GOAP 智能体
GOAP 是一种算法规划方法,它使用 A* 搜索 来寻找满足目标条件同时最小化总成本的最优动作序列。 与使用 LLM 生成计划的 LLM 规划器 不同, GOAP 智能体基于预定义的目标和动作,通过算法发现动作序列。
GOAP 规划器围绕三个核心概念工作:
- 状态:表示世界的当前状态。
- 动作:定义可以执行的操作,包括前提条件、效果(信念)、成本和执行逻辑。
- 目标:定义目标条件、启发式成本函数和价值函数。
先决条件
确保您的环境和项目满足以下要求:
- JDK 17+
- Kotlin 2.2.0+
- Gradle 8.0+ 或 Maven 3.8+
添加 Koog 包 作为依赖项:
从 LLM 提供商获取 API 密钥,或通过 Ollama 运行本地 LLM。 更多信息请参阅 快速入门。
本页示例假设您已设置 OPENAI_API_KEY 环境变量。
在 Koog 中,您可以通过声明式地指定目标和动作,使用 DSL 来定义 GOAP 智能体。
要创建 GOAP 智能体,您需要:
- 将状态定义为一个数据类,其属性代表与您目标相关的各个方面。
- 使用 goap() 函数创建一个 GOAPPlanner 实例。
- 使用 AIAgentPlannerStrategy 包装规划器,并将其传递给 PlannerAIAgent 构造函数。
Note
规划器选择单个动作及其序列。 每个动作都包含一个必须为真才能执行该动作的前提条件, 以及一个定义预测结果的信念。 有关信念的更多信息,请参阅 状态信念与实际执行的比较。
在以下示例中,GOAP 负责创建文章(大纲 → 草稿 → 审阅 → 发布)的高层规划, 而 LLM 则在每个动作内执行实际的内容生成。
// 为内容创作定义一个状态
data class ContentState(
val topic: String,
val hasOutline: Boolean = false,
val outline: String = "",
val hasDraft: Boolean = false,
val draft: String = "",
val hasReview: Boolean = false,
val isPublished: Boolean = false
): GoapAgentState<String, String>(topic) {
override fun provideOutput(): String = draft
}
``` // 使用 LLM 驱动的动作创建 GOAP 规划器
val planner = AIAgentPlannerStrategy.goap("content-planner", ::ContentState) {
// 定义带有前置条件和信念的动作
action(
name = "创建大纲",
precondition = { state -> !state.hasOutline },
belief = { state -> state.copy(hasOutline = true, outline = "大纲") },
cost = { 1.0 }
) { ctx, state ->
// 使用 LLM 创建大纲
val response = ctx.llm.writeSession {
appendPrompt {
user("为关于以下主题的文章创建详细大纲:${state.topic}")
}
requestLLM()
}
state.copy(hasOutline = true, outline = response.content)
}
action(
name = "撰写草稿",
precondition = { state -> state.hasOutline && !state.hasDraft },
belief = { state -> state.copy(hasDraft = true, draft = "草稿") },
cost = { 2.0 }
) { ctx, state ->
// 使用 LLM 撰写草稿
val response = ctx.llm.writeSession {
appendPrompt {
user("基于以下大纲撰写文章:\n${state.outline}")
}
requestLLM()
}
state.copy(hasDraft = true, draft = response.content)
}
action(
name = "审阅内容",
precondition = { state -> state.hasDraft && !state.hasReview },
belief = { state -> state.copy(hasReview = true) },
cost = { 1.0 }
) { ctx, state ->
// 使用 LLM 审阅草稿
val response = ctx.llm.writeSession {
appendPrompt {
user("审阅以下文章并提出改进建议:\n${state.draft}")
}
requestLLM()
}
println("审阅反馈:${response.content}")
state.copy(hasReview = true)
}
action(
name = "发布",
precondition = { state -> state.hasReview && !state.isPublished },
belief = { state -> state.copy(isPublished = true) },
cost = { 1.0 }
) { ctx, state ->
println("正在发布文章...")
state.copy(isPublished = true)
}
// 定义带有完成条件的目标
goal(
name = "已发布文章",
description = "完成并发布文章",
condition = { state -> state.isPublished }
)
}
// 创建并运行智能体
val agentConfig = AIAgentConfig(
prompt = prompt("writer") {
system("你是一名专业的内容撰稿人。")
},
model = OpenAIModels.Chat.GPT4o,
maxAgentIterations = 20
)
val agent = AIAgent(
promptExecutor = simpleOpenAIExecutor(System.getenv("OPENAI_API_KEY")),
strategy = planner,
agentConfig = agentConfig
)
suspend fun main() {
val result = agent.run("人工智能在软件开发中的未来")
println("最终状态:$result")
}
=== "Java"
```java
// 定义内容创作的状态
static class ContentState extends GoapAgentState
public ContentState(String topic) {
super(topic);
this.topic = topic;
}
public ContentState copy(boolean hasOutline, String outline, boolean hasDraft,
String draft, boolean hasReview, boolean isPublished) {
ContentState state = new ContentState(topic);
state.hasOutline = hasOutline;
state.outline = outline;
state.hasDraft = hasDraft;
state.draft = draft;
state.hasReview = hasReview;
state.isPublished = isPublished;
return state;
}
@Override
public String provideOutput() {
return draft;
}
}
public static void main(String[] args) {
var promptExecutor = PromptExecutor.builder()
.openAI("OPENAI_API_KEY")
.build();
var strategy = AIAgentPlannerStrategy.builder("content-planner")
.goap(ContentState::new)
.action("创建大纲", builder -> builder
.precondition(state -> !state.hasOutline)
.belief(state -> state.copy(true, "大纲", false, "", false, false))
.cost(state -> 1.0)
.execute((context, state) -> {
String response = context.llm().writeSession(session -> {
session.appendPrompt(prompt -> {
prompt.user("为以下主题创建详细文章大纲:" + state.topic);
return null;
});
return session.requestLLM().getContent();
});
return state.copy(true, response, state.hasDraft, state.draft,
state.hasReview, state.isPublished);
})
)
.action("撰写草稿", builder -> builder
.precondition(state -> state.hasOutline && !state.hasDraft)
.belief(state -> state.copy(state.hasOutline, state.outline, true, "草稿", false, false))
.cost(state -> 2.0)
.execute((context, state) -> {
String response = context.llm().writeSession(session -> {
session.appendPrompt(prompt -> {
prompt.user("根据以下大纲撰写文章:\n" + state.outline);
return null;
});
return session.requestLLM().getContent();
});
return state.copy(state.hasOutline, state.outline, true, response,
state.hasReview, state.isPublished);
})
)
.action("内容审阅", builder -> builder
.precondition(state -> state.hasDraft && !state.hasReview)
.belief(state -> state.copy(state.hasOutline, state.outline, state.hasDraft,
state.draft, true, false))
.cost(state -> 1.0)
.execute((context, state) -> {
String response = context.llm().writeSession(session -> {
session.appendPrompt(prompt -> {
prompt.user("审阅以下文章并提出改进建议:\n" + state.draft);
return null;
});
return session.requestLLM().getContent();
});
System.out.println("审阅反馈:" + response);
return state.copy(state.hasOutline, state.outline, state.hasDraft,
state.draft, true, state.isPublished);
})
)
.action("发布", builder -> builder
.precondition(state -> state.hasReview && !state.isPublished)
.belief(state -> state.copy(state.hasOutline, state.outline, state.hasDraft,
state.draft, state.hasReview, true))
.cost(state -> 1.0)
.execute((context, state) -> {
System.out.println("正在发布文章...");
return state.copy(state.hasOutline, state.outline, state.hasDraft,
state.draft, state.hasReview, true);
})
)
.goal("已发布文章", builder -> builder
.description("完成并发布文章")
.condition(state -> state.isPublished)
)
.build();kotlin
var agent = AIAgent.builder()
.plannerStrategy(strategy)
.promptExecutor(promptExecutor)
.llmModel(OpenAIModels.Chat.GPT4o)
.systemPrompt("你是一名专业的内容写手。")
.maxIterations(20)
.build();
String result = agent.run("人工智能在软件开发的未来");
System.out.println("最终状态: " + result);
}
```
<!--- KNIT exampleGoapAgentsJava01.java -->
自定义成本函数
由于 A* 搜索 使用成本作为寻找最优操作序列的一个因素,你可以为操作和目标定义自定义成本函数来引导规划器:
kotlin
action(
name = "昂贵操作",
precondition = { true },
belief = { state -> state.copy(operationDone = true) },
cost = { state ->
// 基于状态的动态成本
if (state.hasOptimization) 1.0 else 10.0
}
) { ctx, state ->
// 执行操作
state.copy(operationDone = true)
}
java
.action("昂贵操作", builder -> builder
.precondition(state -> true)
.belief(state -> state.copy(true))
.cost(state -> {
// 基于状态的动态成本
return state.hasOptimization ? 1.0 : 10.0;
})
.execute((context, state) -> {
// 执行操作
return state.copy(true);
})
)
状态信念与实际执行的对比
GOAP 区分了信念(乐观预测)和实际执行这两个概念:
- 信念:规划器认为会发生什么,用于规划。
- 执行:实际发生的情况,用于真实的状态更新。
这使得规划器能够基于预期结果制定计划,同时妥善处理实际结果:
kotlin
action(
name = "尝试复杂任务",
precondition = { state -> !state.taskComplete },
belief = { state ->
// 乐观信念:任务将会成功
state.copy(taskComplete = true)
},
cost = { 5.0 }
) { ctx, state ->
// 实际执行可能会失败或产生不同结果
val success = performComplexTask()
state.copy(
taskComplete = success,
attempts = state.attempts + 1
)
}
java
.action("尝试复杂任务", builder -> builder
.precondition(state -> !state.taskComplete)
.belief(state -> {
// 乐观信念:任务将会成功
return state.copy(true, state.attempts);
})
.cost(state -> 5.0)
.execute((context, state) -> {
// 实际执行可能会失败或产生不同结果
boolean success = performComplexTask();
return state.copy(success, state.attempts + 1);
})
)