Agent概述

AI Agent核心概念与技术原理解析

发表于 %Y/%m/%d

作者 kevin

1 分钟 阅读

Agent概述

Agent 应用原理

这里以 OpenAI 定义的 Agent 为例：

1

Agent = 大模型（LLM）+ 规划（Planning）+ 记忆（Memory）+ 工具使用（Tool Use）

Agent 将大任务拆分为更小的可管理的子目标，使得可以有效处理复杂任务。比如一项复杂性任务通常会包含很多步骤，Agent 需要了解这些步骤是什么并提前规划，可以将大模型一次输出的多任务回答拆解为多个单独任务逐个输出。

比如最常见的规划就是提示词，我们会指挥模型第一步干什么，第二步干什么等等；也可以让大模型生成规划，然后再根据大模型生成的规划进行顺序或并行执行。

在大模型中，目前记忆分为长期记忆与短期记忆：

实际应用中：

能调用外部工具，是大模型进化为智能体 Agent 的关键，如果不能使用外部工具，大模型就只能是个简单的聊天机器人，甚至连查询天气都做不到。

由于底层技术限制，大模型本身是无法和外部工具直接通信的，因此 Function Calling 的思路，就是创建一个外部函数（function）作为中介，一边传递大模型的请求，另一边调用外部工具，最终让大模型能够间接的调用外部工具。

通俗的讲，就是 Agent 调用外部工具，比如外部知识库或 API 去解决问题的方法。最常用的就是使用 Function Call 定义工具，或者使用被封装好的 MCP 工具进行使用。在实际应用中，通常都需要根据业务自定义工具进行使用。

如果不用 LangChain 定义工具，使用大模型原生的 Function Call 接口定义函数的话，需要非常复杂的定义 Function Calling 元信息
而 LangChain 对 Agent 的封装进行了全面更新，可以非常简单的定义工具

学习

AI Agent

本文由作者按照 CC BY 4.0 进行授权