Agent概述
AI Agent核心概念与技术原理解析
Agent概述
Agent 应用原理
这里以 OpenAI 定义的 Agent 为例:
|
|
Planning 规划
Agent 将大任务拆分为更小的可管理的子目标,使得可以有效处理复杂任务。比如一项复杂性任务通常会包含很多步骤,Agent 需要了解这些步骤是什么并提前规划,可以将大模型一次输出的多任务回答拆解为多个单独任务逐个输出。
比如最常见的规划就是提示词,我们会指挥模型第一步干什么,第二步干什么等等;也可以让大模型生成规划,然后再根据大模型生成的规划进行顺序或并行执行。
大模型记忆
在大模型中,目前记忆分为长期记忆与短期记忆:
- 短期记忆:一般指近 N 轮对话,上下文学习就是利用模型的短期记忆进行学习
- 长期记忆:将短期记忆进行整理储存,通常利用外部向量存储和检索实现,为 Agent 提供保留和召回长期信息的能力
实际应用中:
- 常用词嵌入方法:BGE、Qwen3 Embedding、xiaobu Embedding 等等
- 常用向量数据库:Milvus、Faiss、Chroma 等等
Tool Use 工具使用
能调用外部工具,是大模型进化为智能体 Agent 的关键,如果不能使用外部工具,大模型就只能是个简单的聊天机器人,甚至连查询天气都做不到。
由于底层技术限制,大模型本身是无法和外部工具直接通信的,因此 Function Calling 的思路,就是创建一个外部函数(function)作为中介,一边传递大模型的请求,另一边调用外部工具,最终让大模型能够间接的调用外部工具。
通俗的讲,就是 Agent 调用外部工具,比如外部知识库或 API 去解决问题的方法。最常用的就是使用 Function Call 定义工具,或者使用被封装好的 MCP 工具进行使用。在实际应用中,通常都需要根据业务自定义工具进行使用。
- 如果不用 LangChain 定义工具,使用大模型原生的 Function Call 接口定义函数的话,需要非常复杂的定义 Function Calling 元信息
- 而 LangChain 对 Agent 的封装进行了全面更新,可以非常简单的定义工具
本文由作者按照 CC BY 4.0 进行授权