硬核,AI Agents全栈技术框架综述与未来
ccwgpt 2025-04-08 12:29 16 浏览 0 评论
LLM Agents正在变得广泛传播,但它们并非轻易就能创造出来,需要许多组件协同工作。以 40+ 张图解,探索 LLM Agents的主要组件、Multi-Agent框架、以及MCP等全栈技术要点,比如:
- Agent如何从失败Plan中学习经验?
- LLM、MCP、Tool交互细节?
- 几十种Multi-Agent架构,核心组件是?
什么是 LLM Agent?
AI Agent是任何可以通过传感器感知其环境并通过执行器对环境采取行动的东西。
——罗素和诺维格,《人工智能:一种现代方法》(2016 年)
Agents与环境互动,通常包括几个重要组件:
- o 环境 —— 代理互动的世界
- o 传感器 —— 用于观察环境
- o 执行器 —— 用于与环境互动的工具
- o 效应器 —— 决定如何从观察到行动的“大脑”或规则
这个框架适用于所有与各种环境互动的代理,比如与物理环境互动的机器人或与软件互动的AI Agents。
可以稍微扩展这个框架,使其适用于“增强型 LLM”。
使用“增强型”LLM,Agent可以通过文本输入观察环境,并通过使用工具执行某些行动。
为了选择要采取哪些行动,LLM Agent有一个关键组件:它的计划能力。为此,LLM 需要能够通过链式思考等方法进行“推理”和“思考”。
利用这种推理行为,LLM Agent将计划出要采取的必要行动。
这种计划行为使Agent能够理解情况(LLM)、计划下一步(计划)、采取行动(工具)并跟踪已采取的行动(记忆)。
根据系统,你可以拥有不同程度自主性的 LLM Agents。
一个系统越“agentic”,LLM 就越能决定系统的行动方式。
将通过 LLM Agent的三个主要组件:记忆、工具和计划,来探索各种自主行为的方法。
记忆
LLM 是健忘的系统,或者更准确地说,在与它们互动时,它们根本不进行任何记忆。
例如,当你问 LLM 一个问题,然后又接着问另一个问题时,它不会记得前者。
我们通常将其称为短期记忆,也称为工作记忆,它作为(近乎)即时上下文的缓冲区。这包括 LLM 代理最近采取的行动。
然而,LLM 代理还需要跟踪可能多达数十步的行动,而不仅仅是最近的行动。
这被称为长期记忆,因为 LLM 代理理论上可能需要记住多达数十步甚至数百步。
短期记忆
实现短期记忆最直接的方法是使用模型的上下文窗口,这本质上是 LLM 可以处理的 token 数量。
较大的上下文窗口可以用来跟踪完整的对话历史,作为输入提示的一部分。
对于上下文窗口较小的模型,或者当对话历史较大时,可以改用另一个 LLM 来总结到目前为止发生的对话。
长期记忆
LLM Agents的长期记忆包括需要长期保留的Agents过去的行动空间。
实现长期记忆的一个常见技术是将所有之前的互动、行动和对话存储在一个外部向量数据库中。
在构建数据库之后,可以通过RAG方式检索相关信息。
工具
工具允许给定的 LLM 要么与外部环境(如数据库)互动,要么使用外部应用程序(如运行自定义代码)。
工具通常有两种用例:获取数据以检索最新信息和采取行动,比如安排会议或点餐。
要实际使用一个工具,LLM 必须生成适合给定工具的 API 的文本。我们通常期望的是可以格式化为 JSON 的字符串,以便可以轻松地输入到代码解释器中。
Toolformer
工具使用是一种强大的技术,可以增强 LLM 的能力并弥补它们的不足。因此,关于工具使用和学习的研究在过去几年中迅速增加。
最早实现这一目标的技术之一被称为 Toolformer,这是一个训练用于决定调用哪些 API 以及如何调用的模型。
模型上下文协议(MCP)
工具是具代理性框架的重要组成部分,允许 LLM 与世界互动并扩展其能力。然而,当你有许多不同的 API 时,启用工具使用变得很麻烦,因为任何工具都需要:
- o 手动跟踪并输入给 LLM
- o 手动描述(包括其预期的 JSON 模式)
- o 每当其 API 发生变化时手动更新
为了使工具更容易在任何给定的具代理性框架中实现,Anthropic 开发了模型上下文协议(MCP)。MCP 为天气应用和 GitHub 等服务标准化了 API 访问。
它由三个组件组成:
- o MCP 主机 —— LLM 应用程序(例如 Cursor),管理连接
- o MCP 客户端 —— 与 MCP 服务器保持一对一连接
- o MCP 服务器 —— 为 LLM 提供上下文、工具和能力
例如,假设你希望某个 LLM 应用程序总结你仓库中的最新 5 次提交。
MCP 主机(与客户端一起)将首先调用 MCP 服务器,询问有哪些工具可用。
LLM 收到信息后,可能会选择使用某个工具。它通过主机向 MCP 服务器发送请求,然后接收结果,包括所使用的工具。
最后,LLM 收到结果,并可以向用户解析答案。
计划
工具使用使 LLM 能够增强其能力。它们通常通过类似 JSON 的请求调用。
但是,LLM 在具代理性的系统中如何决定使用哪个工具以及何时使用呢?
这就是计划的作用。LLM 代理中的计划涉及将给定任务分解为可操作的步骤。
推理
计划可操作步骤需要复杂的推理行为。因此,LLM 必须能够在规划任务的下一步之前展示这种行为。
“推理型”LLM 是那些倾向于在回答问题之前“思考”的 LLM。
这种推理行为可以通过大致两种选择来实现:微调 LLM 或特定的提示工程。
通过提示工程,可以创建 LLM 应该遵循的推理过程的例子。提供例子是引导 LLM 行为的好方法。
在训练 LLM 时,可以给它足够数量包含类似思维的例子的数据集,或者 LLM 可以发现自己的思考过程。例如 DeepSeek-R1,其中使用奖励来引导使用思考过程。
推理与行动
在 LLM 中启用推理行为很好,但并不一定使其能够规划可操作的步骤。
到目前为止关注的技术要么展示推理行为,要么通过工具与环境互动。
例如,链式思考纯粹关注推理。
将这两个过程结合起来的最早技术之一被称为 ReAct(推理与行动)。
ReAct 通过精心设计的提示来实现这一点。ReAct 提示描述了三个步骤:
- o 思考 —— 关于当前情况的推理步骤
- o 行动 —— 要执行的一系列行动(例如,工具)
- o 观察 —— 关于行动结果的推理步骤
LLM 使用这个提示来引导其行为以循环的方式进行思考、行动和观察。
反思
没有人,即使是具有 ReAct 的 LLM,也并非每个任务都能完美完成。失败是过程的一部分,只要你能反思这个过程就行。
这个过程在 ReAct 中缺失,而 Reflexion 正是填补这一空白的地方, 利用verbal reinforcement 帮助代理从之前的失败中学习的技术。
假设了三个 LLM 角色:
- o 行动者 —— 根据状态观察选择并执行行动。
- o 评估者 —— 对行动者产生的输出进行评分。
- o 自我反思 —— 对行动者采取的行动和评估者生成的评分进行反思。
Multi-Agent协作
探索的Single-Agent存在几个问题:工具太多可能会使选择复杂化,上下文变得过于复杂,任务可能需要专业化。
相反,可以转向Multi-Agents,即多个Agents相互互动以及与它们的环境互动的框架:
这些Multi-Agent系统通常由专业化的代理组成,每个Agent都配备了自己的一套工具,并由一个主管监督。主管管理Agent之间的通信,并可以为专业化的代理分配特定的任务。
每个Agent可能有不同的工具类型可用,也可能有不同的记忆系统。
在实践中,有几十种Multi-Agent架构,其核心有两个组成部分:
- o Agent初始化 —— 如何创建各个(专业化的)代理?
- o Agent协调 —— 如何协调所有代理?
人类行为的交互式仿真
可以说最具影响力且坦率地说非常酷的多代理论文之一是“Generative agents: Interactive simulacra of human behavior”。创建了可以模拟可信人类行为的计算软件代理,他们将其称为生成性代理。
每个生成性代理被赋予的档案使它们以独特的方式行事,并有助于创造更有趣和动态的行为。
每个Agent都用三个模块(记忆、计划和反思)初始化,非常类似于我们之前看到的 ReAct 和 Reflexion 的核心组件。
它们共同允许代理自由地进行行为并相互互动。因此,Agent之间几乎没有协调,因为它们没有特定的目标需要努力实现。
模块化框架
无论你选择哪种框架来创建Multi-Agent系统,它们通常由几个要素组成,包括其档案、对环境的感知、记忆、计划和可用行动。
流行框架是 AutoGen、MetaGPT 和 CAMEL。每个框架在Agent之间的通信方式上略有不同。但归根结底,它们都依赖于这种协作性的沟通。Agent有机会相互交流,以更新它们的当前状态、目标和下一步行动。
最近几周,这些框架的增长呈爆炸式增长。
2025 年将是令人兴奋的一年,AI Agents将迎来更多的落地,什么时候入局AI Agents都不晚!DeepSeek R1 + Agent 的下半场
相关推荐
- 团队管理“布阵术”:3招让你的团队战斗力爆表!
-
为何古代军队能够以一当十?为何现代企业有的团队高效似“特种部队”,有的却松散若“游击队”?**答案正隐匿于“布阵术”之中!**今时今日,让我们从古代兵法里萃取3个核心要义,助您塑造一支战斗力爆棚的...
- 知情人士回应字节大模型团队架构调整
-
【知情人士回应字节大模型团队架构调整】财联社2月21日电,针对原谷歌DeepMind副总裁吴永辉加入字节跳动后引发的团队调整问题,知情人士回应称:吴永辉博士主要负责AI基础研究探索工作,偏基础研究;A...
- 豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
-
强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。近日,字节跳动豆包大模型团队与香港大学联合提出HybridFlow。这是一个灵活高效的RL/RL...
- 创业团队如何设计股权架构及分配(创业团队如何设计股权架构及分配方案)
-
创业团队的股权架构设计,决定了公司在随后发展中呈现出的股权布局。如果最初的股权架构就存在先天不足,公司就很难顺利、稳定地成长起来。因此,创业之初,对股权设计应慎之又慎,避免留下巨大隐患和风险。两个人如...
- 消息称吴永辉入职后引发字节大模型团队架构大调整
-
2月21日,有消息称前谷歌大佬吴永辉加入字节跳动,并担任大模型团队Seed基础研究负责人后,引发了字节跳动大模型团队架构大调整。多名原本向朱文佳汇报的算法和技术负责人开始转向吴永辉汇报。简单来说,就是...
- 31页组织效能提升模型,经营管理团队搭建框架与权责定位
-
分享职场干货,提升能力!为职场精英打造个人知识体系,升职加薪!31页组织效能提升模型如何拿到分享的源文件:请您关注本头条号,然后私信本头条号“文米”2个字,按照操作流程,专人负责发送源文件给您。...
- 异形柱结构(异形柱结构技术规程)
-
下列关于混凝土异形柱结构设计的说法,其中何项正确?(A)混凝土异形柱框架结构可用于所有非抗震和抗震设防地区的一般居住建筑。(B)抗震设防烈度为6度时,对标准设防类(丙类)采用异形柱结构的建筑可不进行地...
- 职场干货:金字塔原理(金字塔原理实战篇)
-
金字塔原理的适用范围:金字塔原理适用于所有需要构建清晰逻辑框架的文章。第一篇:表达的逻辑。如何利用金字塔原理构建基本的金字塔结构受众(包括读者、听众、观众或学员)最容易理解的顺序:先了解主要的、抽象的...
- 底部剪力法(底部剪力法的基本原理)
-
某四层钢筋混凝土框架结构,计算简图如图1所示。抗震设防类别为丙类,抗震设防烈度为8度(0.2g),Ⅱ类场地,设计地震分组为第一组,第一自振周期T1=0.55s。一至四层的楼层侧向刚度依次为:K1=1...
- 结构等效重力荷载代表值(等效重力荷载系数)
-
某五层钢筋混凝土框架结构办公楼,房屋高度25.45m。抗震设防烈度8度,设防类别丙类,设计基本地震加速度0.2g,设计地震分组第二组,场地类别为Ⅱ类,混凝土强度等级C30。该结构平面和竖向均规则。假定...
- 体系结构已成昭告后世善莫大焉(体系构架是什么意思)
-
实践先行也理论已初步完成框架结构留余后人后世子孙俗话说前人栽树后人乘凉在夏商周大明大清民国共和前人栽树下吾之辈已完成结构体系又俗话说青出于蓝而胜于蓝各个时期任务不同吾辈探索框架结构体系经历有限肯定发展...
- 框架柱抗震构造要求(框架柱抗震设计)
-
某现浇钢筋混凝土框架-剪力墙结构高层办公楼,抗震设防烈度为8度(0.2g),场地类别为Ⅱ类,抗震等级:框架二级,剪力墙一级,混凝土强度等级:框架柱及剪力墙C50,框架梁及楼板C35,纵向钢筋及箍筋均采...
- 梁的刚度、挠度控制(钢梁挠度过大会引起什么原因)
-
某办公楼为现浇钢筋混凝土框架结构,r0=1.0,混凝土强度等级C35,纵向钢筋采用HRB400,箍筋采用HPB300。其二层(中间楼层)的局部平面图和次梁L-1的计算简图如图1~3(Z)所示,其中,K...
- 死要面子!有钱做大玻璃窗,却没有钱做“柱和梁”,不怕房塌吗?
-
活久见,有钱做2层落地大玻璃窗,却没有钱做“柱子和圈梁”,这样的农村自建房,安全吗?最近刷到个魔幻施工现场,如下图,这栋5开间的农村自建房,居然做了2个全景落地窗仔细观察,这2个落地窗还是飘窗,为了追...
- 不是承重墙,物业也不让拆?话说装修就一定要拆墙才行么
-
最近发现好多朋友装修时总想拆墙“爆改”空间,别以为只要避开承重墙就能随便砸!我家楼上邻居去年装修,拆了阳台矮墙想扩客厅,结果物业直接上门叫停。后来才知道,这种配重墙拆了会让阳台承重失衡,整栋楼都可能变...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- MVC框架 (46)
- spring框架 (46)
- 框架图 (58)
- bootstrap框架 (43)
- flask框架 (53)
- quartz框架 (51)
- abp框架 (47)
- jpa框架 (47)
- laravel框架 (46)
- express框架 (43)
- scrapy框架 (52)
- beego框架 (42)
- java框架spring (43)
- grpc框架 (55)
- 前端框架bootstrap (42)
- orm框架有哪些 (43)
- ppt框架 (48)
- 内联框架 (52)
- winform框架 (46)
- gui框架 (44)
- cad怎么画框架 (58)
- ps怎么画框架 (47)
- ssm框架实现登录注册 (49)
- oracle字符串长度 (48)
- oracle提交事务 (47)