news 2026/4/22 1:24:13

从 SAS 到 MAS:构建高效、可扩展的 AI Agent 架构演进

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
从 SAS 到 MAS:构建高效、可扩展的 AI Agent 架构演进

本文基于Building Conversation Kernels for AI Agents中的核心示意图与文字内容,总结当前主流 Agent 架构的演进路径,并结合图示拆解其设计动机、优缺点与适用场景。


一、背景:为什么需要新的 Agent 架构?

随着 AI Agent 从单轮问答演进到复杂、多轮、工具驱动任务,传统的Single Agent System(SAS)暴露出明显问题:

  • 上下文无限膨胀(Context Pollution)
  • 工具与指令耦合严重
  • 长对话下性能与稳定性下降
  • 复杂任务难以扩展

为了解决这些问题,Agent 架构逐步从单体 → 分工 → 编排 → 群体演进。


二、On-Demand Tooling SAS:按需加载技能的单体 Agent

1. 核心思想

在传统 SAS 的基础上,引入Skill(技能)概念:

  • 技能以独立SKILL.md形式存在
  • 描述:功能、输入输出、可用工具
  • Agent 在运行时按需学习并注入技能

skill参考地址

2. Agent 调用关系(泳道图)

关键点:Skill 一旦加载即进入长期上下文,形成不可逆增长

ToolsSkill LoaderSingle Agent (SAS)UserToolsSkill LoaderSingle Agent (SAS)User用户请求按需加载 SkillSkill 描述 和 Tool Schema调用工具工具结果回复结果

3. 优点

  • 比静态工具集更灵活
  • 技能模块化、可复用
  • 降低初始上下文负担

4. 致命问题

上下文不可逆增长(Irreversible Context Growth)

  • 技能一旦注入,为保持一致性就难以移除
  • 长会话后仍会走向 Context Pollution
  • 本质仍是“增强版单体 Agent”

📌结论:这是过渡方案,而非终局。


三、Context Engineer / Executor SAS:双模型串行架构

1. 架构拆分

角色模型职责
Context Engineer小模型(Fast / SFT)上下文工程、Query Rewrite、RAG、工具筛选
Executor大模型(Reasoning)在“干净上下文”中执行 ReAct

2. Agent 调用关系(泳道图)

关键点:Context Engineer 决定“给什么”,Executor 决定“怎么做”

ToolsExecutorRAG / DocsContext EngineerUserToolsExecutorRAG / DocsContext EngineerUser用户问题检索 / Query Rewrite相关文档精炼 Context + Tool Schema调用工具工具结果最终回答

3. 优点

  • 高效率:小模型做“脏活累活”
  • 上下文干净:Executor 不被污染
  • 成本可控

4. 局限

  • 工具依赖 SFT,扩展成本高
  • Context Engineer 判断错误会被放大
  • 系统运维复杂(双模型)

📌结论:工程效率很高,但灵活性不足。


四、Multi-Agent System(MAS):多 Agent 分工协作

MAS 是当前主流与未来趋势,核心思想只有一句话:

让不同 Agent 各司其职,而不是让一个 Agent 无所不能


1、Basic Centralized MAS:Dialog / Planner 双 Agent

1.1 角色划分
  • Dialog Agent

    • 与用户交互
    • 维护长期、干净记忆
  • Planner Agent

    • 接收 Task Specification
    • 规划步骤、调用工具
1.2 Agent 调用关系(泳道图)

关键点:Dialog 不碰工具,Planner 不直接对话

ToolsPlanner AgentDialog AgentUserToolsPlanner AgentDialog AgentUser用户输入Task Specification执行计划 / 调用工具执行结果Final Result用户可读回复
1. 3 记忆策略
Agent记忆特征
Dialog长期、精简(只保留最终结果)
Planner短期、深度(完整执行链路)
1.4 优点
  • 指令竞争问题消失
  • 支持长期对话
  • 性能更稳定
1.5 缺点
  • 单轮任务延迟略高

  • 信息传递存在损耗

  • Planner 成为瓶颈

  • 单轮任务延迟略高

  • 信息传递存在损耗

  • Planner 成为瓶颈


2、Hierarchical Centralized MAS:层级化 Agent 组织

2.1 类似“公司组织结构”
  • Dialog Agent(前台)
  • Primary Planner(老板)
  • Team Leader(部门负责人)
  • Worker Agent(执行者)
2.2 Agent 调用关系(泳道图)

关键点:任务逐层拆解,结果逐层回传

Worker AgentTeam LeaderPrimary PlannerDialog AgentUserWorker AgentTeam LeaderPrimary PlannerDialog AgentUser复杂任务请求高层 Task Spec子任务分解执行指令执行结果子任务完成汇总结果最终回复
2.3 适用场景
  • 超复杂任务(写书、市场调研)
  • 长时间异步执行
2.4 核心问题
  • 延迟高

  • 调试极难(电话游戏效应)

  • 只适合高价值任务

  • 延迟高

  • 调试极难(电话游戏效应)

  • 只适合高价值任务


3、Orchestrator MAS:编排者中心架构(强烈推荐)

3.1 核心角色
  • Orchestrator Agent

    • 全局状态机
    • 路由、调度、聚合结果
  • Specialized Planner

    • 只做规划(Coding / Writing / Math)
  • Executor Agent

    • 具备重试、容错能力的“智能工具”
3.2 Agent 调用关系(泳道图)

关键点:Orchestrator 统一决策,Planner 与 Executor 完全解耦

Executor AgentSpecialized PlannerOrchestratorDialog AgentUserExecutor AgentSpecialized PlannerOrchestratorDialog AgentUser用户请求Task Specification请求领域规划执行计划下发执行指令执行结果 / 重试聚合结果最终回复
3.3 优点
  • Planner 可独立优化(CoT-SC / Critic)
  • 扩展安全,不影响全局
  • Executor 更稳定

3.4 核心挑战

  • 规划与执行可能脱节
  • Orchestrator 本身要“足够聪明”

📌结论:这是当前工程实践中最平衡的 MAS 架构


4️⃣ 一个重要对比总结

架构决策权执行权上下文控制
SAS单 Agent单 Agent
Context/ExecutorContext EngineerExecutor
Basic MASPlannerPlanner很好
Orchestrator MASOrchestratorExecutor Agent⭐⭐⭐⭐⭐

五、总结:架构选型建议

场景推荐架构
简单问答基础 SAS
工具密集Context Engineer + Executor
长对话Basic MAS
超复杂任务Hierarchical MAS
通用 AI Agent 平台Orchestrator MAS⭐⭐⭐⭐⭐

Agent 架构的本质,不是模型有多强,而是“谁在什么时候,知道什么,能做什么”。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/20 5:31:41

【小程序毕设全套源码+文档】基于Android的电影信息推荐APP的设计与实现(丰富项目+远程调试+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/18 23:53:18

深入浅出:使用Linux系统函数构建高性能TCP服务器

🌟 深入浅出:使用Linux系统函数构建高性能TCP服务器 🌟引言:网络编程的艺术一、TCP服务器基础架构1.1 服务器工作流程图1.2 核心系统调用概览二、构建TCP服务器的详细步骤2.1 创建Socket:通信的起点2.2 绑定地址&#…

作者头像 李华
网站建设 2026/4/16 12:28:05

斑马优化算法优化BP神经网络风电功率预测附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和…

作者头像 李华
网站建设 2026/4/18 3:01:14

基于CNN+ELM多输入单输出回归预测附Matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。🍎 往期回顾关注个人主页:Matlab科研工作室👇 关注我领取海量matlab电子书和…

作者头像 李华