腾讯面试官：你的多 Agent 协作，调度 Agent 怎么知道该分给谁？子 Agent 挂了整个任务就废了？-编程阁

最近多 Agent 协作这个话题在面试里出现得越来越频繁了。前几天有个读者跟我复盘了他在腾讯的面试经历，聊完之后我觉得这个话题值得单独写一篇。

🙋‍♂️他简历上写了"设计并实现多 Agent 协作架构，支持复杂任务的自动拆解与并行执行"。面试官看了这句话，直接进入连环追问模式。

👨‍💻第一问：“你为什么要用多 Agent？一个 Agent 搞不定吗？给我讲讲具体是什么任务需要拆成多个 Agent。”

🙋‍♂️他说任务太复杂，一个 Agent 处理不过来，所以拆了。

👨‍💻面试官没有被糊弄过去，继续第二问：“你的调度 Agent 怎么知道该把哪个子任务分给哪个 Agent？靠什么机制做路由决策？”

🙋‍♂️他说每个 Agent 有一个角色描述，调度 Agent 看描述来匹配。

👨‍💻面试官接着第三问：“如果负责信息检索的那个子 Agent 超时了，返回了一个空结果，你的调度 Agent 怎么处理？是等它、重试它、还是跳过它？整个任务会不会因为一个子 Agent 的失败就全部作废？”

🙋‍♂️他卡住了。

👨‍💻面试官最后说了一句让他印象很深的话：“多 Agent 最难的不是把任务拆开，而是拆开之后怎么协调、怎么容错、怎么把碎片结果重新拼成一个完整的回答。你如果只想到了’拆’，那你离真正的多 Agent 系统还差好几层。”

说实话，这个反馈让我想起了自己最早做多 Agent 项目时踩的坑。当时我也以为"多 Agent"就是把任务分给几个角色、各自跑完把结果拼一起。实际跑起来才发现，子 Agent 各跑各的导致结果互相矛盾、一个 Agent 卡住整条链路堵死、最后汇总的时候发现三个 Agent 搜了一模一样的东西——这些问题比写几个 Agent 本身难解决得多。

今天把多 Agent 协作从"为什么要用"到"怎么设计"到"怎么防翻车"讲清楚。

简要回答

多 Agent 协作的出发点是单 Agent 的天花板：工具太多模型选不准、上下文太长注意力衰减、一个 Agent 既做搜索又做分析专业度不够。复杂任务拆给多个专业 Agent 分别处理，每个 Agent 只需要聚焦自己擅长的事情，整体效果远好于一个 Agent 全包。

但"拆任务"只是第一步。真正的难点在三件事：任务路由（调度 Agent 怎么知道该把子任务交给谁）、容错处理（子 Agent 失败了怎么办）、结果聚合（多个 Agent 的产出怎么合并成一个连贯的最终回答）。

架构上最成熟的模式是编排者模式——一个调度 Agent 负责拆解、分发和汇总，多个专业 Agent 独立执行子任务。每个 Agent 通过能力声明（Skill 列表）告诉调度 Agent “我能做什么”，调度 Agent 做语义匹配来决定任务路由。子 Agent 之间互不感知，各自黑盒运行。

面试里只说"把任务拆开给不同 Agent"，面试官会认为你停在概念层面。要讲清楚路由机制、容错策略和聚合逻辑，才能让人相信你真做过。

详细解析

单 Agent 的天花板到底在哪

在解释"为什么要多 Agent"之前，得先把单 Agent 的极限讲清楚。不然面试官问"一个 Agent 为什么不行"，你答"因为任务复杂"——这不叫回答，这叫套话。

单 Agent 的天花板来自三个维度。

第一个是工具选择的准确性。你给一个 Agent 配 5 个工具，它选错的概率很低。配 15 个，偶尔选错。配到 30 个以上，工具的描述信息本身就要占掉好几千 token，模型在这么多选项里做决策的准确率会明显下降。就好比你让一个实习生同时记住 30 个不同系统的操作方式，他大概率会张冠李戴。

第二个是上下文窗口的注意力问题。这个在之前讲 Agent 终止控制的文章里提过——Agent 每一步的 Thought、Action、Observation 都会追加到消息历史里，执行 10 步之后上下文可能就两三万 token 了。超过模型的"舒适区"后，早期步骤搜到的关键信息会被后面的内容"挤"出注意力范围。我之前做过一个项目，让一个 Agent 比较中美欧三个市场的产业政策，跑到第 8 步的时候，模型把第 2 步搜到的欧盟数据张冠李戴到了美国的政策上——因为第 2 步的内容已经距离当前生成位置太远了。

第三个是专业度的稀释。一个 Agent 的 System Prompt 不可能面面俱到。你让它既像行业分析师一样做市场调研，又像技术专家一样做产品对比，还像咨询顾问一样写 SWOT 分析——每个角色都做得半吊子，不如让三个各自专精的 Agent 分别来做。

明白了这三个限制，多 Agent 的价值就很清楚了：工具分散配给不同 Agent 避免选择过载，上下文各自独立避免注意力衰减，每个 Agent 只扮演一个角色保证专业深度。

编排者模式：最实用的多 Agent 架构

多 Agent 系统有好几种架构模式，但在实际工程中用得最多的是编排者模式（Orchestrator Pattern）。

核心思想很简单：有一个调度 Agent（Orchestrator）负责"管理"，其他几个专业 Agent 负责"干活"。调度 Agent 不做任何具体的检索或分析工作，它只做三件事——拆任务、分任务、收结果。

打个比方。你去一个餐厅吃饭，服务员记下你的单、分给后厨的不同工位（切配、炒锅、蒸笼），最后服务员把所有菜收齐了端给你。服务员不用会炒菜，但他得知道哪道菜该给谁做，什么时候催单，上错了菜怎么办。调度 Agent 就是这个服务员。

一个典型的编排流程是这样的：

用户输入一个复杂目标（“帮我做一份国内新能源汽车市场竞争分析”）→ 调度 Agent 把目标拆解成子任务（市场份额数据、技术路线对比、政策环境分析）→ 调度 Agent 根据每个子任务的类型，选择最合适的专业 Agent → 专业 Agent 各自独立执行，返回结果 → 调度 Agent 收到所有结果后，做一次综合汇总，生成最终回答。

# 伪代码：编排者模式的核心循环def orchestrator_run(user_goal: str, agents: dict): # 第一步：调度 Agent 做任务拆解 subtasks = planning_llm.decompose(user_goal) # 例如：["市场份额数据", "技术路线对比", "政策环境分析"] results = {} for task in subtasks: # 第二步：根据任务内容选择最合适的专业 Agent best_agent = route_task(task, agents) # 第三步：把子任务委托给专业 Agent 执行 try: result = best_agent.execute(task) results[task] = {"status": "success", "content": result} except TimeoutError: results[task] = {"status": "failed", "reason": "timeout"} # 第四步：汇总所有子任务的结果，生成最终回答 final_answer = synthesis_llm.aggregate(user_goal, results) return final_answer

任务路由：调度 Agent 怎么知道该分给谁

这是面试官最爱追问的环节。“你说调度 Agent 会选合适的 Agent——它靠什么选？”

最粗暴的做法是写死映射表：任务包含"市场"就给 Agent A，包含"技术"就给 Agent B。能跑，但太脆了——用户稍微换个说法你就路由不上。

更好的做法是让每个专业 Agent 发布一份能力声明，然后调度 Agent 拿子任务的描述跟所有 Agent 的能力声明做语义匹配，选相似度最高的。

这个思路在 Google 发布的 A2A 协议里有一个标准化的实现——每个 Agent 发布一张 Agent Card，里面有一个 Skill 列表，每个 Skill 写清楚这个 Agent 能做什么、擅长处理什么类型的输入。调度 Agent 读取所有 Agent Card，把子任务的描述跟各个 Skill 做匹配，找到最合适的那个。

工程上的实现有三种方案，按复杂度递增排列。

方案一：关键词匹配。每个 Agent 的能力描述里标注几个关键词，子任务里命中关键词就路由过去。实现最快，但精度差——"技术路线"和"技术难点"命中同一个关键词，但其实需要不同的 Agent 来处理。

方案二：Embedding 语义匹配。把每个 Agent 的 Skill 描述和子任务描述都向量化，算余弦相似度，选最高的。能处理同义表达，精度明显好于关键词。缺点是需要一个 Embedding 模型，有一点延迟。

方案三：LLM 路由。直接把所有 Agent 的能力描述和当前子任务一起丢给 LLM，让它选。精度最高，但每次路由都要消耗一次 LLM 调用，对于子任务多的场景成本不低。

实际项目中的推荐做法是Embedding 匹配为主，LLM 兜底疑难：先用 Embedding 做初步匹配，如果最高相似度低于 0.6（说明没有一个 Agent 特别匹配），再调 LLM 做精确判断。这跟我们之前讲 RAG 意图识别的三级方案思路是一样的——规则 / ML / LLM 层层递进，兼顾速度和精度。

容错处理：子 Agent 挂了怎么办

这是多 Agent 系统里最容易被忽视、也最容易在面试里被追问的环节。

单 Agent 系统里，工具调用失败你可以在 Observation 里写一条提示让模型换策略。但多 Agent 系统里，一个子 Agent 的失败影响的是整个任务链路——如果"市场份额"的子 Agent 超时了，调度 Agent 是等它、重试它、还是跳过它直接用剩下两个 Agent 的结果生成报告？

这个问题没有标准答案，取决于子任务的重要程度。实际工程中我用过的策略是把子任务分成两类：关键任务和增强任务。

关键任务是缺了就没法回答的——比如"市场份额数据"对于竞争分析报告是核心内容，没有这个数据整个报告就缺了灵魂。这类任务失败后必须重试，最多重试 2 次，超过就标记为失败，告诉用户"由于数据获取失败，本次报告缺少市场份额部分"。

增强任务是有了更好、没有也能凑合的——比如"行业专家观点汇总"，它能增加报告的深度，但缺了也不影响核心结论。这类任务失败后直接跳过，不重试。

# 伪代码：带容错的子任务执行def execute_subtask(agent, task, is_critical: bool, max_retries: int = 2): for attempt in range(max_retries + 1): try: result = agent.execute(task, timeout=30) return {"status": "success", "content": result} except (TimeoutError, AgentError) as e: if attempt < max_retries and is_critical: continue # 关键任务重试 elif is_critical: return {"status": "failed", "reason": str(e)} else: return {"status": "skipped", "reason": "非关键任务，已跳过"}

另一个常见的容错手段是超时降级。子 Agent 正常执行需要 20 秒，你给它 30 秒的 timeout。如果 30 秒之后还没返回，不是直接判定失败，而是看它是否有部分结果——比如搜了 5 条数据、只分析了 3 条就超时了，那就拿这 3 条的部分结果来用。不完美，但比什么都没有好。

结果聚合：把碎片拼回去

每个子 Agent 各自独立运行，返回的结果格式、详略程度、表述风格可能完全不同。市场分析 Agent 返回的是带数字的结构化表格，技术对比 Agent 返回的是大段描述性文字，政策分析 Agent 返回的是条目列表。直接拼在一起，读起来就像三个不同的人各写了一段互不相干的东西。

所以最后一步——结果聚合——其实是调度 Agent 最重要的职责之一。

最简单的做法是把所有子结果拼在一起，让一个 LLM 做一次整合生成。但这里有两个工程上的坑。

第一个坑：子结果太长超出上下文。如果三个 Agent 各自返回了 3000 token 的结果，加上聚合的 Prompt 本身，总量已经过万了。解决方法是在聚合之前先做一轮压缩——让每个子 Agent 在返回结果的时候就控制长度（比如限制在 1500 token 以内），或者在聚合之前加一个摘要步骤，把每个子结果压缩到关键信息。

第二个坑：子结果之间有矛盾。Agent A 说"某品牌 2024 年市占率是 35%“，Agent B 说"该品牌市占率约为 28%”——两个 Agent 搜到了不同来源的数据。如果不处理，聚合 LLM 可能会随机采信一个，或者更糟糕地"取平均"给出一个 31.5%。

解决矛盾的策略是在聚合 Prompt 里明确指示：不要融合矛盾信息，而是标注分歧并说明数据来源。比如最终输出"关于该品牌的市占率，不同数据来源存在差异：来源 A 显示为 35%，来源 B 显示为 28%，差异可能源于统计口径不同"。这种处理方式比随机采信一个要靠谱得多。

MCP 和 A2A：多 Agent 系统的两层协议

如果面试官继续追问"你的多 Agent 系统用了什么通信协议"，这里要能清楚地区分两个东西。

MCP（Model Context Protocol）解决的是单个 Agent 内部的问题——Agent 怎么连接工具和数据源。你的市场分析 Agent 需要调搜索引擎、调数据库，这些工具通过 MCP 协议接入，Agent 不用为每个工具写专门的适配代码。MCP 的方向是向下连工具。

A2A（Agent-to-Agent）解决的是 Agent 之间的问题——调度 Agent 怎么发现专业 Agent 的能力、怎么把任务委托过去、怎么接收结果。A2A 的方向是向外连 Agent。

两者是互补的，不是替代关系。在一个完整的多 Agent 系统里，MCP 管纵向（Agent → 工具），A2A 管横向（Agent → Agent）。如果有后端经验的话可以这样类比：MCP 相当于每个微服务内部用的数据库驱动和 HTTP 客户端，A2A 相当于微服务之间的 gRPC 通信协议和服务注册中心。

面试里能把这个层次关系说清楚，会让面试官觉得你对 Agent 技术栈的理解不是零散的，而是体系化的。

面试里怎么谈多 Agent 协作

这道题面试官爱问，是因为它能直接暴露你对系统架构的理解深度——只会写单个 Agent 的人和能设计多 Agent 协作系统的人，完全不在一个层次。

第一个容易翻车的点：说不清为什么需要多 Agent。"任务复杂"不是理由。你得具体说是工具太多导致选择过载，还是上下文太长导致注意力衰减，还是一个角色无法兼顾多种专业分析。最好举一个你实际遇到的场景——“我们让一个 Agent 同时做市场调研和技术对比，结果它搜到技术资料之后就一头扎进技术细节里去了，把市场数据全忘了”。这种具体的故事比抽象的道理有说服力得多。

第二个容易翻车的点：只讲了任务拆解，没讲路由机制。面试官追问"调度 Agent 怎么知道该分给谁"，你说"根据描述匹配"——太模糊了。能讲到 Agent Card / Skill 列表的能力声明机制、Embedding 语义匹配 + LLM 兜底的路由策略，才显得你真正设计过。

第三个容易翻车的点：完全没考虑子 Agent 失败的情况。这是面试高频追问。你的系统里如果一个子 Agent 超时了、返回了空结果、返回了跟其他 Agent 矛盾的内容，你怎么处理？能讲到关键 / 增强任务分级、超时重试、部分降级、矛盾标注这些策略，面试官会觉得你是真的把系统跑到出过问题才设计出来的。

一个比较完整的面试回答框架：先说单 Agent 的三个天花板（工具过载、上下文膨胀、专业度稀释）→ 讲编排者模式的四步流程（拆解、路由、执行、聚合）→ 讲路由机制（能力声明 + 语义匹配 + LLM 兜底）→ 讲容错策略（关键/增强分级、重试/跳过/降级）→ 讲结果聚合的两个坑（超出上下文、子结果矛盾）→ 最后点一下 MCP 和 A2A 的分层关系。整个回答控制在 3-4 分钟，每一层都有具体的工程细节支撑，面试官大概率会满意。

写在最后

多 Agent 协作在概念上很诱人——任务自动拆解、专业角色并行工作、结果自动汇总。但真正把它做成一个可靠的工程系统，你需要解决的问题远比"写几个 Agent"要多。

任务怎么拆、拆给谁、Agent 挂了怎么办、结果矛盾了怎么办、子结果太长装不下怎么办——这些问题在 demo 阶段不会出现，但在真实业务场景里每一个都会找上门来。

我见过很多做多 Agent 项目的人，注意力全放在"怎么定义更酷的角色"上——一个叫"策略分析师"、一个叫"数据工程师"、一个叫"首席洞察官"。角色名起得花哨，但路由逻辑写死在 if-else 里，任何一个子 Agent 超时整条链路就挂了，结果聚合就是把三段话拼在一起。

这不叫多 Agent 系统，这叫三个独立 Agent 凑在一起的乌合之众。

真正的多 Agent 协作，核心不在于你有多少个 Agent，而在于它们之间的协调机制有多强韧。路由要准确，容错要完善，聚合要智能——这三层做好了，三个 Agent 能打出十个 Agent 的效果。

学AI大模型的正确顺序，千万不要搞错了

🤔2026年AI风口已来！各行各业的AI渗透肉眼可见，超多公司要么转型做AI相关产品，要么高薪挖AI技术人才，机遇直接摆在眼前！

有往AI方向发展，或者本身有后端编程基础的朋友，直接冲AI大模型应用开发转岗超合适！

就算暂时不打算转岗，了解大模型、RAG、Prompt、Agent这些热门概念，能上手做简单项目，也绝对是求职加分王🔋

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料，手把手帮你快速入门！👇👇

学习路线:

✅大模型基础认知—大模型核心原理、发展历程、主流模型（GPT、文心一言等）特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架（LangChain等）实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经

以上6大模块，看似清晰好上手，实则每个部分都有扎实的核心内容需要吃透！

我把大模型的学习全流程已经整理📚好了！抓住AI时代风口，轻松解锁职业新可能，希望大家都能把握机遇，实现薪资/职业跃迁～

智能问数技术路线与选型

腾讯面试官：你的多 Agent 协作，调度 Agent 怎么知道该分给谁？子 Agent 挂了整个任务就废了？

简要回答