ReAct：让大模型一边推理，一边行动-编程阁

ReAct 将Reasoning与Acting放进同一个循环。模型不再只靠已有知识直接作答，而是先判断下一步，再调用搜索、数据库、计算器或其他工具，用真实结果继续推进任务。

01. ReAct 是什么

ReAct 的名字来自Reasoning + Acting。它不是某个特定模型，而是一种组织大模型完成任务的框架。

普通问答往往只有“输入问题—生成答案”两步。ReAct 在中间加入工具交互：模型可以搜索资料、查询数据库、执行代码或操作环境，然后根据返回结果继续判断。整个任务由多轮“思考—行动—观察”组成。

02. 为什么需要 ReAct

Chain-of-Thought（CoT）擅长把复杂问题拆开，但它仍主要依赖模型内部知识。遇到最新信息、陌生事实或精确计算时，一旦前面某一步猜错，错误可能沿着整条推理链继续传播。

只执行工具调用的Act又存在另一个问题：系统会行动，却不一定知道为什么要这样行动，也不容易把一个复杂目标拆成多个子目标。

ReAct 把两者结合起来：推理负责决定“下一步查什么、做什么”，工具负责提供真实反馈，观察结果再反过来修正推理。

03. 核心工作循环

循环会持续到模型获得足够信息，或者达到预设的停止条件。最后一步通常是Final Answer，即面向用户整理后的答案。

04. 一个直观示例

假设用户提出：“查出某篇论文的发表年份，再计算它距 2026 年有多少年。”模型不能只靠记忆，需要先检索，再计算。

Thought 1：我需要先确认论文的准确发表年份。 Action 1：Search[论文标题] Observation 1：检索结果显示论文发表于 2022 年。 Thought 2：现在可以计算 2026 - 2022。 Action 2：Calculator[2026 - 2022] Observation 2：4 Final Answer：该论文发表于 2022 年，距 2026 年为 4 年。

这里的关键不是格式本身，而是信息流：每个 Action 都由当前 Reasoning 决定，每个 Observation 又会改变下一步 Reasoning。

05. ReAct Prompt 怎么写

一个可用的 ReAct Prompt 至少需要说明四件事：任务目标、可用工具、工具调用格式和结束条件。

你需要解决用户的问题，并在必要时使用工具。 可用工具： - Search[query]：搜索外部资料 - Calculator[expression]：执行数学计算 工作规则： 1. 先判断当前缺少什么信息。 2. 需要外部信息时，选择一个工具并给出准确参数。 3. 根据 Observation 决定下一步。 4. 信息充分后，输出 Final Answer。 5. 不要编造工具结果。 输出格式： Action: 工具名[参数] Observation: 工具返回结果 Final Answer: 面向用户的最终答案

论文中的经典 ReAct 通常会加入若干Few-shot examples，让模型模仿完整轨迹。现代 Agent 系统则常通过Function Calling或结构化工具接口约束 Action，不必完全依赖自由文本格式。

06. ReAct、CoT 与 Act 的区别

方法	主要能力	外部工具	典型问题
CoT	分解问题并进行多步推理	通常不使用	可能依赖错误记忆，产生事实幻觉
Act	根据指令连续执行操作	使用	缺少任务分解，容易出现无目的调用
ReAct	推理、行动与反馈交替进行	使用	效果受工具质量和上下文长度影响

避开这些坑！用CANoe调试UDS时，NRC 0x22/0x24/0x33高频错误解决方法

避开这些坑！用CANoe调试UDS时，NRC 0x22/0x24/0x33高频错误解决方法在车载诊断系统开发中，UDS协议是工程师们最常打交道的标准之一。但当你正在产线EOL工位争分夺秒调试，或在台架测试的关键阶段，突然遇到ECU返回NRC 0x…

李华

如何彻底解决BT下载速度慢的问题：trackerslist项目完全指南

如何彻底解决BT下载速度慢的问题：trackerslist项目完全指南【免费下载链接】trackerslist Updated list of public BitTorrent trackers 项目地址: https://gitcode.com/GitHub_Trending/tr/trackerslist 你是否曾经面对BT下载时那令人沮丧的龟速进度条&…

李华

数字钟设计避坑指南：从555振荡器到数码管显示，我的课程设计踩了哪些雷？

数字钟设计避坑指南：从555振荡器到数码管显示，我的课程设计踩了哪些雷？去年电子技术课程设计的最后一周，实验室里此起彼伏的蜂鸣器报警声和此起彼伏的哀嚎形成了奇妙交响。我的数字钟项目在验收前48小时还在上演"数码管蹦迪&…

李华

客户电脑上Keil MDK编译报.axf文件错误？别慌，手把手教你排查‘软件授权’这个坑

Keil MDK编译报.axf文件错误的系统排查指南当你在本地开发环境一切正常，却在客户或同事电脑上遇到Keil MDK编译失败并报.axf文件相关错误时，这种"在我机器上能运行"的经典问题确实令人头疼。本文将带你深入理解这类问题的根源，并提…

李华

告别暴力破解失败：用BurpSuite的Recursive Grep功能搞定Pikachu靶场的动态Token防护

突破动态Token防护：BurpSuite Recursive Grep实战指南每次刷新页面都会变化的Token值，就像一道无形的屏障，让初入渗透测试领域的新手们屡屡碰壁。传统的字典爆破在这里完全失效，看着BurpSuite中不断返回的错误响应，那种…

李华

VCSA 6.7证书过期别慌！手把手教你通过修改系统时间+命令行续订STS证书（附fixsts.sh脚本）

VCSA 6.7证书过期应急处理全指南：从临时救急到彻底修复当你清晨走进机房，准备像往常一样登录VCSA管理界面时，屏幕上赫然出现的证书过期错误提示瞬间让血压飙升——所有管理功能瘫痪，关键业务面临中断风险。这正是许多VMware管理员…

李华