news 2026/4/17 23:08:33

【词汇专栏】思维链(Chain-of-Thought):让 AI “一步步想“

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【词汇专栏】思维链(Chain-of-Thought):让 AI “一步步想“

思维链(Chain-of-Thought):让 AI “一步步想”

直接问 AI 一道复杂的数学题,它可能秒回一个错误答案。但在提问后面加上"请一步步思考"——准确率可能从 20% 跳到 80%。这就是思维链的魔力。


一句话定义

思维链(Chain-of-Thought,简称 CoT)是一种提示技术,通过引导大模型在给出最终答案前先展示推理的中间步骤,从而显著提升复杂推理任务的准确率。


为什么需要思维链?

人类的思维方式和早期 AI 的"思维方式"有本质区别:

人类做复杂题目: 15 × 23 = ? → 10 × 23 = 230 → 5 × 23 = 115 → 230 + 115 = 345 → 答案:345 (分步计算,每步简单,逐步累积得到正确答案) 早期 AI 的方式: 15 × 23 = ? → 345(直接跳到答案) (如果问题更复杂,就更容易算错)

思维链的核心洞察:让模型"把思考过程写出来",和人类"打草稿"是同一个道理。

不使用思维链: 模型直接输出答案 → 中间推理过程"黑盒" → 容易出错 使用思维链: 模型先写推理过程 → 每一步都相对简单 → 最终答案更准确 → 而且:你可以检查它的推理过程,发现错误在哪

通俗类比:考试时的"过程分"

数学考试: 只写最终答案(无思维链): "345" → 老师无法判断你是算对的还是蒙对的 写完整解题过程(有思维链): "15 × 23 = 15 × 20 + 15 × 3 = 300 + 45 = 345" → 即使最终答案算错,过程分也拿到了 → 更重要的是,你自己能在过程中发现错误 AI也一样:展示推理过程 = 更可靠 + 可检查

思维链的几种使用方式

1. 零样本思维链(Zero-Shot CoT)

最简单的用法——在问题后面加一句话:

提示词: "一个游泳池,长50米,宽20米,深2米。如果每小时注入100立方米水, 多久能注满?请一步步思考。" 关键就三个字:"一步步思考" → 模型会自动展开推理过程

这个方法由 Google 在 2022 年的论文中首次提出,简单到不可思议,却极为有效。

2. 少样本思维链(Few-Shot CoT)

给几个带有推理过程的示例:

提示词: Q: Roger有5个网球。他又买了2罐网球,每罐3个球。他现在有多少个网球? A: Roger开始有5个球。2罐 × 3个/罐 = 6个新球。5 + 6 = 11。答案是11。 Q: 餐厅有23张桌子。如果每张桌子坐4人,但3张桌子被预约了,还能坐多少人? A: 总共有23张桌子。23 × 4 = 92人。3张被预约 = 3 × 4 = 12人。92 - 12 = 80。答案是80。 Q: 小明有15块糖,给了弟弟1/3,又买了5块,给了朋友7块,最后给了妈妈一半。妈妈得到几块? A:

模型会模仿前面示例的推理格式,一步步给出正确答案。

3. 自动思维链(Auto-CoT)

让模型自动生成推理过程:

1. 用大模型自动生成大量的"问题 + 推理过程 + 答案" 2. 过滤掉推理有误的 3. 聚类选择有代表性的 4. 用这些自动生成的示例做 Few-Shot CoT → 不需要人工编写推理示例,完全自动化

思维链为什么有效?

从技术角度看,有几个原因:

1. 分解问题: 复杂问题 = 多个简单问题 每个简单问题模型都能处理 分步处理 > 一步到位 2. 更多"计算空间": 直接给答案:只输出几个字(计算量少) 展示推理:输出几百字(给模型更多"思考时间") → 更多的 token = 更多的计算 = 更好的结果 3. 错误可定位: 如果最终答案错了,看推理过程就能找到哪一步出错 → 方便调试和改进

思维链的进阶变体

变体核心思想说明
CoT一步步线性思考基础版
ToT(思维树)多分支探索像下棋一样,考虑多种可能的推理路径
GoT(思维图)推理路径之间可以合并不同的推理思路可以互相补充
ReAct推理 + 行动交替想一步 → 做一步 → 再想下一步
Self-Consistency多次推理取投票同一个问题让模型想多次,取最常见的答案

ToT 思维树的通俗理解

思维链(CoT): 问题 → 想法A → 想法B → 答案 (只有一条推理路径,走错了就是错了) 思维树(ToT): 问题 → 想法A → 分支A1 → 答案1 → 分支A2 → 答案2 → 想法B → 分支B1 → 答案3 → 分支B2 → 答案4 (多条推理路径,选择最优的)

思维链的局限

局限说明
简单问题不需要"1+1等于几?"加"一步步思考"反而啰嗦
模型能力不足时效果差小模型可能"假装思考"但推理过程错误
增加响应时间和成本推理过程多了几倍 token,更贵更慢
不是所有任务都适用翻译、摘要等任务不需要推理,用 CoT 没帮助
推理可能不准确2026年研究表明,模型的思维链有时只是"事后合理化",并非真正的推理过程

从提示技巧到内置能力

思维链最初只是提示工程的一种技巧,但现在已经演变成大模型的内置能力

2022年:需要在提示词中加"请一步步思考"(提示技巧) 2024年:OpenAI o1 模型内置"思考"环节(模型自动思考) 2025年:DeepSeek-R1 通过强化学习学会"慢慢想"(本专栏 P07) 从"外部提示"到"内在能力",思维链已经成为推理模型的标准配置

一句话总结

思维链的核心启示是:让 AI "慢慢想"比让它"快快答"更可靠。这个看似简单的道理——先展示推理过程,再给出最终答案——不仅大幅提升了复杂任务的准确率,还催生了 o1、DeepSeek-R1 等新一代"推理模型",让 AI 从"秒回答案的答题机器"进化为"会思考的问题解决者"。


延伸阅读

  • 论文解读 P07:DeepSeek-R1 —— 通过强化学习让 AI 自发学会"慢慢想"
  • 词汇专栏 W05:RLHF —— ChatGPT 是如何学会"听话"的
  • 词汇专栏 W15:Prompt —— 思维链是提示工程的重要技巧之一

标签#AI术语#思维链#Chain-of-Thought#CoT#推理#提示工程#大模型

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 23:04:13

AI辅助编程之生成测试用例

如大家所了解的,AI可以辅助生成测试用例。通过机器学习算法,AI能够理解代码的功能和逻辑,自动创建覆盖广泛的测试场景,确保软件的稳定性和可靠性。 让 AI 帮忙写测试用例着实是一种享受。我身边的一些程序员笑称:自己…

作者头像 李华
网站建设 2026/4/17 23:03:40

从输入URL到页面渲染完成的全过程

概述 当用户在浏览器地址栏输入一个URL,按下回车键后,浏览器需要将域名解析为服务器的IP地址,如果缓存中有这个域名对应的IP地址,则直接获取,否则会向域名服务器发起DNS查询请求来获得Ip地址。拿到IP地址后,浏览器会与目标服务器通过三次握手建立TCP连接。如果URL时HTTP…

作者头像 李华
网站建设 2026/4/17 22:55:37

别再花钱买会议软件了!手把手教你用Docker在Ubuntu 24上免费搭建Jitsi Meet(含SSL证书配置和品牌定制)

私有化部署Jitsi Meet:从零搭建企业级视频会议系统的完整指南 在远程协作成为主流的今天,视频会议系统已成为企业、教育机构和团队协作的标配。然而,商业解决方案如Zoom、腾讯会议等往往存在订阅费用高昂、功能限制和数据隐私等问题。本文将带…

作者头像 李华
网站建设 2026/4/17 22:55:37

035、FreeRTOS与实时性性能测试(最坏执行时间分析)

035、FreeRTOS与实时性性能测试(最坏执行时间分析) 一、从一次深夜报警说起 上个月在工厂现场调试一台基于STM32的物料分拣设备,凌晨三点突然收到报警:传送带卡料,电机堵转。查看日志发现,任务响应时间在某个时刻从平时的2ms飙升至200ms——直接导致PID控制环失控。当时…

作者头像 李华
网站建设 2026/4/17 22:52:40

PHP怎么用array_unique去重数组元素【方法】.txt

Go生成HMAC-SHA256签名需严格按字典序拼接参数、URL编码值、密钥转[]byte;验证失败多因原始数据不一致,如时间戳偏差、头字段名错误、double-encode等。Go 语言里怎么生成标准 HMAC-SHA256 签名签名本质是用密钥对请求参数做确定性哈希,Go 自…

作者头像 李华