【AI Agent通识九课】01 · Agent 和 ChatGPT 到底差在哪？-编程阁

AI Agent 通识课 · 第 1 篇 / 共 9 篇
一句话记住：会说话的 AI ≠ 会干活的 AI

最近被问得最多的一句话是——

“ChatGPT 我会用，Cursor 我也用过，那 Claude Code、Warp、Devin 到底和它们有啥不一样？”

我一开始也懵。

直到有天我把办公桌前的 5 个 AI 工具摊开对比，才发现真相只有一句话：

它们根本不是同一个物种。

这篇就是要把这件事讲透。读完你再看任何 AI 产品，都能 3 秒判断它是哪个物种——不被价格带偏、不被营销忽悠。

01 · 都是 AI，为啥分这么多名字？

你用 ChatGPT 写周报，顺手。
你用 Copilot 补代码，顺手。
你用 Cursor 改 bug，顺手。
你用 Claude Code / Warp / Devin 让它"自己搞定"，有点晕了。

长得都差不多：输入框 + 对话流。

价格从免费到 $500/月。

差别在哪？

只在一个核心问题：

这个 AI 能不能自己动手干活？

学会区分这件事，你下次选 AI 工具不会被营销话术带偏。

02 · 点外卖 vs 请私人管家

你要办一场周末生日聚会

用外卖 App（这是 ChatBot）：

你：推荐几家北京有生日主题包间的餐厅？
App：推荐三家——海底捞/大董/俏江南。

App 给完答案，事就结束了。

订餐厅、买蛋糕、发邀请、处理朋友的改时间请求——全是你自己来。

请私人管家（这是 Agent）：

你：管家，帮我安排下周六的生日聚会，10 个人。
管家：好的。
—— 20 分钟后 ——
管家：订了大董王府井店 18:00 包间；通讯录 10 个朋友已发邀请；3 人改时间到 19:00，餐厅已同意延后；蛋糕定了 85 度 C，6 点送到；预算 3800 元已登记。

差别清楚了吗？

ChatBot：给答案，你动手
Agent：它动手，给结果

背后用的 AI 模型可能完全一样（都是 GPT-4）。

差的不是聪明程度，差的是"能不能连续做事"。

03 · 一张图看清五个物种

把市面主流 AI 产品按"替你干活程度"排个序：

替你干活程度 ↑ │ 🤖 AI Agent ← 替你完成整个任务 │ 像私人管家：一句话→全部搞定 │ 代表：Claude Code · Warp · Devin · Cursor Composer │ │ 🧑‍💻 AI Copilot ← 你指挥，它动手 │ 像私人助理：你说"订这家"它去订 │ 代表：Cursor Chat · Copilot Chat │ │ ✍️ AI Copilot Lite ← 它写，你审 │ 像代笔实习生：写好稿子你逐字过目 │ 代表：老版 Copilot · Tabnine │ │ 💬 ChatBot ← 只给答案 │ 像外卖 App：问啥答啥，事还是你办 │ 代表：ChatGPT 基础版 · 豆包 · 文心一言 │ │ 📝 文本补全 ← 只补文字 │ 像智能输入法：你打一半它猜后面 │ 代表：GPT-3 API 时代 └──────────────────────────────→ 时间演进

上面一级包含下面所有能力。

Agent 是目前的顶部。

关键分界线在"谁动手"：

线下面：AI 给答案/建议，你动手
线上面：AI 动手，你验收

04 · 同一任务，五种反应

以"帮我办周末生日聚会"为例。

形态	反应	你还要做什么
📝 文本补全	你打"生日聚会要准备 __“，它补上"蛋糕、礼物、餐厅”	所有事全做
💬 ChatBot	“推荐三家包间餐厅：A、B、C”	订餐厅、买蛋糕、发邀请、处理问题
✍️ Copilot Lite	给你写好邀请函草稿	订餐厅、发邀请、其他
🧑‍💻 Copilot	你说"订 A 餐厅 18:00"，它调 OpenTable 下单	每一步你来指挥
🤖Agent	“好的”——20 分钟后给你完整汇报	验收

这个差别在开发场景也完全一样。

让 AI “修一下登录报错”：

ChatBot：告诉你"可能是 token 过期"（你还得自己查代码）
Copilot：你说"改这个函数"，它改，你 Accept
Agent：搜代码 → 定位问题 → 改 5 个文件 → 跑测试 → 提 PR

05 · Agent 的 4 大组件（必须记住）

不管你让 Agent 办生日会，还是让它修 bug，拆开看都是这 4 块：

┌──────────────────────────────────────┐ │ 🤖 AI Agent │ │ │ │ ┌──────┐ ┌─────────────┐ │ │ │ 大脑 │ ◄────► │ 记忆 │ │ │ │ LLM │ │ (上下文) │ │ │ └──┬───┘ └─────────────┘ │ │ │ │ │ │ 决策 │ │ ▼ │ │ ┌──────┐ ┌─────────────┐ │ │ │ 循环 │ ◄────► │ 工具箱 │ │ │ │Loop │ 执行 │ (Tools) │ │ │ └──────┘ └─────────────┘ │ │ │ └──────────────────────────────────────┘

翻译成管家的类比

大脑（LLM）：管家的脑子——GPT-4 / Claude / Gemini
工具箱（Tools）：管家的手脚——打电话、发邮件、订餐、下单
记忆（Context）：管家的小本子——主人的偏好、之前说过啥
循环（Loop）：管家的工作方式——"打电话→收到回复→调整方案→再打电话"的反复

Agent 和 ChatBot 最大的区别就在第 4 点。

ChatBot：一轮问答结束（像外卖 App 给你推荐完就没事了）
Agent：一次任务可以循环 20 次（像管家要打 10 通电话才能搞定一个饭局）

06 · "循环"到底是啥？一个具体例子

场景：你对 Agent 说"帮我安排周末带娃去游乐园"

ChatBot 的做法（一轮结束）

“北京适合 5 岁小孩的游乐园有：欢乐谷、石景山游乐园、嘉年华……”

给完建议，完事。

你还得查天气、查人流、订票、安排午餐、查路线。

Agent 的做法（多轮循环）

Round 1: 脑子：先查周末天气 做：搜索("北京周末天气") 看到：周六晴，周日大雨 Round 2: 脑子：那就周六去。看哪家游乐园合适 做：搜索("北京适合5岁小孩的游乐园") 看到：欢乐谷、石景山、嘉年华 Round 3: 脑子：周六人多吗？查一下客流 做：搜索("欢乐谷周六客流") 看到：建议上午去，下午排队超长 Round 4: 脑子：定方案，告诉主人 做：输出初版方案 看到：主人回复"加上午餐安排" Round 5: 脑子：找附近亲子餐厅 做：搜索("欢乐谷附近亲子餐厅") 看到：3 家可选 Round 6: 脑子：整理最终方案 做：输出完整行程（出门时间/路线/门票/餐厅/回家时间）

6 轮循环，每轮都在做"思考→行动→观察→再思考"。

这就是 Agent 的灵魂。

📌对应到开发场景：让 Agent “修登录报错”，它会循环"搜索错误 → 定位文件 → 读代码 → 改代码 → 跑测试 → 修到通过"——模式一模一样。

这个思考模式有个学名叫ReAct（Reason + Act），下一篇细讲。

07 · 主流 Agent 产品地图

这张表帮你建立"Agent 产品地图"：

产品	定位	适合谁	价位
Claude Code	编程 Agent	开发者	$20-200/月
Warp	终端 Agent	开发者、运维	免费-$40/月
Cursor	IDE Agent	开发者	$20/月
Devin	软件工程 Agent	企业团队	$500/月
AutoGPT	通用 Agent（祖师爷）	研究者	开源
Dify / Coze	低代码 Agent 平台	产品、运营	免费-付费
智谱清言 / Kimi 智能体	国内通用 Agent	大众用户	免费-付费

我自己的用法

我最近半年每天都在用这几个，踩坑总结出一个朴素指南：

写代码→ Cursor / Claude Code / Warp 三选一看偏好。我自己 70% 时间在 Claude Code，30% 在 Warp（终端重度依赖）
日常帮办事（订票、查资料、写报告）→ Claude / ChatGPT / 国内各家通用智能体
不懂代码做 Agent→ Dify / Coze（国内首选，拖拽搭建）
企业级复杂任务→ Devin（贵但能扛事，500/月不是给个人的）

踩过的坑：

早期我以为"Agent 越贵越牛"，花 200 刀一个月开 Claude Max，结果发现 80% 的事 20 刀的版本就能干。

Agent 的价值不在模型，在"适配你场景的工作流"。

08 · 为啥所有产品都在卷 Agent？

2023 年大家还在做 ChatBot。

2024 年头部产品全在卷 Agent。

为啥？

商业价值天差地别。

形态	用户做的事	愿意付的价	定价锚
ChatBot	“查资料、写文案”	$20/月	SaaS 工具（几十块/月）
Copilot	“辅助我做事”	$20/月	SaaS 工具（几十块/月）
Agent	“替我完成整个任务”	$200-500/月	人力成本（月薪几万）

能自主干活的 AI，承接的是人力，不是"工具"。

这解释了为什么 Devin 敢收 $500/月——它对标的是初级工程师。

回到生日聚会的例子：

ChatBot 给你推荐餐厅——值月付 50 块（一个App 会员的价）
Agent 替你全程办完聚会——值月付 2000 块（一个兼职助理的价）

差 40 倍，就差在"谁动手"。

09 · 你能带走什么

读完这篇，你应该能回答的 3 个问题

✅Agent vs ChatGPT 的核心差异：谁动手（AI 还是你）

✅Agent 的 4 大组件：大脑 + 工具箱 + 记忆 +循环（关键）

✅为什么 Agent 是商业趋势：承接的是人力，不是工具

下次评估 AI 产品时，问自己 3 个问题

它能自主调用工具吗？（不是只给建议）
它能在一次任务中循环多轮吗？（不是一问一答）
它的定价锚是"人力"还是"工具"？

下次被问"我们要不要做 Agent 功能"时

用外卖/助理/管家的比喻问回去：

场景是"给答案"（问答、推荐、科普）→ 做 ChatBot 够了，别过度设计
场景是"你给建议，他动手"（营销文案初稿、代码补全）→ 做 Copilot
场景是"替他干完整件事"（自动化运维、自主完成报告、办理流程）→ 做 Agent

需求不匹配形态，做得再好也没价值。

给问"北京天气"的用户一个管家，大材小用。

给问"办生日会"的用户一个外卖 App，用户会骂街。

10 · 下一篇预告

02 · Agent 的"思考回路"长啥样？

所有 Agent 产品共用的大脑——ReAct 循环。

你说"帮我规划周末带娃"，AI 内心到底转了几圈？

像装修师傅现场施工——边看边量边调。

对比 ReAct / Plan-and-Execute / Tree of Thoughts 三种主流思考模式，告诉你各自的适用场景。

一句话记忆锚点

🎯会说话的 AI ≠ 会干活的 AI。就像外卖 App 不等于私人管家，差别不在聪明程度，在"谁动手"。

【AI Agent通识九课】01 · Agent 和 ChatGPT 到底差在哪？