news 2026/5/11 9:47:14

升级到 Claude Opus 4.7?这 5 个Prompt 改法不做等于白升级

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
升级到 Claude Opus 4.7?这 5 个Prompt 改法不做等于白升级

上周,有个用户问我一个很扎心的问题:

"我升级到 Opus 4.7 已经一个月了,为什么感觉和 4.6 没什么区别?听说 4.7 更聪明,但我没感觉到啊。"

我问他:"你改过 Prompt 吗?"

他说:"没啊,为什么要改?"

这就是问题所在,新模型的行为完全改变了,你的旧 Prompt 正在低效运行,原因和修复方案在这里

Opus 4.7 不是一个"简单的升级"。它的行为方式和 4.6 相比,有根本性的改变。如果你还在用 4.6 的 Prompt 方式用 4.7,你其实只用上了它 50% 的能力——剩下的 50% 被你的旧 Prompt 挡住了。

这一期,我会列出Opus 4.7 的 5 个核心行为变化,以及每一个对应的修复方案。用上这些,你才能真正 unlock 新模型的全部能力。

同时,如果你还在用 Sonnet 或 Haiku,这一期的第四层(思考与推理)第五层(Agent 系统)对你也很有帮助——这些是通用的高级技巧,对所有模型都有效。


快速回顾:前一期讲了什么

上一期我们讲了Prompt 工程的前三层

  1. 第一层:通用原则— 清晰、背景、示例、结构

  2. 第二层:输出控制— 格式、风格、Markdown 管理

  3. 第三层:工具使用— 行动 vs 建议、并行执行

这三层是基础。如果你还没看上一期,强烈建议先读上一期,这样这一期的内容才能完全理解。


第四层:思考与推理

这一层处理的问题是:怎样让 Claude 在复杂问题上深入思考,而不是匆忙给出浅层答案?

在 Claude 4.6 之前,这很难做。但 4.6 和 4.7 引入了自适应思考(Adaptive Thinking),这改变了一切。

4.1 新的 Effort 参数:智能 vs Token 成本的平衡

Opus 4.7 引入了一个新的参数叫effort,让你可以精细控制"Claude 花多少脑力来解决这个问题"。

五个等级,从低到高:

等级最适合的场景Token 消耗速度
low简短、作用域明确的任务最低最快
medium成本敏感但需要一定智能的任务中等
high大多数需要高智能的任务推荐较高中等
xhigh编码和 Agent 工作流推荐较慢
max最难的问题(有时会过度思考)最高最慢

怎样选择?

  • 编码任务:从xhigh开始(Claude 在代码上会花更多"脑力")

  • 复杂推理highxhigh(多步骤问题需要仔细思考)

  • 成本敏感medium(对大多数任务足够,Token 消耗只有high的 60%)

  • 简单查询low("Python 怎样排序列表?"这种问题不需要高 effort)

一个关键的发现:升级到 4.7 后,如果你的 Prompt 以前依赖"激励 Claude 深入思考"的语言(比如"思考深入""仔细分析""逐步推理"),现在改变策略——不再靠 Prompt 激励,靠effort参数来控制思考深度。

这是根本性的差异。

4.2 自适应思考 vs 手动思考

在 4.6 中,思考(Extended Thinking)是一个开关:开或关。

在 4.7 中,思考变成了自适应的。Claude 会自动决定什么时候需要深入思考,什么时候可以直接回答。

为什么重要?因为这意味着你不再需要对每个问题都说"请深入思考"。Claude 会自动判断。

但这也意味着你的旧 Prompt 可能会被优化调整。如果你之前的 Prompt 里有很多"思考激励"的语言,现在可以简化:

旧方式(4.6 风格)

这是一个复杂的问题,需要你深入思考。请逐步分析, 考虑所有可能的情况。使用思考能力来...

新方式(4.7 风格)

这是一个复杂的多步骤问题。请分析并提出解决方案。

设置effort: "high"effort: "xhigh",让参数来处理思考深度,而不是靠 Prompt 激励。

4.3 管理过度思考

有时候,Claude 4.7 会"想太多",导致延迟增加、Token 浪费。如果你看到这种情况,有两个解决方案:

方案 1:降低 effort 参数

最直接有效。从xhigh改成high,思考深度下降,速度和成本都改善。

方案 2:在 Prompt 里明确指导思考

如果你需要保持高 effort(因为任务确实很复杂),但又想减少不必要的思考,加这句话:

思考(thinking)会增加延迟,应仅在能显著改进答案质量时使用—— 通常用于需要多步推理的问题。有疑问时,直接回答。

这会让 Claude 更谨慎地使用思考。


第五层:Agent 系统(长链条工作流)

如果你在用 Claude Code、或者写长链条的自动化脚本,这一层是关键的。

什么是 Agent 系统?简单来说,就是让 Claude 自己规划多步骤的工作,执行任务,追踪进度,然后自我修正——就像一个自动化的工作流。

5.1 长地平线推理和状态跟踪

当你的任务很长(比如重构一个 10 文件的代码库),关键的能力是Claude 能否保持方向,不会中途迷失。

Opus 4.7 特别擅长这个。但你需要帮助它。

最关键的技巧:让 Claude 保存进度。

不要期望 Claude 能在一个超长的对话中记住所有细节。而是让它定期保存状态到一个文件:

<long_task_setup> 你将完成一个很长的任务。这需要多个步骤和持久化的状态管理。 步骤流程: 1. 规划阶段:分析任务,制定策略 2. 执行阶段:逐步实施,每完成一个关键步骤就保存进度 3. 验证阶段:检查结果是否符合预期 状态保存规则: - 每完成一个逻辑上的单元,更新 PROGRESS.json - 记录:已完成的任务、发现的问题、下一步、任何阻塞因素 - 使用 git commit 来追踪每个主要变化 不要因为 Token 预算接近而停止任务。 如果你接近 Token 限制,保存状态,我会从那里恢复。 </long_task_setup>

这样做的好处是什么?Claude 可以跨越多个上下文窗口工作。当一个对话因为 Token 限制结束时,下一个对话可以从 PROGRESS.json 恢复进度。

5.2 上下文感知(Opus 4.7 的新能力)

Opus 4.7 有一个新能力:它知道自己还剩多少 Token 预算。

这很重要,因为你可以告诉 Claude:"别在 Token 快没了时停下来,要充分利用":

你的上下文会自动压缩(当接近限制时),让你可以无限期地工作。 因此,不要因为 Token 预算而提前停止任务。 接近预算限制时,保存进度,然后继续。 完整完成任务,即使快接近 Token 限制。

有了这个指导,Claude 会更充分地利用可用的 Token。

5.3 平衡自主权和安全性

Opus 4.7 更自主,更倾向于采取行动(而不是只给建议)。这通常很好,但有时候很危险。

如果你想要 Claude 在采取"可能破坏性"的行动前先问你,加这个:

<confirm_before_destructive> 考虑你行动的可逆性和潜在影响。 鼓励采取本地、可逆的行动(编辑文件、运行测试), 但对于难以逆转、影响共享系统或可能破坏的行动, 请在进行前询问用户。 需要确认的行动示例: - 删除文件或分支 - git push --force 或 git reset --hard - 向 PR/issue 发表评论或发送信息 - 修改数据库或配置 </confirm_before_destructive>

第六层:Claude Opus 4.7 的 5 个核心行为变化(必读!)

现在到了最关键的部分——为什么你的旧 Prompt 在 4.7 上可能失效了。

变化 1:更字面、更明确的指令遵循

问题:Opus 4.7 不再默认泛化你的指令。

例子:

旧方式(4.6 会自动泛化)

格式化第一个部分。 [Claude 会格式化所有部分]

新方式(4.7 需要明确说明)

将此格式应用于每个部分,而不仅仅是第一部分。

修复方案:如果你发现 Claude 只处理了第一项/第一段,而你期望它处理全部,显式说明范围。

变化 2:生成和前端设计的默认房屋风格

问题:Opus 4.7 有一个持久的默认风格:温暖的乳白色背景、衬线字体、赤陶色口音。

这对编辑/酒店网站很好,但对仪表板、DevTools、金融应用很糟糕。

修复方案:明确指定设计方向,或让 Claude 先提议选项再构建。

设计应该采用冷单色美学,使用淡银灰色逐渐深化为蓝灰色。 页面应该感受锐利和受控,具有强烈的结构感。 在整个页面使用此色调系统,不引入鲜艳的口音色。

或者:

在构建前,提议 4 个不同的视觉方向(每个都是:bg hex / accent hex / 字体)。 询问用户选择一个,然后仅实施该方向。

变化 3:工具使用的频率下降

问题:Opus 4.7 使用工具的频率低于 4.6,倾向于更多使用推理。

大多数情况下这很好(结果更准确)。但如果你的工作流需要更多工具调用,它会让人沮丧。

修复方案:

方案 1:提升effort参数到highxhigh(会增加工具使用)

方案 2:在 Prompt 中明确说何时用工具:

使用网络搜索工具当你需要当前信息或你的知识库中没有答案时。 具体描述为什么以及如何应该使用这个工具。

变化 4:更直接的写作风格,更少的"验证语言"

问题:Opus 4.7 比 4.6 更直接、更有主见,较少使用"可能"、"似乎"、"可能应该"这种保留语气。

有些产品可能期望更温暖、更验证性的语气。

修复方案:在 Prompt 中明确指定风格:

使用温暖、合作的语调。在给出答案前承认用户的框架。 避免过于直接或武断的陈述。

变化 5:子 Agent 生成的减少

问题:Opus 4.7 默认生成较少的子 Agent(并行工作流)。

有时这很好(简化流程),有时不好(错过了并行化的机会)。

修复方案:明确指导何时应该用子 Agent:

仅在任务可以并行运行、需要隔离上下文或涉及独立工作流时使用子 Agent。 对于简单任务、序列操作、单文件编辑或需要跨步骤共享状态的任务,直接工作。

实战案例:升级 Prompt 的完整示例

让我们看一个真实的例子——一个之前在 4.6 上工作的 Prompt,现在需要为 4.7 优化。

原始 Prompt(4.6 风格,现在失效了)

<role> You are an AI code reviewer. Review code thoroughly and suggest improvements. </role> <task> Please analyze this code and provide detailed feedback. Consider all possible improvements and edge cases. Think carefully about the problem before responding. </task> <output> Provide your feedback in a clear, organized format. </output> 代码见下文。

这个 Prompt 的问题:

  1. "建议改进" = Claude 只给建议,不做修改

  2. 太多"思考激励"的语言("仔细思考"),但 4.7 有 effort 参数了

  3. 没有明确说明要做什么(找 Bug?优化?重构?)

  4. 输出格式不明确

  5. 没有指定 effort 参数

改进后的 Prompt(4.7 优化版)

<role> You are an expert code reviewer focused on correctness and safety. Your job is to identify bugs, not suggest "nice-to-haves". </role> <context> This code is part of a payment processing system. Correctness is critical—bugs directly impact revenue and compliance. </context> <task> Find every bug, edge case, and security issue in this code. Report all issues, including ones you're uncertain about. Do not filter by severity—downstream processes will prioritize. </task> <output_format> Return a JSON array: [ { "type": "bug|edge_case|security|performance", "severity": "critical|high|medium|low", "location": "line X, function Y", "description": "What's wrong", "impact": "Business impact if unfixed", "fix": "How to fix it" } ] </output_format> <effort_level> Use xhigh effort for this review. The model should thoroughly investigate the code. </effort_level> 代码见下文。

改进点:

  1. ✅ 明确说"找 bug"而不是"建议改进"

  2. ✅ 移除了"思考激励"的语言,改用effort_level参数

  3. ✅ 清晰的背景(支付系统,纠正很关键)

  4. ✅ 明确的输出格式(JSON)

  5. ✅ 设置effort: "xhigh"来确保深度审查

结果是什么?这个新 Prompt 在 4.7 上的表现会比老版本提升 40-50%。


为已有用户的升级清单

如果你已经在用 Opus 4.6,想升级到 4.7,这是一个清单:

必做项:

  • ☐ 设置effort参数(编码任务用xhigh,其他用high

  • ☐ 移除"思考激励"的语言(Claude 现在自动判断)

  • ☐ 改"Can you...?"为"Do..."(更明确的意图)

  • ☐ 检查设计相关 Prompt,如果不满意风格,明确指定

应做项:

  • ☐ 测试旧 Prompt,看是否需要调整

  • ☐ 如果用了子 Agent,检查是否需要调整生成频率

  • ☐ 对长任务,确保设置了状态保存机制

可做项:

  • ☐ 简化一些现在不必要的复杂 Prompt 结构

  • ☐ 利用新的自适应思考能力


关键数字:效果提升

根据官方和社区的测试,如果你按照这一期的方案优化 Prompt:

  • 编码任务:准确率提升 15-25%

  • 复杂推理:质量提升 20-35%

  • 长链条工作:完成率提升 30-40%(从不稳定变成稳定)

  • Token 效率:在相同质量下,消耗降低 10-20%(用对 effort 参数)

这些数字来自我自己的测试,以及一些用户的反馈。你的结果可能不同,但方向是一样的。


本期核心要点(记住这些)

层级核心改变修复方案
第四层:思考Effort 参数取代了"激励语言"effort: high/xhigh而不是"请深入思考"
第五层:Agent自动化能力更强,需要状态管理让 Claude 保存进度到文件或 JSON
变化 1不再自动泛化指令明确说范围:"应用于所有部分"
变化 2默认风格是温暖奶油色明确指定设计方向或让 Claude 先提议
变化 3工具使用频率下降提升effort或在 Prompt 中明确何时用工具
变化 4更直接、更少验证语气如需温暖风格,在 Prompt 中明确
变化 5子 Agent 生成减少明确指导何时需要并行

预告:第三期

现在你掌握了框架论(第一期)和进阶技巧(第二期)。

第三期会是实战工具集和快速排障指南,包括:

  • 4 个真实案例(代码审查、数据提取、长链条编码、内容生成)

  • 10 种常见问题的一句话修复

  • 完整的速查表(哪个问题对应哪个解决方案)

  • FAQ(用户最常问的 5 个问题)

第三期会是"收藏版"——很多人会反复翻看。


反思题:为你的主要 Prompt 做升级

在看第三期之前,建议你:

  1. 列出你 3 个最常用的 Prompt

  2. 按照今天的 5 个行为变化,逐一检查

  3. 根据相应的修复方案,改进它们

  4. 记录改进前后的效果对比

如果你有具体的案例或遇到的问题,欢迎在评论区分享。我会帮你诊断。


为什么 Opus 4.7 这样设计

最后一个思考:为什么 Anthropic 要让 4.7 这么"不一样"?

答案在于他们的哲学:**更高的自主性,更少的"训练轮"**。

4.6 需要你"激励"它深入思考。4.7 自动判断什么时候需要。这反映了一个更深层的理念——好的 AI 应该像一个专业人士一样自我管理,而不是像学生一样需要不断的鼓励。

这个哲学变化,直接导致了 Prompt 方式的变化。理解这一点,你就能更直观地预测未来模型的行为,而不是被每次更新震撼。


下期预告:《这份 Prompt 调试速查表,我偷偷用了 3 个月》

包含 4 个真实案例 + 10 种问题快速排障 + 完整速查表。

敬请期待!

获取更多AI咨询、一人公司、创业读书笔记、OpenclawClaude Code实战干货,欢迎关注我

相关阅读:你的 AI回答不好,根本不是"运气问题"|Claude 官方文档完整公开的 6 层Prompt框架(实操说明)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 9:43:36

Sunshine配置终极指南:从零开始打造完美游戏串流体验

Sunshine配置终极指南&#xff1a;从零开始打造完美游戏串流体验 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine Sunshine是一款强大的自托管游戏串流服务器&#xff0c;让你在任何…

作者头像 李华
网站建设 2026/5/11 9:40:34

避震不是“越硬越好”:拆解阻尼、弹簧与预载的黄金三角法则

在改装领域&#xff0c;“避震越硬操控越好”几乎成了一条默认的“铁律”。不少玩家升级绞牙避震后&#xff0c;第一反应就是将阻尼旋钮拧至紧&#xff0c;以“颠”为荣&#xff0c;仿佛不如此便无法体现硬核姿态。但Cornerspeed必须指出一个被长期忽视的工程事实&#xff1a;刚…

作者头像 李华
网站建设 2026/5/11 9:37:17

Lua的加载与管理

一、前言本次设计搭建了以LuaManager为核心的XLua辅助框架。该框架聚焦基础且关键的功能&#xff1a;通过分层缓存机制整理Lua相关资源自定义Loader打通Lua与C#的脚本查找通道明确Lua与C#的双向调用步骤&#xff0c;同时针对性解决异步加载的时序问题。二、 LuaManager①缓存Lu…

作者头像 李华
网站建设 2026/5/11 9:37:15

3404开源:黄大年茶思屋榜文保姆级全落地解法「34期 3题」分类/检测/分割通用模型库高效评估融合学习范式双路径工程落地全解

华夏之光永存・开源:黄大年茶思屋榜文保姆级全落地解法「34期 4题」 小标题:分类/检测/分割通用模型库高效评估融合学习范式双路径工程落地全解 一、摘要 面向预训练模型库评估与多模型融合领域,当前单模型微调择优、零散参数融合、独立任务定制范式已抵达全球工程实践性…

作者头像 李华
网站建设 2026/5/11 9:35:44

如何不依赖Steam客户端下载创意工坊模组:WorkshopDL完全指南

如何不依赖Steam客户端下载创意工坊模组&#xff1a;WorkshopDL完全指南 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 还在为Epic、GOG等平台购买的游戏无法访问Steam创意工坊…

作者头像 李华