news 2026/5/6 21:43:27

Claude Code Harness Engineering介绍(Agent = Model + Harness 模型提供智力,Harness(马具/控制系统) 提供控制、可靠性和生产力)多代理协作

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Claude Code Harness Engineering介绍(Agent = Model + Harness 模型提供智力,Harness(马具/控制系统) 提供控制、可靠性和生产力)多代理协作

Code Harness:AI Agent 的超级引擎——Claude Code 背后的秘密

引言:为什么“Harness”才是真正的决胜点?

2025-2026 年,AI 编码工具爆发式增长:Claude Code、Cursor、Aider、Cline 等层出不穷。很多人以为胜负取决于底层模型(谁的 LLM 更聪明),但真正的高手和 Anthropic 内部却达成了共识:

Agent = Model + Harness
模型提供智力,Harness(马具/控制系统)提供控制、可靠性和生产力。

Code Harness(代码马具 / Agent Harness)就是围绕大模型构建的完整工程基础设施。它把一个“会聊天的 LLM”变成能长期自主编码、读写文件、运行测试、跨会话保持一致性的真正 Agent。

Claude Code 的成功,不是因为 Claude 模型突然变得无比强大,而是因为 Boris Cherny 及其团队打造了一套顶级的Code Harness

Code Harness 到底是什么?

Harness是模型与真实世界之间的“中间层”:

  • 不是单纯的 Prompt Engineering
  • 不是简单的 Tool Calling
  • 而是一整套生产级系统,包括:工具调度、权限控制、上下文管理、状态持久化、错误恢复、多 Agent 协作、监控循环等。

简单说,它是让 Agent “靠谱地活下去”的操作系统。

Anthropic 官方工程博客多次强调:Harness design 是 agentic coding 前沿性能的关键

Claude Code Harness 的核心架构

根据公开的 Anthropic 工程文章、源码泄露分析(2026 年事件)和 Boris Cherny 的分享,Claude Code Harness 主要包含以下部分:

  1. Master Loop(主循环)
    单线程或协调式循环,不断驱动:感知(读上下文)→ 推理 → Tool Call → 执行结果反馈 → 下一轮。直到任务完成或需要人工介入。

  2. Tool System(工具层,约 40 个权限门控工具)

    • 文件读写、bash 执行、grep、glob、浏览器、LSP(语言服务器)集成等。
    • 严格权限控制:默认谨慎模式,每项危险操作需用户批准;内置分类器自动判断安全动作。
    • Typed schemas 约束模型输出,确保 harness 能可靠解析和执行。
  3. Context & Memory Management(上下文与记忆)

    • 多层记忆架构:对抗“context entropy”(上下文混乱)。
    • 支持长运行(long-running)跨多个 context window。
    • Initializer Agent:首次会话负责项目初始化、任务分解、环境搭建、留下清晰 artifacts。
    • Coding Sub-Agents:后续会话专注增量实现,自动 compaction(上下文压缩)。
    • CLAUDE.md、Skills(.claude/skills/ 目录下的 Markdown 技能包)提供持久项目规则。
  4. Multi-Agent Orchestration(多代理协作)
    Planner / Generator / Evaluator 三代理结构(受 GAN 启发),或 Initiator + Sub-agents 模式。支持并行舰队(fleet of Claudes)。

  5. Safety & Recovery
    沙箱执行、失败重试、会话日志完整记录(每条消息、tool call 都可追溯)。人类始终保留最终决策权。

  6. Claude Agent SDK
    Anthropic 提供的通用 harness 基础,Claude Code 在此之上高度定制。

诞生故事:Boris Cherny 的“意外”

Boris Cherny(前 Meta Principal Engineer,《Programming TypeScript》作者)2024 年加入 Anthropic 后,用 Claude 做各种原型。最初只是个简单命令行工具(甚至能识别你在听什么歌),后来逐步获得文件系统权限,在公司内部爆火,最终演变为正式产品。

他强调:早期 Claude Code 并不惊艳,直到模型(Sonnet/Opus 4 系列)足够强大 + harness 迭代成熟,才实现爆发。现在 Anthropic 大部分代码都由 Claude Code 编写,工程师生产力大幅提升。

为什么 Harness 这么重要?实际影响

  • 相同模型,不同 Harness,性能天差地别。Terminal Bench 等评测显示,换个好 harness 能让同一模型排名大幅上升。
  • 解决 Long-Running Agent 难题:跨会话、跨 context window 保持一致性。
  • 可复制性:2026 年源码泄露后,社区涌现大量“从零构建 Claude Code 式 harness”的教程和开源项目。
  • 未来方向:Harness Engineering 已成为新学科。Prompt → Context → Harness 是进化路径。

如何开始构建或使用自己的 Code Harness?

  1. 直接用 Claude Code(最推荐)。
  2. 参考 Anthropic 官方
    • Effective harnesses for long-running agents
    • Harness design for long-running application development
  3. 开源/社区:研究 Claude Agent SDK quickstarts、GitHub trending 的 best practices repos。
  4. 核心原则(Boris 分享):
    • 信任模型,但用严格工具和权限约束它。
    • 做好初始化和 artifacts 交接。
    • 人类负责方向,Agent 负责执行。
    • 迭代 harness,比单纯优化 prompt 更重要。

结语:Harness 时代已经到来

Code Harness 代表了 AI Agent 从“玩具”走向“生产力工具”的关键工程跃迁。模型会越来越强,但决定你能走多远的,永远是那套把模型“套”好的马具

未来,顶级工程师不再只是写代码,而是设计、优化和编排 harness——让 AI 像优秀团队一样可靠地工作。

你准备好拥抱 Harness Engineering 了吗?


参考来源:Anthropic 官方工程博客、Boris Cherny 访谈与分享、2026 年社区对 Claude Code 架构的分析。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/6 21:41:30

Redis分布式锁进阶第十四篇:全系列终局架构复盘 + 锁体系统一规范 + 线上全年零事故收官方案

Redis分布式锁进阶第十四篇:全系列终局架构复盘 锁体系统一规范 线上全年零事故收官方案一、本篇定位:全系列最终收官篇前面十三篇,我们把手写锁缺陷、Redisson原理、死锁排查、集群锁丢失、热点锁优化、联锁治理、监控巡检、混沌压测全部讲…

作者头像 李华
网站建设 2026/5/6 21:38:55

匿名飞控代码烧录避坑指南:Keil 5.36版本安装与DAP-Link驱动问题解决

匿名飞控开发环境搭建全攻略:从Keil安装到代码烧录实战 刚接触匿名飞控和STM32开发的嵌入式新手们,是否经常被各种开发环境问题困扰?特别是当你好不容易组装好无人机硬件,准备大展拳脚时,却卡在了最基本的代码烧录环节…

作者头像 李华
网站建设 2026/5/6 21:38:54

2025网盘下载终极指南:八大平台直链解析工具免费使用教程

2025网盘下载终极指南:八大平台直链解析工具免费使用教程 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动云盘 / 天…

作者头像 李华
网站建设 2026/5/6 21:38:54

3分钟重置Navicat Premium试用期:macOS用户终极免费解决方案

3分钟重置Navicat Premium试用期:macOS用户终极免费解决方案 【免费下载链接】navicat-premium-reset-trial Reset macOS Navicat Premium 15/16/17 app remaining trial days 项目地址: https://gitcode.com/gh_mirrors/na/navicat-premium-reset-trial 还在…

作者头像 李华
网站建设 2026/5/6 21:38:07

STAR-BENCH:4D音频评估标准与技术实践

1. 项目背景与核心价值在沉浸式音频技术快速发展的当下,4D音频正成为影视制作、游戏开发、虚拟现实等领域的关键技术。但行业内长期缺乏统一的评估标准,导致不同团队开发的音频模型难以横向比较。STAR-BENCH的出现,填补了4D音频智能评估的技术…

作者头像 李华