news 2026/5/14 6:38:16

收藏 | 新手程序员必看:轻松入门大模型构建与优化实战教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
收藏 | 新手程序员必看:轻松入门大模型构建与优化实战教程

收藏 | 新手程序员必看:轻松入门大模型构建与优化实战教程

本文详细介绍了如何利用Claude Code、Claude Managed Agents和Hermes等技术构建和优化智能体。内容涵盖持久化指令文件、作用域上下文组装、分层记忆、梦境整理、渐进式上下文压缩、工作流与编排、工具与权限管理、自动化等关键点。同时,深入解析了智能体的三组件解耦、多智能体协作模式、上下文工程和性能优化。特别介绍了Hermes的五段式循环和五层记忆架构,包括短期记忆、技能手册、知识库、用户建模和工作日志。通过学习这些技术,开发者可以更高效、安全地管理智能体的能力,提升复杂任务的处理质量和可控性,是程序员和大模型学习者的宝贵资源。

1、Claude Code

1.1 持久化指令文件

没有这个文件时,每次对话都像从头开始,相同的规则和错误可能反复出现。

代价:文件需要随项目更新维护,否则可能误导智能体。

1.2 作用域上下文组装

将指令按不同范围(如组织、项目)拆分,让智能体能动态加载最相关的规则。

代价:规则分散在多个文件,可读性变差,且不同范围规则可能冲突。

1.3 分层记忆

将记忆分为三层:常驻的精华摘要、按需加载的细节、仅支持搜索的完整历史,以节省Token。

代价:实现更复杂。需设计信息如何分层、流动,并确保索引与实际数据同步。

1.4 做梦整理

定期在后台对记忆进行去重、清理和重组,类似“垃圾回收”,以保持记忆整洁有效。

代价:整理本身消耗资源,且可能误删有用信息。

1.5 渐进式上下文压缩

新的对话保留细节,稍旧的做轻量总结,更早的则压缩成简短摘要,适合长对话任务。

代价:压缩必有信息损失。后续需要细节时,智能体可能会“编造”。

1.6 工作流与编排

这类模式核心是“分离”,通过拆解任务流程来提升复杂任务的处理质量和可控性。

探索-规划-行动循环

严格分为三步:只读探索、与用户对齐的规划、拥有写权限的执行,避免盲目操作。适用于不熟悉的代码库或复杂修改。

代价:流程更慢,小任务会显得“笨重”。

上下文隔离子智能体

为不同阶段(如调研、执行)创建拥有独立上下文和权限的子智能体,防止信息相互污染。适合长会话、多阶段任务。

代价:需要额外协调信息传递,传多或传少都有问题。

分支-合并并行

将可并行的子任务分发给多个在独立环境中工作的子智能体,最后合并结果,以提升效率。

代价:合并更复杂,处理代码冲突的难度增加。

1.7 工具与权限

这类模式关注如何安全、高效地管理智能体的能力。

渐进式工具扩展

开始时只提供最必要的工具,复杂工具按需动态加载,降低智能体的选择成本和出错概率。

命令风险分类

根据命令类型、参数和影响,自动评估其风险等级(安全、有风险、危险),并采取自动执行、请求确认或直接拦截等不同策略。

单用途工具设计

将常用操作(如读文件、搜索)封装为专用工具,而非依赖通用Shell命令,以提高可理解性、可审查性和权限控制粒度。

1.8 自动化

确定性生命周期钩子

在智能体生命周期的关键节点(如会话开始、工具调用后)自动触发预设动作(如代码格式化),由系统确保关键流程被执行,不依赖可能被模型遗忘的指令。

2、Claude Managed Agents

2.1 宠物与牲畜基础设施哲学

  • Session(会话)是宠物:精心培育、持久保存、不可丢失。
  • Harness(控制器)和 Sandbox(沙盒)是牲畜:可以随时创建、销毁、替换。

2.2 智能体三件套解耦

一个智能体由三个核心组件构成:

  1. Claude(大脑):负责推理和决策。
  2. Harness(双手):驱动运行循环,调用Claude API并将工具调用路由到执行环境。
  3. Sandbox(工作台):Claude在其中编写代码、编辑文件、运行命令的隔离环境。

Session:不可变的事件流

Session核心接口只有两个:记录事件(emitEvent())和读取事件(getEvents())。它是只追加的日志,天然支持重放和状态恢复,赋予智能体容错能力。

Harness:驱动循环

Harness是控制中心,它执行一个循环:从Session取上下文 → 调用Claude → 记录响应 → 如有工具调用则路由到Sandbox执行 → 记录结果 → 循环。Harness本身无状态,所有状态都在Session中,因此可随时替换或重启。

Sandbox:隔离的执行环境

每个Sandbox完全隔离,有自己的文件系统、进程和网络。关键特性是可隔离、可重建、可扩展。

核心安全设计:凭证永不进沙盒

采用保险库(vault) + 代理(proxy)架构:

所有第三方凭证存储在独立的保险库中,Harness和Sandbox都无法直接访问。

当需要调用外部工具时,通过代理从保险库按需获取凭证并执行请求。凭证始终不会暴露给Sand盒中的代码。

优势:遵循最小权限原则,所有外部调用可审计,凭证可统一轮换。

2.3 多智能体协作模式

得益于三组件解耦,自然支持多种协作模式:

  • 多脑一手:多个Claude实例共享一个Sandbox。适用于多角度分析同一份代码(如安全审查+性能优化)。
  • 一脑多手:一个Claude实例控制多个Sandbox。适用于需在不同环境(如Python和Node.js)中同时执行任务。
  • 多脑多手:多个Claude实例各有自己的Sandbox,通过共享Session协调。适用于最复杂的多步骤任务。

2.4 上下文工程:保持大脑专注

为管理长任务中的上下文窗口,引入多种技术:

  • 上下文压缩:当上下文窗口将满时,将早期对话压缩成总结,腾出空间。原始数据仍完整保留在Session中。
  • 记忆工具:让Claude能主动将重要信息写入持久存储,后续可主动检索,类似人类记笔记。
  • 上下文裁剪:在发送给Claude前,智能地裁剪不相关的上下文,只保留当前任务需要的部分。

三者协同,确保Claude始终获得最相关的上下文。

2.5 性能优化:显著降低响应延迟

关键在于将大脑(推理)从容器(Sandbox)中解耦。解耦前,每次推理都需等待Sandbox容器完全启动。解耦后,编排层从Session日志拉取事件后,推理可立即开始,使得首Token延迟降低60-90%。

3、Hermes:会进化的智能体

3.1 五段式循环

规划 → 执行 → 观察 → 学习 → 适应

3.2 五层记忆架构

L1 短期记忆(便利贴):

当前对话的临时信息。

L2 技能手册(肌肉记忆):

完成复杂任务(如涉及5次以上工具调用)后,自动生成SKILL.md文件,记录完整的解决步骤,形成可复用的流程。

L3 知识库(语义记忆)

如何理解语义记忆?

简单讲就是利用向量存储这个技术,来实现模糊检索,原理是:即使字面不同,但语义相近的文本,其向量在数学空间中的位置也很接近。

举例查询进度报告技能:

“进度报告” vs “项目周报” → 相似度 0.92(很高!)

“进度报告” vs “预订机票” → 相似度 0.15(很低)

返回结果:返回最相关的技能:生成项目周报.md

L4 对你的了解(用户建模)

首先什么是黑格尔“辩证式”:

黑格尔“辩证式”就是AI内部在讨论:“我对用户的理解对吗?新证据说明了什么?怎么更新我的理解?”

越来越懂你的朋友:

不是一次判断就定终身,允许你改变、允许情况复杂,通过不断观察、思考、调整,越来越懂真实的你。

这就像最好的朋友:知道你“通常”怎样,但也理解你“有时”会例外

比喻:

  • 旧版本:“林总喜欢喝美式”
  • 新发现:今天林总点了拿铁
  • 冲突:旧版本 和 新证据矛盾
  • 解决方案:不直接覆盖成“喜欢拿铁”,而是升级:

  • “林总平时喝美式,但周三下午会换拿铁”

L5 工作日志(长期档案)

FTS5全文检索+LLM摘要:跨会话搜索历史对话,永久存储

  • LLM 摘要(写读书笔记):每次长谈后,AI 会自动用一两句话总结核心结论,写在笔记本的“摘要区”。
  • FTS5 全文检索(给笔记本加智能目录):AI 会给笔记本的每一页(包括详细对话和摘要)的所有关键词,自动生成一个超快的电子索

最后

近期科技圈传来重磅消息:行业巨头英特尔宣布大规模裁员2万人,传统技术岗位持续萎缩的同时,另一番景象却在AI领域上演——AI相关技术岗正开启“疯狂扩招”模式!据行业招聘数据显示,具备3-5年大模型相关经验的开发者,在大厂就能拿到50K×20薪的高薪待遇,薪资差距肉眼可见!

业内资深HR预判:不出1年,“具备AI项目实战经验”将正式成为技术岗投递的硬性门槛。在行业迭代加速的当下,“温水煮青蛙”式的等待只会让自己逐渐被淘汰,与其被动应对,不如主动出击,抢先掌握AI大模型核心原理+落地应用技术+项目实操经验,借行业风口实现职业翻盘!

深知技术人入门大模型时容易走弯路,我特意整理了一套全网最全最细的大模型零基础学习礼包,涵盖入门思维导图、经典书籍手册、从入门到进阶的实战视频、可直接运行的项目源码等核心内容。这份资料无需付费,免费分享给所有想入局AI大模型的朋友!

👇👇扫码免费领取全部内容👇👇

部分资料展示

1、 AI大模型学习路线图

2、 全套AI大模型应用开发视频教程

从入门到进阶这里都有,跟着老师学习事半功倍。

3、 大模型学习书籍&文档

4、AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

5、大模型大厂面试真题

整理了百度、阿里、字节等企业近三年的AI大模型岗位面试题,涵盖基础理论、技术实操、项目经验等维度,每道题都配有详细解析和答题思路,帮你针对性提升面试竞争力。

6、大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

  • 👇👇扫码免费领取全部内容👇👇

这些资料真的有用吗?

这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/14 6:38:06

AP0803QD 双N沟道MOS管 耐压30V 电流30A 锐科半导体

产品特点&#xff1a; ⚫ 30V /30A RDS&#xff08;ON&#xff09;<11.5mΩ&#xff20;VGS10V TYP:9mΩ RDS&#xff08;ON&#xff09;<18mΩ&#xff20;VGS4.5V TYP:11mΩ ⚫ Advanced Trench technology ⚫ Excellent RDS(ON) and Low Gate Charge ⚫ Fast switch…

作者头像 李华
网站建设 2026/5/14 6:33:07

基于MCP协议的GitHub PR智能审查引擎:AI编程助手的安全代码审查实践

1. 项目概述&#xff1a;一个为AI编程助手打造的GitHub PR智能审查引擎如果你和我一样&#xff0c;日常开发工作流已经深度嵌入了像Cursor、Claude Code这类AI编程助手&#xff0c;那你肯定也遇到过这样的痛点&#xff1a;当AI助手帮你生成了一大段代码&#xff0c;或者你准备合…

作者头像 李华
网站建设 2026/5/14 6:23:05

深入剖析iOS应用性能与功耗优化:从理论到实践

引言 在移动互联网高度发达的今天,用户体验已成为应用成功的关键因素。流畅的操作、快速的响应、持久的续航,这些看似基础的需求背后,是iOS开发者对性能与功耗持续优化的不懈追求。对于资深iOS工程师而言,深入理解系统机制,掌握高效的优化技巧,并能在复杂业务场景(如民…

作者头像 李华
网站建设 2026/5/14 6:23:04

如何通过phpMyAdmin给WordPress所有用户发送全站通知_系统表插入

WordPress通知数据应插入对应通知插件创建的自定义表&#xff08;如wp_wpnotification_logs&#xff09;、wp_options配置项或wp_posts中post_typenotification的草稿&#xff0c;而非wp_users或wp_usermeta&#xff1b;需先确认插件是否存在及启用状态&#xff0c;再按其字段规…

作者头像 李华
网站建设 2026/5/14 6:21:28

Web3信息聚合工具:本地化、无依赖的桌面应用设计与实现

1. 项目概述&#xff1a;一个为Web3从业者打造的本地化信息聚合工具 在Web3这个信息爆炸的领域&#xff0c;每天都有海量的新闻、观点和动态从CoinDesk、Decrypt等数十个头部媒体以及Vitalik Buterin、Arthur Hayes等行业领袖的社交渠道中涌出。对于开发者、交易员、研究员或者…

作者头像 李华
网站建设 2026/5/14 6:20:38

高性能异构计算利器:OpenClaw-Nerve 底层优化与实战解析

1. 项目概述与核心价值最近在整理一些开源项目时&#xff0c;发现了一个名字挺有意思的仓库&#xff1a;daggerhashimoto/openclaw-nerve。乍一看&#xff0c;这个名字组合有点让人摸不着头脑&#xff0c;daggerhashimoto是开发者&#xff0c;openclaw和nerve这两个词组合在一起…

作者头像 李华