news 2026/5/4 13:44:49

Hermes踩大坑:见到好的开源项目就马上移植,却没考虑过合不合适

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Hermes踩大坑:见到好的开源项目就马上移植,却没考虑过合不合适

‍# RalphLoop × Karpathy LLM Wiki 全方位改造方案

本作者用5亿token踩的坑,你可别再踩了。

总是在社媒平台看到有些博主,又发了个对通用智能体框架很有帮助的项目,几乎是隔天隔周就发一个好厉害的项目。

关于karpathy的llm wiki,我引入了,真心论证过后引入了,让kimi和minimax检查了一遍又一遍,以为万事大吉了,直到今天,你看看吧。

直接说结论:不要看到一个很厉害的开源项目就想直接拿过来用,冲突、风险、冗余、架构方方面面,少一点考量都会导致你越跑越偏。

看吧,karpathy的llm wiki虽好,你看看真的适合你吗?反正我已经移除了,再找找更合适的新路子。

核心结论:不要盲目移植开源项目。Karpathy 的 LLM Wiki 虽好,但与 Hermes 现有架构、工作流和知识生产模式存在根本性错配,已移除。


一、现状诊断(改造前基线)

1.1 双轨知识库割裂

维度RalphLoop 知识产出Wiki 系统现状
位置knowledge_base/(4.2MB)harness-knowledge/(577MB)
内容高质量研究报告(3000字深度档案)8,800+ 空壳页面(平均430字符)
关系零链接、零同步、零交叉引用独立运行,未消费研究报告

1.2 RalphLoop 任务流本质

当前是研究报告工厂topics-queue→ Researcher-KB Agent → 写报告 → 标记完成。没有编译、交叉引用、入库审核、生命周期管理。

1.3 与 Karpathy 构想的差距

Karpathy 要求Hermes 现状差距
人类策展决定来源Agent 自主决定研究对象❌ 无人类把关
LLM 编译(1来源→10-15页面)1份报告→1个文件❌ 无编译深度
交叉引用网络91.5% 孤儿页面❌ 无知识网络
定期 Lintwiki-maintainer 几乎不运行❌ 无维护机制
约 100 篇 / 400K 词8,800 篇 / 577MB 空壳❌ 规模失控

二、改造核心原则

不破坏现有核心流程ralph-looptask-queuespawn-hermestopics-queue保持不动,仅改造任务模板、新增脚本、调整目录结构。

引入 Karpathy 三层架构

harness-knowledge/ ├── raw/ ← 原始来源(研究报告、会话记录、外部文章) ├── wiki/ │ ├── draft/ ← 待审核新页面 │ ├── packets/ ← Knowledge Packet(核心知识单元) │ ├── procedures/ ← 可复用操作流程 │ ├── decisions/ ← 架构决策记录 │ └── archive/ ← 归档 ├── schema.md ← 知识库规范(人类维护) └── scripts/ ← 自动化脚本(编译器、巡检、生命周期、质量评分)

人机分工重新定义

角色做什么不做什么
人类定义核心域、核心问题、审核 draft、定义 schema不写 wiki、不维护链接
Compile Agent读取 raw/,编译成 packets/,建立交叉引用不决定研究什么
Lint Agent每周巡检,发现矛盾、孤儿、过时内容不写入新内容
Curation Agent评估 draft 质量,决定转正/退回/合并不生成原始内容

三、五阶段改造路线图

Week 1:止血与架构重组

  • 新建三层目录,将现有空壳批量归档,迁移研究报告至raw/
  • 重写schema.md,定义页面格式、质量标准(最小1,500字符、至少2个出链、60分及格)
  • 修改 Researcher-KB Prompt:不再直接写 wiki,改为产出raw/研究报告 + 编译指令

Week 2-3:建立编译流水线

  • 部署wiki-compiler:读取raw/来源,深度综合编译为wiki/draft/中的 Knowledge Packet(1来源可更新3-10个Packet)
  • 部署wiki-quality:自动评分(长度、出链、结构完整性)
  • 在任务队列中新增compile类型任务

Week 3-4:生命周期与策展

  • 部署wiki-lifecycle:每周自动统计入链数、质量分、最近访问时间,自动归档低质量/过期/孤儿页面
  • 部署Curation Agent:审核draft/,≥60分转正,<60分退回,重复度>80%合并
  • 人类仅审核 borderline 案例和架构决策(ADR)

Week 4-5:消费约束

  • 在核心状态机中增加强制召回机制:Agent 执行涉及特定域的任务前,必须先查询对应 wiki Packet
  • 所有 Agent Prompt 增加"先查 wiki"规则
  • 引入语义索引(sqlite-vec + bge-m3)优化召回质量

Week 5-6:聚焦核心域

  • 严格限定仅 3-5 个核心域进入wiki/packets/(如hermes-architecturehermes-operationsagent-patternsmcp-ecosystem
  • 非核心域内容(如"全球思想家研究")留在knowledge_base/,不进入 wiki
  • 人类每周 15-30 分钟策展:浏览 draft、决定转正/退回、提出新 Compile 任务

四、预期效果

指标改造前改造后(6周目标)
wiki 页面总数8,800+150-250
空壳率99.9%< 5%
孤儿率91.5%< 20%
平均内容长度430 字符2,000+ 字符
wiki-recall 调用1次/历史10-20次/天
Agent 复用 wiki 结论~0%60%+

Token 节省:按每天20个任务、60%复用率、每次复用节省3,000 Token估算,每月节省约100万 Token

改造成功标志

  1. Agent 从"几乎不查 wiki"变成"默认先查"
  2. 人类在 Obsidian 中打开 wiki 时,看到的是有价值的知识网络
  3. RalphLoop 从"研究报告工厂"变成"知识编译+维护流水线"
  4. 知识库规模稳定,遵循"淘汰旧知识 = 补充新知识"

五、风险与缓解

风险可能性影响缓解
Compile Agent 产出仍然太浅硬性字数门槛(1,500+),人类审核前10个样本
人类策展时间不足Curation Agent 自动过滤(<60分直接退回),人类只审 borderline
语义索引引入复杂度保留原有 FTS5 作为 fallback
任务积压Compile/Lint 设为 P2 优先级,不阻塞核心任务
语义漂移每个 Packet 强制标注 sources,矛盾时回溯 raw/

六、一句话总结

改造的本质不是"让 RalphLoop 写更多 wiki",而是"把 RalphLoop 从研究报告工厂改造成知识编译器"——人类策展决定什么值得学,RalphLoop 负责编译和维持,Agent 执行时先查已编译的知识。这样知识库才会从"8,000 个空壳"变成"200 个真正可复用的知识包"。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/4 13:44:11

为OpenClaw智能体工作流配置Taotoken后端服务

为OpenClaw智能体工作流配置Taotoken后端服务 1. 准备工作 在开始配置之前&#xff0c;请确保已安装最新版本的OpenClaw框架。同时需要在Taotoken控制台获取有效的API Key&#xff0c;并在模型广场确认要使用的模型ID。这些信息将在后续配置步骤中使用。 2. 通过CLI快速配置…

作者头像 李华
网站建设 2026/5/4 13:44:02

避开STC8H PWM输入捕获的坑:从寄存器配置到中断处理,我的调试笔记

STC8H PWM输入捕获实战&#xff1a;从寄存器陷阱到精准霍尔信号解码 第一次用STC8H的PWM模块做霍尔编码器信号捕获时&#xff0c;我的开发板上始终读不到脉冲计数。示波器明明显示编码器输出正常&#xff0c;但MCU的中断服务程序就像睡着了一样。经过三天寄存器级的逐行调试&am…

作者头像 李华
网站建设 2026/5/4 13:42:58

单细胞数据分析新纪元:SCP如何让复杂研究变得简单直观

单细胞数据分析新纪元&#xff1a;SCP如何让复杂研究变得简单直观 【免费下载链接】SCP An end-to-end Single-Cell Pipeline designed to facilitate comprehensive analysis and exploration of single-cell data. 项目地址: https://gitcode.com/gh_mirrors/sc/SCP 想…

作者头像 李华
网站建设 2026/5/4 13:40:28

C++STL:list(双链表)的底层实现 部分源码解析

1.list部分源码解析同样&#xff0c;现在我们是读不懂大部分源码的。还是跳着看&#xff0c;看看部分模块功能&#xff0c;重要的底层变量&#xff0c;不去深究根据我们看vector源码的理解&#xff0c;list头文件而是其他头文件的封装&#xff0c;重要的是 list.h &#xff0c;…

作者头像 李华
网站建设 2026/5/4 13:34:58

3步掌握B站直播推流码获取:突破官方限制的专业直播解决方案

3步掌握B站直播推流码获取&#xff1a;突破官方限制的专业直播解决方案 【免费下载链接】bilibili_live_stream_code 用于在准备直播时获取第三方推流码&#xff0c;以便可以绕开哔哩哔哩直播姬&#xff0c;直接在如OBS等软件中进行直播&#xff0c;软件同时提供定义直播分区和…

作者头像 李华