1. 面临的问题
随着大语言模型的逐步成熟,其提升空间非常小,Agent 的外在表现更多由一套驾驶大模型的方法所决定,但在企业内部落地过程中,我们还有一个不可忽视的因素,那就是企业内部私有知识,如果不能很好地发挥这些数据、知识、经验的作用,Agent 始终无法真正成为企业的数字员工。这就好比,一个刚毕业的实习生,一切都要从头开始教,这个训练过程如果缺乏一套标准化的实践,SRE 数字员工无从谈起。
2. Agent 对私有知识的诉求
在实际实践过程中,我们发现 Agent 对私有知识主要有三类诉求:
2.1. 从"人找知识"到"知识找人"
企业内部的知识通常以飞书文档、PPT 形式,人找知识的方式通常依赖搜索技巧,Agent 重点是能够感知上下文,如在故障应急期间搜索"数据库出现 SQL 执行超时怎么办",Agent 会优先从公司内部的数据库运维手册中搜索,直接给出操作步骤指引,而不是基于大模型的通识回答,让系统清楚人此时此刻需要什么。
2.2. 从"知道是什么"到"建议怎么做"
传统搜索会以文档维度输出匹配到的关键字,而 Agent 则会综合多个文档中的相关描述,在此基础上生成一份操作指南,并且在关键步骤上给出操作风险提示。这个过程其实类似从“手动挡“升级到"L2自动驾驶"的过程,像是增强版的基于大数据的信息推送。
2.3. 从“个人经验”到“组织智慧”
企业希望AI Agent不仅能利用现有知识,还能自动沉淀新的知识,形成持续进化的企业知识库。例如故障复盘文档写完就没人看了,下次遇到类似问题依然抓瞎,重复故障多次发生。一次数据库故障处理和复盘完成后,Agent 自动沉淀关键信息,生成一份结构化的知识、经验记录,下一次变更方案评审时,可以综合历史故障触发原因,对当前变更方案给出风险规避建议。
3. 实现路径
3.1. 构建高质量知识/经验供给
3.1.1. 统一知识接入层
多异构数据源接入,数据清洗,数据分块,知识打标
3.1.2. 混合检索引擎
向量检索 + 关键词检索,结合 Elasticsearch(关键词)和 Vector DB(语义)的结果,进行重排序(Rerank)。
3.1.3. 知识图谱辅助
构建实体关系
3.2.训练知识运用 Skill
工作流,先检索、再提炼,最后输出操作 SOP。
3.3. 知识经验持续更新机制
自动化知识提炼(Auto-Summarization),当 Agent 成功解决一个复杂问题时,自动调用 LLM 将对话过程总结为结构化文档(问题 - 原因 - 解决步骤),存入知识库。监控知识块的引用率和反馈评分,长期无人引用或差评多的知识,自动标记为“待审核”。
众包审核机制(Community Review)自动生成的知识草稿,推送给相关领域的专家(如 SRE Tech Lead)进行审核,通过后正式发布。员工贡献知识或修正 Agent 错误可获得积分,纳入绩效考核或奖励。
4.一句话建议
先做“检索增强”,再做“工具调用”,最后做“自动沉淀”。不要一开始就追求全自动,人机协同(Human-in-the-Loop)是企业级 Agent 落地的 safest path。