news 2026/4/16 18:26:28

【收藏必备】RAG系统调优秘籍:3大方向+12个技巧全面提升检索准确率

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【收藏必备】RAG系统调优秘籍:3大方向+12个技巧全面提升检索准确率

#本文系统介绍了RAG高级技术与调优方法,分为知识库处理、高效召回和图谱检索三大方向。知识库处理包括问题生成、对话沉淀、健康度检查和版本管理;高效召回涵盖查询扩展、混合检索(BM25+向量)、重排序等策略;图谱检索则利用知识图谱构建结构化知识网络。这些技术可显著提升检索准确率和系统性能,是构建高质量RAG系统的必备方法。


前言

RAG是一个系统性工程,要达到较好的检索结果,需要不断地对细节进行优化。为此,我整理了RAG高级技术与调优的系统方法,主要分为以下三个方向:

  • 1.知识库处理
  • 2 .高效召回
  • 3 .图谱检索

一、知识库处理

1.知识库问题生成

当用户提问与知识切片的相似度不高时,通过AI为每个知识切片生成可能的问题,通过问题与问题的匹配来提高检索准确度。

举例如下:

民用建筑规范条文原文:
6.6.2 卫生器具配置的数量应符合国家现行相关建筑设计标准的规定。男女厕位的比例应根据使用特点、使用人数确定。在男女使用人数基本均衡时,男厕厕位(含大、小便器)与女厕厕位数量的比例宜为1:1~1:1.5;在商场、体育场馆、学校、观演建筑、交通建筑、公园等场所,厕位数量比不宜小于1:1.5~1:2

根据以上条文,生成三种类型的问题

1.直接问

问:根据《民用建筑设计统一标准》,在商场、体育场馆这类场所,女厕位数量与男厕位(含小便器)数量的比例最低不应小于多少?

2.对比问

问:在设计办公楼的厕所和商场的厕所时,规范对男女厕位比例的要求有什么不同?

3.场景问

问:我正在为一个大型体育馆设计公共厕所。根据《民用建筑设计统一标准》,在规划男、女厕位数量时,我应该遵循怎样的比例要求来确保满足规范并避免女性排队过长?

将以上生成的问题与原知识切片与进行拼接,然后再做向量化。这样可以大幅提升检索准确率。

2.对话知识沉淀

产品上线后每天产生大量对话,其中隐藏着高频问题、用户真实需求、最新信息,从这些对话中提取和沉淀有价值的知识,持续丰富知识库。对于建筑规范问答而言,高频问题以及用户的场景化描述是最有价值的信息。

针对高频问题

针对高频问题对应调整知识切片,可增加高频问题回答正确率,从而高效优化产品提升用户满意度。

用户场景化描述

用户的场景化描述一般都都明确指向了规范理解的重点和难点,这恰恰也是RAG系统需要处理的重点与难点

例如:

1.“我想在商业综合体顶层加个员工餐厅(目标),但原设计是办公(约束),防火分区怎么调整?(核心问题)“。这是最经典的场景化需求。

2.“…和…有矛盾时,以哪个为准?”:揭示了规范冲突点或用户理解难点。

3“除了…规定,有没有更经济的做法?”:揭示了成本敏感型需求。

3.知识库健康度检查

对整个知识库进行健康度检查,找出缺少的知识、过期的知识、冲突的知识,确保知识库的质量和可靠性。

  • • 完整性:是否可以覆盖用户高频问题?
  • • 时效性:建筑规范是否为最新版本?
  • • 一致性:是否存在规范冲突?

4.知识库版本管理与性能比较

对知识库进行版本管理,实现回归测试、上线前验收,并比较不同版本的知识库性能,选择最优版本。

  • • 版本对比:识别新增、修改、删除的知识切片;
  • • 性能测试:在相同测试集上比较准确率与响应时间;
  • • 回归验证:确保更新不会破坏原有问答能力。

二、高效召回

1.查询扩展

使用大模型将用户查询改写成多个语义相近的查询,提升召回多样性。在 LangChain旧版本中提供了MultiQueryRetriever支持多路查询召回,新版本需要自己编写

简单来讲,就是一个问题变为多个问题,通过多路召回,提高覆盖度。

例如:

原始问题:楼梯踏步高度是多少?

扩展后多个问题:
1.楼梯踏步高度有什么规定?
2.踏步高度允许范围是多少?
3.民用建筑楼梯踏步尺寸要求
4.楼梯踏步高度限制

将以上4个问题同时去知识切片中检索,得到的内容一定要比一个问题去检索来的更为全面。

2.混合检索

  • • BM25:擅长精确匹配术语,也就是关键词检索
  • • 向量检索:使用语义相似度去匹配,也就是模糊检索

通常情况下,两者需要混合使用,两者分数加权融合,可根据场景更改权重。专业文档、法规查询权重偏向BM25,口语化、泛化查询权重偏向向量检索。

通过两者的配合可以极大的提高检索的准确率。

3.重排序

重排序Rerank主要用于优化初步检索结果的排序,提高最终输出的相关性或准确性。

重排序模型的精度和准确性要大于向量模型。如果你的个人知识库文档数量有限,且你并不介意成本和响应时间,那么在召回时可以直接使用重排序模型,筛选出最相关的知识切片。

一般的,还是先进行向量检索,再对召回的相关候选切片进行精细打分和重新排序。

4.其他召回策略

  • • 双向改写:将查询扩展为文档,或为文档生成关联查询
  • • small-to-big:特别适用于处理长文档或多文档场景。核心思想是通过小规模内容(如摘要、关键句或段落)建立索引,并链接到大规模内容主体中。

三、GraphRAG

GraphRAG的核心创新在于,它先利用知识图谱对文档库进行深度建模,将非结构化的文本转化为结构化的知识网络,然后基于这个图谱进行检索和推理。

传统 RAG:就像一个只能通过关键词在图书馆目录中搜索,然后找到几本相关书页的助手。

GraphRAG:则像一位已经读完了整个图书馆的书,并画出了一张详细“知识地图”的专家。当你提问时,他不仅找到相关知识点,还能根据地图理清来龙去脉和整体脉络。

结语

本文简要介绍了一些常用的RAG系统调优技巧,在后面的文章中,会针对混合检索重排序GraphRAG进行专篇讲解,并附上相关实践代码,请持续关注!

AI时代,未来的就业机会在哪里?

答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具,到自然语言处理、计算机视觉、多模态等核心领域,技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。

掌握大模型技能,就是把握高薪未来。

那么,普通人如何抓住大模型风口?

AI技术的普及对个人能力提出了新的要求,在AI时代,持续学习和适应新技术变得尤为重要。无论是企业还是个人,都需要不断更新知识体系,提升与AI协作的能力,以适应不断变化的工作环境。

因此,这里给大家整理了一份《2026最新大模型全套学习资源》,包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等,带你从零基础入门到精通,快速掌握大模型技术!

由于篇幅有限,有需要的小伙伴可以扫码获取!

1. 成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图,方向不对,努力白费。这里,我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。

2. 大模型经典PDF书籍

书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础(书籍含电子版PDF)

3. 大模型视频教程

对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识

4. 大模型项目实战

学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。

5. 大模型行业报告

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

6. 大模型面试题

面试不仅是技术的较量,更需要充分的准备。

在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

为什么大家都在学AI大模型?

随着AI技术的发展,企业对人才的需求从“单一技术”转向 “AI+行业”双背景。企业对人才的需求从“单一技术”转向 “AI+行业”双背景。金融+AI、制造+AI、医疗+AI等跨界岗位薪资涨幅达30%-50%。

同时很多人面临优化裁员,近期科技巨头英特尔裁员2万人,传统岗位不断缩减,因此转行AI势在必行!

这些资料有用吗?

这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理,现任上海殷泊信息科技CEO,其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证,服务航天科工、国家电网等1000+企业,以第一作者在IEEE Transactions发表论文50+篇,获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


大模型全套学习资料已整理打包,有需要的小伙伴可以微信扫描下方CSDN官方认证二维码,免费领取【保证100%免费】

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 16:17:01

LVS知识点详解

一、LVS简介: LVS:Linux Virtual Server,负载调度器,内核集成,章文嵩,阿里的四层SLB(Server LoadBalance)是基于LVSkeepalived实现。 LVS 官网: http://www.linuxvirtualserver.org/ LVS 相关术语 VS: V…

作者头像 李华
网站建设 2026/4/16 10:39:29

git给代码打tag

“每次 git push 成功把代码更新上去(推送到远程仓库)以后,都顺手给这次提交打一个 git tag(标签)吧” 简单说就是建议养成一个习惯: 只要你完成了一次有意义的代码推送(比如完成了一个功能、修…

作者头像 李华
网站建设 2026/4/16 10:44:22

与时俱进!多模态数据融合的新套路真是赢麻了呀!

如今,多模态数据融合的研究正朝着深度交互、统一架构、开放应用和高效部署演进。这领域的研究者们也不再仅仅追求性能提升,而是更关注鲁棒性、可解释性、数据效率及生成能力。可以看到,当前多模态数据融合的许多工作都是围绕编码器-解码器、注…

作者头像 李华
网站建设 2026/4/16 10:37:41

agentscope循环对话 这个msg是在循环外面的

这个msg是在循环外面的 msg Nonewhile True:msg await agent(msg)msg await user(msg)if msg.get_text_content() "exit":break agentscope-ai/agentscope: AgentScope: Agent-Oriented Programming for Building LLM Applications input版本: fro…

作者头像 李华