news 2026/4/16 17:08:16

大模型RAG实战:关键词召回+语义召回,如何平衡速度与准确率两难问题?

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型RAG实战:关键词召回+语义召回,如何平衡速度与准确率两难问题?

文章探讨RAG系统中的召回策略,指出面临效率与准确率两大挑战。提出混合检索解决方案:先用关键词检索快速过滤数据解决效率问题,再通过语义检索提升准确性解决准确率问题。这种策略在文本数据场景下能实现速度与准确率的平衡,而多模态数据则需要特殊处理方法。


关键词召回和语义召回分别解决了两个问题,前者解决了速度问题,后者解决了准确率问题。

在RAG中检索召回一直是一个难题,一是效率问题,二是准确率问题;特别是在大批量数据中,怎么快速且准确地召回数据,一直是一个值得讨论的课题;因此,我们今天就讨论一下,关键词召回和语义检索召回。

召回策略的研究

从RAG的技术流程来说,召回属于一个单独的步骤,对模型来说只需要拿到召回的数据即可,模型本身不关心数据的来源以及数据怎么来,所以针对召回问题,可以使用现有的所有检索方案,包括但不仅限于SQL,语义检索,关键词检索等,其实本质来说召回就是在做一个搜索引擎。

在大模型爆火之前,检索方式大都是基于字符匹配和关键词检索的方式,最典型的就是SQL查询和ES分词检索,这也是普通开发者接触最多的东西。

那这些技术和RAG有什么关系呢?

前面说了,RAG的检索召回是一个独立的环节,任何有助于检索召回的技术都可以应用于这一阶段。但是,我们知道RAG大部分是应用于自然语言对话场景,因此很多没接触过或者对RAG没有深入研究的人,都会认为RAG只能用语义召回。

从理论上来说,语义召回更符合RAG的规范,但其中有一个很严重的问题是,语义召回由于要进行大量的向量运算,因此对算力的要求比较高,其次速度比较慢;在面对大数据量大场景时,只使用语义召回明显不是一个好的选择。

所以,为了解决这个问题,我们就需要使用多种召回策略,在速度和准确度之间达到一个平衡。

首先,目前来看最快的召回方式应该是使用SQL等字符匹配的方式,而且其不但速度快,而且准确率最高。但在RAG场景中,SQL查询能解决部分问题,但在某些场景中无法满足,如对文档内容进行检索。

所以,我们就要考虑另外两种方式,关键词检索和语义检索。

在大数据量RAG场景中,为了提升召回速度,我们可以混合检索的方式;首先,使用关键词检索,如jieba分词,通过关键词的方式在大量数据中进行快速过滤,关键词检索的优点有二,其一是速度快,由于不需要进行向量运算,其查询速度要比语义检索快得多;其二就是成本低,基于关键词检索的方式,不需要算力的支持,其本质上还是基于字符匹配的方式进行检索。当然,有些人为了提升关键词检索的准确率,也会使用相似度算法,来对召回的数据进行语义计算,从而提升准确度。

其次,在关键字检索的基础之上,我们再使用语义检索的方式,也就是相似度计算来提升召回数据的准确性;也就是说关键词检索解决了效率问题,语义检索解决了准确度问题。

通过混合这两种召回方式,就能在效率和准确率之间达到一个平衡;当然关键词召回的方式只适用于文本数据,如果涉及到多模态数据,除非使用的是内容提取为文本,然后通过文本进行召回的方式,否则就只能用多模态融合技术,也就是多模态embedding,解决多模态数据召回问题。

AI大模型从0到精通全套学习大礼包

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

只要你是真心想学AI大模型,我这份资料就可以无偿共享给你学习。大模型行业确实也需要更多的有志之士加入进来,我也真心希望帮助大家学好这门技术,如果日后有什么学习上的问题,欢迎找我交流,有技术上面的问题,我是很愿意去帮助大家的!

如果你也想通过学大模型技术去帮助就业和转行,可以扫描下方链接👇👇
大模型重磅福利:入门进阶全套104G学习资源包免费分享!

01.从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

02.AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线


03.学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的


04.大模型面试题目详解

05.这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!


如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 11:14:08

一文搞定多级标题自动编号

在撰写长文档或技术报告时,多级标题的自动编号往往让人头疼。尤其是当需求超过 4 级,涉及到 1.1.1.1、(1)、1) 甚至 ① 的混合排版时,手动输入不仅效率低,还极易出错。 本文将带你彻底搞定 Word 和 WPS 中的多级列表排版&#xf…

作者头像 李华
网站建设 2026/4/16 14:21:36

拒绝 CRUD 搬砖:我如何用脚本 + 模板把重复工作降到 10%

一、真实痛点引入:我们是工程师,还是“高级打字员”? 回想一下你最近接的一个需求:“给后台增加一个商品分类管理功能”。 逻辑极其简单:增删改查(CRUD)。但你需要做哪些动作? 设…

作者头像 李华
网站建设 2026/4/16 16:24:10

2026毕设ssm+vue旅行网的设计与实现论文+程序

本系统(程序源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。 系统程序文件列表 开题报告内容 一、选题背景 关于旅游信息化管理问题的研究,现有研究主要以传统OTA平台(在线旅游代理)的整体架构…

作者头像 李华
网站建设 2026/4/16 12:28:56

气动式定尺飞锯机设计

2气动式定尺飞锯机整体设计 2.1功能分析 气动式定尺飞行锯机应用的领域广泛,例如锯切焊接管,钢筋,轻铝管和大多合金管。显着的特征是由于其高的切割力和可切割管道的大直径范围,以及由于空气床装置保证了气动技术的高压力性&#…

作者头像 李华
网站建设 2026/4/16 16:24:04

A型半自动平面贴标机结构设计

2平面纸盒贴标机 2.1平面纸盒贴标机用途功能介绍及研究意义 本次设计的平面贴标机主要应用于纸盒的平面贴标。例如烟盒,日用品包装盒,食品包装盒等。能够应用于各种产品的不同生产流水线对其进行商标标签粘贴是其主要的工作用途。相对于人工贴标来说&…

作者头像 李华
网站建设 2026/4/16 13:00:43

2026毕设ssm+vue论文投稿系统论文+程序

本系统(程序源码)带文档lw万字以上 文末可获取一份本项目的java源码和数据库参考。 系统程序文件列表 开题报告内容 一、选题背景 关于文档管理系统与在线协作平台的研究,现有研究主要以通用型办公自动化系统和企业级内容管理系统为主&…

作者头像 李华