很多人在优化 RAG 时,会优先考虑:
- 换更强的模型
- 调 Prompt
- 加更多数据
但在真实系统中,一个更本质的事实是:
RAG 的效果,本质上由“检索系统”决定。
一、一个被忽略的现实
我们先看一条最真实的链路:
如果信息没有被检索出来 → 模型永远不可能回答正确换句话说:
模型的上限 = 检索的上限
二、三种主流检索方式
目前主流 RAG 系统,基本都在这三种之间做选择。
1. 向量检索(Vector Search)
原理:
Query → Embedding → 向量相似度搜索(Top-K)优点:
- 能处理语义相似(模糊表达)
- 对自然语言友好
缺点:
- 精确匹配能力差
- 对数字 / ID / 关键词不敏感
- 长尾问题不稳定
典型问题
Query: “2024年Q3报销政策”结果可能:
- 命中“报销流程说明”
- 但忽略“2024 Q3”
问题本质:
向量检索擅长“语义”,但不擅长“精确条件”。
2. 关键词检索(Keyword / BM25)
典型实现:
- Elasticsearch
- BM25 算法
优点
- 精确匹配强(时间 / 数字 / 专有词)
- 可控性高(过滤 / 权重 / 字段控制)
缺点
- 无法真正理解语义
- Query 必须写得“准”
- 对自然语言表达不友好
典型问题:
Query: “费用报销流程” 如果文档写的是“报销审批流程” → 可能完全匹配不到3. 混合检索(Hybrid Retrieval)
真实系统的主流方案
核心思路
向量检索(找语义) + 关键词检索(找精确) + 融合排序三、一个标准架构(可直接用于方案)
下面是一个典型的 Hybrid Retrieval 架构:
关键点:
不是“选一个”,而是“组合使用”。
四、为什么 Hybrid 是必选项?
因为两种能力是互补的:
向量检索解决:
- “用户不会说标准词”的问题
关键词检索解决:
- “必须精确命中”的问题
举个真实场景:
Query: “2024年差旅报销标准”- 向量:找到“报销流程”
- 关键词:命中“2024年”
单用任何一个都不够
五、一个必须理解的核心指标
在检索系统里,有两个核心指标。
Recall(召回率)
能不能“找到”正确答案
Precision(精准率)
找到的结果“是不是对的”
一个核心 Tradeoff
提高 Recall → 噪声变多 提高 Precision → 容易漏掉答案检索系统的本质:
在 Recall 和 Precision 之间找平衡
六、参数怎么调?(工程实战)
这一部分,是很多系统真正拉开差距的地方。
1. Top-K(向量检索)
建议:10 ~ 30太小
- 漏掉答案
太大
- 噪声太多
2. BM25 权重(ES)
可调:
- 标题权重 > 正文
- 精确匹配加权
- 字段 Boost
3. 融合策略(关键)
常见方式:
1.分数融合
score = α * vector_score + β * bm25_score2.排名融合(推荐)
- Reciprocal Rank Fusion(RRF)
优点:
- 不依赖分数归一化
- 更稳定
七、一个进阶优化:Query 分析
不同 Query,用不同策略
示例
1. 精确查询(含时间 / ID) → 偏向 BM25 2. 模糊查询(自然语言) → 偏向向量 3. 长问题 → 拆分 + 多路检索如果这一层做得好:
系统稳定性会明显提升
八、再往上:多路召回(高级)
一个 Query → 多个 Retriever
Query ↓ 多种策略: - 向量 - BM25 - 规则 ↓ 合并 ↓ Rerank作用
- 提升 Recall
- 对抗单一策略失效
- 提高长尾问题稳定性
九、工程落地
1. 标准方案(轻量级)
Vector DB(Qdrant / Milvus / pgvector) + Elasticsearch+Rerank 模型2. 进阶方案(平台级)
多 Retriever + Query Rewrite + Rerank + Feedback Learning(用户点击反馈)十、重要认知
RAG 的核心不是“生成”,而是“找到什么信息被生成”。
收尾
如果你发现:
- 模型经常“答非所问”
- 或者“看起来很聪明,但总差一点”
那么问题很可能不是模型,而是:
你让它“看到了错误的信息”。
学AI大模型的正确顺序,千万不要搞错了
🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!
有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!
就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋
📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇
学习路线:
✅大模型基础认知—大模型核心原理、发展历程、主流模型(GPT、文心一言等)特点解析
✅核心技术模块—RAG检索增强生成、Prompt工程实战、Agent智能体开发逻辑
✅开发基础能力—Python进阶、API接口调用、大模型开发框架(LangChain等)实操
✅应用场景开发—智能问答系统、企业知识库、AIGC内容生成工具、行业定制化大模型应用
✅项目落地流程—需求拆解、技术选型、模型调优、测试上线、运维迭代
✅面试求职冲刺—岗位JD解析、简历AI项目包装、高频面试题汇总、模拟面经
以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!
我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~