news 2026/5/13 7:15:56

RAG 系列(十四):Self-RAG——让模型决定要不要检索

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG 系列(十四):Self-RAG——让模型决定要不要检索

传统 RAG 的一个隐藏问题

传统 RAG Pipeline 有一个从不质疑的假设:所有问题都需要检索

用户问"RAG 系统怎么评估"——检索。
用户问"1 + 1 等于几"——也检索。
用户问"帮我写一个求最大公约数的函数"——还是检索。

后两个问题完全不需要外部知识,强行检索不仅浪费资源,还可能把无关文档塞进上下文,干扰 LLM 的判断。

2023 年 Asai 等人提出的Self-RAG,用一套"反思机制"解决了这个问题:模型在生成过程中会输出特殊的反思 token,自主决定何时检索、检索到的内容是否相关、最终答案是否有据可查。


Self-RAG 的四个反思 token

原始论文里,Self-RAG 训练了一个能输出四种特殊 token 的模型:

Token含义可能的值
[Retrieve]是否需要检索?yes/no/continue
[IsRel]检索到的文档与问题相关吗?relevant/irrelevant
[IsSup]生成的内容有文档支撑吗?fully supported/partially supported/no support
[IsUse]这个回答对用户有用吗?1~5

这四个 token 贯穿整个生成过程,让模型在不同阶段做出自适应决策,而不是盲目地"总是检索,总是使用"。

工程实现上,不需要专门训练带这些特殊 token 的模型——用普通 LLM + Prompt 模拟这四个判断节点,已经能取得不错的效果。


用 LangGraph 实现 Self-RAG

整体流程

用户问题 ↓ [decide] 需要检索吗? ├─ yes → [retrieve] 向量检索 top-4 │ ↓ │ [filter] 逐篇判断相关性,过滤无关文档 │ ↓ │ [rag_generate] 基于相关文档生成答案 │ ↓ └─ no → [direct_generate] 直接生成答案 ↓ [support_check] 回答有文档支撑吗? ↓ 输出最终答案

State 设计

LangGraph 的核心是 State——在节点之间流转的状态对象:

classSelfRAGState(TypedDict):question:strneed_retrieve:str# "yes" | "no"retrieved_docs:list[Document]relevant_docs:list[Document]answer:strsupport_verdict:str# "supported" | "unsupported"token_count:intpath:list[str]# 记录执行路径

关键节点实现

节点1:检索决策(decide)

RETRIEVE_DECISION_PROMPT=ChatPromptTemplate.from_messages([("system","你是一个 RAG 系统的路由决策器。判断以下问题是否需要检索外部知识库。\n\n""需要检索:涉及具体技术细节、参数、推荐选型等事实性内容\n""不需要检索:简单常识、数学计算、逻辑推理、闲聊问候\n\n""只输出 yes 或 no,不要解释。"),("human","问题:{question}"),
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/13 7:12:10

2026实测:抖音视频下载和保存视频的原因和解决方法全在这里

在当今数字化时代,抖音已经成为了人们分享生活、获取娱乐的重要平台。很多时候,我们看到一些精彩的视频,就希望能够将其下载下来,留作纪念或者用于二次创作。然而,抖音本身的下载功能有一定限制,很多视频无…

作者头像 李华
网站建设 2026/5/13 7:09:45

Windows右键菜单终极管理方案:ContextMenuManager专业优化指南

Windows右键菜单终极管理方案:ContextMenuManager专业优化指南 【免费下载链接】ContextMenuManager 🖱️ 纯粹的Windows右键菜单管理程序 项目地址: https://gitcode.com/gh_mirrors/co/ContextMenuManager 还在为Windows右键菜单的臃肿不堪而烦…

作者头像 李华
网站建设 2026/5/13 7:02:05

Deep Lake:统一多模态AI数据存储与向量检索的实践指南

1. 项目概述:Deep Lake,一个为AI而生的数据湖 如果你正在构建一个需要处理图像、文本、音频、PDF,甚至医学影像DICOM文件的大模型应用,或者你在训练一个需要高效加载海量数据的深度学习模型,那么你很可能正被数据管理…

作者头像 李华
网站建设 2026/5/13 7:01:09

外呼系统开启千亿增长新赛道

在企业数字化转型与降本增效的双重刚需下,外呼系统已从电销辅助工具,升级为企业客户触达、服务运营与增长获客的核心基础设施。2026 年,行业在合规强监管与大模型技术革命的双重驱动下,告别野蛮生长,迈入 “合规化、智…

作者头像 李华