news 2026/4/16 14:11:33

RAG简介

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG简介
  1. 概述
    RAG(Retrieval Augmented Generation)检索增强生成技术,解决了LLM(Large Language Model)的知识局限性、in-context learning(上下文学习)的token限制、重新进行模型微调成本高以及数据安全考虑等痛点,以已有知识库作为背景知识,让AI模型从基于记忆和理解进行答案编造考试,转换成基于垂直领域知识库的开卷考试。
  2. 架构
    分为在线和离线两部分。
    • 离线
      离线部分主要是实现知识库的向量化存储和索引构建。大致包含了文档解析、拆分、入库以及构建索引等步骤。
    • 在线
      在线部分主要是实现Query的意图识别和结果生成。大致包含了Query的解析、基于相似度的查询匹配、构造prompt以及通过LLM输出结果等步骤。
  1. 为什么用向量数据库
    一方面查询场景不能简单通过文本的精确匹配来得到结果,而是通过语义匹配来得到结果。向量Embedding能充分包含语义信息;
    另一方面向量数据库在向量的存储和查询上有特有的优势。
  2. 文档解析拆分
    文档解析拆分包含了数据清洗、文本/图片/表格的识别、数据分段等过程。目前已有对应的机器学习和深度学习模型,如RagFlow。
  3. Query解析
    由于用户提问往往具有模糊性和复杂性,需要对问题进行改写、增强、分解
  4. 查询路由
    理解用户query后,在查询路由步骤,通过定义查询路由器以及各个查询数据插件,将用户查询情况传给LLM,通过LLM决策,决定接下来要调用哪个查询插件,然后调用执行路由选择的插件,最后将各个插件预定义格式返回的结果汇总
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 15:45:15

完整指南:5步构建行为面试中的领导力故事

完整指南:5步构建行为面试中的领导力故事 【免费下载链接】awesome-behavioral-interviews Tips and resources to prepare for Behavioral interviews. 项目地址: https://gitcode.com/gh_mirrors/aw/awesome-behavioral-interviews 想要在行为面试中脱颖而…

作者头像 李华
网站建设 2026/4/16 14:06:14

选择性状态空间机制:5个关键突破让序列建模效率提升10倍

选择性状态空间机制:5个关键突破让序列建模效率提升10倍 【免费下载链接】mamba 项目地址: https://gitcode.com/GitHub_Trending/ma/mamba 还在为长文本生成时GPU内存告急而焦虑?或者因Transformer在超长序列推理中的O(n)复杂度而束手无策&…

作者头像 李华
网站建设 2026/4/16 17:12:51

腾讯元宝API实战:构建智能客服聊天机器人

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 基于腾讯元宝API开发一个电商客服聊天机器人。功能包括:1. 自动回答常见问题(退货、物流等);2. 支持多轮对话;3. 情感分析…

作者头像 李华
网站建设 2026/4/16 17:27:15

如何用AI自动修复D-Bus连接错误

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个AI辅助调试工具,能够自动分析Linux系统中D-Bus连接失败的原因。工具应能检测系统权限配置、服务状态和SELinux策略,提供修复建议并生成相应的修复脚…

作者头像 李华
网站建设 2026/4/16 15:29:12

AI如何帮你快速掌握curl命令?

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个AI辅助工具,帮助用户快速生成和优化curl命令。功能包括:1. 根据用户输入的目标URL自动生成基本curl请求;2. 解析curl -h的输出&#xff…

作者头像 李华
网站建设 2026/4/16 10:50:49

AI一键搞定div居中:快马平台智能布局实战

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个HTML页面,包含一个居中的div容器,宽度为80%,高度为300px,背景色为浅蓝色。div内部包含一个标题AI生成的居中div和一段说明文…

作者头像 李华