上传 PDF/Word 打造私有文档问答机器人
- 一、前言
- 二、RAG 基本说明
- 三、第一步:创建知识库
- 四、第二步:上传文档
- 五、第三步:将知识库关联到 AI 应用
- 六、第四步:配置提示词(强制 AI 只看文档)
- 七、第五步:调试问答
- 八、常用优化技巧
- 九、发布使用
一、前言
在完成聊天机器人基础搭建后,本篇进入 Dify最核心、最实用的 RAG 功能。通过上传本地 PDF/Word/TXT 文档,让 AI只依据你的文件回答,不编造、不幻觉,打造专属私有知识问答机器人。
二、RAG 基本说明
RAG(检索增强生成):先从文档中检索相关内容,再交给 AI 生成回答,确保答案来源可追溯、内容准确、不胡编。
支持格式:
- Word(docx)
- TXT
- Excel
- Markdown
三、第一步:创建知识库
- 左侧菜单点击知识库
- 点击新建知识库
- 填写信息:
- 知识库名称:如「公司制度库」「产品文档库」「学习资料库」
- 选择检索模式:混合检索(语义+关键词)
- 点击创建
四、第二步:上传文档
- 进入刚创建的知识库
- 点击上传文件
- 选择本地 PDF / Word / TXT 等文件
- 等待自动解析、分段、向量化
上传完成后显示:处理完成,即可使用。
五、第三步:将知识库关联到 AI 应用
- 进入你创建的聊天助手应用
- 找到上下文设置 → 知识库
- 开启启用知识库检索
- 选择刚才创建的知识库
- 配置参数(新手默认即可):
- 最大召回条数:3~5
- 相似度阈值:0.7
- 点击保存
六、第四步:配置提示词(强制 AI 只看文档)
在系统提示词中加入以下规则,让 AI不编造、只依据文档回答:
你只能根据提供的知识库内容回答问题。 如果文档中没有答案,必须回复:未找到相关信息。 要求回答简洁、准确、不扩展、不编造。七、第五步:调试问答
在右侧调试窗口提问:
- 文档里的内容 → AI 精准回答
- 文档里没有的内容 → AI 回复:未找到相关信息
实现100% 基于文档回答,无幻觉。
八、常用优化技巧
- 回答不准确
- 调整召回数量:改为 5~10
- 提高相似度阈值:0.75~0.85
- 文档太大、解析乱码
- 拆分成小文件上传
- AI 仍然编造
- 加强提示词约束
- 关闭“网络搜索”等无关功能
九、发布使用
配置完成后点击发布,即可:
- 公开网页访问
- 嵌入官网作为智能客服
- 通过 API 对接业务系统