news 2026/4/27 1:38:19

DocsGPT 二次开发:打造面向国内用户的私有 AI 知识库平台

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
DocsGPT 二次开发:打造面向国内用户的私有 AI 知识库平台

基于 GitHub 17.8K Star 的开源 RAG 项目,我们做了什么,为什么做,接下来要做什么

前言

大家好,我是张大鹏。

最近在研究 RAG(检索增强生成)相关的开源项目,想找到一个适合做二次开发的底座,用来搭建面向国内用户的私有 AI 知识库平台。

看了一圈下来,最终选定了 DocsGPT。这是一个 GitHub 上 17.8K Star 的开源项目,功能非常全面,架构也很清晰。但原版是面向海外用户的,全英文界面,文档也是英文的,直接拿来用不太合适。

所以我们做了一轮二次开发:中文化、清理、重构。这篇文章就是来聊聊这个过程,以及我们后续的计划。

DocsGPT 是什么

DocsGPT 是一个开源的 AI 知识库平台,核心能力是RAG + Agent

简单来说,你可以把各种文档(PDF、Word、Excel、网页、音频等)丢给它,它会自动解析、向量化,然后你就可以用自然语言去提问,它会基于你的文档内容给出准确的回答,并且附带来源引用。

核心功能

  • 广泛的格式支持:PDF、DOCX、CSV、XLSX、EPUB、MD、HTML、JSON、PPTX、图片、音频(MP3、WAV、M4A 等)
  • 语音工作流:支持语音输入、音频转录、会议录音导入
  • 多模型支持:兼容 OpenAI、Google、Anthropic 等云端模型,也支持 Ollama、vLLM、llama.cpp 等本地推理引擎
  • Agent 系统:支持 Classic、Agentic、Research、Workflow 四种 Agent 类型
  • 工具链:内置 API Tool、Brave Search、Postgres、Telegram 等工具,支持自定义开发
  • 丰富的集成:React/HTML 聊天组件、搜索组件、Discord/Telegram 机器人、Chatwoot 扩展
  • 灵活部署:Docker Compose 一键部署,支持 Kubernetes 生产级部署

技术架构

┌─────────────┐ ┌─────────────┐ ┌─────────────┐ │ Frontend │────▶│ Backend API │────▶│ LLM Layer │ │ React/Vite │ │ Flask │ │ 多模型适配 │ └─────────────┘ └──────┬──────┘ └─────────────┘ │ ┌────────────┼────────────┐ │ │ │ ┌─────▼─────┐ ┌───▼───┐ ┌─────▼─────┐ │ VectorStore│ │Postgres│ │ Redis │ │ 向量存储 │ │ 用户数据│ │ 缓存/队列 │ └───────────┘ └───────┘ └───────────┘ │ ┌──────▼──────┐ │ Celery │ │ 异步任务队列 │ └─────────────┘

后端是 Flask,前端是 React + Vite,异步任务用 Celery + Redis,数据存储用 PostgreSQL,向量存储支持 FAISS、Elasticsearch、Qdrant、Milvus 等多种后端。

和同类项目对比

项目Star语言Agent多模型本地部署工具链
DocsGPT17.8KPython
Dify60K+Python
FastGPT20K+TypeScript
MaxKB15K+Python

Dify 功能最全但比较重,FastGPT 前端好看但 Agent 能力弱,MaxKB 轻量但扩展性差。DocsGPT 在功能全面性和架构清晰度之间找到了一个不错的平衡点。

为什么选择 DocsGPT 做二次开发

选 DocsGPT 有几个原因:

1. 架构清晰,模块化设计

DocsGPT 的代码组织得很好。后端的 LLM、向量存储、解析器、Agent、工具都是抽象的,有统一的接口。想加新的模型提供商、新的向量后端、新的工具,都很方便。

# LLM 提供商统一接口示例application/llm/├── base.py# 基类├── openai.py# OpenAI├── google.py# Google├── anthropic.py# Anthropic└── ollama.py# Ollama# 向量存储统一接口application/vectorstore/├── base.py ├── faiss.py ├── elasticsearch.py ├── qdrant.py └── milvus.py

2. 多模型支持

不像有些项目只支持 OpenAI,DocsGPT 原生支持 10+ 种云端和本地模型。这对国内用户很重要,因为很多人想用 DeepSeek、通义千问、文心一言等国产模型。

3. Agent 和工具链能力强

DocsGPT 的 Agent 系统不只是简单的对话,支持 Workflow 编排、Webhook 触发、异步任务,还有完整的工具开发框架。这意味着你可以让它不只是"回答问题",还能"执行操作"。

4. 原版的问题

当然,原版也有一些不适合直接用的地方:

  • 全英文界面和文档:国内用户用起来有门槛
  • 社区运营文件多:CODE_OF_CONDUCT、CONTRIBUTING、HACKTOBERFEST 等,对我们没用
  • 默认模型是海外的:需要适配国内模型
  • 缺少中文社区支持:遇到问题只能看英文文档

所以,二次开发是必要的。

我们做了什么

1. 清理开源社区文件

删除了 24 个对私有项目无用的文件:

  • 根目录:CODE_OF_CONDUCT.md、CONTRIBUTING.md、HACKTOBERFEST.md、SECURITY.md、codecov.yml、.vale.ini、md-gen.py
  • .github/:FUNDING.yml、ISSUE_TEMPLATE/、PULL_REQUEST_TEMPLATE.md、THREAT_MODEL.md、holopin.yml、labeler.yml、dependabot.yml、styles/
  • workflows/:labeler.yml、npm-publish.yml、react-widget-build.yml、sync_fork.yaml、vale.yml、holopin.yml、zizmor.yml

保留了核心 CI/CD(pytest、lint、Docker 构建)和 MIT LICENSE。

2. 全面中文翻译

翻译了 42 个文档文件,约 5,150 行内容:

  • README.md
  • docs/content/ 下所有页面(首页、快速开始、部署、Agent、工具、模型、扩展、指南)
  • 所有 _meta.js 导航标题
  • docs/public/llms.txt 文档导航地图

翻译规则:

  • 技术术语(API、Docker、Kubernetes 等)保留英文
  • 代码块、命令、URL 不翻译
  • Mermaid 图表标签翻译为中文

3. Nextra i18n 双语支持

配置了 Nextra i18n,默认中文,可切换英文:

// docs/next.config.jsi18n:{locales:['zh','en'],defaultLocale:'zh',}
// docs/theme.config.jsxi18n:[{locale:'zh',text:'中文'},{locale:'en',text:'English'},]

用户访问/docs默认中文,/docs/en切换英文。

4. README 重构

  • 移除所有广告链接(Discord、Twitter、博客、赞助商)
  • Badge 改为指向自己的仓库
  • 新增"关于本项目"章节,标注大鹏AI教育和张大鹏

5. 建立研究目录

research/ ├── CSDN/ # CSDN 博客文章 │ └── 001-xxx.md ├── 公众号/ # 微信公众号文章 │ └── 001-xxx.md └── superpowers/ # 设计文档和实施计划 ├── specs/ └── plans/

后续计划

短期(1-2 周)

  • 前端界面中文化:把 React 前端的硬编码英文全部翻译
  • 国内模型适配:接入 DeepSeek、通义千问、文心一言
  • 部署教程:写一套面向国内用户的 Docker 部署教程

中期(1-2 月)

  • Agent 实战系列:用 DocsGPT 搭建各种实用 Agent
  • 工具开发系列:自定义工具开发教程
  • 公众号运营:同步发布技术文章

长期

  • 中文社区建设:建立中文交流群
  • 国产化适配:适配更多国内模型和服务
  • 企业级功能:权限管理、审计日志、多租户等

总结

DocsGPT 是一个非常优秀的开源 RAG + Agent 平台,架构清晰、功能全面、扩展性强。我们选择它作为二次开发的底座,做了中文化、清理、重构等工作,让它更适合国内用户使用。

后续会持续更新,分享更多关于 RAG、Agent、工具开发的实战经验。

如果你也对 AI 知识库平台感兴趣,欢迎关注交流。


项目地址:https://github.com/DaPengRuYi/DocsGPT

作者:张大鹏 | 大鹏AI教育

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/27 1:36:20

AI智能体文件感知规划:让AI在行动前先读懂你的文件

1. 项目概述:当AI规划器学会“读文件”最近在折腾AI智能体(Agent)和自动化工作流,我发现一个挺有意思的痛点:很多规划任务,比如写周报、整理会议纪要、分析数据,其实都离不开对现有文件的处理。…

作者头像 李华
网站建设 2026/4/27 1:33:43

汽修门店 POS 机断网?映翰通 IR615 工业路由器搞定稳定联网

一、门店痛点:收银断网,生意白跑汽车维修门店的 POS 机,是日常运营的核心。有线宽带不稳、信号差,付款高峰期频繁断网,订单卡单、失败普通家用路由器扛不住门店复杂环境,用不久就宕机交易数据传输没保障&am…

作者头像 李华
网站建设 2026/4/27 1:33:43

多模态大模型实战:从Mistral-ViBE架构解析到图文理解应用部署

1. 项目概述:从“氛围”到“多模态”的智能进化最近在折腾大模型应用时,发现了一个挺有意思的仓库:mistralai/mistral-vibe。乍一看名字,你可能会联想到音乐或者某种情绪,但在AI圈子里,这个名字指向的是Mis…

作者头像 李华
网站建设 2026/4/27 1:30:38

特征工程实战:提升机器学习模型性能的关键技术

1. 特征工程与选择:数据科学家的必备技能手册在机器学习项目中,数据准备环节往往占据整个流程70%以上的时间。Max Kuhn和Kjell Johnson合著的《Feature Engineering and Selection: A Practical Approach for Predictive Models》正是针对这一关键阶段的…

作者头像 李华