news 2026/4/16 10:16:26

纯 Node.js 的 PDF 转 Markdown 方案:支持图片解析的pdf2md库 `node-pdf-to-markdown`

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
纯 Node.js 的 PDF 转 Markdown 方案:支持图片解析的pdf2md库 `node-pdf-to-markdown`

🚀 纯 Node.js 的 PDF 转 Markdown 方案:支持图片解析的pdf2md库node-pdf-to-markdown

在 Node.js 生态里,“PDF → Markdown” 一直是个被低估但非常刚需的问题

你可能遇到过这些场景:

  • 服务端需要把用户上传的 PDF 转成可编辑的 Markdown
  • 知识库 / 文档系统想统一用 Markdown 存储
  • 自动化流水线里需要解析论文、技术文档、说明书
  • 不想引入 Python、OCR、Headless Chrome 这些“重量级依赖”

于是我做了一个库:
👉node-pdf-to-markdown——纯 Node.js 环境下的 PDF 解析与 Markdown 转换库,并且原生支持图片解析


🔍 这个库解决了什么问题?

一句话总结:

在不依赖 Python、不依赖浏览器、不走 OCR 的前提下,把 PDF 结构化地转换成 Markdown,并且把图片一起处理好。

市面上很多 PDF 转换方案,往往存在几个问题:

  • ❌ 依赖 Python(部署成本高、跨环境麻烦)
  • ❌ 依赖浏览器 / Electron(资源占用大)
  • ❌ 只导出纯文本,结构和图片全丢
  • ❌ 输出不可控,难以二次处理

node-pdf-to-markdown的目标非常明确
做一个“工程可用”的 Node 端 PDF 解析工具,而不是 demo 级脚本。


⚙️ 核心设计理念

✅ 1. 纯 Node.js 运行环境

这是这个库最重要的一个设计点。

  • 不依赖 Python
  • 不需要 Java
  • 不需要 Chromium / Puppeteer
  • 可以直接运行在:
    • Node 服务端
    • CLI 工具
    • CI / GitHub Actions
    • Electron 主进程

npm install 即可用,非常适合现代 Node 工程体系。


🧠 2. 面向 Markdown 的结构化解析

这个库并不是简单地把 PDF 文本“dump”出来,而是尽可能还原文档结构

  • 标题(不同层级)
  • 段落与换行
  • 列表结构
  • 行内文本格式

最终输出的是**“可继续编辑、可被二次处理的 Markdown”**,而不是一次性产物。


🖼️ 图片解析:这是很多库做不到的地方

图片支持是node-pdf-to-markdown的一个核心亮点。

目前支持4 种图片处理模式,覆盖了几乎所有工程场景。

🔹 1️⃣ none(默认)

不解析图片,适合只关心文本的场景。


🔹 2️⃣ base64

直接把图片转成 Base64,内嵌进 Markdown:

![image](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgA...)

适合场景:

  • 单文件分发
  • 在线预览
  • 不方便管理图片文件的系统

🔹 3️⃣ relative

生成相对路径的 Markdown 引用,同时把图片数据返回给你:

![image](./images/page1_img1.png)

图片保存逻辑由你自己控制,非常适合高度定制化系统


🔹 4️⃣ save(推荐)

自动保存图片到指定目录,并在 Markdown 中生成引用路径:

![page1_image1](./output/images/page1_image1.png)

这是最接近真实文档迁移场景的一种模式,非常适合:

  • 知识库
  • 博客系统
  • 本地文档管理工具

🧩 使用示例(Node / 服务端友好)

importfsfrom'fs'importpdf2mdfrom'node-pdf-to-markdown'constpdfBuffer=fs.readFileSync('example.pdf')constmdPages=awaitpdf2md(pdfBuffer,{imageMode:'save',imageOutputDir:'./images'})constmarkdown=mdPages.join('\n')fs.writeFileSync('output.md',markdown)

整个流程非常干净

  1. 读取 PDF
  2. 解析
  3. 拿到 Markdown
  4. 图片自动处理

没有多余的环境成本。


🧪 为什么说它适合“工程级使用”?

从设计上,这个库非常适合被集成到更大的系统里:

  • 📦 返回结构清晰的数据,而不是只写文件
  • 📄 Markdown 按页/段输出,方便你二次处理
  • 🧱 图片处理逻辑可控,不强绑定文件系统
  • 🔧 易于封装成 API、CLI 或 SDK

这也是我在做MetaDoc / 智能文档系统时,决定自己写一个 PDF → Markdown 解析库的原因。


📌 适用场景总结

如果你正在做下面这些事情,这个库会非常合适:

  • 文档 / 论文 PDF 转 Markdown
  • 构建文档导入功能
  • 知识库、笔记系统
  • AI / RAG 系统的文档预处理
  • Node 服务端批量文档解析

🔗 项目地址

  • GitHub
    👉 https://github.com/JaredYe04/node-pdf-to-markdown
  • npm
    👉 https://www.npmjs.com/package/node-pdf-to-markdown

欢迎 Star / Issue / PR,一起把Node 生态下的 PDF 解析工具做得更工程化 💡

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 7:29:02

WKS-动态加载.NET COM DLL,CorBindToRuntimeExObject

你问到 CorBindToRuntimeExObject 中传入的 "wks" 到底是什么,这是 .NET 运行时宿主的构建模式标识,我会用通俗易懂的方式解释它的含义、作用,以及为什么要传这个值。一、"wks" 的核心含义"wks" 是 Workstatio…

作者头像 李华
网站建设 2026/4/16 7:28:00

VS2026SP1运行库x86是啥?为啥必须装?一篇文章讲透

对于许多Windows用户和开发者来说,vs2026sp1运行库 x86是运行特定软件不可或缺的组件。它本质上是Visual Studio 2026 SP1开发环境所生成的程序在32位(x86)Windows系统上运行时所需的一系列动态链接库(DLL)和支持文件的…

作者头像 李华
网站建设 2026/4/16 7:24:12

约瑟夫环问题详解:循环链表和数学解法全攻略

约瑟夫环问题是一个经典的算法问题,描述了N个人围成一圈,从第一个人开始报数,报到M的人出列,然后从下一个人重新开始报数,直到所有人都出列。这个问题在计算机科学中常用于学习循环链表和递归思想,理解其原…

作者头像 李华
网站建设 2026/4/16 7:46:47

氘可来昔替尼Deucravacitinib治疗银屑病的皮损清除时间与持续治疗剂量

银屑病作为一种慢性、复发性、炎症性皮肤病,严重影响患者的生活质量。氘可来昔替尼(Deucravacitinib)作为全球首个获批的每日一次口服TYK2抑制剂,在银屑病治疗领域展现出显著疗效。皮损清除时间:快速起效,持…

作者头像 李华
网站建设 2026/4/16 9:09:43

基于PLC的传送带控制系统设计(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

基于PLC的传送带的控制系统设计 摘 要 介绍了PLC在四节传送带控制系统中的应用,同时也详细地叙述了系统中相关控制项目的设计方案及具体实现方法。文中还介绍了基于PLC与单片机的区别使我们能更加的清楚认识PLC,对学生熟悉PLC控制系统的结构和工作原理以…

作者头像 李华