news 2026/6/10 14:30:33

Python之PDF小工具

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python之PDF小工具

Python之PDF小工具

【穷鬼套餐(买不起WPS会员)】这是一个多功能工具,既可以将EPUB电子书转换为PDF格式,也可以对现有的PDF文件进行拆分。

1-epub_to_pdf

#!/usr/bin/env python3""" epub_to_pdf.py ebooklib>=0.20、weasyprint>=66.0 实测通过 """importosimportsysimportebooklibfromebooklibimportepubfromweasyprintimportHTMLfromweasyprint.text.fontsimportFontConfigurationdefconvert_epub_to_pdf(src_epub:str,dst_pdf:str|None=None)->str|None:"""把单个 epub 转 pdf,返回输出文件路径;失败返回 None"""try:book=epub.read_epub(src_epub)html_parts=[]foriteminbook.get_items():ifitem.get_type()==ebooklib.ITEM_DOCUMENT:html_parts.append(item.get_content().decode('utf-8',errors='ignore'))ifnothtml_parts:raiseValueError('文档不包含可解析章节')# 拼成完整 HTMLfull_html=f""" <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <style> body {{ font-family: "PingFang SC", "Helvetica Neue", "Arial", sans-serif; line-height: 1.6; }} </style> </head> <body>{''.join(html_parts)}</body> </html> """ifdst_pdfisNone:out_dir=os.path.join('.','pdf')os.makedirs(out_dir,exist_ok=True)title=os.path.splitext(os.path.basename(src_epub))[0]dst_pdf=os.path.join(out_dir,f"{title}.pdf")HTML(string=full_html).write_pdf(dst_pdf,font_config=FontConfiguration())print(f"✅ 成功:{dst_pdf}")returndst_pdfexceptExceptionase:print(f"❌ 失败:{src_epub}\n原因:{e}")returnNonedefmain(target):ifos.path.isfile(target)andtarget.lower().endswith('.epub'):convert_epub_to_pdf(target)elifos.path.isdir(target):epub_files=[fforfinos.listdir(target)iff.lower().endswith('.epub')]ifnotepub_files:print('📂 该目录下没有 epub 文件')returnforfinepub_files:convert_epub_to_pdf(os.path.join(target,f))# ----------------------------# 脚本入口# ----------------------------if__name__=='__main__':# if len(sys.argv) != 2:# print('用法:python epub_to_pdf.py <epub文件或文件夹路径>')# sys.exit(1)## target = sys.argv[1]main("/Users/rong/Documents/09-深度学习/epub_book")

2-epub_to_pdf

#!/usr/bin/env python3""" epub_to_pdf.py ebooklib>=0.20、weasyprint>=66.0 实测通过 """importsysimportos# 添加PyPDF2库用于PDF操作try:importPyPDF2 PDF_LIBRARY_AVAILABLE=TrueexceptImportError:PyPDF2=NonePDF_LIBRARY_AVAILABLE=Falsedefsplit_pdf(input_pdf_path:str,output_pdf_path:str,pdf_file_name:str,start_page:int,end_page:int)->bool:"""按指定页码范围拆分PDF文件"""ifnotPDF_LIBRARY_AVAILABLE:print("❌ 错误:缺少PyPDF2库,请安装PyPDF2")returnFalsetry:withopen(input_pdf_path+pdf_file_name,'rb')asinfile:reader=PyPDF2.PdfReader(infile)writer=PyPDF2.PdfWriter()# 检查页码范围是否有效total_pages=len(reader.pages)ifstart_page<1orend_page>total_pagesorstart_page>end_page:print(f"❌ 错误:页码范围无效。总页数:{total_pages},请求范围:{start_page}-{end_page}")returnFalse# 提取指定页面foriinrange(start_page-1,end_page):# 页码从0开始索引writer.add_page(reader.pages[i])# 确保输出目录存在os.makedirs(output_pdf_path,exist_ok=True)# 写入新文件output_file_name=output_pdf_path+str(start_page)+"_"+str(end_page)+"_"+pdf_file_namewithopen(output_file_name,'wb')asoutfile:writer.write(outfile)print(f"✅ 成功拆分PDF:{input_pdf_path}的第{start_page}-{end_page}页已保存到{output_file_name}")returnTrueexceptExceptionase:print(f"❌ 拆分PDF失败:{e}")returnFalsedefmain(pdf_file):split_pdf(pdf_file,"output.pdf",1,10)# ----------------------------# 脚本入口# ----------------------------if__name__=='__main__':input_pdf_path="./pdf/"output_pdf_path="./pdf_split/"input_pdf_name="曾国藩传_张宏杰.pdf"success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,1,115)success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,115,206)success=split_pdf(input_pdf_path,output_pdf_path,input_pdf_name,206,338)sys.exit(0ifsuccesselse1)

3-项目说明

功能特性

  1. EPUB转PDF转换器
  2. PDF文件按页码范围拆分

安装依赖

pipinstall-r requirements.txt

或者使用uv:

uv pipinstall-r.

使用方法

EPUB转PDF

python main.py<epub文件或文件夹路径>

示例:

# 转换单个EPUB文件python main.py books/example.epub# 转换目录下的所有EPUB文件python main.py books/

拆分PDF文件

python main.pysplit<输入PDF文件><输出PDF文件><起始页码><结束页码>

示例:

# 拆分PDF的第5页到第10页python main.pysplitinput.pdf output.pdf510

依赖库

  • ebooklib: 处理EPUB文件
  • weasyprint: 将HTML转换为PDF
  • PyPDF2: 操作PDF文件
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 18:19:26

互联网大厂Java面试:从Spring到微服务的技术探讨

场景&#xff1a;内容社区与UGC 面试官&#xff1a;谢飞机&#xff0c;你好&#xff0c;欢迎来参加我们公司的面试。首先&#xff0c;请你简单介绍一下Spring Boot在内容社区的项目中是如何使用的&#xff1f; 谢飞机&#xff1a;哦&#xff0c;Spring Boot嘛&#xff0c;就是那…

作者头像 李华
网站建设 2026/6/10 12:05:49

分布式系统长尾延迟P95 和 P99 背后的数学与实战

背景 在分布式系统中,尤其是微服务架构和服务网格(如 Istio)中,我们经常会遇到一个问题: 平均响应时间(avg)较低,但 P95 和 P99 却显著偏高且不稳定。 这种现象并不是偶然的,而是因为一些低概率的慢事件(如 GC pause、K8s 调度抖动、网络延迟等)在高并发、fan‑out…

作者头像 李华
网站建设 2026/6/10 12:31:32

通俗解释JLink驱动安装后电脑无法识别的现象

插上J-Link却“看不见”&#xff1f;一文讲透驱动安装后电脑无法识别的根源与实战排错 你有没有遇到过这种情况&#xff1a;新项目刚开工&#xff0c;兴冲冲地把J-Link插上电脑&#xff0c;结果设备管理器里只显示一个灰乎乎的“未知设备”&#xff0c;Keil或IAR也连不上目标板…

作者头像 李华
网站建设 2026/6/10 0:28:46

超详细版ESP32开发环境搭建教程:支持语音控制联动

手把手教你搭建ESP32开发环境&#xff1a;从零开始实现语音控制智能设备 你有没有试过对着空气说一句“打开灯”&#xff0c;然后房间真的亮了&#xff1f;这听起来像科幻电影的桥段&#xff0c;其实用一块几十块钱的 ESP32 就能轻松实现。但问题来了—— 怎么搭好这个开发…

作者头像 李华
网站建设 2026/6/10 12:34:50

强力净化:Windows系统驱动管理的终极解决方案

在现代Windows系统维护中&#xff0c;驱动管理已成为提升系统性能的关键环节。随着硬件设备的频繁更新&#xff0c;驱动冗余问题日益突出&#xff0c;严重影响系统运行效率。Driver Store Explorer作为专业的系统优化工具&#xff0c;通过智能驱动管理&#xff0c;为用户提供了…

作者头像 李华