阅读四五个PDF文件对象相关插件库,如:pdfminer.six、PyPDF2、pikepdf、pdfplumber、PyMuPDF之类的一大堆,最后发现pdf2docx比较简单,几行代码就可以实现。本着用最简单的方法解决最高境界的实际问题的精神,我们用它来进行演示。首先,安装然后通过pip导入模块。pipinstallpdf2docx#安装pdf2docx#导入文件转换对象Converterfrompdf2docximportConverter分别定义了word和pdf文件的存放路径,然后将已有的pdf文件转换为python插件对象。#定义PDF文件路径pdf_file_path='Python集中营.pdf'#定义WORD文件路径docx_file_path='Python集中营.docx'#初始化PDF转换对象converter=Converter(pdf_file_path)将初始化的pdf对象转换为word文档贮存。'''convertPDFtoWORDconvert(path,start=0,end=None)path:word文档路径start:起始页码,0从第一页开始end:结束页码,Noneunlimitedpages:指定哪几页需要转换'''#要转换的连续页面10])#关闭转换对象converter.close()【以往优秀】●办公自动化:轻松提取PDF页面数据生成Excel文件(代码练习)!●sched模块是一款非常好用的轻量级定时任务神器调度器!●不用命令行打包成exe,有??人写了UI应用,可视化UI界面打包python程序的方法!●发现一个秘密:python3.6以后,字典变成了有序集,我再次验证!●大厂学校招白菜包价40W+,不过楼主好开心……●这么多内置功能你能记住吗?python的68个内置函数汇总!●必须知道的文件操作对象File,是python文件读写操作的利器!●你不知道的CS模式流程管理工具,状态监控、项目启停一目了然!●如何将python应用程序作为docker镜像运行?●python-celery是分布式异步任务处理和任务调度的插件!●Python远程服务操作工具:fabric、远程命令、本地命令、服务器操作工具!●办公自动化:Python-win32com自动将word文档转为pdf格式!●GitLFS3.0.0发布,大文件版本控制的Git扩展●pandas数据统计插件的连接函数concat()神奇使用,灵活处理数据对象!
