原文地址请点这里@TOC前言工作中使用PDF文件是很常见的事情。但是你会发现很多时候,我们需要将几个PDF合并成一个PDF文件。这个时候你经常去百度一下,然后打开一个收费的PDF合并网站开始合并。还在傻傻的花钱合并PDF文件?今天给大家分享一个一键合并PDF的办公自动化解决方案!我们仍然使用我们熟悉的Python语言,但是这次我们将调用PyPDF2模块。这个模块如何使用,这里就不赘述了,详见http://pythonhosted.org/PyPDF2/。今天,我将教您我们将要使用的内容。毕竟在办公室,你没有时间去学习与工作无关的东西。我们的任务是将1.pdf和2.pdf这两个文档合并成3.pdf。在做事之前,一定要了解自己做事的逻辑,也就是工作流程。这是我们解决重复性工作所必需的:read1.pdffile,write3.pdfreadthefileof2.pdfandwrite3.pdf,看似简单的合并操作,其实并没有那么简单合并。让Python开始导入PyPDF2模块:fromPyPDF2importPdfFileReader,PdfFileWriter这两个方法分别对应pdf文件的读写,其中PdfFileReader可以读取文件,PdfFileWriter可以写入文件。注意:读取一定要一页一页地读写,也就是说不能一下子读写整个文件,必须一页一页地读写。幸运的是,我们的示例1.PDF和2.pdf都只有一页。这里的提醒是专门为小伙伴们准备的,千万不要跳坑。fromPyPDF2importPdfFileReader,PdfFileWriterpath=r'C:\Users\xxxxxx'pdf_writer=PdfFileWriter()foriinrange(1,2):pdf_reader=PdfFileReader('E:\demo\{}.pdf'.format(i))对于范围内的页面(pdf_reader.getNumPages()):pdf_writer.addPage(pdf_reader.getPage(page))withopen('E:\demo\3.pdf','wb')asout:pdf_writer.write(out)仔细点,你会发现合并是在循环里,但是输出是在循环外的,没错,这印证了我们之前说的“读一页,写一页”。有了这句话,3.pdf就被writer的pdf_writer.write(out)方法创建并输出了。下一期的最后,给大家科普一下如何让Python帮我们分割PDF。
