当前位置: 首页 > 科技观察

不要问我如何用Python操作Word

时间:2023-03-12 01:30:55 科技观察

在之前的自动化系列文章中,我们已经讲解了python如何操作Excel工具openpyxl以及python操作PDF的几种方式。今天我们就来讲解一下Python通过代码操作Word文档docx的常用方法。安装docx是一个非标准库。您需要在命令行(终端)中使用pip来安装pipinstallpython-docx。你必须注意它。安装的时候是python-docx,实际调用的时候是docx!预知Word一般可以结构分为三部分:DocumentDocumentParagraphParagraphTextBlockRun是Document-Paragraph-Run三级结构,这是最常见的情况。其中,Run文本块最难理解,无法完成。如图所示,两个符号之间的短句是一个文本块。一般情况下可以这样理解,但是如果这个短句中有很多不同的文体,就会被分成多个文本块。以图中第一个黄色圆圈为例。如果给这个短句加上一些细节,这时有4个文本块,有时一个Word文档中还有表格,这时候就会生成一个新的文档结构。此时的结构和Excel很像,可以看做是Document-Table-Row/Column-Cell四级结构Word阅读1.打开WordfromdocximportDocumentpath=...wordfile=Document(path)2.获取段落一个word文件由一个或多个段落组成paragraphs=wordfile.paragraphsprint(paragraphs)3.获取一个段落的文本内容.text获取paragraphinwordfile.paragraphs:print(paragraph.text)4.获取文本块的文本内容段落段落由一个或多个运行文本块组成forparagraphinwordfile.paragraphs:forruninparagraph.runs:print(run.text)5.遍历对表的操作完成的经典三级结构的遍历,与遍历表非常相似fortableinwordfile.tables:forcolumnintable.columns:forcelincolumn.cells:print(cell.text)写入Word1。只要不指定创建Word的路径,它就会默认从docximportDocumentwordfile=Document()2创建一个新的Word文件。保存文件修改和创建文档的时候记得保存wordfile.save(...)...放上保存的路径3.添加标题wordfile.add_heading(...,level=...)4.添加段落wordfile.add_paragraph(...)wordfile=Document()wordfile.add_heading('级别标题',level=1)wordfile.add_paragraph('新段落')5.添加文本块wordfile.add_run(...)6。添加分页wordfile.add_page_break(...)7。添加图片wordfile.add_picture(...,width=...,height=...)设置样式1.文本字体设置2.文本其他样式设置fromdocximportDocumentfromdocx.sharedimportRGBColor,ptwordfile=Document(file)forparagraphinwordfile.paragraphs:forruninparagraph.runs:run.font.bold=True#Boldrun.font.italic=True#Italicrun.font.underline=True#Underlinerun.font.strike=True#Deletelinerun.font.shadow=True#Shadowrun.字体。size=Pt(20)#fontsizerun.font.color.rgb=RGBColor(255,0,0)#fontcolor3.段落样式设置默认对齐方式为左对齐,可自行修改docx模块实现commonWord中的操作,只要了解了Python可以进行哪些类型的操作,后面遇到繁琐的工作就可以想到使用Python了。以下是使用该模块实现办公自动化的几个案例。希望能帮到你