当前位置: 首页 > 后端技术 > Python

办公文员必备python神器,PDF文件表格转excel表格!

时间:2023-03-25 21:22:45 Python

【阅读全文】第三方库说明#PDF读取第三方库importpdfplumber#DataFrame数据结果处理importpandasaspd初始化DataFrame数据对象#初始化DataFrame数据对象用于DataFrame数据存储data_frame=pd.DataFrame()读取PDF表单#pdf文件路径pdf_file='/usr/load/data.pdf'#读取pdf数据pdf_data=pdfplumber.open(pdf_file)#遍历pdf数据forpageinpdf_data.pages:#每页Tbale表datatable=page.extract_table()#将每一页的数据写入一个DataFrame对象data_frame_page=pd.DataFrame(table[1:],columns=table[0])#合并每一页的表数据data_frame=pd.concat([data_frame_page,data_frame],ignore_index=True)#简单数据清洗,删除数据列data_frame.dropna(axis=1,how='all',inplace=True)write进入EXCEL表格#excel文件路径excel_path='/usr/load/data.pdf'#自定义列名data_frame.columns=['姓名','年龄','身份证号','绩效考核']#dataFrame将数据保存到Excel数据表data_frame.to_excel(excel_writer=excel_path,index=False,encoding='utf-8')[粉丝福利]关注公众号,获取全套视频资料,使用python的pdf读写功能模块,自定义转换从pdf读取的表格内容,写入excel文件表格。喜欢小编就点‘关注’吧![往期精选]●python最好用的身份证规则分析工具,快速验证区号、性别、出生日期、身份证号码等!●os使用总结:python中必须掌握内置模块os才能实现与电脑操作系统的定时交互!●Python实用技巧:几十行代码把照片转成草图,然后打包成可执行文件(源码分享)●Python十行代码实现文件去重和脚本去重文件●Python的GUI框架tkinterto实现程序成员流氓式的告白逻辑●探究python函数的变长参数args和*kwargs●python的冷知识有多少你没有想过?●python图片处理,自动生成gif动态图片●python-redis操作方法,非常简单的redis数据存储方法!●什么是python日期时间处理,各种日期时间格式/字符串之间的相互转换?●python内置的数据计数器很不错●几十行代码实现python收发邮件●没有开发工具,如何在服务器控制台调试python代码,高级编程pdb代码调试!●梳理python路线知识盲点,最全最详尽的python知识体系框架思维导图终于出炉!本文由微信公众号【python集中营】发布,更多精彩文章视频资料获取!