当前位置: 首页 > 后端技术 > Python

python办公自动化浅谈Excel(下)

时间:2023-03-25 20:41:29 Python

作者:新干果来源:AirPython1.前言在日常工作中,我们经常会用到Word、Excel、PPT、PDF等办公软件。但是,我们经常会遇到一些重复、繁琐的事情,这时候人工操作是极其低效的;需要通过python实现办公自动化。在接下来的系列文章中,我将带大家对Python办公自动化做一个全面的总结,绝对的干货!2、准备使用Python操作Excel文件。常用方法如下:xlrd/xlwtopenpyxlPandasxlsxwriterxlwingspywin32xlrd和xlwt是操作Excel文件最依赖的两个库。其中xlrd负责读取Excel文件,xlwt可以向Excel文件写入数据。我们安装这两个依赖库。安装依赖库pip3installxlrdpip3installxlwt3。xlrd读取Excel并在xlrd中使用open_workbook(filepath)打开本地Excel文件。importxlrd打开文件返回一个workbook对象wb=xlrd.open_workbook(file_path)workbook对象的nsheets属性获取Sheet的个数,sheet_names()方法返回所有Sheet名称的列表。统计sheets_num,sheets_names=wb.nsheets,wb.sheet_names()print('thetotalnumberofsheets:',sheets_num)print('thesheetnamesare:',sheets_names)过滤出某个Sheetin工作簿2种方式,即:通过Sheet名称使用位置索引,从0开始获取某张工作表通过名称或索引获取sheet=wb.sheet_by_index(0)sheet=wb.sheet_by_name('第一张Sheet')print(sheet)每个sheet对象可以通过name、nrows、ncols获取Sheet名称、行数、列数。另外row_values(index)和col_values(index)分别用于获取某行或某列的数据列表。获取一张工作表中包含的行数和列数sheet_name,sheet_row_count,sheet_column_count=sheet.name,sheet.nrows,sheet.ncolsprint('当前工作表名称为:',sheet_name,",共有:",sheet_row_count,"Row;thereare:",sheet_column_count,"column")单独获取一行数据,索引从0开始例如:获取第二行数据row_datas=sheet.row_values(1)print('第二个rowofdatais:',row_datas)分别获取一列数据,索引从0开始例如:获取第二列数据column_datas=sheet.col_values(1)print('第二列数据为:',column_datas)单元格可以通过调用行索引和列索引cell(row_index,column_index)函数来获取。需要注意的是,行索引和列索引都是从0开始的,即:0代表第一行。xlrd中,单元格数据类型有6种,与ctype属性的对应关系如下:0--空(empty)1--字符串(string)2--数字(number)3--date(日期)4--boolean(布尔值)5--error(错误)获取某个单元格的数据例如:获取第2行第1列单元格的数据one_cell=sheet.cell(1,0)cellvaluecell_value=one_cell.valueprint("单元格的值为:",cell_value)celldatatypecell_type=one_cell.print("Thecelldatatypeis:",cell_type)最后,如果要获取所有单元格中的数据当前Sheet的,可以通过遍历所有的行和列来进行操作。获取所有单元格的值print('表格中所有数据如下:')forrinrange(sheet.nrows):foriinrange(sheet.ncols):print(sheet.cell(r,i).value)4.将xlwt写入Excel如果要将数据写入Excel,xlwt非常方便。首先,使用xlwt的Workbook()方法创建工作簿对象;然后,使用workbook对象的add_sheet(sheetname)方法添加一个新的Sheet;importxlwtsheetname='第一个Sheet'创建一个工作簿对象wb=xlwt.Workbook()添加Sheet,通过工作表名称sheet=wb.add_sheet(sheetname)然后,通过工作表对象的write()方法,写入根据行索引和列索引将数据放入相应的单元格中。将数据写入工作表。三个参数分别是:行索引(从0开始),列索引(从0开始),单元格值,第一行第一列,写入一个数据并为索引写入title,titleinenumerate(self.titles):sheet。write(0,index,title)writevalueforindex_row,row_valuesinenumerate(self.values):forindex_column,column_valueinenumerate(row_values):sheet.write(index_row+1,index_column,column_value)需要注意的是最后必须调用工作簿的save(filepath)以在本地生成Excel文件。保存文件最后保存文件wb.save(filepath)5.高级用法接下来说说几个常见的高级用法1.获取所有可见的Sheets在读取Sheet数据的时候,往往需要过滤隐藏的Sheets当可见性的时候sheet对象的属性值为0,表示该sheet显示在工作簿中;否则它是隐藏的defget_all_visiable_sheets(self,wb):"""Getallvisiblesheets:paramwb::return:"""returnlist(filter(lambdaitem:item.visibility==0,wb.sheets()))1.获取所有可见的sheetssheet_visiable=self.get_all_visiable_sheets(wb)print('Allvisiblesheetsinclude:',sheet_visiable)2.获取Sheet的可见行或列在某个Sheet中,有些行和列可能是隐藏的。defget_all_visiable_rows(self,sheet):"""获取工作表中的可见行:paramsheet::return:"""result=[indexforindexinrange(sheet.nrows)ifsheet.rowinfo_map[index].hidden==0]returnresultdefget_all_visiable_columns(self,sheet):"""获取某个sheet中的可见列:paramsheet::return:"""result=[indexforindexinrange(sheet.ncols)ifsheet.colinfo_map[index].hidden==0]返回结果3.获取单元格的样式以单元格的字体颜色和背景为例。defget_cell_bg_color(self,wb,sheet,row_index,col_index):"""获取某个cell的背景色:paramwb::paramsheet::paramrow_index::paramcol_index::return:"""xfx=sheet.cell_xf_index(row_index,col_index)xf=wb.xf_list[xfx]字体颜色font_color=wb.font_list[xf.font_index].colour_index背景颜色bg_c??olor=xf.background.pattern_colour_indexreturnfont_color,bg_c??olor需要注意的是使用xlrd来read单元格的样式,需要在打开工作簿时显式定义formatting_info=True,否则会抛出异常。注意:必须设置Formatting_info=True才能正常获取属性wb=xlrd.open_workbook(file_path,formatting_info=True)sheet=wb.sheet_by_index(06.最后,xlrd和xlwt一起使用,基本可以完成大部分工作。对于一些复杂的功能,如:copy,split,filter等功能,可以使用依赖库xlutils,需要指出的是,这种组合对xlsx的兼容性不是很好;如果需要操作xlsx文件,需要转成xls先。然后继续。