之前分享过一篇关于Python的Excel合并的文章。链接在下面,今天给大家分享一个Python去除Excel中相同数据的方法,同样以工资表为例。为方便观看,数据量较小,足够使用。致力打造嘴巴:别人的公众号文中代码演示效果及源码请点此准备数据重复的Excel工资表安装下载模块(numpy、pandas、xlrd)选择正确路径(薪资表路径)写代码可以看到数据中有两列。一是如何过滤数据。这次是用手机号来过滤数据。名字可能一样,工资也可能一样,但手机号是唯一的。#pip3installpandasimportnumpyasnp#pip3installnumpyimportxlrd#pipinstallxlrdlabelName_phone='手机号'file_name="二月份工资表"frame=pd.read_excel('assets/'+file_name+'.xlsx')data=pd.DataFrame(frame)data.drop_duplicates([labelName_phone],keep='last',inplace=True)data.to_excel('assets/'+file_name+'deduplicateddata.xlsx')print('Complete')效果表明代码运行成功后,可以看到文件夹中多了一个Excel表格。打开它,你会发现只剩下一个相同的数据。
