当前位置: 首页 > 后端技术 > Python

Python十行代码实现文件去重,去除重复文件的脚本

时间:2023-03-25 20:25:54 Python

importdependency'''importdependency'''frompathlibimportPathimportfilecmp函数说明'''filecmp.cmp(path1,path2,shallow=True)path1/path2:要比较的两个文件路径。shallow:默认为True,即只比较os.stat()获取的元数据(创建时间、大小等)是否相同。如果设置为False,比较文件时也会比较文件内容。'''提取待去重文件的路径#初始化文件路径列表path_files_list=[]#遍历pathinPath(r'/usr/load/data').iterdir():#检查是否为afileifpath.is_file():#加入待去重文件列表path_files_list.append(path)#遍历待去重文件forfile_indexinrange(len(path_files_list)-1):#遍历,比较两者forlaterinrange(file_index+1,len(path_files_list)):#检查内容是否相同iffilecmp.cmp(path_files_list[file_index],path_files_list[later],shallow=False):#如果内容相同,删除path_files_list[file_index].unlink()break【粉丝福利】关注公众号获取全套视频资料,喜欢小编就点‘关注’吧!【往期精选】●Python的GUI框架tkinter,实现程序员的流氓忏悔逻辑●探究python函数的变长参数args和*kwargs●python的冷知识你知道有多少你没有想过?●python图片处理,自动生成gif动态图片●python-redis操作方法,非常简单的redis数据存储方法!●什么是python日期时间处理,各种日期时间格式/字符串之间的相互转换?●python自带的数据计数器很不错●几十行代码实现python收发邮件●梳理python路由知识盲点,最全最详尽的python知识体系框架思维导图终于出炉!●没有开发工具,如何在服务器控制台调试python代码,高级编程pdb代码调试!●python中的set集合,元素的CRUD处理,交集/差集/并集计算,不仅可以去重!●Python编程:支持yaml文件应用,方便阅读采取可配置的参数!●VsCode又一神器Pylance发布,终于给python开发者带来福利了!●来自灵魂的提问:每个程序员心中都有自己的一套编码标准,别人能看懂你的代码吗?本文由微信公众号【python集中营】发布,更多精彩文章视频资料获取!

猜你喜欢