本文中使用的Excel表单的内容如下:
结果:
drop_duplicates()方法默认判断所有值,以及默认情况下首次出现的行的值
在删除特定列的特定列时,您只需要使用子集参数即可得到很好的判断。
结果:
目前,仅考虑指定的列,然后重复立即删除。是否重复其他列并不考虑范围,因此与初始表数据相比,第二,5、10和11行,尽管作者的标题和作者和验证符号,但由于分类是历史性的。因此,仅保留第二行的内容。
结果:
目前,与初始表数据相比,由于指定了指定的多列,是否重复数据是指定的多列内容,不仅是查看一定列。因此,即使第二,第五,即使和第10行,尽管分类属于历史,因为标题与作者不同,但它不被认为是重复的记录,因此保留。第四和第9行是Yu Qiuyu写的散文类别,因此只有保留第三行的内容,并删除第10行的内容。
使用Keep参数可以在重复值处理过程中自定义行为移动
结果:
从结果可以看出,第一个记录保留在默认情况下。因此,与初始表数据相比,重复第四和第9行,并保留第四行的第四条记录。
结果:
从结果可以看出,在第一个记录时保留了保留参数的关键。因此,与初始表数据相比,重复第四和第9行,并保留第四行的第四条记录。
结果:
从结果可以看出,与初始表数据相比,最后一次记录了最后一次记录,重复第四和9行,并保留第9条记录。
结果:
从结果可以看出,在键最后键时删除了键参数。
注意:keep参数只是asof,last和false。不正确,不要认为如果有false,则有一个true