当前位置: 首页 > 网络应用技术

熊猫系列重复的处理

时间:2023-03-07 01:22:05 网络应用技术

  本文中使用的Excel表单的内容如下:

  结果:

  drop_duplicates()方法默认判断所有值,以及默认情况下首次出现的行的值

  在删除特定列的特定列时,您只需要使用子集参数即可得到很好的判断。

  结果:

  目前,仅考虑指定的列,然后重复立即删除。是否重复其他列并不考虑范围,因此与初始表数据相比,第二,5、10和11行,尽管作者的标题和作者和验证符号,但由于分类是历史性的。因此,仅保留第二行的内容。

  结果:

  目前,与初始表数据相比,由于指定了指定的多列,是否重复数据是指定的多列内容,不仅是查看一定列。因此,即使第二,第五,即使和第10行,尽管分类属于历史,因为标题与作者不同,但它不被认为是重复的记录,因此保留。第四和第9行是Yu Qiuyu写的散文类别,因此只有保留第三行的内容,并删除第10行的内容。

  使用Keep参数可以在重复值处理过程中自定义行为移动

  结果:

  从结果可以看出,第一个记录保留在默认情况下。因此,与初始表数据相比,重复第四和第9行,并保留第四行的第四条记录。

  结果:

  从结果可以看出,在第一个记录时保留了保留参数的关键。因此,与初始表数据相比,重复第四和第9行,并保留第四行的第四条记录。

  结果:

  从结果可以看出,与初始表数据相比,最后一次记录了最后一次记录,重复第四和9行,并保留第9条记录。

  结果:

  从结果可以看出,在键最后键时删除了键参数。

  注意:keep参数只是asof,last和false。不正确,不要认为如果有false,则有一个true