本文中使用的内容如下:
让我们看一下原始情况:
结果:
通常有两种获得唯一值的方法。首先是删除重复项目。该方法描述了PANDAS系列的重复值的处理。第二种方法是通过unique()方法获得
结果:
间隔切割是将一系列值分为几个副本。例如,现在有10个人,根据他们的年龄,他们分为三组。
该方法具有一个参数箱来指示分区
结果:
查看结果。根据垃圾箱提供的四个值,价格的价格显然分为三个部分,即(7,12],(12,78),(78,2578),它们是全部左,右和关闭。
与剪切方法类似,此方法无需提前指示分区的部分,仅需要剪切数。每个组中的数据数量相等。
结果:
注意:在数据分布相对均匀的情况下,获得的这两种方法基本相同。当负责的数据的分布不统一时,即,当方差很大时,则两者之间的分离会很大。