当前位置: 首页 > 网络应用技术

熊猫系列(1)中的数据包根据列名进行分组

时间:2023-03-08 20:34:30 网络应用技术

  数据包是根据一个或多个键(可以是函数,数组或DF列名称)将数据分为几个组,然后汇总分组后数据的计算,并合并摘要计算结果。功能。用作摘要计算称为聚合物函数。

  本文中使用的内容如下:

  让我们看看数据的情况

  结果:

  数据包的特定过程如下所示

  结果:

  从上面的结果可以看出,如果仅在名称中介绍它,则组为dataFrameGroupby对象后的结果。该对象在分组后包含几个组数据,但未直接显示。它需要在显示这些分组数据之前对其进行计算和计算。

  结果:

  上述代码根据项目的分类付给所有数据,然后在分组数据后计数数据,最后合并。

  由于计算了分组数据,因此每列将具有结果。操作

  结果:

  我们称这组数据摘要操作的操作,所使用的函数称为聚合函数。例如,先前一系列文章的无面数,总和,最大值的最小值,最大值,平均值,中值,数量,差异,标准偏差和分隔数。所有属于聚合物函数。

  只要它们以列表的形式将名称列表传递给GroupBy(),多行数据包和单列数据包几乎相同。

  结果:

  结果:

  上面的两种方法的1和2方法,无论是列还是多列,只要在分组后直接在数据上计算,它就是计算所有计算的列。有时我们不需要计算所有列。

  结果:

  这是根据项目的分类进行分组,然后总统比赛基于项目的名称。