通过和聚集也是数据分析的非常重要的一部分。这也是必须掌握的一点。本文将介绍数据帧数据的数据包和汇总。
PANDA提供了实现小组操作,接收by参数,接收密钥或多个密钥的方法,指示基于返回哪些组对象的分组。该对象属于迭代对象。元组由分组和组后的dataFrame对象组成。使用的具体方法如下:
根据城市的练习:
输出如下:
该方法还根据多个列支持分组,并且可以传递列表参数。在返回结果中,数据包的值是元组。
分组后的对象可以执行数据聚合计算,并且可以使用以下聚合函数:
计数组中非-NAN值NAN值的最大值的最大值的最大值和最大非nan值最小值最小值非nan值的最大值-NAN值STD,非nan值的var non -nan值,例如标准偏差和差异,例如,组中的nan -africa nan数量:
输出如下:
其他几种使用方式未列出。
创建并不容易,如果朋友感到有帮助,请再次喜欢它?