简介:Pandas曾经是我的数据分析的主要工具,即使在许多情况下,也是目前的首选。作为Python的三剑手之一,Pandas以其丰富的API而闻名。个体也经常被各种表演手术陶醉,无法解释自己(有些人很重)。我发现,我发现了早期阶段被忽略的功能。在仔细的探索下,我发现有一些有用的功能。此功能是 - 转换。
变换是熊猫中的一个函数,可用于系列和数据框架,并且可以与GroupBy一起使用dataFrameGroupby对象,因此本文主要介绍转换的两个主要功能:
首先查看官方文档介绍转换:
从函数的签名中可以看出,转换主要包括两个指定的参数func和axis,其中func是接收处理函数,可以是函数对象,函数名称字符串,函数列表,字典函数等。轴是一个起作用的轴。另一个*args和** kwargs用于接收接收func函数的可变参数和字典参数。
在熊猫的早期推文中,这三个功能我没想到会成为我的数据处理的主要力量,该功能的重点是申请,映射和applymap.map.map+applymap tosees:其中,地图是一个元素- 仅用于串联对象的级别转换。ApplionMap只能用于仅用于数据帧对象的元素级别转换,但是所有功能都必须通过相同的函数处理。这是限制的。
那么,转换呢?它不仅可以满足地图和应用程序的某些需求,还可以根据其基础提供更丰富的操作。
需要执行数值列A和两个操作的索引(即使用转换来获取串联对象的两个 - 列数据框)。明显地
此外,不仅需要列A列的执行索引和数字计算,还需要托盘列B的字典格式的长度计算。
在上面的示例中,未声明轴参数。目前,默认轴= 0,即,传输函数是扮演角色。LET以另一个示例为例,然后尝试轴= 1:
在此示例中,通过传递轴= 1的参数,可以实现不同功能的不同功能的处理效果,并且此处的功能包括三种传递字符串形式,函数对象和lambda表达式的形式。
实际上,转换实现MAP或Applipmap的效果的效果是否比两者的功能更定制。
转换可用于组对象。这是我在学习转变中的作用。您知道在熊猫的Groupby中使用这些用法吗?文章中实际上有一个介绍,因此在此简要提及。
大熊猫实现了常用的聚集统计。通常,GroupBy用于直接添加聚合物函数或通过AGG通过多个聚合函数。它也可以通过GroupBy+Apply实施。但是,这三个实现具有共同的特征:也就是说,GroupBy之后的行数(反映为行数减少),这也是“行数减少),这也是”,这也是”“从通常的意义上讲”,在某些情况下,实际上没有必要汇总,例如,给定以下数据示例:
有必要计算每个ID的每个ID的比例。如果需要以3个步骤实施常规汇总统计的想法:
同样,如果您巧妙地使用转换,则可以进入一步:
这是非常酷的,正确!
原始:https://juejin.cn/post/7100138819785064461