当前位置: 首页 > 后端技术 > Python

Pandas系列-一切从爆款功能开始

时间:2023-03-25 22:08:25 Python

Pandas系列|一切从爆款功能开始前段时间,部门大数据开发的同事离职了。他和其他开发同事在交工作项目的时候,我去Next听,因为涉及到一些公司业务逻辑问题。谈到某项目时,他说:这个业务逻辑是……,我用Hive中的爆款功能实现了这个功能。当时他举了一个简单的例子来说明爆炸函数的作用,我当场记下了函数名:爆炸函数。Hive在我的工作中用得不多,所以我想知道:Pandas可以实现这个功能吗?爆破函数function爆破函数到底实现了什么?回忆一下当时的例子:现在有一条数据,包括订单号和订单中商品的价格(每个订单3个商品),使用hive中的爆破功能后,变成如下如下图所示:相当于实现了列转行的功能。这样后面就可以进行各种聚合操作了。Hive中实现爆炸功能的函数有两个,可以自行搜索了解:explode(col)lateralview:profilefunctionpandas实现具体需求。正好最近有个需求,用到了爆炸功能的功能,不过是用pandas实现的。下表左边是每笔订单的销售记录,包括业务员、跟单员、结单员,不一定是同一个人。现在需要统计每个员工的销售业绩。销售业绩是指员工参与了多少订单。统计每个员工的销售业绩:作为销售员、跟单员或结账员,表示参与了订单的销售;同一个订单,一个员工多次参与才算爆款函数到底是做什么的?右边是我们要的结果:张三:参与订单号1-业务员,订单号2-跟单员,结账员,数量2李四:参与订单号1-跟单员,结单员,订单2-业务员,订单号3-商户,数量3王五:参与订单号3-业务员,结单文员,数量1的解决过程1.pandas中的一个数据模拟如下:2.生成新字段:employee3.实现爆款函数,使用pandas中的explode函数获取新的数据:可以看到每个订单号都会出现多次4.统计结果是基于不同的字段,比如employees,sales是python核心的第三方库数据处理和数据分析。它具有快速、灵活、清晰的数据结构。Pandas是用于分析结构化数据的强大工具集;它基于Numpy(另一个提供高性能矩阵运算的Python库),可用于数据挖掘和数据分析,也提供数据清洗功能。熊猫有什么用?pandas的具体使用以后会形成连载系列,敬请期待!本文结语:拥抱熊猫,告别Excel!