指南:作为Python数据分析的首选框架,Pandas不仅具有强大的界面,而且比本地Python更具执行效率。这是由于pandas的底部的实现。请平行计算。更重要的是,此矢量化操作不仅适用于数值计算,而且对文本和时间格式也有很好的支持,并且必须从熊猫的属性接口。
熊猫中的矢量化就像6只熊猫
说到熊猫中的属性接口,我们必须首先从数据类型开始。数据类型和BOER数据类型。可以说,此值类型,字符串类型,计时和布尔类型涵盖了所有基本数据类型。例如其他数组,列表,字典等是收集类的数据结构,不是基本数据类型。
所有数据处理的主要操作是许多操作。不用说,布尔数据实际上很好地反映在熊猫中,即通过&|,?三键运算符,字符串和时间格式如何?实际上,这是今天要共享的关键内容:属性界面-str和dt。两种类型的接口都使用几个小示例来简单而粗略地演示,也就是说,使用它!
严格来说,除了STR和DT外,PANDAS中的属性接口还具有枚举类型的CAT界面,但是它们的实际方法非常小众,因此不会提及本文。
在熊猫中,当数据类型是字符串类型时,可以执行执行属性界面操作,也就是说,可以通过调用.str属性来调用一系列字符串方法函数。python中的方法,例如拆分,杂项等,还实现了正则表达式的大多数功能,包括查找,匹配和替换等。
例如,例如,构建以下虚拟数据帧数据,所有这些数据都使用字符串类型:
相应的数据表如下:
可以看出,名称列字符串格式不是很均匀。既有情况又有情况,以及其他无用的字符,例如 - ,#和其他无用的字符。下限是组成的,helpers列是一种复合类型,由下属之间的空间区分。对于此数据,以下是处理需求需要完成:
对于上述需求,使用Pandas实施非常容易:
上面,我给了熊猫中的字符串属性界面str的一些简单示例,包括一把小刀,包括python的构建 - 字符串函数拆分,count,len等,以及在Findallreplace中使用正则表达式,灵活的效率确实可以起飞...
最后,给出str中的所有属性接口函数:
基本上,在Python中使用的字符串函数。当您致电时,只需在字符串列之后调用STR即可。该方法很简单,但是效率非常明显。
具有极其友好的数据处理和时间类型数据处理的另一个属性接口是DT,即DateTime的缩写,它需要时间类型的格式数据。因为在某些应用程序方案中,时间类型仍然很常见DT属性接口的使用也可以实现非常方便的数据处理操作。
示例数据仍在此处提供:
例如,可以通过DT时间属性接口轻松提取上述时间序列数据。例如,可以提取年度,日期和时间信息来调用年度,日期和时间属性。
应该注意的是,在上述str属性接口中,大多数DT都连接到背后的函数,此处获得的年度,日期和时间都是属性(因为不需要参数)。括号。
但是DT属性接口基本上是此属性接口,但是有一些功能,例如指定类型的格式
完整的接口列表如下:
基本上,已经实施了时间格式的基础和意外时间。提取时间信息太方便了。
编程语言中的基本数据类型无非是数值,字符串类型,时机和布尔类型。为了应对各种数据格式的多功能操作,PANDAS为字符串和计时数据提供了STR和DT。个人接口(数值数据自然支持矢量化操作,并且BIT Operator&|,|,|,?也可以计算Boolean类型要实现并行计算),通过调用属性接口后的系列方法,您可以实现Rich API和有效的计算。尤其是字符串数据,除了Python中的字符串方法外,还可以集成正则表达式逻辑。
此外,除了STR和DT的两个属性接口外,还有一个枚举属性接口CAT(即类别缩写),但实际上更受限制。
此时,已经启动了PANDAS应用程序技巧系列。它将组织起来,以便将来组织一个系列,因此请继续关注。
原始:https://juejin.cn/post/7100546651495858189