当前位置: 首页 > 科技观察

最喜欢的学习:Pandas常用的100个函数

时间:2023-03-18 11:15:29 科技观察

我整理了100个Pandas常用函数,分为6类:统计汇总函数、数据清洗函数、数据过滤、绘图和元素级操作函数、时间序列函数和其他函数。统计汇总函数函数含义min()计算最小值max()计算最大值sum()求和mean()计算平均值count()counts(统计非缺失元素个数)size()counts(计数所有元素的个数number)median()计算中位数var()计算方差std()计算标准差分位数()计算任意分位数cov()计算协方差corr()计算相关系数skew()计算偏度kurt()计算峰度mode()计算模式describe()描述性统计(一次返回多个统计结果time)groupby()分组aggregate()聚合操作(可以自定义统计函数)argmin()找到最小值的位置argmax()找到最大值的位置any()相当于逻辑“或”all()相当于逻辑"and"value_counts()频率统计cumsum()操作累加和cumprod()操作累加累加pct_change()操作比(下一个元素与前一个元素的比值)数据清洗函数函数含义duplicated()判断序列元素是否重复drop_duplicates()删除重复值hasnans()判断序列是否缺失(返回TRUE或FALSE)isnull()判断序列元素是否缺失(返回一个bool与序列长度相同的值)notnull()判断序列元素是否不缺失(返回一个与序列长度相同的bool值)dropna()删除缺失值fillna()用ffill()向前和向后填充缺失值(用缺失值的前一个元素填充)bfill()向后填充缺失值(用缺失值的下一个元素填充)dtypes()检查数据类型astype()typecastpd.to_datetimeturn日期时间类型factorize()因式转换sample()采样where()值替换根据条件判断replace()按值替换(无正则化)str.replace()按值替换(正则可用)str.split.str()字符分隔数据过滤函数功能含义isin()隶属度判断between()区间判断loc()条件判断(数据框内可用)iloc()索引判断(可以在dataframe中使用)compress()条件判断nlargest()寻找最大的n个元素nsmallest()搜索最小的n个元素str.findall()子串查询(正则可以用)绘图和元素级操作函数函数含义hist()画直方图plot()绘制更多图形(饼图、折线图)根据kindparameter,boxplot等)map()elementmappingapply()element-leveloperationbasedoncustomfunctionstimeseriesfunctionfunctionmeaningdt.date()提取日期值dt.time()提取时间(时、分、秒)dt.year()提取年dt.mouth()提取月dt.day()提取日dt.hour()提取小时dt.minute()提取分dt.second()提取第二个dt.quarter()提取季度dt.weekday()提取星期几(返回一个数值)dt.weekday_name()提取星期几(返回dt.week()提取一年中的星期dt.dayofyear()提取一年中的第几天dt.daysinmonth()提取月份对应的最大天数dt.is_month_start()判断日期是否为第一天当月的dt.is_month_end()判断日期是否为当月的最后一天dt.is_quarter_start()判断日期是否为当季的第一天dt.is_quarter_end()判断日期是否为最后一天当前季度的日期dt。is_year_start()判断日期是否为一年的第一天dt.is_year_end()判断日期是否为当年最后一天dt.is_leap_year()判断日期是否为闰年-orderdifferenceround()元素舍入sort_values()按值排序sort_index()按索引排序to_dict()转换为字典tolist()转换为列表unique()对元素进行排序【编者推荐】在Linux上使用Tealdeer代替手册页在WEB环境下构建Linux基本操作视频课程Linux常用远程连接工具介绍,总有一款适合你!如何在Linux中使用Grep命令的排除功能如何将CentOS迁移到AlmaLinux并避免数据中心停机