这20个Pandas功能，让你的“数据清洗”能力提升100倍

时间：2023-03-26 12:40:34 Python

大家好，我是杰杰，今天要给大家介绍一款超肝产品！Pandas是一种基于NumPy的工具，旨在解决数据分析任务。它提供了大量的函数和方法，可以让我们快速方便地处理数据。本文介绍的20个【分为15组】函数绝对是数据处理杀手，用过你就会爱不释手。构建数据集这里先为大家构建一个数据集，为大家演示这20个功能。importpandasaspddf={'姓名':['黄同学','黄至尊','黄老谢','陈大美','孙尚香'],'英文名':['黄同学','huangzhi_zun','黄老谢','陈大梅','孙尚香'],'性别':['男','女','男','女','男'],'身份证':['463895200003128433'，'4294751999912122345'，'4209341991102311','low:172_bad'],'家庭住址':['湖北广水','河南信阳','广西桂林','湖北孝感','广东广州'],'电话号码':['13434813546','19748672895','16728613064','14561586431','19384683910'],'收入':['11,000','8.5,000','9,000','6.5,000','20,000']}df=pd.DataFrame(df)df效果图：1.cat函数该函数主要用于字符串的拼接；df["name"].str.cat(df["homeaddress"],sep='-'*3)效果图：2.contains函数该函数主要用于判断一个字符串是否包含给定的字符；df["homeaddress"].str.contains("guang")效果图：3.startswith、endswith函数该函数主要用于判断一个字符串是否以...开头/结尾；#第一行“黄伟”以空格开头df["name"].str.startswith("HuangWei"")df["英文名"].str.endswith("e")效果图：4.count函数该函数主要用于统计给定字符在字符串中出现的次数；df["电话号码"].str.count("3")<;/pre>效果图：5.get函数该函数主要用于获取指定位置的字符串；df["姓名"].str.get(-1)df["身高"].str.split(":")df["身高"].str.split(":").str.get(0)效果图：6.len函数该函数主要用于计算字符串的长度；df["gender"].str.len()效果图：7.上下函数该函数主要用于英文大小写转换；df["英文名"].str.upper()df["英文名"].str.lower()效果图：8.pad+sideparameter/center函数这个函数主要用来添加一个在字符串的左侧、右侧或两侧给定字符；df[“家庭住址”]。str.pad(10,fillchar="*")#等价于ljust()df["homeaddress"].str.pad(10,side="right",fillchar="*")#等价于rjust()df["homeaddress"].str.center(10,fillchar="*")效果图：9.repeat函数该函数主要用于将一个字符串重复多次；df["gender"].str.repeat(3)效果图：10.slice_replace函数该函数主要用于用给定的字符串替换指定位置的字符；df["电话号码"].str.slice_replace(4,8,"*"*4)效果图：11.replace函数该函数主要用于将指定位置的字符替换为给定的字符串;df["height"].str.replace(":","-")效果图：该函数也接受正则表达式，将指定位置的字符替换为给定的字符串df["income"].str.replace("\d+\.\d+","regular")效果图：12.split方法+expand参数该函数主要用于将一列扩展成几列;#常用df["height"].str.split(":")#split方法，带扩展参数df[["heightdescription","finalheight"]]=df["height"].str.split(":",expand=True)df#split方法与join方法df["height"].str.split(":").str.join("?"*5)效果图：13.strip、rstrip、lstrip函数该函数主要用于去除空格和换行；df["name"].str.len()df["name"]=df["name"].str.strip()df["name"].str.len()效果图：14.findall函数该函数主要用于使用正则表达式匹配字符串，返回搜索结果列表；df["height"]df["Height"].str.findall("[a-zA-Z]+")效果图：15.extract、extractall函数该函数主要用于接受正则表达式并提取匹配的字符String（一定要加括号）；df["height"].str.extract("([a-zA-Z]+)")#extractall提取得到复合索引df["height"].str.extractall("([a-zA-Z]+)")#使用扩展参数提取df["height"].str.extract("([a-zA-Z]+).*?([a-zA-Z]+)",expand=True)渲染图：如果你觉得这篇文章对你有用，不要忘记三连，因为这将是我继续输出更多优质文章的最强大动力！

上一篇：《民国奇探》的弹幕有点搞笑，用Python爬下去看

下一篇：Python3常用内建函数(一)

这20个Pandas功能，让你的“数据清洗”能力提升100倍相关文章