大家好,我是杰杰,今天要给大家介绍一款超肝产品!Pandas是一种基于NumPy的工具,旨在解决数据分析任务。它提供了大量的函数和方法,可以让我们快速方便地处理数据。本文介绍的20个【分为15组】函数绝对是数据处理杀手,用过你就会爱不释手。构建数据集这里先为大家构建一个数据集,为大家演示这20个功能。importpandasaspddf={'姓名':['黄同学','黄至尊','黄老谢','陈大美','孙尚香'],'英文名':['黄同学','huangzhi_zun','黄老谢','陈大梅','孙尚香'],'性别':['男','女','男','女','男'],'身份证':['463895200003128433','4294751999912122345','4209341991102311','low:172_bad'],'家庭住址':['湖北广水','河南信阳','广西桂林','湖北孝感','广东广州'],'电话号码':['13434813546','19748672895','16728613064','14561586431','19384683910'],'收入':['11,000','8.5,000','9,000','6.5,000','20,000']}df=pd.DataFrame(df)df效果图:1.cat函数该函数主要用于字符串的拼接;df["name"].str.cat(df["homeaddress"],sep='-'*3)效果图:2.contains函数该函数主要用于判断一个字符串是否包含给定的字符;df["homeaddress"].str.contains("guang")效果图:3.startswith、endswith函数该函数主要用于判断一个字符串是否以...开头/结尾;#第一行“黄伟”以空格开头df["name"].str.startswith("HuangWei"")df["英文名"].str.endswith("e")效果图:4.count函数该函数主要用于统计给定字符在字符串中出现的次数;df["电话号码"].str.count("3")<;/pre>效果图:5.get函数该函数主要用于获取指定位置的字符串;df["姓名"].str.get(-1)df["身高"].str.split(":")df["身高"].str.split(":").str.get(0)效果图:6.len函数该函数主要用于计算字符串的长度;df["gender"].str.len()效果图:7.上下函数该函数主要用于英文大小写转换;df["英文名"].str.upper()df["英文名"].str.lower()效果图:8.pad+sideparameter/center函数这个函数主要用来添加一个在字符串的左侧、右侧或两侧给定字符;df[“家庭住址”]。str.pad(10,fillchar="*")#等价于ljust()df["homeaddress"].str.pad(10,side="right",fillchar="*")#等价于rjust()df["homeaddress"].str.center(10,fillchar="*")效果图:9.repeat函数该函数主要用于将一个字符串重复多次;df["gender"].str.repeat(3)效果图:10.slice_replace函数该函数主要用于用给定的字符串替换指定位置的字符;df["电话号码"].str.slice_replace(4,8,"*"*4)效果图:11.replace函数该函数主要用于将指定位置的字符替换为给定的字符串;df["height"].str.replace(":","-")效果图:该函数也接受正则表达式,将指定位置的字符替换为给定的字符串df["income"].str.replace("\d+\.\d+","regular")效果图:12.split方法+expand参数该函数主要用于将一列扩展成几列;#常用df["height"].str.split(":")#split方法,带扩展参数df[["heightdescription","finalheight"]]=df["height"].str.split(":",expand=True)df#split方法与join方法df["height"].str.split(":").str.join("?"*5)效果图:13.strip、rstrip、lstrip函数该函数主要用于去除空格和换行;df["name"].str.len()df["name"]=df["name"].str.strip()df["name"].str.len()效果图:14.findall函数该函数主要用于使用正则表达式匹配字符串,返回搜索结果列表;df["height"]df["Height"].str.findall("[a-zA-Z]+")效果图:15.extract、extractall函数该函数主要用于接受正则表达式并提取匹配的字符String(一定要加括号);df["height"].str.extract("([a-zA-Z]+)")#extractall提取得到复合索引df["height"].str.extractall("([a-zA-Z]+)")#使用扩展参数提取df["height"].str.extract("([a-zA-Z]+).*?([a-zA-Z]+)",expand=True)渲染图:如果你觉得这篇文章对你有用,不要忘记三连,因为这将是我继续输出更多优质文章的最强大动力!
