Python的字符串处理广泛应用于爬虫数据分析、大数据文本清洗、普通文件处理等领域,而且Python内置了很多高效的字符串处理功能,功能非常强大,简单易用。今天给大家总结分享一下字符串处理中用的最多的方法,希望大家可以轻松应对字符串处理。1、字符串的切片和乘法(一)切片str='Mondayisabusyday'print(str[0:7])#表示取第1到第7个字符串print(str[-3:])#表示取取倒数第二个字符到末尾的字符串print(str[::])#复制字符串(2)进行乘法我们在写Python代码的时候,需要一个分隔符,此时使用字符串进行乘法运算很容易实施。line=''30print(line)2.字符串的拆分(1)普通拆分,使用split函数,但是split只能做很简单的拆分,不支持多次拆分。phone='400-800-800-1234'print(phone.split('-'))['400','800','800','1234'](2)复杂分割,r表示不转入换句话说,分隔符可以是“;”,或者“,”,或者一个空格后跟0个或多个额外的空格,然后按照这个模式分割。线='你好世界;python,I,like,it'importreprint(re.split(r'[;,s]s*',line))['helloworld','python','I','like','it']3.字符串连接与合并(1)连接,两个字符可以通过“+”轻松连接str1='Hello'str2='World'new_str=str1+str2print(new_str)HelloWorld(2)合并,使用join方法url=['www','python','org']print('.'.join(url))www.python.org4.判断字符串是否以指定的前缀,后缀结束假设我们要检查文件名以什么开头或结尾?filename='trace.h'print(filename.endswith('h'))Trueprint(filename.startswith('trace'))True5.字符串搜索和匹配(1)一般搜索可以很容易的在Searchingforasubstring找到在一个长字符串中将返回字符串位置的索引,如果没有找到则返回-1str1="thisisstringexample....wow!!!"str2="exam"print(str1.find(str2))#15print(str1.find(str2,10))#15print(str1.find(str2,40))#-1(2)对于复杂匹配,正则表达式是必要的。mydate='11/27/2016'importreifre.match(r'd+/d+/d+',mydate):print('ok.match')else:print('notmatch')ok.match6.统计字符字符串中某个字符出现的次数str="thingexample....wow!!!"print(str.count('i',0,5))#1print(str.count('e'))#27.字符串替换(1)普通替换,使用替换方法text='python是一个easy易于学习,功能强大的编程语言。'print(text.replace('learn','study'))python是一种易于学习、功能强大的编程语言。(2)复杂的替换需要使用re模块的sub函数students='Boy103,girl105'importreprint(re.sub(r'd+','100',students))Boy100,girl1008。去除字符串中的一些特定字符(1)去除空格。处理文本时,例如从文件中读取一行,然后需要去除每一行中的空格、表格或换行符。str='pythonstr'print(str)删除前导和尾随空格print(str.strip())删除左边的空格print(str.lstrip())删除右边的空格print(str.rstrip())(2)复杂的文本清洗,可以使用str.translate。比如先建一个转换表,table是转换表,意思是把“to”转换成大写的“TO”,然后把old_str中的'12345'去掉,再通过table转换剩下的字符串。instr='to'outstr='TO'old_str='世界您好,欢迎使用Python。123456'remove='12345'table=str.maketrans(instr,outstr,remove)new_str=old_str.translate(table)print(new_str)HellOwOrld,欢迎使用PyThOn。6小结我们通常会使用Python来处理一些脚本,其中使用频率最高的就是字符串的处理。因此,我们整理了这些常用的字符串处理方法。希望对美国好
