简介:许多朋友询问与Python统计数据有关的几个单词。首席执行官在本文中注明将为您提供详细的答案,以供所有人参考。我希望这对每个人都会有所帮助!让我们一起看看!
代码显示如下:
Len(str.split()))
其中,str代表给出的英语句子。
代码说明:
1.将句子逐一切成单词。
str.split()是一个使用空间将英语句子划分为一个一个单词。空间是拆分方法的默认值,并且可以自身更改。返回值是单词列表。
2.统计单词数。
早些时候,我们得到了单词列表。Len()方法可以计算列表的长度。这个长度是单词数。
由更基本的方法编写的参考代码:
#!/usr/bin/env Python
# - * - 编码:UTF-8 - * -
#Python 2.7
导入
打印u'请输入字符串:'
wz = raw_input()
s = wz.lower()
#小写单词的正则表达
r ='[a-z]+'
#请所有单词
ws = re.findall(r,s)
#定义词典来存储单词和时间
dt = {}
对于WS中的W:
dt [w] = dt.setDefault(w,0)+1
#wd存储单词的集合,可能有几个,例如2个单词,所有这些都出现了30次
WD = []
#max最多用于存储单词
最大= 0
对于dt.items()中的时间:
如果Timesmax:
WD = []
wd.append(word)
最大=时间
ELF Times == Max:
wd.append(word)
打印u具有一个%的单词,最高频率:'%len(wd)
对于WD中的X:
打印“%s%s”%(x,max)
测试
请输入字符串:
一个好的开始使结局很好!!!
有2个单词,最常出现:
A2
好2
#S =“你好,我叫吉姆·格林,你吗?”
s =输入(“输入英语句子:”)
镜头= len(s)#total number字符
ListB = []
JS = 0
对于J中的J:
'(TAB)作为缩小的代码处理''''
(tab)如果j在[“,”,“。”,“!”,“?”:]:]::
(TAB)(TAB)JS += 1#标点符号计数
(TAB)(TAB)J =“”“”
(TAB)(TAB)LISTB.APPEND(J)
(tab)else:
(TAB)(TAB)LISTB.APPEND(J)
ss =(“” .join(listB))
ssl = ss.split(“”)
lensl = len(ssl)+1-js #total单词数
#print(f“ {s})
{ss}”)
print(f“ {lens}#{lensl}”)
'''运行结果
输入英语句子:你好,我叫鲍勃。
21#5
'''
您好,答案如下所示。mydict= {}
对于我输入(“英语句子”).split():
如果我在mydict中:
mydict [i]+= 1
别的:
mydict [i] = 1
对于键,in mydict.items()中的值:
打印(钥匙,值)
较小如图所示
希望您可以详细检查。
如果不能,你可以问问题
我有时间时会帮助您回答。
希望你努力学习。
每天都满。
楼上有很多问题,例如没有标点符号,文件读取方法是错误的,等等。
建筑物之间的主要区别是否?如果您区分,请按照以下内容:
导入
def get_word_frequencies(file_name):
dic = {}
txt = open(文件名,'r')。读 ()。splitlines()
#以下句子取代了所有标点符号,因为“ - ”,因为' - '可能存在文字。
txt = re.sub(r'[^单键WD-]','',txt)
#Replace独自一人' - '
txt = re.sub(r' - ','',txt)
对于行:
对于line.split():
#如果您没有区分情况,那么您将根据小写对您进行处理。
dic.setDefault(Word,0)
dic [word] += 1
打印DIC
如果__name__ ='__ main __':
get_word_frequencies('test.txt')
你一直在问你是否有任何疑问
结论:以上是首席CTO注释汇编的Python统计数据数量的相关内容的相关内容摘要。希望它对您有所帮助!如果您解决了问题,请与更多关心此问题的朋友分享?