简介:今天,首席CTO Note将与您分享与Python Statistics文本有关的几个单词。如果您能解决您现在面临的问题,请不要忘记注意此网站。让我们现在开始!
1.首先,定义一个变量并保存要计算的英语文章。
2.然后,定义两个数组,在文章中保存单词以及每个单词的频繁单词。
3.将所有单词与文章分开,然后将它们保存在数组中。
4.然后,文章中的单词总数存储在变量中。
5.使用循环来计数统计信息中每个单词中经常计数单词。
6.最后,输出文章中每个单词的单词频率。
7.运行程序,计算机将自动从统计中输入文章中每个单词的单词频率。
楼上有很多问题,例如没有标点符号,文件读取方法是错误的,等等。
建筑物之间的主要区别是否?如果您区分,请按照以下内容:
导入
def get_word_frequencies(file_name):
dic = {}
txt = open(文件名,'r')。读 ()。splitlines()
#以下句子取代了所有标点符号,因为“ - ”,因为' - '可能存在文字。
txt = re.sub(r'[^单键WD-]','',txt)
#Replace独自一人' - '
txt = re.sub(r' - ','',txt)
对于行:
对于line.split():
#如果您没有区分情况,那么您将根据小写对您进行处理。
dic.setDefault(Word,0)
dic [word] += 1
打印DIC
如果__name__ ='__ main __':
get_word_frequencies('test.txt')
你一直在问你是否有任何疑问
Python有一种特别简单的方法来实现它,您可以直接使用Str的计数方法,如下
由更基本的方法编写的参考代码:
#!/usr/bin/env Python
# - * - 编码:UTF-8 - * -
#Python 2.7
导入
打印u'请输入字符串:'
wz = raw_input()
s = wz.lower()
#小写单词的正则表达
r ='[a-z]+'
#请所有单词
ws = re.findall(r,s)
#定义词典来存储单词和时间
dt = {}
对于WS中的W:
dt [w] = dt.setDefault(w,0)+1
#wd存储单词的集合,可能有几个,例如2个单词,所有这些都出现了30次
WD = []
#max最多用于存储单词
最大= 0
对于dt.items()中的时间:
如果Timesmax:
WD = []
wd.append(word)
最大=时间
ELF Times == Max:
wd.append(word)
打印u具有一个%的单词,最高频率:'%len(wd)
对于WD中的X:
打印“%s%s”%(x,max)
测试
请输入字符串:
一个好的开始使结局很好!!!
有2个单词,最常出现:
A2
好2
如果您指的是单词,空间分开和频繁的统计单词,请使用列表和词典。
例如,输入以下内容:这是一个可以
dic1 = {}
n =输入()。分裂 ()
因为我在n:
如果我在dic1中:dic1 [i]+= 1
其他:dic1 [i] = 1
印刷(DIC1)
您好,房东,您可以使用字符串的统计功能完成。
详细的代码如下:
w ='Python,我爱Python,你好python。
打印(“ Python出现%W.Count('Python'))
结论:以上是首席执行官注释为每个人编写的Python统计数据的数量。感谢您阅读本网站的内容。我希望这对您有帮助。关于python统计文本有多少个单词的更多单词,它不会忘记在此站点上找到它。