本文将告诉您有关Python Cinger统计数据可以计算多少个单词,以及与Python相对应的Python的知识点。我希望这对您有帮助。不要忘记收集此网站。
本文目录清单:
1.如何用python和jieba分词,频繁统计单词?2。Python,如何计算字符串3中的单词数量。Python33333
# - * - 编码:UTF-8 - * -
导入OS,编解码器
进口jieba
从收集进口计数器
def get_words(txt):
seg_list = jieba.cut(txt)
C = Counter()
对于seg_list中的x:
如果Len(x)1和x!='
':
C [x]+= 1
打印(“通用单词频率统计结果”)
for(k,v)在c.mast_common(100)中:
print('%s%s%s%d'%(''*(5-len(k)),k,'*'*int(v/3),v)
如果__name__ =='__ main __':
用codecs.open('19d.txt','r','utf8')作为f:
txt = f.read()
get_words(txt)
如果您指的是单词,空间分开和频繁的统计单词,请使用列表和词典。
例如,输入以下内容:这是一个可以
dic1 = {}
n =输入()。分裂 ()
因为我在n:
如果我在dic1中:dic1 [i]+= 1
其他:dic1 [i] = 1
印刷(DIC1)
1.首先,定义一个变量并保存要计算的英语文章。
2.然后,定义两个数组,在文章中保存单词以及每个单词的频繁单词。
3.将所有单词与文章分开,然后将它们保存在数组中。
4.然后,文章中的单词总数存储在变量中。
5.使用循环来计数统计信息中每个单词中经常计数单词。
6.最后,输出文章中每个单词的单词频率。
7.运行程序,计算机将自动从统计中输入文章中每个单词的单词频率。
DEF统计(ASTR):
#ASTR.Replace(“”
“,””)
slist = list(asr.split(“”))
alist = []
[alist.append(i),如果我不在alist中,我会在slist中
alist [-1] = alist [-1] .replace(“”
“,””)
返回alist
如果__name__ ==“ __ -main __”:
code_doc = {}
使用打开(“ test_data.txt”,“ r”,编码='utf-8')作为fs:
对于fs.Readlines中的LN():
L =统计(LN)
对于L中的t:
如果不在code_doc中:
code_doc.setDefault(t,1)
别的:
code_doc [t] += 1
对于code_doc.keys()中的键:
打印(键 +'' + str(code_doc [键]))
可以在此处计算Python频率统计的引入,并且Python的引入已经结束。我想知道您是否从中找到了所需的信息?如果您想进一步了解此信息,请记住要收集对该网站的关注。