当前位置: 首页 > 网络应用技术

Python频率统计可以计算多少个单词(频繁的单词统计python)

时间:2023-03-06 15:51:16 网络应用技术

  本文将告诉您有关Python Cinger统计数据可以计算多少个单词,以及与Python相对应的Python的知识点。我希望这对您有帮助。不要忘记收集此网站。

  本文目录清单:

  1.如何用python和jieba分词,频繁统计单词?2。Python,如何计算字符串3中的单词数量。Python33333

  # - * - 编码:UTF-8 - * -

  导入OS,编解码器

  进口jieba

  从收集进口计数器

  def get_words(txt):

  seg_list = jieba.cut(txt)

  C = Counter()

  对于seg_list中的x:

  如果Len(x)1和x!='

  ':

  C [x]+= 1

  打印(“通用单词频率统计结果”)

  for(k,v)在c.mast_common(100)中:

  print('%s%s%s%d'%(''*(5-len(k)),k,'*'*int(v/3),v)

  如果__name__ =='__ main __':

  用codecs.open('19d.txt','r','utf8')作为f:

  txt = f.read()

  get_words(txt)

  如果您指的是单词,空间分开和频繁的统计单词,请使用列表和词典。

  例如,输入以下内容:这是一个可以

  dic1 = {}

  n =输入()。分裂 ()

  因为我在n:

  如果我在dic1中:dic1 [i]+= 1

  其他:dic1 [i] = 1

  印刷(DIC1)

  1.首先,定义一个变量并保存要计算的英语文章。

  2.然后,定义两个数组,在文章中保存单词以及每个单词的频繁单词。

  3.将所有单词与文章分开,然后将它们保存在数组中。

  4.然后,文章中的单词总数存储在变量中。

  5.使用循环来计数统计信息中每个单词中经常计数单词。

  6.最后,输出文章中每个单词的单词频率。

  7.运行程序,计算机将自动从统计中输入文章中每个单词的单词频率。

  DEF统计(ASTR):

  #ASTR.Replace(“”

  “,””)

  slist = list(asr.split(“”))

  alist = []

  [alist.append(i),如果我不在alist中,我会在slist中

  alist [-1] = alist [-1] .replace(“”

  “,””)

  返回alist

  如果__name__ ==“ __ -main __”:

  code_doc = {}

  使用打开(“ test_data.txt”,“ r”,编码='utf-8')作为fs:

  对于fs.Readlines中的LN():

  L =统计(LN)

  对于L中的t:

  如果不在code_doc中:

  code_doc.setDefault(t,1)

  别的:

  code_doc [t] += 1

  对于code_doc.keys()中的键:

  打印(键 +'' + str(code_doc [键]))

  可以在此处计算Python频率统计的引入,并且Python的引入已经结束。我想知道您是否从中找到了所需的信息?如果您想进一步了解此信息,请记住要收集对该网站的关注。