当前位置: 首页 > 网络应用技术

Python Statistics文本中有多少个单词(2023年的最新分享)

时间:2023-03-07 10:24:02 网络应用技术

  简介:今天,首席CTO Note将与您分享与Python Statistics文本有关的几个单词。如果您能解决您现在面临的问题,请不要忘记注意此网站。让我们现在开始!

  1.首先,定义一个变量并保存要计算的英语文章。

  2.然后,定义两个数组,在文章中保存单词以及每个单词的频繁单词。

  3.将所有单词与文章分开,然后将它们保存在数组中。

  4.然后,文章中的单词总数存储在变量中。

  5.使用循环来计数统计信息中每个单词中经常计数单词。

  6.最后,输出文章中每个单词的单词频率。

  7.运行程序,计算机将自动从统计中输入文章中每个单词的单词频率。

  楼上有很多问题,例如没有标点符号,文件读取方法是错误的,等等。

  建筑物之间的主要区别是否?如果您区分,请按照以下内容:

  导入

  def get_word_frequencies(file_name):

  dic = {}

  txt = open(文件名,'r')。读 ()。splitlines()

  #以下句子取代了所有标点符号,因为“ - ”,因为' - '可能存在文字。

  txt = re.sub(r'[^单键WD-]','',txt)

  #Replace独自一人' - '

  txt = re.sub(r' - ','',txt)

  对于行:

  对于line.split():

  #如果您没有区分情况,那么您将根据小写对您进行处理。

  dic.setDefault(Word,0)

  dic [word] += 1

  打印DIC

  如果__name__ ='__ main __':

  get_word_frequencies('test.txt')

  你一直在问你是否有任何疑问

  Python有一种特别简单的方法来实现它,您可以直接使用Str的计数方法,如下

  由更基本的方法编写的参考代码:

  #!/usr/bin/env Python

  # - * - 编码:UTF-8 - * -

  #Python 2.7

  导入

  打印u'请输入字符串:'

  wz = raw_input()

  s = wz.lower()

  #小写单词的正则表达

  r ='[a-z]+'

  #请所有单词

  ws = re.findall(r,s)

  #定义词典来存储单词和时间

  dt = {}

  对于WS中的W:

  dt [w] = dt.setDefault(w,0)+1

  #wd存储单词的集合,可能有几个,例如2个单词,所有这些都出现了30次

  WD = []

  #max最多用于存储单词

  最大= 0

  对于dt.items()中的时间:

  如果Timesmax:

  WD = []

  wd.append(word)

  最大=时间

  ELF Times == Max:

  wd.append(word)

  打印u具有一个%的单词,最高频率:'%len(wd)

  对于WD中的X:

  打印“%s%s”%(x,max)

  测试

  请输入字符串:

  一个好的开始使结局很好!!!

  有2个单词,最常出现:

  A2

  好2

  如果您指的是单词,空间分开和频繁的统计单词,请使用列表和词典。

  例如,输入以下内容:这是一个可以

  dic1 = {}

  n =输入()。分裂 ()

  因为我在n:

  如果我在dic1中:dic1 [i]+= 1

  其他:dic1 [i] = 1

  印刷(DIC1)

  您好,房东,您可以使用字符串的统计功能完成。

  详细的代码如下:

  w ='Python,我爱Python,你好python。

  打印(“ Python出现%W.Count('Python'))

  结论:以上是首席执行官注释为每个人编写的Python统计数据的数量。感谢您阅读本网站的内容。我希望这对您有帮助。关于python统计文本有多少个单词的更多单词,它不会忘记在此站点上找到它。