当前位置：首页 > 网络应用技术

Python Statistics文本中有多少个单词（2023年的最新分享）

时间：2023-03-07 10:24:02 网络应用技术

　　简介：今天，首席CTO Note将与您分享与Python Statistics文本有关的几个单词。如果您能解决您现在面临的问题，请不要忘记注意此网站。让我们现在开始！

　　1.首先，定义一个变量并保存要计算的英语文章。

　　2.然后，定义两个数组，在文章中保存单词以及每个单词的频繁单词。

　　3.将所有单词与文章分开，然后将它们保存在数组中。

　　4.然后，文章中的单词总数存储在变量中。

　　5.使用循环来计数统计信息中每个单词中经常计数单词。

　　6.最后，输出文章中每个单词的单词频率。

　　7.运行程序，计算机将自动从统计中输入文章中每个单词的单词频率。

　　楼上有很多问题，例如没有标点符号，文件读取方法是错误的，等等。

　　建筑物之间的主要区别是否？如果您区分，请按照以下内容：

　　导入

　　def get_word_frequencies（file_name）：

　　dic = {}

　　txt = open（文件名，'r'）。读（）。splitlines（）

　　＃以下句子取代了所有标点符号，因为“ - ”，因为' - '可能存在文字。

　　txt = re.sub（r'[^单键WD-]'，''，txt）

　　＃Replace独自一人' - '

　　txt = re.sub（r' - '，''，txt）

　　对于行：

　　对于line.split（）：

　　＃如果您没有区分情况，那么您将根据小写对您进行处理。

　　dic.setDefault（Word，0）

　　dic [word] += 1

　　打印DIC

　　如果__name__ ='__ main __'：

　　get_word_frequencies（'test.txt'）

　　你一直在问你是否有任何疑问

　　Python有一种特别简单的方法来实现它，您可以直接使用Str的计数方法，如下

　　由更基本的方法编写的参考代码：

　　＃！/usr/bin/env Python

　　＃ - * - 编码：UTF-8 - * -

　　#Python 2.7

　　导入

　　打印u'请输入字符串：'

　　wz = raw_input（）

　　s = wz.lower（）

　　＃小写单词的正则表达

　　r ='[a-z]+'

　　＃请所有单词

　　ws = re.findall（r，s）

　　＃定义词典来存储单词和时间

　　dt = {}

　　对于WS中的W：

　　dt [w] = dt.setDefault（w，0）+1

　　#wd存储单词的集合，可能有几个，例如2个单词，所有这些都出现了30次

　　WD = []

　　#max最多用于存储单词

　　最大= 0

　　对于dt.items（）中的时间：

　　如果Timesmax：

　　WD = []

　　wd.append（word）

　　最大=时间

　　ELF Times == Max：

　　wd.append（word）

　　打印u具有一个％的单词，最高频率：'％len（wd）

　　对于WD中的X：

　　打印“％s％s”％（x，max）

　　测试

　　请输入字符串：

　　一个好的开始使结局很好！！！

　　有2个单词，最常出现：

　　好2

　　如果您指的是单词，空间分开和频繁的统计单词，请使用列表和词典。

　　例如，输入以下内容：这是一个可以

　　dic1 = {}

　　n =输入（）。分裂（）

　　因为我在n：

　　如果我在dic1中：dic1 [i]+= 1

　　其他：dic1 [i] = 1

　　印刷（DIC1）

　　您好，房东，您可以使用字符串的统计功能完成。

　　详细的代码如下：

　　w ='Python，我爱Python，你好python。

　　打印（“ Python出现％W.Count（'Python'））

　　结论：以上是首席执行官注释为每个人编写的Python统计数据的数量。感谢您阅读本网站的内容。我希望这对您有帮助。关于python统计文本有多少个单词的更多单词，它不会忘记在此站点上找到它。

上一篇：Luyang大数据工业园区有多少平方米（Hefei Luyang Big Data Investment Merchants Operation Co.，Ltd。）

下一篇：Django的应用在哪里（什么是Django？）

Python Statistics文本中有多少个单词（2023年的最新分享）相关文章