当前位置: 首页 > 后端技术 > Python

使用Python制作词云

时间:2023-03-26 14:29:39 Python

“词云”,又称词云,是文本数据的可视化表示。它由单词组成云状的彩色图形,用于显示大量的文本数据。通常用于描述网站上的关键字元数据(标签),或可视化自由格式文本。词云中每个词的重要性以字体大小或颜色显示,词由类似云彩的彩色图形组成。“词云”的概念是由美国西北大学新闻学副教授、新媒体系主任里奇·戈登提出的。曾任编辑、记者,曾任迈阿密先驱报新媒体部主任。他一直关注网络内容分发的最新形式——即那些只有互联网才能采用、报纸、广播、电视等其他媒体无法比拟的分发方式。通常,这些最新的、网络最佳的发行版也是最好的发行版。1.功能因此,“词云”就是将网络文本中频繁出现的“关键词”直观地突出显示,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,从而使网页浏览器只要扫一眼文字就可以理解文字的大意。快速感知最突出的文本快速定位字母文本中相对突出的部分词云的本质是一个点图,它是在相应的坐标点绘制具有特定风格的文本的结果。2、Python-词云对于下图所示的TXT文本,使用Python构建词云:代码如下:importjiebafromwordcloudimportWordCloudimportmatplotlib.pyplotasplttext=open(r'\\Mac\Home\Desktop\vlookup.txt',encoding='utf-8')mylist=list(text)word_list=["".join(jieba.cut(sentence))forsentenceinmylist]new_text=''.加入(word_list)wordcloud=WordCloud(font_path='simhei.ttf',background_color='black')。生成(new_text)plt.imshow(wordcloud)plt.axis(“off”)plt.savefig(r'\\Mac\Home\Desktop\test\ciyun.png')plt.show()得到如下图:3.扩展-抠图同样的测试文本也可以用指定的图片进行抠图,比如用白色作为背景,使用指定图像中非白色的颜色作为轮廓填充词汇,生成词云。代码如下:importjiebafromwordcloudimportWordCloudimportmatplotlib.pyplotaspltfromPILimportImage#fromscipy.miscimportimreadfrommatplotlib.pyplotimportimreadtext=open(r'\\Mac\Home\Desktop\test.txt',encoding='utf-8')mylist=list(text)word_list=["".join(jieba.cut(sentence))forsentenceinmylist]new_text=''.join(word_list)pac_mask=imread(r'\\Mac\Home\Desktop\test.jpg')wc=WordCloud(font_path='simhei.ttf',background_color='white',max_words=2000,mask=pac_mask).generate(new_text)plt.imshow(wc)plt.axis('off')plt.show()wc.to_file(r'\\Mac\Home\Desktop\test\ciyun1.png')得到的词云图如下:免费下载试用:https://support.i-search.com.cn/