本文转载自微信公众号《智斌的Python笔记》,作者智斌。转载本文请联系志斌python笔记公众号。大家好,我是志斌~在建党100周年之际,祝我们党生日快乐,祝祖国繁荣昌盛!刚才志斌打开微博,发现第一条热搜是“今天的微博评论好哭”,热度263w+。于是志斌把这条微博下的所有评论都抓取下来,做成词云图展示出来,看看网友们评论了什么,让人哭笑不得!需要源码的读者,贾志斌微信获取哈~01资料收集志斌在前两篇文章中详细介绍了如何获取微博评论。有兴趣的读者可以看这两篇文章批量抓取不同微博下的评论!抓取微博下所有评论数据~。这里志斌直接展示核心代码,代码如下:forpageinrange(1,10000):ifpage==1:params=(('id','4654152979845247'),('mid','4654152979845247'),('max_id_type','0'),)#s=requests.Session()response=requests.get('https://m.weibo.cn/comments/hotflow',headers=headers,params=params)a=回复。json()['data']['max_id']b=response.json()['data']['max_id_type']foriinresponse.json()['data']['data']:pinglunshijian=i['created_at']neirong=re.sub(r'<[^>]*>','',i['text'])id=i['user']['id']yonghumingcheng=i['user']['screen_name']withopen(r'71.txt','a',encoding='utf-8')asf:f.write(f'{neirong}\n')params=(('id','4654152979845247'),('mid','4654152979845247'),('max_id',str(a)),('max_id_type',str(b)),)print(f'抓取{page}页数据。..')time.sleep(random.randint(1,3))02词云图显示我们一共获取了8262条数据,将这些数据绘制词云图,我们发现繁荣昌盛,祖国,China,有China、us、blessing、pride等很多词。评论里似乎充满了对祖国的祝福和对这个盛世的感谢!志斌也点开了这条热搜,看了看。里面的评论真是泪目,尤其是这句话:“我们生在国旗下,成长在春风里;人民有信仰,国家有力量;万众瞩目中国,五颗星照耀全天下。”信仰上。》让志斌久久不安!代码如下:withopen("71.txt",encoding='utf-8')asf:job_title_1=f.read()contents_cut_job_title=jieba.cut(job_title_1)contents_list_job_title="".join(contents_cut_job_title)wc=WordCloud(stopwords=STOPWORDS.add("One"),collocations=False,background_color="white",font_path=r"K:\苏新诗刘开剑.ttf",width=400,height=300,random_state=42,mask=imread('xin.jpg',pilmode="RGB"))wc.generate(contents_list_job_title)wc.to_file("Recommendation.png")03总结1.今天上午,看着建党一百周年,听着习近平总书记的重要讲话,我感到自己是多么的幸运。我生在中国,生在盛世,没有经历乱世。不负众望。你的青春!2.本文仅供学习参考,不作其他用途。
