当前位置: 首页 > 后端技术 > Python

Python解读:Antenna五月演唱会刷屏!这里有你的青春吗?

时间:2023-03-26 16:11:47 Python

【简介】:今天来说说五月天刷朋友圈的线上演唱会。Python技术部分请参考第四部分。给我数据,用数据说话!五月的最后一天,五月天兑现了他们2020年的“五月诺言”。5月31日,一场席卷朋友圈的线上演唱会如期上演。空荡荡的体育馆,数以万计的银色荧光棒,一个乐队独自狂欢晚会,感觉最近被蛋黄裙洗脑了,深深被JonyJ迷倒了。商业。五月天在五月履行了约定,歌迷满足了娱乐的需要来填补内心的空虚,或者真的去摆地摊了,所以这场演唱会瞬间火遍全网,圈朋友们对演唱会充满了“五月天线”,“虽然只有一个小时,也没有安可的呐喊,但现场的效果还是很不错的。五月天唱的是青春,是梦想,是自己的人生经历,而身处人生各个阶段、心情各异的歌迷,似乎都能找到共鸣和灵感。那么五月天的线上演唱会,有没有你的青春呢?让我们用数据说话。01.豆瓣评分9.4,有多好这场线上演唱会?我们先来看看豆瓣的数据:截至目前,五月天线上演唱会的评论人数已超过10万人,目前豆瓣评分为9.4分,已经是非常高的评分了。进一步分析豆瓣评分分布显示68.4%的评论给出了满分5颗星,其次是24.2%的人给了4颗星。豆瓣评论词云图豆瓣评论你在说什么?可见,“太短了”是大家的一致声音。这种演唱会时间太短了一个小时。有歌迷感叹,“五月天的演唱会就像我的青春,就这么结束了。”同时“青春”、“感动”、“永远”等也是高频出现的词。02.喜欢五月天的人有哪些?那么喜欢五月天的人都有哪些呢?最后,让我们看看五月天微博的粉丝画像。我们收集整理的微博评论和粉丝数据分别是4288条和4213条。微博粉丝的性别比例首先是从性别比例上看。女性粉丝是五月天的主要粉丝,占比79.84%,男性粉丝占比20.16%。微博粉丝地域分布从粉丝分布来看,广东省粉丝最多,排名第一,其次是海外粉丝数量众多,排名第二。北京、浙江、江苏分别位列第三、第四、第五。微博粉丝年龄分布关于粉丝的年龄分布,不用担心,90后占绝大多数,占比71.11%。其次是00后,占比12.74%,80后以7.88%排名第三。还有一些10后粉丝,占比4.81%。03、网络开唱1小时,3500万人同时在线观看。我们对五月天在QQ音乐上的评论数据进行了整理分析,去重后得到了7126个样本。先看结论:可以看到评论的实时趋势图。从整体评论实时趋势图来看:五月天的评论留言在5月31日线上演唱会当天达到顶峰,之后逐渐回落并企稳。总体评论词云那么大家在评论中谈论的是什么?查看整体评论的词云图,我们发现“喜欢”、“希望”、“感动”是出现频率特别高的词;而“青春”这个词也出现了很多次,确实,尤其是对于90后来说,五一是我们这一代人的青春记忆。同时,这场线上演唱会也是大家讨论的焦点,“直播”、“直播”、“回放”等都被大家提及。同时,评论中也多次出现了《知足》、《倔强》等歌曲,也是引起共鸣最多的歌曲。评论关注成员对比那么在五月天的成员中,大家最关心的成员是谁呢?没错,在这方面,阿信是毫无悬念的第一。其他成员关佑、怪物、石头和玛莎的关注度差不多,平分秋色。阿信评论词云图大家都在谈论阿信评论什么?看到词云图,最重要的是“喜欢”、“希望”,表达了歌迷对阿信的喜爱和美好祝愿,然后又提到了其他几位乐队成员。有意思的是,“前女友”的提法也特别多。和五月天的金曲相比,有评论的歌曲太多了。哪些歌曲最受欢迎?通过分析排序,我们可以看到,《突然好想你》被提及的次数最多,其次是《突然好想你》。此外,还有《我不愿让你一个人》《星空》《盛夏光年》等,都是耳熟能详的歌曲。04.手把手教你用Python分析QQ音乐评论数据我们用Python获取了QQ音乐五月天/TME直播评论数据、豆瓣短评论数据、微博乐高中国评论和粉丝数据,并进行了数据分析。下面是一些QQ音乐评论分析的关键代码。整体分析流程如下:评论数据获取数据预处理数据可视化分析01数据获取首先我们获取五月天/TME直播的评论数据,地址如下:https://y.qq.com/n/yqq/mv/v/k...通过分析该网页可以发现评论数据是通过js动态加载的,使用简单的抓包分析可以得到真正的数据传输接口铬浏览器。所有数据都可以通过简化URL和修改pageSize参数来获取。代码如下:importpackageimportpandasaspdimporttimeimportrequestsimportjsonfromfakerimportFactorydefget_qq_comment(page_num):"""功能:传入页码获取QQ音乐评论数据。"""#Storedatadf_all=pd.DataFrame()foriinrange(page_num):#Printprogressprint('Iamgettinginformationonpage{}'.format(i))#GetURLurl='https://c.y.qq.com/base/fcgi-..._global_comment_h5.fcg?g_tk_new_20200303=1516279237&g_tk=470981629&loginUin=2315561922&hostUin=0&format=json&inCharset=utf8&outCharset=GB2312¬ice=0&platform=yqq.json&needNewCode=0&cid=205360772&reqtype=2&biztype=5&topID=k0034mj6ty2&cmd=8&needmusiccrit=0&pagenum={}&pagesize=25&domain=qq.com&ct=24&cv=1010101010101010'.format(i)##发起请求r=requests.get(url,headers=headers)#解析网页json_data=json.loads(r.text)#获取数据comment_list=json_data['comment']['commentlist']iick_name#.get('nick')foriincomment_list]#评论内容content=[i.get('rootcommentcontent')foriincomment_list]#评论时间comment_time=[i.get('time')foriincomment_list]#存储数据df=pd.DataFrame({nick_name,'content':content,'remand_time':comment_time})#追加df_all=df_all.append(df,imgnore_index=true)#休眠休眠休眠休眠休眠秒秒秒秒秒df=get_qq_comment(page_num=286)通过以上过程,得到7127条评论。数据获取格式如下:df.head()02读入数据和数据预处理。这里我们主要进行上面得到的数据集。组织和洗涤。工作包括:检查重复值和空值comment_time:将时间戳转换成标准时间格式内容:替换错误值导入所需包导入numpyasnpimportreimportjieba读入数据df=pd.read_excel('../data/五月天QQ评论数据6.05.xlsx')删除重复值df=df.drop_duplicates()转换函数deftransform_time(time_second):time_array=time.localtime(time_second)otherStyleTime=time.strftime('%Y-%m-%d%H:%M:%S',time_array)returnotherStyleTime时间数据处理df['comment_time']=df['comment_time'].apply(lambdax:transform_time(x))内容初步处理pattern=re.compile('\[em\](.*?)\[/em\]')df['content']=df.content.str.replace(pattern,'')df.head()03数据可视化分析Next下面我们使用数据可视化库pyecharts进行数据可视化分析,词云工具使用stylecloud库。导入库frompyecharts.chartsimportPie,Bar,Map,Line,WordCloud,Pagefrompyechartsimportoptionsasoptsfrompyecharts.globalsimportSymbolTypeimportstylecloud五月天QQ音乐评论日期趋势图日期数量df['comment_time']=pd.to_datetime(df['comment_time'])day_num=df.comment_time.astype('str').str.split(':').str[0].value_counts().sort_index()产生数据x1_line1=[i.split('2020-')[1]foriinday_num.index.values.tolist()]y1_line1=day_num.values.tolist()绘制面积图line1=Line(init_opts=opts.InitOpts(width='1350px',height='750px'))line1.add_xaxis(x1_line1)line1.add_yaxis('',y1_line1,markpoint_opts=opts.markpointopts(data=[opts.markpointItem(type_='max'max',name='max',name=''''最最''),opts。MarkPointItem(type_='min',name='最小值')]))line1.set_global_opts(title_opts=opts.TitleOpts('五月天QQ音乐评论日期趋势图'),xaxis_opts=opts.AxisOpts(axislabel.elts=optsrotate='90')),visualmap_操作ts=opts.VisualMapOpts(max_=2000))line1.set_series_opts(label_opts=opts.LabelOpts(is_show=False),统计音乐里的歌手,评论QQ.render)linestyle_opts=opts.LineStyleOpts(width=3)axin=df.content.str.contains('阿信|陈新红').sum()guaishou=df.content.str.contains('温尚仪|阿一|怪物|头').sum()shitou=df.content.str.contains('石头晋航|石头').sum()masha=df.content.str.contains('蔡胜妍|玛莎').sum()guanyou=df.content.str.contains('刘冠佑|冠佑|刘彦明|刘昊铭').sum()actor_list=['阿信','怪物','石头','玛莎','冠佑']actor_num=[int(axin),int(怪手),int(shitou),int(masha),int(guanyou)]条形图bar1=Bar(init_opts=opts.InitOpts(width='1350px',height='750px'))bar1.add_xaxis(actor_list)bar1.add_yaxis('',actor_num)bar1.set_global_opts(title_opts=opts.TitleOpts(title='QQ乐评关注歌手对比'),visualmap_opts=opts.VisualMapOpts(max_=150),.render)(bar)关注歌曲cQQ音乐评论中比较歌名music_list=['一个苹果','盛夏光年','孙悟空','星空','我《不想丢下你一个人》、《派对动物》、《离开地球》、《突然好想你》、《爱的模样》、《爱ing》、《知足》、《诺亚方舟》','Stubbornness']music_num=[int(df.content.str.contains(pattern).sum())forpatterninmusic_list]createdfdf_music=pd.DataFrame({'music_name':music_list,'music_num':music_num}).sort_values('music_num',ascending=True)barbar2=Bar(init_opts=opts.InitOpts(width='1350px',height='750px'))bar2.add_xaxis(df_music.music_name.values.tolist())bar2。add_yaxis('',df_music.music_num.values.tolist())bar2.set_global_opts(title_opts=opts.TitleOpts(title='QQ音乐评论跟歌比较'),visualmap_opts=opts.VisualMapOpts(max_=307),bar2.set_series_opts(label_opts=opts.LabelOpts(position='right'))bar2.reversal_axis()bar2.render()QQ评论整体词云图stylecloud.gen_stylecloud(text=''.join(text_all),#文字需要为strtypemax_words=1000,collocations=False,font_path=r'C:\Windows\Fonts\msyh,tc'ICON_NAME='FASFA-COMMENTS',有关信息,请访问:https://www.cda.cn/?seo(2)(2)在数据领域中了解更多有关高质量课程的信息: