当前位置: 首页 > 后端技术 > Python

Python"大"数据分析——《庆余年》为啥这么火?

时间:2023-03-25 20:18:02 Python

Python“大”数据分析——《庆余年》为何如此火爆?作者|君鑫源|AI篮球与生活年末上映的古装剧《庆余年》可谓是赚足了眼球。它声称已投资7亿元。张若昀、李沁主演,新锐肖战相伴。刚播出不久,就圈粉无数。这个话题在微博上的讨论量和阅读量都达到了亿级(当然会有喷子的成分),一集就能上微博热搜。截至目前,已有15万人参与评分严格的豆瓣评分,评分一直维持在7.9分左右。各大视频网站也想趁着这波热度从观众身上发一笔横财,特意推出了“超前点播”,引得网友和多家媒体吐槽不断,全剧流出日前掀起一波高潮,一些主流视频网站和版权方也损失惨重。当然,我们整个社会都需要加大打击盗版等违法行为的力度,但“超前点播”这种不雅观的行为,是不值得提倡的!!总之,今天小编从豆瓣上抓取了庆祝一周年的相关信息,用“大数据”(其实不大,还是有点小)帮大家分析一下为什么观众喜欢看这部剧,比如谁是看过这部剧的观众,看完之后是怎么评价的。01数据的获取首先是关于数据的获取。获取豆瓣上的数据,首先需要登录自己的豆瓣账号和密码,获取cookie,然后跳转到《庆余年》相关的页面,就这样,然后我们使用起来还是挺简单的请求库发送请求获取我们想要的数据。这次小编爬取了已经看过和正在看的观众的相关信息,以及评论的具体内容。登录豆瓣页面,获取cookies,爬取评论内容02数据分析与挖掘爬取数据后,接下来就是简单的数据清洗与分析,以及数据可视化。有许多使用Python进行数据可视化的工具。目前比较轻量好用的库是pyecharts。这里,小编就不赘述了。下面看一下pyecharts对得到的数据的可视化结果。1、《庆余年》在豆瓣的综合评分维持在7.9分左右,不低,15万人参与评分。从评分分布来看,4星的评分居多,占总评分的48.7%,其次是5星,占总评分的36.5%,其余为3星及以下,占总评分的14.8%。总数,这已经是一个相当低的比率。2.省市差异首先用柱状图粗略展示了看剧热度最高的前十个城市,如下图所示,但是柱状图的呈现并不总是那么直观易懂,所以小编也用地图的形式给大家看看该剧的主要观众分布在哪些区域,可见在长三角和珠三角都有大量的爱剧粉丝三角洲。3.评论分析在对评论内容进行梳理分析后,小编首先对包括剧中人物在内的评论进行了分类,并通过直方图的方式呈现出来。从直方图中我们可以看出,范闲和庆帝是被提及次数最多的两个人物,其次是林婉儿和长公主(毕竟皮肤这么好,怎么看都像是四十多岁的女人?).由于张若昀在剧中的人气如此之高,所以小编对范闲的评论进行了进一步的挖掘,并利用词云库绘制了词云图。从词云分析来看,“剧情”、“搞笑”、“演技”、“原创”等词格外引人注目。确实,这部剧不仅剧情有趣,而且每个演员的演技都相当在线。该剧不仅拥有张若昀、李沁、肖战等年轻演员,还有一大批演技精湛的老牌演员,其中7位是国家一级演员,(《一级演员”是文艺界设立的专业技术职称,是国家演员的最高专业职称,享受国务院特殊津贴。很荣幸被授予全国首创演员称号。级演员)。剧情精彩但不拖沓,主演不尴尬,人物设定完美,剧中的台词时不时会吐出各种金句和表情包。而《庆余年》第二季也即将开拍,喜欢该剧的观众和粉丝们可以期待一下啦!