当前位置: 首页 > 后端技术 > Python

Python数据分析-《隐秘的角落》自开播以来一直没有上过热搜?

时间:2023-03-26 14:02:47 Python

没办法没办法没看过的朋友没有《隐秘的角落》,如果不断网,最近的朋友圈、微博等应该都被这部只有12部的国产网剧给刷爆了剧集屏幕关闭。开播之初,豆瓣评分就已经达到了9.0,甚至一度飙升至9.2。要知道国产电视剧能拿到9分的少之又少,更何况还是一部网剧。也许大多数人都没有机会接触到这个剧本,但他们选择了观看。剧的契机也是这个超高分。经过朋友圈和微博的强力安利,在高收视率的诱惑下,我和家人一天看完了这部剧。看完这部剧,我主要有两个感受:全员演技在线,还不错~真的很好,细节到我平时看的电视剧不多,国产剧就更少了。最大的感受就是有些演技真的是太撩人了。一集电视剧四十、五十分钟,快进三十分钟?这部剧没有所谓的从年轻演员到专业演员的流量。至少大家的演技都在线。这也是我继续追剧的保证。如果说演技是追剧的保证,那么细节应该就是二刷的介绍了。追剧了,妹子还和我聊了一些小细节,比如录音笔的彩蛋,笛卡尔的梗,看剧的时候你可能会感叹演技真好,但值得回味的是剧中的细节和铺垫,这些可能会吸引你去二刷。每天靠着微博热搜继续生活。我发现从节目到结束都没有热搜。本文使用Python对每天上热搜的关键词进行可视化分析。问题是微博只有实时热搜。名单,以及我们想要得到的,就在这段时间之内。万能百度找了个“热搜神器”来满足需求,缺点是每次热搜可以抓取的相关信息很少。审核后发现该网页有几个特点:每个网页的URL都没有变化。网页内容以json形式存储。网页的请求方式是POSTForm形式。只有一个日期发生变化。中间日期的内容然后就可以控制每天的热搜内容了,那么爬虫的方法就很清楚了,requests+json足以应对,爬虫比较简单,只贴一小部分代码,文末给出了完整代码的获取方式。html=requests.post(url=url,headers=headers,data=form_data)content=html.content.decode("utf-8")datas=json.loads(content)因为我们的目的只是分析和《隐秘的角落》相关的热搜关键词,所以Duck不需要保留所有爬取的内容,可以通过一些独特的关键词进行过滤,比如节目名称、人物、热词等。典型代表是攀援茎。我设置的时间间隔是6.19-6.26,一共8天,最终爬取了87条与这部剧相关的热搜:通过观察爬取的数据,发现有一些重复的内容,具体原因不明,这里对数据进行去重:data.drop_duplicates(subset=None,keep='first',inplace=True)data=data.reset_index(drop=True)难免会有一些不相关的内容,而且样本数量不多,所以我们主观上确认了热搜关键词,然后删除了不相关的内容。经过处理,最后的数据集中还剩下64条数据,平均每天8条热搜。搜索量Top10让我们来看看这几天最热门的10个搜索:最热门的是爬藤。不知道用这个梗会不会在景区掀起一波人气!秦昊本人就占了前十的四位,再加上伊能静上了《姐姐》,他很快就会成为热搜特邀嘉宾。此前,秦昊主演的悬疑剧《无证之罪》也曾引起热议。编剧是该剧的原作者紫金陈,鼓掌。热搜人数的变化趋势我们来看看这段时间的热搜人数变化趋势:节目刚开始播出时,反响不是很大。后期热搜词不断增多,25日收官前一天迎来高峰期,一天热搜词19个。pyecharts绘制图形时,可以通过Line中的如下参数设置阴影区间:line.set_series_opts(markarea_opts=opts.MarkAreaOpts(data=[opts.MarkAreaItem(name="peakperiod",x=("2020-06-24","2020-06-26"))])热度趋势如何与热搜数量匹配?每日热度与热搜数量呈正相关关系,热搜越多,热度越高。25日全天热搜点击量超过2400万,大结局当天也有超过2100万的点击量,热度不小。我们都知道如果一个热搜词点击量多了,排名就高,排名就靠前,靠前会影响点击量越来越高,所以如果热搜次数和点击量是正相关的,那么可以推出,这些热搜大多排名都比较高。排名区间的变化是通过饼图的比例展示来验证一下上面的推论:62%的历史最高排名都进入了前十,84%的排名进入了前二十,所以大部分的排名与这部剧相关的热搜词相对第一,这也是热度高的一个很重要的原因。在统计关键词频次之前,我们是通过关键词来过滤相关词条的,那么哪些关键词的搜索次数最高呢?剧名的搜索次数为26次,占比最多,约40%,这应该是理所当然的。毕竟,一个节目如果比演员还受欢迎,那才是真正的好节目。显然比角色的人气还要尴尬。“朱朝阳”这个字被搜索了9次。我真的被这个人物设定震撼到了。我觉得其他人就像在玩朱朝阳一样。他是年级的第一个孩子,这没有什么损失。都说原著中的人物比剧中的要好。我什至无法想象。词云图最后贴一张带权重的词云图:可以看到出现频率高的关键词权重会更高,比较突出的是剧名、人物、演员和小百川记得小学时总会有班级在儿童节表演这歌舞。看完这个节目,真的是毁了,总是不自觉的哼起来。据说《隐秘的角落》是中国电视剧的曙光,但恐怕唯一的就是已经给了模型,很难跟上画面。中国影视业如果不改变“演员>导演>编剧”的关系链,真的很难翻身。毕竟,在艺术方面,编剧更合适,至少这部剧值得一看。没看过的小伙伴安利一下,个人觉得节奏太慢,习惯快节奏的小伙伴需要耐心等待。公众号【奶糖猫】后台回复“孩子们”获取源码和数据参考

猜你喜欢