当前位置: 首页 > 后端技术 > Python

《演员请就位2》的45万弹幕,看看大家在吐槽什么

时间:2023-03-26 11:09:22 Python

CDA数据分析师出品:米卡数据:振达后期:米卡【攻略】给我看数据,今天聊聊《演员请就位2》点击快戳下方视频先睹为快吧:在最近上映的华语电视剧中,最受欢迎的一定是《演员请就位》。从第一季开始,这档综艺就话题不断,金句频出。过去有李成儒老师的“如坐针毡,如芒刺在背,如喉咙疙瘩”;好无聊》一度刷爆网络。《演员请就位2》导师方面,除了上一季的陈凯歌、赵薇、郭敬明,还有本季加入的导演尔冬升,阵容很有意思。在参与方面演员中,也有大家耳熟能详的吴杏儿、黄奕、娄艺潇等人。《演员2》一开播,就掀起了不少热议。无论是李诚儒老师犀利的点评,导演尔冬升,郭敬明给演技新人何昌熙的S卡,都能引起很多讨论。今天我们用Python分析了《演员2》的视频弹幕,看看大家在吐槽什么。01豆瓣6.5分《演员2》为何不尽如人意?《演员请就位》至今已播出两季,第一季豆瓣评分6.8,超过4万人评分。目前正在播出的第二季,超过19,000人评分对其进行了评分,评分为6.5分,比上赛季下降了0.3分。评分比例我们使用Python分析了豆瓣上的500条热评数据。从评分分布可以看出:在评分比例上,37%的人给了1星,20.8%的人给了2星。只有5%的人给出5星评价。豆瓣短评那么短评都在说些什么呢?从评价词云图可以看出,话题主要集中在郭敬明、尔冬升、陈凯歌、李诚儒身上。这也是《演员2》被诟病的一点。客串导师比参演演员更出圈、更有话题度。此外,“节目”、“演技”、“评论”也经常出现在短评中。导演提到的几位客座导师中,提到次数最多的是谁?进一步分析,郭敬明的话题度最高,其次是尔冬升和陈凯歌。导演评价导演和主持人嘉宾的评价也很有意思。对郭敬明的负面评价达到60.66%,过半,好评仅为14.22%。这与尔冬升的评价大相径庭。后者的负面评价仅为28.83%,好评也最高,达到29.73%。有意思的是,作为主持人的大鹏,负面评价比郭敬明还高,达到了67.27%。02分析45万条弹幕数据,看看大家在吐槽什么。我们使用Python获取并分析了《演员请就位2》的腾讯弹幕数据,分析了当前播出的前五集。弹幕数据采集数据读取与数据预处理数据可视化1.1数据读取首先导入需要的库。#导入库导入OS导入jiebaimportnumpy作为npimportpandas作为pyechartss。#用于在jupyterlab中显示这张图使用pandas循环读取数据。#读入数据data_list=os.listdir('../data/')df_all=pd.DataFrame()foriindata_list:#print(i)df_one=pd.read_csv(f'../data/{i}',engine='python',encoding='utf-8',index_col=0)df_all=df_all.append(df_one,ignore_index=False)df_all.info()Int64Index:449762个条目,0到44317个数据列(共7列):#列非空计数Dtype------------------------0插曲449762非无效对象1comment_id449762non-nullint642Oper_name183066非零件对象3VIP_DEGERE449762非无孔INT644内容449762非零件449762non-nullInt_point449762NON-NULLINT646NON-NUPNOUP_COUNT444449762pTES:int64(4),object(3)memoryusage:27.5+MB共获得了前五期449762条弹幕数据。字段主要包括:议题数、评论id、用户名、vip等级、评论内容、评论时间点、点赞数。数据预览如下:df_all.head()1.2数据预处理#删除弹幕角色df_all['content']=df_all['content'].str.replace('(.*?:)','')df_all.head()1.3数据可视化弹幕趋势图先看视频弹幕趋势图,从数量上可以看出弹幕排名前三的分别是:第一期、第三期、第五期。不过第一期和第五期下面的弹幕比较少。df_epinum=df_all['episodes'].value_counts().reset_index()df_epinum['num']=[1,5,3,7,6,8,4,9,2,10]df_epinum=df_epinum.sort_values('num')df_epinumx_data=df_epinum['index'].tolist()y_data=df_epinum['episodes'].tolist()#条形图bar1=Bar(init_opts=opts.InitOpts(width='1350px',height='750px'))bar1.add_xaxis(xaxis_data=x_data)bar1.add_yaxis('',y_axis=y_data)bar1.set_global_opts(title_opts=opts.TitleOpts(title='前五弹幕数量趋势图periods'),visualmap_opts=opts.VisualMapOpts(max_=60000,is_show=False))bar1.render()人物弹幕词云我们接着看到了几个导演和导师的弹幕词云。