CDA数据分析师作者:泽龙、米卡数据:振达后期:泽龙【导读】CBA重启,辽宁为何从争冠球队变成豪门球队?是侄子铿叔,还是变身综艺的亚洲第一控卫?本期,我们用综合数据来证明,是谁杀死了辽宁队!Python技术分析请看第六部分。用数据给我看,用数据说话今天我们就来说说作为国内第一个重启职业体育的联赛的CBA辽宁队。亲临现场,作为中国篮球圈的女婿,钟总为CBA的重启着实操碎了心。CBA复赛重启的结果也很不错,堪称榜样。这一期,我们就来说说辽宁队。用数据解读争冠球队如何成为豪门球队?文章要点:辽宁队输赢得分不同,投篮命中率不同。球员的平均上场时间。辽宁队输赢。辽宁队赛季初顺风顺水,但复赛重启后,辽宁队的战绩惨不忍睹。在连续输给北京、广州、浙江之后,郭士强成了背锅的人,黯然下课。真是大侄子坑老舅子,一个甘战一个甘受苦。随后,辽宁在虐完两支弱队后,又遇到了一支强队,输掉了比赛。真的很难想象,这是一支争冠的球队。这次我们结合数据,聊一聊辽宁怎么变成这样谁该背锅?赛季初的辽宁队,算是一支顶级球队。我们先看看开场的辽宁队。胜场得分都在100分以上,负场也几乎是100分以上,证明了辽宁队进攻没有问题。那时候,有一个像弟弟一样的CBA詹姆斯。一个人可以解决很多问题。辽宁那时候真的很强。复赛后辽宁队的比分下降到什么程度呢?焦头烂额的比赛分数才刚到100,被虐的比赛分数都在垃圾时间,整体效率下降太多了。02射速不稳定。郭士强下课再看整体命中率。我们统计了场次胜负,拉线图显示:全场胜场命中率曲线所有场负场命中率曲线罚球数据一方面,复赛后各队均有所下滑,这可以理解,毕竟他们已经很久没有玩过游戏了。三分球辽宁队的数据实在是惨不忍睹,尤其是复赛后输掉的几场比赛,命中率只有30%多,与广东、新疆等目标球队相去甚远。复赛之后,对阵浙江的比赛两分球命中率跌破50%,这在之前是匪夷所思的。这也是郭士强被下课的主要原因。两分球命中率低只能说明训练不到位,或者场上球员太累了。大家一直在批评辽宁队的轮换,所以我们也分析了球员的上场时间,做了一个饼图。03精彩的4+2轮换只要主力不疲惫就打不出来。这是球员本赛季所有比赛的出场时间图:不同球员的平均出场时间,不包括外援。郭艾伦、赵继伟、韩德君、李晓旭、刘志轩、何天举构成主力轮换,看来这还是符合CBA球队常规轮换的。复赛后,李晓旭受伤,刘志轩神志不清,贺天举有恢复迹象,但远不能为球队分忧,因为防守实在是太糟糕了。于是只剩下郭艾伦、韩德君、赵继伟,外加1名外援,组成了精彩的4人主力+2人轮换阵容。然后是成为亚洲第一后卫的孙铭徽。那场比赛,孙铭徽打了40.3分钟,郭艾伦打了46.8分钟。从以上数据来看,轮换是复赛后辽宁队最大的问题,郭士强因此下课也在情理之中。可我们不明白,外教比郭士强还狠。辽宁队真的烂了?郭艾伦打全场的操作是什么?即便是郭艾伦的球队,也不是每场比赛都能打好。04没有超强得分能力的保障,失误太多,赢球是不可能的。在分析辽宁转型的同时,我们也发现了此前球队的一些隐患,分享给大家。这是辽宁队每场比赛的失误数:所有比赛-胜场和失误曲线所有比赛-输球和失误小视频很多,输出很疯狂。几场比赛下来,队伍里就没有人了。在看到数据之前,我认为辽宁队场均失误应该很少。这张图颠覆了我的认知。如果不看队名,我还以为是只攻不守的福建队。团队应有的数据表现。05没有外援,谁来分担得分压力?再看看外援和国内球员的场均得分:外援-国内球员场均得分的比例在CBA很常见。外援占据了球队一半的投篮权,剩下的一半是国内球员的。也证明弟弟在辽宁。团队真的很重要。郭艾伦单核带队真的很难。这并不是说韩德君不是核心。在CBA的FIBA规则下,想要在内线带队真的是太难了。这也说明了复赛后辽宁的问题。它失去了2名外援。即使新外援梅奥和弟弟表现平平,国内球员的得分也没有增加。之前进了的还是进了,没出场之前没上场的。这是近20分的失利,与CBA复赛后国内球员的积极表现形成鲜明对比。06用Python带你分析辽宁队的比赛数据。我们使用Python在搜狐体育CBA数据中心获取并分析了辽宁队的比赛和技术数据。读取数据集。`#?导入包import?numpy?as?np?import?pandas?as?pd?import?matplotlib.pyplot?as?plt?import?re?from?pyecharts.charts?import?Bar,?Line,?Pie,?Pagefrom?pyecharts?import?options?as?opts?from?pyecharts.globals?import?SymbolType,?WarningTypeWarningType.ShowWarning?=?Falseimport?warningswarnings.filterwarnings('ignore')`摘要数据包含2019-11-01到2020-07-02的战斗摘要数据,共37场,数据格式如下:`#摘要数据df_all=pd.read_excel('../data/辽宁战役总结.xlsx')df_all.head()`技术数据包含每场比赛球员的详细技术数据,数据预览如下:`#技术数据df_skill=pd.read_excel('../data/详细技术资料-修改版.xlsx')df_skill.head()`2.数据预处理在这里清洗初始数据。`#Loopdf_skill2=pd.DataFrame()foriindf_skill['fieldorder'].drop_duplicates():#前五行填1df_sel=df_skill[df_skill['fieldorder']==i]df_sel.iloc[:5,0]=1#后面填0df_sel.iloc[5:-1,0]=0#Appenddf_skill2=df_skill2.append(df_sel,ignore_index=True)df_skill2['first']=df_skill2['first'].replace('total',np.nan)df_skill2.head()`3.数据可视化这里我们分析一下:主力球员胜/负比赛数据(篮板/助攻/失误)球员上场比例time2020年6月之前比赛的得分曲线外援/国内球员的平均得分曲线郭艾伦/其他球员的平均得分曲线分析代码:3.1球员上场时间占比`#删除空值df_time=df_skill2.dropna(axis=0)df_time.head()计算时间time_num=round(df_time.groupby('player')['playingtime'].mean())time_num=time_num.sort_values(ascending=False)time_num``球员梅奥40.0郭艾伦35.0兰斯-史蒂芬森35.0赵继伟33.0韩德君32.0布兰登-32.0高24.0李晓旭24.0李晓旭24.0刘志轩22.0贺天举17.0贺天举15.0wanghuadong11.0GuoXu9.0LiuYanyu7.0Yanyu7.0YanShouqi5.0MaZhuang2.0name:dtype:dtype:floatats:floatat664'dapair=[zppair=[zppair=[)对于zinzip(time_num.index.tolist(),time_num.values.tolist())]`#绘制饼图pie1=Pie(init_opts=opts.InitOpts(width='1350px',height='750px'))pie1.add('',data_pair,radius=['35%','60%'])pie1.set_global_opts(title_opts=opts.TitleOpts(title='不同玩家的平均上场时间'),legend_opts=opts.LegendOpts(is_show=False,orient='vertical',pos_top='15%',pos_left='2%'))pie1.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}:{c}min"))pie1.render()`3.2外援/国内球员平均得分曲线`#合并数据df_neiwai=pd.merge(df_skill2,df_all[['fieldorder','winner']])deletecolumndf_neiwai.dropna(inplace=True)添加外援/国内球员标签deftansform_label(x):ifx=='Mayo'orx=='BrandonBass'orx=='LanceStephenson':return'foreignaid'else:return'国内球员'df_neiwai['label1']=df_neiwai.player.apply(tansform_label)df_neiwai.head()``#groupsummarydefen=df_neiwai.groupby(['fieldsequence','label1'])['Score'].mean().reset_index()defen['score']=round(defen['score'])生成数据x_line1=defen[defen['label1']=='国内球员']['场序'].astype('str').tolist()y_line1=defen[defen['label1']=='国内球员']['score'].tolist()y_line2=defen[defen['label1']=='外援']['score'].tolist()``line9=Line(init_opts=opts.InitOpts(width='1350px',height='750px'))line9.add_xaxis(x_line1)line9.add_yaxis('国内玩家',y_line1,markpoint_opts=opts.MarkPointOpts(data=[opts.MarkPointItem(type_='max',name='最大值'),opts.MarkPointItem(type_='min',name='最小值')]))line9.add_yaxis('外援',y_line2,opts=markpoint_opts.MarkPointOpts(data=[opts.MarkPointItem(type_='max',name='最大值'),opts.MarkPointItem(type_='min',name='最小值')itleobal]))line_opts_glts(=opts.TitleOpts(title='国外选手与国内选手平均分对比'))line9.set_series_opts(label_opts=opts.LabelOpts(is_show=True),linestyle_opts=opts.LineStyleOpts(width=3)render)(9)3.3所有游戏的得分图`#定义函数defdraw_line(xaxis_data,y_axis,title_label,series_name='',min_num=None,label_color=None,line_color=None,formatter=None):line=Line(init_opts=opts.InitOpts(width='1350px',height='750px'))line.add_xaxis(xaxis_data)line.add_yaxis(series_name,y_axis,markpoint_opts=opts.markPointOpts(data=[opts.markPointItem(type_='max',name='最最大'),opts.markPointItem(type_='min',name',name='''最值')))line.set_global_opts(title_opts=opts.titleopts(title=title_label),yaxis_opts=opts.axisopts(min_=min_num)line.set_series_series_opts(label_opts=opts.labelololololololopts=trual=true_se_show=iss_show=isssss(is_show=isssss(is_show=issss)formatter=formatter),linestyle_opts=opts.linestyleopts(width=3,color=line_color))返回行`##产生x_line1=df_all[df_all[df_all['胜负''']=='].astype('str').tolist()y_line1=df_all[df_all['胜负']=='胜']['得分'].tolist()x_line2=df_all[df_all['win']=='lose']['fieldorder'].astype('str').tolist()y_line2=df_all[df_all['win']=='lose']['Score'].tolist()``#绘制line1=draw_line(xaxis_data=x_line1,y_axis=y_line1,title_label='所有比赛获胜得分曲线',min_num=80,label_color=None,line_color=None)line2=draw_line(xaxis_data=x_line2,y_axis=y_line2,title_label='所有游戏-输赢曲线',min_num=80,label_color='blue',line_color='#3B7BA9')page1=Page()page1.add(line1,line2)page1.render()`结语辽宁队本赛季能走多远,能否闯过季后赛首轮,完全取决于李晓旭回归后的表现。需要弥补失分和篮板球,也让韩德君得到休息,但治本之道还是要培养新人。辽宁培养了那么多优秀人才,人才缺口不应该出现。我希望俱乐部能够使用更多的新球员。是时候了。
