当前位置: 首页 > 后端技术 > Python

东京奥运会能否如期举行?用数据带你看120年奥运变迁史

时间:2023-03-25 21:14:46 Python

CDA数据分析师出品:振大、MikaData:振大与此同时,多项国际体育赛事停摆。3月24日,东京奥组委宣布,2020年东京夏季奥运会延期至2021年夏季举行。随着国内疫情逐步得到有效控制,我们的生活步入正轨,但全球疫情形势严峻还是很严重。8月以来,日本第二波疫情来势汹汹,单日新增确诊病例数持续创历史新高。11月18日,单日新增确诊病例已达2201例。这也让原本延期一年的2020年东京奥运会再次笼罩在一层不确定性之中。不禁让人疑惑,延期一年的东京奥运会还能顺利举行吗?那么奥运会这个世界上最具影响力的体育赛事背后有哪些有趣的数据。奥运会参赛国家和项目数量有何变化?各国累计奖牌排名是多少?参赛运动员的年龄和身高特点如何?今天我们就带大家用数据好好看看。奥运会起源于2000多年前的古希腊,以奥林匹亚的举办城市命名。它还举办了1896年第一届奥运会和1924年第一届冬季奥运会,是世界上最具影响力的体育赛事。_01_DataUnderstanding我们拿了一个关于现代奥运会的历史数据集,包括从1896年雅典到2016年里约奥运会的所有奥运会。数据集取自网站:www.sports-reference.com需要注意的是,冬奥会和夏季奥运会从1994年开始独立,每两年举办一次。1992年冬奥会是最后一届与夏季奥运会同年举办的冬奥会。奥运会。自1924年首届以来,截至2018年共举办23届,每四年一届。athlete_events.csv文件包含271116行和15列。每行对应一名参加单独奥林匹克赛事(运动员赛事)的运动员。列为:ID-运动员身份证号码姓名-运动员姓名Sex-性别Age-年龄Height-身高(cm)Weight-体重(kg)Team-队名NOC-NOCCodeGames-YearandSeasonYear-YearSeason-SeasonCity-HostCitySport-SportsEvent-EventMedal-Awards(Gold,Silver,BronzeorNone)_02_Inputdata首先导入包和数据。#导入库importnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportseabornassnsimportplotlyaspyimportplotly.graph_objsasgoimportplotly.expressaspximportplotly.figure_factoryas=tplotmakesubplotsubplotlypy.offline.plot#读取数据df_athlete=pd.read_csv('./archive/athlete_events.csv')df_regions=pd.read_csv('./archive/noc_regions.csv')df_athlete.head()df_athlete.info()RangeIndex:271116entries,0to271115Datacolumns(total15columns):#ColumnNon-NullCountDtype---------------------------------0ID271116非无效INT641名称271116非零对象2性别271116非零件对象3年龄261642非零float644高度210945非零float645重量208241非空float646团队271116非空对象7NOC271116非空对象8游戏271116非空对象9年271116非无效INT6410季271116非无效对象11City271116非零件对象12Sport271116非零对象13事件271116非零件对象14奖牌39783非无孔对象dtypes:float64(float64)),object(10)memoryusage:31.0+MBdf_regions.head()_03_数据预处理这里对数据进行如下处理,方便后续分析:两个数据集水平合并为一个数据集,Key为NOC列Sex:数据值替换Medal:空值填充#合并数据df_all=pd.merge(df_athlete,df_regions,how='left',on='NOC')#处理Sex列df_all['Sex']=df_all['Sex'].map({'M':'Male','F':'Female'})#ProcessMedalcolumndf_all['Medal'].fillna('NoMedal',inplace=True)df_all.head()_04_数据可视化我们利用处理后的数据做数据可视化分析,结果如下:1.奥运会整体数据。参与国家的数量。总体而言,参赛国家呈上升趋势,但有两届奥运会出现异常下滑。是:1976年蒙特利尔奥运会:规模空前的反种族主义行动。本届奥运会遭到非洲国家抵制,规模远小于上届。1980年莫斯科奥运会:为表达对苏联入侵阿富汗的谴责和愤怒,美国带头拒绝参加1980年莫斯科奥运会,并号召其他国家抵制。在美国的号召下,最终共有65个国家抵制了莫斯科奥运会,占当时参赛国家数量的五分之二。最终参加莫斯科奥运会的只有80个国家,约有5000人参加。从比赛项目数量的变化可以看出,奥运会比赛项目呈现波浪式上升趋势。1980年至2000年的20年间,竞赛项目增长趋势最大,尤其是夏季奥运会,但2000年以后竞赛项目有所增加。渐渐稳定了下来。各国累计奖牌数TOP20我们选取了各项目奖牌数前20名的国家。通过对比,我们发现美国在金牌、银牌和铜牌上遥遥领先,其次是俄罗斯和德国。由于缺席多届奥运会,我国累计奖牌数排名靠后。2参加奥运会的运动员人数从图中可以看出每届的参赛人数。夏季奥运会参赛人数最多的是2000年悉尼奥运会,参赛人数为13821人;冬季奥运会参赛人数最多的是2014年,参赛人数为4891人。夏季奥运会的参赛人数远高于冬奥会,这可能是比赛人数少的原因。同时,奥运会在第一次世界大战和第二次世界大战期间没有举行。男女运动员人数和比例的变化(男女人数的变化)(男女比例的变化)纵观奥运会的历史,虽然奥运会开始时,男女运动员的比例男女运动员的比例比较不同,男运动员的比例一直高于女运动员。但是,我们可以看到,随着奥运会的发展,女运动员的比例一直在增加。目前,参加奥运会的男女运动员比例几乎为1:1。从参赛运动员的年龄分布和奖牌数来看,年龄分布呈右偏分布,80%集中在19-33岁之间,25岁左右是运动员的黄金年龄。纵观奥运会历史,最年轻的运动员只有10岁。1896年,第一届现代奥林匹克运动会在希腊举行。年仅10岁零218天的东道主体操运动员迪米特里奥斯·朗德拉斯参赛,获得铜牌。1928年阿姆斯特丹夏季奥运会,一位97岁的美国“运动员”参加了“体育”复刻,但没有获得名次。这个记录应该永远不会被打破。参赛运动员的身高体重分布(heightchange)(weightchange)我们筛选了1960年以后的数据,发现参赛选手中男性身高分布在127cm-226cm之间,女性身高分布在127cm-213cm之间,男性体重分布在127cm-226cm之间。女性体重分布在37kg-226kg之间,女性体重分布在25kg-167kg之间。结语受新冠疫情影响,日本东京奥运会成为现代奥林匹克运动史上第一届延期举办的奥运会。这次延期的影响无疑是巨大的。据多家日本媒体报道,东京奥运会延期造成的直接经济损失约为60亿美元。活动场地和酒店的费用、人工费等各种额外费用,都会让主办方的后续准备工作捉襟见肘。总之,希望明年全球疫情好转吧。。。参考:http://rstudio-pubs-static.s3...维基百科奥运https://zh.wikipedia.org/wiki...。