当前位置: 首页 > 网络应用技术

Python的视频游戏销售数据海洋视觉笔记

时间:2023-03-06 13:08:26 网络应用技术

  该注释是r:www.kaggle.com/umeshnarayanappa/explore-video-games-sales insim。笔记的目的是实现上面的R Notebook中创建的可视化,请使用Python和一些其他图,并添加一些图评论和解释,以帮助Seborn/Python初学者他们的数据可视化/自定义。我们通过玩不同的颜色来维持事物的乐趣。

  使用熊猫在数据集中读取。我们看到每个行条目都对应于特定的游戏。数据包括游戏的名称,已发布的年份以及某些分类特征,例如平台,类型和发行人。根据该区域的数据,我们看到游戏(线)条目还包括累积销售特定的游戏。

  .278.8910.221.0031.37检查最高年份。我们在2020年看到它,这是不可能的发布日期。

  通过错误年份查看条目目的的名称。我们可以在线搜索游戏的发布日期,并将当前值替换为正确的发布日期。

  59575959 Imagine:Makeup Artistds2020202020202020.27000.020.29游戏的数量(线)和以下游戏(线)的唯一发布者,平台和类型(行)的数量,以了解我们在数据浓度中的游戏如何清楚地分布。

  我们进行简单的空价值检查。我们可能会在Internet上搜索所有缺乏发布和发布者,但是现在我们只需要删除这些条目而没有所有数据。

  在下面,我们创建一个简单的列图表,以表示每年视频游戏的“全球销售”总数。我们通过数据获取数据 - 所有视频游戏销售数据,group“ Year”,然后致电.sum()获取每年的总数。这将根据我们的年份作为索引或行名以及年度总销售额创建数据rame。

  在数据集中,年度索引是浮点数的数量,例如“ 2006.0”而不是“ 2006”。我们通过使用这些值作为integer.在数据准备就绪时,我们只需通过这些值就可以通过X和Y变量符合我们的SebornBarart函数。我们还设置了X标签名称,标题,我们还旋转了Xticklabel并更改了其字体。

  在下面,我们创建了一个简单的列表,以表示每年发布的视频游戏总数,但有点扭曲。它是水平的,这意味着我们的年份通常是我们的x轴。“ global_sales”条目通常在y轴上计数,现在位于x轴上。

  下面我们创建了一个关键图片,每年的每个发布者的销售量都是最高的。全球销售在Y轴上,这一年在X轴上。我们使用切点图“色调”的参数代表最高发布者。

  我们使用支点,这使计算可以轻松计算“发布者”。发行商的名称是根据年销售额和“销售”(即每年发行商生成的全球销售)计算的。

  请注意,枢轴表接受要通过函数应用的参数,该参数具有其他选项,例如均值,中位数和模式。此入口点需要一个数据框架,然后您只需将名称添加到x,y和色调。我们还通过旋转和更改其尺寸来自定义我们的XTICK标签。

  下面,我们创建了游戏生成的全球销售,每年都会发挥最大的作用。我们还将以下数据返回以供参考。会让情节看起来困惑。

  该图的数据创建类似于上面的数据,不包括使用颜色代表数据中的类别。相反,我们使用颜色加值来传递我们想要的特定颜色面板的颜色编号。

  8202009WII Sports Resort33.0002010 Kinect Adventures!

  我是白色和白色,我喜欢分享知识??