概括
当我想到那年的软件系统时,开源社区不像现在那样好。几年的东西。
主要内容:Excel Office自动化和数据分析
适用的人群:对数据分析工作感兴趣的办公室工作人员 / Python初学者 /人员
准备内容:Anaconda-Spyder;RE,Pandas图书馆
数据处理
这些单词是家,最后一个介绍了数据爬网的使用来获取以前的奥运会的奖牌数据
观察这些数据,首先列出需要改进的点:
str.replace(常规/字符串,更换目标字符)
参数描述:
当金牌,银和铜牌是空的时,我们可以删除线条并使用dropna(阈值= 1)至少保留1个非空数据以保留。确定每行只要有一个数据保留一个数据
当我们进行数据处理时,最重要的是学习找到规则,并使用最简单的方法来实现我们想要实现的效果。例如,我们看到的问题是删除中文的所有奖牌。我们可以在这些行的同一排名中观察到所有的排名是“排名”
1)我们的条件是:非数字线,第一次筛选[' - lanking']列中的非数字线
2)发现了很多列数据的重复。
3)最终删除包含列的数据
完整的代码如下:
输出结果:
结论
通过我们的一系列上帝的操作,看到处理后的数据令人耳目一新。在本文中,Ofter添加了有关数据处理的几个知识点。我相信我们对数据处理有更深入的了解。我今天将在这里写。我希望初学者能够很好地体验思维,并将复杂的问题分为步骤,以便稍作积累可以成功地使项目成功。在编写Python程序之前,首先想到下一步,然后根据步骤一一完成一台步骤。该系列动态排序中剩下的最后一篇文章正在向您招手。请期待它。
1.数据收集曲折;
Bertram Xu:1896-2021奥运会的动态分类动画(Python Data Collection)1同意·0评论文章
2.数据处理数据清洁;(本文)
3.数据动态排序。
原始:https://juejin.cn/post/70966732984112095