本系列中学习笔记的参考书:“数据分析战斗” Tomaz Dabat将与所有人分享您的笔记以学习本书,并将其开放为一系列“从头开始的数据分析”。
1.创建一个虚拟的Python操作环境,该环境专门用于本系列学习;
2.数据分析通用模块熊猫安装
3.使用熊猫模块读取和编写CSV格式文件
1.我通常更喜欢Pycharm来创建虚拟环境,因此本系列打算将其完全与Pycharm一起制作。Pycharm安装可以直接在官方网站上下载以使用社区版本。
[注意]我以前很喜欢Pycharm,现在我更喜欢VS代码。您也可以使用Jupyter笔记本。
#Windows/Mac安装,使用Python环境 +Justter Notebook
(1)良好的官方开始,打开Pycharm,单击File->新项目,然后查看下图。
特殊说明:不要出现在Python的项目路径中,也不出现在项目名称中。该名称应尽可能小,以总结项目的内容。
(2)创建成功后,我们将在相应的目录下找到更多项目文件和虚拟环境文件。
2.数据分析常用模块pandas安装(1)零基本教程,首先教您如何输入虚拟环境:输入目录i:pycodingframedata_analysiscripts(我的虚拟环境目录),按住Shift+鼠标按钮,打开PowerShell或CMD(如果是如果是IspowerShell首先进入CMD),然后输入激活以输入虚拟环境。您会发现路径正面有一个虚拟环境名称,表明您已输入虚拟环境。查看以下内容:
我不知道每个人是否感到非常麻烦。我感到特别麻烦。每次输入虚拟环境时,我都必须首先转到指定的文件路径,然后输入指令,而不符合程序员的样式!
[注意]我曾经将VirtualenvWrapper用于虚拟环境管理。现在,我更喜欢将Pipenv用于虚拟环境管理。
(2)安装熊猫模块
使用快捷方式进入虚拟环境后,直接说明
安装结果:
安装过程约为1分钟,完成后将显示
可以清楚地看出,此过程不仅安装了熊猫袋,还安装了其他软件包,例如numpy,pytz,六,python-dateutil,我们稍后还将使用它。
3.使用PANDAS模块读取和编写CSV格式文件(1)下载数据文件。单击此处下载。我还将自己构建一个代码仓库以记录我的学习过程。您可以首先从这里下载数据文件。
(2)基本上引入了熊猫,以提供Python编程语言的高性能。它是基于Numpy的简单使用数据结构和数据分析工具。它为我们提供了高性能的高级数据结构(例如:DataFrame)和高度运行的大型操作。数据集所需的工具还提供了大量的功能和方法,这些功能和方法可以快速,方便地处理数据。
(3)使用大熊猫读取CSV文件以读取代码:
操作结果:
功能分析:
read_csv(filepath_or_buffer,SEP,标题,名称,skiprows,na_values,编码,nrows)以指定格式读取CSV文件。
常见参数分析:
(4)使用大熊猫编写CSV文件来编写CSV文件:
操作结果:
功能分析:
to_csv(path_or_buf,sep,na_rep,列,标题,索引)
坚持和努力:最终获得。
这个想法非常复杂,
意识非常有趣,
只要你不放弃,
最后,有著名的日子。
- “旧手表石油诗”
看到下一期,我是猫爱技术的旧手表。