简介:本文的首席执行官注释将介绍Python Computing DF的相关内容。我希望这对每个人都会有所帮助。让我们来看看。
获取以下方法获取以下方法的数量
lines = file.readlines()
打印Len(线)
如果您仅遍历文件,则可以使用以下方法:
f = open('file','r')
对于打开('file')中的行:
线= f.Readline()
在第3章中,当涉及矩阵矩阵和向量向量时,矩阵和向量只能包含某种数据类型,在实际应用中,这种情况相对较少。
当我们进行数据调查时,调查报告通常不太可能仅包含数值类型数据或字符数据,但包含各种数据类型(进行分析时需要编码目录数据。中间)。因此,我们需要一个新的容器类型-DATA框架。
有些人将数据框转换为数据框架。这种翻译是不准确的,尤其是“框架”的定义与数据框架的含义之间的差异。也有将其完全含义的人转化为数据框架。我觉得有些蛇足够了,并且使不难理解的事物变得复杂。
本章主要是关于:
实际上,这很简单。可以在一个示例中解释:中学期间教师统计的最终成绩单是DF。通常,Excel表包含以下内容:
在实际操作中,我们通常读取Excel表单或CSV文件,并将此文件分配给变量(DF或DATA)。可以通过可变名称执行文件的操作。应注意,DF的每一行代表不同的观察对象,每列代表属性或变量。在转录本中,每个学生都是一个观察到的个体,各种主题的等级代表不同的属性,这些属性用于描述观察对象的特征。
在下面,我将使用R语言数据集MTCARS(汽车趋势汽车道路测试)进行演示。
首先打开rstudio,将数据集加载到数据集()函数:
通过前五行数据,我们可以看到每行代表不同的汽车模型,列代表了每个汽车模型的不同特征,例如位移,马力,气缸号等。
在获得数据集后,我们需要了解其结构,例如每列中的列,列和数据类型的总数几行。在看DF的结构时,需要str()函数。
输出结果表明MTCAR的总共有32行(观测)和11列(变量)。
在$符号之后,有11个名称,总共11个,MTCAR中的所有数据类型都是数值的。
构建的数据集已较早使用,然后您可以使用data.frame()自己创建一个。填充括号中的不同矢量。这些向量必须包含相同数量的元素。
*创建DF时请注意R和Python的不同语法
以太阳系中的八个主要行星为例,我们建立了一个DF,包括行星的名称,类型(岩石行星或巨型巨星),地球直径的比率,地球的旋转周期以及是否有星形戒指(不仅土星,有土星,不仅有土星。
查看我们创建的DF,不难发现每个向量是DF中的每个列(在Python中也有相似的用法,也就是说,通过字典词典创建DF,请参见Python教程。)
与矩阵和矢量类似,我们可以选择DF的特定行和 /或列。使用介质支架以填充要在逗号左侧选择的行,并在右侧填充列。使用先前矩阵的元素重复使用,此处省略了。
这是另一种方法,仅选择一个具有一个列名称的特定列:
DF $颜色
输出的结果是一个可以使用class()函数来验证向量元素的类型的向量。
此外,如果我们想用星形戒指选择行星,我们可以使用以下操作:
可以看出,我们在“环形”列中筛选了所有真实行。
那么,您可以没有星形戒指的筛选行星吗?
该方法非常简单,只需在括号中添加一个即可!
*注意:由逻辑值组成的列通常用于筛选满足某些条件的行。如果没有逻辑值组成的列,我们可以通过逻辑运算符自己建立筛选标准。
现在,我们尝试找出地球是否有星形戒指。
与这两个结果相比,您可以发现太阳系中的岩石态行星没有星形戒指,并且巨型巨星具有星形戒指。行星的类型。当然,这只是一个假设。为了验证该假设甚至可以观察是否可以在银河系中建立宇宙,我们需要更多数据来测试假设。内容的这一部分需要更加统计,将在后面提及。
上一步是为我们的数据集创建一个子集,以滤除一些不需要的数据。
使用第二个ARG,我们可以根据“某些条件”进行选择。这里的条件涵盖了广泛的范围,并且不再限于逻辑值。
*注意:“单一等于数字”此处是指分配,'二等数字”表示逻辑判断
现在尝试使用数值数据作为筛选条件,选择直径比地球更大直径的行星:
使用order()函数进行排序:
*注意:默认情况下的减少是假的,也就是说,如果未填充此arg,则将按顺序排列order()函数
这不是很简单吗?
假设此DF是5行和3列
形状[0]参考
DF中的索引编号为0,因此第五行的数字为4
因此,您删除了4的索引,即删除最后一行。
在[36]中:列表(df ['state'])。索引('Ohio')out [36]:0in [37]:list(df ['state'])。]:1
结论:以上是首席CTO注释汇编的Python计算DF的全部内容。感谢您阅读本网站的内容。我希望这对您有帮助。有关多少行Python的更多信息,可以计算出有多少线DF拥有DF,却不忘记在此站点上找到它。