当前位置: 首页 > 网络应用技术

多少行Python计算DF(2023年的最新饰面)

时间:2023-03-05 21:38:45 网络应用技术

  简介:本文的首席执行官注释将介绍Python Computing DF的相关内容。我希望这对每个人都会有所帮助。让我们来看看。

  获取以下方法获取以下方法的数量

  lines = file.readlines()

  打印Len(线)

  如果您仅遍历文件,则可以使用以下方法:

  f = open('file','r')

  对于打开('file')中的行:

  线= f.Readline()

  在第3章中,当涉及矩阵矩阵和向量向量时,矩阵和向量只能包含某种数据类型,在实际应用中,这种情况相对较少。

  当我们进行数据调查时,调查报告通常不太可能仅包含数值类型数据或字符数据,但包含各种数据类型(进行分析时需要编码目录数据。中间)。因此,我们需要一个新的容器类型-DATA框架。

  有些人将数据框转换为数据框架。这种翻译是不准确的,尤其是“框架”的定义与数据框架的含义之间的差异。也有将其完全含义的人转化为数据框架。我觉得有些蛇足够了,并且使不难理解的事物变得复杂。

  本章主要是关于:

  实际上,这很简单。可以在一个示例中解释:中学期间教师统计的最终成绩单是DF。通常,Excel表包含以下内容:

  在实际操作中,我们通常读取Excel表单或CSV文件,并将此文件分配给变量(DF或DATA)。可以通过可变名称执行文件的操作。应注意,DF的每一行代表不同的观察对象,每列代表属性或变量。在转录本中,每个学生都是一个观察到的个体,各种主题的等级代表不同的属性,这些属性用于描述观察对象的特征。

  在下面,我将使用R语言数据集MTCARS(汽车趋势汽车道路测试)进行演示。

  首先打开rstudio,将数据集加载到数据集()函数:

  通过前五行数据,我们可以看到每行代表不同的汽车模型,列代表了每个汽车模型的不同特征,例如位移,马力,气缸号等。

  在获得数据集后,我们需要了解其结构,例如每列中的列,列和数据类型的总数几行。在看DF的结构时,需要str()函数。

  输出结果表明MTCAR的总共有32行(观测)和11列(变量)。

  在$符号之后,有11个名称,总共11个,MTCAR中的所有数据类型都是数值的。

  构建的数据集已较早使用,然后您可以使用data.frame()自己创建一个。填充括号中的不同矢量。这些向量必须包含相同数量的元素。

  *创建DF时请注意R和Python的不同语法

  以太阳系中的八个主要行星为例,我们建立了一个DF,包括行星的名称,类型(岩石行星或巨型巨星),地球直径的比率,地球的旋转周期以及是否有星形戒指(不仅土星,有土星,不仅有土星。

  查看我们创建的DF,不难发现每个向量是DF中的每个列(在Python中也有相似的用法,也就是说,通过字典词典创建DF,请参见Python教程。)

  与矩阵和矢量类似,我们可以选择DF的特定行和 /或列。使用介质支架以填充要在逗号左侧选择的行,并在右侧填充列。使用先前矩阵的元素重复使用,此处省略了。

  这是另一种方法,仅选择一个具有一个列名称的特定列:

  DF $颜色

  输出的结果是一个可以使用class()函数来验证向量元素的类型的向量。

  此外,如果我们想用星形戒指选择行星,我们可以使用以下操作:

  可以看出,我们在“环形”列中筛选了所有真实行。

  那么,您可以没有星形戒指的筛选行星吗?

  该方法非常简单,只需在括号中添加一个即可!

  *注意:由逻辑值组成的列通常用于筛选满足某些条件的行。如果没有逻辑值组成的列,我们可以通过逻辑运算符自己建立筛选标准。

  现在,我们尝试找出地球是否有星形戒指。

  与这两个结果相比,您可以发现太阳系中的岩石态行星没有星形戒指,并且巨型巨星具有星形戒指。行星的类型。当然,这只是一个假设。为了验证该假设甚至可以观察是否可以在银河系中建立宇宙,我们需要更多数据来测试假设。内容的这一部分需要更加统计,将在后面提及。

  上一步是为我们的数据集创建一个子集,以滤除一些不需要的数据。

  使用第二个ARG,我们可以根据“某些条件”进行选择。这里的条件涵盖了广泛的范围,并且不再限于逻辑值。

  *注意:“单一等于数字”此处是指分配,'二等数字”表示逻辑判断

  现在尝试使用数值数据作为筛选条件,选择直径比地球更大直径的行星:

  使用order()函数进行排序:

  *注意:默认情况下的减少是假的,也就是说,如果未填充此arg,则将按顺序排列order()函数

  这不是很简单吗?

  假设此DF是5行和3列

  形状[0]参考

  DF中的索引编号为0,因此第五行的数字为4

  因此,您删除了4的索引,即删除最后一行。

  在[36]中:列表(df ['state'])。索引('Ohio')out [36]:0in [37]:list(df ['state'])。]:1

  结论:以上是首席CTO注释汇编的Python计算DF的全部内容。感谢您阅读本网站的内容。我希望这对您有帮助。有关多少行Python的更多信息,可以计算出有多少线DF拥有DF,却不忘记在此站点上找到它。