当前位置: 首页 > 网络应用技术

使用熊猫读取差的两种方法Excel的两种方法。

时间:2023-03-07 14:47:23 网络应用技术

  在正常情况下,我们使用大熊猫读取Excel数据,这些数据可以轻松地将数据转换为数据框架类型。但是,现实通常是非常骨干的。当我们遇到并非特别好的结构时,传统的熊猫阅读操作并不容易使用。今天,我们将研究非常规结构Excel数据的两个读物的两个示例。

  本文中使用的测试内容如下:

  该文件可以在文章末尾获得。

  在正常情况下,当我们使用read_excel函数读取Excel数据时,我们默认情况下从A列中读取,但是对于某些Excel数据,通常从列ATO避免使用the Process Grocessing。

  例如,以上Excel数据,如果我们直接读取read_excel(src_file),我们将获得以下结果:

  我们得到了很多不需要的列和许多我们根本不需要的列

  此时,我们可以指定通过用户验指定哪些列数据

  您可以看到生成的数据帧仅包含我们需要的数据,而注释列和日期字段则被专门排除在外。

  USECOL可以接受Excel列的范围,例如B:F,并仅读取这些列。标题参数需要定义标题列的整数。

  我们还可以将列定义为数字列表

  您还可以按列名选择所需的列数据

  该方法在列的顺序上发生了变化,但列的名称非常有用。

  最后,usecols也可以接受可可的功能

  此功能将根据名称分析每一列,并且必须返回每列的true或false

  当然,您也可以使用lambda表达式

  在某些情况下,Excel中的数据可能更不确定。在我们的Excel数据中,我们有一个名为Ship_cost的表。

  在这种情况下,我们可以直接使用OpenPyXL来解析Excel文件并将数据转换为PANDAS DataFrame

  以下是使用OpenPyXl读取Excel文件的方法(安装后):

  检查所有页面页面,获取一个页面,并获取Excel范围数据

  现在我们和我们知道已加载的数据范围,下一步是

  这样,我们获得了干净的表数据。

  好吧,今天的两个小知识要点将在这里共享,我们下次见!

  微信技术公共帐户:萝卜霍奇普奇