数据处理【瑞士军刀pandas攻略】：6.数据重命名与合并

时间：2023-03-26 16:02:26 Python

参考来源：Vitu.AI我们先加载数据。importpandasaspdpd.set_option('max_rows',5)importnumpyasnpmelbourne_data=pd.read_csv('melb_data.csv')melbourne_data.head()rename通常数据将通过列名、索引名或我们不是的任何东西传递对获得的其他命名约定感到满意。在这种情况下，我们可以使用pandas重命名实用程序函数来更改相关条目的名称。我们在这里介绍的第一个功能是重命名，它允许您重命名索引名称或列名称。例如，要将数据集中的价格列更改为Px，我们将执行以下操作：melbourne_data.rename(columns={'Price':'Px'})rename允许您通过指定索引或列关键字参数来重命名价格分别命名索引或列值。它支持各种输入格式，但我通常认为Pythondict是最方便的。下面是一个使用它来重命名索引上的某些元素的示例。melbourne_data.rename(index={0:'firstEntry',1:'secondEntry'})您可能经常重命名列，但很少重命名索引值。为此，set_index通常更方便。行索引和列索引都可以有自己的名称属性。rename_axis方法可用于更改这些名称。例如：melbourne_data.rename_axis("houses",axis='rows').rename_axis("fields",axis='columns')Merge在对数据集执行操作时，我们有时需要合并不同的DataFrames和/或Series。pandas有三个核心方法来做到这一点。为了增加复杂性，这些是concat、join和merge。merge可以做的大部分事情也可以用join更简单地完成，所以我将省略它并专注于前两个功能。最简单的组合方式是concat。此函数的工作方式类似于核心Python中的list.concat方法：给定一个元素列表，它沿轴组合这些元素。当我们在不同的DataFrame或Series对象中拥有相同字段（列）的数据时，这非常有用。一个例子：YouTube视频数据集，它根据原产国（例如本例中的加拿大和英国）拆分数据。单击此处下载加拿大数据集单击此处下载英国数据集我们将压缩的csv文件上传到Vitu的数据集空间我们将使用read_csv函数将数据读入DataFrame如果我们想同时研究多个国家，我们可以使用concat将它们连接起来：canadian_youtube=pd.read_csv("CAvideos.csv.zip")british_youtube=pd.read_csv("GBvideos.csv.zip")pd.concat([canadian_youtube,british_youtube])在复杂度方面，中间一行的组合器是pd.DataFrame.join。join允许您组合共享公共索引的不同DataFrame对象。例如，要在同一天在加拿大和英国下载视频，我们可以这样做：])left.join(right,lsuffix='_CAN',rsuffix='_UK')这里需要lsuffix和rsuffix参数，因为数据在英国和加拿大数据集中有相同的列名。如果那不是真的（因为，比方说，我们事先重命名了它们），我们就不需要它们。原文地址：数据处理【瑞士军刀pandas攻略】：6.数据重命名与合并

上一篇：比PS好！Python20行代码批量抠图

下一篇：开源Python发行版Anaconda适配AppleM1Mac

数据处理【瑞士军刀pandas攻略】：6.数据重命名与合并相关文章