数据处理主要是在完成数据清洗过程后,对清洗后的数据进行整理,方便后面的数据汇总、统计等,主要内容包括合并等数据操作、分组和排序。:老王谈编程|作者:老王1、导入数据处理python库#导入numpy库,主要用于数据计算importnumpyasnp#导入pandas库,主要用于读取excel数据,DataFrame数据结构使用importpandasaspd2,DataFrame数据表合并#创建data1数据表data1=pd.DataFrame({"id":[1,2,3,4,5,6,7,8],"names":['laowang','laowang','laowang','laowang','laowang','laowang','laowang','laowang']})#假设data2数据表已经存在#merge()函数将data1和data2的共享数据合并生成一个新的数据tabledata_innerdata_inner=pd.merge(data1,data2,how='inner')3、为数据表设置索引#设置data_inner数据表中的id字段为索引列data_inner.set_index('id')4、sortbyafieldorindexcolumn#data_inner数据表按name字段的列排序data_inner.sort_values(by=['name'])#按索引列排序data_inner.sort_index()5、数据表分组#名称列设备alto'laowang'data_inner['name']=np.where(df_inner['name']=='laowang','high','low')更多精彩去老王说编程>>>
