数据整理完成后,接下来我们需要抽取条件数据,筛选出我们需要的数据。这就是我们这篇文章要讲的数据的提取和筛选,和这个系列的其他文章一样,我们用例子来说明。童鞋新手,请查看本系列文章的前几篇文章。:老王谈编程|作者:老王1、导入python库#导入numpy库,主要用于数据计算importnumpyasnp#导入pandas库,主要用于读取excel数据和使用DataFrame数据结构importpandasaspd2,按标签提取数据#最后文章(python-excel数据处理)最后生成data_inner数据,也就是DataFrame结构的数据#loc()函数,提取索引列第四行的数据data_inner。loc[3]#loc()函数,提取索引列从第1行到第4行的数据data_inner.loc[0:3]#loc()函数,提取第4行之前的数据行data_inner.loc[:3]3、按位置提取数据#iloc()函数,按第3行第2列之前的区域提取数据data_inner.iloc[:2,:1]4、按条件提取数据#使用isin()函数作为条件,过滤出name列为laowang和laow的数据#然后使用loc()过滤出数据data_inner.loc[data_inner['name'].isin(['laowang','laow'])]5、数据过滤使用DataFrame数据结构的数据进行过滤,其实就类似于python中调用数据库的SQL语句条件查询,在一个已经组织好的数据表中,根据条件过滤出需要的数据的过程。#注意:使用&作为“与”的条件来判断data_inner.loc[(data_inner['name']=='laow')&(data_inner['age']>25),['id','name','age']]#注意:使用&作为“或”条件判断data_inner.loc[(data_inner['name']=='laow')|(data_inner['age']>25),['id','name','age']]#注:&作为“非”的条件判断,过滤完成后进行排序根据年龄data_inner.loc[(data_inner['name']!='laow'),['id','name','age']].sort(['age'])更多精彩,去到老王朔编程>>>
