数据分析三剑客数据分析就是让数据产生价值,通过数据筛选、汇总等操作,分析或预测事件的变化规律。python语言在数据分析领域也发挥着比较强大的作用。其中,用于数据分析的扩展库有3个,分别是:pandas、numpy、matplotlib。其中pandas主要用于提炼数据,numpy提供强大的科学计算,matplotlib负责数据可视化的运算。三人成为蟒蛇数据分析领域的三剑客。pandas数据抽取库之前接触过在操作excel数据时使用pandas进行数据抽取。它可以直接读取excel文档中的数据,在python中转换成dataframe对象。直接操作dataframe对象即可完成对数据的操作。同时也支持excel以外的一些文件格式的数据读取和提取操作,比如csv文件格式的数据提取。提取合格数据用于后续分析。numpy科学计算库numpy是一个数组处理模块,是数据分析过程的核心,可以支持二维数组,实现矩阵等。1)数组的创建2)数组相关的属性和函数3)获取数组元素——普通索引、切片、布尔索引和花式索引4)统计函数和线性代数运算5)随机数生成matplotlib数据可视化库Matplotlib是数据可视化的重要工具。它通过折线图、直方图、散点图等将分析后的数据可视化,将数据的变化直接展现在用户面前,带给用户更直观的感受。图片总结对数据分析三剑客有一个简单的了解,后面会逐步介绍pandas、numpy、matplotlib在编程实例中的使用。更多精彩,关注微信公众号【Python集中营】,关注python技术栈、数据获取、社区交流、干货分享,期待你的加入~
