本文经AI新媒体量子比特(公众号ID:QbitAI)授权转载,转载请联系出处。作为Python强大的扩展库,pandas被很多人称为数据分析领域的“瑞士军刀”。但也被不少学习者诟病:语法乱七八糟!API太多了!有什么快速入门的好方法吗?为此,有网友在知乎提出了这样一个问题:这个问题引起了很多网友的共鸣,也有很多人提供了自己的pandas入门方法。怎么这么乱?首先大家抱怨pandas用起来很乱,为什么会这样呢?针对这个问题,来自中科院大学的@李丁表示,由于Pandas等Python的科学计算包是“一群学者开发的”,主要是模仿R语言,但没有模仿R的灵活句法。最后只把功能做到全面好用就行了,不去关注好用与否等其他代码工程素养问题。结果就是,虽然乱七八糟,但碍于“地位”,还是有不少人不得不使用。那么大家都是怎么开始的呢?《磨刀不误砍柴》看整个答案,大部分人的想法是先整体过一遍,在脑海里留下一个印象,等到要用的时候再仔细核对一下!但是很多东西根本就记不起来了。检查时,您可能不知道有某个功能。甚至有人抱怨说,即使你用了很长时间的pandas,你仍然需要一遍又一遍地查看官方文档。所以,为了提高查询效率,在刚上手的时候整理好各种语法和相关的类是非常重要的。以下是GiHub上1.3kstars的“锐化”成果:每个类别都有全面详细的总结,包括示例代码:作者是阿里巴巴的技术专家。也有朋友说的比较详细,总结了75个数据分析打工的Pandas高频操作:每一项都解释了具体用法:除了pandas的作者,《利用Python进行数据分析》(第2版)那本书是?强烈推荐的,但是没必要全部看完,边用边看就好了。?亚马逊书评也不错:这本书比我看过的其他关于Pandas的书好很多,其他书也不错,只是这本书比较简洁。作者先介绍方法,再举例,接着继续,非常适合学习。官方文档一直被吐槽,但是官网更新的文档比以前好多了,需要查询学习的时候还是要用的。剩下的就是在一次又一次的实践中加深对各种用法的记忆!当然,也有人推荐直接切换到matlab、mathematica或julia,效率更高(但不太流行)。而DaPy是专门针对pandas数据结构严格、API过多等问题的Python数据分析框架,轻量易用。你是如何开始使用混沌熊猫的?友人整理的链接:GiHubpandas教程:https://github.com/hangsz/pandas-tutorial75Pandas高频操作:https://mp.weixin.qq.com/s?__biz=MzUwOTg0MjczNw==&mid=2247490395&idx=1&sn=49215a3b51a6768802ba2eae3410e537&chksm=f90d5f05ce7ad613a5200b803580314a298443f98f853a73941ec64ea4a7c90822f1f814cfa9&scene=178&cur_album_id=1429956252289024000#rd
