本文列出了一些技巧,以改善或加快您的日常数据分析工作,包括:使用袖扣和Plotly绘制Pandas数据的PandasProfilingIPython魔术命令在Jupyter中格式化Jupyter快捷方式在Jupyter(或IPython)中使一个单元同时具有多个输出InstantlycreateslidesforJupyterNotebook1.PandasProfiling这个工具非常有效。下图显示了调用df.profile_report()的简单方法的结果:使用该工具只需要安装并导入PandasProfiling包。本文不会详细介绍这个工具,要了解更多信息,请阅读:https://towardsdatascience.com/exploring-your-data-with-just-1-line-of-python-4b35ce21a82d2。使用袖扣和Plotly绘制Pandas数据大多数“经验丰富”的数据科学家或数据分析师都熟悉matplotlib和pandas。也就是说,您可以通过调用.plot()方法快速绘制一个简单的pd.DataFrame或pd.Series:有点无聊?这已经足够好了,但是是否可以绘制一个交互式的、可缩放的、可伸缩的全景图呢?袖扣*时间到了!(Cufflinks是基于Plotly进一步封装的。)要在您的环境中安装Cufflinks,只需运行!pipinstallcufflinks--upgrade在终端中。看看下图:好多了!请注意,上图中唯一发生变化的是Cufflinkscf.go_offline()的导入和设置,它将.plot()方法更改为.iplot()。.scatter_matrix()等其他方法也能提供很好的可视化效果:需要做大量数据可视化工作的朋友可以阅读Cufflinks和Plotly的文档,寻找更多的方法。袖扣文档:https://plot.ly/ipython-notebooks/cufflinks/Plotly文档:https://plot.ly/3。IPython魔术命令IPython的“魔术”是基于IPython的标准Python语法的一系列增强。魔术命令包括两种方法:行魔术:以%为前缀,对单个输入行进行操作;cellmagics:以%%为前缀,对多个输入行进行操作。下面是IPython魔法命令提供的一些有用的功能:(1)%lsmagic:查找所有命令如果你只记得一个魔法命令,那一定是这个。执行%lsmagic命令将提供所有可用魔法命令的列表:(2)%debug:交互式调试这可能是我最常使用的魔法命令。大多数数据科学家都遇到过这样的情况:一段执行的代码不断断掉,你无奈之下写了20条print()语句,试图输出每个变量的内容。然后,当您最终解决问题时,您必须返回并再次删除所有print()语句。但再也不会了。遇到问题只要执行%debug命令,就可以执行任何你想运行的代码部分:上图是怎么回事?我们有一个将列表作为输入并对所有偶数进行平方的函数。我们运行该函数,但出了点问题。但是我们不知道发生了什么!在函数上使用%debug命令。让调试器告诉我们x和type(x)的值。问题很明显:我们将'6'作为字符串传递给函数!这对于更复杂的功能非常有用。(3)%store:这个命令对于在笔记本之间传递变量也很酷。假设你花了一些时间清理笔记本中的数据,现在你想在另一个笔记本上测试一些功能,你是在同一个笔记本上实现功能,还是在另一个笔记本上保存数据并加载数据?使用%store命令后不需要这些!此命令将存储变量,您可以在任何其他笔记本中检索该变量:%store[variable]存储变量。%store-r[variable]读取/检索存储的变量。%who:列出所有全局变量。你有没有遇到过给变量赋值后忘记变量名的情况?或者不小心删除了负责分配变量的单元格?使用%who命令,您可以获得所有全局变量的列表:%%time:timingMagic命令使用此命令可以获取所有时间信息。只需将%%time命令应用于任何可执行代码,即可获得如下输出:这个神奇的命令非常有用。只需在函数或类的单元格前加上%%writefile和你要保存的文件名即可:如上所示,我们可以将创建的函数保存到utils.py文件中,然后随意导入。这也可以在其他笔记本中完成,只要它们与utils.py文件属于同一目录即可。4.在Jupyter中格式化这个工具很酷!Jupyter在markdown中考虑了HTML/CSS格式。以下是我最常使用的功能:蓝色,时尚:
