当前位置: 首页 > 科技观察

掌握这7个Python技能,数据分析无所畏惧!

时间:2023-03-17 01:16:18 科技观察

本文列出了一些改进或加速日常数据分析工作的技巧,包括:1.PandasProfiling2.使用Cufflinks和Plotly绘制Pandas数据3。IPython魔术命令4。在Jupyter5中格式化。Jupyter快捷方式6。在Jupyter(或IPython)中使一个单元同时具有多个输出7.即时为JupyterNotebook创建幻灯片1.PandasProfiling这个工具非常有效。下图显示了调用df.profile_report()的简单方法的结果:使用该工具只需要安装并导入PandasProfiling包。本文不会详细介绍这个工具,要了解更多信息,请阅读:https://towardsdatascience.com/exploring-your-data-with-just-1-line-of-python-4b35ce21a82d2。使用袖扣和Plotly绘制Pandas数据大多数“经验丰富”的数据科学家或数据分析师都熟悉matplotlib和pandas。也就是说,您可以通过调用.plot()方法快速绘制一个简单的pd.DataFrame或pd.Series:有点无聊?这很好,但是绘制一个交互式、可缩放、可扩展的全景图怎么样?是时候让袖扣*出去*了!(Cufflinks是在Plotly的基础上进一步封装的。)要在环境中安装Cufflinks,只需运行!pipinstallcufflinks--upgrade在终端中。看看下图:好多了!请注意,与上图唯一不同的是Cufflinkscf.go_offline()的导入和设置,它将.plot()方法转换为.iplot()。.scatter_matrix()等其他方法也能提供很好的可视化效果:需要做大量数据可视化工作的朋友可以阅读Cufflinks和Plotly的文档,寻找更多的方法。袖扣文档:https://plot.ly/ipython-notebooks/cufflinks/Plotly文档:https://plot.ly/3。IPython魔法命令IPython的“魔法”是在IPython的Python标准语法的基础上进行的一系列增强。魔术命令包括两种方法:行魔术:以%为前缀,对单个输入行进行操作;cellmagics:以%%为前缀,对多个输入行进行操作。以下是IPython魔术命令提供的一些有用功能:%lsmagic:查找所有命令如果您只记得一个魔术命令,那么它必须是这个。执行%lsmagic命令将提供所有可用魔法命令的列表:%debug:interactivedebug这可能是我最常使用的魔法命令。大多数数据科学家都遇到过这样的情况:一段执行的代码不断断掉,你无奈之下写了20条print()语句,试图输出每个变量的内容。然后,当您最终解决问题时,您必须返回并再次删除所有print()语句。但再也不会了。遇到问题只要执行%debug命令,就可以执行你想运行的任何部分代码:上图发生了什么?我们有一个将列表作为输入并对所有偶数进行平方的函数。我们运行该函数,但出了点问题。但是我们不知道发生了什么!在函数上使用%debug命令。让调试器告诉我们x和type(x)的值。问题很明显:我们将6作为字符串传递给函数!这对于更复杂的功能非常有用。%store:在笔记本之间传递变量也很酷。假设你花了一些时间在一个笔记本上清洗数据,现在你想在另一个笔记本上测试一些功能,你是在同一个笔记本上实现功能,还是保存数据并在另一个笔记本上加载?使用%store命令后,这些操作都不需要了!此命令将存储变量,您可以在任何其他笔记本中检索该变量:%store[variable]存储变量。%store-r[variable]读取/检索存储的变量。%who:列出所有全局变量。你有没有遇到过赋值后忘记变量名的情况?或者不小心删除了负责给变量赋值的单元格?使用%who命令,你可以获得所有全局变量的列表:%%time:timingmagiccommand使用这个命令来获取所有的时间信息。只需将%%time命令应用于任何可执行代码,即可获得如下输出:这个神奇的命令非常有用。只需在函数或类的单元格前加上%%writefile和你要保存的文件名即可:如上所示,我们可以将创建的函数保存到utils.py文件中,然后随意导入。这也可以在其他笔记本中完成,只要它们与utils.py文件属于同一目录即可。4.在Jupyter中格式化这个工具很酷!Jupyter在markdown中考虑了HTML/CSS格式。以下是我最常使用的功能:蓝色,时尚:花哨

红色,有点慌乱:Thisisbaaaaad!
绿色和平静:Thisisgooood!
下面显示了它们实际应用:当您想以Notebook格式展示一些发现时非常有用!5.Jupyter快捷键要了解和学习键盘快捷键,您可以使用命令面板:Ctrl+Shift+P来获取所有笔记本功能的列表。下面选择最基本的命令:Esc:进入命令模式。在命令模式下,您可以使用箭头键在笔记本中导航。在命令模式下:A和B:在当前单元格上方(Above)或下方(Below)插入一个新单元格。M:当前单元格变为Markdown状态。Y:当前单元格变为代码状态。D,D:删除当前单元格。Enter:当前单元格返回编辑模式。在编辑模式下:Shift+Tab:为您在当前单元格中键入的对象提供一个文档字符串(文档),并继续使用此快捷方式在文档模式中循环。Ctrl+Shift+-:在光标所在位置拆分当前单元格。Esc+F:查找和替换代码(不包括输出)。Esc+O:切换单元格输出。选择多个单元格:Shift+向下和Shift+向上:选择下方或上方的单元格。Shift+M:合并选定的单元格。注意,选中多个单元格后,可以批量进行删除/复制/剪切/粘贴/运行等操作。6.在Jupyter(或IPython)中使一个单元格同时具有多个输出.tail()方法中途放弃,你有过这样的经历吗?现在不用担心,您可以使用以下代码行来显示您想要的输出:fromIPython.core.interactiveshellimportInteractiveShellInteractiveShell.ast_node_interactivity="all"下图显示了多个输出的结果:7.使用RISE为JupyterNotebook即时创建幻灯片,您可以立即将您的JupyterNotebook变成幻灯片,只需一个按键。当笔记本仍处于活动状态时,您可以在演示幻灯片的同时进行实时编码!要使用该工具,您只需通过conda或pip安装RISE。condainstall-cconda-forgerise或pipinstallRISE现在您可以单击新按钮为笔记本创建漂亮的幻灯片: