当前位置: 首页 > 科技观察

1行代码实现Python数据分析:图表美观清晰,内置对比功能丨开源

时间:2023-03-12 08:20:17 科技观察

朋友圈有没有看到这样的小广告:“你要悄悄学Python,然后给大家一个惊喜。”现在,GitHub上的一位博主告诉你:不用学,用sweetviz就可以了。这是一款基于Python编写的数据分析软件。只要掌握3个函数的用法,一行Python代码就可以实现数据集的可视化、分析和对比。我们以泰坦尼克号数据集为例,输入一行代码:清晰的1080pweb界面出现在眼前。不仅按照性别、年龄等不同的列对数据进行纵向分析,还在每列下进行众数、最大值、最小值等横向比较。所有输入值和文本信息都会被自动检测,并对数据进行分析、可视化和比较,最后为您汇总数据。这样的数据分析下,结果一目了然。△泰坦尼克号数据集的一些功能细节展示了这样的效果,它是基于三个主要功能实现的。3种函数用法analyze()丨数据分析在数据分析函数中,需要设置4个参数source、target_feat、feat_cfg和pairwise_analysis。source:使用pandas中的DataFrame数据结构或者DataFrame中的某类字符串作为分析对象。target_feat:需要标记为目标对象的字符串。feat_cfg:需要跳过的特征,或者需要转换成某种数据类型的特征。pairwise_analysis:关联和其他类型的数据关联可能需要很长时间。如果超过某个阈值,需要将此参数设置为on或off,来决定是否分析数据相关性。△数据相关性分析的效果可能需要一定的时间示例中的my_dataframe和test_df是两个数据集,分别命名为训练数据和测试数据。除了这个inserteddataset,其余参数和analyze一样。compare_intra()丨数据集列比较如果要分析数据集中某列下的参数,就用这个函数。比如你需要比较“性别”栏下的“男”和“女”,就可以使用这个功能。了解了这些函数的变量后,一行代码就可以实现Python数据分析。用户指南sweetviz支持Python3.6+和Pandas0.25.3+环境。配置好环境后,使用万能的pip下载安装包:但有一个条件需要注意:sweetviz需要使用基础的“os”模块。所以,如果你使用的是像GoogleColab这样的自定义环境,你可能无法使用sweetviz,开发者目前正在探索解决方案。下载后使用import快速导入sweetviz,即可开始使用。sweetviz使用的原理是用一行代码生成一个数据报表对象(其中my_dataframe是pandas中的DataFrame,一种表格数据结构):这里的analyze函数可以换成compare或者compare_intra函数。使用方法上面已经给出了,看你需要什么类型的数据报表了。最后用show一键输出。(结果会以SWEETVIZ_REPORT.html网页形式显示)由于在这个过程中,实际只需要编写生成目标代码的第二行,可以说是名副其实的一行代码生成数据分析。展示界面也很简洁,只要鼠标停留在感兴趣的栏目上,右侧就会自动展示数据分析的图表和报表。有兴趣的朋友请点击下方传送门使用哦~传送门:https://github.com/fbdesignpro/sweetviz