当前位置: 首页 > 科技观察

那些被低估的Python库

时间:2023-03-23 10:26:46 科技观察

在这篇文章中,我们想展示一些与流行的不同的东西。以上是深夜浏览GitHub的感悟,以及同事分享的开箱即用的东西。其中一些包是非常独特和有趣的Python包。HybridKnockKnock:将通知从Python发送到手机、桌面或电子邮件。tqdm:可扩展的Python和CLI进度条,内置对pandas的支持。Colorama:简单的跨平台彩色终端文本。pandas-log:提供有关基本pandas操作的反馈。非常适合调试长管道链。Pandas-flavor:一种扩展pandasDataFrame/Series的简单方法。More-Itertools:添加类似于itertools的附加功能。streamlit:一种为机器学习项目创建应用程序的简单方法。数据清理和操作ftfy:修复mojibake和Unicode文本中的其他故障。看门人:清理数据有很多很酷的功能。Optimus:另一个数据清理包。Great-experctations:一个很好的工具,用于检查数据是否符合预期。DataExplorationandModelingPandas-profile:创建包含来自pandasDataFrame的统计信息的HTML报告。dabl:允许使用可视化和预处理进行数据探索。pydqc:允许比较两个数据集之间的统计数据。pandas-summary:描述pandasDataFrame功能的扩展。pivottable-js:pands在jupyternotebook中的拖拽功能。DataStructureBouter:无论数据大小如何,使用有限(有界)内存量的高效计数器。Python-bloomfilter:可扩展的布隆过滤器,用Python实现。datasketch:提供概率数据结构,如LSH、weightedMinHash、HyperLogLog等ranges:Python的contiguousranges、range-sets和range-ordering数据结构性能检查和优化Py-spy:Python程序的采样分析器。pyperf:运行Python基准测试的工具箱。snakeviz:一个浏览器内的Python配置文件查看器,对jupyternotebooks有很好的支持。Cachier:一个持久的、无延迟的、本地的和跨机器的Python函数缓存。Faiss:一个用于高效相似性搜索和密集向量聚类的库。原文:https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270