转载请联系Python学会公众号。前言Python对数据科学如此重要的原因之一是其庞大的数据分析和可视化库。在这篇文章中,我们讨论了一些最流行的。1.Tensorflow谷歌开发的TensorFlow深度学习框架无疑是最流行的神经网络训练工具。Google积极使用自己的框架来实现Gmail和GoogleTranslate等大型服务。TensorFlow被Uber、Airbnb、小米、Dropbox等品牌使用。使用TensorFlow,您可以可视化神经网络的各个部分。Tensorflow模块可以独立制作。TensorFlow允许您在CPU和GPU上训练神经网络。传达学习过程。一个庞大的团队正在不断提高稳定性和新功能。2.Scikit-LearnScikit-Learn是一个流行的机器学习库,用Python、C和C++编写。用一般的选择解决机器学习中的经典问题。用于工业系统和科学研究。广泛的监督和非监督学习算法。Scikit-learn专注于机器学习算法。该库的任务不包括加载、处理、数据操作和可视化。大型社区和详细的文档。3.NumPyNumPy是最流行的机器学习Python库之一。TensorFlow和其他库在内部使用它来对多维数组执行操作。用解释语言(Python)实现的数学算法通常比用编译语言实现的算法慢得多。NumPy库提供针对多维数组优化的计算算法的实现。4.Keras如果你需要快速轻松地组装深度学习模型,Keras是一个完美的选择。P是TensorFlow和Theano框架的附加组件。该库以深度学习网络的操作工作为目标,同时被设计为紧凑、模块化和可扩展的。Keras提供了一组高级、直观的抽象,无论使用何种科学计算库作为计算后端,都可以轻松构建神经网络。工作出色的CPU和GPU。支持几乎所有的神经网络模型,可以组合构建更复杂的模型。该平台完全用Python编写,这意味着您可以使用标准调试工具。5.PyTorchPyTorch是处理神经网络的最佳选择之一,是TensorFlow的长期竞争对手。主要由Facebook的人工智能组开发。生成对抗网络使用PyTorch作为深度学习框架。了解如何在PyTorch上编写自己的GAN。简单的GPU支持。在GPU模式下,PyTorch通过c++API运行时环境提供高质量的优化。支持异步计算执行。直接访问基于ONNX的框架、渲染器和运行时。6.LightGBMLLightGBM是一个梯度提升框架,是Kaggle竞赛中最受欢迎的算法之一。梯度提升是一种用于分类和回归问题的机器学习技术,它以预测模型集合的形式构建预测模型,通常是决策树。学习速度快,效率高。低内存消耗。支持并行和GPU计算。您可以处理大量数据。7.PandasPandas是一个库,它提供用于操作数据的高级结构和用于分析数据的广泛工具。该库允许您使用少量代码执行许多复杂的命令:对数据进行排序和分组、处理缺失数据、时间序列等。所有数据都表示为数据帧表。8.SciPySciPy对科学和工程计算至关重要,包括机器学习任务。特点:搜索函数的最小值和最大值,计算积分,支持特殊函数,信号和图像处理,求解微分方程等。SciPy与NumPy密切相关,所以默认支持NumPy数组。SciPy库可以与PyTables交互,PyTables是一种分层数据库,旨在管理HDF5文件中的大量数据。9.Eli5Eli5是一个使用统一API可视化和调试机器学习模型的Python库。它内置了对多个ML框架和库的支持:scikit-learn、Keras、前面提到的LightGBM,以及XGBoost、lightning和CatBoost。10.NLTKNLTK是一组用于自然语言符号和统计处理的库和程序。它附带大量文档,包括一本书,解释了可以使用此包执行的自然语言处理任务背后的概念。11.PillowPillow是PIL(PythonImageLibrary)图像库的改进版。支持多种文件类型:PDF、WebP、PCX、PNG、JPEG、GIF、PSD、WebP、PCX、GIF、IM、EPS、ICO、BMP等。有许多过滤工具可用于计算机视觉任务。
