Python是最流行、使用最广泛的编程语言之一。已经超越业界众多编程语言,名列前茅。它在开发人员中流行的原因有很多,其中最重要的是它有大量的库供用户使用。Python的易用性和灵活性吸引了许多开发人员为机器学习创建新的库。有一个库大家都会介绍,那就是TensorFlow,这里就不多说了。那么,下面就是今天的干货了。大家有什么喜欢的库也可以在评论里留言分享哦~1.KerasKeras是一个用python编写的机器学习API,它运行在TensorFlow这个优秀的机器学习平台上。优点是可以快速搭建网络模型,数据输入输出也很方便,让你专注于网络模型本身,适合新手。最大的缺点就是慢!作为高级API,推理速度等肯定没有tf和mxnet快。2.PyTorch其特点:处理N维张量,类似于numpy,但可以在GPU上运行。支持自动微分构建和训练大型神经网络。3.Fastai已经很好用了。通过使用当前优秀的技术实践,fastai非常快速地简化了训练过程并加速了神经网络。仅一个API就涵盖了几乎所有常见的深度学习应用。4.JAXJax是Autograd和XLA的组合,用于提供高性能的机器学习研究。Autograd的更新版本,JAX可以自动区分原生Python和Numpy函数。可以通过循环、分支、递归和闭包进行微分,并且可以采用导数的导数。支持通过grad进行反向模式区分。5.FastText是一个让你高效学习词义和句子分类的库。6.spaCyspaCyv3.0拥有全新的基于transformer的管道,让spaCy达到SOTA精度。您可以使用任何预训练的转换器来训练您自己的管道,并且可以在多个组件和任务之间共享转换器。spaCy的转换器支持与PyTorch和HuggingFace转换器库集成,可以访问管道中的许多预训练模型。7.gensim它使用大型语料库进行主题建模、文档索引和相似性检索。目标受众是自然语言处理(NLP)和信息检索(IR)社区。8.NLTK是一个自然语言工具箱,是一套用于自然语言处理研发的开源Python模块、数据集和教程。9.TextBlob是一个简单的Python风格的库,用于处理文本数据。它提供了一个简单的API,用于深入研究常见的自然语言处理(NLP)任务,例如词性标记、名词短语提取、情感分析、分类、翻译等。10.Pillow是PIL的一个非常人性化的分支。PIL是Python图像库。11.OpenCV开源计算机视觉库。12.LightGBM可以帮助开发者使用重新定义的基础模型,即决策树来构建新的算法。LightGBM的特点:计算速度快、生产率高、直观易用。这个库提供了一个高度可扩展、优化和快速的梯度提升实现,这使得它在机器学习开发者中很受欢迎。13.PandasPandas是Python中的机器学习库,提供高级数据结构和多种分析工具。最主要的是能够用一两个命令转换复杂的数据操作。它还具有许多用于分组、数据组合、过滤和时间序列功能的内置函数。当与其他库一起使用时,Pandas保证了高性能和良好的灵活性。14..Numpy数组接口是Numpy最好的特性。它非常容易理解和使用,使复杂的数学实现变得非常简单。使用广泛,因此有很多开源贡献者。此接口可用于将图像、声音和其他二进制原始流表示为n维实数数组。15.ClickClick的初衷是用最少的代码以可组合的方式创建漂亮的命令行界面。它的目的是使编写命令行工具的过程变得快速而有趣,同时防止因未实现预期的CLIAPI而导致的任何问题。主要有三个特点:命令任意嵌套、帮助页面自动生成、支持运行时延迟加载子命令。
