当前位置: 首页 > 科技观察

20个Python人工智能和机器学习开源项目

时间:2023-03-14 19:55:45 科技观察

本文更新了Python中最热门的AI和机器学习项目。Tensorflow以三位数的贡献者增长位居第一。Scikit-learn跌至第二位,但仍然拥有非常庞大的贡献者基础。进入机器学习和人工智能领域并不容易。鉴于当今可用资源过多,许多有抱负的专业人士和爱好者发现很难在该领域建立正确的道路。该领域在不断发展,我们必须跟上快速发展的步伐。更新、查看、更新资料后,本文更新了Python中最热门的AI和机器学习项目。Tensorflow以三位数的贡献者增长位居第一。Scikit-learn跌至第二位,但仍然拥有非常庞大的贡献者基础。与2016年相比,贡献者数量增长最快的项目是:1.TensorFlow,增长169%,贡献者从493人增加到13242.Deap,增长86%,贡献者从21人增加到39人3.Chainer,增长83%,来自84到154个贡献者4.Gensim,增长81%,贡献者从145到2625.Neon,增长66%,贡献者从47到786.Nilearn增长50%,2018年更新,贡献者从46到69:1.Keras,629contributors2.PyTorch,399contributorTop20PythonAIandMLprojectsonGithubSize与贡献者数量成正比,颜色代表贡献者数量的变化,红色高,蓝色低。雪花形状用于深度学习项目,否则用于其他项目。我们看到像TensorFlow、Theano和Caffe这样的深度学习项目是最受欢迎的。下面的列表是根据Github上的贡献者数量降序排列的项目。贡献者数量的变化是相对于2016年发布的前20个Python机器学习开源项目而言的。1.TensorFlow最初是由谷歌机器智能研究机构GoogleBrainTeam的研究人员和工程师开发的。该系统旨在促进机器学习研究,并允许从研究原型快速轻松地过渡到生产系统。贡献者:1324(168%),GithubURL:https://github.com/tensorflow/tensorflow2。Scikit-learn是一个简单高效的数据挖掘和数据分析工具,所有人都可以使用,并且可以在各种环境中重复使用,基于NumPy、SciPy和matplotlib,开源,可商用,BSD许可。贡献者:1019(上涨39%),GithubURL:https://github.com/scikit-learn/scikit-learn3.Keras是一个用Python编写的高级神经网络API,可以在TensorFlow、CNTK或Theano上使用跑步。贡献者:629(新),GithubURL:https://github.com/keras-team/keras4。Python中的PyTorch、张量和具有强大GPU加速功能的动态神经网络。贡献者:399(新),GithubURL:https://github.com/pytorch/pytorch5。Theano允许您高效地定义、优化和评估涉及多维数组的数学表达式。贡献者:327(上升24%),GithubURL:https://github.com/Theano/Theano6.Gensim是一个免费的Python库,具有可扩展的统计语义,可分析纯文本文档的语义结构,以检索语义相似的文档。贡献者:262(上升81%),GithubURL:https://github.com/RaRe-Technologies/gensim7。Caffe是一个深度学习框架,具有深思熟虑的表达方式、速度和模块化。它由BerkeleyVisionandLearningCenter(BVLC)和社区贡献者开发。贡献者:260(增加21%),GithubURL:https://github.com/RaRe-Technologies/gensim8。Chainer是一个独立的开源框架,用于基于Python的深度学习模型。Chainer提供了一种灵活、直观和高性能的方法来实现全面的深度学习模型,包括循环神经网络和变分自动编码器等最先进的模型。贡献者:154(增长84%),GithubURL:https://github.com/chainer/chainer9。Statsmodels是一个Python模块,允许用户探索数据、估计统计模型和执行统计测试。对于不同类型的数据和每个估算器,提供了广泛的描述性统计、统计测量、绘图函数和结果统计列表。贡献者:144(增长33%),GithubURL:https://github.com/statsmodels/statsmodels/10。Shogun是一个机器学习工具箱,提供范围广泛的统一高效的机器学习(ML)方法。该工具箱允许无缝组合多个数据表示、算法类和通用工具。贡献者:139(增长32%),GithubURL:https://github.com/shogun-toolbox/shogun11。Pylearn2是一个机器学习库。它的大部分功能都建立在Theano之上。这意味着你可以使用数学表达式编写Pylearn2插件(新模型、算法等),Theano会为你优化和稳定这些表达式,并将它们编译到你选择的后端(CPU或GPU)。贡献者:119(增长3.5%),GithubURL:https://github.com/lisa-lab/pylearn212。NuPIC是一个基于称为分层时间记忆(HTM)的新皮层理论的开源项目。HTM理论的一部分已经在应用中实现、测试和使用,而HTM理论的其他部分仍在开发中。贡献者:85(增加12%),GithubURL:https://github.com/numenta/nupic13。Neon是Nervana的基于Python的深度学习库。它在提供最佳性能的同时提供了易用性。贡献者:78(上升66%),GithubURL:https://github.com/NervanaSystems/neon14。Nilearn是一个Python模块,用于快速轻松地对神经影像数据进行统计学习。它利用scikit-learnPython工具箱进行多变量统计,并提供预测建模、分类、解码或连通性分析等应用程序。贡献者:69(增加50%),GithubURL:https://github.com/nilearn/nilearn/branches15。Orange3是开源机器学习和数据可视化的新手和专家。使用大型工具箱的交互式数据分析工作流程。贡献者:53(增长33%),GithubURL:https://github.com/biolab/orange316.Pymc是一个python模块,实现了贝叶斯统计模型和拟合算法,包括MarkovChainMonteCarlo。它的灵活性和可扩展性使其适用于大量问题。贡献者:39(增长5.4%),GithubURL:https://github.com/pymc-devs/pymc17.Deap是一种用于快速原型制作和想法测试的新型进化计算框架。它试图使算法明确和数据结构透明。它与多处理和SCOOP等并行机制完美协调。Contributors:39(86%up),GithubURL:https://github.com/deap/deap18.Annoy(ApproximateNearestNeighborOhYeah)是一个C++库,使用Python绑定来搜索查询点的空间点.它还创建映射到内存中的大型只读基于文件的数据结构,以便许多进程可以共享相同的数据。贡献者:35(上升46%),GithubURL:https://github.com/spotify/annoy19。PyBrain是Python的模块化机器学习库。它的目标是为机器学习任务提供灵活、易于使用但功能强大的算法,以及各种预定义的环境来测试和比较算法。贡献者:32(增长3%),GithubURL:https://github.com/pybrain/pybrain20。Fuel是一个数据管道框架,可为您的机器学习模型提供所需的数据。计划供Blocks和Pylearn2神经网络库使用。贡献者:32(增长10%),GithubURL:https://github.com/mila-udem/fuel(2018年2月记录的贡献者。)