当前位置: 首页 > 科技观察

2018年含金量最高的6个开源机器学习项目

时间:2023-03-13 17:02:28 科技观察

刚刚过去的2018年是人工智能和机器学习领域“丰收”的一年,我们看到越来越多有影响力的机器学习项目被开发和应用到现实生活的许多领域,尤其是医疗保健、金融、语音识别、增强现实和更复杂的3D视频应用程序。  此外,我们发现业界正在产生越来越多的应用驱动研究,甚至超过了理论驱动研究的数量。不可否认,这种变化有其弊端,但我们也必须看到它积极的一面。随着可以快速商业化的研究的增加,对整个行业产生了不可估量的积极影响,这在机器学习的开源领域尤为明显。  ***,盘点过去一年最实用的6个机器学习项目。这些项目已经发布了代码和数据集,以方便个人和小团队学习和创造价值。这些项目在理论上可能不是开创性的,但它们非常实用。  本文来自TowardsDataScience的GeorgeSeif,编译如下。  1)Fast.ai  开源地址:  https://github.com/fastai/fastai  Fast.ai库让我们通过先进的解决方案简化神经网络的训练项目,它抽象了实际构建深度神经网络过程中的所有细节工作。设计充分考虑了从业者构建程序的思维方式,非常易用。该库最初是为Fast.ai课程的学生创建的,以简洁易懂的方式编写在Pytorch库之上。此外,它在文件库的组织上也很出色。(文件库地址:https://docs.fast.ai/)  2)Detectron  开源地址:  https://github.com/facebookresearch/Detectron  Detectron是Facebook开发的用于对象检测和实例分割的研究平台。它是用深度学习框架Caffe2编写的,包含了各种物体检测算法的实现,例如:MaskR-CNN:通过FasterR-CNN结构Splitwithinstance实现物体检测。(https://arxiv.org/abs/1703.06870)RetinaNet:特征金字塔网络,通过独特的FocalLoss来处理具有挑战性的案例。(https://arxiv.org/abs/1708.02002)FasterR-CNN:目标检测网络中最常见的结构。(https://arxiv.org/abs/1506.01497)  所有网络都可以使用以下任一替代分类网络:ResNeXt{50101152}(https://arxiv.org/abs/1611.05431)RESNET{50101152}(https://arxiv.org/abs/1512.03385)特征金字塔网络(使用ResNet/ResNeXt)(https://arxiv.org/abs/1612.03144)VGG16(https://arxiv.org/abs/1612.03144)  值得一提的是,这些平台功能自带COCO数据集上的预训练模型,这也意味着用户可以快速上手使用。同时,这些功能都严格按照标准的评估指标在Detectron模型动物园(https://github.com/facebookresearch/Detectron/blob/master/MODEL_ZOO.md)进行了测试。  3)FastText  开源地址:  https://github.com/facebookresearch/fastText  这是Facebook的又一个研究成果,fastText库专为文本表示和文本分类编写.该库自带预训练词向量模型,涵盖150多种语言,可用于文本分类、摘要和翻译等多项任务。  4)AutoKeras  Auto-Keras是一个用于自动化机器学习(AutoML)的开源软件库,由德克萨斯A&M大学的DATA实验室(http://faculty.cs.tamu.edu/xiahu/index.html)与社区贡献者共同开发。AutoML的目标是为缺乏数据科学或机器学习背景的领域专家创建一个易于使用的深度学习工具。Auto-Keras提供了为深度学习模型自动匹配最佳架构和超参数的功能。  5)Dopamine  开源地址:  https://github.com/google/dopamine  Dopamine是谷歌创建的一个研究框架,用于加速强化学习算法的原型制作。严格按照RL为基础的算法、指标和基准,灵活易用。  根据多巴胺提供的文档,他们的产品设计原则包括:易于执行的实验:帮助新用户进行基准实验灵活的开发流程:促进更多突破性想法的诞生简洁可靠:能够实现一些老的或者比较流行的算法的可重复性:保证结果可以复现  6)vid2vid  开源地址:  https://github.com/NVIDIA/vid2vid  vid2vid是基于关于Nvidia***一个视频到视频合成算法的Pytorch实现项目。视频到视频合成算法的目标是学习从输入源视频(例如,一系列语义分割掩码)到准确描绘源视频内容的逼真渲染视频的映射函数。  这个库的美妙之处在于选择的多样性:它为自动驾驶/城市场景、人脸和人体姿势提供了不同的vid2vid应用程序。此外,它还自带丰富的指令和功能,包括数据集加载、任务评估、网络训练和多GPU!  特别提及ChatterBot:一个用于创建对话引擎和聊天机器人的机器学习项目  开源地址:  https://github.com/gunthercox/ChatterBot开源地址:  https://github.com/kubeflow/kubeflowimgaug:图像增强深度学习项目  开源地址:  https://github.com/aleju/imgaugimgaugimgaug:scikit下的Python框架,专用修复不平衡数据集  开源地址:  https://github.com/scikit-learn-contrib/imbalanced-learnmlflow:一个管理ML项目周期的开源平台,涵盖实验、流程等复制和部署。  开源地址:  https://github.com/mlflow/mlflowAirSim:一款基于UnrealEngine/Unity的自动驾驶汽车模拟器,微软出品  开源地址:  https:///github.com/Microsoft/AirSim