当前位置: 首页 > 科技观察

GitHub5月最火的机器学习项目都在这里

时间:2023-03-12 03:13:36 科技观察

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。你的5月余额所剩无几,这个月最新最热的机器学习项目你都看了吗?MybridgeAI博客从近250个机器学习开源项目中找出了star数最高的Top10项目,涵盖了视觉问答、物体检测、自动评论生成等多个维度。一起来看看吧~第1名:PythiaPythia是Facebook人工智能实验室出品的视觉和语言多模态研究的模块化框架,2138星。Pythia基于PyTorch,支持ModelZoo、多任务,内置VQA、VizWiz等各种数据集,支持基于DataParallel和DistributedDataParallel的分布式训练,还可以高度定制。另外,使用Pythia作为TextVQA和VQA的入门代码库也不错。链接:https://github.com/facebookresearch/pythiaNo.2:云标注(CloudAnnotations)自定义对象检测和分类训练,2014stars。基于IBM云对象存储,在TensorFlow上训练需要在线图片标注,可在macOS、Windows和Linux上使用。链接:https://github.com/cloud-annotations/trainingNo.3:PySOT商汤出品,可以跟踪视频中的单个物体,实现SiamRPN和SiamMask等算法,1703星。PySOT实现了最先进的单目标跟踪算法,包括SiamRPN和SiamMask等,用Python编写并在PyTorch上运行。链接:https://github.com/STVIR/pysot第4名:PyTorch-BigGraph大规模图结构数据生成嵌入式软件,1417星,也是Facebook出品,主要作者是巴黎的LucaWehrstedt。PyTorch-BigGraph是一个分布式系统,可以处理具有数十亿实体和数万亿条边的大型网络交互图。如果您使用PyTorch-BigGraph,则需要Python3.6或更高版本,以及最低PyTorch1.0。你不需要喂GPU,但它会花费更多的CPU。链接:https://github.com/facebookresearch/PyTorch-BigGraphNo.5:InterpretML——微软出品的Alpha,用于训练可解释的机器学习模型,1039星。这里的“可解释性”是指能够解释模型调试中遇到的错误,模型是否搞歧视,如何让模型为人类所理解,模型是否合法,在高风险领域是否可靠比如医疗和司法。链接:https://github.com/microsoft/interpretNo.6:Weights&Biases可视化和跟踪机器学习实验工具,1098星。分析机器学习实验,比TensorBoard更轻量级。每次运行都可以保存超参数和输出指标,在训练过程中实现可视化模型,自动跟踪代码状态、系统指标和配置参数。链接:https://github.com/wandb/clientNo.7:MLIR“Multi-LevelIntermediateRepresentation”CompilerInfrastructure,832星。TensorFlow的一部分。MLIR旨在做一个hybridIR(intermediaterepresentation),可以在一个统一的基础设施中支持各种不同的需求,可以表示所有的TensorFlow图,在TensorFlow图上进行优化和转换,使用TensorFlow图或者TFLite完成量化和图转换。链接:https://github.com/tensorflow/mlir#8:MeshCNNPyTorch中3D网格的卷积神经网络,367颗星。这是一篇发表在SIGGRAPH2019上的论文,可用于3D形状分割。作者来自特拉维夫大学和亚马逊。与传统CNN一样,MeshCNN结合了在网格边缘运行的专用卷积层和池化层。卷积应用于边及其入射三角形的四个边,池化层通过边折叠操作保留表面拓扑,为后续层生成网格连接。链接:https://github.com/ranahanocka/MeshCNN9号:微软出品的TensorWatch,用于深度学习和强化学习的调试、监控和可视化,299星。TensorWatch是专为深度学习和强化学习而设计的调试和可视化工具。它充分利用JupyterNotebook来显示实时可视化。可以实时查询训练过程,不用一直翻日志。它还可用于构建您自己的UI和仪表板。此外,TensorWatch利用几个优秀的库来可视化模型图、审查模型统计数据、解释预测等。链接:https://github.com/microsoft/tensorwatch第10名:hncynic一个自动生成黑客新闻式评论的猎奇项目,完全忽略文章本身,只看标题,其他的都是关于编辑,240星。源码依赖黑客新闻评论数据训练Transformerencoder-decoder模型,中间还使用了维基百科数据。大多数生成的评论都没有灵感。比如这个新闻标题《用TensorFlow检测鱼》,生成的评论属于江阿姨:这篇文章太辣了。1、为什么代码看起来像一堆黑框标签?我没看到。2.为什么你的模型不利用这些理论?为什么不用黑盒分类器?如果模型没有拉出红色盒子,它开始看到红色盒子,看起来像一个没有清晰颜色的黑色盒子(好像它知道什么是蓝色)-它怎么能看到红色盒子,甚至是黑色盒子?在一个不了解我们如何使用“黑盒”和“蓝盒”在真实环境中检测鱼类并使用黑盒而不是白纸盒的世界中,我们都知道这一点。好像有道理,就是不知道在说什么,满满的美术风!链接:https://github.com/leod/hncynic传送门原文链接:https://medium.mybridge.co/machine-learning-open-source-for-the-past-month-v-may-2019-bf4ff9b80b1b