AnalyticsVidhya最近发布了3月GitHub上最热门的5个数据科学和机器学习项目。这个月的榜单从GoogleBrain的AstroNet到人工神经网络可视化工具,这些都是很棒的项目,相信它们一定会拓展你的机器学习视野。1.PersonBlockerPersonBlocker是一个python库,可以使用预训练的神经网络自动阻止图像中的每个人。该算法的底层实现是在MSCOCO数据集上预训练的MaskR-CNN,但它不需要GPU!此外,它不仅可以遮罩人像,还可以遮罩多达80种不同类型的图像,包括长颈鹿和汽车等物体,包括交通工具、动物、电子产品等等。(项目地址:https://github.com/minimaxir/person-blocker)2.AstroNet早在2017年12月,GoogleBrain团队就透露Astronet应用程序发现了2颗新行星——它是一个用于处理天文数据的深度神经网络数据网络模型。这是一个巨大的发现,它显示了机器学习对当今世界产生的深远影响。现在,谷歌大脑已经发布了该技术的完整代码,并向所有人开放。该模型基于卷积神经网络(CNN)。(项目地址:https://feedburner.google.com/fb/a/mailverify?uri=Avbytes)3.ANNVisualizerANNVisualizer是一个python库,可以让我们用一行代码来可视化人工神经网络。它用于与Keras配合使用,并利用python的graphviz库创建一个简洁直观的图形来表示您正在构建的神经网络。(项目地址:https://github.com/Prodicode/ann-visualizer)4.FastPandaspandas是数据科学家和开发人员最灵活、最大的工具之一。非常灵活,有多种方法可以执行特定任务。该项目旨在对这些案例的不同可用方法进行基准测试;此外,在numpy和pandas中都有专门的功能部分。(项目地址:https://github.com/mm-mansour/Fast-Pandas)5.TensorFlow.jsTensorFlow.js是一个开源的硬件加速JavaScript库,用于训练和部署机器学习模型。TensorFlow.js的API灵活直观,可以使用低级JavaScript线性代数库和高级层API在浏览器中定义、训练和运行完整的机器学习模型。(项目地址:https://github.com/jimfleming/tensorflowjs)6.Caffe64Caffe64是一个简单、小巧但非常强大的神经网络库。Caffe64被认为是最容易编译的库和最轻量级的神经网络库。(项目地址:https://github.com/dfouhey/caffe64)7.TensorFlowHubTensorFlowHub是一个促进机器学习模型可重用部分的发布、发现和使用的库。它提供模块,这些模块是可用于新任务的预训练TensorFlow模型。通过在相关任务上复用模块,您可以:用更小的数据集训练模型提高泛化能力大大加快训练速度(项目地址:https://github.com/tensorflow/hub)
