大数据文摘出品编译:CoolBoy大家好!文摘菌找到了近一个月的Top10机器学习项目榜单,特地搬过来给大家看看你pick哪一个?这份榜单是从过去一个月的250个开源机器学习项目中挑选出来的。作者比较了这一时期新的、重要的结果,并根据许多因素衡量其专业水平。开源项目对程序员非常有用,希望你也能找到对你有所启发的项目!第十名GANimation:Structuralfacialanimationbasedonasingleimage(AlbertPumarolaetal.)[Github344stars]https://github.com/albertpumarola/GANimation?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more这是一个新的GAN系统基于动作单元(AU),它展示了一系列连续的面部结构变化来定义面部表情。这种方法允许调整每个动作单元的指标,并且可以组合其中的几个。第九名Sg2im:基于场景图的图像生成(谷歌开源)【Github670stars】https://github.com/google/sg2im?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more场景图是一种视觉场景的结构表示A图中的节点代表对象,线代表对象之间的关系。本研究介绍了一种输入场景图并输出图像的端到端神经网络模型。第八名Stt-benchmark:Speech-to-textbenchmark(Picovoice)[Github294stars]https://github.com/Picovoice/stt-benchmark?utm_source=mybridge&utm_medium=blog&utm_campaign=read_moreCheetah是为物联网应用设计的Picovoice语音识别引擎。与其他模型相比,Cheetah的表现几乎接近最好的DeepSpeech(0.3对0.32WER)。但是,它的速度快了100倍,内存减少了398倍。这使得Cheetah可以在嵌入小型对象(例如RaspberryPi)的平台上运行,并促进需要更多计算和存储资源的大型模型。No.7Artificial-adversary:生成对抗文本、测试机器学习模型的工具(AirbnbEngineering)【Github155stars】https://github.com/airbnb/artificial-adversary?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more在区分用户生成的文本时,用户可以通过多种方式修改内容以避免检测。这包括将字符换成外观相似的字符。例如,Pleame10,000USDOLLARStobankofscamland(请转给我10,000美元)可能是诈骗信息,但如果写成pl3@se.wireme10,000USDoLarsto,BANKofScamIand,鉴别者很多将失败。使用此扩展库,您可以使用这些方法生成文本并在您自己的机器学习算法上对其进行测试。第6场足球比赛:在桌面上观看足球比赛(KonstantinosRematas)[Github中有247颗星]https://github.com/krematas/soccerontable?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more第5场DanceNet:使用自动编码器、LSTM和混合密度网络舞蹈生成器(Keras)[Github282颗星]https://github.com/jsn5/dancenet?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more4thUnsupervisedMT:基于短语和神经无监督机器翻译(FacebookResearch)[Github490颗星]https://github.com/facebookresearch/UnsupervisedMT?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more今天的机器翻译系统已经接近人类的效率了,但这和很多平行句相关。本文研究了如何在单个语料库的上下文中学习翻译。作者提出了一个神经模型和一个基于短语的模型。两种模型都考虑了初始化参数、模型降噪和并行数据的迭代生成。它们的性能大大优于以前的模型,并且具有更简单的结构和更少的超参数。第三名Vid2vid:Video-to-VideoSynthesis(NVIDIAAI)[Github1797stars]https://github.com/NVIDIA/vid2vid?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more本文提出了一种新型的Video-to-生成结构的视频合成方法。Github包含Pytorch的高分辨率实现。该模型可以将语义标记的地图转换为实际视频,从笔画生成真实语音,或从手势生成人类动作。第二名Glow:Reversible1x1ConvolutionalGenerationFlow(OpenAI)[Github1664stars]https://github.com/openai/glow?utm_source=mybridge&utm_medium=blog&utm_campaign=read_moreGlow是一个可逆的生成模型,它被用来做1x1reversible卷积。它延续了之前的工作(https://arxiv.org/abs/1605.08803)并简化了其结构。该模型可以生成高分辨率图像并发现可以操纵数据的特征。著名Autokeras:自动机器学习(AutoML)开源软件库(金海峰)【Github2637星】https://github.com/jhfjhfj1/autokeras?utm_source=mybridge&utm_medium=blog&utm_campaign=read_moreAuto-Keras是一款开源软件AutoML库。它是由德克萨斯A&M大学的数据实验室开发的。AutoML的最终目标是为没有数据科学背景的各个领域的专家提供简单的深度学习工具。Auto-Keras提供了构建自动查找结构和超参数的深度学习模型的功能。相关报道:https://medium.mybridge.co/machine-learning-open-source-of-the-month-v-aug-2018-ae85e7302ea5【本文为栏目组织大数据文摘原创翻译,微信♂《大数据文摘(id:BigDataDigest)》】点此查看作者更多好文
