第二轮七月AI研究热门榜单来了!之前的列表是根据Twitter点赞数、转推数和Github星数排序的。不过也有网友抱怨推特点赞数可以自动刷,推特点赞的用户未必懂研究。这一次,作者@bycloudai吸取了经验。这一次,指标不再是推文数量,而是Github上的星数。虽然这次的指标不是很专业,但是比起推特,能访问Github的人数可以认为与AI研究的关系更密切。另外,作者还在榜单开头明确表示,本榜单属于与自己无关的野榜单,仅供娱乐。话虽如此,这本“续集榜单”基本保持了上一期的风格,Top10给出了资源库地址、论文链接、书名、作者、出版单位。来看看7月最火AI研究“改进版”,哪些研究上榜~Top1:YOLOv7:Trainablebag-of-freebiessetsnewstate-of-the-artforreal-timeobjectdetectors作者:Chien-YaoWang,AlexeyBochkovskiy,Hong-YuanMarkLiao机构:“中央研究院”信息科学研究所Githubstars:3.8k摘要:YOLOv7在5FPS到160FPS检测器范围内的速度和精度超过所有已知物体,在GPUV100上超过30FPS的所有实时目标检测器中具有最高的准确度56.8%AP。YOLOv7-E6物体检测器(56FPSV100,55.9%AP)比基于Transformer的检测器SWIN-LCascade-MaskR-CNN(9.2FPSA100,53.9%AP)快509%,准确度更高。2%。值得一提的是,这篇论文的作者王建尧(WangJianyao)是哥伦比亚大学机械工程专业的研究生,现在是英特尔的Chrome软件工程师。Top2:Text-GuidedSynthesisofArtisticImageswithRetrieval-AugmentedDiffusionModels作者:RobinRombach、AndreasBlattmann和BjornOmmer组织:路德维希-马克西米利安-慕尼黑大学(Ludwig-Maximilians-Universit?tMünchen)Github星数:2.4k摘要:新架构最近改进了生成图像合成,从而在各种任务中实现了卓越的视觉质量。尤其值得一提的是“AI-Art”领域。通过结合语音和图像合成模型,建立了所谓的“提示工程”,其中使用精心选择和组合的句子在合成图像中实现某种视觉风格。本文提出了一种基于检索增强扩散模型(RDM)的替代方法。在RDM中,在每个训练实例的训练期间从外部数据库中检索一组最近邻,并且扩散模型以这些信息样本为条件。来看看AI-Art在论文中的效果吧~Top3:NUWA-Infinity:AutoregressiveoverAutoregressiveGenerationforInfiniteVisualSynthesis作者:吴晨飞,梁健,胡小薇其他机构:北京大学微软亚洲研究院,MicrosoftAzureAIGithubStar数:2.4k第三名是之前备受关注的全华班AI大作《女娲无限》。4.TrainingTransformersTogether(1Kstars)作者:AlexanderBorzunov,MaxRyabinin,TimDettmers等机构:俄罗斯国立高等经济学院、华盛顿大学等5.Theseus:ALibraryforDifferentiableNonlinearOptimization(791stars)作者:LuisPineda、TaoshaFan、MaurizioMonge机构:MetaAI、RealityLabsResearch6、k-meansMaskTransformer(704颗星)出版商:约翰霍普金斯大学、谷歌研究院存储库:https://github.com/google-research/deeplab2论文:https://arxiv.org/abs/2207.04044v17,XMem:Long-TermVideoObjectSegmentationwithanAtkinson-ShiffrinMemoryModel(699星)出版商:伊利诺伊大学香槟分校资源库:https://github.com/hkchengrex/XMem论文:https://arxiv.org/abs/2207.07115v28,TinyViT:FastPretrainingDistillationforSmallVisionTransformers(656stars)出版商:MicrosoftResearch,MicrosoftCloud+AIResourcesLibrary:https//github.com/microsoft/cream论文:https://arxiv.org/abs/2207.10666v19,TowardsGrandUnificationofObjectTracking(644stars)发表者:大连理工大学、字节跳动、香港大学、鹏城实验室资源库:ttps://github。com/masterbin-iiau/unicorn论文:https://arxiv.org/abs/2207.07078v310,Multiface:ADatasetforNeuralFaceRendering(337stars)单位:MetaRealityLab存储库:https://github.com/facebookresearch/multiface论文:https://arxiv.org/abs/2207.11243v1
