对于那些惊叹 Facebook 今年在社会上面临的一系列挑战的人来说,以下是该公司人工智能团队的最新研究成果。
目标:“让人工智能更具吸引力。
” Facebook 人工智能部门的研究人员找到了一种方法来训练机器学习模型,不仅可以注释图像标题,还可以以各种评论风格描述照片,这些评论风格可能对特定的人来说更有趣。
他们写道,成功地自动在图像上添加描述的传统机器学习任务“对于验证机器是否理解图像的内容很有用”,“但它们不像角色那样与人类互动。
”在这种情况下,性格可以从甜蜜到傲慢到焦虑,以及介于两者之间的各种排列。
例如,一张三明治的图片可以被亲切地标记为“那是一个可爱的三明治”,或者更讽刺的是,“我做的食物比这个更好”。
这项工作融合了多种最先进的技术,例如如何确定图像的内容以及如何生成新颖的句子。
红帽 OpenShift 应用程序运行时可帮助企业使用云交付模型,并大大简化红帽 OpenShift 平台上应用程序和服务的持续交付。
红帽 OpenShift 应用程序运行时基于经过验证的开源技术,还为开发团队提供了多种现代化选项,以便现有应用程序顺利过渡到云。
这篇题为“通过个性吸引图像字幕”的论文由 Facebook 人工智能研究中心的 Kurt Shuster、Samuel Humeau、Hailiang Hu、Antoine Bordes 和 Jason Weston 撰写,发表在 arXiv 预印本服务上。
他们复制的“TransResNet”创建的神经网络模型的作者依赖于“编码”图像数据中内置的几种最先进的方案,包括 Sebastian Marcel 和 Yan Rodriguez 开发的“ResNet”编码器2001 年,一款名为“Torchvision”的软件被开发出来。
该编码器的输出随后被提供给“具有 ReLU [受限线性单元]激活单元的多层感知器”。
为此,作者添加了人格特质的“嵌入”。
接下来,作者为他们所谓的“下一个话语检索任务”训练两个编码器,该任务使用一个包含“17 亿对话语、一个编码上下文和下一个话语的另一个编码候选”的数据库。
”。
“作者随后表明,TransResNet 在一组将字幕应用于图像的标准基准上具有竞争力,甚至更胜一筹。
但为了表明字幕的个性可以产生影响,他们让一群人看到人类创建的字幕并自动生成作者发现,基于个性的字幕比图像上的中性字幕更有吸引力,使用二项式双尾的胜率为 64.5%。
该测试具有统计显着性。
当将他们的作品与人们撰写的“引人入胜”的字幕进行比较时,研究人员发现“我们最好的 TransResNet 模型几乎与人类作者相匹配,胜率高达 49.5%。
”作者指出,这是进一步开发他们的模型的基准,“在这个领域,超人表现的可能性很快就会出现。
”有趣的是,作者遗漏了一些他们无法模仿的人格特质,比如“分配中心性、无耻、灵活、朴实和隐形”,他们写道,所有这些都很难解释。
这一切可能有更广泛的教训作者写道,在研究小组中,当人们看到两个没有表达具体个性的标题时,他们被要求评估标题的吸引力。
表达积极的观点——“好基蒂!”或类似的内容——另一方面,人们往往会发现积极的标题更有吸引力,但当负面的标题出现时,人们会发现它们不如那些纯粹的消极的标题有吸引力。
,这可能就是要点。