当前位置: 首页 > 科技赋能

微软“AI Painter”来了!不过画功有点差

时间:2024-05-22 17:40:51 科技赋能

|伟宏介绍:微软深度学习技术中心的研究人员开发了一种人工智能,可以根据你输入的信息自动生成图像。

然而,VICE杂志作者Sarah Emerson尝试了一个相关的DEMO,最后发现AI的工作确实没有那么好。

我喜欢做坏事的技术。

比如从建筑物上掉下来的机器人或者写出疯狂卡拉 OK 歌曲的算法。

他们总是那么“努力”。

所以,一个叫AttnGAN的AI让我很高兴。

这是一种使用生成对抗网络 (GAN) 的机器学习算法,经过训练可根据文本输入生成图像。

它是由微软深度学习技术中心的研究人员于今年 1 月发布的。

同时,他们的论文也发表在 arXiv.org 上。

理论上,AttnGAN 可以根据文本内容生成图像,但目前它的表现并不好,有时甚至会生成非常糟糕的图像。

公平地说,当研究人员在特定数据集(例如鸟类图像)上训练人工智能时,它能够生成令人信服的鸟类渲染图。

然而,当在包含更多多样化图像的更大数据集上进行训练时,AttnGAN 的艺术成就就变得捉襟见肘了。

(AttnGAN针对特定鸟类数据集生成的图像)??AttnGAN可以为简单的文本内容生成相应的图像,例如“一只猫”。

不过,研究人员指出,“它无法识别具有更复杂文字描述的鸟类,例如‘绿冠黄翅红腹的鸟’”。

(纽约大学的 Cristobal Valenzuela 基于 AttnGAN 制作的网页演示) 纽约大学的技术专家兼研究员 Cristobal Valenzuela 基于 AttnGAN 制作了一个演示,以便读者可以尝试这个 AI 的效果。

AttnGAN 是一个名为 Runway 的大型项目的一部分,该项目是一个 AI 工具包,可为设计和创意平台添加人工智能功能,以创建更多创意内容。

Valenzuela 还在开发 marrowa,这是一个交互式网站,研究人工智能如何像大脑一样处理信息。

“我正在研究这项技术,因为我相信人工智能具有我们不知道的创造潜力,”瓦伦苏埃拉在推特上告诉我。

“虽然一些生成的图像非常奇怪(就像你输入类似人类的图像),”巴伦苏埃拉在 Twitter 上告诉我。

相关文字),但有些人在输入诗歌、歌词、语录后仍然得到很多鼓舞人心或富有诗意的画面。

“除了是一个有趣的游戏之外,Valenzuela认为人工智能也是一个实用的工具。

例如,它可以用于CG和数字动画的合成,甚至可以根据人们的意愿自动生成动画角色。