当前位置：首页 > 科技赋能

微软“AI Painter”来了！不过画功有点差

时间：2024-05-22 17:40:51 科技赋能

|伟宏介绍：微软深度学习技术中心的研究人员开发了一种人工智能，可以根据你输入的信息自动生成图像。

然而，VICE杂志作者Sarah Emerson尝试了一个相关的DEMO，最后发现AI的工作确实没有那么好。

我喜欢做坏事的技术。

比如从建筑物上掉下来的机器人或者写出疯狂卡拉 OK 歌曲的算法。

他们总是那么“努力”。

所以，一个叫AttnGAN的AI让我很高兴。

这是一种使用生成对抗网络 (GAN) 的机器学习算法，经过训练可根据文本输入生成图像。

它是由微软深度学习技术中心的研究人员于今年 1 月发布的。

同时，他们的论文也发表在 arXiv.org 上。

理论上，AttnGAN 可以根据文本内容生成图像，但目前它的表现并不好，有时甚至会生成非常糟糕的图像。

公平地说，当研究人员在特定数据集（例如鸟类图像）上训练人工智能时，它能够生成令人信服的鸟类渲染图。

然而，当在包含更多多样化图像的更大数据集上进行训练时，AttnGAN 的艺术成就就变得捉襟见肘了。

（AttnGAN针对特定鸟类数据集生成的图像）??AttnGAN可以为简单的文本内容生成相应的图像，例如“一只猫”。

不过，研究人员指出，“它无法识别具有更复杂文字描述的鸟类，例如‘绿冠黄翅红腹的鸟’”。

（纽约大学的 Cristobal Valenzuela 基于 AttnGAN 制作的网页演示）纽约大学的技术专家兼研究员 Cristobal Valenzuela 基于 AttnGAN 制作了一个演示，以便读者可以尝试这个 AI 的效果。

AttnGAN 是一个名为 Runway 的大型项目的一部分，该项目是一个 AI 工具包，可为设计和创意平台添加人工智能功能，以创建更多创意内容。

Valenzuela 还在开发 marrowa，这是一个交互式网站，研究人工智能如何像大脑一样处理信息。

“我正在研究这项技术，因为我相信人工智能具有我们不知道的创造潜力，”瓦伦苏埃拉在推特上告诉我。

“虽然一些生成的图像非常奇怪（就像你输入类似人类的图像），”巴伦苏埃拉在 Twitter 上告诉我。

相关文字），但有些人在输入诗歌、歌词、语录后仍然得到很多鼓舞人心或富有诗意的画面。

“除了是一个有趣的游戏之外，Valenzuela认为人工智能也是一个实用的工具。

例如，它可以用于CG和数字动画的合成，甚至可以根据人们的意愿自动生成动画角色。

微软“AI Painter”来了！不过画功有点差相关文章