据外媒报道,谷歌母公司Alphabet旗下的DeepMind最近开发了一项人工智能技术,可以在观察2D平面图像后将整个场景渲染成3D 。
一些人工智能研究人员目前正在尝试教会机器像人类一样学习。
我们不是用像素来看待世界,而是环顾我们的环境并对其中的一切做出假设。
DeepMind 团队训练了一个人工智能,让它从以前从未见过的角度猜测事物会是什么样子。
DeepMind 的科学家提出了生成查询网络(GQN),这是一种神经网络,旨在教导人工智能如何从不同角度想象物体场景。
基本上,人工智能会查看场景的 2D 平面图像,然后尝试重新创建它。
在这种情况下,重要的是 DeepMind 的人工智能不使用任何人类标记的输入等。
它只查看三张图像并开始预测场景的 3D 版本会是什么样子。
研究人员正在致力于“完全无监督的场景理解”。
人工智能尚未接受过真实世界图像的训练,因此下一步将是从照片中渲染真实场景。
未来,DeepMind 基于 GQN 的人工智能或许能够仅使用照片生成与现实世界几乎相同的按需 3D 场景。