当前位置: 首页 > 科技赋能

DeepMind人工智能学会将平面图像转换成3D场景

时间:2024-05-22 12:41:31 科技赋能

据外媒报道,谷歌母公司Alphabet旗下的DeepMind最近开发了一项人工智能技术,可以在观察2D平面图像后将整个场景渲染成3D 。

一些人工智能研究人员目前正在尝试教会机器像人类一样学习。

我们不是用像素来看待世界,而是环顾我们的环境并对其中的一切做出假设。

DeepMind 团队训练了一个人工智能,让它从以前从未见过的角度猜测事物会是什么样子。

DeepMind 的科学家提出了生成查询网络(GQN),这是一种神经网络,旨在教导人工智能如何从不同角度想象物体场景。

基本上,人工智能会查看场景的 2D 平面图像,然后尝试重新创建它。

在这种情况下,重要的是 DeepMind 的人工智能不使用任何人类标记的输入等。

它只查看三张图像并开始预测场景的 3D 版本会是什么样子。

研究人员正在致力于“完全无监督的场景理解”。

人工智能尚未接受过真实世界图像的训练,因此下一步将是从照片中渲染真实场景。

未来,DeepMind 基于 GQN 的人工智能或许能够仅使用照片生成与现实世界几乎相同的按需 3D 场景。