当前位置: 首页 > 科技赋能

让人工智能像孩子一样理解世界,这是正确的未来吗?

时间:2024-05-22 10:26:04 科技赋能

文章|海中天人工智能(AI)能否像人类孩子一样观察周围的世界并与之互动?我们就这个问题进行了很多认知心理学实验,研究人员发现了人类和计算机观察图像时的一些重要差异。

研究人员将首先测试人类和计算机视觉的局限性,检查它们识别物体(例如飞机、老鹰、马、汽车和眼镜)的部分或模糊图像的能力。

毫不奇怪,人脑在识别小图像方面比计算机要好得多,即使图像变得更小且更难以识别。

这些发现还为我们了解人类视觉的奇迹打开了一扇新的窗口,并表明我们可以改进计算机算法,让人工智能像孩子一样理解世界。

以色列魏茨曼科学研究所的计算机科学家西蒙·乌尔曼(Shimon Ullman)表示:“研究表明,人类具有不同的识别能力,并且与现有模型相比表现得更好。

” “我认为正是这种差异解释了为什么当前模型在自动分析复杂场景时没有用处,例如理解图片中人们运动的细节或理解人与人之间的社交互动。

”乌尔曼解释说,人脑可以基于已知物体的“构建块”特征来识别部分和模糊的图像。

计算机视觉模型或算法不具备这种能力——它们不理解“组件”知识。

共有 0 人受邀参与这项研究,并测试了 1 个图片片段,因此 Ullman 和同事根本不可能将每个人都带到实验室,利用 Amazon Mechanical Turk 向在线工作人员进行众包实验。

研究人员在实验室对一小群志愿者进行了测试,然后利用测试结果验证了在线结果,测试发现,人脑的表现很容易胜过计算机视觉算法。

当微小的变化导致图像太小且模糊而无法识别时,人类识别小图像的能力会迅速下降。

人类志愿者识别基本小图片的成功率为 65%。

当图片较小且模糊时,识别概率下降至20%。

计算机则不同。

一般来说,计算机算法的性能比人类差。

然而,当图像变得更小、更模糊时,计算机的识别能力就不会表现出这么大的差距了。

结果表明,人脑依赖于计算机算法所缺乏的特定学习和识别机制。

当今的计算机视觉模型使用“自下而上”的方法,在识别复杂特征之前尽可能过滤掉图像中最简单的特征。

人类视觉的不同之处在于它不依赖于“自下而上”的方法。

人脑采用“自下而上”的方法,将特定物体的标准模型与它需要识别的物体进行比较。

“也就是说,大脑会在大脑中存储每种物体类型的模型,然后利用内部模型来确认图像。

它将寻找特定的特征以及特征之间的关系来识别图片中的特定对象是什么。

”乌尔曼解释说,“自下而上和自上而下处理之间的相互作用使我们能够感知更丰富的细节。

”受人类“自上而下”认知方式的启发,新型计算机。

模型和算法可以通过观察更好地理解世界。

为了实现这一目标,乌尔曼的研发项目“数字宝贝”(Digital Baby)获得了一些投资。

最终,乌尔曼希望开发出更强大的人工智能,它天生对世界一无所知,但可以通过视觉和交互来提高学习能力。

就像孩子一样,他们一开始对世界一无所知,但通过吸收信息,他们对世界有了丰富的认识。