编辑| Rinchy 今天,DeepMind 团队与英国伦敦大学神经科学家合作,在《Nature》发表深度神经网络新论文,验证“网络细胞是否支持向量导航”猜想,从而让 AI 实现空间感知研究人员首先使用神经网络模拟哺乳动物的细胞“网格网络”,然后将其与更大的网络架构相结合,创建了虚拟实验小鼠,并将其放置在虚拟环境中。
通过强化学习,反复完成相同的寻路任务,最终发现小鼠在这个过程中实现了自我进化,探索出最短路径,并得出了网格单元对于基于矢量的导航的重要性的结论。
1、什么是网络细胞?根据以往的研究,人体中影响空间感知的细胞有三类:位置细胞、方向细胞和网格细胞。
其中,位置细胞可以让受试者记住自己曾经去过的地方;方向细胞可以感知受试者应该选择的方向;而网格单元可以将整个空间环境划分为蜂窝状的六边形网格,就像坐标系一样,指导被摄体的方向选择。
网络细胞与空间感知相关的想法是由神经科学家爱德华·莫泽(Edward Moser)于2001年提出。
他因发现位于海马体及其周围的网格细胞和其他与空间感知相关的神经元而获得诺贝尔奖。
贝尔生理学和医学奖。
然而,网格单元仅在空间环境中提供定向传感服务吗?一些研究人员提出,他们还将参与向量计算,以帮助人类规划路径。
DeepMind团队进行的这个实验就是为了验证这个猜想。
2、网络小区对路径规划的影响是模拟人类路径规划的场景。
基于哺乳动物大脑在路径选择方面的相似性,研究人员创建了一个虚拟人工物体(Agent)来充当豚鼠。
首先,研究人员利用神经网络来模拟哺乳动物“网络网格”细胞的过程。
他们生成数据来训练他们的算法。
他们模拟了老鼠在围栏中觅食时的路径,并使用这些数据训练深度学习网络来识别老鼠的位置。
通过这次实验,他们在计算单元中发现了一个类似于网格活动的六边形模型,并模拟了这个模型并将其用于接下来的实验中。
该代理将原始的“网格网络”与更大的网格网络结合起来,并将其置于基于相互通信的循环计算单元的深度学习虚拟空间中。
在这个虚拟空间中,模拟小鼠需要完成从固定起点到指定终点的任务。
研究人员让他们选择自己的路线,并设置了奖励和惩罚机制,让他们在重复路线尝试的过程中受到奖励和惩罚的激励。
实现自我进化,找到通向终点的捷径。
当研究人员将网络细胞生成的六边形网格网络放入深度学习系统中时,虚拟小鼠能够在不断探索的同时找到最佳路径。
然而,当他们刻意阻止这个网格网络形成后,虚拟鼠标就再也无法高效到达终点线了。
通过控制网络细胞的这个变量,研究人员证实了它在虚拟小鼠(即人类)的路径规划中的重要作用。
但目前这一发现只能作为智能算法的基础研究,无法落实到具体应用中。
DeepMind 创始人兼首席执行官、论文合著者哈萨比斯表示:“我们相信人工智能和神经科学相互启发。
这项工作就是一个很好的证明:通过开发一种能够在复杂环境中导航的机器与人造身体”,我们对网格细胞在哺乳动物导航中的重要性有了更深入的认识,“这样的研究方法也可能适用于未来探索大脑听觉和控制肢体的实验,为未来的人工智能提供进一步的指导。
”对智力的开发有促进作用。