本文作者是Rethink Robotics联合创始人、董事长兼首席技术官Rodney Brooks。
布鲁克斯拥有斯坦福大学计算机科学博士学位,并在麻省理工学院任教多年,是著名的机器人学教授。
在创立 Rethink Robotics 之前,他创立了麻省理工学院计算机科学和人工智能实验室,并共同创立了 iRobot。
Rethink Robotics于2016年成立于波士顿,致力于开发用于制造生产和分拣过程的智能协作机器人。
上帝按照自己的形象创造了人类。
人类按照自己的形象创造了人工智能(AI)。
至少事情是这样开始的。
人类,如海豚、黑猩猩和倭黑猩猩,可能低于一定的智力阈值。
一些声称拥有基于人工智能的系统的公司经常在用户不知情的情况下让人类在其在线系统中处理棘手的任务。
这可能会严重混淆公众对当今人工智能范围的理解。
我一直在思考,为了达到超人工智能或者人类水平的智能,我们需要做哪些研究,需要解决哪些问题,以及我们已经解决了哪些难题。
62 年来,我们一直在不懈地努力,但很明显,直到现在我们才接近实现所有必要的突破。
爱因斯坦在2000年就预言了引力波的存在,但直到99年后我们人类才第一次探测到引力波。
有些事情的成功是一个漫长的过程,需要很多新技术,需要很长时间的理念成熟,需要很多优秀的人才投入其中。
我觉得人类层面的人工智能可能就是这样,但是更复杂,可能需要几百年才能实现。
过去 62 年来,至少有四种主要的人工智能方法。
当然,其他人可能总结了不同的方法。
在我看来,四种主要方法和大致开始日期是: 1. 符号(年份) 2. 神经网络(年份,年份,年份,年份,年份...) 3. 传统机器人(年份) 4. 基于行为机器人(年)符号 符号通常由与单词相对应的字符串表示。
然后人们建立它们之间的关系并对其进行编码,例如instanceof运算符和is字符串。
当我们在搜索引擎中输入查询时,我们选择使用符号来挖掘人工智能系统对世界的理解。
系统进行一些推理和演绎,然后生成一个网页列表,它推断出与我们正在寻找的内容相匹配(它实际上并不知道我们对应于其数据库中的“人”符号)。
然后我们会浏览选定的信息并点击一两个最匹配的网页。
如果信息不是我们想要的,我们会输入新的符号或者修改原来的符号来进行新的搜索。
2020年11月17日,《纽约时报》报道了一则新闻,向世界展示了一个新特征。
谷歌程序自动为下图生成的标题:“一群年轻人在玩飞盘游戏。
”我认为那是人们真正开始关注深度学习的时候。
即使对于人工智能研究人员,尤其是那些研究基于符号的人工智能的人来说,程序能够做到这一点也是一个奇迹。
然而,我也觉得人们混淆了表现和能力。
如果一个人有同样水平的表现,能够准确地描述这个画面,那么人们自然会期望这个人有足够的能力来认识世界。
他/她可以回答以下每个问题: 飞盘的形状是什么?粗略地说,一个人能扔多远?人们可以吃飞盘吗?大约有多少人可以同时玩飞盘?三个月大的宝宝可以玩飞盘吗?今天天气适合玩飞盘吗?但生成上述标题的深度学习神经网络无法回答这些问题。
在人工智能的最初几十年,传统机器人处于基于符号的人工智能阶段。
研究人员试图通过制造机器人来实现人工智能。
其中一些机器人可以四处移动并推动物体。
还有固定在指定位置的机械臂。
然而,制造同时具有上述两种功能的关节臂移动机器人是很困难的。
基于行为的机器人技术 几年前,我花了 10 年时间研究计算机视觉,试图从图像中提取世界的符号描述,并在传统机器人技术中构建机器人规划系统,让机器人能够在模拟或现实世界中运行。
但我很沮丧。
我开始思考昆虫在现实世界中导航的能力,以及它们如何用很少的神经元(当然少于现代深度学习网络中的人工神经元数量)来实现这一点。
当我思考他们是如何做到这一点时,我意识到简单有机体的进化路径可能不是从构建世界的符号或三维建模系统开始的。
相反,这种演变是通过感知和行动之间非常简单的联系开始的。
在这种思维导致的基于行为的方法中,有许多并行的行为同时运行,试图理解一小部分感知并依靠它们来驱动世界上的简单行为。
通常,行为会给机器人的执行器带来冲突的命令,必须采取措施解决这种冲突。
然而,这并不需要依赖于一个完整的世界模型,而是解决冲突的机制必须是启发式的。
正如人们可能猜测的那样,进化会产生这样一种启发式机制。
下面是这四种人工智能方法和人类孩子的得分对比: 从上表可以看出,如果人类孩子在这六项能力中每项都得分为0分,则四种人工智能方法的总分方法将是8至9分。
一如既往,我认为我们可能严重高估了当前人工智能系统的能力。