这种能力被算法掌握后,AlphaGo出现打败人类象棋高手,OpenAIFive也出现了,在电子游戏领域彻底虐了人类棋手。但即便如此,人类的探索能力仍然是最先进的人工智能无法企及的。例如,婴儿可以从爬行和探索中学会识别三维空间,还有一些计算机视觉总是曝出被平面照片欺骗的新闻。推出更高性能的3D视觉算法需要巨大的计算资源。从这个角度来看,人脑在有效性和效率上无疑碾压AI。那么,能否引入儿童的学习能力,实现更智能的AI呢?这个猜测就好比“给我爱因斯坦的大脑,我就能得诺贝尔奖”,有点讽刺,但也有点重要。5岁小孩碾压AI,“玩”够了不妨在假期做一次生活观察,看看孩子们是如何探索世界的?如果一个玩具看起来有多种玩法,但他们不知道哪一个是正确的,幼儿就会进行假设驱动的探索,如果“假设”失败,他们就会转向新玩具。研究表明,当一个11个月大的婴儿看到许多违反物理定律的现象时,他会情不自禁地进行更多探索,甚至做出一些违背行为来实践自己的假设。比如,当你看到一辆汽车漂浮在空中,它颠覆了你之前的认知,你会怎么做?婴儿会选择用力猛击桌子上的玩具,想知道这种“不合理”的情况是如何发生的(所以阻止幼儿打破你的小雕像的唯一方法就是根本不让他们看到它们)。这种“不见黄河不死”的自由探索,有时会让父母和大人感到不安,但抽象的“假设”却能让人类做出很多预测,想象出很多新的可能性。这是一种非常有意义的学习方式,也是人类创造力的源泉。但就像小王子认为无聊的大人看不到“蟒蛇腹中的大象”一样,很遗憾,这种探索能力是幼儿的特长,大多数情况下只存在5岁之前。也使他们成为宇宙中最好的学习者。既然儿童的行为信息量如此之大,科学家们自然想要这样做。事实上,儿童发展对人工智能的进步起到了重要的引导作用。科学家将好奇心引入神经网络,创造出深度强化学习,通过奖励反馈,激励代理(agent)主动探索和理解环境,更新模型参数。这使得人工智能能够在视频游戏等需要通用智能的复杂场景中自主学习技能并做出自主决策,而不是人类通过庞大的标记数据集预先给出答案。其他类型的儿童行为也有价值。前面提到的“心不见黄河不死”的探索,已经转化为深度优先的搜索策略。DeepMind和加州大学伯克利分校的研究人员开发了一个3D导航和解谜环境。智能体(agent)沿着特定的路径探索,如果遇到死胡同,就回头寻找下一条未探索的路径继续前进。这听起来像是儿童迷宫游戏吗?这允许代理接触到各种经验并在信息较少的环境中工作;降低对数据量的依赖,改变计算资源吃紧的现状,让很多数据小、样本少的领域(比如金融、医疗)也可以智能化。将儿童的探索行为应用到人工智能中,可以让一切变得更好。理想情况下确实如此,但现实总是喜欢和科学家开玩笑,对人类来说也算是一个“杀手锏”。在AI能力飙升的当下,人类为何还能稳坐智慧宝座?需要注意的是,这些类似孩子的探索策略通常更多地用于提升agent在训练过程中的经验值,而不是支持决策过程中的快速学习和探索。用人的话来说就是“知道很多道理,却未必能过上好日子”,因为在选择的关键时刻,你会掉链子。以前面提到的深度优先搜索(DFS)为例。科学家发现,如果让孩子自由探索,他们与智能体根据DFS所做的动作有90%的相似度,而以目标为导向(找到Gummy)去探索,96%的路线是相似的。但不同的是,探索更多的孩子最终花更少的时间完成任务,而代理则相反。如果代理发现一个有趣的地方(获得奖励),它会不断重新访问该区域,直到它最终决定不再感兴趣,这会导致泛化能力差(无法形成最优策略)。不同的是,孩子不是孤立地被动学习,也不是在目标的驱使下被动学习,而是不断地进行实验和收集信息,将自己的认知和经验与获得的信息相结合,编织出丰富的世界模型。而即使是最复杂的机器探索方式,也只能服务于特定的目标,一时半会儿也无法完美匹配这个充满各种“意外”的现实世界。为什么AIagent的性能在一定的探索能力下还是差强人意?首当其冲的是实验室与真实环境的巨大差异。过去,深度强化学习是“在机器上说话”。这不是与人类的二维游戏,也不是数字网格中的国际象棋游戏。儿童的探索发生在信息丰富的三维现实世界中,许多潜在因素难以在实验中应用。这也是为什么,当今最强大的AI智能机器人,无法达到一个小学毕业的优秀人类服务员的工作能力,能够像他们一样快速适应环境,完成各种复杂的任务。此外,儿童发展心理学研究很难在AI产业链中形成“闭环”。真正激发人工智能发展服务现实的能力,不仅需要构建具有更强探索能力的智能体,还需要不断学习人类的认知能力,推动人工智能的理论创新和软硬件升级。人工智能本身(比如构建3D训练环境),这一系列的链式突破最终可以将技术理念转化为现实的生产力。“用心创造奇迹”的深度学习高光时刻就这样来了。沿着这个方向,我们可以进一步理解如何弥合智能体与人类之间的鸿沟。下一代AI,逐渐走出迷雾的真实未来在过去的几年里,深度学习取得了传统算法无法企及的进步,并催生了大量的产业应用,但事实上,目前的深度学习还是很笨的——比如大部分人通过几十个小时的学习就可以学会开车,而全自动的L5级无人车还是一个遥不可及的梦想。图灵奖获得者GeoffreyHinton一直非常渴望找到一种新的方式来实现深度网络,并认为当前(最广泛的反向传播算法)根本不是大脑的工作机制。另一位图灵奖获得者YannLeCun认为,在某些游戏中,需要大幅增加模型的训练时间,才能达到或超过职业人类玩家的水平。通过孩子的学习模式发现,目前最好的AI还不如一个5岁孩子的智力。或许我们可以回答“下一代人工智能应该是什么样子”,这是神经网络最重要的未解问题之一。至少要有两个提升:1.意识。目前公认的文本表达能力最高、模型最大的GPT-3也被专家吐槽为“无脑作业”,但它写的句子并不能真正看懂。具有自主探索、决策和推理能力,能够理解周围环境的人工智能才是真正的人工智能。2、能效比。为什么即使有瑕疵,仍然没有阻止深度学习引领人工智能进入发展热潮?核心原因是深度神经网络大大降低了全社会处理、挖掘和应用大数据的成本。与人脑相比,现有计算硬件的功耗非常高。不断提升AI的性价比是避免又一个寒冬的必由之路,也需要更先进的算法。这两个基本问题只能交给科学家和工程师在针尖上大做文章。对于我们普通人来说,保持孩子般的对世界的好奇心,去接触充满各种信息的大自然,由此产生的系统认知和思考能力,或许是机器所无法企及的,弥足珍贵。【编者推荐】在SpringBoot中从类路径加载文件AI加速目标定位助力人机融合即时出击如何判断DevOps变更的优先级?iPhone12mini没有5G吗?物联网如何使会计行业受益?
