研究表明,人工智能听起来很强大,但目前先进的人工智能还远不能解决人类4岁小孩就能轻易解决的问题。那么,人工智能会变得比4岁孩子还聪明吗??您可能会从儿童处理信息的方式以及他们的学习方式中得到启发。 每个人都听说过人工智能的新进展,尤其是机器学习,尽管它的名字令人印象深刻,但它主要由检测大型数据集中统计模式的技术组成。是的,人类学到的远不止于此。 人类如何学习 我们如何了解我们周围的世界?即使是孩子,我们也可以学到很多东西。一个四岁的孩子已经知道植物、动物和机器;欲望、信念和情绪;甚至恐龙和宇宙飞船。 科学把我们对世界的认识扩展到难以想象,扩展到宇宙的边缘和时间的开始,我们用这些知识做出新的分类和预测,想象新的可能性,并在这个世界上做出新的事情发生了,但所有触动世界的都是光子流撞击我们的视网膜和空气扰动我们的耳膜,当我们只有如此有限的例子时,我们如何在我们的眼睛后面使用几磅灰色粘液?这一切有什么作用?(来自史密森尼学会杂志) 到目前为止,更好的答案是我们的大脑根据触及我们各种感官的具体而混乱的数据进行计算,然后这些计算产生对世界的理解。这些表征似乎是结构化的、抽象的和层次化的,它们包括对三维物体的感知、构成语言基础的语法,以及诸如“心智理论”之类的心智能力。 “心智理论”让我们了解他人的想法,这些表现让我们做出各种新的预测,以人类特有的创造性方式想象许多新的可能性。 这种学习不是唯一的智力形式,但对人类来说尤为重要,这种智力是幼儿的特长,虽然孩子的计划和决策能力很差,但他们是世界上最好的学习者,事实上,很多将数据转化为理论的过程发生在我们五岁之前。 人类学习的两种基本方法 自亚里士多德和柏拉图以来,有两种基本方法来解决我们如何知道我们所知道的问题,它们仍然是机器学习的支柱。 亚里士多德自下而上地解决了这个问题:从感官开始——光子的流动和空气中的振动(或数字图像或录音的像素或声音样本),看看你是否能发现从中学习的模式,这这种方法被哲学家大卫休谟和J.S.穆勒等古典联想主义者采用,后来被行为心理学家如巴甫洛夫和B.F.斯金纳采用。学者们更进一步。从这个角度来看,表示的抽象和层次结构是一种幻觉,或者至少是一种附带现象,所有的工作都可以通过关联和模式检测来完成,尤其是在有足够数据的情况下。 这种自下而上的学习方式和柏拉图的自上而下的学习方式一直并存,永远无法压倒对方。 或许我们从具体的数据中得到抽象的知识,是因为我们已经知道了很多,尤其是因为进化,我们已经有了一系列基本的抽象概念。像科学家一样,我们可以使用这些概念来构建关于世界的假设,然后,如果这些假设为真,我们就可以预测数据应该是什么样子,而不是像柏拉图那样试图从原始数据中发现模式,这种方法也被笛卡尔和诺姆乔姆斯基等“理性主义”哲学家和心理学家所采用。 一个日常的例子说明了上述两种方法之间的区别是垃圾邮件泛滥的问题,其中邮件数据由收件箱中的一长串未分类邮件组成,实际情况是有些邮件不是垃圾邮件,有些是垃圾邮件垃圾邮件。如何使用数据来区分它们? 首先考虑自下而上的方法,你会注意到垃圾邮件往往有一些特征:长长的收件人名单,从尼日利亚发送,文本提到百万美元的奖金或春药,问题是的,非常有用的非垃圾邮件可以有这些特征,如果您查看足够多的垃圾邮件和非垃圾邮件示例,您可能会发现垃圾邮件不仅往往具有这些特征,而且它们往往以特定的方式同时出现(尼日利亚来源和提到的100万美元的奖金表明有问题)。 事实上,可能存在一些微妙的更高级别的相关性,可用于区分垃圾邮件和有用的非垃圾邮件-例如,拼写错误和IP地址是特殊的,如果检测到那些特殊模式,则可以过滤掉垃圾邮件.自下而上的机器学习技术正是这样做的,学习者被给予数百万个例子,每个例子都有一定的特征,每个例子都被标记为垃圾邮件(或其他一些类别),计算机可以提取区分两者的特征模式,即使这些功能很微妙。 自上而下的方法怎么样?例如,你收到《临床生物学杂志》编辑的邮件,内容是你写的一篇论文,说要发表你的一篇文章,邮件来源不是尼日利亚,文中也没有提到伟哥和百万美元奖金,该邮件不具备垃圾邮件的任何特征,但通过对垃圾邮件生成过程的现有知识和抽象思考,可以得出该邮件可疑的结论: 1.您知道垃圾邮件发送者试图利用人类的贪婪从人们那里榨取金钱。 2。你也知道合法的“开放获取”期刊已经开始通过向作者而不是订阅者收费来支付费用,而你又不是从事临床生物学或其他工作。 结合所有这些因素,我可以提出一个关于电子邮件来源的新假设,其目的是诱使学术界花钱在假期刊上“发表”一篇文章。这封邮件和其他垃圾邮件一样,都源于一个可疑的形成过程,虽然看起来一点都不像垃圾邮件,但你可以从一个例子中得出这个结论,你可以跳出邮件本身,做一个Google搜索有关发送它的编辑的信息,以进一步检验您的假设。 在计算机术语中,您从一个包含贪婪和欺骗等抽象概念的“生成模型”开始,并描述垃圾邮件是如何生成的,让您可以识别来自尼日利亚的典型垃圾邮件,还可以让您想象许多不同种类的潜在垃圾邮件垃圾邮件,当你收到《华尔街日报》的邮件时,你可以逆向工程:“这看起来像是垃圾邮件生成过程中生成的那种邮件。” 人工智能的新鲜和令人兴奋的是,人工智能研究人员最近开发了这两种强大而有效的学习方法,但批评者认为这些方法本身并没有什么新的和深刻的。 自下而上的深度学习 在20世纪80年代,计算机科学家发明了一种巧妙的方法让计算机检测数据中的模式:链式(或神经网络)架构。这种方法在1990年代走下坡路,但最近随着强大的“深度学习”方法(如Google的DeepMind)的兴起而复苏。 例如,您可以为深度学习程序提供一组标记为“猫”(猫)、“房子”(房子)等的网络图像。该程序能够检测区分两组图像的模式,并使用此信息正确标记新图像。 被称为无监督学习的机器学习技术检测未标记数据中的模式;他们只是寻找一组特征——科学家称之为因素分析。在深度学习机器中,这些过程在不同层次上重复进行。有些程序甚至可以从像素或声音的原始数据中发现相关特征。例如,计算机可能首先检测原始图像中边缘和线条对应的图案,然后从这些图案中找到一个对应于人脸的图案,等等。 另一种历史悠久的自下而上技术是强化学习。在1950年代,B.F.Skinner在JohnWatson的工作基础上,通过给鸽子分配特定的奖励和惩罚来操纵鸽子执行复杂的动作。基本思想是重复鸽子获得奖励的行为,直到完成所需的行为才重复受到惩罚的行为。即使在斯金纳的时代,这个简单的过程,一遍又一遍地重复,也可能导致复杂的行为。计算机被编程为以超越人类的规模一遍又一遍地执行简单的操作。想象一下,计算系统可以通过这种方式学习非常复杂的技能。强化学习(来自网络) 例如,谷歌的DeepMind研究人员将深度学习和强化学习相结合,教计算机玩Atari视频游戏,而计算机不知道游戏是如何玩的,一开始,它的行为是随机的,它只会获取有关屏幕在每个时刻的外观以及得分情况的信息。深度学习帮助它解释屏幕上的特征。强化学习激励系统获得更高的分数,计算机在其中的几个游戏中非常擅长,但它也完全没有能力玩其他人类容易玩的游戏。 通过以类似的方式结合使用深度学习和强化学习,DeepMind的AlphaZero程序取得了成功,在国际象棋和围棋方面击败了人类玩家,尽管他们只了解游戏规则的基本知识和一些规划能力。AlphaZero还有一个有趣的特点:它可以和自己进行数亿次对局,在这个过程中,它会消除导致失败的错误,同时重复和明确导致胜利的策略。使用生成对抗网络技术的系统会观察数据并生成数据。 当你拥有将这些技术应用于非常大的数据集、数以百万计的电子邮件或Instagram图片或录音的计算能力时,你就可以解决以前看起来非常困难的问题,这就是计算机令人兴奋的地方科学。 但值得记住的是,这类问题——比如识别图片中的猫或“Siri”这样的口语词——对蹒跚学步的人类来说是轻而易举的事,这是计算机科学中最有趣的发现对我们来说很容易(例如识别猫)对计算机来说很难——比下象棋或围棋难得多。计算机需要数百万个示例来对我们仅用几个示例即可分类的对象进行分类。 自上而下的贝叶斯模型 自上而下的方法在人工智能的早期发展中发挥了重要作用,在2000年也经历了复兴,概率模型或贝叶斯模型以生成模型的形式出现。 早期使用这种方法的尝试面临两个问题。首先,大多数图示模式通常可以用许多不同的假设来解释:您来自期刊编辑的电子邮件可能不是垃圾邮件,这似乎不太可能。第二,生成模型中使用的概念从何而来?柏拉图和乔姆斯基说你天生就有这些东西,但我们如何解释我们如何学习新的科学概念?孩子们如何理解恐龙和宇宙飞船? 贝叶斯模型将生成模型和假设检验与概率论相结合,旨在解决这两个问题。贝叶斯模型允许您计算特定假设在给定数据的情况下为真的可能性,并且通过对我们已有的模型进行小的系统调整并根据数据对其进行测试,我们有时可以从旧的概念和模型中创建新的概念和模型的,但这些优势被其他问题所抵消。贝叶斯技术可以帮助您选择两个假设中哪个更有可能,但几乎总是存在大量潜在假设,没有任何系统可以有效地将它们全部考虑在内。贝叶斯模型(来源于网络) 纽约大学的BrendenLake和他的同事使用这种自上而下的方法解决了另一个对人类来说很简单,但对计算机来说非常困难的问题:识别不熟悉的手写字符。看日本卷轴上的一个字符,即使你以前从未见过,你也能分辨出它与其他日本卷轴字符是否相似或不同,你可能会画出来,甚至根据你所看到的这个字符被设计成一个假的日语字符。 识别手写字符的自上而下的方法是为计算机提供每个字符的数千个示例,让计算机提取显着特征,而Lake团队则为这个程序提供一个字符书写过程的通用模型of:笔画向右或向左,完成一个笔画后,开始写下一个,等等。当程序看到一个特定的字符时,它可以推断出最有可能导致该字符的笔画顺序——就像你根据垃圾邮件的形成过程推断你的邮件很可能是垃圾邮件,那么它可以判断一个新的字符是来自这个笔顺还是不同的笔顺,它也可以生成一组相似的笔画。 这个程序比应用于完全相同数据的深度学习程序更有效,它实际上反映了人类的行动过程。 这两种机器学习方法各有利弊,自下而上的方法一开始程序不需要太多知识,但需要大量数据,只能以有限的方式泛化,在自上而下的方法,该程序可以从几个例子中学习并做出更广泛和更多样的概括,但你需要在开始时给它提供更多的东西,目前许多研究人员正在尝试结合这两种方法来实现贝叶斯使用深度学习进行推理。 最近人工智能的成功部分是由于那些旧思想的延伸,但更重要的是,由于互联网,我们有更多的数据,由于摩尔定律,我们有更多的计算能力来应用这些数据。 另外,一个被低估的事实是,我们拥有的数据已经被人类整理和处理过,网上发布的猫的图片是典型的猫图片-人类已经选择的“好”图片,谷歌翻译效果很好因为它借鉴了数以百万计的人工翻译,将它们概括为新文本,而不是真正理解句子本身。 孩子与机器的学习方式有何不同? 然而,儿童真正了不起的地方在于,他们以某种方式结合了每种机器学习方法的特点,并做出了超越它们的巨大事情。 在过去的15年里,发展主义者一直在探索儿童从数据中学习结构的方式,四岁的孩子只需要像自上而下的系统那样从一两个数据示例中进行概括。可以学习不同的概念,但它们也可以从数据本身学习新的概念和模型,就像自下而上的系统一样。 例如,在实验室里,研究人员给了孩子们一个“Blickert检测器”——一种他们以前从未见过的新型机器,它是一个盒子,当你把某些物体放在上面时,当它转动时打开时,它会亮起并播放音乐。研究人员只给了孩子们一两个例子来说明机器是如何工作的。他们告诉他们,他们可以通过在上面放两个红色方块来让它工作,而他们可以通过在上面放一个绿色方块和一个黄色方块来让它工作。 即使是18个月大的婴儿也能立即理解使其起作用的基本原理:两个正方形必须相同。他们将这一原则推广到新的例子中:例如,他们会选择两个形状相同的物体来使机器工作。在其他实验中,研究人员表明,孩子们甚至可以弄清楚一些隐藏的、无形的属性使机器工作,或者机器根据一些抽象的逻辑原理运行。 在孩子们的日常学习中也能看到这一点。即使数据相对较少,幼儿学习生物学、物理学和心理学的抽象和直观理论的速度也与成人科学家一样快。 近年来,人工智能系统在机器学习方面取得的显着成就,无论是自下而上还是自上而下的方法,都发生在有限且定义明确的假设和概念空间中——一组精确的游戏棋子和动作,一组预先确定的图形。相比之下,儿童和科学家有时会以激进的方式改变他们的概念,进行范式转变,而不是简单地调整他们已有的东西。(来自网络) 四岁的孩子可以很快认出猫,理解文字的意思,但他们也可以做出创造性的、令人惊讶的新推论,同样远远超出他们的经验范围。比如笔者自己的孙子最近就解释说,如果一个大人还想做回孩子,就尽量不要吃任何健康的蔬菜,因为健康的蔬菜可以让孩子长成大人,这说得通。任何成年人都不接受假设,只有孩子才会做出这样的假设。事实上,作者和同事已经系统地证明,学龄前儿童比年龄较大的儿童和成人更善于做出不太可能的假设,而我们对他们如何进行这种创造性学习和创新知之甚少。 然而,观察孩子们的行为可能会给程序员一些有用的提示,告诉他们从哪里学习计算机。儿童学习的两个特点尤为突出。孩子们是主动的学习者,他们不像人工智能那样被动地吸收数据。就像科学家进行实验一样,孩子们天生就有动力通过无休止的游戏和探索从周围的世界获取信息。 最近的研究表明,这种探索比看起来更系统连接机器,让它们积极地与世界互动,可能是让他们的学习更真实、更广泛的途径。 其次,与现有的人工智能不同,儿童是社会和文化的学习者,人类不是在封闭状态下学习,而是利用前几代人积累的智慧,最近的研究表明,即使是学龄前儿童也是通过模仿和倾听来学习的其他人,但他们不只是被动地服从他们的老师,而是以一种非常微妙和敏感的方式从他人那里获取信息,对信息的来源和可信度有强烈的感觉。做出复杂的推论,并系统地将他们所经历的与他们所听到的结合起来。 “人工智能”和“机器学习”听起来很可怕,在某些方面确实很可怕,比如这些系统是用来控制武器的,我们真的应该害怕它。 然而,人类的愚蠢比人工智能更具破坏性,我们需要变得比以往更聪明才能正确驾驭这些新技术,但人工智能取代人类,是否是世界末日预言和乌托邦愿景都没有太多依据。 除非我们解决学习的基本悖论,否则最好的人工智能也不会像一般的四岁孩子那么好。
