当前位置: 首页 > 科技观察

与无政府主义者对话:NoamChomsky谈深度学习的未来

时间:2023-03-14 23:17:47 科技观察

最初的链接是为了查看人工神经网络(ANN)的最新发展是否促使乔姆斯基重新考虑他著名的语言学理论“通用语法”。演讲涉及深度学习可能存在的局限性、人工神经网络模仿生物大脑的程度,以及更多的哲??学依据。由于这是一次非正式讨论,我不会在本文中直接引用乔姆斯基教授的话,但我会尝试总结要点。诺姆·乔姆斯基是谁?作者很欣赏乔姆斯基的作品,尤其是他对美帝国主义、新自由主义和媒体的批判。我们的观点略有不同之处在于他对大陆哲学家(尤其是法国后结构主义者)的驳斥。或许是因为我从福柯、拉康和德里达的作品中汲取了太多东西,我一直觉得乔姆斯基的哲学分析方法在道德上很有吸引力,但它们有点太“干净”了,无法令人满意地解释我们的世界。尽管乔姆斯基对这些后结构主义名人的蔑视是显而易见的,但他的哲学观点实际上比他的批评者认为的更为微妙。UniversalGrammar声明首先,我不是语言学家,但在本节中我将尝试概述UniversalGrammar理论。在乔姆斯基之前,语言学的主流假设是人类天生就像一张白纸,通过强化获得语言。也就是说,孩子们听到他们的父母说话,他们模仿他们听到的声音,当他们正确地使用一个词或正确地组织一个句子时,他们就会受到表扬。乔姆斯基的研究表明,强化只是故事的一部分,人脑中一定存在促进语言习得的固有结构。他的主要论点是,儿童学习语言的速度太快,输入数据太少,无法用强化学习来解释(这也被称为“刺激饥饿”论点)。即使面对与人类相同的数据,动物也无法习得语言。在20世纪60年代的一个著名实验中,语言学家试图教一只名叫“NimChimpsky”的猩猩学习手语。但10年过去了,除了一些基本的沟通技巧,他仍然无法与人交流。所有人类语言之间都有共同点。这表明即使语言是独立发展的,但也有普遍的特征,因为人脑的结构是相同的。孩子不是天生就学习一种特定的语言。如果你在德国抚养一个在肯尼亚出生的孩子,他们会像德国孩子一样轻松地学习德语。这种基因编码语言能力的理论在科学界被广泛接受,但随之而来的是一个没有说出口的问题,“这个通用语法实际上是什么样子的?”勇敢的研究人员很快着手发现所有人类语言的一个共同特征,但对于我们天生的语言能力采取何种形式仍未达成共识。可以安全地假设通用语法不包括特定的语法规则,但更可能是一种基本的认知功能。乔姆斯基假设,在人类历史的某个时刻,人类发展出了执行称为“合并”的简单递归过程的能力,这是我们在人类语言中看到的语法结构的属性和约束的原因。说起来有点抽象,但本质上“合并”是指取两个对象,将它们组合成一个新对象的过程。虽然这种能力看似平淡无奇,但在头脑中组合概念并递归地这样做的能力是一种令人费解的强大能力,它使我们能够构建“无限多样的层次结构的表达”。这种微小但至关重要的基因飞跃不仅可以解释我们口头交流的能力,而且还可以得出结论,它至少对我们的数学天才和更广泛的人类创造力负有部分责任。这种“融??合”突变发生在我们的一位祖先身上,大约在10万年前,它可能是人类区别于其他动物的关键之一。人工神经网络之所以联系乔姆斯基教授,主要原因是作者想听听他对人工神经网络的看法。人工神经网络是机器学习模型的一个子集,它们以人脑为模型并以类似的方式学习(通过查看大量示例)。这些模型需要很少的硬编码,并且可以使用相对简单的架构执行相当广泛的复杂任务(例如图像标记、语音识别、文本生成)。这种方法的一个有益示例是Google开发的AlphaGoZero模型,它学习了围棋游戏并最终被人类世界冠军击败。最令人印象深刻的是,它经过培训可以在没有硬编码或人工干预的情况下完成所有这些操作,即“白板”(tabularasa)。虽然ANN肯定不是人脑的完美模拟,但我问乔姆斯基教授,这些模型是否表明我们实际上不需要硬编码的认知结构来从分散的数据中学习。乔姆斯基正确地指出,人工神经网络对于高度专业化的任务很有用,但这些任务必须受到严格限制(尽管考虑到现代计算机的内存和速度,它们的范围可能看起来很大)。他将人工神经网络比作在高楼上工作的巨型起重机。令人印象深刻的是,这两种工具都存在于具有固定边界的系统中。这种推理符合我的观察,即我目睹的所有深度学习突破都发生在非常特定的领域,而且我们似乎离通用人工智能之类的东西还差得很远。乔姆斯基还指出,越来越多的证据表明,人工神经网络无法准确模拟人类的认知,大脑的计算系统相对丰富,涉及的内容甚至可能延伸到细胞层面。如果乔姆斯基是对的(而且我认为他是对的),那么深度学习研究的进步意味着什么?归根结底,人脑并没有什么神奇之处。它只是一个由原子构成的物理结构,因此我们完全有理由相信,在未来的某个时候,我们或许能够创造出具有通用智能的人工大脑。尽管如此,当前的神经网络仅提供对这种认知的模拟,按照乔姆斯基的逻辑,如果不首先提高我们对有机神经网络工作原理的理解,我们就无法到达下一个前沿。道德相对主义人工智能的道德使用是现代数据科学家的一个重要关注点,但有时在特定领域内,这个概念可能有些模糊和主观。乔姆斯基的工作不仅为深度学习的未来提供了独特的技术视角,他的通用语法也具有深刻的道德含义,因为语言是我们讨论和解释世界的方式。例如,乔姆斯基的观点是,前面提到的先天神经结构排除了道德相对主义,必须有普遍的道德约束。道德相对主义有许多不同的流派,但其核心原则是道德决策没有客观基础。道德相对主义者断言,虽然我们可能深信“奴隶制是不道德的”这样的陈述,但我们没有经验方法向不同意的人证明这一点,因为任何证据都必然依赖于价值判断,而我们的价值观最终是外生的,由文化和经验决定。乔姆斯基认为,道德在大脑中表现出来,因此根据定义是一个生物系统。所有生物系统都会发生变化(自然地和不同的刺激),但它们也有局限性。以人类视觉系统为例:实验表明它具有一定的可塑性,由经验(尤其是在幼儿期)塑造。通过改变呈现给人类视觉系统的数据,您可以改变感受器的分布,从而改变个人感知水平和垂直线的方式。但是,您无法将人眼变成昆虫的眼睛,或赋予某人看到X射线的能力。根据乔姆斯基的理论,生物系统(包括道德)可以变化很大,但不是无限的。他接着说,即使你相信我们的道德完全来自文化,你仍然需要像获得任何系统一样获得文化(普遍性的先天认知结构的结果)。我对这种解读的最初保留意见是,如果我们假设道德只是“融合”(或同样原创的东西)的结果,那么虽然这可能会施加理论限制,但我的直觉是我们的道德可能会发生很大变化,以至于它是几乎不可能得出一般性结论。过去,乔姆斯基讨论过道德进步如何遵循某些趋势(例如,接受差异、拒绝压迫等),但很难看出这些广泛的趋势如何能够从如此简单的原子认知结构中始终如一地出现。当我把这个告诉乔姆斯基教授时,他认为这种观点是虚幻的,当我们不理解事物时,它们看起来比实际情况更加多样化和复杂。他举了一个自寒武纪大爆发以来动物体型变化的例子。就在60年前,生物学界的主流观点是生物体之间差异如此之大,以至于必须以个体为基础进行研究,但我们现在知道这是完全错误的,物种之间的遗传变异相当小。对复杂采集系统的改动必须是最小的,否则我们将无法采集它们。