当前位置: 首页 > 科技观察

游戏结束?强人工智能与弱人工智能之战

时间:2023-03-18 02:11:24 科技观察

自从谷歌的人工智能(AI)子公司DeepMind几周前发表了一篇论文,描述了他们称之为Gato的“通才”智能体(它可以使用相同的训练模型来执行不同的任务),并声称可以通过纯粹的规模实现通用人工智能(AGI),这在AI行业内引发了激烈的争论。虽然这看起来很学术,但现实是,如果AGI触手可及,我们的社会——包括我们的法律、法规和经济模型——还没有准备好。事实上,多亏了同样训练有素的模型,通才代理Gato能够用真正的机械臂玩Atari、字幕图片、聊天或堆叠积木。它还可以根据上下文决定是否输出文本、连接力矩、按钮按下或其他标记。所以它看起来确实是一个比流行的GPT-3、DALL-E2、PaLM或Flamingo更通用的AI模型,它们变得非常擅长非常狭窄的特定任务,例如自然语言写作、语言理解或创建一个图片来自描述。这导致DeepMind科学家和牛津大学教授NandodeFreitas声称“现在一切都与规模有关!游戏结束!”即更大的模型、更大的训练数据集和更强的计算能力)。然而,德弗雷塔斯所说的“什么”游戏究竟是什么?这场辩论到底是为了什么?AI辩论:强AI与弱AI在讨论这场辩论的细节及其对更广泛社会的影响之前,有必要退后一步了解背景。“人工智能”一词的含义多年来一直在变化,但从高层次和普遍的角度来看,它可以被定义为智能代理的研究领域,它指的是感知其环境并采取行动的任何代理,一个最大化其实现目标机会的系统。这个定义有意遗漏了代理人或机器是否真正“思考”的问题,这个问题长期以来一直是激烈争论的主题。1950年,英国数学家艾伦·图灵在其著名的《模仿游戏》论文中提出,与其考虑机器能否思考,不如关注“机器是否有可能表现出智能行为”。这种区别在概念上导致了人工智能的两个主要分支:强人工智能和弱人工智能。强人工智能,也称为通用人工智能(AGI),是人工智能的一种理论形式,其中机器需要与人类相同的智能。因此,它将具有自我意识,具有解决问题、学习和规划未来的能力。这是人工智能最雄心勃勃的定义,是“人工智能的圣杯”——但就目前而言,它仍然纯粹是理论上的。实现强人工智能的方法通常围绕符号人工智能,其中机器形成物理和抽象“世界”的内部符号表示,因此可以应用规则或推理来进一步学习和做出决策。虽然这一领域的研究仍在继续,但迄今为止,它在解决现实生活问题方面取得的成功有限,因为世界的内部或象征性表征很快就会变得难以管理。NarrowAI,也称为“狭义AI”,是一种不太雄心勃勃的AI方法,专注于执行特定任务,例如根据用户输入回答问题、识别人脸或下棋,同时依靠人类干预来定义参数其学习算法并提供相关训练数据以确保准确性。然而,NarrowAI已经取得了重大进展,众所周知的例子包括人脸识别算法、自然语言模型(如OpenAI的GPT-n)、虚拟助手(如Siri或Alexa)、Google/DeepMind的下棋程序AlphaZero,以及某种程度上的自动驾驶汽车。实现弱人工智能的方法通常围绕着人工神经网络的使用展开,这些系统的灵感来自构成动物大脑的生物神经网络。它们是相互连接的节点或神经元的集合,结合了一个激活函数,该函数根据“输入层”中呈现的数据和互连中的权重确定输出。为了调整互连中的权重以使“输出”有用或正确,可以通过将网络暴露给许多数据示例并“反向传播”输出损失来“训练”网络。可以说,还有第三个分支称为“神经符号AI”,它结合了神经网络和基于规则的AI。虽然在概念上很有前途且似是而非,因为它似乎更接近我们生物大脑的工作方式,但仍处于早期阶段。这真的是规模问题吗?当前争论的焦点在于,在具备足够规模的人工智能和机器学习模型的情况下,是否有可能真正实现通用人工智能(AGI),从而彻底摆脱符号人工智能。现在只是硬件扩展和优化的问题,还是我们需要在AI算法和模型上发现和发展更多?特斯拉似乎也认同谷歌/DeepMind的观点。在2021年人工智能(AI)日活动中,特斯拉宣布推出TeslaBot,也称为擎天柱,这是一款由特斯拉提供动力的通用类人机器人。为汽车中使用的高级驾驶员辅助系统开发的相同人工智能系统控制。有趣的是,该公司首席执行官埃隆·马斯克表示,他希望在2023年之前将机器人投入生产,并声称擎天柱最终将能够做“人类不想做的任何事情”,这意味着他期望AGI将成为可能。然而,其他AI研究小组——尤其是Meta的首席AI科学家和纽约大学教授YannLeCun更喜欢不太雄心勃勃的术语人类人工智能(HLAI)——认为仍有许多问题有待解决,仅靠计算能力无法解决这些问题,可能需要新的模型甚至软件范例。在这些问题中,机器有能力通过像婴儿一样观察世界来了解世界的运作方式,预测它将如何通过其行为影响世界,处理世界固有的不可预测性,预测一系列动作,以便它可以在抽象空间中进行推理和计划,以及表示和预测。最终,争论的焦点是这是否可以仅通过我们现有的人工神经网络的基于梯度的学习来实现,或者是否需要更多的突破。虽然深度学习模型确实能够在没有人为干预的情况下从数据中产生“关键特征”,但人们很容易相信它们将能够用更多的数据和计算能力来挖掘和解决剩余的问题,但这可能太好是真的。打个简单的比方,设计和制造速度更快、功率更大的汽车不会让它们飞起来,因为我们首先需要充分了解空气动力学才能解决飞行问题。使用深度学习AI模型取得的进展令人印象深刻,但值得思考的是,弱AI从业者的乐观情绪是否仅仅是马斯洛锤子或“工具法则”的一个例子,它指出“如果你拥有的唯一工具是一个锤子,你往往会把每个问题都看作钉子。”游戏结束还是一起工作?谷歌/DeepMind、Meta或Tesla等基础研究常常让私营公司感到不安,因为尽管预算庞大,但这些组织往往更倾向于竞争和加快上市速度,而不是学术合作和长期思考。解决通用人工智能可能需要两种方法,而不是强人工智能支持者和弱人工智能支持者之间的竞争。与人脑类比并不牵强,具有有意识和无意识地学习的能力。我们的小脑约占大脑体积的10%,但包含神经元总数的50%以上,负责与运动技能(尤其是手和脚)相关的协调和运动,以及保持姿势和平衡。这是如此迅速和无意识地完成,以至于我们无法真正解释我们是如何做到的。然而,我们有意识的大脑虽然慢得多,但能够处理抽象概念、计划和预测。此外,通过训练和重复,有意识地获取知识是可能的——这是专业运动员擅长的。人们想知道,如果大自然在数十万年的时间里以这种混合方式进化了人类大脑,为什么通用人工智能系统会依赖单一模型或算法。对社会和投资者的启示不管最终实现AGI的具体底层AI技术如何,这一事件都将对我们的社会产生巨大影响——就像轮子、蒸汽机、电力或计算机一样。可以说,如果企业可以用机器人完全取代人类劳动,我们的资本主义经济模式就需要改变,否则社会动荡最终将随之而来。话虽如此,正在进行的辩论很可能有点像企业公关,事实上AGI比我们目前想象的要走得更远,所以我们有时间解决它的潜在影响。然而,从短期来看,对通用人工智能的追求显然将继续推动对软件和半导体等特定技术领域的投资。NAI框架下特定用例的成功导致我们现有硬件能力的压力越来越大。例如,流行的GenerativePre-TrainedTransformer3(GPT-3)模型OpenAI于2020年推出,它已经可以写出与人类一样流畅的原始散文,拥有1750亿个参数,需要几个月的时间来训练。可以说,当今一些现有的半导体产品(包括CPU、GPU和FPGA)在计算深度学习算法方面或多或少都具有一定的效率。然而,随着模型大小的增加,它们的性能变得不尽如人意,并且出现了针对AI工作负载优化定制设计的需求。领先的云服务提供商,如亚马逊、阿里巴巴、百度和谷歌,以及特斯拉和各种半导体初创公司,如Cambrian、Cerebras、Esperanto、Graphcore、Groq、Mythic和Sambanova,都走了这条路。