当前位置: 首页 > 科技观察

为什么大数据不够智能?机器如何走向强人工智能

时间:2023-03-16 01:54:13 科技观察

大数据为什么不够聪明?有什么比概率语言更强大的思维工具?科幻电影中的强人工智能是如何实现的?如何让智能机器像人一样思考?只有弄清了因果关系,才能看到阳光。图灵奖获得者、“贝叶斯网络之父”朱迪亚·珀尔(JudeaPearl)在一鸣惊人的《为什么:关于因果关系的新科学》中为我们解答了这些问题。人工智能领域的大多数问题都是决策问题。1939年,统计学家亚伯拉罕·沃德指出参数估计和假设检验都是统计决策问题,甚至打算将整个统计纳入统计决策理论的框架。损失函数是统计决策的起点,给定一个损失函数,贝叶斯主义者将始终如一地选择具有最小预期损失的决策,无论是否有观测数据。频率论者需要事先制定决策规则,根据损失函数和样本定义一个风险函数,然后根据一定的原则(如最大最小值原则、贝叶斯风险原则等)选择最优决策。如果一个决定是基于被动接收的观察数据,它位于因果阶梯的第一级,强烈依赖于观察数据,因此不可避免地有偏见。有了第二级武器——干预,决策就可以摆脱观察样本的束缚,揭示一些样本无法反映的事实。简而言之,达到第二级的人工智能将具备主动实施行动分析因果关系的能力,从而使决策行为更加智能。第三层反事实推理,让机器拥有“想象力”。反事实推理考虑的是一个假设的世界,它不能通过直接观察数据来推断,而必须依赖因果模型。因果关系的阶梯今天,深度学习仍然是人工智能的热门方法,甚至有人将其盲目地等同于人工智能。其实机器学习的方法有那么多,深度学习只是沧海一粟。从理论上可以证明,即使人工智能在因果关系阶梯的最低层做到了极致,也无法跃升到干预层面,更谈不上进入反事实世界。作为因果关系阶梯最底层的机器学习技术,大数据分析是多元统计分析,而深度学习只是一个隐藏层数较多的神经网络。理论上没有太多创新。Pearl教授认为,大数据分析和深度学习(甚至大部分传统的机器学习)都处于因果关系阶梯的第一层,因为它们的研究对象仍然是相关性而非因果关系。Pearl并不是贬低相关性分析,它是因果关系阶梯的最低一级,他只是提醒我们不要停留在这个高度上,而是要不断攀登。不同层次之间也可以形成合作。例如,在实践中,深度学习可以用于强化学习中的策略拟合。两者结合成为“深度强化学习”,被作为AlphaGo的核心技术之一。(“阿尔法狗”)在那里闪耀。众所周知,这一轮AI的爆发,很大程度上是因为算力的提升。例如,深度学习是人工神经网络借助计算能力的“卷土重来”,将数据驱动的方法推向了一个高峰。人们甚至有一种错觉——“所有科学问题的答案都隐藏在数据中,等待被巧妙的数据挖掘技术揭开”。珀尔教授批评了这种思潮。他把因果模型放在了更高的位置,把数学或统计建模的荣耀还给了相应领域的专家。我们希望在未来,机器学习不再依赖于炼金术士的成功机会,随着知识推理和计算越来越受到重视,可解释的人工智能将从因果关系这一新科学中汲取更多力量,甚至闯入世界的反事实。DeepMind开发的AlphaGo围棋程序在2016年首次击败人类围棋顶尖高手李世石,次年横扫所有人类围棋高手夺冠(包括3:0战胜柯洁)。聂卫平(九段)称之为“至少二十段”。AlphaGo使用深度强化学习和蒙特卡洛树搜索,其最终版本AlphaGoZero在短短3天内训练自己击败了李世石。2017年,DeepMind宣布AlphaGo“退役”,不再参加任何围棋比赛。在棋类游戏中,围棋所蕴含的巨大搜索空间(状态数量远超整个宇宙的原子数量)一直是机器学习未能攻克的难题,甚至被认为无法通过人工智能在不久的将来。固定的。AlphaGo的成功,不仅让人们看到了强化学习和随机模拟技术(又称“蒙特卡罗”技术)的魅力,也让深度学习更加普及。冷静下来后,人们意识到AlphaGo的算法更适合大规模概率空间的智能搜索,其环境和状态是可以模拟的。DeepMind的创始人DemisHassabis表示,这些算法对于难以模拟的环境中的决策问题也无能为力,比如自动驾驶汽车。Pearl在第10章中也谈到了AlphaGo,他认为缺乏可解释性是它的缺陷。以强化学习为例,它不同于监督学习(supervisedlearning)和无监督学习(unsupervisedlearning)。变得越来越“聪明”。强化学习和因果推理都寻求策略,其中行为之间存在因果关系,但因果推理更开放,它可以使用数据之外的知识来推断策略的效果。强化学习允许推断干预的结果,从而爬上因果关系阶梯的第二级。通过模拟环境,强化学习不需要从现实世界中获取观察数据来训练模型,因此也可以生成反事实来攀登因果关系阶梯的第三级。尽管目前的强化学习很少使用先验知识,但我们仍然对强化学习与因果推理之间的理论联系感到好奇。未来人工智能的发展也有“综合化”的趋势。比如语音、图像、视频数据等都可以转化为文本,AI技术可以帮助我们加深对数据的理解。同时,借助包括因果推理在内的人工智能技术更好地理解数据,也有助于模型训练和提升应用性能。同样的,因果关系和现有的机器学习等AI技术是否有可能强强联手,互利共赢?例如,因果推理中考虑的变量越多,计算挑战就越大。那么,基于蒙特卡洛方法的近似计算是否有帮助呢?机器学习能否帮助和改进因果建模?这些问题有待深入研究。形式化的因果关系理论不仅解决了困扰统计学家多年的一些悖论,更重要的是,(1)用“干预”的方式,将人和机器从被动观察中解放出来,转而主动探索因果关系,从而更好地做出决定;(2)用“反事实推理”拓展想象空间,从而摆脱现实世界的束缚。这两个突破实现了因果革命,分别构成了因果关系阶梯第二层和第三层的内容。沿着因果关系的阶梯,机器有望拥有强大的人工智能。