当前位置: 首页 > 科技观察

吴军:未来20年,人工智能可能不会有很大的发展!

时间:2023-03-16 12:41:07 科技观察

三年前,人工智能时代开启,“它能做的事情越来越多,几乎无所不能”,这是一个普遍的看法。但是任何时候,如果所有人都认为某件事情可以做到,那么有两种可能:一种是这件事情真的太强大了;另一个是它可能已经结束了。因为大家都看到了,红利可能不会继续存在。这个时候就需要冷静的思考。从另一个角度来说,这是人工智能做不到的。1、回到问题的原点:人工智能做不到的事情很多时候,一条路走不通,最简单的方法就是直接回到原点,问题就一目了然。人工智能以计算机为基础,人工智能的极限取决于计算机的极限,计算机的极限取决于计算的极限。找出什么重要,什么不重要。相反,这种原始问题是我们很多人都忙不过来的事情,而这决定了你做事的大方向是对是错。一、图灵的思想:计算与机械运动的关系计算机科学之父是艾伦·马西森·图灵,那么,他的老师是谁呢?他的想法从何而来?有两个人是图灵帮助了计算机的发展,我们称他们为精神导师。他们是冯诺依曼(著名的美籍匈牙利数学家、计算机科学家、物理学家和化学家,曾任教于普林斯顿大学)和希尔伯特(20世纪上半叶德国乃至世界最伟大的数学家之一).冯诺依曼当时写了一本书,对图灵很有启发。图灵给出了一个很难证明但感觉正确的观点,那就是人类意识。人类的意识是由不确定性决定的,但计算机与早期的牛顿力学和可预测的机械运动有关。这是图灵当时朦胧的想法,即人的意识是由不确定性决定的,计算等同于机械运动。这就决定了什么可以算,什么不能算,他觉得界限分明了。希尔伯特在1900年的巴黎数学家大会上提出了23个最重要的问题,这就是著名的“希尔伯特的23个问题”。他提出了三个问题,即:①数学完备吗?完整性是否意味着数学可以涵盖我们要解决的任何问题?你能感觉到它不能,数学家哥德尔曾经证明它不能。②数学是否一致?什么是一致性?例如,今天3+5等于8,明天3+5等于8。但是物理学是一致的吗?不!今天测量的尺寸与明天测量的尺寸不同。今天烧这壶水是99.8度,明天可能是100.1度。物理不一致,但数学是一致的!③数学是可验证的吗?物理可以验证,数学可以验证吗?我不知道!希尔伯特23题中的第10题是关于这道题的,有一个特例。具有任意多个未知数的方程,每个未知数都可以改变,有不同的结果,是一个不确定方程。能不能有无穷大解,或者有没有办法确定方程在有限时间内有无穷大解,时间确定对于我们的日常生活是没有意义的。例如:X2+y2=z2有整数解。不知道X2+y2=z2是否有整数解!直到一个英国数学家证明了没有整数解,花了几百年的时间。那么,我随机给你的方程有整数解吗?不知道!也许有,或者没有。别说找整数解了,有没有办法判断这件事有没有解呢?这是希尔伯特的第十个问题。直到20世纪70年代,前苏联的一些数学家才证明它是不可判定的。对于这个问题,在有限的几步之内,谁也不知道它有没有解。如果你连它有没有解法都不知道,你肯定解不出来。虽然图灵当时并不知道这个问题的答案,但他的直觉是,我们不知道很多数学问题是否有答案,所以他使用了一种特殊的机械装置,将数学问题一分为二。这个设备就是图灵机。(图灵机)计算机是图灵机的更新版本。该装置可以判断哪类问题可以在有限的时间内以有限的步数进行计算。但仍有许多数学问题无法通过这种设备在有限的步骤中解决。计算机科学和数学中有一个新概念叫计算机可解问题,现在还有很多问题是无法计算的。无论今天的计算机多么复杂,它们在数学上都等同于图灵机。无论深度学习还是云计算,都相当于这么一个简单的机械设备。这个简单的小玩意做不到的,即使有智能算法的“太湖之光”超级计算机也做不到。这是从源头上说的。2、通过世界问题看人工智能问题我们把世界问题分门别类,有一类叫做数学问题。刚才我说数学是不完备的,有些问题不是数学问题。一些数学问题被称为可??判定问题。我知道它是否有解决方案,但我不知道解决方案在哪里。比如你问儿子一道难题,他答不出来。问题是有答案的,但他做不到。这是一个可判定的问题。有问题有答案的小集合,只有在知道没有答案后才能找到答案。可判定问题是知道有没有答案,而有一些数学问题是不知道有没有答案的。图灵机把有答案的问题分成两部分,其中一小部分称为可计算问题。对于图灵来说,可计算问题是指可以在有限步内计算,而有限步可能需要很长时间。也称为宇宙毁灭前的有限步。(世界问题分类)在工程上,如果你刷门禁卡,你一秒认出来开门是有意义的,三天后让你进来就没有意义了。这种问题称为工程上可以解决的问题。计算三天是工程上无解的问题。工程上可以解决的问题中,有极小一部分就是我们今天要讨论的人工智能问题。我们讨论人工智能,首先要知道它的边界在哪里。只有知道边界,才能知道人工智能需要解决什么问题。在说人工智能能做什么之前,我先说一下它不能做什么。我们不应该用人工智能来解决不需要人工智能解决的问题。2.人工智能究竟是什么?未来十年人工智能会是什么样子?任何人都很难预测20年后会发生什么。人们常常高估三五年后发生的事情,而低估十年后发生的事情。例如,如果有人认为无人驾驶汽车会立即上路,那你就高估了这件事。1、未来10年:整个城市就是一个大“机器人”。漫画家画一幅漫画,世界万物相连,包括花盆。花盆为什么要连在一起?因为需要浇水。前段时间,看到了国家新的用水表。我看到农业用水达到62%。将来,滴灌将用于农业(以减少水的浪费)。新疆只能用滴管,不然会全部蒸发掉。每个工厂都连接到互联网。这是一个大胆的假设,未来可能会是这样。如果这里是徐家汇(上海)附近的区域,信息流会被密密麻麻地画出来,类似于地球的电磁场。密密麻麻带来的好处就是万物互联。万物互联之后,紧接着就是一个紧迫的问题。坦白说,现在的4G恐怕不够用。为什么5G能行?5G来了之后,网速会更快。对于目前的需求,目前的网速已经足够了。5G只有一种可能,就是我能上网的设备突然需要增加10倍或者100倍。什么时候增加10倍、100倍?如果一个工厂要上线,这是一件大事,所以这是可能的。如此密集的网络意味着数据量太大,人工无法处理,需要人工智能。这是一个很重要的原因。当我们的城市数据密集时,现有的单台计算机,或者一个公司的数据中心,很难完成这样的功能。我们需要分布在全市乃至全国的超级计算设施,不仅仅是电脑,里面的程序也非常复杂,所以需要智能化。2.人工智能(机器智能)的本质那么,什么是人工智能,究竟什么是机器智能?人工智能是一个可计算的问题,与我们人类的智能无关。那么,如何判断一台机器是否具备智能的标准呢?所以能不能做出这样客观的判断方法就是图灵测试。如果屏幕后面有一个智能机器,另一个屏幕后面有一个人,我问他们一个问题,天为什么是蓝色的。然后让你判断哪个问题是机器回答的,哪个问题是人回答的。判断不明确的时候,这时候我说机器和人的价值是一样的。因为它是基于等价性的定义,并不意味着机器需要像我们一样思考,这才是人工智能的本质。3.对人工智能的误解说到人工智能,人们有时会想到脑科学。如果我们理解认知思维,人工智能真的可以比其他人做得更好吗?不是这样。人工智能判断是否和人类一样好,是从结果上来的,而不是从做事的方式上。比如MOOC公开课,这两年很火。美国一所学校在教学中广泛使用计算机,经常有助教上课,有时助教会来课堂帮助教授解答问题。TA所做的是一个定义性问题。例如,在辅导宏观经济学这门课时,约翰的表现并不比其他人差。也就是说,在宏观经济学课程中,约翰具有与人类相同的智力,但他不一定像人类一样思考。这是一个非常重要的特性,可以帮助我们理解人工智能。三、人工智能的历史发展阶段传统人工智能人工智能是1956年提出的,美国一所私立大学的10位教授正在思考机器智能。这10位科学家后来获得了五项图灵奖和一项诺贝尔奖。当时,他们正在思考如何让计算机具备人类智能。那时候,人工智能还处于起步阶段。那时候大家的思维方式有点像今天中国的“民间科学家”。这是什么意思?当人类认识某物时,他们会从直觉开始。例子:鸟飞派vs空气动力派你可以在《全球科技通史》看到人类对飞行的理解。最早的时候,他们模仿的是鸟类的飞行,后来他们意识到必须要搞出一套空气动力学理论。今天飞机的飞行方式与鸟类完全不同,但就效果而言,它们比鸟类飞得更快。人工智能一开始也是如此。一开始大家都让它模仿人类。例子:猴子摘香蕉学过人工智能的人可能都知道一个经典的问题,叫猴子摘香蕉。一只香蕉猴放在够不到的天花板上,房间里有可移动的桌椅。猴子挪动桌子,把椅子放回上面,摘了香蕉。人工智能开始做这件事的时候,要让它拥有猴子的智能可能不难,但要让它拥有人的智能就更难了。科学家们为此研究了十多年,其中之一马文·明斯基开始反思为什么这个问题无法解决。他找了一个反例告诉大家,我们都走错了路。什么反例?就两句英文:①Thepenwasinthebox;②盒子在笔里。在英文中,pen这三个英文字母还有另外一个意思,就是给孩子们的playpen。您必须将笔理解为栅栏,第二句话将解释它。这件事对于人类来说并不难理解,但是这时候计算机要判断这支笔是钢笔还是栅栏就非常困难了。为什么?原因很简单。我们知道小事成大事,你怎么知道的?这是常识。二、如何确定钢笔的大小?说到笔的大小,大家马上就能想到。你不会想到汽车的尺寸。计算机怎么知道这支笔有多大?即使它像人一样分析语法和语义,它仍然无法获得这种知识。今天发现计算机可以做一些特别困难的事情,比如下围棋等等,比人类做得好很多。其实谷歌后来就停止开发AlphaGo了,觉得跟人类差距太大了。相当于职业棋手和业余棋手下围棋。你没有办法下围棋。但是如果你今天让机器人上街做一瓶酱油,你3岁的孩子可以做这件事,但它做不到。人工智能最初的定义是它有一个特定的范围,不能比较人类最擅长的和最不擅长的。比如人类的一个非常简单的常识,计算机是无法实现的。再举个例子,大家觉得今天的大疆无人机很厉害,但是如果让无人机像苍蝇一样飞,它就飞不起来了。一只苍蝇有大约100,000个神经元,但无人机做不到那么多。这就是人工智能的缺陷。所以我一开始就讲了计算机的边界。你让电脑模拟一只苍蝇是非常困难的,说明你模拟的路走错了,我们需要另辟蹊径。第二阶段:数据驱动那么人工智能开始进入第二阶段,即数据驱动的人工智能解决方案,由LedrikJalinek提出。1972年,Jalinek到IBM沃森实验室进行学术休假,无意中接触到了语音识别实验室。两年后,他选择留在IBM。在那里,Jalinek组建了一支强大的研究团队。IBM在1960年代做了一些语言识别,但都没有成功。70年代,Jalinek负责语言识别等课题的研究。弗雷德·耶利内克(FredJelinek)因为耶利内克是通信专家,他不把语音识别问题看作人工智能问题,而是看作通信问题。其实把语音识别的问题拉回原点,看看通信是什么。我向你表达我的意思,你就会明白我的意思。我把想法在脑子里变成一串单词,这叫做信息编码。编码信息通过声音说出,然后耳蜗将接收到的信息解码为电信号。电信号经过接收者的大脑解码,接收者就知道对方传递的信息。这就是信息解码的过程,是一种标准的通信方式。模型。既然是标准的通信模型,可以通过通信来解决。他用信源编码和信道编码两种模型来描述语音识别问题。如果要计算数学模型的参数,需要用到大量的数据来计算。为什么这可以在IBM中完成?因为当时全世界只有IBM有数据。IBM是一家商业机器公司。它为各大公司提供电脑,电脑被各大公司用来收发传真。所以IBM有很多商业图文电视,所以它就这样做了。改变思路解决问题后的结果如何?在整个1960和70年代,语音识别可以识别十个数字,外加几个简单的英语单词。IBM最初想做一台语音控制的计算机,可以实现自动接线系统,连接、断开、转账、支付等等。不过当时识别的英文单词不超过100个,错误率30%,没办法用。换个思路,用数据驱动的方法解决问题,可以识别22000个英文单词,错误率从30%下降到10%,这在短短几年内就实现了。这就是工作方法和思维方式的重要性,往往比技术本身更重要。如果走原来的老路,用技术,是出不来的,是死路一条。但是当时的数据只能解决语音识别的问题,不能解决图像处理的问题。图像处理的绝对数据量是语音识别的100倍。所以当时是不可能的。后来,Jalinek的一位下属提出了机器翻译的模型。这个人就是彼得·F·布朗。当时英文翻译的想法是可行的,但由于缺乏数据,翻译效果并不好。在没有互联网的情况下,世界上只能找到两种数据。一个是每个国家都有的圣经,一个是联合国官方语言之间的文件资料。资料很少。PeterBrown的模型在当时并没有失败。非常有趣的是,PeterBrown的论文是当今机器翻译领域被引用次数最多的论文。引用高峰不是在90年代论文刚发表的时候,而是在2000年以后数据量大的时候。那么,彼得·布朗是谁?世界上最好的投资基金叫做文艺复兴。彼得·布朗曾任文艺复兴科技公司IT总监,现任文艺复兴副总裁。所以他后来就去预测股票了。由于缺乏数据,人工智能在20世纪80年代和90年代进入低谷。2004年和2005年,人们看到了一点曙光。让大家感到非常兴奋的是,机器翻译的水平基本可以达到人类的水平。谷歌有一个团队参加了美国国家标准化技术研究院的评估,相当于中国标准化局的评估。这场比赛的结果是谷歌,落后第二名约5个百分点。全世界科学家的努力每年可以增加0.5%左右,差不多10年就可以增加5%。今天的技术落后十年,你们两个不是一个档次,落后一代。为什么他跳槽了,结果涨了5个百分点?因为他用了别人一万倍的数据,就是这么简单的事情,算法也没变。这就是为什么它被称为数据驱动的方法,也就是在这之后,深度学习逐渐流行起来。基本算法建立于1970年代,现在使用的计算资源是当年的10000倍,但如何使用这些计算资源是一门学问。我讲这些想法是想告诉大家,人工智能与我们人脑的智能无关。它是一种数据驱动的机器学习方法。就像鸟类通过振动翅膀飞行一样,飞机飞行时不振动翅膀。事实上,飞机的飞行与鸟类的飞行无关。飞机飞上天是人类对空气动力学的研究,不是鸟类的飞行。今天要理解人工智能,就是思考如何让计算机,比如用钢铁等材料制成的盒子,在回答问题方面超越人类,而不是研究人脑的结构。有一种简单的方法可以判断人工智能是真的还是假的。如果你说人工智能与认知科学有很深的关系,那你是在撒谎。就好比说飞机发明了,机翼可以振动一样。如果我告诉你它是数据驱动的,数学模型有多好,基本都是真的。四、人工智能的发展,好消息和新闻人工智能发展到今天,好消息是得到了世界的认可,LeCun、Hinton、Bengio获得了图灵奖。坏消息是,当人类找到了数据驱动的方向时,人工智能用光了40年技术积累的红利。造成今天这个结果的原因是40年前人们为你种树。40年前栽下的树,今天正在开花结果。你不觉得人工智能突然发展的这么快,未来20年还会有一个巨大的加速吗?我告诉你不。为什么?因为今天的学术界可以预测20年后会产生巨大加速的事情。今天学术界正在进行的一些研究课题并不是太新。现在的科学家工作更努力,人多势众。大约需要20年的时间,才能积累出一个让人感到非常兴奋和惊讶的理论基础。什么是好的?因为这40年的成果,在一些领域被证明是硕果累累。AlphaGo可以用它下棋,PeterBrown可以用它炒股赚大钱,现在包括无人驾驶汽车、语音识别、机器翻译、医学影像识别、人脸识别等等都做的很好。这些结果证明这项技术已经足够成熟,我们可以在各行各业中使用它们。任何一次技术革命,都可能有2%的人掌握核心技术,但其他人一定有应用的可能。五、人工智能的发展水平1、弱人工智能如美图秀秀,是人工智能非常好的应用。虽然你不觉得它很聪明,但它在图像处理上其实是相当聪明的。华为手机(P20及以上)加入了很多图像识别功能,不仅是人脸识别,还有各种物体。大多数人可能会注意华为手机的鲜艳色彩让人看起来更年轻。如果你愿意,还可以测试一下华为手机物体识别的功能。比如你去(上海)陆家嘴,用华为手机拍了一个楼(从下往上拍),然后保存原文件,大概40M左右。然后你看照片,看到大楼是直的,这是不对的。因为从下往上应该是一个斜角,说明手机做了很多目标识别和后期处理的工作。这其实就是人工智能的应用,虽然你可能觉得它没有那么聪明。2、强人工智能大家常想到的智能人工智能,比如人工智能下棋,人工智能看病,是强人工智能的第二个发展阶段。①懂自然语言(比速记员好,会答题会写)比如速记,科大讯飞今天的语音识别和人对语音内容的处理没有太大区别。当然,其中一个原因是科大讯飞的语言库数据量比较大。②疾病(已达到医生平均水平)AI诊断达到医生平均水平,疑难病症达到专家水平。为什么?因为看病某种程度上就是人肉大数据。您必须看到足够多的案例才能获得足够高的水平。③驾驶(大部分时间优于人类)AI驾驶大部分时间优于人类。在自动驾驶汽车方面,谷歌基本上每7000英里左右进行一次干预测试。从中国的最北端到最南端,或者从最东端到最西端,你开车来回就够了。3.超级智能存在吗?科幻电影一直在探索超级智能是否存在。事实上,超级人工智能的存在与你的生活关系不大。我问你一个问题,鬼存在吗?有些人相信有鬼,有些人不相信。不管有没有鬼,你都不担心鬼的存在吧?例如,当你去一个恐怖的地方时,你害怕鬼还是恐怖分子?答案很明显。现在很多人都在写文章,说未来人工智能的发展会很不可思议,人类将无法生存。这种担心无异于怕鬼。我们担心的不是鬼,而是背后装鬼的人!所以超级人工智能并不可怕,可怕的是应用人工智能来控制你的生活,以及那些无形中改变了你生活的人。今天对人工智能的关注不是人工智能本身,而是开发人工智能背后程序的公司和个人。六、机器智能(人工智能)的三大支柱1、摩尔定律今天的手机比十年前的手机慢100倍。因此,华为手机可以实时处理图像信息。如果电脑速度不够快,我就请室内的一些人,把三十、四十张照片拼成一张。这就是摩尔定律的作用。2、多50%的数据,多一倍、多一倍、十倍的数据不一定有结果,多一万倍的数据就会有结果。3.数学模型前面提到计算机可以解决数学问题。如果你想使用人工智能来解决问题,你需要能够对其进行数学建模。复旦大学下属的一个人工智能研究所大概有三批人。一群人读MBA,他们去客户那里了解客户的业务逻辑;第二组人学习数学,根据业务逻辑建立数学模型;第三组人研究计算机,把数学模型变成计算机算法。七、发展人工智能的三种态度。做人工智能,有模拟人、代替人、超越人三种态度。1.模拟器模拟器是指人类可以做的一些事情,它可以完成。有人谈论服务机器人。但我个人认为这不是一个好主意。为什么?举个简单的例子,比如一个养老机器人,家里的老人是想和机器人聊天,还是想和孩子聊天。再比如,当你生病的时候,你是想让机器人给你吃药打针,还是想让护士跟你说话?也许这个领域更适合人类。人工智能并不能解决所有问题,有时需要区分这个问题。当所有人都涌向加州淘金时,卖水的人却赚到了钱。当年加州一家知名矿泉水公司靠卖水发家致富。另一家牛仔裤公司也在淘金热中成长起来。2.赶超人类人工智能可以在很多方面轻松赶上人类。例如,天空为什么是蓝色的可能比你想象的更清晰。我家里有一个会说话的机器人。有一次在家和朋友聊天,聊到amazon,机器人立马问“你要买东西吗?”家里人逗它说它要买东西。后来又说:高尔夫球好像快用完了,还买吗?他说那就买吧!然后问“你还想买上次一样的牌子吗”?我们说是的。几天后,货到了。如果你在FACEBOOK上点赞100次,它可能比你的家人更了解你的需求,如果你点击200次,它可能比你自己更了解你自己。这些东西完全可以被人工智能解决。3、一些超越人类的东西,比如无人驾驶汽车,包括一些疾病的诊断,我个人认为人工智能会比人类做的更好。疾病诊断中的误诊、漏诊其实是相当多的,有时甚至比我们想象的要大得多。如果你是看片的放射科专家,看片时可能会漏掉很多细节。这样做的机器是非常稳定的东西。8、抓住机遇,把握未来今天,我讲了很多计算机和人的界限。换个角度看计算机的智能,不要把它等同于人。它对世界的感知与人类不同。关于人类与计算机智能的区别,美国人工智能专家MichaelJordan教授提到,计算机智能是网络行为,而人类是个体行为。它获得的智能是网络判断的结果,而不是单台计算机的智能。这就是计算机智能和人类智能的区别。当然,这也带来了风险。一旦犯错,就不是一个人犯错了,可能会导致整个社会系统的瘫痪!我们的主题叫超智能时代。这个时代,人工智能在细分领域的应用还有很多机会。看看吧。你怎么把握!如果你相信下一个20年是一个很好的发展机遇,你就会以不一样的人生态度,不一样的做事方式去把握未来,希望大家把握未来。谢谢大家!*文章为作者独立观点,不代表Noteman立场。