由算法组成的人工智能很多人认为一些新的高科技概念遥不可及。其实是因为工作忙或者脑子懒惰,或者是觉得离自己太远,懒得去深究,有的朋友盲目投资,知之甚少,结果可想而知。在21世纪,任何新概念都是基础理论层层叠加的产物。只要我们挖掘出这些概念背后的基础理论,就不难理解这些概念。当今时代,科技日新月异,作为生活在21世纪的人,我认为理解新概念的能力是一道进阶阅读题,其中一些概念是比较常识性的。信息技术的进步正在缩短知识与个人的距离,这也是近年来民间科学文体兴起的原因。我选择其中的一些常识性概念会是一个系列文章,有兴趣的可以关注订阅。当前人工智能技术中最接近强人工智能方向的部分是神经网络技术,也就是说两者属于同一方向但有距离。现有的人工智能技术,所谓机器学习,其实是被动学习,就是按照算法指定的方向,从大量数据中寻找特征值,在不断优化此功能的过程。因此,需要大量的数据作为支撑。深度学习训练的数据越多,特征值分析就越准确。比如现在的图像识别技术已经很成熟了。近年来,几乎所有的人工智能技术竞赛都以图像识别技术为主要项目和基准,衡量技术团队和技术框架。其中,人脸识别技术尤为成熟,尤其是在我国,已经得到广泛应用。无论是在行政层面还是商业层面,人脸识别几乎都是各大应用都会考虑接入的身份认证功能。随着个人信息的全面收集和个人隐私意识的淡化,大量的人脸信息被收集和存储,可以用来训练人脸识别技术。目前AI对人脸的识别率超过99.9%,不仅超越了人类肉眼的识别准确率,更有优势在于AI可以同时处理海量的图像识别任务。在我国行政层面,人脸识别技术已经应用到公共交通/银行开户/公安刑侦/网络实名认证等生活的方方面面,不久前迅速取代芯片认证技术,还淘汰了大站。只要携带身份证/手机和人脸,就可以乘坐公共交通工具前往中国任何一个城市。可以说,在不久的将来,身份证不带在身上将成为可能,因为只要你没有整容,那么你的面部信息就会与你的身份证/手机号/银行账户/信用/行为轨迹……现在国家正在准备发行数字货币。作为居民信息最全的状态机,也许以后你不用掏出手机支付,直接刷脸支付,甚至可以去超市买东西,因为在你出门的那一刻,摄像头就已经识别出你的脸,并直接从你的信用账户中记录到你的借记卡上。这在未来是完全有可能的。为什么在一些人工智能领域出现了应用级的进步?除了在图像识别方面的成就外,文本识别和语音识别也有相当大的成就。语音识别、语音翻译、扫描图像文本识别等,跨学科便捷。人们可能想知道为什么在这些领域而不是其他领域取得了应用程序级的进步,而不是备受期待的机器动力学或股票预测。其实,我们只需要回顾一下过去20年互联网的发展历程,就能找到一个清晰的脉络。在最初的MSN时代,人们主要通过文字来发送信息,当时最流行的是表情符号,因为一开始图片内容并不繁荣,也不是每个人都有相机。价格知道图片信息的稀缺性。后来博客流行起来,图文并茂的博客成为一种流行的信息展示方式。网易/搜狐等门户网站应运而生,并独占鳌头。语音信息是在智能手机时代才开始的。智能手机不同于电脑。每个手机都有麦克风,这为语音信息的普及提供了条件。微信等社交应用抢占先机,迅速进入市场,率先解决了人们无法打字使用手机社交软件通过语音聊天的问题,并主导了社交应用市场。图片来自AppStore。3G普及后,图片内容更加普及。此后,各种表情包爆火,形成了表情包文化。这也是图片信息繁荣的佐证。伴随着这波繁荣,涌现出一批优秀的分享社交软件:Facebook/instagram/Twitter等,以及一批优秀的图片处理软件:美图秀秀/camera360等,以及4G的巅峰时期时代已经成为视频App,从快手到美拍再到抖音,那些年直播平台之间的竞争就像是武林争霸。不知道各位读者看到这里是否真的感受到了通讯技术发展的强大力量。从1G到4G的过程中,我们的信息应用场景发生了从文字-图片-语音-到视频/直播的巨大变化,从而积累了大量的文字/图片/语音/视频信息,所以最早的人工智能已经发展起来的技术,都是在这些类别中积累了大量基础数据的领域。应用层面的增长发生在对应底层数据量大的区域。此时,我们需要问自己一个问题。5G时代来临。哪种沟通方式会站在浪潮中?遗憾的是,新的订阅号无法开启消息功能。感兴趣的读者可以私信订阅号。图片来自AppStore中应用级增长参考指标。我将为您提供思考的背景。从仿生学的角度来看,文字/语音/图片是人类认识世界最基本的窗口。也可以作为人工智能认识世界的窗口。如果我们换个角度想,认识世界的窗口对于人类来说是非常重要的。属于五感应用范畴:视觉:分析图像信息,观察空间;听力:分析声波信息,判断距离;气味:识别气体信息;味道:识别液体信息;触摸:识别固体信息。文字和语言分别属于视觉分析和听觉分析的高级应用,是文化诞生的标志。文本是符号学的应用。每个符号的背后都隐藏着提示。所谓提示,就是逻辑或信息。这就是符号学的本质。归根结底,人工智能理论流派中的符号学继承了符号学的应用。简单来说,所有的编程语言都是符号学应用的体现。一个简单的if语句就可以构建出二叉树的逻辑体系,可见其威力。既然说了符号主义,这里就要把人工智能理论的三大流派补全了:人工智能理论的三大流派:符号主义(symbolicism),又称逻辑主义(logicism)、心理学(Psychology)或计算机主义,其原则主要是物理符号系统(即符号操作系统)假设和有限理性原则。连接主义又称仿生学或生理学,其主要原理是神经网络以及神经网络之间的连接机制和学习算法。行动主义,也称为进化论或控制论,基于控制论和感知行动控制系统。不用担心上面的抽象名称。这三个学校其实没什么区别。从人类构想的强人工智能结论来看,这三个流派是实现强人工智能的必由之路。一绝。(对强人工智能概念感兴趣的请点击:人工智能能否超越人类?(一)AI的真实现状)符号学,大家不妨思考一下。如果把强人工智能计划理解为人工人类计划,那么仿生对象就是人类自己吗?那么要创造一个人,首先需要了解的一定是人本身。人的第一个特征就是思维。要理解和思考这种大脑活动,最基本的就是逻辑。人类的任何思维都有其逻辑可循。当你看到一扇门时,你会想象门后是什么。当你看到标题党的标题写着:【xx女明星被粉丝xx羞辱】,你会想,因为【女明星/羞耻】当这些词与男性大脑中的荷尔蒙联系在一起时,是的,但我点击了进去,发现没有内容。想了想,还不如看看Leo的文章。象征主义解决的主要问题是大脑思维的基本逻辑。比如现在游戏中的电脑人,以王者荣耀为例,游戏中人机模式下的电脑人就是基于这个规则创造出来的。联结主义,但是人类不仅有意识,还有潜意识和本能的反应,人类思维有一个参照物:经验,如何理解经验是很有趣的。当人第一次看到猴子时,大脑的识别中枢会将猴子定义为未知物种。人们会通过各种信息渠道了解猴子,分析并储存它的外貌特征/名字/习性/程序,形成一个叫做“猴子”的体验神经元,属于动物分支。看到猴子后,他就不会再好奇,仔细观察了,因为经验告诉他:这是一只猴子。这里的经验是大脑中已经分类的神经元。当你通过眼睛输入猴子的图像时,大脑会快速准确地检索猴子的神经元,并将之前存储的信息反映到识别中枢。当识别中心判断出猴子的信息属于[Known]标签时,不会再做更多的反应,直接给表面一个“这是一只猴子”的结论,直接绕过。神经元的运行模拟意味着这个经验神经元的作用是一个微型数据库+解析器。经过前几次的学习和训练,就可以形成一个完整的识别程序,大脑可以直接从这个神经元中获取信息。无需重新计算即可得出结论。这种做法会大大降低程序的能耗,提高响应速度。这是联结主义的主要方向。通过神经网络模型建立一个快速反应单元,就是现在的图像识别/文字识别/语音识别。AI程序所做的工作,其实这些AI程序就是一个神经元。训练完成后,你只需要输入一个图片/语音信息,一个结论就可以反馈给你。图片来自波士顿动力官网。既然行为主义称之为人造人,那肯定不是只能进行数据分析的强人工智能。2017年,BD的机器人空翻视频在人工智能的背景下走红。波士顿动力公司研制的机器狗和机器人是行为主义的代表。行为主义的方向是机械动作,可以描述为:在地球重力环境下适应复杂地形和动作的机器行为学习。遗憾的是BD在他们的机器人算法中并没有大量使用机器学习,但这并不妨碍他们在机器动力方面的研究成果为未来真正的机器行为学习做铺垫。BD公司因盈利问题被DARPA/谷歌/软银收购。直到去年被现代以9.2亿收购,缩水30%,也算是个宝贝。对于机器动力学领域,我认为在深度学习和动力学发展更加完善的时候应该会在未来迎来高速增长。除了这些,未来要实现强大的人工智能,还要依赖其他不同的领域。我觉得最远的应该是生物技术,其次是材料科学和芯片技术,最近的是能源领域。2019年电动汽车的爆发式增长其实也是红利之一,因为电池能源领域的发展也将为机器动力铺平道路。毕竟,现在走在强人工智能道路上的各行各业都将率先走上强人工智能的实现之路,不是现在,而是不久的将来。
