当前位置: 首页 > 科技赋能

五年前,是什么让李彦宏相信了人工智能?

时间:2024-05-22 19:36:37 科技赋能

大多数人的思维习惯是看到某件事成功了就感叹成功者的运气。

但很少有人愿意回头看看一个事物从想法到现实到底经历了怎样的思考判断和自我完善的过程。

回到过去思考,其实是一件非常有趣的事情。

比如今天我们已经知道,押宝AI可以说是百度做出的最正确的选择之一。

如今,AI已经与百度融为一体,甚至成为中国科技行业的一张名片。

没有人应该反对这一点。

与这两年突然转型AI的广大科技公司不同,李彦宏和百度很早就选择了相信AI,甚至很早就做出了明确的判断,AI即将在哪些特定领域爆发。

例如,2017年,李彦宏表示“语音技术将从根本上改变人们使用互联网和手机的方式”。

同年,他还认为“人机对话的问题将在近几年很快进入实用阶段”。

2018年,他还提出“五年内语音搜索将超越文字搜索”。

次年,百度推出了度米。

显然,这些判断今天已经实现了。

但五年前,似乎没有多少人关注智能语音交互。

这里我们可以玩一个有趣的游戏:回到五年前李彦宏的视角,看看是什么因素让他选择相信人工智能。

特别是,我们相信AI能够带来商业价值,并决定AI以什么形式带来商业价值。

不难看出,当时的李彦宏至少能发现智能语音正在改变的三件事。

1、效率——近三年中文语音识别率快速提升。

这段时间,AI的中文语音识别的成功率已经成功超越了人类语言交互的效率。

另一方面,NLP和语义理解技术因深度学习而开始成熟,AI能够“理解”人类的可能性已经出现。

虽然这样的技术指标对于当时的普通人来说意义不大,但从行业发展趋势来看,它意味着未来必然发生三件事:1、键盘可以被替代。

打字固然方便,但其核心价值在于效率。

随着语音识别率显着提高,人类语言可以灵活识别,键盘输入的必要性也将受到挑战。

尤其是在手机上,语音输入具有前所未有的优势。

2. 按钮将逐渐被替换。

生活、生产中有无数的按钮。

这些按钮的价值在于人们需要操作某种机器,例如电视遥控器。

但随着语音识别和句子理解能力的提高,按钮的地位可能会动摇。

当然,所产生的经济价值也是不可估量的。

3、替换多余的任务。

当今社会很多工作无非就是倾听、记录和反馈。

尤其是其中很大一部分是低效、冗余的任务。

AI语音识别的准确率达到标准后,大量类似的任务将被取代,人类获取服务的效率将大大提高。

互联网生活的这些基本效率变化意味着巨大的市场调整和生产力升级。

智能语音交互是这一切的基础,而其基础来自于技术升级。

这对于以技术为基础的百度来说,是比其他渠道更好的机会。

李彦宏去年谈到AI时就提出,AI时代更适合百度这样的科技公司。

他认为,“短短两年时间,大家都了解了深度学习,算法日新月异,既然外界已经认识到了AI的重要性,那么对于百度来说,成功的机会自然会增加。

” AI技术的积累来自于百度的早期投资。

在此之前,“技术能换来什么价值”是企业家们的预言。

这或许也是DuerOS最初的思维逻辑。

2、“搜索-答案”关系 百度的核心业务是搜索,所以在上述逻辑中,智能语音带来输入效率的提升和长句理解能力之后,搜索业务势必面临巨大的迭代。

这或许给正在思考“搜索的未来”的李彦宏提供了另一个可能的发展方向。

此外,一种被称为知识图谱的人工智能技术已经开始广泛应用,搜索革命自然而然地孕育在人工智能中。

智能语音的出现最直接的变化就是用户从习惯搜索关键词转变为习惯输入大容量的句子,即向搜索引擎提问。

随之而来的是,用户期望的不仅是搜索结果和带有关键词的百科全书,还包括问题的答案甚至重新提问。

搜索的核心价值是连接人和信息,但信息不仅仅是关键词,更多时候信息隐藏在问题的背后。

这样的搜索习惯必须从用户能够提出复杂的问题开始,而智能语音让用户有机会养成提问的习惯。

另外,用语言来描述事物更符合人类的习惯。

如果没有语音交互的支持,也很难进行抽象的、非关键词的搜索服务。

而从问答搜索到更远的地方,很多时候我们需要的不仅仅是答案,而是建议,甚至是反问和辩论。

这样的搜索效果可能吗?如果可能的话,核心肯定需要一个更智能的系统。

然而,高度复杂的自然语言理解和自然语言处理,带来人机对话的完整性,当然是另一个基础项目。

根据搜索的演进来思考,我们不难发现搜索业务离不开语音交互。

所以当然也不难理解为什么智能语音对于百度如此重要。

用李彦宏自己的话说,移动互联网普及后,“要么想AI,要么说再见”。

3、人机关系更大的机遇在于,人机关系正在随着“人机对话”模式的到来而改变。

这也是李彦宏几年前做出的判断。

人工智能可以让人类与系统对话,系统的理解可以转化为命令。

命令是机器执行的根源——那么人机交互必须用手触发的现状很可能成为历史。

很难低估用语音控制机器的潜力。

在最常见的家居环境中,有句话说,智能家居在你改变之前不会多想,但一旦改变,你就再也回不去了。

这是因为就操作的便捷性和准确性而言,语言远不止是一个开关。

尤其是能够在太空中执行命令,自然是一种更加人性化的人机交互方式。

在家庭之外,人机交互的价值迭代也发生在生活的几乎每一个核心场景:工厂里的很多工作都可以由工人指挥机器来完成,带来巨大的效率提升;在办公场景中,语音交互可以升级为助手。

取代大量的协作工作;在驾驶场景中,如果能够通过语音控制除方向盘之外的所有东西,对于用户体验来说将是一个巨大的解放,更何况在无人驾驶场景中,人机交互只能通过语音来完成。

随着语音识别和理解能力的成熟,这些市场自然会显现出价值。

这对于当时的百度来说是一个巨大的机会。

所以我们看到百度并没有急于抢占音箱的风头,而是搭建了底层平台,逐步完善了人机交互类型的覆盖。

这是因为,在百度的优势中,设备并不是核心,而是技术带来的人机关系的变化。

结论 回到五年前,从李彦宏的角度我们可以发现三个准确的现象:智能语音技术日趋成熟、智能语音对百度核心业务产生巨大影响、语音交互背后隐藏着巨大的新市场。

这三件事支撑着百度准确找到AI时代的核心方向。

如今,DuerOS已连接超过1亿台设备,智能语音已成为核心基础技术。

但或许我们应该问的是:智能语音已经达到顶峰了吗?如果我们回头看看当年百度和李彦宏的判断,或许答案应该是:还没有。

无论是搜索、信息流、内容,还是人机协作和泛社交应用,智能语音今天才打开了市场,奠定了更加坚实的基础。

语言的魔力和红利还没有完全降临到商业世界。

百度的对话式人工智能之战可能还需要跨越更远的山脊。

同时我们还可以发现计算机视觉这两年也在爆发式增长。

李彦宏在2001年恰巧预言,计算机视觉将是无人驾驶的最后一英里。

因此,我们也可以判断,计算机视觉将成为Apollo平台建设的重要组成部分。

种种迹象表明,这一预测可能不再需要另外五年的时间,而且正在迅速逼近我们。

回到你开始的地方,你常常可以看到更多。

当我们推测人工智能的未来时,这种方法在今天可能特别有用。