两个月前的Google I/O大会上,“皮查伊哥”亮出了自己的王牌AI:Google Assistant的“嗯嗯”一句话,让观众惊叹不已。
当语音助手的智能标准仍然是“类人”时,Google Assistant 的模态粒子让你感觉就像在与真人交谈。
本以为谷歌会因此而再次“成神”,没想到在不到两个月后的百度AI开发者大会上,百度AI客服上演了更加精彩的一幕。
在可爱的AI客服介绍了L4级无人驾驶Apollo之后,李彦宏似乎想让现场的开发者放松一下,播放了两段AI客服邀请开发者参加百度AI开发者大会的录音。
录音中,百度AI客服不仅自然地在对话中加入“哦”“呃”“嗯”等情态词,还能清晰地听到其呼吸声和呼吸声,给人一种会说话的感觉给真实的人。
如果仅此而已,百度AI客服和Google Assistant势均力敌,但通话过程中的小插曲,加上现场的阵阵笑声,着实让人领略到了百度的高超功力。
以下是AI客服与开发者的两个对话片段的还原: 对话一:开发者:“嘿,你是机器人吗?” AI客服:“呃……你发现了,我是开发者大会智能客服机器人,很高兴为你服务。
”开发者:“机器人,哈哈,你是哪里人?” AI客服:“不用问,我是百度的。
”开发者:“那百度就给你了,你会得到报酬吗?” AI客服:“嗯……百度免费给我收费。
”对话2:AI客服:“我想和您确认一下您是否参加4号、5号的百度AI开发者大会。
”开发者:“是的。
” AI客服:“哦,好的。
”开发者:“喂?” AI客服:“是啊,你告诉我吧。
”开发者:“哦,没关系,我以为你是机器人,哈哈哈哈,不,抱歉。
”事实上,这位特殊的客服人员从7月1日起就一直在孜孜不倦地为数百名开发者服务。
有些人认出了机器人的身份,有些人根本没有意识到,还有一些人误认为这是一个机器人。
还有自我否定……虽然百度还没有正式宣布,但百度的AI客服在某种程度上已经通过了图灵测试,比如巧妙地回应突发的质疑。
人类的语言系统一直是个谜。
言语仅承担沟通的20%。
剩下的80%是靠情感来沟通,这样才能听出对话者的喜怒哀乐,并给出有分寸的回答。
这已经成为人机对话的固有瓶颈。
即使语音识别的准确率高达 97% 以上,如果有人说“嘿”却不知道接下来该说什么,开发者自然会抱怨这是“人为迟钝”。
百度AI客服的神奇之处在于,它不仅能通过情态词“蒙混过关”,被看穿后还能给出机智幽默的答案。
即使是一个棘手的问题,它仍然可以流利地回答。
为什么人工智能需要学习打电话?验证AI语音能力的方法有很多。
百度为什么选择打电话?这要从谷歌和微软的两个先例说起。
正如之前提到的,Google Assistant 让观众“嗯嗯”了一声。
事实上,谷歌有意展示语音助手帮助顾客进行预订的能力,比如通过电话订餐、预约理发店等,甚至将Google Duplex定义为预订功能。
调用人工智能系统来完成现实世界的任务。
无独有偶,微软也在中国举办的人工智能大会上上演了手机秀。
就连Diss隔壁的Google Duplex,微软也宣布,在过去的两年里,小冰与人类用户总共完成了超过60万次通话。
沟通并将小冰定义为情感聊天机器人。
弄清楚这个问题后,我们不妨来比较一下百度、谷歌、微软人工智能的“打电话”能力。
在与真人交流的过程中,Google Duplex能够准确理解人类语言,并根据任务目标做出合理、自然的反应。
该技术目前旨在执行特定任务,例如为某些类型的活动设置时间。
对话之所以听起来真实自然,是因为它采用了级联TTS引擎和生成式TTS引擎,可以根据不同情况控制语音语调,同时生成一些模态粒子。
第五代小冰采用全双工语音技术和生成模型,允许数据同时在两个方向上传输。
它可以实时预测人类要说什么,实时生成响应,并控制对话节奏,从而实现远距离语音交互。
成为可能。
此外,使用该技术的智能硬件设备不需要用户在每轮交互过程中说出唤醒词。
只需一次唤醒,即可轻松实现连续对话,使人与机器之间的对话更像是人与人之间的自然交流。
。
百度AI客服的核心是百度大脑3.0。
据王海峰博士解释,“多模态深度语义理解”是百度大脑3.0的核心,包括数据语义、知识语义、视觉语义、语音语义集成、自然语言语义。
等待。
语音对话有两个要点。
一是自然语言处理和知识图谱,让人工智能能够回答“过分”的问题;另一种是语音合成技术,使语音和语义听起来更加自然,将传统语音和语义融为一体。
该拼接技术与最新的WaveNet技术有机结合,既保证了音箱拼接时的情感,又保证了WaveNet技术中声音输出的稳定性,同时减少了所需的数据和成本。
看来我们可以得出这样的结论:微软小冰刚刚走出语料搜索阶段,打电话也符合小冰“聊天机器人”的定位; Google Assistant仍然只能完成特定的任务,它仍然需要完全取代“人类助手”的时代已经过去了;百度借助AI客户展示了全方位的沟通对话能力,尤其是被“看穿”后的机智,让外界看到了开放应用的可能性。
百度选择用“客服”来展示其AI能力的不仅仅是AI客服。
恐怕不仅仅是对标谷歌和微软那么简单。
早在去年9月,百度金融APP中在线机器人服务的比例就高达95%。
这也从另一个层面证实了:当对手还在炫技的时候,百度已经开始了商业应用。
AI智能客服涉及的语音语义融合、自然语言处理等只是百度大脑3.0能力的一小部分。
例如,视觉语义可以让机器清晰地看到和理解视频,让顾客在无人超市有完整的购物体验;数据语义技术可以改造世界上多样化、异构、多模态的三维空间大数据。
,形成包含千亿节点、万亿关系的庞大数据语义网络。
各种事情。
值得一提的是,百度大脑3.0对外开放了多项领先的AI能力,并通过开放EasyDL等定制化平台以及集成软硬件AI能力,持续降低AI应用门槛,帮助开发者和企业应用人工智能。
实现业务创新升级。
这也是谷歌和微软所望尘莫及的。
也就是说,开发者可以通过简单的接口调用,获得强大的AI能力,然后不断地让自己的想法变成现实。
以语音语义集成技术为例。
它不仅是百度的AI客服,还将应用到智能音箱、智能电视、智能手机等一系列软硬件产品中,甚至是我们意想不到的场景。
对于人工智能的使命,百度的答案是这样的:将人们从重复、低效、繁重的脑力判断工作中解放出来。