当前位置: 首页 > 科技赋能

京东智能音箱场景革命背后自然语音交互

时间:2024-05-22 19:08:14 科技赋能

Zhidixcom(公众号:zhidxcom) 文字 |莫英年表示,基于对语音交互应用未来的高度认可,京东与科大讯飞共同出资成立玲珑科技,旨在推出更多以语音为交互入口的好用智能产品时的首选就是音箱产品,也就是叮咚音箱。

目前,叮咚音箱和亚马逊Echo采用的技术和应用层面类似。

最大的区别在于声音。

叮咚支持中文和简单英文,而Echo仅支持英文。

此外,最重要的一点是,叮咚采用了科大讯飞最新的语音人工智能技术AIUI,将语音交互提升到了一个新的水平。

通过技术拆解和解读,我们试图找出叮咚音箱所采用的AIUI语音技术的核心创新点,如何带来基于语音的人机交互的新革命,进而赋予叮咚音箱这样的新玩法和活力。

产品,从而带来语音交互场景的革命。

1、从智能交互到智能家居场景革命。

首先我们要了解京东叮咚音箱搭载AIUI语音交互技术后带来了哪些新的体验和实现方式,以及看得见的智能家居场景。

这场革命至少会带来三个变化: 1、让叮咚音箱成为体验最佳的WiFi智能音箱产品。

2018年推出的叮咚音箱项目已发展成为国内最好的WiFi智能音箱产品之一。

目前,其销量在京东排名第一,超过所有前十品牌的总和;它是科技的最好体现。

就是AIUI升级后实现的远场识别、随时中断、连续对话功能,在国内处于领先地位。

2、丰富叮咚音箱的使用场景。

叮咚音箱可以让用户用语音控制微联平台上千台智能硬件设备,从而形成场景化的交互方式。

例如,你只需要发出“我到家了”的命令,家里的灯、空调、加湿器、电视等一系列用户自定义的设备就会按照预先设定的程序自动打开。

彻底解放用户的双手,带来前所未有的用户体验。

3、为京东智能云语音服务平台提供坚实的技术基础。

基于叮咚音箱+AIUI语音交互的结合,京东推出开放平台计划,进一步拓展语音技术的未来想象空间,成为京东布局智能家居的重要一步。

平台入口将接入第三方服务平台。

首批合作伙伴包括:中通快递、电子包洗、百度地图、京东到家、极米机器人等,众多合作伙伴的加盟为叮咚的入口布局带来了更丰富的应用场景。

无论是家政服务还是叫车,用户都可以通过语音完成。

未来,通过叮咚与京东极米客服机器人的连接,用户还可以通过语音查询商品配送等信息。

此次服务的升级,使得语音入口不仅仅局限于智能家居,还支持整个家庭数据生态的建立。

2、AIUI 5大核心功能亮点 接下来我们来拆解解读其背后的技术因素。

AIUI于今年12月的科大讯飞年会上首次推出。

AIUI于10月双创周期间首次正式上线。

叮咚音箱成为首款搭载该技术的产品。

目前,国内80%以上的机器人厂商都使用科大讯飞的语音技术,新锐玩家都在使用AIUI,尤其是像京东叮咚音箱这样的巨头来推广案例的增加。

AIUI的核心强调是“自然语音交互”。

具体来说,重要的是这几个方面的体现:一是远场降噪。

当使用语音与产品交互时,您不需要离它太近。

)以扬声器为例,五米距离内即可轻松唤醒。

为了实现这一点,我们主要采用回声消除技术,消除量可以达到50dB。

无论是稳态噪声抑制还是动态噪声抑制。

还有声源定位技术,比如5麦克风方案,定位锁定角度只有正负10度的偏差。

据悉,5米距离语音听写识别率已超过90%。

二是实现方言识别。

科大讯飞深耕语音十六年,已支持二十种方言识别。

第三,全双工。

过去,当人们通过语音与机器交互时,有时他们并没有听你说的话。

他们要么正在执行识别动作,要么正在与您交谈。

AIUI可以边听边说,并且可以随时打断。

第四,纠正错误。

纠错功能,例如,当报告十位数以上的电话号码时,机器可以用另外两位数字替换两位数字。

科大讯飞花费了大量的时间来打造这样的细致体验。

第五,多轮对话就像人与人之间自然的语音交流。

例如,在谈论天气时,如果你问杭州的天气,然后再问深圳或北京的天气,机器就会知道你是谁。

你在说什么,你想问什么?在交互体验得到大幅提升后,AIUI还针对不同场景进行了差异化能力。

首先,它有统一的界面和交互。

界面会有麦克风阵列、语音唤醒、对话识别、对话聊天等,这些方面可以灵活搭配,呈现不同的人机交互解决方案。

AIUI的应用领域可以扩展到汽车、机器人、录音转录等专业市场。

3、如何实现智能交互。

叮咚音箱使用过程中的几个典型场景可以体现AIUI带来的智能交互体验。

例如,在沟通过程中,无需担心用户的语言是否带有方言口音。

如果音箱正在播放音乐或讲故事时,只需喊“叮咚,叮咚”即可直接中断唤醒。

再比如,即使距离4到5米,叮咚音箱也能灵敏感知。

以上几点是如何实现的呢?传统人机交互的环节比较简单。

如果中间有断点,交互过程就会中断。

从语音识别到语义理解再到合成语音,任何中断都会大大降低语音交互体验。

AIUI是为了丰富和强化这条通讯链,特别是在人工智能方面。

AIUI的语音交互链通过硬件和软件技术得到了极大的完善。

比如在语音识别部分,可以做定向声音识别;在硬件方面,如果四个或多个麦克风在一个平面上,它们会划分每个角度。

如果用户站在一个方向,麦克风将指向该方向以进行定向语音识别。

有了定向语音识别,接下来的几个环节将致力于实现远场降噪,环境中的回声消除也可以通过麦克风来完成。

语义理解也是如此,这在技术优化方面是一个完整的进步。

4、结论:总体来说,AIUI是智能硬件交互解决方案的平台级解决方案。

无论是可穿戴设备还是家居设备、机器人、还是智能家居解决方案,AIUI都能为人机交互提供最自然的交互方案。

很多特点都在叮咚音箱产品上得到了体现。

叮咚音箱最近宣布推出语音交互开放平台时,特别提到升级到最新系统后,叮咚音箱可以一键唤醒。

持续对话是AIUI的典型功能特征之一。

基于优秀的语音交互技术,在京东平台上,通过叮咚智能音箱放大场景化革命,它不仅成为优秀的语音交互助手和场景化语音交互入口,也成为互联网服务分发平台。