当前位置: 首页 > 科技观察

微软突破全双工语音交互逆天!机器人真变“人”

时间:2023-03-16 01:12:32 科技观察

微软(亚洲)互联网工程院宣布率先推出新一代语音交互技术“全双工语音感知”(Full-duplexVoiceSense),以及已完成产品落地。  全双工是通信传输领域的一个术语,允许数据同时在两个方向传输,对应于半双工。  传统的语音识别和机器对话类似于半双工。无论是单轮还是多轮连续识别,都需要人把一句话说完,机器才能理解并做出反应。有点像传统武侠游戏的回合制战斗。.  微软的新技术可以实时预测人类将要说的话,实时产生回应,控制对话节奏,让远距离语音交互成为可能。  使用该技术的智能硬件设备,不需要用户在每一轮交互中都说出唤醒词。只需唤醒一次,即可轻松实现持续对话,让人与机器的对话更像人与人之间的对话,自然交流。  目前,该技术已率先登陆微软小冰全球产品线。其中,在中国市场,不仅有中国科技馆内的小冰电话亭,微软还与小米紧密合作,将其融入米家生态链中的Yeelight语音助手商用硬件产品。  这是全球首款配备全双工语音交互传感器的智能设备,也是首款内置微软小冰的“双AI”智能设备。  在日本市场,小冰琳采(りんナ)已经在直播平台上实现了这项技术,最新的车载智能项目也开始了路测。  微软计划在未来六个月内完成更多产品线对该技术的覆盖。  博士微软高级副总裁、微软(亚洲)互联网工程研究院院长王永东表示:“我们预计,未来一年,人工智能应用将越来越多地从某些单一的技术领域走向综合能力阶段。微软在这方面进行了深度布局,此次推出的全双工语音交互技术不仅涉及计算机语音技术,还包括自然语言处理、人工智能内容创作等领域,这正是微软正在做的事情。是这些领域长期保存和综合应用的成果之一。”  微软小冰全球研发总监周力博士说:“从已经落地的产品数据和用户反馈来看,我们观察到一个普遍的现象:一旦用户使用了微软小冰的全双工语音交互感官,在与其他语音助手交互时,他们一般会开始感到不习惯,甚至经常忘记对其他语音助手说唤醒词。对连续语音交互体验的满意度正在迅速下降。这种新旧交替的现象很符合我们的研发预期。“