当前位置: 首页 > 科技赋能

智能音箱面临升级大战,语音识别成为战胜它们的关键

时间:2024-05-22 14:40:49 科技赋能

当户主回到家时,室内灯光会自动打开,室温将调节到合适的温度;同时,类似Siri的小管家也会贴心地告诉你该买哪些家电。

您无需担心步骤。

只需发出命令,Siri 就会在线下订单。

当你出门的时候,你的车就可以完美实现自动驾驶,完全不用担心路况和道路识别问题。

你觉得这样就够好玩了吗?激动的事还在后头——如果你在开车时按捺不住内心的渴望,它就会开始。

.啪地一声。

. .啪地一声。

. .算了,如果你还在玩方向盘,Siri肯定会不高兴,甚至会建议你照顾好自己。

你一定认为这是我想象的场景,但事实并非如此。

这是前几天刚刚上映的国外科幻惊悚片《升级》中的一个场景。

但它可能很快就会体现在我们的现实生活场景中。

从表面上看,智能音箱市场形势良好。

在当前全球掀起的人工智能浪潮中,智能音箱作为全新人机交互体验的最佳入口,成为世界科技巨头打开AI大门的突破口。

目前,智能音箱市场仍由亚马逊Alexa领先,谷歌紧随其后,而苹果Siri和微软Cortana仍在奋力追赶。

据【TechWeb】8月7日消息,亚马逊凭借这波热潮在全球销售了超过1万台Alexa智能音箱,并希望借此机会将自家产品与智能音箱融合。

回到国内,在BAT的持续支持以及其他同样实力雄厚的互联网独角兽的全力布局下,国内智能音箱市场也迎来了前所未有的高速发展。

据Canalys最新统计,今年第二季度全球智能音箱市场份额中,中国智能音箱表现非常强劲,谷歌第一,亚马逊第二,天猫精灵第三,小米第三。

四。

值得一提的是,小米作为杀气腾腾的互联网之后的手机厂商,凭借“高性价比”和“热销”,迅速冲破层层防线,进军多个领域,建立了强大的小米生态系统。

模型。

智能音箱就是其中之一。

精彩的一击。

从去年到现在,小米占据了整个市场12.2%的份额。

我们看到,小爱同学以其非常低廉的价格在国内市场颇受欢迎。

与其他厂商不同的是,小米将智能音箱的门槛设置得很低,并且集成了小米手机的语音助手并采用了深度学习算法,取得了不错的表现。

刚刚过去的15日,雷军宣布小爱同学月活跃设备数突破1万台。

这也是小米IPO以来听到的最好消息。

可以看到,无论是国外还是国内,智能音箱市场似乎整体表现不错,形势一片大好。

但事实真的是这样吗?智能语音的可控性值得关注。

全球巨头都在争夺从智能音箱到AI的超级入口,但这并不意味着这个入口足够成熟。

只是巨头们不想错过这个最好的入口。

事实上,智能音箱只是一个载体。

核心在于智能语音交互系统(即语音识别)。

语音识别作为人工智能研究的重要基础,在语义理解和识别准确率方面还无法达到完美。

这种情况,尤其是配备智能音箱后的语音控制,值得关注。

尽管考虑到全球语音市场的竞争格局,据外媒最新消息,亚马逊 Alexa 与微软 Cortana 正式联手。

但或许仍无法达到预期的完美形态。

例如,它可能无法播放某些在线音乐服务。

这还不是最关键的。

最关键的是你无法控制声音。

简单来说,你不知道什么时候会不经意间唤醒 Siri,更不知道什么时候你的谈话会被打断。

偷听,当快递小哥突然给你送来包裹时,你还一头雾水。

据笔者在雷锋网了解到的信息,国外发生了一则奇怪的新闻。

Amazon Echo 帮助警方避免了一起谋杀案。

国外一男子与女友发生争执,男子用枪指着女友问她:“你给警察局长打电话了吗?”旁边的Google Home听到了“呼叫警察局长”的命令,于是他也按照命令行事。

最后,特警队抵达事发地点并安全阻止了进一步的事件发生。

这看起来是件好事,至少Echo可以帮助你解决意想不到的危险和情况。

但接下来的案例会让你悲伤甚至恐怖。

据说,一家国外娃娃公司在电视上播放了娃娃屋的广告,该地区几个家庭的亚马逊Echos听到广告后,自动开始网上订购娃娃屋。

更不用说,中国浙江大学电气工程学院智能系统安全实验室甚至成功对亚马逊Echo音箱发起了“海豚攻击”,利用硬件漏洞成功“黑入”了智能设备的语音助手系统麦克风的脆弱性。

,通过发出人耳听不见的超声波声音,允许语音助手执行他们发出的指令,例如要求 Echo 在亚马逊上买东西。

更可怕的是,MWR InfoSecurity的研究人员发现旧款Amazon Echo智能音箱存在安全漏洞。

黑客可以将 Echo 扬声器变成一个 bug,而不会影响其整体效果。

原理是研究人员通过他们制作的插头将 Echo 连接到笔记本电脑和 SD 卡读卡器。

然后我们利用调试工具对Echo系统进行了破解,并编写了专用的启动程序。

该 Echo 听到的所有音频流都会自动转发到其远程服务器。

关键是这款智能音箱的其他功能看起来都还算正常。

也就是说,如果智能音箱遭到非法黑客的攻击,大量用户的数据和隐私安全将受到威胁。

口语仍然是语音识别中难以突破的障碍。

让我们回到语义识别的准确性。

尽管世界在人工智能技术上不断突破,但语音识别的准确性和理解力也达到了完美的水平,比如过去。

据媒体报道,Google Assistant 到今年年底将支持 30 多种语言;此外,高通还开发了一款语音识别设备,可以识别单词和短语,准确率高达95%。

不过,如果用在中文测试中,可能会显得很低。

众所周知,中国经过几千年的文化变迁,其文字已经变得难以捉摸,尤其是具有浓郁地方特色的语言数量已经演化到了30多种。

即使是中国人也不一定能够理解或理解。

理解他们。

更不用说毫无生气的机器语音识别了。

例如,在一项研究中,有人使用 Alexa 测试来识别一些非母语口语,结果显示不准确率可达 30%。

当面对第一语言是西班牙语和中国人说英语的人时,无论是Google Home还是Amazon Echo,识别率都低得吓人。

综上所述,看来语音识别仍然存在很多短期内无法突破的障碍。

巨头们大量抢占智能音箱市场,只是因为它是连接AI到卧室的最佳解决方案。

虽然巨头们抢占了这个入口,但并不意味着他们掌握了AI的超级入口。

他们仍需要在语音识别技术的改进和创新方面继续研究和突破。

否则,即使你先抢占了智能音箱的超级入口,但随着智能音箱继续面临升级战,你仍然很容易被后来者超越和取代。

毕竟,人工智能是一个技术创新性较强的领域。

只有不断的技术创新和迭代升级,才能稳定地度过这场升级战。