当前位置：首页 > 科技赋能

智能音箱面临升级大战，语音识别成为战胜它们的关键

时间：2024-05-22 14:40:49 科技赋能

当户主回到家时，室内灯光会自动打开，室温将调节到合适的温度；同时，类似Siri的小管家也会贴心地告诉你该买哪些家电。

您无需担心步骤。

只需发出命令，Siri 就会在线下订单。

当你出门的时候，你的车就可以完美实现自动驾驶，完全不用担心路况和道路识别问题。

你觉得这样就够好玩了吗？激动的事还在后头——如果你在开车时按捺不住内心的渴望，它就会开始。

．啪地一声。

．．啪地一声。

．．算了，如果你还在玩方向盘，Siri肯定会不高兴，甚至会建议你照顾好自己。

你一定认为这是我想象的场景，但事实并非如此。

这是前几天刚刚上映的国外科幻惊悚片《升级》中的一个场景。

但它可能很快就会体现在我们的现实生活场景中。

从表面上看，智能音箱市场形势良好。

在当前全球掀起的人工智能浪潮中，智能音箱作为全新人机交互体验的最佳入口，成为世界科技巨头打开AI大门的突破口。

目前，智能音箱市场仍由亚马逊Alexa领先，谷歌紧随其后，而苹果Siri和微软Cortana仍在奋力追赶。

据【TechWeb】8月7日消息，亚马逊凭借这波热潮在全球销售了超过1万台Alexa智能音箱，并希望借此机会将自家产品与智能音箱融合。

回到国内，在BAT的持续支持以及其他同样实力雄厚的互联网独角兽的全力布局下，国内智能音箱市场也迎来了前所未有的高速发展。

据Canalys最新统计，今年第二季度全球智能音箱市场份额中，中国智能音箱表现非常强劲，谷歌第一，亚马逊第二，天猫精灵第三，小米第三。

四。

值得一提的是，小米作为杀气腾腾的互联网之后的手机厂商，凭借“高性价比”和“热销”，迅速冲破层层防线，进军多个领域，建立了强大的小米生态系统。

模型。

智能音箱就是其中之一。

精彩的一击。

从去年到现在，小米占据了整个市场12.2%的份额。

我们看到，小爱同学以其非常低廉的价格在国内市场颇受欢迎。

与其他厂商不同的是，小米将智能音箱的门槛设置得很低，并且集成了小米手机的语音助手并采用了深度学习算法，取得了不错的表现。

刚刚过去的15日，雷军宣布小爱同学月活跃设备数突破1万台。

这也是小米IPO以来听到的最好消息。

可以看到，无论是国外还是国内，智能音箱市场似乎整体表现不错，形势一片大好。

但事实真的是这样吗？智能语音的可控性值得关注。

全球巨头都在争夺从智能音箱到AI的超级入口，但这并不意味着这个入口足够成熟。

只是巨头们不想错过这个最好的入口。

事实上，智能音箱只是一个载体。

核心在于智能语音交互系统（即语音识别）。

语音识别作为人工智能研究的重要基础，在语义理解和识别准确率方面还无法达到完美。

这种情况，尤其是配备智能音箱后的语音控制，值得关注。

尽管考虑到全球语音市场的竞争格局，据外媒最新消息，亚马逊 Alexa 与微软 Cortana 正式联手。

但或许仍无法达到预期的完美形态。

例如，它可能无法播放某些在线音乐服务。

这还不是最关键的。

最关键的是你无法控制声音。

简单来说，你不知道什么时候会不经意间唤醒 Siri，更不知道什么时候你的谈话会被打断。

偷听，当快递小哥突然给你送来包裹时，你还一头雾水。

据笔者在雷锋网了解到的信息，国外发生了一则奇怪的新闻。

Amazon Echo 帮助警方避免了一起谋杀案。

国外一男子与女友发生争执，男子用枪指着女友问她：“你给警察局长打电话了吗？”旁边的Google Home听到了“呼叫警察局长”的命令，于是他也按照命令行事。

最后，特警队抵达事发地点并安全阻止了进一步的事件发生。

这看起来是件好事，至少Echo可以帮助你解决意想不到的危险和情况。

但接下来的案例会让你悲伤甚至恐怖。

据说，一家国外娃娃公司在电视上播放了娃娃屋的广告，该地区几个家庭的亚马逊Echos听到广告后，自动开始网上订购娃娃屋。

更不用说，中国浙江大学电气工程学院智能系统安全实验室甚至成功对亚马逊Echo音箱发起了“海豚攻击”，利用硬件漏洞成功“黑入”了智能设备的语音助手系统麦克风的脆弱性。

，通过发出人耳听不见的超声波声音，允许语音助手执行他们发出的指令，例如要求 Echo 在亚马逊上买东西。

更可怕的是，MWR InfoSecurity的研究人员发现旧款Amazon Echo智能音箱存在安全漏洞。

黑客可以将 Echo 扬声器变成一个 bug，而不会影响其整体效果。

原理是研究人员通过他们制作的插头将 Echo 连接到笔记本电脑和 SD 卡读卡器。

然后我们利用调试工具对Echo系统进行了破解，并编写了专用的启动程序。

该 Echo 听到的所有音频流都会自动转发到其远程服务器。

关键是这款智能音箱的其他功能看起来都还算正常。

也就是说，如果智能音箱遭到非法黑客的攻击，大量用户的数据和隐私安全将受到威胁。

口语仍然是语音识别中难以突破的障碍。

让我们回到语义识别的准确性。

尽管世界在人工智能技术上不断突破，但语音识别的准确性和理解力也达到了完美的水平，比如过去。

据媒体报道，Google Assistant 到今年年底将支持 30 多种语言；此外，高通还开发了一款语音识别设备，可以识别单词和短语，准确率高达95%。

不过，如果用在中文测试中，可能会显得很低。

众所周知，中国经过几千年的文化变迁，其文字已经变得难以捉摸，尤其是具有浓郁地方特色的语言数量已经演化到了30多种。

即使是中国人也不一定能够理解或理解。

理解他们。

更不用说毫无生气的机器语音识别了。

例如，在一项研究中，有人使用 Alexa 测试来识别一些非母语口语，结果显示不准确率可达 30%。

当面对第一语言是西班牙语和中国人说英语的人时，无论是Google Home还是Amazon Echo，识别率都低得吓人。

综上所述，看来语音识别仍然存在很多短期内无法突破的障碍。

巨头们大量抢占智能音箱市场，只是因为它是连接AI到卧室的最佳解决方案。

虽然巨头们抢占了这个入口，但并不意味着他们掌握了AI的超级入口。

他们仍需要在语音识别技术的改进和创新方面继续研究和突破。

否则，即使你先抢占了智能音箱的超级入口，但随着智能音箱继续面临升级战，你仍然很容易被后来者超越和取代。

毕竟，人工智能是一个技术创新性较强的领域。

只有不断的技术创新和迭代升级，才能稳定地度过这场升级战。

上一篇：锐智大数据参加GOPS全球运维大会，给您不一样的运维体验

下一篇：起床太早了，拷问激光电视的10大问题

智能音箱面临升级大战，语音识别成为战胜它们的关键相关文章