当前位置: 首页 > 科技赋能

掘金5000亿市场!语音交互技术已经走在智能家居的最前沿

时间:2024-05-22 11:05:27 科技赋能

想象一下,当你下班回家时,你轻轻地对着门口说“我回来了”。

当它收到你的消息的那一刻,门不仅会自动打开,而且会自动打开。

空调和电视都开了一小会儿。

这不是一种很棒的感觉吗?在国外很多科幻大片描述的未来生活中,用语音控制家电的炫酷场景也随处可见。

在《钢铁侠》系列电影中,主人公回到家说想喝咖啡后,咖啡机就开始煮咖啡。

这样的生活真是令人羡慕。

随着语音交互技术的不断成熟,未来电影中的场景很快就会成为现实!语音交互和智能家居数据显示,到2020年,我国智能家居规模将达到1亿元,到2020年,智能家居市场规模将达到1亿元。

分析师预测,2020年全球智能家居市场规模将达到1亿元以上。

在汽车、互联网领域,语音交互功能已经非常普及。

福特SYNC系统是福特专为手机和数字媒体播放器配备的车载多媒体通讯娱乐系统,是目前在车载系统中使用语音交互技术的成功案例,已广泛应用于福特多个系列车辆。

继互联网巨头苹果在其iPhone 4S中推出智能语音助手应用Siri之后,谷歌也在其Android智能操作系统中推出了GoogleNow智能语音搜索和问答服务,微软也将语音技术应用到了Windows Phone上。

在智能家居领域,国外IT巨头纷纷通过智能家居产品与语音相结合的方式进入智能家居领域:谷歌收购NEST布局智能家居,不断强化Google Now的语音入口;苹果的HomeKit智能家居平台与Siri也不断加强整合;微软还发布了语音助手Cortana,拓展了其在智能家居领域的交互门户。

在国内,早在今年8月,语音巨头科大讯飞就宣布进军智能家居市场,并发布了智能语音助手灵犀3.0,用于控制智能家居设备。

这些设备需要提前连接灵犀3.0,可以在灵犀App中搜索设备,然后进行语音控制。

目前支持的设备很多,包括电视、咖啡机、灯、空调、热水器等。

随着国内外巨头加大在语音交互领域的投入,核心语音技术逐渐成熟,以往的技术瓶颈正在被克服。

慢慢被突破。

其中,语音识别技术是语音交互的基础和核心。

“语音识别”技术相当于给计算机系统安装了“耳朵”,使其能够“听”。

该技术经过语音信号处理、语音特征处理、模型训练和解码引擎等复杂步骤,使机器最终能够识别语音中的内容、说话人、语言等信息。

主流语音识别系统框架图:语音交互有哪些技术障碍?上一篇文章提到了语音交互技术在智能家居领域的应用。

语音交互作为主流的人机交互方式之一,将人们的双手从触摸屏中解放出来,减少了人们花在数据输入上的时间。

然而,语音交互并不适合所有场景。

目前,在智能家居领域,语音交互还存在以下问题:一张图片理解语音交互、噪声干扰下的远场识别精度有待提高、端点检测降噪等问题。

加工技术。

这也被称为“鸡尾酒会问题”,指的是在喧闹的鸡尾酒会上,远距离准确识别特定声音。

目前解决这一问题的方法是多通道信号处理,例如麦克风阵列变换。

相关落地技术包括Spichi & Amazon Echo“Ring 6”麦克风阵列,以及ULO Acoustic Mic随机安装语音拾音技术。

端点检测、特征提取和解码过程中的模型优化。

如果我们抛开现有问题的假设和相关设计,而是委托机器使用从训练数据中学习到的转换模型将语音转换为文本序列,可能会更简单、更高效。

目前主要采用端到端的CTC模型+Attention模型进行优化。

Horizo??n内部评测证明,相比之前的DCNN模型,CLDNN+CTC模型在每小时数据上的性能提升了约15%~20%。

然而,端到端的实用性存在争议。

现阶段只是对流程中某一部分的步骤进行简化。

目前还没有包含解码部分,需要大量的训练集。

提高可预测性和适应性。

在日常人际交往中,人们会预测对方接下来会说什么。

机器获得类似预测能力的突破口在于半监督和无监督学习,特别是强化学习和迁移学习。

腾讯之前有一个 PAC-RNN 模型,可以非常快速地适应,不断提高识别结果。

然而,由于循环神经网络的环路相对较大,该模型很难训练。

硬件方面,AI语音识别领域的芯片研发也是热点话题。

在终端中,语音识别的两个关键因素是实时性和成本。

开发专用语音识别芯片是终端语音识别硬件的发展趋势。

终端芯片的例子有:奇英泰伦终端智能语音识别芯片CI、云智胜UniRobot硬件芯片系统、MIT在ISSCC上发表的论文中的芯片。

总结:在消费领域,智能家居改变了消费者的生活方式。

语音交互为智能家居打造安全、舒适、便捷、信息化的生活空间,让人们适应信息社会的快节奏做出了很多贡献。

房屋对外界完全开放。

智能家居以家庭为单位,利用多种信息技术来达到监控和信息交互的目的。

未来,生活将更加智慧,消费者的生活体验将更加舒适。

语音交互的一场革命似乎是不可避免的。