当前位置: 首页 > 科技观察

语音识别的发展如何发展

时间:2023-03-20 00:36:40 科技观察

利用深度学习技术深入理解自然语言一直是人们关注的焦点。不用搜索音乐就能听,不用开灯,空调也能听懂你的声音……这些场景在很多影视作品中都有展现,也代表着很多人心目中“智能生活”的概念。基于此,在人工智能发展的热潮中,自然语言处理成为各大企业和科研机构的必争之地。目前,语音交互赛道汇聚了互联网巨头、知名硬件企业、电商平台、传统家电厂商、各类人工智能初创企业。尤其是近几年,以智能音箱为代表的语音交互产品风靡国内外,极大地刺激了语音交互技术的应用和发展。多领域落地应用近期,最火爆的智能家居硬件无疑是小米AI音箱。这款产品一经推出,在市场上引起了极大的反响,被多家媒体称为“交互体验最佳的音箱”、“智能音箱行业的担当”、“当下‘最火’的智能硬件”“......在我看来,小米AI音箱非常出色,是的,但还没有达到他们吹嘘的程度。从身边人的具体体验来看,它的语音识别能力并不是特别出众,与市面上主流的同类产品相差不大。它最大的优势在于在生态链方面,通过小米AI音箱,可以控制小米台灯、小米扫地机器人、小米落地扇等配套家具设备。毫无疑问,这将使人们离智能生活又近了一步。在汽车和智能移动设备领域,语音交互功能已经非常普及。人们在开车的时候,往往不能腾出手来,也不应该腾出手来操作手机。这个时候,车载语音就成为了车联网的必需品和标配。在现在这个智能互联、无人驾驶的时代,新车似乎都没有一些语音识别的黑科技,似乎都不好意思拿出来。福特的SYNC系统专门配备了福特的车载多媒体通信和娱乐系统,用于手机和数字媒体播放器。继互联网巨头苹果公司在其iPhone4S中推出智能语音助手应用Siri之后,谷歌也在其Android智能手机操作系统中推出了GoogleNow智能语音搜索和问答服务,微软也将语音技术应用于WindowsPhone,三星也推出了比克斯比。在金融领域。语音识别技术也可以发挥作用。近日,中国建设银行在上海黄浦区开设了一家自动化服务网点,机器人为客户服务。该机器人搭载人脸扫描识别软件,可以解答客户的大部分问题,解决普通高街银行的大部分业务需求。同时,还配备了人工协助服务等专业服务,满足个性化需求。使用语音识别与人交流并回答客户问题的机器人会迎接客户。他们可以做大部分人工服务可以做的事情,包括开户、转账和投资。此外,在新零售领域,智能语音技术的应用也在不断扩大。例如,2017年12月18日,科大讯飞与红星美凯龙发布战略合作计划。未来,由科大讯飞研发的智能导购机器人“美美”将在全国红星美凯龙门店上市。除了语音交互,语音转文字也是当前语音识别技术的热点。早些时候,这个功能是记者们的最爱。使用此功能组织采访和演讲,可以大大提高工作效率。现在,这个功能正在被普通人所接受。老年人和患有懒癌的年轻人都可以使用此功能代替打字。如今,资本的涌入、政策的支持、市场的反复扩张,让语音技术日趋成熟,全球语音市场也迎来了应用落地的黄金发展期。据相关统计数据显示,2016年智能语音产业规模逼近60亿大关,2017年将突破100亿,同比增长约69%。技术状况不尽如人意。与语音识别在众多领域的发展相比,语音识别技术的发展相当缓慢。在这种情况下,语音识别技术在实际应用中遇到了很多问题。现在很多公司都说自己的语音识别率已经达到了97%甚至98%,但是在实际应用中,效果并不尽如人意。举个更有说服力的例子,IBM开发的中文语音识别系统Mt.5%,但在识别其他内容时,差距就非常大了。在实际应用中,识别率主要受以下因素影响:对于中文语音识别,方言或口音会降低识别率。公共场所强烈的噪音对识别效果影响很大。即使在实验室环境中,敲击键盘和移动麦克风也会成为背景噪音。打断提问,如果人在说话的时候停顿,机器就无法很好地衔接上下文,把意思说清楚。这里,还有“口语”的问题。它涉及自然语言理解和声学。语音识别技术的最终目标是让用户在“人机对话”时像“人与人对话”一样自然,但是一旦用户以与人交谈的方式进行语音输入,口语语法不规范和不正常的词序会给语义分析和理解带来困难。语音识别的技术迭代此前有人指出,在实际应用中,可以通过语音识别技术的数据采集来解决口音、生词等问题。随着数据量的增加,这个问题就可以解决了。此外,“中断”等问题需要各种深度学习模型,如DNN、CNN、BLSTM(双向长短期记忆神经网络)等,以及新的算法来逐步解决。技术的使用通常需要一个迭代过程。它需要先上线,然后在场景中采集数据,评估、优化模型,提升用户体验。经过几轮迭代,才能达到最好的效果。其他人工智能技术类似。如今,许多AI技术的用户倾向于理想化该技术的能力,认为一旦引入,就应该立即看到效果。当你看到实际效果不尽如人意时,你会感到差距很大,失望而放弃。诚然,智能语音技术已经达到了GF的应用水平,但在真正落地实施的时候,还需要充分认识可能遇到的困难,做好打持久战的心理准备。小结可以预见,在未来五到十年内,语音识别系统的应用将会更加广泛。各种语音识别系统产品将出现在市场上。人们还将调整他们的语音模式以适应各种识别系统。短期内,不可能创造出可与人类相媲美的语音识别系统。建立这样一个系统对人类来说仍然是一个很大的挑战。我们只能朝着完善语音识别系统的方向一步步前进。.至于何时能建成像人类一样完美的语音识别系统,目前还很难预测。就像在1960年代,谁能预料到今天的VLSI技术会对我们的社会产生如此大的影响。