当前位置: 首页 > 科技观察

机器学习发展如何助力配音技术提升

时间:2023-03-16 18:06:45 科技观察

人工智能(AI)技术在过去几年发展迅速,为商业人士提供了深度学习模型。虽然它在音频世界引起轰动还需要一段时间,但人工智能已经在视频和图像处理领域悄然兴起。机器学习是人工智能的一部分,它改变了画外音技术的使用方式。Cortana、Siri、Alexa等大家耳熟能详的语音助手都采用了配音技术。也正是由于人工智能技术的进步,AI发出的声音比以往任何时候都更加真实,在自然语音处理方面做得更好。本文讨论了机器学习和人工智能的进步,以及它们如何影响语音技术的进步。1.机器学习如何改进语音技术(1)音频更智能随着对语音技术的需求开始增长,自动语音识别(ASR)提供商正在加大语音识别产品的创新以满足人们更多的需求。语音识别技术的用户在不断增加,市场规模也在不断扩大。根据一项研究,到2026年,全球语音识别市场规模将增长到220亿美元。这一巨大转变将为自动语音识别(ASR)带来挑战,推动其创新并成功应对同一语言的不同方言,例如母语不同国家和地区(如澳大利亚、英国、苏格兰、美国等)的英语使用者会使用不同的方言。在机器学习(ML)和人工智能(AI)功能的驱动下,自动语音识别(ASR)只能将同一语言不同方言的口语转换为文本。此外,它能够从一种语言中识别出更多的方言和口音。换句话说,有一天,世界上使用的每一种语音技术都将使用逼真的人工智能语音发生器。音频技术中机器学习的一些真实示例包括:iZotope&Neutron2:贴心的音轨助手利用人工智能和机器学习来检测直接为用户提供预设的乐器音轨辅助。它还具有用于将对话与音频隔离的实用程序。LANDR:一种完全依赖人工智能和机器学习来设置有关数字音频处理参数的自动化音频母带制作服务。GoogleWavenet:一种用于生成音频记录的学习模型。(2)数据是驱动力。计算机对声波部分的处理是语音识别的第一步,即将声音转化为数据。因此,要使语音识别社会工程取得成功,该过程应包括以下内容:完全可访问的语音收集样本或可靠的语音数据库。由于表征数据集的特征数量较少,因此淘汰了提高算法学习能力的实用特征。机器学习算法用于创建可靠的分类器,并允许机器学习算法从训练样本中学习以进行新的观察。最后,深度学习应用于语音识别技术,在任何环境下的日常使用中都保持准确,因此语音识别系统可以在给定的环境中顺利运行。实际上,想要创建语音识别系统的开发人员需要有大量的训练数据。从经济上讲,这可能会花费数百万美元来收集正确的转录数据。只有这样,语音识别系统才能根据转录数据进行适当的训练。(3)人工智能和机器学习中的数字信号处理虽然人工智能和机器学习在音频处理中的应用还处于早期阶段,但深度学习方法使人们能够从不同的角度处理信号处理问题,这是目前它正在被广大音响行业用户所忽视。一般来说,理解声音和信号处理是复杂且难以用语言描述的。例如,听到两个或更多人说话,那两个人互相交谈的参数将如何描述?有许多因素需要考虑,其中一些包括:个性(年龄、性别、活力)如何影响这些声音?室内声学和距离对理解水平有多大影响?谈话过程中可能出现的其他噪音呢?可以看出,画外音的测量可以从许多参数中得出,并且需要赋予它们权重。在这种背景下,人工智能可以为人们创造学习所需的条件提供一种实用的方法。深度神经网络音频处理正在增长,但仍有许多问题需要解决,包括:高保真音频重建:小型低质量麦克风。空间模拟:用于双耳处理和混响。选择性降噪:去除某些元素,例如汽车交通。模拟音频模拟:估计非线性模拟音频组件之间的复杂交互。(4)配音师使用深度学习(机器学习)创造自然声音的一个关键步骤是在这个过程中有原始音频。相对而言,全球很多企业都在与配音师合作,打造配音产品。每次使用AI语音时,大多数语音艺术家都会通过赚取版税来获得丰厚的报酬。不过,配音艺人也会遇到被骗的问题。虽然他们录下了画外音,但并不知道使用者是谁。例如,Siri的原声SusanBennett与ScanSoft签约,但她从来不知道她的录音实际上是为Apple制作的。她只获得了一次录制画外音的费用,而不是经常性收入。此外,配音艺人遇到的另外一些问题是,行业内的合同和费用在现有技术的背景下并没有得到很大的改善。此外,还有人认为,配音可能会带来负面影响,甚至可能毁掉配音者的声誉。例如,它可用于您不想与之合作的公司和强硬的语言。(5)用例的出现语音技术正在跨行业发展,因为人工智能和机器学习允许人们以最自然的方式添加定制体验、寻找解决方案、访问服务和进行产品退货。以下是机器学习和人工智能如何改变自然语言处理案例的几个示例:消费者下订单:消费行业中涉及语音识别和转录的另一个应用。消费者有机会更快、更有效地订购。客户无需花时间浏览整个菜单,只需语音请求即可在几秒钟内下订单。虚拟助手:根据一项研究,到2024年,市场上将有超过84亿的语音助手。语音助手可以支持IT服务台团队等。通过对虚拟助手提出更多要求,员工有更多时间完成日常任务并更有效地利用他们的时间。客户亲密度分析:零售企业开始使用音频挖掘软件来更好地分析呼叫中心对话并了解他们的客户。由机器学习和人工智能提供支持的自动语音识别(ASR)可以准确理解客户并从他们的讨论中提取有价值的见解。(6)语音识别技术是未来吗?未来语音识别技术一定会大放异彩。随着人工智能和机器学习技术的不断改进,我们将看到它们的用例增加。此外,配音演员也将获得一席之地。由于可以通过它们改进语音识别技术,因此语音技术可能会发展到可以与具有各种情绪的人交谈的地步。2.结论以上是过去几年机器学习和人工智能给语音技术带来的改进,以及这种改进持续发展的原因。有一天,语音技术可能会发展到人们与语音助手交谈的程度,就像他们在与人交谈一样。组织需要考虑如何将语音技术纳入其业务战略。毕竟,世界正在朝着新的起点和技术道路转变,如果他们将语音识别纳入业务,将有助于他们脱颖而出。原文链接:https://www.smartdatacollective.com/machine-learning-advances-are-improving-voiceover-audio-technology/