当前位置: 首页 > 网络应用技术

稳定的真实 - 时间语音翻译在Google翻译中

时间:2023-03-08 09:59:05 网络应用技术

  视频简介:Google翻译中的稳定真实 - 时间语音翻译

  Google翻译应用程序中的转录功能可用于创建会议和演讲等会议的真实 - 时间翻译,或者只有在桌子上只用您不理解的语言讲述表的故事。在这种情况下,对于及时显示翻译文本很有用,可以帮助读者保持参与并始终注意。原始文本和翻译之间的非单调关系,原始句子末尾的单词将影响翻译开头的单词。

  今天,我们很高兴介绍最近发布的Google Translation应用程序续订续订背后的一些技术。该更新大大降低了翻译修订并改善了用户体验。两篇论文介绍了该目标的研究。在第一个制定评估框架的第一个制定框架,以减少 - 现场翻译和开发方法,以减少不稳定。第二种方法表明,这些方法非常好。替代方案虽然仍然保留了原始方法的简单性。结果模型更稳定,并且在Google翻译中提供了显着的改进阅读体验。

  在尝试进行任何改进之前,首先了解和量化用户体验的不同方面很重要。目的是最大化质量并最大程度地减少延迟和不稳定。工程工作。这项工作提出了使用以下指标的绩效测量标准:

  重要的是要认识到质量的这些不同方面之间的内部平衡。转录实现真实的时间翻译通过叠加机器翻译在真实的时间自动语音识别上。对于识别成绩单的每次更新,将实时生成新的翻译;每秒可能会发生多次更新。此方法在3维质量框架的极端上转录:它显示了最小的滞后和最佳质量,但它也具有很高的消除速度。理解这一点使我们能够努力工作找到更好的平衡。

  减少擦除的直接解决方案是减少翻译更新的频率。在此行,“流翻译”模型(例如stacl和牛奶)智能地学习和识别何时已收到足够的源信息以安全地扩展翻译,因此无需更改翻译。这样,流动翻译模型可以实现零擦除。

  这种流翻译模型的缺点是,它们再次采取极端立场:零擦除需要牺牲bleu和滞后。决定完全消除根除,偶尔偶尔的不稳定的小预算可能会更好地允许更好的bleu和lag。重新训练并维护用于真实时间翻译的特殊模型。在某些情况下,排除流式翻译的使用,因为它是支持100多种语言(例如Google Translation)的产品的重要考虑因素。

  在我们的第二篇论文“重新翻译和流传输相同翻译的传输”中,我们显示了原始的真实 - 时间翻译“重新翻译”方法,以减少雨刮器并实现更有利的擦除/滞后。/bleutrassaction。离开。没有任何特殊模型,我们将一对推理时间应用于原始的机器翻译模型 - 屏蔽和偏见。

  翻译的结局通常会闪烁,因为它更有可能依赖意外的源单词。我们通过从翻译中切割一些单词直至观察到源句子结束。对于不影响质量的稳定性。这与流量方法中使用的延迟策略(例如Wait-K)非常相似,但仅在推理期间而不是在推理期间应用。

  Neuro-机器翻译通常在相同的良好翻译之间“ Seesaw”,从而导致不必要的根除。我们通过将输出偏向我们已经显示给用户的内容来提高稳定性。在减少删除的情况下,偏见也倾向于减少延迟通过较早的稳定翻译。偏见和面膜相互作用良好,因为面膜的不稳定单词也可以防止模型偏向于偏置。质量。

  掩盖和偏见的组合产生了高质量和低序列重新翻译系统,与此同时,它消除了几乎消除的根除。下表显示了指标对引入的灵感方法的响应,以及比较的比较。他们的系统上面讨论了他们的系统。该图显示,即使预算很小,重新翻译也超过了零闪存流的转换系统(牛奶和牛奶和WAIT-K),经过专门培训进行实时翻译。

  系统蓝色团队擦除

  re -Translate(旧)20.4 4.1 2.1

  与WMT 14英国 - 德国人相比,重新翻译,稳定,稳定和特殊流动模型(Wait-K和牛奶)。通过不同的偏置和面具组合,可以获得重新翻译的BLEU-LG称重曲线,并在同一偏置组合中获得时间保持消除预算,每10个字符少于2个字符,并用无法纠正的流模型比较,并且需要为每个称重点一个特殊的训练点,重新翻译可提供更好的bleu/lagging余额。

  结论上面的解决方案概述非常快速地返回良好的翻译,同时允许更多的源句子修改它。重新翻译的简单结构使我们能够以最少的精力应用我们的最佳语音和翻译模型。消除只是故事的一部分 - 我们还期待通过新技术改善整体语音翻译体验。这些技术可以减少翻译过程中的延迟,或者在多人讲话时获得更好的转录。

  更新说明:更喜欢更新微信公共帐户“ Rainy Night Blog”,然后更新博客,然后将其分发到一个接一个地分配给各种平台。如果您提前了解更多信息,请注意微信公共帐户“ Rainy Night Blog”。