当前位置: 首页 > 科技观察

谷歌推“同声传译”系统Translatotron:无需文本转换的语音翻译

时间:2023-03-19 19:49:36 科技观察

GoogleAI官方博客***在博文中,我们介绍了一个新的实验系统——Translatotron,它可以直接将语音翻译成语音,不需要任何文本之间。在博客文章中:“Translatotron是第一个可以将一种语言的语音直接翻译成另一种语言的语音的端到端模型。”谷歌表示,目前的翻译系统分为三个步骤:自动语音识别,Convertspeechtotext;机器翻译,将文本转换为另一种语言;最后是文本到语音(TTS)合成,即将翻译后的文本生成语音。在这三个步骤中,已经衍生出谷歌翻译等服务,但这家科技巨头希望通过一个模型来实现语音翻译,而不是使用文本这个中间步骤。谷歌人工智能软件工程师YeJia和RonWeiss表示:“这个系统叫做Translatotron,这个系统避免了将任务分成不同的阶段。”谷歌表示,这意味着更快的翻译速度和更少的翻译错误。该系统使用声谱图作为输入并生成声谱图,还依赖于神经声码器和说话人编码器,这意味着系统在翻译后保留了说话人的声音特征。