当前位置: 首页 > 科技赋能

人工智能真的能取代同声传译吗?

时间:2024-05-22 13:51:46 科技赋能

前段时间,一名同声传译员指责科大讯飞“AI同传造假”,在网络上引起轩然大波。

人工智能和同声传译也因此成为热门话题。

今天,我们来聊聊“人工智能翻译真的能取代同声传译员吗?”同声传译有多难?同声传译首次出现于第一次世界大战后的巴黎和会上,英法两国代表在同声传译员的帮助下完成了紧张的谈判。

时至今日,该技术仍然在国际会议中发挥着极其重要的作用。

据统计,95%的国际会议都有专业同声传译员协助。

同声传译员要想在舞台上自如运用同声传译技巧,需要大量的刻苦练习。

即使是双语且可以自由使用的专业人士,在实际实践之前也需要几年的培训。

他们不仅需要提前学习和熟悉会议材料,还需要适应变化的能力。

同声传译的工作方式也比较特殊。

由于压力巨大,通常需要多人一起工作。

在持续几个小时的过程中,每个人轮流翻译几十分钟。

相比之下,普通的口译工作要简单得多。

如果机器翻译能够取代同声传译,无疑具有巨大的价值。

人工智能翻译有多好?那么,人工智能同声传译的能力是什么?它会抢走同声传译员的工作吗?今年上半年的博鳌亚洲论坛上,人工智能同声传译首次亮相。

但现场配备的系统出现故障,导致单词翻译不准确、重复等低级错误。

客观地说,人工智能或者机器翻译技术确实在自然语言处理方面取得了很多突破。

这些突破给人们带来了对未来的希望和想象。

但短期内的价值更多体现在辅助翻译等领域。

当然,机器翻译目前已经取得了长足的进步。

衣食住行等常见日常用语的中英翻译可以达到大学六级的水平,可以帮助人们处理一些场景下的语言沟通问题。

但距离人工同声传译和高水平翻译还有很远的距离。

与横译所讲究的“信达雅”还有很大差距。

目前的差距是由现有技术水平的限制决定的。

机器翻译,也称为自动翻译,使用计算机将一种语言转换为另一种语言。

机器翻译技术的发展与计算机技术、信息论、语言学密切相关。

其他学科的发展也密切相关。

从早期的词典匹配,到结合语言学专家整理的知识规则,再到基于语料库的统计方法,随着计算能力的提升和多语言信息的积累,机器翻译技术已经开始在一些场景下提供便捷的翻译。

服务。

新世纪以来,随着互联网的普及,互联网公司纷纷成立机器翻译研究小组,开发基于互联网大数据的机器翻译系统,使机器翻译真正实用化,相对成熟的自动翻译产品也开始走向市场。

出现在市场上。

近年来,随着深度学习的进步,机器翻译技术得到进一步发展,促进了翻译质量的提升,使翻译更加地道、流畅。

机器翻译的难点是什么?这里,我们简单介绍一下机器翻译的难点。

整个机器翻译过程可以分为语音识别转换、自然语言分析、翻译转换和翻译生成等阶段。

这里,以典型的基于规则的机器同声翻译为例(见下图),模块包括:语音识别(语音到文本的转换)、自然语言处理(语法分析、语义分析)、翻译转换、等模块如翻译生成和语音生成。

技术难点主要是:语音识别、自然语言处理和翻译转换步骤。

第一个技术难点是语音识别。

近二十年来,语音识别技术取得了长足的进步,开始进入家电、汽车、医疗、家庭服务等各个领域。

常见的应用系统包括:语音输入系统,它比键盘输入法更符合人们的日常习惯,更自然、高效;语音控制系统,利用语音来控制设备的运行,相比手动控制更加快捷方便,可应用于工业控制、语音拨号系统、智能家电、声控智能玩具等多个领域, ETC。

;智能对话查询系统基于客户的语音进行操作,为用户提供自然、友好的数据库检索服务,如家居服务、旅行社服务系统、机票预订系统、银行服务等。

可以说,语音识别技术与与其他自然语言处理技术结合可以构建许多复杂的应用程序。

然而,语音识别的主要难点在于自然语言的识别和理解。

首先,必须将连续语音分解为单词和音素等单元,其次,必须建立理解语义的规则。

由于语音信息量大,不仅不同说话人的语音模式不同,而且同一说话人在不同场景下的语音模式也不同。

例如,一个人随意说话和认真说话时的言语特征是不同的。

此外,说话者说话时,不同的单词听起来相似是很常见的。

单个字母或单词的语音特征受到上下文的影响,导致重音、音调、音量和发音速度的变化。

最后,环境噪声和干扰对语音识别也有很大影响,导致识别率低。

第二个技术难点是语义分析,它是智能机器翻译系统的核心部分。

目前,机器翻译系统可以分为两类:基于规则的和基于语料库的。

前者基于词典和语言知识规则库;后者以划分和标注的语料库为知识源,主要基于统计算法。

机器翻译系统是随着语料库语言学的兴起而发展起来的。

目前,世界上大多数机器翻译系统都采用基于规则库的策略,一般分为语法型、语义型、知识型和智能型。

不同类型的机器翻译系统由不同的组件组成。

抽象地说,所有机器翻译系统的处理过程都包括以下步骤:对源语言进行分析或理解,对语言的语法、语义和语用平面进行转换,并根据目标语言的结构规则生成目标语言。

语言。

目前,谷歌的在线翻译已经家喻户晓。

其第一代技术是统计机器翻译方法。

其基本原理是收集大量的双语网页作为语料库,然后计算机自动选择最常见的词与词的对应关系。

关系,最后给出翻译结果。

然而,该技术的运用仍然无法达到令人满意的效果,各种翻译笑话时常发生。

由于统计方法需要建立大规模的双语语料库,翻译模型和语言模型参数的准确性直接取决于语料库的规模和质量,而翻译的质量直接取决于模型的质量和覆盖率语料库的。

除了上述传统方法外,随着2008年以来深度学习的研究取得长足进展,基于人工神经网络的机器翻译也逐渐兴起。

目前,长短期记忆循环神经网络广泛应用于机器翻译。

该模型擅长对自然语言进行建模,将任意长度的句子转换为特定维度的浮点向量。

同时,它“记住”了句子中比较重要的单词,让“记忆”能够保存更长的对话时间。

该模型较好地解决了自然语言句子向量化的问题。

其技术核心是通过多层神经网络从语料库中自动学习知识。

语言的句子经过向量化后,在网络中逐层传输,经过多层复杂的传输运算,生成翻译。

这种翻译方式最大的优点就是翻译流畅,更符合语法。

与以前的翻译技术相比,质量有了很大的提高。

我们距离智能同声翻译还有多远?需要注意的是,很多人对机器翻译存在误解,认为机器翻译偏差较大。

事实上,机器翻译是利用语言学知识自动识别语法,模拟语义理解,并进行相应的翻译。

由于语法、语义和语用的复杂性,错误是不可避免的。

从现有结果来看,机器翻译的全场景通用的翻译质量距离最终目标还很远。

随着全球网络时代的到来,语言障碍已成为21世纪社会发展的重要瓶颈。

实现任何时间、任何地点、任何语言的无障碍、自由交流是人类追求的梦想。

这只是全球化背景下的一个小缩影。

在社会快速发展的过程中,机器翻译将发挥越来越重要的作用。