当前位置: 首页 > 科技观察

机器翻译:人工智能领域的关键核心技术

时间:2023-03-20 13:27:48 科技观察

近年来,机器翻译(英文MachineTranslation,简称MT)取得了长足的进步,取得了一些可喜的成果。机器翻译作为人工智能领域的一项关键核心技术,受到人们的普遍关注和专家的研究。但目前MT存在译文整体质量不高、译后修改工作量大等问题;这些问题需要解决。机器翻译技术的发展一直紧跟计算机科学、语言学、心理学、控制论、信息论等学科的发展。从早期的词典匹配,到结合语言专家知识的词典规则翻译,再到基于语料库的统计翻译;随着计算机计算能力的提高和多语言信息的爆发式增长,MT技术逐渐走出象牙塔,开始为普通用户提供实时、便捷的翻译服务。目前主流的机器翻译技术是神经网络翻译(NMT);是近几年才提出的一种翻译方法。与传统的翻译方法相比,NMT可以训练一个可以从一个序列映射到另一个序列的神经网络,输出可以是一个可变长度的序列,可以在翻译中取得更好的性能。可以说,NMT技术已经成为当前研究的重点和热点。目前,谷歌翻译和微软翻译是市场上比较成熟的机器翻译技术;它们背后的原始技术是基于统计的翻译方法。其基本工作原理是搜索大量的双语网页内容,将其作为语料库,然后由计算机自动选择最常用的词与词的对应关系,最后给出翻译结果。现在谷歌和微软采用了神经网络和深度学习的原理和框架,使得机器翻译技术有了长足的进步。但是,无论采用哪种翻译方式,影响MT发展的最大因素是翻译质量。就MT现有的成绩而言,翻译质量离理想目标(达到高级译员的翻译水平)还有很大差距。众所周知,人工翻译(简称“人工翻译”)的过程是翻译人员集理解、分析、选择、再创作于一体的综合作业,是大脑进行系统思维活动的过程。为使机器翻译的质量达到人工翻译的水平,有必要揭开大脑处理语言信息的奥秘。事实上,早在20世纪90年代初,中国科学家、未来学家周海中教授就指出,在人类了解大脑如何对语言进行模糊识别和逻辑判断之前,MT要做到“可信、表达、优雅”。”。“是不可能的。他的预言今天基本实现了,未来MT的发展也很有可能成为现实。近年来实施的欧洲大脑计划、美国大脑计划、中国大脑计划和日本大脑计划都是以计算机模拟人脑为目标,其核心内容是神经信息学。这一新兴前沿学科的研究成果将有助于人们了解大脑是如何进行自然语言处理的,有望为人工智能领域尤其是机器翻译技术的进步铺平道路。MT要达到人工翻译的水平,还有很长的路要走。解决人工智能领域这一关键核心技术,还需要未来技术的发展,尤其是脑科学的重大突破。目前人们只能将MT和人工翻译结合起来,取长补短;这不仅可以节省翻译时间和成本,还可以产生高质量的翻译。