眼球不够,八卦先来个“八卦”。就在这篇文章即将写完的时候,翻译圈发生了一起“爆”事件。6月27日下午,一位同传译员在朋友圈爆料:一家AI公司让译员“玩”机器同传,营造出人工智能取代人工同传的“震撼”效果。这件事瞬间在译者群的朋友圈、微博、微信群里引爆了积压已久的火药桶。因为这几个月,不时冒出一个号称替代同声传译的翻译器,尤其是6月下旬的一篇微信文章《刚刚宣告:同声传译即将消亡!》,铺天盖地都是一堆相关或不相关的东西。公众号,不知道带了多少个10万+。几乎每一个翻译行业的从业者都收到过朋友转发的文章,语气中充满了同情和关心。从最初的“呵呵”,到逐渐的不堪其扰,他终于被上面的事情彻底激怒了。@同声传译樱桃羊微博哽咽:台上还有演讲者,光鲜亮丽受人尊敬,一边享受我们的服务,一边说同声传译以后要失业,骨子里有很深的仇恨。对这个行业的蔑视——“你们都是未来会被取代的工作,我们何必在意你们的感受?”如果你有能力,请不要邀请我们。既然你邀请了我们,那么在你说这话之前,你能不能和在现场辛勤工作的人谈谈?对不起同一个传说?可见“怨气”已经深到什么程度了。事件后来发生了戏剧性的转折。两天后,在文章《消亡》(注:没有证据表明上述造假与讯飞有关)中吹捧的小译翻译机厂商科大讯飞在其公众号文章上发表了一篇题为《拒绝神化 人工智能技术需踏实前行》的文章。重点在这两段:目前,机器翻译已经取得了长足的进步。衣食住行等日常常用表达的汉英翻译可以达到大学六级水平,可以帮助人们应对一些场景下的语言沟通问题,但距离还有一段距离会议同声传译与高水平翻译在“信、达、雅”上存在较大差距。讯飞一直在努力的是通过语音转录和翻译技术帮助同声传译提高工作效率,减少错误,形成人机耦合的同声传译新模式,而不是取代同声传译。好吧,原来是“神化”了,原来是“我拒绝了”。不过不管怎么样,这篇文章一出,就得到了很多不明真相的人的点赞。义愤填膺的翻译们也迅速恢复了低调内敛的幕后工作者态度。就连揭发造假者的呼声也立即沉寂下来。作为人工翻译圈的机器翻译工作者,我觉得这次事件暴露了一些对翻译行业很深的误解,无论是普通大众还是机器翻译/人工智能工作者。本文的主题是探讨人机融合对机器翻译发展的重要性。因此,有必要先澄清这些误解。GitChat的读者可能期待更多的技术深度,我一开始打算写的更技术一些。但是,发生上述事件后,我认为在关心人机融合模式的技术实现之前,应该先探究问题的本质。有志于取代人工智能的同仁,首先要知道自己要取代的是一个神奇的存在吧?误区一:翻译是简单机械的语言转换。翻译工作有很多误区,这是最核心的,还有很多其他的误区(比如懂外语就可以做翻译,到处都是翻译,没有专业知识也可以做翻译等等),根源就在于此.为什么那么多人“一致”认为翻译即将被取代?除了引人注目的自媒体,“换人党”还包括了太多的互联网大佬,比如库兹韦尔、李彦宏、李开复、王小川等等。让我们看看这背后的逻辑是什么。李开复在他的新书《人工智能》中提出了一个“五秒法则”:本来是由人完成的工作,如果人能够在5秒内就工作中需要的思考和决策问题做出相应的决定秒,那么,这项工作很可能会被人工智能技术全部或部分取代。那么根据“五秒法则”,书中预测,从事翻译、新闻报道、助理、保安、销售、客服、交易、会计、司机、家政等工作的人员中,约有90%将被取代未来10年的人工智能。全部或部分更换。显然,翻译很不幸地首先被归类为“五秒钟”就能解决的问题。大概是因为同声传译这个光环工作给大家带来了一种错觉:翻译不是几秒钟就完成了吗?而且,据说同声传译是所有翻译工作中最难、最贵的,那么其他翻译呢?这不是更容易吗?实际上?口译员都知道,要准备一场会议口译,要提前多少天的功课,会前要做好多少沟通协调,会中还要注意适应情况;更何况,要达到会做同声传译的水平,还需要多年的苦练。用“台上一分钟,台下十年功”来形容翻译工作更为贴切。翻译工作一点也不轻松,也需要经过多年的训练才能做出合格的译文。此外,这种误解实际上包括两个断言:翻译只是语言转换。语言切换简单而机械。事实上,这两种说法都站不住脚。对于第一个问题,我们要问翻译的本质。翻译是一种语言服务。关于语言服务,最近看到广东外语外贸大学李瑞林教授给出的定义。我认为最贴近其本质:语言服务是以语言资源为基础,以知识为目标,赋能与共情,知识与体验的变现。人际或组织转移的社会经济过程(见《语言服务概念框架的再反思:存在依据、普遍本质及实践逻辑》)。可见,语言是翻译的载体,而不是服务本身。翻译工作带来的知识、经验和情感是最关键的东西。而这些东西,相信开复人不会认为机器好办(除了内存的静态知识)。对于第二个问题,还要进一步追问“语言”的本质。我们知道,语言是信息的载体。例如,当我们想向另一个人传达“苹果”的信息时,我们不必把他拖到水果店或高科技体验店。但是这个信息载体并不是无损的。当我们使用“苹果”这个概念时,显然不可能将形状、颜色、触感、气味、效用等所有具体信息都传递出去,还得靠对方“凑”出来信息。因此,语言实际上只是信息处理过程中经过编码的“捷径”。快捷方式所代表的信息能否被解码取决于信息接收者的认知结构。这就是所谓的“有一千个读者,就有一千个哈姆雷特”。译者必须既是解码者又是编码者。他必须在短时间内使自己的认知结构接近原作者的预期,同时还要考虑到另一种语言读者认知结构的差异。转换的难度可想而知。因此,翻译并不像想当然的那么简单。在这篇文章的预览帖中,我列举的几种语言特性中,“开放性”、“歧义性”、“进化性”等问题给翻译带来了很大的困难。要想机器翻译达到或超越人工翻译,首先要正视它的难点和价值,而不是依赖于将对方“简化”成某种形式的机器。否则,不就把国乒搞垮了,就达到了“国足和国乒水平”的目的吗?误解二:人工翻译就是“好翻译”这可能是人工智能工作者普遍存在的误解,但也是大家普遍非常看好机器翻译的原因之一。受“图灵测试”思想的影响,我们将“让机器翻译给出一个好的翻译”的问题转化为“如果机器翻译给出的翻译不能被人或机器区分,就是一个好的翻译。“”。因此,绝大多数的机器翻译训练,无论是统计机器翻译还是人工神经网络,都是以人类翻译语料库的“最大似然”作为训练目标。即想办法使机器翻译lookclosesttotheparallelcorpusoftheparallelcorpus.这个假设包括以下子假设:有足够的)。普通的双语者肯定能分辨出翻译质量是否过了这个分界点。不幸的是,这些假设也是我们为了对问题有更好的形式化定义和相对一致的评估标准而做出的简化假设。当我们离问题的“完美”解还很远的时候,这些假设对于我们做出切实可行的近似解是非常有帮助和必要的。但是,如果我们把在这些假设下得到的局部最优解的实质性进步等同于非常接近全局最优解,我们就会产生即将突破临界点的错觉。这不利于寻找真正的真理。下面就以上子假设一一说说。首先,人工翻译的水平显然不是质量尺度上的一个点,而是一个上下界相差很远的区间,比如从30分到99.99分。它的下限低于机器翻译的水平,这是最正常的事情。更何况这条刻度线上的刻度值(如果以所需力为间距单位的话)并不是等距分布的。比如59分钟和60分钟的距离是1厘米,那么95分钟和96分钟的距离可能是1米,98分钟和99??分钟的距离可能是几公里……那么,请问我们应该将哪个位置设置为人工翻译水平呢?这里有很多学问——比如分界点设在60,机器翻译从30升到57,是不是已经达到了90%的目标?即使我们定了99分的高标准,机器翻译也从39分提高到69分。当距离99分还有30分的时候,我们可以说完成了一半吗?长征恐怕只是第一步。但我们很容易想当然地炫耀自己走过的路。比如去年的谷歌GNMT论文,经过计算提升了87%(在某个语言方向,可以找原论文分析其评价数据和结论的关系),已经可以看出胜利在望凯旋门在招手……其次,与其他自然语言处理任务相比,机器翻译由于拥有平行语料库等自然标记的数据资源而更加成功。只要平行语料库是人工翻译的,我们似乎就可以将其作为质量的黄金标准。然而,问题是:语料库有限,但语言是开放的,与语料库不匹配,并不代表它“不好”。语料库是静态的,但语言是动态发展的——过去好的现在可能不好。在一个领域好的东西在另一个领域不一定好。对某些人或情况有利的事情可能对其他人不利。语料库本身的质量可能参差不齐(因为人工翻译的质量参差不齐,参考上面的第一项,更何况很多语料库的来源也是机器翻译),尤其是在规模庞大的时候,即可以说,近似不一定好。因此,基于双语语料库的质量标准,没有更好的办法,“金”度还不够高。第三,假设我们确实可以找到足够好的人工翻译作为质量标准,那么是否有任何双语者有足够的辨别力来正确区分人工翻译和机器翻译?也就是,会不会有这种情况?在这种情况下,一个机器翻译确实是有缺陷的,但有些人就是和参考翻译不一致就看不出是好是坏?答案是肯定的。就像一台写诗的机器。普通人的鉴赏力或阅历有限,不一定能分辨是不是机器写的。这就是为什么微软的机器人小冰潜伏在各个文学社区而不被发现的原因。但热衷文字的人还是可以筛选出哪些是好诗——小冰发布的诗集其实是人工“挑选”出来的。既然如此,不同资历、不同专业、不同文化、不同目标、不同条件的人,对翻译质量的认知也不同。找什么样的人作为图灵测试的判别器,也是需要慎重考虑的事情。三个子假设与实际问题存在一定差距。可见,我们目前的评价体系还不足以带来足够的反馈。这是与下围棋的AlphaGo最大的区别。我们知道,AlphaGo最强大的地方在于它可以通过与自己下棋来不断提高自己的水平,而自我对弈的前提是判断胜负的明确标准。至于翻译的好坏,目前还没有很好的评价机制。也正因如此,今年闹得一塌糊涂的生成对抗网络(GAN)虽然在机器翻译上有效果,但效果并不算太惊人。要想有所突破,就要更加注重评价机制。误区三:翻译市场就那么大,机器多了,人的份量就小了。的确,如果我们把翻译市场比作围棋棋盘,人工翻译是黑的,机器翻译是白的。如果城市掠夺土地,一个人种,另一个人种,就会出现所谓的“替代”问题。然而,实际的翻译市场结构是怎样的呢?让我们看看下面的图片。此图来自一份行业研究报告。如果我们将企业中的文本内容比作一个金字塔:上面的部分目前由人工翻译完成,包括产品信息、营销文案、品牌形象、法律合同等,下面的部分目前由机器翻译完成,大部分这是用户发起的公共网页浏览。中间的部分,比如现场支持和常见问题解答、用户生成的内容、企业内部知识库等,实际上是没有翻译的。而这些未翻译的内容居然占到了99%!也就是说,无论是人工翻译还是机器翻译,都有大片处女地等待开垦,其中很大一部分可能需要人和机器携手合作。提供可行的解决方案。君不见,如今机器翻译用得最多的场景,旅游、电商、聊天、社交,以前都不是人工翻译的菜。未来在客服、知识库、UGC等场景的语言支持,基本上既需要机器的速度,也需要人的可靠性或温度,必须通过人机结合来实现。更何况,上面金字塔的大小并不是一成不变的。随着互联网和人工智能的发展,全球信息流动加速,内容规模不断扩大。楚河大战?言归正传等等,预订的时候约定了什么?为什么老是说这些误会?其实,对于翻译行业或职业,还存在很多误解。为什么选择这三点?请讲?不仅因为这三点是最关键的,而且因为在明确了这三点之后,我们的主题和预定公告中的第一个问题(为什么需要人机融合)的答案就非常明确了。机器翻译要取代人工翻译还有很长的路要走。人力和机器的结合可以提供更好的解决方案,释放出之前被压抑的更大的需求。翻译是知识、经验和情感的传递,人是实现这种传递的主体。现阶段,只有通过人才能更好地获取机器翻译所需要的知识和数据。缺乏良好的评价机制很快就会成为制约机器翻译进步的关键瓶颈,而语言的特性决定了评价反馈不可能来自于语言本身,而只能来自于语言使用场景中的人。对于致力于机器翻译/人工智能的同仁们,希望这篇文章能够引起你们的思考。以上观点不一定正确。但在今天,当我们在密切关注深度学习的最新成果时,或许我们也应该低下头想想自己还欠缺什么,在收获肉眼可见的成果后我们能做些什么。翻译圈的朋友们,看到机器翻译无法替代人工翻译,是不是松了一口气?但是,这并不意味着机器翻译不会让现有的翻译人员失业。下一篇我会回答预定公告中的第二个问题(如何做人机翻译)。顺带一提,机器翻译让翻译人员失业的可能性有N种。
