最近,一款在线机器翻译软件在日本走红。 这个翻译软件叫DeepL。火的原因是其工作过于负责,翻译过于准确,在日本引起了热议。 从日本网友的私下评价来看,不仅日语方言的翻译效果极佳,就连文言文都被拿下了。要知道,这是连谷歌翻译都做不到的事情。 但是有多精确呢?作为一个严谨的技术软件,当然还是要用数据来说话。DeepL官方还发布了日英翻译和中英翻译的盲测结果。如下图所示,可以看出DeepL简直就是碾压。是否存在: 盲测是在专业的翻译审稿人不知道哪个译文是哪个网站翻译的情况下,对译文进行评价,一直是DeepL的测试方式之一。 DeepL也因为出色的准确率引爆了Reddit。有网友指出,DeepL不像谷歌翻译那样从单词翻译过来。从Textractor的设置中,我们可以看出DeepL也支持使用之前的翻译。使用上下文来改进翻译结果。 还有很多网友直呼“DeepL牛逼”! 3年前,当DeepL第一次出现在大众视野时,就引起了广泛关注。DeepLCEOGereonFrahling曾表示,DeepL的目标不仅限于翻译任务。神经网络会从理解文本开始,开拓更多的可能。 至于更多的可能性是如何被开发出来的,文摘菌做了一个小测评,接下来我们一起看看DeepL的发展史。小板凳已经搭好了,欢迎坐~ 学术论文,机器翻译神仙大战! 无论是私下的测评,还是DeepL官方的盲测结果,都暗示着DeepL可能是目前准确率最高的机器翻译,具体好坏还是得自己试一试才知道。 本次更新也加入了简体中文,带着一点疑惑和一点好奇,文摘菌也对DeepL进行了简单的测评,与目前主流的谷歌翻译、微软翻译、百度翻译、有道翻译做了对比. 本次考试分为三轮,第一轮方言,第二轮文言文,第三轮学术论文。好的,现在我们有五位参赛者可以进入。 第一回合,我们来看方言。 众所周知,中国的方言文化博大精深。如果不能正确翻译方言,准确率还是会受到质疑。 我们选的是东北话十级题目:“我去,你长得太丑了”。这道题有两个打分点,一个是“Letmego”,一个是“Knock”。让我们来看看五名球员的表现。 第一个评分点,谷歌翻译成“I'llgothere”,微软和百度认为是“我去”的意思,有道给“我不知道”,DeepL表现不错,正确用惊讶的语气翻译成“哦,我的上帝”。 第二个打分点,五位选手给出了不同的答案,谷歌“害羞”,微软“势利”,百度“寒酸”,有道“烂”,DeepL“丑”。 打分的话,第二题百度表现尚可,有道……勉强及格,谷歌和微软全军覆没。来看看DeepL的满分试卷: 是第一题,别着急,还有翻身的机会。接下来,让我们看看文言文。既然DeepL能翻译古日语,不能翻译古汉语就错了。 第二轮,文言文。 文言文部分,我们以唐代著名诗人张九龄的名句“明月海上升,天涯此时”作为试题。这首诗的意思是,一轮明月升起在浩瀚无际的大海上,使人想起远在人间的亲友,而此时此刻他也应该正望着同一轮明月。 本题的打分点是看参赛者能否用英文表达整首诗的意境。好了,中文版的标准答案已经揭晓,那么五位选手的表现如何呢? 首先从句子的意思来看,谷歌、微软、百度都放弃了后半句的翻译。有道将后半句翻译为“此时的天涯”;用的是born这个词,但是微软的翻译是“大海诞生了”???? 让我们来看看DeepL。前半句和谷歌的回答一模一样,不知道后半句的翻译有没有达到自信优雅的程度,但是读起来感觉很舒服。快来尝尝吧: 第三题也是最后的最后一道题。我们要考察的是参赛选手对学术论文的中英翻译。 学术论文的关键,不仅是句子要流畅,专业词汇也要准确,这也是本次考察的重点。 的中英翻译,我们选择了去年在《国际新闻界》上发表的一篇文章。研究人员调查了社交媒体信任对隐私风险感知和自我披露的影响。 原文:实证结果表明:1.隐私风险感知与自我披露之间不存在显着相关性;2.社交媒体信任负向影响用户隐私风险感知,网络人际信任在其中起中介作用;3.社交媒体信任正向影响用户的自我表露,网络人际信任在其中起中介作用。 从翻译结果来看,五位选手给出的答案都比较令人满意,句型和语法都没有问题,但在一些特定的用词上各有千秋。例如,DeepL和微软使用“self-expression”进行“self-disclosure”,而其他三位选手则使用“self-disclosure”;而“InternetInterpersonalTrust”被有道、百度、微软翻译成“网络人际信任”。trust”,谷歌给出了“onlineinterpersonaltrust”的答案,DeepL将其翻译为“cyber-interpersonaltrust”。 照例,我们来看看DeepL的答案。 对于英译汉部分,我们选择了上周Digest细菌报道的帝国理工论文的介绍部分,在用户体验方面,需要插入Digest,从中转英转英转中时,只有百度、有道和DeepL做到了自动识别。谷歌和微软仍然需要手动选择语言。 译文:COVID-19的全球影响是深远的,它所代表的公共卫生威胁是自1918年H1N1流感大流行以来呼吸道病毒中最严重的威胁。在这里,我们展示了流行病学模型的结果,该模型在最近几周为英国和其他国家/地区的政策制定提供了信息。在没有COVID-19疫苗的情况下,我们评估了一些公共卫生措施的潜在作用——所谓的非药物干预(NPI)——旨在降低人群接触率,从而减少病毒的传播。在这里展示的结果中,我们将之前发布的微观模拟模型应用于两个国家:英国(特别是英国)和美国。我们得出的结论是,任何一种隔离干预的有效性都可能是有限的,需要多种干预相结合才能对传播产生实质性影响。 从结果上看,五位选手的学术造答都比高,学术语言使使用的规范没有太大区别。但是,你可以在细节中看到真相。只有有道保留了双破折号的使用,这在中文中其实并不常见;NPI)”并不完美。 尽管如此,DeepL还是笑到了最后。虽然还有各种小问题,拿不到满分,但还是妥妥的高分试卷: 以上就是本次测试的全部试题,可以看出DeepL当之无愧一号种子选手。无论是方言、文言文还是学术话语,都表现出色。看来DeepL官方还是很老实的。 由Linguee转型,机器学习赋能DeepL 见证了DeepL“独树一帜”的表现,接下来重点介绍本次评测中表现最好的头号种子DeepL。 不知道DeepL?你应该听说过Linguee。它是已经运行了十多年的在线外语词典。DeepL的前身是Linguee。Linguee是一款出现多年的翻译工具,虽然使用广泛,拥有忠实的追随者,但其翻译质量还无法与谷歌翻译相提并论,尤其是考虑到后者的巨大品牌和地位。 不过真正重要的是灵格的技术积累。Linguee联合创始人GereonFrahling曾在谷歌研究院工作。2007年,他选择开始新的征程。团队在机器翻译方面做了几年的工作,直到2016年,他们开始全面开发新系统,成立新公司,这就是DeepL。 Linguee的核心竞争优势是爬虫和机器学习系统。前者可以抓取互联网上超过10亿句的翻译结果和查询的大数据库,后者可以在网络上搜索类似片段的真实翻译方法并进行评估。两者的结合使得Linguee在当时成为“世界上第一个翻译搜索引擎”。 经过十年的积累,Linguee在数据和算法研究方面都不容小觑,而这也直接成为了DeepL的绝对优势,为团队训练新模型打下了坚实的基础。 DeepL的变革性神经架构在冰岛的一台超级计算机上运行,??该超级计算机能够进行5.1petaFLOPS(每秒5100万亿次运算),在不到一秒的时间内翻译100万个单词。“冰岛拥有丰富的可再生能源,因此我们可以非常便宜地在这里训练我们的神经网络。我们将继续专注于高性能硬件”,DeepL的首席技术官JaroslawKutylowski说。 “我们在神经网络连接方面取得了多项重大改进,我们的网络比当前的其他神经网络更全面地映射自然语言。 大学、研究机构和Linguee的竞争对手发表的研究进展表明卷积神经网络是机器翻译的正确路径,而不是DeepL使用的RNNs,但现在不是讨论两者区别的时候,对于长而复杂的相关词串,只要你能控制它们的弱点,卷积神经网络就能更好地工作。 例如,CNN一次处理一个词,当句子末尾的词决定了句首单词的形成,这就成了一个问题。查找整个句子来找到句子的第一个单词,如果网络得到的第一个单词是错误的,那就太浪费了,必须使用那些知识重新开始,所以DeepL和机器学习领域的其他人正在研究当CNN移动到下一个单词或短语时,它使用一种“注意力机制”,可以监测这种潜在的问题。 DeepL增加了对Jap的支持最新版本的anese和中文(简体),包括日文汉字、平假名和片假名以及数千个汉字。目前,DeepL支持的语言数量已经增加到11种,虽然语言支持没有其他翻译服务广泛,比如GoogleTranslate和BingMicrosoftTranslator都支持一百多种不同的语言,但是翻译的准确性也是不容忽视的重点。 精通多种语言的Techcrunch编辑Frederic曾这样评价DeepL:“谷歌翻译的风格很直接,但是漏掉了一些细节和成语(或者把这些成语翻译错了),而DeepL往往可以提供更自然的翻译,就像训练有素的人工翻译一样。” 说了这么多,还是那句话。真假只有亲身试过才能知道。有兴趣的同学可以自行尝试。如果大家遇到什么有趣的翻译结果,记得告诉文摘菌哦~ 最后放上官网链接: https://www.deepl.com/translator
