当前位置: 首页 > 科技观察

人工智能翻译让你无障碍爱上老外

时间:2023-03-12 21:40:48 科技观察

在人工智能语音翻译领域,噪音是必须面对的主要挑战之一。该设备可能能够识别实验室或会议室中的语音,但我仍然可以在Waibel教授周围听到它,我(MarekKohn)在日本京都站与他交谈。背景噪音。我试图用英语跟上他的思路,但潦草的线条让我想起我们相隔将近一万公里,尽管我们说的是同一种语言,但距离仍然是沟通的主要障碍。工作中的同声传译毕竟我们还没有达到科幻小说中描述的那种无缝沟通。在这些描述中,Wybel教授可以用他的母语德语进行解释,但我听到的是英语。或许,不用动手,他也可以和身边的日本人无缝交流,哪怕大家说的都是母语,也不会影响他们之间的交谈。德国卡尔斯鲁厄理工学院计算机科学教授魏贝尔和他的同事们已经可以用德语授课,学生可以通过电子翻译器听英语授课。该系统生成学生可以在笔记本电脑或手机上阅读的文本,因此这个过程有点类似于字幕。但是,它可以帮助讲师更清楚地讲授课程,而不必担心背景差异。人工智能语音翻译的想法由来已久。怀贝尔还是美国卡内基梅隆大学计算机科学教授,甚至可以称为人工语音翻译的开创者。他于1978年在麻省理工学院(MIT)提出了这个想法。道格拉斯·亚当斯(DouglasAdams)大约在同一时间提出了这个想法。《银河系漫游指南》(《银河系漫游指南》)中有一种生命体叫“巴别塔”(Babel),把它放在耳朵里,听者就能听懂宇宙中任何生命种族的讲话。语言。这代表了技术爱好者期待已久的设备,例如便携式语音通信设备和可以挂在墙上的平板电视,这是早该实现的东西,总有一天会成为现实。1991年,Wybel构建了第一个语音翻译系统,它的词汇量为500个单词,可以在大型工作站上运行,需要几分钟来处理听到的内容。“它还没有为语音翻译的黄金时代做好准备,”他承认道。今天,随着人类翻译和语音识别的不断改进,类似于巴别塔鱼的原型设备开始出现。谷歌使用谷歌翻译在Pixel耳机中加入翻译功能,它还可以通过智能手机应用程序进行语音翻译。Skype具有翻译功能,可以处理10种语言。一些较小的公司,例如总部位于纽约布鲁克林的初创公司WaverlyLabs,已经开发了耳机翻译器。科技媒体的评论可以合理地概括为“实际上还不错”。目前可用的系统已经证明了这一概念,但在现阶段它们似乎被视为引人注目的新奇事物,而不是朝着Wybel所说的“建立语言透明的社会”迈出的一步。推动人声翻译的主要趋势之一是鼓励人们使用该技术进行交流。谷歌翻译产品总监巴拉克·图罗夫斯基(BarakTurovsky)表示:“我们通常处于支持语音的设备范式的早期阶段,但它的发展非常迅速,翻译将是这一旅程的关键部分之一。”上个月,谷歌为其家庭设备推出了翻译模式,只需说“嘿谷歌,做我的法语翻译”,你就可以在智能显示屏上语音激活和翻译文本。谷歌建议将酒店入住作为可能的用例。这可能是一个明显的例子,它可以作为“旅行者的英语”,无论是母语为英语的人还是其他语言的人。如果你的手机上有翻译软件,你已经可以做到这一点,尽管它的屏幕和扬声器很小。这种简单的公共交互在很大程度上利用了应用程序的对话功能。但另一个流行的用例是Turovsky所说的“浪漫”。数据日志显示“我爱你”和“你有一双美丽的眼睛”等短语的流行程度。其中很多可能并不代表任何新事物。毕竟,pickup几十年来一直是标准短语手册的内容。WaverlyLabs使用聊天功能在Indiegogo上宣传其筹款活动。该公司的创始人兼首席执行官安德鲁·奥乔亚在一段视频中描述了他的灵感:他在度假时遇到了一位法国女性,无法与她很好地沟通,于是萌生了做翻译的想法。尝试使用翻译应用程序是一种“糟糕的体验”。手机会挡路,但耳机不会挡住您的脸。视频显示了可能的情况:他给法国女人看了耳机,然后他们一起出去喝咖啡和观光。该演示非常成功,奥乔亚筹集了440万美元,是其最初目标的30倍。WaverlyLabsPilot耳机(红色和白色)与Google的Pixel耳机(黑色)对比一位顾客表示,WaverlyLabsPilot耳机让他第一次与女友的母亲通话。有些人甚至说这使他们能够与配偶交谈。“每隔一段时间我们就会收到来自人们的电子邮件,说他们正在使用这个设备与他们讲西班牙语的妻子交谈,”奥乔亚指出。“我不知道他们最初是怎么到那里的。我们聚在一起了!”我们可以猜测,他们是通过网络和婚介所相识相恋的。奥乔亚承认,“技术需要变得更好,你才能通过耳机找到真爱,但这并不遥远。”在组织中使用。WaverlyLab现在正在为需要改进语音识别、翻译准确性和翻译时间性能的特殊用例开发新模型。“专业人士在谈话中往往缺乏耐心,”奥乔亚说。新版本还将包括对卫生设计的改进,以克服Pilot耳机最不吸引人的功能。通话时,双方都需要佩戴Pilot耳机。“我们发现与陌生人共用耳机存在障碍,”奥乔亚说,这可能并不令人意外。如果耳机翻译变得司空见惯,以至于陌生人的耳朵里可能已经有了自己的耳机,那么这个问题就可以解决了。这种情况是否会发生,以及发生的速度有多快,可能并不完全取决于耳机本身,而是取决于语音控制设备和人工翻译的普遍存在。在这方面,主要推动力似乎是进入亚洲新兴市场。谷歌估计50%的互联网是英语的,但世界上只有20%的人说英语。“如果你看看互联网使用量快速增长的地区,比如亚洲国家,那里的大多数人根本不懂英语。因此,打破语言障碍是每个人的重要目标,”图罗夫斯基说,显然也适用于Google。这就是谷歌将大量资源投入翻译系统的原因。”Waibel还强调了亚洲的重要性,指出语音翻译在日本和中国已经真正起飞。然而,还有很长的路要走。翻译需要同时进行,就像电视上的同声传译需要与外国政客的发言同步,而不是每说几句就让发言者停顿一下,等待翻译员表演。它需要能够在没有互联网访问的情况下离线工作,并解决对云中累积的私人语音数据量的担忧,这些数据已被发送到服务器进行处理。Wybel建议,该系统不仅需要应对噪音等物理挑战,还需要具有社会意识,例如了解人们的行为方式并适当地与他们交谈。当我第一次给Wybel发电子邮件时,意识到他是一位德国教授,而且欧洲大陆的传统要求对学术地位给予认真的尊重,所以我犯了一个有偏见的错误,称他为“亲爱的Wybel教授”。正如我所料,他用国际标准英语回答:“你好,马利克。”对礼仪敏感的人工翻译将消除了解不同文化规范的需要,他们将促进沟通,同时减少误解。同时,它们可能有助于保护当地习俗并减缓与国际英语相关的习俗的传播。尽管如此,教授和其他人并没有将语言意识外包给软件。如果技术成熟到无缝连接和无处不在的程度——简而言之,就像巴别鱼一样——它实际上会增加语言技能的价值。自动翻译将提供商品——帮助人们购买东西或找到目的地的基本、有用的信息。它是否会帮助人们管理家庭生活或浪漫关系是一个悬而未决的问题。但这是一个值得注意的可能性,可以克服移民后几代人之间经常出现的语言障碍,让孩子和祖父母没有共同语言。然而,无论AI语音翻译技术如何运用,都比不上真正的通天鱼。尽管语音变形技术模拟了说话者的声音,但他们的嘴唇动作不会匹配,看起来就像在配音电影中一样。这种对比将强调共享语言的价值,以及学习它们的价值。努力学习某人的语言是一种承诺,也是被视为值得信赖的标志。共享一种语言也能培养归属感和社区感,就像国际科学家将英语作为他们的通用语一样,而他们的前辈使用拉丁语。学习顾客语言的移民店主不仅让销售变得更容易,他们还表现出愿意与顾客的社区更亲近,礼貌地宣告他们已经融合。当机器翻译成为一种无处不在的商品时,人类的语言技能将受到重视。会多种语言的人总是比那些依赖设备的人有优势,就像那些有数字意识的人比那些需要使用计算器的人有优势一样。虽然对共同语言的实际需求会减少,但共享这种语言的社会价值将持续存在。软件永远不会取代语言知识带来的微妙但重要的理解体验。毕竟,总是需要这些知识来从噪音中找出细微差别。