当前位置: 首页 > 后端技术 > Java

机器学习服务文本翻译能力升级,中文直译模型让翻译表达更地道!

时间:2023-04-01 22:46:55 Java

HMSCore机器学习服务文本翻译能力,提供多种语言、多种应用场景的翻译服务。沟通无障碍,还可以通过摄像头翻译功能阅读餐厅菜单、路牌信息等。中文直译模型升级文本翻译能力目前主流翻译模型大多使用语料??库资源丰富的英文作为中间语言进行“桥接”翻译,但从英文转过来后翻译精度损失大,执行效果差通过加倍计算资源来减少。为响应“一带一路”倡议,助力多元化开放的全球化进程,国内海外应用语种翻译需求明确,需要系统本地化部署。部分语言方向如中日、中俄等翻译质量要求高。同时希望这些语言方向的翻译效果不断提高。基于此,HMSCore机器学习服务升级了文本翻译能力,新版本上线了中、日、德、法、俄四种语言的中文直译模型。与英文桥接翻译相比,中文直译模型可实现300字/秒并发,端到端翻译速度小于150ms,翻译延迟降低100%,翻译速度更快;中文特殊词和俚语的翻译结果更真实,翻译质量更好。升级后的文本翻译能力可以满足中国企业出海、外资企业进入中国等对翻译要求更高的场景需求。中文直译模型方案也参与了WMT2021国际机器翻译大赛的子任务(SharedTask:TriangularMT:UsingEnglishtoimproveRussian-to-Chinesemachinetranslation),并以显着优势。中文直译和桥接翻译效果对比方法翻译【原创】SmartLauncherestunlanceurpourd'applicationsAndroidquisubstitutel'interfaceclassiquedevotretéléphoneavecuneautrequiestunpeuplussimpleetquivouspermettrad'accéderà吹捧vos应用程序加上快速和舒适。【EnglishBridge】SmartLauncher是一款安卓应用程序启动器,可以用更简单的界面替代手机的经典界面,让您访问所有应用程序更快捷、更舒适。【直译】SmartLauncher是一款Android应用程序启动器,它用另一个更简单的界面取代了手机的经典界面,让您更快、更舒适地访问所有应用程序。InRussiantranslation[Original]да,даладно,когдактогрубитгрубиттебекоридорекоридорекоридоре,безсомнений,самойменьшейизтехпроблемпроблемпроблемпроблемпроблемпроблемтысталкиваешьсявстаршихстаршихстарших.毫无疑问,对你无礼是你高中问题中最不重要的。【ChineseLiteralTranslation】哦,拜托,当有人在走廊上对你无礼时,无疑是你在高中遇到的最小问题。德语翻译[原文]DieservonklassischenLaufschuheninspirierteHerren-SneakerzeichnetsichdurcheinenMaterialmixausWildlederundverschiedenenGewebeartenausundpr?sentiertsichinderCruise2020KollektionmiteinerneuenMid-Top-Silhout。EnglishBridge】这款男士运动鞋的灵感来自经典跑鞋,采用绒面革和不同面料的混合,并采用2020Cruise系列中延伸至脚踝的全新中帮剪裁。【ChineseLiteralTranslation】受经典跑鞋启发,这款男士运动鞋采用绒面革和不同面料的混合设计,为2020早春系列打造全新的中帮款式,鞋底完全延伸至脚踝。中文直译模型的技术优势中文直译模型借鉴了华为在机器翻译方面的最新研究成果,通过使用俄英和英汉语料库进行知识蒸馏,在少量或没有俄语的情况下-中文语料库,结合显式课程学习和训练策略可以获得质量较好的俄汉翻译模型,解决了英语桥接翻译系统资源低和冷启动的问题。中文直译系统技术要点一:Multi-lingualEncoderDecoderEnhancement(多语言编码器解码器增强)以俄汉翻译任务为例,通过多语言模型,引入英汉语料,结合知识蒸馏来加强翻译端解码层的解码能力;引入俄文和英文资料,加强原文端encoder层的编码能力。从而在很大程度上解决了冷启动问题。技术要点2:ExplicitCurriculumLearningforDenoising在训练过程中,结合显式课程学习技巧,根据噪声大小划分三阶段增量训练方案。第一阶段,使用全量噪声语料进行训练,使模型快速收敛;第二阶段,使用双语对齐工具去噪后进行增量训练;在第三阶段,使用增强降噪双语数据进行增量训练。完成模型最终收敛。技术要点3:基于组合解码策略的数据增强方案(FTSTForDataAugmentation)FTST的全称是ForwardTranslationandSamplingBackwardTranslation。该技术使用后向模型中的采样来增强数据;在ForwardModel中使用beamsearch执行数据均衡。在对比实验中,取得了最好的效果。除了现有的四种语言,机器学习服务文本翻译能力计划今年还将推出日语、法语、德语、俄语、韩语、葡萄牙语、西班牙语、土耳其语、泰语、阿拉伯语、马来语、意大利语、波兰语、荷兰语、越南语共有15个国家的中文直译模式,基本涵盖了中国、亚洲、非洲、拉丁美洲、欧洲、南美洲等世界主要国家和地区。更多详情>>访问华为开发者联盟官网获取开发指导文档华为移动服务开源仓库地址:GitHub、Gitee关注我们,第一时间了解HMSCore最新技术资讯~