【.com原稿】1930年代初,法国科学家G.B.Arjuni提出了使用机器进行翻译的想法。今天,许多里程碑式的事件已经证实了机器翻译的可行性和实用性,毫无疑问,它的前景一片光明。为了更好地利用机器翻译解决跨语言交流的问题,谷歌、百度等国内外巨头纷纷成立了相关团队。当然,小而美的初创企业也深耕细分行业,专注于某个场景,比如音塔。近日,音塔CTO张明接受了专访。1999年在新加坡InnovationTechnology工作时开始接触机器翻译,因此在这方面有很多深入而独到的见解。张明·音塔CTO机器翻译三个阶段:规则、统计算法(SMT)、深度学习(NMT)张明表示,机器翻译也和很多技术发展路线类似。它分为三个阶段:规则、统计算法和深度学习:规则的第一阶段是基于规则的方法。这些规则是由语言学家利用他们对知识和语言的理解定制的,然后由计算机领域的专家实施。这种方式的缺点很明显,主要是规则不能穷尽,所以没办法保证用户输入的所有内容都被覆盖。当用户输入的内容符合规则时,翻译效果会很好,反之亦然。SMT的第二阶段基于统计算法。随着翻译领域数据的增长,统计方法被用于对大量语料库进行建模,逐渐摆脱了对语言规则的依赖。基于统计算法的方法其实是有语言学原理在里面的。整个翻译过程是如何实现的,是可以通过人的认知来理解和解释的。NMT第三阶段基于深度学习。目前,深度学习是一种黑盒应用。虽然根据不同的模型进行翻译,但最终的翻译效果会得到很大的提升。至于具体的实施过程,目前还无法以目前人们的认知来解读。用AI细分技术,站在用户的角度迭代产品当被问及为什么选择在2016年设立分流塔时,张明表示,随着数据和NMT模型的发展,2015年左右,NMT超越SMT,整体翻译效果提升很大。2016年编程NMT基本一统天下,SMT被淘汰,谷歌神经机器翻译(GNMT)也在这个时期问世。机器翻译的整体效果可以满足用户在某个场景下的基本预期,相关产品可能会落地。用AI技术解决跨语言交流问题上面提到的机器翻译是纯翻译设置,文本到文本,中文到日文,中文到英文。但分音器要做的是利用AI技术解决跨语言交流问题,而翻译只是交流过程的一部分。张鸣介绍,初代准耳翻译机的落地场景是将某人的声音翻译成对话者能听懂的声音。在这个看似简单的逻辑背后,涉及到语音识别、机器翻译、语音合成等AI细分技术。每项技术都需要不同部门的具体技术点来处理。当被问及目前这些AI细分技术中哪些处于劣势时,张明表示,无论从技术角度还是用户的市场需求,都永远不够。迄今为止,还没有一个可以覆盖所有领域的通用平台,这也是音塔只选择深耕旅游行业的原因。只有将这些AI细分技术应用到旅游行业的具体场景中进行优化,尽量解决流畅的语音识别和吞咽等问题,避免翻译错误被逐级放大或因识别错误导致信息丢失等问题,提高翻译。机器的整体理解率。在从用户角度进行的迭代产品访谈过程中,张明强调,分音器不是一家纯技术公司,而是一家产品和服务公司。如何为用户提供更好的服务和更好的体验?是公司的核心。准儿翻译机最初并没有设计屏幕,目的是为了小巧便携。后来为了应对沟通不畅的问题,加入了屏幕设计,但显示效果略有不足。目前我们使用的一代是触摸式LED液晶屏,在交流过程中起到了很好的辅助作用。这几次产品迭代都是基于用户的真实反馈。紧接着,分音器会在线下方面做更多的研究,因为在旅游场景中,很多地方是WIFI覆盖不到的,甚至是未来的5G。根据实际需求调整优化后台服务器当被问及在服务用户的过程中是否调整架构时,张明坦言,前期没有考虑后台服务器的部署。在旅游行业,用户在使用翻译器时一般不会涉及高并发问题,因为所有出售的翻译器不能同时使用。所以在设计后端服务器的时候,并没有想太多,只是满足当时正常的功能需求。但在实际过程中,虽然不会出现高并发的问题,但由于使用翻译器的用户会分布在不同的国家和地区,传统宽带的表现有些吃力。我们只能寻找合适的节点进行部署,尽量保证不影响不同国家用户的访问速度。这里值得注意的是,在实际部署过程中,需要结合重点客户分布、用户分布,以及华人出现最多的国家,如日本、泰国、东南亚等。采访最后,张鸣表示,音塔未来仍将深耕旅游行业,核心仍将围绕吃、住、行、游、娱、购六个方面展开。SoundTower是一家初创公司。它可能没有大公司丰富的资源和品牌影响力,但有些更专注。所有团队都集中在旅游领域。从用户需求和市场需求出发,我们致力于为他们提供更好的产品和服务。【原创稿件,合作网站转载请注明原作者和出处为.com】
