Zhidixcom (公众号:zhidxcom) 文本 |渔阳 昨天,科大讯飞在北京发布讯飞翻译机2.0产品。
与第一代翻译机相比,它可以翻译的语言数量增加到33种。
除了语音翻译和离线翻译之外,它还支持照片翻译功能。
值得一提的是,讯飞翻译机2.0还针对国内用户的口语、方言问题进行了优化。
目前支持东北话、四川话、河南话、粤语四种方言的翻译。
其官方售价为万元,与第一代产品价格相同。
刚刚过去的博鳌亚洲论坛上,科大讯飞的翻译人员也在场。
科大讯飞翻译机成为博鳌论坛官方指定产品,在会议期间受到国际政要和企业高管的一致好评。
事实上,科大讯飞早在2016年就实现了机器翻译技术,推出了小译翻译机,引领了国内智能翻译机市场的发展。
过去一年,讯飞翻译机销量达20万台,覆盖1万个国家,服务数万条,用户好评率高达98%。
科大讯飞首席执行官兼消费者BG总裁胡宇高兴地说:“我们探索了一个新的品类,并证明机器翻译可以做成一个硬件,取得了很好的效果,引领了这个行业的发展。
”过去两年确实是机器翻译快速落地的一年。
继科大讯飞之后,搜狗、百度、网易等都推出了翻译机产品。
(科大讯飞执行总裁、消费者BG总裁胡宇)会后,智东西与胡宇就科大讯飞翻译机产品思路、定价策略、翻译机市场状况、机器翻译行业现状等进行了深入交流等,并展示了他们在打磨翻译机的过程中,我们要平衡手机和翻译机、机器翻译技术和实用产品之间的利弊。
1、方言翻译成亮点,科大讯飞定义旗舰翻译四大标准 科大讯飞翻译机2.0诞生于“酷刑”。
科大讯飞在2018年推出了第一代翻译机,超过20万台的销量也吸引了大量用户。
大量的用户反馈和市场调研不断迫使科大讯飞团队思考,翻译多少种语言才足够?如果我不会说普通话该怎么办?在嘈杂的环境下你能顺利工作吗?在国外遇到短信怎么办?译者达到什么水平才算够实用?据科大讯飞翻译机产品经理翟继波介绍,该翻译机的用户中有86%用于出境游,这给他们指明了方向,聚焦用户需求的原点,聚焦产品翻译语种的数量。
、多样化的口音翻译、真实的使用环境、口语以外的其他翻译,以及翻译的准确性都受到了严格的拷问。
科大讯飞翻译机2.0昨天正式发布,对上述问题一一给出了答案。
基于国内出境游用户经常访问的国家,讯飞翻译机还支持6种语言,从第一代翻译机到第二代翻译机,支持全球33种语言与中文之间的互译,满足出境游用户的需求。
大部分中国用户的出行需求。
针对国内30%的用户不会说普通话、63%的普通话有口音的现象,科大讯飞依靠科大讯飞输入法长期积累的方言数据和能力,实现了带方言口音的普通话的整体识别率95%,支持四种方言翻译:粤语、四川话、东北话、河南话。
翟继波介绍,科大讯飞第一代翻译机已上线,可实现中英文离线翻译。
下一步,科大讯飞将拓展中、日、中、俄、中、韩语之间的离线翻译。
讯飞翻译机2.0的另一大亮点——照片翻译。
毕竟出境游客不仅需要语言交流,还需要听懂外文。
例如,如果你在国外餐厅吃饭但看不懂菜单怎么办?这时,拍照和翻译就显得尤为重要。
科大讯飞翻译机2.0正面有屏幕,背面有摄像头。
相机将你需要了解的信息拍下来,然后利用图像识别技术将图片中的外文文字转换成中文。
目前,讯飞翻译机2.0支持英语、日语、韩语等11种语言的照片识别。
此外,在国外旅行时,您很可能会面临嘈杂的通讯环境。
如何保证翻译器能够在这种环境下可靠地工作?在语音识别的高精度下,噪声环境下最大的问题是如何有效获取用户清晰的语音。
科大讯飞翻译机2.0配备了四麦麦克风阵列来解决这个问题。
通过对iPhone视频的对比,我们可以感受到,在相同音量下,讯飞翻译机获得的声音更加清晰,噪音也更少。
通过上述“提问、拆解、解答”的呈现,科大讯飞提出了人工智能四大标准。
主打翻译:听清、理解、翻译准确、发音优美。
我们明显感觉到科大讯飞做翻译机不仅仅是为了实现技术,而是围绕核心用户的使用场景和痛点打磨产品。
可见,科大讯飞作为先行者,在翻译领域又向前迈进了一步。
2. 如果你有手机,为什么还需要翻译?有人可能会说,手机装个翻译软件就够了,为什么还要建翻译器呢?科大讯飞执行总裁、消费者BG总裁胡宇意味深长地说:“打造翻译机是科大讯飞深思熟虑的结果。
”这体现了科大讯飞对技术落地、产品思维的探索以及对翻译的战略重视。
科大讯飞是一家拥有19年历史的本土语音科技公司。
其技术布局涵盖语音识别、语义理解、语音合成、机器翻译等各个语音领域。
机器翻译是科大讯飞的一项重要技术。
早在2008年,科大讯飞就在国内率先将神经网络技术应用于机器翻译。
在国际上,它与谷歌同时进入这一领域。
基于神经网络技术,科大讯飞分别于2015年和2020年推出了新一代语音识别、语音合成和机器翻译语言模型。
依托这些技术,科大讯飞在一系列国际演讲比赛中屡获殊荣。
例如,科大讯飞在2018年IWSLT国际口语机器翻译大赛中获得冠军。
科大讯飞连续12年获得著名的暴雪挑战语音合成大赛冠军。
语音技术的优势为科大讯飞开展产业和应用奠定了良好的基础。
例如,科大讯飞翻译机所采用的机器翻译技术涉及语音识别、翻译、语音合成等过程。
以科大讯飞翻译机为例,首先基于科大讯飞的四麦克风麦克风阵列和前端信号处理算法,可以在更自然的距离清晰地获取用户的语音,然后通过语音识别将用户的语音转换为中文文本技术。
然后用翻译机翻译中文和外文,然后通过语音合成将外文以语音的形式呈现给对方。
涉及到的每一个环节都需要相关技术的支持。
没有良好的技术支持,就无法保证良好的用户体验。
近年来,科大讯飞不断探索语音技术,提出了语音转语音机器翻译、全双工语音翻译等。
在产品层面,胡宇回答了为什么我们还需要打造翻译机的问题。
拥有手机从三个角度。
首先,手机的主要使用场景是近距离使用,没有考虑到翻译过程中可能距离较远、环境噪音较大等问题;其次,他认为智能硬件的本质在于易用、方便、快捷,能够打开即用,一步就能有更好的体验。
但手机APP使用流程繁琐,操作不方便;第三,翻译场景交互要更加自然、友好。
把手机直接放到别人嘴边是不合适的。
我们的社交礼仪。
在战略层面,翻译已经深入科大讯飞。
作为语音技术的重要实现方向,翻译是科大讯飞的重点业务。
科大讯飞从2001年开始也涉足小语种翻译工作。
正如胡宇所说:“翻译对科大讯飞来说不仅仅是一项技术或产品,而是一份事业。
”作为人类之间最便捷的交流方式,语言之间的方式和转换将直接影响我们未来人类的整个交流,甚至影响我们人类未来的命运。
今年,科大讯飞董事长刘庆峰在今年的两会上提出了人类语言通用互操作的计划。
科大讯飞还与国际电信联盟、上海外国语大学、中国外文出版发行局、东北大学等合作,共同推动翻译事业的发展。
胡宇还提出,未来的翻译行业将是人与机器的结合和互动。
机器翻译不会取代人类,但它可以取代技能较低的部分,让人们从事更具创造性的工作。
3、人民币定价有哪些考虑因素?近两年,市场上翻译机不断涌现。
科大讯飞、百度、搜狗、网易等都推出了翻译机产品。
看来翻译界迎来了春天。
尽管科大讯飞是翻译机市场的领导者,但目前面临着两类玩家的竞争。
一是搜狗、网易等也推出翻译机产品,二是微软、百度、腾讯等推出的翻译App。
面对搜狗翻译机等千元以内的翻译产品价格,科大讯飞为何价格继续定在人民币吗?胡宇解释说,翻译机产品本身还没有达到成熟的阶段。
作为一个新的垂直品类,最重要的是产品的用户体验和功能。
一味的低价竞争是没有意义的。
言外之意是,讯飞翻译机这款新旗舰产品将更加注重产品打磨和用户体验,从而赢得用户的青睐。
在谈到谷歌、微软、百度、腾讯、网易等手机翻译应用时,胡宇以微软翻译为例,分析了它们与科大讯飞的差异。
微软虽然也做翻译,但它不做硬件。
没有从应用场景来分析。
科大讯飞更专注,聚焦中国用户的需求,对出境游的场景化需求进行深入研究,并进行深入的中文与其他语言之间的翻译。
胡宇还谈到了科大讯飞翻译机和Google Pixel相机图像翻译的区别。
谷歌手机无需拍照即可识别图像信息。
这里应用的技术是AR(增强现实),但谷歌使用了更多考虑技术的实现,这需要更强的处理器支持,同时也会增加手机的功耗。
科大讯飞的翻译机更多是从产品层面考虑。
它采用先拍照后识别的技术。
拍照已经可以满足用户的需求,减轻CPU和内存的负担,增强翻译机的电池寿命。
他进一步表示,机器翻译技术已经到了可以用的时候,而在这个过程中,科大讯飞率先推出产品,向市场证明了翻译机可以销量,这无疑会对行业起到引导作用。
。
如果说技术的可用性是先决条件,那么对未来智能硬件市场的认知则是另一个关键因素。
他认为,手机更像是一个通用模拟器,其主导地位短期内不会改变。
不过,未来智能硬件将会多元化。
在某些场景下,智能硬件能够与场景、用户体验深度融合,也会有强烈的需求。
当被问及对翻译机市场空间的看法时,胡宇表示还需要进一步观察。
他举了个例子,2018年他们刚开始做翻译机的时候,没想到会有这么大的需求,但现在感觉不一样了。
这是一个不断探索发现的过程。
他笑着说,预测未来的最好方法就是去实现它。
不然大家都想出来了,都在做的时候,就没有机会了。
未来译者采取什么形式并不重要,因为翻译的需要没有改变,沟通的需要也没有改变。
可以预见的是,科大讯飞将继续围绕翻译进行深入布局。
翻译器只是消费产品中实现机器翻译的一个点。
机器同声传译、会议系统等都是机器翻译应用的表现形式。
例如,在今年的博鳌亚洲论坛上,腾讯的机器同声传译表现不佳,出现不少错误。
机器翻译行业也存在一些常见的问题,比如机器翻译缺乏语境理解、口音问题、专业性问题等,机器翻译行业仍然面临很多挑战。
不过,胡宇并没有过多强调机器翻译行业的技术短板。
相反,他认为行业的问题和挑战更多在于执行的有效性。
一般来说,机器翻译可以解决90%到95%的问题,但剩下5%的问题可能是非常致命的。
克服这5%的问题的成本往往比克服95%的问题要大得多。
。
“但我们要考虑的是,什么样的情况才能满足用户的需求。
并不是解决所有的问题才可以被用户使用,而是在现有的技术效果下,如何通过产品设计来避免目前的技术缺陷。
胡宇还表达了他对技术与产品之间权衡的思考。
结论:让应用反哺技术。
正如胡宇所说:“语音行业将成为落地的重要入口如何发挥应用创新优势,实现产业升级和品牌突破,是国内人工智能企业当前面临的重要课题。
围绕机器翻译技术和消费者使用场景进一步探索技术落地到翻译机中,进而让大量用户“体验”到了翻译机的使用“新鲜”数据,以及各种口音和方言数据,是机器翻译技术不断迭代的动力源泉,最终将机器翻译技术推向更高的维度。