文章|丽娜智东西讯 8月9日消息,昨日,搜狗推出实时语音转文字速记工具“搜狗听写”,利用搜狗智音引擎长期运行的语音转录技术,为文字工作者在会议、会议等场合提供速记需求,采访、写作和其他场景。
用户可以在App Store免费下载。
会后,搜狗语音交互技术中心总经理王艳峰与知动知等媒体就搜狗听写、搜狗AI技术、知音操作系统、搜狗智能硬件等进行了相关交流。
1、一款专注采访场景的笔记产品。
正如智西西在之前的报告中所写,市场上已经有类似的产品,比如科大讯飞录音等,那么搜狗听写和其他公司有什么区别呢?在回答智西西的这个问题时,王彦峰表示,搜狗听写与其他的区别在于两点:1、其他产品无法像搜狗听写一样支持长时间录音+免费转录支持; 2、搜狗听写更面向垂直场景。
在记者采访、作家写作等场景进行了功能优化(如添加远程蓝牙标签技术),为用户带来更好的产品体验。
在会后的采访中,王彦峰补充道,除了语音、文字转录之外,搜狗听写还具有分享、笔记、笔记管理等功能。
其实它更像是一个云笔记,专门为了解决文字工作者遇到的问题而设计的。
考虑到问题而构建的产品。
2.远场噪声环境下的识别和转录。
记者在发布会上体验了一下,发现“搜狗听写”在嘈杂、远距离环境下的语音识别效果其实并不是很理想。
事实上,市场上的许多语音转录都是这种情况。
产品常见的问题之一是在安静、近距离的环境下转录效果很好,但在处理远场、噪音,尤其是会议上经过麦克风、扬声器处理过的声音时效果较差。
为此,王彦峰提出了两种解决方案:一是继续数据积累和产品迭代,积累更多的数据用于噪声环境下的模型训练,从而提高准确率;第二,搜狗听写模式中有一个“转录”,系统可以离线录音,录音完成后立即获取文本结果。
此时,由于结果不需要实时转录,引擎速度不需要那么快,因此可以构建更深、更复杂的模型,从而有更好的识别效果。
但是,由于搜狗听写App使用手机麦克风,手机本身的无线电硬件也会存在差异。
导致识别结果存在差异。
目前搜狗听写不支持外部录音导入,只能依靠手机进行录音。
3、智能硬件是搜狗目前的战略重点之一。
一年前,搜狗主打“自然交互+知识计算”的技术战略。
王彦丰海表示,知音引擎指的是技术:语音识别、机器翻译、语音合成等技术的集合。
对于搜狗来说,它是语音AI的技术平台。
基于知音引擎,搜狗打造了“知音OS”语音交互平台,这是针对手机、电视、可穿戴设备、车载设备等智能设备的语音交互平台。
目前,知音OS已在小米、魅族、创维、海尔等产品上落地。
王彦丰海表示,智能硬件现在是搜狗的战略重点之一。
随着移动互联网时代逐步迈入IOT时代,智能硬件成为抢占用户入口的最重要渠道。
明年,搜狗还将在可穿戴、车载、客厅等场景自主研发更多搭载智音OS的智能硬件,并进一步推动智音OS平台与其他厂商的合作。
“搜狗正在做能做智能硬件的品类的智能硬件,在电视、手机等场景(搜狗不适合的),说服好的合作伙伴合作,形成用户入口。