文章 |丽娜智东讯 8月8日消息,今日,搜狗推出实时语音转文字速记工具“搜狗听写”,利用搜狗智音引擎的长时语音转录技术,为文字工作者在会议、采访、写作和其他场景。
用户可以在App store免费下载。
据搜狗听写产品经理牛路云介绍,搜狗听写包括“听写”和“转录”两种模式:“听写”模式可以在录音的同时提供实时识别结果;“听写”模式可以在录音时提供实时识别结果;“听写”模式可以在录音的同时提供实时识别结果。
“转录”模式可以离线录制,录制完成后立即得到文本结果。
(搜狗听写产品经理牛路云)此外,搜狗听写还提供边听边修改的能力(保存录音后,可以边听录音边修改文字),根据语义自动添加标点符号,支持文本/语音突出显示、多客户端同步、信息共享等功能,并且在说话音量低至30分贝时仍能识别人。
同时,搜狗听写还将推出Windows版本,主打会议场景实时速记;而根据记者、作家、自媒体的需求,搜狗听写接下来将连接搜狗输入法的个人词汇库,引入“蜜还是毒”、“赚大钱”等个性化词汇。
(搜狗语音交互技术中心技术总监陈伟)据搜狗语音交互技术中心技术总监陈伟介绍,搜狗听写采用的是搜狗知音引擎的长时语音转录技术。
从项目立项到现在,错误率下降了30%。
。
声学模型方面,采用端到端深度神经网络技术Deep LC-CLDNN+CTC技术。
转录模式采用Deep CNN+CTC方法。
基于T级海量输入法文本数据,利用神经网络构建语言模型。
模具。
(搜狗语音交互技术中心总经理王彦峰)搜狗语音交互技术中心总经理王彦峰表示,搜狗知音是搜狗一年前发布的语音交互引擎,主打“自然交互”的技术战略+知识计算”。
经过一年的发展,引擎架构已经完善:基于搜狗输入法和搜索引擎两个入口,基于大数据+深度学习,上层构建语言AI+语音AI+图像AI,进而延伸到对话、翻译、TTS、OCR、图像识别等。
搜狗语音识别技术服务的日访问量也从2018年的每天5500万次增长到2018年的每天2.6亿次。
王彦峰表示,明年,搜狗AI将在更多产品中落地: 1、自主研发更多可穿戴、车载、客厅等场景的硬件; 2、进一步推广AI云平台; 3、与更多用户一起使用 在垂直场景推出更多用户产品。
其实市面上已经有类似的产品,比如科大讯飞录音笔等,那么搜狗听写和其他公司有什么区别呢?在回答智西西的这个问题时,王彦峰表示,搜狗听写与其他的区别在于两点:1、其他产品无法像搜狗听写一样支持长时间录音+免费转录支持; 2、搜狗听写更面向垂直场景。
在记者采访、作家写作等场景进行了功能优化(如添加远程蓝牙标签技术),为用户带来更好的产品体验。