“语音转文本后还能做什么?”这是科大讯飞“百机大战”努力的方向。
过去,“语音转文字”的需求让科大讯飞拥有了广泛的受众;如今,凭借Spark认知模型,科大讯飞打通了从“语音转文本”到“文本生成内容”的服务。
成为市场上第一个提供端到端服务的大模型产品。
有了科大讯飞听写,“一次录音”就可以“一键完成”。
秉承快速落地的理念,科大讯飞于6月9日如期召开了Spark认知模型升级发布会。
时隔一个月,Spark模型不仅能力不断提升,在落地场景上也有了更多尝试。
随身助手——星火APP同步发布;同时,在教育、医疗、工业、办公等领域,星火认知大模型的能力已进入星火语音伴侣APP、医疗诊断后康复管理平台、羚羊工业互联网平台、科大讯飞讯在智慧屏等产品中,已开放科大讯飞Spark开发接口,与开发者共同构建“Spark”生态。
不难看出科大讯飞Spark认知大模型的升级计划。
科大讯飞大模型路线旨在快速落地。
对此,科大讯飞副总裁和听觉科技总经理王玮曾向极客公园解释:20多年来,科大讯飞一直在模式识别、语音、合成、评估、机器翻译、认知等人工智能道路上前进。
不断探索,获得更深层次的积累和理解。
在进入大规模模型之初,团队就决定以“面向垂直行业、有实际应用”为基调打造大规模模型。
年底,科大讯飞正式启动“1+N”大规模认知模型研究项目。
这里的“1”指的是通用认知智能大模型,“N”指的是大模型在教育、办公、汽车、人机交互等各个领域的落地。
针对“1”——通用大模型,科大讯飞持续发力、迭代。
至于“N”,如何在各个领域精耕细作,将大模型落地到具体的垂直场景中,科大讯飞选择开放生态,发挥各自优势,与生态伙伴共建行业应用。
在近日举办的第三届BEYOND国际科技创新博览会上,科大讯飞还展示了部分商用产品,其中包括大模型产品。
在BEYOND活动中,科大讯飞不仅为会议提供了全程多语种同声传译服务,还展示了翻译机、录音机、麦克风等旗舰智能硬件。
同时,大型样板应用产品也亮相,包括:讯飞AI学习机、软件产品“讯飞听写”、与“写”相关的讯飞智能麦克风M2。
此外,科大讯飞智慧屏(畅享版)也在澳门BEYOND科技博览会上正式发布。
作为一块“会记录的智慧屏”,讯飞智慧屏将搭载讯飞Spark认知模型的“书写”功能,细化会议纪要,成为提升智慧办公效率的智能终端。
目前,该产品有65和86尺寸可供选择。
值得注意的是,科大讯飞APP作为科大讯飞语音转录翻译的标杆应用,目前覆盖1万用户,支持粤语等十余种语言的转录翻译服务。
2017年全国两会期间,香港媒体使用科大讯飞APP高效记录两会重点内容,写文章更快!同时,讯飞字幕还可以为粤语视频添加AI字幕,无需手动输入字幕和时间戳,让新闻传递更加高效。
科大讯飞同声传译是顶级峰会必备的屏幕翻译服务。
目前同声传译客户端为用户提供9种语言的同声传译服务,并支持兼容各种远程视频会议软件、双语字幕翻译进行实时会议沟通,让线下会议和远程会议实现无障碍的跨语言沟通。
科大讯飞此前曾为澳门理工大学、澳门扶康会、香港理工大学、香港科技园集团等提供同声传译服务。
此外,王玮表示,随着企业出海,国际化也是主攻方向科大讯飞的努力。
目前,科大讯飞的国际业务正在快速发展。
除了BEYOND这样的大型科技赛事,科大讯飞还成为北京冬奥会、成都国际世界杯等国际赛事的标准语音转录和翻译供应商。
乒乓球锦标赛,以及即将于7月举行的成都国际大学生运动会等,让无障碍沟通、赛事沟通、办公效率提升成为中国人工智能企业的名片。
在C端市场布局方面,早在2018年,科大讯飞APP“Voiter Notes”日文版就已在日本应用市场上线,支持日文、英文音译服务,开创了中国AI企业出海的先例。
海外。