当前位置: 首页 > 科技赋能

对话科大讯飞胡宇!今年开放了200个能力,新增了100多个AI能力,

时间:2024-05-22 19:29:54 科技赋能

Zhidxcom (公众号:zhidxcom) 文本 |渔阳智迪讯5月17日消息,今日,科大讯飞在深圳发布4款新品:AIUI语音交互平台3.0、摩飞麦克风2.0、AIoT物联网平台、iFLY OS物联网操作系统。

此次AIUI语音开放平台3.0升级,新增了文字识别、医疗听写等能力。

到今年年底,它将提供不止一种能力,并添加不止一种人工智能能力。

摩飞麦克风新增分布式、能量跟随、声纹唤醒功能。

AIoT和iFLY OS是科大讯飞针对物联网领域发布的首批新品。

科大讯飞还展示了一份新的成绩单。

开放平台开发者数量已达80万,移动终端日均语音使用次数已达45亿次,电视日均语音交互次数已突破1万次,智能音箱日均交互次数已达1万次,此外,科大讯飞还集成了语音识别、语音唤醒、语义理解、语音合成等技术,免费提供系统级解决方案。

(左为科大讯飞执行总裁兼消费者BG总裁胡宇,右为消费者BG执行总裁于继东)会后,科大讯飞执行总裁兼消费者BG总裁胡宇与于继东合影留念。

消费BG董继东执行总裁接受智东西等媒体采访。

他们告诉智洞智,通过摩飞麦克风开发者可以在几个小时内实现过去六个月的开发,并且通过AIoT和iFLY OS操作系统,可以帮助开发者打通产品开发的各个环节。

关联。

1、四款新品发布 在新品发布之前,科大讯飞简单地秀了一下实力,展示了近期的一些成果。

消费者BG CEO于继东分享,2018年科大讯飞开放平台开发者数量达到51.2万人,目前已达到80万人。

其中,开发者主要集中在教育、通信、机器人和智能硬件领域,其中教育类开发者占比20%。

这里再罗列一下科大讯飞语音交互在不同设备上的日活跃成绩单:移动设备上科大讯飞语音日使用次数达45亿次,电视语音交互日使用次数超过1万次,智能音箱日语音交互使用次数超过1万次,汽车上每天使用 10,000 个。

交互次数达到10000次,商用机器人每天交互次数超过10000次。

与去年相比,科大讯飞在学习、社交、智能硬件、商务办公、生活服务等领域实现了超过%的增长。

发力后,科大讯飞发布了四款产品:AIUI语音交互平台3.0、摩飞麦克风2.0、AIoT物联网平台、iFLY OS物联网操作系统。

1、AIUI语音交互平台3.0 其中,AIUI语音交互平台升级至3.0,新增文字识别、医疗听写功能。

在文字识别方面,科大讯飞的手写识别准确率达到97%,印刷文字识别准确率达到97%,数学公式识别达到93%。

胡宇随后补充道,AIUI平台将在今年年底提供超级能力,并添加新的AI能力。

为了让开发者更好地使用AI能力,科大讯飞还与商汤科技、码隆科技、小牛翻译等AI科技公司合作,进行技术组合和封装。

2、摩飞麦克风2.0 去年,科大讯飞发布了摩飞麦克风。

开发者可以基于它进行开发,也可以将其与家电连接起来,实现智能化。

如今,摩飞麦克风已升级至2.0,对回声消除、功耗等进行了优化,同时还增加了分布式、能量跟随、声纹唤醒等新功能。

所谓分布式功能,就是将多个摩飞麦克风放置在一个局域网中。

在与用户交互过程中,距离用户最近的墨飞麦克风将会被唤醒。

雷军在小米迷你音箱上也介绍了这一点。

能量跟随与波束形成技术有关。

当您唤醒智能音箱时,麦克风阵列会向一个方向形成波束,以更好地获取某一方向的声音。

摩飞麦克风升级后,这种波束成形可以动态调整,跟随用户声音的位置,就像能量跟随一样。

声纹唤醒也是墨飞麦克风此次新增的一项新功能,可以让设备听到声音并识别人。

科大讯飞还将向开发者开放相关接口。

3、AIoT物联网平台,iFLY OS物联网操作系统余继东表示,过去18个月使用科大讯飞AI能力的终端数量已接近20亿。

值得注意的是,近两年来,非手机智能终端的占比从1%提升到了7.6%,这是一个非常可观的数量。

以智能家居、智能穿戴设备、机器人、安防监控等为代表的物联网设备近期呈现激增态势。

科大讯飞也开始关注IoT领域,推出了AIoT物联网平台。

AIoT分为两部分。

其中一部分是云。

科大讯飞提供开放的语音交互平台、聚合内容、广告生态、AI能力;至于iFLY OS物联网操作系统将如何布局,智东西会后也向胡宇询问了这个问题。

他解释说,这是为了更好地克服开发者在产品开发过程中各方面面临的障碍。

通过OS IoT系统,深入了解设备所需的各种底层系统,让开发者更加自由地进行开发。

他还表示,这是第一次发布OS系统,更多细节将在稍后公布。

2、摩飞2.0、AIUI3.0、AIoT实现语音交互场景 为了更好地理解摩飞2.0、AIUI3.0、AIoT之间的关系,科大讯飞的产品经理还利用张少科技利用AIUI3.0和魔柜推出了以AIoT为例。

魔法柜看起来就像厨房里的一块平板电脑。

将摩飞麦克风与平板结合,连接科大讯飞AIoT,魔柜具备远场语音交互能力。

可以连接和调用不同的设备。

此外,魔柜还增加了手势识别和人脸交互,满足厨房场景下的交互。

余继东还提到,科大讯飞已经将WiFi协议与语音连接起来。

通过麦克风模块,可以改造现有WiFi设备实现语音交互,让所有WiFi设备都可以使用AIUI平台。

另外,今天AIUI的一个重要更新就是提高开发者的开发速度。

余继东告诉志东,以前开发者需要花半年时间集成科大讯飞的能力,但现在可以基于摩飞麦克风进行开发。

墨飞相当于一个开源硬件,开发组件的一部分。

有了摩飞麦克风就相当于把硬件开发变成了软件开发,让开发者在几个小时内真正做出一个演示应用程序。

3、基于视觉的语音交互是未来的发展方向。

新品发布后,胡宇主要从三个方面谈了未来的发展趋势:一是回应了外界对科大讯飞盈利能力不佳的质疑。

他表示,科大讯飞需要数亿资源投入开发者平台,赤字来自于开放平台。

其次,他认为基于视觉呈现的语音交互是未来的发展方向。

人类信息获取80%依赖于眼睛,但人类信息输出90%依赖语言,移动场景、车载场景、家庭场景都依赖自然语言交互。

重要场景??。

日前的Google I/O大会上,谷歌发布了AI助手打电话的能力。

他表示,科大讯飞几年前就已经实施了,并正在各大运营商的客户服务中使用。

三是制度创新+产品创新。

胡宇宣布,每年技术投入增长超61%,技术研发团队增长56%。

科大讯飞擅长源头核心技术的创新,不断拓展平台能力,降低创新门槛,让开发者做产品创新和应用创新。

结论:重点是加快行业落地。

通过今天科大讯飞AIUI的3.0升级,我们可以看到,一方面,在百度等语音技术公司的竞争下,科大讯飞也在加速技术融合和开放。

今年的开放将达到项目。

另一方面,科大讯飞更加关注物联网终端,通过整合AIUI、摩飞麦克风、AIoT、科大讯飞OS系统,通过关键技术和系统的整合,降低开发者门槛,加速行业??落地。