当前位置: 首页 > 科技赋能

对话斯皮奇副总裁雷雄国!背靠阿里巴巴从“软”到“硬”

时间:2024-05-22 10:17:53 科技赋能

Zhidixcom(公众号:zhidxcom)|宇阳智能音箱的普及,已经成熟了语音技术提供商和解决方案提供商。

在智能音箱产业链中,语音语义是核心一块,也成为语音技术企业必争之地。

Spichi是B端市场的语音技术提供商,阿里巴巴是其最大的投资者。

它在巨头的支持下正在快速发展。

志东西近日与斯皮奇副总裁雷雄国进行了对话。

作为语音技术提供商,Spichi专注于哪些细分场景,Spichi在智能音箱行业扮演什么角色,为何推出DUI语音开放平台? 1、团队:三大场景、四个城市,研发超过70%。

目前,思必锐在苏州、深圳、北京、上海拥有四个团队,员工人数超过100人,其中研发人员占比超过70%。

具体来说,Spichi总部位于苏州,负责核心底层技术和语音识别算法的研发。

DUI开放平台的研发也在苏州;深圳主要负责基于语音交互的智能硬件产品化,集成Spichi。

技术SDK及DUI平台输出,提供行业语音解决方案,主要包括车载、家居、机器人业务;上海团队是公司的瞭望塔,斯皮里特与上海交通大学建立联合实验室,布局前沿技术的研发;在北京,他们是营销团队和业务开发团队。

雷雄国是SPEED深圳团队的负责人,该团队下设车联网和IoT(物联网)两个业务部门。

团队规模约1000人。

其中,车联网事业部整合语音识别、内容和交互产品,为车机制造商提供语音交互整体解决方案。

IoT事业部主要为智能音箱、电视盒子、机器人等提供技术和完整解决方案,其中阿里巴巴、小米、联想等龙头企业都是Spichi的客户。

(Spichi主要关注领域)雷雄国表示,目前Spichi的“主战场”没有改变,同样聚焦于车载、家庭、机器人三个具体场景,提供语音技术和解决方案。

此外,Spirit也在不断突破,比如推出DUI开放平台,为开发者提供定制化的语音和语义技能;并为医疗、政府、客服等企业,通过资本孵化团队提供解决方案。

其中,Spirit长期深耕汽车市场,拥有众多客户。

目前在汽车市场占有率第一,是其核心利润来源之一。

雷雄国表示,在后市场整车市场,思锐在车机语音交互方面拥有60%~70%的市场份额。

在目前由科大讯飞主导的前装市场,Spichi近期也一直在发力。

2、深入挖掘垂直场景,凸显技术优势。

SPIX提供的核心技术主要集中在前端信号处理和语音语义方面。

其中,前端信号处理包括麦克风阵列技术、声源定位、回声消除等; Spichi成立以来,在语音语义技术方面有着深厚的积累,目前专注于语音识别、语义理解、语音唤醒、语音合成、声纹识别、人机对话等。

(Spichi的语音AIOS对话操作系统)目前平台市场蓬勃发展,从巨头到初创公司纷纷涌入,与其他公司相比,Spichi有哪些优势?雷雄国认为,核心优势需要聚焦在产品上,其中声环境优化和不同场景下的内容语义理解是两个核心优势。

他表示,语音交互与场景密切相关。

Siri在手机中可以很好地识别,但在汽车中识别率会明显下降,而且在家里的远场场景下就不行了。

在各种车内环境下,例如高速公路、喧闹的市区、车窗是否打开、副驾驶是否有人说话等,Spirit针对声学环境做了一系列优化,大大提升了辨识度车内环境中的速率。

此外,用户发出的指令在不同场景下可能有不同的语义,Spirit针对不同场景提供深度定制的语言模型。

在汽车环境和家庭环境中,汽车主要是导航场景,互联网电视主要是搜索场景。

Spirit针对不同的场景提供了不同的语料库模型。

他解释说,在车里“我饿了”可能意味着去餐厅,而在家里“我饿了”可能意味着点外卖,这需要基于语音识别的语言模型进行深度定制。

3、看好智能音箱市场。

早期进入。

目前,阿里巴巴、小米、联想等公司的智能音箱均采用了Spichi的语音技术或解决方案,可见市场对Spichi的认可。

雷雄国表示,Spichi非常看好智能音箱市场,2018年就开始涉足这个市场。

纵观整个产业链,Spichi在各个环节都与厂商有着非常好的合作关系,包括底层芯片厂商、大量深圳的音箱ODM厂商、内容提供商、做智能音箱的传统客户、互联网客户等。

在与大品牌合作的过程中,我们发现智能音箱的门槛还是比较高的。

Spirit还推出了软硬件一体化解决方案,降低智能音箱玩家的语音交互门槛。

(图为天猫精灵X1采用的Spichi六麦环形阵列)Spichi对于智能音箱相关技术的研发投入较早布局。

他介绍,除了早期布局语音识别和语义理解之外,Spichi从2008年开始研究麦克风阵列技术,这项技术是与联想作为内部项目推出的。

年复一年,Spichi 不断积累这项技术。

仅仅为了麦克风阵列技术,Spichi也投入了大量资金,包括人力投入、数据采集投入、硬件生产等。

具体来说,Spichi内部有一个十几人的团队,专门从事麦克风阵列的前端信号处理,并结合Spichi的语音引擎进行优化。

除了专门的研究团队外,Spirit还配备了相关的合作团队,比如数据资源采集团队,从2017年开始采集噪声环境下的数据资源;提供产品化资源,配备软件人员、IP开发人员、阵列硬件开发人员;此外,在产品化过程中,针对麦克风阵列核心技术出现的问题,产品研发团队中也有人员负责阵列的评估和优化。

在麦克风阵列方面,Spichi目前提供单麦克风、双麦克风、四麦克风和六麦克风解决方案。

其中单麦克风和双麦克风主要应用于汽车后视镜和电视盒子。

雷雄国表示,经过几年的技术积累,Spichnian仍然擅长单麦克风的远场交互效果。

六麦克风阵列是目前Spichi提供的性能最好、技术最全面的麦克风阵列。

它是在之前的6麦克风早期方案的升级基础上产生的。

通过算法优化,6麦可以达到甚至超过6麦,从而降低麦克风阵列的成本,让产品设计更加便捷。

阿里巴巴推出的智能音箱天猫精灵X1采用了Spichi的六麦环形阵列。

此外,雷雄国透露,他还在与百度、腾讯等一些重量级客户在麦克风阵列方面进行合作,产品将陆续推出。

目前,Spichi的麦克风阵列参考设计有两种类型。

一种是纯粹的采集板,另一种是基于全志R16芯片平台的完整解决方案和基于联发科MT芯片平台的完整解决方案,这也是Spichi的完整解决方案。

目前推荐的方案成本在1万元左右。

雷国雄表示,智能音箱麦克风阵列有两个核心方面,一是技术性能,二是商业模式。

性能方面,麦克风阵列需要一定的技术积累,SPI在麦克风阵列方面积累了5、6年的经验,可以提供稳定的性能;在商业模式上,客户不仅考虑性能,还考虑价格,因此SPI Bichi提供单麦、双麦、四麦、六麦等不同的解决方案。

此外,他还表示,短期内很难对国内智能音箱市场进行教育,需要大公司对用户的使用习惯进行教育。

Spichi看好这个市场,未来将继续投资。

目前,国产智能音箱在语音交互体验、技术、产品等方面还有很大的提升空间。

此外,内容版权方也会对这个行业产生较大的影响。

例如,智能音箱的基本功能是听音乐。

音乐内容版权方对市场的判断以及市场策略都会影响行业的发展。

4、推进新探索:DUI开放平台 Spichi于今年7月推出了DUI开放平台。

开发者可以通过其平台定制他们的个性化技能。

9月7日,DUI开放平台也将于北京正式发布。

(Spici DUI开放平台技能服务)雷雄国介绍,Spichi长期以来一直在打造平台,并于2016年推出“对话工场”平台,通过平台向APP合作伙伴开放核心技术。

AIOS于2018年推出,旨在将平台情境化并解决技术的实际实施问题。

也取得了不错的成绩。

其中,后市场汽车市场占据60%至70%的市场份额,多家领先的智能音箱公司均采用。

借助Spichi的技术,已有超过1000万个电视盒实际投入使用。

从对话研讨会到车辆、家庭、机器人等多个方向的落地,这些落地反过来又推动了平台的发展。

去年年底,Spichi结合过去几年的实施经验,创建了DUI开放平台。

尽管越来越多的玩家推出语音交互平台,包括百度、腾讯等互联网巨头,但Spichi的愿景核心仍然是智能硬件平台,从几个特定场景的深耕转向通用平台。

更多垂直场景如何优化服务?他提供了两种解决方案。

一方面,Sibichi将把车辆、智能音箱、电视盒子、机器人等数千万用户终端接入DUI平台。

前期开发的解决方案将继续围绕DUI平台进行垂直打磨,方便客户使用Sibichi。

不可避免的是积累。

另一方面,Spichi DUI平台的“开放性”更具包容性,即与第三方技术提供商合作,共同打造平台。

Spirit在其擅长的领域提供技术解决方案,并在其他领域与垂直行业的公司进行合作。

例如,海智智能在NLP(自然语言处理)领域就表现出色。

通过深度合作,其NLP技术已作为技能或产品解决方案集成在DUI平台上。

该平台目前处于内测阶段,已经拥有数百名开发者。

开发者需要注册并提交审核。

符合智能硬件和物联网大方向、具备足够开发能力的开发者将通过审核,使用平台定制技能。

在盈利能力方面,雷雄国表示,目前Spichi将把精力集中在产品层面,完善产品功能。

结论:走软硬件结合的道路,雷雄国认为,语音技术公司在实现智能手机时,由于硬件是固定的,只需要做好交互技术即可。

未来物联网时代,一方面,公司核心需要考虑产品落地问题。

例如,单个麦克风阵列需要连接到后端唤醒引擎。

该技术对硬件的形式和要求及其在不同领域的应用也非常敏感。

此外,市场需求是多样化的。

需要将前端信号处理、后端唤醒、语音语义结合起来,基于此推出一整套交互解决方案,才能达到良好的体验。

这就决定了Spichi需要从一家软件公司走向软硬件结合的道路。