车东溪(公众号:车东溪) 正文 |起源随着越来越多的语音助手出现在我们的生活中,我们会越来越明显地感受到,人们与智能终端的交互方式正在慢慢从简单的触摸转变为与语音相结合。
不过,虽然我们可能更熟悉Google Assistant、Apple Siri等智能语音助手,但语音交互在汽车上的应用其实开始得更早。
如今,汽车内的语音交互也日趋智能化,BAT以各种智能语音助手侵入汽车。
初创企业如何在巨头的阴影下突围?奥硕科技有自己的答案。
1、经验丰富的车载语音司机创业奥说科技是一家成立于2007年的车载语音技术服务公司,创始团队主要来自国际知名车载语音解决方案提供商Nuance。
CEO郑天堂是Nuance中国分公司的首批员工之一。
他从2009年开始接触车载语音。
奥硕的CTO也来自Nuance。
(奥硕科技CEO 郑天堂)2017年,奥硕参与上汽通用汽车车载语音前装项目投标并成功中标。
2009年,为上汽通用汽车批量生产可使用自然语言的车载语音解决方案。
当年的别克新英朗就搭载了奥硕的语音解决方案。
成立的最初几年,奥硕就成为上汽通用汽车的“独家服务商”,别克GL6的车内语音解决方案也是由他??们提供的。
奥硕特别向车东西强调,他们当时能提供的能力与传统汽车语音完全不同。
后者虽然是语言交互,但交互逻辑仍然是传统的“菜单栏”形式,一关键词对应一选择。
相比之下,傲说提供自然语言交互。
用户在别克新英朗上说“我想听某首歌”或者直接说出我想去的地方,就可以直接获得服务。
因此,奥硕是车载自然语言交互的较早起步者之一。
(别克GL6整车系统)如今,奥硕的团队成员更加多元化,来自上海贝尔、四维图新、泰威等公司。
在“上汽通用供应商”的旗帜下,奥硕也开拓了更多的客户,其中包括多家主流国际一级及国内整车厂。
2.本地+云端打造车内纯语音交互。
在拥有15年历史的别克新英朗上,奥硕提供了纯粹的本土化解决方案。
解释一下,语音识别只能通过机载计算硬件来完成。
由于车载芯片通常落后消费电子产品一到两代,而且车内存在噪声干扰,纯本土技术难度很大。
不过,奥硕提供的解决方案仍然满足上汽通用给出的指标。
近年来,人工智能的兴起让语音识别的准确率提升到了新的水平,语音交互自然适应了车内场景。
因此,打造车载语音交互系统已成为一大趋势。
然而,纯粹的本地车载语音解决方案在语义理解和功能丰富性方面存在不足,显然不能满足习惯于互联网体验的用户的要求。
同时,奥硕还观察到,2019年,大量车辆将真正实现联网。
奥硕审时度势,推出了“本地+云端”混合车载语音解决方案。
核心产品包括本地识别引擎、云端识别引擎、自然语言理解引擎、语音合成TTS引擎和声纹识别引擎。
在这套产品中,云计算能力和数据库的加入可以提高识别的准确性,确保用户的需求得到真正的理解和满足。
本地识别引擎是基础。
即使离线,也能保证用户的基本使用需求。
语音合成引擎是车内轻柔女声的直接来源;声纹识别有助于区分不同用户,方便功能个性化。
奥硕的方案支持WinCE、Android、Linux、QNX等操作系统,并在软件层面做了很多优化,对车载硬件的性能要求不高。
应用奥硕的解决方案后,用户在驾驶环境中的大部分场景下都可以通过语音交互得到满足(目前支持超过40种场景)。
同时,奥硕不断迭代优化各个引擎,对接第三方服务,将更多场景纳入覆盖范围。
3.巨头正在进入。
奥硕为何能屹立不倒?毫无疑问,车载语音是一个很大的市场——今年以来,BAT推出了自己的车载系统:百度的小度车载系统、腾讯的AI IN CAR、阿里巴巴的斑马智行,它们都让语音成为可能。
互动发挥主导作用。
但BAT的加入也让车载语音似乎成了一条死亡赛道:语音识别和理解解决方案,以及识别后所需的各种服务和内容,都是BAT提供的。
也正是这样一个完整的计划,让汽车厂商开始选边站——北汽、上汽、广汽纷纷拉拢BAT。
只提供语音识别解决方案的奥硕如何与BAT竞争?而且,即使不提BAT,奥硕在语音解决方案提供商方面也有大量竞争对手,比如科大讯飞、云智声、Spichi等。
对此,郑天堂分析了情况。
他认为,BAT不可避免地会导致汽车制造商选边站队。
三大巨头的大平台拥有各种资源,汽车厂商不能视而不见。
但与此同时,作为一个平台的问题在于它提供的是标准化的而不是定制的。
很多汽车制造商,尤其是大型汽车制造商,往往有定制化需求,而BAT的车载系统很难满足这些需求。
奥硕的优势是定制开发。
为了满足不同汽车制造商的需求,奥硕的公司结构采用项目驱动+产品驱动相结合。
一些研发人员确保底层技术的先进性,而另一些人员则专注于解决汽车制造商的针对性需求。
与互联网出身的技术解决方案提供商相比,奥硕的优势在于更早接触汽车厂商,获得了更多车内场景数据。
在与车厂合作的过程中,奥硕深知车厂的核心诉求是什么——在保证安全的同时尽可能提升体验。
与上汽合作的前装开发经验,让奥硕清楚地认识到为车厂开发语音系统的潜在陷阱。
例如,在设计打电话功能时,需要考虑用户打电话时会如何说、给谁打电话、是否会出现重名、是否会导致功能误操作等。
在此之前,您需要考虑对语音进行降噪处理。
郑天堂表达了自己的观点:虽然现在互联网力量正在涌入汽车行业,但由于汽车的核心是安全,所以互联网公司最终还是要主动去适应汽车厂商,而不是彻底颠覆汽车厂商。
在汽车行业孵化的奥硕在与汽车厂商的合作方面做得很好。
结论:从沟通中可以看出,奥硕这个车载语音服务商,正在做互联网公司热爱的语音交互,但奥硕仍然属于汽车行业的一家公司。
在互联网行业与汽车行业的动态博弈中,奥硕仍然站在汽车一边。
不过,郑天堂表示,他们在产品思维、接入第三方服务等方面也向互联网公司学习,保持自身产品的迭代,培养用户思维。
郑天堂表示,未来两年,将有多个品牌的汽车推出搭载奥硕语音交互技术的汽车。