11月6日,锤子科技在成都召开新品发布会,发布了旗下首款智能音箱——“大卫·熙睿高级智能音箱D1”。
据了解,锤子音箱搭载了猎豹移动旗下人工智能公司猎户星的全套语音操作系统解决方案,包括语音合成(TTS)、自然语言处理(NLP)等一系列技术。
语音识别(ASR)。
同时,Orion Star还为Hammer打造了业界首个“一人扮演两个角色”的声音角色引擎。
基于大数据情感的语音合成和中文语音合成引入口音,打造智能语音助手在生活和工作中不同的性格特征。
老罗在现场表示,未来将与猎户星合作推出更多个性化的角色设定。
他还感谢合作伙伴猎户星,“我们提出了最多、最‘变态’、最意想不到的诉求,他们仍然给了我们最好的支持。
”在猎豹移动“321机器人之夜”上,罗总曾为好友、猎豹移动董事长兼CEO傅盛站出来表示“猎户座语音操作系统是市场上最好的语音操作系统”。
今天回到铁锤队的主场,老罗也用自己的行动证明了自己当时的召唤。
发布会上,老罗还与机器人“浮生”进行了对话。
据了解,机器人“复声”是猎户星开发的语音合成技术。
傅盛本人只录了十段,就达到了“以假乱真”的效果。
老罗:“市面上最好的语音操作系统” 语音交互能力被视为智能音箱的“灵魂”。
据不完全统计,目前国内“语音开发平台”有数十家,竞争十分激烈。
作为老罗口中“最有用的语音操作系统”,猎户星为何能从众多竞争对手中脱颖而出,保护手机行业最有“工匠精神”的锤子科技?双字设计——TTS双字设计引擎功能是本次大会的最大亮点之一。
这是Orion为Hammer打造的业界首款“一人扮演两个角色”的声音角色引擎。
与以往的语音交互体验不同,只有一种声音和一种角色,或者最多支持语音切换。
双字符引擎功能采用Orion的语音合成技术,基于大数据情感语音合成和引入口音的中文语音合成,打造男孩“耿大卫”和女孩“何细蕊”在生活和工作中不同的性格特征。
在语音合成的语音风格和文本语料设计上,呈现男友风、男性职业风、女友风、女性职业风的个性特征,满足不同的用户需求。
Orion Sky在二人设定的TTS合成上也花了不少功夫。
从最初的音箱选择到最后的语音合成,每个环节都严格把控,只为让合成的声音达到最佳效果。
确定人物风格后,从200名演讲者中投票选出男女演讲者。
经过3个月的时间,与角色相关的情感语音库创建完成。
由于同一个音箱“身兼二职”,为了保证声音效果的完美呈现,Orion TTS团队在参数调校和效果打磨上投入了大量的精力,最终呈现出同一个人的生活和工作。
两人的声音温柔甜美,风格干净。
中英文混合识别能力多语言混合Query的识别是语音技术中一个难以攻克的难点。
例如,“我想听泰勒·斯威夫特的《多一晚》”这样的常见请求,普通人是可以理解的。
但对于智能音箱来说,这是一个很大的挑战。
这是因为语言切换给语言模型带来了更大的复杂性。
为了解决这个问题,Orion Voice OS团队投入了大量的精力,特别是在优化中英文点播体验方面,取得了业界领先的成果。
重要任务之一是提高训练数据的数量和丰富性:Orion Voice OS拥有数千小时的远场中英文语料库,可用于语言模型训练;它模拟了一千多个汉语音节,并利用汉语音节来构建模型英语发音。
此外,Orion Voice OS还支持8万首新流行英文资源歌曲和8000名英文歌手的点播播放。
这些数据成为Orion Voice OS的“基础设施”。
除了丰富的数据积累,Orion Sky还拥有独特的技术壁垒:基于远场的语音和语义融合技术可以提高远场交互中高频查询的识别率,让机器更好地理解世界;其次,围绕音频内容进行深度定制,模型动态更新;最后,对语音指令进行概括,使点播粒度更细。
在团队的共同努力下,Orion Voice OS通用内容点播准确率超过90%,在业界遥遥领先。
还支持中英文、儿童、翻译、车辆等场景识别。
Orion Voice OS 已成为行业标准。
作为应用最广泛的中文语音合成技术,Orion Voice OS技术占据中国智能语音市场30%以上的份额,累计激活设备超过3000万台。
截至目前,Orion Voice OS每天接收超过2000万条在线语音命令,积累了数百万小时的远场语音数据。
猎户星一年来在AI硬件赛道上的征程始终有两个核心逻辑:完整技术链的自主研发,以及整体战略上的开放心态。
Orion Star的整套AI技术均为自主研发,包括语音识别、图像识别、视觉导航等,因此Orion Star可以根据场景定制算法,打造更好的用户体验。
具体到Orion Voice OS,全链路自研将使不同技术环节的连接更加融合,让语音交互更快更准:垂直领域深度语义理解准确率达96%,远场语音识别率达到行业领先水平。
97%,全链路流畅网络下平均响应速度1.5秒。
这些都是“努力”的回报。
智能语音发展不断成熟,给各行各业带来新的发展机遇。
猎户星在打磨自身技术的同时,也在以技术优势赋能行业。
据了解,Orion Voice OS已应用于华为、小米、美的、喜马拉雅、猎豹移动等众多合作伙伴的产品中,成为“应用最广泛”的AI语音系统。
10月15日,中国人工智能产业发展联盟(AIIA)在人工智能开发者大会上公布了国产智能音箱的智能评级结果。
猎豹移动、小米、喜马拉雅、百度、京东等五家主流厂商携旗下智能音箱产品参与了第一批测试评测。
Orion Voice OS占据了评级前五名产品中的三款,支持大部分智能音箱市场。
结合自身人机交互的产品基因和猎户星拥有的业界唯一的全链条人工智能技术,猎豹移动也在推动人工智能产品在不同行业的场景化落地。
未来,猎豹移动及其子公司猎户星将逐步向外界开放自主研发的视觉、导航、语音、机械臂技术等核心能力,与合作伙伴一起将机器人产品带入大众生活。