看似简单的游戏背后,隐藏着业界最前沿的语音黑科技,可以支持亿万用户同时通过语音控制玩游戏,并且语音识别响应速度是传统语音技术的20倍。
声控年兽游戏被很多人评价为想象力丰富、解压神奇。
在解锁红包的同时,不少网友对着手机喊出“牛牛牛”、“幸福安康”等祝福,收获了意想不到的喜悦。
“八年兽声控局”这个话题在微博上获得了2.1亿粉丝。
但由于需要承载数亿用户,并保证不同机器配置、不同网络条件的用户都有丝般流畅的体验,这款国民游戏对语音识别技术提出了极高的要求。
传统语音识别系统往往部署在云端,对移动网络条件要求较高,难以低时延支持所有用户。
为了保证稳定的用户体验,声控年兽游戏采用了达摩院语音实验室最前沿的离线关键词识别技术。
将语音识别系统从云端搬到移动端,最终尺寸缩减到5M以下。
离线部署下可以让数亿用户同时低延迟玩游戏。
即使在低端手机上,这项黑科技也能在50毫秒内完成语音识别过程,比传统语音技术快20倍。
近年来,阿里语音在前沿技术和应用领域不断取得突破。
2019年,阿里语音AI凭借接近真人表达能力的交互能力,入选“全球十大突破性技术”之一。
2020年,阿里语音AI首次将端侧语音识别和语音合成能力提升到媲美云端的水平。
年末阿里语音AI,IDC最新报告显示,阿里语音以32%的市场份额继续稳居云语音AI市场第一。