文章|渔阳猎豹移动CEO傅盛曾表示,2019年是特别困难的一年。
他表示,“移动互联网的上半场已经结束”,而且这很快就会发生。
作为移动互联网工具和内容提供商,猎豹移动将何去何从?傅盛给出的答案是AI,就是机器人。
在猎豹CONNECT大会上,傅盛曾表示,即使赔光所有的钱,他也要成立一家机器人公司,进军人工智能领域。
傅盛未来押注的人工智能公司是Orion Star。
去年,猎豹移动又向其投资1万美元,帮助其在AI领域的研发和技术落地。
但这家公司却非常低调。
小雅AI音箱语音技术提供商TTS表现不错,其面部识别技术获得了奖项。
这就是智洞智对猎户星空的直观印象。
除此之外,这家公司是什么?做什么?核心技术是什么?团队的规模和组成是怎样的?它在整个猎豹体系中的地位是什么?我们谁也不知道。
(猎户星首席科学家闵科睿)近日,智西西开启与猎户星首席科学家闵科睿的对话,看看未来一年来,AI公司复盛在做什么。
1、三大业务:语音、视觉、硬件 Orion Star是猎豹移动旗下的AI公司,成立于2018年9月。
公司初创团队来自谷歌、微软、英特尔、国内BAT等公司,拥有博士研究生。
D.s占比近50%。
可以说是一家非常注重技术的公司。
经过一年左右的发展,目前猎户星团队规模已达到10万人左右。
Orion Star的主营业务大致可以分为三个部分,重点是语音、视觉和硬件。
第一个业务是围绕语音构建的一整套语音交互技术。
该业务约占员工一半,是Orion Star最大的业务。
闵克睿表示,Orion Star围绕语音交互构建了一整套完整的技术,包括前端信号处理、唤醒、语音识别、自然语言处理和语音合成。
它有一个专门的团队致力于此。
比如喜马拉雅的小雅AI音箱就采用了整套技术。
小米AI音箱、小米电视等均采用了Orion Star的语音合成和远场语音识别技术。
第二个主营业务是视觉,目前主要围绕图像识别和人脸识别,以及相关技术的落地。
例如,猎豹内部使用的人脸签到就使用了其人脸识别技术。
Orion Star也在和猎豹的直播社交产品进行合作,比如在国外直播软件Live.me中进行直播评论相关的监控,同时也在一些手势检测技术上进行合作。
第三块是硬件,但Orion Star还没有推出硬件。
“现在所谓的智能硬件,无论是声音、视觉还是感知,其实都可以更加一体化。
”闵克瑞说。
看得出来,猎户星的硬件团队也在积极备战,预计下一阶段会推出一些主打视觉和语音的硬件产品。
2、从唤醒到NLP,聚焦全链语音交互技术。
在语音交互方面,猎户星打造了从前端信号处理、唤醒、语音识别、自然语言处理到语音合成的一整套语音交互技术,与行业在某一方面的专业化相比与科技领域的初创公司相比,Orion Star 有什么优势吗?闵克睿表示,一方面,猎户星在每一个具体的技术上都有专门的团队,所以每一个环节都有积累。
另一方面,Orion Star更注重用户的交互体验。
一旦链条的某个环节出现问题,整个用户的交互体验就会很差,这就需要整个链条更多的技术打磨。
例如,在小雅音箱的语音交互中,Orion Star不仅跟踪每项技术对应的模型指标,还对小雅音箱的端到端感知进行评估,从而对技术进行整体优化。
“比如,业界同行在语音识别方面可以达到95%左右的准确率,但我们可以通过自然语言处理模块做大量的纠错,使准确率可以提高三到四个百分点,用户体验会更好。
”敏克瑞说道。
目前,Orion Sky也在尝试一些模型,比如将语音识别和后续的自然语言作为端到端的训练。
这相当于不必先听语音来获取文本,然后通过自然语言纠错来进行第二次处理。
这些模块可以组合在一起,创建更加端到端的解决方案,从而减少中间过程的损失。
传统的语音识别和语义理解是由两组人完成的,但猎户星两个团队都有前后端技术积累和打造的能力。
这样做的好处是,在优化端到端模型时,可以被用户感知。
正确性是目标。
然而,简单的语音识别或语义理解的准确性很难被用户感知。
“但用户真正关心的是发起命令后最终的准确性。
通过深度神经网络技术,可以自动提取很多特征。
相反,端到端的解决方案可以取得更好的效果。
”闵克瑞说。
目前,很多智能硬件产品都采用多种技术来完成语音交互,从语音拾取到语音识别再到语义理解。
如果每块都采用不同厂家的技术,那么车型之间的适配都是一个问题,更不用说通过整个语音链上的后端技术来优化前端技术了。
从整个语音交互链条入手,Orion Star或许可以提供一个优化用户体验的好方法。
此外,闵克睿还表示,猎户星虽然是一家技术型公司,但其技术也非常产品化,更注重其在场景和产品中的落地。
通过产品形态和场景的定义,技术也能得到更好的落地。
这也符合傅盛一直在讲的“通过技术与产品实现的结合创造用户体验”。
3、数百位配音演员打造“邻家女孩之声”。
从小雅AI音箱到小米AI音箱,都采用了猎户星提供的语音合成技术。
其温柔的女声也受到了很多人的欢迎。
闵克睿表示,市场上有一些标准化的解决方案,很多产品没有考虑用户的感知体验,往往直接使用。
但从产品端来看,猎户星认为声音是影响用户体验的重要场景,相当于手机APP的界面,因此在语音合成上花了很大功夫。
首先,在声乐选材方面,他们采访了上百位声优,挑选音质有特色、符合产品定位的声优进行签约,并在录音室采集了大量的声音,通过技术手段进行创作。
处理和精确的数据标准化。
。
所以大家感觉辨识度更高,声音的亲和力也更大。
(小鸭AI主讲)在自然语言处理(NLP)中,传统的NLP是一个多分类问题,依赖于资源数据的分类,要求前一阶段执行得非常正确。
分层做的好处是可以简化问题,但是一旦前一阶段出现问题,后期就很难识别用户的意图。
NLP 中的 Orion Star 第一个版本就使用了这套逻辑,现在他们在提取新模型时,会将资源数据与模型数据结合在一起考虑。
这里采用的模型是一种更复杂的结构化方法。
所谓结构,比如用户说出的一句话就有一个结构,主谓宾语法对这个结构有比较强的限制。
该方法仍然属于判别模型,但结构更加复杂,并且通过对这些结构之间的依赖关系进行建模来获得更高的精度。
此外,犹豫提问和模糊搜索也是Orion Sky的两大亮点。
传统NLP的数据处理往往??是比较正式的文本,但对于用户的口语数据,需要对异常情况进行处理。
例如,如果用户的言语中缺少主语、谓语和宾语,我该怎么办?如果用户说“嗯”半秒怎么办?如果修改了之前的内容怎么办? Orion Sky 可以使用机器学习统计数据来根据上下文确定用户是否已经说完。
在模糊搜索方面,传统的NLP搜索是基于语音识别准确的假设。
但是,如果用户发送的语音识别结果是错误的,那么最终的结果也可能是错误的。
这就是为什么Orion Star需要开发更加端到端的解决方案来减少中间过程中的损失。
例如,通过模糊搜索,数据库中不存在用户请求的歌曲名称,但确实存在一首声音非常相似的歌曲。
进一步地,根据用户频繁点歌的习惯和听歌的习惯,可以推测出用户的点击情况。
是哪首歌? Orion Star 在这方面也做了很多优化。
敏克瑞还表示,更具挑战性的是音频资源内容的模糊搜索,因为很多音频资源名称的名字都很长,用户能记住的都是关键词,这在技术上需要更多的模糊性和容错性。
4、猎户星与猎豹系统的联姻 猎户星是猎豹移动旗下的人工智能公司。
猎户星的定位以及它在整个猎豹系统中的存在一直是我们的疑问。
我们也从敏克瑞那里找到了答案。
总体来说,机器人是猎户座的主攻方向。
当然,这个“机器人”是机器人的一个大类,包括现在的智能音箱,它构建了机器人完整的语音和语义能力。
未来,Orion Sky还将应用视觉打造更加集成的机器人。
这也符合傅盛所说的人工智能的突破点在于产品与应用的结合。
真正的AI不应该只是拥有技术,而是真正与我们的生活融为一体的产品。
对于猎户星和猎豹来说,两者更像是一个互补的循环。
首先,猎豹提供资金支持,猎豹的产品也为其AI技术的落地提供场景。
Orion Star还将其技术赋能猎豹系统产品,帮助其优化服务和产品体验,并通过用户数据迭代技术。
在猎豹系统中成长起来的猎户星不需要像其他AI初创公司那样担心融资问题,也不需要为了生存而规划临时的技术实施。
复盛和猎豹也给了它一个相对宽松的空间,短期内不必盈利。
而且想太多了。
在猎豹体系中,猎户星更注重技术研发。
虽然它也做技术落地,但相比产品化经验更丰富的猎豹来说,将更多AI技术落地到产品和场景中的任务落到了猎豹身上。
在猎豹身上。
5、通用NLP成为业界最大的挑战。
在谈到中国??整个语音交互行业的进展时,闵克睿表示,刚刚起步,通用NLP的挑战仍然巨大。
现在仅限于特定场景,以保证大部分交互可用。
例如,点歌的用户满意率可以达到90%以上。
但就通用NLP而言,建立世界知识模型是非常困难的,而这是实现通用智能的重要一步。
比如“小明打伤了小红,被送到医院,又被警察带走了”。
我们人类很容易理解谁是谁,但机器却很难区分,因为它没有常识。
闵克睿表示,小雅AI音箱发布三个月以来,NLP的准确率也提升了五到七个百分点。
一方面,技术通过用户使用进行迭代,架构上也进行了新的尝试。
另一方面,通过用户使用习惯发现常见错误,然后利用算法模型进行弥补。
此外,他还谈到了一些行业内比较具体、产品化的问题。
例如,儿童的语音识别准确率不高。
一方面是由于孩子们的口音和发音方法不同。
更重要的是,该行业收集的有关儿童的数据有限。
此外,很多儿童玩具设备都受到电池的限制,能否降低识别能力以降低功耗也是当前的问题。
结语:智能音箱大战将烧向何处?对于今年异常火爆的智能音箱来说,销售数据似乎并不乐观。
敏科睿依然看好智能音箱市场。
他认为,智能音箱确实可以在一定程度上落地。
有可用的场景,出货量也在快速增长。
从用户与智能音箱的交互时间可以看出,它们比很多内容APP要长得多。
的。
可以看到,成立仅一年的猎户星已经研发出了完整的语音交互技术,同时也在视觉方面积极探索人脸识别等技术,并在语音两个领域取得了一定的成果。
和愿景。
并且它还与猎豹系统中的其他产品进行交互,相互促进。
但正如傅盛所说,这个全新的行业才刚刚开始,大家都站在同一起跑线上。
猎户星能否实现傅盛的AI梦想,最终还需要市场来评判。