文章|于洋《Her》是一部关于人与机器之间的爱情的科幻电影。
剧中,男主角在经历了一场悲惨的恋情后,意外爱上了先进的人工智能操作系统(OS)。
这个虚拟助手可以与人类交谈,幽默又体贴,并且可以不断学习丰富自己的经验。
意识和情感。
如今,随着智能音箱等各种智能设备的出现,虚拟语音助手成为了人们讨论的热点。
为什么我们不想拥有电影中的虚拟助手,它无处不在地陪伴着我们,为我们提供各种服务。
就在昨天的极客公园奇点大会上,出门问问创始人兼CEO李志飞回答了“虚拟个人助理离我们的生活还有多远”的问题。
会后,他接受了知西西西等媒体采访,并就出门问问的智能音箱、自然语言理解和行业布局展开对话。
1、出门问问的“软硬件结合+多场景联动”出门问问是一家软硬件结合的人工智能公司。
它由李志飞于今年10月创立。
在创立公司之前,李志飞获得了美国约翰霍普金斯大学计算机科学系的博士学位。
后来他在谷歌总部担任科学家,从事机器翻译的研究。
这里的核心技术是自然语言理解。
李志飞表示,公司成立时,他们希望在下一代移动设备或计算设备到来时定义下一代人机交互。
为此,出门问问也经历了三个阶段的探索。
2018年成立一年半以来,出门问问主要做算法。
语音识别、语义理解、后续内容对接、搜索、推荐系统全部由Wenvoi团队自己完成。
李志飞表示,由于之前技术的积累,这一阶段相对简单。
随后李志飞开始探索技术应用在哪里,并在手机上做了一些应用。
2001年至2017年,出门问问开始走向软硬件一体化。
李志飞说,“什么样的方式才能承载下一代交互方式?我们想到的是软件和硬件的结合。
”具体来说,就是将软件和硬件结合起来,开辟一个新的品类。
出门问问推出的第一款软硬件结合的设备是智能手表。
做了智能手表之后,出门问问已经具备了软件、硬件、算法的联合开发能力。
在形成好产品的前提下,李志飞走向了软硬件结合+多场景联动的探索。
由于人们的生活场景是多种多样的,虚拟助手如果仅仅在手表上,其作用是非常有限的。
但通过多产品多场景的联动,可以让虚拟助手变得无处不在,让用户更方便地使用虚拟助手。
。
因此,出门问问开始尝试智能家居、智能汽车等场景的产品。
目前,出门问问软硬件结合的产品包括智能手表Ticwatch、出门问问耳机Ticpods、车载智能后视镜出门问问魔镜Ticmirror、智能音箱Tichome等产品。
2、出门问问的智能音箱将更加注重音质。
在智能家居产品中,出门问问率先探索智能音箱,并于今年4月发布了智能音箱Tichome和虚拟个人助理“出门问问”。
李志飞向智喜喜透露,该智能音箱将于今年8月24日左右发布,月底进入量产。
他表示,出门问问从去年下半年开始研究智能音箱,今年开始投入工作。
4月份首批样品亮相,产品经过近四个月的打磨。
当志东询问价格时,李志飞表示,这款音箱的价格会比市面上的音箱贵一些,大概价格在100到100元之间。
为什么智能音箱比天猫精灵X1和小米智能音箱贵?它有什么优点?李志飞表示,首先在音质方面,闻闻智能音箱的音质优于市面上所有智能音箱,主要是因为它采用了两个高、中、低音不同的扬声器组合,并且音腔较大,导致成本增加。
其次,在音质方面,出门问问会寻找更好的音源和更好的合作伙伴,并花费更高的成本在这方面进行投入。
第三,相比市面上的产品,出门问问在智能语音交互方面做得更好,比如多轮对话、百科问答等。
第四,从策略上来说,出门问问的智能音箱不仅内销,还外销国外。
他们在海外与Google合作,将自己的硬件与Google Assistant集成。
李志飞表示,只有销售更多的硬件才能实现规模经济,更多的用户才能支持投资、售后、服务和产品迭代。
智能音箱市场80%在海外,中国只占20%,所以出门问问从一开始就要做全球化的产品。
可以看到,作为一款智能音箱,李志飞首先关注的是音箱的核心功能,听音乐,提供更好的音质和音乐来源,其次才是智能化程度,这与苹果HomePod的理念不谋而合。
。
此外,李志飞还表示,追随苹果的潮流并没有什么错,因为小型初创公司很难定义一个产品品类,但可以在品类的基础上通过技术进行创新。
出门问问还在生产一款类似于苹果AirPods的耳机,预计将于今年年底推出。
3. 虚拟私人助理离我们还有多远?电影《Her》描述了2000年的情况,里面的虚拟助手有四个特点:自然对话、理解性、无处不在、又爱又恨。
不过,李志飞表示,未来7、8年要实现这个产品将会非常非常困难。
核心瓶颈在于自然语言理解能力。
目前的智能音箱更多还是处于“one shot”模式,即一轮对话,多轮对话仅用于休闲聊天。
李志飞表示,说话者可以根据上下文发起多轮对话。
例如,你可以说“播放音乐”,然后你可以问“这首歌叫什么名字”、“歌手是谁”、“他结婚了吗?”等待更深入的对话,但是为了用户体验,每次提问还是需要醒一醒。
当智西西询问NLP(自然语言处理)的发展现状以及《Her》中的虚拟助手何时能够实现时,李志飞表示,随着语音交互发展到今天,语音识别已经基本达到了可用的水平。
当然,也需要对各种噪声和口音环境进行迭代优化,但根本瓶颈在于自然语言理解和对话系统。
NLP和对话管理的背后是机器学习、大数据和云计算算法,但NLP更多的是指如何在其上下文中理解句子;对话管理指的是前一个过程的状态,即机器说了什么、人说过什么、没说过什么,是化学状态的管理,这两个技术是语音交互中比较大的瓶颈。
两者之间的突破在于如何将NLP技术与知识图谱、推理有效结合。
很难说自然语言理解已经发展到什么程度。
说白了,计算机没有常识,无法对物理世界进行建模。
一个非常有趣的悖论是,一方面,计算机可以创建一个可以击败世界上最好的国际象棋棋手的程序;另一方面,计算机可以创建一个可以击败世界上最好的国际象棋棋手的程序。
但另一方面,计算机无法像5岁的孩子一样与你进行正常的对话,而这就是计算机无法对物理世界和常识进行建模和理解。
4、智能音箱是战略布局。
考虑到智能音箱在NLP方面的瓶颈以及国内使用的实际情况,目前国内智能音箱是否是一个虚假需求?李志飞坦言,很难判断国内智能音箱是否存在虚假需求。
虽然Amazon Echo可以达到千万级的销量,但是想要在短时间内达到千万级的销量还是非常困难的。
首先,国内用户对智能音箱的认知度远低于美国。
他们的调查显示,80%的美国人知道什么是智能音箱,而在中国,这一认知度还不到20%。
其次,美国的智能家居成熟度比较高,房子较大,用户喜欢DIY,但这样的环境在中国是不具备的。
总的来说,国内智能音箱的发展并不乐观。
但对于所有公司,包括像出门问问这样专注于语音交互的公司来说,智能音箱都是一个战略产品。
虽然销量提升需要时间,技术成熟也需要时间,但如果今天不做智能音箱,即使未来四年用户有这个需求,技术成熟了,也没有什么关系。
你。
与运营产品不同,此类产品需要大量的技术积累。
天猫和叮咚的布局更侧重于智能音箱未来的战略价值。
在谈到小米智能音箱(元)和天猫精灵X1(元)的价格时,李志飞表示,出门问问不会选择低价路线。
在目前市场不成熟的情况下,降价不一定能卖出很多产品。
,反而会降低研发和推广的成本。
结论:百盒大战即将来临。
目前,市场上的智能音箱越来越多。
叮咚音箱、天猫精灵、若琪音箱、小雅智能音箱、小米智能音箱、Wevoo智能音箱等纷纷加入战局。
还有一大波玩家在路上,“百盒大战”即将来临!有的玩家硬件控制力强,追求性价比;有的玩家硬件控制力强,追求性价比;有的玩家硬件控制力强,追求性价比;有的玩家技术强,力求互动;有些玩家拥有丰富的内容资源,并且专注于内容;其他人则专注于渠道等。
然而,没有一家公司具备以上所有优势,未来的竞争必须基于用户体验生态系统。
国内市场和用户最终是否会买账,也是一个很大的问号。
但正如李志飞所说,智能音箱是面向未来的战略产品,任何人都不能承担错过的风险。