当前位置: 首页 > 科技赋能

和阿里千雪对话!天猫精灵为什么不做带屏幕的音箱?

时间:2024-05-22 14:41:45 科技赋能

Zhidxcom (公众号:zhidxcom) 文本 |宇阳智迪西3月22日报道,今天阿里人工智能实验室(以下简称阿里AI实验室)发布了AliGenie 2.0语音交互平台,并在此基础上推出了视觉应用系统天猫精灵火眼,主要针对儿童市场和可用于儿童绘本阅读、物体识别等。

此外,阿里巴巴还发布了一系列春季新品,包括路由器天猫Router、投影产品天猫魔屏S1,以及更Mini版的智能音箱天猫精灵饼干。

(阿里巴巴AI实验室负责人钱雪)会后,阿里巴巴AI实验室负责人钱雪、北京研发中心负责人聂再清博士、产品总监时空接受了智东西等媒体采访,共同探讨了此次发布天猫精灵火眼的开发。

屏幕智能音箱、推出多种产品逻辑等。

1、天猫精灵累计销量达到10000台。

阿里巴巴人工智能实验室负责人千雪今天上台,身穿印有天猫精灵标志的黑色T恤。

按照发布会惯例,他回顾了天猫精灵智能音箱的历史。

从出生到现在8个月的历程。

去年双十一的99元促销给天猫精灵带来了一波关注。

经过前期宣传策划,双十一当天销售额破百万。

今天,千雪再次宣布,上线半年多来,天猫精灵销量已突破万台,已接入万台家电。

对了,她又跟亚马逊PK了。

亚马逊花了近2年时间才完成这项任务。

随后千雪从技术、智能家居等方面介绍了天猫精灵的发展进展。

目前,天猫精灵的技能正在逐渐增强。

千雪表示,这是目前最大的中文技能平台,有很多开发者在开发技能。

在智能家居方面,千雪认为,智能音箱推动智能家居进入2.0时代,从手机控制到语音交互。

目前,天猫精灵覆盖8个物联网平台、39个品类、72个家电品牌。

“在市场、用户、产品之间找到一个平衡点,让它走进更多家庭。

”千雪分享了她做智能音箱的理念。

此外,天猫精灵X1还荣获德国红点设计奖。

2、上线视觉应用天猫精灵火眼系统。

天猫精灵搭载AliGenie语音交互系统。

此次阿里宣布系统升级至AliGenie 2.0。

AliGenie 2.0主要在自然语言、机器视觉、多模态交互等方面进行升级。

在自然语言方面,阿里巴巴AI实验室构建了庞大的知识体系,包括5大垂直搜索引擎、20大类知识图谱,并升级算法使其具备通过交互主动学习和提升的能力。

千雪表示,未来人机交互不仅应该包括听觉,还应该包括视觉、嗅觉等能力。

这次AliGenie重点介绍了视觉能力,可以进行图像识别、物体检测、人脸识别等。

多模态交互只是通过语音、图像、触摸等多种交互形式的融合来增强人机交互的沟通能力。

AliGenie2.0还可以利用态势感知进行自主学习,根据自己所处的情境和对话场景了解情景需求。

基于AliGenie 2.0平台,阿里推出了天猫精灵火眼系统,这是一个基于该平台的应用程序视觉能力。

精灵火眼并不是一个硬件,而是一个软件系统。

具体来说,通过打开天猫精灵手机APP,唤醒“精灵火眼”,用户可以通过手机摄像头与天猫精灵的结合来发挥其视觉能力。

为了让使用更加方便,阿里巴巴AI实验室还推出了XHolder配件。

配件本身是一块塑料板,主要是为了方便用户使用精灵火眼,有点类似于谷歌的Cardboard。

从千雪的介绍来看,天猫精灵火眼的应用更侧重于儿童,并为此专门打造了可爱的童声。

其应用主要有三个方面。

一方面,天猫精灵升级了日常语音交互能力。

例如,当播放你指定的歌曲时,它可以根据你喜欢的风格“逗弄”你,增强对话能力。

精灵火眼还会在手机屏幕上显示可爱的表情,还可以通过触摸进行互动。

第二个应用是将视觉技能运用到儿童绘本阅读中。

部分出版社合作伙伴也来到了本次发布会。

原因是阿里巴巴与出版社合作,通过精灵火眼系统识别绘本,给孩子们朗读。

千雪表示,天猫精灵火眼已与全国12家顶级出版社建立合作,推出了一套儿童绘本。

第三个应用是“万物识别”。

与上面的图画书识别不同,物体识别更多的是3D物体识别而不是二维平面。

阿里巴巴AI实验室产品总监石孔演示了通过精灵火眼识别菠萝、西兰花等物体,并表示阿里巴巴将持续推广“识别万物”的能力。

有趣的是,由于直播网络不稳定,阿里在首次直播表演中还上演了“乌龙球”。

另外,我们发现在时控演示过程中,由于现场光线太强,我们要求灯光师将光线调暗一点。

可见,复杂光不仅是天猫精灵的眼中钉,也是视觉识别行业的痛点问题。

3、三款新品助力春季新品浪潮。

除了升级AliGenie语音交互系统、推出精灵火眼应用外,阿里AI实验室还推出了三款新品,分别是天猫路由器、天猫魔屏S1和更Mini版的天猫智能音箱。

精灵饼干。

近日,正正发布了春季新品。

昨晚,猎豹CEO傅盛推出了五款机器人。

阿里巴巴今天还发布了三款硬件产品。

第一个产品是天猫路由器。

千雪提到,网络对于AI来说是一个巨大的挑战。

正是在天猫精灵的开发过程中,她遇到了这样的问题,并做了一个路由器。

该装置的特点主要集中在两点。

一方面,天猫路由可以支持多设备同时在线;二是自组织网络,保证设备不掉网。

第二台设备是天猫魔屏S1投影仪,搭载AliGenie 2.0系统,可与天猫精灵配合使用。

千雪介绍,该投影仪可以在1.8米的距离投射出大画面的观看效果。

这是进军无屏电视市场的节奏吗?第三款是之前出现在大家视野中的智能音箱的更迷你版——天猫精灵Cookie。

它更小,只有苹果大小,符合千雪做智能音箱,让其更好融入生活的理念。

此外,它还具有可拆卸的外部,可以根据房间/偏好进行“蒙皮”。

这三款产品看似没有太多特色,这不免引起我们的好奇,阿里巴巴到底要做什么?会后,千雪解释说,这三个产品有一定的逻辑。

天猫精灵具有语音输出功能,天猫路由器用于联网,投影仪具有输出功能。

阿里巴巴希望通过这样的demo来打造人机交互体验。

或许这才是阿里真正的目的,通过这样一套输入输出设备展示AliGenie系统,吸引硬件厂商使用。

4、重点关注AI人机交互。

阿里巴巴为何推出天猫精灵火眼系统应用而不是硬件?我想这是很多人都有的疑问。

阿里巴巴AI实验室产品总监时空解释,在制作火眼系统时,内部存在很多争议,最终采用了XHolder配件+火眼的形式进行视觉应用。

通过兼容现有产品来实现这一点,而不是制作带有屏幕的智能音箱。

对于是否会推出带屏智能音箱,时空从产品经理的角度进行了谈论。

关键是加一块屏幕能否带来足够的议价能力。

目前,不少企业已经开始推出带屏智能音箱,比如百度、玲珑科技等都将在近期推出。

在千雪看来,屏幕并??不等于视觉能力。

重点不在于它是否有屏幕,而在于它是否具有与AI交互的能力。

通过这次与千雪、时空等人的交流,我们可以看到阿里巴巴对于做硬件的思路更加清晰,主要是发现软硬件创作中的“坑”。

阿里的重点仍然是系统中的软件,让硬件厂商使用AliGenie系统是阿里的想法。

至于2020年智能音箱市场的预期规模,以及阿里巴巴未来硬件或系统补贴的力度和重点,千雪没有给出答案。

结论:AI技术落地是关键。

此次阿里AI实验室重点发布了AliGenie 2.0语音交互系统和天猫精灵火眼,这让我们意识到阿里的重点可能一直在软件系统层面,AI技术落地才是其主要目的。

通过结合现有的天猫精灵和天猫精灵APP添加机器视觉功能,正如千雪所说,可以几乎零成本实现视觉技术的应用,但能否通过兼容不同的手机操作系统来提供呢?更好的体验也可能是一个挑战。