Zhidxcom (公众号:zhidxcom) 文本 |宇阳智迪西3月22日报道,今天阿里人工智能实验室(以下简称阿里AI实验室)发布了AliGenie 2.0语音交互平台,并在此基础上推出了视觉应用系统天猫精灵火眼,主要针对儿童市场和可用于儿童绘本阅读、物体识别等。
此外,阿里巴巴还发布了一系列春季新品,包括路由器天猫Router、投影产品天猫魔屏S1,以及更Mini版的智能音箱天猫精灵饼干。
(阿里巴巴AI实验室负责人钱雪)会后,阿里巴巴AI实验室负责人钱雪、北京研发中心负责人聂再清博士、产品总监时空接受了智东西等媒体采访,共同探讨了此次发布天猫精灵火眼的开发。
屏幕智能音箱、推出多种产品逻辑等。
1、天猫精灵累计销量达到10000台。
阿里巴巴人工智能实验室负责人千雪今天上台,身穿印有天猫精灵标志的黑色T恤。
按照发布会惯例,他回顾了天猫精灵智能音箱的历史。
从出生到现在8个月的历程。
去年双十一的99元促销给天猫精灵带来了一波关注。
经过前期宣传策划,双十一当天销售额破百万。
今天,千雪再次宣布,上线半年多来,天猫精灵销量已突破万台,已接入万台家电。
对了,她又跟亚马逊PK了。
亚马逊花了近2年时间才完成这项任务。
随后千雪从技术、智能家居等方面介绍了天猫精灵的发展进展。
目前,天猫精灵的技能正在逐渐增强。
千雪表示,这是目前最大的中文技能平台,有很多开发者在开发技能。
在智能家居方面,千雪认为,智能音箱推动智能家居进入2.0时代,从手机控制到语音交互。
目前,天猫精灵覆盖8个物联网平台、39个品类、72个家电品牌。
“在市场、用户、产品之间找到一个平衡点,让它走进更多家庭。
”千雪分享了她做智能音箱的理念。
此外,天猫精灵X1还荣获德国红点设计奖。
2、上线视觉应用天猫精灵火眼系统。
天猫精灵搭载AliGenie语音交互系统。
此次阿里宣布系统升级至AliGenie 2.0。
AliGenie 2.0主要在自然语言、机器视觉、多模态交互等方面进行升级。
在自然语言方面,阿里巴巴AI实验室构建了庞大的知识体系,包括5大垂直搜索引擎、20大类知识图谱,并升级算法使其具备通过交互主动学习和提升的能力。
千雪表示,未来人机交互不仅应该包括听觉,还应该包括视觉、嗅觉等能力。
这次AliGenie重点介绍了视觉能力,可以进行图像识别、物体检测、人脸识别等。
多模态交互只是通过语音、图像、触摸等多种交互形式的融合来增强人机交互的沟通能力。
AliGenie2.0还可以利用态势感知进行自主学习,根据自己所处的情境和对话场景了解情景需求。
基于AliGenie 2.0平台,阿里推出了天猫精灵火眼系统,这是一个基于该平台的应用程序视觉能力。
精灵火眼并不是一个硬件,而是一个软件系统。
具体来说,通过打开天猫精灵手机APP,唤醒“精灵火眼”,用户可以通过手机摄像头与天猫精灵的结合来发挥其视觉能力。
为了让使用更加方便,阿里巴巴AI实验室还推出了XHolder配件。
配件本身是一块塑料板,主要是为了方便用户使用精灵火眼,有点类似于谷歌的Cardboard。
从千雪的介绍来看,天猫精灵火眼的应用更侧重于儿童,并为此专门打造了可爱的童声。
其应用主要有三个方面。
一方面,天猫精灵升级了日常语音交互能力。
例如,当播放你指定的歌曲时,它可以根据你喜欢的风格“逗弄”你,增强对话能力。
精灵火眼还会在手机屏幕上显示可爱的表情,还可以通过触摸进行互动。
第二个应用是将视觉技能运用到儿童绘本阅读中。
部分出版社合作伙伴也来到了本次发布会。
原因是阿里巴巴与出版社合作,通过精灵火眼系统识别绘本,给孩子们朗读。
千雪表示,天猫精灵火眼已与全国12家顶级出版社建立合作,推出了一套儿童绘本。
第三个应用是“万物识别”。
与上面的图画书识别不同,物体识别更多的是3D物体识别而不是二维平面。
阿里巴巴AI实验室产品总监石孔演示了通过精灵火眼识别菠萝、西兰花等物体,并表示阿里巴巴将持续推广“识别万物”的能力。
有趣的是,由于直播网络不稳定,阿里在首次直播表演中还上演了“乌龙球”。
另外,我们发现在时控演示过程中,由于现场光线太强,我们要求灯光师将光线调暗一点。
可见,复杂光不仅是天猫精灵的眼中钉,也是视觉识别行业的痛点问题。
3、三款新品助力春季新品浪潮。
除了升级AliGenie语音交互系统、推出精灵火眼应用外,阿里AI实验室还推出了三款新品,分别是天猫路由器、天猫魔屏S1和更Mini版的天猫智能音箱。
精灵饼干。
近日,正正发布了春季新品。
昨晚,猎豹CEO傅盛推出了五款机器人。
阿里巴巴今天还发布了三款硬件产品。
第一个产品是天猫路由器。
千雪提到,网络对于AI来说是一个巨大的挑战。
正是在天猫精灵的开发过程中,她遇到了这样的问题,并做了一个路由器。
该装置的特点主要集中在两点。
一方面,天猫路由可以支持多设备同时在线;二是自组织网络,保证设备不掉网。
第二台设备是天猫魔屏S1投影仪,搭载AliGenie 2.0系统,可与天猫精灵配合使用。
千雪介绍,该投影仪可以在1.8米的距离投射出大画面的观看效果。
这是进军无屏电视市场的节奏吗?第三款是之前出现在大家视野中的智能音箱的更迷你版——天猫精灵Cookie。
它更小,只有苹果大小,符合千雪做智能音箱,让其更好融入生活的理念。
此外,它还具有可拆卸的外部,可以根据房间/偏好进行“蒙皮”。
这三款产品看似没有太多特色,这不免引起我们的好奇,阿里巴巴到底要做什么?会后,千雪解释说,这三个产品有一定的逻辑。
天猫精灵具有语音输出功能,天猫路由器用于联网,投影仪具有输出功能。
阿里巴巴希望通过这样的demo来打造人机交互体验。
或许这才是阿里真正的目的,通过这样一套输入输出设备展示AliGenie系统,吸引硬件厂商使用。
4、重点关注AI人机交互。
阿里巴巴为何推出天猫精灵火眼系统应用而不是硬件?我想这是很多人都有的疑问。
阿里巴巴AI实验室产品总监时空解释,在制作火眼系统时,内部存在很多争议,最终采用了XHolder配件+火眼的形式进行视觉应用。
通过兼容现有产品来实现这一点,而不是制作带有屏幕的智能音箱。
对于是否会推出带屏智能音箱,时空从产品经理的角度进行了谈论。
关键是加一块屏幕能否带来足够的议价能力。
目前,不少企业已经开始推出带屏智能音箱,比如百度、玲珑科技等都将在近期推出。
在千雪看来,屏幕并??不等于视觉能力。
重点不在于它是否有屏幕,而在于它是否具有与AI交互的能力。
通过这次与千雪、时空等人的交流,我们可以看到阿里巴巴对于做硬件的思路更加清晰,主要是发现软硬件创作中的“坑”。
阿里的重点仍然是系统中的软件,让硬件厂商使用AliGenie系统是阿里的想法。
至于2020年智能音箱市场的预期规模,以及阿里巴巴未来硬件或系统补贴的力度和重点,千雪没有给出答案。
结论:AI技术落地是关键。
此次阿里AI实验室重点发布了AliGenie 2.0语音交互系统和天猫精灵火眼,这让我们意识到阿里的重点可能一直在软件系统层面,AI技术落地才是其主要目的。
通过结合现有的天猫精灵和天猫精灵APP添加机器视觉功能,正如千雪所说,可以几乎零成本实现视觉技术的应用,但能否通过兼容不同的手机操作系统来提供呢?更好的体验也可能是一个挑战。