当前位置: 首页 > 科技赋能

智能音箱进阶了!全新视觉功能 终极形态是家庭机器人

时间:2024-05-22 17:04:15 科技赋能

阿里巴巴人工智能实验室于3月22日发布人机交互系统AliGenie 2.0版本。

新版本最大的特点是在原有的基础上引入了“视觉功能”听”和“说”的互动体验。

据悉,AliGenie 2.0的视觉能力包括图像识别、人脸识别、物体检测等。

搭载新版“天猫精灵”,成为首款能“看”的智能音箱。

不过,天猫精灵并没有推出“带屏音箱”,而是推出了“精灵火眼”功能:通过XHolder外设和“精灵火眼”应用,用户可以连接手机,为天猫精灵提供添加一个屏幕。

“精灵火眼”最初推出了读书、识别药盒等功能。

比如,针对儿童的使用场景,《精灵火眼》与出版商合作,精选了一套适合3岁至8岁儿童的图书。

针对老年人的使用场景,“精灵火眼”推出了药盒识别功能,可识别4万种药盒类型。

只需扫描药盒,即可用语音播报药品名称、功效、有效期等信息。

据阿里巴巴人工智能实验室介绍,智能音箱的终极形态是家庭机器人。

从“听”、“说”到“视觉交互”再到“行动”,阿里巴巴希望通过引入视觉能力来加速这一演变。

据了解,天猫精灵上线几天就实现销量破万台。

在全球市场,最畅销的智能音箱亚马逊ECHO用了一年多的时间才达到这一数字。

可见,中国智能音箱市场发展非常迅速。

在中国,人工智能带动了“百盒大战”。

目前,智能音箱的品类较多,但功能正在趋同。

在阿里巴巴人工智能实验室负责人千雪看来,这种情况不会持续太久。

大多数没有技术投入和生态建设的产品都会消亡,最终可能只剩下两三个主要参与者。

虽然当前市场以硬件为主,但千雪认为,未来发展的核心趋势在于云和终端能力。

“我们将继续将更多能力引入家庭场景,继续定义我们对人机交互的理解和对家庭的理解。