当前位置: 首页 > 科技赋能

NIRO 将机器人带入协作智能时代,百度举办首届AI设计论坛

时间:2024-05-22 13:56:42 科技赋能

7月4日至5日,百度AI开发者大会在北京国家会议中心隆重举行。

会议上展示了多项实施成果。

在本次大会上,百度举办了首届AI设计论坛。

百度设计体验委员会主席、百度人工智能交互设计院院长、百度用户体验中心总经理关代松及设计团队分享了百度在AI设计和用户体验方面的经验和思考。

,共同交流AI智能美学与创意的最前沿动态。

百度与湖南大学的战略合作在论坛上正式启动,融合了百度在AI交互设计领域的优势和湖南大学先进的科研能力。

双方将共同建设联合创新实验室和博士后基地,在人工智能设计领域开展更多、更深入的研究。

重视合作与探索。

人机交互的困境已成为机器人发展的重要因素。

AI设计论坛发布了机器人自然情感人机交互模型NIRO,可以帮助机器人产品更快进入协同智能时代。

NIRO由三部分组成:机器人自然语言交互模型、人类情绪反应模型、机器人主动沟通交互模型。

您现在可以通过百度人工智能交互设计院公众号(BaiduAIID)申请预约,同时还可以预约自然语言人机交互模型。

欢迎大家预约同步体验。

以下为演讲实录: 尊敬的开发者、尊敬的来宾,我是百度体验架构师李诗言。

我现在很兴奋,因为下一次我会分享关于《机器人的人机交互体验重构》,它将把机器人的人机交互体验带到一个新的阶段。

Robot这个词最早出现在2000年的一部电视剧中,它的词根是robota,意思是“苦力”。

可以说,机器人从诞生的第一天起就承载了人类这个巨大的梦想。

这个梦想是将人类从繁重的劳动中解放出来。

从交互的角度来看,人类劳动由两部分组成。

第一部分来自于人与世界的互动,比如洗衣服、搬运、做饭。

第二部分来自人际互动,比如指路、咨询、讲故事。

所以机器人要想完成它的使命,就必须解决两个方面的交互问题。

它的第一个维度是机器人与世界的交互,第二个维度是机器人与人的交互。

机器人与世界的互动是科学技术主导的部分,并且已经取得了长足的进步。

机器人与人的交互需要设计将技术和科学转化为良好的人机交互体验。

这方面的基础仍处于起步阶段。

目前机器人与人的交互存在三个问题。

第一个方面是“不自然的语音交互”。

目前,在很多机器人上,当用户与机器人开始对话时,需要点击机器人上的按钮,并且每次输出命令时都必须喊叫。

他的名字曾经。

在人与人之间的交谈中,我们不会每次说一句话时都叫对方的名字。

上一次这样做是几年前我和某人吵架时。

第二个方面是机器人不关注用户的情绪。

当用户与产品交互时,产品越具有人性化特征,人们就越倾向于输出情感。

人类有6种基本情绪和27种丰富情绪。

目前,无论你心情如何,机器人总会给你唯一的答案。

第三个方面是主动性不够。

根据我们的调查,85%的用户对主动与机器沟通有明确的期望,这会给用户体验带来明显的体验增益。

目前,我们仍然不知道如何与机器人主动沟通。

这三方面的问题逐渐导致用户对与机器人交互失去信心,使机器人失去吸引力,成为阻碍服务发展的重要因素。

因此,我们必须重构机器人的人机交互体验。

那么今天我想向大家介绍NIRO。

NIRO是一个机器人人机交互系统。

它由三部分组成,即机器人的自然语言交互模型、机器人的人类情感反应模型、机器人的主动沟通模型。

第一部分是机器人的自然语言交互模型。

人与人之间的沟通有两种场景:远场和近场。

在远场时,我们通常会称呼对方的名字来开始交流,而在近场时,我们往往会直接开始对话。

相应的机器人也是如此。

NIRO的远程交互模型是经典的语音交互模型。

它的唤醒方式是语音唤醒,使用麦克风阵列。

但我们重新设计了近场语音交互。

其第一步是使用激光或双目相机进行距离检测。

当用户与机器人的距离达到一定距离时,自动进入近场语音交互模式。

近场语音交互模式的核心是人脸锁定和唇部运动检测。

人脸锁定解决了交互对象的问题,唇动检测解决了噪声环境导致的错误输入问题。

利用远程语音唤醒和近场唇部运动检测模式,实现在嘈杂环境下与多人的自然交互。

经过实验环境测试,近场自然语音交互模式的通话效率每4轮提升5%。

单轮对话主观体验比唤醒词非一次性方式提升56.2%,比一次性唤醒方式提升31.2%。

第二部分是人类情绪反应模型。

人类是情感动物。

人机交互发展几十年来,机器的智商显着提高,但机器的情商却尚未发展起来。

当两个机器人智商相同时,一个情商更高的机器人肯定会更受欢迎。

情商由情绪识别和情绪反应两部分组成。

在情绪识别方面,我们亚洲人通常更含蓄地表达情绪。

为此,我们使用亚洲人的面部数据进行识别训练。

随着数据量的增加,其准确性会逐渐提高。

关于情绪反应,他有两种场景,一是情绪输出指令,二是负面情绪的调节。

在实验室里,我们通过刺激情绪来测试不同的应对策略,同时观察用户情绪的曲线变化。

我们发现,当用户处于悲伤状态时,机器人的应对策略是悲伤和安慰策略;当用户生气时,机器人的应对策略是谦虚、承认错误、改进。

我们将公布人类6种基本情绪和27种丰富情绪的主要部分,以及他详细的应对策略。

通过这种方式,我们让机器从一个不管你处于什么情绪状态都会做出统一反应的机器人,进化成为一个能够感知用户情绪,进而提供个性化反应策略的机器。

第三部分是主动沟通的人机交互模型。

主动沟通的前提是情境识别。

在某些场景下,用户可能会担心自己的隐私受到侵犯,所以一定有一些场景是不适合主动交流的。

过于主动的机器会被视为分散注意力,而完全不活跃的机器将失去其智能和吸引力。

因此,主动沟通必须回答三个问题:在什么情况下、在什么程度上、以何种方式进行。

通过实验,我们梳理了家庭环境和工作环境中的八个主要场景,发现沟通的活跃程度与用户在当前任务中的注意力投射程度成反比。

例如,是家庭环境中直接输出的主动通信模式更受欢迎,还是工作场景中的主动通信模式更受欢迎?通过主动沟通,可以实现机器人从被动接受指令到主动沟通的跨越。

经验评分后,在每种场景下,与非主动交流相比,你都会获得明显的经验增益。

在百度内部的一个实验环境中,我们让小度机器人主动为当天过生日的学生送上祝福。

效果非常惊人,带来了非常惊喜的体验。

机器人的自然语言交互模型可以让用户以最自然、高效的方式与机器人进行交流。

用户的情绪反应模型可以让机器获得情商。

主动的沟通模式让机器人更具吸引力。

NIRO 的每个模型都包含三层。

自然语言交互模型包括识别层、模型层和表示层,从8月份开始披露。

同时,该模型从9月起可通过百度AI人机交互设计院公众号预约体验。

NIRO的情绪应对模型,包括认知层、策略层和表现层,自9月起已被披露。

主动沟通模式将于8月向公众披露。

如何拓展机器人的使用场景一直是困扰行业的问题,因为机器人的使用环境实际上是为人类设计的。

例如,门、电力或障碍物会阻止机器人进入更广阔的场景。

传统的方法是拆除所有门。

它们都被改装为电动的,机器人与电梯系统相连,甚至在机器人上还安装了昂贵的分析臂。

这将大幅增加服务机器人的成本,使其难以推向市场。

而我们认为,进入广域智能的最佳途径是“协作智能”。

协作智能的未来是成本最低、效率最高。

通过使用NIRO进行设计,您可以快速将您的机器人带入协同智能时代,您也将成为第一批使用NIRO进行设计的用户。

机器人承载着最普世的技术价值。

它们让独居的人不再感到孤独,让有家人的人有更多的时间感受亲情。