当前位置: 首页 > 科技赋能

百度AI交互设计院探索创造类人交互智能前沿

时间:2024-05-22 11:08:10 科技赋能

7月4日至5日,百度AI开发者大会在北京国家会议中心隆重举行。

会议上展示了多项实施成果。

在本次大会上,百度举办了首届AI设计论坛。

百度设计体验委员会主席、百度人工智能交互设计院院长、百度用户体验中心总经理关代松及设计团队分享了百度在AI设计和用户体验方面的经验和思考。

,共同交流AI智能美学与创意的最前沿动态。

百度与湖南大学的战略合作在论坛上正式启动,融合了百度在AI交互设计领域的优势和湖南大学先进的科研能力。

双方将共同建设联合创新实验室和博士后基地,在人工智能设计领域开展更多、更深入的研究。

重视合作与探索。

百度人工智能交互设计院自成立以来,围绕智能语音交互界面设计节点开展了大量的人因工程实验,并分享了一系列研究结论。

这些结论已被写入DuerOS的设备接入规范和设计指南中。

其中的原则,帮助DuerOS和开发者打造更符合人们需求和习惯的语音交互流程。

进入人机交互研究2.0阶段,百度人工智能交互设计院分享了他们在外观、自然交互、情感交互等领域的前沿探索案例,升级了AI时代的研究方法,创造了类人交互代理。

以下为演讲实录: 大家好,我是百度AI交互设计院研究员李轩。

去年11月,百度成立了业内首家交互设计研究机构。

很高兴借此机会与大家分享我们的研究成果。

面对AI时代给人机交互带来的巨大变化,如何通过研究引领交互设计是我们不断探索的问题,而我们找到的答案就是人因工程。

什么是人因工程?通俗地说,我们做设计的时候,需要用工程思维,准确、定量、全面地研究人们对自己了解和不了解的事情,然后应用到设计中。

人因工程并不是一个新领域。

在工业时代,人们利用机器来提高生产效率。

人机交互是纯粹的物理和机械交互。

人因工程学研究人类生理学各个方面的阈值。

基于这些阈值,我们制造出在人类可以承受的范围内高效的产品。

最大化设计。

信息时代,人们用机器代替部分认知劳动。

人机交互是虚拟的认知交流。

人因工程研究人类认知规律以优化信息传输。

过去,人因工程学为研究人体特征和认知规律并将其应用于设计奠定了基础。

AI时代,人因工程因人机交互方式和关系的变化而获得新的延伸。

首先,人工智能技术让机器越来越像人类。

机器可以用声音、手势、眼神等最自然的方式与人交流,甚至开始被赋予人的外貌。

人类不再需要适应机器,而是机器适应人。

其次,人工智能技术让机器越来越理解人。

机器不仅理解我们的语言和身体,甚至理解我们的动机和文化。

此外,随着机器变得越来越像人,人机关系也会发生变化。

以前人们对机器漠不关心,现在人们越来越多地将自己的情感、需求和期望投射到机器上,机器带给人的体验也变得更加复杂。

因此,AI时代的人因工程将不仅是关于人的能力、行为、局限性和特征,而且是关于社会、文化和心理。

这是一个真正以人为中心的系统工程。

那么在这个方法论和研究范畴里,我们具体在做什么呢? 1.0以智能语音作为新的交互方式,定义了语音交互标准。

对于人们来说,语音对话是最自然、最高效的沟通方式,而语音交互则是AI时代一种新的交互形式的开始,但实际上整个行业对于语音交互设计仍然存在很多疑问。

因此,定义语音交互的体验标准是我们工作的开始。

首先,我们整理出五个节点。

通过唤醒、响应、输入、理解、输出,人类和机器完成每一次语音对话。

为了创造良好的语音对话体验,每个节点都会对应很多需要研究和定义的设计点。

我们系统地梳理了每个节点下的设计点,并在此框架内逐步进行详细的实验,以确定最佳的机器参数和反馈水平。

比如,从声学的角度,我们研究了什么样的声音听起来好听,什么样的唤醒词容易发音;从语言学的角度,我们研究了机器和人之间什么样的对话技巧是好的;从视觉认知的角度,我们研究了不同距离下的字体大小。

显示……最后,我们输出了一系列研究结论,并将其应用到DuerOS的设备接入规范和设计指南中,帮助DuerOS和开发者创建更符合人们需求和习惯的语音交互流程。

2.0 创建类人交互代理。

在完成了大部分语音交互节点的研究后,我们开始更深入地思考如何在此基础上让人机交互更加人性化,让人们能够面对AI产品的挑战。

这时,它更加意识到它是一个智能代理而不仅仅是一台机器。

围绕这一点,我想跟大家分享一下我们认为近期比较重要的三个方面。

外观 首先,我们认为作为智能体,外观非常重要。

它影响着人们对人工智能产品的第一印象和期望。

围绕外观可以研究的问题有很多,其中经常争论的一个问题是智能产品是否应该以及在多大程度上应该像人类,即拟人化问题。

让我们分享一下我们的研究。

我们将拟人程度分为面部拟人和全身拟人,然后通过实验研究用户对不同程度拟人的认知和偏好,得到了一些有趣的结果。

比如在脸型方面,两只眼睛或者两只眼睛加鼻子的五官设计是比较安全的。

添加嘴巴很容易导致两极分化,说非常喜欢的人和非常不喜欢的人的比例就会增加,所以如果我们要进行拟人化的面部设计,需要谨慎对待是否使用“嘴”。

在全身拟人化的设计中,“手”是关键的部分。

如果要进行全身拟人化,最好带上双手。

这只是讨论外观的研究之一。

我们还研究智能产品的设计风格、材质、尺寸、形状等,探究人们对不同智能产品外观的认知点和心理原型。

自然交互 基于当前语音交互体验的不断优化,我们认为走向自然交互是人机交互的发展趋势。

所谓自然交互是以人为中心的,是指人类信息输入和输出渠道的交互方式。

人类通过视觉、听觉、触觉、味觉、嗅觉来接收信息,并通过言语、声音、身体、眼睛、表情等来表达。

在人类信息接收方面,视觉和听觉可以满足90%以上的信息需求。

因此,自然交互中机器信息输出最重要的是解决视觉和听觉信息如何有效配合的问题。

对此,我们利用眼动仪对用户视觉资源的分配进行了定量研究,并测量了不同设计方案中视听信息的协调性。

就人类信息表达而言,语言与肢体动作尤其是手势相结合,是人类最常见、最自然的表达方式。

尽管人们在生活中经常使用手势,但目前还没有成熟的交互解决方案,也没有如何将人类自然手势转换为人机交互语言的经验。

我们邀请用户来到实验室,观察他们在进行各种操作时最自然的手势反应。

我们获得了近10个手势,并根据通用性和可理解性对其进行过滤,形成最佳手势集。

然后,借助绿野仙踪的方法,即用户在后台体验通过人为操作实现的手势交互效果,让用户摆脱遥控器,用语音和手势来控制设备,并使用脑电图、肌电图等技术控制手术过程。

测量情绪体验、精神负荷和操作疲劳。

我们衡量了交互操作背后的自然体验,最终选择了不同情况和操作下手势和语音协调的最佳设计方案,并将其应用于DUEROS的设计中。

对于自然交互,我们也会探索更多的感官通道来完善自然交互的设计。

无论是语音交互还是自然交互,对于机器来说,都是交互渠道的问题,触及的是人的感知。

持续进化的下一步,我们将其视为情感互动。

这将是一个很大的飞跃,让机器触及人们的心灵。

情感交互情感交互是让机器具备像人类一样观察、理解和表达情感的能力。

为此,机器需要准确识别人类情绪并做出适当反应。

人们与他人交流时,通过表情、内容、语气、肢体四种渠道表达和接受情感。

达尔文说,能够从表情中识别情绪并预测他人的行为是动物生存和进化的一项重要技能。

因此,表情无疑是最重要、研究最广泛的,也是机器识别人类情感的重要问题。

我们目前正在开展这方面的研究。

在情绪应对方面,我们研究高情商的人如何处理愤怒、沮丧等负面情绪,研究咨询师如何引导哭泣的来访者,研究好朋友和陌生人在表达关心时的区别,并从他们那里提取良好的反应。

策略被赋予机器。

为了验证这些应对策略,我们在实验中通过VR模拟场景诱导用户的情绪,然后让AI让他们平静下来。

情绪识别和反应的研究也被应用到机器人交互设计中。

我期待着将来与您分享更多。

最后,作为一个专注于研究的团队,我们也想分享一些面对这些新领域时的研究方法的见解。

首先,由于研究领域越来越前沿,我们需要在研究中创造体验式的互动和场景。

其次,因为我们追求更加多元化、立体化的体验,所以需要引入越来越多的生理测量来衡量交互体验。

目前,脑电图、肌电图、眼动等都是比较成熟的工具。

第三,人脸、声纹、语气等识别技术帮助我们获取隐藏在行为背后的大量数据,比如用户的情绪、需求、动机等,而大数据计算则帮助我们建立规范。

过去,我们定义了基本语音交互的标准。

未来,我们将投入更多的精力来构建能够进行自然和情感交互的智能代理。

基于心理学对人类的认知、情感和意志的构建,所以在更高级的地方,我们还可以研究和探索如何赋予机器意志,使其能够主动地有目的和动机地交互,并以类人的方式进行交互。

情况。

交互下的人机关系,乃至人与机器物种之间的伦理问题。

未来还有很长的路要走。

百度AI交互设计愿意与大家不断交流和探讨,共同成为AI交互设计领域的先行者和探路者。