【.com原创文章】当前电商行业相对成熟,呈现多种形式,如何为终端用户提供更好的服务,进而改进运营与企业效率是每一个电商企业都不得不面对的问题,而智能导购对话机器人就是在这样的背景下诞生的。本期《大咖来了》直播栏目请来SmarterCTO莫雨。分享的题目是《智能导购对话机器人实践》,深入讲解了智能导购对话机器人背后的技术细节,以及在实际研发过程中的一些总结和思考。智能导购对话机器人应用场景哪些场景需要智能导购对话机器人?用户在夜间购物时很难找到人工客服。这时候,智能导购机器人在提高电商客户的交易量方面发挥着非常重要的作用。在双11、618等大促期间,虽然提前几个月准备了人工客服,以应对几十倍甚至上百倍的流量激增,但效率和资源投入并不尽如人意。这时候,智能导购聊天机器人就派上用场了。下图是整个对话机器人背景的大致结构。当智能对话机器人通过不同的电商客户端接收到用户消息时,能直接回答的会自动回复,超出能力范围的会分发给人工客服。智能对话机器人自动回答用户问题的过程如下。首先,对话管理平台接收消息,根据上下文理解用户意图,分发智能导购机器人。反馈给用户。整个过程看似简单,但技术实现起来并不容易。智能导购对话机器人背后的技术细节智能导购机器人由三部分组成,即问答机器人、任务机器人和推荐机器人。问答机器人主要解决无需多轮交互即可解决的问题,是任务机器人的基础。任务机器人通过与用户的多轮交互,帮助用户解决某个需求,比问答机器人更上一层楼。推荐机器人建立在任务和问答机器人的基础上,其特点是主动与用户互动。Q&ARobots问答机器人一般基于问答库构建,问答库中存储着数万、数十万甚至更多的已知匹配问答数据。当用户输入的问题与库中的问题具有相同的语义时,它会将相应的答案反馈给用户。基于问答数据库的问答机器人一般采用基于规则、统计学习、预训练模型、小样本学习的技术方案:基于规则和统计学习的方法,当用户消息中包含某个关键词时,匹配某个正则expression,并且满足使用某种规则引擎时,能够准确识别意图并反馈相应的答案。这种方法简单可控,但缺乏语义理解,不易维护。基于统计学习的解决方案需要对数据进行标注,例如SVM、DeepSemanticModel(深度语义模型),这些模型会涉及人工设计特征、深度特征、one-hot(稀疏表达)和embedding(密集表达)。与基于规则的方法相比,基于统计学习的方案学习了更多的语义,但缺点是它需要大量的领域知识和领域相关的标记数据。基于预训练模型和小样本学习在没有数据标注的情况下,可以选择基于预训练模型和小样本学习两种方法。2018年发布了基于BERT的Finetuning,刷新了很多问题的最好成绩,语义相似度也是如此。当每个问答数据库的数据量很小,每个意图场景只有几项时,可以尝试使用基于小样本的学习方法。除了基于问答数据库的问答机器人,还有一个非常重要的基于知识图谱的问答机器人:用户基于知识图谱查询的问题大多与产品或活动相关,这些问题可以基本上可以建模为知识图谱。在电子商务领域,商品数据和活动数据是两个非常重要的数据来源。此外,所有行业数据都存储在数据库中,可以查询和解答大多数用户的问题。如下图所示,对于知识图谱和问答模式的构建,客户的原始结构化数据、页面提取的半结构化数据、用户评论等非结构化数据是三大数据知识图谱的来源。构建知识图谱,结合知识图谱进行查询,并放入相应的存储引擎中。如果有些数据需要经常查询,也可以放到关系型数据库中。当收到用户请求时,可以进行句法分析,将句子转化为查询形式,也可以提取问题的核心部分进行查询。任务机器人对话交互系统是任务机器人的核心,包括语义理解、对话管理、文本生成等模块。下图是一个比较常见,也比较成熟的框架。语义理解可以细分为三个部分:领域分类、意图识别和槽值提取。首先,确定用户问题属于哪个领域,然后了解用户意图。).意图识别意图识别是一个非常重要的模块。如果意图识别失败或者错误,那么后面的整个交互就会显得很诡异。下图显示了意图识别的综合方案。该组合方案以基于参数模型的意图识别为主,基于上下文、规则和KNN的意图识别为辅。利用传统特征和深度模型特征,在标注数据的基础上融合模型,将模型视为分类器,输出属于某个意向场景。每个意图都有一个插槽值或感兴趣的参数。实体抽取主要是基于规则和序列标注的结合,如下图所示。规则方案适用于比较规则或封闭的集合,例如地址、邮箱地址、产品链接等数据。对于一些开放的集合,如果没有办法用规则来支持,可以使用序列标注的方法。情感分析也属于语义理解的范畴,比如用户的心情,是积极的还是消极的,有没有变化。对话管理对话状态管理本身就是一项非常复杂的任务。如果用户没有完全遵循交互设计过程,就会出现故意偏差。如下图所示,为对话交互设计了一个简单的流程。当用户提出的问题存在歧义时,在理解了意图反馈后,用户发起后续问题,超出了最初预测的范围。如何处理这些情况?在这里,将应用可配置的对话交互系统与终端用户进行智能交互。对话交互系统可以根据客户描述语言定义的对话进行配置,以支持所需的机器人。目前对话交互设计系统可以实现设计和实现的解耦。技术研发在完善对话交互系统的同时,导购/领域专家可以轻松配置定制化机器人。为什么推荐机器人需要个性化推荐?有两个原因。一是对话交互有利于信息的获取,不利于信息的展示。另一个是对话交互需要细粒度的个性化。在电商场景中,推荐机器人的使用在实际交互过程中占比非常大。在一些商店中,近20%的客户服务请求包含产品链接或推荐要求。与传统推荐系统相比,对话交互推荐系统可以结合更丰富的信息,这些信息实际存在于对话场景中,是显式反馈,并且可以更多地考虑上下文,例如:时间(早上,晚上/星期))、地点、心情、环境(经营情况)等。智能导购中的推荐方式一般可分为四种,即热门推荐、相关推荐、主动推荐和互动推荐。下面主要介绍相对复杂的交互式推荐方法。下图就是一个例子。以推荐奶粉为例,传统的推荐是根据用户画像,从所有SKU中选出最有可能卖出去的商品进行推荐。交互推荐是先推荐某个模型,然后再进行进一步的交流,双方的信息可以互通。这样,在用户了解商家信息的同时,商家也知道用户的喜好,减少信息不对称,弥补双方理解上的差异,更好地为用户服务。对于这部分内容,结合具体的例子,对交互式推荐的过程和建模进行了详细的说明。请点击(http://aix.51cto.com/activity/10015.html)观看。实际研发过程中的总结与思考对话机器人的领域非常广阔,很多新技术也在不断发展。在实际使用对话技术解决业务问题的过程中,你会遇到大大小小的问题。这里主要分享几点:一、产品设计vs技术边界。注重产品设计与技术边界的平衡,考虑如何在技术解决问题的同时,通过巧妙的产品设计和产品流程交互,降低技术要求,提升客户体验。第二,全自动VS人机协作。对于机器人,用户总是希望它的行为/能力能够与人类相媲美。在现实中,很难实现完全自动化。只有通过人机协作,才能给用户更好的体验。当需要全自动化时,需要引入交互式推荐的方式,让人机交互更加顺畅。第三,用户参与度与易于配置。客户参与机器人的配置,会有一种驯服机器人的成就感。但是在配置上要多考虑易用性,不能太繁琐,以免客户有恐惧感。第四,可控VS智能。在电商场景下,实际的商务对话系统是兼具可控性和智能化的。当它是可控的,当它是智能的时候,需要做出很多权衡。比如推荐的交互策略可以基于强化学习,越智能越好,但是对于整个对话系统策略、模块优化、仲裁逻辑、交互过程等环节,需要通过配置或者交互来实现更加可控设计。【原创稿件,合作网站转载请注明原作者和出处.com】【大佬来了第1期】新零售时代的智慧中台【大佬来了第2期】快狗打车的智能进化出租车道【大佬来了第3期】海量日志分析与智能运维【大佬来了第4期】数据驱动的产品决策与智能化【大佬来了第5期】大数据中心如何建设【大佬来了,第6期】面向交互的人工智能
