当前位置: 首页 > 科技观察

宜人贷-宜人蜂巢金融科技AI实践:蜂巢机器人

时间:2023-03-21 00:09:36 科技观察

1.Fintech金融科技:Fintech就是业界所说的Fintech。维基百科给出的定义是由一群通过科技让金融服务更有效率的公司组成的经济产业。金融科技不是简单地在互联网上做金融,而是基于移动互联网、云计算、大数据等技术,实现金融服务和产品的发展、创新和效率提升。简而言之,金融科技被理解为:利用包括人工智能、征信、区块链、云计算、大数据、移动互联网等在内的前沿科技手段,服务于提升金融效率的行业。在金融科技浪潮中,悦蜂巢不仅拥有扎实的技术基础,还构建了一站式智能风控服务体系,推出了多款风控产品。2、蜂巢机器人宜人的蜂巢团队于2018年正式推出蜂巢机器人。蜂巢机器人是一款智能语音对话机器人产品,是人工智能技术的一个重要分支。蜂巢机器人涉及大数据技术、云计算和人工智能技术。主要应用于智能收款、智能客户领域。以多种功能直击行业痛点,帮助企业有效提升转化率。蜂巢机器人的主要功能有:全自动拨号:批量上传案例数据,一键启动群呼计划。按需设置,自动拨号和重播。全人原声对话:定制化语音交互设计,各行业专业对话智能原声交流,非感知人机对话,对话更贴近真实,更流畅。机转人工坐席:自定义意向客户规则,通话过程中满足条件自动触发,无感知转人工坐席,实时推送通话聊天记录,实现人机无缝衔接机器切换。支持对话打断:智能识别用户的打断意图,完成用户的打断记录行为,高度模拟真实对话场景。客户标签分类:呼叫完成转人工时,对数据进行精准分析管理,自动标记筛选客户类型,方便人工及时跟进意向客户。预测最佳通话时间:决策模型根据客户的历史通话接通情况,确定客户的最佳通话时间,尽量在最佳时间联系客户,提高客户联系率和满意度,提高还款效率。通话全程录音:外呼全程录音,数据统计,客户打标,查询试听,语音转文字,客户信息安全有保障。基于大数据的精准用户画像:根据客户贷前、贷中、贷后的表现,区分和拆分不同金额和风险等级的客户。基于客户类型的划分是根据不同的催收方式、催收频率、催收口语技能,在短信、信件、微信、催收机器人等多渠道催收方式中提供催收策略决策依据。蜂巢机器人是一款全面高效的智能语音对话机器人产品。在工程架构方面:整体框架采用微服务框架,高度解耦;每个服务都是分布式开发和部署的,避免单点故障。系统瘫痪;为了存储大量数据,系统采用了结构化数据库和分布式非结构化数据库相结合的方式。在算法方面:语言识别、对话系统、语音合成等模块使用了声学模型、自然语言处理(NLP)、深度学习等人工智能技术。蜂窝机器人总体框架如下图1所示:图1:蜂窝机器人总体框架本文主要从算法上介绍蜂窝机器人主要使用的技术和方法。在整个蜂巢机器人中,机器学习、深度学习等技术出现在每一个环节。其实:整个蜂巢机器人的流程可以分为语音识别(ASR)、语义理解(NLU)、对话管理(DM)和语音合成(TTS)。如图2所示:图2:蜂巢机器人主要流程电话通道将用户的语音实时传输给ASR模块,ASR将用户的语音转化为文本,再由NLU模块进行文本理解,识别出用户的真实意图;有了用户的意图,与用户展开对话,通过多轮对话更清楚地了解用户的意图。这时就需要对话管理模块的对话状态管理和对话策略制定;***,机器人做***反馈,反馈是文本Responsesentence,语音合成将反馈文本转化为语音,播放给用户。至此,机器人已经完成了与用户的多轮对话,同时完成了特定的业务目标。它了解用户并同时提供正确的服务。整个环节环环相扣,承前启后,下面将详细介绍:1.自动语音识别:语音识别是一种广义的自然语言处理技术。语音识别的输入是随时间播放的信号序列,输出是文本序列。将语音实时转换为人机都能理解的文本,是人机交互的第一步,也是最重要的一步。一个完整的语音识别系统通常包括信息处理与特征提取、声学模型、语言模型、解码搜索四个模块,如下图3所示:图3:语音识别系统的主要流程处于语音预处理阶段.信号处理的主要工作是剔除无声片段、分离混叠音轨、消除噪声和声道增强;在特征提取阶段,主要采用MFCC特征提取方法和基于深度学习的特征表示方法,获得语音的特征提取,形成机器可识别的数值数据。传统的声学模型主要有高斯混合模型(GMM)和隐马尔可夫模型(HMM)。随着深度学习的成熟,基于深度学习的声学模型也得到了应用(例如:DNN-HMM混合模型、TDNN模型和DFCNN模型),效果也得到了提升。***端到端(END2END)语音识别处理系统也是研究热点。2、中文文本纠错:语音识别转换后的文本是后续流程处理的主要信息。然而,语音识别的准确性不可能是完美的。这种系统级联的不确定性会严重影响系统的准确性。为此,中文文本纠错是十分必要的。ASR之后的文本纠错主要集中在谐音词的纠错(pairingeyes-pairingglasses)和易混淆词的纠错(织女-牛郎织女)。蜂巢机器人采用人工规则、N-gram模型、拼音相似度、同义词搭配等方法纠正拼音正确但识别错误和背景噪声导致的语音识别句子主体部分的识别错误,以及语义关联错误。双向LSTM检查用于更好地解决此类多义句子的语义错误。3、自然语言理解(NLU):NLU主要理解ASR转换后的文本,同时结合用户画像等数据挖掘用户此时的真实意图。该模块的三大功能是:领域识别、意图识别和槽位提取(如图4所示)。图4:意图识别示例NLU是将文本规范化为机器可以理解的语义表示。NLU可以通过语义解析或语义标注得到,也可以分解成多个分类任务来解决。在蜂巢机器人的NLU部分,在冷启动阶段,采用了基于正则表达式的规则方法和无监督学习的句子相似度方法。随着数据的积累和数据标注,分类算法被用于用户领域识别和意图识别,如机器学习中的SVM,深度学习中的CNN和RNN。槽位提取实际上是通过学习一系列标签序列数据来预测一个新的标签序列。是一个序列标签问题,主要方法是BLSTM+CRF。由于意图和槽具有很强的相关性,我们尝试使用同一个网络来完成意图识别和槽提取。4.对话管理(DM):用户需求复杂,单轮对话无法捕捉到用户的真实意图。通过对话管理,可以实现用户与机器人的多轮对话,机器人可以通过询问、澄清、确认等方式进行回应。获取更多用户信息,帮助用户明确需求。对话管理的主要任务是维护用户与机器人的对话状态,并与知识库产生信息交互,从而选择下一个最佳动作。蜂巢机器人早期采用基于议程的对话管理,使用图数据库存储词的内容和关系,层次清晰有序,使得整个用户与机器人的对话本质上是一个树的遍历,并且比较容易支持主题切换、回滚和退出。随着场景数量的增加,用户的实际需求变得多样化,部分问题的多样性使得基于议程的对话管理变得过于复杂和难以管理。因此,通过将基于议程的对话管理和基于时隙的对话管理相结合,在正常的业务流程中使用基于议程的对话管理;在查询业务问题时,采用填槽对话管理,整个对话过程是一个连续的填槽过程。整个时隙信息的获取就是NLU阶段的信息输出。在对话管理中,语音技术的管理利用了分布式图数据库,同时利用图遍历技术寻找下一个节点和***问题检索的相似度排序。5、语音合成(TTS):语音合成模块是蜂巢机器人的重要模块。语音合成就是将搜索到的语音脚本文本转换成语音音频,通过电话通道播放给用户。语音音频主要解决语音和语气两大问题:清晰的语音解决用户能否听清楚机器人的声音,语气主要是让机器人更像一个有情感的真人。蜂巢机器人在语音合成阶段采用拼接的方法,根据机器人的主旨文本在语音库中寻找语言特征和声学特征相似的音素。在实际业务中,有些词是有参数变量的,随着用户自身信息的变化而变化,所以通过拼接贴贴的方式很容易解决这个问题。语音拼接方式虽然听起来很自然,但在前期的录音和裁剪过程中需要大量的劳动,系统扩展性差。后期计划利用建立基于参数的语音合成系统,其实就是将文本抽象成语音特征,然后利用统计模型学习语音特征与其声学特征的对应关系,然后从预测的声学特征。恢复到音频的过程。该技术主要基于统计模型完成,是现阶段主流的深度学习模型。三、未来展望蜂巢机器人全链路设计融合了大数据、云计算、人工智能等诸多前沿技术,尤其是在某些领域,还没有完美的解决方案。蜂巢机器人作为AI技术的践行者,有以下展望:ASR:为了更好的提高语音识别的准确率,识别更复杂的对话场景,需要做好降噪和多通道识别.为了更适合业务,需要增加男女语音识别、方言识别、领域词汇识别。在语义理解方面:尝试更好的算法来提高意图识别和槽位信息提取的准确性。在对话管理方面:集成各种对话管理框架,最终实现机器人的端到端学习,并通过增强学习等方法让机器人大脑更加智能。TTS方面:构建基于深度学习的语音合成系统,可以合成带有情感的语音音频,变得更有节奏感。【本文为栏目机构易新科技原创文章,微信公众号“易新科技(id:CE_TECH)”点击此处查看作者更多好文

猜你喜欢