当前位置: 首页 > 科技观察

中关村科进副总裁邓江:AI音视频技术在金融场景的实际应用

时间:2023-03-23 10:24:57 科技观察

传统金融行业面临运营效率低下、风险管控不力、获客成本高等痛点。通过金融与科技的融合解决传统业务的痛点难点,是当前金融业创新发展的重要支撑。日前,在中关村科进主办的AISummit全球人工智能技术大会上,中关村科进副总裁邓江发表了主题演讲《AI音视频技术在金融场景下的应用实操》,从三个层面介绍了音视频科技与金融的技术应用应用、技术、功能和价值与思考。三年来,疫情对整个经济社会造成了较大影响。严重依赖线下场景的金融业务也不例外。AI音视频技术在金融场景的应用在过去几年的疫情背景下,金融业务受到了较大的影响。国家也出台了一系列促进非接触金融发展的管理措施。在新环境要求和新技术驱动下,传统人工驱动服务模式(线下人工驱动服务模式)迭代为AI驱动智能服务模式(线上+线下全渠道人机系统服务)模式)。在传统的人工服务模式下,只能实现线下面对面、文字、电话语音、音视频等服务模式。在AI驱动下,可实现智能/无人网点、智能客服、智能IVR/外呼、AI智能视频、AI虚拟员工等业务。为实现远程银行,邓江表示,推动整个技术进步的核心技术有五项。五项核心技术包括人工智能技术、实时计算、生物识别与身份验证、数据决策数据计算、隐私保护。在落地过程中,有3个核心算法和4个核心技术能力,这是技术落地过程中的另外两个技术需求。人工智能三大核心算法:语音技术、自然语言处理、机器视觉。四大核心技术能力:全渠道优质音视频传播能力、全渠道SDK封装适配能力、基于音视频的AI算法深度融合应用能力、灵活可视化的视频业务场景编排能力。在金融场景下,智能视频云建设的技术实践邓江表示,智能视频云是推动基础视频数字化升级的一种方式,利用AI智能和RPA流程自动化构建“人机协同,人机自律”。-help”视频一种新的服务模式。在基础云计算资源的支持下,底层建设支持高并发、快速响应的音视频平台,包括ASR、TTS、NLP、OCR、人脸识别、防复制、活体检测等。业务中心,实现客户流程管理、高并发智能排队、相关信息统计分析、订单管理等一系列中台支持。在前端,除了支持多终端介入,一系列针对假冒身份的多模态生物特征验证、客户端自助服务和客服的远程视频、现场实时计算和抓取等。视频。前端就是业务场景端,比如理财、保险、信托等一系列业务对应的一系列线上线下相关流程。依托强大的底层基础,形成了五大核心产品:多模态身份验证、AI视频直播服务、AI自助视频服务、AI远程视频服务、AI智能音视频质检。还介绍了艾视云的视频服务体系,拆解了产品体系,介绍了产品特性、流程管理和产品价值。AI音视频技术在金融场景的应用——移动信贷传统金融信贷面签存在六大难点:面对信息孤岛,面签数据独立于风控系统,其动态数据价值没有得到充分利用;全手动驱动方式,质量高度依赖人员经验,参差不齐;业务效率低,无智能或弱智能辅助,基层压力大,效率低;展会渠道单一,现场面对面采访模式,覆盖难度大,成本高;业务量瓶颈,业务波峰波谷,动态扩展匹配差;人工抽样检验有风险,人工离线抽样复核,潜在风险大,反馈不及时,人员工作压力大。邓江介绍了面签的难点后,从政策层面解读了银保监会发布的四大行业《通知》。邓江表示,留下音像痕迹已经成为银行、信托、保险、证券等行业的强制性规定。邓江先生在演讲中分享了移动信贷的四种场景:远程视频面签、自助视频面签、客户经理面签、分行柜台现场当面签约。防伪方向的实践成果,即多模态生物防伪安全平台。多模态生物防伪安全平台支持动作、读数等多种活体检测方式,利用服务器端强大的AI算法,提供更精准的识别和防欺诈能力。平台分为四层,由接入层、核心层、功能层和场景层组成。接入层由微信小程序、APP、手机H5、Web、相机接口、第三方系统组成。核心层具有活体伪造、欺诈检测和生物比对三大功能模块。在直播防伪功能部分,由基础的、增强的防伪检测和行为风险检测组成。基础防伪检测包括人脸呈现攻击、声纹呈现攻击、链接劫持检测;增强的防伪检测包括音色迁移合成检测、深度伪造检测;行为风险监测包括人脸姿态检测、唇语识别、音视频同步检测、遮挡语义分割等。欺诈检测包括身份证伪造检测、签名伪造检测、人像背景相似度检测和声纹组检测。生物比对包括对抗样本强化学习、声纹比对检索、人脸比对检索。功能层包括验证能力评估、行为风险评估、策略管理、第三方数据接入、联邦学习、主动攻击拦截、加密存储、无感注册、无感记录、无感刷新、生命周期管理、安全审计等12一个模块实现了这个功能。场景层包含的业务场景包括多维实名认证、授信、员工合规监管、中介代理检测、电子审查团伙发现、CC投诉调查、办公桌面安全、大客户接入等。在对多模态生物防伪平台进行深入分析后,阐述了AI智能音视频质检+人工抽查审核的平台功能。借助AI视觉和语音质检技术,对视频业务进行实时质检和实时纠错(文字纠错、语音纠错),实时提醒用户和业务管理者,大幅提高一次通过率,避免二次补录成本高、用户体验差的问题。涉及的主要技术包括智能图像识别、智能生物特征识别、智能语音识别、智能动作识别、音视频同步检测等。在引入智能催收和智能回访时,智能催收可以实现全自动化催收作业和拟人交流;可针对不同逾期阶段、客户类型灵活定制演讲技巧;规范的语音流可以避免人工采集和不规范的语音合规风险和投诉。智能回访,呼叫效率高;通过后台统计了解客户到达率;在不影响客户体验的情况下充满热情;降低成本,提高效率。在分析了AI智能视频云的功能和相关技术之后,进行了AI智能视频云的相关案例分享。案例详情请参考官网视频回放。结论在AI音视频技术中,无论是人脸、声纹、唇语、语音合成等,场景中都有深度的场景定制。作为一家科技公司,除了打磨技术能力,更多的是深入业务场景,以客户为中心,了解客户需求,解决客户业务中真正的痛点,能够用好工具。这就是技术的未来。公司要求更高。最后,通过技术在金融场景的深入应用,提升整个金融业务的水平,拓宽整个金融业务的规模发展边界。大会演讲回放及PPT上线,进入官网查看精彩内容-->AISummit全球人工智能技术大会官网

猜你喜欢