人工智能应用的6大关键技术,终于有人解释清楚了运行在互联网上的技术,按照规则自动执行相应的流程任务,代替或辅助人类完成相关的计算机操作。与人们通常认为的具有机械实体的“机器人”不同,RPA本质上是一种可以根据特定指令完成工作的软件。该软件安装在个人电脑或大型服务器上,模拟键盘、鼠标等手动操作。使办公室操作自动化。▲图1-1RPA是未来办公创新发展的趋势(GUI),它模拟和增强了人与计算机的交互过程,从而可以辅助执行过去只有人类才能完成的任务,或作为人工高强度工作的补充。2015年以来,人工智能技术与RPA同时发展和完善,恰恰相辅相成,汇聚一堂。自然地,RPA和AI的结合带来了非常独特的智能应用发展趋势,我们称之为智能RPA技术,或者IPA技术(IntelligentProcessingAutomation),即智能过程自动化技术(如图1-2).▲图1-2智能RPA的构成:RPA+AI=IPA也就是说,RPA是基础,需要与其他技术手段相结合才能实现IPA及其优势。企业界对过程自动化功能的期望将与日俱增。将机器学习等人工智能技术应用于RPA,将人工智能功能融入产品套件,提供更多种类的自动化功能,已成为未来RPA发展的主流趋势。.02光学字符识别(OpticalCharacterRecognition,OCR)OCR技术是指利用电子设备(如扫描仪或数码相机)将纸质文档中的文字转换成黑白点阵图像文件,并通过识别软件识别convertthetextintheimage将文字转换为文字格式,以供文字处理软件进一步编辑处理的技术。通俗地说,就是一种扫描文本素材,然后对图像文件进行分析处理,获取文本和版面信息的技术。OCR技术大致可以分为五个阶段,如图3-1所示。▲图3-1OCR技术的五个阶段下面详细介绍OCR识别过程。1.图像处理纠正图像的成像问题。常见的图像预处理过程包括:几何变换(透视、畸变、旋转等)、畸变校正、去模糊、图像增强和光照校正、二值化等。2.文本检测检测文本的位置、范围和布局,通常包括布局分析和文本行检测。文字检测主要解决的问题是哪里有文字,文字有多大。文本检测中使用的处理算法一般包括:Faster-RCNN、Mask-RCNN、FPN、PANet、Unet、IoUNet、YOLO、SSD。3、文字识别在文字检测的基础上,对文字内容进行识别,将图像中的文字信息转化为计算机可以识别和处理的文字信息。文字识别要解决的主要问题是每个文字是什么。文本识别中常用的处理算法有:CRNN、AttentionOCR、RNNLM、BERT。4.文本提取从文本识别结果中提取需要的字段或元素。文本抽取中常用的处理算法有:CRF、HMM、HAN、DPCNN、BiLSTM+CRF、BERT+CRF、Regex。5.输出输出最终的文字识别结果或文字提取结果。03机器学习/大数据分析机器学习/大数据分析是一种设计复杂模型和算法以实现预测功能的方法,即计算机具有学习能力,而不是依赖于预先编写的代码。它能够根据对现有结构化数据的观察在结构化数据中自我识别模式,并使用它来输出对未来结果的预测。机器学习是一种算法,用于通过“监督”和“非监督”学习识别结构化数据(例如日常表现数据)中的模式。监督算法是一种在根据自己的输入进行预测之前从输入和输出的结构化数据集中学习的算法。无监督算法是那些观察结构化数据并提供对已识别模式的相关见解的算法。机器学习和高级分析可以改变保险公司的游戏规则,例如,在提高合规性、降低成本结构以及从新见解中获得竞争优势方面。领先的人力资源部门已经广泛使用高级分析来识别和评估领导者和管理人员的核心素质,以便更好地预测行为、规划职业道路和下一个领导职位。04NaturalLanguageGeneration(NLG)计算机具有与人类相同的表达和书写能力。它遵循一定的规则,将从数据中观察到的信息转换成高质量的自然语言文本。例如,自动识别会议邮件中的主题、数字地名、人名和地址并生成日程备忘录,或识别合同条款的重点内容并生成摘要重点列表。自然语言生成和自然语言处理的详细介绍,请阅读《详解自然语言处理(NLP)5大语义分析技术及14类应用(建议收藏) 》05SmartWorkflow(智能工作流)端到端流程的实时状态,便于管理不同组之间的切换,包括机器人和人类用户之间的切换,同时还提供瓶颈阶段的统计。随着社会和科技的不断进步,各个领域都在逐渐向自动化、智能化方向发展。工作流相关技术的研究也越来越受到重视,并广泛应用于制造、软件开发、银行金融、生物医学等不同领域。工作流不仅可以自动处理相关活动和任务,减少人机交互过程中潜在的错误,还可以细化每个处理步骤,最大限度地提高生产效率,将工作流应用到动态、多变、灵活的应用场景中。近年来,在大数据和人工智能的背景下,工作流中的业务流程变得越来越复杂,其所面临的环境和数据也越来越复杂。需求分析引起的业务流程重塑或维护升级引起的流程模式变更和改进也越来越频繁。在这样一个动态复杂的环境中,如何快速识别任务,进而快速、高效、有针对性地处理工作流问题,成为当前工作流任务研究的关键问题。RPA软件机器人在工作过程中会遇到很多类似的情况。工作流的复杂性和多变性会导致RPA作业流程的复杂性和多变性,使其无法实现自适应,极大地影响RPA软件机器人的作业效率。因此,需要利用智能工作流技术动态调整RPA中的任务设置,以及RPA业务流程的自动变更和自动升级,实现智能工作流指导下的自适应运行模式。实现智能工作流的方式有很多种。例如,美国J.H.Holland教授提出的基于遗传算法的工作流调度,PandeyS等人提出的基于粒子群优化算法的启发式算法(PSO)。可用于不同资源的智能调度。此外,还有许多基于自然界和仿生学的智能算法,如混合蛙跳算法、布谷鸟搜索算法、蝙蝠算法、人工蜂群算法等。目前比较普遍的方法是实现基于智能规划的工作流处理模式。这种模式不再简单地将不同的活动视为互不影响的单独事件,而是有针对性地考虑多个事件的共性。影响。该模型充分考虑了工作流与智能规划的相似性,通过智能规划推导出不同工作流任务之间的内在逻辑关系,并从其他渠道和外部信息中充分挖掘潜在关系。逐步改进传统工作流程存在的问题,采用智能规划的新手段,从表面动作中挖掘潜在信息,过滤噪音数据,进而实现流程的自动修正,最后通过上面得出的结论,有针对性地进行修改以往RPA操作流程,实现自适应操作方式和操作流程。06CognitiveAgent(认知代理)CognitiveAgent是一种结合了机器学习和自然语言生成的技术,并在此基础上加入情绪检测功能,做出判断和分析,从而执行任务和交流,从数据集中学习,甚至根据情绪检测结果做出决定。也就是说,机器会像人一样产生“情感共鸣和精神共鸣”,真正成为完全虚拟的劳动力(或智能体)。在客户服务领域,英国一家汽车保险公司通过使用认知代理技术,将客户转化率提高了22%,验证错误率降低了40%,整体投资回报率达到了330%。当然,德勤、安永等咨询公司也坦言,从现阶段很多企业的流程管理和系统基础能力来看,还有很多基础设施建设工作需要开展。创建智能过程自动化所需的一些核心技术(如认知代理等)仍处于起步阶段。智能包括三个方面,即计算智能、感知智能和认知智能。在计算智能方面,计算机的速度早已远超人类的效率。在感知智能方面,随着OCR、NLP等技术的发展,已经取得了很多效果。但在认知智能方面,即使在某些特定领域,自然语言处理已经可以取得比人工智能更好的效果,但在某些领域,尤其是在知识理解、知识推理、知识判断等方面,还有很多需要逐步积累,逐步完善的地方。根据机器能否产生自我认知和机器人的应用范围,人工智能分为弱人工智能和强人工智能。其中,弱人工智能中的机器没有自我意识,不具备真正的推理和独立解决问题的能力,通常只适合在特定条件下解决特定问题。目前人工智能的研究主要集中在弱人工智能领域。在强人工智能方面,机器具有一定的自我意识,可以通过学习扩展自己的功能。对于目前没有的功能或目前不了解的知识,可以通过自学获得。在当前条件下,综合强人工智能还面临技术能力、社会伦理等诸多挑战。但在某些领域的特定场景下,具有认知智能和学习能力的人工智能软件,不仅可以优化操作流程,快速响应,覆盖更多不同情况,同时最大程度规避技术风险和应用风险,是一个非常有价值的研究方向。认知智能有多种定义。其中,复旦大学肖扬华教授曾提到,所谓机器的认知智能,就是让机器能够像人一样思考,这种思考能力具体体现在以下几个方面。首先,机器有能力理解数据,理解语言,进而理解现实世界。其次,机器具有解释数据、解释过程、进而解释现象的能力。第三,机器具有推理、计划等一系列人类特有的认知能力,这意味着认知智能需要解决推理、计划、联想、创造等一系列复杂的任务。Agent是指驻留在一定环境中,能够持续自主运行,具有驻留性、反应性、社会性、主动性等特征的计算实体。根据著名人工智能学者、美国斯坦福大学Hayes-Roth教授的理论,“智能体可以连续执行三种功能:感知环境中的动态情况、执行影响环境的动作、推理解释感知到的信息,解决问题并决定行动”。从前面的定义可以看出,认知主体可以感知环境中的动态情况,然后根据这些情况执行相应的动作来影响现有环境。问题并确定下一步。将认知代理与RPA相结合,我们可以得到一个具有认知智能的机器人,它可以根据应用系统和涉及的其他环境的变化动态感知下一步需要做什么,同时执行相应的动作来影响相应的环境信息实现智能输入、智能监控、智能文档处理和辅助判断。同时,认知代理可以在通过RPA技术处理业务的同时学习相关经验和知识,逐步掌握识别关键点的能力。对认知主体的研究包括多种不同的方法。近年来,随着分布式人工智能、信息科学和网络科学的不断发展,动态环境下的分布式协同决策成为认知主体的一个重要方面。重要的研究方法。该方法已广泛应用于以多无人机系统和多机器人系统为代表的典型分散式多智能体系统。同时,受限于自身设计,智能体往往将信息的部分可观察特征呈现给环境和系统,智能体之间有限的交互和外部约束也使得获取全局信息的成本非常高。成本。同时,去中心化多智能体系统在应用中呈现出类似于社交网络的自组织结构和相应的复杂网络特征,即网络中的单个智能体通常只能与网络中的小群体进行连接/交互。本地网络。对于一些代理人来说,传统的中心化协作模式已经不适用了。此外,类似于社交网络中人与人之间有限的信息交流,可以大大提高个人的决策效率。能否将同样的方法应用到相应的研究中,也在不断的尝试中。
