当前位置: 首页 > 科技观察

阿里是如何在一分钟内打造出一个会说话的机器人的?

时间:2023-03-19 22:26:45 科技观察

阿里妹导读:面对2020年突如其来的新冠疫情,14亿人心系家人、心系国家共度难关。阿里人更是“这一刻,只有我”,用科技的力量,聚沙成塔,守护万千家庭。你可能在钉钉群里看到过一个叫“抗疫精灵”的小机器人,准时准时播报全国新冠肺炎的实时公共疫情数据;解答你关心的各种问题,防疫知识、在线问诊、社区附近确诊病例、发热门诊分布等,更神奇的是,“防疫精灵”只用了一个下午机器人从创意到钉钉上线,累计服务至少500万钉钉用户。这看似“不可能”的背后,是机器人工厂,强大的智能对话机器人孵化平台,以其成熟的NLP算法能力和QA问答能力,让一切成为可能。什么是机器人工厂?2016年以来,全球进入“Chatbot时代”,科技行业巨头也相继发布了自己在Chatbot领域的相关产品,如苹果Siri、微软小冰、百度小度、阿里旗下天猫精灵等。对话机器人的出现,带来了用户与计算机交互方式的改变,从一系列以计算机为中心的有序操作指令,转变为以用户为中心的自然语言对话式AI。机器人工厂是在“会话AI优先”浪潮中兴起的Chatbot智能机器人孵化平台。有了机器人工厂,任何人都可以在一分钟内打造出专属的对话机器人,不懂NLP技术或不会编程的各种问题都不存在!机器人工厂的整体架构如下图所示,下面将围绕产品场景和核心竞争力做详细介绍。适用于哪些产品场景?机器人工厂的应用场景主要分为三类:答疑、作业、运维。AI+智能问答是三种场景中最常见的。用户在查询商家产品和员工查询公司规章制度时,总会有大量常见的、重复的问题需要回答。这些常见问题被提取并整理成问答对,存放在机器人工厂平台上。答题机器人可以帮您解答大部分问题,省时省力,降低人工成本。例如:机器人工厂为云栖大会提供了会议引导机器人。AI+内容场景运营场景,主要通过机器人统一精准快速触达所有用户。比如,小明经营着100个来自世界各地的商家群。他只需要机器人工厂配置一次消息内容和发送时间,就可以准时到达100个商户群。轻松解决100次人工操作的低效和时延问题。AI+日常运维运维场景如虎添翼。机器人不仅可以回答问题,还可以执行命令。比如你在阿里云上买了一台服务器,运行一些任务,你可以让机器人帮你查询任务执行的状态,发现异常,终止任务等等。“用户提问——理解指令——调用服务(执行指令)——返回答案”是运维场景的环节。还有更多新奇的玩法,比如结合语音转文字技术,与阿里云通信、菜鸟驿站合作打造智能外呼机器人。问卷调查、电话回访、上门服务确认是否在家等场景都可以由机器人完成,而且机器人一天可以拨打的电话数量是机器人的数倍。核心竞争力是什么?介绍了这么多,大家应该对机器人工厂能做什么有一些基本的了解了。下面就为大家介绍一下机器人工厂的核心能力以及玩法。智能问答智能对话机器人的看家本领就是QA问答。意图和实体是两个最基本的概念。意图由三部分组成:用户输入、动作和响应。其中,用户输入定义了用户的问题;响应定义相应的答案;action是可选的,定义了一系列理解用户意图后需要执行的指令。实体作用于用户输入,从用户输入中提取结构化信息,高效解决大量相似意图匹配场景的问题。例如,“2020年3月8日杭州天气怎么样?”杭州可以提取为枚举实体,2020-03-08可以提取为常规实体,动作可以定义为调用基于城市和时间服务的天气查询,最后响应天气信息。上面的例子说明QA问答首先要做到对用户意图的精准理解。机器人工厂底层有一套完整的算法框架。传统的机器学习算法与基于深度神经网络的自然语言处理算法相结合。离线特征提取模型训练与在线实时预测相结合。纯文本FAQ意图匹配与基于实体槽的意图匹配相结合,提高了意图匹配的准确性。这里就不细说了,以后会有专门的文章介绍。语料库管理会话机器人的智能程度在一定程度上取决于它理解的语料库的丰富程度。但大部分知识是以非结构化文本的形式沉积的,而不是会话机器人可以理解的有意问答的形式。那么,新创建的会话机器人如何快速构建具有智能问答能力的语料库呢?机器人工厂提供三种方式解决冷启动问题,在单个机器人应用内,通过语料爬取(自动化)和批量导入(手动)和预置Intent(系统通用语料)丰富语料;实现多个应用(应用程序集)之间的语料库共享。语料库爬取语料库爬取是指将用户已有的非结构化知识库或文档,通过机器阅读和理解能力,自动提取并整理成对话机器人可以理解的问答对形式。语料库爬取不仅可以代替人工输入快速丰富对话机器人的语料库,还可以大大降低知识库对接机器人工厂的迁移成本。目前,机器人工厂平台上80%的语料都是通过语料爬取生成的。此外,还支持手动批量导入excel或json格式的语料,自动生成意图。预设意图预设意图是机器人工厂将用户高频、常见的场景下沉到平台层面,赋能机器人全平台应用,增强QA问答能力。比如八卦、查天气、查值班等,用户只需要在平台上打勾,就可以让自己的机器人具备回答这些问题的能力。语料库共享语料库共享是指在不同的对话机器人之间重复使用语料库的能力。比如所有银泰百货的会员手册都是一样的,只是不同的店有不同的折扣促销。机器人工厂支持创建通用通用语料的机器人A,也支持创建不同语料的机器人,但是大家共享和复用机器人A的语料。语料共享可以提高语料的复用率,让用户专注更多关于差异化的部分。上面在线编程中提到,意图由“用户输入-动作-响应”三部分组成,其中动作定义了理解用户意图后需要执行的一系列指令。通常一个动作通过HTTP请求调用一个用户定义的服务。但是发现经常会遇到以下问题:如果用户已有服务接口,服务格式不匹配;机器人工厂特殊的处理逻辑与业务逻辑等问题强耦合。如果用户没有服务接口,需要开发、部署、联调、发布等一系列流程,也会遇到机器、网络、环境等问题。如果在线验证失败,则需要重复上述步骤。添加一些时间敏感的临时功能需要牵一发而动全身。为了解决以上问题,机器人工厂与阿里云计算平台在线开发平台AppStudio合作,开发了基于AppStudio的在线服务开发IDE,为用户提供云端在线编程平台,助您连接与下游服务实现数据查询、命令执行、知识库检索、内容推荐等功能。它可以为您提供:灵活性:支持在线编程、自定义业务逻辑、安全验证等,与业务系统本身解耦;开放性:可以引入依赖SDK,支持odps、hsf等服务;简单性:封装了基础类和openApi,方便开发;即时性:不依赖于任何发布系统,变更生效;共享:支持协同编辑开发,代码共享;调试:支持在线调试、业务测试等功能;机器人工厂,未来已来经过阿里巴巴集团内部2年的研发打磨,孵化了20000+机器人,服务440000+用户。连续两年参加云栖大会,让我们感受到了用户对智能机器人的强烈诉求。2020年,机器人工厂正式发布公有云版本。最后展示机器人工厂为飞天大数据开发平台DataWorks打造的一键问答机器人demo。