当前位置: 首页 > 科技观察

阿里巴巴达摩院文档AI首批通过信通院权威测评

时间:2023-03-21 01:15:07 科技观察

8月16日,信通院发布智能文档处理首轮测评结果人工智能峰会。阿里巴巴达摩院文档智能平台表现出色,成为国内首批获得“可信人工智能认证”的文档人工智能产品。DocumentAI可以识别和理解各种复杂的文档,例如票据、合同和表格。是业界公认的高难度技术之一。阿里巴巴达摩院构建了完整的技术栈,持续引领行业。中国信息通信研究院于2018年开始构建“可信人工智能”评价体系,逐步成为我国人工智能权威评价体系,涵盖产品服务能力、应用成熟度、可信度风险三大类。今年,中国信息通信研究院首次开展智能文档处理(IDP)测评。通过100多项关键指标综合评价,达摩院文档AI在技术能力、产品能力、应用能力等方面均获得最高5级评价,具有优异的性能。信通院指出,达摩院的文档AI功能完备,场景丰富,行业覆盖面广,准确率高,整体接受度高。据介绍,DocumentAI是OCR(光学字符识别)技术的进一步升级。传统OCR主要针对固定格式的文字识别,难以应对复杂情况。DocumentAI可以分析各种随机布局,识别文档中的层次和结构关系,甚至可以理解复杂的表格……由于任务的复杂性和多样性,DocumentAI需要将自然语言处理和计算机视觉深度融合,这一直是被业界公认为最难的技术之一。早在2019年,阿里达摩院率先提出基于图模型的多模态文档信息抽取方案,引领行业发展方向;目前已经构建了完整的文档AI技术栈,不仅包括文档核心处理技术,还包括底层的电子文档分析、OCR和自学习平台。同时达摩还在探索下一代文档智能技术,提出了多模态文档理解模型Bi-VLDoc。首次通过不同模态信号的交叉监督和不同模态的强制混合注意,实现了双向视觉语言。精确对齐,在业界四个具有代表性的文档理解数据集中实现了最佳模型性能(SOTA)。Bodhidharma在四个具有代表性的数据集上创建了一个新的SOTA。据了解,达摩文档AI支持对合同、票据、报表等各类文档内容进行自动识别、提取、分类、整合和校验,得到了广泛应用。在海关、法律、医疗、金融等行业,是企业数字化的重要支撑技术之一。以报关业务为例,已落地上海、宁波等5大口岸地区,让企业报关人员免去复杂的人工录入。相关系统运行两年多,累计处理报关单超过200万份,使报关企业效率提高3.5倍。此外,达摩院文档AI也应用于盲文识别,将盲文翻译成汉字和数字,并落地浙江盲校,助力普惠教育。AI自动生成报关单AI翻译盲文数学试卷据介绍,阿里巴巴持续关注包括文档AI在内的人工智能前沿研究。国际权威研究机构Gartner最新的《云AI开发者服务关键能力报告》报告显示,阿里巴巴在语言AI领域位居全球第二,是中国企业中最好的成绩。