当前位置: 首页 > 科技赋能

百度联合赞助ICDAR2019,数百精英团队挑战高难度文字识别

时间:2024-05-20 02:00:06 科技赋能

由百度、马来亚大学、华南理工大学、巴塞罗那自治大学计算机视觉中心、中国图像与图像学会主办图形ICDAR LSVT(Large-scale Street View Text with Partial Labeling)和ICDAR Arbitrary-Shaped Text(任意形状文本)国际权威竞赛任务于5月圆满结束。

本次大赛共吸引了来自行业顶尖技术团队、高校及科研机构的队伍参赛,共提交了有效成绩。

经过两个月的激烈角逐,ICDARArtT大赛五个子任务的冠军分别被中科院(字符检测)、旷视科技(拉丁字符识别)、韩国NAVER(拉丁文和中文混合字符识别)夺得冠军)、北京航空航天大学(拉丁文本、拉丁中文混合端到端文本识别)的ICDAR LSVT竞赛文本检测和端到端文本识别任务冠军被腾讯团队获胜。

精英集结ICDAR的桂冠,吸引众多英雄为ICDAR争夺。

“鲁棒阅读大赛”竞赛是评价自然场景/网络图片/复杂视频文本提取和智能识别新技术进展的权威国际竞赛和评审标准。

许多学生在比赛中脱颖而出。

该方法不断推动行业新技术的创新和应用。

在ICDAR百度发布的两项具有挑战性的竞赛任务中,ICDARLSVT竞赛数据包括5万张精细标记街景图像和40万张弱标记街景图像,重点探索大规模数据场景下的深度学习文本。

确定能力的极限。

ICDARArt竞赛数据共6条,是业内最大的任意形状场景文本集合。

重点推动自然场景中任意形状文本检测识别能力的新突破。

来自工业界和学术界的顶尖团队充分发挥各自的技术优势,针对竞赛任务不断优化创新方案和算法效果。

激烈的比赛结果在大规模街道场景文本识别深度学习和任意形状文本检测识别技术方面展现出新的高度。

百度和学术界将持续维护大赛征集和榜单,为相关视觉AI技术领域的不断发展做出贡献。

图 1. ICDAR LSVT 竞赛结果示例:手动标注与算法效果。

图 2. ICDAR ArT 竞赛结果示例:人工标注与算法效果。

百度OCR功能强大,多场景应用实践丰富了本次ICDAR国际大赛的任务。

它标志着大规模街道场景深度学习文本识别和任意形状文本识别的发展。

这是一场学术交流和技术碰撞的盛宴。

在ICDAR国际大赛中,百度OCR承担了大赛主办方的角色,进一步增强了百度的国际影响力。

百度在2011年至2016年间多次荣获ICDAR、ICDAR、ICDAR MLT、ICDAR RCTW权威集合检测、识别、端到端任务榜单第一名,处于行业领先水平。

近两年,百度OCR还在CVPR、ICCV、BMVC、ACCV、ICDAR等会议上发表论文。

此次ICDAR有两部新作品被接受。

“具有在线跟踪的端到端视频文本检测器”致力于解决视频 OCR 检测问题,并将视频文本检测和在线跟踪任务有效地集成到统一且可训练的网络框架中。

“EATEN:Entity-aware Attention for Single Shot Visual Text Extraction”提出了一种端到端的结构化信息提取方法,并公开了结构化信息提取领域的大数据集合。

百度不仅致力于OCR技术领域的深入研究,也是“领先实用的AI视觉技术”的坚定践行者。

多年积累的实践经验,形成了丰富的百度OCR产品矩阵。

通用系列文字识别能力不仅可以高精度识别文字,还支持中、英、日、韩、法等十种语言的识别,以及置信度、位置等信息的返回;卡识别能力不仅支持身份证、银行卡、护照、名片等常见卡的识别,还支持卡片采集、分类、属性判断等能力;票据识别能力不仅支持全类别金融场景的识别,还支持金融、医疗等场景票据的识别;针对终端文字识别场景,百度领先的模型压缩技术应用于所有OCR终端产品。

OCR终端SDK??与多家手机厂商合作,赋予手机识字能力。

目前,百度OCR产品能力已超过50项,在各行业实现了多项技术突破和产品落地,涵盖金融、银行、医疗、政法、教育、交通、电商、快递等场景。

未来,百度将继续与各企业一起探索OCR的实施可能性,让OCR赋能更多企业。

同时,百度将继续秉持普惠的价值理念,在产业实践中不断打磨,持续赋能和服务客户??,持续打造领先公司。

而实用的人工智能技术利用科技的力量让复杂的世界变得更简单。