AI行业技术与业务不断突破的背后,一个新业务已经露出端倪冰山一角。
在汽车、零售、家居、医疗等行业,越来越多的AI功能成为行业发展主流,随之而来的是AI引擎必须足够强大,才是AI行业的“新石油”数据。
质量提出了更高的要求。
欲望变成了一项巨大的生意。
但隐喻数据是“石油”而不是“空气”的原因很简单。
它需要数据标签公司进行“探索、收集、挖掘和处理”。
据Research And Markets报告显示,2017年全球数据标注市场价值6亿美元,预计到2018年将达到64.5亿美元,预计2018年至2018年将以32.54%的复合年增长率增长快速发展的数据标注市场未来将呈现“井喷”式增长。
目前,人工智能的商业化无论是算力还是算法都已经到了基本成熟的阶段。
为了更好地满足现实需求,解决行业特定痛点,算法训练的具体标注数据仍然必不可少,并且需要不断增加。
经过多年的发展,数据标注行业终于迎来了高速发展期,但其前景却并非一帆风顺。
仍有三座大山仍然是需要克服的挑战。
从微观角度看,市场的不断扩大意味着参与者更多、竞争更激烈。
由于进入门槛较低、对人力资源的过度依赖,该行业聚集了众多中小型数据服务商。
由于技术门槛的提高、人工智能企业需求的变化以及劳动力成本的增加,中小型数据服务商将面临越来越大的成本压力。
未来1-2年,行业或将迎来“洗牌期”。
随着商业落地速度加快,人工智能企业也对数据服务商提出了新的要求。
从需求来看,品质化、精细化、定制化场景越来越受欢迎。
;供给侧,技术实力、可控管理等带来了新的挑战。
短短四五年时间,数据标注行业经历了从诞生到混乱再到成型最后产业化的过程。
海量新需求与“告别小作坊” 初始数据标注的困难主要来自速度和质量两个方面。
然而,数据标注行业的特殊性决定了其对人力的依赖。
目前主流的标注方式是标注者工具利用标注工具完成分类、图像目标框选择、标注标注等。
由于标注者能力参差不齐,标注工具功能不完善,导致数据服务商存在不足注释效率和数据质量。
不过,也有一些领先的行业从业者通过加强工程技术研发和更加科学的流程管理,提升了“人机协作”能力。
通过辅助工具等。
此外,目前很多数据服务商忽视或没有人与机器协作的能力,也没有意识到AI产业对数据标注的相互影响。
例如,AI辅助工具不仅可以有效提高效率,还可以大大提高注释准确性。
从代表企业云测量数据的头部布局中,我们可以看到机制和工具的巨大作用。
在云检测数据标注平台的流程管理中,可以精准控制从创建任务、分配任务、标注流程到质检/抽检等步骤,实现数据标注过程的全流程控制。
数据注释后,将对其进行审查和质量检查。
检查、验收等不同环节确保数据准确。
此外,招标与评审分离、完善的风险管控机制、支持平台私有化部署,可以更好地提高数据标注的效率和准确性,从各个方面保证数据的隐私和安全。
2016年中国国际服务贸易交易会上,云测数据完成了“高精度数据标注”下“标注项目交付准确率最高达到99.99%”的领先成果发布。
这正是很多“小作坊”难以做到的。
,是推动数据标注行业意义从“AI产品培训”走向“AI产品落地”的里程碑事件。
更现实的例子是,为了提高OCR深度学习的效率,Testin云测试与英特尔共同进行探索,重点从基础设施平台和工具套件构建解决方案,利用软件加速和硬件支持。
优化OCR解决方案。
AI测试中的OCR识别时间从2秒缩短至0.3秒左右,实现了6倍的性能提升。
为此,云测数据也成为英特尔“AI Top 100”中的优秀企业。
随着AI能力的不断深入,数据标注也进入了广泛的应用场景。
包括自动驾驶、智能安防、新零售、人工智能教育、工业机器人、智慧农业等领域。
但不同的场景有不同的标注要求。
例如,自动驾驶行业主要集中在行人识别、车辆识别、红绿灯识别、道路识别等;安防行业主要集中在人脸识别、人脸检测、视觉搜索行为轨迹、关键点和车牌识别等。
事实上,AI行业的应用场景逐渐碎片化、长尾化,导致新兴垂直领域产生大量数据需求,比如疫情期间的口罩识别应用。
定制化的场景化服务和技术已成为数据标注产业的第二支柱。
因此,基于场景的数据采集成为关键。
云测量数据通过业界首个“场景实验室”解决了此类问题,让云测量数据进一步满足场景化数据需求,为人工智能技术应用到更多垂直场景发挥重要支撑作用。
这甚至为行业提供了新的参考模型。
第三座山需要通过提升技术研发能力来攻克。
纵观国内外人工智能数据服务厂商,各家公司在模式、技术、服务等方面都有各自的差异,但从人工智能的综合发展需求和服务厂商的情况来看,技术研发能力的发挥对提高效率和质量具有根本性作用。
配角作用是确立行业地位的关键一步。
一个比较现实的例子是,在云测量数据标注平台工具的设置中,一些标注对象属性的快速选择、标注对象的归档以及一些快捷键的使用;或 3D 点云数据注释中的“2D”。
\3D Fusion”、“自动拟合”等功能。
在“2D3D融合标注”中,可以将3D场景对应的2D图片显示在标注界面上,并且3D中的标注将与2D中的标注相对应,从而使得更精细标注、快速切框、辅助框、有效标注区域、预设框、自动贴合等一系列辅助功能,得益于其在人工智能数据领域的强大实力,可大幅提升标注效率和准确度。
服务方面,云测量数据在中国科学院主办、科学出版社主办、eNet研究院联合出版的核心杂志《年数据标注公司排行》中排名第一。
综上所述,数据标注行业的机会非常诱人。
但竞争和挑战也是艰难的,数据标注企业似乎正在进行一场“铁人三项”的竞争。
高精度数据标注、场景化数据采集、数据标注平台能力成为竞争的核心要素。
在可预见的行业转型时期,无论是大中型数据服务商都无法避免这种转型。
只有增强技术实力,不断更新迭代赖以生存的核心能力,才能在新时代的“掘金热潮”中脱颖而出。