野子电竞数据官网改版https://www.xxe.io/全新登场人工智能行业。很快我们就会发现,数据的采集、整理、清洗、标注,交给AI公司进行模型训练,已经成为一条顺畅运转的产业链。长期以来,数据服务一直处于粗糙原始的状态,甚至有“数据农场”的说法:数据服务从业者从各种公共数据集或移动互联网产品中获取数据,雇佣大量廉价劳动力来几乎零门槛做简单的清洗和标注工作,比如在一张照片中勾出哪里是天,哪里是地。最后将这些粗加工后的数据放入神经网络的黑匣子中。但是现在,我们看到这种情况正在发生变化。AI企业在数据应用需求上逐渐开始分化。以往粗放的加工方式已经不能满足他们的需求。奔腾至静,让泥沙沉淀,让清流涌上来。这一次,我们采访了云策数据总经理贾宇航,听他聊聊他眼中的数据服务。风起云涌的数据服务战场 如果说数据是AI的养料,那么养料的营养含量自然决定了AI的强弱。算法模型的准确性、对不同环境的适应性如何等等,几乎都来自于原始数据的积累。首先要改变的是AI行业。据清华大学发布的《2018年中国人工智能发展报告》,去年中国人工智能产业市场规模达到237亿元,同比增长67%。预计2019年中国人工智能产业增速将高达75%。产业规模的爆发式增长,意味着竞争将更加激烈。面对这种竞争,AI企业对数据的需求必然发生变化。比如在风起云涌的数据服务战场上,企业渴望更精细化、定制化的数据。真实场景的环境总是比实验室里的想法复杂。要提供更具接地气和差异化优势的模式,仅仅依靠基于移动互联网数据或众包用户数据收集的数据显然是不够的。只有通过定制化的数据采集,不断进入别人没有的细节和场景,才能不断提升技术的价值,才能在洪流中站稳脚跟。再比如,企业渴望获得更专业、更垂直的数据。随着AI技术渗透到各个细分领域,大量的数据标注工作需要专业人士来完成。比如医学影像数据的标注,工业生产线上各种材料的理解。这些都不再像过去那样,聚集一群普通人就能搞定。相反,它需要业内的专业人员来处理它们。如何满足这些要求,是数据服务公司和AI公司都在思考的问题。以及企业日益增长的数据安全要求。除了提出数据隐私等常规数据安全要求外,为突破现有模式的局限,部分企业开始自主研发硬件,向多模态融合迈进;或者,如前所述,专门收集一些定制的专业数据。这时,这些数据将成为企业构建自身核心壁垒的发展方向。此后,数据安全问题成为重中之重。另一方面,AI数据服务企业也是如此。AI数据服务企业意识到,越来越多的AI企业对数据的准确性、安全性和标注效率提出了更多要求,AI企业开始倾向于与大公司合作,对数据服务企业进行尽职调查,建立供应商列表等等。这一切都意味着,数据服务企业必须加强技术能力,推进规范化管理,以应对新的需求。中场大战的号角已经吹响。这场战争决定了AI数据服务企业的生死存亡,也是他们力争上游的重要契机。半场大战有何变化:AI数据服务行业的下一个场景?会有懵懂的小传统企业,也会有植根于农业、化工等非常细分的行业的企业。同时,也会有科技巨头依托丰富的数据积累不断完善AI技术。他们对数据类型的需求会越来越精细化、专业化、垂直化。在此趋势下,数据与算法的产业分工将逐渐清晰。或许数据公司需要“把手伸得更长一些”,才能更好地为他们服务。相信在中场争夺战转折之后,数据服务行业将从单纯的拼劳动力向拼技术、拼专业、拼垂直方向演进。对于数据服务行业来说,这也是一个不断洗牌的过程。产业发展过程进行到一半,真正的竞争才刚刚到来。数据服务行业作为AI的“源头”,在优胜劣汰后,也赋予了AI更强劲的动力。
