当前位置: 首页 > 科技观察

AI时代的GitHub,这个陆奇看好的方向,终于有人做了

时间:2023-03-17 00:00:24 科技观察

AI时代的GitHub,这个陆奇看好的方向,终于有人做出来了,AI时代生存发展最重要的是什么?数据,数据,还是数据。特别是对于中小企业和广大转型中的传统企业来说,数据、优质数据、发现和管理数据是刚需——就像互联网发展时代对代码共享和管理的需求一样。那么如果有一个面向AI时代的面向数据的GitHub,是否满足刚需的痛点?这不,真的有AI创业团队在做这件事。而在看好的人当中,还有一个大名鼎鼎的GitHubforDataproducer,名字叫陆奇,格物钛。AI数据托管和数据协作SaaS提供商,创始团队也是一线技术工程师,深知当前的痛点。一方面,花在AI数据准备和工程任务上的时间占大多数AI项目的80%以上。在人工智能训练中,如果没有足够的高质量训练和测试数据集,就很难训练出高质量的人工智能模型。因此,面对AI发展过程中高昂的隐性成本,提供高质量、场景化的真实价值数据成为AI产业链的核心诉求之一。另一方面,人工智能依靠大量数据作为“思考”和“决策”的基础。过去,企业普遍对数据开放持保守和敏感的态度。然而,随着各种AI应用场景的落地,技术难点也逐渐浮出水面。以无人驾驶领域为例,很多驾驶场景是稀缺的,只能由一家公司打造。一个包含所有交通场景的数据集会消耗巨大的数据采集成本,短时间内难以一步完成。因此,歌舞钛的目标是加速打破人为壁垒,让更多优质海量数据通过开源共享,实现合作共赢。就像GitHub在代码领域起到了基础设施的作用一样,这样的基础设施目前在AI数据领域也是非常紧缺的。而随着AI的深入,另一个现状和事实变得更加清晰:在AI实现的现实世界中,只有一小部分机器学习系统是由机器学习代码组成的,但所需的周边配套基础设施庞大而复杂。其中,数据和数据集是最关键的环节。如果进一步关注国内市场,我们会发现适合AI项目落地的真正有价值的数据更加稀缺。据统计,如今中国有近60万人工智能开发者,但现状是:开源数据集普遍在海外,配套有限;下载分析困难,效率低;数据参差不齐,质量难以保证;核心最大的问题是缺少中文本地化数据。这进一步导致超过70%的企业存在数据共享困难、数据版本管理混乱、数据可视化标签转换困难、缺乏专业管理非结构化数据的共享协作平台等问题。那么摆在格吾提面前的,就只剩下一个问题了:如何?findset命令,顾名思义,就是查找数据集。分两步走。第一步是与AI行业的先驱公司合作。共同打造最迫切的集自动驾驶、互联网泛娱乐、新零售、智慧城市、在线教育为一体的AI公共数据集生态联盟。俗话说,做一个起步,做一个样品,看到价值,就会有更多的企业和组织加入。寻极岭发布会上,圆融七星、新石器、速腾聚创、爵飞、爱驰、酷家乐等均“站”出声援。格物台表示,星星之火可以燎原,希望从搜索订单的第一枪打响,打造国内最大的非结构化数据集平台。在类型上,全面涵盖图片、视频、语音和文字类型。在资源方面,既有公共数据集,也有AI头部企业数据集资源。从领域来看,首先从最迫切的商业落地入手,包括自动驾驶、互联网泛娱乐、智慧产业、新零售、在线教育、直播等。另外,希望这个数据集平台能够成为像GitHub一样受开发者欢迎的社区,提供更极致的数据集管理体验,包括安全等需求。事实上,虽然国内一直缺乏此类数据集的开源平台,但并不代表业界没有尝试。此前,创新工场联合国内领先的AI企业发起了AI挑战者大赛。百度、腾讯、华为、字节跳动等公司也面临以数据集为核心资源的挑战。只是始终缺少一个“专职”的人来执行这件事情。AI从业者应该非常清楚数据集的重要性。比如假设没有ImageNet,那么这波AI复兴应该不会这么快。正是李飞飞、李佳等华人科学家在数据集上的努力,加速和催化了复兴的浪潮。此外,数据集还可以促进产学研更紧密的合作。如果能更方便地利用资源,或许会为它增加更多的力量,也会有更多的机会帮助改进和优化该领域的算法。说白了,公开共享数据集就像开战。产学研领域的专家不仅在自测算法,还能不断让数据集所在的场景得到更高更强的推进。所以从这一点来看,或许就不难想象为什么能够得到陆奇的支持。在奇绩创坛的DemoDay上,这个项目被高调曝光,陆奇也亲自“站”上台为寻机灵发表演讲。总而言之,好事,终于有人做到了。谁做的最后,我也介绍下格伍提背后的创始团队。核心成员均为技术背景。创始人兼CEO崔云凯,优步自动驾驶团队早期员工,长期从事人工智能研究和产品化,经历了优步自动驾驶从50人到1500人的成长历程。Uber自动驾驶部门最年轻的TechLead,第一位华人TechLead。另外两位联合创始人陈启仁是Snapchat的早期员工,聊天系统和游戏系统的核心开发者和技术负责人。具有多年分布式系统软件开发经验。引领snap游戏平台的发展,是snap未来赚钱的重要途径。王广宇,阿里巴巴本地生活服务公司(饿了么),资深产品专家。旅行事业部地导游平台产品负责人,完成了平台从0到1、从1到100的建设,实现了平台每年3倍的增长,带来了过亿的收入元到公司。