当前位置: 首页 > 科技观察

AI不适合开源?MongoDB副总裁:代码开源不适合人工智能

时间:2023-03-17 00:39:10 科技观察

是时候谈谈AI开源了显然,这是开发者不得不面对的问题。基本上从2006年开始,开源与否就成了头号问题之一。MattAsay负责MongoDB的市场营销。在此之前,他是AmazonWebServices的负责人和Adob??e的开发者生态系统负责人。在加入Adob??e之前,Asay在开源公司担任过一系列职务。MongoDB业务开发、营销和社区副总裁,实时分析公司Nodeable(后来被Appcelerator收购)业务开发副总裁,移动HTML5初创公司Strobe(后来被Facebook收购)业务开发副总裁兼临时首席执行官,以及Canonical公司的UbuntuLinux首席运营官和内容管理初创公司Alfresco的美洲区负责人。最终,Asay成为开源计划(OSI)的名誉主任,并获得了斯坦福大学的法学博士学位。之前,MattAsay指责Google和Yahoo对开源代码持保留态度,然后被骂了一顿。现在想想,很有道理。TimO'Reilly表示,在开源云时代,开发者共享代码的动机是让别人运行自己的程序,并提供一份源代码。对它的需求已经慢慢消失了。Reilly继续指出,这不仅没有必要,而且就最大的应用程序而言,它也不再可能。在过去的十年里,这种共享的不可能性已经推翻了开源的最初定义。今天,新的定义正在影响我们对人工智能的看法。正如MikeLoukides指出的那样,AI协作从未如此重要,也从未如此困难。就像2006年的云计算一样,在人工智能领域做最有趣的工作的公司可能会努力以老式的方式开源。但即使他们的开源方法是传统的,这并不意味着他们不能以更有意义的方式开放。OpenInfrastructureLoukides认为:“虽然现在很多公司都说自己在搞AI,但真正推动这个行业发展的公司只有3家——Meta、OpenAI和Google。”他们三人有一个共同点:他们都有大人工智能。大规模运行大型模型的能力。这种能力的背后,需要强大的基础设施和技术手段,而这些往往是很多个人和企业所不具备的。的确,您可以从Meta下载OPT-175B的源代码,但您无法在手头的硬件上对其进行训练。即使对于大学或其他研究机构来说,OPT-175B也太大了。另一方面,即使拥有足够计算资源的谷歌和OpenAI也无法轻易复制OPT-175B。原因也很简单:OPT-175B与Meta自己的基础设施(包括定制硬件)的联系过于紧密,无法移植到其他地方。也就是说,Meta并没有试图隐藏任何关于OPT-175B的信息,但构建一个基本的基础设施确实很困难。即使对于那些有钱有技术的人来说,最终的结果也会是不同的版本。而这正是Yahoo的JeremyZawodny和Google的ChrisDiBona在OSCON2006上所做的。但是话又说回来,如果你不了解机器背后的科学,就很难相信人工智能。因此,我们需要找到一些方法使基础设施可供开放使用。Loukides认为应该向外部研究人员和早期采用者提供免费访问。不过,不是通过给他们一个主密钥来让他们访问Meta、谷歌或OpenAI的数据中心,而是通过一个公共API。这可能不是大多数人所期待的“开源”,但还是可以接受的。另一种看待开源的方式现在,MattAsay曾经无缘无故地指责谷歌和雅虎。从2006年开始,谷歌在满足战略需求的前提下,对关键基础设施进行了封装和开源。在MattAsay看来,TensorFlow是开源的入口,Kubernetes是开源的出口。这些开源机器学习行业标准有望改善谷歌云的工作负载,或者确保谷歌云之间的可移植性,从而为谷歌云赢得更多的工作负载。想出这个的人很聪明,但它不是Pollyanna意义上的开源。不仅仅是谷歌。它只是在开源方面比其他公司做得更好。开源本质上是自私的,公司和个人总是会开放有利于自己或客户的代码。它一直是,也将永远是。Loukides认为AI应该是有意义的开放(虽然这三大AI巨头与其他公司之间存在差异),但他指的并不是通常意义上的开源。为什么?原因是,尽管传统开源很棒,但它从未成功解决2006年DiBona和Zawodny在OSCON上为软件创建者和消费者提出的云开源难题。十多年过去了,我们离答案还差一步。再一次,我们确实靠得更近了。MattAsay认为我们需要以一种新的方式看待开源。他与Loukides的想法很接近:关键是为研究人员提供足够的访问权限,使他们能够重现特定AI模型是如何成功或失败的。“他们不需要完全访问所有代码和基础设施来运行这些模型。”正如他所说,只有当开发人员可以在他们的笔记本电脑上运行开源程序并制作衍生作品时,才能完全访问该代码才有意义。鉴于今天在谷歌或微软运行代码的规模和独特的复杂性,这不再有意义——我们无法大规模地完全访问云代码。我们需要明白:开源不是观察开源世界的镜头。而且考虑到我们今天所处的云时代,开源的使用越来越少。作为公司和个人,我们的目标应该是以有利于客户和第三方开发人员的方式开放对软件的访问和理解,而不是试图将几十年前的开源概念重新发明到云中。它不适用于开源,也不适用于人工智能。是时候换个思路了。