当前位置: 首页 > 科技赋能

解密 Facebook 的 AI 野心!凭借两张王牌和两个部门

时间:2024-05-22 19:25:33 科技赋能

文章|海中天 Facebook的企业文化中,流传着各种“座右铭”。

它们经常以口号的形式出现在办公室里,或者被首席执行官马克·扎克伯格和其他高管引用,例如:“代码胜于雄辩”、“快速行动、打破常规”以及“完成优于”完美的。

” Facebook 纽约办公室的墙上有一句标语,完美概括了 Yann LeCun 向 Facebook 管理层灌输的人工智能和机器学习新理念:“永远保持开放”。

Facebook正在膨胀,AI已经成为这个庞大帝国的重要组成部分。

Facebook 使用人工智能来识别图像并修饰新闻源。

上周,Facebook 还推出了 DeepText,这是一种文本阅读引擎,每秒可以以类似人类的准确性理解数千条帖子,涵盖 20 多种语言。

很快,这些文本将被完全自动地自动翻译成十几种不同的语言。

Facebook 还在开发识别语音和识别视频中人物的工具,这样你就可以在观看时快进并直接跳转到朋友出现的场景。

Facebook 已经是社交网络和即时通讯领域的主导者,现在它还想主导人工智能和机器学习。

该公司已招募了一批专门从事人工智能和机器学习的员工,其研发投入将增加两倍。

Facebook 拒绝透露投资金额。

团队成员:Antoine Bordes、Yann LeCun、Laurens van der Maaten、Leon Bottou、Y-Lan Boureau、Soumith Chintala 后来者 Nvidia CEO 黄仁勋认为,如果说移动计算是上一个计算时代,那么下一个时代将是 AI。

Nvidia 是全球最大的图形处理器制造商,也是 Facebook 的开源硬件设计合作伙伴。

黄仁勋还表示:“过去20年,AI是计算领域最重要的突破。

Facebook和其他公司必须竞争,以确保AI成为公司的核心。

”直到三年前,Facebook才开始认真进军AI领域。

为了竞争,你需要的不仅仅是金钱。

毕竟,人工智能是目前竞争最激烈的领域之一。

“他们实际上是后来者,”华盛顿大学计算机科学教授佩德罗·多明戈斯说。

“谷歌和微软遥遥领先。

”当扎克伯格宣布要开发人工智能管家来管理房子的时候,谷歌和微软就已经在开发AI软件了。

微软从今年年初开始就一直在研究机器学习。

它有数百名科学家和工程师从事此类工作,其研究涉及数十个领域。

Google Assistant 是深度学习的成果之一,它已经开始成为大多数 Google 应用和服务的“大脑”。

2016年,百度从谷歌挖来深度学习项目总监吴恩达。

非营利组织OpenAI已获得包括特斯拉创始人马斯克和其他重量级科技名人在内的投资者的10亿美元资金。

亚马逊首席执行官贝佐斯在出席会议时表示,该公司已经秘密开发人工智能四年了,现在有一千名员工致力于语音识别系统的开发。

苹果和Uber也在AI方面投入了大量资源,并且在人才方面展开竞争。

所有这一切引发了人工智能领域的新一波创新浪潮,其中一些创新是 Ian LeCun 在加入 Facebook 之前创建的。

此前,Facebook 甚至没有像样的 AI 实验室。

领导人 LeCun 和 Candela LeCun 是 Facebook 人工智能研究项目的主任,专注于基础技术和长期研究项目。

Facebook还成立了应用机器学习(AML)部门,由机器学习领域专家华金·坎德拉(Joaquin Candela)领导,他曾在剑桥大学教授机器学习课程。

该团队负责将技术应用到现有的 Facebook 产品中。

这两个部门是独立的,LeCun 和 Candela 向 Facebook 首席技术官 Mike Schroepfer 汇报工作。

如何让两个部门合作,如何在长期科研和短期业务目标之间取得平衡,是他们面临的重大挑战。

为了实现他们的目标,他们想出了一个解决方案:让两个团队紧密合作。

“你必须建立个人关系,必须紧密合作,”LeCun 说。

在Facebook,这两个部门不仅一起工作,而且距离高层也非常近,距离扎克伯格和施罗普夫的办公室仅一英尺之遥。

这显示了人工智能和机器学习在 Facebook 的价值。

尽管如此,深度科学并不会因为人们合作更紧密而变得更容易。

要了解LeCun和Schroepf的计划,你首先要了解他们的出发点! LeCun 是谁 纽约大学计算机科学系 Ian LeCun 办公室的前门上有一个巨大的蓝色竖起大拇指标志。

LeCun 是世界上最著名的深度学习专家之一,他并没有在他的 Facebook 办公室上张贴这样的标志。

最近,LeCun 穿了一件海军蓝 Polo 衫,上面印着爱因斯坦的小脸,下面写着“THINK”字样。

他笑说,两年前,当他宣布加入Facebook时,有人把图标放在上面,他没有把它取下来。

55 岁的 LeCun 仍然是纽约大学的计算机科学兼职教授,该大学距离 Facebook 纽约办事处很近。

如果你曾经用过ATM机存过支票,你应该看过LeCun的研究成果。

他是卷积神经网络的创建者之一,在AI界非常有名。

如今,卷积神经网络已成为开发可扩展的自动自然语言理解工具和图像识别工具的基石。

甚至语音识别和视觉搜索系统也离不开它。

开发复制生物视觉皮层运作的模型是 LeCun 在该领域的主要工作。

在建立FAIR(Facebook AI研究团队)时,LeCun有很大的自由度。

在美国,他可以自由招募员工和团队。

扎克伯格和施罗普弗给予 LeCun 自由是有原因的。

毕竟,LeCun 在贝尔实验室工作了 14 年,对什么有效、什么无效有着强烈的认识。

他长期以来一直在思考一个问题:如果有机会建立一个新的研发实验室,他将如何编码,例如GitHub? LeCun说:“我见过很多朋友从实验室跳槽到大型科技公司。

这些实验室有开放的文化,他们试图改变企业文化,结果是彻底失败。

”在加入Facebook之前,他问了很多问题,其中包括Facebook对开源世界和开放文化的承诺。

团队成员:Hussein Mehanna、Joaquin Candela、Tommer Leyvand、Vincent Cheung 研究与应用 一方面是研究,另一方面是将研究成果转化为产品。

乐坤希望保持两者之间的平衡。

LeCun 表示,许多科技公司在让研究人员保持专注方面都面临着困难。

曾几何时,施乐帕洛阿尔托研究中心(Xerox PARC)是硅谷的传奇人物。

它开发了图形用户界面,后来被苹果公司用在Lisa上,然后是Macintosh上,这一切都是因为乔布斯在1999年参观了实验室。

这个例子可能是最著名的了! LeCun 认为不受欢迎的一种模式是所谓的“混合研究”,这意味着将研究人员嵌入到工程团队中。

这种模式牺牲了创造力。

另一个问题是研究人员被困在象牙塔里,与公司其他部门缺乏沟通。

2000年至2010年,LeCun在NEC普林斯顿实验室工作。

日本公司 NEC 在普林斯顿设立了一个实验,并不急于开发产品。

“NEC Labs 一开始并没有要求员工为公司开发任何产品,”LeCun 说。

“突然,他们提出了这样的要求。

他们告诉员工,如果他们能够开发出有效的产品,那就太好了,几乎所有人都离开了,包括我。

打破已经建立的研发障碍是不可能的。

“开放Facebook正如火如荼地进行,现在扎克伯格的目光提前了10年,他的关注点包括AI、VR和无人机。

在LeCun的领导下,FAIR于2018年12月成立,致力于AI和长期研究—— Facebook很清楚,如果团队的工作要实现短期和长期利益,就必须允许一些科学家和工程师开发出可以影响多年的新技术,同时允许其他人开发。

据乐坤估计,团队70%的工作是研究型的,30%是短期开发的。

“我们发布了很多报告,开放了很多代码。

”LeCun 解释道。

我们已经成为研究界的一部分,因为我们真的想挑战极限,真的想推动技术前进,推动科学前进。

我们需要确保我们掌握了专业知识并控制了当前的切割- 尖端技术,我们正在朝这个方向前进。

“团队的野心非常大:让机器学习“常识”,即让机器像孩子和动物一样学习。

LeCun 表示,FAIR 目前最大的项目是面向对话的自然语言理解系统,这是 Facebook 的事实证明,各大科技公司都想成为语音助手领域的领导者,最明显的例子就是苹果公司推出的 Cortana,以及同样推出的 Viv Machines。

智能语音助手,Facebook有自己的计划,比如M。

AI是M的核心。

LeCun认为,系统要成功回答任何问题并真正对用户产生影响,必须具备常识,即让。

机器通过观察世界来学习。

“机器不需要接受训练来识别纸巾、汽车电话和其他东西,”LeCun 说,“今天,没有任何技术可以赋予机器常识。

LeCun 认为,这个解决方案并不能直接解决问题。

相反,你必须弄清楚如何让机器理解文本,然后教机器背景知识——关于世界的知识,以便它能够被理解。

“如果我说:‘奖品装不进盒子,因为它太小了。

’你会知道,‘它’指的是盒子,而不是纪念品,因为你知道该把什么东西放进别的东西里。

“机器不理解这一点。

FAIR的长期目标之一就是让机器的理解能力达到这个水平。

让机器拥有复杂的常识并理解文本,这不仅会影响语音助手,还会影响自动语言翻译工具, Facebook 的用户遍布世界各地,它认为语言翻译是一个重要的功能。

“翻译是一项非常重要的功能。

” LeCun表示,“Facebook的主要使命是将人们连接到互联网。

我们要做的第一件事就是让人们能够通过翻译进行交流。

”另一个部门 AMLAML 部门主管雅克·华金·坎德拉 (Joaquin Candela) 坐在 Facebook 总部,与旁边装满毛绒动物的大盒子相比,他显得相形见绌。

没有会议室,所以39岁的坎德拉把我们带到一个有两张沙发的小角落。

角落里漆黑一片,但整栋楼却熙熙攘攘,灯火通明。

到了与 Schroepf 会面的时间,Candela 拿起我们的录音机,一边谈话一边带领我们前往 CTO 办公室。

当AML还在筹划和准备的时候,LeCun就已经来到了Facebook。

事实上,正是他推动了AML的建立。

LeCun表示:“要让FAIR开发的技术进入产品,AML将是一个主要渠道。

” AML的目标是提高技术水平,追求技术转移的最大化,成为科研开发和技术转移的粘合剂。

AML 负责开发更好的动态和广告排名、搜索、语言翻译、语音识别和自动视频标记算法。

在谈到AML的成立时,坎德拉希望该部门能够避免其他应用实验室所犯的错误。

AML 成立时,坎德拉还是 Facebook 的工程经理,管理着一个负责构建机器学习基础设施的团队。

“从科学到工程的转变并不是很成功,”坎德拉说。

还有一些错误需要避免,例如实验室距离工程太远,研究人员不再关注与产品相关的目标。

以开放吸引人才。

LeCun的团队70%的时间都花在科学研究上。

坎德拉的团队则完全相反。

他们把大部分时间花在如何将研究成果应用到可扩散产品上。

Candela 表示,他的团队会以季度和月份为单位来考虑项目,而不是 LeCun 团队的工作周期为 5 到 10 年。

坎德拉的团队通常每六个月制定一次计划,但目标是两年。

尽管工作不同,坎德拉和 LeCun 都相信开放会带来更大的成功。

Facebook 首席技术官 Schroepfer 对此表示同意。

Schroepfer 表示,除了开放硬件和数据中心外,Facebook 工程师还开放了 10,000 多行代码,并且有一个活跃的 GitHub 项目正在进行中。

一定程度的开放对于招募优秀人才至关重要。

“顶尖科学家想在哪里工作?”坎德拉说道。

“他们希望与志同道合的人一起工作。

你怎么知道我们有志同道合的人?因为你看到他们的工作内容,你看到他们发布的内容,你知道他们试图解决的问题以及他们打算如何解决它。

“AML的最新团队与计算摄影相关。

去年,Rick Szeliski和其他几位从微软研究院加入Facebook,所以他们成立了这个团队。

该团队研究视频稳定技术,包括Du Video,他们希望帮助人们拍出更好的自拍和“我们来到Facebook的主要原因是因为这是图片的来源,也是数据的来源。

”我们想要分析一些东西,它是存储这些东西的最大的‘仓库’。

”Szeliski 说道。

我们每天都能接触到能让用户开心的图片,而且他们越开心,就会拍摄和分享越多的图片。

因此,Facebook 不仅是图片的诞生地,也是图片的发源地“流程” 在 Facebook,我们经常听到“流程”这个词,部分是因为 FBLearnerFlow,它是 AML 构建的端到端的研发和工程管道,它类似于杀手级应用程序。

针对机器。

学习测试和分享,但FBLearnerFlow到目前为止只供内部使用。

在 FBLearnerFlow 中,Facebook 上从事人工智能和机器学习工作的每个人都可以发布材料供其他人使用。

“假设我们有一个新的广告项目,要在即时文章中嵌入富媒体广告内容,负责该项目的团队没有机器学习知识。

坎德拉举了个例子,“没问题,这些工程师可以进入 Flow 并浏览所有实验原型和产品原型。

他们可以选择模块并在自己的产品中使用。

”我总是鼓励员工应用和借用模型在自己的项目中使用。

没有必要浪费精力一遍又一遍地做同样的事情。

“流程也是一种用于在受控环境中测试新功能的平台。

“这是一个漂亮的产品。

”坎德拉说,“这包括从研究一直到实际实验的整个过程。

当你做实验时,如果有 1% 的人参与,而且看起来不错,我们就会开始向所有人推广。

” “因为 Flow 的使用如此广泛,它已经被四分之一的工程师采用,而不仅仅是人工智能领域的工程师。

??部门。

Facebook如何保持内部开放? Flow 是一个完美的例子,它不隐藏研究成果。

”,而是让每个人都能看到投资回报。

Facebook 因追求短期和长期目标而在人工智能和机器学习社区赢得了一些尊重,但无法保证它会实现扎克伯格、施罗普弗和整个公司所吹捧的领先时代10年的长期使命,失败的原因有很多,而且。

隐私问题可能是最明显的问题。

当用户意识到Facebook正在分析每一篇帖子和每张图片时,Facebook将更深入地挖掘他们的生活,用户就会反抗。

还有财务问题:为人工智能提供资金,Facebook 高管和董事会需要看到回报! Schroepfer坚称Facebook的管理团队并不担心FAIR和AML的投资回报,他表示:“我们认为这两个团队在未来五到十年内实现回报将非常容易。

我们他们的投资回报不会被评估,因为一两个项目就可以实现目标。

“新的人工智能技术可以解读图片内容并更接近上下文,这在以前是不可能的,但要实现目标还有很长的路要走。

Facebook 的所有领导人都强调开放性。

如果情况发生变化,领导人退缩,后果会是什么?“如果他们违背这一想法,就像许多公司之前所做的那样,Facebook 可能会遇到麻烦,”蒙特利尔大学的深度学习实验室和贝尔实验室的 LeCun 的同事在研究上失去了优势,在企业中会出现一种自然趋势,事情进展不顺利,就要求研究人员。

产生短期结果,损害了实验室……甚至损害了企业的长期前景。

Bengio 认为,在产品人员和研究人员之间放置一个强有力的人(比如 LeCun)以确保不会产生太大的短期压力是一项挑战。

Bengio还表示:“未来,我们在Facebook内部仍将面临类似的挑战,因为短期目标带来的压力仍将持续。

”就连 LeCun 也承认,事情可能会在没有任何警告的情况下发生变化。

“没有人要求我们证明我们存在的价值,我们还没有,”LeCun 说。

“经历了几个工业实验室的生死之后,我明白了一个事实,除非你把东西拿出来告诉别人,“这些是我们为公司开发的东西,我们花所有钱的原因是正是出于这些原因,LeCun 和 Candela 正在实时进行实验。

要谨慎行事,避免盲目追求成功最大化而盲目扩张。

“你越清楚自己的目标是什么,组织应该做的事情越少,”施罗普夫说,“如果你让我做 10 件事,其中 3 件事是好的,7 件事是坏的,所以你最好希望你选择的 3 件事是。

另一方面,如果你说该组织只做一件事,你就会真正看到它是如何做的。

我们有两个不同的问题需要解决,并找到使用当前研究结果的方法。

产品。

”正因为如此,Facebook 需要找到在组织之间分享想法的有效方法。

Candela 表示:“这是允许员工流动的最理想的情况,我们正在积极构建它。

AML 员工可以加入 FAIR,反之亦然。

”这个技巧确实有效。

Candela 表示,Facebook 的面部识别团队始于 FAIR,后来转向 AML,因为其工作与产品越来越相关。

还有计算机视觉团队,也需要跨越2个部门。

LeCun表示,有很多情况是一个部门建设了基础设施,然后将设施转移到另一个部门。

例如,DeepText虽然是直接由AML实现的,但它起源于FAIR。

一开始,FAIR尝试使用卷积神经网络等深度学习技术来对文本进行分类并理解文本内容。

一些人担心开放可能对商业构成威胁,但 LeCun 感到放心。

允许外界获取Facebook代码对Facebook本身也有好处。

如果这些人很优秀,Facebook可以将他们招入公司,也可以直接使用别人的成果。

“如果其他人使用我们的技术,这是一件好事,因为它的价值不仅限于技术本身。

” LeCun说,“我们可以挖掘技术的潜力,因为我们占据了独特的市场地位。

而在社交商业中,如果我们不能先于别人开发出技术,我们就会有优势。

这是我们自己的问题。