当前位置: 首页 > 科技观察

专访吴恩达:AI的下一个十年,从硬件第一到数据大王

时间:2023-03-12 05:20:00 科技观察

你有没有觉得自己受够了现在的工作,想换个方向?如果你有,你绝对不是一个人。不过除了参加大辞典之外,还有一些不太激进的方法,比如吴恩达的方法。吴恩达是当今人工智能领域最杰出的人物之一。他是LandingAI和DeepLearning.AI的创始人,Coursera的联合主席和联合创始人,斯坦福大学的兼职教授。此前,他曾担任百度首席科学家,谷歌大脑项目创始人之一。不过,按照他自己的说法,他现在的重心已经从数字世界转移到了现实世界,正所谓“从比特到物”。2017年,吴恩达创立LandingAI,一家致力于推动人工智能在制造业应用的初创公司。我们采访了AndrewNg,讨论他所谓的“以数据为中心的人工智能方法”,以及它与他在LandingAI的工作以及当今更广泛的AI背景之间的关系。从数字化到落地,吴恩达说他的动力是产业导向的。他将制造业视为“对每个人的生活都有巨大影响的伟大行业之一,但对我们中的许多人来说却是无形的。”包括美国在内的许多国家都为制造业的衰退感到悲哀。AndrewNg希望“利用已经改变了互联网业务的AI技术,用它来帮助从事制造业的人们。”这是一个增长的趋势。根据2021年的一项调查,65%的制造业领导者正在努力试点人工智能。预计未来五年复合年增长率将达到57.2%。虽然人工智能越来越多地应用于制造业,但这个过程比吴恩达想象的要困难得多。他坦言,LandingAI刚起步时,主要专注于咨询工作。但在处理了许多客户项目后,吴恩达和LandingAI开发了一个新的工具包和剧本,使人工智能在制造和工业自动化中发挥作用。LandingLens致力于帮助制造和工业自动化领域的客户快速轻松地构建和部署视觉检测系统。吴晓波不得不调整他在消费软件方面的工作,以瞄准制造业中的人工智能。例如,人工智能驱动的计算机视觉可以帮助制造商完成识别生产线缺陷等任务。但这不是一件容易的事,他解释说。“在消费类软件中,你可以构建一个单一的AI系统,为1亿或10亿用户提供服务,并通过这种方式真正获得很多价值,但在制造业中,每个工厂制造的东西都不一样。因此,每个制造工厂都需要一个定制的人工智能系统,根据自己的数据进行训练。吴恩达表示,AI领域很多公司面临的挑战是如何帮助10000家制造工厂建立10000个客户系统。以数据为中心的方法认为人工智能已经达到数据比模型更重要的地步。如果你把AI看作是一个有运动部件的系统,那么你应该保持模型相对固定,并专注于高质量的数据来微调模型,而不是继续推动模型的边际改进。有这种想法的人不多。斯坦福Hazy研究小组的负责人ChrisRé是另一个以数据为中心的方法的倡导者。当然,如前所述,数据的重要性并不是什么新鲜事。几十年来已经开发出复杂的数学、算法和系统技术来处理数据。然而,如何在现代人工智能模型和方法的基础上构建和重新审视这些技术是新的要求。就在几年前,我们还没有长寿的人工智能系统,也没有像现在这样规模的强大深度模型。Ng指出,自从他在2021年3月开始谈论以数据为中心的AI以来,人们的反应让他想起了大约15年前他和其他人开始谈论深度学习时的情景。“今天的反应是,‘我一直都知道这一点,没有什么新鲜事,’到‘这不可能做到,’”Ng说。一个伟大的方向'。《“以数据为中心”的人工智能和基本模型如果说以数据为中心的人工智能是正确的方向,那么如何在现实世界中操作这一切?吴恩达指出,指望机构训练自己的能力是不现实的自己定制的AI模型。摆脱这种困境的唯一出路是设计一个工具,使客户能够设计自己的模型、收集数据并表达各自领域的知识。AndrewNg和LandingAI将通过LandingLens实现这一目标,通过数据标注赋能各个领域的专家进行知识交流。吴恩达指出,在生产领域,一般没有大量的数据可供参考。例如,如果目标是识别故障产品,那么一个合理的好的生产线不会有那么多报废品的图片可以参考,在生产领域,有时候全世界只有50张图片可以参考,这对于现有的AI来说根本不够用。这就是为什么现在的重点应该放在让专家收集数据以记录他们所知道的事情上。Ng说,LandingAI的平台就是这样做的。该平台帮助用户找到最有用的示例来构建最一致的标签,并提高输入算法的图像和标签的质量。这里的关键是“一致性”。AndrewNg和他之前的其他人发现,专业知识不能由一个专家来定义。对一位专家来说有缺陷的东西可能会被另一位专家看重。这种现象并不是独一无二的,但只有在必须生成相同注释的数据集时才会浮出水面。Ng说:“这就是为什么我们需要好的工具和工作流程来让专家快速达成共识。没有必要在已经达成共识的领域花时间。相反,我们的目标是专注于专家不同意的部分,以便他们可以通过讨论解决有缺陷的部分。事实证明,要使人工智能系统快速实现良好性能,实现数据的一致性至关重要。”这种做法不仅有意义,而且也有一些相似的地方。Ng描述的过程与当今AI中经常使用的“抛出更多数据”方法明显不同,而是更多地指向基于管理、元数据和语义协调的方法。事实上,像谷歌前机器翻译总监大卫塔尔博特这样的人一直在传达这样的想法,即机器翻译除了从数据中学习之外,将知识应用到各个领域也很有意义。在应用机器翻译和自然语言处理(NLP)的情况下,该领域的知识是指语言学。我们现在已经到了一个阶段,我们拥有所谓的NLP基础模型:比如说像GPT3这样的大型模型。通过大量数据训练,可以使用这些模型针对特定应用程序或领域对其进行微调。然而,这种基于NLP的模型并没有真正利用来自各个领域的知识。计算机视觉的基本模型可以做到这一点吗?如果是这样,我们如何以及何时才能实现它?实现会带来什么?根据AndrewNg的说法,基础模型既是规模问题,也是遗留问题。他认为这是可以实现的,因为有许多研究小组正在尝试建立计算机视觉的基本模型。吴恩达说,“这不是说第一天不是基础模型,第二天就是。在NLP方面,我们看到模型在发展,从谷歌的BERT模型,transformer模型,GPT2到GPT3。这是一系列越来越大的模型,在越来越多的数据上训练,然后这些新兴模型中的一些被称为基础模型。吴恩达说,“我相信我们会看到在计算机视觉中类似的东西。许多人多年来一直在ImageNet上进行预训练,我认为趋势将是在越来越大的数据集上进行预训练,并且越来越多地在未标记的数据集上进行预训练,并且越来越多的预训练将在视频上进行。”next10yearsofAI作为计算机视觉业内人士,吴恩达非常清楚人工智能正在取得的稳步进展,他相信在未来的某个时刻,媒体和公众会宣称计算机视觉模型是基础。然而,能够准确预测这何时会发生是另一回事。对于具有大量数据的应用程序,例如NLP,输入系统的领域知识量会随着时间的推移而减少。吴恩达解释说,在深度学习(包括计算机视觉和NLP)的早期,人们通常会训练一个小的深度学习模型,然后将其与各个领域知识库的更传统的方法相结合。没有效果。但是随着模型的规模越来越大,数据越来越多,注入的各个领域的知识也越来越少。根据AndrewNg的说法,人们倾向于认为大量数据是一种学习算法。这就是为什么机器翻译最终证明了端到端纯粹的学习方法可以很好地执行。但这只适用于需要从大量数据中学习的问题。当您的数据集相对较小时,领域知识确实变得很重要。AndrewNg认为人工智能系统提供两种知识来源——数据和人类经验。当我们拥有大量数据时,人工智能将更多地依赖数据而不是人类知识。然而,在数据匮乏的领域,例如制造业,我们只能依靠人类知识。技术方法是构建允许专家表达其知识的工具。这似乎指向鲁棒人工智能、混合人工智能或神经符号人工智能等方法,以及用于表示领域知识的知识图谱等技术。然而,虽然AndrewNg了解这些技术并发现它们很有趣,但LandingAI并没有使用它们。Ng还看到了所谓的多模式AI的前景,即结合不同形式的输入,如文本和图像。在过去的十年中,重点一直放在构建和改进单一模式的算法上。现在AI社区更大并且取得了进步,追求这个方向是有意义的。尽管Ng是最早使用GPU进行机器学习的人之一,但如今他不太关心硬件。虽然拥有一个蓬勃发展的AI芯片生态系统是件好事,包括Nvidia、AMD和英特尔等老牌玩家以及采用新颖架构的新贵,但这并不是道路的尽头。在过去十年中,人工智能的大部分焦点都集中在大数据上——也就是说,让我们能够使用巨大的数据集来训练更大的神经网络。是吴恩达自己帮忙宣传的。不过,虽然在大模型和大数据方面有所进步,但吴恩达表示,他认为当今人工智能发展的重心应该转向小数据和以数据为中心的人工智能。AndrewNg说,“十年前,我低估了开发深度学习所需的工作量,我认为今天很多人低估了开发以数据为中心的AI所需的工作量、创新、创造力和工具。但是,我们未来几年将在这方面取得进展,我认为它将支持更多的人工智能应用,对此我感到非常兴奋。”