2022在AI/ML领域取得多项突破性突破。谷歌、Meta和微软等大型科技公司在从量子计算到生成人工智能的全新创新方面取得了重大进展。例如,一些最大的突破包括用于解决国际数学奥林匹克问题的Meta的HyperTreeProofSearch(HTPS);DeepMind的AlphaFold和MetaAI的ESMFold用于蛋白质折叠预测;Google的DeepNull模拟了表型之间协变量效应的关系,并改进了全基因组关联研究(GWAS)等。接下来,让我们看看对2023年的一些预测。ChatGPT以其出色的对话能力席卷了互联网。它建立在OpenAI的GPT-3之上,后者拥有1760亿个参数并依赖于更大的模型尺寸。虽然还有其他LLM的参数是GPT-3的两倍、三倍甚至十倍,但DeepMind或Meta的一些模型(也称为小型语言模型(SLM))在逻辑推理方面的参数比GPT-3多。和预测等任务。除了缩小模型的尺寸外,还希望有更大的模型,比如GPT-4,大约有100万亿个参数。由于目前最大的模型是具有1.6万亿参数的GoogleSwitchTransformer模型,因此跳跃将是巨大的。然而,为了获得更大的延迟和可预测性,未来几年可能会对现有模型进行微调以服务于特定目的。最近,OpenAI使用达芬奇更新对GPT-3进行了微调。趋势1:生成式AI需要可解释的AI文本到图像生成是将在2022年打破排行榜的趋势。DALL-E、StableDiffusion和Midjourney等模型是想要尝试AI生成艺术的爱好者的首选.对话迅速从文本转移到图像,再到文本,再到视频,再到文本,再到任何东西,并且创建了多个模型,这些模型也可以生成3D模型。随着语言模型的扩展和传播模型的改进,文本到任何东西的趋势预计会上升得更高。公开可用的数据集使生成式AI模型更具可扩展性。这些数据集引入了一个关于可解释人工智能的部分,其中训练这些生成模型的每张图像的属性变得至关重要。趋势#2:FastSaaS竞赛开始赶上AI生成趋势的公司已经将其作为云服务提供。随着LLM和生成模型(如GPT-3和DALL-E)的公开可用,企业更容易将它们作为服务提供,这催生了FastSaaS。最近,Shutterstock计划将DALL-E2集成到其平台中,MicrosoftVSCode添加了Copilot作为扩展,TikTok宣布了应用程序内文本到图像AI生成器,Canva在其平台上推出了AI生成功能。趋势三:依赖超级计算机这是趋势,构建超级计算机依赖于生成任务并为企业提供服务。随着这些不断增加的数据集和生成模型,对超级计算机的需求正在上升,并有望进一步上升。随着对FastSaaS的竞争,接下来需要更好的高性能计算。NVIDIA和Microsoft最近合作创建了Quantum-2,一个云原生超级计算平台。10月,特斯拉宣布其Dojo超级计算机完全是使用特斯拉开发的芯片从零开始构建的。很快,它看起来可以为企业客户提供访问权限。此外,Cerebras还推出了拥有1350万个核心的AI超级计算机Andromeda,可提供超过1exaflop的AI算力。最近,Jasper与Cerebras合作以获得更好的性能。趋势四:超越3nm芯片正如摩尔定律所预测的那样,处理能力随着芯片尺寸的减小而增加。因此,要让超级计算机运行大型模型,它们需要更小的芯片,而我们已经看到芯片越来越小。近年来,芯片行业一直在推动小型化,制造商不断寻找使芯片更小、更紧凑的方法。比如M2芯片和A16,苹果分别采用5nm和4nm芯片。预计台积电将在2023年开发出3nm芯片,这将提高AI/ML算法开发的效率和性能。趋势五:量子计算与传统计算的融合随着英伟达、谷歌、微软等公司向云端提供硬件服务,量子计算领域势必会出现更多的创新。这将允许小型科技公司在不需要重型硬件的情况下训练、测试和构建AI/ML模型。未来几年量子计算的兴起绝对应该被开发人员包括在内,因为它的使用将在医疗保健、金融服务等许多其他领域增加。在最近的公告中,量子计算机连接到世界上最快的超级计算机欧洲将传统计算机和量子计算机结合起来以更快地解决问题。同样,Nvidia也发布了QODA——简称Quantum-OptimizedDeviceArchitecture——混合量子经典计算机的开创性平台。IBM最近在其年度2022年量子峰会上宣布了他们的量子硬件和软件,概述了使用433量子位(qubit)处理器进行以量子为中心的超级计算的开创性愿景。在全球人工智能峰会上,IBM宣布明年他们将展示一个1000量子比特的系统,这将是各个领域进一步创新的颠覆者。
