当前位置: 首页 > 科技观察

微软公共AI基础设施服务代号:Singularity

时间:2023-03-19 14:06:08 科技观察

MicrosoftAzure和研究院团队正在合作开发一种新的AI基础设施服务,代号为“Singularity”。根据微软公布的部分招聘内容,Singularity团队正在努力打造微软所说的“一种新的人工智能平台服务,将成为微软内部和外部人工智能的主要驱动力”。该项目的成员发表了一篇题为“Singularity:Planet-Scale,PreemptibleandElasticSc??hedulingofAIWorkloads”的论文,其中提供了有关Singularity项目的技术细节。Singularity服务旨在为数据科学家和AI从业者提供一种方式,让他们可以在Microsoft为AI构建的分布式基础设施服务上构建、扩展、试验和迭代他们的模型。近期发布的发表论文作者名单包括AzureCTOMarkRussinovich;合作伙伴架构师RimmaNehme,曾在AzureCosmosDB工作,直到2019年搬到Azure从事人工智能和深度学习工作;和技术研究员DharmaShukla。根据该论文:“Singularity的核心是一种新颖的、工作负载感知的调度程序,它可以透明地抢占和弹性扩展全球加速器(如GPU、FPGA)上的深度学习工作负载,以提高利用率。”微软此前曾讨论过将FPGA作为服务提供给客户的计划,2018年微软公开了一个代号为“ProjectBrainwave”的项目,旨在通过Azure提供快速的AI处理能力,当时微软预览了一款AzureMachineLearning由Brainwave提供支持的硬件加速模型,这是为客户提供AI工作负载的FPGA处理能力的第一步。我怀疑Singularity是微软将Brainwave转变为商业服务的下一步,我已经联系微软征求意见。我也当被问及微软计划何时以及如何将Singularity变成商业服务时,2019年微软宣布向OpenAI投资10亿美元,一年后微软宣布与OpenAI合作,专门打造了全球第五大超级计算机对于OpenAI。虽然这台AI超级计算机是微软专门为OpenAI打造的,但微软一直表示会通过AzureAI服务和GitHub提供微软的大规模AI模型和训练优化工具。此外,微软还通过AzureAI为那些不需要专用超级计算机的客户提供各种加速器和服务。2021年11月,微软宣布将在Azure中使用80GBNVIDIAA100GPU扩展其AI超级计算机阵容。您可能还记得,微软之前使用Singularity作为另一个研究项目的代号,该项目当时是一个微内核操作系统和一组完全在托管代码中开发的相关工具和库。此Singularity并非基于Windows,而是作为概念验证从头开始编写的。奇点最终催生和/或影响了其他几个微软操作系统研究项目,包括Barrelfish、Helios、Midori和Drawbridge。还值得注意的是,微软并不是唯一一家试图在内部和客户之间提供AI超级计算功能的科技公司。Meta也在做同样的事情,并给了它一把解锁Metaverse的钥匙。