随着越来越多的企业转向AI来处理大量任务,他们很快发现训练AI模型既昂贵、困难又耗时。新公司MosaicML旨在寻找应对这些挑战的新方法,目前正准备推出基于云的神经网络训练系统,旨在解决算法和系统层面的问题。1该公司的创始人宣布了通过组合(一种“马赛克”方法)来提高机器学习效率的想法,这种方法可以共同加速和改进培训。核心思想是,由于机器学习模型在云端、数据中心或本地都很昂贵,因此关键问题是消除学习过程中的低效问题。该公司已经构建了两个组件,它们将成为其未来产品的一部分。Composer是一个用于高效机器学习(ML)训练的开源方法库,可以组合成“食谱”,从大约20种不同的方法开始,并严格地对它们的性能优势进行基准测试。随着产品的成熟,将添加其他方法。另一个MosaicML组件是Explorer,这是一种可视化工具和界面,允许企业开发人员通过比较成本、质量和运行实验所需的时间来模拟、映射和选择运行模型的最佳路径。Explorer旨在为用户提供可视化的成本、时间和质量权衡,这些权衡是在标准基准上进行的数千次训练中测得的。用户可以按方法、云和硬件类型进行过滤,以获得运行测试的最佳协议。关键是这些技术让传统的训练过程更加高效。这种想法和需求来自人工智能、机器学习以及创建和测试模型的初始步骤。在传统方法中,AI开发人员提出了一些基本可行但效率很低的方法。深度学习的世界不断证明东西可以工作,但效率不高,但这并不重要,因为计算(哈希能力)相对便宜。问题是,这仅在模型较小时才成立。一旦模型变得非常大,它的计算方面实际上变得非常昂贵,我们正处于当今AI行业的一个转折点,模型变得非常大,数据集非常大,所以费用非常高现在大。GPT-3培训(延伸阅读:DaaS企业级GPT语言建模问世)花费500万美元——这可能只是一个500万美元的实验。这就是MosaicML开始在人工智能和机器学习领域看到机会的地方。MosaicMLCEO表示:“我们正在关注核心竞争力不是人工智能的公司,但他们需要能够以具有成本效益的方式使用这些技术从数据中提取价值。如果你是Meta(前脸书)或谷歌,你有一个庞大的团队可以做到这一点,他们可以节省昂贵的计算并自己管理。他们最终可能会使用这些工具,但他们并不是真的需要我们。商业企业是我们的首要目标。“MosaicML发布了它的开源库,以便潜在客户和开发人员可以使用它并了解它的功能和特性。不过,该产品尚未正式命名,预计将在2022年初推出免费版和付费支持版。“当你训练模型时,你真正关心的是成本,”他说。但随后您开始考虑其他因素,包括事情需要多长时间以及效果如何。这个Explorer可视化工具让您看到不同之处。如果您不想花那么多钱而只是做一些廉价的实验,请尝试一下。这个想法是为用户提供了解事物成本的工具。但是如果他们没有想法,他们就真的无法规划,做这些实验就变得非常困难。最初,MosaicML将在云中的模型上工作,因为这些变量更容易根据每个供应商的费率成本进行扩展。AI的流行正在将更多组织带入高性能计算(HPC)的世界,无论他们是否愿意。模型创建和优化是任何进入HPC领域的组织面临的最大挑战之一,当然比简单地获取硬件更困难。行业分析师表示,这是帮助更多AI用户的可行方式。MosaicML是解决模型优化问题,有一些优化,像NvidiaTensorRT,针对特定硬件进行优化,但MosaicML追求的是算法优化。用于训练的人工智能硬件非常昂贵,而且是非常高端和前沿的技术。如果你能减少50%的培训时间,你就可以相应地降低成本。而且客户不需要以超高的价格聘请高端人才。
