如何打造自己的人工智能系统?像许多事情一样,答案是“视情况而定”。如果我们以深度学习为例,说明一种越来越流行的人工智能。工作量,构建用于数据集深度学习训练的AI系统在很大程度上取决于您可以轻松访问的资源、专业知识和基础设施的数量。例如,您作为独立开发人员或研究人员在较小环境中使用的系统看起来与支持大型组织努力“支持”与客户的业务交互或提高临床护理质量所需的系统截然不同,或者检测大量金融交易数据中的欺诈行为。最终,这取决于您是设计和构建自己的系统,还是采用专门构建的解决方案来解决您的问题。对于前者,当今消费市场中常见的GPU技术往往会进入“自己动手”的AI领域。该系统非常强大,性能明显优于基于CPU的系统。在当今的GPU上启用通用并行计算的现成工具包,结合支持流行的深度学习框架所需的编程技能,可以产生很好的结果,正如AlexKrizhevsky的“AlexNet”首次展示的那样,它赢得了ImageNetLarge规模视觉识别挑战。2012年,使用在GPU和NVIDIACUDA上运行的卷积神经网络。对于后者(大规模深度学习,适用于大型组织)——有两个重要的考虑因素会影响您实施AI的方法。系统:1.您需要多快开始看到结果?如果您正在进行发现之旅,喜欢玩智力挑战,有时喜欢使用各种硬件和软件配置进行“侦探工作”,那么您很可能没有按照老板的时间表进行操作,或者没有执行某种业务或研究任务。在这种情况下,当您拼凑出您感兴趣的系统(包括GPU、驱动程序、库和深度学习框架)时,沿着蜿蜒的道路前行并筛选可能有数百页的文档可能完全没问题角色“系统集成商”。但是,如果您的工作是以从数据中获取洞察力这一总体需求为指导的,那么您可能需要更轻松、更快捷的途径才能实现目标。在这种情况下,您需要利用“解决方案就绪”平台或设备,例如NVIDIADGX-1或DGXStation。集成您需要的所有组件并使用已发布的基准进行验证,以在您关心的框架上提供可量化的性能。此类设备应基于它们的“即插即用”程度以及供应体验的直观程度,引导您通过易于导航、管理数据集、分配资源和安排作业的简单管理界面。这种部署模式让您摆脱了“IT管理员”的束缚,让您尽快开始训练神经网络,最快一天即可启动并运行。获得更快洞察力的另一个方面是硬件和软件协同工作的性能。GPU优化的深度学习软件堆栈的好处是能够在深度学习训练中实现比单独使用GPU硬件更高的加速因子。NVIDIADGX系统提供的深度学习性能比其他使用相同TeslaV100GPU但缺乏集成、优化的深度学习软件的系统高出30%。这里的重点是,即使你建立了一个A.I.您自己的系统,使用绝对最新的GPU技术,相对于经过全面优化和软件设计以实现每个深度学习框架的最大性能的集成硬件和软件系统,该系统仍将处于性能劣势。2.我准备花多少时间来管理和优化我的基础架构?与“发现之旅”路线类似,您的AI系统可能看起来非常不同,具体取决于您遵循的路线。如果您热衷于花时间微调您的软件堆栈,使用不同的框架和支持库组合,并且不介意在社区论坛中寻求故障排除支持,那么构建您自己的系统可能适合您。现实情况是,调整“完美”的深度学习堆栈,从框架到GPU,通常需要在软件工程技能、驱动程序以及中间的每一层上投入大量资金。还要考虑到框架本身通常是开源的并且不断发展。因此,确保您的堆栈以最佳性能运行意味着承诺即时调整和重新调整,并可能持续重建您的堆栈。如果这是你的章程,那么这可能不是问题,但如果你资助其他人来完成这项工作,这可能意味着数十万美元的软件工程运营支出,以确保你最大化AIROI的好处。或者,像NVIDIA的DGX这样的AI设备可以访问流行的深度学习框架,如TensorFlow、Caffe2、MXNet等,以及支持库,所有这些都与硬件集成,从而节省了大量时间和金钱。此类产品具有预先优化的堆栈,由解决方案提供商定期(最好每月)更新。这使您免受开源软件的变动和不确定性的影响,同时如果您对硬件和软件的任何元素有疑问,还可以为您提供企业级支持。此外,由于数据科学和人工智能的实验性质,开发人员经常发现他们自己(或他们的团队)需要同时对系统资源和软件配置的不同组合进行实验,以确定哪些模型能最快产生洞察力。基于Docker的容器能够支持多个版本的深度学习堆栈共存,每个版本彼此隔离,并有自己的支持驱动程序和库实例。这使系统操作系统的基本映像保持“干净”,并避免了在实验者想要尝试不同的配置排列时必须重新映像设备的可能性。容器与正确的管理和调度设备相结合,还可以让研究人员团队同时使用该平台并在他们正在开发的模型上进行协作,从而提高系统的利用率并推动您所在部门的人工智能水平更高。投资回报率。所有这些都提高了您的工作效率,您是试图利用AI力量的数据科学家。在您的业务中。所以,你真的有两条途径来构建人工智能。每个系统都适用于您可能要处理的一组不同的时间表、业务目标和运营设置。选择最终将取决于您是否可以自由扩展您的章程以包括系统集成商和IT管理员的角色,或者您的职责是否允许您继续专注于数据科学并为您的组织获得洞察力。
