IT 部门的任务是支持人工智能和机器学习计划,这需要广泛考虑当前和未来的基础设施需求。
人工智能(AI)和机器学习(ML)是新兴领域,将以前所未有的速度改变企业的发展。
在数字时代,分析可用于揭示大量数据中的关键见解。
从历史上看,这些见解是通过人类密集型分析方法发现的。
如今,随着数据量的不断增长以及数据的复杂性,这并没有发挥更大的作用。
人工智能 (AI) 和机器学习 (ML) 是数据科学家的最新工具,使他们能够更快地将数据转化为价值。
数据爆炸需要人工智能 (AI) 和机器学习 (ML)。
从历史上看,企业一直使用大型记录系统生成的少量数据进行操作。
今天的环境完全不同,有更多的设备和系统生成自己的可用于分析的数据。
企业面临的挑战是有太多数据需要分析,而在日益数字化的世界中竞争的唯一方法是使用人工智能 (AI) 和机器学习 (ML)。
人工智能 (AI) 和机器学习 (ML) 用例因垂直行业而异 虽然没有通用的“杀手级应用程序”,但人工智能 (AI) 和机器学习 (ML) 适用于大多数垂直行业。
因此,各个行业都有许多关键用例。
常见用例包括: 医疗保健 – 快速诊断 MRI 扫描中的异常检测 汽车 – 用于识别道路上物体的分类 零售 – 可以准确预测未来销售 联络中心 – 翻译使客服人员能够用不同语言与人类交流 谈论高质量基础设施所需的数据 无论用例如何,人工智能 (AI) 和机器学习 (ML) 的成功取决于在基础设施方面做出正确的选择,这需要了解数据的作用。
人工智能 (AI) 和机器学习 (ML) 的成功很大程度上取决于输入系统的数据质量。
人工智能行业有一句公理:“不良数据导致不良推论”,这意味着企业应该关注如何管理自己的数据。
因此,这一公理可以扩展到“好的数据带来好的推论”,但这里的重点是需要拥有正确的基础设施以确保数据“好”。
尽管使用的数据类型可能有所不同,但数据在人工智能 (AI) 的每个用例中都发挥着关键作用。
例如,可以通过让机器学习在企业生成的大数据湖中找到见解来推动创新。
事实上,公司可以在其组织内培育基于数据科学的新思维。
关键是要了解数据在人工智能 (AI) 和机器学习 (ML) 工作流程的每一步中所扮演的角色。
人工智能 (AI) 和机器学习 (ML) 工作流程包含以下组件: 数据收集:数据聚合、数据准备、数据转换和存储 数据科学/工程:数据分析、数据处理、安全性和治理 培训:模型开发、验证和数据分类部署:执行推理数据的最大挑战之一是实时构建数据管道。
使用新数据源进行探索和发现的数据科学家需要收集、准备、建模和推断。
因此,IT 需要在每个阶段进行更改,并从更多来源收集更多数据。
同样重要的是,工作流程是一个迭代循环,其中部署阶段的输出成为数据收集和模型细化的输入。
通过这些阶段移动数据的成功在很大程度上取决于是否拥有合适的基础设施。
支持人工智能 (AI) 和机器学习 (ML) 的基础设施的关键考虑因素 位置:人工智能 (AI) 和机器学习 (ML) 不仅在云平台中执行,也不仅仅在现场处理。
这些举措应该在给定的输出最有意义的地方执行。
例如,机场安全的面部识别系统应该在本地进行分析,因为将信息发送到云平台并返回所需的时间会增加该过程的延迟。
因此,组织需要确保基础设施部署在云端、本地数据中心和边缘,优化人工智能计划的性能至关重要。
高性能基础设施的广度:如前所述,AI 性能高度依赖于基础设施。
例如,与传统中央处理单元 (CPU) 相比,图形处理单元 (GPU) 可以将深度学习速度提高三倍。
服务器功率不足会导致进程延迟,而服务器功率过高则会浪费电力成本。
无论策略是端到端还是同类最佳,都要确保计算硬件具有正确的计算处理能力以及高速存储设备。
这要求组织选择拥有广泛产品组合的供应商,能够解决人工智能流程任何阶段出现的问题。
经过验证的设计:基础设施显然很重要,但运行它的软件也很重要。
软件安装后,可能需要几个月的时间来调整和优化底层硬件。
组织需要选择具有预装软件和经过验证的设计的供应商,以减少部署时间并确保优化性能。
数据中心的扩展:人工智能基础设施并不是孤立存在的,应被视为当前数据中心的扩展。
理想情况下,企业应该寻找可以使用现有工具进行管理的解决方案。
端到端管理:不存在可以投资并启动人工智能采用流程的单一人工智能技术。
它由多个移动部件组成,包括服务器、存储、网络和软件,并且在位置方面有多种选择。
最好的解决方案是包含可通过单个界面管理的所有或大多数组件的整体解决方案。
网络基础设施:部署人工智能时,组织需要关注支持 GPU 的服务器、闪存和其他计算基础设施。
这是有道理的,因为人工智能处理器和存储设备的部署非常密集。
然而,存储系统和服务器必须提供通过网络传输的数据。
人工智能基础设施应该被视为一个“三足凳”,三足是网络、服务器和存储。
每个组件的进步必须迅速跟进。
任何一个组件的滞后都会影响性能。
因此,组织应该对其网络执行与服务器和存储设备相同的尽职调查。
安全性:人工智能通常涉及极其敏感的数据,例如患者记录、财务信息和个人数据。
泄露这些数据可能会给组织带来灾难性后果。
此外,不良的数据输入可能会导致人工智能系统做出错误的推论,从而导致错误的决策。
必须使用先进技术从始至终保护人工智能基础设施。
专业服务:专业服务应该成为基础设施决策的一部分。
大多数组织,尤其是经验不足的组织,不具备人工智能方面的必要技能。
服务合作伙伴可以在整个AI生命周期提供必要的培训、咨询、实施和优化服务,应该是部署的核心组成部分。
广泛的生态系统:对于人工智能供应商来说,与拥有广泛生态系统的供应商合作至关重要,这些供应商可以将人工智能的所有组件整合在一起,提供完整的交钥匙端到端解决方案。
而将这些组件拼凑在一起可能会导致业务延迟甚至失败。
因此,选择具有强大生态系统的供应商才能快速成功。
从历史上看,人工智能 (AI) 和机器学习 (ML) 项目一直由数据科学专家运行,但随着这些技术进入主流,它们正在迅速过渡到 IT 专业人员。
随着这种转变的发生以及人工智能 (AI) 计划变得越来越普遍,IT 组织应该更广泛地思考支持人工智能 (AI) 的基础设施。
组织不应为特定项目购买服务器、网络基础设施和其他组件,而应更广泛地考虑当前和未来的业务需求,类似于当今数据中心的运行方式。