当前位置: 首页 > 科技观察

限制AI潜力的主要基础设施挑战

时间:2023-03-20 00:44:43 科技观察

数字房地产公司Interxion的营销和业务总监PatrickLastennet研究了AI创新加速所面临的障碍。它认为,从一开始就为AI部署制定强大的基础设施战略非常重要。人们对人工智能的需求越来越大。各行各业的企业都在探索如何利用人工智能加速创新并提供强大的竞争优势。然而,设计AI基础设施非常复杂且负担不起,因此,76%的企业将基础设施视为AI成功的障碍。尽管如此,这仍然不是放慢进度的借口。随着越来越多的企业积极追求或至少落后于AI,那些等待的企业只会落得更远。最近对八个欧洲国家的IT决策者进行的一项调查发现,近三分之二(62%)的组织目前正在部署或测试人工智能,另有17%的组织计划到2020年使用它。受访者指出,一些基础设施障碍限制了人工智能的大规模部署,从缺乏资金、人员和物理基础设施等资源,到不明确的企业战略不考虑人工智能。由于AI部署对于许多企业而言构建缓慢,因此进入部署阶段的企业与尚未开始规划的企业之间将形成巨大的技术差距。不愿投资人工智能的企业将错失获得竞争优势的机会。这就是为什么从一开始就为AI部署制定强大的基础设施战略如此重要。这里有一些问题需要考虑。成功的障碍通常,领导主要AI研发工作的公司没有从IT获得大量初始投资。因此,不幸的是,团队产生了影子AI——在IT的监视下创建的AI基础设施,难以成功运行并最终无效。企业可以通过制定专门针对人工智能优化的基础设施战略来避免影子人工智能。该调查强调无法计算的成本是最令人担忧的问题(21%)。从对人员和设备的新投资需求,到人工智能设计和部署之间曲折路径上的不可预见成本,再到技术需求的快速创新和转变,人工智能投资可能规模庞大且难以预测。此外,如果企业未能部署该技术,IT和人工智能开发之间的内部脱节可能会导致投资回报率低下。缺乏内部专业人员也是一个重大挑战。组织通常需要聘请专业开发人员,这可能成本高昂,而且新员工需要时间来学习业务以满足AI设计和组织目标。IT设备不足也阻碍了企业设想如何将AI集成到他们的运营中。根据调查,许多企业担心他们当前的基础设施没有针对支持AI进行优化,而且数据中心正在达到容量极限。战略阶段的障碍在各个行业大体相似,但具体的基础设施决策可能因行业而异。GDPR等法律或合规性要求,以及涉及的数据和工作流类型,将影响AI基础设施决策。该研究发现,39%的各行各业的企业使用主要的公共云——其中大多数是寻求灵活性和高速的制造商。与此同时,29%的受访者更喜欢由顾问支持的内部解决方案——通常是希望将个人身份信息(PII)数据置于严格安全和更好控制之下的金融、能源和医疗保健公司。成功的AI基础架构的要素由于许多企业都是从头开始,因此必须从一开始就制定明确的战略,因为事后重新架构可能需要大量时间、金钱和资源。为了成功地大规模启用AI,企业需要检查多个领域。首先,组织需要能够确保他们拥有合适的基础架构,以支持为AI工作负载准备的数据集所需的数据摄取和收集。特别是,必须注意从运行AI推理的边缘或云设备收集数据的有效性和成本。理想情况下,这需要在全球多个地区完成,同时利用高速连接并确保高可用性。这意味着企业需要一个由网络结构支持的基础设施,该基础设施能够提供:接近人工智能数据:企业数据中心的5G和固网核心节点将来自现场设备、办公室和制造设施的人工智能数据带入区域互连的数据中心,以沿多节点架构的过程。直接云访问:提供对云超大规模环境的高性能访问,以支持AI训练或推理工作负载的混合部署。地理规模:通过将基础设施部署在位于战略地理区域的多个数据中心,企业可以在全球范围内实现低成本的数据获取和高性能的AI工作负载交付。当企业考虑训练AI/深度学习模型时,必须考虑能够容纳必要的电源和冷却技术以长期支持GPU加速计算的数据中心合作伙伴,这需要:高机架密度:支持AI工作负载,企业需要从其数据中心的每个机架获得更多的计算能力。这意味着更高的功率密度。事实上,大多数企业都需要将其最大密度至少提高三倍,以支持AI工作负载并为未来的更高水平做好准备。数量和规模:利用AI优势的关键是大规模实施。在大规模硬件(GPU)上运行的能力使大规模的计算效果成为可能。通往AI的现实之路大多数本地企业数据中心无法处理这种规模的数据。与此同时,公共云提供了阻力最小的路径,但由于成本高或延迟问题,它并不总是大规模训练AI模型或将其部署到生产中的最佳环境。那么,对于希望设计基础架构以支持AI工作负载的企业而言,最佳方法是什么?通过研究已经从AI中获得价值的企业如何选择部署其基础架构课程,可以吸取重要的经验教训。谷歌、亚马逊、Facebook和微软等超大规模企业已经使用自己的核心和边缘基础设施成功地大规模部署了AI,通常是在高度连接的高质量数据中心。他们在世界各地大量使用主机托管,因为他们知道主机托管可以支持他们所需的规模、密度和连接性。通过利用这些AI领导者的知识和经验,企业将能够在AI方面规划自己的命运。