当前位置: 首页 > 科技观察

超级计算机,释放大数据力量的强大工具

时间:2023-03-22 00:58:18 科技观察

在今天的文章中,我们将从六个角度讨论为什么企业,甚至初创企业都在使用超级计算资源,以及IT组织如何利用这个强大的工具帮助满足需求大数据和业务分析。制造商、物流公司、制药公司和能源巨头有一个共同点:他们都在使用超级计算设备来突破研发的界限,并回答在实际中难以或不可能回答的问题。.各种组织现在都在使用云服务和PC来处理过去需要超级计算机处理的任务。在云计算快速发展的今天,相当一部分高性能计算工作已经转向云环境作为实现平台,此类产品、服务和解决方案的供应商进一步瞄准了超级计算机研究和科学领域。然而,随着云解决方案和超级计算机的不断演进,这两类机制的使用并不一定相互排斥。一些公司已经与大学甚至最先进的实验室合作以获得强大的处理资源——有些公司甚至拥有自己的超级计算机。我们发现很多公司都在这方面采取行动,并开始在我们这里并行处理高达petaflops的计算负载,”橡树岭国家实验室计算和计算科学副主任JeffNichols在接受采访时指出来自汽车工业、航空、能源和科学领域的公司正在寻求与我们合作,以解决他们面临的大规模科学问题。橡树岭国家实验室和计算科学伙伴关系——后者是橡树岭联合研究所与田纳西大学联合成立——各自拥有一批先进、领先的计算资源和多种架构选择,可以支持它们解决各种大规模计算任务。“泰坦”是橡树岭实验目前正在世界上最大和第二强大的超级计算机。这是一款计算能力为270exaflops的CrayXK7设备,它使用299,008个16核AMDOpteronCPU、18,688个NvidiaTeslaK20GPU加速器和710TB的整体系统内存。除了拥有极其强大的硬件基础外,CSCA还优化了软件包和专有软件,使其能够在超级计算机或云环境中更高效地运行。此外,计算科学合作署还有20名具有博士学位的技术人员。物理、化学、计算科学等专业学位,精通机器语言。它们可以帮助机构用户了解哪些任务可以通过计算完成。并且因为他们的科学家身份,他们也帮助企业享受到最多的技术成果。当你开始使用计算机制时,你首先需要弄清楚问题本身,并获得更多的计算资源。在这方面,不熟悉情况的新人会立即碰壁。知识渊博的用户知道如何使用它。规模计算任务分布在设备上的所有节点上,但它们最终仍面临其他挑战。例如,他们可能需要更多的内存或使用更多的计算资源,以便能够在合理的时间段内完成任务处理。让我们来看看企业乃至初创企业采用超算资源的六个起点,包括为什么IT组织有理由考虑使用超算设备来满足他们的大数据和业务分析需求。#p#datasetinmemory如果a数据集太大,或者想合并多组大数据集,那么这些数据往往无法挤进内存。解决这个问题的一种方法是将其Split组合成更小的部分,并独立分析每个部分。虽然有很多方法可以分析这些数据,但许多分析措施只能在所有相关数据驻留在内存中时才能执行——除其他外,这大大缩短了整个分析过程。此外,当所有数据都在记忆中时,我们通常能够提出更多类型的问题,扩大我们的发现范围,并找到更深层次的关系。如果我想得到一个问题的正确答案,我会引入我需要的所有数据并彻底查询它,这样我就可以最大限度地提高我的结论的可靠性,”计算科学伙伴关系主任托尼·梅扎卡帕(TonyMezzacappa)在一个采访解释说。一个很好的例子是识别欺诈性医疗索赔,因为这种情况通常涉及大量数据。通过将所有数据带入内存,我们可能会发现某个案例中有些东西是孤立的,这意味着有可能欺诈,田纳西大学研究与经济发展办公室商业分析主任肯吉尔伯特在一份声明中说。在接受采访时说。极其强大的计算能力目前,世界上一些领先的企业正在使用超级计算机来扩展他们的业务。计算能力。即使他们已经拥有自己的超级计算设备,一些公司仍然偶尔与大学或最先进的实验室合作b因为他们希望拥有更强大的计算能力或资源集合,以更有效和高效地解决特定问题。实验和产品开发工作是广泛而耗时的,”计算科学伙伴关系主任TonyMezzacappa说。在制药行业,超级计算解决方案在加快药物开发和降低药物开发成本方面发挥着重要作用。飞机制造商超级计算机正在用于处理流体动力学中的大量计算问题。企业和市政机构使用超级计算机来提高交通流量执行效率,而数据是由部署在街道上的传感器产生的。企业可以利用这些数据优化高级车辆路线和交付时间,同时降低燃料成本和碳排放量。市政机构使用这些数据来改善交通状况,提高抗灾能力,并更有效地执行疏散策略。#p#互连至关重要,过去的企业现在可以更有效地使用自己的资源和云服务来处理大规模数据收集。但考虑到节点间的互连速度,超算方案的实际效果往往更优。不同的互连Connectivity会对实际执行时间产生巨大影响,”ComputationalSciencePartnership主任TonyMezzacappa说。你可能有一个巨大的集群,但有时这个集群可能无法有效地执行大规模计算任务。在事实上,互连机制将是决定并行计算设备实际效率的关键因素。橡树岭实验室计算与计算科学实验室副主任杰夫尼科尔斯认为,在云服务和超级计算机之间进行选择时,我们需要首先明确数据和数据移动(即处理器和存储系统之间的数据交换状态)、计算资源需求、需要的节点数量。如果能在云环境中解决相关问题,那么云解决方案当然是最好的,”尼科尔斯说。然而,许多因素也限制了人们使用云服务来处理工作负载,包括计算内容的隐私属性或控制出口的能力。顾虑等。但只要排除这些问题,云服务确实很便宜,而且往往是最好的替代资源供应。先进的建模能力超级计算机用于从糖果加工到轮胎制造等行业,计算科学合作组织的科学家帮助这些用户微调他们的建模能力。对于轮胎制造商而言,这意味着在生产和组件制造的各个阶段制造组件,包括使用橡胶、聚合物和其他原材料制造组件,引入建模机制。整个过程具有非常复杂的层级结构,与公司的经营决策、轮胎产品的生产、制造轮胎的设计开发、轮胎的安全性和可靠性以及具体的销售方式等密切相关。不确定因素在过程中是绝对不允许存在的,因为轮胎的安全性和可靠性直接决定着使用者的生命财产安全。有各种类型的数据,包括模拟数据和基于从这些数据中总结的一些实验信息的分析结果,“计算科学合作局局长托尼·梅扎卡帕说。你需要将实验数据作为输入信息导入到模型中,然后这些模型会根据轮胎和模型的实验数据生成进一步的输出结果,告诉我们它在特定情况下会发生怎样的变化。这样,我们就可以利用实验信息来发现模拟数据周围的所有可能存在。意外情况,通过刻意改变输入输出结果来量化不确定因素,从而确定如何更准确地模拟以及由此产生的影响。最终的轮胎设计是否足够安全?超级计算机会告诉我们答案。#p#扩展可能性的边界对于不熟悉当前超级计算机甚至云功能的企业来说,他们可能根本不了解计算可以做的令人惊奇的事情。因为解决问题的能力严重受限,他们不可能意识到如今的计算资源有多么强大超乎想象,自然也就没有办法找到问题的最佳解决方案。有时候,新手可能不知道从哪里开始或者先问什么样的问题,所以我们会设计一套理解点,引导他们去把握自己想做什么,告诉用户我们在做什么,我们可以提供什么资源以及我们可以具体解决哪些问题,包括那些可以提出并解决特定问题的人,”计算科学伙伴关系主任TonyMezzacappa说。当他们了解了可能性的具体范围时,他们的视野也开阔了,因为他们认为不可能的任务实际上是非常可能甚至容易的。当问题超出现有系统的计算能力时,企业用户可以根据自己的实际需要,向云服务提供商或ComputingSciencePartnership等机构寻求帮助。精通计算科学的企业用户经常求助于计算科学伙伴关系以获取额外的资源——计算资源、内存或两者——或可以在许多不同系统(例如共享内存计算机或分布式系统)中串联执行的资源集合内存计算机)执行相应的工作流程。加快发现的步伐大型和历史悠久的公司通常拥有数十年使用超级计算机的经验,但一些初创公司也同样渴望使用超级计算资源来解决问题。例如,Atomwise是一家决心改变药物发现和开发方式的初创公司,它使用IBM的超级计算机测试了7,000种药物,希望找到治疗埃博拉病毒的有效方法。经过四个月的虚拟探索,他们设法找到了两个有效性证据。目前,计算科学合作署和橡树岭国家实验室已经拥有大量的初创用户。原标题:超级计算机释放大数据的力量

猜你喜欢