随着超融合在国内市场的兴起并逐渐成为主流,一场IT基础设施的技术变革正在悄然来临。沿用了20多年的传统IT架构正面临新一代架构的严重冲击。近年来,面对巨大的市场机遇,超融合厂商如雨后春笋般涌现,并不断涌现。企业用户数字化转型的发展得益于超融合架构的创新,但同时也面临着如何评估和选择优质厂商和产品的问题。 国内外这些主流超融合厂商有什么区别?他们的产品有什么优点和缺点?应该从哪些方面来评估超融合架构拨开迷雾?融合与厂商帮助超融合入门用户全面、深入地理解超融合的概念,从关键方面了解不同厂商和产品的特点,从而根据自身情况进行有针对性的评估和选择。企业。 1。超融合是概念还是技术? 超融合是构建IT基础设施的一种方式。其核心思想是用通用硬件,用软件来定义IT基础设施的各种服务,包括:计算、存储、容灾、运维管理等,而这些服务都在一个统一的平台上。 超融合的概念包括三个要素: 使用通用硬件:具体来说就是x86服务器,所以如果有IT平台有专有硬件,就不属于超融合。例如,传统中心化存储中的存储控制器属于专有硬件; 软件定义:即通过运行在x86服务器上的软件实现超融合IT服务,如:分布式存储软件实现数据存储服务;相比之下,传统IT服务大多使用专有硬件,功能逻辑硬编码在固件中; 统一平台:所有IT服务必须在一个平台下,属于同一个软件栈,不同于以往IT服务架构方式,每个服务都会属于不同的平台;需要特别区分的是,市场上将存储设备、服务器、网络交换机放在一个机柜中整体交付的一体化方案,如:VCEVblock,与超融合是完全不同的。 由此可见,超融合是一个概念,而不是一种技术。了解超融合本身非常重要。不同超融合产品和厂商之间的差异或差距不在于概念本身,而在于超融合背后的技术和实现。打个简单的比方:“汽车”是一个概念,字典里的定义是:“通常是四轮自动驾驶汽车,用于街道和公路运输”。在这里,对于如何实现这个概念没有规定和限制,所以不管是纯电动特斯拉,还是福田小货车,还是高尔夫球车,都符合上面的定义,但是使用场景和背后的实现天壤之别。. 2。评估超融合平台需要关注哪些核心问题? 了解到超融合只是一个概念,进一步追问:各个厂商的超融合产品在实现上有什么不同?这是选择超融合Focus的真正问题,有四个子问题: 1。超融合平台集成了哪些IT服务? 1)分布式存储打破数据IT服务,软件定义存储是基石。这里需要说明一下:pooledserver的本地存储要求软件定义的存储必须是分布式的,可以作为虚拟卷供虚拟机使用。如无特殊说明,超融合平台中的软件定义存储是指分布式块存储。 没有稳定可靠的分布式块存储,就不可能对外提供存储资源的统一抽象。如果没有统一的抽象,每个服务器的本地存储就是一个数据孤岛,与传统的单机存储没有区别。因此,讨论超融合平台而不讨论分布式块存储,回避展示平台IT服务类型的重要性,甚至以支持的IT类型数量作为超融合的代数标准也基本可以判断成为一种“误导”,本质是这类厂商不具备超融合和分布式存储的研发能力。主流核心厂商无一例外在分布式块存储上具备核心竞争力和自主研发能力,如:NutanixAcropolisEnterpriseStorage(内部称为NDFS)、VMwareVSAN、SmartXZBS等均对应超融合平台核心分布式存储。 2)虚拟化计算也不可或缺网络服务的功能融入到虚拟化计算中。由于Hypervisor技术相对成熟,无论是闭源的VMwareESXi还是开源的KVM,无论是功能还是性能都经过了多年的市场验证。因此,超融合平台的虚拟化计算服务基本集中在VMware产品和基于KVM的自研产品,如:Nutanix的AHV(基于KVM)、VMware的vSphere(基于ESXi)、SmartX的Elf(基于KVM)),ETC。当然,Nutanix和SmartX也支持VMware虚拟化计算平台,加上其强大的存储服务,整体超融合平台的性能甚至优于VMware。 3)一个平台管理多个IT服务,简化运维是趋势如:容灾服务、全闪存存储、容器服务、网络服务、安全服务等。 是一个一平台多IT服务的趋势,伴随着革命性的变化:在传统架构下,需要运维和管理多个IT平台。超融合下,一个管理平台就够了。为从新的角度看待IT运维提供了很大的想象空间。同时,在超融合架构下实现强大易用的统一管理平台的重要性和优先级也被提升到前所未有的高度。超融合领导者NutanixSmartX在运维管理平台上下功夫,推出了智能强大的管理平台:NutanixPrism和SmartXFisheye,大大提高了系统的易用性。 综上所述,超融合平台中的分布式块存储、虚拟化计算、统一运维管理平台是最小最核心的集合。缺少其中任何一个,就不能称为超融合平台。但随着硬件的发展,必将有更多的业务在超融合平台上实现。 2。这些IT服务是如何实现的? 评估超融合产品的关键不是看包含了哪些IT服务。将更多IT服务放入超融合的“盒子”中要糟糕得多”IT服务的质量很重要。一些厂商会利用客户对超融合市场的不成熟认识,盲目争夺超融合平台的服务和功能数量。通常的做法是利用开源项目,比如:“OpenStack+开源分布式存储(Ceph/GlusterFS...)”,构建一个看似庞大而综合的“超融合平台”,以快速推向市场。可以看出,最终几乎没有用户能够真正使用。究其原因,这种拼凑而成的“超融合”产品,其各个服务组件的质量往往过不了关,在可靠性、稳定性、性能等方面存在诸多问题。再加上开源社区基本不受这些厂商的控制,所谓的售后支持也没用,很难做到一个产品该有的上市准备。 1)执行机制是核心。 服务的核心在于实现它的技术和机制。举个手机电池的例子,为了实现手机的长续航,一家厂商只是简单地增加电池块的容量,而另一家公司则采用优化手机软件的电池管理算法。即使是期末考试,也能坚持两天。但是第一个手机的实现机制不如第二个,因为加电池块会导致手机发热,有电池爆炸的风险,但是这些缺陷无法在指标上体现出来测试电池寿命。 同样的道理也适用于超融合产品。超融合产品竞争中最重要的一定是分布式块存储、虚拟化计算、运维管理平台的实现。 最重要的是软件定义存储,它是超融合平台的基石。目前市场超融合平台分布式块存储的实现方式有两种: ——自主研发,如:NutanixNDFS、VMwareVSAN、SmartXZBS、华为融合存储; ——直接采用开源的分布式存储,可能在开源的基础上稍作修改,如Ceph、GlusterFS;对存储几乎没有控制和维护能力。存储系统与其他系统无异,守护着企业最重要的数据。一旦出现问题,将陷入束手无策、一发不可收拾的境地,给企业带来的损失将是惨重的、不可估量的。 这里有一个不容忽视的事实。国外知名超融合厂商无一例外地走上了自主研发的道路,这也证明了在成熟的市场环境下,用户会理性选择自主可控、有保障的产品。产品。纵观IT发展史,甚至没有一家存储公司利用开源存储项目实现自己的存储产品,并取得产品和商业上的成功。再次验证了存储关系到业务连续性、数据可靠性和安全性。没有企业客户“敢”将业务委托给不可控的存储产品。 市面上所有的分布式块存储架构基本上可以收敛到两种类型,一种是依赖元数据服务的数据放置和分发,另一种是依赖一致性哈希的数据放置和分发。但就分布式块存储本身而言,两种数据架构各有优势。但在超融合场景下,元数据服务方式更具优势,数据的放置更加灵活可控。例如,VM数据本地化可以缩短I/O路径,大大降低网络流量。使用这种架构的产品包括NutanixNDFS和SmartXZBS。 第二是虚拟化计算。与存储不同,虚拟化的核心技术Hypervisor相对成熟。超融合产品更多的是竞争虚拟化平台的支撑能力。支持多个虚拟化平台意味着更少的供应商锁定风险。另外,是否支持虚拟化的特殊接口也是一个很重要的指标,直接影响到用户体验和维护支持,比如:VMwareVAAI/VVol,CitrixReady等。这个比较优秀的国外厂商是Nutanix,支持几乎所有的虚拟化平台;国内厂商SmartX和华为支持除Hyper-v外的所有虚拟化平台;VMware只支持自己的虚拟化平台,开源超融合方案一般只支持SupportKVM。 KVM被很多厂商选择作为开源hypervisor,但是每个公司都需要实现自己的虚拟化计算管理平台。除了基本的VM生命周期管理,还需要至少实现企业级的通用功能,比如:VMHA、VirtualDistributedSwitch、共享磁盘等。 除了存储和计算,其他IT服务更多或多或少依赖以上两类核心服务,例如:容灾和备份依赖存储服务;容器编排依赖于计算服务。 2)需要评估资源消耗 除了业务实现机制,超融合平台还有一个特殊的要求:资源消耗越小越好。在超融合场景下,消耗大量资源是绝对不能接受的。每台物理服务器除了运行存储、计算等多项IT服务外,还要将剩余的资源分配给业务应用。业务应用的资源更小,甚至被挤压到业务无法运行的地步。资源消耗不仅是节省TCO的指标,也是影响超融合实用性的重要变量。 收集了各厂商分布式块存储产品的资源消耗情况。 3。如何整合和管理服务? 1)三种各有优缺点的服务集成方式存储与虚拟化的集成。它大致可以分为三类: -存储服务作为内核模块运行在管理程序内部。最典型的代表就是VxRail,将存储服务VSAN集成为一个ESXi/vSphere内核模块。在这种架构下,存储服务直接访问存储设备,不经过hypervisor,几乎没有性能损失。理论上可以充分利用本地I/O性能。遗憾的是,VSAN的实际性能在超融合产品中并不突出。应该是存储软件。在优化上相比其他厂商还是有差距的。这种紧耦合架构存在以下风险: ——厂商锁定风险,如VMware超融合平台虚拟化计算锁定vSphere; -计算和存储不能独立升级; -存储或虚拟化任何一项计算服务出现问题,都可能影响另一项的正常工作。 -存储服务运行在Hypervisor上的独立虚拟机中。这个虚拟机实际上充当了一个虚拟存储设备VSA(VirtualStorageAppliance),所以它也被称为控制虚拟机(Nutanix称之为CVM)或者存储控制虚拟机。机(SmartX调用SCVM)。VSA需要通过Hypervisor访问物理硬件资源。一般VM为了降低性能开销,会直接访问硬件资源,如:HDD、SSD、网卡等。在这种架构下,虚拟化和存储是解耦的,互不影响,可以独立升级。即使VSA发生故障不工作,也不会影响物理节点。通过I/O路由技术,VSA故障节点上的VM会通过其他正常的VSA访问存储资源。当然,对用户最大的好处是消除了hypervisorlock-in的风险,VSA可以支持多种虚拟化计算平台。使用此集成的产品包括Nutanix、SmartXHaloforVMware。 -存储服务在管理程序之外运行,但与管理程序属于同一软件堆栈。这种架构适用于KVM超融合平台。比如SmartXHalo超融合平台自带的虚拟化平台Elf就是基于KVM实现的,而分布式块存储ZBS和Elf都在Halo(SmartXOS)软件栈上。这种整合最大的优势在于: ——性能优于VSA; ——存储或Hypervisor故障互不影响。 2)只有做好管理和运维,才能发挥超融合的优势 由于涉及的IT服务比传统平台多,超融合更强调管理的重要性和易用性平台。一个强大易用的管理平台,可以大大提高运维效率,降低运维成本,充分发挥超融合架构的敏捷特性。 超融合厂商管理平台一览: 一个优秀的超融合管理平台,应该覆盖产品交付到日常运维的方方面面: -Web化管理UI应该是标配超融合平台的同时,web管理服务也是一种超融合服务,需要考虑管理控制台的高可用;NutanixPrism和SmartXFisheye都是分布式管理平台,不存在单点故障。相比之下,VMwarevCenter存在单点故障的风险; ——集群服务管理,包括:存储、虚拟化、网络管理等;更进一步,由于使用了软件定义技术,管理平台还应该能够展示和洞察更细粒度的服务,例如:软件定义存储中的分布式组件服务; -基于事件、基于性能的监控、分析和告警。可以说各种产品或多或少都支持这方面,但仔细研究会发现丰富的功能准确度和易用性因产品而异。Nutanix和SmartX的产品在这方面非常突出。两者都可以在全局集群、物理服务器和虚拟机三个层面提供丰富的性能和事件监控、分析和告警。 -自动化的图形安装程序。易于安装和部署不仅是系统快速上线的关键,也是超融合作为软件交付的必要前提。NutanixFoundation和SmartXTuna都提供了非常方便的UI安装部署工具,整个部署过程通常可以在一个小时内完成。完全的; ——系统硬件管理,一个好的管理平台还应该能够支持数据中心硬件的拓扑管理和配置,在这方面VMware、Nutanix、SmartX都非常好,尤其是Nutanix和SmartX提供manage。 4。产品的交付方式有哪些? 超融合依赖于标准的x86服务器,一般可以是安装了超融合软件的一体机,也可以是独立的软件license。目前主流厂商支持的发货方式如下:
