【独家编译】虚拟化技术给数据中心带来了颠覆性的变化,但尽量减少服务器虚拟化主机的数量和过度增加主机数量并不是最好的选择虚拟机密度。在考虑虚拟化环境时,时代特征催生了一个新的趋势,就是将极其丰富的资源分配给单个物理服务器,并在此基础上支持海量的虚拟机系统。但需要注意的是,硬件故障这个老问题目前还不能完全遏制。将大量业务系统交给同一套设备往往会使宕机事件的影响急剧扩大,最终彻底粉碎我们乐观但不切实际的愿景。理论规划。我们并不是说为物理服务器配备128GB、256GB甚至1TB内存、16到48个CPU内核和大量10G端口有什么问题。如此强大的服务器可以轻松同时运行几十个甚至上百个(视具体工作量而定)虚拟机系统。在它的帮助下,我们可以将2004年需要三台1U物理服务器机架的处理任务完全交给今天一台1U服务器,这确实是一次了不起的计算资源革命。但与此同时,这样的趋势也相当危险。由于系统密度的不断增加,一旦某台服务器在特定情况下发生故障,其产生的严重后果远大于九年前一台1U服务器所带来的影响。然而,出于某种原因,这种类型的风险在创建虚拟化设施时并没有得到足够的重视。事实上,许多中小型企业可以在一台现代服务器上运行所有业务任务和服务器操作。只要业务虚拟机总数在四十到五十之间,单机支持是完全可行的。大多数企业会额外增加一台服务器来进行负载均衡和故障转移,所以我们相当于用四个CPU、任意大小的内存和四种电源设置来运行整个业务系统。这无异于回到大型机时代,但基础设施具有RAS(即可靠性、可用性和可维护性)特性。内部系统故障、电源问题、系统升级等都可能导致服务器无法运行,因此我们将不得不重复使用单个设备来满足数十个虚拟机系统的资源需求。从积极的角度来看,这种情况很少见;但从消极的角度来看,一旦出现这种情况,很可能会造成灾难性的后果。最近发现很多技术团队喜欢把尽可能多的虚拟机系统挤到尽可能少的物理服务器上,然后心满意足地“收工”。事实上,更理想的解决方案是减少单个服务器中的资源分配,并为整个设施添加更多的物理系统。诚然,许可成本是造成这种情况的一个重要原因。由于很多虚拟化框架的License是按照CPU和内存的多少来计费的,所以部署8台低配置服务器的License成本要比部署4台高配置服务器的License成本高很多。但是,将物理平台的资源压榨到极致的做法,必然会让我们失去应对宕机和物理服务器故障的能力。我们不会采用RAID1来部署主线存储机制,但是很多双机方案本质上是一样的,都是尽量减少设备数量。我们经常听到供应商宣称现代服务器硬件的可靠性和资源弹性如何,冗余系统如何在从电源到虚拟机管理程序的各个方面得到普及,以及我们如何减少设备数量和增加设备配置以降低许可证费用、能源消耗、和冷却成本。但无论您的基础设施硬件多么“有弹性”,故障都不可避免地会发生,这只是时间问题。最典型的例子是当特定的LUN锁定服务器中的I/O子系统时,文件系统将发生故障。此时,其他物理服务器中的虚拟服务器也可能受到影响。这些受影响的服务器可能至少需要重新启动或从备份中恢复丢失或损坏的虚拟机系统。一旦其他一些设备也出现问题,管理人员的压力会更大,因为整个部署设施都处于极大的风险之中。但随着服务器数量的增加,风险因素也会分散,压力也会逐渐减轻。请不要认为这是我故意编造的极端情况——几周前我确实遇到过这种情况。好在整个集群有八台服务器,我在解决问题的时候还得备份三台服务器。不必将几十台虚拟机的丢失一一梳理,有效减少了寻找故障根源所需的资源。如果您发现自己更喜欢一些大型设备而不是许多小型设备,请务必记住,有时越少并不总是越好。虽然较少的服务器数量可以更轻松地支持虚拟化工作负载,但它们会给未来的修复和升级带来潜在问题。由于数量有限,我们将不得不尽最大努力收拾碎片。就个人而言,我始终坚持使用八个小设备而不是三个大设备,因为在这些小家伙的帮助下,我的夜晚更加扎实和安全。原文链接:http://www.infoworld.com/d/data-center/when-server-consolidation-goes-too-far-218674原文标题:当服务器整合走得太远时
