当前位置: 首页 > 科技观察

运维经验分享:服务器成本优化策略

时间:2023-03-22 01:08:24 科技观察

在当前数据中心TCO成本结构中,服务器和机柜的成本是最大的成本,约占总成本的54%,其次是供电和散热,占比约占总成本的54%。约21%,可见服务器成本优化对控制整个运营成本起到了关键作用。当前服务器的发展趋势是大规模(高密度、定制化)、更低功耗、更高性能。各大公司主要与OEM厂商合作,根据各公司的业务类型进行定制。差异化,品牌信息内部屏蔽,包装。基于硬件的定制结合服务器分类、分级、分层实现成本优化有以下几点分享:服务器分类互联网公司有多个产品线,比如腾讯和百度有近百条产品线,每个产品线是分为产品,每个产品对应不同的硬件和网络。这些产品的重要性和规模各不相同。需要选择相应型号的服务器硬件,如图11-1所示,避免资源闲置和浪费。服务器一般分为以下几类。1、接入型服务器,主要用于WEB接入服务器,I/O密集型,CPU处理较少。这种类型的服务器是一种低成本的服务器。应该算是单电源模块和扩展槽,不支持热插拔,不支持RAID等。可以根据CPU、内存、SSD、硬盘等分为2~3类。也可以采用高密度服务器,如一U两机、两U四机,密度提升50%,功耗降低15%,服务器Rack租赁成本减半。2.平衡服务器,主要用于应用服务,可以理解为通用服务器,区别于专用服务器。它们可以用于逻辑服务或者中间层服务,可以按照CPU、内存、SSD、硬盘等进一步处理~3类。3、存储服务器主要用于在线和离线存储服务。大硬盘和大存储空间根据硬盘空间和类型又可以分为2~3种。这类服务器也是各大互联网公司服务器存储云的主力军。表11-1模块分类和服务器分类服务器分层根据产品架构分层,每一层使用不同类型的服务器,每一层服务使用一种类型的服务器,可以平衡性能,最大限度地利用服务器资源。易于管理,可批量上传扩容,可批量退役。一个优秀的运营规划师可以让各层的应用程序以最合理的方式使用服务器资源,从而避免资源闲置和浪费。服务器分类根据产品重要性、收入、在线时间等,可以对相应的服务器进行分类。1、优秀产品,如高产产品、明星新品,各层模块采用全新高配置服务器,保持低容量。并且每个季度提前准备好充足的扩容预算。2.稳定的产品。除了为稳定的产品维护2到3年的大容量服务器外,使用相应年份的服务器进行容量更新扩容,甚至根据容量将服务器下线合并。3.历史产品,小于4年的产品。这种业务经历了很多年,经历了多次研发,被多个产品线交叉使用。这种服务器最终会面临服务器老化和报废。需要提前将这类业务模块合并或者平台化,甚至剥离线下。服务器分类分级、分层定制,适用于非云公司和产品。一个优秀的运营策划师就像管家一样,把在线服务和成本管理到一个平衡点,在不浪费资源的情况下优化使用资源。业务分类平台降低运营成本运营资源(服务器、带宽、专线、各区域QOS+IDC)和产品线现有架构及实际增量需求(包括未来架构变更、扩容、优化)都与容量相关它与管理和成本管理相关,最终驱动预算和预算模型的实现,最终体现在运营成本上。大公司有多个业务部门和多个产品,每个产品都需要各种运营资源、能力管理、成本和预算管理。每个产品、每个团队都具备良好的策划能力是不现实的。通过将产品中模块的分类和提取合并到一个平台中,实现统一规划和管理,有效控制运营资源。服务分类及平台分享如下:按通用应用分类平台化说到淘宝,大家应该都不陌生,淘宝的CDN平台印象深刻。2012年双十一最高流量达到2000G,是互联网企业最大的静态应用平台。分析淘宝网站不难发现,静态图片贡献了淘宝80%~90%的流量。这个案例可以涉及到所有的电商网站、社区网站、门户网站等,通常平台主要有以下三个方向。1、静态平台、大图、小图、文本、JS、下载、视频等2、动态平台、逻辑、队列、消息、推荐、账号、关系、PHP、Java等3、数据平台、日志、计算、存储、数据库等将平台应用做到极致。淘宝的CDN就是一个例子。规模、架构、硬件、内容、速度、成本追求极致。这是一个应用平台的典型成功案例。这个应用平台可以做到部门级、公司级的平台,甚至是业界最好的平台。平台不是一蹴而就的,由小到大,由粗到精,不断吸取历史同类应用和新产品,不断壮大。传统运维新上线的业务,看似需要准备很多原材料,然后对原材料进行加工,但平台化之后,只需要组装组件,而这些组件不需要自己维护。混合分布最大化资源利用随着应用平台化和集约化,应用平台逐渐取代了传统运维的对象,即产品线,而应用平台由应用集群组成,因此集群成为当前运维随着各种业务的发展,各种集群的规模以每年数倍的速度扩张,大型应用平台服务器已经达到数万台服务器的规模。这些平台的功能和作用各不相同,大体分为三类:CPU密集型、I/O密集型和存储密集型。簇数越多,浪费越大。由于历史的扩张和服务器硬件的不一致,会加剧这种资源闲置和浪费。这种具有规模性和规律性的资源闲置,可以通过服务的混合分布来提高资源的利用率。速度。混合业务分布的前提1.平台业务,平台业务具有规模属性,也具备多地域、多IDC分布、数据分布、备份等必要的积累,可以快速集成进行混合部署。2.非突发和不同类型的业务。突发业务的负载会因为热点事件增加到正常的数倍,不适合混合部署。同类型业务由于资源竞争,不适合混合部署。同类业务资源的使用如果使用率低,可以根据资源使用趋势决定是否混合。3、硬件配置和网络分布紧密。在多个产品生命周期的每个环节,服务器和服务器所在的IDC都是批量购买和上线的,因为产品不是短时间内规模化的,硬件几乎每次都有巨大的变化年。变化,硬件接近度可以平衡各个区域模块的性能。如果硬件差异较大,会出现“头重脚轻”的性能不均,可进行硬件升级或更换,混配。混合服务的问题1.跨集群影响。由于不同的用户规模、不同的用户分析策略、不同的资源使用增长趋势,混合集群会产生一定的交叉影响。这种效果会在过载状态下发生。因此,在做好的前提下,可以有效避免容量管理。2.硬件交叉效应。硬件故障是不可避免且不确定的。这里的硬件是指在线生产环境中的所有硬件,如网络硬件、服务器、机架硬件等。硬件故障会导致混合分布式集群直接不可用,所以Mixing依赖于平台健康监控和自动恢复能力。【作者简介】本文作者唐文是《海量运维、运营规划之道》一书的作者,该书已在京东、当当、亚马逊上架。详情请关注:http://www.itkoala.com/?p=2777。