当前位置: 首页 > 科技观察

这些硬盘参数你知道吗?

时间:2023-03-20 19:46:52 科技观察

记得第一年工作的时候还在打工。我在中关村工作,接到了数百个540MB硬盘的订单。40MB到TB级别,从IDE、SCSI到SATA、SAS,我一直在关注硬盘领域的技术发展。希望这两个分享的内容能够对大家有所帮助:)  玩存储的朋友都知道,SSD固态硬盘使用闪存作为介质,所以不会像传统HDD硬盘那样出现机械故障。另一方面,闪存有一个P/E周期(program/erasecycle)的限制,即有写寿命,SLC/MLC/TLC的擦写次数有明显差异。那么,机械硬盘有读写寿命的问题吗?我想不是每个人都理解或关注这个问题。  了解不同硬盘之间的工作负载和可靠性差异,将有助于我们选择更合适的产品。5盘Nearline企业级硬盘,目前非充氦的极限密度为6盘。我们也会在本文后面讨论盘片数量、功耗和工作温度范围之间的关系。  横向对比:这么多种类的硬盘,你能认出来吗?目前硬盘行业整体营收受SSD的影响开始下滑,但未来几年仍会有可观的需求,尤其是大容量机型的性价比优势。而且,这个市场已经因为成熟而被细分。以希捷为例,只有3.5寸7200转及以下的硬盘衍生出了以下型号。  注:以上规格没有对照官方文档,仅供参考,后面补上自己整理的表格。其中,红框标出重点解释,篮筐部分代表有一定疑问的参数。  上表来自我几个月前看的一篇国外文章,总结了希捷硬盘的型号和规格。从左到右,Archive是SMR叠瓦磁记录的归档硬盘;Desktop就是普通的桌面硬盘;NASHDD适用于小型文件服务器/网络存储;视频3.5/2.5HDD针对消费类DVR视频应用进行了优化;监控专用用于视频监控;ENAS(EnterpriseNAS)适用于硬盘数量多的高端网络存储设备;ECAP(EnterpriseCapacity,原ConstellationES系列)是传统的Nearline硬盘。  此外,企业级硬盘市场的另一大厂商WD-HGST也拥有比较庞大的产品线,其特点是基于HGST的数据中心产品,如视频/流媒体、NAS应用等.更多在WD品牌下。本文首先使用希捷进行对比分析。  上表继承了上表的部分数据,引用了官方资料,部分是我自己计算的。标记为红色表示该指标优良。  在这张表中,我添加了两个对比产品系列:ConstellationCS(云盘)和高速10KSAS。其中,云盘现在官网上是买不到的,应该只能发货给互联网等大客户;硬盘规格仅供参考。  ConstellationCS“云盘”及其衍生低速版Terascale,其MTBF和AFR接近台式机硬盘。这恰恰印证了本文开头案例中提出的问题。  如果脱离了用户需求,谈任何参数都是没有意义的。下面是我遇到的几个实际案例。  案例一:备份数据量和硬盘选择去年的一天,一个互联网公司的朋友问我一个问题:他们现在的服务器大多是DellPowerEdgeR510和R720xd,现在需要采购硬盘用于数据备份。平均而言,每天写入每个硬盘的数据不到1TB。在这个场景下,每天都有大量的数据写入和读取。对磁盘寿命影响大吗?  由于是企业级应用,按365天计算,硬盘每年的读写负载约为360TB,我觉得原装配件中的Nearline硬盘更合适。那么这个结论是怎么得出的呢?  案例2:视频监控存储可以用“云盘”吗?计算了成本,发现价格与竞争对手相比没有优势。由于对方使用的是价格相对较低的监控硬盘,公司考虑是否可以使用企业级但成本较低的“云盘”(即希捷ConstellationCS)?  这个问题先放一边,看完这一系列的文章,相信你会有更全面的认识,再看看我遇到的另一个案例。  案例三:价格便宜——云盘故障率曾经听说国内某互联网公司用了一批“云盘”,后来遇到了故障率高的问题。“云盘”的价格仅略高于台式机硬盘,在各种细分的低速(7200rpm及以下)企业级硬盘中具有成本优势。那么,它的故障率在什么范围内才算正常呢?  Enterprisevs.Desktop:Performance,ReliabilityGap引自Intel的文档《Enterprise-class versus Desktopclass Hard Drives》,2008年4月  上图是较早前的对比资料,但机械硬盘技术的发展并没有快过年,所以还是有一定的参考价值的。其中,这里的“企业”指的是15K高速企业级硬盘;而7200转的企业级硬盘源自“桌面”,所以性能指标接近。  ***项,硬盘的延迟和寻道时间=平均寻道时间+平均旋转等待,15K由于旋转速度快,磁头臂移动速度快,所以有较大的超前;并且此项直接影响以下“TypicalI/Ospersecond”(无旋转振动的IOPS)。当然,这里的15K硬盘的319并不完全是机械结构的原因,还有上面命令队列(CQ)的作用——左边可以完全支持SCSI/SAS协议,而ATA支持上右侧有限,在高并发情况下提升较小(注:7200-rpmNearline硬盘寻道速度较快时,该值应高于77)。  1震动对硬盘的影响及预防接下来就是抵抗旋转震动的能力了。15K硬盘可达21rad/sec/sec。这里的Radian应该是弧度单位的一种。我不是这方面的专家,所以我不会在这里讨论。台式机硬盘的索引只有5-12(根据本文后面列出的数字,7200转的企业级硬盘也在这个范围内)。  正如专家所说,如果将硬盘固定在足够稳固的底座上,它就不会受到自身和外界震动的影响,能够发挥出最佳的性能和寿命。但真实环境往往不是这样。存储服务器/磁盘阵列机箱中通常有多个硬盘,同时工作时难免会发生共振。这里涉及的因素主要包括硬盘的速度、数量和结构设计。  很多朋友应该都知道,磁盘阵列的空重往往比同尺寸的服务器要大很多,采用更厚的钢板可以“吸收”一部分震动。虽然不止一家厂商声称可以混用不同速度的硬盘,但实际上并不推荐这样做。  过度的振动会影响磁头的定位,导致硬盘性能下降,甚至寿命缩短。防旋转振动基本上是伺服电路根据传感器信息补偿振动。10K、15K高速硬盘自身产生的震动更强,所以在设计上“容忍度”也更强。如上表所示,在20rad/sec/sec的旋转振动条件下,15K硬盘的IOPS仅略有下降;而台式机(7200转)硬盘的性能下降了10倍以上,可见磁头定位的难易程度。  下面的“双工模式”,SAS支持全双工,SATA是半双工,这是SCSI和ATA协议的区别。SAS硬盘驱动器提供双端口,可以同时连接到两个控制器以实现故障转移。关于可变扇区大小,我们稍后再讨论。  2可靠性前提和NL硬盘的由来我们再来看看可靠性。高速企业级硬盘的MTBF(平均故障间隔时间)约为120万小时。现在,由于技术的进一步成熟,设计/制造标准已普遍达到200万小时。而台式机硬盘还停留在70万小时左右,没有动力也不需要为此增加成本。  这里容易忽略的是MTBF的前提条件。高速企业级硬盘,环境温度45℃,7x24小时100%工作负载;而台式机硬盘在25°C的环境下,10-20%的工作负载5x8小时。  以上截图来自《Seagate Enterprise Capacity 3.5 HDD v5 Serial ATA Product Manual》  。同样是7200转,但是面向企业应用的Nearline(近线)硬盘要比台式机硬盘可靠得多。首先是MTBF和AFR(平均故障率)。目前大部分Nearline磁盘都可以达到140-200万小时的MTBF,这个数据是在40℃、全年7x24小时连续启动的条件下得出的。  注:后面会介绍MTBF和AFR的换算关系。这张照片来自我2004年做服务器测试时做的MaxLinePlusII近线硬盘的技术规格,7200转的ATA接口250GB在那些年也算是大容量了,硬盘的存储密度10年间增长了近20倍。当时100万小时的MTBF明显高于台式机硬盘(同期约60万小时)。照片不够好还望大家多多包涵:)  记得第一款Nearline硬盘是迈拓的MaxLine系列推出的。当时根据经验,建议近线硬盘不要超过工作负载的20%。如果故障率超过这个水平,故障率就会超标。经过十多年的发展,硬盘厂商做了大量的分析和统计工作,认为读写数据量是一个比较合适和容易量化的指标。根据本文开头的两个表格,目前业界一致认为Nearline硬盘的工作负载为550TB/年。如果明显超过,故障率会增加。  小知识:硬盘读写负载与SSD擦写寿命关于这一点,除了硬盘是一个推荐值,SSD有一个“硬指标”外,一方面,SSD只有有限的擦写次数次数和不限制读取,同时硬盘不读写是必须要考虑的;另一方面,SSD的寿命来自于每个闪存单元的特性,相同条件下可写入的数据量与容量成正比;而硬盘并不是容量越大越好,因为磁头的老化与其读写的数据量有更强的相关性。  当然,10K/15K高速硬盘在质保期内没有这些限制,所以档次不同,每盘容量和单位容量的价格也有明显的差距。  3环境规格——温湿度范围上图引用自《HGST Hard Disk Drive Specification - Ultrastar 7K6000》  这里是一份HGST硬盘资料中的环境规格。有两个相似的梯形(右边不是直线)嵌套在一起,大面积是硬盘的非工作温度和湿度范围,里面的小面积是工作温度和湿度。可以看出在5-31°C之间可以支持90%的相对湿度,但是在60°C时只能支持10%的相对湿度。  只有少数低速(10K以下)企业级硬盘带有湿度传感器。本文包括数据中心的三个系列:归档、ENAS和企业容量。  4MTBF不是虚标:年平均故障率可用性换算,除了Video3.5的AFR值,其他列出的都是MTBF。使用MTBF计算AFR的公式如下:  年平均故障率AFR=1/(MTBF/365/24)  MTBF看起来很高,上表最长200万小时(8TB机型,目前希捷6TB及以下Nearline硬盘为140万小时)相当于228年,最短的75万小时为85年。其实它们的设计寿命并没有那么长(一般是8-10年),从温彻斯特硬盘的发明到现在没有那么多年。这些可靠性不是针对单个硬盘,而是在保修期内根据大量样品进行计算和统计的。记得十多年前,我所在的公司有一位孙老师。她主持的10万小时PCMTBF测试是在多台设备上进行的。根据上面的公式计算出EnterpriseCapacity的AFR为0.44%,也就是说100个磁盘平均每年损坏0.44个磁盘,如果10000个磁盘损坏就是44个磁盘。  读写负载、使用率、支持盘数,台式机硬盘最好。除了表中的以外,都支持7x24连续开机,桌面硬盘官方建议只配置1-2块盘。换句话说,它没有针对抗旋转振动进行优化。如果您实际使用超过3个磁盘进行RAID,您可能会遇到性能下降和寿命缩短的问题。  EnterpriseCapacity(ES)年读写负载550TB,ENAS300TB,其余4款180TB——远高于桌面硬盘的55TB。可能这些数字不够直观,后面我们会用到它们来简单计算每天和每秒的平均读写负载。  至于机箱支持的硬盘数量,直接关系到另外两个规格——旋转振动传感器和抗旋转振动耐受性。例如,没有RAFFSensor、NAS、Video3.5硬盘的台式机支持小系统规模;监控和归档硬盘驱动器具有RAFF传感器和5弧度/秒/秒的抗振指数。根据***资料,他们可以支持8个以上的配置;然而,在12.5弧度/秒/秒的高振动环境中,它们的性能可能不如ENAS和EnterpriseCapacity。我将在本文后面列出更多引用。  关于硬盘转速,两款7200转的表现都比较不错;希捷目前主流的台式机硬盘应该都是7200转的,早期的低速BarracudaLP应该已经退出市场;Video3.5由原来的PipelineHD发展而来,一直是5900转;监控盘是从7200转的SV35发展过来的,现在4TB及以下应该降到5900转,5-8TB的型号降到7200转。