戴尔PowerEdge R760是一款2U机架式服务器,支持两个第四代Intel? Xeon?可扩展处理器(每个处理器最多可配置56个核心)和最多24个处理器NVMe 驱动器采用 NVMe Gen5 EDSFF E3.S 外形规格。
在为特定用例配置 PowerEdge 时,新的 SSD 外形尺寸对于决策尤为重要。
PowerEdge R760 CPU、GPU 性能评测 与大多数 2U 双 CPU 机架服务器一样,PowerEdge R760 具有几乎无限的选项。
由于 StorageReview 在本次评测中重点关注 CPU 和轻型 GPU 性能,因此所选的配置并未最大限度地提高平台的性能。
事实上,PowerEdge R760可以配备双56核CPU和8TB RAM。
仅CPU就有数十种选择,包括Xeon Silver、Gold、Platinum和Max系列。
建议用户在配置服务器时与销售人员讨论具体需求。
本次评测的PowerEdge R760采用以下配置: ●2个Intel? Xeon? Gold 6430(每个32核/64线程,1.9GHz基础频率,3.4GHz睿频,60MB缓存,270WTDP) ● 1TB DDR5 内存 ● Microsoft Windows Server 2019 ● NVIDIA A2 或 T4 GPU(用于 GPU 特定测试) 为了演示 PowerEdge R660 和 R760 系列中可用配置的多功能性,StorageReview 将 R760 与R660,其配置如下: ● 2 个 Intel? Xeon? Platinum 8452Y 处理器 ● 512GB DDR5 具体到性能测试,StorageReview 使用了 HWBOT x265、y-cruncher、Geekbench 6、Blender 等主流基准测试软件。
01,HWBOT x265 基准测试 HWBOT x265 基准测试托管在 hwbot.org 上,通过使用 x265/HEVC 编码器以 1080P 或 4K 分辨率渲染视频来测量系统性能。
它旨在利用现代 CPU 指令集,并针对多线程进行了优化,以实现竞争性基准测试。
从测试结果来看,两台服务器的计算能力相差并不大。
02. y-cruncher测试 y-cruncher是一款非常流行的测试软件,支持多线程和最新的指令集,可以计算PI和数学常数到万亿位小数。
自2009年推出以来,y-cruncher已成为超频爱好者和硬件爱好者中流行的基准测试和压力测试应用程序。
根据 y 计算结果,PowerEdge R760 的 Xeon Gold 芯片在性能上略有优势。
03、Geekbench 6 Geekbench 是一款流行的跨平台基准测试工具。
其评分系统可分为单核和多核性能,以及模拟真实使用场景的工作负载能力。
StorageReview使用了CPU基准测试。
以下是 PowerEdge R760 的测试结果: 04、Blender Benchmark 测试 Blender Benchmark 测试通过在 Blender 软件中渲染 3D 场景来衡量 CPU/GPU 的 3D 渲染速度,让您可以比较不同的系统和组件性能,以每分钟的样本数衡量分数,分数越高越好。
之后,PowerEdge R760在安装NVIDIA A2 GPU后也参与了基准测试。
以下是测试结果: 编者注:在本次测试中,R660所使用的处理器的性能指标比R760处理器所使用的处理器更强。
05、UL Procyon AI Inference (CPU) UL Procyon AI 推理基准测试套件采用最先进的神经网络来测试各种 AI 推理引擎的性能。
这次仅在 PowerEdge R760 CPU 上运行。
对于这些测试,下表显示了平均推理时间,最后一行是总体得分。
06、V-Ray Benchmark Test V-Ray是一款独立的渲染速度测试软件,可以测试平台在执行渲染操作时的性能。
本次对两台服务器的CPU和GPU性能进行了测试。
StorageReview 评测 Dell PowerEdge R 系列产品线用途广泛,配置涵盖混合工作负载、VDI、数据库和通用用途。
额外的机架高度为 PowerEdge R670 提供了比 R660 更多的扩展和存储空间,并且这两款服务器提供相同的 CPU 和内存选项。
英特尔第四代至强芯片每个插槽提供多达 56 个内核,使 PowerEdge R760 能够支持 112 个内核和 224 个线程以及 8TB RAM。
如果您担心密集配置中的热量过多或已投资液体冷却系统,R760 在某些配置中还支持直接液体冷却 (DLC)。
此外,R760 可以容纳双宽 GPU,因此该服务器可以针对几乎任何工作负载进行配置。
在存储方面,我们喜欢该服务器可以配置E3.S背板以使用Gen5 SSD。
我们仍然喜欢戴尔的易用性和直观的 iDRAC 远程管理,它甚至具有内置的服务请求跟踪功能。
存储性能评估 PowerEdge Direct Drive VS PERC 12 戴尔在16G PowerEdge服务器中提供了多种存储背板,在配置R760时有近50个驱动器机箱可供选择。
对于支持 Gen4 NVMe SSD 的 PowerEdge 存储选项,StorageReview 还评估并比较了戴尔直接驱动器和 PERC 12 硬件 RAID 卡(PERC 是 Dell PowerEdge RAID 控制器)选项的性能。
注意:此处仅考虑 Gen4 U.2/U.3 NVMe SSD,SATA/SAS 和 3.5 英寸 HDD 的机箱选项将被忽略,因为这些配置要简单得多。
在R760中,有以下用于安装Gen4 NVMe驱动器的选项: ● 直接驱动器选项可配置为支持8个或16个驱动器; ● 对于硬件 RAID 配置,戴尔以与 RAID 卡相同的方式提供 PERC 12 硬件,每批 8 个 SSD 使用一张 RAID 卡 - 这对于从配备 16 个 NVMe SSD 的完全填充的 R760 获得最佳性能至关重要。
StorageReview的测试主要集中在两个方面。
第一个是Vdbench工作负载,它通过连接到R760的8个SSD来测量JBOD性能;第二个是 FIO 测试,它模拟不同 IO 场景中的 IO 负载,并演示 PERC 12 解决方案从单 SIM 设置到优化的双 SIM 设置的性能扩展。
直驱PowerEdge R760 评测设备的配置如下: ●双Intel Xeon Gold 6430(32核/64线程,1.9GHz基础) ●1TB DDR5内存 ●8 Solidigm P5520 7.68TB Gen4 SSD ●RHEL 9 硬件 RAID NVMe PowerEdge R760 评测设备配置如下: ●双 Intel Xeon Gold 6430(32 核/64 线程,1.9GHz 基础) ●1TB DDR5 内存 ●16 Solidigm P5520 7.68TB Gen4 SSD ● 双 PERC 12 H965i ● RHEL 9 Vdbench 工作负载分析 在对存储阵列进行基准测试时,应用程序测试是最好的,而综合测试排在第二位。
综合测试虽然不能完全代表实际工作负载,但确实有助于识别具有可重复性因素的基线存储设备,从而使同类产品之间的比较变得容易。
这些工作负载提供了一系列不同的测试配置文件,包括“四个角”测试、常见数据库传输大小测试以及来自不同 VDI 环境的跟踪捕获。
这些测试利用典型的 Vdbench 工作负载生成器和脚本引擎自动捕获大型计算测试集群上的结果,允许在不同的存储设备(包括闪存阵列和单独的存储设备)上重复相同的工作负载。
配置信息: ◆4K随机读写:100%读或写,128线程,0-120%iorate ◆64K顺序读:100%读,32线程,0-120%iorate ◆64K顺序写入:100%写入,16个线程,0-120% iorate ◆4K随机70R/30W混合和4K随机90R/10W混合,64线程,0 -120% iorate 64K顺序读取,这是对读取传输带宽的第一次测试,可以看出具有32个PCIe通道的直接驱动方法比具有16个通道的单个PERC 12具有PCIe通道优势。
在JBOD模式下,直驱计算为41.6GB/s,而PERC 12计算为28GB/s。
64K顺序写入,由于Solidigm P5520的写入速度慢于读取速度,因此额外的PCIe通道的优势会降低。
此时直接驱动配置的测得速度为 18.3GB/s,而 PERC 12 的测得速度为 20.3GB/s。
4K 随机读取,直接驱动器 PowerEdge R760 中的 8 个 Solidigm P5520 SSD,峰值 IOPS 为 555 万次,在 PERC 12 设置中峰值 IOPS 为 434 万次。
4K随机写入,差距再次缩小,直驱IOPS为396万,而PERC 12的IOPS为415万。
对于4K随机70R/30W混合,直驱峰值IOPS为447万,而PERC 12峰值IOPS为366万。
4K随机90R/10W混合、直驱IOPS为504万,而PERC 12系统的IOPS为362万。
FIO 工作负载分析 为了测量 Dell 直接驱动器和 PERC 12 硬件 RAID 模式下的驱动器性能,基准测试分为以下配置: ◆顺序预处理 ◆JBOD、8DR10、8DR5(顺序)单 PERC 和双 PERC 测试) ◆随机预处理 ◆4K 随机 70R/30W 混合和 4K 随机 90R/10W 混合,64 线程,0-120% iorate ◆JBOD,8DR10,随机优化8DR5(单 PERC 和双 PERC)测试 ◆ 8DR10 和 8DR5(单 PERC 和双 PERC)随机重构测试 ◆优化重构模式下,8DR5(单 PERC)随机写入 输入延迟 顺序传输性能,直驱具有带宽优势,其读取速度为54.4GB/s,而单个PERC 12的读取速度为28.1GB/s;原生写入速度也有优势,直接驱动器写入输入速度为 33.4GB/s,而后面有八个驱动器的单个 PERC 12 的写入速度为 28.3GB/s。
一般来说,写入速度不会有太大差异,因为通常此类SSD的读取速度远远超过写入速度。
随机传输性能,RAID卡在NUMA平衡方面的优势发生了变化。
读取性能方面,直驱在4K读取测试中测得796万IOPS,PERC 12 JBOD配置测得700万IOPS;直驱的写入速度下降至 340 万 IOPS,而 PERC 12 仍保持在 597 万 IOPS。
这种差异在 4K OLTP 工作负载下更加明显。
直驱IOPS为360百万,而PERC 12的IOPS为1020万。
虽然传统观点认为硬件 RAID 对于现代 SSD 没有价值,但情况已不再如此。
诚然,直接驱动 NVMe 设置是可以调整的,但它是平衡两个 CPU 上的多个 SSD 的一个移动目标。
这与 PERC 12 硬件 RAID 卡形成鲜明对比 - PERC 12 硬件 RAID 卡可以管理所有这些复杂性并且仅连接到一个 CPU;扩展方面,PowerEdge R760 中的第 2 个 PERC 卡连接到另一个 CPU,提供跨两个磁盘组,为大型工作负载提供平衡。
需要注意的是,大约 1000 万 IOPS 时,系统 CPU 开始饱和,这就是为什么使用附加 PERC 12 卡在某些区域看不到线性扩展的原因。
在降级状态下,PERC 12 上的 RAID 配置的性能如下所示。
虽然与最佳性能相比有明显下降,但在重建 RAID 组时,RAID10 和 RAID5 仍然提供强劲的性能。
虽然最佳 RAID 性能是选择存储解决方案的一个重要方面,但了解其在次优条件下的性能也同样重要。
为此,StorageReview 在最佳条件下测量了 RAID 5 的 4K 写入延迟,以及驱动器故障后的重建性能。
如果性能或延迟受到严重影响,应用程序的响应能力就会成为问题,虽然重建性能与最佳性能相比有所下降,但性能不会延迟超出基线。
存储回顾结论 戴尔的新款 PERC 12 NVMe RAID 卡改变了 PowerEdge 服务器中 NVMe 存储选项的游戏规则。
过去,一些客户一直犹豫是否要从 SAS SSD 切换到 NVMe 驱动器,或者选择连接到各种 SDS 或虚拟机管理程序的 NVMe 驱动器。
然而,PERC 12 卡的引入改变了 PowerEdge 的方程式,使其成为更可行的选择。
PERC 12 表现如此出色的原因也可归因于 PowerEdge 服务器的布局。
R760 有两个 PERC 12(H965i 前端)卡,每个卡都有 x16 通道。
这允许在每张卡上使用 8 个 Solidigm SSD,使每张卡的最大带宽高达 28GB/s,而将 16 个 SSD 全部连接到 RAID 卡将损失一半的潜在性能。
这种方法规避了带宽限制,同时显着提高了高要求工作负载下的峰值可用吞吐量。
你可能会问:“为什么不使用硬件RAID来连接24块SSD呢?”请记住,每个系统都有某个地方的瓶颈,在这种情况下CPU很容易变得饱和,因此服务器中的x86成为限制因素。
如果是集群方案,还需要考虑网络问题。
只需少量SSD即可轻松占用200GbE甚至400GbE。
由于现在SSD的容量已经达到了30.72TB,所以不需要在服务器上装满硬盘来解决系统容量问题。
StorageReview 对 R760 的存储审查结果感到满意,虽然戴尔直接驱动器在许多使用案例(例如软件定义存储)中可能仍然是首选,但 PERC 12 选项在大多数企业使用案例中应该非常受欢迎。