当前位置: 首页 > 科技观察

说说服务器内存和显存知识

时间:2023-03-19 19:58:38 科技观察

早期的内存通过内存总线连接到北桥,北桥通过FrontSideBus与CPU通信。从IntelNehalem开始,北桥集成到CPU中,内存通过内存总线直接与CPU相连。所以AMD采用SocketFM1,Intel采用LGA1156插座后,处理器都集成了北桥,独立的北桥消失了,主板上只剩下南桥。计算机系统的主要矛盾是CPU太快,磁盘太慢。所以两者不能直接通信,需要加一个过渡层,就是内存的作用。哈佛结构是一种将程序指令存储和数据存储分开的内存结构。内存(Memory),又称内存储器,是用来在CPU中暂存计算数据,并与硬盘等外部存储器进行数据交换的。计算机中的所有程序都运行在内存中,因此内存的性能对计算机的性能影响很大。1996年底,SDRAM开始出现在系统中。与早期的技术不同,SDRAM的出现是为了与CPU的时序同步而设计的。SDRAM也可以称为SDRSDRAM(SingleDataRateSDRAM)。SingleDataRate是单一的数据传输速率。SDRSDRAM的内核、I/O、等效时钟都是一样的。SDRSDRAM只能在一个周期内读取。写入一次,如果需要同时写入和读取,必须等到上一条命令执行完毕后才能继续访问。DDRSDRAM是双通道同步动态随机存取存储器,是新一代SDRAM技术。与SDR(SingleDataRate)只能在一个周期内读写一次不同,DDR的双倍数据传输速率意味着它可以在一个周期内读写两次。在核心频率不变的情况下,传输效率是SDRSDRAM的两倍。总结:DDR利用时钟脉冲的上升沿和下降沿分别传输一次数据,一个时钟信号可以传输两倍于SDRAM的数据,因此又称为双倍速率SDRAM。它的倍增系数是2。DDR2SDRAM是一种双通道双同步动态随机存取存储器。DDR2内存Prefetch增加到4bit(是DDR的两倍),DDR2的I/O时钟是DDR的两倍。总结:DDR2依然采用时钟脉冲上升和下降时传输一次数据的技术(不是两次),但是一次预读4bit数据是DDR一次读2bit的两倍,所以它的倍增系数为2X2=4、DDR3SDRAM是双通道三次同步动态随机存取存储器。DDR3内存Prefetch增加到8bit,即每次访问的数据都会以8bit为一组进行访问。DDR3传输速率在800到1600MT/s之间。另外DDR3的规格要求电压控制在1.5V,比DDR2的1.8V更省电。DDR3还增加了ASR(AutomaticSelf-Refresh)和SRT(Self-RefreshTemperature)两种新功能,可以让内存在休眠时随着温度的变化来控制内存颗粒的充电频率,保证系统数据的完整性。总结:DDR3是DDR2的升级版。最重要的变化是一次读取8位,是DDR2的2倍,DDR的4倍。因此,它的乘数为2*2*2=8。DDR4SDRAM提供比DDR3/DDR2更低的1.2V电源电压和更高的带宽。DDR4新增了4个BankGroup组的设计。每个BankGroup都具有读写等独立启动操作的特点。可以通过应用多路复用的概念来想象BankGroup组,最多可处理4组数据,效率明显优于DDR3。此外,DDR4还加入了DBI(DataBusInversion)、CRC(CyclicRedundancyCheck)、CAparity等功能,使得DDR4内存速度更快、更省电,同时也增强了信号完整性和存储可靠性。Intel在2017年推出了六代酷睿Skylake对应的服务器平台“Purley”,采用14nm工艺,最高28核56线程,6通道DDR4内存,光纤互联通道,使用UPI总线代替QPI总线,UPI是UltraPathInterconnect(超路径互连)的缩写。数据传输速率可达9.6GT/s和10.4GT/s。它具有更大的带宽和更大的灵活性。每条消息可以发送多个请求。存储器未来的三个演进方向是容量、电压和频率。容量越来越大(4GB->8GB->16GB->32GB->64GB->…512GB)电压越来越低(1.5v->1.35v->1.2v->…)频率越来越高(1333->1600->1866->2133->2400->..3200)主流内存厂商分为内存芯片厂商和模组厂商。三大原始DRAM制造商是三星、SK海力士和美光。模块制造商Ramaxel和金士顿通过从颗粒制造商处购买颗粒来制造内存模块(DIMM)。内存具有三种不同的频率指标,分别是核心频率、时钟频率和有效数据传输频率。核心频率是内存单元阵列(MemoryCellArray)的工作频率,也就是内存的实际工作频率;时钟频率是I/OBuffer(输入/输出缓冲器)的传输频率;有效数据传输频率是指数据传输频率频率。系统最大内存带宽=内存标称频率*内存总线位数*通道数*CPU数实际内存带宽=内存标称频率*内存总线位数*实际通道数实际内存带宽=内存核心频率*内存总线数位数*实际使用的通道数*乘数。从SDRAM-DDR时代开始,数据总线位宽时钟就没有变过,都是64bit,但是如果采用双通道技术,可以得到64*2=128bit的位宽。下面计算默认频率下标称DDR31066内存模块的带宽。1066指的是有效数据传输频率。除以8就是核心频率。内存只采用单通道方式,位宽为64bit。因此,实际内存带宽=(1066/8)*64*1*8=68224Mbit。可以看出,如果内存工作在标称频率,标称频率*位宽*实际使用的通道数可以直接使用,简化公式=1066*64*1=68224Mbit。如果说显存带宽是处理器和显存之间交换数据的关键,那么显存带宽对于显卡来说也是非常重要的。GPU核心负责计算,显存负责数据存储。两者之间频繁的数据交换取决于显存的带宽。更高的带宽可以让显卡在处理高分辨率和高质量图像时更加得心应手。显存带宽很大程度上由显存频率和显存位宽决定,但实际带宽要视具体情况而定。目前主流显卡的位宽多为128bit、256bit、384bit和512bit,更能决定带宽的还是显存的类型,决定了显存带宽的极限。目前最主流的显存当然是GDDR5了。之前有昙花一现的GDDR4,现在低端市场有gDDR3显存残片。AMD在其显卡上使用HBM显存。与GDDR5显存相比,功能更强大,带宽大幅提升。就两者而言,GDDR5的内部I/O带宽为32bit。目前NVIDIA显卡的GDDR5显存频率可以达到1750MHz。是4x速率机制,数据频率7Gbps,单芯片带宽28GB/s。目前HBM显存的频率只有500MHz,2倍频机制,数据频率为1Gbps,但其I/O带宽极高,弥补了频率上的不足。GDDR5和HBM显存是目前最主流的显存技术。目前gDDR3显存基本被NVIDIA和AMD的一些低端显卡所采用。GDDR5绝对是目前的主流。单芯片容量从之前的2Gb逐渐增加到4Gb。不久前,美光也量产并出货了8Gb(1GB)芯片。高端显卡只需要4-8颗芯片就可以达到4Gb。-8GB显存容量,将进一步推动大容量显卡的出现。HBM是一颗冉冉升起的新星。目前只有AMD使用。第一代HBM技术栈内存核心容量为2Gb(一个栈为4核),数据频率为1Gbps,位宽为1024bit。显存带宽=显存等效数据频率(Gbps)*显存总位宽(bit)/8=显存实际频率(MHz)*显存数据倍率(1、2、4不等)*显存等效位宽(64-512bit范围)/8由于显卡厂商更习惯用更大更好看的数据频率来标注产品规格,所以上面的公司其实可以更简单,直接变成:显存带宽(GB/s)=显存数据频率(Gbps)*显存等效位宽(bit)/8以NVIDIA的GeForceGT720显卡为例。这张卡的位宽只有64bit,同时支持gDDR3和GDDR5显存。前者的典型频率为900MHz,后者的典型频率为1250MHz,两种配置的带宽为:gDDR3:GT720显卡的带宽为:900MHz*2*64bit/8=14.4GB/s,或1.8Gbps*64bit/8=14.4GB/s。GDDR5:GT720显卡的带宽为1250MHz*4*64bit/8=40GB/s,或者5Gbps*64bit/8=40GB/s。