今年是VR元年。
HTC VIVE、OCULUS RIFT等几款家用VR一体机自诞生以来就备受关注。
但未来世界的门票可没有那么便宜,即使是最先进的显卡也只能体验到最低的图像质量。
对此,Nvdia和AMD均表示将推出与VR更加兼容的显卡,因此Nvdia拥有GTX/Pascal架构。
作为一款面向高端市场的GTX,它采用基于16nm工艺的GP核心,内置CUDA处理器,基础频率MHz,加速频率MHz,单8针供电接口,另外,GTX首发了8GB GDDR5X显存,显存频率为MHz,相当于0MHz,显存位宽为bit,显存带宽为GB/s。
GDDR5X是GDDR5的升级版本。
与过去相比,接口从32bit变为64bit,可以获得两倍的传输速率。
VR图像的计算量远大于普通图像,因此IO问题成为重中之重。
面对更多的GPU计算,高带宽可以保证整体速度不被拖慢。
另外在带宽方面,AMD有HBM技术,就是将内存芯片堆叠起来。
2018年,Fury X的带宽甚至达到了GB/s。
所以AMD在这方面比较好。
如果说带宽是门槛,那么架构就是核心。
Nvidia这两年保持了一代人的进步,推出了以GTX为代表的Pascal架构。
Nvdia在Pascal架构中添加了一项名为Nvlink的技术,该技术能够实现CPU和GPU之间的快速通信。
它是由 Nvdia 和 IBM 联合开发的。
对个人电脑组装稍有了解的人都会知道,显卡插在主板上的PCI-E接口上,通过这个接口与CPU交换数据。
然而,共享数据时不可避免地会出现瓶颈。
不过,Nvlink的带宽可以达到传统PCI-E 3.0的5到12倍,几乎与CPU的带宽相同。
因此,在CPU和GPU之间建立了一条快速通道,使数据共享更快、更高效。
唯一遗憾的是该技术需要CPU和GPU同时支持。
对于传统的PCI-E接口来说,依然保持了之前的效果。
第二个特性是文章开头介绍的GDDR5X。
它与 GDDR5 不属于同一家族。
这是类似于水平扩展的性能提升。
该技术被称为3D Memory,意思是三维堆叠。
NVdia采用硅通孔技术将多个DRAM堆叠在一起,以实现更高的带宽、更大的容量和更低的功耗。
在今年的 IDF 上,英特尔推出了一项名为嵌入式缓存的存储技术。
Nvdia表示很可能将这一功能添加到新一代显卡中。
同时,为了更好地兼容VR,Pascal可以同时进行VR渲染的左右眼投影。
这与之前的多视口投影有本质的区别,因为左右眼的投影矩阵不同。
结果是场景几何体只需要在顶点着色器中处理一次,而不是两次。
当几何成为瓶颈时,性能可以大大提高。
当像素着色是瓶颈时,可以看第二项。
虽然多视图应用于VR时只需要提交一次drawcall,但是顶点着色器仍然要在硬件内部执行两次,并且每次获取的图层参数都不同。
Pascal只需要执行一次顶点着色器,性能上有根本的区别。
AMD短期内不会看到太多结构性改善。
不客气地说,Polaris架构只是CGN架构的延伸,并没有本质的改进。
所以从我个人角度来说,我不太看好Polaris 10和11。
但是AMD并没有让人们失望。
Polaris的晶体管工艺采用14nm FinFET,相对于英伟达的16nm有一定的改进。
综合性能方面,Nvdia的GTX依然以3分的跑分领先,而AMD Polaris DF则以3分的跑分排名第二。
6月1日,AMD在发布会上宣布将通过ZEN核心X86 High -高性能处理器和新型Radeon显卡推动VR在平民玩家中的普及。
Radeon新显卡的单卡性能确实不如Nvdia的GTX,但有趣的是,最新的Radeon显卡只卖美元,而GTX则卖美元。
两张Radeon显卡的交火效果明显比一张GTX好,但价格却不到1美元。
那么作为用户,当你的主板有两个PCI-E接口并且允许交叉火力时,你会怎么做呢?是该花这笔钱买一张性能极其出色的显卡,还是花不到一美元买两张性能一般,但最终效果却能超越一美元数量的显卡呢?俗话说,三个皮匠等于诸葛亮。
这种数量大于质量的故事并不少见。