游戏显卡界有这样一个传奇,所有身披6号球衣的NVIDIA巨头产品都会有市场表现极为火爆。
这个定律被称为“每6时火”定律。
自从NVIDIA推出GT以来,几乎每一代带有“6”的显卡都非常受欢迎。
但由于一些问题,上一代GTX最终并没有流行起来,这让N粉丝很失望。
最近发布的新一代帕斯卡中端显卡GTX能否重拾昔日辉煌,续写“每次必爆6”的传奇呢?今年5月,NVIDIA发布了最新一代Pascal架构产品,采用16nm FinFET工艺制造。
同时发布的GTX和GTX都展现出了巨大的性能提升。
作为传统意义上的主流产品,GTX 直到两个月后的 7 月初才低调发布。
在NVIDIA发布GTX之前,其老对手AMD就已经推出了自己的主流显卡RX,使得这个价位的竞争成为另一场N/A战争的第一场交火。
作为这一代NVIDIA主力中端机型,GTX有着怎样的战斗力呢? Pascal GP核心分析 在NVIDIA经历了四年基于28nm FinFET制造工艺制造GPU的漫长历史之后,基于Pascal GP的GeForce GTX首次迎来了16nm FinFET制造工艺升级。
更高精度的“光刻”工艺使得GPU能够在芯片上单位面积上集成更多数量的晶体管。
在相同的核心架构下,核心尺寸越大意味着处理性能越强大。
因此,16nm FinFET制造工艺能为NVIDIA新显卡带来的能效提升是可以预见的。
然而,不断超越自我的NVIDIA并没有被动地享受工艺进步的红利。
相反,它在新一代显卡中使用了更先进的技术。
。
这包括 GTX 使用的 GP 核心。
GP核心逻辑架构图 GTX的GP核心内置2组GPC和6个显存控制器。
每个 GPC 包含 5 个 SM。
1 SM集成了1个CUDA单元、8个纹理单元、KB L2缓存、96KB共享存储空间和48KB L1缓存。
从规格来看,GP更像是GTX使用的GP核心,除了显存控制器之外,其他大部分规格都减半。
SM流式多处理器可以高度协调CUDA核心和其他功能组件的工作。
这20个SM将参与GPU执行的几乎所有命令。
GeForce GTX 拥有 8 个 32 位宽显存控制器,每个控制器配备 8 个 ROP 单元和 KB 二级缓存。
因此,完整的 GTX GP 核心具有 CUDA 单元、位内存宽度、64 个 ROP、TMU 和 2MB L2 缓存。
GP的核心晶体管数量为44亿个,核心面积为mm2,比Maxwell家族GM的mm2略小。
得益于16nm FinFET工艺的应用,每平方毫米的晶体管数量达到了22.9m,远高于通用汽车。
这就是GP和其他Pascal架构显卡如此节能的主要原因之一。
另外,CUDA数量、ROP数量为48个、TMU数量为80个。
NVIDIA将GPU开发精力集中在设计Pascal核心架构的每个细节上。
Pascal之所以能够成为史上最节能的GPU,不仅得益于16nm FinFET带来的制造工艺提升,还有核心效率的不断提升。
NVIDIA 工程团队的一个主要关注点是 GPU 核心工作频率。
与橡木桶定律一样,GPU核心工作频率是由数百万设计电路中最慢的路径决定的,因此这是最慢的路径。
路径优化对于提高GPU核心的运行频率至关重要。
经过NVIDIA工程团队在该领域的不断研究,Pascal架构GPU相比上一代,运行效率提升了40%。
仅靠16nm FinFET制造工艺并不能带来如此高比例的核心频率提升。
SMP技术和Ansel工具介绍Imultaneous Multi-Projection多画面同时投影技术多画面同时投影技术(SMP)允许基于Pascal架构核心的GPU对16个角度的图像进行渲染并分别呈现。
为了实现多画面同步投影技术,NVIDIA在Pascal架构核心的GPU中集成了全新的多画面同步投影引擎模块。
SMP单元负责在渲染一张图片之前生成多个视角,然后交给CUDA等组件进行渲染。
SMP可用于许多新的图形技术,例如环绕透视、镜头阴影匹配、单通道虚拟现实VR和多分辨率渲染。
这些新的图形技术对于虚拟现实VR有很多好处,可以带来高达1.5倍的像素输出和2倍以上的几何输出。
环绕透视 环绕透视利用 SMP 在三个显示器上渲染的更宽视野和具有正确透视关系的图像。
单通道虚拟现实VRNVIDIA VRWorks可以利用SMP技术来减少渲染虚拟现实VR图像时的几何计算量。
GeForce GTX GPU 依靠单通道虚拟现实 VR 图形技术,在一次操作中呈现双眼视角的画面,相当于将 GPU 几何的计算负载减少一半。
镜头阴影匹配计算镜头阴影匹配,让VR头戴显示设备直接显示根据设备校正后的图像。
避免渲染前浪费过多不必要的图形,大幅提升VR图形渲染性能。
多分辨率渲染 玩游戏时,玩家往往会将大部分注意力集中在屏幕中央。
因此,通过多分辨率渲染技术,GPU可以分配更多的资源来渲染游戏中心的屏幕。
提升玩家在游戏过程中的视觉体验。
首创Ansel截图功能。
在游戏行业高速发展的今天,玩家对游戏的需求不再是简单的娱乐和放松。
他们要求游戏能够以艺术甚至自我表达的层面呈现给人们。
为了顺应这一要求,NVIDIA 开发了开创性的 Ansel 截图功能,让玩家能够以自己独特的方式发现游戏中的美妙之处。
玩家在游戏中遇到精彩瞬间时,常常会截图保存。
有些游戏提供了非常简单的截图功能,就是截取一堆当前的游戏画面,然后退出游戏后慢慢选择你理想的一张。
开创性的Ansel允许玩家在游戏中使用Ansel截图功能来定格游戏世界,然后玩家可以从任何方向和角度捕捉精彩瞬间。
您还可以为截图添加不同的Photoshop滤镜效果,并调整景深、色调、光照、纹理等画质细节。
截图的分辨率不锁定游戏分辨率,而是可以大幅提升。
,甚至可以达到×的变态水平,相当于4K显示器的六倍以上!甚至可以拍摄VR全景照片并发送给手机APP,然后使用一些移动VR设备来欣赏VR游戏场景。
全景游戏截图 超高分辨率游戏截图 Ansel 工作原理 Ansel 首先基于 NVIDIA GPU,然后以数据库的形式无缝连接驱动程序和游戏。
NVIDIA为Ansel设计了标准化的UI控件,并将其作为开放的SDK供游戏开发者使用,让游戏开发者可以轻松地将Ansel集成到游戏程序中,让游戏玩家无论玩什么游戏都可以使用它。
Ansel工具具有统一的接口标准。
Ansel中的三个接口: 1.setConfiguration——游戏设置,比如游戏中使用的坐标系。
2.isSessionActive - 显示 Ansel 是否正在控制游戏。
3.updateCamera - 显卡外观分析以符合游戏内使用限制&拆解GTX外观分析。
这次我们拿到的是Founders Edition版本。
与以往不同的是,NVIDIA在这一代公版6系列显卡上采用了类似的高端产品。
“泰坦皮肤”散热器。
由此可见NVIDIA对这款产品的信心和重视。
GTX 背面没有配备金属背板。
整体长度约25cm,PCB长度仅17cm,比散热器短很多。
这种设计也存在于RX上。
为后续推出超短尺寸GTX提供了可能。
另外,GTX没有配备SLI接口,双6秒旗舰的情况在这一代也不会出现。
依然是熟悉的配方,熟悉的味道。
使用多年的涡轮散热器的优点是可以将热量排出底盘,降低底盘内部的温度。
但由于结构限制,散热性能一直比较平均。
另外,较高的风扇转速也会带来一定的噪音问题。
接口方面,共有3个DP1.4接口、1个HDMI2.0b接口、1个DVI-D接口。
拆开GTX并打开散热器后,可以看到有一根飞线连接散热器和PCB。
这实际上是显卡正面布置的6-Pin电源接口的延伸。
这样的排列据说是为了显卡的整体美观。
笔者对此持保留态度。
PCB长度为17cm。
GPU周围排列着6块单块容量1GB的GDDR5显存。
GPU芯片左侧是三相数字供电模块。
W的TDP显然并没有要求过高的电源规格。
PCB背面特写显示,核心型号为GPA1,采用台积电16nm FinFET工艺制造,基于最新的Pascal架构。
默认核心频率为 MHz,Boost 频率为 MHz。
使用的显存果然来自三星,单条容量为1GB,等效频率高达MHz。
公版GTX与GTX外观尺寸对比 公版GTX外观尺寸对比 公版GTX的长度仅为25厘米,比常规ATX主板的宽度还要窄。
厚度占用两个PCI插槽,没有多余的突出部分。
基准性能测试本次测试使用的测试平台如下:为了避免其他因素影响测试结果,我们搭建了由i7-X+X99和DDR4 8GBx4内存组组成的硬件平台,内存频率高达兆赫。
驱动程序版本为 GeForce .64 和 Catalyst 16.7.2。
测试中使用的GTX显卡为Founders Edition版本,也就是我们以前所说的公版卡。
默认核心频率为 MHz,Boost 频率为 MHz。
根据以往的经验,大多数第三方厂商推出的非公版GTX在规格上都会有一些改进,主要体现在核心频率和散热性能上,因此性能会比Founders Edition版本略高一些。
经过我们的测试,非公版GTX和GTX相比公版至少会有10%的性能提升。
GTX的情况应该是类似的。
3DMark性能测试 3DMark是知名图形测试软件厂商Futuremark推出的一款图形性能测试程序。
本次测试使用最新版本的跑分。
测试项目包括常规的Fire Strike Extreme和Fire Strike Ultra两个DX11测试项目以及最近推出的专门用于测试DX12性能的Time Spy模式。
在3Dmark DX11基准性能测试中,我们可以看到,搭载全新16nm Pascal核心的GTX得分与上一代次旗舰GTX基本持平。
与对手RX相比,其在两种模式下分别取得了9.5%和8.4%的领先优势。
性能相当强大。
在DX12测试Time Spy中,GTX也表现出色,分数非常接近GTX,领先RX约2%,基本处于同一水平。
以往同价位产品DX12性能处于劣势的情况也没有再发生过。
接下来是对VR性能的简单测试,使用常用的SteamVR Performance。
GTX 在 SteamVR 性能测试中获得了 8.1 分的平均保真度得分。
分数介于GTX和GTX之间。
根据我们之前测试RX时遇到的情况,虽然显卡厂商针对VR性能做了相关优化,但SteamVR等简单的基准测试软件所使用的引擎更新缓慢,不支持新的VR功能,导致新一代显卡在基准测试中表现异常。
因此,本次测试的参考意义是一般性的。
如果想要完美展现新旧显卡的实际VR性能差距,除了等待Steam更新版本之外,只能等待权威测试程序VRMark尽快发布。
游戏性能测试 在游戏测试环节,我们选择x和x两种分辨率进行测试。
特效级别开启到最高级别。
选择了三款DX12和三款DX11游戏进行测试。
DX12游戏测试 DX11游戏测试 从上面的游戏测试结果可以看出,GTX的表现非常出色。
它与上一代 GTX 基本处于同一水平,定位高出两个级别。
与 RX 相比,它还显示出相当大的性能优势。
即使在A卡擅长的DX12游戏中,也没有表现出任何劣势。
功耗和散热测试评估总结 功耗和散热测试受益于16nm FinFET工艺和新架构。
GTX仅有W的TDP显然无法对当今电源容量日益增大的情况构成威胁。
顶级平台加持下满载仅W。
在散热测试中,满载下温度达到了82摄氏度,待机温度仅为34摄氏度,表现正常。
公版散热器的效率不高,但还是够用的。
如果想要获得良好的散热性能,可以期待一向以库存着称的多家显卡厂商的非公版产品。
评测总结:经过多年“买6卡就爆款”的N卡法则,玩家们不禁对今年NVIDIA的GTX抱有很高的期望,而NVIDIA显然也没有让玩家们失望。
。
在性能测试中,GTX表现出了与上一代旗舰GTX相当的性能水平。
实际游戏测试证实了NVIDIA在这一代显卡中采用的16nm Pascal架构的优越性。
在DX11模式下,相比同级别对手RX拥有10%左右的性能优势。
即使在作为A卡传统优势的DX12测试中,它也不落下风。
另外,得益于底层的大踏步,带来了更高的每瓦性能,超频潜力值得期待。
NVIDIA官方建议零售价为人民币,部分非公开产品已经开始预售。
(本次评测使用的方正版版本并没有出现在首批上市产品中。
)结合其出色的性能,这个价格显然具有非常明显的性价比优势,市场表现十分亮眼。
“万物皆可流行”的传说很有希望在这一代人中传承下去。