MCPLive > 杂志文章 > AMD Radeon HD 7970显卡深度评测

AMD Radeon HD 7970显卡深度评测

2012-03-06《微型计算机》评测室《微型计算机》2012年2月上

HD 7950性能预测:落后HD 7970 10%~15%?

虽然HD 7950尚未发布,但这并不影响我们对其进行性能预测。HD 7950和HD 7970相比,主要是流处理算术逻辑单元数量缩减到1792个,被屏蔽了4个CU单元,显存位宽和显存容量保持不变,分别为384bit和3GB。

考虑到HD 7950和HD 7970的规格差异不算大,主要是流处理算术逻辑单元数量被缩减了。结合HD 6970和HD 6950之间的性能差距,以及综合我们过去对AMD顶级单核心显卡和次一级单核心显卡的评测经验,我们大胆预测HD 7950的综合游戏性能将落后HD 7970 10%~15%。

另一方面,结合本次11个3D游戏测试项目来看,HD 7970的性能领先HD 6950 50%左右。再加上上文我们对“HD 7950的综合游戏性能将落后HD 7970 10%~15%”的预判,我们推测HD 7950的综合游戏性能将领先HD 6950 35%~40%。

HD 7970 CrossFireX:效率大爆发

两块HD 7970组成的CrossFireX系统的效率和性能,将是HD 7970的又一个看点。从测试结果来看,我们可以用“惊艳”来形容HD 7970 CrossFireX系统的效率。众所周知,借助DirectX 11的统一渲染架构和AMD自身的优化,AMD HD 5000、HD 6000系列显卡的CrossFireX效率节节攀高,HD 6850(6870)CrossFireX就是典型代表。不过这主要是针对中高端产品而言,而由于种种原因顶级的单核心显卡组建的CrossFireX效率反而没有那么明显。

而HD 7970在采用新的GCN架构、使用线程级并行(TLP)方式以后,可以一次执行来自两个指令的4个ALU操作。而之前采用VLIW 4、VLIW 5架构的AMD显卡则需要分两次来执行上述操作。显然,HD 7970的执行效率得到了大幅提升,这种提升显著反映在CrossFireX的执行效率上。可以看到,HD 7970 CrossFireX在绝大部分测试项目中,相对于HD 7970都保持了90%,甚至100%的性能提升——这样超高的执行效率对单核心的旗舰显卡来说是非常难得的。例如在3DMark 11 Extreme、Unigine Heaven Benchmark 2.5、《尘埃3》、《战地3》、《异形大战铁血战士》、《地铁2033》上,HD 7970 CrossFireX的提升效率都非常接近100%或者已经达到了100%。

HD 7970 3Way CrossFireX、4Way CrossFireX:3DMark 11 Extreme分数破万

对那些发烧玩家和以冲击记录为目的的玩家来说,他们更关心HD 7970 3Way CrossFireX、4Way CrossFireX的性能表现。测试结果表明,HD 7970多路CrossFireX系统的确可以大幅提升3DMark等基准测试软件的性能。在3DMark 11 Extreme测试中,HD 7970 3Way CrossFireX较HD 7970、HD 7970 CrossFireX分别提升了183%和45%;HD 7970 4Way CrossFireX较HD 7970、HD 7970 CrossFireX、HD 7970 3Way CrossFireX分别提升了265%、87%、29%。值得一提的是,HD 79704Way CrossFireX取得了X10037的高分数。同样地,多路CrossFireX在Unigine Heaven Benchmark 2.5测试中亦有上佳的表现。

用HD 7970组建的三屏系统,可以在高分辨率下获得更舒适的游戏体验。
用HD 7970组建的三屏系统,可以在高分辨率下获得更舒适的游戏体验。

不过在实际游戏中,多路CrossFireX的表现相对就比较差了。这其中,HD 7970 3Way CrossFireX的游戏表现稍好,例如在《尘埃3》测试中,相对HD 7970、HD 7970 CrossFireX,HD 7970 3Way CrossFireX的性能分别提升了121%、20%。而HD 7970 4Way CrossFireX的表现则比较糟糕了,在总共5个游戏测试项目中,除了《异形大战铁血战士》以外,在另外4个测试项目中性能不但没有提升,反而有所下降。这个测试成绩也和过去我们对AMD显卡的多路CrossFireX系统的测试结果基本吻合。这再次说明,如果单纯从提升游戏性能的角度出发,多只需要组建3Way CrossFireX,4Way CrossFireX已经没有实际意义了。4Way CrossFireX的意义在于可以显著提升3DMark的分数,帮助玩家冲击记录。

表3:HD 7970组建多路CrossFireX的成绩

HD 7970
3Way CrossFireX
HD 7970
4Way CrossFireX
3DMark 11 Extreme X7789 X10037
Unigine Heaven Benchmark 2.5 1920×1080
Shader(High)、Tessellation(Extreme)
150.2 174.2
《尘埃3》
1920×1080、高画质 212.2(153.4) N/A
1920×1080、高画质、8AA 204.25(153) 204.25(153) N/A
《失落的星球2》
1920×1080、高画质 122.2(31) 102(41)
1920×1080、高画质 114.5(30) 97.7(39)
《异形大战铁血战士》
1920×1080、高画质、16AF 280.5(173) 342(214)
《战地3》
1920×1080、高画质、16AF 164.8(122) 160.5(110)
1920×1080、高画质、4AA、16AF 133.8(120) 157(96)
《孤岛危机2》
1920×1080、超高画质、DX11、高材质纹理 85.6(74) 73.5(38)
1920×1080、高画质、DX11、高材质纹理 100(98) 100(97)
PC待机功耗 123W 127W
PC满载功耗 988W 1243W

在测试中,我们注意到对A卡进行了特别优化的《异形大战铁血战士》,对多路CrossFireX支持得很好。以HD 7970 3Way CrossFireX为例,它的性能分别领先HD 7970、HD 7970 CrossFireX 198%和49%。即使是HD 7970 4Way CrossFireX,相对HD 7970 3Way CrossFireX亦有22%的性能提升,相对HD 7970则有高达264%的性能提升。不难看出,多路HD 7970系统在该游戏的提升幅度基本和3DMark等基准测试软件的结果相符合。

另一方面,多路CrossFireX在测试中也遇到了一些问题。例如HD 7970 4Way CrossFireX在运行《尘埃3》时,不断出现死机问题,无法获得测试结果;同样的情况也出现在其他游戏中,只是在其他游戏中,我们可以通过重新启动游戏、反复测试等手段来获得测试结果,而《尘埃3》却无法做到。总体而言,我们建议那些打算组建HD 7970 CrossFireX的用户,如果你不是“跑分党”的话,从功耗、效率和价格综合考虑,组建HD 7970 CrossFireX是合适的,HD 7970 3Way CrossFireX 、4Way CrossFireX意义不大。

HD 7970 4Way的3DMark 11 Extreme分数破万
HD 7970 4Way的3DMark 11 Extreme分数破万

HD 7970(CrossFireX)三屏表现:基本令人满意

Eyefinity作为AMD独有的多屏显示技术,在游戏、金融等许多领域有广泛的应用前景,一些游戏发烧玩家以Eyefinity技术为基础,组建三屏系统,以获得更高的分辨率和更好的游戏体验。因此我们特意组建了三屏系统,来看看HD 7970能否具备在5760×1080超高分辨率下流畅运行游戏的实力。从4个游戏和一个基准测试软件的测试结果来看,HD 7970的性能损失比较严重,普遍在50%以上。例如在《尘埃3》、《孤岛危机2》中,三屏下的HD 7970的性能较单卡性能分别下降了53% 和60%。好在HD 7970的性能足够出色,除了《孤岛危机2》以外,它在余下4个游戏中都保持了40fps的帧率(包括在抗锯齿模式下),基本满足了流畅运行游戏的需求。

表4:HD 7970(CrossFireX)在三屏下的游戏性能

HD 7970 HD 7970 CrossFireX
Unigine Heaven Benchmark 2.5 1920×1080
Shader(High)、Tessellation(Extreme)
21.5 43
《尘埃3》
1920×1080、高画质 45(37.53) 83.76(70)
1920×1080、高画质、8AA 40(33.75) 76(64.8)
《失落的星球2》
1920×1080、高画质 45.4(31) 81.8(54)
1920×1080、高画质 4AA 36.7(22) 66.6(33)
《异形大战铁血战士》
1920×1080、高画质、16AF 45.3(23) 89(46)
《孤岛危机2》
1920×1080、超高画质、DX11、高材质纹理 18.6(16) 36(32)
1920×1080、高画质、DX11、高材质纹理 36(33) 67(58)

此外我们还组建了HD 7970 CrossFireX系统,在三屏下进行了游戏测试。HD 7970 CrossFireX在三屏下依旧延续了超高的效率,相比HD 7970单卡在三屏下的性能有近100%的性能提升,流畅运行游戏没有任何问题。不过由于驱动优化的问题,在使用CrossFireX系统运行在三屏下时,不时会出现游戏无故退出,或者需要多次启动游戏才能运行的问题。

HD 7970:通用计算能力攀新高

HD 7970除了大幅提升游戏性能之外,其通用计算方面的改进尤其令人关注。究竟在使用了新架构、改进了执行效率,和增加了丰富的缓存设计以后,它的通用计算性能能否有大幅提升呢?我们使用GPCBenchmarkOCL和ComputeMark这两款软件对其进行测试。GPCBenchmarkOCL是一款基于OpenCL的测试软件,可以全面测试和评估GPU在通用计算方面的性能以及底层的性能。例如可以测试出GPU的峰值计算性能,GPU在各种实用算法中的实际性能。ComputeMark在技术上基于由Jan Vlietinck开发的Fluid3D Demo,号称可以“百分之百测试DX11Compute Shader的基准测试工具”。它在一般情况下能够调动99%的GPU资源,可以深度测试HD 7970的通用计算性能。

HD 7970的核心频率可以轻松超频至1000MHz以上,并通过FurMark稳定测试。
HD 7970的核心频率可以轻松超频至1000MHz以上,并通过FurMark稳定测试。

两款测试软件的结果都表达出一个明确的信号:HD 7970在新架构和丰富的缓存设计的帮助下,通用计算性能提升到一个令人吃惊的地步。从GPCBenchmarkOCL的测试来看,HD 7970的总分分别领先HD 6970、GTX 580高达176%和58%。

新版的催化剂控制中心拥有更丰富和人性化的界面
新版的催化剂控制中心拥有更丰富和人性化的界面

例如在全局存储器、局部存储器的子项测试中,HD 7970都有出色的表现。特别是局部存储器的子项测试,HD 7970的多层缓存架构体系使得它在该项测试中获益良多,性能领先HD 6970高达524%。这是因为HD 6970仍然采用的是VLIW 4架构,没有引入缓存设计,测试大幅落后也就在情理之中了。而和同样具备丰富的缓存设计的GTX 580相比,HD 7970也不逞多让,也获得了51%的领先优势,从侧面反映出HD 7970高效的缓存架构设计。

HD 7970 4Way CrossFireX在FurMark拷机时,四颗GPU核心的温度明显提升了不少。
HD 7970 4Way CrossFireX在FurMark拷机时,四颗GPU核心的温度明显提升了不少。

GTX 580唯一占优势的是双精度的实际计算性能。首先是双精度浮点运算子项,HD 7970领先GTX 580达310%,反映出HD 7970优秀的双精度浮点运算性能。但在常用数学方法(双精度)子项上,GTX 580却反而领先HD 7970 20%。这说明虽然GTX 580的双精度浮点运算性能不如HD 7970,但在一些常见应用方面的双精度性能却领先HD 7970。双精度性能主要和高性能计算有关,这个测试结果也和GTX 580在高性能计算领域的地位相吻合。

在ComputeMark测试方面,HD 7970继续着良好的势头,分别领先HD 6970、GTX 580达109%和80%。这说明,HD 7970的Compute Shader性能更强,在加速图形后期处理、随机访问等方面的效率更高。

分享到:

用户评论

共有评论(1)

  • 2012.06.17 16:36
    1楼

    这篇文章写的不错,美中不足是没有对照GPU和CPU在通用计算和浮点运算的差异与数据.如果有此数据就可知道在APU明年实现真正的CPU/GPU统一寻址后,而APU不仅仅是CPU、GPU的简单物理整合,更是深层次的融合,而实现这种融合的关键之一就是CPU、GPU的统一内存空间寻址。经过Llano、Trinity的两代铺垫之后,明年的Kaveri将终完全实现这一梦想。彻底实现统一寻址后,CPU、GPU之间就可以有通用的用户调用,并共享数据,从而避免相互的数据拷贝和带宽浪费,也摆脱对高内存频率的依赖,为二者的更进一步融合奠定坚实的基础。无论是3D图形性能还是并行计算性能,都会因此上一个台阶。这才是HD7970架构的先进之处.但是总的来说很好.

    (0) (0) 回复

用户名:

密码: