显卡 > 评测 > 横向评测 > 浅析DirectX11技术带给图形业界的改变
CBSi中国·ZOL 作者:中关村在线 濮元恺 责任编辑:龚力成 【原创】 2010年05月07日 06:30
本文导航
返回分页阅读文章
产品:浅析DirectX11技术带给图形业界的改变
前言:2009年10月23日,微软高调发布了其最新一代操作系统——Windows7,这款操作系统相对于之前的Vista系统有相当大的进步,特别核心执行效率方面得到显著改善,并且加入了DirectX 11等新技术。微软此次推出全新图形API——DirectX 11目的很明确,就是能够充分利用显卡资源,旨在游戏以及通用计算方面达到更高的执行效率。今天本文就带大家一起分析DirectX 11技术带给图形业界和游戏玩家的双重体验。同时也让更多人了解到自己是否需要一款支持DirectX 11的显卡,具体选择哪些显卡最为合适。
Shader Model
GPU代表
显卡时代
特点
DirectX 7
1999~2001
SM 1.0
DirectX 8
将图形硬件流水线作为流处理器来解释,顶点部分出现可编程性,像素部分可编程性有限(访问纹理的方式和格式受限,不支持浮点)
SM 2.0
2003 年
ATI R300
和第三代NV Geforce FX
DirectX 9.0b
SM 3.0
2004年
第四代NV Geforce 6
和 ATI X1000
DirectX 9.0c
SM 4.0
2007年
DirectX 10
2007~2009
SM 5.0
2009年
ATI RV870
DirectX 11
2009~
传统的分离架构中,两种着色器的比例往往是固定的。在GPU核心设计完成时,各种着色器的数量便确定下来,比如著名的“黄金比例”——顶点着色器与像素着色器的数量比例为1:3。但不同的游戏对顶点资源和像素资源的计算能力要求是不同的。如果场景中有大量的小三角形,则顶点着色器必须满负荷工作,而像素着色器则会被闲置;如果场景中有少量的大三角形,又会发生相反的情况。因此,固定比例的设计无法完全发挥GPU中所有计算单元的性能。
顶点着色单元(Vertex Shader,VS)和像素着色单元(Pixel Shader,PS)两种着色器的架构既有相同之处,又有一些不同。两者处理的都是四元组数据(顶点着色器处理用于表示坐标的w、x、y、z,但像素着色器处理用于表示颜色的a、r、g、b),顶点渲染需要比较高的计算精度;而像素渲染则可以使用较低的精度,从而可以增加在单位面积上的计算单元数量。在Shader Model 4.0之前,两种着色器的精度都在不断提高,但同期顶点着色器的精度要高于像素着色器。
Shader Model 4.0统一了两种着色器,所以顶顶点和像素着色器的规格要求完全相同,都支持32位浮点数。这是GPU发展的一个分水岭;过去只能处理顶点和只能处理像素的专门处理单元被统一之后,更加适应通用计算的需求。
DirectX 11提出的Shader Model 5.0版本继续强化了通用计算的地位,微软提出的全新API——Direct Compute将把GPU通用计算推向新的巅峰。同时Shader Model 5.0是完全针对流处理器而设定的,所有类型的着色器,如:像素、顶点、几何、计算、Hull和Domaim(位于Tessellator前后)都将从新指令集中获益。
测 试 平 台 硬 件
中央处理器 Intel Core i7-975 Extreme Edition
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存 )
散热器 Thermalright Ultra-120 eXtreme
(单个120mm*25mm风扇 / 1600RPM)
内存模组 G.SKILL F3-12800CL9T-6GBNQ 2GB*3
(SPD:1600 9-9-9-24-2T)
主板 ASUS P6T Deluxe
(Intel X58 + ICH10R Chipset)
显示卡
测 试 产 品
GeForce GTX 480
(GF100 / 1536MB / 核心:700MHz / Shader:1401MHz / 显存:3696MHz)
GeForce GTX 470
(GF100 / 1280MB / 核心:607MHz / Shader:1215MHz / 显存:3348MHz)
Radeon HD 5850
(RV870 / 1024MB / 核心:725MHz / Shader:725MHz / 显存:4000MHz)
Radeon HD 5870
(RV870 / 1024MB / 核心:850MHz / Shader:850MHz / 显存:4800MHz)
Radeon HD 5970
(RV870 / 2048MB / 核心:725MHz / Shader:725MHz / 显存:4000MHz)
硬盘 Western DigitalCaviar Blue
(640GB / 7200RPM / 16M缓存 / 50GB NTFS系统分区)
电源供应器 AcBel R8 ATX-700CA-AB8FB
(ATX12V 2.0 / 700W)
显示器 DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)
Adaptive Tessellation技术一样会通过调节VS来细化曲面结构,跟单纯的设置顶点碎多边形的Tessellation技术来说不一样。我们发现这方面AMD显卡表现较为优秀,比起单纯的Tessellation技术来说性能衰减要小很多。
而Tessellation Ultra对曲面细分单元较为缺乏的A卡来说,性能下降非常迅速,毕竟Fermi架构的GF100完整版拥有16个曲面细分单元,而AMD的R800架构只是在UTDP指令分配器中装配了一个曲面细分单元以达到微软DirectX 11的硬件要求,所以性能较弱理所应当。
鉴于这项测试对单卡双芯HD5970显卡没有提供良好支持,我们在Detail Tessellation测试中忽略了这款显卡的成绩。我们可以从测试中看到,在Shader效果较为简单的前几项测试中,AMD和NVIDAI的最新架构显卡并没有太大分别,而在越来越复杂的Shader效果中,全新设计的Fermi架构显卡体现出了比较强劲的运算能力。
在4月下旬,中关村在线显卡频道已经对DirectX 11现有的大部分游戏进行了横向评测,而今天这篇文章的目的,就是让大家更加深入地了解DirectX 11这套全新的API将如何从图形图像的渲染方面改变我们的“视界”。
目前Fermi架构的Geforce GTX400系列显卡刚上市不久,整个DirectX 11周边配合程序还没有完善,用户方便执行的、可用于单项性能测试的也只有屈指可数的Techdemo和SDK开发包内的程序,而且它们的测试方向几乎都指向了Tessellation技术。相信在未来的一段时间内,我们可以运用更好的软件来了解DirectX 11显卡的各项技术特性。
本文参考文献:
[1] 全新绘图时代DirectX 11 GPU架构深度解析
[2] 图像的革新 Win7 DirectX 11技术全解析
[3] DirectX 11核心技术Tessellation浅析
[4] 开创DX11宏图霸业 镭HD5870权威评测
[5] Matrox絕地大反擊 幻日Parhelia-512
[6] 全新API呼之欲出 DirectX 11动力深析
[7] 细分模式构造及拟合