GeForce2 GTS显示卡评测报告 电脑报评测实验室 2000年 第20期   无论是市场或技术方面,nVidia都是一间相当成熟的公司。nVidia公司生产的图形加速芯片在个人电脑市场占有率上有着非常不错的成绩。从技术方面来说,该公司一直保持比较稳定的开发周期和计划,大约每6-8个月时间,nVidia就有新款产品推出,在这一个周期里,最具代表性的是GeForce 256的后续产品——GeForce2 GTS,现在ASUS、Creative、ELSA、Guillemot、Leadtek等显卡生产厂商都已经正式推出了基于GeForce2 GTS的3D图形加速卡。那么GeForce2 GTS的性能特征到底怎样呢?它是否是“GeForce 256 Ultra”呢?本周我们就来看一看这款目前最耀眼的图形加速卡。 #1 技术特性   nVidia是一间相当“聪明”的公司,它自己并没有生产工厂,而是专注于芯片的设计和开发,GeForce2 GTS芯片由台积电制造。GeForce2 GTS和GeForce 256的主要特性比较参见^20070201d^表一。 #1 0.18微米制造工艺   GeForce2 GTS采用0.18微米工艺,564 Pin BGA封装,集成的晶体管数目已经达到了2500万,比GeForce256增加了3百万个晶体管。由于采用了0.18微米工艺,GeForce2 GTS的核心频率从GeForce256的120MHz提升到了200MHz,这意味着它能够提供更高的像素填充率,并且还减少了功耗。GeForce2 GTS芯片级的功耗大概只有10W,明显少于GeForce256(18W),大大减小了发热量,提高了系统的稳定性。(^20070201a^) #1  改进的T&L引擎   nVidia在GeForce256芯片中首次引入了T&L(Transform Engine and Lighting Engine)引擎。在新款的GeForce2 GTS中,使用的是改进后的所谓第二代T&L引擎,和最初的T&L引擎相比,增加了硬件剪裁功能(Hardware clipping)和单像素光照运算(Per Pixel Lighting)功能。   硬件剪裁功能是nVidia对T&L单元进行的改进,增加剪裁运算到T&L几何运算动能中,可以实现在屏幕或窗口边沿对三角形进行硬件级的剪裁,而不是像过去那样把这部分工作交给CPU来完成。   单像素光照运算是用来处理光照效果的,这以前所有的动态光照效果都是在三角形上处理的,即Vertex lighting过程。每个三角形有三个彼此连接的顶点,过去是给每个顶点一个光照效果数值,要实现光照效果接下来的工作就是对三个顶点的光照效果数值进行内插值混合运算,这种方式对于小三角形还凑合,但是如果三角形较大,处理后的效果会显得很粗糙。现在GeForce2 GTS提供了新的单像素光照运算技术,可以给三角形中的每一个像素指定自己的光照效果数值。目前还没有应用程序用到这一功能,在现有的游戏中还体现不出它的优势。不过nVidia已经提供了采用单像素光照的游戏DEMO演示程序,看起来效果非常酷。而且利用单像素光照运算技术可以衍生出大量的新渲染模式,例如nVidia所宣称的单像素碰撞影射效果(Per-Pixel Bump Mapping)、单像素渗透光照效果(Per-Pixel Diffuse Lighting)、单像素镜面反射效果(Per-Pixel Specular Lighting)等。 #1 改进的渲染引擎   GeForce2 GTS的渲染引擎也有很大的改进。新的引擎被称为nVidia Shading Rasterizer(NSR),它可以使材质贴图能力增倍,新的Shading Rasterizer 可以实现一次八个材质的shading 处理(GeForce256只有单周期四个材质的shading 处理能力),支持单周期八材质的应用程序,使游戏画面更细腻平滑,是新一代显卡中填充率最高的,理论峰值点填充率800 Megapixels/s,峰值材质填充率1600Megatexels/s,这也是GTS即Giga Texel Shader的含义所在。   简单的说,GeForce2 GTS有四条管线,每条管线的点填充率是200Megapixels/s(因为GeForce2 GTS核心频率是200MHz),如果四条管线同时运行则可以实现每个点(像素)上多达两个材质的处理。但在实际应用中充分发挥填充率可以有不同的方式,不同类型的游戏往往采用了不同的渲染技术。例如:像Quake3这样的游戏可能有八或者九个不同的过程,渲染过程包括背景纹理(Background Textures)、雾化(Fog)、光照效果(Lighting Effects)、动态光照效果或者任何其他类型的视觉效果;而赛车游戏可能只有两个步骤,包括一个纹理(Textures)和一个光照Lightmaps,像下雨和镜面闪烁这样的效果只需要通过简单的Sprites处理。 #1 DDR显存   和GeForce 256不同,GeForce2 GTS并不支持单倍速率的SDRAM,它只提供对DDR-SDRAM以上的显存支持,不过目前基于成本考虑,还不会使用QDR-SDRAM (Quad Data Rate),频率从GeForce256 DDR的150MHz提升到166MHz(实际频率333MHz),GeForce2 GTS的显存带宽为5.3GB/s,仅仅比GeForce 256提高了大约10%,这显然没有解决显存带宽的问题。据称目前能够量产的最高频率DDR SGRAM也就是6ns的产品,而且第一批只有西门子旗下的Infineon生产,所以下半年GeForce2 GTS可能就会采用200MHz(实际频率400MHz)的DDR SGRAM,期望能够进一步缓解显存带宽瓶颈。 #1 强化的视频功能   GeForce2 GTS芯片集成了下一代高清晰视频处理器High Definition Video Processor(HDVP),提供MPEG2数据流(DVD或HDTV信号)的硬件辅助译码,支持完整的HDTV标准,支持HDTV信号的回放和Timeshifting,支持NTSC/PAL TV 输出编码。 #1 测试样品简介   本次测试的ASUS V7700(^20070201b^)是首批面市的GeForce2 GTS加速卡之一,按华硕的惯例采用深黄色PCB板,公板设计。这款加速卡集成32MB Infineon-6 DDR SGRAM,显存芯片编号HYB39D32322TQ-6。V7700只提供标准的HD-15显示器接口,TV-Out功能可以通过附加子卡实现,而V7700 Deluxe接口齐全,包括对TV-out、Digital VCR、和3D VR眼的支持。这款加速卡的特点是在PCB背面增加了一颗很小的监控芯片Winbond W83781D(华硕的V6x00系列显卡同样有此设计),可以监控散热风扇、处理芯片内部温度以及电压等,这对于超频以及防止风扇停转很有用处。另外,它采用了涵道式的散热风扇,转速为5500RPM,比普通风扇5000RPM快一点,更有利于散热。(^20070201c^) #1 测试简介   本次测试的Windows桌面分辨率为1024×768×32Bit,操作系统安装了DirectX7.0,主板驱动程序为VIA 4in1 4.20公版,显示驱动程序使用nVidia 5.16公版。V7700自带的驱动程序同样基于nVidia 5.16版,不过将界面改为华硕风格,核心部分和功能并没有变化。在测试中,我们使用了三种不同的分辨率和两款速度差异较大的CPU,目的是为了更清晰地显示出加速卡的瓶颈所在。 #1  测试分析 #1  GeForce2 GTS和GeForce 256   GeForce2 GTS比GeForce 256速度更快。它在核心速度、显存速度、架构等方面都有明显优势,实在是没有理由比GeForce 256更差。我们可以看到,在Quake3的不同分辨率之下,标准频率的GeForce2 GTS和GeForce 256始终保持了约6帧的差距。其它3D测试软件中,GeForce2 GTS也都保持领先。 #1  GeForce2 GTS和CPU   尽管GeForce系列显卡采用了GPU的技术,但仍然有大量的3D图形运算要交由CPU来完成,也就是说,即使加速卡的性能再好,也由可能因为CPU不够强力而发挥不出性能。   从我们的测试来看,GeForce2 GTS是一款“大食”的图形加速卡,CPU的速度会严重影响到它的性能。我们知道,提高加速卡的核心频率和显存频率可以提高像素填充率和显存带宽,应该会带来性能的改善。可是在Quake3、3D Winbench2000和3D Mark2000的测试中,当分辨率为1024×768时,GeForce2 GTS超频得分差异很小,甚至可以归入测试误差范围之内。而换用850MHz的CPU,加速卡频率不变,测试得分和使用566MHz的CPU相比提升很明显。所以我们的结论是GeForce2 GTS在1024×768分辨率下完全可以满足3D游戏的需要,其速度非常出色。此时3D图形运算的瓶颈在CPU之处。 #1  Quake3测试项   本次测试的Quake3测试项很能说明GeForce2 GTS的性能,当使用566MHz的CPU时,各种分辨率下超频后的GeForce2 GTS和标准频率时性能都没有什么差异,此时瓶颈在CPU方面。而当使用850MHz的CPU时,1280×1024和1600×1200分辨率下,测试得分和使用566MHz的CPU并无区别,也就是说,此时的瓶颈在于加速卡本身的显存带宽方面,这种情况下,提高加速卡的核心频率和显存频率会使性能大幅提高。 #1  其它   在Winbench99的图形测试项目中,我们可以看到使用同一CPU时,各种不同分辨率下得分几乎没有差异,而且GeForce2 GTS和GeForce 256的分数几乎相同,这说明在2D速度方面,现有加速卡的速度都已经足够快了,相差的只是图像质量。   GeForce2 GTS超频能力还算不错,240MHz几乎已经是目前GeForce2 GTS使用核心的极限频率,而它的显存频率几乎可以提高到390MHz,我们使用的365MHz可以说相当保守。前面我们已经提到,目前加速卡的瓶颈是显存带宽,提高显存频率的意义比提高核心频率更大。 #1 结  论   以3D游戏来说,60fps是一个视觉感受极限,如果速度超过60fps,那么超过得再多也没有多大价值,而通常认为下限是30fps,低于这一速度,游戏中会有比较明显的延迟感。以速度而言,GeForce2 GTS已经相当不错,在通常使用的1024×768分辨率下,3D游戏的速度可以保证在60fps以上,即使分辨率提高到1600×1200,也可以比较正常地运行游戏。   GeForce2 GTS的性能受CPU的影响很大,这并不是说它依赖于CPU,而只是说需要一款强劲的CPU才能将GeForce2 GTS的性能充分发挥出来。   和GeForce 256一样,GeForce2 GTS仍然受到显存带宽问题的困扰。GeForce2 GTS是目前个人电脑上最快的3D加速芯片,如果能够进一步提高显存带宽,GeForce2 GTS加速卡的性能会更为出色。(^20070201e^)   测试平台   CPU:赛扬Ⅱ 566/850MHz   主板:微星6309   内存:128M 金条PC133 SDRAM   硬盘:金钻四代10GB   光驱:NEC 36×   网卡:D-Link 530TX