DDR VS SDRAM——丽台DDR版与SDRAM版Geforce 256对比测试 电脑报评测实验室 2000年 第8期   自去年下半年全新的3D显示芯片——GeForce 256面市之后,nVidia公司突然发现,凭借着GeForce 256的T&L硬件几何变换和硬件光源、256位处理能力、4个独立渲染引擎、Fast Write等最新技术,他们第一次真正甩开了老对手(至少在时间上),当上了3D显示芯片界的领头羊。以前的老对手3dfx此时还在拼命地往Voodoo3芯片上集成PAL制电视接收功能(说白了就是电视卡功能),G400也仍然处于叫好不叫座的尴尬地位。nVidia长舒一口气,“业界第一块GPU(GRAPHICS PROCESSE UINT)”的口号喊得更加理直气壮了。   然而,仅仅两个月后,Savage2000这匹黑马的杀出,让人们在对GeForce津津乐道之际,多了一个与之做比较的选择。我们在第一时间拿到Savage2000,并与GeForce 256进行了一番对比,那层绕在nVidia周围的光环立即就暗了一些。不可否认,GeForce 256在几乎所有方面都比Savage2000占有优势,但并非想象中的那样分明。Savage2000同样拥有4条独立的渲染引擎、ST&L硬件转换和光源等新技术,只是在内存接口方面仍采用128位方式,在理论上似乎要慢得多。但当我们比较之后发现,这种内存方面的差异并不大,因为两种显示卡采用的都是SDRAM的内存芯片。这让我们不得不重新审视一下现在的SDRAM版本的GeForce 256。(DDR 版GeForce 256芯片如^08070201a^)   首先,GeForce 256在技术上的一大特点是将以前需要CPU处理的几何转换、光源等工作集成在硬件上,即T&L技术。但屈指算来,现在能用上T&L功能的游戏或软件几乎仅用一只手就能数完,而且还包括nVidia公司自己专为这一技术开发的生成树演示程序。尽管DirectX7.0已经包含了这一技术,但要历来跟着硬件走的其他软件公司也迅速跟上这一节奏是不现实的,还需要相当一段时间。所以,现在谈T&L对于3D性能的提高还为时过早。   其次,我们发现,现在的GeForce 256核心频率为120MHz,显存频率为166MHz,比TNT2 ULTRA 150/183MHz的核心频率还低。166MHz的显存频率意味着在它全速运行时,也只有最大2.7GB/Sec的传输能力。这对于需要大容量数据传输的程序非常不利。下面是GeForce 256 SDRAM版在Q3下测试的结果(^08070201e^表1)。我们可以很明显看到,在16bit色彩模式下,从800×600到1280×1024的分辨率,游戏帧数只下降了10帧左右,而在32bit模式下,游戏帧数下降了足有25帧!当数据量急剧增加时,166MHz的显存显然已经吃不消了。在4条独立渲染引擎共4.8亿/每秒的填充率和T&L技术的对比下,这已经成为了GeForce 256的技术瓶颈。   实际上nVidia公司早就已经注意到这个问题了,因此,在开发GeForce 256时,他们已经焦急的为它寻找更新、更快、带宽更大的内存。GeForce 256是业界第一个采用DDR内存芯片的显示卡,在这种新的内存支持下,GeForce 256才算真正站到了领跑的第一位。现在各大显卡生产公司已经纷纷推出自己的DDR产品,我们拿到了丽台公司的一块SDRAM GeForce 256和一块DDR GeForce 256,就来对比一下到底DDR版的显卡对SDRAM版的有多大的优势。   由于DDR内存芯片(^08070201b^)还未在市面上流行,所以这里简单介绍一下它和SDRAM的不同。DDR(Double Data Rate),是目前SDRAM的更新产品,DDR的核心建立在SDRAM的基础上,但在速度和容量上有了提高。与SDRAM相比有两个不同点:首先,它使用了更多、更先进的同步电路。其次,DDR使用了Delay-Locked Loop (DLL,延时锁定回路)来提供一个数据滤波信号(DataStrobe signal)。当数据有效时,存储器控制器可使用这个数据滤波信号来精确定位数据,每16次输出一次,并同步来自不同的双存储器模块的数据。DDR本质上不需要提高时钟频率就能加倍提高SDRAM的速度,从图中可以看到,DDR内存具有“单周期双数据传输”能力,就是说,SDRAM只有在时钟脉冲的上沿才能进行一次数据操作(写或读操作),而DDR不仅在时钟上沿进行操作,在时钟脉冲的下沿还可以进行一次对等的操作(写或读操作)。这样,理论上DDR的数据传输能力就比同频率的SDRAM提高了一倍,100MHz的DDR就相当于200MHz的SDRAM一样。 丽台是较早推出GeForce 256显示卡的公司之一,目前SDRAM(^08070201d^)和DDR(^08070201c^)两个版本的显卡已经上市。这两块显卡无论在规格、大小、用料等方面都是相同的,采用公版设计并在卡上集成了一个TV OUT接头。SDRAM版采用16片编号为M1ZL16161A-5T的2M的内存条,DDR版则采用8片编号为HYB39D32322TQ-6的4M的内存条。DDR内存面积比SDRAM略大,厚度差不多。如果拆下安装在芯片上的散热风扇,可以看到DDR版的GeForce 256芯片上印有DDR字样,不过,从功能上讲,两块显示卡的主芯片是一样的。   测试平台:   CPU:PⅢ 450   主板:微星6301(820)   内存:128M PC100 SDRAM   硬盘:火球CR 8.4G   声卡:启亨4.1   显示器:LG未来窗795FT Plus   首先我们使用3D WinBench和3D Mark99 MAX对这两块卡进行测试。由于它们采用同样的显示芯片,所以各个功能测试结果是一致的,只是因为显存的快慢决定最后的得分。   从^08070201g^表3中3D Mark99的得分上,可以很清楚地反映出两块卡的不同之处。在800×600 16bit的情况下,采用DDR的GeForce性能并没有大幅度的超越SDRAM的GeForce,仅比它多出10分。当分辨率提升到1280×1024 16bit时,采用DDR的GeForce已经领先了60分,但这并没有完全反映出两者的区别。我们将色深提高到32bit,再次测试从800×600到1280×1024的3D Mark99得分。这一次,采用DDR的GeForce轻松地将SDRAM的GeForce甩开,从800×600时的30分差距迅速加大到1280×1024时的260分差距。显存传输能力是其中的关键。当分辨率定在800×600 16bit,此时系统所需的数据传输量并不大,对于32M显存、256位处理能力的GeForce 256来说应该是小菜一碟,所以两者的差距很小。但当系统逐渐加大到1280×1024时,数据传输能力弱的SDRAM就开始显出颓势,特别是如果采用32bit的颜色深度,所需的数据量剧增的情况下,具有双倍处理速度的DDR真正显示出强劲的实力,保证了系统处理能力没有如SDRAM一样急剧下降。 3D WinBench 2000测试的结果与此类似,^08070201h^表4中的测试数据是在1024×768 32bit的系统环境下得到的(我们认为800×600的分辨率对GeForce 256来说已经不存在明显的瓶颈)。注意到DDR版因其300MHz的传输能力,在所有项上都优于SDRAM版,尤其在那些材质大、结构复杂的测试项中,这种差别更明显。测试的最后得分分别为36.2和43.7,由于3D Winbench 2000支持T&L功能,因此更能体现出GeForce 256的性能,这应该是这两块显卡目前比较准确的差别。   现在再来做Q3的测试,同样可以看到DDR使速度下降趋势减弱了(^08070201f^表2)。在1280×1024 32bit的分辨率下能达到32帧左右的水平,而SDRAM版的GeForce 256在这种情况下只有24帧左右。DDR的GeForce 256使玩家可以在1024×768 32bit下享受到48帧的速度,基本满足了速度的要求。   GeForce 256的制作工艺为0.22微米技术,这是nVidia公司由0.25微米向0.18微米技术前进的一个中间步骤。其核心频率被定为120MHz。我们试着对丽台这两块卡超频,结果都顺利的达到145MHz,没有加另外的降温措施,系统运行3D Mark99 MAX等都非常稳定。另外,DDR显存的速度应该是166MHz×2=333MHz,不过,也许是出于稳定的考虑,现在几乎所有推出的DDR GeForce 256(包括华硕、ELSA等公司)显示卡显存额定频率只有300MHz。我们将它超频到340MHz,运行Q3一个小时,没有出现问题,看来300MHz的额定频率似乎偏低了一点。不过,在核心频率运行在145MHz、显存340MHz的情况下,Q3在1024×768 32bit设定下的成绩并没有提高多少,只有2帧左右的改善。   我们最后进行了2D性能测试。在WinBench 99的测试中,BUSINESS GRAPHICS WINMark 99的得分两块卡都是180,只在HIGH-END GRAPHICS WINMark 99(高端)测试中,SDRAM版得分为504,DDR版以516分稍占优势。可以说,在256位图形处理芯片上,2D性能已经比较成熟,单靠显存速度的提高已得不到大的提升了。   通过测试,我们可以看到有了DDR内存芯片的协助,GeForce 256的性能确实有一定提高,特别是在高分辨率、大容量纹理的情况下,这种提高更为明显。据说Savage 2000的后继产品也将采用DDR的内存。看来各个显示卡厂商都已经意识到,单是核心处理能力的提高还不够,要显示卡整体性能得到提高,还须要解决数据传输速度等问题。我们也感觉到,GeForce 256的性能还没有完全发挥出来,潜力不小。nVidia公司宣称的“GPU”概念,也许是由于T&L等技术还未得到有力的支持,在测试时并不明显。我们以550MHz的Coppermine作为平台,结果Q3测试成绩竟有超过10帧的提升,说明GeForce 256对CPU的要求还是很高。由SDRAM升级到DDR,可以认为是nVidia公司在为进一步提升GeForce 256的性能做准备。等到T&L技术被广泛应用、核心和显存频率提升到一个新高度时,相信能看到GeForce 256更突出的表现。那个时候,GPU的概念应该能进一步深入人心吧。