八块专业显示卡测试 祝伟、万鹏 1999年 第46期 49版 PC市场上的3D加速卡种类很多,大家比较熟悉的是TNT2、Voodoo3等。除了这些常见的家用3D加速卡外,还有一类价格昂贵、用途特殊的专业图形加速卡,大多数读者对它们几乎不了解。很多朋友会问:“为什么有的3D加速卡要卖到万元以上?到底它们有什么用?”或者是“我用TNT、Permedia2一样可以搞图形设计,和这些昂贵的专业卡有什么区别?”这次我们测试了八款工作站级3D加速卡,为读者展示这个较为陌生的领域,希望能够解开大家的疑团,并为准备自己攒一台图形工作站的朋友提供参考。 在公布测试数据和结果之前,有必要先和大家谈一谈专业图形加速卡的一些特点。一般来说,目前工作站级图形加速卡的研发和制造掌握在Intergraph、E&S(Evans&Sutherland)、3Dlabs、ELSA等少数公司手中。这些公司在图形学、工程学、软件学等领域造诣相当深,研发的显卡主要针对Pro/E(ProEngineer)、Pro Designer、CATIA、MAYA、SoftImage、AWSYS等高端CAD、CAM、Animation(动画)、Simulation(模拟)软件。而市面上常见的S3、nVidia、3dfx、Matrox等公司生产的3D加速卡主要面向娱乐和相对简单的商用图形软件。直观地说:“专业图形加速卡是用来创造3D游戏和商用图形的,而一般的家用3D加速卡是用来演示这些画面的。” 因为用途不同,专业图形加速卡和一般3D加速卡在硬件和软件上存在很大的区别。在硬件方面,TNT2一类的3D加速卡几乎所有的功能都集成到一块主芯片中,而许多高档专业卡上有四五颗芯片,其RAMDAC、渲染芯片、显示芯片都是独立的。例如ELSA的老牌专业卡Gloria XXL,基板上有250MHz IBM RGB640 RAMDAC芯片、Permedia2V显示芯片、Glint MX 3D加速芯片和Glint GammaR1集合协处理器共四颗芯片。这样做的好处在于各芯片各司其职,可以专心致志地完成自己的工作,而且专业显卡的发热量是极其惊人的,分散布置可以避免因集成度过高而产生的高热问题。专业卡的显存和一般显卡也有区别。许多高档专业卡的显存分为两部分,一部分是用高速RAM充当帧缓存,另一部分使用较大容量的低速RAM存储纹理,例如E&S公司的Lighting1200就配置了15MB SDRAM帧缓存和16M BCDRAM(Cache DRAM)纹理缓存。另外,专业级加速卡的做工都非常到位,普遍采用八层板或十层板,大量使用贴片安装的钽电容,卡上通常有两个以上的涵道风扇进行散热,电源部分也经过专门设计。专业显卡的另一个特点在于其软件,很多专业显卡根本就没有Windows98的驱动程序,只能用于Windows NT系统中。这些显卡的驱动程序通常都可以调节硬件的DMA数量和Buffer尺寸,有的卡还为特定的软件如Pro/E和MAYA编写了专用的驱动程序,这样做的好处是显卡的兼容性和速度都有很大的改善。专业显卡采用的API是OpenGL,部分产品也提供对DirectX的支持。 高配置的硬件和优化的软件为专业显卡带来的好处很多,但是副作用也显而易见:它们的价格太高了!很多爱好图形设计的发烧友是可望而不可及。但是如果你是一位专业的设计师,一块好的工作站级3D加速卡是不可缺少的,它会为你节省很多时间,极大地提高工作效率。(附^464901a^表1) #1测试方案设计   参加本次测试的显卡有ELSA公司的Gloria XXL和Gloria SynergyⅡ、丽台公司的L2800和L300VX、E&S公司的Galaxy和Lighting1200、帝盟公司的FireGL1和耕宇公司的Permedia3共八款,显卡的技术规格参见表一。必须提到的是专业显卡的三角形生成数目指标和我们常用的主流3D加速卡不同,前者是指每秒实时生成的三角形数量,而后者只是指每秒演示的三角形数量,这两者之间有很大的区别,所以大家不要单纯地和某些显卡技术资料中的每秒生成1XXX万个多边形相比较。   与以往我们对一般显卡的测试不同,这次测试被分为四个部分。第一部分是使用常用的OpenGL测试软件Viewperf6.1.1和Indy3D 3.0评估参测样品的OpenGL加速性能。第二部分是最重要的环节,让这些显卡在应用软件中实际测速,毕竟用户买这些昂贵的显卡并不是为了Benchmark,只有在实际使用中才能说明它们究竟有多少“威力”。这一部分我们使用了AutoCAD、SolidWorks、Pro/E这三个软件来进行测试。第三部分是显卡对CPU的依赖性测试,因为毕竟不是每一个用户都可以随随便便地配置双Xeon系统,基本上现阶段奔腾Ⅲ还是较容易接受的选择。而奔腾Ⅲ 450和奔腾Ⅲ 733的价格差距也相当大,用户应该选择哪个档次的CPU呢?所以CPU能力对显卡产生的影响如何,大家都会有兴趣。最后一部分是对显卡兼容性的测试。就像一般3D加速卡在某些游戏中会有Bug一样,专业加速卡可能在图形软件中也有Bug,所以除了第一、二部分使用的软件外,我们还打开了MAYA、SoftImage、LightScape和3DMAX R3.0的一些基本模块,看看这些显卡会不会出问题。 #1测试平台配置   为了让这次测试尽量不受其他方面造成瓶颈的影响,我们布置了一台配置较高的图形工作站。   CPU:奔腾Ⅲ 650(100MHz×6.5)   内存:512MB “金条” (PC133 With ECC CL=2)   主板:硕泰克 SL67-EB   硬盘:IBM DGV-09U  (SCSI接口,10000转,1MB Cache)   SCSI卡:Adaptec2940UW   显示器:日立EMT-751U 19英寸   操作系统为WindowsNT4 ,参测显卡的BIOS都已经刷新为各公司发布的最新版本,也下载安装了最新的驱动程序。 #1测试数据分析   在第一部分的OpenGL测试中(得分见^464901b^表二、^464901c^表三),可以看到丽台L2800和帝盟FireGL1是Viewperf测试的佼佼者。因为L2800拥有几何加速芯片——Gamma,所以在反映线框速度的Light-03、DX-05、DRV-06测试项中优势明显,而号称256Bit加速卡的FireGL1则在反映动画与线框相结合的Awadvs-03、ProCDRS-02测试相中表现突出。Indy3D测试则是E&S公司Lighting1200和Galaxy的天下,E&S的这两块加速卡都拥有独立的纹理贴图芯片,所以在以动画、模拟为主的Indy3D测试中胜出也在情理之中。   第二部分的应用软件测试是本次测试中最“严酷”的部分,AutoCAD测试使用的内存容量达到了256MB,程序运行约一小时30分钟,而Pro/E对内存的使用量高达508MB,最快的显卡运行一次也需要二小时四十分钟,这些测试项目比我们用3D Winbench99测试普通3D加速卡耗费的时间和资源都多出好几倍。   首先是CAD测试项,我们运行的软件平台是AutoCAD2000,测试软件为CAD ALYST杂志编写的“C99 bench”,这一测试软件将运行几个CAD实程序(以LISP文件为主),然后根据时间计算成绩(测试结果参见^464901d^表四)。出人意料的是,在这一测试项中胜出的是本次测试中最廉价的显卡——Permedia3,我们推测原因是AutoCAD对显卡几何运算能力要求不高,甚至有可能是通过2D软件模拟运行的3D Test,所以这显卡的2D性能对该测试至关重要,看来3Dlabs的产品(包括Permedia3、VX1和GVX1)在2D领域确实有独到的地方。而最后一名——Lighting1200的“主攻方向”不是AutoCAD,其2D引擎是由Cirrus Logic提供,所以得分偏低。   接下来是中等档次的SolidWorks测试。该项测试的成绩表现得特别的“合乎情理”,各显卡测试得分的高低基本和价格高低相吻合。唯一的例外是ELSA Gloria XXL,这款显卡因为推出的时间较早,其硬件设计和驱动程序都比较旧,所以表现有失水准,得分垫底。帝盟FireGL1的256位通道设计使其在Solid Works的大数据量处理中受益匪浅,以微弱的优势击败L2800、Lighting1200等强劲对手。(SolidWorks98 BenchMark由Spec站点提供,配合SolidWorks98使用)(^464901e^表五)   最后是本次测试的压轴戏——Pro/E Bench。该项测试的软件平台使用Pro/E 20版,测试软件由Spec提供,两者共占据超过500MB硬盘空间。为了更清楚的显示专业级3D加速卡在高端图形领域的优势,我们使用了一块Matrox G400作为参照,测试成绩参见^464901f^表六。表六清楚的显示出在高端图形软件中,专业显卡的优势极为明显,G400用了四个多小时完成的测试,L2800只需要两个多小时,几乎节省了一半的时间。而G400在“第四代3D加速卡”中还算表现不错,因为Savage4和TNT2根本运行不了这一项测试。本次测试八块显卡中,SynergyⅡ在Pro/E中存在一些兼容性问题,笔者运行了三次测试才得到了一次成绩,所以如果读者真的有可能用到Pro/E,最好选择使用3Dlabs或E&S芯片的显卡。   完成性能测试以后,我们进行了显卡对CPU依赖性的测试。我们从Viewperf6.1.1中选取了ProCDRS-02这个项目的得分作为标准,然后将CPU换为奔腾Ⅲ450,数据参见^464901g^表七。我们可以看到像GVX1、XXL这类显卡上有强力浮点引擎的加速卡,对CPU的变化并不敏感,而那些内建或没有浮点引擎的显卡对CPU的依赖性较强。   最后,我们还进行了兼容性测试。和我们以前进行的显卡与不同主板之间的硬件兼容性测试不同,专业卡的兼容性主要是指和各种高端图形设计软件之间的软件兼容性。可以想象,花了成千上万元买回来的图形加速卡在某个软件中不能用是多么令人懊恼的事。^464901h^表八显示了本次测试样品的兼容性情况。撇开“非专业”的G400不谈,可以看出在专业显卡中采用nVidia TNT2芯片的ELSA SynergyⅡ兼容性问题较多,因为从本质上来说TNT2并不是针对专业应用设计的,要把D3D和OpenGL两种API完美地融合到一起并不是一件容易的事。SynergyⅡ能够达到这样的兼容性已经不错了。另外值得注意的是:我们在安装完Lighting1200专为Pro/E优化的驱动程序后,SoftImage和MAYA就不能正常工作了,所以专业显卡的用户在安装专门为某个软件优化的驱动程序时一定要注意一一对应,以免造成不必要的麻烦。 这次的测试表明,在3DS MAX这样的常用图形设计软件中,普通3D加速卡也可以完成工作,而工作站级显卡能够极大地提高工作效率。类似Pro/E这样在工程设计中大量使用的“真正”的高端图形软件,普通的加速卡就显得力不从心了。所以如果你只是一位将3D图形设计当作业余爱好的发烧友,可以选择TNT2一类的普通显卡或Permedia3、L300VX等入门级专业卡,但如果3D制图是你的工作,那么最好能够选择L2800、FireGL1这样相对高档的专业显卡。在测试报告的下篇中,我们将逐一介绍参测样品的性能和特色。 #1参测样品简介 #1丽台公司L2800、L300VX   丽台公司送测的L2800(^464901i^)和L300VX(^464901j^)其实就是3Dlabs的GVX1和VX1。 L2800是一款较高档的图形加速卡,它采用GammaG1加GlintR3的芯片组合。GammaG1负责几何运算,GlintR3负责对3D有关的处理,两块芯片配合得天衣无缝,同时提供几何和光源硬件加速。L2800还采用独特的虚拟纹理技术,这种技术可以认为是AGP技术的扩展。简单地说就是使用板载的显存缓冲存储在系统内存中的大纹理,它允许操作256MB大小的纹理。3Dlabs的技术资料表明,这一技术可以在不损失图像质量的情况下提供30倍于普通AGP纹理的容量和效率。它还专对奔腾Ⅲ SSE指令集设计,并且有优化的OpenGL驱动程序。L2800上还有一块能够连接18英寸数字平板显示器的SIL150芯片和一个TV Out端子,使其工作范围大幅扩展,它支持1920×1200的分辨率,通过升级驱动程序,还提供对2048×1536分辨率的支持,也支持硬件MPEG-2动态补偿。   L2800的主3D芯片GlintR3设计独到,它完全支持OpenGL1.2,提供单像素光源凹凸映射。在单一时钟周期,它支持双重双线性mip-mapping和三重纹理混合。这些高级特性使L2800在本次测试中大放光彩,大多数测试项目的成绩都名列前茅。它在DRV-06、DX-05、Light-03、Pro/E、Animation五项测试中位居第一,尤其是在Pro/E中的线框速度更是远远超过其它样品,这得益于它独立的几何运算芯片GammaG1。这款加速卡最适合于线框很多,光源迭代运算繁重的设计应用,因此使用Pro/E、MAYA、Softimage的用户会对它十分满意。不过L2800的价格超过10000元,非专业用户大概是无福消受了。   L300VX可以说是L2800的缩小简化型号,它只采用了GlintR3芯片,去掉了昂贵的GammaG1,也没有连接数字平板显示器的SIL150芯片。另外它采用的显存也由L2800的8ns SGRAM改为7ns SDRAM。这些措施使L300VX的价格比L2800大大下降了。但有关性能特征,如分辨率和3D特性等,L300VX和L2800是相同的。   和L2800相比,L300VX的速度当然有所不及,但它在AutoCAD测试中的成绩分外耀眼,仅以非常微弱的差距列于Permedia3之后,另外它对各种软件的兼容性也相当不错,从《古墓丽影Ⅲ》到Pro/E,L300VX都能胜任。对于常用到AutoCAD的用户,例如中小型建筑公司(多数建筑类软件的核心是基于AutoCAD),L300VX是一个不错的选择,如果它3000元左右的价格能再下降一些,就更好了。 #1ELSA公司GloriaXXL、SynergyⅡ   ELSA公司是一家老牌专业图形加速卡公司。早期它曾以3Dlabs公司的主芯片为基础开发专业加速卡。当3Dlabs公司停止向ELSA供货后,它将芯片的需求转向nVidia,现在是世界唯一一家能够以TNT2芯片为基础生产专业加速卡的公司。   参加本次测试的GloriaXXL(^464901k^)是ELSA公司采用3Dlabs图形芯片时期开发的顶级大作,它采用Gamma加GlintMX的配置,并使用Permedia2和2MB SGRAM用于图形界面引导,它支持1920× 1200分辨率,比较有特色的是,它还支持非常高档的16:10宽屏幕显示器和3D立体液晶眼镜。GloriaXXL 的3D特性包括纹理MIP-mapping、几何加速、抗混叠技术、雾化、覆盖等等。由于拥有Gamma芯片,GloriaXXL在线框处理较多的场合,如Pro/E、DataExploer等软件中有很强的优势,而且经过多年持续不断地改进,XXL的软件兼容性已经非常完善。XXL的缺点在于2D速度较慢,在AutoCAD和SolidWorks等以2D为主的软件测试中成绩不够理想,如果用户只接触高档3D设计软件,XXL还是值得考虑的。   SynergyⅡ(^464901l^)则是ELSA生产的“另类”风格的代表,它采用了nVidia TNT2芯片,加上ELSA自己开发的全新WindowsNT OpenGL驱动程序,成为了唯一的“专业级TNT2”。 SynergyⅡ有16MB和32MB两种规格,同样支持1920×1200的分辨率。TNT2并不是专门设计的专业图形加速芯片,它支持的3D特性相信大家都比较清楚,包括单通道多材质、MIP mapping、高洛德渲染、雾化等。   从测试的成绩来看,SynergyⅡ在各专业软件中的速度还是相当不错的,不少项目中可以和Permedia3、VX1等入门级专业加速卡匹敌,在CAD类测试中,SynergyⅡ的成绩也居于前列。但由于TNT2芯片的先天不足,SynergyⅡ在一些专业软件中的兼容性受到影响,主要集中于高端3D设计类软件,如果ELSA能够进一步完善SynergyⅡ的驱动程序,并降低价格,它的前景相当光明。 #1帝盟公司FireGL1   FireGL1(^464901m^)是由大名鼎鼎的图形卡公司Diamond和PC巨头IBM携手开发的专业图形加速卡,它采用IBM针对Windows NT开发的第一个图形芯片。只使用了一枚“ALL IN ONE”芯片的FireGL1板卡面积非常小,和许多比MicroATX机箱还长的专业卡比较起来,它更像一块高档的家用图形卡。FireGL1的用料非常高档,板上共布置了16枚Simens 6ns SGRAM,芯片,其显存的通道宽度更是首屈一指,它是世界上第一块256位引擎的图形加速卡。FireGL1具有多线OpenGL驱动并支持奔腾Ⅲ SSE,它支持的最大分辨率为1920×1200,在Windows NT下同时支持四个显示器。其3D特性包括:集成多边形建模引擎、24位RGB双缓冲、24位Z-缓冲、点采样、YUV-RGB等。   FireGL1不仅仅拥有256位核心,也采用双128位通道和帧缓存连接。256位特性使它在需要大数据量交换的专业软件应用上占有很大优势,它在ProCDRS-02、Awadvs-03 Fill Rate、SolidWorks等测试中取得了第一,另外在Indy3D的MCAD40和MCAD150两项测试中仅仅次于E&S的Lighting1200,位居亚军。对于一块单芯片的专业卡来说,能够取得这样好的成绩也是非常令人惊异的。帝盟和IBM两强联手使得FireGL1在各种专业软件的兼容性测试中表现非凡。由于本身性能强劲,而又没有专门的几何加速芯片,FireGL1对CPU性能比较依赖,一块低档的CPU是无法让它发挥出所有潜力的,因为FireGL1的设计思想是多线程操作,将几何运算交给双处理器工作站的第二颗CPU,这决定了在单一CPU系统中,它无法发挥出最大性能,所以从某种程度上说,本次测试对FireGL是“不公正的”。另外,FireGL1的价格也在万元档次上,和L2800差不多,就成本而言,这一价格显得高了一些。 #1E&S公司Galaxy、Lighting1200   E&S公司是一家真正的专业图形加速卡生产商,Galaxy(^464901n^)和Lighting1200是面向低端专业卡市场的产品。其实它们的差别并不大,只是3D渲染芯片有所不同。这两块加速卡有一个显著的特色,都使用了E&S的传统优势显存——3DRAM和CDRAM。这两种显存都来自三菱公司,并不常见。3DRAM是专门为3D图形设计的一种双通道显存,速度非常快,价格当然也非常昂贵,它特别适合用于动画处理,因此Galaxy和Lighting1200在SoftImage和MAYA等软件中的渲染速度完全可以和一般UNIX工作站用的显卡相抗衡。   E&S的这两块加速卡囊括了Indy3D测试中所有项目的第一名,Lighting1200获得MCAD40、MCAD150两个项目的冠军,而Galaxy则取得Simulation、ImageQuality、Fixed Rate、PolygonRate四个项目的第一名,尤其是后三项测试中,Galaxy更是将对手抛得老远,显示了强劲的实力。Galaxy和Lighting1200的最强之处在于动画和仿真应用,国外有很多游戏公司在E&S的图形加速卡上运行SoftImage和MAYA,因为速度和画质都很杰出。在测试中我们发现Galaxy和Lighting1200的色深选择只有一种——32Bit,似乎这两块显卡只是为动画和模拟这些对颜色、画质要求较高的应用而诞生的。   Galaxy和Lighting1200也并非全无弱点,首先,这两块卡上的RAMDAC只有175MHz,严重限制了它们在高分辨率下的应用。另外Galaxy和Lighting1200在AutoCAD测试中的速度慢,证明它们的2D引擎比较差劲。E&S的这两款加速卡最适合只玩3D基本不接触2D的用户。 #1耕宇公司Permedia3   台湾显卡生产商耕宇公司这次送测了一块Permedia3(^464901o^),耕宇公司证实将继续生产Permedia3,并且已经投放市场,这使得前一段时间对Permedia3停产的流言不攻自破。这块Permedia3使用了4片2M×32的SEC-G7显存,和3Dlabs原产的显卡相比,耕宇的这块卡重新设计的电路。由于这块卡采用了风扇主动散热,所以使用时温度比较低。   Permedia3是本次测试中最廉价的专业图形加速卡,不过在测试中的表现倒并不“掉价”,在AutoCAD的测试中它击败了众多强手脱颖而出。另外,这款产品的兼容性也很出色,一般非公版设计的加速卡总会在兼容性上出问题,特别是高端的图形软件,Permedia3则经受住了考验。   由于没有Gamma几何加速芯片,Permedia3在高端软件如Pro/E、SolidWorks等测试中成绩一般,不过以其2000元左右的价格来说,也不应该有过高的要求,它可能是目前能买到的最廉价的专业图形加速卡了,对于3D图形发烧有来说,非常适用。   测试完成后我们做了一个实验,将Permedia3的BIOS刷新为3Dlabs VX1,WindowsNT即将它识别为VX1显卡,并能正常使用,看来Permedia3和VX1并没有什么差异,它们的核心其实是一样的。 #1总 结   这一次专业图形加速卡的测试花费了我们无数的精力和时间,我们希望能够通过这次测试让大家明白专业级显卡到底“专”在何处,不同的专业卡的“对口”专业又是什么。现在我们可以大致知道,基于3Dlabs图形芯片的卡一般对CPU能力要求不高,兼容性很好,适用于Pro/E、Pro/D(Pro Designer)、AutoCAD等工程软件上。这一类应用中,丽台L2800、L300VX和Permedia3都是不错的选择。E&S公司的加速卡更适合用于要求高画质、高动态的动画、模拟场合。帝盟FireGL1是一块各方面都很均衡的显卡,兼容性也很好,应用范围很广,如果配置较高,CPU够强力,选择它也不错。ELSA公司的新产品SynergyⅡ性能还是很不错,而且价格也还并不算太贵,可惜其兼容性还有缺陷,希望能够尽快改进。耕宇公司的Permedia3在测试中表现良好,其价格更是诱人,是普通用户的上佳选择。   这次的测试已经告一段落,但大家不久就会看到诸如Permedia4、Realimage4000、Quardo等新一代专业加速卡面世,我们期待在下一次测试中,能够让这些新生代登台亮相并一较高下。 #1几何加速 在本次专业显示卡测试中,我们大量提到了几何加速的作用,可能很多读者对此并不了解,这里向大家简单解释一下。 3D图形生成的过程请见^464901p^,我们可以看到,转换、剪辑、光影三个几何函数位于这一流程的中间部分,也是这一过程的瓶颈部分。十年前,UNIX工作站即开始使用硬件几何加速,而PC机上一直采软件方式进行几何运算。一块高主频的奔腾ⅡCPU每秒大概可以处理1百万个顶点,也就是说通过软件几何加速。PC机上图形应用程序每秒仅仅能够处理30万到60万个多边形,当然,此时CPU已经完全陷于繁忙的运算中。而流畅地使用动画和VR程序大概需要每秒2百万多边形的处理速度,所以我们需要将PC机的几何运算速度提高约5倍。 现在PC机上提高几何运算速度主要包括两方面的措施,其一是使用奔腾Ⅲ或Xeon CPU,它们的SSE扩展指令增强了浮点和几何转换功能,现在多数专业图形加速卡的驱动程序已经为SSE指令集做过优化。第二项措施就是图形加速卡本身的新技术开发。目前成功使用的两种解决方案就是3Dlabs的Gamma和IBM的FireGL(^464901q^),这不同两种方案最终都达到了每秒3百万多边形以上的处理速度。这两种方案各有特色,3Dlabs的解决方案相对而言更为彻底,但Gamma芯片成本很高,也就提高了图形加速卡的成本,只适用于高档卡,不利于普及。IBM的方案充分利用了CPU的性能,显卡成本较低,但对于单CPU系统没有意义,不够完善。 nVidia新近推出的Geforce256是第一块支持几何加速的家用显卡,它在芯片中集成了256个指令的DSP也是一种几何加速解决方案,当然性能还无法和Gamma芯片相比,不过Geforce256的价格比集成Gamma芯片的专业卡要低,能够让普通用户感受到几何加速的优点,Geforce256功不可没。