2001年3D显示芯片技术与市场展望 朱云 2001年 4期 当人们还在透视去年年底NVIDIA收购3dfx的核心技术的风波时,新的一年又拉开了3D显示芯片竞争的序幕。当今的显示芯片市场上,NVIDIA占据着同英特尔在CPU市场上类似的领导地位,不论技术还是市场上都是如此;紧跟其后的ATI就成了显示芯片领域的AMD,ATI在技术方面虽然有很多亮点,但研发速度较慢和不对外销售芯片的战略都不及NVIDIA有着胜券在握的实力;而以图形质量为本的Matrox,新产品开发已经远远落后于计划日程,如果没有一流的性能作为后盾,空有高价格、高品质的名声也无济于事;其他显示芯片公司在2001年估计只能走上淡出市场的道路,虽然不排除出现“黑马”的可能,但是如今的3D显示市场已经今非昔比,没有巨大财力作后盾的小公司将难以生存。   2001年的3D显示卡,处理速度肯定越来越快,图形质量也必然越来越高,随着不断的升级换代、新技术层出不穷,更多高性价比的产品也将陆续出现。   #1 难以阻挡的技术潮流   3D显示卡的各种技术日渐成熟,然而还是有层出不穷的新技术让人们感到眼花缭乱,3D是电脑领域中发展最快的部分之一。只要去看看最新的专业3D软件,例如SoftImage和Maya等等,它们支持什么样的3D新技术,这些就是将来的3D显示卡可能用硬件支持的新特性。举个例子吧:如今的SoftImage和Maya基本上只使用硬件提高绘图过程中的显示速度,最终显示图像时仍只能使用CPU作软件渲染,因为目前的3D显示卡的3D特性仍不够丰富、图形质量仍不够一致,为了照顾速度,现有的3D图形质量仍差得很远;然而我们的3D芯片正在赶上来,今年将作为3D芯片的硬件功能被广泛接受的背面剪裁、逐像素涂色、NURBS曲面、关键帧插值、骨骼皮肤系统、3D体积纹理和粒子系统等,正是前几年被引入到专业3D软件中用来制作CG(电脑动画)的部分功能。   #2 质量重于速度   随着3D显示芯片速度的不断提高,人们开始更加重视3D图形的质量,因为使用大屏幕显示器的用户越来越多,受到利用电脑制作的影视节目“熏陶”的人们,更加希望在自己的电脑上享受同样逼真的3D游戏。毕竟已经不是当年3D显示芯片出现初期,人人只在乎3D比2D好得多,速度越快越有真实感那么简单;如今3D硬件的速度基本够快了,大家就更多地关心起质量的问题。   3D质量的提高取决于几个方面,多数都是以消耗更多的处理能力为代价:提高RAMDAC的速度,让图像分辨率提得更高、更敏锐;更准确、完整地完成3D功能,不再像从前那样为了提高速度“偷工减料”;FSAA(全屏反锯齿)带来更平滑的物体边缘;凹凸贴图、逐像素涂色等等新3D功能,能够实现更复杂、细腻的3D场景和人物。   #2 HSR(隐面去除)   HSR意味着不必花时间处理看不见的表面,就是3D绘图软件中的背面剪裁,这是继T&L引擎、逐像素涂色、FSAA之后的又一项非常重要的3D技术,能够成倍提高处理速度──按照目前最复杂的场景计算约是3~4倍。   严格地讲,HSR并非新技术,Imagination/Videologic的PowerVR系列和GigaPixel的GP-1都使用HSR;去年年底3dfx为Voodoo 4/5系列开发出具有HSR和T&L功能的驱动程序,估计使用了3D Now!或者SSE指令、用软件实现;NVIDIA也在完善HSR驱动程序(大约是雷管7.27及以后的版本),使用NSR(NVIDIA涂色光栅引擎)模拟出HSR功能,只能用于GeForce 2系列,今后的NV20、NV2A和NV25则肯定将具有硬件HSR引擎;ATI估计也在研究Radeon 256的HSR驱动程序。但是估计只有各公司正在秘密开发的硬件HSR技术,才能有明显的性能提升,没有副作用。   #2 可编程引擎   NVIDIA公司一向倡导使用RISC或者DSP架构作为3D芯片的内核,可编程的结构带来的灵活性对于用户来说至关重要,因为每次推出新的驱动程序都能够得到免费的性能提升(或者功能改变),还可以根据不同的用途配置不同的内部处理流程:应用软件可以调用驱动程序中的标准程序,也可以自行开发一套独特的专用“引擎”。   从今年开始,3D显示芯片将成为完全可编程的GPU,正如CPU分成整数ALU和浮点MPU两部分一样,芯片的3D部分也将分成两部分:几何部分负责造型与光照,包括几何转换、图形剪裁、光源照射、HSR和关键帧插值、骨骼与皮肤等功能,空闲不用的处理能力可以被配置给其他工作量大的功能;渲染部分负责光栅化工作,包括三角形设置、逐像素的材质涂色、多层的纹理贴图和色彩混合等功能,同样可以灵活地使用其中的SIMD处理单元。正如编制得好的软件能让CPU发挥出潜力一样,优化、合适的编程将让3D芯片的能力跨上一个新的台阶。   #2 新3D特性   今年我们将看到3D体积纹理、NURBS曲面、粒子系统等新3D特性正式进入实用阶段,关键帧插值、骨骼与皮肤等CG电影制作功能也可能得到初步的应用。大多数时候,新3D特性的命运完全决定于3D游戏制作商的态度,如今3D显示芯片市场经过大幅度“精简”之后的形势,对软件公司无疑是个好消息,因为它们只需要针对NVIDIA和ATI的顶尖产品开发下一代的游戏引擎就足以保证兼容性──这样可以期待3D新技术将被更快地投入实际应用,游戏软件的执行效率也能得到提高。   #2 新生产工艺   以往最先进的半导体生产工艺总是被用于CPU或者内存,近年随着3D显示芯片的飞速发展,这个惯例可能被打破:CPU使用的工艺是逐级提升的,如0.35、0.25、0.18、0.13微米,每次升级实际硅片面积约减少一半;3D显示芯片使用的生产工艺是半级、半级提升的,如0.25、0.22、0.18、0.15、0.13微米,每次升级实际硅片面积约减少1/4。因此3D芯片的升级速度比CPU快几乎一倍(只是因为CPU分成很多不同频率的版本先后销售才没有让我们感觉升级太慢),而且今年内显示芯片会领先CPU采用0.15微米或0.18微米的生产工艺,当然由于集成规模过大,核心频率无法同CPU主频相提并论,但250MHz~350MHz的标准指日可待。   制约3D性能的一个主要问题是显示内存的速度太慢,DDR SDRAM将在年内达到500MHz~600MHz,下一代的DDR Ⅱ也将在顶级显示卡市场上闪亮登场、速度又将是同频DDR的两倍。AGP 8×的总线接口将是今年的主流,说不定我们还能看见AGP 16×迫不及待地推出呢!   按照CPU的发展规律,现在是为显示芯片集成二级缓存的时候了,其实显示芯片早就有了数十KB的L1 cache,为了进一步提高外部传输带宽必须集成大量的L2 cache。为什么要大量呢?从根本上讲是因为3D显示芯片的瞬时数据吞吐量比CPU大得多,想想最初的Celeron没有集成128KB的二级缓存却没有显著影响3D性能就能明白一二(尽管这个对比不完全对等),显然3D芯片需要“Xeon级”的数MB的L2 cache。   其它的硬件技术,如多显示器支持、全硬件DVD解码、多芯片显示卡和数字化的平板显示功能等,虽然不知道能否成为今年的主流趋势,但是可以肯定今年的3D显示市场必将变得更加多姿多彩,我们用户将有更多的产品可以选购。   #1 沧海桑田的市场变迁   3D显示芯片市场在今年将进入“寡头政治”的时代,只剩下NVIDIA和ATI两家巨型公司正面交锋,还有风头稍逊的Matrox、Imagination和一些整合芯片组公司、专业公司以及部分小公司仍在苦苦努力。   常规情况下,一两家公司垄断的市场将导致创造力的下降和产品更新换代速度的减缓。如今的3D显示芯片市场正在迅速形成这种态势,作为用户,我们当然不希望看到一成不变的显示卡商品价格居高不下,因此一方面我们需要尽力支持ATI等其他公司挑战NVIDIA的霸主地位,另一方面也应当看到整合芯片组等相关产品对3D显示卡市场造成的压力。正如AMD强大了,英特尔的产品就变得平易近人一样,给予NVIDIA更多的压力和竞争,它才能带领整个3D行业马不停蹄地向着“更快、更真、更便宜”的发展方向推进。   #2 3D巨人NVIDIA   尽管NVIDIA已经无可争议地夺取了3D之王的桂冠,但却仍未表现出创新方面的松懈,NVIDIA目前正在开发HSR驱动程序,新一代产品NV20将于今年2月底正式公布、春季准时上市;为微软的XBox准备的整合型芯片组NV20的改进版NV25也在紧张的开发过程中,预计今年秋天上市;新收购的3dfx技术将得到谨慎的应用,利用从3dfx得到的部分开发人员,是否会成为第三支开发队伍仍不得而知,但至少能充实NVIDIA现有的两支开发小组,他们一向是以跳跃式的日程轮流开发新产品;去年初3dfx花费不少代价(比3dfx最终的卖价还高不少)购得的GigaPixel设计公司擅长节省带宽的渲染技术,曾同NVIDIA竞争XBox订单,如今NVIDIA一定能充分利用GigaPixel的智力和专利资源,开发出性价比更高的产品;NVIDIA同微软的合作也不仅仅限于XBox项目,实际上NVIDIA同微软的Direct3D API是共同发展起来的,如今双方的合作更趋密切,NV20完全为DirectX 8优化,DirectX 8中集成了NVIDIA的多种新技术,如3D体积纹理压缩、高阶曲面、可编程的Vertex Shader(顶点材质涂色引擎)和Pixel Shader(逐像素材质涂色引擎)等。(^04039101a^)   如今,除了专业领域的少数公司之外,已经很少有竞争者能够顶住NVIDIA凌厉的攻势,在NV20推出后,很可能NVIDIA的产品将变得所向无敌。在主流的游戏用3D市场上,NVIDIA目前的主力是GeForce2 Ultra/Pro/GTS/MX系列,还有就要退出历史舞台的TNT2系列,不久后NV20系列将接替GeForce2成为NVIDIA的旗舰产品;在移动图形芯片市场上,NVIDIA新推出的GeForce2 Go将大放异彩;对于整合型主板芯片组市场,NVIDIA很快将推出Crush系列芯片组,使用GeForce2 MX档次的图形内核;专业3D绘图领域,Quadro已经逐步淡出,Quadro2 Pro/MXR正如日中天,新一代的NV20GL系列将为NVIDIA赢得更高的声誉;在游戏机市场上,NV2A估计能远远超越SONY PS2的图形引擎、任天堂GameCube的Flipper和Sega DreamCast的PowerVR 2DC──这样一来NVIDIA的触角已经伸到了各个3D相关领域,而且希望在所有市场上都占据领先地位。另外3dfx一向关心PDA和移动电话的3D化问题,很可能今年我们还将听说使用NVIDIA芯片的3D掌上电脑!   #2 3D世家ATI   在去年秋天之前,ATI一直是世界最大的显示芯片厂家,被NVIDIA取代后,ATI更加急于夺回技术领先地位和各类市场份额,措施当然是:技术创新和加快升级速度。(^04039101b^)   ATI在Radeon 256上就采用了不少新技术:Hyper Z节省带宽技术为ATI赢得了高速32位渲染的声誉、关键帧插值、骨骼皮肤系统、各种阴影和3D纹理等都走在了NVIDIA前面。如今,ATI又在简化版的Radeon VE上推出了HydraVision双头显示功能。至于被ATI收购的ArtX则同样擅长节省带宽技术,为ATI主流产品的开发效力的同时,ArtX开发了一系列芯片组产品。至于MAXX多芯片并行技术,因为找不到较好的PCI桥芯片,只能暂时搁置──看看Rage Fury MAXX在Win 2000中遇到的困难和3dfx的Voodoo5 6000换了多种PCI桥芯片就可以理解。   ATI的市场策略同NVIDIA类似,它用同一系列产品应付PC和苹果电脑的主流市场:目前是Radeon 256的DDR和SDR版,还有Radeon VE,上半年将推出4条渲染流水线的Radeon Ⅱ及其简化版Radeon Ⅱ VE,年底还可能完成相当于3倍的Radeon Ⅱ速度的Radeon Ⅲ;在移动计算市场上,功能类似Radeon VE的Mobile Radeon有些落后于预计的日程,估计将于近期推出;整合芯片组方面,ATI现有T&L功能的S1-370 TL,很快将推出ArtX 2+和ArtX 3芯片组,ArtX还为任天堂GameCube游戏机开发了Flipper芯片组,其T&L引擎的速度达到2.8/4.7GFLOPS、5100万三角形/秒,集成2.1MB的1T-SRAM。同NVIDIA的情形相比,ATI在使用OpenGL的专业3D领域弱点明显,尽管在2D设计方面实力很强。   #2 3D贵族Matrox   Matrox的产品一向是高质、高价的代名词,至今G400/450系列的2D图形质量仍是无人能及,是2D平面设计的“利器”。然而近年来Matrox在3D技术的发展上明显落后,只有凹凸环境贴图(EMBM)一项3D特性是由Matrox首先引入的,至于处理速度方面就更加不是NVIDIA和ATI的对手了。(^04039101c^)   今年,Matrox全指望新一代支持T&L的G800挽回局面,因为G400/450仅凭双头显示和TNT2档次的性能苦苦支撑,如果年内G800还未出现,Matrox恐怕要变成专门生产“专业2D显示卡”的厂家了。   #2 3D另类Kyro   Kyro系列真是很难讲属于哪家公司,它是由Imagination设计、SGS-Thomson生产芯片、Videologic制造显示卡(也有其他公司制造兼容显卡)的PowerVR 3系列。PowerVR系列的历史“悠久”:在Voodoo时代Power VR PCX1/2就早已存在了;在TNT时代PowerVR 2系列主要提供给Sega DreamCast游戏机,PC版产品PowerVR 250不很知名;如今是3dfx都已消失的GeForce时代,屹立至今的PowerVR节省带宽架构在Kyro系列身上又焕发了青春。   Kyro分块渲染的HSR引擎效率比较高,但是性能却只能同GeForce2 MX相提并论,主要是因为它不很适应目前为传统3D架构优化的3D游戏。另外,由于Kyro和Giga Pixel采用的分块渲染机制需要对每块显示区域内的多边形进行排序,因此更适合多边形少、像素多的场景(例如FSAA的赛车和飞行游戏),即使有了T&L引擎也帮不上太多的忙。   今年Kyro系列将发展壮大,新生产工艺、高工作频率的新Kyro和集成分块渲染专用的T&L引擎的产品将陆续登场。但如果性能落后于NVIDIA和ATI的产品过多,Kyro也可能会从人们的视野中迅速消失。   #2 3D整合芯片组   在这里,你能见到许多退出了主流3D显示芯片市场的名字:S3、Real3D、SiS、ArtX和Rendition等。   老牌显示芯片公司S3已经连技术带品牌都卖给了威盛,S3自己改名为SONICblue,专心致力于音频和数字家电产品。威盛今年上半年将推出新3D核心Paramount的主板芯片组多款,分别是PM266、RM266、PX266等。另外,威盛还是决定同SONICblue联合经营新成立的S3 Graphics公司,目前的研发项目是几种可以同时用于独立显示卡和整合芯片组的3D内核:Paramount和后续的双像素流水线产品Zoetrope,还有最新的兼容DirectX 8/9的Columbia。估计今年二季度拿出样品的Columbia将是S3能否起死回生的决定产品。   属于Intel的著名飞行模拟公司Real3D也是专心开发芯片组用的3D核心,目前还不清楚815E后面的整合产品是什么。   SiS将推出SiS315显示卡芯片,具备简化的T&L功能和DDR内存支持。基于SiS315内核的单芯片主板芯片SiS640、SiS740将是今年的主力产品。   ALI目前仍使用ArtX当初授权的S1-370 TL的图形内核和TNT2内核的产品,但是今后的整合芯片组使用什么内核,仍属于未定之数。   Micron公司买下Rendition很多年了,仍未有3D产品推出,今年估计在集成8MB的L3缓存的Mamba芯片组之外,还可能生产具有Rendition的3D核心的整合芯片组。   总的来看,如果NVIDIA的Crush 11/12系列芯片组如期推出,能同它一较高下的对手并不太多,大多数整合芯片组的目标是廉价PC市场。   #2 3D专业芯片   目前依然“健在”的专业3D显示卡公司并不少:3Dlabs仍在销售那些由Gamma、Glint芯片组装成的产品,被3Dlabs吞并的Intense3D(原属顶级专业3D厂商Intergraph公司)风头正劲,Wildact 4110和目前的旗舰4210获奖无数,还将推出Wildcat Ⅱ系列;Evans & Sutherland(E&S)仍在开发和生产REALimage 1200/3000/4000系列;HP公司继Visualize FX-5之后又推出了FX-10;NEC的TE4E似乎略有“廉颇老矣”之感;唯一SONICblue尚未放弃的显示卡分公司FGL Graphic,将继续用IBM的芯片生产FireGL 1/2/3系列,今年可能是双芯片、256位128MB DDR内存的FireGL 3的天下。(^04039101d^)   然而NVIDIA尚未出手,谁能保证它够蝉联新一年的专业3D性能的冠军?目前在OpenGL的ViewPerf 6.1.2测试中,只有Wildcat 4210、FireGL 2和TE4E档次的产品才能略胜过Quadro2 Pro,很难想象NV20GL现身后还有什么显示卡能阻挡NVIDIA加上ELSA(还有SGI)的脚步──只能期待Wildcat Ⅱ和FireGL 3暂时顶住压力,可是再过半年、一年,NV25、NV30推出时呢?!   还有一些小公司我们尚未谈到,Bitboys的Glaze 3D让人望眼欲穿好几回了,Trident的Blade XP集成简化的T&L功能,应该同SiS315的命运类似,我已经很难再举出其他仍在生存的3D显示芯片公司。   #1 结语   在日渐成熟的3D显示市场上,一幕幕的悲喜剧不断上演,NVDIA再次证明了其强大的技术实力。在这个强者为王的时代,技术的领先和市场良好的结合将对任何厂商的生存都是良好的基础。2001年3D市场或许并不能给我们带来更多的惊喜,但我们仍在期待更好的产品,尽管很多结局都在我们的意料之中。