新一代3D加速芯片PowerVR SG 朱云 1998年 第31期 33版   从Voodoo到Voodoo2,3Dfx 公司占据游戏用3D加速卡市场的统治地位已有一年半。然而这种一手遮天的情形不会太长久了,这不仅是因为基于RivaTNT等新一代2D/3D加速芯片的显示卡很快将会上市,更重要的是PowerVR SG就要出现了!   PowerVR SG是NEC公司和Videologic公司继PowerVR PCX2 纯3D加速芯片(Matrox曾用它开发过一款价廉物美的3D附加卡M3D,在国际国内市场均有不错的销量)之后,再次合作开发的PowerVR Second Generation(PowerVR二代)全功能单片2D/3D/视频加速器的缩写。   新一代的PowerVR SG 针对PCX2的缺点,进行了很多改进和创新。我们从以下两个事例中许也可以看出一些端倪:首先,世界最大的微电子生产厂商之一的NEC和著名的3D显示卡设计公司Videologic合作开发了两年多之后才宣布推出PowerVR SG;其次,作为电子游戏界巨头的SEGA(世嘉)公司在为其新一代家用主机Dreamcast挑选显示加速芯片时,放弃了占有率较高的3Dfx的芯片,转而选用PowerVR SG,理由很明确——PowerVR SG具有更先进的硬件结构和更好的显示效果。下面就让我们来看一下PowerVR SG为什么会得到世嘉公司的青睐呢? #1PowerVR SG的特点   与Voodoo系列的传统结构不同,Power VR系列产品的3D流水线有着专用架构,它的图形处理流程如^313301a^所示。由PCI或AGP总线送来的图形数据,最初由硬件分块加速器将整个屏幕的显示数据分为许多512(32×16)像素的小“块”(Tile),然后对每个块进行单独处理。在处理过程中,先由几何综合处理引擎及其前端的几何综合设置引擎,将形状和位置(包括哪些多边形看得见,哪些看不见)方面的工作全部处理完毕。随后,数据被送至纹理综合处理引擎及其前端的纹理综合设置引擎,将那些可见的多边形贴上纹理贴图,再进行阴影、光线等3D效果处理。最后由两个后端累加缓存器将图形进行多纹理的多路32位合成,以实现DirectX和OpenGL中要求的全部Alpha(透明)混合模式,然后送至显示内存并显示出来。这样的3D加速结构,可以实现每秒1.2亿个像素填充率和每秒300万~400万个已渲染多边形峰值生成率。   在PowerVR SG的数据处理流程中,有三个独有的特点。第一,它将整个屏幕数据进行硬件分块处理,可以最大限度地简化操作,比较容易将几何和纹理引擎最优化;另外,由于每块的数据量较小,所以可以一次将几何和纹理处理完成后再全部送入显存,而不必像Voodoo 2一样处理完几何数据后先送入显存,再由纹理引擎又读进来进行处理,这样节省了显存带宽,也就等于提高了显示速度。第二,是HSR(Hidden Surface Removal,去除不可见表面)功能,这一功能相当于普通3D芯片的Z-buffer(Z轴缓冲,就是通过不同物体的远近距离确定它们互相遮掩的关系),并且具有32位浮点Z-buffer的精度,但是HSR是全硬件的芯片内部操作,所以速度快,又不像Z-buffer那样占用大量显存,而且也节省了显存带宽。至于被挡住看不见的物体,一般3D显示卡还是要对它进行几何、纹理数据等处理,而在PowerVR SG中就完全不再处理了,这一机制极大地节省了处理时间,从而使PowerVR SG的速度表现足以跻身于最快的3D显示芯片之列。第三,是VQ(Vector Quatization)纹理压缩功能,使用符合微软在DirectX 6.0中认可的S3公司S3TC标准的特殊算法,PowerVR SG的最大纹理压缩率可以达到8:1(S3公司标准算法的最大压缩率为6:1,而Voodoo系列的压缩率约为2:1),这样不但可以减少纹理数据对显存的占用,还可以少占用显存带宽。另外VQ功能的纹理压缩是当纹理数据装入时在后台进行的,解压缩速度很快,基本不占用处理器时间,还可以混合使用压缩与未压缩的纹理数据。正是由于具有这些特点,PowerVR SG可以轻松地实现顶级的3D速度和画面质量。   PowerVR SG的优点还不止这些,在3D方面它还拥有很多其它的功能。首先,有了全硬件浮点32位几何、纹理设置引擎,可以大大降低系统对CPU浮点性能的依赖。PowerVR SG与RivaTNT、Permedia3一样,具有全景抗锯齿失真(Full Scene Anti-aliasing)过滤功能,远远优于Voodoo系列所倡导的边缘抗锯齿失真(Edge Anti-aliasing)过滤的效果,过去只是因为全景抗锯齿失真过滤运算量太大,所以一直没有办法实现。现在PowerVR SG 利用可达2048×2048点的超级取样(Super-Sampling)方式将其变为现实,效果好而且易于使用。Volume效果则是由PowerVR SG第一次实现的,可以将特殊空间范围的效果变得容易实现,例如可以方便地制作阴影、镜头反光光斑等很多特殊效果。PowerVR SG还可以硬件实现DirectX 6中支持的模板缓存(Stencil buffer)和凹凸材质贴图(Bump mapping,Voodoo 2只能用软件实现)等功能。另外它还具有透视矫正的双线性、三线性、各项异性等过滤功能,透视矫正的ARGB高洛德(Gouraud)明暗处理,具有色彩偏移的镜面高光效果,环境贴图等等很多3D特性。   PowerVR SG出色的2D和视频性能,也是世嘉在Dreamcast中选用PowerVR SG的另一个原因。它可以完善地支持DVD软解压和高质量的视频输入输出。另外,PowerVR SG还有以下特性:异步工作模式,可以在处理图形的同时释放CPU进行程序操作;帧缓存和纹理缓存统一的显示内存模式,最多可以使用高达32MB的SDRAM;片上集成230MHz的RAMDAC,在24位真彩时最大分辨率可达1600×1200;使用100MHz内部时钟;使用NEC先进的0.25微米工艺制造,更小的工艺线宽意味着更高的时钟频率、更小的硅片面积以及更少的热量耗散,也就相当于更快的运行速度和更便宜的IC(显示卡)售价,所以PowerVR SG芯片价格约为$30(批量订货时),比NVIDIA公司的超级3D加速芯片RivaTNT低大约$15。 #1业界支持情况   3D加速芯片仅有较好的性能和速度还不够,各方面的支持也是必不可少的。PowerVR SG所使用的API(应用程序接口)有两类,在专用方面有NEC/Videologic为PowerVR系列自行开发的Power SGL,在通用方面将会完全支持DirectX 6和OpenGL。特别是在OpenGL应用中,专门为NT工作站设计的PowerVR SG专业用显示卡也许会从3Dlabs著名的GLINT系列专业3D显示卡中夺得部分市场份额。   在游戏方面,现在大多数游戏厂商已经得到了标准的PowerVR SG显示卡,并且均很欣赏PowerVR SG对游戏质量的提高。至今我们已经知道Epic MegaGames公司将会为其看家作品——Unreal(虚幻),专门发行一款PowerVR SG加强版本。据测试新版Unreal的人士表示,RivaTNT和PowerVR SG是目前在Unreal上表现得最好的芯片,RivaTNT虽然能够略微胜出,但PowerVR SG凭借大约便宜一半的售价,将会占据很大优势。面对PowerVR SG等新一代3D加速芯片咄咄逼人的攻势,3Dfx公司再也坐不住了,该公司创始人之一斯科特表示他们已经大大增加了新芯片的开发人员,3Dfx新的市场战略将是每半年推出新产品。   当然,讲到PowerVR SG时,世嘉的DreamCast是不能不提的,DreamCast是当今性能最强、与PC兼容性最好的家用游戏机,能提供不亚于街机的处理能力。Videologic已经宣布,有许多新型街机系统都将会采用与DreamCast相同的PowerVR SG显示加速芯片。DreamCast的硬件清单中还包括:YAMAHA的声音合成芯片,33.6Kbps的MODEM,16MB主内存、8MB显示内存和2MB声音内存。Dream Cast使用的操作系统是微软的Windows CE,内置DirectX(包括Direct3D)API——除了CPU用的是日立公司的RISC芯片SH-4外,这简直就是一台PC的配置。世嘉将在今年11月20日为DreamCast举行盛大的首发仪式,大举进攻现在主要被SONY的PS所占领的家用游戏机市场。 #1产品上市时间   基于PowerVR SG的系列显示卡原定在8月底面世,但由于在家用游戏机方面的工作较为紧张,Videologic道歉之余,宣布最迟在今年夏季末(9月底前后)将会有PC版的PowerVR SG显示卡出售,8MB显示内存的版本仅售$99!要知道,8MB显存的PowerVR SG显卡可以实现1600×1200分辨率下的24位真彩色2D/3D加速。   在正式上市时,NEC/Videologic和其它显示卡生产厂商将会陆续推出5种不同的版本,以适应不同的市场定位。这5种卡分别是:面向中档市场的2D/3D加速卡(就是前面所说的8MB版本),面向高级应用(例如NT图形工作站)市场的高档2D/3D显示卡和高档纯3D附加卡,专为家用游戏机(包括DreamCast等)生产的视频加速卡,最后是专为多种新街机提供的高性能视频加速卡,这种市场战略将使PowerVR SG成为用途最广泛的显示芯片。