ATI的新曙光——Rage6图形芯片预览 朱云 abs3d.yeah.net 2000年 第12期   ATI是全球最大的图形芯片设计制造厂商之一,最近在德国汉诺威的CeBIT2000大展上公布了S1-370 TL北桥系统芯片,它与扬智公司的Aladdin 7芯片组相同,集成了ArtX公司(刚被ATI并购)的图形核心,使用分块渲染原理、集成T&L引擎,还具有虚拟AGP 8X接口等等,它的出现,使业界很多人都认为ATI似乎要进入芯片组市场。不过3月7日,ATI公司出人意料地公布了下一代尚未正式命名的3D图形芯片的技术细节,大量未知的3D技术更使得我们眼花缭乱,似乎在证明,ATI在3D图形芯片市场上仍是强者。   其实,这个新产品就是闻名已久的Rage 6,在Rage 128系列芯片之后,ATI一方面通过Aurora计划发展多芯片系统(如ATI Rage Fury MAXX)来赢得时间,又通过收购获得ArtX的新技术,在Rage 128完成后的一年多时间里,ATI始终全力实施的项目就是Rage 6,ATI对它寄予厚望,要它夺取3D市场的主导地位。   ATI认为现有的3D硬件主要在以下三方面不尽如人意:角色模型不够细致,需要更精细的几何结构和贴皮技术;图形细节不足,需要更精细、平滑的纹理;环境不真实,需要交互式的环境光影效果。因此ATI新一代3D处理器主要包括两个部分及其相应的先进技术:Charisma引擎和Pixel Tapestry结构。 #1 Charisma引擎   Charisma引擎号称是世界最快的T&L引擎,10倍于现有产品的速度,还集成了先进的动画角色加速功能,ATI希望它能带来实时的、真实的动画效果。Charisma引擎具有TCL功能、骨骼与贴皮系统、4矩阵处理、关键帧插值等新技术。   TCL功能 指几何变换(Transform)、图形剪裁(Clipping)和光源照射(Lighting),就是T&L引擎的基本功能。Charisma引擎使用尽量多的多边形,很容易使角色和环境变得更加平滑、真实。   骨骼与贴皮系统 这是3D图形的必然发展方向,骨骼可以使角色的动作更拟真;贴皮则可以填补骨骼间的空隙,使图形更细腻、真实。   4矩阵处理 因为T&L操作基本都是浮点矩阵操作,3D芯片进行矩阵处理的速度就显得非常重要,GeForce 256每个时钟周期能处理2个矩阵,而Charisma引擎每个时钟周期能处理4个,它的处理速度加快,而且在某些情况下减少了误差。   关键帧插值 类似于3DS中在两帧关键帧之间自动生成中间帧的方式,硬件自动在变化较大的图形之间插入中间状态,从而使动画更平滑、自然。过去很难用软件实现类似功能,如今硬件支持关键帧插值既可以节省3D游戏的开发时间,又可以降低内存需求。 #1 Pixel Tapestry结构   Pixel Tapestry结构据称是世界首枚能达到10亿图素填充率以上的单片渲染引擎,ATI希望凭借它使3D画面达到像片级的光影效果。Pixel Tapestry结构具有三重纹理渲染、3D纹理、凹凸贴图、纹理变换、优先级缓存、基于范围的雾化等新技术。   三重纹理渲染 它是Pixel Tapestry结构首先引入的先进结构,每条渲染流水线能够在一个时钟周期内为一个像素贴上三重纹理,不但能够明显提高图形质量,还将图素填充率提高了约50%,减少了带宽占用,这在当前是极其困难的。   3D纹理 3D纹理是创造性发展的纹理概念,现在纹理不但是平面的图形,而且有了深度,并且在不同的深度层上的图形可以完全不同——就是说每个纹理点都有了三维坐标。从OpenGL 1.2开始支持3D纹理,希望Direct3D尽快支持这一创新的3D特性,尽管它还是比较复杂、必须由硬件实现。   凹凸贴图 这个特性由Matrox G400首先引入的,基本可以分为3种:浮雕凹凸贴图是效率最高的方式,不需要更多的纹理、节省带宽和处理能力;Dot Product 3凹凸贴图可以精确控制每一个点,根据光源确定光反射情况,同浮雕凹凸贴图类似,比较适合表面处理;环境凹凸贴图是最精细的模式,能够实时改变凹凸的高低数据,比较适合于光亮的不平表面,特别是波光粼粼的水面。   纹理变换 指将纹理贴在相应表面时的一系列处理方法,可以得到特殊的视觉效果。通常纹理变换使用CPU软件实现、效率较低,ATI在Pixel Tapestry结构中集成了纹理变换的硬件加速功能。纹理变换的主要应用是环境贴图,分为3种实现方式(OpenGL支持全部这三种方式,但Direct3D只支持立方贴图):球状环境贴图是最简单的方法,仅使用一个纹理,并假定观察点是不变的,较多被用于光亮的固定物体,它只要较少的资源实现反射面效果;双抛物面贴图使用两个纹理实现反射效果,使用独立可变的观察点,比球状环境贴图复杂,但比立方贴图简单;立方贴图是3种方式中最灵活、最复杂的,使用6个纹理和独立可变的观察点(位于纹理中央),因此能够灵活的切换反射效果,尽管十分耗费显示内存,但显示芯片硬件支持可以明显降低CPU的负担。纹理变换的另一应用是投影纹理,能够生成真实的观察者位于光线和阴影之中的效果,硬件支持下的投影纹理可以较容易地实现阴影贴图。   优先级缓存 首次被硬件实现,它可以保存多边形或物体距离某一参考点的相对距离,在Pixel Tapestry结构中用来实现阴影贴图是一个较好的优先级缓存的应用:阴影在3D场景中很适合表现光线和深度效果,通常用一定的阴影空间(容积)同模板缓存相结合来达到动态的阴影效果,但需要更多的几何操作;阴影贴图则先将光源作为观察点计算优先级数据(越近的物体优先级越高)并存入优先级缓存,阴影纹理就可以根据这些数据由物体的剪影得到,最后将阴影叠加在正常观察点的场景之上就行了。阴影贴图能够生成很复杂的阴影及其各种变形。   基于范围的雾化 它是对传统的雾化方式的改进,过去雾化效果只是根据深度简单地计算出来,Pixel Tapestry结构中基于范围的雾化程度是根据物体同观察者之间的距离来设定的,相当于将一维极坐标改成二维极坐标。 #1 Rage6图形芯片的其它特征   ATI新3D图形芯片还有很多细节,如显示芯片和内存的配置等。它必须使用0.18微米的生产工艺,很可能同TNT2系列类似,通过不同的核心频率和显存频率来划分多个档次。ATI 很有可能在推出单芯片的显示卡后不久,再生产像Rage Fury MAXX那样利用AFR(Alternate Frame Rendering)技术的双芯片、甚至四芯片型号以提高性能,毕竟双处理器、双T&L引擎和双倍显存带宽的潜力不容忽视。因为前一代的产品已经开始使用64MB显存,定位于高端的新显示卡估计应该从64MB开始,很有可能逐步推出128MB的产品。另外,ATI一直很重视也很擅长的OEM原装机市场,一定会有相应的OEM显示卡推出,这就很可能使用32MB显存了。显存的类型,除了通常的SDRAM/SGRAM之外,高速的DDR SDRAM对处理大量的纹理、阴影数据也很有帮助,估计是一定会支持的,至于其他新型高速显存,就难以预测了。下面是Rage6芯片刚刚发布的一些技术特征:   ·256位图形核心   ·0.18微米制造工艺,未来将进一步改进为0.15微米   ·集成2千5百万个晶体管,芯片面积为100平方毫米   ·200MHz ~400MHz的核心工作频率   ·内建350MHz~400MHz RAMDAC   ·支持最大显示分辨率为2048×1536@75Hz   ·芯片核心提供一个纹理、像素和Z坐标缓存   ·支持SDR/SGRAM和DDR SGRAM及其他改进的内存类型,最多支持8MB~128MB逻辑图形内存   ·使用200MHz DDR SGRAM时,可提供6.4GB/s内存总线带宽   ·MAXX技术支持,可以使用两片或更多的Rage6芯片制作一块显示卡   ·提供AGP 4×/2× 和PCI 2.2规范的支持   关于Rage6的速度,我们可以这样看:要达到10亿/秒以上的图素填充率,对于Pixel Tapestry结构的三纹理引擎并不难,因为只需要3.33亿/s以上的像素填充率,如果是类似于Savage2000的两条像素流水线,工作在166MHz的核心频率就行。如果是NV15类型的四条像素流水线,只要区区83 MHz核心频率就足够了,因此这款产品面对NV15的12.8亿/s图素填充率和新版Savage 2000的近10亿/s图素填充率毫不脸红(多芯片的Voodoo 5不比也罢);T&L性能表现只知道比现有的产品高10倍,就算只用Riva TNT/TNT2的600万/800万多边形/s作基准、而且是两块芯片并联达到的水平,那么ATI Rage6的多边形能力也必须高达3000万/s~4000万/s,要高出NV15几乎一倍,暂时难以想象ATI要集成什么样的DSP核心才能完成这个艰巨的T&L任务。   ATI Rage6的正式名称还未公布,以往ATI的产品总是在时间上落后,比如ATI Rage 128的原定对手是Riva TNT,最后上市时却遇到了更新一代的TNT2,自然占不到什么便宜;现在对于新产品,ATI不管在新产品的3D速度、3D特性,还是发售时间上都掌握了主动,只要一切如期实现,必将引起主流3D硬件市场的极大震动。ATI终于不但打算赶上对手,而且更进一步计划主动引领3D技术和市场的发展——一切看起来如此美好,只希望新一代ATI显卡更加价廉物美。