CPU:给显卡一颗驿动的“芯” 刘镝 2001年 21期 是的,是GPU而不是CPU,你没看错我也没写错,那么GPU究竟是什么呢?   世界著名图形芯片制造厂商NVIDIA公司发布了代号为NV10的GeForce 256图形处理芯片,并首次提出了GPU(Graphic Processor Unit)的概念。GPU的中文含义为“图形处理器”。应该说GPU概念的提出在3D图形芯片技术的发展史上具有划时代的意义,GPU再加上CPU,使计算机同时拥有了两颗奔腾的“芯”。 GPU使显卡减少了对CPU的依赖,它将一部分原来由CPU完成的工作“抢”了过来,在3D图形的处理上尤其如此,于是GPU当之无愧地成了计算机运算体系中又一重要的核心部件,从而使 CPU能够从繁杂的3D图形处理中解放出来。   GPU所采用的核心技术有硬件T&L、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图、双重纹理四像素256位渲染引擎等,而硬件T&L技术可以说是GPU的标志。硬件T&L(Hardware transform and lighting)即硬件转换与投影。我们在游戏中所看到的移动影像其实是由一连串快速显示的静态画面所组成,电脑绘制出一张静态画面要经过一系列步骤,这些步骤包括转换(transform)、投影(lighting)、三角形设定(triangle setup)及成像(rendering)等等,显然T&L是最前面两个步骤。传统上,转换及投影这两个步骤是由系统处理器即CPU进行运算处理的,而GPU拥有自己的硬件T&L引擎,从而可以分担CPU的工作,让它可以腾出更大的“空间”去进行人工智能、物理性和游戏控制方面的运算(^21030901a^)。   就目前来讲,具有硬件T&L技术的显卡芯片主要有NVIDIA的GeForce256、GeForce2 系列、GeForce3、Quadro系列和ATI的Radeon。   #1NVIDIA:打造GPU概念   NVIDIA公司自从推出TNT芯片后,一直保持着半年一代的发展步伐,如此速度使其它公司望尘莫及,自推出GeForce256及GPU概念以来,NVIDIA已拥有GeForce256、GeForce2 系列、GeForce3、Quadro系列的全线GPU产品,在图形芯片领域独领风骚。   #2GeForce256   GeForce256采用0.22微米的制造工艺,集成了2300万个晶体管,比PⅢ处理器晶体管还要多,具有256位总线的显存通道宽度,在芯片中增加了以往各类图形芯片都不具备的T&L引擎,因此它基本上可以脱离CPU的帮助独立处理所有2D/3D图形显示数据,是全球首块GPU。但由于没能很好地解决散热及功耗问题(GeForce256的耗电量高达17W),因此NVIDIA只能将其工作频率设为125MHz,所以GeForce256只能算一款显卡芯片换代时期的过渡产品。   #2GeForce2 系列   ⒈GeForce2 GTS与GeForce256一样也采用256位架构,但其采用了0.18微米的制造工艺,同时发热量也显著降低(GeForce2 GTS的耗电量约为8~9W),内核的运行速度更是飙升到200MHz,集成的晶体管数目也由GeForce256的2300万增加到了2500万,还改进了T&L引擎,三角形生成速度从GeForce256的1500万个/s提高到了2500万个/s,能在3D加速芯片上进行所有的几何转换、光照、裁剪等处理。由于拥有4条在一个时钟周期内可以各自完成2个纹理处理的渲染引擎,所以在每个时钟周期内GeForce2 GTS可以完成8个纹理的处理,渲染速度达到1600M/s。全屏幕反锯齿(FSAA)和像素阴影等功能的使用,可以大幅提升游戏画面的质量。在与搭配的显存方面,GeForce2 GTS使用DDR显存,显存工作频率为166MHz,显存带宽高达5.2GB/s,在75MHz的显示器工作频率下,其2D/3D画面的最大分辨率为2048×1536,支持Directx8。   ⒉GeForce2 MX是GeForce2 GTS的简化版本,因此其价格接近于GeForce256芯片。GeForce2 MX采用128位架构,核心运行频率为175MHz,渲染流水线有两条,其像素填充率、显存频率和渲染流水线的数值都只达到GeForce2 GTS的1/2。但是由于GeForce2 MX在流水线渲染方面像GeForce2 GTS一样可以在一个时钟周期内处理两个纹理单元,其核心运行频率也高于GeForce256,而且其硬件T&L能力也进一步升级到第二代,所以其综合的图形处理能力比GeForce256有显著增强。此外,GeForce2 MX还拥有DVC和双显示功能。所谓的DVC(Digital Vibrance Control),即图形数字动态控制功能,可令 2D、3D以及视频图像更加清晰、亮丽;双显示功能则类似于Matrox G400的双头显示功能,即通过单个显示芯片可以提供两个显示屏幕的图像输出。   ⒊GeForce2 Pro的大部分功能都与GeForce2 GTS相同,采用256位架构,三角形生成速度2500万个/s,与GeForce2 GTS相比,显存带宽增加20%,主要用于OEM市场。   ⒋GeForce2 Ultra是本系列的终极产品。采用第二代256位架构,三角形生成速度达到3100万/s,显存带宽高达7.4GB/s。   ⒌GeForce2 Go它是世界上第一块笔记本电脑使用的GPU。在2D方面,GeForce2 Go可以提供16位和32位的图形模式,你可以轻松浏览网页、观看DVD画质的视频节目;在3D方面,它的三角形生成速度可以达到1800万个/s,支持硬件T&L。   #2Geforcer3   Geforcer3采用0.15微米的制造工艺,核心频率200MHz。拥有4条在一个时钟周期内可以各自完成4个纹理处理的渲染引擎,所以在每个时钟周期内Geforcer3可以完成16个纹理的处理,内核集成的晶体管数目也创下了前所未有的记录,多达5700万。拥有60亿次/s的浮点运算速度,8000亿次/s的运算处理速度,像素填充率为3.2Gpixels/s。内建全新的nfiniteFX引擎、光速记忆体架构以及高分辨率图形保真技术。GeForce3还是第一款具有完全可编程和高分辨率反锯齿(HRAA) 能力的GPU。   #2Quadro系列   Quadro主要面向专业图形工作站,支持AutoCAD、3D Studio Max、Maya、 Softimage/3D、Adobe Photoshop等专业图形软件的使用。   ⒈Quadro每秒可进行200亿次的运算,三角形生成速度达1700万/s,像素填充率最高可达5.4G/s,并针对PⅢ Xeon和AMD Athlon处理器进行了优化。   ⒉Quadro DCC是专为DCC(Digital Content Creation)应用而设计的专业工作站图形解决方案,支持DirectX和OpenGL应用,其核心架构与GeForce3和微软的XBOX图形芯片一致。   ⒊Quadro2 MXR/EX是专业图形工作站的低端版本,三角形生成速度达21M/s,带宽为2.7GB/s,50Mpixels/s的渲染能力。   ⒋Quadro2 PRO是世界上最快的专业图形工作站显示芯片,三角形生成速度达31M/s,6.4GB/s的带宽,1.0Gpixels/s 渲染能力,以上指标都为高分辨率、高画质的图像提供了有力支持。   #1ATI:跟进GPU概念   ATI并不是GPU概念的始作俑者,但却是最积极的跟进者,鉴于GPU概念的先进和NVIDIA的成功经验,ATI选择了跟进,目前ATI拥有Radeon系列的GPU芯片。   #2Radeon   作为ATI的新一代显卡芯片,Radeon的性能堪与GeForce2 GTS比肩。它采用0.18微米制造工艺,内置2500万个晶体管,采用256位芯片架构,核心频率200MHz,显存频率为400MHz,支持ATI独有的MAXX技术,显存总线带宽高达6.4GB/s,使用ATI独有的Hyper-Z技术后可增至8GB/s,内建TMDS输出,支持DFP分辨率高达2048×1536,每秒可生成3000万个三角形,像素填充率高达1200M/s。值得一提的是,NVIDIA硬件T&L功能的英文缩写为“Hardware transform and lighting”,而ATI显然对硬件T&L功能进行了扩充,在其官方网站上描述Radeon具有硬件T&L功能的语句是“Hardware for transformation,clipping,and lighting”。