新千年内存规格之争——DDR与Rambus鹿死谁手 王寒晖 http://dizen.yeah.net 2000年 第19期   威盛电子于4月10日宣布推出了PC2100及PC1600的DDR(Double Data Rate)DRAM规范,它是继PC133架构后的新内存标准。威盛电子表示,DDR266根据SDRAM架构设计,它使内存厂商和OEM系统厂商在原有标准上构建出新一代的产品技术。目前主要合作的厂商包括Micron、三星、Hyundai、Infineon、NEC、日立、三菱、南亚、东芝等,威盛电子参与了所有DDR266规格制定过程,这使威盛的芯片组能符合最新的SDRAM标准。跨入2000年,Rambus仍积极冲刺PC主内存市场,而DDR则蓄势待发,意图继承PC 133的主流地位,未来的PC主内存架构趋势将如何演变呢? #1 DDR与Rambus的内存架构   DDR SDRAM也可以说是传统 SDRAM的升级版本,其最重要的改变是在界面数据传输上,DDR在时钟信号上升沿与下降沿时各传输一次数据,这使得DDR的数据传输速率为传统SDRAM的两倍,由于仅多采用了下降沿信号,因此并不会造成能耗增加。至于定址与控制信号则与传统SDRAM相同,仅在时钟上升沿传输。另一个明显的改变是增加了一个双向的数据控制接脚(Data Strobe,DQS)。当系统中某个控制器发出一个写入命令时,一个DQS信号便会由内存控制器送出至内存。此外,传统SDRAM的DQS接脚则用来在写入数据时(单向:内存控制器DRAM)做数据遮罩(Data Mask)用。由于数据、数据控制信号(DQS)与DM同步传输,不会有某个数据传输较快,而另外的数据传输较慢的skew(时间差)以及Flight Time(控制信号从内存控制器出发,到数据传回内存控制器的时间)不相同的问题。此外,DDR的设计可让内存控制器每一组DQ/DQS/DM与DIMM上的颗粒相接时,维持相同的负载,减少对主板的影响。在内存内部架构上,传统SDRAM属于×8组态(organization),表示内存核心中的I/O寄存器有8位数据I/O,不过对于×8组态的DDR SDRAM而言,内存核心中的I/O寄存器却是16位的,一次可传输16位数据,在时钟信号上升沿时输出8位数据,在下降沿再输出8位数据。此外,为了保持较高的数据传输率,电气信号必须要求能较快改变,因此,DDR改为支持电压为2.5V的SSTL2信号标准。   与DDR相比,Direct Rambus改用封包方式传输/控制位址讯息与数据。在内存控制器(如英特尔的820)上,处理列要求封包有3根接脚,处理行要求封包有5根接脚,数据封包则要求有两组各为9根的接脚组,因其中第9根为支持ECC功能时方才使用,所以实际上每一组乃是负责1 byte的数据。由于每根总线是彼此独立,所以行封包、列封包与数据封包可以同时传送至不同的RDRAM颗粒或是同一颗颗粒的不同缓冲区。在RDRAM部分,颗粒内部的DRAM核心具有32个缓冲区(除第一个与最后一个感应放大器是仅连一个缓冲区,基本上是每两个缓冲区共用一个感应放大器)及工作频率为100MHz的128/144位数据路径(datapath);在界面部分,Rambus的数据宽度为16位,工作频率则有300MHz、356MHz与400MHz三种;在控制封包部分,每一个封包占去4个时钟周期,若以时钟速度400MHz计算,1个时钟周期是2.5ns,4个周期便可达10ns。而在数据封包部分,RDRAM内部数据路径宽度长达128位,数据宽度为16位(2Byte),每一个时钟上下沿各可传送一次,所以收到行存取指令后,是以4个时钟周期的时间(10ns),传送16 Byte的数据封包。而Rambus内存次系统部分不同于SDRAM的并联式架构,RIMM的连接方式则是采用串连式的总线系统,以内存控制器作为起端,中间串连各个RDRAM,结束端则是加上代表信号准位为0的1.8V电压的终止电阻,以避免信号反射。以数据接脚DQA0为例,控制器上的数据接脚DQA0会藉由PCB板上的线路与每一个模组、每颗RDRAM的数据接脚DQA0相连,最后再接上一个终止电阻,而数据传输仅止于内存控制器与每一颗RDRAM间,各个RDRAM间不会有数据的流通。至于信号界面部分则是Rambus专属的RSL,电压为1.8V,参考电压为1.4V,逻辑0为1.8V,逻辑1为1.0V。 #1 DDR的生产体系更具有优势   PC主内存架构由传统SDRAM走向DDR与Rambus等新架构,或多或少会引起整个PC供应链体系的变动与调整,并很可能影响到很多芯片制造、封装、测试、芯片组与时钟产生器等IC、被动元件、连接器、主板、模组与PCB等生产厂商。   就DDR架构来看,它基本上可完全沿用传统SDRAM(SDR SDRAM)的生产体系。以内存颗粒制造为例,DDR与SDR SDRAM可共用同一个DRAM设计,生产SDR SDRAM通常需要20~22道工序,而生产DDR的工序绝大部分与生产SDR SDRAM相同,仅需在最上一层金属层或在衬垫(Pad)处变动一下便可生产出DDR产品。在封装上,DDR仍是采用传统的TSOP Ⅱ封装,测试时仍可沿用现有的SDRAM测试平台。DDR的模组部分采用184针封装,PCB使用4~6层板,在其他零组件或组装上并无太大差别,与SDR DIMM成本相差不大。使用DDR后,主板设计可使用4层板,与SDR主板较大的差异在于模组插槽将由原来的168针更改为184针,电气接口由LVTTL改变为SSTL2,因此模组插槽与电气设计会有所调整。若主板仅支持DDR DIMM,而不考虑沿用SDR DIMM/SDR SDRAM的兼容性,其成本比PC 133主板可降低10%~15%,差异的部分在于芯片组、PCB、时钟产生器/缓冲器、插槽与被动元件,最大的缺点则是旧的SDR DIMM内存条将无法继续使用。而若考虑与SDR SDRAM的兼容性,则主板需支持2.5V与3.3V两种I/O电压,并且要同时配置184针与168针两种插槽,或是配置支持184针的SDR DIMM内存条,当然,缺点则是主板成本将升高。   RDRAM有着颗粒面积较大的劣势,主要在于其内存核心分区(Partition)方式的改变,以及Rambus专属界面IP会多占空间。传统的SDRAM具有四个Bank,而RDRAM则具有三十二个Bank,Bank与Bank间,自然需要更多的数据路径,因此影响到DRAM核心的面积。而在周边电路方面,设计RDRAM必需置入Rambus提供的界面IP,以支持其专用的高速传输界面,因此,RDRAM的芯片面积会较SDR/DDR SDRAM大上许多。在价格方面,目前128MB RDRAM的颗粒价格近50美元,与PC133 SDRAM的近13美元相比,是它的4倍左右,并且RDRAM需要采用CSP封装。测试时,由于Rambus的高频界面之故,即便采用先测内存核心、再测高频界面的二段式测试方式,仍需添购高频的内存测试机平台,且由于RDRAM需满足高频规格的测试,许多DRAM都过不了800MHz的测试关卡。在模组的制造成本方面,若不计颗粒,目前Unbuffered SDR DIMM的制造成本,包括电阻、电容、SPD与PCB约为2美元出头。与DIMM相比,RIMM大约仅需一半数目的被动元件,但需增加一个散热片。除颗粒外,RIMM的成本差异主要是来自于PCB板,DIMM可用4层板做,而RIMM则需8层板。不过RIMM PCB板的价格正逐步下滑,但与DIMM的PCB相较,价格仍过于昂贵。而在主板方面,Rambus主板在PCB上已可用4层板制作,但由于阻抗需要达到28欧姆,生产成本仍然较高。   综合而言,DDR SDRAM乃至于支持DDR的PC几乎可完全沿用现有的生产体系,即便是量产初期,DDR PC整体制造成本将仅约较PC133 PC多出10%~15%,不过DDR PC初期将主打高端市场,在价格上会有较高的价差。至于Rambus方面,其生产体系需要重新建立。可以确定的是,建立DDR量产生产体系的转换成本将远较RDRAM低,而在近期内,Rambus相关零组件的生产成本仍比DDR高出一截。 #1 Rambus在Granularity与带宽上具有极佳的特性   单就技术来看,不考虑实际制造的难度与成本,Rambus架构在Granularity与带宽上具有极佳的特性。所谓Granularity,乃是指在DRAM架构与组态(organization)确定的条件下,系统中内存所需装载的最小容量。   对SDR/DDR SDRAM而言,目前PC系统中内存数据总线宽度为64位,在DIMM上需要以并联方式运作。以64MB SDRAM来说,目前有16MB×4、8MB×8B与4M×16三种常见的组态,若以8MB×8的颗粒来算,由于此款颗粒数据界面宽度为8位,所需的颗粒数为则8颗,因此DIMM乃是以8颗8MB颗粒的方式封装,模组的容量则是64MB。而单以64MB容量来看,如不分DRAM组态的话,Granularity乃是32MB。在DRAM世代交替持续进行的情况下,内存需装载的最小容量会变得愈来愈大,以×8组态的DRAM颗粒而言,至256MB时代时,Granularity增加为256MB,而至512MB与1GB时代时,更分别增加为512MB与1GB。至于若采用×16组态颗粒的话,Granularity则可以小一些,其256MB、512MB与1GB时代的Granularity分别为128MB、256MB与512MB。而在RDRAM方面,其内存次系统与SDRAM有颇大的差异在:RDRAM内存数据总线宽度仅为16位,正好与每颗RDRAM的数据界面宽度一样,而RDRAM乃是以串连方式组成内存次系统,而不必像SDRAM一样必须并联64位的数据总线。这使RDRAM在实际使用时,在支持一个Rambus通道的情况下,仅需一颗便可让系统运作,而若支持两个Rambus通道,也仅需两颗RDRAM。因此RDRAM的架构,将使其在系统设计上具有更大的弹性,特别是对内存次系统容量需求不高的小系统,更具有吸引力。   除了Granularity的弹性外,Rambus的最大优点,则是在高速运作时所提供的高带宽。以800MHz RDRAM而言,每一根数据接脚的带宽可达800MB/pin/s,而PC133 SDRAM为133MB/pin/s,PC266则为266MB/pin/s。PC100内存数据总线的带宽为800MB/s,PC133带宽增为1.06GB/s,PC266则为2.13GB/s。而对Rambus来说,带宽乃是视执行几个Rambus通道而定,就一个通道而言,带宽为1.6GB/s,若是两个通道,则可提升为3.2GB/s,若是四个通道的话,则带宽将达到6.4GB/s。SONY于3月所推出的PS2支持两个Rambus通道,仅使用两颗128MB的RDRAM,便可提供3.2GB/s带宽,算是将RDRAM带宽与Granularity优点发挥得最淋漓尽致的产品。附表是三种内存的部分性能参数比较表。 #1 DDR与Rambus的局限性   DDR除了带宽比SDR SDRAM提高两倍外,最大的优势在于可完全使用现有的SDR量产生产体系。不过依照AMD、威盛、矽统与扬智等芯片组厂商的规划,芯片组最快要2000年第三季度末方能大量出货,而由于芯片组与主板量产乃至打开市场的时间将耗时3~6个月,且初期DDR将主攻高性能PC市场,因此2000年第四季度DDR的出货量将非常有限,真正的商机需要2001年方可显现。   RDRAM毋庸讳言是项好技术,但问题在于,RDRAM虽具有Granularity的优势,但低端市场用户却无法承受RDRAM的高价。2000年普通用户购机仍选购64MB与128MB SDRAM,SDRAM应付各类PC市场仍绰绰有余,RDRAM并无法凸显其价值。待英特尔推出Willamette后,RDRAM有可能因其带宽优势使需求增长,然而此机会落点在2001年,至于2000年RDRAM的市场需求则有限。RDRAM原打算掌握高性能PC市场,再向主流PC市场渗透,但在高性能PC市场版图却持续缩小,而在RDRAM成本过高的缺点未能有效改善的情况下,RDRAM主流化速度欲快不易。RDRAM难卖局面要有所突破,最主要的关键在DRAM厂商身上,唯有DRAM厂商愿意扩大RDRAM的颗粒产量,开始走入以量制价、创造需求的良性循环,方可有效驱动RDRAM的普及。(^19030503a^)   DDR与Rambus两大阵营,究竟谁可以主导未来的个人电脑市场?目前尚难预料,i820芯片组的MTH芯片出现问题,使得Rambus的推行再次受到打击,而DDR内存条已经颇为电脑DIY玩家所熟悉。支持DDR规格的芯片组及主板目前尚未在一般的市场中出现,而DDR DRAM模组在高端的图形显示卡领域中,已经占有一席之地。不过IT业变化快速,现在还不能说已分出高下,但以消费者的眼光来看,如果Rambus价格继续保持高昂,那么它将很难阻止DDR登上主流的宝座。由于目前Rambus与DDR均各有局限性,因此即使到今年年末,PC133仍将是内存市场的主流规格。