Hammer处理器呼之欲出 张义春 2001年 44期 2001年,AMD似乎流年不利,先是在与Pentium 4的速度争霸战中节节败退,接着在OEM市场又有IBM、Gateway两座城池相继失陷。9月下旬宣布关闭奥斯汀的Fabs14/15晶圆厂的消息还余音未尽,10月初又再次传出AMD第三季亏损上亿美元的消息。凭借Athlon处理器在台式机市场摧城拔寨而无往有胜的风光已经成为明日黄花,从AMD的记忆中渐渐远去。   10月15日,世界微处理器论坛(MPF)开幕。AMD向业界宣布了64位架构x86-64的首批处理器内核“Hammer”概要。Hammer是AMD公司定位于x86架构的第8代处理器内核。在第7代处理器与英特尔对战受挫的背景下,Hammer扮演着明天在处理器市场开疆拓土、单骑救主的重要角色。AMD在论坛上所作的产品报告,使Hammer的研发情况与技术细节再次成为IT业界与广大用户共同关心的热点话题。   #1处理器技术亮点扫描   今年6月,AMD首次面向工作站、服务器市场推出了Athlon MP处理器与AMD 760MP配套芯片组,标志着AMD以此开始进军商用系统市场,把处理器的竞争引向了以服务器处理器为代表的高端领域。但英特尔64位Itanium与至强处理器的强势出击,使AMD的努力被消弥于无形,毕竟在性能相近甚至更高的前提下,“Intel Inside”更具有吸引力。面对Hammer的千呼万唤也难觅芳踪,我们不禁担心它真的能够成为AMD冲出阴霾的“暗黑破坏神”吗?与其它处理器相比,Hammer增添了哪些新的技术亮点呢,下面我们就来仔细看看。   #21.高度兼容32位程序的x86-64架构   对于Hammer系列处理器来说,最重要的特性就是被称为x86-64的64位寄存器。将目前x86寄存器扩展成64位,称为x86-64架构,与以往32位x86架构100%兼容。   Hammer处理器将有两种不同的工作模式,分别为Long模式和Legacy模式。当使用Long模式时,Hammer就相当于一块x86-64处理器;而使用Legacy模式时,它就和常见的x86处理器没有什么两样,可以完全兼容当前的16位或32位应用程序。Hammer的x86-64架构可以让现有的32位软件不须重新翻译,就能够毫不费力地转移到K8平台上执行,而且执行现有的32位软件时,也能呈现硬件一级的直接执行的性能,而非Merced、Alpha、Sun SPARC、Itanium等计算机系统,都是借助软件、硬件仿真转译,或者扩充x86 PCI适配卡的方式,无法享有最高等级的执行性能。   #22.具有32级超级流水线   从技术上来看,处理器厂商大都通过增加名为“超级流水线”的运算处理流水线级数来实现工作频率的提高,当然AMD也不例外。增加流水线级数以后,各级的处理负担就会减轻,工作频率也容易提高。Pentium 4之所以能在工作频率方面领先Athlon,就在于流水线级数达到了20级之多,而目前AMD的Athlon处理器仅为10级。   为了在工作频率上决一胜负,AMD公司开发出的处理器内核必须在流水线级数上不低于Pentium 4,或者开发出拥有超过这一数量的流水线级数的处理器内核。Hammer流水线级数多达32级,所以也意味着能够使处理器主频得到更大幅度的提高。   #23.集成DDR内存控制器   今年4月,HyperTransport(简称HT,也称作LDT)技术由AMD首次公布,得到了包括NVIDIA、ALi在内的多家著名厂商的支持。HyperTransport是一种串接周边、芯片组与处理器的超高速总线技术,可以由每个不同位宽度(8bit、16bit、32bit)连接部件,双向控制联系,每秒传输数据上限可达12.8GB,比以往芯片组266MB/s传输频宽加快了40倍以上,并且适用于多重处理器架构。   AMD Hammer系列处理器将通过使用HyperTransport技术来整合DDR内存控制器。整合内存控制器的好处在于处理器可以直接和内存交换数据,而不需要通过系统总线传给芯片组,然后再传输给内存,这样就缩短了数据交换时间,有效提升了多处理器系统中主内存的使用效率。为了使它组成的多处理器系统更具威力,AMD还将使用一种称为NUMA(非统一内存访问)的技术,这种技术的功能在于使处理器不但可以直接向本身的内存池读取数据,而且还可以向其他处理器的内存池读取数据,尽管速度会慢一点。   #24.全面采用SOI技术   在制造工艺方面,AMD宣布将从Hammer系列的首批产品开始导入SOI技术,并提高CPU工作频率。SOI全名是Silicon-on-Insulator(绝缘硅),在使用SOI技术加工半导体晶体管时,通过在晶体管和硅底板间形成绝缘体达到减小晶体管寄生容量、抑制漏电电流的目的,晶体管的响应速度也可以提高。最早将此项技术投入实际运用的是IBM,该公司通过在PowerPC G3(PowerPC 750)等产品中使用该技术,获得了将工作频率提高20%~30%的效果。   AMD公司通过与IBM公司达成协议,已经计划将在其下一代64Bit Hammer处理器中全面采用SOI技术。采用SOI技术以后,晶体管就能够以更快的速度运行,同时其耗费的能量也更少。据称,采用IBM公司的SOI技术将使“大锤”芯片提速30%以上,这样使得它比英特尔公司的64位处理器Itanium还要快,而且据称使用该技术还可以使“Hammer”芯片的温度比Itanium还要低。   #1支持芯片组   在架构上,支持Hammer的芯片组和支持Athlon、Palomino的芯片组有很大的不同。关于支持这款处理器的芯片组,AMD自己开发的有两款:Golem和Lokar。Golem是服务器芯片组,支持PCI-X总线技术,而Lokar则是工作站芯片组,支持AGP 8×。另外VIA也将会推出一款支持ClawHammer的芯片组──K8T266。   K8T266芯片组由K8T333北桥以及K8T237南桥组成,采用V-Link结构连接南桥芯片。K8T266芯片组将支持K8的HT(HyperTransport)总线,使用AGP 4×或8×显示接口,不过我们有足够的理由相信AGP 8×具有更大的可能性。令人感到惊讶的是,从芯片组研发计划看,K8T266目前只支持两条DIMM内存插槽,而不是通常的三条或四条,也许在设计中还存在一些未解决的问题。主板将使用VIA的266/533 MB/s 带宽的V-Link 技术连接南北桥,不过目前还不清楚南桥芯片的具体情况。因为VIA和AMD都在开发自己的北桥技术,这也许意味着AMD Hammer处理器内部的北桥部分可以被屏蔽掉。   #1处理器性能前瞻   64位Hammer和32位处理器相比,优势主要在于执行效能上,64位处理器可以提供TB(1012字节)级的内存寻址空间,而32位处理器只能提供GB(109字节)级的寻址空间。这使它在执行某些大型程序比如数据库处理的时候很有好处,因为这些程序对内存要求比较高。   据AMD公布的资料,目前的处理器都是通过比处理器慢很多的外部总线(例如现时频率最高的P4 2GHz总线频率仅为400MHz)与内存交换数据,这样一来就会存在明显的数据传输瓶颈,从而导致整体效能下降;而Hammer最大的改进就是将内存控制器直接整合在处理器之中,使其成为处理器的一部分,以消除这个数据传输瓶颈,在多芯片还同时搭配AMD的HyperTransport技术,AMD表示这种高速的内部连接技术将可以避开芯片组拥挤的传输通道,进而从最大程度上提升处理器的效能表现。   AMD日前在MPF 2001上表示,由于外部连接技术的改进,Hammer处理器将能在普通基准测试中胜过其它的同类服务器芯片,而其工作站/服务器版则能在SPECint2000测试中超越现时所有的处理器(包括IBM Power 4,Sun UltraSparc Ⅲ,Intel Itanium),最高将达到两倍以上的效能表现。   #1Hammer向我们走来   AMD方面日前透露将在明年第二季或第三季正式发布其首款64位Hammer系列处理器,目前AMD Fab30芯片厂已开始实验性制造该处理器样品。据AMD的资料显示,预计在2002年现身的Sledge Hammer处理器,初期将可能采用0.18微米工艺制造,而其芯片面积只比Athlon增加5%,估计约在104mm2,非常容易大量制造,成本也可以压得很低。   对照英特尔的产品蓝图,我们可以作一些简单的比较。按照最初的想法,Intel的64位Merced是直接相抗衡于AMD K8的。它是Intel最初的一款64位产品,但是其不良的生产率和较低的时钟频率使得Intel最终放弃了这款CPU,而投向了另外一块新的核心设计──Itanium。Itanium同样能够执行目前的x86-32代码,但不是源代码。32位的x86指令必须被解码和重组成数据后才能被处理器所理解。Itanium得利用几个时钟周期来进行必要的数据操作,这就降低了它的性能水平了。可以想象,IA-64平台在执行32位代码时将比目前的x86-32处理速度慢。AMD在这方面占有优势,因为其K8能够直接执行32位代码,而不须任何转换。   凭借着把Hammer建立在高性能和高兼容性的基础上,AMD努力使x86-64平台成为下一次计算机技术革命。有了当前和未来软件全面支持作为核心,Hammer可能会成为一个新计算机领域的先驱。这种预测会完全应验吗,Hammer将会成为市场的领导者吗?答案并不遥远,让我们拭目以待。   附:Hammer处理器版本规划   根据AMD产品计划,64位Hammer系列处理器将分为ClawHammer/SledgeHammer两个不同的版本。ClawHammer将主要面向桌面及工作站市场(只支持2路SMP),而高端的支持4路/8路SMP的SledgeHammer将面向服务器市场,同时SledgeHammer还拥有更大的二级缓存,Hammer系列对应平台的具体规格如下:   桌面版ClawHammer:只支持单颗ClawHammer处理器,AGP 8×总线与处理器间采用16位双向LDT控制器连接,而AGP总线与南桥之间采用双向8位LDT控制器连接,桌面版ClawHammer不提供PCI-X总线的支持。   工作站版ClawHammer(2路SMP):采用16位双向LDT控制器连接PCI-X总线与两颗处理器,而PCI-X总线与南桥之间采用双向8位LDT控制器连接,工作站版ClawHammer系统或许不提供AGP 8×的支持。   服务器版SledgeHammer(4路/8路SMP):采用两颗16位双向LDT控制器分别连接AGP 8×及PCI-X总线,而PCI-X总线与南桥之间仍采用双向8位LDT控制器连接。