英特尔的秘密武器——Katmai

徐舒
1998年 第40期 33版

　　前一段时间，AMD推出的K6－2出尽了风头，作为业界龙头老大的英特尔对此当然无法容忍。她一面推出了针对低端市场的赛扬，一面加紧了CPU的升级，并于日前向业界透露了即将推出的奔腾Ⅱ－Katmai CPU的信息，包括Katmai的70条新增指令的细节和Katmai／Tanner的结构。在新增指令中，大多数指令是针对提高电脑游戏的性能而设计的。这些新指令提供了SIMD－FP技术，即采用单指令多数据方式来处理单精度浮点值。由于CPU芯片的浮点运算性能对游戏的表现具有决定性的作用，所以SIMD－FP对于游戏性能的提升是不言而喻的。虽然AMD的3DNow！也采用了类似技术，但英特尔采用了一种更为成熟的方式来实现SIMD－FP，下面一一列举：
　　1.采用8个新的128位单精度寄存器（4×32位），能同时处理4个单精度浮点变量，可达到每秒20亿次浮点运算的速度。现在尚不能确定Katmai是采用1条还是2条SIMD－FP管线结构，如果采用2条SIMD－FP的话，Katmai将能在每秒内完成40亿次浮点运算，而AMD的K6－2仅装备了8个64位单精度寄存器（2×32位）。
　　2.为了充分发挥这些寄存器的优势，英特尔又引进了新的“处理器分离模式”，这是英特尔继十多年前引入386模式以来又一次推出新的处理器模式，新的处理器模式需要操作系统的支持，为此，英特尔将推出Windows98的补丁程序，而WindowsNT 5.0将直接支持该模式。
　　3.新的处理器模式允许并行使用SIMD－FP和MMX或SIMD－FP和IA－FP双精度浮点代码。自从MMX和标准IA－FP使用相同的寄存器以来，还不能同时使用MMX和SIMD－FP，但这对于Katmai来说已不再是问题，而K6－2尚不能同时使用3DNow!和标准双精度浮点单元。
　　Katmai的这些特点将极大提高游戏的3D表现，而且在对声音的处理上（如语音识别、环绕立体声、AC3等），也将因为新指令的引入而有所提高。著名的芯片专家Andreas Stiller认为Katmai所采用的SIMD－FP结构与AMD有很大的不同，新的处理器模式及增加的8个128位寄存器是3DNow!所实现不了的。
　　AMD采用8个64位宽的寄存器，因此，在同一时刻同一管道线只能进行两次单精度浮点操作，而Katmai每条管线能同时进行4次操作。K6－2拥有两条管线，因此Katmai必须装备两条SIMD－FP管线才能具备两倍于K6－2的优势。但Katmai的SIMD－FP是建立在P6那大大快于K6的浮点处理结构的基础之上的，所以Katmai将明显快于K6－2也就不足为奇了。
　　除此之外，英特尔在原有的MMX指令集的基础上加入了一些新的指令，这将使CPU在多媒体的表现上显得更加得心应手。
　　Katmai还采用了新的内存流式传输结构，这一新的特点改进了P6的总线，通过在CPU运行时，经由一个新的预读取结构，把存在于内存中的结果隐藏起来。它能在不占用CPU管线的前提下产生多传输请求，避免了一次性写入数据对CACHE造成的浪费。它不仅能提高操作系统、服务器和工作站应用程序的运行速度，而且还能对MPEG2的编码、解码进行加速。英特尔希望新的内存流式传输结构能够将CPU的性能提升5％～20％。
　　可以预见，Katmai将会对3D游戏的效果带来戏剧般的提升，至少可以带来像K6－2引入了3DNow！那样的变化。Katmai的确值得期待！


 