超级电脑与基因 信海光 熊川 2001年 7期 #1 换上防尘鞋,穿上白大褂。   几乎是屏住呼吸,走进华大的计算机中心──就是这里处理了中国分担的1%人类基因组测序任务所产生的海量信息,但也许并没有多少人知道,就是这里藏着中国为数极少的曙光2000巨型计算机,而2月17日才正式推出的曙光3000也将在这里安家落户。   它们就矗立在我的眼前,每台有近两米高,一米多宽,和对面摆放着的普通台式机一比,显得鹤立鸡群。   #1 人类三大工程的功臣   “中国人距离生命科学的世界前沿有多远?从此向西十米向左看吧!”   在白色的华大基因研究中心三楼,首先映入眼帘的是墙上的这一行字。   2月12日,人类基因组图谱向全世界公布,作为中国基因测序的主基地,位于北京东部空港科技创业园的华大基因研究中心成了焦点。中心有70多人,但这里给人的第一感觉仍是一片寂静。   向西十米,向左看,是一排排的基因测序仪,就是这些机器,承担了中国的人类基因组的测序任务。然而,这并不是我此行的重点,我的重点是再往西十米的生物信息中心。   就是这里,每天把基因测序所产生的海量信息用超级电脑进行处理、分析,把有用的信息反馈给生物学家,以研究哪些基因可造福于人类。   人类基因组计划是美国科学家于1985年率先提出的,旨在阐明人类基因组30亿个碱基对的序列。人类基因组测序就是在天文数字般的DNA片断中寻找属于人的基因,据估算,平均人类每一百万个DNA片断中,只有12个基因。在上百万个鱼龙混杂的DNA中寻找12个基因,这无异于大海捞针。   正因为如此,人类基因组计划才与40年代的曼哈顿原子弹计划、60年代的阿波罗登月计划一起被并称为人类科学史上的三大工程。   如果说曼哈顿原子弹计划带动了计算机的诞生和成长,那么阿波罗登月计划则使计算机获得了长足的发展,它也是人类第一次大规模使用计算机来完成一项巨大的工程。而人类基因组测序计划则是又一次对计算机的考验,它对未来计算机的发展方向有着重要意义。   人类基因组图谱公之于众意味着生命之图被绘就,人们的生活也将发生巨大变化。利用基因治疗更多的疾病不再是一个奢望,很多疾病的病因将被揭开,21世纪的医学基础由此奠定。利用基因,人们提高农作物的品质,更多的转基因植物和动物食品将问世。通过控制人体的生化特性,人类将能够恢复或修复人体细胞和器官的功能,甚至改变人类的进化过程。   在这项伟大的成就中,超级电脑功不可没。华大基因研究中心使用的是国产曙光2000型超级巨型机。(^07010101a^)   #1 曙光超级电脑   站在巨大的曙光2000旁边,华大信息中心副主管孙健冬显得有点矮小。   孙健冬告诉记者,因为要处理基因测序所产生的海量信息,生物信息中心使用的高性能的计算机必须有几个特点:运算速度要快、内存容量要大、存储量更要大。信息中心一天信息产出量就有20G。这个数据令人振奋,在国外基因研究中最领先的塞莱拉公司,其日数据产生量也不过如此。这20G的原始数据如果再被拼接、处理的话,整个量是极其惊人的。现在市场上最好的PC机75G容量硬盘仅仅能装这里一天的信息量。   由于曙光2000计算机已超负荷运转,不能胜任。华大又订购了最新的曙光3000计算机,3月20日将要运到,它的硬盘将是2T(2000G),相当于200台高档PC的容量,而这也顶不了多少,信息中心的要求是20T才是理想配置。   对于内存来说,曙光2000一共有四个节点,每个节点带2G的内存,一共是16G内存(16000兆),而目前市场上很高档的PC的内存也就256兆而已。曙光2000的峰值运算速度是3000亿次/秒。国内还有其它两款超级电脑,分别是神威、银河,主要应用于国防科研领域。   曙光2000的造价是2500万元人民币,即将使用的曙光3000是国家重点科研项目,首批供应全国三台,而华大一下子就订购了其中的两台。由于这两台机器的存在及使用,华大还被有关部门定为“国家高性能计算中心”。孙健冬告诉记者:“曙光2000在其它领域可能会运转得很正常,但在华大已经是不堪重负。不得不一次买了两台曙光3000。”   曙光3000的发布会于2月17日在北京举行,记者找到了国家曙光超级电脑计划总工程师徐志伟先生,他告诉记者,曙光3000峰值速度超过每秒1万亿次,1/16的曙光3000计算能力每天可实现80亿次的页面点击。1/32的计算能力每天可收发7000万封电子邮件。1/64的计算能力每天可处理400多万次事务。1/4的计算能力工作,一个月的气候预报仅用15分钟。   #1 中国人追上来了   实际上,在全球范围内,即使如今最强大的超级电脑也不能满足基因时代的计算需求。为此,美国能源部一举联合了生物信息领域、高性能计算领域和巨型并行系统领域的三个领导者:塞莱拉基因中心、康柏、Sandia国家实验室来应对基因时代对计算机的挑战。三方联合研究的目标是首先实现每秒100万亿次运算,最终将可能实现每秒千万亿次运算。   现在,中国的超级电脑正直追美国最先进的水平。正因为曙光计算机的出现,某些国家才放宽了对华计算机出口的限制。在此前,中国想进口比曙光2000还差的高性能计算机都很难。曙光2000出现以后,像康柏、Sun已经可以向中国出口满载50个CPU的高性能计算机。而在2月17日推出的曙光3000,将至少能装载64个CPU。这将迫使美国进一步修改它对中国禁运超级电脑的条款。在价格上,与进口的同配置高性能计算机相比,国产机便宜很多。(^07010101b^)   超级电脑作为国家综合实力的象征,一直是日本和美国你追我赶的竞技场。但正如国家863计划智能计算机主题专家刘澎2月16日告诉记者的那样,中国的超级机算机现在已在第一阵营,我们在这超级电脑领域与美国只有很小的差距。曙光3000强大的处理能力、可扩展性的体系结构、超大的存储系统、基于网络的访问和提交能力及强劲可靠的操作系统,将让我国的超级电脑在世界基因研究和其他尖端应用赛场成为令人生畏的对手。日美专家惊呼:“中国人追上来了!”