计算机容错技术 杨晓晖 1992-09-11 其实这个问题回答起来很简单。容错技术就是说计算机在数值计算或非数值符号处理过程中可以容许某些错误的存在,这些错误的存在不会影响计算机的正确运行。特别需要指出的是这里所说的“错误”,是指“故障”(FAULT),而不是指“差错”(ERROR)。根据这种理论研制和发展起来的计算机就是容错计算机,容错计算机技术是从七十年代才开始研究与发展起来的一门新的计算机科学分支技术。容错计算机的硬件和软件的研制在现实生活中着重要意义,特别是在某些特殊的领域,如在人们关注的核武器及导弹发射控制系统内,如果处于主控制地位的计算机不能在系统的硬件和软件发生某种瞬间故障的情况下保持数据处理的正确性,后果是人类难以承受的,然而现代科学技术的发展使得这种可能性变得越来越小。 世界上第一台具有容错功能的计算机STAR,一九七一年在美国加州理工学院研制成功,然后又研制成具备软件容错功能的SIFT等容错计算机。容错计算机技术经过折二十多年的发展,已引起了世界各发达国家的广泛注意。但目前仍处于基础理论研究阶段,如容错硬件系统结构及容错功能可靠性评估,软件容错功能与测试理论及方法,这些研究都有待进一步深入和突破。目前美国的IBM公司、Stratus公司和Tandon公司是世界上著名的三大容错计算机公司。