中文软件的移植性问题 王 健 1993-06-04 要解决上述问题,还要从汉字的码制谈起。汉字的代码包括汉字输入码、汉字内部码、地址码、字形码、交换码、控制功能码,从汉字代码的角度来看,中文信息处理系统就是一个进行各种汉字代码转换的系统。 通过键盘输入汉字输入码(常见的输入码有五笔字型码、自然码等),输入到计算机内部的为汉字内码,供加工处理以后得到汉字的地址码(即指汉字字库中存储汉字字形信息的逻辑地址码),再根据汉字地址码取出汉字字形码(指汉字字库中所存储的汉字字形点阵信息),从而显示出汉字信息。汉字内码存放在缓冲区中,由于具体的系统及使用要求不同,汉字内码的设计也没有一个统一标准。目前汉字内码的形式有许多种:二字节内码、三字节内码、四字节内码等。宝岛台湾所采用的汉字内码又有5550码、TCA码等。这样,在一种在中文操作平台(如台湾的倚天操作系统)下开发的中文应用软件完全不加修改地移植到另一种中文操作平台(如CCDOS)下,可能会因所采用的内码形式不同,而对应的汉字信息随之不同,即移植性差,出现本文开头所提到的令人头痛的问题。 根本的解决办法只有成立一个标准委员会,统一各种内码,制定出唯一的标准。