汉字系统何处去 交通部二航局二公司微机室 周启勇 1995-12-22 任何一个汉字系统都要解决汉字信息的输入与输出这两个基本的问题。这也是我们民族要比其它使用拼音文字的民族要多背的一个沉重的包袱。 “万码奔腾”的汉字键盘编码输入方案与繁花似锦的各种汉字系统,为我们提供了琳琅满目的输入、输出方法。它们大大地促进了计算机科学在华夏大地的普及和汉字信息处理技术的发展,确实功不可没。 但是,在计算机技术急需更广泛地深入普及的今天,它们的积极作用看来已经到了尽头,甚至从很大意义上讲,它们已成为计算机技术新的普及浪潮计算机技术交流、移植的严重障碍。原因是它们缺乏一个赖以依循的,权威、统一的规范和标准,因而使得它们在以上两个基本问题上自成体系,各自为政,互不兼容。每一个汉字系统都是一个针插不入,水泼不进的独立王国,都有自己的一套不胜繁琐的“王法”。这实在难为了从事应用软件开发、维护和使用的良民们。它们必须熟读各国王法,锻炼成与这众多“王国”打交道的杰出外交家。否则,他们就难以在应用软件的天地中自由驰聘。而要如此,又得花费他们多少本可用于应用软件的构思和优化的精力与时间啊!我们渴求这一规范和标准的尽早出台,让那个沉重的包袱轻点,再轻点。 本文愿就一些具体问题聊表数言,不知同仁诸君以为然否? 一、汉字输入方法的规范化 各种编码输入方案的现状和前景已有不少颇具见地的文章见诸报刊,在此不拟赘述。这里只对具体操作细节提出以下几点建议: 1、为节省内存空间,应让各种输入方法(包括区位码)独立于汉字系统,各川输入方法都以悬挂方式与系统接口,系统设多个外部输入接口,用户可自由选择数种自己所钟爱的输入方法进行安装和使用。 2、统一输入方法的选择操作 比如,按输入法安装的先后顺序,依次使用Alt+F1、Alt+F2、……等进行相应输入方法的选择和切换。 3、在拼音码输入法中,双拼法是较成熟的。但各种汉字系统的双拼输入方法对复合声韵母及零声母代码键的安排各行其是,五花八门。让使用这种输入法的人难以适应多个汉字系统。因而当选择其最优者规范统一声韵母的代码键,其它各种以双拼为基础的词句输入方法,应随之遵循这一规范。 4、统一“三字词”的编码规则 各种输入方法对于双字词、四字词及多字词的编码规则基本上是一致的。但对三字词首尾两字的编码有两种相反的规则: 其一为首字取两码,尾字取一码; 其二为首字取一码,尾字取两码; 应取其一种,舍其另一种。 5、统一对重码字、词在提示行的翻页(前翻、后翻,选字后再翻等)、选择与重选的操作方法。拿翻页来说吧,现状是:有采用“〉”、“,”的,有采用“]”、“[”的,有采用“+”、“-”的,有采用“→”、“←”的,还有使用空格键来翻页的,有的只能往后翻,不能往回翻;有的选字后就不能重选。有的汉字系统有几种输入方法,就有几种翻页方式。如此等等,不一而足。翻页方式的统一,给操作者带来的方便和好处不是显而易见的吗? 二、汉字输出控制的规范化 这是比第一个问题弄得更混乱不堪的问题。 这里的输出主要是指屏幕与打印输出。在这个问题上,各种汉字系统为输出各种不同效果的汉字信息所采用的控制方式更是花样百出。它带来的直接后果是使众多的应用软件难以“搬家”。因为几乎所有的信息管理应用软件都必须依赖于一种汉字系统,而每一种汉字系统都有自己特定的“出口法”,在一个汉字系统下生成的应用软件,搬到另一个汉字系统下,轻则只影响打印输出的效果,重则根本打印不出任何东西,甚至干脆死机,拒绝运行。 一个基层单位的应用软件来源,有不少是上级部门编制下发的,或者是外购的商品软件(如财会通用软件),这睦软件几乎无一例外地要求运行在一个特定的汉字系统下。为了满足这些“特权”,一台机器上往往要装上好几个汉字系统。这不仅造成软硬悠扬资源的严重浪费,同时也给用户的操作笔软件的维护带来沉重的负担。最终阻碍了这些应用软件以至整个计算机技术的效流与普及。 显然,汉字输入控制的规范化就成了一个急待解决的现实问题。 三、一个难题 简单地说,就是如何解决GB2312-80汉字字符集所不包含的汉字字符的问题。举个例子说明这个问题的不可回避性。 某电视台的综合信息频道,在播送新华社的一则快讯时,屏幕上出现了如下的字样: 国务院副问题朱(金旁加容)基……” 这是多么的令人尴尬。 不错,不少汉字系统都提供了造字功能,但造成的字只局限在母机上使用,对多也只能在使用同一汉字系统的机器上使用(把造字后相应的字库拷贝过去)。否则,所造的新字,换个地方就理所当然地无踪无影,不翼而飞;下级单位数据库中有的人员报盘到上级机关就可能失踪不见了。 BG2312-80治安字符集应该说只满足了现代汉字的一般需求。一旦涉及姓氏、地名、历史、古典文字、考古乃至全球华人世界的文字信息交流等领域时,这个字符集就远不敷用了。因为它只不过是严格意义上的汉字字符集的一个涉小的子集。而严格意义上的汉字字符集实际上是一个没有确定边界、变化无穷、浩瀚无际的象形文字字符集合。计算机汉字信息处理系统将如何较完美地处理这一集合呢?利用BG2312-80有限的冗余空间添加一些汉字字符当然无济于事,无限制地扩大汉字字符集也是不可能的。如之奈何?看来,尚需有志之士苦心攻关,以图良策。 四、面对WINODWS WINDOWS以其友好的用户界面,赏心悦目、直观易学的操作方式赢得了全球众多用户的青睐。WINDOWS 95的面市更是在世界范围内掀起了一阵WINDOWS狂潮。各类应用软件也都纷纷向WINDOWS靠拢。 预计中文版的WINDOWS 95将于今年12月出台,国内软件界亦正紧锣密鼓制造、移植自己的软件,争扮WINDOWS的弄潮儿。WINDOWS大有统一天下的架势,或许终有一天我们所有的汉字系统衡也都将在它面前起白旗。但是,难道结果就只能是这样吗?……我们就不能拿出一个与之抗的,更为中国用户所鼓闻乐的东西吗? (交通部二航局二公司微机室 周启勇)