你也可以“发明”汉字输入法 中央电视台新闻制作部 缪暑金 1996-08-30 一、确定自己对汉字编码的总体原则 目前,汉字编码主要分三种类型,即声码、形码和声形混合码。汉语拼音是声码,五笔字型是形码,还有相当多的是声形混合码。汉字输入法是指根据某种编码方案而设计的输入汉字的应用程序,显然,汉字输入法是对应于汉字编码的一种输入方法。笔者对社会上相当多的声形混合码没有研究,本文虚构的“缪码”只是举例说明需要,如果正好与某种声形混合码的设想相同,纯属巧合,决无剽窃之意,而且笔者也没有要去注册什么发明权的意思,特此声明。 “缪码”的基本设想是给汉字的所有部首起一个名字,取部首名称发音的第一个拼音字母作为代码,取码顺序按汉字写字笔顺为序,每一个字最多取3位码,再加构成这个字本身发音的第一个字母。如果总码数正好是4个,对应的汉字会自动上屏,如果不足4码,按空格补充。举例说:我们常说木子“李”,其编码是“MZL”再加一个空格键;日月“明”,其编码是“RYM”再加一个空格键。多码字“照”的部首是“日、刀、口、四点”,定义代码是:“RDKZ”不需再加空格键。这里只是举几个例子,中国的方块字奥妙无穷,给人们留下了无穷的创造机会,你可以触类旁通,从声、形、笔划、部首、组合关系等各方面去设计拆分和编码的方法,创造出更好的输入方法来。 二、给每一个字根编代码 “缪码”的字根就是汉字的偏旁部首,根据《现代汉语词典》所确定的部首,共有188个,每一个部首都要先确定代码名称,根据名称再确定编码。 例如:“丶”被称为“点”代码为“D”,也可以称为“一点”,代码“Y”;“氵”被称为“三点,代码为“S”;“王”旁,代码为“W”;“扌”旁,代码为“T”。其余类推。如果编码过程中发现某个部首的代码使用频度过高,重码过多,就要给这个部首重新编码,这个过程当然是一个艰苦而又枯燥无味的工作。最后,你要制定一张部首名称及其代码的对照表,做到一目了然,容易记忆。 三、对字词编码 根据自己已经确定的汉字编码总体原则,应对汉字两级字库的6763个汉字一一编码,完成单字码表。 1.编制一级简码表 将最常用的26个汉字与26个字母一一对应,便于快速调用。 2.编制二级简码表 根据使用频度,将6763个汉字与每两个字母组合对应,供快速调用。 如有可能,最好还能确定三级简码。 3.自定义词组 可根据任何一种输入法发明者提供的词组清单,编制你自己的词组码表,词组取码规则一般有三条,即二字词每个字各取前二码,三字词则前两个字各取前一码,第三个字取前二码,四个或四个以上的词前三个字各取前一码,最后一个字取前一码。 把单字码表、简码字码表和词组码表组合在一起就完成了字词码表原文件的编制工作。 四、编制符合Windows 95输入法标准的码表原文件 1.先按下面格式编辑码表原文件的头部 码表文件的头部格式如下: [Description](输入法码表文件标志) Name=神奇缪码(输入法名称,可随便取) MaxCodes=4(最大码长为4码) MaxElement=1(码元为纯字母一种) UsedCodes=abcdefghijklmnopqrstuwxyz(码元) WildChar=v(通用检索码为“v,因为汉字不用v) Numrules=3(组词规则有3条) ce2=p11+p12+p21+p22(二字词取码规则) ce3=p11+p21+p31+p32(三字词取码规则) ca4=p11+p21+p31+n11(四字及以上词取码规则) [Text](字词码表头) 2.将字词码表原文件接在[Text]的后面。字词码表原文件应该是每一个汉字或词组后面紧接它的编码,编码用小写字母,字、词与码之间不留空格,每一个字或词与其编码占一行,例如: 一y 二e 三s 王hhsw(横横竖王) 李mzl 照rdkz 工人hsnp(横竖捺撇) 等等。 最后,将此文件以文本文件格式如miao.txt存贮到Windows的system子目录里。 五、安装你“发明”的输入法 1.对码表原文件中的字、词代码排序 由于你所编制的码表原文件的编码部分是随机输入的,为便于电脑搜索,必须经过排序,使其按编码的字母顺序排列。Windows 95中文版的输入法生成器程序中提供了对码表原文件排序的功能功能,现详细介绍排序具体步骤: a.单击“开始”,选择“程序”中的“附件”,单击其清单中的“输入法生成器”图标,打开输入法生成器窗口。 b.单击“词条排序”按钮及“打开”按钮,然后在“打开”窗口的文件夹框中找到c:\windows\system的子目录并双击system子目录名,打开该子目录内的文件清单。 c.双击文件清单中前面已存入的“miao.txt”码表原文件,此时,“打开”按钮的下方出现“码表原文件:miao.txt”和“转换结果文件名:c:\windows\system\miao.mb”两行提示。 d.单击窗口下方的“排序”按钮,此时系统会打开“排序”窗口,接着系统开始排序,窗口右侧会列出已排序词数,当系统提示“排序结束”时,按下“确定”按钮,排序工作结束,并退回到“输入法生成器”窗口。 2.将码表原文件转换为码表文件 a.在“输入法生成器”窗口中,单击“创建输入法”按钮,展开创建窗口。 b.单击输入法窗口中的“浏览”按钮,展开“打开”窗口。 c.在文件框中找到“system”子目录,双击“system”,等待“文件”框中出现“WBX.TXT”文件名。 d.双击“wbx.txt”后,返回到输入法生成器窗口。 e.输入法生成器窗口的“输入法码表名”后面的框中出现“C:\WINDOWS\SYSTEM\WBX.MB”后,单击窗口下面的“转换”按钮。 f.接着系统询问:“是否检查GBK字符集的构词?”,选择“否”以后,系统开始执行转换,这时屏幕出现“转换提示信息”框,列出总词数和已转换词数,待已转换词数等于总词数时,系统提示转换完毕,单击“确定”键后,退出转换功能。 g.再单击“创建”按钮,打开输入法创建窗口,可根据自己喜欢选择其中各个项目,笔者建议,只选择“词组输入”和“SPACE”两项,单击这两项前面的复选框。然后按下“确定”按钮,系统会询问“选择系统位图?”和“选择系统图标?”,连按两次“确定”按钮后,结束输入法生成器程序。 到此,所谓“神奇缪码”输入法已经安装在Windows 95里了。通过文件管理器或者资源管理器查看c:\Windows\system子目录,可以看到在系统中已生成了一个“miao.ime”的输入法文件。 六、应用你“发明”的输入法输入汉字 1.打开文本编辑器 为了验证你“发明”的输入法是否可用,你必须先进入某一个文本编辑器,建议先进入“记事本”程序,即单击“开始”,选择“程序”及“附件”,然后单击附件清单中的“记事本”,打开“记事本”程序。 2.打开“神奇缪码”输入法状态显示条 单击任务条右端的输入法按钮,如果原来的状态是英语,此按钮为小方框内套着En两个字,单击它就可以在此按钮的上方出现该电脑已安装的输入法清单,单击其中的“神奇缪码”,任务条上位于“开始”按钮的上方就会出现“神奇缪码”的输入法状态显示条。此时,你就可以用你“发明”的输入法在“记事本”程序中录入汉字了。 3.用你的输入法造词 单击输入法状态显示条的“神奇缪码”名称,就会在此状态显示条的上方出现输入法任务清单,单击其中“手工造词”那一项,就打开了造词功能。接着你只要在输入词语的框中录入词组,系统会在外码框中显示符合该输入法组词规则的外码,此时只用单击“添加”按钮,就将这个词组添加到名为“miao.emb”的词组文件中去了。接下来,你既可以继续造词,也可以按下“关闭”来退出造词。返回到“记事本”程序中,继续你的写作,试用一下你刚造的词,轻轻松松按几个码,这个词组就自动上屏了,你说是不是很神奇!