智能ABC输入法 金 西 1995-01-06 智能ABC的智能特色: ●输入过程中的自动分词和构词 ●输入词条的自动记忆 ●输入词条的强制记忆 ●输入词条的朦胧回忆 ●候选词的频度调整和记忆 ●自动处理构词中的前加成分和后加成分 一、智能ABC的使用方法 1.汉语拼音的熟手 如果您对汉语拼音使用比较熟练,可以使用全拼输入法。按规范的汉语拼音输入。输入全拼和书写汉语拼音的过程完全一致,但需注意两点: ①按词连写,词与词之间用空格或者标点隔开。如果您不会正词,也可以一直写下去,如超过系统允许的字符个数,则响铃警告。 ②注意隔音符号的使用。例如: wo xiang wei qin'aide mama dian yi zhi haotingde gequ. 我 想为 亲爱的 妈妈 点一 支 好听的 歌曲。 2.对汉语拼音略知一二 如果您对汉语拼音把握不甚准确,可以使用简拼输入法。简拼就是汉语拼音的简化形式。 简化的规则是:取各个音节的第一个字母组成,对于包含zh、ch、sh(知、吃、诗)的音节,也可以取前两个字母组成。例如: 全拼 简拼 汉字 jisuanji jsj 计算机 changcheng cc,cch,chc,chch 长城 在简拼时,隔音符号的作用进一步扩大。例如: 全拼 简拼 说明 zhonghua(中华) zh 不正确,因为它是复合声母“知”,应当为z'h 或者zhh。 eran(愕然) er 不正确,它是“而”等字的全拼,应当为 e'r 。 3.汉语拼音的全方位输入 这是汉语拼音输入的一种开放式、全方位的输入方式_混拼输入法。两个音节以上的词才有混拼的问题,即一个词中有的音节全拼,有的音节简拼。例如: 全拼 混拼 汉字 jinshajiang jinsj 金沙江 请注意,隔音符号在混拼时的重要作用。例如: 全拼 混拼 说明 linian(历年) lin 不正确,它是“林”的拼音,应为li'n或lnian。 dange(单个) dang 不正确,它是“当”的拼音,应为dan'g或dge。 4.汉语拼音的外行 在不会汉语拼音或者不知道某字的读音时,可以使用纯笔形输入法。在智能ABC系统中汉字“形”的元素,按照基本的笔画形状,共分为八类: 笔形代码“1”为横(提),“2”为竖,“3”为撇,“4”为点(捺),“5”为折(竖弯勾),“6”为弯,“7”为叉,“8”为方。例如,笔形代码“7”的实例有“十”字形, 而笔形代码“8”的实例字形为“口”字。 注意:笔形代码1-6的实例是取第一笔,笔形代码7-8的实例是取第一个形状。 笔形代码的取码时按照笔顺,即写字的习惯,最多取6笔。笔形“+(7)”和“口(8)”,包含两个笔画以上,按照其第一笔的顺序取码;作为(7)(8)的部分,已经取过的笔画,不再重复。 例如: 汉字 笔形描述 汉 44154 字 4455(1) (取到4笔已经够了) 简单汉字__即独体字可按笔画顺序一一取码。例如: 汉字 小 力 串 我 乎 笔形码 534 53 882 315 34315 对于复杂的汉字,我们称为合体字,可将其按左右、上下或外内分为两块,每个字块最多取三个笔画对应的笔形码,若第一个字块多于三个,限取三码,然后开始取第二个字块的笔形码;若第一个字块不足三码时,第二个字块可顺延取码,第二字块仍可一分为二,按每部分取三码顺延取码。这些笔形按键不必死记,只要能按提示行信息顺序按键就可以找到所需的汉字。例如: 第一个字块多于三码: 汉字 船 装 敲 笔形码 33536 412413 418217 第一个字块不足三码: 汉字 传 国 花 笔形码 321154 81714 72323 对于一些特殊的偏旁部首,笔形码有二义性,按下列笔顺规定编码: 耳 非 忄 火 女 艹 122 211 424 433 631 72 对于笔顺不够明确的个别字或偏旁,按下列编码: (偏旁) 廾 开 井 弗 凸 凹 132 1132 1132 51532 25 26 在纯笔形输入的时候,对编码模糊的情形,允许多种编码。 5.熟悉本系统的高手 如果您比较熟悉本系统,输入过程不妨采用拼音笔形混合输入。拼音和笔形的混合输入是为了减少在全拼或简拼输入时的重码率。 音形组合原则: (拼音+[笔形描述])+(拼音+[笔形描述])+.......+(拼音+[笔形描述]) 其中,“拼音”可以是全拼、简拼或混拼。“[笔形描述]”可以有0笔或1~2笔;最末一项可以到1~6笔。 对于多音节词的输入,“拼音”一项是不可少的;笔形可有可无,可多可少。对于单音节词或字,允许纯笔形输入。一个词可以有许多种输入方法,您可以根据您的习惯和熟练程度选用不同的方法。 6.专业录入人员 智能ABC为专业录入人员提供了一种快速的输入方式__双打输入法。 汉字的读音大体上是由声母+韵母两部分组成。这种汉字在双打方式下,只需要击键两次:奇次为声母,偶次为韵母。 有些汉字只有韵母,被称为零声母音节。这种汉字在双打方式下,用零声母键(本系统为“o”字母)或隔音符号“'”补成双键。虽然击键为两次,但是在屏幕上显示的仍然是一个汉字规范的拼音。 注意: ①在双打变换状态,下列场合对双打键盘的定义不起作用: 大写字母(输入拼音时,大写字母要按“Shift+字母”); 第一键为“u”,“u”在ABC中用于输入用户定义的特拼词。 第一键为“i”或“I”,在ABC中用于输入中文数量词。 ②在双打变换方式下,简拼的输入采取如下措施: 全部大写(在“标准变换”下也有效,而且不用隔音符号); mingqiang'anjian mq'aj MQAJ 标准 双打 明枪暗箭 标准音节之间加笔形代码或隔音符号: mingqiang'anjian mq'aj m'q'Aj 标准 双打 明枪暗箭 标准加第一个“天”字的首笔。 tiantian tt t1t 标准 双打 天天 由于字母“v”在双打方式中替代声母“sh(诗)”,所以不能使用“V+区号”的方式来输入1-9区的字符。应切换到标准变换方式来输入。 二、汉字输入过程 1.开始阶段 第一键按下后,就开始了拼音输入过程。第一键只允许输入26个英文字母(大写、小写均可以);在“全角”状态时,还允许中文标点符号的代用键。第一键为i,I,u,v 时具有特殊的含义。 2.输入中间阶段 各种字符包括数字都可作为输入字串的组成部分。但是输入信息应当符合基本的组合规则。 3.输入结束键 空格,标点符:将以词为单位转换输入信息。 回车键:将以字为单位转换输入信息。“[”、“]”、“Ctrl”+ “-”为特殊情况结束键。 4.结果修正阶段 系统对输入的音形字串在分析、变换后,把结果显示在相应输入信息的位置,计算机用响铃提醒操作人员对转换结果进行正确性判断。其大致情况有: 无声:转换结果唯一;短声:有参考结果;长声:无结果,且显示“无”字。 如果结果不是唯一的,还要在参考提示窗口中显示参考结果。如果转换不能一次完成,就可能进入自动分词构词和记忆过程。 5.输入过程中的用键定义 ①词转换键_空格键、鼠标左键: 结束一次输入过程,同时具有对输入信息按词转换的功能。 ②字转换键_回车键: 结束一次输入过程,同时具有对输入信息按字转换的功能。 ③取消键[Esc]: 取消输入过程或者变换结果。 ④逆转换及删除键[←或BackSpace]: 在输入字符过程,删除光标前的字符;在转换过程,把光标前的一个汉字恢复到原输入码。 ⑤恢复、重复键[Ctrl+"-"]: 对记忆功能的内容“朦胧回忆”,在其他的场合下,它起着恢复现场或重复作用。 ⑥翻页键: “]”键向前翻页;“[”键向后翻页。翻页还可以根据操作提示符,用鼠标左键翻页: A.向后翻页;B.向前翻页;C.既可向前,也可向后;D.不用翻页。 在多页的情况下,如果光标在操作提示符上,按下鼠标右键可直接到最前页和最后页。 参考结果选择键[数码键1~8]: 6.输入区的编辑 智能ABC的输入区允许输入的字串可达40个字符,实际上可以输入整个汉字。 在输入过程中,可以使用光标进行插入、删除、取消等操作。 光标键: → 右移光标; ← 左移光标; ↑ 光标移到输入字串头; ↓ 光标移到字串尾; [Back Space] 删除前一个字符; [Del] 删除后一个字符; [Esc] 取消全部输入内容。 7.输入过程中的自动分词和构词 例如,在“标准”方式下,要输入“计算机系统”一词,首先输入该词的拼音:jsjxt。按空格键,结果出现:“计算机XT”1.计算机2.九十九3.脚手架4.金沙江。 因为系统中没有“计算机系统”一词,所以先分出一个“计算机”并等待选择纠正。“计算机”一词不用选择,因此直接按空格键后出现:“计算机系统”1.系统2.相同3.协调4.形态5.夏天。 同样也给予选择的机会,正巧,“系统”一词也不用选择。如果按空格键,则分词构词过程完成,一个新的词“计算机系统”被存入暂存区。 注意:本例中输入时采用的是简拼方式,实际上用全拼、混拼等其他方式同样可以得到所需结果。另外,由例子中也可以看出,这也同时是自动记忆过程。 8.输入词条的自动记忆 自动记忆通常用来记忆词库中没有的生词,如人名、地名等,它的特点是自动进行,或者略加人为干预。自动记忆的词都是标准的拼音词,可以和基本词汇库中的词条一样使用。允许记忆的标准拼音词最大长度为9字,最大词条容量为1.7万条。刚被记忆的词并不立即存入用户词库中,至少要使用三次后,才有资格长期保存。新词栖身于临时记忆栈之中,如果栈“客满”,而当它还不具备长期保存资格的时侯,就会被后来者挤出。刚被记忆的词具有高于普通词语,但低于最常用词的频度。往往有这种情况,用户要求输入的内容与机器判断的结果不符合,也就是说,按照用户输入的拼音可以得到字库中的词,但不是用户需要的,这时用户就需要用回车键或者回空格键来干预记忆过程,以达到自己的要求。 9.输入词条的强制记忆 强制记忆,一般用来定义那些非标准的汉语拼音词语。利用该功能,可以直接把生词加到用户库中。强制记忆一个新词,必须输入词条内容和编码两部分。词条的内容,可以是汉字词或者词组、短语,也可以由汉字和其他的字符组成,编码则可以是汉语拼音、外来语原文、或者是使用者所喜欢的任意标记。 强制记忆允许定义的非标准词容量为400条;非标准词最大长度为15字;非标准词输入码最大长度为9个字符。用强制记忆的方法记忆一个既频繁使用而又较长的词条是比较有意义的,因为它可以用最简单的方式,获得所需的结果。 选菜单“新词”项,或者按热键[Ctrl+'8'],若出现如下所示的窗口,则进入强制记忆过程。 (1)“添加” 首先在“输入新词”框输入所需要记忆的内容,内容没有特殊要求,任何长度小于30的新词字串(15个汉字)都可以。然后在“输入编码”框输入其记忆代码,代码不能是汉字字符,最大长度不得大于9个,实际上越简单、越容易记忆越好。最后,按下“添加”按钮, 如果成功,新词就会出现在“新词一览表”中。 您可以一次加入多个词条。 (2)“删除” 把光标移动到“新词一览表”中,选中需要删除的词条后,按下“删除”按钮。 (3) “返回” 肯定本次操作的结果,结束定义新词的操作。 10.输入词条的朦胧回忆 这个功能模拟的是人大脑的瞬时记忆以及不完整记忆。对于刚刚用过不久的词条,可以使用最简单的办法依据不完整的信息进行回忆,这个过程称为朦胧回忆。朦胧回忆的功能通过[Ctrl+"-"]键完成。例如,不久前曾输入: 1 基础教育研究会; 2 上海; 3 基础科学; 4 北京; 5 基本粒子 若想再次输入“基础科学”,先键入“j”;再按[Ctrl+"-"],朦胧回忆扩展屏幕就有显示,这时选择“3”即可。 如果要重复刚刚输入过的内容,只需要连续按两次[Ctrl+"-"]即可。第一次起恢复现场的作用,第二次起“朦胧回忆”的作用。朦胧回忆在输入内容较为单一、输入内容频繁重复等情况下使用是非常有效的,能显示出非常大的优越性。 11.候选词的频度调整和记忆 所谓词的频度,是指一个词使用的频繁程度。ABC标准库中的同音词的词序安排, 反映了它的使用频度,即经常使用的在前,不常使用的在后。但这只是反映了一般规律,对于不同使用者来说,可能有较大的偏差。实际上,每个人有每个人的词频特色。所以,ABC 设计了词频调整记忆功能。词频调整自动进行,不需要人为干预。词频调整,主要调第一个词,因为机器认为它是变换的结果,而自动输出。词频调整的词长范围1~3音节,对单音节词来说,需要使用两次,词频才发生变化。注意:需要打开“调词频”设置选项,此功能才起作用。 12.自动处理构词中的前加成分和后加成分 系统自动处理构词过程中的前加成分和后加成分。有些词只能作前加成分,例如: 副: 副主席, 副主任 总: 总公司, 总经理 有些词只能作后加成分,例如: 们: 先生们, 女士们 的: 我们的, 他们的 有些词既可作前加成分,又可作后加成分,例如: 中: 中西部, 假期中 子: 儿子, 子公司 三、智能ABC的词汇库系统 1.基本词库 智能ABC具有一个约6万词条的基本词库。 2.动态词库 具有自动筛选功能的动态词库,在自动记忆的词汇容量可达1.7万词条; 强制记忆的词汇可达400条。 3.系统状态设置 在主菜单中选择“设置”项,或按下热键“Ctrl+9”,则弹出智能ABC的状态设置框: “标点”项:选中时西文标点自动转换成中文标点。 “词频”项:选中时具备自动调整词频功能。 “双打提示”:选中时每输入一键,都有自动帮助提示的功能。 “纯笔型”:此选项有三种状态, 选中时在“标准”方式下,具有纯笔型输入功能。但纯笔型输入功能使数字的输入带来麻烦,建议在使用“标准”方式时,不设此功能。 选中时在“双打”方式下选中时,也具有纯笔型输入功能。 选择框为灰色方块时封闭“纯笔型”输入功能。即在“标准”和“双打”方式下都不能进行纯笔型输入。 4.中文数量词的简化输入 ABC输入系统提供阿拉伯数字和中文大小写数字的转换能力, 对一些常用量词也可缩写连在数字后输入。 其中,“i”为输入小写中文数字标记;“I”为输入大写中文数字标记。 系统还规定数字输入中字母的含义为: G[个] S[十,拾] B[百,佰] Q[千,仟] W[万] E[亿] Z[兆] D[第] N[年] Y[月] R[日] T[吨] K[克] $[元] F[分] L[里] M[米] J[斤]  注意:$之前必须要有数字。 5.以词定字的单字输入 使用拼音输入单字,当你需要的字不容易找到时,尽量想一个双音节或多音节的词,然后用以词定字的方法选择 ,这样输入比较便捷 。因为双音节或多音节的词重码率低得多。无论是标准库中的词,还是用户自己定义的词,都可以用来定字。例如人名、地名用字往往需要费力挑选,就可以以词来定字。以词定字的方法是: 用'['取前一个字,']'取后一个字。 6.强制记忆词条的输入 事先用强制记忆功能定义了词条,输入时应当以“u”字母打头。 例如,如果在定义新词一览表中已经定义: 马克思 marx;国家语言文字工作委员会 gjyw 则在输入这些词条时,应键入: umarx[空格键]输出结果:马克思;ugjyw[空格键]输出结果:国家语言文字工作委员会  7.图形符号的输入 输入ASCII字符集1-9区各种符号、外文字母、制表符等,可使用简便方法:在标准状态下,按字母V+数字(1-9),这时将该区的符号显示在扩展屏幕的提示行,并可进行翻页,找到所需要的符号后,再按数字键,主屏幕光标所在位置显示出相应的符号。中文标点符号的输入在各个输入法中是一致的,智能ABC 在此基础上为您提供了书名号自动嵌套的输入功能,以满足单书名号必须出现在双书名号中间的一般约定。书名号的输入键为‘<'和‘>'键。第一次按‘<'时,对应的输出字符为《,再按‘<'时,则出现‘〈'。此后如果输入的‘>'与‘<'能够匹配上,则再次输入‘>'时,则出现‘》'。 8.拼音输入过程中的英文输入 在输入拼音的过程中(“标准”或“双打”方式下),如果需要输入英文,可以不必切换到英文方式。键入“v”作为标志符,后面跟随要输入的英文,按空格键即可。 9.了解词库内容 智能ABC的词库以《现代汉语词典》为蓝本,同时又增加了一些新的的词汇,共收集了大约6万词条。其中: 单音节词和词素 13%, 双音节 66%, 三音节 11%, 四音节 9%, 五~九音节 1%。 上述数字表明,双音节词占着很大的比重,这是现代汉语的重要特色。词库不仅具有一般的语汇,也收了一些常见的方言词词语,还有某些习见的专门术语。此外还收入了一些人名(古今中外名人,三百余人),如“孟德斯鸠”、“孔子”等;地名(国家名称、大都会、名胜古迹、中国的省、市、地区一级的地名,约2000条),如“科威特”、“泰山”等;短语或习语,如“振兴中华”、“我国”等;数词(“一”到“一百”)、序数词(“第一”至“第一百”)。熟悉词库的结构和内容,有助于恰当地断词和选择效率高的输入方法。 10.把握按词输入的大体规律 建立比较明确的“词”的概念,尽量按词、词组、短语输入,并把握输入的大体规律: ①三音节以上的词语都可以简拼输入,尤其是常用词语。个别情况下,尤其是三音节的情况下,对其中的一个音节全拼或者简拼+笔形,以区别同音词。 ②最常用的双音节词可以简拼输入,这些词大约有500个。一般常用词, 可采取混拼或者简拼+1笔笔形描述。普通双音节词,应当采用全拼或者简拼+2笔笔形描述的形式输入。少量双音节词,特别是简拼为“zz,yy,ss,jj”等结构的词,需要在全拼基础上增加笔形描述。 ③最常用单音节词可以简拼+1笔形描述输入。一般常用单音节词,应当全拼(简拼+2笔形相当于全拼)。重码高的单字(特别是“yi,ji,shi”音节的单字)可以全拼+笔形输入,一般不超过两笔,但是在特殊情况下,加到六笔也是允许的。实际上,加4 笔就已经没有重码(极个别情况除外)。注:有24个单音节词可以不加笔形。 表中的词,在“智能ABC”中叫做特拼词,数量虽然少,但是使用极其频繁,应当记住。另外,还应充分利用“以词定字”的功能来输入单字。如果没有现成的、恰当的词可以自己定义一个。 11.选择符合自己特点的打法 在诸多的方式当中,总有一种适合于你的打法,但是不要完全局限于一种方式,而应根据自己的特点,调整并采用多种输入方式,这样既可以充分利用本系统的智能特色,又可以最大限度地发挥人的主观能动性。 例如: 有时,您所用的词往往是单音节词和双音节词,或者是单音节词和双音节词的组合,如“回车键”、“个人简历”等。利用ABC 的记忆功能可将这些常用的组合词记忆为一个词,这样可大大提高输入速度。如果您写一篇论文,需要经常使用特殊符号,如表示温度的符号“℃”(国标码为0170)。每次键入这一符号时,都必须使用图形符号的输入法。这时您可以采用强制记忆的方法,将“℃”定义成“d”(当然也可以是任意定义的编码), 下次使用时,只需键入“ud”即可得到该符号,这中间不需要任何切换的过程。