智能狂拼评测报告 电脑报评测实验室 2000年 第34期 如何快速准确地在电脑上进行汉字输入是一直困扰着我们的一个难题。目前,市面上各种各样的中文输入法非常之多,但绝大多数用户使用的都无外乎拼音输入法或者五笔输入法两种。关于两者孰优孰劣,在国内曾有过非常激烈的讨论,在这里不再老生常谈。根据最新调查数据表明,目前我国电脑用户有70%~80%使用的是拼音输入法。其根本原因在于它的易学易用。广大用户特别是青少年对拼音都非常熟悉,不存在什么隔阂,很快就能上手;五笔输入法则需要记忆大量字根和规则,并反复练习。因此,现在除一些专业的打字员以外,使用五笔输入法的人已是越来越少。   使用拼音进行汉字输入也有非常明显的缺陷如:重码率高,连续输入能力差等等,相信大家对此都深有体会。以我们评测室内部来说,虽然主要从事软硬件测试工作,但在电脑上整理出各项产品的评测报告也是必需的,而大家都只会用拼音,毕竟把符合美学的汉字拆得七零八落让人觉得有点别扭。市面上各种类型的拼音输入法软件我们几乎都尝试过,总的来说都不是很满意。我们使用的拼音输入法主要集中在《智能ABC》和《拼音加加》上。   日前,中文之星公司推出了一款全新的智能化拼音输入法软件—《智能狂拼》。对于这样的一个评测对象,我们当然是很有兴趣的了。   本次评测的系统环境:   硬件环境:Pentium Ⅲ 450、128M内存   软件环境:中文Windows 98第二版(4.10.2222 A)、IE 5.5 #1 安 装   《智能狂拼》的安装光盘采用了自动运行的方式。将光盘放入光驱后便会自动弹出安装界面,用户可选择立即安装或浏览光盘。如果用户的系统中已经关闭了“自动运行”功能,也可以浏览光盘找到安装文件进行手动安装。每个安装步骤均有清晰的提示向导,用户可自定义安装路径和安装类型,并可将其设为缺省使用的输入法。系统共提供了三种可选安装类型,分别是:最小智能数据库安装,需要90MB空间,适合于速度慢、内存小的电脑使用;安装中等大小的智能数据库,则需要140MB空间,适合于中档性能的电脑使用;安装大的智能数据库,需要270MB磁盘空间,这是适合于速度快、内存大的电脑使用。为充分感受《智能狂拼》的全貌,我们选择了最大安装。一个拼音输入法竟然会占用这么大的空间!?这确实让我们感到吃惊。安装完毕后,我们查看了安装目录下的文件后,发现是智能词库占据了大量空间(约240MB)。同时,在桌面托盘区中的输入法指示器上会出现中文之星《智能狂拼》输入法的选项(如^34070301a^1)。此外,我们发现盘中还附带有简/繁体文本转换工具和四套精密文鼎字库。 #1 界面与设置   选择输入法指示器中的“中文之星《智能狂拼》”选项,弹出一矩形的输入小窗口(如^34070301b^2)。其上分布有九个按钮,其功能从左到右依次为:中/英文输入状态切换、中/英文标点状态切换、半/全角状态切换、简/繁体状态切换、输出文字间加/不加空格状态切换、开/关动态键盘、自动连接Internet、帮助以及输入法选项设置。鼠标左键点击设置按钮弹出设置对话框(如^34070301c^3),这里共提供了模糊音、智能处理、西文处理、双拼、窗口和其它共六个页面。在“模糊音”设置页中可设置对不易分清的卷舌/不卷舌音和后鼻音等进行模糊处理,并可选择是否在全拼输入时允许省略韵母及提示正确的拼音;在“智能处理”页中用户可根据自己的需要并结合自己电脑的速度和内存的大小调节输入法的运算速度与运算精,并可扩充用户智能数据库;在“西文处理”页中可查看和添加英文词库;在“双拼”页中可对双拼输入法进行设置;在“窗口”页中可自定义输入条的色彩方案及显示哪些按钮,其中预置了“蓝天白云、粉面佳人、满天朝霞、青青绿草、雪山飞狐”等共五种备选方案;在“其它”页中可设置中文标点键位及部分状态的自动切换功能。   按照一般用户的输入习惯,我们将系统设置为半角状态、中文标点、不加空格的简体中文方式。 #1 基本输入操作   《智能狂拼》的输入条分为上下两行显示,在输入拼音字符后,相应的汉字便出现在上一行。我们随意连续输入拼音字符串,不用敲空格键《智能狂拼》基本都能自动识别,并且转换成正确的文字(如^34070301d^4)。按空格键或回车键即可将输入条中的文字确认输出至文档中当前光标所在位置。如果需要改动,用光标键“← 、→”或“+、-”均可进行定位,但前者是以字母为单位移动光标,后者则是以字为单位移动光标;DEL键和Backspace可分别删除光标后面和前面的字母;按空格键可调出备选字/词,在备选字/词框中前后翻页则是按“+、-”键。而按Ctrl键则可在中文或英文输入状态下进行切换。   《智能狂拼》的各项输入操作与我们平时常用的各种拼音输入法大致相同,用户无须学习即可平稳过渡。 #1 主要功能   按照《智能狂拼》的说明,它具有自己的三大技术和八项功能。其内嵌的三大技术是:CLM(中文语言模型)技术、智能信息预测技术和智能信息挖掘技术;而八项功能则是分别是:   1.智能整句输入 2.全拼、双拼、声母头输入 3.智能选词校对 4.超大容量知识库支持 5.智能词汇记忆 6.中英、繁简自由切换 7.智能模糊音识别 8.e键探索互联网   接下来我们对其中各项主要功能逐一进行了测试: #1 一、智能模糊音识别   模糊音的识别是目前很多拼音输入法都在考虑的问题。中国地域辽阔、人口众多,各地方言造成人们口音差别很大,很多人不能准确的拼写拼音,尤其是对卷舌/不卷舌音和后鼻音极易混淆。我们首先选定设置对话框中的所有模糊音设置以及拼音的正确提示。我们首先尝试输入“fei shu fa zhan”,系统马上就显示出“飞速发展”其中“su”以粉红色标注了出来,不仅自动纠正了拼写错误,还注明了错在哪里。我们又测试了类似的其他功能,再次输入“xin zhai ne huo”,系统则显示出“幸xing灾zai乐le祸”,三个地方都同时纠正了。此外,它在处理“持之以恒、足不出户、面目狰狞”等其它大家常输错的词语时也都表现得很好。看来《智能狂拼》的自动识别、错误定位、智能修改功能做得很不错,这些功能配合“提示正确的拼音”功能使用,对于许多朋友(尤其是南方的)无疑是太有用了。 #1 二、全拼输入时允许省略韵母   我们在输入汉字时,常会碰到拼音中韵母很长的情况,输起来感觉很麻烦。而《智能狂拼》中提供了“全拼输入时允许省略韵母”的功能。首先激活该选项。我们尝试输入这样一句话:“科学技术是第一生产力”。在我们输入“k x j s shi d y s c l”,句子竟然一次性打了出来;再输入“dian n bao sh zh g fa x l d y d j s j bao”则正确地显示出“电脑报是中国发行量第一的计算机报”。特别是在将句子的句首词选择成“电脑报”时,句子竟然能自动地跃然“屏”上。这说明《智能狂拼》具有良好的信息预测功能。这项省略韵母的功能相比上面的模糊语音识别功能,对于普通话比较标准的朋友(特别是北方人)会更有吸引力。   接下来,我们把报社地址输了进去:“重庆市渝中区人民路236号”,系统一次性正确识别。在下次输入时,系统会自动从地址词库里面进行快速筛选,这正是智能数据挖掘技术的体现。 #1 三、整句输入   中文之星《智能狂拼》不再局限于以字或词为单位的输入方式,支持其整句输入最多长四十个字以上的句子。在前两项测试完成以后,接下来我们就进行了对一段文章(如下)的录入测试。   “一个年轻人要想成为一个程序员首先必须热爱编程,有强烈的求知欲,他必须仔细阅读手册来学习有关系统的每一点知识。如果一个程序员是为了某种目的来工作,我们可以说他是成功的,但他不是一个好的程序员。我们需要因为爱程序而写程序的人。你看,我成为一个程序员是因为我爱它,几乎所有的优秀程序员都和我一样。如果我们想学东西,我们直接读它的手册。你不需要教我们什么,我们需要的一切都可以从手册里得到。如果你需要某些人来教你,那你永远不可能成为最伟大的程序员。”   我们用《智能狂拼》打了上面这段话,整个过程比较流畅,停顿较少。我们是以标点为划分单位来进行整句输入的,在输入“有强烈的求知欲”时,系统将其误为了“有强烈地求知与”,需要移动光标进行修改;在我们将“仔细”误输为“zhixi”时系统自动进行了修改;在输到“可以”一词时,系统却将其显示为“可一”,令人感觉有些意外;在输入“爱程序而写程序”时,系统将“而”误为“二”,将光标切换到“二”上,按空格键弹出显示菜单,我们发现只需直接选7,正确的句子就会自动列出来。输入的正确率在95%以上。可以看到,在整个录入过程中一旦出现文字改动,系统会同时提供选字,选句同屏显示,这种方式非常直观。比起同类的其它拼音输入法,《智能狂拼》不仅识别率高出很多,纠正上更方便,特别是一气呵成的整句输入功能,大大提高了输入效率。 #1 四、智能选词校对   前面特别说了《智能狂拼》带有一巨大的智能数据库,其后台数据处理采用了中文之星公司的CLM(中文语言模型)核心技术。这个巨大的资料库覆盖了经济、政治、文化、科技、教育、文学、历史、哲学、军事、体育、法律、社会新闻等众多领域。我们选用了各种词汇进行测试,比如:巴蒂斯图塔、独孤求败、令狐冲、库尔尼科娃、谭咏麟、布宜诺斯艾利斯、梅里尔斯特里普等等以及古今中外的名篇名句它几乎都能应付自如,让人感到有些瞠目结舌。看来CLM(中文语言模型)确实很有自己的独到之处。这使得中文之星《智能狂拼》输入法与传统拼音输入法相比,至少能提高30%的输入速度。 #1 五、其他功能   在对双拼功能进行测试时,我们发现系统中提供了三套双拼方案,分别是中文之星、微软拼音输入法和自然码输入法的双拼方案,而且各自提供了不同的拼音键位,这也大大方便了双拼用户。系统提供的另一项功智能词汇记忆也很实用,它允许我们输入一些经常遇到的文章进行智能学习,包含在文章里面的新单词便可以被系统所记忆并直接识别显示出来。“用户智能数据库”还允许用户自己合并数据库,这样便于用户数据库的相互扩充。《智能狂拼》提供的E频道功能是软件积极响应互联网时代需求的特色功能之一。就如同金山的iWPS网上咖啡"一样,它提供了一个热点链接的功能,用户可以通过点击E按钮直接访问一些大型的热门Internet网站,方便快捷。此外,我们发现《智能狂拼》中还有一个很有意思的功能就是,用这个输入法在网上聊天的时候,如果要告诉朋友一个网址,即使开始时忘记按下Ctrl键进行中英文输入的切换,当输入了“http://”的时候,系统会自行切换到英文输入状态,而且在西文处理"设置页中,你还可以随时加入新的英文单词,系统马上就能生效。 #1 六、与目前流行的拼音输入法比较   为了给用户一个准确地定位,我们把目前市面上的几种主流拼音输入法和《智能狂拼》作了一个比较。结果如^34070301e^表所示。 #1 评测总结   通过对中文之星智能狂拼输入法的反复多次实践(实际上我们这篇评测报告也正是用智能狂拼写就的),我们认为智能狂拼输入法是目前国内众多的拼音输入法中功能最强大、速度最快的首选产品。其智能化的设计和基于CLM技术的超大数据库支持为我们在拼音输入方面扫清障碍,无论是对普通用户还是专业的打字员来说,都很有实用价值。当然《智能狂拼》也并非完美无缺,比如《拼音加加》当中的中英混合输入,以回车直接输入英文的方式就值得《智能狂拼》借鉴。另外,对长句中的拼写识别率以及高精度下的数据检索速度仍有待提高。   希望《智能狂拼》能以自己独特的CLM和智能技术为核心,不断发展,早日实现真正的拼音盲打。