图像扫描仪的应用 1994-06-17 一、光学字符识别(Optical Chayooler Recognition简称OCR) 在办公室里可以用一台扫描仪将一份文件扫描输入到计算机内,OCR软件可以相当精确地将图像文件中的文字符号辩识出来,并转换为工作标准的文本文件,这样,一篇很长的文件可以在极短的时间内全部输入到计算机,比用键盘录入效率要提高很多。 在国外,特别是西方国家大约是在六十年代就开始利用OCR做文字处理了,目前应用已相当普遍,由于西文多数是采用拼音方式,字符有限,所以相应的识别难度要小得多,而汉字是用图形方式描述,常用的基本汉字数以千计,因此汉字的OCR具有相当难度,我国的科技人员在这方面进行了大量的探索,汉字OCR(尤其是对印刷体汉字的识别)已达到较高水平,并已有一批实用的商品化软件,诸如清华OCR,北信OCR等。对印刷质量较好的文稿,它们的识别率都足以达到95%以上。 二、图文数据库(Image & Text Base) 数据库技术是OA的重要组成部分。利用文字数据库(例如DBASE、FOXBASE等)可以将大量的文字,数据资料进行存储、管理、查询、检索,使办公效率成倍提高。遗憾的是这类数据库无法管理办公室中大量的图像资料以及重要文件的传递。图像扫描仪的出现和使用使建立图文并茂的图文数据库成为可能,利用扫描仪轻而易举将照片、文档输入计算机,并装入图文数据库中的专用图像字段,这些图像数据同样可以进行存贮、管理、查询、检索等,从而使数据库的应用进一步拓宽。在国外,图文数据库发展很迅速,当然它和图像扫描仪有直接的关系。在国内,具有代表性的图文数据库是清华三艾公司开发的ITbase,它已广泛用于人事、户政、房地产、车辆驾照、电脑红娘、风景名胜管理等诸多领域。