中英文表单的识别系统及识别方法

文档序号：6410303阅读：443来源：国知局

专利名称：中英文表单的识别系统及识别方法
技术领域：
本发明涉及一种中英文表单的识别系统及识别方法。更确切地说，本发明为一可辨识印刷及手写中文及字符数字的中英文表单的识别系统及识别方法。
许多商业及政府单位均需处理填写手写文字的印刷表单，有许多方法可以将该数据抽取、处理并予以储存。举例来说，可利用图像扫描装置及光学文字辨识技术抽取出表单上的印刷或手写数据。表单图像本身可以经由照相产生微缩单片或微缩影片，或利用光学扫描而产生图像储存于计算机硬盘或其他电子储存媒体。知名公司如东芝(Toshiba)、三洋(Sanyo)、日立(Hitachi)、松下(Panasonic)等均已推出结合图像扫描与光学字元辨识(OCR)装置的表单阅读系统处理日文及字母数字的数据。
一种OCR装置常用的表单为A8或A4大小、总有暗格子的表单。图1为一描述该类表单的例子。表单上的说明文字需预先列印在规定的栏位位置，待填文字需填写在以暗格子标示、字与字间有间隔的栏位内。说明文字不需以暗线(格)分开。
图1所示的暗格表单20有22、24、26、28等栏位可填写文字，例如在例举的医疗保险单内，包含被保险人姓名22、病人姓名24、雇主姓名26、以及病人与被保险人姓名28。相关文字被填入含暗线32的格子30内，每个由暗线定义出的格子34内只能填写一个中文或英文字母数字。位置符号36被印在表单20上，在一较佳实施例中，此符号36位于表单的四角，被用来校正扫描时表单的倾斜与偏移状态。
图2显示表单20的局部放大样本，其中印刷字元部分，例如“被保险人姓名”38以及“病人姓名”39没有暗线区隔，但落于栏40及42(显示于图2的虚线栏位)的手写字元则书写于格子34内。格子34由位于栏位44、46内的暗格32所组成。
一个字元辨识系统往往无法保证辨识无误，特别是在辨识手写字元时，辨识错误无可避免。如此，人工更正(由操作人员执行)势在必行。某些典型的字元辨识系统往往拒认潦草或不合法的字元。当拒认与误认字元大大增加后，文字更正率对于自动系统而言，比一般的人工数据登录系统更重要。因此，一个光学字元辨识系统最好能提供一套有效地更正无法辨识字元的方法。
表单辨识结果可被分为三种情况1、完全正确表单内每个字元都可辨识且每个栏位均通过后处理检查，例如字典检查(辨识栏位是否符合字典中的一个字)、文法检查(辨识栏位是否符合预设的文法)等。辩识后不需任何人工更正，即使有任何错误也是因系统隐藏的错误造成而无法更正(例如字元辨识错误欲同样通过后处理检查)。一个实用的系统其隐藏错误必须低于人工登录系统。
2、人工更正表单辨识后需经人工屏幕更正。当某些字元被拒认或栏位内的字元均可辨识但未通过完整性检查，则表单必段经人工更正。
3、整张拒认当表单内无法辨识字元太多(例如，由于扫描质量太差、表单错误或书写笔迹潦草表单被拒认，此时所有表单上的字元均须由人工输入。
一些国外的光学字元辨识系统针对上述问题提出了不同的解决方法。例如，美国专利5,251,273号(Betts等)提出一个数据处理系统及方法，依序更正扫描辨识表单后产生的错误。此参考例所提出的装置中包含三个辨识数据更正处理器，即(1)人工智能处理器(2)数据库检错处理器(3)人工验证与更正处理器。一种机器产生的数据结构记录识别结果及更正历史，并将其陆续传送至每个处理器。当人工智能与数据库错误更正处理器处理完成后，工作站屏幕上会显示栏位图像供人工更正。
美国专利5,305,396号(Betts)提出一数据处理系统与方法，可针对不同客户表单选择字元辨识流程以及辨识数据更正流程。此参考例提出在辨识前先输入一表单模版，该模版内含有根据客户需求而设的系统操作参数，在大量识别前系统须先阅读该表单模版。
美国专利5,235,654号(Anderson等)提出一进步的数据抽取、数据处理系统，处理扫描后的表单图像。其内容为一个可以产生新表单做自动处理的系统。
美国专利5,153,927号(Yamanari)提出一字元阅读系统与方法，该专利提出一个字元阅读系统，该系统允许使用者准备一个使用者特殊处理程序，系统不需知道该处理程序的规格。该专利提出两个处理区段，即标准处理区段以及使用者自订处理区段。该使用者自订处理区段允许使用者任意设定其希望检查的栏位，而不影响标准处理区段。
美国专利5,233,627号(Yamanari等)提出一个附有特殊更正功能的文字识别器，该专利公开一种字元阅读装置，可避免在屏幕显示包含拒认字元的图像时，遮到原始的表单图像。
本发明的目的在于提供一种具有中英文表单查询功能的字元辨识装置。
本发明的另一目的在于提供一可识别印刷及手写表单内字元的光学字元识别装置。
本发明的再一目的在于提供一种识别效率高的装置及人工更正方法。
上述目的经由具有印刷字母数字识别模组、手写字母数字识别模组、印刷中文辨识模组、手写中文识别组的识别装置而达到。当被抽取的数据完成识别后，如有需要，会再显示在屏幕上供察看与更正。
本发明的一较佳实施例包括一可“查询”表格内数据地址的表单查询模组，如此可使光学文字识别(OCR)装置直接进入具有待处理文字的栏位并进行处理。该模组可查询字元位置，并在大量处理时，比较扫描表单图像上定位记号的位置与查询时定位记号的差异以改善扫描时所产生倾斜与偏移的许可偏差。
本发明也提出一种可抽取印刷与手写数据，并将该数据储存于包含印刷与手写中文和字母数字的图像文档内的光学文字识别(OCR)装置。
一个较佳实施例也提供一种逐渐进行的更正流程，其中人工更正只在有必要时才执行。其更正程序是依照工作量的大小由简至繁排列。亦即成本较低的部分(较不费时)先进行。在此实施例中，先实施字元更正，其次是栏位更正，最后是表单整张更正。
本发明表单查询方法、抽取字元方法、验证光学扫描数据信息正确性的方法以及人工更正表单的方法的步骤如下本发明的结合附图及实施例对特征详细描述如下

图1显示一暗格表单范例；图2为图1表单的部分放大图；图3为中英文表单识别装置的方块图；图4为本发明中表单查询的流程图；图5为本发明装置的工作流程图；图6为本发明中的屏幕更正程序的流程图；图7为字元更正时的一个描述画面；图8为栏位更正时的一个描述画面；图9为字元更正屏幕流程图。
如图3所写，其为本发明的光学文字辨识装置的一较佳实施例，该系统50包括纸张输送系统51，该纸张输送系统51将表单沿箭头方向通过光学扫描器(“OCR扫描器”)52。一个扫描器的较佳实施例52利用激光照亮该表单，并利用例如电荷耦合器件CCD的储存元件产生该表单的二值图像。此扫描器可产生每个像素非逻辑“1”即逻辑“0”的二值图像。一种OCR扫描器52的型号为TDC2610W(由Terminal DataCorp所制造。)扫描器52可与处理器54(例如，一个一般用途的电脑或是一个特殊用途的硬件处理单元)连接。处理器的硬件单元可以是光学处理单元或电子处理单元，例如“Resister Summing Network”及数字逻辑线路。该处理器可包括一微处理器56及其余元件、一个屏幕或监视器58、一个键盘或其余输入装置60。该处理器54可包括一个记忆装置62储存扫描后的文件图像。该存储装置可为硬件、RAM、或其余存储装置。
识别过程如下欲识别的表单经由送纸器51及扫描器52扫描，产生二值图像数据存入存储器62经由微处理器54处理；应用程序、字元特征、数据库、表单检查知识库等均储存于存储装置62内，当执行辩识时图象辩识程序数据库等均由微处理器56控制载入动态随机存储器内并逐步执行直至该批图像均已处理产生批次中间档储存于硬盘中。微处理器56控制执行更正作业，其中需在屏幕58上显示图像，并由操作人员操作输出/入键盘，微处理器56于接收键盘60输入后，将该输入值传递主存储器内的更正程序，以使程序继续执行直至更正作业流程执行完毕为止。在扫描过程中，表单图像及字元识别数据显示屏幕58，当下述的字元辨识程序58完成后，本发明的一较佳实施例将无法辨识的字元列示于屏幕，使用者可利用键盘60将正确字元取代被拒认及误认的字元。如下述讨论，无法辨识的栏位与表单则显示于屏幕上做人工更正。
为使本发明的OCR系统“阅读”表单内的文字，较佳的作法是系统先“查询”表单上哪些区域有待阅读文字，这些文字是以何种型式(例如，印刷或手写)出现，以及这些文字是什么。由于不同的栏位位置及字元性质已在表单识别前即为OCR装置所查询，数据抽取将较快，亦较正确，而字元抽取动作亦更有效率。比较预期的及真实的表单定位符号的位置后，表单倾斜及不同栏位的边界即可精确地探知。
如此使得OCR装置可将含有需被抽取及辨识文字的重要栏位自整张表单中独立出来。如下所述，辨识及后处理参数也已预设好，使处理效率提高。换句话说，字元性质(如印刷/手写及中文/字母数字)为辨识处理而预设，栏位描述(名字、性别、地址等)为字词后处理而预设。
表单查询程序图4是表单查询的流程图70，首先一个空白表单先经扫描(步骤72)，表单图像显示在电脑屏幕上。操作员决定定义其中的一个栏位(例如，“被保险人姓名”)，使用周边装置，例如鼠标器，操作员拉出一个包含辨识栏位的矩型区域。OCR软件探知该栏位X及Y方向的栏位边界(步骤74)，如此填写字元格子的位置即可自动标示出。
接着定义一个性质(或栏位描述，步骤76)，此性质指出栏位内数据的类别。例如，第一个栏位指出内含“被保险人姓名”，第二个栏位指出内含“病人姓名”(见图1及图2)。当栏位定义好后，接着要定义内含的字元属性(步骤78)，亦即定义栏内字元应为印刷或手写英文字或者印刷或手写中文字。例如“病人姓名”栏位内应填写手写英文字元。
当栏位边界、性质、属性都定义好后，定义每一个暗线“格子”34(见图2)为字元填写处(步骤80)。如此，本装置即可查询每个手写字元的预期位置。
接着，操作员定义定位符号36的位置(步骤82)，在本发明的较佳实施例中，定位符号36必须位于表单的四角，且数据应采用横向填写。接着再定义定位符号36的性质(步骤84)。
此查询过程将可使OCR50自填好的表单内自动提取数据。如此可加速随后的字元抽取过程，并增加对倾斜角度的容许偏差。
当所有空白表单内的数据都查询好后，本系统即已准确好阅读填有数据的表单，此必须经过字元抽取与字元辨识两步骤。其中字元抽取数据包括三部分栏位抽取、行抽取与字元抽取。字元抽取再分为印刷字元抽取(包括中文与字母数字)以及手写字元抽取(包括中文与字母数字)。
数据提取图5为本发明的较佳实施的识别工作流程图，其中系统100分为三部分扫描部分102、文字识别部分104及辨识后处理部分106。
其工作流程为首先，填好的表单置于纸张传送系统51，经过OCR扫描器52(如图3)，完成扫描110，此扫描图像再与已查寻且储存在存储器112的空白表单数据做比较。
数据抽取可分为三个步骤。首先，先找到包含抽取数据的栏位位置，并考虑任何可能的偏移。其次决定栏位中的文字行位置，此即文字行抽取；最后，抽取文字行中字元的位置，此即字元抽取。字元抽取又可分为两个步骤，即印刷字元抽取与手写字元抽取。
1、栏位抽取抽取模组114抽取欲辨认栏位并校正栏位座标。其步骤如下首先决定表单的偏移与倾斜，本模组可容许倾斜(最多5度)及偏移(扫描时表单移动)。此两种变异受送纸系统51的机械限制。定位符号36的位置决定了表单20的边界，(例如，本实施例中，定位符号36指出表单20的边界(例如本实施例中，定位符号36指出表单的四角)并且经由比较输入表单定位符号的位置与空白表单上“查寻”得到的定位符号位置，而得知输入表单的倾斜与偏移量。
接着，本模组参考栏位数据库112所记录的文字性质决定其预期位置，并抽取出栏位。由于已知表单的倾斜与偏移量，欲辨识栏位的位置皆可经由相对于空白表单计算而得。
2、文字行抽取接着，文字行抽取及行座标校正以下列方式执行。模组114查询字词性质数据库112来决定栏内文字行的位置，并抽取文字行的位置。如果栏位内有文字行，则进行水平投射，其描述如下首先用水平扫描线决定落在栏内同一行的字元的黑点，这些水平线结合起来形成累积投影量，文字行的边界可由水平线中黑点的位置决定。接着，由查询而得的栏位原始位置被用来校正文字行的位置，亦即利用“查询”得到的原始地址以找出可分割两重叠的输入文字行的最佳水平分割线。当文字行内的字元串超过查询文字行的上下边界时，栏位即可安全地分割成数行，此时可得到正确的文字行座标。
3、字元抽取接下来，字元抽取及座标更正执行如下步骤利用行内字元图像的垂直投影来抽取行内字元，即利用垂直扫描线字元形成垂直投影量。投影量的最小值发生处即为字元的边界位置。文字行数据库栏位112可用来决定字元是印刷体或手写。查询空白表单时字元的预期位置可用以调整欲辨识栏位内字元的抽取座标，如此使字元抽取更有效。文字行内字元顺序依水平座标值，亦即其X-座标排列。
(i)印刷字元抽取印刷字元抽取模组116抽取文字性质数据库112所指示包含印刷数据的栏位数据，它参考112以预知该字元为中文或英文字。中文印刷数据送入印刷中文辨识模组118，字母数字印刷数据送入印刷字母数字辨识模组120。
接着，执行印刷字元识别。已知许多光学识别装置，如图5所示，包含模组118、120。(例如，参见Mc Graw Hill Encyclopediaof Electronics and Computers，pp.109-111(Mc GRAW-Hill1984))。识别印刷字元的光学识别器通常采用模版比较方法识别字元。然而，印刷字元识别装置118、120抽取不同的特征并利用判断数字辨识专家数据库122，而印刷中文识别装置116参考了印刷中文辨识专家数据库124。
(ii)手写字元抽取手写字元抽取模组130抽取文字行性质数据库112所指示含手写数据的栏位数据，它参考112以预知该手写栏位内含中文或英文数字数据。中文手写数据送入手写中文辨识模组132，字母数字手写数据送入手写字母数字辨识模组134。
接着执行手写字元辨识。抽取出的手写中文字元与至少一个手写中文字元辨识专家136比较，手写字母数字字元亦与至少一个手写字母数字字元辨识专家138比较。有两种较佳方式执行辨识，其一是采用统计辨识专家，将抽取字元的特征抽取出，并与储存数据库内特征比较，选出最接近者作为辨识结果。
第二种方法是利用几个辨识专家“投票”选出正确的辨识结果。在本发明的较佳实施例中采用四个辨识专家，其一为上述统计专家；其二为结构性的松驰对比辨识专家；其三为结构性的周边对比辨识专家；其四为软件模拟的类神经网络。松驰对比辨识专家将字元图像骨干化并抽取结构性的骨干特征，包括笔段数目、笔段形状(凸状或凹状，方向等)、笔段长度及位置、转折点等。松驰比对分类器则用以区分未知字元。
周边辨识专家抽取字元图像的周边并抽取结构性的特征，包括位置、数目、特征点种类。这些特征包括如字元中空洞的数目及位置等布局信息；动态对比及布局分类器被用来区分未知字元。
系统网路辨识专家抽取一般的统计特征，并采用向后扩展的系统网路区分未知字元。
其余方法亦可用来辨识手写字元。
4、辨识后处理辨识后处理包括有二个步骤即字词后处理与屏幕更正。字词后处理模组140包括地址后处理与栏位检查。
1、字词后处理字词后处理利用词库交叉检查字元辨识正确性。例如，词库可包括某一地理区域内的城市、乡镇、道路及分段的名称。辨识产生的字词会与词库对比以决定是否辨识正确。另外，邮递区号亦可用以交叉检查。
栏位检查检验每个字元的值域范围，以及栏位内的字元是否符合设定的代数关系。
2、屏幕更正图6是一个较佳的屏幕更正方法200的流程图。扫描的表单图像被送入表单辨识系统(步骤202)，表单被归入“完全正确”、“人工更正”、或“拒绝接受”三类之一(步骤204)，完全正确的表单图像先存入数据库内(步骤222)。
需要人工更正的表单在处理时，先决定是否有拒认字元(步骤206)，拒认字元需由人工更正(步骤208)。
执行字元(或栏位)更正时，屏幕更正器144将拒认字元(或栏位)显示在屏幕58上(见图3)，如图7所示。拒认字元图象显示在屏幕上供更正，这些字元属于同一批次，但可来自不同的表单。如此使得更正时可一次处理许多表单，因此更可提高效率。
当表单需人工更正，但并无拒认字元存在时，表示栏位内的字元串未通过栏位后处理检查(步骤210)，此时即需执行栏位更正(步骤214)。
图8为执行栏位更正时的屏幕显示例。如图8所示，在本发明的较佳实施例中，监视图58采用分割屏幕方式，将栏位图像显示在一侧(此例中为屏幕上半部)将辨识结果显示在另一侧(此例中为屏幕下半部)。使用者可参考屏幕上的栏位图像检查并更正辨识错误或拒认的字元，操作人员可利用例如键盘的输入装置输入正确字元。
若表单通过栏位检查，它也存入数据库(步骤222)，但若表单未通过栏位检查(即步骤216)则整张表单拒认，并执行整张表单人工录入(步骤218)，亦即此时表单内所有的数据由人工重新打字输入。如果更正后的表单可接受(亦即所有错误已人工更正完)，表单数据即储存于数据库(步骤222)否则即整张表单拒认(步骤224)。
最后，辨识产生的数据被送至格式转换模组146将其转换成常用的数据库格式。此格式转换后的数据与表单图像可以储存、查询、排序或做其他用途。
在更正拒认字元时，采用工作量最小的步骤先执行的原则，亦即先检视并更正字元而非栏位或整张表单。此外，字元更正步骤可提高表单通过栏位检查及整张检查的可能性，如此能同时有效地处理许多的表单。
更正作业流程说明更正作业是将部分字元、栏位或整张表单的图像显在屏幕上，由操作人员以目视判断有疑问之处后，利用键盘输入该字元、栏位或整张表单内的文字数据，以辅助人工输入。电脑基本上提供下述功能1、挑选可疑的数据，其中包括字元辨识无法肯定辨认的字元(即所谓拒认)；或是虽然整个栏位都可以辨认，但利用表单检查时所得该栏位的后处理知识检查该栏位的辨识结果，却不符合该后处理知识，此时该栏位图像即被挑出；此外，如果因为表单倾斜或书写者字迹太撩草，至使表单内超过一定比例的字元或栏位无法辨识时(根据表单检查结果可知该类表单应有多少字元及多少栏位)则该整张表单图像即会被挑出。上述挑出的目标的动作(或判断哪些数据被挑出的动作)是由电脑的CPU辨认后储存在硬盘中的图像与文字数据混合的一批表单中间档逐字元、逐栏位进行监视及运算后，将有疑问的字元或栏位，甚至整张表单图像的相关数据(序号、图像边界坐标等)储存在动态随机存储器内，以供后续图像显示利用；2、显示可疑的数据当数据挑选完毕后，CPU即执行对储存在硬件中的表单中间档进行监视，并根据储存在动态随机存储器中的上述相关数据，将物件(包括字元、栏位或整张图像)显示在屏幕上。考虑到效率问题，因此显示的顺序是由字元至栏位至整张表单图像；3、人工更正上述显示动作，除在屏幕上显示图象外，并在图像下显示输入文字区，以提供操作人员将该显示图像所对应的标准答案，经由键盘输入电脑。CPU于接收到该输入数据后，即执行栏位后处理检查，以判定数据的正确性。例如当所有该批表单中的拒认字元均输入完毕后，CPU执行后处理检查，将不符者的序号再录入动态随机存储器中，以供后续的图像显示与更正之用。
经由上述三项基本功能，遵循图1的流程，即可得到一高效率的屏幕更正，同时，也会对应每张表单在硬盘中产生每张表单内容的纯文字档。
本发明的效果包括操作的方便性以及字元抽取时间减少。字元辨识速度增加，逐级式人工更正过程更是更正扫描辨识后的表单的一甚有效的方法。此外，能在屏幕上更正辨识结果及有效地抽取及储存数据。如此改进了输入、阅读、储存大量印刷、手写表单数据的能力。
权利要求
1.一种中英文表单的识别方法，其特征在于，包括表单查询、光学文字识别及字词后处理步骤，表单查询，包括如下步骤(a)定义含有数据信息栏位的边界；(b)定义该栏位内数据信息性质；(c)定义该栏位内字元的属性；及(d)定义该栏位内字元预期填入的位置。
2.根据权利要求1所述的方法，其特征在于，其还包括定义数个定位符号的位置。
3.根据权利要求1所述的方法，其特处在于，其还包括定义栏位边界前，用光学扫描器扫描一张空白表单。
4.根据权利要求1所述的方法，其特征在于，步骤(a)-(d)对数个内含数据的栏位重覆实施。
5.根据权利要求1所述的方法，其特征在于在定义数据信息性质的步骤中，还包括定义数据信息的形式。
6.根据权利要求1所述的方法，其特征在于，在定义属性的步骤中，还包括定义栏内包含印刷或手写的字元。
7.根据权利要权利所述的方法，其特征在于，所述光学文字识别步骤，包括从表单电子图像中抽取字之步骤，其包括(a)决定该电子图像是否倾斜或位移；(b)自该电子图像中抽取一栏位；(c)校正该抽取栏位的座标；(d)自校正后的栏位中抽取至少一个文字行；(e)校正该文字行的座标；(f)自校正的文字行中抽取至少一个字元；及(g)校正抽取字元的座标。
8.根据权利要求7所述的方法，其特征在于，在所述抽取栏位之前，定义栏位。
9.根据权利要求8所述的方法，其特征在于，在所述定义栏位步骤，包括下列步骤(a)决定所述栏位的边界；(b)决定栏位中字元预期出现的位置；(c)选择栏位的性质；及(d)选择栏位的标记。
10.根据权利要求7所述的方法，其特征在于，所述决定表单是否倾斜或偏移的步骤，包括下列步骤(a)决定该电子图像的边界；及(b)根据电子图像的边界，决定待抽取栏位的位置。
11.根据权利要求7所述的方法，其特征在于，所述校正抽取栏位座标的步骤，包括将倾斜与偏移投影在抽取栏位的步骤。
12.根据权利要求7所述的方法，其特征在于，所述抽取至少一个文字行的步骤中还包括下列步骤(a)参考一数据库以决定文字行的位置；以及(b)利用抽取栏位内字元的水平投影与其行位置，调整栏位内文字行的位置。
13.根据权利要求7所述的方法，其特征在于，所述校正抽取文字行的座标步骤，还包括下列步骤(a)将字元的水平投影投射于抽取栏位及行位置，以调整栏位内的文字行；(b)决定文字行中的字元是否超过所述抽取栏位的底部或项部；及(c)若发现该文字行中的字元超过所述抽取栏位的底部或项部，则将所述文字行再产生文字行。
14.根据权利要求7所述的方法，其特征在于，所述字元抽取方法步骤还包括下列步骤(a)参考一个数据库决定字元为印刷或手写；(b)抽取字元；(c)将抽取的手写字元送入手写字元辨识模组；及(d)将抽出的印刷字元送入印刷字元辨识模组。
15.根据权利要求14所述的方法，其特征在于，所述抽取字元的步骤，还包括(a)决定一列字元的垂直投影；及(b)分隔各字元。
16.根据权利要求14所述的方法，其特征在于，所述传送抽取的手写字元步骤还包括(a)查询一数据库以决定手写字元预期为字母数字或中文；(b)将手写字母数字元传送至手写字母数字字元辨识模组；及(c)将手写中文传送至手写中文字元辨识模组。
17.根据权利要求7所述的方法，其特征在于，所述校正抽取字元座标步骤还包括依水平座标排列字元步骤。
18.根据权利要求7所述的方法，其特征在于，还包括下列步骤(a)对抽取字元执行辨识程序；及(b)对辨识过的字元进行辨识后处理程序。
19.根据权利要求1所述的方法，其特征在于，所述字词后处理步骤，包括(a)在监视器上显示辨识处理过的字元；及(b)如有需要，更正任何无法辨识或认识的字元。
20.一种验证光学扫描数据信息正确性的方法，其特征在于，包括下列步骤(a)将辨识后的表单信息区分为；(i)完全正确；(ii)人工更正；及(iii)整张拒认；(b)储存完全正确的表单信息；(c)在需要人工更正的表单信息中，决定是否有拒认字元；(d)如有拒认字元，人工更正所述拒认字元；(e)进行第一次栏位后处理检查；(f)如果更正后的字元所属栏位通过后处理检查，则储存这些字元信息；(g)对未通过第一次栏位后处理检查且栏内无拒认字元的栏位进行栏位更正；(h)对更正后的栏位信息进行第二次栏位后处理检查；(i)如果更正后的栏位信息通过第二次栏位后处理检查，则储存该栏位信息；(j)对未通过第二次栏位后处理检查且被归为整张拒认的表单执行整张更正；(k)对整张更正的表单信息进行系统后处理检查；(l)储存通过此第三个系统后处理检查的表单信息，及(m)整张拒绝接受未能通过第三个系统后处理检查的表单信息。
21.根据权利要求20所述的方法，其特征在于，所述扫描数据包括多张表单，而人工更正拒认字元步骤中更正的字元来自多张表单。
22.根据权利要求20所述的方法，其特征在于，所述人工更正拒认字元步骤还包括下列步骤(a)在监视器上的第一个部分显示拒认字元图像；及(b)在监视器的第二个部分提供可输入正确字元的位置。
23.一个人工更正光学扫描表单的方法，其特征在于，包括将人工更正程序依工作复杂度排列的步骤，在此步骤中较简单的更正程序安排在复杂度较高的更正程序之前。
24.根据权利要求23所述的方法，其特征在于，所述许多栏位的多张表单以下列的步骤扫描及人工更正；(a)人工更正未通过第一次栏位后处理检查的表单栏位内的字元；(b)人工更正未通过第二次栏处理检查的表单栏位数据；及(c)整张更正未通过第三个栏位后处理检查的表单数据。
全文摘要
一种中英文表单的识别系统及识别方法；识别系统包括印刷数字识别模组、手写字母数字识别模组、印刷中文识别模组及手写中文识别模组。识别方法包括表单查询，抽取字元验证光学扫描数据以及人工更正步骤；其中表单查询包括定义含有数据的栏位的边界；定义栏位信息的性质、定义栏位内字元的属性及字符填入的位置；抽取字符验证光学扫描数据的步骤包括自图像中抽取一栏位、校正栏位坐标，从该栏位中抽取至少一行文字行，校正文字行坐标，并从文字行中抽取一字元，校正其坐标。
文档编号G06K9/00GK1153358SQ9610661
公开日1997年7月2日申请日期1996年6月7日优先权日1996年6月7日
发明者徐英士, 陈谋琰, 林文雯, 屠乐梃, 周开祥申请人:财团法人工业技术研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐英士;陈谋琰;林文雯;屠乐**;周开祥
技术所有人：财团法人工业技术研究院
我是此专利的发明人

上一篇：文字辨识系统数据库的组建方法
上一篇：实时手绘图像的图形生成方法及其系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。