信息处理方法和设备的制作方法

文档序号:6409116阅读:117来源:国知局
专利名称:信息处理方法和设备的制作方法
技术领域
本发明涉及一种信息处理方法和设备,它利用一种字符识别功能,例如OCR(光学字符识别)功能或类似功能,把输入图象信息转换成一种文本。
本发明还涉及另一种信息处理方法和设备,它能够从一种文本形成一个检索数据库,该文本是利用一种字符识别功能,例如OCR功能或类似的功能,通过转换输入图象信号而得到的;它还能够检索所需要的数据。
至今,当一个输入图象被一种OCR功能或类似功能识别并被转换成一种文本时,对于一个其中仅得出低相似性候选字符的输入字符,作为一种错误识别用的对策,就把相似性低的事实通知操作者,他可判断该候选字是正确还是错误。当它为错误时,就敦促操作者手工校正该错误的字符,并输入一个正确的字符。
然而,根据这样一种方法,操作者必须不仅输入一个要转换成文本的图象,而且还要进行校正操作,因此存在着操作者感觉有负担的缺点。
还有一种方法,藉此不仅可输出字符识别的结果,还可把由该字符识别得出的一个候选字符对照一本字典或一个知识库,从而校正一个被错误地识别的字符,而不必求助于操作者。
然而,上述方法也存在一些缺点该字典或知识库必须存入校正过程用的一个存储器,并且这样一种使用它们的校正过程是复杂的,所花时间长,成为该设备的负担。
本发明的一个目的在于消除操作者或设备的负担,用于把一个在OCR操作或类似操作的字符识别过程中可能产生的被错误地识别的字符校正成一个正确的字符;并使它能够有效地用于其他过程。
本发明的另一个目的在于形成一个能够高质量地检索的数据库,而不必执行一种额外负担的过程,例如对在OCR操作或类似操作的字符识别过程中可能发生的被错误地识别的字符进行校正的过程。


图1是一个OCR处理用的流程图;图2是一个用于资料检索的检索文件形成过程的流程图;图3是一个资料检索处理用的流程图;图4是一个实施例中信息处理设备的结构方块图;图5是一个在没有事先形成检索文件的情况下检索处理用的流程图。
现在在下文详细描述本发明的一个实施例。
图4是一个本实施例中处理系统的构造方块图。
一个图象扫描器1是对用作识别目标的资料的初始图象进行光学读出用的图象输入装置。输入图象的方法不限于这样一种用图象扫描器或类似装置对图象进行光学读出的方法,而是也可能对用数字化仪、鼠标器或能够输入坐标系的类似装置这样的输入装置输入的手写字符图象进行输入。一个键盘/鼠标器5是用于操作者输入各种命令或指令信息的输入装置。该键盘或鼠标器还输入一个检索字和一个检索过程中的检索条件。一个显示器6是象CRT(阴极射线管)或液晶显示器之类的显示装置,用于显示从键盘/鼠标器5输入的信息、从图象扫描器1或类似装置输入的图象信息、该过程的进展、和该过程的结果。一个外存储器4是存储装置,用于存储从图象扫描器输入的图象数据、文本信息和检索文件。一个计算机10通过一个CPU(中央处理机)10—1的控制进行各种信息处理。将在下文描述的流程图所示各种信息处理的控制程序,已被存入一个存储器10—2。CPU10—1按照该控制程序执行和控制各种处理。一个用于字符识别的字典也已存入存储器10—2。一个按照需要由外存储装置或类似装置读出的控制程序,也能作为存入存储器10—2的控制程序而被使用。在本实施例中,提供一个OCR处理器2和一个资料检索器3,以执行由计算机10执行的主要处理,现在解释本实施例。字符识别方法不限于OCR处理,只要一个字符是由数字化仪、鼠标器或类似装置输入的笔画组成的手写字符,就足以提供一种处理单元,以便进行一种适合这样一个字符的在线字符识别。
一种把用图象扫描器1或类似装置输入的初始图象的图象数据转换成文本信息的处理,示于图1流程图中,现在予以描述。
把存入外存储器4、由图象扫描器1或类似装置输入的图象数据,输入到OCR处理器2(S1)中。作一种检验,看字符数据是否包含于输入图象数据中(S2)。如果是,就提取一个字符的图象数据(S3)。把所提取的一个字符对照字典,从此得出多个用作识别结果的字符代码,和一个作为与每个字符代码所指示的字典数据的相似性的似然值(likehood)LH(S4)。在作为S4中识别结果得出的字符代码中,使最大似然值LHMAX对照一个存入存储器10—2的预定有效似然性判断阈值Th1(S5)。当似然值等于或大于Th1时,就判定该识别结果是正确的,并且把这样一个在多个字符代码中的字符代码作为识别结果而输出(S6)。当在S5中似然值小于Th1时,为了存储用于一个字符代码图象数据的多个识别结果,一个定界符就作为标识(下文叫作ID)信息而输出(S7)。在S8中,处理流程根据操作者指定的方式,或由系统或S4中所得似然值设定的方式,进到S9或S11。在S9,在S4中所得的多个似然值中,一个对应于大于存储器10—2中所存的一个预定低识别似然性判断阈值Th2的似然值的字符代码,作为一个相应于字符代码图象数据的结果而输出。在S11,在S4中得出的多个字符代码中,最大识别候选者数目Nmax的字符代码,作为相应于一个字符代码图象数据的结果,按照来自有最大似然性的字符代码的顺序,相继地输出的。当相应于一个字符代码图象数据的结果被输出时,就输出一个定界符,作为指示字符结果结束的ID信息(S10)。
当一个字符代码图象数据的识别和其结果的输出被完成时,重复S3至S11中的处理,同时更新用作目标的图象数据,直至在S2中判定不包含剩余的字符数据为止。
在S6至S11中输出的这种代码信息是作为文本信息相继地存入外存储器中的。
通过这样的处理,可避免这样一种状况,即识别结果在OCR识别似然值低且在识别中存在不可置信的情况下缩为一个;能够选择多个相应于识别似然性的最佳识别候选者;并且能够有效地储存和使用有效识别候选者信息,而不必放弃它。在指令形成一个检索文件以便由上述处理储存的文本信息能够用于尔后检索的情况下,一种检索文件形成过程示于图2流程图中,且将予以描述。
在指令形成用于外存储器4中储存的文本信息的检索文件的情况下,在指定的文本数据被寄存于检索文件时索引用的一种字符键被指定(S21)。把指定的文本信息从外存储器4装入资料检索器3(S22)。从装入的文本信息读出一个字符代码的数据(S24)。当判定该字符代码表示一个定界符时(S25),直到下一个定界符的多个候选者与到此为止的字符串相结合,从而得出多个字符键。当在S25中判定字符代码不表示一个定界符时,就把这样一个字符代码在其终端加到字符键的字符串中(S27)。重复进行S25至S27中的处理,直至在S28中判字符键被完成为止。
当在S28中判定字符键被完成时,把形成的字符键(单个或多个)加到外存储器4中的检索文件中的索引信息中(S29)。
重复进行S24至S29中的处理,直至在S23中处理完全部字符数据为止,从而完成该装入文本信息的检索文件的形成。
通过这样一些处理,使多个识别候选者字符结合于那些在来自通过识别输入图象得出的文本信息的字符前后的字符,并且按照要使用的那种索引字符键发展出字符串,从而预先形成一个索引。因此,可能减少由于错误识别而引起的检索漏失。
通过使用按上述方法形成的检索文件而执行的检索处理,示于图3的流程图中,现在予以描述。
按照检索处理指令输入一个检索字(S31)。把该输入检索字分析成适合于检索处理的检索键(S32)。使该检索键比较外存储器4中的检索文件(S33)。当找到一个与该检索键匹配的索引时,相应于这样一个索引的资料地址信息就返回到应用侧(S34)。
由资料地址信息规定的且存在外存储器4中的图象数据,是作为检索结果显示于显示器6的。
图5的流程图说明这样一些处理使字符结合于那些在来自文本信息的识别候选者字符组前后的字符,并且每当指令进行检索处理时使其发展,从而比较所输入的检索字,而不必预先形成检索文件。
在指令要形成用于在外存储器4中存储的文本信息的检索文件的情况下,一种在所指令文本数据被寄存于检索文件时索引用的字符键被指定(S41),一个检索字被输入(S42)。所输入的检索字被分析成适合于检索处理用的检索键(S43)。把所指令的文本信息从外存储器4装入资料检索器3(S44)。从所装入的文本信息中读出一个字符的数据(S46)。当判字该字符代码表示定界符时(S47),多个直到下一个定界符的候选者便同到此为止的字符串相结合,从而发展出多个字符键。当在S47中判定不包含定界符时,就把这样一个字符在其终端加到字符键的字符串中(S49)。重复进行S47到S49中的处理,直到在S50中判定字符键被完成为止。
当在S50中判定已完成字符键时,所形成的字符键(单个或多个)和在S43中得出的检索键被比较(S51)。当它们相同时(S52),一个其中作为检索结果而储存的资料图象数据的资料地址被输出(S53)。
至于数据库,通过类似于上述处理的处理,还形成多个记录,因此通过使用该数据库,可能以小的漏失率进行检索。
现在说明一个具体的实例。
现在假定,在一份资料中包含一个如“DATA”的句子。
现在假定,当上述句子由图象扫描器1输入,且在初始识别步骤S4中由OCR处理器2识别“T”时,尽管事实上其他字符的识别似然值都等于或大于Th1,但这样一个字符的识别似然值小于Th1。还假定,识别候选者具有类似的小于Th2的似然值。结果,在S8中选择S11的处理,并且按照来自具有高似然值的候选者的顺序依次地输出诸Nmax候选者。
假定因此而输出4个候选者“I”、“T”、“Y”和“J”。
OCR处理器2按下述格式描述上述多个候选者字符。在这个实例中,当要在S7和S10中输出的定界符假定为☆时,得出下述格式。
☆〔候选者数〕〔候选者字符1〕〔候选者字符2〕〔候选者字符3〕…☆因此,在实例中相应于“T”输出上述4个候选者,并且在S5中判定,其他字符的似然值都大于Th1。在有着最大似然值的一个字符在S6中作为一个候选字符而被输出的情况下,“DATA”表达式如下所示。
“DA☆4ITYJ☆A”这样一个字符代码组是作为文本信息而存入外存储器的。
另一方面,资料检索器3解释该格式,并按图2流程形成一个检索文件。
DAIADATADAYADAJA因此,当从键盘输入象“DATA”这样的检索字并且资料检索器3按照该检索字执行资料检索处理时,还能检索该资料。
在本实施例中,虽然解释了用于资料检索的例子,但本发明还能够用于使用数据库的检索。
本发明也能用于通过OCR析取资料关键字,页键字,或类似字。
此外,对于借助OMR(光标记阅读器)或条形码的光阅读装置的部分信息的识别似然性为低的情况,也能通过一种类似的方法应用本发明。
根据如上所述的本发明,可避免在OCR识别似然值低和判字该识别没有把握的情况下,识别候选者被缩减为一个的状况;可选择相应于识别似然值的多个最佳识别候选者;并可储存有效识别候选者信息,加以有效利用,而不必放弃它。
如上所述,根据本发明,可免除识别结果的手工校正操作,可在操作者不介入的情况下进行通过OCR的从图象输入到图象数据与文本数据储存的处理,可减轻设备的处理负担,可提高处理速度,并可提供便宜的设备。
如上所述,根据本发明,在存在用于一个字符的一个输入图象的多个识别候选者的情况下,诸字符结合于那些在上述字符前后的字符,并且它们被发展,且多个索引被形成;因此能够减少由于错误识别引起的检索漏失。
权利要求
1.一种信息处理方法,包括下述步骤储存图象信息;识别所述储存图象信息的字符和输出字符代码及其似然值;按照所述输出的似然值来判定用于一个字符图象信息的将被输出的候选字符的数;和寄存一个包括候选字符的所述判字数的候选者的识别结果。
2.根据权利要求1所述的方法,其中所述的候选字符数是按照通过把所述输出似然值同某一阈值对照而得出的结果加以判定的。
3.根据权利要求1所述的方法,其中用于一个字符的所述图象信息的要被输出的信息包括候选字符的所述判定数和所述数的候选字符。
4.根据权利要求1所述的方法,其中用于一个字符的所述图象信息的要被输出的信息用ID信息区别于其他的信息,该ID信息能够鉴别相应于一个字符的图象信息的信息。
5.根据权利要求1所述的方法,其中在为一个字符的所述图象信息而输出的候选字符数是多个的情况下,所述的多个候选字符与一些相继的字符相结合,从而形成多个字符串。
6.根据权利要求5所述的方法,其中所述形成的字符串都被寄存。
7.根据权利要求6所述的方法,其中所述寄存的字符串和一个指定检索字被比较,并且根据同所述检索字匹配的字符串而储存的图象信息被调出。
8.根据权利要求1所述的方法,其中所述储存的图象信息是用一个扫描器输入的图象信息。
9.根据权利要求1所述的方法,其中所述储存的图象信息是用一个坐标输入装置输入的图象信息。
10.根据权利要求7所述的方法,其中所述调出的图象信息是用一个打印机输出的。
11.根据权利要求7所述的方法,其中所述调出的图象信息是用显示装置输出的。
12.根据权利要求1所述的方法,其中所述的字符是用一种光学字符识别方法识别的。
13.根据权利要求1所述的方法,其中所述的字符是用一种在线字符识别方法识别的。
14.一种信息处理设备,包括用于储存图象信息的储存装置;用于识别在所述储存装置中储存的图象信息的字符并用于输出字符代码及其似然值的字符识别装置;用于根据由所述字符识别装置输出的似然值判定为一个字符的图象信息的将被输出的候选字符的数的候选字符数判定装置;和用于寄存识别结果的寄存装置,该结果包括由所述候选字符数判定装置判定的候选字符数候选者。
15.根据权利要求14所述的设备,其中所述候选字符数判定装置,利用通过比较所述输出的似然值和阈值所得的结果,判定候选字符数。
16.根据权利要求14所述的设备,其中为一个字符的所述图象信息而将被输出的信息包括候选字符的所述判定数和所述数的候选字符。
17.根据权利要求14所述的设备,其中为一个字符的所述图象信息而将被输出的信息是由ID信息同其他信息区别开的信息,所述ID信息能够鉴定它是相应于一个字符的图象信息的信息。
18.根据权利要求14所述的设备,其中在为一个字符的所述图象信息而输出的候选字符数是多个的情况下,通过把所述多个候选字符与一些相继的字符相结合,形成多个字符串。
19.根据权利要求18所述的设备,其中所述形成的字符串通过所述寄存装置寄存。
20.根据权利要求19所述的设备,还包括用于指定一个检索字的装置;用于比较在所述寄存装置中寄存的字符串和所述指定的检索字的比较装置;对相应于匹配该检索字的字符串而寄存的图象信息进行调出用的装置。
21.根据权利要求14所述的设备,还包括一个输入图象信息用的扫描器,并且其中储存于所述储存装置的图象信息是由所述扫描器输入的图象信息。
22.根据权利要求14所述的设备,还有坐标输入装置,并且其中所述储存的图象信息是由所述坐标输入设备输入的图象信息。
23.根据权利要求20所述的设备,还有一个输出图象信息用的打印机,并且其中所述调出的图象信息由所述打印机输出。
24.根据权利要求20所述的设备,还包括用于输出图象信息的显示装置,并且其中所述调出的图象信息由所述显示装置输出。
25.根据权利要求14所述的设备,其中所述字符的识别是用一种光学字符识别方法实现的。
26.根据权利要求14所述的设备,其中所述字符的识别是用一种在线字符识别方法进行的。
27.一种信息处理方法,包括下述步骤;输入作为识别图象信息的结果的候选字符串;形成字,这些字能够相对于每个候选字符按照所述识别结果从候选字符形成;和寄存每个所述相应于所述图象信息的所形成的字。
28.根据权利要求27所述的方法,其中在多个候选字符是从一个字符的图象信息得到的情况下,要形成的所述字词都是根据每个候选字符均是识别结果这一假定下形成的。
29.根据权利要求27所述的方法,其中所述的图象信息是从一个扫描器输入的图象信息。
30.根据权利要求27所述的方法,其中所述的图象信息是用一个坐标输入设备输入的图象信息。
31.根据权利要求27所述的方法,其中一个输入的检索字与所述寄存的字相比较,并且同所匹配的字相应的图象信息被调出。
32.根据权利要求31所述的方法,其中所述调出的图象信息用一个打印机输出。
33.根据权利要求31所述的方法,其中所述调出的图象信息用显示装置输出。
34.根据权利要求27所述的方法,其中所述图象信息用一种光学字符识别方法识别。
35.根据权利要求27所述的方法,其中所述图象信息用一种在线字符识别方法识别。
36.一种信息处理设备包括输入装置,用于输入作为识别图象信息结果的候选字符串;候选字形成装置,用于形成一些能够按照所述识别结果相对于每个候选字符从候选字符形成的字;和寄存装置,用于寄存同所述图象信息相应的每个所述形成的字。
37.根据权利要求36所述的设备,其中,在多个候选字符是从一个字符的图象信息得到的情况下,所述候选字形成装置通过假定每个候选字符为识别结果来形成。
38.根据权利要求36所述的设备,还有一个扫描器,并且其中所述的图象信息由所述扫描器输入。
39.根据权利要求36所述的设备,还包括坐标输入装置,并且其中所述图象信息由所述坐标输入装置输入。
40.根据权利要求36所述的设备,还有用于输入一个检索字的装置;比较装置,用于把一个输入的检索字同所述寄存的字进行比较;和用于调出图象信息的装置,该图象信息相应于匹配的字。
41.根据权利要求40所述的设备,还有一个打印器,并且其中所述调出的图象信息由所述打印器输出。
42.根据权利要求40所述的设备,还有显示装置,并且其中所述调出的图象信息由所述显示装置输出。
43.根据权利要求36所述的设备,其中所述的图象信息用一种光学字符识别方法识别。
44.根据权利要求36所述的设备,其中所述的图象信息用一种在线字符识别方法识别。
全文摘要
当由OCR识别的文本被寄存且这些文本被一个检索字检索时,可消除一种状况,即在用OCR识别时依靠错误识别不能进行检索的状况。本发明之目的在于实现这样一种处理不因上述状况而把负担加于操作者或设备。在此提供一种OCR处理器(2),用于识别储存的图像信息和输出识别的结果,同时按照似然度转换将作为识别结果而输出的候选字符数;和一种资料检索器(3),用于形成字符串以便从识别结果检索且作为检索文件而寄存。
文档编号G06K9/03GK1121605SQ9510705
公开日1996年5月1日 申请日期1995年6月16日 优先权日1994年6月16日
发明者椎山弘隆, 正木克己 申请人:佳能株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1