字符识别结果显示方法、字符识别系统及信息记录媒体的制作方法

文档序号:6412151阅读:196来源:国知局
专利名称:字符识别结果显示方法、字符识别系统及信息记录媒体的制作方法
技术领域
本发明涉及对从输入文档图象截出的字符图象进行字符识别处理并将获得的字符识别结果显示在画面上的字符识别结果显示方法、字符识别系统及信息记录媒体。
通常在字符识别系统中,用扫描器等读入原稿等文档,将其作为输入文档图象,然后从该输入文档图象截出字符图象,获得进行字符识别处理的字符识别结果。在这种系统中,为了使字符识别结果的确认、修正等工作容易进行,以往所知,例如特公平7-72903号所示,具有将所获得的字符识别结果及其原来的输入文档图象两者显示在画面上的功能。
更具体地说,如图1所示,在特公平7-72903号所示的字符识别装置中,将被双值化的输入文档图象和字符识别结果图象同时左右并列地显示在显示部上。即,在图1所示的例中,在显示部画面的左半部分显示输入文档图象,在显示部画面的右半部分显示与在左半部分显示的输入文档图象对应的字符识别结果图象,根据需要还可以上卷,以便使在左半部分显示的输入文档图象和在右半部分显示的字符识别结果图象互相对应。具体地说,在图1所示的状态下,如果将在左半部分显示的输入文档图象向上方卷动2行,则如图2所示,也能使在右半部分显示的字符识别结果图象与其连动而向上方卷动。
这样,在上述现有的字符识别装置中,输入文档图象和字符识别结果图象双方都能显示出来,通过与其中一方的图象对应地使另一方的图象上卷,操作者能在显示部的显示画面上进行字符识别结果和原稿的对比。
可是,在上述现有的字符识别系统中,在进行字符识别结果的确认、修正时,将字符识别结果及其原来的输入文档图象对应地显示在显示画面上,另外,能使它们互相连动地上卷,这样的图象存在看不清字符识别结果图象和输入文档图象的对应关系的问题。就是说,操作者在显示画面上将字符识别结果图象与输入文档图象进行对照时,每次都要强制视线左右进行大幅度地移动,增大了疲劳度,存在工作效率下降的问题。另外,进行字符识别结果的确认、修正时,操作者必须察看全部输入文档图象,特别是在进行大量的字符识别结果的确认、修正时,存在工作效率下降的问题。
本发明的目的在于提供一种在进行字符识别结果的确认、修正等工作时,能显著地提高工作效率的字符识别结果显示方法、字符识别系统及信息记录媒体。
为了达到上述目的,本发明的第1方面是一种对输入文档图象进行字符识别,将获得的字符识别结果的图象和输入文档图象显示在画面上,并判断字符的识别是否正确,当断定字符的识别有误时,修正成正确的字符用的字符识别结果显示方法,其特征在于从这里将成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示出来。
另外,本发明的第2方面是一种对给定的输入文档图象进行字符识别处理,将获得的字符识别结果显示在显示画面上的字符识别结果显示方法,其特征在于将显示字符识别结果时的基准线显示在显示画面上,在该基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果的字符串,在该基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果的字符串对应的输入文档图象的字符串,这时使成为现在的字符识别结果确认修正对象的字符识别结果的字符串和与其对应的输入文档图象的字符串互相夹着基准线相对地显示。
另外,本发明的第3方面是一种对给定的输入文档图象进行字符识别处理,将获得的字符识别结果显示在显示画面上的字符识别结果显示方法,其特征在于在字符识别处理中,与字符识别结果一起算出字符识别结果的准确度,将字符识别结果的字符组显示在显示画面上,在将光标显示在其中欲确认从这里起的字符识别结果的字符的字符图象上时,越过(跳过)准确度在给定的阈值以上的字符,使光标显示在准确度小于给定的阈值的字符的字符图象上。
另外,本发明的第4方面由输入文档图象的文档图象输入装置、对输入的文档图象进行字符识别的字符识别装置、以及显示字符识别的识别结果的图象和输入的文档图象的图象显示装置构成,其特征在于图象显示装置将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示出来。
另外,本发明的第5方面的特征在于备有输入文档图象的图象输入装置、对该输入的文档图象进行字符识别处理的字符识别处理装置、将该字符识别处理装置的字符识别结果显示在显示画面上的显示装置、以及在将该字符识别结果显示在显示装置上时进行显示控制的显示控制装置,显示控制装置将显示字符识别结果时的基准线显示在显示画面上,在该基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果的字符串,在该基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果的字符串对应的输入文档图象的字符串,这时使成为现在的字符识别结果确认修正对象的字符识别结果的字符串和与其对应的输入文档图象的字符串互相夹着基准线相对地显示。
另外,本发明的第6方面的特征在于在上述本发明的第5方面的字符识别系统中包括设定装置,用来在输入文档之前,预先根据按操作者的操作输入的输入文档图象是竖写文档还是横写文档,设定将基准线沿横向或沿纵向显示。
另外,本发明的第7方面的特征在于在上述本发明的第5方面的字符识别系统中还设有设定基准线的条件用的基准线设定装置,显示控制装置根据由基准线设定装置设定的基准线的条件来显示基准线。
另外,本发明的第8方面的特征在于在上述本发明的第7方面的字符识别系统中,基准线的条件是这样的,即根据输入文档图象是竖写文档还是横写文档,预先将基准线沿横向或沿纵向显示。
另外,本发明的第9方面的特征在于在上述本发明的第5方面的字符识别系统中,当显示字符识别结果图象的画面区域和显示输入文档图象的画面区域分别作为窗口显示时,基准线被作为双方窗框的重叠部分显示。
另外,本发明的第10方面的特征在于备有输入文档图象的图象输入装置、对该输入的文档图象进行字符识别处理的字符识别处理装置、将该字符识别处理装置的字符识别结果显示在显示画面上的显示装置、求出字符识别处理装置的字符识别结果的准确度的准确度计算装置、以及在将该字符识别结果显示在显示装置上时进行显示控制的显示控制装置,显示控制装置显示字符识别结果的字符组,在将光标显示在其中欲确认从这里起的字符识别结果的字符的字符图象上时,越过准确度在给定的阈值以上的字符,使光标显示在准确度小于给定阈值的字符的字符图象上。
另外,本发明的第11方面由输入文档图象的阶段a)、对输入的文档图象进行字符识别的阶段b)、以及显示字符识别的识别结果的图象和输入的文档图象的阶段c)构成。
其特征在于在图象显示阶段c)中,将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示出来。
另外,本发明的第12方面是计算机用的软件程序,用来对输入文档图象进行字符识别,将获得的字符识别结果的图象和输入文档图象显示在画面上,并判断字符的识别是否正确,当断定字符的识别有误时,修正成正确的字符,该计算机用的软件程序被记录在信息记录媒体上,其特征在于将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示出来。
另外,本发明的第13方面是计算机用的软件程序,用来执行输入文档图象的阶段a)、对输入的文档图象进行字符识别的阶段b)、以及显示字符识别的识别结果的图象和输入的文档图象的阶段c),该计算机用的软件程序被记录在信息记录媒体上,其特征在于在图象显示阶段c)中,将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示出来。
另外,本发明的第14方面的特征在于将计算机用的软件程序记录在信息记录媒体上,该计算机用的软件程序用来在显示字符识别结果时,将基准线显示在显示画面上,在该基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果的字符串,另外,在该基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果的字符串对应的输入文档图象的字符串,这时使成为现在的字符识别结果确认修正对象的字符识别结果的字符串和与其对应的输入文档图象的字符串互相夹着基准线相对地显示。
另外,本发明的第15方面的特征在于将计算机用的软件程序记录在信息记录媒体上,该计算机用的软件程序用来在字符识别处理中,与字符识别结果一起算出字符识别结果的准确度,将字符识别结果的字符组显示在显示画面上,在将光标显示在欲确认从这里起的字符识别结果的字符的字符图象上时,越过准确度在给定的阈值以上的字符,使光标显示在准确度小于给定的阈值的字符的字符图象上。
如果采用上述的本发明,则在进行字符识别结果的确认、修正等工作时,能显著地提高工作效率。
特别是在上述本发明的第1方面、第4方面、第11方面、第12方面及第13方面,将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示出来。另外,在上述本发明的第2方面、第5方面、第9方面及第14方面,将显示字符识别结果时的基准线显示在显示画面上,在该基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果的字符串,在该基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果的字符串对应的输入文档图象的字符串,这时使成为现在的字符识别结果确认修正对象的字符识别结果的字符串和与其对应的输入文档图象的字符串互相夹着基准线相对地显示。因此,操作者能够在画面上极容易地将成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串与其原来的输入文档图象(字符图象)的字符串进行对照(不需要使视线作很大的移动就能进行对照),能够极容易地看出成为现在的字符识别结果确认修正对象的字符识别结果(文本)中与原来的输入文档图象(字符图象)不同的地方(识别错了的地方、或发生遗漏等的地方)。
另外,在上述本发明的第3方面、第10方面、第5方面,由于在字符识别处理中,与字符识别结果一起算出字符识别结果的准确度,将字符识别结果显示在显示画面上,在将光标显示在其中欲确认从这里起的字符识别结果的字符的字符图象上时,越过(跳过)准确度在给定的阈值以上的字符,使光标显示在准确度小于给定的阈值的字符的字符图象上,所以在进行字符识别结果的确认、修正等时,操作者不需要察看全部文档,能提高工作效率。
本发明的其它目的及特征通过与附图一起做的详细说明将变得更加明确了。
图1是表示输入文档图象和字符识别结果的现有的显示例的图。
图2是说明现有的上卷功能用的说明图。
图3是表示本发明的字符识别系统的结构例图。
图4是表示图3中的字符识别系统的硬件结构例图。
图5是表示某一页文档的例图。
图6A、图6B是表示对图5所示文档的字符识别结果进行确认、修正等用的显示例的图。
图7、图8是说明在显示画面中使在基准线的一侧显示的字符识别结果(文本)和在基准线的另一侧显示的输入文档图象(字符图象)经常连动、上卷或移动的功能用的说明图。
图9是表示对图5所示文档的字符识别结果进行确认、修正等用的显示例的图。
图10是表示本发明的字符识别结果显示方法的第1处理例的流程图。
图11是表示本发明的字符识别结果显示方法的第2处理例的流程图。
图12、图13、图14是分别表示对图5所示文档的字符识别结果进行确认、修正等用的显示例的图。
以下,根据


本发明的实施例。图3是表示本发明的字符识别系统的结构例图。参照图3,该字符识别系统有将原稿等文档作为文档图象输入的图象输入部1;存储由图象输入部1读入的输入文档图象的输入文档图象存储部2;从由图象输入部1输入的输入文档图象中截出成为字符识别对象的字符图象,取出该字符图象的特征,与给定的词典5进行比较并进行字符识别处理的字符识别处理部4;存储来自字符识别处理部4的字符识别结果的字符识别结果存储部6;进行显示等的显示部7;为了进行字符识别结果的确认、修正等工作,进行将字符识别结果显示在显示部7的画面上的控制的显示控制部8;以及设定字符识别结果的显示形式等条件用的条件设定部9。
图4是表示图3中的字符识别系统的硬件结构例图。参照图4,该字符识别系统有由例如个人计算机等实现的进行总体控制的CPU11;存储CPU11的控制程序等的ROM12;作为CPU11的工作区等使用的RAM13;将原稿等文档作为文档图象读入的扫描器14;存储输入文档图象文件、词典文件及文本文件的外部存储装置15;设定字符识别结果的显示形式等条件、并对获得的字符识别结果(文本)进行确认、修正等工作用的显示器18及输入装置19。另外,上述输入文档图象文件是由扫描器14读入的输入文档图象(或从输入文档图象中截出的用于字符识别的字符图象)的文件,该文件例如是以输入文档的页为单位压缩而成的。上述词典文件是字符识别用的词典的文件。上述文本文件是对输入文档图象(字符图象)进行字符识别处理得到的字符识别结果的文本(被编码的信息)的文件。
这里,扫描器14对应于图3中的图象输入部1,存储输入文档图象文件、词典及文本文件的外部存储装置15对应于图3中的输入文档图象存储部2、词典5、字符识别结果存储部6。另外,CPU11具有图3中的字符识别处理部4及显示控制部8的功能。
另外,作为CPU11中的这种字符识别处理部、显示控制部等的功能例如能以软件包(具体地说,CD-ROM等信息记录媒体)的形式提供,因此,在图4所示例中,在安装信息记录媒体20时,设有驱动它的媒体驱动装置21。
另外,作为输入装置19例如可以使用键盘、鼠标器等,例如通过用鼠标指示在显示器18的画面上显示的图标等,进行处理的选择、给定处理的开始、结束指示等,利用键盘或鼠标器,在画面上进行光标的移动,还能进行画面的上卷。
换句话说,本发明的字符识别系统可以构成这样一种系统来实现,即将CD-ROM等信息记录媒体中记录的程序码读入备有图象扫描器、显示器等通用的计算机系统中,在该通用计算机系统的微处理机中进行字符识别处理。这时,作为存储本发明的字符识别处理程序等的信息记录媒体不限于CD-ROM,也可以使用ROM、RAM、FD等。另外,文档图象的输入不限于使用扫描器,也可以作为图象文件从外部供给。
可是,在本发明中,显示控制部8在进行字符识别结果(文本)的确认、修正等工作时,将显示字符识别结果时的基准线显示在显示部7(显示器18)的画面上,在该基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串,在该基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串对应的输入文档图象(字符图象)的字符串,这时使成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串和与其对应的输入文档图象(字符图象)的字符串互相夹着基准线相对地(并列地)显示。
图5表示某一页文档的例,图6A、图6B分别表示对图5所示文档的字符识别结果进行确认、修正等用的显示例。
在图6A的显示例中,在画面上显示出纵向的基准线L1,沿着该基准线L1,在其右侧靠近它的地方,沿行方向(=纵)显示成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串“本日は晴天なり、”,另外,沿着纵向的基准线L1,在其左侧靠近它的地方,沿行方向(=纵)显示与成为上述字符识别结果确认修正对象的字符识别结果(文本)的字符串对应的输入文档图象(字符图象)的字符串“本日は晴天なり、”。
另外,在图6B的显示例中,在画面上显示出横向的基准线H1,沿着该基准线H1,在其上侧靠近它的地方,沿行方向(=横)显示成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串“本日は晴天なり、”,另外,沿着横向的基准线H1,在其下侧靠近它的地方,沿行方向(=横)显示与成为上述字符识别结果确认修正对象的字符识别结果(文本)的字符串对应的输入文档图象(字符图象)的字符串“本日は晴天なり、”。
再者,在显示画面上,如下进行设定,如图6A所示,使行方向呈纵向,或者如图6B所示,使行方向呈横向。操作者例如在由扫描器14进行的文档输入之前,使用输入装置19输入关于所输入的文档是竖写文档还是横写文档的信息。如果该输入的结果是竖写文档,则CPU11如图6A所示的那样沿纵向设定基准线如果该输入的结果是横写文档,便如图6B所示的那样沿横向设定基准线。
另外,在图6A及图6B的显示例中,显示成为字符识别结果确认修正对象的字符识别结果(文本)的画面区域被作为窗口(文本确认修正窗口)W1设定,在该文本确认修正窗口W1中,读出并显示出外部存储装置15中存储的成为文本文件的字符识别结果确认修正对象的字符识别结果(文本)的全部或一部分,这时,使成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串与基准线最接近进行显示。
另外,在图6A及图6B的显示例中,显示输入文档图象(字符图象)的画面区域被作为窗口(图象窗口)W2设定,在此情况下,在该画面的图象窗口W2中,读出并显示出外部存储装置15中存储的输入文档图象文件的输入文档图象(字符图象),这时,使与在基准线的一侧最接近基准线显示的字符识别结果(文本)的字符串对应的输入文档图象(字符图象)的字符串最接近基准线显示。
这样,当显示字符识别结果(文本)的画面区域和显示输入文档图象(字符图象)的画面区域被分别作为窗口(即,文本确认修正窗口W1、图象窗口W2)设定时,能将基准线L1或H1作为双方的窗框的重合部分(即,文本确认修正窗口W1的窗框和图象窗口W2的窗框的重合部分)显示。如上所述,操作者在输入文档之前,输入使用输入装置19输入的关于文档是竖写文档还是横写文档的信息,CPU11根据该输入结果,设定窗口(即,文本确认修正窗口、图象窗口)如何显示,从而能自动地设定基准线的显示形式(使基准线象L1那样显示还是象H1那样显示)。
另外,在本发明中,显示控制部8具有使在显示部7的画面上、在基准线的一侧显示的字符识别结果(文本)和在基准线的另一侧显示的输入文档图象(字符图象)经常连动、上卷或移动的功能。具体地说,能进行这样的显示控制,即,例如在图6A的状态下,如果使在基准线L1的右侧显示的字符识别结果(文本)例如向右移动1行,则如图7所示,与其连动,在基准线L1的左侧显示的输入文档图象(字符图象)也向右移动1行。另外,还能进行这样的显示控制,即,例如在图6A的状态下,如果使在基准线L1的右侧显示的字符识别结果(文本)例如向上移动2个字符,则如图8所示,与其连动,在基准线L1的左侧显示的输入文档图象(字符图象)也向上移动2个字符。另外,这样的字符识别结果、输入文档图象的上卷、移动都能互相连动地在各自的窗口内移动。
这样,由于具有使在显示部7的画面上、在基准线的一侧显示的字符识别结果(文本)和在基准线的另一侧显示的输入文档图象(字符图象)经常连动、上卷或移动的功能,所以从图7或图8也能知道,能经常使成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串和与其对应的输入文档图象(字符图象)的字符串沿着基准线、且互相夹着基准线相对地(并列地)显示。
另外,显示控制部8还能这样显示,即进行字符识别结果的确认、修正时,关于现在修正中的字符,能识别出现在正在对它进行修正。具体地说,显示控制部8有这样的功能,即在图6A所示例中,如图9所示,当"天"被误认为"夫"、且在字符识别结果(文本)中现在修正中的字符是"夫"时,则在字符识别结果的显示区,例如用矩形框将字符"夫"所在处围起来,另外,在输入文档图象的显示区,例如用红色的矩形框将与其对应的字符"天"的字符图象所在处围起来。
另外,显示控制部8能在进行字符识别结果(文本)的确认、修正时,将字符识别结果(文本)中的低准确度字符与其它字符识别出来。例如,在字符识别结果(文本)的显示区中,将字符识别结果(文本)中的低准确度字符翻转显示,另外,在输入文档图象(字符图象)的显示区中,也能将上述低准确度字符翻转显示。上述所谓低准确度字符是指由字符识别处理部4对字符识别的结果的准确度(可靠性)低的字符。
另外,在图6A、图6B等的显示例中,能将输入文档图象(字符图象)的字符按与其原来的文档的字符同样大小显示,调整字符识别结果(文本)的字符尺寸,能按与输入文档图象的字符同样大小显示。
另外,在图6A、图6B等的显示例中,虽然在画面上只显示字符识别结果(文本)和输入文档图象(字符图象),但如后文所述,在该画面上还能显示例如字符识别结果确认修正对象页的全体图象。另外,还能与字符识别结果确认修正对象页的全体图象相邻地显示该页中的修正字符数、低准确度的字符数、总字符数等信息。
如上所述,在显示低准确度的字符时,字符识别处理部4求出字符识别结果,同时求出该字符识别结果的准确度(可靠性)。该准确度的计算处理可以采用例如特开平4-211883号中公开的方法进行。
即,所谓准确度是表示最后的字符识别结果的字符可靠到何种程度,能够用从0%到100%的数值表示,或者能将该数值量子化成几个阶段来表示。例如能用下述的A、B、C3个等级表示。
A级字符识别结果正确的可能性非常高。
B级字符识别结果正确的可能性低。
C级字符识别结果正确的可能性非常低。
在字符识别处理部4中,根据为了获得最后的字符识别结果而经过多个阶段的处理得到的信息,综合地确定准确度。例如,将从模式批配处理得到的第1候选评价值或第1和第2候选评价值之差、从合格选择处理得到的确定合格时的评价值、从规则处理得到的表示能用哪种规则进行修正的信息、以及从语言处理得到的表示语言修正结果的信息集中起来,根据这些信息,并利用例如德姆普斯特-萨佛(Dempster和Shafer)的概率理论,综合地判断准确度。
这种准确度的确定,在最后处理阶段将在到此之前的处理阶段得到的信息集中起来一并进行确定,或者根据在各处理阶段得到的信息,求出候选准确度,据此,在到达最后处理阶段之前,通过反复进行更新在预处理阶段前求得的准确度的操作,进行确定。
然后,根据该准确度,在进行字符识别结果的显示时,通过改变字符的颜色或辉度等视觉条件,或者与字符识别结果的字符对应地显示字符或符号,系统操作者能容易地辨认字符识别结果的准确度,能迅速且可靠地找到需要修正的字符,能高效率地进行该修正工作。
这样,在与字符识别结果一起算出字符识别的准确度时,该算出的结果可如下利用。显示控制部8能在进行字符识别结果(文本)的确认、修正时,将光标显示在显示部7(显示器18)的画面上显示的字符识别结果(文本)中的或/和输入文档图象(字符图象)中的欲从这里开始确认字符识别结果的字符上(如上所述,例如用矩形框将该字符围起来)。这时,显示控制部8可使光标越过(跳过)字符识别的准确度在给定的阈值(例如90%)以上的字符,而显示在低准确度的字符上。即,可以取出字符识别结果(文本)的字符内其字符识别的准确度在给定的阈值(例如90%)以下的字符,并将光标显示在该字符上。
另外,光标只显示在这样的低准确度的字符上的功能也能在下述的画面中实现,即例如能在图6A、图6B所示的在基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串,在基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串对应的输入文档图象(字符图象)的字符串的显示画面中实现,或者在只显示字符识别结果(文本)的画面中实现,或者在只显示输入文档图象(字符图象)的画面中实现。
另外,准确度的阈值可由图3中的条件设定部9或图4中的输入装置19进行设定。
图10是表示本发明的字符识别结果显示方法的第1处理例的流程图。参照图10,在该第1处理例中,显示字符识别结果时,将显示字符识别结果时的基准线显示在显示画面上(步S1),在该基准线的一侧沿基准线且最靠近基准线显示成为现在的字符识别结果确认修正对象的字符识别结果的字符串(步S2),在该基准线的另一侧沿基准线且最靠近基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果的字符串对应的输入文档图象的字符串(步S3)。从而能使成为现在的字符识别结果确认修正对象的字符识别结果的字符串和与其对应的输入文档图象的字符串互相夹着基准线相对地(并列地)显示。
另外,图11是表示本发明的字符识别结果显示方法的第2处理例的流程图。参照图11,在该第2处理例中,在字符识别处理中,与字符识别结果一起算出字符识别结果的准确度(步S11)。其次,将获得的字符识别结果显示在显示画面上(步S12),但这时检索字符识别结果,检查准确度在给定的阈值以下的字符(步S13)。然后,判断是否有准确度在给定的阈值以下的字符(步S14),当有准确度在给定的阈值以下的字符时,在到达准确度在给定的阈值以下的字符之前,使光标越过(跳过)字符,而显示在准确度小于该给定的阈值的字符上(步S15)。换句话说,使光标越过(跳过)准确度在给定的阈值以上的字符,而显示在准确度在该给定的阈值以下的字符上。所以在进行字符识别结果的确认、修正等时,操作者不需要察看全部文档,能提高工作效率。
其次,说明这样构成的字符识别系统的处理工作的具体例。本发明的字符识别系统以软件包(信息记录媒体)20的形式提供时,操作者将该信息记录媒体20安装在媒体驱动装置21中,将字符识别系统软件装入例如RAM13中。在该阶段,CPU11根据例如装入RAM13中的字符识别系统软件,就能进行处理。
扫描器14例如为ADF(原稿自动供给装置)时,如果将例如多张原稿置于扫描器14中,则扫描器14便自动地依次读取多张原稿。为了说明简单起见,假定各原稿是单张单面原稿,1张原稿对应于1页,因此,例如读取n(n≥1)张原稿时,以页为单位输入n页的文档图象。它们被分别作为输入文档图象文件,依次存入外部存储器15。
CPU11利用词典文件中的词典,以页为单位,对外部存储装置15中存储的n页的输入文档图象的输入文档图象文件进行字符识别处理,将每1页的字符识别结果作为文本(被编码的信息),并将它们作为文本文件,依次存入外部存储装置15。
操作者例如在该阶段,能对分别作为文本文件以页为单位存储的n页的字符识别结果(文本),以页位单位进行确认、修正。进行该确认修正处理时,操作者通过点一下显示画面上显示的规定的图标(例如「确认修正」等的图标),来起动确认修正处理程序。确认修正处理程序一旦被起动(或者作为输入文档图象文件、文本文件,存储多个文档时,如果选择成为字符识别结果确认修正对象的文档),则如图10所示,在画面上显示基准线(在图10所示例中为纵向基准线)L1、显示成为字符识别结果确认修正对象的文档的字符识别结果(文本)用的文本确认修正窗口W1、显示与成为字符识别结果确认修正对象的字符识别结果(文本)对应的输入文档图象用的图象窗口W2、显示字符识别结果确认修正对象页的全部图象用的页全体窗口W3、以及显示在该确认修正处理中修正的字符识别结果(文本)中的字符数、低准确度的字符数、总字符数(全部,成为现在的字符识别结果确认修正对象的页中的数)用的信息显示窗口W4。
其次,CPU11读出字符识别结果确认修正对象页全体图象的输入文档图象文件,将该页的全部图象显示在页全体窗口W3上,另外,从给定的文本文件读出从字符识别结果确认修正对象页的开头开始的1行字符数的字符识别结果(文本),并显示在文本确认修正窗口W1上。这时,如图12所示,显示出成为现在的字符识别结果确认修正对象的1行字符数的字符识别结果(文本)的字符串。(在图示的例中,在基准线L1的右侧,沿着基准线L1,且与基准线L1相邻地显示)。另外,CPU11从该输入文档图象文件中读出与在基准线L1的右侧、与基准线L1相邻地显示的字符识别结果(文本)的字符串对应的输入文档图象(字符图象),在将其压缩后存储的情况下,将其展开,例如按照与由扫描器14输入的文档的字符相同的尺寸显示在图象窗口W2上。这时,如图12所示,与在基准线L1的右侧、与基准线L1相邻地显示的字符识别结果(文本)的字符串对应的输入文档图象(字符图象)的字符串被显示在基准线L1的左侧,且沿着基准线L1,与基准线L1相邻地显示。即,成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串和与其对应的输入文档图象(字符图象)的字符串互相夹着基准线相对地(并列地)显示。
因此,操作者能够在画面上极容易地将成为现在的字符识别结果确认修正对象的字符识别结果(文本)的字符串与其原来的输入文档图象(字符图象)的字符串进行对照(不需要使视线作很大的移动就能进行对照),能够极容易地看出成为现在的字符识别结果确认修正对象的字符识别结果(文本)中与原来的输入文档图象(字符图象)不同的地方(识别错了的地方、或发生遗漏等的地方)。
现在,当在成为字符识别结果确认修正对象的字符识别结果(文本)中例如找出了识别错了的字符时,操作者将光标显示在该字符所在处。这时,如图13所示,用矩形框将字符识别结果的该字符所在处围起来,另外,输入文档图象中的对应的字符图象所在处也用矩形框围起来显示。在此状态下,操作者例如从键盘输入该字符的正确的读法(在图13所示的例中为「かぃ」)。据此,如图13所示,在画面上,该字符的修正候选字符被显示在候选字符选择窗口W5上,操作者用例如候选字符选择按钮等,从修正候选字符中选择正确的字符,能将字符识别结果(文本)中的识别错了的字符替换成正确的字符。另外,当在成为字符识别结果确认修正对象的字符识别结果(文本)中例如找出了遗漏时,操作者将光标显示在该处,例如将系统设定成插入模式,例如从键盘输入遗漏的字符,可将其插入字符识别结果(文本)中有遗漏的地方。
这样一来,现在移动光标,对显示在画面上的1行字符数的文本进行识别错了的字符或遗漏的修正。另外,当确认显示在确认修正窗口W1上的字符与显示在图象窗口W2上的字符相同后,操作者操作移动按钮(例如上卷键)等,从文本文件中读出例如下1行字符数的字符识别结果(文本),并显示在文本确认修正窗口W1上。这时,下1行字符数的字符识别结果(文本)的字符串如图14所示那样进行显示(在图示的例中,在基准线L1的右侧,且沿着基准线L1,与基准线L1相邻地显示)。另外,CPU11从输入文档图象文件中读出与在基准线L1的右侧、与基准线L1相邻地显示的字符识别结果(文本)的字符串对应的输入文档图象(字符图象),在将其压缩后存储的情况下,将其展开,例如按照与由扫描器14输入的文档的字符相同的尺寸显示在图象窗口W2上。这时,如图14所示,与在基准线L1的右侧、与基准线L1相邻地显示的字符识别结果(文本)的字符串对应的输入文档图象(字符图象)的字符串被显示在基准线L1的左侧,且沿着基准线L1,与基准线L1相邻地显示。即,成为字符识别结果确认修正对象的字符识别结果(文本)的字符串和与其对应的输入文档图象(字符图象)的字符串互相夹着基准线相对地(并列地)显示。
因此,操作者还能够在画面上极容易地将下1行的字符识别结果(文本)与其原来的输入文档图象(字符图象)进行对照,能够极容易地找出与原来的输入文档图象不同的地方(识别错了的地方、或发生遗漏等的地方),能用与上述相同的方法进行确认、修正。
另外,将图12和图14进行比较可知,在该例中,在将下1行的字符识别结果(文本)的字符串紧靠基准线L1显示在右侧时,前1行的字符识别结果(文本)的字符串便向右侧移1行显示,另外,前1行的输入文档图象(字符图象)的字符串由于下1行的输入文档图象(字符图象)的字符串被紧靠基准线L1显示在左侧而从画面上消去。
换句话说,上述的下1行字符识别结果的字符串的显示,能够通过将在文件确认修正窗口W1上显示的图象和在图象窗口W2上显示的图象分别向右侧移动1行来进行显示。
另外,在上述处理例中,操作者在需要修正的地方,通过操作输入装置19的鼠标器等,来移动光标。可是如上所述,在使系统具有使光标越过(跳过)高准确度的字符而显示在低准确度的字符上的功能的情况下,CPU11使光标自动地移动到低准确度的字符上,使操作者能确认或修正低准确度字符的字符识别结果。即,CPU11例如从1页的字符识别结果(文本)的开头检索低准确度字符,当检测到低准确度字符时,使光标自动地移动到该字符所在处,并将光标显示在该字符上,使操作者进行确认、修正等,如果操作者操作了表示该字符的确认、修正等已结束的键后,光标便自动地移动到下1个低准确度字符所在处,操作者即可进行该字符的确认、修正。
因此,在进行字符识别结果的确认、修正等时,操作者不需要察看全部文档,能提高工作效率。
这样进行处理,当1页的确认、修正结束后,操作者例如操作下页键,就能以同样的方法进行下1页的确认修正处理。另外,在返回前1页时,例如操作前页键即可。
然后,当全部页的确认修正处理结束后,操作者敲一下例如结束按钮。由此确定确认、修正处理。
在使用英语等字符数较少的语言中,进行字符识别结果的确认修正时,利用拼写检查功能,能有效地发现识别错了的字符。例如在英语的情况下,大部分文章能只用字母中的26个字符表示。与此不同,在日语、汉语等字符数较多的语言中,难以实现与英语等的拼写检查功能对应的功能。例如在日语的情况下,在发表文章时假名及汉字是必要的,使用的字数远远(位数不同)多于字母表中的26个字符。因此,操作者在必较输入文档图象和字符识别结果,发现识别错了的字符而进行修正时所用的时间增多。如果采用本发明,由于进行字符识别结果的确认修正时,能大幅度减少操作者所用的时间,所以能大幅度提高字符识别结果的确认修正效率,另外,还能减轻操作者进行字符识别结果的确认修正时的疲劳程度。
另外,本发明的实施例不受上述内容的限制,在下述的权利要求的范围内可以进行各种变化。
权利要求
1.一种对输入文档图象进行字符识别,将获得的字符识别结果的图象和输入文档图象显示在画面上,并判断字符的识别是否正确,当断定字符的识别有误时,修正成正确的字符用的字符识别结果显示方法,其特征在于将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示。
2.一种对给定的输入文档图象进行字符识别处理,将获得的字符识别结果显示在显示画面上的字符识别结果显示方法,其特征在于将显示字符识别结果时的基准线显示在显示画面上,在该基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果的字符串,在该基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果的字符串对应的输入文档图象的字符串,这时使成为现在的字符识别结果确认修正对象的字符识别结果的字符串和与其对应的输入文档图象的字符串互相夹着基准线相对地显示。
3.一种对给定的输入文档图象进行字符识别处理,将获得的字符识别结果显示在显示画面上的字符识别结果显示方法,其特征在于在字符识别处理中,与字符识别结果一起算出字符识别结果的准确度,将字符识别结果的字符组显示在显示画面上,在将光标显示在其中欲确认从这里起的字符识别结果的字符的字符图象上时,越过(跳过)准确度在给定的阈值以上的字符,使光标显示在准确度小于给定的阈值的字符的字符图象上。
4.一种字符识别系统,它由输入文档图象的文档图象输入装置、对输入的文档图象进行字符识别的字符识别装置、以及显示字符识别的识别结果的图象和输入的文档图象的图象显示装置构成,其特征在于图象显示装置将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示出来。
5.一种字符识别系统,其特征在于备有输入文档图象的图象输入装置、对该输入的文档图象进行字符识别处理的字符识别处理装置、将该字符识别处理装置的字符识别结果显示在显示画面上的显示装置、以及在将该字符识别结果显示在显示装置上时进行显示控制的显示控制装置,显示控制装置将显示字符识别结果时的基准线显示在显示画面上,在该基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果的字符串,在该基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果的字符串对应的输入文档图象的字符串,这时使成为现在的字符识别结果确认修正对象的字符识别结果的字符串和与其对应的输入文档图象的字符串互相夹着基准线相对地显示。
6.根据权利要求5所述的字符识别系统,其特征在于包括设定装置,用来在输入文档之前,预先根据按操作者的操作输入的输入文档图象是竖写文档还是横写文档,设定将基准线沿横向或沿纵向显示。
7.根据权利要求5所述的字符识别系统,其特征在于还设有设定基准线的条件用的基准线设定装置,显示控制装置根据由基准线设定装置设定的基准线的条件来显示基准线。
8.根据权利要求7所述的字符识别系统,其特征在于基准线的条件是这样的,即根据输入文档图象是竖写文档还是横写文档,预先将基准线沿横向或沿纵向显示。
9.根据权利要求5所述的字符识别系统,其特征在于当显示字符识别结果图象的画面区域和显示输入文档图象的画面区域分别作为窗口显示时,基准线被作为双方窗框的重叠部分显示。
10.一种字符识别系统,其特征在于备有输入文档图象的图象输入装置、对该输入的文档图象进行字符识别处理的字符识别处理装置、将该字符识别处理装置的字符识别结果显示在显示画面上的显示装置、求出字符识别处理装置的字符识别结果的准确度的准确度计算装置、以及在将该字符识别结果显示在显示装置上时进行显示控制的显示控制装置,显示控制装置显示字符识别结果的字符组,在将光标显示在其中欲确认从这里起的字符识别结果的字符的字符图象上时,越过准确度在给定的阈值以上的字符,使光标显示在准确度小于给定的阈值的字符的字符图象上。
11.一种字符识别方法,该方法包括输入文档图象的阶段a)、对输入的文档图象进行字符识别的阶段b)、以及显示字符识别的识别结果的图象和输入的文档图象的阶段c),其特征在于在该图象显示阶段c)中,将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示出来。
12.一种记录计算机用的软件程序的信息记录媒体,该软件程序用来对输入文档图象进行字符识别,将获得的字符识别结果的图象和输入文档图象显示在画面上,并判断字符的识别是否正确,当断定字符的识别有误时,修正成正确的字符,其特征在于将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示。
13.一种记录计算机用的软件程序的信息记录媒体,该软件程序用来执行输入文档图象的阶段a)、对输入的文档图象进行字符识别的阶段b)、以及显示字符识别的识别结果的图象和输入的文档图象的阶段c),其特征在于在图象显示阶段c)中,将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示。
14.一种信息记录媒体,其特征在于该信息记录媒体用来记录计算机用的软件程序,该计算机用的软件程序用来在显示字符识别结果时,将基准线显示在显示画面上,在该基准线的一侧沿基准线显示成为现在的字符识别结果确认修正对象的字符识别结果的字符串,在该基准线的另一侧沿基准线显示与在基准线的一侧显示的成为现在的字符识别结果确认修正对象的字符识别结果的字符对应的输入文档图象的字符串,这时使成为现在的字符识别结果确认修正对象的字符识别结果的字符串和与其对应的输入文档图象的字符串互相夹着基准线相对地显示。
15.一种信息记录媒体,其特征在于该信息记录媒体用来记录计算机用的软件程序,该计算机用的软件程序用来在字符识别处理中,与字符识别结果一起算出字符识别结果的准确度,将字符识别结果的字符组显示在显示画面上,在将光标显示在欲确认从这里起的字符识别结果的字符的字符图象上时,越过准确度在给定的阈值以上的字符,使光标显示在准确度小于给定的阈值的字符的字符图象上。
全文摘要
一种字符识别结果显示方法,用来对输入文档图象进行字符识别,将得到的字符识别结果的图象和输入文档图象显示在画面上,判断是否进行了正确的字符识别,当断定字符识别有误时,修正成正确的字符,将从这里起成为对字符识别结果进行判断的对象的字符识别结果的字符和成为该字符识别结果的字符的字符识别源的输入文档图象中的字符相邻地显示。
文档编号G06K9/62GK1170912SQ9711367
公开日1998年1月21日 申请日期1997年6月25日 优先权日1996年6月28日
发明者工藤奈保子, 金子馨 申请人:株式会社理光
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1