字符识别系统、字符识别程序以及字符识别方法

文档序号:9264730阅读:448来源:国知局
字符识别系统、字符识别程序以及字符识别方法
【技术领域】
[0001 ] 本发明涉及字符识别系统。
【背景技术】
[0002]以往,提供了用于光学读取被打印在纸上的字符而进行识别的光学字符识别系统,例如,在下述专利文献1、2中作了公开。
[0003]另一方面,如下述专利文献3所公开的那样,为了在系统之间或应用程序之间进行数据的交接,需要借助通过画面捕捉得到的图像数据,识别计算机的显示器上显示的字符。
[0004]现有技术文献
[0005]专利文献
[0006]专利文献1:日本特开2008-305126号公报
[0007]专利文献2:日本特开2010-26805号公报
[0008]专利文献3:日本特开2011-81537号公报

【发明内容】

[0009]发明所要解决的课题
[0010]但是,显示器上的显示字符与被打印在纸上的字符相比,点的分辨率粗,所以即使采用现有的光学字符识别的手法,有时候识别率也会大幅下降。尤其是对于为了增大显示数据量而使用的小字符尺寸的字符而言,识别率极端地降低。
[0011]本发明就是鉴于上述课题而完成的,其目的在于提供一种字符识别系统,其能够以高的准确率识别显示在计算机的显示器上的字符。
[0012]用于解决课题的手段
[0013]为了解决上述课题,本发明的字符识别系统用于识别计算机的显示器上显示的字符,其特征在于,所述字符识别系统具有:存储装置,其针对规定的显示字体和字符尺寸的组合,记录有识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及字符识别部,其参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
[0014]此外,本发明的字符识别程序用于使计算机识别显示器上显示的字符,其特征在于,所述字符识别程序使所述计算机执行以下步骤:识别辞典生成步骤,针对规定的显示字体和字符尺寸的组合,生成识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及字符识别步骤,参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
[0015]此外,本发明的字符识别方法用于识别计算机的显示器上显示的字符,其特征在于,所述字符识别方法具有以下步骤:识别辞典生成步骤,针对规定的显示字体和字符尺寸的组合,生成识别辞典,所述识别辞典具有关于具备该显示字体和字符尺寸的各字符的构成点的配置的信息;以及字符识别步骤,参照所述识别辞典,提取与关于所述显示器上显示的识别对象字符的构成点的配置的信息完全一致的字符,由此确定所述识别对象字符。
[0016]发明效果
[0017]根据本发明,即使是显示在计算机的显示器上的分辨率低的字符,也能够高精度地进行字符识别。
【附图说明】
[0018]图1是概略地示出本发明的实施方式的字符识别系统的结构的示意图。
[0019]图2是示出本发明的实施方式的识别辞典的内容的图。
[0020]图3是概略地示出本发明的实施方式的字符识别系统的功能的框图。
[0021]图4是示出本发明的实施方式的识别辞典的生成处理的流程的流程图。
[0022]图5是示出本发明的实施方式的字符识别的处理的流程的流程图。
[0023]图6是用于说明本发明的实施方式的字符识别的处理的图。
【具体实施方式】
[0024]下面,参照附图详细说明本发明的实施方式的字符识别系统。图1是概略地示出本实施方式的字符识别系统的结构的示意图。图2是示出本实施方式的识别辞典的内容的图。图3是概略地示出本实施方式的字符识别系统的功能的框图。
[0025]如图1所示,字符识别系统I具有:计算机主体10 ;显示器30,其是显示来自计算机主体10的输出信息的显示装置;以及键盘和鼠标等输入装置32,其用于将信息输入到计算机主体10。
[0026]本实施方式的字符识别系统I是用于识别显示器30上显示的字符的系统,其特征在于,在进行字符识别时,不是利用光学字符识别,而是根据关于构成字符的构成点的配置的信息是否完全一致,来进行字符的确定。在本实施方式中,以识别应用程序A在显示器30上的显示窗口内的规定的识别对象区域中显示的显示字符的情况为例进行说明。
[0027]计算机主体10具有:用于进行各种运算的CPU(Central Processing Unit,中央处理单元)等运算装置11 ;以及用于存储各种信息的HDD (Hard Disc Drive,硬盘驱动器)和作为运算处理的工作区进行使用的RAM (Random Access Memory,随机存取存储器)等存储装置12。
[0028]存储装置12具有:程序保存部121,其保存有安装于计算机主体10的OS (Operating System:操作系统)、字符识别程序、识别辞典生成程序、字体检查程序、应用程序A等各种程序;识别辞典DB (数据库)122,其保存有在进行字符识别时使用的识别辞典;用于字体检查的字体检查用辞典DB 123 ;以及视频存储器125,其临时保持显示器30上显示的画面内容。
[0029]关于程序保存部121,字符识别程序是用于执行后述的字符识别处理的程序,识别辞典生成程序是用于执行后述的识别辞典的生成处理的程序。此外,字体检查程序是用于在进行识别辞典的生成和字符识别时,取得识别对象字符的显示字体和字符尺寸的信息的程序。
[0030]在识别辞典DB 122中,按照显示字体和字符尺寸的每种组合,生成识别辞典并进行记录。参照图2来说明识别辞典的识别辞典记录的内容。识别辞典DB 122内的各记录具有“辞典ID”、“显示字体”、“字符尺寸”、“字符代码”、“外框内点配置”、“外框尺寸”、“外框位置”的项目。
[0031]“辞典ID”是各识别辞典的识别符,如果是相同显示字体和字符尺寸的组合,则为相同的识别符,如果显示字体和字符尺寸的至少一个不同,则为不同的识别符。“显示字体”、“字符尺寸”和“字符代码”是作为该记录的生成源的字符的字体、尺寸、字符代码。
[0032]“外框内点配置”是包含构成辞典生成源的字符的全部构成点的最小矩形外框内的点配置位置的信息。例如,将配置有黑色点的位置设为“ I ”,将没有配置的空白位置设为“0”,从矩形外框内的左上朝向右下,按照每行以“00110101110000”的形式进行记录。
[0033]“外框尺寸”是上述最小矩形外框的纵横的尺寸信息(点的个数)。“外框位置”是从基线(标准底线)到上述最小矩形外框的下边的距离。在本实施方式中,“外框内点配置”、“外框尺寸”、“外框位置”的项目相当于关于字符的构成点的配置的信息。
[0034]字体检查用辞典DB 123内记录的字体检查用辞典是用于在进行识别辞典的生成和字符识别时,取得识别对象字符的显示字体和字符尺寸的信息的辞典。字体检查用辞典仅针对例如“务U 3尤朽”等规定的检查用的多种字符,具有与关于计算机主体10中安装的全部字体的全部尺寸的上述识别辞典相同的信息。
[0035]接着,参照图3来说明字符识别系统I的功能。如该图所示,字符识别系统I具有:字体检查部20,其具有识别显示器30上显示的显示字符的显示字体和字符尺寸的功能;辞典生成部21,其具有预先生成上述识别辞典的功能;以及字符识别部25,其具有进行字符识别的功能。
[0036]这各个部分的功能是使运算装置11执行程序保存部121中保存的字体检查程序、识别辞典生成程序、字符识别程序来实现的。
[0037]接着,进一步参照图4来说明识别辞典DB 122中记录的识别辞典的生成处理的流程。图4是示出本实施方式的识别辞典的生成处理的流程的流程图。
[0038]识别辞典的生成是在后述的字符识别处理之前进行的,辞典生成部21生成针对之后待识别的识别对象字符的显示字体和字符尺寸的组合的识别辞典。当然,在已经针对相同显示字体和字符尺寸的组合生成了识别辞典的情况下,无需再次进行辞典的生成,只要使用已经登记的识别辞典即可。
[0039]在识别辞典的生成时,在计算机主体10中执行识别辞典生成程序。首先,在Sll中,进行生成识别辞典所需的显示字体和字符尺寸的取得。该字符尺寸等的取得是启动字体检查程序而进行的。
[0040]这里生成的识别辞典是应用程序A在显示窗口内的规定的识别对象区域内显示的识别对象字符的显示字体和字符尺寸的组合的识别辞典,所以字体检查程序参照记录在字体检查用辞典DB 123内的字体检查用辞典,自动确定该识别对象字符的显示字体和字符尺寸。
[0041]具体而言,字体检查部20通过画面捕捉从视频存储器125取得识别对象字符的图像数据,一边参照字体检查用辞典DB 123,一边提取与构成识别对象字符的点的配置信息完全一致的字符。由此,确定与识别对象字符相同字体和相同尺寸的字符,能够取得识别对象区域中显示的字符的显示字体和字符尺寸的信息。
[0042]另外,参照该字体检查用辞典DB 123提取字符的处理与后述的字符识别的处理相同,所以省略详细的说明。此外,字体检查用辞典是仅针对检查用的多种字符的辞典,所以在进行字体检查时,操作员需要预先进行字符的输入等作业,以使该检查用的字符作为识别对象字符显示在识别对象区域内。
[0043]与现有的光学字符识别不同,在本实施方式中,根据字符的构成点的配置位置是否相同,进行字符的识别,如果显示字体或字符尺寸不同,则会被识
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1