图像自动定向的方法及装置的制作方法

文档序号：6558526阅读：187来源：国知局

专利名称：图像自动定向的方法及装置的制作方法
技术领域：
本发明属于计算机信息处理领域的图像处理技术，具体涉及一种图像的自动定向方法及装置。
背景技术：
随着数字化信息资源的建设与管理，对现有印刷品数字化的需求越来越迫切。通过扫描识别技术处理的电子文档将广泛应用于各种电于出版物、网络资源、各种大型文献资料数据库、数字化图书馆等诸多领域。面对大量的印刷品，批量扫描识别成为实施信息化建设中的重要技术手段。
但是，现有技术中，对于扫描方向错乱的图像大都是人工旋转后再进行识别。这种人工干预使计算机系统自动的批量处理十分困难，效率非常低。专利号为CN200410042984.6的专利《一种已知表格的版面自动定向和定位方法》中叙述了一种版面自动定向的方法，但是只能针对特定的表格格式，应用十分有限。

发明内容
为了克服上述缺陷，本发明的目的在于提供一种图像自动定向的方法及装置，能够将带有文字的图像自动、精确的旋转到正确的方向，减少由于图像方向错乱给批量图像的文字识别带来的麻烦。
为了达到上述目的，本发明一种图像自动定向的方法，包括以下步骤(一)将输入文档转换为数字图像，对数字图像的每一方向上设定相同的初始权值，默认其中任意一个方向的权值排在方向序列的第一位；(二)挑选出数字图像中的部分文字块；(三)取方向序列中权值排在第一位的方向，将步骤(二)中得到的文字块归一化成点阵后旋转为此方向，进行试识别，根据试识别结果调整方向权值；(四)将方向序列按权值从大至小重新排列，若权值相等，则按照试识别的时间次序将较远或是没有参加试识别的方向排在前面，统计方向序列中排在第一位的方向的参数值，所述的参数值包括此该方向上进行过试识别的总的点阵个数、识别结果好的点阵个数和识别结果差的点阵个数；
(五)根据步骤(四)得到的参数，进行以下操作系统设定的需要试识别最少点阵个数为Wmin，系统设定的需要试识别最多点阵个数为Wmax，1)如果W＜Wmin，则返回步骤(三)；2)如果Wmin≤W＜Wmax，则判断是否满足公式Wg＞Wb*α，其中，所述的α为常数系数；判断结果为是，则判定排在第一位的方向为正确方向，进入步骤(六)；判断结果为否，则返回步骤(三)；3)如果W≥Wmax，则判断是否满足公式Wg＞Wb和W＞Wb*β，其中，所述的β为常数系数；判断结果为是，则判定排在第一位的方向为正确方向，进入步骤(六)；判断结果为否，则判定图像的原方向为正确方向，进入步骤(六)；其中，所述的W为进行过试识别的总的点阵个数，所述的Wg为识别结果好的点阵个数，所述的Wb为识别结果差的点阵个数；(六)根据步骤(五)得到的方向，将图像旋转并输出。
作为本发明的进一步改进，所述的步骤(二)具体为通过版面分析技术找到图像中的文本区域，利用切分技术将文本区域中的每一个独立的文字切分出来，即获得文字块。
作为本发明的进一步改进，所述的步骤(二)具体为(a)通过版面分析、切分技术或求连通域的方式获得图像的大部分文字块；(b)在获得图像的大部分文字里面，保留正方形或者接近正方形的文字块，剔除其他形状和文字不相符合的文字块，根据文字块宽或高的数值大小进行聚类，文字块数目最多的一类为图像中的文字块。
作为本发明的进一步改进，所述的步骤(三)具体为将得到的文字块归一化为64×64点阵。
作为本发明的进一步改进，步骤(三)包括
(A)取方向序列中权值排在第一位的方向，对未在此方向上试识别过的任意一个点阵进行试识别通过模板点匹配法进行试识别，匹配距离较小的识别结果为好，不和任何模版匹配的识别结果为差，匹配距离比较大的识别结果为不确定；(B)系统对识别结果好的权值加1，识别结果差的权值减1，识别结果为不确定的权值不变。
作为本发明的进一步改进，如不能匹配的模版点为6个以下，则为识别结果好；如不能匹配的模版点超过14个，则为识别结果差；不匹配的模版点处于6个以上14个以下，则为识别结果不确定。
作为本发明的进一步改进，所述的方向序列包括顺时针旋转0度、90度、180度、270度四个方向。
一种图像自动定向的装置，包括图像输入装置，用于将输入的文档转换为数字图像；文字获取装置，用于挑选数字图像有代表性文字块；归一化装置，包括用于将挑选出的文字块归一化为点阵的归一化模块，用于将点阵按照从识别定向装置获得的方向信息进行旋转的旋转器模块；识别定向装置，包括用于将点阵进行试识别的识别器模块，用于根据识别结果修改权值的距离统计模块，用于设定方向的初始权值，按权值大小排列方向序列，将权值第一位的方向信息传递给归一化装置，计算方向序列排在第一位的方向上识别过的点阵个数，判断图像正确方向的方向判定模块；输出装置，用于根据判断出的正确方向旋转图像，并将图像输出。
作为本发明的进一步改进，所述的文字获取装置包括用于获得大部分文字块的获取文字块模块；用于提取最有代表性文字块的筛选文字模块。
作为本发明的进一步改进，所述的获取文字块模块是通过版面分析、切分技术实现或通过求取连通域的形式实现。
作为本发明的进一步改进，所述的识别器模块通过模板点匹配法实现。
采用上述的方法及装置后，由于采用了归一化装置和识别定向装置，可以将图像的文字归一化为点阵，取出有代表性的文字块在方向上进行试识别，并根据识别结果自动、精确的旋转到正确的方向，可以用于所有文字识别的图像，减少了由于图像方向错乱给批量图像的文字识别带来的麻烦。

图1为本发明图像自动定向装置的总体框图。
图2为本发明实施例中挑选待识别文字的效果图。
图3为本发明用试识别方法判定图像方向的流程图。
图4为本发明顺时针旋转90度的图像效果图。
图5为本发明顺时针旋转180度的图像效果图。
图6为本发明自动旋转后的效果图。
具体实施例方式
下面结合附图及具体实施方式
对本发明作进一步的描述。
如图1所示，一种图像的自动定向装置，包括图像输入装置、文字获取装置、归一化装置、识别定向装置和旋转输出装置。
一种图像自动定向的装置，包括图像输入装置，用于将输入的文档转换为数字图像；文字获取装置，用于挑选数字图像有代表性文字块；归一化装置，包括用于将挑选出的文字块归一化为点阵的归一化模块，用于将点阵按照从识别定向装置获得的方向信息进行旋转的旋转器模块；识别定向装置，包括用于将点阵进行试识别的识别器模块，用于根据识别结果修改权值的距离统计模块，用于设定方向的初始权值，按权值大小排列方向序列，将权值第一位的方向信息传递给归一化装置，计算方向序列排在第一位的方向上识别过的点阵个数，判断图像正确方向的方向判定模块；输出装置，用于根据判断出的方向旋转图像，并将图像输出。
作为本发明的进一步改进，所述的文字获取装置包括用于获得大部分文字块的获取文字块模块；用于提取最有代表性文字块的筛选文字模块。
作为本发明的进一步改进，所述的获取文字块模块是通过版面分析、切分技术实现或通过求取连通域的形式实现。
作为本发明的进一步改进，所述的识别器模块通过模板点匹配法实现。
一种图像的自动定向方法，包括以下步骤将输入文档转换为数字图像数据，所述的文档可以是打印文档、手写文档或其他形式的文档。
挑选出数字图像中有代表性的文字块。
本发明所述的挑选文字块的过程中，首先要获得图像上的大部分文字块，然后再在这些文字中挑选符合条件的，送入归一化及识别定向装置。如图2是本发明实施例中挑选的待识别文字块图。
获得决大部分文字块可以有很多种方法，下面简要说明本发明中使用的两种方法1)通过版面分析、切分技术实现。首先，通过版面分析技术，找到图像中的文本区域；再利用切分技术，将文本区域中的每一个独立的文字切分出来，称为文字块。
2)通过求取连通域的方式直接求出所有的连通域，每个小的连通域作为一个文字块。
通过切分获得大部分文字块，或求取连通域方式获得连通域后，保留正方形或者接近正方形的文字块，剔除其他形状和文字不相符合的文字块。然后根据文字块的宽高的数值聚类，由于保留的均为正方形或接近正方形的块，因此可以只用文字块的宽(或高)的数值大小来进行聚类。文字块数目最多的一类被认为是本图像中的最有代表性的文字。
将得到的文字块归一化后在每个方向上试识别，总体识别结果好的方向判定为正确方向；这个步骤是由归一化装置和识别定向装置共同完成的。为了提高判定效率，本发明采用了为每个方向加权，根据权值大小来决定识别方向的顺序的加速方法。图3是本发明实施例中这一步骤的流程图。
首先，分别为顺时针旋转0度、90度、180度、270度四个方向设置初始权值。初始权值是一个正整数常数，如四个方向的初始权值均设为100。
然后，在文字块序列中获得任意的一个块，归一化为64×64的点阵，通过旋转器，将该点阵旋转为方向序列中排在第一位的方向。方向序列是按照权值的大小来排列的，权值最大的排在第一位。初始时，权值都相同，排序随机，一般默认为0度为第一位。
将旋转后的点阵送入识别器识别。这里的识别器可由很多方法完成，本发明采用了模板点匹配法(详细参考申请号为200510090877.5的专利“模板优化的字符识别方法和系统”)，即将点阵与字典中的模板匹配，获得最小匹配距离。
本发明根据返回的匹配距离，将试识别结果分为好(匹配距离较小，如不能匹配的模版点为6个以下，明显可以识别出正常文字)、差(拒识，如不匹配的模版点超过14个，根本不能和任何模板匹配)和不确定(可以和部分模版匹配，不匹配的模版点处于6个以上14个以下，但匹配距离相对较大，可能是文字变形或与错误模版匹配造成)三种。然后记录各个方向上试识别的文字总数W、识别结果好的文字总数Wg和识别结果差的文字总数Wb。同时，根据识别结果修改此方向的权值。识别结果好的权值加1，差的减1，识别结果不确定的权值不变。
任意方向的权值每改变一次，方向就要按照权值大小排序一次，权值大的方向排在前面。若两方向权值相等，则按照文字点阵在方向上试识别的时间次序排列，即较近一次试识别的方向排在后面，较远或者没有参加过试识别的方向排在前面。
排序后，对排在第一位的方向上统计的数据根据下面的公式判断W＞＝CountA&&Wg＞Wb*α (A)W＞＝CountB&&(Wg＞Wb||W＞Wb*β)(B)如果本方向上的数据满足公式之一，则可判断该方向为图像的正确方向。
其中，CountA与CountB是两个正整数常数，CountA表示需要试识别的最少点阵个数，CountB表示需要试识别的最多点阵个数。CountA与CountB是两个经验值，根据识别器类型的不同而不同，在本实施例中，经验值分别为6和16左右。α与β是两个常数系数，表示如果可确定方向，则识别较好的点阵(或识别较好与不确定的点阵之和)与识别较差的点阵应满足的比例关系。在本实施例中，α与β经验值分别在3和2.5左右。
公式(A)适用于质量较好，文字较清晰的图像，即试识别文字点阵达到最小点阵个数，且识别效果好的点阵远远大于差的，则可判断此方向为正确方向。
公式(B)适用于质量相对差一些，或者文字过于简单，容易误识的图像，即试识别文字点阵达到最大点阵个数，且识别效果好的点阵大于差的，或者总的识别点阵数大于识别效果差的点阵数的β倍，则可判断此方向为正确方向。
如果试识别文字点阵达到最大点阵个数，又不满足上述(A)、(B)公式的条件，则说明图像质量太差，或识别器不支持此图像上的文字识别，则认为没有自动旋转必要，因此定原方向为正确方向。
根据得到的正确方向，将整个图像逆时针旋转，得到正确方向的图像。
因此，由于采用了归一化装置和识别定向装置，可以将图像的文字归一化为点阵，取出有代表性的文字块在方向上进行试识别，并根据识别结果自动、精确的旋转到正确的方向，可以用于所有文字识别的图像，减少了由于图像方向错乱给批量图像的文字识别带来的麻烦。
权利要求
1.一种图像自动定向的方法，其特征在于，包括以下步骤(一)将输入文档转换为数字图像，对数字图像的每一方向上设定相同的初始权值，默认其中任意一个方向的权值排在方向序列的第一位；(二)挑选出数字图像中的部分文字块；(三)取方向序列中权值排在第一位的方向，将步骤(二)中得到的文字块归一化成点阵后旋转为此方向，进行试识别，根据试识别结果调整方向权值；(四)将方向序列按权值从大至小重新排列，若权值相等，则按照试识别的时间次序将较远或是没有参加试识别的方向排在前面，统计方向序列中排在第一位的方向的参数值，所述的参数值包括此该方向上进行过试识别的总的点阵个数、识别结果好的点阵个数和识别结果差的点阵个数；(五)根据步骤(四)得到的参数，进行以下操作系统设定的需要试识别最少点阵个数为Wmin，系统设定的需要试识别最多点阵个数为Wmax，1)如果W＜Wmin，则返回步骤(三)；2)如果Wmin≤W＜Wmax，则判断是否满足公式Wg＞Wb*α，其中，所述的α为常数系数；判断结果为是，则判定排在第一位的方向为正确方向，进入步骤(六)；判断结果为否，则返回步骤(三)；3)如果W≥Wmax，则判断是否满足公式Wg＞Wb和W＞Wb*β，其中，所述的β为常数系数；判断结果为是，则判定排在第一位的方向为正确方向，进入步骤(六)；判断结果为否，则判定图像的原方向为正确方向，进入步骤(六)；其中，所述的W为进行过试识别的总的点阵个数，所述的Wg为识别结果好的点阵个数，所述的Wb为识别结果差的点阵个数；(六)根据步骤(五)得到的方向，将图像旋转并输出。
2.按照权利要求1所述的图像自动定向的方法，其特征在于，所述的步骤(二)具体为通过版面分析技术找到图像中的文本区域，利用切分技术将文本区域中的每一个独立的文字切分出来，即获得文字块。
3.按照权利要求1或2所述的图像自动定向的方法，其特征在于所述的步骤(二)具体为(a)通过版面分析、切分技术或求连通域的方式获得图像的大部分文字块；(b)在获得图像的大部分文字里面，保留正方形或者接近正方形的文字块，剔除其他形状和文字不相符合的文字块，根据文字块宽或高的数值大小进行聚类，文字块数目最多的一类为图像中的文字块。
4.按照权利要求3所述的图像自动定向的方法，其特征在于，所述的步骤(三)具体为将得到的文字块归一化为64×64点阵。
5.按照权利要求3所述的图像自动定向的方法，其特征在于，步骤(三)包括(A)取方向序列中权值排在第一位的方向，对未在此方向上试识别过的任意一个点阵进行试识别通过模板点匹配法进行试识别，匹配距离较小的识别结果为好，不和任何模版匹配的识别结果为差，匹配距离比较大的识别结果为不确定；(B)系统对识别结果好的权值加1，识别结果差的权值减1，识别结果为不确定的权值不变。
6.按照权利要求5所述的图像自动定向的方法，其特征在于，如不能匹配的模版点为6个以下，则为识别结果好；如不能匹配的模版点超过14个，则为识别结果差；不匹配的模版点处于6个以上14个以下，则为识别结果不确定。
7.按照权利要求1所述的图像自动定向的方法，其特征在于，所述的方向序列包括顺时针旋转0度、90度、180度、270度四个方向。
8.一种图像自动定向的装置，其特征在于，包括图像输入装置，用于将输入的文档转换为数字图像；文字获取装置，用于挑选数字图像有代表性文字块；归一化装置，包括用于将挑选出的文字块归一化为点阵的归一化模块，用于将点阵按照从识别定向装置获得的方向信息进行旋转的旋转器模块；识别定向装置，包括用于将点阵进行试识别的识别器模块，用于根据识别结果修改权值的距离统计模块，用于设定方向的初始权值，按权值大小排列方向序列，将权值第一位的方向信息传递给归一化装置，计算方向序列排在第一位的方向上识别过的点阵个数，判断图像正确方向的方向判定模块；输出装置，用于根据判断出的正确方向旋转图像，并将图像输出。
9.按照权利要求8所述的图像自动定向的装置，其特征在于，所述的文字获取装置包括用于获得大部分文字块的获取文字块模块；用于提取最有代表性文字块的筛选文字模块。
10.按照权利要求9所述的图像自动定向的装置，其特征在于所述的获取文字块模块是通过版面分析、切分技术实现或通过求取连通域的形式实现。
11.按照权利要求8所述的图像自动定向的装置，其特征在于所述的识别器模块通过模板点匹配法实现。
全文摘要
本发明公开了一种图像自动定向的方法及装置，为解决图像方向错乱给批量图像的文字识别带来麻烦的问题而发明。本发明一种图像自动定向的方法包括将输入文档转换为数字图像；系统挑选出数字图像中有代表性的文字块；将得到的文字块归一化成点阵，为每个方向设定相同的初始权值，对权值排在第一位的方向不断进行点阵的试识别，并根据识别结果修改权值后，重新排列方向序列，统计识别结果判断出图像的正确方向并旋转输出。本发明一种图像自动定向的装置包括图像输入装置、文字获取装置、归一化装置、识别定向装置、输出装置；采用这样的方法及装置后，可以自动、精确的将所有带有文字的图像旋转为正确方向。
文档编号G06K9/20GK101064006SQ20061007899
公开日2007年10月31日申请日期2006年4月29日优先权日2006年4月29日
发明者刘芝, 康凯, 李鹏申请人:北大方正集团有限公司, 北京北大方正技术研究院有限公司, 北京大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘芝;康凯;李鹏
技术所有人：北大方正集团有限公司;北京北大方正技术研究院有限公司;北京大学
我是此专利的发明人

上一篇：一种表格图像几何畸变的数字校正方法
上一篇：打印方法及打印对象控制装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。