一种票据字符校正的方法及装置与流程

文档序号:11134709阅读:893来源:国知局
一种票据字符校正的方法及装置与制造工艺

本发明属于票据图像识别技术领域,尤其涉及一种票据字符校正的方法及装置。



背景技术:

票据票面上的字符是记录、分析信息的一种重要标记和可靠途径。有价票据、尤其是银行票据作为一种广泛使用的结算方式,其票面字符的自动化识别尤为重要,OCR(Optical Character Recognition,光学字符识别)处理技术作为文字识别和文档分析领域的一个研究热点在有价票据字符识别中的广泛应用也印证了这点。

有价票据文件的字符识别一般包括图像预处理、倾斜校正、字符定位和字符识别等过程。

票据图像采集中会出现整行字符的整体倾斜,倾斜后整体还在一条直线上,所有字符的倾斜角度一样,利用如上特征,通过对整幅票据图像进行校正可以解决字符倾斜的问题。

发明人发现票据图像采集过程中,由于运动、挤压等原因造成票据字符发生不同程度倾斜,而且每个字符的倾斜程度均不同。



技术实现要素:

本发明实施例提供一种票据字符校正的方法,旨在解决上述现有字符倾斜校正方法用于“票据字符发生不同程度倾斜,而且每个字符的倾斜程度均不同”的这种情况对倾斜字符进行整体校正时,一方面某些字符依旧倾斜严重,另一方面整幅票据图像进行校正,增加了算法时间复杂度,降低了算法效率的问题。

本发明实施例的第一方面,提供一种票据字符校正的方法,所述方法包括:

检测票面图像中的单个字符;

确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;

计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;

根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。

本发明实施例的第二方面,提供一种票据字符校正的装置,所述装置包括:

检测模块,用于检测票面图像中的单个字符;

确定模块,用于确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;

计算模块,计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;

校正模块,用于根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。

本发明实施例与现有技术相比存在的有益效果是:提供一种票据校正的方法,检测票面中的单个字符;确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。相对于现有技术整幅票据图像进行校正来解决字符倾斜,本技术方案对于每个字符单独进行倾斜校正,可使每个字符相对于票据来说,倾斜角度控制在不影响字符识别的范围内,可提高字符自动识别的效率,而且避免了对整幅票据图像进行旋转校正,降低了算法的时间复杂度。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1-1是本发明实施例一提供的票据字符校正的方法实现流程图;

图1-2是本发明实施例一提供的单个字符的最小外接矩形示意图;

图1-3是本发明实施例一提供的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域示意图;

图1-4是本发明实施例一提供的计算最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度和计算最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线与所述对称轴的夹角在预设范围内的示意图;

图2是本发明实施例二提供的票据字符校正的装置结构示意图;

图3是本发明实施例三提供的票据字符校正的装置结构示意图;

图4-1是本发明实施例四提供的票据字符校正的装置结构示意图;

图4-2是本发明实施例四提供的票据字符校正的装置结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。

以下描述中,为了说明而不是为了限定,给出了诸多技术特征的说明示意图,以便透切理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的装置以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

实施例一:

票据包括各种有价证券和凭证,例如股票、国库券、企业债券、发票、提单等,其形状绝大部分是对称形状,尤其是矩形。

为了有效解决现有字符倾斜校正方法用于“票据字符发生不同程度倾斜,而且每个字符的倾斜程度均不同”的这种情况对倾斜字符进行整体校正时,一方面某些字符依旧倾斜严重,另一方面整幅票据图像进行校正,增加了算法时间复杂度,降低了算法效率的问题。本实施例提供的票据字符校正的方法包括:检测票面图像中的单个字符;确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内;根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。

图1-1示出了本发明实施例一提供的票据字符校正的方法实现流程图,为了便于说明,图1-1仅示出了与本实施例相关的部分,其过程详述如下:

在步骤S101中,检测票面图像中的单个字符。

优选的是,票面中的单个字符可以是世界各个国家或地区或民族用的文字、数字的各种字体的印刷体或手写体,例如阿拉伯数字、汉语拼音字母、汉字、大小英文字母等。

优选的是,根据字符在票据票面中的特征,例如字符区域与背景像素亮度值明显不同或字符轮廓或多个字符组成一串的连续性的特征,对票据票面进行二值化后,进行单个字符检测,此方法简单高效。

优选的是,可以根据每种票据中字符所处的位置在票据票面预设的区域内进行单个字符的检测,此方法检测范围固定,目标性强,可提高检测效率。

需要说明的是,本实施例检测票面中的单个字符,指出了处理对象是针对单个字符,为后续其它技术特征奠定了基础,也是本申请核心要点,这不同于现有技术中对整幅票据图像进行处理,提高了处理效率。

在步骤S102中,确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

鉴于最小外接矩形可能存在两种不同定义,第一种定义为最小面积矩形,第二种定义为以二维坐标表示的若干二维形状(例如点、直线、多边形)的最大范围,即以给定的二维形状各顶点中的最大横坐标、最小横坐标、最大纵坐标、最小纵坐标定下边界的矩形。

本实施例中的最小外接矩形指最小面积外接矩形,图1-2中示出了本实施例中提供的单个字符的最小外接矩形示意图。为了便于理解,建立辅助直角坐标系xoy,字母“O”被对齐标注短边长度尺寸9.35和长边长度尺寸14.76的矩形,即第一种定义的矩形和对齐标注短边长度尺寸9.49和长边长度尺寸14.73的矩形,即第二种定义的矩形所框定,从图中示例的长度尺寸也可知第一种定义的矩形,即最小面积外接矩形面积要小于第二种定义的矩形。若从图1-2中来看,则对齐标注短边长度尺寸9.35和长边长度尺寸14.76的矩形为本申请所指的最小外接矩形。

最小外接矩形外侧预设缓冲区范围内的矩形指在最小外接矩形边线封闭区域外部的预设缓冲区范围内的矩形,且其面积大于最小外接面积矩形。图1-3中示出了本实施例中提供的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域示意图,为了便于理解,建立辅助直角坐标系xoy,图中矩形abcd为所述的单个字符的最小外接矩形,矩形a'b'c'd'为以矩形abcd各边或各边的预设段为基准在矩形abcd封闭区域外部以预设的距离作缓冲区形成的,如图1-3中的矩形a1b1c1d1为最小外接矩形外侧预设缓冲区范围内的矩形的一种示例,a1b1c1d1的边处在矩形abcd以外且矩形a'b'c'd'以内的图1-3中阴影部分中,图1-3中的阴影部分只是一种示例,阴影部分也可能是一种不规则形状。

需要说明的是,本实施例中最小外接矩形外侧预设缓冲区范围,可以是通过大样本后得到的经验值范围。

优选的是,本发明实施例中,确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域可由如下步骤S1021、步骤S1022实现:

步骤S1021,查找所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

需要说明的是,单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域为无数个,对于每一个字符只要查到合理数量个数(例如1个)的最小外接矩形外侧预设缓冲区范围内的矩形区域,就进行查找下一个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,此方法可根据需要,灵活查找需要个数的最小外接矩形外侧预设缓冲区范围内的矩形区域。

步骤S1022,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

优选的是,所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域为在检测票面中的单个字符过程中,把票面中的其部分图像误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

优选的是,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域可以是根据预设的字符高度、宽度、及高度、宽度的比值的范围中至少一个,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;根据所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中心的预设范围,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;根据所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域与其它所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域形成重叠区域的情形,排除所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中至少一个。

因为字符、尤其是印刷体字符的高度和宽度及二者的比值有约定俗成的书写规范,票据中字符更是有比较严格的规定,故字符的高度和宽度及二者的比值均在一定范围内,根据预设的字符高度、宽度、及高度、宽度的比值的范围中至少一个,所述预设的字符高度、宽度、及高度、宽度的比值的范围是通过大样本计算后得到的,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域当然可行。

因为字符、尤其是印刷体字符在票据中的位置相对有固定的范围,因此字符的中心聚集在相对有固定的范围,故单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中心的聚集区域也有其相对有固定的范围,可以采用聚类的方法通过大样本计算求取此范围,而后判断当前查找到的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域是否在此范围内,如果在此范围,则说明是查找到的矩形内是字符,不排除,否则,进行排除。票据中字符更是有比较严格的规定,例如即使是手写体,一般在银行办理票据单中有规定的方格或横线来引导和规范书写,故根据所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中心的预设范围,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域当然可行。

若遇到被误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域与其它所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域形成重叠区域的情形,排除所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

优选的是,所述情形为所述重叠区域的形状和/或测量的所述重叠区域的尺寸和/或面积,即可根据重叠区域的形状和/或测量的重叠区域的尺寸和/或面积,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

需要说明的是,到底重叠区域的尺寸和/或面积为多少时,进行排除这也是通过大样本计算求取的经验值。

进一步需要说明的是,因为票据中可能存在类似于字符的图像区域,但是在步骤S101中运用的算法或者考虑到在步骤S101中字符检测时要尽量不遗漏检测字符等诸多原因没有判别出其不是字符,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,减少了查找到的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,提高后续处理的效率,排除了污损,非字符等干扰,提高后续处理的精度。

在步骤S103中,计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线与所述对称轴的夹角在预设范围内。

计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度。

需要说明的是,票据对称轴可以等同于平行于票据对称轴所有直线,包括票据的长边和短边。本实施例中,一条直线相对于另外一条直线的倾斜角度在[0,π/2]范围。

图1-4中示出了本实施例中提供的计算最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度的示意图,为了便于理解和说明原理,建立辅助直角坐标系xoy,而且采用了稍微夸张点的画法,图1-4中,假设矩形MNPQ为票据,矩形a1b1c1d1为最终确定的最小外接矩形外侧预设缓冲区范围内的矩形,但实际上一般情况下,最小外接矩形外侧预设缓冲区范围内的矩形相对于票据来说没有这么大。HH'为票据的一个对称轴,为了方便,在图1-4中画成了直线段,其等同于平行于其所有直线,包括票据的长边和短边。在图1-4中,计算最小外接矩形外侧预设缓冲区范围内的矩形区域a1b1c1d1相对于票据对称轴HH'为计算矩形a1b1c1d1对称轴的平行线KK'相对于票据对称轴HH'的倾斜角度。为了方便,在图1-4中KK'画成了直线段,其等同于平行于其所有直线,包括a1b1c1d1的长边和短边。在图1-4中倾斜角度大小为HH'与KK'的夹角,这个夹角可以等同于其补角,故也可以求取HH'与KK'的夹角的补角大小作为所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度。

计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于票据对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内。

图1-4中示出了本实施例中提供的计算最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内,此范围可通过大样本计算求取。交于票据对称轴HH'上预设点S的直线为JJ',直线JJ'与对称轴HH'的夹角α在预设范围内,角β或其补角的值为计算最小外接矩形外侧预设缓冲区范围内的矩形区域a1b1c1d1相对于交于对称轴HH'上预设点S的直线JJ'的倾斜角度的示例。

步骤S104中,根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。

优选的是,本发明实施例中,根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域可由如下步骤S1041、步骤S1042实现:

步骤S1041,将所述倾斜角度与预设角度范围进行比较。

优选的是,预设角度范围可以分成多个相互连续的区间,例如三个相互连续的区间。

如图1-4中,比较倾斜角度β是否在预设角度范围,例如是否在开区间(5π/12,19π/40)、闭区间[0,5π/12]、闭区间[19π/40,π/2]范围内。

步骤S1042,若所述倾斜角度属于预设角度范围,则对所述最小外接矩形外侧预设缓冲区范围内的矩形区域进行顺时针或逆时针旋转。

如图1-4中,若倾斜角度β在开区间(5π/12,19π/40)范围内,则对最小外接矩形外侧预设缓冲区范围内的矩形区域a1b1c1d1进行逆时针旋转。

而倾斜角度β在[0,5π/12]或[19π/40,π/2]范围内,则不对矩形区域a1b1c1d1进行旋转。

不对旋转角度β在[19π/40,π/2]范围内的矩形区域a1b1c1d1旋转,原因是此时字符已经相对于票据不倾斜或倾斜角度在预设范围内,不影响后续字符识别,不需要进行倾斜校正,减少了需要校正的矩形个数,降低了算法时间复杂度,提高运算效率。

不对旋转角度β在[0,5π/12]范围内的矩形区域a1b1c1d1旋转,原因是此时a1b1c1d1内很可能不是字符,故需谨慎,不进行旋转,从而也减少了需要校正的矩形个数,降低了算法时间复杂度,提高运算效率。

需要说明的是,以上具体角度区间只是示例,实际中此区间可通过大样本计算求取。逐个字符进行校正,则全部检测为单个字符相应图像会进行旋转,进行旋转是指旋转到字符相对于票据不倾斜或倾斜角度在预设范围内,不影响后续字符识别等即可,而且在某些情况下,也会发生顺时针旋转。

本发明实施例提供一种票据校正的方法,对于每个字符单独进行倾斜校正,可使每个字符相对于票据来说,倾斜角度控制在不影响字符识别的范围内,本发明实施例避免了对整幅票据图像进行校正造成大多数字符原有特征信息丢失的情况,从这个角度来看也可以说能解决“整幅票据图像进行校正造成大多数字符原有特征信息丢失的问题”,从而最大程度地保留了每个字符原有特征信息,降低了后续字符定位、自动识别的难度,提高票据字符自动识别的成功率,而且避免了对整幅票据图像进行旋转校正,降低了算法的时间复杂度,提高了字符自动识别的效率。

实施例二:

图2示出了本发明第二实施例提供的票据字符校正的装置结构示意图。为了便于说明,图2仅示出了与本发明实施例相关的部分。图2示例的票据字符校正的装置包括检测模块201、确定模块202、计算模块203和校正模块204,其中:

检测模块201,用于检测票面图像中的单个字符。

优选的是,票面中的单个字符可以世界各个国家或地区或民族用的文字、数字的各种字体的印刷体或手写体,例如阿拉伯数字、汉语拼音字母、汉字、大小英文字母等。

优选的是,根据字符在票据票面中的特征,例如字符区域与背景像素亮度值明显不同或字符轮廓或多个字符组成一串的连续性的特征,对票据票面进行二值化后,进行单个字符检测,此方法简单高效。

优选的是,可以根据每种票据中字符所处的位置在票据票面预设的区域内进行单个字符的检测,此方法检测范围固定,目标性强,可提高检测效率。

需要说明的是,本实施例检测票面中的单个字符,指出了处理对象是针对单个字符,为后续其它技术特征奠定了基础,也是本申请核心要点,这不同于现有技术中对整幅票据图像进行处理,提高了处理效率。

确定模块202,用于确定所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

鉴于最小外接矩形可能存在两种不同定义,第一种定义为最小面积矩形,第二种定义为以二维坐标表示的若干二维形状(例如点、直线、多边形)的最大范围,即以给定的二维形状各顶点中的最大横坐标、最小横坐标、最大纵坐标、最小纵坐标定下边界的矩形。

本实例中与第一实施例中部分内容相同,故借用第一实施例中图1-2和图1-3进行描述。

本实施例中的最小外接矩形指最小面积外接矩形,且其面积大于最小外接面积矩形。图1-2中示出了本实施例中提供的单个字符的最小外接矩形示意图,为了便于理解,建立辅助直角坐标系xoy,字母O被对齐标注短边长度尺寸9.35和长边长度尺寸14.76的矩形,即第一种定义的矩形和对齐标注短边长度尺寸9.49和长边长度尺寸14.73的矩形,即第二种定义的矩形所框定,从图中示例的长度尺寸也可知第一种定义的矩形,即最小面积外接矩形面积要小于第二种定义的矩形。若从图1-2中来看,则对齐标注短边长度尺寸9.35和长边长度尺寸14.76的矩形为本申请所指的最小外接矩形。

最小外接矩形外侧预设缓冲区范围内的矩形指在最小外接矩形边线封闭区域外部的预设缓冲区范围内的矩形,图1-3中示出了本实施例中提供的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域示意图,为了便于理解,建立辅助直角坐标系xoy,图中矩形abcd为所述的单个字符的最小外接矩形,矩形a'b'c'd'为以矩形abcd各边或各边的预设段为基准在矩形abcd封闭区域外部以预设的距离作缓冲区形成的,如图1-3中的矩形a1b1c1d1为最小外接矩形外侧预设缓冲区范围内的矩形的一种示例,a1b1c1d1的边处在矩形abcd以外且矩形a'b'c'd'以内的图1-3中阴影部分中,图1-3中的阴影部分只是一种示例,阴影部分也可能是一种不规则形状。

需要说明的是,本实施例中最小外接矩形外侧预设缓冲区范围,可以是通过大样本后得到的经验值范围。

需要说明的是,因为票据中可能存在类似于字符的图像区域,但是在步骤S101中运用的算法或者考虑到在步骤S101中字符检测时要尽量不遗漏检测字符等诸多原因没有判别出其不是字符,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,减少了查找到的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,提高后续处理的效率,排除了污损,非字符等干扰,提高后续处理的精度。

计算模块203,用于计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度或计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内。

计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度。

需要说明的是,票据对称轴可以等同于平行于票据对称轴所有直线,包括票据的长边和短边。本实施例中,一条直线相对于另外一条直线的倾斜角度在[0,π/2]范围内。

本实例中与第一实施例中部分内容相同,故借用第一实施例中图1-4进行描述。

图1-4中示出了本实施例中提供的计算最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度的示意图,为了便于理解和说明原理,建立辅助直角坐标系xoy,而且采用了稍微夸张点的画法,图1-4中,假设矩形MNPQ为票据,矩形a1b1c1d1为最终确定的最小外接矩形外侧预设缓冲区范围内的矩形,但实际上一般情况下,最小外接矩形外侧预设缓冲区范围内的矩形相对于票据来说没有这么大。HH'为票据的一个对称轴,为了方便,在图1-4中画成了直线段,其等同于平行于其所有直线,包括票据的长边和短边。在图1-4中,计算最小外接矩形外侧预设缓冲区范围内的矩形区域a1b1c1d1相对于票据对称轴HH'为计算矩形a1b1c1d1对称轴的平行线KK'相对于票据对称轴HH'的倾斜角度。为了方便,在图1-4中KK'画成了直线段,其等同于平行于其所有直线,包括a1b1c1d1的长边和短边。在图1-4中倾斜角度大小为HH'与KK'的夹角,这个夹角可以等同于其补角,故也可以求取HH'与KK'的夹角的补角大小作为所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于票据对称轴的倾斜角度。

计算所述最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于票据对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内。

图1-4中示出了本实施例中提供的计算最小外接矩形外侧预设缓冲区范围内的矩形区域相对于交于所述对称轴上预设点的直线的倾斜角度,所述直线相对于所述对称轴的倾斜角度在预设范围内,此范围可通过大样本计算求取。交于票据对称轴HH'上预设点S的直线为JJ',直线JJ'与对称轴HH'的夹角α在预设范围内,角β或其补角的值为计算最小外接矩形外侧预设缓冲区范围内的矩形区域a1b1c1d1相对于交于对称轴HH'上预设点S的直线JJ'的倾斜角度的示例。

校正模块204,用于根据所述倾斜角度校正所述最小外接矩形外侧预设缓冲区范围内的矩形区域。

需要说明的是,若倾斜角度在预设的角度区间,则校正最小外接矩形外侧预设缓冲区范围内的矩形区域,实际中此区间可通过大样本计算求取。逐个字符进行校正,则全部检测为单个字符相应图像会进行校正,使得字符相对于票据不倾斜或倾斜角度在预设范围内,不影响后续字符识别等即可。

需要说明的是,以上图2示出的本发明第二实施例提供的货币面向识别装置的实施方式中,为描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成,即将票据字符校正的装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成,例如,检测模块,可以是具有执行检测票面中的单个字符的硬件,例如检测器,也可以是能够执行相应计算机程序从而完成检测功能的一般处理器或者其他硬件设备。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。(本说明书提供的各个实施例都可应用上述描述原则)。

实施例三:

图2示出的确定模块202可以包括查找单元301、排除单元302,如图3中示出了本发明第三实施例提供的票据字符校正的装置结构示意图。其中:

查找单元301,用于查找所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

需要说明的是,单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域为无数个,对于每一个字符只要查到合理数量个数(例如1个)的最小外接矩形外侧预设缓冲区范围内的矩形区域,就进行查找下一个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,此方法可根据需要,灵活查找需要个数的最小外接矩形外侧预设缓冲区范围内的矩形区域。

排除单元302,用于排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

优选的是,所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域为在检测票面中的单个字符过程中,把票面中的其部分图像误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

优选的是,所述排除单元302,包括:第一排除子单元,用于根据预设的字符高度、宽度、及高度、宽度的比值的范围中至少一个,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;第二排除子单元,用于根据所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中心的预设范围,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域;第三排除子单元,用于根据所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域与其它所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域形成重叠区域的情形,排除所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中至少一个。

因为字符,尤其是印刷体字符的高度和宽度及二者的比值有约定俗成的书写规范,票据中字符更是有比较严格的规定,故字符的高度和宽度及二者的比值均在一定范围内,根据预设的字符高度、宽度、及高度、宽度的比值的范围中至少一个,所述预设的字符高度、宽度、及高度、宽度的比值的范围是通过大样本计算后得到的,故用第一排除单元排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域当然可行。

因为字符,尤其是印刷体字符在票据中的位置相对有固定的范围,因此字符的中心聚集在相对有固定的范围,故单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中心的聚集区域也有其相对有固定的范围,可以采用聚类的方法通过大样本计算求取此范围,而后判断当前查找到的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域是否在此范围内,如果在此范围,则说明是查找到的矩形内是字符,不排除,否则,进行排除。票据中字符更是有比较严格的规定,例如即使是手写体,一般在银行办理票据单中有规定的方格或横线来引导和规范书写,故根据所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域中心的预设范围,故用第二排除单元排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域当然可行。

若遇到被误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域与其它所述单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域形成重叠区域的情形,可用第三排除单元排除所述误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

优选的是,所述情形为所述重叠区域的形状和/或测量的所述重叠区域的尺寸和/或面积,即可根据重叠区域的形状和/或测量的重叠区域的尺寸和/或面积,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域。

需要说明的是,到底重叠区域的尺寸和/或面积为多少时,进行排除这也是通过大样本计算求取的经验值。

进一步需要说明的是,因为票据中可能存在类似于字符的图像区域,但是在检测模块201中运用的算法或者考虑到检测模块201中字符检测时要尽量不遗漏检测字符等诸多原因没有判别出其不是字符,排除误检测为单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,减少了查找到的单个字符的最小外接矩形外侧预设缓冲区范围内的矩形区域,提高后续处理的效率,排除了污损,非字符等干扰,提高后续处理的精度。

实施例四:

图2或图3示出的校正模块204可以包括比较单元401和旋转单元402,如图4-1或图4-2中示出了本发明第四实施例提供的票据字符校正的装置结构示意图。其中:

本实例中与第一实施例中部分内容相同,故借用第一实施例中图1-4进行描述。

比较单元401,用于将所述倾斜角度与预设角度范围进行比较。

优选的是,预设角度范围可以分成多个相互连续的区间,例如三个相互连续的区间。

如图1-4中,比较倾斜角度β是否在预设角度范围,例如是否在开区间(5π/12,19π/40)、闭区间[0,5π/12]、闭区间[19π/40,π/2]范围内。

旋转单元402,用于若所述倾斜角度属于预设角度范围,则对所述最小外接矩形外侧预设缓冲区范围内的矩形区域进行顺时针或逆时针旋转。

如图1-4中,若倾斜角度β在开区间(5π/12,19π/40)范围内,则对最小外接矩形外侧预设缓冲区范围内的矩形区域a1b1c1d1进行逆时针旋转。

而倾斜角度β在[0,5π/12]或[19π/40,π/2]范围内,则不对矩形区域a1b1c1d1进行旋转。

不对旋转角度β在[19π/40,π/2]范围内的矩形区域a1b1c1d1旋转,原因是此时字符已经相对于票据不倾斜或倾斜角度在预设范围内,不影响后续字符识别,不需要进行倾斜校正,减少了需要校正的矩形个数,降低了算法时间复杂度,提高运算效率。

不对旋转角度β在[0,5π/12]范围内的矩形区域a1b1c1d1旋转,原因是此时a1b1c1d1内很可能不是字符,故需谨慎,不进行旋转,从而也减少了需要校正的矩形个数,降低了算法时间复杂度,提高运算效率。

需要说明的是,以上具体角度区间只是示例,实际中此区间可通过大样本计算求取。逐个字符进行校正,则全部检测为单个字符相应图像会进行旋转,进行旋转是指旋转到字符相对于票据不倾斜或倾斜角度在预设范围内,不影响后续字符识别等即可,而且在某些情况下,也会发生顺时针旋转。

需要说明的是,实施例二、三、四中各模块/单元之间的信息交互、执行过程等内容及实施例整体内容,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

需要说明的是,本发明所有实施例中涉及“第一”、“第二”、“第三”等词,例如第一排除单元、第二排除单元等在此仅为表述和指代的方便,并不意味着在本发明的具体实现方式中一定会有与之对应的第一排除单元和第二排除单元。

本领域普通技术人员还可以理解,实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以在存储于一计算机可读取存储介质中,所述的存储介质,包括ROM/RAM、磁盘、光盘等。

以上内容是结合具体的优选实施方式对本发明原理及实施方式所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明,只是用于帮助理解本发明的方法及其核心思想;同时,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下做出若干等同替代或明显变型,而且性能或用途相同,都应当视为属于本发明由所提交的权利要求书确定的专利保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1