图像识别方法及系统的制作方法

文档序号:6615578阅读:330来源:国知局
专利名称:图像识别方法及系统的制作方法
技术领域
本发明涉及图像识别的技术领域,特别涉及采用模式识别技术对静态的目 标图像进行识别的方法及系统。
背景技术
图像识别作为办公自动化中一个高端技术,正随着模式识别技术的发展而
不断发展,并被积极推广应用。例如部分机场采用指紋识别4支术进行身份确 认。模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础上, 利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自 动完成识别的过程。模式识别包括相互关联的两个阶段,即学习阶段和实现阶
段;学习阶段是对样本进行特征选择,寻找分类的规律;实现阶段是根据分类 规律对未知样本集进行分类和识别。
在模式识别技术的目标图像的识别问题中,目标搜索、特征信息提取、逻 辑判别是三个主要技术环节。目标图像的识别技术需要通过对图像信息的多重 数据处理,获得目标图像的边界信息,通过边界信息和其它图像信息提取或计 算得到目标图像的特征信息,然后对特征信息进行逻辑判断,以获得目标图像 的识别结果。
上述特征信息的提取目前尚无通用的提取方法,只能通过分析具体识别对 象来决定选取何种特征信息,然后针对选择特征信息的特点来设计提取方法, 不具有通用性。目前所选择的特征信息除了图像的形象信息外,其他特征信息 都包含基于逻辑思维的,或者需要经过图像信息处理、数学变换、演绎推理、 统计计算才能得到的特征信息。现有技术中逻辑判断是通过获得的多个特征信
息不同取值的组合来判断,以获得目标图像的识别结果。在很多场合,这种特 征信息取值组合与目标图像之间的关系,都需要大量的实验获得经验数据,或 者通过专家系统技术来获得,经验数据是保证逻辑判断准确因数之一。
在上述目标图像的识别技术中,图像特征信息提取和目标识别过程要完成 大量的图像信息处理和数学统计计算,另外还包括复杂的数学变换、演绎推理,使图像目标识别的过程速度相对较慢、技术复杂、识别准确率不高;由于特征 信息取值组合与目标图像之间的关系,都需要大量的实验获得经验数据,或者 通过专家系统技术来获得,每次遇到一个新的识别领域,就需要重新获取大量 的经验数据,并建立一套特征信息取值组合与目标图像之间的关系,所以,通 过现有识别方法构成的识别系统的通用性很差。
具有视觉能力的动物对图像信息都有快速分析、判断的能力,这种能力来 源于形象思维。形象思维是通过感知表象信息,调用大脑中的形象知识(表象、 意象、经验等),通过分析、比较、归纳、想象等思维活动,完成对事物本质的 认识。这一思维活动并没有经过复杂严密的逻辑推理过程,但却是简洁、快速、 有效的。对于图像静态目标识别问题,形象思维的思维活动相对来说是很筒单 的。目前简化图像识别的主要问题,是如何模拟形象思维方法来完成识别过程。

发明内容
一方面,本发明的目的在于提供一种图像识别方法,以提高识别速度、识 别准确度,且该图像识别方法的通用性较好。
为达到上述目的,本发明采用如下技术方案该图像识别方法步骤如下 (1)获取待识别图像的信息;
(2 )在模板信息库中选择目标图像,并将选中目标图像的模板信息导入识 别系统,所述模板信息至少包括目标图像中标识区域的信息、以及标识区域内 标志像素的特征信息;
(3)根据标识区域的信息确定待识别图像中的待识别区域;
(4 )在待识别区域中查找与标识区域中标志像素对应的像素;计算查找到 的像素的特征信息与标识区域中标志像素的特征信息的最大相似度;
(5)判断所述最大相似度是否在误差范围内,若在误差范围内,则所述待 识别图像与所述目标图像相匹配;否则所述待识别图像与所述目标图像不匹配。 上述技术方案所描述的图像识别方法,通过选择图像的局部,以模板方式 记忆目标图像中标识区域内的形与像的特征信息,在确定待识别图像中与标识 区域相对应的待识别区域后,计算待识别区域内的特征信息和标识区域内的特 征信息的相似度,当相似度符合误差要求时,表示找到与待识别图像相匹配的目标图^f象,即实现了图像的识别。
由于上述方法中只需要比较标识区域内和待识别区域的特征信息,所需要 的信息量比现有技术要少很多,并且所比较的特征信息是像素的特征信息,没 有经过任何预处理,不需要大量的图像信息处理和数学统计计算,也没有复杂 的数学变换、演绎推理,使图像识别的过程相对于现有识别技术而言较快,实 现也较为简单。
由于上述图像识别方法中以模板方式记忆目标图像的形与像的特征信息, 这些形与像的特征信息相当于动物大脑中的形象知识,所有的才莫板信息都是在 识别之前就保存完成的,这样在识别过程中不需要对新的目标图像进行特征分
析、识别策略分析等复杂工作;也不需要做大数据量的图像处理,通过对比这
些特征信息来模拟动物大脑的形象思维以完成图像识别。所以本发明图像识别 方法相对于现有的图像识别技术而言,其识别速度快,识别效率得到了提高。
由于上述图像识别方法中不需要获取大量的经验数据,只是提取像素的特 征信息,对其中标志像素的特征信息进行比较,计算出相似度就可以完成识别 过程。在遇到一个新的静态图像识别的问题时,可以采用本发明提供的技术方 案,故而本发明图像识别方法具有较好的通用性。
另一方面,本发明的目的还在于提供一种图像识别系统,以提高识别速度 和识别准确度,且该图像识别系统的通用性较好。
为达到上述目的,本发明采用如下技术方案该图像识别系统包括 图像输入模块,用于导入待识别图像的信息;
模板信息选择模块,用于在模板信息库选择目标图像,并读取模板信息库 中目标图像的模板信息,所述模板信息包括目标图像中标识区域的信息、以及 标识区域内标志像素的特征信息;
扫描模块,连接到图像输入模块和模板信息选择模块,依据标识区域的信 息在待识别图像上确定待识别区域,在待识别区域中查找与标识区域中标志像 素对应的像素;并计算查找到的像素的特征信息与标识区域中标志像素的特征 信息的最大相似度;
判断模块,连接到扫描模块,依据计算出的最大相似度,输出所述待识别 图像与所述目标图像相匹配;或者输出所述待识别图像与所述目标图像不匹配。由上述技术方案所描述的图像识别系统,由图像输入模块导入待识别图像 的信息,并通过对比待识别图像的待识别区域内特征信息与目标图像的标识区 域内特征信息,当两者的相似度符合误差要求时,表示找到与待识别图像相匹 配的目标图像,即实现了图像的识别。
由于上述图像识别系统在识别过程中,只需要比较标识区域内和待识别区 域的特征信息,所需要的信息量比现有技术要少很多,并且所比较的特征信息 是像素的特征信息,没有经过任何预处理,不需要大量的图像信息处理和数学 统计计算,也没有复杂的数学变换、演绎推理,使图像识别相对于现有识别技 术而言较快,实现也较为筒单。
由于上述图像识别系统中以模板信息方式保存目标图像的形与像的特征信 息,这些形与像的特征信息相当于动物大脑中的形象知识,并且在识别过程中
不需要对新的目标图像进行特征分析、识别策略分析等复杂工作;也不需要做 大数据量的图像处理,通过对比这些特征信息来模拟动物大脑的形象思维以完 成图像识别。所以本发明图像识别系统相对于现有的图像识别技术而言,其识 别速度快,识别效率得到了提高。
由于上述图像识别系统不需要获取大量的经验数据,只是提取像素的特征 信息,对其中标志像素的特征信息进行比较,计算出相似度就可以完成识别过 程。在遇到一个新的静态图像识别的问题时,可以采用本发明提供的技术方案, 故而本发明图像识别系统具有较好的通用性。


图1是本发明图像识别方法实施例的流程图2是本发明图像识别方法实施例中精确识别的流程图3是本发明图像识别系统实施例的结构图4是本发明图像识别系统实施例的内部结构图5是本发明图像识别方法在票据版面识别中应用的流程图6是票据版面识别中第一 目标票据图像标识示意图7是票据版面识别中第二目标票据图像标识示意图8是票据版面识别中第三目标票据图像标识示意图;图9是票据版面识别中提取的特征信息的几何参数示意图。
具体实施例方式
本发明图像识别方法及系统是一种模仿形象思维的模板式组合标识图像识 别。在现有基于逻辑思维方式的图像识别技术中,需要提取完整的信息、经过 严密的推理与计算、以及有序的处理过程,才能最后完成图像识别。而模仿形 象思维方式的图像识别技术,完全基于图像中形与像的特征信息,所记忆的信 息仅是表征其特征的很少一部分,并且对特征信息的处理是并行的,没有大量 复杂的数学计算和逻辑推理,就可以完成图像识别。比较上述两种基于不同思 维方式的图像识别技术,可知基于形象思维方式的图像识别具有特征信息量小, 处理过程简约、高效的优势。
就目前对形象思维的认知程度,还不能完全模拟形象思维的高级思维活动 来解决图像识别问题。但对于图像静态识别问题,分析形象思维的高级思维活 动特点,模拟特征目标识别过程的主要特点及方法是可以实现的,这也是本发 明的核心思想。
形象思维对图像的识别过程最主要的是直接利用记忆的形与象的特征信 息搜索匹配的目标图像,根据相似程度获得识别结果。这种方法有三个主要特 点第一、直接利用形与像的特征信息搜索匹配的目标图像,不对原始图像信 息作各种预处理;第二、根据不同的识别目标集合及不同的识别准确率要求, 调整参与图像识别的特征信息元素数量;第三、根据统一的相似程度指标判定 识别结果。本发明图像识别方法及系统模拟这三个特点,实现了一种简洁、高 效的图像识别方法,通过使用少量的特征信息,直接匹配目标图像使识别的速 度大大提高;通过使用相似程度指标使该方法可应用于各种静态图像目标的识 别,具有较好的通用性。
下面结合附图对本发明图像识别方法及系统进行详细描述。
如图1所示,为本发明图像识别方法的流程图,该过程包括目标图像的模 板信息准备,以及后续的识别过程,其中步骤101至步骤103为目标图像的模 板信息准备,其后为具体的识别过程。图l所示的具体过程如下
101、调入作为识别目标的图像并将其转换为24位RGB图像,即获取图像的基本信息和特征信息,所述基本信息至少包含目标图像以像素为单位的宽度
Bw、高度Bh和图像分辨率Bf;特征信息是指像素的坐标、亮度和颜色。用鼠标 圏定该RGB图像的局部区域,并将该局部区域作为该目标图像的标识区域。
记录标识区域的信息主要包括标识区域中心坐标偏移P。 ( x, y)、标识区 域参数Reb(l, t, r, b)、搜索区域参数Res(l, t, r, b)。通过这些标识区域的信息 可以准确定位标识区域,然后就可确定标识区域内的特征信息元素个数Na和区 别特征级级特征信息元素个数Nm 。
其中,标识区域中心坐标偏移表示标识区域中心与它的基准坐标点的偏移 量,为了能够更精确地进行图像识别,可以设置主要标识区域和辅助标识区域, 其中主要标识区域的基准坐标点规定为图像左上角(0, O)坐标点;辅助标识 区域的基准坐标点规定为主要标识区域的中心点。
当所选定的标识区域在实际图像中的位置不会变化时,该标识区域称为定 位标识区域,当所选定的标识区域在实际图像中的位置会发生变化时,该标识 区域称为非定位标识区域,本发明中通过表示区域的中心坐标偏移来区分定位 标识和非定位标识,当中心坐标偏移P。为(0, G)时,该标识区域为非定位标 识,否则为定位标识。
一般情况下需要人工选择图像中的主要标识区域,对于定位标识,如果不 进行人工选择标识区域,则自动生成默认的标识区域。根据目标图像的具体情 况可选择或不选择若干个辅助标识区域,辅助标识区域固定为定位标识,其中 心坐标偏移表示以主要标识区域的中心为参考点的坐标偏移。
标识区域参数Reb、搜索区域参数Res与矩形参数定义相同,即1 (left) 表示矩形区域左上角x坐标(中心点的左偏移),t (top)表示矩形区域左上角 y坐标(中心点的上偏移),r ( right )表示矩形区域右下角x坐标(中心点的 右偏移),b (bottom)表示矩形区域右下角y坐标(中心点的下偏移),这样就 构成一个向中心点四周偏移的矩形。
特征信息的元素以Ty (x, y, s, l)表示,其中x、 y表示特征信息^象素点以标 识图像中心为原点的相对几何坐标;s表示特征信息像素点的颜色标记代码;1 表示特征信息像素点的亮度标记代码。
通过上述的步骤101即可提取到目标图像标识区域内的特征信息,完成了对静态目标图像的特征描述。
102、 利用上述目标图像的基本信息、标识区域的信息、以及标识区域内标
志像素的特征信息构成描述目标图像的完整模板信息,然后为模板信息记录项
添加名称和^r索标识代码,并保存该;^莫板信息记录项。所述基本信息至少包含 目标图像以像素为单位的宽度Bw、高度Bh和图像分辨率Bf。本步骤完成了对 静态目标图像的特征记忆。
103、 将至少一个目标图像的模板信息构建成模板信息库。
104、 在识别图像之前,首先在目标模扭.信息库中选择所需的目标才莫板信息,
并将其导入图像识别系统。
105、 调入待识别图像,并将其转换为RGB图像。
106、 根据待识别图像的分辨率与目标模板基本信息分辨率,按下式计算各 标识特征信息元素的几何坐标缩放比值Fk=Df/Bf,其中Df是待识别图像的分 辨率,Bf是目标图像的分辨率。
当待识别图像的中心坐标偏移P。为(0, 0)时,标识为非定位标识,否则 为定位标识。对于非定位标识的识别问题直接转向步骤107。对于定位标识的识 别问题,按如下公式顺序计算与各模板信息的相似指标Xjw、 Xjh。
Xjw= (Fk*Bw-Dw) /Dw;Xjh= ( Fk*Bh - Dh ) /Dh;
其中,Bw、 Bh分别是目标图像的宽度和高度;Dw、 Dh分别是待识别图像的 宽度和高度。设定一个判定指标Ra、 Rb, Ra的取值范围为大于5%小于等于15%; Rb取值范围为大于-15%小于等于-5%;若Rb〈Xjw 〈Ra并且Rb〈Xjh <Ra,则待识别图 像符合目标图像的外形尺寸,转向步骤107,否则重新选择一个目标图像,并执 行步骤106,当待识别图像与所有的目标图像都不符合外形尺寸时,判定结束, 并给出没有找到与待识别图像匹配的目标图像的识别结果。
107、 利用模板信息中主要标识区域的搜索区域参数、标识区域的中心坐标 偏移,在待识别图像中确定待识别区域,并计算主要标识区域内标志像素的特 征信息和待识别区域内像素的特征信息的相似度,设定一个判定指标R。, R。的取 值范围为大于90%小于等于100%。当找到的待识别区域中计算出的最大相似度 满足XSsm〉R。时,则粗略判定待识别图像与目标图像匹配,由于是粗略识别,所
以在本步骤中只需要利用部分标志像素(即区别特征级的标志像素)的特征信息来计算相似度。
对于定位标识的识别问题,具体过程如下
(1 )设定粗略识别X、 Y平面的默认搜索邻域Rd、 Re。 Rd是对应200dpi分 辨率的参数,Ra取值范围为大于50小于等于200。 Re是对应待识别图像分辨率 的参数RHl^(Df/ 200)。根据标识区域的信息中标识区域中心坐标偏移Pc、标 识区域参数Reb、搜索区域参数Res,计算搜索区域Rezs。
如果Res是人工选择的,按下面公式计算搜索区域Rezs:
Rezs. 1= ( Pc. x- (Reb. 1—Res. 1) ) *Fk ; Rezs. r= ( Pc. x+ (Res. r- Reb. r) ) *Fk ;
Rezs. t= (Pc. y-(Reb. t-Res. t) ) *Fk ; Rezs. b= ( Pc. y+(Res. b- Reb. b) ) *Fk ;
如果Res是自动选择的,按下面公式计算搜索过程中心坐标的搜索区域Rezs:
Rezs. l=Pe. x*Fk - Re; Rezs. r=Pe. x*Fk + Re;
Rezs. t=Pc. y*Fk - R" Rezs. b=Pc. y*Fk + Re;
其中,Rezs. l表示以搜索中心坐标为准向左的偏移量,Rezs. r表示以搜索中 心坐标为准向右的偏移量,Rezs. t表示以搜索中心坐标为准向上的偏移量,Rezs. b 表示以搜索中心坐标为准向下的偏移量;搜索中心有标识区域的中心坐标偏移 P。确定。
设置粗略搜索过程X、 Y方向的增量dsx、 dsy。 dsx=Rf*(Df/ 200); dsy=Rf* (Df / 200)。 Rf是对应200dpi分辨率的参数,Rf取值范围为大于1小于等于6。
(2) 由于是针对定位标识的图像识别,可以设定粗略识别最大搜索的偏斜 角度取值范围为大于5小于等于20,记为alfs。旋转角度的搜索范围是(-Ralf ~ Ralf)。设置搜索过程旋转角度的增量(Ut取值范围为大于1小于等于3。
(3) 对区别特征级标志像素的特征信息,按照步骤(2)中的旋转角度以 及旋转角度的步进量(Uf,按照旋转角度的增量变化待识别图像的偏斜角度,在 待识别图像上按照步骤(1)中界定的搜索范围内,按照X、 Y方向的增量dsx、 dsy,搜索待识别区域,将待识别区域中的像素逐步与目标图像中的主要标识区 域内的像素比较,计算出一个相似度XSs。当找到的待识别区域中计算出的最大 相似度满足XsJRc时,返回最大相似度Xs吣当前映射的旋转角度alG和当前 标识区域的搜索中心点坐标PeS,并转向步骤108。如果所有偏斜角度都搜索完 成之后还不能找到满足Xs〉R。的最大相似度,则返回步骤106。对于非定位标识的识别问题,其具体过程如下
1) 将标识区域参数Res设置为待识别图像的整个区域。即Res. 1=0; Res. t=0; Res. r=Dw; Res. b=Dh;其中Dw表示待识别图像的宽度;Dh表示待识别图像的高 度。按下面公式计算搜索区域Rezs:
Rezs. 1= Res. 1 +Cw*Fk/2; Rezs. t= Res. t +Ch*Fk/2;
Rezs. r= Res. r - Cw*Fk/2; Rezs. b= Res. b -Ch*Fk/2;
其中,Cw表示目标图像中标识区域的宽度;Ch表示目标图像中标识区域的 高度。搜索过程X、 Y方向的增量与定位标识粗略搜索过程X、 Y方向的增量相 同,即dsx=Rf*(Df/ 200); dsy=Rf* (Df / 200) 。 Rf是对应200dpi分辨率的参数, Rf取值范围为大于1小于等于6。
2) 对于非定位标识的图像识别,可以设定粗略识别最大搜索的偏斜角度Raf 取值范围为180度,记为alfs。旋转角度的搜索范围(-Ralf ~Ralf),设置搜索 过程旋转角度的增量d^取值范围为大于1小于等于3。
3) 对区别特征级标志像素的特征信息,按照步骤(2)中的旋转角度以及 旋转角度的步进量(Uf,按照旋转角度的增量变化待识别图像的偏斜角度,并在 偏斜后的待识别图像中,按照步骤(1)中界定的搜索范围内,沿X、 Y方向的 增量dsx、 dsy,搜索待识别区域,并将待识别区域内的像素逐步与目标图像中主 要标志区域内的像素比较,计算出一个相似度XSs。当找到的待识别区域中计算 出的最大相似度满足XsJR。时,返回最大相似度XSsm、当前映射的旋转角度alfjs 和当前标识区域的搜索中心点坐标P。s,并转向步骤108。如果所有偏斜角度都 搜索完成之后还不能找到满足XSsm〉R。的最大相似度,则返回步骤106。
通过上述步骤106和107即可完成对图像的粗选匹配。
108、对通过粗选匹配的目标图^象进行进一步的精确识别,精确识别也需要 计算特征信息的相似程度指标,返回最大相似程度指标Xs,设定一个判定指标
l的取值范围为大于90°/。小于等于100°/。。如果最大相似程度指标XSsm〉R。,则 判定待识别图像与目标图像匹配;否则判定待识别图像与目标图像不匹配。
该精确识别的具体流程如图2,所示
Sl、设定精确识别中X、 Y平面的4叟索邻域Rg、 Rh。 Rg是对应200dpi分辨率 的参数,Rg取值范围为大于5小于等于20。 Rh是对应待识别图像分辨率的参数,Rh = Rg*(Df/ 200)。根据粗略识别过程返回的旋转角度alfjs和搜索中心点坐标 Pcs,按下面公式确定精确搜索过程中心坐标的搜索区域Rezjs。
Rezjs. 1=PCS. x—Rh; Re2jS. r=Pcs. x+ R"
Rezjs. t=Pcs. y_Rh; Rezjs. b=Pcs. y+ Rh;
当前映射的旋转角度采用粗略识别过程返回的旋转角度alfjs,还需要设置 搜索过程X、 Y方向的增量dsjx=l; dsjy =1,设定精确识别最大搜索的偏斜角度 Ralfj, R"n取值范围为大于0小于等于5。旋转角度的搜索范围是(alfjs-Ralfj~ alfjs+Ralfj)。设置搜索过程旋转角度的增量dsjalf=l。
52、 对所有标志像素的特征信息,在上述旋转角度的变换范围内,按照旋 转角度的增量变化待识别图像的偏转角度,然后按照X、 Y方向的增量,搜索待 识别区域,并将待识别区域内的像素逐个与主要标识区域内的像素比较,并计 算出相似度XSjs。当找到的待识别区域中计算出的最大相似度满足Xs,L时,返 回最大相似度Xsjsm、当前映射的旋转角度a 1 f jzs和当前标识图像的搜索中心点坐 标P。"并执行步骤S3。如果不能找到满足Xs細〉R。的最大相似度,则输出所述待 识别图像与当前的目标图像不匹配,并返回执行步骤107 (返回后,按照步骤 107中返回当前映射的旋转角度和当前标识区域的搜索中心点坐标,继续进行搜 索),直到系统中的所有模板信息全都被匹配比较完成。
53、 判断目标图像是否设定有辅助标识区域,若设定有辅助标识区域,则 执行步骤S4;否则输出所述待识别图像与当前的目标图像相匹配。
54、 根据精确识别过程返回主要标识的旋转角度alfjzs和搜索中心点坐标 P",按下面公式确定辅助标识搜索过程中心坐标P。fs和搜索区域Refjs,并设置搜 索过程X、 Y方向的增量ds,l; dsjy =1。
Pcfs. x=Pcs. x + (Pcf. x*cos (alf jZS)+Pcf. y*sin (alf jzs)) *Fk;
PCfS. y=Pcs. y + (PCf. x *sin(alf jzs)+ Pcf. y *cos (alf jzs)) * Fk;
Re"" 1= Pcfs. x_ Rh; Ret'jS. r= PCfS. x+ Rh;
Refjs. t= Pcfs. y- Rh; Refjs. b= Pcfs. y+ Rh;
其中Pef是辅助标识区域相对于主要标识中心坐标的偏移。
按下面公式对辅助标识的Nt.个特征信息元素作初始旋转映射变换
Tyi. x = (( Tf" x+ Pcf. x ) *cos (a 1 f jzs) + (Tf" y+ Pcf. y ) * s in (a 1 f jzs)) * Fk - Pcfs. x;Tyi. y = ((Tfi. x+ Pcf, x ) *s in (alf jzs) + ( Tfi. y+ Pcf. y ) *cos (alf jzs)) * Fk - Pcfs. y;
其中,Tyi是第i个辅助标识特征信息元素Tfi作初始旋转映射变换后的元 素。经变换后,旋转映射变换的初始旋转角度alfjs=0,最大搜索的偏斜角度与 精确识别最大搜索的偏斜角度相同,R"fj取值范围为大于0小于等于5,旋转角 度的搜索范围是(-Ralfj~ Ralfj ),并设置搜索过程旋转角度的增量d一产l。
S5、对辅助标识区域中全部标志像素的特征信息,按照S2中同样的方法计 算相似度,并获取最大相似度XSjsm。
当最大相似度Xs一〉Re时,返回最大相似程度指标XsjM、当前映射的旋转角 度alfjfs和当前标识图像的搜索中心点坐标Pew并输出所述待识别图像与当前 的目标图像相匹配;当没有找到满足Xs細〉R。的最大相似度时,则输出所述待识 别图像与当前的目标图像不匹配,并返回执行步骤106,直到系统中的所有模板 信息全都被匹配比较完成。
上述技术方案所描述的图像识别方法,通过选择图像的局部,以模板方式 记忆目标图像中标识区域内的形与像的特征信息,在查找到待识别图像中与标 识区域相对应的待识别区域后,计算待识别区域内的特征信息和标识区域内的 特征信息的相似度,当相似度符合误差要求时,表示找到与待识别图像相匹配 的目标图像,即实现了图像的识别。
由于上述方法中只需要比较标识区域内和待识别区域的特征信息,所需要 的信息量比现有技术要少很多,并且所比较的特征信息是像素的特征信息,没 有经过任何预处理,不需要大量的图像信息处理和数学统计计算,也没有复杂 的数学变换、演绎推理,使图像识别的过程相对于现有识别技术而言较快,实 现也较为简单。
由于上述方法中采用了主要标识区域和辅助标识区域,通过辅助标识区域 内的识别过程可以更进一步地提高识别的准确性。
对应于上述方法构建一个图像识别系统,如图3所示,为本发明图像识别 系统的原理图,该系统至少包含目标图像模板信息生成工具、目标图像模板信 息库和目标图像识别系统三部分,其中模板信息生成工具负责前期目标图像的 模板信息准备,目标图像模板信息库中保存了已准备好的模板信息,目标图像 识别系统主要负责图像的识别。该图像识别系统包括图像输入模块、模板信息选择模块、扫描模块、判断 模块和外形扫描模块,其中各个模块的连接关系和实现的功能如下
如图4所示,图像输入模块,用于导入待识别图像的信息,主要读取图像 的RGB信息。
模板信息选择模块,用于在模板信息库选择目标图像,并读取模板信息库 中目标图像的模板信息,可以根据需要选择不同的模版信息库,所述模板信息 包括目标图像的基本信息、标识区域的信息、以及标识区域内标志像素的特征 信息。扫描模块,连接到图像输入模块和模板信息选择模块,依据标识区域的 信息在待识别图像上确定待识别区域,待识别区域的查找过程和上述图像识别 方法中完全相同,并且查找后需要按照旋转角度来计算待识别区域内特征信息 与标识区域内特征信息的相似度,返回其中最大相似度。判断模块,连接到扫 描模块,依据计算出的相似度,输出所述待识别图像与所述目标图像相匹配; 或者输出所述待识别图像与所述目标图像不匹配。
上述判断模块的具体工作过程如下在存储器中事先保存了特征信息的相 似度判定指标;当扫描模块输出最大相似度时,将该最大相似度与相似度判定 指标比较,若计算出的最大相似度大于相似度判定指标,则输出目标图像与待 识别图像匹配;否则输出目标图像与待识别图像不匹配。
上述的标识区域具有如下特点
1、 人为选定的具有明显视觉效果,反映目标图像特征的局部图像。
2、 分为主要标识区域和辅助标识区域。主要标识只有一个,辅助标识可以 有多个。辅助标识与主要标识的几何位置关系是固定不变的。主要标识用于区 别目标之间的明显差别,多个辅助标识逐级精确区分目标之间的细微差别。
3、 分为定位标识和非定位标识,定位标识是指标识区域在图像的指定区域 内;非定位标识是指不能确定标识在图像中的位置。
对于采用定位标识进行图像识别的情况,在确定待识别区域之前,先要粗 略判断该图像在大小上是否相似,为了选择外形相符的目标图像,本发明图像 识别系统还包括外形扫描模块,连接到才莫板信息选择模块、图像输入模块和扫 描模块,对选择的目标图像进行外形尺寸的比较,用于查找与待识别图像外形 尺寸相符的目标图像,并将所述目标图像的特征信息传送到扫描模块。这样所有进入扫描模块进行识别的目标图像都是在尺寸上符合要求的,不必要对尺寸 不符合的目标图像进行识别,加快了图像识别的过程。
用户通过图像输入模块输入待识别图像后,再通过模板信息选择模块将目 标图像的信息选择,通过外形扫描模块过滤掉外形尺寸不相符的目标图像,然 后通过扫描模块将外形尺寸相符的目标图像和待识别图像进行图像识别。扫描 模块找到待识别区域后,在待识别区域内进行特征信息的比较,计算出相似度, 最后由判断模块利用相似度得出匹配结果。在整个识别过程中只需要比较待识 别区域内的特征信息,所比较的信息相对于现有识别技术要少,并且不需要对 特征信息进行逻辑运算,加快了识别过程。
下面介绍一个采用本发明的票据版面的图像识别过程,票据版面识别是票 据自动处理首先要解决的关键问题。各行各业的票据种类不计其数,新的票据 不断地出现,可用于识别的票面信息千变万化。构建能适应这种变化的票据版 面识别系统是实现票据自动处理的基础。
本发明所述的方法非常有效的解决这一票面信息千变万化票据版面识别问 题。为票据版面识别提供了一种通用的、快速记忆、识别方法。按照本发明所 述的方法构建的票据版面识别系统与图3所示是一致的。只需才艮据票据版面识
别的要求对界面做相应的改动。包括三部分 一、描述票据图像特征的模板信 息生成的工具软件;二、记忆票据图像特征的模板信息库;三、实现票据版面 识别的图像静态目标识别系统。按照本发明所述的方法实现票据版面识别的流 程如图4所示,这一流程又分为两大部分。第一部分是识别前的准备工作,包 括票据图像特征的描述、记忆,识别目标的选择,识别目标集特征信息的优化。 第二部分是在线的识别过程。本发明这种通过模板与标识组合,模拟形象思维 对图像信息进行记忆与识别的方法以及上述的流程设计,使得本发明的实施例 具有如下优点
通过简单人工参与,选择标识区域,实现票据图像特征描述与记忆。 通过简单人工参与,选择目标票据模板信息,实现有限票据类型识别系统 的快速构成。
按照本发明的方法,不对待识别图像进行预处理,直接利用少量特征信息, 通过搜索与匹配,实现图像的快速准确识别。如图5所示包括目标图像的模板信息准备过程,本发明图像识别方法用 于票据版面的识别通过以下步骤实现
401、 在模板工具软件中,按先后顺序打开三个目标票据图像。前两个目标 票据图像如图6、图7所示,票面图像信息基本是一样的。其差别是目标票据 图像l标有"(壹)"字样;目标票据图像2标有"(武)"字样;第三个目标票 据图像与前两个具有不同图像特征的,如图8所示。
402、 按先后顺序分别为三个目标票据图像选择作为主要标识区域的局部图 像,并提取该主要标识区域内标志像素的特征信息,其选择标识类型为定位标 识。特征信息的几何参数示意如图9所示。白点表示标识图像信息点;深色点 表示背景信息点;将主要标识的信息加入到模板中。
根据本发明方法,本实施例中分别选择图6中的Al、图7中的A2和图8中 的A3三个区域的局部图像,作为三个目标票据图像的主要标识区域。
403、 按先后顺序分别为前两个目标票据图像选择作为辅助标识区域的局部 图像,并提取该辅助标识区域内标志像素的特征信息,其选择标识类型为定位 标识。计算以主要标识中心坐标为参考点的辅助标识中心坐标偏移,同时将辅 助标识的信息加入到模板中。
图5中的Bl和图7中的B2两个区域的局部图像作为目标票据图像l、目标 票据图像2的辅助标识区域。
404、 将目标图像的基本信息、主要标识区域的信息、以及主要标识区域内 的提取出的特征信息加入模板,构成描述目标图像特征的完整模板信息,当设 定了辅助标识区域时,还需要将辅助标识区域信息以及其内特取出的特征信息 加入才莫板。其中,基本信息设置如下对目标票据图像l设置Bw-1365; Bh=645; Bf=200;对目标票据图^f象2设置Bw=1368; Bh=643; Bf=200;对目标票据图像 3设置Bw^840; Bh=920; Bf=200。
405、 为模板信息记录项添加票据图像得名称和检索标识代码,并将该模板 记录项保存于模板信息库。
在本实施例中,对目标票据图像1添加票据图像名称为"方正奥德业务档 案综合管理系统转账支票测试样张(壹),,和检索标识代码为011001。对目标 票据图像2添加票据图像目标名称为"方正奥德业务档案综合管理系统转账支票测试样张(武)"和检索标识代码为011002。对目标票据图像3添加票据图像 目标名称为"中国工商银行转账支票(京)"和^r索标识代码为011101。
406、 根据目标图像出现的频率高低,从模板信息库中为票据版面识别系统 选择所需的目标斗莫板。在票据类型目标识别系统,通过检索,显示相关业务票 据模板信息的列表。点击票据模板记录项,可观察对应的目标票据图像和所选 择标识图像。在本实施例中,为本系统选择此前录入的3个目标票据图像的模 板信息,并将其导入票据版面识别系统。
以上步骤就完成了对目标图像的准备工作。
407、 将一个待识别票据图像转换为RGB的24位图像并加载。
408、 根据当前待识别票据图像的分辨率Df与目标模板基本信息分辨率Bf, 计算各标识票据图像和目标票据图像的缩放比值Fk=Df / Bf 。
例如当前待识别图像分辨率-300dpi;目标才莫板基本信息分辨率-200dpi, Fk=300 / 200=1. 5。
409、 本实施例为定位标识的识别问题,按如下公式顺序计算与各模板基本 信息的相似指标Xjw、 Xjh:
Xj> (Fk, Bw-Dw) /Dw; Xjh= ( Fk,Bh - Dh ) /Dh;
其中Bw、 Bh分别是目标票据图像模板信息中的宽度和高度;DW、 Dh分别是 待识别图像的宽度和高度。设定判定指标Ra =10%、 Rb=-10%。如果Rb<Xjw <Ra 并且Rb〈Xjh〈Ra判定该图像符合该目标的外形尺寸,转向步骤411,否则重新选择 一个目标图像,并执行步骤410,当待识别图像与所有的目标图像都不符合外形 尺寸时,判定结束,并给出没有找到与待识别图像匹配的目标图像的识别结果。
在本实施例中的外形尺寸都能够相符。
410、 调用该模板主要标识区域内的标志像素信息,在定位区域内进行粗略 识别的定位标识特征信息的搜索与匹配,
本实施例中粗略识别中计算相似度的过程具体如下 (1 )设定粗略识别X、 Y平面的默认搜索邻域Rd=100。 Re=Rd* (Df / 200) =100* (300/200) =150。
根据主要标识区域的信息中,主要标识区域中心坐标偏移P。、标识区域参 数Reb、搜索区域参数Res计算搜索区域,由于Res是人工选择的,按下面公式计算搜索过程中心坐标的搜索区域Rezs:
Rezs. 1= (Pc. x-(Reb. 1-Res. 1) ) *Fk ;Rezs. r= ( Pc. x+(Res. r- Reb. r) ) *Fk ; Rezs. t= ( Pc. y- (Reb. t-Res. t) ) *Fk ;Rezs. b= ( Pc. y+ (Res. b- Reb. b) ) *Fk ; 设定R严2;那么粗略搜索过程X、 Y方向的增量如下 dsx=Rf*(Df/ 200)=2*(300/200)=3; dsy= dsx。
(2) 对定位标识的待识别票据图像,设定粗略识别最大搜索的偏斜角度 Ralf=l5,偏斜角度记为alfs。旋转角度的搜索范围是(-15 ~15)。设置搜索过 程旋转角度的增量(U产2。
(3) 并在待识别图像内按X、 Y方向的增量,确定待识别区域;在偏斜角 度变化一个增量dsalf=2时,将标识区域中的标志像素的坐标按照偏斜角度旋转, 然后将待识别区域内的像素逐个和变换后的区分级标志像素比较,计算特征信 息相似度XSs。当找到的待识别区域中计算出的最大相似度满足XsJR。时,返回 最大相似度Xsm当前映射的旋转角度alfjs和当前搜索中心点坐标P。s,并执行 步骤411,如果按照所有偏斜角度将待识别图像搜索完成后,还没找到满足 XSs,Re的相似度,则输出目标图像与待识别图像不匹配,并返回执行步骤409。
411、设定精确识别X、 Y平面的搜索邻域Rg、 Rh。 Rg=10, Rh = Rg*(Df/ 200)= Rg* (300 / 200) =15。根据粗略识别过程返回的旋转角度alfjs和搜索中心点坐标 按下面公式确定精确搜索过程中心坐标的搜索区域Rezjs。 ReZjS. 1=PCS. x-Rh; ReZjS. r=Pcs. x+ Rh;
Rezjs. t=Pcs. y-Rh; Rezjs. b=Pcs. y+ Rh;
由于需要进行精确识别,设置搜索过程X、 Y方向的增量和旋转角度的增量 要比较小, 一般设定山,l; ds.iy=l。当前映射的旋转角度是alfjs,设定精确识 别最大搜索的偏斜角度Ralfj=5,旋转角度的搜索范围是(alf js-Ralfj ~ alf js+Ralfj ), 设置搜索过程旋转角度的增量dsjalf=l。
偏斜角度按照旋转角度的增量dsjalf=l变化,将标识区域中的标志像素的坐 标按照偏斜角度进行旋转变换,在待识别图像的待识别区域内按X、 Y方向的增 量dsjx=l; dsjy =1,并计算待识别区域中特征信息和所有变换后的标志像素的特 征信息的相似度Xsjs,当找到最大相似度满足Xs一〉L时,退出搜索匹配过程, 返回最大相似程度指标Xsjsm、当前映射的旋转角度a 1 f jzs和当前搜索中心点坐标P"。当没有找到满足XSjjRe的最大相似度,并返回执行步骤410 (按照410中 返回的当前映射的旋转角度和当前搜索中心点坐标,继续搜索),直到系统中的 所有模板信息全都被匹配比较完成。
判断目标图像是否设定有辅助标识区域,若没有辅助标识区域,则输出所 述待识别图像与当前的目标图像相匹配。若设定有辅助标识区域,根据精确识 别过程返回主要标识的旋转角度a 1 f jzs和搜索中心点坐标P。s,按下面公式确定辅 助标识区域搜索过程中心坐标P。fs和搜索区域Refjs。
PCfS. x=Pcs. x + (Pcf. x *cos (alfjzs)+ Pcf. y *sin(alfjzs)) * Fk;
PCfS. y=Pcs. y + (Pc" x *sin(alfjzs)+ Pcf. y *cos (alf jzs)) * Fk;
RefjS. 1= PCfS- x- R" RefjS. r= PCfS. x+ R"
Refjs. t= Pcfs. y_ Rh; Refjs. b= Pcfs. y+ Rh;
其中P。f是辅助标识与主要标识中心坐标的偏移。设置搜索过程X、 Y方向的 i曽量dsjx=l; dsjy =1。
按下面公式对辅助标识的Nf个特征信息元素作初始旋转映射变换
Tyi. x = (( Tfi. x+ Pcf. x ) *cos (alf jzs) + ( Tfi. y+ Pcf. y ) *sin (alf jzs)) * Fk - Pcfs. x;
Tyi. y = ( (Tfi. x+ Pcf. x ) *sin (alf jzs)+ ( Tfi. y+ Pcf. y ) *cos (alf jzs)) * Fk - Pcfs. y;
其中Tyi是第i个辅助标识区域内的特征信息元素Tn作初始旋转映射变换 后的元素。经变换后,设置旋转映射变换的初始旋转角度alfjs=0。最大搜索的 偏斜角度R"f产2,旋转角度的搜索范围是(-Ralfj~Ralfj),设置搜索过程旋转角度 的增量dsw产l。
对辅助标识区域中所有标志像素的特征信息,当偏斜角度变化一个旋转角
度的增量d一产l时,将辅助标识区域中的标志像素的坐标按照偏斜角度进行旋
转变换,并计算变换后的标志像素的特征信息和搜索区域内像素的相似度XSjs。 如果如果找到最大相似度Xsjsm〉R。,返回最大相似程度指标Xsjsra、当前映射的旋 转角度alfjfs和当前搜索中心点坐标P£fs,并输出所述待识别图像与当前的目标 图像相匹配;如果没有找到满足Xs細〉Re的最大相似度,则输出所述待识别图像 与当前的目标图像不匹配,并返回执行步骤408,直到系统中的所有模板信息全 都4皮匹配比较完成。
上述粗略识别和精确识别过程都需要通过映射变换并计算相似度,该过程具体包括如下步骤
① 按下面公式,对N。个特征信息元素作旋转映射变换。
Tyti. x = Tyi. x *cos(alf0)+ Tyi. y *sin(alf0);
Tyti. y = Tyi. x *sin(alf0)+ Tyi. y *cos(alf0); 其中N。是特征信息中参与搜索匹配的特征信息元素个数,alf。是三维搜索 空间中一个离散点的旋转角度。Tyti是第i个特征信息元素Tyi作旋转映射变换 后的元素。
② 每作一次旋转映射变换后,在三维搜索空间的X、 Y平面,顺序作平移的 映射变换。
对于主要标识按下面7>式计算
Tyyi. x = Tyti. x* Fk + Mx0;Tyyi. y = Tyti. y* Fk + My0; 对于辅助标识按下面公式计算
Tyyi. x = Tyti. x + Mx0;Tyyi. y = Tyti. y + My0; 其中Mx。、 My。是三维搜索空间中旋转角度,等于alf。的平面上一个离散点的 X和Y的坐标。Tyyi是第i个特征信息元素Tyi作旋转、平移映射变换后的元素。 ①、②两步骤并不改变特征信息元素的光学参数。
③ 设定亮度偏差指标Rm。 Rm取值范围为大于5%小于等于20%。对第i个变换 后的特征信息元素,根据其几何坐标参数,直接提取待识别图像中对应像素的
光学参数Dsi(第i个像素点的颜色值)、Dj第i个像素点的亮度值),如果Tyyi.S
(第i个特征信息元素的颜色值)等于Dsi并且(Tyyi. l-Du) / 255的绝对值小于 Rm,判定该特征信息元素相似,否则判定该特征信息元素不相似。^没相似特征信 息元素计数变量Nx记录判定特征信息元素相似的个数。对N。个特征信息元素判 定相似性,相似程度指标Xss按下面公式求取Xss=Nx / N。。
按上述的流程步骤,通过粗略快速搜索和精确细致匹配实现对票据类型的 快速准确识别。
本发明主要用于寻找相匹配的图像,例如票据识别、印章识别等。 以上所述,仅为本发明的具体实施方式
,但本发明的保护范围并不局限于 此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到 变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
权利要求
1、一种图像识别方法,包括(1)获取待识别图像的信息;其特征在于还包括以下步骤(2)在模板信息库中选择目标图像,并将选中目标图像的模板信息导入识别系统,所述模板信息至少包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息;(3)根据标识区域的信息确定待识别图像中的待识别区域;(4)在待识别区域中查找与标识区域中标志像素对应的像素;计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相似度;(5)判断所述最大相似度是否在误差范围内,若在误差范围内,则所述待识别图像与所述目标图像相匹配;否则所述待识别图像与所述目标图像不匹配。
2、 根据权利要求1所述的图像识别方法,其特征在于,所述目标图像的模 板信息按如下步骤提取获取目标图像的宽度、高度和分辨率; 输入标识区域的信息;根据标识区域的信息在所述目标图像中确定标识区域; 获取所述标识区域内标志像素的特征信息,所述特征信息包括该像素的坐 标、亮度和颜色;将图像的宽度、高度和分辨率,标识区域的信息,以及标识区域内标志像 素的特征信息保存为模板信息,并为所述模板信息添加名称和检索码。
3、 根据权利要求1所述的图像识别方法,其特征在于,所述标识区域的信 息包括主要标识区域的信息和/或辅助标识区域的信息。
4、 根据权利要求3所述的图像识别方法,其特征在于,所述主要标识区域 的信息至少包括主要标识区域参数、中心偏移坐标和搜索区域参数,用于确定 主要标识区域;所述辅助标识区域的信息至少包括辅助标识区域相对于主要标 识区域的中心偏移坐标,以及辅助标识区域参数、搜索区域参数,用于确定辅 助标识区i或。
5、 根据权利要求1所述的图像识别方法,其特征在于,所述待识别图像的 信息包括待识别图像的分辨率,所述目标图像的模板信息包括目标图像的分辨率;所述步骤(2)之后还包括如下步骤按如下公式计算待识别图像和目标图像的缩放比值Fk=Df/Bf,其中,Df 为待识别图像的分辨率,Bf为目标图像的分辨率。
6、 根据权利要求1所述的图像识别方法,其特征在于,所述待识别图像的 信息包括待识别图像的宽度和高度,所述目标图像的模板信息包括目标图像的 宽度和高度;若所述标识区域为定位标识,则所述步骤(2)之后还包括查找 与待识别图像外形尺寸相符的目标图像,具体方法如下计算待识别图像和目标图像的相似指标,公式为Xjw= (Fk*Bw-Dw) /Dw,X jh= ( Fk*Bh - Dh ) /Dh,其中,Bw为目标图像的宽度,Bh为目标图像的高度,Dw为待识别图像的宽 度,Dh为待识别图像的高度;判断X;和Xjh是否在误差范围内,如果在误差范围内,则该目标图像的外 形尺寸与待识别图像的外形尺寸相符;否则该目标图像的外形尺寸与待识别图 像的外形尺寸不相符。
7、 根据权利要求1所述的图像识别方法,其特征在于所述步骤(4)具体 包括设定偏转角度范围和偏转角度的增量; 在偏转角度范围内,按照偏转角度的增量确定偏转角度; 将目标图像中标识区域内的标志像素坐标按照偏转角度进行变换; 在待识别区域中查找与变换后的标志像素相对应的像素; 计算查找到的像素的特征信息与标识区域中标志像素的特征信息的最大相 似度。
8、 一种图像识别系统,包括 图像输入模块,用于导入待识别图像的信息; 其特征在于还包括模板信息选择模块,用于在模板信息库选择目标图像,并读取模板信息库中目标图像的模板信息,所述模板信息包括目标图像中标识区域的信息、以及标识区域内标志像素的特征信息;扫描模块,连接到图像输入模块和模板信息选择模块,依据标识区域的信 息在待识别图像上确定待识别区域,在待识别区域中查找与标识区域中标志像 素对应的像素;并计算查找到的像素的特征信息与标识区域中标志像素的特征 信息的最大相似度;判断模块,连接到扫描模块,依据计算出的最大相似度,输出所述待识别 图像与所述目标图像相匹配;或者输出所述待识别图像与所述目标图像不匹配。
9、 根据权利要求8所述的图像识别系统,其特征在于,所述判断模块包括 存储器,用于保存目标图像与待识别图像匹配的相似度判定指标; 比较器,连接到扫描模块和存储器,用于比较计算出的最大相似度与存储器中的相似度判定指标,若计算出的最大相似度大于相似度判定指标,则输出 目标图像与待识别图像匹配;否则输出目标图像与待识别图像不匹配。
10、 根据权利要求8所述的图像识别系统,其特征在于还包括 外形扫描模块,连接到模板信息选择模块、图像输入模块和扫描模块,用于查找与待识别图像外形尺寸相符的目标图像,并将所述目标图像的特征信息 传送到扫描模块。
全文摘要
本发明公开了一种图像识别方法及系统,涉及采用模式识别技术对静态的目标图像进行识别的方法及系统。解决了现有图像识别技术中速度相对较慢问题。该图像识别方法及系统将图像的标识区域信息和标识区域内的特征信息保存为模板信息,然后利用标识区域确定待识别图像中的待识别区域,然后比较标识区域和待识别区域内的特征信息,当两者的相似度在误差范围时,认为待识别图像和目标图像相匹配,实现图像识别,在识别过程中,只需要比较待识别区域的特征信息,数据量较少,并且不需要对特征信息进行逻辑推理和数学运算,从而加快了图像识别速度。本发明主要用于寻找相匹配的图像,例如票据识别、印章识别等。
文档编号G06K9/32GK101464951SQ200710301950
公开日2009年6月24日 申请日期2007年12月21日 优先权日2007年12月21日
发明者曾培祥 申请人:北大方正集团有限公司;北京方正奥德计算机系统有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1