一种基于网格多级精确度递进式比划识别方法

文档序号:8223862阅读:373来源:国知局
一种基于网格多级精确度递进式比划识别方法
【技术领域】
[0001] 本发明涉及比划识别、草图检索领域,具体涉及到一种基于网格多级精确度递进 式比划识别方法。
【背景技术】
[0002] 基于关键字或基于自然语言的信息检索技术是现有的常用技术,输入文本可W检 索到兴趣数据(如文本、图片或声音等)该极大地提高了人们搜集信息的能力。一些更为 精确与直观的检索需求逐渐浮出了水面且近些年也引起了学界较大的关注,常见的如基 于语意的多媒体信息检索(图片、视频或声音等),更为直观的是基于内容的信息检索即 CBIR(Content-based image retrieval),简单来讲可W认为是W图搜图-即图片本身 替代了关键字,搜索的目标是与原图相同或相近的图片。
[0003] 若想要搜索一幅与现有图片相近的图片,又或者是已知一幅图片的部分但想搜索 到整幅图片,此时就无法很好地判别需要的关键字,该种情况需要的就是CBIR技术。CBIR 技术从检索结果上看可W分为两类:一类是检索与原图基本一致或部分区域基本一致的图 片;一类是检索与原图部分特征(如颜色分布、纹理、轮廓等)相近的图片;后者的更直接 的应用为草图检索,即手绘简单的草图作为检索内容。
[0004] 草图通常通过手绘的方式得到,手绘图形也常被称为"比划"。比划的识别是草图 检索的核也部分,而草图的最重要的是特征提取与匹配。而特征值的提取和匹配一直是草 图检索领域的难点和关键点,其直接决定了检索的整体性能,同时决定了其能满足的应用。 草图检索的实际应用如大型搜索引擎中通过web页面手绘输入图片进行检索,也如近几年 兴起的儿童画板类应用:W儿童随手绘制出脑海里的画面作为输入,系统根据其提供出大 量相近的但颜色纹理细节更为生动复杂的候选,之后儿童选取系统提供的该些更适合用于 绘画局部元素来拼接出画面。

【发明内容】

[0005] 本发明为克服上述现有技术所述的至少一种缺陷,提出一种直观、高效率且对起 点及比划顺序无依赖的基于网格多级精确度递进式比划识别方法。
[0006] 为了达到上述技术效果,本发明的技术方案如下:
[0007] -种基于网格多级精确度递进式比划识别方法,包括W下步骤:
[0008] S1 ;建立比划模板库;采集若干个不同的比划并分别对其依次进行重采样规范 化、旋转规范化、缩放规范化、平移规范化处理,分别在若干级精确度下对处理后的比划进 行拓扑特征向量的提取,最后将原始采集的比划和其特征向量作为一个比划模板来建立比 划模板库,其中采集的比划经缩放规范化后被一标准包围框所包围,将该标准包围框分割 为若干子网格,标准包围框被分割为不同的子网格数即表示该识别方法的不同级别的精确 度,子网格数越多该方法的精确度级别越高;
[000引 S2 ;提取待识别的比划特征向量:对用户输入的比划A依次进行重采样规范化、旋 转规范化、缩放规范化、平移规范化处理得到比划A*,对比划A*进行若干级精确度下拓扑 特征向量的提取;
[0010] S3 ;计算得到模板库中与提取出的比划A的拓扑特征向量差距最小的比划模板, 并将其作为输出识别结果。
[0011] 本发明中,对于待识别比划或是待采集的模板比划,其第一步均为规范化。规范化 的目的在于消除因人为绘制习惯而引入的干扰,同时做到旋转、缩放无关性。对于需要采集 入库作为模板的比划,过程是先规范化,之后提取出其由多级精确度下拓扑特征组成的特 征向量,后将比划和其特征向量作为一个比划模板采集入模板库。而对于待识别比划,也即 先规范化,然后提取出其由多级精确度下拓扑特征组成的特征向量,然后与模板库中各模 板的特征向量进行比较得出识别结果。
[0012] 进一步地,所述步骤S1中的重采样规范化的处理过程如下:
[001引 S11 ;计算输入比划的路径长度pathLength :
[0014]
【主权项】
1. 一种基于网格多级精确度递进式比划识别方法,其特征在于,包括以下步骤: 51 :建立比划模板库:采集若干个不同的比划并分别对其依次进行重采样规范化、旋 转规范化、缩放规范化、平移规范化处理,分别在若干级精确度下对处理后的比划进行拓扑 特征向量的提取,最后将原始采集的比划和其特征向量作为一个比划模板来建立比划模板 库,其中采集的比划经缩放规范化后被一标准包围框所包围,将该标准包围框分割为若干 子网格,标准包围框被分割为不同的子网格数即表示该识别方法的不同级别的精确度,子 网格数越多该方法的精确度级别越高; 52 :提取待识别的比划特征向量:对用户输入的比划A依次进行重采样规范化、旋转规 范化、缩放规范化、平移规范化处理得到比划A*,对比划A*进行若干级精确度下拓扑特征 向量的提取; 53 :计算得到模板库中与提取出的比划A的拓扑特征向量差距最小的比划模板,并将 其作为输出识别结果。
2. 根据权利要求1所述的比划识别方法,其特征在于,所述步骤Sl中的重采样规范化 的处理过程如下: 511 :计算输入比划的路径长度pathLength :
,式中points为输入比划包含的点的有序 集合,Ien为points中点的个数,points [i]表示集合中第i个点,Dis (pl, p2)为计算点pi 与p2间欧氏距离的函数; 512 :计算重采样后每两点之间的相隔距离interval : interval = pathLength/numPointsEachSketch,式中 numPointsEachSketch 为米样点 数目; 513 :以points中第一个点作为重采样第一个点,之后沿着points中点的轨迹移动,每 隔interval距离就采样一次,直至采样点总数递增到numPointsEachSketch。
3. 根据权利要求2所述的基于网格多级精确度递进式比划识别方法,其特征在于,所 述步骤Sl中的旋转规范化的处理过程如下: 计算出集合points的重心c和距重心c最远的点f ;作f到c的连线L,计算L相对用 户比划输入设备的水平方向的顺时针夹角Y ;将比划整体围绕重心c顺时针旋转γ度,使 得L平行于用户比划输入设备的水平方向。
4. 根据权利要求3所述的基于网格多级精确度递进式比划识别方法,其特征在于,所 述步骤Sl中缩放规范化用于使得不同的比划在用户比划输入设备上被具有大小相同的标 准包围框所包围,其处理过程如下: 求出包围当前比划A的最小矩形包围框的宽度X和高度y ;将比划A的最小矩形包围 框整体宽度缩放M/x倍,将比划A的最小矩形包围框整体高度缩放M/y倍,其中M为标准包 围框的宽与高。
5. 根据权利要求4所述的基于网格多级精确度递进式比划识别方法,其特征在于,所 述步骤Sl中的平移规范化用于将A的中心平移至标准包围框中心。
6. 根据权利要求5所述的基于网格多级精确度递进式比划识别方法,其特征在于,所 述步骤S2中提取比划的特征向量的过程如下: 521 :令最高精确度下标准包围框被细分为m2个紧密的子网格,Grid[i][j]代表在行 优先顺序下的第个子网格,i彡0, j〈m,将任一网格Grid[i] [j]细分为左上、左 下、右上、右下四个区域,同时将比划A*进入该网格的点记为入点a,将比划A*离开该网格 的点记为出点b,设置比划A*在该子网格处特征值Hag ij如下: S211 :入点a和出点b均不在该网格中,则A*在该网格的特征值为0x00 ; S212:入点a和出点b中一点位于左上,一点位于右上,则A*在该网格的特征值为 0x01 ; S213:入点a和出点b中一点位于左下,一点位于右下,则A*在该网格的特征值为 0x02 ; 5214 :入点a和出点b中一点位于左上,一点位于左下,则A*在该网格的特征值为 0x03 ; 5215 :入点a和出点b中一点位于右上,一点位于右下,则M在该网格的特征值为 0x08 ; 5216 :入点a和出点b中一点位于左上,一点位于右下,则A*在该网格的特征值为 0x10 ; 5217 :入点a和出点b中一点位于左下,一点位于右上,则A*在该网格的特征值为 0x20 ; 5218 :入点a和出点b中一点位于左上,另一点不存在或也位于左上,则A*在该网格的 特征值为0x40 ; 5219 :入点a和出点b中一点位于左下,另一点不存在或也位于左下,则A*在该网格的 特征值为0x80 ; 5220 :入点a和出点b中一点位于右上,另一点不存在或也位于右上,则A*在该网格的 特征值为0x100 ; 5221 :入点a和出点b中一点位于右下,另一点不存在或也位于右下,则A*在该网格的 特征值为0x200 ; 若比划A*的轨迹不止一次跨越一网格,则该格的最后特征值f Iagu为对多次跨越特征 值间取逻辑或操作所得值: Hagij =特征值11特征值2 I特征值3……特征值n,其中η为比划轨迹跨越此网格的 次数; 因此比划Α*在最商精度下的特征向量!^为: β 1= (flag 〇〇,......, fIag〇(^1),......,fIag0ll-D0,......, fIagf^1) ; 522 :将网格精确度重复降低数次并分别提取出此精度下比划Α*的拓扑特征向量,此 操作迭代η次,最后该比划A的特征向量为:β Α= β Α*= (β η…,β i,…,β n)。
7.根据权利要求6所述的基于网格多级精确度递进式比划识别方法,其特征在于,所 述步骤S3的处理过程如下: 令Similarity (A,B)为比划A与网络中一比划B间的相似度,则有:
β A为比划A的特征向量,β B为比划B的特征向量,i 2为不同精确度下Eval函数的权 值;
,cal (a,b)函数的输出通过查表得出:
【专利摘要】本发明提供了一种基于网格多级精确度递进式比划识别方法,该方法采集若干个不同的比划并分别对其依次进行重采样规范化、旋转规范化、缩放规范化、平移规范化处理,对处理后的比划进行若干级精确度下拓扑特征向量的提取,最后将原始采集的比划和其特征向量作为一个比划模板存入模板库;用户输入比划A,对比划A依次进行重采样规范化、旋转规范化、缩放规范化、平移规范化处理得到比划A*,对比划A*进行若干级精确度下拓扑特征向量的提取;计算模板库中与提取出的比划A的拓扑特征向量差距最小的比划模板,并将其作为输出识别结果。
【IPC分类】G06K9-68, G06K9-00
【公开号】CN104537343
【申请号】CN201410822919
【发明人】纪庆革, 王新文, 严聪, 印鉴
【申请人】中山大学, 广州智海纵横信息科技有限公司, 广州中大南沙科技创新产业园有限公司
【公开日】2015年4月22日
【申请日】2014年12月22日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1