基于图像边缘和线条特征的三维模型检索方法

文档序号:10570062阅读:232来源:国知局
基于图像边缘和线条特征的三维模型检索方法
【专利摘要】本发明涉及基于图像边缘和线条特征的三维模型检索方法,首先,通过爬取互联网中发布的三维模型数据及上下文图像,建立原始数据库;然后通过提取上下文图像的色彩特征和三维模型形状特征,对原始库进行聚类预处理并定义初步类别权值;在此基础上,为图像提取边缘线条及局部Zernike矩特征、Gabor滤波特征,以加权形式组成上下文图像原始特征库。同样,采用视觉词袋方法,从编码和权重计算后的特征库中检索出经过相似度排序的上下文图像,实现三维模型检索。解决了视图冗余、视点选择困难的问题。
【专利说明】
基于图像边缘和线条特征的三维模型检索方法
技术领域
[0001] 本发明涉及计算机图形领域,尤其涉及基于图像边缘和线条特征的三维模型检索 方法。
【背景技术】
[0002] 在三维模型检索领域,图像是最为简单自然的检索接口。采用图像进行三维模型 检索的核心难题是如何评价图像和三维模型的相似性。理论上讲,通过图像的形态和三维 模型视图进行相似性匹配就可以得到检索结果,但是这种研究思路存在如下两个问题:
[0003] (1)对于任意一个三维模型需要多个视图来保证检索准确率,极大地降低了检索 效率。三维模型各视图分别表现不同视点下同一个三维模型的姿态。已有的方法中,通常将 为三维模型提取均匀的数十甚至数百幅视图以保证足够全面的检索范围。
[0004] (2)如何选择视点;对于一个三维模型,可以得到数十上百幅视图。应该如何选择 视图?通过比较三维模型已有视点选择算法得到的最优渲染视图和用户感知所设计的渲染 图像,发现最优视图和用户感知所设计的渲染方法存在非常明显的差异:包含最丰富信息 的视图并非是用户偏好的角度;仅通过视点选择和程序渲染的视图只包含基本光照和线 条。

【发明内容】

[0005] 本发明为克服上述的不足之处,目的在于提供基于图像边缘和线条特征的三维模 型检索方法,本方法首先依据图像颜色矩和三维模型投影轮廓形状特征的对原始模型库进 行聚类预处理,然后为三维模型上下文图像提取图像线条、Zernike矩特征和Gabor边缘特 征,以加权特征建立原始特征库;最后,采用视觉词袋方法,将输入源与上下文图像依据加 权特征进行相似性排序,实现三维模型检索。解决了三维模型视图提取中的冗余和视点选 择困难问题。
[0006] 本发明是通过以下技术方案达到上述目的:基于图像边缘和线条特征的三维模型 检索方法,包括如下步骤:
[0007] (1)爬取并存储网络发布的三维模型及其上下文图像集;
[0008] (2)分别为上下文图像集和三维模型提取颜色矩和形状上下文特征,建立相近特 征三维模型间的预关联,对上下文图像集作聚类预处理;
[0009] (3)对预处理后的上下文图像集提取图像特征线条,基于图像特征线条计算八阶 及八阶以内的Zerni k矩,以上下文图像的八方向Gabor边缘滤波响应作为其边缘特征,以加 权混合特征作为上下文图像特征库;
[0010] (4)以上下文图像均匀网格点的局部邻域特征为块建立原始特征链;
[0011] (5)根据视觉词袋方法对模型与上下文图像库生成的所有原始局部特征进行聚类 生成词袋,利用原始特征链依据词袋进行词频编码,并进行权重计算,生成新的特征库; [0012] (6)对输入的自然图像提取线条特征的Zernike矩和Gabor边缘滤波响应,将特征 链根据词袋进行编码和权重计算,在新特征库遍历进行相似度计算,获得三维模型排序。
[0013] 作为优选,所述步骤(1)以单一对应方式爬取网络发布的三维模型及其上下文图 像集。
[0014] 作为优选,所述步骤(2)建立相近特征三维模型间的预关联的步骤如下:
[0015] 1)为三维模型提取最优视点,并在最优视点下利用固定光场进行正交投影提取模 型形状轮廓;
[0016] 2)利用模型形状轮廓的形状采样特征实现三维模型的细分聚类,形成模型类别权 重。
[0017] 作为优选,所述步骤(2)对上下文图像集作聚类预处理的方法为利用k-means算法 对上下文图像集的颜色矩特征进行初步聚类,形成图像类别权重。
[0018] 作为优选,所述步骤(3)提取的图像特征线条包括Canny边缘和二值化外轮廓;图 像特征线条的提取方法如下:
[0019] (a)对上下文图像进行二值化,利用快速连通区域标记法优化二值化阈值;
[0020] (b)对二值化阈值图采用均匀射线法提取外轮廓,利用Canny算子提取上下文图像 的边缘,取两者或操作的结果;
[0021] (c)基于步骤(b)的结果利用形态学膨胀融合细碎边缘。
[0022] 作为优选,所述步骤(3)的Zernik矩的计算公式如下:
[0023] Z={|Znin| |nG [0,8] ,mG [0,n]}
[0024] 其中,| Z? |为幅值。
[0025] 作为优选,所述步骤(5)中进行权重计算的方法如下:
[0026] (i)以每个原始局部特征单元邻域为单位,使用k-means算法对特征库中的特征单 位进行聚类,以产生1000个聚类中心作为单元词汇表生成词袋;
[0027] (ii)利用原始特征链将特征链的所有单位以1000个中心词汇为横轴,将其统计为 词频直方图;
[0028] (iii)利用权重计算公式对词频直方图进行词汇权重计算。
[0029]作为优选,所述权重计算公式为
[0031 ] fi为词汇i在整个特征库中出现的频率;N表示原始特征库中的特征链总数。
[0032]作为优选,所述步骤(6)中相似度计算采用夹角函勠
衡量输 入图像特征Hi与库中特征Hj的相似度。
[0033]本发明的有益效果在于:(1)本发明解决了对于任意一个三维模型需要多个视图 来保证检索准确率的问题,极大地提高了检索效率;(2)解决了三维模型的视点选择困难问 题。
【附图说明】
[0034]图1是本发明方法的流程示意图;
[0035]图2是本发明实施例三维模型和图像聚类预处理的流程示意图;
[0036]图3是本发明实施例三维模型与最大可见面积比视图;
[0037] 图4是本发明实施例光场投影与形状线条对比图;
[0038] 图5是本发明实施例两个类别的图像抽样示意图;
[0039] 图6是本发明实施例图像边缘线条提取示意图;
[0040] 图7是本发明实施例图像边缘特征提取示意图;
[0041] 图8是本发明实施例的局部邻域示意图;
[0042] 图9是本发明实施例Zernik矩方差对比示意图;
[0043] 图10是本发明实施例基于上下文图像的模型检索示例图1;
[0044] 图11是本发明实施例基于上下文图像的模型检索示例图2;
[0045] 图12是本发明实施例基于上下文图像的模型检索示例图3。
【具体实施方式】
[0046] 下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围并不仅限于 此:
[0047]实施例:如图1所示,基于图像边缘和线条特征的三维模型检索方法,包括如下步 骤
[0048]步骤一,首先以直观的单一对应方式,爬取三维模型与单幅上下文图像共同构成 了三维模型及其上下文图像集。
[0049]步骤二,如图2所示,利用颜色矩初步为模型上下文图像进行粗聚类。和颜色直方 图相似,颜色矩是一种更为有效的颜色特征表示,利用线性代数中矩的概念,将图像中的颜 色分布用其矩表示。利用颜色一阶矩(平均值)、颜色二阶矩(方差)和颜色三阶矩(偏斜度) 来描述颜色分布,有
[0051 ]其中,pi, j为图像第i个颜色通道中灰度值为j的像素出现概率,N为像素总数。与颜 色直方图不同的是,利用颜色矩进行图像描述无需量化图像特征。由于每个像素具有颜色 空间的三个颜色通道,因此图像的颜色矩有9个分量来描述。由于颜色矩的维度较少,本发 明将其用于初步的图像聚类。
[0052]三维模型及其上下文图像集聚类预处理中,加权特征的第二部分为三维模型的形 状特征。本发明采用三维模型最优视点下的二值投影轮廓特征表示该三维模型的形状特 征。其中,考虑聚类预处理的效率与有效性,最优视点选择方法采用可见面积比。可见面积 比由当前视点下可见面片的数量衡量视点的信息量,即特定视点v下的可见面积比为
,Si是可见面片i的面积,Sa*模型总表面积,如图3所示。
[0053]在获得特定模型的最优视点后,对二维模型在该方向上进行投影和轮廓提取。使 用光场描述符(light field descriptor)对固定光场进行正交投影,获得模型投影视图。 轮廓提取使用稠密射线对投影图像进行扫描,取阈值变化点进行连接。
[0054]本发明采用形状上下文(shape C〇nteXt,SC)描述模型投影形状特征,即对模型的 投影轮廓进行采样,用有限边界点集D= {cU,d2,…,dm}表示模型视图,并使采样点集尽可能 均匀地分布于整个边界,以保留完善的形状信息,如图4所示。
[0055]采样点集中任意点cU与其余所有点构成的向量组刻画了其在整个形状中的相对 位置,D中所有点构成的向量组集合将能够表述视图完整的轮廓形状。其中,离散化采样密 度越高点集维度越高,自然就越能精确的描述一个形状。对连接任意两个采样点cU、山的线 段进行评价,若完全落入形状区域内部,则将其加入图G(V,E)中,有
[0057] 其中,取权重| |cU-山| |为x7)2+(_yf-_y7)2。根据G(V,E)各采样点距离关系, 以最短路径法计算采样点di到dj的内在距离。lij = di-dj,( i辛j),有 ~ J J j 一 lu …f7:l ... ~1
[0058] L- l\j ifj …lnj ' -?+ ? iltn- :im- "」(m-1)⑶
[0059] 最后,对内在距离矩阵规范化处理后,为边界点集D建立特征矩阵,有
[0060] T = {S(cU) :norm{lii,…,lij,…,lim},j辛i,cUGD} ?
[0061 ]其中,S(di)为采样点di到其余所有点内在距离的归一化结果,取s (di) G [0,10], 如图5所示。
[0062]最后,使用k-means对三维模型上下文图像集颜色矩特征进行初步聚类,将聚类结 果以权重形式计入依据三维模型形状特征的细分聚类中完成二次权值划分。
[0063]步骤三,完成三维模型及其上下文图像集的预聚类后,需要将模型上下文图像集 进行加权混合特征提取,以建立上下文图像特征库。为覆盖图像的整体形状特征,本方法引 入了 Zernike矩特征,低阶矩描述了图像目标的整体形状,而高阶矩加强了图像目标的细节 描述。
[0064] l)Zernike矩,即对密度函数f (x,y)的图像,11阶1]1重的复数泽尼克矩为
[0066] 其中,f (r,0)为灰度图像极坐标表示,n = 0,1,"、°°,|m|=0,l,…,n并满足n-|m| 为偶数,*为复数共辄,Vn^Xj)为泽尼克多项式,有
[0067] Vnm(x,y) = Vnin(r , 0) = Rnm(r)e:im0.
[0068] Vr?(x,y)是基于x2+y2彡1的一组完备正交函数,即满足
[0070] 其中,snp为克罗内克符,有 「 n . I1 'l1 = p
[00711 S < npl0,其他
[0072] Rr?(r)是实值径向多项式
[0074]满足正交关系
[0076] Zernike矩对目标形状具有良好的表述能力,为像素点领域Nz XNZ求取Zernike矩 局部特征时,离散计算中使用求和代替积分
[0082] Zernike矩为复数矩,记为,供""为相位,|Znm|为幅值;本发明将幅值作为 特征提取。
[0083] 2)计算图像块的Zernike矩时需将图块中心平移至坐标原点,将图块像素映射至 单位圆内,Zernike矩具备旋转不变性,可将幅值| Znm |作为图像不变特征,图像低频特征由 匕,,(r.的中r值较小的部分提取,高频特征有r值较大部分提取,上述可见,Zernike矩可构造 任意高阶矩。
[0084]为进一步规避Zernike矩的弱势,即不具备平移和尺度不变性,本发明采用标准矩 的方法对图块在特征提取前进行了归一化,令Mi j = 2 5: Xiyjf 〇 ( X,y ),有像素和为S = MQQ,图 像重心为
[0086]将图块重心取代图块中心平移至坐标原点使其具备平移不变性,将图块密度函数 f〇(x,y)变换为
[0088]最终,将图像go(x,y)的Zernike矩作为其旋转、平移和尺度不变特征。
[0089]边缘线条提取中,本方法首先对三维模型的上下文图像(图6的a)进行二值化,使 用快速连通区域标记法优化了二值化阈值;然后对图6的a图采用与和图4相同的射线法提 取外轮廓,利用Canny算子提取上下文图像的边缘,取两者或操作的结果;最后,利用形态学 膨胀融合了细碎边缘,如图6的b图所示。本方法在侧重图像形状的Zernike矩特征提取中, 首先为图像提取边缘线条后进行网格采样划分,然后为图块单独提取n阶内Zernike矩。
[0090] 本发明进一步对提取后的边缘线条图像以及原图进行了特征提取对比,如图7所 示;效果显示,直接滤波特征相对于混合边缘将自然图像边缘特征保留得更为完整,也避免 了高耗时的阈值优化过程。
[0091] 特征加权与存储中,为保证尺度一致性,局部邻域采用全局百分比形式。如图8所 示,令图像尺度规范后长宽比1:1,宽为W。则,若局部邻域尺度为pXp时,表示图块(红蓝矩 形)宽度占图像宽度的P%,以W = 400像素 ,p = 4为例,此时整图将有25X25个规格为4X4像 素的局部邻域图块组成。
[0092] Zernike矩特征提取中,本发明首先对比了形状、纹理存在差异两类模型上下文图 像进行了实验论证,椅子、汽车模型上下文图10副,如图5所示;本发明将图像依次编号后, 取S={s2(i,j) |i,jG[l,20]}。其中i,jGN,s2(i,j)为图像i、j边缘线条图的8阶以内 Zernike矩的方差,有
[0093] Z={|Znin| |nG [0,8] ,mG [0,n]}.
[0094] 其中,n,mGN,方差分布如图9所示。不难看出,相同的上下文图像类别内的 Zernike矩特征明显相似,而属于不同类别的特征均值存在较大的差异。但是,从个例看,异 类模型上下文图像的Zernike矩特征相似性存在波动,也暴露出Zernike在整幅图像的特征 描述中仍然存在一定弊端。本发明在纹理特征描述中加入Zernike矩特征,避免了单一特征 的局限也有利于从检索评价结果来逆向调整各自的特征权重,提高检索系统中特征提取的 灵活性。
[0095] 步骤四,本发明检索匹配算法以视觉词袋为模型,以特征链预编码的形式大幅降 低检索匹配耗时。词袋建立过程中,使用k-means对特征库中的数量庞大的特征单位进行聚 类,以产生K个聚类中心组成视觉词袋。词频编码中,利用词袋量化特征链,以K个中心词汇 为横轴,将其统计为词频直方图。最后采用权重计算公式
__进行词频直方的 权重计算。其中,fi为词汇i在整个特征库中出现的频率;N为整个特征库中特征链总数。 [0096]步骤五,对输入的自然图像提取线条特征的Zernike矩和Gabor边缘滤波响应,将 特征链根据词袋进行编码和权重计算,使用夹角函数衡量归一化后的词频直方出与出的相 似度
,最终获得三维模型排序。如图1 〇-图12所示。
[0097]以上的所述乃是本发明的具体实施例及所运用的技术原理,若依本发明的构想所 作的改变,其所产生的功能作用仍未超出说明书及附图所涵盖的精神时,仍应属本发明的 保护范围。
【主权项】
1. 基于图像边缘和线条特征的三维模型检索方法,其特征在于包括如下步骤: (1) 爬取并存储网络发布的三维模型及其上下文图像集; (2) 分别为上下文图像集和三维模型提取颜色矩和形状上下文特征,建立相近特征三 维模型间的预关联,对上下文图像集作聚类预处理; (3) 对预处理后的上下文图像集提取图像特征线条,基于图像特征线条计算八阶及八 阶以内的Zernik矩,以上下文图像的八方向Gabor边缘滤波响应作为其边缘特征,以加权混 合特征作为上下文图像特征库; (4) 以上下文图像均匀网格点的局部邻域特征为块建立原始特征链; (5) 根据视觉词袋方法对模型与上下文图像库生成的所有原始局部特征进行聚类生成 词袋,利用原始特征链依据词袋进行词频编码,并进行权重计算,生成新的特征库; (6) 对输入的自然图像提取线条特征的Zernike矩和Gabor边缘滤波响应,将特征链根 据词袋进行编码和权重计算,在新特征库遍历进行相似度计算,获得三维模型排序。2. 根据权利要求1所述的基于图像边缘和线条特征的三维模型检索方法,其特征在于: 所述步骤(1)以单一对应方式爬取网络发布的三维模型及其上下文图像集。3. 根据权利要求1所述的基于图像边缘和线条特征的三维模型检索方法,其特征在于: 所述步骤(2)建立相近特征三维模型间的预关联的步骤如下: 1) 为三维模型提取最优视点,并在最优视点下利用固定光场进行正交投影提取模型形 状轮廓; 2) 利用模型形状轮廓的形状采样特征实现三维模型的细分聚类,形成模型类别权重。4. 根据权利要求1所述的基于图像边缘和线条特征的三维模型检索方法,其特征在于: 所述步骤(2)对上下文图像集作聚类预处理的方法为利用k-means算法对上下文图像集的 颜色矩特征进行初步聚类,形成图像类别权重。5. 根据权利要求1所述的基于图像边缘和线条特征的三维模型检索方法,其特征在于: 所述步骤(3)提取的图像特征线条包括Canny边缘和二值化外轮廓;图像特征线条的提取方 法如下: (a) 对上下文图像进行二值化,利用快速连通区域标记法优化二值化阈值; (b) 对二值化阈值图采用均匀射线法提取外轮廓,利用Canny算子提取上下文图像的边 缘,取两者或操作的结果; (c) 基于步骤(b)的结果利用形态学膨胀融合细碎边缘。6. 根据权利要求1所述的基于图像边缘和线条特征的三维模型检索方法,其特征在于: 所述步骤(3)的Zernik矩的计算公式如下: Z={|Znm| |ne [0,8] ,me [〇,n]} 其中,IZnmI为幅值。7. 根据权利要求1所述的基于图像边缘和线条特征的三维模型检索方法,其特征在于: 所述步骤(5)中进行权重计算的方法如下: (i) 以每个原始局部特征单元邻域为单位,使用k-means算法对特征库中的特征单位进 行聚类,以产生1000个聚类中心作为单元词汇表生成词袋; (ii) 利用原始特征链将特征链的所有单位以1000个中心词汇为横轴,将其统计为词频 直方图; (iii)利用权重计算公式对词频直方图进行词汇权重计算。8. 根据权利要求7所述的基于图像边缘和线条特征的三维模型检索方法,其特征在于: 所述权重计算公式为fi为词汇i在整个特征库中出现的频率;N表示原始特征库中的特征链总数。9. 根据权利要求1所述的基于图像边缘和线条特征的三维模型检索方法,其特征在于: 所述步骤(6)中相似度计算采用夹角函数衡量输入图像特征出与库 中特征比的相似度。
【文档编号】G06F17/30GK105930497SQ201610297402
【公开日】2016年9月7日
【申请日】2016年5月6日
【发明人】刘志, 尹世超, 潘翔
【申请人】浙江工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1