一种空间位置和局部特征相融合的特征构造方法与流程

文档序号:11323801阅读:754来源:国知局

本发明涉及一种从3d模型中构造模型特征的方法。本发明将计算机视觉技术应用于三维模型表示领域。从工程技术实现的角度,为用户提供一种高效快捷的三维模型特征提取方法。



背景技术:

如今增强现实、三维影视工业、三维动画产业都蓬勃发展,尤其随着三维游戏、视频等工具的大量普及,对三维模型的需求量巨大。快速在现有模型库中检索到有用的类似模型,然后进行编辑、重用,比凭空构建一个新的三维模型或场景要更加经济实惠。

目前现有的三维模型检索大部分还在研究从整体到整体的检索模式,从物体或场景的局部去检索完整的物体,或者反过来从完整的场景检索其中某个局部物体的技术还不成熟,还存在着检索误差大、检索效率低等一系列问题。其中构建结合局部特征和全局几何结构特征的特征向量是整个三维模型检索的关键。本发明主要关注从3d模型中融合空间位置信息和局部特征来构造模型特征的方法。



技术实现要素:

本发明要克服现有技术的上述缺点,提供一种先计算模型的局部特征,再将特征点的空间位置关系作为整体特征融合进去,从而实现局部属性识别、从局部到整体的搜索等任务。本发明具有准确性高,效率高等特点。

本发明的内容包括:提取局部特征,构建视觉词汇字典,空间位置信息融合等三部分。

一种空间位置和局部特征相融合的特征构造方法,包括如下步骤:

1.提取模型局部特征;

模型局部特征通过计算旋转图来构造,计算旋转图的具体方法参见a.e.johnson,m.hebert:usingspinimageforefficientobjectrecognitionincluttered3dscenes.pami.vol.21,no.5,1999,pp.433–449。其步骤如下:

1.1在模型表面随机采样n个点,其中nb个基点,ns个支撑点。

1.2计算基点出发的模型法线从而构建此基点相对于模型表面的切平面。

1.3以通过基点的法线为一条边,构造宽度为r、高度为2r的平面p,它被切平面分成完全相等的上下两部分,并且将此平面离散成宽度为w、高度为h的图像平面。

1.4上图像平面以法线为轴旋转,将落入每个像素格中的支撑点数量进行统计,则得到此基点的一副旋转图。

对所有选连样本集合内的模型都进行局部特征抽取,构造局部特征库。

2.构建视觉词汇字典;

对于局部特征库里的所有特征描述子,采用k均值聚类方法构造包含m个视觉词汇的视觉词汇字典,这些视觉词汇被记为{v1,v2,…,vm}。那么每个模型可以表示成长度为m的一个向量{n1,n2,…,nm},每一个分量代表此模型中包含多少个视觉词汇vi,其中i=1,2,…,m。

3.空间位置信息融合;

3.1对所有模型,通过主成分分析获得模型的三个主轴方向,把模型调整到xy平面与地面平行,z轴与地面垂直的坐标系统中,让模型的中心与坐标系统的原点重合,并把模型归一化到边长为1的立方体内。

3.2将模型用中心在原点,半径以h为增量的同心球进行分割,假设这些同心球的数量为x个,每两个球面之间区域内的旋转图代表区域内的模型特征集合量{n1,n2,…,nm}。

3.3每一个模型被表示成x个长度为m的的向量

本发明的优点是:能够将局部特征和全局位置信息相结合,提取更鲁棒、识别率更高的特征描述子,为增强现实企业、三维影视工业、三维动画产业的模型管理、重用提供有效的途径。

附图说明

图1是本发明的流程图。

具体实施方式

下面结合附图进一步说明本发明的技术方案。

本发明的一种空间位置和局部特征相融合的特征构造方法,包括如下步骤:

1.提取模型局部特征;

模型局部特征通过计算旋转图来构造,计算旋转图的具体方法参见a.e.johnson,m.hebert:usingspinimageforefficientobjectrecognitionincluttered3dscenes.pami.vol.21,no.5,1999,pp.433–449。其步骤如下:

1.1在模型表面随机采样n个点,其中nb个基点,ns个支撑点。

1.2计算基点出发的模型法线从而构建此基点相对于模型表面的切平面。

1.3以通过基点的法线为一条边,构造宽度为r、高度为2r的平面p,它被切平面分成完全相等的上下两部分,并且将此平面离散成宽度为w、高度为h的图像平面。

1.4上图像平面以法线为轴旋转,将落入每个像素格中的支撑点数量进行统计,则得到此基点的一副旋转图。

对所有选连样本集合内的模型都进行局部特征抽取,构造局部特征库。

2.构建视觉词汇字典;

对于局部特征库里的所有特征描述子,采用k均值聚类方法构造包含m个视觉词汇的视觉词汇字典,这些视觉词汇被记为{v1,v2,…,vm}。那么每个模型可以表示成长度为m的一个向量{n1,n2,…,nm},每一个分量代表此模型中包含多少个视觉词汇vi,其中i=1,2,…,m。

3.空间位置信息融合;

3.1对所有模型,通过主成分分析获得模型的三个主轴方向,把模型调整到xy平面与地面平行,z轴与地面垂直的坐标系统中,让模型的中心与坐标系统的原点重合,并把模型归一化到边长为1的立方体内。

3.2将模型用中心在原点,半径以h为增量的同心球进行分割,假设这些同心球的数量为x个,每两个球面之间区域内的旋转图代表区域内的模型特征集合量{n1,n2,…,nm}。

3.3每一个模型被表示成x个长度为m的的向量

在执行步骤1.1时,需要事先确定取样点数量n。对训练样本集中所有模型的顶点数量进行统计,所有训练集中模型顶点数量的中值的100倍即为每个模型取样点数n,其中1%为基点数量nb,99%为支撑点数量ns。

在执行步骤1.3时,绕基准轴旋转的平面宽度r也通过对训练样本集中的模型顶点间距离统计获得,也就是对训练集中所有模型,计算其顶点和相邻顶点的距离,将距离集合的中值作为绕轴平面的宽度r。

在执行步骤1.3时,绕轴平面的横纵轴像素数量都确定为32个像素单位。

在执行步骤2时,视觉词汇字典的大小可定为基点数量的20%。

在执行步骤3.2时,同心圆的数量可由模型库的复杂度决定,一般取值为10。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1