一种基于主题模型的3d模型检索方法及其检索装置的制造方法_2

文档序号:9453133阅读:来源:国知局
>[0062] 在词典中查找距离每个视觉单词最近的聚类中心作为单词内容,获取3D模型中 每个兴趣点的单词内容分布。
[0063] 进一步地,3D特征库具体为:
[0064] 提取每个3D模型初始视图集的SIFT特征,由SIFT特征组成的特征库。
[0065] 进一步地,步骤101中的将单词内容分布和文档分布分别输入LDA主题模型,并指 定生成的主题个数,获取每个3D模型的主题分布向量的步骤具体为:
[0066] 获取各文档的主题分布参数、各主题的单词内容分布参数,当条件概率最大时,通 过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
[0067] 通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
[0068] 其中,上述步骤中的各文档的主题分布参数、各主题的单词内容分布参数具体 为:
[0069] 每个文档采样一个主题分布,对文档中的每个单词采样一个主题;
[0070] 为每个单词采样单词内容。
[0071] 综上所述,本发明实施例通过上述步骤101至步骤103克服了LDA主题模型忽略 了空间信息的缺点,提高了检索性能,满足了实际应用中的多种需要。
[0072] 实施例2
[0073] 下面结合具体的计算公式、例子、以及图2至图5对实施例1中的方案进行详细的 说明,详见下文描述:
[0074] 201 :拍摄N。个3D模型的多视角彩色视图组成3D模型库,经过提取掩膜等预处理 后得到各3D模型的初始视图集,定义为3D视图库;
[0075] 本发明实施例首先拍摄N。个3D模型的多视角彩色视图,例如苹果、水杯、围巾、雨 伞等。
[0076] 具体过程如下:将三个Kinect摄像头(此摄像头为本领域所公知,全称为"XB0X 360第一代Kinect",型号为1414)分别置于距离可旋转工作台30厘米,与水平面夹角为 0°、45°和90°处拍摄一系列彩色视图,示意图如图3所示。当工作台上的3D模型匀速 旋转一圈时,每个摄像头均匀拍摄36张视图,每个物体共得到108张视图,示意图如图4所 不。
[0077] 运用Matlab软件对所获取的108张视图进行预处理,首先提取各视图掩膜,即分 离前景物体与背景区域并将背景区域置为黑色。然后对部分缺损图像进行空洞填充、轮廓 调整等处理[11]。最后得到各3D模型的初始视图集,如图5所示,定义为3D视图库。
[0078] 202 :在3D视图库中,提取每个3D模型初始视图集的局部特征,不失一般性的,我 们采用SIFT特征进而得到初始特征向量集,定义为3D特征库;
[0079]SIFT特征,即尺度不变特征变换(Scale-invariantfeaturetransform,SIFT), 可在图像中检测出局部兴趣点并得到局部特征,其对旋转、尺度缩放、亮度变化保持不变 性,对视角变化、仿射变换、噪声也保持一定程度的稳定性;并且SIFT特征独特性好,信息 量丰富,适用于在海量特征数据库中进行快速、准确的匹配。
[0080]SIFT是局部特征描述子,根据文献[13 14]运用Matlab软件可提取各初始视图中局 部兴趣点的SIFT特征,单个兴趣点的SIFT特征为128维,若在某视图中检测到x个SIFT 兴趣点,则此视图的SIFT特征为x行128列。此时初始视图集转化为初始特征向量集,定 义为3D特征库。
[0081] 203 :对3D特征库中所有兴趣点的SIFT特征进行K-means聚类得到词典,进而根 据词典得到每个兴趣点的单词内容分布,定义为3D单词库;
[0082] 利用Matlab软件自带的K-means函数,输入3D特征库中所有兴趣点的SIFT特征 向量以及聚类个数S(本例中选取S= 500),输出满足方差最小标准的S个聚类中心。
[0083] 生成BOW(Bag-of-words)单词内容的主要过程为:将3D特征库中每个兴趣点的 SIFT特征向量作为视觉单词,S个聚类中心作为词典,在词典中查找距离每个视觉单词最 近的聚类中心作为它的单词内容,即可得到每个3D模型中兴趣点的单词内容分布,定义为 3D单词库,作为步骤205中LDA主题模型的输入之一。
[0084] 204:在3D单词库中,根据每个SIFT兴趣点所在视图的空间位置不同,将属于同一 3D模型的SIFT兴趣点划分为w个文档,分别生成每个3D模型中所有兴趣点的文档分布;
[0085] 在步骤201中采集3D模型的多视角彩色视图时,初始视图分别来自于与水平面夹 角为0°、45°和90°的三个Kinect摄像机。由于空间位置相近的视图在形状纹理上存在 较大的相似性,若划分在同一文档中有更大的可能性被分配到相同的主题。所以根据SIFT 兴趣点所在视图的空间位置不同,将每个3D模型的SIFT兴趣点划分为t个文档(本例中t =3,即从0°采集的视图中的兴趣点属于文档1,从45°采集的视图中的兴趣点属于文档 2,从90°采集的视图中的兴趣点属于文档3),生成每个3D模型中所有兴趣点的文档分布, 作为下一步中LDA主题模型的输入之一。
[0086] 205 :将步骤203得到的单词内容分布和步骤204得到的文档分布分别输入LDA主 题模型,并指定生成的主题个数K,得到每个3D模型对于K个主题的分布向量;
[0087] -篇文档的每个词都是通过"文档以一定概率选择了某个主题,并从这个主题中 以一定概率选择某个词语"这样一个过程得到。文档到主题服从多项式分布,主题到词服从 多项式分布,而多项式分布的参数符合狄利克雷分布。可以通过吉普斯采样的方法识别大 规模文档集或语料库中潜藏的主题信息 [13]。
[0088] 步骤205的详细的生成过程如下:
[0089] 本例中将每个SIFT兴趣点视为一个单词,空间位置相似的SIFT兴趣点集存在于 同一个文档。数据库中共有N。个3D模型,每个3D模型中的所有SIFT兴趣点被划分成t个 文档,故整个语料库中共有tN。个文档。假设文档i中有N个单词,文档i的第j个单词的 内容在本例中为SIFT兴趣点经过BOW模型后的单词内容,表示为Wlj。理论上每个文档i中 的每个单词j都会被分配一个隐含的主题Zl],共有K个隐含主题。a和0是狄利克雷超 参数,0 ,、魏和Zl]是学习过程中的中间参数,生成过程分为四步:
[0090] 1)首先给每个文档采样一个主题分布,然后给文档中的每个单词采样一个特定的 主题;
[0091] 对于文档i,其主题分布的参数服从超参数为a的狄利克雷分布0 Dir(a),如式⑴所示:
[0092]
(1)
[0093]其中p(0」a)表示给定狄利克雷超参数a时,第i个文档的主题分布参数0i 的条件概率分布,ak表示第k个狄利克雷超参数,K表示主题个数,0k表示主题为k的主 题分布参数,并且函美
[0094] 对于文档i中的单词j,它的主题标签Zlj采样于K个主题的多项式分布Zlj~ Discrete(0J。即给定主题多项式分布的参数,文档i中的单词j被分配到主题k 的条件概率为P(Zi_j=k| 0 ;)。
[0095] 2)为每个单词选定主题后,接下来为它采样单词内容;
[0096] 对于每个主题k,单词内容分布的参数%服从超参数为0的狄利克雷分布 约~如下式所示:
[0097]
[0098] 其中表示给定狄利克雷超参数0时,第k个主题的单词内容分布参数約 的条件概率分布,表示第m个狄利克雷超参数,N表示文档i中的单词个数,爲表示单 词内容为m的单词内容分布参数。
[0099] 对于文档i中的单词j,它的单词内容Wl]服从参数为钤的多项式分布,即 % ~D/scre/e(%)。当确定单词的主题k以及该主题下单词内容的多项式分布参数%时,文 档i中的单词j被分配到内容m的条件概率为= 先涔:U
[0100] 3)若已知参数a、0以及各文档中单词的内容Wl],则当条件概率p(Wl]|a,0)取 得最大值时可以得到各文档的主题分布参数9 $和各主题的单词内容分布参数^ :
[0101]
[0102] 其中,
[0103]
[0104] 其中p(Wlj|a,0)表示给定超参数a和0时,第i个文档中第j个单词的单词 内容',的条件概率分布,P( 9」a)表示给定狄利克雷超参数a时主题分布参数的条 件概率分布,p(Zij| 0J表示给定主题多项式分布的参数0 ^寸,文档i中的单词j主题z 的条件概率分布,表示给定狄利克雷超参数0和主题Zl]时,单词内容分布参数 的条件概率分布,尸(% |%,AV)确定单词的主题以及该主题下单词内容的多项式分布参 数%时,文档i中的单词j的单词内容&的条件概率分布。已知3D模型中各文档的单词 内容Wl]时,上式可以利用吉普斯采样经过一系列迭代收敛时得到0 $和#值,采样的详细 描述和具体推导可见参考文献[15-17]。
[0105] 通过吉普斯采样得到了各3D模型中每个文档的K主题分布向量后,从3D模型库 中随机选择一 3D模型作为查询目标Q,再选取任一 3D模型作为比较目标M,检索任务为从 3D模型库中找到与Q相似的模型。
[0106] 4)模型Q由t个文档组成,将t个文档的主题分布向量求平均值得到Q的主题分 布,如下式所示:
[0107]
[0108] 其中,9 (^表示模型Q的主题分布向量,0 (^表示模型Q的第i个文档的主题分布 向量,t表示Q中的文档数目。
[0109] 同理可得模型M的主题分布向量:
[0110]
[0111] 其中,9M表示模型M的主题
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1