一种基于主题模型的3d模型检索方法及其检索装置的制造方法_2

文档序号：9453133阅读：来源：国知局

>[0062] 在词典中查找距离每个视觉单词最近的聚类中心作为单词内容，获取3D模型中每个兴趣点的单词内容分布。
[0063] 进一步地，3D特征库具体为：
[0064] 提取每个3D模型初始视图集的SIFT特征，由SIFT特征组成的特征库。
[0065] 进一步地，步骤101中的将单词内容分布和文档分布分别输入LDA主题模型，并指定生成的主题个数，获取每个3D模型的主题分布向量的步骤具体为：
[0066] 获取各文档的主题分布参数、各主题的单词内容分布参数，当条件概率最大时，通过吉普斯采样获取各3D模型中每个文档的各主题分布向量；
[0067] 通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
[0068] 其中，上述步骤中的各文档的主题分布参数、各主题的单词内容分布参数具体为：
[0069] 每个文档采样一个主题分布，对文档中的每个单词采样一个主题；
[0070] 为每个单词采样单词内容。
[0071] 综上所述，本发明实施例通过上述步骤101至步骤103克服了LDA主题模型忽略了空间信息的缺点，提高了检索性能，满足了实际应用中的多种需要。
[0072] 实施例2
[0073] 下面结合具体的计算公式、例子、以及图2至图5对实施例1中的方案进行详细的说明，详见下文描述：
[0074] 201 :拍摄N。个3D模型的多视角彩色视图组成3D模型库，经过提取掩膜等预处理后得到各3D模型的初始视图集，定义为3D视图库；
[0075] 本发明实施例首先拍摄N。个3D模型的多视角彩色视图，例如苹果、水杯、围巾、雨伞等。
[0076] 具体过程如下：将三个Kinect摄像头（此摄像头为本领域所公知，全称为"XB0X 360第一代Kinect"，型号为1414)分别置于距离可旋转工作台30厘米，与水平面夹角为 0°、45°和90°处拍摄一系列彩色视图，示意图如图3所示。当工作台上的3D模型匀速旋转一圈时，每个摄像头均匀拍摄36张视图，每个物体共得到108张视图，示意图如图4所不。
[0077] 运用Matlab软件对所获取的108张视图进行预处理，首先提取各视图掩膜，即分离前景物体与背景区域并将背景区域置为黑色。然后对部分缺损图像进行空洞填充、轮廓调整等处理[11]。最后得到各3D模型的初始视图集，如图5所示，定义为3D视图库。
[0078] 202 :在3D视图库中，提取每个3D模型初始视图集的局部特征，不失一般性的，我们采用SIFT特征进而得到初始特征向量集，定义为3D特征库；
[0079]SIFT特征，即尺度不变特征变换（Scale-invariantfeaturetransform，SIFT)，可在图像中检测出局部兴趣点并得到局部特征，其对旋转、尺度缩放、亮度变化保持不变性，对视角变化、仿射变换、噪声也保持一定程度的稳定性；并且SIFT特征独特性好，信息量丰富，适用于在海量特征数据库中进行快速、准确的匹配。
[0080]SIFT是局部特征描述子，根据文献[13 14]运用Matlab软件可提取各初始视图中局部兴趣点的SIFT特征，单个兴趣点的SIFT特征为128维，若在某视图中检测到x个SIFT 兴趣点，则此视图的SIFT特征为x行128列。此时初始视图集转化为初始特征向量集，定义为3D特征库。
[0081] 203 :对3D特征库中所有兴趣点的SIFT特征进行K-means聚类得到词典，进而根据词典得到每个兴趣点的单词内容分布，定义为3D单词库；
[0082] 利用Matlab软件自带的K-means函数，输入3D特征库中所有兴趣点的SIFT特征向量以及聚类个数S(本例中选取S= 500)，输出满足方差最小标准的S个聚类中心。
[0083] 生成BOW(Bag-of-words)单词内容的主要过程为：将3D特征库中每个兴趣点的 SIFT特征向量作为视觉单词，S个聚类中心作为词典，在词典中查找距离每个视觉单词最近的聚类中心作为它的单词内容，即可得到每个3D模型中兴趣点的单词内容分布，定义为 3D单词库，作为步骤205中LDA主题模型的输入之一。
[0084] 204:在3D单词库中，根据每个SIFT兴趣点所在视图的空间位置不同，将属于同一 3D模型的SIFT兴趣点划分为w个文档，分别生成每个3D模型中所有兴趣点的文档分布；
[0085] 在步骤201中采集3D模型的多视角彩色视图时，初始视图分别来自于与水平面夹角为0°、45°和90°的三个Kinect摄像机。由于空间位置相近的视图在形状纹理上存在较大的相似性，若划分在同一文档中有更大的可能性被分配到相同的主题。所以根据SIFT 兴趣点所在视图的空间位置不同，将每个3D模型的SIFT兴趣点划分为t个文档（本例中t =3,即从0°采集的视图中的兴趣点属于文档1，从45°采集的视图中的兴趣点属于文档 2,从90°采集的视图中的兴趣点属于文档3)，生成每个3D模型中所有兴趣点的文档分布，作为下一步中LDA主题模型的输入之一。
[0086] 205 :将步骤203得到的单词内容分布和步骤204得到的文档分布分别输入LDA主题模型，并指定生成的主题个数K，得到每个3D模型对于K个主题的分布向量；
[0087] -篇文档的每个词都是通过"文档以一定概率选择了某个主题，并从这个主题中以一定概率选择某个词语"这样一个过程得到。文档到主题服从多项式分布，主题到词服从多项式分布，而多项式分布的参数符合狄利克雷分布。可以通过吉普斯采样的方法识别大规模文档集或语料库中潜藏的主题信息 [13]。
[0088] 步骤205的详细的生成过程如下：
[0089] 本例中将每个SIFT兴趣点视为一个单词，空间位置相似的SIFT兴趣点集存在于同一个文档。数据库中共有N。个3D模型，每个3D模型中的所有SIFT兴趣点被划分成t个文档，故整个语料库中共有tN。个文档。假设文档i中有N个单词，文档i的第j个单词的内容在本例中为SIFT兴趣点经过BOW模型后的单词内容，表示为Wlj。理论上每个文档i中的每个单词j都会被分配一个隐含的主题Zl]，共有K个隐含主题。a和0是狄利克雷超参数，0 ,、魏和Zl]是学习过程中的中间参数，生成过程分为四步：
[0090] 1)首先给每个文档采样一个主题分布，然后给文档中的每个单词采样一个特定的主题；
[0091] 对于文档i，其主题分布的参数服从超参数为a的狄利克雷分布0 Dir(a)，如式⑴所示：
[0092]
(1)
[0093]其中p(0」a)表示给定狄利克雷超参数a时，第i个文档的主题分布参数0i 的条件概率分布，ak表示第k个狄利克雷超参数，K表示主题个数，0k表示主题为k的主题分布参数，并且函美
[0094] 对于文档i中的单词j，它的主题标签Zlj采样于K个主题的多项式分布Zlj~ Discrete(0J。即给定主题多项式分布的参数，文档i中的单词j被分配到主题k 的条件概率为P(Zi_j=k| 0 ;)。
[0095] 2)为每个单词选定主题后，接下来为它采样单词内容；
[0096] 对于每个主题k，单词内容分布的参数％服从超参数为0的狄利克雷分布约~如下式所示：
[0097]
[0098] 其中表示给定狄利克雷超参数0时，第k个主题的单词内容分布参数約的条件概率分布，表示第m个狄利克雷超参数，N表示文档i中的单词个数，爲表示单词内容为m的单词内容分布参数。
[0099] 对于文档i中的单词j，它的单词内容Wl]服从参数为钤的多项式分布，即 % ~D/scre/e(%)。当确定单词的主题k以及该主题下单词内容的多项式分布参数％时，文档i中的单词j被分配到内容m的条件概率为= 先涔：U
[0100] 3)若已知参数a、0以及各文档中单词的内容Wl]，则当条件概率p(Wl]|a，0)取得最大值时可以得到各文档的主题分布参数9 $和各主题的单词内容分布参数^ :
[0101]
[0102] 其中，
[0103]
[0104] 其中p(Wlj|a，0)表示给定超参数a和0时，第i个文档中第j个单词的单词内容',的条件概率分布，P( 9」a)表示给定狄利克雷超参数a时主题分布参数的条件概率分布，p(Zij| 0J表示给定主题多项式分布的参数0 ^寸，文档i中的单词j主题z 的条件概率分布，表示给定狄利克雷超参数0和主题Zl]时，单词内容分布参数的条件概率分布，尸(％ |%，AV)确定单词的主题以及该主题下单词内容的多项式分布参数％时，文档i中的单词j的单词内容&的条件概率分布。已知3D模型中各文档的单词内容Wl]时，上式可以利用吉普斯采样经过一系列迭代收敛时得到0 $和#值，采样的详细描述和具体推导可见参考文献[15-17]。
[0105] 通过吉普斯采样得到了各3D模型中每个文档的K主题分布向量后，从3D模型库中随机选择一 3D模型作为查询目标Q，再选取任一 3D模型作为比较目标M，检索任务为从 3D模型库中找到与Q相似的模型。
[0106] 4)模型Q由t个文档组成，将t个文档的主题分布向量求平均值得到Q的主题分布，如下式所示：
[0107]
[0108] 其中，9 (^表示模型Q的主题分布向量，0 (^表示模型Q的第i个文档的主题分布向量，t表示Q中的文档数目。
[0109] 同理可得模型M的主题分布向量：
[0110]
[0111] 其中，9M表示模型M的主题

完整全部详细技术资料下载

当前第2页1 2 3 4