一种基于主题模型的3d模型检索方法及其检索装置的制造方法

文档序号：9453133阅读：279来源：国知局

一种基于主题模型的3d模型检索方法及其检索装置的制造方法
【技术领域】
[0001] 本发明涉及3D模型检索领域，尤其涉及一种基于主题模型的3D模型检索方法及其检索装置。
【背景技术】
[0002] 现实世界中的物体存在空间特性，而人眼对于物体的视觉感知也是三维的。三维模型比二维图像能够带来更加具体的感知细节、更加生动的真实感受和更加丰富的视觉效果，现已发展成为了继声音、图像、视频之后的第四种多媒体数据类型。近年来3D模型被广泛应用于社会生产生活中的各个领域，如计算机辅助设计[1]、计算机视觉、生物信息学 [2]、医学?和娱乐产业
[0003]随着计算机技术和网络的迅速发展，多媒体数据规模日益庞大。目前有数以兆计的3D数据存在，而且每天都有大量的3D模型产生和传播，存在着对3D模型进行检索的迫切需求。之前主要考虑如何构造三维模型，而这样的构造问题无疑需要花费大量的时间和人力成本，所以现在设计3D模型时，考虑更多的问题是如何从现有的海量数据库中寻找合适的、与3D模型相似的模型加以利用以降低开发成本，或者是在此基础上构造所需要的3D 模型以提高创建模型的效率[5]。基于这种设计思路的转变，3D模型检索技术应运而生。
[0004]目前主要将3D模型检索分为基于文本检索和基于内容检索：基于文本检索技术主要是依靠关键字进行检索，但关键字描述很难全面的使用文字准确表达、耗费人力物力、易受主观因素干扰、因此基于文本的检索方法可靠性和有效性都有其局限性 [6]。
[0005] 基于内容的检索主要利用检索对象本身所携带的信息与库中模型进行所设计特征的相似度比较，方法比较客观，可靠性和有效性较高 [7]。基于内容检索方法已被证实在多媒体检索技术中有优越性。根据所利用的模型格式不同，基于内容的检索又可分为基于模型的检索和基于视图的检索M。由于二维图像的检索已经蓬勃发展了几十年，已经积累了丰富的技术基础，基于视图的方法可以利用现有的技术进行有效的检索，且已被证实相对于基于模型的检索方法有更好的检测结果 [9 1W。大多数基于内容的检索根据3D模型的形状拓扑结构获取特征向量后，只是单纯通过地计算特征向量之间的距离作为相似度比较，而忽略了特征向量间更加深层的含义与联系。本发明通过引入LDA主题模型探索特征向量之间的主题分布，更深入地刻画了特征向量的深层子结构。

【发明内容】

[0006] 本发明提供了一种基于主题模型的3D模型检索方法及其检索装置，本发明通过引入LDA主题模型探索特征向量之间的主题分布，更深入地刻画了特征向量的深层子结构，提尚了检索性能，详见下文描述：
[0007] -种基于主题模型的3D模型检索方法，所述方法包括以下步骤：
[0008] 将单词内容分布和文档分布分别输入LDA主题模型，并指定生成的主题个数，获取每个3D模型的主题分布向量；
[0009] 选择查询模型，计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离；
[0010] 将欧式空间内的距离升序排列，得到最终的检索结果。
[0011] 其中，在将单词内容分布和文档分布分别输入LDA主题模型的步骤之前，所述方法还包括：
[0012] 在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类，获取词典，根据词典获取每个兴趣点的单词内容分布；
[0013] 根据SIFT兴趣点所在视图的空间位置不同，划分为文档，生成每个3D模型中兴趣点的文档分布。
[0014] 其中，所述根据词典获取每个兴趣点的单词内容分布的步骤具体为：在词典中查找距离每个视觉单词最近的聚类中心作为单词内容，获取3D模型中每个兴趣点的单词内容分布。
[0015] 其中，所述3D特征库具体为：
[0016] 提取每个3D模型初始视图集的SIFT特征，由SIFT特征组成的特征库。
[0017] 进一步地，所述将单词内容分布和文档分布分别输入LDA主题模型，并指定生成的主题个数，获取每个3D模型的主题分布向量的步骤具体为：
[0018] 获取各文档的主题分布参数、各主题的单词内容分布参数，当条件概率最大时，通过吉普斯采样获取各3D模型中每个文档的各主题分布向量；
[0019] 通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
[0020] 进一步地，所述各文档的主题分布参数、各主题的单词内容分布参数具体为：
[0021] 每个文档采样一个主题分布，对文档中的每个单词采样一个主题；为每个单词采样单词内容。
[0022] 一种基于主题模型的3D模型检索装置，所述装置包括：
[0023] 第一获取模块，用于将单词内容分布和文档分布分别输入LDA主题模型，并指定生成的主题个数，获取每个3D模型的主题分布向量；
[0024] 第二获取模块，用于选择查询模型，计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离；
[0025] 第三获取模块，用于将欧式空间内的距离升序排列，得到最终的检索结果。
[0026] 进一步地，所述装置还包括：
[0027] 第四获取模块，用于在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类，获取词典，根据词典获取每个兴趣点的单词内容分布；
[0028] 生成模块，用于根据SIFT兴趣点所在视图的空间位置不同，划分为文档，生成每个3D模型中兴趣点的文档分布。
[0029] 其中，所述第四获取模块包括：
[0030] 查找子模块，用于在词典中查找距离每个视觉单词最近的聚类中心作为单词内容；
[0031] 第一获取子模块，用于获取3D模型中每个兴趣点的单词内容分布。
[0032] 进一步地，所述第一获取模块包括：
[0033] 第二获取子模块，用于获取各文档的主题分布参数、各主题的单词内容分布参数，当条件概率最大时，通过吉普斯采样获取各3D模型中每个文档的各主题分布向量；
[0034] 第三获取子模块，用于通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
[0035] 本发明提供的技术方案的有益效果是：
[0036] 1、通过获取3D模型的多视角视图，将3D模型检索问题巧妙地转化为2D图像比较问题，可利用二维图像处理中较成熟的特征提取方法。
[0037] 2、在3D模型检索领域引入了LDA主题模型，通过无监督学习利用隐含主题变量更加准确地描述了模型特征之间深层的结构联系。
[0038] 3、创造性地提出了根据模型特征空间位置的不同有选择地划分文档，克服了LDA 主题模型忽略了空间信息的缺点，提高了检索性能。
【附图说明】
[0039] 图1为一种基于主题模型的3D模型检索方法的流程图；
[0040] 图2为一种基于主题模型的3D模型检索方法的另一流程图；
[0041]图3为采集初始视图时摄像机位置的排列图；
[0042] 图4为3D模型的彩色视图样例；
[0043] 图5为3D模型的初始视图样例；
[0044] 图6为五种算法的查准-查全曲线示意图；
[0045] 图7为五种算法的其它评测标准比较结果示意图；
[0046] 图8为一种基于主题模型的3D模型检索装置的结构示意图；
[0047] 图9为一种基于主题模型的3D模型检索装置的另一结构示意图；
[0048] 图10为第四获取模块的结构示意图；
[0049] 图11为第一获取模块的结构示意图。
【具体实施方式】
[0050] 为使本发明的目的、技术方案和优点更加清楚，下面对本发明实施方式作进一步地详细描述。
[0051] LDA(LatentDirichletAllocation)主题模型，也称为三层贝叶斯概率模型，包含词、主题和文档三层结构。它是一种非监督机器学习技术，可以用来识别大规模文档集或语料库中潜藏的主题信息。
[0052] 3D模型检索领域需要能够全面、自动、准确提取3D模型特征并进行检索的方法。研究表明：LDA主题模型可以识别大规模文档集中潜藏的主题信息，通过在3D模型检索领域引入LDA主题模型可更加准确地描述模型特征之间深层的结构与联系。生成文档分布时又根据模型特征的空间位置信息有选择地划分文档，克服了LDA主题模型忽略了空间信息的缺点，提尚了检索性能。
[0053] 实施例1
[0054] -种基于主题模型的3D模型检索方法，参见图1，该3D模型检索方法包括以下步骤：
[0055] 101 :将单词内容分布和文档分布分别输入LDA主题模型，并指定生成的主题个数，获取每个3D模型的主题分布向量；
[0056] 102 :选择查询模型，计算查询模型与3D模型库中其余模型之间主题分布向量在欧式空间内的距离；
[0057] 103 :将欧式空间内的距离升序排列，得到最终的检索结果。
[0058] 在步骤101将单词内容分布和文档分布分别输入LDA主题模型的步骤之前，该3D 模型检索方法还包括以下步骤：
[0059] 在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类，获取词典，根据词典获取每个兴趣点的单词内容分布；
[0060] 根据SIFT兴趣点所在视图的空间位置不同，划分为文档，生成每个3D模型中兴趣点的文档分布。
[0061] 其中，上述步骤中的根据词典获取每个兴趣点的单词内容分布的步骤具体为：

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘安安;李希茜;聂为之;苏育挺;
技术所有人：天津大学;
我是此专利的发明人

上一篇：基于球环和非负矩阵分解的视频哈希方法
上一篇：识别用户点击访问网站行为的方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。