一种基于主题模型的3d模型检索方法及其检索装置的制造方法

文档序号:9453133阅读:279来源:国知局
一种基于主题模型的3d模型检索方法及其检索装置的制造方法
【技术领域】
[0001] 本发明涉及3D模型检索领域,尤其涉及一种基于主题模型的3D模型检索方法及 其检索装置。
【背景技术】
[0002] 现实世界中的物体存在空间特性,而人眼对于物体的视觉感知也是三维的。三维 模型比二维图像能够带来更加具体的感知细节、更加生动的真实感受和更加丰富的视觉效 果,现已发展成为了继声音、图像、视频之后的第四种多媒体数据类型。近年来3D模型被广 泛应用于社会生产生活中的各个领域,如计算机辅助设计[1]、计算机视觉、生物信息学 [2]、 医学?和娱乐产业
[0003]随着计算机技术和网络的迅速发展,多媒体数据规模日益庞大。目前有数以兆计 的3D数据存在,而且每天都有大量的3D模型产生和传播,存在着对3D模型进行检索的迫 切需求。之前主要考虑如何构造三维模型,而这样的构造问题无疑需要花费大量的时间和 人力成本,所以现在设计3D模型时,考虑更多的问题是如何从现有的海量数据库中寻找合 适的、与3D模型相似的模型加以利用以降低开发成本,或者是在此基础上构造所需要的3D 模型以提高创建模型的效率[5]。基于这种设计思路的转变,3D模型检索技术应运而生。
[0004]目前主要将3D模型检索分为基于文本检索和基于内容检索:基于文本检索技术 主要是依靠关键字进行检索,但关键字描述很难全面的使用文字准确表达、耗费人力物力、 易受主观因素干扰、因此基于文本的检索方法可靠性和有效性都有其局限性 [6]。
[0005] 基于内容的检索主要利用检索对象本身所携带的信息与库中模型进行所设计特 征的相似度比较,方法比较客观,可靠性和有效性较高 [7]。基于内容检索方法已被证实在多 媒体检索技术中有优越性。根据所利用的模型格式不同,基于内容的检索又可分为基于模 型的检索和基于视图的检索M。由于二维图像的检索已经蓬勃发展了几十年,已经积累了 丰富的技术基础,基于视图的方法可以利用现有的技术进行有效的检索,且已被证实相对 于基于模型的检索方法有更好的检测结果 [9 1W。大多数基于内容的检索根据3D模型的形 状拓扑结构获取特征向量后,只是单纯通过地计算特征向量之间的距离作为相似度比较, 而忽略了特征向量间更加深层的含义与联系。本发明通过引入LDA主题模型探索特征向量 之间的主题分布,更深入地刻画了特征向量的深层子结构。

【发明内容】

[0006] 本发明提供了一种基于主题模型的3D模型检索方法及其检索装置,本发明通过 引入LDA主题模型探索特征向量之间的主题分布,更深入地刻画了特征向量的深层子结 构,提尚了检索性能,详见下文描述:
[0007] -种基于主题模型的3D模型检索方法,所述方法包括以下步骤:
[0008] 将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个数,获 取每个3D模型的主题分布向量;
[0009] 选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在欧式 空间内的距离;
[0010] 将欧式空间内的距离升序排列,得到最终的检索结果。
[0011] 其中,在将单词内容分布和文档分布分别输入LDA主题模型的步骤之前,所述方 法还包括:
[0012] 在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类,获取词典,根据词典 获取每个兴趣点的单词内容分布;
[0013] 根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每个3D模型中兴趣 点的文档分布。
[0014] 其中,所述根据词典获取每个兴趣点的单词内容分布的步骤具体为:在词典中查 找距离每个视觉单词最近的聚类中心作为单词内容,获取3D模型中每个兴趣点的单词内 容分布。
[0015] 其中,所述3D特征库具体为:
[0016] 提取每个3D模型初始视图集的SIFT特征,由SIFT特征组成的特征库。
[0017] 进一步地,所述将单词内容分布和文档分布分别输入LDA主题模型,并指定生成 的主题个数,获取每个3D模型的主题分布向量的步骤具体为:
[0018] 获取各文档的主题分布参数、各主题的单词内容分布参数,当条件概率最大时,通 过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
[0019] 通过每个文档的各主题分布向量获取每个3D模型的主题分布向量。
[0020] 进一步地,所述各文档的主题分布参数、各主题的单词内容分布参数具体为:
[0021] 每个文档采样一个主题分布,对文档中的每个单词采样一个主题;为每个单词采 样单词内容。
[0022] 一种基于主题模型的3D模型检索装置,所述装置包括:
[0023] 第一获取模块,用于将单词内容分布和文档分布分别输入LDA主题模型,并指定 生成的主题个数,获取每个3D模型的主题分布向量;
[0024] 第二获取模块,用于选择查询模型,计算查询模型与3D模型库中其余模型之间主 题分布向量在欧式空间内的距离;
[0025] 第三获取模块,用于将欧式空间内的距离升序排列,得到最终的检索结果。
[0026] 进一步地,所述装置还包括:
[0027] 第四获取模块,用于在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类, 获取词典,根据词典获取每个兴趣点的单词内容分布;
[0028] 生成模块,用于根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每 个3D模型中兴趣点的文档分布。
[0029] 其中,所述第四获取模块包括:
[0030] 查找子模块,用于在词典中查找距离每个视觉单词最近的聚类中心作为单词内 容;
[0031] 第一获取子模块,用于获取3D模型中每个兴趣点的单词内容分布。
[0032] 进一步地,所述第一获取模块包括:
[0033] 第二获取子模块,用于获取各文档的主题分布参数、各主题的单词内容分布参数, 当条件概率最大时,通过吉普斯采样获取各3D模型中每个文档的各主题分布向量;
[0034] 第三获取子模块,用于通过每个文档的各主题分布向量获取每个3D模型的主题 分布向量。
[0035] 本发明提供的技术方案的有益效果是:
[0036] 1、通过获取3D模型的多视角视图,将3D模型检索问题巧妙地转化为2D图像比较 问题,可利用二维图像处理中较成熟的特征提取方法。
[0037] 2、在3D模型检索领域引入了LDA主题模型,通过无监督学习利用隐含主题变量更 加准确地描述了模型特征之间深层的结构联系。
[0038] 3、创造性地提出了根据模型特征空间位置的不同有选择地划分文档,克服了LDA 主题模型忽略了空间信息的缺点,提高了检索性能。
【附图说明】
[0039] 图1为一种基于主题模型的3D模型检索方法的流程图;
[0040] 图2为一种基于主题模型的3D模型检索方法的另一流程图;
[0041]图3为采集初始视图时摄像机位置的排列图;
[0042] 图4为3D模型的彩色视图样例;
[0043] 图5为3D模型的初始视图样例;
[0044] 图6为五种算法的查准-查全曲线示意图;
[0045] 图7为五种算法的其它评测标准比较结果示意图;
[0046] 图8为一种基于主题模型的3D模型检索装置的结构示意图;
[0047] 图9为一种基于主题模型的3D模型检索装置的另一结构示意图;
[0048] 图10为第四获取模块的结构示意图;
[0049] 图11为第一获取模块的结构示意图。
【具体实施方式】
[0050] 为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步 地详细描述。
[0051] LDA(LatentDirichletAllocation)主题模型,也称为三层贝叶斯概率模型,包 含词、主题和文档三层结构。它是一种非监督机器学习技术,可以用来识别大规模文档集或 语料库中潜藏的主题信息。
[0052] 3D模型检索领域需要能够全面、自动、准确提取3D模型特征并进行检索的方法。 研究表明:LDA主题模型可以识别大规模文档集中潜藏的主题信息,通过在3D模型检索领 域引入LDA主题模型可更加准确地描述模型特征之间深层的结构与联系。生成文档分布时 又根据模型特征的空间位置信息有选择地划分文档,克服了LDA主题模型忽略了空间信息 的缺点,提尚了检索性能。
[0053] 实施例1
[0054] -种基于主题模型的3D模型检索方法,参见图1,该3D模型检索方法包括以下步 骤:
[0055] 101 :将单词内容分布和文档分布分别输入LDA主题模型,并指定生成的主题个 数,获取每个3D模型的主题分布向量;
[0056] 102 :选择查询模型,计算查询模型与3D模型库中其余模型之间主题分布向量在 欧式空间内的距离;
[0057] 103 :将欧式空间内的距离升序排列,得到最终的检索结果。
[0058] 在步骤101将单词内容分布和文档分布分别输入LDA主题模型的步骤之前,该3D 模型检索方法还包括以下步骤:
[0059] 在3D特征库中对所有兴趣点的SIFT特征进行K-means聚类,获取词典,根据词典 获取每个兴趣点的单词内容分布;
[0060] 根据SIFT兴趣点所在视图的空间位置不同,划分为文档,生成每个3D模型中兴趣 点的文档分布。
[0061] 其中,上述步骤中的根据词典获取每个兴趣点的单词内容分布的步骤具体为:
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1