视觉词典构建及应用方法和装置的制造方法

文档序号:9261429阅读:355来源:国知局
视觉词典构建及应用方法和装置的制造方法
【技术领域】
[0001] 本发明设及数据检索领域,尤其设及一种视觉词典构建及应用方法和装置。
【背景技术】
[0002] 随着科学技术的不断进步,计算机技术的不断发展,人们在利用检索工具进行数 据检索时,已经不满足于仅仅利用文本,而利用图像进行检索的检索工具提供了更多的可 能。
[0003] 图像检索的目的是从大量的图像数据库中准确、高效地识别出需要的图像。现有 技术中的一种方法为;用一个无序视觉词的集合来表示一幅图像,然后将所有视觉词放在 倒排表中来高效索引图像。早期的工作主要是通过不同的矢量量化技术构建视觉词典,从 而近似描述图像特征。具体的视觉词典是通过在原始描述空间聚类大量训练图像的局部描 述子来构建的。
[0004] 上述现有技术中的缺点为;在进行聚类时,为了覆盖一个拥有大量不同场景的大 规模图像库,我们需要构建一个上百万级甚至更大的视觉词典。要做到该一点,该些方法都 需要一个庞大的训练集来聚类,从而导致极长的运算时间和巨大的内存占用,特别是对高 维图像的局部描述,计算复杂度几乎不可达。
[0005] 总之,迫切需要本领域技术人员解决的技术问题就在于,如何降低为实现图像检 索所需要的运算时间W及内存占用。

【发明内容】

[0006] 本发明的实施例提供了一种视觉词典的构建及应用方法和装置,提高了为实现图 像检索所需要的运算时间W及内存占用。
[0007] 为了实现上述目的,本发明采取了如下技术方案。
[0008] 一种视觉词典构建方法,包括:
[0009] 确定训练图像数据集,提取所述训练图像数据集中全部训练图像的局部描述符, 得到第一局部描述符集;
[0010] 根据设定的分解方式将所述第一局部描述符集分解成若干第一子局部描述符 集;
[0011] 对每个所述第一子局部描述符集分别进行聚类,分别得到每个所述第一子局部描 述符集对应的第一视觉子词集,由所有所述第一视觉子词集构成视觉词典。
[0012] 优选的,所述的根据设定的分解方式将所述第一局部描述符集分解成若干第一子 局部描述符集包括:
[0013] 将所述第一局部描述符集中的每个局部描述符,从设定的分解位置,均匀地分解 成设定数量个第一子局部描述符;
[0014] 由属于不同第一局部描述符的,相对应的位置的全部所述第一子局部描述符构成 一个所述第一子局部描述符集,根据全部所述第一子局部描述符得到若干所述第一子局部 描述符集。
[0015] 优选的,所述对每个所述第一子局部描述符集分别进行聚类,分别得到每个所述 第一子局部描述符集对应的第一视觉子词集包括:
[0016] 分别确定每个所述第一子局部描述符集的若干个初始的聚类中屯、,计算同一所述 第一子局部描述符集中的各个子局部描述符与所述初始的聚类中屯、之间的欧式距离;
[0017] 将所述第一子局部描述符集中的子局部描述符归类到与其欧式距离最近的所述 初始的聚类中屯、,分别构成每个子局部描述符簇;计算出属于同一簇中的子局部描述符之 间的欧式距离,确定与所述同一簇中的其他子局部描述符的欧式距离的和最小的子局部描 述符为新聚类中屯、;
[001引计算出同一簇的新聚类中屯、和初始的聚类中屯、之间的距离,判断该距离是否小于 或等于预制阔值;
[0019] 若不是,将新聚类中屯、作为初始聚类中屯、重复上述步骤;
[0020] 若是,分别由同一所述第一子局部描述符集中若干所述新聚类中屯、构成一个所述 第一视觉子词集,由全部所述第一子局部描述符集构成若干第一视觉子词集。
[0021] 一种视觉词典构建装置,包括:
[0022] 第一局部描述符集确定单元,用于确定训练图像数据集,提取所述训练图像数据 集中全部训练图像的局部描述符,得到第一局部描述符集;
[0023] 第一子局部描述符集确定单元,用于根据设定的分解方式将所述第一局部描述符 集分解成若干第一子局部描述符集;
[0024] 视觉词典构建单元,用于对每个所述第一子局部描述符集分别进行聚类,分别得 到每个所述第一子局部描述符集对应的第一视觉子词集,由所有所述第一视觉子词集构成 视觉词典。
[0025] 优选的,所述第一子局部描述符集确定单元包括:
[0026] 第一局部描述符分解子单元,用于将所述第一局部描述符集中的每个局部描述 符,从设定的分解位置,均匀地分解成设定数量个第一子局部描述符;
[0027] 第一子局部描述符集确定子单元,用于由属于不同第一局部描述符的,相对应的 位置的全部所述第一子局部描述符构成一个所述第一子局部描述符集,根据全部所述第一 子局部描述符得到若干所述第一子局部描述符集。
[002引优选的,所述第一子局部描述符集确定单元包括:
[0029] 子局部描述符与所述初始的聚类中屯、之间的欧式距离计算子单元,用于分别确定 每个所述第一子局部描述符集的若干个初始的聚类中屯、,计算同一所述第一子局部描述符 集中的各个子局部描述符与所述初始的聚类中屯、之间的欧式距离;
[0030] 新聚类中屯、确定子单元,用于将所述第一子局部描述符集中的子局部描述符归类 到与其欧式距离最近的所述初始的聚类中屯、,分别构成每个子局部描述符簇;计算出属于 同一簇中的子局部描述符之间的欧式距离,确定与所述同一簇中的其他子局部描述符的欧 式距离的和最小的子局部描述符为新聚类中屯、;
[0031] 第一视觉子词集确定子单元,用于计算出同一簇的新聚类中屯、和初始的聚类中屯、 之间的距离,判断该距离是否小于或等于预制阔值;
[0032] 若不是,将新聚类中屯、作为初始聚类中屯、重复上述步骤;
[0033] 若是,分别由同一所述第一子局部描述符集中若干所述新聚类中屯、构成一个所述 第一视觉子词集,由全部所述第一子局部描述符集构成若干第一视觉子词集。
[0034] 一种视觉词典的应用方法,包括:
[0035] 根据所述的视觉词典W及图像数据库,通过建立倒排表的方式索引数据库中的图 像;
[0036] 确定待检索图像,提取待检索图像的局部描述符,得到第二局部描述符集;
[0037] 根据所述视觉词典W及所述第二局部描述符集,确定所述待检索图像的视觉词 集;
[003引根据所述倒排表与所述待检索图像的视觉词集的相关性,对所述倒排表中的图像 地址进行排序,根据所述排序返回所述图像地址对应的图像。
[0039] 优选的,所述的根据所述的视觉词典W及图像数据库,通过建立倒排表的方式索 引数据库中的图像包括:
[0040] 确定图像数据库中待索引图像,提取所述待索引图像的局部描述符,得到第S局 部描述符集;所述第=局部描述符集中的局部描述符对应所述待索引图像;
[0041] 根据设定的分解方式,将每个所述第=局部描述符分解成若干第=子局部描述 符;
[0042] 根据所述视觉词典,确定所述子局部描述符对应的视觉词典中的视觉子词,对属 于同一所述第=局部描述符的第=子局部描述符对应的视觉子词进行组合,得到待索引图 像的视觉词,根据全部的第=子局部描述符对应的视觉子词得到待索引图像的视觉词集;
[0043] 将所述图像的地址插入到对应的所述第S视觉词集中的视觉词的倒排表中,通过 所述倒排表索引数据库中的图像。
[0044] 优选的,所述将所述图像的地址插入到对应的所述第=视觉词集中的视觉词的倒 排表中之前还包括:
[0045] 判断所述视觉词倒排表列中是否包含所述第=视觉词集中的视觉词的倒排表;
[0046] 若未包含,新建一个未被包含的所述第=视觉词集中的视觉词的倒排表。
[0047] 优选的,所述根据所述视觉词典,确定所述待检索图像的视觉词集包括:
[0048] 根据设定的分解方式,将所述第二局部描述符集中的每个第二局部描述符分解成 若干第二子局部描述符;
[0049] 根据所述视觉词典,确定所述第二子局部描述符对应的视觉词典中的视觉子词, 对属于同一所述第二局部描述符的第二子局部描述符对应的视觉子词进行组合,得到待检 索图像的视觉词,根据全部的第二子局部描述符对应的视觉子词得到待检索图像的视觉词 集。
[0化0] 优选的,所述根据所述倒排表与所述第二视觉词集的相关性,对所述倒排表中的 图像地址进行排序包括:
[0化1] 确定所述倒排表中的图像地址与所述第二视觉词集中相关的视觉词的个数;
[0化2] 根据所述图像地址相关的所述视觉词的个数,对所述图像地址进行排序。
[0053]一种视觉词典的应用装置,包括:
[0化4] 数据库索引建立单元,用于根据所述的视觉词典W及图像数据库,
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1