基于用户搜索意图定位的图像检索方法及系统的制作方法_3

文档序号:9667478阅读:来源:国知局
类后的图像中选取一个类别中 的至少一个图像。实际应用时,一些用户可能会希望选择多张较满意的图片,那么,他们可 以单击选取多张,服务器会对这些选取的图像执行各自的二次检索过程。若用户对该页中 的所有图像都不满意,他可以选择"下一页"查看其他图像,处理过程同上。
[0080] S8 :将被选取的图像及与被选取的图像相关的文本信息作为检索条件,进行二次 检索。
[0081] 与被选取的图像相关的文本信息,包括:被选取的图像的类别名称、用户输入的检 索关键字和\或HTML中的图像描述信息(HTML,HyperTextMarkupLanguage,超文本标 记语言,HTML中的图像描述信息是指HTML中的"alt"字段属性信息)。其中,类别名称,即 用户已选择图像所属类别,如果图像属于"其他"类型,则该字段设为空值;用户输入的检索 关键字,若用户是通过上传图像进行检索的,则该字段为空值;HTML中的图像描述信息即 图像的"alt"属性字段,在主搜索页面的源代码中,图像可能会在"alt"属性中设置图像标 签来描述图像信息,若无,则该字段设为空值。
[0082] 二次检索的具体步骤如下:
[0083] S801 :根据与被选取的图像相关的文本信息的文本内容,在图像结果集中被选取 的图像所在的分类中进行基于文本的图像检索。
[0084] S802:提取被选取的图像的视觉特征,采用感知哈希算法计算被选取的图像以及 图像结果集中被选取的图像所在的分类中的图像的图像相似度,在图像结果集中被选取的 图像所在的分类中进行图像检索。参见图2,图像相似度计算的具体步骤如下:
[0085] S8021 :将图像转化为灰度图像,转化公式如下:
[0086] Gray=RXO. 299+GXO. 587+BX0. 114 (1)
[0087] 其中,Gray表示灰度值,R、G和B分别表示原始像素中的红、绿和蓝的分量。
[0088] S8022 :将灰度图像分为8X8块,将每个块的灰度设置为该块的灰度平均值,使用 Gray[8, 8]矩阵来存储每个块的灰度值,生成一个感知哈希矩阵H[8, 8],满足以下条件:
[0089]

[0090] 其中,avg是整张灰度图像的灰度平均值,Gray[i,j]是图像被划分后,第i行、第 j列个块的灰度值,others是指第i行、第j列个块的灰度值小于avg时的情况,H[i,j]是 由第i行、第j列个块的灰度值得到的感知哈希矩阵H[8, 8]的第i行、第j列个元素的值, 并满足以下条件:
[0091]
[0092] 其中,Μ是指图像划分后的行数且M= 8,N是指图像划分后的列数且N= 8,将获 得的64位的二进制数值作为图像的感知哈希值。
[0093] S8023 :采用步骤S8021至步骤S8022分别提取被选取的图像以及检索结果(即图 像结果集中被选取的图像所在的分类中的图像)所对应的图像的感知哈希值,采用按位异 或方式计算两张图像的相似度,图像H1和图像H2的相似度p(氏,H2)可以表示为位0的异 或结果的百分比,公式如下:
[0094]

[0095] 其中,C。是一个计算0异或结果的函数。
[0096] 采用简化的感知哈希算法来在基于图像而进行图像检索的过程中,计算图像之间 的相似度,可以显者减少^?次检索的运算量,提尚检索系统的处理速度,并能进一步提尚检 索的精度。
[0097] 在实际应用中,为了进一步提高检索精度,还可以进行:
[0098] S10 :在步骤S801完成后,在步骤S801所获得的结果集中,采用步骤S802进行检 索排序,将排序后的结果集返回给用户。具体排序方式如下:
[0099] S1001 :在步骤S801完成后,二次检索中基于文本的图像检索从图像结果集中选 出了一个图像集IS。
[0100] S1002 :用pO^Hj公式来计算样本图像I与图像集合IS中图像的相似度,其中, 样本图像I指的是用户从经过分类的图像中选取的一张或多张图像。具体说明如下:
[0101] 首先定义一个向量P,用来保存样本图像I与IS中每个图像is的相似程度,也就 是p(I,is),计算完成后,将P中的所有元素降序排列。因此,这些二次检索所得的图像结果 就有了一个新的排序序列,最后,我们只需要将排序结果返回给用户即可。
[0102] 本发明实施例中,同时考虑文本和内容的图像搜索结果,而且,基于文本的搜索结 果会根据基于内容的特征来进行重排序,从而保证更相似的图像位于重新检索结果的顶 部。经过重排序过程后,重新检索图像便被重组成一个新的序列。同样的,该过程中处理的 数据量并不大,因为我们只需要考虑从当前页的返回结果中进行二次检索,当用户不满意 当前的结果时,点击下一页,才进行下一页结果集的二次检索。
[0103] 参见图4,在上述方法的同一原理的基础上,本发明的基于用户搜索意图定位的图 像检索系统,包括一次检索模块、分类模块、用户交互模块以及二次检索模块。其中,一次检 索模块用于根据用户输入的检索关键字,使用任意一个图像检索平台进行检索获取图像结 果集;分类模块用于根据图像结果集中的图像的文本信息,对图像结果集中的图像进行分 类;用户交互模块用于将分类后的图像返回给用户,并引导用户在分类后的图像中选取一 个类别中的至少一个图像;二次检索模块用于将被选取的图像及与被选取的图像相关的文 本信息作为检索条件,进行二次检索。该系统采用一次检索模块进行广泛检索,采用分类 模块对广泛检索获得的图像结果集进行分类,然后通过用户交互模块引导用户进行一次反 馈,根据反馈的结果进行二次检索,可以以增加较小的计算量,使得检索精度获得较大的提 尚。
[0104] 在实际应用中,为了进一步以较小的计算量提高检索精度,该系统还可扩充,其中 二次检索模块可包括:文本检索单元和图像检索单元,其中,文本检索单元用于根据与被选 取的图像相关的文本信息的文本内容,在图像结果集中被选取的图像所在的分类中进行基 于文本的图像检索;图像检索单元用于提取被选取的图像的视觉特征,采用感知哈希算法 计算被选取的图像以及图像结果集中被选取的图像所在的分类中的图像的图像相似度,在 图像结果集中被选取的图像所在的分类中进行图像检索。在基于图像内容进行的图像检索 中,采用了一种改进的感知哈希算法。该算法提取图像特征作为其指纹,这种指纹可用来比 较。系统还可包括排序模块,用于在文本检索单元完成后,在文本检索单元所获得的结果集 中,采用图像检索单元进行检索排序,将排序后的结果集返回给用户。
[0105] 结合上述的描述,下面从搜索精确度和时间消耗两方面,对本发明实施例的优点 进行进一步说明:
[0106] 而在本发明实施例中,先将图像进行分类,将分类结果展示给用户让用户选择,这 种方式与现在技术相比,用户不需要面对大量图像来选择出一个较满意的图像,而是从少 数量的分类中找到一个较满意的类,并从这个类中选择出一个或多个较满意的图像,这样 可产生更好的用户体验;其次,本系统对图像重排序采用了计算量小的简化的感知哈希算 法来计算两图的相似度,而现有技术采用的是更加复杂且计算量较大的算法。通过理论分 析及实验证明,本发明实施例消耗更少的时间,不仅达到了较高精确度的效果,也节省了计 算资源,提高了计算效率。
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1