基于用户搜索意图定位的图像检索方法及系统的制作方法_2

文档序号：9667478阅读：来源：国知局

，并引导用户在分类后的图像中选取一个类别中的至少一个图像；
[0047] 二次检索模块，用于将被选取的图像及与被选取的图像相关的文本信息作为检索条件，进行二次检索。
[0048] 作为本发明的系统的进一步改进：
[0049] 二次检索模块包括：
[0050] 文本检索单元，用于根据与被选取的图像相关的文本信息的文本内容，在图像结果集中被选取的图像所在的分类中进行基于文本的图像检索；
[0051] 图像检索单元，用于提取被选取的图像的视觉特征，采用感知哈希算法计算被选取的图像以及图像结果集中被选取的图像所在的分类中的图像的图像相似度，在图像结果集中被选取的图像所在的分类中进行图像检索。
[0052] 系统还包括排序模块，用于在文本检索单元完成后，在文本检索单元所获得的结果集中，采用图像检索单元进行检索排序，将排序后的结果集返回给用户。
[0053] 本发明具有以下有益效果：
[0054] 1、本发明的基于用户搜索意图定位的图像检索方法，采用任意一个图像检索平台进行检索获取图像结果集，可以首先使用户获得全面的检索结果；然后根据图像的文本信息对图像结果集中的图像进行分类，并将分类结果显示给用户进行选择，通过用户对分类的选择来大致获取用户的检索意图，进行文本和图像相结合的二次检索；用户只需进行一次额外的反馈，就可以以此来获取能够反映用户意图的检索结果。因而，本发明能通过较小的计算量、消耗更少的时间达到较高精确度的效果，节省了计算资源，提高了计算效率。
[0055] 2、本发明的基于用户搜索意图定位的图像检索方法，采用简化的感知哈希算法来在基于图像而进行图像检索的过程中，计算图像之间的相似度，可以显著减少二次检索的运算量，提高检索系统的处理速度，并能进一步提高检索的精度。
[0056] 3、本发明的基于用户搜索意图定位的图像检索系统，采用一次检索模块进行广泛检索，采用分类模块对广泛检索获得的图像结果集进行分类，然后通过用户交互模块引导用户进行一次反馈，根据反馈的结果进行二次检索，可以以增加较小的计算量，使得检索精度获得较大的提高。
[0057] 除了上面所描述的目的、特征和优点之外，本发明还有其它的目的、特征和优点。下面将参照附图，对本发明作进一步详细的说明。
【附图说明】
[0058] 构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：
[0059] 图1是本发明优选实施例的基于用户搜索意图定位的图像检索方法的流程示意图；
[0060] 图2是本发明优选实施例的步骤S802的图像处理过程示意图；
[0061] 图3是本发明优选实施例的维基百科分类索引的类目分级示意图；
[0062] 图4是本发明优选实施例的基于用户搜索意图定位的图像检索的结构图。
【具体实施方式】
[0063] 以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。
[0064] 图1是本发明实施例中基于用户搜索意图定位的图像检索方法的流程示意图。参见图1，本发明的一种基于用户搜索意图定位的图像检索方法，包括以下步骤：
[0065] S2:根据用户输入的检索关键字，使用任意一个图像检索平台进行检索获取图像结果集；
[0066] S4 :根据图像结果集中的图像的文本信息，对图像结果集中的图像进行分类；
[0067] S6:将分类后的图像返回给用户，并引导用户在分类后的图像中选取一个类别中的至少一个图像；
[0068] S8 :将被选取的图像及与被选取的图像相关的文本信息作为检索条件，进行二次检索。
[0069] 以上步骤，采用任意一个图像检索平台进行检索获取图像结果集，可以首先使用户获得全面的检索结果；然后根据图像的文本信息对图像结果集中的图像进行分类，并将分类结果显示给用户进行选择，通过用户对分类的选择来大致获取用户的检索意图，进行文本和图像相结合的二次检索；用户只需进行一次额外的反馈，就可以以此来获取能够反映用户意图的检索结果。因而，本发明能通过较小的计算量、消耗更少的时间达到较高精确度的效果，节省了计算资源，提高了计算效率。
[0070] 在实际应用中，在上述步骤的基础上，本发明的基于用户搜索意图定位的图像检索方法还可增加以下步骤进行优化：
[0071] S2:根据用户输入的检索关键字，使用任意一个图像检索平台进行检索获取图像结果集。第一次检索的图像检索平台可以在现有的众多检索平台中任选一个。
[0072] S4 :根据图像结果集中的图像的文本信息，对图像结果集中的图像进行分类。图像的文本信息包括两个部分：（1)当从图像检索平台获取图像结果集的网页时，我们可以利用常见的一些技术，如网络爬虫技术，获取该网页中的文字信息，我们可以通过文档分析来提取其中出现频率高的词语或其他信息。这里的其他信息，我们在这里举一个例子来说明，比如，当用百度的识图平台进行搜索时，在搜索结果页面，会提供"对该图片的最佳猜测： XXX"。该"XXX"和上述的出现频率高的词语可视为具有代表性的文本信息。它们可以作为 "文本信息"的一部分；（2)当从图像检索平台获取图像结果集网页时，也可以获取并分析该网页的HTML中的标签，例如，从HTML中提取出"img"标签的"src"属性，从而可以获取该图像的文件位置，通过获取该位置的信息可以得到更多的关于图像的文本信息，这些信息也是具有代表性的，作为文本信息的另一个组成部分。步骤S4的具体步骤如下：
[0073] S401 :根据图像结果集中的图像的文本信息，将每个图像在维基百科分类索引 (参见图3)中所属的二级类目（或者二级深度/二级类目深度）作为图像的类别。维基百科分类索引采用的语言可以是中文或英文或其他语言，可以利用字典库将中文对应的英文或其他语言进行关联。具体包括以下步骤：
[0074] S4011 :根据图像结果集中的图像的文本信息，建立如下的信息矩阵：
[0075]
[0076] 其中，N表示图像结果集中的图像的图像数目，L表示图像结果集中的一张图像，其中0〈 =i〈 =N;1\表示图像的文本信息，其中0〈 =i〈 =N;C^示与图像相关的类别名，其中0〈 =i〈 =N。
[0077] S4012 :根据维基百科分类索引定义分类图G(参见图3)，遍历图像结果集中的N 个图像（遍历分类图G时，采用的是广度优先算法），将图像中图像的文本信息中包含的每个词语或短语作为一个文本结点，对于每个图像中的每个文本结点，如果文本结点与分类图G中的结点相匹配，则计算该文本结点出现在图像的文本信息1\中的频率，最后将出现频率最大的文本结点所对应的分类图G中的分类名称作为该图像的分类。
[0078] S402:并将图像的类别对应的所有三级类目作为类别的同义词保存到关系型数据库中。关系型数据库中保存了二级索引与对应的三级索引的相应名称以及关系，参见图3，即维基百科索引的层次结构图，既包括该层次结构图，也包括这种层次关系，这种关系可抽象出来，定义为分类图G。
[0079] S6:将分类后的图像返回给用户，并引导用户在分

完整全部详细技术资料下载

当前第2页1 2 3 4