一种确定网页图片相关度及显示检索结果的方法及装置制造方法

文档序号:6552301阅读:170来源:国知局
一种确定网页图片相关度及显示检索结果的方法及装置制造方法
【专利摘要】本发明实施例公开了一种确定网页图片相关度及显示检索结果的方法及装置,所述确定网页图片相关度的方法包括:获取目标网页中的图片;根据图片在目标网页中的位置、图片的周边信息和图片与目标网页主题的相关度中的至少一项,确定图片与目标网页的相关度;根据图片与目标网页之间的相关度,建立网页图片信息索引库。通过本发明公开的一种确定网页图片相关度及显示检索结果的方法及装置,可以确定图片与所述目标网页之间的相关度,建立网页图片信息索引库,并且在检索结果中显示网页主图,使得用户通过网页主图直观的获得页面主题,判断该页面是否是正确的检索结果,提高了用户检索的效率。
【专利说明】-种确定网页图片相关度及显示检索结果的方法及装置

【技术领域】
[0001] 本发明实施例涉及互联网【技术领域】,尤其涉及一种确定网页图片相关度及显示检 索结果的方法及装置。

【背景技术】
[0002] 随着互联网技术的发展,图文并茂形态的网页越来越多,图片可以直观向用户传 达所包含的内容,尤其是网页主图,最能体现网页主题。
[0003] 在当前的搜索引擎中,用户输入检索请求,检索结果展现出与检索请求相对应的 网页的标题、正文摘要、更新时间等网页相关的信息。例如用户输入的检索请求为:黄杨,检 索结果如图1所示。若用户无法从文字上获得正确的检索结果,则需要用户点击与网页相 关的链接,跳转至网页的正文部分,查看图片,并且需要逐个查看各个图片,判断哪幅图片 最能代表网页主题,进一步判断该网页是否是正确的检索结果,由此造成检索效率不高。


【发明内容】

[0004] 本发明实施例提供一种确定网页图片相关度及显示检索结果的方法及装置,以实 现提1?用户的检索效率。
[0005] 本发明实施例提供了一种确定网页图片相关度的方法,包括:
[0006] 获取目标网页中的图片;
[0007] 根据所述图片在所述目标网页中的位置、所述图片的周边信息和所述图片与目标 网页主题的相关度中的至少一项,确定所述图片与所述目标网页的相关度;
[0008] 根据所述图片与所述目标网页之间的相关度,建立网页图片信息索引库。
[0009] 本发明实施例提供了一种显示检索结果的方法,包括:
[0010] 接收用户输入的检索请求;
[0011] 获取与所述检索请求相对应的检索结果;
[0012] 依据网页图片信息索引库中图片与目标网页的相关度,将所述检索结果中的网页 进行排序,并展示所述网页的图片。
[0013] 本发明实施例提供了一种确定网页图片相关度的装置,包括:图片获取模块、相关 度确定模块和网页图片信息索引库建立模块;
[0014] 所述图片获取模块,用于获取目标网页中的图片;
[0015] 所述相关度确定模块,用于根据所述图片在所述目标网页中的位置、所述图片的 周边信息和所述图片与目标网页主题的相关度中的至少一项,确定所述图片与所述目标网 页的相关度;
[0016] 所述网页图片信息索引库建立模块,用于根据所述图片与所述目标网页之间的相 关度,建立网页图片信息索引库。
[0017] 本发明实施例还提供了一种显示检索结果的装置,包括:检索请求接收模块、检索 结果获取模块和网页排序模块;
[0018] 所述检索请求接收模块,用于接收用户输入的检索请求;
[0019] 所述检索结果获取模块,用于获取与所述检索请求相对应的检索结果;
[0020] 所述网页排序模块,用于依据网页图片信息索引库中图片与目标网页的相关度, 将所述检索结果中的网页进行排序,并展示所述网页的图片。
[0021] 本发明实施例通过一种确定网页图片相关度及显示检索结果的方法及装置,可以 建立图片与网页的对应关系,并且在检索结果中显示网页主图,使得用户通过网页主图直 观的获得页面主题,判断该页面是否是正确的检索结果,提高了用户检索的效率。

【专利附图】

【附图说明】
[0022] 图1为现有技术中检索结果示意图;
[0023] 图2为本发明实施例一提供的一种确定网页图片相关度的方法的流程示意图;
[0024] 图3为本发明实施例四提供的一种显示检索结果的方法流程示意图;
[0025] 图4为本发明实施例四提供的检索结果示意图;
[0026] 图5为本发明实施例五提供的一种确定网页图片相关度的装置结构示意图;
[0027] 图6为本发明实施例八提供的显示检索结果的装置结构示意图。

【具体实施方式】
[0028] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描 述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便 于描述,附图中仅示出了与本发明相关的部分而非全部结构。
[0029] 实施例一
[0030] 图2为本发明实施例一提供的一种确定网页图片相关度的方法的流程示意图,该 方法可适用于用户使用互联网进行检索的情况下,该方法可以由确定网页图片相关度的装 置来执行,该装置可以由硬件和/或软件来实现,该装置可以配置能够处理网页数据的服 务器。该方法具体包括:
[0031] S201,获取目标网页中的图片;
[0032] 目标网页中可以包括文本和图片,图片一般为至少一幅。
[0033] S202,根据图片在目标网页中的位置、图片的周边信息和图片与目标网页主题的 相关度中的至少一项,确定图片与目标网页的相关度。
[0034] 在上述操作中,图片在目标网页中的位置可以位于目标网页的正文或边框位置; 图片的周边信息可以包括周边文本字样、周边标签、图片正下方的短文本和图片尺寸等信 息。
[0035] S203,根据图片与目标网页之间的相关度,建立网页图片信息索引库。
[0036] 在上述操作中,可以确定网页中每幅图片与该网页之间的相关度,相关度可以用 百分比等量化形式进行表示,也可以将相关度划分为几类,例如确定网页的主图。优选是, 图片与目标网页之间的相关度可以包括:目标网页的主体部分包含图片,其中第N张图片 为目标网页的主图;或者,目标网页的边框部分包含图片,其中第N张图片为目标网页的主 图,其中,N为自然数。从而,可以通过查询网页图片信息索引库,获得图片与目标网页之间 的相关度。
[0037] 通过本发明实施例一公开的一种确定网页图片相关度的方法,可以通过依据图片 在目标网页中的位置、图片的周边标签和图片与目标网页主题的相关度中的至少一项,确 定图片与目标网页的相关度。
[0038] 实施例二
[0039] 本实施例二在实施例一的基础上,优选是将实施例一中的操作S102,根据图片在 目标网页中的位置、图片的周边信息和图片与目标网页主题的相关度中的至少一项,确定 图片与目标网页的相关度,进一步优化为:如果图片的位置位于目标网页的主体部分,依据 图片的周边的标签信息,确定图片与目标网页的相关度。
[0040] 在上述操作中,图片的周边信息可以包括:周边文本字体样式、周边标签、正下方 的短文本和尺寸等信息。则如果图片的位置位于目标网页的主体部分,依据图片的周边信 息,确定图片与目标网页的相关度的方式可以包括以下至少一项:
[0041] 如果图片的周边文本字体样式为预设样式,则图片为目标网页的主图,预设样式 可以为字体加粗、字体颜色与其他字体颜色有明显差异;
[0042] 如果图片的周边标签为预设的标签,则图片为目标网页的主图,预设的标签可以 为P标签(定义段落)、center标签(对其包围的文本进行水平居中处理)和ignore_js_ os标签;
[0043] 如果图片正下方的短文本不是锚文本,则图片为目标网页的主图,其中,锚文本又 称锚文本链接,是链接形式的一种;
[0044] 如果图片尺寸位于预设的尺寸范围内,则图片为目标网页的主图。其中,尺寸中的 长度与宽度可以是以像素为单位。
[0045] 通过本发明实施例二公开的一种确定网页图片相关度的方法,在实施例一的基础 上,可以依据图片的周边的标签信息,确定图片与目标网页的相关度。
[0046] 实施例三
[0047] 本实施例三在实施例一的基础上,优选是将实施例一中的操作S102,根据图片在 目标网页中的位置、图片的周边信息和图片与目标网页主题的相关度中的至少一项,确定 图片与目标网页的相关度,进一步优化为:如果图片的位置位于目标网页的边框部分,依据 图片与目标网页主题的相关度,确定图片与目标网页的相关度。
[0048] 在上述操作中,可以通过获取图片的标签文字属性、标签标题属性和描述内容中 的至少一项,与目标网页主题之间的相似性,根据相似性确定图片与目标网页的相关度。 [0049] 具体的,可以通过以下至少一种方式,根据相似性确定图片与目标网页的相关 度:
[0050] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的共有词数量超过预设数量的图片为目标网页的主图;
[0051] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的字符串之间的编辑距离小于第一预设距离的图片为目标网页的 主图;
[0052] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的字符串之间的向量距离小于预设的第二距离的图片为目标网页 的主图;向量距离可以是KL距离、欧式距离、马氏距离和明氏距离中的任意一种。
[0053] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的字符串之间的向量相似度大于预设的相似度的图片为目标网页 的主图;向量相似度可以是余弦夹角,Dice系数,Jaccard系数中的任意一种。
[0054] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的字符串之间的向量相关系数大于预设的相关系数的图片为目标 网页的主图;向量相关系数可以是皮尔逊系数,肯德尔系数,斯皮尔曼系数。
[0055] 通过本发明实施例三公开的一种确定网页图片相关度的方法,在实施例一的基础 上,依据图片与目标网页主题的相关度,确定图片与目标网页的相关度。
[0056] 实施例四
[0057] 图3为本发明实施例四提供的一种显示检索结果的方法流程示意图;图4为本发 明实施例四提供的检索结果示意图。
[0058] 该方法可适用于用户使用互联网进行检索的情况下,该方法可以由显示检索结果 的装置来执行,该装置可以由硬件和/或软件来实现,该装置可以配置能够处理网页数据 的服务器。该方法具体包括:
[0059] S301,接收用户输入的检索请求。
[0060] 在上述操作中,检索请求可以是用户在检索界面上直接输入的文字、符号、字母和 数字任意的组合。
[0061] S302,获取与检索请求相对应的检索结果。
[0062] 在上述操作中,可以通过无线连接或者有线连接的方式向处理页面数据的服务器 发送检索请求,处理页面数据的服务器接收该检索请求,进行检索,并返回与检索请求相对 应的检索结果,从而获得与检索请求相对应的检索结果。
[0063] S303,依据网页图片信息索引库中图片与目标网页的相关度,将检索结果中的网 页进行排序,并展示网页的图片。
[0064] 在上述操作中,检索结果可以包括两个及两个以上的网页,并可以按照网页图片 信息索引库中图片与目标网页的相关度由高到低的顺序,对各个网页进行排序,优选的可 以是,将检索结果中的网页的主体部分包含主图的网页,进行优先排序,并且展示的网页图 片可以是与目标网页的相关度最商的图片。
[0065] 在本发明实施例四中,以检索请求为"黄杨"为例,对检索结果中的各个网页进行 排序后的如图4所不。
[0066] 通过本发明实施例四公开的一种显示检索结果的方法,对检索结果中各个网页进 行排序,用户优先查看到具有网页主图的网页,通过网页主图直观的获得页面主题,判断该 页面是否是正确的检索结果,提高了用户检索的效率。
[0067] 实施例五
[0068] 图5为本发明实施例五提供的一种确定网页图片相关度的装置结构示意图。本实 施例可适用于用户使用互联网进行检索的情况下情况,该确定网页图片相关度的装置的具 体结构包括:
[0069] 图片获取模块51、相关度确定模块52和网页图片信息索引库建立模块53。
[0070] 其中,图片获取模块51,用于获取目标网页中的图片;相关度确定模块52,用于根 据图片在目标网页中的位置、图片的周边标签和图片与目标网页主题的相关度中的至少一 项,确定图片与目标网页的相关度;网页图片信息索引库建立模块53,用于根据图片与目 标网页之间的相关度,建立网页图片信息索引库。
[0071] 在图片获取模块51中,目标网页中可以包括文本和图片,图片一般为至少一幅。
[0072] 在相关度确定模块52中,图片在目标网页中的位置可以位于目标网页的正文或 边框位置;图片的周边信息可以包括周边文本字样、周边标签、图片正下方的短文本和图片 尺寸等信息。
[0073] 网页图片信息索引库建立模块53,可以确定网页中每幅图片与该网页之间的相关 度,相关度可以用百分比等量化形式进行表示,也可以将相关度划分为几类,例如确定网页 的主图。优选是,图片与目标网页之间的相关度可以包括:目标网页的主体部分包含图片, 其中第N张图片为目标网页的主图;或者,目标网页的边框部分包含图片,其中第N张图片 为目标网页的主图,其中,N为自然数。从而,可以通过查询网页图片信息索引库,获得图片 与目标网页之间的相关度。
[0074] 通过本发明实施例五公开的一种确定网页图片相关度的装置,可以通过依据图片 在目标网页中的位置、图片的周边标签和图片与目标网页主题的相关度中的至少一项,确 定图片与目标网页的相关度。
[0075] 实施例六
[0076] 本实施例在实施例五的基础上,实施例六提供的一种确定网页图片相关度的装 置,优选是将在相关度确定模块进一步优化为:相关度确定第一模块。
[0077] 相关度确定第一模块,用于如果图片的位置位于目标网页的主体部分,依据图片 的周边的标签信息,确定图片与目标网页的相关度。
[0078] 由于图片的周边信息可以包括周边文本字样、周边标签、图片正下方的短文本和 图片尺寸等信息,则相关度确定第一模块,可以通过以下至少一种方式确定图片与目标网 页的相关度,即所述相关度确定第一模块具体用于执行下述至少一项:
[0079] 如果图片的周边文本字体样式为预设样式,则图片为目标网页的主图,预设样式 可以为字体加粗、字体颜色与其他字体颜色有明显差异;
[0080] 如果图片的周边标签为预设的标签,则图片为目标网页的主图,预设的标签可以 为P标签(定义段落)、center标签(对其包围的文本进行水平居中处理)和ignore_js_ os标签;
[0081] 如果图片正下方的短文本不是锚文本,则图片为目标网页的主图,其中,锚文本又 称锚文本链接,是链接形式的一种;
[0082] 如果图片尺寸位于预设的尺寸范围内,则图片为目标网页的主图。其中,尺寸中的 长度与宽度可以是以像素为单位。
[0083] 通过本发明实施例六公开的一种确定网页图片相关度的装置,在实施例五的基础 上,可以依据图片的周边的标签信息,确定图片与目标网页的相关度。
[0084] 实施例七
[0085] 本实施例在实施例五的基础上,实施例七提供的一种确定网页图片相关度的装 置,优选是将在相关度确定模块进一步优化为:相关度确定第二模块。
[0086] 相关度确定第二模块,用于如果图片的位置位于目标网页的边框部分,依据图片 与目标网页主题的相关度,确定图片与目标网页的相关度。
[0087] 具体的,可以通过以下方式根据相似性确定图片与目标网页的相关度,即所述相 关度确定第二模块具体用于执行下述至少一项:
[0088] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的共有词数量超过预设数量的图片为目标网页的主图;
[0089] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的字符串之间的编辑距离小于第一预设距离的图片为目标网页的 主图;
[0090] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的字符串之间的向量距离小于预设的第二距离的图片为目标网页 的主图;向量距离可以是KL距离、欧式距离、马氏距离和明氏距离中的任意一种。
[0091] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的字符串之间的向量相似度大于预设的相似度的图片为目标网页 的主图;向量相似度可以是余弦夹角,Dice系数,Jaccard系数中的任意一种。
[0092] 获取图片的标签文字属性、标签标题属性和描述内容中的至少一项,与目标网页 的文章标题或页面标题的字符串之间的向量相关系数大于预设的相关系数的图片为目标 网页的主图;向量相关系数可以是皮尔逊系数,肯德尔系数,斯皮尔曼系数。
[0093] 通过本发明实施例其公开的一种确定网页图片相关度的装置,在实施例五的基础 上,依据图片与目标网页主题的相关度,确定图片与目标网页的相关度。
[0094] 实施例八
[0095] 图6为本发明实施例八提供的显示检索结果的装置结构示意图。
[0096] 本发明实施例八提供了一种显示检索结果的装置,包括:检索请求接收模块61、 检索结果获取模块62和网页排序模块63 ;其中,检索请求接收模块61,用于接收用户输入 的检索请求;检索结果获取模块62,用于获取与检索请求相对应的检索结果;网页排序模 块63,用于依据网页图片信息索引库中图片与目标网页的相关度,将检索结果中的网页进 行排序,并展示网页的图片。
[0097] 在检索请求接收模块61中,检索请求可以是用户在检索界面上直接输入的文字、 符号、字母和数字任意的组合。
[0098] 在检索结果获取模块62中,可以通过无线连接或者有线连接的方式向处理页面 数据的服务器发送检索请求,处理页面数据的服务器接收该检索请求,进行检索,并返回与 检索请求相对应的检索结果,从而获得与检索请求相对应的检索结果。
[0099] 在网页排序模块63中依据网页图片信息索引库中图片与目标网页的相关度,将 检索结果中的网页进行排序,并展示网页的图片。
[0100] 在上述操作中,检索结果可以包括两个及两个以上的网页,并可以按照网页图片 信息索引库中图片与目标网页的相关度由高到低的顺序,对各个网页进行排序,优选的可 以是,将检索结果中的网页的主体部分包含主图的网页,进行优先排序,并且展示的网页图 片可以是与目标网页的相关度最商的图片。
[0101] 通过本发明实施例八公开的一种显示检索结果的装置,对检索结果中各个网页进 行排序,用户优先查看到具有网页主图的网页,通过网页主图直观的获得页面主题,判断该 页面是否是正确的检索结果,提高了用户检索的效率。
[0102] 请注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理 解,本发明不限于这里的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重 新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了 较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可 以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
【权利要求】
1. 一种确定网页图片相关度的方法,其特征在于,包括: 获取目标网页中的图片; 根据所述图片在所述目标网页中的位置、所述图片的周边信息和所述图片与目标网页 主题的相关度中的至少一项,确定所述图片与所述目标网页的相关度; 根据所述图片与所述目标网页之间的相关度,建立网页图片信息索引库。
2. 根据权利要求1所述的方法,其特征在于,所述根据所述图片在所述目标网页中的 位置、所述图片的周边信息和所述图片与目标网页主题的相关度中的至少一项,确定所述 图片与所述目标网页的相关度包括: 如果所述图片的位置位于所述目标网页的主体部分,依据所述图片的周边信息,确定 所述图片与所述目标网页的相关度;或 如果所述图片的位置位于所述目标网页的边框部分,依据所述图片与所述目标网页主 题的相关度,确定所述图片与所述目标网页的相关度。
3. 根据权利要求2所述的方法,其特征在于,所述依据所述图片的周边信息,确定所述 图片与所述目标网页的相关度包括下述至少一项: 如果所述图片的周边文本字体样式为预设样式,则所述图片为所述目标网页的主图; 如果所述图片的周边标签为预设的标签,则所述图片为所述目标网页的主图; 如果所述图片正下方的短文本不是锚文本,则所述图片为所述目标网页的主图; 如果所述图片尺寸位于预设的尺寸范围内,则所述图片为所述目标网页的主图。
4. 根据权利要求2所述的方法,其特征在于,依据所述图片与所述目标网页主题的相 关度,确定所述图片与所述目标网页的相关度包括: 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页主题之间的相似性,根据所述相似性确定所述图片与所述目标网页的相关度。
5. 根据权利要求4所述的方法,其特征在于,获取所述图片的标签文字属性、标签标题 属性和描述内容中的至少一项,与所述目标网页主题之间的相似性,根据所述相似性确定 所述图片与所述目标网页的相关度包括下述至少一项: 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的共有词数量超过预设数量的图片为所述目标网页的主图; 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的字符串之间的编辑距离小于第一预设距离的图片为所述目 标网页的主图; 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的字符串之间的向量距离小于预设的第二距离的图片为所述 目标网页的主图; 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的字符串之间的向量相似度大于预设的相似度的图片为所述 目标网页的主图; 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的字符串之间的向量相关系数大于预设的相关系数的图片为 所述目标网页的主图。
6. 根据权利要求1所述的方法,其特征在于,所述图片与所述目标网页之间的相关度 包括: 所述目标网页的主体部分包含所述图片,其中第N张所述图片为所述目标网页的主 图;或 所述目标网页的边框部分包含所述图片,其中第N张所述图片为所述目标网页的主 图,其中,N为自然数。
7. -种显示检索结果的方法,其特征在于,包括: 接收用户输入的检索请求; 获取与所述检索请求相对应的检索结果; 依据网页图片信息索引库中图片与目标网页的相关度,将所述检索结果中的网页进行 排序,并展示所述网页的图片。
8. 根据权利要求7所述的方法,其特征在于,所述依据网页图片信息索引库中图片与 目标网页的相关度,将所述检索结果中的网页进行排序包括: 依据网页图片信息索引库中图片与目标网页的相关度,将所述检索结果中的网页的主 体部分包含主图的网页,进行优先排序。
9. 一种确定网页图片相关度的装置,其特征在于,包括:图片获取模块、相关度确定模 块和网页图片信息索引库建立模块; 所述图片获取模块,用于获取目标网页中的图片; 所述相关度确定模块,用于根据所述图片在所述目标网页中的位置、所述图片的周边 信息和所述图片与目标网页主题的相关度中的至少一项,确定所述图片与所述目标网页的 相关度; 所述网页图片信息索引库建立模块,用于根据所述图片与所述目标网页之间的相关 度,建立网页图片信息索引库。
10. 根据权利要求9所述的装置,其特征在于,所述相关度确定模块包括:相关度确定 第一模块或相关度确定第二模块; 所述相关度确定第一模块,用于如果所述图片的位置位于所述目标网页的主体部分, 依据所述图片的周边信息,确定所述图片与所述目标网页的相关度; 所述相关度确定第二模块,用于如果所述图片的位置位于所述目标网页的边框部分, 依据所述图片与所述目标网页主题的相关度,确定所述图片与所述目标网页的相关度。
11. 根据权利要求10所述的装置,其特征在于,所述相关度确定第一模块具体用于执 行下述至少一项: 如果所述图片的周边文本字体样式为预设样式,则所述图片为所述目标网页的主图; 如果所述图片的周边标签为预设的标签,则所述图片为所述目标网页的主图; 如果所述图片正下方的短文本不是锚文本,则所述图片为所述目标网页的主图; 如果所述图片尺寸位于预设的尺寸范围内,则所述图片为所述目标网页的主图。
12. 根据权利要求10所述的装置,其特征在于,所述相关度确定第二模块具体用于,获 取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标网页主 题之间的相似性,根据所述相似性确定所述图片与所述目标网页的相关度。
13. 根据权利要求12所述的装置,其特征在于,所述相关度确定第二模块具体用于执 行下述至少一项: 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的共有词数量超过预设数量的图片为所述目标网页的主图; 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的字符串之间的编辑距离小于第一预设距离的图片为所述目 标网页的主图; 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的字符串之间的向量距离小于预设的第二距离的图片为所述 目标网页的主图; 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的字符串之间的向量相似度大于预设的相似度的图片为所述 目标网页的主图; 获取所述图片的标签文字属性、标签标题属性和描述内容中的至少一项,与所述目标 网页的文章标题或页面标题的字符串之间的向量相关系数大于预设的相关系数的图片为 所述目标网页的主图。
14. 根据权利要求10所述的装置,其特征在于,在所述网页图片信息索引库建立模块 中,所述图片与所述目标网页之间的相关度包括: 所述目标网页的主体部分包含所述图片,其中第N张所述图片为所述目标网页的主 图;或 所述目标网页的边框部分包含所述图片,其中第N张所述图片为所述目标网页的主 图,其中,N为自然数。
15. -种显示检索结果的装置,其特征在于,包括:检索请求接收模块、检索结果获取 模块和网页排序模块; 所述检索请求接收模块,用于接收用户输入的检索请求; 所述检索结果获取模块,用于获取与所述检索请求相对应的检索结果; 所述网页排序模块,用于依据网页图片信息索引库中图片与目标网页的相关度,将所 述检索结果中的网页进行排序,并展示所述网页的图片。
16. 根据权利要求15所述的装置,其特征在于,所述网页排序模块具体用于,依据网页 图片信息索引库中图片与目标网页的相关度,将所述检索结果中的网页的主体部分包含主 图的网页,进行优先排序。
【文档编号】G06F17/30GK104063489SQ201410317567
【公开日】2014年9月24日 申请日期:2014年7月4日 优先权日:2014年7月4日
【发明者】陶涛, 牛正雨, 郭荣锋, 张梦涵, 郭瑞, 张岩 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1