图片搜索方法和装置制造方法

文档序号:6542113阅读:144来源:国知局
图片搜索方法和装置制造方法
【专利摘要】本发明提出一种图片搜索方法和装置。该方法包括:接收用户输入的搜索词;确定搜索词的搜索频次,并确定搜索频次是否在预设范围内,搜索频次根据搜索引擎记录的历史搜索数据确定;当确定搜索频次在预设范围内时,在预先建立的第一图片库中获取与搜索词匹配的第一图片,第一图片库中包括搜索引擎从UGC网站中获得的图片;向用户展现图片搜索结果,图片搜索结果包括第一图片。本发明实施例的图片搜索方法,可以在提供冷门的图片搜索需求时,为用户提供具有更强实时性、更高相关性、更高质量的图片搜索结果。
【专利说明】图片搜索方法和装置
【技术领域】
[0001]本发明涉及搜索【技术领域】,尤其涉及一种图片搜索方法和装置。
【背景技术】
[0002]图片搜索是垂直搜索引擎的一个重要方向。参照图1,是相关技术中搜索引擎提供图片搜索的一个示例效果图,如图1所示,用户在搜索引擎提供的搜索框中输入“中国中文信息学会青年工委”,搜索引擎给用户提供中国中文信息学会青年工委相关的图片,但是,搜索引擎提供的图片相关度、时效性差,而且图片质量也不高。因此,在相关技术中,对于“中国中文信息学会青年工委”这类冷门需求的图片搜索无论是相关度、时效性还是图片质量都较差,搜索效果不佳。

【发明内容】

[0003]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0004]为此,本发明的第一个目的在于提出一种图片搜索方法。该方法在提供冷门的图片搜索需求时,能够为用户提供具有更强实时性、更高相关性、更高质量的图片搜索结果。
[0005]本发明的第二个目的在于提出一种图片搜索装置。
[0006]为了实现上述目的,本发明第一方面实施例的图片搜索方法,包括:接收用户输入的搜索词;确定所述搜索词的搜索频次,并确定所述搜索频次是否在预设范围内,所述搜索频次根据搜索引擎记录的历史搜索数据确定;当确定所述搜索频次在所述预设范围内时,在预先建立的第一图片库中获取与所述搜索词匹配的第一图片,所述第一图片库中包括所述搜索引擎从用户原创内容UGC网站中获得的图片;向所述用户展现图片搜索结果,所述图片搜索结果包括所述第一图片。
[0007]本发明实施例的图片搜索方法,利用第一图片库补充图片搜索引擎在向用户提供冷门的图片搜索需求时的图片不足的问题,利用第一图片库,图片搜索引擎可以在提供冷门的图片搜索需求时,为用户提供具有更强实时性、更高相关性、更高质量的图片搜索结果,提升用户体验。
[0008]为了实现上述目的,本发明第二方面实施例的图片搜索装置,包括:接收模块,用于接收用户输入的搜索词;确定模块,用于确定所述搜索词的搜索频次,并确定所述搜索频次是否在预设范围内,所述搜索频次根据搜索引擎记录的历史搜索数据确定;第一获取模块,用于当确定所述搜索频次在所述预设范围内时,在预先建立的第一图片库中获取与所述搜索词匹配的第一图片,所述第一图片库中包括所述搜索引擎从用户原创内容UGC网站中获得的图片;展现模块,用于向所述用户展现图片搜索结果,所述图片搜索结果包括所述第一图片。
[0009]本发明实施例的图片搜索装置,利用第一图片库补充图片搜索引擎在向用户提供冷门的图片搜索需求时的图片不足的问题,利用第一图片库,图片搜索引擎可以在提供冷门的图片搜索需求时,为用户提供具有更强实时性、更高相关性、更高质量的图片搜索结果,提升用户体验。
[0010]本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【专利附图】

【附图说明】
[0011]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
[0012]图1是相关技术中搜索引擎提供图片搜索的一个示例效果图;
[0013]图2是根据本发明一个实施例的图片搜索方法的流程图;
[0014]图3是根据本发明实施例的图片搜索方法的一种示例性的效果图;
[0015]图4是根据本发明另一个实施例的图片搜索方法的流程图;
[0016]图5是根据本发明实施例的图片搜索方法的另一种示例性的效果图;
[0017]图6是根据本发明一个实施例的图片搜索方法装置的结构框图;
[0018]图7是根据本发明另一个实施例的图片搜索方法装置的结构框图;以及
[0019]图8是根据本发明又一个实施例的图片搜索方法装置的结构框图。
【具体实施方式】
[0020]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0021]在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0022]流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属【技术领域】的技术人员所理解。
[0023]目前,对于用户的冷门的图片搜索需求,图片搜索引擎为用户提供的图片无论是相关度、时效性还是图片质量都较差,搜索效果都不佳。其主要原因在于,图片搜索引擎索引的图片往往来自各个网站,而这些网站往往是专人编辑和维护的,因此难以保证图片的覆盖性。为此,需要利用其他图片源来补充图片搜索引擎索引的图片不足的问题,而微博、微信、人人网等用户原创内容UGC (User Generated Content)网站上的图片都是普通网民发表的,可涵盖至方方面面,包括小众冷门的图片,而且具有较强的时效性,图片质量也高。由此,可利用微博、微信、人人网等UGC网站上的图片来补充图片搜索引擎索引的图片不足的问题。因此,本发明的实施例公开了一种图片搜索方法和装置。
[0024]下面参考附图描述根据本发明实施例的图片搜索方法和装置。
[0025]图2是根据本发明一个实施例的图片搜索方法的流程图。
[0026]如图2所示,该图片搜索方法包括:
[0027]SlOl,接收用户输入的搜索词。
[0028]具体地,在本发明的实施例中,用户可在图片搜索弓I擎提供的输入框中输入当前搜索词,用户还可在各种快捷搜索输入框中输入搜索词,对此,本方法的实施例不进行限定。
[0029]S102,确定搜索词的搜索频次,并确定搜索频次是否在预设范围内,搜索频次根据搜索引擎记录的历史搜索数据确定。
[0030]具体地,根据搜索频次可以确定搜索词的搜索热度,如果搜索频次相对高,则说明搜索词属于热门搜索,如,杨幂、长城、奔驰等,对应的图片比较丰富,图片搜索引擎能够提供实时性强、相关度高、质量高的图片,而没有必要补充图片,如果补充图片源,反而会增加计算负担。如果搜索频次相对低,则说明搜索词属于冷门搜索,对应的图片较为匮乏,此时需要补充图片。
[0031]S103,当确定搜索频次在预设范围内时,在预先建立的第一图片库中获取与搜索词匹配的第一图片,第一图片库中包括搜索引擎从UGC网站中获得的图片。
[0032]在本发明的一个实施例中,UGC网站包括微博、微信、人人网等中的至少一种。应理解,微博、微信、人人网等仅为了说明本发明实施例的第一图片库的特性,本领域的技术人员很容易将其他具有相同功能网站中的图片使用至本发明的实施例中,对此本发明的实施例不进行限定。
[0033]具体地,预先建立的第一图片库即为从UGC网站中获得的图片。此时,需要UGC网站为图片搜素引擎提供架构、接口和功能上支持,UGC网站上的图片能够实时地存储到第一图片库中,即新产生的图片能够实时地存入第一图片库中,并且图片与其对应的文本、转发、回复、评论、作者信息等相关数据之间具有完备的关联关系,便于查询。
[0034]S104,向用户展现图片搜索结果,图片搜索结果包括第一图片。
[0035]图3是根据本发明实施例的图片搜索方法的一种示例性的效果图。如图3所示,同样用户输入“中国中文信息学会青年工委”进行查询,在微博上可以搜索到中国中文信息学会青年工委近期的活动宣传海报和学术活动现场图片,无论是相关度、时效性还是图片质量,都明显优于图片搜索引擎所得到的结果(如图2)。
[0036]本发明实施例的图片搜索方法,利用第一图片库补充图片搜索引擎在向用户提供冷门的图片搜索需求时的图片不足的问题,利用第一图片库,图片搜索引擎可以在提供冷门的图片搜索需求时,为用户提供具有更强实时性、更高相关性、更高质量的图片搜索结果,提升用户体验。
[0037]图4是根据本发明另一个实施例的图片搜索方法的流程图。
[0038]如图4所示,该图片搜索方法包括:
[0039]S201,接收用户输入的搜索词。
[0040]具体地,在本发明的实施例中,用户可在图片搜索弓I擎提供的输入框中输入当前搜索词,用户还可在各种快捷搜索输入框中输入搜索词,对此,本方法的实施例不进行限定。
[0041]S202,确定搜索词的搜索频次,并确定搜索频次是否大于第一预设阈值且小于第二预设阈值,其中,第一预设阈值小于第二预设阈值,搜索频次根据搜索引擎记录的历史搜索数据确定。
[0042]具体地,根据搜索频次可以确定搜索词的搜索热度,如果搜索频次相对高,图片搜索引擎能够提供实时性强、相关度高、质量高的图片,而没有必要补充图片,如果补充图片源,反而会增加计算负担。如果搜索频次过低,对应的搜索词可能不合理或者拼写错误等,也需要对这种情况进行筛选。因此,对于搜索词q的搜索频次f(q),需要满足以下条件:
[0043]Fl<f (q) <F2 (I)
[0044]其中,F1、F2为两个正整数,分别表示第一预设阈值和第二预设阈值。
[0045]因此,通过上述条件的筛选,可以确定搜索词是否为低频小众的搜索,例如,非热门的人名(如某大学老师)、地名(如某县城)、机构名(如上例中的“中国中文信息学会青年工委”)等。
[0046]S203,当确定搜索频次大于第一预设阈值且小于第二预设阈值时,在预先建立的第一图片库中获取与搜索词匹配的第一图片,第一图片库中包括搜索引擎从UGC网站中获得的图片。
[0047]在本发明的一个实施例中,UGC网站包括微博、微信、人人网等中的至少一种。应理解,微博、微信、人人网等仅为了说明本发明实施例的第一图片库的特性,本领域的技术人员很容易将其他具有相同功能网站中的图片使用至本发明的实施例中,对此本发明的实施例不进行限定。
[0048]具体地,预先建立的第一图片库即为从UGC网站中获得的图片。此时,需要UGC网站为图片搜素引擎提供架构、接口和功能上支持,UGC网站上的图片能够实时地存储到第一图片库中,即新产生的图片能够实时地存入第一图片库中,并且图片与其对应的文本、转发、回复、评论、作者信息等相关数据之间具有完备的关联关系,便于查询。
[0049]S204,向用户展现图片搜索结果,图片搜索结果包括第一图片。
[0050]本发明实施例的图片搜索方法,利用第一预设阈值和第二预设阈值可以将热门搜索词、不合理搜索词或者错误搜索词等筛除掉,可以保证效率。
[0051]在本发明的一个实施例中,上述在预先建立的第一图片库中获取与搜索词匹配的第一图片,包括(图中未示出):将第一图片库中满足如下项中任意一项的图片作为第一图片:文本内容与搜索词匹配的图片;转发文本或者回复文本与搜索词匹配的图片;作者名称或者作者个人描述或者作者标签与搜索词匹配的图片。具体地,对于用户输入的搜索词q,将文本内容t (W)与搜索词q匹配的图片,w表示图片;或,转发文本f (W)或者回复文本r (w)与搜索词q匹配的图片;作者名称an (W)或者作者个人描述ad (w)或者作者标签at (w)与搜索词q匹配的图片召回。在上述三个条件中,任意两个字符串Si和s2 (如,t(w)和q等)之间的匹配可基于词重叠率来计算,即首先将Si和s2进行切词,得到词向量V(Sl)和V(s2),进而基于下述公式(2)计算匹配度:
[0052]
【权利要求】
1.一种图片搜索方法,其特征在于,包括: 接收用户输入的搜索词; 确定所述搜索词的搜索频次,并确定所述搜索频次是否在预设范围内,所述搜索频次根据搜索引擎记录的历史搜索数据确定; 当确定所述搜索频次在所述预设范围内时,在预先建立的第一图片库中获取与所述搜索词匹配的第一图片,所述第一图片库中包括所述搜索引擎从用户原创内容UGC网站中获得的图片; 向所述用户展现图片搜索结果,所述图片搜索结果包括所述第一图片。
2.根据权利要求1所述的方法,其特征在于,所述确定所述搜索频次是否在预设范围内,包括: 确定所述搜索频次是否大于第一预设阈值且小于第二预设阈值,其中,所述第一预设阈值小于所述第二预设阈值。
3.根据权利要求1或2所述的方法,其特征在于,所述在预先建立的第一图片库中获取与所述搜索词匹配的第一图片,包括: 将所述第一图片库中满足如下项中任意一项的图片作为所述第一图片: 文本内容与所述搜索词匹配的图片; 转发文本或者回复文本与所述搜索词匹配的图片; 作者名称或者作者个人描述或者作者标签与所述搜索词匹配的图片。
4.根据权利要求3所述的方法,其特征在于,在所述在预先建立的第一图片库中获取与所述搜索词匹配的第一图片后,所述方法还包括: 对所述第一图片进行排序,以向所述用户展现排序后的所述第一图片。
5.根据权利要求4所述的方法,其特征在于,所述对所述第一图片进行排序,包括: 获取至少一种的特征分值; 根据所述至少一种的特征分值和排序学习LTR算法,对所述第一图片进行排序。
6.根据权利要求5所述的方法,其特征在于,所述特征分值包括如下项中的至少一项: 正文匹配特征值,转发文本匹配特征值,回复文本匹配特征值,作者名称匹配特征值,作者描述匹配特征值,作者标签匹配特征值。
7.根据权利要求1所述的方法,其特征在于,还包括: 获取与所述搜索词匹配的第二图片,所述第二图片为所述搜索引擎采用传统方式抓取的图片; 所述向所述用户展现的图片搜索结果中还包括所述第二图片。
8.根据权利要求7所述的方法,其特征在于,还包括: 在向所述用户展现图片搜索结果时,将所述第一图片和所述第二图片分区域展现。
9.根据权利要求1所述的方法,其特征在于,所述UGC网站包括微博、微信、人人网中的至少一种。
10.一种图片搜索装置,其特征在于,包括: 接收模块,用于接收用户输入的搜索词; 确定模块,用于确定所述搜索词的搜索频次,并确定所述搜索频次是否在预设范围内,所述搜索频次根据搜索引擎记录的历史搜索数据确定;第一获取模块,用于当确定所述搜索频次在所述预设范围内时,在预先建立的第一图片库中获取与所述搜索词匹配的第一图片,所述第一图片库中包括所述搜索引擎从用户原创内容UGC网站中获得的图片; 展现模块,用于向所述用户展现图片搜索结果,所述图片搜索结果包括所述第一图片。
11.根据权利要求10所述的装置,其特征在于,所述确定模块具体用于: 确定所述搜索频次是否大于第一预设阈值且小于第二预设阈值,其中,所述第一预设阈值小于所述第二预设阈值。
12.根据权利要求10或11所述的装置,其特征在于,所述第一获取模块具体用于: 将所述第一图片库中满足如下项中任意一项的图片作为所述第一图片: 文本内容与所述搜索词匹配的图片; 转发文本或者回复文本与所述搜索词匹配的图片; 作者名称或者作者个人描述或者作者标签与所述搜索词匹配的图片。
13.根据权利要求12所述的装置,其特征在于,还包括: 排序模块,用于对所述第一图片进行排序,以向所述用户展现排序后的所述第一图片。
14.根据权利要求13所述的装置,其特征在于,所述排序模块包括: 获取单元,用于获取至少一种的特征分值; 排序单元,用于根据所述至少一种的特征分值和排序学习LTR算法,对所述第一图片进行排序。
15.根据权利要求14所述的装置,其特征在于,所述特征分值包括如下项中的至少一项: 正文匹配特征值,转发文本匹配特征值,回复文本匹配特征值,作者名称匹配特征值,作者描述匹配特征值,作者标签匹配特征值。
16.根据权利要求10所述的装置,其特征在于,还包括: 第二获取模块,用于获取与所述搜索词匹配的第二图片,所述第二图片为所述搜索引擎采用传统方式抓取的图片; 其中,所述展现模块向所述用户展现的图片搜索结果中还包括所述第二图片。
17.根据权利要求16所述的装置,其特征在于,所述展现模块还用于在向所述用户展现图片搜索结果时,将所述第一图片和所述第二图片分区域展现。
18.根据权利要求16所述的装置,其特征在于,所述UGC网站包括微博、微信、人人网中的至少一种。
【文档编号】G06F17/30GK103942272SQ201410120404
【公开日】2014年7月23日 申请日期:2014年3月27日 优先权日:2014年3月27日
【发明者】赵世奇, 张超 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1