一种图片推荐方法和装置的制作方法

文档序号:6363094阅读:213来源:国知局
专利名称:一种图片推荐方法和装置的制作方法
技术领域
本申请涉及图片处理技术领域,特别是涉及一种图片推荐方法和装置。
背景技术
目前随着网络技术的不断发展,用户对搜索引擎的要求已经不再满足于只是对文本的搜索,很多用户还希望可以通过搜索引擎对网络图片进行搜索。目前的图片搜索引擎大都采用基于文本的搜索技术,该技术将图片作为数据库存储的对象,用关键字对其进行描述。然而对于图片中包含的视觉特征,如颜色或形状等,无法用文本进行描述,这样,当需要根据图片中包含的视觉特征搜索图片时,基于文本的搜索技术将不再适用。例如,用户经常遇到这样的问题,在网站或电脑上看到一张包含物品的图片,但并不知道该图片中的物品是什么,故很难将该物品的视觉特征用语言描述出来,即便表达能力好的用户将其视觉特征描述出来了,也很难在现有的搜索引擎中找到与该图片相似的图片,导致搜索效率低下,使用网络流量较大。针对上述搜索效率低下、使用网络流量较大的问题,一些图片搜索引擎提供以图搜图功能,该以图搜图功能将视觉内容一致的图片返回给用户,以满足用户的某些搜索需求。例如某些用户爱好搜集图片,最不能容忍的就是美图上面有水印,只要上传图片到图片搜索引擎,轻轻一点便能搜出不带水印的图片;又如,可以上传小图片,搜到这个小图片的各个版本,如清晰大图等。还有一些图片搜索引擎在提供以图搜图功能的同时提供图片推荐功能,参照图1, 示出了现有技术一种图片搜索引擎中图片推荐方法的流程图,具体可以包括步骤101、用户提交查询图片;步骤102、抽取查询图片的颜色、纹理、形状等视觉特征;步骤103、将查询图片的视觉特征与数据库中图片的视觉特征进行相似性比对;步骤104、将视觉相似图片推荐给用户。由于图片推荐结果依据的颜色、纹理、形状等视觉特征比对得到,故这里的视觉相似主要指外观相似,例如用户上传妮可基德曼的图片,图片中妮可基德曼的头发颜色为金色,则图片搜索引擎可能会返回视觉相似的含有金色头发的图片,如金发女郎的图片,有时甚至会返回金毛犬的图片,等等。但有些用户存在一些个性化需求,如用户上传刘德华的图片,还可能希望看到刘德华的电影海报、个人写真等图片。此时,现有技术中视觉内容一致的搜索结果和视觉相似的图片推荐结果均不能满足用户的个性化需求。总之,需要本领域技术人员迫切解决的一个技术问题就是如何能够提供契合用户个性化需求的图片。

发明内容
本申请所要解决的技术问题是提供一种图片推荐方法和装置,能够提供契合用户个性化需求的图片,扩展用户感兴趣信息的获取渠道。为了解决上述问题,本申请公开了一种图片推荐方法,包括接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;在搜索日志中进行关键词的匹配,并将与关键词匹配的相应目标图片推荐给用户;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词。优选的,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,包括依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。优选的,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述词或短语;所述实体词库存储有具有实际意义的实体词。优选的,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述词或短语。优选的,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,还包括依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键
ο优选的,所述方法还包括在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;所述将与关键词匹配的相应目标图片推荐给用户的步骤为,将所述剩余图片推荐给用户。优选的,所述将与关键词匹配的相应目标图片推荐给用户的步骤,包括依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;按照在线查询请求数目的降序将与关键词匹配的相应目标图片推荐给用户。优选的,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为除目标图片外大于匹配阈值的其他图片。另一方面,本申请还公开了一种图片推荐装置,包括图片搜索模块,用于接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;
关键词抽取模块,用于依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;匹配模块,用于在搜索日志中进行关键词的匹配;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词;及图片推荐模块,用于将与关键词匹配的相应目标图片推荐给用户。优选的,所述关键词抽取模块包括去除子模块,用于依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;及抽取子模块,用于抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。优选的,所述装置还包括第一实际意义抽取模块,用于调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述剩余文本中的词或短语;所述实体词库存储有具有实际意义的实体词。优选的,所述装置还包括第二实际意义抽取模块,用于依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述剩余文本中的词或短语。优选的,所述关键词抽取模块还包括边缘词统计子模块,用于依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。优选的,所述装置还包括滤除模块,用于在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;所述图片推荐模块,具体用于将所述剩余图片推荐给用户。优选的,所述图片推荐模块包括数目统计子模块,用于依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;降序推荐子模块,用于按照在线查询请求数目的降序将相应与关键词匹配的相应目标图片推荐给用户。优选的,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为除目标图片外大于匹配阈值的其他图片。与现有技术相比,本申请具有以下优点相对于现有技术采用视觉特征描述查询图片,本申请采用关键词描述查询图片的图片语义特征,并在搜索日志中记录全网在线查询请求对应的目标图片及相应的关键词; 由于关键词所描述的图片语义特征能够反映用户的兴趣爱好,这样,在一个用户提交查询请求时,本申请能够依据所得到目标图片的关键词和所述搜索日志中目标图片的关键词, 匹配得到具有相同兴趣爱好的其它用户查询请求对应的目标图片,也即与关键词匹配的相应目标图片能够契合用户的兴趣爱好,因此,将从搜索日志中提取出来的与关键词匹配的相应目标图片推荐给当前用户,提供了契合用户个性化需求的图片,扩展了用户感兴趣信息的获取渠道。


图I是现有技术一种图片搜索引擎中图片推荐方法的流程图;图2是本申请一种图片推荐方法实施例的流程图;图3是本申请一种图片推荐装置实施例的结构图。
具体实施例方式为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本申请作进一步详细的说明。用户个性化需求往往是源自用户的兴趣爱好的,例如,某用户有追星的爱好,其是刘德华的粉丝,则他在上传刘德华的图片时,很有可能还希望看到刘德华的电影海报、个人写真等图片;又如,另一用户是电影爱好者,其对《当幸福来敲门》这部电影有着由衷的爱好,则他在上传《当幸福来敲门》的电影海报时,很有可能还希望看到更多该电影的其它不同海报。现有技术视觉相似的搜索结果是无法满足在上述情形下的用户个性化需求。本申请实施例的核心构思之一在于,根据当前用户输入图片的局部特征得到目标图片和与其特征内容相似或相同的多个结果图片,对结果图片所在页面分别进行分析,综合各页面中标题、文本等文字信息,得到的关键词与目标图片关联;由于关键词所描述的图片语义特征能够反映用户的兴趣爱好,这样,在一个用户提交查询请求时,本申请能够依据所得到目标图片的关键词和所述搜索日志中目标图片的关键词,匹配得到具有相同兴趣爱好的其它用户查询请求对应的对应目标图片,也即与关键词匹配的相应目标图片能够契合用户的兴趣爱好,因此,将与关键词匹配的相应目标图片推荐给用户能够提供契合用户个性化需求的图片,扩展用户感兴趣信息的获取渠道。参照图2,示出了本申请一种图片推荐方法实施例的流程图,具体可以包括步骤201、接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;本申请可以应用于图片搜索引擎中,用以扩充图片搜索引擎的功能,也即,使得图片搜索引擎具备原有的以图搜图功能,同时具备本申请的图片推荐功能。实际上,本申请还可以应用于其它搜索引擎或搜索装置,本申请对具体的应用环境不加以限制。在实际中,用户可在浏览器中提交在线查询请求,这里的提交在线查询请求的方式可以包括直接上传本地图片,或者提供图片的网络地址,由服务器自动下载图片,本申请对具体的提交在线查询请求的方式不加以限制。也即,本申请实施例中,与该查询请求直接对应的图片可以包括用户直接上传的本地图片,也可以包括依据用户提供的图片的网络地址得到图片。在具体实现中,服务器可根据该查询请求直接对应的图片的视觉内容,抽取出局部特征,然后进行图片搜索,与数据库中各图片的局部特征进行匹配,如果匹配率在一定阈值范围(如>90%)内,可认为二者的视觉内容一致。
对于该查询请求直接对应的图片和匹配结果而言,二者仅有细微的差别,如是否带水印、小图片和大图片的差别等;刨除这些细微的差别,二者就是相同的图片。考虑到该查询请求直接对应的图片可能为带水印的图片或者是小图片等质量不好的图片,如果将其作为搜索日志的存储对象,而最终向用户推荐的图片源自搜索日志,这样,向用户推荐带水印或小图片等质量不好的图片会影响用户的搜索体验。因此,在本申请的一种优选实施例中,将与查询请求对应的查询策略最匹配的图片作为目标图片,并将该目标图片作为搜索日志的存储对象。在实际中,匹配所用的数据库往往存储一些不带水印且尺寸较大的图片,这样,向用户推荐不带水印且尺寸较大的图片能够提高用户的搜索体验。本申请的一种优选实施例中,结果图片为数据库中除目标图片外大于匹配阈值的其他图片,即结果图片与查询请求对应的查询策略的相符程度小于目标图片与查询请求对应的查询策略的相符程度。本实施例中,得到的目标图片和结果图片按匹配度进行排序,与查询请求最匹配的图片为目标图片,其余的图片作为结果图片按匹配度进行排序展示。在其他实施例中,用户的查询请求的对应结果可按图片大小或发布时间进行排序,将尺寸最大或最近发布的图片作为目标图片,其余的图片作为结果图片按尺寸由大至小或发布时间由近至远进行排序展示。在通常情况下,结果图片和目标图片仅有细微的差别,如是否带水印、小图片和大图片的差别等;刨除这些细微的差别,二者就是相同的图片。可以理解,在本申请应用于图片搜索引擎时,服务器还可以将所述结果图片作为搜索结果返回给用户,以满足用户的某些搜索需求。例如某些用户爱好搜集图片,最不能容忍的就是美图上面有水印,只要上传图片到图片搜索引擎,轻轻一点便能搜出不带水印的图片;又如,可以上传小图片,搜到这个小图片的各个版本,如清晰大图等。在本申请的一种应用示例中,所述根据该查询请求直接对应的图片的视觉内容, 抽取出局部特征的步骤具体可以包括首先,对该查询请求直接对应的图片的尺寸进行归一化,将尺寸过大或过小的图片变换为640*640 300*300之内;然后使用二维局部特征检测矩阵与归一化后的图片进行卷积操作;再者,在卷积后的图片中扫描定位出其中的局部极值(最大值与最小值)点的位置;最后,根据局部极值点附近区域的明暗对比,抽取该查询请求直接对应的图片的局部特征。需要说明的是,为了实现匹配目的,该查询请求直接对应的图片与数据库中具有与其相同原始尺寸的图片在归一化后的尺寸应一致,例如,同为300*300。参照表1,示出了本申请一种归一化前后的图片尺寸示意。表I
权利要求
1.一种图片推荐方法,其特征在于,包括接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;在搜索日志中进行关键词的匹配,并将与关键词匹配的相应目标图片推荐给用户;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词。
2.如权利要求I所述的方法,其特征在于,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,包括依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
3.如权利要求2所述的方法,其特征在于,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述词或短语;所述实体词库存储有具有实际意义的实体词。
4.如权利要求2所述的方法,其特征在于,通过以下步骤抽取所述剩余文本中具有实际意义的词或短语依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述词或短语。
5.如权利要求2所述的方法,其特征在于,所述依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词的步骤,还包括依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
6.如权利要求I至5中任一项所述的方法,其特征在于,所述方法还包括在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;所述将与关键词匹配的相应目标图片推荐给用户的步骤为,将所述剩余图片推荐给用户。
7.如权利要求I至5中任一项所述的方法,其特征在于,所述将与关键词匹配的相应目标图片推荐给用户的步骤,包括依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;按照在线查询请求数目的降序将与关键词匹配的相应目标图片推荐给用户。
8.如权利要求I至5中任一项所述的方法,其特征在于,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为除目标图片外大于匹配阈值的其他图片。
9.一种图片推荐装置,其特征在于,包括图片搜索模块,用于接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;关键词抽取模块,用于依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;匹配模块,用于在搜索日志中进行关键词的匹配;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词;及图片推荐模块,用于将与关键词匹配的相应目标图片推荐给用户。
10.如权利要求9所述的装置,其特征在于,所述关键词抽取模块包括去除子模块,用于依据对所述网页文本进行聚类分析的结果,去除所述网页文本中孤立的网页文本,得到剩余文本;及抽取子模块,用于抽取所述剩余文本中词频最高并具有实际意义的词或短语,作为描述图片语义特征的关键词。
11.如权利要求10所述的装置,其特征在于,还包括第一实际意义抽取模块,用于调用预先构造的实体词库,在所述剩余文本中的词或短语与所述实体词库中的实体词相匹配时,保留所述剩余文本中的词或短语;所述实体词库存储有具有实际意义的实体词。
12.如权利要求10所述的装置,其特征在于,还包括第二实际意义抽取模块,用于依据词性抽取所述剩余文本中具有实际意义的词或短语,所述抽取过程包括在所述剩余文本中的词或短语为叹词、代词或语气助词中的任一种时,丢弃所述剩余文本中的词或短语。
13.如权利要求10所述的装置,其特征在于,所述关键词抽取模块还包括边缘词统计子模块,用于依据所述关键词与所述剩余文本中其他词汇的相邻共现频率,统计所述剩余文本中与所述关键词相邻的边缘词;将所述边缘词与关键词一起作为描述图片语义特征的关键词。
14.如权利要求9至13中任一项所述的装置,其特征在于,还包括滤除模块,用于在与关键词匹配的相应各目标图片中滤除相同或近似的图片,得到剩余图片;所述图片推荐模块,具体用于将所述剩余图片推荐给用户。
15.如权利要求9至13中任一项所述的装置,其特征在于,所述图片推荐模块包括数目统计子模块,用于依据所述搜索日志,统计所述与关键词匹配的相应目标图片对应的在线查询请求数目;降序推荐子模块,用于按照在线查询请求数目的降序将相应与关键词匹配的相应目标图片推荐给用户。
16.如权利要求9至13中任一项所述的装置,其特征在于,该目标图片为与该查询请求对应的查询策略最匹配的图片;所述结果图片为除目标图片外大于匹配阈值的其他图片。
全文摘要
本申请提供了一种图片推荐方法和装置,其中的方法具体包括接收用户的查询请求,并搜索得到与该查询请求对应的目标图片和与该目标图片相同或近似的结果图片;依据所述结果图片所在的网页文本,抽取描述图片语义特征的关键词,作为该目标图片的关键词;在搜索日志中进行关键词的匹配,并将与关键词匹配的相应目标图片推荐给用户;所述搜索日志记录有全网用户的在线查询请求对应的目标图片及相应的关键词。本申请能够提供契合用户个性化需求的图片,扩展用户感兴趣信息的获取渠道。
文档编号G06F17/30GK102609458SQ20121000904
公开日2012年7月25日 申请日期2012年1月12日 优先权日2012年1月12日
发明者路晶 申请人:北京搜狗信息服务有限公司, 北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1