一种社区网站页面的图片检索方法和系统的制作方法

文档序号:6432691阅读:149来源:国知局
专利名称:一种社区网站页面的图片检索方法和系统的制作方法
技术领域
本发明涉及互联网技术领域,尤其涉及一种社区网站页面的图片检索方法和系统。
背景技术
随着互联网技术的不断发展,各种互联网应用产品日益丰富。目前流行的社区网站大都提供了用户上传图片和图片链接的功能,有些也提供了预设好的一系列图片供用户选择使用。微博社区是社区网站的一种,以微博社区为例,图1所示的微博社区提供了用户上传图片和图片链接的功能,图2所示的微博社区不仅提供了用户上传图片和图片链接的功能,还提供了预设好的一系列图片供用户选择使用。
然而,现有技术中,当用户在互联网的页面进行文字和/或图片输入时,如果用户所在的客户端没有用户所需要上传的图片,同时互联网提供的预设图片中也没有符合用户需求的图片,那么用户需要访问到搜索引擎或者图片资源网站去进行的检索并获取相关的图片。这样的操作比较繁琐,而且不利于提高用户的输入效率,带来不好的用户体验。发明内容
有鉴于此,本发明的主要目的在于提供一种社区网站页面的图片检索方法和系统,以降低用户进行页面输入时获取图片的复杂度,提高输入效率。
为达到上述目的,本发明的技术方案是这样实现的
本发明提供了一种社区网站页面的图片检索方法,该方法包括
从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片;
将检索所得的图片通过所述社区网站页面进行展示。
所述根据获取的关键词在相应的搜索引擎检索图片,具体为
搜索引擎从图片资源网站或图片资源库中抓取图片索引与所述关键词相匹配的图片,作为检索所得的图片。
所述从社区网站页面获取检索图片的关键词,具体为
从社区网站页面的搜索引擎入口提取所述关键词。
所述从社区网站页面获取检索图片的关键词,具体为
从社区网站页面上的输入文本中抽选特征关键词,作为检索图片的关键词。
该方法进一步包括
从输入文本T中抽选特征关键词,所述特征关键词的集合标记为向量W,其中,W = {w1; w2, W3, , wm}, Wi表示特征关键词i, I < i < m, m为正整数;
计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性分值向量标记为F,其中,F = {f1; f2, f3, . . . , fm}, fi表示Wi的重要性分值,I彡i彡m, m为正整数;
搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P= {Pl, p2, P3,. . . , pj , Pj表示图片j, I彡j彡η,η为正整数;图片Pj对应的词汇向量标记为W」、相应的重要性分值标记为Fj,其中,Wj = {w, 1; W1 2, W1 3, ... ,W1 q\ ,W1 k表示Pi的索引词汇I^Fj=W ^f' 2, f' 3' . . . ,f' q\ ,f' k表示W' k的重要性分值,I彡k彡q, q为正整数;计算图片P]的推荐分值S(T,Pj) = F · Fj,并选取S最大的一张图片、或S按照从大到小顺序的多张图片作为最终检索所得的图片。
所述从社区网站页面获取检索图片的关键词之后,该方法进一步包括对所述关键词进行归一化处理;
相应的,检索图片所使用的关键词是经过归一化处理的关键词。
所述将检索所得的图片通过所述社区网站页面进行展示,具体为
将检索获得的图片按照关键词与图片索引的匹配程度从高到低的顺序进行排序并展示。
本发明还提供了一种社区网站页面的图片检索系统,该系统包括图片检索模块和图片展示模块,其中,
所述图片检索模块,用于从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片;
所述图片展示模块,用于将检索所得的图片通过所述社区网站页面进行展示。
所述图片检索模块进一步用于,通过搜索引擎从图片资源网站或图片资源库中抓取图片索引与所述关键词相匹配的图片,作为检索所得的图片。
所述图片检索模块进一步用于,从社区网站页面的搜索引擎入口提取所述关键ο
所述图片检索模块进一步用于,从社区网站页面上的输入文本中抽选特征关键词,作为检索图片的关键词。
所述图片检索模块进一步用于,从输入文本T中抽选特征关键词,所述特征关键词的集合标记为向量W,其中,W = (W1, W2, W3, , wm}, Wi表示特征关键词i, I彡i彡m, m 为正整数;计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性分值向量标记为F,其中,F = {f1; f2, f3, . . . , fm}, fi表示Wi的重要性分值,I彡i彡m, m为正整数;
将搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P= {Pl, p2, P3,. . . , pj , Pj表示图片j, I彡j彡η,η为正整数;图片Pj对应的词汇向量标记为W」、相应的重要性分值标记为Fj,其中,Wj = {w, 1; W1 2, W1 3, ... ,W1 q\ ,W1 k表示Pi的索引词汇 I^Fj=W 1; f' 2, f' 3, . . . , fr q\, f' k 表示 w' k 的重要性分值,I 彡 k 彡 q, q 为正整数;通过计算图片Pj的推荐分值S(T,Pj) = F · Fj,选取S最大的一张、或S按照从大到小顺序的多张图片作为最终检索所得的图片。
所述图片检索模块进一步用于,对所获取的关键词进行归一化处理,并根据归一化处理后的关键词在相应的搜索引擎检索图片。
所述图片展示模块进一步用于,将检索获得的图片按照关键词与图片索引的匹配程度从高到低的顺序进行排序并展示。
本发明所提供的一种社区网站页面的图片检索方法和系统,从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片;将检索所得的图片 通过所述社区网站页面进行展示。通过本发明,简化了用户进行页面输入过程中获取图片 的检索操作,降低了用户进行页面输入时获取图片的复杂度,提高了输入效率,增加了用户 体验。









具体实施方式
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
为简化用户进行页面输入过程中获取图片的检索操作的复杂度,本发明旨在让用 户文字输入的社区网站页面自动执行图片检索,从而省去用户的操作。
本发明实施例所提供的一种社区网站页面的图片检索方法,如图3所示,主要包 括以下步骤
步骤301,从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的 搜索引擎检索图片。
社区网站的客户端可以从社区网站页面的搜索引擎入口提取关键词;也可以从社 区网站页面上的输入文本中抽选特征关键词,作为检索图片的关键词。在获取检索图片的 关键词后,社区网站的客户端通过搜索引擎从图片资源网站或图片资源库中抓取图片索引 与所述关键词相匹配的图片,作为检索所得的图片。
较佳的,从社区网站页面获取检索图片的关键词之后,可以对所述关键词进行归 一化处理,如同义词归一化、纠正错别字等处理;那么,检索图片所使用的关键词即是经 过归一化处理的关键词。
步骤302,将检索所得的图片通过所述社区网站页面进行展示。
检索获得的图片可以按照关键词与图片索引的匹配程度从高到低的顺序进行排 序并展示。
下面以从社区网站页面的搜索引擎入口提取关键词为例,对本发明的图片检索方 法进一步详细阐述。本发明实施例一所提供的一种社区网站页面的图片检索方法,如图4 所示,主要包括以下步骤
步骤401,从社区网站页面的搜索引擎入口提取关键词,并根据提取的关键词在相 应的搜索引擎检索图片。
在社区网站页面的界面上提供图片搜索的功能,通过社区网站页面上的搜索引擎入口,用户可以直接提交查询图片的关键词;社区网站的客户端通过搜索引擎从图片资源网站或图片资源库中抓取图片索引与关键词相匹配的图片,作为检索所得的图片。以微博社区为例,如图5所示,在微博社区的界面上提供有搜索引擎入口,用户点击“搜索”按钮即可触发搜索引擎入口,并通过该入口提交查询图片的关键词;微博社区通过关联的搜索引擎从图片资源网站或图片资源库中抓取图片索引与关键词相匹配的图片,作为检索所得的图片。搜索引擎具有索引功能,在搜索引擎中为每个检索的图片建立有图片索引,图片索引中的词汇来自于图片采集时网页上图片周边的文本。例如用户提交的关键词为“太阳”和 “月亮”,则微博社区的客户端通过关联的搜索引擎从图片资源网站或图片资源库中抓取图片索引中包含“太阳”和/或“月亮”图片,作为检索所得的图片。
步骤402,将检索所得的图片通过社区网站页面进行展示。
仍以微博社区为例,一种较佳的图片检索过程如图6所示,用户通过微博的搜索引擎入口提交查询图片的关键词,微博对所述关键词进行查询串处理、也即归一化处理,包括同义词归一化、纠正错别字等等;然后,根据归一化处理后的关键词通过关联的搜索引擎从图片资源网站或图片资源库中抓取图片索引与关键词相匹配的图片,具体的搜索引擎根据所述关键词通过网络爬虫(Crawler)从图片资源网站或图片资源库抓取图片,搜索引擎的索引模块为每个抓取的图片建立有图片索引,图片索引中的词汇来自于图片采集时网页上图片周边的文本;微博客户端利用所述关键词,结合所述图片索引,对索引中的图片进行筛选、排序等处理,将检索获得的图片按照关键词与图片索引的匹配程度(如图片索引与关键词的匹配数量)从高到低的顺序进行排序并通过微博的界面展示。其中,Crawler 是一种自动获取网页内容的程序,是搜索引擎的重要组成部分。
在上述实施例一中,需要用户主动触发搜索并输入查询的关键词来获取所需图片;本发明的实施例二提供一种社区网站页面的图片检索方法,根据用户的输入内容自动进行相关图片的检索和推荐,如图7所示,该方法主要包括以下步骤
步骤701,从社区网站页面上的输入文本中抽选特征关键词,并根据抽选的特征关键词在搜索引擎检索图片。
社区网站的客户端实时地从用户的输入文本中抽选特征关键词,将抽选的特征关键词送入搜索引擎,搜索 引擎从图片资源网站或图片资源库中抓取图片索引与所述特征关键词相匹配的图片,作为检索所得的图片。
—种较佳的检索方式可以进一步包括
社区网站的客户端从输入文本T中抽选特征关键词,所述特征关键词的集合标记为向量W,其中,W = (W1, W2, W3, , wm}, Wi表示特征关键词i, I < i < m, m为正整数;
计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性分值向量标记为F,其中,F = {f1; f2, f3, . . . , fm}, fi表示Wi的重要性分值,I彡i彡m, m为正整数;
搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P= {Pl, p2, P3,. . . , pj , Pj表示图片j, I彡j彡η,η为正整数;图片Pj对应的词汇向量标记为W」、相应的重要性分值标记为Fj,其中,Wj = {w, 1; W1 2, W1 3, ... ,W1 q\ ,W1 k表示Pi的索引词汇 I^Fj=W 1; f' 2, f' 3, . . . , fr q\, f' k 表示 w' k 的重要性分值,I 彡 k 彡 q, q 为正整数;计算图片P]的推荐分值S(T,Pj) = F · Fj,并选取S最大的一张图片、或S按照从大到小顺序的多张图片(数量根据实际展示的需要进行设定)作为最终检索所得的图片。
步骤702,将检索所得的图片通过社区网站页面进行展示。
仍以微博社区为例,一种较佳的图片检索过程如图8所示,微博客户端实时地从用户的输入文本中抽选特征关键词,所述特征关键词的集合标记为向量W,其中,W= Iw1, w2, w3, , wm}, Wi表示特征关键词i, I彡i彡m, m为正整数;计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性分值向量标记为F,其中,F = {f1;f2,f3,..., fj,fi表示Wi的重要性分值,I彡i彡m,m为正整数;抽选的特征关键词送入到搜索引擎, 搜索引擎根据所述特征关键词通过网络爬虫(Crawler)从图片资源网站或图片资源库抓取图片,搜索引擎的索引模块为每个抓取的图片建立有图片索引,图片索引中的词汇来自于图片采集时网页上图片周边的文本;图片检索模块具有图片推荐功能,将搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P = (Pi P2r P3, , PnI,Pj表示图片j, I彡j彡η, η为正整数;图片Pj对应的词汇向量标记为W」、相应的重要性分值标记为Fj, 其中,Wj=W I,w' 2,3,...,w' J , k 表示 Pi 的索引词汇 k, F」={f, 1; f 2, f' 3,...,f' q},f' k表示w' k的重要性分值,I彡k彡q,q为正整数;图片检索模块通过计算图片P]的推荐分值S (T,Pj) = F ·匕,选取S最大的一张图片 、或S按照从大到小顺序的多张图片作为最终检索所得的图片,即图片检索模块的一个优化目标函数为
arg maxP Σ S (T, Pi), where Pi G P
该函数的含义即为,选择P中S最大的作为最终结果。
对应上述社区网站页面的图片检索的方法,本发明的实施例还提供了一种社区网站页面的图片检索系统,主要包括图片检索模块和图片展示模块。其中,图片检索模块,用于从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片;图片展示模块,用于将检索所得的图片通过所述社区网站页面进行展示。
较佳的,图片检索模块可用于,通过搜索引擎从图片资源网站或图片资源库中抓取图片索引与所述特征关键词相匹配的图片,作为检索所得的图片。
较佳的,图片检索模块可进一步用于,从社区网站页面的搜索引擎入口提取所述关键词;或者,从社区网站页面上的输入文本中抽选特征关键词,作为检索图片的关键词。
较佳的,图片检索模块可进一步用于,从输入文本T中抽选特征关键词,所述特征关键词的集合标记为向量W,其中,W = (WijW2jW3,. . . ,wj ,Wi表示特征关键词i, I彡i彡m, m为正整数;计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性分值向量标记为F,其中,F = {f1; f2, f3, . . . , fm}, fi表示Wi的重要性分值,I彡i彡m, m为正整数;
将搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P= {Pl, p2, P3,. . .,pn} ,Pj表示图片j, I彡j彡η,η为正整数;图片Pj对应的词汇向量标记为Wj,计算相应的重要性分值F」,其中,Wj = {w' ,,w' 2,w' 3,...,w' J7Wi k表示Pi的索引词汇 k, Fj = {f; 1; f' 2, f' 3, . . . , fr q\, f' k 表示 w' k 的重要性分值,I 彡 k 彡 q, q 为正整数;通过计算图片P]的推荐分值S (T,Pj) = F ·匕,选取S最大的一张、或S按照从大到小顺序的多张图片作为最终检索所得的图片。
较佳的,图片检索模块可进一步用于,对所获取的关键词进行归一化处理,并根据归一化处理后的关键词在相应的搜索引擎检索图片。
较佳的,图片展示模块可进一步用于,将检索获得的图片按照关键词与图片索引 的匹配程度从高到低的顺序进行排序并展示。
需要说明的是,本发明的方案不仅仅适用于微博社区的网站,也适用于页面提供 有用户文字输入的任何形式的社区网站和其他类型的网站。通过本发明,简化了用户进行 页面输入过程中获取图片的检索操作,降低了用户进行页面输入时获取图片的复杂度,提 高了输入效率,增加了用户体验。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
权利要求
1.一种社区网站页面的图片检索方法,其特征在于,该方法包括 从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片; 将检索所得的图片通过所述社区网站页面进行展示。
2.根据权利要求1所述社区网站页面的图片检索方法,其特征在于,所述根据获取的关键词在相应的搜索引擎检索图片,具体为 搜索引擎从图片资源网站或图片资源库中抓取图片索引与所述关键词相匹配的图片,作为检索所得的图片。
3.根据权利要求1或2所述社区网站页面的图片检索方法,其特征在于,所述从社区网站页面获取检索图片的关键词,具体为 从社区网站页面的搜索引擎入口提取所述关键词。
4.根据权利要求1或2所述社区网站页面的图片检索方法,其特征在于,所述从社区网站页面获取检索图片的关键词,具体为 从社区网站页面上的输入文本中抽选特征关键词,作为检索图片的关键词。
5.根据权利要求4所述社区网站页面的图片检索方法,其特征在于,该方法进一步包括 从输入文本T中抽选特征关键词,所述特征关键词的集合标记为向量W,其中,W = (W1,w2, W3, , wm},Wi表示特征关键词i, I ^ i ^ m, m为正整数; 计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性分值向量标记为F,其中,F = {f1; f2, f3, . . . , fj , fi表示Wi的重要性分值,I彡i彡m, m为正整数;搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P= {Pl,p2,p3,...,pn},Pj表示图片j, I彡j彡η, η为正整数;图片Pj对应的词汇向量标记为W」、相应的重要性分值标记为F」,其中,Wj = {w, 1; W1 2, W1 3,q\, W1 k表示Pi的索引词汇k, Fj ={f' ι f' 2^ 3,...,f' q},f' k表示w' k的重要性分值,I彡k彡q, q为正整数;计算图片P]的推荐分值S(T,Pj) = F * Fj并选取S最大的一张图片、或S按照从大到小顺序的多张图片作为最终检索所得的图片。
6.根据权利要求1或2所述社区网站页面的图片检索方法,其特征在于,所述从社区网站页面获取检索图片的关键词之后,该方法进一步包括对所述关键词进行归一化处理; 相应的,检索图片所使用的关键词是经过归一化处理的关键词。
7.根据权利要求1或2所述社区网站页面的图片检索方法,其特征在于,所述将检索所得的图片通过所述社区网站页面进行展示,具体为 将检索获得的图片按照关键词与图片索引的匹配程度从高到低的顺序进行排序并展示。
8.—种社区网站页面的图片检索系统,其特征在于,该系统包括图片检索模块和图片展示模块,其中, 所述图片检索模块,用于从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片; 所述图片展示模块,用于将检索所得的图片通过所述社区网站页面进行展示。
9.根据权利要求8所述社区网站页面的图片检索系统,其特征在于,所述图片检索模块进一步用于,通过搜索引擎从图片资源网站或图片资源库中抓取图片索引与所述关键词相匹配的图片,作为检索所得的图片。
10.根据权利要求8或9所述社区网站页面的图片检索系统,其特征在于,所述图片检索模块进一步用于,从社区网站页面的搜索引擎入口提取所述关键词。
11.根据权利要求8或9所述社区网站页面的图片检索系统,其特征在于,所述图片检索模块进一步用于,从社区网站页面上的输入文本中抽选特征关键词,作为检索图片的关键词。
12.根据权利要求11所述社区网站页面的图片检索系统,其特征在于,所述图片检索模块进一步用于,从输入文本T中抽选特征关键词,所述特征关键词的集合标记为向量W,其中,W = (W1, W2, W3, , wm}, Wi表示特征关键词i, I彡i彡m, m为正整数;计算每个特征关键词对所述输入文本T的重要性分值,对应于W的重要性分值向量标记为F,其中,F =ifi,f2,f3,…,fm},fi表示Wi的重要性分值,I彡i彡m, m为正整数; 将搜索引擎抓取的图片索引对应的图片集合标记为向量P,其中,P = {Pl, P2, P3,...,Pnl,Pj表示图片为正整数;图片Pj对应的词汇向量标记为W」、相应的重要性分值标记为Fj,其中,Wj = {w,2,w' 3, . . . ,w' q\ ,w' k表示Pi的索引词汇k, Fj={f i, f' 2,f' 3,...,f' q},f' k表示w' k的重要性分值,I彡k彡q, q为正整数;通过计算图片P]的推荐分值S (T,Pj) = F ·匕选取S最大的一张、或S按照从大到小顺序的多张图片作为最终检索所得的图片。
13.根据权利要求8或9所述社区网站页面的图片检索系统,其特征在于,所述图片检索模块进一步用于,对所获取的关键词进行归一化处理,并根据归一化处理后的关键词在相应的搜索引擎检索图片。
14.根据权利要求8或9所述社区网站页面的图片检索系统,其特征在于,所述图片展示模块进一步用于,将检索获得的图片按照关键词与图片索引的匹配程度从高到低的顺序进行排序并展示。
全文摘要
本发明公开了一种社区网站页面的图片检索方法和系统,方法包括从社区网站页面获取检索图片的关键词,并根据获取的关键词在相应的搜索引擎检索图片;将检索所得的图片通过所述社区网站页面进行展示。通过本发明,能够降低用户进行页面输入时获取图片的复杂度,提高输入效率,增加用户体验。
文档编号G06F17/30GK102999489SQ20111026538
公开日2013年3月27日 申请日期2011年9月8日 优先权日2011年9月8日
发明者庄子明 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1