一种基于长尾关键词的搜索推荐方法及装置制造方法

文档序号:6550367阅读:207来源:国知局
一种基于长尾关键词的搜索推荐方法及装置制造方法
【专利摘要】本发明公开了一种基于长尾关键词的搜索推荐方法及装置。该方法包括:接收用户搜索查询词,判断查询词的类型是否为长尾关键词;当查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。本发明当接收到用户搜索的查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,从而将用户引导到最有可能解决用户问题的网站,解决了当搜索词为长尾关键词时,无法获取与该长尾关键词相匹配的网站的问题,取得了提高用户搜索效率,满足用户的搜索需求的有益效果。
【专利说明】—种基于长尾关键词的搜索推荐方法及装置
【技术领域】
[0001 ] 本发明涉及索引,具体涉及一种基于长尾关键词的搜索推荐方法及装置。
【背景技术】
[0002]搜索引擎是当前互联网领域中的一项极其重要的应用,而基于分词索引的检索技术是目前主流搜索引擎的基本支柱。目前,搜索引擎主要是根据网页和搜索查询词的匹配程度给出匹配度最高的网页。但是,通过对海量用户的查询词统计分析,发现用户经常通过长尾关键词作为搜索查询词进行索引查询,但是现有技术中搜索引擎往往只是对长尾关键词做一般的分词处理做索引,但分词处理后在搜索数据库中都没有索引到与查询的长尾关键词匹配度很高的网页,同时用户输入的长尾关键词本身通常包含很明确的搜索需求,因此这时搜索引擎给出的搜索结果无法较好的满足用户的搜索需求;进一步地,用户可能需要花费更多的时间和精力在搜索结果网页中查找,亦或是重新调整查询词再次检索,导致搜索效率低下。

【发明内容】

[0003]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的。
[0004]本发明提供的基于长尾关键词的搜索推荐方法,包括:
[0005]接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词;
[0006]当所述查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
[0007]所述判断所述查询词的类型是否为长尾关键词包括:对所述查询词进行分词处理,在判断出所述查询词由至少2个单词组成,且所述查询词在一段时间阈值内的搜索次数低于设定次数阈值的情况下,确定所述查询词为长尾关键词;
[0008]或者,如果搜索查询词索引的通用搜索结果匹配程度低于匹配阈值,则确定所述查询词为长尾关键词。
[0009]所述查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,包括:根据分词后各个分词的搜索热度判断所述各个分词的权重,将权重最高的分词作为核心分词,其他分词作为支持词;查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
[0010]所述查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐,包括:在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与所述核心分词相匹配的有互动性质的网站,并将查找到的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
[0011]所述相匹配包括下述中的至少一个:
[0012]所述关键词在所述有互动性质的网站和/或所述有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值;
[0013]包含有解决过有关关键词和/或其同义词、相关词问题的网页的所述有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值;
[0014]解决过有关关键词和/或其同义词、相关词问题的所述有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值;
[0015]单个有互动性质的网站中的解决过有关关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值。
[0016]所述有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或贴吧。
[0017]本发明提供的基于长尾关键词的搜索推荐方法,包括:
[0018]接收用户输入的搜索查询词,
[0019]当所述查询词为长尾关键词时,推荐与其相关的互动性质的网站。
[0020]本发明提供的基于长尾关键词的搜索推荐装置,包括:
[0021]判断模块,用于接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词;
[0022]网站推荐模块,用于当所述判断模块的判断结果为是时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
[0023]所述判断模块,包括:
[0024]分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理;
[0025]第一判断执行单元,用于判断所述查询词是否由至少2个单词组成,且所述查询词是否在一段时间阈值内的搜索次数低于设定次数阈值;若是,确定所述查询词为长尾关键词;
[0026]或,所述判断模块,包括:
[0027]分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理;
[0028]第二判断执行单元,用于判断根据搜索查询词索引的通用搜索结果匹配程度是否低于匹配阈值;若是,确定所述查询词为长尾关键词。
[0029]所述网站推荐模块,包括:
[0030]判断分析单元,用于当所述判断执行单元的判断结果为是时,根据分词后各个分词的搜索热度判断所述各个分词的权重,将权重最高的分词作为核心分词,其他分词作为支持词;
[0031]网站推荐执行单元,用于查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
[0032]所述网站推荐执行单元,具体用于在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
[0033]所述相匹配包括下述中的至少一个:
[0034]所述关键词在所述有互动性质的网站和/或所述有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值;
[0035]包含有解决过有关关键词和/或其同义词、相关词问题的网页的所述有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值;
[0036]解决过有关关键词和/或其同义词、相关词问题的所述有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值;
[0037]单个有互动性质的网站中的解决过有关关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值。
[0038]所述有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或贴吧。
[0039]本发明提供的基于长尾关键词的搜索推荐装置,包括:
[0040]搜索输入框,用于用户输入搜索查询词;
[0041]显示模块,用于当所述查询词为长尾关键词时,显示推荐的与其相关的互动性质的网站。
[0042]本发明的基于长尾关键词的搜索推荐方法及装置,当接收到用户搜索的查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,从而将用户引导到最有可能解决用户问题的网站,解决了当搜索词为长尾关键词时,无法获取与该长尾关键词相匹配的网站的问题,取得了满足用户的搜索需求的有益效果。
[0043]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【专利附图】

【附图说明】
[0044]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0045]图1示出了本发明实施例提供的一种基于长尾关键词的搜索推荐方法的流程图;
[0046]图2示出了本发明实施例提供的另一种基于长尾关键词的搜索推荐方法的流程图;
[0047]图3示出了本发明实施例提供的一种基于长尾关键词的搜索推荐装置的结构框图;
[0048]图4示出了通过本发明实施例提供的一种基于长尾关键词的搜索推荐装置进行基于长尾关键词的搜索推荐的网页截图;
[0049]图5示出了本发明实施例提供的另一种基于长尾关键词的搜索推荐装置的结构框图。
【具体实施方式】
[0050]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。[0051]参见图1,本发明实施例提供了基于长尾关键词的搜索推荐方法,包括:
[0052]步骤SllO:接收用户搜索查询词,判断查询词的类型是否为长尾关键词;
[0053]本实施例可以在接收到用户搜索查询词之后,先根据查询词在网站库中进行索弓丨,若无与查询词相匹配的网站,再判断查询词的类型是否为长尾关键词。
[0054]本发明实施例提供两种判断查询词的类型是否为长尾关键词的方法:
[0055]第一种方法为:对用户输入的查询词进行分词处理,在判断出查询词由至少2个单词组成,且查询词在一段时间阈值内的搜索次数低于设定次数阈值的情况下,确定查询词为长尾关键词;否则,确定查询词不是长尾关键词。其中,时间阈值和设定次数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0056]第二种方法为:如果搜索查询词索引的通用搜索结果匹配程度低于匹配阈值,则确定查询词为长尾关键词;否则,确定查询词不是长尾关键词。其中,匹配阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0057]步骤S210:当查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
[0058]其中,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,具体包括:根据分词后各个分词的搜索热度判断各个分词的权重,将权重最高的分词作为核心分词,其他分词作为支持词;查找与核心分词相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。其中,查找与核心分词相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,包括:在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与核心分词相匹配的有互动性质的网站,并将查找到的网站作为可解决长尾关键词问题的网站优先向用户推荐,因此本发明实施例能够向用户优先推荐上述三类网站中的至少一类,用户可以从有互动性质的网站中查找到其所需的内容。若在被推荐出的网站中,仍然没有用户所需的内容,用户还可以在被推荐的有互动性质的网站中以提问的方式,将自己感兴趣的问题向公众提出,等待其他用户解答,从而在有互动性质的网站中,得到自己所需的与长尾关键词有关的答案。其中,综合性问答知识类网站可以包括:360问答、百度知道、搜狗知识、或SOSO问问等;垂直领域的网站可以包括:游侠网、游戏官网论坛、或大众点评网等;综合性经验分享类网站可以包括豆瓣网、或百度贴吧等。
[0059]需要说明的是,在本发明实施例中,查询词、关键词与网站相匹配包括下述中的至少一个:
[0060]若查询词、关键词在有互动性质的网站和/或有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值,则说明查询词、关键词与网站相匹配;其中,设定次数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0061]若包含有解决过有关查询词、关键词和/或其同义词、相关词问题的网页的有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0062]若解决过有关查询词、关键词和/或其同义词、相关词问题的有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。[0063]若单个有互动性质的网站中的解决过有关查询词、关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值,则说明查询词、关键词与网站相匹配;其中,设定个数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0064]在本发明实施例中,有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或贴吧等。
[0065]参见图2,本发明实施例还提供了另一种基于长尾关键词的搜索推荐方法,包括:
[0066]步骤SlOl:接收用户输入的搜索查询词;
[0067]步骤S201:当查询词为长尾关键词时,优先推荐与其相关的互动性质的网站。
[0068]其中,当查询词为长尾关键词时,优先推荐与其相关的互动性质的网站,包括:
[0069]当查询词为长尾关键词时,由于长尾关键词通常表达出用户非常明确具体的搜索需求,比如具体的问题,这样的问题通常在互动性质的网站中会有最相近的答案或相关内容,比如论坛某个帖子中有提到。这样的话,互动性质的网站包括:综合性问答知识类网站、垂直领域的网站,和/或综合性经验分享类网站。本实施例中,从而在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与长尾关键词的核心分词相匹配的有互动性质的网站,并将查找到的网站作为可解决长尾关键词问题的网站优先向用户推荐,因此本发明实施例优先向用户推荐的互动性质网站包括上述三类网站中的至少一类,用户可以从有互动性质的网站中查找到其所需的内容。若在被推荐出的网站中,仍然没有用户所需的内容,用户还可以在被推荐的有互动性质的网站中以提问的方式,将自己感兴趣的问题向公众提出,等待其他用户解答,从而在有互动性质的网站中,得到自己所需的与长尾关键词有关的答案。其中,综合性问答知识类网站可以包括:360问答、百度知道、搜狗知识、或SOSO问问等;垂直领域的网站可以包括:游侠网、游戏官网论坛、或大众点评网等;综合性经验分享类网站可以包括豆瓣网、或百度贴吧等。
[0070]需要说明的是,在本发明实施例中,查询词、关键词与网站相匹配包括下述中的至少一个:
[0071]若查询词、关键词在有互动性质的网站和/或有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值,则说明查询词、关键词与网站相匹配;其中,设定次数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0072]若包含有解决过有关查询词、关键词和/或其同义词、相关词问题的网页的有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0073]若解决过有关查询词、关键词和/或其同义词、相关词问题的有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0074]若单个有互动性质的网站中的解决过有关查询词、关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值,则说明查询词、关键词与网站相匹配;其中,设定个数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0075]在本发明实施例中,有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或贴吧等。
[0076]参见图3,本发明实施例还提供了一种基于长尾关键词的搜索推荐装置,包括:[0077]判断模块100,用于接收用户搜索查询词,判断查询词的类型是否为长尾关键词;
[0078]在本发明实施例中,判断模块100,包括:
[0079]分词单元110,用于接收用户搜索查询词,对查询词进行分词处理;
[0080]第一判断执行单元120,用于判断查询词是否由至少2个单词组成,且查询词是否在一段时间阈值内的搜索次数低于设定次数阈值;若是,确定查询词为长尾关键词;否则,确定查询词不是长尾关键词。时间阈值和设定次数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0081]或,判断模块100,包括:
[0082]分词单元110,用于接收用户搜索查询词,对查询词进行分词处理;
[0083]第二判断执行单元130,用于判断根据搜索查询词索引的通用搜索结果匹配程度是否低于匹配阈值;若是,确定查询词为长尾关键词。否则,确定查询词不是长尾关键词。其中,匹配阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0084]这里需要说明的是,第一判断执行单元120和第二判断执行单元130不仅仅是或的关系,它们也可以是和的关系,即在判断模块100中,先通过分词单元110对用户输入的查询词进行分词处理,接下来既通过第一判断执行单元120对查询词进行判断,又通过第二判断执行单元130对查询词进行判断。
[0085]网站推荐模块200,用于当判断模块100的判断结果为查询词是长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
[0086]具体地,网站推荐模块200,包括:
[0087]判断分析单元210,用于当判断执行单元的判断结果为查询词是长尾关键词时,根据分词后各个分词的搜索热度判断各个分词的权重,将权重最高的分词作为核心分词,其他分词作为支持词;
[0088]网站推荐执行单元220,用于查找与核心分词相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐;
[0089]其中,网站推荐执行单元220,具体用于在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与核心分词相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
[0090]因此本发明实施例能够向用户优先推荐上述三类网站中的至少一类,用户可以从有互动性质的网站中查找到其所需的内容。若在被推荐出的网站中,仍然没有用户所需的内容,用户还可以在被推荐的有互动性质的网站中以提问的方式,将自己感兴趣的问题向公众提出,等待其他用户解答,从而在有互动性质的网站中,得到自己所需的与长尾关键词有关的答案。其中,综合性问答知识类网站可以包括:360问答、百度知道、搜狗知识、或SOSO问问等;垂直领域的网站可以包括:游侠网、游戏官网论坛、或大众点评网等;综合性经验分享类网站可以包括豆瓣网、或百度贴吧等。
[0091]这里需要说明的是,在本发明实施例中,还包括:第一搜索引擎、第二搜索引擎、第一网站库和第二网站库;第一搜索引擎用于第一网站库的索引,第二搜索引擎用于第二网站库的索引;其中,第一网站库为所有网站的集合;第二网站库为有互动性质的网站的集合。当分词单元110对查询词进行分词处理后,由判断执行单元对查询词进行长尾关键词的判断;再由第一搜索引擎在第一网站库中进行索引,将索引到的网站推荐给用户,但该网站与查询的长尾关键词的匹配程度并不高,往往并不是用户想得到的内容,此时用户往往需要重新调整查询词再次检索,无法满足用户的索引需求;因此,与此同时,由判断分析单元210确定核心分词,由网站推荐执行单元220利用第二搜索引擎在第二网站库中进行索弓丨,将索引到的互动性质的网站推荐给用户,用户可以在被推荐出的有互动性质的网站中查找自己感兴趣的内容,从而更容易得到自己想要的内容。
[0092]由此可见,在本发明实施例中,网站推荐执行单元220,具体用于通过第二搜索引擎在第二网站库中,查找与核心分词相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。其中,第二网站库可以包括综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站这3类有互动性质的网站,但不仅限于这3类有互动性质的网站,本发明实施例对此不进行具体地限制。
[0093]需要说明的是,在本发明实施例中,查询词、关键词与网站相匹配包括下述中的至少一个:
[0094]若查询词、关键词在有互动性质的网站和/或有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值,则说明查询词、关键词与网站相匹配;其中,设定次数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0095]若包含有解决过有关查询词、关键词和/或其同义词、相关词问题的网页的有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0096]若解决过有关查询词、关键词和/或其同义词、相关词问题的有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0097]若单个有互动性质的网站中的解决过有关查询词、关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值,则说明查询词、关键词与网站相匹配;其中,设定个数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0098]在本发明实施例中,有互动性质的网站,包括:社父网站、互动社区、论fe;、攻略/经验分享网站或贴吧等。
[0099]通过本发明实施例提供的装置基于长尾关键词进行搜索推荐的实施例如图4所示,当用户搜索的查询词是“太阁5战国绘卷628秘籍怎么收归蝶”时,先由分词单元110对“太阁5战国绘卷628秘籍怎么收归蝶”进行分词处理,再由判断执行单元判断查询词的类型是否为长尾关键词;通过分析,查询词至少由“太阁”、“战国”、“绘卷”和“秘籍”这4个单词组成,且在一段时间阈值内的搜索次数低于设定次数阈值,则判断该查询词为长尾关键词。利用第一搜索引擎在第一网址库中查找是否有与这个查询词相匹配的网站;而只有“太阁立志传5战国绘卷怎么娶女武将我去她家什么都不发生送什么。。。”的网址,即没有与查询词相匹配的网站;再由判断分析单元210根据各分词的权重,将“太阁”作为核心分词,其他分词作为支持词;接着通过第二搜索引擎在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与“太阁”相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,即将查找到的百度贴吧中的太阁立志传5吧、太阁5官方论坛、游侠网的太阁5游戏专题和360问答优先向用户推荐,用户可以从上述百度贴吧中的太阁立志传5吧、太阁5官方论坛、游侠网的太阁5游戏专题中查找到“太阁5战国绘卷628秘籍怎么收归蝶”有关的内容。若在上述网站中,仍然没有用户所需的内容,用户还可以在被推荐出的360问答中以提问的方式,将“太阁5战国绘卷628秘籍怎么收归蝶”的问题向公众提出,等待其他用户解答,从而通过被推荐出的互动性质的网站得到自己所需的与长尾关键词有关的答案。
[0100]参见图5,本发明实施例还提供了一种基于长尾关键词的搜索推荐装置,包括:
[0101]搜索输入框300,用于用户输入搜索查询词;
[0102]显示模块400,用于当查询词为长尾关键词时,显示优先推荐的与其相关的互动性质的网站。
[0103]其中,显示模块400,具体用于当查询词为长尾关键词时,在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与长尾关键词的核心分词相匹配的有互动性质的网站,并将查找到的网站作为可解决长尾关键词问题的网站优先向用户显示,因此本发明实施例优先向用户推荐的互动性质网站包括上述三类网站中的至少一类,用户可以从有互动性质的网站中查找到其所需的内容。若在被推荐出的网站中,仍然没有用户所需的内容,用户还可以在被推荐的有互动性质的网站中以提问的方式,将自己感兴趣的问题向公众提出,等待其他用户解答,从而在有互动性质的网站中,得到自己所需的与长尾关键词有关的答案。其中,综合性问答知识类网站可以包括:360问答、百度知道、搜狗知识、或SOSO问问等;垂直领域的网站可以包括:游侠网、游戏官网论坛、或大众点评网等;综合性经验分享类网站可以包括豆瓣网、或百度贴吧等。
[0104]需要说明的是,在本发明实施例中,查询词、关键词与网站相匹配包括下述中的至少一个:
[0105]若查询词、关键词在有互动性质的网站和/或有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值,则说明查询词、关键词与网站相匹配;其中,设定次数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0106]若包含有解决过有关查询词、关键词和/或其同义词、相关词问题的网页的有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0107]若解决过有关查询词、关键词和/或其同义词、相关词问题的有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值,则说明查询词、关键词与网站相匹配;其中,设定搜索热度阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0108]若单个有互动性质的网站中的解决过有关查询词、关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值,则说明查询词、关键词与网站相匹配;其中,设定个数阈值由具体需求而定,本发明实施例对此不进行具体的限制。
[0109]在本发明实施例中,有互动性质的网站,包括:社父网站、互动社区、论is、攻略/经验分享网站或贴吧等。
[0110]本发明实施例的基于长尾关键词的搜索推荐方法及装置,当接收到用户搜索的查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,从而将用户引导到最有可能解决用户问题的网站,解决了当搜索词为长尾关键词时,无法获取与该长尾关键词相匹配的网站的问题,取得了满足用户的搜索需求的有益效果。[0111]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0112]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0113]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0114]本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0115]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0116]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于长尾关键词的搜索推荐装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0117]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
[0118]本发明还提供了 Al、一种基于长尾关键词的搜索推荐方法,包括:
[0119]接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词;
[0120]当所述查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
[0121]A2、如Al所述的方法,所述判断所述查询词的类型是否为长尾关键词包括:对所述查询词进行分词处理,在判断出所述查询词由至少2个单词组成,且所述查询词在一段时间阈值内的搜索次数低于设定次数阈值的情况下,确定所述查询词为长尾关键词;
[0122]或者,如果搜索查询词索引的通用搜索结果匹配程度低于匹配阈值,则确定所述查询词为长尾关键词。
[0123]A3、如A1-A2中任一项所述的方法,所述查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,包括:根据分词后各个分词的搜索热度判断所述各个分词的权重,将权重最高的分词作为核心分词,其他分词作为支持词;查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
[0124]A4、如A1-A3中任一项所述的方法,所述查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐,包括:在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与所述核心分词相匹配的有互动性质的网站,并将查找到的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
[0125]A5、如A1-A4中任一项所述的方法,所述相匹配包括下述中的至少一个:
[0126]所述关键词在所述有互动性质的网站和/或所述有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值;
[0127]包含有解决过有关关键词和/或其同义词、相关词问题的网页的所述有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值;
[0128]解决过有关关键词和/或其同义词、相关词问题的所述有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值;
[0129]单个有互动性质的网站中的解决过有关关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值。
[0130]A6、如A1-A5中任一项所述的方法,所述有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或贴吧。
[0131]本发明还提供了 B7、一种基于长尾关键词的搜索推荐方法,包括:
[0132]接收用户输入的搜索查询词,
[0133]当所述查询词为长尾关键词时,推荐与其相关的互动性质的网站。
[0134]本发明还提供了 CS、一种基于长尾关键词的搜索推荐装置,包括:
[0135]判断模块,用于接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词;
[0136]网站推荐模块,用于当所述判断模块的判断结果为是时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
[0137]C9、如CS所述的装置,所述判断模块,包括:
[0138]分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理;
[0139]第一判断执行单元,用于判断所述查询词是否由至少2个单词组成,且所述查询词是否在一段时间阈值内的搜索次数低于设定次数阈值;若是,确定所述查询词为长尾关键词;
[0140]或,所述判断模块,包括:
[0141]分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理;
[0142]第二判断执行单元,用于判断根据搜索查询词索引的通用搜索结果匹配程度是否低于匹配阈值;若是,确定所述查询词为长尾关键词。
[0143]C10、如C9所述的装置,所述网站推荐模块,包括:
[0144]判断分析单元,用于当所述判断执行单元的判断结果为是时,根据分词后各个分词的搜索热度判断所述各个分词的权重,将权重最高的分词作为核心分词,其他分词作为支持词;
[0145]网站推荐执行单元,用于查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
[0146]C11、如ClO所述的装置,
[0147]所述网站推荐执行单元,具体用于在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
[0148]C12、如C8-C11中任一项所述的装置,所述相匹配包括下述中的至少一个:
[0149]所述关键词在所述有互动性质的网站和/或所述有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值;
[0150]包含有解决过有关关键词和/或其同义词、相关词问题的网页的所述有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值;
[0151]解决过有关关键词和/或其同义词、相关词问题的所述有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值;
[0152]单个有互动性质的网站中的解决过有关关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值。
[0153]C13、如CS所述的装置,所述有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或贴吧。
[0154]本发明还提供D14、一种基于长尾关键词的搜索推荐装置,包括:
[0155]搜索输入框,用于用户输入搜索查询词;
[0156]显示模块,用于当所述查询词为长尾关键词时,显示推荐的与其相关的互动性质的网站。
【权利要求】
1.一种基于长尾关键词的搜索推荐方法,包括: 接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词; 当所述查询词的类型为长尾关键词时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
2.如权利要求1所述的方法,所述判断所述查询词的类型是否为长尾关键词包括:对所述查询词进行分词处理,在判断出所述查询词由至少2个单词组成,且所述查询词在一段时间阈值内的搜索次数低于设定次数阈值的情况下,确定所述查询词为长尾关键词; 或者,如果搜索查询词索引的通用搜索结果匹配程度低于匹配阈值,则确定所述查询词为长尾关键词。
3.如权利要求1-2中任一项所述的方法,所述查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐,包括:根据分词后各个分词的搜索热度判断所述各个分词的权重,将权重最高的分词作为核心分词,其他分词作为支持词;查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
4.如权利要求1-3中任一项所述的方法,所述查找与所述核心分词相匹配的有互动性质的网站作为可解决所述长尾关键词问题的网站优先向用户推荐,包括:在综合性问答知识类网站、垂直领域的网站和综合性经验分享类网站中,分别查找与所述核心分词相匹配的有互动性质的网站,并将查找到的网站作为可解决所述长尾关键词问题的网站优先向用户推荐。
5.如权利要求1-4中任一项所述的方法,所述相匹配包括下述中的至少一个: 所述关键词在所述有互动性质的网站和/或所述有互动性质的网站的网页中出现的次数等于或者大于设定次数阈值; 包含有解决过有关关键词和/或其同义词、相关词问题的网页的所述有互动性质的网站的搜索热度等于或者大于设定搜索热度阈值; 解决过有关关键词和/或其同义词、相关词问题的所述有互动性质的网站的网页的搜索热度等于或者大于设定搜索热度阈值; 单个有互动性质的网站中的解决过有关关键词和/或其同义词、相关词问题的网页的个数等于或者大于设定个数阈值。
6.如权利要求1-5中任一项所述的方法,所述有互动性质的网站,包括:社交网站、互动社区、论坛、攻略/经验分享网站或贴吧。
7.一种基于长尾关键词的搜索推荐方法,包括: 接收用户输入的搜索查询词, 当所述查询词为长尾关键词时,推荐与其相关的互动性质的网站。
8.一种基于长尾关键词的搜索推荐装置,包括: 判断模块,用于接收用户搜索查询词,判断所述查询词的类型是否为长尾关键词; 网站推荐模块,用于当所述判断模块的判断结果为是时,查找与其相匹配的有互动性质的网站作为可解决长尾关键词问题的网站优先向用户推荐。
9.如权利要求8所述的装置,所述判断模块,包括: 分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理;第一判断执行单元,用于判断所述查询词是否由至少2个单词组成,且所述查询词是否在一段时间阈值内的搜索次数低于设定次数阈值;若是,确定所述查询词为长尾关键词; 或,所述判断模块,包括: 分词单元,用于接收用户搜索查询词,对所述查询词进行分词处理; 第二判断执行单元,用于判断根据搜索查询词索引的通用搜索结果匹配程度是否低于匹配阈值;若是,确定所述查询词为长尾关键词。
10.一种基于长尾关键词的搜索推荐装置,包括: 搜索输入框,用于用户输入搜索查询词; 显示模块,用于当所述查询词为长尾关键词时,显示推荐的与其相关的互动性质的网 站。
【文档编号】G06F17/30GK104021214SQ201410281334
【公开日】2014年9月3日 申请日期:2014年6月20日 优先权日:2014年6月20日
【发明者】崔代超 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1