一种相关关键词推荐方法和装置制造方法

文档序号:6499379阅读:93来源:国知局
一种相关关键词推荐方法和装置制造方法
【专利摘要】本发明实施例公开了一种相关关键词推荐方法,包括:接收输入的第一查询词;检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词;接收输入的第二查询词;判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值;更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。采用本发明,解决现有技术中搜索引擎无法推荐与查询词语义不相关内容却相关的相关关键词。
【专利说明】一种相关关键词推荐方法和装置
【技术领域】
[0001]本发明涉及互联网领域,尤其涉及一种相关关键词推荐方法和装置。
【背景技术】
[0002]当前搜索引擎的相关关键词推荐是推荐和用户输入的关键词在单词表意上或语义上相似的关键词,如用户输入搜索“蘑菇”,百度返回的相关搜索为“香菇的做法大全”,“香菇油菜”,“香菇炖鸡”等,google返回的相关搜索为“蘑菇街”,“蘑菇网”,“蘑菇汤”等。这些相似关键词都是基于词法或语义相似度。
[0003]当前搜索引擎的相关关键词推荐是建立在用户明确知道要搜索的内容、指定关键词的前提上,故其推荐的相关关键词都是单词表意或语义上有一定的相似度的单词。当用户在无法准确表述要搜索的内容,无法明确指定其想搜索的关键词时,当前传统的推荐算法仅能根据输入关键词提供给用户信息时,用户会人为的查看搜索结果,进行判断、筛选,逐步修改其要搜索的关键词。举例来说,用户想搜索如何评估代码变更影响范围的文章,当他输入“代码变更影响范围”,返回的搜索及相关推荐里中都是包含这些“代码变更”或“影响范围”的结果。让我们考虑一下用户的行为,用户依次查看传统搜索引擎的搜索结果,当用户查看到一篇介绍代码变更测试相关的搜索结果时,意识到这个领域的专业术语“change centric testing”,所以他将搜索关键词改为 “change centric testing”。如果从单词词法、语义上来讲“代码变更影响范围”和“change centric testing”相差甚远,用传统的推荐算法是无法推荐到的。

【发明内容】

[0004]本发明实施例所要解决的技术问题在于,提供一种相关关键词推荐方法。可解决现有技术中搜索引擎无法推荐与查询词语义不相关内容却相关的相关关键词。
[0005]为了解决上述技术问题,本发明实施例提供了一种相关关键词推荐方法,包括:
[0006]接收输入的第一查询词;
[0007]检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词;
[0008]接收输入的第二查询词;
[0009]判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值;
[0010]更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
[0011]相应地,本发明实施例还提供了一种相关关键词推荐装置,包括:
[0012]第一接收模块,用于接收输入的第一查询词;
[0013]关键词检索模块,用于检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词;
[0014]第二接收模块,用于接收输入的第二查询词;[0015]相似度计算模块,判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值;相似库更新模块,用于更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
[0016]实施本发明实施例,具有如下有益效果:
[0017]实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
【专利附图】

【附图说明】
[0018]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是本发明实施例的一种关键词推荐方法的流程示意图;
[0020]图2是本发明实施例的一种关键词推荐方法的另一流程示意图;
[0021]图3是本发明实施例的一种关键词推荐装置的结构示意图;
[0022]图4是本发明实施例的一种关键词推荐装置的另一结构示意图;
[0023]图5是图4中相似度计算模块的结构示意图。
【具体实施方式】
[0024]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0025]参见图1,为本发明的一种相关关键词推荐方法的流程示意图,该方法包括:
[0026]步骤101、接收输入的第一查询词。
[0027]步骤102、检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词。
[0028]具体的,用户通过搜索引擎的输入框输入第一查询词,搜索引擎接收到该第一查询词,搜索引擎的数据库中预置有关键词相似库,该关键词相似库中包括若干个相关关键词,搜索引擎根据获取到第一查询词计算关键词相似库中每一个相关关键词的相似度值,将计算得到的相似度值进行排序,返回预定数量的相关关键词,同时,搜索引擎根据预置的搜索算法返回与第一查询词相关的搜索结果,该搜索结果一般为网页的链接集合;搜索引擎对用户访问过的网页进行记录并保存至日志中。例如,假设用户输入的第一查询词为A0,预置的关键词相似库中的相关关键词为{A10,A8,A6,Al,A5,A2,Al,A3,A4,A7,A9},搜索引擎根据获取到的第一查询词AO分别计算关键词相似库中每个相关关键词的相似度值,相似度值越大表示该相关关键词与第一查询词越相似。假设计算出来的相关关键词降序排序为{A10,A9,A8,A7,A6,A5,A4,A3,A2,Al},假如需要显示5个相关关键词,则搜索引擎将{A10,A9, A8, A7, A6} 5个相关关键词返回至搜索页面。
[0029]步骤103、接收输入的第二查询词。
[0030]具体的,搜索引擎接收到输入的与第一查询词不同的第二查询词,假设输入的第二查询词为BO。
[0031]步骤104、判断访问所述第一查询词的搜索结果中是否包括所述第二查询词。
[0032]具体的,从步骤102中保存的日志中获取访问过的第一查询词的搜索结果,判断该捭索结果中是否包括所沭第二杳询词。假设用户访问过的网址为“WWW, sairolel.com”,该网址指向的页面中包括第二查询词B0,则表明第二查询词BO和第一查询词AO存在一定的相似度,执行步骤105,若不包括,则该流程结束。
[0033]步骤105、增加所述第二查询词语所述第一查询词之间的相似度值。
[0034]具体的,采用第二查询与第一查询词的关联次数来计算二者之间的相似度值,用户使用第一查询词返回的搜索结果中包括输入的第二查询词,计为关联次数加1,关联次数每增加I次则二者的相似度值加1,关联次数越多则表明第二查询词语第一查询词之间的相似度越大。也可以采用其他的算法来增加第二查询词和第一查询词之间的相似度值,本发明不作限制。
[0035]步骤106、更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
[0036]具体的,由于第二查询词与第一查询词存在相似度,搜索引擎将第二查询词更新至第二查询词的关键词相似库中,当用户下次再次输入第一查询词时,搜索引擎返回相关关键词时就会计算关键词相似库中的第二查询词的相似度值。假设按照步骤104的预置的算法,当第二查询词语第一查询词的关联次数较多时,根据相似度值排名第二查询词就会排在前面,搜索引擎会将相似度值较高的第二查询词推荐给用户。
[0037]实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
[0038]参见图2,为本发明的一种相关关键词推荐方法的另一流程示意图,该方法包括:
[0039]步骤201、接收输入的第一查询词。
[0040]步骤202、检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词。
[0041]具体的,用户通过搜索引擎的输入框输入第一查询词,搜索引擎接收到该第一查询词,搜索引擎的数据库中预置有关键词相似库,该关键词相似库中包括若干个相关关键词,搜索引擎根据获取到第一查询词计算关键词相似库中每一个相关关键词的相似度值,将计算得到的相似度值进行排序,返回预定数量的相关关键词,同时,搜索引擎根据预置的搜索算法返回与第一查询词相关的搜索结果,该搜索结果一般为网页的链接集合;搜索引擎对用户访问过的网页进行记录并保存至日志中。例如,假设用户输入的第一查询词为A0,预置的关键词相似库中的相关关键词为{A10,A8,A6,Al,A5,A2,Al,A3,A4,A7,A9},搜索引擎根据获取到的第一查询词AO分别计算关键词相似库中每个相关关键词的相似度值,相似度值越大表示该相关关键词与第一查询词越相似。假设计算出来的相关关键词降序排序为{A10,A9,A8,A7,A6,A5,A4,A3,A2,Al},假如需要显示5个相关关键词,则搜索引擎将{A10,A9, A8, A7, A6} 5个相关关键词返回至搜索页面。
[0042]步骤203、接收输入的第二查询词。
[0043]步骤104、判断访问所述第一查询词的搜索结果中是否包括所述第二查询词。
[0044]具体的,从步骤102中保存的日志中获取访问过的第一查询词的搜索结果,判断该捭索结果中是否包括所沭第二杳询词。假设用户访问过的网址为“WWW, sairolel.com”,该网址指向的页面中包括第二查询词B0,则表明第二查询词BO和第一查询词AO存在一定的相似度,执行步骤205,若不包括,则该流程结束。
[0045]步骤205、获取所述第二查询词与所述第一查询词的关联次数,根据所述关联次数确定所述第二查询词与所述第一查询词增加的相似度值。
[0046]具体的,由于第二查询词语第一查询词在语义上关联很小,二者之间相似度值可能会很小,无法达到搜索引擎的推荐阈值,但是二者的内容上是相关的,需要采用一定的算法来增加二者之间的相似度值以达到推荐语第一查询词语义不相关内容却相关的关键词。具体做法为,用户使用第一查询词返回的搜索结果中包括输入的第二查询词,计为关联次数加1,关联次数每增加I次则二者的相似度值加1,关联次数越多则表明第二查询词语第一查询词之间的相似度越大。
[0047]步骤206、判断根据所述第二查询词执行的当前搜索操作是否结束。
[0048]具体的,若在预定的时长内未返回与所述第二查询词相关的搜索结果,则确定根据所述第二查询词执行的当前搜索操作结束,执行步骤207,否则,继续判断。
[0049]步骤207、若所述关键词相似库中是否存在所述第二查询词,若不存在,则创建所述第一查询词语所述第二查询词的关联关系,并保存所述第二查询词值所述第一查询词相似库中。
[0050]具体的,第一查询词和相关关键词以表格的形式保存至关键词相似库中,判断关键词相似库中是否存在第二查询词,如果该行不存在,则创建该行。如果第一查询词的行已经存在,但关联的第二查询词的列不存在,只需增加一列,然后将该列的相似度值设为I。那么在下次查询第一查询词时,会优先显示相似度值较高的关键词。
[0051]实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
[0052]参见图3,为本发明的一种关键词推荐装置的结构示意图(以下简称推荐装置),包括:
[0053]第一接收模块11,用于接收输入的第一查询词。
[0054]关键词检索模块12,用于检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词。
[0055]具体的,搜索引擎的数据库中预置有关键词相似库,该关键词相似库中包括若干个相关关键词,关键词检索模块12根据获取到第一查询词计算关键词相似库中每一个相关关键词的相似度值,将计算得到的相似度值进行排序,返回预定数量的相关关键词,同时,关键词检索模块12根据预置的搜索算法返回与第一查询词相关的搜索结果,该搜索结果一般为网页的链接集合;关键词检索模块12对用户访问过的网页进行记录并保存至日志中。例如,假设用户输入的第一查询词为A0,预置的关键词相似库中的相关关键词为{A10,A8,A6,Al,A5,A2,Al,A3,A4,A7,A9},关键词检索模块12根据获取到的第一查询词AO分别计算关键词相似库中每个相关关键词的相似度值,相似度值越大表示该相关关键词与第一查询词越相似。假设计算出来的相关关键词降序排序为{A10,A9,A8,A7,A6,A5,A4,A3,A2, Al},假如需要显示5个相关关键词,则搜索引擎将{A10,A9, A8, A7, A6}5个相关关键词返回至搜索页面。
[0056]第二接收模块13,用于接收输入的第二查询词。
[0057]具体的,第二接收模块13接收到输入的与第一查询词不同的第二查询词,假设输入的第二查询词为BO。
[0058]相似度计算模块14,判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值。
[0059]具体的,从关键词检索模块12中保存的日志中获取访问过的第一查询词的搜索结果,相似度计算模块14判断该搜索结果中是否包括所述第二查询词。假设用户访问过的网址为“WWW, samplel.com”,该网址指向的页面中包括第二查询词B0,则表明第二查询词BO和第一查询词AO存在一定的相似度,执行步骤105,若不包括,则该流程结束。
[0060]相似度计算模块14采用第二查询与第一查询词的关联次数来计算二者之间的相似度值,用户使用第一查询词返回的搜索结果中包括输入的第二查询词,计为关联次数加1,关联次数每增加I次则二者的相似度值加1,关联次数越多则表明第二查询词语第一查询词之间的相似度越大。也可以采用其他的算法来增加第二查询词和第一查询词之间的相似度值,本发明不作限制。
[0061]相似库更新模块15,用于更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
[0062]实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
[0063]进一步的,参见图4和图5,为本发明的一种关键词推荐装置的另一种结构示意图,该推荐装置I除包括第一接收模块11、关键词检索模块12、第二接收模块13、相似度计算模块和相似库更新模块15外,还包括操作检测模块14。
[0064]操作检测模块16,用于判断根据所述第二查询词执行的当前搜索操作是否结束,若判断为是,则指示所述相似库更新模块进行操作。
[0065]进一步的,操作检测模块16用于若在预定的时长内未返回与所述第二查询词相关的搜索结果,则确定根据所述第二查询词执行的当前搜索操作结束。
[0066]其中,相似度计算模块14包括:[0067]获取单元141,用于获取所述第二查询词与所述第一查询词的关联次数;
[0068]计算单元142,用于根据所述关联次数确定所述二查询词与所述第一查询词增加的相似度值。
[0069]进一步的,相似库更新模块15用于判断所述关键词相似库中是否存在所述第二查询词,若不存在,则创建所述第一查询词与所述第二查询词的关联关系。
[0070]实施本发明的实施例,通过记录输入的第一查询词和访问过的第一查询词匹配的搜索结果,当用户输入第二查询词时,解析访问过的第一查询词匹配的搜索结果中是否包括第二查询词,若存在第二查询词则表明第二查询词语第一查询词的内容存在关联,即使二者的语义不相关,将第二查询词更新至关键词相似库中,克服了传统搜索引擎仅能推荐词法/语义相关关键词问题,本发明能够推荐词法/语义无关但内容相关的关键词。
[0071]本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory, ROM)或随机存储记忆体(Random AccessMemory, RAM)等。
[0072]以上所揭露的仅为本发明一种较佳实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
【权利要求】
1.一种相关关键词推荐方法,其特征在于,包括: 接收输入的第一查询词; 检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词; 接收输入的第二查询词; 判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值; 更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
2.如权利要求1所述的方法,其特征在于,所述更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系的步骤之前,该方法还包括: 判断根据所述第二查询词执行的当前搜索操作是否结束,若判断为是,则执行更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
3.如权要求2所述的方法,其特征在于,所述判断根据所述第二查询词执行的当前搜索操作是否结束的方法包括: 若在预定的时长内未返回与所述第二查询词相关的搜索结果,则确定根据所述第二查询词执行的当前搜索操作结束。
4.如权利要求3所述的方法,其特征在于,所述更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系包括: 判断所述关键词相似库中是否存在所述第二查询词,若不存在,则创建所述第一查询词与所述第二查询词的关联关系。
5.如权利要求1-4任一项所述的方法,其特征在于,所述增加所述第二关键词与第一关键词之间的相似度值包括: 获取所述第二查询词与所述第一查询词的关联次数; 根据所述关联次数确定所述二查询词与所述第一查询词增加的相似度值。
6.一种相关关键词推荐装置,其特征在于,包括: 第一接收模块,用于接收输入的第一查询词; 关键词检索模块,用于检索关键词相似库,并根据所述关键词相似库中各相关关键词与所述第一查询词的相似度值,返回预定数量的相关关键词; 第二接收模块,用于接收输入的第二查询词; 相似度计算模块,判断访问过的所述第一查询词的搜索结果中是否包括所述第二查询词,若为是,则增加所述第二关键词与第一关键词之间的相似度值; 相似库更新模块,用于更新所述关键词相似库,保存所述第二查询词与所述第一查询词的关联关系。
7.如权利要求6所述的装置,其特征在于,还包括; 操作检测模块,用于判断根据所述第二查询词执行的当前搜索操作是否结束,若判断为是,则指示所述相似库更新模块进行操作。
8.如权利要求7所述的装置,其特征在于,所述操作检测模块用于若在预定的时长内未返回与所述第二查询词相关的搜索结果,则确定根据所述第二查询词执行的当前搜索操作结束。
9.如权利要求8所述的装置,其特征在于,所述相似库更新模块用于判断所述关键词相似库中是否存在所述第二查询词,若不存在,则创建所述第一查询词与所述第二查询词的关联关系。
10.如权利要求6-9任一项所述的装置,其特征在于,所述相似度计算模块包括: 获取单元,用于获取所述第二查询词与所述第一查询词的关联次数; 计算单元,用于根 据所述关联次数确定所述二查询词与所述第一查询词增加的相似度值。
【文档编号】G06F17/30GK103970748SQ201310029622
【公开日】2014年8月6日 申请日期:2013年1月25日 优先权日:2013年1月25日
【发明者】鲁四喜 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1