推荐信息的获取方法及装置与流程

文档序号:12786362阅读:201来源:国知局
推荐信息的获取方法及装置与流程

本发明涉及互联网应用技术领域,具体涉及一种推荐信息的获取方法及装置。



背景技术:

当用户通过浏览器进行关键词搜索时,浏览器除了会反馈与关键词直接相关的搜索结果外,还可以反馈一些和关键词相关的其他推荐结果,以便于用户查看与该关键词相关的一些推荐信息。

现有的后台服务器在根据浏览器的请求向浏览器推送相关推荐信息时,一般是按照推荐信息与关键词的相关度从高到低的顺序进行推送。

然而,现有的后台服务器关于推荐信息的推送方式,存在一个问题,即推送的推荐信息有可能不够全面,有时候后台服务器推送的推荐信息并不是用户真正想获知的推荐信息。



技术实现要素:

针对现有技术中的缺陷,本发明提供一种推荐信息的获取方法及装置,能够较为全面地获取与关键词相关的推荐信息,避免错漏用户真正的搜索需求。

为解决上述技术问题,本发明提供以下技术方案:

第一方面,本发明提供了一种推荐信息的获取方法,包括:

接收浏览器发送的针对关键词的推荐信息请求指令,所述推荐信息请求指令中携带有所述浏览器的标识以及所述关键词;

根据所述关键词获取与所述关键词对应的多个领域的推荐信息;

根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领 域的推荐信息。

优选地,所述根据所述关键词获取与所述关键词对应的多个领域的推荐信息,进一步包括:

根据所述关键词依次查找不同领域的映射关系,以获取与所述关键词对应的多个领域的推荐信息,所述映射关系包括:关键词与推荐信息之间的对应关系。

优选地,在所述根据所述关键词获取与所述关键词对应的多个领域的推荐信息之前,所述方法进一步包括:

建立若干预设领域的映射关系。

优选地,所述建立若干预设领域的映射关系,进一步包括:

从网络中抓取不同领域的网页样本;

获取各领域的网页样本中出现频率超过预设阈值的词语,根据获取的词语建立各领域的关键词集合;

对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度;

根据获取的关联度确定所述当前关键词集合中各关键词的推荐信息,以建立所述当前关键词集合所属领域的映射关系。

优选地,所述获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度,进一步包括:

获取遍历到的当前关键词集合中各关键词与所述当前关键词集合中的其他关键词在同一网页样本中出现的次数;

根据获取的次数确定所述当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。

优选地,所述推荐信息包括:推荐词和与所述推荐词相关的图片的链接地址。

优选地,所述推荐信息还包括:所属领域的领域名称。

第二方面,本发明还提供了一种推荐信息的获取装置,包括:

接收单元,用于接收浏览器发送的针对关键词的推荐信息请求指 令,所述推荐信息请求指令中携带有所述浏览器的标识以及所述关键词;

获取单元,用于根据所述关键词获取与所述关键词对应的多个领域的推荐信息;

发送单元,用于根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领域的推荐信息。

优选地,所述获取单元,进一步用于:

根据所述关键词依次查找不同领域的映射关系,以获取与所述关键词对应的多个领域的推荐信息,所述映射关系包括:关键词与推荐信息之间的对应关系。

优选地,所述装置进一步包括:建立单元,用于建立若干预设领域的映射关系。

优选地,所述建立单元,进一步包括:抓取模块、第一建立模块、遍历模块和第二建立模块;

所述抓取模块,用于从网络中抓取不同领域的网页样本;

所述第一建立模块,用于获取各领域的网页样本中出现频率超过预设阈值的词语,根据获取的词语建立各领域的关键词集合;

所述遍历模块,用于对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度;

所述第二建立模块,用于根据获取的关联度确定所述当前关键词集合中各关键词的推荐信息,以建立所述当前关键词集合所属领域的映射关系。

优选地,所述遍历模块,进一步用于:

对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中各关键词与所述当前关键词集合中的其他关键词在同一网页样本中出现的次数;

根据获取的次数确定所述当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。

优选地,所述推荐信息包括:推荐词和与所述推荐词相关的图片的链接地址。

优选地,所述推荐信息还包括:所属领域的领域名称。

由上述技术方案可知,本发明所述的推荐信息的获取方法,接收浏览器发送的针对关键词的推荐信息请求指令,所述推荐信息请求指令中携带有所述浏览器的标识以及所述关键词,根据所述关键词获取与所述关键词对应的多个领域的推荐信息,根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领域的推荐信息。可见,本实施例所述的推荐信息的获取方法,可以根据浏览器发送的关键词获取与关键词对应的多个领域的推荐信息,从而使得获取的推荐信息能够尽可能全面地覆盖与所述关键词相关的各个领域的信息,以满足查看不同领域中与该关键词相关的内容的需求。同时,本发明所述的推荐信息获取方法可以为用户获取搜索热度较低的领域中与该关键词相关的信息,而这部分信息有可能正是用户真正关心的推荐信息。而现有的推荐信息获取方法,在进行推荐信息获取时,一般只会考虑与关键词的相关度(和搜索热度),因而获取的推荐信息很有可能会遗漏掉用户真正关心的内容,即获取的推荐信息或许根本就不是用户想要的推荐信息。

由于本发明所述的推荐信息的获取方法,可以获取各个领域与关键词相关的推荐信息,故用户大约总可以在获取的推荐结果中看到他关心的内容,虽然有时候他关心的内容的搜索热度较低(比如属于某一比较偏的领域的内容),但是本发明所述的推荐信息的获取方法,并不会使其漏掉或错过这部分内容。

因此,本发明所述的推荐信息的获取方法,能够较为全面地获取与关键词相关的推荐信息,避免错漏用户真正的搜索需求。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明第一个实施例提供的推荐信息的获取方法的流程图;

图2-图4是浏览器在关键词的搜索结果页中对多个领域的推荐信息的展示结果示意图;

图5是本发明第三个实施例提供的推荐信息的获取方法的流程图;

图6是本发明第三个实施例中步骤102’的具体实现过程示意图;

图7是本发明第四个实施例中步骤c的具体实现过程示意图;

图8是本发明第五个实施例提供的推荐信息的获取装置的结构示意图;

图9是本发明第七个实施例提供的推荐信息的获取装置的结构示意图;

图10是本发明第八个实施例提供的推荐信息的获取装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1示出了本发明第一个实施例提供的推荐信息的获取方法的流程图,参见图1,本发明第一个实施例提供的推荐信息的获取方法包括如下步骤:

步骤101:接收浏览器发送的针对关键词的推荐信息请求指令,所述推荐信息请求指令中携带有所述浏览器的标识以及所述关键词。

步骤102:根据所述关键词获取与所述关键词对应的多个领域的推荐信息。

步骤103:根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领域的推荐信息。

本实施例提供的推荐信息的获取方法,接收浏览器发送的针对关键词的推荐信息请求指令,所述推荐信息请求指令中携带有所述浏览器的标识以及所述关键词,根据所述关键词获取与所述关键词对应的多个领域的推荐信息,根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领域的推荐信息。可见,本实施例所述的推荐信息的获取方法,可以根据浏览器发送的关键词获取与关键词对应的多个领域的推荐信息,从而使得获取的推荐信息能够尽可能全面地覆盖与所述关键词相关的各个领域的信息,以满足查看不同领域中与该关键词相关的内容的需求。同时,本实施例所述的推荐信息获取方法可以为用户获取搜索热度较低的领域中与该关键词相关的信息,而这部分信息有可能正是用户真正关心的推荐信息。而现有的推荐信息获取方法,在进行推荐信息获取时,一般只会考虑与关键词的相关度(和搜索热度),因而获取的推荐信息很有可能会遗漏掉用户真正关心的内容,即获取的推荐信息或许根本就不是用户想要的推荐信息。

由于本实施例所述的推荐信息的获取方法,可以获取各个领域与关键词相关的推荐信息,故用户大约总可以在获取的推荐结果中看到他关心的内容,虽然有时候他关心的内容的搜索热度较低(比如属于 某一比较偏的领域的内容),但是本实施例所述的推荐信息的获取方法,并不会使其漏掉或错过这部分内容。

因此,本实施例所述的推荐信息的获取方法,能够较为全面地展示与关键词相关的推荐信息,避免错漏用户真正的搜索需求。

在本发明的第二个实施例中,给出了上述步骤102的一种具体实现方式。

在本实施例中,上述步骤102根据所述关键词获取与所述关键词对应的多个领域的推荐信息,具体包括:

根据所述关键词依次查找不同领域的映射关系,以获取与所述关键词对应的多个领域的推荐信息,所述映射关系包括:关键词与推荐信息之间的对应关系。

在本实施例中的领域的范围包括:教育领域、科学研究领域、房地产领域、互联网领域、电商领域、影视领域、生活领域、游戏领域、餐饮领域、体育领域、环境领域、化学领域、卫生领域、建筑领域和农林领域等。

其中,对应每个领域至少有一个映射关系存在,这个映射关系中存储有关键词与推荐信息的对应关系。其中,每个领域也可以有多个映射关系,比如人物映射关系、事务映射关系、名词映射关系等。当一个领域中包含多个映射关系时,在获取该领域内与关键词对应的推荐信息时,就需要将关键词与该领域内的所有映射关系中的关键词进行一一匹配,以避免漏掉该领域内的相关信息。另外,也可以先判断关键词属于哪一类关键词,比如若关键词属于人名,则可以直接与该领域内的人物映射关系中的关键词进行匹配,这样可以节省匹配时间,同时也不会遗漏信息。

本实施例给出的映射关系均是一个领域对应一个映射关系的情况。当然,一个领域还可以对应多个映射关系。下述表1-表10所示的映射关系中的数据只是为了举例,并不具有完整性。比如,对于电商领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息, 其映射关系具体如下表1所示。

表1

又如,对于互联网领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表2所示。

表2

又如,对于文化领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表3所示。

表3

又如,对于影视领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表4所示。

表4

又如,对于餐饮领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表5所示。

表5

又如,对于生活领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表6所示。

表6

又如,对于医学领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表7所示。

表7

又如,对于游戏领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表8所示。

表8

又如,对于体育领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表9所示。

表9

又如,对于化学领域,其映射关系中存储有若干关键词以及与关键词对应的推荐信息,其映射关系具体如下表10所示。

表10

基于上述不同领域内的映射关系,当用户在浏览器中输入关键词的指令时,浏览器可以获取与所述关键词对应的多个领域的推荐信息。

例如,当用户在浏览器搜索框中输入关键词“马云”时,浏览器根据关键词“马云”依次查找不同领域的映射关系,最终获得与“马云”相关的多个领域的推荐信息。如①电商领域内与马云相关的人物或内容,如蔡崇信、刘强东、黄若、李国庆、俞渝、贝索斯、陈欧等;②互联网领域内与马云相关的人物或内容,如李彦宏、张朝阳、马化 腾等;③文化领域内与马云相关的人物或内容,如曹云金等;④影视领域内与马云相关的人物或内容,如马云投资的相关电影等;⑤影视领域内名字同样叫马云的相关信息,比如影视领域内有位导演名字也叫马云,此时该推荐信息包括与导演马云相关的人物或内容,如郑晓龙、赵宝刚、高希希等;⑥餐饮领域内与马云相关的人物或内容,如马云投资开的餐馆等。

又比如,当用户在浏览器搜索框中输入关键字“张朝阳”时,浏览器根据关键词“张朝阳”依次查找不同领域的映射关系,最终获得与“张朝阳”相关的多个领域的推荐信息。如①互联网领域内与张朝阳相关的人物或内容,如邓晔、李彦宏、周鸿祎、王志东、马化腾、曹国伟、王小川、丁磊、雷军、任正非等;②医学领域内与张朝阳相关的人物或内容,如张朝阳参加或投资的医疗项目;③医学领域内名字也叫张朝阳的相关信息,如与医生张朝阳相关的人物或内容。

又比如,当用户在浏览器搜索框中输入关键字“孟非”时,浏览器根据关键词“孟非”依次查找不同领域的映射关系,最终获得与“孟非”相关的多个领域的推荐信息。如①影视领域内与孟非相关的人物或内容,如黄菡、黄磊、乐嘉、《非诚勿扰》等;②餐饮领域内与孟非相关的人物或内容,如孟非投资开的餐馆重庆小面等。

又比如,当用户在浏览器搜索框中输入关键字“OT”时,浏览器根据关键词“OT”依次查找不同领域的映射关系,最终获得与“OT”相关的多个领域的推荐信息。如①游戏领域内与仇恨失控OT相关的名词,如伤害DMG、持续伤害DOT等;②医学领域内与结核菌素试验OT相关的名词或内容,如芒图试验、PPD试验、蒂内测试等;③体育领域内与加时赛OT相关的名词或内容,如小组赛、淘汰赛等。

又比如,当用户在浏览器搜索框中输入关键字“AMA”时,浏览器根据关键词“AMA”依次查找不同领域的映射关系,最终获得与“AMA”相关的多个领域的推荐信息。如①影视领域内与全美音乐大奖AMA相关的内容,如2015年全美音乐大奖AMA的获奖人物贾斯 汀.比伯、Jack、查理·帕斯、尼克.乔纳斯、Meghan Trainor等;②生活领域内与婴幼儿配方奶粉AMA相关的内容,如启赋婴幼儿配方奶粉、荷兰牛栏奶粉、羊奶粉、贝因美奶粉等;③医学领域内与美国医学学会AMA相关的内容,如AMA内的相关成员等。

又比如,当用户在浏览器搜索框中输入关键字“甄嬛传”时,浏览器根据关键词“甄嬛传”依次查找不同领域的映射关系,最终获得与“甄嬛传”相关的多个领域的推荐信息。如①影视领域内与甄嬛传相关的内容,如《芈月传》、《辣妈正传》等;②文化领域内与甄嬛传相关的内容,如甄嬛体、回音体、华妃体、陈欧体、咆哮体、tvb体。

又比如,当用户在浏览器搜索框中输入关键字“BP”时,浏览器根据关键词“BP”依次查找不同领域的映射关系,最终获得与“BP”相关的多个领域的推荐信息。如①互联网领域内与网络模型BP相关的词语,如OSI、TCP/IP等;②医学领域内与血压BP相关的名词或简写,如心电图ECG、脑电图EEG、血红蛋白Hb、红细胞RBC、白细胞WBC、血小板PLT等;③化学领域内与磷化硼BP相关的名词或内容,如碳化硼B4C和氮化硼等。

从上面描述过程可知,本实施例所述的推荐信息获取方法,根据用户输入的关键词依次查找不同领域的映射关系,最终可以获取与用户输入的关键词对应的属于多个领域的推荐信息,从而使得推荐信息更为全面。这样做的好处是:

第一,可以满足用户查看不同领域中与该关键词相关的内容的需求。比如,当用户在浏览器搜索框中输入“马云”时,现有的推荐信息获取方法只能获取“马化腾”、“刘强东”等这些与马云相关的内容。而本实施例所述的推荐信息获取方法,可以获取电商领域、互联网领域、文化领域、影视领域内和餐饮领域内与马云相关的人物或内容,从而可以满足用户查看不同领域中与“马云”相关的内容的需求,这样的推荐信息结果可以让用户知道马云和哪些领域有关系,或者分别在哪些领域做了什么事情。

第二,当用户想要获取的推荐信息属于冷门领域或搜索热度较低的领域时,现有的推荐信息获取方法不会获取这部分推荐信息,这样会使得用户无法获知真正想要的推荐信息。而本实施例所述的推荐信息获取方法,可以为用户获取搜索热度较低的领域中与该关键词相关的信息,而这部分信息有可能正是用户真正关心的推荐信息。比如,当用户在浏览器搜索框中输入“孟非”一词时,现有的推荐信息获取方法只能获取“乐嘉”、“黄菡”等这些与孟非相关的内容,但是用户真正想获知的推荐信息可能是孟非开的面馆“重庆小面”的一些信息。而本实施例所述的方法,除了可以获取影视领域内与孟非相关的一些信息外,还可以获取餐饮领域内与孟非相关的推荐信息。

又如,当用户在浏览器搜索框中输入“OT”一词时,用户真正关心的可能不是与“加班”或“加时赛”相关的推荐信息,而有可能是比较冷门的结核菌素试验OT这一含义的推荐信息。采用本实施例所述的推荐信息获取方法,不但可以获取出游戏领域内与仇恨失控OT相关的名词,体育领域内与加时赛OT相关的名词或内容,如小组赛、淘汰赛等,还可以获取医学领域内与结核菌素试验OT相关的名词或内容,如芒图试验、PPD试验、蒂内测试等,这样的推荐信息获取方法满足了用户的搜索需求。

第三,当不同领域内存在人物重名情况时,现有技术中浏览器给出的基于该人物的推荐信息基本上都是跟搜索热度较高的领域内的那个人的相关的信息,这个推荐信息有时候可能并不是用户真正想要的推荐信息。例如,用户想获知影视领域内名叫马云的一位导演的相关信息,假如用户在浏览器搜索框内输入马云这个关键词时,浏览器给出的推荐信息大都是互联网领域跟阿里巴巴CEO马云相关的推荐信息,但是该推荐信息并不是用户真正想获知的推荐信息。而本实施例所述的方法,既可以获取与阿里巴巴CEO马云相关的推荐信息(如马云在不同领域内的推荐信息),又可以获取与导演马云相关的推荐信息。另外,在获取推荐信息时,一般可以只获取推荐词。但为了提升 用户体验,可以在获取推荐词的同时还获取与推荐词相关的图片信息,这样可以将获取的推荐词和与推荐词相关的图片信息发送给浏览器,以使所述浏览器在所述关键词的搜索结果页中展示推荐词和与推荐词相关的图片信息,从而给用户更好的用户体验。

优选地,为了提高性能,在获取与推荐词相关的图片时,不直接获取该图片,而是获取该图片的链接地址。然后将获取的推荐词和与推荐词相关的图片的链接地址发送给浏览器,以使浏览器展示所述推荐词,并根据所述链接地址展示与推荐词相关的图片。

为了进一步提升用户体验,所述推荐信息还包括推荐词所属的领域。这样,在将推荐信息发送给浏览器后,浏览器可以将推荐词、与推荐词相关的图片(可选)以及推荐词所属的领域进行展示。这样,可以方便用户了解相对陌生的推荐词所属的领域,或相对熟悉的推荐词所述的陌生领域。用户根据推荐词所属的领域可以决定是否进一步查看该推荐词的具体信息或相关信息。

其中,在上述步骤103根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领域的推荐信息之后,浏览器在所述关键词的搜索结果页中对所述多个领域的推荐信息的展示结果可参见图2-图4。其中,图2是没有按照领域对推荐信息进行分类展示的展示结果示意图,图3是按照领域对推荐信息进行分类展示的展示结果示意图,图4是按照领域对推荐信息进行分类展示且带有隐藏和显示至少部分推荐信息功能的展示结果示意图。图2-图4中,1表示关键词的搜索结果页,2表示与关键词直接相关的搜索结果框,3表示与关键词相关的推荐信息结果展示框;3中的小方形区域代表入口元素,每个入口元素中有推荐词(和相关图片)。优选地,当推荐信息包括领域名称时,入口元素除了包括小方形区域外,还包括展示领域名称的区域。其中,入口元素用于触发对应推荐信息的搜索。

在本发明第三个实施例中,参见图5,在上述步骤102之前,所述 方法还包括步骤102’。

步骤102’:建立若干预设领域的映射关系。

另外,在本实施例中,进一步给出了上述步骤102’建立所述若干领域的映射关系的具体过程。参见图6,上述步骤102’建立若干预设领域的映射关系进一步包括如下子步骤a-d。

步骤a:从网络中抓取不同领域的网页样本。

在本步骤中,从网络中抓取不同领域的网页样本,其中,在具体抓取网页样本时,可以按照领域进行网页样本抓取。比如,每个领域内抓取预设数量的网页样本。为了保证后续关键词集合的准确性和代表性,这里每个领域内的网页样本的数量不能太少。

步骤b:获取各领域的网页样本中出现频率超过预设阈值的词语,根据获取的词语建立各领域的关键词集合。

步骤c:对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。

步骤d:根据获取的关联度确定所述当前关键词集合中各关键词的推荐信息,以建立所述当前关键词集合所属领域的映射关系。

在本实施例中,给出了建立若干预设领域的映射关系的具体步骤。首先,需要从网络中抓取不同领域的网页样本,然后获取各领域的网页样本中出现频率超过预设阈值(如10000次)的词语(如互联网领域内的李彦宏、张朝阳、马化腾、周鸿祎等,又如餐饮领域内的马云投资开的餐馆、孟非开的重庆小面面馆、张兰的俏江南等,又如体育领域内经常出现的名词加时赛OT、马云投资的恒大球队等,又如游戏领域经常出现的仇恨失控OT等),再根据获取的词语建立各领域的关键词集合,例如对于互联网领域,建立互联网领域的关键词集合(马云、李彦宏、李明远、周鸿祎、张朝阳、王志东、马化腾、曹国伟、王小川、丁磊、雷军、任正非)。在建立完各领域的关键词集合之后,开始执行步骤c和d,对各领域的关键词集合进行遍历,获取遍历到的 当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。例如遍历到的当前关键词集合为互联网领域的关键词集合,那么获取互联网关键词集合中各关键词与该集合中其他关键词之间的关联度,例如,获取“马云”与其他各关键词的关联度,根据获取的关联度确定关键词“马云”的推荐信息(如关联度较高的李彦宏、张朝阳和马化腾等),再获取“李彦宏”与其他各关键词的关联度,根据获取的关联度确定关键词“李彦宏”的推荐信息(如关联度较高的李明远、周鸿祎、张朝阳、王志东、马化腾和王小川等),按照这种处理方式,最终可以建立互联网领域的映射关系。对于其他领域的映射关系,也是按照类似的方式进行处理,最终可以建立各领域的映射关系,如上述表1-表10所示。

在本发明第四个实施例中,给出了上述步骤c的具体实现过程。参见图7,上述步骤c对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度,进一步包括如下步骤c1和c2。

步骤c1:获取遍历到的当前关键词集合中各关键词与所述当前关键词集合中的其他关键词在同一网页样本中出现的次数。

步骤c2:根据获取的次数确定所述当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。

在本实施例中,给出了上述步骤c的具体实现过程。其中,在获取当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度时,可以通过当前关键词集合中各关键词与所述当前关键词集合中的其他关键词在同一网页样本中出现的次数确定当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。这是因为当两个关键词经常在同一网页样本出现时,那么一定程度上意味着这两个关键词具有较为密切的联系,即关联度较高。

上述步骤c在具体执行时,需要基于该领域内一定数量的网页样本,即网页样本的数量要足够大,否则最终获取的次数不足以确定关 联度,或确定的关联度与实际的关联度有可能会存在较大差异。

本发明第五个实施例提供了一种推荐信息的获取装置,参见图8,包括:

接收单元81,用于接收浏览器发送的针对关键词的推荐信息请求指令,所述推荐信息请求指令中携带有所述浏览器的标识以及所述关键词;

获取单元82,用于根据所述关键词获取与所述关键词对应的多个领域的推荐信息;

发送单元83,用于根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领域的推荐信息。

本实施例所述的装置,可以用于执行上述第一个实施例所述的方法,其原理和技术效果类似,此处不再详述。

在本发明第六个实施例中,所述获取单元82,进一步用于:

根据所述关键词依次查找不同领域的映射关系,以获取与所述关键词对应的多个领域的推荐信息,所述映射关系包括:关键词与推荐信息之间的对应关系。

优选地,所述推荐信息包括:推荐词和与所述推荐词相关的图片的链接地址。更为优选地,所述推荐信息还包括:所属领域的领域名称。

本实施例所述的装置,可以用于执行上述第二个实施例所述的方法,其原理和技术效果类似,此处不再详述。

在本发明第七个实施例中,参见图9,所述装置进一步包括:建立单元84,用于建立若干预设领域的映射关系。

本实施例所述的装置,可以用于执行上述第三个实施例所述的方法,其原理和技术效果类似,此处不再详述。

在本发明第八个实施例中,参见图10,所述建立单元84,进一步包括:抓取模块841、第一建立模块842、遍历模块843和第二建立模 块844;

所述抓取模块841,用于从网络中抓取不同领域的网页样本;

所述第一建立模块842,用于获取各领域的网页样本中出现频率超过预设阈值的词语,根据获取的词语建立各领域的关键词集合;

所述遍历模块843,用于对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度;

所述第二建立模块844,用于根据获取的关联度确定所述当前关键词集合中各关键词的推荐信息,以建立所述当前关键词集合所属领域的映射关系。

本实施例所述的装置,可以用于执行上述第三个实施例所述的方法,其原理和技术效果类似,此处不再详述。

在本发明第九个实施例中,所述遍历模块843,进一步用于:

对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中各关键词与所述当前关键词集合中的其他关键词在同一网页样本中出现的次数;

根据获取的次数确定所述当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。

本实施例所述的装置,可以用于执行上述第四个实施例所述的方法,其原理和技术效果类似,此处不再详述。

本发明的实施例公开了:

A1、一种推荐信息的获取方法,包括:

接收浏览器发送的针对关键词的推荐信息请求指令,所述推荐信息请求指令中携带有所述浏览器的标识以及所述关键词;

根据所述关键词获取与所述关键词对应的多个领域的推荐信息;

根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领域的推荐信息。

A2、根据A1所述的方法,所述根据所述关键词获取与所述关键词对应的多个领域的推荐信息,进一步包括:

根据所述关键词依次查找不同领域的映射关系,以获取与所述关键词对应的多个领域的推荐信息,所述映射关系包括:关键词与推荐信息之间的对应关系。

A3、根据A2所述的方法,在所述根据所述关键词获取与所述关键词对应的多个领域的推荐信息之前,所述方法进一步包括:

建立若干预设领域的映射关系。

A4、根据A3所述的方法,所述建立若干预设领域的映射关系,进一步包括:

从网络中抓取不同领域的网页样本;

获取各领域的网页样本中出现频率超过预设阈值的词语,根据获取的词语建立各领域的关键词集合;

对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度;

根据获取的关联度确定所述当前关键词集合中各关键词的推荐信息,以建立所述当前关键词集合所属领域的映射关系。

A5、根据A4所述的方法,所述获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度,进一步包括:

获取遍历到的当前关键词集合中各关键词与所述当前关键词集合中的其他关键词在同一网页样本中出现的次数;

根据获取的次数确定所述当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。

A6、根据A1所述的方法,所述推荐信息包括:推荐词和与所述推荐词相关的图片的链接地址。

A7、根据A6所述的方法,所述推荐信息还包括:所属领域的领域名称。

B8、一种推荐信息的获取装置,包括:

接收单元,用于接收浏览器发送的针对关键词的推荐信息请求指令,所述推荐信息请求指令中携带有所述浏览器的标识以及所述关键词;

获取单元,用于根据所述关键词获取与所述关键词对应的多个领域的推荐信息;

发送单元,用于根据所述浏览器的标识将所述多个领域的推荐信息发送给所述浏览器,以使所述浏览器在所述关键词的搜索结果页中展示所述多个领域的推荐信息。

B9、根据B8所述的装置,所述获取单元,进一步用于:

根据所述关键词依次查找不同领域的映射关系,以获取与所述关键词对应的多个领域的推荐信息,所述映射关系包括:关键词与推荐信息之间的对应关系。

B10、根据B9所述的装置,所述装置进一步包括:建立单元,用于建立若干预设领域的映射关系。

B11、根据B10所述的装置,所述建立单元,进一步包括:抓取模块、第一建立模块、遍历模块和第二建立模块;

所述抓取模块,用于从网络中抓取不同领域的网页样本;

所述第一建立模块,用于获取各领域的网页样本中出现频率超过预设阈值的词语,根据获取的词语建立各领域的关键词集合;

所述遍历模块,用于对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度;

所述第二建立模块,用于根据获取的关联度确定所述当前关键词集合中各关键词的推荐信息,以建立所述当前关键词集合所属领域的映射关系。

B12、根据B11所述的装置,所述遍历模块,进一步用于:

对各领域的关键词集合进行遍历,获取遍历到的当前关键词集合 中各关键词与所述当前关键词集合中的其他关键词在同一网页样本中出现的次数;

根据获取的次数确定所述当前关键词集合中的各关键词与所述当前关键词集合中的其他关键词之间的关联度。

B13、根据B8所述的装置,所述推荐信息包括:推荐词和与所述推荐词相关的图片的链接地址。

B14、根据B13所述的装置,所述推荐信息还包括:所属领域的领域名称。

以上实施例仅用于说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1