推荐网址的方法、装置及系统的制作方法

文档序号:6373140阅读:232来源:国知局
专利名称:推荐网址的方法、装置及系统的制作方法
技术领域
本发明涉及计算机技术领域,特别是涉及推荐网址的方法、装置及系统。
背景技术
随着计算机技术的发展和网联网用户规模的不断扩大,越来越多的互联网用户使用个人计算机通过互联网获得各种各样所需的信息。同时,为互联网用户提供信息服务的网站也越来越多,互联网网页的数量每天都在以惊人的速度增长,互联网信息呈现出爆发式的增长。对于用户来说,经常需要通过一定的手段,才能在浩如烟海的互联网信息中迅速定位最适合自己需求的网站或者需要的信息,比如通过网址导航服务。
网址导航是一个集合较多网址,并按一定条件进行分类的一种网址站,主要为用户提供网址导航服务。网址导航可以使用户不用记忆网站的网址,就能通过网址导航页面提供的链接方便找到自己需要的网站进行浏览和信息检索。同时,现有的网址导航有的还提供了一些比较实用的功能,如号码查询、邮箱登陆、热点新闻、搜索引擎入口等,在一定程度上也为用户的互联网冲浪提供了便利。据统计,目前有相当比例的互联网用户将浏览器的主页设置为网址导航页面,从一个侧面也说明了网址导航服务在实际应用中确实有着方便用户浏览的作用,从而受到了许多用户的欢迎。然而,在现有的网址导航服务技术中,导航内容大多是由网址导航产品的运营维护人员人工推荐的静态页面,虽然页面内容可能设计到许多门类,但相对于互联网上数量巨大并且还在高速增加的信息量而言,网址导航的内容的覆盖面是极其有限的,另外静态页面的单一服务也不能够适应互联网用户个性化浏览的需求。因此,迫切需要本领域技术人员解决的技术问题就在于,提供一种网址导航推荐方法,以针对不同用户提供个性化的网址导航。

发明内容
本发明提供了一种推荐网址的方法、装置及系统,能够在用户浏览导航页面时,为其提供更符合该用户关注的网址,实现了针对不同的用户提供个性化的网址导航。本发明提供了如下方案一种推荐网址的方法,包括获取用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名;获取所述域名访问历史记录中的各个域名分别对应的类别标签;根据所述域名访问历史记录以及所述类别标签,获取目标类别标签;根据所述目标类别标签获取用于推荐的候选域名;基于所述候选域名确定推荐网址;在该用户浏览的导航页面中展现推荐网址。可选的,所述获取用户的域名访问历史记录,包括
接收由客户端上传的域名访问历史记录以及对应的用户标识信息;在该用户浏览的导航页面中展现推荐网址,包括根据所述用户标识信息将所述推荐网址推送给对应的客户端,以便在所述用户标识信息对应的用户浏览的导航页面中展现推荐网址。可选的,所述还包括存储用户标识信息、对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址;所述根据所述用户标识信息将所述推荐网址推送给对应的客户端包括在用户浏览导航页面时,根据客户端上传的用户标识信息,将所述对应于用户标 识信息的目标类别标签,以及对应于用户标识信息的推荐网址,传送给客户端,以便客户端在用户浏览的导航页面中展现所述类别标签,以及推荐网址。可选的,所述获取所述域名访问历史记录中的各个域名分别对应的类别标签,包括根据预先建立的数据库,获取所述域名访问历史记录中的各个域名分别对应的类别标签,所述数据库用于保存域名与标签之间的对应关系;或者,获取所述域名访问历史记录中的各个域名对应的网页信息,通过对所述网页信息进行文本分析,获取各个域名分别对应的类别标签。可选的,所述域名访问历史记录中还包括各个域名对应的访问时间,以及各个域名对应的访问次数;所述根据所述域名访问历史记录以及所述类别标签,获取目标类别标签,包括根据用户访问过的网站的域名、各个域名对应的访问时间以及各个域名对应的访问次数,获取目标类别标签。可选的,所述根据用户访问过的网站的域名、各个域名对应的访问时间以及各个域名对应的访问次数,获取目标类别标签,包括对域名访问历史记录中的各个域名按访问时间由近及远依次递减的方式赋予权值因子,将各个域名对应的访问次数与对应的权值因子的乘积作为各个域名对应的权重,将达到预设权重阈值的域名对应的类别标签,确定为目标类别标签。可选的,所述根据所述目标类别标签获取用于推荐的候选域名,包括 统计该用户对其目标类别标签下的各个域名的访问频度,将访问频度符合预置条件的域名确定为用于推荐的候选域名;和/ 或,统计目标类别标签下的各个域名的全局访问量,将全局访问量符合预置条件的域名确定为用于推荐的候选域名;其中,所述全局访问量为统计过的所有用户的访问量总和;和/ 或,将目标类别标签下的全部域名划分为两个子集,出现在该用户域名访问历史记录中的域名组成第一子集,未出现在该用户域名访问历史记录中的域名组成第二子集;分别计算第二子集中的各个域名与第一子集中的各个域名之间的网站相似度,将第二子集中网站相似度达到预置条件的域名确定为用于推荐的候选域名;和/ 或,将该用户历史推荐结果中点击过的推荐网址确定为用于推荐的候选域名。可选的,所述基于所述候选域名确定推荐网址包括对候选域名进行排序,根据排序结果确定推荐网址。 可选的,所述对候选域名进行排序,根据排序结果确定推荐网址包括根据该用户域名访问历史记录中各个域名对应的访问次数,对候选域名进行排序,将符合预设排名条件的域名作为推荐网址;和/ 或,根据该用户对历史推荐结果中的网址的点击情况,获取该用户对候选域名的偏好得分,将偏好得分符合预置条件的域名作为推荐网址。一种推荐网址的装置,包括记录获取单元,用于获取用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名;域名类别标签获取单元,用于获取所述域名访问历史记录中的各个域名分别对应的类别标签;目标类别标签获取单元,用于根据所述域名访问历史记录以及所述类别标签,获取目标类别标签;候选域名获取单元,用于根据所述目标类别标签获取用于推荐的候选域名;推荐网址确定单元,用于基于所述候选域名确定推荐网址;展示单元,用于在该用户浏览的导航页面中展现推荐网址。可选的,所述域名类别标签获取单元,包括第一域名类别标签获取子单元,用于根据预先建立的数据库,获取所述域名访问历史记录中的各个域名分别对应的类别标签,所述数据库用于保存域名与标签之间的对应关系;或者,第二域名类别标签获取子单元,用于获取所述域名访问历史记录中的各个域名对应的网页信息,通过对所述网页信息进行文本分析,获取各个域名分别对应的类别标签。可选的,所述域名访问历史记录中还包括各个域名对应的访问时间,以及各个域名对应的访问次数;所述目标类别标签获取单元,包括第一目标类别标签获取子单元,用于根据用户访问过的网站的域名、各个域名对应的访问时间以及各个域名对应的访问次数,获取目标类别标签。可选的,所述第一目标类别标签获取子单元,具体用于对域名访问历史记录中的各个域名按访问时间由近及远依次递减的方式赋予权值因子,将各个域名对应的访问次数与对应的权值因子的乘积作为各个域名对应的权重,将达到预设权重阈值的域名对应的类别标签,确定为目标类别标签。可选的,所述候选域名获取单元,包括第一候选域名获取子单元,用于统计该用户对目标类别标签下的各个域名的访问频度,将访问频度符合预置条件的域名确定为用于推荐的候选域名;
和/ 或,第二候选域名获取子单元,用于统计目标类别标签下的各个域名的全局访问量,将全局访问量符合预置条件的域名确定为用于推荐的候选域名;其中,所述全局访问量为统计过的所有用户的访问量总和;和/ 或,第三候选域名获取子单元,用于将目标类别标签下的全部域名划分为两个子集,出现在该用户域名访问历史记录中的域名组成第一子集,未出现在该用户域名访问历史记录中的域名组成第二子集;分别计算第二子集中的各个域名与第一子集中的各个域名之间的网站相似度,将第二子集中网站相似度达到预置条件的域名确定为用于推荐的候选域名;
和/ 或,第四候选域名获取子单元,用于将该用户历史推荐结果中点击过的推荐网址确定为用于推荐的候选域名。可选的,所述推荐网址确定单元包括排序子单元,用于对候选域名进行排序,根据排序结果确定推荐网址。可选的,所述排序子单元具体用于根据该用户域名访问历史记录中各个域名对应的访问次数,对候选域名进行排序,将符合预设排名条件的域名作为推荐网址;和/ 或,根据该用户对历史推荐结果中的网址的点击情况,获取该用户对候选域名的偏好得分,将偏好得分符合预置条件的域名作为推荐网址。一种推荐网址的系统,包括客户端及服务端,其中所述客户端包括信息采集单元,用于采集用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名;第一通信单元,用于将所述域名访问历史记录以及对应的用户标识信息上传到服务器;所述服务端包括域名类别标签获取单元,用于获取所述域名访问历史记录中的各个域名分别对应的类别标签;目标类别标签获取单元,用于根据所述域名访问历史记录以及所述类别标签,获取目标类别标签;候选域名获取单元,用于根据所述目标类别标签获取用于推荐的候选域名;推荐网址确定单元,用于基于所述候选域名确定推荐网址;第二通信单元,用于根据所述用户标识信息将所述推荐网址推送给对应的客户端;所述客户端还包括展现单元,用于在该用户浏览的导航页面中展现推荐网址。可选的,所述服务器端还包括
存储单元,用于存储用户标识信息、对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址;所述第二通信单元具体用于在用户浏览导航页面时,根据客户端上传的用户标识信息,将所述对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址,传送给客户端,以便客户端在用户浏览的导航页面中展现所述类别标签,以及推荐网址。根据本发明提供的具体实施例,本发明公开了以下技术效果通过本发明,可以获取用户的域名访问历史记录,域名访问历史记录中包括该用户访问过的网站的域名;然后获取所述域名访问历史记录中的各个域名分别对应的类别标签,实现了对用户访问过的域名的分类;根据域名访问历史记录以及所述类别标签,可以获取目标类别标签,从而获得了用户更感兴趣的域名的类别;根据目标类别标签获取用于推荐的候选域名,可以使获得的候选域名更加符合用户的兴趣;基于所述候选域名,在该用户浏览的导航页面中展现推荐网址。从而实现了在用户浏览导航页面时,为其提供更符合该 用户兴趣的网址,以及实现了针对不同的用户提供个性化的网址导航。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I是本发明实施例提供的方法的流程图;图2是本发明实施例提供的装置的示意图;图3是本发明实施例提供的系统的示意图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。下面对本发明实施例提供的推荐网址的方法进行详细介绍,参见图1,该方法包括以下步骤SlOl :获取用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名;域名是由一串用点分隔的名字组成的互联网上某一台计算机或计算机组的名称,用于在互联网上数据传输时标识计算机的电子方位,如abc. com。简单的说,域名是计算机或计算机组在互联网上注册的名称,用户可以通过这个注册的名称访问到对应的计算机或计算机组。这个名称可以包含注册者的一些信息,比如公司或组织名称,服务内容等。同时域名还有级别的差异,如上述的abc. com是一个顶级域名,顶级域名由专门的国际组织分配,顶级域名下可以有二级域名、三级域名,如news. abc. com是一个二级域名。一些二级域名,尤其是对于一些商业组织注册的二级域名,通常可以用于区别和突出不同业务板块,反之不同业务板块往往可以通过不同的二级域名反应出来,如上述的news. abc. com可以代表新闻板块,而sports, abc. com可以代表该网站的体育板块。对于用户来说,一个域名通常代表了一个网站,用户浏览的各个网页,则是从此网站的服务器中下载的某个文件夹预置的文件,通过用户浏览网页的网址,可以获得这个网址中所包含的域名信息,例如用户访问的网址为sports, abc. com/foot ball/fifa2010/123. htm,可以得到其中包含的域名sports. abc. com。在本发明实施例提供的方法中,获取用户的域名访问历史记录,其中获取到的域名访问历史记录可以包括用户访问过的网站的域名。此外用户对某个或某类网站的浏览频度,往往可以反映出用户对这个或这类网站偏好程度,所以用户的域名访问历史记录也可以包括对域名进行访问的次数,用来反映用户对某一个网站的偏好程度;另外用户对在近期访问过的域名,往往相对于远期访问过的域名有更高的关注度,所以用户的域名访问历史记录还可以包含访问各个域名的 对应的时间信息。具体在获取用户的域名访问历史记录时,可以由用户的计算机程序来实现,比如由具有域名访问历史记录获取功能的浏览器,在用户浏览网页时记录用户的域名访问历史记录;或者通过具有域名访问历史记录获取功能的浏览器的插件,在用户浏览网页时记录用户的域名访问历史记录;又比如通过具有能够监控用户浏览行为的软件,用户通过浏览器浏览网页时,能够监控到用户浏览的网址信息,并从网址信息中提取出网站的域名,以获得用户的域名访问历史记录。此外,还可以使用客户端/服务器端的方式来实现获取用户的域名访问历史记录,客户端可以是具有域名访问历史记录获取功能的浏览器、浏览器插件、以及其他应用程序,通过客户端来获取用户的域名访问历史记录,并上传到服务器端。具体在客户端来获取用户的域名访问历史记录并上传到服务器端的实现上,可以是由客户端在用户访问网址时,实时地获取用户的域名访问记录并上传至服务器端;也可以在用户访问网址时,将用户的域名访问信息记录为日志文件,并在一定条件下将日志文件上传至服务器端。这里的一定条件,可以是客户端定期地将记录日志文件传送至服务器端,比如客户端每周将日志文件传送至服务器端,也可以是当日志文件达到了一定的磁盘空间占用量,比如每当日志文件达到了 100KB大小,就将日志文件上传至服务器端。为了识别不同的用户,在客户端还可以为每个用户生成一个对应的具有唯一性的用户标识信息,当然,也可以由客户端向服务器端发出一个请求,然后又服务器端为用户分配一个对应的具有唯一性的用户标识信息。客户端在上传用户的域名访问历史记录同时,可以将该用户的标识信息同时上传给服务器端。S102 :获取所述域名访问历史记录中的各个域名分别对应的类别标签;在获得用户的域名访问历史记录后,可以获取用户的域名访问历史记录中的各个域名的类别标签。一个域名的类别标签通常是这个域名下的网页所包含的网页的信息类另IJ,比如sports, abc. com,其下的网页可能包含了各个方面的体育信息,则可以把此域名的类别标签确定为“体育”;又例如fashion, abc. com,其下的网页可能包含了各种时尚潮流的信息,则可以把此域名的类别标签确定为“时尚”。具体在获取域名访问历史记录中的各个域名分别对应的类别标签时,可以预先收集常用的域名,然后采用人工标注等方式给各个域名添加类别标签,并建立数据库,用于保存域名与类别标签之间的对应关系。这样,具体在需要获取某域名的类别标签时,就可以根据该预先建立的保存有预置的域名与标签之间的对应关系的数据库,来确定各个域名分别对应的类别标签,具体的,可以根据域名信息,在上述数据库中进行检索,以获取该域名对应的类别标签;或者,也可以通过获取域名访问历史记录中的各个域名对应的网页中的信息,如网页的标题,正文等内容,通过对网页信息进行文本分析,获取网页中的信息的主题分类,进而获取各个域名分别对应的类别标签。例如,对于sports, abc. com这个域名,假设该域名对应的网页的标题为“abc体育”,则通过该标题就可以分析出该域名的类别标签为“体育”,等等。具体在对网页信 息进行文本分析时,可以通过对网页中的文本信息进行抓取,而后进行分词分析,而如何抓取文本信息以及如何分词分析则可以通过现有技术实现,在此就不再赘述了。S103 :根据所述域名访问历史记录以及所述类别标签,获取目标类别标签;用户对域名访问的历史记录,通常可以反映出用户关注程度比较高的是哪种类别的信息,比如一个用户如果经常访问体育类的网站,可以反映出该用户对体育类信息有较高的关注度。而用户访问的域名的类别,可以通过用户访问的各个域名的类别标签体现出来。可以根据域名访问历史记录以及域名的类别标签,得到用户关注度更高的域名类别,即用户更感兴趣的目标类别标签。用户的域名访问历史记录中,可以除了用户访问过的网站域名,还可以包括可以反映用户对域名关注程度的信息,如各个域名对应的访问时间、访问次数等。可以根据用户访问过的网站域名,可以反映用户对域名关注程度的信息,如各个域名对应的访问时间、访问次数等,以及用户访问域名对应的类别标签来确定用户刚兴趣的类别标签。具体在根据用户域名访问历史记录,以及用户访问域名对应的类别标签来确定目标类别标签时,可以根据每个标签下用户访问域名的总次数来确定目标类别标签,用户在某个类别标签下访问的域名的总次数比较多,一般可以说明用户在对此类信息拥有较高的关注度,因此,可以将代表此类域名类别的类别标签确定为用户感兴趣的目标类别标签。具体的可以将域名访问总次数比较多的前几位的类别标签作为用户感兴趣的目标类别标签,也可以预设一个阈值,将域名访问总次数达到预设阈值的类别标签作为用户感兴趣的目标类别标签。另外还可以根据用户对类别标签下各个域名的访问时间来确定用户感兴趣的目标类别标签,因为用户对在近期访问过的域名,往往相对于远期访问过的域名有更高的关注度。具体的,可以是对域名访问历史记录中的各个域名按访问时间由近及远依次递减的方式赋予权值因子,将各个域名对应的访问次数与对应的权值因子的乘积作为各个域名对应的权重,将达到预设权重阈值的域名对应的类别标签,确定为目标类别标签。例如,假设域名访问历史记录中的信息是用户从6月I日到6月30日的访问记录,则可以为6月I日的权值因子设置为1,6月2日设置为2,6月3日设置为3,以此类推,6月30日设置为30,然后再将用域名的访问次数乘以对应的权值因子,就可以得到域名的权重。例如,某个域名sports, abc. com的访问时间是6月10日,对应的权值因子是10,访问次数是10次,则最终计算出的权重是100 ;另一个域名yule. abc. com的访问时间是6月20日,对应的权值因子是20,访问次数是8次,则最终计算出的权重是160。可见,虽然用户对sports, abc. com的访问次数略多于对yule. abc. com的访问次数,但最终计算出的权重,前者却略低于后者。
需要说明的是,前述对权值因子的举例介绍仅仅是为了便于理解而进行的介绍,在实际应用中可以根据实际的需求来设定权值因子的大小,此外,也不一定是以天为单位进行递增或递减,例如还可以是以小时等为单位,等等。另外需要说明的是,域名访问历史记录中记录的信息中,一个域名对应的访问次数可能有多次,此时,域名对应的访问时间可以是最后一次访问时的时间。S104 :根据所述目标类别标签获取用于推荐的候选域名;目标类别标签一般是用户感兴趣的类别标签,可以反映出该用户关注度比较高的域名类别,因此,可以将根据目标类别标签获取用于推荐的候选域名。具体实现时,可以有以下实现方式I)统计该用户对目标类别标签下的各个域名的访问频度,将访问频度符合预置条件的域名确定为用于推荐的候选域名。其中的域名是用户曾经访问过的域名,用户对这个或这些域名的访问频度,在一定程度上反映了用户对这个或这些域名的偏好程度,也就是说,可以将用户经常访问的域名作为用于推荐的候选域名。2)统计目标类别标签下的各个域名的全局访问量,将全局访问量符合预置条件的域名确定为用于推荐的候选域名。其中,全局访问量为统计过的所有用户的访问量总和。相对互联网浩如烟海的信息,每个用户能访问到的信息量是非常有限的,在向用户推荐网址时,可以考虑将某一类别标签下全局访问量符合一定预置条件的域名作为候选域名,为用户提供更多的选择。具体实现时,可以分别统计出各个域名的全局访问量(也即将统计过的所有用户对该域名的访问次数相加),在针对某用户进行推荐时,在确定了目标类别标签之后,在数据库中找到该类别标签下的所有域名,然后将目标类别标签下全局访问量比较大的域名,确定为用于推荐的候选域名。例如,用户甲感兴趣的目标类别标签包括“体育”,在数据库中,“体育”类别下包括有域名I、域名2、域名3等等,其中,域名I和域名2可能并不是该用户甲访问过的域名,但是这两个域名的全局访问量比较大,则就可以作为用于推荐的候选域名。3)将目标类别标签下的全部域名划分为两个子集,出现在该用户域名访问历史记录中的域名组成第一子集,未出现在该用户域名访问历史记录中的域名组成第二子集;分别计算第二子集中的各个域名与第一子集中的各个域名之间的网站相似度,将第二子集中网站相似度达到预置条件的域名确定为用于推荐的候选域名。与上述第二种方法类似,在选择用于推荐的候选域名时,同样基于用户感兴趣的目标类别标签下的全部域名进行确定,但是选择的依据不再是各个域名的全局访问量,而是用户未访问过的域名与访问过的域名在网站内容上的相似度。也就是说,如果一个域名与另一个域名具有相同的类别标签,而如果用户曾经访问过其中的一个域名,则该用户访问另一个域名的几率也会比较大,因此,也可以作为用于推荐的候选域名。其中,网站相似度的计算方法可以与已有技术中的相同,这里不再赘述。关于预置条件,可以是预先设定相似度阈值,如果大于该阈值,就可以用于推荐,等等。4)将该用户历史推荐结果中点击过的推荐网址确定为用于推荐的候选域名。在实际应用中,在确定了推荐结果之后,会在网页中某相对固定的区域向用户进行展现,供用户进行点击。如果用户在历史推荐结果中点击推荐网址,说明在一定程度上,历史推荐网址满足了用户的需要,所以可以将用户在历史推荐结果中点击过的网址继续作为用于推荐的候选域名。另外还可以结合应用以上实现方式中的其中几种,以使用于推荐的候选域名更加符合用户的兴趣关注。S105 :基于所述候选域名确定推荐网址;通过以上步骤获得的候选域名是用户更有关注倾向进而访问的域名,可以在用户浏览的导航页面作为推荐网址展现给用户。导航页面的展示区域通常是有限的,因此,可以在导航页面为用户滚动展示全部候选域名;此外还可以先对候选域名做进一步的排序,将排序后的结果展示给用户,以更好的满足用户的需要。具体对候选域名进行排序并向用户展示排序后的结果时,可以根据该用户域名访问历史记录中各个域名对应的访问次数,对候选域名进行排序,将符合预设排名条件的域名作为推荐网址向该用户展示;还可以根据该用户对历史推荐结果中的网址的点击情况,获取该用户对候选域名的偏好得分,将偏好得分符合预置条件的域名作为推荐网址向用户展示;以及结合使用上述的两种方法,以使导航页面中展示的推荐网址,更加契合用户的兴趣。在向用户展现推荐网址的同时,可以把推荐网址对应的域名所属的类别标签同时展示给用户,以便用户更好的浏览感兴趣的网址。当然,在上述几种排序方式中,由于仅考虑了当前用户的访问情况和/或在推荐结果中的点击情况这两个因素,因此,如果仅将据此进行排序后排在前面的几个域名推荐给用户,则可能会使得用户没有访问过而全局访问量比较大、或者与用户访问过的域名具有很高的网站相似度的网站得不到被推荐的机会,因此,在实际应用中,还可以在推荐结果展现区域中预留出一块区域,用于展现前述用户之前未访问过、但用户也很可能会感兴趣的域名,以此来扩大推荐的范围。S106 :在该用户浏览的导航页面中展现推荐网址。在获得了用于向该用户推荐的网址之后,就可以在用户浏览的导航页面中展现这种推荐网址。也即,用户可以在导航页面中看到一个区域,其中展现的内容是根据用户的访问历史为该用户推荐的网址,换言之,不同的用户在浏览器同一个网址导航页面时,该区域中网址可能是不同的,从而体现出在不同用户之间的个性化。 在具体实现时,前述步骤SlOl至S105的执行主体可以是客户端的应用程序,也即,单独由客户端程序来实现本发明实施例提供的上述技术方案,当然,需要用到的数据库等可以预先保存在客户端本地,并且还可以通过服务器对数据库进行更新等等。或者,还可以使用客户端/服务器端的方式来实现本发明实施例提供的方法。此时,可以由客户端对用户的域名访问情况进行采集,然后上传到服务器端,由服务器端进行进一步的分析计算,确定出用户感兴趣的目标类别标签,以及用于向用户推荐的候选域名等等,然后再推送给客户端,由客户端展现给用户。当然,由于同一个服务器端一般会对应着多个客户端,因此,服务器端需要对不同的客户端上传的信息进行区分,此时,客户端在上传域名访问记录的同时,还上传用户标识信息,这样,服务器端可以根据客户端上传的用户标识信息来区分不同的用户,在用户标识信息对应的用户浏览的导航页面中展现推荐网址。服务器端还可以将用户标识信息、对应于用户标识信息的用户感兴趣的目标类别标签,以及对应于用户标识信息的推荐网址等信息存储起来,在用户浏览导航页面时,根据客户端上传的用户标识信息,将对应于用户标识信息的用户感兴趣的目标类别标签,以及对应于用户标识信息的推荐网址,传送给客户端,以便客户端在用户浏览的导航页面中展现类别标签,以及推荐网址。其中,关于用户标识信息,可以是用户在安装客户端程序时,自动为用户生成的ID信息,这种ID —般都具有唯一性,因此,客户端在上传用户标识信息时,就可以上传该I D信息。当然,还可以是用户的IP地址,或者在已登录的情况下用户的账户信息,等等。总之,通过本发明实施例提供的上述方法,可以获取用户的域名访问历史记录,域名访问历史记录中包括该用户访问过的网站的域名;然后获取所述域名访问历史记录中的各个域名分别对应的类别标签,实现了对用户访问过的域名的分类;根据域名访问历史记录以及所述类别标签,可以获取目标类别标签,从而获得了用户更感兴趣的域名的类别;根据目标类别标签获取用于推荐的候选域名,可以使获 得的候选域名更加符合用户的兴趣关注;基于所述候选域名,在该用户浏览的导航页面中展现推荐网址。从而实现了在用户浏览导航页面时,为其提供更符合该用户兴趣关注的网址,以及实现了针对不同的用户提供个性化的网址导航。与本发明实施例提供的推荐网址的方法相对应,本发明实施例还提供了一种推荐网址的装置,参见图2,该装置具体可以包括记录获取单元201,用于获取用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名;域名类别标签获取单元202,用于获取所述域名访问历史记录中的各个域名分别对应的类别标签;目标类别标签获取单元203,用于根据所述域名访问历史记录以及所述类别标签,获取目标类别标签;候选域名获取单元204,用于根据所述目标类别标签获取用于推荐的候选域名;推荐网址确定单元205,用于基于所述候选域名确定推荐网址;展示单元206,用于在该用户浏览的导航页面中展现推荐网址。所述域名类别标签获取单元202,可以包括第一域名类别标签获取子单元,用于根据预先建立的数据库,获取所述域名访问历史记录中的各个域名分别对应的类别标签,所述数据库用于保存域名与标签之间的对应关系;或者,第二域名类别标签获取子单元,用于获取所述域名访问历史记录中的各个域名对应的网页信息,通过对所述网页信息进行文本分析,获取各个域名分别对应的类别标签。域名访问历史记录中还可以包括各个域名对应的访问时间,以及各个域名对应的访问次数;此时目标类别标签获取单元203可以包括第一目标类别标签获取子单元,用于根据用户访问过的网站的域名、各个域名对应的访问时间以及各个域名对应的访问次数,获取目标类别标签。这里,第一目标类别标签获取子单元,具体可以用于对域名访问历史记录中的各个域名按访问时间由近及远依次递减的方式赋予权值因子,将各个域名对应的访问次数与对应的权值因子的乘积作为各个域名对应的权重,将达到预设权重阈值的域名对应的类别标签,确定为目标类别标签。候选域名获取单元204,可以包括第一候选域名获取子单元,用于统计该用户对目标类别标签下的各个域名的访问频度,将访问频度符合预置条件的域名确定为用于推荐的候选域名;和/ 或,第二候选域名获取子单元,用于统计目标类别标签下的各个域名的全局访问量,将全局访问量符合预置条件的域名确定为用于推荐的候选域名;其中,所述全局访问量为统计过的所有用户的访问量总和;和/ 或,第三候选域名获取子单元,用于将目标类别标签下的全部域名划分为两个子集,出现在该用户域名访问历史记录中的域名组成第一子集,未出现在该用户域名访问历史记录中的域名组成第二子集;分别计算第二子集中的各个域名与第一子集中的各个域名之间的网站相似度,将第二子集中网站相似度达到预置条件的域名确定为用于推荐的候选域 名;和/ 或,第四候选域名获取子单元,用于将该用户历史推荐结果中点击过的推荐网址确定为用于推荐的候选域名。为了给用户展示经过优选的域名,推荐网址确定单元205可以包括排序子单元,用于对候选域名进行排序,根据排序结果确定推荐网址。排序子单元具体可以用于根据该用户域名访问历史记录中各个域名对应的访问次数,对候选域名进行排序,将符合预设排名条件的域名作为推荐网址向该用户展示;和/ 或,根据该用户对历史推荐结果中的网址的点击情况,获取该用户对候选域名的偏好得分,将偏好得分符合预置条件的域名作为推荐网址向用户展示。总之,通过本发明实施例提供的上述装置,可以获取用户的域名访问历史记录,域名访问历史记录中包括该用户访问过的网站的域名;然后获取所述域名访问历史记录中的各个域名分别对应的类别标签,实现了对用户访问过的域名的分类;根据域名访问历史记录以及所述类别标签,可以获取目标类别标签,从而获得了用户更感兴趣的域名的类别;根据目标类别标签获取用于推荐的候选域名,可以使获得的候选域名更加符合用户的兴趣关注;基于所述候选域名,在该用户浏览的导航页面中展现推荐网址。从而实现了在用户浏览导航页面时,为其提供更符合该用户兴趣关注的网址,以及实现了针对不同的用户提供个性化的网址导航。另外,与本发明实施例提供的上述推荐网址的方法及装置相对应,本发明实施例还提供了一种推荐网址的系统,参见图3,该系统包括客户端301及服务器端302,其中客户端301包括信息采集单元3011,用于采集用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名;第一通信单元3012,用于将所述域名访问历史记录以及对应的用户标识信息上传到服务器;所述服务端302包括域名类别标签获取单元3021,用于获取所述域名访问历史记录中的各个域名分别对应的类别标签;目标类别标签获取单元3022,用于根据所述域名访问历史记录以及所述类别标签,获取目标类别标签;候选域名获取单元3023,用于根据所述目标类别标签获取用于推荐的候选域名;推荐网址确定单元3024,用于基于所述候选域名确定推荐网址;第二通信单元3025,用于根据所述用户标识信息将所述推荐网址推送给对应的客户端; 所述客户端301还包括展现单元3013,用于在该用户浏览的导航页面中展现推荐网址。在实际应用中,所述服务器端302还可以包括存储单元,用于存储用户标识信息、对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址;此时,所述第二通信单元3024具体用于在用户浏览导航页面时,根据客户端上传的用户标识信息,将所述对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址,传送给客户端,以便客户端在用户浏览的导航页面中展现所述类别标签,以及推荐网址。通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如R0M/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上对本发明所提供的推荐网址的方法、装置及系统,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1.一种推荐网址的方法,其特征在于,包括 获取用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名; 获取所述域名访问历史记录中的各个域名分别对应的类别标签; 根据所述域名访问历史记录以及所述类别标签,获取目标类别标签; 根据所述目标类别标签获取用于推荐的候选域名; 基于所述候选域名确定推荐网址; 在该用户浏览的导航页面中展现推荐网址。
2.根据权利要求I所述的方法,其特征在于,所述获取用户的域名访问历史记录,包括 接收由客户端上传的域名访问历史记录以及对应的用户标识信息; 在该用户浏览的导航页面中展现推荐网址,包括 根据所述用户标识信息将所述推荐网址推送给对应的客户端,以便在所述用户标识信息对应的用户浏览的导航页面中展现推荐网址。
3.根据权利要求2所述的方法,其特征在于,所述还包括 存储用户标识信息、对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址; 所述根据所述用户标识信息将所述推荐网址推送给对应的客户端包括 在用户浏览导航页面时,根据客户端上传的用户标识信息,将所述对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址,传送给客户端,以便客户端在用户浏览的导航页面中展现所述类别标签,以及推荐网址。
4.根据权利要求I至3任一项所述的方法,其特征在于,所述获取所述域名访问历史记录中的各个域名分别对应的类别标签,包括 根据预先建立的数据库,获取所述域名访问历史记录中的各个域名分别对应的类别标签,所述数据库用于保存域名与标签之间的对应关系; 或者, 获取所述域名访问历史记录中的各个域名对应的网页信息,通过对所述网页信息进行文本分析,获取各个域名分别对应的类别标签。
5.根据权利要求I至3任一项所述的方法,其特征在于,所述域名访问历史记录中还包括各个域名对应的访问时间,以及各个域名对应的访问次数;所述根据所述域名访问历史记录以及所述类别标签,获取目标类别标签,包括 根据用户访问过的网站的域名、各个域名对应的访问时间以及各个域名对应的访问次数,获取目标类别标签。
6.根据权利要求5所述的方法,其特征在于,所述根据用户访问过的网站的域名、各个域名对应的访问时间以及各个域名对应的访问次数,获取目标类别标签,包括 对域名访问历史记录中的各个域名按访问时间由近及远依次递减的方式赋予权值因子,将各个域名对应的访问次数与对应的权值因子的乘积作为各个域名对应的权重,将达到预设权重阈值的域名对应的类别标签,确定为目标类别标签。
7.根据权利要求I至3任一项所述的方法,其特征在于,所述根据所述目标类别标签获取用于推荐的候选域名,包括 统计该用户对其目标类别标签下的各个域名的访问频度,将访问频度符合预置条件的域名确定为用于推荐的候选域名; 和/或, 统计目标类别标签下的各个域名的全局访问量,将全局访问量符合预置条件的域名确定为用于推荐的候选域名;其中,所述全局访问量为统计过的所有用户的访问量总和; 和/或, 将目标类别标签下的全部域名划分为两个子集,出现在该用户域名访问历史记录中的域名组成第一子集,未出现在该用户域名访问历史记录中的域名组成第二子集;分别计算第二子集中的各个域名与第一子集中的各个域名之间的网站相似度,将第二子集中网站相似度达到预置条件的域名确定为用于推荐的候选域名; 和/或, 将该用户历史推荐结果中点击过的推荐网址确定为用于推荐的候选域名。
8.根据权利要求I至3任一项所述的方法,其特征在于,所述基于所述候选域名确定推荐网址包括 对候选域名进行排序,根据排序结果确定推荐网址。
9.根据权利要求8所述的方法,其特征在于,所述对候选域名进行排序,根据排序结果确定推荐网址包括 根据该用户域名访问历史记录中各个域名对应的访问次数,对候选域名进行排序,将符合预设排名条件的域名作为推荐网址; 和/或, 根据该用户对历史推荐结果中的网址的点击情况,获取该用户对候选域名的偏好得分,将偏好得分符合预置条件的域名作为推荐网址。
10.一种推荐网址的装置,其特征在于,包括 记录获取单元,用于获取用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名; 域名类别标签获取单元,用于获取所述域名访问历史记录中的各个域名分别对应的类别标签; 目标类别标签获取单元,用于根据所述域名访问历史记录以及所述类别标签,获取目标类别标签; 候选域名获取单元,用于根据所述目标类别标签获取用于推荐的候选域名; 推荐网址确定单元,用于基于所述候选域名确定推荐网址; 展示单元,用于在该用户浏览的导航页面中展现推荐网址。
11.根据权利要求10所述的装置,其特征在于,所述域名类别标签获取单元,包括 第一域名类别标签获取子单元,用于根据预先建立的数据库,获取所述域名访问历史记录中的各个域名分别对应的类别标签,所述数据库用于保存域名与标签之间的对应关系; 或者,第二域名类别标签获取子单元,用于获取所述域名访问历史记录中的各个域名对应的网页信息,通过对所述网页信息进行文本分析,获取各个域名分别对应的类别标签。
12.根据权利要求10所述的装置,其特征在于,所述域名访问历史记录中还包括各个域名对应的访问时间,以及各个域名对应的访问次数;所述目标类别标签获取单元,包括 第一目标类别标签获取子単元,用于根据用户访问过的网站的域名、各个域名对应的访问时间以及各个域名对应的访问次数,获取目标类别标签。
13.根据权利要求12所述的装置,其特征在于,所述第一目标类别标签获取子単元,具体用于对域名访问历史记录中的各个域名按访问时间由近及远依次递减的方式赋予权值因子,将各个域名对应的访问次数与对应的权值因子的乘积作为各个域名对应的权重,将达到预设权重阈值的域名对应的类别标签,确定为目标类别标签。
14.根据权利要求10所述的装置,其特征在于,所述候选域名获取单元,包括第一候选域名获取子単元,用于统计该用户对目标类别标签下的各个域名的访问频度,将访问频度符合预置条件的域名确定为用于推荐的候选域名; 和/或, 第二候选域名获取子単元,用于统计目标类别标签下的各个域名的全局访问量,将全局访问量符合预置条件的域名确定为用于推荐的候选域名;其中,所述全局访问量为统计过的所有用户的访问量总和; 和/或, 第三候选域名获取子単元,用于将目标类别标签下的全部域名划分为两个子集,出现在该用户域名访问历史记录中的域名组成第一子集,未出现在该用户域名访问历史记录中的域名组成第二子集;分别计算第二子集中的各个域名与第一子集中的各个域名之间的网站相似度,将第ニ子集中网站相似度达到预置条件的域名确定为用于推荐的候选域名;和/或, 第四候选域名获取子単元,用于将该用户历史推荐结果中点击过的推荐网址确定为用于推荐的候选域名。
15.根据权利要求10所述的装置,其特征在于,所述推荐网址确定单元包括 排序子単元,用于对候选域名进行排序,根据排序结果确定推荐网址。
16.根据权利要求15所述的装置,其特征在于,所述排序子単元具体用于 根据该用户域名访问历史记录中各个域名对应的访问次数,对候选域名进行排序,将符合预设排名条件的域名作为推荐网址; 和/或, 根据该用户对历史推荐结果中的网址的点击情况,获取该用户对候选域名的偏好得分,将偏好得分符合预置条件的域名作为推荐网址。
17.ー种推荐网址的系统,其特征在于,包括客户端及服务端,其中 所述客户端包括 信息采集单元,用于采集用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名; 第一通信単元,用于将所述域名访问历史记录以及对应的用户标识信息上传到服务 器; 所述服务端包括域名类别标签获取单元,用于获取所述域名访问历史记录中的各个域名分别对应的类别标签; 目标类别标签获取单元,用于根据所述域名访问历史记录以及所述类别标签,获取目标类别标签; 候选域名获取单元,用于根据所述目标类别标签获取用于推荐的候选域名; 推荐网址确定单元,用于基于所述候选域名确定推荐网址; 第二通信单元,用于根据所述用户标识信息将所述推荐网址推送给对应的客户端; 所述客户端还包括 展现单元,用于在该用户浏览的导航页面中展现推荐网址。
18.根据权利要求17所述的系统,其特征在于,所述服务器端还包括 存储单元,用于存储用户标识信息、对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址; 所述第二通信单元具体用于在用户浏览导航页面时,根据客户端上传的用户标识信息,将所述对应于用户标识信息的目标类别标签,以及对应于用户标识信息的推荐网址,传送给客户端,以便客户端在用户浏览的导航页面中展现所述类别标签,以及推荐网址。
全文摘要
本发明公开了推荐网址的方法、装置及系统,其中,所述方法包括获取用户的域名访问历史记录;所述域名访问历史记录中包括该用户访问过的网站的域名;获取所述域名访问历史记录中的各个域名分别对应的类别标签;根据所述域名访问历史记录以及所述类别标签,获取目标类别标签;根据所述目标类别标签获取用于推荐的候选域名;基于所述候选域名确定推荐网址;在该用户浏览的导航页面中展现推荐网址。通过本发明,可以在用户浏览导航页面时,为其提供更符合用户兴趣关注的网址,实现了针对不同的用户提供个性化的网址导航。
文档编号G06F17/30GK102799662SQ201210239708
公开日2012年11月28日 申请日期2012年7月10日 优先权日2012年7月10日
发明者刘鎏, 秦吉胜, 常富洋, 周浩 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1