一种获取信息类别的方法和装置的制造方法

文档序号:9547189阅读:207来源:国知局
一种获取信息类别的方法和装置的制造方法
【技术领域】
[0001]本发明涉及互联网领域,特别涉及一种获取信息类别的方法和装置。
【背景技术】
[0002]随着互联网技术的快速发展,互联网信息呈爆炸式增长,如果能根据用户的兴趣将用户进行群组划分,为同一个群组中的用户推荐用户感兴趣的信息类别对应的信息,能够大大提高信息的点击率;如一个群组的用户感兴趣的信息类别为休闲服装,服务器为该群组内的用户推荐休闲服装的商品信息。因此,如何获取用户感兴趣的信息类别就显得尤为重要。
[0003]目前主要是通过搜索引擎获取用户感兴趣的信息类别,包括:获取用户在一段时间内向搜索引擎输入的关键字,对于用户输入的每个关键字,计算用户输入的该关键字与信息类别和关键字的对应关系中的每个关键字之间的匹配度,选择与用户输入的该关键字之间的匹配度最大的关键字,将选择的关键字对应的信息类别的搜索次数加一;获取在该一段时间内搜索次数最大的预设个数个信息类别,将获取的信息类别作为用户感兴趣的信息类别。
[0004]在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
[0005]大部分用户使用搜索引擎的频率较低,在一段时间内向搜索引擎输入关键字的数目不是很多,甚至小于预设个数,如此导致根据用户输入的关键词得到的用户感兴趣的信息类别的准确度较低。

【发明内容】

[0006]为了解决现有技术的问题,本发明提供了一种获取信息类别的方法和装置。所述技术方案如下:
[0007]—方面,本发明提供了一种获取信息类别的方法,所述方法包括:
[0008]获取用户浏览网页的浏览记录,所述浏览记录至少包括所述用户浏览的网页的网页标识;
[0009]根据所述浏览记录获取所述用户对各信息类别的兴趣度;
[0010]获取兴趣度满足第一预设条件的信息类别,并将所述获取的信息类别作为所述用户感兴趣的信息类别。
[0011]另一方面,本发明提供了一种获取信息类别的方法,所述方法包括:
[0012]获取用户浏览网页的浏览记录,所述浏览记录至少包括所述用户浏览的网页的网页标识;
[0013]根据所述用户浏览的网页的网页标识,获取所述网页对应的第一特征词集合,所述网页对应的第一特征词集合用于存储所述网页包括的特征词;
[0014]根据所述网页对应的第一特征词集合与信息类别和第二特征词集合的对应关系,获取所述网页属于的信息类别;
[0015]统计各信息类别包括的网页数目;
[0016]将所述各信息类别包括的网页数目分别确定为所述用户对所述各信息类别的兴趣度;
[0017]获取兴趣度满足第二预设条件的信息类别,并将所述获取的信息类别作为所述用户感兴趣的信息类别。
[0018]另一方面,本发明提供了一种获取信息类别的装置,所述装置包括:
[0019]第一获取模块,用于获取用户浏览网页的浏览记录,所述浏览记录至少包括所述用户浏览的网页的网页标识;
[0020]第二获取模块,用于根据所述浏览记录获取所述用户对各信息类别的兴趣度;
[0021]第三获取模块,用于获取兴趣度满足第一预设条件的信息类别,并将所述获取的信息类别作为所述用户感兴趣的信息类别。
[0022]另一方面,本发明提供了一种获取信息类别的装置,所述装置包括:
[0023]第四获取模块,用于获取用户浏览网页的浏览记录,所述浏览记录至少包括所述用户浏览的网页的网页标识;
[0024]第五获取模块,用于根据所述用户浏览的网页的网页标识,获取所述网页对应的第一特征词集合,所述网页对应的第一特征词集合用于存储所述网页包括的特征词;
[0025]第六获取模块,用于根据所述网页对应的第一特征词集合与信息类别和第二特征词集合的对应关系,获取所述网页属于的信息类别;
[0026]统计模块,用于统计各信息类别包括的网页数目;
[0027]确定模块,用于将所述各信息类别包括的网页数目分别确定为所述用户对所述各信息类别的兴趣度;
[0028]第七获取模块,用于获取兴趣度满足第二预设条件的信息类别,并将所述获取的信息类别作为所述用户感兴趣的信息类别。
[0029]在本发明实施例中,服务器根据浏览记录获取用户对各信息类别的兴趣度,获取兴趣度满足预设条件的信息类别,并将获取的信息类别作为用户感兴趣的信息类别,从而能够提高获取用户感兴趣的信息类别的准确度。
【附图说明】
[0030]为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0031]图1是本发明实施例1提供的一种获取信息类别的方法流程图;
[0032]图2是本发明实施例2提供的一种获取信息类别的方法流程图;
[0033]图3是本发明实施例3提供的一种获取信息类别的方法流程图;
[0034]图4是本发明实施例4提供的一种获取信息类别的装置结构示意图;
[0035]图5是本发明实施例5提供的一种获取信息类别的装置结构示意图;
[0036]图6是本发明实施例6提供的一种服务器的装置结构示意图。
【具体实施方式】
[0037]为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
[0038]实施例1
[0039]本发明实施例提供了一种获取信息类别的方法。参见图1,其中,该方法包括:
[0040]步骤S101:获取用户浏览网页的浏览记录,该浏览记录至少包括用户浏览的网页的网页标识;
[0041]步骤S102:根据该浏览记录获取用户对各信息类别的兴趣度;
[0042]步骤S103:获取兴趣度满足第一预设条件的信息类别,并将获取的信息类别作为用户感兴趣的信息类别。
[0043]在本发明实施例中,服务器根据浏览记录获取用户对各信息类别的兴趣度,获取兴趣度满足第一预设条件的信息类别,并将获取的信息类别作为用户感兴趣的信息类别,从而能够提高获取用户感兴趣的信息类别的准确度。
[0044]实施例2
[0045]本发明实施例提供了一种获取信息类别的方法。参见图2,其中,该方法包括:
[0046]步骤S201:服务器获取用户浏览网页的浏览记录,该浏览记录至少包括用户浏览的网页的网页标识;
[0047]网页标识可以为网页的URL (Uniform Resoure Locator,统一资源定位器)等。该浏览记录还包括用户浏览网页的时间戳。
[0048]服务器中事先存储用户标识和浏览记录的对应关系,服务器获取用户的用户标识,根据用户的用户标识从用户标识和浏览记录的对应关系中获取用户浏览网页的浏览记录。
[0049]其中,浏览记录中还包括用户浏览网页的时间戳,服务器还可以根据用户浏览网页的时间戳,获取用户在离当前最近且时长为第一预设时长的时间段内用户浏览网页的浏览记录。
[0050]第一预设时长可以根据需要进行设置并更改,如第一预设时长为一个月或者半年等。用户的用户标识为任一可以标识用户的标识,如用户的用户标识为用户对应的终端的GUID(Globally Unique Identifier,全局唯一标识符)等。
[0051]步骤S202:服务器去除重复的网页标识;
[0052]对于相同的网页标识,服务器去除重复的网页标识,并记录网页标识对应的数目。
[0053]步骤S203:服务器根据用户浏览网页的浏览记录,确定用户浏览的网页属于的信息类别;
[0054]其中,信息类别为用户浏览的网页属于的类别,如,信息类别为化妆品或者服装坐寸。
[0055]服务器根据用户浏览网页的浏览记录获取用户浏览的网页的网页标识,根据用户浏览的网页的网页标识确定用户浏览的网页属于的信息类别。
[0056]其中,对于用户浏览的每个网页,可以按照以下步骤⑴至⑷来确定该网页属于的信息类别。
[0057](1)、服务器根据用户浏览的网页的网页标识,获取网页对应的第一特征词集合,第一特征词集合用于存储网页包括的特征词;
[0058]其中,步骤(1)可以包括以下步骤(1-1)至(1-3):
[0059](1-1
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1