1.一种结合多数据源的热词推荐方法,其包括:
筛选搜索引擎数据库中的榜单数据;
将筛选得到的榜单数据与搜索日志数据做交集,获取数据交集中的热词及热词对应的页面浏览量;
提取所述页面浏览量排行在预定阈值前对应的热词;
当客户端新启动时,从提取的热词中选取预定条数的热词推送给客户端进行显示。
2.根据权利要求1所述的方法,其中,在所述提取所述页面浏览量排行在预定阈值前对应的热词之后,所述方法还包括:根据热词对应的页面浏览量,计算所述热词对应的权重。
3.根据权利要求2所述的方法,其中,所述计算热词对应的权重值为log(页面浏览量)/log2。
4.根据权利要求2或3所述的方法,其中,所述从提取的热词中选取预定条数的热词推送给客户端进行显示进一步包括:按照热词对应的权重,利用权重随机算法从提取的热词中选取预定条数的热词推送给客户端进行显示。
5.根据权利要求1-4任一项所述的方法,其中,所述筛选搜索引擎数据库中的榜单数据进一步包括:筛选搜索引擎数据库中的电影、电视剧、综艺、动漫、人物以及小说的榜单数据。
6.一种结合多数据源的热词推荐装置,其包括:
筛选模块,适于筛选搜索引擎数据库中的榜单数据;
交集模块,适于将筛选得到的榜单数据与搜索日志数据做交集,获取数据交集中的热词及热词对应的页面浏览量;
提取模块,适于提取所述页面浏览量排行在预定阈值前对应的热词;
推送模块,适于当客户端新启动时,从提取的热词中选取预定条数的热词推送给客户端进行显示。
7.根据权利要求6所述的装置,其中,还包括:计算模块,适于根据热词对应的页面浏览量,计算所述热词对应的权重。
8.根据权利要求7所述的装置,其中,所述计算模块进一步适于:计算热词对应的权重值为log(页面浏览量)/log2。
9.根据权利要求6或7所述的装置,其中,所述推送模块进一步适于:按照热词对应的权重,利用权重随机算法从提取的热词中选取预定条数的热词推送给客户端进行显示。
10.根据权利要求6-9任一项所述的装置,其中,所述筛选模块进一步适于:筛选搜索引擎数据库中的电影、电视剧、综艺、动漫、人物以及小说的榜单数据。