一种热词推荐方法及系统的制作方法

文档序号:6504816阅读:391来源:国知局
一种热词推荐方法及系统的制作方法
【专利摘要】本发明提出了一种热词推荐方法及系统,该推荐方法包括如下步骤:在存储器中存储词汇、始词汇热度和词汇的最近被访问日期;查找初始词汇热度,每天对当天未被访问的词汇计算当前词汇热度,将初始词汇热度的数值更新为当前词汇热度数值;在接收到词汇访问请求时,查找初始词汇热度和最近被访问日期,将初始词汇热度的数值加m,将最近被访问日期更新为当前日期。本发明仅利用初始词汇热度计算当前词汇热度,无需遍历该词所有天的访问记录,能够减少数据库访问量,减少访问记录的存储空间,提高统计速度和系统性能。同时每天对未被访问的词汇的热度采用消融算法进行计算,随着未被访问时间的增长逐渐降低其初始词汇热度,结果更准确。
【专利说明】一种热词推荐方法及系统

【技术领域】
[0001]本发明涉及搜索引擎、网络服务开发【技术领域】,具体涉及一种高效率的热词推荐 方法及系统。

【背景技术】
[0002]在许多网络服务器程序,例如新闻网站、购物网站、搜索网站中,都会统计用户输 入的关键字,用于后期的数据挖掘处理,这样在网站页面上,可以提示用户最热门的检索关 键字排序,用户以更准确,更便利的方式获取最想得到的网站内容。
[0003]在统计并推荐热门词汇(热词)的过程中,由于网站的访问量大,因此具有海量的 关键字,热词的统计方式和统计效率成为整个热词统计技术的瓶颈点。传统的热词统计方 式,是在数据库当中记录每一个词汇,并记录该词汇每天被访问的次数,当在一天内访问多 次时,每次访问都在当天的计数上加 U
[0004]表1.传统的热词存储方式
[0005]
[0006]
[0007]根据表1中热词的存储方式孤右姑

【权利要求】
1. 一种热词推荐方法,其特征在于,包括如下步骤: S1,数据存储:在存储器的词汇存储阵列中存储词汇;在存储器的热度存储阵列中存 储初始词汇热度,每一个词汇的存储地址与其初始词汇热度的存储地址一一对应;在存储 器的日期存储阵列中存储词汇的最近被访问日期,每一个词汇的存储地址与其最近被访问 日期的存储地址 对应; 52, 数据更新:控制器通过词汇存储地址与初始词汇热度存储地址的对应关系查找所 述词汇对应的初始词汇热度,每天对当天未被访问的词汇根据热度消融法计算当前词汇热 度,每个当天未被访问的词汇的词汇热度随该词汇的访问日期间隔天数的增加而减小,将 所述词汇对应的初始词汇热度的数值更新为当前词汇热度数值; 当控制器在接收到通过人机交互界面输入的词汇访问请求时,通过词汇存储地址与 词汇热度存储地址的对应关系,以及词汇存储地址与最近被访问日期存储地址的对应关系 查找所述词汇对应的初始词汇热度和最近被访问日期,将所述词汇对应的初始词汇热度的 数值加 m,如果最近被访问日期不是当前日期,将所述词汇对应的最近被访问日期更新为当 前日期,如果最近被访问日期是当前日期,则不对日期做处理; 53, 数据显示:所述控制器指令人机交互界面对词汇热度高的前设定个数个词汇进行 显不。
2. 如权利要求1所述的热词推荐方法,其特征在于,所述根据热度消融法计算当前词 汇热度的方法为: S21 :计算词汇的间隔日期天数d ; S22:根据词汇被访问的间隔日期天数d确定消融系数,其中,所述消融系数p随访问日 期间隔天数d的增长而梯度递减; 523 :根据公式H=(l-p)*h计算当前词汇热度H,其中,Η为当前词汇热度,p为消融系 数,h为初始词汇热度,d为访问日期间隔天数; 524 :将初始词汇热度h的数值更新为当前词汇热度Η的数值。
3. 如权利要求2所述的热词推荐方法,其特征在于,当d彡1时,ρ为0 ;当7 > d>l时, P 为 1/7,当 30 彡 d>7 时,p 为 1/30,当 183 彡 d>30 时,p 为 1/183,当 365 彡 d>183 时,p 为 1/365,当 d>365, p 为 0。
4. 如权利要求1所述的热词推荐方法,其特征在于,所述m为1。
5. 如权利要求1所述的热词推荐方法,其特征在于,所述设定个数为5。
6. -种热词推荐系统,其特征在于,包括:人机交互界面、控制器和存储器,所述人机 交互界面与所述控制器连接,所述控制器与所述存储器连接; 所述存储器包括存储词汇存储阵列、热度存储阵列和日期存储阵列,在词汇存储阵列 中存储词汇,在热度存储阵列中存储初始词汇热度,每一个词汇的存储地址与其初始词汇 热度的存储地址一一对应;在日期存储阵列中存储词汇的最近被访问日期,每一个词汇的 存储地址与其最近被访问日期的存储地址一一对应; 所述控制器用于:通过词汇存储地址与初始词汇热度存储地址的对应关系查找所述词 汇对应的初始词汇热度,每天对当天未被访问的词汇根据热度消融法计算当前词汇热度, 每个当天未被访问的词汇的词汇热度随该词汇的访问日期间隔天数的增加而减小,将所述 词汇对应的初始词汇热度的数值更新为当前词汇热度数值;当控制器在接收到通过人机交 互界面输入的词汇访问请求时,通过词汇存储地址与词汇热度存储地址的对应关系,以及 词汇存储地址与最近被访问日期存储地址的对应关系查找所述词汇对应的初始词汇热度 和最近被访问日期,将所述词汇对应的初始词汇热度的数值加 m,如果最近被访问日期不是 当前日期,将所述词汇对应的最近被访问日期更新为当前日期,如果最近被访问日期是当 前日期,则不对日期做处理;控制器指令人机交互界面对词汇热度高的前设定个数个词汇 进行显示。
7. 如权利要求6所述的热词推荐系统,其特征在于,所述控制器计算当天未被访问的 词汇的间隔日期天数d,根据词汇被访问的间隔日期天数d确定消融系数,其中,消融系数p 随访问日期间隔天数d的增长而梯度递减,根据公式H= (1-p) *h计算当前词汇热度H,其中, Η为当前词汇热度,p为消融系数,h为初始词汇热度,d为访问日期间隔天数;控制器将初 始词汇热度h的数值更新为当前词汇热度Η的数值。
8. 如权利要求7所述的热词推荐系统,其特征在于,当d彡1时,ρ为0;当73 d>l时, P 为 1/7,当 30 彡 d>7 时,p 为 1/30,当 183 彡 d>30 时,p 为 1/183,当 365 彡 d>183 时,p 为 1/365,当 d>365, p 为 0。
9. 如权利要求6所述的热词推荐系统,其特征在于,所述m为1。
10. 如权利要求6所述的热词推荐系统,其特征在于,所述设定个数为5。
【文档编号】G06F17/30GK104252470SQ201310261220
【公开日】2014年12月31日 申请日期:2013年6月26日 优先权日:2013年6月26日
【发明者】王忻 申请人:重庆新媒农信科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1