文本信息推荐方法、服务器、浏览器及系统的制作方法

文档序号:6503991阅读:135来源:国知局
文本信息推荐方法、服务器、浏览器及系统的制作方法
【专利摘要】本发明涉及一种文本信息推荐方法、服务器、浏览器及系统,其方法包括:当用户访问浏览器网页时,后台服务器根据浏览器发送的访问请求从文本索引池中获取对应的关键词;根据对应的关键词从关键词索引池中获取推荐文本信息列表;将推荐文本信息列表嵌入至当前网页并返回浏览器显示给用户,用户可以根据需要点击关键词获取推荐文本信息列表,从而通过将关键词作为连接用户与网页资讯文本的桥梁,在对原页面不作大幅度修改的情况下,不仅能有效降低信息过载,而且提高了文本信息的推荐效率及有效性,满足用户快速浏览网页的需求。
【专利说明】文本信息推荐方法、服务器、浏览器及系统

【技术领域】
[0001] 本发明涉及互联网【技术领域】,尤其涉及一种基于关键词的文本信息推荐方法、月艮 务器、浏览器及系统。

【背景技术】
[0002] 目前,在网页上给用户推荐相关文本时,通常在文本底部利用人工或自动的方法, 生成与当前文本内容相近的其它文本。
[0003] 现有的这种推荐方法中,在生成相似文本时,由于需要计算新文本与原文本的内 容相似度,随着积累的文本越来越多,系统计算耗时也会越来越长,由此不仅造成信息过 载,而且不利于将新文本及时推荐给用户。
[0004] 另外,现有技术没有选择较为合适的信息维度,从而无法给用户提供关键信息的 订阅功能,进而降低了文本信息的推荐效果。


【发明内容】

[0005] 本发明实施例的主要目的在于提供一种文本信息推荐方法、服务器、浏览器及系 统,旨在提高文本信息的推荐效率及有效性。
[0006] 为了达到上述目的,本发明实施例提出一种文本信息推荐方法,包括:
[0007] 当用户访问浏览器网页时,后台服务器接收来自所述浏览器对当前网页的访问请 求;
[0008] 根据所述访问请求从预先创建的文本索引池中获取对应的关键词;
[0009] 根据所述对应的关键词从预先创建的关键词索引池中获取推荐文本信息列表;
[0010] 将所述推荐文本信息列表嵌入至所述当前网页并返回给所述浏览器,由所述浏览 器显示给用户。
[0011] 本发明实施例还提出一种推荐文本信息的服务器,包括:
[0012] 请求接收模块,用于当用户访问浏览器网页时,接收来自所述浏览器对当前网页 的访问请求;
[0013] 关键词获取模块,用于根据所述访问请求从预先创建的文本索引池中获取对应的 关键词;
[0014] 推荐信息获取模块,用于根据所述对应的关键词从预先创建的关键词索引池中获 取推荐文本信息列表;
[0015] 推荐信息嵌入模块,用于将所述推荐文本信息列表嵌入至所述当前网页并返回给 所述浏览器,由所述浏览器显示给用户。
[0016] 本发明实施例还提出一种推荐文本信息的浏览器,包括:
[0017] 请求发送模块,用于当用户访问浏览器网页时,向后台服务器发送用户对当前网 页的访问请求;
[0018] 显示模块,用于接收所述后台服务器发送的嵌入有推荐文本信息列表的当前网 页,并显示给用户。
[0019] 本发明实施例还提出一种推荐文本信息的系统,包括:浏览器和后台服务器,其 中:
[0020] 所述浏览器,用于当用户访问浏览器网页时,向后台服务器发送用户对当前网页 的访问请求;
[0021] 所述后台服务器,用于接收来自所述浏览器对当前网页的访问请求;根据所述访 问请求从预先创建的文本索引池中获取对应的关键词;根据所述对应的关键词从预先创建 的关键词索引池中获取推荐文本信息列表;将所述推荐文本信息列表嵌入至所述当前网页 并返回给所述浏览器;
[0022] 所述浏览器还用于,接收所述后台服务器发送的嵌入有推荐文本信息列表的当前 网页,并显示给用户。
[0023] 本发明实施例提出的一种文本信息推荐方法、服务器、浏览器及系统,在用户访问 浏览器网页时,后台服务器根据访问请求从文本索引池中获取对应的关键词;根据对应的 关键词从关键词索引池中获取推荐文本信息列表;将推荐文本信息列表嵌入至当前网页并 返回给浏览器显示给用户,用户可以根据需要点击关键词获取推荐文本信息列表,从而通 过将关键词(TAG)作为连接用户与网页资讯文本的桥梁,在对原页面不作大幅度修改的情 况下,不仅能有效降低信息过载,而且提高了文本信息的推荐效率及有效性,满足用户快速 浏览网页的需求。

【专利附图】

【附图说明】
[0024] 图1是本发明文本信息推荐方法第一实施例的流程示意图;
[0025] 图2是本发明实施例中根据访问请求从预先创建的文本索引池中获取对应的关 键词的流程示意图;
[0026] 图3是本发明文本信息推荐方法第二实施例的流程示意图;
[0027] 图4a是本发明实施例中创建文本索引池和关键词索引池的流程示意图;
[0028] 图4b是本发明实施例中一种网页的关键词抽取不例不意图;
[0029] 图5a是本发明文本信息推荐方法第三实施例的流程示意图;
[0030] 图5b是本发明实施例中通过QQ浏览器访问某门户资讯的实例示意图;
[0031] 图5c是用户点击图5b所示的网页中带标识的关键词后的文本推荐信息示意图;
[0032] 图6是本发明推荐文本信息的服务器第一实施例的结构示意图;
[0033] 图7是本发明实施例中关键词获取模块的结构示意图;
[0034] 图8是本发明推荐文本信息的服务器第二实施例的结构示意图;
[0035] 图9是本发明实施例中创建模块的结构示意图;
[0036] 图10是本发明推荐文本信息的服务器第三实施例的结构示意图;
[0037] 图11是本发明推荐文本信息的浏览器较佳实施例的结构示意图;
[0038] 图12是本发明推荐文本信息的系统较佳实施例的结构示意图。
[0039] 为了使本发明的技术方案更加清楚、明了,下面将结合附图作进一步详述。

【具体实施方式】
[0040] 本发明实施例解决方案主要是:在用户访问浏览器网页时,后台服务器根据访问 请求从文本索引池中获取对应的关键词;根据对应的关键词从关键词索引池中获取推荐文 本信息列表;将推荐文本信息列表嵌入至当前网页并返回给浏览器显示给用户,用户可以 根据需要点击关键词获取推荐文本信息列表,从而通过将关键词(TAG)作为连接用户与网 页资讯文本的桥梁,在对原页面不作大幅度修改的情况下,有效降低信息过载,提高文本信 息的推荐效率及有效性。
[0041] 本发明实施例主要是将关键词(TAG)作为连接用户与资讯文本的桥梁,在对原页 面不作大幅度修改的情况下,提供了一种基于关键词的相关文本推荐方案。
[0042] 其中,关键词又可以称TAG、标签等。一般来源于用户给文本的标记或者由程序自 动生成。关键词是对文本主旨内容的一种简洁描述手段,在文本主题抽取、信息组织、用户 兴趣描述等方面应用非常广泛。比如豆瓣的每本书或每个电影都有用户标记的关键词(标 签)、国外流行网站delicious允许用户为其收藏的网页标记关键词(TAG)、目前主流新闻 APP均附带了以关键词(话题)为内容展示维度的功能,比如指阅新闻、Zaker等。因此利用 关键词、通过合理的交互方式将用户与文本联系起来,不仅能有效降低信息过载,还能刻画 用户兴趣,为个性化推荐提供基础。
[0043] 具体地,如图1所示,本发明第一实施例提出一种文本信息推荐方法,包括:
[0044] 步骤S101,当用户访问浏览器网页时,后台服务器接收来自所述浏览器对当前网 页的访问请求;
[0045] 当用户访问浏览器网页时,通过浏览器向后台服务器发送访问请求,以 实现对当前页面的访问,其中,访问请求中包含用户需要访问的当前网页的URL (UniformResourceLocator,统一资源定位符,也被称为网页地址)等信息。
[0046] 步骤S102,根据所述访问请求从预先创建的文本索引池中获取对应的关键词;
[0047] 步骤S103,根据所述对应的关键词从预先创建的关键词索引池中获取推荐文本信 息列表;
[0048] 本实施例中,预先创建有文本索引池和关键词索引池,其中,文本索引池和关键词 索引池保存了从浏览器各历史网页中筛选出来的推荐网页文本的URL与该推荐网页文本 中各关键词的对应关系,其中:
[0049] 文本索引池由Key(文本索引关键字段)和Value(文本索引关键字段的值)组成, 对每一推荐网页文本,以该推荐网页文本的URL为Key(文本索引关键字段),以该推荐网页 文本的关键词为Value(文本索引关键字段的值),对应保存生成所述文本索引池。
[0050] 关键词索引池由Key(文本索引关键字段)和Value(文本索引关键字段的值)组 成,对每一推荐网页文本,以该推荐网页文本的关键词为Key,以该推荐网页文本的URL为 Value,对应保存生成所述关键词索引池。
[0051] 在用户访问浏览器网页时,后台服务器根据该访问请求从预先创建的文本索引池 中获取对应的关键词;然后根据该对应的关键词从预先创建的关键词索引池中获取预定数 目的推荐网页文本的URL,从而得到由多个推荐网页文本的URL组成的推荐文本信息列表。
[0052] 步骤S104,将所述推荐文本信息列表嵌入至所述当前网页并返回给所述浏览器, 由所述浏览器显示给用户。
[0053] 将所述推荐文本信息列表与所述当前网页中对应位置的关键词链接,并对所述对 应位置的关键词进行标识。
[0054] 其中,对对应位置的关键词进行标识的方式包括但不限于以下几种:高亮度显示 所述关键词;或者,以异于关键词相邻字体颜色的其他颜色显示所述关键词;或者,在所述 关键词旁添加设定图标;或者,在所述关键词下添加下划线。
[0055] 用户在访问浏览器显示的当前带有标识的网页时,可以根据自身需要或兴趣点击 当前网页中带有标识的关键词,以获取相应的推荐文本信息,从而可以快速浏览推荐文本。
[0056] 具体地,作为一种实施方式,如图2所示,上述步骤S102 :根据访问请求从预先创 建的文本索引池中获取对应的关键词可以包括:
[0057] 步骤S1021,从所述访问请求中获取所述当前网页的URL;
[0058] 步骤S1022,根据所述当前网页的URL查询所述文本索引池;
[0059] 步骤S1023,当所述文本索引池中包含与所述当前网页的URL对应的关键词时,从 所述文本索引池中获取与所述当前网页的URL对应的关键词。
[0060] 其中,在判断时,若文本索引池中包含与所述当前网页的URL对应的关键词,则 从文本索引池中获取与所述当前网页的URL对应的关键词;否则,退出流程。
[0061] 本实施例通过上述方案,在用户访问浏览器网页时,后台服务器根据访问请求从 文本索引池中获取对应的关键词;根据对应的关键词从关键词索引池中获取推荐文本彳目息 列表;将推荐文本信息列表嵌入至当前网页并返回给浏览器显示给用户,用户可以根据需 要点击关键词获取推荐文本信息列表,从而通过将关键词(TAG)作为连接用户与网页资讯 文本的桥梁,在对原页面不作大幅度修改的情况下,不仅能有效降低信息过载,而且提高了 文本信息的推荐效率及有效性,满足用户快速浏览文本的需求;此外,后台服务器与浏览 器针对用户访问网页的在线响应流程是与用户实时交互,其交互时间短(比如整个流程在 IOms以下),因此响应速度快,不会影响原页面的展现速度。
[0062] 如图3所示,本发明第二实施例提出一种文本信息推荐方法,在上述第一实施例 的基础上,在上述步骤SlOl:所述当用户访问浏览器网页时,后台服务器接收来自浏览器 对当前网页的访问请求之前还包括:
[0063] 步骤S100,创建所述文本索引池和关键词索引池。
[0064] 本实施例与上述第一实施例的区别在于,本实施例还包括创建文本索引池和关键 词索引池的方案,以便后台服务器根据创建的文本索引池和关键词索引池获取推荐文本信 息列表。
[0065] 具体地,作为一种较佳实施方式,如图4a所示,上述步骤SlOO:创建文本索引池和 关键词索引池可以包括:
[0066] 步骤S1001,对浏览器历史网页进行关键词提取;
[0067] 作为一种实施方式,该步骤具体可以包括:对所述浏览器历史网页进行正文抽取; 对抽取的正文进行分词,得到候选关键词;然后统计每个候选关键词的词频及分布参数等 信息,计算每个候选关键词的权重;将权重大于预定阀值的候选关键词作为所述浏览器历 史网页提取出的关键词。
[0068] 其中,预定阀值可以根据实际情况设定。
[0069] 权重计算公式可以为W=TF*D。其中TF是词频,D是关键词在文本的分布参数, 取值可以在0-1之间。
[0070] 如图4b所示,图4b为一种网页的关键词抽取示例。
[0071] 其中,关键词(TAG)为"夏普"、"裁员",两关键词的权重分别为32.24965和 22.75728。
[0072] 步骤S1002,对包含有提取的所述关键词的浏览器历史网页以预定方式进行排序, 取排名靠前的预定数量的浏览器历史网页作为推荐网页文本;
[0073] 通常每个关键词下会有很多文本(一般在数百篇),而推荐给用户时一般只需要其 中优选的几篇(比如5篇文本左右),因此需要对这数百篇按一定方式进行排序,将比较优的 文本推荐给用户。

【权利要求】
1. 一种文本信息推荐方法,其特征在于,包括: 当用户访问浏览器网页时,后台服务器接收来自所述浏览器对当前网页的访问请求; 根据所述访问请求从预先创建的文本索引池中获取对应的关键词; 根据所述对应的关键词从预先创建的关键词索引池中获取推荐文本信息列表; 将所述推荐文本信息列表嵌入至所述当前网页并返回给所述浏览器,由所述浏览器显 示给用户。
2. 根据权利要求1所述的方法,其特征在于,所述根据访问请求从预先创建的文本索 引池中获取对应的关键词的步骤包括: 从所述访问请求中获取所述当前网页的网页地址URL ; 根据所述当前网页的URL查询所述文本索引池; 从所述文本索引池中获取与所述当前网页的URL对应的关键词。
3. 根据权利要求2所述的方法,其特征在于,所述根据当前网页的URL查询所述文本索 引池的步骤之后还包括: 判断所述文本索引池中是否包含与所述当前网页的URL对应的关键词;若包含,则执 行从所述文本索引池中获取与所述当前网页的URL对应的关键词;否则,退出流程。
4. 根据权利要求1所述的方法,其特征在于,所述当用户访问浏览器网页时,后台服务 器接收来自浏览器对当前网页的访问请求的步骤之前还包括: 创建所述文本索引池和关键词索引池。
5. 根据权利要求4所述的方法,其特征在于,所述创建文本索引池和关键词索引池的 步骤包括: 对浏览器历史网页进行关键词提取; 对包含有提取的所述关键词的浏览器历史网页以预定方式进行排序,取排名靠前的预 定数量的浏览器历史网页作为推荐网页文本; 对每一所述推荐网页文本以该推荐网页文本的URL为Key,以该推荐网页文本的关键 词为Value,对应保存生成所述文本索引池;以该推荐网页文本的关键词为Key,以该推荐 网页文本的URL为Value,对应保存生成所述关键词索引池。
6. 根据权利要求5所述的方法,其特征在于,所述对浏览器历史网页进行关键词提取 的步骤包括: 对所述浏览器历史网页进行正文抽取; 对抽取的正文进行分词,得到候选关键词; 统计每个候选关键词的词频及分布参数,计算每个候选关键词的权重; 将权重大于预定阀值的候选关键词作为所述浏览器历史网页提取出的关键词。
7. 根据权利要求5所述的方法,其特征在于,所述对包含有提取的所述关键词的浏览 器历史网页以预定方式进行排序,取排名靠前的预定数量的浏览器历史网页作为推荐网页 文本的步骤包括: 对包含有提取的所述关键词的浏览器历史网页,以点击数及文本更新时间为参数计算 该浏览器历史网页的文本权重; 将文本权重靠前的预定数量的浏览器历史网页作为推荐网页文本。
8. 根据权利要求1-7中任一项所述的方法,其特征在于,所述将推荐文本信息列表嵌 入至所述当前网页并返回给所述浏览器的步骤包括: 将所述推荐文本信息列表与所述当前网页中对应位置的关键词链接,并对所述对应位 置的关键词进行标识。
9. 根据权利要求8所述的方法,其特征在于,对所述对应位置的关键词进行标识的方 式至少包括:高亮度显示所述关键词;或者,以异于关键词相邻字体颜色的其他颜色显示 所述关键词;或者,在所述关键词旁添加设定图标;或者,在所述关键词下添加下划线。
10. 根据权利要求9所述的方法,其特征在于,还包括: 当用户对进行标识后的所述对应位置的关键词进行点击时,将嵌入至所述当前网页的 推荐文本信息列表推送给浏览器显示给用户。
11. 一种推荐文本信息的服务器,其特征在于,包括: 请求接收模块,用于当用户访问浏览器网页时,接收来自所述浏览器对当前网页的访 问请求; 关键词获取模块,用于根据所述访问请求从预先创建的文本索引池中获取对应的关键 词; 推荐信息获取模块,用于根据所述对应的关键词从预先创建的关键词索引池中获取推 荐文本信息列表; 推荐信息嵌入模块,用于将所述推荐文本信息列表嵌入至所述当前网页并返回给所述 浏览器,由所述浏览器显示给用户。
12. 根据权利要求11所述的服务器,其特征在于,所述关键词获取模块包括: URL获取单元,用于从所述访问请求中获取所述当前网页的URL ; 查询单元,用于根据所述当前网页的URL查询所述文本索引池; 关键词获取单元,用于从所述文本索引池中获取与所述当前网页的URL对应的关键 。
13. 根据权利要求12所述的服务器,其特征在于,所述关键词获取模块还包括: 判断单元,用于判断所述文本索引池中是否包含与所述当前网页的URL对应的关键 词;若包含,则由关键词获取单元从所述文本索引池中获取与所述当前网页的URL对应的 关键词。
14. 根据权利要求11所述的服务器,其特征在于,还包括: 创建模块,用于创建所述文本索引池和关键词索引池。
15. 根据权利要求14所述的服务器,其特征在于,所述创建模块包括: 关键词提取单元,用于对浏览器历史网页进行关键词提取; 排序单元,用于对包含有提取的所述关键词的浏览器历史网页以预定方式进行排序, 取排名靠前的预定数量的浏览器历史网页作为推荐网页文本; 映射保存单元,用于对每一所述推荐网页文本以该推荐网页文本的URL为Key,以该推 荐网页文本的关键词为Value,对应保存生成所述文本索引池;以该推荐网页文本的关键 词为Key,以该推荐网页文本的URL为Value,对应保存生成所述关键词索引池。
16. 根据权利要求15所述的服务器,其特征在于,所述关键词提取单元还用于对所述 浏览器历史网页进行正文抽取;对抽取的正文进行分词,得到候选关键词;统计每个候选 关键词的词频及分布参数,计算每个候选关键词的权重;将权重大于预定阀值的候选关键 词作为所述浏览器历史网页提取出的关键词。
17. 根据权利要求15所述的服务器,其特征在于,所述排序单元还用于对包含有提取 的所述关键词的浏览器历史网页,以点击数及文本更新时间为参数计算该浏览器历史网页 的文本权重;将文本权重靠前的预定数量的浏览器历史网页作为推荐网页文本。
18. 根据权利要求11-17中任一项所述的服务器,其特征在于,所述推荐信息嵌入模块 还用于将所述推荐文本信息列表与所述当前网页中对应位置的关键词链接,并对所述对应 位置的关键词进行标识。
19. 根据权利要求18所述的服务器,其特征在于,对所述对应位置的关键词进行标 识的方式至少包括:高亮度显示所述关键词;或者,以异于关键词相邻字体颜色的其他颜 色显示所述关键词;或者,在所述关键词旁添加设定图标;或者,在所述关键词下添加下划 线。
20. 根据权利要求18所述的服务器,其特征在于,还包括: 推送模块,用于当用户对进行标识后的所述对应位置的关键词进行点击时,将嵌入至 所述当前网页的推荐文本信息列表推送给浏览器显示给用户。
21. -种推荐文本信息的浏览器,其特征在于,包括: 请求发送模块,用于当用户访问浏览器网页时,向后台服务器发送用户对当前网页的 访问请求; 显示模块,用于接收所述后台服务器发送的嵌入有推荐文本信息列表的当前网页,并 显示给用户。
22. 根据权利要求21所述的浏览器,其特征在于, 所述显示模块,还用于接收用户对当前网页中进行标识后的对应位置的关键词的点击 指令;根据所述点击指令,将嵌入至所述当前网页的推荐文本信息列表显示给用户。
23. -种推荐文本信息的系统,其特征在于,包括:浏览器和后台服务器,其中: 所述浏览器,用于当用户访问浏览器网页时,向后台服务器发送用户对当前网页的访 问请求; 所述后台服务器,用于接收来自所述浏览器对当前网页的访问请求;根据所述访问请 求从预先创建的文本索引池中获取对应的关键词;根据所述对应的关键词从预先创建的关 键词索引池中获取推荐文本信息列表;将所述推荐文本信息列表嵌入至所述当前网页并返 回给所述浏览器; 所述浏览器还用于,接收所述后台服务器发送的嵌入有推荐文本信息列表的当前网 页,并显示给用户。
24. 根据权利要求23所述的系统,其特征在于, 所述浏览器还用于接收用户对当前网页中进行标识后的对应位置的关键词的点击指 令;根据所述点击指令,将嵌入至所述当前网页的推荐文本信息列表显示给用户。
25. 根据权利要求23所述的系统,其特征在于, 所述后台服务器还用于创建所述文本索引池和关键词索引池。
【文档编号】G06F17/30GK104239298SQ201310223473
【公开日】2014年12月24日 申请日期:2013年6月6日 优先权日:2013年6月6日
【发明者】蔡兵 申请人:腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1