浏览器智能阅读实现方法、装置及其终端的制作方法

文档序号:8258524阅读:381来源:国知局
浏览器智能阅读实现方法、装置及其终端的制作方法
【技术领域】
[0001]本发明涉及浏览器技术领域,具体而言,涉及一种浏览器智能阅读实现方法、装置及其终端。
【背景技术】
[0002]随着无线通讯技术和互联网技术的飞速发展,目前在移动终端(例如,智能手机)上采用浏览器上网的用户也越来越多。
[0003]为了提高用户的浏览器使用体验,各设备或方案提供商针对浏览器的各项功能也提出了多种改进方案,其中之一的阅读模式便是用于方便用户浏览多页新闻或者小说类网页而提出的一种浏览器附加功能。通过该阅读模式功能,浏览器可以自动将具有多页的新闻或小说类网页的正文内容拼接在一起,以供用户轻松地浏览,从而帮助用户省去了频繁翻页的操作,并且无需用户长时间多频次的等待下页加载的过程。
[0004]然而,本发明的发明人经研究发现,当前在浏览器上实现上述阅读模式,主要还存在以下一些问题亟待解决:
[0005]第一、现有的浏览器支持的阅读模式只是简单地通过搜索“下一页”等类似的文本标签,并基于这些文本标签来查找该网页之后下页的链接地址。但在实际情况之下,此类文本标签在当前网页中可能不止存在一个,也有可能存在较多的类似标签,因此容易导致错找或漏找真实的下页链接地址,以致无法正确地加载下页内容。
[0006]第二、现有的浏览器支持的阅读模式在提取下页的正文内容时,往往都是提取整个网页的内容,例如其加载的内容同时还包括该当前页面以前/以后节点的所有节点内容。
[0007]除此之外,该现有技术在提取已加载的页面的正文内容时,对于各个页面中重复的部分往往会重复提取,一则加大了处理能力的开销,二则一定程度上影响了用户的阅读体验。

【发明内容】

[0008]为了解决上述现有技术中的至少一个问题,本发明实施例的目的在于提供一种浏览器智能阅读实现方法、装置及其终端,其通过对比候选下页标签的链接地址与当前页面的连接地址的相似度智能判别并准确地检索到下文页面的链接地址,从而提取下页页面的正文内容并拼接,从而可以极大地提高用户的阅读体验。
[0009]为了达到本发明的目的,本发明采用以下技术方案实现:
[0010]一种浏览器智能阅读实现方法,包括:
[0011]依据预先设置在当前页面中检索候选下页标签的链接信息,并选择与当前页面链接信息相似度最大的候选下页标签作为真实下页标签;
[0012]依据所述真实下页标签的链接信息预加载下页页面;
[0013]获得下页页面的正文内容并将其拼接至该当前页面。
[0014]优选地,所述预先设置为至少一个下页加载鉴别符或自动触发加载策略,所述下页加载鉴别符至少定义了通过预定手势触发下页页面预加载或通过垂直滚动条的位置触发下页页面预加载,所述自动触发加载策略定义了至少一种通过预先配置的触发规则自动触发下页页面预加载。
[0015]优选地,所述通过预定手势触发下页页面预加载包括:
[0016]检测与触敏屏的接触;
[0017]当所述接触的轨迹延伸方向符合预定手势时,即触发下页页面预加载。
[0018]优选地,所述通过垂直滚动条的位置触发下页页面预加载包括:
[0019]检测垂直滚动条的当前位置;
[0020]当所述当前位置与预定的触发位置相匹配时,即触发下页页面预加载。
[0021]优选地,从候选下页标签中选择真实下页标签包括:
[0022]检索当前页面中所有候选下页标签的链接信息;
[0023]采用以下数学式计算各候选下页标签的链接信息与当前页面链接信息的相似度S:
[0024]S=T/N,其中,T为各候选下页标签的链接信息与当前页面链接信息在相同位置上具有相同字符的个数,所述N为当前页面链接信息的字符个数;
[0025]选取相似度最大且超出预定阈值的候选下页标签作为真实下页标签。
[0026]优选地,依据所述真实下页标签的链接信息获得下页页面的正文内容包括:
[0027]分别获取在文档对象模型DOM树中当前页面以及真实下页页面的所有的节点集合,并将真实下页页面中与当前页面属性相同的节点予以滤除;
[0028]计算真实下页页面之中余下节点所包含正文的长度,并将正文长度最长的节点作为该真实下页页面的正文节点,并依据该正文节点获取下页页面的正文内容。
[0029]一种浏览器智能阅读实现装置,其包括:
[0030]触发检索模块,用于依据预先设置在当前页面中检索候选下页标签的链接信息;
[0031]主控模块,用于在候选下页标签中选择与当前页面链接信息相似度最大的候选下页标签作为真实下页标签;
[0032]网页预加载模块,用于依据所述真实下页标签的链接信息预加载下页页面;
[0033]正文提取模块,用于获得下页页面的正文内容;
[0034]内容拼接模块,用于将所述下页页面的正文内容拼接至该当前页面。
[0035]优选地,所述预先设置为至少一个下页加载鉴别符或自动触发加载策略,所述下页加载鉴别符至少定义了通过预定手势触发下页页面预加载或通过垂直滚动条的位置触发下页页面预加载,所述自动触发加载策略定义了至少一种通过预先配置的触发规则自动触发下页页面预加载。
[0036]优选地,所述触发检索模块包括:
[0037]第一检测模块,用于检测与触敏屏的接触;
[0038]第一触发模块,用于当所述接触的轨迹延伸方向符合预定手势时,即触发下页页面加载。
[0039]优选地,所述触发检索模块包括:
[0040]第二检测模块,用于检测垂直滚动条的当前位置;
[0041]第二触发模块,用于当所述当前位置与预定的触发位置相匹配时,即触发下页页面预加载。
[0042]优选地,所述主控模块包括:
[0043]检索模块,用于检索当前页面中所有候选下页标签的链接信息;
[0044]计算模块,用于采用以下数学式计算各候选下页标签的链接信息与当前页面链接信息的相似度S:
[0045]S=T/N,其中,T为各候选下页标签的链接信息与当前页面链接信息在相同位置上具有相同字符的个数,所述N为当前页面链接信息的字符个数;
[0046]判断模块,用于选取相似度最大且超出预定阈值的候选下页标签作为真实下页标签。
[0047]优选地,所述正文提取模块包括:
[0048]过滤模块,用于分别获取在文档对象模型DOM树中当前页面以及真实下页页面的所有的节点集合,并将真实下页页面中与当前页面属性相同的节点予以滤除;
[0049]提取模块,用于计算真实下页页面之中余下节点所包含正文的长度,并将正文长度最长的节点作为该真实下页页面的正文节点,并依据该正文节点获取下页页面的正文内容。
[0050]一种终端,其包括如上所述的浏览器智能阅读实现装置,所述装置包括:
[0051]触发检索模块,用于依据预先设置在当前页面中检索候选下页标签的链接信息;
[0052]主控模块,用于在候选下页标签中选择与当前页面链接信息相似度最大的候选下页标签作为真实下页标签;
[0053]网页预加载模块,用于依据所述真实下页标签的链接信息预加载下页
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1