一种呈现浏览器主体内容的方法

文档序号:9929579阅读:500来源:国知局
一种呈现浏览器主体内容的方法
【技术领域】
[0001]本发明涉及互联网领域,尤其涉及一种呈现浏览器主体内容的方法。
【背景技术】
[0002]随着互联网科技的快速发展,通过网页浏览新闻等消息已经成了现代人生活中不可或缺的信息传输途径。
[0003]现有浏览网页时,通常是将获取的网页内容直接按照网页的默认设置展示,而,默认设置的字体和图片等内容有可能不能使阅读者获取良好的阅读感。在文章主要内容外存在大量广告等干扰内容,无法专注于阅读,同时需要手动操作才能阅读后续页面;而且很多网页没有进行移动端优化,在移动端展示效果很差,阅读区域过小,需要手动放大内容来回移动才能完整阅读,无法有很好阅读体验。尽管在现有技术中存在网页全屏浏览的技术,但无法兼容任意网页,只能对特定的网站页面有着良好的支持,当页面数多于两页时,需手动操作才能进入下一页的加载,导致全屏阅读应用效果差。

【发明内容】

[0004]本发明的目的在于提供一种呈现浏览器主体内容的方法,从而解决现有技术中存在的前述问题。
[0005]为了实现上述目的,本发明所述呈现浏览器主体内容的方法,该方法包括:
[0006]SI,分析加载成功的页面,判断页面中是否存在表示页面内容的候选节点;如果是,则进入S2;如果否,则仍保持当前界面的阅读状态;
[0007]S2,获取候选节点的评分,选择评分最高的候选节点A作为所述页面的主要内容,然后,根据所述候选节点A中的文本、图片和视频的占比,选择相应的阅读模式;
[0008]S3,获取所述页面的主要内容标题;
[0009 ] S4,将所述主要内容标题和所述页面的主要内容进行全屏展示。
[0010]优选地,所述表示页面内容的候选节点按照下述方法获取:
[0011]Al,提取表示主要内容的标签节点;所述标签节点包括:BODY、DIV、TD、P、PRE、D、SPAN、STRONG和ARTICLE;
[0012]A2,删除父级元素节点内容为菜单、标题和页脚的节点,然后再删除宽及高小于宽及高阈值的节点,得到一级备用节点组;
[0013]A3,通过一级备用节点组中任意一个节点所包含的文本数量W和其标志性属性的权重值,获得该节点的初始评分;
[0014]A4,按照初始评分从高到低将一级备用节点排序,得到二级备用节点组;
[0015]A5,判断二级备用节点组任意一个节点中Unicode编码字符是否是中文、日文或韩文,如果是,则将该节点的初始评分乘以3,得到该节点评分;如果否,则将该节点的初始评分直接作为本轮计算的该节点评分;然后删除节点评分小于节点评分阈值的节点,得到三级备用节点组;
[0016]A6,计算三级备用节点中每个节点的面积,然后删除节点面积小于面积阈值的节点,得到四级备用节点组;
[0017]A7,将每个节点中文本的文字字体大小与预先设定的字体大小对比,得到相应的字体权重值C,将四级备用节点组每个节点的节点评分乘以字体权重值C最为该节点的最终评分;
[0018]然后删除最终评分小于最终评分阈值的节点,得到五级备用节点组;
[0019]AS,从五级备用节点组中去除水平线和/或标题占比大于占比阈值的节点,得到候选节点。
[0020]更优选地,步骤A3具体按照下述方法实现:
[0021]获取一级备用节点组中任意一个节点所包含的文本数量W和其标志性属性;
[0022]判断所述标志性属性是加分属性还是减分属性,如果标志性属性Q是加分属性,则将W X α最为该节点的初始评分;如果标志性属性组合Q是加分属性,则将W X β最为该节点的初始评分;
[0023]所述α是加分权重值,所述β是减分权重值;所述加分属性包括article、entry、post、main 和 content;所述减分属性包括:foot、header、list、menu、rss、sidebar 和sponsor。
[0024]更优选地,步骤A6具体按照下述步骤实现:
[0025]获取三级备用节点组中任意一个三级备用节点的总面积;
[0026]获取所述三级备用节点中包括的非文字区的面积;
[0027]将所述三级备用节点的总面积与所述非文字区的面积做差,得到所述三级备用节点的面积。
[0028]更优选地,步骤A7,具体按照下述步骤实现:
[0029]获取四级备用节点组中任意一个四级备用节点的文本,获得所述文本中字体的平均大小,判断所述字体的平均大小与12镑的大小关系;
[0030]如果所述字体的平均大小大于12镑,则所述文本的字体权重值C>1;
[0031]如果所述字体的平均大小等于12镑,则所述文本的字体权重值C=I;
[0032]如果所述字体的平均大小小于12镑,则所述文本的字体权重值C<I;
[0033]将所述三级备用节点组中每个节点的节点评分与该节点的文本的字体权重值做乘,得到该节点的最终评分。
[0034]更优选地,步骤S2中,所述根据所述候选节点A中的文本、图片和视频的占比,选择相应的阅读模式,具体为:
[0035]获取候选节点中文本、图片和视频的占比;
[0036]如果图片或视频的面积占比之和大于90%,则选择图片或影片放映模式;
[0037]如果图片或视频的面积占比之和小于等于90%,则选择纯文本阅读模式。
[0038]优选地,步骤S3,具体按照下述步骤实现:
[0039]获取距离所述候选节点外边框预设像素内的标题节点;
[0040]计算所述标题节点中的标题文本在所述页面的标题中出现的频率;
[0041 ]将出现频率最高的标题文本作为所述阅读模式的标题。
[0042]优选地,步骤S4,所述全屏展示具体按照下述实现:
[0043]建立全屏阅读区,所述全屏阅读区覆盖所述页面;
[0044]将所述主要内容标题和所述页面的主要内容进行格式化处理后加载到全屏阅读区,完成全屏展示;
[0045]所述格式化处理包括:去除不可见的或文本大小小于阈值的元素,去除非文本和/或非图片和/或非视频,调整字体、颜色、文本宽度。
[0046]优选地,在步骤S4之后还包括以下步骤:
[0047]S5,判断全屏展示时滚动条的位置是否小于预先设定的高度阈值,如果小于,则进入S6;如果不小于,则继续判断;
[0048]S6,加载并展示下一页,直到接收到退出全屏展示的请求;
[0049]S7,删除全屏阅读区,并根据全屏阅读区上滚动条所在位置,跳转到所述页面上与所述位置内容相同的区域。
[0050]更优选地,步骤S6中所述加载并展示下一页,具体按照下述步骤实现:
[0051 ] BI,查找下一页节点,具体为:
[0052]将与所述候选节点A连接的且在所述页面与所述候选节点A属于上、下分布的候选节点作为初选节点;判断所述初选节点中是否包括下一页提示节点;
[0053]如果是,进入B2;
[0054]如果否,判断是否能筛选出与所述候选节点A的URL的前序路径相同且路径最尾端编号相比增加最少的URL,如果是,则保存查找到的URL,进入B2;如果否,则判断所述候选节点A的父节点文本中是否包括的下一页提示节点,如果是,进入B2;如果否,则继续判断是否能筛选出与所述候选节点A的父节点的URL的前序路径相同且路径最尾端编号相比增加最少的URL,如果是,保存查找到的URL,进入B2;如果否,则结束;
[0055]B2,打开所述下一页提示节点指向的URL或直接打开保存的URL,然后依次进行S1、S2找出主要内容;
[0056]B3,将找出的主要内容拼接在当前全屏阅读内容的尾端。
[0057]本发明的有益效果是:
[0058]本发明根据页面内容,使用智能算法分析页面,提取文章主体部分及标题,分析需加载页面的内容是以文字还是图片为主体,然后根据主体的不同,将需要加载的主体内容加载相应阅读模式中。去除页面中无关的广告等干扰内容,让用户沉静在阅读中,同时非常适合在移动和PC端展示,让未为移动
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1