网页自动调整方法和系统的制作方法

文档序号：6605160阅读：166来源：国知局

专利名称：：网页自动调整方法和系统的制作方法
技术领域：
：本发明总体上涉及对网页进行处理的方法和系统，特别的本发明涉及对网页页面进行自动调整的方法和系统。
背景技术：
：浏览网页中的字体大小以及图片的大小是由字体缺省尺寸决定的。字体的缺省尺寸在一定范围内是用户可调的。但是用户只能整体放大或者缩小网页中的字体大小，而无法针对网页中的某个特定区域进行调整。图IA中示出了维基百科(Wikipedia)网站中一个有关现实增强技术(Augmentedreality)的网页截屏，在这个网页中整体字体较小。当用户希望获得更好的视觉效果时，可以通过调整字体大小而放大网页中的内容。图IB中示出了对图IA中的网页进行放大后的网页截屏。从图IB中可以看出，网页整体被进行了放大，包括左边的面板框架(panelframe)、中间的内容框架(contentframe)以及上面的头框架(headframe)，并且内容框架中的文字和图片被同时放大了。
发明内容实际应用中，用户由于视力问题或显示屏幕尺寸受限，可能经常需要对网页进行调整。而用户对于网页内容的关注往往集中在部分区域(block)而不是全部区域，比如对于图IA中的网页而言，有些用户可能更关心内容框架中的文字部分，有些用户可能更关心内容框架中的图片部分。如果对网页的内容进行整体放大，可能将用户根本不关心的内容也放大了，从而浪费了屏幕资源，影响了用户的视觉体验。这一问题对于显示屏目较小的显示器(比如尺寸较小的笔记本或者手机)而言尤为突出。对于这类显示器，如果以同样比例的尺寸显示网页中的所有内容，可能使得有限的屏幕资源无法得到真正有效的利用，并且用户需要不断的拖动屏幕右边的滚动条才能全面浏览其需要看到的所有内容。现有技术中存在一些对网页中的部分内容进行操纵的方法。例如公开号为US2007/0130525A1的美国专利申请。在这一专利申请中，首先分析和分割网页中的区域，区域被划分之后，再由用户手动选取感兴趣的区域，而后浏览器重新绘制用户感兴趣的区域使其适合屏幕尺寸(比如放大、形变、卷动和漂浮等)。然而该方案给用户对网页的访问带来额外的操作流程，用户需要手动的选取感兴趣的区域，这使得用户的浏览方式受到干扰，必然会给用户体验带来负面影响。本发明提出了一种自动的对网页进行调整的方案。在本发明的方案中，用户无需对感兴趣的区域进行手动选择，本发明可以自动学习用户历史浏览行为从而预测出用户待浏览的网页中哪个区域可能是用户比较关注的区域，并且对这一区域的显示进行调整(比如进行字体放大)。应用本发明，在用户浏览网页时，有限的屏幕资源可以被更加有效的用来显示用户所关心的内容。具体而言，本发明提供一种网页自动调整方法，包括获得已浏览网页，对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域，记录所述已浏览网页的实际焦点区域的焦点特征，获得目标网页，按照所述焦点特征预测所述目标网页的潜在焦点区域，以及调整所述目标网页的显示。本发明还提供一种网页自动调整系统，包括已浏览网页获得装置，用于获得已浏览网页，分析装置，用于对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域，记录装置，用于记录所述已浏览网页的实际焦点区域的焦点特征，目标网页获得装置，用于获得目标网页，预测装置，用于按照所述焦点特征预测所述目标网页的潜在焦点区域，以及调整装置，用于调整所述目标网页的显示。本说明中所参考的附图只用于示例本发明的典型实施例，不应该认为是对本发明范围的限制。图IA示出了维基百科网站中一个有关现实增强技术的网页截屏。图IB示出了对图IA中的网页进行放大后的网页截屏。图2示出了网页自动调整方法的流程图。图3示出了按照本发明的一个实施例的经分割的已浏览网页示意图。图4A示出了按照本发明的一个实施例的经分割的目标网页示意图。图4B示出了按照本发明的一个实施例的对焦点区域进行放大的目标网页示意图。图4C示出了按照本发明的一个实施例的对焦点区域进行放大而对非焦点区域进行缩小的目标网页示意图。图4D示出了按照本发明的一个实施例的对焦点区域进行放大并且对网页布局进行重排的目标网页示意图。图5示出了网页自动调整系统的框图。具体实施例方式下列讨论中，提供大量具体的细节以帮助彻底了解本发明。然而，很显然对于本领域技术人员来说，即使没有这些具体细节，并不影响对本发明的理解。并且应该认识到，使用如下的任何具体术语仅仅是为了方便描述，因此，本发明不应当局限于只用在这样的术语所表示和/或暗示的任何特定应用中。本发明提出了一种自动的对网页进行调整的方案。在本发明的方案中，用户无需对感兴趣的区域进行手动选择，本发明可以自动学习用户历史浏览行为从而预测出用户待浏览的网页中哪个区域可能是用户比较关注的区域，并且对这一区域的显示进行调整(比如进行字体放大)。应用本发明，在用户浏览网页时，有限的屏幕资源可以被更加有效的用来显示用户所关心的内容。图2示出了网页自动调整方法的流程图。在步骤201中获得已浏览网页。本发明根据用户浏览历史进行学习自动获得用户关注的区域，因此需要首先获得用户已浏览的网页。按照本发明的一种实施例，可以将已浏览网页分割成多个区域。对网页进行分区可以借助网页的源代码进行。网页的源代码可以是HTML代码、XML代码或者其它结构化或半结构化语言。图3示出了按照本发明的一个实施例的经分割的已浏览网页示意图。从图中可以看出该网页被分割为7个区域(Block)。HTML代码中存在很多标记符，这些标记符号控制显示的效果。同时网页中的每块内容在HTML代码中都是以层级的方式展现出来的。比如在图3所示的网页中，该网页被分割为头元素〈headX/head〉和体元素<body></body〉。在体元素中又包含很多其它元素，比如标记符为<divid="mw-head-base“>的DIV元素对应于图3中:3B2，标记符为<divid=‘‘mw-panel">的DIV元素对应于图中的3B1，标记符为<divid=〃bodyContent">的DIV元素对应于图中的虚线框中的内容。进一步，标记符为<divid=“bodyContent">的DIV元素中，标记符为<hlid=〃firstHeading">的元素对应于图中的!3B3，标记符为<h3id=〃siteSub〃>W7ΠSIST15ΦW3B4,feid#%<tableclass="metadataplainlinksamboxambox-style">的元素对应于图中的3B5，标记符为Edgedetectionisa...</p>的元素对应于图中的3B6，标记符为〈tableclass=“infobox">的元素对应于图中的3B7。本发明对网页进行分割的粒度没有特别的限定。图3仅仅是示例性的展示网页的一种分割方案。实际上本发明还可以采用更加细粒度或更加粗粒度的分割方案。HTML代码可以被视为一种树状结构。该树状结构中的每个元素可以被视为一个节点。本发明中网页被分割的区域即可以是树状结构中的叶子节点也可以是树状结构中的非叶子节点，即可以仅代表树状结构中的一个节点也可以代表树状结构中的多个节点的组合。回到图2，在步骤203中对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域。通过识别实际焦点区域可以确定用户通常情况下在类似版面中关注的区域的位置。比如如果用户通常情况下比较关注内容中的文字部分，则图3中的区域3B6可能是用户的实际焦点区域；如果用户通常情况下比较关注内容中的图片部分，则图3中的;3B7可能是用户的实际焦点区域。在一些相对简单的网页中，比如类似于图3这样的网页中，用户关注的焦点区域可能比较集中，即可能大部分用户会比较关注文字部分。但是在一些复杂的网页当中，用户关注的焦点区域可能就相对分散。也就是说各个用户可能关注不同的区域。比如网站http://asia.wsj.com/home-page的结构就相对复杂，不同用户关注的区域可能有所不同，有的用户可能更加关注右边股市的消息，有的用户可能更加关注左边的头条新闻，有的用户可能比较关注中间的新闻列表。识别实际焦点区域可以通过区域位置、区域大小、鼠标状态以及浏览记录中的一项或多项进行判断。按照本发明的一个实施例，对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域包括至少基于下列各项中的一项或多项对所述已浏览网页中的区域进行打分区域位置分数S1、区域大小分数s2、鼠标状态分数s3、以及浏览记录分数S^O其中所述区域位置是指某一区域在网页中的绝对位置。也就是说，无论该区域是否被用户所浏览其位置是不变的。比如就图3中的网页而言，可以将网页划分为横⑴竖(Y)坐标系，坐标系的原点是整个网页的左上角，将某个区域的左上角的位置视为该区域的位置，即用该区域的左上角在横坐标中和纵坐标中的象素数来表示该区域的位置，比如区域3B6的位置为X=30，Y=50。假设当前处理的焦点区域为targetObj，在Javascript语言中，可以通过函数targetObj.χ获得该区域左上角的横坐标X，并且通过targetObj.y6获得该区域左上角的纵坐标Y。区域位置分数5工可以基于区域的位置进行设定。在一个实施例中可以先分别根据一个区域的左上角的横坐标和纵坐标计算横坐标分数Slx和纵坐标分数sly。如果假设一个网页的上半部分将会受到比下半部分更多的关注，并且一个网页的右半部份将会受到比左半部分更多的关注，更具体而言假设经验值表明网页的Y=100象素，及X=60象素的位置往往是最受关注的位置。那么可以利用各种数学函数(比如高斯函数)设计一些位置分数模型，使得某区域的Y值坐标离100越近，Sly分数越高，离100越远，Sly分数越低；X值坐标离60越近，Slx分数越高，离60越远，Slx分数越低。然后对这Slx和Sly进行如公式1中的加权求和，最后再对加权求和后的分数进行归一化处理使其限定为0到1间的一个数作为区域位置分数Si。公式1:S1=WxXSlx+ffyXSly在其它实施例中，也可以以一个区域的右上角、左下角、右下角、中心位置等的横竖坐标来表示该区域的位置。区域的大小指某一区域在网页中的绝对大小。也就是说，无论该区域是否被用户所浏览，也无论用户浏览时使用的浏览窗口大小，区域的大小是不变的。在Javascript语言中，可以通过targetObj.width函数获得一个区域的宽度，并且可以通过targetObj.height函数获得一个区域的高度。在本发明的一个实施例中，假设区域越大，被关注的可能性就越大，区域大小分数&也就越大。同样，也可以对&进行归一化处理使其限定为0到1间的一个数作为区域大小分数&。鼠标的状态是指鼠标在某一区域上发生的动作，其可以是鼠标点击、鼠标停留、鼠标选中中的一个或多个。其中鼠标点击的动作可以通过document,onclick函数获得、鼠标停留的时间可以通过event.clientX和event.clientY来计算、鼠标选中的动作可以通过document,selection.createRange().text函数结合document.onMouseUp函数获得。假设认为对于一个区域而言，如果鼠标点击的次数越多，该区域就越受关注；鼠标在该区域的停留时间越长，该区域就越受关注；或者鼠标在该区域中进行选中动作的时间越长或次数越多，该区域就越受关注。按照本发明的一个实施例，鼠标的状态分数&是对鼠标点击分数&。、鼠标停留分数S3P、鼠标选中分数S3s的加权求和(如下面公式2所示)。同样，也可以对&进行归一化处理使其限定为0到1间的一个数作为鼠标状态分数&。公式2S3=WcXS3c+ffpXS3p+ffsXS3s有时候在某些区域上虽然没有发生鼠标点击、鼠标停留或者鼠标选中的动作，但是该区域也出现在用户的浏览窗口内，则可以认为这样的区域也是用户所关注的区域。浏览记录表示某一区域是否出现在用户的浏览窗口内，以及如果出现在浏览窗口内，那么出现的位置是否是受用户所关注的位置。要想获得某一区域的浏览记录，首先要获得浏览窗口的位置°可以通过document,body.scrollTop函数以及document,body.scrollLeft函数计算浏览窗口的左上角相对网页的位置，再通过window,width函数和window,height函数获得浏览窗口的大小，从而计算出浏览窗口相对于整个网页所处的位置以及所占的面积。按照本发明中的一种实施例，可以假设如果某一区域中有越多的面积出现在浏览窗口内，该区域被关注的可能性就越大；并且如果某一区域的位置越靠近浏览窗口的右下角，该区域被关注的可能性就越大。该区域被关注的可能性越大，浏览记录分数、就越高。同样，也可以对、进行归一化处理使其限定为0到1间的一个数作为浏览记录分数、。本发明仅以区域位置分数S1、区域大小分数S2、鼠标状态分数S3、以及浏览记录分数、为例进行说明，但是除了Si、S2、S3、以及、以外，本发明还可以在其它实施例中根据实际需要应用更多的分数。并且本发明也不仅限于上述提到的计算Si、S2,S3、以及、的建模方式，在实际应用中可以根据实际需要采用各种模型以确定Si、S2、S3、以及、的值。得到SpS2,S3,以及、的值后可以通过下述公式3计算一个区域的总焦点分数权利要求1.一种网页自动调整方法，包括获得已浏览网页；对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域；记录所述已浏览网页的实际焦点区域的焦点特征；获得目标网页；按照所述焦点特征预测所述目标网页的潜在焦点区域；以及调整所述目标网页的显示。2.一种如权利要求1所述的方法，进一步包括将所述已浏览网页分割成多个区域；以及将所述目标网页分割成多个区域。3.—种如权利要求1所述的方法，其中对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域包括至少基于下列各项中的一项或多项对所述已浏览网页中的区域进行打分区域位置分数、区域大小分数、鼠标状态分数、以及浏览记录分数。4.一种如权利要求1-3中任意一项所述的方法，其中通过下述公式计算一个区域的总焦点分数TS(Bk)=^iwi*Si)i=l其中，指第k个区域，TS(Bk)指第k个区域的总焦点分数,Si指第k个区域的第i项焦点分数，Wi指第k个区域的第i项焦点分数的权重，N指计算所述总焦点分数所依赖的各项焦点分数的项数。5.一种如权利要求1所述的方法，其中所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小，并且其中按照所述焦点特征预测所述目标网页的潜在焦点区域包括识别所述目标网页中与所述实际焦点区域在所述已浏览网页中的位置和大小的相似度大于预定阈值的区域作为潜在焦点区域。6.一种如权利要求1或5所述的方法，其中所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域的主题，并且其中按照所述焦点特征预测所述目标网页的潜在焦点区域包括识别所述目标网页中与所述实际焦点区域的主题的相似度大于预定阈值的区域作为潜在焦点区域。7.—种如权利要求1所述的方法，其中所述目标网页为被请求的网页中与所述已浏览网页近似度超过一定阈值的网页，并且所述方法进一步包括从下述各项中的至少一项判断所述被请求的网页是否与所述已浏览网页近似度超过一定阈值网页布局、网页主题、网页类型、网页URL。8.—种如权利要求1所述的方法，其中所述调整所述目标网页的显示包括放大所述潜在焦点区域的内容。9.一种如权利要求1所述的方法，进一步包括预测所述目标网页的潜在非焦点区域，并且所述调整所述目标网页的显示包括缩小所述目标网页的潜在非焦点区域的内容。10.一种如权利要求1所述的方法，其中调整所述目标网页的显示包括对所述目标网页的布局进行重排。11.一种如权利要求1所述的方法，其中所述已浏览网页与所述目标网页是由同一用户所请求的。12.—种如权利要求1所述的方法，其中所述已浏览网页与所述目标网页是由不同用户所请求的。13.一种网页自动调整系统，包括已浏览网页获得装置，用于获得已浏览网页；分析装置，用于对所述已浏览网页进行分析以识别所述已浏览网页中的实际焦点区域；记录装置，用于记录所述已浏览网页的实际焦点区域的焦点特征；目标网页获得装置，用于获得目标网页；预测装置，用于按照所述焦点特征预测所述目标网页的潜在焦点区域；以及调整装置，用于调整所述目标网页的显示。14.一种如权利要求13所述的系统，进一步包括已浏览网页分割装置，用于将所述已浏览网页分割成多个区域；以及目标网页分割装置，用于将所述目标网页分割成多个区域。15.一种如权利要求13所述的系统，其中所述分析装置进一步用于至少基于下列各项中的一项或多项对所述已浏览网页中的区域进行打分区域位置分数、区域大小分数、鼠标状态分数、以及浏览记录分数。16.一种如权利要求13所述的系统，其中所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域在所述已浏览网页中的位置和所述实际焦点区域的大小，并且其中所述预测装置进一步用于识别所述目标网页中与所述实际焦点区域在所述已浏览网页中的位置和大小的相似度大于预定阈值的区域作为潜在焦点区域。17.—种如权利要求13或16所述的系统，其中所述已浏览网页的实际焦点区域的焦点特征包括所述实际焦点区域的主题，并且其中所述预测装置进一步用于识别所述目标网页中与所述实际焦点区域的主题的相似度大于预定阈值的区域作为潜在焦点区域。18.—种如权利要求13所述的系统，其中所述目标网页为被请求的网页中与所述已浏览网页近似度超过一定阈值的网页，并且所述系统进一步包括判断装置，用于从下述各项中的至少一项判断所述被请求的网页是否与所述已浏览网页近似度超过一定阈值网页布局、网页主题、网页类型、网页URL。19.一种如权利要求13所述的系统，其中所述调整装置进一步用于放大所述目标网页的潜在焦点区域的内容。全文摘要本发明提出了一种自动的对网页进行调整的方案。在本发明的方案中，用户无需对感兴趣的区域进行手动选择，本发明可以自动学习用户历史浏览行为从而预测出用户待浏览的网页中哪个区域可能是用户比较关注的区域，并且对这一区域的显示进行调整。应用本发明，在用户浏览网页时，有限的屏幕资源可以被更加有效的用来显示用户所关心的内容。文档编号G06F17/30GK102314436SQ20101021608公开日2012年1月11日申请日期2010年6月30日优先权日2010年6月30日发明者包胜华,王栋,田春华,苏中,陈健申请人:国际商业机器公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：包胜华;陈健;王栋;苏中;田春华
技术所有人：国际商业机器公司
我是此专利的发明人

上一篇：权限查询方法和装置的制作方法
上一篇：加速器及其实现支持虚拟机迁移的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。