获取网页质量数据的方法和浏览器及服务器的制作方法

文档序号:6379881阅读:148来源:国知局
专利名称:获取网页质量数据的方法和浏览器及服务器的制作方法
技术领域
本发明涉及数据处理技术领域,具体地涉及一种网页质量数据获取方法和系统。
技术背景
万维网联盟(World Wide Web Consortium,缩写W3C),又称W3C理事会。W3C组织 是对网络标准制定的一个非赢利组织,像HTML、XHTML、CSS、XML的标准就是由W3C来定制。 W3C是专门致力于创建Web相关技术标准并促进Web向更深、更广发展的国际组织。到目前 为止,W3C已开发了超过50个规范(草案)。这些规范(草案)包括人们早已耳熟能详的 HTML、HTTP、URIs, XML等,也包括针对语义Web的RDF、OffL等。
WEB标准不是某一个标准,而是一系列标准的集合。网页主要由三部分组成结构 (Structure)、表现(Presentation)和行为(Behavior)。对应的标准也分三方面结构化 标准语言主要包括XHTML和XML,表现标准语言主要包括CSS,行为标准主要包括对象模型 (如W3C DOM)、ECMAScript等。这些标准大部分由W3C起草和发布。
按照W3C标准来设计网站将带来以下好处
I)对网站浏览者的好处包括文件下载与页面显示速度更快;内容能被更多的用 户所访问(包括失明、视弱、色盲等残障人士);内容能被更广泛的设备所访问(包括屏幕 阅读机、手持设备、搜索机器人、打印机、电冰箱等等);用户能够通过样式选择定制自己的 表现界面;所有页面都能提供适于打印的版本。
2)对网站所有者的好处包括更少的代码和组件,容易维护;带宽要求降低(代 码更简洁),成本降低。举个例子当ESPN, com使用CSS改版后,每天节约超过两兆字节 (terabytes)的带宽;更容易被搜寻引擎搜索到;改版方便,不需要变动页面内容;提供打 印版本而不需要复制内容;提高网站易用性。在美国,有严格的法律条款(Section 508)来 约束政府网站必须达到一定的易用性,其他国家也有类似的要求。
现有技术中,用户通过浏览器浏览各个网站。然而各个网站制作质量良莠不齐,缺 乏质量标识。用户盲目地浏览网页将不可避免地在制作质量很差的网站上耗费精力和时 间。
有一些网站会进行W3C标准的验证和质量数据的获取,并把验证通过信息或者质 量数据显示于网页上,供用户参考。然而这依赖于网站的个体行为,无法要求每个网站都提 供类似的基于W3C标准的质量数据。并且,现有的质量数据计算机制之间各有差异,虽然都 基于W3C标准,然而各项分值设置不同,造成各种质量数据之间的差异。从而采用不同质量 数据计算机制的网站给出的质量数据之间可比性不高。当然,W3C仅是众多标准中的一种 主要标准,网站也可基于其他标准进行验证和获取质量数据。
综上所述,现有技术中,用户不能有效地获取网页质量数据,从而造成浏览网页的 盲目和效率低下。发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的获取网页质量数据的方法和浏览器及服务器。依据本发明的一个方面,提供了一种获取网页质量数据的方法,该方法包括从浏览器接收统一资源定位符URL和散列值,该散列值是浏览器根据从用户接收的URL进行页面加载,对页面内容进行散列计算得到的;存储网页质量数据;根据所述URL和散列值获取相关网页质量数据并返回给浏览器。可选地,通过质量数据管理表来管理质量数据,在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中有该散列值,则返回与该散列值对应的质量数据。可选地,通过质量数据管理表来管理质量数据,质量数据获取单元在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则根据该URL获取网页,并计算该网页的质量数据。可选地,在计算得到质量数据之后,判断质量数据管理表中是否具有与该URL对应的质量数据,如果有,则利用计算得到的质量数据来更新表中已有的质量数据,如果没有,则新建表项,存储与该URL、散列值相对应的质量数据。可选地,通过质量数据管理表来管理质量数据,在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则质量数据获取单元向浏览器返回相关数据。可选地,所述相关数据包括预设时间段内针对该URL产生的质量数据。根据本发明的再一方面,提供了一种浏览器,包括数据获取单元,用于接收用户要访问的网页的统一资源定位符URL,并且加载该页面;计算单元,用于对页面内容进行散列计算得到散列值;通信单元,用于将URL和散列值发送给服务器,并接收服务器根据URL和散列值获取的相关网页质量数据;显示单元,用于显示质量数据。根据本发明的再一方面,提供了一种获取网页质量数据的方法,包括接收用户要访问的网页的统一资源定位符URL,并且加载该页面;对页面内容进行散列计算得到散列值;将URL和散列值发送给服务器;接收服务器根据URL和散列值获取的相关网页质量数据;显示质量数据。根据本发明的再一方面,提供了一种服务器,其包括通信单元,用于从浏览器接收统一资源定位符URL和散列值并将获取的相关网页质量数据返回给浏览器,该散列值是浏览器根据从用户接收的URL进行页面加载,对页面内容进行散列计算得到的;存储单元,用于存储网页质量数据;质量数据获取单元,用于根据URL和散列值获取相关网页质量数据。可选地,存储单元通过质量数据管理表来管理质量数据,质量数据获取单元在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中有该散列值,则服务器返回与该散列值对应的质量数据。可选地,存储单元通过质量数据管理表来管理质量数据,质量数据获取单元在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则质量数据获取单元根据该URL获取网页,并根据W3C标准来计算该网页的质量数据。可选地,质量数据获取单元在计算得到质量数据之后,判断质量数据管理表中是否具有与该URL对应的质量数据,如果有,则利用计算得到的质量数据来更新表中已有的 质量数据,如果没有,则新建表项,存储与该URL、散列值相对应的质量数据。
可选地,存储单元通过质量数据管理表来管理质量数据,质量数据获取单元在接 收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散 列值,则质量数据获取单元向浏览器返回相关数据。
可选地,相关数据包括预设时间段内针对该URL产生的质量数据。
根据本发明的再一方面,提供了一种网页质量数据获取方法,其包括从浏览器接 收统一资源定位符URL和散列值,该散列值是浏览器根据从用户接收的URL进行页面加载, 对页面内容进行散列计算得到的;存储网页质量数据;根据URL和散列值获取相关网页质 量数据并返回给浏览器。
可选地,通过质量数据管理表来管理质量数据,在接收到URL和散列值之后,在质 量数据管理表中查找对应的散列值,如果表中有该散列值,则返回与该散列值对应的质量 数据。
可选地,通过质量数据管理表来管理质量数据,质量数据获取单元在接收到URL 和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则根 据该URL获取网页,并计算该网页的质量数据。
可选地,在计算得到质量数据之后,判断质量数据管理表中是否具有与该URL对 应的质量数据,如果有,则利用计算得到的质量数据来更新表中已有的质量数据,如果没 有,则新建表项,存储与该URL、散列值相对应的质量数据。
可选地,通过质量数据管理表来管理质量数据,在接收到URL和散列值之后,在质 量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则质量数据获取单元向 浏览器返回相关数据。
可选地,相关数据包括预设时间段内针对该URL产生的质量数据。
根据本发明的网页质量数据获取方法和系统,用户可以对网页的制作质量有所了 解,从而提闻网上浏览的效率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的具体实施方式



通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明 的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中
图1A示出了根据本发明一个实施例的网页质量数据获取方法的基本流程图1B示出了根据本发明另一个实施例的本发明网页质量数据获取方法的详细流 程图2示出了根据本发明一个实施例的网页质量数据获取系统结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本发明提供一种网页质量数据获取方法和系统,解决用户无法获得网页质量数据,从而网上浏览效率低下的问题。图1A为根据本发明一个实施例的网页质量数据获取方法的基本流程图。参照图1,该方法包括步骤S100,浏览器接收用户要访问的网页的统一资源定位符URL,并且加载该页面;步骤S110,浏览器对页面内容进行散列计算得到散列值;步骤S120,浏览器将URL和散列值发送给服务器;步骤S130,服务器根据所述URL和散列值获取相关网页质量数据并返回给浏览器;步骤S140,浏览器从服务器接收返回的质量数据,并显示该数据。其中在步骤S110,散列计算米用MD5算法,MD5即Message-Digest Algorithm5 (信息-摘要算法5),用于确保信息传输完整一致,是计算机广泛使用的杂凑算法之一,MD5又译摘要算法、哈希算法,主流编程语言普遍由MD5实现。将数据(如汉字)运算为另一固定长度值,是杂凑算法的基础原理,MD5的前身有MD2、MD3和MD4。MD5的作用是让大容量信息在用数字签名软件签署私人密钥前被"压缩"成一种保密的格式(就是把一个任意长度的字节串变换成一定长的十六进制数字串)。除了 MD5以外,也可以采用其他算法,比如sha-l、RIPEMD以及Haval等。下面以MD5为例进行说明,当然也可采用其他算法。图1B示出了根据本发明另一个实施例中网页质量数据获取方法的详细流程图。根据图1A,在步骤S130服务器根据所述URL和散列值获取相关网页质量数据并返回给浏览器,参照图1B,该步骤进一步包括以下各步骤在步骤S131,服务器接收到URL和MD5之后,首先在质量数据管理表中查找是否有对应的MD5。`质量数据管理表例如是如下形式
权利要求
1.一种服务器,其包括通信单元,用于从浏览器接收统一资源定位符URL和散列值并将获取的相关网页质量数据返回给浏览器,该散列值是浏览器根据从用户接收的URL进行页面加载,对页面内容进行散列计算得到的;存储单元,用于存储网页质量数据;质量数据获取单元,用于根据所述URL和散列值获取相关网页质量数据。
2.如权利要求1所述的服务器,存储单元通过质量数据管理表来管理质量数据,质量数据获取单元在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中有该散列值,则服务器返回与该散列值对应的质量数据。
3.如权利要求1所述的服务器,存储单元通过质量数据管理表来管理质量数据,质量数据获取单元在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则质量数据获取单元根据该URL获取网页,并根据W3C标准来计算该网页的质量数据。
4.如权利要求3所述的服务器,质量数据获取单元在计算得到质量数据之后,判断质量数据管理表中是否具有与该URL对应的质量数据,如果有,则利用计算得到的质量数据来更新表中已有的质量数据,如果没有,则新建表项,存储与该URL、散列值相对应的质量数据。
5.如权利要求1所述的服务器,存储单元通过质量数据管理表来管理质量数据,质量数据获取单元在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则质量数据获取单元向浏览器返回相关数据。
6.如权利要求5所述的服务器,所述相关数据包括预设时间段内针对该URL产生的质量数据。
7.一种获取网页质量数据的方法,其包括从浏览器接收统一资源定位符URL和散列值,该散列值是浏览器根据从用户接收的 URL进行页面加载,对页面内容进行散列计算得到的;根据所述URL和散列值获取相关网页质量数据并返回给浏览器;存储网页质量数据。
8.如权利要求7所述的方法,通过质量数据管理表来管理质量数据,在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中有该散列值,则返回与该散列值对应的质量数据。
9.如权利要求7所述的方法,通过质量数据管理表来管理质量数据,质量数据获取单元在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则根据该URL获取网页,并计算该网页的质量数据。
10.如权利要求9所述的方法,在计算得到质量数据之后,判断质量数据管理表中是否具有与该URL对应的质量数据,如果有,则利用计算得到的质量数据来更新表中已有的质量数据,如果没有,则新建表项,存储与该URL、散列值相对应的质量数据。
11.如权利要求7所述的方法,通过质量数据管理表来管理质量数据,在接收到URL和散列值之后,在质量数据管理表中查找对应的散列值,如果表中没有查到该散列值,则质量数据获取单元向浏览器返回相关数据。
12.如权利要求11所述的方法,所述相关数据包括预设时间段内针对该URL产生的质量数据。
13.一种浏览器,包括 数据获取单元,用于接收用户要访问的网页的统一资源定位符URL,并且加载该页面; 计算单元,用于对页面内容进行散列计算得到散列值; 通信单元,用于将URL和散列值发送给服务器,并接收服务器根据所述URL和散列值获取的相关网页质量数据; 显示单元,用于显示所述质量数据。
14.一种获取网页质量数据的方法,包括 接收用户要访问的网页的统一资源定位符URL,并且加载该页面; 对页面内容进行散列计算得到散列值; 将URL和散列值发送给服务器; 接收服务器根据所述URL和散列值获取的相关网页质量数据; 显示所述质量数据。
全文摘要
本发明公开了一种获取网页质量数据的方法和浏览器及服务器,其中所述服务器包括其包括通信单元,用于从浏览器接收统一资源定位符URL和散列值并将获取的相关网页质量数据返回给浏览器,该散列值是浏览器根据从用户接收的URL进行页面加载,对页面内容进行散列计算得到的;存储单元,用于存储网页质量数据;质量数据获取单元,用于根据所述URL和散列值获取相关网页质量数据。利用本发明的方案,用户可以了解网页的制作质量,从而可以提高网上浏览速率。
文档编号G06F17/30GK103064874SQ20121041844
公开日2013年4月24日 申请日期2012年10月26日 优先权日2012年10月26日
发明者吴浩, 张鹏翼, 任寰 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1