网页编码的分析方法及装置的制造方法

文档序号:9865515阅读:280来源:国知局
网页编码的分析方法及装置的制造方法
【技术领域】
[0001] 本申请涉及网页分析技术领域,特别是涉及网页编码的分析方法及装置。
【背景技术】
[0002] 随着计算机技术的高速发展W及互联网的广泛普及,越来越多的用户通过互联网 获取各种信息,使用各种互联网服务。在互联网信息的载体中,网页是不可或缺的一种,通 过网页,服务商可W向用户提供各式各样的数据服务。从新闻浏览,生活信息获取,广告发 布,到数据下载,收发邮件,游戏娱乐等等,都可W通过网页来实现。在用户的网络生活中, 网页具有不可取代的地位。
[0003] 网页通常由页面设计人员完成设计编码,在进行网页设计编码的工作中, HTML(Hyp&rText Markup Language,超文本标记语言)语言是使用最广泛的语言之一。HTML 语言是一种标记语言,送种语言通过特定符号或符号对来标记要显示在网页中的各个部分 内容,规定所要显示的内容的显示样式,W及各部分内容在网页中的显示位置。例如"<P〉 内容</p>"表示一个段落,"<img src ="···"/〉表示一张图片等。浏览器在解析和显示 网页时,按HTML文件从上到下的顺序依次读取和解析文件中的标记符号及其标记的内容, 并根据标记符号来确定各种网页内容的显示样式和显示位置。
[0004] 同其它计算机编码工作一样,网页编码也应本着正确和规范的原则进行,但也难 免会出现错误,例如,一些电子商务平台为店主提供了 "店铺装修"功能,店主可W藉由送类 功能进行自主的店铺页面的设计,由于店主通常并非专业的设计人员,因而页面出现编码 错误的情况时有发生。对于存在编码错误的网页,浏览器在解析网页文件时通常并不会指 出其中的错误,而是继续解释执行过程。送样浏览器会将错误的内容显示出来,设计人员通 常也只能通过网页的最终显示效果来分析出错原因和出错位置。造成的现状是,对网页错 误编码进行检查需要耗费很多时间,检查效率非常低。综上,需要本领域技术人员解决的问 题就在于,提供一种网页编码的分析方法,能够更加高效的识别网页编码中的错误,帮助网 页设计人员降低网页编码错误的出现概率。

【发明内容】

[0005] 本申请提供了网页编码的分析方法及装置,可W提高网页编码中识别错误编码的 效率,帮助网页设计人员降低网页编码错误的出现概率。
[0006] 本申请提供了如下方案:
[0007] -种网页编码的分析方法,包括:
[0008] 读取待检测的目标网页,确定所述目标网页中待检测的目标元素对象;
[0009] 在所述目标网页中,获取与所述目标元素对象存在特定结构关系的相关元素对 象;
[0010] 将所述相关元素对象与预置的期望元素进行对比;
[0011] 根据对比的结果,确定所述目标网页在所述目标元素对象或所述相关元素对象处 是否存在编码错误。
[0012] 一种网页编码的分析装置,包括:
[0013] 目标元素确定单元,用于读取待检测的目标网页,确定所述目标网页中待检测的 目标元素对象;
[0014] 相关元素获取单元,用于在所述目标网页中,获取与所述目标元素对象存在特定 结构关系的相关元素对象;
[0015] 元素对比单元,用于将所述相关元素对象与预置的期望元素进行对比;
[0016] 错误确定单元,用于根据对比的结果,确定所述目标网页在所述目标元素对象或 所述相关元素对象处是否存在编码错误。
[0017] 根据本申请提供的具体实施例,本申请公开了 W下技术效果:
[0018] 通过本申请,可W目标网页中确定目标网页中待检测的目标元素对象,获取与目 标元素对象存在特定结构关系的相关元素对象,进而将相关元素对象与预置的期望元素进 行对比,根据对比的结果,确定目标网页在所述目标元素对象或相关元素对象处是否存在 编码错误。本方法从与网页中元素对象的结构关系角度,对网页中的目标元素进行分析,根 据发生编码错误的元素对象和与其它元素对象之间的送种结构关系会发生改变,来判断目 标元素对象或相关元素对象处是否发生了编码错误,提高了网页编码中识别错误编码的效 率,可W帮助网页设计人员降低网页编码错误的出现概率。
[0019] 当然,实施本申请的任一产品并不一定需要同时达到W上所述的所有优点。
【附图说明】
[0020] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施 例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可W根据送些附图获 得其他的附图。
[0021] 图1是本申请实施例提供的方法的流程图;
[0022] 图2是本申请实施例提供的装置的示意图。
【具体实施方式】
[0023] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于 本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的 范围。
[0024] 请参看图1,为本申请实施例提供的网页编码的分析方法的流程图,如图1所示, 该方法可W包括W下步骤:
[00巧]S101 ;读取待检测的目标网页,确定所述目标网页中待检测的目标元素对象;
[0026] 在进行网页编码的过程中,往往会由于各种原因导致编码错误,对于编码错误的 网页,一般的浏览器在解析的过程中并不会指出其中的错误,因而一旦网页出现编码错误, 则会造成一些页面元素显示不正确,如某些元素显示在了不正确的位置。另外,由于页面元 素嵌套等原因,如果一个元素出现了编码错误,常常导致与其有嵌套关系的其他元素也无 法正常显示,从而严重影响页面的显示效果w及美观。同一个网页中的元素对象,通常会与 其它一个或多个元素对象存在特定的结构关系,而对于出现编码错误的网页,发生编码错 误的元素对象和与其它元素对象之间的送种结构关系会发生改变。本申请实施例旨在提供 一种网页编码的分析方法,从网页HTML编码中元素对象的结构关系角度出发,对网页中存 在错误编码的元素对象进行检测,从而识别网页编码中的错误,帮助网页设计人员降低网 页编码错误的出现概率。
[0027] 首先,可W读取待检测的目标网页,确定目标网页中待检测的目标元素。具体实现 该步骤时,可W根据实际应用环境的不同采取不同的方式。例如,当W测试工具对网页编码 进行分析时,可W使用测试工具加载目标网页,并确定目标网页中待测的目标元素。也可W 调用浏览器加载目标网页,通过向目标网页中注入脚本,并通过所注入的脚本来对目标网 页的编码进行分析。具体在确定待检测的目标元素时,也可W有不同的实现方式,例如,可 W将目标页面中所有的可分析元素对象中,随机或按预置方式选取的元素列为目标元素对 象,并逐一进行分析。当需要进行严格的分析测试时,可W将目标页面中所有的可分析元素 对象都列为目标元素对象,并逐一进行分析等。
[0028] 具体在确定目标网页中待检测的目标元素对象时,可W在目标网页中,根据预置 字符串查询各元素对象对应的唯一标识信息,根据查询到的相匹配的元素对象,确定目标 网页中待检测的目标元素对象。在目标网页加载的过程中,目标网页中的各个元素通常 会表示为树状的数据结构,网页中的各个元素唯一与树状结构中的一个节点相对应,而树 状结构中的节点可W具有一些属性信息,例如,Name属性、ID属性、化gName属性等。在 送些属性信息中可W包括一个唯一的标识信息,如ID属性;在书写规范的网页文件中, 元素对象如果对应唯一的Name属性,该Name属性也可W作为标识信息。也即上述标识 信息能够唯一标识对应点节点,同时也唯一标识了对应的元素对象。在有目的性的选择 分析郝些目标网页中的元素对象作为目标元素对象的应用中,可W通过执行预置的字符 串,根据该字符串来查询各元素对象对应的唯一标识信息,根据查询到的相匹配的元素 对象,确定目标网页中待检测的目标元素对象。例如,可W利用ge巧1 ementBy I d (S i d), getElementsByName(sname)等方法来实现查询,将相匹配的元素对象确定为目标元素对
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1