一种Diff打分方法以及系统的制作方法

文档序号:6363492阅读:173来源:国知局
专利名称:一种Diff打分方法以及系统的制作方法
技术领域
本发明涉及页面效果的回归测试领域,具体地说涉及一种Diff打分方法以及系统。
背景技术
为了对各种页面的展现效果进行评价,最直观、最便捷的方法就是对页面进行测试。页面测试通常是指对两个相似网页进行对比,例如:原始网页和其升级版本的网页进行对比;或者是使用不同版本转码器对原始网页进行转码,以获得原始网页的不同版本的转码网页,再对这两个不同版本的转码网页进行对比。使用不同版本转码器对原始网页进行转码主要是为了满足各种设备的需求,目前的网页主要针对计算机等固定终端。随着智能终端例如:智能手机、Ipad等移动终端的出现,其也可以浏览各种网页,但是由于显示屏幕的大小,或者移动终端中系统的限制,并不是所有的移动终端都能够很好地显示出各种网页的网页效果,因此需要使用转码器对原本针对计算机设计的原网页进行转码,使其适应各种移动终端的显示屏幕。转码器(Transcoder)系统中的tckernel模块属于策略型模块,页面展现效果的转换主要依赖于该模块,其他一些模块主要负责一些码获取等外围工作,因此对于策略性模块tckernel模块的测试至关重要。在目前的测试现状中,针对策略型模块无特别适合的测试方法。现在一种常用的方法是通过对页面数据集进行大规模的Diff打分,来衡量一个策略对页面效果的影响。但是,现有技术并不适合对比两个版本页面的差异化,因为两个版本的页面所对应的原始页面是相同的,只是在展现上存在差异,而现有技术中对网页相似度进行比较时通常采用的方法为对网页文本进行切词,并据此通过计算文本相似度来反映网页相似度,即主要关注的是两个不同网页的文字内容上的差别。因此,现有技术中的网页相似度计算方法并不能反应用户视觉上的差异,即不能针对每种类型的元素(折叠分支,链接,图片,文本)进行差异化相似度计算。其中,折叠分支主要是指为了让网页主要内容更加突出,将网页内容中的次要部分被折叠起来,每一个被折叠的部分就是一个折叠分支。在现有技术中,如果需要对页面展现效果进行测试,则完全依赖于人工测试,即人工对两个网页进行一一比对以找到差异,不但成本高而且效率低。

发明内容
本发明提供一种DifT打分方法,用于实现高效、自动化的页面效果测试。Diff打分系统可降低人工页面检查的成本,大幅度提升页面效果类回归测试的效率。根据本发明的一个方面,提供一种Diff打分方法,其特征在于,包括以下步骤:a)获取待比较的第一网页和第二网页;b)提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行对比,获得Diff结果;c)为所述元素信息赋予不同的权重,并根据所述权重统计分析所述Diff结果,以获取所述第一网页和第二网页的相似度值。根据本发明的一个优选实施例,所述步骤b)还进一步包括:提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行向量化,生成第一向量和第二向量;对所述第一向量和所述第二向量进行对比,获得Diff结果。根据本发明的又一个优选实施例,所述第一网页由第一版本转码器对原始网页转码获得;所述第二网页由第二版本所述转码器对所述原始网页转码获得。根据本发明的另一个方面,提供一种Diff打分系统,其特征在于,包括:获取装置,用于获取待比较的第一网页和第二网页;对比装置,用于提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行对比,获得Diff结果;加权装置,用于为所述元素信息赋予不同的权重,并根据所述权重统计分析所述Diff结果,以获取所述第一网页和第二网页的相似度值。根据本发明的一个优选实施例,所述对比装置还进一步包括:向量生成模块,用于提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行向量化,生成第一向量和第二向量;Diff模块,用于对所述第一向量和所述第二向量进行对比,获得Diff结果。根据本发明的另一个优选实施例,所述获取装置还包括:第一转码器,用于将原始网页转码生成所述第一网页;第二转码器,用于将所述原始网页转码生成所述第二网页。本发明提供的Diff打分方法及其系统,重点在于对待比较的两个页面的展现效果,如文字字体、颜色、图片、链接等量化为向量表示,然后通过对比两个向量的差异来表示两个页面展现效果的差异,并将对比结果,即各个向量的差异进行加权计算,把计算值直观的展现给用户。对页面展现效果进行测试时所涉及到的比较内容不仅限于现有技术中常用的文本,还包括链接、图片等元素。通过对多种元素的向量化以及比较,可以大幅度提高两个页面效果的测试效率,且由于可以对各种元素进行向量化,向量化之后进行对比,有效提高了测试的自动化水平。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:图1为根据本发明的一种Diff打分方法的一种具体实施方式
的流程示意图;图2为根据本发明的一种Diff打分方法中获取原始网页的具体实施方式
的示意图;图3为根据图1所示流程S102可能具有的分解步骤流程图;图4为根据本发明的一种Diff打分系统的一种具体实施方式
的结构示意图;图5为根据图4所示的Diff打分系统中获取装置的一种具体实施方式
的结构示
意图;图6为根据图4所示的Diff打分系统中对比装置的一种具体实施方式
的结构示意图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施例作详细描述。下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。当然,它们仅仅为示例,并且目的不在于限制本发明。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。如图1所示,图1为根据本发明提供的一种Diff打分方法的一个具体实施方式
的流程示意图,包括步骤SlOl S103,下面结合具体的实施例对图1所示的方法进行说明。步骤S101,获取待比较的第一网页和第二网页。所述第一网页和所述第二网页可以是任意的两个网页,但是如果是毫无关联的网页进行对比,那么将失去比较的意义。因此,优选的,所述第一网页和第二网页都是基于同一个原始网页获得,即:所述第一网页由第一转码器对原始网页转码获得;所述第二网页由第二转码器对所述原始网页转码获得。第一转码器和第二转码器是指同一转码器的不同版本。可以理解,由于目前的网页大部分都是基于固定终端进行编写,因此在移动终端上的显示可能会出现各种各样的问题,例如,字体不全,显示为乱码;格式不匹配,显示格式错乱等。随着移动终端的日新月异以及各种移动终端系统的出现,需要对原始网页进行转换,以期能使原本适应于固定终端的网页可以在各种移动终端中有完美展现。可以理解,作为一种客户端软件,转码器也是在不断升级的,因此需要对不同版本的转码器对原始页面的转码效果进行测试。可以理解,第二转码器优选为第一转码器的升级版本。所述原始网页的来源多种多样,包括但不限于本地存储、实时抓取或代理抓取,参考图2。在本地抓取方式中,先通过srcURL重定向到本地数据的路径,然后进行拼接抓取URL参数,最后通过URL参数访问互联网抓取页面。srcURL字符串的值可以是需要获得的网页内容的地址(例如,http://www.baidu.com)或者本地服务器上的一个HTML文件的文件名(例如,example, html),其中参数可以任意修改,诸如width, fontFacel等等。实时抓取直接拼接抓取URL参数,并通过该参数访问互联网抓取所需页面。面对更新速度过快的网页,例如:BBS、微博等页面,优选采用实时抓取的方式。另外,还可以通过设置代理服务器的方式抓取所需页面,例如掌百代理等。当获取到原始页面后,会通过不同版本的转码器对其进行转码,生成第一网页和第二网页。接下来,执行步骤S102,提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行对比,获得Diff结果。所述元素信息包括:所述元素的个数和所述元素的内容属性。所述元素包括但不限于图片、链接、纯文本、折叠分支等;元素个数即为图片的多少、文本文件的个数等等。元素的内容属性例如:纯文本元素的字体、文字的多少等;图片元素的尺寸、像素、格式等。优选的,参考图3,所述步骤S102进一步包括:步骤S102-1,提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行向量化,生成第一向量和第二向量。对各种元素进行向量化即将连续变化的模拟量(各种元素)转换成离散数字量样本值。数字化的结果有助于进行比较。例如,对图片进行向量化,可以是根据其尺寸对其在网页中的位置进行定位;对字体颜色进行向量化,可以是对级联样式表(Cascading Style Sheet, CSS)中相关变量的提取等。步骤S102-2,对所述第一向量和所述第二向量进行对比,获得Diff结果。对第一向量和第二向量进行对比,即对数字化的样本进行对比,这种对比简单且正确性高,因此为本发明的优选方案。通过对比,即可得到第一向量和第二向量的区别,将其区别整合,即为Diff结果。继续执行步骤S103,为所述元素信息赋予不同的权重,并根据所述权重统计分析所述Diff结果,以获取所述第一网页和第二网页的相似度值。Diff结果通常会显示出第一网页和第二网页各种元素的不同,例如:文本的不同,其可能具体体现在文本中字体的不同;链接的不同,其具体可能体现在超链接数目的不同等等。为了更好地对Diff结果进行分析,需要对各种元素赋予不同的权重,如:图片占30%、链接占20%、纯文本占40%、折叠分支占10%等。进一步地,还可以为各个元素的各个属性赋予不同的权重,例如:在图片元素中,图片的尺寸占40%、图片的像素占40%、图片的格式占20%等。根据不同的需求,可以为各种元素或者元素属性设置不同的权重,以获得所需的分析结果。图4为根据本发明的Diff打分系统10的一个具体实施方式
的结构示意图。系统10包括:获取装置11、对比装置12和加权装置13。获取装置11用于获取待比较的第一网页和第二网页。所述第一网页和所述第二网页可以是任意的两个网页,但是如果是毫无关联的网页进行对比,那么将失去比较的意义。因此,优选的,所述第一网页和第二网页都是基于同一个原始网页获得,即:所述第一网页由第一转码器111对原始网页转码获得;所述第二网页由第二所述转码器112对所述原始网页转码获得,如图5所示。第一转码器111和第二转码器112是指同一转码器的不同版本。由于技术更新速度非常快,客户端、软件等的更新也是日新月异,如果每次都重新命名,不但会导致工作量巨大,而且名称混乱,不利于使用和查找,因此目前常用的命名法,就是对相似功能、版本不同的的客户端、软件统一命名,例如:QQ2009、QQ2011等等。可以理解,第二转码器112优选为第一转码器111的升级版本。所述原始网页的来源多种多样,包括但不限于本地存储、实时抓取或代理抓取,参考图2。在本地抓取方式中,先通过srcURL重定向到本地数据的路径,然后进行拼接抓取URL参数,最后通过URL参数访问互联网抓取页面。srcURL字符串的值可以是需要获得的网页内容的地址(例如,http://www.baidu.com)或者本地服务器上的一个HTML文件的文件名(例如,example, html),其中参数可以任意修改,诸如width, fontFacel等等。实时抓取直接拼接抓取URL参数,并通过该参数访问互联网抓取所需页面。面对更新速度过快的网页,例如:BBS、微博等页面,优选采用实时抓取的方式。另外,还可以通过设置代理服务器的方式抓取所需页面,例如掌百代理等。当获取到原始页面后,会通过获取装置11中的不同转码器对其进行转码,生成第一网页和第二网页。对比装置12用于提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行对比,获得Diff结果。所述元素信息包括:所述元素的个数和所述元素的内容属性。所述元素包括但不限于图片、链接、纯文本、折叠分支等;元素个数即为图片的多少、文本文件的个数等等。元素的内容属性例如:纯文本元素的字体、文字的多少等;图片元素的尺寸、像素、格式等。优选的,参考图6,所述对比装置12进一步包括:向量生成模块121,用于提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行向量化,生成第一向量和第二向量。对各种元素进行向量化即将连续变化的模拟量(各种元素)转换成离散数字量样本值。数字化的结果有助于进行比较。Diff模块122,用于对所述第一向量和所述第二向量进行对比,获得Diff结果。对第一向量和第二向量进行对比,即对数字化的样本进行对比,这种对比简单且正确性高,因此为本发明的优选方案。通过对比,即可得到第一向量和第二向量的区别,将其区别整合,即为Diff结果。加权装置13,用于为所述元素信息赋予不同的权重,并根据所述权重统计分析所述Diff结果,以获取所述第一网页和第二网页的相似度值。Diff结果通常会显示出第一网页和第二网页各种元素的不同,例如:文本的不同,其可能具体体现在文本中字体的不同;链接的不同,其具体可能体现在超链接数目的不同等等。为了更好地对Diff结果进行分析,需要对各种元素赋予不同的权重,如:图片占30 %、链接占20 %、纯文本占40 %、折叠分支占10%等。进一步地,还可以为各个元素的各个属性赋予不同的权重,例如:在图片元素中,图片的尺寸占40%、图片的像素占40%、图片的格式占20%等。根据不同的需求,可以为各种元素或者元素属性设置不同的权重,以获得所需的分析结果。采用本发明的方法和系统,可以通过对待对比网页中的多种元素进行比对,获取精确的对比结果,且自动化程度和效率高。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括” 一词不排除其他模块或步骤,单数不排除复数。
权利要求
1.一种DifT打分方法,其特征在于,包括以下步骤: a)获取待比较的第一网页和第二网页; b)提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行对比,获得Diff结果; c)为所述元素信息赋予不同的权重,并根据所述权重统计分析所述Diff结果,以获取所述第一网页和第二网页的相似度值。
2.根据权利要求1所述的方法,其特征在于,所述步骤b)还进一步包括: 提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行向量化,生成第一向量和第二向量; 对所述第一向量和所述第二向量进行对比,获得Diff结果。
3.根据权利要求1或2所述的方法,其特征在于,在步骤a)中,所述第一网页由第一版本转码器对原始网页转码获得;所述第二网页由第二版本转码器对所述原始网页转码获得。
4.根据权利要求3所述的方法,其特征在于,所述原始网页来源于本地存储、实时抓取或代理抓取。
5.根据权利要求1所述的方法,其特征在于,所述元素信息包括:所述元素的个数和所述元素的内容属性。
6.根据权利要求1所述的 方法,其特征在于,所述元素包括:图片、链接、纯文本、折叠分支。
7.—种DifT打分系统,其特征在于,包括: 获取装置,用于获取待比较的第一网页和第二网页; 对比装置,用于提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行对比,获得Diff结果; 加权装置,用于为所述元素信息赋予不同的权重,并根据所述权重统计分析所述Diff结果,以获取所述第一网页和第二网页的相似度值。
8.根据权利要求7所述的系统,其特征在于,所述对比装置还进一步包括: 向量生成模块,用于提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行向量化,生成第一向量和第二向量; Diff模块,用于对所述第一向量和所述第二向量进行对比,获得Diff结果。
9.根据权利要求7或8所述的系统,其特征在于,所述获取装置还包括: 第一转码器,用于将原始网页转码生成所述第一网页; 第二转码器,用于将所述原始网页转码生成所述第二网页。
10.根据权利要求9所述的系统,其特征在于,所述原始网页来源于本地存储、实时抓取或代理抓取。
11.根据权利要求7所述的系统,其特征在于,所述元素信息包括:所述元素的个数和所述元素的内容属性。
12.根据权利要求7所述的系统,其特征在于,所述元素包括:图片、链接、纯文本、折叠分支。
全文摘要
本发明提供一种Diff打分方法,包括获取待比较的第一网页和第二网页;提取所述第一网页和所述第二网页中的元素信息,并分别对所述第一网页和所述第二网页中的相应元素信息进行对比,获得Diff结果;为所述元素信息赋予不同的权重,并根据所述权重统计分析所述Diff结果,以获取所述第一网页和第二网页的相似度值。本发明还提供一种使用该方法的系统。本发明可以实现高效自动化的页面效果测试。
文档编号G06F17/30GK103218358SQ20121001632
公开日2013年7月24日 申请日期2012年1月18日 优先权日2012年1月18日
发明者翁岩青 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1