一种网页评估方法及存储介质与流程

文档序号:29645438发布日期:2022-04-13 20:12阅读:83来源:国知局
一种网页评估方法及存储介质与流程

1.本发明涉及互联网领域,尤其涉及一种网页评估的方法及存储介质。


背景技术:

2.随着技术的不断发展,对网页性能的要求也越来越高,网页在实际应用过程可能涉及各种使用状态,与多个服务器进行交互,响应用户请求等多种作业,在一个系统工程中,可能需要对很多网页进行操作,应用。如何科学地对网页进行评估的工作也日趋重要。


技术实现要素:

3.因此,需要提供一种能够进行网页评估的方法,能够满足对于网页进行量化评估的需求。
4.为实现上述目的,发明人提供了一种网页评估方法,包括如下步骤,
5.调取所述网页的元素节点数量,调取网页的进程数量,根据所述元素节点数量及所述进程数量获得网页复杂度;
6.获取所述网页的所述进程的平均响应时长,根据所述平均响应时长获得网页重要度;
7.获取所述网页的链入页面的链出页面数量,根据所述网页的链入页面的链出页面数量获得网页依赖度,
8.计算网页评分,所述网页评分与所述网页复杂度、网页重要度和网页依赖度正相关。
9.具体地,所述平均响应时长与网页重要度负相关。
10.具体地,所述网页评分为网页复杂度、网页重要度和网页依赖度的加权求和。
11.具体地,所述元素节点包括网页端的dom节点,所述进程数量包括网页的微服务数量。
12.具体地,根据所述网页的链入页面的链出页面数量获得网页依赖度,具体包括步骤,
13.其中所述网页的链入页面包括a1...an,每个链入页面的链出页面数量分别为:l(a1)...l(an),所述网页的依赖度r的计算方法为,
14.r=1/l(a1)+1/l(a2)+...+1/l(an)
15.一种网页评估存储介质,存储有计算机程序,所述计算机程序在被运行时执行包括如下步骤,
16.调取所述网页的元素节点数量,调取网页的进程数量,根据所述元素节点数量及所述进程数量获得网页复杂度;
17.获取所述网页的所述进程的平均响应时长,根据所述平均响应时长获得网页重要度;
18.获取所述网页的链入页面的链出页面数量,根据所述网页的链入页面的链出页面
数量获得网页依赖度,
19.计算网页评分,所述网页评分与所述网页复杂度、网页重要度和网页依赖度正相关。
20.具体地,所述平均响应时长与网页重要度负相关。
21.具体地,所述网页评分为网页复杂度、网页重要度和网页依赖度的加权求和。
22.具体地,所述元素节点包括网页端的dom节点,所述进程数量包括网页的微服务数量。
23.具体地,所述计算机程序在被运行时执行步骤,根据所述网页的链入页面的链出页面数量获得网页依赖度,具体包括:
24.其中所述网页的链入页面包括a1...an,每个链入页面的链出页面数量分别为:l(a1)...l(an),所述网页的依赖度r的计算方法为,
25.r=1/l(a1)+1/l(a2)+...+1/l(an)
26.通过上述方案,能够达到多网页进行评分的技术效果,为网页在工程中的作用提出了量化模型,为网页的后续应用提供了可执行的基础。
附图说明
27.图1为具体实施方式所述的网页评估方法流程图;
28.图2为具体实施方式所述的网页复杂度计算方法;
29.图3为具体实施方式所述的网页重要度计算流程图;
30.图4为具体实施方式所述的网页依赖度计算流程图;
31.图5为具体实施方式所述的网页价值评分方法流程图;
32.图6为具体实施方式所述的网页评估存储介质示意图。
具体实施方式
33.为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
34.在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本技术的至少一个实施例中。在说明书中各个位置出现的“实施例”一词并不一定指代相同的实施例,亦不特别限定其与其它实施例之间的独立性或关联性。原则上,在本技术中,只要不存在技术矛盾或冲突,各实施例中所提到的各项技术特征均可以以任意方式进行组合,以形成相应的可实施的技术方案。
35.除非另有定义,本文所使用的技术术语的含义与本技术所属技术领域的技术人员通常理解的含义相同;本文中对相关术语的使用只是为了描述具体的实施例,而不是旨在限制本技术。
36.在本技术的描述中,用语“和/或”是一种用于描述对象之间逻辑关系的表述,表示可以存在三种关系,例如a和/或b,表示:存在a,存在b,以及同时存在a和b这三种情况。另外,本文中字符“/”一般表示前后关联对象是一种“或”的逻辑关系。
37.在本技术中,诸如“第一”和“第二”之类的用语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何实际的数
量、主次或顺序等关系。
38.在没有更多限制的情况下,在本技术中,语句中所使用的“包括”、“包含”、“具有”或者其他类似的表述,意在涵盖非排他性的包含,这些表述并不排除在包括所述要素的过程、方法或者产品中还可以存在另外的要素,从而使得包括一系列要素的过程、方法或者产品中不仅可以包括那些限定的要素,而且还可以包括没有明确列出的其他要素,或者还包括为这种过程、方法或者产品所固有的要素。
39.与《审查指南》中的理解相同,在本技术中,“大于”、“小于”、“超过”等表述理解为不包括本数;“以上”、“以下”、“以内”等表述理解为包括本数。此外,在本技术实施例的描述中“多个”的含义是两个以上(包括两个),与之类似的与“多”相关的表述亦做此类理解,例如“多组”、“多次”等,除非另有明确具体的限定。
40.在本技术实施例的描述中,所使用的与空间相关的表述,诸如“中心”“纵向”“横向”“长度”“宽度”“厚度”“上”“下”“前”“后”“左”“右”“竖直”“水平”“垂直”“顶”“底”“内”“外”“顺时针”“逆时针”“轴向”“径向”“周向”等,所指示的方位或位置关系是基于具体实施例或附图所示的方位或位置关系,仅是为了便于描述本技术的具体实施例或便于读者理解,而不是指示或暗示所指的装置或部件必须具有特定的位置、特定的方位、或以特定的方位构造或操作,因此不能理解为对本技术实施例的限制。
41.除非另有明确的规定或限定,在本技术实施例的描述中,所使用的“安装”“相连”“连接”“固定”“设置”等用语应做广义理解。例如,所述“连接”可以是固定连接,也可以是可拆卸连接,或成一体设置;其可以是机械连接,也可以是电连接,也可以是通信连接;其可以是直接相连,也可以通过中间媒介间接相连;其可以是两个元件内部的连通或两个元件的相互作用关系。对于本技术所属技术领域的技术人员而言,可以根据具体情况理解上述用语在本技术实施例中的具体含义。
42.在如图1所示的实施例中,为一种网页评估方法,该方法包括如下步骤,
43.s1调取所述网页的元素节点数量,调取网页的进程数量,根据所述元素节点数量及所述进程数量获得网页复杂度;
44.s2获取所述网页的所述进程的平均响应时长,根据所述平均响应时长获得网页重要度;
45.s3获取所述网页的链入页面的链出页面数量,根据所述网页的链入页面的链出页面数量获得网页依赖度,
46.s4计算网页评分,所述网页评分与所述网页复杂度、网页重要度和网页依赖度正相关。
47.其中,网页的元素可以为文字、图片、树节点、根节点等等,在一些实施例中,可以选用元素节点为网页的dom节点数量。dom:文档对象模型(document object model,简称dom),是w3c组织推荐的处理可扩展置标语言的标准编程接口。它是一种与平台和语言无关的应用程序接口(api),它可以动态地访问程序和脚本,更新其内容、结构和www文档的风格(html和xml文档是通过说明部分定义的)。文档可以进一步被处理,处理的结果可以加入到当前的页面。dom是一种基于树的api文档,它要求在处理过程中整个文档都表示在存储器中。另外一种简单的api是基于事件的sax,它可以用于处理很大的xml文档,由于大,所以不适合全部放在存储器中处理。通过选用元素为dom节点能够更好地反映网页的内容多寡,从
而更好地体现网页的复杂度,在一些实施例中,网页的进程包括并行的程序数量、占用内存数量等,还可以选择为网页运行的微服务的数量,微服务为一种软件开发技术-面向服务的体系结构(soa)架构样式的一种变体,它提倡将单一应用程序划分成一组小的服务,服务之间互相协调、互相配合,为用户提供最终价值。每个服务运行在其独立的进程中,服务与服务间采用轻量级的通信机制互相沟通(通常是基于http的restful api)。每个服务都围绕着具体业务进行构建,并且能够独立地部署到生产环境、类生产环境等。另外,应尽量避免统一的、集中式的服务管理机制,对具体的一个服务而言,应根据上下文,选着合适的语言、工具对其进行构建。通过选用微服务为网页进程指标能够更好地反映网页的内容多寡,从而更好地体现网页的复杂度。
48.在一些实施例中,一般可以通过网页被调用的次数及其调用的微服务的平均响应时长进行加权求和得到。网页被调用的频率越高说明该网页经常被访问,重要程度就高。我们一般认为越经常被访问的网页,其性能势必会经过多次优化,性能会比不常访问的网页好,故可以通过网页调用的微服务平均响应时长,反映出一个网页是否经常被访问,重要程度是否高。因此通过上述方案进行网页重要度的评价,能够使得方案的标准更为科学。
49.对于每个网页,可以有链入本网页的页面数量,这里的链入或链出可以指代通过其他网页跳转或跳转至其他网页的操作,对于本网页a,可以有n个其他网页能够跳转至本网页,因此a的链入页面可以包括a1-an。所有的a的链入页面可以有包括了a的链出页面,因此网页的依赖度可以看做a占链入页面的所有链出页面的比例。通过上述参数设计能够进行网页依赖度的评价,从而使得网页依赖度的参数设计更为科学。
50.基于上述方案,网页评分可以设置为所述网页复杂度、网页重要度和网页依赖度正相关,都能够达到量化网页的使用状态的技术效果,例如网页评分为网页复杂度、网页重要度和网页依赖度的直接相加,也可以将网页评分设置为网页复杂度、网页重要度和网页依赖度之间的乘积,都可以得到网页的评分评价,以用于后续的应用或处理,例如,根据网页评分设定网页的维护顺序、根据网页评分设定资源量、根据网页评分调配服务器,根据网页评分设定某些应用下的展示排序等等。本发明方案能够为网页的后续应用提供量化基础即可,并不对具体的应用提出限制。
51.在一些具体的实施例中,平均响应时长与网页重要度负相关。一般来说,进程的平均响应时长越短,说明其分配的资源越好,如分配的服务器可能越多。因此设置平均响应时长与网页重要度负相关更为科学,在具体的例子中,网页网页重要度还可以获取网页被调用次数,网页重要程度与网页被调用次数正相关,网页被调用次数和平均响应时长可以同时影响网页重要度,也可以只选取其中一个作为变量影响网页重要度属性。上述设置提升了本方案的科学性与实用性。
52.在另一些具体的实施例中,所述网页评分w为网页复杂度c、网页重要度s和网页依赖度r的加权求和。如设定网页评分w=a*c+b*s+c*r。abc为各项权重,通过上述方案,能够针对网页评分中的各项内容——网页复杂度c、网页重要度s和网页依赖度r根据需要设定不同的权重,使得技术人员在使用本方案的时候能够更加灵活地调节参数,提升本发明的实用性。
53.在一些关于网页依赖度计算的具体实施例中,根据所述网页的链入页面的链出页面数量获得网页依赖度,具体包括步骤,
54.其中所述网页的链入页面包括a1...an,每个链入页面的链出页面数量分别为:l(a1)...l(an),所述网页的依赖度r的计算方法为,
55.r=1/l(a1)+1/l(a2)+...+1/l(an)。
56.在这一实施例中,通过设计本网页占其链入页面的总链出页面的比例,来评估网页的依赖度,这种方法更为客观,适用性好。
57.在一些综合的实施例中,本发明方案还进行如下步骤:如图2所示网页复杂度c计算算法如下:
58.s20遍历关系网中的每个网页,统计网页dom节点的数量。将统计结果分到不同级别的区间,每个区间对应不同的分值,最后的得到第一网页的分值记为d。
59.s21遍历关系网中的每个网页,统计网页调用的微服务的数量。将统计结果分到不同级别的区间,每个区间对应不同的分值,最后的得到第一网页的分值记为e。
60.s22关系网中的每个网页,对上面两个分值分别按照权重d、e进行相加,第一网页的网页复杂度c=d*d+e*e。
61.如图3所示,网页重要度计算算法如下:
62.s30遍历关系网中的每个网页,统计第一网页的被调用次数。将统计结果分到不同次数的区间,每个区间对应不同的分值,最后的得到第一网页的对应分值记为f。
63.s31遍历关系网中的每个网页,统计第一网页调用其搭载的各个微服务的平均响应时长。将统计结果分到不同级别的区间,每个区间对应不同的分值,最后的得到每个网页的分值记为g。
64.s32关系网中的每个网页,对上面两个结果分别按照权重f、g进行相加,网页重要度s=f*f+g*g。其中f和g为分项权重,可以根据需求设定。
65.网页间的依赖度计算算法如图4所示:
66.s40根据网页关系网,统计每个网页的链出度为l。
67.s41对于一个网页a,假设链入它的网页有a1...an可以链入到网页a,设置l(a1)...l(an)分别为这些a1...an的链出度,则网页a的依赖度
68.r=1/l(a1)+1/l(a2)+...+1/l(an)。
69.最后计算网页价值
70.网页评分或网页价值评分是一个综合指标,需要结合网页复杂度c、网页重要度s、网页依赖度r综合计算得出。
71.网页价值评分w计算算法如图5所示:
72.s50设置网页复杂度、网页重要度、网页间的依赖单度权重,分别记为:a、b、c。
73.s51遍历网页关系网中的每个节点,计算每个网页的价值w,其中第一网页a的价值评分w为=a*c+b*s+c*r,其中a为网页复杂度c的权重、b为网页重要度s的权重、c为网页依赖度r的权重。
74.通过上述方法可以计算得出网络中所有网页的评分。可以对所有网页的评分进行排序展示操作。
75.在如图6所示的实施例中,还包括了一种网页评估存储介质2,存储有计算机程序,所述计算机程序在被运行时执行包括如下步骤,
76.调取所述网页的元素节点数量,调取网页的进程数量,根据所述元素节点数量及
所述进程数量获得网页复杂度;
77.获取所述网页的所述进程的平均响应时长,根据所述平均响应时长获得网页重要度;
78.获取所述网页的链入页面的链出页面数量,根据所述网页的链入页面的链出页面数量获得网页依赖度,
79.计算网页评分,所述网页评分与所述网页复杂度、网页重要度和网页依赖度正相关。
80.具体地,所述平均响应时长与网页重要度负相关。
81.具体地,所述网页评分为网页复杂度、网页重要度和网页依赖度的加权求和。
82.具体地,所述元素节点包括网页端的dom节点,所述进程数量包括网页的微服务数量。
83.具体地,所述计算机程序在被运行时执行步骤,根据所述网页的链入页面的链出页面数量获得网页依赖度,具体包括:
84.其中所述网页的链入页面包括a1...an,每个链入页面的链出页面数量分别为:l(a1)...l(an),所述网页的依赖度r的计算方法为,
85.r=1/l(a1)+1/l(a2)+...+1/l(an)
86.通过上述方案,能够达到多网页进行评分的技术效果,为网页在工程中的作用提出了量化模型,为网页的后续应用提供了可执行的基础。
87.需要说明的是,尽管在本文中已经对上述各实施例进行了描述,但并非因此限制本发明的专利保护范围。因此,基于本发明的创新理念,对本文所述实施例进行的变更和修改,或利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接地将以上技术方案运用在其他相关的技术领域,均包括在本发明的专利保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1