网页访问数据的监测方法和装置与流程

文档序号:12824890阅读:321来源:国知局
网页访问数据的监测方法和装置与流程

本申请涉及计算机领域,具体而言,涉及一种网页访问数据的监测方法和装置。



背景技术:

随着互联网的普及和发展,通过互联网了解信息和进行交易的用户越来越多,进而得到的互联网用户的访问数据也随之日渐庞大。更多的产品提供方开始利用互联网这个平台进行宣传、交易和维护产品,这就导致对访问数据处理和呈现的需求一路飙升,现有技术中,数据提供方大多是通过图(例如,热力图)、表的方式展示网页访问数据的变化情况。

热力图一种非常有效且直观的网页访问数据显示方法,它能够将网页在预先设定的时间区间内的访问数据进行展示,并结合多维度剖析功能,被应用于用户体验优化(简称:ueo优化)、访客行为分析、网页整体表现的判断等方面。

通过上述内容可知,现阶段数据提供方的侧重点仅在于展现访客群体的访问行为(也即,展现访问数据),所以只能让需求方(即,产品提供方)看到关于访客群体的访问行为(即,访问数据)的静态展现,缺乏对上述访问数据的真实性的评判,进而也就无法知道热力图中展现的访问行为是否为访客的真实访问行为。

针对上述的问题,目前尚未提出有效的解决方案。



技术实现要素:

本申请实施例提供了一种网页访问数据的监测方法和装置,以至少解决现有技术中无法确定访问数据是否真实的技术问题。

根据本申请实施例的一个方面,提供了一种网页访问数据的监测方法,包括:获取目标网页上各个像素点对应的访问数据;将所述访问数据进行排序,对排序后的访问数据对应的所述各个像素点绘制像素点曲线;判断所述像素点曲线中所述各个像素点对应的访问数据的分布情况是否符合预设分布;在判断出所述分布情况符合所述预设分布的情况下,从所述各个像素点对应的访问数据中确定出目标像素点对应的访问数据,其中,所述目标像素点为根据预设筛选条件,从所述各个像素点中确定出的像 素点;根据所述目标像素点对应的访问数据和预设阈值,确定所述各个像素点对应的访问数据的监测结果。

进一步地,根据所述目标像素点对应的访问数据和预设阈值,确定所述各个像素点对应的访问数据的监测结果包括:计算所述目标像素点对应的访问数据的访问数据总和;判断所述访问数据总和是否达到所述预设阈值;在判断出所述访问数据总和达到所述预设阈值的情况下,确定所述监测结果为真实访问数据,其中,所述真实访问数据用于表征所述各个像素点对应的访问数据为有效的访问数据;在判断出所述访问数据总和未达到所述预设阈值的情况下,确定所述监测结果为不真实访问数据,其中,所述不真实访问数据用于表征所述各个像素点对应的访问数据为无效的访问数据。

进一步地,根据所述目标像素点对应的访问数据和预设阈值,确定所述各个像素点对应的访问数据的监测结果包括:计算所述目标像素点对应的访问数据的访问数据总和;判断所述访问数据总和占总访问数据的比例是否达到所述预设阈值,其中,所述总访问数据为所述各个像素点对应的访问数据之和;在判断出所述比例达到所述预设阈值的情况下,确定所述监测结果为真实访问数据,其中,所述真实访问数据用于表征所述各个像素点对应的访问数据为有效的访问数据;在判断出所述比例未达到所述预设阈值的情况下,确定所述监测结果为不真实访问数据,其中,所述不真实访问数据用于表征所述各个像素点对应的访问数据为无效的访问数据。

进一步地,将所述访问数据进行排序,对排序后的访问数据对应的所述各个像素点绘制像素点曲线包括:按照所述访问数据由高到低对所述各个像素点进行排序;基于按照访问数据由高到低排序后的所述各个像素点绘制所述像素点曲线;判断所述像素点曲线中所述各个像素点对应的访问数据的分布情况是否符合预设分布包括:判断所述像素点曲线中所述各个像素点对应的访问数据的分布情况是否符合长尾分布。

进一步地,在判断出所述分布情况不符合所述预设分布的情况下,确定所述监测结果为不真实访问数据,其中,所述不真实访问数据用于表征所述各个像素点对应的访问数据为无效的访问数据。

进一步地,获取目标网页上各个像素点对应的访问数据包括:从数据库中获取满足预设条件的所述目标网页上所述各个像素点对应的访问数据,其中,所述预设条件至少包含:预设时间段。

进一步地,所述各个像素点对应的访问数据包括以下任一种:点击量、会话量和鼠标停留时长。

根据本申请实施例的另一方面,还提供了一种网页访问数据的监测装置,包括: 获取单元,用于获取目标网页上各个像素点对应的访问数据;绘制单元,用于将所述访问数据进行排序,对排序后的访问数据对应的所述各个像素点绘制像素点曲线;判断单元,用于判断所述像素点曲线中所述各个像素点对应的访问数据的分布情况是否符合预设分布;第一确定单元,用于在判断出所述分布情况符合所述预设分布的情况下,从所述各个像素点对应的访问数据中确定出目标像素点对应的访问数据,其中,所述目标像素点为根据预设筛选条件,从所述各个像素点中确定出的像素点;第二确定单元,用于根据所述目标像素点对应的访问数据和预设阈值确定所述各个像素点对应的访问数据的监测结果。

进一步地,所述第二确定单元包括:第一计算模块,用于计算所述目标像素点对应的访问数据的访问数据总和;第一判断模块,用于判断所述访问数据总和占总访问数据的比例是否达到所述预设阈值,其中,所述总访问数据为所述各个像素点对应的访问数据之和;第一确定模块,用于在判断出所述比例达到所述预设阈值的情况下,确定所述监测结果为真实访问数据,其中,所述真实访问数据用于表征所述各个像素点对应的访问数据为有效的访问数据;第二确定模块,用于在判断出所述比例未达到所述预设阈值的情况下,确定所述监测结果为不真实访问数据,其中,所述不真实访问数据用于表征所述各个像素点对应的访问数据为无效的访问数据。

进一步地,所述绘制单元包括:排序模块,用于按照所述访问数据由高到低对所述各个像素点进行排序;绘制模块,用于基于按照访问数据由高到低排序后的所述各个像素点绘制所述像素点曲线;所述判断单元包括:第二判断模块,用于判断所述像素点曲线中所述各个像素点对应的访问数据的分布情况是否符合长尾分布。

进一步地,所述第二确定单元包括:第二计算模块,用于计算所述目标像素点对应的访问数据的访问数据总和;第三判断模块,用于判断所述访问数据总和是否达到所述预设阈值;第三确定模块,用于在判断出所述访问数据总和达到所述预设阈值的情况下,确定所述监测结果为真实访问数据,其中,所述真实访问数据用于表征所述各个像素点对应的访问数据为有效的访问数据;第四确定模块,用于在判断出所述访问数据总和未达到所述预设阈值的情况下,确定所述监测结果为不真实访问数据,其中,所述不真实访问数据用于表征所述各个像素点对应的访问数据为无效的访问数据。

进一步地,所述装置还包括:第五确定模块,用于在判断出所述分布情况不符合所述预设分布的情况下,确定所述监测结果为不真实访问数据,其中,所述不真实访问数据用于表征所述各个像素点对应的访问数据为无效的访问数据。

进一步地,获取单元包括:获取模块,用于从数据库中获取满足预设条件的所述目标网页上所述各个像素点对应的访问数据,其中,所述预设条件至少包含:预设时 间段。

进一步地,所述各个像素点对应的访问数据包括以下任一种:点击量、会话量和鼠标停留时长。

在本申请实施例中,采用获取目标网页上各个像素点对应的访问数据;将所述访问数据进行排序,对排序后的访问数据对应的所述各个像素点绘制像素点曲线;判断所述像素点曲线中所述各个像素点对应的访问数据的分布情况是否符合预设分布;在判断出所述分布情况符合所述预设分布的情况下,从所述各个像素点对应的访问数据中确定出目标像素点对应的访问数据,其中,所述目标像素点为根据预设筛选条件,从所述各个像素点中确定出的像素点;根据所述目标像素点对应的访问数据和预设阈值确定所述各个像素点对应的访问数据的监测结果的方式,通过绘制表征像素点与访问数据之间的对应关系的像素点曲线,并判断像素点曲线中访问数据的分布情况是否正常(也即,是否符合长尾分布等预设分布),进而在判断出上述访问数据的分布情况正常的情况下,通过比较各个像素点中目标像素点对应的访问数据与预设阈值的大小就能得到各个像素点对应的访问数据是否为真实访问数据的监测结果,达到了量化且有依据的监测网页的访问数据是否真实的目的,从而实现了监测网页访问数据是否真实的技术效果,进而解决了现有技术中无法确定访问数据是否真实的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请实施例的一种网页访问数据的监测方法的流程图;

图2是根据本申请实施例的一种像素点曲线的示意图;以及

图3是根据本申请实施例的一种网页访问数据的监测装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例,提供了一种网页访问数据的监测方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

图1是根据本申请实施例的一种网页访问数据的监测方法的流程图,如图1所示,该方法包括如下步骤s102至步骤s110:

步骤s102,获取目标网页上各个像素点对应的访问数据,其中,目标网页为待监测访问数据的网页。

具体地,目标网页可以是任一待监测访问数据的网页,也就相当于可以是任一待确定访问数据是否真实的网页。

其中,各个像素点对应的访问数据可以是点击量、会话量和鼠标停留时长中的任意一种,具体可以根据需求确定。

步骤s104,将访问数据进行排序,对排序后的访问数据对应的各个像素点绘制像素点曲线,其中,像素点曲线用于表征各个像素点和各个像素点对应的访问数据之间的对应关系。

具体地,对访问数据进行排序既可以是对访问数据由高到低排序,也可以是对访问数据由低到高排序,在本实施例中并不对访问数据的排序方式进行限定。

步骤s106,判断像素点曲线中各个像素点对应的访问数据的分布情况是否符合预设分布。

步骤s108,在判断出分布情况符合预设分布的情况下,从各个像素点对应的访问数据中确定出目标像素点对应的访问数据,其中,目标像素点为根据预设筛选条件,从各个像素点中确定出的像素点。

具体地,预设筛选条件可以根据需求设置,例如,预设筛选条件为各个像素点中 访问数据排在前n的像素点,其中,访问数据排在前n的像素点是指将各个像素点对应的访问数据由高到低排序时排在前n的像素点。n的取值可以根据需求设置,例如:20%。如果n为20%,则上述步骤s108中的目标像素点即为各个像素点中访问数据排在前20%的像素点,所以如果各个像素点共有100个,则目标像素点为20个;如果各个像素点共有200个,则目标像素点为40个。

步骤s110,根据目标像素点对应的访问数据和预设阈值,确定各个像素点对应的访问数据的监测结果。

具体地,监测结果有两种,一种是真实访问数据,另一种是不真实访问数据。如果监测结果是真实访问数据,说明网页的访问数据所表示的大部分访问行为都是真实访客行为,则上述访问数据大都是由真实用户访问网页产生的;反之如果监测结果是不真实访问数据,说明网页的访问数据所表示的大部分访问行为都不是真实访客行为,则上述访问数据大都不是由真实用户访问网页产生的。

预设阈值可以根据需求设置,既可以是百分比形式,也可以是数值形式,还可以是小数形式。

此外,由于各个像素点为目标网页上的像素点,所以各个像素点对应的访问数据的监测结果即为各个像素点所在的网页(即,目标网页)的访问数据的监测结果,也就是上述网页的访问数据的监测结果。

在本申请实施例中,通过绘制表征像素点与访问数据之间的对应关系的像素点曲线,并判断像素点曲线中访问数据的分布情况是否正常(也即,是否符合长尾分布等预设分布),进而在判断出上述访问数据的分布情况正常的情况下,通过比较各个像素点中目标像素点对应的访问数据与预设阈值的大小就能得到各个像素点对应的访问数据是否为真实访问数据的监测结果,达到了量化且有依据的监测网页的访问数据是否真实的目的,从而实现了监测网页访问数据是否真实的技术效果,进而解决了现有技术中无法确定访问数据是否真实的技术问题。

需要说明的是,对于每个目标网页的访问数据,都可以通过执行步骤s102至步骤s110得到该目标网页的访问数据是否真实的监测结果。

可选地,可以通过两种方式实现根据目标像素点对应的访问数据和预设阈值,确定各个像素点对应的访问数据的监测结果,上述两种方式具体如下:

方式一:包括步骤s1101至步骤s1107,具体如下:

步骤s1101,计算目标像素点对应的访问数据的访问数据总和。

具体地,从各个像素点中确定出的像素点(也即,目标像素点)通常为多个,上述步骤s1101也就是计算全部的目标像素点对应的访问数据之和,得到访问数据总和。

步骤s1103,判断访问数据总和是否达到预设阈值。

具体地,在本申请实施例中,预设阈值为数值形式,例如可以设置为各个像素点对应的访问数据之和的80%。

步骤s1105,在判断出访问数据总和达到预设阈值的情况下,确定监测结果为真实访问数据,其中,真实访问数据用于表征各个像素点对应的访问数据为有效的访问数据。

具体地,上述步骤s1105也就是在判断出访问数据总和达到预设阈值的情况下,确定各个像素点对应的访问数据为有效的访问数据,则说明上述访问数据大都是由真实用户访问网页产生的。

步骤s1107,在判断出访问数据总和未达到预设阈值的情况下,确定监测结果为不真实访问数据,其中,不真实访问数据用于表征各个像素点对应的访问数据为无效的访问数据。

具体地,上述步骤s1107也就是在判断出访问数据总和未达到预设阈值的情况下,确定各个像素点对应的访问数据为无效的访问数据,则说明上述访问数据大都不是由真实用户访问网页产生的。

方式二:包括步骤s1109至步骤s11015,具体如下:

步骤s1109,计算目标像素点对应的访问数据的访问数据总和,该步骤同上述步骤s1101,在此不再重复说明。

步骤s11011,判断访问数据总和占总访问数据的比例是否达到预设阈值,其中,总访问数据为各个像素点对应的访问数据之和。

具体地,在本申请实施例中,预设阈值为百分比形式或者小数形式,例如可以设置为80%或者0.8。

步骤s11013,在判断出比例达到预设阈值的情况下,确定监测结果为真实访问数据,其中,真实访问数据用于表征各个像素点对应的访问数据为有效的访问数据。

具体地,上述步骤s11013也就是在判断出比例达到预设阈值的情况下,确定各个像素点对应的访问数据为有效的访问数据,则说明上述访问数据大都是由真实用户访问网页产生的。

步骤s11015,在判断出比例未达到预设阈值的情况下,确定监测结果为不真实访问数据,其中,不真实访问数据用于表征各个像素点对应的访问数据为无效的访问数据。

具体地,上述步骤s11015也就是在判断出比例未达到预设阈值的情况下,确定各个像素点对应的访问数据为无效的访问数据,则说明上述访问数据大都不是由真实用户访问网页产生的。

需要说明的是,可以根据需求选择上述两种方式中的任一种,确定出各个像素点对应的访问数据的监测结果,也就是确定出网页的访问数据的监测结果。

如果预设阈值的取值为各个像素点对应的访问数据之和的80%、0.8或者80%,也就是判断目标像素点对应的访问数据之和与各个像素点对应的访问数据之和相比是否满足“二八定律”。

可选地,在本申请实施例中,将访问数据进行排序,对排序后的访问数据对应的各个像素点绘制像素点曲线包括:按照访问数据由高到低对各个像素点进行排序;基于按照访问数据由高到低排序后的各个像素点绘制像素点曲线。判断像素点曲线中各个像素点对应的访问数据的分布情况是否符合预设分布包括:判断像素点曲线中各个像素点对应的访问数据的分布情况是否符合长尾分布。

当访问数据为点击量时,对某个网页内各个像素点对应的点击量按照由高到低排序,基于按照点击量由高到低排序后的像素点绘制出的像素点曲线的示意图可以参见图2。需要说明的是,图2中,x轴表示像素点,y轴表示点击量,其中,各个像素点按照点击量由高到低排列在x轴上。

可选地,在本申请实施例中,在判断出分布情况不符合预设分布的情况下,确定监测结果为不真实访问数据,其中,不真实访问数据用于表征各个像素点对应的访问数据为无效的访问数据。

可选地,在本申请实施例中,获取目标网页上各个像素点对应的访问数据包括:从数据库中获取满足预设条件的目标网页上各个像素点对应的访问数据,其中,预设条件至少包含:预设时间段。

也就是,从数据库中提取目标网页在某些筛选条件下,各个像素点对应的访问数据,其中,某些筛选条件即为上述实施例中的预设条件。

具体地,数据库可以为任一能够获取到目标页面上各个像素点对应的访问数据的数据库,例如,热力图数据库等。

可选地,除了预设时间段之外,预设条件还可以包含预设来源渠道、预设来源类型等。上述预设时间段、预设来源渠道和预设来源类型均可以根据需求设置。

例如,当预设条件仅包含预设时间段时,预设时间段为2015年10月1日至2015年10月31日,目标网页为某个商品a的网页,简称为网页a,则从数据库中获取在2015年10月1日至2015年10月31日之间,网页a上各个像素点对应的访问数据。

例如,当预设条件包含预设时间段和预设来源渠道时,预设时间段为2015年10月1日至2015年10月31日,预设来源渠道为新浪微博,目标网页为某个商品a的网页,简称为网页a,则从数据库中获取在2015年10月1日至2015年10月31日之间通过新浪微博访问网页a上各个像素点对应的访问数据。

在本申请实施例中,可以根据用户需求获取相应的访问数据,进而对上述访问数据是否真实进行监测,达到了提高用户满意度的效果。

以访问数据为点击量为例,说明如下:

大量访客访问同一网页时,与其他事务的关注程度表现一致,存在共性和个性的特点:即大多数访客的兴趣点相似,在网页上点击的范围也会相似;然而不同访客的性格不完全相同,总会存在差异,并且不排除个别新访客对网页不熟悉产生的误点击情况,肯定会有少量其他区域的点击。共性和个性的点击量差异有多大,则取决于网页的布局和自身特点。以一段时间和其他剖析路径下,某页面(即,网页)的各个像素点的点击量为研究对象,存在以下两个特点:

(1)网页上各个像素的点击量呈现长尾分布,存在主体和长尾两部分像素点;

(2)绝大多数的点击量是由少量像素点产生,满足二八定律。

具体地,长尾分别很好的描画了“绝大多数事件的规模很小,而只有少数事件的规模相当大”。

所以大量真实访客的网页访问行为中点击量等浏览数据(即,访问数据)同时符合二八定律和长尾分布,也就是,若满足以上两点,则从各像素对应的点击量的整体分布来看,大多数的访问行为是满足真实访客行为的。

通过上述内容可知,由于非真实访客的访问行为与真实访客的访问行为是存在一定差异,本申请实施例所提供的方案结合多维度剖析功能,利用网页上每个像素点对应的访问数据,判断上述网页的访问数据是否真实,也就是判断该网页的访客中是否大多数为非真实访客,从而得到该网页的监测结果。

根据本申请实施例,还提供了一种网页访问数据的监测装置,该网页访问数据的监测装置用于执行本申请实施例上述内容所提供的网页访问数据的监测方法,以下对本申请实施例所提供的网页访问数据的监测装置做具体介绍:

图3是根据本申请实施例的一种网页访问数据的监测装置的示意图,如图3所示,该监测装置主要包括获取单元31、绘制单元33、判断单元35、第一确定单元37和第二确定单元39,其中:

获取单元31,用于获取目标网页上各个像素点对应的访问数据。

具体地,目标网页可以是任一待监测访问数据的网页,也就相当于可以是任一待确定访问数据是否真实的网页。

其中,各个像素点对应的访问数据可以是点击量、会话量和鼠标停留时长中的任意一种,具体可以根据需求确定。

绘制单元33,用于将访问数据进行排序,对排序后的访问数据对应的各个像素点绘制像素点曲线。

具体地,对访问数据进行排序既可以是对访问数据由高到低排序,也可以是对访问数据由低到高排序,在本实施例中并不对访问数据的排序方式进行限定。

判断单元35,用于判断像素点曲线中各个像素点对应的访问数据的分布情况是否符合预设分布。

第一确定单元37,用于在判断出分布情况符合预设分布的情况下,从各个像素点对应的访问数据中确定出目标像素点对应的访问数据,其中,目标像素点为根据预设筛选条件,从各个像素点中确定出的像素点。

具体地,预设筛选条件可以根据需求设置,例如,预设筛选条件为各个像素点中访问数据排在前n的像素点,其中,访问数据排在前n的像素点是指将各个像素点对应的访问数据由高到低排序时排在前n的像素点。n的取值可以根据需求设置,例如:20%。如果n为20%,则上述步骤s108中的目标像素点即为各个像素点中访问数据排在前20%的像素点,所以如果各个像素点共有100个,则目标像素点为20个;如果各个像素点共有200个,则目标像素点为40个。

第二确定单元39,用于根据目标像素点对应的访问数据和预设阈值,确定各个像素点对应的访问数据的监测结果。

具体地,监测结果有两种,一种是真实访问数据,另一种是不真实访问数据。如果监测结果是真实访问数据,说明网页的访问数据所表示的大部分访问行为都是真实访客行为,则上述访问数据大都是由真实用户访问网页产生的;反之如果监测结果是 不真实访问数据,说明网页的访问数据所表示的大部分访问行为都不是真实访客行为,则上述访问数据大都不是由真实用户访问网页产生的。

预设阈值可以根据需求设置,既可以是百分比形式,也可以是数值形式,还可以是小数形式。

此外,由于各个像素点为目标网页上的像素点,所以各个像素点对应的访问数据的监测结果即为各个像素点所在的网页(即,目标网页)的访问数据的监测结果,也就是上述网页的访问数据的监测结果。

在本申请实施例中,通过绘制表征像素点与访问数据之间的对应关系的像素点曲线,并判断像素点曲线中访问数据的分布情况是否正常(也即,是否符合长尾分布等预设分布),进而在判断出上述访问数据的分布情况正常的情况下,通过比较各个像素点中目标像素点对应的访问数据与预设阈值的大小就能得到各个像素点对应的访问数据是否为真实访问数据的监测结果,达到了量化且有依据的监测网页的访问数据是否真实的目的,从而实现了监测网页访问数据是否真实的技术效果,进而解决了现有技术中无法确定访问数据是否真实的技术问题。

需要说明的是,对于每个目标网页的访问数据,都可以通过调用获取单元、绘制单元、判断单元、第一确定单元和第二确定单元得到该目标网页的访问数据是否真实的监测结果。

可选地,可以通过两种方式实现根据目标像素点的访问数据之和与预设阈值,确定各个像素点的访问数据的监测结果,上述两种方式具体如下:

方式一:第二确定单元包括:第一计算模块、第一判断模块、第一确定模块和第二确定模块,其中:

第一计算模块,用于计算目标像素点对应的访问数据的访问数据总和。

具体地,从各个像素点中确定出的像素点(也即,目标像素点)通常为多个,上述第一计算模块也就是用于计算全部的目标像素点对应的访问数据之和,得到访问数据总和。

第一判断模块,用于判断访问数据总和占总访问数据的比例是否达到预设阈值,其中,总访问数据为各个像素点对应的访问数据之和。

具体地,在本申请实施例中,预设阈值为数值形式,例如可以设置为各个像素点对应的访问数据之和的80%。

第一确定模块,用于在判断出比例达到预设阈值的情况下,确定监测结果为真实 访问数据,其中,真实访问数据用于表征各个像素点对应的访问数据为有效的访问数据。

具体地,上述第一确定模块也就是用于在判断出访问数据总和达到预设阈值的情况下,确定各个像素点对应的访问数据为有效的访问数据,则说明上述访问数据大都是由真实用户访问网页产生的。

第二确定模块,用于在判断出比例未达到预设阈值的情况下,确定监测结果为不真实访问数据,其中,不真实访问数据用于表征各个像素点对应的访问数据为无效的访问数据。

具体地,上述第二确定模块也就是用于在判断出访问数据总和未达到预设阈值的情况下,确定各个像素点对应的访问数据为无效的访问数据,则说明上述访问数据大都不是由真实用户访问网页产生的。

方式一:第二确定单元包括:第二计算模块、第三判断模块、第三确定模块和第四确定模块,其中:

第二计算模块,用于计算目标像素点对应的访问数据的访问数据总和。

第三判断模块,用于判断访问数据总和是否达到预设阈值。

具体地,在本申请实施例中,预设阈值为百分比形式或者小数形式,例如可以设置为80%或者0.8。

第三确定模块,用于在判断出访问数据总和达到预设阈值的情况下,确定监测结果为真实访问数据,其中,真实访问数据用于表征各个像素点对应的访问数据为有效的访问数据。

具体地,上述第三确定模块也就是用于在判断出比例达到预设阈值的情况下,确定各个像素点对应的访问数据为有效的访问数据,则说明上述访问数据大都是由真实用户访问网页产生的。

第四确定模块,用于在判断出访问数据总和未达到预设阈值的情况下,确定监测结果为不真实访问数据,其中,不真实访问数据用于表征各个像素点对应的访问数据为无效的访问数据。

具体地,上述第四确定模块也就是用于在判断出比例未达到预设阈值的情况下,确定各个像素点对应的访问数据为无效的访问数据,则说明上述访问数据大都不是由真实用户访问网页产生的。

需要说明的是,可以根据需求选择上述两种方式中的任一种,确定出各个像素点对应的访问数据的监测结果,也就是确定出网页的访问数据的监测结果。

可选地,在本申请实施例中,绘制单元包括:排序模块,用于按照访问数据由高到低对各个像素点进行排序;绘制模块,用于基于按照访问数据由高到低排序后的各个像素点绘制像素点曲线;判断单元包括:第二判断模块,用于判断像素点曲线中各个像素点对应的访问数据的分布情况是否符合长尾分布。

可选地,在本申请实施例中,装置还包括:第五确定模块,用于在判断出分布情况不符合预设分布的情况下,确定监测结果为不真实访问数据,其中,不真实访问数据用于表征各个像素点对应的访问数据为无效的访问数据。

可选地,在本申请实施例中,获取单元包括:获取模块,用于从数据库中获取满足预设条件的目标网页上各个像素点对应的访问数据,其中,预设条件至少包含:预设时间段。

上述获取模块也就是用于从数据库中提取目标网页在某些筛选条件下,各个像素点对应的访问数据,其中,某些筛选条件即为上述实施例中的预设条件。

可选地,除了预设时间段之外,预设条件还可以包含预设来源渠道、预设来源类型等。上述预设时间段、预设来源渠道和预设来源类型均可以根据需求设置。

在本申请实施例中,可以根据用户需求获取相应的访问数据,进而对上述访问数据是否真实进行监测,达到了提高用户满意度的效果。

所述网页访问数据的监测装置包括处理器和存储器,上述获取单元、绘制单元、判断单元、第一确定单元和第二确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数确定网页的访问数据是否真实。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram),存储器包括至少一个存储芯片。

本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取目标网页上各个像素点对应的访问数据;将所述访问数据进行排序,对排序后的访问数据对应的所述各个像素点绘制像素点曲线;判断所述像素点曲线中所述各个像素点对应的访问数据的分布情况是否符合预设分布;在判断出所述分布情况符合所述预设分布的情况下,从所述各个像素点对应的访问数据中确定出目标像素点对应的访问数据,其中,所述目标像素点为根据预设筛选条件,从所述各个像素点中确定出的像素点;根据所述目标像素点对应的访问数据和预设阈值,确定所述各个像素点对应的访问数据的监测结果。

在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1