一种监测网络访问活动的方法和系统的制作方法

文档序号:9217199阅读:579来源:国知局
一种监测网络访问活动的方法和系统的制作方法
【技术领域】
[0001] 本发明涉及计算机网络技术领域,尤其涉及的是一种监测网络访问活动的方法和 系统。
【背景技术】
[0002] 在网络广告、网络调查、在线投票及选举等网络活动中,网络监测系统起着至关重 要的作用,对网络活动数据的精确监测和分析可有效的保证网络活动的质量,提高调研结 果的精确度。目前常见的数据监测指标包括曝光数量、独立访问者数量、到达频次Reach 等,而到达频次又可细化为至少曝光1次、2次、3次、……、N次的独立访问者数量等。其 中,独立访问者数量和Reach的计算均依赖于对独立访问者的准确识别。假设监测到三次 曝光,其中两次曝光被识别为同一个独立访问者,另外一次曝光被识别为另一个独立访问 者,则独立访问者数量为2,至少曝光1次的独立访问者的数量为2,至少曝光2次的独立访 问者的数量为1,至少曝光3次和3次以上的独立访问者数量均为0。
[0003] 目前,相关技术中主要利用终端cookie来识别独立访问者。当用户访问被监测网 页时,被监测网页中嵌入的代码会要求用户使用的浏览器向广告监测服务器发起HTTP请 求。广告监测服务器会判断HTTP请求是否包含cookie,对于不包含cookie的请求会在用户 终端植入cookie。然后,广告监测服务器会记录这一请求的信息,例如cookie、用户的IP、 时间等,即曝光数据。广告监测服务器可根据曝光数据中包含的cookie进行独立访问者的 识别。例如,广告监测服务器连续两次收到包含cookie的请求,并且所述两次请求中包含 的cookie信息相同,则两次请求会被识别为同一个独立访问者所发。但是,随着大众对隐 私问题的关注程度不断提高,越来越多的人选择"关闭cookie追踪功能",因此,网络监测 系统监测到的部分访问请求可能不包含cookie,也就无法根据cookie识别独立访问者了。
[0004] 另一种识别独立访问者的方式是利用设备指纹。设备指纹是根据用户上网设备的 信息(比如,设备的操作系统版本及其序列号、浏览器版本及其序列号、屏幕分辨率、安装的 插件及其序列号、使用的IP地址等信息)生成的。当用户访问被监测网页时,被监测网页 中嵌入的代码会要求用户使用的浏览器向广告监测服务器发起HTTP请求,所述HTTP请求 中会包含所述设备指纹。此方法的缺陷在于:不同设备可能具有相同的指纹。例如,收集 设备信息时,可能只收集到浏览器标识(比如,IE)信息,而其他信息全部无法收集到,则具 有相同浏览器标识的设备均具有相同的设备指纹,因此被识别为同一个独立访问者。实际 情况虽然可能没有这样简单,但是某些更复杂一点的特征组合也可能普遍存在于多台设备 中,即不同设备具有相同指纹的情况相当普遍。因此,仅仅根据设备指纹识别独立访问者存 在不准确的情况。

【发明内容】

[0005] 本发明所要解决的技术问题是提供一种监测网络访问活动的方法和系统,能够提 高对网络访问行为监测的准确性。
[0006] 为了解决上述技术问题,本发明提供了一种监测网络访问活动的方法,包括:
[0007] 监测访问被监测页面的全部流量的曝光数据,其中每一条曝光数据均携带独立访 问者的设备指纹信息;
[0008] 将所述曝光数据中,携带cookie的曝光数据保存在样本集合中,其他曝光数据保 存在估算集合中,将cookie作为所述样本集合中曝光数据的独立访问者标识,并根据所述 样本集合建立设备指纹与cookie的关系模型;
[0009] 对所述估算集合中具有所述关系模型中某一设备指纹的每条曝光数据,根据所述 关系模型分配一个独立访问者标识。
[0010] 进一步地,该方法还包括下述特点:
[0011] 所述根据所述样本集合建立设备指纹与cookie的关系模型,包括:
[0012] 根据所述样本集合中各条曝光数据的设备指纹和cookie,为每一种设备指纹建立 一个访问子表,在该访问子表的每条记录中,保存具有该设备指纹的一组曝光数据所具有 的一种cookie及该cookie在该组曝光数据中的出现次数。
[0013] 进一步地,该方法还包括下述特点:
[0014] 对所述估算集合中具有所述关系模型中某一设备指纹的每条曝光数据,根据所述 关系模型分配一个独立访问者标识,包括:
[0015] 对所述估算集合具有所述关系模型中设备指纹Fi的M条曝光数据分为k+1组, M=kN+M',其中,N为所述样本集合中具有设备指纹Fi的曝光数据总数,k,M'为自然数;
[0016] 对其中的k组曝光数据,将每一组的N条曝光数据再划分为Q个子组,每一子组对 应设备指纹Fi的访问子表中的一条记录,每一子组的曝光数据条数等于对应记录中的出 现次数,Q为设备指纹Fi的访问子表中的记录数;
[0017] 对余下的M'条曝光数据组成的一组曝光数据,将所述M'条曝光数据分成Q'个子 组,Q' <Q,每一子组对应设备指纹Fi的访问子表中的一条记录,且至少有Q' -1个子组的 曝光数据条数等于对应记录中的出现次数;
[0018] 为同一组中同一子组的曝光数据分配相同的独立访问者标识,为不同组或同一组 中不同子组的曝光数据分配不同的独立访问者标识。
[0019] 进一步地,该方法还包括:
[0020] 根据所述样本集合中各条曝光数据的cookie建立访问总表,在所述访问总表的 每条记录中,保存所述样本集合中的曝光数据所具有的一种cookie及该cookie在该样本 集合的曝光数据中的出现次数;
[0021] 对所述估算集合中不具有所述关系模型中任一设备指纹的每条曝光数据,根据所 述访问总表分配一个独立访问者标识。
[0022] 进一步地,该方法还包括下述特点:
[0023] 所述对所述估算集合中不具有所述关系模型中任一设备指纹的每条曝光数据,根 据所述访问总表分配一个独立访问者标识,包括:
[0024] 将所述估算集合中的全部M条曝光数据分为k+1组,M=kN+M',其中,N为所述样本 集合中的曝光数据总数,k,M'为自然数;
[0025] 对其中的k组曝光数据,将每一组的N条曝光数据再划分为Q个子组,每一子组对 应所述访问总表中的一条记录,每一子组的曝光数据条数等于对应记录中的出现次数,Q为 所述混合访问表中的记录数;
[0026] 对余下的M'条曝光数据组成的一组曝光数据,将所述M'条曝光数据分成Q'个子 组,Q' <Q,每一子组对应所述访问总表中的一条记录,且至少有Q' -1个子组的曝光数据 条数等于对应记录中的出现次数;
[0027] 为同一组中同一子组的曝光数据分配相同的独立访问者标识,为不同组或同一组 中不同子组的曝光数据分配不同的独立访问者标识。
[0028] 进一步地,该方法还包括:
[0029] 根据所述样本集合的独立访问者标识以及所述估算集合的独立访问者标识,统计 所述全部流量的到达频次。
[0030] 为了解决上述技术问题,本发明还提供了一种监测网络访问活动的系统,包括:
[0031] 监测模块,用于监测访问被监测页面的全部流量的曝光数据,其中每一条曝光数 据均携带独立访问者的设备指纹信息;
[0032] 统计模块,用于将所述曝光数据中,携带cookie的曝光数据保存在样本集合中, 其他曝光数据保存在估算集合中,将cookie作为所述样本集合中曝光数据的独立访问者 标识,并根据所述样本集合建立设备指纹与cookie的关系模型;
[0033] 估算模块,用于对所述估算集合中具有所述关系模型中某一设备指纹的每条曝光 数据,根据所述关系模型分配一个独立访问者标识。
[0034] 进一步地,该系统还包括下述特点:
[0035] 统计模块,用于根据所述样本集合建立设备指纹与cookie的关系模型,包括:
[0036] 根据所述样本集合中各条曝光数据的设备指纹和cookie,为每一种设备指纹建立 一个访问子表,在该访问子表的每条记录中,保存具有该设备指纹的一组曝光数据所具有 的一种cookie及该cookie在该组曝光数据中的出现次数。
[0037] 进一步地,该系统还包括下述特点:
[0038] 估算模块,用于对所述估算集合中具有所述关系模型中某一设备指纹的每条曝光 数据,根据所述关系模型分配一个独立访问者标识,包括:
[0039] 对所述估算集合具有所述关系模型中设备指纹Fi的M条曝光数据分为k+1组, M=kN+M',其中,N为所述样本集合中具有设备指纹Fi的曝光数据总数,k,M'为自然数;
[0040] 对其中的k组曝光数据,将每
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1