一种数据处理方法及装置与流程

文档序号:12719679阅读:247来源:国知局
一种数据处理方法及装置与流程

本发明涉及电通信技术领域,尤其涉及一种数据处理方法及装置。



背景技术:

cookie是一个存储用户访问网站时的部分状态、动作和设置的文件。第三方互联网监测公司进行网页投放效果评估时,在网页植入一段代码,将记录在本地cookie中的网民网上浏览行为数据,通过这段代码发送给第三方互联网监测公司的服务器,并将cookie记录的行为数据作为主要的分析资源,评估网页投放效果。

第三方互联网监测公司,在使用cookie数据时,直接对数据进行分析,评估网页投放效果。在初始的cookie数据集中包含所有对发生浏览行为或点击行为的行为数据。产生cookie数据包括在稳定网络环境上网的网民浏览行为,以及在不稳定网络环境上网的网民浏览行为和由作弊产生的网民浏览行为。不稳定的上网环境,如在网吧、学校机房等地方会定期清理电脑cookie,当同样的网页被浏览时会重新生成新的cookie,cookie更换会比较频繁。而由作弊产生的网民浏览行为,也会很频繁的更换cookie,以更加隐蔽的方式非法增加曝光、流量等。这类频繁更换cookie的网民浏览行为数据是不稳定的,在网页投放效果评估中价值较低。而稳定网络环境上网的网民浏览行为,在网页投放效果评估中价值较高。

在现有技术中,在评估网页投放效果时,获取第三方cookie中的全部初始数据,其中包括稳定网民浏览行为数据和不稳定的网民浏览行为数据,不区分数据的稳定性,直接进行处理数据。由于不稳定的网民浏览行为数据,对网页效果评估中的价值较低,而在数据处理过程中与稳定网民浏览行为数据做同样的数据处理,降低了网页投放效果评估结果的准确性。



技术实现要素:

本发明提供了一种数据处理方法及装置,能够解决网页投放效果评估结果准确性低的问题。

为了解决上述技术问题,一方面,本发明提供了一种数据处理方法,该方法包括:

获取用户行为数据;

查询记录所述用户行为数据的第三方cookie的生成时间;

计算所述用户行为数据的产生时间与所述cookie的生成时间的时间间隔;

若所述时间间隔大于预设时长,则所述记录用户行为数据的第三方cookie为稳定cookie;

根据所述稳定cookie,确定所述用户行为数据为有效数据。

另一方面,本发明还提供了一种数据处理装置,该装置包括:

获取单元,用于获取用户行为数据;

查询单元,用于查询记录所述获取单元获取的用户行为数据的第三方cookie的生成时间;

计算单元,用于计算所述用户行为数据的产生时间与所述查询单元查询的cookie的生成时间的时间间隔;

记录单元,用于若所述计算单元计算的时间间隔大于预设时长,则所述记录用户行为数据的第三方cookie为稳定cookie;

确定单元,用于根据所述记录单元记录的稳定cookie,确定所述用户行为数据为有效数据。

本发明提供的数据处理方法及装置,能够获取用户行为数据,查询记录用户行为数据的第三方cookie的生成时间,计算用户行为数据产生的时间与第三方cookie的生成时间的时间间隔,若时间间隔大于预设时长,则记录用户行为数据的第三方cookie为稳定cookie,稳定cookie中记录的用户行为数据为有效数据。与现有技术相比,本发明能够从cookie记录的大量行为数据中,排除不稳定的无效数据,获取稳定的有效的行为数据,根据高价值的有效行为数据,分析投放效果,提高评估网页投放效果的准确性。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和 其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本发明实施例提供的一种数据处理方法流程图;

图2示出了本发明实施例提供的另一种数据处理方法流程图;

图3示出了本发明实施例提供的一种数据处理装置组成框图;

图4示出了本发明实施例提供的另一种数据处理装置组成框图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种数据处理方法,如图1所示,该方法包括:

101、获取用户行为数据。

用户行为数据可以至少包含下述一种:对网络事件的触发动作,如对广告的点击;对网络展示内容浏览时间,如广告的曝光统计可以根据用户对广告浏览时间来确定;访问网站时间;等上述三种用户行为数据。

具体地,用户行为数据可以由用户对目标页面操作产生,目标页面可以是游戏页面,广告页面,购物页面等等,在发明方案中,对目标页面的类型不做限定。

用户行为数据是用户访问网站及在网站上的其他操作所产生的信息。这些信息可以以日志的形式存放在用户本地cookie中。cookie是一个存储用户访问网络时的部分状态、动作和设置的文件,一般包括所访问网站的域名、访问开始时间、访问者的IP地址以及访问者关于网站的一些设置。

获取的用户行为数据,是为了分析某一个或某几个目标页面的运作效 果,而不是对所有的网络用户而言的。所以在目标页面中植入一段代码,这段代码能够给点击目标页面的用户分配一个cookie编号,与该用户在目标页面产生的其他行为数据记录在本地cookie中,并将记录在本地cookie中的行为数据,通过这段代码发送给第三方互联网监测公司。这样从第三方互联网监测方的cookie中只包括用户点击目标页面的行为数据,而不是用户本地所有的cookie,减少后续数据处理的数据量,提高数据处理的效率。

用户首次点击目标页面时,生成一个cookie,当用户再次点击目标页面时,用户行为数据记录在首次生成的cookie中,记录行为数据时不再分配新的cookie编号。这样可以通过cookie编号区别不同的用户。

102、查询记录用户行为数据的第三方cookie的生成时间。

第三方cookie,是指用户当前浏览的页面上有通过标签嵌入另外一个域名的链接地址,该链接设置的cookie就称为第三方cookie,当前页面设置的cookie为第一方cookie。

第三方cookie的生成时间,是在用户首次点击目标页面时产生的。查询记录行为数据的cookie生成时间,即查询用户首次点击目标页面的时间。

103、计算用户行为数据的产生时间与cookie的生成时间的时间间隔。

通过步骤101获取的用户行为数据,得到用户行为数据的产生时间,通过步骤102得到cookie的生成时间,计算两者的时间间隔。

通常时间的记录包括年、月、日、时、分、秒。在计算时间间隔时,可以根据最小时间单位,统一时间单位进行逐项对比,计算时间差;对于时间间隔的计算方式本发明在此不做任何限定。

示例性的,行为数据的产生时间为2015年11月2日8时23分10秒,cookie的生成时间为2015年11月1日9时10分5秒,两者做减法运算,与十进制减法类似,从最小时间单位秒开始,计算两者的时间间隔为23时13分5秒。

104、若时间间隔大于预设时长,则记录用户行为数据的第三方cookie为稳定cookie。

所述预设时长,可以是用来判定行为数据是否为有效行为数据的比较 值。预设时长是根据用户访问网页的行为习惯或是经验得出的,也可以根据有效行为数据的判定结果的准确性做适应性调整。在本实施例中,对预设时长的时间长短不做限定。

若根据步骤103计算得到的时间间隔大于预设时长,则记录用户行为数据的第三方cookie为稳定cookie。稳定cookie,是确定某用户是否为稳定网民的一种方式,即当一个用户从其cookie诞生到在项目中再次出现用户行为数据的时间间隔大于预设时长,认为此用户为稳定网民,在分析中相比拥有不稳定cookie的用户更具价值。

105、根据稳定cookie,确定用户行为数据为有效数据。

将步骤104记录为稳定cookie中的用户行为数据确定为有效数据。有效行为数据,即为在cookies中价值较高的数据。

示例性的,在第三方的cookies中,cookie编号c1对应的数据信息中记录的点击目标页面的时间信息,c1:2015年10月1日8:00;2015年11月1日8:00。预设时长为12小时。

提取点击目标页面时间为2015年11月1日8:00的行为数据。记录该行为数据的cookie生成时间,即用户首次点击目标页面的时间为2015年10月1日8:00,计算行为数据的产生时间与cookie的生成时间的时间间隔,时间间隔为31天,大于预设时长12小时,所以确定该cookie为稳定cookie,该cookie中的用户行为数据是有效数据。

本发明实施例提供的数据处理方法,能够获取用户行为数据,查询记录用户行为数据的第三方cookie的生成时间,计算用户行为数据产生的时间与第三方cookie的生成时间的时间间隔,若时间间隔大于预设时长,则记录用户行为数据的第三方cookie为稳定cookie,稳定cookie中记录的用户行为数据为有效数据。与现有技术相比,本发明实施例能够从cookie记录的大量行为数据中,排除不稳定的无效数据,获取稳定的有效的行为数据,根据高价值的有效行为数据,分析投放效果,提高评估网页投放效果的准确性。

进一步的,作为图1所述方法的细化和扩展,本发明实施例还提供了另一种数据处理方法,如图2所示,该方法包括:

201、获取用户行为数据。

用户行为数据,是有用户对网页操作产生的。用户行为数据至少包括其中的一种:对网络事件的触发动作;对网络展示内容浏览时间;访问网站时间。

从第三方互联网监测公司的cookies中获取用户行为数据,在获取用户行为数据时,目标页面可能还在运行行为数据随时更新,也可能已经停止运行行为数据不再更新。在本实施例中对目标页面的运行状态不做限定。通常在目标页面运行的过程中,根据行为数据,分析目标页面的运行效果,调整目标页面内容,以达到更好的效果。

对于已经停止运行的目标页面,所有的行为数据已经产生,行为数据不随着时间更新,所以在提取行为数据时,也不涉及时间问题,不用考虑提取时间与行为数据产生时间的关系。

对于还在运行的目标页面,在提取行为数据时,需要考虑时间问题。若分析目标页面在一段时间内的运行情况,则行为数据是在该段时间之内产生的;若对目标页面随时监测,则根据监测周期,提取对应监测周期内产生的行为数据。

202、查询记录用户行为数据的第三方cookie的生成时间。

203、计算用户行为数据的产生时间与cookie的生成时间的时间间隔。

用户行为数据的产生时间,即为用户对网页操作产生的时间。计算时间间隔的的方法为:计算当前用户行为数据的产生的时间与第三方cookie的生成时间的时间差;根据时间差,确定时间误差率;利用时间误差率,计算用户行为数据的产生时间与cookie的生成时间的时间间隔。

204、若时间间隔大于预设时长,则记录用户行为数据的第三方cookie为稳定cookie。

205、根据所述稳定cookie,确定所述用户行为数据为有效数据。

当时间间隔大于预设时长时,检测是否存在与用户行为数据相关的其他用户行为数据;当存在与用户行为数据相关的其他用户行为数据,获取其他用户行为数据;将用户行为数据和用户行为数据相关的其他用户行为数据,确定为有效数据。

示例性的,在第三方的cookies中,cookie编号c2对应的数据信息中记录的点击目标页面的时间信息,c2:2015年11月1日8:00;2015年11月1日9:00;2015年11月2日8:00。预设时长为12小时。

提取点击目标页面时间为2015年11月2日8:00的行为数据。记录该行为数据的cookie生成时间,即用户首次点击目标页面的时间为2015年11月1日8:00,计算行为数据的产生时间与cookie的生成时间的时间间隔,时间间隔为24小时,大于预设时长12小时,所以确定该行为数据是有效行为数据,获取该行为数据。点击目标页面时间为2015年11月1日9:00的行为数据,产生时间在cookie生成时间与有效行为数据之间,也确定为有效行为数据。

206、对有效数据进行统计。

对有效数据的统计包括:统计所述有效数据的稳定网民曝光量;统计所述有效数据的稳定网民独立曝光量。统计的稳定网民曝光量和稳定网民独立曝光量,均为稳定cookie产生的用户行为数据,产生稳定cookie的网民为稳定网民。

稳定网民曝光量为稳定网民对网页发生浏览行为的次数总和。稳定网民独立曝光量为稳定网民对网页发生浏览行为的用户数。对应于稳定网民的情况,还可以对所有cookie中记录的用户行为数据,统计全体网民曝光量和全体网民独立曝光量。稳定网民曝光量为用户对网页发生浏览行为的次数总和。稳定网民独立曝光量为对广告页面发生浏览行为的用户数。

将稳定网民曝光量与稳定网民独立曝光量,作为对广告投放效果评估中的数据指标。一个广告页面,曝光量越多,表示用户越容易被该广告吸引,独立曝光量越多,表示该广告传播的范围越广。

对于本发明实施例,具体的应用场景可以如下所示,但不限于此,包括:有C1、C2、C3三个网民,预设时间间隔为12小时,对于同一个网页产生的cookie记录,如表1所示。

表1

根据如图2所示步骤的描述,对每个网民进行判断:

网民C1:将预设时间间隔12小时,与第一次在项目中曝光和cookie生成时间的时间间隔相比较。[(2015年11月1日8:00)-(2015年10月1日8:00)>12小时]。因此,记录C1用户行为数据的第三方cookie为稳定cookie,C1为稳定网民,C1的第一次曝光数据为稳定网民曝光量。

网民C2:将预设时间间隔12小时,与第一次在项目中曝光和cookie生成时间的时间间隔相比较。[(2015年11月1日9:00)-(2015年11月1日8:00)=1小时<12小时],所以这一次曝光不属于不稳定曝光。但是,由于C2在第二次曝光时属于稳定网民曝光,[(2015年11月2日8:00)-(2015年11月1日8:00)=24小时>12小时],则记录C2用户行为数据的第三方cookie为稳定cookie,C2为稳定网民。系统会校正第一次曝光也为稳定网民曝光。

网民C3:第一次和第二次在项目中出现的时间,与cookie诞生的时间间隔均不足12小时,因此这两次曝光均属于不稳定曝光。

统计出C1、C2、C3三个网民的曝光情况,如表2所示。

表2

进一步的,作为对上述图1与图2所示方法的实现,本发明另一实施例还提供了一种数据处理装置。本装置实施例与前述方法实施例对应,为便于阅读,本装置实施例不再对前述方法实施例中的细节内容进行逐一赘述,但应当明确,本装置实施例能够对应实现前述方法实施例中的全部内容。如图3所示,该装置包括:获取单元31、查询单元32、计算单元33,记录单元34以及确定单元35,其中,

获取单元31,用于获取用户行为数据;

查询单元32,用于查询记录所述获取单元31获取的用户行为数据的第三方cookie的生成时间;

计算单元33,用于计算所述用户行为数据的产生时间与所述查询单元32查询的cookie的生成时间的时间间隔;

记录单元34,用于若所述计算单元33计算的时间间隔大于预设时长,则所述记录用户行为数据的第三方cookie为稳定cookie;

确定单元35,用于根据所述记录单元34记录的稳定cookie,确定所述用户行为数据为有效数据。

进一步地,所述获取单元31获取的用户行为数据,至少包含下述一种:

对网络事件的触发动作;

对网络展示内容浏览时间;

访问网站时间。

进一步地,如图4所示,所述计算单元33,包括:

计算模块331,用于计算当前所述用户行为数据的产生的时间与所述第三方cookie的生成时间的时间差;

确定模块332,用于根据所述计算模块331计算的时间差,确定时间误差率;

所述计算模块331,还用于利用所述确定模块确定的时间误差率,计算所述用户行为数据的产生时间与所述cookie的生成时间的时间间隔。

进一步地,如图4所示,所述确定单元35,包括:

检测模块351,用于当所述时间间隔大于预设时长时,检测是否存在与所述用户行为数据相关的其他用户行为数据;

获取模块352,用于当存在与所述检测模块351检测的用户行为数据相关的其他用户行为数据,获取所述其他用户行为数据;

确定模块353,用于将所述用户行为数据和所述获取模块352获取的用户行为数据相关的其他用户行为数据,确定为有效数据。

进一步地,如图4所示,所述该装置还包括:

统计单元36,用于统计所述有效数据的稳定网民曝光量;

统计单元36,还用于统计所述有效数据的稳定网民独立曝光量。本发明实施例提供的数据处理装置,能够获取用户行为数据,查询记录用户行为数据的第三方cookie的生成时间,计算用户行为数据产生的时间与第三方cookie的生成时间的时间间隔,若时间间隔大于预设时长,则记录用户行为数据的第三方cookie为稳定cookie,稳定cookie中记录的用户行为数据为有效数据。与现有技术相比,本发明实施例能够从cookie记录的大量行为数据中,排除不稳定的无效数据,获取稳定的有效的行为数据,根据高价值的有效行为数据,分析投放效果,提高评估网页投放效果的准确性。

所述数据处理装置包括处理器和存储器,上述获取单元31、查询单元32、计算单元33,记录单元34和确定单元35,等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决网页投放效果评估结果准确性低的问题。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一个存储芯片。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取用户行为数据;查询记录所述用户行为数据的第三方cookie的生成时间;计算所述用户行为数据的产生时间与所述cookie的生成时间的时间间隔;若所述时间间隔大于预设时长,则所述记录用户行为数据的第三方cookie为稳定cookie;根据所述稳定cookie,确定所述用户行为数据为有效数据。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不 限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可 擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1