用户标识的确定方法和装置与流程

文档序号:11147504阅读:715来源:国知局
用户标识的确定方法和装置与制造工艺
本申请涉及计算机领域,具体而言,涉及一种用户标识的确定方法和装置。
背景技术
:当前对网站进行数据分析时,要分析用户行为,首先就得标识用户,这样才知道一系列的行为与哪个用户关联,现有技术中,目前标识用户的主流的方法就是通过cookie对用户进行标识,也即,将cookie作为用户的唯一标识。cookie又分为第一方cookie和第三方cookie,通常第一方cookie被广泛支持和使用,然而涉及到跨域标识时,第一方cookie是做不到的。这时只能求助于第三方cookie。由于受浏览器等环境影响,第三方cookie标识的接受率要低于第一方cookie。通过上述内容可知,现有技术中要么使用缺少跨域标识功能的第一方cookie作为用户标识,要么使用能够提供跨域标识功能,但接受的准确率偏低的第三方cookie作为用户标识。针对上述的问题,目前尚未提出有效的解决方案。技术实现要素:本申请实施例提供了一种用户标识的确定方法和装置,以至少解决现有技术中只利用第一方cookie或者第三方cookie无法准确的确定出用户标识的技术问题。根据本申请实施例的一个方面,提供了一种用户标识的确定方法,包括:获取目标网站的访问日志;从所述访问日志的每条访问记录中提取cookie信息和账户ID;以及根据所述cookie信息和所述账户ID确定每条所述访问记录的用户标识。进一步地,所述cookie信息包括第一方cookie和第三方cookie,其中:从所述访问日志的每条访问记录中提取cookie信息和账户ID包括:从每条所述访问记录中提取第一方cookie的ID、第三方cookie的ID以及所述账户ID;依次对每条所述访问记录进行编号,并将每个所述编号和与所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID进行存储;根据所述cookie信息和所述账户ID确定每条所述访问记录的用户标识包括:根据每个所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID确定所述编号所对应的所述访问记录的用户标识。进一步地,根据每个所述编号对应的第一方cookie的ID、第三方cookie的ID以 及所述账户ID确定所述编号所对应的所述访问记录的用户标识包括:判断所述编号对应的所述第三方cookie的ID中是否存在数据,以及判断所述账户ID中是否存在数据;在判断出所述编号对应的所述第三方cookie的ID中不存在数据,并且所述账户ID中存在数据的情况下,确定所述编号所对应的所述访问记录的用户标识为所述账户ID。进一步地,根据每个所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID确定所述编号所对应的所述访问记录的用户标识还包括;在判断出所述编号对应的所述第三方cookie的ID中存在数据,并且所述账户ID中存在数据的情况下,确定所述编号所对应的所述访问记录的用户标识为所述账户ID。进一步地,根据每个所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID确定所述编号所对应的所述访问记录的用户标识还包括:在判断出所述编号对应的所述第三方cookie的ID中存在数据,并且判断出所述账户ID中不存在数据的情况下,确定所述编号所对应的所述访问记录的用户标识为所述第三方cookie的ID。进一步地,根据每个所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID确定所述编号所对应的所述访问记录的用户标识还包括:在判断出所述编号对应的所述第三方cookie的ID不中存在数据,并且所述账户ID的数据内容中不存在数据的情况下,确定所述编号所对应的所述访问记录的用户标识为所述第一方cookie的ID。进一步地,在根据每个所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID确定所述编号所对应的所述访问记录的用户标识之后,所述方法还包括:将每个所述编号和与所述编号对应的所述用户标识存储在数据库中。根据本申请实施例的另一方面,提供了一种用户标识的确定装置,包括:进一步地,获取单元,用于获取目标网站的访问日志;提取单元,用于从所述访问日志的每条访问记录中提取cookie信息和账户ID;以及确定单元,用于根据所述cookie信息和所述账户ID确定每条所述访问记录的用户标识。进一步地,所述cookie信息包括第一方cookie和第三方cookie,其中:所述提取单元包括:提取子单元,用于从每条所述访问记录中提取第一方cookie的ID、第三方cookie的ID以及所述账户ID;处理子单元,用于依次对每条所述访问记录进行编号,并将每个所述编号和与所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID进行存储;所述确定单元包括:确定子单元,用于根据每个所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID确定所述编号所对应的所述访问记录的用户标识。进一步地,所述确定子单元包括:判断模块,用于判断所述编号对应的所述第三方cookie的ID中是否存在数据,以及判断所述账户ID中是否存在数据;第一确定模块,用于在判断出所述编号对应的所述第三方cookie的ID中不存在数据,并且所述账户ID中存在数据的情况下,确定所述编号所对应的所述访问记录的用户标识为所述账户ID。进一步地,所述确定子单元还包括;第二确定模块,用于在判断出所述编号对应的所述第三方cookie的ID中存在数据,并且所述账户ID中存在数据的情况下,确定所述编号所对应的所述访问记录的用户标识为所述账户ID。进一步地,所述确定子单元还包括:第三确定模块,用于在判断出所述编号对应的所述第三方cookie的ID中存在数据,并且判断出所述账户ID中不存在数据的情况下,确定所述编号所对应的所述访问记录的用户标识为所述第三方cookie的ID。进一步地,所述确定子单元还包括:第四确定模块,用于在判断出所述编号对应的所述第三方cookie的ID中不存在数据,并且所述账户ID的数据内容中不存在数据的情况下,确定所述编号所对应的所述访问记录的用户标识为所述第一方cookie的ID。进一步地,所述确定子单元还包括:存储子单元,用于在根据每个所述编号对应的第一方cookie的ID、第三方cookie的ID以及所述账户ID确定所述编号所对应的所述访问记录的用户标识之后,将每个所述编号和与所述编号对应的所述用户标识存储在数据库中。在本申请实施例中,采用获取目标网站的访问日志;从所述访问日志的每条访问记录中提取cookie信息和账户ID;根据所述cookie信息和所述账户ID确定每条所述访问记录的用户标识,达到了准确的确定出用户标识的目的,从而解决了现有技术中只利用第一方cookie或者第三方cookie无法准确的确定出用户标识的技术问题,实现了提高确定用户标识的准确性的技术效果。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请实施例的一种用户标识的确定方法的流程图;以及图2是根据本申请实施例的一种用户标识的确定装置的示意图。具体实施方式为了使本
技术领域
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。根据本申请实施例,提供了一种用户标识的确定方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本申请实施例的一种用户标识的确定方法的流程图,如图1所示,该方法包括步骤S102至步骤S106,具体如下:步骤S102,获取目标网站的访问日志。具体地,可以通过在目标网站的网站页面部署脚本的方式,获取到目标网站的访问日志。其中,目标网站为需要分析用户行为的网站,可以是任一消费网站或者视频网站等,例如京东、淘宝、苏宁、唯品会、优酷等。步骤S104,从访问日志的每条访问记录中提取cookie信息和账户ID。具体地,cookie信息中可以包含第一方cookie和第三方cookie。其中,账户ID(又称为强账户),通过它可以非常精确的标识出用户,但并不容易获取到。步骤S106,根据cookie信息和账户ID确定每条访问记录的用户标识。在本申请实施例中,通过根据包含第一方cookie和第三方cookie的cookie信息和 账户ID共同确定出用户标识,与现有技术中,只根据第一方cookie或者第三方cookie确定出用户标识相比,能够更准确的确定出用户标识,从而解决了现有技术中只利用第一方cookie或者第三方cookie无法准确的确定出用户标识的技术问题,实现了提高确定用户标识的准确性的技术效果。可选地,在本申请实施例中,cookie信息包括第一方cookie和第三方cookie,其中:从访问日志的每条访问记录中提取cookie信息和账户ID包括步骤S1041至步骤S1043,具体如下:步骤S1041,从每条访问记录中提取第一方cookie的ID、第三方cookie的ID以及账户ID。步骤S1043,依次对每条访问记录进行编号,并将每个编号和与该编号对应的第一方cookie的ID、第三方cookie的ID以及账户ID进行存储。假设,访问日志中包含3条访问记录,则根据上述步骤S1041至步骤S1043可以得到下述表1所示的数据。表1编号cookieIDcookie3rdIDUserID…1xxxxxxxxxxxxx…2xxxxxxxxxxxxx…3xxxxxxxxxxxxx…其中,cookieID表示第一方cookie的ID,cookie3rdID表示第三方cookie的ID,UserID表示账号ID。需要说明的是,还可以通过脚本从每条访问记录中获取除上述信息之外的其它信息,其它信息同样可以与编号对应的存储(例如,表1中示出的“…”的内容)。根据cookie信息和账户ID确定每条访问记录的用户标识包括:根据每个编号对应的第一方cookie的ID、第三方cookie的ID以及账户ID确定编号所对应的访问记录的用户标识。参照表1,例如,根据编号1所对应的第一方cookie的ID、第三方cookie的ID以及账户ID确定出编号1所对应的访问记录的用户标识。在本申请的实施例中,通过将第一方cookie、第三方cookie以及账户ID相结合的方式来确定出用户标识,能够兼顾第一方cookie和第三方cookie利弊,达到了进一步提高确定用户标识的准确性以及支持域跨标识用户的技术效果。可选地,根据每个编号对应的第一方cookie的ID、第三方cookie的ID以及账户ID确定编号所对应的访问记录的用户标识包括:判断编号对应的第三方cookie的ID中是否存在数据,以及判断账户ID中是否存在数据,换而言之,也就是判断该编号对应的第三方cookie的ID的数据是否缺失,以及判断账户ID的数据是否缺失。虽然可以通过部署脚本获取上述第一方cookie的ID、第三方cookie的ID以及账户ID,但是由于受浏览器限制等原因,通常情况下可以获取到第一方cookie的ID的数据,确可能无法真正的获取到第三方cookie的ID的数据以及账户ID的数据,也即关于第三方cookie的ID和账户ID存在数据缺失的情况,因此关于上述判断的判断结果有以下几种情况,具体如下:情况一,在判断出编号对应的第三方cookie的ID中不存在数据,并且账户ID中存在数据的情况下,确定编号所对应的访问记录的用户标识为账户ID。具体地,上述判断结果还可以通过下式表示,具体为:若cookie3rdID=”,并且userID!=”,则uvID=UserID。其中,”表示数据缺失,cookieID表示第一方cookie的ID,cookie3rdID表示第三方cookie的ID,UserID表示账号ID,uvID表示用户标识。在本申请实施例中,提供了当同一个用户的cookieID不一致时,确定出用户标识的方式。需要说明的是,同一个用户的cookieID不一致可能是由于cookie重新生成等原因导致的。情况二,在判断出编号对应的第三方cookie的ID中存在数据,并且账户ID中存在数据的情况下,确定该编号所对应的访问记录的用户标识为账户ID。同样的,上述判断结果还可以通过下式表示,具体为:若userID!=”,并且cookie3rdID!=”,则uvID=userID。在本申请实施例中,提供了对同一个用户跨域标识时,确定出用户标识的方式。需要说明的是,当一个用户登录A网站,又登录B网站,A网站和B网站的域名不同,对该用户进行标识即为跨域标识。情况三,在判断出编号对应的第三方cookie的ID中存在数据,并且判断出账户ID中不存在数据的情况下,确定编号所对应的访问记录的用户标识为第三方cookie的ID。同样的,上述判断结果还可以通过下式表示,具体为:若userID=”,并且cookie3rdID!=”,则uvID=cookie3rID。在本申请实施例中,提供了对部分跨域用户标识时,确定出用户标识的方式。情况四,在判断出编号对应的第三方cookie的ID中不存在数据,并且账户ID的数据内容中不存在数据的情况下,确定编号所对应的访问记录的用户标识为第一方cookie的ID。同样的,上述判断结果还可以通过下式表示,具体为:若userID=”,并且cookie3rdID=”,则uvID=cookieID。通过内容可知,本申请所提供的方案整合了多个确定用户标识的方法,取长补短,不仅支持跨域确定出用户标识,还提高了确定出的用户标识的准确率。需要说明的是,跨域确定用户标识需要依赖于第三方cookie信息的获取。可选地,在根据每个编号对应的第一方cookie的ID、第三方cookie的ID以及账户ID确定编号所对应的访问记录的用户标识之后,方法还包括:将每个编号和与编号对应的用户标识存储在数据库中。具体地,基于表1,可以得到下述表2所示的数据。表2数据编号Uvid…1xxxx…2xxxx…3xxxx…需要说明的是,访问记录中获取到的其它信息在表2中只是示意性的示出了一列,用“…”表示,可以有多列内容。根据本申请实施例,还提供了一种用户标识的确定装置,该用户标识的确定装置用于执行本申请实施例上述内容所提供的用户标识的确定方法,以下对本申请实施例所提供的用户标识的确定装置做具体介绍:图2是根据本申请实施例的一种用户标识的确定装置的示意图,如图2所示,该确定装置主要包括获取单元21、提取单元23和确定单元25,其中:获取单元21用于获取目标网站的访问日志。具体地,可以通过在目标网站的网站页面部署脚本的方式,获取到目标网站的访问日志。提取单元23用于从访问日志的每条访问记录中提取cookie信息和账户ID。具体地,cookie信息中可以包含第一方cookie和第三方cookie。确定单元25用于根据cookie信息和账户ID确定每条访问记录的用户标识。在本申请实施例中,通过根据包含第一方cookie和第三方cookie的cookie信息和账户ID共同确定出用户标识,与现有技术中,只根据第一方cookie或者第三方cookie确定出用户标识相比,能够更准确的确定出用户标识,从而解决了现有技术中只利用第一方cookie或者第三方cookie无法准确的确定出用户标识的技术问题,实现了提高确定用户标识的准确性的技术效果。可选地,在本申请实施例中,cookie信息包括第一方cookie和第三方cookie,其中:提取单元包括:提取子单元,用于从每条访问记录中提取第一方cookie的ID、第三方cookie的ID以及账户ID;处理子单元,用于依次对每条访问记录进行编号,并将每个编号和与该编号对应的第一方cookie的ID、第三方cookie的ID以及账户ID进行存储。确定单元包括:确定子单元,用于根据每个编号对应的第一方cookie的ID、第三方cookie的ID以及账户ID确定编号所对应的访问记录的用户标识。在本申请的实施例中,通过将第一方cookie、第三方cookie以及账户ID相结合的方式来确定出用户标识,能够兼顾第一方cookie和第三方cookie利弊,达到了进一步提高确定用户标识的准确性以及支持域跨标识用户的技术效果。可选地,在本申请实施例中,确定子单元包括:判断模块,用于判断编号对应的第三方cookie的ID中是否存在数据,以及判断账户ID中是否存在数据,换而言之,也就是判断该编号对应的第三方cookie的ID的数据是否缺失,以及判断账户ID的数据是否缺失。虽然可以通过部署脚本获取上述第一方cookie的ID、第三方cookie的ID以及账户ID,但是由于受浏览器限制等原因,通常情况下可以获取到第一方cookie的ID的数据,确可能无法真正的获取到第三方cookie的ID的数据以及账户ID的数据,也即关于第三方cookie的ID和账户ID存在数据缺失的情况,因此关于判断模块上述判断的判断结果有以下几种情况,具体如下:情况一,确定子单元还包括第一确定模块。其中,第一确定模块用于在判断出编号对应的第三方cookie的ID中不存在数据,并且账户ID中存在数据的情况下,确定编号所对应的访问记录的用户标识为账户ID。在本申请实施例中,提供了当同一个用户的cookieID不一致时,确定出用户标识的方式。需要说明的是,同一个用户的cookieID不一致可能是由于cookie重新生成等原因导致的。情况二,确定子单元还包括第二确定模块。其中,第二确定模块用于在判断出编号对应的第三方cookie的ID中存在数据,并且账户ID中存在数据的情况下,确定编号所对应的访问记录的用户标识为账户ID。在本申请实施例中,提供了对同一个用户跨域标识时,确定出用户标识的方式。需要说明的是,当一个用户登录A网站,又登录B网站,A网站和B网站的域名不同,对该用户进行标识即为跨域标识。情况三,确定子单元还包括第三确定模块。其中,第三确定模块用于在判断出编号对应的第三方cookie的ID中存在数据,并且判断出账户ID中不存在数据的情况下,确定编号所对应的访问记录的用户标识为第三方cookie的ID。在本申请实施例中,提供了对部分跨域用户标识时,确定出用户标识的方式。情况四,确定子单元还包括第四确定模块。其中,第四确定模块用于在判断出编号对应的第三方cookie的ID中不存在数据,并且账户ID的数据内容中不存在数据的情况下,确定编号所对应的访问记录的用户标识为第一方cookie的ID。通过内容可知,本申请所提供的方案整合了多个确定用户标识的方法,取长补短,不仅支持跨域确定出用户标识,还提高了确定出的用户标识的准确率。需要说明的是,跨域确定用户标识需要依赖于第三方cookie信息的获取。可选地,装置还包括:存储子单元,用于在根据每个编号对应的第一方cookie的ID、第三方cookie的ID以及账户ID确定编号所对应的访问记录的用户标识之后,将每个编号和与编号对应的用户标识存储在数据库中。所述用户标识的确定装置包括处理器和存储器,上述获取单元、提取单元和确定单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元。处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数解决了现有技术中只利用第一方cookie或者第三方cookie无法准确的确定出用户标识的技术问题,实现了提高确定用户标识的准确性的技术效果。存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flashRAM),存储器包括至少一 个存储芯片。本申请还提供了一种计算机程序产品的实施例,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序代码:获取目标网站的访问日志;从所述访问日志的每条访问记录中提取cookie信息和账户ID;以及根据所述cookie信息和所述账户ID确定每条所述访问记录的用户标识。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。以上所述仅是本申请的优选实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1