本发明涉及数据分析,具体而言,涉及一种互联网用户识别方法、电子设备和存储介质。
背景技术:
1、随着信息技术的发展,为了满足人们多样性的精神文化需求,各种组织内外部的应用程序越来越多,因此也产生了海量的数据。这些数据中包含了众多的不同类型用户标识发生的行为数据。这些数据看似孤立的,但又存在着关联。如何从多种数据来源,海量的数据,复杂的关系网络中识别出同一用户或者主体的行为,把不同应用或者功能模块中的碎片化用户行为特征串联起来,从而完整准确的刻画用户画像,是id mapping技术要解决的问题。
2、在网络金融服务行业中,通过多种不同的渠道为客户提供各种不同的服务是常见的模式。不同的渠道往往有不同的开发者、由不同的服务商进行维护并将数据保存在不同的服务器上。同一用户在不同的渠道服务中会使用不同的账号和设备,二现有技术无法准确解决同一用户身份标识的问题,造成金融企业难以识别用户身份,无法为用户生成全域全生命周期通用的唯一身份标识。是金融企业无法获得完整的用户图像,无法精确地识别客户需求为客户提供专门定值的服务。
3、本领域需要提供一种互联网用户识别方法、电子设备和存储介质,其能够克服现有技术的缺陷。
技术实现思路
1、本发明提供了一种互联网用户识别方法、电子设备和存储介质。其能够解决现有技术存在的问题。本发明的目的通过以下技术方案得以实现。
2、第一方面,本发明的一个实施方式提供了一种互联网用户识别方法,其包括多个步骤:
3、步骤1:使用数据仓库生成或更新id mapping实例;以及
4、步骤2:根据实时用户行为生成或更新id mapping实例,
5、其中,步骤1:使用数据仓库生成或更新id mapping实例包括下列步骤:
6、步骤11:从数据仓库获取用户行为数据并去除重复的用户行为数据,其中,用户行为数据包括用户标识信息;
7、步骤12:过滤用户标识信息,将用户标识信息分别归类为第一用户标识或第二用户标识;
8、步骤13:根据用户行为数据建立用户标识信息之间的标识聚合,其中,标识聚合是第一用户标识和第二用户标识的集合,同一标识聚合中的第一用户标识和第二用户标识对应同一用户;
9、步骤14:判断是否存在与标识聚合中的第一用户标识对应的id mapping实例,若“是”,执行步骤15;
10、步骤15:分别判断标识聚合中的每个第一用户标识和第二用户标识是否在idmapping实例中存在对应的要素信息,若“是”,执行步骤16;以及
11、步骤16:更新要素信息。
12、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中步骤2:根据实时用户行为生成或更新id mapping实例包括下列步骤:
13、步骤21:从实时用户行为中获取用户标识信息,判断用户标识信息中是否包含身份证信息,若“是”,执行步骤22;
14、步骤22:过滤用户标识信息,将用户标识信息分别归类为第一用户标识或第二用户标识;
15、步骤23:判断是否存在与用户标识信息中的第一用户标识对应的vid信息,若“是”,执行步骤23;以及
16、步骤24:更新要素信息。
17、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中第一用户标识具有优先级,不同的第一用户标识的优先级不相同。
18、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中步骤15:分别判断标识聚合中的每个第一用户标识和第二用户标识是否在id mapping实例中存在对应的要素信息,若“否”,执行步骤17;
19、步骤17:执行要素信息生成处理,其中,要素信息生成处理根据第一用户标识和第二用户标识生成对应的要素信息。
20、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中执行要素信息生成处理包括下列步骤:
21、步骤41:根据第一用户标识生成对应的xid并建立对应的要素信息;以及
22、步骤42:根据第二用户标识建立对应的要素信息。
23、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中步骤14:判断是否存在与标识聚合中的第一用户标识对应的id mapping实例,若“否”,执行步骤18;
24、步骤18:执行要素信息生成处理;
25、步骤19:将标识聚合中优先级最高的第一用户标识的xid设为vid并建立对应的vid要素信息。
26、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中步骤21:从实时用户行为中获取用户标识信息,判断用户标识信息中是否包含身份证信息,若“否”,执行步骤25;
27、步骤25:分别判断用户标识信息中的每个第一用户标识和第二用户标识是否在idmapping实例中存在对应的要素信息,若“是”,执行步骤24;若“否”,执行步骤26;
28、步骤26:执行要素信息生成处理。
29、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中步骤23:判断是否存在与用户标识信息中的第一用户标识对应的vid信息,若“否”,执行步骤27;
30、步骤27:执行要素信息生成处理;以及
31、步骤28:将用户标识信息中优先级最高的第一用户标识的xid设为vid并建立对应的vid要素信息。
32、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中去除重复的用户行为数据是指去除用户行为数据中用户标识信息相同且用户行为相同的数据。
33、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中第一用户标识是与用户的现实身份关联的用户标识信息。
34、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中第二用户标识对应的要素信息包括可靠值,可靠值根据数据仓库中的用户行为数据和实时用户行为设定或调整。
35、根据本发明的上述一个实施方式提供的互联网用户识别方法,其中步骤42:根据第二用户建立对应的要素信息包括根据第二用户的用户行为设定要素信息中第二用户对应的可靠值。
36、第二方面,本发明的一个实施方式提供了一种电子设备,其包括:
37、一个或多个处理器;
38、存储装置,其上存储有一个或多个程序,
39、当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如前述的互联网用户识别方法。
40、第三方面,本发明的一个实施方式提供了一种计算机可读存储介质,其上存储有计算机程序,其中,计算机程序被一个或多个处理器执行时实现前述的互联网用户识别方法。
41、根据本发明实施方式的互联网用户识别方法、电子设备和存储介质的优点在于:解决了不同渠道,不同生态,同一用户不同身份标识的问题,将用户不同身份要素(设备id,身份证,手机号,微信号,不同渠道的身份id等)关联到唯一一个id上(vid),此id跟随用户整个生命周期,与全渠道身份要素映射,唯一且不变;对外提供全域id-mapping服务,为使用者提供跨用户生命周期,跨渠道的营销提供有力支持;能够实时更新身份要素,及时更新身份要素的可靠度数值,提高用户身份识别准确度。