数据处理方法、装置及设备与流程

文档序号:33620234发布日期:2023-03-25 11:17阅读:48来源:国知局
数据处理方法、装置及设备与流程

1.本文件涉及数据处理技术领域,尤其涉及一种数据处理方法、装置及设备。


背景技术:

2.随着计算机技术的快速发展,企业为用户提供的应用服务的种类和数量也越来越多,随之而来的用户数据的数据量日益增加,数据结构也日趋复杂,这就导致对用户进行风险检测的复杂度较高。
3.在对用户进行风险检测时,可以根据同一用户在不同场景下的风险标签和训练数据,对不同的检测模型进行训练,在根据当前所处场景选取对应的训练完成的检测模型,对待检测的用户进行风险检测。但是,由于只通过当前场景下的数据和模型对用户进行风险检测,这就会导致针对用户的风险检测准确性差,因此,需要一种能够提高针对用户进行风险检测的检测准确性的解决方案。


技术实现要素:

4.本说明书实施例的目的是提供一种数据处理方法、装置及设备,以提供一种能够提高针对用户进行风险检测的检测准确性的解决方案。
5.为了实现上述技术方案,本说明书实施例是这样实现的:第一方面,一种数据处理方法,包括:获取与目标用户触发执行目标业务相关的目标数据,所述目标数据包括在所述目标用户的账户生命周期的多个不同阶段中,与每个所述阶段对应的子数据;基于预先训练的风险检测模型,对所述目标数据进行风险检测处理,得到所述目标用户对应的风险类型,所述风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的所述子网络用于对不同的所述阶段的子数据进行风险检测处理,所述风险检测模型为基于历史数据依次对所述子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个所述子网络的优化方向;基于所述目标用户对应的风险类型,确定所述目标用户是否为风险用户。
6.第二方面,本说明书实施例提供了一种数据处理装置,所述装置包括:第一获取模块,用于获取与目标用户触发执行目标业务相关的目标数据,所述目标数据包括在所述目标用户的账户生命周期的多个不同阶段中,与每个所述阶段对应的子数据;类型确定模块,用于基于预先训练的风险检测模型,对所述目标数据进行风险检测处理,得到所述目标用户对应的风险类型,所述风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的所述子网络用于对不同的所述阶段的子数据进行风险检测处理,所述风险检测模型为基于历史数据依次对所述子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个所述子网络的优化方向;风险检测模块,用于基于所述目标用户对应的风险类型,确定所述目标用户是否为风险用户。
7.第三方面,本说明书实施例提供了一种数据处理设备,所述数据处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述
处理器:获取与目标用户触发执行目标业务相关的目标数据,所述目标数据包括在所述目标用户的账户生命周期的多个不同阶段中,与每个所述阶段对应的子数据;基于预先训练的风险检测模型,对所述目标数据进行风险检测处理,得到所述目标用户对应的风险类型,所述风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的所述子网络用于对不同的所述阶段的子数据进行风险检测处理,所述风险检测模型为基于历史数据依次对所述子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个所述子网络的优化方向;基于所述目标用户对应的风险类型,确定所述目标用户是否为风险用户。
8.第四方面,本说明书实施例提供一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被执行时实现以下流程:获取与目标用户触发执行目标业务相关的目标数据,所述目标数据包括在所述目标用户的账户生命周期的多个不同阶段中,与每个所述阶段对应的子数据;基于预先训练的风险检测模型,对所述目标数据进行风险检测处理,得到所述目标用户对应的风险类型,所述风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的所述子网络用于对不同的所述阶段的子数据进行风险检测处理,所述风险检测模型为基于历史数据依次对所述子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个所述子网络的优化方向;基于所述目标用户对应的风险类型,确定所述目标用户是否为风险用户。
附图说明
9.为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
10.图1a为本说明书一种数据处理方法实施例的流程图;图1b为本说明书一种数据处理方法的处理过程示意图;图2为本说明书一种目标数据的示意图;图3为本说明书另一种目标数据的示意图;图4为本说明书一种控制优化方向的示意图;图5为本说明书一种数据处理过程的示意图;图6为本说明书又一种数据处理方法的处理过程示意图;图7为本说明书一种数据处理装置实施例的结构示意图;图8为本说明书一种数据处理设备的结构示意图。
具体实施方式
11.本说明书实施例提供一种数据处理方法、装置及设备。
12.为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于
本说明书保护的范围。
13.实施例一如图1a和图1b所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为服务器,其中,该服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:在s102中,获取与目标用户触发执行目标业务相关的目标数据。
14.其中,目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,目标用户的账户生命周期可以用于表示目标用户从创建账户,以创建的账户开始触发执行目标业务,到逐渐多次触发执行业务的过程,即目标用户的账户生命周期可以表征目标用户从创建账户到目标用户发展成为成熟用户的动态过程,目标业务可以是任意业务,例如,以目标业务可以为资源转移业务等。
15.在实施中,随着计算机技术的快速发展,企业为用户提供的应用服务的种类和数量也越来越多,随之而来的用户数据的数据量日益增加,数据结构也日趋复杂,这就导致对用户进行风险检测的复杂度较高。在对用户进行风险检测时,可以根据同一用户在不同场景下的风险标签和训练数据,对不同的检测模型进行训练,在根据当前所处场景选取对应的训练完成的检测模型,对待检测的用户进行风险检测。但是,由于只通过当前场景下的数据和模型对用户进行风险检测,这就会导致针对用户的风险检测准确性差,因此,需要一种能够提高针对用户进行风险检测的检测准确性的解决方案。为此,本说明书实施例提供一种可以解决上述问题的技术方案,具体可以参见下述内容。
16.在实施中,以目标业务为资源转移业务为例,可以基于目标用户的标识,获取目标用户的账户生命周期,例如,假设目标用户已通过账户多次触发执行资源转移业务(即目标用户已经成为成熟用户),那么,该目标用户的账户生命周期就可以基于一个或多个节点划分的多个阶段,具体如,如图2所示,可以将目标用户首次触发执行目标业务的时间点为节点,在基于确定的节点将目标用户的账户生命周期划分为2个阶段,或者,还可以将目标用户触发执行资源转移业务的资源转移数量超过资源转移阈值的时间点确定为节点,再通过这两个节点对账户生命周期进行划分,如假设目标用户在1月1日和1月15日的资源转移数量超过资源转移阈值,那么,如图3所示,可以将这两个时间点确定为节点,并通过这两个节点对目标用户的账户生命周期进行划分,得到3个阶段。
17.此外,上述目标用户的账户生命周期的阶段划分方法是一种可选地、可实现的划分方法,在实际应用场景中,还可以有多种不同的划分方法,可以根据实际应用场景的不同选取不同的划分方法,本说明书实施例对此不作具体限定。
18.由于每个阶段的数据特征不同,因此,可以基于每个阶段对应的子数据,构建目标数据,例如,假设如图2所示,目标数据可以包括阶段1和阶段2对应的子数据,其中,在阶段1中由于目标用户并未触发执行目标业务,因此,阶段1对应的子数据可以侧重于目标用户的用户数据(如目标用户的特征数据、与目标用户使用的设备相关的数据等),而阶段2是目标用户已经触发执行目标业务的阶段,因此,阶段2对应的子数据可以侧重于触发执行目标业务相关的数据等。
19.另外,上述不同阶段的子数据的确定方法是一种可选地、可实现的划分方法,在实际应用场景中,还可以有多种不同的确定方法,可以根据实际应用场景的不同选取不同的
确定方法,本说明书实施例对此不作具体限定。
20.在s104中,基于预先训练的风险检测模型,对目标数据进行风险检测处理,得到目标用户对应的风险类型。
21.其中,风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的子网络用于对不同的阶段的子数据进行风险检测处理,风险检测模型为基于历史数据依次对子网络进行训练得到,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个子网络的优化方向,终身学习又称持续学习、增量学习,终身学习算法强调学习序列式任务的可塑性及稳定性,即当需要有序地学习多个任务时,能够将前一个任务的知识应用到下一个任务上,学习后一个任务时也不会忘记如何做前一个任务,而在终身学习算法中,易产生灾难性遗忘问题,即在对由终身学习算法构建的模型进行训练的过程中,由于模型学习到的知识与特征是存储在模型参数中,当对模型进行更新时,可以使模型在另一数据集中学习一个新任务,此时,模型中的参数会被更新,而对旧任务的知识就会被覆盖,这就会导致更新后的模型针对旧任务表现出“灾难性遗忘”,因此,可以通过正则约束方法解决终身学习算法中可能出现的灾难性遗忘问题,即在对风险检测模型中的第一个子网络训练完成后,可以计算训练完成的子网络中每个参数对于风险检测任务的重要性,并将训练完成的子网络的参数的重要性作为参数,以正则项的形式加入到下一个子网络的损失函数中以控制优化方向,使得参数在不同风险检测任务上都能保持较为良好的性能。
22.在实施中,风险检测模型可以是基于终身学习正则约束算法构建,其中,终身学习正则约束算法可以为ewc算法、mas算法、si算法等,ewc算法可以通过贝叶斯方法和拉普拉斯近似限制参数的更新,以fisher信息矩阵近似的刻画每个参数的重要程度,mas算法可以将模型前向传递过程视为一个函数,用函数对于参数的敏感程度来衡量每个参数的重要性。
23.以风险检测模型包括子网络1和子网络2为例,在对风险检测模型进行训练时,如图4所示,若在训练完子网络1的情况下,直接训练子网络2,那么,优化方向就为无约束方向,即最优参数从子网络1直接移到了子网络2,那么,风险检测模型就会失去在子网络1上学习到的知识。若仅通过l2正则约束,那么,优化方向就为图4中的l2正则约束方向。若通过训练完成的子网络1子网络的参数的重要性对子网络2进行正则约束,那么,优化方向就会移到子网络1与子网络2的公共区域,即在对子网络2进行训练时,不会失去子网络1上学习到的知识,使得子网络1和子网络2都有良好的性能。
24.在对风险检测模型训练完成后,假设目标数据包括阶段1对应的子数据1以及阶段2对应的子数据2,那么,可以将目标数据输入风险检测模型,其中,如图5所示,风险检测模型中的子网络1相较于子网络2,更侧重于对子数据1的检测,同样的,子网络2相较于子网络1,对更侧重于对子数据2的检测。
25.这样,相较于对多个子网络进行联合训练的方法,基于终身学习算法构建的风险检测模型可以通过目标数据中包含的不同阶段的子数据对不同的子网络,可以缓解联合训练方法中存在的模型对不同阶段的风险的识别能力较差问题。相较于多任务学习方法,基于终身学习算法构建的风险检测模型中的序列式的学习方式可以避免特征穿越的问题。相较于不加约束的序列式训练,基于终身学习算法构建的风险检测模型通过增加正则约束项的形式进行优化,可以通过控制损失函数的优化方向来缓解灾难性遗忘的问题。
26.在s106中,基于目标用户对应的风险类型,确定目标用户是否为风险用户。
27.其中,风险类型可以包括高风险、中风险、低风险、无风险等,可以根据实际应用场景的不同选取不同的风险类型,本说明书实施例对此不作具体限定。
28.在实施中,可以根据当前场景的不同,以及目标用户对应的风险类型,确定目标用户是否为风险用户。例如,在目标用户对应的风险类型为中风险的情况下,若当前场景为用户登录场景,则可以确定目标用户不是风险用户,可以继续登录操作,若当前场景为资源转移场景,则可以确定目标用户为风险用户,可以暂停资源转移操作,即可以根据当前场景的风险检测需要,以及目标用户对应的风险类型,对目标用户是否为风险用户进行更为精准的判断。
29.上述对目标用户是否为风险用户的判断方法是一种可选地、可实现的判断方法,在实际应用场景中,还可以有多种不同的判断方法,可以根据实际应用场景的不同选取不同的判断方法,本说明书实施例对此不作具体限定。
30.本说明书实施例提供一种数据处理方法,获取与目标用户触发执行目标业务相关的目标数据,目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,基于预先训练的风险检测模型,对目标数据进行风险检测处理,得到目标用户对应的风险类型,风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的子网络用于对不同的阶段的子数据进行风险检测处理,风险检测模型为基于历史数据依次对子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个子网络的优化方向,基于目标用户对应的风险类型,确定目标用户是否为风险用户。这样,一方面,由于目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,因此,通过风险检测模型对目标数据进行处理,可以实现通过风险检测模型学习到目标用户的在不同阶段(即目标用户的账户生命周期的不同阶段)的风险表现形式,可以关注到不同阶段间的共性,以及刻画出不同阶段的差异性,能够动态地刻画目标用户的账户生命周期的多个阶段的风险变化的过程。另一方面,由于风险检测模型是基于终身学习算法构建的包括多个子网络的模型,并且前一个训练完成的子网络的参数的重要性可以通过正则约束的方式控制下一个子网络的优化方向,这就可以缓解模型训练过程中存在的灾难性遗忘的问题,可以保证风险检测模型在不同阶段的风险识别效果及稳定性,实现对覆盖目标用户的账户生命周期的风险识别能力,提高针对目标用户的风险检测准确性。
31.实施例二如图6所示,本说明书实施例提供一种数据处理方法,该方法的执行主体可以为服务器,其中,服务器可以是独立的服务器,也可以是由多个服务器组成的服务器集群。该方法具体可以包括以下步骤:在s602中,获取历史用户的历史数据,以及历史用户对应的风险类型。
32.其中,历史数据包括在历史用户的账户生命周期的多个不同历史阶段中,与每个历史阶段对应的历史子数据,历史用户的账户生命周期可以包括账户未注册成功阶段、账户注册成功且未触发执行业务阶段,以及触发执行业务阶段等。
33.在s604中,将历史数据输入风险检测模型。
34.在s606中,基于历史阶段中的第一阶段对应的历史子数据对风险检测模型中的第
一子网络进行训练,并在第一子网络收敛的情况下,确定训练得到的第一子网络中每个参数的重要性。
35.在实施中,可以将历史数据输入第一子网络,并通过历史数据中包括的历史阶段中的第一阶段对应的历史子数据,对风险检测模型中的第一子网络进行训练,即可以通过第一子网络得到第一输出结果,可以基于第一输出结果和历史用户对应的风险类型,确定第一子网络是否收敛,若第一子网络未收敛,则可以基于历史数据中包括的历史阶段中的第一阶段对应的历史子数据,继续对第一子网络进行训练,直到第一子网络收敛。
36.在第一子网络收敛的情况下,可以通过ewc算法或mas算法等终身学习正则约束算法确定第一子网络中每个参数的重要性,以通过每个参数的重要性,使得重要性较大的参数在后续子网络的训练过程中不会轻易地发生变化,使得模型优化方向朝着风险检测模型中所有子网络的低误差区域变化,以保证风险检测模型的效能。
37.在s608中,基于历史阶段中与第一阶段相邻的后一阶段对应的历史子数据、训练得到的第一子网络中每个参数及重要性,对风险检测模型中的第二子网络进行训练。
38.在实施中,在实际应用中,风险检测模型的多个子网络的网络结构相同,例如,子网络的网络结构可以为多层感知机(multilayer perceptron,mlp)等,可以根据实际应用场景的不同选取不同的网络结构,本技术说明书对此不作具体限定,这样,在风险检测模型的训练过程中,每个子网络的特征空间和网络结构可以保持不变,因此,以下提供一种可选的实现方式,具体可以参见下述步骤一~步骤二处理:步骤一,将历史数据输入第二子网络,得到第二输出结果。
39.步骤二,基于第二输出结果、历史用户的风险类型、训练得到的第一子网络中每个参数及重要性,确定第二子网络是否收敛。
40.在实施中,可以基于第二输出结果和历史用户的风险类型,得到第一损失值,再基于训练得到的第一子网络中每个参数及重要性,得到第二损失值。
41.其中,在确定第二损失值时,可以确定第二子网络中每个参数与训练得到的第一子网络中每个参数的差值的平方与第一子网络中每个参数的重要性的乘积,再基于第一子网络中每个参数对应的乘积和预设超参数,确定第二损失值。
42.例如,可以将第二子网络中每个参数、训练得到的第一子网络中每个参数及重要性以及预设超参数输入公式,得到第二损失值,其中,为第二损失值,为第一子网络的第i个参数的重要性,为第二子网络的第i个参数,为第一子网络的第i个参数,为预设超参数。
43.最后,可以基于第一损失值和第二损失值,确定目标损失值,并基于目标损失值,确定第二子网络是否收敛。例如,可以将第一损失值和第二损失值的和值,确定为目标损失值,以基于目标损失值,确定第二子网络是否收敛。
44.在s610中,在第二子网络收敛的情况下,得到训练后的风险检测模型。
45.在实施中,上述是以风险检测模型包含第一子网络和第二子网络为例,在实际应用场景中,风险检测模型还可以包括两个以上的子网络,例如,假设风险检测模型包括3个子网络,那么,在对风险检测模型进行训练时,前两个子网络的训练方法可以参见上述步骤
s606~s608,在对第二子网络训练完成后,可以参照对第二子网络进行训练的方法,通过训练完成的第二子网络,对第三子网络进行训练,以得到训练后的风险检测模型,在此不再赘述。
46.此外,用户从注册账户到成为活跃成熟的用户,其对应的账户生命周期是一个动态发展的过程,那么从风险控制的角度来看,这一动态发展的过程就可以对应着账号注册成功、触发执行业务前,以及触发执行业务这一序列式的风险识别任务。同时,用户在不同发展阶段中风险形式也存在一定的共性和差异,因此,可以通过终身学习算法构建风险检测模型。即目标用户的账户生命周期可以包括账户未注册成功阶段、账户注册成功且未触发执行业务阶段,以及触发执行业务阶段,这三个阶段存在时间三个的先后关系。
47.在s612中,获取目标用户在账户未注册成功时对应的设备信息和操作行为信息,并将获取的设备信息和操作行为信息,确定为与账户未注册成功阶段对应的子数据。
48.其中,设备信息可以包括账户未注册成功时,目标用户使用过的设备信息,如设备型号、设备地址、使用频次等,操作行为信息可以是目标用户在交互过程中触发的行为信息,如操作行为信息可以包括目标用户点击某图片时的点击时间和点击对象等。
49.在s614中,将目标用户输入的用户信息,确定为与账户注册成功且未触发执行业务阶段对应的子数据。
50.其中,用户信息可以包括目标用户输入的生物特征信息等。
51.在s616中,获取目标用户触发执行目标业务对应的业务数据,并将获取的业务数据确定为与触发执行业务阶段对应的子数据。
52.其中,目标用户可以多次触发执行目标业务,服务器可以获取目标用户每次触发执行目标业务对应的业务数据,业务数据可以包括触发执行目标业务的时间等数据。
53.在实施中,以目标业务为资源转移业务为例,触发执行目标业务对应的业务数据包括资源转移时间、资源转移数量、资源转移对象等。
54.在s104中,基于预先训练的风险检测模型,对目标数据进行风险检测处理,得到目标用户对应的风险类型。
55.其中,风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的子网络用于对不同的阶段的子数据进行风险检测处理,风险检测模型为基于历史数据依次对子网络进行训练得到,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个子网络的优化方向。
56.在s106中,基于目标用户对应的风险类型,确定目标用户是否为风险用户。
57.在s618中,在接收到目标用户触发针对目标业务的执行请求的情况下,基于目标用户对应的风险类型,确定触发执行目标业务是否存在风险。
58.在实施中,以目标业务为资源转移业务为例,在接收到目标用户触发针对资源转移业务的执行请求的情况下,若目标用户对应的风险类型为中风险,则可以确定触发执行目标业务存在风险,可以停止执行目标业务,并输出预设告警信息。
59.本说明书实施例提供一种数据处理方法,获取与目标用户触发执行目标业务相关的目标数据,目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,基于预先训练的风险检测模型,对目标数据进行风险检测处理,得到目标用户对应的风险类型,风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同
的子网络用于对不同的阶段的子数据进行风险检测处理,风险检测模型为基于历史数据依次对子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个子网络的优化方向,基于目标用户对应的风险类型,确定目标用户是否为风险用户。这样,一方面,由于目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,因此,通过风险检测模型对目标数据进行处理,可以实现通过风险检测模型学习到目标用户的在不同阶段(即目标用户的账户生命周期的不同阶段)的风险表现形式,可以关注到不同阶段间的共性,以及刻画出不同阶段的差异性,能够动态地刻画目标用户的账户生命周期的多个阶段的风险变化的过程。另一方面,由于风险检测模型是基于终身学习算法构建的包括多个子网络的模型,并且前一个训练完成的子网络的参数的重要性可以通过正则约束的方式控制下一个子网络的优化方向,这就可以缓解模型训练过程中存在的灾难性遗忘的问题,可以保证风险检测模型在不同阶段的风险识别效果及稳定性,实现对覆盖目标用户的账户生命周期的风险识别能力,提高针对目标用户的风险检测准确性。
60.实施例三以上为本说明书实施例提供的数据处理方法,基于同样的思路,本说明书实施例还提供一种数据处理装置,如图7所示。
61.该数据处理装置包括:第一获取模块701、类型确定模块702和风险检测模块703,其中:第一获取模块701,用于获取与目标用户触发执行目标业务相关的目标数据,所述目标数据包括在所述目标用户的账户生命周期的多个不同阶段中,与每个所述阶段对应的子数据;类型确定模块702,用于基于预先训练的风险检测模型,对所述目标数据进行风险检测处理,得到所述目标用户对应的风险类型,所述风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的所述子网络用于对不同的所述阶段的子数据进行风险检测处理,所述风险检测模型为基于历史数据依次对所述子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个所述子网络的优化方向;风险检测模块703用于基于所述目标用户对应的风险类型,确定所述目标用户是否为风险用户。
62.本说明书实施例中,所述装置还包括:第二获取模块,用于获取历史用户的历史数据,以及所述历史用户对应的风险类型,所述历史数据包括在所述历史用户的账户生命周期的多个不同历史阶段中,与每个所述历史阶段对应的历史子数据;数据输入模块,用于将所述历史数据输入所述风险检测模型;第一训练模块,用于基于所述历史阶段中的第一阶段对应的历史子数据对所述风险检测模型中的第一子网络进行训练,并在所述第一子网络收敛的情况下,确定训练得到的所述第一子网络中每个参数的重要性;第二训练模块,用于基于所述历史阶段中与所述第一阶段相邻的后一阶段对应的历史子数据、所述训练得到的所述第一子网络中每个参数及重要性,对所述风险检测模型
中的第二子网络进行训练,并在所述第二子网络收敛的情况下,得到训练后的所述风险检测模型。
63.本说明书实施例中,所述第二训练模块,用于:将所述历史数据输入所述第二子网络,得到所述第二输出结果;基于所述第二输出结果、所述历史用户的风险类型、所述训练得到的所述第一子网络中每个参数及重要性,确定所述第二子网络是否收敛。
64.本说明书实施例中,所述第二训练模块,用于:基于所述第二输出结果和所述历史用户的风险类型,得到第一损失值;基于所述训练得到的所述第一子网络中每个参数及重要性,得到第二损失值;基于所述第一损失值和所述第二损失值,确定目标损失值,并基于所述目标损失值,确定所述第二子网络是否收敛。
65.本说明书实施例中,所述风险检测模型的多个子网络的网络结构相同,所述第二训练模块,用于:确定所述第二子网络中每个参数与所述训练得到的所述第一子网络中每个参数的差值的平方与所述第一子网络中每个参数的重要性的乘积;基于所述第一子网络中每个参数对应的乘积和预设超参数,确定所述第二损失值。
66.本说明书实施例中,所述目标用户的账户生命周期包括账户未注册成功阶段、账户注册成功且未触发执行业务阶段,以及触发执行业务阶段。
67.本说明书实施例中,所述第一获取模块701,用于:获取所述目标用户在账户未注册成功时对应的设备信息和操作行为信息,并将获取的所述设备信息和操作行为信息,确定为与所述账户未注册成功阶段对应的子数据;将所述目标用户输入的用户信息,确定为与所述账户注册成功且未触发执行业务阶段对应的子数据;获取所述目标用户触发执行所述目标业务对应的业务数据,并将获取的所述业务数据确定为与所述触发执行业务阶段对应的子数据。
68.本说明书实施例中,所述装置还包括:业务检测模块,用于在接收到所述目标用户触发针对所述目标业务的执行请求的情况下,基于所述目标用户对应的风险类型,确定触发执行所述目标业务是否存在风险。
69.本说明书实施例提供一种数据处理装置,获取与目标用户触发执行目标业务相关的目标数据,目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,基于预先训练的风险检测模型,对目标数据进行风险检测处理,得到目标用户对应的风险类型,风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的子网络用于对不同的阶段的子数据进行风险检测处理,风险检测模型为基于历史数据依次对子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个子网络的优化方向,基于目标用户对应的风险类型,确定目标用户是否为风险用户。这样,一方面,由于目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,因此,通过风险检测模型对目标数据进行处理,可以实现通过风险检测模型学习到目标用户的在不同阶段(即目标用户的账户生命周期的不同阶段)
的风险表现形式,可以关注到不同阶段间的共性,以及刻画出不同阶段的差异性,能够动态地刻画目标用户的账户生命周期的多个阶段的风险变化的过程。另一方面,由于风险检测模型是基于终身学习算法构建的包括多个子网络的模型,并且前一个训练完成的子网络的参数的重要性可以通过正则约束的方式控制下一个子网络的优化方向,这就可以缓解模型训练过程中存在的灾难性遗忘的问题,可以保证风险检测模型在不同阶段的风险识别效果及稳定性,实现对覆盖目标用户的账户生命周期的风险识别能力,提高针对目标用户的风险检测准确性。
70.实施例四基于同样的思路,本说明书实施例还提供一种数据处理设备,如图8所示。
71.数据处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对数据处理设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在数据处理设备上执行存储器802中的一系列计算机可执行指令。数据处理设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806。
72.具体在本实施例中,数据处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对数据处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:获取与目标用户触发执行目标业务相关的目标数据,所述目标数据包括在所述目标用户的账户生命周期的多个不同阶段中,与每个所述阶段对应的子数据;基于预先训练的风险检测模型,对所述目标数据进行风险检测处理,得到所述目标用户对应的风险类型,所述风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的所述子网络用于对不同的所述阶段的子数据进行风险检测处理,所述风险检测模型为基于历史数据依次对所述子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个所述子网络的优化方向;基于所述目标用户对应的风险类型,确定所述目标用户是否为风险用户。
73.可选地,在所述基于预先训练的风险检测模型,对所述目标数据进行风险检测处理,得到所述目标用户对应的风险类型之前,还包括:获取历史用户的历史数据,以及所述历史用户对应的风险类型,所述历史数据包括在所述历史用户的账户生命周期的多个不同历史阶段中,与每个所述历史阶段对应的历史子数据;将所述历史数据输入所述风险检测模型;基于所述历史阶段中的第一阶段对应的历史子数据对所述风险检测模型中的第一子网络进行训练,并在所述第一子网络收敛的情况下,确定训练得到的所述第一子网络中每个参数的重要性;
基于所述历史阶段中与所述第一阶段相邻的后一阶段对应的历史子数据、所述训练得到的所述第一子网络中每个参数及重要性,对所述风险检测模型中的第二子网络进行训练,并在所述第二子网络收敛的情况下,得到训练后的所述风险检测模型。
74.可选地,所述基于所述历史阶段中与所述第一阶段相邻的后一阶段对应的历史子数据、所述训练得到的所述第一子网络中每个参数及重要性,对所述风险检测模型中的第二子网络进行训练,包括:将所述历史数据输入所述第二子网络,得到所述第二输出结果;基于所述第二输出结果、所述历史用户的风险类型、所述训练得到的所述第一子网络中每个参数及重要性,确定所述第二子网络是否收敛。
75.可选地,所述基于所述第二输出结果、所述历史用户的风险类型、所述训练得到的所述第一子网络中每个参数及重要性,确定所述第二子网络是否收敛,包括:基于所述第二输出结果和所述历史用户的风险类型,得到第一损失值;基于所述训练得到的所述第一子网络中每个参数及重要性,得到第二损失值;基于所述第一损失值和所述第二损失值,确定目标损失值,并基于所述目标损失值,确定所述第二子网络是否收敛。
76.可选地,所述风险检测模型的多个子网络的网络结构相同,所述基于所述训练得到的所述第一子网络中每个参数及重要性,得到第二损失值,包括:确定所述第二子网络中每个参数与所述训练得到的所述第一子网络中每个参数的差值的平方与所述第一子网络中每个参数的重要性的乘积;基于所述第一子网络中每个参数对应的乘积和预设超参数,确定所述第二损失值。
77.可选地,所述目标用户的账户生命周期包括账户未注册成功阶段、账户注册成功且未触发执行业务阶段,以及触发执行业务阶段。
78.可选地,所述获取目标用户对应的目标数据,包括:获取所述目标用户在账户未注册成功时对应的设备信息和操作行为信息,并将获取的所述设备信息和操作行为信息,确定为与所述账户未注册成功阶段对应的子数据;将所述目标用户输入的用户信息,确定为与所述账户注册成功且未触发执行业务阶段对应的子数据;获取所述目标用户触发执行所述目标业务对应的业务数据,并将获取的所述业务数据确定为与所述触发执行业务阶段对应的子数据。
79.可选地,所述方法还包括:在接收到所述目标用户触发针对所述目标业务的执行请求的情况下,基于所述目标用户对应的风险类型,确定触发执行所述目标业务是否存在风险。
80.本说明书实施例提供一种数据处理设备,获取与目标用户触发执行目标业务相关的目标数据,目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,基于预先训练的风险检测模型,对目标数据进行风险检测处理,得到目标用户对应的风险类型,风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的子网络用于对不同的阶段的子数据进行风险检测处理,风险检测模型为基于历史数据依次对子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束
的方式控制下一个子网络的优化方向,基于目标用户对应的风险类型,确定目标用户是否为风险用户。这样,一方面,由于目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,因此,通过风险检测模型对目标数据进行处理,可以实现通过风险检测模型学习到目标用户的在不同阶段(即目标用户的账户生命周期的不同阶段)的风险表现形式,可以关注到不同阶段间的共性,以及刻画出不同阶段的差异性,能够动态地刻画目标用户的账户生命周期的多个阶段的风险变化的过程。另一方面,由于风险检测模型是基于终身学习算法构建的包括多个子网络的模型,并且前一个训练完成的子网络的参数的重要性可以通过正则约束的方式控制下一个子网络的优化方向,这就可以缓解模型训练过程中存在的灾难性遗忘的问题,可以保证风险检测模型在不同阶段的风险识别效果及稳定性,实现对覆盖目标用户的账户生命周期的风险识别能力,提高针对目标用户的风险检测准确性。
81.实施例五本说明书实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述数据处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-only memory,简称rom)、随机存取存储器(randomaccess memory,简称ram)、磁碟或者光盘等。
82.本说明书实施例提供一种计算机可读存储介质,获取与目标用户触发执行目标业务相关的目标数据,目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,基于预先训练的风险检测模型,对目标数据进行风险检测处理,得到目标用户对应的风险类型,风险检测模型为基于终身学习算法构建的包括多个子网络的模型,不同的子网络用于对不同的阶段的子数据进行风险检测处理,风险检测模型为基于历史数据依次对子网络进行训练得到,其中,前一个训练完成的子网络的参数的重要性通过正则约束的方式控制下一个子网络的优化方向,基于目标用户对应的风险类型,确定目标用户是否为风险用户。这样,一方面,由于目标数据包括在目标用户的账户生命周期的多个不同阶段中,与每个阶段对应的子数据,因此,通过风险检测模型对目标数据进行处理,可以实现通过风险检测模型学习到目标用户的在不同阶段(即目标用户的账户生命周期的不同阶段)的风险表现形式,可以关注到不同阶段间的共性,以及刻画出不同阶段的差异性,能够动态地刻画目标用户的账户生命周期的多个阶段的风险变化的过程。另一方面,由于风险检测模型是基于终身学习算法构建的包括多个子网络的模型,并且前一个训练完成的子网络的参数的重要性可以通过正则约束的方式控制下一个子网络的优化方向,这就可以缓解模型训练过程中存在的灾难性遗忘的问题,可以保证风险检测模型在不同阶段的风险识别效果及稳定性,实现对覆盖目标用户的账户生命周期的风险识别能力,提高针对目标用户的风险检测准确性。
83.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
84.在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmable logic device,pld)(例如现场可编程门阵列(fieldprogrammable gate array,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardware description language,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advancedboolean expression language)、ahdl(altera hardware description language)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(ruby hardwaredescription language)等,目前最普遍使用的是vhdl(very-high-speedintegrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
85.控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc 625d、atmelat91sam、microchip pic18f26k20 以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
86.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
87.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
88.本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结
合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
89.本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
90.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
91.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
92.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
93.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。
94.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
95.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
96.本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中
包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
97.本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
98.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
99.以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1