一种用户行为的处理方法、装置及设备与流程

文档序号:32392252发布日期:2022-11-30 08:46阅读:28来源:国知局
一种用户行为的处理方法、装置及设备与流程

1.本文件涉及计算机技术领域,尤其涉及一种用户行为的处理方法、装置及设备。


背景技术:

2.在金融领域等风控场景中,用户的风险行为往往隐藏在其日常的行为数据中,但某些新的风控场景中,往往缺乏用户行为是否具有风险的有标签样本,无法通过有监督的模型训练发现异常行为,因此,可以一定程度上,从用户的行为是否有明显的突变这一维度,发现用户的异常风险。例如,用户从一种交易模式转变为另一种模式,说明用户的使用习惯发生改变,其中可能是账户使用者发生转变或用户的交易场景发生变化,在上述变化中可能蕴含着各类风控风险,通过对时序变化点进行检测,可以一定程度上识别到有风险的账户,从而进行提前防控。在变化位置检测应用中,可以分为两个应用方式:在线方式和离线方式,其中,在线方式不会运用到未来数据,主要用于事件预警;离线方式可以用来进行历史数据检测,评估模型效能,进行在线预测时,往往会使得统计类或表征信息不全面,从而导致识别准确率不高。为此,需要提供一种识别准确率更高的时序数据的变化位置检测方式,从而可以使得统计类或表征信息更加全面。


技术实现要素:

3.本说明书实施例的目的是提供一种识别准确率更高的时序数据的变化位置检测方式,从而可以使得统计类或表征信息更加全面。
4.为了实现上述技术方案,本说明书实施例是这样实现的:本说明书实施例提供的一种用户行为的处理方法,所述方法包括:获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取所述目标用户执行所述目标业务过程中的相应用户历史行为数据。将当前时刻获取的用户行为数据和相应所述用户历史行为数据分别输入到预先训练的编码模型中,得到所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,所述编码模型能够对数据进行并行处理的模型。基于所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,确定所述用户行为数据与相应所述用户历史行为数据之间的相似度,并基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息。基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
5.本说明书实施例提供的一种用户行为的处理装置,所述装置包括:数据获取模块,获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取所述目标用户执行所述目标业务过程中的相应用户历史行为数据。模型处理模块,将当前时刻获取的用户行为数据和相应所述用户历史行为数据分别输入到预先训练的编码模型中,得到所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,所述编码模型能够对数据进行并行处理的模型。数据处理模块,基于所述
用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,确定所述用户行为数据与相应所述用户历史行为数据之间的相似度,并基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息。行为突变确定模块,基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
6.本说明书实施例提供的一种用户行为的处理设备,所述用户行为的处理设备包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取所述目标用户执行所述目标业务过程中的相应用户历史行为数据。将当前时刻获取的用户行为数据和相应所述用户历史行为数据分别输入到预先训练的编码模型中,得到所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,所述编码模型能够对数据进行并行处理的模型。基于所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,确定所述用户行为数据与相应所述用户历史行为数据之间的相似度,并基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息。基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
7.本说明书实施例还提供了一种存储介质,所述存储介质用于存储计算机可执行指令,所述可执行指令在被处理器执行时实现以下流程:获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取所述目标用户执行所述目标业务过程中的相应用户历史行为数据。将当前时刻获取的用户行为数据和相应所述用户历史行为数据分别输入到预先训练的编码模型中,得到所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,所述编码模型能够对数据进行并行处理的模型。基于所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,确定所述用户行为数据与相应所述用户历史行为数据之间的相似度,并基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息。基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
附图说明
8.为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
9.图1为本说明书一种用户行为的处理方法实施例;图2为本说明书另一种用户行为的处理方法实施例;图3为本说明书一种用户行为样本对的示意图;图4为本说明书一种负样本的构建示意图;图5a为本说明书一种编码模型的训练过程示意图;
图5b为本说明书一种用户行为的处理过程的示意图;图6为本说明书又一种用户行为的处理方法实施例;图7为本说明书一种用户行为的处理装置实施例;图8为本说明书一种用户行为的处理设备实施例。
具体实施方式
10.本说明书实施例提供一种用户行为的处理方法、装置及设备。
11.为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
12.实施例一如图1所示,本说明书实施例提供一种用户行为的处理方法,该方法的执行主体可以为终端设备或服务器,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为iot设备(具体如智能手表、车载设备等)等。该服务器可以是独立的一个服务器,还可以是由多个服务器构成的服务器集群等,该服务器可以是如金融业务或网络购物业务等的后台服务器,也可以是某应用程序的后台服务器等。本实施例中以服务器为例进行详细说明,对于终端设备的执行过程可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:在步骤s102中,获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据。
13.其中,目标用户可以是任意用户,在本实施例中,目标用户可以是执行目标业务的用户。目标业务可以包括多种,例如,支付业务、转账业务、面部识别业务等,本实施例中的目标业务可以是一项业务,也可以包括多项业务,具体可以根据实际情况设定,本说明书实施例对此不做限定。用户行为信息可以是目标用户执行目标业务的过程中目标用户进行任意操作所产生的信息,用户行为信息具体可以包括支付操作行为的相关数据、支付金额、转账操作行为的相关数据、转账金额、购物品类等,具体可以根据实际情况设定。用户历史行为数据可以是当前时刻之前的某时间点或时间段内目标用户执行目标业务的过程中目标用户进行某一项操作或连续的多项操作所产生的数据,例如,用户历史行为数据是在当前时刻前的1分钟时,目标用户执行目标业务的过程中目标用户进行连续的多项操作所产生的数据,基于此,在实际应用中,目标用户在当前时刻执行目标业务过程中的用户行为数据可以作为用户未来行为数据。
14.在实施中,在金融领域等风控场景中,用户的风险行为往往隐藏在其日常的行为数据中,但某些新的风控场景中,往往缺乏用户行为是否具有风险的有标签样本,无法通过有监督的模型训练发现异常行为,因此,可以一定程度上,从用户的行为是否有明显的突变这一维度,发现用户的异常风险。例如,用户从一种交易模式转变为另一种模式,说明用户的使用习惯发生改变,其中可能是账户使用者发生转变或用户的交易场景发生变化,在上
述变化中可能蕴含着各类风控风险,通过对时序变化点进行检测,可以一定程度上识别到有风险的账户,从而进行提前防控。在变化位置检测应用中,可以分为两个应用方式:在线方式和离线方式,其中,在线方式:可以是指连续观察某一随机过程,监测到变化位置时停止检测,不会运用到未来数据,主要用于事件预警;离线方式:从已经获得的时序数据中检测过去的变化位置,主要用作历史检测,通常情况下,离线方式可以用来进行历史数据检测,评估模型效能,进行在线预测时,可以基于验证过的模型对未来数据进行异常位置检测,常用的一些时序数据的变化位置检测方式,往往存在统计类或表征信息不全面的问题,从而导致识别准确率不高。
15.在对用户行为突变位置进行检测时,可以包括很多异常检测方式,通常可以分为非机器学习的统计类方式,以及机器学习方式。其中,统计类方式可以基于对用户的行为进行多个维度的特征描述,识别时间序列数据的相邻短间隔之间的特征统计差异来计算发生变化的位置,后者,可以根据不同时间段的数据概率密度分布是否有较大差异,来判断变化位置发生的时间,该方式对特征的定义较为敏感,同时对统计分布差异的模型或函数的准确度要求较高,当特征维度较高或存在噪声数据时,模型的准确率会受到比较大的影响。由于统计类方式对特征定义较为敏感,机器学习方式主要的思路是将用户的行为序列数据作为连续的文本预测任务,将用户行为通过编码器进行表征,基于用户历史的行为数据来预测当前的用户行为,再对比预测的数据与实际数据之间是否存在差异。上述方式由于不需要人工定义特征,因此在一些场景中,被证明效果要优于统计类方式。但与此同时,机器学习方式中,历史行为数据在对用户行为进行训练预测时,多数基于rnn类的网络模型进行,该方式下rnn耗时太长,由于一次只读取、解析输入的一个字段,且必须等前一个字段处理完,才能进行下一个字段的处理,这意味着 rnn 不能像 cnn 一样,能够进行大规模并行处理。同时,历史行为数据在对用户行为进行表征学习时,通常通过学习过去一段时间累积的行为数据来预测下一时刻的用户行为数据,该方式并没有学习到相邻两段连续的时间段内行为数据的延续性信息。为此,需要提供一种识别准确率更高的时序数据的变化位置检测方式,从而可以解决通常所存在的统计类或表征信息不全面的问题。本说明书实施例提供一种可实现的处理方式,具体可以包括以下内容:针对目标业务,目标用户每次执行目标业务时,可以记录目标用户执行目标业务的相关信息,记录的信息可以包括执行目标业务的时间、执行目标业务过程中目标用户每次的操作所产生的信息、位置信息等,如目标用户执行目标业务中的第一项业务时,可以记录为,的属性信息可以包括执行第一项业务的时间、执行第一项业务过程中目标用户每次的操作所产生的信息、位置信息等,目标用户执行目标业务中的第二项业务时,可以记录为,的属性信息可以包括执行第二项业务的时间、执行第二项业务过程中目标用户每次的操作所产生的信息、位置信息等,目标用户执行目标业务中的第三项业务时,可以记录为,的属性信息可以包括执行第三项业务的时间、执行第三项业务过程中目标用户每次的操作所产生的信息、位置信息等,
……
目标用户执行目标业务中的第n项业务时,可以记录为,的属性信息可以包括执行第n项业务的时间、执行第n项业务过程中目标用户每次的操作所产生的信息、位置信息等。基于上述内容,可以按照目标用户执行目标业务
的时间顺序依次排列相应的数据,得到时序数据,即,其中,按照时间顺序依次排列的时序数据的属性信息分别包括目标用户执行目标业务所产生的用户行为数据,用户行为数据可以包括d个维度的数据,其中可以包括如每次执行目标业务的时间、每次执行目标业务过程中每次操作所产生的信息、位置信息等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
16.通过上述方式可以得到目标用户执行目标业务所产生的业务时序数据构建的用户行为数据,当需要确定目标用户执行目标业务的用户行为数据时,可以获取目标用户在当前时刻执行目标业务过程中的业务时序数据构建的用户行为数据,并可以基于当前时刻获取的用户行为数据的内容,获取目标用户执行目标业务过程中的相应历史业务时序数据构建的用户历史行为数据,具体如,可以获取目标用户在当前时刻(如当前时间点到当前时间点之前的预设时间间隔(如10秒或20秒等)的时间点)执行目标业务过程中的业务时序数据构建的用户行为数据,获取目标用户执行目标业务过程中当前时刻之前的预设时间间隔(具体如1分钟或3分钟,也可以根据实际情况设定)的业务时序数据,可以将该业务时序数据作为相应历史业务时序数据,可以基于相应的历史业务时序数据构建用户历史行为数据。
17.需要说明的是,用户历史行为数据可以是当前时刻之前的某一时间点或时间段内目标用户执行目标业务过程中产生的业务时序数据,还可以是当前时刻之前的多个不同的时间点或时间段内目标用户执行目标业务过程中产生的业务时序数据,例如,用户历史行为数据可以包括当前时刻的1分钟(或3分钟或5分钟等)前目标用户执行目标业务过程中产生的业务时序数据、当前时刻目标用户执行目标业务之前的一次或多次目标用户执行目标业务过程中产生的业务时序数据等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
18.在步骤s104中,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,编码模型能够对数据进行并行处理的模型。
19.其中,编码模型可以通过多种不同的算法构建,例如,可以通过指定的神经网络模型构建,该神经网络模型可以包括多种,如卷积神经网络模型等,具体可以根据实际情况设定,本说明书实施例对此不做限定。编码模型可以用于将时序数据进行编码处理,得到相应的特征,编码模型能够对大量数据进行并行处理。
20.在实施中,可以获取相应的算法,并可以基于该算法构建编码模型,该编码模型的输入数据可以为用户执行某业务所产生的业务时序数据构建的用户行为数据,输出数据可以为输入数据对应的向量表征(或可以称为行为表征),然后,可以获取用于训练编码模型的训练样本(即用户执行某业务所产生的业务时序数据构建的用户行为数据),可以使用该训练样本对编码模型进行模型训练,在进行模型训练的过程中,考虑到在实际业务场景下,简单的对训练样本中的时间序列进行编码处理,得到相应的向量特征,可以预先设定目标函数,可以基于该目标函数对编码模型中的模型参数进行优化处理,其中,针对目标函数,可以对上述编码模型进行调整。之后,可以使用训练样本对编码模型进行模型训练,同时通过上述目标函数对模型参数进行优化处理,最终得到训练后的编码模型。
21.通过上述方式获取到当前时刻获取的用户行为数据和相应用户历史行为数据后,可以将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到上述预先训练的编码模型中,通过编码模型的处理,可以得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征。
22.在步骤s106中,基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定用户行为数据与相应用户历史行为数据之间的相似度,并基于该相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息。
23.其中,相似度计算可以包括多种不同的方式,例如,杰卡德相似系数相似度算法、余弦相似度算法、通过距离计算相似度的算法、皮尔逊相关系数相似度算法等,具体可以根据实际情况设定,本说明书实施例对此不做限定。
24.在实施中,基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,并通过预先设定的相似度算法计算用户行为数据与相应用户历史行为数据之间的相似度,具体如,可以基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,通过余弦相似度算法计算用户行为数据与相应用户历史行为数据之间的余弦相似度,从而得到用户行为数据与相应用户历史行为数据之间的相似度。可以基于该相似度对目标用户执行目标业务过程中的用户行为进行分析,并可以通过相应的分析结果,基于相应的算法计算目标用户执行目标业务过程中用户行为分布的变化趋势信息。
25.在步骤s108中,基于目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定用户行为数据中目标用户的用户行为发生突变的位置。
26.在实施中,可以对目标用户执行目标业务过程中用户行为分布的变化趋势信息进行分析,可以基于相应的分析结果,通过预设的算法从上述用户行为分布的变化趋势信息中查找到用户行为数据中发生变化的数据和/或存在异常的数据等,可以基于查找到的用户行为数据中发生变化的数据和/或存在异常的数据等,确定用户行为数据中相应的目标用户的用户行为发生突变的位置。
27.本说明书实施例提供一种用户行为的处理方法,通过获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据,然后,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,其中,编码模型能够对数据进行并行处理的模型,可以基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定两者之间的相似度,并基于相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息,进而确定用户行为数据中目标用户的用户行为发生突变的位置,这样,对用户行为进行表征,替代了人工设计特征的方式,能够更好的避免统计类方式中,对人工筛选特征的依赖,同时,在对用户行为进行表征时,选择使用类似于cnn结构的、能够对数据进行并行处理的编码模型,避免使用rnn等网络结构而无法并行计算的问题,并且通过自监督对比学习在用户行为序列中的应用,在无标签信息参与的同时,最大化相邻用户行为数据对之间的互信息,从而学习短时间尺度上的相似性概念,相比于基于历史一段时间的数据以此来预测未来的方式,能够获得更丰富紧凑的行为特征表达,进而能够在时序数据的突变位置的检测中实现更高的准确率。
28.实施例二如图2所示,本说明书实施例提供一种用户行为的处理方法,该方法的执行主体可以为终端设备或服务器,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为iot设备(具体如智能手表、车载设备等)等。该服务器可以是独立的一个服务器,还可以是由多个服务器构成的服务器集群等,该服务器可以是如金融业务或网络购物业务等的后台服务器,也可以是某应用程序的后台服务器等。本实施例中以服务器为例进行详细说明,对于终端设备的执行过程可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:在步骤s202中,获取用于训练编码模型的训练样本,该训练样本中包括多组不同的用户行为样本对,用户行为样本对包括用户执行目标业务过程中的用户历史行为样本和相应的用户未来行为样本,多组不同的用户行为样本对包括多组正样本对和多组负样本对,不同的用户行为样本对之间的时间间隔小于预设间隔阈值。
29.其中,编码模型可以为基于卷积神经网络cnn模型构建的模型,或者,编码模型也可以为基于transformer类的模型构建的模型,在实际应用中,编码模型除了可以通过上述模型构建外,还可以通过多种不同的模型或算法构建,具体可以根据实际情况设定。此外,考虑到编码模型处理的数据为时序数据,因此,编码模型还可以为基于时域卷积网络tcn模型构建的模型。tcn模型是指时间卷积网络模型,是一种新型的可以用来解决时间序列预测的算法模型,tcn模型可以采用一系列任意长度的数据,并可以将其输出为相同长度的数据,在使用一维完全卷积网络体系结构的情况下,使用因果卷积,一个关键特征是时间t的输出仅与时间t之前发生的元素卷积,tcn模型以 cnn模型为基础,并做了如下改进:适用序列模型:因果卷积(causal convolution);记忆历史:空洞卷积/膨胀卷积(dilated convolution),残差模块(residual block)。tcn模型的特点:因果卷积网络、膨胀卷积方式(扩张卷积、空洞卷积)、残差块、激活函数、规范化、正则化和dropout,其中,因果卷积网络对于上一层t时刻的值,只依赖于下一层t时刻及其之前的值,与传统的卷积神经网络的不同之处在于,因果卷积网络不能看到未来的数据,它是单向的结构,不是双向的,也就是说只有有了前面的因才有后面的果,是一种严格的时间约束模型,因果卷积网络具有下述特点:不考虑未来的信息;追溯历史信息越久远,隐藏层越多。对于空洞卷积/膨胀卷积,单纯的因果卷积网络还是存在传统卷积神经网络的问题,即对时间的建模长度受限于卷积核大小的,如果获取更长的依赖关系,就需要线性的堆叠很多的层,标准的 cnn模型可以通过增加pooling层来获得更大的感受野,而经过pooling层后肯定存在信息损失的问题。空洞卷积是在标准的卷积里注入空洞,以此来增加感受野,空洞卷积多了一个超参数dilation rate,指的是kernel的间隔数量(标准的 cnn模型中dilatation rate等于 1),空洞的好处是不做pooling损失信息的情况下,增加了感受野,让每个卷积输出都包含较大范围的信息。和传统卷积不同的是,膨胀卷积允许卷积时的输入存在间隔采样,采样率受空洞卷积的参数控制,一般来讲,越高的层级使用的空洞卷积的参数的大小越大,所以,膨胀卷积使得有效窗口的大小随着层数呈指数型增长,这样卷积网络用比较少的层,就可以获得很大的感受野。因为需要处理的数据是时间序列数据,tcn模型采用一维的卷积网络。上图是 tcn 架构中的因果卷积与空洞卷积,可以看到每一层t时刻的值只依赖于上一层中t时刻及其以前的时间的值,体现了因果卷积的特性;而每一层对上一层信息的提取,都是跳跃式的,且
逐层dilated rate以2的指数增长,体现了空洞卷积的特性。由于采用了空洞卷积,因此每一层都要做padding(通常情况下补 0)。对于残差模块,残差链接被证明是训练深层网络的有效方法,它使得网络可以以跨层的方式传递信息,tcn模型构建了一个残差块来代替一层的卷积,一个残差块包含两层的卷积和非线性映射,在每层中还加入了weightnorm和dropout来正则化网络。
30.tcn模型在预测方面,希望预测未来时间序列的下一个条目,为了训练tcn模型进行预测,训练集将由给定时间序列的等大小子序列对(输入序列、目标序列)组成。目标序列将是相对于其各自的输入序列向右移动一定数量output_length的序列,这意味着长度input_length的目标序列包含其各自输入序列的最后(input_length-output_length)元素作为第一个元素,位于输入序列最后一个条目之后的output_length元素作为它的最后一个元素,在预测方面,这意味着该模型所能预测的最大预测视界等于output_length。使用滑动窗口的方式,许多重叠的输入和目标序列可以创建出一个时间序列。tcn模型具有下述特点:并行性:与在rnn模型中对后续时间步的预测必须等待其前面的任务完成的情况不同,卷积可以并行完成,因为每一层都使用相同的滤波器,因此,在训练和评估中,长输入序列可以在 tcn模型中作为一个整体进行处理,而不是像在 rnn模型中那样按顺序处理;灵活的感受野大小:tcn模型可以通过多种方式改变其感受野大小;稳定的梯度:与循环架构不同,tcn模型的反向传播路径与序列的时间方向不同,因此,tcn模型避免了梯度爆炸/消失的问题;训练时内存要求低:在tcn模型中,滤波器跨层共享,反向传播路径仅取决于网络深度;可变长度输入:就像 rnn 以循环方式对可变长度的输入进行建模一样,tcn 也可以通过滑动卷积核来接收任意长度的输入。预设间隔阈值可以根据实际情况设定,具体如24小时或1小时等。
31.在实施中,服务器中可以记录有每个用户执行目标业务过程中产生的用户行为数据,当需要使用某些用户行为数据时,可以从服务器中存储的用户行为数据中获取用于训练编码模型的训练样本,具体地,可以获取用户执行目标业务过程中的用户历史行为样本,并可以获取与该用户历史行为样本相对应的用户未来行为样本,并可以将获取的用户历史行为样本和与该用户历史行为样本相对应的用户未来行为样本构建为一组用户行为样本对,可以通过上述方式,从服务器中记录的用户行为数据中获取多组不同的用户行为样本对,可以将得到的多组不同的用户行为样本对作为正样本对,并可以从预设的数据库中获取用户历史行为样本和用户未来行为样本构建的负样本对,可以将上述正样本对和负样本对构建为用于训练编码模型的训练样本。
32.上述步骤s202的具体处理可以多种多样,以下提供一种可选的处理方式,具体可以包括以下步骤a2~步骤a6的处理。
33.在步骤a2中,获取第一用户执行目标业务过程中的用户历史行为数据作为用户历史行为样本,并获取与用户历史行为样本相应的用户未来行为样本,将获取的用户历史行为样本和相应的用户未来行为样本构建为用户行为样本对中的正样本对。
34.在实施中,服务器中可以记录有每个用户执行目标业务过程中产生的用户行为数据,当需要使用某些用户行为数据时,可以从服务器中存储的用户行为数据中获取用于训练编码模型的训练样本,具体地,可以获取第一用户执行目标业务过程中的用户历史行为样本,并可以获取与该用户历史行为样本相对应的用户未来行为样本,并可以将获取的用
户历史行为样本和与该用户历史行为样本相对应的用户未来行为样本构建为一组用户行为样本对,可以通过上述方式,从服务器中记录的用户行为数据中选择多组随机连续的用户行为样本对,可以将得到的多组不同的用户行为样本对作为正样本对。如图3所示,x1、x2、x3、x4

xk为用户历史行为样本,y1、y2、y3、y4

yk为用户未来行为样本,正样本对为(x1,y1)、(x2,y2)、(x3,y3)、(x4,y4)

(xk,yk)。
35.需要说明的是,每组用户行为样本对必须遵守与其他组的用户行为样本对受最小时间距离的约束,即不同的用户行为样本对之间的时间间隔小于预设间隔阈值。最小时间距离约束用于使每组能够采用其他组中的正样本的用户未来行为样本构造负样本对,因为它们保证与本次的正样本对中的用户历史行为样本充分分离,在时间上彼此分离的行为样本可能表现出比相邻行为样本弱得多的统计依赖性。
36.在步骤a4中,将构建的正样本对中的一个正样本对中的用户历史行为样本分别与构建的正样本对中的其它正样本对中的用户未来行为样本构建为负样本对。
37.在实施中,基于上述图3所示的示例,如图4所示,负样本对为(x1,y2)、(x1,y3)、(x1,y4)

(x1,yk)、(x2,y1)、(x2,y3)、(x2,y4)

(x2,yk)、(x3,y1)、(x3,y2)、(x3,y4)

(x3,yk)、(x4,y1)、(x4,y2)、(x4,y3)

(x4,yk)

(xk,y1)、(xk,y2)、(xk,y3)、(xk,y4)

(xk,yk-1)。
38.在步骤a6中,基于构建的正样本对和构建的负样本对构建上述训练样本中的多组不同的用户行为样本对。
39.在步骤s204中,基于多组不同的用户行为样本对,并以正样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大,负样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大作为模型训练所要达到的目标对编码模型进行模型训练,得到训练后的编码模型。
40.在实施中,基于多组不同的用户行为样本对对编码模型进行模型训练,同时,以正样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大,负样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大作为模型训练所要达到的目标,具体地,如图5a所示,对于任一组用户行为样本对,可以将该用户行为样本对中的用户历史行为样本和相应的用户未来行为样本分别输入到编码模型中,分别得到用户历史行为样本对应的向量表征和用户未来行为样本对应的向量表征,可以计算两个向量表征之间的相似度,基于该相似度和预设的损失函数对编码模型进行模型训练,最终,可以得到训练后的编码模型。
41.在步骤s206中,获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据。
42.上述步骤s206的具体处理可以参见上述实施例中的相关内容,并参见图5b所示,在此不再赘述。
43.在步骤s208中,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,编码模型能够对数据进行并行处理的模型。
44.在步骤s210中,基于用户行为数据对应的向量表征和相应用户历史行为数据对应
的向量表征,确定用户行为数据与相应用户历史行为数据之间的相似度。
45.其中,用户行为数据与相应用户历史行为数据之间的相似度为余弦相似度。
46.在实施中,如图5b所示,可以基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,通过余弦相似度算法计算用户行为数据对应的向量表征与相应用户历史行为数据对应的向量表征之间的余弦相似度。
47.在步骤s212中,基于上述相似度计算该相似度之间的差值。
48.在步骤s214中,基于上述相似度之间的差值,确定相应的移动平均值,并基于确定的移动平均值,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息。
49.其中,移动平均值也可以称为移动平均线(moving average,ma),移动平均线是用统计分析的方式,将一定时期内的数据加以平均,并把不同时间的平均值连接起来,形成一根ma线,用以观察变动趋势的一种技术指标。
50.在步骤s216中,通过寻峰算法确定上述移动平均值中的局部最大值。
51.在步骤s218中,基于确定的局部最大值对应的时间间隔,确定用户行为数据中目标用户的用户行为发生突变的位置。
52.对于目标业务为金融类业务等,还可以通过下述步骤s220和步骤s222的处理进行风险防控处理。
53.在步骤s220中,基于用户行为数据中目标用户的用户行为发生突变的位置,对目标用户的账户进行风险检测。
54.在步骤s222中,如果确定目标用户的账户存在预设风险,则对目标用户的账户进行风险防控处理。
55.其中,预设风险可以根据实际情况设定,具体如欺诈风险、非法金融活动等。
56.本说明书实施例提供一种用户行为的处理方法,通过获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据,然后,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,其中,编码模型能够对数据进行并行处理的模型,可以基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定两者之间的相似度,并基于相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息,进而确定用户行为数据中目标用户的用户行为发生突变的位置,这样,对用户行为进行表征,替代了人工设计特征的方式,能够更好的避免统计类方式中,对人工筛选特征的依赖,同时,在对用户行为进行表征时,选择使用类似于cnn结构的、能够对数据进行并行处理的编码模型,避免使用rnn等网络结构而无法并行计算的问题,并且通过自监督对比学习在用户行为序列中的应用,在无标签信息参与的同时,最大化相邻用户行为数据对之间的互信息,从而学习短时间尺度上的相似性概念,相比于基于历史一段时间的数据以此来预测未来的方式,能够获得更丰富紧凑的行为特征表达,进而能够在时序数据的突变位置的检测中实现更高的准确率。
57.实施例三基于前述实施例,以下通过具体的应用场景对上述实施例的过程进行说明,该应用场景为支付业务场景,基于此,上述的目标业务为支付业务,用户历史行为样本为历史支
付行为时序数据样本,业务时序数据为支付时序数据,用户未来行为样本为用户未来行为时序数据样本,用户行为样本对为支付行为时序数据样本对,用户行为数据为用户支付行为时序数据,用户历史行为数据为历史支付行为时序数据。
58.如图6所示,本说明书实施例提供一种用户行为的处理方法,该方法的执行主体可以为终端设备或服务器,其中,该终端设备可以如手机、平板电脑等一定终端设备,还可以如笔记本电脑或台式电脑等计算机设备,或者,也可以为iot设备(具体如智能手表、车载设备等)等。该服务器可以是独立的一个服务器,还可以是由多个服务器构成的服务器集群等,该服务器可以是如金融业务或网络购物业务等的后台服务器,也可以是某应用程序的后台服务器等。本实施例中以服务器为例进行详细说明,对于终端设备的执行过程可以参见下述相关内容,在此不再赘述。该方法具体可以包括以下步骤:在步骤s602中,获取第一用户执行所述支付业务过程中的历史支付行为时序数据作为所述历史支付行为时序数据样本,并获取与所述历史支付行为时序数据样本相应的用户未来行为时序数据样本,将获取的历史支付行为时序数据样本和相应的用户未来行为时序数据样本构建为所述支付行为时序数据样本对中的正样本对,不同的支付行为时序数据样本对之间的时间间隔小于预设间隔阈值。
59.其中,编码模型为基于时域卷积网络tcn模型构建的模型,或者,所述编码模型为基于transformer类的模型构建的模型。
60.在步骤s604中,将构建的正样本对中的一个正样本对中的历史支付行为时序数据样本分别与构建的正样本对中的其它正样本对中的用户未来行为时序数据样本构建为负样本对。
61.在步骤s606中,基于构建的正样本对和构建的负样本对构建训练样本中的多组不同的支付行为时序数据样本对。
62.在步骤s608中,基于多组不同的支付行为时序数据样本对,并以正样本对中历史支付行为时序数据样本和相应的用户未来行为时序数据样本对应的向量表征之间的相似度越大,负样本对中历史支付行为时序数据样本和相应的用户未来行为时序数据样本对应的向量表征之间的相似度越大为模型训练所要达到的目标对编码模型进行模型训练,得到训练后的编码模型。
63.在步骤s610中,获取目标用户在当前时刻执行支付业务过程中的用户支付行为时序数据,并基于当前时刻获取的用户支付行为时序数据,获取目标用户执行支付业务过程中的相应历史支付行为时序数据。
64.在步骤s612中,将当前时刻获取的用户支付行为时序数据和相应历史支付行为时序数据分别输入到预先训练的编码模型中,得到用户支付行为时序数据对应的向量表征和相应历史支付行为时序数据对应的向量表征,编码模型能够对数据进行并行处理的模型。
65.在步骤s614中,基于用户支付行为时序数据对应的向量表征和相应历史支付行为时序数据对应的向量表征,确定用户支付行为时序数据与相应历史支付行为时序数据之间的余弦相似度,并基于该余弦相似度计算该余弦相似度之间的差值。
66.在步骤s616中,基于该余弦相似度之间的差值,确定相应的移动平均值,并基于确定的移动平均值,确定目标用户执行支付业务过程中用户行为分布的变化趋势信息,并通过寻峰算法确定该移动平均值中的局部最大值。
67.在步骤s618中,基于确定的局部最大值对应的时间间隔,确定用户支付行为时序数据中目标用户的用户支付行为发生突变的位置。
68.在步骤s620中,基于用户支付行为时序数据中目标用户的用户支付行为发生突变的位置,对目标用户的账户进行风险检测。
69.在步骤s622中,如果确定目标用户的账户存在预设风险,则对目标用户的账户进行风险防控处理。
70.本说明书实施例提供一种用户行为的处理方法,通过获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据,然后,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,其中,编码模型能够对数据进行并行处理的模型,可以基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定两者之间的相似度,并基于相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息,进而确定用户行为数据中目标用户的用户行为发生突变的位置,这样,对用户行为进行表征,替代了人工设计特征的方式,能够更好的避免统计类方式中,对人工筛选特征的依赖,同时,在对用户行为进行表征时,选择使用类似于cnn结构的、能够对数据进行并行处理的编码模型,避免使用rnn等网络结构而无法并行计算的问题,并且通过自监督对比学习在用户行为序列中的应用,在无标签信息参与的同时,最大化相邻用户行为数据对之间的互信息,从而学习短时间尺度上的相似性概念,相比于基于历史一段时间的数据以此来预测未来的方式,能够获得更丰富紧凑的行为特征表达,进而能够在时序数据的突变位置的检测中实现更高的准确率。
71.实施例四以上为本说明书实施例提供的用户行为的处理方法,基于同样的思路,本说明书实施例还提供一种用户行为的处理装置,如图7所示。
72.该用户行为的处理装置包括:数据获取模块701、模型处理模块702、数据处理模块703和行为突变确定模块704,其中:数据获取模块701,获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取所述目标用户执行所述目标业务过程中的相应用户历史行为数据;模型处理模块702,将当前时刻获取的用户行为数据和相应所述用户历史行为数据分别输入到预先训练的编码模型中,得到所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,所述编码模型能够对数据进行并行处理的模型;数据处理模块703,基于所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,确定所述用户行为数据与相应所述用户历史行为数据之间的相似度,并基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息;行为突变确定模块704,基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
73.本说明书实施例中,所述装置还包括:
样本获取模块,获取用于训练所述编码模型的训练样本,所述训练样本中包括多组不同的用户行为样本对,所述用户行为样本对包括用户执行所述目标业务过程中的用户历史行为样本和相应的用户未来行为样本,所述多组不同的用户行为样本对包括多组正样本对和多组负样本对,不同的所述用户行为样本对之间的时间间隔小于预设间隔阈值;模型训练模块,基于所述多组不同的用户行为样本对,并以所述正样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大,所述负样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大作为模型训练所要达到的目标对所述编码模型进行模型训练,得到训练后的编码模型。
74.本说明书实施例中,所述样本获取模块,包括:正样本确定单元,获取第一用户执行所述目标业务过程中的用户历史行为数据作为所述用户历史行为样本,并获取与所述用户历史行为样本相应的用户未来行为样本,将获取的所述用户历史行为样本和相应的用户未来行为样本构建为所述用户行为样本对中的正样本对;负样本确定单元,将构建的正样本对中的一个正样本对中的用户历史行为样本分别与构建的正样本对中的其它正样本对中的用户未来行为样本构建为所述负样本对;样本对构建单元,基于构建的所述正样本对和构建的所述负样本对构建所述训练样本中的多组不同的用户行为样本对。
75.本说明书实施例中,所述数据处理模块703,包括:差值确定单元,基于所述相似度计算所述相似度之间的差值;变化趋势确定单元,基于所述相似度之间的差值,确定相应的移动平均值,并基于确定的移动平均值,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息;所述行为突变确定模块704,包括:最大值确定单元,通过寻峰算法确定所述移动平均值中的局部最大值;行为突变确定单元,基于确定的所述局部最大值对应的时间间隔,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
76.本说明书实施例中,所述用户行为数据与相应所述用户历史行为数据之间的相似度为余弦相似度。
77.本说明书实施例中,所述编码模型为基于卷积神经网络模型构建的模型,或者,所述编码模型为基于transformer类的模型构建的模型。
78.本说明书实施例中,所述编码模型为基于时域卷积网络tcn模型构建的模型。
79.本说明书实施例中,所述目标业务为金融类业务,所述装置还包括:风险检测模块,基于所述用户行为数据中所述目标用户的用户行为发生突变的位置,对所述目标用户的账户进行风险检测;风险防控模块,如果确定所述目标用户的账户存在预设风险,则对所述目标用户的账户进行风险防控处理。
80.本说明书实施例提供一种用户行为的处理装置,通过获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据,然后,将当前时刻获取的用户行为数据和
相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,其中,编码模型能够对数据进行并行处理的模型,可以基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定两者之间的相似度,并基于相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息,进而确定用户行为数据中目标用户的用户行为发生突变的位置,这样,对用户行为进行表征,替代了人工设计特征的方式,能够更好的避免统计类方式中,对人工筛选特征的依赖,同时,在对用户行为进行表征时,选择使用类似于cnn结构的、能够对数据进行并行处理的编码模型,避免使用rnn等网络结构而无法并行计算的问题,并且通过自监督对比学习在用户行为序列中的应用,在无标签信息参与的同时,最大化相邻用户行为数据对之间的互信息,从而学习短时间尺度上的相似性概念,相比于基于历史一段时间的数据以此来预测未来的方式,能够获得更丰富紧凑的行为特征表达,进而能够在时序数据的突变位置的检测中实现更高的准确率。
81.实施例五以上为本说明书实施例提供的用户行为的处理装置,基于同样的思路,本说明书实施例还提供一种用户行为的处理设备,如图8所示。
82.所述用户行为的处理设备可以为上述实施例提供终端设备或服务器等。
83.用户行为的处理设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器801和存储器802,存储器802中可以存储有一个或一个以上存储应用程序或数据。其中,存储器802可以是短暂存储或持久存储。存储在存储器802的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对用户行为的处理设备中的一系列计算机可执行指令。更进一步地,处理器801可以设置为与存储器802通信,在用户行为的处理设备上执行存储器802中的一系列计算机可执行指令。用户行为的处理设备还可以包括一个或一个以上电源803,一个或一个以上有线或无线网络接口804,一个或一个以上输入输出接口805,一个或一个以上键盘806。
84.具体在本实施例中,用户行为的处理设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对用户行为的处理设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取所述目标用户执行所述目标业务过程中的相应用户历史行为数据;将当前时刻获取的用户行为数据和相应所述用户历史行为数据分别输入到预先训练的编码模型中,得到所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,所述编码模型能够对数据进行并行处理的模型;基于所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,确定所述用户行为数据与相应所述用户历史行为数据之间的相似度,并基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息;基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述
用户行为数据中所述目标用户的用户行为发生突变的位置。
85.本说明书实施例中,还包括:获取用于训练所述编码模型的训练样本,所述训练样本中包括多组不同的用户行为样本对,所述用户行为样本对包括用户执行所述目标业务过程中的用户历史行为样本和相应的用户未来行为样本,所述多组不同的用户行为样本对包括多组正样本对和多组负样本对,不同的所述用户行为样本对之间的时间间隔小于预设间隔阈值;基于所述多组不同的用户行为样本对,并以所述正样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大,所述负样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大作为模型训练所要达到的目标对所述编码模型进行模型训练,得到训练后的编码模型。
86.本说明书实施例中,所述获取用于训练所述编码模型的训练样本,包括:获取第一用户执行所述目标业务过程中的用户历史行为数据作为所述用户历史行为样本,并获取与所述用户历史行为样本相应的用户未来行为样本,将获取的所述用户历史行为样本和相应的用户未来行为样本构建为所述用户行为样本对中的正样本对;将构建的正样本对中的一个正样本对中的用户历史行为样本分别与构建的正样本对中的其它正样本对中的用户未来行为样本构建为所述负样本对;基于构建的所述正样本对和构建的所述负样本对构建所述训练样本中的多组不同的用户行为样本对。
87.本说明书实施例中,所述基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,包括:基于所述相似度计算所述相似度之间的差值;基于所述相似度之间的差值,确定相应的移动平均值,并基于确定的移动平均值,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息;所述基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置,包括:通过寻峰算法确定所述移动平均值中的局部最大值;基于确定的所述局部最大值对应的时间间隔,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
88.本说明书实施例中,所述用户行为数据与相应所述用户历史行为数据之间的相似度为余弦相似度。
89.本说明书实施例中,所述编码模型为基于卷积神经网络模型构建的模型,或者,所述编码模型为基于transformer类的模型构建的模型。
90.本说明书实施例中,所述编码模型为基于时域卷积网络tcn模型构建的模型。
91.本说明书实施例中,所述目标业务为金融类业务,还包括:基于所述用户行为数据中所述目标用户的用户行为发生突变的位置,对所述目标用户的账户进行风险检测;如果确定所述目标用户的账户存在预设风险,则对所述目标用户的账户进行风险防控处理。
92.本说明书实施例提供一种用户行为的处理设备,通过获取目标用户在当前时刻执
行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据,然后,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,其中,编码模型能够对数据进行并行处理的模型,可以基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定两者之间的相似度,并基于相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息,进而确定用户行为数据中目标用户的用户行为发生突变的位置,这样,对用户行为进行表征,替代了人工设计特征的方式,能够更好的避免统计类方式中,对人工筛选特征的依赖,同时,在对用户行为进行表征时,选择使用类似于cnn结构的、能够对数据进行并行处理的编码模型,避免使用rnn等网络结构而无法并行计算的问题,并且通过自监督对比学习在用户行为序列中的应用,在无标签信息参与的同时,最大化相邻用户行为数据对之间的互信息,从而学习短时间尺度上的相似性概念,相比于基于历史一段时间的数据以此来预测未来的方式,能够获得更丰富紧凑的行为特征表达,进而能够在时序数据的突变位置的检测中实现更高的准确率。
93.实施例六进一步地,基于上述图1到图6所示的方法,本说明书一个或多个实施例还提供了一种存储介质,用于存储计算机可执行指令信息,一种具体的实施例中,该存储介质可以为u盘、光盘、硬盘等,该存储介质存储的计算机可执行指令信息在被处理器执行时,能实现以下流程:获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取所述目标用户执行所述目标业务过程中的相应用户历史行为数据;将当前时刻获取的用户行为数据和相应所述用户历史行为数据分别输入到预先训练的编码模型中,得到所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,所述编码模型能够对数据进行并行处理的模型;基于所述用户行为数据对应的向量表征和相应所述用户历史行为数据对应的向量表征,确定所述用户行为数据与相应所述用户历史行为数据之间的相似度,并基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息;基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
94.本说明书实施例中,还包括:获取用于训练所述编码模型的训练样本,所述训练样本中包括多组不同的用户行为样本对,所述用户行为样本对包括用户执行所述目标业务过程中的用户历史行为样本和相应的用户未来行为样本,所述多组不同的用户行为样本对包括多组正样本对和多组负样本对,不同的所述用户行为样本对之间的时间间隔小于预设间隔阈值;基于所述多组不同的用户行为样本对,并以所述正样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大,所述负样本对中用户历史行为样本和相应的用户未来行为样本对应的向量表征之间的相似度越大作为模型训练所要达到的目标对所述编码模型进行模型训练,得到训练后的编码模型。
95.本说明书实施例中,所述获取用于训练所述编码模型的训练样本,包括:获取第一用户执行所述目标业务过程中的用户历史行为数据作为所述用户历史行为样本,并获取与所述用户历史行为样本相应的用户未来行为样本,将获取的所述用户历史行为样本和相应的用户未来行为样本构建为所述用户行为样本对中的正样本对;将构建的正样本对中的一个正样本对中的用户历史行为样本分别与构建的正样本对中的其它正样本对中的用户未来行为样本构建为所述负样本对;基于构建的所述正样本对和构建的所述负样本对构建所述训练样本中的多组不同的用户行为样本对。
96.本说明书实施例中,所述基于所述相似度,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,包括:基于所述相似度计算所述相似度之间的差值;基于所述相似度之间的差值,确定相应的移动平均值,并基于确定的移动平均值,确定所述目标用户执行目标业务过程中用户行为分布的变化趋势信息;所述基于所述目标用户执行目标业务过程中用户行为分布的变化趋势信息,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置,包括:通过寻峰算法确定所述移动平均值中的局部最大值;基于确定的所述局部最大值对应的时间间隔,确定所述用户行为数据中所述目标用户的用户行为发生突变的位置。
97.本说明书实施例中,所述用户行为数据与相应所述用户历史行为数据之间的相似度为余弦相似度。
98.本说明书实施例中,所述编码模型为基于卷积神经网络模型构建的模型,或者,所述编码模型为基于transformer类的模型构建的模型。
99.本说明书实施例中,所述编码模型为基于时域卷积网络tcn模型构建的模型。
100.本说明书实施例中,所述目标业务为金融类业务,还包括:基于所述用户行为数据中所述目标用户的用户行为发生突变的位置,对所述目标用户的账户进行风险检测;如果确定所述目标用户的账户存在预设风险,则对所述目标用户的账户进行风险防控处理。
101.本说明书实施例提供一种存储介质,通过获取目标用户在当前时刻执行目标业务过程中的用户行为数据,并基于当前时刻获取的用户行为数据,获取目标用户执行目标业务过程中的相应用户历史行为数据,然后,将当前时刻获取的用户行为数据和相应用户历史行为数据分别输入到预先训练的编码模型中,得到用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,其中,编码模型能够对数据进行并行处理的模型,可以基于用户行为数据对应的向量表征和相应用户历史行为数据对应的向量表征,确定两者之间的相似度,并基于相似度,确定目标用户执行目标业务过程中用户行为分布的变化趋势信息,进而确定用户行为数据中目标用户的用户行为发生突变的位置,这样,对用户行为进行表征,替代了人工设计特征的方式,能够更好的避免统计类方式中,对人工筛选特征的依赖,同时,在对用户行为进行表征时,选择使用类似于cnn结构的、能够对数据进行并行处理的编码模型,避免使用rnn等网络结构而无法并行计算的问题,并且通过自监督对比学习在
用户行为序列中的应用,在无标签信息参与的同时,最大化相邻用户行为数据对之间的互信息,从而学习短时间尺度上的相似性概念,相比于基于历史一段时间的数据以此来预测未来的方式,能够获得更丰富紧凑的行为特征表达,进而能够在时序数据的突变位置的检测中实现更高的准确率。
102.上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
103.在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(programmable logic device,pld)(例如现场可编程门阵列(field programmable gate array,fpga))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(hardware description language,hdl),而hdl也并非仅有一种,而是有许多种,如abel(advanced boolean expression language)、ahdl(altera hardware description language)、confluence、cupl(cornell university programming language)、hdcal、jhdl(java hardware description language)、lava、lola、myhdl、palasm、rhdl(ruby hardware description language)等,目前最普遍使用的是vhdl(very-high-speed integrated circuit hardware description language)与verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
104.控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(application specific integrated circuit,asic)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:arc 625d、atmel at91sam、microchip pic18f26k20 以及silicone labs c8051f320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
105.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
106.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
107.本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
108.本说明书的实施例是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程欺诈案例的串并设备的处理器以产生一个机器,使得通过计算机或其他可编程欺诈案例的串并设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
109.这些计算机程序指令也可存储在能引导计算机或其他可编程欺诈案例的串并设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
110.这些计算机程序指令也可装载到计算机或其他可编程欺诈案例的串并设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
111.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
112.内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
113.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算
机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
114.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
115.本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
116.本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
117.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
118.以上所述仅为本说明书的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1