本申请属于计算机,尤其涉及一种数据处理方法、装置、设备及存储介质。
背景技术:
1、随着互联网技术的发展,用户画像在各个领域得到广泛应用。其中,用户画像是将用户的每个具体的用户特征抽象成标签,利用这些标签将用户形象具体化,以便服务平台根据标签为用户提供针对性的服务。
2、在相关技术中,服务平台可以根据与信贷交易需求预先关联的被监控业务的标签,反向定位与标签对应的用户特征如交易数据,从而基于用户特征确定该用户在其平台的信贷交易权限。然而,由于被监控业务范围存在限制,使得业务标签具有同质性和局限性,进而导致服务平台获取到的用户特征较为单一,影响服务平台对用户的风险估计。
技术实现思路
1、本申请实施例提供一种数据处理方法、装置、设备及存储介质,能够解决相关技术中无法获取完整的用户特征,影响服务平台对用户评估的准确性的问题。
2、第一方面,本申请实施例提供一种数据处理方法,该方法可以包括:
3、获取多组用户交易特征,多组用户交易特征中的每组用户交易特征包括用户端的目标用户交易特征;
4、按照聚类维度,通过n个聚类算法分别对每组用户交易特征进行聚类,得到聚类结果;其中,聚类维度包括p层交易统计时间段,p层交易统计时间段中的每层交易统计时间段的时长不同,聚类结果包括每组用户交易特征在p层交易统计时间段的第p层交易统计时间段内且与n个聚类算法中第n个聚类算法对应的类簇集合;
5、根据聚类结果,确定与业务场景对应的用户经营标签,用户经营标签包括用于表征每组用户交易特征中的目标用户交易特征在第p层交易统计时间段内且与第n个聚类算法对应的聚类簇之间相似性程度。
6、第二方面,本申请实施例提供一种数据处理装置,该装置可以包括:
7、获取模块,用于获取多组用户交易特征,多组用户交易特征中的每组用户交易特征包括用户端的目标用户交易特征;
8、聚类模块,用于按照聚类维度,通过n个聚类算法分别对每组用户交易特征进行聚类,得到聚类结果;其中,聚类维度包括p层交易统计时间段,p层交易统计时间段中的每层交易统计时间段的时长不同,聚类结果包括每组用户交易特征在p层交易统计时间段的第p层交易统计时间段内且与n个聚类算法中第n个聚类算法对应的类簇集合;
9、确定模块,用于根据聚类结果,确定与业务场景对应的用户经营标签,用户经营标签包括用于表征每组用户交易特征中的目标用户交易特征在第p层交易统计时间段内且与第n个聚类算法对应的聚类簇之间相似性程度。
10、第三方面,本申请实施例提供了一种计算机设备,该计算机设备包括:处理器以及存储有计算机程序指令的存储器;
11、处理器执行计算机程序指令时实现如第一方面所示的数据处理方法。
12、第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面所示的数据处理方法。
13、第五方面,本申请实施例提供了一种芯片,芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面所示的数据处理方法。
14、第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所示的数据处理方法。
15、本申请实施例的数据处理方法、装置、设备及存储介质,可以获取多组用户交易特征,多组用户交易特征中的每组用户交易特征包括用户端的目标用户交易特征。接着,按照聚类维度,通过n个聚类算法分别对每组用户交易特征进行聚类,得到聚类结果;其中,聚类维度包括p层交易统计时间段,p层交易统计时间段中的每层交易统计时间段的时长不同,聚类结果包括每组用户交易特征在p层交易统计时间段的第p层交易统计时间段内且与n个聚类算法中第n个聚类算法对应的类簇集合。然后,根据聚类结果,确定与业务场景对应的用户经营标签,用户经营标签包括用于表征每组用户交易特征中的目标用户交易特征在第p层交易统计时间段内且与第n个聚类算法对应的聚类簇之间相似性程度。这样,在按照聚类维度和p层交易统计时间段中的每层交易统计时间段,利用n个聚类算法分别对所述每组用户交易特征进行聚类的优势,生成更合理的簇结构,结合用户交易在第p层交易统计时间段内且与第n个聚类算法对应的聚类簇之间相似性程度,有利于获取目标用户交易特征关于各类簇模糊隶属信息,有助于进一步精细化用户端的标签,进而使得服务平台获取到更为丰富的用户特征,以便在运用机器学习方法挖掘用户端关于不同场景和不同层交易统计时间段的隐式交易模式,并通过从粗到细的交易统计时间段逐层次转换,从大规模交易模式中寻找有助于理解能影响用户关于不同场景的交易偏好的有效特征组合,丰富标签体系的构造逻辑,提高服务平台根据标签为用户提供针对性的服务的准确性。
1.一种数据处理方法,包括:
2.根据权利要求1所述的方法,其中,所述目标用户交易特征包括卡基特征和账基特征,其中,所述卡基特征包括至少一个支付卡的交易流水特征,所述账基特征包括至少一个交易账户的交易流水特征;
3.根据权利要求2所述的方法,其中,所述聚类结果包括与所述卡基特征对应的第一聚类结果和与所述账基特征对应的第二聚类结果;
4.根据权利要求1所述的方法,其中,所述聚类维度还包括m个地域;所述聚类结果包括针对所述m个地域中第m个地域内,所述每组用户交易特征在所述p层交易统计时间段的第p层交易统计时间段内且与所述n个聚类算法中第n个聚类算法对应的类簇集合。
5.根据权利要求1或4所述的方法,其中,所述聚类维度还包括k个业务场景;
6.根据权利要求1-5任意一项所述的方法,其中,所述聚类维度包括p层交易统计时间段、m个地域和k个业务场景;所述按照聚类维度,通过n个聚类算法分别对所述每组用户交易特征进行聚类,得到聚类结果,包括:
7.根据权利要求6所述的方法,其中,所述根据所述聚类结果,确定与业务场景对应的用户经营标签,包括:
8.根据权利要求7所述的方法,其中,所述以所述第k个业务场景下的基础聚类平均信息熵为评估条件,评估所述聚类结果,得到目标聚类结果,包括:
9.根据权利要求7或8所述的方法,其中,所述根据所述目标聚类结果,确定与业务场景对应的用户经营标签,包括:
10.根据权利要求1所述的方法,其中,所述方法还包括:
11.根据权利要求10所述的方法,其中,所述通过所述绝对语义标签和相对语义标签,对所述用户经营标签进行校正,得到与所述业务场景对应的目标用户经营标签,包括:
12.根据权利要求11所述的方法,其中,所述通过所述绝对语义标签和相对语义标签,对所述用户经营标签进行校正,得到与所述业务场景对应的目标用户经营标签,包括:
13.根据权利要求12所述的方法,其中,所述通过所述绝对语义标签和相对语义标签,对所述用户经营标签进行校正,得到与所述业务场景对应的目标用户经营标签,包括:
14.根据权利要求12所述的方法,其中,所述通过所述绝对语义标签和相对语义标签,对所述用户经营标签进行校正,得到与所述业务场景对应的目标用户经营标签,包括:
15.一种数据处理装置,包括:
16.一种计算机设备,所述设备包括:处理器以及存储有计算机程序指令的存储器;
17.一种存储介质,所述存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-14任意一项所述的数据处理方法。