数据筛选方法、装置、电子设备及存储介质与流程

文档序号:34660922发布日期:2023-07-05 05:48阅读:40来源:国知局
数据筛选方法、装置、电子设备及存储介质与流程

本申请涉及大数据智能分析,尤其涉及一种数据筛选方法、装置、电子设备及存储介质。


背景技术:

1、目前,为了对用户账户进行风险评估,比如判断用户是否有欺诈行为等,可以通过预先设置的筛选规则,对真实的生产环境中各用户账户的业务数据进行筛选,从而将满足筛选规则的用户账户确定为风险账户。

2、由于实时产生的数据的流动性与即时性等原因,相关技术多局限在将预先设置的筛选规则部署于生产环境中后,根据生产环境中筛选出的符合筛选规则的数据的数量,判断该筛选规则在用于风险评估时的效果。这就容易出现在生产环境中筛选出的符合筛选规则的数据量过大等情况,从而对数仓容量和业务处理造成风险。因此需要一种能够在设置的筛选规则部署于生产环境之前,提前预估符合筛选规则的数据量的方法。


技术实现思路

1、本申请提供一种数据筛选方法、装置、电子设备及存储介质,用以解决现有技术中将预设的筛选规则部署于生产环境中后,根据生产环境中筛选出的符合筛选规则的数据的数量,判断该筛选规则在用于风险评估时的效果,易出现在生产环境中筛选出的符合筛选规则的数据量过大等情况,从而对数仓容量和业务处理造成风险的问题。

2、第一方面,本申请提供一种数据筛选方法,包括:获取预设的筛选规则,所述筛选规则中包括时间周期以及预设的筛选条件;获取生产环境中与所述筛选条件相关的第一数据表,所述第一数据表中包括任意时间段内多个账户各自对应的第一历史业务数据;获取所述生产环境中与所述筛选条件相关的第二数据表,所述第二数据表中包括所述任意时间段以及所述任意时间段之前的所述时间周期内的多个账户各自对应的第二历史业务数据;基于所述第一数据表和所述第二数据表,通过主键关联的方式,从所述第一数据表中筛选出所述时间周期内满足所述筛选条件的目标账户。

3、第二方面,本申请提供一种数据筛选装置,包括:第一获取模块,用于获取预设的筛选规则,所述筛选规则中包括时间周期以及预设的筛选条件;第二获取模块,用于获取生产环境中与所述筛选条件相关的第一数据表,所述第一数据表中包括任意时间段内多个账户各自对应的第一历史业务数据;第三获取模块,获取所述生产环境中与所述筛选条件相关的第二数据表,所述第二数据表中包括所述任意时间段以及所述任意时间段之前的所述时间周期内的多个账户各自对应的第二历史业务数据;筛选模块,用于基于所述第一数据表和所述第二数据表,通过主键关联的方式,从所述第一数据表中筛选出所述时间周期内满足所述筛选条件的目标账户。

4、第三方面,本申请提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现如第一方面所述的方法。

5、第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如第一方面所述的方法。

6、第五方面,本申请提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现第一方面所述的方法。

7、本申请提供的数据筛选方法、装置、电子设备及存储介质,通过获取预设的筛选规则,筛选规则中包括时间周期以及预设的筛选条件,获取生产环境中与筛选条件相关的第一数据表,第一数据表中包括任意时间段内多个账户各自对应的第一历史业务数据,获取生产环境中与筛选条件相关的第二数据表,第二数据表中包括任意时间段以及任意时间段之前的时间周期内的多个账户各自对应的第二历史业务数据,基于第一数据表和第二数据表,通过主键关联的方式,从第一数据表中筛选出时间周期内满足筛选条件的目标账户。由此,能够在设置的筛选规则部署于生产环境之前,提前准确的预估符合筛选规则的数据量,从而避免出现在生产环境中筛选出的符合筛选规则的数据量过大等情况,避免对数仓容量和业务处理造成风险。



技术特征:

1.一种数据筛选方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一数据表和所述第二数据表,通过主键关联的方式,从所述第一数据表中筛选出所述时间周期内满足所述筛选条件的目标账户,包括:

3.根据权利要求2所述的方法,其特征在于,所述筛选条件包括业务办理次数大于次数阈值;

4.根据权利要求1所述的方法,其特征在于,所述筛选规则还包括触发事件;

5.根据权利要求4所述的方法,所述基于所述第一数据表和所述第二数据表,通过主键关联的方式,从所述第一数据表中筛选出所述触发事件发生之后的所述时间周期内满足所述筛选条件的目标账户,包括:

6.根据权利要求5所述的方法,其特征在于,所述基于所述第四数据表和所述第二数据表,通过主键关联的方式,从所述第一数据表中筛选出在所述触发事件发生之后的所述时间周期内满足所述筛选条件的目标账户,包括:

7.根据权利要求6所述的方法,其特征在于,所述筛选条件包括业务办理次数大于次数阈值且业务数额大于数额阈值;

8.一种数据筛选装置,其特征在于,包括:

9.根据权利要求8所述的装置,其特征在于,所述筛选模块,包括:

10.根据权利要求9所述的装置,其特征在于,所述筛选条件包括业务办理次数大于次数阈值;

11.根据权利要求8所述的装置,其特征在于,所述筛选规则还包括触发事件;

12.根据权利要求11所述的装置,所述第二筛选单元,包括:

13.根据权利要求12所述的装置,其特征在于,所述筛选子单元,具体用于:

14.根据权利要求13所述的装置,其特征在于,所述筛选条件包括业务办理次数大于次数阈值且业务数额大于数额阈值;

15.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;

16.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7中任一项所述的方法。

17.一种计算机程序产品,其特征在于,包括计算机程序,该计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。


技术总结
本申请提供一种数据筛选方法、装置、电子设备及存储介质,涉及大数据智能分析技术领域。该方法包括:获取预设的筛选规则,筛选规则中包括时间周期及筛选条件;获取生产环境中与筛选条件相关的第一数据表和第二数据表,第一数据表中包括任意时间段内多个账户各自对应的第一历史业务数据,第二数据表中包括任意时间段以及任意时间段之前的时间周期内的多个账户各自对应的第二历史业务数据;基于第一数据表和第二数据表,通过主键关联的方式,从第一数据表中筛选出时间周期内满足筛选条件的目标账户。能够在规则部署于生产环境之前,提前准确预估符合规则的数据量,从而避免出现符合规则的数据量过大等情况,避免对数仓容量和业务处理造成风险。

技术研发人员:徐蔚峰,刘锦山,蔡佳煌,林乐凝
受保护的技术使用者:中国建设银行股份有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1