本公开涉及模型更新,尤其涉及一种风控模型更新方法、装置及电子设备。
背景技术:
1、随着大数据技术的不断发展,越来越多的金融科技公司开始利用大数据进行风控。在经过数据提取、数据清洗、模型训练、模型部署上线到生产之后,随着时间的推移,模型的区分性和稳定性就会下降。为了确保模型仍然相关并且可靠,需要定时监控模型的各项指标,并将监控指标得到的监控报表发给开发团队和业务团队。
2、然而,不同的模型需要人为手动接入数据,模型处于不断的更新中,数量不断上涨,其便捷性较低。存在数据接入不智能的问题;并且使用普通的关系型数据库,缺乏对时间序列等的查询优化,导致数据接入的效率不高。此外,不同模型的响应内容存在较大差异,缺少对模型响应内容的封装和标准化,尤其当模型存在多个版本时缺乏灵活配置的能力。
技术实现思路
1、为克服相关技术中数据接入的效率不高,不同模型的响应内容存在较大差异,缺少对模型响应内容的封装和标准化,当模型存在多个版本时缺乏灵活配置的能力的技术问题,本公开提供一种风控模型更新方法、装置及电子设备。
2、在本公开实施例的第一方面,提供一种风控模型更新方法,所述方法包括:
3、采用目标数据接入模式,根据多模型多版本生成的数据,生成每一模型中应用和与所述应用对应版本的待用数据;
4、从所述待用数据中,确定与所述应用的版本对应的生效监控参数;
5、以定时任务执行时间为基准,分时段统计生效监控参数,得到指标趋势、指标值分布和网关流量;
6、通过显示界面上的时间窗口,展示所述指标趋势、所述指标值分布和所述网关流量;
7、通过每个模型应用的当前启用配置,从指标趋势、指标值分布和网关流量查到目标监控参数;
8、在click house中对应模型应用和版本的表中,从所述目标监控参数中查询指定时间内的每个参数的目标指标,并通过所述目标指标对所述风控模型更新。
9、在一种优选的实施方式中,所述采用目标数据接入模式,根据多模型多版本生成的数据,生成每一模型中应用和与所述应用对应版本的待用数据,包括:
10、按照第一定时任务,调用多模型多版本生成的数据,并将所述数据记录在所述第一定时任务生成的第一定时任务表中;
11、按照第二定时任务,采用目标数据接入模式,将所述第一定时任务列表中记录的所述数据转移到列式存储数据库对应的总表中;
12、按照第三定时任务,从所述总表中清洗数据,生成每一模型中应用和与所述应用对应版本的待用数据。
13、在一种优选的实施方式中,所述目标数据接入模式为推模式、拉模式中的任一种。
14、在一种优选的实施方式中,所述从所述待用数据中,确定与所述应用的版本对应的生效监控参数,包括:
15、通过cron表达式的方式在显示界面上配置定时任务执行时间,其中,在显示界面上包括每个定时任务的执行时间点;
16、以所述定时任务执行时间为基准,分时段对所述待用数据进行统计;
17、根据预先设置的默认值、分组规则以及稳定性指标,从分时段统计后的待用数据中,确定与所述应用的版本对应的生效监控参数。
18、在一种优选的实施方式中,所述指标包括调用量、缺失数、缺失率、psi滚动、psi固定、方差、标准差、平均值、最大值、上四分位、中位数、下四分位、最小值和值分布中的至少一者。
19、在一种优选的实施方式中,所述网关流量包括所述每个模型应用的调用量、异常请求数、最大响应时间、平均响应时间中的至少一者。
20、在一种优选的实施方式中,所述方法还包括:
21、根据预先配置的告警规则,确定分时段统计后的生效监控参数是否触发告警;
22、在分时段统计后的生效监控参数存在触发告警的情况下,通过预先配置的告警方式进行告警。
23、在本公开实施例的第二方面,提供一种风控模型更新装置,所述装置包括:
24、生成模块,被配置为采用目标数据接入模式,根据多模型多版本生成的数据,生成每一模型中应用和与所述应用对应版本的待用数据;
25、确定模块,被配置为从所述待用数据中,确定与所述应用的版本对应的生效监控参数;
26、统计模块,被配置为以定时任务执行时间为基准,分时段统计生效监控参数,得到指标趋势、指标值分布和网关流量;
27、展示模块,被配置为通过显示界面上的时间窗口,展示所述指标趋势、所述指标值分布和所述网关流量;
28、查询模块,被配置为通过每个模型应用的当前启用配置,从指标趋势、指标值分布和网关流量查到目标监控参数;
29、更新模块,被配置为在click house中对应模型应用和版本的表中,从所述目标监控参数中查询指定时间内的每个参数的目标指标,并通过所述目标指标对所述风控模型更新。
30、在一种优选的实施方式中,所述生成模块,被配置为:
31、按照第一定时任务,调用多模型多版本生成的数据,并将所述数据记录在所述第一定时任务生成的第一定时任务表中;
32、按照第二定时任务,采用目标数据接入模式,将所述第一定时任务列表中记录的所述数据转移到列式存储数据库对应的总表中;
33、按照第三定时任务,从所述总表中清洗数据,生成每一模型中应用和与所述应用对应版本的待用数据。
34、在本公开实施例的第三方面,提供一种电子设备,包括:
35、处理器;
36、用于存储处理器可执行指令的存储器;
37、其中,所述处理器被配置为执行所述存储器中的可执行指令,以实现第一方面中任意一项所述的方法。
38、本公开的实施例提供的技术方案可以包括以下有益效果:
39、采用目标数据接入模式,根据多模型多版本生成的数据,生成每一模型中应用和与应用对应版本的待用数据;从待用数据中,确定与应用的版本对应的生效监控参数;以定时任务执行时间为基准,分时段统计生效监控参数,得到指标趋势、指标值分布和网关流量;通过显示界面上的时间窗口,展示指标趋势、指标值分布和网关流量;通过每个模型应用的当前启用配置,从指标趋势、指标值分布和网关流量查到目标监控参数;在clickhouse中对应模型应用和版本的表中,从目标监控参数中查询指定时间内的每个参数的目标指标,并通过目标指标对风控模型更新。无需手动指定数据来源就能接入数据。新建模型应用或者增加模型应用的版本,数据都能自动接入。采用列式存储数据库clickhouse才存储接入的数据,使用mergetree引擎并按照写入时间的ymd进行分区,提高查询效率。可以监控动态变化的模型应用和版本,监控参数灵活可配置。
40、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种风控模型更新方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述采用目标数据接入模式,根据多模型多版本生成的数据,生成每一模型中应用和与所述应用对应版本的待用数据,包括:
3.根据权利要求2所述的方法,其特征在于,所述目标数据接入模式为推模式、拉模式中的任一种。
4.根据权利要求1所述的方法,其特征在于,所述从所述待用数据中,确定与所述应用的版本对应的生效监控参数,包括:
5.根据权利要求1所述的方法,其特征在于,所述指标包括调用量、缺失数、缺失率、psi滚动、psi固定、方差、标准差、平均值、最大值、上四分位、中位数、下四分位、最小值和值分布中的至少一者。
6.根据权利要求1所述的方法,其特征在于,所述网关流量包括所述每个模型应用的调用量、异常请求数、最大响应时间、平均响应时间中的至少一者。
7.根据权利要求1-6中任一项所述的方法,其特征在于,所述方法还包括:
8.一种风控模型更新装置,其特征在于,所述装置包括:
9.根据权利要求8所述的装置,其特征在于,所述生成模块,被配置为:
10.一种电子设备,其特征在于,包括: