用于风控模型的数据监控方法、装置及电子设备与流程

文档序号:27967678发布日期:2021-12-12 22:32阅读:115来源:国知局
用于风控模型的数据监控方法、装置及电子设备与流程

1.本发明实施例涉及数据处理技术领域,尤其涉及一种用于风控模型的数据监控方法、装置及电子设备。


背景技术:

2.在互联网金融市场中,常用风控模型(全称:风险控制模型)来确定最高能够承受什么样的高风险客户,以及确定该如何把这些资产证券化并分散点风险给投行对自己是最有利的。
3.风控模型一旦正式上线部署后,将运行较长一段时间才会更新换代,但是,互联网金融市场风云变幻,经济环境变化、客群变化、数据源获取等各种内外部因素都会引起风控模型处理结果偏移,甚至出现错误,但由于更新周期较长,很难及时发现风控模型的问题。


技术实现要素:

4.鉴于此,为解决上述的技术问题,本发明实施例提供一种用于风控模型的数据监控方法、装置及电子设备。
5.第一方面,本发明实施例提供一种用于风控模型的数据监控方法,包括:
6.从待监控风控模型的源数据中确定出第一目标监控数据;
7.对所述第一目标监控数据进行预处理,得到分箱数据;
8.确定监控参数;
9.根据所述监控参数及所述分箱数据生成监控报告。
10.第二方面,本发明实施例提供一种用于风控模型的数据监控装置,包括:
11.第一确定模块,用于从待监控风控模型的源数据中确定出第一目标监控数据;
12.数据处理模块,用于对所述第一目标监控数据进行预处理,得到分箱数据;
13.第二确定模块,用于确定监控参数;
14.监控报告模块,用于根据所述监控参数及所述分箱数据生成监控报告。
15.第三方面,本发明实施例提供一种电子设备,包括:处理器和存储器,所述处理器用于执行所述存储器中存储的用于风控模型的数据监控程序,以实现第一方面中任一项所述的用于风控模型的数据监控方法。
16.第四方面,本发明实施例提供一种存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现第一方面中任一项所述的用于风控模型的数据监控方法。
17.本发明实施例提供的技术方案,针对待监控的风控模型,获取其源数据,并通过分箱处理将源数据进行离散化,避免后期数据处理时候数据过拟合而影响监控结果,然后根据确定的监控参数和分箱数据来生成监控报告,其中监控参数例如可以是时间、数据阈值范围等等,即可以理解为可以及时发现分箱数据出现的异常情况的参数,进而避免更新周期较长,很难及时发现风控模型的问题。
附图说明
18.图1为本发明实施例示出的一种用于风控模型的数据监控方法的流程示意图;
19.图2为本发明实施例提供的另一种用于风控模型的数据监控方法的实施例流程图;
20.图3为本发明实施例提供的风控模型的监控效果示意图;
21.图4为本发明实施例提供的监控数据预处理的可视化操作界面示意图;
22.图5为本发明实施例提供的监控数据预处理结果展示界面示意图;
23.图6为本发明实施例提供的监控参数的可视化操作界面示意图;
24.图7为本发明实施例提供的监控报告生成过程可视化界面示意图;
25.图8为本发明实施例提供的一种用于风控模型的数据监控装置的实施例框图;
26.图9为本发明实施例提供的一种的电子设备的结构示意图。
具体实施方式
27.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
28.下面结合附图以具体实施例对本发明提供的用于风控模型的数据监控方法做进一步的解释说明,实施例并不构成对本发明实施例的限定。
29.图1为本发明实施例示出的一种用于风控模型的数据监控方法的流程示意图。
30.如图1所示,一种用于风控模型的数据监控方法可以包括如下步骤:
31.步骤101,从待监控风控模型的源数据中确定出第一目标监控数据。
32.本发明实施例可以由具有数据交互、数据计算能力的电子设备实施,实现步骤可以是该电子设备上运行的应用程序。该电子设备可以与风控模型运行的电子设备相连接,或者与风控模型的数据存储装置(存储服务器、云存储等)相连接,以获取风控模型的源数据。
33.本发明实施例的电子设备或者电子设备上运行的应用程序中,为了实现本发明实施或者增加本发明实施例技术方案的应用范围,可以设置多种/多个风控模型,进而根据客户需求来确定哪些为待监控风控模型。示例性地,可以为用户提供可视化界面,用户通过输入装置(例如,鼠标、键盘、语音输入设备等)确定其目标风控模型,该目标风控模型即本发明实施例的待监控风控模型。
34.本步骤中,第一目标监控数据即待监控风控模型中相关指标对应的源数据。
35.步骤102,对第一目标监控数据进行预处理,得到分箱数据。
36.在本发明实施例中,可以通过可视化操作界面获取操作选项信息,进而对第一目标监控数据进行预处理。示例性地,可以监测预处理的可视化操作界面的操作选项信息,操作选项信息用于表征分箱处理参数,基于分箱处理参与对第一目标监控数据进行分箱处理,得到分箱数据。如图4所示,为本发明实施例提供了监控参数的可视化操作界面示意图,可以在该界面内完成“数据集”、分箱处理确认键、分箱类型、分箱组数等的选择,例如,数据集为模型5(可以表示编号为5的待监控风控模型对应的第一目标监控数据),分箱处理确认
键为“是”(表征确定对模型5的第一目标监控数据进行分箱处理)、分箱类型为“等距”(表征按照数据等距方式进行分箱处理)、分箱组数为“10”(表征将第一目标监控数据分为10个组),最终得到分箱数据。得到的分箱数据的显示可以参加如图5所示的界面。可以理解的是,本发明提供的附图仅为一种示例,并不对本发明的技术方案等造成限制,以及也不对本发明中分箱数据的处理、显示等造成限制。
37.分箱处理即将连续变量进行离散化,变量离散化后会异常数据有很强的鲁棒性,有助于后续对待监控风控模型的异常监督。需要说明的是,分箱处理可以分为无监督分箱和有监督分箱两大类,而无监督分箱又可以包括等距分箱、等频分箱和聚类分箱,有监督分箱可以包括best

ks分箱和卡方分箱。在本发明实施例中,不对分箱处理的方法进行限制,可以采用任一种分箱处理的方法,只要能够得到分箱数据即可。
38.步骤103,确定监控参数。
39.在本步骤中,可以监测监控参数的可视化操作界面的参数项设置信息,进而根据参数项设置信息生成监控参数。其中,参数项设置信息例如可以包括待监控指标、待监控指标的告警阈值范围、待监控指标启用状态的设置信息,如图6所示,为可视化操作界面的显示示意图,图中限制有任一个待监控指标对应的数据源(例如图中的mysql)、指标类型(模板、非模板等,其中,模板例如为待监控风控模型中的既定监控指标,非模板例如为自定义的待监控风控模型的监控指标)、指标代码、启用状态、以及操作(修改或复制)按钮等,可以通过在可视化操作界面进行实时操作以形成监控参数的参数项设置信息,也可以在后台设置后由当前可视化操作界面进行显示。
40.在一些实施例中,根据参数项设置信息生成监控参数例如可以实现为:
41.根据待监控指标的设置信息确定待监控指标,根据待监控指标的告警阈值范围的设置信息确定待监控指标的告警阈值范围,以及根据待监控指标启用状态的设置信息确定待监控指标启用状态,进而将待监控指标、待监控指标的告警阈值范围和待监控指标启用状态确定为监控参数。
42.步骤104,根据监控参数及分箱数据生成监控报告。
43.在本发明实施例中,监控报告的生成例如可以实现为:基于待监控指标从分箱数据中确定出待监控指标对应的第二目标监控数据,根据待监控指标启用状态确定任一待监控指标是否处于启用状态,对处于启用状态的待监控指标,根据该待监控指标的告警阈值范围确定该待监控指标对应的第二目标监控数据是否超出告警阈值范围,针对超出告警阈值范围的所有待监控指标及其对应的第二目标监控数据,生成监控报告。
44.其中,第二目标监控数据对应待监控指标,例如,原来分箱数据可能包括ks、psi、csi、iv等业务指标和io、cpu、磁盘容量、耗时等运行指标对应的数据,从中选择部分指标,例如选择ks、psi、csi等业务指标和cpu性能指标,则ks、psi、csi等业务指标和cpu性能指标对应的数据则可以确定为第二目标监控数据。
45.在一些实施例中,可以将第二目标监控数据作为监控数据报告输出,在另一些实施例中,可以先确定第二目标监控数据是否超出其预设的告警阈值范围,如果超出了,则将其作为监控报告的数据,然后输出。
46.在另一些实施例中,还可以通过可视化操作界面设置告警联系人信息,从而将生产的监控包括发送给告警联系人;和/或,确定监控报告的报告生成时间(例如,通过可视化
操作界面的时间选项进行时间选择),以在到达报告生成时间时,执行针对超出告警阈值范围的所有待监控指标及其对应的第二目标监控数据,生成监控报告的步骤。如图7所示,该界面可以用于监控报告生成前,由用户再次确认待监控指标、报告生成时间、告警联系人等,进而在报告生成时间达到时,生成与待监控指标对应的监控报告,将监控报告发送告警联系人。
47.在一些实施例中,还提供监控可视化图,如图3所示,用于将监控报告转化成可视化的趋势图等,便于用户查看。
48.在一些实施例中,在根据待监控指标及分箱数据生成监控报告之后,还可以包括如下任一个或者多个步骤:
49.按照预设存储方式存储监控报告;
50.和/或,
51.在确定监控报告中任一待监控指标对应的数据出现异常时,生成监控警告;
52.根据预设联系人信息将监控警告发送至目标地址;
53.和/或,
54.在确定监控报告中出现运行异常数据时,重新运行根据待监控指标及分箱数据生成监控报告的步骤,以生成监控报告;
55.和/或,
56.在确定待监控风控模型的源数据包括有历史数据时,基于历史数据生成历史监控数据。
57.为了本领域技术人员能够清楚、准确地理解本发明实施例提供的技术方案,下面再结合图2介绍下本发明用于风控模型的数据监控方法的处理流程:
58.1.选择数据源,即选择待监控的风控模型以及对应的数据,读取数据方式可以参加前述图1的相关内容,在此不赘述;
59.2.定义输入项,即定义预处理方式,生成分箱数据(可自定义,可以多种方式分箱,亦可枚举):定义输入项分箱、设置规则,自动化对数据进行预处理,也可手动配置;
60.3.确定告警联系人、联系方式;
61.4.选择监控指标(可自定义监控指标;即待监控指标确定);
62.5.监控日报跑批,以邮件的形式每日发送,也可查看历史快照;
63.6.若有历史数据,可以选择补数,监控日报将显示这些历史状况,主要针对新入模型,即针对新入系统的模型若有历史数据可以进行补数,得到历史监控数据(可用作指标对比等);历史快照实现持久化存储,用来记录历史状况;
64.7.若运行失败,自动重跑,即对错误/失误的数据进行重跑,修正意外情况;
65.8.若有告警,通知联系人,例如,可通过邮件、电话、短信等方式通知相关人员。
66.此外,监控指标例如可以包括如下三类:
67.第一类:实时监控性能指标:如io、cpu、磁盘容量、耗时等模型运行的基本情况;
68.第二类:实时监控业务指标:如ks值、psi值、iv值等风控指标;
69.第三类:自定义指标:可以参考模板,自定义业务特有的指标。
70.其中,业务指标的相关说明可以参加如下表:
[0071][0072]
综上所述,本发明实施例提供的技术方案,针对待监控的风控模型,获取其源数据,并通过分箱处理将源数据进行离散化,避免后期数据处理时候数据过拟合而影响监控结果,然后根据确定的监控参数和分箱数据来生成监控报告,其中监控参数例如可以是时间、数据阈值范围等等,即可以理解为可以及时发现分箱数据出现的异常情况的参数,进而避免更新周期较长,很难及时发现风控模型的问题。
[0073]
此外,本发明实施例还提供可编辑的可视化操作界面,供操作选择,功能全面、自动化程度高,支持自定义功能,可扩展性强。并且在处理数量级、处理速度、开源等方面都能满足比较高的要求,功能强大。功能齐全,互相配合,能够最大限度的满足使用需求,具有高度的易用性。
[0074]
本发明实施例还提供了与前述用于风控模型的数据监控方法对应的用于风控模型的数据监控装置,下面结合附图对该装置进行描述。
[0075]
图8为本发明实施例提供的一种用于风控模型的数据监控装置的实施例框图。如图8所示,用于风控模型的数据监控装置可以包括:
[0076]
第一确定模块81,用于从待监控风控模型的源数据中确定出第一目标监控数据。
[0077]
数据处理模块82,用于对第一目标监控数据进行预处理,得到分箱数据。
[0078]
第二确定模块83,用于确定监控参数。
[0079]
监控报告模块84,用于根据监控参数及所述分箱数据生成监控报告。
[0080]
在一实施例中,所述监控参数还包括预设联系人信息,所述装置还包括(图中未示出):
[0081]
存储模块,用于在所述根据所述待监控指标及所述分箱数据生成监控报告之后,按照预设存储方式存储所述监控报告;
[0082]
和/或,
[0083]
警告模块,用于在确定所述监控报告中任一待监控指标对应的数据出现异常时,生成监控警告;根据所述预设联系人信息将所述监控警告发送至目标地址;
[0084]
和/或,
[0085]
重运行模块,用于在确定所述监控报告中出现运行异常数据时,重新运行所述根据所述待监控指标及所述分箱数据生成监控报告的步骤,以生成监控报告;
[0086]
和/或,
[0087]
历史监控模块,用于在确定待监控风控模型的源数据包括有历史数据时,基于所述历史数据生成历史监控数据。
[0088]
在一实施例中,所述数据处理模块82对所述第一目标监控数据进行预处理,得到分箱数据,包括:
[0089]
监测所述预处理的可视化操作界面的操作选项信息,所述操作选项信息用于表征分箱处理参数;
[0090]
基于所述分箱处理参与对所述第一目标监控数据进行分箱处理,得到分箱数据。
[0091]
在一实施例中,所述第二确定模块83确定监控参数,包括:
[0092]
监测所述监控参数的可视化操作界面的参数项设置信息;根据所述参数项设置信息生成所述监控参数。
[0093]
在一实施例中,所述参数项设置信息包括待监控指标、待监控指标的告警阈值范围、待监控指标启用状态的设置信息;
[0094]
所述第二确定模块83根据所述参数项设置信息生成所述监控参数,包括:
[0095]
根据所述待监控指标的设置信息确定待监控指标;根据所述待监控指标的告警阈值范围的设置信息确定所述待监控指标的告警阈值范围;根据所述待监控指标启用状态的设置信息确定所述待监控指标启用状态;将所述待监控指标、所述待监控指标的告警阈值范围和所述待监控指标启用状态确定为所述监控参数。
[0096]
在一实施例中,所述监控报告模块84根据所述监控参数及所述分箱数据生成监控报告,包括:
[0097]
基于所述待监控指标从所述分箱数据中确定出所述待监控指标对应的第二目标监控数据;根据所述所述待监控指标启用状态确定任一待监控指标是否处于启用状态;对处于启用状态的待监控指标,根据该待监控指标的告警阈值范围确定该待监控指标对应的第二目标监控数据是否超出告警阈值范围;针对超出告警阈值范围的所有待监控指标及其对应的第二目标监控数据,生成监控报告。
[0098]
在一实施例中,所述装置还包括(图中未示出):
[0099]
时间确定模块,用于确定所述监控报告的报告生成时间;
[0100]
所述监控报告模块84还用于:在到达所述报告生成时间时,执行所述针对超出告警阈值范围的待监控指标及其对应的第二目标监控数据,生成监控报告的步骤。
[0101]
本发明实施例提供的技术方案,针对待监控的风控模型,获取其源数据,并通过分箱处理将源数据进行离散化,避免后期数据处理时候数据过拟合而影响监控结果,然后根据确定的监控参数和分箱数据来生成监控报告,其中监控参数例如可以是时间、数据阈值范围等等,即可以理解为可以及时发现分箱数据出现的异常情况的参数,进而避免更新周期较长,很难及时发现风控模型的问题。
[0102]
此外,本发明实施例还提供可编辑的可视化操作界面,供操作选择,功能全面、自动化程度高,支持自定义功能,可扩展性强。并且在处理数量级、处理速度、开源等方面都能满足比较高的要求,功能强大。功能齐全,互相配合,能够最大限度的满足使用需求,具有高度的易用性。
[0103]
图9为本发明实施例提供的一种的电子设备的结构示意图,图9所示的电子设备900包括:至少一个处理器901、存储器902、至少一个网络接口904和其他用户接口903。电子
设备900中的各个组件通过总线系统905耦合在一起。可理解,总线系统905用于实现这些组件之间的连接通信。总线系统905除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图9中将各种总线都标为总线系统905。
[0104]
其中,用户接口903可以包括显示器、键盘或者点击设备(例如,鼠标,轨迹球(trackball)、触感板或者触摸屏等。
[0105]
可以理解,本发明实施例中的存储器902可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read

onlymemory,rom)、可编程只读存储器(programmablerom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、电可擦除可编程只读存储器(electricallyeprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(staticram,sram)、动态随机存取存储器(dynamicram,dram)、同步动态随机存取存储器(synchronousdram,sdram)、双倍数据速率同步动态随机存取存储器(doubledatarate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlinkdram,sldram)和直接内存总线随机存取存储器(directrambusram,drram)。本文描述的存储器902旨在包括但不限于这些和任意其它适合类型的存储器。
[0106]
在一些实施方式中,存储器902存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统9021和应用程序9022。
[0107]
其中,操作系统9021,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序9022,包含各种应用程序,例如媒体播放器(mediaplayer)、浏览器(browser)等,用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序9022中。
[0108]
在本发明实施例中,通过调用存储器902存储的程序或指令,具体的,可以是应用程序9022中存储的程序或指令,处理器901用于执行各方法实施例所提供的方法步骤,例如包括:
[0109]
从待监控风控模型的源数据中确定出第一目标监控数据;
[0110]
对所述第一目标监控数据进行预处理,得到分箱数据;
[0111]
确定监控参数;
[0112]
根据所述监控参数及所述分箱数据生成监控报告。
[0113]
上述本发明实施例揭示的方法可以应用于处理器901中,或者由处理器901实现。处理器901可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器901中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器901可以是通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(fieldprogrammablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器
中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器902,处理器901读取存储器902中的信息,结合其硬件完成上述方法的步骤。
[0114]
可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(applicationspecificintegratedcircuits,asic)、数字信号处理器(digitalsignalprocessing,dsp)、数字信号处理设备(dspdevice,dspd)、可编程逻辑设备(programmablelogicdevice,pld)、现场可编程门阵列(field

programmablegatearray,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本技术所述功能的其它电子单元或其组合中。
[0115]
对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
[0116]
本实施例提供的电子设备可以是如图9中所示的电子设备,可执行如图1中用于风控模型的数据监控方法的所有步骤,进而实现图1中用于风控模型的数据监控方法的技术效果,具体请参照图1相关描述,为简洁描述,在此不作赘述。
[0117]
本发明实施例还提供了一种存储介质(计算机可读存储介质)。这里的存储介质存储有一个或者多个程序。其中,存储介质可以包括易失性存储器,例如随机存取存储器;存储器也可以包括非易失性存储器,例如只读存储器、快闪存储器、硬盘或固态硬盘;存储器还可以包括上述种类的存储器的组合。
[0118]
当存储介质中一个或者多个程序可被一个或者多个处理器执行,以实现上述在电子设备侧执行的用于风控模型的数据监控方法。
[0119]
所述处理器用于执行存储器中存储的用于风控模型的数据监控程序,以实现以下在电子设备侧执行的用于风控模型的数据监控方法的步骤:
[0120]
从待监控风控模型的源数据中确定出第一目标监控数据;
[0121]
对所述第一目标监控数据进行预处理,得到分箱数据;
[0122]
确定监控参数;
[0123]
根据所述监控参数及所述分箱数据生成监控报告。
[0124]
专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0125]
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd

rom、或技术领域内所公知的任意其它形式的存储介质中。
[0126]
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明
的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1