本申请涉及数据处理,尤其涉及一种基于多模型策略的监管报送数据检核方法、装置、电子设备及存储介质。
背景技术:
1、近年来,随着科技发展和数字化转型的发展趋势,监管部门对银行业金融机构经营管理和风险管理提出了更高的要求。为了满足在数据量稳步增长的环境中及时提供高质量报送数据的需求,我们需要高度重视监管数据质量问题,加强数据质量监控、检查和考核评价,现有监管报送数据方法存在监管成本高、效率底下,且现存数据监管方法精度较低,无法精准地检测异常数据。目前的异常数据检测方法,或者又被称为“离群点检测”,大多基于数据分布特征,来判断某个数据点是否属于异常。检测的异常数据通俗表述为:(1)异常数据跟样本中大多数数据不太一样。(2)异常数据在整体数据样本中占比比较小。较主流的方法为:isolation forest、dbscan等。这些方法没有充分考虑到监管数据的特殊性。
2、综合所述可知,如何设计一种提取精度高、效率快的监管报送数据检核方法是目前亟需解决的问题。
技术实现思路
1、本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
2、为此,本申请的第一个目的在于提出一种基于多模型策略的监管报送数据检核方法,以解决现有技术手段数据监管方法精度较低,无法精准地检测异常数据等问题。
3、本申请的第二个目的在于提出一种装置。
4、本申请的第三个目的在于提出一种电子设备。
5、本申请的第四个目的在于提出一种计算机可读存储介质。
6、为达上述目的,本申请第一方面实施例提出了一种基于多模型策略的监管报送数据检核方法,包括:
7、获取监管报送明细数据及指标;
8、基于所述监管报送明细数据及指标,建立监管数据多维时间矩阵;
9、基于所述监管数据多维时间矩阵生成监管数据指标的时间序列特征;
10、基于异常检测方法构建异常检测模型库;
11、基于所述时间序列特征,匹配所述异常检测模型库中符合特征的检测模型,并对待检测数据进行检核,得到检核结果。
12、优选地,所述基于所述监管报送明细数据及指标,建立监管数据多维时间矩阵包括:利用开发自动化工具,从报表中抽取关键数据,进行标准化处理后对历史数据进行拼接整合,建立监管数据多维时间序列矩阵。
13、优选地,所述时间序列特征包括:
14、时间序列统计特征,包括数据的最大值、最小值、值域、均值、中位数、方差、峰度、同比、环比、周期性、自相关系数及变异系数;
15、时间序列分类特征,包括数据的熵特征、小波分析特征、值分布特征。
16、优选地,所述基于异常检测方法构建异常检测模型库包括:
17、利用了3-sigma、emwa、多项式统计异常检测及基于时间序列预测的异常值检测方法,构建监管数据异常检测模型库。
18、优选地,所述基于所述时间序列特征,匹配所述异常检测模型库中符合特征的检测模型包括:
19、基于所述时间序列特征,选择适配的异常检测模型,包括:
20、平稳序列,选取所述3-sigma模型;
21、不平稳序列,呈现无趋势,无差异特征,选取所述ewma、多项式统计异常检测模型;
22、不平稳序列,呈现无趋势,有差异特征,选择动态阈值模型。
23、优选地,所述匹配所述异常检测模型库中符合特征的检测模型支持多模型融合方法。
24、优选地,所述对待检测数据进行检核,得到检核结果包括:
25、针对监管的关键性指标,基于所述时间序列特征分析,根据指标历史数据预测未来一段时间内的正常情况,再计算实际数据和预测数据的残差,根据残差的相对大小判断当期数据是否属于异常,得到检核结果。
26、为达上述目的,本申请第二方面实施例提出了一种基于多模型策略的监管报送数据检核装置,包括:
27、检测报表构建模块,获取监管报送明细数据及指标;
28、矩阵建立模块,基于所述监管报送明细数据及指标,建立监管数据多维时间矩阵;
29、特征生成模块,基于所述监管数据多维时间矩阵生成监管数据指标的时间序列特征;
30、模型库构建模块,基于异常检测方法构建异常检测模型库;
31、检核模块,基于所述时间序列特征,匹配所述异常检测模型库中符合特征的检测模型,并对待检测数据进行检核,得到检核结果。
32、为达上述目的,本申请第三方面实施例提出了一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;
33、所述存储器存储计算机执行指令;
34、所述处理器执行所述存储器存储的计算机执行指令,以实现上述任一项所述的方法。
35、为达上述目的,本申请第四方面实施例提出了一种计算机可读存储介质,包括所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现上述任一项所述的方法。
36、本申请提供的一种基于多模型策略的监管报送数据检核方法,本方法针对监管报送的手工报表数据,进行自动标准化处理,基于指标间勾稽关系的异常检核模型,创新性地对指标间的勾稽关系进行异常检测,符合监管机构的关注重点,通过识别监管数据的时间序列特征,自动选择适配的模型,并支持多模型融合方法,能够更准确、全面检测到监管报送数据的异常,并在实践中较高的可扩展性和实用性。
37、本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
1.一种基于多模型策略的监管报送数据检核方法,其特征在于,包括:
2.根据权利要求1所述的基于多模型策略的监管报送数据检核方法,其特征在于,所述基于所述监管报送明细数据及指标,建立监管数据多维时间矩阵包括:利用开发自动化工具,从报表中抽取关键数据,进行标准化处理后对历史数据进行拼接整合,建立监管数据多维时间序列矩阵。
3.根据权利要求1所述的基于多模型策略的监管报送数据检核方法,其特征在于,所述时间序列特征包括:
4.根据权利要求1所述的基于多模型策略的监管报送数据检核方法,其特征在于,所述基于异常检测方法构建异常检测模型库包括:
5.根据权利要求4所述的基于多模型策略的监管报送数据检核方法,其特征在于,所述基于所述时间序列特征,匹配所述异常检测模型库中符合特征的检测模型包括:
6.根据权利要求5所述的基于多模型策略的监管报送数据检核方法,其特征在于,所述匹配所述异常检测模型库中符合特征的检测模型支持多模型融合方法。
7.根据权利要求1所述的基于多模型策略的监管报送数据检核方法,其特征在于,还包括:
8.一种基于多模型策略的监管报送数据检核装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:处理器,以及与所述处理器通信连接的存储器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1-7中任一项所述的方法。