风险预警方法及系统与流程

文档序号:16583704发布日期:2019-01-14 18:12阅读:6417来源:国知局
风险预警方法及系统与流程
本发明涉及数据处理
技术领域
,特别涉及一种风险预警方法及系统。
背景技术
:完善与精细的贷后管理体系,能够通过深入细致的跟踪检查和专业化的分析来捕捉客户的潜在违约风险,及时发出贷后风险预警信号,以便银行能及时采取措施化解风险,最大程度挽回损失。在整个贷后管理体系中,从风险指标到预警信号的生成是最为核心的部分。目前的贷后预警信号生成以定性方法为主,依靠贷后管理人员业务经验较多,通过设置强信号规则,定期进行风险检查,判断是否发生风险。强风险指标预警一般是直接以指标的数据指与一固定的阈值做比较,一旦超过阈值就触发生成预警信号。使用强信号规则预警具有一定的预警能力,但是实际上非强风险指标也具有一定的预警意义,可以监测到风险指标自身的劣变,然而目前却缺少非强风向指标的风险预警方法。技术实现要素:本发明的目的在于改善上述缺陷,提供一种新的风险预警方法及系统。为了实现上述发明目的,本发明实施例提供了以下技术方案:一方面,本发明实施例中提供了一种风险预警方法,包括以下步骤:构造每个过程监测类指标的一个或多个衍生指标;实时收集被监测对象的每个过程监测类指标的每个衍生指标的数据值;设定每个衍生指标的预警阈值;实时将每个衍生指标的数据值与对应的预警阈值做比较,根据超出预警阈值的衍生指标的数量判定是否发出风险预警信号。作进一步优化的方案中,上述方法还包括步骤:基于每个衍生指标的数据值,绘制每个衍生指标的概率分布图;所述设定每个衍生指标的预警阈值,具体是基于每个衍生指标的概率分布图设定每个衍生指标的预警阈值。基于衍生指标的实际数据值生成概率分布图,再根据分布图设定预警阈值,实现预警阈值也跟随指标值动态变化,可以进一步提高风险预警的可靠性。另一方面,本发明实施例中同时提供了一种风险预警系统,包括以下模块:衍生指标构造模块,用于构造每个过程监测类指标的一个或多个衍生指标;数据收集模块,用于实时收集被监测对象的每个过程监测类指标的每个衍生指标的数据值;阈值设置模块,用于设定每个衍生指标的预警阈值;风险预警模块,用于实时将每个衍生指标的数据值与对应的预警阈值做比较,根据超出预警阈值的衍生指标的数量判定是否发出风险预警信号。再一方面,本发明实施例同时提供了一种包括计算机可读指令的计算机可读存储介质,所述计算机可读指令在被执行时使处理器执行本发明实施例中所述方法中的操作。再一方面,本发明实施例同时提供了一种电子设备,包括:存储器,存储程序指令;处理器,与所述存储器相连接,执行存储器中的程序指令,实现本发明实施例中所述方法中的步骤。与现有技术相比,本发明将只能纵向比较的时间序列数据转化为可连续监测的单点指标,并将单点指标以分布的形式反应其风险程度,可同时实现指标的纵向分析和横向分析,且指标将随时间推移而变化,达到动态监测的目的。纵向分析与横向分析为业界通用概念,纵向分析是指将各个时间点的数据与一个基本时点数据进行比较,以研究数据随时间变化的趋势,包括趋势分析和变动率分析,本方案中采用的是变动率分析,一般情况下,企业的各个时点的数据指标彼此变化不会出现大的差异,如果差异较大应引起注意;横向分析是指一个企业与其他企业在同一时点上的比较,可以将多家企业放在同一标准进行比较。经过分析,本发明方法能有效捕捉非强风险指标的早期预警信号,可为强风险指标提供有效补充,且前瞻性高于强风险指标,即可在强风险指标尚未提示预警信号时,有效捕捉风险客户的劣变特征,达到及时预警的目的,为银行减少损失。具体而言,应用本发明后,该类指标发出的预警信号能大幅提高整体召回率。召回率是信用风险中的通用统计学概念,该比例计算的是所有“正确被检索的样本”占所有“应该检索到的样本”的比例,衡量了分类器的效果,该比例越大,说明预警出的逾期客户占所有逾期客户的占比越大,模型的效果越好,减小整体误判率,误判率是信用风险中的通用统计学概念,该比例计算的是未命中的逾期客户数与未预警客户总数的比例,衡量了分类器的准确性,该比例越小,说明将好客户错判为逾期客户的占比越少,模型的效果越好。通常情况下,召回率与误判率会同时使用,召回率高即“找得全”,误判率低即“找得对”。并能达到平均提前预警超过180天,且命中客户的平均账龄在m2+,即命中的逾期客户的实际平均逾期天数在60天及以上。附图说明为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本发明较佳实施例中所述的一种风险预警方法的流程图。图2(a)-(d)分别为不同衍生指标的概率分布图。图3(a)-(c)分别为不同风险类型的指标的预警线划分示意图。图4为本实施例中提供的一种的风险预警系统的功能模块图。图5为本实施例中提供的一种电子设备的结构框图。具体实施方式下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。强风险指标定义:强风险指标称为状态监测类指标(a类),关注的是指标在当前时点发生的变化,可通过当前时点状态的变化即确定是否预警及预警级别。强风险指标涵盖重大违约事件、重大违法违规、工商司法状态异常以及其他明显不利因素,易导致授信资产分类进入不良类的信号,强风险指标例如有对外保证担保笔数、企业申报收入、企业所得税应纳税额等等。该类指标通过设定预警阈值即可提示相应预警级别,强风险指标预警为目前常用预警方式,仅为引出概念,本实施例中对此不做阐述。非强风险指标定义:非强风险指标称为过程监测类指标(b类),该类指标相较于强风险指标,风险程度稍减,无法通过单个时间点的状态变动来明确判定其是否预警或预警级别,因此需量化监测该类指标一定时间段内的变化特征后,综合判定是否触碰预警线及发出预警信号。弱风险指标定义:弱风险指标称为风险提示类指标(c类),该类指标为单一指标的变化不能明显代表客户违约风险的增大,需要由多个指标形成指标池,通过设定指标权重来表示客户违约风险增大。该类指标可用于建立客户行为评分模型,以客户评分的形式预测高风险客户群体。)仅作为举例,下面的表1中列举了部分非强风险指标和弱风险指标。需要注意的是,表1中,“强指标级别”列为b的指标,即为本发明中所说的“非强风险指标”,而为c的指标,为弱风险指标,其预警方法不属于本发明的范畴,另,实际应用时,还会有a类指标,只是在表格中未列示,该类指标即前文提到的“强风险指标”,其预警方法也不属于本发明的范畴。强风险指标无需进行指标衍生,因为强风险指标是指一旦发生就代表有极大违约风险的指标,不需要持续观测其一段时间的变化趋势后再进行判定。表1请参阅图1,本实施例示意性地提供了一种风险预警方法,该方法包括以下步骤:步骤1,构造每个过程监测类指标的衍生指标。衍生指标构造的目的在于将连续变化的指标演化为单点指标,分别通过对多个衍生指标的监控,完成动态监测。本文中,衍生指标构造包括:计算每个过程监测类指标的“衍生指标”,即构造每个过程监测类指标的1个当前指标值和若干个时间段的指标值变化率,作为举例,例如包括t时点指标值、一个月变化率r1、三个月变化率r3及六个月变化率r6,计算规则如下:上述计算式中,t表示t时点的指标值,t-1表示t-1时点(即t时点对应的一个月前的时点)的指标值,t-3表示t-3时点(即t时点对应的三个月前的时点)的指标值,t-6表示t-6时点(即t时点对应的六个月前的时点)的指标值。以“企业申报收入”为例:tt-1t-3t-6r1r3r6951964629574520784600.5136-0.2172-0.1758步骤2,划分指标的风险类型。由于每个指标可能与风险呈不同的关系,因此需要区别对待。对过程监测类指标进行分类(过程监测类指标与其衍生出来的衍生指标使用相同的风险类型分类),根据指标与风险的关系划分为以下分类:(1)正向指标,即越大越好,与风险是成负相关关系,值越大,代表风险越小,在阈值划分时取概率分布图的左边界部分;例如:“企业申报收入”,该指标计算了从税务申报表上报备的企业销售收入值,从经济意义上判断,企业销售收入越高,说明该企业经营状况越好,还款能力越好,则违约风险越低,因此为正向指标。(2)负向指标,即越小越好,与风险是成正相关关系,值越小,代表风险越小,在阈值划分时取概率分布图的右边界部分;例如:“对外保证担保笔数(企业)”,该指标计算了企业从征信报告上显示的企业对外担保笔数,从经济意义上判断,企业对外担保笔数越多,说明该企业的或有负债越多,即还款能力可能越差,则违约风险越高,因此为负向指标。(3)中间型指标,即与风险是趋中关系,值往两边界走,代表风险越大,在阈值划分时取概率分布图的左、右两边界部分。例如:“一度关联方数量”,该指标计算了企业的一度关联方的数量,从经济意义上判断,企业的关联方数量过少,说明公司规模小,业务开展不力,还款能力较差,则违约风险大,同时,若企业的关联方数量过多,说明企业可能面临的风险点多,由关联方产生重大风险事件而引起本体企业连锁反应的可能性大,影响还款能力,则违约风险大。步骤3,实时获取被监测对象的每个监测指标的每个衍生指标的数据值。仅以“企业申报收入”指标为例,在当前客户群中,“企业申报收入”指标的衍生指标的数据值如下表1所示:步骤4,绘制每个衍生指标的概率分布图。绘制分布图之前,需要判断指标值(指标的数值)是否出现异常值,判断异常值的方式如下:(1)若为正向指标:(2)若为负向指标:上表中,只有指标值为“计算值”时是正常情况,其余情况都为异常值,而异常值中,根据t值和r1、r3、r6的取值正负,又可赋值为空值或特殊赋值(如999999或666666)完成指标构造后,在贷款客户群中,每个指标的每一衍生指标均可绘制一副概率分布图,概率分布图是基于正常指标值而建立,分布函数就是变量小于等于某个特定值a的概率,如果将x看成数轴上的随机点的坐标,那么,分布函数f(a)在a处的函数值就表示x落在区间(-∞,a)上的概率,即f(a)=p{x≤a},在极端概率下代表有风险。概率分布图的要素主要包括以下内容:(1)数据点:概率分布图中的每一个数据点代表在每段历史周期该指标对应的变化率。数据点的个数取决于前期数据收集时取的数据样本量(即客户量)的个数。(2)坐标轴:以指衍生指标的数值(包括变化率的值和当前点的指标值,即t值)的值为横坐标轴(x轴),以数据量的值为纵坐标轴(y轴)。仅以上述所举实例表1中所列数据为例,绘制的t、r1、r3、r6的概率分布图分别如图2(a)-(d)所示。进行风险预警的目的不是看某个客户是否有还款风险,所以一般地可以仅针对该单个客户进行监测。然而本方法中,以客户群为基础,统计客户群中指标值在某个范围的数量,一方面既实现了对所有企业的同时监控,另一方面更重要的是,以客户群为参照标准,判定单个客户的指标值在目前这群客户里面是否属于“异常”,提高风险预警的准确性。比如某个客户的指标值变化率为-0.1,从数值来看负得不算大,但如果当前的整个客户群的变化率都是-0.0001左右,那该客户的-0.1就属于“异常”了,就需要预警了。步骤5,基于衍生指标的风险类型,设定预警阈值。基于所有客户的历史数据,构造上述衍生指标,并分别绘制出相应概率分布图,在概率分布图基础上,可以通过以下两种方法确定预警线(预警阈值):方法一:选定固定分位点。分位点亦称为分位数,是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。分位数指的就是连续分布函数中的一个点,这个点对应概率p。若概率0<p<1,随机变量x或它的概率分布的分位数za,是指满足条件p(x≤za)=α的实数。在没有任何业务经验导向的情况下,可以选定初始5%的分位点作为预警线。因为从统计意义上讲,5%属于业界通用的“尾部”定义。具体而言,若为正向指标,则预警线为5%分位点处对应的指标值;若为负向指标,则预警线为95%分位点处对应的指标值;若为中间型指标,则预警线分别为上下5%分位点对应的指标值,如图3(a)-(c)所示。方法二:遗传算法全局寻优。在数据量足够的情况下,也可以通过遗传算法进行全局搜索,找到衍生指标在分布图中哪个分位点的预警黑名单客户命中率最高(预警黑名单客户命中率最高是指命中的逾期客户数最多),且预警信号数量相对合理(可以结合业务经验进行判断,通常预警信号数量大于总客户数量的25%,则判定为不合理。比如:一共有400名客户,针对一个指标而言,如果有100个客户都发出了预警信号,显然就不合理了,预警信号过多,会极大增加贷后客户经理的工作量,不利于预警信号的及时处理),则以该分位点为预警阈值。阈值线的设定规则如下:(1)以指标黑名单命中率最高的分位点作为阈值线的初始设置;(2)阈值线根据数据量的累积,选用最新的样本数据,重跑遗传算法,视情况进行定期(例如每月、每季度)更新。基于遗传算法全局寻优的方式设定预警阈值的步骤包括:(1)输入数据;(2)设置参数,参数包括种群大小(population)、交叉概率(cross_prob)、变异概率(mutation_prob)、最大迭代次数(generation)、待搜索阈值取值范围(threshold_min,threshold_max)、阈值个数(n,可取值3,6)、搜索次数(k)、数据抽样好坏比(times);(3)按照坏样本(此处坏样本是指逾期客户,好样本是指正常还款客户)的倍数抽取好样本,并使用所有坏样本,构成新的数据集;(4)用以上的数据集进行ga(遗传算法)最优阈值搜索,输出最小适应度函数对应的所有最优解(可能存在多个最优解),并求均值。适应度函数为加惩罚项的错误率,将坏人错判为好人的惩罚为2,好人错判为坏人的惩罚为1。惩罚项只关注两者的比例,与具体取值大小无关;(5)重复步骤(3)-(4)k次后,对k次搜索的最优值求均值,该值即为最优预警阈值,并计算分位点,即确定该最优预警阈值在概率分布图中处于什么位置。步骤6,实时将每个衍生指标的数据值与对应的预警阈值做比较,根据超出预警阈值的衍生指标的数量判定是否发出风险预警信号。选定每个指标分布图中的预警阈值后,若指标值大于(或小于)该预警阈值,即落入“异常区间”,若某监测指标的“衍生指标”达到一定数量落入“异常区间”,该指标便触发预警,例如4个衍生指标中,若t值落入“异常区间”,则该指标直接预警,若t值未落入“异常区间”,但剩余3个变化率中有2个及以上落入“异常区间”,则该指标发出预警信号。例如“税务申报收入”这一个指标,会衍生出4个衍生指标,就是t值、r1、r3、r6,如果t值落入了异常区间,则“税务申报收入”这个指标发出预警信号,如果t值没有落入异常区间,则r1、r3、r6里面有2个及以上落入异常区间,则“税务申报收入”这个指标发出预警信号。请参阅图4,基于相同的发明构思,本实施例中还提供了一种风险预警系统,本系统描述中未涉及之处,还请参照前述方法描述的相关内容。具体的,该风险预警系统包括以下模块:衍生指标构造模块,用于构造每个监测指标的一个或多个衍生指标;数据收集模块,用于实时收集被监测对象的每个监测指标的每个衍生指标的数据值;阈值设置模块,用于根据衍生指标的风险类型,设定每个衍生指标的预警阈值;风险预警模块,用于实时将每个衍生指标的数据值与对应的预警阈值做比较,根据超出预警阈值的衍生指标的数量判定是否发出风险预警信号。在较佳的实施方案中,上述风险预警系统还包括图形绘制模块,用于基于数据收集模块获取的每个衍生指标的数据值,绘制每个衍生指标的概率分布图。此时,阈值设置模块则是基于每个衍生指标的概率分布图设定每个衍生指标的预警阈值。例如,基于当前时间点获得的“企业申报收入”指标的各个衍生指标的概率分布图,设定5%的分位点作为预警线。预警阈值基于实时获得的概率分布图进行设置,不管是以固定值设定预警线,还是以遗传算法获取的最优值作为预警阈值,预警阈值都是在根据衍生指标的变化而动态变化,继而可以设置出更有效合理的预警值,实现更准确地风险预警,增强风险预警系统的可靠性。如图5所示,本实施例同时提供了一种电子设备,该电子设备可以包括处理器51和存储器52,其中存储器52耦合至处理器51。值得注意的是,该图是示例性的,还可以使用其他类型的结构来补充或替代该结构。如图5所示,该电子设备还可以包括:输入单元53、显示单元54和电源55。值得注意的是,该电子设备也并不是必须要包括图5中显示的所有部件。此外,电子设备还可以包括图5中没有示出的部件,可以参考现有技术。处理器51有时也称控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该处理器51接收输入并控制电子设备的各个部件的操作。其中,存储器52例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其他合适装置中的一种或多种,可存储上述处理器51的配置信息、处理器51执行的指令、记录的表格数据等信息。处理器51可以执行存储器52存储的程序,以实现信息存储或处理等。在一个实施例中,存储器52中还包括缓冲存储器,即缓冲器,以存储中间信息。输入单元53例如用于向处理器51提供待实施获取的各个衍生指标的数据值。显示单元54用于显示处理过程中的各种结果,例如各个衍生指标的数据值,该显示单元例如可以为lcd显示器,但本发明并不限于此。电源55用于为电子设备提供电力。本发明实施例还提供一种计算机可读指令,其中当在电子设备中执行所述指令时,所述程序使得电子设备执行本发明方法所包含的操作步骤。本发明实施例还提供一种存储有计算机可读指令的存储介质,其中所述计算机可读指令使得电子设备执行本发明方法所包含的操作步骤。应理解,在本发明的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1