P2P平台信用风险动态评价方法和系统与流程

文档序号:18064167发布日期:2019-07-03 03:16阅读:280来源:国知局
P2P平台信用风险动态评价方法和系统与流程
本发明涉及互联网金融
技术领域
,具体涉及一种p2p平台信用风险动态评价方法和系统。
背景技术
:p2p(peer-to-peer)借贷指个体和个体间通过互联网p2p平台实现直接的借贷。p2p借贷作为新型的互联网金融模式,利用互联网为主要渠道,为借款人和投资人提供信息交互与信贷撮合等服务,具有门槛低,方便,快捷等优点。从2007年首次引入我国开始,p2p借贷得到飞速发展,p2p平台的数量和p2p借贷交易量都呈现大幅增长,极大程度弥补了传统借贷模式未能有效针对个体借款人提供小额借贷服务的不足。但由于缺乏健全的法律法规、成熟的监管手段以及高度的信息不对称性,p2p平台跑路、经侦介入、提现困难以及网站关闭等风险事件频频发生。由于p2p网络借贷行业及信用风险问题频发,因此很多用户在使用p2p平台之前,都会对p2p平台的信用风险进行评价。目前对p2p平台的信用风险评价,一般是沿用传统的信用评分模型或通过专家评估。然而,传统的信用评分方法是基于分类模型的违约风险预测,只能得到表现期或整个借款周期内的单一的违约概率,p2p平台的信用风险是变化的过程,仅仅依靠表现期或整个借款周期内的单一的违约概率无法准确评价p2p平台的风险趋势。专家评估则会受到人为因素干扰,导致评估结果出现误差。技术实现要素:(一)解决的技术问题针对现有技术的不足,本发明提供了一种p2p平台信用风险动态评价方法和系统,解决了现有技术中对p2p平台信用风险评估不准确的技术问题。(二)技术方案为实现以上目的,本发明通过以下技术方案予以实现:本发明提供了一种p2p平台信用风险动态评价方法,该方法包括以下步骤:s1、获取p2p平台的信用数据,所述信用数据包括:观测时间、观测时间内的信用特征变量、观测时间内的删失状态数据以及观测时间内的违约状态数据;所述观测时间内的删失状态数据表示在观测时间内未能观测到违约;s2、构建基于混合生存分析的动态评价模型,包括:s201、定义p2p平台的信用状态,包括定义所述步骤s1中的所述观测时间、所述删失状态数据以及所述违约状态数据;s202、基于s201的信用状态构建p2p平台信用风险的动态评价模型;s203、在s202的基础上构建违约状态估计子模型;s204、在s202的基础上构建违约时间估计子模型;s3、利用面板数据估计模型参数,包括:s301、步骤s2中的模型在不同观测时间下,可观测到构建违约状态估计子模型以及构建违约时间估计子模型的信用特征变量,构成了p2p平台信用特征面板数据,针对不同观测时间,构建多重生存观测数据;s302、基于步骤s301中所构建的多重生存观测数据,利用em算法迭代估计步骤s2中动态评价模型的参数;s4、预测p2p平台动态违约概率,通过步骤s1—步骤s3,得到训练好的动态评价模型,针对预测样本,预测p2p平台在不同时间下的生存概率;基于p2p平台在不同时间下的生存概率,可计算在不同时间下的违约概率;其中,在步骤s202中:所述动态评价模型为:p2p平台在指定观察时间下的生存概率等于p2p平台非违约的概率与p2p平台在指定观察时间之后发生违约的概率之和;在步骤s203中:所述违约状态估计子模型为:针对p2p平台的违约概率,利用逻辑回归构建违约状态估计子模型;在步骤s204中:所述违约时间估计子模型为:针对p2p平台的条件生存概率,利用cox比例风险回归构建违约时间估计子模型。优选的,在步骤s201中,所述定义p2p平台的信用状态:定义变量t为观测时间;定义随机变量δ为删失状态数据指示变量,δ=0表示观测数据删失,即在时间t内未能观测到违约,δ=1表示观测数据未删失,即在t时间内观测到违约;定义随机变量y为违约状态数据指示变量,y=0与表示p2p平台不会发生违约,y=1表示p2p平台会发生违约。优选的,在步骤s202中,所述p2p平台信用风险的动态评价模型为:s(t)=1-p+p*s(t|y=1)其中:s(t)为目标函数,是p2p平台在时间t的生存概率;p=p(y=1)是p2p平台的违约概率;s(t|y=1)=p(t>t|y=1)是假定p2p平台会发生违约下的条件生存函数;目标函数s(t)=1-p+p*s(t|y=1)表达的含义是:p2p平台在时间t下的生存概率等于p2p平台非违约的概率与p2p平台在时间t之后发生违约的概率之和。优选的,在步骤s203中,所述违约状态估计子模型为:其中:z=(1,z1,...,zn)为违约状态估计子模型的信用特征变量;β=(β0,β1,...,βn)为信用特征变量的系数。优选的,在步骤s204中,所述违约时间估计子模型为:其中:s0(t|y=1)为基准生存函数,是函数的非参数部分;向量x=(x1,x2,…,xm)为违约时间估计子模型的信用特征变量;向量α=(α1,α2,...,αm)为信用特征变量的系数。优选的,在所述步骤s302中,包括:步骤s3021:利用删失变量作为初始违约概率期望值e(yi)(0)=δi;估计违约概率估计子模型的初始参数β(0)以及违约时间估计子模型的初始参数α(0),s0(0);设定模型迭代的最大次数c,模型收敛函数g(·)=+∞以及收敛阈值g,迭代次数指示变量k=1;若迭代次数k<c,且收敛函数g(·)>g,则进行以下迭代;步骤s3022:利用违约概率期望值e(yi)(k-1)计算违约概率估计子模型的极大似然估计函数:其中:li为违约概率估计子模型的极大似然函数;p(zi)为违约状态估计子模型结果;得到该轮迭代下违约概率估计子模型的参数估计值:β(k)=(β1,β2,…,βn)(k)步骤s3023:利用违约概率期望值e(yi)(k-1)计算违约时间估计子模型的极大似然估计函数:其中:ll为违约时间估计子模型的极大似然函数;h(ti|y=1,xi)为条件生存函数s(ti|y=1,xi)所对应的风险函数;s(ti|y=1,xi)是假定平台会发生违约下的条件生存函数;得到该轮迭代下违约概率估计子模型的参数估计值:α(k)=(α1,α2,…,αm)(k)步骤s3024:计算违约概率yi的期望值:其中:e(k)(yi|ti,δi,zi,xi)为k轮迭代下违约概率yi的期望值;步骤s3025:计算迭代收敛函数:g(·)=||β(k)-β(k-1)||22+||α(k)-α(k-1)||22+||s0(k)-s0(k-1)||22其中:g(·)为迭代收敛函数;β(k)为k轮迭代下违约状态估计子模型的参数值;α(k),s0(k)为k轮迭代下违约时间估计子模型的参数值;步骤s3026:更新迭代次数:k=k+1步骤s3022至s3026一直循环迭代,直至迭代达到最大次数(k=c)或迭代收敛函数小于设定的阈值(g(k)≤g);得到动态评价函数的参数估计值:β(*)=(β0,β1,...,βn)(*)α(*)=(α1,α2,…,αm)(*)s0(*)(t|y=1)其中:β(*),α(*),s0(*)(t|y=1)分别为迭代结束时违约状态估计子模型和违约时间估计子模型的参数值。优选的,在步骤s4中,预测p2p平台在不同时间下的生存概率表示为:其表示:针对预测样本,预测p2p平台在不同时间下的生存概率;违约概率的表示方法为:p(t|xv,zv)=1-s(t|xv,zv)其中:xv为预测样本的违约状态估计子模型信用特征变量;zv为违约时间估计子模型信用特征变量;ov=(xv,zv)表示预测样本。本发明还提供了一种p2p平台信用风险动态评价系统,包括:数据采集单元,用于获取p2p平台的信用数据;建模单元,所述建模单元包括:定义信用状态单元,用于对p2p平台在观测时间内的删失状态和违约状态进行定义;构建动态评价模型单元,用于构建p2p平台信用风险的动态评价模型、违约状态估计子模型以及违约时间估计子模型;模型参数处理单元,所述模型参数处理单元包括:构建生存观测数据单元,用于针对不同观测时间下所观测到的构建违约状态估计子模型以及违约时间估计子模型的信用特征变量,构建多重生存观测数据;迭代参数估计单元,基于构建生存观测数据单元中所构建的多重生存观测数据,利用em算法迭代估计模型参数;概率计算单元,所述概率计算单元包括:预测生存概率单元,用于预测p2p平台在不同时间下的生存概率;违约概率计算单元,通过p2p平台在不同时间下的生存概率,计算出p2p平台在不同时间下的违约概率。(三)有益效果本发明提供了一种p2p平台信用风险动态评价方法和系统,该方法在获取p2p平台在观测时间内的删失状态数据和违约状态数据后定义p2p平台的信用状态,能有效处理p2p平台观测中出现的删失状态数据;在定义信用状态的基础上构建基于混合生存分析的动态评价模型,建立评价模型后针对不同观测时间,构建多重生存观测数据,然后采用em算法迭代估计评价模型的参数,使模型能够有效学习到面板数据中的有效信息;针对选取预测样本,预测p2p平台在不同时间下的生存概率,从而计算出模型的动态违约概率,准确地预测p2p平台的风险趋势。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1本发明实施例一种p2p平台信用风险动态评价方法的流程图;图2本发明实施例中多重生存观测构建的示意图;图3本发明实施例一种p2p平台信用风险动态评价系统的框图;其中,图2中的竖轴p2p平台1到4分别代表了四类p2p平台,横轴表示观测时间。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本申请实施例通过提供一种p2p平台信用风险动态评价方法和系统,解决了现有技术中对p2p平台信用风险评估不准确的技术问题,不仅能预测p2p平台是否会发生风险,而且能预测p2p平台何时会发生风险,提供p2p平台在不同时间下的动态违约概率。本申请实施例中的技术方案为解决上述技术问题,其发明构思在于:基于背景所述,现有的对p2p平台的信用风险评估,一般是沿用传统的信用评分模型或通过专家评估。传统的信用评分模型只能得到表现期或整个借款周期内的单一的违约概率,p2p平台的信用风险是变化的过程,仅仅依靠表现期或整个借款周期内的单一的违约概率无法准确评价p2p平台的风险趋势,专家评估则会受到人为因素干扰,导致评估结果出现误差。可见,这两类方法对p2p平台的信用风险评价均不准确。为解决上述问题,本申请提出了一种基于混合生存分析的动态评价方法,用于预测p2p平台的动态信用风险。通过分别构建违约状态估计子模型和违约时间估计子模型来预测平台是否会发生违约以及何时会发生违约。方法设计了一种多重生存观测构建方法,使模型能够有效学习到平台信用特征面板数据中的有效信息,从而提升模型的预测效果,准确地预测平台的风险趋势,为p2p平台提供及时有效的内部风险控制,同时为投资人提供投资决策支持。为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。本发明实施例提供了一种p2p平台信用风险动态评价方法和系统,如图1所示,包括以下步骤s1—步骤s4:s1、获取p2p平台的信用数据,信用数据包括观测时间以及观测时间内的信用特征变量、删失状态数据与违约状态数据;观测时间内的删失数据表示在观测时间内未能观测到违约。s2、构建基于混合生存分析的动态评价模型,其中动态评价模型包括:p2p平台信用风险的动态评价模型、违约状态估计子模型以及违约时间估计子模型,具体步骤如下:s201、定义p2p平台的信用状态,包括定义步骤s1中的观测时间、删失状态数据以及所述违约状态数据;s202、通过s201的信用状态构建p2p平台信用风险的动态评价模型:p2p平台在指定观察时间下的生存概率等于p2p平台非违约的概率与p2p平台在指定观察时间之后发生违约的概率之和;s203、在s202的基础上构建违约状态估计子模型:所述违约状态估计子模型为:针对p2p平台的违约概率,利用逻辑回归构建违约状态估计子模型;s204、在s202的基础上构建违约时间估计子模型:所述违约时间估计子模型为:针对p2p平台的条件生存概率,利用cox比例风险回归构建违约时间估计子模型。s3、利用面板数据估计模型参数,具体步骤包括:s301、步骤s2中的模型在不同观测时间下,可观测到构建步骤s2中的违约状态估计子模型以及违约时间估计子模型的信用特征变量,构成了p2p平台信用特征面板数据,针对不同观测时间,构建多重生存观测数据;s302、基于步骤s301中所构建的多重生存观测数据,利用em算法迭代估计步骤s2中动态评价模型的参数,这里的em算法是指的是最大期望算法(expectationmaximizationalgorithm)。s4、预测p2p平台动态违约概率,通过步骤s1—步骤s3,得到训练好的动态评价模型,针对预测样本,预测p2p平台在不同时间下的生存概率;基于p2p平台在不同时间下的生存概率,可计算在不同时间下的违约概率。本发明另一个实施例还提供了一种p2p平台信用风险动态评价系统,如图3所示,其包括:数据采集单元、建模单元、模型参数处理单元以及概率计算单元。其中,数据采集单元用于获取p2p平台的信用数据。建模单元包括:定义信用状态单元,用于将p2p平台在观测时间内的删失状态和违约状态进行定义;构建动态评价模型单元,用于构建p2p平台信用风险的动态评价模型、违约状态估计子模型以及违约时间估计子模型。模型参数处理单元包括:构建生存观测数据单元,用于针对不同观测时间下所观测到的违约状态估计子模型以及违约时间估计子模型的信用特征变量,构建多重生存观测数据;迭代法估计单元,基于构建生存观测数据单元中所构建的多重生存观测数据,利用em算法迭代估计模型参数。概率计算单元包括:预测生存概率单元,用于预测p2p平台在不同时间下的生存概率;违约概率计算单元,通过p2p平台在不同时间下的生存概率,计算出p2p平台在不同时间下的违约概率。本发明实施例提供了一种p2p平台信用风险动态评价方法和系统,通过分别构建违约状态估计子模型和违约时间估计子模型,该方法不仅能预测p2p平台是否会发生风险,而且能预测p2p平台何时会发生风险,预测p2p平台在不同时间下的动态违约概率。同时,设计了一种多重生存观测构建方法,使模型能够有效学习到面板数据中的有效信息,从而提升模型的预测效果,准确地预测平台的风险趋势。下面对个步骤进行详细的描述:s1、获取p2p平台的信用数据,在具体实施时,这里的步骤s1中的获取信用数据可以通过多种方式实现,下面对其中一种实施方式进行具体介绍:利用网络爬虫技术获取观测时间内的信用特征变量、删失状态数据和违约状态数据,删失状态数据表示在观测时间内未能观测到违约。s2、构建基于混合生存分析的动态评价模型,包括:s201、定义p2p平台的信用状态,包括定义步骤s1中的观测时间、删失状态数据以及违约状态数据:在具体实施时,这里的步骤s201中的定义p2p平台的信用状态有多种方式,下面对其中一种实施方式进行具体介绍:定义变量t为观测时间;定义随机变量δ为删失状态数据指示变量,δ=0表示观测数据删失,即在时间t内未能观测到违约,δ=1表示观测数据未删失,即在时间t内观测到违约;定义随机变量y为违约状态数据指示变量,y=0与表示p2p平台不会发生违约,y=1表示p2p平台会发生违约。因此,在某个观测时间t下p2p平台在时间存在着三种信用状态,如表1所示。表1p2p平台的信用状态分类δy信用状态描述00删失,p2p平台未观测到违约,且不会违约01删失,p2p平台未观测到违约,但最终会违约11未删失,p2p平台已经观测到违约s202、通过s201的信用状态构建p2p平台信用风险的动态评价模型:p2p平台在指定观察时间下的生存概率等于p2p平台非违约的概率与p2p平台在指定观察时间之后发生违约的概率之和。在具体实施时,这里的步骤s202中的构建p2p平台信用风险的动态评价模型可以通过多种方式实现,下面对其中一种实施方式进行具体介绍,具体表现为:s(t)=1-p+p*s(t|y=1)其中:s(t)为目标函数,是p2p平台在时间t的生存概率;p=p(y=1)是p2p平台的违约概率;s(t|y=1)=p(t>t|y=1)是假定p2p平台会发生违约下的条件生存函数;目标函数s(t)=1-p+p*s(t|y=1)表达的含义是:p2p平台在时间t下的生存概率等于p2p平台非违约的概率与p2p平台在时间t之后发生违约的概率之和。s203、在s202的基础上构建违约状态估计子模型:针对p2p平台的违约概率,利用逻辑回归构建违约状态估计子模型。在具体实施时,可以通过多种方式实现,下面对其中一种实施方式进行具体介绍,具体表现为:其中:z=(1,z1,…,zn)为违约状态估计模型的信用特征变量;β=(β0,β1,…,βn)为信用特征变量的系数。s204、在s202的基础上构建违约时间估计子模型:针对p2p平台的条件生存概率,利用cox比例风险回归构建违约时间估计子模型。具体表现为:其中:s0(t|y=1)为基准生存函数,是函数的非参数部分;向量x=(x1,x2,…,xm)为违约时间估计模型的信用特征变量;向量α=(α1,α2,…,αm)为信用特征变量的系数。s3、基于面板数据的模型参数估计,包括:s301、步骤s2中的模型在不同观测时间下,可观测到违约状态估计子模型以及违约时间估计子模型的信用特征变量,构成了p2p平台信用特征面板数据,针对不同观测时间,构建多重生存观测数据。在具体实施时,可以通过多种方式实现,下面对其中一种实施方式进行具体介绍:在不同观测时间下,可观测到p2p平台违约状态估计子模型以及违约时间估计子模型的信用特征变量,构成了p2p平台信用特征面板数据。针对不同观测时间,构建多重生存观测数据。例如,如图2所示,p2p平台1到4分别代表了四类p2p平台,即p2p平台1在观测到违约,p2p平台2在观测到违约,p2p平台3在观测到违约,p2p平台4在观测周期内未观测到违约,因此在处删失。针对p2p平台1,在时刻开始观测,在时刻观测到p2p平台发生违约,则观测生存数据的信用状态为。针对p2p平台2,可以得到两条生存观测数据,第多重生存数据在时刻开始观测,在时刻观测到p2p平台发生违约,观测生存数据的信用状态为,第二条生存数据在时刻开始观测,在时刻观测到违约,观测生存数据的信用状态为。类似地,针对p2p平台3和p2p平台4可以分别得到三条生存观测数据,其信用状态如表2所示。表2多重生存观测的信用状态(t,δ)p2p平台id观测1观测2观测31(1,1)2(2,1)(1,1)3(3,1)(2,1)(1,1)4(3,0)(2,0)(1,0)s302、基于步骤s301中所构建的多重生存观测数据,利用em算法迭代估计步骤s2中动态评价模型的参数。在具体实施时,可以通过多种方式实现,下面对其中一种实施方式进行具体介绍,具体表现为:步骤s3021:利用删失变量作为初始违约概率期望值e(yi)(0)=δi;估计违约概率估计子模型的初始参数β(0)以及违约时间估计子模型的初始参数α(0),s0(0);设定模型迭代的最大次数c,模型收敛函数g(·)=+∞以及收敛阈值g,迭代次数指示变量k=1;若迭代次数k<c,且收敛函数g(·)>g,则进行以下迭代;步骤s3022:利用违约概率期望值e(yi)(k-1)计算违约概率估计子模型的极大似然估计函数:其中:li为违约概率估计子模型的极大似然函数;p(zi)为违约状态估计子模型结果。得到该轮迭代下违约概率估计子模型的参数估计值:β(k)=(β1,β2,…,βn)(k)得到该轮迭代下违约概率估计子模型的参数估计值β(k)=(β1,β2,…,βn)(k)步骤s3023:利用违约概率期望值e(yi)(k-1)计算违约时间估计子模型的极大似然估计函数:其中:ll为违约时间估计子模型的极大似然函数;h(ti|y=1,xi)为条件生存函数s(ti|y=1,xi)所对应的风险函数;s(ti|y=1,xi)是假定平台会发生违约下的条件生存函数。得到该轮迭代下违约概率估计子模型的参数估计值:α(k)=(α1,α2,...,αm)(k)步骤s3024:计算违约概率yi的期望值:其中:e(k)(yi|ti,δi,zi,xi)为k轮迭代下违约概率yi的期望值。步骤s3025:计算迭代收敛函数:g(·)=||β(k)-β(k-1)||22+||α(k)-α(k-1)||22+||s0(k)-s0(k-1)||22其中:g(·)为迭代收敛函数;β(k)为k轮迭代下违约状态估计子模型的参数值;α(k),s0(k)为k轮迭代下违约时间估计子模型的参数值。步骤s3026:更新迭代次数:k=k+1过程s3022至s3026一直循环迭代,直至迭代达到最大次数(k=c)或迭代收敛函数小于设定的阈值(g(k)≤g);得到动态评价函数的参数估计值:β(*)=(β0,β1,...,βn)(*)α(*)=(α1,α2,,αm)(*)s0(*)(t|y=1)β(*),α(*),s0(*)(t|y=1)分别为迭代结束时违约状态估计子模型和违约时间估计子模型的参数值。s4、预测p2p平台动态违约概率,在具体实施时,可以通过多种方式实现,下面对其中一种实施方式进行具体介绍,具体表示为:其表示:针对预测样本,预测p2p平台在不同时间下的生存概率;违约概率的表示方法为:p(t|xv,zv)=1-s(t|xv,zv)其中:xv为预测样本的违约状态估计子模型信用特征变量;zv为违约时间估计子模型信用特征变量;ov=(xv,zv)表示预测样本。将上述实施例用于对现有的p2p平台进行评估,具体过程如下:选取了396家p2p平台第三季度(2018年7月至2018年9月)的面板数据,其中正常运营p2p平台311家,违约p2p平台85家,其中7月违约的有52家,8月违约的有15家,9月违约的有18家。变量包括成交量,参考收益率,投资人数,借款人数,新投资人数,老投资人数,人均投资额,人均借款额,投资人总额,平均借款期限。由于变量表现出高度的偏态分布,针对变量进行了log(x+1)转换。为了获得预测性能的无偏估计,选择了留一法交叉验证来估计模型的预测性能。针对模型的预测性能,选取了auc,ks和h-measure三个评价指标对模型进行综合评价,其中auc计算了roc曲线下面的面积,其反应了模型对违约和非违约样本的综合预测能力,并考虑了样本不均衡的影响。ks计算了模型预测违约样本和非违约样本累计分布的最大差值,反应了模型对违约样本和非违约样本的分隔程度。h-measure克服了auc指标在评价不同模型的预测性能中应用了不同损失分布的缺陷,利用beta分布明确了模型的误分类损失,从而获得了标准化的预测性能评估。选择了三类模型与本发明中的模型(msa)进行对比:(1)基于截面数据的动态评价模型(mcm):利用截面数据,训练了本发明中的动态评价模型,其中违约状态估计子模型和违约时间估计子模型应用了逻辑回归和cox比例风险回归。(2)仅考虑何时违约的评价模型(cox):利用cox比例风险回归模型构建了仅考虑何时违约的评价模型。(3)仅考虑是否违约的评价模型(lr):利用利用逻辑回归构建了仅考虑是否违约的评价模型。首先验证了多重生存观测方法的有效性,比较了msa模型和mcm模型在以下三个场景的预测性能:(1)p2p平台在前一个月发生违约的概率p(t≤1);(2)p2p平台在前两个月发生违约的概率p(t≤2);(3)p2p平台在前三个月发生违约的概率p(t≤3)。表3动态违约概率估计模型时间评分函数aucksh-measuremsa11-s(1)0.8140.4790.358mcm0.7390.3580.251msa21-s(2)0.8170.5250.366mcm0.7570.4210.266msa31-s(3)0.8280.5530.392mcm0.7760.4920.298模型违约概率的预测性能结果如表3所示。在三个时间下,动态评价模型的评分函数分别为1-s(1)、1-s(2)以及1-s(3)。留一法交叉验证的结果显示,在所有的时间下基于多重生存观测估计的msa模型的预测效果均显著优于基于截面观测估计的mcm模型,且在auc,ks以及h-measure三种预测性能评价指标下msa的模型的效果均优于mcm模型,体现出msa模型预测效果的稳健性。结果表明,相比于截面数据,p2p平台的面板数据中包含了更多违约风险判别的有用信息,本发明所提出的多重生存观测方法可以有效的利用p2p平台面板数据中的有用信息,从而提升p2p平台风险动态评价模型的违约预测性能。验证了多重生存观测方法的有效性后,进而比较了msa、mcm、cox以及lr模型在两个动态场景下的违约预测性能:(1)p2p平台在第一个月未发生违约下,在第二个月发生违约的概率;(2)p2p平台在前两个月未发生违约下,在第三个月发生违约的概率。由于逻辑回归模型无法预测p2p平台随时间的动态违约概率,为了比较逻辑回归与其他模型在动态违约预测中的性能,在不同时间分别构建了逻辑回归模型,并综合多个逻辑回归的预测结果来估计违约概率。表4违约风险预测性能模型时间评分函数aucksh-measuremsa2|11-s(2)/s(1)0.7890.5360.344mcm1-s(2)/s(1)0.7600.5540.315cox1-s(2)/s(1)0.7980.5660.330lr(p(2)-p(1))/(1-p(1))0.6780.4960.253msa3|21-s(3)/s(2)0.8320.5950.421mcm1-s(3)/s(2)0.7960.5610.418cox1-s(3)/s(2)0.7740.5890.379lr(p(3)-p(2))/(1-p(2))0.8210.5880.413模型的违约预测结果如表4所示。由留一法交叉验证的结果显示:评价场景(2)下,本发明提出的msa模型的动态违约预测性能显著优于其他三个模型,且在auc,ks以及h-measure三种评价指标下均取得了最好的预测性能。在评价场景(1)下,基于h-measure的标准化评价指标下,mas模型取得了最高的预测性能,基于auc和ks的评价指标下,cox模型取得了最高的预测性能。尽管在该场景下取得了较好的预测性能,但cox模型在场景(2)下的预测性能却低于其他模型,处于最低水平。同时,lr模型也表现出相似的情形,lr模型在场景(2)下取得较好的预测性能,仅次于msa模型,但在场景(1)下却表现出最差的预测性能。由此可见,仅仅考虑是否违约(lr模型)或何时违约(cox模型)单方面因素,评价模型的动态预测性可能会出现波动性。巴塞尔新资本协议中明确指出银行或金融机构在开发内部评级系统时需考虑评价模型的稳定性,高质量的信用评价模型应能在不同时间下均取得良好的区分能力。基于留一法交叉验证的结果,本发明所提出的msa模型在不同的时间下均取得了较好且稳定的违约判别性能,能够更为准确地预测p2p平台的风险趋势,因此可以更好地为p2p借贷投资人提供投资决策辅助,同时为p2p平台提供及时有效的内部风险控制。综上所述,与现有技术相比,具备以下有益效果:本发明提供了一种p2p平台信用风险动态评价方法和系统,该方法在获取p2p平台在观测时间内的删失状态数据和违约状态数据后定义平台的信用状态,能有效处理p2p平台观测中出现的删失数据;在定义信用状态的基础上构建基于混合生存分析的动态评价模型,建立评价模型后针对不同观测时间,构建多重生存观测数据,然后采用em算法迭代估计评价模型的参数,使模型能够有效学习到面板数据中的有效信息;针对选取预测样本,预测p2p平台在不同时间下的生存概率,从而计算出模型的动态违约概率,准确地预测p2p平台的风险趋势。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1