一种信用评级违约概率测度与风险预警方法与流程

文档序号:18399656发布日期:2019-08-09 23:45阅读:980来源:国知局
一种信用评级违约概率测度与风险预警方法与流程

本发明属于金融信息数据管理技术领域,尤其涉及一种信用评级违约概率测度与风险预警方法。



背景技术:

目前,最接近的现有技术:

信用评级的核心问题是违约概率的研究,分为违约概率的测度和违约概率的评估两个方面。前者所要解决的是如何测算违约概率的问题;后者的研究目的是分析决定、影响违约及违约概率的相关因素及其重要性。

违约概率的测度研究可归为以下几类:基于信用评级历史资料的信用等级违约概率、基于期权定价理论的“基数”违约率、基于保险精算违约概率的测度以及基于风险中性(rn)市场的违约率测度。代表研究包括:以转移矩阵形式表现违约概率的creditmetrics模型;纳入宏观经济因素计算条件违约概率的creditportfolioview模型;利用期权定价理论的违约预测模型——creditmonitor模型(kmv);基于寿险思想的死亡率模型和基于保险精算框架开发的creditrisk+模型。违约概率评估研究主要有以下几类分析方法:单变量分析、多变量分析、现代评估法。代表研究包括:“以财务比率预测经营失败”的研究为典型代表的违约概率评估单变量分析法;以多元判别分析思路建立的zeta评分模型;运用聚类分析对消费贷款申请者的信用评估模型。目前,实证研究中使用比较多的是假设违约事件发生服从logistic分布的logit回归模型和神经网络模型。以神经网络技术为核心的违约概率模型不要求对概率分布作出假设,并且能够深入挖掘预测变量之间隐藏的相关关系,这就使其能有效地处理非正态、非线性的信用风险分析问题。但是神经网络模型又面临着网络结构难以确定和过度拟合等难题,在很大程度上影响其对新样本违约的预测能力和模型应用。

随着经济市场对信用体系要求的不断提高,信用评级研究的不断深入细分,对数据有效收集和高效处理的需要显得愈发迫切。数据挖掘技术的更新进步,挖据数据、分析数据的能力在信用评级研究中越来越重要。数据挖掘指的是从大量的随机的实际数据中,提取有潜在应用价值的信息和知识的过程。其目标是从大量数据中,发现隐藏于其后的规律或数据间的关系,从而服务于决策。数据挖掘技术汇聚了数据库、人工智能、统计学、可视化、并行计算等不同学科和交叉领域。它的经典过程划分为:问题的定义、数据收集和预处理、数据挖掘算法的执行,以及结果的解释和评估。由于数据挖掘具有不需要依靠假设条件、能够处理大规模数据等优点已经在金融分析、风险预测中广泛应用,尤其集中在信用卡审核、股票市场分析,投资决策等领域。由于金融数据多是大样本、高维度的数据,而数据挖掘擅长处理多变量的大数据,利用数据挖掘算法来刻画金融市场风险是科学合理的,数据挖掘技术为风险预警体系提供了众多可行性的技术手段。因此借助数据挖掘技术来检验信用评级理论,完善风险管理体系,实现风险预警策略,理论研究与科学技术之间相互融合、相互促进,是信用评级研究的发展趋势。

金融业在国民经济中占有举足轻重的地位,金融体系的完善和发达程度直接关系着国民经济能否持续、健康地发展。而风险作为金融业与生俱来的本质特征,也伴随着金融的深化发展而愈发引人关注。由于金融市场的随机波动性,金融风险的客观存在催生了对金融风险管理的需求。信用评级作为金融风险管理的重要参与者,起到了专业化的风险揭示作用。信用评级是对债务主体所负债务按时如约还本付息的能力和可信任程度的评估,是对债务偿还风险的评价,根本目的是揭示债务发行人的信用风险,降低交易成本和投资风险。

我国信用评级业随着市场经济体制建立,自20世纪80年代末逐步发展起来。经过近30年的发展,虽然我国的信用评级行业取得了长足的进步,但与国际同业相比仍处于起步阶段,由于评级模型不够成熟和评级技术相对落后等原因,信用评级发展过程中面临以下三个方面的问题:

1.历史违约率与同期违约概率拟合不理想由于我国融资体制改革和债券市场的发展,经济主体的信用活动日趋频繁,产生了巨大的数据库规模,挖掘有效数据统计历史违约率难度增大。又因为评级机构的评级体系、方法或实际操作不够稳定,外加宏观经济环境等因素的影响,采集的数据带有很强的随机性,这给测算违约概率提出了新的挑战。事实发现,根据历史信用数据统计出的违约率与同期的真实违约概率存在差异,真实数据与原有的违约概率测度模型拟合不理想。而违约概率是测算信用风险的核心问题。评级机构针对不同属性的债务主体定义出相对应的信用评级等级,这些定义都基于违约概率。违约概率值使信用评级结果具有更加直观的解释力,同时提供了更为精确的关于风险水平的度量,为进行风险监控与管理提供了基础,大量的信用风险模型都是基于对违约概率作测算。因此,违约概率测度是首要研究的问题,改进原有测度模型,减小历史违约率与同期违约概率差异是十分必要的。

2.评级结果缺乏一致性检验从1841年世界上第一家商业信用评级机构louistappan在纽约成立至今,评级员、统计家、数学家和软件程序员们创造了数不胜数的信用评级模型,开发了许许多多快捷的评级软件,我国评级机构也引进了不少先进的评级软件,但是在实际的信用评级工作中,人们更多关注的是评级结果,却缺乏对评级结果的一致性检验与修正。其原因在于宏观经济与金融环境变化较快,评级结果与实际情况之间难免会出现偏差,而这样的偏差是客观存在的。评级结果一致性检验的难点在于债券的信用质量与其信用等级之间的一致性检验。债券信用质量的关键指标是债券的预期损失率(预期损失率=违约概率×违约损失率),其中影响违约损失率因素复杂,因素之间存在相关性,因此只有利用相关数学分析方法,科学筛选出影响违约损失率主要因子,建立预测模型,才能准确得到预期损失率。攻克信用质量与信用等级之间的一致性检验,完善评级结果和评级模型的修正,做出科学、正确的信用评级判断,是信用评级体系必不可少的环节。

3.跟踪评级工作困难,风险预警滞后,跟踪评级是指信用评级机构在评级工作完成后,仍密切关注受评者的相关变化信息,其目的是为了确保受评者的信用风险能够在项目存续期内得到持续的跟踪与揭示,从而避免评级结果失效。但目前在国内,信用评级结果应用的范围较狭窄,且受评主体获得评级结果后不关注自身信用状况变化,信用评级机构采集的信用数据只局限于评级前指标数,后期数据缺失严重,导致跟踪评级工作困难,评级信息的时效性低,风险预警滞后。风险预警体系的构建和实现需要众多学科理论与技术的参与。金融工程、数学模型、财务管理、计算机与信息技术等都是支持风险预警体系运行和发展的重要学科领域。随着金融投资市场对风险预警要求的提高,完善信用风险预警指标体系,借助相应的数据挖掘技术实现“预警”策略是大数据时代下的迫切需要。

数据挖据技术的参与为信用评级研究提供了更加多元化的数据处理技术手段和理念,评级体系势必向多角度、多层次的方向发展。信用评级与数据挖掘技术之间相互融合、相互促进的趋势将进一步得到加强,两者的无缝衔接是现实的客观需要,也是科学理论向实践操作转化的必然过程。

综上所述,现有的信用评级技术是:

(1)企业自主开发信用评级系统,利用已有数学模型对数据进行违约概率计算;

(2)信用评级因素体系多以定量数据为主,用数学模型进行定量分析;

(3)大多数信用评级系统采用主成分分析方法,对信用评级多重因素进行数据降维处理,再用因子分析做信用等级排序;

(4)企业根据信用等级结果做出判断。

综上所述,现有技术存在的问题是:

(1)神经网络模型网络结构难以确定和过度拟合,在很大程度上影响其对新样本违约的预测能力和模型应用。

(2)根据历史信用数据统计出的违约率与同期的真实违约概率存在差异,真实数据与原有的违约概率测度模型拟合不理想。

(3)在实际的信用评级工作中,人们更多关注的是评级结果,却缺乏对评级结果的一致性检验与修正。

(4)后期数据缺失严重,导致跟踪评级工作困难,评级信息的时效性低,风险预警滞后。

(5)原有的数学模型很少考虑变量在金融市场的随机性,评级机构的评级体系、方法或实际操作不够稳定;

(6)实际的信用评级工作中有一部分是定性指标因素,如果忽略定性因素对评级的影响,会降低违约概率测度的准确性;

(7)主成分分析算法在降维的过程中会丢失一部分原始数据的信息,经过主成分分析算法的数据处理,若贡献率占85%以上,那么系统会认为后面的数据结果有统计价值,但丢失的数据信息直接影响评级的准确性和可靠程度;

解决上述技术问题的难度:

(1)研究由违约率测度违约概率p的方法;

(2)确定影响违约损失率的主要因素;

(3)实现“预警”策略的数据挖掘技术。

解决上述技术问题的意义:

(1)在原有的穆迪模型基础上添加参数λ,模型中考虑非信用因素的随机波动对违约概率的影响;

(2)添加定性指标因素,设置定性指标可行区域,建立违约损失综合指标体系;

(3)改进信用评级数学模型,提高违约概率测度的准确性和可靠程度;

(4)完善评价结果的一致性检验,由评级结果修正模型算法,使模型建立—模型应用—模型修正成为一个闭环;

(5)利用机器学习中的监督学习的分类思想建立评级预警系统,用数据挖掘技术实现预警策略。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种信用评级违约概率测度与风险预警方法。

本发明是这样实现的,一种信用评级违约概率测度与风险预警方法。

所述信用评级系统由违约概率测度计算模块、信用评级指标体系模块、监督学习数学模型可视化模块、数据查询及评级报告生成模块构成。

所述违约概率测度计算模块通过数据挖掘技术能够实现数据获取和违约概率测度计算,包括数据的加载、参数设定、违约概率测度计算。

所述信用评级指标体系模块能够实现定性指标定量指标源数据的保存、数据列共线性分析、原始数据的预处理,包括数据清洗、数据集成、数据变换、数据规约,以及信用质量与信用等级的一致性检验。

所述监督学习数学模型可视化模块能够实现信用评级结果的预测,包括逻辑回归、支持向量机、神经网络模型的数据结果的比较,最优评级结果与违约概率测度的比较,以及穆迪模型的进一步修订。

所述数据查询及评级报告生成模块能够实现数据备份、数据查询、打印预览功能,以及后期违约预警功能。

所述数据查询及评级报告生成模块进一步包括:

步骤1:利用数据挖掘技术筛选出影响违约率的三个因素(m(r)、n(r)、l(r)),设定参数λ,λ∈[0,1],由改进的穆迪模型计算出违约率p(r),利用分布族的χ2拟合检验法,检验p(r)概率分布情况,由数字特征测度违约概率,以违约概率值为依据做信用等级划分,等级分为m类,m为1至5整数。m=1表示信用级别aaa,m=2表示信用级别aa,m=3表示信用级别a,m=4表示信用级别bbb,m=5表示信用级别bb。违约概率值越大,m值越大,违约风险越大。

步骤2:利用数据挖掘技术提取样本的定性指标数据和定量指标数据,保存源数据,计算数据列的皮尔逊相关系数分析共线性,设定相关系数r,r∈(0,1),若所得皮尔逊相关系数大于r,则做变量变换xij=xi/xj,消除共线性,再做数据清洗、数据集成、数据变换、数据规约等数据预处理。

步骤3:首先由违约概率值为依据的信用等级设为同期信用等级,然后与历史信用等级做一致性检验,若一致性检验未通过,则返回到第1步骤修订参数λ,若一致性检验通过,则以信用评价指标体系中影响lgd的因素为解释变量,由违约概率值为依据的同期信用等级为被解释变量,利用逻辑回归、支持向量机svm、神经网络模型分别测试样本,比较准确率和召回率,可视化roc曲线与auc值,系统选择最优模型作为后期信用评级预警模型。

步骤4:设定信用等级m=2,a类为无风险信用级别,赋值0,b类为风险信用级别,赋值1,构建二元响应风险预警模型,借助数据挖据技术实现“预警”策略。数据备份,生成信用评级可视化报告,保存为word或pdf文档,打印信用评价结果。

所述信用评级违约概率测度与风险预警方法包括:

步骤一,挖掘有效数据,测算违约概率;

步骤二,构建违约损失率预测模型,检验评级结果的一致性;

步骤三,构建二元响应风险预警模型,借助数据挖据技术实现“预警”策略。

进一步,所述步骤一挖掘有效数据,测算违约概率的方法为:由违约率测度违约概率p。由于难以在事先准确地计算出信用等级对应的违约概率,因此用违约率来估计违约概率。违约率是指债务人未能按照合约规定履行其金融义务,即发生违约的实际历史频率。而违约概率是指在未来给定时期内债务人发生违约的可能性。通过对评级机构信用评级历史数据的跟踪与分析得到违约率,从违约率概率分布情况估计违约概率。

进一步,所述测算违约概率方法具体包括:

第一步,利用数据挖据筛选出影响违约率的三个因素(m(r)、n(r)、l(r)),计算出违约率p(r);

第二步,利用分布族的χ2拟合检验法,检验p(r)概率分布情况,由数字特征测度违约概率。

进一步,所述测算违约概率第一步具体为:

改进穆迪模型动态群组,得到等级为r的发行人的年违约率p(r)公式如下:

其中m(r):等级为r的发行人中发生违约的个数;n(r):等级为r的发行人的原始个数;l(r):等级为r的发行人中由于非信用相关原因被撤销的个数;λ:比例系数,确定比例系数λ的可行区间。

1)若违约概率不随时间变化,则对于大样本,其t年的违约率p(r)t和t年加权平均的违约率p(r)近似服从正态分布,有

其中p:违约概率;mt:t年的发行人个数;m:t年合计发行人个数,

2)若违约概率随时间波动,但各年波动相互独立,则

其中σ:波动因素

3)若违约概率随时间波动,且波动存在连续性,则整个存续期内的平均违约率dr近似服从如下的正态分布:

其中,

θ:不同连续性程度。

进一步,所述测算违约概率第二步具体包括:

利用分布族的χ2拟合检验法,检验p(r)概率分布情况,由数字特征测度违约概率。若违约概率p则是其数学期望,用最大似然估计法估计p。

具体过程如下:

首先检验假设h0:p(r)t可能的概率密度函数为

再由最大似然估计法得μ,σ,的估计值接着分割ω,得到事件a1,a2,…,ak,计算频数fi和从而计算出取显著性水平α,如果则拒绝h0。如果接受h0,则违约概率

进一步,所述步骤二构建违约损失率预测模型,检验评级结果的一致性具体包括:

信用评级结果的一致性检验指债券发行人的主体违约概率与其信用等级间存在一致性,债券的信用质量与其信用等级之间存在一致性。对于债券发行人而言,主体违约概率与信用等级间的一致性并不涉及具体的违约损失,因此主要利用主体违约的历史数据来估算违约率,并进行一致性检验。收集、整理、筛选主体违约历史数据,建立数据库是检验违约概率与信用等级一致性的前提。质量与等级一致性检验环节,由于债券的信用质量包含因素较多,内在关系复杂,单纯考察债券的违约概率并不足以描述其实际的信用表现,因此,对债券的一致性检验应以预期损失率(即:违约概率×违约损失率)为主要考察因素。其中测算违约损失率lgd的大小不仅受到债务主体自身因素的影响,而且还同债务项目的具体设计密切相关,影响lgd的因素包括项目因素(如清偿优先性、抵押品等)、公司因素(如总资产和总负债等)、行业因素(如回收率等)、宏观经济周期因素(如经济指标等)。检验评级结果的一致性,关键是研究确定违约损失率影响因子,建立违约损失率的预测模型,从债券信用质量的角度检验质量与等级的一致性。针对违约损失率预测模型的建立,可以利用因子分析法确定影响违约损失率lgd的主要因素,并用多元回归拟合因素与违约损失率之间的数量关系,从而预测违约损失率,以此预测预期损失率,并检验评级结果的一致性。

进一步,检验评级结果的一致性有两个方面:一是违约概率与信用等级一致性,二是信用质量与信用等级一致性。难点是债券的信用质量与其信用等级之间的一致性检验,原因在于信用质量包含了违约概率、损失严重性以及等级转移风险等诸多因素,内在关系复杂。因此,用预期损失率(预期损失率=违约概率×违约损失率)为主要考察债券一致性检验的因素,其中研究、确定影响违约损失率lgd的因素就成为研究的关键问题。

进一步,所述步骤三构建二元响应风险预警模型,借助数据挖据技术实现“预警”策略具体包括:

跟踪受评主体的目的是为了确保受评者的信用风险能够在项目存续期内得到持续的揭示。假如受评主体已被跟踪记录一段时间,收集这段时间内主要的经济活动数据,设持续期为t,那么该主体在1+t之前违约的概率有多大,这是风险概率经常回答的问题。这类问题也可以理解为持续期t的风险概率就是t和1+t之间违约的风险。而生存分析,则揭示受评主体何时可能违约。风险和生存曲线提供了债务受评主体生存周期(即履行合约期)的快照。在评级结果公布的后续期建立早期风险预警模型,检测违约警告信号。

针对二元响应预警模型的构建与实现,采用线性回归模型的一种特殊形式——针对定性变量的逻辑回归分析法。但线性回归问题转化为逻辑回归,可以运用类似于朴素贝叶斯模型的思路,乘以一串似然来估计概率,然后将其转换为几率。构建二元响应预警模型关键点是根据受评主体的持续期估计其违约的概率。由于概率的取值范围是0~1,而几率的范围是0~+∞,因此利用将概率转换为几率。然后取几率的对数值以生成一个从负无穷到正无穷的函数,以几率的对数值作为目标变量建立回归方程:

得到的逻辑函数用于持续期的违约概率计算,债务受评主体的后续经济活动数据即可以由逻辑回归分析模型进行拟合并预测。

综上所述,本发明的优点及积极效果为:

测算违约概率是信用评级系统中最核心的问题,它是量化信用风险的必需输入变量,对信用风险的管理有着十分重要的意义。在大数据背景下挖据出与违约率相关的有效数据,计算出历史违约率;改进穆迪模型的动态群组,研究违约率与违约概率之间的关系,用实际数据检验其合理性,同时确定比例系数的可行区间;利用违约率概率分布情况研究违约概率测度方法,由违约概率估计受评主体违约的可能性,减少暴露于违约的信用风险。

构建二元响应风险预警模型可利用信用评估体系进行信用风险预控,当仍有时间采取措施降低暴露风险时,检测出违约的警告信号,并发出警示,有效化解债务受评主体非自愿违约的发生,使信用风险造成的损失降至最低程度。构建二元响应风险预警模型,是在给定时间点所有受评主体的快照集,检测受评主体在快照日期之后的t时间是否违约,利用数据挖据技术对合约期临近的受评主体或低评主体选择“预警”策略,提醒债务受评主体应履行的合约,以此减少非自愿违约的风险。

通过对信用评级数学模型的研究与应用,利用数据挖据技术最终形成一套能用数据实证的可行性强的信用评级体系,并取得有效的实践经验。同时研究成果可以与金融行业合作,也可以与信用企业合作,为其提供信用产品和技术服务,为市场主体的交易决策提供数据参考,从而对信用需求与信用产业发展作出贡献。

本发明创新点在于由违约率概率分布创设出违约概率测度的有效途径,并用数据挖据技术实现算法。数据挖据技术与信用评级理论的紧密结合,使实践技术与科学理论之间形成相互融合、相互促进的发展态势。数据挖据技术的渗透为信用评级模型的应用与实证成为了可能,增强了模型检验的可行性。在已有信用评级算法的基础上,改进、创新信用风险预警模型以及相关配套模型的研发、测试工作,使信用等级对应的信用质量能更加科学、准确地得以量化。

(1)因穆迪模型添加了参数λ,考虑了非信用因素的随机性对违约概率测度的影响,使模型应用更为广泛;

(2)定性指标与定量指标相结合,建立了信用评价因素指标体系,使信用评价所考察的因素更为全面;

(3)利用数据挖掘技术收集数据,在大数据背景下,信用评价结果更加真实可靠;

(4)利用机器学习中的监督学习算法使预测出的评级准确度更高,信用评级预警策略更加准确。

附图说明

图1是本发明实施例提供的信用评级系统结构示意图。

图中:1、违约概率测度计算模块;2、信用评级指标体系模块;3、监督学习数学模型可视化模块;4、数据查询及评级报告生成模块。

图2是本发明实施例提供的信用评级违约概率测度与风险预警方法流程图。

图3是本发明实施例提供的测算违约概率方法流程图。

图4是本发明实施例提供的svm混淆矩阵训练集结果显示图。

图5是本发明实施例提供的svm混淆矩阵测试集结果显示图。

图6是本发明实施例提供的神经网络混淆矩阵训练集结果显示图。

图7是本发明实施例提供的神经网络混淆矩阵测试集结果显示图。

图8是本发明实施例提供的逻辑回归混淆矩阵测试集结果显示图。

图9是本发明实施例提供的神经网络混淆矩阵训练集结果显示图。

图10是本发明实施例提供的

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

下面结合附图对本发明的应用原理作详细描述。

如图1所示,本发明实施例提供的信用评级系统由违约概率测度计算模块1、信用评级指标体系模块2、监督学习数学模型可视化模块3、数据查询及评级报告生成模块4构成。

所述违约概率测度计算模块1通过数据挖掘技术能够实现数据获取和违约概率测度计算,包括数据的加载、参数设定、违约概率测度计算。

所述信用评级指标体系模块2能够实现定性指标定量指标源数据的保存、数据列共线性分析、原始数据的预处理,包括数据清洗、数据集成、数据变换、数据规约,以及信用质量与信用等级的一致性检验。

所述监督学习数学模型可视化模块3能够实现信用评级结果的预测,包括逻辑回归、支持向量机、神经网络模型的数据结果的比较,最优评级结果与违约概率测度的比较,以及穆迪模型的进一步修订。

所述数据查询及评级报告生成模块4能够实现数据备份、数据查询、打印预览功能,以及后期违约预警功能。

所述数据查询及评级报告生成模块4进一步包括:

步骤1:利用数据挖掘技术筛选出影响违约率的三个因素(m(r)、n(r)、l(r)),设定参数λ,λ∈[0,1],由改进的穆迪模型计算出违约率p(r),利用分布族的χ2拟合检验法,检验p(r)概率分布情况,由数字特征测度违约概率,以违约概率值为依据做信用等级划分,等级分为m类,m为1至5整数。m=1表示信用级别aaa,m=2表示信用级别aa,m=3表示信用级别a,m=4表示信用级别bbb,m=5表示信用级别bb。违约概率值越大,m值越大,违约风险越大。

步骤2:利用数据挖掘技术提取样本的定性指标数据和定量指标数据,保存源数据,计算数据列的皮尔逊相关系数分析共线性,设定相关系数r,r∈(0,1),若所得皮尔逊相关系数大于r,则做变量变换xij=xi/xj,消除共线性,再做数据清洗、数据集成、数据变换、数据规约等数据预处理。

步骤3:首先由违约概率值为依据的信用等级设为同期信用等级,然后与历史信用等级做一致性检验,若一致性检验未通过,则返回到第1步骤修订参数λ,若一致性检验通过,则以信用评价指标体系中影响lgd的因素为解释变量,由违约概率值为依据的同期信用等级为被解释变量,利用逻辑回归、支持向量机svm、神经网络模型分别测试样本,比较准确率和召回率,可视化roc曲线与auc值,系统选择最优模型作为后期信用评级预警模型。

步骤4:设定信用等级m=2,a类为无风险信用级别,赋值0,b类为风险信用级别,赋值1,构建二元响应风险预警模型,借助数据挖据技术实现“预警”策略。数据备份,生成信用评级可视化报告,保存为word或pdf文档,打印信用评价结果。

如图2-3,本发明实施例提供的信用评级违约概率测度与风险预警方法包括:

s101:挖掘有效数据,测算违约概率;

s102:构建违约损失率预测模型,检验评级结果的一致性;

s103:构建二元响应风险预警模型,借助数据挖据技术实现“预警”策略。

进一步,所述步骤一挖掘有效数据,测算违约概率的方法为:由违约率测度违约概率p。由于难以在事先准确地计算出信用等级对应的违约概率,因此用违约率来估计违约概率。违约率是指债务人未能按照合约规定履行其金融义务,即发生违约的实际历史频率。而违约概率是指在未来给定时期内债务人发生违约的可能性。通过对评级机构信用评级历史数据的跟踪与分析得到违约率,从违约率概率分布情况估计违约概率。

进一步,所述测算违约概率方法具体包括:

s201:利用数据挖据筛选出影响违约率的三个因素(m(r)、n(r)、l(r)),计算出违约率p(r);

s202:利用分布族的χ2拟合检验法,检验p(r)概率分布情况,由数字特征测度违约概率。

进一步,所述测算违约概率第一步具体为:

改进穆迪模型动态群组,得到等级为r的发行人的年违约率p(r)公式如下:

其中m(r):等级为r的发行人中发生违约的个数;n(r):等级为r的发行人的原始个数;l(r):等级为r的发行人中由于非信用相关原因被撤销的个数;λ:比例系数,确定λ的可行区间;

1)若违约概率不随时间变化,则对于大样本,其t年的违约率p(r)t和t年加权平均的违约率p(r)近似服从正态分布,有

其中p:违约概率;mt:t年的发行人个数;m:t年合计发行人个数,

2)若违约概率随时间波动,但各年波动相互独立,则

其中σ:波动因素

3)若违约概率随时间波动,且波动存在连续性,则整个存续期内的平均违约率dr近似服从如下的正态分布:

其中,

θ:不同连续性程度。

进一步,所述测算违约概率第二步具体包括:

利用分布族的χ2拟合检验法,检验p(r)概率分布情况,由数字特征测度违约概率。若违约概率p则是其数学期望,可用最大似然估计法估计p。

具体过程如下:

首先检验假设h0:p(r)t可能的概率密度函数为

再由最大似然估计法得μ,σ的估计值接着分割ω,得到事件a1,a2,…,ak,计算频数fi和从而计算出取显著性水平α,如果则拒绝h0。如果接受h0,则违约概率

进一步,所述步骤二构建违约损失率预测模型,检验评级结果的一致性具体包括:

信用评级结果的一致性检验指债券发行人的主体违约概率与其信用等级间存在一致性,债券的信用质量与其信用等级之间存在一致性。对于债券发行人而言,主体违约概率与信用等级间的一致性并不涉及具体的违约损失,因此主要利用主体违约的历史数据来估算违约率,并进行一致性检验。收集、整理、筛选主体违约历史数据,建立数据库是检验违约概率与信用等级一致性的前提。质量与等级一致性检验环节,由于债券的信用质量包含因素较多,内在关系复杂,单纯考察债券的违约概率并不足以描述其实际的信用表现,因此,对债券的一致性检验应以预期损失率(即:违约概率×违约损失率)为主要考察因素。其中测算违约损失率lgd的大小不仅受到债务主体自身因素的影响,而且还同债务项目的具体设计密切相关,影响lgd的因素包括项目因素(如清偿优先性、抵押品等)、公司因素(如总资产和总负债等)、行业因素(如回收率等)、宏观经济周期因素(如经济指标等)。检验评级结果的一致性,关键是研究确定违约损失率影响因子,建立违约损失率的预测模型,从债券信用质量的角度检验质量与等级的一致性。针对违约损失率预测模型的建立,可以利用因子分析法确定影响违约损失率lgd的主要因素,并用多元回归拟合因素与违约损失率之间的数量关系,从而预测违约损失率,以此预测预期损失率,并检验评级结果的一致性。

进一步,检验评级结果的一致性有两个方面:一是违约概率与信用等级一致性,二是信用质量与信用等级一致性。难点是债券的信用质量与其信用等级之间的一致性检验,原因在于信用质量包含了违约概率、损失严重性以及等级转移风险等诸多因素,内在关系复杂。因此,用预期损失率(预期损失率=违约概率×违约损失率)为主要考察债券一致性检验的因素,其中研究、确定影响违约损失率lgd的因素就成为研究的关键问题。

进一步,所述步骤三构建二元响应风险预警模型,借助数据挖据技术实现“预警”策略具体包括:

跟踪受评主体的目的是为了确保受评者的信用风险能够在项目存续期内得到持续的揭示。假如受评主体已被跟踪记录一段时间,收集这段时间内主要的经济活动数据,设持续期为t,那么该主体在1+t之前违约的概率有多大,这是风险概率经常回答的问题。这类问题也可以理解为持续期t的风险概率就是t和1+t之间违约的风险。而生存分析,则揭示受评主体何时可能违约。风险和生存曲线提供了债务受评主体生存周期(即履行合约期)的快照。在评级结果公布的后续期建立早期风险预警模型,检测违约警告信号。

针对二元响应预警模型的构建与实现,采用线性回归模型的一种特殊形式——针对定性变量的逻辑回归分析法。但线性回归问题转化为逻辑回归,可以运用类似于朴素贝叶斯模型的思路,乘以一串似然来估计概率,然后将其转换为几率。构建二元响应预警模型关键点是根据受评主体的持续期估计其违约的概率。由于概率的取值范围是0~1,而几率的范围是0~+∞,因此利用将概率转换为几率。然后取几率的对数值以生成一个从负无穷到正无穷的函数,以几率的对数值作为目标变量建立回归方程:

得到的逻辑函数用于持续期的违约概率计算,债务受评主体的后续经济活动数据即可以由逻辑回归分析模型进行拟合并预测。

综上所述,信用评级违约概率测度与风险预警方法原理为:首先,利用r语言收集、整理、储存债务主体经济活动原始数据,建立数据库。其次,利用单样本s-k检验计算z统计量和相应的相伴概率p值,依据p值法原理来判断数据来自的总体分布情况,根据随机变量违约率的数字特征和最大似然估计法相应得到参数μ的估计值,违约概率p即可得到。再次,违约损失率预测模型的软件实现遵循因子分析原理和思路,得到分子得分系数,在eviews统计软件中进行回归模型设定与检验,预测违约损失率。而二元响应风险预警模型的软件实现,可以先对定性变量重新赋值0和1,设置条件预警命名,检测数据库违约警告信号,并对达到履行合约临界点的受评主体或低评主体自动提示。

本发明的主要内容环环相扣,条例清晰,方案合理。研究内容有一定的深度和广度,研究方案的论证能达到目前信用评级实际工作的需要,以便与国际惯例接轨。数据挖据技术上硬、软件能满足配套模型的研发、测试工作的需要。本项目涉及的统计软件均可以直接导入excel格式的数据,便于收集数据,建立数据库,并且r语言提供了许多高级管理功能,能够处理大量数据。本发明的灵活性、安全性和易用性为评级模型编程提供了良好的条件。

本发明制定了合理的项目实施进度计划、选择了科研教学经验丰富的研究团队、建立了良好的协作关系,保证项目的顺利执行。本项目组成员副教授三名,讲师两名,助教一名,组成了合理的研究梯队。六名成员均为学院统计实训指导教师,从事随机过程、应用统计的理论研究和实训实践工作多年,具备非常强的数据处理能力和软件编辑能力。

重庆第二师范学院图书馆已经订购了中外期刊数据库等数字资源,这有利于项目组成员查阅一些相关的文献,为本项目的实施提供了较完备的查新条件。重庆第二师范学院数学与信息工程系建立了统计实验室,配备了统计系列软件,并与软酷公司合作开发金融数学实验实训项目,为计算机、数学、金融多学科交叉和创新研究提供较高的平台。这为本项目的实施提供了良好的软、硬件支撑。研究成果可以进一步与信用评级机构、金融行业合作,提供信用产品和服务,为市场主体的交易决策提供数据参考和建议。

下面结合具体实施例对本发明作进一步描述。

实施例:

数据挖掘1020个有效样本数据,选取指标体系部分数据,设m=2,做二元分类预测检验,分别用支持向量机svm、神经网络、逻辑回归模型测试样本得到如下结果:

(1)svm运行结果分析,如图4、图5与表一、表二所示。

表1svm测试集各类评价标准指标

表2svm训练集各类评价标准指标

(2)神经网络运行结果分析,如图6、图7与表三、表四所示。

表3神经网络测试集各类评价标准指标

表4神经网络训练集各类评价标准指标

(3)逻辑回归运行结果分析,如图8、图9与表五、表六所示。

表5逻辑回归测试集各类评价标准指标

表6逻辑回归训练集各类评价标准指标

过svm模型、神经网路模型、逻辑回归模型算法可以知道,在三种算法中,从数据结果看,说明建立逻辑回归模型算法拟合较好,具有统计学意义。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1