应用数据挖掘方法的信用评分系统及信用评分方法

文档序号:6557862阅读:272来源:国知局
专利名称:应用数据挖掘方法的信用评分系统及信用评分方法
技术领域
本发明涉及一种信用评分系统,尤其是涉及一种适用于金融机构的应用数据挖掘(Data Mining)方法的信用评分系统及方法。
背景技术
目前,对信用卡或现金卡等新申请进件的评分,大多采用人工经验评估或利用评分卡来建立评分规则。一般而言,信用评分是根据申请人的历史缴款数据,同时参照个人属性数据,再运用统计原理,将申请人的信用风险予以量化。然后,再依据此信用评分来决定是否核卡,或决定申请人的信用额度的多少。通过对申请人的信用评分,可以减少金融机构的坏帐损失。
然而,随着社会大环境的剧烈变迁,评分标准也需要随之变更调整,但目前所使用的静态评分卡却无法实时反应社会大环境的现况。其次,各个金融机构的客户属性仍具相当大的差异,而目前一般所使用的专家型评分卡(Generic Score Card)却无法有效地评估各金融机构的客户的风险。而评分卡需要完全仰赖厂商供应,导致金融机构的自主性降低。再者,评分卡的购置成本相当高,从而会增加金融机构的营运成本的负担。
由于目前并无一套完整流程以及评估方法,可以应用于处理信用卡或现金卡新申请者的进件的信用评估系统,也无法使信用评分的模型实现最佳化的目标。因此,亟需建立一套信用评分系统,以提供最佳化的信用评分模型。

发明内容
因此,本发明的目的就是提供一种应用数据挖掘方法的银行信用评分方法,适用于金融机构对申请者进行信用评分。此信用评分方法可利用历史数据,来建立呆帐者预测模型,借以筛选客户,减少金融机构的坏帐损失,进而达到降低风险的效果。
本发明的另一目的是提供一种应用数据挖掘方法的银行信用评分方法,利用数据挖掘方法来建立信用评分模型。因此,可建立客观公正的信用审核标准,从而排除人为经验判断的缺陷。
本发明的又一目的是在提供一种应用数据挖掘方法的银行信用评分方法,具有混合式取样模块,因此可平衡数据比例,从而解决数据挖掘了无法处理高度不对称数据的问题。
本发明的再一目的是提供一种应用数据挖掘方法的信用评分系统,金融机构可依据其所面对的实际状况,自行调整更新预测模型。因此,可有效适应外在环境变化,灵活性极佳。
根据上述目的,本发明提出了一种应用数据挖掘方法的信用评分方法,适用于一金融机构来评估多个申请者的信用评分。此信用评分方法包括先提供一进件申请历史数据;再进行重新取样(Resample)步骤,以使所提供的进件申请历史数据中所取样的呆帐者笔数以及正常者笔数之间成接近比例;接下来,进行数据挖掘分类步骤,以建立多个呆帐者模型;接着,利用分类模型评估测量值评估所建立的呆帐者模型,以评估这些呆帐者模型的准确率,以从这些呆帐者模型选出具最佳测量值的呆帐者模型来作为预测模型;然后,将一新申请进件数据输入预测模型,从而获得此新申请进件数据的信用评分。
依照本发明一个较佳实施例,进件申请历史数据中的呆帐者笔数与正常者笔数之间的预设比例接近于1。
为实现上述目的,本发明还提出了一种应用数据挖掘方法的信用评分系统,适用于金融机构来评估多个申请者的信用评分。此信用评分系统至少包括重新取样模块,以将进件申请历史数据中不平衡的呆帐者数据与正常者数据重新取样,而使进件申请历史数据中所取样的呆帐者笔数以及正常者笔数之间成相近比例;以及数据挖掘模块,以建立多个呆帐者模型,其中利用模型评估测量值来评估所建立的呆帐者模型,以从这些呆帐者模型选出具最佳测量值的呆帐者模型作为预测模型。
依照本发明的一个较佳实施例,重新取样模块包括进件历史数据过度取样模块以及进件历史数据减量取样模块。而且,数据挖掘模块包括数据挖掘决策树引擎以及数据挖掘类神经网络引擎。
通过结合混合式取样模块以及数据挖掘技术,可建立客观公正的信用评分模型,且可根据金融机构所面对的实际状况的差异进行调整。因此,信用评分系统不仅具有极为灵活的应用性,还可有效筛选客户,从而大幅减少了金融机构的坏帐损失,进而实现了降低风险的目的。


图1示意根据本发明一较佳实施例的一种信用评分的流程图。
图2示意根据本发明另一较佳实施例的一种信用评分的流程图。
其中,附图标记说明如下10进件申请历史数据12数据处理模块14数据挖掘模块16数据挖掘决策树引擎18逻辑斯蒂回归引擎20数据挖掘类神经网络引擎22分类模型评估测量值 24信用评分预测模型26分数28新进件申请数据100进件申请历史数据 102重新取样模块104进件历史数据过度取样模块 106进件历史数据减量取样模块108数据挖掘模块 110数据挖掘决策树引擎112数据挖掘类神经网络引擎 114分类模型评估测量值116信用评分预测模型 118新进件申请数据120分数 122逻辑斯蒂回归引擎具体实施方式
本发明公开了一种应用数据挖掘方法的信用评分系统及方法,适合被金融机构用来评估新申请者的信用评分。为了使本发明的叙述更加详尽与完整,可以参照下列描述并配合图1与图2。
近年来,随着信息科技的日新月异,信息系统不论是在巨量数据处理,或是在高速运算等功能上,均具有相当显著的突破与进步。数据挖掘为数据库应用方式中相当重要的一种技术。其中,数据挖掘技术又可称为数据采矿技术,也就是说,通过优异的数据处理以及运算能力,在所掌握的大量数据中进行多维度的搜寻,并更进一步地撷取出藏匿在所述大量数据中的知识模式(Knowledge Patterns)。即,经由数据挖掘所提供的智能型数据分析,可更加了解数据的内涵,进而充分且有效地解决所面对的各种问题。目前,数据挖掘技术已广泛且成功地应用在市场调查、营销分析研究、经营决策分析、制造工程控制、以及生物科技研究等领域。
因此,本发明就是运用数据挖掘技术,再搭配混合式取样模块,来整合出一套信用评分模型的完整程序。
请参照图1,图1示意根据本发明一较佳实施例的一种信用评分的流程图。本发明的信用评分方法可供银行或金控公司等金融机构的授信单位来使用,例如信用卡申请审核、现金卡申请审核、个人小额信贷审核、或中小企业信用评级。通过该信用评分方法,金融机构可对金融商品的新申请者进行信用评分的评估。此信用评分方法主要是运用信用评分系统,此信用评分系统至少包括数据挖掘模块14。在本较佳实施例中,信用评分系统还可选择性地设置数据处理模块12,例如进件历史数据取样模块,以先行对为数众多的历史数据进行处理。数据挖掘模块14可例如包括数据挖掘决策树引擎16、逻辑斯蒂回归引擎18及/或数据挖掘类神经网络引擎20。
利用上述的信用评分系统进行金融商品新申请者的信用评分时,先将过往的进件申请历史数据10输入信用评分系统中。这些过往的进件申请历史数据为例如信用卡、现金卡、或小额信贷等金融商品申请者的历史数据。这些进件申请历史数据包括个人基本数据,例如性别、年龄、职业、年收入、婚姻状况与居住地等等。接着,可直接利用信用评分系统的数据挖掘模块14对进件申请历史数据进行数据挖掘分类步骤,以分别建立出多个呆帐者模型。数据挖掘模块14可例如包括数据挖掘决策树引擎16、数据挖掘类神经网络引擎20以及逻辑斯蒂回归引擎18。数据挖掘决策树引擎16、数据挖掘类神经网络引擎20及/或逻辑斯蒂回归引擎18可单独使用,但较佳是同时使用。在本发明中,进件申请历史数据10分别进入数据挖掘决策树引擎16、数据挖掘类神经网络引擎20及/或逻辑斯蒂回归引擎18中,经数据挖掘决策树引擎16、数据挖掘类神经网络引擎20探勘分类及/或逻辑斯蒂回归引擎18后,产生多组的呆帐者模型。
在本发明的其它较佳实施例中,也可先利用数据处理模块12对进件申请历史数据进行处理,例如取样或重新取样。然后,再使处理后的训练数据分别进入数据挖掘决策树引擎16、数据挖掘类神经网络引擎20及/或逻辑斯蒂回归引擎18中,经数据挖掘决策树引擎16、数据挖掘类神经网络引擎20探勘分类及/或逻辑斯蒂回归引擎18后,而产生多组的呆帐者模型。因此,本发明可根据进件申请历史数据的实际情况,选择性地使用数据处理模块12。
在呆帐者模型建立后,利用分类模型评估测量值22,例如正确率、AUC(Area Under the Curve)值等,对这些呆帐者模型进行评估,以评估这些呆帐者模型的准确率,并以从这些呆帐者模型中选出具最佳测量值的一组呆帐者模型来作为信用评分预测模型24。此时,即可将一新申请者的新进件申请数据28输入此信用评分预测模型24。信用评分预测模型24就可预估出此新申请者呆帐的机率,并可将所预估的呆帐机率转换成分数26,从而获得此新申请者的信用评分。
请参照图2,图2示意根据本发明另一较佳实施例的一种信用评分的流程图。本发明的信用评分方法可供金融机构(例如银行或金控公司的信用卡、现金卡、小额信贷的授信单位等)来应用,例如信用卡申请审核、现金卡申请审核、个人小额信贷审核、或中小企业信用评级。通过此信用评分方法,金融机构可对金融商品的新申请者进行信用评分的评估。此信用评分方法主要运用一信用评分系统,此信用评分系统较佳可包括重新取样模块102以及数据挖掘模块108。在本较佳实施例中,重新取样模块102包括进件历史数据过度取样模块104及/或进件历史数据减量取样模块106,且数据挖掘模块108包括数据挖掘决策树引擎110、数据挖掘类神经网络引擎112及/或逻辑斯蒂回归引擎122。
利用上述的信用评分系统进行金融商品新申请者的信用评分时,首先,将过往的进件申请历史数据100输入信用评分系统中。这些过往的进件申请历史数据为一些金融商品(例如信用卡、现金卡、或小额信贷)申请者的历史数据。这些进件申请历史数据包括个人基本数据,例如性别、年龄、职业、年收入、婚姻状况与居住地等等。接下来,利用重新取样模块102对所输入的进件申请历史数据中不平衡的呆帐者数据与正常者数据进行重新取样。重新取样模块102较佳可包括进件历史数据过度取样模块104以及进件历史数据减量取样模块106。其中,进件历史数据过度取样模块104是指对笔数较少的数据进行过度取样,而进件历史数据减量取样模块106是指对笔数较多的数据进行减量取样。例如,就一般情况而言,银行或金控公司的信用卡或现金卡等金融商品的使用者中,属呆帐者的比例与正常者的比例的差异相当悬殊。因此,就可利用进件历史数据过度取样模块104来对呆帐者数据进行过度取样的操作,另外可利用进件历史数据减量取样模块106对正常者数据进行减量取样的操作。在本较佳实施例中,进件历史数据过度取样模块104与进件历史数据减量取样模块106可单独使用或同时使用,以将进件申请历史数据中不平衡的呆帐者数据与正常者数据重新取样,而使所取样的呆帐者笔数以及正常者笔数之间成接近比例,并获得多组申请者历史数据来作为训练数据。为了使后续数据挖掘引擎能顺利建立出呆帐者预测模型,所取样的呆帐者笔数较佳是接近正常者笔数,更佳是使呆帐者笔数与正常者笔数之间的预设比例接近于1。
本较佳实施例一个的特征就是混合过度取样模块与减量取样模块,来进行重新取样。因此,可解决数据高度不对称的问题,有利于数据挖掘的进行。
接着,利用信用评分系统的数据挖掘模块108对重新取样后所获得的训练数据进行数据挖掘分类步骤,以分别建立出多个呆帐者模型。数据挖掘模块108较佳可包括数据挖掘决策树引擎110、数据挖掘类神经网络引擎112以及逻辑斯蒂回归引擎122。在本发明中,数据挖掘决策树引擎110、数据挖掘类神经网络引擎112及/或逻辑斯蒂回归引擎122可单独使用,但较佳是同时使用。在本发明的较佳实施例中,重新取样后的训练数据分别进入数据挖掘决策树引擎110、数据挖掘类神经网络引擎112及/或逻辑斯蒂回归引擎122中,经过数据挖掘决策树引擎110、数据挖掘类神经网络引擎112探勘分类及/或逻辑斯蒂回归引擎122后,而产生多组的呆帐者模型。
这些呆帐者模型建立后,利用分类模型评估测量值114,例如正确率、AUC值等,对这些呆帐者模型进行评估,以评估这些呆帐者模型的准确率,并以从这些呆帐者模型中选出具最佳测量值的一组呆帐者模型来作为信用评分预测模型116。完成信用评分预测模型116后,此时,即可将新申请者的新进件申请数据118输入此信用评分预测模型116。信用评分预测模型116就可预估出此新申请者呆帐的机率,并可将所预估的呆帐机率转换成分数120,而获得此新申请者的信用评分。
本较佳实施例的又一特征就是结合混合式的重新取样模块以及数据挖掘技术,来建立出信用评分模型的完整流程。
由上述本发明较佳实施例可知,本发明的一个优点就是因为本发明的信用评分方法可利用历史数据来建立呆帐者预测模型,并借以筛选客户。因此,可减少金融机构的坏帐损失,进而达到降低风险的目的。
由上述本发明较佳实施例可知,本发明的另一优点就是因为本发明的信用评分方法具有混合式取样模块,可平衡数据比例。因此,可解决数据挖掘无法处理高度不对称数据的问题。
由上述本发明较佳实施例可知,本发明的又一优点就是因为本发明是利用数据挖掘方法并结合混合式重新取样模块来建立信用评分模型。因此,可建立客观公正的信用审核标准,从而排除人为经验判断的缺陷。
由上述本发明的较佳实施例可知,本发明的再一优点就是金融机构可依据其所面对的实际状况,自行调整更新信用评分系统的预测模型。因此,可有效适应外在环境的变化,具有极佳的灵活性。
虽然本发明已以较佳实施例公开如上,然其并非用以限定本发明,任何本领域的技术人员,在不脱离本发明的精神和范围内,应当可以作各种的更动与润饰,因此本发明的保护范围应当以后附的权利要求书所界定的范围为准。
权利要求
1.一种应用数据挖掘方法的信用评分方法,适用于金融机构来评估多个申请者的信用评分,该信用评分方法包括提供进件申请历史数据;进行数据挖掘分类步骤,以建立多个呆帐者模型;利用分类模型评估测量值评估所述呆帐者模型,以评估所述呆帐者模型的准确率,从而从所述呆帐者模型中选出具有最佳测量值的呆帐者模型作为预测模型;以及将新申请进件数据输入该预测模型,从而获得该新申请进件数据的信用评分。
2.如权利要求1所述的应用数据挖掘方法的信用评分方法,在提供该进件申请历史数据的步骤与该数据挖掘分类步骤之间,还包括进行重新取样步骤,以使该进件申请历史数据中所取样的呆帐者笔数以及正常者笔数之间成接近比例。
3.如权利要求2所述的应用数据挖掘方法的信用评分方法,其中该重新取样步骤包括使用进件历史数据过度取样模块及/或进件历史数据减量取样模块。
4.如权利要求2所述的应用数据挖掘方法的信用评分方法,其中该接近比例接近于1。
5.如权利要求1所述的应用数据挖掘方法的信用评分方法,其中该数据挖掘分类步骤包括使用数据挖掘决策树引擎、数据挖掘类神经网络引擎及/或逻辑斯蒂回归引擎。
6.一种应用数据挖掘方法的信用评分系统,适用于金融机构来评估多个申请者的信用评分,该信用评分系统包括一数据挖掘模块,以建立多个呆帐者模型,其中利用分类模型评估测量值来评估所述呆帐者模型,以从所述呆帐者模型中选出具有最佳测量值的呆帐者模型作为预测模型。
7.如权利要求6所述的应用数据挖掘方法的信用评分系统,还包括重新取样模块,以将进件申请历史数据中不平衡的呆帐者数据与正常者数据重新取样,而使该进件申请历史数据中所取样的呆帐者笔数以及正常者笔数之间成接近比例。
8.如权利要求7所述的应用数据挖掘方法的信用评分系统,其中该重新取样模块包括进件历史数据过度取样模块及/或进件历史数据减量取样模块。
9.如权利要求7所述的应用数据挖掘方法的信用评分系统,其中该接近比例接近于1。
10.如权利要求6所述的应用数据挖掘方法的信用评分系统,其中该数据挖掘模块包括数据挖掘决策树引擎、数据挖掘类神经网络引擎及/或逻辑斯蒂回归引擎。
全文摘要
一种应用数据挖掘(Data Mining)方法的信用评分系统及方法,适用于金融机构来评估多个申请者的信用评分。此信用评分方法包括提供进件申请历史数据;进行一重新取样(Resample)步骤,以使进件申请历史数据中所取样的呆帐者笔数以及正常者笔数之间成一相近比例;进行一数据挖掘分类步骤,以建立多个呆帐者模型;利用一分类模型评估测量值评估这些呆帐者模型,以评估这些呆帐者模型的准确率,借以从这些呆帐者模型选出具最佳测量值者作为一预测模型;以及将一新申请进件数据输入预测模型,而获得此新申请进件数据的信用评分。
文档编号G06F17/30GK101046876SQ20061007108
公开日2007年10月3日 申请日期2006年3月31日 优先权日2006年3月31日
发明者张元勋, 李建亿, 曾新穆, 吴博民 申请人:探宇科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1