一种基于核极限学习机的风险预测的方法和装置的制造方法

文档序号:10656294阅读:283来源:国知局
一种基于核极限学习机的风险预测的方法和装置的制造方法
【专利摘要】本发明适用于计算机领域,提供了一种基于核极限学习机的风险预测的方法和装置,旨在解决现有技术中无法确定核极限学习机的惩罚系数和核宽的最佳值,导致风险预测精确度不高的问题。方法包括:获取预定数量的企业的经营数据;对经营数据进行标准化;利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和核宽;基于优化后的惩罚系数和核宽构建核极限学习机的预测模型;根据预测模型进行风险预测。通过本发明的技术方案,将灰狼算法融入核极限学习机来确定惩罚系数和核宽的最佳值,构建出更加准确的预测模型,实现对风险的有效预测,提高预测精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。
【专利说明】
-种基于核极限学习机的风险预测的方法和装置
技术领域
[0001] 本发明设及计算机技术领域,尤其设及一种基于核极限学习机的风险预测的方法 和装置。
【背景技术】
[0002] 为了减少企业经营风险尤其是破产风险对金融机构造成的损失,通过建立安全有 效的风险预警机制并对企业经营风险进行预测的方法,是金融机构保持投资回报的有效方 式。
[0003] 目前已有的企业经营风险预测方法主要可分为两类,即基于统计学模型的方法和 基于人工智能的方法。基于统计学模型的预测方法主要有单变量分析法、多元判别分析法、 罗吉斯特回归模型和因子分析法。相比于基于统计学模型的预测方法,基于人工智能的预 测方法因其优越的性能而被广泛应用于金融风险预测领域。
[0004] 当前,基于人工智能的预测方法主要有基于人工神经网络、基于支持向量机、基于 k近邻、基于贝叶斯模型、基于极限学习机、基于混合模型W及集成学习等方法,运些方法都 已经成功的应用于金融风险预测领域。其中,基于人工神经网络的方法由于其能够较好地 捕捉数据中的非线性关系而得到广泛地应用收。但基于人工神经网络的方法因通常采用梯 度下降法进行学习而存在易陷入局部最小值的不足,同时网络构建过程也需要对大量的参 数进行调整而难W建立起最优的模型。为了克服神经网络的运些缺点,出现了一种新的神 经网络学习方法即极限学习机。由于极限学习机具有良好的学习泛化能力,基于极限学习 的模型已经开始应用于金融破产预测、经济生命周期预测和企业信用评估等风险预测和评 估中。由于极限学习机的输入参数值随机产生,导致模型的性能不够稳定,为了解决该问 题,核极限学习机的概念被提出。相比于极限学习机,核极限学习机不需要随机设置输入层 和隐藏层的权值,因而能够获得更高的训练速度,基于核极限学习机的企业经营风险预测 相比其他预测方法更加准确。
[0005] 然而,现有研究表明核极限学习机的性能易受两个参数影响,即惩罚系数和核宽。 惩罚系数用于确定拟合误差最小化和输入之间的权衡重量最小化,核宽定义了从输入空间 到高维特征空间的非线性映射关系。运两个关键参数需要预先确定,如何确定最优的惩罚 系数和最优的核宽,一直未获得较好的解决,目前,通常采用的方法是利用网格捜索方法确 定它们的值,但网络捜索方法易陷入局部最优,因而导致风险预测的精确度不高。

【发明内容】

[0006] 本发明的目的在于提供一种基于核极限学习机的风险预测的方法和装置,旨在解 决现有技术中无法确定核极限学习机的惩罚系数和核宽的最佳值,导致风险预测的精确度 不高的问题。
[0007] 本发明的第一方面,提供一种基于核极限学习机的风险预测的方法,包括:
[000引获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征 值;
[0009] 对所述经营数据进行标准化;
[0010] 基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核 宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最 小化W及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空 间的非线性映射关系;
[0011] 基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测 模型;
[0012] 根据所述预测模型进行风险预测。
[0013] 本发明的第二方面,提供一种基于核极限学习机的风险预测的装置,包括:
[0014] 数据获取模块,用于获取预定数量的企业的经营数据,所述经营数据包括预定个 数的属性特征的特征值;
[0015] 标准化模块,用于对所述经营数据进行标准化;
[0016] 灰狼优化模块,用于基于标准化后的所述经营数据,利用灰狼算法优化核极限学 习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数 用于确定拟合误差最小化W及输入数据之间的权衡重量最小化,所述优化后的核宽为从输 入空间到高维特征空间的非线性映射关系;
[0017] 模型构建模块,用于基于所述优化后的惩罚系数和所述优化后的核宽构建所述核 极限学习机的预测模型;
[0018] 预测模块,用于根据所述预测模型进行风险预测。
[0019] 本发明与现有技术相比存在的有益效果是:通过将灰狼算法融入核极限学习机来 确定核极限学习机的惩罚系数和核宽,由于灰狼算法通过模仿自然界中狼群的社会等级和 猎食行为获得问题的最优解,因此具有更好的捜索能力,能够确定核极限学习机的惩罚系 数和核宽的最佳值,从而可W构建出更加准确的核极限学习机的预测模型,实现对企业经 营风险的有效预测,并大大提高了预测的精确度,在辅助金融机构对企业经营风险进行科 学合理有效的预测中具有重要的应用价值。
【附图说明】
[0020] 图1是本发明实施例一提供的一种基于核极限学习机的风险预测的方法的流程 图;
[0021] 图2是本发明实施例二提供的一种基于核极限学习机的风险预测的方法的流程 图;
[0022] 图3是本发明实施例=提供的一种基于核极限学习机的风险预测的装置的结构示 意图;
[0023] 图4是本发明实施例四提供的一种基于核极限学习机的风险预测的装置的结构示 意图。
【具体实施方式】
[0024] 为了使本发明的目的、技术方案及优点更加清楚明白,W下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用W解释本发明,并 不用于限定本发明。
[0025] W下结合具体附图对本发明的实现进行详细的描述。
[0026] 实施例一.
[0027] 图1是本发明实施例一提供的一种基于核极限学习机的风险预测的方法的流程 图,具体包括步骤SlOl至S104,详述如下:
[0028] S101、获取预定数量的企业的经营数据,该经营数据包括预定个数的属性特征的 特征值。
[0029] 具体地,企业经营数据指从会计学角度定义的企业当前经济状况的属性特征,属 性特征代表一系列的金融比率,具体可W但不限于包括现金/流动负债比(cash/current liabilities)、现金/总资产比(cash/total assets)、流动资产/流动负载比(current assets/current liabilities)、流动资产 / 总资产 t:t(current assets/total assets)、营 运资金/总资产比(working capital/total assets)、营运资金/销售额比(working capital/sales)、销售额/库存比(sales/inventoiT)、销售额/应收账款比(sales/ receivables)等。
[0030] 在预定数量的企业中,每一个企业都提供预定个数的属性特征,运些预定数量的 企业的预定个数的属性特征的特征值构成全部经营数据。
[0031] S102、对经营数据进行标准化。
[0032] 具体地,在每一个企业的经营数据中,对每一个属性特征均进行标准化处理,使得 标准化处理后的经营数据能够准确有效的支撑灰狼算法的实现。
[0033] 进一步地,可W按照公式(1)对经营数据进行标准化处理:
[0034]
(1)
[0035] 其中,sy[i]'为第y个企业的第i个属性特征标准化后的特征值,sy[i]为第y个企业 的第i个属性特征的特征值,S[i]max为预定数量的企业的第i个属性特征的最大值,S[i]min 为预定数量的企业的第i个属性特征的最小值,yG[l,門,Y为预定数量的企业,iG[l,I],I 为预定个数的属性特征。
[0036] S103、基于标准化后的经营数据,利用灰狼算法优化核极限学习机的惩罚系数和 核宽,得到优化后的惩罚系数和优化后的核宽,优化后的惩罚系数用于确定拟合误差最小 化W及输入数据之间的权衡重量最小化,优化后的核宽为从输入空间到高维特征空间的非 线性映射关系。
[0037] 具体地,灰狼算法的过程是根据标准化后的经营数据计算灰狼的位置,并确定排 在前=位的灰狼的位置,并根据运前=位灰狼的位置,使其他的灰狼跟随着运=只最优秀 的灰狼去围捕猎物,即让其他灰狼的位置不断围绕和接近运=只灰狼,每更新一次位置即 完成一次迭代过程,并得到狼群的一个新的位置集合,反复迭代直到达到预置的最大迭代 次数为止。
[0038] 每一只灰狼的位置包括两个参数,即惩罚系数和核宽,惩罚系数用于确定拟合误 差最小化W及输入数据之间的权衡重量最小化,核宽为从输入空间到高维特征空间的非线 性映射关系。因此,在通过灰狼算法得到的狼群的最终位置集合中,排在第一位的灰狼即头 狼的位置的两个参数即为优化后的惩罚系数和优化后的核宽。
[0039] S104、基于优化后的惩罚系数和优化后的核宽构建核极限学习机的预测模型。
[0040] 具体地,基于步骤S103得到的优化后的惩罚系数和优化后的核宽,进行核极限学 习机的预测模型的构建。
[0041] S105、根据预测模型进行风险预测。
[0042] 具体地,根据步骤S104构建的核极限学习机的预测模型,可W对企业经营风险进 行预测。
[0043] 本实施例中,通过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数 和核宽,由于灰狼算法通过模仿自然界中狼群的社会等级和猎食行为获得问题的最优解, 因此具有更好的捜索能力,能够确定核极限学习机的惩罚系数和核宽的最佳值,从而可W 构建出更加准确的核极限学习机的预测模型,实现对企业经营风险的有效预测,并大大提 高了预测的精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要 的应用价值。
[0044] 实施例二:
[0045] 图2是本发明实施例二提供的一种基于核极限学习机的风险预测的方法的流程 图,具体包括步骤S201至S208,详述如下:
[0046] S201、获取预定数量的企业的经营数据,该经营数据包括预定个数的属性特征的 特征值。
[0047] 具体地,企业经营数据指从会计学角度定义的企业当前经济状况的属性特征,属 性特征代表一系列的金融比率,具体可W但不限于包括现金/流动负债比(cash/current liabilities)、现金/总资产比(cash/total assets)、流动资产/流动负载比(current assets/current liabilities)、流动资产 / 总资产 t:t(current assets/total assets)、营 运资金/总资产比(working capital/total assets)、营运资金/销售额比(working capital/sales)、销售额/库存比(sales/inventoiT)、销售额/应收账款比(sales/ receivables)等。
[004引在预定数量的企业中,每一个企业都提供预定个数的属性特征,运些预定数量的 企业的预定个数的属性特征的特征值构成了全部经营数据。
[0049] S202、对经营数据进行标准化。
[0050] 在每一个企业的经营数据中,对每一个属性特征均进行标准化处理,使得标准化 处理后的经营数据能够准确有效的支撑灰狼算法的实现。
[0051] 具体地,可W按照公式(2)对经营数据进行标准化处理:
[0052](2)
[0053] 其中,SyLi」'
为第y个企业的第i个属性特征标准化后的特征值,Sy[ i]为第y个企业 的第i个属性特征的特征值,S[i]max为预定数量的企业的第i个属性特征的最大值,S[i]min 为预定数量的企业的第i个属性特征的最小值,yG[l,門,Y为预定数量的企业,iG[l,I],I 为预定个数的属性特征。
[0054] S203、初始化灰狼参数,该灰狼参数包括最大迭代次数T、灰狼个数M、惩罚系数C的 捜索范围[Cmin,Cmax]和核宽丫的捜索范围[丫 min, 丫 max]。
[0055]具体地,对灰狼算法中需要用到的灰狼参数进行初始化,可W但不限于包括最大 迭代次数T、灰狼个数M、惩罚系数C的捜索范围[Cmin,Cmax]和核宽丫的捜索范围[丫 min, y max] O
[0化6] S204、设置每一只灰狼的位置Xm,并建立灰狼位置矩阵1。
[0057]具体地,按照公式(3)设置每一只灰狼的位置Xm:
[0化引 Xm=(Xml,Xm2) (3)
[0059] 其中,Xmi为灰狼m在当前位置时惩罚系数的值,为灰狼m在当前位置时核宽的 值,niE [1 ,M] , Xml E [ Cmin , Cmax ] , E [丫 min , 丫 max ]。
[0060] 根据每一只灰狼的位置Xm,按照公式(4)构建灰狼位置矩阵^。
[0061 ]
' 4)
[0062] S205、计算每一只灰狼的适应度fm。
[0063] 具体地,适应度fm为基于Xm计算得到的核极限学习机的准确度ACC,核极限学习机 的准确度ACC是对步骤S202得到的标准化后的经营数据进行K折交叉验证后,获取的平均准 确度,核极限学习机的准确度ACC按照公式(5)计算得到:
[0064]
(5)
[0065] 其中,acck为第k折交叉验证的准确度,K为大于0的整数。
[0066] 交叉验证(Cross-validation)是指在给定的建模样本中,拿出大部分样本进行模 型构建,留小部分样本对所建立的模型进行预报,并求运小部分样本的预报误差,运个过程 一直进行,直到所有的样本都被预报了一次而且仅被预报一次。交叉验证的目的是为了得 到可靠稳定的模型。K折交叉验证化-fold cross-validation)是交叉验证的一种具体形 式,常用的K折交叉验证为10折交叉验证(10-fold cross validation)。
[0067] 在本实施例中,K折交叉验证化-fold cross-validation)是指将步骤S202得到的 标准化后的经营数据分割成K个子样本,轮流将其中一个子样本作为测试数据,其他K-I个 子样本作为训练数据,保证每一个子样本都有一次作为测试数据的机会。交叉验证重复K 次,每个子样本验证一次,每一次交叉验证的结果即为acck,平均K次交叉验证的结果得到 一个单一估测值,即核极限学习机的准确度ACC。
[0068] S206、按照适应度fm对灰狼进行排序,得到具有最高适应度的灰狼a的位置、具 有次高适应度的灰狼e的位置和适应度第=高的灰狼S的位置。
[0069] 具体地,对灰狼按照步骤S205得到的适应度fm的值进行排序,得到具有最高适应 度的灰狼a的位置具有次高适应度的灰狼e的位置和适应度第=高的灰狼S的位置 fd,其中具有最高适应度的灰狼a作为头狼。
[0070] S207、分别计算灰狼a、灰狼e和灰狼S距离猎物的距离D、4和&。
[0071] 具体地,按照公式(6)计算计算灰狼a、灰狼0和灰狼S距离猎物的距离
[0072]
(后)
[0073] 其中,這、這和S通过公
十算得到,为[0,1]之间的随机数,即;^取不同 的随机数分别得到ci、ミ和ミ,l为当前的灰狼位置矩阵,f。、和为在当前灰狼位 置矩阵中排在前=位的灰狼的位置。
[0074] S208、完成对灰狼位置矩阵^的更新。
[00巧]具体地,按照公式(7)对灰狼位置矩阵1进行更新:
[0076]
(7)
[0077] 其中,4、4和4通过公式
计算得到:
,t为当前迭代次 数,tG[l,T],3随着迭代次数t的增加会在巧Ijo之间线性递减,;^为[0,1]之间的随机数,即 n取不同的随机数分别得到4、石和4,&、马和這通过公式(6)计算得到。
[0078] 灰狼算法的核屯、思想是让除去排在狼群前=位的其他灰狼跟随着运=只优秀的 灰狼去围捕猎物,运是灰狼算法的算法生物学核屯、意义所在。在具体算法中,运个核屯、思想 是通过公式(7)来模拟实现的。其中,
的含义是让狼群中除去灰狼a之外的 其他灰狼跟随着灰狼a去猎食,即其他灰狼的位置不断接近灰狼a
的含义 是让狼群中除去灰狼e之外的其他灰狼跟随着灰狼e去猎食,即其他灰狼的位置不断接近灰 狼e,
的含义是让狼群中除去灰狼S之外的其他灰狼跟随着灰狼S去猎食, 即其他灰狼的位置不断接近灰狼S:
的含义则是对围绕着运=只优秀的灰 狼产生的新的狼群的S个灰狼位置矩阵^和;?,进行平均,所得到的I即为此次迭代 后更新的狼群的灰狼位置矩阵4。
[0079] S209、判断当前迭代次数t是否达到所述最大迭代次数T,如果是,则执行步骤 S210,否则根据更新后的灰狼位置矩阵J返回步骤S205继续执行。
[0080] 具体地,如果当前迭代次数t是否达到所述最大迭代次数T,则灰狼优化完成,执行 步骤S210,否则根据更新后的灰狼位置矩阵X返回步骤S205继续进行迭代。
[0081 ] S210、输出灰狼a的位置Xa= (Xal,Xa2),其中Xal为优化后的惩川系数C,Xa2为优化后 的核宽T。
[0082] 具体地,当前迭代次数t达到所述最大迭代次数T时,此时最新的灰狼位置矩阵1 中排在第一位的头狼的位置的参数即为优化后的惩罚系数C和优化后的核宽丫。即灰狼a的 位置Xa=Ual,Xa2)中,XU为优化后的惩罚系数C,Xa2为优化后的核宽丫。
[0083] S211、基于优化后的惩罚系数C和优化后的核宽丫构建核极限学习机的预测模型。
[0084] 具体地,基于优化后的惩罚系数C和优化后的核宽丫,按照公式(8)构建核极限学 习机的预测模型:
[0085]
(8) 1234567 其中,S为待测试样本,SI,…,SN为训练样本,N为预置的训练样本数,nG[l,N], Q ELM为预置的符合Mercer定理构造的核矩阵。 2 待测试样本是指在现有的数据集即步骤S202得到的标准化后的经营数据中,按照 预设的规则取一定数量的样本,作为检测模型性能的数据,训练样本是指除去待检测样本 的其他样本,作为训练模型的训练样本。待测试样本和训练样本的样本个数由N的取值决 定。 3 Mercer定理是指任何半正定的函数都可W作为核函数。 4 S212、根据预测模型进行风险预测。 5 具体地,根据步骤S211构建的核极限学习机的预测模型,可W对企业经营风险进 行预测。 6 本实施例中,通过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数 和核宽,具体地,将惩罚系数和核宽设定为灰狼的位置参数并设置灰狼位置矩阵,通过计算 灰狼的适应度并对适应度的值进行排序,得到适应度排在前=位的灰狼的位置,并根据前 =位的灰狼位置不断更新灰狼位置矩阵,使其他灰狼的位置不断接近运=只灰狼,即通过 模仿自然界中狼群的社会等级和猎食行为获得问题的最优解,即核极限学习机的惩罚系数 和核宽的最佳值,从而可W构建出更加准确的核极限学习机的预测模型,实现对企业经营 风险的有效预测,并大大提高了预测的精确度,在辅助金融机构对企业经营风险进行科学 合理有效的预测中具有重要的应用价值。 7 实施例
[0093] 图3是本发明实施例=提供的一种基于核极限学习机的风险预测的装置的结构示 意图,为了便于说明,仅示出了与本发明实施例相关的部分。图3示例的一种基于核极限学 习机的风险预测的装置可W是前述实施例一提供的一种基于核极限学习机的风险预测的 方法的执行主体。图3示例的集中基于核极限学习机的风险预测的装置主要包括:数据获取 模块31、标准化模块32、灰狼优化模块33、模型构建模块34和预测模块35。各功能模块详细 说明如下:
[0094] 数据获取模块31,用于获取预定数量的企业的经营数据,该经营数据包括预定个 数的属性特征的特征值;
[00M]标准化模块32,用于对经营数据进行标准化;
[0096] 灰狼优化模块33,用于基于标准化后的经营数据,利用灰狼算法优化核极限学习 机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,优化后的惩罚系数用于确 定拟合误差最小化W及输入数据之间的权衡重量最小化,优化后的核宽为从输入空间到高 维特征空间的非线性映射关系;
[0097] 模型构建模块34,用于基于优化后的惩罚系数和优化后的核宽构建核极限学习机 的预测模型;
[0098] 预测模块35,用于根据预测模型进行风险预测。
[0099] 本实施例提供的一种基于核极限学习机的风险预测的装置中各模块实现各自功 能的过程,具体可参考前述图1所示实施例的描述,此处不再寶述。
[0100] 从上述图3示例的一种基于核极限学习机的风险预测的装置可知,本实施例中,通 过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数和核宽,由于灰狼算法通 过模仿自然界中狼群的社会等级和猎食行为获得问题的最优解,因此具有更好的捜索能 力,能够确定核极限学习机的惩罚系数和核宽的最佳值,从而可W构建出更加准确的核极 限学习机的预测模型,实现对企业经营风险的有效预测,并大大提高了预测的精确度,在辅 助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。
[0101] 实施例四:
[0102] 图4是本发明实施例四提供的一种基于核极限学习机的风险预测的装置的结构示 意图,为了便于说明,仅示出了与本发明实施例相关的部分。图4示例的一种基于核极限学 习机的风险预测的装置可W是前述实施例二提供的一种基于核极限学习机的风险预测的 方法的执行主体。图4示例的集中基于核极限学习机的风险预测的装置主要包括:数据获取 模块41、标准化模块42、灰狼优化模块43、模型构建模块44和预测模块45。各功能模块详细 说明如下:
[0103] 数据获取模块41,用于获取预定数量的企业的经营数据,该经营数据包括预定个 数的属性特征的特征值;
[0104] 标准化模块42,用于对经营数据进行标准化;
[0105] 灰狼优化模块43,用于基于标准化后的经营数据,利用灰狼算法优化核极限学习 机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,优化后的惩罚系数用于确 定拟合误差最小化W及输入数据之间的权衡重量最小化,优化后的核宽为从输入空间到高 维特征空间的非线性映射关系;
[0106] 模型构建模块44,用于基于优化后的惩罚系数和优化后的核宽构建核极限学习机 的预测模型;
[0107] 预测模块45,用于根据预测模型进行风险预测。
[0108] 进一步地,标准化模块42,还用于:
[0109] 按如下公式对经营数据进行标准化:
[0110]
[0111] 其中,Sy[i]'为第y个企业的第i个属性特征标准化后的特征值,Sy[i]为第y个企业 的第i个属性特征的特征值,S[i]max为所述预定数量的企业的第i个属性特征的最大值,S
[i]min为所述预定数量的企业的第i个属性特征的最小值,y G [1,門,Y为所述预定数量的企 业,i G [ 1,I ],I为所述预定个数的属性特征。
[0112] 进一步地,灰狼优化模块43包括:
[0113] 初始化子模块431,用于初始化灰狼参数,该灰狼参数包括最大迭代次数T、灰狼个 数M、惩罚系数C的捜索范围[Cmin,Cmax]和核宽丫的捜索范围[丫 min, 丫 max];
[0114] 位置设置子模块432,用于按如下公式设置每一只灰狼的位置Xm,并建立灰狼位置 矩阵;;
[0115;
[0116; 1234567 其中,Xml为灰狼m在当前位置时惩罚系数的值,为灰狼m在当前位置时核宽的 值,niE [1 ,M] , Xml E [ Cmin , Cmax ] , E [丫 min , 丫 max ]; 2 优化迭代子模块433,用于根据标准化后的经营数据计算灰狼的适应度,并按照适 应度对灰狼进行排序,更新灰狼位置得到更新后的灰狼位置矩阵i,完成一次灰狼优化迭 代,并根据更新后的灰狼位置矩阵1继续进行灰狼优化迭代,直到达到最大迭代次数T为 止,输出当前灰狼位置矩阵J中头狼的位置,根据头狼的位置得到优化后的惩罚系数C和优 化后的核宽丫。 3 进一步地,优化迭代子模块433,还用于: 4 计算每一只灰狼的适应度fm,该适应度fm为基于Xm计算得到的核极限学习机的准 确度ACC,准确度ACC为基于标准化后的经营数据的K折交叉验证获取的平均准确度,准确度 ACC的计宵公古责? 5
[0121]
6 其中,acck为第k折交叉验证的准确度,K为大于0的整数; 7 按照适应度fm对灰狼进行排序,得到具有最高适应度的灰狼Cl的位置之<<、具有次 高适应度的灰狼e的位置和适应度第=高的灰狼S的位置J
[0124] 按照如下公式分别计算灰狼a、灰狼e和灰狼S距离猎物的距离、/^和6、
[0125]
[0126]
[0127]
[0128] 其中,S、Q和^通过公式? =2,"^十算得到,端为[0,1 ]之间的随机数;
[0129] 按照如下公式完成对灰狼位置矩阵X的更新:
[0130]
[0131]
[0132]
[0133]
[0134] 其中,4、和4通过公式
计算得到:
,t为当前迭代次 数,*£[1,門,;^;%[0,1]之间的随机数;
[0135] 如果当前迭代次数t尚未达到最大迭代次数T,则根据更新后的灰狼位置矩阵X继 续进行灰狼优化迭代,直到当前迭代次数t达到最大迭代次数T为止;
[0136] 输出灰狼a的位置Xa= (Xal,Xa2),其中Xal为优化后的惩罚系数C,Xa2为优化后的核 宽丫。
[0137] 进一步地,模型构建模块44包括:
[0138] 预测模型构建子模块441,用于基于优化后的惩罚系数C和优化后的核宽T,按照 如下公式构建核极限学习机的预测模型:
[0139]
[0140]
[0141] 其中,S为待测试样本,Si,…,SN为训练样本,N为预置的训练样本数,n G [ 1,N], Q ELM为预置的符合Mercer定理构造的核矩阵。
[0142] 本实施例提供的一种基于核极限学习机的风险预测的装置中各模块实现各自功 能的过程,具体可参考前述图2所示实施例的描述,此处不再寶述。
[0143] 从上述图4示例的一种基于核极限学习机的风险预测的装置可知,本实施例中,通 过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数和核宽,具体地,将惩罚 系数和核宽设定为灰狼的位置参数并设置灰狼位置矩阵,通过计算灰狼的适应度并对适应 度的值进行排序,得到适应度排在前=位的灰狼的位置,并根据前=位的灰狼位置不断更 新灰狼位置矩阵,使其他灰狼的位置不断接近运=只灰狼,即通过模仿自然界中狼群的社 会等级和猎食行为获得问题的最优解,即核极限学习机的惩罚系数和核宽的最佳值,从而 可W构建出更加准确的核极限学习机的预测模型,实现对企业经营风险的有效预测,并大 大提高了预测的精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有 重要的应用价值。
[0144] 需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每一个实施例 重点说明的都是与其他实施例的不同之处,各个实施例之间相同或者相似的部分互相参见 即可。对于装置类实施例而言,由于其与方法实施例基本相似,所W描述的比较简单,相关 之处参见方法实施例的部分说明即可。
[0145] 值得注意的是,上述装置实施例中,所包括的各个模块只是按照功能逻辑进行划 分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体 名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
[0146] 本领域普通技术人员可W理解,实现上述各实施例方法中的全部或部分步骤是可 W通过程序来指令相关的硬件来完成,相应的程序可W存储于一计算机可读取存储介质 中,所述的存储介质,如R0M/RAM、磁盘或光盘等。
[0147] W上所述仅为本发明的较佳实施例而已,并不用W限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于核极限学习机的风险预测的方法,其特征在于,包括: 获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值; 对所述经营数据进行标准化; 基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽, 得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化 以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的 非线性映射关系; 基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型; 根据所述预测模型进行风险预测。2. 根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述对所 述经营数据进行标准化包括: 按如下公式对所述经营数据进行标准化:其中,sy[i] '为第y个企业的第i个属性特征标准化后的特征值,sy[i]为第y个企业的第 i个属性特征的特征值,s[i]max为所述预定数量的企业的第i个属性特征的最大值,s[i]min 为所述预定数量的企业的第i个属性特征的最小值,ye [?,γ],γ为所述预定数量的企业,i e [ I,I ],I为所述预定个数的属性特征。3. 根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述基于 标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化 后的惩罚系数和优化后的核宽包括: 初始化灰狼参数,所述灰狼参数包括最大迭代次数T、灰狼个数M、惩罚系数C的搜索范 围[Cmin,C歷]和核宽γ的搜索范围[ymin,ymax]; 按如下公式设置每一只灰狼的位置Xm,并建立灰狼位置矩阵^£其中,Xml为灰狼m在当前位置时所述惩罚系数的值,Xm2为灰狼m在当前位置时所述核宽 的值[I,M],Xml G [ Cmin,Cmax ],Xm2 G γ min,γ max ]; 根据标准化后的所述经营数据计算灰狼的适应度,并按照所述适应度对灰狼进行排 序,更新灰狼位置得到更新后的灰狼位置矩阵^,完成一次灰狼优化迭代,并根据所述更新 后的灰狼位置矩阵i继续进行所述灰狼优化迭代,直到达到所述最大迭代次数τ为止,输出 当前灰狼位置矩阵?中头狼的位置,根据所述头狼的位置得到优化后的惩罚系数C和优化 后的核宽γ。4. 根据权利要求3所述的基于核极限学习机的风险预测的方法,其特征在于,所述根据 标准化后的所述经营数据计算灰狼的适应度,并按照所述适应度对灰狼进行排序,更新灰 狼位置得到更新后的灰狼位置矩阵?,完成一次灰狼优化迭代,并根据所述更新后的灰狼 位置矩阵?继续进行所述灰狼优化迭代,直到达到所述最大迭代次数T为止,输出当前灰狼 位置矩阵?中头狼的位置,根据所述头狼的位置得到优化后的惩罚系数C和优化后的核宽 γ包括: 计算所述每一只灰狼的适应度fm,所述适应度fm为基于Xm计算得到的所述核极限学习 机的准确度ACC,所述准确度ACC为基于标准化后的所述经营数据的K折交叉验证获取的平 均准确度,所述准确度ACC的计算公式为:其中,aCCk为第k折交叉验证的准确度,K为大于O的整数; 按照所述适应度对灰狼进行排序,得到具有最高适应度的灰狼α的位置?β、具有次高 适应度的灰狼邱勺位置i和适应度第三高的灰狼δ的位置; 按照如下公式分别计算所述灰狼α、所述灰狼β和所述灰狼S距离猎物的距离、? 和汐. 其中,C1、通过公式汐=2;1计算得到,?为[〇,ι]之间的随机数; 按照如下公式完成对灰狼位置矩阵?的更新:其中,4、為和為.通过公式I = 计算得到'为当前迭代次数,te [1,1'],^为[0,1]之间的随机数;如果所述当前迭代次数t尚未达到所述最大迭代次数T,则根据更新后的灰狼位置矩阵 ^继续进行灰狼优化迭代,直到所述当前迭代次数t达到所述最大迭代次数T为止; 输出灰狼α的位置Xa =( Xcil,Χα2 ),其中Xcil为优化后的惩罚系数C,Xa2为优化后的核宽γ。5. 根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述基于 所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型包括: 基于所述优化后的惩罚系数C和所述优化后的核宽γ,按照如下公式构建所述核极限 学习机的预涮樽型,K(s,sn)=exp(-y | |s-sn| |2) 其中,S为待测试样本,S1,…,SN为训练样本,N为预置的训练样本数,ηε[1,Ν],ΩΕυ^ 预置的符合Mercer定理构造的核矩阵。6. -种基于核极限学习机的风险预测的装置,其特征在于,包括: 数据获取模块,用于获取预定数量的企业的经营数据,所述经营数据包括预定个数的 属性特征的特征值; 标准化模块,用于对所述经营数据进行标准化; 灰狼优化模块,用于基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机 的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于 确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空 间到高维特征空间的非线性映射关系; 模型构建模块,用于基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限 学习机的预测模型; 预测模块,用于根据所述预测模型进行风险预测。7. 根据权利要求6所述的基于核极限学习机的风险预测的装置,其特征在于,所述标准 化模块包括: 标准化处理子模块,用于按如下公式对所述经营数据进行标准化:其中,sy[ i ] '为第y个企业的第i个属性特征标准化后的特征值,Sy[i ]为第y个企业的第 i个属性特征的特征值,s[i]max为所述预定数量的企业的第i个属性特征的最大值,s[i]min 为所述预定数量的企业的第i个属性特征的最小值,ye [1,Y],Y为所述预定数量的企业,i e [ I,I ],I为所述预定个数的属性特征。8. 根据权利要求6所述的基于核极限学习机的风险预测的装置,其特征在于,所述灰狼 优化模块包括: 初始化子模块,用于初始化灰狼参数,所述灰狼参数包括最大迭代次数T、灰狼个数M、 惩罚系数C的搜索范围[Cmin,Cmax]和核宽γ的搜索范围[ymin,; 位置设置子模块,用于按如下公式设置每一只灰狼的位置Xm,并建立灰狼位置矩阵 Xm - ( Xml,Xm2 )其中,Xml为灰狼m在当前位置时所述惩罚系数的值,Xm2为灰狼m在当前位置时所述核宽 的值[I,M],Xml G [ Cmin,Cmax ],Xm2 G γ min,γ max ]; 优化迭代子模块,用于根据标准化后的所述经营数据计算灰狼的适应度,并按照所述 适应度对灰狼进行排序,更新灰狼位置得到更新后的灰狼位置矩阵?,完成一次灰狼优化 迭代,并根据所述更新后的灰狼位置矩阵i继续进行所述灰狼优化迭代,直到达到所述最 大迭代次数T为止,输出当前灰狼位置矩阵}中头狼的位置,根据所述头狼的位置得到优化 后的惩罚系数C和优化后的核宽γ。9.根据权利要求8所述的基于核极限学习机的风险预测的装置,其特征在于,所述优化 迭代子模块,还用于: 计算所述每一只灰狼的适应度fm,所述适应度fm为基于Xm计算得到的所述核极限学习 机的准确度ACC,所述准确度ACC为基于标准化后的所述经营数据的K折交叉验证获取的平 均准确度,所述准确度ACC的计算公式为:其中,acck为第k折交叉验证的准确度,K为大于O的整数; 按照所述适应度对灰狼进行排序,得到具有最高适应度的灰狼α的位置具有次高 适应度的灰狼邱勺位置/#和适应度第三高的灰狼δ的位置; 按照如下公式分别计算所述灰狼α、所述灰狼β和所述灰狼S距离猎物的距离 和爲:::其中,4、在和Q通过公式5=2/^计算得到,?为[〇,1]之间的随机数; 按照如下公式完成对灰狼位置矩阵?的更新:其中,4、為和為.通过公式J = 计算得到,:为当前迭代次数,tG [1,1'],€为[0,1]之间的随机数; 如果所述当前迭代次数t尚未达到所述最大迭代次数T,则根据更新后的灰狼位置矩阵 ?继续进行灰狼优化迭代,直到所述当前迭代次数t达到所述最大迭代次数T为止; 输出灰狼α的位置Xa =( Xal,Χα2 ),其中Xcil为优化后的惩罚系数C,Xa2为优化后的核宽γ。10.根据权利要求6所述的基于核极限学习机的风险预测的装置,其特征在于,所述模 型构建模块包括: 预测模型构建子模块,用于基于所述优化后的惩罚系数C和所述优化后的核宽γ,按照 如下公式构建所述核极限学习机的预测模型:K(s,sn)=exp(-y | |s-sn| Γ) 其中,S为待测试样本,S1,…,SN为训练样本,N为预置的训练样本数,ηε[1,Ν],ΩΕυ^ 预置的符合Mercer定理构造的核矩阵。
【文档编号】G06Q10/04GK106022517SQ201610326839
【公开日】2016年10月12日
【申请日】2016年5月17日
【发明人】陈慧灵, 赵学华, 王名镜, 童长飞, 蔡振闹, 李俊, 沈立明, 王科杰, 朱彬磊
【申请人】温州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1