一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法_3

文档序号:9598277阅读:来源:国知局
条件的线性规划问题,可以使用经典的单纯形法 进行求解,得到决策变量a i, a A (i = 1,2, . . .,T-1+1, T-1)及截距b。对于分位数 τ,(τ e (〇,l)),其最终的预测函数如下:
例如,外推预测测试期第一个样本在分位数τ =0.5的预测值,代入如下公式即可:
[0013] 为了测试本方法的实际预测效果,在测试集30个样本中检验模型的预测精度。选 取未进行集成经验模态分解,仅针对原始序列xt分别进行1-范数支持向量机分位数回归 预测和线性分位数回归预测两种方法作为对照试验。 在对照方法中,线性分位数回归预测与1-范数支持向量机分位数回归预测模型进行 预测建模的过程与本方法类似,都要经过时间序列的自相关分析、样本归一化和训练模型 建立预测函数。不同的是对照方法是对原始上证指数序列进行预测建模,而不是对经过集 成经验模态分解的各分解分量进行建模。另外,单独的1-范数支持向量机分位数回归预测 模型的设置与参数筛选与本方法相同。 由于本方法会分解出多个分解分量,正常的情况下在对每个分解分量使用1-范数支 持向量机分位数回归模型建模时都要对参数C,σ进行如表1中的筛选。为了简化说明,下 面对本方法进行实验时,不再对参数C, σ进行筛选,各分解分量的1-范数支持向量机分位 数回归预测模型参数统一设置为C= 10, 〇 =2。从最后的结果中可以看出,即使不经过模 型参数优化,本方法得出的结果都要显著优于对照方法。 评价的标准为分位数的非对称偏差函数,与之前网格法选参数时使用的评价方式相 似:
其中,ξ T 1+1^st为测试集第i个样本实际值yT 1+1低于预测值(χΤ 1+1)的残差, 测试集第i个样本为实际值^ 1+1高于预测值(χτ 1+1)的残差。Ttest代表测试集样本数量, 在上证指数的预测案例中,Ttest= 30。 例如,τ = 〇. 3时,
[0014] 表2本发明方法与其他两种传统方法在测试集内各分位数预测误差对比
从表2可以看出,这三种模型有着明显的优劣层次。其中,1-范数支持向量机分位数回 归方法的效果要优于线性的分位数回归模型,这表明该方法能够拟合上证指数的非线性特 征。最重要的是,无论从各个分位数的偏差还是平均偏差来看,本发明的基于集成经验模态 分解1-范数支持向量机分位数回归方法的测试偏差都优于单模型,这表明了本发明的优 越性。
【主权项】
1. 一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测 方法,其特征在于,该方法包括如下操作步骤: (1) 时间序列分解; 用示原始金融时间序列{x D X2,...,χτ},其中下标t表示时间,一共有T期:t = 1,2,…,T ;使用集成经验模态分解算法将^进行分解,得到N个本征模态函数序列c ]it,(j =1,2,...,N)和一个残值序列rt,分解结果用公式表示为:(2) 对各分解序列分别建立时间序列预测函数; 时间序列预测建模的本质是通过分析序列的历史值与其未来值的关系,建立函数关 系;用χt表示原始金融时间序列{x u X2,...,χτ},其中下标t表示时间,一共有T期:t = 1,2,…,T ;如建立预测函数xt= f(x t D xt 2,. . .,xt 1+1,xt (1〈T),其中1表示预测的滞后 期,通过自相关与偏相关分析,并由Schwarz最小化原则确定;用y;表示第i个训练样本的 因变量x 1+i,Xi表示第i个训练样本的自变量向量[X i, xi+1, . . .,xi+1 2, xi+i 1],则原始时间序 列(X1, χ2, · · ·,χτ}形成一组样本数量为 T-I 的训练集(Xi, y;),i = 1,2, · · ·,T-1+1, T-I ;对 于给定训练集(X1, Y1), (i = 1,2,. . .,T-1+1,T-1),使用1-范数支持向量机分位数回归模型 建立 Xi- yi在分位数 T,( τ e (〇, 1))的预测函数 f τ (Xi) = (Xi, Xi+1, . . .,Xi+1 2, Xi+1 i), 其具体方法为: 对于分位数τ e (〇, I),训练1-范数支持向量机分位数回归模型的本质是通过优化 参数〇1,€(1>>,(1 = 1,2,...,1'-1+1,1'-1),其中,€[1与€[1>>为当第1个样本点预测值小于 实际值或大于实际值时对应约束条件的拉格朗日因子;使如下目标函数最小化:并满足约束条件:其中,虚拟变量ξ i,ξ ^分别表示模型预测值小于实际值Y1和大 于实际值残差,b为待估截距,C为惩罚参数;Κ(·)为径向基核函数,对于任意一气,\, (t1; t2e [I, 2,..., T-l+1, T-I]):σ为径向基核函数的核宽度,一代表任意两个自变量的下标; 模型中的参数(:与σ对预测效果有重要影响,不同的时间序列可能有不同的最佳参数 组合;最佳参数组合通过网格法选取:在给定范围C,σ e [1,2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100],共有19 X 19组参数;对每组参数,分别使用1-范数非线性支持 向量机分位数回归模型建立预测函数,并根据预测函数对训练集上的数据进行预测;计算 预测值与实际值之间的预测误差,选取预测误差最小的一组参数组合作为最终参数;其中, 对于分位数τ,其预测误差为:此处,T-I代表训练样本个数,ξ litMin表示训练集第i个样本的实际值y i大于预测值的残差,表示训练集第i个样本的实际值71小于预测值:的残差:使用网格法确定好最佳参数C与σ后,该模型本质上是一个带线性约束条件的线性规 划问题,使用经典的单纯形法进行求解,得到决策变量a u α Λ (i = 1,2, . . .,Τ-1+1,Τ-1) 及截距b;对于分位数τ,(τ e (〇,1)),其最终的预测函数如下:使用1-范数支持向量机分位数回归模型对分解得到的Ν+1个序列,每个序列建立9组 分位数预测函数,即τ = 0. 1,0. 2,…,0. 9共9个分位数,共得到9 X (Ν+1)个预测函数; 用fy,(j = 1,2,...,Ν)表示分位数τ的第j个本征模态序列c]t的预测函数,f u表示 残差rt的预测函数; (3) 基于训练好的模型进行外推预测; 使用训练集训练该模型,分别得到N+1个分解序列的9个分位数的预测函数,共 9X (N+1)个;基于这些预测函数和各分解序列的历史值,得到各本征模态函数序列和残差 序列在T+1期的预测值,其预测函数如下:(4) 最后对分解序列的预测结果集成; 最后,将各分位数的每个分量预测结果进行加和集成,得到所有分位数最终的预测结 果:
【专利摘要】本发明属于金融风险管理领域,具体为一种基于集成经验模态分解和非线性分位数回归的时间序列概率分布预测方法。该发明首先对金融价格时间序列进行集成经验模态分解,得到不同尺度下,规律性更强的分量;其次,分别对各个分量使用1-范数支持向量机分位数回归预测,得到每个分量的所有分位数预测结果。第三步,以各分位数为统计目标,将每个分量的各分位数预测结果分别进行加和,集成得到各分位数预测结果,进而得到金融价格时间序列的概率分布预测。本发明提供的方法能有效预测金融价格的变动概率,并能够应用于金融风险管理和投资实践中。
【IPC分类】G06Q10/04, G06Q40/06
【公开号】CN105354644
【申请号】CN201510849963
【发明人】余乐安, 杨泽斌, 汤铃
【申请人】北京化工大学
【公开日】2016年2月24日
【申请日】2015年11月29日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1