一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法

文档序号:9598277阅读:635来源:国知局
一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法
【技术领域】
[0001] 本发明属于金融领域,具体涉及各种有价证券的价格、收益率的概率分布预测方 法。
【背景技术】
[0002] 金融时间序列,主要包括各种有价证券的价格、收益率等数据。尽管价格变动具有 很强的不确定性,但其变化之中总是蕴含着一些规律。比如,一些有经验的证券投资者可以 凭借技术指标,实现对价格的涨跌做出预测,并从中获利。发现这些规律,并将这些规律用 来预测价格的变动,对于帮助金融机构或普通投资者科学的管理风险,做出投资决策有着 重大的意义。
[0003] 金融时间序列往往具有非平稳和非线性的特征,传统的线性模型很难捕捉其中的 规律。目前常用的非线性时间序列预测模型有神经网络和支持向量机等模型,这些模型能 够很好地拟合时间序列的非线性特征,进而做出预测。虽然这些智能模型的预测精度比传 统模型的要高,但要将其预测的结果应用于决策还有一定的差距。而且,这些预测是对价格 的均值做出预测,缺少了对价格变动的各种可能性的描述,这不便于投资人进行风险控制。 分位数回归模型恰恰能够估计价格变动的分布情况,它通过计算一种非对称形式的绝对值 残差最小化函数,分别估计各个分位数的回归函数。分位数回归具有很多优点,但最重要 在于它能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的均 值。
[0004] 本发明结合集成经验模态分解和1-范数支持向量机分位数回归模型,预测金融 时间序列的变动分布情况。其中,集成经验模态分解用来将原始时间序列分解为规律性强 的分量,以提高预测精度;支持向量机分位数回归模型用来估计非线性时间序列各个分位 数的预测值。

【发明内容】

[0005] 本发明的目的在于针对原有金融时间序列的概率分布预测方法中存在的不足,提 供一种精度较高的预测方法,以辅助投资者进行风险管理和投资决策。
[0006] 时间序列预测建模的本质是通过分析序列的历史值与其未来值的关系,建立函数 关系。用xt表示已知原始金融时间序列,其中下标t表示时间,一共有T期:t = 1,2,…,T ; 如建立预测函数xt= f (X t D xt 2, . . .,xt 1+1,xt 1),(1〈T),其中1表示预测的滞后期,通过自 相关分析,并由Schwarz最小化原则确定。例如通过分析一个时间序列滞后期1为6,则使用 其t-1,t-2, . . .,t-6期的值作为自变量,来预测第t期的值。用yi表示第i个训练样本的因 变量x1+i,Xi表示第i个训练样本的自变量向量[X i, xi+1,. . .,xi+1 2, xi+1 J,则原始时间序列 {Xi, x2,. . .,χτ}可以形成一组样本数量为T-1 的训练集(Xi, y;),i = 1,2,. . .,T-1+1, T-1。对 于给定训练集(Xd 7丄(i = 1,2,. . .,T-l+1,T-l),使用1-范数支持向量机分位数回归模型 建立 Xi- yi在分位数 τ,( τ e (0, 1))的预测函数 f τ (Xi) = f\ (Xi, Xi+1, . . .,Xi+1 2, Xi+1 i)。
[0007] 该发明第一步对金融价格时间序列进行集成经验模态分解,得到不同尺度下,规 律性更强的N+1个分解序列;第二步,分别对各个分解序列进行1-范数支持向量机分位数 回归模型预测,得到每个序列的9个分位数τ =0.1,0.2,…,0.9的预测结果。第三步, 以各分解分量为单位,基于训练好的模型外推预测各分解序列未来在各分位数下的值。第 四步,将每个序列各个分位数预测结果分别进行加和,集成得到各分位数预测结果。
[0008] 所述预测方法的具体步骤如下: (1) 对原始时间序列进行集成经验模态分解; 用示原始金融时间序列{x Χ2,...,XT},其中下标t表示时间,一共有Τ期:t = 1,2,…,T ;使用集成经验模态分解算法将^进行分解,得到N个本征模态函数序列c & t,(j =1,2,. . .,N)和一个残值序列rt,分解结果用公式表示为:
(2) 对各分解序列分别建立时间序列预测函数; 时间序列预测建模的本质是通过分析序列的历史值与其未来值的关系,建立函数关 系。用Xt表示原始金融时间序列{x D X2, . . .,xd,如建立预测函数xt= f (X t 1,Xt 2, . . .,Xtl+1,xtl),(1〈T),其中1表示预测的滞后期,通过自相关分析,并由Schwarz最小化原则确 定。例如通过分析一个时间序列滞后期1为6,则使用其t-1,t-2,. . .,t-6期的值作为自 变量,来预测第t期的值。用yi表示第i个训练样本的因变量X 1+1,Xl表示第i个训练样 本的自变量向量[Xi, xi+1, . . .,xi+1 2, Xi+1 1],则原始时间序列{xi,X2, . . .,xj可以形成一组 样本数量为τ-I的训练集(Xl,yi),i = 1,2, · · ·,T-1+1,T-1。对于给定训练集(Xl,yi),(i =1,2,. . .,τ-l+l,τ-l),使用1-范数支持向量机分位数回归模型建立Xl- y 1在分位数 τ,( τ e (〇, 1))的预测函数 (Xi) = (Xi, xi+1, . . .,xi+1 2, xi+1 J,其具体方法为: 对于分位数τ e (〇,1),训练1-范数支持向量机分位数回归模型的本质是通过优化 参数〇1,€(1>>,(1 = 1,2,...,1'-1+1,1'-1),其中,€[1与€[1>>为当第1个样本点预测值小于 实际值或大于实际值时对应约束条件的拉格朗日因子。使如下目标函数最小化:
并满足约束条件:
其中,虚拟变量L,€分别表示模型预测值
小于实际值yi和大 于实际值残差,b为待估截距,C为惩罚参数。Κ(·)为径向基核函数,对于任意一组
σ为径向基核函数的核宽度,一代表任意两个自变量的下标。 模型中的参数(:与σ对预测效果有重要影响,不同的时间序列可能有不同的最佳参数 组合。最佳参数组合通过网格法选取:在给定范围C,σ e [1,2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30 ,40, 50, 60, 70, 80, 90, 100],共有19 X 19组参数。对每组参数,分别使用1-范数非线性支 持向量机分位数回归模型建立预测函数,并根据预测函数对训练集上的数据进行预测。计 算预测值与实际值之间的预测误差,选取预测误差最小的一组参数组合作为最终参数。其 中,对于分位数τ,其预测误差为:
此处,Τ-1代表训练样本个数,ξ litMin表示训练集第i个样本的实际值y i大于预测值 免=Λ(χ;.)的残差,表示训练集第i个样本的实际值小于预测值λ =Λ(χ,)的残差:
使用网格法确定好最佳参数C与σ后,该模型本质上是一个带线性约束条件 的线性规划问题,可以使用经典的单纯形法进行求解,得到决策变量<^,α Λ (i = 1,2, . . .,Τ-1+1,Τ-1)及截距b。对于分位数τ,( τ e (〇, 1)),其最终的预测函数如下:
使用1-范数支持向量机分位数回归模型对分解得到的N+1个序列,每个序列建立9组 分位数预测函数,即τ = 0. 1,0. 2,…,0. 9共9个分位数,共得到9 X (N+1)个预测函数。 用,,(j = 1,2, . . .,Ν)表示分位数τ的第j个本征模态函数序列c]it的预测函数,f y 表示残差匕的预测函数。 (3) 基于训练好的模型进行外推预测。 使用训练集训练该模型,分别得到N+1个分解序列的
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1