本发明属于金融大数据挖掘技术领域,具体涉及金融市场在线投资组合选择方法。
背景技术:
投资组合(portfolio)是指由金融机构或者投资者所持有的股票、债券、衍生金融产品等组成的集合,而投资组合选择(portfolioselection,简称ps)一般是指把现有财富在可投资资产中分配,以实现一定的长远目标,比如累计收益最大化或风险调整收益最大化。投资组合选择问题是非常切实的金融工程问题,构建投资组合的目的在于分散风险。1952年harrym.markowitz首次对该问题进行了研究,并提出了著名的均值方差分析方法以及有效边界模型。之后,kelly提出资本增长理论,受到了极大的关注。在此之后,许多学者提出了一系列投资组合选择策略用以分析证券市场,如追踪高收益策略、追踪低收益策略、模式匹配策略、元学习算法等等。
随着人工智能和机器学习理论的快速发展,在线投资组合策略的越来越受关注。1998年helrmbold以每期最大化收益为目标的同时,提出“保持历史投资组合策略”的在线投资组合策略,但是由于该策略最大化收益的极端追求,导致效果并不十分理想。之后学术界又提出以单周期倒数作为估计量来刻画市场的反转现象(pamr,passiveaggressivemeanreversion),即认为市场在当前期表现好的将在下一期表现差,反之当前期表现差的将在下一期表现好,并以被动主动在线学习方式进行组合向量的学习,这是将helrmbold的“极大化收益”,改为收益达到一定阈值前提下来“保持历史投资组合策略”,本质是一种“中庸”的思想,但是由于每次估计量依据是单期的信息,往往不能真实反应市场变化。此后,学术界提出以多周期的均值作为估计量来刻画市场(olmar,on-lineportfolioselectionwithmovingaveragereversion),到达较好的预期效果。近年,学术界提出的一种以l1-中位数作为估计量的在线投资组合策略(rmr,robustmedianreversion),该策略使用具有鲁棒性的空间中位数作为估计量。
pamr采用单周期的策略往往不符合真实市场关联特性,olmar和rmr对所用的历史收盘价一视同仁,等权分配,这种方法忽略了由于真实市场具有近期信息比过往信息的价值高这一基本特点。pamr、olmar容易受到噪音和异常值的影响,而rmr引入了l1-中位数,虽然一定程度上可以克服噪音和异常值,但在一些真实市场下还是不能准确预测,如在sp500数据集上表现反而不如olmar。
技术实现要素:
本发明的目的在于提供一种具有低时间复杂度和高预测准确度的金融市场在线投资组合选择方法。
本发明提出的金融市场在线投资组合选择方法,是一种基于高斯函数递减式加权的两次预测型被动主动在线学习投资组合选择方法,命名为gwr(gaussianweightingreversion)。
本发明的基本内容如下:
(1)为了更加合理地利用市场历史数据,对历史信息进行加权。加权方式为高斯函数单边递减加权;
(2)为了增强鲁棒性,更好地克服噪音和异常值,每期的最终预测值来源于两次初始预测的平均值;
(3)结合被动主动在线学习方法(pa,passiveaggressiveon-linelearningalgorithm),计算最终的投资组合向量。
具体来说,本发明提出的金融市场在线投资组合选择方法,首先,利用单边高斯函数对金融市场历史数据进行加权:每次预测,利用高斯函数的左半部分对历史数据进行加权,越早的信息对应的权值越低,越晚的信息对应的权值越高;本方法采用两次预测的策略:每次对第t+1期的预测值,通过两次初始预测:其一,基于以高斯函数对第t期及其之前的历史真实数据进行加权;其二,以高斯函数对第t-1期及其以前的真实数据和在第t-1期对第t期的预测值进行加权;平均两次的初始预测值获得对第t+1期的最终预测值;
最后,用该预测值进行被动主动在线学习,获得下一期的投资组合向量。
为方便表述,先介绍一下投资组合的形式化表示:
假设一个金融市场有d项资产。需要考虑连续n个交易期的投资策略。在第t个交易期,资产价格用收盘价向量
在第t个交易期的期初,根据求得的第t个交易期的投资组合向量
本发明提出的金融市场在线投资组合选择方法,每次针对下一期(设第t+1期)投资决策,分为计算预测值和在线学习投资组合向量两个部分:
(一)计算预测值
该预测值来源于两次经过高斯递减式加权的初始预测值。
先介绍高斯式递减具体过程:我们只用高斯函数的左边部分,该函数以t+1期为中心,公式如下:
其中τ是高斯函数参数。由于该函数随x减小将无限延伸,所以我们引入参数ε,当函数值小于该阈值时舍弃(说明此时市场信息权重占比例已经相对较小),由此容易求得加权的区间长度
第一个初始预测值是由截止到t期的历史真实数据的高斯递减式加权而得。计算公式如下:
第二个初始预测值来源于第t-1期对第t+1期的初始预测,公式如下:
对t+1期最终的预测向量为:
图2给出一个两次预测的示例。
(二)在线学习投资组合向量
然后根据求得的预测值
其中,
求得
最后,将bt+1映射到单纯型。
附图说明
图1为单边高斯函数递减式加权图。
图2为两次预测示例。
图3为各个算法受交易费用影响结果之比较。
具体实施方式
下面给出本发明方法的具体实施过程。每次预测下一期(设为第t+1期)分为两步,第一步是基于滑动高斯函数加权的两次预测,第二步是通过被动主动在线学习的方式确定投资组合向量。下面给出本方法的具体过程。
第一步:计算第t+1时期预测的相对价格,具体步骤如算法1所述。其中,步骤4是根据参数ε和τ计算当前高斯加权的窗口大小,步骤5是根据计算初始第一次预测值,步骤6计算初始第二次预测值,步骤7则是平均两次初始预测值,最后步骤8输出相对收盘价的预测值。
算法1gwr(p,ε,τ)
1.输入:收盘价p1,...pt,参数ε,τ
2.输出:预测相对价格
3.计算:
4.
5.
6.
7.
8.
第二步,根据第一步计算的的预测值,在线学习获得下一期的投资组合向量。具体步骤如算法2所述。其中,步骤5由拉格朗日乘数法扩展算法计算其算子,然后步骤7更新投资组合向量。由于此时的向量某些维度可能为负数,最后步骤8将该向量映射到单纯型。
算法
1.输入:预测相对价格
2.输出:bt+1
3.过程:
4.计算拉格朗日算子:
5.
6.更新投资组合向量:
7.
8.将bt+1映射到单纯型。
算法3则描述了利用本发明的方法计算n个交易期后的累计收益。其中,步骤4-6是初始化工作,我们开始投资组合向量默认为按均匀分布进行投资,初始累积财富值设置为1。步骤7循环n期的投资组合选择,
每期公布收盘价后,步骤9计算本期收益,步骤10、11通过我们的算法制定下一期的投资组合策略。
算法3基于高斯加权的投资组合选择
1.输入:市场价格序列
2.输出:n期结束后累计收益:sn
3.过程:
4.初始化:
5.fort=1,2,3,…,ndo
6.pt+1=pt·xt+1(注:此处为元素智能乘积)
7.fort=1,2,3,…,ndo
8.公布本次相对价格xt
9.计算本期收益st=bt·xt,累计获利:st=st-1*st
10.通过两次高斯递减式预测法计算相对价格估计值:
11.更新投资组合向量:
12.endfor。
图2给出一个简单的模拟例子。本期在第t期结束,准备投资第t+1期,红色曲线代表高斯权重曲线,黑色线为市场的收盘价,其中的倒三角点为上一期(第t-1期)对第t的初始预测值。例子中参数ε设定为0.1,τ设定为2.7,根据公式
本发明方法性能分析
用来自六组不同的真实市场数据进行验算,最后结果为累积收益,初始量设置为1。表1所示为六个通用的真实测试数据集。
表1:六个测试数据集
与现有的9中方法进行了性能测试比较,在6个测试集上各算法的累积收益如表2所示。其中,加粗的是各个算法中的最优结果。由表2可以看出,本方法(gwr)除了在djia中仅次于rmr(位居第二),其他都是位居第一,而且在nyse_o数据集下,远胜于第二名算法(rmr),其鲁棒性显而易见。
表2:各个算法累积收益对比表
本发明的特点是:根据市场信息“时间有效性”特点,即近期的市场信息往往比更早的信息更具有价值,以及金融产品历史价格变化规律,使用高斯函数对历史信息进行加权,并且采用两次预测的方式,每次对下一期的预测的最终值,来源于当前期对下一期的初始预测值和上一期对下一期的初始预测值的平均值,再通过被动主动在线学习算法,从而更准确地获得下次投资组合向量。通过多组真实市场结果验证,该算法不仅有很好的鲁棒性,能达到很好的收益效果,优于现有同类方法。而且,本方法具有较低的时间复杂度,适用于大规模的数据市场。本方法暂不考虑交易费用,最后由真实市场实验性地给出算法随交易费用的影响。图3给出本算法与同类算法受交易费用的对比。
本发明方法不仅具有较低的算法时间复杂度,适用于高频交易(highfrequencyrrading),而且具有很好的鲁棒性,在克服噪音和异常值影响上,优于同类方法。