本发明涉及机器学习领域,更具体的,涉及一种基于交替方向乘子准则的短期稀疏资产组合优化系统。
背景技术:
目前,在进行资产组合优化时,一般沿用公式(1)(2)。
设整个投资期共有n个交易期,所研究的金融市场共有d项资产可供配置。则设当前在第t期,记资产价格为一个d维非负向量
其中,两个向量的除法表示逐个元素相除。价比表示在前一期投入1单位的某项资产会在当期有多大产出。
相应地,一个资产组合向量表示在第t期的开始以何种比例将所有财富配置于各项资产中,显然它是在d维单纯型上的:
其中b(i)为向量b的第i个维度,表示第i个资产在整个资产组合中所占的权重。
记第t个交易期末的累计财富为st,则当期财富增长(或减少)的因子为
因此,短期资产组合优化问题可归结如下:为使最终累计财富最大,需要在每期期末找出一个合适的资产组合向量bt+1,使得下一期期末的累计财富尽量大。
现有技术中,一般先估计下一期的价比
olmar:b.li,s.c.h.hoi,d.sahoo,andz.y.liu,“movingaveragerever-sionstrategyforon-lineportfolioselection,”artificialintelligence,vol.222,pp.104–123,2015.
rmr:d.huang,j.zhou,b.li,s.c.h.hoi,ands.zhou,“robustmedianreversionstrategyforon-lineportfolioselection,”ieeetransactionsonknowledgeanddataengineering,vol.28,no.9,pp.2480–2493,sep.2016.
首先,olmar使用滑动平均数来估计
其中w为时间窗口宽度。因此,如果以该
而rmr则使用l1中位数来估计
估计出
其中,(·)+表示取正部,||·||表示欧氏范数。最后,为了获得合法的资产组合,还要把bt+1投影到单纯型上:
但是,上述现有技术在应用过程中存在着以下几个缺点:第一,没有完善的收益率计算模块,无法准确提取收益率信息。第二,不能生成稀疏的资产组合,无法把财富集中在少数几个具有良好增长潜力的资产上。第三,公式(6)中,当
技术实现要素:
为了解决现有技术投资收益仍然不够理想的不足,本发明提供了一种基于交替方向乘子准则的短期稀疏资产组合优化系统。
为实现以上发明目的,采用的技术方案是:
一种基于交替方向乘子准则的短期稀疏资产组合优化系统,包括数据输入模块、收益率计算模块、资产组合生成模块、标准化及输出模块;
所述的数据输入模块,用于采集历史资产价格数据并传输到收益率计算模块;
所述的收益率计算模块,用于对接收到的历史资产价格数据进行计算,获得广义对数收益率,并将其传输到资产组合生成模块;
所述的资产组合生成模块,用于对接收到的广义对数收益率以及所存储的历史资产组合,运用基于交替方向乘子准则的求解算法进行计算,获得稀疏的下一期资产组合,并将其传输至标准化及输出模块;
所述的标准化及输出模块,用于将接收到的下一期资产组合标准化为合法的资产组合,并进行输出;
优选的,所述收益率计算模块,用于提取一个时间窗口内的最高价格,并转化为广义对数收益率,具体如下:
设整个投资期共有n个交易期,所研究的金融市场共有d项资产可供配置,则设当前在第t期,记资产价格为一个d维非负向量
其中,两个向量的除法表示逐个元素相除,价比表示在前一期投入1单位的某项资产会在当期有多大产出;
一个资产组合向量表示在第t期的开始以何种比例将所有财富配置于各项资产中,它是在d维单纯型δd上的:
其中b(i)为向量b的第i个维度,表示第i个资产在整个资产组合中所占的权重,再提取宽度为w的最近的一个时间窗口内的资产最高价格如下:
定义如下的广义对数收益率:
其中,
优选的,资产组合生成模块的目的是要计算下一期的资产组合bt+1,首先须建立一个资产组合优化模型,其包含的资产组合优化模型同时引入一个关于资产组合b的l1正则化项和一个“自融资”项,具体如下:
从盈利的角度看,一个投资策略应该最大化
(5)式所描述的模型即为所述资产组合生成模块所使用的资产组合优化模型,其中,λ>0用来控制正则化的力度,
优选的,由于(5)式所描述的资产组合优化模型带有限制项
其中,g为用于逼近b的、与b交替迭代的向量,ρ为拉格朗日乘子,γ>0用来控制g逼近b的程度,η>0用来控制当
下面给出l(b,g,ρ)具有鞍点的证明,首先,要证对任意给定的ρ,下列等式成立:
下面等式是显而易见的:
在上述不等式的3个项都取
此外,因为
下一步,检查下面两个函数:
其中,
为著名的huber函数,它是连续的且严格凸的;(10)式的h(b)为huber向量函数,它也是连续的且严格凸的;
反观(9)式,l(b,ρ)是以下问题的拉格朗日函数:
显然,
接下来需要找到鞍点对应的g*;从(10)式可看到g是由b所决定的,因此g*是h(b*)的最小化向量;它就是软收缩算子:
其中,sign和abs分别为符号函数和绝对值函数,它们的输出是向量,(·)+为正部运算符,即把所有的负分量映射为0,
l(b*,g*,ρ)=l(b*,ρ)≤l(b*,ρ*)=l(b*,g*,ρ*)(15)
再由(13)的第二个不等式和(7)(9)两式可得:
结合(15)(16)两式,可证得(b*,g*,ρ*)为拉格朗日函数l(b,g,ρ)的鞍点。
优选的,所述资产组合生成模块,包含一种“主-对偶”算法,围绕着鞍点的存在性依次迭代b,g,ρ三个变量,从主函数以及对偶函数两个方向同时优化,具体如下:
初始化:
重复迭代:
①
②
③
④o=o+1
直到:
标准化并输出:
在上述算法过程中,i表示单位矩阵,其维度由上下文可以推测出来(在这里是d×d维),
与现有技术相比,本发明的有益效果是:
本发明提供的资产组合优化系统,能生成稀疏的资产组合,把财富集中在一小部分具有良好增长潜力的资产上,以此来最大化整个投资期的最终财富;本发明包含一种新的具有鞍点的拉格朗日函数,以及基于交替方向乘子准则的求解算法,能同时处理l1正则化项和“自融资”项;本发明获得更高的投资收益,能承受一定的交易费损耗,而且运行迅速,适用于真实世界的金融环境。
附图说明
图1为本系统的框架图。
图2为本发明提供的方法与olmar和rmr在nyse(o)、nyse(n)、djia、sp500和tse资产配置标准测试数据集上的最终累计财富数值。
图3为本发明所产生的资产组合效果图。
图4为本发明提供的方法与olmar和rmr在nyse(o)、nyse(n)、djia、sp500和tse资产配置标准测试数据集上的夏普比率(sharperatio)数值。
图5为本发明提供的方法(sspo)与olmar和rmr在不同的交易费率之下,在nyse(o)、nyse(n)、djia、sp500和tse资产配置标准测试数据集上的最终累计财富数值。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
以下结合附图和实施例对本发明做进一步的阐述。
实施例1
一种基于交替方向乘子准则的短期稀疏资产组合优化系统,包括数据输入模块、收益率计算模块、资产组合生成模块、标准化及输出模块;
所述的数据输入模块,用于采集历史资产价格数据并传输到收益率计算模块;
所述的收益率计算模块,用于对接收到的历史资产价格数据进行计算,获得广义对数收益率,并将其传输到资产组合生成模块;
所述的资产组合生成模块,用于对接收到的广义对数收益率以及所存储的历史资产组合,运用基于交替方向乘子准则的求解算法进行计算,获得稀疏的下一期资产组合,并将其传输至标准化及输出模块;
所述的标准化及输出模块,用于将接收到的下一期资产组合标准化为合法的资产组合,并进行输出;
优选的,所述收益率计算模块,用于提取一个时间窗口内的最高价格,并转化为广义对数收益率,具体如下:
设整个投资期共有n个交易期,所研究的金融市场共有d项资产可供配置,则设当前在第t期,记资产价格为一个d维非负向量
其中,两个向量的除法表示逐个元素相除,价比表示在前一期投入1单位的某项资产会在当期有多大产出;
一个资产组合向量表示在第t期的开始以何种比例将所有财富配置于各项资产中,它是在d维单纯型δd上的:
其中b(i)为向量b的第i个维度,表示第i个资产在整个资产组合中所占的权重,
再提取宽度为w的最近的一个时间窗口内的资产最高价格如下:
定义如下的广义对数收益率:
其中,
优选的,资产组合生成模块的目的是要计算下一期的资产组合bt+1,首先须建立一个资产组合优化模型,其包含的资产组合优化模型同时引入一个关于资产组合b的l1正则化项和一个“自融资”项,具体如下:
从盈利的角度看,一个投资策略应该最大化
(5)式所描述的模型即为所述资产组合生成模块所使用的资产组合优化模型,其中,λ>0用来控制正则化的力度,
优选的,由于(5)式所描述的资产组合优化模型带有限制项
其中,g为用于逼近b的、与b交替迭代的向量,ρ为拉格朗日乘子,γ>0用来控制g逼近b的程度,η>0用来控制当
下面给出l(b,g,ρ)具有鞍点的证明,首先,要证对任意给定的ρ,下列等式成立:
下面等式是显而易见的:
在上述不等式的3个项都取
此外,因为
下一步,检查下面两个函数:
其中,
为著名的huber函数,它是连续的且严格凸的;(10)式的h(b)为huber向量函数,它也是连续的且严格凸的;
反观(9)式,l(b,ρ)是以下问题的拉格朗日函数:
显然,
接下来需要找到鞍点对应的g*;从(10)式可看到g是由b所决定的,因此g*是h(b*)的最小化向量;它就是软收缩算子:
其中,sign和abs分别为符号函数和绝对值函数,它们的输出是向量,(·)+为正部运算符,即把所有的负分量映射为0,
l(b*,g*,ρ)=l(b*,ρ)≤1(b*,ρ*)=l(b*,g*,ρ*)(15)
再由(13)的第二个不等式和(7)(9)两式可得:
结合(15)(16)两式,可证得(b*,g*,ρ*)为拉格朗日函数l(b,g,ρ)的鞍点。
优选的,所述资产组合生成模块,包含一种“主-对偶”算法,围绕着鞍点的存在性依次迭代b,g,ρ三个变量,从主函数以及对偶函数两个方向同时优化,具体如下:
初始化:
重复迭代:
①
②
③
④o=o+1
直到:
标准化并输出:
在上述算法过程中,i表示单位矩阵,其维度由上下文可以推测出来(在这里是d×d维),
本实施例采用具体数据进行了实验。设置本方法的参数为w=5,λ=0.5,γ=0.01,η=0.005,ζ=500,ε=10-4,最大迭代次数为104。然后使用本方法、olmar和rmr在nyse(o)、nyse(n)、djia、sp500和tse资产配置标准测试数据集上运行,所得的最终累计财富如图2所示。由图2可知,本发明提供的方法在5个数据集上均取得最高的最终累计财富,其中在nyse(o)、nyse(n)、djia和tse数据集上均较大程度地超越olmar和rmr这两种先进算法。
此外,本实施还随机抽取了标准测试数据集djia的6个交易日的资产组合用来展示,如图3所示。从上到下、从左到右依次为第2、33、450、276、127、98个交易日的资产组合。总共有30个资产,水平线为区分大权重(重仓资产)和小权重(轻仓资产)的分界线。本发明所产生的资产组合是稀疏的,而且集中在少数几个资产上。例如,在第一幅图中,财富主要集中在第29个资产上;在第二幅图中,财富主要集中在第18和第26个资产上。
同时,本实施还将本方法与olmar和rmr这两种先进算法在夏普比率(sharperatio)这一辅助性金融指标上进行比较。夏普比率是一种风险调整后的收益率指标,其计算公式如下:
其中,
此外,本实施还测量了本方法与olmar和rmr在承受一定交易费损耗的条件下所取得的最终累计财富,如图5所示。由图5可知,当交易费率从0增至0.5%时,本方法在所有数据集上均大幅领先于olmar和rmr,这表明本方法能承受一定的交易费损耗,适用于真实世界的金融环境。
本实施使用一台具有一个amda10-7800中央处理器和一块8gbddr31600mhz内存卡的计算机完成。在五个标准测试数据集上,计算一个资产组合所需的平均时间分别为:nyse(o)(0.0576秒),nyse(n)(0.0450秒),djia(0.0455秒),sp500(0.0449秒),tse(0.1190秒)。因此,本方法运行迅速,适用于真实世界的金融环境。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。