债券ETF的构建方法、装置及计算机可读存储介质与流程

文档序号:16434457发布日期:2018-12-28 20:23阅读:118来源:国知局
债券ETF的构建方法、装置及计算机可读存储介质与流程

本发明涉及数据处理技术领域,尤其涉及一种债券etf的构建方法、装置及计算机可读存储介质。

背景技术

交易型开放式指数基金(exchangetradedfunds),简称etf,是一种在交易所上市交易的、基金份额可变的开放式基金。按标的资产不同,etf分为股票etf、债券etf等,目前国内市场上,股票etf较多,债券etf存在着巨大的空白,而且现有的债券etf基本是国债为主的债券etf,信用债etf非常匮乏,因此,市场上为了推动债券etf研发,填补市场空白,开发信用债etf就有了现实的需求。

这就需要一种针对信用债的债券etf构建方案,实现对该信用债的债券指数的跟踪,但是由于目前的市场上的债券etf的构建方案主要是针对国债设计的,并不适用于信用债,因此,目前亟需能够适用于信用债的债券etf构建方案。



技术实现要素:

本发明提供一种债券etf的构建方法、装置及计算机可读存储介质,其主要目的在于解决现有技术中没有适用于信用债的债券etf的构建方案的技术问题。

为实现上述目的,本发明还提供一种债券etf的构建方法,该方法包括:

确定作为跟踪标的的市场指数,按照预设的筛选规则从所述市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券;

获取所述样本债券在目标时间区间内的交易收益数据;

确定所述样本债券的初始权重,以及初始下降步长和预设停止条件;

根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重;

按照计算得到的权重组合所述样本债券,构成与所述目标时间区间对应的债券etf。

可选地,所述确定所述样本债券的初始权重的步骤包括:

确定所述目标时间区间的前一个时间区间的债券etf中的样本债券以及各个样本债券的权重;

判断前一个时间区间的样本债券与本次筛选出的样本债券是否相同;

若相同,则将前一个时间区间的债券etf中的样本债券的权重对应地作为本次筛选出的样本债券的初始权重;

若不相同,则在本次筛选出的样本债券多于前一个时间区间的样本债券数量时,将新增的样本债券的初始权重赋值为零,在本次筛选出的样本债券的数量等于前一个时间区间的样本债券数量且有样本债券被替换时,将被替换的样本债券的权重赋值给替换后的样本债券,在本次筛选出的样本债券少于前一个时间区间的样本债券数量时,将被剔除的样本债券权重分配给剩下的样本债券。

可选地,所述交易收益数据为所述样本债券在交易日的收盘价数据,所述根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重的步骤包括:

确定所述收益偏差二次规划模型的函数表达式,并对所述函数表达式进行变换以构造随机梯度下降算法的目标函数,所述目标函数的自变量为样本债券的权重;

将所述收盘价数据转换为对数收益率数据;

根据所述初始权重、所述初始下降步长,以及所述对数收益率数据,按照随机梯度下降算法对所述目标函数进行迭代计算,直至迭代计算的结果满足所述预设停止条件,得到所述样本债券的权重。

可选地,在按照随机梯度下降算法对所述目标函数进行迭代计算的过程中,按照预设规则和初始下降步长动态调整下降步长。

可选地,所述确定作为跟踪标的的市场指数,按照预设的筛选规则从所述市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券的步骤包括:

确定作为跟踪标的的市场指数,获取所述市场指数的成分券在所述目标时间区间内的久期数据,根据获取的久期数据和预设的久期区间将成分券分为多组债券;

获取成分券在所述目标时间区间内抽样因子对应的数据,并根据获取的抽样因子对应的数据和预设的评分规则对各组债券中的成分券进行评分,其中,抽样因子包括凸性、久期、累计成交量和发行规模;

确定各组债券的抽样数量;

根据各组债券中成分券的评分和抽样数量从各组债券中抽取样本债券。

此外,为实现上述目的,本发明还提供一种债券etf的构建装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的etf构建程序,所述etf构建程序被所述处理器执行时实现如下步骤:

确定作为跟踪标的的市场指数,按照预设的筛选规则从所述市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券;

获取所述样本债券在目标时间区间内的交易收益数据;

确定所述样本债券的初始权重,以及初始下降步长和预设停止条件;

根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重;

按照计算得到的权重组合所述样本债券,构成与所述目标时间区间对应的债券etf。

可选地,所述确定所述样本债券的初始权重的步骤包括:

确定所述目标时间区间的前一个时间区间的债券etf中的样本债券以及各个样本债券的权重;

判断前一个时间区间的样本债券与本次筛选出的样本债券是否相同;

若相同,则将前一个时间区间的债券etf中的样本债券的权重对应地作为本次筛选出的样本债券的初始权重;

若不相同,则在本次筛选出的样本债券多于前一个时间区间的样本债券数量时,将新增的样本债券的初始权重赋值为零,在本次筛选出的样本债券的数量等于前一个时间区间的样本债券数量且有样本债券被替换时,将被替换的样本债券的权重赋值给替换后的样本债券,在本次筛选出的样本债券少于前一个时间区间的样本债券数量时,将被剔除的样本债券权重分配给剩下的样本债券。

可选地,所述交易收益数据为所述样本债券在交易日的收盘价数据,所述根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重的步骤包括:

确定所述收益偏差二次规划模型的函数表达式,并对所述函数表达式进行变换以构造随机梯度下降算法的目标函数,所述目标函数的自变量为样本债券的权重;

将所述收盘价数据转换为对数收益率数据;

根据所述初始权重、所述初始下降步长,以及所述对数收益率数据,按照随机梯度下降算法对所述目标函数进行迭代计算,直至迭代计算的结果满足所述预设停止条件,得到所述样本债券的权重。

可选地,在按照随机梯度下降算法对所述目标函数进行迭代计算的过程中,按照预设规则和初始下降步长动态调整下降步长。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有etf构建程序,所述etf构建程序可被一个或者多个处理器执行,以实现如上所述的债券etf的构建方法的步骤。

本发明提出的债券etf的构建方法、装置及计算机可读存储介质,确定作为跟踪标的的市场指数,按照预设的筛选规则从市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券;获取样本债券在目标时间区间内的交易收益数据;确定样本债券的初始权重,以及初始下降步长和预设停止条件;根据初始权重、初始下降步长、预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到样本债券的权重;按照计算得到的权重组合所述样本债券,构成与目标时间对应的债券etf。本发明的方案一种新的债券复制逻辑,从市场指数的成分券中筛选出样本债券,并且通过随机梯度下降算法为样本债券分配合适的权重,通过计算的权重组合样本债券作为单市场债券etf,解决了现有技术中没有适用于信用债的债券etf的构建方案的技术问题。

附图说明

图1为本发明一实施例提供的债券etf的构建方法的流程示意图;

图2为本发明一实施例提供的债券etf的构建装置的内部结构示意图;

图3为本发明一实施例提供的债券etf的构建装置中etf构建程序的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种债券etf的构建方法。参照图1所示,为本发明一实施例提供的债券etf的构建方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。

在本实施例中,债券etf的构建方法包括:

步骤s10,确定作为跟踪标的的市场指数,按照预设的筛选规则从所述市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券。

本发明实施例中作为跟踪标的的市场指数可以是上证综指、沪深300等指数,本实施例中以上证综指为例,从该市场指数的成分券中抽取出一定数量的样本债券作为跟踪复制的对象,建立债券etf。具体地,从成分券中选择样本债券的步骤包括:

确定作为跟踪标的的市场指数,获取所述市场指数的成分券在所述目标时间区间内的久期数据,根据获取的久期数据和预设的久期区间将成分券分为多组债券;

获取成分券在所述目标时间区间内抽样因子对应的数据,并根据获取的抽样因子对应的数据和预设的评分规则对各组债券中的成分券进行评分,其中,抽样因子包括凸性、久期、累计成交量和发行规模;

确定各组债券的抽样数量;

根据各组债券中成分券的评分和抽样数量从各组债券中抽取样本债券。

从预设数据库中获取上证综指的成分股,在本实施例中,以一个月作为一个时间区间,获取这些成分券在一个月内的久期数据,根据获取的久期数据和预设的久期区间将成分券分为多组债券,其中,预设的久期区间是用户预先设置的、用于对成分券分组的依据。

以下内容以2016年12月作为目标时间区间,以这个月的数据示例。获取2016年12月1日到2016年12月31日中所有指数成分券在交易日的日度久期数据,该数据为修正久期,来源中证指数公司,采用算术平均计算方法对每只债券计算月度平均久期,根据月度平均久期将所有的成分券分为修正久期分别为0-3年、3-6年、6-9年、9年以上,共四个分组。

关于抽样因子的设置,本实施例中将债券凸性、债券久期、月度累计成交量以及债券发行规模作为抽样因子,在其他实施例中也可以增加其他的因素作为抽样因子。从数据库中获取每组债券中成分券的上述抽样因子在2016年12月的数据,即成分券的凸性、久期数据、发行规模数据和月度累计成交量数据。接下来根据这些数据和预设的评分规则对各组债券中的成分券进行评分。

具体地,在一实施例中,获取成分券在所述目标时间区间内抽样因子对应的数据,并根据获取的抽样因子对应的数据和预设的评分规则对各组债券中的成分券进行评分的步骤可以包括如下细化步骤:

获取成分券在所述目标时间区间内抽样因子对应的数据;分别按照各抽样因子对应的预设评分规则对各抽样因子对应的数据进行评分,得到各抽样因子对应的评分;根据各抽样因子对应的评分以及各抽样因子的预设占比,计算第一评分的加权平均分数,将所述加权评分分数作为成分券的评分。

各抽样因子的预设占比可以根据各抽样因子的重要程度来设置,例如,在一实施例中,凸性因子分配的权重是15%,月度累计成交量因子的权重为50%,债券久期因子和债券发行规模因子的权重分别为20%和15%。针对每个债券分组,分别按照上述三个抽样因子对应的评分规则对分组内的成分券进行评分,根据评分结果以及各个抽样因子的占比,对每个债券的三个评分值进行加权求和,作为最终的评分。其中,评分规则可以由用户根据需要设置。以凸性因子为例,将400只指数成分券按凸性大小对进行排序,凸性越大,排名越靠前,排名分为4挡,第一档是排名前15%,分值10分;第二档是排名15%-40%,分值8分;第三档是排名40%-70%,分值6分;第四档是排名最后30%,分值4分。关于修正久期、发行规模和月度累计成交量的评分规则,可以参照上述修正久期的评分规则设置类似的评分规则,在此不再赘述,其中,同一个分组内,发行规模越大,分数越高;月度累计成交量越大,分数越高;对于修正久期来说,同一个分组内,修正久期越短,分数越高。

对于每组债券来说,按照各个抽样因子的评分规则对成分券进行评分,可以分别得到四个评分,按照各个抽样因子的预设权重进行加权求和,将求和结果作为最终评分。将各组债券中的成分券按照最终评分由高至低的顺序排序。

预先设置好单市场债券etf的目标复制率以及各组债券的复制比例。假设目标复制率为20%,修正久期为0-3年的债券分组的复制比例为50.94%,修正久期为3-6年的债券分组的复制比例为40.57%,修正久期为6-9年的债券分组的复制比例为7.55%,修正久期为9年以上的债券分组的复制比例为0.94%。上述各组债券的复制比例为各个分组债券中要抽选出的样本债券的数量占抽样债券总数的比例。根据目标复制率以及各组债券的复制比例可以计算得到每组债券中要抽选出的样本债券的数量在该组债券的成分券总数中所占的比例。根据分组结果可以确定每组债券中成分券的总数量,再结合每组债券中要抽选出的样本债券的数量在该组债券的成分券总数中所占的比例,可以计算出各组债券的抽样数量。

根据各组债券中成分券的评分,选择每个分组中评分最高的数量等于计算出的抽样数量的成分券作为样本债券,即用于构建债券etf的标的券。

步骤s20,获取所述样本债券在目标时间区间内的交易收益数据。

获取样本债券在目标时间区间内每个交易日的收盘价数据,并将收盘价数据转换为对数收益率数据。

步骤s30,确定所述样本债券的初始权重,以及初始下降步长和预设停止条件。

确定所述样本债券的初始权重的步骤包括:

确定所述目标时间区间的前一个时间区间的债券etf中的样本债券以及各个样本债券的权重;

判断前一个时间区间的样本债券与本次筛选出的样本债券是否相同;

若相同,则将前一个时间区间的债券etf中的样本债券的权重对应地作为本次筛选出的样本债券的初始权重;

若不相同,则在本次筛选出的样本债券多于前一个时间区间的样本债券数量时,将新增的样本债券的初始权重赋值为零,在本次筛选出的样本债券的数量等于前一个时间区间的样本债券数量且有样本债券被替换时,将被替换的样本债券的权重赋值给替换后的样本债券,在本次筛选出的样本债券少于前一个时间区间的样本债券数量时,将被剔除的样本债券权重分配给剩下的样本债券。

可以理解的是,在建仓时,可以按照[0,1]均匀分布给出各样本债券的初始权重,在债券etf后续每次调仓时,初始值的选择基于上一个月的最优权重,可以降低计算难度;并且从上个月的最优权重出发,可以规避掉重复计算,因为有些底层资产的权重比较稳定。具体地,如果本月筛选出的样本债券数量和上个月相同,那么初始权重就是上个月的初始权重;如果本月样本债券数量多于上个月,那么原有样本债券对应的权重保持不变,新增加的样本债券初始权重为0;如果上月样本债券在本月初被剔除,其对应的权重被赋值给新增的替换样本债券;如果本月样本债券数量少于上月样本债券,则被剔除的样本债券权重之和被均分给剩下的样本债券,例如,上个月有20个券,本月符合筛选条件的只有16个,被剔除的4个债券的权重之和为16%,那么16%/16=1%,其余每个券权重增加1%。

初始梯度下降步长γ0的选择方式如下:γ0=1/m,m为样本债券的数量。

步骤s40,根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重。

具体地,该步骤包括如下细化步骤:

确定所述收益偏差二次规划模型的函数表达式,并对所述函数表达式进行变换以构造随机梯度下降算法的目标函数,所述目标函数的自变量为样本债券的权重;

将所述收盘价数据转换为对数收益率数据;

根据所述初始权重、所述初始下降步长,以及所述对数收益率数据,按照随机梯度下降算法对所述目标函数进行迭代计算,直至迭代计算的结果满足所述预设停止条件,得到所述样本债券的权重。

在抽取出样本债券之后,采用收益偏差二次规划模型计算各个样本债券的最优权重,其中,收益偏差二次规划模型的函数表达式如下:

其中,qi为月初建仓时债券i的建仓数量,也是这个二次规划问题的求解对象,通过计算找出每个月初建仓时最优的建仓数量,即债券i在债券组合中的最优权重。n为一个时间区间内的交易日的总数量,在本实施例中,为月度内交易日的总数量,m为筛选出的样本券的总数量。

进一步地,该方案中,为了提高计算机处理数据的效率,同时避免求解绝对数量的参数解,求得更加准确的权重数值,对上述函数表达式进行等价变换,变换过程如下:

同理:

上述转换中,

经过上述转换,将原来的二次规划求解问题由求绝对数量的参数变成求解相对数量的参数,可以将上述函数表达式转换为如下函数表达式:

其中,ωi为每月初建(调)仓时债券i的最优权重,为待求解的对象,对于所有样本债券来说,满足条件:上述函数表达式中,样本债券i的最优权重就是上述函数f(ωi)的值最小时的ωi

接下来为了使用随机梯度下降算法对收益偏差二次规划模型求解,通过以下步骤对上述函数表达式f(ωi)进行变换构建随机梯度下降算法的目标函数f。

首先,定义

根据对数收益率的计算公式rt=lngt-lngt-1,将上述函数表达式f(ωi)转换为用对数收益率表达的函数f,其中,t为n个交易日中的第t个交易日,rt为第t个交易日的对数收益率:

其中,rt为作为跟踪标的的市场指数的在交易日t的数值,可以根据市场指数的计算公式计算得到。上述函数即为跟踪误差的表达式,同时也是随机梯度下降算法的目标函数。

随机梯度下降算法的迭代过程表示为:

目标函数f的梯度如下:

其中,

k是指第k次迭代。

停止条件为:μ为预设阈值,且μ>0。

根据样本债券的初始权重、随机梯度下降算法的初始下降步长以及获取到的对数收益率数据计算梯度然后进行第一次的权重迭代:

计算目标函数以及

根据得到的结果重复执行上述计算梯度、权重迭代以及计算目标函数的过程,直至达到计算得到的目标函数满足如下停止条件:

其中,预设阈值μ的取值范围为10-6~10-8,预设阈值的取值范围由用户根据本方案的实际应用情况进行选择。在完成迭代计算后,目标函数达到最小值,即跟踪误差最小,此时的(ω1,ω2,…,ωm)即为各个样本债券的最优权重。在迭代计算的过程中可以按照如下公式动态调整梯度下降步长γ:

其中,ε是来自于0-1均匀分布的随机抽样数,可以使用蒙特·卡罗方法来实现。

本实施的求解最优权重的方案中,采用随机梯度下降算法来求解样本券的最优权重,对etf基金动态跟踪指数提供了可控的误差优化方法,并且结合被动型基金的特点,对随机梯度下降算法中的初始权重分配方式进行优化,节省了计算资源,同时在迭代计算的过程中动态调整下降步长,缩短运行时间,提高计算速度。

步骤s50,按照计算得到的权重组合所述样本债券,构成与所述目标时间区间对应的债券etf。

在2017年1月初建仓时,将2016年12月作为目标时间区间,根据这个月的数据筛选出符合条件的样本债券构成2017年1月的持仓篮子,按照上述步骤计算出各个样本债券的最优权重,按照计算出的最优权重组合持仓篮子中的样本债券构成2017年1月度的单市场债券etf。

进一步地,由于在月度之间可能存在调仓的变动,因此,每个月度的月初可以根据上个月的交易情况进行一次调仓,建立新的持仓篮子,并重新计算篮子中各个样本债券的权重,构建该月度新的单市场债券etf。

本实施例提出的债券etf的构建方法,确定作为跟踪标的的市场指数,按照预设的筛选规则从市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券;获取样本债券在目标时间区间内的交易收益数据;确定样本债券的初始权重,以及初始下降步长和预设停止条件;根据初始权重、初始下降步长、预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到样本债券的权重;按照计算得到的权重组合所述样本债券,构成与目标时间对应的债券etf。本发明的方案一种新的债券复制逻辑,从市场指数的成分券中筛选出样本债券,并且通过随机梯度下降算法为样本债券分配合适的权重,通过计算的权重组合样本债券作为单市场债券etf,解决了现有技术中没有适用于信用债的债券etf的构建方案的技术问题。

本发明还提供一种债券etf的构建装置。参照图2所示,为本发明一实施例提供的债券etf的构建装置的内部结构示意图。

在本实施例中,债券etf的构建装置1可以是pc(personalcomputer,个人电脑),也可以是智能手机、平板电脑、便携计算机等终端设备。该债券etf的构建装置1至少包括存储器11、处理器12,网络接口13以及通信总线。

其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是债券etf的构建装置1的内部存储单元,例如该债券etf的构建装置1的硬盘。存储器11在另一些实施例中也可以是债券etf的构建装置1的外部存储设备,例如债券etf的构建装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括债券etf的构建装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于债券etf的构建装置1的应用软件及各类数据,例如etf构建程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行etf构建程序01等。

网络接口13可选的可以包括标准的有线接口、无线接口(如wi-fi接口),通常用于在该装置1与其他电子设备之间建立通信连接。

通信总线用于实现这些组件之间的连接通信。

可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在债券etf的构建装置1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-13以及etf构建程序01的债券etf的构建装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对债券etf的构建装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

在图2所示的装置1实施例中,存储器11中存储有etf构建程序01;处理器12执行存储器11中存储的etf构建程序01时实现如下步骤:

确定作为跟踪标的的市场指数,按照预设的筛选规则从所述市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券。

获取所述样本债券在目标时间区间内的交易收益数据;

确定所述样本债券的初始权重,以及初始下降步长和预设停止条件;

根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重;

按照计算得到的权重组合所述样本债券,构成与所述目标时间区间对应的债券etf。

本发明实施例中作为跟踪标的的市场指数可以是上证综指、沪深300等指数,本实施例中以上证综指为例,从该市场指数的成分券中抽取出一定数量的样本债券作为跟踪复制的对象,建立债券etf。具体地,从成分券中选择样本债券的步骤包括:

确定作为跟踪标的的市场指数,获取所述市场指数的成分券在所述目标时间区间内的久期数据,根据获取的久期数据和预设的久期区间将成分券分为多组债券;

获取成分券在所述目标时间区间内抽样因子对应的数据,并根据获取的抽样因子对应的数据和预设的评分规则对各组债券中的成分券进行评分,其中,抽样因子包括凸性、久期、累计成交量和发行规模;

确定各组债券的抽样数量;

根据各组债券中成分券的评分和抽样数量从各组债券中抽取样本债券。

从预设数据库中获取上证综指的成分股,在本实施例中,以一个月作为一个时间区间,获取这些成分券在一个月内的久期数据,根据获取的久期数据和预设的久期区间将成分券分为多组债券,其中,预设的久期区间是用户预先设置的、用于对成分券分组的依据。

以下内容以2016年12月作为目标时间区间,以这个月的数据示例。获取2016年12月1日到2016年12月31日中所有指数成分券在交易日的日度久期数据,该数据为修正久期,来源中证指数公司,采用算术平均计算方法对每只债券计算月度平均久期,根据月度平均久期将所有的成分券分为修正久期分别为0-3年、3-6年、6-9年、9年以上,共四个分组。

关于抽样因子的设置,本实施例中将债券凸性、债券久期、月度累计成交量以及债券发行规模作为抽样因子,在其他实施例中也可以增加其他的因素作为抽样因子。从数据库中获取每组债券中成分券的上述抽样因子在2016年12月的数据,即成分券的凸性、久期数据、发行规模数据和月度累计成交量数据。接下来根据这些数据和预设的评分规则对各组债券中的成分券进行评分。

具体地,在一实施例中,获取成分券在所述目标时间区间内抽样因子对应的数据,并根据获取的抽样因子对应的数据和预设的评分规则对各组债券中的成分券进行评分的步骤可以包括如下细化步骤:

获取成分券在所述目标时间区间内抽样因子对应的数据;分别按照各抽样因子对应的预设评分规则对各抽样因子对应的数据进行评分,得到各抽样因子对应的评分;根据各抽样因子对应的评分以及各抽样因子的预设占比,计算第一评分的加权平均分数,将所述加权评分分数作为成分券的评分。

各抽样因子的预设占比可以根据各抽样因子的重要程度来设置,例如,在一实施例中,凸性因子分配的权重是15%,月度累计成交量因子的权重为50%,债券久期因子和债券发行规模因子的权重分别为20%和15%。针对每个债券分组,分别按照上述三个抽样因子对应的评分规则对分组内的成分券进行评分,根据评分结果以及各个抽样因子的占比,对每个债券的三个评分值进行加权求和,作为最终的评分。其中,评分规则可以由用户根据需要设置。以凸性因子为例,将400只指数成分券按凸性大小对进行排序,凸性越大,排名越靠前,排名分为4挡,第一档是排名前15%,分值10分;第二档是排名15%-40%,分值8分;第三档是排名40%-70%,分值6分;第四档是排名最后30%,分值4分。关于修正久期、发行规模和月度累计成交量的评分规则,可以参照上述修正久期的评分规则设置类似的评分规则,在此不再赘述,其中,同一个分组内,发行规模越大,分数越高;月度累计成交量越大,分数越高;对于修正久期来说,同一个分组内,修正久期越短,分数越高。

对于每组债券来说,按照各个抽样因子的评分规则对成分券进行评分,可以分别得到四个评分,按照各个抽样因子的预设权重进行加权求和,将求和结果作为最终评分。将各组债券中的成分券按照最终评分由高至低的顺序排序。

预先设置好单市场债券etf的目标复制率以及各组债券的复制比例。假设目标复制率为20%,修正久期为0-3年的债券分组的复制比例为50.94%,修正久期为3-6年的债券分组的复制比例为40.57%,修正久期为6-9年的债券分组的复制比例为7.55%,修正久期为9年以上的债券分组的复制比例为0.94%。上述各组债券的复制比例为各个分组债券中要抽选出的样本债券的数量占抽样债券总数的比例。根据目标复制率以及各组债券的复制比例可以计算得到每组债券中要抽选出的样本债券的数量在该组债券的成分券总数中所占的比例。根据分组结果可以确定每组债券中成分券的总数量,再结合每组债券中要抽选出的样本债券的数量在该组债券的成分券总数中所占的比例,可以计算出各组债券的抽样数量。

根据各组债券中成分券的评分,选择每个分组中评分最高的数量等于计算出的抽样数量的成分券作为样本债券,即用于构建债券etf的标的券。

获取样本债券在目标时间区间内每个交易日的收盘价数据,并将收盘价数据转换为对数收益率数据。

确定所述样本债券的初始权重的步骤包括:

确定所述目标时间区间的前一个时间区间的债券etf中的样本债券以及各个样本债券的权重;

判断前一个时间区间的样本债券与本次筛选出的样本债券是否相同;

若相同,则将前一个时间区间的债券etf中的样本债券的权重对应地作为本次筛选出的样本债券的初始权重;

若不相同,则在本次筛选出的样本债券多于前一个时间区间的样本债券数量时,将新增的样本债券的初始权重赋值为零,在本次筛选出的样本债券的数量等于前一个时间区间的样本债券数量且有样本债券被替换时,将被替换的样本债券的权重赋值给替换后的样本债券,在本次筛选出的样本债券少于前一个时间区间的样本债券数量时,将被剔除的样本债券权重分配给剩下的样本债券。

可以理解的是,在建仓时,可以按照[0,1]均匀分布给出各样本债券的初始权重,在债券etf后续每次调仓时,初始值的选择基于上一个月的最优权重,可以降低计算难度;并且从上个月的最优权重出发,可以规避掉重复计算,因为有些底层资产的权重比较稳定。具体地,如果本月筛选出的样本债券数量和上个月相同,那么初始权重就是上个月的初始权重;如果本月样本债券数量多于上个月,那么原有样本债券对应的权重保持不变,新增加的样本债券初始权重为0;如果上月样本债券在本月初被剔除,其对应的权重被赋值给新增的替换样本债券;如果本月样本债券数量少于上月样本债券,则被剔除的样本债券权重之和被均分给剩下的样本债券,例如,上个月有20个券,本月符合筛选条件的只有16个,被剔除的4个债券的权重之和为16%,那么16%/16=1%,其余每个券权重增加1%。

初始梯度下降步长γ0的选择方式如下:γ0=1/m,m为样本债券的数量。

具体地,根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重的步骤包括如下细化步骤:

确定所述收益偏差二次规划模型的函数表达式,并对所述函数表达式进行变换以构造随机梯度下降算法的目标函数,所述目标函数的自变量为样本债券的权重;

将所述收盘价数据转换为对数收益率数据;

根据所述初始权重、所述初始下降步长,以及所述对数收益率数据,按照随机梯度下降算法对所述目标函数进行迭代计算,直至迭代计算的结果满足所述预设停止条件,得到所述样本债券的权重。

在抽取出样本债券之后,采用收益偏差二次规划模型计算各个样本债券的最优权重,其中,收益偏差二次规划模型的函数表达式如下:

其中,qi为月初建仓时债券i的建仓数量,也是这个二次规划问题的求解对象,通过计算找出每个月初建仓时最优的建仓数量,即债券i在债券组合中的最优权重。n为一个时间区间内的交易日的总数量,在本实施例中,为月度内交易日的总数量,m为筛选出的样本券的总数量。

进一步地,该方案中,为了提高计算机处理数据的效率,同时避免求解绝对数量的参数解,求得更加准确的权重数值,对上述函数表达式进行等价变换,变换过程如下:

同理:

上述转换中,

经过上述转换,将原来的二次规划求解问题由求绝对数量的参数变成求解相对数量的参数,可以将上述函数表达式转换为如下函数表达式:

其中,ωi为每月初建(调)仓时债券i的最优权重,为待求解的对象,对于所有样本债券来说,满足条件:上述函数表达式中,样本债券i的最优权重就是上述函数f(ωi)的值最小时的ωi

接下来为了使用随机梯度下降算法对收益偏差二次规划模型求解,通过以下步骤对上述函数表达式f(ωi)进行变换构建随机梯度下降算法的目标函数f。

首先,定义

根据对数收益率的计算公式rt=lngt-lngt-1,将上述函数表达式f(ωi)转换为用对数收益率表达的函数f,其中,t为n个交易日中的第t个交易日,rt为第t个交易日的对数收益率:

其中,rt为作为跟踪标的的市场指数的在交易日t的数值,可以根据市场指数的计算公式计算得到。上述函数即为跟踪误差的表达式,同时也是随机梯度下降算法的目标函数。

随机梯度下降算法的迭代过程表示为:

目标函数f的梯度如下:

其中,

k是指第k次迭代。

停止条件为:μ为预设阈值,且μ>0。

根据样本债券的初始权重、随机梯度下降算法的初始下降步长以及获取到的对数收益率数据计算梯度然后进行第一次的权重迭代:

计算目标函数以及

根据得到的结果重复执行上述计算梯度、权重迭代以及计算目标函数的过程,直至达到计算得到的目标函数满足如下停止条件:

其中,预设阈值μ的取值范围为10-6~10-8,预设阈值的取值范围由用户根据本方案的实际应用情况进行选择。在完成迭代计算后,目标函数达到最小值,即跟踪误差最小,此时的(ω1,ω2,…,ωm)即为各个样本债券的最优权重。在迭代计算的过程中可以按照如下公式动态调整梯度下降步长γ:

其中,ε是来自于0-1均匀分布的随机抽样数,可以使用蒙特·卡罗方法来实现。

本实施的求解最优权重的方案中,采用随机梯度下降算法来求解样本券的最优权重,对etf基金动态跟踪指数提供了可控的误差优化方法,并且结合被动型基金的特点,对随机梯度下降算法中的初始权重分配方式进行优化,节省了计算资源,同时在迭代计算的过程中动态调整下降步长,缩短运行时间,提高计算速度。

在2017年1月初建仓时,将2016年12月作为目标时间区间,根据这个月的数据筛选出符合条件的样本债券构成2017年1月的持仓篮子,按照上述步骤计算出各个样本债券的最优权重,按照计算出的最优权重组合持仓篮子中的样本债券构成2017年1月度的单市场债券etf。

进一步地,由于在月度之间可能存在调仓的变动,因此,每个月度的月初可以根据上个月的交易情况进行一次调仓,建立新的持仓篮子,并重新计算篮子中各个样本债券的权重,构建该月度新的单市场债券etf。

本实施例提出的债券etf的构建装置,确定作为跟踪标的的市场指数,按照预设的筛选规则从市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券;获取样本债券在目标时间区间内的交易收益数据;确定样本债券的初始权重,以及初始下降步长和预设停止条件;根据初始权重、初始下降步长、预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到样本债券的权重;按照计算得到的权重组合所述样本债券,构成与目标时间对应的债券etf。本发明的方案一种新的债券复制逻辑,从市场指数的成分券中筛选出样本债券,并且通过随机梯度下降算法为样本债券分配合适的权重,通过计算的权重组合样本债券作为单市场债券etf,解决了现有技术中没有适用于信用债的债券etf的构建方案的技术问题。

可选地,在其他的实施例中,etf构建程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述etf构建程序在债券etf的构建装置中的执行过程。

例如,参照图3所示,为本发明债券etf的构建装置一实施例中的etf构建程序的程序模块示意图,该实施例中,etf构建程序可以被分割为模块样本筛选10、数据获取模块20、初始值确定模块30、权重分配模块40和债券组合模块50,示例性地:

样本筛选模块10用于:确定作为跟踪标的的市场指数,按照预设的筛选规则从所述市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券;

数据获取模块20用于:获取所述样本债券在目标时间区间内的交易收益数据;

初始值确定模块30用于:确定所述样本债券的初始权重,以及初始下降步长和预设停止条件;

权重分配模块40用于:根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重;

债券组合模块50用于:按照计算得到的权重组合所述样本债券,构成与所述目标时间区间对应的债券etf。

上述样本筛选10、数据获取模块20、初始值确定模块30、权重分配模块40和债券组合模块50等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有etf构建程序,所述etf构建程序可被一个或多个处理器执行,以实现如下操作:

确定作为跟踪标的的市场指数,按照预设的筛选规则从所述市场指数的成分券中筛选出符合预设条件的多个成分券作为样本债券;

获取所述样本债券在目标时间区间内的交易收益数据;

确定所述样本债券的初始权重,以及初始下降步长和预设停止条件;

根据所述初始权重、所述初始下降步长、所述预设停止条件以及获取的交易收益数据,按照随机梯度下降算法求解预先构建的收益偏差二次规划模型,得到所述样本债券的权重;

按照计算得到的权重组合所述样本债券,构成与所述目标时间区间对应的债券etf。

本发明计算机可读存储介质具体实施方式与上述债券etf的构建装置和方法各实施例基本相同,在此不作累述。

需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1