高频数据的波动率获取方法、装置及计算机可读存储介质与流程

文档序号:17069492发布日期:2019-03-08 23:11阅读:280来源:国知局
高频数据的波动率获取方法、装置及计算机可读存储介质与流程

本发明涉及计算机技术领域,尤其涉及一种高频数据的波动率获取方法、装置及计算机可读存储介质。



背景技术:

随着信息技术的进步和数据粒度的微型化,高频交易数据无疑成为各专业机构竟相掘矿的对象,因为日内的高频数据往往蕴含着丰富的信息,但是尚未得到充分的开采。业界对于高频数据的波动率,多采用的是rv(realizedvolatility,实际波动率)模型进行刻画,主要原因在于rv计算简便,可操作性强,对于无噪声或者噪声较小的环境,rv依概率收敛到iv(integratedvolatility,累积波动率);但是,更为现实的环境是,高频数据的噪声是普遍存在的,在这种情况下,现有的rv模型无法将连续波动率和跳跃波动率区分开来,因此也就无法把内在价值信息和噪音区分开来,导致获取到的股票日内波动率数据由于受到噪声的影响而准确度低。



技术实现要素:

本发明提供一种高频数据的波动率获取方法、装置及计算机可读存储介质,其主要目的在于解决现有技术中获取的股票高频数据日内波动率数据准确度低的技术问题。

为实现上述目的,本发明还提供一种高频数据的波动率获取方法,该方法包括:

获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;

根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率;

根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率;

基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据;

根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。

可选地,所述根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率的步骤包括:

将全市场的个股按照市值由高至低的顺序进行排序;

计算排名为前三分之一的个股构成的高市值股票组合的分钟级别的第一市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低市值股票组合的分钟级别的第二市值加权平均对数收益率;

将所述第一市值加权平均对数收益率与所述第二市值加权平均对数收益率之差作为所述市值因子收益率。

可选地,所述方法还包括如下步骤:

重复执行所述获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据至所述根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的日内波动率的步骤,以计算全市场个股在预设交易日之前的连续多个交易日的日内波动率,并计算所述连续多个交易日的日内波动率的均值;

获取所述预设交易日的收益率数据,并根据全市场个股在所述连续多个交易日的日内波动率的均值和所述预设交易日的收益率数据,计算个股日内波动率与次日收益率之间的皮尔森相关系数;

若所述皮尔森相关系数为负值且绝对值大于预设阈值,则将所述日内波动率作为选股因子进行选股。

可选地,所述将所述日内波动率作为选股因子进行选股的步骤包括:

按照个股的在所述预设周期内的平均日内波动率由小至大的顺序对全市场的个股进行排序,将排名最前的预设数量的个股作为优选个股。

可选地,所述已实现双幂次变差模型的计算公式如下:

其中,rbvi表示个股i在一个交易日内的已实现双幂次变差,εi为个股i在该交易日内的残差数据,n为该交易日内残差数据的个数。

此外,为实现上述目的,本发明还提供一种高频数据的波动率获取装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的波动率获取程序,所述波动率获取程序被所述处理器执行时实现如下步骤:

获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;

根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率;

根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率;

基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据;

根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。

可选地,所述根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率的步骤包括:

将全市场的个股按照市值由高至低的顺序进行排序;

计算排名为前三分之一的个股构成的高市值股票组合的分钟级别的第一市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低市值股票组合的分钟级别的第二市值加权平均对数收益率;

将所述第一市值加权平均对数收益率与所述第二市值加权平均对数收益率之差作为所述市值因子收益率。

可选地,所述波动率获取程序还可被所述处理器执行,以实现如下步骤:

重复执行所述获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据至所述根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的日内波动率的步骤,以计算全市场个股在预设交易日之前的连续多个交易日的日内波动率,并计算所述连续多个交易日的日内波动率的均值;

获取所述预设交易日的收益率数据,并根据全市场个股在所述连续多个交易日的日内波动率的均值和所述预设交易日的收益率数据,计算个股日内波动率与次日收益率之间的皮尔森相关系数;

若所述皮尔森相关系数为负值且绝对值大于预设阈值,则将所述日内波动率作为选股因子进行选股。

可选地,所述已实现双幂次变差模型的计算公式如下:

其中,rbvi表示个股i在一个交易日内的已实现双幂次变差,εi为个股i在该交易日内的残差数据,n为该交易日内残差数据的个数。

此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有波动率获取程序,所述波动率获取程序可被一个或者多个处理器执行,以实现如上所述的高频数据的波动率获取方法的步骤。

本发明提出的高频数据的波动率获取方法、装置及计算机可读存储介质,获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;根据个股的分钟级别的收益率数据和市值计算市值因子收益率;根据个股的分钟级别的收益率数据和账面市值比计算账面市值比因子收益率;基于个股在一个交易日内的市场收益率、市值因子收益率和账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取目标股票的在交易日内的残差数据;根据残差数据和已实现双幂次变差模型,计算个股在交易日内的已实现双幂次变差,将已实现双幂次变差作为个股在该交易日内的日内波动率。本发明的方案,首先根据fama-french三因子模型获取残差数据,该残差数据是排除了fama-french三因子模型中三个因子的影响后,个股独有的收益率部分,将这部分数据作为计算个股日内特有的波动率的数据基础,通过已实现双幂次变差模型,剔除日内高频噪声,消除了已实现波动率和实际波动率之间的偏差,获取到准确度高的股票日内波动率数据。

附图说明

图1为本发明一实施例提供的高频数据的波动率获取方法的流程示意图;

图2为本发明一实施例提供的高频数据的波动率获取装置的内部结构示意图;

图3为本发明一实施例提供的高频数据的波动率获取装置中波动率获取程序的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明提供一种高频数据的波动率获取方法。参照图1所示,为本发明一实施例提供的高频数据的波动率获取方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。

在本实施例中,高频数据的波动率获取方法包括:

步骤s10,获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据。

步骤s20,根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率。

步骤s30,根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率。

步骤s40,基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据。

该方案通过个股在一个交易日的高频数据,即分钟级别的交易数据,以及市值和账面市值比等数据,计算得到个股的市场收益率、市值因子收益率和账面市值比因子收益率三个因子,并代入fama-french三因子模型进行回归处理,计算得到日内残差数据,根据日内残差数据和已实现双幂次变差模型计算得到个股的日内波动率。

具体地,获取个股在一个交易日内的n分钟收盘价数据,并按照如下公式计算得到该个股的n分钟对数收益率:

rt=lnpt-lnpt-1

以n=2为例,一个交易日内有240分钟,则可以得到120个2分钟级别的收盘价数据,rt为个股从时间点t-1到时间点t的2分钟级别的对数收益率,pt为个股在时间点t的收盘价,pt-1为成分股在时间点t-1的收盘价。

假设该个股为某市场指数的成分股,例如,市场指数为沪深300,则可以按照同样的方式,可以计算该市场指数的n分钟级别对数收益率,用以代表市场收益率。

其中,市值因子收益率的计算方式如下:

将全市场的个股按照市值由高至低的顺序进行排序;

计算排名为前三分之一的个股构成的高市值股票组合的n分钟级别的第一市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低市值股票组合的n分钟级别的第二市值加权平均对数收益率;

将所述第一市值加权平均对数收益率与所述第二市值加权平均对数收益率之差作为所述市值因子收益率。

其中,对于高市值股票组合或者低市值股票组合,其市值加权平均对数收益率均可以按照如下公式计算:

其中,ri是个股i的对数收益率,为个股i在组合中的市值占比,vi为个股i的市值,其中,k为组合中个股的数量。

账面市值比因子收益率的计算方式如下:

将全市场的个股按照账面市值比由高至低的顺序进行排序;

计算排名为前三分之一的个股构成的高账面市值比股票组合的n分钟级别的第三市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低账面市值比组合的n分钟级别的第四市值加权平均对数收益率;

将所述第三市值加权平均对数收益率与所述第四市值加权平均对数收益率之差作为所述账面市值比因子收益率。

账面市值比因子收益率的计算方式原理上与市值因子收益率的计算方式相同,区别在于:在对个股进行排序是按照账面市值比由高至低的顺序进行排序。其中,账面市值比由个股的权益净值除以市值得到。

接下来,将计算得到的一个交易日的市场收益率、市值因子收益率和账面市值比因子收益率,代入到fama-french三因子模型中,进行回归处理,提取残差。其中,fama-french三因子模型的公式如下:

ri=a+brl+ce(smb)+de(hmi)+εi

ri代表个股n分钟级别的对数收益率,rl为市场指数的n分钟级别的对数收益率,e(smb)和e(hmi)分别为市值因子收益率和账面市值比因子收益率,a、b、c、d为参数,εi为个股i的n分钟级对数收益率的残差,对一个交易日内的数据回归处理后得到的残差数据的个数为n。

步骤s50,根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。

将上述残差数据代入到已实现双幂次变差模型中,计算个股在该交易日内的日内特有波动率。计算公式如下:

其中,rbvi表示个股i在一个交易日内的已实现双幂次变差,εi为个股n分钟级对数收益率残差,n为日内回归得到的残差个数。

进一步地,根据计算得到的日内波动率,统计一段时间的日内波动率均值与次日的收益率之间的相关性。具体地,在步骤s50之后,该方法还可以包括如下步骤:

重复执行步骤s10至步骤s50,以计算全市场个股在预设交易日之前的连续多个交易日的日内波动率,并计算所述连续多个交易日的日内波动率的均值;

获取所述预设交易日的收益率数据,并根据全市场个股在所述连续多个交易日的日内波动率的均值和所述预设交易日的收益率数据,计算个股日内波动率与次日收益率之间的皮尔森相关系数,此处,预设交易日为连续多个交易日的次日,个股日内波动率与次日收益率之间的皮尔森相关系数,即为个股在连续多个交易日的日内波动率的均值与预设交易日的收益率之间的皮尔文相关系数;

若所述皮尔森相关系数为负值且绝对值大于预设阈值,则将所述日内波动率作为选股因子进行选股。

具体地,所述将所述日内波动率作为选股因子进行选股的步骤包括:

按照个股的在所述预设周期内的平均日内波动率由小至大的顺序对全市场的个股进行排序,将排名最前的预设数量的个股作为优选个股。

其中,皮尔森相关系数的计算方式如下:

xi为个股i的日内波动率的平均值,yi为股票i的次日收益率。m为全市场的个股数量。

若计算得到的皮尔森相关系数为负数,则说明日内特有波动率越小,股票未来收益率就越大,因此,通过挖掘出高频交易数据的有用信息,从而可以形成一个有效的选股因子。当皮尔森相关系数的绝对值越接近于1,则说明个股日内波动率与次日收益率之间的相关程度越高,因此,可以预先设置预设阈值,例如,预设阈值=0.8,若皮尔森相关系数为负值且绝对值大于该预设阈值,则可以将日内波动率作为一个有效的选股因子。

此外,需要说明的是,在实际应用中分析相关性时,由于需要大量的数据进行回测,因此,需要使用较多的历史交易日的对数收益率数据,对日内波动率进行滚动计算,以及对预设周期内的日内波动率的均值和次日收益率之间的皮尔森相关系数进行滚动计算。

本实施例提出的高频数据的波动率获取方法,获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;根据个股的分钟级别的收益率数据和市值计算市值因子收益率;根据个股的分钟级别的收益率数据和账面市值比计算账面市值比因子收益率;基于个股在一个交易日内的市场收益率、市值因子收益率和账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取目标股票的在交易日内的残差数据;根据残差数据和已实现双幂次变差模型,计算个股在交易日内的已实现双幂次变差,将已实现双幂次变差作为个股在该交易日内的日内波动率。本发明的方案,首先根据fama-french三因子模型获取残差数据,该残差数据是排除了fama-french三因子模型中三个因子的影响后,个股独有的收益率部分,将这部分数据作为计算个股日内特有的波动率的数据基础,通过已实现双幂次变差模型,剔除日内高频噪声,消除了已实现波动率和实际波动率之间的偏差,获取到准确度高的股票日内波动率数据。

本发明还提供一种高频数据的波动率获取装置。参照图2所示,为本发明一实施例提供的高频数据的波动率获取装置的内部结构示意图。

在本实施例中,高频数据的波动率获取装置1可以是pc(personalcomputer,个人电脑),也可以是智能手机、平板电脑、便携计算机等终端设备。该高频数据的波动率获取装置1至少包括存储器11、处理器12,网络接口13以及通信总线。

其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是高频数据的波动率获取装置1的内部存储单元,例如该高频数据的波动率获取装置1的硬盘。存储器11在另一些实施例中也可以是高频数据的波动率获取装置1的外部存储设备,例如高频数据的波动率获取装置1上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,存储器11还可以既包括高频数据的波动率获取装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于高频数据的波动率获取装置1的应用软件及各类数据,例如波动率获取程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器11中存储的程序代码或处理数据,例如执行波动率获取程序01等。

网络接口13可选的可以包括标准的有线接口、无线接口(如wi-fi接口),通常用于在该装置1与其他电子设备之间建立通信连接。

通信总线用于实现这些组件之间的连接通信。

可选地,该装置1还可以包括用户接口,用户接口可以包括显示器(display)、输入单元比如键盘(keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在高频数据的波动率获取装置1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-13以及波动率获取程序01的高频数据的波动率获取装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对高频数据的波动率获取装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

在图2所示的装置1实施例中,存储器11中存储有波动率获取程序01;处理器12执行存储器11中存储的波动率获取程序01时实现如下步骤:

获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据。

根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率。

根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率。

基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据。

根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。

该方案通过个股在一个交易日的高频数据,即分钟级别的交易数据,以及市值和账面市值比等数据,计算得到个股的市场收益率、市值因子收益率和账面市值比因子收益率三个因子,并代入fama-french三因子模型进行回归处理,计算得到日内残差数据,根据日内残差数据和已实现双幂次变差模型计算得到个股的日内波动率。

具体地,获取个股在一个交易日内的n分钟收盘价数据,并按照如下公式计算得到该个股的n分钟对数收益率:

rt=lnpt-lnpt-1

以n=2为例,一个交易日内有240分钟,则可以得到120个2分钟级别的收盘价数据,rt为个股从时间点t-1到时间点t的2分钟级别的对数收益率,pt为个股在时间点t的收盘价,pt-1为成分股在时间点t-1的收盘价。

假设该个股为某市场指数的成分股,例如,市场指数为沪深300,则可以按照同样的方式,可以计算该市场指数的n分钟级别对数收益率,用以代表市场收益率。

其中,市值因子收益率的计算方式如下:

将全市场的个股按照市值由高至低的顺序进行排序;

计算排名为前三分之一的个股构成的高市值股票组合的n分钟级别的第一市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低市值股票组合的n分钟级别的第二市值加权平均对数收益率;

将所述第一市值加权平均对数收益率与所述第二市值加权平均对数收益率之差作为所述市值因子收益率。

其中,对于高市值股票组合或者低市值股票组合,其市值加权平均对数收益率均可以按照如下公式计算:

其中,ri是个股i的对数收益率,为个股i在组合中的市值占比,vi为个股i的市值,其中,k为组合中个股的数量。

账面市值比因子收益率的计算方式如下:

将全市场的个股按照账面市值比由高至低的顺序进行排序;

计算排名为前三分之一的个股构成的高账面市值比股票组合的n分钟级别的第三市值加权平均对数收益率,并计算排名为后三分之一的个股构成的低账面市值比组合的n分钟级别的第四市值加权平均对数收益率;

将所述第三市值加权平均对数收益率与所述第四市值加权平均对数收益率之差作为所述账面市值比因子收益率。

账面市值比因子收益率的计算方式原理上与市值因子收益率的计算方式相同,区别在于:在对个股进行排序是按照账面市值比由高至低的顺序进行排序。其中,账面市值比由个股的权益净值除以市值得到。

接下来,将计算得到的一个交易日的市场收益率、市值因子收益率和账面市值比因子收益率,代入到fama-french三因子模型中,进行回归处理,提取残差。其中,fama-french三因子模型的公式如下:

ri=a+brl+ce(smb)+de(hmi)+εi

ri代表个股n分钟级别的对数收益率,rl为市场指数的n分钟级别的对数收益率,e(smb)和e(hmi)分别为市值因子收益率和账面市值比因子收益率,a、b、c、d为参数,εi为个股i的n分钟级对数收益率的残差,对一个交易日内的数据回归处理后得到的残差数据的个数为n。

将上述残差数据代入到已实现双幂次变差模型中,计算个股在该交易日内的日内特有波动率。计算公式如下:

其中,rbvi表示个股i在一个交易日内的已实现双幂次变差,εi为个股n分钟级对数收益率残差,n为日内回归得到的残差个数。

进一步地,根据计算得到的日内波动率,统计一段时间的日内波动率均值与次日的收益率之间的相关性。具体地,在步骤s50之后,该方法还可以包括如下步骤:

重复执行所述获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据至所述根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的日内波动率的步骤,以计算全市场个股在预设交易日之前的连续多个交易日的日内波动率,并计算所述连续多个交易日的日内波动率的均值;

获取所述预设交易日的收益率数据,并根据全市场个股在所述连续多个交易日的日内波动率的均值和所述预设交易日的收益率数据,计算个股日内波动率与次日收益率之间的皮尔森相关系数,此处,预设交易日为连续多个交易日的次日,个股日内波动率与次日收益率之间的皮尔森相关系数,即为个股在连续多个交易日的日内波动率的均值与预设交易日的收益率之间的皮尔文相关系数;

若所述皮尔森相关系数为负值且绝对值大于预设阈值,则将所述日内波动率作为选股因子进行选股。

具体地,所述将所述日内波动率作为选股因子进行选股的步骤包括:

按照个股的在所述预设周期内的平均日内波动率由小至大的顺序对全市场的个股进行排序,将排名最前的预设数量的个股作为优选个股。

其中,皮尔森相关系数的计算方式如下:

xi为个股i的日内波动率的平均值,yi为股票i的次日收益率。m为全市场的个股数量。

若计算得到的皮尔森相关系数为负数,则说明日内特有波动率越小,股票未来收益率就越大,因此,通过挖掘出高频交易数据的有用信息,从而可以形成一个有效的选股因子。当皮尔森相关系数的绝对值越接近于1,则说明个股日内波动率与次日收益率之间的相关程度越高,因此,可以预先设置预设阈值,例如,预设阈值=0.8,若皮尔森相关系数为负值且绝对值大于该预设阈值,则可以将日内波动率作为一个有效的选股因子。

此外,需要说明的是,在实际应用中分析相关性时,由于需要大量的数据进行回测,因此,需要使用较多的历史交易日的对数收益率数据,对日内波动率进行滚动计算,以及对预设周期内的日内波动率的均值和次日收益率之间的皮尔森相关系数进行滚动计算。

本实施例提出的高频数据的波动率获取装置,获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;根据个股的分钟级别的收益率数据和市值计算市值因子收益率;根据个股的分钟级别的收益率数据和账面市值比计算账面市值比因子收益率;基于个股在一个交易日内的市场收益率、市值因子收益率和账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取目标股票的在交易日内的残差数据;根据残差数据和已实现双幂次变差模型,计算个股在交易日内的已实现双幂次变差,将已实现双幂次变差作为个股在该交易日内的日内波动率。本发明的方案,首先根据fama-french三因子模型获取残差数据,该残差数据是排除了fama-french三因子模型中三个因子的影响后,个股独有的收益率部分,将这部分数据作为计算个股日内特有的波动率的数据基础,通过已实现双幂次变差模型,剔除日内高频噪声,消除了已实现波动率和实际波动率之间的偏差,获取到准确度高的股票日内波动率数据。

可选地,在其他的实施例中,波动率获取程序01还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述波动率获取程序在高频数据的波动率获取装置中的执行过程。

例如,参照图3所示,为本发明高频数据的波动率获取装置一实施例中的波动率获取程序的程序模块示意图,该实施例中,波动率获取程序可以被分割为数据获取模块10、收益率计算模块20、残差计算模块30和波动率计算模块40,示例性地:

数据获取模块10用于:获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;

收益率计算模块20用于:根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率;

以及,根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率;

残差计算模块30用于:基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据;

波动率计算模块40用于:根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。

上述数据获取模块10、收益率计算模块20、残差计算模块30和波动率计算模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。

此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有波动率获取程序,所述波动率获取程序可被一个或多个处理器执行,以实现如下操作:

获取个股在一个交易日内的分钟级别的收益率数据、市值和账面市值比,并获取全市场的收益率数据;

根据所述个股的分钟级别的收益率数据和所述市值计算市值因子收益率;

根据所述个股的分钟级别的收益率数据和所述账面市值比计算账面市值比因子收益率;

基于所述个股在一个交易日内的市场收益率、所述市值因子收益率和所述账面市值比因子收益率,对fama-french三因子模型进行回归处理,获取所述目标股票在所述交易日内的残差数据;

根据所述残差数据和已实现双幂次变差模型,计算所述个股在所述交易日内的已实现双幂次变差,将所述已实现双幂次变差作为所述个股在该交易日内的日内波动率。

本发明计算机可读存储介质具体实施方式与上述高频数据的波动率获取装置和方法各实施例基本相同,在此不作累述。

需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1