多层次数据系统中数据指标变化趋势的监测方法和装置与流程

文档序号:24487884发布日期:2021-03-30 21:12阅读:114来源:国知局
多层次数据系统中数据指标变化趋势的监测方法和装置与流程
本申请涉及数据处理
技术领域
,尤其涉及一种多层次数据系统中数据指标变化趋势的监测方法、装置、计算机设备和可读存储介质。
背景技术
:多层次数据系统在日常研究中较为常见,其包括不同层次的数据,例如在针对行业分析的多层次数据系统中,行业所在的层次是中观层次,向下一层的层次是具体的公司所在的微观层次,向上一层是国家经济运行状况所在的宏观层次。再如针对各地的空气质量情况研究的多层次数据系统中,小到每个区县、大到每个城市都有空气质量情况,城市的空气质量情况相对于其下的区县空气质量情况属于高层次,区县空气质量情况相应属于低层次。通常,对于多层次数据系统,包括宏观层次、中观层次和微观层次,相对于宏观层次与微观层次而言,中观层次指的是多层次数据系统的中间层次,这个中间层次在系统中起着承上启下的作用,中观泛指微观之上的层级,是统合某类微观主体的一个分类主体。在多层次数据系统中,不同层次的数据能够体现不同层次的监测指标的变化趋势,但是,通过不同层次的数据在体现这些监测指标的变化趋势时,可能由于数据生成的成本高、耗时长等问题,导致有些层次的监测指标较容易获取,有些层次的监测指标较难获取,特别是对于一些微观层次的监测目标,无法高频迅速地获得,例如上市公司的财务报告、每个地区的人口数量等。为了解决该问题,在现有技术中,通常会采用人工分析的方式,根据已知的一个层次的监测指标来分析出另一层次较难获取的监测指标。例如,在进行营业收入分析时,在得到行业级别的判断之后,专家往往会根据具体公司在行业内的地位和资源优势,对公司的做出一个定性的判断。但是,上述人工分析的方式,依赖研究人员对分析主体的深度理解,同时,涉及到跨层级的情况,不同层级之间的对应关系往往只能给出定性判断,较难给出定量结论,准确性低。因此,如何提升多层次数据系统中数据指标变化趋势监测的准确性,成为本领域亟需解决的技术问题。技术实现要素:本申请的目的是提供一种多层次数据系统中数据指标变化趋势的监测方法、装置、计算机设备和可读存储介质,用于解决现有技术中上述技术问题。一方面,为实现上述目的,本申请提供了一种多层次数据系统中数据指标变化趋势的监测方法。该多层次数据系统中数据指标变化趋势的监测方法包括:确定待监测指标对应的代理指标,其中,所述待监测指标为多层次数据系统中第一层次数据的指标,所述代理指标为所述多层次数据系统中第二层次数据的指标,所述第一层次和所述第二层次为所述多层次数据系统的不同层次;获取生成所述代理指标的第二层次数据;根据所述第二层次数据和无监督层状态空间模型确定所述代理指标的第一频率变化趋势;获取所述待监测指标的第二频率变化趋势的历史数据,其中,所述第一频率高于所述第二频率;根据所述代理指标的第一频率变化趋势和获取到的所述待监测指标的第二频率变化趋势,训练有监督层状态空间模型;以及根据所述有监督层状态空间模型预测所述待监测指标的第二频率变化趋势。进一步地,在获取生成所述代理指标的第二层次数据的步骤之后,根据所述第二层次数据和无监督层状态空间模型确定所述代理指标的第一频率变化趋势的步骤之前,所述方法还包括:消除所述第二层次数据中不同量级数据的量纲差异。进一步地,所述第二层次数据包括存量类数据和流量类数据,根据所述第二层次数据和无监督层状态空间模型确定所述代理指标的第一频率变化趋势的步骤包括:当所述第二层次数据包括存量类数据时,根据所述存量类数据和对应的第一无监督层状态空间模型确定所述存量类数据的第一频率变化趋势;当所述第二层次数据包括流量类数据时,根据所述流量类数据和对应的第二无监督层状态空间模型确定所述流量类数据的第一频率变化趋势;以及根据所述存量类数据的第一频率变化趋势和所述流量类数据的第一频率变化趋势确定所述代理指标的第一频率变化趋势。进一步地,所述第一无监督层状态空间模型的架构为:yt=k*xt+v+εtxt=j*xt-1+c+τt其中,yt为所述存量类数据中所有观测指标组成的向量,xt为所述存量类数据在t时刻的共同隐藏状态,k、v为常向量,j和c为常量,εt和τt分别为误差向量。进一步地,所述第二无监督层状态空间模型的架构为:xt=j*xt-1+c+τt其中,和依次为所述流量类数据中的季频观测变量、月频观测变量、周频观测变量和日频观测变量,q、m和w分别为对应的季度天数、月度天数和周天数,xt为所述流量类数据在t时刻的共同隐藏状态,k1、k2、k3、k4、j和c均为常量,和τt分别为误差向量。进一步地,所述有监督层状态空间模型的架构为:kt=kt-1+τtct=ct-1+εt其中,为所述代理指标的频率变化趋势,为所述待监测指标的频率变化趋势,kt和ct分别为所述代理指标的频率变化趋势与所述待监测指标的频率变化趋势的关联系数,εt和τt分别为误差向量。进一步地,所述待监测指标为公司营业收入,所述代理指标为所述公司所在行业的营业收入,所述第一频率为月频,所述第二频率为季频。另一方面,为实现上述目的,本申请提供了一种多层次数据系统中数据指标变化趋势的监测装置。该多层次数据系统中数据指标变化趋势的监测装置包括:第一确定模块,用于确定待监测指标对应的代理指标,其中,所述待监测指标为多层次数据系统中第一层次数据的指标,所述代理指标为所述多层次数据系统中第二层次数据的指标,所述第一层次和所述第二层次为所述多层次数据系统的不同层次;第一获取模块,用于获取生成所述代理指标的第二层次数据;第二确定模块,用于根据所述第二层次数据和无监督层状态空间模型确定所述代理指标的第一频率变化趋势;第二获取模块,用于获取所述待监测指标的第二频率变化趋势的历史数据,其中,所述第一频率高于所述第二频率;训练模块,用于根据所述代理指标的第一频率变化趋势和获取到的所述待监测指标的第二频率变化趋势,训练有监督层状态空间模型;以及预测模块,用于根据所述有监督层状态空间模型预测所述待监测指标的第二频率变化趋势。又一方面,为实现上述目的,本申请还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。又一方面,为实现上述目的,本申请还提供计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。本申请提供的多层次数据系统中数据指标变化趋势的监测方法、装置、计算机设备和可读存储介质,确定待监测指标对应的代理指标,其中,待监测指标为多层次数据系统中第一层次数据的指标,代理指标为多层次数据系统中第二层次数据的指标,第一层次和第二层次为多层次数据系统的不同层次;获取生成代理指标的第二层次数据;根据第二层次数据和无监督层状态空间模型确定代理指标的第一频率变化趋势;获取待监测指标的第二频率变化趋势的历史数据,其中,第一频率高于第二频率;根据代理指标的第一频率变化趋势和获取到的待监测指标的第二频率变化趋势,训练有监督层状态空间模型;以及根据有监督层状态空间模型预测待监测指标的第二频率变化趋势,通过本申请,在多层次数据系统中,能够依据一个层次的代理指标自动分析出另一个层次的待监测指标,提升多层次数据系统中数据指标变化趋势监测的准确性。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1为本申请实施例一提供的多层次数据系统中数据指标变化趋势的监测方法的流程图;图2为本申请实施例二提供的多层次数据系统中数据指标变化趋势的监测装置的框图;图3为本申请实施例三提供的计算机设备的硬件结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。实施例一本申请实施例一提供了一种多层次数据系统中数据指标变化趋势的监测方法,通过该方法,能够提升多层次数据系统中数据指标变化趋势监测的准确性。具体地,图1为本申请实施例一提供的多层次数据系统中数据指标变化趋势的监测方法的流程图,如图1所示,该实施例提供的多层次数据系统中数据指标变化趋势的监测方法包括如下的步骤s101至步骤s106。步骤s101:确定待监测指标对应的代理指标。其中,多层次数据系统包括多个层次的数据,待监测指标为多层次数据系统中第一层次数据的指标,代理指标为多层次数据系统中第二层次数据的指标,第一层次和第二层次为多层次数据系统的不同层次,具体地,第一层次和第二层次可以为宏观、中观和微观中的两种。在该实施例中,通过代理指标连间接实现对待监测指标的监测。例如,待监测指标为某具体公司的营业收入,代理指标为公司所在行业的营业收入。具体地,在该步骤中,确定待监测指标对应的代理指标时,首先确认所研究主体也即公司的基本情况,厘清行业中观数据与公司微观层级监测目标之间的关系,确定行业层次的代理目标。例如,待监测指标为某上市公司的营业收入,可以把行业级别的营业收入作为代理目标。步骤s102:获取生成代理指标的第二层次数据。第二层次数据可以包括多个维度、多种频率的数据,这些数据可反应出代理指标。在进行数据获取时,可获取丰富的数据资源,其中,数据资源越丰富,预测效果越好;但当数据资源并不丰富或者获取成本过高的情况下,采用替代数据也能进行建模计算。参考营业收入的例子,当无法得到合适的销量数据时,可以用产量数据代替;当无法得到具体产品的价格数据时,采用较为模糊的价格指数或景气指数;而当获取到较多同类数据的时候,例如烧碱不同地区、不同纯度的价格,不需要考虑该选取哪些价格,可以全部获取,以提取共同的变化趋势。可选地,在进行数据获取之后,可以对数据进行预处理。其中,数据预处理的步骤包括:消除第二层次数据中不同量级数据的量纲差异,此外,如果原始数据存在季节性的话,需要剔除季节性趋势。步骤s103:根据第二层次数据和无监督层状态空间模型确定代理指标的第一频率变化趋势。其中,通过该步骤s103,对第二层次数据进行数据建模,以通过无监督层状态空间模型提取出第二层次数据中不同观测指标数据的共同趋势,也即得到代理指标在第一频率变化趋势,该第一频率相对于待监测指标变化趋势的频率而言,属于高频率。其中,在生成代理指标的数据中,包括存量类数据与流量类数据两类数据,其中,存量类数据是指在一定时点上测算的量,存量类数据具有时点的基本特征。流量类数据是按一定时期测算的量,反映一定时期内指标的产生、转换、交换、转移或消失等。比如产品或服务的价格是存量类数据,而销量则是流量类数据,过去一个月的销量是由每天的销量相加得到的。因此,存量类数据和流量类数据的特点差异较大。为了提升代理指标的第一频率变化趋势确定的准确性,对存量类数据和流量类数据采用不同的无监督层状态空间模型,具体地,当第二层次数据包括存量类数据和流量类数据时,在该步骤s103中,根据第二层次数据和无监督层状态空间模型确定代理指标的第一频率变化趋势时,具体的步骤包括:当第二层次数据包括存量类数据时,根据存量类数据和对应的第一无监督层状态空间模型确定存量类数据的第一频率变化趋势;当第二层次数据包括流量类数据时,根据流量类数据和对应的第二无监督层状态空间模型确定流量类数据的第一频率变化趋势;根据存量类数据的第一频率变化趋势和流量类数据的第一频率变化趋势确定代理指标的第一频率变化趋势。进一步地,第一无监督层状态空间模型的架构为:yt=k*xt+v+εt(1)xt=j*xt-1+c+τt(2)其中,上述方程组中(1)式为观测方程,yt为存量类数据中所有观测指标组成的向量,xt为存量类数据在t时刻的共同隐藏状态,也即代理指标的第一频率变化趋势,k、v为常向量,j和c为常量,εt和τt分别为误差向量,每个误差分量互相独立,各自服从均值为0、方差不同的正态分布,也即τt~n(0,ω2)。对于存量类数据,理论上同一个分堆的数据有着共同的走势,因此yt中的所有分量通过系数向量k共同作用于xt,yt的每一个分量对xt的作用系数可能是不同的。v是截距向量,对于不同的分量也是不相同的。可选地,第一频率的大小,也即xt的频率是由第二层次数据中的最高频决定的。第二无监督层状态空间模型的架构为:xt=j*xt-1+c+τt(2)其中,和依次为流量类数据中的季频观测变量、月频观测变量、周频观测变量和日频观测变量,对于流量类数据,不同频率的观测变量是对应期限内的累加。q、m和w分别为对应的季度天数、月度天数和周天数,其中,q、m视情况而定,不同季度和月份的长度不太一致,w固定为7天,xt为流量类数据在t时刻的共同隐藏状态,k1、k2、k3、k4、j和c均为常量,和τt分别为误差向量。可选地,第一频率的大小,也即第一无监督层状态空间模型中xt的频率是由第二层次数据中的最高频决定的。此外,在第一无监督层状态空间模型和第二无监督层状态空间模型对应的方程组中,(2)式均为状态转移方程,是对隐藏状态的内在变化规律做的一阶自相关的假设。两种无监督层状态空间模型的输出目标均是数据堆的隐藏状态xt,反映了数据堆的共同趋势。共同趋势为隐藏状态,无法实际观测到,因此,通过该无监督学习的模型层,起到了容纳处理缺失、混频数据,提取共同趋势的作用,使得该层的输出为第二层次数据代表不同数据种类的无量纲的隐藏状态。例如,以监测季度频率的上市公司营业收入为例,将第二层次数据分成代表量和代表价的两堆后,通过该步骤s103,输出的是行业级别的产品价格的隐藏状态和产品销量的隐藏状态,可以提取出量和价分别不同的高频趋势,各堆数据输出的频率由该堆中所有数据的最高频率决定。将该隐藏状态先统一到季度维度后,通过对数比值变换转换成价格和销量的对数同比,销量的对数比值ln(pt/pt-1)与价格的对数比值ln(qt/qt-1)相加即得营业收入的对数比值ln(revt/revt-1),如下公式所述:随着信息技术的发展,所能获取的数据范围不断扩大,获取数据的成本在不断下降。面对庞大的数据量,在应用上天然存在着诸多困难,主要有以下几个方面:第一,数据缺失。在数据的生成、获取过程中,难免会因为各种原因引起数据的缺失。对于这种缺失,用某种方式比如前值补全的误差太大,而直接删除又会对时间序列的连贯性产生影响。若忽略数据缺失问题,现有的诸多预测模型则无法兼容处理带缺失值得数据。而采用上述第一无监督层状态空间模型和第二无监督层状态空间模型,能够容纳缺失值,降低数据缺失的影响。第二,数据混频。对于同一个数据主体,获取到的数据可能是不同频率的。数据的频率不同,可能是因数据生成的复杂度和工作量引起的。比如我国的人口统计一年才进行一次,而gdp一个季度核算一次,更高频的生产者价格指数ppi和消费者价格指数cpi一个月即可核算一次,股市的股指每天都能看到其点位。而采用上述第一无监督层状态空间模型和第二无监督层状态空间模型,能够处理不同频率的数据,能够实现混频数据的处理。第三,数据口径繁多。由于数据产生时的不同口径,可能会得到一大堆相似但又不相同的数据源。例如水泥的价格,可以获取到全国各地不同省份、不同城市、不同厂家、不同种类的水泥的日度、周度价格数据。如果想要分析水泥行业的整体价格趋势,选哪些数据、该怎么使用,是一个见仁见智的问题。不同的分析师选择不同的数据,得到的结论也会不同,而采用上述第一无监督层状态空间模型和第二无监督层状态空间模型,可以不对上述数据进行选择,获取各种口径数据的统一变化趋势。第四,数据禀赋各异。不同主体的数据禀赋可能天差地别。有些主体数据充足,而有些主体则数据稀缺。传统的建模方法需要对不同预测主体有一个一致的数据形态,因此如果没有特殊的处理,传统建模方法在此方面是无能为力的。而采用上述第一无监督层状态空间模型和第二无监督层状态空间模型,面对差异显著的数据禀赋情况,具备一定的兼容性。可选地,在对第二层次数据进行预处理后,还包括数据标记的步骤。数据标记的目的是区分所输入数据的发布频率、描述对象和存流特征。采用上述第一无监督层状态空间模型和第二无监督层状态空间模型,可容纳不同频率的数据,而不再需要通过剔除数据或者补足数据的方式使得所有数据处于同一频率。但实际上不同频率的数据处理方式并不一样,这些需要事先标注。此外,由于获取的数据可能需要一定的组合才能生成代理目标,例如,通过销量和价格生成收入,这些数据很可能是不同种类的,因此需要对其进行标注区分,以便后续的数据分堆处理,例如收入需要价格与销量的数据相乘。至于存流特征则是分别针对存量类数据和流量类数据进行的区分。通过上述数据标记,能够方便通过第一无监督层状态空间模型和第二无监督层状态空间模型确定代理指标的第一频率变化趋势。步骤s104:获取待监测指标的第二频率变化趋势的历史数据。其中,第一频率高于第二频率,可选地,第一频率为月频,第二频率为季频。步骤s105:根据代理指标的第一频率变化趋势和获取到的待监测指标的第二频率变化趋势,训练有监督层状态空间模型。对于待监测指标而言,能够获取到待监测指标的第二频率变化趋势的历史数据,因此,在得到代理指标的第一频率变化趋势后,利用代理指标的第一频率变化趋势和获取到的待监测指标的第二频率变化趋势,训练有监督层状态空间模型,使得有监督层状态空间模型能够学习到代理指标的第一频率变化趋势和待监测指标的第二频率变化趋势之间的关联关系,通过有监督层状态空间模型监督学习层,能够将不同层次、不同频率的代理指标和待监测目标进行匹配。可选地,有监督层状态空间模型的架构为:kt=kt-1+τt(2)ct=ct-1+εt(2)其中,为代理指标的频率变化趋势,为待监测指标的频率变化趋势,kt和ct分别为代理指标的频率变化趋势与待监测指标的频率变化趋势的关联系数,εt和τt分别为误差向量。在上述有监督层状态空间模型的方程组中,(1)为测量方程,(2)为转移方程。以待监测指标为上市公司营收为例,测量方程中的两个和分别代表着行业的高频营收增速和公司的低频营收增速,其中公司的营收增速是基于公司披露的财务报告计算得到,因此更新频率为季度。行业的营收增速则是基于无监督层输出结果计算得到的,更新频率快于季度频率,由获取的最高频的中观数据决定。kt是上市公司营收增长与行业营收增长的关联系数,反映公司相对行业的增速的弹性。kt小于1代表该公司营收增速变化慢于行业整体水平,反之说明该公司营收增速变化比行业整体水平剧烈。在该模型中的转移方程中,蕴含了一个假设,即中观层次与微观层次之间的关系每期都会有一个随机的变动,但每期是基于上一期的基础上有一个随机的影响。步骤s106:根据有监督层状态空间模型预测待监测指标的第二频率变化趋势。在得到有监督层状态空间模型之后,也即得到代理指标的第一频率变化趋势和待监测指标的第二频率变化趋势的关联关系之后,将已有的代理指标的第一频率变化趋势对应的数据输入至有监督层状态空间模型,即可预测出预测待监测指标的第二频率变化趋势。例如,在实际预测的时候,在估计出的监督层状态空间模型中的关联系数kt和ct后,将高频的中观层次数据输入至有监督层状态空间模型后,即可得到未来低频化的微观层级待监测指标的变化趋势。在该实施例提供的多层次数据系统中数据指标变化趋势的监测方法中,确定待监测指标对应的代理指标,其中,待监测指标为多层次数据系统中第一层次数据的指标,代理指标为多层次数据系统中第二层次数据的指标,第一层次和第二层次为多层次数据系统的不同层次;获取生成代理指标的第二层次数据;根据第二层次数据和无监督层状态空间模型确定代理指标的第一频率变化趋势;获取待监测指标的第二频率变化趋势的历史数据,其中,第一频率高于第二频率;根据代理指标的第一频率变化趋势和获取到的待监测指标的第二频率变化趋势,训练有监督层状态空间模型;以及根据有监督层状态空间模型预测待监测指标的第二频率变化趋势,通过该方法,在多层次数据系统中,能够依据一个层次的代理指标自动分析出另一个层次的待监测指标,提升多层次数据系统中数据指标变化趋势监测的准确性。进一步地,在不同层次的数据研究中,引入状态空间模型,有效处理数据混频、缺失的应用难点;通过构造双层状态空间模型的架构,在多层次数据系统的场景下,实现了信息的有效提取和应用;结合无监督学习和监督学习两层模型架构,实现第二层次数据目标(也即代理指标)相关信息的提取,以及不同层级指标的联动关系,能够实现对第一层次数据目标(也即待监测指标)实现预测。采用本申请的多层次数据系统中数据指标变化趋势的监测方法,第一,具有高度延展性和定制化,对数据层次不进行限定,可以对宏观层次、中观层次和微观层次的待监测指标进行预测。第二,兼容性强。适用于各种数据禀赋的情况,数据充足或者缺乏均可实现预测。第三,可容纳处理混频、缺失数据。可容纳混频缺失数据而不需要对数据进行剔除或补充,减少了信息的浪费和误差的引入。第四,对流量类数据和存量类数据有精细化的处理,通过层状态空间模型,实现流量类数据和存量类数据的统一建模输出。接下来以行业分析为例,以行业层面为中观层次,以个体公司层面为微观层次,监测目标为个体公司的营业收入指标,具体说明本申请的实施流程。以普钢板材行业为分析案例,通过行业层级的中观数据,监测具体上市公司xx股份的营业收入变化情况。第一步:确定代理目标。由于监测目标为公司营业收入,因此代理目标可以选定为行业级别的营业收入。第二步:获取数据。行业级别的营业收入可以参考收入=销量*价格的公式。普钢板材行业的产品较为单一,尽管不同类型的板材型号众多,但其原材料和工艺并无太大差别,因此其价格和销量走势也是相对一致的。可以认为普钢板材行业为单产品的制造业,只需要获取其价格和销量数据即可。普钢板材的价格数据大多数为日度的各种型号的价格数据。为了起到示例作用,随机选取了3个不同种类型号的板材的日度价格数据,包括热轧板卷:q235b:3.0mm,冷轧板卷:0.5mm和中板:普20mm。而板材的销量数据相对较少,因此考虑用产量数据替代,选用了冷轧薄板的当月产量以及全国热卷钢厂的日均产量,选取的指标列表如下。指标名称频率起始时间价格:热轧板卷:q235b:3.0mm:上海日2002/1/21价格:冷轧板卷:0.5mm:上海日2004/11/1价格:中板:普20mm:上海日2007/1/4产量:冷轧薄板:当月值月2004/1/31日均产量:热卷(商品):全国热卷钢厂月2014/4/30第三步:数据预处理。钢材的价格数据没有明显的季节性,但是产量数据存在季节性。因此利用乘法模型剔除了季节因素,保留趋势项。之后采用了归一的方式,不同时间起点的数据均除以其最早的初始值,去除指标本身的量纲。第四步:数据标记。将上述五个指标分成描述价格和描述产量两个分堆数据,分别标记其频率。价格为存量类数据,产量为流量类数据。第五步:无监督层状态空间模型。将预处理以及标记好的数据输入无监督层状态空间模型,分堆提取其共同趋势。将分堆的共同趋势提取后,计算高频的行业级别的营收。在此阶段,可参考板材行业的上市公司按季度披露的的营业收入增速的中位数,对比两者之间的趋势,观察提取出的行业级别营业收入的增速的趋势能够较好拟合。第六步:有监督层状态空间模型。将无监督层模型输出的行业级别高频营业收入增速与季度频率的具体公司的营业收入增速进行匹配,计算其关联程度。为了确保本模型有较好地泛化和落地实现的能力,每次运行都采用滚动样本外的预测方式,即每期预测的结果都是基于当时能够获得的数据的原则。以xx股份为例,本案例的完成时间在2季报披露之前,因此xx股份的真实营收增速截至2020年1季度。模型判断xx股份在2季度时营收同比将继续下滑,幅度为-16.2%。后续2季度后,得到xx股份2020年2季报财务报表已经披露,计算得到的营业收入同比下滑值为-12.6%。可以看出,本盛情在预测上市公司营业收入增长方面有着一定的准确度。实施例二对应于上述实施例一,本申请实施例二提供了一种多层次数据系统中数据指标变化趋势的监测装置,相应地技术特征细节和对应的技术效果可参考上述实施例一,在该实施例中不再赘述。图2为本申请实施例二提供的多层次数据系统中数据指标变化趋势的监测装置的框图,如图2所示,该装置包括:第一确定模块201、第一获取模块202、第二确定模块203、第二获取模块204、训练模块205和预测模块206。第一确定模块201,用于确定待监测指标对应的代理指标,其中,所述待监测指标为多层次数据系统中第一层次数据的指标,所述代理指标为所述多层次数据系统中第二层次数据的指标,所述第一层次和所述第二层次为所述多层次数据系统的不同层次;第一获取模块202,用于获取生成所述代理指标的第二层次数据;第二确定模块203,用于根据所述第二层次数据和无监督层状态空间模型确定所述代理指标的第一频率变化趋势;第二获取模块204,用于获取所述待监测指标的第二频率变化趋势的历史数据,其中,所述第一频率高于所述第二频率;训练模块205,用于根据所述代理指标的第一频率变化趋势和获取到的所述待监测指标的第二频率变化趋势,训练有监督层状态空间模型;以及预测模块206,用于根据所述有监督层状态空间模型预测所述待监测指标的第二频率变化趋势。可选地,在一种实施例中,所述装置还包括预处理模块,用于在第一获取模块202获取生成所述代理指标的第二层次数据之后,第二确定模块203根据所述第二层次数据和无监督层状态空间模型确定所述代理指标的第一频率变化趋势之前,消除所述第二层次数据中不同量级数据的量纲差异。可选地,在一种实施例中,所述第二层次数据包括存量类数据和流量类数据,第二确定模块203包括:第一确定单元,用于当所述第二层次数据包括存量类数据时,根据所述存量类数据和对应的第一无监督层状态空间模型确定所述存量类数据的第一频率变化趋势;第二确定单元,用于当所述第二层次数据包括流量类数据时,根据所述流量类数据和对应的第二无监督层状态空间模型确定所述流量类数据的第一频率变化趋势;以及第三确定单元,用于根据所述存量类数据的第一频率变化趋势和所述流量类数据的第一频率变化趋势确定所述代理指标的第一频率变化趋势。可选地,在一种实施例中,所述第一无监督层状态空间模型的架构为:yt=k*xt+v+εtxt=j*xt-1+c+τt其中,yt为所述存量类数据中所有观测指标组成的向量,xt为所述存量类数据在t时刻的共同隐藏状态,k、v为常向量,j和c为常量,εt和τt分别为误差向量。可选地,在一种实施例中,所述第二无监督层状态空间模型的架构为:xt=j*xt-1+c+τt其中,和依次为所述流量类数据中的季频观测变量、月频观测变量、周频观测变量和日频观测变量,q、m和w分别为对应的季度天数、月度天数和周天数,xt为所述流量类数据在t时刻的共同隐藏状态,k1、k2、k3、k4、j和c均为常量,和τt分别为误差向量。可选地,在一种实施例中,所述有监督层状态空间模型的架构为:kt=kt-1+τtct=ct-1+εt其中,为所述代理指标的频率变化趋势,为所述待监测指标的频率变化趋势,kt和ct分别为所述代理指标的频率变化趋势与所述待监测指标的频率变化趋势的关联系数,εt和τt分别为误差向量。可选地,在一种实施例中,所述待监测指标为公司营业收入,所述代理指标为所述公司所在行业的营业收入,所述第一频率为月频,所述第二频率为季频。实施例三本实施例还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图3所示,本实施例的计算机设备01至少包括但不限于:可通过系统总线相互通信连接的存储器012、处理器011,如图3所示。需要指出的是,图3仅示出了具有组件存储器012和处理器011的计算机设备01,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。本实施例中,存储器012(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器012可以是计算机设备01的内部存储单元,例如该计算机设备01的硬盘或内存。在另一些实施例中,存储器012也可以是计算机设备01的外部存储设备,例如该计算机设备01上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。当然,存储器012还可以既包括计算机设备01的内部存储单元也包括其外部存储设备。本实施例中,存储器012通常用于存储安装于计算机设备01的操作系统和各类应用软件,例如实施例二的多层次数据系统中数据指标变化趋势的监测装置的程序代码等。此外,存储器012还可以用于暂时地存储已经输出或者将要输出的各类数据。处理器011在一些实施例中可以是中央处理器(centralprocessingunit,cpu)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器011通常用于控制计算机设备01的总体操作。本实施例中,处理器011用于运行存储器012中存储的程序代码或者处理数据,例如多层次数据系统中数据指标变化趋势的监测方法等。实施例四本实施例还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,sd或dx存储器等)、随机访问存储器(ram)、静态随机访问存储器(sram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、可编程只读存储器(prom)、磁性存储器、磁盘、光盘、服务器、app应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储多层次数据系统中数据指标变化趋势的监测装置,被处理器执行时实现实施例一的多层次数据系统中数据指标变化趋势的监测方法。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的
技术领域
,均同理包括在本申请的专利保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1