一种数据平均增长率计算方法和装置与流程

文档序号:11707545阅读:389来源:国知局
一种数据平均增长率计算方法和装置与流程

本发明涉及计算机数据挖掘和处理领域,具体涉及一种数据平均增长率计算方法和装置。



背景技术:

随着计算机和互联网技术的发展,计算机处理数据的智能性得到了显著的提高。目前,计算机可以根据预定的规则或者算法,估计或预测某些数据在未来的变化。

例如某些数据本身会随着时间发生变化,而它们的变化过程是非线性的,或是不符合低维度的规律的。如果这些数据的变化会对相关产业差生重大影响,那么预测这些数据的变化则是十分必要的,预知数据的未来走势有助于提前做出应对方案。假设存在一台机器或者某个人可以对这些数据的变化进行预测,无论采用由计算机执行的深度学习算法还是依赖人为的经验,都很难预测出具体的数值,而通常只能够给出一种趋势预测,也即预测某个数据在未来的一段时间是增长、不变或减少。由于数据预测方通常会对大量的数据进行预测,所以用户很难验证数据预测方的大量结论的可信度,也即无法评价或确定数据预测方的性能。



技术实现要素:

因此,本发明要解决的技术问题在于数据预测方的性能无法被评估或确定的问题。

有鉴于此,本发明提供一种数据平均增长率计算方法,包括:

获取评估对象对各个目标数据的预测时间;

分别获取所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值,其中所述预定时间在所述预测时间之后;

根据所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值计算所述评估对象所预测数据的平均增长率。

优选地,在所述分别获取所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值之后,还包括:

分别根据所述各个目标数据在预定时间时的数值与所述各个目标数据在所述预测时间时的数值计算所述各个目标数据的增长率;

在所述根据所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值计算所述评估对象所预测数据的平均增长率之后,还包括:

根据所述各个目标数据的增长率与所述平均增长率计算所述评估对象的预测结果的波动性。

优选地,所述根据所述各个目标数据的增长率与所述平均增长率计算所述评估对象的预测结果的波动性,包括:

利用下式计算所述波动性:

d=1/n((x1-s)2+(x2-s)2+(x3-s)2+……+(xn-s)2),

其中d为所述波动性,x1、x2、x3……xn为所述各个目标数据的增长率,s为所述平均增长率,n为所述评估对象所预测的目标数据的数量。

优选地,所述评估对象是研报数据发布者、所述目标数据为所述研报数据所涉及股票的市值、所述预测时间为所述研报数据的发布时间;

所述获取评估对象对各个目标数据的预测时间,包括:

获取多个研报数据,所述研报数据中包括发布者信息和对股票市值的趋势预测信息和发布时间;

从所述多个研报数据中筛选出所述趋势预测信息指示的趋势为正向增长的研报数据;

根据所述发布者信息从正向增长的研报数据中确定所述评估对象发布的研报数据;

分别从确定的研报数据中确定发布时间。

优选地,还包括:

根据股票指数在所述各个目标数据的预测时间和预定时间时的数值

计算所述股票指数的平均增长率;

在所述根据所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值计算所述评估对象所预测数据的平均增长率之后,还包括:

计算研报数据发布者所预测股票的平均增长率与所述股票指数的平均增长率的差值,作为所述研报数据发布者的收益率。

相应地,本发明还提供一种数据平均增长率计算装置,包括:

获取模块,用于获取评估对象对各个目标数据的预测时间;

数值确定模块,用于分别获取所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值,其中所述预定时间在所述预测时间之后;

平均值计算模块,用于根据所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值计算所述评估对象所预测数据的平均增长率。

优选地,还包括:

增长率计算模块,用于在所述数值确定模块处理之后,分别根据所述各个目标数据在预定时间时的数值与所述各个目标数据在所述预测时间时的数值计算所述各个目标数据的增长率;

波动性计算模块,用于在所述平均值计算模块处理完成之后,根据所述各个目标数据的增长率与所述平均增长率计算所述评估对象的预测结果的波动性。

优选地,所述波动性计算模块利用下式计算所述波动性:

d=1/n((x1-s)2+(x2-s)2+(x3-s)2+……+(xn-s)2),

其中d为所述波动性,x1、x2、x3……xn为所述各个目标数据的增长率,s为所述平均增长率,n为所述评估对象所预测的目标数据的数量。

优选地,所述评估对象是研报数据发布者、所述目标数据为所述研报数据所涉及股票的市值、所述预测时间为所述研报数据的发布时间;

所述获取模块包括:

研报数据获取模块,用于获取多个研报数据,所述研报数据中包括发布者信息和对股票市值的趋势预测信息和发布时间;

正向研报数据筛选模块,用于从所述多个研报数据中筛选出所述趋势预测信息指示的趋势为正向增长的研报数据;

发布者筛选模块,用于根据所述发布者信息从正向增长的研报数据中确定所述评估对象发布的研报数据;

预测信息获取模块,用于分别从确定的研报数据中确定发布时间。

优选地,还包括:

股票指数平均增长率确定模块,用于根据股票指数在所述各个目标数据的预测时间和预定时间时的数值

计算所述股票指数的平均增长率;

收益率计算模块,用于在所述平均值计算模块完成处理之后,计算研报数据发布者所预测股票的平均增长率与所述股票指数的平均增长率的差值,作为所述研报数据发布者的收益率。

根据本发明实施例提供的数据平均增长率计算方法和装置,首先获取评估对象对各个目标数据的预测时间,然后确定各个目标数据在该预测时间时的数值以及在之后一段时间时的数值,通过对同一评估对象给出的大量预测数据进行验证后,可以计算该评估对象的所有预测对象的平均增长率,这一数据能够反映出评估对象的可信度,并可以作为目标数据使用者的重要参考指标,从而协助用户评估或确定数据预测方的性能,进而协助用户对数据的变化提前做出应对方案。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的一个实施例中的数据平均增长率计算方法的流程图;

图2为本发明的另一个实施例中的数据平均增长率计算方法的流程图;

图3为本发明的第三个实施例中的数据平均增长率计算装置的结构示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。在本发明的描述中,需要说明的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。

此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

本发明实施例提供了一种数据平均增长率计算方法,如图1所示,该方法包括如下步骤:

s01,获取评估对象对各个目标数据的预测时间,其中的评估对象可以是计算机也可以是人,目标数据即评估对象的预测对象。本方法可以应用于多种行业和领域,不同的领域中目标数据的内容不相同,但目标数据的值必须是随时间变的,例如是某种随时间消耗的或者增长的参数。预测时间是指评估对象发布这种预测结果的时间。为了更清楚地对本方案进行说明,下面例举一个具体应用场景,例如在电池领域中,计算机可以根据充放电参数预测多个电池单体的电量变化情况,那么电池电量即为目标数据,假设电池1在t1时刻的电量为a%,计算机在时刻t1根据充放电参数预测该电池1的电量到t2时刻是增长、减少或不变;电池2在t3时刻的电量为c%,计算机在时刻t3根据充放电参数预测该电池2的电量到t4时刻是增长、减少或不变,其中计算机即为评估对象,时刻t1和t3即为预测时间。

s02,分别获取各个目标数据在预测时间时的数值以及各个目标数据在预定时间时的数值,其中预定时间在预测时间之后。本实施例所指的预定时间t2必须是在上述时刻t1之后、时间t4必须是在上述时刻t3之后,假设t4是最靠后的一个时间点,则本方法至少需要在预定时间t4之后执行,也即本发明需要明确目标数据在t1时刻的数值以及目标数据在t2时刻的数值,以及目标数据在t3时刻的数值以及目标数据在t4时刻的数值。其中预定时间可以是根据预测时间确定的,例如是预测时间之后的几分钟、几小时、几天甚至几个月都是可行的,具体需要根据目标数据的性质进行设定。如此,同一评估对象对不同的目标数据的预测时间可以是不相同的,对于同一对象预测的不同目标数据,本发明所选的预定时间也可以是不同的。

s03,根据各个目标数据在所述预测时间时的数值以及各个目标数据在预定时间时的数值计算评估对象所预测数据的平均增长率,该增长率可以是正数、负数或者0。例如通过上述步骤获取到电池1的电量在t2时刻的数值为b%、电池2的电量在t4时刻的数值为d%,计算平均增长率的方式有多种,例如平均增长率可以为{[(d%+b%)-(a%+c%)]/((a%+c%))}。

根据本发明实施例提供的数据平均增长率计算方法,首先获取评估对象对各个目标数据的预测时间,然后确定各个目标数据在该预测时间时的数值以及在之后一段时间时的数值,通过对同一评估对象给出的大量预测数据进行验证后,可以计算该评估对象的所有预测对象的平均增长率,这一数据能够反映出评估对象的可信度,并可以作为目标数据使用者的重要参考指标,从而协助用户评估或确定数据预测方的性能,进而协助用户对数据的变化提前做出应对方案。

作为一个优选的实施方式,在上述步骤s02之后,本方法还可以包括如下步骤:

s04,分别根据各个目标数据在预定时间时的数值与各个目标数据在所述预测时间时的数值计算所述各个目标数据的增长率,该增长率可以是正数、负数或者0,通过上述步骤可以计算出n个目标数据的增长率。仍以上述应用场景为例,可以分别计算出电池1的电量的增长率为(b%-a%)/a%,电池2的电量的增长率为(d%-c%)/c%;

在上述步骤s03和s04之后,本方法还可以包括如下步骤:

s05,根据各个目标数据的增长率与平均增长率计算评估对象的预测结果的波动性。

按照上述步骤计算出的平均增长率与各个目标数据的实际增长率是可能存在差异的,并且可能会出现差异较大的情况,例如评估对象一共预测了n个数据,平均增长率为+r%,其中部分数据的增长率接近+r%,但是有部分数据的增长率与+r%差异较大,甚至出现负值,那么差异性的大小以及差异性较大的结果所占的比例均可影响评估对象的整体稳定性。具体地计算差异性的方式有多种,例如利用现有的一些数学算法都是可行的。本实施例提供一种优选的计算方式,即上述步骤s05具体可以按照如下方式进行计算:

d=1/n((x1-s)2+(x2-s)2+(x3-s)2+……+(xn-s)2),

其中d为所述波动性,x1、x2、x3……xn为所述各个目标数据的增长率,s为所述平均增长率,n为所述评估对象所预测的目标数据的数量。

上述方式分别将每个目标数据的增长率与平均增长率相减,然后将结果做平方运算,最后以平方运算结果的总和除以目标数据的个数,将得到结果作为数据预测结果的波动性。上述优选方案考虑单个预测结果与平均增长率的差异,由此反映出了预测方的稳定性,进一步评估了预测方的性能。

以上为一个应用于电池领域的实施例,在该实施例中评估对象是计算机或者软件程序、程序模型或程序模块。下面提供另一种应用场景,本发明的另一个实施例还提供了一种数据平均增长率计算方法,在本实施例中,评估对象是研报数据发布者(也称为股票分析师或分析师)、目标数据为研报数据所涉及股票的市值、预测时间为研报数据的发布时间。具体地,如图2所示,该方法包括如下步骤:

s21,获取多个研报数据,研报数据中包括发布者信息和对股票市值的趋势预测信息和发布时间。获取方式包括多种,例如可以在预定的某些网站、服务器中进行搜索,以尽可能收集所有的研报数据。此步骤暂不考虑数据具体内容,只判断是否为研报数据即可,例如可以通过文件名称、文件类型等属性进行筛选。

s22,从多个研报数据中筛选出趋势预测信息指示的趋势为正向增长的研报数据。为了减少计算量,本实施例首先筛选出趋势为正向增长的研报数据,后续将不再对趋势为中性或下跌的研报数据进行判断。通常对股票市值的预测趋势最多为5种,在本领域中也将此称为对股票的评级,例如某些研报数据使用“买入”、“增持”、“中性”、“减持”、“卖出”这5个用词来表达对股票市值的预测趋势,显然其中“买入”和“增持”表示的是正向增长的趋势。不同机构发布的研报数据的格式可能是不同的,并且其中的用词也可能是不同的,例如某些研报数据还可能使用系数(数值)表示趋势。在此步骤中,即可以采用关键字匹配的方式来确定预测趋势,也可以结合预设阈值匹配的方式来确定预测趋势。研报数据的格式和表达方式是符合一定行业标准的,因此表达方式也是有限的,所以可以针对来自不同机构的研报数据采取相应的识别方式来筛选出趋势为正向增长的研报数据。

s23,根据发布者信息从正向增长的研报数据中确定评估对象发布的研报数据,例如当前的评估对象为分析师a,则从这些正向增长的研报数据中找出作者为分析师a的研报数据;

s24,分别从确定的研报数据中确定发布时间,例如a发布过10个正向增长趋势的研报数据,则分别从这10个正向增长趋势的研报数据中确定发布时间。

s25,分别获取各个股票市值在研报发布时间时的数值以及各个股票市值在预定时间时的数值,其中预定时间在研报发布时间之后。例如预定时间可以研报发布时间的5日、一个月、半年、一年之后。本实施例中的日期可以是自然日也可以是交易日,由此本实施例还可以加入对日期的判断操作,具体地,假设本实施例中的预定时间是研报发布时间的5日之后的交易日,因此在确定预定日期的过程中,可以首先判断判断研报发布时间的5日之后是否为交易日,如果不是交易日可以取该日期附近的交易日,例如取该日期之前的最近的一个交易日。例如可以获取到股票000001在其研报发布时间的市值为x1,在预定时间再次获取到其市值为y1、股票00002在其研报发布时间的市值为x2,在预定时间再次获取到其市值为y2。

s26,根据各个股票市值在预定时间时的数值与各个股票市值在预测时间时的数值计算分析师所预测股票的平均增长率,例如分析师a发布过n个正向增长的研报数据,则其平均增长率为{(y1+y2+y3+........yn)—(x1+x2+x3+.....xn)}/(x1+x2+x3+.....xn),其中y1+y2+y3+........yn是各个股票在相应预定时间时的市值,x1+x2+x3+.....xn是各个股票在相应研报发布时间时的市值。

根据本发明实施例提供的数据平均增长率计算方法,首先获取分析师对各个股票市值的预测时间,然后确定各个股票市值在该预测时间时的数值以及在之后一段时间时的数值,通过对同一分析师给出的大量研报数据进行验证后,可以计算该分析师所分析过的所有股票市值的平均增长率,这一数据能够反映出分析师的可信度,并可以作为投资者的重要参考指标,从而协助投资者评估或确定分析师的业务水平,进而协助投资者对股票市值的变化提前做出应对方案。

作为一个优选的实施方式,在上述步骤s25之后,还可以包括如下步骤:

s27,分别根据各个股票市值在预定时间时的数值与各个股票市值在预测时间时的数值计算各个股票市值的增长率,例如在此可以计算出股票000001的增长率为(y1-x1)/x1、股票000002的增长率为(y2-x2)/x2。

在上述步骤s25和s27之后还可以包括如下步骤:

s28,根据各个股票市值的增长率与平均增长率计算分析师的预测结果的波动性。本实施例提供一种优选的计算方式,即上述步骤s28具体可以按照如下方式进行计算:

d=1/n((x1-s)2+(x2-s)2+(x3-s)2+……+(xn-s)2),

其中d为波动性,x1、x2、x3……xn为各个股票市值的增长率,s为平均增长率,n为分析师所预测的股票的数量。例如分析师a共发布研报数量为5份(对5支股票进行了预测),每份研报的增长率分别为25%、10%、20%、15%、25%,平均增长率为(25%+10%+20%+15%+25%)/5=20%。由此,其预测结果的波动性为((25%-20%)2)+(10%-20%)2)+(20%-20%)2)+(15%-20%)2)+(25%-20%)2)/5=1.75%。

上述方式分别将每个股票市值的增长率与平均增长率相减,然后将结果做平方运算,最后以平方运算结果的总和除以股票市值的个数,将得到结果作为预测结果的波动性。上述优选方案考虑单个预测结果与平均增长率的差异,由此反映出了分析师的预测结果的稳定性。

作为一个优选的实施方式,在上述步骤s28之后,本方法还可以包括如下步骤:

s29,根据股票指数在各个目标数据的预测时间和预定时间时的数值计算股票指数的平均增长率。以上证指数为例,由于分析师对各股票的预测时间不同,所以上证指数相对于各只股票的增长情况是不同的,具体地可以按照如下方式确认:分别确定分析师对各股票市值的预测时间,然后在确定上证指数在各个预测时间和预定时间的数值。例如分析师a对股票000001的预测时间为t1,预定时间为t2,然后确定上证指数在t1时为xa,在t2时为ya;分析师a对股票000002的预测时间为t3,预定时间为t4,然后确定上证指数在t3时为xb,在t2时为yb。股票指数的平均增长率的计算方式有多种,例如可以是{(ya+yb)—(xa+xb)}/(xa+xb)。

s30,计算研报数据发布者所预测股票的平均增长率与股票指数的平均增长率的差值,作为研报数据发布者的收益率,例如计算出的分析师a所预测的股票市值的平均增长率为+20%,计算出的上证指数的平均增长率为+3%,则相减后确定分析师的收益率为+17%。

上述优选方案结合分析师所预测股票的平均增长率与上证指数的平均增长率来计算分析师的收益率,该结果综合考虑所有股票市值的变化情况,基于此变化情况计算出的收益率更真实地反映了分析师的业务水平。

本发明的第三个实施例提供一种数据平均增长率计算装置,如图3所示,该装置包括:

获取模块31,用于获取评估对象对各个目标数据的预测时间;

数值确定模块32,用于分别获取所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值,其中所述预定时间在所述预测时间之后;

平均值计算模块33,用于根据所述各个目标数据在所述预测时间时的数值以及所述各个目标数据在预定时间时的数值计算所述评估对象所预测数据的平均增长率。

根据本发明实施例提供的数据平均增长率计算装置,首先获取评估对象对各个目标数据的预测时间,然后确定各个目标数据在该预测时间时的数值以及在之后一段时间时的数值,通过对同一评估对象给出的大量预测数据进行验证后,可以计算该评估对象的所有预测对象的平均增长率,这一数据能够反映出评估对象的可信度,并可以作为目标数据使用者的重要参考指标,从而协助用户评估或确定数据预测方的性能,进而协助用户对数据的变化提前做出应对方案。

优选地,该装置还包括:

增长率计算模块34,用于在所述数值确定模块处理之后,分别根据所述各个目标数据在预定时间时的数值与所述各个目标数据在所述预测时间时的数值计算所述各个目标数据的增长率;

波动性计算模块35,用于在所述平均值计算模块处理完成之后,根据所述各个目标数据的增长率与所述平均增长率计算所述评估对象的预测结果的波动性。

优选地,所述波动性计算模块利用下式计算所述波动性:

d=1/n((x1-s)2+(x2-s)2+(x3-s)2+……+(xn-s)2),

其中d为所述波动性,x1、x2、x3……xn为所述各个目标数据的增长率,s为所述平均增长率,n为所述评估对象所预测的目标数据的数量。

上述方式分别将每个目标数据的增长率与平均增长率相减,然后将结果做平方运算,最后以平方运算结果的总和除以目标数据的个数,将得到结果作为数据预测结果的波动性。上述优选方案考虑单个预测结果与平均增长率的差异,由此反映出了预测方的稳定性,进一步评估了预测方的性能。

优选地,所述评估对象是研报数据发布者、所述目标数据为所述研报数据所涉及股票的市值、所述预测时间为所述研报数据的发布时间;

所述获取模块包括:

研报数据获取模块,用于获取多个研报数据,所述研报数据中包括发布者信息和对股票市值的趋势预测信息和发布时间;

正向研报数据筛选模块,用于从所述多个研报数据中筛选出所述趋势预测信息指示的趋势为正向增长的研报数据;

发布者筛选模块,用于根据所述发布者信息从正向增长的研报数据中确定所述评估对象发布的研报数据;

预测信息获取模块,用于分别从确定的研报数据中确定发布时间。

根据本发明实施例提供的数据平均增长率计算装置,首先获取分析师对各个股票市值的预测时间,然后确定各个股票市值在该预测时间时的数值以及在之后一段时间时的数值,根据这两个时刻的数值可以计算出各个股票的实际增长率,通过对同一分析师给出的大量研报数据进行验证后,可以计算该分析师所分析过的所有股票市值的平均增长率,这一数据能够反映出分析师的可信度,并可以作为投资者的重要参考指标,从而协助投资者评估或确定分析师的业务水平,进而协助投资者对股票市值的变化提前做出应对方案。

优选地,该装置还包括:

股票指数平均增长率确定模块,用于根据股票指数在所述各个目标数据的预测时间和预定时间时的数值计算所述股票指数的平均增长率;

收益率计算模块,用于在所述平均值计算模块完成处理之后,计算研报数据发布者所预测股票的平均增长率与所述股票指数的平均增长率的差值,作为所述研报数据发布者的收益率。

上述优选方案结合分析师所预测股票的平均增长率与上证指数的平均增长率来计算分析师的收益率,该结果综合考虑所有股票市值的变化情况,基于此变化情况计算出的收益率更真实地反映了分析师的业务水平。

显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1