一种事件的预测方法及装置与流程

文档序号:17132152发布日期:2019-03-16 01:25阅读:234来源:国知局
一种事件的预测方法及装置与流程

本发明涉及社交网络技术领域,尤其涉及一种事件的预测方法及装置。



背景技术:

随着互联网技术的飞速发展,网络媒体以及社群媒体发展越来越成熟,并已经成为信息的主要传播途径。人们可以通过网络媒体平台以及社群媒体平台等,随意获取以及传播自己感兴趣的内容,使得任何一个人的想法都可能被大众广泛的感知,从而形成一个新的话题,当某一话题吸引更多人的注意时,该话题从众多话题中脱颖而出成为一个热点事件。对于事件发展趋势的预测,对媒体、商家以及政府等掌握大众的需求以及舆论导向,针对事件采取相应的措施起到非常重要的作用。

其中,目前对事件发展趋势的预测通常是采用统一的预测模型实现。但是,由于不同的热点事件发展趋势可能具有不同特性,这样采用统一的预测模型进行预测,从而导致对事件发展趋势的预测存在预测准确性差的问题。



技术实现要素:

本发明实施例提供一种事件的预测方法及装置,以解决现有技术中对对事件发展趋势的预测存在预测准确性差的问题。

为了解决上述技术问题,本发明是这样实现的:

第一方面,本发明实施例提供一种事件的预测方法,包括:

确定目标时间维度;

在预设的至少两个预测模型中选择与目标时间维度对应的目标预测模型,其中,所述至少两个预测模型中,不同预测模型用于获取不同时间维度上的预测结果;

基于所述目标预测模型,以及所述事件与所述目标时间维度关联的目标训练数据集,获取所述事件在所述目标时间维度上的预测结果。

第二方面,本发明实施例提供一种事件的预测装置,包括:

时间维度确定模块,用于确定目标时间维度;

预测模型选择模块,用于在预设的至少两个预测模型中选择与目标时间维度对应的目标预测模型,其中,所述至少两个预测模型中,不同预测模型用于获取不同时间维度上的预测结果;

预测结果获取模块,用于基于所述目标预测模型,以及所述事件与所述目标时间维度关联的目标训练数据集,获取所述事件在所述目标时间维度上的预测结果。

第三方面,本发明实施例提供一种设备,其特征在于,包括处理器,存储器,存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述的事件的预测方法的步骤。

第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的事件的预测方法的步骤。

本发明实施例中,通过确定目标时间维度;在预设的至少两个预测模型中选择与目标时间维度对应的目标预测模型,其中,所述至少两个预测模型中,不同预测模型用于获取不同时间维度上的预测结果;基于所述目标预测模型,以及所述事件与所述目标时间维度关联的目标训练数据集,获取所述事件在所述目标时间维度上的预测结果。这样,在对事件进行预测过程中,能够通过调用目标时间维度所对应的预测模型,获取目标时间维度上的预测结果,在不同时间维度具有不同特性的情况下,可以提升预测结果的准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获取其他的附图。

图1是本发明实施例提供的事件的预测方法的流程图;

图2是本发明实施例提供的事件的预测装置的结构示意图;

图3是本发明实施例提供的预测结果获取模块的结构示意图;

图4是本发明实施例提供的参数获取单元的结构示意图;

图5是本发明实施例提供的计算单元的结构示意图;

图6是本发明实施例提供的事件的预测装置的硬件结构框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获取的所有其他实施例,都属于本发明保护的范围。

参见图1,图中示出了本发明实施例提供的事件的预测方法的流程图。如图1所示,该方法包括如下步骤:

步骤11、确定目标时间维度;

步骤12、在预设的至少两个预测模型中选择与目标时间维度对应的目标预测模型,其中,至少两个预测模型中,不同预测模型用于获取不同时间维度上的预测结果;

步骤13、基于目标预测模型,以及事件与目标时间维度关联的目标训练数据集,获取事件在目标时间维度上的预测结果。

在实际应用中,通过对事件在不同时间维度上的数据的统计分析,不同时间维度由于不同时间维度的数据具有不同的特性,例如:小时级数据不平稳,随机性强;天级别数据特点是周期性强,小样本、贫信息,易受外界影响;周级别及月级别数据特点是只与主题本身的类型和相关实体声量相关。因此,同一预测模型在不同时间维度上获取的事件的预测结果的准确性也不同。

这里,事件的预测装置可以通过调用与目标时间维度对应的目标预测模型,获取在目标时间维度上的预测结果,从而在不同时间维度具有不同特性的情况下,可以调用合适的预测模型获取事件的预测结果,从而提升预测结果的准确性。

本发明实施例中,上述步骤11确定目标时间维度,可以是事件的预测装置接收到用户输入的需查看的时间点或者时间段的预测结果的指令,例如:用户输入查看明天的预测结果的指令等,事件的预测装置根据用户输入的指令,确定该指令中时间段对应的时间维度,如上述查看明天的预测结果,则确定目标时间维度为天级别的时间维度。

当然,上述指令也可以是终端根据预设机制自动触发,例如:事件的预测装置在预设时间点,自动触发查看下一小时或者下一个月的预测结果的指令,等等,在此并不进行限定。

其中,上述目标时间维度可以是包括但不局限于以下至少一项:

分钟级别的时间维度;

小时级别的时间维度;

天级别的时间维度;

周级别的时间维度;

月级别的时间维度;

年级别的时间维度,等等。

另外,事件可以是网络媒体平台以及社群媒体平台等传播的话题、主题或者时事新闻等事件,在此并不进行限定。

本发明实施例中,上述步骤12在预设的至少两个预测模型中选择与目标时间维度对应的目标预测模型,可以是事件的预测装置根据预设的时间维度与预测模型的对应关系,确定与目标时间维度存在对应关系的目标预测模型。

其中,上述预设的时间维度与预测模型的对应关系,可以是事件的预测装置中建立有时间维度与预测模型的关系映射表,该关系映射表中存在多个预测模型中每一预测模型与至少一个时间维度的对应关系,且不同预测模型对应的时间维度不同。

例如:事件的预测装置预设有预测模型1和预测模型2,且预测模型1与分钟级别、小时级别或者天级别的时间维度存在预设对应关系,预测模型2与周级别或者月级别的时间维度存在预设对应关系,则在上述目标时间维度为周级别的时间维度的情况下,事件的预测装置可以将预测模型1确定为上述目标预测模型。

另外,上述事件的预测装置中预设的预测模型的数量可以根据实际预测需要进行设备,具体地,上述至少两个预测模型包括:

用于获取第一时间维度上的预测结果的第一预测模型;

用于获取第二时间维度上的预测结果的第二预测模型;

用于获取第三时间维度上的预测结果的第三预测模型;

其中,第一时间维度小于所述第二时间维度,所述第二时间维度小于所述第三时间维度。

这里,事件的预测装置通过预设用于获取不同时间维度上的预测结果的三个预测模型,从而可以实现在第一时间维度、第二时间维度和第三时间维度上,分别采用不同的预测模型获取事件在目标时间维度上的预测结果。

应当说明的是,上述预测模型可以是任何能够实现基于事件的数据训练集获取该时间的预测结果(即预测数据)的模型,其中,该数据训练集可以是事件的历史数据的数据训练集,例如:上述预测模型可以是线性回归模型、马尔可夫预测模型、灰色预测模型或者人工神经网络预测模型,等等,在此并不进行限定。

另外,上述事件的预测装置中预设时间维度与预测模型的对应关系,可以是通过大量的训练数据,对每一预测模型在各时间维度上获取预测结果的准确性进行训练分析,从而确定在一时间维度上获取的预测结果具有准确性最高或者准确率处于预设范围内的预测模型,并建立该时间维度与该预测模型的对应关系。

例如:在通过历史的训练数据对预测模型1、预测模型2和预测模型3进行训练分析过程中,若预测模型1在分钟级别和小时级别的时间维度上具有最高的预测准确性,预测模型2在天级别的时间维度上具有最高的预测准确性,以及预测模型3在周级别和月级别的时间维度上具有最高的预测准确性,则事件的预测装置预设分钟级别和小时级别的时间维度与预测模型1对应,天级别的时间维度与预测模型2对应,周级别和月级别的时间维度与预测模型3对应。

本发明实施例中,在上述步骤12确定目标时间维度之后,事件的预测装置基于目标预测模型,以及事件与目标时间维度关联的目标训练数据集,获取事件在目标时间维度上的预测结果。

其中,上述目标数据训练集是与目标时间维度具有关联的历史时间段内的数据的集合,其可以包括但不限于历史时段内事件的文档数量、文中提及的次数、相关信息的阅读量、信息被转发的转发量、信息被点赞的次数以及信息被阅读的时长等中的至少一项。这里,上述与目标时间维度关联的目标训练数据集,可以理解为目标训练数据集中的数据均为目标时间维度上的数据。

例如:在上述目标时间维度为小时级别的时间维度的情况下,上述目标训练数据集可以是过去一段时间内天级别的数据的集合,如过去一段时间内每天的事件的信息被点赞的次数的集合,等等。

本发明实施例中,可以通过统一用通过关键词表达式来代表一个事件的文档集合,文档集合中提及的关键词次数作为训练数据集和预测目标。一个事件的文档集合应当是一组以下内容的数据集合:每一个数据包含一个文档的具体内容,一个文档标题,一个时间戳,一个匹配的关键词表达式,当然,也并不局限于此。

需要说明的是,上述目标数据训练集可以是事件的预测装置,根据预设规则调取历史数据中与目标时间维度关联的数据集,例如:由于训练数据集中的数据的产生时间与预测时间点或者预测时间段最接近,预测准确性越高,则事件的预测装置可以调取最近获取的过去时间点或者时间段的数据的集合作为目标数据训练集。

另外,上述事件在目标时间维度上的预测结果,可以在目标时间维度上的指定的时间点或者时间段上的预测数据,例如:在目标时间维度为天级别的时间维度的情况下,上述预测结果可以是未来几天的预测数据。

当然,上述预测结果可以是根据目标数据训练集,获取的未来时间点或者时间段内事件的文档数量、文中提及的次数、相关信息的阅读量、信息被转发的转发量、信息被点赞的次数以及信息被阅读的时长等中的至少一项,在此并不进行限定。

本发明实施例中,上述基于目标预测模型与目标训练数据集获取预测结果,通过目标训练数据集、目标预测模型以及目标预测模型的预设相关参数,计算得到预测结果。

或者,可选的,上述步骤13,包括:

根据目标训练数据集,获取目标预测模型的实时相关参数;

通过目标预测模型、实时相关参数以及目标训练数据集,计算得到事件在目标时间维度上的预测结果;

其中,在目标预测模型的相关参数为实时相关参数的情况下,目标训练数据集的残差最小。

由于不同的训练数据集对于预测结果存在不同的影响,则在目标预测模型的相关参数为预设的情况下,通过不同数据训练集得到的预测结果的准确性也会不同。这里,通过根据目标预测模型、实时相关参数以及目标训练数据集,计算得到事件在目标时间维度上的预测结果,从而可以降低因数据训练集不同而对预测结果带来的影响,进一步提升预测的准确性。

以上述目标预测模型为灰度预测模型(grayforecastmodel)为例进行说明:

灰色预测模型是通过少量的和不完全的信息,建立数学模型并做出预测的一种预测方法。预测是根据客观事物的过去和现在的发展规律,借助于科学的方法对其未来的发展趋势和状况进行描述和分析,并形成科学的假设和判断。

通过灰度预测模型以及目标训练数据集获取预测结果的过程可以包括:

对目标训练数据集进行累加序列生成和邻值序列生成处理;构建灰微分方程即灰色模型gm(1,1);通过迭代使残差最小,获取实时相关参数a、b;通过目标训练数据集、gm(1,1)模型以及实时相关参数a、b,计算下一时刻或需要预测的时间点的值。

其中,累加序列生成为:

设原始数据序列(即目标训练数据集)为x(0)=(x(0)(1),x(0)(2),…,x(0)(n));

令x(1)(k)=∑x(0)(i),k=1,2,...,n;

有x(1)=(x(1)(1),x(1)(2),…,x(1)(n)),k=1,2,...,n,称所得到的新数列为数列x(0)的1次累加生成数列。

类似的,有x(r)(k)=∑x(r-1)(i),k=1,2,...,n,r≥1,x(r)(k)称为x(0)的r次累加生成数列。

邻值序列生成为:

如果原始数据序列为x(0)=(x(0)(1),x(0)(2),…x(0)(n)),称任意一对相邻元素x(0)(k-1),x(0)(k)互为邻值。对于常数α∈[0,1],

令z(0)(k)=αx(0)(k)+(1-α)x(0)(k-1),k=2,3,…,n,由此得到的数列称为邻值生成序列,权α也称为生成系数;

特别地,当生成系数α=0.5时,则称该数列为均值生成序列,也称为等权邻值生成序列。

建立gm(1,1)模型:

在上述原始数据序列经过数据的检验与处理之后,可以以原始数据序列建立gm(1,1)模型

x(0)(k)+αz(0)(k)=b

用回归分析求得a,b的估计值,于是相应的白化模型为

解为

于是得到预测值

从而相应地得到预测值

通过上述gm(1,1)模型计算目标训练数据集中历史数据对应的预测值,对a、b进行迭代,使残差最小,即目标训练数据集中真实值与预测值的差值的绝对值之和最小,从而得到迭代后的实时a、b。

将迭代后的实时a、b代入gm(1,1)模型,并将目标训练数据集代入更新后的gm(1,1)模型,计算得到下一时刻或需要预测的时间点的值。

在实际应用中,通过对多种预测模型的分析,上述灰度预测模型在短周期的时间维度上(如分钟级别或者小时级别的时间维度)具有较高的准确性,具体地,上述第一预测模型可以为灰度预测模型,从而提升事件的预测装置在短周期的时间维度上获取预测结果的准确性。

应当说明的是,对事件在短周期的时间维度上进行预测,除通过上述灰度预测模型之外,也可以通过其他预测模型,例如:还可以通过平均值计算模型,即将预测时间点或者时间段之前的一端时间内的历史数据的平均值,作为上述预测结果,等等,在此并不进行限定。

而对中等时长周期的时间维度(如天级别的时间维度)的数据训练集的分析得知,事件所处的网络环境和网络传播特征是传播趋势的核心特征,通过采用与记忆曲线模型相关联的预测模型进行预测具有较高的拟合性能,从而可以使预测结果的准确性较高。

具体地,上述与记忆曲线模型相关联的预测模型,可以是其他预测模型与记忆曲线模型相结合的预测模型,例如:可以是用于计算事件热度的事件热度计算模型与记忆曲线模型相结合的模型,等等,在此并不进行限定。

其中,上述用于计算事件热度的事件热度计算模型可以是牛顿热力学模型或者其他可计算事件热度的模型,在此并不进行限定。

另外,对于长周期的时间维度(如周级别、月级别或者年级别的时间维度)的数据训练集的分析得知,事件的发展趋势受到事件的类型、相关实体的声量、相关行业的类型以及过去时间中数据的影响特征,并且还与其他特性的弱相关。还有,通过对长周期的时间维度的数据的分析,大部分事件的声量分布都符合随机分布。这里,通过采用随机分布模型对时间在长周期的时间维度进行预测具有较高的拟合性能。

具体地,上述随机分布模型可以是高斯分布模型、二项分布模型、泊松分布模型和卡方分布模型等中的任一项。

另外,通过对事件的数据的分析,不同事件类型的事件的声量符合不同的随机分布,即上述随机分布模型与事件的时间类型相关联,例如:对于容易发生的事件的声量和发生周期长或者频率较低的事件的声量所符合的随机分布不同,等等。

本发明具体实施例中,在第一时间维度为短周期的时间维度、第二时间维度维度为中等时长周期的时间维度以及第三时间维度为长周期的时间维度的情况下,上述第一预测模型可以是灰度预测模型,第二预测模型可以是牛顿热力学-记忆曲线模型,以及第三预测模型可以是高斯模型。

例如:事件预测的装置中可以预设小时级别的时间维度与灰度预测模型的对应关系,天级别的时间维度与牛顿热力学-记忆曲线模型的对应关系,以及月级别的预测模型与高斯模型的对应关系。

上述实施例中对于通过灰度预测模型获取目标时间维度的预测结果的过程已进行描述,在此并不再重复赘述第一预测模型为灰度预测模型时获取预测结果的过程。

其中,在目标时间维度为第二时间维度的情况下,事件的预测装置可以将第二预测模型确定为目标预测模型。

而在中等时长周期的时间维度获取事件的预测结果,通过采用与记忆曲线模型相关联的预测模型进行预测具有较高的拟合性能,即具体地,上述第二预测模型可以为:与记忆曲线模型相关联的预测模型,从而提升预测结果的准确性较高。

更为具体地,在目标预测模型为第二预测模型的情况下,目标预测模型的实时相关参数包括牛顿热力学模型的第一相关参数,以及记忆曲线模型的第二相关参数;

上述通过目标预测模型、目标预测模型的实时相关参数以及目标训练数据集,计算得到事件在目标时间维度上的预测结果,包括:

根据目标训练数据集、牛顿热力学模型以及第一相关参数,计算事件的热力值;

根据记忆曲线模型以及第二相关参数,计算事件在各时间点的记忆保存量;

计算事件的热力值和事件在各时间点的记忆保存量的乘积,得到时间在第二时间维度上的预测结果。

这里,通过牛顿热力学-记忆曲线模型可以实现在第二时间维度(天级别的时间维度)获取到较高的准确性的预测结果。

对于上述通过牛顿热力学-记忆曲线模型获取事件在第二时间维度上的预测结果的过程,可以大致分为事件热度的计算、事件记忆保存量的计算以及事件趋势的预测三个过程,具体如下:

在事件热度的计算过程中,通过牛顿热力学定律中的热力值的计算公式计算得出,热力值的计算公式为

k为散热系数,即第一相关参数;

这里,可以通过对事件集合中每个事件的相关热力值计算,以求解上述公式中的相关参数,如dq和θ两个参数。其中,上述相关热力值计算可以包括:

文档温度计算,即将目标数据训练集中的数据相加并求对数得到,如:在上述预测结果为文档的阅读数、转发数以及被引用数的情况下,将文档的阅读数、转发数以及被引用数相加求对数得到;

事件温度计算,即将文档温度大于某一参数(如预设的文档激活参数)的温度相加得到;

事件环境温度计算,即将事件集合中每一事件的时间温度加权平均计算得到。

而在上述根据目标训练数据集、牛顿热力学模型以及第一相关参数,计算事件的热力值,可以是在热力值的计算公式中各相关参数确定的情况下,可以是将上述文档温度、事件温度以及时间环境温度中的至少一个作为上述t,以计算得到事件的热力值。

在主题记忆保存量的计算过程中,上述记忆曲线模型可以是任何能够使得到的记忆保存量具有随着时间变化、开始下降很快并渐渐趋于稳定值的记忆曲线模型,例如:上述记忆曲线模型可以是艾宾浩斯记忆模型。其中,艾宾浩斯记忆模型的保存量的计算公式为

j(t)=eb/(t+t0),

b为常量,即第二相关参数。

在事件趋势的预测过程中,事件的趋势即上述预测结果由事件趋势的预测公式计算得出,事件趋势的预测公式为

r(f,j)=f(x)×j(t)。

这里,应当说明的是,在通过牛顿热力学-记忆曲线模型获取事件在第二时间维度上的预测结果的过程,上述第一相关参数k和第二相关参数b可以是预设值,即对于不同的目标训练数据集采用固定的k和b。

当然,上述第一相关参数k和第二相关参数b也可以是通过迭代处理得到的实时相关参数,例如:可以是通过k和b的初始值计算得到目标训练数据集中部分或者全部数据对应的预测值,并将目标训练数据集中的真实值与预测值的差值的绝对值之和作为残差,通过对第一相关参数k和第二相关参数b进行迭代,使残差最小化,从而得到第一相关参数k和第二相关参数b的实时参数,并通过计算得到的实时k和b获取预测结果。

应该说明的是,上述对第一相关参数k和第二相关参数b进行迭代,可以是采用梯度下降法等,在此并不进行限定。

由上述实施例可知,在长周期的时间维度上,大部分事件的声量符合随机分布,且不同事件类型的事件的声量符合的随机分布不同,具体地,第三预测模型为:与事件的事件类型存在关联关系的随机分布模型。

这里,通过选用与事件的事件类型存在关联关系的随机分布模型,来获取事件在第三时间维度上的预测结果,从而使选择的预测模型更合适,进一步提升预测结果的准确性。

而对于绝大部分事件,事件的声量通常符合高斯分布,即上述第三预测模型可以是高斯分布模型,而对于通过高斯分布模型获取事件在第三时间维度上的预测结果的过程,可以大致分为数据归一化、高斯分布模型参数求解以及传播趋势预测三个过程。

具体地,在目标预测模型为所述第三预测模型,且第三预测模型为高斯分布模型的情况下,上述根据与目标训练数据集,获取目标预测模型的实时相关参数,包括:

对目标训练数据集中的数据进行数据归一化处理,得到归一化后的数据序列;

获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差;

根据归一化后的数据序列对期望值进行迭代处理,得到迭代处理后的期望值;

其中,实时相关参数包括标准差和迭代处理后的期望值。

这里,事件的预测装置可以获取高斯分布模型的标准差和迭代处理后的期望值,并通过目标训练数据集、高斯分布模型以及获取的标准差和迭代处理后的期望值,从而可以提升事件在第三时间维度上的预测结果的准确性。

其中,在数据归一化过程中,通过归一化方法的数学表达式对目标训练数据集(如月级别的时间维度关联的数据集)进行归一化处理,归一化方法的数学表达式为

x(i)表示目标训练数据集中的数据,且

事件在长周期的时间维度上的数据通常符合高斯分布,即正态分布。而在高斯分布中若随机变量x服从一个数学期望值为μ、方差为σ^2的正态分布,记为n(μ,σ^2),即

其中,概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。

在上述得到归一化后的数据序列之后,事件的预测装置还可以调取事件集合中与归一化后的数据序列中每一数据关联的相关特征,即包括实体日均声量、相关行业类型、行业日均声量等,并通过与归一化后的数据序列中每一数据关联的相关特征获取上述高斯分布中的μ和σ。

具体地,上述获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差,包括:

通过全连接神经网络模型,获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差,其中,全连接神经网络模型的输入层为归一化后的数据序列中各数据的相关特征;输出层为期望值和标准差。

这里,通过全连接神经网络模型可以获取到更为准确的μ和σ,从而可以减少对期望值进行迭代处理中的计算量,提升处理效率,另外,还可以提升预测结果的准确性。

例如:全连接神经网络模型的输入层包括12个节点、隐藏层包括20个节点以及输出层包括2个节点,将输入层的12个节点为归一化后的数据序列中各数据的12个相关特征,输出层的2个节点为μ和σ。

其中,上述通过全连接神经网络模型获取期望值和标准差的训练过程,可以分为前向传播和反向传播两个过程。前向传播是指在上述全连接神经网络模型参数下,通过输入层的数据层层传播至输出层,与真实值对比并计算出误差的过程。如果误差不达要求或未超过指定的迭代次数,则进入反向传播过程,这个过程使用梯度下降方法迭代求解最小残差,通过修改连接各节点的边上的权值使损失函数达到最小。另外,全连接神经网络模型训练结果的输出,就是上述训练过程最后产出的整个全连接神经网络中连接各节点边上的权值。

当然,上述获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差,并不局限于通过上述全连接神经网络模型,也可以是其他方法。

而在上述获取到高斯分布模型的μ和σ之后,可以将通过高斯分布模型获取归一化后的数据序列中部分数据对应的预测值,并通过对μ进行迭代处理,使残差最小,得到迭代后的期望值μ',即

这里,上述高斯分布模型参数求解包括获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差,以及根据归一化后的数据序列对所述期望值进行迭代处理,得到迭代处理后的期望值,从而得到高斯分布模型的实时相关参数μ'和σ。

在传播趋势预测过程中,事件的预测装置可以通过目标训练数据集、高斯分布以及实时相关参数μ'和σ,计算预测值,并对预测值进行还原,得到事件在第三时间维度上的预测结果,即通过如下公式实现:

应当说明的是,本发明实施例中,并不局限有通过上述灰度预测模型获取短周期的时间维度的预测结果,通过上述牛顿热力学-记忆曲线模型获取中等时长周期的时间维度的预测结果,以及通过上述高斯分布模型获取长周期的时间维度的预测结果,也可以通过其他预测模型实现,在此并不进行赘述。

本发明实施例中,通过确定目标时间维度;在预设的至少两个预测模型中选择与目标时间维度对应的目标预测模型,其中,所述至少两个预测模型中,不同预测模型用于获取不同时间维度上的预测结果;基于所述目标预测模型,以及所述事件与所述目标时间维度关联的目标训练数据集,获取所述事件在所述目标时间维度上的预测结果。这样,在对事件进行预测过程中,能够通过调用目标时间维度所对应的预测模型,获取目标时间维度上的预测结果,在不同时间维度具有不同特性的情况下,可以提升预测结果的准确性。

参见图2,图中示出了本发明实施例提供的事件的预测装置20的结构框图。如图2所示,事件的预测装置20包括:

时间维度确定模块21,用于确定目标时间维度;

预测模型选择模块22,用于在预设的至少两个预测模型中选择与目标时间维度对应的目标预测模型,其中,至少两个预测模型中,不同预测模型用于获取不同时间维度上的预测结果;

预测结果获取模块23,用于基于目标预测模型,以及事件与目标时间维度关联的目标训练数据集,获取事件在目标时间维度上的预测结果。

可选的,如图3所示,预测结果获取模块23,包括:

参数获取单元231,用于根据目标训练数据集,获取目标预测模型的实时相关参数;

计算单元232,用于通过目标预测模型、实时相关参数以及目标训练数据集,计算得到事件在目标时间维度上的预测结果;

其中,在目标预测模型的相关参数为实时相关参数的情况下,目标训练数据集的残差最小。

可选的,至少两个预测模型包括:

用于获取第一时间维度上的预测结果的第一预测模型;

用于获取第二时间维度上的预测结果的第二预测模型;

用于获取第三时间维度上的预测结果的第三预测模型;

其中,第一时间维度小于第二时间维度,第二时间维度小于第三时间维度。

可选的,第三预测模型为:与事件的事件类型存在关联关系的随机分布模型。

可选的,如图4所示,在目标预测模型为第三预测模型,且第三预测模型为高斯分布模型的情况下,参数获取单元231,包括:

归一化子单元2311,用于对目标训练数据集中的数据进行数据归一化处理,得到归一化后的数据序列;

参数获取子单元2312,用于获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差;

参数迭代子单元2313,用于根据归一化后的数据序列对期望值进行迭代处理,得到迭代处理后的期望值;

其中,实时相关参数包括标准差和迭代处理后的期望值。

可选的,参数获取子单元231,具体用于:

通过全连接神经网络模型,获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差,其中,全连接神经网络模型的输入层为归一化后的数据序列中各数据的相关特征;输出层为期望值和标准差。

可选的,第二预测模型为:与记忆曲线模型相关联的预测模型。

可选的,在目标预测模型为第二预测模型的情况下,目标预测模型的实时相关参数包括牛顿热力学模型的第一相关参数,以及记忆曲线模型的第二相关参数;如图5所示,计算单元232,包括:

热力值计算子单元2321,用于根据目标训练数据集、牛顿热力学模型以及第一相关参数,计算事件的热力值;

记忆保存量计算子单元2322,用于根据记忆曲线模型以及第二相关参数,计算事件在各时间点的记忆保存量;

预测结果计算子单元2323,用于计算事件的热力值和事件在各时间点的记忆保存量的乘积,得到时间在第二时间维度上的预测结果。

可选的,第一预测模型为灰度预测模型。

需要说明的是,本实施例中上述事件的预测装置20可以实现本发明实施例中图1对应的方法实施例中的各个过程,以及达到相同的有益效果,为避免重复,此处不再赘述。

下面对本发明实施例提供的设备进行说明。

参见图6,图中示出了本发明实施例提供的事件的预测装置60的结构示意图。如图6所示,事件的预测装置60包括:处理器61、收发机62、存储器63、用户接口64和总线接口,其中:

处理器61,用于读取存储器63中的程序,执行下列过程:

确定目标时间维度;

在预设的至少两个预测模型中选择与目标时间维度对应的目标预测模型,其中,至少两个预测模型中,不同预测模型用于获取不同时间维度上的预测结果;

基于目标预测模型,以及事件与目标时间维度关联的目标训练数据集,获取事件在目标时间维度上的预测结果。

在图6中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器61代表的一个或多个处理器和存储器63代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口提供接口。收发机62可以是多个元件,即包括发送机和接收机,提供用于在传输介质上与各种其他装置通信的单元。针对不同的用户设备,用户接口64还可以是能够外接内接需要设备的接口,连接的设备包括但不限于小键盘、显示器、扬声器、麦克风、操纵杆等。

处理器61负责管理总线架构和通常的处理,存储器63可以存储处理器61在执行操作时所使用的数据。

可选地,处理器61,具体用于:

根据目标训练数据集,获取目标预测模型的实时相关参数;

通过目标预测模型、实时相关参数以及目标训练数据集,计算得到事件在目标时间维度上的预测结果;

其中,在目标预测模型的相关参数为实时相关参数的情况下,目标训练数据集的残差最小。

可选地,至少两个预测模型包括:

用于获取第一时间维度上的预测结果的第一预测模型;

用于获取第二时间维度上的预测结果的第二预测模型;

用于获取第三时间维度上的预测结果的第三预测模型;

其中,第一时间维度小于第二时间维度,第二时间维度小于第三时间维度。

可选的,第三预测模型为:与事件的事件类型存在关联关系的随机分布模型。

可选地,在目标预测模型为第三预测模型,且第三预测模型为高斯分布模型的情况下,处理器61,具体用于:

对目标训练数据集中的数据进行数据归一化处理,得到归一化后的数据序列;

获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差;

根据归一化后的数据序列对期望值进行迭代处理,得到迭代处理后的期望值;

其中,实时相关参数包括标准差和迭代处理后的期望值。

可选地,处理器61,具体用于:

通过全连接神经网络模型,获取归一化后的数据序列中各数据所服从的高斯分布的期望值和标准差,其中,全连接神经网络模型的输入层为归一化后的数据序列中各数据的相关特征;输出层为期望值和标准差。

可选的,第二预测模型为:与记忆曲线模型相关联的预测模型。

可选地,在目标预测模型为第二预测模型的情况下,目标预测模型的实时相关参数包括牛顿热力学模型的第一相关参数,以及记忆曲线模型的第二相关参数;

处理器61,具体用于:

根据目标训练数据集、牛顿热力学模型以及第一相关参数,计算事件的热力值;

根据记忆曲线模型以及第二相关参数,计算事件在各时间点的记忆保存量;

计算事件的热力值和事件在各时间点的记忆保存量的乘积,得到时间在第二时间维度上的预测结果。

可选地,第一预测模型为灰度预测模型。

需要说明的是,本实施例中上述事件的预测装置60可以实现本发明实施例中图1对应的方法实施例中的各个过程,以及达到相同的有益效果,为避免重复,此处不再赘述。

本发明实施例还提供一种设备,包括处理器61,存储器63,存储在存储器63上并可在处理器61上运行的计算机程序,该计算机程序被处理器61执行时实现上述的事件的预测方法实施例中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述的事件的预测方法实施例中的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(read-onlymemory,简称rom)、随机存取存储器(randomaccessmemory,简称ram)、磁碟或者光盘等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台设备(可以是手机,计算机等)执行本发明各个实施例所述的方法。

上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本发明的保护之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1