一种信息扩散预测的方法和装置与流程

文档序号:17239990发布日期:2019-03-30 08:32阅读:303来源:国知局
一种信息扩散预测的方法和装置与流程

本发明涉及信息传播领域,特别是涉及一种信息扩散预测的方法和装置。



背景技术:

近几年社会网络分析领域的相关研究已经愈发受到人们的重视,而其中信息传播已成为研究焦点之一。目前随着研究的深入,信息传播领域的研究已经逐步分成了四类:社区发现、社会影响预测、信息源检测以及链接预测。在链接预测中还有一个细分的研究领域,即传播预测,其目标是预测在社交网络中信息最终会影响到哪些人群。

目前传播预测的模型分为两类,相似度模型和概率模型。相似度模型预测时以大量的历史数据为依据,通过找到网络结构内在的规律,以及网络中每个用户的特定社交行为规律和偏好发现相似性,通过分类或聚类算法将相似度高的结点用户放在一起,并且假设越相近的用户越容易彼此影响;概率模型预测时,以大量的用户信息作为输入信息,通过参数模型特征,通过最大化(或最小化,视模型而定)目标函数求得最优参数解,从而能最好的拟合已有数据(训练集),通过用户间的概率预测训练集中的数据,需要大量的历史数据才能通过概率进行预测。

然而,以上两种模型的核心是用户在网络中的行为关系,包括彼此的好友关系网络,用户相似性等;需要大量的用户信息才能对信息的传播进行预测。



技术实现要素:

本发明实施例的目的在于提供一种信息扩散预测的方法和装置,以解决目前信息传播中需要大量的用户信息才能进行预测的问题。

达到上述目的,本发明实施例公开了一种信息扩散预测的方法,包括:

获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,当前用户和前一个用户是按照传播所述预设信息的先后顺序进行排序的,且前一个用户传播预设信息在当前用户传播预设信息之前,用户特征为用户传播预设信息时与预设信息相关的特征;

映射前一个用户和与前一个用户对应的用户特征到潜在空间向量中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在空间向量中,得到第二用户结点和第二用户特征向量,潜在空间向量为包括第一用户结点、第二用户结点、第一用户特征向量和第二用户特征向量的潜在空间;

根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在空间向量模型;其中,潜在空间向量模型至少包括:处于潜在空间向量坐标系的原点处的第一用户结点到与处于潜在空间向量坐标系内的其他相邻结点的向量,该其他相邻结点为除第一用户结点以外的其他结点;

对潜在空间向量模型进行学习,得到与第一用户结点和第一用户特征向量、及第二用户结点和第二用户特征向量相关的核函数公式;

根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,传播趋势为第二用户结点能够传播预设信息给其他相邻结点中的至少一个相邻结点;或者,第二用户结点传播预设信息给其他相邻结点中的相邻接点的先后顺序,其中,先后顺序是按照核函数的大小进行排序的。

较优地,映射前一个用户和与前一个用户对应的用户特征到潜在空间向量中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在空间向量中,得到第二用户结点和第二用户特征向量,包括:

对前一个用户对应的用户特征对应分配预设向量,得到前一个用户的第一用户特征向量,将位于潜在空间向量中坐标原点处的前一个用户,确定为前一个用户的第一用户结点;

对当前用户对应的用户特征对应分配预设向量,得到当前用户的第二用户特征向量,将位于潜在空间向量坐标系中的第一坐标点处的当前用户,确定为当前用户的第二用户结点。

较优地,该核函数公式为:

其中,k(x,y)为核函数,x为第一用户结点,r为第一用户特征向量,y为第二用户结点,||·||d为欧氏距离,t为时间,x,r,y分别为R维向量R为所述潜在空间向量模型的维数。

较优地,根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,包括:

根据该核函数公式,确定该核函数公式的单调性及该核函数公式中的欧氏距离的单调性;

根据该核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,该核函数公式中的欧氏距离的单调性与该核函数公式的单调性相反。

较优地,根据该核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势之后,本发明实施例的信息扩散预测的方法还包括:

根据该核函数公式中的欧氏距离:

f(v)=min{||y+r-v||d}

确定其他相邻结点中传播预设信息的用户结点;

其中,y为第二用户结点,r为第二用户特征向量,v为社交网络中没有传播预设信息的其他用户结点,||·||d为欧氏距离,x,r,v分别为R维向量,R为潜在空间向量的维数,f(v)为社交网络中没有传播预设信息的其他用户结点v与第二用户结点y的最小欧氏距离,第二用户特征向量与第一用户特征向量相同。

较优地,根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势之后,本发明实施例的信息扩散预测的方法还包括:

通过随机梯度下降算法,确定锁链损失函数公式的最小值;

获取锁链损失函数公式的最小值,对预测的传播趋势进行误差估计。

为了达到上述目的,本发明实施例公开了一种信息扩散预测的装置,包括:

获取模块,用于获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,当前用户和前一个用户是按照传播预设信息的先后顺序进行排序的,且前一个用户传播预设信息在当前用户传播预设信息之前,用户特征为用户传播预设信息时与预设信息相关的特征;

映射模块,用于映射前一个用户和与前一个用户对应的用户特征到潜在空间向量中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在空间向量中,得到第二用户结点和第二用户特征向量,潜在空间向量为包括第一用户结点、第二用户结点、第一用户特征向量和第二用户特征向量的潜在空间;

建模模块,用于根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在空间向量模型;其中,潜在空间向量模型至少包括:处于潜在空间向量坐标系的原点处的第一用户结点到与处于潜在空间向量坐标系内的其他相邻结点的向量,其他相邻结点为除第一用户结点以外的其他结点;

学习模块,用于对潜在空间向量模型进行学习,得到与第一用户结点和第一用户特征向量、及第二用户结点和第二用户特征向量相关的核函数公式;

预测模块,用于根据核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,传播趋势为第二用户结点能够传播预设信息给其他相邻结点中的至少一个相邻结点;或者,第二用户结点传播预设信息给其他相邻结点中的相邻接点的先后顺序,该先后顺序是按照核函数的大小进行排序的。

较优地,映射模块,具体用于:

对前一个用户对应的用户特征对应分配预设向量,得到前一个用户的第一用户特征向量,将位于潜在空间向量中坐标原点处的前一个用户,确定为前一个用户的第一用户结点;

对当前用户对应的用户特征对应分配预设向量,得到当前用户的第二用户特征向量,将位于潜在空间向量坐标系中的第一坐标点处的当前用户,确定为当前用户的第二用户结点。

较优地,核函数公式为:

其中,k(x,y)为核函数,x为第一用户结点,r为第一用户特征向量,y为第二用户结点,||·||d为欧氏距离,t为时间,x,r,y分别为R维向量,R为潜在空间向量模型的维数。

较优地,预测模块还包括:

计算子模块,用于根据核函数公式,确定核函数公式的单调性及核函数公式中的欧氏距离的单调性;

预测子模块,用于根据核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,核函数公式中的欧氏距离的单调性与核函数公式的单调性相反。

由上述的技术方案可见,本发明实施例提供了一种信息扩散预测的方法和装置,通过使用核函数公式对第一用户结点、第二用户结点及第一用户特征向量进行学习,进而使用核函数公式对预设信息的传播趋势进行预测,不需要大量用户信息作为样本就可以进行预测,减小了样本量,提高了预测速度,解决了目前信息传播中需要大量的用户信息才能进行预测的问题。

当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的信息扩散预测的方法的流程图;

图2为本发明实施例的信息扩散预测的装置的结构框图;

图3为本发明实施例的信息扩散预测的装置的预测模块的结构框图;

图4为本发明实施例的信息扩散预测的装置的潜在空间向量模型与热力学传播模型、独立级联模型及热量扩散模型在追踪社区上的准确率对比图;

图5为本发明实施例的信息扩散预测的装置的潜在空间向量模型与热力学传播模型、独立级联模型及热量扩散模型在谷歌社区上的准确率对比图;

图6为本发明实施例的信息扩散预测的装置的潜在空间向量模型与热力学传播模型、独立级联模型及热量扩散模型在掘客上的准确率对比图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,图1为本发明实施例的信息扩散预测的方法的流程图,本发明实施例的信息扩散预测的方法包括:

S100:获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,当前用户和前一个用户是按照传播所述预设信息的先后顺序进行排序的,且前一个用户传播预设信息在当前用户传播预设信息之前;

具体地,预设信息为在社交网络中传播任一个信息的信息,用户特征为用户传播该预设信息时与该预设信息相关的特征。

比如,前一个用户和当前用户在社交网络中传播了一条关于打篮球的信息,那么,前一个用户的用户特征和当前用户的用户特征都是篮球。

S110:映射前一个用户和与前一个用户对应的用户特征到潜在空间向量中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在空间向量中,得到第二用户结点和第二用户特征向量;

其中,该潜在空间向量为包括第一用户结点、第二用户结点、第一用户特征向量和第二用户特征向量的潜在空间

在本步骤中,通过映射,得到第一用户结点和第一用户特征向量、以及第二用户结点和第二用户特征向量,能够在潜在空间向量模型中进行表示。

S120:根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在空间向量模型;其中,潜在空间向量模型至少包括:处于潜在空间向量坐标系的原点处的第一用户结点到与处于潜在空间向量坐标系内的其他相邻结点的向量,该其他相邻结点为除第一用户结点以外的其他结点;

S130:对潜在空间向量模型进行学习,得到与第一用户结点和第一用户特征向量、及第二用户结点和第二用户特征向量相关的核函数公式;

具体地,该核函数公式为:

其中,k(x,y)为核函数,x为第一用户结点,r为第一用户特征向量,y为第二用户结点,||·||d为欧氏距离,t为时间,x,r,y分别为R维向量R为所述潜在空间向量模型的维数。

S140:根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势。

具体地,在本步骤中,上述的传播趋势可以是第二用户结点能够传播该预设信息给其他相邻结点中的几个相邻结点;还可以是

第二用户结点传播该预设信息给其他相邻结点中的相邻接点的先后顺序,其中,先后顺序是按照核函数的大小进行排序的,核函数值大,先传播给该相邻结点,核函数值小,后传播给该相邻结点。

可见,本发明实施例的信息扩散预测的方法,通过使用核函数公式对第一用户结点、第二用户结点及第一用户特征向量进行学习,进而使用核函数公式对预设信息的传播趋势进行预测,不需要大量用户信息作为样本就可以进行预测,减小了样本量,提高了预测速度,解决了目前信息传播中需要大量的用户信息才能进行预测的问题。

优选地,本发明实施例的信息扩散预测的方法中,映射前一个用户和与前一个用户对应的用户特征到潜在空间向量中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在空间向量中,得到第二用户结点和第二用户特征向量,包括:

第一步,对前一个用户对应的用户特征对应分配预设向量,得到前一个用户的第一用户特征向量,将位于潜在空间向量中坐标原点处的前一个用户,确定为前一个用户的第一用户结点;

第二步,对当前用户对应的用户特征对应分配预设向量,得到当前用户的第二用户特征向量,将位于潜在空间向量坐标系中的第一坐标点处的当前用户,确定为当前用户的第二用户结点。

具体地,本步骤中的第一坐标点,按照实际需求,为当前用户在潜在空间向量坐标系中的位置,可以是潜在空间向量坐标系中的除原点以外的其他坐标点。

优选地,本发明实施例的信息扩散预测的方法中,根据核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,包括:

第一步,根据该核函数公式,确定该核函数公式的单调性及该核函数公式中的欧氏距离的单调性;

第二步,根据该核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,该核函数公式中的欧氏距离的单调性与该核函数公式的单调性相反。

在本步骤中,通过确定该核函数公式中的欧氏距离的单调性与该核函数公式的单调性相反,将通过核函数公式进行信息扩散预测转换为通过欧氏距离进行信息扩散预测,消除了时间对传播趋势的影响,同时,简化了计算过程,提高了预测速度。

优选地,根据该核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势之后,本发明实施例的信息扩散预测的方法还包括:

根据该核函数公式中的欧氏距离:

f(v)=min{||y+r-v||d}

确定其他相邻结点中传播预设信息的用户结点;

其中,y为第二用户结点,r为第二用户特征向量,v为社交网络中没有传播预设信息的其他用户结点,||·||d为欧氏距离,x,r,v分别为R维向量,R为潜在空间向量的维数,f(v)为社交网络中没有传播预设信息的其他用户结点v与第二用户结点y的最小欧氏距离,第二用户特征向量与第一用户特征向量相同。

具体地,在根据该核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势之后,本发明实施例的信息扩散预测的方法还包括:

通过随机梯度下降算法,确定锁链损失函数公式的最小值;

获取锁链损失函数公式的最小值,对预测的传播趋势进行误差估计。

具体地,根据公式:

f(z)=min(0,|1-z|)

通过随机梯度下降算法,确定锁链损失函数公式的最小值,对预测的传播趋势进行误差估计,其中,f(z)为锁链损失函数公式的最小值,z为输入的变量,可以是核函数的值,还可以是欧氏距离的值。

具体地,本步骤中的误差估计具体为:上述锁链损失函数公式的最小值越小,则说明预测的越准确,反之,锁链损失函数公式的最小值越大,则说明预测的越不准确。

为了更清楚的说明本发明实施例的一种信息传播的预测方法,下面以对第l条信息的传播进行预测为例对本发明实施例进行说明:

假设C为社交网络中所有数据集中的信息序列(即一条消息沿着时间轴依次影响的用户结点)集合,Cl为第l条信息序列,ui、uj分别为潜在空间向量模型中没有传播第l条信息的两个用户结点,为潜在空间向量中传播第l条信息的当前用户结点,分别为没有传播第l条信息的两个用户结点ui、uj传播第l条信息的时间,为当前用户的特征向量。

分别将ui、uj、分别代入核函数公式得到:

当时,可知用户结点ui比用户结点uj更容易传播第l条信息;

当时,可知用户结点uj比用户结点ui更容易传播第l条信息。

具体地,假设

由核函数公式的单调性知,若则:

经过变换得到:

因此,若用户结点ui的核函数值越大,则在潜在空间向量模型中,ui距离越近,就越容易传播第l条信息。

进一步地,根据本发明实施例的信息扩散预测的方法,可以通过公式:

确定多个用户结点中传播第l条信息的用户结点对应的用户。

其中,un为社交网络中没有传播第l条信息的其他用户结点,为当前用户结点,为当前用户结点的特征向量,||·||d为欧氏距离,f(un)为社交网络中社交网络中没有传播第l条信息的其他用户结点与当前用户节点的最小欧氏距离。

具体地,在进行信息扩散预测时,选择与欧氏距离最近的用户,即为最有可能传播第l条信息的用户。

进一步地,为了使信息扩散预测更加准确,通过随机梯度下降算法,确定锁链损失函数公式的最小值,对预测的传播趋势进行误差估计。其中,随机梯度下降算法为现有技术,在此不再赘述。

参见图2,图2为本发明实施例的信息扩散预测的装置的结构框图,本发明实施例的信息扩散预测的装置包括:

获取模块200,用于获取在社交网络中传播预设信息的当前用户和用户特征、以及前一个用户和用户特征,其中,当前用户和前一个用户是按照传播预设信息的先后顺序进行排序的,且前一个用户传播预设信息在当前用户传播预设信息之前,用户特征为用户传播预设信息时与预设信息相关的特征。

映射模块210,用于映射前一个用户和与前一个用户对应的用户特征到潜在空间向量中,得到第一用户结点和第一用户特征向量,以及映射当前用户和与当前用户对应的用户特征到潜在空间向量中,得到第二用户结点和第二用户特征向量,潜在空间向量为包括第一用户结点、第二用户结点、第一用户特征向量和第二用户特征向量的潜在空间。

建模模块220,用于根据第一用户结点和第一用户特征向量、第二用户结点和第二用户特征向量,建立潜在空间向量模型;其中,潜在空间向量模型至少包括:处于潜在空间向量坐标系的原点处的第一用户结点到与处于潜在空间向量坐标系内的其他相邻结点的向量,其他相邻结点为除第一用户结点以外的其他结点;

学习模块230,用于对潜在空间向量模型进行学习,得到与第一用户结点和第一用户特征向量、及第二用户结点和第二用户特征向量相关的核函数公式;

具体地,核函数公式为:

其中,k(x,y)为核函数,x为第一用户结点,r为第一用户特征向量,y为第二用户结点,||·||d为欧氏距离,t为时间,x,r,y分别为R维向量,R为潜在空间向量模型的维数。

预测模块240,用于根据核函数公式,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,传播趋势为第二用户结点能够传播预设信息给其他相邻结点中的至少一个相邻结点;或者,第二用户结点传播预设信息给其他相邻结点中的相邻接点的先后顺序,该先后顺序是按照核函数的大小进行排序的。

需要说明的是,本发明实施例的装置是应用上述信息扩散预测的方法的装置,则上述信息扩散预测的方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。

优选地,参见图3,图3为本发明实施例的信息扩散预测的装置的预测模块的结构框图,该预测模块240包括:

计算子模块241,用于根据核函数公式,确定核函数公式的单调性及核函数公式中的欧氏距离的单调性;

预测子模块242,用于根据核函数公式中的欧氏距离的单调性,预测第二用户结点传播预设信息至其他相邻结点中的至少一个相邻结点的传播趋势,其中,核函数公式中的欧氏距离的单调性与核函数公式的单调性相反。

优选地,本发明实施例的信息扩散预测的装置中映射模块210,具体用于:

对前一个用户对应的用户特征对应分配预设向量,得到前一个用户的第一用户特征向量,将位于潜在空间向量中坐标原点处的前一个用户,确定为前一个用户的第一用户结点。

对当前用户对应的用户特征对应分配预设向量,得到当前用户的第二用户特征向量,将位于潜在空间向量坐标系中的第一坐标点处的当前用户,确定为当前用户的第二用户结点。

参见图4、图5、图6,图4为本发明实施例的信息扩散预测的装置的潜在空间向量模型与热力学传播模型、独立级联模型及热量扩散模型在追踪社区上的准确率对比图,图5为本发明实施例的信息扩散预测的装置的潜在空间向量模型与热力学传播模型、独立级联模型及热量扩散模型在谷歌社区上的准确率对比图,图6为本发明实施例的信息扩散预测的装置的潜在空间向量模型与热力学传播模型、独立级联模型及热量扩散模型在掘客上的准确率对比图。可以得到,本发明实施例的信息扩散预测的装置使用潜在空间向量模型的预测平均准确率均高于其他三种模型。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1