一种社交媒体内容传播预测方法、装置、计算设备和存储介质

文档序号:37521951发布日期:2024-04-01 14:39阅读:58来源:国知局
一种社交媒体内容传播预测方法、装置、计算设备和存储介质

本发明涉及数据分析,具体涉及一种社交媒体内容传播预测方法、装置、计算设备和存储介质。


背景技术:

1、随着互联网的迅速发展和普及,出现了大量在线社交网络,它们已经成为人们分享、传播和获取信息的主要平台。媒体可以在平台上发布内容,同时也有大量用户通过点赞、转发等行为加速内容的传播过程。

2、现有技术对内容传播预测的研究主要集中在图嵌入领域,通过将历史传播建模为图数据,利用机器学习、深度学习等方法建模用户之间内容传播的过程。对进行商业推广、社会热点追踪和敏感内容监控等具有重要意义。通过分析内容传播的特征,可以调节内容的传播范围,影响传播的用户群体或者避免内容的快速传播。现有的模型大多将社交媒体内容传播图嵌入到欧几里得空间中,忽略了此类图数据内蕴的层次化和无标度特性,导致了嵌入的失真和更差的预测结果。


技术实现思路

1、鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种社交媒体内容传播预测方法,其包括:

2、步骤s101:获取历史社交媒体内容对应的用户历史内容传播关系数据,根据历史传播关系数据,按照一定的时间步长构建动态社交媒体传播网络离散时间快照,得到每个时间快照中每个用户的第一双曲嵌入向量序列;

3、步骤s102:根据动态社交媒体传播网络离散时间快照和用户的第一双曲嵌入向量序列,在每个时间快照上计算得到包含局部特征的用户第二双曲嵌入向量序列;

4、步骤s103:根据动态社交媒体传播网络离散时间快照和用户的第二双曲嵌入向量序列,把每个时间快照上的同一个节点表示看作是时间序列,在节点时间序列上计算得到用户的第三双曲嵌入向量序列;

5、步骤s104:根据计算得到的用户第三双曲嵌入向量序列中的最后一个向量,预测不同用户在未来形成连边的概率。

6、可选地,所述步骤s10包括:

7、对用户历史传播关系数据进行分析,构建动态社交媒体传播网络离散时间快照;

8、通过双曲空间和欧式空间之间的映射,将用户的在欧几里得空间的嵌入向量投影得到用户在双曲空间的第一双曲嵌入向量序列。

9、可选地,所述步骤s102包括:

10、对用户的第一双曲嵌入向量序列应用双曲线性变换操作,将节点嵌入从前一层映射到下一层的嵌入空间,得到时间快照上所有节点的双曲变换后的向量;

11、通过双曲变换后的向量,计算节点嵌入间的双曲距离,利用双曲距离设计空间注意力值,进一步利用空间注意力值对节点的邻居进行加权求和,得到节点的加权求和结果;

12、将双曲变换后的向量投影到切空间,应用激活函数,再将激活变换后的欧式向量投影回双曲空间,得到用户的第二双曲嵌入向量序列。

13、可选地,所述空间注意力值αij为:

14、

15、

16、

17、其中为节点i的邻域集合,exp为指数函数:代表两个向量间的双曲距离,分别代表节点i、节点j和节点w双曲线性变换后的向量。

18、可选地,所述步骤s103包括:针对用户的第二双曲嵌入向量序列,计算对应的双曲查询序列、键序列和值序列;

19、根据计算出的双曲查询序列和键序列计算双曲时间自注意力值,根据计算得到的双曲时间自注意力值和值序列加权求和,计算节点的第三双曲嵌入向量序列。

20、可选地,根据双曲查询序列和键序列计算双曲时间自注意力值具体为:

21、

22、

23、

24、是掩码矩阵,具体定义如下:

25、

26、

27、其中,exp为指数函数,tm,tn是节点任意两个时间快照对应的时间,是查询序列在tm快照上对应的向量,是键序列分别在tn、tk快照上对应的向量,a,c是可学习向量。

28、可选地,所述方法还包括:

29、步骤s105:预测得到用户群体的内容传播关系形成概率,并根据训练集中样本计算得到的交叉熵损失函数对预测模型进行优化处理。

30、根据本发明的另一方面,提供一种社交媒体内容传播预测装置,包括:

31、双曲向量投影模块,用于获取历史社交媒体内容对应的用户历史内容传播关系数据,根据历史传播关系数据,按照一定的时间步长构建动态社交媒体传播网络离散时间快照,得到每个时间快照中每个用户的第一双曲嵌入向量序列;

32、结构自注意力嵌入计算模块,用于根据动态社交媒体传播网络离散时间快照和用户的第一双曲嵌入向量序列,在每个时间快照上计算得到包含局部特征的用户第二双曲嵌入向量序列;

33、时间自注意力嵌入计算模块,用于根据动态社交媒体传播网络离散时间快照和用户的第二双曲嵌入向量序列,把每个时间快照上的同一个节点表示看作是时间序列,在节点时间序列上计算得到用户的第三双曲嵌入向量序列;

34、预测模块,用于根据计算得到的用户第三双曲嵌入向量序列中的最后一个向量,预测不同用户在未来形成连边的概率;

35、优化模块,用于预测得到用户群体的内容传播关系形成概率,并根据训练集中样本计算得到的交叉熵损失函数对预测模型进行优化处理。

36、根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

37、所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述的一种社交媒体内容传播预测方法对应的操作。

38、根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行上述的一种社交媒体内容传播预测方法对应的操作。

39、与现有技术相比,本发明具有如下有益效果:

40、根据本发明提供的社交媒体传播预测方法、装置,通过将用户历史内容传播关系按照一定的时间步长构建动态社交媒体内容传播网络离散时间快照,将快照投影到双曲空间。利用空间双曲自注意力机制捕捉双曲空间上节点间的局部关系。利用时间双曲自注意力机制捕捉双曲空间上节点的时间演化规律。可以预测内容的传播范围,方便对内容的传播进行管控,帮助平台推荐更合适的内容,进行更精准的推广、实现对内容的合理管控,也促进社交媒体平台的发展。与现有的深度学习模型不同,本发明使用双曲距离设计自注意力机制,可以极大程度上利用社交媒体传播图数据的层次特性,捕捉用户之间的潜在关系。同时,本发明使用爱因斯坦中点法在双曲空间中直接加权聚合节点嵌入,保留了嵌入空间的全局特性。



技术特征:

1.一种社交媒体内容传播预测方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的社交媒体内容传播预测方法,其特征在于,所述步骤s101包括:

3.根据权利要求1所述的社交媒体内容传播预测方法,其特征在于,所述步骤s102包括:

4.根据权利要求3所述的社交媒体内容传播预测方法,其特征在于,所述空间注意力值αij为:

5.根据权利要求1所述的社交媒体内容传播预测方法,其特征在于,所述步骤s103包括:

6.根据权利要求5所述的社交媒体内容传播预测方法,其特征在于,根据双曲查询序列和键序列计算双曲时间自注意力值具体为:

7.根据权利要求1-6中任一项所述的社交媒体内容传播预测方法,其特征在于,所述方法还包括:

8.一种社交媒体内容传播预测装置,其特征在于,包括:

9.一种计算设备,其特征在于,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;

10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述的社交媒体内容传播预测方法对应的操作。


技术总结
本发明公开了一种社交媒体传播预测方法、计算设备和存储介质,该方法包括:获取历史内容传播关系数据,根据历史传播关系数据,构建社交媒体传播关系离散时间快照,得到每个时间快照中的用户第一双曲嵌入向量序列;根据传播关系离散时间快照和用户的第一双曲嵌入向量序列,在每个时间快照上计算用户第二双曲嵌入向量序列;根据用户第二双曲嵌入向量序列,计算得到用户第三双曲嵌入向量序列;根据用户第三双曲嵌入向量序列,预测不同用户在未来形成连边的概率;根据用户历史内容传播关系时间快照和训练样本数据的关系概率,对预测模型进行优化处理。本发明可以极大程度上利用社交媒体传播图数据的层次特性,捕捉用户之间的潜在关系。

技术研发人员:李昊,江昊,杜亮,孙灏,陈诚,袁柳,王迎雪
受保护的技术使用者:武汉大学
技术研发日:
技术公布日:2024/3/31
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1