早期谣言检测方法、装置、设备及介质与流程

文档序号:35703999发布日期:2023-10-12 03:53阅读:28来源:国知局
早期谣言检测方法、装置、设备及介质与流程

本发明涉及人工智能领域,尤其涉及一种早期谣言检测方法、装置、设备及存储介质。


背景技术:

1、早期谣言通常是指在产生的几小时内被检测到的谣言。例如,金融行业中,金融产品发布期间的三个小时内检测到的关于上新产品存在虚假宣传信息的谣言。

2、现有的早期谣言检测方法是通过基于自下而上和自上而下的树状递归神经模型对谣言数据进行检测和分类。但是,这种检测方法是基于对谣言数据的非顺序传播结构来学习谣言数据的各种特征,以识别不同类型的谣言,由于谣言文本包含了丰富的语义信息和传播结构信息,通过利用树状递归神经模型学习谣言语义结构存在不够完善的问题,且这种方法未结合谣言传播过程中不同用户属性的影响,使得谣言特征提取不够准确;进一步地,由于不同的谣言在网络上的爆点时间并不相同,在谣言传播过程中时序信息也常常被忽略,导致早期谣言检测的准确率较低。


技术实现思路

1、本发明提供一种早期谣言检测方法、装置、设备及存储介质,其主要目的是提高早期谣言检测的准确率。

2、为实现上述目的,本发明提供了一种早期谣言检测方法,包括:

3、获取预设时间段内的待检测的谣言事件集及参与谣言传播的用户数据集;

4、利用预先训练的谣言分类模型中的谣言检测网络对所述谣言事件集进行特征提取,得到谣言特征集,并对所述用户数据集进行特征提取,得到用户特征集;

5、将所述谣言特征集及所述用户特征集进行拼接,得到拼接特征集,并对所述拼接特征集进行时序谣言检测,得到所述谣言事件集的初始时序谣言类型;

6、利用所述谣言分类模型中的早期谣言停止检测网络检测到所述预设时间段内初始时序谣言类型满足预设的谣言检测停止条件时,将符合所述谣言检测停止条件的首个停止时刻对应的初始时序谣言类型作为所述谣言事件集的目标谣言分类结果。

7、可选地,所述利用预先训练的谣言分类模型中的谣言检测网络对所述谣言事件集进行特征提取,得到谣言特征集,包括:

8、利用所述谣言检测网络中的多头注意力机制对所述谣言事件集中的源谣言数据及谣言传播数据进行线性变换操作,得到包含所述源谣言数据及所述谣言传播数据的初始谣言特征集;

9、获取所述源谣言数据及所述谣言传播数据之间的传播结构信息,并对所述传播结构信息进行特征提取,得到谣言传播特征集;

10、将所述初始谣言特征集及所述谣言传播特征集进行拼接,得到所述谣言特征集。

11、可选地,所述获取所述源谣言数据及所述谣言传播数据之间的传播结构信息之前,所述方法还包括:

12、将所述源谣言数据作为第一节点,以及将所述谣言传播数据基于从早到晚的时间顺序作为后续节点;

13、在所述第一节点及所述后续节点间添加节点关系,汇总所有节点及节点关系,得到所述所述源谣言数据及所述谣言传播数据之间的传播结构信息。

14、可选地,所述对所述用户数据集进行特征提取,得到用户特征集,包括:

15、利用所述谣言检测网络中的多头注意力机制分别提取所述用户数据集中直接参与谣言传播的直接用户特征集以及间接参与谣言传播的间接用户特征集;

16、将所述直接用户特征集及所述间接用户特征集进行拼接,得到所述用户特征集。

17、可选地,所述将符合所述谣言检测停止条件的首个停止时刻对应的初始时序谣言类型作为所述谣言事件集的目标谣言分类结果之前,所述方法还包括:

18、利用所述早期谣言停止检测网络输出所述预设时间段内每一时刻初始时序谣言类型的隐藏状态;

19、判断预设连续时刻内的隐藏状态是否满足预设的谣言检测停止条件;

20、当所述预设连续时刻内的隐藏状态未满足所述谣言检测停止条件时,则继续选取下一连续时刻内的隐藏状态与所述谣言检测停止条件进行对比,直至连续时刻内的隐藏状态满足所述谣言检测停止条件,则确定所述预设时间段内初始时序谣言类型满足所述谣言检测停止条件。

21、可选地,所述将符合所述谣言检测停止时间的首个停止时间对应的初始时序谣言类型作为所述谣言事件集的目标谣言分类结果之后,所述方法还包括:

22、计算所述谣言事件集进行时序谣言检测时产生的第一损失函数;

23、计算所述谣言事件集进行早期停止检测时产生的第二损失函数;

24、计算所述谣言事件集进行最终谣言预测时产生的第三损失函数;

25、合并所述第一损失函数、第二损失函数及第三损失函数,得到目标损失函数;

26、利用所述目标损失函数对所述谣言分类模型进行调优训练。

27、为了解决上述问题,本发明还提供一种早期谣言检测装置,所述装置包括:

28、数据获取模块,用于获取预设时间段内的待检测的谣言事件集及参与谣言传播的用户数据集;

29、特征提取模块,用于利用预先训练的谣言分类模型中的谣言检测网络对所述谣言事件集进行特征提取,得到谣言特征集,并对所述用户数据集进行特征提取,得到用户特征集;

30、谣言初始检测模块,用于将所述谣言特征集及所述用户特征集进行拼接,得到拼接特征集,并对所述拼接特征集进行时序谣言检测,得到所述谣言事件集的初始时序谣言类型;

31、早期谣言检测模块,用于利用所述谣言分类模型中的早期谣言停止检测网络检测到所述预设时间段内初始时序谣言类型满足预设的谣言检测停止条件时,将符合所述谣言检测停止条件的首个停止时刻对应的初始时序谣言类型作为所述谣言事件集的目标谣言分类结果。

32、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

33、存储器,存储至少一个计算机程序;及

34、处理器,执行所述存储器中存储的计算机程序以实现上述所述的早期谣言检测方法。

35、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的早期谣言检测方法。

36、本发明实施例中,通过利用谣言分类模型对谣言事件集进行特征提取,可以提取谣言事件集中的语义特征及传播结构特征,丰富了谣言特征内容,通过将谣言特征集及用户特征集进行拼接,结合了谣言特征及谣言传播过程中用户信息对谣言特征的影响,提高了谣言特征提取的准确率;其次,通过对拼接特征集进行时序谣言检测,得到谣言事件集的初始时序谣言类型,能够确定每一时刻的谣言分类结果,便于后续提高谣言检测的准确性;最后,通过利用早期谣言停止检测网络确定预设时间段内初始时序谣言类型的停止时间,可以能够使得不同的谣言在网络上的爆点时间不相同时,依然可以保证谣言检测的时效性并准确的进行谣言检测,并将符合谣言检测停止条件的首个停止时刻对应的初始时序谣言类型作为谣言事件集的目标谣言分类结果,可以结合谣言传播过程中的时序信息,提高了早期谣言检测的准确性。因此本发明实施例提出的早期谣言检测方法、装置、设备及存储介质可以提高早期谣言检测的准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1