基于人工智能的虚假新闻检测方法、装置及计算机设备与流程

文档序号：35400272发布日期：2023-09-09 17:50阅读：26来源：国知局

本技术涉及人工智能与金融科技领域，尤其涉及基于人工智能的虚假新闻检测方法、装置、计算机设备及存储介质。

背景技术：

1、虚假新闻检测旨在从大量新闻文本中检测出与事实不符、具有误导性的新闻，是维护信息安全、社会舆论稳定的一项重要技术手段。因此，如何设计一种有效的虚假新闻检测装置来检测广泛分布在各大社交平台上有关于金融公司不实、误导性新闻对金融科技公司(例如保险公司、银行等)维护自身形象具有重要的意义。通过对虚假新闻的检测，金融科技公司可以迅速了解到外部环境中出现的不实舆论环境，从而迅速制定合理的宣传策略以及澄清措施，以有效维护金融科技公司的正面形象，防止金融科技公司的利益受到损害。

2、按照当前市场来看，目前金融科技公司所使用的虚假新闻检测手段主要为：基于文本语义识别的非图结构建模方法，如通过识别关键字、文本写作风格等来判断新闻文本是否为虚假新闻。然而，上述虚假新闻检测手段存在如下问题：该手段主要对新闻文本的序列信息进行建模，无法挖掘出潜在的语义结构信息，导致难以刻画出单词间更深层次的语义关联信息，降低了模型在虚假新闻检测上的准确性。

技术实现思路

1、本技术实施例的目的在于提出一种基于人工智能的虚假新闻检测方法、装置、计算机设备及存储介质，以解决现有的金融科技公司所使用的虚假新闻检测手段主要对新闻文本的序列信息进行建模，无法挖掘出潜在的语义结构信息，导致难以刻画出单词间更深层次的语义关联信息，降低了模型在虚假新闻检测上的准确性的技术问题。

2、为了解决上述技术问题，本技术实施例提供一种基于人工智能的虚假新闻检测方法，采用了如下所述的技术方案：

3、将预先采集的新闻训练文本数据输入至预设的图比对学习模型的输入层，在所述输入层中构建与所述新闻训练文本数据对应的异构图；

4、将所述异构图输入至所述图比对学习模型内的预设的构建层，在所述构建层中构建与所述异构图对应的增广图；

5、将所述异构图与所述增广图输入至所述图比对学习模型内的编码器，在所述编码器中生成与所述异构图对应的第一新闻文本低维向量，以及生成与所述增广图对应的第二新闻文本低维向量；

6、对所述新闻训练文本数据进行实体识别得到对应的实体名词，并基于预设的语料库构建与所述实体名词对应的属性特征；

7、将所述第一新闻文本低维向量、所述第二新闻文本低维向量以及所述属性特征输入至所述图比对学习模型内的预设的构造层，在所述构造层内构造与所述异构图对应的第一目标新闻文本低维向量，以及构造与所述增广图对应的第二目标新闻文本低维向量；

8、基于所述第一目标新闻文本低维向量与所述第二目标新闻文本低维向量构建最终损失函数，并不断迭代最小化所述最终损失函数，直至满足预设的迭代条件时迭代停止，得到训练好的图比对学习模型；

9、将所述训练好的图比对学习模型作为虚假新闻检测模型，并通过所述虚假新闻检测模型对待测的新闻文本数据进行虚假预测处理。

10、进一步的，所述将所述异构图输入至所述图比对学习模型内的预设的构建层，在所述构建层中构建与所述异构图对应的增广图的步骤，具体包括：

11、将所述异构图输入至所述图比对学习模型内的所述构建层，在所述构建层中获取所述异构图内的连边集合；

12、获取预设数值；

13、基于所述预设数值对所述异构图内的连边集合的连边进行随机删除处理，得到处理后的异构图；

14、将所述处理后的异构图作为所述增广图。

15、进一步的，所述基于预设的语料库构建与所述实体名词对应的属性特征的步骤，具体包括：

16、获取预设数量；

17、基于所述实体名词对所述语料库进行检索，从所述语料库中提取出与所述预设数量对应的目标句子；

18、将所述目标句子输入至预设的长短期记忆网络内，基于所述长短期记忆网络输出与所述目标句子对应的目标向量；

19、将所述目标向量作为与所述实体名词对应的所述属性特征。

20、进一步的，所述将所述第一新闻文本低维向量、所述第二新闻文本低维向量以及所述属性特征输入至所述图比对学习模型内的预设的构造层，在所述构造层内构造与所述异构图对应的第一目标新闻文本低维向量，以及构造与所述增广图对应的第二目标新闻文本低维向量的步骤，具体包括：

21、将所述第一新闻文本低维向量、所述第二新闻文本低维向量以及所述属性特征输入至所述图比对学习模型内的所述构造层，在所述构造层内，基于预设的对比函数生成与所述属性特征对应的对比向量；

22、构建与所述对比向量对应的对比特征向量；

23、基于所述对比特征向量与所述第一新闻文本低维向量生成与所述异构图对应的所述第一目标新闻文本低维向量；

24、基于所述对比特征向量与所述第二新闻文本低维向量生成与所述增广图对应的所述第二目标新闻文本低维向量。

25、进一步的，所述基于所述第一目标新闻文本低维向量与所述第二目标新闻文本低维向量构建最终损失函数的步骤，具体包括：

26、基于所述第一目标新闻文本低维向量与所述第二目标新闻文本低维向量计算第一损失函数；

27、将所述第一目标新闻文本低维向量输入至所述图比对学习模型内的全连接层，基于预设的激活函数生成与所述第一目标新闻文本低维向量对应的预测标签；

28、获取与所述新闻训练文本数据对应的真实标签；

29、基于所述预测标签与所述真实标签计算第二损失函数；

30、基于所述第一损失函数与所述第二损失函数构建所述最终损失函数。

31、进一步的，所述不断迭代最小化所述最终损失函数，直至满足预设的迭代条件时迭代停止，得到训练好的图比对学习模型的步骤，具体包括：

32、不断迭代最小化所述最终损失函数，并获取当前的累计迭代次数；

33、判断所述累计迭代次数是否大于预设的迭代次数阈值；

34、若所述累计迭代次数大于所述迭代次数阈值，判定满足迭代条件，迭代停止，得到训练好的图比对学习模型。

35、进一步的，在所述判断所述累计迭代次数是否大于预设的迭代次数阈值的步骤之后，还包括：

36、若所述累计迭代次数小于所述迭代次数阈值，获取当前迭代过程的第一损失值；

37、获取与所述当前迭代过程相邻的前次迭代过程的第二损失值；

38、计算所述第一损失值与所述第二损失值之间的差值；

39、判断所述差值是否小于预设的差值阈值；

40、若是，判定满足迭代条件，迭代停止，得到训练好的图比对学习模型。

41、为了解决上述技术问题，本技术实施例还提供一种基于人工智能的虚假新闻检测装置，采用了如下所述的技术方案：

42、第一构建模块，用于将预先采集的新闻训练文本数据输入至预设的图比对学习模型的输入层，在所述输入层中构建与所述新闻训练文本数据对应的异构图；

43、第二构建模块，用于将所述异构图输入至所述图比对学习模型内的预设的构建层，在所述构建层中构建与所述异构图对应的增广图；

44、生成模块，用于将所述异构图与所述增广图输入至所述图比对学习模型内的编码器，在所述编码器中生成与所述异构图对应的第一新闻文本低维向量，以及生成与所述增广图对应的第二新闻文本低维向量；

45、第三构建模块，用于对所述新闻训练文本数据进行实体识别得到对应的实体名词，并基于预设的语料库构建与所述实体名词对应的属性特征；

46、构造模块，用于将所述第一新闻文本低维向量、所述第二新闻文本低维向量以及所述属性特征输入至所述图比对学习模型内的预设的构造层，在所述构造层内构造与所述异构图对应的第一目标新闻文本低维向量，以及构造与所述增广图对应的第二目标新闻文本低维向量；

47、第一处理模块，用于基于所述第一目标新闻文本低维向量与所述第二目标新闻文本低维向量构建最终损失函数，并不断迭代最小化所述最终损失函数，直至满足预设的迭代条件时迭代停止，得到训练好的图比对学习模型；

48、第二处理模块，用于将所述训练好的图比对学习模型作为虚假新闻检测模型，并通过所述虚假新闻检测模型对待测的新闻文本数据进行虚假预测处理。

49、为了解决上述技术问题，本技术实施例还提供一种计算机设备，采用了如下所述的技术方案：

50、将预先采集的新闻训练文本数据输入至预设的图比对学习模型的输入层，在所述输入层中构建与所述新闻训练文本数据对应的异构图；

51、将所述异构图输入至所述图比对学习模型内的预设的构建层，在所述构建层中构建与所述异构图对应的增广图；

52、将所述异构图与所述增广图输入至所述图比对学习模型内的编码器，在所述编码器中生成与所述异构图对应的第一新闻文本低维向量，以及生成与所述增广图对应的第二新闻文本低维向量；

53、对所述新闻训练文本数据进行实体识别得到对应的实体名词，并基于预设的语料库构建与所述实体名词对应的属性特征；

54、将所述第一新闻文本低维向量、所述第二新闻文本低维向量以及所述属性特征输入至所述图比对学习模型内的预设的构造层，在所述构造层内构造与所述异构图对应的第一目标新闻文本低维向量，以及构造与所述增广图对应的第二目标新闻文本低维向量；

55、基于所述第一目标新闻文本低维向量与所述第二目标新闻文本低维向量构建最终损失函数，并不断迭代最小化所述最终损失函数，直至满足预设的迭代条件时迭代停止，得到训练好的图比对学习模型；

56、将所述训练好的图比对学习模型作为虚假新闻检测模型，并通过所述虚假新闻检测模型对待测的新闻文本数据进行虚假预测处理。

57、为了解决上述技术问题，本技术实施例还提供一种计算机可读存储介质，采用了如下所述的技术方案：

58、将预先采集的新闻训练文本数据输入至预设的图比对学习模型的输入层，在所述输入层中构建与所述新闻训练文本数据对应的异构图；

59、将所述异构图输入至所述图比对学习模型内的预设的构建层，在所述构建层中构建与所述异构图对应的增广图；

60、将所述异构图与所述增广图输入至所述图比对学习模型内的编码器，在所述编码器中生成与所述异构图对应的第一新闻文本低维向量，以及生成与所述增广图对应的第二新闻文本低维向量；

61、对所述新闻训练文本数据进行实体识别得到对应的实体名词，并基于预设的语料库构建与所述实体名词对应的属性特征；

62、将所述第一新闻文本低维向量、所述第二新闻文本低维向量以及所述属性特征输入至所述图比对学习模型内的预设的构造层，在所述构造层内构造与所述异构图对应的第一目标新闻文本低维向量，以及构造与所述增广图对应的第二目标新闻文本低维向量；

63、基于所述第一目标新闻文本低维向量与所述第二目标新闻文本低维向量构建最终损失函数，并不断迭代最小化所述最终损失函数，直至满足预设的迭代条件时迭代停止，得到训练好的图比对学习模型；

64、将所述训练好的图比对学习模型作为虚假新闻检测模型，并通过所述虚假新闻检测模型对待测的新闻文本数据进行虚假预测处理。

65、与现有技术相比，本技术实施例主要有以下有益效果：

66、本技术实施例通过构造增广图数据来模拟虚假消息的精心设计过程，而后引入对比学习过程来将这种精心设计句子的构造特征刻画到低维向量表示中。另外，通过设计一种有效的领域外部知识融合技术，将内部语料库的资料信息融合到模型学习过程，将真实信息与虚假信息的语义不一致性刻画到低维表示向量中，从而提升了虚假新闻检测模型的鲁棒性和准确率，使得后续通过所述虚假新闻检测模型对待测的新闻文本数据进行虚假预测处理，可以实现快速准确地生成与该新闻文本数据对应的预测结果，提高了预测结果的准确率。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈雪娇
技术所有人：中国平安财产保险股份有限公司
我是此专利的发明人

上一篇：一种治疗皮肤烧烫伤、切割伤的蟒蛇油复合物及其制备方法与流程
上一篇：一种喂水泵的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。