一种虚假新闻检测方法、装置、计算机设备和存储介质

文档序号:26050657发布日期:2021-07-27 15:25阅读:125来源:国知局
一种虚假新闻检测方法、装置、计算机设备和存储介质

本申请涉及计算机技术领域,特别是涉及一种虚假新闻检测方法、装置、计算机设备和存储介质。



背景技术:

现有技术中虚假新闻检测的模型主要有两类,基于内容的建模和基于社交网络的模型。基于内容的建模包括面向知识库、面向内容风格;基于社交网络的模型分为基于立场和基于传播行为的两种。多分类的真假新闻检测极具挑战性:由于新闻的文本信息通常很少,内容非常有限,仅仅基于新闻内容来对新闻真假性进行检测的方法准确率较低,数据利用率低,难以满足需求。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够提高虚假新闻辨别能力的虚假新闻检测方法、装置、计算机设备和存储介质。

一种虚假新闻检测方法,所述方法包括:

获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向gru网络、基于注意力加权的cnn网络,以及全连接层;

通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;

将所述新闻内容低维矢量输入到所述基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;

将所述隐状态加权和信息输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息;

获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息特征加权和信息;

将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵,将所述融合特征矩阵输入到所述全连接层进行检测,通过激活函数得到所述新闻内容的预测虚假度;

根据预先构建的损失函数和所述预测虚假度,对所述虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。

在其中一个实施例中,还包括:通过词嵌入生成部分的glove算法或word2vec算法,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量。

在其中一个实施例中,还包括:将所述新闻内容低维矢量输入到所述基于注意力加权的双向gru网络;

通过双向gru网络获得所述新闻内容低维矢量序列的前字特征和后字特征;所述前字特征由前向gru计算得到,所述后字特征由后项gru计算得到;

所述前字特征为:

其中,ht-1表示t-1时刻的隐状态;vt表示t时刻时间步骤;表示所述前字特征;fgur表示如下gru门控处理函数:

zt=σ(wz[ht-1,xt])

rt=σ(wr[ht-1,xt])

相应的,表示gru针对前字进行处理;

所述后字特征为:

其中,表示所述后字特征;表示gru针对后字进行处理;

将所述前字特征和所述后字特征并串联,得到当前时刻的隐状态为:

其中,ht表示当前t时刻的隐状态;

根据所有时间步骤的所述隐状态,得到全局信息矩阵;

通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息。

在其中一个实施例中,还包括:通过机器学习算法得到所述全局信息矩阵中每个隐状态的权重为:

其中,ut表示注意力得分,通过神经网络训练得到,计算公式为ut=tanh(wtht+bt),wt表示隐状态ht对应的权重,bt表示偏置项;

计算所述隐状态和所述隐状态的权重的加权和,得到隐状态注意力向量为:

其中,为所述隐状态注意力向量,l表示所述新闻内容的总字数;

将所述隐状态注意力向量作为所述隐状态加权和信息。

在其中一个实施例中,还包括:将所述隐状态加权和信息输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图;所述新闻内容特征映射图中的项为:

yi=relu(wm·xi:i+m-1+bm)

其中,yi表示所述新闻内容特征映射图中的项;xi:i+m-1表示所述隐状态加权和信息对应的矩阵x第i行到第i+m-1行的子矩阵,m表示所述子矩阵的行数;wm表示与xi:i+m-1对应的权重矩阵,bm表示偏置项;relu表示relu激活函数;

通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容注意力向量为:

其中,为所述新闻内容注意力向量,αi′表示yi对应的权重,且∑αi′=1;

将所述新闻内容注意力向量作为新闻内容特征加权和信息。

在其中一个实施例中,还包括:获取辅助信息;

将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量对应的矩阵v;

将所述辅助信息低维矢量输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波,得到辅助信息特征映射图;所述辅助信息特征映射图中的项为:

zj=relu(wn·xj:j+n-1+bn)

其中,zj表示所述辅助信息特征映射图中的项;xj:j+n-1表示所述隐状态加权和信息对应的矩阵v第j行到第j+n-1行的子矩阵,n表示所述子矩阵的行数;wn表示与xj:j+n-1对应的权重矩阵,bn表示偏置项;

通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息注意力向量为:

其中,为所述辅助信息注意力向量,αj″表示zj对应的权重,且∑αj″=1;

将所述辅助信息注意力向量作为辅助信息特征加权和信息。

在其中一个实施例中,还包括:将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵为:

其中,u表示所述融合特征矩阵;y表示所述新闻内容特征加权和信息;z表示所述辅助信息特征加权和信息;

将所述融合特征矩阵输入到所述全连接层进行检测,利用全连通层得到特征序列为:

rk=relu(wkuk+bk)

其中,rk表示所述特征序列;wk为softmax权值矩阵,bk表示偏置项;

根据所述特征序列通过softmax函数得到所述新闻内容的预测虚假度为:

ck=softmax(rk)

其中,ck表示所述预测虚假度。

一种虚假新闻检测装置,所述装置包括:

新闻内容获取模块,用于获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向gru网络、基于注意力加权的cnn网络,以及全连接层;

新闻内容低维矢量获取模块,用于通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;

隐状态加权和信息获取模块,用于将所述新闻内容低维矢量输入到所述基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;

新闻内容特征映射图获取模块,用于将所述隐状态加权和信息输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波,得到新闻内容特征映射图;

辅助信息特征映射图获取模块,用于获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波,得到辅助信息特征映射图;

预测虚假度获取模块,用于通过注意力机制计算所述新闻内容特征映射图和所述辅助信息低维矢量特征映射图中每个项的权重,得到注意加权特征图,将所述注意加权特征图输入到所述全连接层,通过激活函数得到所述新闻内容的预测虚假度;

训练和使用模块,用于根据预先构建的损失函数和所述预测虚假度,对所述虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向gru网络、基于注意力加权的cnn网络,以及全连接层;

通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;

将所述新闻内容低维矢量输入到所述基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;

将所述隐状态加权和信息输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息;

获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息特征加权和信息;

将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵,将所述融合特征矩阵输入到所述全连接层进行检测,通过激活函数得到所述新闻内容的预测虚假度;

根据预先构建的损失函数和所述预测虚假度,对所述虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取新闻内容,将所述新闻内容输入到虚假新闻检测模型中,所述虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向gru网络、基于注意力加权的cnn网络,以及全连接层;

通过词嵌入生成部分,将所述新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;

将所述新闻内容低维矢量输入到所述基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算所述全局信息矩阵中每个项的权重,得到隐状态加权和信息;

将所述隐状态加权和信息输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算所述新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息;

获取辅助信息,将所述辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将所述辅助信息低维矢量输入到所述基于注意力加权的cnn网络,通过所述cnn网络中不同粒度的滤波器对所述辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算所述辅助信息特征映射图中每个项的权重,得到辅助信息特征加权和信息;

将所述新闻内容特征加权和信息和所述辅助信息特征加权和信息进行融合,得到融合特征矩阵,将所述融合特征矩阵输入到所述全连接层进行检测,通过激活函数得到所述新闻内容的预测虚假度;

根据预先构建的损失函数和所述预测虚假度,对所述虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。

上述虚假新闻检测方法、装置、计算机设备和存储介质,通过词嵌入生成算法,将新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;将新闻内容低维矢量输入到基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算全局信息矩阵中每个项的权重,得到隐状态加权和信息;将隐状态加权和信息输入到基于注意力加权的cnn网络,得到新闻内容特征加权和信息;将辅助信息低维矢量输入到基于注意力加权的cnn网络,得到辅助信息特征加权和信息;将新闻内容特征加权和信息和辅助信息特征加权和信息融合得到融合特征矩阵,将融合特征矩阵输入到全连接层进行检测,通过激活函数得到新闻内容的预测虚假度。本发明的模型结合了双向gru和cnn,通过将新闻文本和新闻元数据相结合来提取全局和局部特征,同时多部分部署注意机制,突出关键特征,提高了虚假新闻辨别能力。

附图说明

图1为一个实施例中虚假新闻检测方法的应用场景图;

图2为一个实施例中虚假新闻检测模型的示意图;

图3为一个实施例中虚假新闻检测装置的结构框图;

图4为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的虚假新闻检测方法,可以应用于如下应用环境中。其中,终端执行一种虚假新闻检测方法,所述方法基于层次自注意深度学习的架构,通过词嵌入生成算法,将新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;将新闻内容低维矢量输入到基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算全局信息矩阵中每个项的权重,得到隐状态加权和信息;将隐状态加权和信息输入到基于注意力加权的cnn网络,得到新闻内容特征加权和信息;将辅助信息低维矢量输入到基于注意力加权的cnn网络,得到辅助信息特征加权和信息;将新闻内容特征加权和信息和辅助信息特征加权和信息融合得到融合特征矩阵,将融合特征矩阵输入到全连接层进行检测,通过激活函数得到新闻内容的预测虚假度。其中,终端可以但不限于是各种个人计算机、笔记本电脑、平板电脑。

在一个实施例中,如图1所示,提供了一种虚假新闻检测方法,包括以下步骤:

步骤102,获取新闻内容,将新闻内容输入到虚假新闻检测模型中,如图2所示,虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向gru网络、基于注意力加权的cnn网络,以及全连接层。

步骤104,通过词嵌入生成部分,将新闻内容预处理后得到的文本序列转换为新闻内容低维矢量。

为了使用标准机器学习算法对文本中的词进行分析,需要通过词嵌入(wordembedding)算法将文本中的词转换成数字向量,以数字形式将文本信息输入模型。词嵌入过程就是把一个维数为所有词数量的高维空间嵌入到一个维数低得多的连续向量空间中。

步骤106,将新闻内容低维矢量输入到基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算全局信息矩阵中每个项的权重,得到隐状态加权和信息。

为了获取新闻语句的全局模式,本发明利用双向gru网络对文本序列进行分析,获得句子之间的内部结构特征,然后动态加权这些特征,并带有注意机制来突出关键特征。双向gru网络由前向gru网络和后向gru网络组成。gru有独立的门来控制序列中的信息流,使得它适合于捕获文本中的长距离和短距离依赖。

双向gru网络将新闻内容的嵌入转换为反映整个内容的全局模式的矩阵。这种方案平等地考虑了所有的来源。然而,并不是所有的向量在假新闻检测中贡献相同。关注决定新闻声明真实性的部分内容很重要。例如,“根据医疗保健法,每个人都将拥有更低的费率、更好的质量和更好的机会”这一说法是错误的,因为根据分析,有些人会为医疗保险支付更多的费用。也就是说,每个人都有较低的比率而不是陈述的其他部分决定陈述的真实性。为此,我们应用注意机制来计算每个项相对于相应语句的总体表示的重要性。具体地,在时间步长t时,通过融合全局信息,为每个隐状态ht学习一个权重αt,然后得到一个注意力向量作为隐状态的加权和。

步骤108,将隐状态加权和信息输入到基于注意力加权的cnn网络,通过cnn网络中不同粒度的滤波器对隐状态加权和信息进行滤波得到新闻内容特征映射图,通过注意力机制计算新闻内容特征映射图中每个项的权重,得到新闻内容特征加权和信息。

设计cnn,在双向gru网络的输出上通过多个滤波器实现不同尺度的特征融合。为了学习互补的特征,采用不同粒度的滤波器实现不同尺度的特征融合。基于特征图,进一步执行注意机制,强调与假新闻检测高度相关的特征。

步骤110,获取辅助信息,将辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将辅助信息低维矢量输入到基于注意力加权的cnn网络,通过cnn网络中不同粒度的滤波器对辅助信息低维矢量进行滤波得到辅助信息特征映射图,通过注意力机制计算辅助信息特征映射图中每个项的权重,得到辅助信息特征加权和信息。

辅助信息指的是新闻的元数据,元数据可以从新闻中提取得到。

步骤112,将新闻内容特征加权和信息和辅助信息特征加权和信息进行融合,得到融合特征矩阵,将融合特征矩阵输入到全连接层进行检测,通过激活函数得到新闻内容的预测虚假度。

本发明对新闻内容和辅助信息进行注意加权特征提取和融合,得到了对虚假检测影响较大的特征。全连接层用于融合新闻内容特征和辅助信息特征进行检测,将融合特征作为输入连接到全连接层,然后通过softmax激活函数进行多类检测。

步骤114,根据预先构建的损失函数和预测虚假度,对虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。

上述虚假新闻检测方法中,通过词嵌入生成算法,将新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;将新闻内容低维矢量输入到基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算全局信息矩阵中每个项的权重,得到隐状态加权和信息;将隐状态加权和信息输入到基于注意力加权的cnn网络,得到新闻内容特征加权和信息;将辅助信息低维矢量输入到基于注意力加权的cnn网络,得到辅助信息特征加权和信息;将新闻内容特征加权和信息和辅助信息特征加权和信息进行融合,得到融合特征矩阵,将融合特征矩阵输入到全连接层进行检测,通过激活函数得到新闻内容的预测虚假度。本发明的模型结合了双向gru和cnn,通过将新闻文本和新闻元数据相结合来提取全局和局部特征,同时多部分部署注意机制,突出关键特征,提高了虚假新闻辨别能力。

在其中一个实施例中,还包括:通过词嵌入生成部分的glove算法或word2vec算法,将新闻内容预处理后得到的文本序列转换为新闻内容低维矢量。

在其中一个实施例中,还包括:将新闻内容低维矢量输入到基于注意力加权的双向gru网络;通过双向gru网络获得新闻内容低维矢量序列的前字特征和后字特征;前字特征由前向gru计算得到,后字特征由后项gru计算得到;前字特征为:

其中,ht-1表示t-1时刻的隐状态;vt表示t时刻时间步骤;表示前字特征;fgur表示如下gru门控处理函数:

zt=σ(wz[ht-1,xt])

rt=σ(wr[ht-1,xt])

相应的,表示gru针对前字进行处理;

所述后字特征为:

其中,表示所述后字特征;表示gru针对后字进行处理;

将前字特征和后字特征并串联,得到当前时刻的隐状态为:

其中,ht表示当前t时刻的隐状态;根据所有时间步骤的隐状态,得到全局信息矩阵;通过注意力机制计算全局信息矩阵中每个项的权重,得到隐状态加权和信息。

在其中一个实施例中,还包括:通过机器学习算法得到全局信息矩阵中每个隐状态的权重为:

其中,ut表示注意力得分,通过神经网络训练得到,计算公式为ut=tanh(wtht+bt),wt表示隐状态ht对应的权重,bt表示偏置项;计算隐状态和隐状态的权重的加权和,得到隐状态注意力向量为:

其中,为隐状态注意力向量,l表示所述新闻内容的总字数;将隐状态注意力向量作为隐状态加权和信息。

在其中一个实施例中,还包括:将隐状态加权和信息输入到基于注意力加权的cnn网络,通过cnn网络中不同粒度的滤波器对隐状态加权和信息进行滤波得到新闻内容特征映射图;新闻内容特征映射图中的项为:

yi=relu(wm·xi:i+m-1+bm)

其中,yi表示新闻内容特征映射图中的项;xi:i+m-1表示隐状态加权和信息对应的矩阵x第i行到第i+m-1行的子矩阵,m表示子矩阵的行数;wm表示与xi:i+m-1对应的权重矩阵,bm表示偏置项;relu表示relu激活函数;通过注意力机制计算新闻内容特征映射图中每个项的权重,得到新闻内容注意力向量为:

其中,为新闻内容注意力向量,αi′表示yi对应的权重,且∑αi′=1;将新闻内容注意力向量作为新闻内容特征加权和信息。

与常用的sigmod函数相比,我们使用relu激活函数加快了模型训练的收敛速度,更有效地实现梯度下降和反向传播,避免了梯度爆炸和梯度消失的问题。

在其中一个实施例中,还包括:获取辅助信息;将辅助信息预处理后得到的文本序列转换为辅助信息低维矢量对应的矩阵v;将辅助信息低维矢量输入到基于注意力加权的cnn网络,通过cnn网络中不同粒度的滤波器对辅助信息低维矢量进行滤波,得到辅助信息特征映射图;辅助信息特征映射图中的项为:

zj=relu(wn·xj:j+n-1+bn)

其中,zj表示辅助信息特征映射图中的项;xj:j+n-1表示隐状态加权和信息对应的矩阵v第j行到第j+n-1行的子矩阵,n表示子矩阵的行数;wn表示与xj:j+n-1对应的权重矩阵,bn表示偏置项;通过注意力机制计算辅助信息特征映射图中每个项的权重,得到辅助信息注意力向量为:

其中,为辅助信息注意力向量,αj″表示zj对应的权重,且∑αj″=1;将辅助信息注意力向量作为辅助信息特征加权和信息。

在其中一个实施例中,还包括:将新闻内容特征加权和信息和辅助信息特征加权和信息进行融合,得到融合特征矩阵为:

其中,u表示融合特征矩阵;y表示新闻内容特征加权和信息;z表示辅助信息特征加权和信息;将融合特征矩阵输入到全连接层进行检测,利用全连通层得到特征序列为:

rk=relu(wkuk+bk)

其中,rk表示特征序列;wk为softmax权值矩阵,bk表示偏置项;根据特征序列通过softmax函数得到新闻内容的预测虚假度为:

ck=softmax(rk)

其中,ck表示预测虚假度。

应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图3所示,提供了一种虚假新闻检测装置,包括:新闻内容获取模块302、新闻内容低维矢量获取模块304、隐状态加权和信息获取模块306、新闻内容特征映射图获取模块308、辅助信息特征映射图获取模块310、预测虚假度获取模块312和训练和使用模块314,其中:

新闻内容获取模块302,用于获取新闻内容,将新闻内容输入到虚假新闻检测模型中,虚假新闻检测模型包括:词嵌入生成部分、基于注意力加权的双向gru网络、基于注意力加权的cnn网络,以及全连接层;

新闻内容低维矢量获取模块304,用于通过词嵌入生成部分,将新闻内容预处理后得到的文本序列转换为新闻内容低维矢量;

隐状态加权和信息获取模块306,用于将新闻内容低维矢量输入到基于注意力加权的双向gru网络,通过双向gru网络得到全局信息矩阵,通过注意力机制计算全局信息矩阵中每个项的权重,得到隐状态加权和信息;

新闻内容特征映射图获取模块308,用于将隐状态加权和信息输入到基于注意力加权的cnn网络,通过cnn网络中不同粒度的滤波器对隐状态加权和信息进行滤波,得到新闻内容特征映射图;

辅助信息特征映射图获取模块310,用于获取辅助信息,将辅助信息预处理后得到的文本序列转换为辅助信息低维矢量,将辅助信息低维矢量输入到基于注意力加权的cnn网络,通过cnn网络中不同粒度的滤波器对辅助信息低维矢量进行滤波,得到辅助信息特征映射图;

预测虚假度获取模块312,用于通过注意力机制计算新闻内容特征映射图和辅助信息低维矢量特征映射图中每个项的权重,得到注意加权特征图,将注意加权特征图输入到全连接层,通过激活函数得到新闻内容的预测虚假度;

训练和使用模块314,用于根据预先构建的损失函数和预测虚假度,对虚假新闻检测模型进行训练,得到训练好的虚假新闻检测模型,通过训练好的虚假新闻检测模型进行虚假新闻的多类检测。

新闻内容低维矢量获取模块304还用于通过词嵌入生成部分的glove算法或word2vec算法,将新闻内容预处理后得到的文本序列转换为新闻内容低维矢量。

隐状态加权和信息获取模块306还用于将新闻内容低维矢量输入到基于注意力加权的双向gru网络;通过双向gru网络获得新闻内容低维矢量序列的前字特征和后字特征;前字特征由前向gru计算得到,后字特征由后项gru计算得到;前字特征为:

其中,ht-1表示t-1时刻的隐状态;vt表示t时刻时间步骤;表示前字特征;fgur表示如下gru门控处理函数:

zt=σ(wz[ht-1,xt])

rt=σ(wr[ht-1,xt])

相应的,表示gru针对前字进行处理;

所述后字特征为:

其中,表示所述后字特征;表示gru针对后字进行处理;

将前字特征和后字特征并串联,得到当前时刻的隐状态为:

其中,ht表示当前t时刻的隐状态;

根据所有时间步骤的隐状态,得到全局信息矩阵;通过注意力机制计算全局信息矩阵中每个项的权重,得到隐状态加权和信息。

隐状态加权和信息获取模块306还用于通过机器学习算法得到全局信息矩阵中每个隐状态的权重为:

其中,ut表示注意力得分,通过神经网络训练得到,计算公式为ut=tanh(wtht+bt),wt表示隐状态ht对应的权重,bt表示偏置项;计算隐状态和隐状态的权重的加权和,得到注意力向量为:

其中,为注意力向量,将注意力向量作为隐状态加权和信息,l表示所述新闻内容的总字数。

新闻内容特征映射图获取模块308还用于将隐状态加权和信息输入到基于注意力加权的cnn网络,通过cnn网络中不同粒度的滤波器对隐状态加权和信息进行滤波得到新闻内容特征映射图;新闻内容特征映射图中的项为:

yi=relu(wm·xi:i+m-1+bm)

其中,yi表示新闻内容特征映射图中的项;xi:i+m-1表示隐状态加权和信息对应的矩阵x第i行到第i+m-1行的子矩阵,m表示子矩阵的行数;wm表示与xi:i+m-1对应的权重矩阵,bm表示偏置项;relu表示relu激活函数;

通过注意力机制计算新闻内容特征映射图中每个项的权重,得到新闻内容注意力向量为:

其中,为新闻内容注意力向量,αi′表示yi对应的权重,且∑αi′=1;

将新闻内容注意力向量作为新闻内容特征加权和信息。

辅助信息特征映射图获取模块310还用于获取辅助信息;

将辅助信息预处理后得到的文本序列转换为辅助信息低维矢量对应的矩阵v;

将辅助信息低维矢量输入到基于注意力加权的cnn网络,通过cnn网络中不同粒度的滤波器对辅助信息低维矢量进行滤波,得到辅助信息特征映射图;辅助信息特征映射图中的项为:

zj=relu(wn·xj:j+n-1+bn)

其中,zj表示辅助信息特征映射图中的项;xj:j+n-1表示隐状态加权和信息对应的矩阵v第j行到第j+n-1行的子矩阵,n表示子矩阵的行数;wn表示与xj:j+n-1对应的权重矩阵,bn表示偏置项;

通过注意力机制计算辅助信息特征映射图中每个项的权重,得到辅助信息注意力向量为:

其中,为辅助信息注意力向量,αj″表示zj对应的权重,且∑αj″=1;

将辅助信息注意力向量作为辅助信息特征加权和信息。

预测虚假度获取模块312还用于将新闻内容特征加权和信息和辅助信息特征加权和信息进行融合,得到融合特征矩阵为:

其中,u表示融合特征矩阵;y表示新闻内容特征加权和信息;z表示辅助信息特征加权和信息;

将融合特征矩阵输入到全连接层进行检测,利用全连通层得到特征序列为:

rk=relu(wkuk+bk)

其中,rk表示特征序列;wk为softmax权值矩阵,bk表示偏置项;

根据特征序列通过softmax函数得到新闻内容的预测虚假度为:

ck=softmax(rk)

其中,ck表示预测虚假度。

关于虚假新闻检测装置的具体限定可以参见上文中对于虚假新闻检测方法的限定,在此不再赘述。上述虚假新闻检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种虚假新闻检测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现上述方法实施例中的步骤。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1