一种基于线性和非线性传播的谣言检测方法与流程

文档序号:23719062发布日期:2021-01-24 06:50阅读:来源:国知局

技术特征:
1.一种基于线性和非线性传播的谣言检测方法,其特征在于,包括如下步骤:步骤1:对谣言节点中的文本信息和时间信息进行编码;步骤2:对通过步骤1中学习到的两个特征进行建模,生成一个统一的谣言节点混合特征嵌入表示;通过特征映射矩阵、文本特征和时间特征,将在统一的向量空间中进行学习表示,以sigmoid函数作为激活函数,对混合表示进行筛选,选取能揭示谣言真实性的潜在特征;步骤3:同时沿非线性扩散结构和线性时间序列,聚合所有节点的混合特征;其中,沿非线性结构聚合所有节点的混合特征的方法如下:首先,利用边和点建立邻接矩阵,通过图的拉普拉斯矩阵来研究图中所包含的信息;在图上进行卷积的同时,通过增加残差项来增加网络深度并解决过度平滑的问题;最后,通过池化操作整合各个节点潜在特征,形成非线性扩散结构的最终表示;沿线性结构聚合所有节点的混合特征的方法如下:第一步,通过lstm聚合器,从子节点中聚合其特征信息:首先,将非线性的传播结构转换为线性图,即,按时间顺序排列各个子节点,使得每个孩子节点的父节点都是源节点;为了学习用户参与的变化趋势,将序列作为输入馈入至单向lstm中;之后,通过对lstm最后一个隐藏态和源节点之间的相互作用进行建模,增强源节点的表示并获得序列传播的向量表示;基于lstm的聚合方法,默认最新的节点的贡献度最大;第二步,采用基于立场注意力的聚合器,根据源节点和子节点之间的立场冲突度量响应节点的重要性:首先,计算子节点文本嵌入和源节点文本嵌入之间的冲突分数,再通过冲突分数来更新节点,从而得到带有立场信息的节点表示;在立场注意力中,采用度量矩阵来衡量各个节点的重要程度;聚合后生成的全局节点表示再与源节点结合,并同lstm聚合器输出最终的序列传播向量表示;步骤4:计算共享特征矩阵,获取谣言的全部特征;为得到谣言传播图的全局特征,要对非线性和线性传播表示进行过滤,计算共享特征矩阵,并将它们与共享特征连接起来;步骤5:预测谣言的真实性标签;通过全连接层和softmax层,获取预测的真实性标签分布。步骤6:训练神经网络,使用交叉熵作为损失函数计算损失值;预先设置迭代次数,如果迭代次数满足设置次数,则训练流程结束,实现了谣言真实性标签的预测;如果迭代次数不满足设置次数,则返回步骤1,继续进行下一轮训练。2.如权利要求1所述的一种基于线性和非线性传播的谣言检测方法,其特征在于,步骤1的实现方法如下:步骤1.1:利用word2vec,获取每个单词的词嵌入和字符嵌入;然后,将每个单词的字符嵌入通过cnn和池化层输出其字符表示;步骤1.2:将词嵌入和字符表示相加或者连接作为输入,通过双向循环神经网络得到每个单词的隐藏表示;步骤1.3:将时间信息通过空间转移矩阵映射至高维向量空间。
3.如权利要求1所述的一种基于线性和非线性传播的谣言检测方法,其特征在于,步骤3的实现方法如下:首先,将边集合转换为邻接矩阵,用a=[a
pc
]∈n
×
n来表示邻接矩阵,a
pc
=1代表e
pc
∈e,即,节点v
c
回复了节点v
p
,否则a
pc
=0;如果a
pc
=1,则a
cp
=1,邻接矩阵包含了谣言传播树自顶向下和自底向上两个方向的路径;得到邻接矩阵后,将其与节点嵌入序列作为输入,馈入两层具有残差项的图卷积神经网络层,具体如下:网络层,具体如下:其中,i为对角元素均为1的矩阵;σ表示relu激活函数;随后,在h
(2)
上进行mean-pooling操作以输出最后的扩散结构表示:g=mean(h
(2)
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)其中,mean(
·
)表示均值池化函数(层);与此同时,对谣言的线性传播进行建模:第一步,构建lstm聚合器捕捉用户参与的变化趋势;首先,对传播树进行前序遍历,将谣言节点按照时间顺序排列,把非线性的扩散结构转换为线性序列图;为了学习回复节点的反应的转移,将序列图作为lstm聚合器的输入:换为线性序列图;为了学习回复节点的反应的转移,将序列图作为lstm聚合器的输入:换为线性序列图;为了学习回复节点的反应的转移,将序列图作为lstm聚合器的输入:其中,lstm(
·
)表示lstm函数;n(
·
)为获取邻接节点的函数;表示节点v
1
的所有邻接节点的隐藏状态;r
i
为第i个节点的混合特征表示;sigmoid()为激活函数;为由lstm聚合器计算得到的线性传播的隐藏表示;通过对聚合器最后一个隐藏态和源节点的嵌入表示r
1
之间错综复杂的相互关系进行建模,获取基于时序的向量表示;第二步,构建基于立场注意力的聚合器;对于节点v
q
,将其文本表示和源节点的文本表示作为冲突分数计算的输入:其中,h
1
和h
q
分别为源节点和节点v
q
的文本特征,w
1score
和为度量矩阵;h
q
表示节点v
q
的文本序列表示;b
score
表示偏差项;sigmoid为激活函数;利用得到的冲突分数来更新各个节点的节点表示:其中,r
q
表示节点v
q
的混合特征表示;
随后,新的节点表示用于立场注意力的计算,从而获得全局的回复节点表示:e
q
=tanh(w
e
r
1
+u
e
p
q
+b
e
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)e=[e
2
,...,e
n
]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)(17)其中,e
q
反映了源节点的混合特征嵌入表示r
1
和节点v
q
带有冲突分数的嵌入表示p
q
之间的相互匹配度;α表示注意力分数;表示基于立场注意力所得到的传播隐藏表示;随后的计算过程,与源节点嵌入表示交互的计算过程与公式(12)、(13)一致;最后,序列传播的向量表示e通过连接两个聚合器的输出结果获得:其中,表示元素加法或者连接操作。4.如权利要求1所述的一种基于线性和非线性传播的谣言检测方法,其特征在于,步骤4的具体实现方法如下:将扩散结构和序列传播的向量表示作为输入,查询矩阵是非线性扩散结构嵌入,键矩阵和值矩阵是线性序列传播表示,计算过程如下:m=multihead(q
g
,k
e
,v
e
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(22)=concat(head
1
,...,head
h
)w
m
其中,q
g
=g,k
e
=v
e
=e;为权重矩阵;head
i
表示多头注意力机制中第i个注意力头;concat(
·
)为连接操作;m表示共享特征矩阵;随后,将输出m通过归一化层和前馈层,得到共享特征的向量表示;为得到谣言传播图的全局特征,对非线性和线性传播表示进行过滤,并将它们与共享特征连接起来:特征连接起来:特征连接起来:其中,为对应的权重矩阵;为对应的偏差项;g和e分别表示非线性和线性传播表示,和为经过特征筛选后的传播表示;sigmoid函数将向量中的元素映射至0到1之间,从而实现过滤。5.如权利要求1所述的一种基于线性和非线性传播的谣言检测方法,其特征在于,步骤5的实现方法如下:将global通过softmax分类层获取预测的真实性标签分布将global通过softmax分类层获取预测的真实性标签分布表示源节点为
谣言,表示源节点是真实的:其中,w
f
表示映射矩阵;b
f
表示偏差项。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1