一种基于线性和非线性传播的谣言检测方法与流程

文档序号：23719062发布日期：2021-01-24 06:50阅读：来源：国知局

技术特征：
1.一种基于线性和非线性传播的谣言检测方法，其特征在于，包括如下步骤：步骤1：对谣言节点中的文本信息和时间信息进行编码；步骤2：对通过步骤1中学习到的两个特征进行建模，生成一个统一的谣言节点混合特征嵌入表示；通过特征映射矩阵、文本特征和时间特征，将在统一的向量空间中进行学习表示，以sigmoid函数作为激活函数，对混合表示进行筛选，选取能揭示谣言真实性的潜在特征；步骤3：同时沿非线性扩散结构和线性时间序列，聚合所有节点的混合特征；其中，沿非线性结构聚合所有节点的混合特征的方法如下：首先，利用边和点建立邻接矩阵，通过图的拉普拉斯矩阵来研究图中所包含的信息；在图上进行卷积的同时，通过增加残差项来增加网络深度并解决过度平滑的问题；最后，通过池化操作整合各个节点潜在特征，形成非线性扩散结构的最终表示；沿线性结构聚合所有节点的混合特征的方法如下：第一步，通过lstm聚合器，从子节点中聚合其特征信息：首先，将非线性的传播结构转换为线性图，即，按时间顺序排列各个子节点，使得每个孩子节点的父节点都是源节点；为了学习用户参与的变化趋势，将序列作为输入馈入至单向lstm中；之后，通过对lstm最后一个隐藏态和源节点之间的相互作用进行建模，增强源节点的表示并获得序列传播的向量表示；基于lstm的聚合方法，默认最新的节点的贡献度最大；第二步，采用基于立场注意力的聚合器，根据源节点和子节点之间的立场冲突度量响应节点的重要性：首先，计算子节点文本嵌入和源节点文本嵌入之间的冲突分数，再通过冲突分数来更新节点，从而得到带有立场信息的节点表示；在立场注意力中，采用度量矩阵来衡量各个节点的重要程度；聚合后生成的全局节点表示再与源节点结合，并同lstm聚合器输出最终的序列传播向量表示；步骤4：计算共享特征矩阵，获取谣言的全部特征；为得到谣言传播图的全局特征，要对非线性和线性传播表示进行过滤，计算共享特征矩阵，并将它们与共享特征连接起来；步骤5：预测谣言的真实性标签；通过全连接层和softmax层，获取预测的真实性标签分布。步骤6：训练神经网络，使用交叉熵作为损失函数计算损失值；预先设置迭代次数，如果迭代次数满足设置次数，则训练流程结束，实现了谣言真实性标签的预测；如果迭代次数不满足设置次数，则返回步骤1，继续进行下一轮训练。2.如权利要求1所述的一种基于线性和非线性传播的谣言检测方法，其特征在于，步骤1的实现方法如下：步骤1.1：利用word2vec，获取每个单词的词嵌入和字符嵌入；然后，将每个单词的字符嵌入通过cnn和池化层输出其字符表示；步骤1.2：将词嵌入和字符表示相加或者连接作为输入，通过双向循环神经网络得到每个单词的隐藏表示；步骤1.3：将时间信息通过空间转移矩阵映射至高维向量空间。
3.如权利要求1所述的一种基于线性和非线性传播的谣言检测方法，其特征在于，步骤3的实现方法如下：首先，将边集合转换为邻接矩阵，用a＝[a
pc
]∈n
×
n来表示邻接矩阵，a
pc
＝1代表e
pc
∈e，即，节点v
c
回复了节点v
p
，否则a
pc
＝0；如果a
pc
＝1，则a
cp
＝1，邻接矩阵包含了谣言传播树自顶向下和自底向上两个方向的路径；得到邻接矩阵后，将其与节点嵌入序列作为输入，馈入两层具有残差项的图卷积神经网络层，具体如下：网络层，具体如下：其中，i为对角元素均为1的矩阵；σ表示relu激活函数；随后，在h
(2)
上进行mean-pooling操作以输出最后的扩散结构表示：g＝mean(h
(2)
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)其中，mean(
·
)表示均值池化函数(层)；与此同时，对谣言的线性传播进行建模：第一步，构建lstm聚合器捕捉用户参与的变化趋势；首先，对传播树进行前序遍历，将谣言节点按照时间顺序排列，把非线性的扩散结构转换为线性序列图；为了学习回复节点的反应的转移，将序列图作为lstm聚合器的输入：换为线性序列图；为了学习回复节点的反应的转移，将序列图作为lstm聚合器的输入：换为线性序列图；为了学习回复节点的反应的转移，将序列图作为lstm聚合器的输入：其中，lstm(
·
)表示lstm函数；n(
·
)为获取邻接节点的函数；表示节点v
1
的所有邻接节点的隐藏状态；r
i
为第i个节点的混合特征表示；sigmoid()为激活函数；为由lstm聚合器计算得到的线性传播的隐藏表示；通过对聚合器最后一个隐藏态和源节点的嵌入表示r
1
之间错综复杂的相互关系进行建模，获取基于时序的向量表示；第二步，构建基于立场注意力的聚合器；对于节点v
q
，将其文本表示和源节点的文本表示作为冲突分数计算的输入：其中，h
1
和h
q
分别为源节点和节点v
q
的文本特征，w
1score
和为度量矩阵；h
q
表示节点v
q
的文本序列表示；b
score
表示偏差项；sigmoid为激活函数；利用得到的冲突分数来更新各个节点的节点表示：其中，r
q
表示节点v
q
的混合特征表示；
随后，新的节点表示用于立场注意力的计算，从而获得全局的回复节点表示：e
q
＝tanh(w
e
r
1
+u
e
p
q
+b
e
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(16)e＝[e
2
,...,e
n
]
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(17)(17)其中，e
q
反映了源节点的混合特征嵌入表示r
1
和节点v
q
带有冲突分数的嵌入表示p
q
之间的相互匹配度；α表示注意力分数；表示基于立场注意力所得到的传播隐藏表示；随后的计算过程，与源节点嵌入表示交互的计算过程与公式(12)、(13)一致；最后，序列传播的向量表示e通过连接两个聚合器的输出结果获得：其中，表示元素加法或者连接操作。4.如权利要求1所述的一种基于线性和非线性传播的谣言检测方法，其特征在于，步骤4的具体实现方法如下：将扩散结构和序列传播的向量表示作为输入，查询矩阵是非线性扩散结构嵌入，键矩阵和值矩阵是线性序列传播表示，计算过程如下：m＝multihead(q
g
,k
e
,v
e
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(22)＝concat(head
1
,...,head
h
)w
m
其中，q
g
＝g，k
e
＝v
e
＝e；为权重矩阵；head
i
表示多头注意力机制中第i个注意力头；concat(
·
)为连接操作；m表示共享特征矩阵；随后，将输出m通过归一化层和前馈层，得到共享特征的向量表示；为得到谣言传播图的全局特征，对非线性和线性传播表示进行过滤，并将它们与共享特征连接起来：特征连接起来：特征连接起来：其中，为对应的权重矩阵；为对应的偏差项；g和e分别表示非线性和线性传播表示，和为经过特征筛选后的传播表示；sigmoid函数将向量中的元素映射至0到1之间，从而实现过滤。5.如权利要求1所述的一种基于线性和非线性传播的谣言检测方法，其特征在于，步骤5的实现方法如下：将global通过softmax分类层获取预测的真实性标签分布将global通过softmax分类层获取预测的真实性标签分布表示源节点为
谣言，表示源节点是真实的：其中，w
f
表示映射矩阵；b
f
表示偏差项。

完整全部详细技术资料下载

当前第2页1 2 3