一种基于迁移学习和深度学习融合的半监督图表示学习方法及装置与流程

文档序号：25522506发布日期：2021-06-18 20:10阅读：来源：国知局

技术特征：

1.一种基于迁移学习和深度学习融合的半监督图表示学习方法，其特征在于，包括以下步骤：

通过全局层面和局部层面的两个子任务预训练图神经网络模型，以从未标注的数据中学习输入数据的通用表征；

将预训练的图神经网络模型迁移到目标任务的训练过程中，在预训练的图神经网络模型之后添加一个与目标任务相关的输出层，并利用有标签数据对预训练的图神经网络模型的参数进行微调，得到最终的图神经网络模型。

2.根据权利要求1所述的方法，其特征在于，所述全局层面和局部层面的两个子任务，包括：

中心性评估子任务，用以获得反映各节点在全局中重要性的图节点嵌入表示；

上下文预测子任务，用以将具有相似邻域的节点映射到相近的嵌入表示空间中，使学习到的节点嵌入表示能够捕获其邻域信息。

3.根据权利要求2所述的方法，其特征在于，所述中心性评估子任务对输入的原始图中每个节点从不同粒度评估每个节点的中心性得分，构成输入节点的本地特征向量，并训练图自编码器模型，根据节点位于图中的结构角色来衡量节点在全局网络中的重要性，以学习到图中每个节点在全局中起到的作用，获得图节点嵌入表示提供给下游目标任务。

4.根据权利要求3所述的方法，其特征在于，所述中心性评估子任务对输入的原始图中每个节点计算特征向量中心性、介数中心性、紧密中心性和度中心性，从四个不同粒度评估每个节点的中心性得分。

5.根据权利要求2所述的方法，其特征在于，所述上下文预测子任务在全局网络图中使用上下文子图来预测各节点为中心的局部图结构，并利用图自编码器进行预训练，分别采用节点的k-hop子结构和对应的上下文子特征对节点编码，将出现在相似结构上下文中的节点映射到邻近的嵌入，将上下文编码成固定向量。

6.根据权利要求1所述的方法，其特征在于，所述在预训练的图神经网络模型之后添加一个与目标任务相关的输出层，包括：

去掉预训练的图神经网络模型的输出层，在保留学习到的图嵌入表示和参数矩阵的基础上添加一个与目标任务关联的输出层，并随机初始化该输出层的模型参数。

7.根据权利要求1所述的方法，其特征在于，所述利用有标签数据对预训练的图神经网络模型的参数进行微调，得到最终的图神经网络模型，包括：

利用有标签数据经过梯度下降算法对预训练的图神经网络模型的参数进行微调，得到目标图神经网络模型，训练过程中除输出层以外其它层的参数都是基于预训练的图神经网络模型的参数微调得到的。

8.一种采用权利要求1～7中任一权利要求所述方法的基于迁移学习和深度学习融合的半监督图表示学习装置，其特征在于，包括：

图数据预处理模块，负责对原始图数据进行清洗，过滤掉无效数据；

预训练模块，负责通过全局层面和局部层面的两个子任务预训练图神经网络模型，以从未标注的数据中学习输入数据的通用表征；

目标任务微调模块，负责将预训练的图神经网络模型迁移到目标任务的训练过程中，在预训练的图神经网络模型之后添加一个与目标任务相关的输出层，并利用有标签数据对预训练的图神经网络模型的参数进行微调，得到最终的图神经网络模型。

9.一种电子装置，其特征在于，包括存储器和处理器，所述存储器存储计算机程序，所述计算机程序被配置为由所述处理器执行，所述计算机程序包括用于执行权利要求1～7中任一权利要求所述方法的指令。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储计算机程序，所述计算机程序被计算机执行时，实现权利要求1～7中任一权利要求所述的方法。

技术总结
本发明涉及一种基于迁移学习和深度学习融合的半监督图表示学习方法及装置。本发明通过全局层面和局部层面的两个子任务预训练图神经网络模型，以从未标注的数据中学习输入数据的通用表征；将预训练的图神经网络模型迁移到目标任务的训练过程中，在预训练的图神经网络模型之后添加一个与目标任务相关的输出层，并利用有标签数据对预训练的图神经网络模型的参数进行微调，得到最终的图神经网络模型。本发明在节省人工标记成本的基础上有效结合无标签数据和有标签数据，提升了模型的泛化能力，能够简化目标任务的训练过程，达到更快收敛的目的；本发明充分利用了迁移学习的思想，能够节省大量的计算资源和计算时间，提高计算效率。

技术研发人员：刘冰;马永征;李洪涛;杨学
受保护的技术使用者：中国互联网络信息中心
技术研发日：2021.03.10
技术公布日：2021.06.18

完整全部详细技术资料下载

当前第2页1 2