图自监督学习方法、电子设备及存储介质

文档序号:37770124发布日期:2024-04-25 10:56阅读:6来源:国知局
图自监督学习方法、电子设备及存储介质

本发明属于自监督学习领域,具体是涉及到一种图自监督学习方法、电子设备及存储介质。


背景技术:

1、自监督学习(ssl)是机器学习领域的一个重要分支,旨在通过学习从未标记的数据自动生成标签或任务,而无需人工标记大量数据,解决监督学习中标签获取困难的问题。当前nlp领域大数据的方法带来了成功,但是与其相比,图数据由于获取困难,仍面临着很大的数据稀缺问题。

2、在这种数据缺少的条件下,也涌现出了大量的图自监督学习方法。这些方法主流可以分为两大类,即对比式图自监督学习方法和生成式图自监督学习方法。对比式图自监督学习方法通过一种简单的判别对比思想,拉近同一图增强的表征,远离了不同的图表征,对比式图自监督学习方法更好的保留了图的判别表征信息,但缺乏图内的整体结构和细节特征信息。生成式图自监督学习方法更加关注于重建输入图中的局部表征来获取整体特征,但几乎没有对不同图之间的判别。因此,这些图自监督学习方法的的图表示学习能力较差。


技术实现思路

1、本发明要解决的技术问题是提供一种图自监督学习方法、电子设备及存储介质,能够提高图自监督学习的学习能力。

2、本发明的内容包括一种图自监督学习方法,包括:

3、获取原图数据,所述原图数据包括原图节点特征;

4、将所述原图数据输入至图掩码对比学习模型,所述图掩码对比学习模型包括生成模块和对比模块;

5、通过所述生成模块对所述原图数据进行掩码和编码操作,并从操作后的数据中解码出局部重建节点特征和整体恢复节点特征;

6、将所述局部重建节点特征与所述原图节点特征进行对比学习,得到第一损失函数;

7、通过所述对比模块对所述原图数据进行编码操作,并从操作后的数据中提取图判别特征;

8、将所述整体恢复节点特征与所述图判别特征进行对比学习,得到第二损失函数;

9、根据所述第一损失函数和所述第二损失函数,对所述图掩码对比学习模型进行参数优化。

10、根据本申请的一个实施例,所述生成模块包括生成编码器、重建解码器和特征恢复解码器,所述原图数据还包括邻接特征;

11、所述通过所述生成模块对所述原图数据进行掩码和编码操作,并从操作后的数据中解码出局部重建节点特征和整体恢复节点特征,包括:

12、对所述原图节点特征中的部分节点特征进行掩码操作;

13、将掩码操作后的原图节点特征和所述邻接特征输入至所述生成编码器,得到第一编码特征;

14、对所述第一编码特征中的部分编码特征进行掩码操作,所述部分编码特征与所述部分节点特征对应的节点相同;

15、将掩码操作后的第一编码特征输入至所述重建解码器,得到局部重建节点特征,所述局部重建节点特征与所述部分节点特征对应的节点相同;

16、将掩码操作后的第一编码特征输入至所述特征恢复解码器,得到整体恢复节点特征,所述整体恢复节点特征与所述原图节点特征对应的节点相同。

17、根据本申请的一个实施例,在所述通过所述生成模块对所述原图数据进行掩码和编码操作之前,还包括:

18、对所述原图数据进行边扰动数据增强操作。

19、根据本申请的一个实施例,所述对比模块包括对比编码器,所述原图数据还包括邻接特征;

20、所述通过所述对比模块对所述原图数据进行编码操作,并从操作后的数据中提取图判别特征,包括:

21、将所述原图节点特征和所述邻接特征输入至所述对比编码器,得到第二编码特征;

22、通过投影头从所述第二编码特征中提取图判别特征。

23、根据本申请的一个实施例,在所述通过所述对比模块对所述原图数据进行编码操作之前,还包括:

24、对所述原图数据进行边扰动数据增强操作。

25、根据本申请的一个实施例,所述对所述原图数据进行边扰动数据增强操作,包括:

26、从所述原图数据中随机抽取第一部分节点对数据,并对所述第一部分节点对数据进行边扰动数据增强操作;

27、从所述第一部分节点对数据中随机抽取第二部分节点对数据,并对所述第二部分节点对数据进行边扰动数据增强操作。

28、根据本申请的一个实施例,所述根据所述第一损失函数和所述第二损失函数,对所述图掩码对比学习模型进行参数优化,包括:

29、对所述第一损失函数和所述第二损失函数进行加权求和,得到整体损失函数;

30、最小化所述整体损失函数,以对所述图掩码对比学习模型进行参数优化。

31、根据本申请的一个实施例,所述生成模块包括生成编码器,所述对比模块包括对比编码器;优化的参数包括所述生成编码器的参数,所述对比编码器的参数通过对所述生成编码器的参数进行指数移动平均操作得到。

32、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述图自监督学习方法。

33、本发明还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行上述图自监督学习方法。

34、本发明的有益效果是,将原图数据输入至图掩码对比学习模型,通过生成模块对原图数据进行掩码和编码操作,并从操作后的数据中解码出局部重建节点特征和整体恢复节点特征,并将局部重建节点特征与原图节点特征进行对比学习,得到第一损失函数,通过对比模块对原图数据进行编码操作,并从操作后的数据中提取图判别特征,并将整体恢复节点特征与图判别特征进行对比学习,得到第二损失函数,以根据第一损失函数和第二损失函数,对图掩码对比学习模型进行参数优化,即图掩码对比学习模型融合生成模块和对比模块,使得学习到的表征包括局部重建信息和图判别信息,提高图自监督学习的学习能力。



技术特征:

1.一种图自监督学习方法,其特征是,包括:

2.如权利要求1所述的图自监督学习方法,其特征是,所述生成模块包括生成编码器、重建解码器和特征恢复解码器,所述原图数据还包括邻接特征;

3.如权利要求1所述的图自监督学习方法,其特征是,在所述通过所述生成模块对所述原图数据进行掩码和编码操作之前,还包括:

4.如权利要求1所述的图自监督学习方法,其特征是,所述对比模块包括对比编码器,所述原图数据还包括邻接特征;

5.如权利要求1所述的图自监督学习方法,其特征是,在所述通过所述对比模块对所述原图数据进行编码操作之前,还包括:

6.如权利要求3或5所述的图自监督学习方法,其特征是,所述对所述原图数据进行边扰动数据增强操作,包括:

7.如权利要求1所述的图自监督学习方法,其特征是,所述根据所述第一损失函数和所述第二损失函数,对所述图掩码对比学习模型进行参数优化,包括:

8.如权利要求7所述的图自监督学习方法,其特征是,所述生成模块包括生成编码器,所述对比模块包括对比编码器;优化的参数包括所述生成编码器的参数,所述对比编码器的参数通过对所述生成编码器的参数进行指数移动平均操作得到。

9.一种电子设备,其特征是,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如权利要求1至8任意一项所述的图自监督学习方法。

10.一种非暂态计算机可读存储介质,其特征是,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行权利要求1至8任意一项所述的图自监督学习方法。


技术总结
本发明提供一种基于图自监督学习方法、电子设备及存储介质。所述方法包括:获取原图数据,原图数据包括原图节点特征;将原图数据输入至图掩码对比学习模型,图掩码对比学习模型包括生成模块和对比模块;通过生成模块对原图数据进行掩码和编码操作,并从操作后的数据中解码出局部重建节点特征和整体恢复节点特征;将局部重建节点特征与原图节点特征进行对比学习,得到第一损失函数;通过对比模块对原图数据进行编码操作,并从操作后的数据中提取图判别特征;将整体恢复节点特征与图判别特征进行对比学习,得到第二损失函数;根据第一损失函数和第二损失函数,对图掩码对比学习模型进行参数优化。本发明能够提高图自监督学习的学习能力。

技术研发人员:陈洪辉,许龙,蔡飞,潘志强,李凯,张鑫,李若哲,王申,张梦溪
受保护的技术使用者:中国人民解放军国防科技大学
技术研发日:
技术公布日:2024/4/24
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1