基于深度聚类区块链实体关联关系评估方法、系统及装置与流程

文档序号:33383631发布日期:2023-03-08 07:05阅读:99来源:国知局
基于深度聚类区块链实体关联关系评估方法、系统及装置与流程

1.本发明涉及区块链技术领域,具体涉及一种基于深度聚类区块链实体关联关系评估方法。
技术背景
2.近年来,具有去中心化、不可篡改等特点的区块链技术快速发展,在众多领域中应用广泛。相应地,区块链安全与监管已成为国内外关注焦点。
3.区块链生态中,账号、交易、链群等相互关联的实体数量庞大、关系复杂,类型划分和行为相似性检测存在困难。目前仍然缺乏能够准确进行特征识别的专家规则。另一方面,在分类任务中较为有效的监督学习方法难以应用。当前缺乏标记完成的训练集,人工赋予区块链实体数据标签的过程工作量大、效率较低。因此亟需一种准确高效的方法进行区块链实体关联关系构建。


技术实现要素:

4.为了解决上述问题,本发明提供了一种基于深度聚类区块链实体关联关系评估方法。深度聚类是一种将表征学习和聚类技术相结合的方法。其具体包括如下步骤:
5.(1)提取区块信息,将描述实体的数据转化为矩阵的形式,并随机为每一个实体分配一个伪标签;
6.(2)对矩阵进行数据增强后输入特征提取网络,输出特征信息;
7.(3)将特征信息映射到子空间,进行对比学习,并更新特征提取网络的参数;
8.(4)计算并更新每个实体的伪标签,并更新特征提取网络的参数;
9.(5)重复执行步骤(2)-(4)的训练过程,随后依据伪标签对实体进行分类,并计算实体间行为相似度。
10.进一步地,所述步骤(1)的具体实现如下:
11.1.1提取区块信息,包括实体的账号、交易、链群信息,每一个实体表示为xi,i∈[n],其中n表示实体的数量;
[0012]
1.2随机为每一个实体分配一个伪标签yi∈[m],i∈[n],其中m为计划划分的实体类别的数量。
[0013]
进一步地,所述步骤(2)中特征提取网络由卷积层和transformer编码器组成,其具体实现如下:
[0014]
2.1使用不同的数据增强方式ta和tb对x进行操作,生成x
a,o
=ta(xi),x
b,i
=tb(xi),i∈[n];
[0015]
2.2对xa,xb进行嵌入操作,使用轻量型堆叠卷积将其转化为维度为d的矩阵,其中卷积层使用4个3
×
3大小、步长为2的卷积,每个卷积后跟随批量归一化和线性整流函数,最后经过一个1
×
1,步长为1的卷积;
[0016]
2.3将步骤2.2中生成的矩阵传入transformer编码器,输出特征ha,hb。
[0017]
进一步地,所述步骤(3)的具体实现如下:
[0018]
3.1对特征ha,hb分别执行两次线性变换、批量归一化、线性整流函数,再将其线性映射到子空间za,zb;
[0019]
3.2进行对比学习,提高由相同实体产生的{z
a,i
,z
b,i
}之间的相似性,降低不同实体产生的{z
a,i
,z
b,j
,i≠j}之间的相似性,其中相似性定义为计算损失函数并使用adam作为优化器更新特征提取网络的参数。
[0020]
进一步地,所述步骤(4)的具体实现如下:
[0021]
4.1将x输入更新后的特征提取网络,得到特征信息h;
[0022]
4.2对特征h执行两次线性变换、批量归一化、线性整流函数,再经过柔性最大值传输函数得到伪标签y'n;
[0023]
4.3为了防止聚类过程将多数实体归为同一类,如果某一种步骤(1)中存在的伪标签c在y'n不存在,进行重新分配操作,选取包含实体数量最多的一类标签,保留其中一半实体的标签不变,将另一半实体的标签更改为c,如果y'n包含所有类型的标签,则不进行重新分配操作;
[0024]
4.4计算前一轮训练得到的yn和重新计算得到的y'n之间的交叉熵损失函数,并使用sgd作为优化器更新特征提取网络的参数。
[0025]
进一步地,所述步骤(5)中,在重复步骤(2)-(4)的训练过程得到优化的特征提取网络之后,执行步骤4.1和4.2可以得到实体对应的标签,同一种标签对应的实体划分为同一类型的实体,在同一类型实体中选取少量实体进行具体分析,可以使该类型实体的特征更具可解释性。对实体进行特征提取,并通过步骤3.1和3.2可以关联实体间行为相似性,以此构建实体间关联关系。
[0026]
本发明的有效收益是,基于深度聚类的方法,可以准确有效的对区块链生态中关系复杂的实体进行类型划分和行为相似性检测。该方法不需要事先标记完成的训练集,可以在无监督情形下完成区块链实体聚类过程,实现账号、交易、链群三维一体的实体关联关系构建。
附图说明
[0027]
图1为本发明具体实施例中区块链实体关联关系评估方法的流程图。
具体实施方式
[0028]
为了将本发明的技术方案和优点阐释更清楚、准确,下面结合本发明实施例中的附图对本发明进一步地详细说明。
[0029]
如图1所示,一种基于深度聚类区块链实体关联关系评估方法,其主要分为五个步骤,
[0030]
(1)提取区块信息,包括实体的账号、交易、链群信息,将描述实体的数据转化为矩阵的形式,每一个实体表示为xi,i∈[n],并随机为每一个实体分配一个伪标签yi∈[m],i∈
[n],其中n为实体数量,m为计划划分的实体类别的数量;
[0031]
(2)使用不同的数据增强方式ta和tb,生成x
a,i
=ta(xi),x
b,i
=tb(xi),i∈[n],传入轻量型堆叠卷积层,具体为4个3
×
3大小、步长为2的卷积,每个卷积后跟随batch norm和relu,最后经过一个1
×
1,步长为1的卷积,将得到的矩阵传入transformer编码器,输出特征ha,hb;
[0032]
(3)进行对比学习,对特征ha,hb分别执行两次线性变换、批量归一化、线性整流函数,再将其分别线性映射到子空间za,zb,提高由相同实体产生的{z
a,i
,z
b,i
}之间的相似性,降低不同实体产生的{z
a,i
,z
b,j
,i≠j}之间的相似性,其中相似性定义为使用损失函数使用损失函数得到损失值,并使用adam作为优化器更新特征提取网络的参数;
[0033]
(4)将x输入更新后的特征提取网络,得到特征信息h,对特征h执行两次线性变换、批量归一化、线性整流函数,再经过柔性最大值传输函数得到伪标签y'n,如果某一种步骤(1)中存在的伪标签c在y'n不存在,进行重新分配操作,选取包含实体数量最多的一类标签,保留其中一半实体的标签不变,将另一半实体的标签更改为c,如果y'n包含所有类型的标签,则不进行重新分配操作,计算前一轮训练得到的yn和重新计算得到的y'n之间的交叉熵损失,并使用sgd作为优化器更新特征提取网络的参数;
[0034]
(5)在重复步骤(2)-(4)的训练过程得到优化的特征提取网络之后,重新输入代表实体的矩阵,经过特征提取网络和聚类过程得到实体对应的标签,同一种标签对应的实体划分为同一类型的实体。对实体进行特征提取,并通过步骤(3)关联实体间行为相似性,以此构建实体间关联关系。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1