以太坊地址画像生成方法、装置、电子设备及存储介质与流程

文档序号:17591123发布日期:2019-05-03 21:50阅读:235来源:国知局
以太坊地址画像生成方法、装置、电子设备及存储介质与流程

本申请涉及计算机应用技术领域,尤其涉及一种以太坊地址画像生成方法、装置、电子设备及存储介质。



背景技术:

随着互联网技术的不断发展,互联网不再仅仅是人与人之间进行通信的媒介,利用互联网进行工作、学习、娱乐、购物等已是信息社会的常态。同时,互联网引致了一个新的市场的出现,这个市场就是基于网络空间的虚拟市场,货币存在的形式也更加虚拟化,出现了摆脱任何事物形态,只以电子信号形式存在的虚拟货币。虚拟货币极大地突破了现实世界的时空限制,将虚拟货币用于网上消费也越来越方便快捷。通过使用虚拟货币获取服务或进行娱乐消费,用户可以获得更加优质的体验。

互联网中的虚拟货币具有较大的投资潜力,越来越多的人们希望通过投资虚拟货币来让自己的财富增值。以太坊(ethereum)是一个开源的有智能合约功能的公共区块链平台,通过其专用加密货币以太币(ether)提供去中心化的以太虚拟机(ethereumvirtualmachine)来处理点对点合约,以太坊解决了比特币网络的扩展性差的问题。

然而,由于以太坊的去中心化、匿名交易等特性,通常无法知道以太网地址持有人的真实身份信息,从而给以太坊的地址风险识别、异常交易检测带来困难。



技术实现要素:

本申请提出的以太坊地址画像生成方法、装置、电子设备及存储介质,用于解决相关技术中,由于以太坊的去中心化、匿名交易等特性,通常无法知道以太网地址持有人的真实身份信息,从而给以太坊的地址风险识别、异常交易检测带来困难的问题。

本申请一方面实施例提出的以太坊地址画像生成方法,包括:从以太坊节点中获取以太坊网络中当前的内容数据;对所述内容数据进行解析处理,以确定所述以太坊网络中的基础数据;对所述基础数据进行整理,以确定所述以太坊网络中每个以太坊地址对应的基础信息;对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。

可选地,在第一方面实施例的一种可能的实现形式中,所述对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集,包括:

利用预设的rfm模型,对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的新鲜度、活跃度及交易额度。

可选地,在第一方面实施例的另一种可能的实现形式中,所述对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集,包括:

利用预设的图模型对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的交易行为网络、出度、入度及排名。

可选地,在第一方面实施例的再一种可能的实现形式中,所述确定每个以太坊地址对应的特征指标集之后,还包括:

根据每个以太坊地址对应的特征指标集,确定每个以太坊地址的类型。

可选地,在第一方面实施例的又一种可能的实现形式中,所述确定每个以太坊地址对应的特征指标集之后,还包括:

根据每个预设的画像指标与特征指标的映射关系,以及每个以太坊地址对应的特征指标集,确定与每个以太坊地址对应的画像指标集,其中,所述画像指标集包括以下指标中的至少一个:开发者指数、资深指数、活跃指数、土豪指数、专注指数、影响力指数。

可选地,在第一方面实施例的又一种可能的实现形式中,所述确定所述以太坊网络中的基础数据之后,还包括:

根据所述基础数据,爬取与所述基础数据相关的链下数据;

所述确定所述以太坊网络中每个以太坊地址对应的基础信息,包括:

对所述基础数据及链下数据进行整理,以确定每个以太坊地址对应的基础信息。

可选地,在第一方面实施例的另一种可能的实现形式中,所述根据所述基础数据,爬取与所述基础数据相关的链下数据,包括:

根据所述基础数据中的地址信息,爬取与所述基础数据相关的项目信息、代币数据及分布式应用。

本申请另一方面实施例提出的以太坊地址画像生成装置,包括:获取模块,用于从以太坊节点中获取以太坊网络中当前的内容数据;第一确定模块,用于对所述内容数据进行解析处理,以确定所述以太坊网络中的基础数据;第二确定模块,用于对所述基础数据进行整理,以确定所述以太坊网络中每个以太坊地址对应的基础信息;第三确定模块,用于对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。

可选地,在第二方面实施例的一种可能的实现形式中,所述第三确定模块,包括:

第一确定单元,用于利用预设的rfm模型,对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的新鲜度、活跃度及交易额度。

可选地,在第二方面实施例的另一种可能的实现形式中,所述第三确定模块,包括:

第二确定单元,用于利用预设的图模型对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的交易行为网络、出度、入度及排名。

可选地,在第二方面实施例的再一种可能的实现形式中,所述装置,还包括:

第四确定模块,用于根据每个以太坊地址对应的特征指标集,确定每个以太坊地址的类型。

可选地,在第二方面实施例的又一种可能的实现形式中,所述装置还包括:

第五确定模块,用于根据每个预设的画像指标与特征指标的映射关系,以及每个以太坊地址对应的特征指标集,确定与每个以太坊地址对应的画像指标集,其中,所述画像指标集包括以下指标中的至少一个:开发者指数、资深指数、活跃指数、土豪指数、专注指数、影响力指数。

可选地,在第二方面实施例的又一种可能的实现形式中,所述装置,还包括:

爬取模块,用于根据所述基础数据,爬取与所述基础数据相关的链下数据;

所述第二确定模块,包括:

第三确定单元,用于对所述基础数据及链下数据进行整理,以确定每个以太坊地址对应的基础信息。

可选地,在第二方面实施例的另一种可能的实现形式中,所述爬取模块,包括:

爬取单元,用于根据所述基础数据中的地址信息,爬取与所述基础数据相关的项目信息、代币数据及分布式应用。

本申请再一方面实施例提出的电子设备,其包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如前所述的以太坊地址画像生成方法。

本申请再一方面实施例提出的计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如前所述的以太坊地址画像生成方法。

本申请又一方面实施例提出的计算机程序,该程序被处理器执行时,以实现本申请实施例所述的以太坊地址画像生成方法。

本申请实施例提供的以太坊地址画像生成方法、装置、电子设备、计算机可读存储介质及计算机程序,可以从以太坊节点中获取以太坊网络中当前的内容数据,并对内容数据进行解析处理,以确定以太坊网络中的基础数据,之后对基础数据进行整理,以确定以太坊网络中每个以太坊地址对应的基础信息,进而对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。由此,通过对以太坊网络中的内容数据进行分析、整理,以确定出每个以太坊地址对应的特征指标集,即对每个以太坊地址进行了画像,从而可以通过以太坊地址的画像识别出以太坊中的风险地址、异常交易,提高了以太坊网络的安全性和可靠性。

本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本申请实施例所提供的一种以太坊地址画像生成方法的流程示意图;

图2为本申请实施例所提供的另一种以太坊地址画像生成方法的流程示意图;

图3为本申请实施例提供的一种以太坊地址画像生成装置的结构示意图;

图4为本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的要素。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

本申请实施例针对相关技术中,由于以太坊的去中心化、匿名交易等特性,通常无法知道以太网地址持有人的真实身份信息,从而给以太坊的地址风险识别、异常交易检测带来困难的问题,提出一种以太坊地址画像生成方法。

本申请实施例提供的以太坊地址画像生成方法,可以从以太坊节点中获取以太坊网络中当前的内容数据,并对内容数据进行解析处理,以确定以太坊网络中的基础数据,之后对基础数据进行整理,以确定以太坊网络中每个以太坊地址对应的基础信息,进而对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。由此,通过对以太坊网络中的内容数据进行分析、整理,以确定出每个以太坊地址对应的特征指标集,即对每个以太坊地址进行了画像,从而可以通过以太坊地址的画像识别出以太坊中的风险地址、异常交易,提高了以太坊网络的安全性和可靠性。

下面参考附图对本申请提供的以太坊地址画像生成方法、装置、电子设备、存储介质及计算机程序进行详细描述。

图1为本申请实施例所提供的一种以太坊地址画像生成方法的流程示意图。

如图1所示,该以太坊地址画像生成方法,包括以下步骤:

步骤101,从以太坊节点中获取以太坊网络中当前的内容数据。

其中,以太坊(ethereum)是一个开源的有智能合约功能的公共区块链平台,通过其专用加密货币以太币(ether)提供去中心化的以太虚拟机(ethereumvirtualmachine)来处理点对点合约,以太坊解决了比特币网络的扩展性差的问题。

区块链,是指分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法。区块链是虚拟货币的一个重要概念,它本质上是一个去中心化的数据库,同时作为虚拟货币的底层技术。区块链是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一次虚拟货币网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块,每个区块都包含一个时间戳和一个与前一区块的链接。狭义来讲,区块链是一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本,即区块链中的数据一旦记录下来将不可逆。

其中,以太坊网络中当前的内容数据,是指以太坊网络中当前的各区块中记录的交易数据。

需要说明的是,在本申请实施例中,可以首先建立一个以太坊节点,并加入以太坊网络中,进而通过建立的以太坊节点获取以太坊网络中当前的内容数据,即对以太坊区块链中的数据进行同步,以获取在以太坊网络中发送的各交易数据。

步骤102,对所述内容数据进行解析处理,以确定所述以太坊网络中的基础数据。

在本申请实施例中,在通过以太坊节点获取到以太坊网络中当前的内容数据之后,可以对获取到的内容数据进行解析处理,即通过以太坊接口对获取到的内容数据进行数据抽取、解析、转换、加载,以去除获取到的内容数据中无用数据,确定出以太坊网络中的基础数据。其中,基础数据可以包括以太坊块数据(block)、交易数据(transaction)、收据数据(recipts)、日志数据(logs)、合约数据(contract)、代币数据(token)等。

步骤103,对所述基础数据进行整理,以确定所述以太坊网络中每个以太坊地址对应的基础信息。

其中,以太坊地址,是指以太网中的用户标识。可以理解的是,每个以太坊地址相当于一个用户账号,与该用户相关的所有数据,都与其对应的以太坊地址相关联。但是,由于以太坊的去中心化与匿名的特点,在以太坊网络中无法获取到与用户身份相关的信息,因此,在本申请实施例中,可以采用以太坊网络中的以太坊地址表示以太坊网络中的用户。

在本申请实施例中,对获取的以太坊网络中的当前的内容数据进行解析处理,确定出以太坊网络中的基础数据之后,即可根据基础数据中包括的地址信息,对基础数据进行整理,以确定出以太坊网络中每个以太坊地址对应的基础信息,即以太坊网络中的每个用户对应的基础信息。比如,每个以太坊地址对应的基础信息可以包括每个以太坊地址对应的交易数据、收据数据、日志数据、合约数据、代币数据等。

具体的,对以太坊网络中基础数据进行整理之后,确定的以太坊网络中每个以太坊地址对应的基础信息中可以包括:以太坊地址、以太坊地址的创建合约数、最后进账时间、最后出账时间、第一次进账时间、第一次出账时间、1天进账次数、7天进账次数、30天进账次数、180天进账次数、历史进账次数、1天出账次数、7天出账次数、30天出账次数、180天出账次数、历史出账次数、1天进账金额、7天进账金额、30天进账金额、180天进账金额、所有进账金额、最大一笔进账金额、1天转出金额、7天转出金额、30天转出金额、180天转出金额、所有转出金额、最大一笔转出金额。

需要说明的是,以太坊网络中每个以太坊地址对应的基础信息可以包括但不限于以上列举的情形。实际使用时,可以根据实际需要预设以太坊地址对应的基础信息的维度,以生成符合实际需要与预期的以太坊地址画像。

步骤104,对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。

其中,以太坊地址对应的特征指标集中包括可以描述以太坊地址的历史交易状态的多个特征指标。

在本申请实施例中,确定出以太坊网络中每个以太坊地址的基础信息之后,即可对每个以太坊地址的基础信息进行识别,即对每个以太坊地址的基础信息进行统计分析,确定出每个以太坊地址对应的特征指标集。

具体的,可以通过rfm模型对以太坊地址的基础信息进行识别,以确定出每个以太坊地址对应的特征指标集。即在本申请实施例一种可能的实现形式中,上述步骤104,可以包括:

利用预设的rfm模型,对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的新鲜度、活跃度及交易额度。

其中,rfm模型,是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(crm)的分析模式中,rfm模型是被广泛提到的。该机械模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱三项指标来描述该客户的价值状况。

其中,以太坊地址对应的新鲜度,与以太坊地址的最后一次交易时间以及以太坊地址的创建时间有关。具体的,以太坊地址的最后一次交易时间距离当前时刻的时间间隔越大,以太坊地址对应的新鲜度越低;以太坊地址的最后一次交易时间距离当前时刻的时间间隔越小,以太坊地址对应的新鲜度越高;以太坊地址的创建时间距离当前时刻的时间间隔越大,以太坊地址对应的新鲜度越低;以太坊地址的创建时间距离当前时刻的时间间隔越小,以太坊地址对应的新鲜度越高。

以太坊地址对应的活跃度,与以太坊地址的交易频率有关,以太坊地址的交易频率越低,以太坊地址对应的活跃度也越低;以太坊地址的交易频率越高,以太坊地址对应的活跃度也越高。

以太坊地址对应的交易额度,与以太坊地址的历史交易金额有关,以太坊地址的历史交易金额越大,以太坊地址对应的交易额度越大;以太坊地址的历史交易金额越小,以太坊地址对应的交易额度越小。

可以理解的是,以太坊地址对应的新鲜度、活跃度及交易额度可以从多个维度描述以太坊地址的历史交易行为,因此,可以作为以太坊地址对应的特征指标集中的特征指标,用于描述以太坊地址的画像。

在本申请实施例一种可能的实现形式中,可以通过预设的rfm模型,对每个以太坊地址的基础信息进行识别,以确定出每个以太坊地址的新鲜度、活跃度及交易额度。具体的,可以根据以太坊地址的创建时间、最后进账时间、最后出账时间,确定以太坊地址对应的新鲜度,即可以将最后进账时间、最后出账时间两者中距离当前时刻的时间间隔较小的时间,确定为以太坊地址的最后一次交易时间,并根据以太坊地址的最后一次交易时间以及创建时间,确定以太坊地址对应的新鲜度;可以根据以太坊地址的历史进账次数、历史出账次数,确定以太坊地址对应的活跃度;可以根据以太坊地址的所有进账金额、所有转出金额,确定以太坊地址对应的交易额度。

需要说明的是,以太坊地址对应的新鲜度、活跃度及交易额度可以包括多个等级。具体的,可以根据以太坊地址的基础信息,确定出每个以太坊地址对应的新鲜度等级、活跃度等级以及交易额度等级。其中,以太坊地址的最后一次交易时间距离当前时刻的时间间隔越小,以太坊地址对应的新鲜度等级越高;以太坊地址的历史进账次数、历史出账次数越高,以太坊地址对应的活跃度越高;以太坊地址的所有进账金额、所有转出金额越大,以太坊地址对应的交易额度越大。

实际使用时,以太坊地址对应的新鲜度、活跃度及交易额度包括的等级个数,以及以太坊相应的基础信息与以太坊地址对应的新鲜度、活跃度及交易额度等级的对应关系,可以根据实际需要预设,本申请实施例对此不做限定。比如,可以将以太坊地址对应的新鲜度、活跃度及交易额度分别划分为5个等级。

需要说明的是,对以太坊地址的基础信息进行识别的方法,以及以太坊地址对应的特征指标集中包括的特征指标,可以根据实际需要预设,本申请实施例对此不做限定。

进一步的,在确定出每个以太坊地址对应的特征指标集之后,可以根据各以太坊地址对应的特征指标集,确定出每个以太坊地址的类型。即在本申请实施例一种可能的实现形式中,上述步骤104之后,可以包括:

根据每个以太坊地址对应的特征指标集,确定每个以太坊地址的类型。

其中,以太坊地址的类型,可以包括是否为交易所特征地址、交易所类型、是否为异常特征地址、异常类型。

需要说明的是,以太坊地址的类型可以包括但不限于以上列举的情形。实际使用时,以太坊地址的类型可以根据实际的业务场景特征预设,本申请实施例对此不做限定。

在本申请实施例一种可能的实现形式中,可以预设以太坊地址类型与特征指标集的映射关系,并根据确定出的每个以太坊地址对应的特征指标集以及预设的以太坊地址类型与特征指标集的映射关系,确定出每个以太坊地址的类型。

举例来说,以太坊地址对应的特征指标集中包括以太坊地址对应的新鲜度、活跃度以及交易额度指标。那么,判断以太坊地址的类型是否为异常地址的以太坊地址类型与特征指标集的映射关系可以预设为:对应的交易额度大于阈值的以太坊地址为异常地址,异常类型为交易额度异常。

需要说明的是,上述举例仅为示例性的,不能视为对本申请的限制。实际使用时,可以根据实际需要预设以太坊地址的类型与特征指标集的映射关系,本申请实施例对此不做限定。

在本申请实施例另一种可能的实现形式中,还可以通过预设的识别模型对以太坊地址对应的特征指标集进行识别,以确定每个以太坊地址的类型。具体的,可以首先从以太坊网络中获取大量的内容数据,并通过对获取的内容数据进行整理和识别,确定出每个以太坊地址对应的特征指标集,并对每个以太坊地址进行人工标注,其中,标注信息中包括以太坊地址的类型。之后将每个以太坊地址对应的特征指标集以及人工标注信息作为训练数据,进行训练,从而获得识别模型。在确定以太坊地址对应的类型时,可以直接将确定出的以太坊地址对应的特征指标集输入预设的识别模型,即可根据识别模型的输出,确定出以太坊地址的类型。

本申请实施例提供的以太坊地址画像生成方法,可以从以太坊节点中获取以太坊网络中当前的内容数据,并对内容数据进行解析处理,以确定以太坊网络中的基础数据,之后对基础数据进行整理,以确定以太坊网络中每个以太坊地址对应的基础信息,进而对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。由此,通过对以太坊网络中的内容数据进行分析、整理,以确定出每个以太坊地址对应的特征指标集,即对每个以太坊地址进行了画像,从而可以通过以太坊地址的画像识别出以太坊中的风险地址、异常交易,提高了以太坊网络的安全性和可靠性。

在本申请实施例一种可能的实现形式中,还可以根据与以太坊网络中的基础数据相关的链下数据,完善以太坊网络中的每个以太坊地址的基础信息,并根据确定出的各以太坊地址对应的特征指标集,确定出每个以太坊地址的画像指标集,以生成每个以太坊地址的画像。

下面结合图2,对本申请实施例提供的以太坊地址画像生成方法进行进一步说明。

图2为本申请实施例所提供的另一种以太坊地址画像生成方法的流程示意图。

如图2所示,该以太坊地址画像生成方法,包括以下步骤:

步骤201,从以太坊节点中获取以太坊网络中当前的内容数据。

步骤202,对所述内容数据进行解析处理,以确定所述以太坊网络中的基础数据。

上述步骤201-202的具体实现过程及原理,可以参照上述实施例的详细描述,此处不再赘述。

步骤203,根据所述基础数据,爬取与所述基础数据相关的链下数据。

步骤204,对所述基础数据及链下数据进行整理,以确定每个以太坊地址对应的基础信息。

需要说明的是,为保证获取的每个以太坊地址对应的基础信息的丰富度,提高对以太坊地址画像生成的准确度,不仅可以从以太坊区块链中获取以太坊网络中的链上数据,还可以从与从其他渠道获取与从以太坊网络中获取的基础数据相关的链下数据。

具体的,可以根据获取的以太坊网络中的基础数据,从与以太坊网络中基础数据相关的第三方应用、代币数据、项目信息中,爬取链下数据。即在本申请实施例一种可能的实现形式中,上述步骤203,可以包括:

根据所述基础数据中的地址信息,爬取与所述基础数据相关的项目信息、代币数据及分布式应用。

其中,基础数据中的地址信息,是指该基础数据对应的以太坊地址。

需要说明的是,可以根据基础数据中包括的地址信息,确定与该以太坊地址相关的项目信息(如该以太坊地址参与或投资的项目信息)、该以太坊地址对应的代币数据以及该以太坊地址使用过的分布式应用等,并从网络中爬取与与基础数据中地址信息相符的项目信息、代币数据以及分布式应用,作为与以太坊网络中的基础数据相关的链下数据。

在本申请实施例一种可能的实现形式中,确定出以太坊网络中的基础数据,以及与基础数据相关的链下数据之后,可以根据基础数据中的地址信息,对基础数据以及与基础数据相关的链下数据进行整理,以确定出以太坊网络中每个以太坊地址对应的基础信息,即以太坊网络中的每个用户对应的基础信息。比如,每个以太坊地址对应的基础信息可以包括每个以太坊地址对应的交易数据、收据数据、日志数据、合约数据、代币数据等。

具体的,对以太坊网络中基础数据进行整理之后,确定的以太坊网络中每个以太坊地址对应的基础信息中可以包括:以太坊地址、以太坊地址的创建合约数、最后进账时间、最后出账时间、第一次进账时间、第一次出账时间、1天进账次数、7天进账次数、30天进账次数、180天进账次数、历史进账次数、1天出账次数、7天出账次数、30天出账次数、180天出账次数、历史出账次数、1天进账金额、7天进账金额、30天进账金额、180天进账金额、所有进账金额、最大一笔进账金额、1天转出金额、7天转出金额、30天转出金额、180天转出金额、所有转出金额、最大一笔转出金额。

需要说明的是,以太坊网络中每个以太坊地址对应的基础信息可以包括但不限于以上列举的情形。实际使用时,可以根据实际需要预设以太坊地址对应的基础信息的维度,以生成符合实际需要与预期的以太坊地址画像。

步骤205,对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。

在本申请实施例中,确定出以太坊网络中每个以太坊地址的基础信息之后,即可对每个以太坊地址的基础信息进行识别,即对每个以太坊地址的基础信息进行统计分析,确定出每个以太坊地址对应的特征指标集,以对每个以太坊地址对应的交易数据进行描述。

在本申请实施例一种可能的实现形式中,可以利用预设的rfm模型,对每个以太坊地址的基础信息进行识别,确定每个以太坊地址对应的新鲜度、活跃度及交易额度,以通过每个以太坊地址对应的新鲜度、活跃度及交易额度构成每个以太坊地址的特征指标集。

进一步的,还可以通图模型对以太坊地址对应的基础信息进行识别,以确定以太坊地址对应的交易行为网络、出度、入度、排名等指标。即在本申请实施例一种可能的实现形式中,上述步骤205,可以包括:

利用预设的图模型对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的交易行为网络、出度、入度及排名。

其中,图模型,是指由点和线组成的用以描述系统的图形。图模型属于结构模型,可用于描述自然界和人类社会中的大量事物和事物之间的关系。在建模中采用图模型可利用图论作为工具。按图的性质进行分析为研究各种系统,特别是复杂系统提供了一种有效的方法。构成图模型的图形不同于一般的几何图形。例如,它的每条边可以被赋以权,组成加权图。权可取一定数值,用以表示距离、流量、费用等。

在本申请实施例中,可以预设图模型的构建方式,并利用预设的图模型对每个以太坊地址对应的基础信息进行识别,即采用预设的图模型表示每个以太坊地址对应的基础信息。比如,预设的图模型可以是,利用图模型中的一个结点表示一个以太坊地址;利用图模型中节点之间的有向线段,表示以太坊地址之间的交易记录,即指向一个节点的有向线段,表示该节点对应的以太坊地址的进账记录,一个节点指向其他节点的有向线段,表示该节点的出账记录;采用有向线段的权重,表示该有向线段对应的交易金额等。

需要说明的是,利用预设的图模型表示每个以太坊地址对应的基础信息之后,即可根据图模型直观的确定出每个以太坊地址对应的交易对象以及交易金额,从而可以通过预设的图模型,确定出每个以太坊地址对应的交易行为网络、出度、入度及排名。

其中,以太坊地址对应的交易行为网络,可以包括该以太坊地址对应的出账交易对象列表、出账合约类型交易对象列表(调用合约列表)、出账代币类型交易对象地址列表(代币地址列表)、出账分布式应用类型交易对象列表(使用过的分布式应用列表)、出账代币类型交易对象名称列表(代币列表)、交易过的代币个数、出账交易对象个数、交易过的合约个数、交易过的分布式应用个数、转入对象列表、转入地址个数等。

其中,以太坊地址对应的出度,是指该以太坊地址对应的所有转出金额;以太坊地址对应的入度,是指该以太坊地址对应的所有进账金额;以太坊地址对应的排名,可以是指该以太坊地址对应的网页排名(pagerank),可以通过有向图中指向该以太坊地址对应的节点的有向线段的数量,以及指向该以太坊节点的各以太坊地址的重要性确定。

步骤206,根据每个预设的画像指标与特征指标的映射关系,以及每个以太坊地址对应的特征指标集,确定与每个以太坊地址对应的画像指标集,其中,所述画像指标集包括以下指标中的至少一个:开发者指数、资深指数、活跃指数、土豪指数、专注指数、影响力指数。

在本申请实施例一种可能的实现形式中,在对每个以太坊地址对应的基础信息进行识别,确定出每个以太坊地址对应的特征指标集之后,可以根据以太坊地址对应的特征指标集,生成以太坊地址的画像。具体的,可以根据预设的画像指标与特征指标的映射关系,以及每个以太坊地址对应的特征指标集,确定出每个以太坊地址对应的画像指标集。其中,以太坊地址对应的画像指标集中,可以包括开发者指数、资深指数、活跃指数、土豪指数、专注指数、影响力指数等。

需要说明的是,以太坊地址对应的开发者指数,主要与以太坊地址创建合约数指标有关,即以太坊地址创建的合约数越多,开发者指数越高;反之,开发者指数越低。以太坊地址对应的资深指数/年龄指数,主要与以太坊地址对应的进出账时间指标有关,即以太坊地址对应的进出账时间距当前时刻的时间间隔越大,以太坊地址对应的资深指数越高;反之,资深指数越低。以太坊地址对应的活跃指数,主要与以太坊地址对应的进出账次数指标有关,即以太坊地址对应的进出账次数越多,以太坊地址对应的活跃指数越高;反之,活跃指数越低。以太坊地址对应的土豪指数,主要与以太坊地址对应的进出账金额指标有关,即以太坊地址对应的进出账金额越大,以太坊地址对应的土豪指数越高;反之,土豪指数越低。以太坊地址对应的专注指数,主要与以太坊地址对应的交易对象类型及个数有关,即以太坊地址对应的交易对象类型及个数越少,以太坊地址对应的专注指数越高;反之,专注指数越低。以太坊地址对应的影响力指数,主要与以太坊地址在交易网络的pagerank排名有关,即以太坊地址在交易网络的pagerank排名越高,以太坊地址对应的影响力指数越高;反之,影响力指数越低。

需要说明的是,以太坊地址对应的画像指标集可以包括但不限于以上列举的情形。实际使用时,可以根据实际需要预设以太坊地址对应的画像指标集,以生成实际业务场景的以太坊地址画像,本申请实施例对此不做限定。

在本申请实施例一种可能的实现形式中,确定出每个以太坊地址对应的画像指标集之后,可以根据每个以太坊地址对应的画像指标集,为每个以太坊地址推荐符合其对应的画像指标集的项目信息,不仅可以精准推荐用户感兴趣的内容,还可以更好的推广以太坊项目。

本申请实施例提供的以太坊地址画像生成方法,可以对从以太坊节点中获取以太坊网络中当前的内容数据,进行解析处理,以确定以太坊网络中的基础数据,并根据基础数据,爬取与基础数据相关的链下数据,之后对基础数据及链下数据进行整理,以确定每个以太坊地址对应的基础信息,进而对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集,并根据每个预设的画像指标与特征指标的映射关系,以及每个以太坊地址对应的特征指标集,确定与每个以太坊地址对应的画像指标集。由此,通过对以太坊网络中的基础数据及与基础数据相关的链下数据进行分析、整理,以确定出每个以太坊地址对应的特征指标集,并根据每个以太坊地址对应的特征指标集确定出每个以太坊地址对应的画像指标集,即对每个以太坊地址进行了画像,从而不仅可以通过以太坊地址的画像识别出以太坊中的风险地址、异常交易,提高了以太坊网络的安全性和可靠性,而且可以精准推荐符合以太坊地址画像的项目信息,有利于以太坊项目的推广,改善了用户体验。

为了实现上述实施例,本申请还提出一种以太坊地址画像生成装置。

图3为本申请实施例提供的一种以太坊地址画像生成装置的结构示意图,。

如图3所示,该以太坊地址画像生成装置30,包括:

获取模块31,用于从以太坊节点中获取以太坊网络中当前的内容数据;

第一确定模块32,用于对所述内容数据进行解析处理,以确定所述以太坊网络中的基础数据;

第二确定模块33,用于对所述基础数据进行整理,以确定所述以太坊网络中每个以太坊地址对应的基础信息;

第三确定模块34,用于对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。

在实际使用时,本申请实施例提供的以太坊地址画像生成装置,可以被配置在任意电子设备中,以执行前述以太坊地址画像生成方法。

本申请实施例提供的以太坊地址画像生成装置,可以从以太坊节点中获取以太坊网络中当前的内容数据,并对内容数据进行解析处理,以确定以太坊网络中的基础数据,之后对基础数据进行整理,以确定以太坊网络中每个以太坊地址对应的基础信息,进而对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。由此,通过对以太坊网络中的内容数据进行分析、整理,以确定出每个以太坊地址对应的特征指标集,即对每个以太坊地址进行了画像,从而可以通过以太坊地址的画像识别出以太坊中的风险地址、异常交易,提高了以太坊网络的安全性和可靠性。

在本申请一种可能的实现形式中,上述第三确定模块34,包括:

第一确定单元,用于利用预设的rfm模型,对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的新鲜度、活跃度及交易额度。

进一步的,在本申请另一种可能的实现形式中,上述第三确定模块34,还包括:

第二确定单元,用于利用预设的图模型对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的交易行为网络、出度、入度及排名。

在本申请一种可能的实现形式中,上述以太坊地址画像生成装置30,还包括:

第四确定模块,用于根据每个以太坊地址对应的特征指标集,确定每个以太坊地址的类型。

进一步的,在本申请另一种可能的实现形式中,上述以太坊地址画像生成装置30,还包括:

第五确定模块,用于根据每个预设的画像指标与特征指标的映射关系,以及每个以太坊地址对应的特征指标集,确定与每个以太坊地址对应的画像指标集,其中,所述画像指标集包括以下指标中的至少一个:开发者指数、资深指数、活跃指数、土豪指数、专注指数、影响力指数。

进一步的,在本申请再一种可能的实现形式中,上述以太坊地址画像生成装置30,还包括:

爬取模块,用于根据所述基础数据,爬取与所述基础数据相关的链下数据;

相应的,上述第二确定模块33,还包括:

第三确定单元,用于对所述基础数据及链下数据进行整理,以确定每个以太坊地址对应的基础信息。

进一步的,在本申请又一种可能的实现形式中,上述爬取模块,包括:

爬取单元,用于根据所述基础数据中的地址信息,爬取与所述基础数据相关的项目信息、代币数据及分布式应用。

需要说明的是,前述对图1、图2所示的以太坊地址画像生成方法实施例的解释说明也适用于该实施例的以太坊地址画像生成装置30,此处不再赘述。

本申请实施例提供的以太坊地址画像生成装置,可以对从以太坊节点中获取以太坊网络中当前的内容数据,进行解析处理,以确定以太坊网络中的基础数据,并根据基础数据,爬取与基础数据相关的链下数据,之后对基础数据及链下数据进行整理,以确定每个以太坊地址对应的基础信息,进而对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集,并根据每个预设的画像指标与特征指标的映射关系,以及每个以太坊地址对应的特征指标集,确定与每个以太坊地址对应的画像指标集。由此,通过对以太坊网络中的基础数据及与基础数据相关的链下数据进行分析、整理,以确定出每个以太坊地址对应的特征指标集,并根据每个以太坊地址对应的特征指标集确定出每个以太坊地址对应的画像指标集,即对每个以太坊地址进行了画像,从而不仅可以通过以太坊地址的画像识别出以太坊中的风险地址、异常交易,提高了以太坊网络的安全性和可靠性,而且可以精准推荐符合以太坊地址画像的项目信息,有利于以太坊项目的推广,改善了用户体验。

为了实现上述实施例,本申请还提出一种电子设备。

图4为本发明一个实施例的电子设备的结构示意图。

如图4所示,上述电子设备200包括:

存储器210及处理器220,连接不同组件(包括存储器210和处理器220)的总线230,存储器210存储有计算机程序,当处理器220执行所述程序时实现本申请实施例所述的以太坊地址画像生成方法。

总线230表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(isa)总线,微通道体系结构(mac)总线,增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

电子设备200典型地包括多种电子设备可读介质。这些介质可以是任何能够被电子设备200访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

存储器210还可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(ram)240和/或高速缓存存储器250。电子设备200可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统260可以用于读写不可移动的、非易失性磁介质(图4未显示,通常称为“硬盘驱动器”)。尽管图4中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如cd-rom,dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线230相连。存储器210可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块270的程序/实用工具280,可以存储在例如存储器210中,这样的程序模块270包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块270通常执行本申请所描述的实施例中的功能和/或方法。

电子设备200也可以与一个或多个外部设备290(例如键盘、指向设备、显示器291等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口292进行。并且,电子设备200还可以通过网络适配器293与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器293通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理器220通过运行存储在存储器210中的程序,从而执行各种功能应用以及数据处理。

需要说明的是,本实施例的电子设备的实施过程和技术原理参见前述对本申请实施例的以太坊地址画像生成方法的解释说明,此处不再赘述。

本申请实施例提供的电子设备,可以执行如前所述的以太坊地址画像生成方法,可以从以太坊节点中获取以太坊网络中当前的内容数据,并对内容数据进行解析处理,以确定以太坊网络中的基础数据,之后对基础数据进行整理,以确定以太坊网络中每个以太坊地址对应的基础信息,进而对每个以太坊地址的基础信息进行识别,以确定每个以太坊地址对应的特征指标集。由此,通过对以太坊网络中的内容数据进行分析、整理,以确定出每个以太坊地址对应的特征指标集,即对每个以太坊地址进行了画像,从而可以通过以太坊地址的画像识别出以太坊中的风险地址、异常交易,提高了以太坊网络的安全性和可靠性。

为了实现上述实施例,本申请还提出一种计算机可读存储介质。

其中,该计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,以实现本申请实施例所述的以太坊地址画像生成方法。

为了实现上述实施例,本申请再一方面实施例提供一种计算机程序,该程序被处理器执行时,以实现本申请实施例所述的以太坊地址画像生成方法。

一种可选实现形式中,本实施例可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户电子设备上执行、部分地在用户电子设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。

本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未发明的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由权利要求指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1