数据存储方法及系统、设备和存储介质与流程

文档序号:16919492发布日期:2019-02-19 19:14阅读:164来源:国知局
数据存储方法及系统、设备和存储介质与流程

本申请涉及区块链技术领域,具体涉及一种数据存储方法及系统、设备和存储介质。



背景技术:

当前区块链系统的数据读写的解决方案中,通常会采用默克尔树(merkletree)的结构,例如比特币的系统中通过默克尔树进行spv验证、以太坊的系统中通过默克尔前缀树(merklepatriciatree,简称mpt)进行数据的读写,等等。

当前利用默克尔树的结构进行数据存储的方案的缺陷在于:

所存储的数据限制了系统的读取性能,查询一笔交易的数据需要通过多次读操作来完成。例如,对于一颗20层的默克尔树,查询一个叶子节点的数据需要进行20次读操作来完成,导致数据查询的效率仅为普通数据库的查询效率的1/20,对于每秒能完成10万次读操作的系统,每秒仅能读取5000笔交易的数据。

更进一步地,现有方案需要在节点本地数据库中写完默克尔树的数据后才能进行区块的共识,导致在交易数量剧增时容易发生交易拥堵。

此外,现有方案在节点本地数据库中写默克尔树的数据时若发生崩溃,会导致无法生成区块。



技术实现要素:

鉴于现有技术中的上述缺陷或不足,期望提供一种通过优化所存储的数据结构提升系统读取性能的数据存储方法及系统、设备和存储介质,并进一步期望优化系统在发生交易拥堵或节点崩溃时的健壮性。

第一方面,本发明提供一种数据存储方法,包括:

在区块链网络的各节点本地存储对应于每个区块的默克尔树的全局索引表,以及每个区块的默克尔树。

其中,该全局索引表以区块高度为版本号,用于根据区块高度进行数据查询。

第二方面,本发明提供一种数据存储系统,配置在区块链网络的节点中,包括第一存储单元和第二存储单元。

第一存储单元配置用于在节点本地存储对应于每个区块的默克尔树的全局索引表;

第二存储单元配置用于在节点本地存储每个区块的默克尔树。

其中,该全局索引表以区块高度为版本号,用于根据区块高度进行数据查询。

第三方面,本发明还提供一种设备,包括一个或多个处理器和存储器,其中存储器包含可由该一个或多个处理器执行的指令以使得该一个或多个处理器执行根据本发明各实施例提供的数据存储方法。

第四方面,本发明还提供一种存储有计算机程序的存储介质,该计算机程序使计算机执行根据本发明各实施例提供的数据存储方法。

本发明诸多实施例提供的数据存储方法及系统、设备和存储介质通过为默克尔树配置相对应的、以区块高度为版本号的全局索引表,为系统提供了可以直接通过区块高度查询全局索引表、通过一次读操作即可完成查询的数据查询途径,从而大幅提升了系统的数据读取性能;

本发明一些实施例提供的数据存储方法及系统、设备和存储介质进一步通过在存储完全局索引表的数据后即打包区块共识,并异步存储对应的默克尔树的数据,从而可以大幅缓解交易数量剧增时的区块拥堵问题,同时还降低了存储数据时发生节点崩溃导致无法生成区块的风险;

本发明一些实施例提供的数据存储方法及系统、设备和存储介质进一步通过在节点崩溃时通过全局索引表恢复每个区块的默克尔树,从而无需通过向其它节点同步数据进行恢复,缓解了节点间的通信压力;

本发明一些实施例提供的数据存储方法及系统、设备和存储介质进一步通过查询全局索引表得到的数据构建最新版本的默克尔树,并将根节点哈希打包共识,实现了无需对全局索引表进行共识即可确保全局索引表的安全性;

本发明一些实施例提供的数据存储方法及系统、设备和存储介质进一步通过在全局索引表中只记录默克尔树新增或修改的叶子节点,从而大幅降低了为多版本默克尔树配置全局索引表所带来的数据冗余。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本发明一实施例中多版本默克尔树与全局索引表的对应关系示意图。

图2为本发明一优选实施例提供的一种数据存储方法的流程图。

图3为图2所示方法的一种优选实施方式的流程图。

图4为本发明一实施例提供的一种数据存储系统的结构示意图。

图5为图4所示系统的一种优选实施方式的结构示意图。

图6为本发明一实施例提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

在本实施例中,本发明提供一种数据存储方法,包括:

s10:在区块链网络的各节点本地存储对应于每个区块的默克尔树的全局索引表,以及每个区块的默克尔树。

其中,该全局索引表以区块高度为版本号,用于根据区块高度进行数据查询。

具体地,在本实施例中,上述默克尔树具体配置为默克尔状态树(merklestatetree),高度配置为20层,存储在节点本地的键值(key-value)数据库中,全局索引表存储在节点本地的另一数据库中;在更多实施例中,可根据实际需求将默克尔树配置为本领域常用的其它不同类型的默克尔树、不同高度、存储在节点本地的本领域常用的其它不同类型的数据库中,还可以将默克尔树和全局索引表存储在同一数据库中,均可实现相同的技术效果。

图1为本发明一实施例中多版本默克尔树与全局索引表的对应关系示意图。

如图1所示,以高度为3层的默克尔二叉状态树为例,在a节点中,当区块高度h=9的区块打包了一笔k4账户进行支付(或收款)、余额由v4变为v4′的交易时:

在步骤s10中,一方面在a节点本地的kv数据库中新增一个叶子节点h4′,并新增相对应的索引节点h34′和根节点h1234′,其中,h4′为(k4,v4′)的哈希值;

另一方面,在a节点本地的另一数据库中更新全局索引表,新增版本号为9的记录(k4,v4′)。

上述默克尔树和全局索引表的存储可以同步进行,也可以异步进行,以下将结合图2-4详细介绍异步进行存储的优选方案。

在本实施例中,被替换的叶子节点和索引节点将保留在数据库中,以便于在区块链发生分叉等场景下进行数据回滚;在另一些实施例中,还可以根据实际配置的不同方案将被替换的叶子节点和索引节点配置为直接删除或经过若干个区块高度后进行清理,可实现相同的技术效果。

显而易见地,在通过上述存储方法为每个区块的默克尔树配置相对应的全局索引表后,可以通过区块高度直接在全局索引表中查询所需的数据,而无需再根据默克尔树的根节点哈希对默克尔树进行逐层的读取和查询。

如图1所示,在本实施例中,全局索引表配置为在每个版本中只记录当前版本的默克尔树中新增或修改的叶子节点,而不再重复记录未发生修改的叶子节点;上述查询在所查找的区块高度若未查找到目标数据,可以通过数据库的指针进行滑动查找;

在另一实施例中,还可以将全局索引表配置为在每个版本中记录当前版本的默克尔树的所有叶子节点;在该实施例中,上述查询可以通过区块高度直接查找到目标数据。

上述实施例通过为默克尔树配置相对应的、以区块高度为版本号的全局索引表,为系统提供了可以直接通过区块高度查询全局索引表、通过一次读操作即可完成查询的数据查询途径,从而大幅提升了系统的数据读取性能;并进一步通过在全局索引表中只记录默克尔树新增或修改的叶子节点,从而大幅降低了为多版本默克尔树配置全局索引表所带来的数据冗余。

图2为本发明一优选实施例提供的一种数据存储方法的流程图。

如图2所示,在一优选实施例中,步骤s10包括:

s101:构建最新版本的默克尔树;

s103:根据最新版本的默克尔树在节点本地的第一数据库中生成或更新全局索引表,并生成全局索引表的存储完成信息,以供节点中的共识单元将最新版本的默克尔树的根节点哈希打包至区块中进行共识;

s105:根据最新版本的默克尔树在节点本地的第二数据库中生成或更新每个区块的默克尔树。

优选地,步骤s101包括:通过全局索引表查询交易所需的业务数据;以及,根据业务数据和交易构建最新版本的默克尔树。

具体地,在步骤s101中,当交易在默克尔树中新增叶子节点时,例如区块高度h=22时,用户甲开设新账户k11,无需进行余额v11的查询,直接在内存中新增叶子节点和对应的索引节点;

当交易在默克尔树中修改叶子节点时,例如区块高度h=23时,用户乙的账户k4与用户丙的账户k6发生交易,则需要通过上述全局索引表查询账户k4的余额v4,以及账户k6的余额v6;再根据v4和v6以及交易的数额计算出交易后账户k4的余额v4′,以及账户k6的余额v6′,再在内存中新增对应的叶子节点和索引节点,完成最新版本的默克尔树的构建。

在步骤s103中,根据步骤s101在内存中所构建的最新版本的默克尔树在节点本地的第一数据库中生成或更新全局索引表,并在第一数据库写完全局索引表后生成存储完成信息,通知节点中的共识单元可以进行区块的打包。共识单元在收到通知后将最新版本的默克尔树的根节点哈希打包至区块中,再将打包的区块广播进行共识。

其中,若节点本地存储的全局索引表被篡改导致查询到的交易前的余额不正确,则计算出的交易后的余额、最新版本的默克尔树的根节点哈希均不正确,从而导致打包的区块无法通过共识;因此,该方法可以保障节点本地存储的全局索引表无需通过共识,但只有根据正确的全局索引表所生成的区块可以通过共识。

在步骤s105中,当节点收到的需要打包共识的交易数量较少时,步骤s105的数据存储可以与步骤s103同步进行;而当交易数量较多,需要存储的默克尔树的数据量超过系统的存储性能瓶颈时,步骤s105的数据存储可以与步骤s103异步进行。

例如系统每秒可以存储5000笔交易的默克尔树的数据,但在高峰期节点每秒收到20000笔交易,由于全局索引表的数据量较小,可以实时完成步骤s103的数据存储并打包区块进行共识,而在高峰期过后再异步进行步骤s105的数据存储。

同时由于全局索引表的数据量较小、存储耗时较短,在全局索引表存储完成之前发生节点崩溃的概率较低,从而还可以大幅降低存储数据时发生节点崩溃导致无法生成区块的风险。

上述实施例进一步通过在存储完全局索引表的数据后即打包区块共识,并异步存储对应的默克尔树的数据,从而可以大幅缓解交易数量剧增时的区块拥堵问题,同时还降低了存储数据时发生节点崩溃导致无法生成区块的风险;并进一步通过查询全局索引表得到的数据构建最新版本的默克尔树,并将根节点哈希打包共识,实现了无需对全局索引表进行共识即可确保全局索引表的安全性。

图3为图2所示方法的一种优选实施方式的流程图。如图3所示,在一优选实施例中,步骤s103之后还包括:

s107:在节点崩溃后,根据全局索引表在第二数据库中恢复每个区块的默克尔树。

具体地,当全局索引表的数据存储完成之后,在默克尔树的数据存储之前发生节点崩溃,或在默克尔树的数据存储进行过程中发生节点崩溃,均可通过全局索引表在第二数据库中恢复每个区块的默克尔树。

上述实施例进一步通过在节点崩溃时通过全局索引表恢复每个区块的默克尔树,从而无需通过向其它节点同步数据进行恢复,缓解了节点间的通信压力。

图4为本发明一实施例提供的一种数据存储系统的结构示意图。图4所示的系统可对应执行上述包括步骤s10的方法。

如图4所示,在本实施例中,本发明提供一种数据存储系统10,配置在区块链网络的节点20中,包括第一存储单元101和第二存储单元103。

第一存储单元101配置用于在节点本地存储对应于每个区块的默克尔树的全局索引表;

第二存储单元103配置用于在节点本地存储每个区块的默克尔树。

其中,该全局索引表以区块高度为版本号,用于根据区块高度进行数据查询。

图4所示系统的数据存储原理可参照上述包括步骤s10的方法,此处不再赘述。

图5为图4所示系统的一种优选实施方式的结构示意图。图5所示的系统可对应执行图2-3所示的方法。

如图5所示,在一优选实施例中,数据存储系统10还包括构建单元105。

构建单元105配置用于构建最新版本的默克尔树;

第一存储单元101进一步配置用于根据最新版本的默克尔树在节点20本地的第一数据库中生成或更新全局索引表,并生成全局索引表的存储完成信息,以供节点20中的共识单元将最新版本的默克尔树的根节点哈希打包至区块中进行共识;

第二存储单元103进一步配置用于根据最新版本的默克尔树在节点20本地的第二数据库中生成或更新每个区块的默克尔树。

优选地,第二存储单元103进一步配置用于在节点20崩溃后,根据全局索引表在第二数据库中恢复每个区块的默克尔树。

优选地,构建单元105进一步配置用于通过全局索引表查询交易所需的业务数据,以及,根据业务数据和交易构建最新版本的默克尔树。

优选地,第一存储单元101进一步配置用于在全局索引表的每个版本中只记录当前版本的默克尔树中新增或修改的叶子节点。

图5所示系统的数据存储原理可参照图2-3所示的方法,此处不再赘述。

图6为本发明一实施例提供的一种设备的结构示意图。

如图6所示,作为另一方面,本申请还提供了一种设备600,包括一个或多个中央处理单元(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。在ram603中,还存储有设备600操作所需的各种程序和数据。cpu601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。

以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

特别地,根据本公开的实施例,上述任一实施例描述的数据存储方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行数据存储方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。

作为又一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例的装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,该程序被一个或者一个以上的处理器用来执行描述于本申请的数据存储方法。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以通过执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以通过专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,各所述单元可以是设置在计算机或移动智能设备中的软件程序,也可以是单独配置的硬件装置。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1