数据存储方法、设备和存储介质与流程

文档序号:17398677发布日期:2019-04-13 01:01阅读:198来源:国知局
数据存储方法、设备和存储介质与流程

本申请涉及区块链技术领域,具体涉及一种数据存储方法、设备和存储介质。



背景技术:

现有的数据存储技术中,由于磁盘io读写存在瓶颈,对于数据库的读写效率(尤其是读操作)都会有较大影响;现有的解决方式是,采用最近最少使用(lru)缓存或预先读缓存的方式,使得数据库每次从磁盘中读取数据时候,都会将该数据周围数据一并读取到内存中,以减少直接读取磁盘次数。

现有的区块链系统中,通常会利用默克尔树(merkletree)、默克尔平衡二叉树(mavltree)等对区块的节点数据进行存储。以mavltree为例,在区块链网络中,由于mavltree的非叶子节点及叶子节点存储键值都是经过哈希运算产生,具有随机性,每次读取键值时都需要在整个数据库中进行查找;由于存储键值都是经过哈希运算产生,具有随机性,键值分布于数据库的各个地方,即使结合了lru缓存或预先读缓存的方式,将读取的相应键值周围数据一并读取到内存中,也降低了连续读取效率,无法减少磁盘io读写的次数。



技术实现要素:

鉴于现有技术中的上述缺陷或不足,期望提供一种减少硬盘实际读的次数,提高读效率的数据存储方法、设备和存储介质。

第一方面,本发明提供一种数据存储方法,包括:

将默克尔树的节点数据存储到键-值(key-value)数据库中时,对节点数据的键(key)添加前缀;其中,前缀包括节点数据对应的区块高度。

第二方面,本发明还提供一种设备,包括一个或多个处理器和存储器,其中存储器包含可由该一个或多个处理器执行的指令以使得该一个或多个处理器执行根据本发明各实施例提供的数据存储方法。

第三方面,本发明还提供一种存储有计算机程序的存储介质,该计算机程序使计算机执行根据本发明各实施例提供的数据存储方法。

本发明诸多实施例提供的一种数据存储方法通过将默克尔树的节点数据存储到键-值(key-value)数据库中时,对节点数据的键(key)添加前缀;其中,前缀包括节点数据对应的区块高度的方法,减少硬盘实际读的次数,提高读效率,为用户提供良好的用户体验。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1为本发明一实施例提供的数据存储场景的示意图。

图2为本发明一实施例提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1为本发明一实施例提供的数据存储场景的示意图。如图1所示,在本实施例中,在区块高度为500的区块中,节点收到若干交易使得相邻的四个叶子节点的节点数据发生变化,节点数据发生变化后,重新生成默克尔树,默克尔树的每个节点数据都存入键-值(key-value)数据库中,存储到键-值数据库中时,对节点数据的键(key)添加前缀;其中,前缀包括节点数据对应的区块高度。以下结合图2对本发明提供的数据存储方法进行具体说明。

图2为本发明一实施例提供的一种数据存储方法的流程图。

如图2所示,在本实施例中,本发明提供一种数据存储方法,其特征在于,将默克尔树的节点数据存储到键-值(key-value)数据库中时,对节点数据的键(key)添加前缀;其中,前缀包括节点数据对应的区块高度。

具体地,以图1所示的应用场景为例,用户a、用户b、用户c、用户d的余额状态均为拥有200个token1;叶子节点a记录用户a的余额状态,叶子节点b记录用户b的余额状态,叶子节点c记录用户c的余额状态,叶子节点d记录用户d的余额状态;在区块高度为500的区块中,节点甲收到两笔交易,交易m表示,用户a向用户b发送10个token1,交易n表示,用户c向用户d发送100个token1;对节点数据的键(key)添加前缀,前缀为节点数据对应的区块高度。

节点收到交易m及交易n后:

叶子节点a的节点数据变为:190个token1(数据0);

叶子节点b的节点数据变为:210个token1(数据1);

叶子节点c的节点数据变为:100个token1(数据2);

叶子节点d的节点数据变为:300个token1(数据3);

使用sha256算法对叶子节点a的节点数据变为:190个token1进行哈希运算,得到hash0,hash0为906962……9246e3;

使用sha256算法对叶子节点b的节点数据变为:210个token1进行哈希运算,得到hash1,hash1为832bd1……67c3b3;

使用sha256算法对叶子节点c的节点数据变为:100个token1进行哈希运算,得到hash2,hash2为d6ddc0……0cd2d9;

使用sha256算法对叶子节点d的节点数据变为:300个token1进行哈希运算,得到hash3,hash3为e33ed5……ce0c04;

并对hash0、hash1、hash2、hash3生成默克尔树,最终生成默克尔根。

将默克尔树的节点数据hash0、hash1、hash2、hash3、hash01、hash12、hash0123存储到键-值(key-value)数据库中时,对节点数据的键(key)添加前缀:

hash0添加前缀后生成的key为:500hash0;

hash1添加前缀后生成的key为:500hash1;

hash2添加前缀后生成的key为:500hash2;

hash3添加前缀后生成的key为:500hash3;

hash01添加前缀后生成的key为:500hash01;

hash23添加前缀后生成的key为:500hash23;

hash0123添加前缀后生成的key为:500hash0123。

最终存储到键-值(key-value)数据库时的数据为:

500hash0,190token1;

500hash1,210token1;

500hash2,100token1;

500hash3,300token1;

500hash01,hash0+hash1;

500hash23,hash2+hash3;

500hash0123,hash01+hash23。

上述实施例以对节点数据的键(key)添加前缀,前缀为节点数据对应的区块高度为例,对本发明提供的数据存储方法进行了阐述,在更多实施例中,还可以根据实际需求为节点数据配置不同的前缀(例如,将节点数据的前缀配置为区块的id),可实现相同的技术效果。

在现有的未对key添加前缀的方案中,从hash0为906962……9246e3,hash1为832bd1……67c3b3,hash2为d6ddc0……0cd2d9;hash3为e33ed5……ce0c04可以看出,默克尔树的非叶子节点及叶子节点存储键值都是经过哈希运算产生,具有随机性;键值分布于数据库的各个地方,即使结合了lru缓存或预先读缓存的方式,将读取的相应键值周围数据一并读取到内存中,也降低了连续读取效率,无法减少磁盘io读写的次数;

例如,读取hash1后(832bd1……67c3b3),会将与832bd1……67c3b3有连续性的一些数据一并读取到内存中,而与832bd1……67c3b3有连续性的数据,未必与hash1相关;在读取与hash1相关的数据(例如hash2)时,由于hash2(d6ddc0……0cd2d9)与hash1(832bd1……67c3b3)没有连续性,因此读取hash2时,还是需要从磁盘读取,实际上无法减少硬盘实际读的次数。

而使用上述实施例提供的方法后,在存储数据时,对节点数据的键(key)添加前缀,hash0添加前缀后生成的key为:500hash0;hash1添加前缀后生成的key为:500hash1;hash2添加前缀后生成的key为:500hash2;hash3添加前缀后生成的key为:500hash3;hash01添加前缀后生成的key为:500hash01;hash23添加前缀后生成的key为:500hash23;hash0123添加前缀后生成的key为:500hash0123。例如读取500hash1时,将500hash1相邻的若干个键值(500hash01、500hash0123、500hash12、500hash2)缓存至内存中;由于500hash2已被缓存在内存中,可以直接读取,从实际上减少硬盘实际读的次数,提高读效率。

上述实施例通过将默克尔树的节点数据存储到键-值(key-value)数据库中时,对节点数据的键(key)添加前缀;其中,前缀包括节点数据对应的区块高度的方法,减少硬盘实际读的次数,提高读效率,为用户提供良好的用户体验。

在一优选实施例中,前缀还包括标识符,该标识符用于标识节点数据所属节点是否叶子节点。以图1所示应用场景为例,为hash0、hash1、hash2、hash3、hash01、hash12、hash0123配置前缀,前缀包括前缀包括节点数据对应的区块高度,还包括用于标识节点数据所属节点是否叶子节点的标识符(例如,叶子节点的标识符为pri1,非叶子节点的标识符为pri2);将默克尔树的节点数据hash0、hash1、hash2、hash3、hash01、hash12、hash0123存储到键-值(key-value)数据库中时,对节点数据的键(key)添加前缀:

hash0添加前缀后生成的key为:500pri1hash0;

hash1添加前缀后生成的key为:500pri1hash1;

hash2添加前缀后生成的key为:500pri1hash2;

hash3添加前缀后生成的key为:500pri1hash3;

hash01添加前缀后生成的key为:500pri2hash01;

hash23添加前缀后生成的key为:500pri2hash23;

hash0123添加前缀后生成的key为:500pri2hash0123。

最终存储到键-值(key-value)数据库时的数据为:

500pri1hash0,190token1;

500pri1hash1,210token1;

500pri1hash2,100token1;

500pri1hash3,300token1;

500pri2hash01,hash0+hash1;

500pri2hash23,hash2+hash3;

500pri2hash0123,hash01+hash23。

上述实施例以对节点数据的键(key)添加前缀,前缀为节点数据对应的区块高度与标识节点数据所属节点是否叶子节点的标识符为例,对本发明提供的数据存储方法进行了阐述,在更多实施例中,还可以根据实际需求为节点数据配置不同的前缀(例如,将节点数据的前缀配置为区块的id与标识节点数据所属节点是否叶子节点的标识符),可实现相同的技术效果。

在一优选实施例中,默克尔树为默克尔平衡二叉查找树(mavltree);

计算默克尔平衡二叉查找树的非叶子节点的哈希值时,去除非叶子节点的子节点的键的前缀。

以图1所示应用场景为例,使用sha256算法对叶子节点a的节点数据变为:190个token1进行哈希运算,得到hash0,hash0为906962……9246e3;使用sha256算法对叶子节点b的节点数据变为:210个token1进行哈希运算,得到hash1,hash1为832bd1……67c3b3;计算非叶子节点的哈希值hash01时,去除非叶子节点的子节点的键的前缀,即使用hash0与hash1计算hash01:

hash01=hash(hash0+hash1)=hash(906962……9246e3+832bd1……67c3b3),计算出hash01为810611……aac6ff;

同理,计算出hash23,并使用hash01及hash23计算出hash0123。

在一优选实施例中,键还包括用于判断在磁盘中是否存在与键对应的数据的第一标识:

否,则返回报错信息。

例如,读取键为500pri1hash11的节点数据,而磁盘中并不存在键为500pri1hash11的节点数据的第一标识,此时返回报错信息。

图2为本发明一实施例提供的一种设备的结构示意图。

如图2所示,作为另一方面,本申请还提供了一种设备200,包括一个或多个中央处理单元(cpu)201,其可以根据存储在只读存储器(rom)202中的程序或者从存储部分208加载到随机访问存储器(ram)203中的程序而执行各种适当的动作和处理。在ram203中,还存储有设备200操作所需的各种程序和数据。cpu201、rom202以及ram203通过总线204彼此相连。输入/输出(i/o)接口205也连接至总线204。

以下部件连接至i/o接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分207;包括硬盘等的存储部分208;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至i/o接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入存储部分208。

特别地,根据本公开的实施例,上述任一实施例描述的数据存储方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行数据存储方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。

作为又一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例的装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,该程序被一个或者一个以上的处理器用来执行描述于本申请的数据存储方法。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以通过执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以通过专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,各所述单元可以是设置在计算机或移动智能设备中的软件程序,也可以是单独配置的硬件装置。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离本申请构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1