基于区块链的数据盒配置、使用和记账方法及其运作系统与流程

文档序号:17791427发布日期:2019-05-31 20:18阅读:247来源:国知局
基于区块链的数据盒配置、使用和记账方法及其运作系统与流程

本发明属于大数据安全技术领域,具体涉及基于区块链的数据盒配置、使用和记账方法及其运作系统。



背景技术:

随着数据资源的战略性和商业价值越来越显现,数据资源的开放共享变得越来越困难。目前数据开放共享有着一个巨大的挑战,那就是如何保证数据开放的同时确保数据稀缺性不丧失和隐私不泄露。以数据盒为数据开放共享的基本单元的数据自治开放模式的推动和实施过程中,如何保证数据盒内的数据不会被泄露,数据盒本身不会被转卖,这是我们目前需要解决的问题,也是困扰很多数据提供者,制约其开放共享数据的主要挑战。

本发明针对目前数据开放共享遇到的挑战,提出了一种以数据盒为数据开放共享载体,以区块链技术为数据使用和记账手段的系统,主要包括数据提供者数据盒配置、数据使用者使用数据盒和数据盒记账等部分。



技术实现要素:

本发明的目的在于提出一种安全性能好,且支持数据开放共享的基于区块链的数据盒配置、使用和记账方法及其运作系统。

本发明能使得数据提供者在进行数据开放共享时,在数据盒交付这一阶段中,利用区块链技术,保证每一笔数据盒的使用过程可追踪,使用记录难篡改,使用权利不可转移,保护数据使用者的唯一性,提升了数据盒使用的安全性,更好地支持数据开放共享。

本发明首先以面向数据自治开放的数据盒作为数据存储单元(如图1所示),在此基础上,提供基于区块链的数据盒的配置、使用和记账方法,即数据提供者可以按照自己的意愿,整理其准备开放的数据,制定数据的使用规则,以数据盒形式向数据使用者开放数据,在数据开放、共享、使用的过程中,保护数据盒内的数据安全,保证数据可控。这样,使数据提供者开放和共享数据的过程方便、易实施,同时也不失安全性和可控性,数据盒的打包、开放、交付和监控流程整体可追溯、可跟踪,数据使用者在使用数据盒内数据时操作方便,数据盒的使用对于开发和部署友好。

本发明提出一套基于区块链的数据盒配置、使用和记账方法及其运作系统。基于区块链的数据盒的配置、使用和记账方法,包括基于区块链的数据盒的配置、使用和记账,分述如下:

(1)数据盒的配置,包括数据盒内数据、环境、监控软件及外部接口的配置。具体流程如下:

i.数据盒的数据准备。数据提供者在面向数据盒提供者的数据盒管理平台,将数据库型数据和文件型数据注册到系统中。在注册数据库型数据的过程中,数据提供者为特定数据库型数据配置一定的隐私保护等级。隐私保护等级能够体现此项数据的受保护程度。隐私保护可被配置在数据库型数据的单字段上、表内多字段上及表间多字段上。当隐私保护等级被配置于单字段上时,数据使用者使用的字段集合包含这个字段时就会触发相关检查行为和保护行为;当隐私保护等级被配置于表内多字段时,数据使用者在该表中使用的多字段集合为这条配置中涉及的多字段的超集时,就会触发相关检查行为和保护行为;当隐私保护等级被配置于表间多字段时,数据使用者在跨若干表,使用的多字段集合为这条配置中涉及的多字段的超集时,就会触发相关检查行为和保护行为。隐私保护等级分为五档:最低、较低、一般、较高和最高,为离散值。类似的,在注册文件型数据过程中,数据提供者也可为特定文件配置一定的隐私保护等级,隐私等级也划分为五档:最低、较低、一般、较高和最高,为离散值。

上述面向数据盒提供者的数据盒管理平台,指以数据站为依托的,以计算能力虚拟化技术为核心手段的,具有将原始数据归类、注册并注入到特定容器中以创建数据盒的能力的平台。此处的计算能力虚拟化技术指docker等技术,此处的特定容器指在特定计算能力虚拟化技术中的虚拟化计算单位,如docker中的container容器;

数据提供者所提供的所有数据及数据的储存介质统称为数据站,可以为结构化或者非结构化数据库型数据,以及文件型数据等。

ii.数据盒的数据灌装。数据提供者选择数据盒内需灌入的数据(即在数据准备阶段已经注册完毕的数据库型数据和/或文件型数据)配置生成一个数据盒。配置主要分成两个部分,一个是选择若干特定数据库型数据中的若干特定数据库、数据表、数据字段等,以及为这些数据库、数据表、数据字段等配置别名等信息;另一个是选择若干特定文件型数据,以及将这些文件型数据配置成文件树结构。在配置完成数据后,数据提供者配置数据盒请求的自动处理规则。其中,数据盒请求的自动处理规则有两种:一种是低于某个需求等级时自动通过,另一个是高于某个需求等级时自动拒绝。数据盒请求的需求等级是由数据使用者填写的数据使用需求,以及数据提供者对于这些被需求的数据的隐私保护等级计算得出的。隐私需求等级同隐私保护等级一样,也分为五档:最低、较低、一般、较高和最高,为离散值。数据盒在上架前,数据提供者可以为数据盒进行分级。

iii.数据盒内的环境配备:为后续数据盒内数据的使用提供环境,包括但不限于操作系统环境、软件环境、进行数据使用所需的工具等。

iv.数据盒内固定软件配备:固定软件用于对数据盒内数据的使用情况和访问行为进行监控和评价,包括但不限于:监控数据使用情况的软件、监控数据使用行为的软件、评价风险并保护数据盒完整和数据盒安全的软件等。

v.数据盒向外接口的设置,接口包括但不限于:获取示例数据以供数据使用者在使用数据盒开发程序过程中,程序调试运行的接口、上传程序以使用数据盒内完整数据进行数据分析任务的接口、提供给数据提供者监控数据的接口、提供给数据使用者模型或者结果取回的接口等。

vi.数据盒调整:数据提供者在配置完成数据盒后,将数据盒将数据盒打包,并调整为上架状态。上架状态的数据盒可以被数据使用者在数据盒开放共享平台中浏览到。待收到数据使用者发出的数据盒使用请求后,评估并处理数据使用者的请求,同时可以为此次使用请求设置处理方式包括同意和拒绝。同时,数据提供者保留在数据使用者不当使用数据盒情况下收回或销毁数据盒的权利。

(2)数据盒的使用,包括:数据盒的使用申请,数据盒的按约使用。具体流程如下:

i.数据盒的使用申请。数据盒使用者先浏览数据盒相关信息,然后可以向希望使用的数据盒提出申请。申请需要填写一段用于描述使用目的和使用方式的文本,以及一系列具体的数据需求,包括:要使用的单字段、要使用的表内多字段的组合方式、要使用的表间多字段的使用方式等。

数据使用者填写的数据需求配置也会影响数据盒内部监控程序的行为。若数据使用者对某项数据的要求较高,则其请求的整体隐私需求等级则会较高,请求将更难得到通过;同时,数据使用者在通过请求后使用了请求中未涉及的字段,或者采取了未提及的使用方式,其行为将会被严格监控、限制,并可能最终导致数据盒的收回或者销毁。

在完成数据使用需求的填写后,数据使用者可以发出请求,请求首先经过数据提供者配置的数据盒请求自动处理规则的自动处理,如果不符合任何自动处理规则,则该请求将会提交给数据提供者进行人工审核。对于已经通过的数据盒请求,系统自动对数据盒进行交付。

ii.数据盒的按约使用。数据使用者将获得数据盒的使用权,并获得数据盒的一个实例,在事先约定的使用需求下,通过约定的方式(数据使用者利用给定的套件开发数据分析程序,或是打包生产环境程序等方式),对数据盒中的数据进行使用,其使用的数据盒不与其他数据使用者使用的数据盒冲突,数据使用者亦不可在获得使用的若干个数据盒间共享数据。

数据使用者需下载由数据盒管理平台为数据盒自动生成的数据盒开发套件来进行开发,该套件会自动导入数据盒的相关配置,提供给数据使用者一个友好的集成开发环境,数据使用者可在此开发环境中开发并调试数据分析程序。该套件亦可为数据使用者打包一份可使数据使用者在数据盒内运行的生产环境程序,以供数据使用者上传到数据盒内进行作业。

在完成数据分析程序的开发与打包后,数据使用者可以利用相关凭证(用户名、密码、数据盒交付后自动生成的鉴权凭证等),登入并上传该程序包到数据盒内部环境中。数据盒内部配置的相关软件将会自动启动该数据分析程序。在程序完成运行后,数据使用者将会得到通知,并可取回程序的结果,结果包括可由文本表示的分析数据或二进制的训练模型参数等。

(3)数据盒记账,包括:构建底层区块链系统,建立智能合约,数据盒交付记录上链,具体流程如下:

i.构建底层区块链系统:底层区块链系统是一个点对点通信网络,网络中的节点彼此之间互不信任,同时所有节点对网络中的数据的一致性达成共识,所有产生的数据以区块的形式进行保存,区块之间通过链表的形式链接起来,每个区块包含前一个区块的哈希值,从而使得改变之前的区块的内容需要改变该区块之后所有的区块内容,而每个区块又包含一个工作量证明,使得更改每个区块的内容需要重新计算工作量证明,所以更改以记录的数据需要消耗大量的计算资源,使之变得困难。

ii.建立智能合约:区块链的记录中可以存储少量额外的数据,但是无法对这些数据进行统一的索引以查询相关的内容,引入智能合约机制,用以存储自定义的数据结构,包括相应的存储和查询的接口,能对这些数据进行查询,从而实现对数据进行更加灵活的操作,以实现预定的要求。将合约部署到区块链上并得到智能合约的地址。接下来需要先创建好账户并导出账户的私钥,并向该地址转入一定的金额,用于发送记录向智能合约中存储数据盒使用信息,设置好这两者之后就可以使用上述描述的方式进行数据盒使用记录的存储和查询操作。

iii.数据盒交付记录上链:数据提供者在同意数据使用者的申请,数据盒交付给数据使用者完成后,该笔交互的记录信息会被提取出来,然后绑定在一个数据结构中,该数据结构包括和最终发送到智能合约上的信息内容一致的要素,即数据使用者、数据提供者、数据盒的id以及该数据盒使用请求id,然后调用智能合约将这些内容通过构造数据盒使用记录的形式发送到区块链上,待包含该数据盒使用记录的区块被成功的计算出来,存储信息的过程执行完成。需要注意的是,在这个过程中,由于在区块链中所有的记录都需要相应的费用,所以系统需要一个有余额的账户来发送这些记录。最后,在后续通过智能合约去查询所有数据盒的信息以及所有用户的记录信息时也需要使用该账户的信息,但是如果只是查询合约而不修改或者存储内容的话则不需要花费费用。

对应上述基于区块链技术的数据盒配置、使用和记账方法,其具体运作系统如图2所示,包括“面向数据提供者的数据盒管理平台”、“数据盒开放共享平台”、“面向数据使用者的数据盒使用平台”,“数据盒使用和记账的区块链”四个模块:其中:

所述“面向数据提供者的数据盒管理平台”,即帮助数据提供者将数据站的数据,通过一定的配置方式,辅以隐私约束手段灌装为数据盒,并完成交付前各项准备工作的管理客户端。包括但不限于:数据站管理模块,环境配置模块,数据盒打包模块,数据盒上架和监控模块,交互模块等。这些模块对应于数据盒配置过程中的数据盒的数据准备、数据灌装、环境配置、软件配置、数据盒打包、上架、监控等操作;利用这个客户端,数据提供者可以在友好的界面下,对需要开放的数据进行注册、管理、隐私配置,并完成数据盒的隐私约束配置、创建、上架及监控等。

所述“数据盒开放共享平台”,即用于向有意愿使用数据的数据使用者,展示“面向数据提供者的数据盒管理平台”中由数据提供者创建并上架的数据盒的平台系统。该平台的主要功能是辅助数据使用者更好地了解数据盒的数据内容,更好地确定数据盒交付意愿和规划数据盒使用方式,辅助数据提供者和数据使用者双方达成数据盒的交付,辅助数据提供者和数据使用者查询数据盒使用状态。

所述“面向数据使用者的数据盒使用平台”,提供给数据使用者一个友好的平台,辅助其方便又符合约定地使用其已申请并获得交付的数据盒中的具体数据,同时亦负责对数据盒使用者的行为进行一定程度的监测,通过并在发生异常时,警告数据盒使用者,并记录行为、向数据提供者报告行为,甚至销毁数据盒以避免进一步隐私泄露。

所述“数据盒使用和记账的区块链”,负责在数据盒交付后和使用时对具体使用行为进行记录,并提供查询接口,以供数据提供者与数据使用者进行查询。

该系统的运作的基本步骤为:

(1)准备数据。数据提供者使用“面向数据提供者的数据盒平台”,将数据站中准备开放共享的数据,注册为“面向数据提供者的数据盒平台”中可用的数据源,并为各项数据源配置隐私等级。

(2)准备数据盒。数据提供者使用“面向数据提供者的数据盒平台”,将已注册好的各项数据源,组合并配置为一个数据盒,并且为这个数据盒设定相关隐私保护等级。

(3)数据盒上架。数据提供者将打包配置好的数据盒设置为以上架状态。已经上架的数据盒可以被数据使用者在“数据盒开放共享平台”中看到,并且查看一些描述性质的数据盒信息,包括但不限于:表名称、表结构、数据盒描述等。

(4)数据盒交付,区块链记账。数据使用者在查看并选择好需要使用的数据盒后,可以向数据提供者发起数据盒使用请求。利用“数据盒开放共享平台”,双方可以通过双方约定的方式完成数据盒的交付。在交付完成后,“数据盒使用和记账的区块链”将会添加一条记录,记录这一次的数据盒交付行为,同时数据盒会被自动交付给数据使用者。

(5)区块链查询。在交付完成后,数据提供者和数据使用者双方均可以获取这次记录的凭证,凭借该凭证,双方都可以在“数据盒使用和记账的区块链”上进行查询。由于“数据盒使用和记账的区块链”上的记录都是唯一且难以篡改的,因此,可以认为如果查询到此次记录,则可以认为这次记录双方的身份是确定且可信的,防止数据盒被权利转移。

(6)数据盒使用及监测。在数据盒完成交付后,数据使用者可以使用“面向数据使用者的数据盒使用平台”,利用给定的开发工具进行数据分析程序的开发,利用给定的数据接口获取数据,利用给定的程序相关接口来进行程序的上传、运行和结果取回,实现对于数据盒内数据的开发和利用。数据盒内部配置的一套监测软件也会监测数据使用者的使用行为,防止过度使用和不当使用,保护数据安全。

以上步骤中,(1)~(4)步需依顺序进行,(5)、(6)步均发生于(4)步之后,但(5)、(6)步之间无时间上的先后顺序。

图2以更为形象的方式,展示了这些步骤。

综上,以数据盒作为数据自治开放的基本单元,在数据盒使用过程中设计约束并利用区块链技术对数据盒的使用情况进行记账,能够追溯数据盒使用情况,数据盒使用权利一旦被转移,使用该数据盒的操作均不会被通过,保障了数据盒使用权利的不可转移性及数据使用者的唯一性,为数据开放共享提供了技术支撑。

本发明利用数据盒作为数据自治开放的基本单元与使用载体,面对过去数据开放共享过程中数据隐私易泄露,数据易被二次转移,数据稀缺性难以保证的问题,采用了如下方案:在数据盒使用过程中设计一定的约束来保护数据中隐私的安全,实现数据的分级开放共享,利用区块链技术对数据盒的使用进行记账,保障了数据盒使用权利的不可转移性及数据使用者的唯一性。在此过程中,数据提供者可以使用友好的管理系统来完成数据盒的创建、管理、交付和监控的全流程,数据使用者可以使用友好的系统来完成数据盒的选择、申请和使用的全流程,同时利用区块链技术,以非侵入的方式对数据盒使用和交付进行记录,不增加数据提供者及数据使用者的使用复杂度,为数据开放共享提供了技术支撑。

附图说明

图1为本发明中利用的数据盒的组织结构图。

图2为本发明组成模块简略示意图。

图3为本发明组成模块详细示意图。

具体实施方式

下面以一个数据盒的完整生命周期为例,展示本方法的使用方式,并以言行一致使用数据盒、言行不一致使用数据盒、转移数据盒使用权三种行为为例,展示本方法中提及的保护方式。其中,言行一致是指数据使用者在申请数据盒时提供的使用需求描述与实际使用数据盒时进行的操作一致。

(1)数据提供者配置数据盒。数据提供者配置数据,将数据站中的数据库型数据和文件型数据配置为“面向数据提供者的数据盒管理平台”中能利用的数据源,并在该过程中设置隐私等级信息。数据提供者配置数据盒,将已经选定好的数据源进行组合和配置,并在该过程中设置数据盒的隐私等级。在这一步,数据盒被创建,并处于暂未上架的状态。

(2)数据提供者上架数据盒。数据提供者为配置好的数据盒调整为上架状态。在这一步数据盒处于已上架的状态,并可以被数据使用者浏览到。

(3)数据使用者查看并挑选数据盒。数据使用者前往“面向数据使用者的数据盒使用平台”,查看当前所有已上架可供查看的数据盒。数据使用者可以查看数据盒的描述以及数据盒内的各项数据的基本信息,并以此决定是否要申请或购买对应的数据盒。

(4)数据提供者和数据使用者完成数据盒申请和交付。数据使用者确定所需要使用的数据盒,向数据提供者申请特定数据盒,双方在“数据盒开放共享平台”进行协商并完成交付。交付完成后,该次记录会被区块链记录,以供双方查询。此时数据盒将会产生一个可供数据使用者使用的副本实例,并且交付给数据使用者。

(5)数据使用者言行一致的使用数据盒。数据使用者可以使用“面向数据盒使用者的数据盒平台”,利用给定的套件开发工具进行数据分析程序的开发,利用给定的数据接口获取数据,利用给定的程序相关接口来进行程序的上传、运行和结果取回,实现对数据盒内数据的利用。

(6)数据使用者言行不一致的使用数据盒。数据使用者在使用数据盒的过程中如发生了不当操作(包括但不限于:过度使用数据,使用了隐私保护等级过高的数据,对数据进行过度操作和处理,或尝试向外部发送原始数据)时,数据盒内配备的监控软件会对数据使用者发出警告,内部进行记录,通知数据提供者,并在必要情况下销毁数据盒以阻止隐私进一步泄露。

(7)数据使用者转移数据盒的使用权。数据使用者将数据盒转交给非授权数据使用者使用,数据盒被非授权的数据使用者打开时,无法从区块链上查询到符合双方身份的记录信息,将会无法启动,且这次异常信息会被报告给该数据盒对应的数据提供者。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1