一种基于区块链的数据可信确权方法和装置与流程

文档序号:36233122发布日期:2023-12-01 08:02阅读:56来源:国知局
一种基于区块链的数据可信确权方法和装置与流程

本发明涉及数据确权,尤其涉及一种基于区块链的数据可信确权方法和装置。


背景技术:

1、数据作为基础性战略资源,可以被买卖、转让和使用。然而,一旦某份数据在网络上发布,其他人就能转载和复制,导致无法追溯数据的最初作者,从而引发所有权不明确的问题。可见,数据的归属至关重要。因此,要将数据作为数字资产,最关键的是对数据进行确权,即确定某种数据的所有权或归属权属于谁。通过数据确权,可以促进数据整合,加速数据共享和流通,推动数据产业的迅速发展。

2、虽然基于互联网的信息网络方便了数据的共享,但无法实现数据的确权和记录数据价值的流转,因此无法将互联网上的数据视为资产。随着这一矛盾的加剧,区块链技术的出现有效解决了数据确权的问题。上传至区块链网络生成的每一份数据都可以定义其所有权关系,只有经过数据确权后,为其生成非同质化通证后,数据才真正具备价值,并且能够实现数据资产的流转和交易。

3、然而,现有的确权方案通常通过将待确权数据与数据库中已有的数据进行一一比对的方式进行数据查重,或者在原始数据基础上生成数字指纹(例如哈希值)利用数字指纹进行数据匹配,存在效率较低的问题,而随着当今几乎所有技术领域对快速解决方案的需求不断增长,毫无疑问,与现有的实现相比,确权效率正成为一个主要的制约因素。同时,针对一些易修改的文档内容,上述方式也很难实现精准查重,导致确权结果不准确。


技术实现思路

1、本发明提供一种基于区块链的数据可信确权方法和装置,用以解决现有技术中数据确权效率较低且确权结果准确性欠佳的缺陷。

2、本发明提供一种基于区块链的数据可信确权方法,包括:

3、基于区块链节点中每一已生成的文本类非同质化通证的原始数据,构建每一已生成的文本类非同质化通证的状态自动机;

4、将当前已生成的文本类非同质化通证的状态自动机作为待匹配自动机,对待确权数据与所述待匹配自动机进行逐文本块匹配,得到所述待确权数据与所述当前已生成的文本类非同质化通证的匹配结果;其中,在对所述待确权数据的当前文本块与所述待匹配自动机的当前匹配节点进行匹配时,将所述当前文本块与所述当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与所述待确权数据的下一文本块进行匹配;所述当前文本块的长度小于等于滑动窗口长度,所述后缀集合中包含长度小于等于滑动窗口长度的候选后缀;

5、基于所述待确权数据与每一已生成的文本类非同质化通证的匹配结果,确定所述待确权数据的确权结果。

6、根据本发明提供的一种基于区块链的数据可信确权方法,所述将所述当前文本块与所述当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与所述待确权数据的下一文本块进行匹配,具体包括:

7、分别确定所述当前文本块与所述当前匹配节点的后缀集合中每一长度为当前文本块长度的候选后缀之间的相似度,判断是否存在匹配的候选后缀;

8、若存在匹配的候选后缀,则确定所述待匹配自动机中所述匹配的候选后缀对应的节点,并在所述匹配的候选后缀对应的节点为结束节点时,标记所述待确权数据中当前匹配开始位置和当前文本块的结束位置之间的字符串为匹配串,将下一文本块的开始位置作为下一匹配开始位置,将所述待匹配自动机的初始节点作为下一匹配节点;在所述匹配的候选后缀对应的节点不为结束节点时,将所述匹配的候选后缀对应的节点作为下一匹配节点;

9、若不存在匹配的候选后缀,则确定所述当前匹配节点的模糊转移指针指向的节点作为下一匹配节点。

10、根据本发明提供的一种基于区块链的数据可信确权方法,任一已生成的文本类非同质化通证的状态自动机中任一节点的后缀集合是基于如下步骤构建的:

11、从所述任一节点开始对相应状态自动机进行深度优先遍历,基于每一条深度遍历路径上的各个节点对应的字符,获取长度小于等于所述滑动窗口长度的候选后缀;

12、其中,若在深度优先遍历过程中遍历到结束节点时,当前深度遍历路径上的节点数量小于所述滑动窗口长度,则将当前遍历到的结束节点的模糊转移指针指向的节点作为下一遍历节点,直至当前深度遍历路径上的节点数量等于所述滑动窗口长度。

13、根据本发明提供的一种基于区块链的数据可信确权方法,任一已生成的文本类非同质化通证的状态自动机中任一节点的模糊转移指针是基于如下步骤确定的:

14、确定相应状态自动机的初始节点到每一非初始节点的路径上每一节点对应的字符组成的字符串;

15、确定所述初始节点到任一非初始节点的路径上每一节点对应的字符组成的字符串的最长后缀,若所述最长后缀是相应状态自动机的初始节点到任一其他非初始节点的路径上每一节点对应的字符组成的字符串的最长前缀,则将所述任一非初始节点的模糊转移指针指向所述任一其他非初始节点;否则,将所述任一非初始节点的模糊转移指针指向所述初始节点。

16、根据本发明提供的一种基于区块链的数据可信确权方法,所述分别确定所述当前文本块与所述当前匹配节点的后缀集合中每一长度为当前文本块长度的候选后缀之间的相似度,判断是否存在匹配的候选后缀,具体包括:

17、计算所述当前文本块与任一长度为当前文本块长度的候选后缀之间的汉明距离,作为所述当前文本块与所述任一长度为当前文本块长度的候选后缀之间的相似度;

18、基于所述当前文本块对应的相似度阈值,以及所述当前文本块与所述任一长度为当前文本块长度的候选后缀之间的相似度,判断所述当前文本块是否与所述任一长度为当前文本块长度的候选后缀匹配;其中,所述当前文本块对应的相似度阈值是基于所述当前文本块的长度确定的。

19、根据本发明提供的一种基于区块链的数据可信确权方法,所述基于所述当前文本块对应的相似度阈值,以及所述当前文本块与所述任一长度为当前文本块长度的候选后缀之间的相似度,判断所述当前文本块是否与所述任一长度为当前文本块长度的候选后缀匹配,具体包括:

20、若所述当前文本块与所述任一长度为当前文本块长度的候选后缀之间的相似度最高且大于所述当前文本块对应的相似度阈值,则确定所述待确权数据中当前匹配开始位置和当前文本块的结束位置之间的字符串为第一字符串,确定从当前匹配开始位置对应的节点至所述任一长度为当前文本块长度的候选后缀对应的节点经历的路径对应的字符串为第二字符串;

21、确定所述第一字符串与所述第二字符串之间的编辑距离;

22、若所述编辑距离小于验证阈值,则确定所述当前文本块与所述任一长度为当前文本块长度的候选后缀匹配。

23、根据本发明提供的一种基于区块链的数据可信确权方法,所述验证阈值是基于所述第二字符串的长度和所述滑动窗口长度确定的;其中,所述第二字符串的长度越长或所述滑动窗口长度越长,则所述验证阈值越大。

24、根据本发明提供的一种基于区块链的数据可信确权方法,所述对待确权数据与所述待匹配自动机进行逐文本块匹配,得到所述待确权数据与所述当前已生成的文本类非同质化通证的匹配结果,具体包括:

25、获取所述待确权数据中的所有匹配串;

26、基于所述所有匹配串的总长度以及所述当前已生成的文本类非同质化通证的原始数据的长度,确定所述待确权数据与所述当前已生成的文本类非同质化通证的匹配结果。

27、根据本发明提供的一种基于区块链的数据可信确权方法,所述对待确权数据与所述待匹配自动机进行逐文本块匹配,之前还包括:

28、将所述待确权数据按照分隔符进行切分,得到多个切分段;

29、基于滑动窗口对各个切分段进行分块,得到多个文本块;其中,针对任一切分段,所述任一切分段包含至多一个长度小于所述滑动窗口长度的文本块。

30、本发明还提供一种基于区块链的数据可信确权装置,包括:

31、自动机构建单元,用于基于区块链节点中每一已生成的文本类非同质化通证的原始数据,构建每一已生成的文本类非同质化通证的状态自动机;

32、文本匹配单元,用于将当前已生成的文本类非同质化通证的状态自动机作为待匹配自动机,对待确权数据与所述待匹配自动机进行逐文本块匹配,得到所述待确权数据与所述当前已生成的文本类非同质化通证的匹配结果;其中,在对所述待确权数据的当前文本块与所述待匹配自动机的当前匹配节点进行匹配时,将所述当前文本块与所述当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与所述待确权数据的下一文本块进行匹配;所述当前文本块的长度小于等于滑动窗口长度,所述后缀集合中包含长度小于等于滑动窗口长度的候选后缀;

33、确权结果确定单元,用于基于所述待确权数据与每一已生成的文本类非同质化通证的匹配结果,确定所述待确权数据的确权结果。

34、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述基于区块链的数据可信确权方法。

35、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述基于区块链的数据可信确权方法。

36、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述基于区块链的数据可信确权方法。

37、本发明提供的一种基于区块链的数据可信确权方法和装置,通过基于区块链节点中每一已生成的文本类非同质化通证的原始数据,构建每一已生成的文本类非同质化通证的状态自动机,其中每个已生成的文本类非同质化通证的状态自动机中各个节点设置了模糊转移指针和后缀集合,可以在对待确权数据和每个已生成的文本类非同质化通证的状态自动机进行逐文本块匹配的过程中,将当前文本块与当前匹配节点的后缀集合中长度为当前文本块长度的候选后缀进行匹配,并将匹配的候选后缀对应的节点作为下一匹配节点与待确权数据的下一文本块进行匹配,得到待确权数据与每一已生成的文本类非同质化通证的匹配结果,并确定待确权数据的确权结果;其中为各个节点设置的模糊转移指针可以在匹配失败时快速确定下一匹配节点,而为各个节点设置包含长度小于等于预设滑动窗口长度的候选后缀的后缀集合,可以更快速地实现字符串的模糊匹配以应对通过轻微修改文本绕过确权检查的场景,实现更精准且时间复杂度接近线性的数据快速确权。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1