一种基于区块链的版权溯源的保护框架及方法与流程

文档序号:17373536发布日期:2019-04-12 23:02阅读:504来源:国知局
一种基于区块链的版权溯源的保护框架及方法与流程

本发明涉及网络和信息安全技术领域,尤其涉及一种基于区块链的版权溯源的保护框架及方法。



背景技术:

数字版权作品包括以电子图书、数字期刊、网络原创文学为主的文字型作品,以及数字音频、视频。在我国,由于数字技术对传统版权保护带来的冲击,数字作品的版权不能得到充分保护,用户的权益每每受到伤害,再加上相当多的网民缺乏良好的版权保护意识以及正确的数字消费观等,导致数字出版产业链不完善,无法进行正常的产业循环,数字出版业难以得到健康发展。

版权区块链技术是过去几年来信息技术最重大的发展之一,被认为是继大型机、个人电脑、互联网之后计算模式的颠覆性创新。它是一种在对等网络环境下,通过透明和可信规则,构建不可伪造、不可篡改和可追溯的块链式数据结构,实现和管理事务处理的模式。因为版权区块链的去中心化、去信任、集体维护、时序块链的特性,并且是一种安全可靠的数据库,所以被学者广泛研究和应用。版权区块链技术的引入能够消除现有数字版权登记风险,淘汰纸质版权记录,转而将版权上的全部交易信息记录在去中心化的账本中,这将极大减少版权欺诈风险,同时降低版权保险成本。

据此,针对互联网领域版权保护面临的挑战,目前急需一种将版权块链技术应用于数字版权中的基于区块链的版权溯源的保护框架及方法,给数字出版业的健康发展提供了保障。



技术实现要素:

本发明所要解决的技术问题在于提供一种通过使用版权区块链的去中心化、时序块链和不可篡改的特性来保护用户的权益的基于区块链的版权溯源的保护框架及方法。

本发明采用以下技术方案解决上述技术问题:

一种基于区块链的版权溯源的保护方法,该方法应用于由具有去中心化、数据不可篡改、时序块链特性的区块链,一个监管检测机构rta,并作用于n个用户所构成的网络环境;其中uj表示第j个用户,1≤j≤n,该方法包括如下步骤:

s1、生成双标签阶段:当某一用户uj向rta发送自己的数字作品m,包括文本、图像、视频、音频,rta对m进行sha256加密生成唯一标识哈希值id;并通过局部敏感哈希算法,生成对应的局部敏感哈希值lshv;

s2、盗版检测阶段:此阶段分为初步盗版检测和精确盗版检测;初步盗版检测:rta通过搜索、匹配登记在版权区块链上文件的双标签和用户文件的双标签,计算相似度;若lshv的汉明距离小于阈值,即初步盗版检测未通过,用户如果对检测结果有疑义,可以向rta提交精确盗版检测申请;若lshv的汉明距离大于阈值,即通过初步盗版检测,rta将双标签登记到区块链上;

s3、登记文件阶段:通过检测的数字作品才会被登记至版权区块链,登记内容包括<id,lshv,ft,ff,srta>,其中id是文件的标识哈希值,lshv是文件的局部敏感哈希值,ft是文件类型,ff是文件格式,srta是监管检测机构的签名;

s4、反馈盗版警告阶段:初步盗版检测或精确盗版检测未通过,rta向用户反馈盗版警告;

s5、用户反馈阶段:具体包括三种情况;分别为:(1)版权区块链的文件登记公开透明,对全网节点可见,用户可以查询登记在区块链的信息,若对文件登记有疑义可以向rta提供疑义文件的双标签,rta结合版权区块链的时间戳记载对其进行精确检测,通过检测则登记在区块链上,未通过检测则反馈盗版警告给用户;(2)接收到未通过初步盗版检测的用户,如果对结果有疑义也可以发送精确检测的申请;(3)用户如果对精确检测的结果仍有疑义,可以申请走法律程序,本框架的技术检测可为法律判决提供支撑。

作为本发明的优选方式之一,所述步骤s1的生成双标签阶段具体包括以下操作流程:

(1)唯一标识文件:监管检测机构将上传的文件块经过sha256加密算法生成唯一标识哈希id,id=sha256(m),其中id代表文件的标志哈希值;

(2)生成局部敏感哈希:

文本采用相似哈希算法simhash:

分词:提取n个特征关键词;哈希和特征向量加权:对每一个特征,用传统哈希算法对该特征产生一个64位哈希值b;对i=1到64:如果b的第i位为1,则v的第i个元素加上该特征值的权重;否则,如果b的第i位为0,则v的第i个元素减去该特征值的权重;合并特征向量和降维:每一特征的对应的二进制串v进行相加,如果v的第i位元素大于0,则s的第i位为1;否则,如果v的第i位小于0,则s的第i位为0;输出s作为最终要求的块局部敏感哈希值lshv;其中lshv代表文件的局部敏感哈希值;

图像采用感知哈希算法:

缩小图片:采用32*32的大小,方便离散余弦变换dct计算;转化为灰度图:把缩放后的图片转化为256阶的灰度图;计算dct:dct把图片分离成分率的集合;缩小dct:dct计算后的矩阵是32*32,保留左上角的8*8,这些代表的图片的最低频率;计算平均值:计算缩小dct后的所有像素点的平均值;进一步减小dct:大于平均值记录为1,反之记录为0;得到局部敏感哈希值:组合64个信息位,顺序随意保持一致性;

作为本发明的优选方式之一,所述步骤s2的盗版检测阶段具体包括以下操作流程:

(1)初步盗版检测:

rta首先获取版权区块链上相同类型文件的全部id,对比用户文件的id,id搜索匹配结果若相同,说明文件内容相同,是盗版文件,出现完全盗版警告;id搜索匹配若不相同,接下来会通过计算用户与版权区块链上文件lshv的汉明距离,汉明距离小于阈值,则有很大可能是盗版文件,出现盗版警告;汉明距离大于阈值,认为相似度不高,无盗版嫌疑,rta将正版文件的<id,lshv,ft,ff,srta>登记到版权区块链上;

(2)精确盗版检测:

用户对收到的盗版警告有疑义时,可向rta提交双标签申请精确检测;rta作为第三方,通过文件的id找出原文件,进行原文件的比较或人工判定,最终判定该文件是否属于盗版。

作为本发明的优选方式之一,所述步骤s3的登记文件阶段具体包括以下操作流程:

(1)双标签的存储:将文件的双标签存储在区块链上,rta以交易形式将双标签存储在区块体中;

(2)原文件的存储:检测完毕的原始文件根据用户需求选择性存储,存储在rta的云存储系统上或者由用户自己保存;

(3)查找原文件:rta从版权区块链获取已登记文件的id,根据这个id,从云存储系统或者用户得到无法篡改的原文件;

(4)用户验证:用户查询rta上传到版权区块链的id,保证rta不可以随意更改文件内容和版权造假。

作为本发明的优选方式之一,所述步骤s4的反馈盗版警告阶段具体包括以下操作流程:

(1)反馈初步盗版警告:rta向用户发送该用户文件的id、lshv,区块链中已登记的相似文件的id、lshv,区块号和文件检测的技术报告,其中文件检测的技术报告详细说明rta采用的检测方法和检测结果;根据不同媒体类型,rta选择不同的媒体匹配检测方法;文件id哈希值相同,rta反馈完全盗版警告;局部敏感哈希值的汉明距离小于阈值,则反馈部分盗版警告并给出相似文件间的汉明距离;最后rta对发送给用户的消息进行签名;

(2)反馈精确盗版警告:rta向用户发送该用户文件的id、lshv,区块链中已登记的相似文件的id、lshv,区块号和文件检测的技术报告;其中文件检测的技术报告包含相似原文件的片段和人工检测的负责人签名;对保密性不做特殊要求的文件,rta根据id找到正版原文件提供给用户,最后rta对发送给用户的消息进行签名。

作为本发明的优选方式之一,在所述s1生成双标签阶段中:rta用于认证用户身份、盗版检测和存储管理,当用户传送文件给rta时需要实名认证。

作为本发明的优选方式之一,在所述s2盗版检测阶段中:匹配登记在版权区块链上文件的双标签为唯一标识哈希值id和局部敏感哈希值lshv。

作为本发明的优选方式之一,在所述s3登记文件阶段中:所述ft文件类型为文件、图像、视频或音频。

作为本发明的优选方式之一,在所述s3登记文件阶段中:所述ff是文件格式是文件类型对应的格式,其为pdf,wmv或wav。

本发明还公开了一种基于区块链的版权溯源的保护框架,该框架应用于由具有去中心化、数据不可篡改、时序块链特性的区块链的一个监管检测机构rta,并作用于n个用户所构成的网络环境;其中uj表示第j个用户,1≤j≤n,该框架包括如下模块:

生成双标签模块:用于当某一用户uj向rta发送自己的数字作品m,包括文本、图像、视频、音频,rta对m进行sha256加密生成唯一标识哈希值id;并通过局部敏感哈希算法,生成对应的局部敏感哈希值lshv;

盗版检测模块:包括初步盗版检测模块和精确盗版检测模块;初步盗版检测模块:rta通过搜索、匹配登记在版权区块链上文件的双标签和用户文件的双标签,计算相似度;若lshv的汉明距离小于阈值,rta就会反馈盗版警告给用户,用户如果对版权归属有疑义可以申请精确盗版检测。若lshv的汉明距离大于阈值,即通过初步盗版检测,rta将双标签登记到区块链上;

登记文件模块:用于将通过检测的数字作品登记至版权区块链,登记内容包括<id,lshv,ft,ff,srta>,其中id是文件的标识哈希值,lshv是文件的局部敏感哈希值,ft是文件类型,ff是文件格式,srta是监管检测机构的签名;反馈盗版警告模块:初步盗版检测或精确盗版检测未通过,rta向用户反馈盗版警告;

反馈盗版警告模块:用于当初步盗版检测或精确盗版检测未通过,rta向用户反馈盗版警告;

用户反馈模块:主要用于实现:(1)由于版权区块链的文件登记公开透明,并对全网节点可见,当用户uj对版权区块链上的文件登记有疑义,通过向rta提供疑义文件的双标签,rta通过用户反馈模块对其进行精确检测,结合版权区块链的时间戳记载,通过检测则登记在区块链上,未通过检测则反馈盗版警告给用户;(2)接收到未通过初步盗版检测的用户,如果对结果有疑义也可以通过用户反馈模块发送精确检测的申请;(3)用户如果对精确检测的结果仍有疑义,通过用户反馈模块可以申请走法律程序,本框架的技术检测可为法律判决提供支撑。

本发明相比现有技术的优点在于:(1)本发明提出一种基于区块链的版权溯源的保护框架及方法,文件的登记在版权区块链上透明公示。

(2)本发明首次引入监管检测机构辅助计算文件相似度,在文件登记版权区块链之前进行初步盗版检测,减弱版权区块链登记文件的压力。

(3)本发明首次提出将文件的局部敏感值和标识哈希值结合,在版权区块链上登记双哈希标签,利用版权区块链的去中心化、不可篡改和可追溯的特性,使文件数据的登记过程变得透明可信。同时双哈希标签的结合,在计算文件相似度的同时可以达到抗碰撞效果。

(4)本发明考虑存储空间要求和效率方面,采用内部存储和外部存储结合的方式,原文件存储在云存储系统系统中或由用户保存,相对应的哈希值存储在版权区块链中,通过id建立链接。

附图说明

图1是本发明实施例1的网络模型图;

图2是本发明实施例1的基于版权区块链的版权保护跟踪溯源方法及框架的主要实施步骤流程图;

图3是本发明实施例1的版权区块链存储双标签的merkletree结构图;

图4是本发明实施例1的文本的局部敏感哈希算法的步骤流程图。

具体实施方式

下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

本发明的设计的思想与理念:版权区块链版权保护具有以下的优点:1、去中心化:可以避免中心化应用的存在导致系统整体失效的问题,版权区块链上每个节点都拥有最新的完整数据库拷贝,单单攻破少数节点不会起任何破坏历史交易的作用;2、时序块链,记录所有环节:版权区块链能记录所有使用和交易痕迹,可以追溯版权使用交易的全过程;3、不可逆且不可篡改,安全可信:版权区块链记录的数据经过一小时的确认即可认为不可篡改,除非打败全网51%算力,因此具有较高可信度;4、节点共同维护:打破从单点进入数据中心进行版权确认的模式,可以实现多节点进入,所有节点都能看到完整的版权使用和交易过程,版权登记的效率明显高于传统版权登记方式。虽然版权区块链版权保护具有以上优点,但是由于海量正版数字文件需要相对大的的空间存储,其次版权区块链存储大量数据的成本会比较高。所以本发明需要探索出一种合适的数据存储方式。同时,文件的正版登记需要一种高效的相似度对比算法。因此数据存储和计算问题是至关重要的。

基于以上设计思想与理念并为了保护用户的权益不会被侵害,如图1-4:本实施例1公开了一种一种基于区块链的版权溯源的保护方法,该方法应用于由具有去中心化、数据不可篡改、时序块链特性的区块链,一个监管检测机构rta,并作用于n个用户所构成的网络环境;其中uj表示第j个用户,1≤j≤n,该方法包括如下步骤:

s1、生成双标签阶段:当某一用户uj向rta发送自己的数字作品m,包括文本、图像、视频、音频,rta对m进行sha256加密生成唯一标识哈希值id;并通过局部敏感哈希算法,生成对应的局部敏感哈希值lshv;sha256加密算法可以抵抗生日攻击和差分攻击等,安全级别高。局部敏感哈希的效果是将高维向量哈希成一串n-bit的数字,当两个cos夹角越小(即越相似)那么他们哈希成的两串数字越相近。因此,将双标签结合起来,就可以达到标识文件和计算相似性的作用。rta在生成双标签之前,根据用户信息,在文件中加入数字水印,来证实该文件的所有权。这种被嵌入的水印可以是一段文字、标识、序列号等,而且这种水印通常是不可见或不可察的,它与原始数据紧密结合并隐藏其中,并可以经历一些不破坏源数据使用价值或商用价值的操作而能保存下来。版权区块链溯源保护技术结合传统的水印技术,文件保护效果更佳。

s2、盗版检测阶段:此阶段分为初步盗版检测和精确盗版检测;初步盗版检测:rta通过搜索、匹配登记在版权区块链上文件的双标签和用户文件的双标签,计算相似度;若lshv的汉明距离小于阈值,即初步盗版检测未通过,rta反馈盗版警告给用户,用户如果对检测结果有疑义,可以向rta提交精确盗版检测申请。若lshv的汉明距离大于阈值,即通过初步盗版检测rta将双标签登记到区块链上;

s3、登记文件阶段:通过检测的数字作品才会被登记至版权区块链,登记内容包括<id,lshv,ft,ff,srta>,其中id是文件的标识哈希值,lshv是文件的局部敏感哈希值,ft是文件类型,ff是文件格式,srta是监管检测机构的签名;

s4、反馈盗版警告阶段:初步盗版检测或精确盗版检测未通过,rta向用户反馈盗版警告。

s5、用户反馈阶段:此阶段可细分为三个阶段。分别为:1、版权区块链的文件登记公开透明,对全网节点可见,用户可以查询登记在区块链的信息,若对文件登记有疑义可以向rta提供疑义文件的双标签,rta结合版权区块链的时间戳记载对其进行精确检测,通过检测则登记在区块链上,未通过检测则反馈盗版警告给用户。2、接收到未通过初步盗版检测的用户,如果对结果有疑义也可以发送精确检测的申请。3、用户如果对精确检测的结果仍有疑义,可以申请走法律程序,本框架的技术检测可为法律判决提供支撑。

作为本发明的优选方式之一,所述步骤s1的生成双标签阶段具体包括以下操作流程:

(1)唯一标识文件:监管检测机构将上传的文件块经过sha256加密算法生成唯一标识哈希id,id=sha256(m),其中id代表文件的标志哈希值;

(2)生成局部敏感哈希:

文本采用相似哈希算法simhash:

分词:提取n个特征关键词;哈希和特征向量加权:对每一个特征,用传统哈希算法对该特征产生一个64位哈希值b;对i=1到64:如果b的第i位为1,则v的第i个元素加上该特征值的权重;否则,如果b的第i位为0,则v的第i个元素减去该特征值的权重;合并特征向量和降维:每一特征的对应的二进制串v进行相加,如果v的第i位元素大于0,则s的第i位为1;否则,如果v的第i位小于0,则s的第i位为0;输出s作为最终要求的块局部敏感哈希值lshv;其中lshv代表文件的局部敏感哈希值;拿两个特征向量举例,例如“安徽大学”的“4-4-44-44”和“计算机学院”的“5-55-555”进行累加,得到“4+5-4-5-4+54-5-4+54+5”,得到“9-91-119”。如果v的第i位元素大于0,则s的第i位为1;否则,如果v的第i位小于0,则s的第i位为0。例子中v[]=“9-91-11”对应的s[]=“10101”。输出s作为最终的局部敏感哈希。

图像采用感知哈希算法:

缩小图片:采用32*32的大小,方便离散余弦变换dct计算;转化为灰度图:把缩放后的图片转化为256阶的灰度图;计算dct:dct把图片分离成分率的集合;缩小dct:dct计算后的矩阵是32*32,保留左上角的8*8,这些代表的图片的最低频率;计算平均值:计算缩小dct后的所有像素点的平均值;进一步减小dct:大于平均值记录为1,反之记录为0;得到局部敏感哈希值:组合64个信息位,顺序随意保持一致性。视频、音频等文件也有对应的局部敏感哈希计算方式,本实施例就不一一列出。

作为本发明的优选方式之一,所述步骤s2的盗版检测阶段具体包括以下操作流程:

(1)初步盗版检测:

rta首先获取版权区块链上相同类型文件的全部id,对比用户文件的id,id搜索匹配结果若相同,说明文件内容相同,是盗版文件,出现完全盗版警告;id搜索匹配若不相同,接下来会通过计算用户与版权区块链上文件lshv的汉明距离,若汉明距离小于阈值,则有很大可能是盗版文件,出现盗版警告;汉明距离大于阈值,认为相似度不高,无盗版嫌疑;rta将正版文件的<id,lshv,ft,ff,srta>登记到版权区块链上;对于文本论文中汉明距离的经验值为3,两个文本汉明距离少于3,就说明很相似。对于图像,如果不相同的数据位数不超过5,就说明两张图像很相似;如果大于10,就说明这是两张不同的图像。

(2)精确盗版检测:

用户对收到的盗版警告有疑义时,可向rta提交双标签申请精确检测。rta作为第三方,通过文件的id找出原文件,进行原文件的比较或人工判定,最终判定该文件是否属于盗版。

作为本发明的优选方式之一,所述步骤s3的登记文件阶段具体包括以下操作流程:

(1)双标签的存储:双标签存储在图3所示的区块链上;

(2)原文件的存储:检测完毕的原始文件根据用户需求选择性存储,存储在rta的云存储系统上或者由用户自己保存;

(3)查找原文件:rta从版权区块链获取已登记文件的id,根据这个id,从云存储系统或者用户得到无法篡改的原文件;由于sha256哈希函数的良好特性可被用来进行文件完整性验证,保证rta获取的文件是无篡改的原始文件;

(4)用户验证:用户对rta上传至版权区块链的id进行验证,在本发明中rta作为第三方无更改事实能力,不需要完全可信。

作为本发明的优选方式之一,所述步骤s4的反馈盗版警告阶段具体包括以下操作流程:

(1)反馈初步盗版警告:rta向用户发送该用户文件的id、lshv,区块链中已登记的相似文件的id、lshv,区块号和文件检测的技术报告,其中文件检测的技术报告详细说明rta采用的检测方法和检测结果;根据不同媒体类型,rta选择不同的媒体匹配检测方法;文件id哈希值相同,rta反馈完全盗版警告;局部敏感哈希值的汉明距离小于阈值,则反馈部分盗版警告并给出相似文件间的汉明距离;最后rta对发送给用户的消息进行签名。

(2)反馈精确盗版警告:rta向用户发送该用户文件的id、lshv,区块链中已登记的相似文件的id、lshv,区块号和文件检测的技术报告;其中文件检测的技术报告包含相似原文件的片段和人工检测的负责人签名;对保密性不做特殊要求的文件,rta根据id找到正版原文件提供给用户,最后rta对发送给用户的消息进行签名。

作为本发明的优选方式之一,在所述s1生成双标签阶段中:rta用于认证用户身份、盗版检测和存储管理,当用户传送文件给rta时需要实名认证。

作为本发明的优选方式之一,在所述s2盗版检测阶段中:匹配登记在版权区块链上文件的双标签为唯一标识哈希值id和局部敏感哈希值lshv。

作为本发明的优选方式之一,在所述s3登记文件阶段中:所述ft文件类型为文件、图像、视频或音频。

作为本发明的优选方式之一,在所述s3登记文件阶段中:所述ff是文件格式是文件类型对应的格式,其中为pdf,wmv或wav。

本发明还公开了一种基于区块链的版权溯源的保护框架,该框架应用于由具有去中心化、数据不可篡改、时序块链特性的区块链的一个监管检测机构rta,并作用于n个用户所构成的网络环境;其中uj表示第j个用户,1≤j≤n,该框架包括如下模块:

生成双标签模块:用于当某一用户uj向rta发送自己的数字作品m,包括文本、图像、视频、音频,rta对m进行sha256加密生成唯一标识哈希值id;并通过局部敏感哈希算法,生成对应的局部敏感哈希值lshv;

盗版检测模块:包括初步盗版检测模块和精确盗版检测模块;初步盗版检测模块:rta通过搜索、匹配登记在版权区块链上文件的双标签和用户文件的双标签,计算相似度;若lshv的汉明距离小于阈值,rta就会反馈盗版警告给用户,用户如果对版权归属有疑义可以申请精确盗版检测。若lshv的汉明距离大于阈值,即通过初步盗版检测,rta将双标签登记到区块链上;

登记文件模块:用于将通过检测的数字作品登记至版权区块链,登记内容包括<id,lshv,ft,ff,srta>,其中id是文件的标识哈希值,lshv是文件的局部敏感哈希值,ft是文件类型,ff是文件格式,srta是监管检测机构的签名;反馈盗版警告模块:初步盗版检测或精确盗版检测未通过,rta向用户反馈盗版警告;

反馈盗版警告模块:用于当初步盗版检测或精确盗版检测未通过,rta向用户反馈盗版警告;

用户反馈模块:主要用于实现:(1)由于版权区块链的文件登记公开透明,并对全网节点可见,当用户uj对版权区块链上的文件登记有疑义,通过向rta提供疑义文件的双标签,rta通过用户反馈模块对其进行精确检测,结合版权区块链的时间戳记载,通过检测则登记在区块链上,未通过检测则反馈盗版警告给用户;(2)接收到未通过初步盗版检测的用户,如果对结果有疑义也可以通过用户反馈模块发送精确检测的申请;(3)用户如果对精确检测的结果仍有疑义,通过用户反馈模块可以申请走法律程序,本框架的技术检测可为法律判决提供支撑。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1