基于大数据的信息隐写方法及系统、信息提取方法及系统与流程

文档序号：13890168阅读：261来源：国知局

本发明涉及一种基于大数据的信息隐写方法及系统、信息提取方法及系统，属于信息隐私保护技术领域。

背景技术：

信息隐写与大众所熟知的“密码”不同，信息隐写是一种"匿形术"，致力于通过设计精妙的方法，使得非授权者根本无从得知秘密信息的存在与否、更无法得知秘密信息存在哪里。

“数据体量巨大、价值密度低”是大数据不同于“不大的数据”的关键特性，这些新型的特性使得现有的信息隐写技术无法照搬照抄到大数据环境中。

大数据(载体)数据体量巨大，而现有信息隐写技术是针对体量不大的载体进行设计实现的。如果用现有信息隐写技术处理如此体量巨大的载体(大数据)，则需要非常长的时间才能处理完，从而使得现有信息隐写技术在大数据中失去了时效性。

大数据(载体)价值密度低，其中数据随时有可能被当成垃圾数据去删除或当成过时数据去更新，而现有信息隐写技术是针对相对稳定的载体进行设计实现的。如果将现有信息隐写技术用于如此易变的载体(大数据)，则在载体中隐写的秘密信息随时有可能被破坏，从而使得现有信息隐写技术在大数据中失去了可靠性。

技术实现要素：

本发明的第一个目的是为了解决上述现有技术的缺陷，提供了一种信息隐写方法，该方法能够在大数据中的位置快速地隐写秘密信息，在实现大容量隐写的同时，充分保证了秘密信息的高隐蔽性。

本发明的第二个目的在于提供一种信息提取方法，该方法使得获授权者能够根据大数据中的秘密信息相关信息对秘密信息进行快速地定位和提取。

本发明的第三个目的在于提供一种信息隐写系统。

本发明的第四个目的在于提供一种信息提取系统。

本发明的第一个目的可以通过采取如下技术方案达到：

信息隐写方法，所述方法包括：

接收需要隐写的秘密信息；

对秘密信息进行处理并插入大数据中的位置，将大数据中的秘密信息相关信息发送给获授权者。

进一步的，所述对秘密信息进行处理并插入大数据中的位置，将大数据中的秘密信息相关信息发送给获授权者，具体包括：

将秘密信息切分成多个秘密信息片；

对每个秘密信息片在秘密信息中的位置进行编号；

将多个秘密信息片插入大数据中的多个位置；

将多个秘密信息片在大数据中的位置和多个秘密信息片在秘密信息中的位置编号发送给获授权者。

进一步的，所述对秘密信息进行处理并插入大数据中的位置，将大数据中的秘密信息相关信息发送给获授权者，具体包括：

将秘密信息复制成多份秘密信息；

将多份秘密信息插入大数据中的多个位置；

将秘密信息的部分信息或属性信息作为校验信息；

将多份秘密信息在大数据中的位置和校验信息发送给获授权者。

进一步的，所述对秘密信息进行处理并插入大数据中的位置，将大数据中的秘密信息相关信息发送给获授权者，具体包括：

将秘密信息复制成多份秘密信息；

将每份秘密信息切分成多个秘密信息片；

根据大数据中已插入的所有秘密信息的位置信息，计算各数据块中的秘密信息在大数据中的分布密度；

为每份秘密信息的多个秘密信息片分配多个所述分布密度最低的位置；

根据每份秘密信息的每个秘密信息片的特征信息及其所需载体的特征信息、该个秘密信息片及其所需载体的变换需求，利用信息隐写技术对每个秘密信息片进行变换和插入；

将秘密信息的部分信息或属性信息作为校验信息；

对于每份秘密信息，将多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息发送给获授权者。

本发明的第二个目的可以通过采取如下技术方案达到：

信息提取方法，所述方法包括：

接收获授权者提供的大数据中的秘密信息相关信息；

根据大数据中的秘密信息相关信息提取秘密信息，并将秘密信息发送给获授权者。

进一步的，所述大数据中的秘密信息相关信息包括多个秘密信息片在大数据中的位置和多个秘密信息片在秘密信息中的位置编号；

所述根据大数据中的秘密信息相关信息提取秘密信息，并将秘密信息发送给获授权者，具体包括：

通过多个秘密信息片在大数据中的位置从大数据中定位并获取多个秘密信息片；

根据多个秘密信息片在秘密信息中的位置编号和多个秘密信息片，合并得到秘密信息；

将秘密信息发送给获授权者。

进一步的，所述大数据中的秘密信息相关信息包括多份秘密信息在大数据中的位置和校验信息；

所述根据大数据中的秘密信息相关信息提取秘密信息，并将秘密信息发送给获授权者，具体包括：

通过多份秘密信息在大数据中的位置从大数据中定位并获取多份秘密信息；

从多份秘密信息中选出与校验信息一致的秘密信息；

当校验通过的秘密信息只有一份时，将该份秘密信息发送给获授权用户；

当校验通过的秘密信息多于一份，且其中每份秘密信息与其他秘密信息均不相同时，选择其中一份秘密信息发送给获授权用户；

当校验通过的秘密信息多于一份，且其中每份秘密信息与其他k份秘密信息相同时，选择最大k值对应的那份秘密信息发送给获授权用户；其中，k≥1，且为自然数。

进一步的，所述大数据中的秘密信息相关信息包括每份秘密信息的多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息；

所述根据大数据中的秘密信息相关信息提取秘密信息，并将秘密信息发送给获授权者，具体包括：

根据每份秘密信息的多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息，利用信息隐写技术对每个秘密信息片进行逆变换；

对于每份秘密信息，将逆变换后的多个秘密信息片进行合并，得到该份秘密信息；

从多份秘密信息中选出与校验信息一致的秘密信息；

当校验通过的秘密信息只有一份时，将该份秘密信息发送给获授权用户；

当校验通过的秘密信息多于一份，且其中每份秘密信息与其他秘密信息均不相同时，选择其中一份秘密信息发送给获授权用户；

本发明的第三个目的可以通过采取如下技术方案达到：

信息隐写系统，所述系统包括：

第一接收模块，用于接收需要隐写的秘密信息；

插入与发送模块，用于对秘密信息进行处理并插入大数据中的位置，将大数据中的秘密信息相关信息发送给获授权者。

进一步的，所述插入与发送模块，具体包括：

第一切分单元，用于将秘密信息切分成多个秘密信息片；

编号单元，用于对每个秘密信息片在秘密信息中的位置进行编号；

第一插入单元，用于将多个秘密信息片插入大数据中的多个位置；

第一发送单元，用于将多个秘密信息片在大数据中的位置和多个秘密信息片在秘密信息中的位置编号发送给获授权者。

进一步的，所述插入与发送模块，具体包括：

第一复制单元，用于将秘密信息复制成多份秘密信息；

第二插入单元，用于将多份秘密信息插入大数据中的多个位置；

第一校验信息获取单元，用于将秘密信息的部分信息或属性信息作为校验信息；

第二发送单元，用于将多份秘密信息在大数据中的位置和校验信息发送给获授权者。

进一步的，所述插入与发送模块，具体包括：

第二复制单元，用于将秘密信息复制成多份秘密信息；

第二切分单元，用于将每份秘密信息切分成多个秘密信息片；

计算单元，用于根据大数据中已插入的所有秘密信息的位置信息，计算各数据块中的秘密信息在大数据中的分布密度；

分配单元，用于为每份秘密信息的多个秘密信息片分配多个所述分布密度最低的位置；

第三插入单元，用于根据每份秘密信息的每个秘密信息片的特征信息及其所需载体的特征信息、该个秘密信息片及其所需载体的变换需求，利用信息隐写技术对每个秘密信息片进行变换和插入；

第二校验信息获取单元，将秘密信息的部分信息或属性信息作为校验信息；

第三发送单元，用于对于每份秘密信息，将多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息发送给获授权者。

本发明的第四个目的可以通过采取如下技术方案达到：

信息提取系统，所述系统包括：

第二接收模块，用于接收获授权者提供的大数据中的秘密信息相关信息；

提取与发送模块，用于根据大数据中的秘密信息相关信息提取秘密信息，并将秘密信息发送给获授权者。

进一步的，所述大数据中的秘密信息相关信息包括多个秘密信息片在大数据中的位置和多个秘密信息片在秘密信息中的位置编号；

所述提取与发送模块，具体包括：

第一定位单元，用于通过多个秘密信息片在大数据中的位置从大数据中定位并获取多个秘密信息片；

第一合并单元，用于根据多个秘密信息片在秘密信息中的位置编号及多个秘密信息片，合并得到秘密信息；

第四发送单元，用于将秘密信息发送给获授权者。

进一步的，所述大数据中的秘密信息相关信息包括多份秘密信息在大数据中的位置和校验信息；

所述提取与发送模块，具体包括：

第二定位单元，用于通过多份秘密信息在大数据中的位置从大数据中定位并获取多份秘密信息；

第一校验单元，用于从多份秘密信息中选出与校验信息一致的秘密信息；

第五发送单元，用于当校验通过的秘密信息只有一份时，将该份秘密信息发送给获授权用户；

第六发送单元，用于当校验通过的秘密信息多于一份，且其中每份秘密信息与其他秘密信息均不相同时，选择其中一份秘密信息发送给获授权用户；

第七发送单元，用于当校验通过的秘密信息多于一份，且其中每份秘密信息与其他k份秘密信息相同时，选择最大k值对应的那份秘密信息发送给获授权用户；其中，k≥1，且为自然数。

进一步的，所述大数据中的秘密信息相关信息包括每份秘密信息的多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息；

所述提取与发送模块，具体包括：

逆变换单元，用于根据每份秘密信息的多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息，利用信息隐写技术对每个秘密信息片进行逆变换；

第二合并单元，用于对于每份秘密信息，将逆变换后的多个秘密信息片进行合并，得到该份秘密信息；

第二校验单元，用于从多份秘密信息中选出与校验信息一致的秘密信息；

第八发送单元，用于当校验通过的秘密信息只有一份时，将该份秘密信息发送给获授权用户；

第九发送单元，用于当校验通过的秘密信息多于一份，且其中每份秘密信息与其他秘密信息均不相同时，选择其中一份秘密信息发送给获授权用户

第十发送单元，用于当校验通过的秘密信息多于一份，且其中每份秘密信息与其他k份秘密信息相同时，选择最大k值对应的那份秘密信息发送给获授权用户；其中，k≥1，且为自然数。

本发明相对于现有技术具有如下的有益效果：

1、本发明针对网络公开大数据，通过对秘密信息进行处理并插入大数据中的位置，以保护大数据中的信息隐私，既可以使所有用户都能公开访问大数据，又可以使各用户只能访问到大数据中该用户获得授权的信息，使得大数据既有开放性又有安全性，由于插入了大数据，使得信息隐写的隐写容量在大数据载体中得到了极大的扩展，不再受限于传统的载体大小，极大地提高了信息隐写的容量。

2、本发明可以通过将秘密信息切分成很多秘密信息片分散到大数据中，在实现大容量隐写的同时，充分保证了秘密信息的高隐蔽性，将秘密信息片的插入位置作为处理的对象，能够在大数据中的位置快速地隐写秘密信息，同时在信息提取阶段时，获授权者也能够根据秘密信息片在大数据中的位置对秘密信息进行快速地定位和提取，以实现秘密信息的高时效性。

3、本发明可以通过将秘密信息复制成多份，来冗余存储，不但可以对抗大数据载体的变化，而且甚至比基于传统载体的隐写更为可靠，因为大数据中有更大的存储空间来对秘密信息进行更多的冗余备份，而多个冗余备份被同时损坏的概率相对更小，在信息提取阶段时，可以通过校验能够排除已损坏的秘密信息，使得“通过了校验”的秘密信息的可靠性高；当有多个秘密信息都通过了校验，则多个秘密信息之间的相互印证，可以使得所得到的秘密信息的可靠性进一步地极大提高。

4、本发明可以在信息隐写阶段时利切分方式对复制的每份秘密信息进行切片，采用现有信息隐写技术又进一步地对秘密信息片进行了变换，在信息提取阶段时，校验和互相印证逆变换并合并后的每份秘密信息，可以使得所得到的秘密信息的可靠性进一步地极大提高，同时通过合适的“插入”调度使得秘密信息在大数据中的分布尽量远，并使得秘密信息在大数据中的分布尽量不要出现扎堆现象，那么大批量秘密信息在大数据中的分布仍然是极其稀疏的，可以确保秘密信息的高隐蔽性和高安全性。

5、本发明开创了不同于传统信息隐写和传输方式的新方式，即面向网络公开大数据的信息隐写和传输方式，从“拥有秘密信息的用户将秘密信息直接通过网络传给获授权的用户”转变为“拥有秘密信息的用户将秘密信息通过互联网或云客户端传到大数据，然后再由获授权的用户通过互联网或云客户端从大数据中提取秘密信息”，这种基于大数据的信息隐写和传输的新方式，可以使得秘密信息在大数据中被更多的获授权用户在更长时间内可访问，而且不影响大众对于网络公开大数据的访问，极大地方便了用户对秘密信息的隐写和传输。

附图说明

图1为本发明实施例1的信息隐写方法流程图。

图2为本发明实施例1的信息隐写方法中对秘密信息进行处理、插入以及发送的流程图。

图3为本发明实施例1的信息提取方法流程图。

图4为本发明实施例1的信息提取方法中对秘密信息进行提取、发送的流程图。

图5为本发明实施例2的信息隐写方法中对秘密信息进行处理、插入以及发送的流程图。

图6为本发明实施例2的信息提取方法中对秘密信息进行提取、发送的流程图。

图7为本发明实施例3的信息隐写方法中对秘密信息进行处理、插入以及发送的流程图。

图8为本发明实施例3的信息提取方法中对秘密信息进行提取、发送的流程图。

图9为本发明实施例4的信息隐写系统结构框图。

图10为本发明实施例4的信息隐写系统中插入与发送模块结构框图。

图11为本发明实施例5的信息隐写系统中插入与发送模块结构框图。

图12为本发明实施例6的信息隐写系统中插入与发送模块结构框图。

图13为本发明实施例7的信息提取系统结构框图。

图14为本发明实施例7的信息提取系统中提取与发送模块结构框图。

图15为本发明实施例8的信息提取系统中提取与发送模块结构框图。

图16为本发明实施例9的信息提取系统中提取与发送模块结构框图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

实施例1：

如图1所示，本实施例提供了一种信息隐写方法，该方法包括以下步骤：

s101、接收需要隐写的秘密信息。

s102、对秘密信息进行处理并插入大数据中的位置，将大数据中的秘密信息相关信息发送给获授权者。

本实施例的信息隐写方法与现有技术的对比，现有技术将秘密信息隐写在不大的数据中，而本实施例将秘密信息隐写在大数据中。

现有技术在不大的数据里隐写秘密信息如同把金银财宝藏在家里，只藏得了少量的金银财宝，总是能被精明的小偷找到。

本实施例在大数据里隐写秘密信息如同“石沉大海”，可以沉大量的“石头”(秘密信息)，破解的难度如同“大海捞针”。

以一个示例进行说明，地(“大数据”)下秦始皇陵中成千上万的兵马俑(“秘密信息”)到1974年才被发现，足足“隐写”了2千多年。反之，如果我们把这些兵马俑藏到仓库(“不大的数据”)里，或把兵马俑放在布满机关的房间(“信息加密”)里，这些兵马俑一定早就被发现了！

以另一个示例进行说明，到目前位置宇宙(“大数据”)中是否存在外星人(“秘密信息”)无人知晓，更不会知道外星人到底存在哪里；反之，如果将外星人藏在家(“不大的数据”)里，或将外星人锁在密码箱(“信息加密”)里，外星人则很容易被找出来。

通过上述情形及示例的比较，可以显而易见地看到相对于现有的信息隐写技术及信息加密技术而言，在基于大数据的信息隐写技术的容量更大，更牢不可破。

在本实施例中，对秘密信息进行处理并插入大数据中的位置是指对秘密信息进行切分，得到多个秘密信息片，并对多个秘密信息片的位置进行编号，然后将多个秘密信息片插入大数据中的多个位置；大数据中的秘密信息相关信息包括多个秘密信息片在秘密信息中的位置编号和多个秘密信息片在大数据中的位置。

如图2所示，步骤s102具体包括以下步骤：

s1021、将秘密信息切分成多个秘密信息片。

s1022、对每个秘密信息片在秘密信息中的位置进行编号，并将每个秘密信息片在秘密信息中的位置编号作为第一编号。

s1023、将多个秘密信息片插入大数据中的多个位置，并将多个秘密信息片在大数据中的位置作为多个第一位置。

由于大数据的体量巨大，如同汪洋大海，非授权者由于不知道所述位置信息，从整体大数据中提取秘密信息，如同“大海捞针”，只能永远“望洋兴叹”；同时通过将秘密信息切分成很多秘密信息片分散到大数据中，如同“将石头碎成砂子撒到大海中”，非授权者就更无从找起。

大数据虽大，但需要隐写的秘密信息相对不大，只需要不大的“立足之地”、“容身之所”，因此将多个秘密信息片的插入位置作为处理的对象，而没有将大数据载体本身作为处理的对象，能够在大数据中的位置快速地隐写秘密信息。

即使秘密信息非常大，但在巨大体量的大数据载体中也显得非常渺小，而且通过将秘密信息切分成更小的秘密信息片分散到大数据中，使得各个秘密信息片在大数据载体中更微不足道，从而在实现大容量隐写的同时，充分保证了秘密信息的高隐蔽性。

s1024、将多个第一位置和多个第一编号发送给获授权者。

如图3所示，本实施例还提供了一种信息提取方法，该方法与上述信息隐写方法相对应，包括以下步骤：

s301、接收获授权者提供的大数据中的秘密信息相关信息。

s302、根据大数据中的秘密信息相关信息提取秘密信息，并将秘密信息发送给获授权者。

由于本实施例的信息提取方法与上述信息隐写方法相对应，因此大数据中的秘密信息相关信息包括多个秘密信息片在大数据中的位置和多个秘密信息片在秘密信息中的位置编号，即包括多个第一位置和多个第一编号。

如图4所示，步骤s302具体包括以下步骤：

s3021、通过多个第一位置从大数据中定位并获取多个秘密信息片。

s3022、根据多个第一编号及多个秘密信息片，合并得到秘密信息。

s3023、将秘密信息发送给获授权者。

可见，获授权者根据多个第一位置和多个第一编号，可以对秘密信息进行快速地定位和提取。

实施例2：

本实施例与实施例1的区别之处在于步骤s102，对秘密信息进行处理并插入大数据中的位置是指将秘密信息复制成多份秘密信息，并将多份秘密信息插入大数据中的多个位置；大数据中的秘密信息相关信息包括多份秘密信息在大数据中的位置和校验信息。

如图5所示，步骤s102具体包括以下步骤：

s1021、将秘密信息复制成多份秘密信息。

s1022、将多份秘密信息插入大数据中的多个位置，并将多份秘密信息在大数据中的位置作为多个第一位置。

虽然大数据价值密度低，导致其易变，但在信息隐写时，通过将秘密信息复制成多份，来冗余存储，不但可以对抗大数据载体的变化，而且甚至比基于传统载体的隐写更为可靠，因为大数据中有更大的存储空间来对秘密信息进行更多的冗余备份，而多个冗余备份被同时损坏的概率相对更小。

s1023、将秘密信息的部分信息或属性信息作为校验信息。

s1024、将多个第一位置和校验信息发送给获授权者。

相应地，在本实施例的信息提取方法中，大数据中的秘密信息相关信息包括多份秘密信息在大数据中的位置和校验信息，即包括多个第一位置和校验信息。

如图6所示，步骤s302具体包括以下步骤：

s3021、通过多个第一位置从大数据中定位并获取多份秘密信息。

s3022、从多份秘密信息中选出与校验信息一致的秘密信息，若校验通过的秘密信息只有一份，进入步骤s3023；若校验通过的秘密信息多于一份，且其中每份秘密信息与其他秘密信息均不相同，进入步骤s3024；若校验通过的秘密信息多于一份，且其中每份秘密信息与其他k份秘密信息相同，进入步骤s3025；其中，k≥1，且为自然数。

s3023、将该份秘密信息发送给获授权用户。

s3024、选择其中一份秘密信息发送给获授权用户；

以校验通过的秘密信息有三份为例，第一份、第二份、第三份秘密信息与其他两份秘密信息均不相同，选择其中一份秘密信息发送给获授权用户。

s3025、选择最大k值对应的那份秘密信息发送给获授权用户。

以校验通过的秘密信息有五份为例，第一份、第二份秘密信息与其他两份秘密信息相同，k值为2，第三份、第四份、第五份秘密信息与其他三份秘密信息相同，k值为3，可见最大k值为3，则取第三份、第四份、第五份中任一份发送给获授权用户。

以校验通过的秘密信息有三份为例，第一份、第二份、第三份秘密信息与其他两份秘密信息相同，k值为2，由于没有相比较的k值，可见最大的k值为2，则取第一份、第二份、第三份中的任一份发送给获授权用户。

本实施例通过校验能够排除已损坏的秘密信息，使得“通过了校验”的秘密信息的可靠性高；当有多个秘密信息都通过了校验，则多个秘密信息之间的相互印证可以使得所得到的秘密信息的可靠性进一步地极大提高。

实施例3：

本实施例与实施例1、2的区别之处在于步骤s102，如图7所示，步骤s102具体包括以下步骤：

s1021、将秘密信息复制成多份秘密信息，复制方式同实施例2。

s1022、将每份秘密信息切分成多个秘密信息片，切分方式同实施例1。

虽然大数据载体的体量巨大、易变，但应用了实施例1的切分之后，每个秘密信息片插入位置之处的数据块都是不大的数据载体，而不大的数据载体属于现有的信息隐写技术的胜任范畴，从而使得现有的信息隐写技术能够用于“秘密信息片”。

s1023、根据大数据中已插入的所有秘密信息的位置信息，计算各数据块中的秘密信息在大数据中的分布密度。

s1024、为每份秘密信息的多个秘密信息片分配多个所述分布密度最低的位置。

对于每份秘密信息，由于切分的秘密信息片至少为两个，因此分布密度最低的位置也至少为两个，在其中一份秘密信息的多个秘密信息片分配多个所述分布密度最低的位置后，再重新执行步骤s1023，为下一份的多个秘密信息片分配多个所述分布密度最低的位置，直到每份秘密信息的多个秘密信息片分配多个所述分布密度最低的位置。

虽然大数据是开放的，会有海量用户的大批量秘密信息需要插入到大数据中，但因为大批量秘密信息相对于巨量的大数据而言，仍然是非常微不足道的，只要通过合适的“插入”调度使得相关的秘密信息在大数据中的分布尽量远，同时使得秘密信息在大数据中的分布尽量不要出现扎堆现象，那么大批量秘密信息在大数据中的分布仍然是极其稀疏的，可以确保秘密信息的高隐蔽性和高安全性。

s1025、根据每份秘密信息的每个秘密信息片的特征信息及其所需载体(该个秘密信息所插入的数据块)的特征信息、该个秘密信息片及其所需载体的变换需求，利用信息隐写技术对每个秘密信息片进行变换和插入；其中，信息隐写技术可以采用现有信息隐写技术。

s1026、将秘密信息的部分信息或属性信息作为校验信息。

s1027、对于每份秘密信息，将多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息发送给获授权者。

相应地，在本实施例的信息提取方法中，大数据中的秘密信息相关信息包括每份秘密信息的多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息。

如图8所示，步骤s302具体包括以下步骤：

s3021、根据每份秘密信息的多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息，利用信息隐写技术对每个秘密信息片进行逆变换；其中，信息隐写技术可以采用现有信息隐写技术。

s3022、对于每份秘密信息，将逆变换后的多个秘密信息片进行合并，得到该份秘密信息，该合并方式同实施例1。

s3023、从多份秘密信息中选出与校验信息一致的秘密信息，若校验通过的秘密信息只有一份，进入步骤s3024；若校验通过的秘密信息多于一份，且其中每份秘密信息与其他秘密信息均不相同，进入步骤s3025；若校验通过的秘密信息多于一份，且其中每份秘密信息与其他k份秘密信息相同，进入步骤s3026；其中，k≥1，且为自然数。

虽然在信息隐写阶段时利用实施例1的切分方式对“实施例2中的每份秘密信息”进行了切片，现有信息隐写技术又进一步地对秘密信息片进行了变换，但在信息提取阶段时校验和互相印证的是逆变换并合并后的每份秘密信息，所以完全符合实施例2的处理机制。

s3024、将该份秘密信息发送给获授权用户。

s3025、选择其中一份秘密信息发送给获授权用户；

s3026、选择最大k值对应的那份秘密信息发送给获授权用户；其中，k≥1，且为自然数。

步骤s3023～s3026的校验方式同实施例2。

针对本实施例的具体应用实例如下：

构建大数据云计算环境的两种最常用框架是hadoop和spark，在实验过程中拟选用spark，因为spark是ucberkeleyamplab所开源的类hadoopmapreduce的通用并行框架，spark，拥有hadoopmapreduce所具有的优点；但不同于mapreduce的是job中间输出结果可以保存在内存中，从而中间输入输出不再需要读写hdfs，因此spark能更好地适用于数据挖掘与机器学习等需要迭代的mapreduce的算法。spark是一种与hadoop相似的开源集群计算环境，但是两者之间还存在一些不同之处，这些有用的不同之处使spark在某些工作负载方面表现得更加优越，换句话说，spark启用了内存分布数据集，除了能够提供交互式查询外，它还可以优化迭代工作负载。

在实际应用中，则根据实际的大数据云计算环境中已部署的框架进行选择。例如，如果实际环境中已部署了spark，则利用spark进行处理；如果实际环境中已部署了hadoop，则利用hadoop进行处理。下面以在spark框架下与hdfs相结合的处理方式进行说明(在hadoop框架下的处理方式与在spark下的处理方式的原理相同，不再赘述)，主要步骤如下：

(一)信息隐写阶段：

1)大数据环境中spark管理的master节点将接受到的海量用户的大批量秘密信息的隐写请求调度到不同的第一worker节点进行处理。

2)大数据环境中spark管理的各第一worker节点调用hdfs(hadoop分布式文件系统)对隐写请求任务中的秘密信息根据实施例2的复制方式进行复制，然后再根据实施例1的切分方式进行切分。

3)大数据环境中spark管理的各第一worker节点将秘密信息片的特征信息及其所需载体的特征信息(如秘密信息片的大小及其所需载体的大小)发送给spark管理的master节点，并请求spark管理的master节点分配插入位置。

4)大数据环境中spark管理的master节点根据各第一worker节点发送来的秘密信息片的特征信息、所需载体的特征信息，以及大数据中已插入秘密信息的分布密度，计算出每个秘密信息片的最合适的插入位置(这里涉及到的“插入”调度算法可以基于hdfs(开源)数据块切片及冗余算法进行改进来实现)，返回给各第一worker节点。

5)大数据环境中spark管理的各第一worker节点根据spark管理的master节点分配的位置，将每个秘密信息片及其所需载体的变换需求发送到各分配的位置所在各第二worker节点。

6)大数据环境中各第二worker节点根据秘密信息片的特征信息及其所需载体的特征信息、该秘密信息片及其所需载体所需的变换需求，调用“现有信息隐写技术”对秘密信息片进行变换和插入，完成操作后反馈“成功插入”信息给各第一worker节点。

7)大数据环境中各第一worker节点将每个秘密信息片的插入位置信息、所需载体的特征信息及生成的校验信息发送给获授权用户。

(二)信息提取阶段：

1)大数据环境中spark管理的master节点将接受到的大批量秘密信息的提取请求调度到不同的第三worker节点进行处理。

2)大数据环境中spark管理的各第三worker节点根据用户提供的获授权信息(例如：秘密信息片的位置信息、所需载体的特征信息、校验信息)获取秘密信息片在大数据中的插入位置信息及秘密信息片所需载体的特征信息。

3)大数据环境中spark管理的各第三worker节点将各秘密信息片的提取请求及其特征信息发送给各秘密信息片所在位置的各第四worker节点；

4)大数据环境中各第四worker节点调用“现有信息隐写技术”对秘密信息片进行逆变换后将秘密信息片发送给各第三worker节点。

5)大数据环境中各第三worker节点调用hdfs(hadoop分布式文件系统)对各秘密信息片根据实施例1的合并方式进行合并，然后再根据实施例2的校验方式对合并后的多份秘密信息进行校验和相互印证。

6)大数据环境中各第三worker节点将通过了校验和相互印证的各秘密信息发送给获授权者。

其中，“第一worker节点、第二worker节点、第三worker节点、第四worker节点”中的“第一、第二、第三、第四”，没有特殊含义，只是为了区分不同类worker节点的需要。

实施例4：

如图9所示，本实施例提供了一种信息隐写系统，该系统包括第一接收模块901，以及插入与发送模块902。

所述第一接收模块901，用于接收获授权者提供的大数据中的秘密信息相关信息。

所述插入与发送模块902，用于根据大数据中的秘密信息相关信息提取秘密信息，并将秘密信息发送给获授权者。

如图10所示，本实施例的插入与发送模块902具体包括：

第一切分单元9021，用于将秘密信息切分成多个秘密信息片。

编号单元9022，用于对每个秘密信息片在秘密信息中的位置进行编号，并将每个秘密信息片在秘密信息中的位置编号作为第一编号。

第一插入单元9023，用于将多个秘密信息片插入大数据中的多个位置，并将多个秘密信息片在大数据中的位置作为多个第一位置；

第一发送单元9024，用于将多个第一位置和多个第一编号发送给获授权者。

实施例5：

本实施例与实施例4的区别之处在于插入与发送模块902，如图11所示，插入与发送模块902具体包括：

第一复制单元9021，用于将秘密信息复制成多份秘密信息。

第二插入单元9022，用于将多份秘密信息插入大数据中的多个位置，并将多份秘密信息在大数据中的位置作为多个第一位置。

第一校验信息获取单元9023，用于将秘密信息的部分信息或属性信息作为校验信息。

第二发送单元9024，用于将多份秘密信息在大数据中的位置和校验信息发送给获授权者。

实施例6：

本实施例与实施例4、5的区别之处在于插入与发送模块902，如图12所示，插入与发送模块902具体包括：

第二复制单元9021，用于将秘密信息复制成多份秘密信息。

第二切分单元9022，用于将每份秘密信息切分成多个秘密信息片。

计算单元9023，用于根据大数据中已插入的所有秘密信息的位置信息，计算各数据块中的秘密信息在大数据中的分布密度。

分配单元9024，用于为每份秘密信息的多个秘密信息片分配多个所述分布密度最低的位置。

第三插入单元9025，用于根据每份秘密信息的每个秘密信息片的特征信息及其所需载体的特征信息、该个秘密信息片及其所需载体的变换需求，利用信息隐写技术对每个秘密信息片进行变换和插入。

第二校验信息获取单元9026，将秘密信息的部分信息或属性信息作为校验信息。

第三发送单元9027，用于对于每份秘密信息，将多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息发送给获授权者。

实施例7：

如图13所示，本实施例提供了一种信息提取系统，该系统与实施例4的信息隐写系统相对应，其包括第二接收模块1101，以及提取与发送模块1102。

所述第二接收模块1101，用于接收获授权者提供的大数据中的秘密信息相关信息；

所述提取与发送模块1102，用于根据大数据中的秘密信息相关信息提取秘密信息，并将秘密信息发送给获授权者。

由于本实施例的信息提取系统与实施例4的信息隐写系统相对应，因此大数据中的秘密信息相关信息包括多个秘密信息片在大数据中的位置和多个秘密信息片在秘密信息中的位置编号，即包括多个第一位置和多个第一编号。

如图14所示，本实施例的提取与发送模块1102具体包括：

第一定位单元11021，用于通过多个第一位置从大数据中定位并获取多个秘密信息片；

第一合并单元11022，用于根据多个第一编号及多个秘密信息片，合并得到秘密信息；

第四发送单元11023，用于将秘密信息发送给获授权者。

实施例8：

本实施例与实施例7的区别之处在于，本实施例的信息提取系统与实施例5的信息隐写系统相对应，大数据中的秘密信息相关信息包括多份秘密信息在大数据中的位置和校验信息，即包括多个第一位置和校验信息。

如图15所示，本实施例的提取与发送模块1102具体包括：

第二定位单元11021，用于通过多份秘密信息在大数据中的位置从大数据中定位并获取多份秘密信息。

第一校验单元11022，用于从多份秘密信息中选出与校验信息一致的秘密信息。

第五发送单元11023，用于当校验通过的秘密信息只有一份时，将该份秘密信息发送给获授权用户。

第六发送单元11024，用于当校验通过的秘密信息多于一份，且其中每份秘密信息与其他秘密信息均不相同时，选择其中一份秘密信息发送给获授权用户。

第七发送单元11025，用于当校验通过的秘密信息多于一份，且其中每份秘密信息与其他k份秘密信息相同时，选择最大k值对应的那份秘密信息发送给获授权用户；其中，k≥1，且为自然数。

实施例9：

本实施例与实施例7、8的区别之处在于，本实施例的信息提取系统与实施例6的信息隐写系统相对应，大数据中的秘密信息相关信息包括每份秘密信息的多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息。

如图16所示，本实施例的提取与发送模块1102具体包括：

逆变换单元11021，用于根据每份秘密信息的多个秘密信息片的插入位置信息、所需载体的特征信息以及校验信息，利用信息隐写技术对每个秘密信息片进行逆变换；

第二合并单元11022，用于对于每份秘密信息，将逆变换后的多个秘密信息片进行合并，得到该份秘密信息；

第二校验单元11023，用于从多份秘密信息中选出与校验信息一致的秘密信息；

第八发送单元11024，用于当校验通过的秘密信息只有一份时，将该份秘密信息发送给获授权用户；

第九发送单元11025，用于当校验通过的秘密信息多于一份，且其中每份秘密信息与其他秘密信息均不相同时，选择其中一份秘密信息发送给获授权用户

第十发送单元11026，用于当校验通过的秘密信息多于一份，且其中每份秘密信息与其他k份秘密信息相同时，选择最大k值对应的那份秘密信息发送给获授权用户；其中，k≥1，且为自然数。

本领域普通技术人员可以理解实现上述各实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，相应的程序可以存储于一计算机可读取存储介质中，所述的存储介质，如rom/ram、磁盘或光盘等。

在此需要说明的是，上述各实施例提供的系统仅以上述各功能模块的划分进行举例说明，在实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。

可以理解，上述各实施例的系统所使用的术语“第一”、“第二”等可用于描述各种模块，但这些模块不受这些术语限制。这些术语仅用于将第一个模块与另一个模块区分。举例来说，在不脱离本发明的范围的情况下，可以将第一接收模块称为第二接收模块，且类似地，可将第二接收模块称为第一接收模块，第一接收模块和第二接收模块两者都是判定模块，但其不是同一接收模块。

以上所述，仅为本发明专利优选的实施例，但本发明专利的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方案及其发明构思加以等同替换或改变，都属于本发明专利的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱定局
技术所有人：大国创新智能科技(东莞)有限公司
我是此专利的发明人

上一篇：一种基于私有链的红酒防伪溯源系统的制作方法
上一篇：基于网络编码的多播移动设备视频会议系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。