一种基于深度对抗网络的敏感文件隐写和溯源方法与流程

文档序号：23729186发布日期：2021-01-26 19:23阅读：139来源：国知局

[0001]
本发明涉及信息识别技术领域，尤其是，本发明涉及一种基于深度对抗网络的敏感文件隐写和溯源方法。

背景技术：

[0002]
随着互联网信息技术的迅速发展，信息安全问题日益严重，已经成为当前社会的热点，并引起学术界的重视。隐写术是确保信息安全传输、实现隐蔽通信的重要方法，是信息安全领域的重要分支。隐写术主要是通过隐藏通信行为实现秘密信息的安全传输，它将秘密信息嵌入到数字媒体文件，如音视频、图像和文档，并且不会引起原始载体的视觉和听觉上的感知失真，使秘密信息在不引起第三方注意的情况下完成传递。
[0003]
文件隐写是信息隐藏领域中的重要组成部分，已经有很多隐写技术用于隐藏政府部门、企事业和个人的隐私信息。如利用字形字库、点阵、同义词替换等隐写方法隐藏信息到敏感文档。例如中国专利发明专利cn111898142a公开了一种基于图片的密码隐藏与查询方法。所述密码隐藏方法包括：步骤1，图片读入。读入用于保存密码的图片。步骤2，图片预处理。检查图片标志信息。如果是第一次隐藏密码，对图片进行初始化处理。把初始化标志信息嵌入到图片中。步骤3，密码隐藏。将账号、密码中的每个字符的ascii码依次转换为二进制，根据二进制比特位调整图像像素蓝色分量的末位值，从而把账号、密码隐藏到图片中。上述发明将密码隐藏在一张普通的图片中，需要时解析出密码，实现了基于图像的密码隐藏和查询方法。人眼无法分辨，一般的图像处理软件也发现不了，提高用户个人密码的安全性。
[0004]
但是上述隐写方法依然存在以下缺点：1）、对一般的图片或者文档有较好的支持，但是对私密图片的隐写效果不佳，隐秘性差；2）、无法针对不同类型的文档进行特定的处理；3）、无法兼容集成到传统数据防泄漏（data leakage prevention，dlp）系统中。
[0005]
因此为了解决上述问题，设计一种合理的基于深度对抗网络的敏感文件隐写和溯源方法对我们来说是很有必要的。

技术实现要素：

[0006]
本发明的目的在于提供一种可以针对不同类型的文档进行特定的隐写处理，对私密图片的隐写的隐秘性强，可以集成到传统dlp系统中，能够有效扩展dlp系统防控范围，降低文档、图片等敏感文件外泄风险，能够及时、准确溯源和定位外泄途径，降低企业和政府部门损失，鲁棒性高，具有很好的抗压缩、抗斜拍、抗阴影、抗污损能力的基于深度对抗网络的敏感文件隐写和溯源方法。
[0007]
为达到上述目的，本发明采用如下技术方案得以实现的：一种基于深度对抗网络的敏感文件隐写方法，包括以下步骤：s11：hook打印任务；s12：判断打印任务中的文档类型是否为私密图片类型；若是，则执行步骤s13；反之则
执行步骤s14；s13：使用深度对抗网络，将溯源信息隐藏到私密图片中，执行步骤s15；s14：使用图像二值化方法，将溯源信息隐藏到敏感文件中，执行步骤s15；s15：将隐写后的敏感文件下发至打印机，打印机进行打印。
[0008]
作为本发明的优选，执行步骤s11时，打印任务的打印文件包括图片和文档。
[0009]
作为本发明的优选，执行步骤s12时，利用智能分类器，对打印任务中的文档类型进行分类。
[0010]
作为本发明的优选，执行步骤s13之前，训练深度对抗网络模型。
[0011]
作为本发明的优选，执行步骤s13时，将打印任务中的文件数据输入至训练好的深度对抗网络模型中，将溯源信息隐藏到敏感图片文档中进行输出。
[0012]
作为本发明的优选，执行步骤s14时，根据打印文件属性，使用图像二值化方法，将溯源信息隐藏到打印文件中，打印文件包括文档和图片。
[0013]
本发明还提供一种基于深度对抗网络的敏感文件隐写方法的文件的溯源方法，包括以下步骤：s21：获取打印文件；s22：判断打印文件中的文档类型是否为私密图片类型；若是，则执行步骤s23；反之则执行步骤s24；s23：使用深度对抗网络，溯源私密图片隐写信息，执行步骤s25；s24：使用图像二值化方法，溯源打印文件隐写信息，执行步骤s25；s25：对溯源到的隐写信息校验，判断校验是否成功，若是，则溯源成功；反之则提示文档没有敏感信息或者溯源失败。
[0014]
作为本发明的优选，执行步骤s21时，打印文件包括复印件、扫描件和照片。
[0015]
作为本发明的优选，执行步骤s22之前，对文档图片进行预处理，先利用透视变换将文档图片校正，然后定位文档图片敏感区域，去除干扰区域。
[0016]
作为本发明的优选，执行步骤s22时，利用智能分类器，对打印文件进行分类。
[0017]
作为本发明的优选，执行步骤s23之前，训练深度对抗网络模型。
[0018]
作为本发明的优选，执行步骤s23时，将打印文件数据输入至训练好的深度对抗网络模型中，获取私密图片类型的隐写信息并进行输出。
[0019]
作为本发明的优选，执行步骤s25时，对溯源信息依次进行bch和crc校验，若均校验通过，则溯源出隐写信息；反之则未检测到隐写信息或者溯源失败。
[0020]
本发明一种基于深度对抗网络的敏感文件隐写和溯源方法有益效果在于：可以针对不同类型的文档进行特定的隐写处理，对私密图片的隐写的隐秘性强，可以集成到传统dlp系统中，能够有效扩展dlp系统防控范围，降低文档、图片等敏感文件外泄风险，能够及时、准确溯源和定位外泄途径，降低企业和政府部门损失，鲁棒性高，具有很好的抗压缩、抗斜拍、抗阴影、抗污损能力。
附图说明
[0021]
图1为本发明一种基于深度对抗网络的敏感文件隐写方法的流程示意图；图2为本发明一种基于深度对抗网络的敏感文件溯源方法的流程示意图。
具体实施方式
[0022]
以下是本发明的具体实施例，对本发明的技术方案作进一步的描述，但本发明并不限于这些实施例。
[0023]
现在将参照附图来详细描述本发明的各种示例性实施例。应注意到：除非另外具体说明，否则在这些实施例中阐述的模块和结构的相对布置不限制本发明的范围。
[0024]
以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本发明及其应用或使用的任何限制。
[0025]
对于相关领域普通技术人员已知的技术、方法及系统可能不作详细讨论，但在适当情况下，技术、方法及系统应当被视为授权说明书的一部分。
[0026]
实施例一：如图1所示，仅仅为本发明的其中一个的实施例，一种基于深度对抗网络的敏感文件隐写方法，包括以下步骤：s11：hook打印任务；需要注意的是，整个方法的步骤都是直接集成到传统dlp系统中，也就是dlp系统实时hook电脑打印请求，在这里，打印请求的打印文件包括图片和文档，可以支持灰度、彩色办公文档、图片，应用场景多。
[0027]
s12：判断打印任务中的文档类型是否为私密图片类型；若是，则执行步骤s13；反之则执行步骤s14；dlp系统实时hook电脑打印请求之后，利用智能分类器，对打印任务中的文档类型进行自动分类，一般分为私密图片、办公文档、图片以及其他，由于办公文档、图片和其他打印物品的针对隐写方式相同，那么仅仅判断打印任务中的文档类型为私密图片还是其他文件。
[0028]
需要注意的是，智能分类器采用生成式对抗网络（generative adversarial networks，gan）模型判断打印任务中的文档类型，例如文件内容为办公文档或办公图片，分类器认为是文档类型；若文件内容为自然图片或者私密生活照等不规则的图片，则分类器认为是私密图片类型。
[0029]
当然，图片类型智能分类器模型需要提前训练。
[0030]
s13：使用深度对抗网络，将溯源信息隐藏到私密图片中，执行步骤s15；一旦系统判断打印任务中的文档类型是否为私密图片，那么将打印任务中的文件数据输入至训练好的深度对抗网络模型中，将溯源信息隐藏到敏感图片文档中进行输出。
[0031]
同样的，执行步骤s13之前，提前训练深度对抗网络模型。
[0032]
s14：使用图像二值化方法，将溯源信息隐藏到敏感文件中，执行步骤s15；根据打印文件属性，使用图像二值化方法，将溯源信息隐藏到打印文件中，打印文件包括文档和图片。
[0033]
以上使用深度对抗网络模型来隐写、溯源敏感文件，结合图像二值化方法，可以针对不同类型的文档进行特定的隐写处理，隐秘性强，鲁棒性高。
[0034]
s15：将隐写后的敏感文件下发至打印机，打印机进行打印。打印文档通过扫描、拍照或复印外泄传播，防止其他途径外泄，私密性更好。
[0035]
整个方法全部集成到dlp系统中，全程系统自动处理，用户体验感好。
[0036]
本发明一种基于深度对抗网络的敏感文件隐写方法可以针对不同类型的文档进行特定的隐写处理，对私密图片的隐写的隐秘性强，可以集成到传统dlp系统中，能够有效
扩展dlp系统防控范围，降低文档、图片等敏感文件外泄风险，降低企业和政府部门损失。
[0037]
实施例二：如图2所示，本发明还提供一种基于深度对抗网络的敏感文件隐写方法的文件的溯源方法，包括以下步骤：s21：获取打印文件；整个溯源方法的步骤也都是直接集成到传统dlp系统中，系统获取打印文件进溯源，打印文件包括复印件、扫描件和照片。当然，也包括图片、彩印、喷绘等等。
[0038]
在这里需要注意的是，真实场景中，外泄文档可能受到污损，文档拍摄环境随机，并且外泄图片可能通过三方软件外发出去，因此图片往往是非正对拍照，图片本身有阴影，并且被压缩，所以dlp系统获取文档一般为污损文档，需要对污损文档进行溯源。
[0039]
所以在对污损文档进行溯源的步骤之前，对文档图片进行预处理，先利用透视变换将文档图片校正，也就是将不规则正文图形拉伸成规则图形，然后定位文档图片敏感区域，去除干扰区域，自适应定位敏感区域。这样的好处是可以针对污损文件进行溯源，鲁棒性高，具有很好的抗压缩、抗斜拍、抗阴影、抗污损能力。
[0040]
s22：判断打印文件中的文档类型是否为私密图片类型；若是，则执行步骤s23；反之则执行步骤s24；dlp系统实时获取打印文件，利用智能分类器，对打印文件进行分类，同样的，仅仅需要判断打印文件的文档类型为私密图片还是其他文件。
[0041]
同样的，智能分类器进行分类判断打印文件的文档类型为图片时，还需要采用gan模型判断溯源图片类型，例如图片内容为办公文档或办公图片，分类器认为是文档类型；若图片内容为自然图片或者私密生活照等不规则的图片，则分类器认为是私密图片类型。
[0042]
当然，智能分类器模型需要提前训练。
[0043]
s23：使用深度对抗网络，溯源私密图片隐写信息，执行步骤s25；一旦系统判断打印文件中的文档类型是否为私密图片，将打印文件数据输入至训练好的深度对抗网络模型中，获取私密图片类型的隐写信息并进行输出。
[0044]
同样的，执行步骤s23之前，需要提前训练深度对抗网络模型。
[0045]
s24：使用图像二值化方法，溯源打印文件隐写信息，执行步骤s25；一旦系统判断打印文件中的文档类型为办公文档、图片或其他，那么根据打印文件属性，使用图像二值化方法，溯源打印文件隐写信息并输出。
[0046]
以上使用深度对抗网络模型来隐写、溯源敏感文件，结合图像二值化方法，可以针对不同类型的文档进行特定的溯源处理，隐秘性强，鲁棒性高。
[0047]
s25：对溯源到的隐写信息校验，判断校验是否成功，若是，则溯源成功；反之则提示文档没有敏感信息或者溯源失败。
[0048]
在这里，对溯源信息依次进行bch和crc校验，若均校验通过，则溯源出隐写信息；反之则系统提示“未检测到隐写信息或者溯源失败”。
[0049]
整个方法全部集成到dlp系统中，全程系统自动处理，用户体验感好。
[0050]
结合实施例一和实施例二，总结得之：本发明一种基于深度对抗网络的敏感文件隐写和溯源方法预先训练文档类型识别模型，隐写模型，溯源模型。隐写阶段，通过文档识别模型，能够智能识别不同文档类型，如彩色、灰度私密图片，彩色、灰度敏感办公文档。对私密图片，深度对抗网络通过隐写模型隐写信息到图片，对敏感办公文档，使用图像二值化
方法将隐写信息隐藏到文档。溯源阶段，同样通过文档识别模型，智能识别私密图片和敏感办公文档图片。对私密图片，深度对抗网络通过溯源模型溯源图片隐写信息，对敏感办公文档，使用图像二值化方法溯源敏感信息。
[0051]
以及，通过结合图像二值化方法，本发明能够对灰度、彩色打印文档、图片进行隐写、溯源，隐写结果不易被察觉。并且该发明具有一定的抗压缩、抗斜拍、抗阴影、抗污损能力，具有较强的鲁棒性和实用性。通过将该发明集成到dlp系统，能够有实时、有效的溯源、追踪私密图片和敏感办公文档，增强dlp系统监控范围，降低敏感文档、图片外泄风险。
[0052]
本发明一种基于深度对抗网络的敏感文件隐写和溯源方法可以针对不同类型的文档进行特定的隐写处理，对私密图片的隐写的隐秘性强，可以集成到传统dlp系统中，能够有效扩展dlp系统防控范围，降低文档、图片等敏感文件外泄风险，能够及时、准确溯源和定位外泄途径，降低企业和政府部门损失，鲁棒性高，具有很好的抗压缩、抗斜拍、抗阴影、抗污损能力。
[0053]
本发明不局限于上述具体的实施方式，本发明可以有各种更改和变化。凡是依据本发明的技术实质对以上实施方式所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张黎;刘维炜;吴洋;陈焰华
技术所有人：闪捷信息科技有限公司
我是此专利的发明人

上一篇：模糊与个人可识别信息(PII)有关的信息的制作方法
上一篇：基于权限配置的数据访问控制的方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。