一种敏感图片文件的智能识别方法与流程

文档序号：11323653阅读：1163来源：国知局

【技术领域】

本发明涉及图片文件识别的技术领域，特别涉及一种敏感图片文件的智能识别方法。

背景技术：

数字信息技术的快速发展大力推动了计算机网络与信息系统在政府及企事业单位的广泛应用，为办公及生产建设的电子化、自动化、信息化提供了坚实保障，但目前关于电子文档的安全监控系统大部分是针对计算机可以直接识别的计算机文字而设计，而对图像形式的电子文档的监控暂时还没有很好的系统对其处理。各种涉密信息也大量以电子文件的形式存储于计算机系统中。尤其在政府内网(公安、检察院、法院、政府、财税、电力等等领域)环境中，防止涉密文件的非法存储可以说已成为国家安全保密工作的重中之重。

在实际应用当中会存在很多图片格式、视频格式的涉密信息文件，并且有些用户为了逃避监管，利用手机、相机、视频等设备把文本涉密信息内容拍成图片和视频格式存放，导致无法完全实现对图片、视频格式涉密文件的智能发现和监管，存在监管漏洞。

为了解决上述问题，有必要提出一种敏感图片文件的智能识别方法，实现对图片格式涉密文件的智能识别和监管，实现对图片敏感文件的智能发现和定位，减少敏感文件泄露的风险，解决当前利用手机和相机任意拍摄敏感文件存放，逃避监管的行为。

技术实现要素：

本发明的目的在于克服上述现有技术的不足，提供一种敏感图片文件的智能识别方法，其旨在解决现有技术中对图片格式涉密文件的智能识别和监管力度较小，存在较大的泄露风险，同时图片格式的涉密文件易逃避监管的技术问题。

为实现上述目的，本发明提出了一种敏感图片文件的智能识别方法，其基于部署于终端设备上的终端监测程序，来实现对终端设备上文件系统的扫描和监控，同时把结果数据上报给中心分析服务器，中心分析服务器根据图片文件的敏感特征进行建模分析，并识别是否为敏感图片，具体步骤如下：

第一步、启动终端设备上的终端监测程序，对终端设备上的文件系统进行扫描，并且对图片文件的格式进行预处理，形成标准格式的图片文件；

第二步、识别预处理后标准格式的图片文件的不同颜色区域，并且对不同颜色区域进行灰度和二值化处理，读取图片文件上的像素点，必要时根据图片内容位置进行图片旋转摆正处理；

第三步、对图片上的文字区域进行合并处理，找出具有文字特征的文字区域边界，提取文字区域块；

第四步、对提取的具有文字特征的文字区域块进行内容检测，通过字符切割和旋转处理，提取出图片上的特征内容文字；

第五步、终端监测程序对提取出的特征内容文字与对比数据库进行匹配，识别是否存在绝密、机密、秘密信息的敏感特征，同时终端设备上的终端监测程序将敏感特征传输给中心分析服务器；

第六步、中心分析服务器根据敏感特征进行建模分析，根据模型分析结果识别终端设备上的图片文件是否为敏感图片。

作为优选，所述的第一步中的预处理包括像素矩阵的缩放处理和噪声去除处理。

作为优选，所述的第二步中识别不同颜色区域时，特别提取出图片文件的红色区域。

作为优选，所述的第三步中对图片上的文字区域进行合并处理时，连续两行只有一个字则合并为一个区域。

作为优选，所述的第六步中中心分析服务器利用敏感文件特征知识库，通过对图片文件的特征进行关联分析，实现敏感特征文件的特征建模，完成对具有敏感特征的图片文件的智能识别。

作为优选，所述的图片文件的特征包括文件头、文件头内容、段落、特征字段。

本发明的有益效果：与现有技术相比，本发明提供的一种敏感图片文件的智能识别方法，通过在终端设备设备上部署一个终端监测程序，实现对终端设备文件系统的扫描和监控，同时把结果数据上报给中心分析服务器，根据敏感特征建模分析，识别其是否为敏感图片，本发明依靠对图片内文字内容的提取和识别技术，通过敏感特征分析模型，实现对敏感图片文件的智能发现和定位，实现对图片格式涉密文件的智能识别和监管，大大减少了敏感文件泄露的风险，解决当前利用手机和相机任意拍摄敏感文件存放，逃避监管的行为。

本发明的特征及优点将通过实施例结合附图进行详细说明。

【附图说明】

图1是本发明实施例一种敏感图片文件的智能识别方法的流程示意图。

【具体实施方式】

为使本发明的目的、技术方案和优点更加清楚明了，下面通过附图中及实施例，对本发明进行进一步详细说明。但是应该理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限制本发明的范围。此外，在以下说明中，省略了对公知结构和技术的描述，以避免不必要地混淆本发明的概念。

参阅图1，本发明实施例提供一种敏感图片文件的智能识别方法，其基于部署于终端设备上的终端监测程序，来实现对终端设备上文件系统的扫描和监控，同时把结果数据上报给中心分析服务器，中心分析服务器根据图片文件的敏感特征进行建模分析，并识别是否敏感图片，具体步骤如下：

第一步、启动终端设备上的终端监测程序，对终端设备上的文件系统进行扫描，并且对图片文件的格式进行预处理，形成标准格式的图片文件。

其中，中的预处理包括像素矩阵的缩放处理和噪声去除处理。

第二步、识别预处理后标准格式的图片文件的不同颜色区域，并且对不同颜色区域进行灰度和二值化处理，读取图片文件上的像素点，必要时根据图片内容位置进行图片旋转摆正处理。

在本发明实施例中，在识别不同颜色区域时，特别提取出图片文件的红色区域。

第三步、对图片上的文字区域进行合并处理，找出具有文字特征的文字区域边界，提取文字区域块。

其中，对图片上的文字区域进行合并处理时，连续两行只有一个字则合并为一个区域。

第四步、对提取的具有文字特征的文字区域块进行内容检测，通过字符切割和旋转处理，提取出图片上的特征内容文字。

第五步、终端监测程序对提取出的特征内容文字与对比数据库进行匹配，识别是否存在绝密、机密、秘密信息的敏感特征，同时终端设备上的终端监测程序将敏感特征传输给中心分析服务器。

第六步、中心分析服务器根据敏感特征进行建模分析，根据模型分析结果识别终端设备上的图片文件是否为敏感图片。

在本发明实施例中，中心分析服务器利用敏感文件特征知识库，通过对图片文件的特征进行关联分析，实现敏感特征文件的特征建模，完成对具有敏感特征的图片文件的智能识别。

进一步地，所述的图片文件的特征包括文件头、文件头内容、段落、特征字段。

本发明一种敏感图片文件的智能识别方法，通过在终端设备设备上部署一个终端监测程序，实现对终端设备文件系统的扫描和监控，同时把结果数据上报给中心分析服务器，根据敏感特征建模分析，识别其是否是铭感图片，本发明依靠对图片内文字内容的提取和识别技术，通过敏感特征分析模型，实现对敏感图片文件的智能发现和定位，实现对图片格式涉密文件的智能识别和监管，大大减少了敏感文件泄露的风险，解决当前利用手机和相机任意拍摄敏感文件存放，逃避监管的行为。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：傅如毅
技术所有人：浙江远望信息股份有限公司
我是此专利的发明人

上一篇：拼装式保育栏的制造方法与工艺
上一篇：一种通气螺旋杆与气管连接装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。