一种面向多文档的敏感关键词识别与打印控制方法

文档序号:9810218阅读:415来源:国知局
一种面向多文档的敏感关键词识别与打印控制方法
【技术领域】
[0001]本发明属于计算机打印控制领域,尤其涉及一种面向多文档的敏感关键词识别与打印控制方法。
【背景技术】
[0002]随着办公电子化时代到来,政府部门、企事业单位、科研院所等机构核心数据的打印泄密、无序管理、存储灾难成为管理的挑战,各种敏感数据文档,包括设计文档、研发数据、医药配方、设计图纸、源代码、营销方案、财务报表及其他各种涉及国家机密和商业秘密的文档,一旦外泄将对机构运行、盈利甚至生存带来严重风险。
[0003]目前,打印业务流程中缺乏敏感信息审核功能,打印用户存在无意识或有意识地忽略对文档中敏感信息的检查,机构管理者在打印文档数量剧增的情况下,无法对打印的各类文件进行有效审核。因此会造成核心信息泄露、打印文档失控、事故追责困难等问题。

【发明内容】

[0004]针对现有技术的不足,本发明的目的旨在于提供一种用于降低打印成本、消除泄密安全隐患问题的面向多文档的敏感关键词识别与打印控制方法。
[0005]为实现上述目的,本发明采用如下技术方案:
[0006]—种面向多文档的敏感关键词识别与打印控制方法,包括如下步骤,
[0007]步骤1、客户端将待打印文档提交至打印服务器上;
[0008]步骤2、打印服务器检测待打印文档中是否包含敏感关键词库中的敏感关键词,若是,则执行步骤3,若否,则执行步骤4;
[0009]步骤3、打印服务器将获取的敏感关键词的相关信息写入敏感关键词检测结果表中,以丰富敏感关键词库;
[0010]步骤4、打印服务器将待打印文档加入打印列队,并确认打印输出。
[0011]进一步的,所述步骤4后还包括以下步骤,
[0012]步骤5、打印服务器通过打印机执行打印并记录打印过程的审计信息;
[0013]其中审计信息包括用户名、文档名称、打印时间、页数、份数,以及保存打印输出文档图像备份作为追踪标识、文档回收、举证鉴真的永久数据。
[0014]进一步的,所述步骤2中的敏感关键词库具体通过基于文档样本学习和用户自定义方法动态生成。
[0015]更进一步的,所述敏感关键词库采用关系型数据库进行数据存储,并采用字典树存储结构。
[0016]更进一步的,所述步骤2中的打印服务器检测待打印文档中是否包含敏感关键词库中的敏感关键词具体包括以下步骤,
[0017]步骤21、启动敏感关键词检测系统,加载敏感关键词库到内存;
[0018]步骤22、通过目录文件读写子模块读取待打印文档;
[0019]步骤23、对待打印文档进行预处理;
[0020]步骤24、通过扫描指针依次读取待检测文本中的每个字符,并使用哈希散列函数将每个字符映射到字典树中进行敏感关键词检测,直到扫描指针指向文本结尾;
[0021]更进一步的,步骤3中的敏感关键词的相关信息包括标记扫描指针的位置信息、获取敏感关键词的上下文作为该敏感关键词的摘要内容以及获取敏感关键词检测系统的当前时间。
[0022]更进一步的,步骤4具体还包括以下步骤,
[0023]步骤41、调用打印文档命令,以使待打印文档加入打印列队;
[0024]步骤42、在虚拟打印机缓冲区中生成SHD打印缓冲文件和SPL打印缓冲文件;
[0025]步骤43、通过Web办公系统或刷卡登陆确认打印输出。
[0026]本发明的有益效果如下:本发明针对企事业机构打印机密信息管理需求,采用面向多文档的敏感关键词识别、标定与打印权限控制技术,从而提供了一种集成打印服务管理、关键词标定、内容审核与授权、打印记录统计等功能的分布式打印服务系统,以降低打印成本、消除泄密安全隐患。本发明通过对网络中的多个异构打印设备和打印用户进行管理,建立网络打印环境中用户标识信息,对用户的打印行为进行授权和监控,为打印文档内容审核提供基于关键词库的快速识别与标定算法,辅助管理者进行打印自动审核与授权,可用于对各种国家和商业秘密文档进行打印信息输出保护。
【附图说明】
[0027]图1为本发明一种面向多文档的敏感关键词识别与打印控制方法的流程图。
【具体实施方式】
[0028]下面将结合附图以及【具体实施方式】,对本发明做进一步描述:
[0029]本发明运行于网络化打印环境(两节点以上)内,该网络化打印环境由打印服务器、打印客户端以及打印机等逻辑节点构成。
[0030]本发明采用虚拟打印技术为打印客户端设计一台虚拟打印机,屏蔽非授权打印许可,强制用户必须使用虚拟打印机进行所有的打印操作,用户所有待打印文档必须通过Web办公管理系统提交管理者审核,经授权打印服务器将待打印文档加入打印机任务队列,用户在Web办公系统或刷卡登录确认打印后,输出待打印文档。
[0031]具体请参见图1,本发明涉及一种面向多文档的敏感关键词识别与打印控制方法,其较佳实施方式包括如下步骤,
[0032]步骤S1、客户端将待打印文档提交至打印服务器上。
[0033]步骤S2、打印服务器检测待打印文档中是否包含敏感关键词库中的敏感关键词,若是,则执行步骤S3,若否,则执行步骤S4。此处即为基于敏感关键词快速匹配识别算法的打印内容审核,其中敏感关键词快速匹配识别算法主要完成对待打印文档的敏感关键词检测。
[0034]步骤S3、打印服务器将获取的敏感关键词的相关信息写入敏感关键词检测结果表中,以丰富敏感关键词库。
[0035]步骤S4、打印服务器将待打印文档加入打印列队,并确认打印输出。
[0036]步骤S5、打印服务器通过打印机执行打印并记录打印过程的审计信息;
[0037]其中审计信息包括用户名、文档名称、打印时间、页数、份数,以及保存打印输出文档图像备份作为追踪标识、文档回收、举证鉴真的永久数据。
[0038]其中,步骤S2中具体通过基于文档样本学习和用户自定义方法动态生成敏感关键词库,用户可以根据自身保密要求定义核心数据保护
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1