敏感数据鉴识方法与使用所述方法的数据外泄防范系统的制作方法

文档序号:8361761阅读:395来源:国知局
敏感数据鉴识方法与使用所述方法的数据外泄防范系统的制作方法
【技术领域】
[0001]本发明系关于一种数据外泄防范(Data Loss Prevent1n,DLP)系统,且特别是一种可以无关于文件格式(format free)的敏感数据鉴识方法与使用所述方法的数据外泄防范系统。
【背景技术】
[0002]敏感数据是指政府机关、企业或医院内部的机密或敏感数据,其具有不得外泄的文字内容,例如,个资、商业秘密、国家机密或病历等。上述敏感数据一般会被记录于计算器装置的文件中,因此,目前有人采用数据外泄防范系统来防止具有敏感数据的文件外泄。
[0003]现行的数据外泄防范系统必须对文件的文件格式进行语法解析(parsing),才可以将文件中的文字内容撷取出来,并进一步地解读文件是否包括敏感数据。但不幸的是,开发文件格式的语法解析器(parser)是一件耗时费力的事,且文件的文件格式有数百种,甚至部份的文件格式系未被公开,故现行的数据外泄防范系统并无法完全解析每一种文件格式的文件。
[0004]虽然,现行的部份数据外泄防范系统可以通过逆向工程来解析未被公开的文件格式的文件,但其解析方式依然十分复杂,且解析文件的工作(loading)亦十分繁重。除此之夕卜,现行的数据外泄防范系统并无法实时地侦测与防范敏感数据通过其他新文件格式的文件外泄。

【发明内容】

[0005]本发明实施提供一种敏感数据鉴识方法,所述方法系执行于数据外泄防范系统中,并用于在文件的生成过程中,判断文件是否有至少一敏感数据的存在。所述方法的步骤说明如下。记录用户通过键盘所输入的多个字符。将被记录的多个字符进行裁剪,以产生裁剪后的数据。比对裁剪后的数据与预先定义的关于至少一敏感数据的至少一字词,以判断裁剪后的数据是否存在有所述至少一敏感数据。
[0006]本发明实施例提供一种数据外泄防范系统,所述系统用于在文件的生成过程中,判断文件是否有至少一敏感数据的存在。所述系统包括记录驱动模块、前置过滤模块与敏感数据分析模块。记录驱动模块用于记录用户通过键盘所输入的多个字符。前置过滤模块用于将被记录的多个字符进行裁剪,以产生裁剪后的数据。敏感数据分析模块用于比对裁剪后的数据与预先定义的关于至少一敏感数据的至少一字词,以判断裁剪后的数据是否存在有至少一敏感数据。
[0007]综上所述,本发明实施例所提供的敏感数据鉴识方法可以在文件生成过程中,不须对文件的文件格式进行解析的情况下,即可撷取文件的文字内容,并进一步地判断文件的文字内容是否存在有敏感数据。
[0008]为使能更进一步了解本发明的特征及技术内容,请参阅以下有关本发明的详细说明与附图,但是此等说明与所附图式仅系用来说明本发明,而非对本发明的申请专利范围作任何的限制。
【附图说明】
[0009]图1是本发明实施例的敏感数据鉴识方法的概念示意图。
[0010]图2是本发明实施例的应用程序显示的文字内容、被记录的所有字符与裁剪后的数据的示意图。
[0011]图3是本发明实施例的数据外泄防范系统的架构示意图。
[0012]图4是本发明实施例的敏感数据鉴识方法的流程示意图。
[0013]附图标记说明
[0014]SlOO ?SI 14、S400 ?S410:步骤流程
[0015]200:应用程序显示的文字内容
[0016]202:被记录的所有字符
[0017]204:裁剪后的数据
[0018]3:数据外泄防范系统
[0019]300:记录驱动模块
[0020]302:储存/暂存模块
[0021]304:前置过滤模块
[0022]306:敏感数据分析模块
[0023]308:事件处理模块
【具体实施方式】
[0024]在下文将参照附图更充分地描述各种例示性实施例,在附图中展示一些例示性实施例。然而,本发明概念可能以许多不同形式来体现,且不应解释为限于本文中所阐述的例示性实施例。
[0025]本发明实施例提供一种敏感数据鉴识方法与使用所述方法的数据外泄防范系统,其可以在文件生成过程中,判断文件是否有敏感数据的存在。由于所述敏感数据鉴识方法是在文件生成过程中,判断是否有敏感数据的存在,因此,所述敏感数据鉴识方法不需要去解析文件的文件格式,且可以实时地侦测与防范敏感数据通过其他新文件格式的文件外泄。
[0026]首先,请参照图1,图1是本发明实施例的敏感数据鉴识方法的概念示意图。于图1中,一般来说,使用者要编辑文件时,会在步骤SlOO中,打开相应的应用程序,例如微软办公软件(Micro Soft Office)或其他文件编辑软件。接着,在步骤S102中,用户通过键盘(实体键盘、屏幕中的虚拟键盘、或藉由投射或显示键盘样式于一平面供用户输入的相关输入设备等)输入多个字符,以产生文字内容于正在编辑的文件。然后,在步骤S104中,用户储存文件,以记录用户所输入的文字内容于文件中。在步骤S112a中,数据外泄防范系统扫描用户所储存的文件,并且解析所述文件中被记录的用户所输入的文字内容,并据此判断用户所输入的文字内容是否有敏感数据的存在。在步骤S114中,若数据外泄防范系统判断用户所储存的文件具有敏感数据,则执行对应事件,例如通知管理信息系统(ManagementInformat1n System, MIS)人员。
[0027]上述步骤S100、S102、S104、S112a与S114为现行技术所存在的原始程序,为了使敏感数据鉴识方法无关于文件格式,敏感数据鉴识方法的核心作法是在应用程序被打开后,执行无关于文件格式的步骤S106?S110、S112b。
[0028]于步骤S106中,当应用程序被打开后,记录驱动模块被驱动,以实时地记录用户使用键盘所输入的多个字符,亦即将这些字符暂存于暂存模块的内存区块或储存于储存模块中。接着,在步骤S108中,使用前置过滤模块将所被记录的所有字符进行裁剪,以产生裁剪后的数据。更精确地说,由于使用者可能会输入一些特殊字符,例如,返回(Enter)、跳格(TAB)或退格(Backspace),因此,前置过滤模块会对被记录的所有字符进行裁剪,以获取使用者真正所要输入的文字内容。
[0029]举例来说,使用者可能会打错字,故会输入退格的字符将前一个字符消除;或者,用户可能会输入返回的字符,以换行继续输入;又或者,用户可能会使用跳栏的字符,以换栏继续输入。由此可见,前置过滤模块需要依据这些特殊字符的定义对被记录的所有字符进行裁剪处理,以滤除被记录的所有字符中的噪声,并产生用户真正所要输入的文字内容,亦即裁剪后的数据。
[0030]接着,在步骤SllO中,裁剪后的数据被传送至数据外泄防范系统。的后,在步骤S112b中,数据外泄防范系统扫描裁剪后的数据,并解析裁剪后的数据中是否存在着敏感数据。更精确地说,数据外泄防范系统可能定义有数个相关于敏感数据的字词,数据外泄防范系统通过比对裁剪后的数据中与这些字词,以判断裁剪后的数据中是否存在着敏感数据。若在步骤S112b中发现裁剪后的数据中是否存在着敏感数据,则在步骤S114中,数据外泄防范系统会执行相应事件。
[0031]接着,以一个例子说明上述步骤S108如何对被记录的所有字符进行裁剪并产生裁剪后的数据的作法。请参照图2,图2是本发明实施例的应用程序显示的文字内容、被记录的所有字符与裁剪后的数据的示意图。于图2中,用户是在报表编辑软件中输入应用程序显示的文字内容200,记录驱动模块会记录用户使用键盘输入的所有字符202,而前置过滤模块则是将被记录的所有字符202中进行裁剪,以滤除被记录的所有字符202中的噪声,并进一步地产生裁剪后的数据204,其中裁剪后的数据204的内容实质上相同或近似于应用程序显示的文字内容200。
[0032]举例来说,使用者一开始在打字时,先输入“Alex”这四个字符后,输入跳栏的特殊字符,以更换字段继续输入。的后,使用者将“Alex”误输入为“Akex”,因此接着输入了三个退格的特殊字符,并重新输入“lex”这三个字符。因此,在被记录的所有字符202的第一列中[TAB] ”的特殊字符会被前置过滤模块视为一个空格,而“kex[Backspace] [Backspace][Backspace] ”的这些字符则被前置过滤模块视为噪声,并直接删除。
[0033]接着,请参照图3,图3是本发明实施例的数据外泄防范系统的架构示意图。数据外泄防范系统3系以软件、硬件或韧体的方式实现,且本发明并不限制其实现的方式。数据外泄防范系统3包括记录驱动模块300、储存/暂存模块302、前置过滤模块304、敏感数据分析模块306与事件处理模块308。记录驱动模块300电性耦接储存/暂存模块302,储存/暂存模块302电性耦接前置过滤模块
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1