一种基于文字及图片的内容安全过滤方法及系统与流程

文档序号:32792606发布日期:2023-01-03 21:29阅读:31来源:国知局
一种基于文字及图片的内容安全过滤方法及系统与流程

1.本发明属于数据处理技术领域,尤其涉及一种基于文字及图片的内容安全过滤方法及系统。


背景技术:

2.信息安全的定义为:为数据处理系统建立和采用的技术、管理上的安全保护,为的是保护计算机硬件、软件、数据不因偶然和恶意的原因而遭到破坏、更改和泄露。
3.无论是在办公环境下,还是在平时人们的沟通过程中,均是通过沟通软件来实现的,在沟通软件上,用户可以发送任意图片和文字,并通过沟通软件进行传输和显示。
4.但是,对于具有保密要求的用户,不对发送内容进行限制,很容易出现信息泄漏的问题。


技术实现要素:

5.本发明实施例的目的在于提供一种基于文字及图片的内容安全过滤方法,旨在解决对于具有保密要求的用户,不对发送内容进行限制,很容易出现信息泄漏的问题。
6.本发明实施例是这样实现的,一种基于文字及图片的内容安全过滤方法,其特征在于,所述方法包括:获取待传输数据,所述待传输数据包括待核验文字信息和待核验图片信息;对待核验文字信息进行关键字核查,得到文字安全检测结果;对待核验图片信息进行图像识别,提取图像内容,进行图片内容核查,得到图片安全监测结果;获取接收数据用户权限,根据接收数据用户权限、文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行屏蔽处理,并发送。
7.优选的,所述对待核验文字信息进行关键字核查,得到文字安全检测结果的步骤,具体包括:查询发送数据用户信息,获取与之对应的核验关键字;逐个调取核验关键字,并对待核验文字信息进行检索,得到检索结果;根据检索结果确定核验关键字出现的位置,确定过滤区间,生成文字安全检测结果。
8.优选的,所述对待核验图片信息进行图像识别,提取图像内容,进行图片内容核查,得到图片安全监测结果的步骤,具体包括:对待核验图片信息进行图像识别,得到图像识别结果;根据图像识别结果查询图像内容数据库,得到图像内容转化数据;对图像内容转化数据进行关键字核查,以得到图片安全监测结果。
9.优选的,所述获取接收数据用户权限,根据接收数据用户权限、文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行屏蔽处理的步骤,具体包
括:获取接收数据用户权限,根据接收数据用户权限对待核验文字信息和待核验图片信息进行内容筛选,得到权限筛选结果;根据文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行内容筛选,得到安全筛选结果;根据权限筛选结果和安全筛选结果对待核验文字信息和待核验图片信息中的相应位置进行屏蔽处理。
10.优选的,进行屏蔽处理时,对文字部分以预设字符进行替换。
11.优选的,进行屏蔽处理时,对图片部分进行模糊处理。
12.本发明实施例的另一目的在于提供一种基于文字及图片的内容安全过滤系统,所述系统包括:数据获取模块,用于获取待传输数据,所述待传输数据包括待核验文字信息和待核验图片信息;文字核验模块,用于对待核验文字信息进行关键字核查,得到文字安全检测结果;图片核验模块,用于对待核验图片信息进行图像识别,提取图像内容,进行图片内容核查,得到图片安全监测结果;局部过滤模块,用于获取接收数据用户权限,根据接收数据用户权限、文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行屏蔽处理,并发送。
13.优选的,所述文字核验模块包括:数据查询单元,用于查询发送数据用户信息,获取与之对应的核验关键字;数据检索单元,用于逐个调取核验关键字,并对待核验文字信息进行检索,得到检索结果;关键字定位单元,用于根据检索结果确定核验关键字出现的位置,确定过滤区间,生成文字安全检测结果。
14.优选的,所述图片核验模块包括:图像识别单元,用于对待核验图片信息进行图像识别,得到图像识别结果;内容转化单元,用于根据图像识别结果查询图像内容数据库,得到图像内容转化数据;关键字核验单元,用于对图像内容转化数据进行关键字核查,以得到图片安全监测结果。
15.优选的,所述局部过滤模块包括:权限筛选单元,用于获取接收数据用户权限,根据接收数据用户权限对待核验文字信息和待核验图片信息进行内容筛选,得到权限筛选结果;安全筛选单元,用于根据文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行内容筛选,得到安全筛选结果;信息拼比单元,用于根据权限筛选结果和安全筛选结果对待核验文字信息和待核验图片信息中的相应位置进行屏蔽处理。
16.本发明实施例提供的一种基于文字及图片的内容安全过滤方法,通过对待核验文字信息进行文字核验,从而对文字内容进行检查,进而对图片进行内容识别,根据识别结果
确定图片内容,从而完成对图片内容的核查,最终结合用户权限对待核验文字信息和待核验图片信息进行内容屏蔽,以保证数据传输的安全,避免出现信息泄漏的问题。
附图说明
17.图1为本发明实施例提供的一种基于文字及图片的内容安全过滤方法的流程图;图2为本发明实施例提供的对待核验文字信息进行关键字核查,得到文字安全检测结果的步骤的流程图;图3为本发明实施例提供的对待核验图片信息进行图像识别,提取图像内容,进行图片内容核查,得到图片安全监测结果的步骤的流程图;图4为本发明实施例提供的获取接收数据用户权限,根据接收数据用户权限、文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行屏蔽处理的步骤的流程图;图5为本发明实施例提供的一种基于文字及图片的内容安全过滤系统的架构图;图6为本发明实施例提供的一种文字核验模块的架构图;图7为本发明实施例提供的一种图片核验模块的架构图;图8为本发明实施例提供的一种局部过滤模块的架构图。
具体实施方式
18.为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
19.可以理解,本技术所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但除非特别说明,这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。举例来说,在不脱离本技术的范围的情况下,可以将第一xx脚本称为第二xx脚本,且类似地,可将第二xx脚本称为第一xx脚本。
20.无论是在办公环境下,还是在平时人们的沟通过程中,均是通过沟通软件来实现的,在沟通软件上,用户可以发送任意图片和文字,并通过沟通软件进行传输和显示。但是,对于具有保密要求的用户,不对发送内容进行限制,很容易出现信息泄漏的问题。
21.本发明通过对待核验文字信息进行文字核验,从而对文字内容进行检查,进而对图片进行内容识别,根据识别结果确定图片内容,从而完成对图片内容的核查,最终结合用户权限对待核验文字信息和待核验图片信息进行内容屏蔽,以保证数据传输的安全,避免出现信息泄漏的问题。
22.如图1所示,为本发明实施例提供的一种基于文字及图片的内容安全过滤方法的流程图,所述方法包括:s100,获取待传输数据,所述待传输数据包括待核验文字信息和待核验图片信息。
23.在本步骤中,获取待传输数据,待传输数据即为等待传输的数据,其中待核验文字信息中包含的均为文本内容,具体可以是文字,也可以是只包含文字的文档,待核验图片信息中则为图片,上述信息均为用户选择发送,但尚未经过核验,因此安全性未知。
24.s200,对待核验文字信息进行关键字核查,得到文字安全检测结果。
25.在本步骤中,对待核验文字信息进行关键字核查,通过调取预设的关键字,当出现相应的关键字时,则说明该部分内容可能会涉及安全,因此,需要对该部分内容进行处理,以防止将其流传出去,因此在进行核查的时候,直接逐个调取关键字,将关键字与待核验文字信息进行比较,从而判断其中是否包含对应的关键字,若包含,则需要记录该关键字出现的位置,并将其录入到文字安全监测结果当中,后续则根据文字安全检测结果对待核验文字信息进行处理即可。
26.s300,对待核验图片信息进行图像识别,提取图像内容,进行图片内容核查,得到图片安全监测结果。
27.在本步骤中,对待核验图片信息进行图像识别,在进行图像识别时,识别图片中的物体,从而根据物体将其转化为文字内容,通过文字内容对其进行描述,即得到图像内容,然后同样的,利用关键字对图片内容进行核查,以保证图片的安全性,将图片内容核查得到的结果进行记录,以得到图片安全监测结构。
28.s400,获取接收数据用户权限,根据接收数据用户权限、文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行屏蔽处理,并发送。
29.在本步骤中,获取接收数据用户权限,对于不同的用户而言,其由于职级不同,因此具有的权限也不同,为每一个用户设置相应的权限,具有不同权限的用户能够查看的文件内容也不筒,因此在进行屏蔽时,基于用户权限进行处理,从而对待核验文字信息和待核验图片信息涉及信息安全的部分进行屏蔽,避免其泄漏,具体的,用户可以为待核验文字信息和待核验图片信息设置相应的标签,不同的标签也就代表着不同的阅读权限,那么在进行传输时,根据接收方的权限,来判断待核验文字信息和待核验图片信息传输是否安全,在进行屏蔽之后,涉及信息安全的内容被替换,因此可以进行安全传输,不影响其他内容的传输。
30.如图2所示,作为本发明的一个优选实施例,所述对待核验文字信息进行关键字核查,得到文字安全检测结果的步骤,具体包括:s201,查询发送数据用户信息,获取与之对应的核验关键字。
31.在本步骤中,查询发送数据用户信息,对于不同的用户,其在发送数据时,需要对其发送的内容进行检查,判断其是否具有处理上述内容的权限,因此先查询该用户的信息,确定不属于该用户权限内的核验关键字。
32.s202,逐个调取核验关键字,并对待核验文字信息进行检索,得到检索结果。
33.在本步骤中,逐个调取核验关键字,具体的,为每一个核验关键字进行编号,从而按照编号顺序进行调取每调取一个核验关键字,将该核验关键字作为比对源,以判断在待核验文字信息中是否包含该核验关键字,最终在所有核验关键字检索完成之后,生成检索结果。
34.s203,根据检索结果确定核验关键字出现的位置,确定过滤区间,生成文字安全检测结果。
35.在本步骤中,根据检索结果确定核验关键字出现的位置,在根据每个核验关键字进行检索之后,对待核验文字信息中出现该核验关键字的位置进行记录,以该核验关键字的位置为参考点,确定过滤区间,具体的,将包含该核验关键字的一句话,或者一个段落作为一个过滤区间,从而对所有能够在待核验文字信息中出现的核验关键字进行上述处理,
以得到安全检测结果。
36.如图3所示,作为本发明的一个优选实施例,所述对待核验图片信息进行图像识别,提取图像内容,进行图片内容核查,得到图片安全监测结果的步骤,具体包括:s301,对待核验图片信息进行图像识别,得到图像识别结果。.s302,根据图像识别结果查询图像内容数据库,得到图像内容转化数据。
37.在本步骤中,对待核验图片信息进行图像识别,具体的,设置图像内容数据库,图像识别过程中,识别其中的文字和图案,而在图像内容数据库中存储有所有图案对应的文字描述内容,从而在识别得到图案时,则根据图案查询图像内容数据库,以确定与之对应的文字描述内容,即得到由图像识别结果转化得到的图像内容转化数据,图像内容转化数据为通过文本描述的信息。
38.s303,对图像内容转化数据进行关键字核查,以得到图片安全监测结果。
39.在本步骤中,对图像内容转化数据进行关键字核查,由于待核验图片信息已经转为文字内容,那么可以通过对待核验文字信息进行核查的方式对图像内容转化数据进行核查,以最终得到图片安全监测结果。
40.如图4所示,作为本发明的一个优选实施例,所述获取接收数据用户权限,根据接收数据用户权限、文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行屏蔽处理的步骤,具体包括:s401,获取接收数据用户权限,根据接收数据用户权限对待核验文字信息和待核验图片信息进行内容筛选,得到权限筛选结果。
41.在本步骤中,获取接收数据用户权限,在本地或者服务器中预存有各个用户对应的权限,根据不同的权限可以查看和接收不同的信息,因此,对于接收数据的一方,需要先核查其权限,根据其权限先对待核验文字信息和待核验图片信息进行内容筛选,筛选出具有查看权限的一部分。
42.s402,根据文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行内容筛选,得到安全筛选结果。
43.在本步骤中,读取文字安全检测结果和图片安全监测结果,可知,对于不同发送用户的权限进行了权限核查,从而对其进行了筛选,据此确定需要进行屏蔽的位置。
44.s403,根据权限筛选结果和安全筛选结果对待核验文字信息和待核验图片信息中的相应位置进行屏蔽处理。
45.在本步骤中,根据权限筛选结果和安全筛选结果对待核验文字信息和待核验图片信息中的相应位置进行屏蔽处理,对于文本内容,通过文字替换的方式实现,如以特殊字符“&%”进行替换,也可以通过预设的文字段落进行替换,对于图片则可以通过模糊处理,也可以通过预设的加密图案进行覆盖,最终将屏蔽的文件进行传输。
46.如图5所示,为本发明实施例提供的一种基于文字及图片的内容安全过滤系统,所述系统包括:数据获取模块100,用于获取待传输数据,所述待传输数据包括待核验文字信息和待核验图片信息。
47.在本系统中,数据获取模块100获取待传输数据,待传输数据即为等待传输的数据,其中待核验文字信息中包含的均为文本内容,具体可以是文字,也可以是只包含文字的
文档,待核验图片信息中则为图片,上述信息均为用户选择发送,但尚未经过核验,因此安全性未知。
48.文字核验模块200,用于对待核验文字信息进行关键字核查,得到文字安全检测结果。
49.在本系统中,文字核验模块200对待核验文字信息进行关键字核查,通过调取预设的关键字,当出现相应的关键字时,则说明该部分内容可能会涉及安全,因此,需要对该部分内容进行处理,以防止将其流传出去,因此在进行核查的时候,直接逐个调取关键字,将关键字与待核验文字信息进行比较,从而判断其中是否包含对应的关键字,若包含,则需要记录该关键字出现的位置,并将其录入到文字安全监测结果当中,后续则根据文字安全检测结果对待核验文字信息进行处理即可。
50.图片核验模块300,用于对待核验图片信息进行图像识别,提取图像内容,进行图片内容核查,得到图片安全监测结果。
51.在本系统中,图片核验模块300对待核验图片信息进行图像识别,在进行图像识别时,识别图片中的物体,从而根据物体将其转化为文字内容,通过文字内容对其进行描述,即得到图像内容,然后同样的,利用关键字对图片内容进行核查,以保证图片的安全性,将图片内容核查得到的结果进行记录,以得到图片安全监测结构。
52.局部过滤模块400,用于获取接收数据用户权限,根据接收数据用户权限、文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行屏蔽处理,并发送。
53.在本系统中,局部过滤模块400获取接收数据用户权限,对于不同的用户而言,其由于职级不同,因此具有的权限也不同,为每一个用户设置相应的权限,具有不同权限的用户能够查看的文件内容也不筒,因此在进行屏蔽时,基于用户权限进行处理,从而对待核验文字信息和待核验图片信息涉及信息安全的部分进行屏蔽,避免其泄漏,具体的,用户可以为待核验文字信息和待核验图片信息设置相应的标签,不同的标签也就代表着不同的阅读权限,那么在进行传输时,根据接收方的权限,来判断待核验文字信息和待核验图片信息传输是否安全,在进行屏蔽之后,涉及信息安全的内容被替换,因此可以进行安全传输,不影响其他内容的传输。
54.如图6所示,作为本发明的一个优选实施例,所述文字核验模块200包括:数据查询单元201,用于查询发送数据用户信息,获取与之对应的核验关键字。
55.在本模块中,数据查询单元201查询发送数据用户信息,对于不同的用户,其在发送数据时,需要对其发送的内容进行检查,判断其是否具有处理上述内容的权限,因此先查询该用户的信息,确定不属于该用户权限内的核验关键字。
56.数据检索单元202,用于逐个调取核验关键字,并对待核验文字信息进行检索,得到检索结果。
57.在本模块中,数据检索单元202逐个调取核验关键字,具体的,为每一个核验关键字进行编号,从而按照编号顺序进行调取每调取一个核验关键字,将该核验关键字作为比对源,以判断在待核验文字信息中是否包含该核验关键字,最终在所有核验关键字检索完成之后,生成检索结果。
58.关键字定位单元203,用于根据检索结果确定核验关键字出现的位置,确定过滤区
间,生成文字安全检测结果。
59.在本模块中,关键字定位单元203根据检索结果确定核验关键字出现的位置,在根据每个核验关键字进行检索之后,对待核验文字信息中出现该核验关键字的位置进行记录,以该核验关键字的位置为参考点,确定过滤区间,具体的,将包含该核验关键字的一句话,或者一个段落作为一个过滤区间,从而对所有能够在待核验文字信息中出现的核验关键字进行上述处理,以得到安全检测结果。
60.如图7所示,作为本发明的一个优选实施例,所述图片核验模块300包括:图像识别单元301,用于对待核验图片信息进行图像识别,得到图像识别结果。
61.内容转化单元302,用于根据图像识别结果查询图像内容数据库,得到图像内容转化数据。
62.在本模块中,对待核验图片信息进行图像识别,具体的,设置图像内容数据库,图像识别过程中,识别其中的文字和图案,而在图像内容数据库中存储有所有图案对应的文字描述内容,从而在识别得到图案时,则根据图案查询图像内容数据库,以确定与之对应的文字描述内容,即得到由图像识别结果转化得到的图像内容转化数据,图像内容转化数据为通过文本描述的信息。
63.关键字核验单元303,用于对图像内容转化数据进行关键字核查,以得到图片安全监测结果。
64.在本模块中,关键字核验单元303对图像内容转化数据进行关键字核查,由于待核验图片信息已经转为文字内容,那么可以通过对待核验文字信息进行核查的方式对图像内容转化数据进行核查,以最终得到图片安全监测结果。
65.如图8所示,作为本发明的一个优选实施例,所述局部过滤模块400包括:权限筛选单元401,用于获取接收数据用户权限,根据接收数据用户权限对待核验文字信息和待核验图片信息进行内容筛选,得到权限筛选结果。
66.在本模块中,权限筛选单元401获取接收数据用户权限,在本地或者服务器中预存有各个用户对应的权限,根据不同的权限可以查看和接收不同的信息,因此,对于接收数据的一方,需要先核查其权限,根据其权限先对待核验文字信息和待核验图片信息进行内容筛选,筛选出具有查看权限的一部分。
67.安全筛选单元402,用于根据文字安全检测结果和图片安全监测结果对待核验文字信息和待核验图片信息进行内容筛选,得到安全筛选结果。
68.在本模块中,安全筛选单元402读取文字安全检测结果和图片安全监测结果,可知,对于不同发送用户的权限进行了权限核查,从而对其进行了筛选,据此确定需要进行屏蔽的位置。
69.信息拼比单元403,用于根据权限筛选结果和安全筛选结果对待核验文字信息和待核验图片信息中的相应位置进行屏蔽处理。
70.在本模块中,信息拼比单元403根据权限筛选结果和安全筛选结果对待核验文字信息和待核验图片信息中的相应位置进行屏蔽处理,对于文本内容,通过文字替换的方式实现,如以特殊字符“&%”进行替换,也可以通过预设的文字段落进行替换,对于图片则可以通过模糊处理,也可以通过预设的加密图案进行覆盖,最终将屏蔽的文件进行传输。
71.应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次
显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink) dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
72.以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
73.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
74.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1