一种用于网页截图的脱敏、还原方法和系统与流程

文档序号:28056539发布日期:2021-12-17 22:20阅读:1035来源:国知局
一种用于网页截图的脱敏、还原方法和系统与流程

1.本发明涉及信息安全的技术领域,尤其涉及一种用于网页截图的脱敏、还原方法和系统。


背景技术:

2.随着人脸检测识别、车辆检测识别、ocr识别等相关技术发展,在各种场景下应用也越来越广泛,在各种应用系统上展示也是越来越丰富的个人身份信息、手机信息、人脸信息、车辆信息等,同时,国家对个人隐私也是越来越重视,如何加强隐私保护,防范一些系统截图包含隐私信息流传问题亟需解决。
3.现如今各种应用系统展示和截图时无法支持自动隐藏人员姓名、身份证、手机、人脸图片、车辆图片、一些字典敏感文字信息,难免会造成截图泄露敏感信息;若对截图上的敏感文字信息进行人工脱敏,对于特定条件下需要对数据内容和数据来源信息进行还原则难以实现。


技术实现要素:

4.为了解决现有技术中无法自动实现对网页截图的自动脱敏处理并在特定条件下的还原问题,本发明提出了一种用于网页截图的脱敏、还原方法和系统,用以解决上述技术问题。
5.根据本发明的第一方面,提出了一种用于网页截图的脱敏方法,包括:
6.s1:递归遍历网页中所有元素,获取包括元素文本信息和坐标信息的文本信息集合;
7.s2:利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对元素文本信息进行敏感信息匹配,获取敏感信息集合;
8.s3:对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,并构建文本图片替换信息集合;
9.s4:对原始图片进行人脸和车辆识别检测,分别得到包括人脸位置坐标的人脸信息集合和车牌位置坐标车辆信息集合,并分别对脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至替换信息集合中;
10.s5:利用随机生成的密钥生成二维码图片替换初始脱敏图片的一边角像素,输出最终脱敏图片,并利用密钥对替换信息集合进行加密生成与脱敏图片对应的数据加密文件。
11.在一些具体的实施例中,步骤s3具体包括:
12.根据敏感信息集合的坐标信息对原始图片将对应位置区域像素使用r、g、b值均为255的白值填充,生成中间图片;
13.对中间图片进行ocr识别,获取包括文本信息和坐标信息的ocr识别集合;
14.利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对ocr识别集合进
行敏感信息匹配,并更新补充至敏感信息集合中。凭借该步骤可以进一步利用ocr识别敏感文本,避免遗漏。
15.在一些具体的实施例中,步骤s3中脱敏文本图片的获取具体包括以下步骤:
16.根据敏感信息集合的坐标信息对原始图片进行遍历,获取集合中每一个对应坐标位置的像素区域,并提取像素区域的背景;
17.利用与敏感信息集合的文本长度信息生成替代内容文本,替代内容文本将敏感信息集合的文本替换为其他文本标识;
18.结合内容文本和背景填充至对应的敏感信息的像素区域内。
19.在一些具体的实施例中,步骤s5具体包括生成随机128位密钥,并将128位密钥生成100*100的二维码图片,利用二维码图片替换初始脱敏图片的右下角像素,生成最终脱敏图片,并将被替换下的右下角像素内容加入替换信息集合中。凭借该步骤可以再脱敏图片中形成用于解密的二维码密钥信息,便于在特定情况下进行脱敏图片的还原。
20.根据权利要求1的用于网页截图的脱敏方法,还包括对最终脱敏图片进行sha256提取图片摘要信息,利用密钥对替换信息集合、生成时间、客户端ip、mac地址和图片摘要信息进行加密生成数据加密文件。
21.根据本发明的第二方面,提出了一种用于网页截图的脱敏还原方法,包括输入如上述脱敏方法中生成的最终脱敏图片和数据加密文件,还包括:
22.识别最终脱敏图片上的二维码获得密钥,利用密钥对数据加密文件进行解密获得替换信息集合和图片摘要信息;
23.对最终脱敏图片进行sha256提取摘要信息,响应与摘要信息与解密获得的图片摘要信息一致,遍历替换信息集合的每个替换数据填充最终脱敏图片上对应位置区域,还原图片信息。
24.根据本发明的第三方面,提出了一种计算机可读存储介质,其上存储有一或多个计算机程序,该一或多个计算机程序被计算机处理器执行时实施上述方法。
25.根据本发明的第四方面,提出了一种用于网页截图的脱敏系统,包括
26.文本信息获取单元:配置用于递归遍历网页中所有元素,获取包括元素文本信息和坐标信息的文本信息集合;
27.敏感信息集合获取单元:配置用于利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对元素文本信息进行敏感信息匹配,获取敏感信息集合;
28.文本脱敏单元:配置用于对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,并构建文本图片替换信息集合;
29.人脸和车辆脱敏单元:配置用于对原始图片进行人脸和车辆识别检测,分别得到包括人脸位置坐标的人脸信息集合和车牌位置坐标车辆信息集合,并分别对脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至替换信息集合中;
30.最终脱敏图片生成单元:配置用于利用随机生成的密钥生成二维码图片替换初始脱敏图片的一边角像素,输出最终脱敏图片,并利用密钥对替换信息集合进行加密生成与脱敏图片对应的数据加密文件。
31.在一些具体的实施例中,敏感信息集合获取单元还配置包括根据敏感信息集合的坐标信息对原始图片将对应位置区域像素使用r、g、b值均为255的白值填充,生成中间图片;对中间图片进行ocr识别,获取包括文本信息和坐标信息的ocr识别集合;利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对ocr识别集合进行敏感信息匹配,并更新补充至敏感信息集合中。
32.根据本发明的第五方面,提出了一种用于网页截图的脱敏还原系统,包括如上述脱敏系统中生成的最终脱敏图片和数据加密文件,还包括:
33.解析单元:配置用于识别最终脱敏图片上的二维码获得密钥,利用密钥对数据加密文件进行解密获得替换信息集合和图片摘要信息;
34.脱敏图片还原单元:配置用于对最终脱敏图片进行sha256提取摘要信息,响应与摘要信息与解密获得的图片摘要信息一致,遍历替换信息集合的每个替换数据填充最终脱敏图片上对应位置区域,还原图片信息。
35.本发明提出了一种用于网页截图的脱敏方法,利用正则匹配敏感信息,通过ocr进一步识别文本敏感信息实现对网页截图中文本的全面识别,避免敏感信息泄露,再通过人脸识别和车辆车牌识别对截图中的相关人脸和车牌进行马赛克处理,避免敏感信息泄露,利用图片像素替换的方式在脱敏图片中植入包含随机生成密钥的二维码,并将被植入区域进一步加入至替换集合中,在特殊情况需还原时,可以借助二维码对数据加密文件进行解密并对应将替换数据替换至相应位置的图片上最终实现脱敏图片的还原。
附图说明
36.包括附图以提供对实施例的进一步理解并且附图被并入本说明书中并且构成本说明书的一部分。附图图示了实施例并且与描述一起用于解释本发明的原理。将容易认识到其它实施例和实施例的很多预期优点,因为通过引用以下详细描述,它们变得被更好地理解。通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本技术的其它特征、目的和优点将会变得更明显:
37.图1是根据本技术的一个实施例的用于网页截图的脱敏方法流程图;
38.图2是根据本技术的一个具体的实施例的用于网页截图的脱敏方法流程图;
39.图3是根据本技术的一个实施例的用于网页截图的脱敏还原方法流程图;
40.图4是根据本技术的一个具体的实施例的用于网页截图的脱敏还原方法流程图;
41.图5是根据本技术的一个实施例的用于网页截图的脱敏系统的框架图;
42.图6是根据本技术的一个实施例的用于网页截图的脱敏还原系统的框架图;
43.图7是适于用来实现本技术实施例的电子设备的计算机系统的结构示意图;
44.图8是根据本技术的一个具体的实施例的应用界面图。
具体实施方式
45.下面结合附图和实施例对本技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
46.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相
互组合。下面将参考附图并结合实施例来详细说明本技术。
47.根据本技术的一个实施例的基于图像的眼动追踪方法,图1示出了根据本技术的一个实施例的用于网页截图的脱敏方法流程图。如图1所示,该方法包括:
48.s101:递归遍历网页中所有元素,获取包括元素文本信息和坐标信息的文本信息集合。利用jquery递归遍历网页中所有元素,jquery选择器基于元素的id、类、类型、属性、属性值等查找(或选择)html元素,jquery选择器允许对html元素组或单个元素进行操作。
49.s102:利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对元素文本信息进行敏感信息匹配,获取敏感信息集合。
50.s103:对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,并构建文本图片替换信息集合。
51.在具体的实施例中,还包括利用ocr识别对敏感信息集合进行补充,具体采用以下步骤:
52.根据敏感信息集合的坐标信息对原始图片将对应位置区域像素使用rgb(255,255,255)的白值填充,生成中间图片;
53.对中间图片进行ocr识别,获取包括文本信息和坐标信息的ocr识别集合;
54.利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对ocr识别集合进行敏感信息匹配,并更新补充至敏感信息集合中。
55.通过ocr识别对图片中的敏感信息进行识别补充,能够避免步骤s101中无法识别到的敏感信息,例如存在于图片中的文字信息等,避免该类敏感信息泄露。
56.在具体的实施例中,对敏感文本替换具体可以采用以下方式:
57.根据敏感信息集合的坐标信息对原始图片进行遍历,获取集合中每一个对应坐标位置的像素区域,并提取像素区域的背景;
58.利用与敏感信息集合的文本长度信息生成替代内容文本,替代内容文本将敏感信息集合的文本替换为其他文本标识,例如替换为文本长度相当的xxx;
59.结合内容文本和背景填充至对应的敏感信息的像素区域内。
60.s104:对原始图片进行人脸和车辆识别检测,分别得到包括人脸位置坐标的人脸信息集合和车牌位置坐标车辆信息集合,并分别对脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至替换信息集合中。通过对人脸和车辆的识别,将截图中的人脸和车辆车牌作马赛克处理,避免泄露个人信息。
61.s105:利用随机生成的密钥生成二维码图片替换初始脱敏图片的一边角像素,输出最终脱敏图片,并利用密钥对替换信息集合进行加密生成与脱敏图片对应的数据加密文件。该步骤中通过二维码图片的植入替换生成最终的脱敏图片,数据加密文件中存在替换信息集合可用于在特定情况下对最终脱敏图片进行还原。
62.在具体的实施例中,生成随机128位密钥,并将128位密钥生成100*100的二维码图片,利用二维码图片替换初始脱敏图片的右下角像素,生成最终脱敏图片,并将被替换下的右下角像素内容加入替换信息集合中。对最终脱敏图片进行sha256提取图片摘要信息,利用密钥对替换信息集合、生成时间、客户端ip、mac地址和图片摘要信息进行加密生成数据加密文件。
63.继续参考图2,图2示出了根据本技术的一个具体的实施例的用于网页截图的脱敏
方法流程图,如图2所示,该方法包括:
64.步骤201:带敏感信息网页页面。输入带敏感信息网页页面。
65.步骤202:使用jquery递归遍历所有元素。获取元素文本信息【t】、坐标位置【x】、坐标位置【y】、元素宽【w】、元素高【h】;得到文本信息集合【ts】。
66.步骤203:对文本【t】使用正则表达式匹配(身份证、姓名、手机号、住址、特殊文字等)是否敏感信息匹配。若匹配则进入步骤204,否则结束。
67.步骤204:记录敏感信息元素的文本信息【t】、坐标位置【x】、坐标位置【y】、元素宽【w】、元素高【h】;得到敏感信息集合【ms】。
68.步骤205:使用html2canvas插件对当前页面进行截图得原始图片【ri】。
69.步骤206:根据敏感信息集合[ms],对图片[ri]把对应位置区域像素使用rgb(255,255,255)填充,生成中间图片【ri2】。
[0070]
步骤207:对图片【ri2】进行ocr识别,识别得到文本信息【t】、坐标位置【x】、坐标位置【y】、元素宽【w】、元素高【h】,记录得到集合ocr识别集合【ocrs】。
[0071]
步骤208:判断对【ocrs】集合每个文本【t】使用正则表达式匹配(身份证、姓名、手机号、住址、特殊文字等)是否敏感信息匹配。若匹配则进入步骤209,若不匹配则结束。
[0072]
步骤209:补充到敏感信息集合【ms】。将ocr识别到的敏感信息补充更新至敏感信息集合【ms】中避免图片中敏感信息的遗漏处理。
[0073]
步骤210:对图片【ri】进行人脸识别检测,识别出人脸位置【x】,位置【y】,宽【w】,高【h】;得到人脸信息集合【fs】。
[0074]
步骤211:对图片【ri】进行车辆识别检测,识别出车牌位置【x】,位置【y】,宽【w】,高【h】;得到车辆信息集合【cs】。
[0075]
步骤212:根据敏感信息集合【ms】,对图片【ri】进行遍历集合信息每一个对应坐标位置【x】、位置【y】、元素宽【w】、元素高【h】的像素区域进行背景提取【bi】,使用文本【t】长度进行生成(xxx)内容文本【mt】,再对【bi】和文本【mt】进行合成然后填充到敏感信息位置【x】、【y】、【w】、【h】,遍历结束得到脱敏感文本图片【mti】,同时构建文本图片替换信息集合【ris】内容(坐标【x】、坐标【y】、宽【w】、高【h】、像素数组【ps】)。
[0076]
步骤213:根据人脸信息集合【fs】,对图片【mti】进行遍历集合每一个人脸对应坐标位置【x】、位置【y】、元素宽【w】、元素高【h】的像素区进行马赛克处理,遍历结束得到人脸处理图片【mfi】,同时,将人脸图片替换信息补充到集合【ris】内容(坐标【x】、坐标【y】、宽【w】、高【h】、像素数组【ps】)。
[0077]
步骤214:根据车牌信息集合【cs】,对图片【mfi】进行遍历集合每一个车牌对应坐标位置【x】、位置【y】、元素宽【w】、元素高【h】的像素区进行马赛克处理,遍历结束得到车牌处理图片【mci】,同时,将车牌图片替换信息补充到集合【ris】内容(坐标【x】、坐标【y】、宽【w】、高【h】、像素数组【ps】)。
[0078]
步骤215:生成随机128位密钥【k】,将k生成100*100的二维码图片【qi】,将【qi】替换图片【mci】的右下脚像素,生成最终脱敏图片【moi】,同时,将右下加替换图片信息内容(坐标【x】、坐标【y】、宽【w】、高【h】、像素数组【ps】)加入到集合【ris】。
[0079]
步骤216:对图片【moi】进行sha256提取摘要【sha】。
[0080]
步骤217:使用密钥【k】对集合【ris】、生成时间【ts】、生成客户端【ip】、生成客户端
【mac】、图片摘要信息【sha】进行加密生成数据加密文件【mdf】。
[0081]
步骤218:输出返回脱敏截图图片【moi】和数据加密文件【mdf】。
[0082]
通过上述脱敏方法可以实现各种应用系统展示和截图时自动隐藏人员姓名、身份证、手机、人脸图片、车辆图片、一些字典敏感文字信息,避免截图泄露敏感信息。
[0083]
继续参考图3,图3示出了根据本技术的一个实施例的用于网页截图的脱敏还原方法流程图,如图3所示,在如图1的脱敏方法所生成的脱敏图片和数据加密文件的基础上,该脱敏还原方法包括以下步骤:
[0084]
s301:识别最终脱敏图片上的二维码获得密钥,利用密钥对数据加密文件进行解密获得替换信息集合和图片摘要信息。
[0085]
s302:对最终脱敏图片进行sha256提取摘要信息,响应与摘要信息与解密获得的图片摘要信息一致,遍历替换信息集合的每个替换数据填充最终脱敏图片上对应位置区域,还原图片信息。在保证摘要信息一致的前提下提取替换信息集合中的替换数据对脱敏图片进行还原,保证还原结果的准确有效。
[0086]
图4示出了根据本技术的一个具体的实施例的用于网页截图的脱敏还原方法流程如,如图4所示,对图2的脱敏方法获得的脱敏截图图片【moi】和数据加密文件【mdf】进行脱敏还原,包括以下步骤:
[0087]
步骤401:输入脱敏截图图片【moi】和数据加密文件【mdf】。
[0088]
步骤402:识别图片【moi】右下脚二维码,得到密钥【k】。
[0089]
步骤403:使用密钥【k】对加密文件【mdf】进行解密,得到解密内容图片替换集合【ris】、生成时间【ts】、生成客户端【ip】、生成客户端【mac】、图片摘要信息【sha】。
[0090]
步骤404:对图片【moi】进行sha256提取摘要【sha2】。
[0091]
步骤405:比较【sha】和【sha2】是否一致。
[0092]
步骤406:对图片【moi】使用图片替换集合【ris】遍历每一个替换数据消息(坐标【x】、坐标【y】、宽【w】、高【h】、像素数组【ps】)去填充覆盖【moi】对应位置,得到还原图片信息【ri】。
[0093]
上述脱敏还原方法针对上文中的脱敏方法进行脱敏图片的还原,在特定条件下,如相关单位需要取证时可以对于该类脱敏图片进行还原,通过对图片上的二维码进行识别获取相应的密钥,并利用特定的解密算法对数据加密文件进行解密,获得替换集合、生成时间、客户端ip、客户端mac地址和图片摘要信息,利用图片摘要信息作为进一步验证的条件,若一致则利用替换集合中的替换数据对脱敏图片进行填充覆盖进而还原获得图片原始信息。
[0094]
继续参考图5,图5示出了根据本技术的一个实施例的用于网页截图的脱敏系统的框架图。该系统具体包括文本信息获取单元501、敏感信息集合获取单元502、文本脱敏单元503、人脸和车辆脱敏单元504以及最终脱敏图片生成单元。其中,文本信息获取单元501配置用于递归遍历网页中所有元素,获取包括元素文本信息和坐标信息的文本信息集合;敏感信息集合获取单元502配置用于利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对元素文本信息进行敏感信息匹配,获取敏感信息集合;文本脱敏单元503配置用于对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,并构建文本图片替换信息集合;人脸和车辆脱敏单元
504配置用于对原始图片进行人脸和车辆识别检测,分别得到包括人脸位置坐标的人脸信息集合和车牌位置坐标车辆信息集合,并分别对脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至替换信息集合中;最终脱敏图片生成单元505配置用于利用随机生成的密钥生成二维码图片替换初始脱敏图片的一边角像素,输出最终脱敏图片,并利用密钥对替换信息集合进行加密生成与脱敏图片对应的数据加密文件。
[0095]
在具体的实施例中,敏感信息集合获取单元502还配置包括根据敏感信息集合的坐标信息对原始图片将对应位置区域像素使用r、g、b值均为255的白值填充,生成中间图片;对中间图片进行ocr识别,获取包括文本信息和坐标信息的ocr识别集合;利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对ocr识别集合进行敏感信息匹配,并更新补充至敏感信息集合中。
[0096]
图6示出了根据本技术的一个实施例的用于网页截图的脱敏还原系统的框架图,该系统包括,解析单元601和脱敏图片还原单元602,其中,解析单元601配置用于识别如图5中的脱敏系统生成的最终脱敏图片上的二维码获得密钥,利用密钥对数据加密文件进行解密获得替换信息集合和图片摘要信息;脱敏图片还原单元602配置用于对最终脱敏图片进行sha256提取摘要信息,响应与摘要信息与解密获得的图片摘要信息一致,遍历替换信息集合的每个替换数据填充最终脱敏图片上对应位置区域,还原图片信息。
[0097]
下面参考图7,其示出了适于用来实现本技术实施例的电子设备的计算机系统700的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
[0098]
如图7所示,计算机系统700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram 703中,还存储有系统700操作所需的各种程序和数据。cpu 701、rom 702以及ram 703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。
[0099]
以下部件连接至i/o接口705:包括键盘、鼠标等的输入部分706;包括诸如液晶显示器(lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
[0100]
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(cpu)701执行时,执行本技术的方法中限定的上述功能。需要说明的是,本技术的计算机可读存储介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上
的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd

rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读存储介质,该计算机可读存储介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0101]
可以以一种或多种程序设计语言或其组合来编写用于执行本技术的操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0102]
附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0103]
描述于本技术实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。
[0104]
作为另一方面,本技术还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:递归遍历网页中所有元素,获取包括元素文本信息和坐标信息的文本信息集合;利用包括身份证、姓名、手机号、住址和特殊文字的正则表达式对元素文本信息进行敏感信息匹配,获取敏感信息集合;对当前网页截图获取原始图片,根据敏感信息集合生成文本替代图片将对应坐标位置区域的敏感文本替换,获取脱敏文本图片,并构建文本图片替换信息集合;对原始图片进行人脸和车辆识别检测,分别得到包括
人脸位置坐标的人脸信息集合和车牌位置坐标车辆信息集合,并分别对脱敏文本图片中的人脸图片和车牌图片进行马赛克处理,获取初始脱敏图片,将人脸图片和车牌图片补充至替换信息集合中;利用随机生成的密钥生成二维码图片替换初始脱敏图片的一边角像素,输出最终脱敏图片,并利用密钥对替换信息集合进行加密生成与脱敏图片对应的数据加密文件。
[0105]
图8示出了根据本技术的一个具体的实施例的应用界面图,如图8所示,录入脱敏网页地址后,点击执行脱敏就可以在下方界面生成原始网页展示内容和脱敏图片展示内容,使用者可以直接下载脱敏图片和脱敏数据加密文件,在特定条件下,相关人员可以借助脱敏数据加密文件对脱敏图片进行还原,同时也能够追溯数据来源。
[0106]
以上描述仅为本技术的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本技术中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本技术中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1