一种试卷图像文件处理方法及存储介质

文档序号:33396029发布日期:2023-03-08 13:28阅读:27来源:国知局
一种试卷图像文件处理方法及存储介质

1.本发明涉及图像压缩技术领域,特别涉及一种试卷图像文件处理方法及存储介质。


背景技术:

2.当前学校的期中考试和期末考试的形式可以分为线上考试形式和线下考试形式两种。线下考试形式为学生集中在考场并进行考试答题和提交答卷。线上考试形式通常为学生通过互联网或者考试指定的客户端验证身份信息,之后获取学校方上传的考试试题,并在事先打印好的答题卡上进行作答;当考试时间结束时,将答题卡进行扫描为图片并上传至客户端,进而完成考试的提交。答题卡通常为统一的答题卡。另外,如答题卡、试卷等考试信息为隐私信息,其在传输的过程中需要保证一定的安全性,即要防止其在传输过程中遭受到信道攻击和明文窃取。
3.目前,学校方通常通过传输网络将扫描好的试题图像传输给学生方,学生方完成答题后通过传输网络将扫描好的答题卡图像传输至学校方,进而完成整个考试流程。然而,由于试卷图像并未进行加密操作,在其传输的过程中容易遭到外部攻击,导致试卷图像泄露。再者,在图像传输时,可能会出现在同一时间点大量图像上传的情况。面对大量的图像数据,传输网络无法处理庞大的数据量,进而导致传输网络崩溃,试卷图像文件无法正常传输给学生方或学校方。


技术实现要素:

4.本发明的目的是提供一种试卷图像文件方法及存储介质,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
5.本发明解决其技术问题的解决方案是:第一方面,本技术提供一种试卷图像文件处理方法,包括如下步骤:
6.接收来自发起端的试卷图像,通过图像分割模型提取所述试卷图像中的特定区域和非特定区域;
7.检测传输网络的网络通畅率,根据网络通畅率计算所述传输网络的传输数据量阈值;
8.当所述试卷图像的文件数据量大于所述传输数据量阈值时,通过神经网络模型对所述特定区域进行压缩,得到特定压缩区域,并通过混沌迭代算法对所述特定压缩区域进行加密,得到第一图像压缩信号;
9.通过压缩感知技术对所述非特定区域进行压缩,得到第二图像压缩信号;
10.将所述第一图像压缩信号和所述第二图像压缩信号一并传输至目标端。
11.进一步地,所述通过图像分割模型提取所述目标图像中的特定区域和非特定区域,包括:
12.通过云端获取若干个历史试卷图像并构成图像分割数据集,所述云端存储有若干
个历史试卷图像;
13.其中,所述历史试卷图像中均包含有特定区域和非特定区域;
14.从所述图像分割数据集中循环抽取每个历史试卷图像作为测试集,样本中其余历史试卷图像作为训练集;
15.以非特定区域为模型参数,对所述训练集采用深度学习的方法进行模型训练,得到各个图像分割模型;
16.采用测试集对各个图像分割模型进行测试,得到各个图像分割模型的测试结果;
17.根据各个图像分割模型的测试结果,得到最终图像分割模型的性能指标;
18.采用最终图像分割模型对所述目标图像进行特定区域和非特定区域的分割。
19.进一步地,所述神经网络模型由深度卷积编码器、特征提取层和码率分配层构成,所述深度卷积编码器由一层输入层、归一化层、两个输出通道不同的卷积层、残差网络和输出层,所述输出层与所述特征提取层的输入连接;
20.所述深度卷积编码器用于对所述特定区域进行压缩编码,得到潜在表示特征,所述特征提取层用于提取重要性图,所述重要性图与所述潜在标识特征一并构成掩码,所述码率分配层用于通过掩码进行码率分配,得到特定压缩区域。
21.进一步地,所述通过神经网络模型对所述特定区域进行压缩,得到特定压缩区域,包括:
22.通过云端获取若干个历史试卷图像,预处理所述历史试卷图像,获得样本特定区域图像;
23.确定所述样本特定区域图像的感兴趣区域和非感兴趣区域,循环抽取若干个预处理后的所述样本特定区域图像分别作为高码率模型训练集、低码率模型训练集和压缩测试集;
24.以所述感兴趣区域作为模型参数,分别通过高码率模型训练集、低码率模型训练集对所述神经网络模型进行模型训练,得到高码率压缩模型和低码率压缩模型;
25.采用所述压缩测试集分别对所述高码率压缩模型和所述低码率压缩模型进行测试,得到高码率压缩模型和低码率压缩模型的测试结果;
26.根据高码率压缩模型和低码率压缩模型的测试结果,确定最终高码率压缩模型和最终低码率压缩模型的性能指标;
27.采用最终高码率压缩模型对所述特定区域的感兴趣区域进行压缩,采用低码率压缩模型对所述特定区域的非感兴趣区域进行压缩,得到所述特定压缩区域。
28.进一步地,所述通过混沌迭代算法对所述特定压缩区域进行加密,得到第一图像压缩信号,包括:
29.获取发起端的身份特征信息,将所述身份特征信息与所述特定压缩区域融合形成第一密钥,通过所述第一密钥生成混沌序列;
30.通过所述混沌序列构建偏移矩阵和置换矩阵;
31.对所述特定压缩区域进行小波变换,得到平滑版本的所述特定压缩区域的系数矩阵;
32.通过所述偏移矩阵改变所述系数矩阵中的小波系数值,得到第一矩阵;
33.通过所述置换矩阵对所述第一矩阵进行排列变换,得到第二矩阵;
34.将所述第二矩阵替换所述系数矩阵,对替换后的系数矩阵进行逆小波变换,得到第一图像压缩信号;
35.其中,所述逆小波变换为:y1为第一图像压缩信号,a为替换后的系数矩阵,tw为逆小波变换系数。
36.进一步地,所述通过所述第一密钥生成混沌序列,包括:
37.构建混沌系统和chebyshev映射;
38.所述混沌系统为:
[0039][0040]
所述chebyshev映射满足:
[0041]
τ(x
j+1
)=cos(n(cos-1
x(n+1))
[0042]
其中,定义区间为(-1,1);
[0043]
计算所述特定压缩区域的信息熵,通过所述信息熵和所述第一密钥计算所述混沌系统的参数和初始值;所述参数和所述初始值为:
[0044][0045]
其中,δ为混沌系统的参数,x(1)为初始值,mod表示取模运算,a1、a2、a3、a4为所述第一密钥,h为信息熵;a1、a2、a3、a4∈(0,+

);
[0046]
将所述初始值和所述参数代入至所述混沌系统中,结合所述chebyshev映射迭代若干次后生成所述混沌序列。
[0047]
进一步地,所述通过所述混沌序列构建偏移矩阵和置换矩阵,包括:
[0048]
构建空值矩阵r,所述空值矩阵r中可包含的元素数量的阈值为n1;
[0049]
将所述混沌序列中的元素依次填入至空值矩阵r中,直至空值矩阵r的元数数量等于阈值n1,将空值矩阵r记作置换矩阵;
[0050]
定义偏移阈值,通过所述偏移阈值对所述置换矩阵进行偏移,得到所述偏移矩阵;所述偏移矩阵满足:r

=ρ
×
r,其中ρ为偏移阈值,r

为偏移矩阵。
[0051]
进一步地,所述通过压缩感知技术对所述非特定区域进行压缩,得到第二图像压缩信号,包括:
[0052]
构建字典和优化问题,通过所述字典和求解所述优化问题分别对所述非特定区域进行稀疏表示,所述优化问题为:
[0053]
α*=arg min||α||0[0054]
受f(x,y)=αβ约束;
[0055]
其中,β为字典,f(x,y)表示所述所述非特定区域;
[0056]
在所述稀疏表示的过程中,通过求解如下约束问题,从所述字典中找寻最佳线性组合的原子,来逼近所述非特定区域:
[0057]
min||α||0[0058]
受约束如下:其中||α||0为系数序列{αk}中的非零项的个数;
[0059]
通过稀疏因子来量度稀疏表示后的所述非特定区域的稀疏性,当所述稀疏性大于稀疏性阈值时,重新执行以上步骤;
[0060]
当所述稀疏性小于或等于所述稀疏性阈值时,构建观测矩阵,通过所述观测矩阵对稀疏表示后的所述非特定区域进行随机观测,观测后得到第二图像压缩信号。
[0061]
进一步地,所述方法还包括:当所述试卷图像的文件数据量小于或等于所述传输数据量阈值时,通过所述混沌迭代算法对所述特定区域进行加密,得到加密后的所述特定区域,并将其与所述非特定区域一并传输至目标端。
[0062]
另一方面,本技术提供了一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序被处理器执行时用于实现所述的一种试卷图像文件处理方法。
[0063]
本发明的有益效果是:提供一种试卷图像文件方法及存储介质,根据传输网络的网络通畅情况,对试卷图像的特定区域和非特定区域进行不同的加密和压缩处理,能够提高考试时图像文件传输的效率和速率,确保了图像文件在传输过程中的安全性,并且在网络阻塞的情况下仍旧能够保证图像文件的传输。
[0064]
本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
[0065]
附图用来提供对本技术技术方案的进一步理解,并且构成说明书的一部分,与本技术的实施例一起用于解释本技术的技术方案,并不构成对本技术技术方案的限制。
[0066]
图1为本技术实施例提供的一种试卷图像文件处理方法的流程示意图;
[0067]
图2为本技术实施例提供的通过图像分割模型提取特定区域和非特定区域的流程示意图;
[0068]
图3为本技术实施例提供的神经网络模型的结构示意图;
[0069]
图4为本技术实施例提供的加密特定压缩区域的流程示意图;
[0070]
图5为本技术实施例提供的图像处理过程的流程图。
具体实施方式
[0071]
为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
[0072]
下面结合说明书附图和具体的实施例对本技术进行进一步的说明。所描述的实施例不应视为对本技术的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
[0073]
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0074]
除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的
技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
[0075]
对本技术实施例进行进一步详细说明之前,对本技术实施例中涉及的名词和术语进行说明,本技术实施例中涉及的名词和术语适用于如下的解释。
[0076]
(1)压缩感知(compressed sens ing),一种信号处理技术,只需要在确保信号在某个域为可稀释便可以通过压缩感知技术进行压缩。压缩感知技术本质上为通过矩阵与矩阵或者矩阵与向量之间的乘法运算,达到矩阵降维的目的。同时,压缩感知技术可以实现对信号进行压缩的同时保证信号的信息安全性,可以将其用于各种信号的传输应用领域来实现信号的高校及安全运输。
[0077]
(2)图像分割(image segmentat ion),图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分以下几类:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。
[0078]
(3)混沌加密,主要是利用由混沌系统迭代产生的序列,作为加密变换的一个因子序列。混沌加密的理论依据是混沌的自相似性,使得局部选取的混沌密钥集,在分布形态上都与整体相似。混沌系统对初始状态高度的敏感性,复杂的动力学行为,分布上不符合概率统计学原理,是一种拟随机的序列,其结构复杂,可以提供具有良好的随机性、相关性和复杂性的拟随机序列,使混沌系统难以重构、分析和预测。
[0079]
目前,学校的期中考试和期末考试的形式可以分为线上考试形式和线下考试形式两种。线下考试形式为学生集中在考场并进行考试答题和提交答卷。线上考试形式通常为学生通过互联网或者考试指定的客户端验证身份信息,之后获取学校方上传的考试试题,并在事先打印好的答题卡上进行作答;当考试时间结束时,将答题卡进行扫描为图片并上传至客户端,进而完成考试的提交。答题卡通常为统一的答题卡。另外,如答题卡、试卷等考试信息为隐私信息,其在传输的过程中需要保证一定的安全性,即要防止其在传输过程中遭受到信道攻击和明文窃取。
[0080]
图像文件传输过程通常为:从发起端输入图像信息源;对信息源进行预处理;对图像信源进行编码;信道编码和调制;进行信道传输给目标端;解调并进行信道解码;对图像信源进行解码;在目标端显示图像。然而,在实际的图像文件传输过程中,由于在同一时间段若干个学生同时上传其对应的答题卡图片,增加信道传输的压力,传输网络的数据负担较大,导致传输网络的传输效率和速度较低。同时,进行图像通信时将会占用大量系统存储资源,对计算机执行图像处理的要求较高,不便于传输和存储。在本领域中,通常将需要传输的图像文件进行压缩,将压缩后的图像文件进行传输和存储,之后目标端接收到图像文件后对其进行还原。这样能够降低图像文件传输时的信道占用率和数据负担。
[0081]
近年来,jpeg和jpeg2000压缩算法兴起。jpeg算法是一种常见的图像压缩编码算法,主要分为两种形式:基于dct的有损压缩算法和基于dpcm的无损压缩算法。其原理是利用dct将图像从空间域转换到频率域,在频率域对图像进行压缩编码。而jpeg2000算法则是jpeg的改进算法,其能够获得更高的压缩比,同时支持无损压缩和有损压缩,能够在保证图像质量的前提下实现不同分辨率的图像压缩。然而,不论是jpeg还是jpeg2000,都会存在模糊失真的问题,解码时无法获得原本的图像。若使用jpeg或者jpeg2000来压缩试卷图像,则
可能会出现试卷图像无法复原的情况,进而影响学生的
[0082]
为了解决上述问题,本技术提供了一种试卷图像文件处理方法及存储介质,适用于试卷图像的传输。试卷图像可以包括但不限于试题图像和答题图像。参照图1所示,下面将以答题图像作为试卷图像对本技术的技术方案进行说明和阐述。本技术提供的图像文件处理方法可以包括但不限于以下步骤。
[0083]
100,接收试卷图像,通过图像分割模型提取试卷图像中的特定区域和非特定区域。
[0084]
本步骤中,当试卷图像为答题图像,答题图像的特定区域为学生作答区域,而非特定区域为固定的非作答区域。可以理解为,每个学生所使用的答题卡均为同一格式的答题卡,非特定区域是相同的。而由于每个学生的作答不同,特定区域也会不同。在本技术的另一实施例中,当试卷图像为试题图像时,试题图像的特定区域为考试试题区域,而非特定区域为非考试试题区域。
[0085]
需要说明的是,图像分割模型为预先训练好的神经网络模型。
[0086]
200,检测传输网络的网络通畅率,根据网络通畅率计算传输网络的传输数据量阈值。
[0087]
需要说明的是,网络通畅率通过每分钟接收的字节数来衡量。传输数据量阈值可以根据实际情况而定,本技术对其不作具体限定。
[0088]
300,当试卷图像的文件数据量大于传输数据量阈值时,通过神经网络模型对特定区域进行压缩,得到特定压缩区域,并通过混沌迭代算法对特定压缩区域进行加密,得到第一图像压缩信号;
[0089]
400,通过压缩感知技术对非特定区域进行压缩,得到第二图像压缩信号;
[0090]
500,将第一图像压缩信号和第二图像压缩信号一并传输至目标端。
[0091]
以上步骤中,当文件数据量大于其传输量阈值时,则说明传输图像文件时可能会出现网络阻塞的情况,属于异常情况。为了保证图像传输的流畅性,同时又不丢失试卷图像中的重要区域,本技术将试卷图像分割为特定和非特定两个区域,采用不同的压缩方式对这两个区域进行压缩处理。并且,对特定区域进行加密处理,即对学生作答的区域进行加密处理,以保证学生作答的区域不会被泄露。压缩和加密处理后的特定区域和压缩处理后的非特定区域等同于压缩处理后的试卷图像。而当文件数据量小于或等于传输量阈值时,则说明此时传输网络不会出现阻塞的情况,属于正常状态。此时,仅需对特定区域进行加密处理后,与非特定区域一并传输即可。
[0092]
另外,本技术提供的试卷图像文件处理方法还包括:
[0093]
600,当试卷图像的文件数据量小于或等于传输数据量阈值时,通过混沌迭代算法对特定区域进行加密,得到加密后的特定区域并与非特定区域一并传输至目标端。
[0094]
本步骤中,当文件数据量未大于其传输量阈值时,则说明传输图像文件时,出现网络阻塞的可能性极小,属于正常情况。在此情况下,仅需对特定区域进行加密操作,以保证学生作答的区域不会被泄露。之后,将加密后的特定区域和非特定区域一起传输给目标端,完成图像的传输。
[0095]
参照图2所示,本技术的一个实施例,下面将对步骤100进行说明和阐述。步骤100可以包括但不限于以下步骤。
[0096]
110,通过云端获取若干个历史试卷图像并构成图像分割数据集。
[0097]
需要说明的是,云端存储有若干个历史试卷图像,历史试卷图像中均包含有特定区域和非特定区域。
[0098]
可选地,构成图像分割数据集之前,还包括对若干个历史试卷图像的预处理操作。预处理可以包括但不限于通过中值滤波法去除历史试卷图像中的噪声。图像噪声是图像中孤立的像素点,与周围相邻的像素点存在显著的差异,采用中值滤波法可以平滑图像像素值,有效地消除图像中的噪声,又可以保持图像原有的细节信息。由于云端中所获得的历史试卷图像的数量能够满足模型的训练,因此无需进行数据集的扩增。
[0099]
120,从图像分割数据集中循环抽取每个历史试卷图像作为测试集,样本中其余历史试卷图像作为训练集;
[0100]
130,以非特定区域为模型参数,对训练集采用深度学习的方法进行模型训练,得到各个图像分割模型;
[0101]
140,采用测试集对各个图像分割模型进行测试,得到各个图像分割模型的测试结果;
[0102]
150,根据各个图像分割模型的测试结果,得到最终图像分割模型的性能指标。
[0103]
本步骤中,通过评价标准来评判模型的性能指标。评价指标包括dice系数、positive predicted、ppv和敏感度中的一种或多种。
[0104]
dice系数满足:
[0105][0106]
ppv满足:
[0107][0108]
敏感度满足:
[0109][0110]
其中,p表示预测结果,t表示相应的真值。ppv值代表预测的准确率,预测值是真值占总预测值的比例。敏感度代表预测的召回率,预测值是真值占总的真值的比例。而dice系数可以看成是结合ppv和敏感度的综合指标。
[0111]
160,采用最终图像分割模型对目标图像进行特定区域和非特定区域的分割。
[0112]
本实施例实用留一法循环抽取一个历史试卷图像作为测试集,样本中其余历史试卷图像作为训练集输入深度学习模型中训练,然后使用测试集对训练出来的模型进行测试。循环以上过程,直到将每个历史试卷图像均作为测试集一次,最后得到所有测试集的测试结果来计算样本中所有历史试卷图像全部用作训练集时训练出的分类器的性能指标。
[0113]
可选地,深度学习的方法采用深度残差u-net。深度残差u-net是u-net的变式网络,其大致架构与u-net一致。深度残差u-net包含七个基本单元,每个基本单元内含有一个残差网络模块,层与层之间存在短跳跃连接。深度残差u-net融合了残差网络和u-net两者的网络特点,它将u-net的卷积层结构作为网络的基本模块来构建深层网络,并且在u-net
的上采样过程中加入了短跳跃连接,减少了不必要的参数和卷积操作,从而大大地提高了语义分割的性能。
[0114]
其中,深度残差u-net的损失函数满足:
[0115][0116]
本技术的一个实施例,下面将对步骤300中的压缩特定区域的过程进行说明和阐述。神经网络模型的构成如图3所示,神经网络模型的构成为深度卷积编码器、特征提取层和码率分配层。其中:
[0117]
深度卷积编码器包括:输入层、归一化层、残差网络、两层卷积层和输出层。具体地,归一化层用于将输入归一化为[0,1]。两层卷积层分别为第一卷积层和第二卷积层。其中,第一卷积层的卷积核为5、输出通道为64、步长为2,第二卷积层的卷积核为5、输出通道为128及步长为2。输出层连接特征提取层。
[0118]
另外,残差网络由十五个残差块构成,三个残差块构成一组残差模块,每组残差模块嵌入至深度卷积编码器的每一层中。残差网络采用“捷径”的概念,增加了一个恒等映射,这个恒等映射可以将当前层的输出直接传至下一层的网络,能够有效地解决深度卷积编码器梯度消失的问题。定义残差模块的残差函数为:
[0119]
h(xn)=f(xn,wn)+xn[0120]
x
n+1
=re(h(xn))
[0121]
其中,x为残差模块的输入,其网络学习的特征为h(xn)。当f(xn,wn)=0时,特征h(xn)不会归为零,起到了恒等映射的作用。
[0122]
深度卷积编码器的作用是对特定区域压缩编码,得到潜在表示特征z=e(x)。
[0123]
本技术中,人眼视觉对图像中不同区域的感受存在差异。图像中具有显著对象或丰富纹理的区域更容易引起人眼的关注,也就是说人们会更感兴趣。因此,在压缩任务中,应将较少的码率分配给平滑区域,将更多的码率分配给具有复杂结构和细节的区域。这样,在图像重建时,能够使重建出的图像更加清晰,减少图像的失真。本技术的特定区域可以分为感兴趣区域和非感兴趣区域。当试卷图像为答题图像时,特定区域为学生作答的区域。而在学生作答的区域中,可能会存在除去作答答案以外的干扰部分,即不感兴趣的区域。而作答答案则为感兴趣的区域。为了降低非感兴趣区域的码率和提高感兴趣区域的码率,本技术引入特征提取层,特征提取层的作用是提取特定区域中的重要性图,即提取感兴趣区域的特征图。该重要性图只有一个通道的特征图,并且其大小与深度卷积编码器的输出大小相同。重要性图的作用是突显特定区域中的感兴趣区域,并且与潜在表示特征一并构成掩码,用于指导码率分配。这样做能够使得重建的试卷图像减少失真的可能性。
[0124]
具体地,特征提取层与深度卷积编码器的输出层的最后一个残差块连接,将残差块的特征h(xn)作为输入,通过两个添加有注意力机制的卷积层来获得重要性图。这两个卷积层的输出通道数均与第二卷积层的输出通道数相同,其卷积核为5且步长为1。激活函数采用leakyrelu,leakyrelu可以防止大量激活值变为0的现象出现。leakyrelu满足f(x)=max(x,ax)。最终得到大小为h
×
w的重要性图p(x)。重要性图p(x)与输出层所输出的潜在表示特征z=e(x)一起生成掩码m,为码率分配提供指引。
[0125]
码率分配层的作用是通过掩码m进行码率分配,得到特定压缩区域。
[0126]
具体地,在码率分配层中,将重要性图进行元素量化,生成大小为n
×h×
w的重要性掩码。重要性映射的量化器可以定义为:
[0127][0128]
其中:l=1,2,...,l,l为重要性级别;p
ij
∈(0,1);q(p
ij
)则表示只有l种不同的量值:0,1,2,...,l-1。
[0129]
掩码可以通过重要性映射的量化器获取得到。获取得到掩码后,图像最终的特定压缩区域可以表示为:y1=m
°
b(e)。其中,b(e)为潜在表示特征的二值化特征图。
[0130]
基于上述实施例,步骤300中的压缩特定区域的过程可以包括但不限于以下步骤。
[0131]
301,通过云端获取若干个历史试卷图像,预处理历史试卷图像,获得样本特定区域图像。
[0132]
本步骤中,预处理历史试卷图像的主要目的是获得其中的特定区域。预处理的方式可以是通过步骤100中涉及的图像分割模型对历史试卷图像进行分割,进而获得样本特定区域图像。另外,在输入至神经网络模型之前,还需要将样本特定区域图像进行标准化处理。
[0133]
302,确定样本特定区域图像的感兴趣区域和非感兴趣区域,循环抽取若干个预处理后的样本特定区域图像分别作为高码率模型训练集、低码率模型训练集和压缩测试集。
[0134]
由于步骤300的目的是对感兴趣区域给予更多的码率分配,而对于不感兴趣的区域给予更少的码率分配。因此,需要训练两种具有不同码率压缩的图像压缩模型。本步骤中,针对高码率模型的训练,构建高码率模型训练集。对于低码率模型的训练,构建低码率训练集。同时,构建用于测试这两个图像压缩模型性能的测试集。
[0135]
303,以感兴趣区域作为模型参数,分别通过高码率模型训练集、低码率模型训练集对神经网络模型进行模型训练,得到高码率压缩模型和低码率压缩模型。
[0136]
本步骤中,低码率模型的训练参数h_target设定为0.4,参数num_chan_bn为32。高码率模型的训练参数h_target设定为1.0,参数num_chan_bn为64。本技术通过调整训练参数h_target达到调整码率的目的,进而获得具有不同压缩比的模型。
[0137]
304,采用压缩测试集分别对高码率压缩模型和低码率压缩模型进行测试,得到高码率压缩模型和低码率压缩模型的测试结果;
[0138]
305,根据高码率压缩模型和低码率压缩模型的测试结果,确定最终高码率压缩模型和最终低码率压缩模型的性能指标。
[0139]
本步骤中,图像在压缩过程中会产生误差,在编码过程中,图像的误差应控制在一定的范围之内,因此需要度量压缩模型的性能。本技术通过压缩比和峰值信噪比来评估压缩模型的性能。其中:
[0140]
压缩比衡量的是图像压缩前后数据量的变化情况,即计算图像的压缩效率,未压缩之前图像的大小与压缩之后图像大小的比值。压缩比满足:
[0141][0142]
其中,b1和b2分别代表压缩前后图像占用的存储空间。
[0143]
峰值信噪比衡量的是图像压缩重建后信息损失的情况,其衡量标准主要依赖压缩前后两张图像的均方误差。峰值信噪比满足:
[0144][0145][0146]
其中,k代表通道数,m*n代表图像的大小,i(i,j)为压缩前(i,j)位置的像素值,j(i,j)为压缩后(i,j)位置的像素值。psnr越大,代表压缩损失越少。
[0147]
306,采用最终高码率压缩模型对特定区域的感兴趣区域进行压缩,采用低码率压缩模型对特定区域的非感兴趣区域进行压缩,得到特定压缩区域。
[0148]
本步骤中,当试卷图像为答题图像时,特定区域为学生作答的区域。而在学生作答的区域中,可能会存在除去作答答案以外的干扰部分,即不感兴趣的区域。而作答答案则为感兴趣的区域。确定特定区域的感兴趣区域和非感兴趣区域,将深度卷积编码器通过将特定区域映射到潜在表示特征,通过特征提取网路获得重要性图。结合潜在表示特征和重要性图,得到用于指导码率分配的掩码。在码率分配层中,通过掩码指导该层熵编码过程中的码率分配,提高感兴趣区域的码率,降低非感兴趣区域的码率,进而减少图像的失真。
[0149]
作为可选的实施例,神经网络模型还包括解码器。解码器包括:第三卷积层、残差网络、第四卷积层、反归一化层和输出层。第三卷积层的结构和第二卷积层的一致,第四卷积层的结构和第一卷积层的结构一致。解码器中的残差网络和编码器的残差网络的结构一致,并且也是嵌入至每一层当中。反归一化层是归一化层的逆运算。可选地,第一卷积层至第四卷积层所采用的激活函数均为leakyrelu。
[0150]
目标端对第一图像压缩信号进行解密后获得特定压缩区域,之后通过解码器对特定压缩区域进行解码,即可获得恢复的特定区域。
[0151]
本技术的一个实施例,参照图4所示,下面将对压缩后的特定区域进行加密的过程进行说明和阐述。步骤300中,在获得特定压缩区域后,为了保证特定区域传输时的安全性,避免网络传输攻击,需要对特定压缩区域进行加密,以确保其信息安全性。对特定压缩区域进行加密的过程可以包括但不限于以下步骤。
[0152]
获取发起端的身份特征信息,将身份特征信息与特定压缩区域融合形成第一密钥,通过第一密钥生成混沌序列。
[0153]
本步骤中,通过将身份特征信息和特定压缩区域融合,进而得到第一密钥。第一密钥可以作为混沌系统的参数,进而得到混沌序列。这样做的目的是,使得第一密钥不再是随机生成的密钥,其产生过程中与特定压缩区域相关联,将单个明文比特的影响扩散到更多的密文当中去,进而改善了加密效果。通过第一密钥加密所得到的密文不容易遭受明文攻击。
[0154]
可选地,通过hash算法sha256或者神经网络的特征层关联身份特征信息和特定压缩区域。
[0155]
通过混沌序列构建偏移矩阵和置换矩阵。
[0156]
本步骤中,利用混合的混沌序列来产生相应的置换矩阵和偏移矩阵。
[0157]
对特定压缩区域进行小波变换,得到平滑版本的特定压缩区域的系数矩阵。
[0158]
需要说明的是,小波变换是图像的时频表示。其dct是时频不相关的,由于wt的空间分辨率是随着频率增加的,因此对于剧烈变化的边缘有更好的适应性。另外,图像的能量
通常集中在低频,在小波变换中,频率变化率与频率成反比,其允许把低频分解为更加精细的子带。每次小波变换中,特定压缩区域均会被分解为4个子块,其中一个子块对应平滑版本,其他三个子块对应细节版本。如果在小波域内的平滑版本中用图像置乱算法进行置乱,则频域内的每一点变化将对空间域中的整个数据集合产生一定的影响。不仅能够取得很好的置乱效果,而且所需的混沌序列的长度也可以成倍地减小。
[0159]
通过偏移矩阵改变系数矩阵中的小波系数值,得到第一矩阵;
[0160]
通过置换矩阵对第一矩阵进行排列变换,得到第二矩阵;
[0161]
将第二矩阵替换系数矩阵,对替换后的系数矩阵进行逆小波变换,得到第一图像压缩信号。
[0162]
需要说明的是,逆小波变换满足:
[0163][0164]
其中,第一图像压缩信号通过y1来表示。替换后的系数矩阵通过a来表示。逆小波变换系数通过tw来表示。
[0165]
作为可选的实施例,目标端获取第一图像压缩信号后,需要获取正确的密钥,即第一密钥,并对第一图像压缩信号进行加密算法的逆向运算,方可获得特定压缩区域。
[0166]
基于上述实施例,通过第一密钥生成混沌序列可以包括但不限于以下步骤。
[0167]
构建混沌系统和chebyshev映射。混沌系统可以描述为:
[0168][0169]
chebyshev映射是具备良好的非线性动力学特性的1d的混沌映射,当控制参数∈[2,6]时,该映射的lyapunov指数为正数,表明在∈[2,6]的区间范围内,chebyshev映射能够表现出混沌特性。本技术的chebyshev映射可以描述为:
[0170]
τ(x
j+1
)=cos(n(cos-1
x(n+1))
[0171]
定义chebyshev映射的定义区间为(-1,1)。
[0172]
计算第一目标压缩图像的信息熵,通过信息熵和第一密钥计算混沌系统的参数和初始值。
[0173]
需要说明的是,参数δ满足以下公式:
[0174]
δ=mod((h
×
a1+a2×
a3+a4)
×
106,1)
[0175]
初始值x(1)满足以下公式:
[0176]
x(1)=mod((h
×
a1+a2×
a3+a4)106,4)
[0177]
其中:取模运算通过mod来表示。第一密钥通过a1、a2、a3、a4来表示。信息熵通过h来表示。a1、a2、a3、a4∈(0,+

)。
[0178]
将初始值和参数代入至混沌系统中,结合chebyshev映射迭代若干次后生成混沌序列。
[0179]
以上步骤中,混沌系统和chebyshev映射式均可生成混沌序列。对于混沌系统,首先计算压缩特定图像的大小,根据图像大小计算器信息熵。利用信息熵和第一密钥计算混沌系统中的参数和初始值。之后,将参数和初始值代入混沌系统的公式中,生成混沌序列。对于chebyshev映射,通过chebyshev映射式生成混沌序列。本技术使用混沌系统和chebyshev映射式交替生成混合的混沌序列。
[0180]
基于上述实施例,置换矩阵和偏移矩阵的生成过程如下:
[0181]
构建空值矩阵r。
[0182]
需要说明的是,空值矩阵r中可包含的元素数量的阈值通过n1来表示。
[0183]
将所述混沌序列中的元素依次填入至空值矩阵r中,直至空值矩阵r的元数数量等于阈值n1,将空值矩阵r记作置换矩阵。
[0184]
定义偏移阈值,通过偏移阈值对置换矩阵进行偏移,得到偏移矩阵。
[0185]
需要说明的是,偏移矩阵满足以下公式:
[0186]r′
=ρ
×r[0187]
其中,偏移阈值通过ρ来表示,偏移矩阵通过r

来表示。
[0188]
本技术中,置换矩阵满足混沌特性。偏移矩阵的作用是改善小波系数,其也具有混沌特性。
[0189]
本技术的一个实施例,下面将对步骤400的压缩感知技术进行说明和阐述。步骤400可以包括但不限于以下步骤。
[0190]
410,构建字典和优化问题,通过字典和求解优化问题分别对非特定区域进行稀疏表示。
[0191]
本步骤中,压缩感知的前提是图像系数或可压缩。图像在小波域的表示系数中只有少部分较大值,大量系数值都很小,满足压缩感知的前提。因此在进行压缩之前,需要将非特定区域稀疏化。在图像稀疏表示理论中,β为字典。在字典β下对非特定区域进行稀疏表示可以通过求解下述优化问题得到:
[0192]
α*=arg min||α||0[0193]
约束表示如下:f(x,y)=αβ。
[0194]
上述公式中:f(x,y)为非特定区域。
[0195]
本技术中,图像具有丰富的几何和纹理特征,通常要求字典中的原子具备不同的表征能力。因此,在稀疏表示的过程中,字典的设计尤为重要。可选地,字典可以是mcgp字典或者k-svd字典。同时,还需找寻字典中具有最佳线性组合的原子,用于稀疏逼近非特定区域。
[0196]
420,在稀疏表示的过程中,通过求解如下约束问题,从字典中找寻最佳线性组合的原子,来逼近非特定区域:
[0197]
min||α||0[0198]
约束表示如下:
[0199]
上述公式中:系数序列{αk}中的非零项的个数通过||α||0来表示。
[0200]
本技术中,稀疏性是压缩感知的前提。图像经过稀疏表示后,能量更为集中。通过根据表示系数的l0范数或者稀疏因子sf来度量稀疏表示后的所述非特定区域的稀疏性。
[0201]
430,通过稀疏因子来量度稀疏表示后的非特定区域的稀疏性,当稀疏性大于稀疏性阈值时,重新执行以上步骤。
[0202]
本步骤中,给定一稀疏性阈值,稀疏性通过稀疏因子来衡量。稀疏因子越大则稀疏性越差。反之,稀疏性越好。可选地,稀疏性阈值可根据实际情况而定。
[0203]
440,当稀疏性小于或等于稀疏性阈值时,构建观测矩阵,通过观测矩阵对稀疏表示后的非特定区域进行随机观测,观测后得到第二图像压缩信号。
[0204]
本步骤中,观测矩阵对测量值的获取和图像的重建过程起着关键性的作用。它在不丢失主要信息的情况下,准确地重建出原始图像信息。
[0205]
作为可选的实施例,目标端获取第二图像压缩信号后,可通过常见的贪婪算法或者凸松弛法对第二图像压缩信号进行重建,得到非特定区域。可选地,贪婪算法包括匹配跟踪算法、omp算法、正则化omp算法中的任一种。
[0206]
本技术的一个实施例,步骤600中所采用的混沌迭代算法和步骤300的混沌迭代算法一致。本技术对此不再赘述。
[0207]
参照图5所示,下面以一次完整的线上考试为例子对本技术进行举例说明。线上考试可以分为两个过程:一个是学校把试题图像传给学生。这一过程中,发起端为学校端,目标端为学生端。另一个是学生将答题图像上传至云端或者学校。这一过程中,发起端为学生端,目标端为云端或者学校端。
[0208]
第一个过程:首先,学校扫描试卷图像,试卷图像为试题图像,其特定区域为试题部分,非特定区域为非试题部分。通过图像分割模型可将试题图像分为特定区域和非特定区域。在进行图像上传和传输之前,学校方需要录入身份特征信息,如人脸信息或者声纹信息。然后,检测网络通畅率能否支持试卷图像的传输,如果是,则通过混沌迭代算法对试题部分进行加密后,和非试题部分一并传输。如果否,则分别对试题部分和非试题部分进行压缩,之后通过混沌迭代算法对压缩后的试题部分进行加密处理。随后,加密、压缩后的试题部分和压缩后的非试题部分即可传输给目标端。这样做既能保证图像文件的传输速率和效率,又能保证试题部分的安全性和保密性。学生获取压缩后的试题部分和非试题部分,通过压缩感知技术的重构算法对非试题部分进行解压,并通过第一密钥解密得到压缩后的试题部分,再通过神经网络模型的解压器即可获得试题部分。
[0209]
第二个过程:首先,学生扫描试卷图像,试卷图像为答题图像,其特定区域为答题区域,非特定区域为非答题区域。通过图像分割模型可将答题图像分为答题区域和非答题区域。然后,检测网络通畅率能否支持试卷图像的传输,如果是,则通过混沌迭代算法对答题部分进行加密后,和非答题部分一并传输。如果否,则分别对答题部分和非答题部分进行压缩,之后通过混沌迭代算法对压缩后的答题部分进行加密处理。随后,加密、压缩后的答题部分和压缩后的非答题部分即可传输给目标端。这样做既能保证图像文件的传输速率和效率,又能保证答题部分的安全性和保密性。学校方获取压缩后的答题部分和非答题部分,通过压缩感知技术的重构算法对非答题部分进行解压,并通过第一密钥解密得到压缩后的答题部分,再通过神经网络模型的解压器即可获得答题部分。
[0210]
本技术根据传输网络的网络通畅情况,对试卷图像的特定区域和非特定区域进行不同的加密和压缩处理。当网络通畅时,只需对试卷图像中的特定区域进行加密,并将其和非特定区域一并传输给目标端。这样既可以保证特定区域的安全性,又可以实现快速地传输图像文件。当网络不通畅时,通过压缩感知技术压缩非特定区域,减少压缩所需时间;同时通过具有特征提取层的神经网络模型压缩特定区域,根据特定区域中感兴趣区域和非感兴趣区域,进行不同码率的压缩,能够减少重构的试卷图像的失真的可能性,并提高压缩的速率。对压缩后的特定区域结合混沌迭代算法进行加密处理,保证特定区域的保密性和安全性,减少明文攻击。本技术能够提高考试时图像文件传输的效率和速率,确保了图像文件在传输过程中的安全性,并且在网络阻塞的情况下仍旧能够保证图像文件的传输。
[0211]
另外,一种计算机可读存储介质,其中存储有处理器可执行的程序,所述处理器可执行的程序被处理器执行时用于实现所述的一种试卷图像文件处理方法。
[0212]
本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或装置不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或装置固有的其他步骤或单元。
[0213]
应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
[0214]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,可以是电性、机械或其它的形式。
[0215]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0216]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0217]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机、服务器或者网络装置等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:只读存储器(read-on ly memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0218]
对于上述方法实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进
行适应性调整。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1