1.一种基于知识重组的语义图像压缩方法,包括下列步骤:
1)获得预训练的编解码器结构模型以及无标签数据;
分别选取用于图像压缩和语义分割任务的编解码器结构模型。语义分割模型对输入图像进行逐像素分类,图像压缩模型对数字图像进行压缩和解压。本方法使用无标签数据进行训练,即使用预训练模型对输入图像进行预测,将预测结果作为学习目标。
2)模型重组;
对预训练模型的编码器参数进行零填充,将大小为o×i×h×w的参数填充为o×∑tit×h×w,使其能够接收所有预训练模型的输入,其中t表示预训练模型的序号。最后组合多个零填充参数,获得大小为∑tot×∑tit×h×w的重组参数。非零参数经过重组后依次成对角线排布,其余位置均为零。对多个模型的编码器部分进行逐层重组,得到重组模型。重组模型包括一个共享的重组编码器和两路解码器。解码器能够独立工作,分别进行语义分割和图像解压。重组模型与多个预训练模型功能等价。
3)迭代剪枝减小模型规模;
基于余弦相似度
利用预训练模型在无标签数据上的预测结果作为目标,进行多任务训练,压缩分支损失函数为均方误差