一种基于混合深先验的RFID标签图像运动去模糊方法

文档序号:28915883发布日期:2022-02-16 10:38阅读:97来源:国知局
一种基于混合深先验的RFID标签图像运动去模糊方法
一种基于混合深先验的rfid标签图像运动去模糊方法
技术领域
1.本发明涉及rfid标签图像运动去模糊方法,尤其涉及一种基于混合深先验的rfid标签图像运动去模糊方法。


背景技术:

2.射频识别(radio frequency identification,rfid)是一种非接触式自动识别技术。它会自动识别目标物体并通过射频信号获取数据。识别过程不需要人工干预,并且可以在各种恶劣的环境下工作。rfid技术已经广泛应用于智能交通、仓储物流、目标定位等领域。然而在智慧物流中,由于网上购物的普及,需要使用大量的rfid标签用于批量货物的出入库信息采集与货物盘点。在rfid标签的批量应用中,标签的几何位置分布会对标签组的整体识读性能产生影响。为了研究多标签几何位置分布对识读性能的影响,需要对标签的位置分布进行量测。
3.在物体测量建模领域,基于机器视觉的测量方法由于其非接触,范围大,全自动的优点等而到广泛的应用。在利用机器视觉对标签的位置坐标进行非接触测量过程中,由于标签和ccd相机之间的相对运动会导致获取的标签图像中存在一定程度的运动模糊,这些运动模糊的存在会严重影响后续的标签位置非接触测量的精度。为了消除运动模糊以实现高精度测量,需要附加的约束条件和先验知识。现有先验通常是复杂的手工先验,但是,手工先验需要太多的手动设置预输入参数。近年来,一些学者基于数据驱动的方式构建了可学习的深度先验。但是,深度先验无法适应任意模糊。


技术实现要素:

4.发明目的:本发明的目的是提供一种将手工先验与流行的深度先验相结的基于混合深先验的rfid标签图像运动去模糊方法。
5.技术方案:本发明的rfid标签图像运动去模糊方法,包括以下步骤:
6.(1)利用已收集的清晰标签图像,随机生成模糊核;将随机生成的模糊核与随机选出的清晰标签图像进行卷积,生成标签模糊图像数据集,作为训练的正样本;同时将剩余的清晰标签图像作为负样本;
7.(2)采用判别式二分类器构建标签图像深先验;
8.(3)选用交叉熵作为损失函数,同时将标签模糊图像数据集作为训练集,进行标签图像深先验训练;
9.(4)将训练好的深先验与传统的l0先验组合,构成标签图像的混合深先验;
10.(5)进行标签运动模糊图像盲反卷积,将混合深先验插入最大后验框架求解模型中,求解出潜在的清晰图像;
11.(6)采用l2正则化方法对标签运动模糊图像盲反卷积中的模糊核进行估计;
12.(7)重复步骤(5)和步骤(6),直到求解出最佳的清晰图像为止。
13.进一步,所述步骤(1)中生成标签模糊图像的实现包括如下步骤:
14.(11)选用boracchi和foi方法随机生成多个模糊核,模糊核的大小范围从7
×
7像素到51
×
51像素;
15.(12)将随机生成的模糊核与清晰标签图像进行卷积,并加上标准为σ1=0.01的高斯白噪声生成标签模糊图像。
16.进一步,所述步骤(2)中判别式二分类器由残差网络构成,残差网络包含多层,实现步骤如下:
17.(21)残差网络设为19层,包括三个主要组成部分:卷积、relu、批处理归一化;其中,有7个大小为3
×
3的扩展卷积层,扩展卷积层的扩展因子分别为1,2,3,4,3,2,1;在第一层卷积之后连接非线性relu层;对于第二层至第六层卷积,在每两个卷积之间连接放置有批处理归一化和relu;
18.(22)采用从输入到输出的跳过连接,将二分类交叉熵作为损失函数:
[0019][0020]
其中,n表示一个批处理中训练样本的数量,yi=f(xi)表示分类输出的概率值;表示输入图像的标记,将模糊图像的标记设置为1,清晰图像的标记设置为0。
[0021]
进一步,所述步骤(3)中深先验训练的实现步骤如下:
[0022]
(31)选用多尺度训练策略;
[0023]
(32)采用matconvnet工具包训练网络,采用xavier方法初始化网络中各滤波器参数;
[0024]
(33)采用adam算法对网络进行优化;同时,采用批处理的方式对网络进行训练,每一批所含的训练样本设置为50,训练的初始的学习率设置为0.01,训练后每50轮学习率衰减为原来学习率的五分之一。
[0025]
进一步,所述步骤(5)中图像盲反卷积的实现步骤如下:
[0026]
(51)当深先验训练完成后,将其作为图像先验添加到求解模型m1中:
[0027][0028]
其中,i表示潜在的清晰图像、b表示获取的标签模糊图像、k表示模糊核、表示卷积操作、表示l0正则化项、λf(i)表示深先验;γ、μ、λ为调整各项约束的权重参数;
[0029]
(52)采用半二次分裂优化方法来求解最大后验框架求解模型:
[0030][0031]
其中,α和β为惩罚系数,为图像i的梯度,u和g为引入的辅助变量;
[0032]
(53)通过交替求解i、u、g:
[0033][0034]
(54)通过快速傅里叶变换得到i的封闭形式的解:
[0035]
其中,f(
·
)和f-1
(
·
)分别表示傅里叶变换和逆傅里叶变换,为复数共轭算子,其中,d∈{h,v},h表示水平方向,v表示竖直方向,和分别表示图像水平方向和竖直方向上的梯度操作算子;gd为辅助变量g在垂直和水平方向的梯度;
[0036]
(55)通过硬阈值算子求解
[0037][0038]
通过基于梯度下降的方法,采用基于反向传播的方式求解:
[0039][0040]
其中,η表示步长,s表示迭代次数索引。
[0041]
进一步,所述步骤(6)中模糊核估计的实现如下:
[0042]
采用l2正则化方法来估计模糊核,采用快速傅里叶变换进行求解,在每次迭代求解出模糊核k后,将模糊核k中为负数的元素设置为0,并且将模糊核k归一化,所有元素求和为1。
[0043]
本发明与现有技术相比,其显著效果如下:1、本发明将包含有标签模糊图像和清晰图像的数据集用于训练该深先验,能够更有效的去除标签图像中存在的运动模糊;2、将混合深先验引入最大后验框架求解模型中,能实现标签图像中运动模糊的有效去除,具有更好的泛化性,对各种运动模糊情况都能达到较好的去模糊效果。
附图说明
[0044]
图1为本发明的总流程示意图;
[0045]
图2为本发明的标签模糊图像示意图;
[0046]
图3为原始清晰标签图像图;
[0047]
图4为本发明的标签去模糊后得到的清晰图像图;
[0048]
图5为本发明的最终估计得到的模糊核图。
具体实施方式
[0049]
下面结合说明书附图和具体实施方式对本发明做进一步详细描述。
[0050]
如图1所示为本发明的rfid标签图像运动去模糊方法的总流程图,实现过程包括以下步骤:
[0051]
步骤一,数据集生成,利用工业相机收集10100张清晰的标签图像,然后随机生成100个模糊核,将随机生成的模糊核与随机选出的100张清晰标签图像进行卷积,生成10000
张标签模糊图像数据集,作为训练的正样本(标记为1),同时将剩余的10000张清晰的标签图像作为负样本集(标记为0)。其中,标签模糊图像如图2所示,原始清晰标签图像如图3所示。
[0052]
生成标签模糊图像的实现步骤如下:
[0053]
步骤11:使用boracchi和foi方法随机生成多个模糊核,其大小范围从7
×
7像素到51
×
51像素不等。
[0054]
步骤12:将随机生成的模糊核与清晰标签图像进行卷积,并加上标准差为σ1=0.01的高斯白噪声生成标签模糊图像。
[0055]
步骤二,标签图像深先验构建,采用一个判别式二分类器来学习一个基于数据驱动的判别式先验,即标签图像深先验f(i),该深先验由残差网络(resnet)构成,其中,resnet包含多层卷积层、全连接层及softmax层。
[0056]
构建的深先验是一个判别式二分类器先验,该二分类器由残差网络(resnet)构成,实现步骤如下:
[0057]
步骤21:残差网络有19层,包括三个主要组成部分:卷积、relu、批处理归一化。其中,有7个大小为3
×
3的扩展卷积层,卷积层的扩展因子分别为1,2,3,4,3,2,1。在第一层卷积之后连接非线性relu层。至于其他卷积,批量归一化和relu被连接放置在每两个卷积之间。
[0058]
步骤22:采用从输入到输出的跳过连接。采用二分类交叉熵作为损失函数:
[0059][0060]
式(1)中,n表示一个批处理(batch)中训练样本的数量,yi=f(xi)表示分类输出的概率值,表示输入图像的标记。
[0061]
将模糊图像的标记设置为1,清晰图像的标记设置为0。
[0062]
步骤三,标签图像深先验训练,采用交叉熵作为损失函数,同时将步骤一中生成的10000张正样本与10000张负样本作为训练集训练resnet残差网络。
[0063]
深先验训练的实现步骤如下:
[0064]
步骤31:为了使训练的混合深先验对输入图像尺寸更加鲁棒,采用了多尺度训练策略。
[0065]
步骤32:选用matlab的matconvnet工具包训练网络,选用xavier方法初始化网络中各滤波器参数。
[0066]
步骤33:选用adam算法对网络进行优化。其中,adam采用默认设置。同时,采用批处理的方式对网络进行训练,每一批所含的训练样本(batch size)设置为50。训练的初始的学习率设置为0.01,训练后每50轮(epoch)学习率衰减为原来学习率的五分之一。
[0067]
步骤四,混合深先验构建,将第三步骤中训练好的深先验与传统的l0先验组合在一起构成标签图像的混合深先验。
[0068]
步骤五,标签运动模糊图像盲反卷积,将提出的混合深先验插入最大后验框架求解模型中,求解出潜在的清晰图像。
[0069]
图像盲反卷积的实现步骤如下:
[0070]
步骤51:当深先验训练完成后,将其作为图像先验添加到最大后验框架求解模型中,最大后验框架求解模型为:
[0071][0072]
式(2)中,i表示潜在的清晰图像,b表示获取的标签模糊图像,k表示模糊核,表示卷积操作,表示l0正则化项,λf(i)表示深先验,γ=2.0、μ=0.004、λ=0.004为调整各项约束的权重参数。
[0073]
步骤52:采用半二次分裂优化方法来求解最大后验框架求解模型,
[0074]
引入辅助变量u和g=(gh,gv)替换求解过程中的潜在清晰图像、以及潜在清晰图像在水平方向和垂直方向的梯度,得出:
[0075][0076]
式(3)中,α=4e-3和β=4e-3为惩罚系数,为图像i的梯度,u和g为引入的辅助变量,μ为调整相应项约束的权重参数。显然,当α

∞和β

∞时,等式
[0077][0078]
等于
[0079]
步骤53:通过交替迭代求解i,u,g的子问题,来求解公式(3)
[0080]
得出:
[0081][0082]
步骤54:对于中的可以通过快速傅里叶变换得到i的封闭形式的解:
[0083]
式(5)中,f(
·
)和f-1
(
·
)分别表示傅里叶变换和逆傅里叶变换,为复数共轭算子,其中,d∈{h,v},h表示水平方
向,v表示竖直方向,和分别表示图像水平方向和竖直方向上的梯度操作算子;gd为辅助变量g在垂直和水平方向的梯度。
[0084]
步骤55:对于中的可以通过硬阈值算子求解,即
[0085]
对于中的通过一种基于梯度下降的方法,采用基于反向传播的方式求解:
[0086][0087]
式(6)中,η=0.1表示步长,s表示迭代次数索引,s的最大值为s
max
=10。
[0088]
步骤六,模糊核估计,针对步骤五中标签运动模糊图像盲反卷积中模糊核估计问题,采用l2正则化方法来求解和更新模糊核。模糊核估计的实现如下:
[0089]
采用l2正则化方法来估计模糊核即采用快速傅里叶变换进行求解,在每次迭代求解出k后,将k中为负数的元素设置为0,并且将k归一化,所有元素求和为1。其中γ=2.0,表示l2正则化。最终估计得到的模糊核如图5所示。
[0090]
步骤七,重复步骤五和步骤六,直接求解出最佳的清晰图像为止,标签去模糊后得到的清晰图像如图4所示。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1