基于改进的PSO算法的归一化互相关的目标区域定位方法

文档序号:33560709发布日期:2023-03-22 14:11阅读:48来源:国知局
基于改进的PSO算法的归一化互相关的目标区域定位方法
基于改进的pso算法的归一化互相关的目标区域定位方法
技术领域
1.本发明涉及一种计算机图像处理方法,尤其涉及一种基于改进的pso算法的归一化互相关(normalized cross correlation,ncc)的目标区域定位方法。


背景技术:

2.模板匹配是计算机视觉应用中常用的方法之一,可以应用在视频跟踪,字符识别、目标重定位等领域。模板图像和目标图像的筛选窗口之间的相似性度量是模板匹配的核心[1]。通过评估筛选窗口的相似度即可找出目标区域的准确位置。
[0003]
视频跟踪采用图像传感器对动态环境中的运动目标(如人、车辆等)进行实时观测通过检测、识别和跟踪图像序列中的运动目标,监视场景中目标的活动,理解和描述目标的各自行为和相互间行为。基于模板匹配的视频跟踪技术可以用于安防,寻人。采用模板匹配的检测方式,可以大大提高检测结果的精度与可靠性,提高整体流水线的生产效率。基于视觉的模板匹配技术可以广泛的应用于生产生活的各行各业。
[0004]
传统的模板匹配方法通常使用平方差和、模板与目标图像的方差、归一化的模板与目标图像的方差、模板与目标图像的点积等方法计算模板与基础图像之间的相似度得分[2]。在搜索图中,以像素点(i,j)为左上角,取m*n大小的筛选窗口,计算其与模板的相似度;遍历整个搜索图,找到与模板图最相似的窗口作为最终匹配结果[3]。
[0005]
同时,本文通过使用时变的学习因子以及新的速度更新公式对pso粒子群优化算法进行改进,降低了pso算法的早熟收敛和易陷入局部最优的不足以及求解复杂优化问题效果不理想等共性问题,提高了算法的自适应性,并利用改进的pso粒子群优化算法对目标图像实现定位。
[0006]
[参考文献]
[0007]
[1]陈超,牛王强,杜芃.基于模板匹配和特征匹配的集装箱箱号识别算法[j].上海海事大学学报,2019,40(01):68-73。
[0008]
[2]杨昆,张明新,刘永俊.基于优化粒子群的ncc模板匹配算法[j].计算机应用与软件,2015(8):162-165。
[0009]
[3]吴平,王彬,薛洁,等.基于模板匹配的加速肺结节检测算法研究[j].计算机工程与应用,2015,51(7):184-188。


技术实现要素:

[0010]
针对现有技术在视频跟踪,字符识别、目标重定位应用过程中的模板匹配的实时性问题,在实际处理图像像素较大的图片时,ncc(normalized cross correlation,归一化互相关)相似度计算过程非常耗时的问题,本发明提出一种基于改进的pso算法的归一化互相关(normalized cross correlation,ncc)的目标区域定位方法,利用ncc相似度评估模板图像和目标图像的筛选窗口之间的相似性,遍历搜索区域,找到与模板图最相似的窗口作为最终匹配结果。在计算ncc值的过程中引入了一个上限函数作为筛选条件,可以更快地
略过匹配度不高的筛选窗口。采用快速的搜索策略,更快速的ncc模板匹配筛选策略应用于目标区域快速定位,可以解决各种工业生产中的定位问题,并显著提高生产效率。
[0011]
为了解决上述技术问题,本发明提出的一种基于改进的pso算法的归一化互相关的目标区域定位方法,主要包括:依据不同的应用场景设定归一化互相关(ncc)算法参数;使用改进的pso算法更新粒子坐标;记录归一化互相关(ncc)值满足相似度的粒子在原始图像中的坐标位置和数量;该粒子的坐标位置即为搜索到的目标图像的位置;依据相似度值搜索到所有目标图像的位置;将搜索到的目标图像输出,在原始图像中标记目标图像的位置。
[0012]
以控制箱的模板匹配实验为例,精准定位目标的具体步骤如下:
[0013]
步骤一、设原始图像中的初始粒子坐标为(x,y),其ncc值的计算公式为:
[0014][0015]
式(1)中,w为模板图像,大小为m*n像素,f为模板图像w匹配到的原始图像。f(x+i,y+j)表示匹配到的原始图像f中(x+i,y+j)点的像素值,为原始图像f的平均灰度值;wk(i,j)表示第k个模板图像中(x,y)点的像素值,为第k个模板图像的平均灰度值。
[0016]
步骤二、将步骤一中根据初始化粒子在原始图像中的坐标位置求得的最大的ncc值作最优值,依据式(2)所示的一种改进的pso算法更新粒子的位置信息:
[0017]vi
(t+1)=w(t)
×vi
(t)+c1(t)
×
r1×
(rand
×
pbesti(t)-xi(t))
[0018]
+c2(t)
×
r2×
(rand
×
gbest(t)-xi(t))
ꢀꢀꢀꢀ
(2)
[0019]
其中,w(t)为模板图像,vi(t),vi(t+1)分别是第i个粒子在t次迭代和t+1迭代的速度,c1(t)为自我认知学习因子,c2(t)为社会学习因子,为了更好的调控该幅度,采用一种时变的策略,其中自我认知学习因子c1(t)从2.5线性递减到0.5,而社会学习因子c2(t)从0.5线性递增到2.5,其时变公式如(3)所示:
[0020]
c1(t)=2.5-2*t/maxt
[0021]
c2(t)=0.5+2*t/maxt (3)
[0022]
rand为一个随机数,pbesti(t)是粒子的自身最优,gbest(t)为全局最优,通过采用乘上一个随机数rand的方式来对pbesti(t)和gbest(t)进行了一定程度的缩放,为rand
×
pbesti(t)-xi(t)和rand
×
gbest(t)-xi(t);xi(t)是第i个粒子在t次迭代的位置信息,本文通过设置一个计数器count用于记录第i个粒子未能有效提升解的质量的次数,当计数器达到某个阈值(本文设定为10)时,将对xi进行重新初始化,其初始化公式如(4):
[0023]
xi=min(gbest)+rand(1,dim)*(max(gbest)-min(gbest)) (4)
[0024]
r1和r2为随机变量(或向量),在原始pso算法的速度更新公式中,随机变量(或向量)r1和r2在整个迭代过程中,要么都取[0,1]区间上服从均匀分布的随机数或随机向量,整个过程缺乏变化,因此,将通过一种随机机制来动态的确定r1和r2是用随机数还是用随用向量,即:
[0025][0026][0027]
改进的pso算法依据式(6)所示的公式更新粒子的速度信息:
[0028]
xi(t+1)=xi(t)+vi(t+1) (6)
[0029]
式(6)中,xi(t)和xi(t+1)分别是第i个粒子在t次迭代和t+1迭代的位置信息。
[0030]
步骤三、统计适应度值大于等于0.98的粒子数目,并记录满足要求的粒子在原始图像中的位置,该位置即为匹配到的特征点的位置;
[0031]
步骤四、步骤三中统计的粒子数目满足特征点数目时,可对目标图像进行定位。
[0032]
步骤五、将匹配到的特征点在原始图像中进行标记。
[0033]
通过以上步骤即可完成模板匹配的过程。如图2(a)所示为待检测的原始图像,图2(b)为2个小模板图像,图2(c)为模板匹配的结果。从图中可以看出,通过匹配小模板图,找到目标的特征点,从而确定目标的位置。
附图说明
[0034]
图1是基于改进的pso-tm算法流程图;
[0035]
图2(a)至图2(c)是本发明室内消防器材实施例相关图形,其中:图2(a)是原始图像,图2(b)是模板图像,图2(c)模板匹配结果图。
具体实施方式
[0036]
下面结合附图及具体实施例对本发明做进一步的说明,但下述实施例绝非对本发明有任何限制。
[0037]
模板匹配是将待检测图像中与模板图像进行对比判断目标图像的位置。ncc值一般用来衡量模板匹配的程度,取值范围是[-1,1]。如果ncc的值为1,代表模板图像与筛选窗口图像完全相同,如果为-1,则表示两幅图片完全不相关。基于这个机理,提出了基于ncc的模板匹配技术。
[0038]
模板匹配是将待检测图像中与模板图片所有像素上逐个对比,因此计算量较大,匹配速度较慢。对此,针对此问题提出了一种多模板匹配方法。
[0039]
在模板匹配(template match,tm)算法中,tm-ncc值表示一组模板中计算得到最大的ncc值。设定模板大小为m*n像素,表示模板对应到原图中区域的平均灰度值,f(x,y)表示原图中(x,y)点的像素值。则表示模板图像的平均灰度值,w(x,y)表示模板图中(x,y)点的像素值。在图像中(x,y)点的ncc计算公式为:
[0040][0041]
在进行多模板匹配的过程中,所有的待检测的图像和目标图像进行匹配和判别。
在计算的过程中,创建一个存储目标图像所对应的ncc值表,每个ncc值是在原图每个像素进行匹配计算得到的。在这些值中,选取代表正确匹配的最优值。多个目标检测的时候,就要确定所有的目标模板对应的ncc最优值。
[0042]
改进的粒子群优化(particle swarm optimization,pso)算法用来解决ncc最值优化问题,并且实现对目标图像的定位。在pso中,搜索空间中的每个粒子代表优化问题的可能解。每个粒子都有个适应度值以及一个速度。在算法中,首先随机初始化一群粒子,之后通过不停地迭代寻求最优粒子(最优解)。
[0043]
假设在d维搜索空间中,先初始化n个d维的粒子,第i个粒子位置信息表示为:
[0044]
xi=(x
i1
,x
i2
...,x
id
),i=1,2,...,n
[0045]
其中,x为粒子,i为粒子编号,1

d为粒子信息的维度。第i个粒子的速度表示为:
[0046]vi
=(v
i1
,v
i2
...,v
id
),i=1,2,...,n
[0047]
其中,v
i1
,v
i2
...,v
id
为第i个粒子在d维度上的速度。第i个粒子在当前找到的最优解表示为:
[0048]
pi=(p
i1
,p
i2
,...,p
id
),i=1,2,...,n
[0049]
其中,p
i1
,p
i2
,...,p
id
为第i个粒子的最优的d维粒子信息。所有粒子群在当前找到的最优解表示为:
[0050]gbest
=(p
g1
,p
g2
,...,p
gd
)
[0051]
粒子的速度以及位置更新公式如下:
[0052]vi
(t+1)=w(t)
×vi
(t)+c1(t)
×
r1×
(rand
×
pbesti(t)-xi(t))
[0053]
+c2(t)
×
r2×
(rand
×
gbest(t)-xi(t))
[0054]
xi(t+1)=xi(t)+vi(t+1)
[0055]
其中,w(t)为模板图像,vi(t),vi(t+1)分别是第i个粒子在t次迭代和t+1迭代的速度,c1(t)为自我认知学习因子,c2(t)为社会学习因子,rand为一个随机数,pbesti(t)是粒子的自身最优,gbest(t)为全局最优,r1和r2为随机变量(或向量)。xi(t)和xi(t+1)分别是第i个粒子在t次迭代和t+1迭代的位置信息。
[0056]
模板匹配是计算机视觉应用中常用的方法之一,被广泛的应用于各类工业生产流程。计算模板图像和目标图像的筛选窗口之间的相似性;遍历整个搜索图,找到与模板图最相似的窗口作为最终匹配结果。原始图像像素较大时,ncc相似度计算过程非常耗时。在计算ncc值的过程中引入了一个上限函数,作为筛选条件,可以更快地略过匹配度不高的筛选窗口。
[0057]
改进的pso算法用来解决ncc最值优化问题。在改进的pso算法中,搜索空间中的每个粒子代表优化问题的可能解。每个粒子都有个适应度值以及一个速度。在算法中,首先随机初始化一群粒子,之后通过不停地迭代寻求最优粒子(最优解)。调节关联度比率cr,可以使提出的模板匹配算法在不同的应用场景能够更加有效地发挥作用。基于bpc的pso-tm(粒子群优化-模板匹配)算法流程图如图1所示。
[0058]
经过以上分析,本发明中提出的基于模板匹配的目标区域精准定位方法的设计思路是:依据不同的应用场景设定归一化互相关(ncc)算法参数;使用改进的pso算法更新粒子坐标;记录归一化互相关(ncc)值满足相似度的粒子在原始图像中的坐标位置和数量;该粒子的坐标位置即为搜索到的目标图像的位置;依据相似度值搜索到所有目标图像的位
置;将搜索到的目标图像输出,在原始图像中标记目标图像的位置。
[0059]
以pcb电路板模板匹配实验为例,目标区域精准定位方法的具体步骤如下:
[0060]
步骤一、设置归一化互相关(ncc)算法参数,设:惯性因子w=0.5,权重系数r1以及权重系数r2均为0到1之间的随机数,学习因子c1=c2=2;粒子数量选取为120,最大运行步数设定为5000步;设定关联度比率cr=40%;最高匹配度η
max
=0.96;设定目标图案的数量为z,本实施例中z=8(根据图2明确该数值);初始化粒子在原始图像中的坐标位置为(x,y)。
[0061]
利用式(1)计算初始粒子的ncc值:
[0062][0063]
式(1)中,模板大小为m*n像素,为模板对应到原始图像中区域的平均灰度值,f(x+i,y+j)表示原始图像中(x+i,y+j)点的像素值;为模板图像的平均灰度值,w(x,y)为模板图像中(x,y)点的像素值;
[0064]
步骤四、将步骤一中根据初始化粒子在原始图像中的坐标位置求得的最大的ncc值作最优值,依据式(2)和式(3)所示的pso算法更新粒子的位置信息和速度信息,
[0065][0066]
xi(t+1)=xi(t)+vi(t+1) (3)
[0067]
式(2)和式(3)中,w(t)为模板图像,vi(t),vi(t+1)分别是第i个粒子在t次迭代和t+1迭代的速度,c1(t)为自我认知学习因子,c2(t)为社会学习因子,rand为一个随机数,pbesti(t)是粒子的自身最优,gbest(t)为全局最优,r1和r2为随机变量(或向量)。xi(t)和xi(t+1)分别是第i个粒子在t次迭代和t+1迭代的位置信息;
[0068]
步骤三、设定相似度的阈值为0.98,记录归一化互相关(ncc)值满足相似度的粒子在原始图像中的坐标位置和数量,所记录的粒子的坐标位置即为搜索到的目标图像的位置;
[0069]
步骤四、步骤三中统计的粒子数目满足特征点数目时,可对目标图像进行定位。
[0070]
步骤五、将搜索到的目标图像输出,在原始图像中标记目标图像的位置。
[0071]
经过上述步骤即可完成模板匹配。如图2所示,其中(a)为待检测图像,(b)为模板图像,(c)为实验结果图。从图中可以看出,目标图像全部找到,而且目标图像的坐标精准。不同的目标也不会出现混淆,可以分别用不同线型的线框或是不同颜色的线框标记出。
[0072]
尽管上面结合附图对本发明进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨的情况下,还可以做出很多变形,这些均属于本发明的保护之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1