一种基于扩散映射的侧扫声呐图像目标非监督探测方法与流程

文档序号:12906454阅读:350来源:国知局
一种基于扩散映射的侧扫声呐图像目标非监督探测方法与流程

本发明涉及侧扫声呐技术领域,具体是一种基于扩散映射的侧扫声呐图像目标非监督探测方法。



背景技术:

侧扫声呐(sidescansonar,sss)图像在似雷物体、海底冷泉等水下目标的探测和识别方面具有重要的应用价值。基于时域ping断面数据可实现目标探测,但精度受复杂海洋噪声影响显著;基于空域图像数据的目标探测方法主要有两种:基于监督学习的方法,其通过提取已知图像库中参考图像目标的形状、纹理、灰度等特征,通过构建分类识别模型实现待检测图像中目标的探测。侧扫声呐作为一种水下声学设备,应用于复杂变化的海洋环境中,决定了没有足够的专家图像库可供选择,且将不同海况下得到的图像提取目标特征用于陌生海况进行目标探测时精度难以保证;基于非监督学习的方法,通常需借助一定的数学模型,这些模型应用于数据量大的侧扫声呐图像时,往往存在计算效率不高的缺陷,因此很多情况下,在保证目标与背景有足够分离度的基础上需要先对原始数据进行降维操作。扩散映射(diffusionmap)作为流形(manifolds)学习算法的一种,是一种非线性的数据降维方法,可以有效降低图像数据维数;而扩散映射下定义的扩散距离为寻找数据中有意义的几何结构提供了一种有效的方法,为侧扫声呐图像中异常区域(目标)的探测提供了一种新思路。



技术实现要素:

本发明的目的在于提供一种基于扩散映射的侧扫声呐图像目标非监督探测方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种基于扩散映射的侧扫声呐图像目标非监督探测方法,包括以下步骤:

第一步:计算sss图像的灰度直方图,统计得到其第一个波峰的灰度g,将sss图像中灰度小于g的像素的位置标记为阴影区域,并记录阴影的位置;

第二步:构建高斯金字塔图像(gl)ll=0,其中g0为原始sss图像;随机采样时,忽略阴影区域的像素;在低尺度的金字塔图像采用较高的采样率,而在高尺度的金字塔图像采用较低的采样率;

第三步:对采样数据进行扩散映射计算,得到采样数据的扩散坐标及其特征向量;

第四步:应用第三步的特征向量根据数据扩展方法将采样数据扩展至原始数据,得到原始数据的扩散坐标y;

第五步:再计算扩散坐标y的扩散距离d;

第六步:根据扩散距离d在sss图像的像素邻域内计算目标得分,目标得分的公式如下:

式中,dposition为欧几里得距离,d为扩散距离,σk为d的k近邻个值的方差;根据目标得分c给定一个阈值τl,实现目标探测;当l>0时,τl取目标得分95%的置信区间;当l=0时,取一硬阈值τ对探测结果进行平滑处理;

第七步:当l<l时,对每层sss图像重复第二步-第六步;当l=0时,输出目标探测结果。

作为本发明进一步的方案:第三步中,扩散映射计算中包括权矩阵的计算,权矩阵由高斯函数得到:

w(xi,xj)=exp(-||xi-xj||2/δ2)

式中δ为尺度参数,距离||xi-xj||采用欧几里得距离,xi,xj为数据集合x的行向量。

作为本发明进一步的方案:第四步中,数据扩展方法采用nystrom扩展方法。

作为本发明进一步的方案:第五步中,扩散距离d的计算公式为:

式中:为当x为有限集的情况下对转移概率p进行特征分解,得到正交的右特征向量,λj为正特征值序列。

与现有技术相比,本发明的有益效果是:

本发明提出了一种基于扩散映射的侧扫声呐图像目标非监督探测方法。顾及扩散映射计算效率低的缺陷,通过构建高斯金字塔图像,对每层sss图像随机采样进行扩散映射计算,提高了计算效率;通过扩散距离定义邻域内目标得分,有效实现了侧扫声呐图像中目标的探测。考虑到侧扫声呐图像存在阴影的特点,首先对阴影进行单阈值简单探测,随机采样时不考虑阴影位置,提高了目标探测的精度;且通过多层sss图像的探测弥补了随机采样可能造成目标探测失败的缺陷。试验验证了方法的有效性,为侧扫声呐图像提供了一种新的非监督探测方法。

附图说明

图1是基于扩散映射的侧扫声呐图像目标探测流程图;

图2:(a)单目标声呐图像,(b)扩散坐标前三维数据图像显示;

图3是扩散坐标前三维数据成图;

图4是平滑前后的目标得分情况图;

图5是目标及其阴影的最终探测结果图;

图6是顾及阴影位置的目标得分及探测结果图;

图7是不顾及阴影的目标得分及目标探测结果图;

图8是顾及阴影的目标得分及多目标探测结果图;

图9是沙坡纹理中声呐图像目标探测结果图。

具体实施方式

下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

1:扩散映射基本原理

扩散映射的框架来源于动力系统。在数据图上定义一个markov随机游走,通过若干时间步长的随机游走,得到数据点之间接近度的一种度量关系,有了这种度量,可定义扩散距离,且在数据的低维表示中,扩散距离也能得到保留。如果令x=(x1,x2,...,xn)为n组高维的数据集合,可构建权重矩阵来度量相邻两个数据结点之间的相似性,标准的扩散映射算法中,权矩阵由高斯函数得到:

w(xi,xj)=exp(-||xi-xj||2/δ2)式(1)

式(1)中δ为尺度参数,距离||xi-xj||可采用欧几里得距离,xi,xj为数据集合x的行向量。

对x构建一个核映射k:x×x→r,该映射满足kij=kji,且kij≧0,如果基于w构造k=wtw,可知核映射k满足前述两个条件。若将(x,k)视为一个图,那么根据核映射k的性质,可以构造出数据集合x上的一个马尔科夫(markov)链,如此引入几个概念和符号。

(1)数据点x的度

它呈现了数据点x的“局部信息”。

(2)转移概率

p(x,y)=k(x,y)/d(x)式(3)

此时转移概率p(x,y)为一个正矩阵,但不满足对称的性质。但其满足:

如此构建得到了数据集合x上的一个markov链,其包含了原始数据集的局部几何信息,转移概率p(x,y)反映了数据从一个点运动到另一个点的概率,可定义pt(x,y)为第t次转移概率。该markov链有一个重要的性质,即其为可逆矩阵,这个性质决定了,当x为有限集的情况下对p进行特征分解,可得到正交的左、右特征向量ψj、同时可得到正特征值序列:λ0≥λ1≥λ2≥...,则第t次获得的markov链可表示为:

l为特征值个数;由于λ0为一常数,根据mishne等(2014)的研究可将扩散映射表示为,

(3)扩散距离

针对扩散映射可以定义扩散距离:

式(6)中pt(x,y)是pt中的元素,z为数据集合x中的数据;dt(x,y)为在给定时刻t、数据(x,y)之间的扩散距离。它反映了数据(x,y)间的局部结构,更为重要的是它从宏观上给出了数据(x,y)之间的联系,如果数据(x,y)与很多短边相连接,那么,直观上它们之间的距离也应该很小;这个距离包括了衔接数据(x,y)的所有路径,所以其抗干扰能力很强,一个点的微小扰动对距离的改变不大。

根据扩散映射后得到的扩散坐标,dt(x,y)可以按下式计算:

根据前述基本原理,可以将图像数据降维得到扩散坐标,解决侧扫声呐图像数据量大而导致目标探测效率低的缺陷;将扩散距离作为扩散坐标的度量标准,在含异常的侧扫声呐图像中计算扩散距离,目标和背景、背景内部间的扩散距离差别很大,据此可以进行目标探测。

2:基于扩散映射的侧扫声呐目标探测方法

根据上述基本原理,可知基于扩散映射的目标探测存在如下几个问题:

(1)参数取值

式(1)中尺度参数δ的取值对权矩阵的影响很大,如果尺度参数δ很小,会导致很多点仅与自己连接;反之,尺度参数δ太大,全部数据可能都被连接。这对侧扫声呐图像目标探测不利,比如尺度参数δ过大时,目标和背景区域被连接在一起,导致目标探测失败。可采用局部尺度参数δ的自适应确定方法:

w(xi,xj)=exp(-||xi-xj||2/δiδj)式(8)

δi,δj为xi,xj的局部尺度参数,距离为欧几里得距离,δi可以根据xi的k-邻域统计得到:

δi=||xi-xk||2式(9)

基于局部尺度参数δi,δj构建权重矩阵,可以有效的区分出数据点之间的密度关系。

(2)计算效率

扩散映射虽然实现图像数据降维,由于侧扫声呐图像数据量巨大,在进行扩散映射、扩散坐标计算时,效率仍然非常低。可采用随机采样进行扩散映射计算,然后扩展至原图。

(3)数据扩展方法

问题(2)引入数据扩展的问题。其数学描述如下,假设г,г'为rn空间的一组尺度可比较的数据集合且г∈г',ψ为г经过扩散映射后的低维数据,数据扩展就是寻找一组新的ψ'使其对应于数据г'。目前常用的方法为nystrom扩展方法,它通过局部数据的特征向量推导出整个数据集的特征向量的近似值,进而完成数据扩展。

(4)探测精度

随机采样造成目标探测可能失败,据此可构建高斯金字塔图像,在多层sss图像中实施目标探测,且在低尺度目标探测完成后,可将可疑位置的像素继续作为下一尺度的采样点,保证目标探测的可靠性;侧扫声呐受其机理限制,sss图像目标常存在阴影,阴影和背景、阴影和目标及背景内部区域间的扩散距离也很大,导致目标探测失败。据此可考虑将目标阴影简单提取出来并记录其位置,随机采样时不考虑阴影位置,提高目标探测精度。

基于上述缺陷及改正方法,本发明提出了一种基于扩散映射的侧扫声呐图像目标非监督探测方法(流程如图1所示),具体实施步骤如下:

第一步:计算sss图像的灰度直方图,统计得到其第一个波峰的灰度g,将sss图像中灰度小于g的像素的位置标记为阴影区域,并记录阴影的位置;

第二步:构建高斯金字塔图像(gl)ll=0,其中g0为原始图像,l为高斯图像层数,0≤l≤l。随机采样时,可在低尺度的金字塔图像采用较高的采样率(甚至为全部数据),而在高尺度的金字塔图像采用较低的采样率(采样时忽略阴影位置)。例如l=3,则l=0时为最高尺度的图像,可在g0采样率低些(诸如30%采样率);l=3时为最低尺度的图像,g3采用全部图像数据(采样率100%)。

第三步:对采样数据进行扩散映射计算,得到采样数据的扩散坐标及其特征向量。计算权矩阵时,式(1)中尺度参数δ根据公式(9)确定。

第四步:应用第三步的特征向量根据前述数据扩展方法将采样数据扩展至原始数据,得到原始数据的扩散坐标y。

第五步:根据公式(7),计算扩散坐标y的扩散距离d。

第六步:根据扩散距离d在sss图像的像素邻域内计算目标得分,目标得分的公式如下:

式(10)中,dposition为欧几里得距离,d为扩散距离,σk为扩散距离d的k近邻个值的方差,k取8时,表示取前8组扩散距离。根据目标得分c给定一个阈值τl,可实现目标探测。当l>0时,τl可取目标得分95%的置信区间;当l=0时,可取一硬阈值τ(目标区域的c接近于1)对探测结果进行平滑处理。

第七步:当l<l时,对每层sss图像重复第二步-第六步;当l=0时,输出目标探测结果。

3:试验及分析

为验证本发明方法的有效性,采用含阴影的单一目标的侧扫声呐图像进行目标探测试验,原始侧扫声呐图像如图2(a)所示。首先对图2(a)进行扩散映射计算(当sss图像大小为96×96时,式(1)中扩散距离需计算一个9216×9216的矩阵,计算效率很低),得到其扩散坐标,为了显示扩散坐标展现的原始sss图像的像素与其周围像素的关系,提取扩散坐标前三维数据进行成图显示,其中对应sss图像像素的三维坐标图像如图2(b)所示,sss图像中的颜色仅为了对比显示,并无其它实际意义。但通过分析两幅sss图像,可以看出sss图像中的异常(目标、阴影区域)的扩散坐标与其邻域像素存在一定的差异;扩散映射前三维坐标如图3所示,也可看出坐标存在离散程度的不同。因此可基于扩散映射下扩散坐标的离散程度进行侧扫声呐图像中异常目标的探测。

采用本发明方法(先不考虑阴影),l取3,三层的采样率设置为[0.4,0.6,1],公式(9)中k取7,公式(10)(10)中k取64进行目标探测试验。考虑到目标区域的得分会很高,可以采用简单的硬阈值(诸如当c(i,j)<0.3时将c赋值为0)及中值滤波对最终目标得分进行平滑处理。目标得分及其平滑后得分如图4所示。可以看出经平滑后的目标得分有效标注出目标的位置。

根据上述目标得分,进行联通区域提取及目标轮廓连接,最终结果如图5所示。可见在实现目标探测的同时将阴影也探测出来,影响后续的目标识别。

顾及阴影时计算目标得分及目标探测结果如图6所示,此时提取目标轮廓的质心进行显示。可以看出顾及阴影的目标探测方法虽然在计算目标得分时会出现阴影的部分轮廓,但通过连通区域提取及轮廓质心提取后,可以有效将阴影舍弃,只实现了目标的探测。

上述实验说明了本发明方法在探测含单一目标的sss图像的可行性,下面采用含多目标物体的sss图像进行试验,统计原始图像含11个目标物体。不顾及阴影和顾及阴影的多目标得分及探测结果分别如图7和图8所示,不顾及阴影时,探测出目标10个,且存在2个误探测和3个遗漏探测;而顾及阴影时探测目标11个,不存在误探测和漏探测。分析认为,侧扫声呐图像的阴影与其邻域扩散距离也很大,在进行目标得分计算时,阴影得分很高,而侧扫声呐图像目标和阴影往往成对存在,当存在紧邻的目标时,在进行联通区域提取时多个目标及其阴影被当成一个目标,导致目标探测失败。而顾及阴影位置时,由于不考虑阴影所在位置,尽管阴影轮廓区域目标得分很高,但其不连续,后续联通区域提取及目标探测时有效将其舍弃,仅得到目标探测结果。

sss图像目标探测的难点之一为含有阴影的沙坡地形中目标的探测,因此采用含沙坡地形的sss图像进行目标探测。采用本发明方法的目标得分及探测结果如图9所示,可见本发明方法有效的实现了含不同沙坡纹理特征的sss图像中的目标探测。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1