无监督特征点检测方法及装置

文档序号:25782895发布日期:2021-07-09 10:03阅读:97来源:国知局
无监督特征点检测方法及装置

1.本发明涉及图像处理技术领域,尤其涉及一种无监督特征点检测方法及装置。


背景技术:

2.在图像处理和与计算机视觉领域,兴趣点(interest points),也被称作关键点(key points)、特征点(feature points)。它被大量用于解决物体识别、图像识别、图像匹配、视觉跟踪、三维重建等一系列的问题。我们不再观察整幅图,而是选择某些特殊的点,然后对它们进行局部有的放矢分析。
3.随着应用领域对特征检测算法实时性,精确性和鲁棒性要求的日益提高,传统的特征检测算法如以角点检测算子为主的harris检测算子和sift等多尺度人工定义的特征以及无法满足应用需求。近年来,随着深度学习技术的发展,基于深度学习的特征点检测和匹配算法发展迅速。相对于传统算法中人工设计的特征算子,基于深度学习的方法可以更加直观、稳定地提取出图像中的有效信息,减少特征数量,提高特征鲁棒性。基于深度学习的特征点检测算法应用广泛,但是仍存在一些问题,如需要手工标注特征点位置来进行有监督学习,耗费大量人力。


技术实现要素:

4.针对现有技术存在的问题,本发明提供一种无监督特征点检测方法及装置。
5.本发明提供一种无监督特征点检测方法,包括:利用编码器网络对训练图像提取特征,得到k个通道的特征图,归一化后生成特征点位置概率分布图;对所述概率分布图求解质心后,基于所述质心对概率分布图进行高斯重构;将高斯重构后特征图,输入解码器网络得到输出图像,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值;根据多次训练结果,得到损失函数最小时的编码器网络;基于训练后的编码器网络,确定待检测图像的k个特征点位置。
6.根据本发明一个实施例的无监督特征点检测方法,所述对所述概率分布图求解质心,包括:
[0007][0008]
其中,为空间归一化因子,w

,h

分别为概率分布图宽和高,d
k,i,j
为概率分布图的特征值。
[0009]
根据本发明一个实施例的无监督特征点检测方法,所述基于所述质心对概率分布图进行高斯重构,包括:
[0010][0011]
其中,δ为预设的标准差,x
k
和y
k
为质心坐标,u
k,i,j
和v
k,i,j
分别为概率分布图的坐标。
[0012]
根据本发明一个实施例的无监督特征点检测方法,所述预设损失函数为:
[0013]
l=ω1l
self
+ω1l
norm

[0014][0015][0016]
其中,ω1和ω1为两个约束函数之间调节的权重,i为输入编码器网络之前的图像,i

为解码器网络输出的图像。
[0017]
根据本发明一个实施例的无监督特征点检测方法,所述编码器网络和所述解码器网络为对应的卷积神经网络。
[0018]
根据本发明一个实施例的无监督特征点检测方法,所述方法还包括:根据所述特征点位置概率分布图和高斯重构后特征图,确定待检测图像的特征点检测置信度。
[0019]
根据本发明一个实施例的无监督特征点检测方法,所述根据所述特征点位置概率分布图和高斯重构后特征图,确定待检测图像的特征点检测置信度,包括:
[0020]
a
k
=exp(

ω3||d
k

g
k
||2;
[0021]
其中,a
k
为第k个特征点的置信度,ω3为预设权重,d
k
和g
k
分别为特征点在概率分布图和高斯重构后特征图的特征值。
[0022]
本发明还提供一种无监督特征点检测装置,包括:特征提取模块,用于利用编码器网络对训练图像提取特征,得到k个通道的特征图,归一化后生成特征点位置概率分布图;高斯重构模块,用于对所述概率分布图求解质心后,基于所述质心对概率分布图进行高斯重构;无监督训练模块,用于将高斯重构后特征图,输入解码器网络得到输出图像,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值,根据多次训练结果,得到损失函数最小时的编码器网络;特征点检测模块,用于基于训练后的编码器网络,确定待检测图像的k个特征点位置。
[0023]
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述无监督特征点检测方法的步骤。
[0024]
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述无监督特征点检测方法的步骤。
[0025]
本发明提供的无监督特征点检测方法及装置,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值,无需手工标注特征点位置来进行有监督学习,可有效避免人工标注的人力成本和人工标注带来的主观错误,同时能够提高检测效率。
附图说明
[0026]
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]
图1是本发明提供的无监督特征点检测方法的流程示意图;
[0028]
图2是本发明提供的无监督特征点检测装置的结构示意图;
[0029]
图3是本发明提供的电子设备的结构示意图。
具体实施方式
[0030]
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0031]
卷积神经网络:是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一
[0032]
无监督学习:根据目标未知(没有被标记)的训练样本解决模式识别中的各种问题,称之为无监督学习。
[0033]
特征点:图像中感兴趣的点,通常是图像灰度值发生剧烈变化的点或者在图像边缘上曲率较大的点(即两个边缘的交点),如sift特征点,orb特征点以及具有语义信息的结构点;
[0034]
特征点检测:通过特定算法检测、提取图像中特征点的过程;
[0035]
置信度:可靠程度,置信水平,表示某一参数的真实值落在预测值上的概率。
[0036]
下面结合图1

图3描述本发明的无监督特征点检测方法及装置。图1是本发明提供的无监督特征点检测方法的流程示意图,如图1所示,本发明提供无监督特征点检测方法,包括:
[0037]
101、利用编码器网络对训练图像提取特征,得到k个通道的特征图,归一化后生成特征点位置概率分布图。
[0038]
本发明中的训练图像为通过目标检测算法或已有数据集获得同一类别不同实例图像,裁剪到固定大小,并通过随机旋转和颜色变换进行数据增强以提高算法对旋转,光照变化的鲁棒性。编码器网络,即特征提取网络,不限于任何网络结构,可为全卷积网络。在本实施例中可采用减少网络参数的hr

net提取特征。
[0039]
处理后的输入图像送入全卷积图像编码网络h,通过不同尺度,全局和局部的图像特征提取融合,最终生成k个通道的初始特征点位置概率分布图其中k为预先设置的特征点数目,w

和h

分别为输出概率图的宽和长。由于单个特征点在图像上的位置分布概率总和应为1,则通过特征提取网络预测的初始概率分布图q需要进行进一步的归一化得到最终特征点位置概率分布图其中:
[0040][0041]
102、对所述概率分布图求解质心后,基于所述质心对概率分布图进行高斯重构。
[0042]
该步骤通过预测的特征点位置概率分布图进行高斯重构,生成特征点位置的高斯概率分布图。该步骤主要为了去掉特征提取网络生成的位置概率分布图d中可能存在的颜色等外观信息,仅保留有效的位置信息。求解质心主要获得高斯重构中的目标中心位置,以使得重构的高斯概率分布与原始的特征点位置概率分布尽可能一致。由于最大值函数无法计算梯度,以进行反向传播训练,质心计算可作为最大值函数的有效近似。
[0043]
103、将高斯重构后特征图,输入解码器网络得到输出图像,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值;根据多次训练结果,得到损失函数最小时的编码器网络。
[0044]
将高斯重构后的概率分布图送入生成网络,通过自监督约束训练网络实现无监督特征点检测。解码器网络为生成网络,相应地生成网络可为全卷积神经网络,输入为高斯概率分布图g,输出为生成得到输出图像生成网络结构没有明确要求,采用与图像编码网络对应结构的网络作为生成网络。
[0045]
为了使得完整算法可以在无监督情况下端到端训练,预设置损失函数进行约束。可采用两个约束函数,一个根据输入图像和输出图像确定,另一个根据概率分布图和高斯重构后特征图确定,两个约束函数之间通过加权得到损失函数。在损失函数的约束下进行无监督训练,最终得到训练后的编码器网络。
[0046]
104、基于训练后的编码器网络,确定待检测图像的k个特征点位置。
[0047]
对于待检测图像,输入训练后的编码器网络,便可得到对应的k个通道的特征图,对每个特征图找出最大值,可得到对应的k个特征点位置。
[0048]
本发明实施例的无监督特征点检测方法,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值,无需手工标注特征点位置来进行有监督学习,可有效避免人工标注的人力成本和人工标注带来的主观错误,同时能够提高检测效率。
[0049]
在一个实施例中,所述对所述概率分布图求解质心,包括:
[0050][0051]
其中,为空间归一化因子,w

,h

分别为概率分布图宽和高,d
k,i,j
为概率分布图的特征值。
[0052]
在一个实施例中,所述基于所述质心对概率分布图进行高斯重构,包括:
[0053][0054]
其中,δ为预设的标准差,x
k
和y
k
为质心坐标,u
k,i,j
和v
k,i,j
分别为概率分布图的坐
标。
[0055]
对于每个特征点位置概率分布的质心m
k
,以该质心位置作为二维高斯函数的中心位置,构建标准差为δ的高斯概率分布函数标准差δ值可手工设置,该值决定特征点分布的聚集程度和特征匹配的接受域大小。其中δ越小,特征点概率分布越聚集,越精确,但特征匹配的接受域越小,匹配的可靠性越低。可通过特征点数目以选择合适的δ值大小。
[0056]
在一个实施例中,所述预设损失函数为:
[0057]
l=ω1l
self
+ω1l
norm

[0058][0059][0060]
其中,ω1和ω1为两个约束函数之间调节的权重,i为输入编码器网络之前的图像,i

为解码器网络输出的图像。
[0061]
两个约束函数,为自监督约束loss函数l
self
和正则化约束loss函数l
norm
。通过该两个约束函数共同约束网络训练,以完成合理的特征点检测和有效的特征点匹配目标。可更改图像编码网络和生成网络结构,如修改约束函数中的2

范式为1

范式等。
[0062]
在一个实施例中,所述编码器网络和所述解码器网络为对应的卷积神经网络。本发明对解码器网络结构没有明确限定,可采用与图像编码网络相应结构的网络作为生成网络。例如,图像编码网络为输入w
×
h图像,输出w
′×
h

特征图的卷积网络,则解码器网络为输入w
′×
h

高斯重构后特征图,输出w
×
h图像的卷积网络。
[0063]
在一个实施例中,所述方法还包括:根据所述特征点位置概率分布图和高斯重构后特征图,确定待检测图像的特征点检测置信度。
[0064]
该步骤主要实现无监督特征点检测的置信度量化。在目前的无监督特征点检测中,由于没有训练目标,难以实现单个无监督检测特征点可靠性的评估。本发明提出一种置信求解方法,以实现无监督特征点检测的置信度量化。具体方法为:通过特征提取网络获得的特征点位置概率图d和进行高斯重构的概率图g之间相似性最终构建特征点检测置信度
[0065]
在一个实施例中,所述根据所述特征点位置概率分布图和高斯重构后特征图,确定待检测图像的特征点检测置信度,包括:
[0066]
a
k
=exp(

ω3||d
k

g
k
||2;
[0067]
其中,a
k
为第k个特征点的置信度,ω3为预设权重,d
k
和g
k
分别为特征点在概率分布图和高斯重构后特征图的特征值。
[0068]
经实验验证,对于语义特征或梯度特征明显位置的检测特征点,上述置信度越高,对于遮挡区域的特征点检测置信度更低。
[0069]
特征点数目k可以手工设置,物体也可以为任何类别,即使在没有任何监督的情况下,检测到的特征点仍具有有效的语义信息,如眉毛,鼻子和嘴角,并能够有效实现跨实例一致性。
[0070]
下面对本发明提供的无监督特征点检测装置进行描述,下文描述的无监督特征点
检测装置与上文描述的无监督特征点检测方法可相互对应参照。
[0071]
图2是本发明提供的无监督特征点检测装置的结构示意图,如图2所示,该无监督特征点检测装置包括:特征提取模块201、高斯重构模块202、无监督训练模块203和特征点检测模块204。其中,特征提取模块201用于利用编码器网络对训练图像提取特征,得到k个通道的特征图,归一化后生成特征点位置概率分布图;高斯重构模块202用于对所述概率分布图求解质心后,基于所述质心对概率分布图进行高斯重构;无监督训练模块203用于将高斯重构后特征图,输入解码器网络得到输出图像,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值,根据多次训练结果,得到损失函数最小时的编码器网络;特征点检测模块204用于基于训练后的编码器网络,确定待检测图像的k个特征点位置。
[0072]
本发明实施例提供的装置实施例是为了实现上述各方法实施例的,具体流程和详细内容请参照上述方法实施例,此处不再赘述。
[0073]
本发明实施例提供的无监督特征点检测装置,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值,无需手工标注特征点位置来进行有监督学习,可有效避免人工标注的人力成本和人工标注带来的主观错误,同时能够提高检测效率。
[0074]
图3是本发明提供的电子设备的结构示意图,如图3所示,该电子设备可以包括:处理器(processor)301、通信接口(communications interface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储器303中的逻辑指令,以执行无监督特征点检测方法,该方法包括:利用编码器网络对训练图像提取特征,得到k个通道的特征图,归一化后生成特征点位置概率分布图;对所述概率分布图求解质心后,基于所述质心对概率分布图进行高斯重构;将高斯重构后特征图,输入解码器网络得到输出图像,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值;根据多次训练结果,得到损失函数最小时的编码器网络;基于训练后的编码器网络,确定待检测图像的k个特征点位置。
[0075]
此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0076]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的无监督特征点检测方法,该方法包括:利用编码器网络对训练图像提取特征,得到k个通道的特征图,归一化后生成特征点位置概率分布图;对所述概率分布图求解质心后,基于所述质心对概率分布图进行高斯重构;将高斯重构后特征图,输入解码器网络得到输出图像,根据输入图像、输出图像、概率
分布图和高斯重构后特征图,确定预设损失函数的损失值;根据多次训练结果,得到损失函数最小时的编码器网络;基于训练后的编码器网络,确定待检测图像的k个特征点位置。
[0077]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的无监督特征点检测方法,该方法包括:利用编码器网络对训练图像提取特征,得到k个通道的特征图,归一化后生成特征点位置概率分布图;对所述概率分布图求解质心后,基于所述质心对概率分布图进行高斯重构;将高斯重构后特征图,输入解码器网络得到输出图像,根据输入图像、输出图像、概率分布图和高斯重构后特征图,确定预设损失函数的损失值;根据多次训练结果,得到损失函数最小时的编码器网络;基于训练后的编码器网络,确定待检测图像的k个特征点位置。
[0078]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0079]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0080]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1