基于距离信息的单幅图像相机焦距估计方法

文档序号:27433907发布日期:2021-11-17 22:37阅读:261来源:国知局
基于距离信息的单幅图像相机焦距估计方法

1.本发明涉及相机标定和图像焦距估计的技术领域,尤其是指一种基于距离信息的单幅图像相机焦距估计方法。


背景技术:

2.相机标定是指从单幅或多幅图像当中估计相机的内外参数,在很多计算机视觉任务中有重要作用。在相机的5个内参当中,相机焦距是最重要的,可用于距离估算、视角转换、场景重建等任务。
3.在典型的实验室场景中,相机标定通常通过拍摄多张标定物的图片完成。这种方法精度高但是无法应用于普通场景的相机标定。随着对任意图像的相机标定的需求增加,有两类方法得到了发展,它们分别是:1、基于图像线索的方法,这类方法使用图像上可见的线索,例如灭点,共面圆,同心圆等等进行标定,需要图像当中出现这种特定的模式才能进行标定;2、基于深度学习的方法,这类方法使用大量的数据进行强监督学习,对任意图片均可进行相机标定,但是受域适应问题的影响,其精度仍然需要改善。


技术实现要素:

4.本发明的目的在于克服现有技术的缺点与不足,提出了一种基于距离信息的单幅图像相机焦距估计方法,能够使用图像上普遍存在的距离信息进行相机标定,缓解图像线索难以寻找的问题,同时提高了相机标定的精度,进一步可实现更灵活和精确的下游应用。
5.为实现上述目的,本发明所提供的技术方案为:基于距离信息的单幅图像相机焦距估计方法,包括以下步骤:
6.1)从单幅图像当中人工标记距离信息,其中包括n个标记点和标记点之间的至少n+1段物理距离;
7.2)根据简化针孔相机模型,使用距离信息建立非线性方程组,再利用单目标优化问题转化法将非线性方程组转化为基于归一化距离的优化问题;
8.3)使用多随机初始化点的l

bfgs

b优化算法求解基于归一化距离的优化问题,得到初步的相机焦距估计值;
9.4)使用深度扰动技术增强初步的相机焦距估计值的稳定性,得到最终的相机焦距估计值。
10.进一步,在步骤1)中,标记点是指图像上标记出来的像素点,表示为:
[0011][0012]
式中,m
i
是指第i个标记点,u
i
和v
i
分别是m
i
在像素坐标系下的u轴和v轴分量,共有n个点;
[0013]
标记点之间的物理距离是指标记点所对应的相机坐标系下的三维点之间的物理
距离,其中标记点所对应的相机坐标系下的三维点表示为:
[0014][0015]
式中,m
i
是指第i个标记点m
i
所对应的相机坐标系下的三维点,x
i
、y
i
和z
i
分别表示m
i
在相机坐标系下的x轴、y轴和z轴分量;而标记点之间的物理距离则表示为:
[0016]
d
ij
=||m
i

m
j
||,1≤i<j≤n
[0017]
式中,d
ij
是指标记点所对应的相机坐标系下的三维点m
i
和m
j
之间的物理距离,也即m
i

m
j
的2

范数;n个标记点及标记点之间至少n+1段物理距离需要人工标记,且n≥4。
[0018]
进一步,所述步骤2)包括以下步骤:
[0019]
2.1)根据简化针孔相机模型,使用距离信息建立非线性方程组;简化针孔相机模型为:
[0020]
zm=am
[0021]
式中,z为标记点m的深度,m是标记点m对应的相机坐标系下的三维点,a是图像对应的相机内参矩阵:
[0022][0023]
式中,f为图像对应的相机焦距,是待求解的;w和h为图像的宽度和高度,是能够从图像上直接获取的;根据简化针孔相机模型,标记点对应的相机坐标系下的三维点能够通过m=a
‑1zm求得;根据标记点所对应的相机坐标系下的三维点m
i
和m
j
之间的物理距离d
ij
的定义:
[0024]
d
ij
=||m
i

m
j
||,1≤i<j≤n
[0025]
建立非线性方程组:
[0026]
d
ij
=||a
‑1(z
i
m
i

z
j
m
j
)||,1≤i<j≤n
[0027]
式中,z
i
为第i个标记点的深度值;待求解量为焦距f和标记点的深度值的集合z={z
i
}={z
i
|i=1,2,...,n},已知量为d
ij
和m
i

[0028]
2.2)利用单目标优化问题转化法将非线性方程组转化为基于归一化距离的优化问题,其中单目标优化问题转化法是指将非线性方程组改写为各方程左右两项差的平方和的单目标优化问题;基于归一化距离的优化问题是指将优化问题中的每一项都除以对应的距离d
ij
,进行归一化得到的优化问题;基于归一化距离的优化问题最终表示为:
[0029][0030]
式中,argmin是指求解使得右边求和式取得最小值的参数值,其中待求解的参数值包括相机内参矩阵a和标记点的深度值的集合{z
i
},d
ij
是标记点之间的物理距离的指示函数,其定义为:
[0031][0032]
ε是一个微小的量,用于增加问题求解的稳定性,这里设置为10
‑6。
[0033]
进一步,在步骤3)中,使用多随机初始化点的l

bfgs

b优化算法是指在l

bfgs

b优化算法的初始化阶段,通过多次随机地初始化待求解参数相机内参矩阵a和标记点的深度值的集合{z
i
},比较每次求解基于归一化距离的优化问题的能量值大小,取最小能量值所对应的参数求解值,得到初步的相机焦距估计值。
[0034]
进一步,在步骤4)中,深度扰动技术是指在距离信息提供的监督信息不足时所采用的一种减少相机焦距估计误差的缓和技术,包括以下步骤:
[0035]
4.1)通过优化得到的深度值判断距离信息是否提供了足够的监督信息,定义过滤指标r(z)为:
[0036][0037]
式中,max(z)是指求集合z的最大值,min(z)是指求集合z的最小值,z为标记点m
i
的深度值z
i
的集合;引入新的距离:
[0038][0039]
式中,k是在1~n当中随机选取的值,是在相机坐标系下的三维点m
k
基础上加上z轴扰动得到的新的相机坐标系下的三维点;
[0040][0041]
这里η是一个阈值,设置为1.5;λ是一个经验值,设置为0.1;
[0042]
4.2)应用深度扰动后得到新的距离,再次进行步骤3)优化求解基于归一化距离的优化问题,得到最终的相机焦距估计值。
[0043]
本发明与现有技术相比,具有如下优点与有益效果:
[0044]
1、本发明首次采用距离信息进行相机标定,突破图像线索难以寻找的缺点,避免了深度学习方法域适应性差的缺点。
[0045]
2、本发明与其它单幅图像上的相机标定方法相比,提高了标定精度。
[0046]
3、本发明方法在计算机视觉任务中具有广泛的使用空间,操作简单、适应性强,具有广阔的应用前景。
附图说明
[0047]
图1为本发明逻辑流程示意图。
[0048]
图2为本发明所使用的距离信息实例示意图。
具体实施方式
[0049]
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
[0050]
如图1和图2所示,本实施例所提供的基于距离信息的单幅图像相机焦距估计方法,使用了图像距离信息及l

bfgs

b优化算法,其包括以下步骤:
[0051]
1)输入图像,标记n个标记点和标记点之间的至少n+1段物理距离。标记点是指图像上标记出来的像素点,表示为:
[0052][0053]
其中m
i
是指第i个标记点,u
i
和v
i
分别是m
i
在像素坐标系下的u轴和v轴分量,共有n个点。标记点之间的物理距离是指标记点所对应的相机坐标系下的三维点之间的物理距离,其中标记点所对应的相机坐标系下的三维点表示为:
[0054][0055]
其中m
i
是指第i个标记点m
i
所对应的相机坐标系下的三维点,x
i
,y
i
和z
i
分别表示m
i
在相机坐标系下的x轴,y轴和z轴分量;而标记点之间的物理距离则表示为:
[0056]
d
ij
=||m
i

m
j
||,1≤i<j≤n,
[0057]
其中d
ij
是指标记点所对应的相机坐标系下的三维点m
i
和m
j
之间的物理距离,也即m
i

m
j
的2

范数。n个标记点及标记点之间至少n+1段物理距离需要人工标记,且n≥4。如图2所示,此时n=4,人工标记的4个标记点的像素坐标分别为(467,214),(879,147),(873,646)和(379,629),所标记的5段物理距离为80cm,80cm,80cm,80cm和113.14cm。
[0058]
2)根据简化针孔相机模型,使用距离信息建立非线性方程组,再利用单目标优化问题转化法将非线性方程组转化为基于归一化距离的优化问题,包括以下步骤:
[0059]
2.1)根据简化针孔相机模型,使用距离信息建立非线性方程组;简化针孔相机模型为
[0060]
zm=am,
[0061]
其中z为标记点m的深度,m是标记点m对应的相机坐标系下的三维点,a是图像对应的相机内参矩阵,
[0062][0063]
其中f为图像对应的相机焦距,是待求解的;w和h为图像的宽度和高度,是可以从
图像上直接获取的。根据简化针孔相机模型,标记点对应的相机坐标系下的三维点可以通过m=a
‑1zm求得。根据标记点所对应的相机坐标系下的三维点m
i
和m
j
之间的物理距离d
ij
的定义:
[0064]
d
ij
=||m
i

m
j
||,1≤i<j≤n,
[0065]
建立非线性方程组:
[0066]
d
ij
=||a
‑1(z
i
m
i

z
j
m
j
)||,1≤i<j≤n,
[0067]
其中z
i
为第i个标记点的深度值;待求解量为焦距f和标记点的深度值的集合z={z
i
}={z
i
|i=1,2,...,n},已知量为d
ij
,1≤i<j≤n和m
i
,i=1,2,...,n。例如使用图2的距离信息建立的非线性方程组中的一个方程为
[0068][0069]
2.2)利用单目标优化问题转化法将非线性方程组转化为基于归一化距离的优化问题,其中单目标优化问题转化法是指将非线性方程组改写为各方程左右两项差的平方和的单目标优化问题;基于归一化距离的优化问题是指将优化问题中的每一项都除以对应的距离d
ij
,进行归一化得到的优化问题。基于归一化距离的优化问题最终表示为:
[0070][0071]
其中argmin是指求解使得右边求和式取得最小值的参数值,其中待求解的参数值包括相机内参矩阵a和标记点的深度值的集合{z
i
},d
ij
是标记点之间的物理距离的指示函数,其定义为:
[0072][0073]
ε是一个微小的量,用于增加问题求解的稳定性,这里设置为10
‑6。例如使用图2的距离信息建立的基于归一化距离的优化问题中的一项为:
[0074][0075]
3)使用多随机初始化点的l

bfgs

b优化算法是指在l

bfgs

b优化算法的初始化阶段,通过多次随机地初始化待求解参数相机内参矩阵和标记点的深度值的集合,比较每次求解基于归一化距离的优化问题的能量值大小,取最小能量值所对应的参数求解值,得到初步的相机焦距估计值。
[0076]
4)使用深度扰动技术增强初步的相机焦距估计值的稳定性,得到最终的相机焦距估计值。深度扰动技术是指在距离信息提供的监督信息不足够时所采用的一种减少相机焦距估计误差的缓和技术,包括以下步骤:
[0077]
4.1)通过优化得到的深度值判断距离信息是否提供了足够的监督信息。定义过滤指标r(z)为:
[0078][0079]
其中max(z)是指求集合z的最大值,min(z)是指求集合z的最小值,z为标记点m
i
的深度值z
i
的集合。我们引入新的距离:
[0080][0081]
其中k是在1~n当中随机选取的值,是在相机坐标系下的三维点m
k
基础上加上z轴扰动得到的新的相机坐标系下的三维点;
[0082][0083]
这里η是一个阈值,设置为1.5;λ是一个经验值,设置为0.1。
[0084]
4.2)应用深度扰动后得到新的距离,再次进行步骤3)优化求解基于归一化距离的优化问题,得到最终的相机焦距估计值。
[0085]
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1