一种全景视频拼接方法与流程

文档序号:12674810阅读:来源:国知局

技术特征:

1.一种全景视频拼接方法,其特征在于,包括以下步骤:

获取一组图像并生成模板;

使用模板将视频每一帧进行空间映射;

将映射后的视频帧渲染成全景视频,

其中,生成模板包括以下步骤:

对图像进行畸变校正;

对校正后的图像进行特征点提取及特征点匹配;

使用优化算法以及特征点匹配结果估计空间映射参数,将映射参数保存成模板。

2.根据权利要求1所述的方法,其特征在于,所述对图像进行畸变校正,采用经纬度校正法,在一条确定的经度上,图像上一点的椭圆方程为:

<mrow> <mfrac> <msup> <mi>x</mi> <mn>2</mn> </msup> <msup> <mi>a</mi> <mn>2</mn> </msup> </mfrac> <mo>+</mo> <mfrac> <msup> <mi>y</mi> <mn>2</mn> </msup> <msup> <mi>b</mi> <mn>2</mn> </msup> </mfrac> <mo>=</mo> <mn>1</mn> <mo>,</mo> </mrow>

经纬度校正后的坐标为(x1,y1),校正关系为:

<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <msqrt> <mrow> <mn>1</mn> <mo>-</mo> <msup> <mi>y</mi> <mn>2</mn> </msup> <mo>/</mo> <msup> <mi>a</mi> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> <mo>*</mo> <mi>x</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mn>1</mn> </msub> <mo>=</mo> <mi>y</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>.</mo> </mrow>

3.根据权利要求1所述的方法,其特征在于,所述特征点提取包括以下步骤:

用高斯金字塔方法构建尺度空间,对校正后的图像进行若干次的卷积和下采样,得到尺度空间图像;

对构建好的尺度空间图像进行搜索,找到局部极大值点作为初步关键点,然后通过极大值抑制,确定最终的关键点,即特征点;

通过对特征点周围图像区域分块,计算每块内梯度直方图,再用这些直方图生成一个128维向量,即进行特征点描述。

4.根据权利要求3所述的方法,其特征在于,所述卷积,利用如下公式得到卷积后图像:

<mrow> <mi>G</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>,</mo> <mi>&sigma;</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>2</mn> <msup> <mi>&pi;&sigma;</mi> <mn>2</mn> </msup> </mrow> </mfrac> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mfrac> <mrow> <msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>-</mo> <msub> <mi>x</mi> <mn>0</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mi>y</mi> <mo>-</mo> <msub> <mi>y</mi> <mn>0</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> <mrow> <mn>2</mn> <msup> <mi>&sigma;</mi> <mn>2</mn> </msup> </mrow> </mfrac> </mrow> </msup> <mo>,</mo> </mrow>

L(x,y,σ)=I(x,y)*G(x,y,σ),

其中I(x,y)为原图像,G(x,y,σ)为高斯函数,L(x,y,σ)为卷积后图像。

5.根据权利要求3所述的方法,其特征在于,所述特征点匹配,首先从一张图像中选择一个特征点,根据其特征点描述,从另一张图像中搜索出与该特征点描述最相似的特征点描述,即形成一对匹配的特征点。

6.根据权利要求1所述的方法,其特征在于,所述使用优化算法以及特征点匹配结果估计空间映射参数,为用若干对匹配的特征点,通过优化算法估计空间映射参数,包括旋转量、平移量、及畸变量,将这些参数保存成模板。

7.根据权利要求1所述的方法,其特征在于,所述优化算法为最小二乘法或LevenBerg-Marquardt算法。

8.根据权利要求1所述的方法,其特征在于,所述使用模板将视频每一帧进行空间映射,为根据所生成的模板中的空间映射参数,将视频的每一帧图像投影到全景平面上。

9.根据权利要求1所述的方法,其特征在于,所述将映射后的视频帧渲染成全景视频,是通过图像的线性融合,生成全景视频。

10.根据权利要求9所述的方法,其特征在于,所述线性融合,是对若干图像进行线性加权,包括以下步骤:

将图像映射到全景图像时,生成每个有效像素点的权重系数w,无效区的权重系数为0;

不同镜头间存在重合区域,即存在不同幅图像映射到全景图像中的同一个点,全景图像的像素值由如下公式得到:

<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>I</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>*</mo> <msub> <mi>w</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>/</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>w</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

其中,N为有N个图像映射到全景图像中的同一个点,In(x,y)为第n个图像的像素值,wn(x,y)为第n个图像在点(x,y)的权重。

11.根据权利要求1所述的方法,其特征在于,所述将映射后的视频帧渲染成全景视频,是通过图像的多重融合或无缝融合或泊松融合,生成全景视频。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1