一种全景视频拼接方法与流程

文档序号：12674810阅读：来源：国知局

技术特征：

1.一种全景视频拼接方法，其特征在于，包括以下步骤：

获取一组图像并生成模板；

使用模板将视频每一帧进行空间映射；

将映射后的视频帧渲染成全景视频，

其中，生成模板包括以下步骤：

对图像进行畸变校正；

对校正后的图像进行特征点提取及特征点匹配；

使用优化算法以及特征点匹配结果估计空间映射参数，将映射参数保存成模板。

2.根据权利要求1所述的方法，其特征在于，所述对图像进行畸变校正，采用经纬度校正法，在一条确定的经度上，图像上一点的椭圆方程为：

$<mrow> <mfrac> <msup> <mi>x</mi> <mn>2</mn> </msup> <msup> <mi>a</mi> <mn>2</mn> </msup> </mfrac> <mo>+</mo> <mfrac> <msup> <mi>y</mi> <mn>2</mn> </msup> <msup> <mi>b</mi> <mn>2</mn> </msup> </mfrac> <mo>=</mo> <mn>1</mn> <mo>,</mo> </mrow>$

经纬度校正后的坐标为(x1,y1)，校正关系为：

$<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>x</mi> <mn>1</mn> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <msqrt> <mrow> <mn>1</mn> <mo>-</mo> <msup> <mi>y</mi> <mn>2</mn> </msup> <mo>/</mo> <msup> <mi>a</mi> <mn>2</mn> </msup> </mrow> </msqrt> </mfrac> <mo>*</mo> <mi>x</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>y</mi> <mn>1</mn> </msub> <mo>=</mo> <mi>y</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>.</mo> </mrow>$

3.根据权利要求1所述的方法，其特征在于，所述特征点提取包括以下步骤：

用高斯金字塔方法构建尺度空间，对校正后的图像进行若干次的卷积和下采样，得到尺度空间图像；

对构建好的尺度空间图像进行搜索，找到局部极大值点作为初步关键点，然后通过极大值抑制，确定最终的关键点，即特征点；

通过对特征点周围图像区域分块，计算每块内梯度直方图，再用这些直方图生成一个128维向量，即进行特征点描述。

4.根据权利要求3所述的方法，其特征在于，所述卷积，利用如下公式得到卷积后图像：

$<mrow> <mi>G</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>,</mo> <mi>σ</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>2</mn> <msup> <mi>πσ</mi> <mn>2</mn> </msup> </mrow> </mfrac> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mfrac> <mrow> <msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>-</mo> <msub> <mi>x</mi> <mn>0</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msup> <mrow> <mo>(</mo> <mi>y</mi> <mo>-</mo> <msub> <mi>y</mi> <mn>0</mn> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> <mrow> <mn>2</mn> <msup> <mi>σ</mi> <mn>2</mn> </msup> </mrow> </mfrac> </mrow> </msup> <mo>,</mo> </mrow>$

L(x,y,σ)＝I(x,y)*G(x,y,σ)，

其中I(x,y)为原图像，G(x,y,σ)为高斯函数，L(x,y,σ)为卷积后图像。

5.根据权利要求3所述的方法，其特征在于，所述特征点匹配，首先从一张图像中选择一个特征点，根据其特征点描述，从另一张图像中搜索出与该特征点描述最相似的特征点描述，即形成一对匹配的特征点。

6.根据权利要求1所述的方法，其特征在于，所述使用优化算法以及特征点匹配结果估计空间映射参数，为用若干对匹配的特征点，通过优化算法估计空间映射参数，包括旋转量、平移量、及畸变量，将这些参数保存成模板。

7.根据权利要求1所述的方法，其特征在于，所述优化算法为最小二乘法或LevenBerg-Marquardt算法。

8.根据权利要求1所述的方法，其特征在于，所述使用模板将视频每一帧进行空间映射，为根据所生成的模板中的空间映射参数，将视频的每一帧图像投影到全景平面上。

9.根据权利要求1所述的方法，其特征在于，所述将映射后的视频帧渲染成全景视频，是通过图像的线性融合，生成全景视频。

10.根据权利要求9所述的方法，其特征在于，所述线性融合，是对若干图像进行线性加权，包括以下步骤：

将图像映射到全景图像时，生成每个有效像素点的权重系数w，无效区的权重系数为0；

不同镜头间存在重合区域，即存在不同幅图像映射到全景图像中的同一个点，全景图像的像素值由如下公式得到：

$<mrow> <mi>P</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>I</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>*</mo> <msub> <mi>w</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>/</mo> <munderover> <mo>Σ</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>w</mi> <mi>n</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

其中，N为有N个图像映射到全景图像中的同一个点，I_n(x,y)为第n个图像的像素值，w_n(x,y)为第n个图像在点(x,y)的权重。

11.根据权利要求1所述的方法，其特征在于，所述将映射后的视频帧渲染成全景视频，是通过图像的多重融合或无缝融合或泊松融合，生成全景视频。

完整全部详细技术资料下载

当前第2页1 2 3