一种基于支持向量回归的视觉映射方法与流程

文档序号：11920834阅读：来源：国知局

技术特征：

1.一种基于支持向量回归的视觉映射方法，该方法包括：

步骤1：根据实际问题采集N幅输入图像，并根据采集每幅图像时标定各图像对应的目标值；

步骤2：将步骤1中得到的图像提取视觉特征，并记任意第n幅图像对应的视觉特征向量D表示视觉特征向量的维数；

步骤3：将所有N幅图像对应特征向量按顺序排列可以得到输入数据矩阵X，即X＝[x₁，x₂，...，x_N]；

步骤4：将N幅图像对应的目标值向量按顺序排列为数据矩阵y，即Y＝[y₁，y₂，...y_N]；

步骤5：为了方便叙述，假设y_n为一维的情况下，介绍支持向量回归模型，当实际输入y_n为高维时，则依次按维数建立支持向量回归模型；具体来讲，支持向量机回归假设输入与输出之间存在下述关系：

$<mrow> <msub> <mi>y</mi> <mi>n</mi> </msub> <mo>=</mo> <munderover> <mi>Σ</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>w</mi> <mi>i</mi> </msub> <mi>k</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>w</mi> <mn>0</mn> </msub> <mo>+</mo> <msub> <mi>ϵ</mi> <mi>n</mi> </msub> <mo>=</mo> <mi>y</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>ϵ</mi> <mi>n</mi> </msub> </mrow>$

w＝[w₁，w₂，...，w_N]^T为权向量，w₀为偏差，ε_n为噪声，k(x_n，x_i)为度量x_n和x_i之间距离的核函数，支持向量机回归规定在给定阈值∈的情况下，w，w₀的最优解满足以下目标式的取值最小，

$<mrow> <mi>C</mi> <munderover> <mi>Σ</mi> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>E</mi> <mo>&Element;</mo> </msub> <mrow> <mo>(</mo> <mi>y</mi> <mo>(</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>)</mo> <mo>-</mo> <msub> <mi>y</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>w</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> </mrow>$

其中C表示向量回归中控制回归误差容忍程度的参数，函数E_∈(y(x_n)-y_n)的表达式为：

∈表示根据实际情况设定的阈值；

步骤6：建立步骤3和4中得到的所有图像的视觉特征及其对应估的目标值之间的回归模型，利用LIBSVM工具包求解回归参数w和w₀，在求解时所使用的核函数类型为RBF类型；

步骤7：对于测试图像，我们按照步骤2中的方法对其进行梯度方向直方图特征提取，最后利用步骤6中得到的参数w和w₀估计目标值

$<mrow> <mover> <mi>y</mi> <mo>^</mo> </mover> <mo>=</mo> <munderover> <mi>Σ</mi> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>w</mi> <mi>n</mi> </msub> <mi>k</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>w</mi> <mn>0</mn> </msub> </mrow>$

k(·，·)为RBF核函数。

2.如权利要求1所述的一种基于支持向量回归的视觉映射方法，其特征在于所述步骤1中进一步的，所述步骤1中，如果为头部姿态估计问题，N幅输入图像即为N幅头部图像，标定值则为头部姿态y_n，y_n的第一维表示俯仰角，第二维表示倾斜角，第三维表示旋转角，下标n表示第n幅图像对应的姿态；如果是身体姿态估计问题，输入图像为身体图像，目标值为身体各部分之间的角度，如果是视线估计问题，输入图像为眼部图像，目标值为视线方向：水平方向角度和垂直方向角度。

完整全部详细技术资料下载

当前第2页1 2 3