一种基于支持向量回归的视觉映射方法与流程

文档序号:11920834阅读:来源:国知局

技术特征:

1.一种基于支持向量回归的视觉映射方法,该方法包括:

步骤1:根据实际问题采集N幅输入图像,并根据采集每幅图像时标定各图像对应的目标值;

步骤2:将步骤1中得到的图像提取视觉特征,并记任意第n幅图像对应的视觉特征向量D表示视觉特征向量的维数;

步骤3:将所有N幅图像对应特征向量按顺序排列可以得到输入数据矩阵X,即X=[x1,x2,...,xN];

步骤4:将N幅图像对应的目标值向量按顺序排列为数据矩阵y,即Y=[y1,y2,...yN];

步骤5:为了方便叙述,假设yn为一维的情况下,介绍支持向量回归模型,当实际输入yn为高维时,则依次按维数建立支持向量回归模型;具体来讲,支持向量机回归假设输入与输出之间存在下述关系:

<mrow> <msub> <mi>y</mi> <mi>n</mi> </msub> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>w</mi> <mi>i</mi> </msub> <mi>k</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>w</mi> <mn>0</mn> </msub> <mo>+</mo> <msub> <mi>&epsiv;</mi> <mi>n</mi> </msub> <mo>=</mo> <mi>y</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>&epsiv;</mi> <mi>n</mi> </msub> </mrow>

w=[w1,w2,...,wN]T为权向量,w0为偏差,εn为噪声,k(xn,xi)为度量xn和xi之间距离的核函数,支持向量机回归规定在给定阈值∈的情况下,w,w0的最优解满足以下目标式的取值最小,

<mrow> <mi>C</mi> <munderover> <mi>&Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>E</mi> <mo>&Element;</mo> </msub> <mrow> <mo>(</mo> <mi>y</mi> <mo>(</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>)</mo> <mo>-</mo> <msub> <mi>y</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>w</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> </mrow>

其中C表示向量回归中控制回归误差容忍程度的参数,函数E(y(xn)-yn)的表达式为:

∈表示根据实际情况设定的阈值;

步骤6:建立步骤3和4中得到的所有图像的视觉特征及其对应估的目标值之间的回归模型,利用LIBSVM工具包求解回归参数w和w0,在求解时所使用的核函数类型为RBF类型;

步骤7:对于测试图像,我们按照步骤2中的方法对其进行梯度方向直方图特征提取,最后利用步骤6中得到的参数w和w0估计目标值

<mrow> <mover> <mi>y</mi> <mo>^</mo> </mover> <mo>=</mo> <munderover> <mi>&Sigma;</mi> <mrow> <mi>n</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msub> <mi>w</mi> <mi>n</mi> </msub> <mi>k</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <msub> <mi>x</mi> <mi>n</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>w</mi> <mn>0</mn> </msub> </mrow>

k(·,·)为RBF核函数。

2.如权利要求1所述的一种基于支持向量回归的视觉映射方法,其特征在于所述步骤1中进一步的,所述步骤1中,如果为头部姿态估计问题,N幅输入图像即为N幅头部图像,标定值则为头部姿态yn,yn的第一维表示俯仰角,第二维表示倾斜角,第三维表示旋转角,下标n表示第n幅图像对应的姿态;如果是身体姿态估计问题,输入图像为身体图像,目标值为身体各部分之间的角度,如果是视线估计问题,输入图像为眼部图像,目标值为视线方向:水平方向角度和垂直方向角度。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1