基于缺损数据的非线性特征提取和分类方法与流程

文档序号:11952074阅读:来源:国知局

技术特征:

1.一种基于缺损数据的非线性特征提取和分类方法,其特征在于,包括:

采用缺损数据的距离估计方法来构造数据点的局部邻域集和局部邻域集对应的缺失标记集;

构造基于所述局部邻域集和其对应的缺失标记集的核范数正则化模型,并使用动态自适应迭代算法求解该模型来提取局部坐标;

对齐所述局部坐标,获得全局坐标。

2.根据权利要求1所述的基于缺损数据的非线性特征提取和分类方法,其特征在于,所述采用缺损数据的距离估计方法来构造数据点的局部邻域集和局部邻域集对应的缺失标记集,包括:

对于每个数据点xi(i=1,2,…,n),定义一个缺失性标记向量fi=(fi1,fi2,…,fim)T,其中fit=0当且仅当数据点xi中的第t个属性值缺失,否则fit=1;

用如下公式表示两个具有缺失值的数据点xi和xj之间的距离:

<mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>&Element;</mo> <mi>I</mi> </mrow> </munder> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <msub> <mi>x</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mo>|</mo> </mrow> <mrow> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>&Element;</mo> <mi>I</mi> </mrow> </munder> <msup> <msub> <mi>x</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>&Element;</mo> <mi>I</mi> </mrow> </munder> <msup> <msub> <mi>x</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> <mo>,</mo> <mi>I</mi> <mo>=</mo> <mo>{</mo> <mi>t</mi> <mo>|</mo> <msub> <mi>f</mi> <mrow> <mi>i</mi> <mi>t</mi> </mrow> </msub> <mo>&times;</mo> <msub> <mi>f</mi> <mrow> <mi>j</mi> <mi>t</mi> </mrow> </msub> <mo>=</mo> <mn>1</mn> <mo>}</mo> </mrow>

其中,i=1,2,…,n;j=1,2,…,n;I表示数据点xi和xj已知数值的指标集;

对于每个数据点xi使用上述公式计算出其对应的k个近邻点;

构造数据点xi的局部邻域集和其对应的缺失标记集Fi

3.根据权利要求2所述的基于缺损数据的非线性特征提取和分类方法,其特征在于,所述核范数正则化模型如下:

其中,⊙表示矩阵之间的点乘,c和Z为模型的解,e=[1,1,…,1]T,λ表示正则化参数。

4.根据权利要求3所述的基于缺损数据的非线性特征提取和分类方法,其特征在于,所述使用动态自适应迭代算法求解该模型具体指获取模型的最优解c*和Z*

5.根据权利要求4所述的基于缺损数据的非线性特征提取和分类方法,其特征在于,所述获取模型的最优解c*的方法如下:

所述是凸函数;

通过如下公式获取c*最优解,如下:

基于上式求得最优解c*的表达式,如下:

c*=(Fi⊙(Xi-Z*))e·/(Fi)e

其中,·/表示矩阵或向量之间的点除。

6.根据权利要求5所述的基于缺损数据的非线性特征提取和分类方法,其特征在于,所述获取模型的最优解Z*的方法如下:

获取最优解Z*的KKT条件,如下:

其中,表示核函数的次梯度集合;

对上述公式进行等同变换得到:

在其两侧同时加上Z*,进一步变换得到:

根据上式求解如下最小化问题来获取最优解Z*

<mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mi>Z</mi> </munder> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>Z</mi> <mo>-</mo> <msub> <mi>Y</mi> <mo>*</mo> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>+</mo> <mi>&lambda;</mi> <mo>|</mo> <mo>|</mo> <mi>Z</mi> <mo>|</mo> <msub> <mo>|</mo> <mo>*</mo> </msub> </mrow>

由Z*=Sλ(Y*)给出上式的最优解,其中Sλ(·)表示收敛算子;Y的奇异值分解为Σλ=diag[(λ1-λ)+,…,(λr-λ)+]并且(λi-λ)+=max(λi-λ,0);UY和VY分别表示Σλ对应的左右奇异向量组成的矩阵。

7.根据权利要求6所述的基于缺损数据的非线性特征提取和分类方法,其特征在于:所述动态自适应迭代算法指动态调整正则化参数λ,使得最优解Z*的秩d*最终位于一个合理的范围内,而非某一个固定值。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1