一种基于奇异值选择的集成学习器的制作方法

文档序号:12272337阅读:来源:国知局

技术特征:

1.一种基于奇异值选择的集成学习器,其特征在于:包括如下步骤:

步骤一、对训练样本集进行归一化预处理;

步骤二、从归一化预处理后的训练样本集中采用Bootstrap随机抽样方法有放回地抽样,产生M个新的样本集;

步骤三、对M个新的样本集中的每个样本进行部分SVD分解,得到每个样本相应的奇异值和左右奇异向量;

步骤四、每次随机抽取k个奇异值及其相应的左右奇异向量,生成2D SVM基学习器,分别对M个新的样本集进行训练,得到M个2D SVM基分类器;

步骤五、根据相对多数投票准则合并基分类器得到集成学习器,用得到的集成学习器对待分类样本进行分类识别。

2.根据权利要求1所述的一种基于奇异值选择的集成学习器,其特征在于:步骤一所述的对训练样本集进行归一化预处理的方法如下:

S101、对训练样本集中的每个样本分别进行预处理,得到归一化后的训练样本Xi'及其类别标签yi

<mrow> <msup> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>&prime;</mo> </msup> <mo>=</mo> <mfrac> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <mi>r</mi> <mi>e</mi> <mi>p</mi> <mi>m</mi> <mi>a</mi> <mi>t</mi> <mo>{</mo> <mi>m</mi> <mi>i</mi> <mi>n</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>}</mo> </mrow> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>min</mi> <mrow> <mo>(</mo> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>=</mo> <msub> <mi>y</mi> <mi>i</mi> </msub> </mrow>

其中,max(Xi)表示训练样本Xi中的最大值,min(Xi)表示训练样本Xi中的最小值,repmat{min(Xi)}∈Rp×q表示样本最小值矩阵,矩阵中的元素为min(Xi);

S102、用所有预处理后的训练样本Xi'及其类别标签yi构成预处理后的训练样本集

3.根据权利要求1所述的一种基于奇异值选择的集成学习器,其特征在于:步骤三所述对M个新的样本集中的每个样本进行部分SVD分解的方法如下:

S301、样本Xi的SVD分解形式为:Xi=UΣVT,其中Xi∈Rp×q是一个二维的矩阵,U∈Rp×p是Xi的左奇异向量组成的矩阵,Σ∈Rp×q是Xi的奇异值组成的对角矩阵,VT∈Rq×q是Xi的右奇异向量组成的矩阵;

S302、用前r大的奇异值来近似描述样本Xi,部分奇异值分解形式如下:

其中σip,μip,vip为Xi的第p个奇异值及其对应的左右奇异向量。

4.根据权利要求3所述的一种基于奇异值选择的集成学习器,其特征在于:步骤四所述2D SVM基学习器的生成方法如下:

S401、对于二分类任务,给定一个训练数据集其中Xi∈Rp×q是第i个输入样本,yi∈{-1,1}是样本Xi对应的类标签;

S402、2D SVM支持向量机定义如下:

<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <mi>W</mi> <mo>,</mo> <mi>b</mi> <mo>,</mo> <msub> <mi>&xi;</mi> <mi>i</mi> </msub> </mrow> </munder> <mi>J</mi> <mrow> <mo>(</mo> <mi>W</mi> <mo>,</mo> <mi>b</mi> <mo>,</mo> <msub> <mi>&xi;</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>W</mi> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>+</mo> <mi>C</mi> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&xi;</mi> <mi>i</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <msub> <mi>y</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mo>&lt;</mo> <mi>W</mi> <mo>,</mo> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>&gt;</mo> <mo>+</mo> <mi>b</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mn>1</mn> <mo>-</mo> <msub> <mi>&xi;</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>n</mi> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>&xi;</mi> <mi>i</mi> </msub> <mo>&GreaterEqual;</mo> <mn>0</mn> <mo>,</mo> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>n</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>

其中,W为法矩阵,b为位移项;

通过拉格朗日乘子法得到2D SVM支持向量机的对偶问题为:

<mrow> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <munder> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> <mi>&alpha;</mi> </munder> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mo>-</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mi>n</mi> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <msub> <mi>&alpha;</mi> <mi>j</mi> </msub> <msub> <mi>y</mi> <mi>i</mi> </msub> <msub> <mi>y</mi> <mi>j</mi> </msub> <mo>&lt;</mo> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>X</mi> <mi>j</mi> </msub> <mo>&gt;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mtable> <mtr> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> </mtable> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>&le;</mo> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mo>&le;</mo> <mi>C</mi> <mo>,</mo> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>n</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中,<Xi,Xj>是Xi∈Rp×q与Xj∈Rp×q的内积,C=αii,i=1,…,n,式中:αi≥0,βi≥0是拉格朗日乘子;

S403、从每个样本的r个奇异值和相应的左右奇异向量中随机选取k个奇异值及其相应的左右奇异向量,分别为则矩阵Xi和Xj的内积计算如下:

将式(2)代入式(1)中,得2D SVM的最终形式如下:

<mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <munder> <mi>max</mi> <mi>&alpha;</mi> </munder> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mo>-</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mi>n</mi> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>p</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>q</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <msub> <mi>&alpha;</mi> <mi>j</mi> </msub> <msub> <mi>y</mi> <mi>i</mi> </msub> <msub> <mi>y</mi> <mi>j</mi> </msub> <msub> <mi>&lambda;</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <msub> <mi>&lambda;</mi> <mrow> <mi>j</mi> <mi>p</mi> </mrow> </msub> <mo>&lt;</mo> <msub> <mi>u</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>u</mi> <mrow> <mi>j</mi> <mi>q</mi> </mrow> </msub> <mo>&gt;</mo> <mo>&lt;</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>v</mi> <mrow> <mi>j</mi> <mi>q</mi> </mrow> </msub> <mo>&gt;</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <msub> <mi>y</mi> <mi>i</mi> </msub> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>0</mn> <mo>&le;</mo> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <mo>&le;</mo> <mi>C</mi> <mo>,</mo> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>n</mi> </mrow> </mtd> </mtr> </mtable> </mfenced>

基学习器2D SVM分类器f(X)分类决策函数为:

<mrow> <mi>h</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>f</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>s</mi> <mi>i</mi> <mi>g</mi> <mi>n</mi> <mrow> <mo>(</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> <mi>n</mi> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>p</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>q</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>k</mi> </munderover> <msub> <mi>&alpha;</mi> <mi>i</mi> </msub> <msub> <mi>y</mi> <mi>i</mi> </msub> <msub> <mi>&sigma;</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <msub> <mi>&sigma;</mi> <mi>q</mi> </msub> <mo>&lt;</mo> <msub> <mi>u</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>u</mi> <mrow> <mi>i</mi> <mi>q</mi> </mrow> </msub> <mo>&gt;</mo> <mo>&lt;</mo> <msub> <mi>v</mi> <mrow> <mi>i</mi> <mi>p</mi> </mrow> </msub> <mo>,</mo> <msub> <mi>v</mi> <mi>q</mi> </msub> <mo>&gt;</mo> <mo>+</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow>

其中,σip、σq、uip、uq、vip和vq分别为Xi和X的奇异值以及对应的左奇异向量和右奇异向量;

S404、对于2D SVM多分类任务采用一对一的策略进行分类决策。

5.根据权利要求4所述的一种基于奇异值选择的集成学习器,其特征在于:步骤S404所述采用一对一的策略进行分类决策的方法为:给定数据集Xi∈Rp×q,yi∈{C1,C2,…,CN},将N个类别两两配对,从而产生N(N-1)/2个二分类任务。

6.根据权利要求4所述的一种基于奇异值选择的集成学习器,其特征在于:步骤五所述根据相对多数投票准则合并基分类器的方法为:

<mrow> <mi>y</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>)</mo> </mrow> <mo>=</mo> <mi>H</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>argmax</mi> <mrow> <mi>y</mi> <mo>&Element;</mo> <mi>Y</mi> </mrow> </msub> <munderover> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <mi>l</mi> <mrow> <mo>(</mo> <mi>y</mi> <mo>=</mo> <msub> <mi>h</mi> <mi>t</mi> </msub> <mo>(</mo> <mi>X</mi> <mo>)</mo> <mo>)</mo> </mrow> <mo>.</mo> </mrow>

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1