1.一种基于奇异值选择的集成学习器,其特征在于:包括如下步骤:
步骤一、对训练样本集进行归一化预处理;
步骤二、从归一化预处理后的训练样本集中采用Bootstrap随机抽样方法有放回地抽样,产生M个新的样本集;
步骤三、对M个新的样本集中的每个样本进行部分SVD分解,得到每个样本相应的奇异值和左右奇异向量;
步骤四、每次随机抽取k个奇异值及其相应的左右奇异向量,生成2D SVM基学习器,分别对M个新的样本集进行训练,得到M个2D SVM基分类器;
步骤五、根据相对多数投票准则合并基分类器得到集成学习器,用得到的集成学习器对待分类样本进行分类识别。
2.根据权利要求1所述的一种基于奇异值选择的集成学习器,其特征在于:步骤一所述的对训练样本集进行归一化预处理的方法如下:
S101、对训练样本集中的每个样本分别进行预处理,得到归一化后的训练样本Xi'及其类别标签yi:
其中,max(Xi)表示训练样本Xi中的最大值,min(Xi)表示训练样本Xi中的最小值,repmat{min(Xi)}∈Rp×q表示样本最小值矩阵,矩阵中的元素为min(Xi);
S102、用所有预处理后的训练样本Xi'及其类别标签yi构成预处理后的训练样本集
3.根据权利要求1所述的一种基于奇异值选择的集成学习器,其特征在于:步骤三所述对M个新的样本集中的每个样本进行部分SVD分解的方法如下:
S301、样本Xi的SVD分解形式为:Xi=UΣVT,其中Xi∈Rp×q是一个二维的矩阵,U∈Rp×p是Xi的左奇异向量组成的矩阵,Σ∈Rp×q是Xi的奇异值组成的对角矩阵,VT∈Rq×q是Xi的右奇异向量组成的矩阵;
S302、用前r大的奇异值来近似描述样本Xi,部分奇异值分解形式如下:
其中σip,μip,vip为Xi的第p个奇异值及其对应的左右奇异向量。
4.根据权利要求3所述的一种基于奇异值选择的集成学习器,其特征在于:步骤四所述2D SVM基学习器的生成方法如下:
S401、对于二分类任务,给定一个训练数据集其中Xi∈Rp×q是第i个输入样本,yi∈{-1,1}是样本Xi对应的类标签;
S402、2D SVM支持向量机定义如下:
其中,W为法矩阵,b为位移项;
通过拉格朗日乘子法得到2D SVM支持向量机的对偶问题为:
其中,<Xi,Xj>是Xi∈Rp×q与Xj∈Rp×q的内积,C=αi+βi,i=1,…,n,式中:αi≥0,βi≥0是拉格朗日乘子;
S403、从每个样本的r个奇异值和相应的左右奇异向量中随机选取k个奇异值及其相应的左右奇异向量,分别为和则矩阵Xi和Xj的内积计算如下:
将式(2)代入式(1)中,得2D SVM的最终形式如下:
基学习器2D SVM分类器f(X)分类决策函数为:
其中,σip、σq、uip、uq、vip和vq分别为Xi和X的奇异值以及对应的左奇异向量和右奇异向量;
S404、对于2D SVM多分类任务采用一对一的策略进行分类决策。
5.根据权利要求4所述的一种基于奇异值选择的集成学习器,其特征在于:步骤S404所述采用一对一的策略进行分类决策的方法为:给定数据集Xi∈Rp×q,yi∈{C1,C2,…,CN},将N个类别两两配对,从而产生N(N-1)/2个二分类任务。
6.根据权利要求4所述的一种基于奇异值选择的集成学习器,其特征在于:步骤五所述根据相对多数投票准则合并基分类器的方法为: