一种基于降维与聚类的高光谱样本选择方法与流程

文档序号：12468871阅读：来源：国知局

技术特征：

1.一种基于降维与聚类的高光谱样本选择方法，其特征在于，该方法包括：

步骤1，将原始高光谱数据集标准化处理为标准化数据集；

步骤2，对标准化数据集降维得到联合代表空间；

步骤3，对获得的联合代表空间聚类得到聚类簇；

步骤4，从聚类簇中按最大最小距离选取样本组成训练集，其余剩下的样本组成测试集。

2.按照权利要求1所述的方法，其特征在于，所述步骤3中，以欧式聚类作为相似度测度，根据数据点到原型距离作为优化目标函数，采用误差平方和作为聚类准则函数。

3.按照权利要求1或2所述的方法，其特征在于，所述步骤2中包括：

采用主成分分析的方法，计算标准化数据集的相关系数矩阵，根据累计贡献率确定m值，计算标准化数据集的主成分矩阵；

将代表高光谱样本空间的主成分矩阵以权重矩阵与样本标签信息联合，获得联合代表空间。

4.按照权利要求3所述的方法，其特征在于，所述步骤2中采用主成分分析的方法，计算标准化数据集的相关系数矩阵，根据累计贡献率确定m值，计算标准化数据集的主成分矩阵包括：

计算相关系数矩阵R＝X^TX/(n-1)，求解相关系数矩阵R的特征方程|R-λI_p|＝0获得p个特征值；其中X为标准化数据集，n为样本个数。

5.按照权利要求3所述的方法，其特征在于，步骤2中，权重矩阵如下所示：

Y为样本标签信息，U为主成分矩阵，M为权重矩阵，S为联合代表空间。

6.按照权利要求1或2所述的方法，其特征在于，步骤3聚类包括：

第一步：随机选取k个初始聚类中心c_j；

第二步：逐个计算样本s_i与聚类中心c_j的距离，若与聚类中心c_j距离最近，则将其归到聚类簇D_j中

$<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>D</mi> <mi>j</mi> </msub> <mo>=</mo> <munder> <mi>argmin</mi> <mi>j</mi> </munder> <mo>|</mo> <mo>|</mo> <msub> <mi>s</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>c</mi> <mi>j</mi> </msub> <mo>|</mo> <mo>|</mo> </mrow> </mtd> <mtd> <mrow> <mo>&ForAll;</mo> <mi>i</mi> <mo>&Element;</mo> <mo>{</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>k</mi> <mo>}</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>$

第三步：重新计算聚类簇D_j的聚类中心

$<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>c</mi> <mi>j</mi> </msub> <mo>=</mo> <msubsup> <mi>Σ</mi> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>d</mi> </msubsup> <msub> <mi>s</mi> <mi>k</mi> </msub> </mrow> </mtd> <mtd> <mrow> <msub> <mi>s</mi> <mi>k</mi> </msub> <mo>&Element;</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced>$

式中d为聚类簇D_j所含样本数目，s_k为依次加入到聚类簇D_j的样本；

第四步：不断执行步骤二和步骤三，直到聚类中心趋于稳定，通过迭代更新k个聚类中心使目标函数F取得最小值，其目标函数如下式所示：

$<mrow> <mi>F</mi> <mo>=</mo> <munder> <mi>Σ</mi> <mrow> <msub> <mi>s</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <mi>S</mi> </mrow> </munder> <msub> <mi>min</mi> <mrow> <msub> <mi>c</mi> <mi>j</mi> </msub> <mo>&Element;</mo> <msub> <mi>D</mi> <mi>j</mi> </msub> </mrow> </msub> <mo>|</mo> <mo>|</mo> <msub> <mi>s</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>c</mi> <mi>j</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>.</mo> </mrow>$

7.按照权利要求1所述的方法，其特征在于，步骤1包括：

将原始高光谱数据集X^R∈R^n×p标准化获得数据集X

$<mrow> <mi>X</mi> <mo>=</mo> <mfrac> <mrow> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>R</mi> </msubsup> <mo>-</mo> <msubsup> <mover> <mi>X</mi> <mo>&OverBar;</mo> </mover> <mrow> <mi>i</mi> <mo>·</mo> </mrow> <mi>R</mi> </msubsup> </mrow> <msqrt> <mfrac> <mrow> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>p</mi> </munderover> <msup> <mrow> <mo>(</mo> <msubsup> <mi>X</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> <mi>R</mi> </msubsup> <mo>-</mo> <msubsup> <mover> <mi>X</mi> <mo>&OverBar;</mo> </mover> <mrow> <mi>i</mi> <mo>·</mo> </mrow> <mi>R</mi> </msubsup> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> <mrow> <mi>n</mi> <mo>-</mo> <mn>1</mn> </mrow> </mfrac> </msqrt> </mfrac> </mrow>$

其中，其中n为样本个数；p为样本的维度，为第i行原始高光谱数据集的平均值。

完整全部详细技术资料下载

当前第2页1 2 3