一种基于K‑均值聚类的图像特征提取方法与流程

文档序号:12748496阅读:578来源:国知局
一种基于K‑均值聚类的图像特征提取方法与流程

本发明涉及图像识别技术领域,具体涉及一种基于K-均值聚类的图像特征提取方法。



背景技术:

图像的识别分类在所有应用领域中的应用最为直接,由于获取的图像数据内容丰富,提取图像的特征技术就变得非常关键,传统的图像特征提取主要包含光谱特征、纹理特征以及形状特征。常用的光谱特征提取方法有主成分分析法、K-T变换、典型分析法以及基于遗传算法的特征提取算法。主成分分析法是图像中最常用的一种变换算法,是一种非常有效的特征提取算法,但是这种算法需要处理的数据非常大,因为图像中包含大量的观测数据,造成了计算复杂度大大增加。

鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本发明。



技术实现要素:

为解决上述技术缺陷,本发明采用的技术方案在于,提供一种基于K-均值聚类的图像特征提取方法,该方法包括以下步骤:

步骤S1:采集图像并对图像进行预处理,以及建立图像数据库;

步骤S2:利用K-均值聚类算法对图像进行聚类分析,将图像数据库分为K类;

步骤S3:利用主成分分析算法对分为K类的图像数据库中的分类图像进行处理,得到主成分分析图像;

步骤S4:根据性能指标估计主成分分析图像,选取效果最好的图像。

较佳的,述步骤S1具体包括:

步骤S11:通过图像采集设备采集图像;

步骤S12:对所获取的图像进行尺寸大小归一化;

步骤S13:建立图像数据库。

较佳的,所述步骤S2具体包括:

步骤S21:统计图像数据库中每一幅图像的波段数和像素数,并将其表示为一个矩阵X;

步骤S22:根据主成分分析算法的需求输入指定数目的聚类类数N;

步骤S23:在初始矩阵X中随机选取N个对象作为初始聚类中心;

步骤S24:根据每个聚类的中心,计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分,形成一类;

步骤S25:更新聚类中心,然后以每一类的平均向量作为新的聚类中心,重新分配数据对象;

步骤S26:反复迭代,直到满足每个聚类不再发生变化为止。

较佳的,所述步骤S3具体包括:

步骤S31:选取新获得的聚类中心作为新的输入样本;

步骤S32:利用高斯核函数和新输入的样本计算核矩阵K,核矩阵K的计算公式为:

式中,xi,xj为样本向量,c表示输入的样本数量,表示对样本向量的非线性变换,k(·)表示高斯核函数;

步骤S33:对核矩阵K进行归一化处理得到归一化之后的核矩阵K′:

K′=(K-AcK-KAc+AcKAc)ij

式中,Ac是一个c×c矩阵,(Ac)ij=1/c;

步骤S34:分别计算归一化之后的核矩阵K′的特征值和特征向量,并对特征向量进行归一化处理;

步骤S35:将特征值按照从大到小的顺序进行排列,选择前r个非零的特征值对应的特征向量αi作为主分量;

步骤S36:将特征空间中所有的光谱向量映射到与第r个特征值对应的特征向量Vr,映射公式为:

步骤S37:将所得向量恢复为图像,得到第r幅主成分图像,依次得到所有的主成分图像。

较佳的,所述步骤S4具体包括:

步骤S41:分别计算各主成分数据的方差,并对其标准化处理;

步骤S42:计算每一分量标准方差的比例;

步骤S43:根据得到的比例大小选择出效果最好的图像。

与现有技术相比,本发明提供的一种基于K-均值聚类的图像特征提取方法有如下好处:

(1)本发明将K-均值聚类算法应用到图像特征提取中,提高了图像特征提取的性能,可有效地提取多光谱图像中的非线性特征信息,同时也改善了图像特征提取计算量大的缺点。

(2)结合传统的主成分分析算法,引入了高斯核函数,使得主成分分析算法变得更加鲁棒,在图像的特征提取中具有更好的效果。

附图说明

为了更清楚地说明本发明各实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。

图1为本发明的一种基于K-均值聚类的图像特征提取方法的流程图;

图2为步骤S1的流程图;

图3为步骤S2的流程图;

图4为步骤S3的流程图;

图5为步骤S4的流程图。

具体实施方式

以下结合附图,对本发明上述的和另外的技术特征和优点作更详细的说明。

如图1所示,为本发明的一种基于K-均值聚类的图像特征提取方法的流程图,该方法包括以下步骤:

步骤S1:采集图像并对图像进行预处理,以及建立图像数据库。

如图2所示,为步骤S1的流程图,该步骤S1具体包括:

步骤S11:通过图像采集设备采集图像。

步骤S12:对所获取的图像进行尺寸大小归一化。

步骤S13:建立图像数据库。

步骤S2:利用K-均值聚类算法对图像进行聚类分析,将图像数据库分为K类。

如图3所示,为步骤S2的流程图,该步骤S2具体包括:

步骤S21:统计图像数据库中每一幅图像的波段数和像素数,并将其表示为一个矩阵X。

步骤S22:根据主成分分析算法的需求输入指定数目的聚类类数N。

步骤S23:在初始矩阵X中随机选取N个对象作为初始聚类中心。

步骤S24:根据每个聚类的中心,计算每个对象与这些中心对象的距离,并根据最小距离重新对相应对象进行划分,形成一类。

步骤S25:更新聚类中心,然后以每一类的平均向量作为新的聚类中心,重新分配数据对象。

步骤S26:反复迭代,直到满足每个聚类不再发生变化为止。

步骤S3:利用主成分分析算法对分为K类的图像数据库中的分类图像进行处理,得到主成分分析图像。

如图4所示,为步骤S3的流程图,该步骤S3具体包括:

步骤S31:选取新获得的聚类中心作为新的输入样本。

步骤S32:利用高斯核函数和新输入的样本计算核矩阵K,核矩阵K的计算公式为:

式中,xi,xj为样本向量,c表示输入的样本数量,表示对样本向量的非线性变换,k(·)表示高斯核函数。

步骤S33:对核矩阵K进行归一化处理得到归一化之后的核矩阵K′:

K′=(K-AcK-KAc+AcKAc)ij

式中,Ac是一个c×c矩阵,(Ac)ij=1/c。

步骤S34:分别计算归一化之后的核矩阵K′的特征值和特征向量,并对特征向量进行归一化处理。

步骤S35:将特征值按照从大到小的顺序进行排列,选择前r个非零的特征值对应的特征向量αi作为主分量。

步骤S36:将特征空间中所有的光谱向量映射到与第r个特征值对应的特征向量Vr,映射公式为:

步骤S37:将所得向量恢复为图像,得到第r幅主成分图像,依次得到所有的主成分图像。

步骤S4:根据性能指标估计主成分分析图像,选取效果最好的图像。

如图5所示,为步骤S4的流程图,该步骤S4具体包括:

步骤S41:分别计算各主成分数据的方差,并对其标准化处理。

步骤S42:计算每一分量标准方差的比例。

步骤S43:根据得到的比例大小选择出效果最好的图像。

本发明提供的一种基于K-均值聚类的图像特征提取方法有如下好处:

(1)本发明将K-均值聚类算法应用到图像特征提取中,提高了图像特征提取的性能,可有效地提取多光谱图像中的非线性特征信息,同时也改善了图像特征提取计算量大的缺点。

(2)结合传统的主成分分析算法,引入了高斯核函数,使得主成分分析算法变得更加鲁棒,在图像的特征提取中具有更好的效果。

以上所述仅为本发明的较佳实施例,对本发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在本发明权利要求所限定的精神和范围内可对其进行许多改变,修改,甚至等效,但都将落入本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1