基于高斯核函数模糊非相关判别转换的乳腺癌判别方法

文档序号:6617048阅读:401来源:国知局
专利名称:基于高斯核函数模糊非相关判别转换的乳腺癌判别方法
技术领域
本发明涉及模式识别和人工智能技术领域,具体涉及一种基于高斯核函数模糊非相关判别转换的乳腺癌判别方法。
背景技术
乳腺癌是女性排名第一的常见恶性肿瘤。据统计全球每年平均约有130万人新患乳腺癌,女性乳腺癌患者占女性新发恶性肿瘤的30%,排名女性恶性肿瘤发病率第一位。乳腺癌同样是我国女性最常见的恶性肿瘤。乳腺癌可以通过临床病史,体格检查,乳房X线照相术,超声造影检查出来。但是,权威性诊断乳腺肿块必须采用细针抽吸活检,中心活检或者切除手术。其中,细针抽吸活检方法是最容易也是最快获取乳腺活组织的方法,对女性液性囊肿检查很有效。目前国内外先后运用线性规划,线性判别分析(LDA),神经网络,支持向量机来区分乳腺癌诊断数据集(WDBC)的良性和恶性乳房肿块。但是线性规划,线性判别分析(LDA)的分类准确率低;神经网络计算复杂,参数设置困难且易陷入局部极小点;支持向量机参数估计难度大,计算复杂。自从Zadeh教授提出模糊集以来,模糊模式识别技术已被广泛用于许多领域。模糊模式识别包括无监督模糊学习和有监督模糊学习。模糊聚类是著名的无监督模糊学习方法,如模糊C-均值聚类(FCM),可能性C-均值聚类(PCM)和广义噪声聚类(GNC)等。模糊有监督学习方法有模糊k近邻(FKNN),模糊判别分析(FDA),模糊Fisher分类器,模糊支持向量机(FSVM)等。模糊模型通常表现出比传统模型更好的性能。例如,FCM是一个众所周知的模糊聚类模型,它比硬C-均值聚类(HCM)更好。FSVM比SVM更适合减少噪声和野值.模糊Fisher分类器在处理由于照明条件不好导致的模糊脸部图像时效果更好。同时,利用改进的模糊隶属度函数,将使得训练集中的不同样本对散射矩阵重新定义所做贡献不同。模糊非相关判别转换方法(武小红,武斌,周建江《模糊非相关判别转换及其应用》,中国图象图形学报,2009, 14(9) : 1832-1836.)建立在模糊类间散射矩阵,模糊总体散射矩阵和模糊类内散射矩阵基础上,其特征向量满足广义瑞利商方程,同时也满足样本到模糊非相关优化判别向量上的投影是非相关的。模糊非相关判别转换方法在处理带有模糊性的线性特征提取方面要优于非相关判别转换方法。但是,模糊非相关判别转换方法在处理线性不可分问题方面存在难度,处理效果往往不理想。因此如何扩展模糊非相关判别转换方法的功能,使之能够处理线性不可分问题是个亟待解决的问题。

发明内容
针对上述现有的良性和恶性乳房肿块判别方法的缺陷和不足,本发明的目的是提出一种基于高斯核函数的模糊非相关判别转换的乳腺癌判别方法,该方法将高斯核函数引入到模糊非相关判别转换方法,构造基于高斯核函数的模糊非相关判别转换,提取乳腺癌诊断数据集的非线性特征以处理线性不可分问题,利用非线性映射将乳腺癌诊断数据集数据映射到高维特征空间,用高斯核函数隐式实现在高维特征空间的计算,从而可以避免“维数灾难”的问题,能提取乳腺癌诊断数据集样本数据的非线性鉴别信息,分类准确率高。提高了分类准确率,达到快速,准确地判别良性还是恶性乳房肿块。该方法具体为首先,将从乳腺癌诊断数据集利用模糊K-近邻法得到模糊隶属度值,由模糊C-均值聚类方法得到每类的类中心值,从而实现数据的模糊化处理;接着计算核模糊线性判别分析的最大特征值对应的特征向量并将该特征向量作为本发明方法最优鉴别向量集的第I个特征向量;然后根据乳腺癌诊断数据集到模糊非相关优化鉴别向量上的投影非相关性原则计算本发明方法的一组最优鉴别向量集,利用核函数实现模糊非相关判别转换的非线性转换。最后将乳腺癌诊断数据集进行非线性转换而实现乳腺癌的正确判别。为实现本发明的目的,采用的技术方案具体包括以下步骤步骤一、将乳腺癌诊断数据集模糊化处理;步骤二、最优鉴别向量集的第I个特征向量的计算;步骤三、一组最优鉴别向量集的计算;步骤四、利用核函数实现乳腺癌诊断数据集的非线性转换。步骤五、实现良性乳房肿块数据和恶性乳房肿块数据的分类。所述步骤一中对乳腺癌诊断数据集的模糊化处理方法如下1.用K-近邻法获得样本Xk Uk属于第j类)的K个近邻样本,则Xk的模糊隶属度值则按如下规律计算
权利要求
1.一种基于高斯核函数模糊非相关判别转换的乳腺癌判别方法,其特征在于首先,将乳腺癌诊断数据集利用模糊K-近邻法得到模糊隶属度值,由模糊C-均值聚类方法得到每类的类中心值,从而实现数据的模糊化处理;接着计算核模糊线性判别分析的最大特征值对应的特征向量并将该特征向量作为本发明方法最优鉴别向量集的第I个特征向量;然后根据乳腺癌数据集到模糊非相关优化鉴别向量上的投影非相关性原则计算本发明方法的一组最优鉴别向量集;接下来利用核函数实现模糊非相关判别转换的非线性转换,最后将乳腺癌诊断数据集进行非线性转换而实现乳腺癌的正确判别。
2.根据权利要求1所述的基于高斯核函数模糊非相关判别转换的乳腺癌判别方法,其特征在于,该方法包括以下步骤步骤一将乳腺癌诊断数据集进行模糊化处理;步骤二 最优鉴别向量集的第I个特征向量的计算;步骤三一组最优鉴别向量集的计算;步骤四利用核函数实现乳腺癌诊断数据集的非线性转换;步骤五实现良性乳房肿块数据和恶性乳房肿块数据的分类。
3.根据权利要求2所述的基于高斯核函数模糊非相关判别转换的乳腺癌判别方法,其特征在于,所述步骤一中将乳腺癌诊断数据集模糊化处理方法如下(1)用K-近邻法获得样本XkCxk属于第j类)的K个近邻样本,则Xk的模糊隶属度值则按如下规律计算
4.根据权利要求2所述的基于高斯核函数模糊非相关判别转换的乳腺癌判别方法,其特征在于,所述步骤二中最优鉴别向量集的第I个特征向量的计算如下
5.根据权利要求2所述的基于高斯核函数模糊非相关判别转换的乳腺癌判别方法,其特征在于,所述步骤三中一组最优鉴别向量集的计算如下N-1PM a r+1 = β a r+1这里P= Ι-ΝΑτ(ΑΝΑτΓ Α,04和β分别为上面方程所求的特征向量和所对应的特征值,I 为单位矩阵,A= [Ct1Ct 2··· a Jt ;a i, ct 2,…,a r是一组最优鉴别向量集。
6.根据权利要求2所述的基于高斯核函数模糊非相关判别转换的乳腺癌判别方法,其特征在于,所述步骤四中利用核函数实现非线性转换计算如下
7.根据权利要求2所述的基于高斯核函数模糊非相关判别转换的乳腺癌判别方法,其特征在于,所述步骤五中实现良性乳房肿块数据和恶性乳房肿块数据的分类方法是用最近邻分类器和“leave one out”即“留一”策略来实现良性乳房肿块数据和恶性乳房肿块数据 的分类。
全文摘要
本发明是一种基于高斯核函数模糊非相关判别转换的乳腺癌判别方法,将核函数理论用于模糊非相关判别转换,实现乳腺癌的快速、准确判别。首先,实现数据的模糊化处理;接着计算最优鉴别向量集的第1个特征向量;然后计算本发明方法的一组最优鉴别向量集,利用核函数实现模糊非相关判别转换的非线性转换;最后将乳腺癌诊断数据集进行非线性转换而实现乳腺癌的正确判别。本发明解决了模糊非相关判别转换难以处理线性不可分问题,利用非线性映射将乳腺癌诊断数据集数据映射到高维特征空间,用高斯核函数隐式实现在高维特征空间的计算,从而可以避免“维数灾难”的问题,能提取乳腺癌诊断数据集的非线性鉴别信息,分类准确率高。
文档编号G06F17/30GK102999593SQ201210465559
公开日2013年3月27日 申请日期2012年11月16日 优先权日2012年11月16日
发明者武小红, 孙俊, 傅海军, 陆继远 申请人:江苏大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1