基于支持向量机的阿尔茨海默症特征分类方法及系统与流程

文档序号:14680906发布日期:2018-06-12 22:14阅读:836来源:国知局
本发明涉及计算机辅助诊断领域,尤其是一种基于支持向量机的阿尔茨海默症特征分类方法及系统。
背景技术
:阿尔茨海默症(Alzheimer'sDisease,AD)是一种不可逆的慢性神经系统退行性疾病,是一种持续性高级神经功能活动障碍。AD现有的药物治疗手段非常有限,但早期准确发现、治疗能减缓疾病进程。轻度认知损害(MildCognitiveImpairment,MCI)是介于正常健康者(HealthControllers,HC)和AD之间的过渡阶段,MCI患者是AD的高危人群。国内外的研究指出,AD的重要病理学征象和生物标示,可以通过磁共振成像(MagneticResonanceImaging,MRI)进行测量。从MRI提取有效特征,以对AD、MCI和HC三个阶段进行分类识别的方法,是近年来研究的热点。MRI具有“高维度”和“信息量大”的特点,但并非从MRI中提取到的所有特征都对AD的分类起到关键作用。从MRI提供的大量特征中寻找到用以区分AD、MCI和HC三个阶段的关键特征,成为当前研究工作的重点。但是,遍历特征的所有组合情况是一个NP难(NondeterminismPolynomial-Hard,NP-Hard)问题,因此在特征选择方法上,需要选择高效方法。遗传算法(GA)是以自然选择和遗传理论为基础,将生物进化过程中适者生存规则与群体内部染色体的随机信息交换机制相结合的搜索算法。它在搜索之前,先将变量以某种形式进行编码(编码后的变量称为染色体),不同的染色体构成一个群体。对于群体中的染色体,将以某种方法评估出其适应值。该算法作为模拟自然界生物进化过程与机制求解问题的一类自组织与自适应的人工智能技术,已广泛应用于计算机科学、人工智能、信息技术及工程实践。根据实际研究问题的特殊性,研究学者提出了很多关于GA的进一步优化算法。在特征分类的问题上,可选的分类模型有很多而且分类效果相当。但是,在这些分类模型中,支持向量机(SVM)的方法已表现出很多优于已有方法的性能。一些学者认为,SVM正在成为继神经网络研究之后新的研究热点,并将推动机器学习理论和技术有重大的发展。支持向量机的方法是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度,Accuracy)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力(GeneralizatinAbility)。支持向量机的方法的几个主要优点有:1.它是专门针对有限样本情况的,其目标是得到现有信息下的最优解而不仅仅是样本数趋于无穷大时的最优值;2.它最终将转化成为一个二次型寻优问题,从理论上说,得到的将是全局最优点,解决了在神经网络方法中无法避免的局部极值问题;3.它将实际问题通过非线性变换转换到高维的特征空间(FeatureSpace),在高维空间中构造线性判别函数来实现原空间中的非线性判别函数,该特殊性质能保证机器有较好的推广能力,同时它巧妙地解决了维数问题,其算法复杂度与样本维数无关;在SVM方法中,只要定义不同的内积函数,就可以实现多项式逼近、贝叶斯分类器、径向基函数(RadialBasicFunction或RBF)方法、多层感知器网络等许多现有学习算法。然而,目前尚未见到将遗传算法和支持向量机的方法相结合来进行阿尔茨海默症特征提取与分类的报道,阿尔茨海默症的特征提取的效率和分类效果有待进一步提升。技术实现要素:为解决上述技术问题,本发明的目的在于:提供一种提取效率高和分类性能好的,基于支持向量机的阿尔茨海默症特征分类方法及系统。本发明所采取的第一技术方案是:基于支持向量机的阿尔茨海默症特征分类方法,包括以下步骤:获取阿尔茨海默症的磁共振成像数据;采用改进的遗传算法对获取的磁共振成像数据进行特征寻优,得到阿尔茨海默症的关键特征,所述改进的遗传算法以平均分类准确率作为适应度值,并以分类效果最优为目标来提取关键特征;根据提取出的关键特征采用支持向量机分类器对待分类数据进行分类,得到阿尔茨海默症的分类结果。进一步,所述获取阿尔茨海默症的磁共振成像数据这一步骤,具体为:从阿尔茨海默症神经影像学倡议标准数据库中选取若干张磁共振图像作为阿尔茨海默症的磁共振成像数据。进一步,所述采用改进的遗传算法对获取的磁共振成像数据进行特征寻优,得到阿尔茨海默症的关键特征这一步骤,具体包括:对阿尔茨海默症的磁共振成像数据进行预处理,得到n个样本以及每个样本关于左右脑各个区域的所有相关特征,其中,n为样本的个数;采用基于遗传算法的关键特征提取方法从得到的所有相关特征中提取出用于阿尔茨海默症分类的关键特征。进一步,所述采用基于遗传算法的关键特征提取方法从得到的所有相关特征中提取出用于阿尔茨海默症分类的关键特征这一步骤,具体包括:对得到的所有相关特征进行标准化,得到标准化后的特征;对标准化后的特征进行二进制编码,所述进行二进制编码时一个染色体中基因为1代表该位上的特征为关键特征,基因为0代表该位上的特征为非关键特征;确定遗传策略,所述遗传策略包括群体规模大小、选择算子、交叉算子和变异概率;按设定比例将n个样本划分为训练样本和测试样本;根据染色体与关键特征集的映射关系,选择训练样本的关键特征训练支持向量机分类器;通过测试样本对支持向量机分类器进行测试,得到训练样本的关键特征在支持向量机分类器的平均分类准确率,并把平均分类准确率作为染色体的适应度值;根据染色体的适应度值和遗传策略进行迭代选择、交叉和变异操作,最终得到分类效果最优的关键特征作为阿尔茨海默症的关键特征。进一步,所述根据染色体与关键特征集的映射关系,选择训练样本的关键特征训练支持向量机分类器这一步骤,具体包括:根据染色体与关键特征集的映射关系,将训练样本的当前染色体转换成当前的样本关键特征集;根据当前的样本关键特征集,训练支持向量机分类器,所述支持向量机分类器采用拉格朗日函数来求取最优分类函数并选取线性核函数、径向基核函数或sigmoid核函数作为核函数。进一步,所述根据染色体的适应度值和遗传策略进行迭代选择、交叉和变异操作,最终得到分类效果最优的关键特征作为阿尔茨海默症的关键特征这一步骤,具体包括:根据染色体的适应度值,采用基于轮盘赌选择法的选择算子选择复制优良染色体进入下一代;对选出的染色体根据单点交叉算子进行交叉操作,产生新染色体;对新染色体根据变异概率进行变异操作,得到下一代新染色体;判断迭代是否已满足预定的迭代终止条件,若是,则执行下一步骤的操作,反之,则返回根据染色体的适应度值,采用基于轮盘赌选择法的选择算子选择复制优良染色体进入下一代这一步骤;根据迭代终止时的适应度值得到最优染色体,并根据染色体与关键特征集的映射关系对最优染色体进行解码,最终得到阿尔茨海默症的关键特征。进一步,所述基于轮盘赌选择法的选择算子中第i个染色体被选中的概率Ps的计算公式为:其中,ACCi和ACCj分别为第i个和第j个染色体对应的平均分类准确率。进一步,所述单点交叉算子的交叉概率为0.75,所述预定的迭代终止条件为父子两代染色体的适应度值之差的绝对值小于0.0001或迭代次数达到100000。本发明所采取的第二技术方案是:基于支持向量机的阿尔茨海默症特征分类系统,包括:数据获取模块,用于获取阿尔茨海默症的磁共振成像数据;特征寻优模块,用于采用改进的遗传算法对获取的磁共振成像数据进行特征寻优,得到阿尔茨海默症的关键特征,所述改进的遗传算法以平均分类准确率作为适应度值,并以分类效果最优为目标来提取关键特征;分类模块,用于根据提取出的关键特征采用支持向量机分类器对待分类数据进行分类,得到阿尔茨海默症的分类结果。本发明所采取的第三技术方案是:基于支持向量机的阿尔茨海默症特征分类系统,包括:存储器,用于存放程序;处理器,用于加载所述程序以执行如第一技术方案所述的基于支持向量机的阿尔茨海默症特征分类方法。本发明的有益效果是:本发明基于支持向量机的阿尔茨海默症特征分类方法及系统,综合采用了基于遗传算法的关键特征提取方法和支持向量机分类器来进行阿尔茨海默症特征提取与分类,通过改进的遗传算法以平均分类准确率作为适应度值来提升阿尔茨海默症的特征提取效率,同时通过支持向量机分类器保证了阿尔茨海默症的分类性能,直观,容易实现,泛化能力强,且有良好的识别表现。附图说明图1为本发明基于支持向量机的阿尔茨海默症特征分类方法的整体流程图。具体实施方式参照图1,基于支持向量机的阿尔茨海默症特征分类方法,包括以下步骤:获取阿尔茨海默症的磁共振成像数据;采用改进的遗传算法对获取的磁共振成像数据进行特征寻优,得到阿尔茨海默症的关键特征,所述改进的遗传算法以平均分类准确率作为适应度值,并以分类效果最优为目标来提取关键特征;根据提取出的关键特征采用支持向量机分类器对待分类数据进行分类,得到阿尔茨海默症的分类结果。其中,待分类数据是阿尔茨海默症分类的对象,即实际的磁共振图像数据。本发明阿尔茨海默症特征提取过程与特征分类过程是相互结合的,特征分类过程中分类器的类型选择会影响特征提取过程,为了保证分类效果,本发明在提取关键特征时需要以分类效果最优为目标,并选取了支持向量机分类器来进行分类。进一步作为优选的实施方式,所述获取阿尔茨海默症的磁共振成像数据这一步骤,具体为:从阿尔茨海默症神经影像学倡议标准数据库中选取若干张磁共振图像作为阿尔茨海默症的磁共振成像数据。本实施例所用数据来源于美国大型阿尔茨海默氏症公共数据库ADNI(Alzheimer'sDiseaseNeuroimagingInitiative),数据的选取标准是要选取男女比例均衡的数据,而且成像参数的TR/TE值必须一样。这样可以排除一些未知因素的干扰,保证个体间差异较小。因此,本实施例选取了3.0TMR扫描仪,所有对象均获得头部矢状位3D-磁化准备快速梯度回波T1加权成像,成像参数:TR/TE=7000ms/3.0ms,反转时间900ms,反转角为8,成像视野240mm*220mm,层厚为1.2mm,共170层。数据的选取主要根据两个评判标准,简易智力状态检查MMSE(Mini-MentalStateExamination)和临床痴呆表CDR(ClinicalDementiaRating)。MMSE总分范围0-30分,正常与不正常的分界与受教育程度有关,在分界值以下认为有功能缺陷,在分界值以上为正常。文盲(未受教育)组17分,小学(受教育年限<=6年)组20分,中学或以上(受教育年限>=6年)组24分;CDR共分为5级:0为健康,0.5为可疑痴呆,1为轻度痴呆,2为中度痴呆,3为重度痴呆,如下表1所示:表1研究对象组别例数(男/女)平均年龄平均MMSE评分CDR评分AD组50(25/25)73.1821.350.9MCI组50(25/25)74.5424.280.5HC组50(25/25)76.8329.330.0进一步作为优选的实施方式,所述采用改进的遗传算法对获取的磁共振成像数据进行特征寻优,得到阿尔茨海默症的关键特征这一步骤,具体包括:对阿尔茨海默症的磁共振成像数据进行预处理,得到n个样本以及每个样本关于左右脑各个区域的所有相关特征,其中,n为样本的个数;采用基于遗传算法的关键特征提取方法从得到的所有相关特征中提取出用于阿尔茨海默症分类的关键特征。本实施例在得到所有相关特征时,按照Desikan-Killiany的大脑区域划分方式,左右脑各划分为43区域,包括:楔叶、楔前叶、颞上沟、颞上回、颞中回、颞下回、颞极、颞横部、额中回后部、额眶回外侧、额眶回内侧、额中回下部、额上回、额极、缘上回、前扣带回后部、前扣带回下部、扣带回峡部、扣带回后部、梭状回、眶回、内嗅区、顶上小叶、顶下小叶、中央旁小叶、枕叶外侧、舌回、海马旁回、岛盖部、三角区、距状旁回、中央后回、中央前回、岛叶。本实施例对样本进行预处理后,划分为以上43个区域,每个区域对应8个特征:表面面积(SurfaceArea,SurfArea)、灰质体积(GrayMatterVolume,GrayVol)、平均厚度(AverageThickness,ThickAvg)、厚度标准差(ThicknessStDev,ThickStd)、积分校正平均曲率(IntegratedRectifiedMeanCurvature,MeanCurv)、积分校正高斯曲率(IntegratedRectifiedGaussianCurvature,GausCurv)、折叠指数(FoldingIndex,FoldInd)和内在曲率指数(IntrinsicCurvatureIndex,CurvInd)。于是,本实施例提取的所有特征共2*34*8=544个。在ADNI数据库中每个被试对象对应一个编号,编号为002_S_0413的被试对象经过预处理后得到左脑的部分特征如下表2所示:表2编号为002_S_0413左脑的部分特征进一步作为优选的实施方式,所述采用基于遗传算法的关键特征提取方法从得到的所有相关特征中提取出用于阿尔茨海默症分类的关键特征这一步骤,具体包括:对得到的所有相关特征进行标准化,得到标准化后的特征;对标准化后的特征进行二进制编码,所述进行二进制编码时一个染色体中基因为1代表该位上的特征为关键特征,基因为0代表该位上的特征为非关键特征;确定遗传策略,所述遗传策略包括群体规模大小、选择算子、交叉算子和变异概率;按设定比例将n个样本划分为训练样本和测试样本;根据染色体与关键特征集的映射关系,选择训练样本的关键特征训练支持向量机分类器;通过测试样本对支持向量机分类器进行测试,得到训练样本的关键特征在支持向量机分类器的平均分类准确率,并把平均分类准确率作为染色体的适应度值;根据染色体的适应度值和遗传策略进行迭代选择、交叉和变异操作,最终得到分类效果最优的关键特征作为阿尔茨海默症的关键特征。其中,设定比例可采用十折交叉校验法的比例,即训练样本的比例为90%,测试样本的比例为10%。根据二进制编码可知,染色体与关键特征集中的关键特征是一一对应的,每个染色体由0/1串的若干个基因组成。进一步作为优选的实施方式,所述根据染色体与关键特征集的映射关系,选择训练样本的关键特征训练支持向量机分类器这一步骤,具体包括:根据染色体与关键特征集的映射关系,将训练样本的当前染色体转换成当前的样本关键特征集;根据当前的样本关键特征集,训练支持向量机分类器,所述支持向量机分类器采用拉格朗日函数来求取最优分类函数并选取线性核函数、径向基核函数或sigmoid核函数作为核函数。进一步作为优选的实施方式,所述根据染色体的适应度值和遗传策略进行迭代选择、交叉和变异操作,最终得到分类效果最优的关键特征作为阿尔茨海默症的关键特征这一步骤,具体包括:根据染色体的适应度值,采用基于轮盘赌选择法的选择算子选择复制优良染色体进入下一代;对选出的染色体根据单点交叉算子进行交叉操作,产生新染色体;对新染色体根据变异概率进行变异操作,得到下一代新染色体;判断迭代是否已满足预定的迭代终止条件,若是,则执行下一步骤的操作,反之,则返回根据染色体的适应度值,采用基于轮盘赌选择法的选择算子选择复制优良染色体进入下一代这一步骤;根据迭代终止时的适应度值得到最优染色体,并根据染色体与关键特征集的映射关系对最优染色体进行解码,最终得到阿尔茨海默症的关键特征。其中,轮盘赌选择法是从染色体群体中选择一些成员的方法,被选中的几率和它们的适应性分数成比例,适应性分数愈高的染色体,被选中的概率也愈大,这不保证适应性分数最高的成员一定能选入下一代,仅仅说明它有最大的概率被选中。进一步作为优选的实施方式,所述基于轮盘赌选择法的选择算子中第i个染色体被选中的概率Ps的计算公式为:其中,ACCi和ACCj分别为第i个和第j个染色体对应的平均分类准确率。进一步作为优选的实施方式,所述单点交叉算子的交叉概率为0.75,所述预定的迭代终止条件为父子两代染色体的适应度值之差的绝对值小于0.0001或迭代次数达到100000。与图1的方法相对应,本发明基于支持向量机的阿尔茨海默症特征分类系统,包括:数据获取模块,用于获取阿尔茨海默症的磁共振成像数据;特征寻优模块,用于采用改进的遗传算法对获取的磁共振成像数据进行特征寻优,得到阿尔茨海默症的关键特征,所述改进的遗传算法以平均分类准确率作为适应度值,并以分类效果最优为目标来提取关键特征;分类模块,用于根据提取出的关键特征采用支持向量机分类器对待分类数据进行分类,得到阿尔茨海默症的分类结果。与图1的方法相对应,本发明基于支持向量机的阿尔茨海默症特征分类系统,包括:存储器,用于存放程序;处理器,用于加载所述程序以执行如本发明所述的基于支持向量机的阿尔茨海默症特征分类方法。下面结合说明书附图和具体实施例对本发明作进一步解释和说明。实施例一针对现有技术未能将遗传算法和支持向量机的方法相结合来进行阿尔茨海默症特征提取与分类的问题,本发明提出了一种基于支持向量机的阿尔茨海默症特征分类方案,首次将遗传算法和支持向量机的方法结合起来并用于阿尔茨海默症特征提取与分类,通过改进的遗传算法以平均分类准确率作为适应度值来提升了阿尔茨海默症的特征提取效率,同时通过支持向量机分类器保证了阿尔茨海默症的分类性能,直观,容易实现,泛化能力强,且有良好的识别表现。该方案能在更短时间内寻找到影响阿尔茨海默症不同阶段转换的关键特征并通过支持向量机分类器进行分类,为阿尔茨海默症的计算机辅助诊断研究提供了帮助。下面对本发明所涉及的相关理论和具体实现过程进行详细说明。(一)本发明所涉及的相关理论本发明所涉及的相关理论包括:(1)遗传算法遗传算法(GA)是以自然选择和遗传理论为基础,将生物进化过程中适者生存规则与群体内部染色体的随机信息交换机制结合的搜索算法。它在搜索之前,先将变量以某种形式进行编码(编码后的变量称为染色体),不同的染色体构成一个群体。对于群体中的染色体,将以某种方法评估出其适应值。新一代群体的产生是按下面两个步骤完成的:首先,根据染色体的适应值选择被保留的染色体以及相应的复制次数;其次,对被选择的染色体进行重组、变异,产生新的染色体。遗传算法的输入为初始的染色体,输出为使得适应值函数达到最大值的染色体解。遗传算法的具体实现步骤如下:Step1:对问题的参数进行编码;Step2:定义适应度函数和遗传策略(包括群体大小、交叉概率、变异概率等);Step3:随机初始化群体:随机选择N个初始点(称为一个群体,每个点成为一个个体)k代表第k代总群。Step4:计算群体中每个个体的适应值Step5:根据个体适应度值,选择复制优良个体进入下一代:从中选择且每个被选中的概率为:Step5:对选出的个体根据交叉概率值进行交叉操作,产生新个体:从中以相同的概率选出两个个体,这两个个体之间以预先给定的交叉概率Pc执行重组运算,产生两个新个体,重复这一过程,直至形成新群体Step5:对新个体根据变异概率值进行变异操作,产生下一代新个体:根据预先给定的变异率Pm随机地对每个个体的每一位改变它的值,形成新一代群体Step6:检验收敛准则是否已满足,如果满足则停止运算;否则令k+1=k,转Step4。GA的优越性体现在:首先,它在搜索的过程中不容易陷入局部最优,即使在所定义的适应值函数是不连续的、非规则的或有噪声的情况下,它也能以很大的概率找到整体最优解;其次,由于它固有的并行性,GA非常适用于大规模并行计算机。(2)支持向量机的方法在机器学习领域,支持向量机SVM(SupportVectorMachine)是一个有监督的学习模型,通常用来进行模式识别、分类、以及回归分析。Vapnik等人在多年研究统计学习理论基础上对线性分类器提出了另一种设计最佳准则。其原理也从线性可分说起,然后扩展到线性不可分的情况,甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机(SupportVectorMachine,简称SVM)。SVM的主要思想可以概括为两点:1)它是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;2)它基于结构风险最小化理论在特征空间中建构最优分割超平面,使得学习器得到全局最优化,并且在整个样本空间的期望风险以某个概率满足一定上界。概括地说,SVM就是首先通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,然后再在这个空间中求(广义)最优分类面的分类方法。以两类数据分类(即两类问题)为例,给定训练样本集(xi,yi),i=1,2,...,l,x∈Rn,y∈{±1},将超平面记作和b分别为超平面的权值向量和偏置,为使SVM的分类面能对所有样本正确分类并且具备分类间隔,就要求它满足如下公式的约束:可以计算出分类间隔因此构造最优超平面的问题就转化为在约束式(2)下求:式(3)中,为关于内积的函数,为的反向量。为了解决这个约束最优化问题,引入Lagrange函数如公式(4)所示:式(4)中,ai>0为Lagrange乘数。约束最优化问题的解由Lagrange函数的鞍点决定,并且最优化问题的解在鞍点处对和b的偏导为0,故可将该QP问题(即式(4))转化为相应的对偶问题,即有:最后解出的最优解为:计算最优权值向量和最优偏置b*,分别如下公式(6)和公式(7)所示:公式(6)和公式(7)中,下标由此得到最优分类超平面而最优分类函数如公式(8)所示:式(8)中,sgn()为符号函数。在SVM中,将做从输入空间Rn到特征空间H的变换Φ,如公式(9)所示:以特征向量代替输入向量代入公式(8)中则可以得到最优分类函数如公式(10)所示:是未知的高维函数,SVM理论只考虑高维特征空间的点积(或内积)运算而不直接用SVM将k(x,xi)称核函数。核函数的引入,很好地解决了高维问题,将高维空间的内积运算转化为低维空间的函数运算。常用的核函数包括:线性核函数(LinearKernel):k(x,xi)=(x·xi)(11)径向基核函数(RadicalBasisFunction,RBF):k(x,xi)=exp(-γ|x-xi|2)(12)其中,γ为给定的参数;Sigmoid核函数(Sigmoidtanh):k(x,xi)=tanh(γx·xi+r)(13)其中,γ和r均为给定的参数。(二)本发明的具体实现过程基于(一)的相关理论,以输入为n张MRI图像,SVM分类为二类分类,输出为测试样本对应的分类标签为例,本发明基于支持向量机的阿尔茨海默症分类方案的实现过程具体包括如下步骤:Step1:MRI数据预处理。MRI数据预处理是大脑皮质重构的过程,主要包括运动校正、使用形变过程去除非脑组织、自动Talairach变换、皮层下白质分割、深部灰质体积结构(包括海马、杏仁核、尾状核、壳核和脑室)的强度归一化、自动拓扑校正等(如可使用FreeSurferv5.3.0工具箱实现上述一系列相关算法),获得关于左右脑各34个区域的544个相关特征。Step2:确定预处理得到的样本对应的标签集。n张MRI数据经过预处理后得到n个样本,每个样本有544个特征,将第i个样本对应的真实标签记为yi,并将n个学习样本记为其中fi为样本的预测标签。Step3:特征标准化。特征标准化时,首先计算每一个维度上数据的均值之后在每一个维度上都减去该均值,然后在数据的每一维度上除以该维度上数据的标准差σ,即得到特征标准化后的结果,如公式(14)所示:其中,x为原始数据值,为x所在维度上的数据均值,σ为x所在维度上的数据标准差。x'为经过特征标准化后的数据值。经过标准化处理后的数据符合标准正态分布,即其均值为0,标准差为1。Step4:种群初始化。设置群体规模大小为100,对544个相关特征进行二进制编码,二进制编码时一个染色体是长度为544的0/1串,基因为1代表该位上的特征为当前的关键特征,基因为0代表该位上的特征为当前的非关键特征。为了加快遗传算法的收敛速度和改善变异操作的性能,本实施例在进行种群初始化前还可根据预设的特征划分方法(如根据这些相关特征与标准特征不同的相关度大小来划分),将544个相关特征分别划分成高质量特征、中质量特征和低质量特征这三类不同的特征。相应地,可将种群初始化为111……0000,其中,“1”对应高质量特征,“0”的对应中质量特征或低质量特征。Step5:根据染色体与关键特征集的映射关系,将当前染色体转换成对应的关键特征集(即当前的样本关键特征集)。基因为1代表该位上的特征为当前的关键特征,基因为0代表该位上的特征为当前的非关键特征。Step6:根据当前的样本关键特征集,训练支持向量机分类器。训练支持向量机分类器的详细过程可参考(一)的相关理论。Step7:对100个样本进行10折交叉检验(即10个测试样本,90个训练样本),得到训练样本的关键特征在支持向量机分类器中的平均分类准确率(平均分类准确率=样本的总分类准确率÷总分类次数),把平均分类准确率作为遗传算法(即染色体)的适应度值。Step8:判断是否已经满足算法终止条件:若父子两代染色体的适应度值之差的绝对值<0.0001或迭代次数达到100000,则转Step11;否则转Step7。Step9:根据染色体的适应度值,采用基于轮盘赌选择法的选择算子选择复制优良染色体进入下一代。其中,选择算子采用轮盘赌选择法,第i个染色体被选中的概率Ps的计算公式为:式(15)中,ACCi和ACCj分别为第i个和第j个染色体对应的平均分类准确率。Step9:对选出的染色体根据单点交叉算子进行交叉操作,产生新染色体。为了加快算法的收敛速度和降低交叉的操作难度,本实施例的交叉算子采用单点交叉算子来取代传统遗传算法的双点交叉或多点交叉算子。本实施例在染色体上随机生成一个有效的交叉位置,然后交换位于该位置后的所有基因,其交叉的概率Pc为0.75。Step10:对新染色体根据变异概率进行变异操作,得到下一代新染色体。若在进行种群初始化前已将544个相关特征分别划分成高质量特征、中质量特征和低质量特征这三类不同的特征,本实施例的变异概率则可采用改进的基本位变异算法计算,具体计算过程为:1)随机选择染色体上的一个基因位作为当前基因位w,其对应的特征为tw;2)根据当前基因位w,计算变异概率Pm,具体可分为以下五种情况:a)如果tw为高质量特征且其当前基因位为“0”,则Pm为即该基因位上变异的概率为b)如果tw为高质量特征且其当前基因位为“1”,则Pm为即该基因位上变异的概率为c)如果tw为中质量特征,则Pm为0.01,即该基因位上变异的概率为0.01;d)如果tw为低质量特征且其当前基因位为“0”,则Pm为即该基因位上变异的概率为e)如果tw为低质量特征且其当前基因位为“1”,则Pm为即该基因位上变异的概率为3)根据变异概率Pm决定是否反转该基因位。4)转Step5。本实施例改进的基本位变异算法能适应不同质量特征的要求而采用不同的变异算子来进行变异,更加灵活且更加贴合实际的情况,有效改善了遗传算法变异操作的性能。Step11:得到最优个体(即最优染色体),并根据染色体与关键特征集的映射关系对最优色体进行解码,算法结束。由前述的内容可知,本发明基于支持向量机的阿尔茨海默症分类方法、系统及装置具有以下优点:1)采用了改进的遗传算法作为关键特征提取算法,提升了阿尔茨海默症的特征提取效率。2)本发明改进的遗传算法使用基于平均分类准确率作为评价函数启发,过程简单,同时在搜索使用概率机制进行迭代,具有随机性和较强的鲁棒性。3)本发明改进的遗传算法在交叉操作时由两点交叉改为单点交叉,加快了关键特征提取算法的收敛速度。4)采用了支持向量机分类器作为阿尔茨海默症的分类器,具有坚实的理论基础、简洁的数学形式、直观的几何解释,而且能够较好地解决小样本、非线性、维数灾难和局部极小等问题。5)采用了支持向量机分类器来对阿尔茨海默症数据进行分类,而阿尔茨海默症数据主要的来源是MRI数据,MRI数据具有结构复杂、样本量小和特征维数高等特点,因此本发明的支持向量机分类器对分类MRI数据有较高的泛化能力,并具有很好的识别表现。以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1