基于磁共振波谱成像的乳腺肿瘤诊断系统的制作方法

文档序号:1181376阅读:262来源:国知局
专利名称:基于磁共振波谱成像的乳腺肿瘤诊断系统的制作方法
技术领域
本发明属于医疗技术领域,特别涉及一种基于磁共振波谱成像的乳腺肿瘤诊断系统。

背景技术
乳腺肿瘤是妇女常见疾病和多发病之一。近年来,妇女人群中由乳腺肿瘤引发乳腺癌的发病率和死亡率呈逐年上升趋势,已跃居我国女性恶性肿瘤发病率和死亡率的首位。早期发现、早期诊断、早期治疗是减少乳腺肿瘤发病率、降低死亡率的关键。目前用于乳腺的影像学检查手段主要有B超、钼靶X线摄影和磁共振检查,而磁共振检查无论在显示病变位置、形态还是病变性质方面都要明显优于其它两种检查手段。
核磁共振技术是继CT成像技术后的又一广泛应用于临床医学检查的医学成像技术。应用于临床医学的核磁共振技术主要分为两类一类是磁共振成像(Magnetic ResonanceImaging,简称MRI),该技术主要应用在组织器官发生解剖形态上的变化的临床情况下,但此时疾病也已处于中晚期,失去了最好的治疗时机,并不具备实质的临床检验意义。另一类是磁共振波谱成像(Magnetic Resonance Spectroscopic Imaging,简称MRSI),MRSI技术把MRI提供的空间信息和磁共振波谱学(Magnetic Resonance Spectroscopy,MRS)提供的波谱信息有机结合起来,由于磁共振波谱的无创性和无射线损害,可以反复进行以监测放化疗效果。
在乳腺肿瘤的早期诊断中,MRSI被普遍认为是最为有效的检测诊断技术之一。而临床上,诊断乳腺肿瘤主要靠医师凭肉眼观察医学影像的特征,靠医师观察诊断难以避免经验差异、疲劳疏忽等人为因素,误诊、漏诊等情况时有发生,因而乳腺肿瘤计算机辅助诊断系统运遇而生。目前,基于磁共振波谱成像的乳腺肿瘤计算机辅助诊断方法可大致分为两类①依赖模型的信号量化分析方法;②模型独立的机器学习方法。最常用的信号量化分析方法包括VARPRO、AMARES、QUEST三种,它们以实现样本数据和模型基函数之间的均方距离最小化作为辅助诊断依据,模型基函数则建立在典型磁共振波谱代谢特征的先验知识上。信号量化分析方法实现简单,但其辅助诊断的性能却受到多种因素的影响,例如如何选择模型成分数目、如何优化选择先验知识(模型函数)、如何降低非乳腺磁共振波谱导致的噪声影响、如何解决由于多重代谢导致的峰值重叠、如何解决基准线失真和扩散等等,这些因素导致信号定量分析方法在基于磁共振波谱成像的乳腺肿瘤早期诊断中的应用受到了极大的限制。为了克服这些缺陷,研究人员开始寻求利用模型独立的机器学习方法来辅助乳腺肿瘤早期诊断,其中具有代表性方法有Z积分法、典型相关分析(Canonical Correlation Analysis,简称CCA)、主成分分析(Principal Component Analysis,简称PCA)和线性判别分析(Linear Discriminant Analysis,简称LDA)。
在Z积分法中,Z积分是一个统计量,Z积分分析的目的是量化所有代谢成分在整个谱向量所占的比例,它通过计算每个单独样本的积分差异与样本的总体举均值的总体方差的比率来获得。
CCA也是一种统计分析方法,是研究两组变量之间相关关系的一种统计分析方法,也是一种维数约简技术,它能够有效地揭示两组变量之间的相互线性依赖关系,

已成功应用于一些领域的数据分类。
PCA与支持向量机(Support Vector Machine,简称SVM)进行结合已应用于脑MRS数据进行脑组织分类,PCA以最大化方差为准则,能够在均方误差最小意义下最优表达数据,但是并不能有效保持MRS数据中的鉴别信息,因而不适合于分类。
LDA以最大化类间离散度矩阵与类内离散度矩阵之比为准则,通过求解广义瑞利商问题获得投影矩阵,能够进行数据维数约简和分类;但LDA也存在缺陷它只能提取比已标注类别数少的特征,没有考虑类别方差的差异性,小样本问题会导致算法失效;并且其支持向量机的性能主要取决于其选择的参数,若参数选择不当,支持向量机就可能出现过学习或欠学习,机器学习效果不理想。
上述几种机器学习方法都是常用的线性特征提取方法。而近年研究发现,磁共振波谱可以由一些连续的变量进行参数化,也就是说,磁共振波谱在本质上属于低维子流形。这意味着传统线性特征提取方法不能有效发现磁共振波谱数据中的本征流形结构,从而不能有效的实现磁共振波谱数据的维数约简;同时,现实中数据的有用特征往往不一定是特征的线性组合,线性方法在这样的场合中不适用。


发明内容
针对现有技术存在的上述不足,本发明的目的在于提供一种基于磁共振波谱成像的乳腺肿瘤诊断系统,该诊断系统能有效发现磁共振波谱数据中的本征流形结构,将鉴别性流形学习方法与无监督的谱聚类方法相融合,通过计算机辅助检测磁共振波谱成像中的异常、可疑区域,实现乳腺肿瘤的早期鉴别诊断。
本发明的目的是这样实现的基于磁共振波谱成像的乳腺肿瘤诊断系统,包括超导MR扫描仪和计算机系统,超导MR扫描仪将乳腺磁共振波谱数据以电子图像的计算机可识别的格式读入计算机,计算机执行步骤如下 a)由乳腺磁共振波谱数据生成乳腺磁共振波谱矩阵对读入的乳腺磁共振波谱数据中每一个数据点根据其磁共振波谱生成一个向量,从而所有的磁共振波谱数据构成一个矩阵;以G表示乳腺磁共振波谱数据的二维分格,则|G|表示乳腺磁共振波谱数据中数据点的个数;以n表示数据点的磁共振波谱维数;从而,由整个乳腺磁共振波谱数据生成|G|行n列的乳腺磁共振波谱矩阵X={x1,x2,…,x|G|}T,其中T为矩阵转置符号; b)利用鉴别性流形学习方法对乳腺磁共振波谱数据进行维数约简,获取乳腺磁共振波谱数的低维鉴别特征; c)利用谱聚类方法对乳腺磁共振波谱数据的低维鉴别特征进行聚类,得到乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域; d)利用流形学习方法,对乳腺磁共振波谱数据中的肿瘤区域进行维数约简,获取肿瘤区域的低维鉴别特征;其具体包括 以r表示肿瘤区域中数据点的二维分格,|r|表示肿瘤区域中数据点的个数,肿瘤区域中各数据点磁共振波谱的维数为n,则肿瘤区域中的数据可表示为一个|r|行n列矩阵Xnew={xnew,1,xnew,2,…,xnew,|r|}T,即肿瘤区域数据矩阵,其中|r|<|G|。然后依照步骤c)中的方法对肿瘤区域数据矩阵Xnew进行维数约简,并获取肿瘤区域的低维鉴别特征Ynew;Ynew为肿瘤区域数据矩阵Xnew投影到低维嵌入空间的特征矩阵,其维数为|r|×tnew,tnew<n; e)根据先验知识得到代价敏感因子矩阵; 在计算机的数据库中标注良性肿瘤磁共振波谱特征Bx以及恶性肿瘤磁共振波谱特征Cx;对肿瘤区域的低维鉴别特征Ynew中每个数据点ynew,u赋予一个代价因子mcost,u,其中ynew,u∈Ynew,u∈{1,2,…,|r|},代价因子mcost,u由下式确定
其中取1<α<100;由元素mcost,u构成代价敏感因子矩阵Mcost。
f)利用代价敏感的聚类方法进行聚类,得到乳腺磁共振波谱数据的肿瘤区域中的良性区域和恶性区域,实现乳腺肿瘤的早期鉴别诊断;其具体包括 f1)初始化良性区域聚类中心vnew,1和恶性区域聚类中心vnew,2,由vnew,1和vnew,2构成聚类中心矩阵Vnew={vnew,1,vnew,2};其具体方式是,随机在肿瘤区域的低维鉴别特征Ynew中选取2个数据点ynew,i和ynew,j(ynew,i,ynew,j∈Ynew,i,j∈{1,2,…,|r|}且i≠j),分别作为良性区域聚类中心vnew,1和恶性区域聚类中心vnew,2,并确定初始代价和Mnewsum,0、最大迭代次数Tnew,max和迭代截止误差εnew;其中,200≥Tnew,max≥50,10-2≥εnew≥0; f2)分别计算肿瘤区域的低维鉴别特征Ynew中其它各数据点与两个聚类中心vnew,1和vnew,2的欧氏距离,按就近原则将各数据点归入聚类中心所代表的聚类中,完成一次聚类迭代运算; f3)经过该次迭代运算后,根据如下目标函数计算聚类后的代价和 然后将聚类后的代价和Mnewsum与初始代价和Mnewsum,0进行比较,计算错分代价误差若且ΔMnew≤εnew则停止迭代运算,执行步骤f5);否则,执行步骤f4); f4)分别计算所得两个聚类的均值数据点



并以



作为新的良性区域聚类中心vnew,1和新的恶性区域聚类中心vnew,2,并以此次聚类后的代价和Mnewsum作为新的初始代价和Mnewsum,0,重复步骤f2)和f3),再一次进行迭代运算和良性与恶性肿瘤区域错分代价误差运算;当迭代运算次数超过最大迭代次数Tnew,max,停止迭代运算,执行步骤f5); f5)依据聚类结果,划分肿瘤区域中的良性区域和恶性区域。
与现有技术相比,本发明具有以下优点 (I)本发明提供一种融合流形学习和谱聚类的乳腺磁共振波谱成像分析方法,通过计算机辅助检测手段,实现乳腺肿瘤的早期鉴别诊断,进一步实现乳腺癌的诊断。其采用鉴别性流形学习方法对乳腺磁共振波谱数据进行学习,将其投影到低维嵌入空间,不仅可以揭示隐藏在高维磁共振波谱空间中的低维流形结构,而且有效保持乳腺磁共振波谱数据中的鉴别信息;然后利用谱聚类方法对低维鉴别特征进行优化聚类,使不具备同鉴别特征的数据点得到了最大程度的分离,实现乳腺肿瘤的早期鉴别诊断;进一步,还引入代价敏感机制,以达到错分的总体代价最小化,实现乳腺癌的优化诊断。
(II)本发明通过融合鉴别性流形学习方法的乳腺磁共振波谱数据鉴别特征提取方法,能够更好地揭示隐藏在乳腺磁共振波谱高维空间中的低维流形结构,消除磁共振波谱之间的相关性,降低数据冗余度。
(III)本发明融合鉴别性流形学习方法与无监督的谱聚类方法实现乳腺磁共振波谱数据的数据特征分割,分割效率高,肿瘤诊断更加准确。
(IV)本发明进一步利用鉴别性流形学习方法对肿瘤区域进行维数约简和特征提取,进而区分良性肿瘤和恶性肿瘤,为乳腺癌的辅助诊断提供依据。
(V)在肿瘤区域的分类过程中,以实际医疗情况为依据引入代价敏感机制,区分良性误判和恶性误判的代价值,使得乳腺癌诊断结果更加优化。



图1为本发明基于磁共振波谱成像的乳腺肿瘤诊断系统的计算机流程图; 图2为1H-MRS乳腺磁共振波谱成像示意图; 图3为融合鉴别性流形学习方法与无监督的谱聚类方法实现乳腺磁共振波谱数据的数据分割效果示意图; 图4为融合鉴别性流形学习方法与代价敏感聚类方法实现乳腺磁共振波谱数据的良恶性肿瘤分类效果示意图;
具体实施例方式 下面结合附图和实施例对本发明的技术方案进一步说明如下 实施例 一种基于磁共振波谱成像的乳腺肿瘤诊断系统,包括超导MR扫描仪、乳腺专用表面线圈和计算机系统。利用本发明进行乳腺癌鉴别诊断的方法如下 通过GE公司1.5T超导MR扫描仪和乳腺专用表面线圈获得磁共振波谱数据进行乳腺癌鉴别诊断。数据采集过程中,患者取俯卧位,双侧乳腺自然下垂,用垫子适当填充固定,扫描中保持身体不动。使用单体素空间频谱点分辨自旋回波波谱法(SS-PRESS)行1H-MRS检查。参见图2,在图2.A中为一个乳腺磁共振切片场景,并进行16×16的体素分格,与网格相对应的波谱示例如图2.B和图2.C所示;图2.B表示一个由乳腺正常部分体素获得MR波谱曲线;图2.C表示一个由乳腺的肿瘤部分体素获得MR波谱曲线。超导MR扫描仪将乳腺磁共振波谱数据,以电子图像等计算机可识别的格式读入计算机,计算机执行步骤如下,参见图1 a)由乳腺磁共振波谱数据生成乳腺磁共振波谱矩阵计算机读入由GE公司1.5T超导MR扫描仪和乳腺专用表面线圈获得的磁共振波谱数据,如图2所示,在图2.A中为一个乳腺磁共振切片场景,并进行16×16的体素分格,与网格相对应的波谱示例如图2.B和图2.C所示,其中谱特征向量的维数n=256;图2.B表示一个由乳腺正常部分体素获得MR波谱曲线;图2.C表示一个由乳腺的肿瘤部分体素获得MR波谱曲线;通过转换可以将该磁共振波谱数据表示成256行256列矩阵X={x1,x2,…,xi,…,x256}T,i∈[1,256],T是矩阵转置符号; b)利用鉴别性流形学习方法对乳腺磁共振波谱数据进行维数约简,获取乳腺磁共振波谱数的低维鉴别特征。
首先对每一点xi通过欧氏距离计算其近邻点,在这里取k=8,可得到为点xi的8个近邻点组成的子集;这样对每一点xi,X可以分为knnL(xi)和knnN(xi)两部分。然后根据knnL(xi)和knnN(xi),就可以构建近邻图PL和非近邻图PN,并分别计算近邻权重矩阵WL和非近邻权重矩阵WN,WL与WN为256×256的对称矩阵。具体实现如下

再利用输入样本数据X、权重矩阵WL和WN来计算近邻结构矩阵ML和非近邻结构矩阵MN,ML与MN为256×256的对称矩阵。具体实现如下 其中,DL是由元素dL,ij构成的矩阵,且dL,ji=∑jwL,ij,因此DL是一个对角矩阵,LL=DL-WL为拉普拉斯矩阵; 其中,DN是由元素dN,ij构成的矩阵,且dN,ii=∑jwN,ij,因此DN是一个对角矩阵,LN=DN-WN为拉普拉斯矩阵。
通过目标优化函数得到投影矩阵A 即投影矩阵A由以下特征方程的t个最大特征值λ1>λ2>…>λt对应的特征向量a1,a2,…,at构成 MNa=λMLa 选择保持β能量(能量保持系数)的方法确定t, 在本实例中,β=0.9,得到256×16的投影矩阵A。
最后利用投影矩阵A将投影到低维嵌入空间,得到低维鉴别特征,具体如下 Y=ATX 得到256行16列的低维鉴别特征Y。
c)利用谱聚类方法对乳腺磁共振波谱数据的低维鉴别特征进行聚类,得到乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域。
首先通过Y来构造相似性矩阵Q与对角矩阵D;然后利用Q与D计算规范化相似性矩阵ND=D-1/2QD-1/2;再对矩阵ND进行特征值分解,获得m个最大特征向量,在本实例中,为了更直观的将聚类结果可视化,令m=3,构造E=[e1,…,e256];最后使用k-均值聚类算法将数据点ei划分到相应聚类中,在本实例包括两个聚类,分别为为乳腺组织的肿瘤区域和非肿瘤区域,完成聚类,具体如下 c21)先随机在可视化特征E中选取2个数据点ei和ej(ei,ej∈E,i,j∈{1,2,…,|G|}且i≠j),分别作为肿瘤区聚类中心v1和非肿瘤区聚类中心v2,选取Tmax=50,ε=10-3; c22)分别计算可视化特征E中其它各数据点与两个聚类中心v1和v2的欧氏距离,按就近原则将各数据点归入聚类中心所代表的聚类中,完成一次聚类迭代运算; c23)经过该次迭代运算后,分别计算所得两个聚类的均值数据点



计算它们与该次迭代运算的两个聚类中心之间的距离误差若Δv≤ε则停止迭代运算,执行步骤c25);否则,执行步骤c24); c24)分别以



作为新的肿瘤区聚类中心v1和新的非肿瘤区聚类中心v2,重复步骤c22)和c23),再一次进行迭代运算和距离误差运算;当迭代运算次数超过最大迭代次数Tmax,停止迭代运算,执行步骤c25); c25)依据聚类结果,划分乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域。
通过上述步骤,可得到乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域,如图3所示,其中矩形代表非肿瘤数据,圆形代表肿瘤数据,从图3可以得到,肿瘤区域与非肿瘤区域有了较好的区分; d)利用流形学习方法,对乳腺磁共振波谱数据中的肿瘤区域进行维数约简,获取肿瘤区域的低维鉴别特征; 在步骤c)中获得共有28个分格为肿瘤区域,其余为非肿瘤区域,所以乳腺磁共振波谱数据ROI区域表示为28行256列矩阵Xnew={xnew,1,xnew,2,…,xnew,28}T。然后利用步骤b)中的方法对肿瘤区域数据矩阵Xnew进行维数约简,在本实例中,为了更直观的将聚类结果可视化,令tnew=3,得到维数为28×3的肿瘤区域的低维鉴别特征Ynew。
e)根据先验知识进行标注,计算感兴趣区域中分格的代价敏感因子矩阵Mcost,Mcost为28×28的对称矩阵。具体如下
在本实例中,取α=20,表示将恶性样本错分为良性样本的代价要远大大于将良性样本错分为恶性样本。
f)利用代价敏感的聚类方法进行聚类,得到乳腺磁共振波谱数据的肿瘤区域中的良性区域和恶性区域,实现乳腺肿瘤的早期鉴别诊断。利用代价敏感因子矩阵Mcost,将肿瘤区域的低维鉴别特征Ynew聚类为良性区域和恶性区域 为了让肿瘤区域的低维特征数据集聚类后,良性误判和恶性误判的总代价值最小化,即希望如下目标优化函数达到最小 为实现上述目标,代价敏感聚类方法具体步骤如下 f1)初始化良性区域聚类中心vnew,1和恶性区域聚类中心vnew,2,由vnew,1和vnew,2构成聚类中心矩阵Vnew={vnew,1,vnew,2};其具体方式是,随机在肿瘤区域的低维鉴别特征Ynew中选取2个数据点ynew,i和ynew,j(ynew,i,ynew,j∈Ynew,i,j∈{1,2,…,|r|}且i≠j),分别作为良性区域聚类中心vnew,1和恶性区域聚类中心vnew,2,选取Tnew,max=100,εnew=10-4,在此迭代运算的收敛条件更加严格,使得聚类效果更好; f2)分别计算肿瘤区域的低维鉴别特征Ynew中其它各数据点与两个聚类中心vnew,1和vnew,2的欧氏距离,按就近原则将各数据点归入聚类中心所代表的聚类中,完成一次聚类迭代运算; f3)经过该次迭代运算后,根据如下目标函数计算聚类后的代价和 然后将聚类后的代价和Mnewsum与初始代价和Mnewsum,0进行比较,计算错分代价误差若且ΔMnew≤εnew则停止迭代运算,执行步骤f5);否则,执行步骤f4); f4)分别计算所得两个聚类的均值数据点



并以



作为新的良性区域聚类中心vnew,1和新的恶性区域聚类中心vnew,2,并以此次聚类后的代价和Mnewsum作为新的初始代价和Mnewsum,0,重复步骤f2)和f3),再一次进行迭代运算和良性与恶性肿瘤区域错分代价误差运算;当迭代运算次数超过最大迭代次数Tnew,max,停止迭代运算,执行步骤f5); f5)依据聚类结果,划分肿瘤区域中的良性区域和恶性区域。
通过上述步骤,可对乳腺磁共振波谱数据的肿瘤区域中的良性区域和恶性区域进行区分,实现乳腺癌的诊断,如图4所示,其中三角形代表良性区域的数据点,圆角四边代表为恶性区域的数据点。
综上,本发明提供一种融合流形学习和谱聚类的乳腺磁共振波谱成像分析方法,通过计算机辅助检测手段,实现乳腺肿瘤的早期鉴别诊断,进一步实现乳腺癌的诊断。本发明采用鉴别性流形学习方法对乳腺磁共振波谱数据进行学习,将其投影到低维嵌入空间,不仅可以揭示隐藏在高维磁共振波谱空间中的低维流形结构,而且有效保持乳腺磁共振波谱数据中的鉴别信息;然后利用谱聚类方法对低维鉴别特征进行优化聚类,使不具备同鉴别特征的数据点得到了最大程度的分离,实现乳腺肿瘤的早期鉴别诊断;进一步,还引入代价敏感机制,以达到错分的总体代价最小化,实现乳腺癌的优化诊断。
本发明中,超导MR扫描仪将乳腺磁共振波谱数据以电子图像等计算机可识别的格式读入计算机,计算机执行步骤如下,参见图1 a)由乳腺磁共振波谱数据生成乳腺磁共振波谱矩阵即计算机对读入的乳腺磁共振波谱数据中每一个数据点根据其磁共振波谱生成一个向量,从而所有的磁共振波谱数据构成一个矩阵。
其具体方式是以G表示乳腺磁共振波谱数据的二维分格,则|G|表示乳腺磁共振波谱数据中数据点的个数;以n表示数据点的磁共振波谱维数;从而,整个乳腺磁共振波谱数据构成一个|G|行n列矩阵X={x1,x2,…,x|G|}T(T为矩阵转置符号),即乳腺磁共振波谱矩阵。
乳腺磁共振波谱数据反映了不同代谢物的分布情况,如肌酸、柠檬酸和胆碱等,不同代谢物分的磁共振波谱互不相同;对乳腺磁共振波谱数据进行二维分格,以每一格作为一个数据点,每个数据点对应一个多维磁共振波谱,那么乳腺磁共振波谱数据中数据点数量加之各数据点的磁共振波谱,将乳腺磁共振波谱数据构建成为一个多维空间。
b)利用鉴别性流形学习方法对乳腺磁共振波谱数据进行维数约简,获取乳腺磁共振波谱数的低维鉴别特征。
通常乳腺磁共振波谱数据中数据点的磁共振波谱维数较高,并且在数据点之间呈现复杂的非线性流形分布,为准确、有效的提取其中的鉴别特征,就需要根据其流形结构对乳腺磁共振波谱数据进行维数约简;鉴别性流形学习方法可以揭示隐藏在乳腺磁共振波谱高维空间中的低维流形结构,消除磁共振波谱之间的相关性,降低数据冗余度,为乳腺磁共振波谱数据的鉴别特征提取提供了有效的保证。
利用鉴别性流形学习方法分析乳腺磁共振波谱数据中的流形结构,并通过优化目标函数对乳腺磁共振波谱数据进行维数约简,获取乳腺磁共振波谱数的低维鉴别特征;其具体方式是 首先对乳腺磁共振波谱矩阵X中每一个数据点xi,xi∈X,i∈{1,2,…,|G|},通过欧氏距离计算其近邻点,这样对每一数据点xi,乳腺磁共振波谱矩阵X可以分为knnL(xi)和knnN(xi)两部分表示数据点xi的k个近邻点xi1,xi2,…,xik组成的子集;knnN(xi)表示数据点xi的非近邻点组成的子集,即X中不包括其近邻点子集knnL(xi)的其余部分。
knnL(xi)、knnN(xi)与X之间的关系可用下式来表示 knnN(xi)=X-knnL(xi)(1) 显然,

knnL(xi)∪knnN(xi)=X。
利用knnL(xi)和knnN(xi)就可以构建近邻图PL和非近邻图PN首先分别在近邻图PL和非近邻图PN中定义与乳腺磁共振波谱矩阵X中每一个数据点xi一一对应的节点,然后对每一个数据点xi考虑任一相异数据点xj,xj∈X,j∈{1,2,…,|G|}且j≠i,根据k-NN方法定义图中的边,若xj∈knnL(xi),则用一条边连接近邻图PL中xi和xj两点;若xj∈knnN(xi),则用一条边连接非近邻图PN中xi和xj两点。
根据构建的近邻图PL和非近邻图PN,分别计算近邻权重矩阵WL和非近邻权重矩阵WN

由元素wL,ij构成近邻图PL对应的近邻权重矩阵WL,由元素wN,ij构成非近邻图PN对应的非近邻权重矩阵WN,然后分别利用近邻权重矩阵WL和非近邻权重矩阵WN计算近邻结构矩阵ML和非近邻结构矩阵MN 计算近邻结构矩阵ML的公式如下 其中,DL是由元素dL,ij构成的矩阵,且dL,ii=∑jwL,ij,因此DL是一个对角矩阵,LL=DL-WL为拉普拉斯矩阵; 计算非近邻结构矩阵的公式如下 其中,DN是由元素dN,ij构成的矩阵,且dN,ii=∑jwN,ij,因此DN是一个对角矩阵,LN=DN-WN为拉普拉斯矩阵。
近邻结构矩阵ML和非近邻结构矩阵MN体现了乳腺磁共振波谱数据中的流形结构;为了让相同磁共振波谱的数据点之间散度尽可能小、不同磁共振波谱的数据点之间散度尽可大,以便准确、有效的提取乳腺磁共振波谱数据中的鉴别特征,就需要根据乳腺磁共振波谱数据的流形结构计算得到投影矩阵A,将乳腺磁共振波谱矩阵投影到低维嵌入空间,实现乳腺磁共振波谱数据的维数约简,获取其低维鉴别特征。
投影矩阵A通过目标优化函数得到 即投影矩阵A由以下特征方程的t个最大特征值λ1>λ2>…>λt对应的特征向量a1,a2,…,at构成 MNa=λMLa(7), 其中,λ∈{λ1,λ2,…,λt},a∈{a1,a2,…,at},特征向量个数t的选择可通过下式计算 其中,β为能量保持系数,即从全部特征值中选择保持能量β的t个特征值,t<n;取0<β≤1,进而选择特征值对应特征向量a1,a2,…,at构成投影矩阵A=(a1,a2,…,at)。
然后利用投影矩阵A将乳腺磁共振波谱矩阵X投影到低维嵌入空间,得到乳腺磁共振波谱数据的低维鉴别特征,具体如下 Y=ATX(9), 其中,Y为乳腺磁共振波谱矩阵X通过投影矩阵A投影到低维嵌入空间的特征矩阵,是一个维数为|G|×t的低维矩阵,从而实现了到从|G|×n维到|G|×t维的维数约简(t<n);特征矩阵Y即作为乳腺磁共振波谱数据的低维鉴别特征。
c)利用谱聚类方法对乳腺磁共振波谱数据的低维鉴别特征进行聚类,得到乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域。
通过提取乳腺磁共振波谱数据的低维鉴别特征,使得乳腺磁共振波谱数据中肿瘤数据与非肿瘤数据之间得到了最大程度的分离,从而可利用无监督的谱聚类方法对低维鉴别特征进行聚类,实现肿瘤区域与非肿瘤区域的分割。
利用谱聚类方法对乳腺磁共振波谱数据的低维鉴别特征进行聚类,得到乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域;其具体方式是 c1)为了实现聚类后数据点的可视化,将乳腺磁共振波谱数据的低维鉴别特征Y再次投影到可视化维数的空间 首先,计算低维鉴别特征Y中每一数据点yi(yi∈Y,i∈{1,2,…,|G|})与Y中其余任一数据点yj(yj∈Y,j≠i})之间的相似度qij,由元素qij构成维数为|G|×|G|的相似度矩阵Q,且 式中t为常数,从式中可以得到,如果yi与yj的距离越远,‖yi-yj‖2越大,则qij越小,相似度越低;反之,则相似度越高。
然后,对相似度矩阵Q进行规范化,通过规范化相似度矩阵ND=D-1/2QD-1/2进行特征值分解,求得规范化相似度矩阵ND的m个最大特征向量,并由上述m个特征向量构成乳腺磁共振波谱数据的可视化特征E=[e1,…,e|G|];其中,D是由元素dij构成的对角矩阵,且dii=∑jqij,m是可视化空间的维数,且m<<n。
c2)用k-均值聚类算法对乳腺磁共振波谱数据的可视化特征E进行分类,区分肿瘤区和非肿瘤区;k-均值聚类算法的具体步骤如下 c21)先随机在可视化特征E中选取2个数据点ei和ej(ei,ej∈E,i,j∈{1,2,…,|G|}且i≠j),分别作为肿瘤区聚类中心v1和非肿瘤区聚类中心v2,并确定最大迭代次数Tmax和迭代截止误差ε;为防止迭代计算过程不收敛,选取200≥Tmax≥50,10-1≥ε≥0; c22)分别计算可视化特征E中其它各数据点与两个聚类中心v1和v2的欧氏距离,按就近原则将各数据点归入聚类中心所代表的聚类中,完成一次聚类迭代运算; c23)经过该次迭代运算后,分别计算所得两个聚类的均值数据点



计算它们与该次迭代运算的两个聚类中心之间的距离误差若Δv≤ε则停止迭代运算,执行步骤c25);否则,执行步骤c24); c24)分别以



作为新的肿瘤区聚类中心v1和新的非肿瘤区聚类中心v2,重复步骤c22)和c23),再一次进行迭代运算和距离误差运算;当迭代运算次数超过最大迭代次数Tmax,停止迭代运算,执行步骤c25); c25)依据聚类结果,划分乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域。
通过上述步骤,可得到乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域。
将乳腺磁共振波谱数据中的肿瘤区域作为感兴趣区域,进一步区分良性区域和恶性区域。良性肿瘤和恶性肿瘤在临床中的磁共振波谱也具有较明显的差异,可利用监督鉴别性流形学习方法对肿瘤区域进行维数约简和特征提取,进而区分肿瘤的良性区域和恶性区域,为乳腺癌的辅助诊断提供依据。因此,在上述乳腺肿瘤诊断方法的基础上,进一步通过以下步骤进行乳腺癌的诊断 d)利用流形学习方法,对乳腺磁共振波谱数据中的肿瘤区域进行维数约简,获取肿瘤区域的低维鉴别特征。其具体方式是 以r表示肿瘤区域中数据点的二维分格,|r|表示肿瘤区域中数据点的个数,肿瘤区域中各数据点磁共振波谱的维数为n,则肿瘤区域中的数据可表示为一个|r|行n列矩阵Xnew={xnew,1,xnew,2,…,xnew,|r|}T,即肿瘤区域数据矩阵,其中|r|<|G|。然后依照步骤b)中的方法对肿瘤区域数据矩阵Xnew进行维数约简,并获取肿瘤区域的低维鉴别特征Ynew;Ynew为肿瘤区域数据矩阵Xnew投影到低维嵌入空间的特征矩阵,其维数为|r|×tnew,tnew<n。
e)根据先验知识得到代价敏感因子矩阵。
依照传统的肿瘤分类理论,认为良性样本识别率与恶性样本识别率的重要性相当,因而良性样本误判率与恶性样本误判率的临床代价也相当,则通过与步骤c)相似的谱聚类方法对肿瘤区域的低维鉴别特征进行聚类,便能够实现肿瘤区域的分类。
但对于实际的临床检测诊断来说,这样的分类效果并不是十分理想的因为实际临床检测诊断中,若将良性样本错判为恶性样本,病人付出的代价仅在于多余的医疗成本;而若将恶性样本错判为良性样本,极易导致延误病人的最佳治疗时间,病情恶化后,病人不仅要付出成倍增加的医疗成本,还要付出健康代价,甚至导致不可挽回的后果,其代价远远大于良性样本错判为恶性样本的代价。因此,在肿瘤区域的分类过程中,以实际医疗情况为依据引入代价敏感机制,区分良性误判和恶性误判的代价值,使得乳腺癌诊断结果更加优化。具体方法是 基于对实际临床诊断的考虑,在计算机的数据库中标注良性肿瘤磁共振波谱特征Bx以及恶性肿瘤磁共振波谱特征Cx。对肿瘤区域的低维鉴别特征Ynew中每个数据点ynew,u赋予一个代价因子mcost,u,其中ynew,u∈Ynew,u∈{1,2,…,|r|},代价因子mcost,u由下式确定
其中取1<α<100,表示将恶性数据点误判为良性数据点的代价要大于将良性数据点误判为恶性数据点的代价。由元素mcost,u构成代价敏感因子矩阵Mcost。
f)利用代价敏感的聚类方法进行聚类,得到乳腺磁共振波谱数据的肿瘤区域中的良性区域和恶性区域,实现乳腺肿瘤的早期鉴别诊断。其具体方式是(以下聚类步骤需重新核实) 为了让肿瘤区域的低维特征数据集聚类后,良性误判和恶性误判的总代价值最小化,即希望如下目标优化函数达到最小 为实现上述目标,代价敏感聚类方法具体步骤如下 f1)初始化良性区域聚类中心vnew,1和恶性区域聚类中心vnew,2,由vnew,1和vnew,2构成聚类中心矩阵Vnew={vnew,1,vnew,2};其具体方式是,随机在肿瘤区域的低维鉴别特征Ynew中选取2个数据点ynew,i和ynew,j(ynew,i,ynew,j∈Ynew,i,j∈{1,2,…,|r|}且i≠j),分别作为良性区域聚类中心vnew,1和恶性区域聚类中心vnew,2,并确定初始代价和Mnewsum,0、最大迭代次数Tnew,max和迭代截止误差εnew;为使迭代运算初始化成立,选取为防止迭代计算过程不收敛,选取200≥Tnew,max≥50,10-2≥εnew≥0; f2)分别计算肿瘤区域的低维鉴别特征Ynew中其它各数据点与两个聚类中心vnew,1和vnew,2的欧氏距离,按就近原则将各数据点归入聚类中心所代表的聚类中,完成一次聚类迭代运算; f3)经过该次迭代运算后,根据如下目标函数计算聚类后的代价和 然后将聚类后的代价和Mnewsum与初始代价和Mnewsum,0进行比较,计算错分代价误差若且ΔMnew≤εnew则停止迭代运算,执行步骤f5);否则,执行步骤f4); f4)分别计算所得两个聚类的均值数据点



并以



作为新的良性区域聚类中心vnew,1和新的恶性区域聚类中心vnew,2,并以此次聚类后的代价和Mnewsum作为新的初始代价和Mnewsum,0,重复步骤f2)和f3),再一次进行迭代运算和良性与恶性肿瘤区域错分代价误差运算;当迭代运算次数超过最大迭代次数Tnew,max,停止迭代运算,执行步骤f5); f5)依据聚类结果,划分肿瘤区域中的良性区域和恶性区域。
通过上述步骤,可对乳腺磁共振波谱数据的肿瘤区域中的良性区域和恶性区域进行区分,实现乳腺癌的诊断。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
权利要求
1.基于磁共振波谱成像的乳腺肿瘤诊断系统,包括超导MR扫描仪和计算机系统,超导MR扫描仪将乳腺磁共振波谱数据以电子图像的计算机可识别的格式读入计算机,其特征在于,计算机执行步骤如下
a)由乳腺磁共振波谱数据生成乳腺磁共振波谱矩阵对读入的乳腺磁共振波谱数据中每一个数据点根据其磁共振波谱生成一个向量,从而所有的磁共振波谱数据构成一个矩阵;以G表示乳腺磁共振波谱数据的二维分格,则|G|表示乳腺磁共振波谱数据中数据点的个数;以n表示数据点的磁共振波谱维数;从而,由整个乳腺磁共振波谱数据生成|G|行n列的乳腺磁共振波谱矩阵X={x1,x2,…,x|G|}T,其中T为矩阵转置符号;
b)利用鉴别性流形学习方法对乳腺磁共振波谱数据进行维数约简,获取乳腺磁共振波谱数的低维鉴别特征;
c)利用谱聚类方法对乳腺磁共振波谱数据的低维鉴别特征进行聚类,得到乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域;
d)利用流形学习方法,对乳腺磁共振波谱数据中的肿瘤区域进行维数约简,获取肿瘤区域的低维鉴别特征;其具体包括
以r表示肿瘤区域中数据点的二维分格,|r|表示肿瘤区域中数据点的个数,肿瘤区域中各数据点磁共振波谱的维数为n,则肿瘤区域中的数据可表示为一个|r|行n列矩阵Xnew={xnew,1,xnew,2,…,xnew,|r|}T,即肿瘤区域数据矩阵,其中|r|<|G|。然后依照步骤c)中的方法对肿瘤区域数据矩阵Xnew进行维数约简,并获取肿瘤区域的低维鉴别特征Ynew;Ynew为肿瘤区域数据矩阵Xnew投影到低维嵌入空间的特征矩阵,其维数为|r|×tnew,tnew<n;
e)根据先验知识得到代价敏感因子矩阵;
在计算机的数据库中标注良性肿瘤磁共振波谱特征Bx以及恶性肿瘤磁共振波谱特征Cx;对肿瘤区域的低维鉴别特征Ynew中每个数据点ynew,u赋予一个代价因子mcost,u,其中ynew,u∈Ynew,u∈{1,2,…,|r|},代价因子mcost,u由下式确定
其中取1<α<100;由元素mcost,u构成代价敏感因子矩阵Mcost。
f)利用代价敏感的聚类方法进行聚类,得到乳腺磁共振波谱数据的肿瘤区域中的良性区域和恶性区域,实现乳腺肿瘤的早期鉴别诊断;其具体包括
f1)初始化良性区域聚类中心vnew,1和恶性区域聚类中心vnew,2,由vnew,1和vnew,2构成聚类中心矩阵Vnew={vnew,1,vnew,2};其具体方式是,随机在肿瘤区域的低维鉴别特征Ynew中选取2个数据点ynew,i和ynew,j,分别作为良性区域聚类中心vnew,1和恶性区域聚类中心vnew,2,并确定初始代价和Mnewsum,0、最大迭代次数Tnew,max和迭代截止误差εnew;其中,ynew,i,ynew,j∈Ynew,i,j∈{1,2,…,|r|}且i≠j,200≥Tnew,max≥50,10-2≥εnew≥0;
f2)分别计算肿瘤区域的低维鉴别特征Ynew中其它各数据点与两个聚类中心vnew,1和vnew,2的欧氏距离,按就近原则将各数据点归入聚类中心所代表的聚类中,完成一次聚类迭代运算;
f3)经过该次迭代运算后,根据如下目标函数计算聚类后的代价和
然后将聚类后的代价和Mnewsum与初始代价和Mnewsum,0进行比较,计算错分代价误差若且ΔMnew≤εnew则停止迭代运算,执行步骤f5);否则,执行步骤f4);
f4)分别计算所得两个聚类的均值数据点

并以

作为新的良性区域聚类中心vnew,1和新的恶性区域聚类中心vnew,2,并以此次聚类后的代价和Mnewsum作为新的初始代价和Mnewsum,0,重复步骤f2)和f3),再一次进行迭代运算和良性与恶性肿瘤区域错分代价误差运算;当迭代运算次数超过最大迭代次数Tnew,max,停止迭代运算,执行步骤f5);
f5)依据聚类结果,划分肿瘤区域中的良性区域和恶性区域。
2.根据权利要求1所述的基于磁共振波谱成像的乳腺肿瘤诊断系统,其特征在于,所述计算机执行的步骤b)具体包括
对乳腺磁共振波谱矩阵X中每一个数据点xi,xi∈X,i∈{1,2,…,|G|},通过欧氏距离计算其近邻点,将乳腺磁共振波谱矩阵X分为knnL(xi)和knnN(xi)两部分
knnN(xi)=X-knnL(xi);
其中,knnL(xi)表示数据点xi的k个近邻点xi1,xi2,…,xik组成的子集;knnN(xi)表示数据点xi的非近邻点组成的子集;
然后,分别计算近邻权重矩阵WL和非近邻权重矩阵WN
由元素wL,ij构成近邻权重矩阵WL,由元素wN,ij构成非近邻权重矩阵WN,分别利用近邻权重矩阵WL和非近邻权重矩阵WN计算近邻结构矩阵ML和非近邻结构矩阵MN
其中,DL是由元素dL,ij构成的矩阵,且dL,ii=∑jwL,ij,因此DL是一个对角矩阵,LL=DL-WL为拉普拉斯矩阵;
其中,DN是由元素dN,ij构成的矩阵,且dN,ii=∑jwN,ij,因此DN是一个对角矩阵,LN=DN-WN为拉普拉斯矩阵;
再通过目标优化函数得到投影矩阵A
即,投影矩阵A由以下特征方程的t个最大特征值λ1>λ2>…>λt对应的特征向量a1,a2,…,at构成
MNa=λMLa
其中,λ∈{λ1,λ2,…,λt},a∈{a1,a2,…,at},特征向量个数t的选择可通过下式计算
其中,β为能量保持系数,且0<β≤1,投影矩阵A=(a1,a2,…,at);
利用投影矩阵A计算腺磁共振波谱矩阵X通过投影矩阵A投影到低维嵌入空间的特征矩阵
Y=ATX,
特征矩阵Y即作为乳腺磁共振波谱数据的低维鉴别特征。
3.根据权利要求1所述的基于磁共振波谱成像的乳腺肿瘤诊断系统,其特征在于,所述计算机执行的步骤c)具体包括
c1)为了实现聚类后数据点的可视化,利用乳腺磁共振波谱数据的低维鉴别特征Y将乳腺磁共振波谱矩阵X再次投影到可视化维数的空间
首先,计算低维鉴别特征Y中每一数据点yi与Y中其余任一数据点yj之间的相似度qij,由元素qij构成维数为|G|×|G|的相似度矩阵Q,且
式中t为常数,yi∈Y,yj∈Y,i,j∈{1,2,…,|G|},j≠i;
然后,对相似度矩阵Q进行规范化,求得乳腺磁共振波谱数据的可视化特征E=[e1,…,e|G|];
c2)用k-均值聚类算法对乳腺磁共振波谱数据的可视化特征E进行分类,区分肿瘤区和非肿瘤区;k-均值聚类算法的具体步骤如下
c21)先随机在可视化特征E中选取2个数据点ei和ej,分别作为肿瘤区聚类中心v1和非肿瘤区聚类中心v2,并确定最大迭代次数Tmax和迭代截止误差ε;其中,ei,ej∈E,i,j∈{1,2,…,|G|}且i≠j,200≥Tmax≥50,10-1≥ε≥0;
c22)分别计算可视化特征E中其它各数据点与两个聚类中心v1和v2的欧氏距离,按就近原则将各数据点归入聚类中心所代表的聚类中,完成一次聚类迭代运算;
c23)经过该次迭代运算后,分别计算所得两个聚类的均值数据点

计算它们与该次迭代运算的两个聚类中心之间的距离误差若Δv≤ε则停止迭代运算,执行步骤c25);否则,执行步骤c24);
c24)分别以

作为新的肿瘤区聚类中心v1和新的非肿瘤区聚类中心v2,重复步骤c22)和c23),再一次进行迭代运算和距离误差运算;当迭代运算次数超过最大迭代次数Tmax,停止迭代运算,执行步骤c25);
c25)依据聚类结果,划分乳腺磁共振波谱数据中的肿瘤区域和非肿瘤区域。
全文摘要
本发明提供一种基于磁共振波谱成像的乳腺肿瘤诊断系统,包括超导MR扫描仪和计算机系统,通过计算机辅助检测手段,实现乳腺肿瘤的早期鉴别诊断,进一步实现乳腺癌的诊断。其采用鉴别性流形学习方法对乳腺磁共振波谱数据进行学习,将其投影到低维嵌入空间,不仅可以揭示隐藏在高维磁共振波谱空间中的低维流形结构,而且有效保持乳腺磁共振波谱数据中的鉴别信息;然后利用聚类方法对低维鉴别特征进行优化聚类,使不具备同类鉴别特征的数据点得到了最大程度的分离;进一步,还引入代价敏感机制,以达到错分的总体代价最小化,实现乳腺癌的优化诊断。
文档编号A61B5/055GK101785672SQ201010103529
公开日2010年7月28日 申请日期2010年1月29日 优先权日2010年1月29日
发明者黄鸿, 李见为, 冯海亮, 秦高峰 申请人:重庆大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1