计算机软件系统中实现肺结节危险程度分类的系统和方法与流程

文档序号:12470827阅读:421来源:国知局
计算机软件系统中实现肺结节危险程度分类的系统和方法与流程
本发明涉及识别领域,尤其涉及肺结节危险程度分类,具体是指一种计算机软件系统中实现肺结节危险程度分类的系统和方法。
背景技术
:近年来,肺结节临床诊断过程中肺部CT图像的应用越来越广泛,通过肺部CT图像分析肺结节的危险程度具有非常大的意义,尤其对早期肺结节的研究,研制一种高精度、临床意义大、鲁棒性强的肺结节危险程度分类系统变得越来越重要。由于肺结节的复杂性,目前基于肺部CT图像处理的肺结节分类技术缺乏完备性。现有的技术对肺结节的分类不具备实用性,对肺结节的恶性程度评估系统精度不高,在实际应用中缺乏实用性。技术实现要素:本发明的目的是克服了上述现有技术的缺点,提供了一种能够实现的。为了实现上述目的,本发明的具有如下构成:该计算机软件系统中基于肺结节图像密度实现肺结节危险程度分类的方法,其特征在于,所述的方法包括以下步骤:(1)通过已有的肺结节图像,建立肺结节图像数据库,并按照危险程度将肺结节图像标记成不同的类别;(2)采集需要判断的肺结节图像,建立肺结节图像单元库;(3)计算肺结节图像单元库中两两图像单元之间的距离,得到距离矩阵;(4)获得聚类数量和聚类中心;(5)对所述的肺结节图像数据库中每个肺结节图像计算其CT值密度分布特征,该特征表征着肺结节的危险程度,不同的肺结节类别具有不同的图像特征;(6)肺结节危险程度分类模块基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;较佳地,所述的步骤(2)包括以下步骤:(2-1)判断图像单元中各像素点的CT值是否都大于需要处理的CT数据源的最小灰度值,如果是,则保存至暂存数据集,否则,继续步骤(2-2);(2-2)遍历整个肺结节图像,重复步骤(2-1),直到所有像素点都筛选完毕;(2-3)随机挑选所述的暂存数据集中的若干图像单元,并送至肺结节图像单元库,设挑选比例为percent,暂存数据集中单元数量为tempCellNum,被选中的单元数量number由以下公式计算得到:number=1if0<tempCellNum≤percent*100tempCellNum*precentOTHERS.]]>较佳地,所述的步骤(3)包括以下步骤:(3-1)设u、v为肺结节图像单元库中任意两个图像单元,依次将u、v由大小为cellSize×cellSize转换为1×cellSize2的一维向量,分别为u={ui|i=0,1,2,…,cellSize2}、和v={vi|i=0,1,2,…,cellSize2};(3-2)设两个图像单元之间的距离为d,通过以下公式计算d;d(1)=Σ|ui-vi|Σ|ui+vi|;]]>d(2)=Σi|ui-vi||ui|+|vi|;]]>d(3)=max|ui-vi|;d(4)=∑i|ui-vi|;d(5)=||u-v||2。(3-3)得到五个距离矩阵dmj,j=1,2,3,4,5,设maxDist,minDist分别为dmj中最大和最小的值,目标选择的距离矩阵为distanceMatrix;其中:distanceMatrix=dmj,j=argmax(maxDistj-minDistj)。更佳地,所述的获得聚类数量和聚类中心,具体为:使用无监督聚类的方法对距离矩阵进行聚类,确定聚类数量,并分别获得其聚类中心,选择轮廓系数值最大的聚类结果作为最终的聚类结果。较佳地,所述的步骤(5)包括以下步骤:(5-1)逐个计算结节图像中CT值非零的像素的密度分布级别,以该CT值非零的像素为中心提取大小为cellSize×cellSize的小块图像;(5-2)匹配所述的小块图像与肺结节图像单元库中每一个图像单元,匹配到的图像单元的类别将作为测试像素的密度分布级别;(5-3)遍历地匹配整个结节图像,得到其CT值密度分布图像;(5-4)密度分布图像中进行类别点数统计并归一化得到一个多维CT值密度分布特征向量,所述的CT值密度分布特征向量地维度数等于聚类数量。较佳地,所述的步骤(6)包括以下步骤:(6-1)重复上述步骤(5),直到肺结节图像数据库中的所有肺结节图像都得到CT值密度分布特征向量,生成特征集,并将该特征集按一定的比例分裂为训练集和测试集;(6-2)从特征集中随机提取不少于70%的特征数据作为训练的特征集投入有监督机器学习模型进行训练,并进行参数优化;(6-3)将特征集中除训练集外的其余特征数据作为测试特征集,将测试特征向量投入上述的机器学习模型进行肺结节危险程度分类识别。还包括一种用于实现上述方法的计算机软件系统中基于肺结节图像密度实现肺结节危险程度判断处理的系统,其特征在于,所述的系统包括:图像CT值密度分布计算模块,用于根据无监督聚类计算CT值密度分布特征,该特征表征着肺结节的危险程度,不同的肺结节类别具有不同的图像特征;肺结节危险程度分类模块,用以根据有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;采用了该发明中的计算机软件系统中实现肺结节危险程度判断的系统和方法,在一定程度上实现在有创病理活检前,从临床角度辅助判断肺结节的良恶性,从而提高病理活检的准确性;减少病患不必要的有创活检,避免病患不必要的CT随访,为提高肺癌筛查、检测、诊断的准确率提供更有效的信息处理方法,具有广泛的引用范围。附图说明图1为本发明的计算机软件系统中实现肺结节危险程度判断的系统和方法的流程图。图2为本发明的计算机软件系统中实现肺结节危险程度判断的系统和方法的肺结节图像CT值密度分布特征提取流程图。图3为本发明的计算机软件系统中实现肺结节危险程度判断的系统和方法的肺结节危险程度分类流程图。图4为本发明的计算机软件系统中实现肺结节危险程度判断的系统和方法的实验结果示意图。具体实施方式为了能够更清楚地描述本发明的技术内容,下面结合具体实施例来进行进一步的描述。在一种实施方式中,该计算机软件系统中基于肺结节图像密度实现肺结节危险程度分类的方法,其特征在于,所述的方法包括以下步骤:(1)通过已有的的肺结节图像,建立肺结节图像数据库,并按照危险程度将肺结节图像标记成不同的类别;(2)采集需要判断的肺结节图像,建立肺结节图像单元库;(3)计算肺结节图像单元库中两两图像单元之间的距离,得到距离矩阵;(4)获得聚类数量和聚类中心;(5)对所述的肺结节图像数据库中每个肺结节图像计算其CT值密度分布特征,该特征表征着肺结节的危险程度,不同的肺结节类别具有不同的图像特征;(6)肺结节危险程度分类模块基于有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;在一种较佳的实施方式中,所述的步骤(2)包括以下步骤:(2-1)判断图像单元中各像素点的CT值是否都大于需要处理的CT数据源的最小灰度值,如果是,则保存至暂存数据集,否则,继续步骤(2-2);(2-2)遍历整个肺结节图像,重复步骤(2-1),直到所有像素点都筛选完毕;(2-3)随机挑选所述的暂存数据集中的若干图像单元,并送至肺结节图像单元库,设挑选比例为percent,暂存数据集中单元数量为tempCellNum,被选中的单元数量number由以下公式计算得到:number=1if0<tempCellNum≤percent*100tempCellNum*precentOTHERS.]]>在一种较佳的实施方式中,所述的步骤(3)包括以下步骤:(3-1)设u、v为肺结节图像单元库中任意两个图像单元,依次将u、v由大小为cellSize×cellSize转换为1×cellSize2的一维向量,分别为u={ui|i=0,1,2,…,cellSize2}、和v={vi|i=0,1,2,…,cellSize2};(3-2)设两个图像单元之间的距离为d,通过以下公式计算d;d(1)=Σ|ui-vi|Σ|ui+vi|;]]>d(2)=Σi|ui-vi||ui|+|vi|;]]>d(3)=max|ui-vi|;d(4)=∑i|ui-vi|;d(5)=||u-v||2。(3-3)得到五个距离矩阵dmj,j=1,2,3,4,5,设maxDist,minDist分别为dmj中最大和最小的值,目标选择的距离矩阵为distanceMatrix;其中:distanceMatrix=dmj,j=argmax(maxDistj-minDistj)。在一种更佳的实施方式中,所述的获得聚类数量和聚类中心,具体为:使用无监督聚类的方法对距离矩阵进行聚类,确定聚类数量,并分别获得其聚类中心,选择轮廓系数值最大的聚类结果作为最终的聚类结果。在一种较佳的实施方式中,所述的步骤(5)包括以下步骤:(5-1)逐个计算结节图像中CT值非零的像素的密度分布级别,以该CT值非零的像素为中心提取大小为cellSize×cellSize的小块图像;(5-2)匹配所述的小块图像与肺结节图像单元库中每一个图像单元,匹配到的图像单元的类别将作为测试像素的密度分布级别;(5-3)遍历地匹配整个结节图像,得到其CT值密度分布图像;(5-4)密度分布图像中进行类别点数统计并归一化得到一个多维CT值密度分布特征向量,所述的CT值密度分布特征向量地维度数等于聚类数量。在一种较佳的实施方式中,所述的步骤(6)包括以下步骤:(6-1)重复上述步骤(5),直到肺结节图像数据库中的所有肺结节图像都得到CT值密度分布特征向量,生成特征集,并将该特征集按一定比例分裂为训练集和测试集;(6-2)从特征集中随机提取不少于70%的特征数据作为训练的特征集投入有监督机器学习模型进行训练,并进行参数优化;(6-3)将特征集中除训练集外的其余特征数据作为测试特征集,将测试特征向量投入上述的机器学习模型进行肺结节危险程度分类识别。还包括一种用于实现上述方法的计算机软件系统中基于肺结节图像密度实现肺结节危险程度判断处理的系统,其特征在于,所述的系统包括:图像CT值密度分布计算模块,用于根据无监督聚类计算CT值密度分布特征,该特征表征着肺结节的危险程度,不同的肺结节类别具有不同的图像特征;肺结节危险程度分类模块,用以根据有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;在一种具体的实施方式中,为了实现上述目的,本发明的系统及方法具有如下构成:该基于肺部CT图像密度分布特征实现肺结节危险程度分类的系统,包括:图像CT值密度分布计算模块,用于根据无监督聚类计算CT值密度分布特征,该特征表征着肺结节的危险程度,不同的肺结节类别具有不同的图像特征;肺结节危险程度分类模块,用以根据有监督机器学习模型使用肺结节CT值密度分布特征实现肺结节危险程度的训练和分类;本发明还涉及一种通过权利要求1所述的系统基于肺部CT图像密度分布特征实现肺结节危险程度分类的方法,其特征在于,所述的方法包括以下步骤:(1)所述的图像CT值密度分布模块基于无监督聚类计算肺结节图像的CT值密度分布并提取该图像的密度分布特征。该步骤使用常用的各种聚类方法对肺结节数据进行分析,并利用轮廓指数的聚类评价参数评估聚类效果,提升处理效率、自适应程度以及方法的鲁棒性。特征计算过程中使用独特的CT值密度分布计算方式,该特征用于表征肺结节CT值的稠密度。通过此步骤,肺结节的生理性已被转换为信息领域中的图像密度分布特征;(2)所述的肺结节危险程度分类模块基于有监督机器学习模型的肺结节分类。该步骤主要利用不同肺结节类别密度分布特征的差异进行学习、分类。采用了该发明中的计算机软件系统中实现肺结节危险程度判断的系统和方法,在一定程度上实现在有创病理活检前,从临床角度辅助判断肺结节的良恶性,从而提高病理活检的准确性;减少病患不必要的有创活检,避免病患不必要的CT随访,为提高肺癌筛查、检测、诊断的准确率提供更有效的信息处理方法,具有广泛的引用范围。在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限制性的。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1