肺结节的高级计算机辅助诊断的制作方法

文档序号:6455947阅读:132来源:国知局

专利名称::肺结节的高级计算机辅助诊断的制作方法肺结节的高级计算机辅助诊断本申请主张2006年9月22日提交的序号为no.60/826,602的美国临时申请的权益,以引用的方式将其全文合并于此。提供用于高级计算机辅助诊断的系统和方法。肺癌是一种常见的并经常致命的疾病。尽管在外科技术和治疗方面有所改进,肺癌患者的五年生存率保持在仅有约15%。然而,对于在该疾病仍为局部时就被检测到的情况而言,五年生存率为约50%。对可疑病灶的早期检测和诊断允许早期的介入治疗并且会引起改进的预后。肺结节的表征是一个主要挑战,甚至连专家都经常不同意肺结节是癌性的。恶性结节的误诊造成治疗的延误。为了使误诊最小化,许多患者进行活组织检査,其消极地影响了患者的身体健康和心理健康,并对患者和保险提供者施加了很大的经济负担。多层计算机断层摄影(MSCT)的新近进展使得肺癌的检测和诊断可能在比以前更早的阶段进行。然而,这种系统生成要由放射学家解释的大量数据。这进而增加了临床决策支持系统(CDSS)的重要性。CDSS的一个示例为计算^l辅助检测(CAD)系统。在MSCT扫描中自动识别潜在病灶(诸如从胸部MSCT扫描识别肺结节)的CAD系统已获得FDA认证并且在市场上可获得。相反,表征所检测的病灶的计算机辅助诊断(CADx)系统仍停留在研究阶段(Awai等人,Radiology,2006年第239巻第1期第276-284页;Suzuki等人,IEEETrans,onMedicalImaging,2005年第24巻第9期第1138-1150页;以及Way等人,Me.Phys.,33(7),第2323-2337页,2006年)。CADx算法典型地依赖于机器学习技术,以将一组输入特征与期望的诊断输出联系起来。例如,在用于肺癌诊断的肺部计算机断层摄影(CT)成像中,这些输入特征可以包括应用于被研究的肺结节的图像处理算法的结果。识别用于机器学习的图像特征的过程被称为特征提取。改进CADx系统的诊断准确度是将该技术成功引入临床的一个关键步骤。改进CADx的性能的一种方法为改进特征提取过程。表征所检测的病灶的CADx系统仍处于研究阶段,甚至连文献中所描述的许多新近系统也无法并入临床信息或采用最优特征提取或应用高级机器学习技术。因此,在此提供在受检者中的疾病的诊断中提供决策支持的方法和系统。一个实施例中的方法包括提取所述受检者中的基于图像的感兴趣体积;分割所述图像,以从所述图像的背景描绘所述感兴趣体积内的至少一个病灶;在多个维数中提取基于图像的特征;将临床信息转换为兼容格式,并且将所述临床信息与所述基于图像的特征结合,以形成特征库;以及从由输出决策的分类器或分类器委员会(committeeofclassifiers)所要使用的子集库中选择最优特征子集或最优特征子集组,其中,所述分类器或分类器委员会提供对所述病灶的诊断的预测。相关的实施例还包括在感兴趣体积的各切片之间进行插值,以创建各向同性的体素表示。在这些实施例中的任一个中,多个维数包括用于基于图像的特征提取的2维、2.5维和3维。相关的实施例还包括最优特征子集,其包括遗传算法、统计差分滤波、相关滤波、递归特征消除、逐步线性回归以及随机特征选择中的至少一项。在相关的实施例中,将临床信息变换为多个临床特征类别。在另一相关的实施例中,分类器或分类器委员会为支持向量机、决策树、线性判别分析、或神经网络。在又一实施例中,分类器或分类器委员会确定至少一个病灶是恶性的还是良性的。在相关的实施例中,分类器或分类器委员会确定至少一个病灶为恶性的可能性。分类器或分类器委员会作出的确定结果由诸如简单平均值、简单投票、加权平均值或加权投票之类的至少一种计算确定。提供用于计算机辅助诊断的系统,其包括预处理单元,用以提取基于图像的感兴趣区域;插值单元,用以生成各向同性或接近各向同性的体素表达;分割单元,用以描绘所述感兴趣区域中的至少一个病灶;特征提取单元,用以在多个维数中从所述感兴趣区域的所述图像提取多个维数中的基于图像的特征;临床信息处理单元,用以接收临床信息并将其转换变换为兼容格式;以及分类器或分类器委员会,其利用所述基于图像的特征和所述临床信息以输出决策。相关的实施例还包括特征选择单元,用以在训练所述系统的过程中从特征库选择相关的基于图像的特征和临床特征。在另一相关的实施例中,该特征选择单元还包括优化技术,诸如遗传算法、统计差分滤波、相关滤波、递归特征消除、逐步线性回归和随机特征选择;以及选择的分类器或分类器委员会,其包括支持向量机、决策树、线性判别分析和神经网络。在相关的实施例中,通过执行至少一种形态学运算来构造基于图像的感兴趣区域。所述至少一种形态学运算包括腐蚀、膨胀和孔洞填充。.相关的实施例还包括通过选择由所述分割产生的最大相邻对象来构造基于图像的感兴趣区域。在另一相关的实施例中,基于图像的感兴趣区域包括内部区域、外部区域和边界区域,其中不需要的元素被排除在感兴趣区域之外。在另一相关的实施例中,临床信息还包括从年龄、性别、吸烟史、癌症史、家族史、职业暴露、休闲暴露、既往肺部疾病、现患肺部疾病、先前的胸部手术、要被诊断的病灶周围的卫星病灶的数量、淋巴结大小、是否存在可疑结以及病灶在肺中的位置中选择的至少一个数据点。在相关的实施例中,分类器确定病灶是恶性的还是良性的。在另一相关的实施例中,分类器确定病灶为恶性的可能性。在又一实施例中,提供一种从多切片数据集提取特征的方法,其中所述方法包括以下步骤数学地表示对象的空间分布;数学地表示对象的形状;确定对象的轮廓和纹理;识别病灶的边界像素并估计导数;分析作为沿着轮廓的位置的函数的导数;自动识别对象内的暗区域或亮区域的存在;以及对对象的周围区域的图像的纹理进行近似。相关的实施例还包括通过由用户手动选择或通过自动选择最大切片而从多切片数据集选择独立的切片以用于分析。在相关的实施例中,对以下至少一项计算特征多切片数据集的每个切片;以任意角度进行的最大强度投影;以任意角度进行的最小强度投影;以及贯穿所述图像的一个或多个切片以任意角度进行的数字重建射线照片。在另一相关的实施例中,对多切片数据集的各切片计算的特征通过包括下列的方法进行结合计算加权平均值,其中权重与每个切片上的像素的数量成比例;找出横跨多切片数据集的多个切片的最大值;以及找出横跨多切片数据集的多个切片的最小值。在另一相关实施例中,在多个维数的每个中计算特征。在另一实施例中,通过下列至少一项描述对象的形状边界像素位置的傅立叶变换之后的系数分布;分割对象的对平移、旋转和缩放不变的数学矩;图像像素的灰度分布的数学矩;分形维数;以及链码。在另一实施例中,通过下列至少一项描述对象的纹理分形维数;基于灰度共生矩阵的能量、熵、最大概率、惯量、逆差和相关;以及基于邻域灰色调差分矩阵的粗糙度、对比度、繁忙度、复杂度和强度。在又一实施例中,通过下列至少一项描述描述周围区域图像强度沿着与局部轮廓正交的方向的导数;图像强度沿着与局部轮廓正交的方向的导数以及功率谱的矩;以及图像强度沿着与局部轮廓正交的方向的方差的估计。在又一实施例中,通过高于或低于给定阈值的相邻像素簇的强度或尺寸描述对象内的暗区域和亮区域的存在。在此提供方法和系统,以便预处理医学图像并提供用作到CADx系统的输入的特征。应用高级图像处理和机器学习技术,并且整合关于患者的临床信息以提供诊断中的决策支持。在此提供的方法和系统实现了很高的特异性和敏感性,并且在多个维数中表征病灶以更准确地区分开恶性病灶与良性病灶。在此提供的方法和系统可以给出二元决策(即结节是恶性的还是良性的),或者可以提供结节或病灶为恶性的概率或可能性(例如80%)。临床医生将该信息用作第二意见以帮助其作出诊断决策。在此提供的方法和系统可以用于不同的疾病(例如结肠息肉、肝癌或肺癌)和不同的模态,诸如MRI或CT。10图1为示出了用于找出轮廓的分形维数的计盒算法的系列图;图2为分形维数的计算的图表,其中纵坐标为log(N[盒])而横坐标为log(1/[盒尺寸]),从而示出log(N[盒])和log(1/[盒尺寸])之间的线性关系;图3,画面A为结节的扫描;图3,画面B为相对应的分割轮廓图和所估计的法向角;图4,画面A为结节的强度梯度的图表,其中纵坐标为梯度而横坐标为沿着轮廓的位置;图4,画面B为相对应的功率谱的图表,其中纵坐标为功率/频率而横坐标为归一化频率;图5为CADx系统的框图。向临床医生提供高置信度的CADx系统通过提供快速准确的诊断(更少的假阳性和假阴性)而改进临床医生的工作流程。CADx系统可用作第二阅读器以增加临床医生在其诊断中的置信度,从而导致显著减少了诸如结节的肺部病灶的不必要的活组织检査。此外,由于可以快速并准确地达到诊断,CADx系统能够便于无症状患者的肺癌筛选。例如但并不限于PhilipsBrilliance系列的MSCT扫描器提供增加的分辨率并允许观察更细的结构,同时产生要由放射学家解释的数量增加的图像数据。然而,甚至连最新的CADx系统也经常无法并入临床信息、采用最优特征提取或应用机器学习技术。未被开发的感兴趣特征包括对厚切片和薄切片CT扫描这两者的分析。其他提议的特征仅包括简单的3D特征或对于描述良性结节和恶性结节之间的差异非最优的特征。这些特征通常引起低准确率,并且不期望用于CADx算法。在此提供的方法和系统是基于现有技术水平的机器学习技术的,诸如遗传算法和支持向量机以及用于预处理图像和特征提取的创新的图像处理算法。在此提供的方法和系统的一个方面为能够将关于患者和患者病灶的基于图像的信息和临床信息结合到决策过程中。在此提供的方法和系统通过使用机器学习和图像处理方法将从高质量医学图像(例如CT扫描)提取的特征与来自患者健康记录的非成像数据相结合。在此提供的用于病灶的计算机辅助诊断的方法和系统(由图5举例说明)包括若干处理单元。预处理单元处理图像(例如MSCT扫描),以创建每个都围绕被诊断病灶的各向同性的感兴趣体积,或者分割或描绘诸如肺结节的病灶。特征提取单元从图像提取二维(2D)和二点五维(2.5D)和三维(3D)特征以表征病灶。这些特征与包括患者历史的临床信息共同构成特征库。临床信息处理单元接收并变换临床信息,以将其用于特征库。特征选择是在系统的设计阶段所使用的一个步骤,其基于遗传算法并用于从特征库选择最优特征子集。分类器或分类器委员会用于特征选择过程,并且构建为利用所选择的特征子集以将病灶分类为恶性或良性,或确定诸如肺结节的病灶的恶性程度。在很多情况下,由于结节的3D形状的复杂性,2D切片可以显示若干间断的岛。由于以下描述的很多特征依赖于边界像素的唯一描绘,经常期望仅在单个对象上进行操作。一个实施例中的方法和系统利用算法将除最大的连接的对象外的所有对象移除,并且在该对象上执行所有结节分析。在此情况中,仅对2D和2.5D特征执行分析。在此提供的方法和系统便于在多切片数据集上使用2D、2.5D和3D特征。由于2D特征计算的便利,甚至在可获得3D数据时也常常期望采用2D特征。这在厚切片数据(即切片厚度大于3倍的面内分辨率)中尤其常见,其中3D特征可能并不同样鲁棒和充足。在这种情况下,CADx系统的用户可以手动地识别独立的切片以用于分析。于是可以说CADx系统在2D模式下操作,其中将从该2D切片提取的特征用于执行分类。相似地,当该系统在2D模式下操作时,只将来自训练数据集的2D特征用于构造最优分类器。这种系统无法获取多切片体积中存在的全范围信息。为了将此克服,在此提供的方法和系统采用2.5D或伪3D模式。在纯2D模式下使用相同的特征,并且在MSCT图像的每个切片上计算这些特征。切片范围可以包括整个体积,或可替代地由用户手动地选择。用于分类器的特征值于是被作为这些逐个切片计算的尺寸加权平均值。对于某些特征,可以更合乎逻辑地利用横跨各切片的最大值或最小值。可替代地,在贯穿各切片的范围或从任意角度进行的最大强度投影(MIP)的数据上计算2D特征,并在所投影的图像上运行2D特征提取。图像的预处理对诸如MSCT扫描的图像进行预处理,以确定用于分析的感兴趣区域(ROI)或感兴趣体积(VOI)。这些用作进入特征提取单元的输入。在此提供的方法和系统包括若干预处理步骤。ROI被构造为允许特征计算以对分割错误具有鲁棒性。ROI由二值结节图像上的腐蚀和膨胀的形态学运算构造。这可用于构造内部区域、外部区域和边界区域。还识别由可以嵌入对象中的最大的正方形区域组成的额外ROI。可以利用这些ROI的任何一个或多个来计算这些方法和系统中所描述的特征。胸壁和其他无关的解剖结构被排除在特征计算之外。许多当前的分割算法还描绘胸壁的边界。属于胸壁的体素或像素明确地被排除在将被描述的所有特征之外。仅包括标记为属于肺实质或感兴趣结节的那些像素。对于许多特征而言,期望获取结节内的全范围细节,包括结节内的潜在空洞。空化或结节内的气包(airpocket)经常不能通过分割直接识别。因此,在此提供的方法和系统采用一种算法,该算法用于对结节分割进行预处理以填充分割掩模中的孔洞或间隙,从而使得在特征计算过程中明确考虑结节内的气包或空洞。改变不是在CT图像上执行,而是在分割结果上执行。这些方法和系统涉及处理后的分割掩模以及原始分割掩模的使用。如图5所示,预处理单元基于肺结节的位置提取围绕肺结节的VOI,肺结节的位置可由临床医生或CAD系统提供。由于MSCT扫描在切片中比切片间具有更高的分辨率,期望在各切片之间执行插值以创建各向同性的体素表示。对各向同性体素的插值被期望用于分割目的。然而,还优选保留用于特征计算的原始数据,以避免插值核的滤波特性。在此提供的方法和系统采用一种插值法,该插值法保持原始切片并插入插值切片,以使扫描接近各向同性。一个实施例中的方法和系统包括一种将插值限制到单轴以便达到接近各向同性的体素的手段。这些各向同性体积于是可用于分割以及3D特征的计算。随后可以从该插值3D数据集提取原始的2D切片。分割步骤描绘来自背景的肺结节,从而生成二值图像或三值图像(标记VOI),其中结节、背景和肺壁区域被标记。在插值数据上运行分割算法,从而产生与插值体积具有相同维数的体积。参见2003年的PhilipsPresskelease,飞利浦的新型CT肺结节评估和比较选项可以使临床医生能够识别禾口治疗月巿癌(Philips'newCTLungNoduleAssessmentandComparisonOptioncanenableclinicianstoidentifyandtreatlungcancer);Wiemker等人,改进月市结节计算机辅助检测在薄切片CT中的性能的选项(Optionstoimprovetheperformanceofthecomputeraideddetectionoflungnodulesinthin-sliceCT),PhilipsResearchLaboratories:Hamburg,2003年第1-19页;以及Wiemker等人,CT数据中的计算机辅助肿瘤体积分析(ComputerAidedTumorVolumetryinCTData),Inventiondisclosure,PhilipsResearchHamburg,2002。对于对2D特征的分析,识别并提取出标记体积中对应于原始切片的切片。对于3D特征,使用全部接近各向同性的3D体积。在本发明的一个实施例中,通过使用变化阈值从分割中手动选择分割掩模。因而,对各种分割阈值和种子布局进行测试。向用户呈现覆盖有分割轮廓的灰度图像,然后,该用户手动地选择最优分割、用于2D特征提取的单个切片以及用于2.5-D特征提取的切片的范围。特征提取单元执行特征提取来提取2D、2.5D和3D特征图像,以表征诸如肺结节的病灶。这些特征与临床信息共同构成特征库。通过使用灰度和标记的VOI,特征提取单元计算不同的特征,诸如2D(使用具有最大的结节横截面的VOI的原本(native)切片)、2.5D(在所有原本切片上计算的2D特征的平均值,按照结节横截面积进行加权)和3D(基于接近各向同性的VOI)特征。特征提取步骤很重要,因为所计算的特征需要具有足够的判别力以及临床信息,以区别恶性结节和良性结节。特征可以是例如结节内部或结节周围的灰度分布、形状信息、结节内部和结节外部的纹理信息、结节表面上的梯度信息或结节内部和结节外部之间的对比度。可以在2D、2.5D或3D中计算这些特征中的每个特征。临床信息及其到临床特征的变换由于临床信息在诊断过程中很重要,在此提供的方法和系统包括一单元,该单元将临床信息转换为适当形式,从而使其能够与基于所提取的图像的特征相结合以用于特征选择过程。例如,性别的临床信息被分为两类,诸如患者是否为男性或患者是否为女性。可用于所提议的系统的临床信息可以包括例如年龄、性别、吸烟史、癌症史、家族史、职业暴露、休闲暴露、既往或现患肺部疾病(例如肺气肿)、要被诊断的病灶周围的卫星病灶的数量、淋巴结大小、其他可疑结节的存在或肺中结节的位置(例如上叶或下叶)。特征选择特征选择单元从包含基于图像的特征及临床特征的特征库中找出最相关的特征。采用基于GA和SVM的特征选择过程。一旦基于训练数据集确定了最相关的特征,就基于最优特征子集构建分类器或分类器委员会,并且特征选择单元不再是必需的。在涉及分类器委员会的实施例中,可以在通过单独运行特征选择算法而识别的特征子集上构建每个委员会成员。例如对于基于GA的特征选择,通过对每个GA运行给予不同的随机选择的包含训练数据和测试数据的集合来实现委员会中分类器的多样性。还可以采用其他特征选择方法,诸如统计差分滤波、相关滤波、逐步线性回归、递归特征消除(RFE)和随机特征选择。分类器遵循监督学习原理,利用所选择的最优特征子集和训练数据来创建分类器。可能的分类器有SVM、决策树、线性判别分析和神经网络。经常采用SVM,因为SVM已表现出关于分类器的优越性能。还可以采用分类器委员会。在这种情况中,在经由特征选择过程选择作为最佳特征子集的不同的特征子集上创建若干分类器。每个分类器将产生决策,例如结节是恶性的或良性的。分类器的多数投票将确定例如CADx系统对有疑问的结节的输出。在似然CADx中,委员会的输出似然可以是小部分阳性投票,或来自委员会的每个成员的独立似然结果的平均值(可对其加权)。示例在此提供的方法和系统对CADx应用若干图像处理方法。以下提供这些图像处理方法的示例。示例l:不变矩矩是数学地表示对象的空间分布的一种手段。其包括形状(二值矩)15或密度分布(灰度矩)。不变矩是在对象经历诸如旋转、縮放和平移的某种变换时不发生变化的那些矩。基于矩的方法己被详细地用在计算机视觉和光学字符识别。Hu(1962)的数学形式体系描述了不变矩(包括前6个不变矩)的使用。对于尺寸为NXM的图像I,矩mpq可以由以下给出淤w二H]xP少?7(x,少)x=l少=1其中,/针对灰度矩呈现像素(x,y)处的图像的灰度强度,或者针对二值矩呈现0或1值。利用下列矩定义对象的质心。X=W10/W00且y=OT01/w00这允许计算在平移下不变的中心矩;"pq:wJW——_r=l少=1可以通过计算归一化的中心矩来使其尺度不变其中,对于所有07+g)22,r=(;7+9)/2+l。利用Hu所描述的方法(IRETransInformationTheory,IT-8179-197,1962)可以将其这些尺度不变矩和平移不变矩转换为旋转不变矩。按照下列方程给出这七个矩不变量。仏=+物仏,20-W02)2+勿u2=(物-3〃i2)2+(3/2i-物)2仏=0/30+712)2+(721+物)2&=0/30-3化)(Wo+"12)+((物+7i2)2-3(72i-W2)+(3^/21-物)0/21+物)(3(物+712)2-("21+物)2)仏=0720-(0/30+〃12)2-0/21+物)2)+化i(物+Wi2)(//2i+物)巧=(372i-物)(物+(O730+2——30/2i+物)2)+(3y12-物)(721+物)(3(w12+物)2-(721+物)2)通过在不同的p和q值以及图像中的所有像素上进行迭代、跳过不在结节中的像素来计算这些矩和中心矩。图像函数/可以是二值的或实值的,并且实际上,这两者都可以实现。以这种方式,每个结节可以贡献七个不变二值矩和七个不变灰度矩。这14个标量值可用作对CADx系统的输入。可替代地,为了使特征提取对分割的不确定性具有鲁棒性,通过在包围所分割的结节的圆形面积上执行矩计算来计算灰度矩。通过分割识别胸腔壁和无关的肺部结构并将其移除。为了避免错误地将0值置于这些移除的结构中,通过从根据所保留的背景计算的直方图中进行采样来将随机噪声插入这些像素中。此外,提取3D矩,并且,如以下方程所示,根据二值掩模灰度数据中的3D矩导出各特征。矩Jll=T]200+ri020+Ti002矢巨J21=Tl200"H020+Tl20011002+"H02(/n002_"101_TllloTlll(Tfl。U矩J31=r(200T|020ri002-ri002ri1102+2*ri110*ri101*ri01i國ri020、1012—"200*,12还对灰度结节图像导出的矩计算以上这三个导出的特征。示例2:不变傅立叶描述子傅立叶描述子是数学地描述对象形状的一种手段。从概念上讲,用频率来描述对象的边界。低频描述光滑边缘并给出对象的大体形状,而高频描述不规则性和轮廓的急剧变化。傅立叶描述子描述构成特定对象形状的频率的特定混合。在此提供的方法和系统中,采用对縮放、平移和旋转不变的傅立叶描述子。为了用于分类器,提供将傅立叶系数精简(condense)为标量值的两种手段。最初,通过大量公知的方法识别结节边缘上的像素。注意确保这N个边缘像素在对象周围以顺时针顺序或逆时针顺序列出。利用每个边缘像素的x禾ny坐标描述每个边缘像素,从而产生向量x={x,,x2,…,x"和y=(y,,y2,yN}。采用大量技术中的任何技术计算每个对象的离散傅立叶变换(一般地表示为FT),从而产生v=FT{x}且w=FT{y}其可以分解为实部和虚部于是,可将由x和y唯一地定义的形状的傅立叶描述子表达为:这产生了可能在结节之间的长度上变化的向量f,因而致使其难以用于在CADx系统中比较结节。在此提供的方法和系统中,将向量f精简为两个标量描述子gi和g2:这里给出的数学描述遵循了Nixon等人的FeatureExtraction&ImageProcessing,Butterworth-Heinemann:Woburn,MA.第269—278页(2002)。该计算用作至CADx系统中的输入。示例3:结节形状的分形维数可以利用Minkowski-Bouligand分形维数(也称为计盒维数)来描述对象的轮廓。其描述了所测量的轮廓长度如何随着观察轮廓的分辨率而变化。具有高分形维数的结节趋向于展现出表面形状的不规则性,其可以指示恶性程度。可以针对2D、2.5D或3D特征计算分形维数,并且实际上,可以在分类过程中同时使用所有这三者。考虑在图1的第一画面中示出(尺度1)的具有轮廓线的结节。此轮廓线由最接近结节外表的所有像素组成。将轮廓线中的像素的总数计数为N(1)。然后,如图1中所示(尺度2),以因子K对图像进行重采样。其可以被认为在尺度1的图像上拼接(tile)2x2像素盒并查看包含多少这些盒和边缘像素。此盒计数被表示为N(1/2)。然后,以3x3的像素盒重复这个过程以产生N(1/3),以此类推。对于分形对象,值N(1/d)根据下式随^度d而变化N(l/d)"(l/d)-FD其中FD为对象的分形维数。通过代数操作,将其变为InN(1/d)=—FDIn(1/d)+lnp。因而,如果对若干d计算Nd的值,则可以通过x轴上的ln(l/d)和y轴上的lnN(l/d)之间的线性拟合来估计FD。此拟合可以是最小二乘拟合或鲁棒拟合,或可以通过在连续点之间取平均斜率来进行拟合。图2中给出了这种拟合的一个示例。该线的斜率用作CADx系统的一个特征。示例4:结节纹理的分形维数可以用分形维数来描述对象的纹理。对象的2D视图被认为是嵌入在3D中的表面。分形维数测量在图像的分辨率改变时的灰度强度的变化。更高的分形维数表明对象的内部结构的更大的复杂度。与边界一样,可以对2D、2.5D或3D特征计算纹理的分形维数,并且实际上,可以在分类过程中同时使用所以这三者。以与边界相似的方式计算纹理维数,如以上在示例3中描述的,其中具有下列改变不拼接而是重叠dxd盒;就是说,考虑所有可能的dxd盒。然后,代替对盒的数量进行计数,N(1/d)表示每个dxd盒内的最大像素灰度值和最小像素灰度值之间的差,并在尺寸为dxd的所有盒上进行求和。示例5:基于边缘梯度的特征识别结节的边界像素,并且计算指向远离对象的法线方向。通过计算边界像素和在法线方向上远离某有限距离的像素之间的灰度强度的差来估计导数。典型地通过对图像的值内插两个远离的像素来找出此第二外部值。于是,可以统计地对作为沿着轮廓的位置的函数的导数进行分析,以利用此函数的平均值、标准差以及此函数的功率谱的均方根差和第一矩来产生标量特征。与傅立叶描述子一样,考虑每个边缘像素及其x和y坐标,从而产生向量x={力,:c2,…,~}和y={^,》,...,,}。对于位于(^乂)处的边缘像素/,计算法向角。法向角由下式给出-1a=—2an-i(i^LZA)+tan-i(AZi^)+90°注意确保符号的一致性。也就是说,将法线计算为与表面的局部曲线垂直,其中,通过在两个相近(但不必要相邻)点之间取平均值来估计局部曲率。图3中给出了在结节上计算这些角的一个示例。然后由以下坐标定义远离边缘的点d的像素jc=jc/+dsina且_y=乂'+<icosa,其中强度位于图像上的双线性插值所找出的位置。于是边缘梯度简化了插值强度和原始边缘像素强度之间的差异。这可以按顺序对每个边缘像素进行计算,如图4中所示。据此可以计算大量统计特征,包括平均值和标准差。可以通过许多公知的技术来估计功率谱,从而产生关于对象周围的脉动的频率含量的信息。对此分析的基本假设为强度的高的频率变化可以表明毛刺征,其被认为是对恶性的指示。为了对此进行评估,可以计算功率谱的矩和均方根差并将其用作特征。示例6:内部簇的检测和表征对象中暗簇或亮簇的存在可以分别指示钙化或空化。在此提供的方法和系统包括自动识别这些区域并将其用作CADx的特征的手段。将阈值迭代地应用于图像,从而使得只有保留的像素才高于某个强度t。降低t的值,从对象中的最大值开始,至对象的最小值。在每个阈值,保留的像素被分组成在侧面相连的簇。也就是说,每个簇由像素集合组成,其中该集合可能通过在四个主方向中的一个方向上行进但不曾离开该簇来从一个像素移动至任何其他像素。如果最大的簇具有大于n个像素的尺寸,则保存阈值t的值并且停止该算法。所提取的特征由在图像像素强度的单元中表达的阈值的值给出,或者作为检测到的簇的剩余部分的平均强度和临界阈值之间的标准差的数量。相似地,通过将阈值设为低于迭代的强度阈值,可能检测暗簇;可以对这些簇计算相同的两个特征。示例7:链码可以以连续序(continuousorder)识别对象图像的边界上的像素,从而使得每个像素具有一对近邻。通过跟踪邻近像素的相对位置,识别描述对象形状的向量。对于边界上的每个像素,使用链码定义该像素的两个近邻。考虑由左边的图像的灰色像素给出的边界。20<table>tableseeoriginaldocumentpage21</column></row><table>通过将右边的模板的中心置于边界的每个像素上,链码描述读出{1,2,1,2,4,4,...},其具有连续值(l,-1,1,2,0,...}之间的差或具有{1,1,1,2,0,...}的绝对差。这些链码的分布和链码差值可用于计算特征。大于1,26的小部分绝对差值可用作特征。该小部分可以用于检测方向突变的数,因而描述了结节的不规则性或诸如毛刺征和分叶征的概念。示例8:纹理邻域灰色调(Gmv-Tone)差分矩阵存在若干数学方法用于对图像纹理的人类感知进行近似,包括上述分形方法。一种替代方法基于被称为邻域灰皿差分矩阵(neighborhoodgray-tonedifferencematrix,NGTDM)的矩阵。该方法试图定量描述每个像素和其周围邻域之间的差异,从而导致已在心理测试中显示出与包括粗糙度、对比度、繁忙度、复杂度和强度的抽象品质的主观评价良好相关的数学描述。接下来是由Amadsun禾tlKing(IEEETransSysManCybernetics19(5):1264-1274,1989)给出的描述。NGTDM为如下形成的矩阵。作为整体的WXiV图像被量化为预订数量的级别g。对于具有表示为/(^力的量化强度的特定ROI中的每个像素,<formula>formulaseeoriginaldocumentpage21</formula>-也就是说,A为除像素自身之外的感兴趣像素周围的(2d+l)x(2^H)邻域的平均值。NGTDM矩阵TV具有一列和与图像中的强度级别一样多的行。然后,行/由下式给出那)=2]卜-单/)|其中,求和是在所有像素上进行,其中,^^,/)=纟。注意将计算限定在感兴趣区域(ROI)内的面积,不管其是结节自身还是结节外部区域。其中(m,")^(0,0)每个面元(bin)的概率p(/)定义为贡献7V(z')的计算的小部分中心像素。这里示出了两个特征;在Amadsun等人的IEEETransSysManCybernetics,19(5):1264-1274,1989中详细描述其他特征。这些特征为粗糙度=对比度-<formula>formulaseeoriginaldocumentpage22</formula>其中"=(7V-2力且G为图像中出现的g级别的实际数量。在此提供的方法和系统包括用于CADx的预处理CT图像、可以用作对CADx系统的输入的若干新特征以及用于特征选择和分类的高级机器学习技术。在此提供的方法和系统克服了在处理厚切片CT体积方面的困难,在识别肺结节的边界方面提供了对错误的鲁棒性,并且优化以改进分类系统的诊断准确度。在此提供的方法和系统使用预处理和特征以通过提供病灶(诸如良性肺结节和恶性肺结节)的2D、2.5D和3D表征来解决该问题。因此,利用这些特征的机器学习系统可以更准确地将良性结节与恶性结节区分开,并且可以实现比不利用这些特征的系统更高的特异性和敏感性。此外,所提议的系统能够将关于患者的基于图像的信息和临床信息结合到决策过程中。在此提供的CADx方法和系统可以与例如MRI和CT的若干模态一起使用。在此提供的方法和系统可以用于放射学工作站(例如但不限于PhilipsExtendedBrillianceWorkstation、PhilipsMx8000禾nPhilipsBrillianceCT扫描器)或并入PACS系统中(例如StentoriSite)。在此提供的CADx方法和系统可以用于诊断不同的疾病,包括但不限于结肠息肉、肝癌和乳腺癌。此外将显而易见的是,可以在不偏离所附权利要求及其等同物的精神和范围的情况下设计本发明的其他形式和进一步的形式以及除上述具体实施例和示例性实施例之外的实施例,因此本发明的范围意欲包括这些等同物,并且说明书和权利要求书意欲为示例性的且不应被解释为进一步限制。在此引用的所有参考的内容以引用的方式并入。权利要求1、一种在受检者中的疾病的诊断中提供决策支持的方法,所述方法包括提取所述受检者中的基于图像的感兴趣体积;分割所述图像,以从所述图像的背景描绘所述感兴趣体积内的至少一个病灶;在多个维数中提取基于图像的特征;将临床信息转换为兼容格式,并且将所述临床信息与所述基于图像的特征结合,以形成特征库;以及从由输出决策的分类器或分类器委员会所要使用的子集库中选择最优特征子集或最优特征子集组,其中,所述分类器或分类器委员会提供对所述病灶的诊断的预测。2、如权利要求1所述的方法,还包括在所述感兴趣体积的各切片之间进行插值,以创建各向同性的体素表示。3、如权利要求1所述的方法,其中,所述多个维数从包括2维、2.5维和3维的组中选择。4、如权利要求l所述的方法,其中,选择最优特征子集还包括采用遗传算法、统计差分滤波、相关滤波、递归特征消除、逐步线性回归以及随机特征选择中的至少一项。5、如权利要求4所述的方法,其中,选择最优特征子集包括对具有不同的随机选择的包含训练数据和测试数据的集合的多个迭代执行基于遗传算法的特征选择,以获得作为结果的多个特征子集。6、如权利要求l所述的方法,其中,将所述临床信息转换为多个临床特征类别。7、如权利要求l所述的方法,其中,所述分类器或分类器委员会从包括支持向量机、决策树、线性判别分析以及神经网络中的至少一项的组中选择。8、如权利要求1所述的方法,还包括所述分类器或分类器委员会确定所述至少一个病灶是恶性还是良性。9、如权利要求1所述的方法,还包括所述分类器或分类器委员会确定所述至少一个病灶为恶性的可能性。10、如权利要求8所述的方法,其中,所述分类器或分类器委员会作出的所述确定结果是由从包括下列的组中选择的至少一种计算确定的简单平均值、简单投票、加权平均值以及加权投票。11、一种计算机辅助诊断系统,所述系统包括预处理单元,用以提取基于图像的感兴趣区域;分割单元,用以描绘所述感兴趣区域中的至少一个病灶;特征提取单元,用以从所述感兴趣区域的所述图像提取多个维数中的基于图像的特征;临床信息处理单元,用以接收临床信息并将其转换为兼容格式;以及分类器或分类器委员会,其利用所述基于图像的特征和所述临床信息以输出决策。12、如权利要求11所述的计算机辅助诊断系统,还包括特征选择单元,用以在训练所述系统的过程中从特征库选择相关的基于图像的特征和临床特征。13、如权利要求12所述的计算机辅助诊断系统,其中,所述特征选择单元还包括从包括遗传算法、统计差分滤波、相关滤波、递归特征消除、逐步线性回归以及随机特征选择中的至少一项的组中选择的优化技术;以及从包括支持向量机、决策树、线性判别分析以及神经网络中的至少一项的组中选择的分类器或分类器委员会。14、如权利要求ll所述的计算机辅助诊断系统,其中,所述基于图像的感兴趣区域是通过执行至少一种形态学运算来构造的。15、如权利要求14所述的计算机辅助诊断系统,其中,所述至少一种形态学运算从腐蚀、膨胀和孔洞填充的组中选择。16、如权利要求ll所述的计算机辅助诊断系统,其中,所述基于图像的感兴趣区域是通过选择由所述分割产生的最大相邻对象来构造的。17、如权利要求ll所述的计算机辅助诊断系统,其中,所述基于图像的感兴趣区域还包括内部区域、外部区域和边界区域,其中,不需要的元素被排除在所述感兴趣区域之外。18、如权利要求ll所述的计算机辅助诊断系统,其中,所述多个维数从包括2维、2.5维和3维的组中选择。19、如权利要求ll所述的计算机辅助诊断系统,其中,所述临床信息还包括从由年龄、性别、吸烟史、癌症史、家族史、职业暴露、休闲暴露、既往肺部疾病、现患肺部疾病、先前的胸部手术、要被诊断的病灶周围的卫星病灶的数量、淋巴结大小、是否存在可疑结以及所述病灶在肺中的位置组成的组中选择的至少一个数据点。20、如权利要求ll所述的计算机辅助诊断系统,其中,所述分类器确定病灶是恶性还是良性。21、如权利要求ll所述的计算机辅助诊断系统,其中,所述分类器确定病灶为恶性的可能性。22、一种从多切片数据集提取特征的方法,所述方法包括-数学地表示对象的空间分布;数学地表示所述对象的形状;确定所述对象的轮廓和纹理;识别病灶的边界像素并估计导数;分析作为沿着所述轮廓的位置的函数的所述导数;自动识别所述对象内的暗区域或亮区域的存在;以及对所述对象的周围区域中的图像的纹理进行近似。23、如权利要求22所述的方法,还包括通过由用户手动选择或通过自动选择最大切片而从所述多切片数据集选择独立的切片以用于分析。24、如权利要求22所述的方法,其中,对包括下列的组计算所述特征所述多切片数据集的每个切片;以任意角度进行的最大强度投影;以任意角度进行的最小强度投影;以及贯穿所述图像的一个或多个切片以任意角度进行的数字重建射线照片。25、如权利要求24所述的方法,其中,对所述多切片数据集的每个切片计算的所述特征通过从包括下列的组中选择的方法进行结合计算加权平均值,其中权重与每个切片上的像素的数量成比例;找出横跨所述多切片数据集的多个切片的最大值;以及找出横跨所述多切片数据集的所述多个切片的最小值。26、如权利要求22所述的方法,其中,在多个维数的每个中计算所述特征。27、如权利要求22所述的方法,其中,通过包括下列的组中的至少一项描述所述对象的所述形状边界像素位置的傅立叶变换之后的系数分布;分割对象的对平移、旋转和縮放不变的数学矩;图像像素的灰度分布的数学矩;分形维数;以及链码。28、如权利要求22所述的方法,其中,通过包括下列的组中的至少一项描述所述对象的所述纹理分形维数;基于灰度共生矩阵的能量、熵、最大概率、惯量、逆差和相关;以及基于邻域灰色调差分矩阵的粗糙度、对比度、繁忙度、复杂度和强度。29、如权利要求22所述的方法,其中,通过包括下列的组中的至少一项描述所述周围区域图像强度沿着与局部轮廓正交的方向的导数;所述图像强度沿着与所述局部轮廓正交的所述方向的导数以及功率谱的矩;以及所述图像强度沿着与所述局部轮廓正交的所述方向的方差的估计。30、如权利要求22所述的方法,其中,通过高于或低于给定阈值的相邻像素簇的强度或尺寸描述所述对象内的暗区域和亮区域的存在。31、如权利要求22所述的方法,其中,所述多个维数是从包括2维、2.5维和3维的组中选择的至少一项。全文摘要在此提供用于受检者中的疾病的诊断中的决策支持并且用于从多切片数据集提取特征的方法。提供用于计算机辅助诊断的系统。该系统输入多个医学数据并产生基于该数据的诊断的输出。输入可以包括图像数据和临床数据的结合。通过特征选择和一种或多种分类器算法的使用来执行诊断。文档编号G06T7/00GK101517614SQ200780035051公开日2009年8月26日申请日期2007年9月18日优先权日2006年9月22日发明者A·博尔曲克,C·鲍威尔,L·A·阿尼霍特里,L·博罗茨基,L·赵,M·C·C·李,S·卡乌特申请人:皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1