使用组织参数估计根据MR数据的伪CT生成的制作方法

文档序号:15879911发布日期:2018-11-09 17:43阅读:329来源:国知局
使用组织参数估计根据MR数据的伪CT生成的制作方法

本申请涉及于2015年10月13日提交的并且题为“pseudo-ctgenerationfrommrdatausingtissueparameterestimation”的代理人案卷号12475.0050-00000,其全部内容通过引用并入本文。

本公开内容大体上涉及辐射疗法或放射治疗。更具体地,本公开内容涉及用于根据mr数据生成伪ct图像以用于在开发在放射治疗期间使用的辐射疗法治疗计划中使用的系统和方法。

背景技术

放射治疗被用于治疗哺乳动物(例如,人和动物)组织中的癌症和其他疾病。一种这样的放射治疗技术是伽马刀,通过伽马刀,患者受到大量低强度伽马射线的辐照,其中伽马射线以高强度和高精度会聚在目标(例如,肿瘤)处。在另一实施方式中,使用线性加速器提供放射治疗,由此肿瘤受到高能粒子(例如,电子、质子、离子等)的辐照。必须精确地控制辐射束的定位和剂量,以确保肿瘤接收处方的辐射,并且射束的定位应当使对周围健康组织——通常被称为危及器官(oar)——的损伤最小化。辐射被称为“处方的”,是因为医师为肿瘤和周围器官开了类似于药物处方的预定量的辐射。

常规地,对于每个患者,可以使用基于临床和剂量测定的目标和约束(例如,对肿瘤和关键器官的辐射的最大剂量、最小剂量和平均剂量)的优化技术来创建辐射疗法治疗计划(“治疗计划”)。治疗计划过程可以包括使用患者的三维图像来识别目标区域(例如,肿瘤)并且识别肿瘤附近的关键器官。创建治疗计划会是一个耗时的过程,其中,计划者在考虑到各项治疗目标或约束的各自重要性(例如,加权)的情况下尽力遵守所述各项治疗目标或约束(例如,剂量体积直方图(dvh)目标),以便产生临床上可接受的治疗计划。该任务可能是因各种危及器官(oar)而变得复杂的耗时的反复试错的过程,这是因为随着oar的数目的增加(例如,对于头颈部治疗最高达13个oar),这个过程的复杂性也增加。远离肿瘤的oar可以容易地免受辐射,而接近目标肿瘤或着与目标肿瘤重叠的oar可能难以幸免。

计算机断层扫描(ct)成像常规上用作用于辐射疗法的治疗计划的图像数据的主要来源。ct图像提供患者几何结构的精确表示,并且可以将ct值直接转换成电子密度(例如,亨氏单位)以用于辐射剂量计算。然而,使用ct导致患者暴露于额外的辐射剂量。除了ct图像之外,磁共振成像(mri)扫描由于其与ct图像相比的优越的软组织对比度而可以被用于辐射疗法。mri不含电离辐射,并且可以被用于捕获人体的机能信息,例如组织代谢和组织机能。

因此,mri可以被用于关于更精确的结构轮廓对ct进行补充。然而,mri强度值不与电子密度直接相关,并且不能直接用于剂量计算;因此,期望将mr图像转换成对应的导出图像——通常是ct图像(通常被称为“伪ct图像”)。类似于真实ct图像的伪ct图像具有数据点集,该数据点集指示可直接转换成用于辐射剂量计算的电子密度的ct值。因此,从mr图像导出的伪ct图像可以被用于促进辐射疗法治疗计划中的患者剂量计算。因此,期望使用mr图像数据精确地生成伪ct图像,以便使患者免受由ct成像引起的额外辐射曝露。所需的是,伪ct图像能够代替“真实的”ct图像。

典型地,为了创建伪ct图像,采用了图谱图像(atlasimage)。图谱图像是作为参考被用于促进如何转换新图像以生成导出图像的预先存在的图像。例如,在伪ct图像生成的背景下,可以使用图谱mr图像和图谱ct图像作为参考以用于根据新的mr图像来生成导出ct图像。可以预先生成作为新mr图像的受试体的同一患者的同一感兴趣区域的图谱图像,其中,这些图谱图像已经被分析以识别感兴趣的结构。例如,在许多治疗或诊断情况下,患者将需要在治疗或诊断过程的不同时间处经历成像。然而,情况不一定总是如此,例如,图谱图像不需要是同一个人的图像。

图谱mr图像和图谱ct图像优选地经由配准技术彼此对准(即,使得图谱mr图像和图谱ct图像被彼此“配准”,或者处于“配准”状态)。利用这样的配准,图谱mr图像中的针对受试体的特定位置的给定点可以映射到图谱ct图像中的针对相同特定位置的给定点(并且反之亦然)。但是,该配准中可能存在一定量的错误。因此,图谱mr与图谱ct之间的配准可能并不完美。

为了代替真实ct图像,伪ct图像应该尽可能接近患者的真实ct图像,以用于在辐射疗法治疗计划中的剂量计算的目的、或者用于生成数字重建的射线照片(drr)以用于图像引导。然而,ct图像强度值(ct值)与mr强度值之间不存在简单的数学关系。因为mr强度值未被标准化并且可以取决于不同的mr扫描仪设置或不同的mr成像序列参数而显著变化,所以出现困难。因此,现有技术——例如,基于mr图像的组织分割来分配ct值或者基于点比较和加权组合来分配ct值——仅提供非常粗略的分配,导致缺乏真实ct图像的解剖细节的现有的伪ct图像。

因此,需要生成具有提高的质量的能够代替真实ct图像的伪ct图像,以用于治疗计划中的剂量计算、生成数字重建的射线照片(drr)以用于图像引导等的目的。



技术实现要素:

一方面,本公开内容涉及一种用于生成伪ct预测模型的系统。该系统可以包括被配置成存储包括多个训练受试体的mr数据和ct数据的训练数据的数据库。每个训练受试体可以具有至少一个mr图像和至少一个ct图像。该系统还可以包括通信耦接至数据库的用于访问存储在数据库中的信息的处理器。该系统还可以包括通信耦接至处理器的存储器。存储器可以存储指令,所述指令在由处理器执行时将处理器配置成执行各种操作。操作可以包括访问数据库以检索包括针对所述多个训练受试体中的每个受试体的至少一个mr图像和至少一个ct图像的训练数据。针对每个训练受试体,操作可以包括:从所述至少一个mr图像的每个图像点提取多个特征;针对每个图像点基于所提取的特征来创建特征向量;并且从所述至少一个ct图像的每个图像点提取ct值。操作还可以包括:基于所述多个训练受试体的特征向量和ct值来生成伪ct预测模型。

另一方面,本公开内容涉及一种用于生成伪ct图像的系统。该系统可以包括处理器和通信耦接至处理器的存储器。存储器可以存储指令,所述指令在由处理器执行时将处理器配置成执行各种操作。操作可以包括:接收患者的mr图像并且从mr图像的每个图像点提取多个特征。操作还可以包括:针对每个图像点基于所提取的特征来创建特征向量。操作还可以包括:针对每个图像点使用预测模型基于针对该图像点创建的特征向量来确定ct值。此外,操作可以包括:基于针对所有图像点确定的ct值来生成伪ct图像。

又一方面,本公开内容涉及一种用于生成患者的伪ct预测图像的系统。该系统可以包括处理器和通信耦接至处理器的存储器。存储器可以存储指令,所述指令在由处理器执行时将处理器配置成执行各种操作。操作可以包括:接收患者的mr图像并且从mr图像提取多个特征。操作还可以包括:使用预测模型基于所提取的特征来生成中间图像。操作还可以包括:从中间图像提取一个或更多个特征。此外,操作可以包括:基于从mr图像提取的多个特征和从中间图像提取的一个或更多个特征来生成患者的伪ct图像。

又一方面,本公开内容涉及一种用于生成伪ct预测模型的系统。该系统可以包括被配置成存储包括多个训练受试体的多通道mr数据和ct数据的训练数据的数据库。每个训练受试体可以具有多个mr图像和至少一个ct图像。该系统还可以包括通信耦接至数据库的用于访问存储在数据库中的信息的处理器。该系统还可以包括通信耦接至处理器的存储器。存储器可以存储指令,所述指令在由处理器执行时将处理器配置成执行各种操作。操作可以包括:访问数据库以检索包括针对多个训练受试体中的每个受试体的多个mr图像和至少一个ct图像的训练数据。针对每个训练受试体,操作可以包括:基于多个mr图像来确定至少一个组织参数图并且基于所述至少一个ct图像来获得ct值。操作还可以包括:基于所述多个训练受试体的组织参数图和ct值来生成伪ct预测模型。

又一方面,本公开内容涉及一种用于生成伪ct图像的系统。该系统可以包括处理器和通信耦接至处理器的存储器。存储器可以存储指令,所述指令在由处理器执行时将处理器配置成执行各种操作。操作可以包括:接收患者的多个多通道mr图像并且将所述多个多通道mr图像转换成至少一个组织参数图。操作还可以包括:通过将预测模型应用于所述至少一个组织参数图来生成ct值。操作还可以包括:基于通过预测模型生成的ct值来生成伪ct图像。

又一方面,本公开内容涉及一种用于生成伪ct预测模型的计算机实现的方法。该方法可以包括:检索包括针对多个训练受试体中的每个受试体的多个多通道mr图像和至少一个ct图像的训练数据。针对每个训练受试体,该方法可以包括:基于所述多个多通道mr图像来确定至少一个组织参数图并且基于所述至少一个ct图像来获得ct值。该方法还可以包括:基于所述多个训练受试体的组织参数图和ct值来生成伪ct预测模型。

要理解的是,前面的一般性描述和以下的详细描述两者均仅是示例性和说明性的,并且不限制如所要求保护的所公开的实施方式。在审阅如以下描述、附图和所附权利要求书中描述的教示后,本公开内容的这些和其他特征和优点对于本领域的普通技术人员将是明显的。

附图说明

包括在本说明书中并且构成本说明书的一部分的附图示出了所公开的实施方式,并且与描述和权利要求书一起用于说明所公开的实施方式。这样的实施方式是说明性的并且不意在是本设备、系统或方法的穷举性或排他性的实施方式。在不一定按比例绘制的附图中,不同视图中类似的标记可以描述相似的部件。具有字母后缀或不同字母后缀的类似标记可以表示相似部件的不同实例。

图1是用于构建伪ct预测模型的示例性过程的图。

图2是用于从mr图像的每个体素提取特征的示例性过程的图。

图3是用于使用图1的预测模块来生成患者的伪ct图像的示例性过程的图。

图4a示出了示例性放射治疗系统。

图4b示出了示例性放射治疗装置——伽玛刀。

图4c示出了作为线性加速器的示例性放射治疗装置。

图5示出了用于构建伪ct预测模型并且生成伪ct图像的示例性系统。

图6是用于训练和构建伪ct预测模型的示例性过程的流程图。

图7是用于使用伪ct预测模型来生成伪ct图像的示例性过程的流程图。

图8是用于训练和构建多级伪ct预测模型的示例性过程的图。

图9是用于使用多级伪ct预测模型来生成伪ct图像的示例性过程的图。

图10是用于使用根据多通道mr扫描估计到的组织参数来训练伪ct预测模型的示例性过程的图。

图11是使用多通道mr数据来构建伪ct预测模型的示例性方法的流程图。

图12是用于使用多通道mr图像来生成患者的伪ct图像的示例方法的流程图。

具体实施方式

现在将详细参考其示例在附图中示出的所公开的实施方式。只要方便,贯穿附图相同的附图标记将用于指代相同或类似的部分。

在一个实施方式中,为了根据mr图像来创建伪ct图像(还被称为合成ct图像或导出ct图像),提供了包括训练模块和预测模块的基于学习的方法。训练模块构造预测模型(还被称为回归模型),预测模型可以被用于基于从选定位置的一个或更多个mr图像提取的特征来预测任何给定体素的ct值。在训练期间,从多个现有患者收集mr扫描和ct扫描以形成训练数据。训练数据包括来自现有患者的成对的预对准的ct图像和mr图像。对于图像中的每一对,相应的mr值和ct值是已知的并且针对每个像素或体素(还被称为包括2d情景和3d情景两者的图像点)进行配准。

可以使用训练数据来训练预测模型。在训练阶段,回归方法(例如,统计学习、回归分析或机器学习技术)可以用在收集的训练数据上以训练模型。在对预测模型进行训练之后,可以由预测模块使用该模型来预测患者图像的每个图像点的ct值。因此,训练后的模型可以用于根据任何未来扫描的mr数据并且针对相同或不同的患者来创建伪ct图像。

图1示出了与所公开的实施方式一致的用于构建伪ct预测模型150的示例性过程的流程图。如所示出的,一个实施方式是包括训练模块和预测模块的基于学习的方法。在实施方式中,训练模块创建回归模型(例如,伪ct模型150),该回归模型可以由预测模块使用以基于一个或更多个新的mr扫描来预测伪ct值。

在一个实施方式中,可以从现有患者或受试体(统称为“训练受试体”)收集训练数据110。训练受试体可以具有先前获取的并且可以被用于构建伪ct预测模型150的mr扫描和对应的ct扫描两者。训练数据110可以包括对于具有至少一个mr扫描和至少一个ct扫描的多个训练受试体的数据(例如,训练受试体数据110a-110n)。与由较小数据集构成的模型相比,用于提供训练数据的训练受试体的数目越多(例如,数据集越大),通常将使得能够生成更好的伪ct预测模型。训练受试体数据110a-110n包括成对的预对准的mr图像和ct图像。mr图像和ct图像可以分开获取;因此如果图像彼此重叠,则它们通常不匹配。因此,如本领域中已知的,使用图像配准对mr图像和ct图像进行预对准。根据一些实施方式,与训练受试体相关联的mr扫描与伪ct图像被期望的新患者的mr扫描可以由相同的mr扫描仪来生成。在其他实施方式中,与训练受试体相关联的mr扫描可以由不同的mr扫描仪来生成。另外,与单个训练受试体相关联的多个mr扫描可以包括具有不同对比度性质(例如,t1加权、t2加权等)的mr扫描,以提供更精确的伪ct生成结果。

图像特征提取模块111可以用于从与训练数据110相关联的mr图像提取图像特征。图像特征可以指mr体素的数值性质(例如,强度值、特征的坐标位置等)或分类性质(例如,组织类型、结构标签等)。例如,“强度特征”可以指mr体素的强度值。然而,任何单个mr特征可能不足以充分表示用于生成伪ct图像的目的的mr体素。例如,单独采用的mr体素的强度值提供了对于ct估计的不明确表示。单个强度值是不明确的,因为除了别的之外,具有相同强度水平的两个mr体素可以属于具有不同ct值的不同组织(例如,骨头和空气)。如本文中所使用的,术语“组织”指的是分类并且不仅仅表示特定类型的组织;例如,空气不是组织。因此,提取mr扫描的每个mr体素的多种特征类型以便提供对mr体素的更具区别性的描述。

利用多个mr图像或多通道mr图像,可以提取一组丰富的基于图像的特征,这提供了更多的信息并且可以导致更精确的伪ct预测。图像特征提取模块111可以被用于分别从每个图像或每个通道提取特征(例如,mr特征向量120)。

所得到的mr特征向量120可以包括多个收集到的图像特征向量集,每个图像特征向量集与训练受试体的mr扫描相关联(例如,图像向量集120a-120n)。每个图像特征向量集120a-120n可以包括多个特征向量。例如,给定特征向量集(例如,120a)的每列可以表示包括作为向量元素的多个特征的特征向量。特征向量的多个特征表示与例如训练受试体的mr扫描/图像的图像点(例如,体素)相关联的不同类型的图像特征。特征向量中的特征元素的数目(例如,列中的元素的数目)还被称为特征向量的维度。在一些实施方式中,特征向量还可以按行或其他合适的形式排列。下面参照图2更详细地论述了根据所公开的实施方式的特征提取。

图2示出了与所公开的实施方式一致的特征提取过程。可以针对患者(例如,mr受试体a210)的mr扫描的每个mr体素来提取多个图像特征。如图2所示,所提取的图像特征可以包括局部图案特征212、界标(landmark)特征214、背景(context)特征216以及各种其他类型的特征218。这些特征中的每个可以由一个或更多个特征元素来表示,一个或更多个特征元素在图2中被示出为共同形成特征向量列的小块。特征可以与图像像素(在2d中)、图像体素(在3d中)或图像点集合(例如,在2d或3d中的图像块)相关联。例如,图2示出了与体素i、体素i+1、…、体素m相关联的特征向量(例如,列)。多个特征向量——例如,与mr图像的多个体素(例如,体素i至m)相关联的特征向量的集合——可以形成对应于训练受试体a的特征向量集120a。

潜在的图像特征的非限制性列表包括:

·强度特征:多个尺度上的mr图像强度值——原始强度值或在一些预处理之后的强度值,例如mr强度偏差校正和/或mr强度标准化/归一化;

·基于界标的特征:针对给定体素相对于一个或更多个界标点(例如,大脑的前连合-后连合(ac-pc)点、每个眼球的中心等)计算的相对位置、距离或其他几何特征;

·背景特征:在给定点的某些邻近位置处计算的任何其他图像特征;

·位置特征:每个体素的归一化坐标。可以例如通过使用线性或非线性图像配准将每个图像与公共参考系进行对准来完成归一化;

·块特征:在一些实施方式中,块(patch)可以指图像的在特征被计算的图像体素的周围的子区域或子集。例如,块在大小上可以包括5×5×5个体素,并且125个体素位置处的图像强度值可以与块中心的点的125个特征元素相关联;

·可以根据一个或更多个块导出高级特征:这些类型的特征可以包括本领域已知的各种特征描述符,例如sift(尺度不变特征变换)、surf(加速鲁棒特征)、gloh(梯度位置和方向直方图)、lbp(局部二进制图案)或hog(方向梯度直方图)等。可以针对包含考虑中的体素的每个2d图像切片来计算这样的特征,并且此外,在实施方式中这样的特征可以被扩展到3d图像;

·纹理特征:例如,局部图像灰度共生矩阵的能量、熵、对比度、同质性(homogeneity)和相关性,以及通过利用gabor滤波器对图像进行滤波而计算的那些特征等;

·联合特征:例如,当多个mr图像(例如,t1加权、t2加权等)与给定训练受试体相关联时。在这种情况下,可以从每个mr扫描中独立地提取诸如强度、块、纹理等的特征以供稍后组合。另外,可以在每个体素位置处计算表征多个mr扫描之间的相关性的特征,例如多个mr通道的局部联合直方图和/或局部互相关或协方差;

·利用至少一个线性或非线性滤波器(例如,局部相位、梯度、曲率、边缘检测器或角检测器等)根据图像的卷积导出的特征;

·通过图像变换(例如,傅里叶变换、希尔伯特变换、拉东变换、距离变换、离散余弦变换、小波变换等)导出的特征;

·区域协方差特征:在局部子区域内的以上点状特征中的任何特征的协方差;以及

·基于分类的特征,将在下面更全面地论述。

如图2所示,与mr图像体素相关联的特征的集合可以在单个向量(例如,与体素i、体素i+1、…、体素m相关联的向量)中表示。

返回到图1,当提取图像特征时,mr特征向量120可以具有多个维度(例如,特征向量中的每个特征元素可以被认为是一个维度,如图2所示)。然而,当从mr图像中提取的特征的数目增加时,创建预测模型的任务可能变得更加难以完成。这是因为每个患者图像通常包含数百万个体素,并且每个体素可以与大量特征相关联。因此,如果使用从来自所有多个现有患者的所有图像的所有体素中提取的特征来构建预测模型,则用于处理这样巨量数据的计算成本可能非常昂贵。因此,维度的实际数目取决于相对于计算成本的可用的计算机的处理能力。此外,处理所提取的特征所产生的预测模型的性能可能不与特征维度的数目成比例。在一些情况下,随着特征维度的数目增加,预测模型的性能可能会下降,因为一个特征的效果可能会被另一个特征取消或削弱——如果两个特征都包括在处理中的话。在使用预测模型基于新的mr数据确定伪ct图像时,大量的特征还可能导致不可接受的计算成本。因此,在实施方式中,降维模块132可以用于生成降维特征向量140,而不会显著损失通过mr特征提供的区别性信息。降维模块132可以被用于在减少维度的原始数目时从原始特征向量捕获大部分相关信息。例如,mr特征向量120的一些维度可能包括与生成伪ct图像无关的可以被去除的噪声或其他信息。其他维度可以包括冗余信息,这些冗余信息可以被组合或精简,以用于通过特征提供的区别性信息的更紧凑的表示。例如,如果原始数据符合高斯分布,则可以通过使用原始数据的均值和标准偏差表示原始数据来降低原始数据的整体维度。这样的降维方法导致原始数据被转换。在一些实施方式中,维度降低的水平的范围可以从使用原始特征向量(即,没有维度降低)到任何预定的维度水平(例如,减少的特征向量集)。因此,在实施方式中,降维模块132可以是可选的,并且原始特征向量可以被用于产生伪ct模型150。

如果利用降维模块132,则由模型132使用的降维技术可以包括至少两种类型的技术:(1)无监督降维和(2)监督降维。通常,如以下所描述的,监督降维优于无监督降维。

无监督降维可以去除无意义的噪声和数据冗余,并且仅需要mr特征向量120作为输入。常见的无监督降维技术包括例如主成分分析(pca)及其非线性版本、核主成分分析(kpca)。

监督降维可以利用感兴趣的其他数据来进一步滤除与生成伪ct图像无关的维度。例如,ct值130可以用于降维。ct值130(例如,原始ct值或ct数值)可以从训练数据110的ct扫描数据获得。监督降维可以将mr特征向量120和ct值130两者作为输入。可能的监督降维技术包括例如:典型成分分析(cca)、度量学习(ml)方法、监督主成分分析(spca)、局部敏感哈希(lsh)、局部敏感判别分析(lsda)等。对于需要感兴趣的数据与离散的类别标签相关联的降维技术,可以将图像分割应用于训练数据110中的ct扫描或mr扫描,从而导致可以用作类别标签的分割类别。

降维模块132可以使用ct值130来确定训练数据110中的哪些信号与潜在的ct值相关。使用原始ct值,可以在保持相关信号的同时抑制无关信号。一般而言,每个训练受试体的至少一个ct图像应该是可用的。在一些实施方式中,多个ct图像可以是可用的。可以对较大数目的ct扫描进行平均以减少图像噪声,从而提高降维模块132的有效性。降维模块132的输出是降维特征向量140。

一旦训练数据被收集和处理(例如,经历图像特征提取、降维技术等),则可以使用统计学习技术或机器学习技术来构建伪ct预测模型150。在一个实施方式中,可以使用回归分析来构建伪ct预测模型150。回归分析是用于估计变量之间的关系的统计过程。存在用于执行回归分析的许多已知的方法,例如:线性回归或普通最小二乘回归等是“参数化”的,因为回归函数是根据有限数目的未知模型参数定义的,这些模型参数可以根据训练数据来估计。对于伪ct图像生成,可以将回归模型(例如,式1)定义为例如:

h≈f(x,β),(式1)

其中,“h”表示ct值,“x”表示输入变量的向量(例如,mr特征向量120或降维特征向量140中的任一个),并且“β”表示要针对回归模型确定或训练的未知参数的向量。在实施方式中,ct值可以是ct扫描的亨氏值。

包括mr扫描和ct扫描的训练数据110提供具有对应的x值(例如,从训练受试体的mr扫描提取的特征向量)的一组已知的h值(例如,与同一训练受试体的ct扫描相关联的ct值)。使用这些数据,可以使用数据拟合技术例如最小二乘法、最大似然法等来计算模型参数β。一旦估计了β,则模型然后可以针对一组新的x值(例如,从新的mr扫描提取的特征向量)来计算h(例如,伪ct值)。

在另一实施方式中,机器学习和监督学习可以被用于构建伪ct预测模型150。监督学习是机器学习的分支,机器学习在给定训练数据集的情况下推断预测模型。训练数据的每个样本是由输入数据(例如,测量结果或特征的向量)和期望的输出值(还被称为监督信号)组成的对。监督学习算法分析训练数据并且产生预测函数,在输出变量是数值的或连续的时预测函数是回归函数。与所公开的实施方式一致,可以应用许多不同的算法,包括但不限于:knn(k最近邻)回归、支持向量机、神经网络、决策树、随机森林和梯度提升机。

图3示出了与所公开的实施方式一致的可以使用伪ct模型150的预测模块的示例性过程的流程图。一旦伪ct模型150被创建并且被训练,则预测模块301可以在应用阶段使用模型150以根据同一患者或新患者的新mr扫描来生成伪ct图像。如图3所示,除了在应用阶段使用先前生成和训练的伪ct预测模型150之外,生成伪ct图像350的过程类似于上面针对图1所描述的过程。在该过程中,新的mr扫描310被输入到预测模块301中。在实施方式中,预测模块301可以包括图像特征提取模块311和伪ct预测模型150。在该实施方式中,mr扫描301没有对应的ct扫描。可以从mr扫描301提取特征来以与上面关于mr特征向量120的生成所论述的方式类似的方式来生成患者mr特征向量320。可以包括降维模块321以降低患者mr特征向量320的维度。可替选地,如虚线331所指示的,伪ct预测模型150可以使用患者mr特征向量320,而无需任何维度降低。

以这种方式,由于最初没有提供与新的mr扫描相对应的ct扫描,因此预测模块301使用在训练阶段期间建立的伪ct预测模型150来预测在患者mr图像310的每个位置处的伪ct值。因为伪ct预测模型150可以例如在每个图像位置处“逐点”操作,所以伪ct值表示基于mr扫描310中的特定位置处的特定体素的特征向量导出的值。预测模型301因此可以生成伪ct值340。伪ct值340表示伪ct图像350的多个强度值。为了生成伪ct图像350,通常将伪ct值340放置于体素网格(grid)上它们的适当位置中。在实施方式中,由于图像是体素的网格,因此预测模型301可以预测体素网格的一些值(例如,伪ct值340)(例如,不是每个图像体素被预测);并且然后可以使用插值来生成伪ct图像350以描绘患者的解剖细节的精确视觉表示。

可以使用所有可用患者的训练数据110来对伪ct预测模型150进行一次训练,并且然后伪ct预测模型150可以被用于所有未来的新患者。可替选地,相同的伪ct预测模型150可能不能用于每个患者。可以针对特定患者来定制伪ct预测模型150。例如,可以选择训练数据以包括与新患者最相似或相关的数据,并且可以针对新患者来构建模型。

图4a示出了根据本公开内容的一些实施方式的示例性放射治疗系统400。放射治疗系统400可以包括训练模块412、预测模块414、训练数据库422、测试数据库424、放射治疗装置430以及图像获取装置440。放射治疗系统400还可以连接至治疗计划系统(tps)442和可以提供患者信息的肿瘤学信息系统(ois)444。此外,放射治疗系统400可以包括显示装置和用户接口(未示出)。

图4b示出了根据本公开内容的一些实施方式的一种类型的放射治疗装置430(例如,由瑞典斯德哥尔摩的elekta,ab制造的leksell伽玛刀)的示例。如图4b所示,在放射治疗治疗期间,患者452可以佩戴坐标框架454以保持患者的经历手术或放射治疗的身体部位(例如,头部)稳定。坐标框架454和患者定位系统456可以建立可以在对患者进行成像时或者在辐射手术期间使用的空间坐标系。放射治疗装置430可以包括保护壳体464以封闭多个辐射源462。辐射源462可以生成通过射束通道466的多个辐射束(例如,小束)。多个辐射束可以被配置成从不同方向聚焦在等中心点(isocenter)458上。虽然每个独立辐射束可以具有相对较低的强度,但是当来自不同辐射束的多个剂量在等中心点458处积聚时,等中心点458可以接收相对高水平的辐射。在某些实施方式中,等中心点458可以与进行手术或治疗的目标如肿瘤相对应。在实施方式中,放射治疗装置430(例如,由瑞典斯德哥尔摩的elekta,ab制造的leksell伽玛刀)可以利用具有指定堆积(bulk)密度的mr图像或与mr图像融合的ct图像,并且可以使用与所公开的实施方式一致地生成的伪ct图像。

图4c示出了根据本公开内容的一些实施方式的放射治疗装置430(例如,线性加速器470)的另一示例。使用线性加速器470,可以将患者472定位在患者台473上以接收通过治疗计划确定的辐射剂量。线性加速器470可以包括生成辐射束476的辐射头475。整个辐射头475可以能够围绕水平轴477旋转。此外,在患者台473的下方,可以设置平板闪烁体检测器474,该平板闪烁体检测器474可以围绕等中心点471与辐射头475同步旋转。轴477与由辐射头475产生的射束476的中心的交点通常被称为等中心点。患者台473可以是机动化的,使得患者472可以被定位成肿瘤部位在等中心点471处或在其附近。辐射头475可以围绕机架(gantry)478旋转,以根据治疗计划向患者472提供多个变化剂量的辐射。在替选实施方式中,线性加速器470可以是mr线性加速器(“mr-linac”)。在实施方式中,线性加速器10和mr-linac两者均可以利用mr图像、ct图像,并且可以使用与所公开的实施方式一致地生成的伪ct图像。

图5是与所公开的实施方式一致的用于构建伪ct预测模型并且生成伪ct图像的示例性系统500。根据一些实施方式,系统500可以是能够与所公开的实施方式一致地识别、分析、保持、生成和/或提供大量数据的一个或更多个高性能计算装置。系统500可以是独立的,或者它可以是子系统的一部分,子系统又可以是更大的系统的一部分。例如,系统500可以表示被远程定位并且通过网络例如因特网或者专用网络例如lan或wan进行通信的分布式高性能服务器。在一些实施方式中,系统500可以包括与一个或更多个远程定位的高性能计算装置通信的嵌入式系统、mr扫描仪和/或触摸屏显示装置。

在一个实施方式中,系统500可以包括一个或更多个处理器514、一个或更多个存储器510以及一个或更多个通信接口515。处理器514可以是处理装置,包括一个或更多个通用处理装置,例如微处理器、中央处理单元(cpu)、图形处理单元(gpu)等。更特别地,处理器514可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器、实现其他指令集的处理器或者实现指令集的组合的处理器。处理器514还可以是一个或更多个专用处理装置,例如专用集成电路(asic)、现场可编程门阵列(fpga)、数字信号处理器(dsp)、片上系统(soc)等。如本领域技术人员将理解的,在一些实施方式中,处理器514可以是专用处理器,而不是通用处理器。处理器514可以包括一个或更多个已知处理装置,例如来自由inteltm制造的pentiumtm系列或xeontm系列的微处理器、由amdtm制造的turiontm系列的微处理器或者由sunmicrosystems制造的各种处理器中的任何处理器。处理器514还可以包括由nvidiatm制造的图形处理单元。所公开的实施方式不限于以其他方式被配置成满足与所公开的实施方式一致地识别、分析、保持、生成和/或提供大量成像数据或任何其他类型的数据的计算需求的任何类型的处理器。

存储器510可以包括被配置成存储由处理器514使用以执行与所公开的实施方式有关的功能的计算机可执行指令的一个或更多个存储装置。例如,存储器510可以存储用于治疗计划软件511、操作系统软件512和训练/预测软件513的计算机可执行软件指令。处理器514可以通信耦接至存储器/存储装置510,并且处理器514可以被配置成执行存储在其上的计算机可执行指令以执行与所公开的实施方式一致的一个或更多个操作。例如,处理器514可以执行训练/预测软件513以实现训练模块412和预测模块414的功能。此外,处理器装置514可以执行可以与训练/预测软件513接口的治疗计划软件511(例如,例如由elekta制造的软件)。

所公开的实施方式不限于被配置成执行专门任务的单独程序或计算机。例如,存储器510可以包括执行系统500的功能的单个程序或者多个程序(例如,治疗计划软件511和/或训练/预测软件513)。另外,处理器514可以执行远离系统500定位的一个或更多个程序,例如存储在数据库520中的程序,这样的远程程序可以包括肿瘤学信息系统软件或治疗计划软件。存储器510还可以以系统可以用来执行与所公开的实施方式一致的操作的任何格式来存储图像数据或任何其他类型的数据/信息。

通信接口515可以是被配置成允许由系统500接收和/或传送数据的一个或更多个装置。通信接口515可以包括允许系统500与其他机器和装置——例如,系统500的远程定位部件、数据库520或医院数据库530——通信的一个或更多个数字和/或模拟通信装置。例如,处理器514可以通过通信接口515通信地连接至数据库520或医院数据库530。例如,通信接口515可以是计算机网络例如因特网或者专用网络例如lan或wan。可替选地,通信接口515可以是允许处理器514向数据库520或530发送数据或者从数据库520或530接收数据的卫星通信链路或者任何形式的数字或模拟通信链路。

数据库520和医院数据库530可以包括存储信息并且通过系统500来访问和管理的一个或更多个存储器装置。作为示例,数据库520、医院数据库530或两者均可以包括关系数据库,例如oracletm数据库、sybasetm数据库或其他关系数据库,并且可以包括非关系数据库,例如hadoop序列文件、hbase、cassandra或其他非关系数据库。数据库或其他文件可以包括例如来自与训练受试体相关联的mr扫描或ct扫描的原始数据、mr特征向量120、ct值130、降维特征向量140、伪ct预测模型150、伪ct值340、伪ct图像350、dicom数据等。然而,所公开的实施方式的系统和方法不限于单独的数据库。在一个方面,系统500可以包括数据库520或医院数据库530。可替选地,数据库520和/或医院数据库530可以远离系统500定位。数据库520和医院数据库530可以包括计算部件(例如,数据库管理系统、数据库服务器等),所述计算部件被配置成接收和处理对存储在数据库520或医院数据库530的存储器装置中的数据的请求并且提供来自数据库520或医院数据库530的数据。

系统500可以通过网络(未示出)与系统500的其他装置和部件进行通信。网络可以是任何类型的网络(包括基础设施),所述任何类型的网络提供通信、交换信息或者促进信息交换,并且使得能够通过网络(未示出)在系统500的其他装置和/或部件之间发送信息和接收信息。在其他实施方式中,系统500的一个或更多个部件可以通过专用通信链路例如系统500与数据库520和医院数据库530之间的链路(例如,硬连线链路、无线链路或卫星链路或其他通信链路)直接通信。

为了方便描述,已经在本文中定义了系统500的功能构建块的配置和边界。可以定义替代边界,只要其指定的功能和关系被适当地执行即可。基于本文中包含的教导,替选方案(包括在本文中描述的方案的等同物、扩展、变化、偏离等)对于相关领域的技术人员将是明显的。这样的替选方案落入所公开的实施方式的范围和精神内。

图6是与所公开的实施方式一致的用于训练和构建伪ct预测模型的示例性过程600的流程图。过程600包括多个步骤,其中一些步骤可以是可选的。在步骤610处,系统500可以从例如数据库520和/或医院数据库530访问与多个训练受试体相关联的训练数据110。训练数据110可以包括针对每个训练受试体的至少一个mr扫描和至少一个ct扫描(例如,如图1所示,训练受试体数据110a至110n)。在一些实施方式中,训练数据110可以包括针对同一患者的至少一个mr扫描和多个ct扫描。

根据一些实施方式,系统500可以确定训练数据110中的一些或全部在用于训练和构建伪ct预测模型150之前是否需要进行预处理。在步骤620处,处理器514确定训练数据中的针对一个或更多个训练受试体的mr扫描和对应的ct扫描是否对准(例如,对于每个mr体素,来自对应的ct体素的ct值是已知的)。如果mr图像和ct图像未对准,则过程600沿分支621(例如,“否”)到步骤624处以将该扫描对准。系统600可以根据需要根据本领域技术人员已知的方法将mr扫描和对应的ct扫描对准。可替选地,如果mr图像和ct图像对准,则过程600沿分支622(例如,“是”)继续至步骤630。

可选地,在步骤630处,处理器514验证训练数据110是否包括针对同一训练受试体的多个ct扫描。如果存在多个ct扫描,则处理器514确定多个ct扫描之间的对应ct体素的平均ct值,以降低同一患者的图像噪声。否则,过程600直接从步骤620进行至步骤640。

在步骤640处,作为预处理的一部分,处理器514基于例如在治疗计划软件511或训练/预测软件513中反映的系统设置来确定是否要减少或消除mr扫描中的图像伪影(artifact)。如果期望减少图像伪影,则过程600沿分支642(“是”)到步骤644。在步骤644处,处理器514可以应用作为预处理的一部分的图像伪影减少技术。通过对mr扫描进行预处理,处理器514可以去除或减少图像伪影,例如强度不均匀性(还被称为mr图像偏移场)和图像噪声。另外,预处理可以针对不同的mr扫描仪类型(例如,由ge、西门子等制造的;或者各种磁场强度例如0.5特斯拉、1.5特斯拉等)对mr图像强度值进行归一化/标准化。预处理技术还可以用于去除或减少新患者mr扫描310(如图3所示)的图像伪影。如果不进行图像伪影减少,则过程600继续至步骤650以提取特征。在一些实施方式中,可以省略预处理中的(例如,如由图6中的虚线所包围的)一个或更多个步骤。

在步骤650处,可以从训练数据110中提取特征。在一些实施方式中,系统500可以从训练数据110中的每个mr扫描的每个体素中提取特征。例如,可以使用mr图像本身来提取特征,并且可以使用mr图像的每个体素或从mr图像中选择的体素来提取特征。可替选地,处理器514可以将mr图像分割成不同的组织类型,并且基于组织类型来分割每个mr扫描的图像体素。这在某些情况下可能是有利的,因为例如除了其他提取的特征以外,组织类型可以被用作附加特征。

在步骤660处,系统500可以基于针对mr扫描的每个体素所提取的图像特征来创建mr特征向量。因此,处理器514可以产生包含针对mr扫描的每个体素的多个特征的向量。处理器514可以针对mr扫描的多个体素来产生多个mr特征向量120。

在步骤670处,系统500可以从训练数据中的每个ct扫描的每个体素中提取ct值。

在步骤680处,系统500可以确定是否降低与mr特征向量120相关联的维度的数目。

例如,系统500的处理器514可以确定与mr特征向量120相关联的维度的数目将导致高的计算成本或者在由伪ct预测模型150处理时可能导致性能问题。在另一示例中,系统500可以确定mr特征向量120包括超过被认为影响伪ct预测模型150的准确度的阈值的噪声或重复数据。在另一实施方式中,系统500可以基于影响性能和/或输出质量的因素来确定是否进行降维。因此,如果处理器514确定需要降维,则过程600沿分支682(例如,“是”)到步骤686,在步骤686中,处理器514可以降低与mr特征向量120相关联的维度。可替选地,在一些实施方式中,系统500可以接收(例如,来自用户的)输入以不对mr特征向量120执行任何降维。

如果不需要降维,则过程600可以直接沿分支684进行至步骤690。在步骤690处,系统500可以利用统计学习技术或机器学习技术基于mr特征向量(例如120)和所提取的ct值来生成伪ct预测模型150。在一些实施方式中,可以利用降维特征向量140。

根据一些实施方式,训练数据110的子集可以被用作训练和构建伪ct预测模型150的基础。因此,系统500可以确定(例如,基于用户输入和/或治疗计划软件511和/或训练/预测软件513中所反映的系统设置)训练数据110的子集以训练和构建伪ct预测模型150。在另一实施方式中,训练数据110的子集可以基于特定图像区域来分类。例如,训练数据110的子集可以:1)关于特定解剖区域,2)关于各种组织分类,或3)关于训练受试体特征。

例如,对于给定患者mr扫描,一个或更多个特征可以为潜在的解剖结构提供优异的说明;并且因此可以从训练数据110中仅提取优异的特征的子集以用于训练伪ct预测模型150。使用优异的特征,可以提高伪ct预测模型150针对给定患者mr扫描估计对应的伪ct值340的预测能力。特征的子集可以用于生成和训练一个或更多个伪ct模型。

在实施方式中,当针对特定解剖区域构建伪ct预测模型时,训练数据110的子集(例如,仅与感兴趣的身体区域相关联的训练数据110)可以用于训练和构建伪ct预测模型150。代替一个伪ct预测模型,处理器514可以针对身体的特定解剖区域(例如,头部、上身,下身等)生成多个伪ct预测模型。因此,处理器514可以针对感兴趣的预定解剖位置利用mr特征向量120(或降维特征向量140)和ct值130来生成对于mr扫描中描绘的感兴趣的特定解剖位置的伪ct预测模型150。

例如,系统500可以确定患者mr扫描310包括患者的前列腺的mr图像。因此,与所公开的实施方式一致,系统500可以识别已经基于利用前列腺的一个或更多个mr扫描和ct扫描作为训练数据的训练数据110构建和训练的伪ct预测模型。在实施方式中,多于一个伪ct预测模型可以是可用的,其中每个模型可以描绘例如前列腺的各种解剖方面。因此,可以生成多个伪ct预测模型,其中每个伪ct预测模型针对特定解剖区域(例如,针对前列腺的伪ct预测模型、针对右肺的伪ct预测模型、针对左肺的伪ct预测模型、针对大脑的伪ct预测模型等)。

在另一实施方式中,可以基于基于分类的特征例如组织分类来生成伪ct预测模型150。例如,系统500可以使用图像特征提取模块111根据组织类别(例如,骨头、脂肪、肌肉、水、空气,以及结构类别例如心脏组织、肺组织、肝组织、脑组织等)对训练数据110中的每个mr扫描的图像体素进行分割。可以基于分割后的图像体素来生成对于每个mr扫描的多个分割图。图像特征可以从分割图中提取。对于每个体素,可以将分割图提取的图像特征与mr扫描提取的图像特征进行组合。可以针对每个训练受试体基于组合后的图像特征来确定mr特征向量。可以生成基于组合的mr特征向量和所提取的ct值的伪ct预测模型。如上所述,术语“组织”被用作分类,而不仅仅表示特定类型的组织(例如,空气不是组织)。

在又一实施方式中,用于生成伪ct图像的过程可以基于使用根据训练受试者的特征选择的训练数据。例如,系统500可以识别训练受试体的子集中的一个或更多个共同特征。例如,系统500可以识别与每个训练受试体相关联的年龄、性别、重量级别等,并且选择具有一个或更多个共同特征的训练受试体。在其他示例中,系统500可以基于训练数据110中的mr扫描和ct扫描来识别训练受试体的一个或更多个特征。此外,系统500可以识别患者(例如,新患者)的与训练受试体的子集相同的一个或更多个特征。例如,系统500可以识别患者的一个或更多个特征,并且将患者的特征与针对训练受试体识别到的特征进行比较,以识别共同特征。然后,系统500可以选择具有一个或更多个共同特征的训练受试体作为训练数据以训练和构建伪ct预测模型150。

图像特征可以从与训练受试体的特征相关联的mr扫描中提取,并且ct数值可以从与训练受试体的特征相关联的ct扫描中提取。例如,系统500可以从训练数据110中的mr扫描中提取图像特征,并且可以从训练数据110中的ct扫描中提取ct值130,所述训练数据与和新患者具有共同特征的训练受试体的子集相关联。然后,可以针对该子集中的每个训练受试体基于所提取的图像特征确定mr特征向量。可以基于这些mr特征向量和所提取的ct值来生成伪ct预测模型。

伪ct预测模型150可以使用所有的训练数据110进行训练,并且然后用于新患者的新mr扫描。伪ct预测模型150还可以用于所有将来的新患者。在一些实施方式中,同一伪ct预测模型150可能不能用于每个患者。伪ct预测模型150可以针对特定患者定制生成。例如,可以基于与新患者相似或相关的训练受试体来选择训练数据,并且可以针对新患者专门地构建模型。

医务人员可以发现评估患者的感兴趣的区域的mr特征和ct特征二者以确定最佳治疗或诊断是有益的。此外,可以使用伪ct模型来从mr图像导出ct图像以促进放射疗法治疗计划中的患者剂量计算。对于根据mr图像准确地生成伪ct图像以使患者免受由ct成像引起的额外的辐射暴露,这是期望的。为了代替真实的ct图像,伪ct图像应尽可能接近患者的真实ct图像,以在放射疗法治疗计划中进行剂量计算或者生成数字重建放射影像(drr)以用于图像指导。然而,ct图像强度值(ct值)与mr强度值之间不存在简单的数学关系。由于mr强度值未标准化并且可能根据不同的mr扫描仪设置或不同的mr成像序列参数而显著变化,所以出现困难。

图7是与所公开的实施方式一致的用于在模型已经被训练之后使用伪ct预测模型(如由图1和图6所描述的)生成伪ct值和伪ct图像(如图3所述)的示例性过程700的流程图。在步骤710处,系统500可以接收与患者(例如,新患者)相关联的至少一个mr扫描(例如,mr扫描310)。至少一个mr扫描可能没有对应的ct扫描。mr扫描被用于生成伪ct图像。

在步骤720处,处理器514可以确定mr图像的体素是否应该被分割。对mr扫描进行分割是可选的。处理器514可以从治疗计划软件511(图5中示出)或者从用户接口(未示出)接收指示mr扫描是否应被分割的指令。如果是,则过程700沿分支722(例如,“是”)前进以对mr扫描进行分割。在步骤730处,根据例如组织分类来分割mr扫描的图像体素。可以根据本领域技术人员已知的分割技术来执行分割。例如,处理器514可以使用k均值聚类分割方法、模糊c均值分割方法等来创建一个或更多个分割图。

处理器514还可以使用更先进的分割方法。例如,处理器514可以采用基于学习的方法或基于特征的方法来执行分割,其可以包括使用例如算法(例如,局部图案特征、界标特征、背景特征等)来构建分类预测模型以基于图像体素的特征来预测每个图像体素的组织标签。

在步骤732处,处理器514可以针对每个mr扫描基于分割后的图像体素生成多个分割图以创建分类预测模型。例如,二进制骨分割图可以是在标记为骨的体素处值等于“1”且在所有其他体素处值为“0”的图像。处理器514可以使用分割图从原始mr图像中提取附加特征。与所公开的实施方式一致,可以采用上面公开的基于学习的方法来训练和构建预测模型以用于生成一个或更多个分割图。可替选地,如果不需要分割mr扫描,则过程700沿分支724(例如,“否”)前进。

在步骤740处,处理器514可以从患者的mr扫描中提取图像特征。如果执行了上面所述的分割mr扫描的可选路径,则可以沿路径722提供所提取的图像特征。在步骤734处,处理器514可以将通过使用来自mr扫描的分割图所提取的附加特征与直接从mr图像提取的特征进行组合,以针对每个数据点(例如体素)形成组合的特征集。

无论是否分割mr扫描,在图像特征已被提取之后,过程700(例如,沿路径744或路径736)进行至步骤750。在步骤750处,处理器514可以针对每个训练受试体根据所提取的图像特征来确定特征向量120。

在步骤760处,处理器514可以将mr特征向量120输入至伪ct预测模型150。在步骤770处,处理器514可以将伪ct预测模型150应用于输入的mr特征向量120以确定患者mr图像310的每个体素的ct数值(例如,伪ct值340)。

在步骤780处,基于伪ct值340,处理器514可以生成患者的伪ct图像350。由此得到的伪ct图像350可以用于治疗计划中的剂量计算、生成drr以用于图像指导等的目的。

图8示出了与所公开的实施方式一致的用于扩充训练数据以构建伪ct预测模型的示例性方法的图。图8所示的方法还可以被称为级联训练技术或多阶段训练技术,其中,初始训练的预测模型用于产生中间预测结果,该中间预测结果又被用作训练数据的一部分以进一步改善预测模型。级联训练技术可以包括多个训练阶段。在每个阶段中,使用与通过在前一阶段中生成的预测模型产生的预测结果相结合的初始数据(例如,训练数据110)来训练预测模型。

在一个实施方式中,如上面关于图1所描述的,可以使用初始的训练数据集来初始地构建和训练伪ct预测模型150。作为初始训练过程的一部分,图像特征从多个图像扫描中提取,并且根据所提取的图像特征确定特征向量。另外,对应的ct值可以根据ct扫描确定。例如,针对每个训练受试体,至少一个ct图像应是可用的。在实施方式中,多个ct图像可以是可用的。如果多个ct图像可用,则可以对ct图像进行平均以减少图像噪声。伪ct模型可以在级联训练过程中的任何阶段进行训练。

在另一实施方式中,分类预测模型可以作为初始模型或任何中间模型来训练。如上所述,分类预测模型可以用于预测一个或更多个分割图,从所述一个或更多个分割图中可以提取基于分类的特征并且基于分类的特征可以在下一训练阶段被使用。

在示例性级联训练过程中,可以在多个阶段中以任意组合的方式来使用伪ct预测模型和分类预测模型,只要在上一阶段中训练和构建了伪ct预测模型即可。

如图8所示,初始构建的预测模型被示出为模型#1。通过在训练阶段#1期间处理原始训练数据例如每个mr扫描、每个ct扫描或者每对mr扫描和ct扫描(例如,110a、110b)来生成模型#1。如上所述,模型#1可以是伪ct预测模型或分类预测模型。然后,模型1可以在下一阶段的训练过程中被使用。例如,可以使用模型#1来生成多个预测结果(例如,预测结果1,阶段1;预测结果2,阶段1,…,预测结果n,阶段1)。例如,当模型#1是伪ct预测模型时,可以将训练受试体a的mr扫描用作至模型#1的输入(例如,好像训练受试体a是新患者,并且训练受试体a的mr扫描是新的mr扫描)以生成伪ct预测结果1120a:预测结果1,阶段1。在另一示例中,当模型#1是分类预测模型时,模型#1的预测结果可以是分割图。可以类似地生成其他预测结果1120b…1120n。然后,可以将这些预测结果扩充至初始训练数据以形成扩充的训练数据1120。例如,通过将成对的mr扫描和ct扫描(例如,110a、110b、…、110n)与根据模型#1生成的它们对应的预测结果(例如,1120a、1120b、…、1120n)相关联,可以创建扩充的训练数据1120。扩充的训练数据1120可以由训练模块(例如,训练模块412)在下一训练阶段中使用以生成另一模型(例如,模型#2)。

以这种方式,可以在每个阶段生成新的、改善的、训练的模型(例如,模型#2、模型#3、…、模型#m)。可以通过将扩充的训练数据(例如,扩充的训练数据1120、1130等)应用于训练模块来改善在前一阶段中建立的模型。例如,可以使用包括通过模型#1生成的预测结果的扩充的训练数据1120来生成模型#2。为了生成模型#2,可以在训练阶段#2中将扩充的训练数据1120输入至训练模块(例如,训练模块412)。在一些实施方式中,通过模型#1生成的预测结果可以是针对每个训练受试体的图像(例如,伪ct图像)或图(例如分割图)。然后,可以使用例如图像特征提取模块111从预测结果(例如,图像或图)中提取图像特征。可以从预测结果中提取的图像特征可以包括在先前段落中论述的任何特征,例如强度特征、背景特征、块特征、局部图案特征、界标特征等。从预测结果中提取的特征可以与从原始mr图像中提取的特征进行组合以形成针对每个图像点的新的扩展的特征向量。扩展的特征向量可以用于下一训练阶段以训练例如模型#2。随着每个随后的预测模型(例如,模型#2)被使用其在先预测模型(例如,模型#1)的预测结果来构建和训练,从预测结果中揭露的新信息可以被添加至训练过程中,并且随后的预测模型的性能可以得到改进。使用扩充的训练数据(例如,扩充的训练数据1120、1130等)来训练每个随后的模型(例如,模型#1、模型#2、…等)的该过程继续,直到最终的预测模型模型#m被训练和构建。如果级联训练过程的目标是构建伪ct预测模型,则最终的模型模型#m是伪ct预测模型,而中间阶段的所有其他模型可以是任何模型。所使用的阶段的数目可以取决于对模型#m的验证以准确预测ct值。例如,当通过最新的模型生成的伪ct预测值与原始ct值之间的差小于预定阈值时,该迭代过程可以停止。在另一示例中,当相继的伪ct预测模型的预测结果之间的差小于预定阈值时,迭代过程可以停止。

如上所述,级联训练技术适用于训练和构建伪ct预测模型和/或组织分类模型。当训练和构建组织分类模型时,每个中间预测模型(例如模型#1、模型#2、…、模型#m-1)可以是组织分类模型,组织分类模型能够例如提供反映组织标签的分割图,而不是产生伪ct值。使用上面论述的多阶段训练过程,可以使用包括在先模型的预测结果的扩充数据来构建和训练每个组织分类模型,以在每个阶段不断地改善模型。另外,组织分类和伪ct预测可以在多阶段过程中混合。例如,在前k阶段中,训练的模型可以是组织分类模型,并且预测结果可以是组织分类结果。一旦组织分类模型被训练,则组织分类结果可以在k+1阶段中使用以预测伪ct值,其中,组织分类结果可以被用于提取与从mr扫描提取的其他特征结合的一组特征。可以执行单个额外阶段(例如,如果m=k+1)或者可以执行附加的阶段直至达到m阶段(例如,如果m>k+1)。在该过程结束时,最终的预测模型模型#m被训练和构建以生成伪ct值。

图9示出了与所公开的实施方式一致的用于应用多级模型来预测伪ct值的示例性过程的图。

如图9所示,处理器(例如,图5所示的处理器514)可以从图像获取装置440或者从数据库520、530(图5所示)获取一个或更多个患者的mr扫描310。

一旦获取了患者的mr扫描,则可以针对mr扫描的每个mr体素提取多个图像特征。如上面关于图2所论述的,所提取的图像特征可以包括局部图案特征212、界标特征214、背景特征216以及各种其他类型的特征218。特征可以与图像点、图像体素或图像样本相关联。如图9所示,图像特征提取模块311可以用于从mr扫描中提取图像特征。图像特征可以指mr体素的数值性质(例如,强度值、特征的坐标位置等)或分类性质(例如,组织类型、结构标签等)。如上所述,针对每个图像点提取的图像特征可以形成特征向量。例如针对mr扫描310的所有图像点的特征向量集(例如,320)可以被输入至模型#1(图8中在训练阶段1中生成的模型)。换句话说,处理器514可以将在图8的多阶段训练过程中在训练阶段1中生成的模型#1应用于从mr扫描310提取的特征向量集。模型#1可以输出预测结果#1940(例如,伪ct值、分割图等,取决于模型#1的类型)。随后,预测结果#1940和mr扫描310可以被组合并且经历另一次图像特征提取311。因为预测结果#1940提供了更多信息,所以可以由第二次提取产生更多的图像特征,或者由第二次提取产生的图像特征与由第一次提取产生的图形特征相比可以具有更好的质量。由第二次提取产生的图像特征可以形成mr特征向量集,所述mr特征向量集可以被输入至在图8的训练阶段2中生成的模型#2中以生成预测结果#2950,所述预测结果#2950可以与mr扫描310进行组合。图像特征提取模块311可以再次从所组合的预测结果#2950和mr扫描310中提取mr特征向量集。重复该过程,直到应用最终的预测模型模型#m来生成伪ct值340。根据一些实施方式,应该以与训练过程中生成的模型的顺序相同的顺序来应用预测模型模型#1至模型#m。伪ct值340可以用于生成描绘患者的解剖几何形状的准确视觉表示的伪ct图像350。

在一些实施方式中,预测模型模型#1、模型#2、…、模型#m-1中的任一个可以是组织分类模型。例如,模型#1可以是分类模型。将模型#1应用于从mr扫描310中提取的特征向量可以生成分类图,例如组织分类图。组织分类图与mr扫描310一起可以用作图像特征提取模块311的输入以生成具有更多信息或改进的质量的特征向量,模型#2可以应用于该特征向量。可以重复类似的步骤以进一步改善特征向量。可以从多阶段训练过程(图8)提供一系列分类模型。例如,模型#1可以是分类模型a,模型#2可以是分类模型b等。分类模型a和分类模型b可以与相同组织类别但不同的改善相关联,或者可以与不同的组织类别相关联。如上所述,与所公开的实施方式一致,最终的预测模型#m是产生伪ct值340的伪ct预测模型。

在一些实施方式中,可以使用包括多通道mr扫描和相应ct值的训练数据110(图1所示)来构建和训练预测模型。与单通道mr扫描相比,多通道mr扫描提供更多的信息。利用多通道mr图像可获得的增加的信息使得能够更准确且更稳健地预测ct值以生成伪ct图像。例如,多通道mr图像使得能够实现从mr强度值到固有组织参数值的转换。

mri是允许通过操纵磁场和射频(rf)场来研究人体的各种性质(例如,结构性质和机能性质二者)的高度通用的成像技术。对于标准结构(或解剖)成像,所测量的mr信号(例如,mr图像强度)可以是几个固有组织参数的函数:质子密度(p)、纵向弛豫时间(t1)以及横向弛豫时间(t2,或者考虑到磁场不均匀性效应时为)。例如,对于flash和spgr成像协议(例如,还被称为成像序列)二者,根据式2,mr信号强度s可以表示为固有组织参数的函数(p、t1以及):

其中,tr、te以及α是用户可以任意修改的mr获取参数。不同的参数可以用于产生不同的图像对比度。

为了根据mr图像预测ct数值,预测模型可以主要依赖于固有组织参数(p、t1以及),而不是取决于序列参数(tr、te以及α)的mr信号强度s,因为后者不表示——至少不直接表示——患者的解剖性质。

使用多通道mr图像使得能够对这些固有组织参数进行估计,因为多通道mr图像可以提供多个图像,其中每个图像具有序列参数(tr、te以及α)的不同设置。因此,多通道mr图像使得能够通过求解其中s和序列参数(tr、te以及α)的多个值已知的式2来对固有组织参数(p、t1以及)进行估计。例如,为了估计所有三个未知参数(p、t1以及),需要三个mr图像(例如,三个通道)。使用额外的通道将通过降低图像噪声来提高参数估计的鲁棒性。

在一些实施方案中,用于实现所公开的方法的工作流包括两个阶段:训练(例如,模型构建)阶段和应用(例如,伪ct生成)阶段。在一些实施方式中,在训练数据被收集之后,仅需要计算一次训练阶段。在预测模型经过训练之后,在应用阶段,可以将训练后的模型应用于新的多通道mr扫描以仅使用多通道mr扫描为新患者创建伪ct图像。在下面的描述中,图10和图11针对训练阶段,而图12针对预测阶段。

图10示出了用于使用根据多通道mr扫描估计的组织参数训练伪ct预测模型的示例性过程的图。类似于图1所示的过程,可以收集来自既具有ct扫描又具有多通道mr扫描的多个训练受试体的训练数据。例如,如图10所示,可以针对受试者a收集多通道mr图像数据1010a和ct图像数据1014a。多通道mr数据1010a可以包括使用不同的序列参数集获得的多个mr图像。类似地,可以针对受试体b获取多通道mr图像数据1010b和ct图像数据1014b。多通道mr图像数据和ct图像数据可以从图像获取装置(例如,440)或从图像数据库(例如,520、530)来获取。数据获取/收集过程持续进行直至第n组数据(例如,1010n和1014n)已经包括在训练数据中。在一个实施方式中,除了图10中的mr图像数据是多通道mr数据而图1中的mr数据可以是单通道mr数据或多通道mr数据之外,图10中所示的训练数据与图1中的训练数据110类似。

在一些实施方式中,ct扫描(例如,1014a)和多通道mr扫描(例如,1010a)是对准的。如果没有,则可以应用自动或半自动图像配准或对准程序来将它们对准。如上所述,对准的一对ct图像和mr图像意味着对于每个体素(例如,指示图像的空间位置),对应的ct图像值和mr图像值是已知的或者对应关系是已知的。另外,mr图像也可以经历一些程序以用于校正几何失真。

本申请公开了使用训练数据构建和训练预测模型的基于学习的方法。在实施方式中,预测模型可以是回归模型或回归函数,因为预测模型的输出可以是连续变量(例如,ct值)。

可以使用许多统计或机器学习的方法来构建和/或训练预测模型,该预测模型可以基于从mr图像导出的特征来预测ct图像强度(还被称为ct值或ct数值)。例如,监督学习是机器学习的分支,其可以用于基于训练数据集来确定预测模型。训练数据的每个样本都是包括输入数据(例如,测量结果或特征的向量)和期望的输出值(例如,监督信号)的对。当输出变量是数值的或连续的时——这在生成伪ct图像的应用中通常是真实的,监督学习算法可以分析训练数据并且产生预测函数(例如,回归函数)。各种算法可以被应用于确定预测模型,包括但不限于:支持向量机、神经网络、决策树以及随机森林。

一旦使用训练数据进行了训练,则预测模型可以被用于针对同一患者或不同患者的多通道mr扫描的任意新的集合来生成伪ct图像。

本申请的实施方式可以将mr强度值(例如,s)转换成固有组织参数(例如,p、t1、),并且可以基于固有组织参数来构建预测模型。如上所述,与ct成像相比,使用mr成像的能力提供了更大的灵活性和更少的辐射暴露,但是mr强度值不能直接用于剂量计算,因为它们是依赖于序列的。使用固有组织参数而不是使用原始mr强度值训练预测模型可以提供不依赖于序列的预测模型。不依赖于序列会是有利的,因为成像序列或序列参数可易于修改,并且在不同诊所之间通常显著变化。通过将预测模型设计成不依赖于序列,可以将从不同mr扫描仪、不同mr成像序列或者不同诊所获取的数据一起使用——如果mr序列可以被用于估计固有组织参数的话。另外,新患者的mr成像序列不需要与由训练数据使用的mr成像序列相同。因此,用户可以自由地为将来的患者设计新的mr成像序列,而不需要获取新的训练数据来训练预测模型。

为了基于组织参数来构建预测模型,需要针对每个患者将mr图像强度转换成组织参数值。这可以通过在患者的mr图像的每个图像点(例如,体素)处求解mr成像等式(例如,式2)来实现。可以产生组织参数图像(还被称为组织参数图)的集合。该集合可以包括用于每个组织参数的一个组织参数图。例如,集合可以包括p的图、t1的图以及t2或的图。组织参数值是反映患者身体的下层组织或器官的性质的固有值。此外,因为对于每个训练受试体,ct图像与mr图像是对准的,所以ct图像还与根据mr图像生成的组织参数图是对准的。

如图10所示,可以基于多通道mr图像数据生成针对每个训练受试体的组织参数图。例如,受试体a的组织参数图1012a可以包括所有三个组织参数图的集合。在一些实施方式中,如果难以根据多通道mr图像来估计所有组织参数,则也可以仅使用组织参数的子集来构建模型。一旦获得每个训练受试体的组织参数图(例如,1012b,…,1012n),则组织参数图可以与对应的ct图像一起被用于使用训练模块1045(例如,使用统计或机器学习技术)来构建和训练伪ct预测模型1050。在一些实施方式中,对于每个图像点(例如,体素),组织参数集可以被视为包括在如图1中所描述的特征向量中的特征。例如,如果使用所有三个组织参数,则可以构建特征向量[p,t1,]。该组织参数特征向量可以单独使用,或者与结合图2所讨论的用于构建和训练预测模型的其他特征组合使用。上面讨论的构建和训练预测模型150的公开技术也适用于构建和训练预测模型1050的过程。

图11是使用多通道mr数据构建伪ct预测模型的示例性方法1100的流程图。方法1100可以由系统500实现。在步骤1110处,处理器514可以接收包括多通道mr数据(例如,1010a、1010b等)和ct数据(例如1014a、1014b等)的训练数据。多通道mr数据可以包括对应一个或更多个患者的多通道mr图像。在一些实施方式中,多通道mr数据可以包括对应每个患者的至少两个多通道mr图像。可以使用不同的成像序列参数来获得同一患者的多通道mr图像。ct数据可以包括对应一个或更多个患者的ct图像。在一些实施方式中,ct数据可以包括对应每个患者的至少一个ct图像。如果多个ct图像可用,则可以对它们进行平均以降低图像噪声。对于给定患者,可以将ct图像和多通道mr图像对准。在一些实施方式中,如果ct图像和多通道mr图像未对准,则可以使用图像配准技术来将它们对准。

在步骤1120处,处理器514可以基于来自多通道mr数据的mr强度来确定至少一个组织参数图(例如,1012a、1012b等)。例如,p、t1或中的至少一个组织参数图可以使用患者的多个mr图像的mr强度值通过求解式2来估计。因为式2是非线性等式,所以可以使用拟合技术基于多组mr强度((s)和序列参数(tr、te以及α)来估计组织参数值,其中,所述多组mr强度((s)和序列参数(tr、te以及α)基于多通道mr数据而是已知的。如上所述,优选所有三个组织参数图,但是也可以使用组织参数图的子集。

在一些实施方案中,可以通过估计各个图像点来生成组织参数图。例如,可以在每个图像点处估计包括若干种组织参数(例如,p、t1、或者)的组织参数值集。然后,对应的组织参数图可以被形成为特定种类的所有组织参数值的集合。

在步骤1130处,处理器514可以获得与在步骤1120处生成的组织参数图相对应的ct值。在一些实施方式中,ct值可以是与组织参数图相同患者的ct图像的ct强度值。如上所述,因为ct图像与mr图像是对准的,所以ct图像也与根据mr图像转换的组织参数图是对准的。

在步骤1140处,处理器514可以基于ct值和组织参数图生成伪ct预测模型(例如,1050)。在一些实施方式中,可以将ct值和组织参数图输入至训练模块(例如,1045)以训练伪ct模型1050。训练模块1045可以使用回归方法例如统计学习或机器学习技术来训练预测模型。训练后的预测模型1050可以是可以被用于基于一个或更多个组织参数值(例如,p、t1、)预测ct数值的数学或统计模型。如上所述,虽然优选使用所有组织参数,但是也可以仅使用组织参数的子集来构建模型。

图12是用于使用多通道mr图像生成患者的伪ct图像的示例方法1200的流程图。方法1200可以由系统500实现,并且可以用于使用通过方法1100构建的预测模型(例如,1050)生成新患者的伪ct图像。

在步骤1210处,处理器514可以从例如图像获取装置440或数据库520、530接收患者(例如,新患者)的多通道mr图像。所接收的多通道mr图像可能没有对应的ct图像。在步骤1220处,处理器514可以将多通道mr图像转换成至少一个组织参数图。例如,处理器514可以通过使用拟合技术等求解式2来将多通道mr图像转换成组织参数图。可以通过转换过程1220生成一个或更多个组织参数图,例如p、t1、和/或的图。如上所述,虽然优选具有所有组织参数图,但是在一些实施方式中也可以使用图的子集。

在步骤1230处,处理器514可以将预测模型(例如,1050)应用于组织参数图。例如,可以将转换后的组织参数图用作预测模型的输入。在一些实施方式中,预测模型可以按逐点的方式进行操作,其中,预测模型基于在患者图像(例如,伪ct图像)的每个位置处计算的组织参数值来预测该位置处的ct数值。也可以使用更复杂的预测模型。例如,模型可以考虑每个点附近的组织参数值,这可以提高相对于数据噪声的鲁棒性。模型还可以基于组织参数值和其他信息例如图像点位置或者可以从组织参数图——例如纹理、梯度等——导出的其他特征的组合来进行预测。

在步骤1240处,可以通过集合从步骤1230得到的伪ct值来生成患者的伪ct图像。

为了训练预测模型,并且使用该模型来预测伪ct值,可以使用参数化方法例如线性回归或普通最小二乘回归。在这些参数化方法中,回归函数是根据有限数目的未知模型参数定义的,这些未知模型参数可以根据输入数据进行估计。例如,回归模型可以被定义为:

h≈f(x,β)

其中,h表示要预测的ct值,x表示输入变量的向量,例如组织参数值(p、t1以及(或t2)),并且β表示回归模型的未知模型参数的向量。一个示例性模型是如下定义的线性回归模型:

在训练阶段,训练数据可以提供大量的观察值,例如,一组已知的h值(例如,在步骤1130处通过ct扫描来提供)与对应的p、t1以及值(例如,在步骤1120处通过转换mr扫描来提供)。使用这些观察数据,随后可以计算或训练(例如,使用最小二乘拟合)模型参数β。一旦在训练之后获得β,则该模型可以随后被用于针对一组新的p、t1以及值来计算h(例如,在预测阶段使用方法1200)。

在一些实施方案中,代替或除了使用组织参数作为预测模型的输入数据,也可以收集其他信息。例如,可以计算或收集的额外的特征包括但不限于:

·图像点的坐标,或者关于外部参考空间或关于一个或几个内部界标点归一化的坐标;

·在采样点位置处计算的组织参数图的曲率;

·在采样点位置处计算的组织参数图的纹理测度;以及

·局部组织参数值的块,例如,样本点的5×5×5邻域内的组织参数值。

基于本说明书的书面描述和方法的计算机程序在软件开发人员的技能范围内。可以使用各种软件编程技术来创建各种程序或程序模块。例如,程序段或程序模块可以以或者借助于java、python、c、c++、汇编语言或任何已知的编程语言来设计。这样的软件部分或模块中的一个或更多个可以集成到计算机系统和/或计算机可读介质中。

此外,虽然本文已经描述了说明性的实施方式,但是该范围包括具有基于本公开内容的等同元素、修改、省略、组合(例如,跨各种实施方式的各方面的组合)、适应性调整、替代内容的任何及所有实施方式。权利要求中的元素将基于权利要求中使用的语言进行宽泛地解释,而不限于本说明书中或在本申请的审查期间描述的示例,这些示例将被解释为是非排他性的。因此,旨在将说明书和示例仅视为示例,而真正的范围和精神由所附权利要求书及其等同内容的全部范围来指示。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1