基于GrowCut的鼻咽癌原发病灶临床靶区自动勾画方法及系统与流程

文档序号:20690705发布日期:2020-05-08 19:27阅读:296来源:国知局
基于GrowCut的鼻咽癌原发病灶临床靶区自动勾画方法及系统与流程

本发明涉及预测肿瘤生长、模拟肿瘤扩散区域领域,尤其涉及一种基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法及系统。



背景技术:

现有基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法(cn107437249)包括以下步骤:步骤s1:对模板ct图像序列进行离散化操作,网格化三维的ct图像得到对应的三维网格,读入训练集中医生勾画好的肿瘤轮廓文件,生成肿瘤原发灶区域的二值图像。步骤s2:对读入的原发灶肿瘤数据做预处理操作,挖掘临近肿瘤之间的互关联关系,统计相邻的体素联合出现的频数,存储统计的结果,建立互关联规则的数据库。步骤s3:读入新病人的原发肿瘤数据,设定原发灶肿瘤区域格点强度值为1,按照预设定的元胞演化规则和互关联规则信息不断更新各个离散网格点的强度值;直到各个网格点强度停止更新,给定不同的损失代价阈值得到对应的临床放疗靶区范围。

但现有基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法在步骤s21预处理中,为了去掉肿瘤表层不稳定的数据,采用了腐蚀操作,可以消除边界点,但同时也会造成边界内缩,导致最终的预测区域偏小。而在步骤s222中,对空间中所有三维点按照位置顺序编号,统计三项集和四项集的频数,这样子在生成三项集和四项集的过程中产生的候选组合过多,没有排除不应该参与组合的元素,并且每次计算项集的支持度时,都对数据库中的全部记录进行了一遍扫描比较,对于模板ct全部体素点组合,这样一个大型的数据库的话,这种扫描比较会大大增加计算机系统的i/o开销。而这种代价是随着数据库的记录的增加呈现出几何级数的增加。另外,在步骤s321中,要对于三维网格点中所有体素点,计算邻居点对该点的影响,但是根据临床先验知识,放射照射的靶区范围是比肿瘤原发灶gtv范围大的,所以相当于每次计算了很多不需要计算的体素点。在整体计算的时候,内部的体素点概率很可能会因为外部点的影响,造成最终的结果偏小,不符合临床实际结果。



技术实现要素:

针对现有技术存在的问题,本发明实施例提供一种基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法及系统。

第一方面,本发明实施例提供一种基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法,包括以下步骤:

步骤s1:对模板ct的图像序列进行数据离散操作,网格化三维的ct图像得到对应的三维网格,读入训练集中医生勾画好的肿瘤轮廓文件,生成肿瘤原发灶区域的二值图像;

步骤s2:对读入的原发灶肿瘤数据采用开运算进行预处理操作,挖掘邻近肿瘤之间的互关联关系,统计相邻的体素联合出现的频数,存储统计的结果,建立互关联规则的数据库;

步骤s3:读入新病人的原发肿瘤数据,设定原发肿瘤区域格点强度值为1,按照预设定的元胞演化规则和互关联规则信息不断更新各个离散网格点的强度值;直到各个网格点强度值停止更新,给定不同的损失代价阈值得到对应的临床放疗靶区范围。

进一步地,步骤s2中对读入的原发灶肿瘤数据采用开运算进行预处理操作的具体公式为:

其中,b是腐蚀结构元素,先做腐蚀操作,再做膨胀操作;腐蚀就是结构元素b平移到e空间中每个位置,可以完全包含在e中的像素点的集合;膨胀就是在结构元素b约束下,将于空间e接触的部分背景点合并到e中的过程。

进一步地,步骤s2中建立互关联规则的数据库包括步骤s222:挖掘邻近肿瘤区域的关联关系,统计数据里所有相邻体素组合之间的频数,构建频繁项集树。

进一步地,步骤s222包括以下步骤:

给空间中所有三维网格点按照位置顺序编号;

统计空间上所有的连续的体素的组合;

扫描数据库一遍,统计每个元素出现的频数,按照频数递降排序;

创建频繁项集树的根节点,然后根据频数递降排序添加树的路径,如果新添加的项集在树中已有路径,则只需更新元素对应的频数,否则创建新的结点;

挖掘频繁模式:得到频繁项集树后,对每个元素前缀路径,构建条件频繁项集树,得到每个元素的频繁项集。

进一步地,挖掘频繁模式采用并行执行。

进一步地,步骤s3包括步骤s32:在已知第t次迭代状态值,计算t+1次迭代演化过程;所述步骤s32包括步骤s321:读入新病人的原发肿瘤数据,并设定原发肿瘤区域内格点强度为1,外部的体素点强度值设置为0,按照元胞演化规则和互关联规则信息不断更新网格点强度值。

进一步地,步骤s321包括以下步骤:

将原发肿瘤边界的体素点看成种子点,从t=0的状态开始迭代更新,每次迭代后更新对应点的强度值;

从肿瘤原发区域边界点集开始,将边界点周围所有相邻的强度值小于1的体素点加入肿瘤原发区域边界点集,按照加入肿瘤原发区域边界点集的顺序,计算每个点周围邻点对该点的影响值,来确定是否更新强度值;然后增加更外层的强度值小于1的相邻点加入肿瘤原发区域边界点集,迭代计算更新强度值,如果循环两次强度值不变,则从肿瘤原发区域边界点集中去掉该点;

当肿瘤原发区域边界点集为空或者所有体素点的强度值不再更新,或者迭代达到上限,则停止迭代,得到当前的网格点强度值分布,给定不同的损失代价阈值,得到对应的不同剂量的原发病灶临床靶区范围供放射科医生选择。

第二方面,本发明实施例提供一种基于growcut的鼻咽癌原发病灶临床靶区自动勾画系统,包括:

二值图像生成模块:用于对模板ct的图像序列进行数据离散操作,网格化三维的ct图像得到对应的三维网格,读入训练集中医生勾画好的肿瘤轮廓文件,生成肿瘤原发灶区域的二值图像;

互关联规则数据库建立模块:用于对读入的原发灶肿瘤数据做预处理操作,挖掘邻近肿瘤之间的互关联关系,统计相邻的体素联合出现的频数,存储统计的结果,建立互关联规则的数据库;

临床放疗靶区范围生成模块:用于读入新病人的原发肿瘤数据,设定原发肿瘤区域格点强度值为1,按照预设定的元胞演化规则和互关联规则信息不断更新各个离散网格点的强度值;直到各个网格点强度值停止更新,给定不同的损失代价阈值得到对应的临床放疗靶区范围。

第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法的步骤。

第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法的步骤。

本发明实施例提供的一种基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法及系统具有如下优点:

1.对数据处理更合理,对最外层可能是噪点的体素点采用开运算,在去除细小噪点的同时,保证整体肿瘤区域面积和形状不变,结果更可靠。

2.大大减少计算量,在计算体素点互关联关系采用频繁项集树构造,避免了现有技术会计算大量候选项集,需要多次扫描整个数据集的情况。并且在迭代更新体素点强度的时候,只对需要更新的体素点计算周围点对该点的影响,而避免现有算法每次都需要更新所有体素点的情况。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法流程图;

图2为本发明实施例提供的方法中步骤s2中建立互关联规则的数据库的流程图;

图3为本发明实施例提供的方法中步骤s222的流程图;

图4为本发明实施例提供的方法中步骤s321的流程图;

图5本发明实施例提供的基于growcut的鼻咽癌原发病灶临床靶区自动勾画系统的原理图;

图6本发明实施例提供的一种电子设备的实体结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1为本发明实施例提供的一种基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法流程图(其中,肿瘤区(grosstumorvolume,gtv):指临床可见、可通过诊疗检查手段(包括ct和mri)证实的肿瘤范围。原发病灶临床靶区(clinicaltargetvolume,ctv):除包含gtv外,还包括显微镜下可见的、亚临床灶以及肿瘤可能侵犯的范围。growcut是一种应用在图像处理中的基于元胞自动机的交互式的图像分割方法),如图1所示,本发明提出的一种基于growcut鼻咽癌放疗靶区自动勾画方法,包括下述步骤:

步骤s1:对模板ct的图像序列进行数据离散操作,网格化三维的ct图像得到对应的三维网格,读入训练集中医生勾画好的肿瘤轮廓文件,生成肿瘤原发灶区域的二值图像;

本发明实施例的步骤s1中,网格化三维的ct图像的具体过程为:把不同层面的模板ct序列图像划分成长方体格点,即体素点,长宽高的物理距离分别为2*0.95756325mm×2*0.95756325mm×3mm。得到格点数目为width×height×zlen的三维网格。width和height的值,由训练集中n例病人中肿瘤所侵犯的区域决定,zlen为模板ct横断面的层数。所述二值图像需要判断网格点是否在肿瘤轮廓(多边形)内部,把三维网格中在肿瘤区域内部的网格点(体素)值设为1,肿瘤区域外部的网格点值设为0(体素(voxel):三维图像体积元素的简称。数字数据于三维空间分割上的最小单位,用于三维成像、医学影像等领域。概念类似于二维空间的最小单位——像素);所述肿瘤区域将运用判断体素点是否在多边形内的方法(inpolygon),分开非肿瘤区域与肿瘤区域。具体的判断体素点是否在多边形内的方法(inpolygon)的计算公式为:

in=inpolygon(x,y,z,xv,yv,zv)

式中in为输出的二值图像,其尺寸与原始输入横截面ct图像i(x,y,z)相同,(x,y,z)为像素,(xv,yv,zv)为gtv轮廓的坐标。

步骤s2:对读入的原发灶肿瘤数据做预处理操作,挖掘邻近肿瘤之间的互关联关系,统计相邻的体素联合出现的频数,存储统计的结果,建立互关联规则的数据库;

本发明实施例的步骤s2中对读入的原发灶肿瘤数据做预处理操作是为了去除边界区域可能存在的噪声像素点的影响,即肿瘤表面层面不稳的数据,采用开运算进行处理,具体公式为:

其中b是腐蚀结构元素,先做腐蚀操作,再做膨胀操作。腐蚀就是结构元素b平移到e空间中每个位置,可以完全包含在e中的像素点的集合(像素(pixel):图像元素的简称。像素是构成数码影像的基本单元,是二维空间的最小单位)。膨胀就是在结构元素b约束下,将于空间e接触的部分背景点合并到e中的过程。

如图2所示,本发明实施例的步骤s2中建立互关联规则的数据库包括下述步骤:

步骤s221:给空间中所有三维网格点按照位置顺序编号,具体公式为mxyz=z×height×width+x×height+y;其中,(x,y,z)是对应着网格点三维坐标。z为网格点所在的ct层面,(x,y)为格点在该ct切片中的坐标位置。

步骤s222:挖掘邻近肿瘤区域的关联关系,统计数据里所有相邻体素组合之间的频数,构建频繁项集树。

如图3所示,本发明实施例的步骤s222包括以下步骤:

(a)为区别ct图像的各个体素,给空间中所有三维网格点按照位置顺序编号,具体公式为mxyz=z×height×width+x×height+y;其中,(x,y,z)是对应着网格点三维坐标;z为网格点所在的ct层面,(x,y)为格点在该ct切片中的坐标位置;

(b)统计空间上所有的连续的体素的组合,在gtv内部,体素概率同时为1,且空间上相邻的体素点被视为连续,具体来说,对于每个体素的领域,按照格点的编号升序排列(i<j<k),当该组合的频数大于1时,将该组合记录于数据库。

(c)扫描数据库一遍,统计每个元素出现的频数,按照频数递降排序,结果记为f

(d)创建频繁项集树的根节点,标记为null,然后根据f中的顺序添加树的路径,如果新添加的项集在树中已有路径,则只需更新元素对应的频数,否则创建新的结点。

(e)挖掘频繁模式:得到频繁项集树后,就可以对每个元素前缀路径,构建条件频繁项集树,得到每个元素的频繁项集。即可以得到三项集和四项集,并且可以得到所有相关的项集。

(f)并且为了提速挖掘频繁模式的过程,采用并行执行,加速了得到三项集和四项集的过程。

挖掘体素点互关联关系,原技术采用apriori算法模式,计算所有三项集和四项集时候,产生判断的组合为全部情况,没有排除不应该参加判断的组合元素,并且每次计算项集支持度的时候,都对数据库中全部记录进行了一遍扫面比较,这样大大增加了计算机系统的i/o开销,花费时间长,资源占用量大。本发明采用频繁项集树的结构,只通过两次扫描数据库,就把包含的频繁项按照支持度降序压缩保存到树结构中,并通过递归的方法可以直接生成频繁模式,因此整个过程不需要产生候选组合,大大减少计算量,并通过并行,大大提高计算速度。

步骤s3:读入新病人的原发肿瘤数据,设定原发肿瘤区域格点强度值为1,按照预设定的元胞演化规则和互关联规则信息不断更新各个离散网格点的强度值;直到各个网格点强度值停止更新,给定不同的损失代价阈值得到对应的临床放疗靶区范围。

本发明实施例的步骤s3包括以下步骤:

步骤s31:设定初始状态的体素点的强度值,位于gtv内部的体素点看作种子点,强度值设置为1,位于gtv外部的强度值设置为0,此时设为t=0下的状态,具体来说,对于点坐标为(x,y,z)的体素点mxyz,该点在第t次迭代的强度值记为不失一般性,设所有

步骤s32:在已知第t次迭代状态值,计算t+1次迭代演化过程。

本发明实施例的步骤s32包括以下步骤:

步骤s321:读入新病人的原发肿瘤数据,由临床先验知识知道,放射照射的靶区范围是比肿瘤原发范围大,所以设定原发肿瘤区域内格点强度为1,外部的体素点强度值设置为0。按照元胞演化规则和互关联规则信息不断更新网格点强度值。

如图4所示,本发明实施例的步骤s321包括以下步骤:

(a)将原发肿瘤边界的体素点看成种子点,从t=0的状态开始迭代更新,每次迭代后更新对应点的强度值。

(b)从肿瘤原发区域边界点集(记为{p})开始,将边界点周围所有相邻的强度值小于1的体素点加入{p},按照加入点集{p}的顺序,计算每个点周围邻点对该点的影响值,来确定是否更新强度值。然后增加更外层的强度值小于1的相邻点加入{p},迭代计算更新强度值,如果循环两次强度值不变,则从点集{p}中去掉该点。

(c)当点集{p}为空或者所有体素点的强度值不再更新,或者迭代达到上限,则停止迭代,得到当前的网格点强度值分布,给定不同的损失代价阈值,得到对应的不同剂量的ctv范围供放射科医生选择。

步骤s322:对于三维网格中的所有体素点,计算每个点邻居对该点的影响值,具体来说,对于点坐标为(x,y,z)的体素点mxyz。遍历所有属于点mxyz领域范围n(mxyz)的连续体素组合σ(mxyz),如果更新强度值具体来说,n是三维网格中的一个领域系统:n(mxyz)={mj∈z3,j≠(xyz):||mj-mxyz||2<d};d是距离常数,在具体实施例中d=3,σ(mxyz)是一组空间连续的邻近体素组合,在具体实施例中其基数||σ(mxyz)||取3,即三项频繁集。f是一个衡量邻近体素对目标体素点强度值影响能力的一个函数,公式如下:

其其中,factor用其中于减弱与目标体素点距离联系不够紧密的频繁项组合对目标体素点的影响,mindist是常数,在具体实施过程中取值为2。

步骤s323:当迭代次数达到上限或者所有体素点的强度值不再更新时,停止迭代,得到当前的网格点强度值分布,给定不同的阈值,得到对应的不同剂量的ctv范围供放射科医生选择。

通过本发明的技术方案,运用一种原本应用于图像分割算法growcut,模拟肿瘤生长,实现放疗靶区的自动勾画,本方法计算的结果能辅助临床放射治疗计划的制定,实现临床放疗靶区的自动勾画,达到临床应用的勾画标准,提高医生的工作效率。此外,局部的调整将作为后处理,提供给医生选择。

基于上述任一实施例,图5为本发明实施例提供的一种基于growcut的鼻咽癌原发病灶临床靶区自动勾画系统的结构示意图,该系统包括:

二值图像生成模块:用于对模板ct的图像序列进行数据离散操作,网格化三维的ct图像得到对应的三维网格,读入训练集中医生勾画好的肿瘤轮廓文件,生成肿瘤原发灶区域的二值图像;

互关联规则数据库建立模块:用于对读入的原发灶肿瘤数据做预处理操作,挖掘邻近肿瘤之间的互关联关系,统计相邻的体素联合出现的频数,存储统计的结果,建立互关联规则的数据库;

临床放疗靶区范围生成模块:用于读入新病人的原发肿瘤数据,设定原发肿瘤区域格点强度值为1,按照预设定的元胞演化规则和互关联规则信息不断更新各个离散网格点的强度值;直到各个网格点强度值停止更新,给定不同的损失代价阈值得到对应的临床放疗靶区范围。

综上所述,本发明实施例提供的基于growcut的鼻咽癌原发病灶临床靶区自动勾画方法及系统对最外层可能是噪点的体素点采用开运算,在去除细小噪点的同时,保证整体肿瘤区域面积和形状不变,结果更可靠。该鼻咽癌原发病灶临床靶区自动勾画方法及系统大大减少计算量,在计算体素点互关联关系采用频繁项集树构造,避免了现有技术会计算大量候选项集,需要多次扫描整个数据集的情况。并且在迭代更新体素点强度的时候,只对需要更新的体素点计算周围点对该点的影响,而避免现有算法每次都需要更新所有体素点的情况。

图6为本发明实施例提供的一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)301、通信接口(communicationsinterface)302、存储器(memory)303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信。处理器301可以调用存储在存储器303上并可在处理器301上运行的计算机程序,以执行上述各实施例提供的方法,例如包括:

对模板ct的图像序列进行数据离散操作,网格化三维的ct图像得到对应的三维网格,读入训练集中医生勾画好的肿瘤轮廓文件,生成肿瘤原发灶区域的二值图像;

对读入的原发灶肿瘤数据做预处理操作,挖掘邻近肿瘤之间的互关联关系,统计相邻的体素联合出现的频数,存储统计的结果,建立互关联规则的数据库;

读入新病人的原发肿瘤数据,设定原发肿瘤区域格点强度值为1,按照预设定的元胞演化规则和互关联规则信息不断更新各个离散网格点的强度值;直到各个网格点强度值停止更新,给定不同的损失代价阈值得到对应的临床放疗靶区范围。

此外,上述的存储器303中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的方法,例如包括:

对模板ct的图像序列进行数据离散操作,网格化三维的ct图像得到对应的三维网格,读入训练集中医生勾画好的肿瘤轮廓文件,生成肿瘤原发灶区域的二值图像;

对读入的原发灶肿瘤数据做预处理操作,挖掘邻近肿瘤之间的互关联关系,统计相邻的体素联合出现的频数,存储统计的结果,建立互关联规则的数据库;

读入新病人的原发肿瘤数据,设定原发肿瘤区域格点强度值为1,按照预设定的元胞演化规则和互关联规则信息不断更新各个离散网格点的强度值;直到各个网格点强度值停止更新,给定不同的损失代价阈值得到对应的临床放疗靶区范围。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1