一种基于基因影像学的肿瘤影像标记物提取方法与流程

文档序号:11251415阅读:698来源:国知局

本发明涉及一种基于基因影像学的肿瘤影像标记物提取方法,属于影像标记物领域。



背景技术:

据世界卫生组织报告,癌症是全球发病和死亡的主要原因;在我国,恶性肿瘤已经成为我国居民头号杀手。肿瘤领域是当下研究的一个热点,其中一个重要的挑战是寻找肿瘤标记物,对于肿瘤早期诊断、预后以及疗效预测起至关重要作用。

现有肿瘤标记物提取方法主要基于分子技术,该方法需借助专业仪器对病人进行活检或手术,侵入性地获取出肿瘤局部组织,通过基因测序或蛋白质分子技术,从癌症的分子机制去探索发生的根源,寻找致癌基因的突变位点和其分子表达通路。结合病人的临床分期、生存周期等信息,寻找潜在的肿瘤分子标记物。但肿瘤具有很强的空间异质性,局部组织并不能代表整个肿瘤的全局特征;这可能会导致分子标记物研究的可变性和不一致性。另外,现阶段分子技术的不成熟、成本高,制约着其在临床的常规应用。因此,探索无侵入的可替代标记物是一个重要的研究目标。

影像学方法已用于临床的常规诊断。其中,ct作为最常见的成像方式,可无侵入、重复地描述肿瘤的解剖学特征。在一些肿瘤影像学标记物提取方法中,基于ct的定量特征,如肿瘤大小、边界等被证明与肿瘤分期,生存周期和疗效相关。而新兴领域——基因影像学,将影像特征和分子机制相关联,尝试用从基因层次去解释宏观的影像学特征。然而,基因影像学大部分研究集中在两者的关联,尚未发现其在影像标记物领域的应用。



技术实现要素:

基于分子技术的生物标记物提取方法,缺点是侵入性、局部描述、成本高。

导致原因:分子技术需侵入性地取肿瘤局部组织,因而只能分析肿瘤局部特征;整个过程需借助专门仪器和基因测序或蛋白质技术,尚未成熟,成本高。

基于影像学的生物标记物提取方法,缺点是不稳定、缺乏生物学解释。

导致原因:提取的影像特征是定性或半定量,主观性强,可重复性差,因而并不稳定。由于肿瘤ct的影像学特征是肿瘤宏观上的信息,缺乏其背后的生物学解释。

因此针对上述现有技术的缺点,本发明提出通过提取肿瘤ct的高维定量影像特征,与对应的肿瘤基因表达模式进行关联的一种方法;并假设某些定量影像特征可以反映肿瘤的特定基因表达模式,作为肿瘤的预后标记物。解决的实际问题在于提出一种最终提取无侵入、生物学可解释的影像学标记物的提取方法。

为了实现上述目的,本发明采用以下技术方案。

本发明提出了一种基于基因影像学的影像学标记物提取方法,包括以下步骤:

肿瘤ct影像分析、肿瘤基因表达数据分析、基因影像关联分析、关联影像特征的预后评估。具体过程如下:

1)肿瘤ct影像分析;根据肿瘤ct影像,放射科医师手动或自动分割算法勾画肿瘤区域,针对肿瘤区域,计算4组共639个特征,分别为一阶统计特征,几何形状特征,纹理特征以及小波特征;

2)肿瘤基因表达数据分析;基因表达数据的处理分为三步,

第一步,预处理,若某个基因表达值为0的样本个数超过第一阈值或所有样本的平均表达值小于第二阈值,则该基因剔除,对筛选后的基因表达值进行对数和标准化处理;

第二步,基因模块聚类,对基因表达值进行权重共表达网络分析,将基因表达值自动聚类成若干个基因模块,用每个基因模块的主成分代表该基因模块;

第三步,对基因模块进行生存分析,按照p<0.05标准,筛选出具有显著预后的基因模块;

3)基因影像关联分析;利用spearman相关法,将筛选后的影像特征和基因模块做关联热图,得到每个影像特征与基因模块的相关系数和p值;

4)关联影像特征的预后评估;在基因影像关联热图中,按照p<0.05标准,筛选出显著的基因-影像关联对,对关联对中出现的影像特征做生存分析评估,得到预后的影像特征,有潜力作为生物可解释的影像学标记物。

进一步地,选取所述一阶统计特征中的最大值,最小值,平均值,绝对误差,中位数,区间差,均方误差,标准差,方差,不均匀度,峰度,偏度,能量,熵特征。

进一步地,选取所述几何形状特征中的表面积,体积,最大直径,压缩比1,压缩比2,椭球度,圆球度,表面积与体积比,浑圆度特征。

进一步地,选取所述纹理特征中的子类特征共生矩阵、灰度游程矩阵、灰度级区域矩阵和邻域灰度差分矩阵特征。

进一步地,选取所述共生矩阵中的自相关,对比度,相关1,相关2,集群突,聚类萌,集群趋势,不相似性,能量,熵,均匀性1,均匀性2,最大概率,平方和,平均数,和方差,和熵,差方差,方差,差熵,相关信息测度1,相关信息测度2,逆方差,逆差归一化,逆差矩归一化特征。

进一步地,选取所述灰度游程矩阵中的短游程增强,长游程增强,灰度级不均匀度,游程不均匀度,游程比例,低灰度级游程增强,高灰度级游程增强,短游程低灰度级增强,短游程高灰度级增强,长游程低灰度级增强,长游程高灰度级增强,灰度级方差,游程方差特征。

进一步地,选取所述灰度级区域矩阵中的小区域增强,大区域增强,灰度级不均匀度,区域大小不均匀度,区域比例,低灰度级区域增强,高灰度级区域增强,小区域低灰度级增强,小区域高灰度级增强,大区域低灰度级增强,大区域高灰度级增强,灰度级方差,区域大小方差特征。

进一步地,选取所述邻域灰度差分矩阵中的粗糙度,对比度,繁忙度,复杂度,强度特征。

进一步地,选取所述小波特征中的一阶统计特征和纹理特征;具体包括xlll*(70)、xllh*(70)、xlhl*(70)、xlhh*(70)、xhll*(70)、xhll*(70)、xhhl*(70)、xhhh*(70),其中,*号代表小波分解量在x,y,z上的高频(h)或低频分量(l)。

优选地,其中xhlh分量,为x,z方向上高频,在y方向上低频的分量,该分量小波分解公式为nh代表滤波高通滤波的长度,nl代表低通滤波的长度;小波特征是基于小波分量上提取的一阶统计特征和纹理特征。

附图说明

图1为基于基因影像学的肿瘤影像标记物提取方法的流程图。

表1为影像特征的组合。

具体实施方式

结合说明书附图说明本发明的具体实施方式。

如图1所示的基于基因影像学的肿瘤影像标记物提取方法的流程图,本发明的一种基于基因影像学的影像学标记物提取方法首先获取肿瘤ct数据,然后进行肿瘤ct影像分析,获取得到的影像特征与预后的基因模块进行spearman关联,得到基因影像关联热图,根据上述过程所得关联热图和选取的关联影像特征,进行生存分析评估,得到一种生物学可解释的影像学标记物。

上述预后的基因模块通过以下步骤获得,首先基因表达数据进行基因组分析和模块聚类,进一步地,基因模块通过生存分析得到预后的基因模块。

如表1所示的影像特征的组合,结合图1所示的基于基因影像学的肿瘤影像标记物提取方法,进而得到一种基于基因影像学的肿瘤影像标记物提取方法,具体实现过程如下:

1)根据肿瘤ct影像,放射科医师手动或自动分割算法勾画肿瘤区域。针对肿瘤区域,计算4组共639个特征,分别为一阶统计特征,几何形状特征,纹理特征以及小波特征,如表1所示。为了去冗余,选取最有代表性的特征,根据一致性指数标准,选取每组中ci值最大的3个特征;

表1影像特征的组合

*代表小波分解量在x,y,z上的高频(h)或低频分量(l),例如xhlh分量,为x,z方向上高频,在y方向上低频的分量,该分量小波分解公式为nh代表滤波高通滤波的长度,nl代表低通滤波的长度;小波特征是基于小波分量上提取的一阶统计特征和纹理特征。

2)基因表达数据的处理分为三步。第一步,预处理,若某个基因表达值为0的样本个数超过10或所有样本的平均表达值小于8,则该基因剔除,对筛选后的基因表达值进行对数和标准化处理;第二步,基因模块聚类,对基因表达值进行权重共表达网络分析(weightedgeneco-expressionnetworkanalysis,wgcna),将基因表达值自动聚类成若干个基因模块,用每个基因模块的主成分代表该基因模块;第三步,对基因模块进行生存分析,按照p<0.05标准,筛选出具有显著预后的基因模块;

3)利用spearman相关法,将筛选后的影像特征和基因模块做关联热图,得到每个影像特征与基因模块的相关系数和p值;

4)在基因影像关联热图中,按照p<0.05标准,筛选出显著的基因-影像关联对,对关联对中出现的影像特征做生存分析评估,得到预后的影像特征,有潜力作为生物可解释的影像学标记物。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1