一种基于CT影像组学的胰腺癌癌源性新发糖尿病预测方法与流程

文档序号:37076888发布日期:2024-02-20 21:31阅读:10来源:国知局
一种基于CT影像组学的胰腺癌癌源性新发糖尿病预测方法与流程

本发明涉及医疗,具体为一种基于ct影像组学的胰腺癌癌源性新发糖尿病预测方法。


背景技术:

1、胰腺癌起病隐匿、进展迅速、早期诊断困难。胰腺癌预后极差,现有治疗手段的效果已达到瓶颈,短期内难有突破,目前5年生存率仍仅为6%,在恶性肿瘤中最低,根据预测,2025年左右胰腺癌将超过乳腺癌成为全球第二大致死癌症。目前手术仍是患者获得根治、改善预后的唯一机会,但胰腺癌早期诊断困难,早诊率仅为5%,确诊时仅有20%左右的患者有机会接受根治性手术,其余患者则处于局部晚期或伴远处转移。因此,提高胰腺癌的早期诊断率,是目前改善胰腺癌预后最有效的方法之一。

2、近年来,胰腺癌与糖尿病关系的研究为其早期诊断提供了新的思路,研究发现30%-50%的胰腺癌患者于胰腺癌确诊前2~3年突然出现糖尿病症状,称为新发糖尿病。大约每100人新发糖尿病患者中就有1人在糖尿病确诊3年内发展为胰腺癌,有四分之一的胰腺癌患者确诊时第一次被诊断出糖尿病。新发糖尿病是区别于ⅰ型、ⅱ型和妊娠期糖尿病的一种特殊类型,是胰腺癌的早期临床表现,是胰腺癌重要的早期预警,结合散发胰腺癌发病率低、人群普筛顺应性差的特点,针对新发糖尿病患者进行筛查可以达到事半功倍的效果。影像组学作为一种新兴的方法,具有无创、无需额外费用和动态检测肿瘤的优势,所以患者依从性好、临床应用便捷,并且能反映肿瘤整体特征,为新发糖尿病患者胰腺癌早期诊断预测研究提供了新的思路,但是目前胰腺癌癌源的相关诊断工作,依旧无法快速有效的实现;鉴于此,我们提出了一种基于ct影像组学的胰腺癌癌源性新发糖尿病预测方法。


技术实现思路

1、针对现有技术的不足,本发明提供了一种基于ct影像组学的胰腺癌癌源性新发糖尿病预测方法,解决了上述背景技术提到的问题。

2、为实现以上目的,本发明通过以下技术方案予以实现:一种基于ct影像组学的胰腺癌癌源性新发糖尿病预测方法,所述预测方法包括以下步骤:

3、s1、ct图像数据获取及roi勾画,包括以下步骤:

4、s11、ct图像数据获取;

5、s12、手动roi勾画;

6、s13、自动roi勾画;

7、s2、胰腺部位图像标准化处理,通过像素标准化公式对图像进行处理,所述像素标准化公式表示如下:

8、

9、windowrange=pixel95%-pixel5%

10、根据roi分割的结果,确定ct图像中胰腺所在区域,统计所有案例中该区域的像素值的分布,取像素值个数累积占比区间为[5%,95%]的像素值作为图像的像素范围并确定相应的窗宽窗位并应用于所有的图像;

11、s3、影像组学特征提取,随后对相应的图像提取特征,包括ct扫描得到的动脉期图像与静脉期图像;

12、s4、统计分析与特征差异分析,包括:

13、获取胰腺癌患者的非肿瘤胰腺部分中nonedm与nodm的特征差异分析,分别nonedm与nodm患者的影像组学特征两两之间做t-test,保留具有显著差异(p<0.05)的特征;

14、获取腺癌患者的非肿瘤胰腺部分中糖尿病患者ltdm与nodm的ct影像数据特征差异,分别ltdm与nodm患者的影像组学特征两两之间做t-test,保留具有显著差异(p<0.05)的特征,共计691个;

15、提取胰腺癌引起的胰腺影像ct变化特征,取nonedm与nodm具有显著差异的特征以及ltdm与nodm具有显著差异的特征的交集,总共得到204个特征,用于后期进一步进行影像组学分析;

16、s5、特征分类、筛选与降维;

17、s6、建立模型;

18、s7、模型和数据的验证。

19、可选的,所述s12中手动roi勾画包括:

20、图像使用开源软件itk-snap按以下的要求进行勾画:选中正常胰腺实性成分最大层面勾画roi,注意避开周围的脂肪、血管、金属支架结构;

21、用同样的方法完成胰腺非肿瘤区域实质的3d-roi勾画以提取特征;

22、胰腺非肿瘤区域(roi)是根据胰腺的影像轮廓,由经验丰富的影像科医生手动划定,为了保证提取特征的稳定性和可重复性,将由两名具有10年以上影像诊断经验的放射科医师指导勾画。

23、可选的,所述s13中自动roi勾画包括:

24、采用基于全卷积神经网络的ct图像分割方法,其中模型分为两部分:

25、第一部分称为下采样层,包括5个模块,每个模块包含两个卷积层,一个最大池化层以及一个激活层;

26、第二部分为上采样层,包括4个模块,每个模块包含两个卷积层,一个近邻插值层以及一个激活层;

27、在图像输入上采样层之前,会先与对应大小的下采样层的输出,沿着channel维度拼接在一起,然后在输入到上采样层当中;最后一层上采样层的输出会先后输入到卷积核大小为1的卷积层以及能量函数softmax当中,以实现像素级的分类,其中每层卷积层的公式可以表示为:

28、

29、

30、其中l表示所在的层表示当前卷积层的输出,表示当前层的输入,表示卷积核,b(l)表示偏置项。

31、可选的,在下采样层中,池化层的公式可以表示如下:

32、ykij=maxxkpq(p,q)∈rij

33、其中ykij表示与第k个特征图有关的在矩形区域rij的输出;每层的激活函数可以表述如下式所示:

34、relu=max(x,0)

35、能量函数softxmax可以表示为下式所示:

36、

37、用于评估模型性能并优化模型的损失函数如下所示:

38、e=∑x∈ωw(x)log(pl(x)(x))。

39、可选的,所述s3包括:

40、图像经标准化后,输入到pyradiomics中完成影像组学特征的提取,提取影像组学特征包括统计特征,形状特征,纹理特征以及小波特征;

41、统计特征包括图像的能量,熵,最小值,最大值,均值,绝对值平均特征,总计314个特征;

42、可选的,所述形状特征包括两部分特征:

43、一部分是用于描述2d形状的2d形状特征,2d形状特征包括像素表面积,周长与面比,主轴长度在内的总共192个特征;

44、另一部分是用于描述3d形状的3d形状特征,3d形状特征包括体积大小,表面积体积比,球形度在内总共560个特征;

45、通过建立图像的多种灰度矩阵描述图像的小波特征,包括glcm,glszm,glrlm,ngtdm以及gldm。对这些矩阵计算相关的统计特征,包括autocorrelation,joint average,cluster prominence在内的总共736个特征;

46、小波特征通过对图像执行离散三维小波变换,得到8种不同的ct图像,每种图像都会分析其部分的统计特征,以及纹理特征,每次小波变换提取了1508个特征;

47、其中不同类型的小基波会有不同的变换结果,本方法采用了bior6.8,db8,rbio2.2以及sym3总共4种类型的小基波,总共提取了6032个特征。

48、可选的,所述s5进一步的包括:

49、将s4得到的204个特征做lasso分析,以达到两个目标:1)剔除对目标变量无贡献的特征;2)筛选强相关变量中对预测最具权重的特征变量;所述lasso的数学表达式如下:

50、

51、可选的,所述s6进一步的包括:

52、依据所得到的强相关影像组学变量,按以下步骤构建针对糖尿病患者的早期胰腺癌预测模型:

53、s61、数据准备,按照s5得到的特征,提取nodm与t2dm中对应的特征按照一比一的比例混合;

54、s62、模型训练,利用sckit-learn构建随机森林模型,并将数据集按照1:4的比例分为测试集与训练集,将训练集输入到模型中训练,测试集则用于评估模型的性能。

55、本发明提供了一种基于ct影像组学的胰腺癌癌源性新发糖尿病预测方法。具备以下有益效果:

56、该基于ct影像组学的胰腺癌癌源性新发糖尿病预测方法,可以较准确和客观对胰腺癌癌源性新发糖尿病与2型糖尿病进行鉴别,为临床医生提供额外的诊断信息,在无肉眼可见病灶的ct胰腺图像中识别胰腺癌风险,从而实现在所有新发糖尿病人群中早期识别胰腺癌癌源性新发糖尿病患者,实现胰腺癌的早期个体化诊断和风险预测。流程包括:获取病患待识别ct胰腺区域图像;输入待识别ct胰腺区域图像至胰腺癌癌源性新发糖尿病识别模型,胰腺癌癌源性新发糖尿病识别模型对待识别ct胰腺区域图像进行定性分析操作,获得待识别ct胰腺区域图像的定性分析结果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1