一种肠道图像的识别方法及终端设备

文档序号:24652618发布日期:2021-04-13 20:23阅读:107来源:国知局
一种肠道图像的识别方法及终端设备

1.本发明涉及图像识别技术领域,尤其涉及一种肠道图像的识别方法、 计算机可读存储介质及终端设备。


背景技术:

2.目前对肠道图像的识别,尤其是肠壁纤维化程度的识别,存在着识别 结果不准确,耗时较久的问题。
3.因此,如何准确对肠道的肠壁纤维化程度进行识别是亟需解决的问 题。


技术实现要素:

4.鉴于上述现有技术的不足,本发明的目的在于提供一种肠道图像的识 别方法、计算机可读存储介质及终端设备,旨在准确识别出肠道的肠壁纤 维化程度。
5.本发明实施例第一方面,提供了一种肠道图像的识别方法,所述方法 包括如下步骤:
6.获取肠道ct扫描图像,从所述肠道ct扫描图像中提取影像组学特征;
7.将所述影像组学特征输入预先训练好的识别模型中进行计算,得到肠 壁纤维化程度识别结果;其中,所述识别模型通过多个肠道ct扫描图像对 应的影像组学特征训练得到。
8.本发明实施例第二方面,提供了一种计算机可读存储介质,所述计算 机可读存储介质存储有肠道图像识别程序,所述肠道图像识别程序被处理 器执行时,以实现如上所述的肠道图像的识别方法中的步骤。
9.本发明实施例第三方面提供了一种终端设备,所述终端设备包括处理 器、存储器以及存储在所述存储器中并可在所述处理器上执行的肠道图像 识别程序,所述处理器执行所述肠道图像识别程序时实现如上所述的肠道 图像的识别方法中的步骤。
10.有益效果:本发明提供一种肠道图像的识别方法,通过将待识别肠道 ct扫描图像,并从所述待识别肠道ct扫描图像中提取影像组学特征,然后 将该影像组学特征输入预先训练好的识别模型中,从而得到肠道的肠壁纤 维化程度识别结果。由于识别模型是通过机器学习构建得到,具有识别准 确率高的特点。
附图说明
11.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述 中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅 是本发明的一些实施例,对于本领域普通技术人员而言,在不符创造性劳 动的前提下,还可以根据这些附图获得其他的附图。
12.图1为本发明实施例提供的一种肠道图像的识别方法流程图;
13.图2为本发明实施例提供的一种肠道图像识别系统总体流程图;
14.图3为本发明实施例提供的二分类模型架构图;
15.图4本发明实施例提供的特征选择流程图;
16.图5本发明实施例提供的通过十折交叉验证确定α最佳参数值;其中, 横轴为不同的α值(log),纵轴表示该α值对应的每一折lasso回归模型 的mse(虚线)以及十折mse的均值(黑色实线),竖虚线表示十折均方差 均值的最小值所对应的α值为77.09;
17.图6本发明实施例提供的不同超参数下lasso特征权重系数变化,黑 色虚线表示α=77.09时,权重系数不为零的影像组学特征有4个;
18.图7为传统影像组学特征选择前聚类热图;
19.图8本发明实施例提供的为影像组学特征选择后的聚类热图;
20.图9为本发明实施例提供的终端设备结构原理图。
具体实施方式
21.为了便于理解本发明,下面将参照相关附图对本发明进行更全面的描 述。附图中给出了本发明的较佳实施方式。但是,本发明可以以许多不同 的形式来实现,并不限于本文所描述的实施方式。相反地,提供这些实施 方式的目的是使对本发明的公开内容理解的更加透彻全面。
22.除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的 技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所 使用的术语只是为了描述具体的实施方式的目的,不是旨在于限制本发明。
23.目前对肠道ct扫描图像的识别还主要是依赖于人工进行,人工读片的 方法费时费力,效率极低。人工读片更多的是依赖个人经验,所读取的结 果往往存在着一定的偏差,不能准确的将肠道ct扫描图像所包含的特征读 取出来。
24.基于此,本发明提供一种能够解决上述技术问题的方案,其详细内容 将在后续实施例中得以阐述。
25.请参阅图1至图3,图1为本发明实施例提供的一种肠道图像的识别方 法流程图。方法包括:
26.s10、获取待识别肠道ct扫描图像,从所述待识别肠道ct扫描图像中 提取影像组学特征。
27.具体来说,对待识别肠道ct扫描图像的获取可以是在肠道ct扫描图 像上勾画出目标肠段的精细轮廓作为感兴趣区域(region of interest, roi),从所述roi中提取出影像组学特征。需要说明的是,影像组学是一 种新兴的评估组织异质性的图像处理手段,可以从图像中高通量提取高维 度特征信息,具有客观准确、省时省力等优点。在本实施例中,待识别肠 道ct扫描图像的获取还可以是通过训练后的图像获取模型识别得到。即, 通过机器学习构建一个图像识别模型,该模型通过训练后能够从肠道ct 扫描图像中识别出roi。
28.在本实施例中,所述影像组学特征包括强度特征、纹理特征、形状特 征及变换特征。其中,所述强度特征是通过描述roi内的单个体素值与整 体灰度分布计算而来。本发明提取的强度特征可进一步分为直接强度特征 与强度直方图特征两类,前者侧重描述单个体素信息,包括如灰度均值、 方差、熵、能量等;后者对全局灰度直方图分布进行描述,包括
如峰度系 数(kurtosis)与偏态系数(skewness)等特征。强度特征可以反映灰度 分布的整体信息,但存在丢失空间分布信息、缺乏量化标准、稳定性较差 等缺点。
29.所述纹理特征源于计算机视觉领域,通过定量描述体素信息的空间相 关性及其分布,表征病灶的异质性。根据体素个数可以把纹理特征分为二 阶(second

order)与高阶纹理特征(higher

order)两类,前者计算两 个体素的空间关系,后者评估三个及更多体素之间的相关信息。本实施例 同时提取了二阶与高阶纹理特征,其中二阶特征包括:灰度共生矩阵 (gray

level co

occurrence matrix,glcm)可以描述具有相同或接近 灰度的两个体素之间的位置分布;灰度游程矩阵(gray

level run

lengthmatrix,glrlm)则描述具有相同灰度的体素在某个方向上的排列特性。 高阶纹理特征包括:灰度区域大小矩阵(gray

level size zone matrix, glszm)描述具有相同灰度的体素在某个区域内的连接特性;空间灰度相 关矩阵(spatial gray

level dependence matrix,sgldm)则描述体素 与一定范围内具有相同灰度值的其他连接体素的相关性;邻域灰度差矩阵 (neighborhood gray

tone difference matrix,ngtdm)可以描述某区 域中心体素与邻域体素均值的灰度差;邻域灰度差统计(neighborhoodgray

level difference statistics,nglds)描述体素与邻域体素差值 的统计分布信息。
30.所述形状特征可以定量描述目标图像整体特性与评估空间复杂性,是 最常见的影像信息之一。根据roi维度,形状特征可分为二维(2d)与三 维(3d)形状信息,且大多数3d形状特征是2d形状特征的扩展。例如, roi为2d切面时,从中可提取的形状信息包括面积、周长、最大直径等; 而roi是3d物体时,形状特征可拓展为体积、表面积、最大三维直径等。 本实施例提取的形状信息为三维形状特征。
31.ct扫描图像属于医学类图像,医学图像的本质是沿空间坐标分布的 灰度值,往往反映的是空域的强度信息。通过图像变换可以在不丢失任何 信息的情况下把空域信息转换为其他信息,如频域信息,而变换后获得的 影像组学特征称为变换特征。常用的图像变换方法包括:傅里叶(fourier) 变换、gabor变换与小波(wavelet)变换。本实施例基于小波变换提取 cd患者的影像组学变换特征。小波变换是在傅里叶变换与gabor变换的 基础上发展而来,通过小波基分解可以多分辨率、自适应分析图像的强度 与纹理特征,具有良好的空

频域局部化分析能力,被广泛用于描述病灶 的异常频率或空间成分。小波基的选取是小波变换的重点,本研究选择了 较为常见的三种小波基进行小波变换,分别为daubechies小波,coiflets 小波与symlets小波。
32.作为举例,基于每一目标肠道的ct扫描图像及其对应的roi,共提取 1454个影像组学特征,其中包括37个强度特征、106个纹理特征、24个 形状特征以及1287个变换特征。特征提取的详细介绍如表1所示。
33.表1.基于ct图像提取的影像组学特征
[0034][0035]
s20、将所述影像组学特征输入预先训练好的识别模型中进行计算,得 到肠道肠壁纤维化程度识别结果;其中,所述识别模型通过多个肠道ct扫 描图像对应的影像组学特征训练得到。
[0036]
在本实施例中,所述识别模型为基于影像学组特征建立的逻辑斯蒂回 归模型(logistic regression,lr)。lr是参数化的逻辑斯蒂分布,通过 计算条件概率p(y=1|x),即给定数据x识别为正样本(y=1)的概率实 现二分类任务。根据贝叶斯公式,条件概率分布p(y=1|x)可以如公式2 表示,其中,x∈r
n
是模型输入,y∈{0,1}是模型输出,ω∈r
n
和b∈r分别 是权重系数向量和偏置系数。lr的分类问题往往可以通过极大似然估计法 (maximum likelihood)转换为以对数似然函数为目标函数的最优化问题, 并使用梯度下降法来估计lr模型权重系数与偏置系数。
[0037][0038]
lr的优点是训练速度快,可以使用离散或连续变量作为模型输入。
[0039]
在本实施例的一种实施方式中,对识别模型的训练方法包括如下步骤:
[0040]
s1、获取多个样本肠道ct扫描图像及肠道肠壁的纤维化程度。
[0041]
具体来说,可以是由具有多年评估肠道肠壁纤维化程度经验的用户对 肠道ct扫描图像进行独立半定量纤维化评分,包括0

4分。根据评分,把 肠道图像分为无

轻度纤维化(0

2分)与中

重度纤维化(3

4分)两类, 作为金标准。
[0042]
s2、分别对每个样本肠道ct扫描图像进行特征提,得到所述样本肠道 对应的影像组学特征及纤维化程度,并将所述影像组学特征及纤维化程度 作为对应所述样本肠道的训练样本;其中,所述纤维化程度包括无

轻度纤 维化与中

重度纤维化;将各个样本肠道对应的训练样本作为所述识别模型 的训练样本集。
[0043]
具体来说,对每一个样本肠道ct扫描图像进行定位勾画出目标肠段的 轮廓作为roi,从中提取出影像组学特征如强度特征、纹理特征、变换特征 等。同时,评价出纤维化程度,如属于中

重度纤维化、轻度纤维化等。将 所得到的每一样本肠道ct扫描图像的影像组学特征及纤维化程度进行组 合,形成该样本的训练样本。
[0044]
s3、基于训练样本集,结合留一法交叉验证与网格寻优法得到所述识 别模型的最优参数。需要说明的是,本实施例中,所述识别模型为逻辑斯 蒂回归模型,所述逻辑斯蒂回归模型符合概率分布为
[0045]
其中,x∈rn是模型 输入,y∈{0,1}是模型输出,ω∈rn和b∈r分别是权重系数向量和偏置系 数。
[0046]
s4、将计算到的所述最优参数代入所述识别模型中,得到所述训练好 的识别模型。
[0047]
具体来说,根据逻辑斯蒂回归模型的表达式,确定出相应的似然函数, 然后对其取对数,得到对数似然函数。针对对数似然函数,对其求偏导并 以步骤s3得到的训练样本集合作为对数似然函数的求偏导的函数的输入, 通过梯度上升法进行迭代计算,从而求得逻辑斯蒂回归模型的最优参数, 即求得最优的ω。
[0048]
在本实施例中,可以将所述训练样本集中的所有训练样本分成十折, 其中的一折作为测试集,其余九折作为训练集;
[0049]
采用lilliefors检验与levene检验对训练集中的每一个影像组学特 征进行正态性检验与方差齐次性检验,若不符合正态分布,则采用 mann

whitney u检验分析特征在无

轻度与中

重度纤维化组间的统计学差 异;若符合正态分布但非方差齐次,选择welch’s t检验;若符合正态分 布且方差齐次,选择student’s t检验,得到具有统计学意义的影像组学 特征;
[0050]
采用lasso(least absolute shrinkage and selection operator) 模型对所述具有统计学意义的影像组学特征进行筛选,得到与分类相关的 影像组学特征,在所述测试集中保留相同的影像组学特征;
[0051]
基于所述与分类相关的影像组学特征与十折交叉验证进行逻辑斯蒂回 归模型最
优参数的网格寻优,得到最优参数。
[0052]
具体来说,将所述最优参数代入所述识别模型,重新基于所述训练样 本集中的所有训练样本对所述识别模型进行训练;
[0053]
将所述训练样本集中的每个训练样本,作为其余训练样本的测试集, 用于训练模型测试,得到全部训练样本的识别概率;
[0054]
基于所述识别概率,使用roc曲线和roc曲线下面积auc评估所述识 别模型,根据评估结果得到训练好的所述识别模型。
[0055]
在本实施例的一种实施方式中,由于所提取的影像组学特征维度较大 (如表1中的1454维),且其中包含大量冗余或高度相关的特征,这些特 征不能提供有效信息却显著增加了矩阵维数,容易造成“梯度爆炸”或“维 度灾难”;同时,特征的区分能力取决于任务,所提取的很多特征可能与建 模任务无关,因此,为特定任务选择最佳子集,减少无关特征数量,可以 显著提高模型性能。
[0056]
在本实施例中,对特征的选择方法可以包括单因素分析、最小绝对收 缩和选择算子lasso。
[0057]
单因素分析,采用lilliefors检验与levene检验对每一个特征进行 正态性检验与方差齐次性检验,若不符合正态分布,则采用mann

whitney u 检验分析特征在无

轻度与中

重度纤维化组间的统计学差异;若符合正态 分布但非方差齐次,则选择welch’s t检验;其余特征进行student’s t 检验分析统计学差异。具有显著性差异的特征可认为与分类任务显著相关, 纳入下一步分析。
[0058]
lasso是一种基于回归模型的特定筛选方法,可以构建线性回归模型, 通过在目标函数中添加l1正则项,使回归函数中部分特征的权重系数趋于 或等于零,从而实现特征选择。lasso目标函数如公式1所示,其中x为输 入,y为输出,ω为回归模型的权重系数向量,||ω||1是系数向量的l1 范数,α为可调节比例参数,通过调节α可以控制最终筛选的特征个数。
[0059][0060]
在本实施例中,使用十折交叉验证方法完成基于训练样本集的lasso 参数α的网格寻优,即,可以将训练样本数据分为10折,其中9折用于构 建lasso回归模型,剩余1折用于评估lasso回归模型性能,选择的评价 指标为均方误差(mean square error,mse)。在每一折遍历参数α候补值, 计算每一个α值对应的十折lasso回归模型的mse均值,其中mse均值最 小时对应的α值可认为是最佳α参数值。随后将最佳α参数值应用于完整 训练样本集数据,训练lasso回归模型,其中模型中非零权重参数的个数 就是筛选后的特征个数。举例来说,如图4所示,结合表1中所提取的影 像组学特征(1454维),设定显著性水平为0.1,即显著性水平低于0.1时, 认为正负样本所得到的统一特征结果具有显著统计学差异,保留该特征。 结果得到正、负样本间差异具有统计学意义的影像组学特征共有127个 (8.7%),剔除了1327个(91.3%)影像组学特征。
[0061]
然后,采用lasso方法对剩余127个影像组学特征进行进一步的筛选。如 图5至图6所示,通过网格寻优与十折交叉验证,可以确定lasso回归模 型最佳超参数α=77.09。此时,lasso回归函数权重系数不为零的特征个 数为4个,即最终筛选出4个最有价值的影像
组学特征。这4个特征分别 为4个图像(原始图像、压缩比为0.5的coiflets小波变换图像以及压缩 比分别为0.5和1.5的daubechies小波变换图像)基于邻域灰度差矩阵 (ngtdm)的忙碌度特征。忙碌度衡量的是像素与其相邻像素空间频率变化 的强度,忙碌度高表示该像素与相邻像素之间的强度发生快速变化。
[0062]
采用聚类分析热图(heatmap)对特征筛选前、后的影像组学特征进行数 据可视化分析,结果如图7至图8所示。在特征选择前,基于1454维特征 进行无监督聚类,可以准确判断98例样本中41例样本的情况;而经过单 因素分析与lasso回归等特征选择方法,基于4维特征进行无监督聚类, 可以准确区分出52例样本。可见影像组学特征具有一定的表征cd肠壁纤 维化能力,而经过特征选择,剔除了无关或冗余特征,可以基于更少的特 征数量实现更好的区分效果。
[0063]
基于上述的肠道图像的识别方法,本发明还提供一种计算机可读存储 介质,计算机可读存储介质存储肠道图像识别程序,所述肠道图像识别程 序被处理器执行时,以实现如上所述的肠道图像的识别方法中的步骤。。
[0064]
基于上述的肠道图像的识别方法,本发明还提供一种终端设备,如图9 所示,其包括至少一个处理器(processor)30以及存储器(memory)31, 还可以包括通信接口(communicationsinterface)32和总线33。其中, 处理器30、存储器31和通信接口32可以通过总线33完成相互间的通信。 通信接口32可以传输信息。处理器30可以调用存储器31中的逻辑指令, 以执行上述实施例中的方法。此外,上述的存储器31中的逻辑指令可以通 过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在 一个可读取存储介质中。存储器31作为一种可读存储介质,可设置为存储 软件程序,如本发明实施例中的方法对应的程序指令或模块。处理器30通 过运行存储在存储器31中的软件程序、指令或模块,从而执行功能应用 以及数据处理,即实现上述实施例中的方法。存储器31可包括存储程序区 和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的 应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存 储器31可以包括高速随机存取存储器,还可以包括非易失性存储器。例如, u盘、移动硬盘、只读存储器(read

onlymemory,rom)、随机存取存储器 (random access memory,ram)、磁碟或者光盘等多种可以存储程序代码的 介质,也可以是暂态存储介质。此外,上述存储介质以及终端中的多条指 令处理器加载并执行的具体过程在上述方法中已经详细说明,在这里就不 再一一陈述。
[0065]
综上,本发明提供一种肠道图像的识别方法、计算机可读存储介质以 及终端设备。通过使用逻辑斯蒂回归方法,基于影像组学特征构建肠道肠 壁纤维化识别模型。并对所述识别模型进行训练,利用训练好的识别模型 对肠道肠壁纤维化程度的准确识别,解决人工读片判断缺乏客观性、不够 准确的问题,提高肠道肠壁纤维化程度识别的精确性。
[0066]
应当理解的是,本发明的应用不限于上述的举例,对本领域普通技术 人员来说,可以根据上述说明加以改进或变换,所有这些改进和变换都应 属于本发明所附权利要求的保护范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1