一种基于UNET的宫颈病理组织分割方法与流程

文档序号:21699848发布日期:2020-07-31 23:03阅读:280来源:国知局
一种基于UNET的宫颈病理组织分割方法与流程

本发明涉及医学图像分割技术领域,具体为一种基于unet的宫颈病理组织分割方法。



背景技术:

宫颈组织活检是宫颈疾病确诊的最后一个环节,在过去一直由病理专家人工观察后给出最终诊断意见,受专家技术经验和主观性的影响,诊断结果的正确性有待提高。随着数字化显微成像技术的成熟和人工智能的新进展,用计算机去分析样本切片,辅助医生进行确诊,减轻医生的工作负担是大势所趋。

目前,国际上对宫颈组织病理数字图像的全自动分析主要通过传统的机器学习来实现,具体地是先通过灰度共生矩阵、k-均值聚或支持向量机svm等算法模型分割出鳞状上皮,然后运用图论技术找到中轴线,通过旋转、变形使鳞状上皮呈长方形且中轴线水平放置,再沿垂直于中轴承线的方向将鳞状上皮切成10片,每片等分成三部分,分别提取诸如细胞核密度、细胞核形状、细胞核大小等特征,用svm根据精心设计的特征识别为正常、cin1、cin2和cin3中的一种,然后通过表决算法综合出整个上皮的类别。近年来随着深度学习在机器视觉领域的飞跃发展,也有个别学者尝试对每个小切片用卷积神经网络来识别,即将每个小切片三等分,分别用三个独立训练的卷积神经网络对30x30大小的方块进行识别。

对于超大图像,上述方法因处理时间过长,至今仍无法用于临床实践。



技术实现要素:

本发明的目的在于提供一种基于unet的宫颈病理组织分割方法,以解决上述技术背景中提出的问题。为实现上述目的,本发明提供如下技术方案:一种基于unet的宫颈病理组织分割方法,包括扫描拼接、降噪、区域划分、unet模型训练及辅助诊断五个步骤,其步骤如下:

步骤一、扫描拼接:用光学显微镜扫描样本涂片,然后将生成的视野图像拼接成一个全景图ic;

步骤二、降噪:对ic做降噪预处理;

步骤三、区域划分:将ic中的每个感兴趣独立前景区域ai提取出来,保存ai及其在ic中的相对位置;

步骤四、unet模型训练:统计所有样本中的ai,按6:2:2的比例随机分配到训练集、验证集和测试集中,然后传递给unet模型进行学习,最终获得可靠分割模型m;

步骤五、辅助诊断:将模型m应用于临床,辅助病理医生诊断宫颈疾病。

进一步,所述步骤一的具体方法是在10x显微物镜下,对每个样本进行全片自动扫描与拼接,生成分辨率可变的逻辑全景图ic,其宽度取值范围为30000~40000像素,高度取值范围为20000~30000像素。

进一步,所述步骤二的具体方法是对ic依次进行模糊和锐化操作,用以去除制片染色过程中产生的部分噪声。

进一步,所述步骤三的具体方法还包括如下步骤:

a、对ic的行和列进行1/32下采样,生成低分辨率全景图if,并将其灰度化为ig;

b、以背景灰度均值为阈值从ig提取轮廓,采用平均灰度计算图像的二值化阈值,利用二值化阈值t对图像进行前景和背景分割,获得标记图,并提取相应的区域轮廓;阈值分割公式如下:

其中f(x,y)为灰度图像,g(x,y)为阈值运算后得二值图像;

c、计算ig中每个轮廓的面积,长度和宽度,采用阈值法去除面积、长度或宽度较小的干扰轮廓,保留感兴趣轮廓;首先对g(x,y)进行贴标签每一个不同的标签代表不同的连通域,然后统计每一个连通域的面积,第k个连通域面积sk的计算公式如下:

其中,l为连通域的个数,为第k个连通域

之后消除面积小于预设阈值area的连通域,小面积连通域消除处理的计算公式如下:

d、为每个轮廓生成一个蒙版,利用蒙版从ic中提取待处理区域ai并记录每个ai在全景图中的绝对位置pi。第k个轮廓蒙版mk的提取公式如下:

第k个图像区域ak的提取公式如下:

ak=ic*mk

e、对不同的区域以并行的方式进行处理。设一个样本通过本发明生成n个区域,43可并行工作的处理核有m个,若以串行方式处理if所需时间为t,则理想情况下并行处理所需时间可缩短为t/m

进一步,所述步骤四的具体方法包括如下步骤:

①对已经标注好的训练集中的每个ai,增加一个通道存放标注数据,原始数据有红、绿、蓝三个彩色通道,通过本步骤处理之后增加一个黄色表示的标注数据通道;

②对经上一步处理后的每个ai,分别通过仿射变换、相似变换和刚体变换进行数据增强,得到数据集di

仿射变换计算式为:

其中

相似变换的计算式为:

其中刚体变换的计算式为:

其中

③unet网络以并行方式接收并学习每个di所包含的特征数据,循环进行50轮次迭代训练,生成最终的诊断模型m;训练前网络各层参数的初化化计算式为:

其中nl-1为前一网络层参数个数,训练时将上一步得到的所有训练样本的di经归一化后做为输入数据,经50轮迭代后完成首训,通过验证集和测试集的运行结果决定是否需要继续训练和优化。

进一步,所述步骤五的具体方法包括如下步骤:

步骤1、将样本涂片放入载物台,依次自动执行权利要求1中的步骤一、二和三,得到n个感兴趣区域图像{ai|0<i<n},将每个ai做为输入让模型m处理,然后保存生成的分割类别和轮廓信息;

步骤2、在if中用绿色描绘每个ai中的正常组织轮廓,黄色描绘低级别病变组强织轮廓,橙红描绘高级别病变组织轮廓,色描绘癌变组织轮廓;

步骤3、将ir显示在屏幕上,供病理医生参考,当使用者点击放大时,依据放大倍数k对ic进按行、列分别进行k/2下采样,生成ik,然后依照ir和ik的放大倍率关系计算每个分割结果轮廓在ik中的对应坐标并按同样的类别颜色描绘及显示。

本发明和以前的技术相比,具有如下优点和显著优势:

本发明应用unet(一种采用深度自动编码解码结构的卷积神经网络模型)有效地解决宫颈组织病理数字图像智能分析领域普遍存在的样本数量少、样本规范性差、样本处理实时性差等阻碍临床应用的问题。该方法还可以帮助医生快速、精确地标识出病变组织并给出辅助诊断建议,既极大地减轻了病理医生的工作负担,又显著降低了检测成本,具有巨大的经济利益和社会效益。

附图说明

图1是本发明一种基于unet的宫颈病理组织分割方法总体流程图;

图2是本发明图像数据与标注数据通道叠加示意图;

图3是本发明unet结构图;

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图(1-3),本发明提供如下技术方案:一种新型的脱落上皮细胞重叠分割方法,包括扫描拼接、降噪、区域划分、unet模型训练及辅助诊断五个步骤,其步骤如下:

步骤一、扫描拼接:先将光学显微镜调节到10倍物镜下对所有已标注过的样本涂片进行全片扫描,每个样本的视野图像数量在4000~6000之间。用自定义的拼接程序对每个样本的视野图像进行拼接,生成分辨率可变的逻辑全景图ic并在物理上分散存储,逻辑全景图的尺寸由合格涂片样本大小决定,约束宽度m取值范围为30000~40000像素,高度取值范围为20000~30000像素。

步骤二、降噪:对ic做降噪预处理;

对逻辑全景图ic先用3*3卷积核进行均值模糊,消除拼接过程引起的突变或拼接缝隙,然后用拉普拉斯算子做锐化处理,涂片上各独立区域、各组织之间的边缘更加清晰。均值模糊的计算式为拉普拉斯算子计算式为:

步骤三、区域划分:将ic中的每个感兴趣独立前景区域ai提取出来,保存ai及其在ic中的相对位置;每个样本景图ic存在多个独立的前景区域,如果顺序地对全景图逐像素处理,速度极其缓慢。本发明采用并行处理方式加快处理速度,具体地:

a、对ic的行和列进行1/32下采样,生成低分辨率全景图if,并将其灰度化为ig;

b、以背景灰度均值为阈值从ig提取轮廓,采用平均灰度计算图像的二值化阈值,利用二值化阈值t对图像进行前景和背景分割,获得标记图,并提取相应的区域轮廓;阈值分割公式如下:

其中f(x,y)为灰度图像,g(x,y)为阈值运算后得二值图像;

c、计算ig中每个轮廓的面积,长度和宽度,采用阈值法去除面积、长度或宽度较小的干扰轮廓,保留感兴趣轮廓;首先对g(x,y)进行贴标签每一个不同的标签代表不同的连通域,然后统计每一个连通域的面积,第k个连通域面积sk的计算公式如下:

其中,l为连通域的个数,为第k个连通域

之后消除面积小于预设阈值area的连通域,小面积连通域消除处理的计算公式如下:

d、为每个轮廓生成一个蒙版,利用蒙版从ic中提取待处理区域ai并记录每个ai在全景图中的绝对位置pi。第k个轮廓蒙版mk的提取公式如下:

第k个图像区域ak的提取公式如下:

ak=ic*mk

e、对不同的区域以并行的方式进行处理。设一个样本通过本发明生成n个区域,43可并行工作的处理核有m个,若以串行方式处理if所需时间为t,则理想情况下并行处理所需时间可缩短为t/m

步骤四、unet模型训练:统计所有样本中的ai,按6:2:2的比例随机分配到训练集、验证集和测试集中,然后传递给unet模型进行学习,最终获得可靠分割模型m;其步骤还包括:

①对已经标注好的训练集中的每个ai,增加一个通道存放标注数据,如图2所示:原始数据有红、绿、蓝三个彩色通道,通过本步骤处理之后增加一个黄色表示的标注数据通道;

②对经上一步处理后的每个ai,分别通过仿射变换、相似变换和刚体变换进行数据增强,得到数据集di

仿射变换计算式为:

其中

相似变换的计算式为:

其中刚体变换的计算式为:

其中

③unet网络以并行方式接收并学习每个di所包含的特征数据,循环进行50轮次迭代训练,生成最终的诊断模型m。unet网络模型结构如图3所示,由右箭头指向的收缩路径和左箭头指向的扩展路经构成,其中收缩路径完成分类功能,扩展路径完成最终的按类分割及定位功能。图中下三角形代表图像大小适配操作,使unet网络适应不同分辨率的图像;上三角形代表对分割结果进行孔洞填充等后处理操作;竖实线代表3*3卷积运算;短矩形代表maxpooling下采样操作;长矩形代表上采样操作。训练前网络各层参数的初化化计算式为:

其中nl-1为前一网络层参数个数,训练时将上一步得到的所有训练样本的di经归一化后做为输入数据,经50轮迭代后完成首训,通过验证集和测试集的运行结果决定是否需要继续训练和优化。

步骤五、辅助诊断:将模型m应用于临床,辅助病理医生诊断宫颈疾病。具体包括以下步骤:

步骤1、对每个由宫颈细胞学筛查发现的疑似病例,进一步做宫颈病理组织涂片检查。对每个待检宫颈病理组织涂片,将样本涂片放入载物台,依次自动执行扫描拼接、降噪、区域划分三个预处理操,得到n个感兴趣区域图像{ai|0<i<n},将每个ai做为输入让模型m进行分割识别处理,得到的病变组织的类别、轮廓、位置等信息连同数据一起形成if,然后保存生成的分割类别和轮廓信息;

步骤2、在if中用绿色描绘每个ai中的正常组织轮廓,黄色描绘低级别病变组强织轮廓,橙红描绘高级别病变组织轮廓,色描绘癌变组织轮廓;

步骤3、将ir以可以缩放的形式连同诊断结果显示屏幕上,供病理医生参考,当使用者点击放大时,依据放大倍数k对ic进按行、列分别进行k/2下采样,生成ik,然后依照ir和ik的放大倍率关系计算每个分割结果轮廓在ik中的对应坐标并按同样的类别颜色描绘及显示。

最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1