一种癌症数字病理细胞图像的分类方法及系统与流程

文档序号:11865410阅读:381来源:国知局
一种癌症数字病理细胞图像的分类方法及系统与流程

本发明涉及医学图像处理技术领域,特别涉及一种癌症数字病理细胞图像的分类方法及系统。



背景技术:

乳腺癌是当今社会中女性的一种常见的恶性肿瘤。根据世界卫生组织(WHO)2014年2月份最新发布《世界癌症报告》中公示最新统计数据显示,2012年,乳腺癌是全球三大癌症之一(肺癌、乳癌、大肠癌),占所有癌症比例的25%,位居第二位。因此,如何对乳腺癌进行更加有效的预防、诊断和治疗,从而减少乳腺癌对人类的侵害,成为当今医学界中一个十分重要的课题。

免疫组织化学方法具有灵敏度高、特异性强等优点,目前已经被广泛应用于病理学、神经解剖等医学的基础研究和临床检查中,已经成为一种非常重要的科研和临床手段,但是如何利用细胞图像信息定量的判别肿瘤的良恶性和恶性等级情况的划分依然是一个极具挑战性的课题。

由于细胞图像的复杂性,主要依赖人工阅片,由于医生肉眼观察,从数目众多的细胞中寻找若干病变细胞。长时间的高强度观察工作极易使得医生疲劳,而且读片要求医生具有丰富的临床经验和全面的病理分析专业知识。目前出现了一些借助于计算机辅助诊断方法来提高诊断的灵敏性和特异性,虽然国内外学者对基于免疫组化显微镜的癌症细胞的定量诊断和评估技术做了大量研究工作,并取得了一定的进展,但是由于乳腺细胞切片的制片和染色方式的差异、背景的复杂性、细胞形态的多样性和不规则性等诸多问题,需要大量的样本训练,因而从时间上无法高效的获取分类的结果,从判别的准确性方面,现阶段的特征提取的方法,也无法使得分类结果具有较高的准确度。



技术实现要素:

有鉴于此,有必要提供一种提升细胞分类速度以及准确度的癌症数字病理细胞图像的分类方法。

为实现上述目的,本申请采用下述技术方案:

一种癌症数字病理细胞图像的分类方法,包括下述步骤:

获取感兴趣的疑似病变区域;

对所述疑似病变区域进行分块处理;

利用局部匹配模式纹理特征对分块处理后的所述疑似病变区域进行特征提取;及

采用极限学习机训练法对提取的特征进行分类判别,以确定肿瘤的良恶性以及等级划分。

在一些实施例中,其中,获取感兴趣的疑似病变区域,具体为:利用颜色分布信息方法获取感兴趣的疑似病变区域。

在一些实施例中,对所述疑似病变区域进行分块处理,具体为:对所述疑似病变区域采用聚类算法快速统计出癌细胞分布密度和趋势,分离得到细胞区域并进行分块处理。

在一些实施例中,利用局部匹配模式纹理特征对分块处理后的所述疑似病变区域进行特征提取,包括下述步骤:

对所述疑似病变区域的第b个感兴趣图块中计算三通道颜色统计信息Cb,j=[ci=b,1,cb,2,…,cb,n],提取颜色特征,,其中,Cb,j表示第b图像块中j个统计特征,b表示第b个感兴趣区域模块,j表示第j个特征;

对所述疑似病变区域的第b个图像块进行局部匹配模式纹理特征提取,获取中心点的像素值,提取纹理特征;

通过像素值重构中心点的像素信息,从而获取重构的系数矩阵。

在一些实施例中,所述重构的系数矩阵为其中,HL(k)是HL的第k的元素,P表示图像邻域点数,ai(i=0,...,P-1)是图像邻域像素值与中心像素点对应的权重值,AL(i)是AL的第i个元素,0i是第i个模式出现的概率,q是感兴趣区域的总数目。

在一些实施例中,采用极限学习机训练法对提取的特征进行分类判别,以确定肿瘤的良恶性以及等级划分,包括下述步骤:

对存在N个样本的训练集输入矩阵X和输出矩阵T分别为:X=[x1,x2,...,xN],其中X为上述的颜色特征和纹理特征,T=[t1,t2,...,tN],其中T表示的是相应肿瘤类别信息,则含有L个隐含结点且激励函数为g(x)的标准单隐含层前向神经网络的数学模型的形式为:

<mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <msub> <mi>&beta;</mi> <mi>i</mi> </msub> <msub> <mi>g</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <msub> <mi>&beta;</mi> <mi>i</mi> </msub> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>+</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>N</mi> </mrow>

其中,xj和tj表示第j个输入样本和输出样本,βi代表连接第i个隐含层节点和输出神经元的输出权值,ai代表连接输入神经元和第i个隐含层节点的输入权值,bi为第i个隐层节点的偏置,含有L个隐层节点,且激励函数为g(x)的标准单隐层前向神经网络能够无限接近于N个训练样本;

构建公式Hβ=T,并进行求解最小值计算得到极限学习机网络的参数ai,bi,βi

另外,本发明还提供了一种癌症数字病理细胞图像的分类系统,包括:

感兴趣区域获取模块,用于获取感兴趣的疑似病变区域;

感兴趣区域分块处理模块,对所述疑似病变区域进行分块处理;

特征值提取模块,利用局部匹配模式纹理特征对分块处理后的所述疑似病变区域进行特征提取;

分类模块,采用极限学习机训练法对提取的特征进行分类判别,以确定肿瘤的良恶性以及等级划分。

在一些实施例中,所述感兴趣区域获取模块利用颜色分布信息方法获取感兴趣的疑似病变区域。

在一些实施例中,所述感兴趣区域分块处理模块为对所述疑似病变区域采用聚类算法快速统计出癌细胞分布密度和趋势,分离得到细胞区域并进行分块处理。

本发明采用上述技术方案,其有益效果在于:

本发明提出了一种癌症数字病理细胞图像的分类方法及系统,对获取感兴趣的疑似病变区域进行分块处理,利用局部匹配模式纹理特征对分块处理后的所述疑似病变区域进行特征提取,再采用极限学习机训练法对提取的特征进行分类判别,以确定肿瘤的良恶性以及等级划分。本发明提供的癌症数字病理细胞图像的分类方法及系统,利用局部匹配模式纹理特征进行特征提取,从宏观和微观两个方面进行分析细胞的纹理特征,而且具有旋转不变性,有效的克服了细胞形态的多样性和不规则性等诸多问题,为分类提供了可靠的纹理特征信息,较传统的图像特征提取,不受操作者的经验、采集设备和图像采集情况的影响,提供客观、稳定的量化特征信息;同时,将极限学习机应用于乳腺癌症细胞的分类,与传统的监督学习相比,大大简短了训练时间,提升了分类判别的速度,提高的识别的准确度。

附图说明

图1为本发明提供的癌症数字病理细胞图像的分类方法的步骤流程图。

图2为本发明提供的癌症数字病理细胞图像的分类系统的结构示意图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

请参阅图1,本申请提供的癌症数字病理细胞图像的分类方法,包括下述步骤:

步骤S110:获取感兴趣的疑似病变区域;

可以理解,由于全景病理图像,数据量很大,在特征提取之前,利用颜色分布信息方法粗略的选择出感兴趣的疑似病变区域。

步骤S120:对所述疑似病变区域进行分块处理;

优选地,对疑似病变区域采用fuzzy c-means聚类算法快速统计出癌细胞分布密度和趋势,大致分离得到细胞区域并进行分块处理,从而减少计算量。

步骤S130:利用局部匹配模式纹理特征对分块处理后的所述疑似病变区域进行特征提取,具体包括下述步骤:

步骤S131:对所述疑似病变区域的第b个感兴趣图块中计算三通道颜色统计信息Cb,j=[ci=b,1,cb,2,…,cb,n],提取颜色特征,其中,Cb,j表示第b图像块中j个统计特征,b表示第b个感兴趣区域模块,j表示第j个特征;

步骤S132:对所述疑似病变区域的第b个图像块进行局部匹配模式纹理特征提取,获取中心点的像素值,提取纹理特征;

可以理解,通过取样点的像素值,可以有效的获取中心点的像素值,对噪声也不敏感,是一种稳定的纹理特征,通过局部二值模式得到像素点的模式种类属性,从宏观方面得到每种模式出现的概率。

步骤S133:通过像素值重构中心点的像素信息,从而获取重构的系数矩阵。

可以理解,本申请从微观方面通过样本点的像素值重构中心点的像素信息,从而获取重构的系数矩阵。

优选地,所述重构的系数矩阵为其中,HL(k)是HL的第k的元素,,P表示图像邻域点数,ai(i=0,...,P-1)是图像邻域像素值与中心像素点对应的权重值,AL(i)是AL的第i个元素,0i是第i个模式出现的概率,q是感兴趣区域的总数目。

可以理解,为了提供旋转不变特征,我们将一维的傅里叶变换应用到系数矩阵AL的估计的问题上。则转换的向量可以表示为:

<mrow> <msub> <mi>H</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <mi>k</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>P</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <mi>A</mi> <mi>L</mi> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&CenterDot;</mo> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>j</mi> <mn>2</mn> <mi>&pi;</mi> <mi>k</mi> <mi>i</mi> <mo>/</mo> <mi>P</mi> </mrow> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

HL(k)是HL的第k的元素,AL(i)是AL的第i个元素。虽然图像的旋转将会对AL的产生影响,但是傅里叶变换却具有不变性,所以HL也具备旋转不变性。向量HL的大小被当作微观特征,表示形式如下:

|HL|=[HL(0)|;|HL(1)|;...,|HL(P-1)|] (2)

因HL诠释了图像的配置和像素点之间的关系,它和局部二值模式一起构建了一个将微观配置和局部结构相结合的新的特征。最终的特征可以表示为:

步骤S140:采用极限学习机训练法对提取的特征进行分类判别,以确定肿瘤的良恶性以及等级划分,具体地包括下述步骤:。

对存在N个样本的训练集输入矩阵X和输出矩阵T分别为:X=[x1,x2,...,xN],其中X为上述的颜色特征和纹理特征,T=[t1,t2,...,tN],其中T表示的是相应肿瘤类别信息,则含有L个隐含结点且激励函数为g(x)的标准单隐含层前向神经网络的数学模型的形式为:

<mrow> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <msub> <mi>&beta;</mi> <mi>i</mi> </msub> <msub> <mi>g</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <msub> <mi>&beta;</mi> <mi>i</mi> </msub> <mi>g</mi> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <msub> <mi>x</mi> <mi>j</mi> </msub> <mo>+</mo> <msub> <mi>b</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>t</mi> <mi>j</mi> </msub> <mo>,</mo> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mn>2</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>N</mi> </mrow>

其中,xj和tj表示第j个输入样本和输出样本,βi代表连接第i个隐含层节点和输出神经元的输出权值,ai代表连接输入神经元和第i个隐含层节点的输入权值,bi为第i个隐层节点的偏置,含有L个隐层节点,且激励函数为g(x)的标准单隐层前向神经网络能够无限接近于N个训练样本;

构建公式Hβ=T,并进行求解最小值计算得到极限学习机网络的参数ai,bi,βi

可以理解,由于全景的病理图像数据量大,传统的神经网络由于使用基于梯度的方法来训练网络,且在训练过程中要求调整网络中的全部参数,因而会面临学习速度缓慢、易陷入局部极小等问题,而极限学习机算法,随机选取输入层与隐含层之间的连接权重与阈值,而隐含层与输出层之间的连接权重则有最小范数最小二乘解确定。由于采用了无需迭代计算的学习方法和对隐含变量的随机选取,在极大提高了学习速度的同时还减少了对网络参数的调整,网络的泛化能力也得到了保障。

请参阅图2,本申请还提供了一种癌症数字病理细胞图像的分类系统,包括:感兴趣区域获取模块110、感兴趣区域分块处理模块120、特征值提取模块130及分类模块140。其中,

感兴趣区域获取模块110用于获取感兴趣的疑似病变区域;感兴趣区域分块处理模块120用于对所述疑似病变区域进行分块处理;特征值提取模块130利用局部匹配模式纹理特征对分块处理后的所述疑似病变区域进行特征提取;分类模块140采用极限学习机训练法对提取的特征进行分类判别,以确定肿瘤的良恶性以及等级划分。

上述癌症数字病理细胞图像的分类系统其详细的工作方式在前述有详细的说明,这里不再赘述。

本发明提出了一种癌症数字病理细胞图像的分类方法及系统,对获取感兴趣的疑似病变区域进行分块处理,利用局部匹配模式纹理特征对分块处理后的所述疑似病变区域进行特征提取,再采用极限学习机训练法对提取的特征进行分类判别,以确定肿瘤的良恶性以及等级划分。本发明提供的癌症数字病理细胞图像的分类方法及系统,利用局部匹配模式纹理特征进行特征提取,从宏观和微观两个方面进行分析细胞的纹理特征,而且具有旋转不变性,有效的克服了细胞形态的多样性和不规则性等诸多问题,为分类提供了可靠的纹理特征信息,较传统的图像特征提取,不受操作者的经验、采集设备和图像采集情况的影响,提供客观、稳定的量化特征信息;同时,将极限学习机应用于乳腺癌症细胞的分类,与传统的监督学习相比,大大简短了训练时间,提升了分类判别的速度,提高的识别的准确度。

虽然本发明参照当前的较佳实施方式进行了描述,但本领域的技术人员应能理解,上述较佳实施方式仅用来说明本发明,并非用来限定本发明的保护范围,任何在本发明的精神和原则范围之内,所做的任何修饰、等效替换、改进等,均应包含在本发明的权利保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1