基于多级分区词袋模型的脑疾病识别装置的制作方法

文档序号:17502617发布日期:2019-04-23 23:49阅读:127来源:国知局
基于多级分区词袋模型的脑疾病识别装置的制作方法

本发明实施例涉及医学图像处理技术领域,尤其是涉及一种基于多级分区词袋模型的脑疾病识别装置。



背景技术:

磁共振成像作为一种非侵入式的脑成像方法,已被广泛应用于脑疾病的研究中。脑疾病的准确诊断对疾病治疗起着积极的作用。利用磁共振结构图像,客观评估疾病状态,辅助医疗诊断成为当前研究的热点。

利用图像局部结构特征对磁共振结构图像进行表示受到关注。词袋模型作为一种基于局部特征的图像表示方法,其基本思想是将图像用局部特征(视觉单词)的概率分布(直方图)表示。词袋模型被广泛运用于目标分类和目标识别领域,近年来逐渐用于磁共振结构图像分析。Daliri在文献(Daliri MR.Automated diagnosis of Alzheimer disease using the scale-invariant feature transforms in magnetic resonance images[J].Journal of medical systems,2012,36(2):995-1000.)中从磁共振图像提取SIFT特征,提出了一种基于词袋模型和支持向量机的磁共振结构图像分类算法。此外,另一些方法将灰度密度值、Laguerre Circular Harmonic Functions等作为局部特征,建立词袋模型。上述词袋模型主要是基于全脑或固定区域实施完成,位置信息未被充分利用。



技术实现要素:

鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于多级分区词袋模型的脑疾病识别装置。

为了实现上述目的,本发明提供了以下技术方案:

一种基于多级分区词袋模型的脑疾病识别装置,所述装置至少包括:

预处理模块,其被配置为对训练样本集和测试样本集中各样本的脑部磁共振结构图像进行预处理,所述预处理包括:去除头骨和背景以及将所述脑部磁共振结构图像仿射变换到标准脑模板;

结构特征提取模块,其被配置为基于所述标准脑模板、所述训练样本集中各样本和所述测试样本集中各样本在横断面、矢状面和冠状面方向上的每个二维脑部磁共振结构图像,分别提取其结构特征;

多级脑分区构建模块,其被配置为针对所述标准脑模板,建立多级脑分区;

词袋构建模块,其被配置为针对所述标准脑模板的结构特征,使用无监督聚类方法分别对所述各级分区内结构特征进行聚类,构建各等级分区词袋;

词袋直方图构建模块,其被配置为针对所述训练样本集和所述测试样本集中各样本在所述横断面、所述矢状面和所述冠状面上的二维脑部磁共振结构特征,利用所述各等级分区词袋,构建各样本的各等级词袋直方图;

脑疾病识别模块,其被配置为利用所述训练样本集中各样本的各等级词袋直方图,建立多级分类器,并对所述测试样本分类,进而实现脑部疾病的识别。

与现有技术相比,上述技术方案至少具有以下有益效果:

本发明实施例利用标准脑模板建立多级脑分区;针对标准脑模板的结构特征,使用无监督聚类方法分别对各级分区结构内特征进行聚类,来构建各等级分区词袋;接着针对训练样本集和测试样本集中各样本在横断面、矢状面和冠状面上的二维脑部磁共振结构特征,利用各等级分区词袋,来构建各样本的各等级词袋直方图;最后利用训练样本集中各样本的各等级词袋直方图,建立多级分类器对测试样本分类,进而实现了脑部疾病的识别。

当然,实施本发明的任一产品不一定需要同时实现以上所述的所有优点。

上述说明仅仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,可以依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更加明显易懂,以下特举本发明的具体实施方式。

附图说明

附图作为本发明的一部分,用来提供对本发明的进一步的理解,本发明的示意性实施例及其说明用于解释本发明,但不构成对本发明的不当限定。显然,下面描述中的附图仅仅是一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。在附图中:

图1为根据一示例性实施例示出的基于多级分区词袋模型的脑疾病识别方法的流程示意图;

图2为根据一示例性实施例示出的多级脑分区示意图;

图3为根据一示例性实施例示出的利用分区词袋构建等级词袋直方图的示意图。

这些附图和文字描述并不旨在以任何方式限制本发明的构思范围,而是通过参考特定实施例为本领域技术人员说明本发明的概念。

具体实施方式

下面结合附图以及具体实施例对本发明实施例解决的技术问题、所采用的技术方案以及实现的技术效果进行清楚、完整的描述。显然,所描述的实施例仅仅是本申请的一部分实施例,并不是全部实施例。基于本申请中的实施例,本领域普通技术人员在不付出创造性劳动的前提下,所获的所有其它等同或明显变型的实施例均落在本发明的保护范围内。本发明实施例可以按照权利要求中限定和涵盖的多种不同方式来具体化。

需要说明的是,在下面的描述中,为了方便理解,给出了许多具体细节。但是很明显,本发明的实现可以没有这些具体细节。

需要说明的是,在没有明确限定或不冲突的情况下,本发明中的各个实施例及其中的技术特征可以相互组合而形成技术方案。

本发明实施例提供一种基于多级分区词袋模型的脑疾病识别方法,进行脑疾病识别。如图1所示,该方法至少可以包括步骤S1至步骤S6。

S1:对训练样本集和测试样本集中各样本的脑部磁共振结构图像进行预处理,预处理包括:去除头骨和背景以及将脑部磁共振结构图像仿射变换到标准脑模板。

在本步骤中,训练样本集包括病人样本集和健康样本集。测试样本集中的样本为病人样本或健康样本。

预处理具体包括:

步骤S1.1:去除颅骨和背景。

其中,可以利用FreeSurfer等软件去除原始二维脑部磁共振结构图像的颅骨和背景。

步骤S1.2:将去除了颅骨和背景的脑部磁共振结构图像仿射变换到标准脑模板。

其中,可以利用FSL等软件将脑部磁共振结构图像仿射变换到标准脑模板(即标准脑空间)。

本发明实施例从横断面、矢状面和冠状面三个方向分别获得标准脑模板、训练样本集和测试样本集中各样本的二维序列脑图像。二维序列脑图像这里指包括同一方向的多张二维脑图像,覆盖全脑。

S2:基于标准脑模板、训练样本集中各样本和测试样本集中各样本在横断面、矢状面和冠状面方向上的每个二维脑部磁共振结构图像,分别提取其结构特征。

下面以提取SIFT特征为例来说明提取结构特征的过程。

本领域技术人员应清楚,虽然本发明实施例是以SIFT特征作为结构特征为例来进行说明的,但是本文中所指的结构特征包括但不限于SIFT特征。

SIFT特征提取主要分为四个步骤:首先检测关键点,在高斯差分金字塔分层结构中提取图像的极值点作为候选关键点;接着对关键点进行精确定位,并对关键点进行筛选,去除低对比度或在边界上的关键点;然后利用关键点周围像素的梯度信息来指定主方向;最后为每个关键点生成128维的描述子。其中,每个SIFT特征对应着其位置信息。

S3:针对标准脑模板,建立多级脑分区。

图2示例性地示出了多级脑分区示意图。

在本步骤中,多级脑分区可以使用以下任意一种方式进行分区:固定尺寸分区、基于功能的脑分区及滑动窗口分区。

下面以ICBM-152标准脑模板为例来对本步骤加以详细说明。

本发明实施例将ICBM-152标准脑模板按以下方式进行多级分区。

Level 1:将全脑作为整体分析。

Level 2:二分区,即根据横断面、矢状面或冠状面方向的中心平面对标准脑模板进行划分。根据不同方向的中心平面,Level 2又可细分为Level 2-1、Level 2-2和Level 2-3。

Level 3:四分区,即根据横断面、矢状面或冠状面三个方向的其中两个中心平面对标准脑模板进行划分。根据不同中心面组合,Level 3又可细分为Level 3-1、Level 3-2和Level 3-3。

Level 4:八分区,即根据横断面、矢状面和冠状面三个方向的中心平面对标准脑模板进行划分。

S4:针对标准脑模板的结构特征,使用无监督聚类方法分别对各级分区内结构特征进行聚类,构建各等级分区词袋。

在本发明的一个实施例中,聚类步骤可以包括根据结构特征的位置信息,将结构特征划归于各级分区,并在各级分区分别进行聚类。

在本发明的一个优选实施例中,本步骤可以包括针对各级分区的结构特征,使用无监督聚类方法提取聚类中心,将聚类中心作为基础词汇加入分区词袋,并对不同等级的各分区分别构建分区词袋。

作为示例,构建各等级分区词袋可以包括:

针对标准脑模板提取到的SIFT特征,按照其位置划归于不同脑分区,将每个脑分区的SIFT特征使用AP(Affinity Propagation)算法进行聚类,并提取聚类中心。提取到的聚类中心将作为基础词汇而加入分区词袋。然后,对不同等级的各分区分别构建分区词袋。例如,在Level 4的八个分区分别对落入各分区的特征进行聚类,最终可得到8个分区词袋。

S5:针对训练样本集和测试样本集中各样本在横断面、矢状面和冠状面上的二维脑部磁共振结构特征,利用各等级分区词袋,构建各样本的各等级词袋直方图。

在本发明实施例的一些可选的实现方式中,本步骤具体可以包括针对训练样本集中各样本在横断面、矢状面和冠状面上的二维脑部磁共振结构特征,根据结构特征位置信息,使用对应分区词袋中与之最相似的基本词汇代替,构建分区词袋直方图,进而构建各等级词袋直方图。

其中,构建各等级词袋直方图还可以进一步包括:将同等级不同分区的词袋直方图按次序联合,得到该样本的等级词袋直方图。

图3是利用Level 4的八个分区词袋,构建等级词袋直方图示意图。

示例性地,利用分区词袋构建等级词袋直方图具体可以包括:

步骤5.1:寻找代替单词

针对训练样本集和测试样本集中各样本在横断面、矢状面和冠状面上的二维脑部磁共振结构特征,根据结构特征的位置信息,找到在各级分区中的对应脑分区,使用对应分区词袋中与之最相似的基本词汇代替。

优选地,本发明的一些实施例使用欧几里得距离来度量该相似性,即距离越近代表特征越相似。

优选地,本发明的一些实施例使用最近邻查找的方法在各等级对应分区词袋中查找距离该特征向量最近的基本词汇。

步骤5.2:构建分区词袋直方图

针对训练样本集和测试样本集中各样本在横断面、矢状面和冠状面上的二维脑部磁共振结构特征,根据其位置在各等级对应分区词袋中寻找替代单词,并计算基本词汇出现频次。即:每个样本提取到的结构特征(优选为SIFT特征),根据其位置信息可以用不同等级对应分区词袋的不同基础词汇代替。

示例性地,一个SIFT特征位于Level 3-1的第二分区,可以由该等级二分区的一个基础词汇代替。此外,由于该SIFT特征位于Level 2-1的第一分区,因此该SIFT特征也可以由该等级一分区的一个基础词汇代替。

步骤5.3:构建等级词袋直方图

具体地,对训练样本集和测试样本集中各样本,分别获取其各等级分区词袋直方图,将同等级不同分区的词袋直方图按次序联合,得到该样本的等级词袋直方图。

例如,图3给出了Level 4的8分区划分,在各分区计算分区词袋直方图,分区词袋直方图按次序联合得到等级词袋直方图。再将等级词袋直方图作为该等级划分下图像的词袋表示向量。

本领域技术人员应能理解,上述构建各样本的各等级词袋直方图的方式仅为举例,其他任意现有的或今后可能出现的构建各样本的各等级词袋直方图的方式若能适用于本发明,则也应包含在本发明的保护范围之内并在此以引用的方式结合于此。

S6:利用训练样本集中各样本各等级词袋直方图,建立多级分类器,并对测试样本分类,进而实现脑部疾病的识别。

本步骤中建立多级分类器具体可以包括利用训练样本集中各样本各等级词袋直方图分别构建各等级分类器。综合利用各等级分类器构建多级分类器,以进行测试样本分类。

示例性地,测试样本分类具体可以包括:

步骤6.1:训练分类器

在本发明实施例中,基于训练样本的等级词袋直方图向量,根据样本所属组群设定标号(样本属于健康组对应标号为1,属于病人组对应标号为-1),在各等级分别训练一支持向量机分类模型。例如本发明实施例可以针对图2所示的8种分区方式分别训练支持向量分类器。

步骤6.2:样本分类

基于各等级分区训练得到的各个支持向量机模型,根据各等级分类器的结果,分类新样本,进而实现脑部疾病的识别。本发明实施例根据Level 2-1、Level 2-2、Level 2-3、Level 3-1、Level 3-2、Level 3-3和Level 4七级分类器的结果,采用多数投票原则分类新样本。采用Level 1的分类结果作为对照。

本发明实施例所述的基于多级分区词袋模型的脑疾病识别方法利用公开数据集OASIS和PPMI进行了评估。实验结果说明,相比于不做分区处理的词袋模型,本发明实施例所述的基于多级分区词袋模型的脑疾病识别方法取得了更好的分类效果。

本实施例中虽然将各个步骤按照上述先后次序的方式进行了描述,但是本领域技术人员可以理解,为了实现本实施例的效果,不同的步骤之间不必按照这样的次序执行,其可以同时(并行)执行或以颠倒的次序执行,这些简单的变化都在本发明的保护范围之内。

以上对本发明实施例所提供的技术方案进行了详细的介绍。虽然本文应用了具体的个例对本发明的原理和实施方式进行了阐述,但是,上述实施例的说明仅适用于帮助理解本发明实施例的原理;同时,对于本领域技术人员来说,依据本发明实施例,在具体实施方式以及应用范围之内均会做出改变。

需要说明的是,本文中涉及到的流程图不仅仅局限于本文所示的形式,其还可以进行划分和/或组合。

需要说明的是:附图中的标记和文字只是为了更清楚地说明本发明,不视为对本发明保护范围的不当限定。

术语“包括”、“包含”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

本发明的各个步骤可以用通用的计算装置来实现,例如,它们可以集中在单个的计算装置上,例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备或者多处理器装置,也可以分布在多个计算装置所组成的网络上,它们可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。因此,本发明不限于任何特定的硬件和软件或者其结合。

本文中所述的“一些实施例”、“实施例”意味着:结合实施例描述的技术特征、结构或者特性包括在本发明的至少一个实施例中。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

虽然本文说明了大量的具体细节。但是,应该能够理解,本发明的实施例可以在没有这些具体细节的情况下实施。在一些实施例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

本发明并不限于上述实施方式,在不背离本发明实质内容的情况下,本领域普通技术人员可以想到的任何变形、改进或替换均落入本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1