一种医学病灶图像的词袋模型的构建方法

文档序号:6368593阅读:252来源:国知局
专利名称:一种医学病灶图像的词袋模型的构建方法
技术领域
本发明涉及识别医学病灶图像,具体来说涉及识别医学病灶图像的词袋模型。
背景技术
基于内容的图像检索(Content-Based ImageRetrieval,CBIR)的基本思想是提取图像的视觉特征进行图像表达,使用图像表达对图像进行检索。CBIR技术可以为管理图像数据、临床诊断、医学教学等提供支持和帮助。特别地,医学图像中相似病灶的检索,可提高临床诊断的可靠性和相关信息的完整性。
一般地,CBIR系统把待查询图像和待查询图像的图像表达存放在数据库中,当用户提供一幅查询图像吋,CBIR系统提取该图像的视觉特征进行图像表达,与数据库中待查询图像的图像表达进行比较,从而返回与查询特征相似的图像。CBIR系统中常用来进行图像表达的视觉特征有顔色、纹理、形状、边缘等。纹理特征是图像的重要特征之一,能够描述图像的平滑,稀疏,规则性等特征。在医学图像中,由于提取图像的纹理特征能够反映人眼所不能观察到的隐藏在图像结构中的细节信息,因此纹理特征广泛应用于医学图像检索的图像表达中。几种传统的纹理特征提取方法包括灰度共生矩阵、小波变换、伽伯(Gabor)变换等。灰度共生矩阵表示了在一致纹理模式下像素灰度的空间依赖性,但是,它没有完全抓住局部灰度的图像特点,对于较大的局部,用这种方法提取纹理特征的效果不理想。小波变换能够为多尺度需求提供一个清晰的数学框架,因此,小波变换能够有效地提取纹理图像的多尺度特征。然而,在小波变换中,滤波器组的选择问题仍未解決,导致对纹理分析产生影响。伽伯变换与人类的视觉最为匹配,在图像分析中具有重要的作用,但是,它的变换窗ロ大小固定,对纹理在方向和频率上的细微变换不敏感,不能满足我们在实际应用中需求。词袋(Bag of Visual Words, Boff)模型通过提取整幅图像的局部细节特征,进而对图像进行量化表达,捕捉了图像的细微变化和整体特征。然而,由于一般的词袋模型在提取局部特征时,没有考虑到特征之间的相对空间位置关系,从而使产生的词袋模型缺乏有效的空间信息,降低了词袋模型的描述能力。为了解决这个问题,有研究者提出ー种联合空间金字塔模型和词袋模型的方法,用于自然图像的分类(S. Lazebnik, C. Schmid, and J. Ponce, " Beyond bags of features :spatialpyramid matching for recognizing natural scene categories," IEEE Conference onComputer Vision and Pattern Recognition, pp. 2169-2178, 2006)。这种方法以空间金字塔模型的提取方式,把图像细分为多个子区域,然后构建各个子区域的词袋模型,最后把全部子区域的词袋模型联合为ー个大的词袋模型。此外,还有研究者提出在词袋模型的特征向量中加入特征的空间坐标来提高医学X光片的分类和检索性能(U. Avni, H. Greenspan,E.Konen,M. Sharon,ana j.boldberger,' X-ray categorization ana retrieval on theorgan and pathology level,using patch-based visual words, " IEEE Transactionson Medical Imaging, vol. 30, pp. 733-746, 2011)。由于医学病灶图像一般是灰度图像,病灶组织内部的纹理信息有异于附近的正常组织,而且,不同类型病灶的纹理信息也各有差异,另外,病灶邻近的组织结构也有所不同。例如,在脑部肿瘤图像中,胶质瘤通常边缘会有一圈水肿;脑膜瘤邻近脑壳、灰质和脑脊髄液;而垂体瘤则经常出现在蝶窦、视交叉和内部颈动脉附近。因此,上述现有技术虽然能很好地表达出病灶区域内的纹理特征,但是因缺少病灶边界区域和病灶区域向病灶边界区域过渡的灰度变化信息,其区分不同类型病灶的准确性尚不够理想。

发明内容
本发明所要解决的技术问题是提供ー种医学病灶图像的词袋模型的构建方法,该方法得到的词袋模型能反映病灶区域的空间位置,有助于提高临床诊断的准确性。本发明的目的可通过以下的技术措施来实现 —种医学病灶图像的词袋模型的构建方法,该方法由以下步骤组成(I)读取数据库中已勾画出病灶轮廓的医学病灶图像,所读取的医学病灶图像要包含每种病灶类型至少各50幅图像,并每一幅医学病灶图像进行以下处理(I. I)先对病灶轮廓线进行ー维高斯平滑,再分别以病灶轮廓线和病灶轮廓线的法线相交的像素点为起点,沿着病灶轮廓法线向病灶内和病灶外各取若干数量相同的像素点,然后分别,以位于每ー病灶轮廓法线方向上所取的像素点为列,按顺时针或逆时针排列,以位于每ー病灶轮廓法线方向上同一位置的像素点为行,按从病灶轮廓内向病灶轮廓外或从病灶轮廓外向病灶轮廓内的顺序排列,得到所述医学病灶图像的边界区域的变换图像;接着,以变换图像内间隔为O 5个像素点距离的像素点为中心向外扩展,获取一系列像素点阵列大小为5X5、7X7或9X9的小方块,将所述小方块中的姆一列像素点逆时针转90°,再以从上到下的顺序排成一行队列,然后将每一行队列中,位于所述变换图像内的像素点分别替换为所对应的灰度值,位于所述变换图像外的像素点的灰度值分别赋予零,得到所述病灶边界区域的灰度值向量Al ;(I. 2)在病灶区域内自位于所述病灶轮廓线边缘的像素点起,以间隔为O 5个像素点距离的像素点为中心向外扩展,获取一系列像素点阵列大小为5 X 5、7 X 7或9 X 9的小方块,将所述小方块中的每一列像素点逆时针转90°,再以从上到下的顺序排成一行队列,然后将每一行队列中,位于所述病灶轮廓线内的像素点分别替换为所对应的灰度值,位于所述病灶轮廓线外的像素点的灰度值分别赋予零,得到病灶区域的灰度值向量A2 ;(I. 3)将步骤(I. I)得到的所有医学病灶图像的病灶边界区域的灰度值向量Al规为ー类,将步骤(1.2)得到的所有医学病灶图像的病灶区域的灰度值向量A2规为另ー类,然后分别对其进行k均值聚类,得到含有由聚类中心所形成的单词组成的病灶区域词典和病灶边界区域词典;(2)取所述数据库中任一幅医学病灶图像,分别构建病灶区域的词袋B2和病灶边界区域的词袋BI ;其中,(2. I)所述病灶区域的词袋B2的构建方法为以其病灶区域内每ー像素点为中心向外扩展,获取一系列大小与步骤(I. 2)所述小方块相同的小方块,再以步骤(I. 2)相同的方法得到该幅医学病灶图像的病灶区域的二次运算的灰度值向量A2',然后按所述行队列的顺序分别计算每ー灰度值向量A2'与病灶区域词典中每个单词的欧氏距离,并把每ー灰度值向量A2'量化到与其欧氏距离最小的单词上,得到病灶区域词典中每个单词出现的频率,该频率数字所形成的一维向量即为该幅医学病灶图像的病灶区域的词袋B2;(2.2)所述病灶边界区域的词袋BI的构建方法为先按步骤(I. I)相同的方法对该医学病灶图像的病灶边界区域进行处理,得到边界区域的变换图像,以变换图像内每一像素点为中心向外扩展,获取一系列大小与步骤(I. I)所述小方块相同的小方块,再以步骤(I. I)相同的方法得到该幅医学病灶图像的病灶边界区域的二次运算的灰度值向量Al',然后按所述行队列的顺序分别计算每ー灰度值向量Al'与病灶边界区域词典中每个单词的欧氏距离,并把每ー灰度值向量Al'量化到与其欧氏距离最小的单词上,得到病灶边界区域词典中每个单词出现的频率,该频率数字所形成的一维向量即为该幅医学病灶图像的病灶边界区域的词袋BI ;
(2. 3)将表示词袋BI和词袋B2的两个向量首尾连接排列成一个向量便得到该医学病灶图像的词袋模型。本发明所述的构建方法,其中,所述的小方块的大小以7X7为优,所述的k均值聚类的k值可根据图像的数目取,取的原则为图像数目越多,k值取得越大;图像数目越少,k值取得越小,一般k值取1000为优。本发明所述的构建方法适用于MRI、CT、超声图像词袋模型的构建。本发明方法相对于现有技术来说,具有以下的有益效果由于图像数据库是由已经勾画好病灶轮廓的图像构成,因此,依据病灶图像的特点,把病灶图像划分为病灶区域和病灶边界区域两个部分,分别得到病灶区域和病灶边界区域的词袋,进而构建出病灶区域词袋和病灶边界区域词袋联合的词袋模型,相对于一般的词袋模型増加了病灶区域局部特征的相对空间位置信息,因此有助于提高临床诊断的准确性。


图I是本发明的基于医学病灶图像的词袋模型的构建方法的流程图;图2是查全-查准率曲线,其中,编号为I的曲线是用本发明所述的词袋模型得到的查全-查准率曲线;编号为II的曲线是用在病灶区域构建词袋B2得到的查全-查准率曲线;编号为III的曲线是用灰度共生矩阵的方法得到的查全-查准率曲线;编号为IV的曲线是用小波变换的方法得到的查全-查准率曲线;编号为V的曲线是用伽伯变换的方法得到的查全-查准率曲线;图3是查全-查准率曲线,其中,编号为I的曲线是用本发明所述的词袋模型得到的查全-查准率曲线;编号为II的曲线是采用空间金字塔方法构建词袋模型得到的查全-查准率曲线;编号为III的曲线是用在特征向量中加入特征的空间坐标的方法构建词袋模型得到的查全-查准率曲线。
具体实施例方式例I (构建词袋模型)本实施例所使用的数据库是存有脑膜瘤、胶质瘤和垂体瘤的脑部Tl加权增强MRI图像各800张,且每ー张MRI图像已勾画好了病灶轮廓。以下參照图I详细描述所述数据库中任ー张MRI图像的词袋模型的构建方法。
(I)读取所述数据库中的MRI图像,并对其中的每一幅MRI图像进行以下处理(I. I)先对病灶轮廓线进行ー维高斯平滑,再分别以病灶轮廓线和病灶轮廓线的法线相交的像素点为起点,沿着病灶轮廓法线向病灶内和病灶外各取15个像素点,然后分另O,以位于每ー病灶轮廓法线方向上所取的像素点为列,按顺时针或逆时针排列,以位于每一病灶轮廓法线方向上同一位置的像素点为行,按从病灶轮廓内向病灶轮廓外或从病灶轮廓外向病灶轮廓内的顺序排列,得到所述医学病灶图像的边界区域的变换图像;接着,以变换图像内间隔为5个像素点距离的像素点为中心向外扩展,获取一系列像素点阵列大小为7X7的小方块,将所述小方块中的每一列像素点逆时针转90°,再以从上到下的顺序排成一行队列,然后将每一行队列中,位于所述变换图像内的像素点分别替换为所对应的灰度值,位于所述变换图像外的像素点的灰度值分别赋予零,得到所述病灶边界区域的灰度值向量Al。其中所述的ー维高斯平滑的目的是为了避免病灶轮廓线受到噪声的干扰而导致病灶轮廓线的法线方向改变,要用到高斯核来平滑病灶轮廓线。所述ー维高斯平滑的方法如下一维的高斯核为
权利要求
1.一种医学病灶图像的词袋模型的构建方法,该方法由以下步骤组成 (1)读取数据库中已勾画出病灶轮廓的医学病灶图像,所读取的医学病灶图像要包含每种病灶类型至少各50幅图像,并每一幅医学病灶图像进行以下处理 (I. D先对病灶轮廓 线进行一维高斯平滑,再分别以病灶轮廓线和病灶轮廓线的法线相交的像素点为起点,沿着病灶轮廓法线向病灶内和病灶外各取若干数量相同的像素点,然后分别,以位于每一病灶轮廓法线方向上所取的像素点为列,按顺时针或逆时针排列,以位于每一病灶轮廓法线方向上同一位置的像素点为行,按从病灶轮廓内向病灶轮廓外或从病灶轮廓外向病灶轮廓内的顺序排列,得到所述医学病灶图像的边界区域的变换图像;接着,以变换图像内间隔为0 5个像素点距离的像素点为中心向外扩展,获取一系列像素点阵列大小为5X5、7X7或9X9的小方块,将所述小方块中的每一列像素点逆时针转90°,再以从上到下的顺序排成一行队列,然后将每一行队列中,位于所述变换图像内的像素点分别替换为所对应的灰度值,位于所述变换图像外的像素点的灰度值分别赋予零,得到所述病灶边界区域的灰度值向量Al ; (I. 2)在病灶区域内自位于所述病灶轮廓线边缘的像素点起,以间隔为0 5个像素点距离的像素点为中心向外扩展,获取一系列像素点阵列大小为5 X 5、7 X 7或9 X 9的小方块,将所述小方块中的每一列像素点逆时针转90°,再以从上到下的顺序排成一行队列,然后将每一行队列中,位于所述病灶轮廓线内的像素点分别替换为所对应的灰度值,位于所述病灶轮廓线外的像素点的灰度值分别赋予零,得到病灶区域的灰度值向量A2 ; (I. 3)将步骤(I. I)得到的所有医学病灶图像的病灶边界区域的灰度值向量Al规为一类,将步骤(1.2)得到的所有医学病灶图像的病灶区域的灰度值向量A2规为另一类,然后分别对其进行k均值聚类,得到含有由聚类中心所形成的单词组成的病灶区域词典和病灶边界区域词典; (2)取所述数据库中任一幅医学病灶图像,分别构建病灶区域的词袋B2和病灶边界区域的词袋BI ;其中, (2. I)所述病灶区域的词袋B2的构建方法为以其病灶区域内每一像素点为中心向外扩展,获取一系列大小与步骤(I. 2)所述小方块相同的小方块,再以步骤(I. 2)相同的方法得到该幅医学病灶图像的病灶区域的二次运算的灰度值向量A2',然后按所述行队列的顺序分别计算每一灰度值向量A2'与病灶区域词典中每个单词的欧氏距离,并把每一灰度值向量A2'量化到与其欧氏距离最小的单词上,得到病灶区域词典中每个单词出现的频率,该频率数字所形成的一维向量即为该幅医学病灶图像的病灶区域的词袋B2 ; (2. 2)所述病灶边界区域的词袋BI的构建方法为先按步骤(I. I)相同的方法对该医学病灶图像的病灶边界区域进行处理,得到边界区域的变换图像,以变换图像内每一像素点为中心向外扩展,获取一系列大小与步骤(I. I)所述小方块相同的小方块,再以步骤(1.1)相同的方法得到该幅医学病灶图像的病灶边界区域的二次运算的灰度值向量Al',然后按所述行队列的顺序分别计算每一灰度值向量Al'与病灶边界区域词典中每个单词的欧氏距离,并把每一灰度值向量Al'量化到与其欧氏距离最小的单词上,得到病灶边界区域词典中每个单词出现的频率,该频率数字所形成的一维向量即为该幅医学病灶图像的病灶边界区域的词袋BI ; (2. 3)将表示词袋BI和词袋B2的两个向量首尾连接排列成一个向量便得到该医学病灶图像的词袋模型。
2.根据权利要求I所述的一种医学病灶图像的词袋模型的构建方法,其特征在于,所述的小方块的大小为7X7的像素点阵列。
3.根据权利要求I或2所述的一种医学病灶图像的词袋模型的构建方法,其特征在于,所述的k均值聚类的k值为1000。
全文摘要
本发明涉及识别医学病灶图像,具体涉及一种医学病灶图像的词袋模型的构建方法,该方法首先将医学病灶图像划分为病灶区域和病灶边界区域两个部分,分别得到病灶区域和病灶边界区域的词袋,进而构建出病灶区域词袋和病灶边界区域词袋联合的词袋模型。本发明所述的构建方法得到的词袋模型相对于一般的词袋模型增加了病灶区域局部特征的相对空间位置信息,因此有助于提高临床诊断的准确性。
文档编号G06F17/30GK102663446SQ20121012324
公开日2012年9月12日 申请日期2012年4月24日 优先权日2012年4月24日
发明者冯前进, 阳维, 黄美燕 申请人:南方医科大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1