一种基于图熵的医学图像聚类方法

文档序号：9418261阅读：1617来源：国知局

一种基于图熵的医学图像聚类方法
【技术领域】
[0001] 本发明属于医疗信息技术领域，具体涉及一种基于图熵的医学图像聚类方法。
【背景技术】
[0002] 借着科学技术飞速发展的东风，医疗卫生事业的现代化程度不断加深。医学影像技术，如：电子计算机X射线断层扫描技术（CT)、正电子发射计算机断层扫描技术（PET)、核磁共振成像技术（MRI)等可辅助医生对病人的病情进行诊断，其在临床诊断的过程中得到大量使用，因此医院每天都会产生大量的医学图像。如何利用好这些医学图像，从这些图像的背后发掘出有价值的信息，以方便医生对病人的病情进行诊断，是当前对医学图像进行数据挖掘的热点。目前，对于医学图像的数据挖掘研究主要集中在对医学图像进行分类、聚类、相似性搜索以及关联规则等方面。
[0003] 聚类是数据挖掘领域一个重要组成部分，同时其在模式识别、生物学、图像处理、 Web信息检索等方面也有着广泛应用。如在图像检索领域中，通过图像聚类对图像进行聚类预处理可以提高图像的检索性能。在医学图像分析领域中，通常会使用分类方法将医学图像分成若干个类目，如：利用贝叶斯随机变量选择方法对大量的基因数据进行分类；使用关联规则和决策树的混合方法对脑部CT图像中是否含有肿瘤进行分类。然而随着存储的医学图像数量的不断增加，具有不同病理特征的脑部CT图像也会随之增加，分类方法需要提前对医学图像所要分成的类目数量进行指定已经不能准确刻画既有医学图像的特征。这时，通过使用聚类方法将医学图像按其既有特征划分成若干个类目是一个很好的选择，目前，聚类方法在对图像进行分割及图像聚类等方面得到了一定的应用，如：使用模糊C-均值（FCM)聚类算法对图像进行分割；采用k-均值聚类方法对MRI图像进行分割；使用k-均值及模糊k-均值方法对图像进行聚类；使用局部判别模型和全局融合的方法对图像进行聚类等。然而以上这些算法在应用的过程中需要指定参数，并且对参数的选取也很敏感。因此，对不需提前指定类别数目的医学图像聚类方法进行研究，有很高的实际意义和应用价值。

【发明内容】

[0004] 本发明的目的是提出一种基于图熵的能够缩短医学图像聚类时间并保证准确率的基于图熵的医学图像聚类方法。
[0005] 本发明的目的是这样实现的：
[0006] (1)待聚类图像提出聚类请求：待聚类图像为原始医学图像数据；
[0007] (2)图像预处理过程：对原始医学图像提取感兴趣区域，计算图像ROI区域的灰度直方图，得到图像ROI区域的灰度直方图的波谷列表，根据波谷列表对图像分级提取纹理特征，将得到的分级纹理图像规范化到统一的大小，之后将此纹理图像分区域，通过比较两张纹理图像对应区域的直方图的差值之和，来衡量医学图像之间的相似程度；
[0008] (3)图的稀疏化：将医学图像集抽象成带权无向完全图，之后对其进行稀疏化剪枝处理；
[0009] (4)基于图熵的带权无向图聚类：计算带权无向图中顶点熵和图熵，并在此基础上为图熵的带权无向图聚类；
[0010] (5)展示结果。
[0011] 所述的图的稀疏化过程为：首先将医学图像集抽象成图，其中，每个顶点代表一张医学图像，医学图像之间的相似度作为顶点之间所连边上的权值，所够成的图是一个带权无向完全图；之后根据稀疏因子e，e的取值范围是[0, 1]，每个顶点将会保留[cf]条边，其中d为该顶点原有边的数量；当边在稀疏化过程中被其两个端点均保留时，则此边将继续保留在图中，否则将从图中删除；此时图中所留下的边为两个顶点在剪枝过程中均要保留的公共边。
[0012] 所述的基于图熵的带权无向图聚类：计算带权无向图中顶点熵和图熵；在形成每个簇的过程中，通过使在此簇的件下图熵的值达到最小来优化此簇的结果，迭代上述过程来形成聚类结果集合C 1. . . Cn。
[0013] 本发明的有益效果在于：
[0014] 本发明提出利用图熵的方法对医学图像进行聚类，通过将医学图像集抽象成完全图，之后对其进行稀疏化剪枝处理，所留下的边说明两张图像均认为与对方很相似，最后提出带权无向图的聚类方法。通过以上过程对医学图像进行聚类，可以有效的降低聚类时间而且聚类的准确率也没有明显的降低，利用这种方法可以辅助医生在日常工作中对病人的病情进行诊断。
【附图说明】
[0015] 图1是带权无向图中顶点熵和图熵计算方法举例；
[0016] 图2(a)是脑部CT纹理图像构建带权无向完全图的过程；
[0017] 图2(b)是带权无向完全图剪枝过程；
[0018] 图2(c)是剪枝完成之后的图；
[0019] 图2(d)是图2(c)的同构图。
【具体实施方式】
[0020] 下面结合附图和具体实施对本发明作进一步的说明：
[0021] 本发明包括如下步骤：
[0022] (1)图像预处理过程：对原始医学图像提取感兴趣区域（ROI，Region Of Interest)，计算图像ROI区域的灰度直方图，得到图像ROI区域的灰度直方图的波谷列表，根据波谷列表对图像分级提取纹理特征，根据实际需要将得到的分级纹理图像规范化到统一的大小，之后将此纹理图像分成若干区域，通过比较两张图像对应区域的LBP (Local Binary Patterns)直方图的差值之和，来衡量医学图像之间的相似程度；
[0023] (2)图的稀疏化过程：将医学图像集抽象成带权无向完全图，之后对其进行稀疏化剪枝处理；
[0024] (3)基于图熵的带权无向图聚类方法：给出带权无向图中顶点熵和图熵的计算方法，并在此基础上提出了基于图熵的带权无向图聚类方法；
[0025] 进一步的1.基于图熵的医学图像聚类方法，其特征在于，包括如下步骤：
[0026] I. 1待聚类图像提出聚类请求：待聚类图像为原始医学图像数据；
[0027] 1.2图像预处理过程：对原始医学图像提取感兴趣区域（ROI，Region Of Interest)，计算图像ROI区域的灰度直方图，得到图像ROI区域的灰度直方图的波谷列表，根据波谷列表对图像分级提取纹理特征，根据实际需要将得到的分级纹理图像规范化到统一的大小，之后将此纹理图像分成若干区域，通过比较两张纹理图像对应区域的LBP (Local Binary Patterns)直方图的差值之和，来衡量医学图像之间的相似程度；
[0028] 1. 3图的稀疏化：将医学图像集抽象成带权无向完全图，之后对其进行稀疏化剪枝处理；
[0029] 1.4基于图熵的带权无向图聚类方法：给出带权无向图中顶点熵和图熵的计算方法，并在此基础上提出了基于图熵的带权无向图聚类方法；
[0030] 1. 5展示结果：基于图熵的带权无向图聚类方法将原始图像数据库中的图像实现聚类。
[0031] 所述的图稀疏化过程为：首先将医学图像集抽象成图，其中，每个顶点代表一张医学图像，医学图像之间的相似度作为顶点之间所连边上的权值，所够成的图是一个带权无向完全图。之后，根据稀疏因子e的选取情况（e的取值范围是[0, 1])，每个顶点将会保留条边，其中d为该顶点原有边的数量。当边在稀疏化过程中被其两个端点均保留时，则此边将继续保留在图中，否则将从图中删除。此时图中所留下的边为两个顶点在剪枝过程中均要保留的公共边。
[0032] 所述的基于图熵的带权无向图聚类方法为：首先，给出带权无向图中顶点熵和图熵的计算方法；之后，在形成每个簇的过程中，通过使在此簇的件下图熵的值达到最小来优化此簇的结果，迭代上述过程来形成聚类结果集合C 1. .. Cn。
[0033] 本发明的具体内容包括：
[0034] 首先对医学图像进行预处理：
[0035] 1.对原始图像库中的每一张原始的脑部CT图像提取ROI区域；
[0036] 2.截取ROI区域并校正；
[0037] 3.计算图像ROI区域灰度直方图的波谷分布情况，得到灰度直方图的波谷表；
[0038] 4.按照波谷表设置阈值对图像多次提取纹理，从而得到多级纹理图像；
[0039] 5.最后将多级纹理图像规范化为大小为COLUMNXROW的图像；
[0040] 6.计算每张纹理图像中纹理点的LBP值；
[0041] 7.对纹理图像进行分区，得到每个区域的LBP直方图；
[0042] 8.通过计算两张纹理图像间对应区域LBP直方图差值的和，来获得图像之间相似性权值；
[0043] 经过以上过程，每两张医学图像都会进行相似度权值计算，得到对应的权值。将这些医学图像抽象成一个带权无向完全图，利用稀疏化方法对每个顶点的边进行稀疏化剪枝处理，之后定义带权无向图中顶点熵和图熵，并给出基于图熵的带权无向图聚类方法，通过此方法得到医学图像的聚类结果；
[0044] 具体的一次图像聚类过程如下：
[0045] 1.对待聚类的医学图像进行预处理，先得到每张医学图像对应的纹理图像，之后得到医学图像间的相似性权值；
[0046] 2.将此医学图像集抽象成一个带权无向完全图G，将图中的所有边按照升序进行排列，之后选取稀疏因子e (e的取值范围是[0, 1])，保留每个顶点的前丨，1条权值最小的边 (d为该顶点之前所含有边的数量），以此来对此图进行稀疏化剪枝处理，边被保留的下规则是如果在此稀疏化过程中，该边被其两个端点均保留，则此边留下，否则将此边从图中删除。
[0047] 3.构建种子顶点候选集S，初始的S中为图中的所有顶点。第一步，从种子顶点候选集S中任意选取一个顶点作为种子顶点，将此顶点和它的邻居顶点一起构成初始的种子簇C，通过以下公式：

来计算每个顶点熵以及图熵。如果从簇C中移除种子顶点的某个邻居顶点会使图G的熵变小，那么将此邻居顶点移除，迭代第一步直到图G的熵不能再变小为止。第二步，如果将簇C的某个外边界顶点（即与簇C的顶点相连又不在C中的顶点）加入到簇中会使图G的熵继续变小，则将此顶点加入到簇C中，迭代第二步，直到图G的熵不能再继续变小为止。第三步，此时所得到的簇C就是聚类结果中的一个簇，将此簇中的顶点从种子顶点候选集中删去。迭代第一、第二、第三步，直到种子顶点候选集S为空才停止，此时已将图G聚类完毕。
[0048] 以上实例表明，本发明提出的基于图熵的医学图像聚类方法具有实际的应用价值。
[0049] 本发明还有这样一些技术特征：
[0050] 1. 一些定义和定理：
[0051] 定义1. 一个带权图是一个三元组G = (V，E, W)，其中V = Iv1, v2. . . vj是顶点集，E ={e。|l<i<n，Kj<n，且i GV，j GV}是 VXV 的边集，W = (Wij |l<i<n，l<j<n 且i e V，j e V}为边集E上的权值集合，Wlj表示顶点V i和顶点V #目连的边e U上的权值。
[0052] 其中，顶点集中的每个顶点代表一张医学图像，边集代表每两张医学图像的相似性关系，权值集合的元素为医学图像之间的相似性权值。
[0053] 定理：当稀疏因子e辛1时，经过稀疏化剪枝处理后得到的图G'中，每个顶点\相比其原图G中所对应的顶点，至少会减少一条边。
[0054] 这个定

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：潘海为;战宇;韩启龙;谢晓芹;张志强;吴枰;
技术所有人：哈尔滨工程大学;
我是此专利的发明人

上一篇：采用旋转tin多级加密网的影像数字化方法
上一篇：一种基于火焰显著图和空间金字塔直方图的火灾检测方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。