一种基于概率潜语义分析模型的面向对象影像聚类方法

文档序号：6452749阅读：507来源：国知局

专利名称：一种基于概率潜语义分析模型的面向对象影像聚类方法
技术领域：
本发明涉及图像分析领域，尤其是涉及一种遥感影像处理的方法。
背景技术：
潜语义分析模型(Latent Semantic Analysis, LSA)是一种自然语言分析技术，由 Deerwester等人于年1990提出。该模型认为通过分析文档与词的共生矩阵，可较好地提取文档对应的语义信息。在实际文档识别与检索应用中，文档与词之间的语义信息一般通过概率主题来表示，在此基础上从而形成一系列的概率主题模型。一般而言，概率主题模型均拥有一个共同的理论前提，即每个文档均是由多个主题依据不同的比例混合构成的，但是不同的概率主题模型对于文档或主题的先验分布拥有不同的统计分布假设，从而适用于不同的分析目标。由于概率主题模型可较好的分析文档、主题以及词之间的统计相关关系，该类模型在计算机视觉、模式识别等领域均有较好的应用，在自然图像识别、检索、场景分析中有着较成功的应用案例。与此同时，在高分辨率遥感影像的分类研究中，影像、像元以及像元的归属类别之间的关系，与概率主题模型求解的问题极为相似，存在一定天然的关联关系，可尝试将该模型应用于遥感影像分类研究。目前使用较多的概率主题模型为概率潜语义分析(PLSA)模型与潜Dirichlet分析(LDA)模型，在不同的实际应用过程中也发展出了一系列的扩展模型。自然语言处理往往需要分析隐含于词背后的涵义，普通的词频分析方法不能取得较好的结果，而潜语义分析模型(LSA)通过利用奇异值分解将高维的词-文档共生矩阵映射至低维的语义空间，从而体现出深层次语义关系。Hofmarm在LSA模型的基础上，构建了概率潜语义分析模型(PLSA)，拥有更坚实的数学基础及易于利用的数据生成模型，可为信息提供更好的语义分析。PLSA模型分析的对象为文档与词汇的共生矩阵。若假设该矩阵由有M个文档，N个词的词汇表构成，则共生矩阵集可被视为一个MXN的矩阵。该共生矩阵中的任何一个文档可视为文档集D = W1, d2，…，dM}中的一个数据，任何一个词均可视为词汇集W= Iw1, w2，···，％}中的一个数据。共生矩阵中每一个文档与每一个词的语义关系需要通过一个主题来联系起来，这个主题可被视为潜变量集Z= Iz1, z2，···, zj中的一个数据。PLSA模型是通过文档与词的共生矩阵来分析文档集、词汇集与潜变量集之间的关联关系，从而获取文档与词的语义信息。在PLSA模型中，文档、潜变量及词的概率生成模型通常可定义为·文档Cli归属于文档集D的概率为P (Cli)；·文档Cli中潜变量Zk的条件概率为P (zk/dj ；·文档Cli中潜变量Zk对应词Wj的条件概率为P (wj/zk)；将概率生成模型中的条件概率可转换一定的联合概率模型，具体公式如式(1)与 (2)所示。P(C^Wj)=P(Cli)P(WjAli)(1)
权利要求
1.一种高分辨遥感影像的聚类分析方法，其特征在于该方法包括如下步骤1)影像文档的生成；2)影像最佳聚类个数的确定；3)利用影像文档结合PLSA模型获取每文档中视觉词对应主题类型的条件概率分布；4)结合视觉词的多个邻域文档计算原始影像中每个像元对应于每个聚类类型的条件概率分布，最终选择使最大的聚类类型作为像元的聚类类型。
2.如权利要求1所述的高分辨遥感影像的聚类分析方法，其特征在于该方法中步骤1)为影像文档以是hXh的子影像块来表示的，而影像文档集是通过将原始影像划分为具备一定重叠程度的子影像块来实现生成的。
3.如权利要求1所述的高分辨遥感影像的聚类分析方法，其特征在于该方法中步骤1)为影像文档集依据影像文档生成过程中重叠程度的不同而划分为影像训练文档集与影像推断文档集，其中不重叠的影像文档构影像训练文档集，而重叠的影像文档构成影像推断文档集。
4.如权利要求2或3所述的高分辨遥感影像的聚类分析方法，其特征在于该方法中步骤1)为只有训练文档被用来估计视觉词与主题之间的条件概率分布P(w|z)；当P(w|z)被估计出来后，训练文档中视觉词与主题之间的条件概率分布具备典型性，影像推断文档集中的视觉词与主题的条件概率分布符合相同的分布；然后在固定视觉词与主题的条件概率分布P(w|z)的基础上，通过影像推断文档集的EM算法迭代推断出每个文档中每个视觉词对应主题的条件概率分布P (z I d,w)，从而能够获取原始影像中每个像元在其邻域文档中对应主题的条件概率分布。
5.如权利要求1所述的高分辨遥感影像的聚类分析方法，其特征在于该方法中步骤2)为聚类中心个数的选择是通过MDL准则来实现的；MDL准则假设影像的特征符合高斯混合分布的特征，并利用最小描述长度的条件约束来获取最佳聚类中心个数。
6.如权利要求1所述的高分辨遥感影像的聚类分析方法，其特征在于该方法中步骤3)为当影像的聚类中心个数确定之后，通过利用PLSA模型来估计推断文档集中每个视觉词对应主题的条件概率的分布；该条件概率的估计流程整体上可以划分为两部分为PLSA 模型训练与PLSA模型推断；影像文档集在整体上被划分为两种类型，分别为训练文档集与推断文档集，而这两种文档集将被有效地应用于条件概率估计流程的两个阶段；在PLSA模型的训练阶段，利用训练文档集构建词与文档的词频共生矩阵，然后结合PLSA模型的训练可以获得训练文档集中视觉词对应主题的条件概率P (w I ζ)。
7.如权利要求1所述的高分辨遥感影像的聚类分析方法，其特征在于该方法中步骤4)为通过上述NSPLSA方法的基本流程，原始影像中每个像元在其邻域文档中的主题概率分布信息均可得到；每个像元都被多个邻域文档覆盖，而利用Wj表示原始影像中的像元j时，需要通过计算条件概率分布^(Zkj, )来最终该判定该像元最终的聚类类别归属。
8.如权利要求7所述的高分辨遥感影像的聚类分析方法，其特征在于该方法中步骤4) 为包括四个步骤1)、确定原始影像中每个像元对应的覆盖该像元的所有邻域文档；具体而言，是通过给定的视觉词q的坐标Ov yq)来寻找该像元对应的邻域文档集Dq，其中Dq中每个文档在空间位置上均覆盖视觉词q ；2)、利用视觉词q的坐标Ovyq)与邻域文档集Dq中邻域文档Cli的文档中心坐标 (~，八)来计算视觉词在其邻域文档中的概率权重PWi I Ci，q)，具体计算公式为
9.如权利要求1所述的高分辨遥感影像的聚类分析方法，其特征在于该方法包括步骤1)影像文档以是hXh的子影像块来表示的，而影像文档集是通过将原始影像划分为具备一定重叠程度的子影像块来实现生成的；影像文档集依据影像文档生成过程中重叠程度的不同而划分为影像训练文档集与影像推断文档集，其中不重叠的影像文档构影像训练文档集，而重叠的影像文档构成影像推断文档集；只有训练文档被用来估计视觉词与主题之间的条件概率分布P(Wlz)；当P(w|z)被估计出来后，训练文档中视觉词与主题之间的条件概率分布具备典型性，影像推断文档集中的视觉词与主题的条件概率分布符合相同的分布；然后在固定视觉词与主题的条件概率分布P (W Iz)的基础上，通过影像推断文档集获取每个文档中每个视觉词对应主题的概率分布P (z I d,w)，从而能够获取原始影像中每个像元在其邻域文档中对应主题的概率分布；步骤2)聚类中心个数的选择是通过MDL准则来实现的；MDL准则假设影像的特征符合高斯混合分布的特征，并利用最小描述长度的条件约束来获取最佳聚类中心个数；步骤3)当影像的聚类中心个数确定之后，通过利用PLSA模型来估计推断文档集中每个视觉词对应主题的条件概率的分布；该条件概率的估计流程整体划分为两部分为PLSA 模型训练与PLSA模型推断；影像文档集在整体上被划分为两种类型，分别为训练文档集与推断文档集，而这两种文档集将被有效地应用于条件概率估计流程的两个阶段；在PLSA模型的训练阶段，利用训练文档集构建词与文档的词频共生矩阵，然后结合PLSA模型的训练可以获得训练文档集中视觉词对应主题的条件概率P (w I ζ)；步骤4)为原始影像中每个像元在其邻域文档中的主题概率分布信息均可得到；每个像元都被多个邻域文档覆盖，而利用Wj表示原始影像中的像元j时，通过计算条件概率分布乂…仏&？)来最终该判定该像元最终的聚类类别归属；包括四个步骤确定原始影像中每个像元对应的覆盖该像元的所有邻域文档；具体而言，是通过给定的视觉词q的坐标Ov yq)来寻找该像元对应的邻域文档集Dq，其中Dq中每个文档在空间位置上均覆盖视觉词q ；利用视觉词q的坐标O^ytl)与邻域文档集Dq中邻域文档Cli的坐标信息(、，来计算视觉词在其邻域文档中的概率权重PWi I Ci，q)，具体计算公式为
全文摘要
本发明涉及一种基于概率潜语义分析(PLSA)模型的面向对象影像聚类方法。通过将影像分割为不同尺寸的矩形影像块并引入计算机视觉的图像分析方法，从而将影像像素视为视觉词、影像块视为影像文档、像元归属的主题视为聚类中心。依据影像块的重叠程度将影像文档划分为训练文档集与推断文档集，然后利用训练文档训练PLSA模型可获取影像聚类的最佳聚类中心与训练文档中视觉词与主题的先验概率。将推断文档中的视觉词的先验概率视为与训练文档中的先验概率一致，利用PLSA模型的EM算法循环迭代推断出文档集中每个文档中视觉词的主题类型，从而确定出每个视觉词在其邻域文档中的主题类型。分析视觉词与领域文档的距离并进行一定的高斯距离权重分配，选择权重最大的主题视为聚类类型，从而将空间信息引入聚类算法，最终形成面向对象的影像聚类结果。本发明方法可以得到一般单纯使用像元信息进行聚类所无法实现的效果，从而可以满足不同高分辨率遥感影像分析与应用的需求。
文档编号G06K9/62GK102314610SQ201010220330
公开日2012年1月11日申请日期2010年7月7日优先权日2010年7月7日
发明者唐宏, 易文斌, 陈云浩申请人:北京师范大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：唐宏;陈云浩;易文斌
技术所有人：北京师范大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。