一种基于泛函映射的多模态图像分割方法

文档序号：8457776阅读：1708来源：国知局

一种基于泛函映射的多模态图像分割方法
【技术领域】
[0001] 本发明属于图像处理中的图像分割技术领域，特别是基于泛函映射的多模态图像分割方法。
【背景技术】
[0002] 数字图像技术的蓬勃发展催生了大量的新兴产业，如遥感卫星图像定位、医学影像分析、交通智能识别等等，促进了信息化社会的日臻成熟。图像作为人类感知世界的重要桥梁，与视觉领域也紧密相关。例如，图像处理在人工智能、机器视觉、生理学、医学、气象学、军事学等领域的各类视觉应用中的需求不断增长，并且发挥着越来越关键的作用。而图像分割作为图像预处理方法，为图像中高层语义分析奠定了坚实的基础，例如图像识别、目标定位、边缘检测等许多应用中均可使用图像分割技术提升性能。
[0003] 图像分割，顾名思义是将给定的图像按照某种规则或目标进行区域分割。例如，一副湖边拍摄的图像可以分割为湖面、人、小船、房屋、树丛、天空等多个代表不同语义类别的区域，这里的人和小船可以看做目标前景对象，其余的可看做背景对象。传统的图像分割技术主要针对单幅图像的灰度、颜色、纹理、形状等线索进行处理，典型的方法有阈值分割、区域分割、边缘分割、图分割、基于能量泛函分割等。例如阈值分割方法根据设定阈值对灰度值判断其所属类别；边缘分割方法根据边缘灰度值具有阶跃性或突变性等特点进行检测；区域分割方法根据图像相似性准则进行判定，主要有分水岭、区域分裂合并、阵子区域生长等技术；图分割将图像看做以像素为顶点而相邻像素用边连接的无向图，每个分割区域看做图中的子图；基于能量泛函分割利用连续曲线表示目标边缘，并通过能量泛函最小化求解分割结果，一般分为参数活动轮廓模型和几何活动轮廓模型两种。
[0004] 上述方法的不足点主要表现在以下几个方面：第一，直接针对图像原始像素处理，增加了算法的时间复杂度，加大了计算开销；第二，底层处理技术如阈值分割和边缘分割很难与图像的语义特征建立关联；第三，忽略了图像之间的互补信息，尤其是包含相似目标的图像之间存在一些共同的结构和潜在信息，直接影响了图像目标的分割效果。因此，这些方法并不适合大规模的包含共同目标的图像分割任务，由此对数量级较大的图像识别、目标定位等实际应用产生一定的不利影响。基于这些考虑，针对智能交通识别、医学影响分析、大规模图像识别等应用领域，迫切需要设计一种能建立图像底层特征与语义特征的关联，并可多方位有效利用图像之间的潜在结构信息的图像分割技术。

【发明内容】

[0005] 为了有效利用图像之间的潜在结构信息，降低图像分割处理的计算复杂度，提升图像中的目标分割效果，本发明提出了一种基于泛函映射的多模态图像分割方法，该方法包括以下步骤：
[0006] 1、获取包含目标的图像集合后，进行以下操作：
[0007] 1)将集合中的各图像分割成超像素块，用不同的特征描述子表征分割后的超像素以获得多模态图像表示；
[0008] 2)在多模态图像上建立基于超像素的图，并构建相应的拉普拉斯矩阵；
[0009] 3)表征每幅图像的约减泛函空间，建立图像对之间的泛函映射；
[0010] 4)将每种模态的图像泛函映射与图像线索对齐，并引入隐函数保持泛函映射之间的一致性；
[0011] 5)依据多模态映射一致性获得泛函映射表达，通过联合优化目标函数计算图像对应的分割函数，得到图像最优分割表示，完成图像分割。
[0012] 进一步，所述的步骤1)中所述的将集合中的各图像分割成超像素块，用不同的特征描述子表征分割后的超像素以获得多模态图像表示，具体是：
[0013] 1)设集合由n幅相关联的图像组成，记为:^认石…人卜每幅图像含有一个或多个目标类，整个集合的目标类别数目为C;
[0014] 2)将图像中的像素看做图的顶点，利用图分割方法将集合中的图像划分为q个小区域（如100)，q为正整数，这些小区域由取值相近的像素点构成，称之为超像素，第i幅图像中属于第C类的分割块表示为Si。，其中i= {1，2,…，n}，C= {1，2,…，C};
[0015] 3)利用m种不同的特征描述子，如尺度不变特征变换（SIFT)、局部二值模式 (LBP)、梯度直方图（HOG)等，表征图像中的各超像素，从而获得多方位反映图像本征信息的多模态特征表示，如第i幅图像对应矩阵集合< ={<,足2，...，乂"'}，即第k种图像特征描述子对应第k种模态if。
[0016] 进一步，所述的步骤2)中的在多模态图像上建立基于超像素的图，并构建相应的拉普拉斯矩阵，具体是：
[0017] 2. 1)将每种图像模态上的q个超像素看做图的顶点，构建相应顶点全连接而成的超像素图；
[0018] 2.2)分别在各不同模态的超像素图上构建拉普拉斯矩阵/； = {^乂,2,...,1；"}，它们通过高斯加权策略计算的权重矩阵W获得，即L=D-W，其中D是一对角阵，其对角线元素为W的各列元素和。
[0019] 所述的步骤3)中的表征每幅图像的线性约减泛函空间，建立图像对之间的泛函映射，具体是：
[0020] 1)计算多模态的拉普拉斯矩阵/； = {6,以，...,1；"}的特征值和特征向量，并取前 P(P〈q)个特征向量张成约减泛函空间乃，且每幅图像的各模态上对应的特征值分别组成对角矩阵A,.二{ALaL.mA;"};
[0021] 2)设每幅图像分割函数为4对应Si。，该函数的搜索空间对应一组基向量丨所张成的p维空间巧，且4对第i幅图像的系数表示为线性函数组合 P /= ；￡./>/ =尽f，其中Bi为拉普拉斯矩阵前p个特征向量构成；
[0022] 3)通过线性泛函映射反映任意两两成对图像之间的关系，如从第i幅图像的子空间巧到第j幅图像的子空间巧的泛函映射用矩阵禹表示，即子空间乃中的函数映射到子空间乃中的表达值可由计算氏/得到。
[0023] 所述的步骤4)中的将每种模态的图像泛函映射与图像线索对齐，并引入隐函数保持泛函映射之间的一致性，具体是：
[0024] 1)图像线索对应不同的描述算子，每种模态的图像泛函映射与图像线索对齐通过优化以下表达式实现，即

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李平;李黎;李建军;俞俊;
技术所有人：杭州电子科技大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。