一种基于熵正则模糊非负矩阵分解的图像处理方法及系统

文档序号:33150347发布日期:2023-02-03 22:44阅读:33来源:国知局
一种基于熵正则模糊非负矩阵分解的图像处理方法及系统

1.本发明属于机器学习与图像处理技术领域,涉及高维数据分析与处理领域,特别涉及一种基于熵正则模糊非负矩阵分解的图像处理方法及系统。


背景技术:

2.随着大数据时代的到来,图像数据成为一项重要的信息资源,数据挖掘技术提供了从海量图像数据中以快速便捷的方式解读信息的方法。
3.在数据挖掘技术领域中,聚类是一种致力于将数据集中彼此相近或相似的数据归并在一起的方法,是一项非常重要无监督知识发现任务。在最近的几十年里,各种各样的聚类算法(例如,k均值算法、模糊k均值算法、均值偏移等聚类算法)被人们不断提出并取得了较好地效果;然而,这些传统方法对非结构化的高维数据,例如:自然图像、遥感高光谱数据等,往往由于“维数灾难”问题而失效。
4.事实上,工业和商业中所需要处理的数据虽然都是高维的,但数据的本质特征通常位于相对低维的空间中,因此一般会寻求有效的表示工具将高维复杂的数据转化为低维的数据进行处理。非负矩阵分解(nonnegative matrix factorization:nmf)是解决这一问题的有效方法之一,其通过寻找两个小的非负矩阵,使得它们的乘积能够较好地逼近原始数据;这种纯加性的基于局部的数据表示方法已被证实与人脑的认知模式非常相似,因此nmf受到了人们的关注与应用。非负性的限制会导致表示的稀疏性,也使得nmf方法会更加鲁棒,nmf在人脸识别与文本聚类中已被证实是比奇异值分解(single value decomposition:svd)或主成分分析(principal component analysis:pca)更优的算法。然而,nmf因其模型的非凸性,问题本身是不适定的,存在较大的搜索空间,导致其在某些问题或数据中的精度不高、结果不理想;另外,在图像聚类或者遥感高光谱数据混合像元分解等问题中,nmf因其未对表示向量施加范围约束而缺乏一定的可解释性。


技术实现要素:

5.本发明的目的在于提供一种基于熵正则模糊非负矩阵分解的图像处理方法及系统,以解决上述存在的一个或多个技术问题。本发明提供的图像处理方法,可解决现有传统非负矩阵分解模型处理图像聚类或高光谱解混时存在的精度低、可解释性差等技术问题。
6.为达到上述目的,本发明采用以下技术方案:
7.本发明提供的一种基于熵正则模糊非负矩阵分解的图像处理方法,包括以下步骤:
8.获取待处理的图像矩阵;
9.采用基于熵正则模糊非负矩阵分解模型将所述图像矩阵分解为两个矩阵的乘积;
10.基于分解获得的两个矩阵,获得图像处理结果;
11.其中,所述基于熵正则模糊非负矩阵分解模型表示为,
12.[0013][0014]
式中,x为待处理的图像矩阵;u表示分解后的基矩阵,v表示分解后的表示矩阵;k为物质的个数,v
ki
为表示矩阵的第k行i列的元素;uk为基矩阵的第k列向量;xi表示x的列向量;tr()表示矩阵的迹,q,μ,λ为参数,分别表示分解后的矩阵逐元素非负;为表示矩阵的列和为为模糊聚类正则项,-λtr(vlog(v
t
))为熵正则项。
[0015]
本发明的进一步改进在于,所述采用基于熵正则模糊非负矩阵分解模型将所述图像矩阵分解为两个矩阵的乘积的步骤具体包括:
[0016]
步骤1,基于拉格朗日乘子法和库恩塔克条件求解所述基于熵正则模糊非负矩阵分解模型,得到迭代更新公式,表示为,
[0017][0018][0019]
式中,λi=diag(|vi|)∈rk×k,与v.
q-1
均表示对于矩阵逐元素进行计算;
[0020]
矩阵x,u增广表示为,
[0021]
步骤2,初始化基矩阵与系数矩阵并设置参数取值,;
[0022]
步骤3,依照步骤1得到的迭代更新公式以交替迭代的方式对图像矩阵进行熵正则模糊非负矩阵分解,求解得到模糊聚类表示矩阵;
[0023]
步骤4,判断是否达到预设终止条件;其中,若为否,则进入步骤5;若为是,则进入步骤6;
[0024]
步骤5:进行超参数λ的自适应更新,表示为,式中,为第k步迭代第i个样本点的熵正则参数,为第i个样本点熵;
[0025]
步骤6,停止循环,输出基矩阵u与表示矩阵v。
[0026]
本发明的进一步改进在于,所述待处理的图像矩阵为自然图像数据集;所述图像处理结果为聚类结果;
[0027]
所述基于分解获得的两个矩阵,获得图像处理结果的步骤包括:
[0028]
取表示矩阵v的每一列中最大元素所在行数为分类标签;其中,第i列中最大元素为v
ki
,表示自然图像数据集所形成的矩阵x的第i列所对应的图像属于第k类。
[0029]
本发明的进一步改进在于,所述待处理的图像矩阵为高光谱图像数据集;所述图像处理结果为解混结果;
[0030]
所述基于分解获得的两个矩阵,获得图像处理结果的步骤包括:
[0031]
基矩阵u的每一列表示一种基本地物光谱,将列向量按行或列重构成为预定大小的矩阵,获得对应物质的丰度图;其中,像元点越亮表示丰度值越大。
[0032]
本发明提供的一种基于熵正则模糊非负矩阵分解的图像处理系统,包括:
[0033]
获取模块,用于获取待处理的图像矩阵;
[0034]
分解模块,用于采用基于熵正则模糊非负矩阵分解模型将所述图像矩阵分解为两个矩阵的乘积;
[0035]
输出模块,用于基于分解获得的两个矩阵,获得图像处理结果;
[0036]
其中,所述基于熵正则模糊非负矩阵分解模型表示为,
[0037][0038][0039]
式中,x为待处理的图像矩阵;u表示分解后的基矩阵,v表示分解后的表示矩阵;k为物质的个数,v
ki
为表示矩阵的第k行i列的元素;uk为基矩阵的第k列向量;xi表示x的列向量;tr()表示矩阵的迹,q,μ,λ为参数,分别表示分解后的矩阵逐元素非负;为表示矩阵的列和为为模糊聚类正则项,-λtr(vlog(v
t
))为熵正则项。
[0040]
本发明的进一步改进在于,所述分解模块中,采用基于熵正则模糊非负矩阵分解模型将所述图像矩阵分解为两个矩阵的乘积的步骤具体包括:
[0041]
步骤1,基于拉格朗日乘子法和库恩塔克条件求解所述基于熵正则模糊非负矩阵分解模型,得到迭代更新公式,表示为,
[0042][0043][0044]
式中,λi=diag(|vi|)∈rk×k,与v.
q-1
均表示对于矩阵逐元素进行计算;
[0045]
矩阵x,u增广表示为,
[0046]
步骤2,初始化基矩阵与系数矩阵并设置参数取值,;
[0047]
步骤3,依照步骤1得到的迭代更新公式以交替迭代的方式对图像矩阵进行熵正则模糊非负矩阵分解,求解得到模糊聚类表示矩阵;
[0048]
步骤4,判断是否达到预设终止条件;其中,若为否,则进入步骤5;若为是,则进入步骤6;
[0049]
步骤5:进行超参数λ的自适应更新,表示为,式中,为第k步迭代第i个样本点的熵正则参数,为第i个样本点熵;
[0050]
步骤6,停止循环,输出基矩阵u与表示矩阵v。
[0051]
本发明的进一步改进在于,所述待处理的图像矩阵为自然图像数据集;所述图像处理结果为聚类结果;
[0052]
所述基于分解获得的两个矩阵,获得图像处理结果的步骤包括:
[0053]
取表示矩阵v的每一列中最大元素所在行数为分类标签;其中,第i列中最大元素为v
ki
,表示自然图像数据集所形成的矩阵x的第i列所对应的图像属于第k类。
[0054]
本发明的进一步改进在于,所述待处理的图像矩阵为高光谱图像数据集;所述图像处理结果为解混结果;
[0055]
所述基于分解获得的两个矩阵,获得图像处理结果的步骤包括:
[0056]
基矩阵u的每一列表示一种基本地物光谱,将列向量按行或列重构成为预定大小的矩阵,获得对应物质的丰度图;其中,像元点越亮表示丰度值越大。
[0057]
与现有技术相比,本发明具有以下有益效果:
[0058]
本发明提供的基于熵正则模糊非负矩阵分解的图像处理方法,在传统非负矩阵分解模型的基础上,考虑了对数据低维表示向量施加概率单纯形约束,使模型更具可解释性;另外,为了降低表示向量的不确定性,提升问题的适定性,将信息熵引入到模型当中,使得数据的表示更具稀疏性。
[0059]
本发明中,将模糊聚类正则和熵正则引入到基本非负矩阵分解nmf模型当中,并基于拉格朗日乘子法和库恩塔克条件推导得到了优化目标函数的乘性迭代公式;将所构建的模型和算法应用于自然图像聚类和遥感高光谱数据的解混问题当中,通过大量的数值实验和对比结果证明了本发明所提出的模型和方法的有效性和先进性。
附图说明
[0060]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面对实施例或现有技术描述中所需要使用的附图做简单的介绍;显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0061]
图1是本发明实施例提供的一种基于熵正则模糊非负矩阵分解的图像处理方法的流程示意图;
[0062]
图2是本发明又一实施例提供的一种基于熵正则模糊非负矩阵分解的图像处理方法的流程示意图;
[0063]
图3是本发明实施例中,本发明实施例提供的erf-nmf方法与现有nmf方法在yale和coil20数据集上提取的基矩阵和表示矩阵可视化结果对比示意图;其中,图3中的(a)、(d)、(g)依次分别是coil20、yale、mnist数据集的样本样例;图3中(b)、(e)、(h)依次分别是基于上述样本示例采用nmf产生的基矩阵;图3中(c)(f)、(i)依次分别是基于上述样本示例采用erf-nmf产生的基矩阵;图3中(j)和(k)依次分别是nmf和erf-nmf在yale数据集上所学习得到系数矩阵的可视化呈现示意图;
[0064]
图4是本发明实施例中,本发明实施例提供的erf-nmf方法在三幅高光谱数据上进行解混的结果展示示意图;其中,图4中(a)为samson数据集的原始高光谱图像,图4中(b)、(c)、(d)依次分别为samson数据集解混后不同物质的丰度图;图4中(e)为jasper数据集的原始高光谱图像,图4中(f)、(g)、(h)、(i)依次分别为jasper数据集解混后不同物质的丰度图;图4中(j)为urban数据集的原始高光谱图像,图4中(k)、(l)、(m)、(n)为urban数据集解混后不同物质的丰度图;
[0065]
图5是本发明实施例中,利用本发明实施例提供的方法进行公司考勤记录示意图;
[0066]
图6是本发明实施例提供的一种基于熵正则模糊非负矩阵分解的图像处理系统的示意图。
具体实施方式
[0067]
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0068]
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0069]
下面结合附图对本发明做进一步详细描述:
[0070]
请参阅图1,本发明实施例提供的一种基于熵正则模糊非负矩阵分解的图像处理方法,包括以下步骤:
[0071]
获取待处理的图像矩阵;其中,所述图像矩阵为自然图像数据集或高光谱图像数据集;
[0072]
采用基于熵正则模糊非负矩阵分解模型将所述图像矩阵分解为两个矩阵的乘积;
[0073]
基于所述两个矩阵,获得图像处理结果;具体解释性的,图像矩阵为自然图像数据集时,获得的图像处理结果为聚类结果;图像矩阵为高光谱图像数据集时,获得的图像处理结果为解混结果;
[0074]
其中,所述基于熵正则模糊非负矩阵分解模型表示为,
[0075][0076][0077]
式中,x为一个m
×
n的待处理的图像矩阵,每一列表示一副自然图像或高光谱数据的一个像元;u表示分解后的基矩阵;v表示分解后的表示矩阵;k为聚类数或者高光谱数据中物质的个数,v
ki
为表示矩阵的第k行i列的元素;uk表示基矩阵的第k列向量;xi表示数据x的列向量;tr()表示矩阵的迹,q,μ,λ为参数,分别表示分解后的矩阵逐元素非负,为表示矩阵的列和为1,即概率单纯形约束;为模糊聚类正则项,-λtr(vlog(v
t
))为熵正则项。
[0078]
本发明上述实施例提供的图像处理方法,可解决现有传统非负矩阵分解模型处理图像聚类或高光谱解混时存在的精度低、可解释性差等技术问题;本发明实施例提供的技术方案具有较好的精度以及可解释性。
[0079]
请参阅图2,本发明实施提供的一种基于熵正则模糊非负矩阵分解的图像处理方
法,具体步骤包括:
[0080]
步骤s1:基于熵正则与模糊聚类正则,构建如下目标函数,表达式为,
[0081][0082][0083]
式中,x为一个m
×
n的矩阵,每一列表示一副自然图像或高光谱数据的一个像元;u表示分解后的基矩阵;v表示分解后的表示矩阵;k为聚类数或者高光谱数据中物质的个数,v
ki
为表示矩阵的第k行i列的元素;uk表示基矩阵的第k列向量;xi表示数据x的列向量;tr()表示矩阵的迹,q,μ,λ为参数,分别表示分解后的矩阵逐元素非负,为表示矩阵的列和为1,即概率单纯形约束;特别地,为模糊聚类正则项,-λtr(vlog(v
t
))为熵正则项。
[0084]
步骤s2:基于拉格朗日乘子法和库恩塔克条件求解目标函数,得到迭代更新公式;上述目标函数经推导得到的迭代公式如下所示:
[0085][0086][0087]
其中,λi=diag(|vi|)∈rk×k,与v.
q-1
均表示对于矩阵逐元素进行计算;为满足表示矩阵列和为1(即:概率单纯形)的限制,对矩阵x,u作增广如下:
[0088][0089]
这样对矩阵进行增广之后,在矩阵v列和不为1时,便会造成一个与δ相关的损失。
[0090]
步骤s3:初始化基矩阵与系数矩阵并设置参数取值。
[0091]
步骤s4:依照上述步骤s2得到的迭代更新公式以交替迭代的方式对自然图像或高光谱数据进行熵正则模糊非负矩阵分解,求解得到模糊聚类表示矩阵v;
[0092]
步骤s5:判断是否达到终止条件,若为否,则进入步骤s6;若为是,则进入步骤s7;
[0093]
步骤s6:进行超参数λ的自适应更新,如下:
[0094][0095]
其中,为第k步迭代第i个样本点的熵正则参数,为第i个样本点熵;
[0096]
步骤s7:停止循环,输出基矩阵u与聚类表示矩阵v并根据其进行聚类判定。
[0097]
本发明实施例中,从矩阵分解结果中获取聚类结果的步骤包括:
[0098]
将原始矩阵x分解为基矩阵u和聚类表示矩阵v;
[0099]
对于自然图像聚类:关注聚类表示矩阵v,取v的每一列中最大元素所在行数为分类标签:第i列中最大元素为v
ki
,表示自然图像数据集所形成的矩阵x的第i列所对应的照片属于第k类。
[0100]
对于遥感高光谱数据的解混问题:关注基矩阵u,u的每一列表示一种基本地物光
谱,将列向量按行或列重构成为一个指定大小的矩阵,便形成了对应物质的丰度图,其中像元点越亮表示其丰度值越大。
[0101]
本发明实施例提供的熵正则模糊非负矩阵分解(entropy regularized fuzzy nonnegative matrix factorization:erf-nmf)方法,进行自然图像聚类或遥感高光谱数据解混,能够有效提高聚类或解混的精度(包括:准确度ac和归一化互信息nmi),可使分解结果更具稀疏性、可解释性更强。
[0102]
为了更好地展示本发明实施例提供的erf-nmf方法的有效性,下面针对不同的自然图像数据集和遥感高光谱数据数据集,使用多种聚类与高光谱解混方法与本发明进行对比。对比方法包括:
[0103]
基本非负矩阵分解方法(nonnegative matrix factorization:nmf);
[0104]
约束非负矩阵分解(constrained nonnegative matrix factorization:cnmf);
[0105]
k均值(k-means);
[0106]
非负局部坐标分解(nonnegative local coordinate factorization:nlcf);
[0107]
图正则化非负矩阵分解(graph regularized nmf:gnmf);
[0108]
联合稀疏度和低秩约束非负矩阵分解(joint sparsity and low-rank constrained non-negative matrix factorization:slrnmf);
[0109]
全变分正则化重加权稀疏非负矩阵分解(total variation regularized reweighted sparse nonnegative matrix factorization:tv-rsnmf)。
[0110]
本发明实施例所采用的自然图像数据集和高光谱数据数据集分别包括:
[0111]
coil20数据集:其中包含了从不同角度观察的20个物体的32
×
32像素的灰度图像,每一个物体有72张不同角度拍摄的图像;
[0112]
yale数据集:其中包含了15个人的32
×
32像素的灰度图像,每一个人11张不同表情或不同角度拍摄的图像;
[0113]
mnist数据集:其中包含了0到9共10个数字的28
×
28像素的灰度图像,每一个数字有约400张手写字体图片;
[0114]
samson数据集:数据有952
×
952像素,每个像素记录在156个通道上,覆盖401nm至889nm的波长,光谱分辨率3.13nm;
[0115]
jasper数据集:数据有512
×
614个像素,每个像素记录在范围从380nm到2500nm的224个通道中,光谱分辨率9.46nm;
[0116]
urban数据集:数据有307
×
307像素,每个像素对应一个2
×
2平方米的区域,记录范围从400nm到2500nm的162个通道,光谱分辨率10nm。
[0117]
请参阅图3,本发明实施例中,采用本发明实施例公开的方法erf-nmf与上述现有7种方法在以上数据集上进行实验对比,结果如表1至表3以及图3所示。
[0118]
表1.本发明erf-nmf方法与现有方法在coil20数据集上的结果对比
[0119][0120]
表2.本发明erf-nmf与现有方法在yale数据集上的结果对比
[0121][0122]
表3.本发明erf-nmf与现有方法在mnist数据集上的结果对比
[0123][0124]
请参阅上述表1至表3,表1至表3分别给出了本发明实施例公开的erf-nmf方法与另外7种现有聚类方法在coil20、yale以及mnist数据集上的聚类结果。从结果中可以发现,本发明实施例提供的方法在不同聚类个数设置下的精度ac与nmi都较其它方法好,特别是
平均精度(avg.)上的表现更加明显。本发明实施例实验中,对每一给定的聚类个数,随机选择对应聚类个数的样本类别,随后进行了10次独立实验进行对比分析;最终的实验结果取10次实验的平均值。结合三种图像数据集的实验结果不难发现,使用本发明方法erf-nmf在准确度ac和互信息度nmi方面显示出了明显的优势。例如,在手写数字集mnist上,可以发现,与其它7种方法相比,当聚类数的值不同时,采用本发明的erf-nmf聚类方法在准确度和互信息度中都是最高的。此外,在人脸识别的经典数据集yale中,本发明的方法erf-nmf也显示出了较好的优势。综上,通过与当前流行的基于矩阵分解的聚类方法在多个数据集上进行对比,可以发现,本发明实施例所提出的熵正则模糊非负矩阵分解图像聚类方法具有更高的聚类准确度。
[0125]
请参阅图3,图3展现了本发明实施例方法erf-nmf与传统的非负矩阵分解nmf在进行图片聚类分析过程中的特征提取的可视化对比。图3中(a)、(d)、(g)分别是coil20、yale、mnist数据集的样本样例;图3中(b)、(e)、(h)是nmf产生的基矩阵;图3中(c)(f)、(i)是erf-nmf产生的基矩阵;图3中(j)和(k)分别是nmf和erf-nmf在yale数据集上所学习得到系数矩阵的可视化呈现。本发明实施例中,将原始图像与erf-nmf所提取出来的基向量进行对比,发现erf-nmf所提取出来的特征与样本中的原始图像非常相近,这也解释了算法erf-nmf所提取出来的特征可以充分靠近原始图像;从(j)和(k)中可以看出,erf-nmf分解得到的系数矩阵的黑色部分更多,这代表具有更好的稀疏性。
[0126]
对比结果可以发现,采用本发明的方法所提取的特征是图像的部分特征,更具有局部性和稀疏性,从而可解释性更好。为了量化分析稀疏性,表4给出了两种方法对yale数据集在不同聚类个数k的情况下得稀疏度比较,从对比结果可以发现,本发明的erf-nmf方法学习的表示更具稀释性。
[0127]
表4.本发明erf-nmf与nmf方法对yale数据集上在不同聚类个数k下的稀疏度对比
[0128][0129]
此外,本发明所构建的模型非常适用于解决高光谱数据混合像元分解问题,即:高光谱解混问题。高光谱解混(hyperspectral unmixing)就是把通过高光谱传感器获取的高光谱数据中的混合像元分解成不同的基本地物光谱,又称为端元,以及这些基本地物在每个混合像元中所占的比例的一个过程。从研究方法上来讲,高光谱解混可以看成是对像元的模糊聚类问题,属于模式识别和机器学习的研究范畴;也可以看成是盲信号分离问题,属于信号处理的研究内容。此外,高光谱解混虽然已在众多实际问题中得到了应用,但是,还存在大量尚未解决的问题,仍然是国内外遥感光谱图像研究的热点。
[0130]
数学上,高光谱解混问题等价于带概率单纯形约束的非负矩阵分解问题,因此,非常适合用本发明构建的erf-nmf模型进行求解。为了进一步验证本发明方法的性能,本发明实施例将对三幅实际高光谱数据对本发明方法进行测试,其结果如图4所示。图4中,第一列为原始高光谱数据,剩余图为求解出来的不同物质的丰度图,图4中像元点越亮表示其丰度值越大(最大为1),越暗表示丰度值越小(最小为0)。从它们的丰度图中可以看出,本发明提出的erf-nmf方法可以清晰的解混出不同物质的含量和分布,使得结果更具有可解释性和实际意义。
[0131]
本发明实施例所提供的熵正则模糊非负矩阵分解erf-nmf方法可以应用于图像的聚类分析以及遥感高光谱数据的解混问题当中。具体地,以matlab为实现工具,借助yale人脸数据集,对熵正则模糊非负矩阵分解erf-nmf模型的图像聚类及高光谱解混方法进行具体实施说明与讲解。具体实施过程中,以耶鲁大学人脸数据集采集的15个人的不同表情照片为例,在此数据集中,每一个人有11张照片,共165张照片;每一张照片由32
×
32个像素点组成;每一个像素点的取值为[0,255]。该数据集将单张照片的1024个像素点排成一行,一共15个人,每一个人11张照片,所以一共有165行。以这样的排列方式形成的人脸数据集就是一个165
×
1024的矩阵x,且矩阵中元素的取值范围为[0,255],是一个元素非负的矩阵。进一步,将矩阵x进行转置,矩阵的每一列的物理意义就是一张照片。利用本发明提出的erf-nmf方法进行聚类过程如下:
[0132]
步骤s1:基于熵正则和模糊聚类正则,构建非负矩阵x分解的目标函数。
[0133]
步骤s2:基于拉格朗日乘子法和库恩-塔克条件,求解目标函数得到迭代更新公式。具体的,引入λi=diag(|vi|)∈rk×k;
[0134]
由于对任意的矩阵a,有||a||2=tr(aa
t
),故目标函数可以重写如下:
[0135][0136]
进一步,令ψ
jk
和φ
ki
分别为限制条件u
jk
≥0和v
ki
≥0对应的拉格朗日乘子。定义矩阵ψ=[ψ
jk
]和φ=[φ
ki
],则目标函数o的拉格朗函数为:
[0137][0138]
其中,符号以及v.
q-1
均表示对矩阵中逐个元素的运算。此外,定义c=diag(x
t
x)∈rn,则式中c=(c,

,c)
t
∈rk×n;定义d=diag(u
t
u)∈rk,则式中d=(d,

,d)∈rk×n;符号1表示一个k
×
n阶的元素全为1的矩阵。注意到有如下库恩-塔克条件:
[0139][0140][0141][0142]
对关于u,v分别求偏导后,两边同时乘以u,v,得到:
[0143][0144][0145]
特别地,为满足系数矩阵列和为1的限制,我们对矩阵x,u作延拓如下:
[0146][0147]
由此得到如下的乘法更新公式:
[0148][0149][0150]
步骤s3:初始化基矩阵与系数矩阵并设置参数选择范围。具体的,本发明利用随机数或是在样本中随机选择来初始化基矩阵u;参数选择范围的设置一般先粗略尝试大致的值,选择效果较好的参数值周围作为参数选择范围;这里我们设置q=1.0:0.1:1.4,μ=4:0.1:5.5,λ=0.3:0.1:2.1;同时设置分类数k=2:1:15;
[0151]
步骤s4:依照上述的迭代更新公式,采用交替迭代的方法对yale图像x进行熵正则模糊非负矩阵分解,获取表示矩阵v,然后将表示矩阵设定为聚类标签。具体的,在matlab程序中输入上述的迭代更新公式,设置迭代停止条件为400次,在迭代停止时会得到分解后的基矩阵u与系数矩阵v。此时,取v的每一列的所在行为分类标签,例如第i列最大元素为v
ki
,则x的第i列所对应的照片属于第k类。
[0152]
步骤s5:判断是否满足终止条件(例如:最大迭代次数),若不满足,则进入步骤s6;若满足,则进入步骤s7。
[0153]
步骤s6:进行新的一组参数选择,并按如下方式自动更新超参数λ
[0154][0155]
具体的,参数的值增加一个步长,按照上述公式更新λ的值,然后进入下一循环;其中,定义第k步迭代第i个样本点的参数为为熵值;
[0156]
步骤s7:停止循环,输出基矩阵u与聚类表示矩阵v并根据其进行聚类判定。
[0157]
请参阅图5,本发明实施例首先假设如下场景:在一家公司中有10名雇员,需要利用公司门口的摄像头识别雇员身份以此记录考勤状况。在这样一种假设情形下,最关键的问题在于雇员身份的识别,即利用采集完成的雇员图片数据集,识别摄像头拍摄的人脸为哪位雇员。本发明实施例具体的实现步骤如下:
[0158]
步骤s0:采集雇员不同表情不同光线下的照片各10张,每张照片为100
×
100像素;将单张照片的10000个像素点平铺称为一列,将10名雇员共100张照片整理形成10000
×
100的矩阵x。
[0159]
步骤s1至s7对应本发明实施例提出的基于熵正则模糊非负矩阵分解的图像聚类及高光谱解混方法的具体实现步骤,包括:
[0160]
步骤s1:基于熵正则与模糊聚类正则,构建目标函数。
[0161]
步骤s2:基于拉格朗日乘子法和库恩塔克条件求解目标函数,得到迭代更新公式。
[0162]
步骤s3:初始化基矩阵与系数矩阵并设置参数取值。
[0163]
步骤s4:依照上述步骤s2得到的迭代更新公式以交替迭代的方式对自然图像或高光谱数据进行熵正则模糊非负矩阵分解,求解得到模糊聚类表示矩阵v;
[0164]
步骤s5:判断是否达到终止条件,若为否,则进入步骤s6;若为是,则进入步骤s7;
[0165]
步骤s6:进行超参数λ的自适应更新;
[0166]
步骤s7:停止循环,输出基矩阵u与聚类表示矩阵v并根据其进行聚类判定;
[0167]
步骤s8:对于某雇员考勤当天在门口摄像头处所拍摄的100
×
100像素的照片,按照步骤s0中整理单张照片的方法,将其平铺成为10000
×
1的向量x,求解方程uv=x,其中u为步骤s7中输出的基矩阵,v为需要求解的未知量,x为上述的由单张照片整理成的向量。取v中最大值分量所在行数c为照片x所属的类别,即照片x是雇员c的照片。由此便可以利用本发明实施例提供的方法完成人脸识别与考勤记录。
[0168]
以上为利用本发明实施例提供的方法进行自然图像处理的具体应用说明;对于高光谱数据解混的应用,请参考上文中对于高光谱解混的说明。综上,本发明属于通用数据分析与处理技术领域,具体地说,涉及一种熵正则模糊非负矩阵分解(entropy regularized fuzzy nonnegative matrix factorization,erf-nmf)高维矩阵表示模型及方法,并将其应用于自然图像的聚类和遥感高光谱数据的解混问题当中;本发明包括:对数据的低维表示向量施加概率单纯形约束,使模型更具可解释性;为降低表示向量的不确定性,将信息熵引入到模型当中,使得数据的表示更具稀疏性;将模糊聚类正则和熵正则引入到基本非负矩阵分解模型当中,构建熵正则模糊非负矩阵分解的目标函数;基于拉格朗日乘子法和库恩塔克条件推导得到优化目标函数的乘性迭代算法,求解出数据的低维表示向量;将所构建的模型和算法应用于自然图像聚类和遥感高光谱数据的解混问题当中,并通过大量的数值实验和对比结果证明了所提出的模型和方法的有效性和先进性。本发明通过表示向量的归一化限制使得表示具有概率解释意义,并从信息论出发引入熵的概念来限制数据表示的不确定性,有效地结合了非负矩阵分解以及模糊聚类的优越性,具有优秀的自然图像数据聚类和高光谱数据解混结果。
[0169]
下述为本发明的装置实施例,可以用于执行本发明方法实施例。对于装置实施例中未纰漏的细节,请参照本发明方法实施例。
[0170]
请参阅图6,本发明一实施例中,提供一种基于熵正则模糊非负矩阵分解的图像处理系统,包括:
[0171]
获取模块,用于获取待处理的图像矩阵;
[0172]
分解模块,用于采用基于熵正则模糊非负矩阵分解模型将所述图像矩阵分解为两个矩阵的乘积;
[0173]
输出模块,用于基于分解获得的两个矩阵,获得图像处理结果;
[0174]
其中,所述基于熵正则模糊非负矩阵分解模型表示为,
[0175][0176][0177]
式中,x为待处理的图像矩阵;u表示分解后的基矩阵,v表示分解后的表示矩阵;k为物质的个数,v
ki
为表示矩阵的第k行i列的元素;uk为基矩阵的第k列向量;xi表示x的列向量;tr()表示矩阵的迹,q,μ,λ为参数,分别表示分解后的矩阵逐元素非负;为表示矩阵的列和为为模糊聚类正则项,-λtr(vlog(v
t
))为熵正则项。
[0178]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机
可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0179]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0180]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0181]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0182]
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1