基于增量式凸局部非负矩阵分解的数据处理方法

文档序号:9631520阅读:481来源:国知局
基于增量式凸局部非负矩阵分解的数据处理方法
【技术领域】
[0001] 本发明属于数据处理技术领域,涉及增量数据的处理方法,可用于图像、视频和网 络访问记录的数据处理。
【背景技术】
[0002] 随着物联网、传感器和计算机等相关技术的飞速发展,数据以爆炸式的速度动态 增长,如监控视频、网络访问等,且数据维数越来越高,人们不得不面临分析和处理各种大 规模海量高维数据的任务。如何从浩如烟海的数据海洋里迅速且准确地获取有用或最 需要的信息,成为迫在眉睫的问题。数据降维是解决"维数灾难"的一种有效方法。传统 的降维方法包括:主成分分析、独立成分分析、Fisher判别分析等,该类方法允许结果为 负,但负值元素在处理图像、视频等高维数据时,缺乏直观的物理意义,而非负矩阵分解 (Non-negativeMatrixFactorization,NMF)成功解决了这个难题。
[0003] LeeDD,SeungHS.等人于1999年在著名的Nature上提出了一种非负矩阵分解 NMF方法[Learningthepartsofobjectswithnonnegativematrixfactorization. Nature, 40U6755) :788-791],该方法能够大大降低数据特征的维数,挖掘数据潜在的内部 结构特征,大幅度节省存储空间和计算资源,具有明确的物理意义,同时具备局部感知全局 的智能特性。
[0004] 而基本非负矩阵分解NMF方法在处理增量数据时,需要对历史数据和新增数据全 部分解处理,消耗了大量的计算资源和存储资源,大大降低了方法的效率,同时,输入矩阵 的严格非负性要求,极大地限制了该类方法的应用领域。

【发明内容】

[0005] 本发明针对上述已有技术的不足,提出了基于增量式凸局部非负矩阵分解的数据 处理方法,以解决基本非负矩阵分解方法不能处理负值数据的缺陷,同时解决常规方法在 处理增量式数据时效率不高、严重消耗计算资源和存储资源的问题。
[0006] 本发明的技术关键是:首先,对基本非负矩阵分解NMF方法进行了核拓展,构成凸 非负矩阵分解CNMF方法的目标函数;其次,对此目标函数引入正交约束和稀疏约束,构成 凸局部非负矩阵分解CLNMF方法的目标函数;最后,对该方法进行增量处理,构成本发明的 增量式凸局部非负矩阵分解ICLNMF方法,其实现方案包括如下:
[0007] (1)获取固定大小pXn的数据,作为初始数据,并表示成初始矩阵V。,其中,p表示 单个样本的维数,η表示样本个数;
[0008] (2)对基本非负矩阵分解NMF目标函数进行核拓展,构成凸非负矩阵分解CNMF的 目标函数:
[0009]
[0010] 其中,W。和Η。分别是对初始矩阵V。进行分解期望得到的基矩阵和系数矩阵,||:*κ 表示矩阵的F范数的平方;
[0011] (3)对步骤(2)中目标函数的基矩阵W。施加正交约束,系数矩阵Η。施加稀疏约束, 构成凸局部非负矩阵分解CLNMF的目标函数F_f (V。| |V^H。):
[0012]
[0013] 其中,| | · | |u表示矩阵的L1范数,Tr〇表示求矩阵的迹,T表示矩阵的转置,δ 是正交调节参数,用于控制正交约束项对目标函数影响的大小,以调节正交约束项与准确 重构之间的平衡,Φ是稀疏调节参数,用于控制稀疏约束项对目标函数影响的大小,以调节 稀疏约束项与准确重构之间的平衡;
[0014] (4)对凸局部非负矩阵分解CLNMF的目标函数F_f(Vq| |VQWQH。)优化求解,得到基 矩阵W。和系数矩阵Η。;
[0015] (5)继续获取固定大小ρΧη的数据,作为第1次待处理的增量数据,并表示成相应 的新数据矩阵ν;
[0016] (6)将新数据矩阵ν代入凸局部非负矩阵分解CLNMF的目标函数中,得到对应于新 数据矩阵ν的新目标函数faNMF(νIIvW"h):
[0017]
[0018] 其中,Wm和h分别对新数据矩阵ν进行分解期望得到的基矩阵和系数矩阵;
[0019] (7)将初始矩阵V。赋值给数据矩阵,将步骤(3)目标函数中的W。替换为H。 替换为Η",ν。替换为V",此时m=1;并与步骤(6)中的目标函数进行加权结合,得到增量式 凸局部非负矩阵分解ICLNMF的目标函数F:
[0020]
[0021] 其中,Η"表示用于联系前后两次数据分解的过渡系数矩阵,存储前一次分解得到 的系数矩阵,α为控制目标函在增量式凸局部非负矩阵分解中作用大 小的权值,β为控制目标函数fa_(v| |vW"h)在增量式凸局部非负矩阵分解中作用大小的 权值,且 〇<α<1,〇<β<1,α+β=1;
[0022] (8)对增量式凸局部非负矩阵分解的目标函数F优化求解,实现对新数据矩阵ν的 分解,得到对应的系数矩阵h和基矩阵
[0023] (9)初始化一个空的存储矩阵H,将过渡系数矩阵Η"中的数据保存到存储矩阵Η 中,之后将过渡系数矩阵Η"清空,再将此时的系数矩阵h的值赋值给过渡系数矩阵Η",之后 将系数矩阵h清空用于存储下次处理结果;
[0024] (10)将数据矩阵清空,把新数据矩阵ν赋值给数据矩阵V",赋值结束后,将新 数据矩阵ν清空,存储第m+1次获得的大小为ρΧη的数据,作为待处理的新数据矩阵,m= 1, 2,. . . ,Μ;
[0025] (11)当接收数据的次数达到设置的Μ时,增量数据处理完毕,结束处理过程;否 贝1J,将通过赋值得到的过渡系数矩阵Η"、数据矩阵V"以及第m+1次获得的新数据矩阵ν代 入到步骤(7)的目标函数中,得到与之对应的目标函数,重复步骤(8)到步骤(11)的操作。
[0026] 本发明相比于现有技术具有如下优点:
[0027] 1)本发明在基本非负矩阵分解方法的基础上进行核拓展,能够直接对含有负值的 数据进行处理,扩展了应用领域的范围;
[0028] 2)本发明通过对基矩阵施加正交约束、对系数矩阵施加稀疏约束,使得分解结果 具有良好的正交性和稀疏性;
[0029] 3)本发明对于增量数据,采用增量式处理方法,大大节省了处理时间,提高了方法 的效率。
【附图说明】
[0030] 图1是本发明的实现流程图;
[0031] 图2是本发明与基本NMF方法随样本增加次数变化的运行迭代时间对比结果图。
【具体实施方式】
[0032] -、基础理论介绍
[0033] 信息时代使得人类不得不面临分析或处理各种大规模数据信息的要求,如卫星传 回的大量图像、机器人接收到的实时视频流、数据库中的大规模文本、Web上的海量信息等。 处理这类信息时,矩阵是最常用的数学表达方式,比如一幅图像就恰好与一个矩阵对应,矩 阵中每个位置存放着图像中一个像素的空间位置和色彩信息。为了高效处理这些矩阵数 据,一个关键步骤是对矩阵进行分解操作。通过矩阵分解,一方面将描述问题的矩阵进行维 数约减,另一方面也可对大规模数据进行很好的压缩和概括。
[0034] 基本非负矩阵分解方法的定义是,设V为mXn维的非负矩阵,对V进行非负矩阵 分解,则有:
[0035] V^WH
[0036] 其中,W、Η分别是分解非负矩阵V得到的基矩阵和
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1