一种基于粒子群优化的空间大数据字典学习方法

文档序号：6638213阅读：171来源：国知局

一种基于粒子群优化的空间大数据字典学习方法
【专利摘要】本发明公开了一种基于粒子群优化的空间大数据字典学习方法，包括步骤1：空间大数据的预处理过程；步骤2：在线字典学习ODL字典学习过程，利用ODL算法处理当前读入的分隔后的遥感数据，得到先验字典；步骤3：粒子群优化模型建立过程；步骤4：粒子群优化算法PSO优化过程，得到优化后的新字典；步骤5：算法稳定机制，引入ODL算法中的中间变量，传递经PSO优化后新字典所产生的稀疏系数矩阵的更新信息；步骤6：判断空间大尺度数据集合中有无数据。本发明的有益效果为：有效的进行大尺度遥感数据的处理，在尽量不增加计算负载的情况下，提高空间大数据表示的精度，并很好抑制重建过程中遥感数据中含有的噪声。
【专利说明】-种基于粒子群优化的空间大数据字典学习方法

【技术领域】
[0001] 本发明涉及面向空间大数据字典学习技术，具体来说，涉及一种基于粒子群优化的空间大数据字典学习方法。

【背景技术】
[0002] 近年来，随着航天、航空与遥感数据获取技术的快速发展，由此产生了海量的空间数据，面对空间数据的海量式的增长，传统的数据获取和分析方法已经无法适应；因此，数据的稀疏表征思想应运而生；稀疏表征主要涉及两个方面的研究：字典的构建和求解稀疏系数的方法；在非解析超完备字典构建的研究领域，这两方面的研究有一定的耦合性。
[0003] 字典构建的方法主要分为两种：利用数学工具生成字典，即解析字典和基于训练样本学习字典，即学习字典；解析字典是基于预先定义好的解析基以及基的变形形式，但是非解析字典原子没有固定的形式，也不要求正交性；这种获取字典的方式比使用固定的数学表达要精确，适用性更广泛，表达效果也较解析字典更稀疏，但是计算复杂度也相应的提商。
[0004] 其中，对于非解析字典比较著名的方法有K均值奇异值分解（K-SVD)、最小二乘字典学习（RLSDL)、在线字典学习（ODL)等。不过从理论上来说，它们不是针对特定的数据集合，在处理空间大数据的时候可能会遇上一些问题。首先，它们对每一个新样本都更新了全部的原子，这对于处理空间大数据时，算法需要的大量原子是不现实的；其次，固定的原子数目对于字典学习过程不太合适。因此，就目前提出的算法而言，进行大样本训练时，没有考虑大规模数据的数据分布特性，因此训练效果不理想；因此应对空间大数据的训练，还是力有不逮。
[0005] 粒子群算法（PSO)是一种群体智能算法，源于人们对鸟类捕食的研究，鸟类捕食策略是搜寻当前距离食物最近的鸟的周围区域；PSO算法这样解决优化问题：算法中每个粒子都代表问题的潜在解，每个粒子对应一个适应度函数（即目标函数）决定的适应度值，粒子速度决定了粒子移动的方向和距离，速度随自身及其他粒子移动经验动态调整，从而实现个体在可解空间中的寻优；因此，现在急需一种基于粒子群优化的字典学习方法，以提高原子更新的精度，抑制重建过程中遥感数据的噪声。
[0006]

【发明内容】

[0007] 本发明的目的是提供一种基于粒子群优化的空间大数据字典学习方法，以克服目前现有技术存在的上述不足。
[0008] 本发明的目的是通过以下技术方案来实现：一种基于粒子群优化的空间大数据字典学习方法，包括以下步骤：步骤1 :对预先采集的大尺度遥感数据进行分割处理，建立空间大尺度遥感数据集合，并对所述空间大尺度遥感数据集合进行归一化处理；步骤2 :利用ODL算法，对进行归一化处理后的所述空间大尺度遥感数据集合进行处理，得到先验字典；步骤3 :根据所述先验字典，利用误差矩阵作为原子筛选机制选取待优化原子，确定所述先验字典总候选原子的初始线性表示结构，并以该候选原子的初始线性表示结构作为粒子；步骤4 :根据预先确定的所述空间大尺度遥感数据的纹理特征，利用PSO算法，优化所述粒子，得到优化后的新字典；步骤5 :算法稳定机制，引入ODL算法中的中间变量，传递经PSO优化后新字典所产生的稀疏系数矩阵的更新信息；步骤6 :根据所述更新信息，判断空间大尺度数据集合中有无数据，在有数据的情况下，重复步骤2至5;否则结束。
[0009] 进一步的，所述步骤2中，利用ODL算法，对进行归一化处理后的所述空间大尺度遥感数据集合进行处理，得到先验字典包括：根据所述空间大尺度遥感数据集合，依照总体目标函数对字典D和稀疏系数α分别进行优化，得到先验字典。
[0010] 进一步的，根据所述空间大尺度遥感数据集合，依照总体目标函数对字典D和稀疏系数α分别进行优化，得到先验字典包括：根据总体目标函数，ODL算法利用正交匹配追踪OMP算法，固定所述字典D，训练所述稀疏系数α ;并且 ODL算法利用梯度下降法策略，针对所述目标函数对字典 Λ求偏导，得到相应的梯度，并根据所述梯度构造新字典原子的更新公式，并根据该更新公式，进行ODL算法收敛，得到所述先验字典D和稀疏系数α。
[0011] 进一步的，所述总体目标函数的表达式如下：

【权利要求】
1. 一种基于粒子群优化的空间大数据字典学习方法，其特征在于，包括以下步骤：步骤1 :对预先采集的大尺度遥感数据进行分割处理，建立空间大尺度遥感数据集合，并对所述空间大尺度遥感数据集合进行归一化处理；步骤2 :利用ODL算法，对进行归一化处理后的所述空间大尺度遥感数据集合进行处理，得到先验字典；步骤3 :根据所述先验字典，利用误差矩阵作为原子筛选机制选取待优化原子，确定所述先验字典总候选原子的初始线性表示结构，并以该候选原子的初始线性表示结构作为粒子；步骤4 :根据预先确定的所述空间大尺度遥感数据的纹理特征，利用PSO算法，优化所述粒子，得到优化后的新字典；步骤5 :算法稳定机制，引入ODL算法中的中间变量，传递经PSO优化后新字典所产生的稀疏系数矩阵的更新信息；步骤6 :根据所述更新信息，判断空间大尺度数据集合中有无数据，在有数据的情况下，重复步骤2至5;否则结束。
2. 根据权利要求1所述的基于粒子群优化的空间大数据字典学习方法，其特征在于，所述步骤2中，利用ODL算法，对进行归一化处理后的所述空间大尺度遥感数据集合进行处理，得到先验字典包括：根据所述空间大尺度遥感数据集合，依照总体目标函数对字典D和稀疏系数α分别进行优化，得到先验字典。
3. 根据权利要求2所述的基于粒子群优化的空间大数据字典学习方法，其特征在于，根据所述空间大尺度遥感数据集合，依照总体目标函数对字典D和稀疏系数α分别进行优化，得到先验字典包括：根据总体目标函数，ODL算法利用正交匹配追踪OMP算法，固定所述字典D，训练所述稀疏系数α ;并且 ODL算法利用梯度下降法策略，针对所述目标函数对字典 Λ求偏导，得到相应的梯度，并根据所述梯度构造新字典原子的更新公式，并根据该更新公式，进行ODL算法收敛，得到所述先验字典D和稀疏系数α。
4. 根据权利要求2或3所述的基于粒子群优化的空间大数据字典学习方法其特征在于，所述总体目标函数的表达式如下：
其中，JT为训练样本集合，U为字典，CT为稀疏矩阵。
5. 根据权利要求3所述的基于粒子群优化的空间大数据字典学习方法其特征在于，所述正交匹配追踪OMP计算公式如下：
其中，Xt为样本集中第t个样本，；!为正则化参数，为当前样本对应的稀疏系数矩阵。
【文档编号】G06K9/62GK104517121SQ201410759485
【公开日】2015年4月15日申请日期:2014年12月10日优先权日:2014年12月10日
【发明者】王力哲, 刘鹏, 耿浩, 王托弟申请人:中国科学院遥感与数字地球研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王力哲;刘鹏;耿浩;王托弟;
技术所有人：中国科学院遥感与数字地球研究所;
我是此专利的发明人

上一篇：基于小波变换的遥感数据统计特性估计算法
上一篇：用于被分享事件的记录方法和装置制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。