基于独立分量分析-残余总体相关分析的低维时域量化特征提取技术的制作方法

文档序号:10613290阅读:372来源:国知局
基于独立分量分析-残余总体相关分析的低维时域量化特征提取技术的制作方法
【专利摘要】本发明公开了一种基于独立分量分析?残余总体相关分析的低维时域量化特征提取技术,其特征在于,该方法包括如下步骤:1)数据选择、预处理与训练集的构建;2)独立分量分析特征抽取网络的批训练;3)模式分类目标综合分析;4)时域特征提取器的联合构建;5)残余总体相关低维量化特征提取;6)特征数据的空间可视化后处理。本发明的有益效果是,方法设计合理,使用简明,提取特征典型。
【专利说明】
基于独立分量分析-残余总体相关分析的低维时域量化特征 提取技术
技术领域
[0001] 本发明基于特征提取理论,在独立分量分析的基础上提出一种残余总体相关分析 时域特征提取方法,利用独立分量分析的冗余取消特性以及残余总体相关分析的整体约简 能力,抽取描述不同模式类的典型低维特征,削减原始数据中的外来噪声干扰。该计算方法 为解决许多领域中涉及的模式分类的特征提取问题奠定了理论基础。
【背景技术】
[0002] 特征提取是模式分类的关键环节[1]。如果能获取具有高度准确描述能力的特征, 则无疑对分类系统的建立具有重要意义。它可以较少的存贮,表达较多的物理意义,从而为 后续的分类(判别)器的正确设计打下基础。
[0003]在实际的模式分类应用场合,信号检测中待分类对象周边的外来干扰以及信号采 集系统的内噪声等均可能在原始观测数据中引入噪声干扰;传感器件异常或故障也可能产 生异常的观测数据即野值。这些存在于原始数据中的噪声或野值如果不适当处理,将随同 特征提取进入特征空间,形成明显偏离整体类特征的噪点或野点。根据已有的研究结果,当 原始观测数据中存在局部的噪声或野值时其分布往往呈现出典型的非高斯特性,增加了特 征提取的困难 [2]。此外,还有许多影响模式分类的负面因素,例如传感观测的信息冗余,特 征提取环节所选择的过高特征维数等。信息冗余将直接造成后续特征提取的困难,并进一 步放大噪声或野值的负面作用;特征维数选择过高,则会使样本统计特性的估计更加困难, 从而降低分类器的泛化推广能力 [3]。

【发明内容】

[0004] 本发明的目的是为了解决上述问题,开发了一种基于独立分量分析-残余总体相 关分析的低维时域量化特征提取技术。
[0005] 实现上述目的本发明的技术方案为,一种基于独立分量分析-残余总体相关分析 的低维时域量化特征提取技术,其特征在于,该方法包括如下步骤: 1) 数据选择、预处理与训练集的构建; 2) 独立分量分析特征抽取网络的批训练; 3) 模式分类目标综合分析; 4) 时域特征提取器的联合构建; 5) 残余总体相关低维量化特征提取; 6) 特征数据的空间可视化后处理。
[0006] 所述数据选择、预处理与训练集的构建为:
式中立(63:为非二次函数(6(6-):的负熵w为#中第i个行向量,约束子%的取值 为:&= 〇,当^/兵念时;占^ = 1,当j·=々时,五.{·}.为数学期望估计, 所述独立分量分析特征抽取网络的批训练式为:
[0007]式中c =五{>/}为数据协方差矩阵。r *为r的估计新值。1\.= {>u), 1 = 1, 2,…,4, c= 1,2,…,c为分属不同模式类的c个原始观测数据训练集,为第 女个训练样本,c为训练集编号,即对应的模式类号。ΛΓ为训练集容量,即每个训练集中所 包含的训练样本数。Ubl为由每个模式类的个训练样本组合成的批训练样本 所述模式分类目标综合分析原理为:
式中&与6均为实常数且& > 0。¥( X,X )为核函数,选取不同形式的核函数可 以获得不同性质的分类器。
[0008] 所述时域特征提取器的联合构建式为:
式中l,C = 1,…,C为由属于C个模式类的原始观测训练样本得到的C个独立分量分析估计基, 为由I共同构成的独立分量分析特征提取器。
[0009] 所述残余总体相关低维量化特征提取计算式为:
式中ixy为输出估计向量中第i个与第J个独立分量间的零时延相关系数。从而, 由每个观测数据样本,可以得到一个C维的特征向量片[//,A,…,办]。
[0010]所述特征数据的空间可视化后处理式为:
式中{Xf}为有效特征样本集合。{!〇}为可视特征散点集合,^和心分别为其中的第 i个和第J个特征样本点。
[0011] 利用本发明的技术方案制作的基于独立分量分析-残余总体相关分析的低维时域 量化特征提取技术,设计合理,使用简明,提取特征典型,可很好的提取模式分类中复杂模 式的低维时域量化特征。
[0012]
【附图说明】
[0013] 图1是本发明所述基于独立分量分析-残余总体相关分析的低维时域量化特征提 取技术的流程示意图; 图2独立分量分析-残余总体相关特征提取原理; 图3二维特征数据的空间可视化分布; 图4三维特征数据的空间可视化分布。
【具体实施方式】
[0014] 下面结合附图对本发明进行具体描述,如图1是本发明所述基于独立分量分析-残 余总体相关分析的低维时域量化特征提取技术的流程示意图,如图所示,采用有约束最大 化数据权向量负熵的非二次函数进行数据选择,对数据进行融合压缩预处理,并以模块取 样方式进行训练集的构建。
[0015] 本技术方案以齿轮箱正常状态、轮齿破坏和机座松动三类模式的分类为例子阐述 低维时域量化特征提取的过程,其基本提取原理为:当隶属于某一模式类的原始观测数据 样本输入该特征提取器中对应的估计基(已经过同类样本数据训练),则输出的残余总体相 关值相比于输入其他的独立分量估计基(经过不同模式类样本数据训练)所获得的输出值 更小,即
:2 式中B为独立分量估计基,Bt为已经过同类样本训练的独立分量估计基。&为用于 特征提取的观测数据样本。为&输入独立分量估计基后输出的残余总体相关值。
[0016] 实施例1 两维时域量化特征提取及模式分类 基于约束优化选择正常状态、轮齿破坏与机座送动三类模式的训练数据,并进行融合 压缩预处理。采用模块取样方式构建训练集。
[0017]

[0018] 式中、rg以及Γ?分别为正常状态、轮齿破坏以及机座送动模式类的原始观测 数据训练集,为第1个训练样本,为训练集中所包含的训练样本数。{^b}n、{^b}g以 及Ubh分别为由正常状态、轮齿破坏以及机座送动模式类的个训练样本组成的批训 练集。
[0019] 分别批训练三个独立分量分析基特征抽取网络,即估计基或逆变换矩阵rn、rg以 及ffu
[0020] 对模式分类的目标进行综合分析,本实施实例为基于二维特征的多模式分类,分 类在二维平面进行。因此,对正常状态、轮齿破坏以及机座送动三个模式类的独立分量分析 估计基进行两两组合,构建三个两维特征提取器。
[0021]
如图2,基于残余总体相关分析特征提取,由每个两维特征提取器可以得到两个两维的 特征集合。
[0022]

[0023] 分别对两维特征提取器所提取的同一模式类的特征向量集进行平均化处理,每一 模式类可以得到一个平均特征向量集。
[0024]
如图3,三个模式类特征的空间散布描述在二维平面上,可以看到不同模式类彼此之间 已经呈现出明显的空间分集特性,表明基于独立分量分析-残余总体相关分析的时域量化 特征提取技术所获取的二维特征大大地简化了后续的模式分类工作。
[0025] 实施例2 三维时域量化特征提取及模式分类 对模式分类的目标进行综合分析,本实施实例为基于三维特征的多模式分类,分类在 三维空间中进行。因此,以正常状态、轮齿破坏以及机座送动三个模式类的独立分量分析估 计基共同构建一个三维特征提取器
,并基于如图2所示的残余总 体相关分析特征提取原理由该特征提取器得到三个三维的特征集合。
如图4,三个模式类特征的空间散布描述在三维空间中。可以看到不同模式类之间也具 有较好的空间分集特性,进一步验证了基于独立分量分析-残余总体相关分析的时域量化 特征提取技术的优势。
[0027] 参考文献
[1] 徐敏,设备故障诊断手册.西安:西安交通大学出版社,1998.
[2] 焦卫东.基于独立分量分析的旋转机械故障诊断新方法的研究.杭州:浙江大 学博士学位论文,2003.
[3]张彪.文本分类中特征选择算法的分析与研究[D].合肥:中国科学技术大学硕 士学位论文,2010. 上述技术方案仅体现了本发明技术方案的优选技术方案,本技术领域的技术人员对其 中某些部分所可能做出的一些变动均体现了本发明的原理,属于本发明的保护范围之内。
【主权项】
1. 一种基于独立分量分析-残余总体相关分析的低维时域量化特征提取技术,其特征 在于,该方法包括如下步骤: 1) 数据选择、预处理与训练集的构建; 2) 独立分量分析特征抽取网络的批训练; 3) 模式分类目标综合分析; 4) 时域特征提取器的联合构建; 5) 残余总体相关低维量化特征提取; 6) 特征数据的空间可视化后处理。2. 根据权利要求1所述的基于独立分量分析-残余总体相关分析的低维时域量化特征 提取技术,其特征在于,所述数据选择、预处理与训练集的构建为:式中Λ(·)为非二次函数(6:結的负赌, wi为r中第i个行向量,约束子解的取值为:舞0,当y'#A-时;d, = 1,当j = A时,为数学期望估计。3. 根据权利要求1所述的基于独立分量分析-残余总体相关分析的低维时域量化特征 提取技术,其特征在于,所述独立分量分析特征抽取网络的批训练式为:式中C=幻χχΤ}为数据协方差矩阵,为r的估计新值,{xW,A= 1,2, …,幻,c = 1,2,…,C为分属不同模式类的C个原始观测数据训练集,xW为第A 个训练样本,C为训练集编号,即对应的模式类号,J为训练集容量,即每个训练集中所包 含的训练样本数,Ub}。为由每个模式类的J个训练样本组合成的批训练样本。4. 根据权利要求1所述的基于独立分量分析-残余总体相关分析的低维时域量化特征 提取技术,其特征在于,所述模式分类目标综合分析原理为:式中a*与6均为实常数且a*〉0,Υ(Χ,Χ)为核函数,选取不同形式的核函数可 w获得不同性质的分类器。5. 根据权利要求1所述的基于独立分量分析-残余总体相关分析的低维时域量化特征 提取技术,其特征在于,所述时域特征提取器的联合构建式为: 抑)二W心…W。), 式中/fc,c= 1,…,C为由属于C个模式类的原始观测训练样本得到的C个独立分 量分析估计基,外')为由於共同构成的独立分量分析特征提取器。6. 根据权利要求1所述的基于独立分量分析-残余总体相关分析的低维时域量化特征 提取技术,其特征在于,所述残余总体相关低维量化特征提取计算式为:式中rj,为输出估计向量中第i个与第J个独立分量间的零时延相关系数,从而,由 每个观测数据样本,可W得到一个C维的特征向量片[/;,&,···i/c]。7. 根据权利要求1所述的基于独立分量分析-残余总体相关分析的低维时域量化特征 提取技术,其特征在于,所述特征数据的空间可视化后处理式为:式中Uf}为有效特征样本集合,{:龙}为可视特征散点集合,Xj和xj分别为其中的第i 个和第J个特征样本点。
【文档编号】G06K9/46GK105975976SQ201510126583
【公开日】2016年9月28日
【申请日】2015年3月23日
【发明人】焦卫东, 毛剑, 林树森, 王晓燕, 翁孟超
【申请人】浙江师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1