一种分布式光纤振动信号特征提取与识别方法与流程

文档序号:21002396发布日期:2020-06-05 22:49阅读:404来源:国知局
一种分布式光纤振动信号特征提取与识别方法与流程

本发明属于光纤传感信号处理领域,涉及一种分布式光纤振动信号特征提取与识别方法。



背景技术:

基于相位敏感光时域反射技术的分布式光纤振动传感系统,以光纤作为传感及传输介质,可以实现长距离、宽范围振动信号连续监测,具有监测距离长、灵敏度高、环境耐受性好等特点,被广泛用于周界安防、油气管道安全、结构健康监测等民用及国防设施安全监测领域。

在长距离监测的实际应用中,环境复杂多变,多种振动源混叠,实时性要求高,对分布式光纤振动传感系统振动源识别难度增加。随着人工智能技术的发展,越来越多研究利用机器学习方法对分布式光纤振动传感系统振动源进行识别。但机器学习方法进行振动源识别都存在共同问题:1)需要人工提取并筛选事件信号的时间结构特征,耗时费力;2)特征的选取没有统一、客观的评判标准;3)特征依赖人为经验,易遗漏信息,且通常泛化性差难以适用于新数据。

2018年《光学工程》的“基于时频分析和卷积神经网络的φ-otdr振动事件模式识别”中尝试应用深度学习如卷积神经网络(cnn)简化人工提取特征的过程,主要用于提取振动信号的局部结构特征,深度学习自有一套特征评判标准,特征选取更加客观,得到一些较好的结果。但现有深度学习网络提取特征的粒度唯一且固定,细粒度特征与粗粒度特征难以同时兼顾,如果采用加深网络层次来提取更多粒度特征的方法,不仅部分特征已经损耗而且模型参数量将大大增加,存在过拟合的风险。2019年《journaloflightwavetechnology》的“基于隐马尔可夫模型的管道动态时间序列识别与知识挖掘方法”提出一种基于人工特征的隐马尔科夫(hmm)模型,在人工提取时间结构特征的基础上,利用hmm模型提取短时信号结构间的时序关系,揭示事件演化过程中状态的动态变化,振动源识别率得到了一定提高,但该特征提取过程仍依赖人工经验,模型更新困难。

因此,本发明针对上述问题,提出了一种分布式光纤振动信号特征提取与识别方法。



技术实现要素:

本发明的目的在于:提供了一种分布式光纤振动信号特征提取与识别方法,解决了现有技术无法同时提取分布式光纤振动信号的局部结构特征和时序特征,振动源识别准确率和模型的泛化能力较低的问题。

本发明采用的技术方案如下:

一种分布式光纤振动信号特征提取与识别方法,包括以下步骤:

步骤1:利用分布式光纤振动传感系统采集振动源的时空矩阵信号,抽取空间列信号并划分短时信号单元,打上事件类型标签,构建光缆振动事件数据集;

步骤2:基于光缆振动事件数据集构建改进的mcnn模型,并对其进行训练和调优,调优过程中对改进的mcnn模型提取的特征进行特征评估,直到改进的mcnn模型迭代达到最优;

步骤3:利用最优mcnn模型并行提取多尺度下所有短时信号单元的时间结构特征矢量,按短时信号单元的时间顺序重组为短时特征序列,构建振动事件数据的时间结构特征序列集;

步骤4:基于时间结构特征序列集训练各类振动事件的hmm模型,挖掘时间结构特征序列间的时序关系,构建线下振动事件hmm模型库,作为振动源识别的分类器,实现振动源分类识别。

进一步地,还包括步骤5:

进行在线测试:将某一振动事件的时空矩阵信号的列信号输入已经保存的最优mcnn模型,得到时间结构特征矢量并对其进行重组,重组为时间结构特征序列,再输入已构建的线下振动事件hmm模型库,依次比较在各事件模型下的概率输出,将最大概率对应的事件类型作为分类结果,输出振动源类别。

进一步地,所述步骤1具体包括以下步骤:

步骤1.1:利用分布式光纤振动传感系统采集在振动事件发生时各空间点的信号,构成时空矩阵,列信号为单个空间点的时间信号,抽取列信号作为振动事件的信号样本,所述信号样本为一条长时信号,信号维度为1×u,u表示长时信号的数据点数,由信号时长和采样频率决定;

步骤1.2:将固定时间长度的信号作为一个短时信号单元,一条信号样本可划分为l个短时信号单元,短时信号单元的信号维度为1×v,v表示短时信号单元的数据点数,由短时信号单元的时间长度决定;

步骤1.3:按事件类型设标签后,根据步骤1.1和步骤1.2,构建得到不同类型的光缆振动事件数据集。

进一步地,所述步骤2具体包括以下步骤:

步骤2.1:将光缆振动事件数据集划分为训练集与测试集,在训练集上构建改进的mcnn模型并对其进行训练,所述训练包括依次进行模型参数初始化和网络前向传播;

步骤2.2:对模型进行调优,所述调优包括根据步骤2.1训练过程中改进的mcnn模型输出的后验概率计算损失函数,根据损失函数计算参数梯度,采用梯度下降法更新模型参数θ,并进行迭代,所述模型参数θ包括矩阵权重w和偏置b;

步骤2.3:在步骤2.2的模型迭代过程中,在测试集上进行测试,计算分类准确率,并进行特征评估,选择分类准确率和特征评估结果最好的模型作为最优mcnn模型,所述特征评估以正确预测类别的后验概率和错误预测类别的后验概率之间的欧氏距离进行评估。

更进一步地,所述步骤2.1具体包括以下步骤:

步骤2.1.1:将光缆振动事件数据集划分为训练集与测试集,在训练集上构建改进的mcnn模型,所述改进的mcnn模型逐层交叉学习振动信号的多尺度特征,每层多尺度卷积层的最后都对不同尺度的特征进行一次融合,将融合后得到的特征作为下一层的输入,在深层对于浅层提取的每种尺度的特征再次进行多尺度提取;

步骤2.1.2:对步骤2.1.1中改进的mcnn模型采用xavier方法进行参数初始化,参数初始化的分布范围为:

式中,nin为输入参数个数,nout为输出参数个数;

步骤2.1.3:设改进的mcnn模型中卷积层的第k尺度输入训练数据xi为:

第k尺度的第j个卷积核初始化后第k个通道的矩阵权重其中,kout为输出特征通道数;

对训练数据xi进行网络前向传播,所述网络前向传播包括:对每层卷积层依次进行卷积操作、池化操作、relu激活操作和特征融合操作;

其中,对单尺度进行卷积操作的公式为:

式中,m为卷积核大小,p为边界填充,s为步长;

按上述公式对训练数据进行单尺度卷积操作后的输出为:

根据单尺度卷积操作公式得到多尺度的卷积核并行进行卷积操作的公式为:

对多尺度的卷积核并行进行卷积操作后的输出进行池化操作的公式为:

式中,s为步长;

按上述公式进行池化操作后的输出为:

对上述输出进行relu激活操作的公式为:

最后,进行特征融合操作后的输出为:

经过多层多尺度卷积层后,最终输出一个二维数组的多尺度特征,将其转换为一维数组h=[h1,h2…ht];

步骤2.1.4:设一条样本信号的前验概率矩阵为:

y=[y0,y1,y2,y3],

将一维数组h输入全连接层后得到当前样本被预测类别的后验概率矩阵:

p=[p0,p1,p2,p3]。

更进一步地,所述步骤2.2具体包括以下步骤:

步骤2.2.1:根据后验概率矩阵计算交叉熵损失函数e:

式中,x表示训练样本,n表示样本的总数;

步骤2.2.2:根据损失函数e计算目标函数梯度gt:

步骤2.2.3:根据梯度下降法更新mcnn模型的矩阵权重w,梯度的一阶矩估计为:

mt=u*mt-1+(1-u)*gt,

二阶矩估计为:

式中,u、v∈[0,1),分别为梯度一阶矩、二阶矩的指数衰减率;

设第t次迭代时,

则mcnn模型的模型参数θ为:

式中,α为学习率,ε为非常小的数,防止除以零。

更进一步地,所述步骤2.3具体包括以下步骤:

步骤2.3.1:在步骤2.2的模型迭代过程中,在光缆振动事件数据集中的测试集上进行测试,计算分类准确率的公式为:

式中,ntest为测试集样本总数,ntest为正确分类样本数;

步骤2.3.2:以正确预测类别的后验概率和错误预测类别的后验概率之间的欧氏距离进行评估,所述欧式距离的计算公式为:

式中,为第j条测试样本正确被预测为i类的后验概率,为第j条测试样本错误被预测为m类的后验概率;

步骤2.3.3:选择同时满足步骤2.3.1的分类准确率最高,步骤2.3.2的特征评估结果最好的对应的模型作为最优mcnn模型。

进一步地,所述步骤3具体包括以下步骤:

步骤3.1:将光缆振动事件信号数据集输入保存的最优mcnn模型,并将步骤2.1.3得到的一维数组h=[h1,h2…ht]作为时间结构特征矢量,该特征矢量是由该模型自动提取的挖掘不同细节信息的多种特征组成,将其表示为不同特征种类的形式:

式中,f为一条信号样本的特征矢量,l为一条信号样本包含的短时信号单元个数,c表示不同尺度细节信息的特征种类,表示第c种特征的第l个短时信号单元的特征矢量;

步骤3.2:将特征矢量f按振动信号中短时信号单元的时间顺序进行时序重组,得到重组的与l个短时信号单元对应的特征序列:

即,

至此完成原始数据到时间结构特征序列的转换,得到一条信号样本的短时特征序列;

步骤3.3:将光缆振动事件数据集的全部样本根据步骤3.1和3.2进行特征提取,打上标签,构建振动事件数据的时间结构特征序列集。

进一步地,所述步骤4具体包括以下步骤:

步骤4.1:将时间结构特征序列集划分为hmm的训练集与测试集,在训练集上构建hmm模型并进行训练,挖掘时间结构特征序列间的时序关系,训练出不同振动事件的hmm模型,构建线下振动事件hmm模型库,所述训练包括构建特征矢量序列集、初始化hmm模型的参数和迭代更新;

步骤4.2:在测试集上,采用维特比算法计算每条测试数据在线下振动事件hmm模型库中各模型下的贝叶斯后验概率,以输出概率最大的模型所对应的事件标签作为该测试信号的事件类型,实现振动信号的识别和分类。

更进一步地,所述步骤4.1具体包括以下步骤:

步骤4.1.1:将时间结构特征序列集划分为hmm的训练集与测试集,以训练集作为hmm模型的观测序列输入,构建hmm模型;

步骤4.1.2:hmm模型的观测序列集o包含n组信号的时间结构特征序列:

o=[o(1),o(2),......,o(n)],

式中,观测序列集o的维度为n×l×d,其中,l为时间结构特征序列的短时信号单元数,对应原单个空间点的时间信号包含的短时信号单元个数,d为每个短时信号单元提取的特征矢量维数,n为特征矢量序列的样本个数,则第n组特征矢量序列为:

式中,ot表示特征矢量序列集中第t个短时信号单元的特征矢量,1≤t≤l;

步骤4.1.3:设hmm模型为:

λ=(π,a,b),

式中,π、a、b均为模型参数,π为初始概率分布矢量,π=(π1,π2,…,πn),πi=p(qt=θi),1≤i≤n;

a为状态转移概率矩阵,a=(aij)n×n,aij=p(qt+1=θj|qt=θi),1≤i,j≤n,

其中,n表示模型中markov链的状态数目,n个状态为θ1,θ2,…,θn,t时刻马尔科夫链所处的状态为qt,qt∈(θ1,θ2,…,θn);

b为观测值概率矩阵,b=(bj(o)),

用gmm模型描述b为:

其中,bj(o)表示第j个状态下,产生特征矢量o的概率,m为高斯元的个数,bjl为状态j下第l个高斯密度函数,μ为均值矩阵,σ为协方差矩阵,w为高斯分量权值系数矩阵,wjl表示第j个状态下第l个混合高斯元的权值系数,μjl表示第j个状态下第l个混合高斯元的均值矢量,σjl表示第j个状态下第l个混合高斯元的协方差矩阵,|σjl|表示协方差矩阵的行列式值,d为特征矢量的维数,h为长时信号所经历的隐状态个数;

对hmm模型的各个参数进行初始化,对π和a进行随机初始化,对b采用gmm模型来估计hmm模型中每个状态产生某一特征矢量的概率,并采用k-means算法对gmm模型进行参数估计,通过k-means算法将每类事件的多组特征矢量序列中的每个特征矢量分配到h个隐状态下,对每个状态下的特征矢量再进行一次k-means聚类,k-means聚类的聚类中心数为gmm模型的混合高斯元个数m,按下列公式对权值系数wjl、均值矢量μjl和协方差矩阵σjl进行初始化:

完成hmm模型的参数初始化;

步骤4.1.4:根据步骤4.1.2的特征矢量序列集o,假设各特征矢量序列相互独立,则所有特征矢量序列的联合概率分布为:

用k条相互独立的特征矢量序列基于baum-welch算法对hmm模型的各个参数进行重估,重估公式为:

式中,为过渡概率,表示第k组特征矢量序列在t时刻处于状态i,在t+1时刻处于状态j的概率,其中,为前向变量,表示第k组观测矢量序列在t时刻,状态为θi,前t秒内观测值为o1,o2,…,ot的概率,为后向变量,表示第k组观测矢量序列在t时刻,状态为θi,从t+1秒到l秒内观测值为ot+1,ot+2,…,ol的概率;

表示给定模型λ和o(k),在t时刻处于状态qi的概率;

表示某个特征矢量序列在t时刻处于状态j时对于第l个混合高斯元的输出概率,g和n为gmm模型;

根据上述重估公式用训练集所有特征矢量序列更新hmm模型各个参数一遍为训练过程的一次迭代,当前后两次迭代过程的联合概率p(o'|λ)误差小于设置的收敛误差时,停止迭代,完成hmm模型训练;

步骤4.1.5:根据步骤4.1.2至步骤4.1.4,利用不同振动事件的时间结构特征序列集的训练集分别对hmm模型进行训练,得到不同振动事件的hmm模型,将各模型参数保存,完成线下振动事件hmm模型库的构建;

所述步骤4.2具体包括以下步骤:

步骤4.2.1:在测试集上,采用下列公式对测试数据在线下振动事件hmm模型库的hmm模型下的贝叶斯后验概率进行初始化操作:

再采用下列公式进行递归操作:

从而得到贝叶斯后验概率p*

式中,δt(i)为t时刻沿一条路径q1,q2,…,qt产生o1,o2,…,ot的最大概率,δt(i)=maxp(q1,…,qt,qt=θi,o1,…,ot|λ),其中,qt=θi表示在时刻t状态为θi,为在时刻t状态为θi的所有路径q1,q2,…,qt中概率最大的路径的第t-1个节点,

递归完成后,t=l,p*对应当前特征矢量序列在给定模型参数下的最大输出概率;

步骤4.2.2:采用步骤4.2.1的方法,根据模型库中各hmm模型参数λi和当前特征矢量序列o,计算各模型下对该特征矢量序列的预测概率pi*=p(o|λi);

步骤4.2.3:选择步骤4.2.2的所有预测概率中最大的预测概率所对应的模型事件标签,作为当前测试信号的事件类型,实现振动信号的识别和分类。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

1.一种分布式光纤振动信号特征提取与识别方法,根据采集的振动源时空矩阵信号,构建光缆振动事件数据集,再构建并训练改进的mcnn模型,并对模型进行调优得到最优mcnn模型,然后利用最优mcnn模型构建时间结构特征序列集,再构建并训练hmm模型,得到线下振动事件hmm模型库作为振动源识别的分类器,实现振动源的分类识别,初次提出了端对端的mcnn-hmm复合模型,可同时提取分布式光纤振动信号的局部结构特征和时序特征,自动挖掘光纤振动信号携带的信息,避免了人为特征提取的麻烦,并且不依赖人为经验,提高了模型在新应用场景下的更新效率和泛化能力;相比现有的深度学习网络,增加了对结构特征之间的时序关系挖掘,进一步丰富了信号的特征信息,可以提高振动源识别的准确性。

2.本发明所述步骤2对改进的mcnn模型调优时,还对改进的mcnn模型提取的特征进行特征评估,对模型提取的特征进行实时客观评价,衡量了模型的泛化能力,再选择同时满足分类准确率最高和特征评估结果最好的对应的模型作为最优mcnn模型,为分类结果的置信度提供了科学依据,解决了模型在实际使用过程中对分类结果无监督而盲目信任的问题。

3.本发明中构建的所述改进的mcnn模型,包含多种尺度的卷积核,小尺度的卷积核可较好的提取时域细节和高频特征,大尺度的卷积核可较好的提取时域轮廓和低频特征,可以实现多尺度特征的并行提取和使用,兼顾复杂噪声背景下时变信号的多种复合结构特征,对比现有的深度学习网络使用的加深模型的层数来提取多粒度特征的方法,可以避免使用单一尺度卷积核或依赖某一个粒度特征过程中,由于特征粒度划分不好而带来的特征遗漏或可分辨性不强的问题。

4.本发明中利用改进的mcnn模型实现短时信号单元的时间结构特征提取,逐层交叉学习信号的多尺度特征,将浅层提取的不同尺度的特征融合作为下一层的输入,在深层对于浅层提取的每种尺度的特征再次进行多尺度提取,进一步提取小尺度特征的轮廓特征和大尺度特征的细节特征,从而在挖掘不同尺度的时间结构特征的同时挖掘不同尺度时间结构特征间的深层联系,可进一步改善现有mcnn模型结构特征提取时由于不同尺度特征之间相互独立和简单相加引起的特征遗漏问题;且进行特征提取时,具有涉及参数少、训练速度快、过拟合风险小的优点。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图,其中:

图1是一种分布式光纤振动信号特征提取与识别方法的流程图;

图2是本发明实施例一中分布式光纤振动传感系统的原理框图;

图3是本发明实施例一中现有mcnn模型的结构图;

图4是本发明实施例一中改进的mcnn模型的结构图;

图5是本发明实施例一中机械施工测试样本基于改进的mcnn模型提取特征和人工提取特征的分类结果对比图;

图6是本发明实施例一中人为施工测试样本基于改进的mcnn模型提取特征和人工提取特征的分类结果对比图;

图7是本发明实施例一中交通干扰测试样本基于改进的mcnn模型提取特征和人工提取特征的分类结果对比图;

图8是本发明实施例一中背景噪声测试样本基于改进的mcnn模型提取特征和人工提取特征的分类结果对比图;

图9是本发明实施例一中步骤4训练hmm模型的流程图;

图10是本发明实施例一中对四类事件的测试数据基于本发明的mcnn-hmm复合模型和人工提取特征的hmm模型分别进行识别测试后得到的时间测试识别率对比图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例只是本发明的一部分实施例,而不是全部的实施例。通常在此处描述和附图中示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

术语解释:

cnn模型:卷积神经网络模型;

mcnn模型:多尺度卷积神经网络模型;

hmm模型:隐马尔科夫模型;

φ-otdr:线性解调相位敏感光时域反射;

edfa:掺铒光纤放大器;

xavier方法:赛维尔初始化方法;

adam算法:梯度下降法;

viterbi算法:维特比算法;

markov链:马尔科夫链;

gmm模型:高斯混合模型;

k-means算法:k均值聚类算法;

baum-welch算法:隐马尔可夫模型的学习算法。

下面结合实施例和附图对本发明的特征和性能作进一步的详细描述。

实施例一

本发明的较佳实施例,以埋地通信光缆的振动源识别应用为例,提供了一种分布式光纤振动信号特征提取与识别方法,如图1所示,包括以下步骤:

步骤1:利用分布式光纤振动传感系统采集振动源的时空矩阵信号,抽取空间列信号并划分短时信号单元(su),打上事件类型标签,构建光缆振动事件数据集;

步骤1.1:利用分布式光纤振动传感系统采集在振动事件发生时各空间点的振动信号,具体地,所述分布式光纤振动传感系统采用φ-otdr技术,硬件包括探测光缆、光信号解调设备和信号处理主机,如图2所示;

所述探测光缆通常采用普通单模通信光纤,一般沿地下管道、输电线缆、城镇道路埋地铺设,也可直接利用沿管道或道路铺设的通信光缆空余纤芯;

所述光信号解调设备包括光学器件和电学器件,所述光学器件包括依次连接的激光器、调制器、放大器、隔离器和环形器,所述电学器件包括与环形器连接的滤波器、耦合器、光电探测器、模数转换器,以及波形发生卡,所述滤波器、耦合器、光电探测器、模数转换器依次连接,所述耦合器包括第一耦合器和第二耦合器,所述波形发生卡与调制器和模数转换器连接;具体地,所述激光器采用超窄线宽激光器,所述调制器采用声光或电光调制器,所述放大器采用edfa,所述滤波器采用光学滤波器;

所述信号处理主机采用普通电脑主机(pc)或fpga/dsp嵌入式主板,用于光纤探测信号的分析、处理,通过特定信号处理算法得到引起声波、振动等的事件信息,并由光时域反射原理确定其位置,以及对感测事件进行智能分析、处理和识别分类;

工作原理:超窄线宽激光器产生一路连续相干光信号,经调制器调制成光脉冲信号,光脉冲信号由edfa集中放大,放大后的光脉冲信号依次经隔离器、环形器的1端口、2端口注入探测光缆;光脉冲信号沿所述探测光缆传输过程中产生瑞利散射,探测光缆的后向瑞利散射光信号沿所述探测光缆返回,由环形器的2端口、3端口接收,经光学滤波器滤除噪声信号后经第一耦合器耦合,并将其注入到一个非平衡马赫曾德尔或迈克尔逊干涉仪中,再经3*3的第二耦合器耦合输出三路相位差为120度的外界扰动引入的相位变化信息,即可获得声波及振动在光纤上的作用信号,解调出的光信号由光电探测器转换成电信号,再由波形发生卡控制的同步触发模数转换器进行信号同步采集,最后数字电信号传输给信号处理主机;

将现有埋地通信光缆一根纤芯作为探测光缆,总长20km,时间采样率设置为500hz,空间采样间隔为5.16m,采用上述分布式光纤振动传感系统采集在振动事件发生时光缆沿线的振动信号,累积30s构成一个时空矩阵,该矩阵的行信号为某一时刻采集的光缆沿线不同位置的光信号,列信号为单个空间点的时间信号,抽取列信号作为振动事件的信号样本,所述信号样本为一条长时信号:

所述长时信号的信号维度为1×u,u表示长时信号的数据点数,由信号时长和采样频率决定,本实施例中u=15000;

步骤1.2:将时长为1s的信号作为一个su,一条信号样本可划分为l个su:

式中,l=30,su的信号维度为1×v,v表示su的数据点数,由su的时间长度决定,本实施例中v=500;

步骤1.3:典型光缆振动事件一般包括机械施工(破路机、挖掘机)、人工施工(铁镐挖掘、铁笔击地、敲击光缆)、交通干扰、背景噪声四类事件,本实施例按这四类事件类型设标签为:0、1、2、3,根据步骤1.1和步骤1.2,构建得到四类光缆振动事件数据集。

步骤2:基于光缆振动事件数据集构建改进的mcnn模型,并对其进行训练和调优,调优过程中对改进的mcnn模型提取的特征进行特征评估,直到改进的mcnn模型迭代达到最优;

步骤2.1:将光缆振动事件数据集划分为训练集与测试集,在训练集上构建改进的mcnn模型并对其进行训练,所述训练包括依次进行模型参数初始化和网络前向传播;

步骤2.1.1:将步骤1得到的四类光缆振动事件数据集按照7:3的比例划分为训练集与测试集,如表1所示:

表1

在训练集上构建改进的mcnn模型,所述改进的mcnn模型基于现有mcnn模型进行改进,现有mcnn模型的结构如图3所示,独立学习不同尺度的特征,将三个独立的不同尺度的卷积神经网络整合为一个多尺度卷积神经网,提取三种不同尺度的互相独立的特征,在输出前通过简单叠加的方式进行一次特征融合,仅能挖掘不同尺度的时间结构特征;改进的mcnn模型的结构如图4所示,逐层交叉学习振动信号的多尺度特征,每层多尺度卷积层的最后都对不同尺度的特征进行一次融合,将融合后得到的特征作为下一层的输入,在深层对于浅层提取的每种尺度的特征再次进行多尺度提取,进一步提取小尺度特征的轮廓特征和大尺度特征的细节特征,从而在挖掘不同尺度的时间结构特征的同时挖掘不同尺度时间结构特征间的深层联系;

所述改进的mcnn模型中,设定有f层多尺度卷积层,每层卷积层依次进行,每层具有k种尺度,不同尺度并行进行卷积操作、池化操作、激活操作,每层多尺度卷积层的最后将k种不同尺度的特征融合作为下一层的输入,在深层对于浅层提取的每种尺度的特征再次进行多尺度提取,本实施例中,f=3,k=3,可根据实际需要,更改卷积层层数和卷积核种类的数量,3种卷积核的尺度分别为1、3、5,模型具体参数如表2所示:

表2

步骤2.1.2:对步骤2.1.1中改进的mcnn模型采用xavier方法进行参数初始化,初始化的网络参数是模型训练的起点,好的初始化参数使得模型更易学习,快速收敛,为了保证前向传播和反向传播时每一层的方差一致,参数初始化的分布范围为:

式中,nin为输入参数个数,nout为输出参数个数,所述参数初始化的分布范围为通过该层的输入参数个数nin和输出参数个数nout得到的分布范围内的均匀分布;

步骤2.1.3:设改进的mcnn模型中卷积层的第k尺度输入训练数据xi为:

第k种尺度的第j个卷积核初始化后第k个通道的矩阵权重其中,为第k种尺度的卷积核的第k个通道的矩阵权重,kout为输出特征通道数,kin为输入特征通道数;

对训练数据xi进行网络前向传播,所述网络前向传播包括:对每层卷积层依次进行卷积操作、池化操作、relu激活操作和特征融合操作;

其中,对单尺度进行卷积操作的公式为:

式中,m为卷积核大小,p为边界填充,s为步长;

按上述公式对训练数据进行单尺度卷积操作后的输出为:

根据单尺度卷积操作公式得到多尺度的卷积核并行进行卷积操作的公式为:

对多尺度的卷积核并行进行卷积操作后的输出进行池化操作的公式为:

式中,s为步长;

按上述公式进行池化操作后的输出为:

对上述输出进行relu激活操作的公式为:

最后,进行特征融合操作后的输出为:

经过三层以上的多尺度卷积层后,最终输出一个二维数组的多尺度特征,将其转换为一维数组h=[h1,h2…ht];

步骤2.1.4:设一条样本信号的前验概率矩阵为:

y=[y0,y1,y2,y3],

将一维数组h输入全连接层后得到当前样本被预测类别的后验概率矩阵:

p=[p0,p1,p2,p3]。

步骤2.2:对模型进行调优,所述调优包括根据步骤2.1训练过程中改进的mcnn模型输出的后验概率计算损失函数,根据损失函数计算参数梯度,采用梯度下降法更新模型参数θ,并进行迭代,所述模型参数θ包括矩阵权重w和偏置b;

步骤2.2.1:根据后验概率矩阵计算交叉熵损失函数e:

式中,x表示训练样本,n表示样本的总数;

步骤2.2.2:根据损失函数e计算目标函数梯度gt:

步骤2.2.3:根据梯度下降法更新mcnn模型的矩阵权重w,梯度的一阶矩估计为:

mt=u*mt-1+(1-u)*gt,

二阶矩估计为:

式中,u、v∈[0,1),分别为梯度一阶矩、二阶矩的指数衰减率;

设第t次迭代时,

则mcnn模型的模型参数θ为:

式中,α为学习率,ε为非常小的数,防止除以零。

步骤2.3:在步骤2.2的模型迭代过程中,在测试集上进行测试,计算分类准确率,并进行特征评估,选择分类准确率和特征评估结果最好的模型作为最优mcnn模型,所述特征评估以正确预测类别的后验概率和错误预测类别的后验概率之间的欧氏距离进行评估;

步骤2.3.1:在步骤2.2的模型迭代过程中,在光缆振动事件数据集中的测试集上进行测试,计算分类准确率,计算分类准确率的公式为:

式中,ntest为测试集样本总数,ntest为正确分类样本数;

步骤2.3.2:以正确预测类别的后验概率和错误预测类别的后验概率之间的欧氏距离进行评估,所述欧式距离的计算公式为:

式中,为第j条测试样本正确被预测为i类的后验概率,为第j条测试样本错误被预测为m类的后验概率;

步骤2.3.3:选择同时满足步骤2.3.1的分类准确率最高,步骤2.3.2的特征评估结果最好的对应的模型作为最优mcnn模型,在分类过程中,分类准确率能一定程度反映模型的优劣,但测试数据集的选取对分类准确率有影响,可能产生过拟合,因此分类准确率并不完全可信,在测试数据上表现优秀的模型可能在新数据上失效,泛化能力差,因此本发明增加了特征评估,对模型进行客观评价,衡量了模型的泛化能力,同时也为分类结果的置信度提供科学依据;

步骤2.3.4:对本实施例的改进的mcnn模型提取的特征和人工提取的特征的分类结果进行比较,得到如图5至图8的对比图,其中,图5(a)为机械施工测试样本被改进的mcnn模型提取特征后分为每一类事件的后验概率,图5(b)为机械施工测试样本基于人工提取特征后分为每一类事件的后验概率;图6(a)为人为施工测试样本被改进的mcnn模型提取特征后分为每一类事件的后验概率,图6(b)为人为施工测试样本基于人工提取特征后分为每一类事件的后验概率;图7(a)为交通干扰测试样本被改进的mcnn模型提取特征后分为每一类事件的后验概率,图7(b)为交通干扰测试样本基于人工提取特征后分为每一类事件的后验概率;图8(a)为背景噪声测试样本被改进的mcnn模型提取特征后分为每一类事件的后验概率,图8(b)为背景噪声测试样本基于人工提取特征后分为每一类事件的后验概率;由上述图可见,基于改进的mcnn模型提取的特征分为正确类别的后验概率比分为其他类别的后验概率要大,这个差距远大于人工提取的特征进行分类的概率差,因此改进的mcnn模型可以更好的刻画不同事件信号间的可分辨性。

获取测试数据中被预测为真实类别的后验概率与被预测为其它类别的后验概率间的欧式距离,基于改进的mcnn模型提取的特征计算的欧式距离如表3所示:

表3

基于人工提取的特征计算的欧式距离如表4所示:

表4

从表3和表4可看出,对于四类目标事件的测试结果,基于改进的mcnn模型提取的特征计算的各类别的欧式距离都大于基于人工提取的特征计算的各类别的欧式距离,且几乎大一个数量级,因此,说明改进的mcnn模型提取特征的能力比人工方法更有效。

步骤3:利用最优mcnn模型并行提取多尺度下所有短时信号单元的时间结构特征矢量,按短时信号单元的时间顺序重组为短时特征序列,构建振动事件数据的时间结构特征序列集;

步骤3.1:将光缆振动事件信号数据集输入保存的最优mcnn模型,并将步骤2.1.3得到的一维数组h=[h1,h2…ht]作为时间结构特征矢量,可避免复杂的分类参数调整,提高算法效率,该特征矢量是由该模型自动提取的挖掘不同细节信息的多种特征组成,将其表示为不同特征种类的形式:

式中,f为一条信号样本的特征矢量,l为一条信号样本包含的su个数,c表示不同尺度细节信息的特征种类,表示第c种特征的第l个su的特征矢量;

步骤3.2:将特征矢量f按振动信号中su的时间顺序进行时序重组,得到重组的与l个su对应的特征序列:

即,

至此完成原始数据到时间结构特征序列的转换,得到一条信号样本的短时特征序列;

步骤3.3:将光缆振动事件数据集的全部样本根据步骤3.1和3.2进行特征提取,打上标签,构建振动事件数据的时间结构特征序列集。

步骤4:基于时间结构特征序列集训练各类振动事件的hmm模型,挖掘时间结构特征序列间的时序关系,构建线下振动事件hmm模型库,作为振动源识别的分类器,实现振动源分类识别;

步骤4.1:将时间结构特征序列集按照7:3的比例划分为hmm的训练集与测试集,在训练集上构建hmm模型并进行训练,挖掘时间结构特征序列间的时序关系,训练出不同振动事件的hmm模型,构建线下振动事件hmm模型库,所述训练流程如图9所示,包括构建特征矢量序列集、初始化hmm模型的参数和迭代更新;

步骤4.1.1:将时间结构特征序列集划分为hmm的训练集与测试集,以训练集作为hmm模型的观测序列输入,构建hmm模型;

步骤4.1.2:hmm模型的观测序列集o包含n组信号的时间结构特征序列:

o=[o(1),o(2),......,o(n)],

式中,观测序列集o的维度为n×l×d,其中,l为时间结构特征序列的su数,对应原单个空间点的时间信号包含的su个数,d为每个su提取的特征矢量维数,n为特征矢量序列的样本个数,则第n组特征矢量序列为:

式中,ot表示特征矢量序列集中第t个su的特征矢量,1≤t≤l;

步骤4.1.3:设hmm模型为:

λ=(π,a,b),

式中,π、a、b均为模型参数,π为初始概率分布矢量,π=(π1,π2,…,πn),πi=p(qt=θi),1≤i≤n;

a为状态转移概率矩阵,a=(aij)n×n,aij=p(qt+1=θj|qt=θi),1≤i,j≤n,

其中,n表示模型中markov链的状态数目,n个状态为θ1,θ2,…,θn,t时刻马尔科夫链所处的状态为qt,qt∈(θ1,θ2,…,θn);

b为观测值概率矩阵,b=(bj(o)),

用gmm模型描述b为:

其中,bj(o)表示第j个状态下,产生特征矢量o的概率,m为高斯元的个数,bjl为状态j下第l个高斯密度函数,μ为均值矩阵,σ为协方差矩阵,w为高斯分量权值系数矩阵,wjl表示第j个状态下第l个混合高斯元的权值系数,μjl表示第j个状态下第l个混合高斯元的均值矢量,σjl表示第j个状态下第l个混合高斯元的协方差矩阵,|σjl|表示协方差矩阵的行列式值,d为特征矢量的维数,h为长时信号所经历的隐状态个数;

对hmm模型的各个参数进行初始化,对π和a进行随机初始化,对b采用gmm模型来估计hmm模型中每个状态产生某一特征矢量的概率,并采用k-means算法对gmm模型进行参数估计,通过k-means算法将每类事件的多组特征矢量序列中的每个特征矢量分配到h个隐状态下,对每个状态下的特征矢量再进行一次k-means聚类,k-means聚类的聚类中心数为gmm模型的混合高斯元个数m,按下列公式对权值系数wjl、均值矢量μjl和协方差矩阵σjl进行初始化:

完成hmm模型的参数初始化;

步骤4.1.4:根据步骤4.1.2的特征矢量序列集o,假设各特征矢量序列相互独立,则所有特征矢量序列的联合概率分布为:

用k条相互独立的特征矢量序列基于baum-welch算法对hmm模型的各个参数进行重估,重估公式为:

式中,为过渡概率,表示第k组特征矢量序列在t时刻处于状态i,在t+1时刻处于状态j的概率,其中,为前向变量,表示第k组观测矢量序列在t时刻,状态为θi,前t秒内观测值为o1,o2,…,ot的概率,为后向变量,表示第k组观测矢量序列在t时刻,状态为θi,从t+1秒到l秒内观测值为ot+1,ot+2,…,ol的概率;

表示给定模型λ和o(k),在t时刻处于状态qi的概率;

表示某个特征矢量序列在t时刻处于状态j时对于第l个混合高斯元的输出概率,g和n为gmm模型;

根据上述重估公式用训练集所有特征矢量序列更新hmm模型各个参数一遍为训练过程的一次迭代,当前后两次迭代过程的联合概率p(o'|λ)误差小于设置的收敛误差时,停止迭代,完成hmm模型训练;

步骤4.1.5:根据步骤4.1.2至步骤4.1.4,利用不同振动事件的时间结构特征序列集的训练集分别对hmm模型进行训练,得到不同振动事件的hmm模型,将各模型参数保存,完成线下振动事件hmm模型库的构建。

步骤4.2:在测试集上,采用维特比算法计算每条测试数据在线下振动事件hmm模型库中各模型下的贝叶斯后验概率,以输出概率最大的模型所对应的事件标签作为该测试信号的事件类型,实现振动信号的识别和分类;

步骤4.2.1:在测试集上,采用下列公式对测试数据在线下振动事件hmm模型库的hmm模型下的贝叶斯后验概率进行初始化操作:

再采用下列公式进行递归操作:

从而得到贝叶斯后验概率p*

式中,δt(i)为t时刻沿一条路径q1,q2,…,qt产生o1,o2,…,ot的最大概率,δt(i)=maxp(q1,…,qt,qt=θi,o1,…,ot|λ),其中,qt=θi表示在时刻t状态为θi,为在时刻t状态为θi的所有路径q1,q2,…,qt中概率最大的路径的第t-1个节点,

递归完成后,t=l,p*对应当前特征矢量序列在给定模型参数下的最大输出概率;

步骤4.2.2:采用步骤4.2.1的方法,根据模型库中各hmm模型参数λi和当前特征矢量序列o,计算各模型下对该特征矢量序列的预测概率pi*=p(o|λi);

步骤4.2.3:选择步骤4.2.2的所有预测概率中最大的预测概率所对应的模型事件标签,作为当前测试信号的事件类型,实现振动信号的识别和分类。

步骤5:进行在线测试:将某一振动事件的时空矩阵信号的列信号输入已经保存的最优mcnn模型,得到时间结构特征矢量并对其进行重组,重组为时间结构特征序列,再输入已构建的线下振动事件hmm模型库,依次比较在各事件模型下的概率输出,将最大概率对应的事件类型作为分类结果,输出振动源类别。

具体地,采用本发明的改进的mcnn模型提取的特征得到的hmm模型,即采用mcnn-hmm复合模型和采用人工提取特征得到的hmm模型对四类事件的测试数据进行识别测试,得到如图10所示的时间测试识别率对比图,图10(a)为采用mcnn-hmm复合模型得到的事件识别率,平均识别率达到98%,图10(b)为采用人工提取特征的hmm模型的分类识别率,平均识别率为91.5%。因此,可以看出,本发明的分类识别效果优于采用人工提取特征的hmm模型的分类识别效果。

本发明根据采集的振动源时空矩阵信号,构建光缆振动事件数据集,再构建并训练改进的mcnn模型,并对模型进行调优得到最优mcnn模型,然后利用最优mcnn模型构建时间结构特征序列集,再构建并训练hmm模型,得到线下振动事件hmm模型库作为振动源识别的分类器,实现振动源的分类识别,初次提出了端对端的mcnn-hmm复合模型,可同时提取分布式光纤振动信号的局部结构特征和时序特征,自动挖掘光纤振动信号携带的信息,避免了人为特征提取的麻烦,并且不依赖人为经验,提高了模型在新应用场景下的更新效率和泛化能力;相比现有的深度学习网络,增加了对结构特征之间的时序关系挖掘,进一步丰富了信号的特征信息,可以提高振动源识别的准确性。

需要说明的是,由于说明书附图不得着色和涂改,所以本发明附图中部分区别明显的地方比较难以显示,若有必要,可提供彩色图片。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明的保护范围,任何熟悉本领域的技术人员在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1