基于i-vector局部加权的光纤振动振源识别分类方法及系统与流程

文档序号:19157031发布日期:2019-11-16 00:57阅读:179来源:国知局
基于i-vector局部加权的光纤振动振源识别分类方法及系统与流程

本发明涉及光纤听音、安防领域,特别是涉及基于i-vector局部加权的光纤振动振源识别分类方法及系统。



背景技术:

光纤振动传感器作为一种新型的振动采集传感器,可以实现长距离无缘探测,微小的扰动就可以使光纤由于振动而变形,传输轨迹也会相应变化。具有抗电磁和射频干扰、灵敏度高、安全可靠和保密性强等优点,特别适用于强电磁场、高射频、易燃易爆和军事安全等场合。但光纤振动对信号过于灵敏也造成误报率高,现多采用门限的方式来过滤虚警。

目前门限上的处理设计思路主要是提取出信号的幅度特性,该幅度特性也包括杂波和噪声幅度变化,将提取到的幅度特性与门限比较,将高于门限的信号提取后报警。而门限值不能很好的反应光的振动情况。当光路及外部环境发生变化的时候无法进行自适应调整,因而可用性极差。而本发明利用光纤采集的振动数据可还原为音频,继而采用基于语音模式识别分类的方法进行,因此研究基于i-vector局部加权的光纤振动振源识别方法具有非常重要的理论价值和实际应用意义。



技术实现要素:

本发明主要解决的技术问题是提供一种基于i-vector局部加权的反馈式光纤振动振源分类的方法及装置。由于光纤中瑞利散射的反馈光的反射强度调制,声纹识别系统通常采用线性鉴别分析(lda)来消除训练和测试振源音频之间信道失配,不能保证样本在待识别振源近邻区域内具有最佳的分离度,这就使得在光纤振动系统中目标振源和其近邻间的得分差异较小,进而导致识别准确性下降。而近年来为了提高在信道失配条件下的识别鲁棒性,进一步提出了sn-lda(sourcenormalisedlineardiscriminantanalysis)、wlda(weightedlineardiscriminantanalysis),方法在计算类内和类间散度矩阵时,对所有的训练样本赋予相同的权重,然后求解出的投影矩阵可以最大化所有样本的平均类间散度和最小化平均类内散度。然而,这些方法没有很好地突出待识别振源音频近邻区域的局部分离度。

为解决上述技术问题,更好的对目标振源进行识别分类,针对该问题本发明提出的一个技术方案是基于i-vector局部加权线性判别分析的目标振源识别方法(lwlda)。在计算类内和类间散度时,增加待识别振源近邻样本权重。在此基础上,通过提高待识别振源近邻域局部类间的分辨能力,尽可能减少因信道差异而产生的识别错误。

其中,所述基于i-vector局部加权线性判别分析的算法设计的步骤包括:线性判别分析与信道失配补偿。首先,本发明为了使目标振源所有信道条件下的声纹特征更加紧凑,引入了t子空间的概念。把振源音频的差异性用单一的更低维的t空间和残差来表示。对于一段振源音频,在t子空间里,超ubm均值向量可以表示为:

m=m+tx+ε(1)

式(1)中,m为一个与特定目标振源和信道都无关的超向量,即由大量通用背景振源音频训练的ubm均值向量,代表所有人在所有信道条件下的超均值向量的平均值。t为t子空间矩阵,x为目标振源因子,其分布服从正态分布n(0,i),ε为残差,可视作噪声。m服从均值为m、协方差矩阵为ttt的正态分布。t子空间矩阵t可在训练集目标振源语音样本上由map(maximumaposterior)算法生成,t子空间变化因子属于隐变量。在给定目标振源s第h段语音的特征和t子空间参数集的条件下,将i-vector记作us,h,将该段语音的0阶和1阶baum-welch统计量记为n(s,h)与f'(s,h),训练时的方差记为σ,具体如式(2):

us,h=(i+ttσ-1n(s,h)t)-1ttσ-1f'(s,h)(2)

其中,在线性判别分析里,为了在保持目标振源声纹特征的同时并消除信道差异性,采用lda投影实现2次降维,使得i-vector的维数远小于ubm均值超向量。目标振源特征us符合高斯分布n(0,1),类间和类内散度矩阵分别为:

(3)

(4)

其中,ui为第i个目标振源语音样本的i-vector,us为第s个目标振源的目标振源语音样本的i-vector均值,uo为所有目标振源语音样本的i-vector均值。s为总目标振源个数,ns为第s个目标振源目标振源语音样本的个数。投影矩阵设为p,可用式(5)求解:

sbv=λswv(5)

式(5)中:λ、v分别为sw-1sb所对应的特征值和特征向量。投影矩阵p由最大的前nd个特征值对应的特征向量组成,nd为投影后目标振源特征的维数。设i-vector为x,投影后的目标振源声纹特征为:

y=ptx(6)

sn-lda将sb重新定义为:

sb=s1b+s2b(7)

式中:s1b是针对麦克风语音计算的类间散度,s2b是针对光纤语音计算的类间散度。类内散度矩阵为:

sw=stotal-sb(8)

stotal为总散度:

(9)

式中:n为所有类样本总数。在式(7)~(9)的基础上,首先根据式(5)求取投影矩阵,然后利用式(6)对i-vector进行投影变换。

通过增加待识别振源音频近邻样本权重求解投影矩阵。由于待识别振源音频近邻域局部类间分辨能力得到了增强,因此提高了识别准确率。一方面,待识别振源音频近邻区域的局部类间分离度对识别结果的准确率影响更为重要;另一方面,同待识别振源音频距离较远区域的类间分离度并影响对识别结果的判决。因此可以重新计算类间散度sb、类内散度sw如下:

(10)

(11)

式(10)及式(11)中:ws为第s个目标振源的样本权值,若该目标振源语音样本是待识别振源音频的近邻,则令ws=1,否则ws=α。其中,α∈[0,1]为权重系数。当α∈(0,1)时,减小了待识别振源音频近邻以外样本的权重,等同于增加了近邻样本的权重。边界条件下,当α=0时,相当于只有待识别振源音频的近邻样本参与了训练;当α=1时,则lwlda将退化成lda。将sb和sw代入式(5)后,可以求取投影矩阵,然后结合式(6)对i-vector进行投影变换。可显著改善算法的收敛性能。利用语音库及自行采集的数据实验,测试结果如图4、图5、图6,证明基于瑞利散射的光纤振动系统采用i-vector局部线性加权算法够在复杂信道条件下始终保持良好的鲁棒性,可提高振源识别的准确率,从而提高系统的可用性。

综上,可将前述lwlda方法实现步骤归纳如下:

步骤1:令所有ws=1;

步骤2:利用训练振源音频的i-vector,根据式(10)和(11)分别计算sb和sw;

步骤3:根据式(5),求得投影矩阵p;

步骤4:根据式(6),对测试振源音频i-vector进行投影变换,生成新的特征向量;

步骤5:对步骤4生成的新特征向量,计算登记目标振源语音样本和待识别振源音频样本的gplda得分;根据相似度,从高到低取前k个登记目标振源语音样本,将第k个样本和待识别振源音频样本的gplda得分设为θ;

步骤6:根据式(6),对训练振源音频i-vector进行投影变换,生成新的特征向量,在此基础上计算训练集振源音频样本和待识别振源音频样本gplda得分;根据θ确定待识别语音的近邻样本,将近邻样本对应的ws设为α;

步骤7:重做步骤2和步骤3后,根据式(6)对步骤5产生的k个登记目标振源及待识别振源音频样本的i-vector进行投影变换,生成新的特征向量;据此计算这k个登记目标振源和待识别振源音频样本的gplda得分;

步骤8:选择该k个登记目标振源中和待识别振源音频样本的gplda得分最高者,作为识别结果输出。

附图说明

图1是本发明采用的i-vector局部加权算法整体流程示意图;

图2是本发明采用的系统整体装置示意图;

图3是本发明采用的光路装置示意图;

图4是本发明在参数α对识别率的影响(k=10)性能曲线;

图5是本发明参数k对识别率的影响(α=0.1)性能曲线;

图6是本发明不同算法的局部分离能力对比测试图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。然而,对光纤振动领域熟悉的同行人员来说,在没有这些具体细节的其它实施方式中也可以实现本申请。在其它情况中,省略对大家熟悉的装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

请参阅图1,图1为i-vector局部加权算法整体流程示意图,包括

1)将所有样本权值初始化为1,初步求解投影矩阵;

2)对待识别振源音频进行分析,找出训练振源音频集中与其相邻的样本;

3)将该近邻样本的权值加大,重新求解投影矩阵;

4)对测试语音i-vector进行投影和打分,以此判决识别结果。

图2示出的是系统整体架构图,描绘的是光纤振动系统在获取振动信号后的装置及其处理流程。本发明中将系统的振动数据输入来自于脉冲光禄系统的信息采集与采集卡数据采集功能模块的接收。由于脉冲光路采集的回光在光纤的传输路径受到干扰,其相位角无法确定,需要通过正交分解后再合成以确定其幅度与夹角信息。因此将回光通过分束器正交分解,而后两路正交光源将进入到apd光电转换模块,并由数据采集卡完成两路的振源信号采集。数据采集卡的核心功能包含板卡初始化设置、外围设备配置、网口通讯、中断使能等等,实现对光信号转电信号的实时采集并与上位机数据采集装置通讯。若判定不含振动信号则丢弃,否则传送振动信号,包含位置、时间等信息。由i-vector识别模块对预警事件进行分类,将事件分类并推送至前端模块。

请参阅图3,图3为本发明实施方式的的光路装置结构示意图。本系统激光器发射稳定的光信号,通过驱动器进行脉冲控制,进而通过edfa放大器进行能量放大、提高信噪比。而后发射光通过环形器射出,反射光通过环形器接收并通过pbs分光器后进入apd光电转换,最终变为数字信号并上传。

请参阅图4,图4为参数α对识别率的影响(k=10)性能曲线。在目标振源识别任务中,lda在计算sb和sw时,对所有的训练样本是同等对待的。而lwlda在计算sb和sw时,通过调节参数α和k,则以待识别目标振源语音样本为中心,自动将和待识别振源音频邻近样本的权重增大,时将较远样本的权重减小。如图4所示,随着α值的增加,lwlda识别先是低于基线lda,接着逐渐上升并超过基线,然后缓慢下降,最终和lda相当。这是因为,当α接近0时,除待识别振源音频近邻外的其他样本的权重很小,特别是当α=0时完全失去了作用。在这种情况下,相当于只有待识别振源音频的近邻样本参与了训练。训练样本的不足造成求解出的投影矩阵有效维数过低。由于损失了一部分鉴别信息,因此出现了识别率下降。随着α的增大,所有样本参与训练,避免了sb和sw的秩降低;同时,通过增加待识别振源音频近邻样本在sb和sw中的权重,使得局部分辨能力逐渐增强。当α>0.02时,lwlda的性能超出lda,并在α=0.1时达到最高峰。此后,再随着α的增大,待识别振源音频邻近样本的权重和其他较远样本差异缩小。当α>0.6时,性能逐渐接近于lda,最终,当α=1时,退化成lda域。由高至低,寻找登记人样本中与待识别目标振源语音样本最相似的第k个样本,取其与待识别目标振源语音样本的距离为阈值,在训练集语音中与待识别振源音频的距离小于此阈值者视为近邻样本。

请参阅图5,图5为参数k对识别率的影响(α=0.1)。以lda为基线,给出了参数k对lwlda识别性能的影响。当k=1时,lwlda退化为lda。此后随着k的增加,lwlda识别率逐渐增加,当k≥4时,虽有小幅波动,但其期望值相对稳定。由此可知,k∈[4,5,…,10]时有利于提高识别性能。

请参阅图6,图6示出的为局部分离能力对比图。振源音频信号的特征参数维数通常较高,这些数据在高维空间中的分布及内在联系难以直接观察。为了清楚地对比各种方法在待识别振源音频近邻局部分离能力的差别,这里将高维的特征参数映射到二维空间,即进行二维可视化。实验中,以某段待识别振源音频为例,局部区域选择为该段语音所对应的目标振源(m144)及其4个近邻目标振源(m142、m160、m168、m182)。其中,每个目标振源采集的4段振源音频(t1~t4),共计20个目标振源语音样本。对这些音频信号提取i-vector后,分别采用lda、snlda、wlda、lwlda投影到低维空间并进行长度规整。图6给出了相应的可视化结果。通过增加近邻。权重,lwlda在待识别振源音频近邻局部分离能力方面优于其他3种方法。在相同信道条件下,4种方法性能较接近,均能达到较高识别率。而在不同信道条件下,lwlda的识别率始终高于其他3种方法。在t子空间所提取的i-vector同时包含目标振源特征和信道特征。在交叉信道条件下,i-vector中叠加有不同的信道特征而使得目标振源之间的类间关系,特别是近邻域的类间关系受到干扰而变得复杂。lwlda在计算sb和sw时,通过对待识别样本的近邻样本赋予更大的权值,可以得到一个更加鲁棒的投影矩阵,从而提高在交叉信道条件下的识别准确性。

以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1