基于决策树TWSVM的高速光信号调制格式识别方法与流程

文档序号:17726337发布日期:2019-05-22 02:32阅读:240来源:国知局
基于决策树TWSVM的高速光信号调制格式识别方法与流程

本发明涉及高速光通信技术领域,尤其涉及一种基于决策树(decisiontree,dt)twsvm(twinsupportvectormachine,孪生支持向量机)的高速光信号调制格式识别方法。



背景技术:

随着电子技术和光通信技术的快速发展,光通信信号的调制格式更加多样化和复杂化,以充分利用通信资源。由于信号环境日益密集,不同调制格式的不同信号会同时进入宽带接收机,这需要同时识别多个调制信号。在接收端的接收和解调过程中,调制格式识别(modulationformatidentification,mfi)位于整个信号接收解调过程的前端,因此mfi的准确性和效率将影响整个信号处理的结果。然而,下一代光网络使接收机可以从接收信号中盲目识别调制格式。因此,光信号调制格式的盲识别和自动识别已成为没有任何先验知识的研究重点。

目前,现代光通信系统主要用于骨干传输网络,由于骨干网需要实现大容量、高带宽、高速率和长距离传输,因此对现代光通信系统的传输能力和性能维护提出了更高的要求。为了满足不同传输业务和网络升级的需求,未来的光纤通信网络是异构的,多种调制格式和信号速率可以在同一网络中共存。光网络的异构化趋势使光通信系统的网络管理、优化和信号接收更加复杂。为了实现光网络的智能管理和自适应光接收机,mfi技术对异构光网络的管理控制和自适应光信号接收具有重要价值。此外,光网络也将向智能光网络发展,因为智能光网络具有重构、灵活和安全的特点,并且提高网络的整体利用率需要有效、高效和准确的光信号质量监测。当前的光网络正朝着具有速率自适应收发器的弹性光网络(eon)和智能认知光网络(icon)发展来支持多种调制格式,它具有更好的可扩展性和协作性,能够协调发送器和接收器,实现光信号速率和调制格式的实时动态调整,实现网络节点中的智能信道管理和带宽分配等链路管理功能,同时它可以通过光学性能监测(opm)技术监控信号质量,为动态路由和网络管理提供基础。

光网络中的mfi技术目前主要是采用基于特征的(fb)统计模式识别方法,该方法是从接收信号中提取重要特征,由分类器对提取的观测值进行分类和识别,当前的研究重点即是针对分类器的分类算法,寻找合适的算法,最大可能地在较少的特征参数的情况下解决在低光信噪比(osnr)时识别精度低、识别时间长的问题。分类器的分类过程是在选择或构造特征参数与样本训练集相结合的基础上,设计合理的分类器结构和分类标准,最后通过训练分类器进行分类决策。

机器学习在分类决策中具有优越的性能,典型的如支持向量机(supportvectormachine,svm)方法,svm广泛应用在高速光信号的调制格式盲识别中。svm是建立在统计学习理论和结构风险最小原理基础上,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,来获得最好的泛化能力。对于二分类问题,svm旨在输入样本空间中找到一个最优分离超平面对两类样本进行正确分割,这个超平面通过估计训练样本集中两类样本最接近数据点的距离来获得,如果训练样本中的数据点在输入空间中线性不可分,这些训练样本将会通过核函数实现将各输入特征向量到高维特征空间的转换,通过高维空间中寻找最优分类超平面实现对信号调制方式的判决,利用svm解决二分类问题中最优超平面与分类样本的关系如图1所示。

由于随着相干光通信技术的发展,高速率和高阶调制格式已被广泛应用,而针对高速率和高阶调制格式的光信号信号量大,大数据量就意味着使用传统的如svm等的机器学习算法需要较多的训练特征以及额外的复杂性和计算时间,尤其是在低osnr(光信噪比)情况下,会存在泛化能力不足、计算时间长、不平衡数据分类精度低等问题。



技术实现要素:

本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种实现方法简单、在低光信噪比时识别精度及识别效率高、计算复杂度低的高速光信号调制格式识别方法。

为解决上述技术问题,本发明提出的技术方案为:

一种基于决策树(decisiontree,dt)twsvm(twinsupportvectormachine,孪生支持向量机)的高速光信号调制格式识别方法,步骤包括:

s1.dt-twsvm分类器构建:预先构建决策树框架并在构建的所述决策树架构的每个节点中使用twsvm,得到dt-twsvm分类器,所述决策树框架中根据高阶累积量定义第一特征参数t1以实现初始分类,根据差分运算后的累积量定义第二特征参数t2以及根据循环谱定义第三特征参数t3以实现最终分类;

s2.信号采样:进行高速光信号调制格式识别时,对所需混合速率多调制格式光信号进行低速率采样,得到待识别信号;

s3.特征提取:分别提取所述待识别信号的所述第一特征参数t1、第二特征参数t2以及第三特征参数t3;

s4.格式识别:将所述步骤s3提取到的各特征参数数据输入到所述dt-twsvm分类器中,得到识别结果。

作为本发明的进一步改进:所述步骤s2中基于压缩感知理论方法进行低速率采样。

作为本发明的进一步改进,所述基于压缩感知理论方法进行低速率采样的步骤包括:

s21.选择最佳稀疏基来实现光信号的稀疏表示;

s22.构造满足约束等距特性的测量矩阵,将采样的信号从高维空间映射到低维度空间,以实现对信号的线性测量;

s23.选择重构算法将原信号在所述测量矩阵下的投影进行重构恢复,重构得到待识别信号。

作为本发明的进一步改进:所述步骤s3中提取得到各特征参数数据时,通过使用压缩感知理论方法,计算在指定压缩率下各特征参数数据的值,重构得到各特征参数的压缩采样值。

作为本发明的进一步改进:所述第一特征参数t1定义为t1=|c8,0|/|c4,0|,所述第二特征参数t2定义为t2=|cd8,0|/|cd4,02,其中c4,0、c8,0分别为四阶、八阶累积量值,cd表示差分运算后的累积量值,所述第三特征参数t3定义为其中为循环谱值。

作为本发明的进一步改进,所述步骤s3中还包括对各特征参数使用压缩感知理论方法,计算在压缩率为δ的情况下经过线性测量后的四阶、八阶累积量值和循环谱值为:

其中,φ为线性测量中的测量矩阵,f为离散傅里叶变换矩阵,p为对角线投影矩阵,km和hn均为投影矩阵,in为n维的识别矩阵,λv为n×n的矩阵且只有它的对角线元素为1,其他元素为0。

作为本发明的进一步改进:所述步骤s1中构建dt-twsvm分类器时,还包括比较不同核函数下所述dt-twsvm分类器的识别性能,根据比较结果确定最佳核函数。

作为本发明的进一步改进:使用k折分层交叉验证方法对不同核函数下所述dt-twsvm分类器的识别性能进行评估,以确定最佳核函数。

作为本发明的进一步改进:所述dt-twsvm分类器中具体选择rbf核函数作为最佳核函数。

作为本发明的进一步改进:所述dt-twsvm分类器中训练集比例为70~80%。

与现有技术相比,本发明的优点在于:

1、本发明基于决策树twsvm的高速光信号调制格式识别方法,充分利用twsvm以及决策树框架的特性,通过基于高阶累积量和循环谱特征构建决策树框架,同时将twsvm置于决策树框架中构建得到dt-twsvm分类器,对高速混合速率多调制格式光信号进行低速采样后使用dt-twsvm分类器进行识别,可以有效降低计算复杂度,提高识别效率及识别精度,且灵活性较高,解决了传统svm等在低osnr情况下识别时间长、识别精度低的问题。

2、本发明基于决策树twsvm的高速光信号调制格式识别方法,通过先基于高阶累积量对输入的混合速率多调制格式进行第一层分类,在第一层分类的基础上,再针对某些相移键控光信号采用差分运算后的累积量以及循环谱实现最终分类,可以很好的实现各种调制格式光信号的分类识别,同时避免误差积累。

3、本发明基于决策树twsvm的高速光信号调制格式识别方法,进一步通过将压缩感知理论与特征提取算法进行结合,使得直接重构特征参数的压缩采样值,而不是重构原始信号,可以进一步降低计算复杂度,且可靠性更高。

附图说明

图1是支持向量机svm的最优分类超平面原理示意图。

图2是本实施例基于决策树twsvm的高速光信号调制格式识别方法的实现流程示意图

图3是本实施例中使用dt-twsvm分类器进行识别的实现原理示意图。

图4是twsvm处理线性和非线性数据的原理示意图。

图5是本实施例中构建的实时光纤信号调制格式识别系统的结构示意图。

图6是本发明具体应用实施例中构建的dt-twsvm分类器的分类原理示意图。

图7是本发明具体应用实施例中在不同训练集比例下的信号整体识别精度结果示意图。

图8是本发明具体应用实施例中构建dt-twsvm分类器的详细步骤流程示意图。

具体实施方式

以下结合说明书附图和具体优选的实施例对本发明作进一步描述,但并不因此而限制本发明的保护范围。

如图2、3所示,本实施例基于决策树twsvm的高速光信号调制格式识别方法,步骤包括:

s1.dt-twsvm分类器构建:预先构建决策树框架并在构建的决策树架构的每个节点中使用twsvm,得到dt-twsvm分类器,决策树框架中根据高阶累积量定义第一特征参数t1以实现初始分类,根据差分运算后的累积量定义第二特征参数t2以及根据循环谱定义第三特征参数t3以实现最终分类;

s2.信号采样:进行高速光信号调制格式识别时,对所需混合速率多调制格式光信号进行低速率采样,得到待识别信号;

s3.特征提取:分别提取待识别信号的第一特征参数t1、第二特征参数t2以及第三特征参数t3;

s4.格式识别:将步骤s3提取到的各特征参数数据输入到dt-twsvm分类器中,得到识别结果。

twsvm是基于非平行超平面思想,通过解决两个较小规模的二次规划问题,构造出一组非平行超平面的判别输入数据,使得训练时间大大减小,可以减小为大约原标准svm的四分之一,决策树框架具有高效计算优点。本实施例充分利用twsvm以及决策树框架的特性,通过基于高阶累积量和循环谱特征构建决策树框架,同时将twsvm置于决策树框架中构建得到dt-twsvm分类器,对高速混合速率多调制格式光信号进行低速采样后使用dt-twsvm分类器进行识别,可以有效降低计算复杂度,提高识别效率及识别精度,且灵活性较高,解决了传统svm等在低osnr情况下识别时间长、识别精度低的问题。

twsvm的中心思想是构造一组非平行超平面实现二分类,twsvm处理线性和非线性问题时原理如图4,本实施例采用的twsvm的实现原理如下:

由于线性是非线性的一种特殊情况,本实施例对twsvm的分析仅考虑非线性情况,在非线性的情况下,考虑二元分类问题并假设有两种类型的训练集:

t={(x1,y1),…,(xi,yi)},i=1,2,…,l(1)

其中,xi∈rn为属性向量,yi∈{-1,1}表示两类模式,另外假设分别来表示属于1,-1类的输入矩阵。

与传统的svm方法类似,twsvm中核函数用于将数据样本映射到更高维度的特征空间,以便更容易地分离这种类型的数据样本,基于内核空间的twsvm的两个超平面可以表示为:

k(xt,ct)w1+b1=0,k(xt,ct)w-1+b-1=0(2)

其中,核函数可使用:线性核函数多项式核函数rbf核函数k(xi,xj)=exp(-γ||xi-xj||2)和s型核函数c=[a;b]t,γ为核参数,r为常数项,d为多项式阶数。

要得到上述两个超平面,则需要解决如下两个二次优化问题(qpp):

其中,c1和c-1是非负的参数,而e1和e-1是与相应类有相同维数的由1组成的列向量。

对于上述优化问题,本实施例引入拉格朗日函数,同时根据库恩塔克条件对其对偶问题进行转化可以得到twsvm的分类决策函数为:

本实施例基于上述分析,通过构建dt-twsvm分类器以实现信号识别问题中的多分类问题,通过dt-twsvm架构能够提供卓越的多级分类性能,对于k类样本的分类,dt-twsvm多类分类算法需要构造k-1个twsvm分类器,在分类过程中,解决二元分类问题的规模会较小,因此训练速度通常较快,可以缩短训练时间,有效提高识别效率。

由于dt-twsvm的基本过程是从根节点开始计算分类函数,并根据正负判断值确定下一个节点,因此它在某个叶节点之后停止,此时由叶节点表示的类别是样本所属,根据该过程,不需要完全计算dt-twsvm中所有分类器的判别函数,并且上层节点的分类器的分类性能对整个模型的稳定性具有更大的影响。在dt-twsvm分类方法中,如何构造决策树和类之间的可分性度量是研究的关键。由于决策树上层节点的划分会对下层节点产生很大影响,如果上层节点的分类器在样本分类中出错,则较低的分类器会直接受到影响,这必然会导致错误现象的积累,错误累积意味着上层节点的分类错误将对下层节点的分类产生不良影响,并最终降低分类准确性。

本实施例通过对dt-twsvm方法的训练和分类过程的上述分析,考虑误差积累的主要原因是分类器没有很好地分离正负类别,通过根据不同调制格式的特征参数的性质构建dt-twsvm分类器结构,dt-twsvm分类器中,首先根据高阶累积量定义第一特征参数t1实现未知的多调制格式信号第一层分类,由于相移键控光信号难以直接通过第一层分类进行区分,如16qam和64qam信号,在第一层分类的基础上,针对某些相移键控光信号采用差分运算后的累积量定义第二特征参数t2以及基于循环谱特征定义第三特征参数t3,实现多调制格式光信号的最终分类,可以很好的实现各种调制格式光信号的分类识别,同时避免误差积累。

以对光纤传输系统中广泛应用的10gbook、40gbdpsk,100gbqpsk,100gboqpsk,200gb16qamand200gb64qam共六种调制格式光信号进行识别为例,首先构建如图5所示的实时光纤信号调制格式识别系统,通过对压缩采样后的六种信号提取第一特征参数t1,由第一特征参数t1可以将六种信号通过第一层的分类分为三类:(ook,dpsk)、(qpsk,oqpsk)和(16qam,64qam),其中的相移键控光信号尚不能实现分类,然后通过计算差分运算后的累积量值(t2)和循环谱值(t3)将(qpsk,oqpsk)和剩余两组信号进行分类;经过上述的分类步骤,选择决策树框架并在决策树节点中采用twsvm构造dt-twsvm分类器,根据六种信号的特征参数的性质,构建的决策树支持向量机分类器结构如图6所示。

如图5所示,本实施例通过构建实时混合速率多调制格式光信号识别系统,通过该识别系统对未知的混合速率多调制格式光信号进行低速率采样,再经调制格式识别模块识别光信号调制格式。

本实施例中,步骤s2中具体基于压缩感知理论方法进行低速率采样,即利用压缩感知理论实现高速光信号的低速率采样,可以减少数据处理量以及计算复杂负,从而实现高速光信号的高效处理。

本实施例中,基于压缩感知理论方法进行低速率采样的步骤包括:

s21.选择最佳稀疏基来实现光信号的稀疏表示;

s22.构造满足约束等距特性的测量矩阵,将采样的信号从高维空间映射到低维度空间,以实现对信号的线性测量;

s23.选择重构算法将原信号在测量矩阵下的投影进行重构恢复,重构得到待识别信号。

本实施例利用压缩感知理论进行低速率采样时,首先将待识别信号认为在某稀疏域(规范正交基)下是稀疏的或近似稀疏,在此基础上选择最佳稀疏基来实现光信号的稀疏表示;通过构造满足约束等距特性(rip)的测量矩阵将原信号(如含有上述六种不同调制格式信号的多调制格式信号)从高维空间映射到低纬度空间,实现对原始信号的线性测量;最后选择合适的重构算法将原信号在测量矩阵下的投影进行重构恢复,从而实现精确的原信号重构。

在具体应用实施例中,步骤s3中提取得到各特征参数数据时,具体还可以通过使用压缩感知理论方法,计算在指定压缩率下各特征参数数据的值,重构得到各特征参数的压缩采样值,通过将压缩感知理论与特征提取算法进行结合,使得直接重构特征参数的压缩采样值,而不是重构原始信号,计算复杂度低且可靠性更高。

根据高阶累积量和高阶矩的关系可知:

其中c4,0、c8,0分别为四阶、八阶累积量值,m为高阶矩。

本实施例具体基于高阶累积量定义特征参数t1=|c8,0|/|c4,0|,以及基于差分运算后的累积量值定义特征参数t2=|cd8,0|/|cd4,0|2,cd表示差分运算后的累积量值,以及基于循环谱值定义特征参数其中为循环谱值,α为循环频率;

对上述三个特征参数进一步引入压缩感知理论,得到在压缩率为δ的情况下经过线性测量后的四阶、八阶累积量值和循环谱值分别为:

其中,φ为线性测量中的测量矩阵,f为离散傅里叶变换矩阵,p为对角线投影矩阵,km和hn均为投影矩阵,in为n维的识别矩阵,λv为n×n的矩阵且只有它的对角线元素为1、其他元素为0。

本实施例通过基于压缩感知理论、高阶累积量和循环谱特征、以及决策树孪生支持向量机分类器等思想,构建实时高速光信号调制格式识别系统实现低速率采样,解决了在低osnr情况下的识别精度低的问题,能够提高训练速度,同时降低计算复杂度。

本实施例中,步骤s1中构建dt-twsvm分类器时,还包括比较不同核函数下所述dt-twsvm分类器的识别性能,根据比较结果确定最佳核函数。具体将各特征参数数据输入到分类器中,通过对线性核函数、多项式核函数、径向基(rbf)核函数以及s型核函数等不同核函数下的光信号进行整体识别精度的比较,确定得到最优核函数。

为了评估上述dt-twsvm分类器中不同核函数的性能,本实施例具体使用k折分层交叉验证(k-cv)方法对不同核函数下构建的dt-twsvm分类器性能进行评估,根据评估结果确定最佳核函数,k折分层交叉验证目的即是评估模型的泛化能力,不仅可以提高数据的利用率,更重要的是可以在一定程度上解决过拟合问题,从而进行模型选择。k-cv方法中的k值具体取为10,该过程是将原始数据平均分成10组,10-1组数据子集用于训练,其余用于测试;该过程重复10次,并且10组测试结果的平均值最终用作模型精度的估计,并且作为当前10次交叉验证下的模型的性能指标。在具体应用实施例中得到的不同内核函数下光信号整体识别精度的比较结果如表1所示。

表1:不同核函数下的整体识别精度。

经过上述验证评估,dt-twsvm分类器中具体选择rbf核函数作为最佳核函数。构建的dt-twsvm分类器,信号识别时间可达毫秒级,而训练时间仅需传统支持向量机的大约1/4。

dt-twsvm中训练集和测试集之间多维特征向量比例会影响分类器的识别精度,本发明在具体应用实施例中构建dt-twsvm分类器时,预先将训练集的大小从10%增长为90%,以10%为步长,剩余的为测试集,得到的不同比例的训练和测试集中六种不同调制格式(10gbook、40gbdpsk,100gbqpsk,100gboqpsk,200gb16qamand200gb64qam)的光信号的总体识别精度的变化如图7所示,从图7中可以看出,除了训练集的比例为50%时整体识别率降低外,其余当训练集的比例增加时,整体识别准确度增加,分析判断当训练集的比例为50%时,发生了过度拟合现象。本实施例通过在不同训练集比例下对识别精度的上述对比分析,选择训练集比例为70%或80%,此时可以达到最佳的识别精度、识别效率,同时避免过度训练。

如图8所示,本发明在具体应用实施例中构建dt-twsvm分类器的详细流程为:

步骤1:构建如图3所示的实时混合速率多调制格式光信号识别系统;

步骤2:针对未知的混合速率多调制格式光信号进行低速率采样;

步骤3:根据高阶累积量特征:定义特征参数t1实现未知的多调制格式信号第一层分类;

步骤4:在第一层分类的基础上针对某些相移键控光信号采用差分运算后的累积量定义特征参数t2和循环谱特征定义特征参数t3实现多调制格式光信号的最终分类,以构建决策树架构;

步骤5:在决策树架构的每个节点中使用孪生支持向量机,得到dt-twsvm分类器;

步骤6:对dt-twsvm分类器进行训练过程中,将各特征参数数据输入到dt-twsvm分类器中,通过对不同核函数下的光信号整体识别精度的比较,得到最优核函数;

步骤7:通过决策树架构的高效计算和孪生支持向量机的高分类精度得到各个未知光信号在低osnr下的识别精度,以确定dt-twsvm分类器的识别精度性能;

步骤8:对dt-twsvm分类器各个节点进行分析计算,得到该分类器的识别时间以及分析在识别过程中训练集比例对识别精度的影响,以确定最佳的训练集比例。

为了验证本发明在识别精度方面的优越性,当核函数为rbf时分别采用本发明上述dt-twsvm分类方法以及传统的dt-svm、决策树算法在不同osnr条件下对高速光信号调制格式进行识别并比较识别精度,比较结果如表2所示,训练集和测试集的大小选择为整个特征向量集的80%和20%。从表2中可以看出,随着osnr的增加,六种不同格式的光信号的识别精度在提高,当onsr为-5db时,本发明dt-twsvm分类的识别精度大于传统的dt-svm,当osnr为0db和5db时,两者的识别精度相等,识别精度在5db时达到100%;值得注意的是,不同osnr中dt-twsvm和dt-svm的识别精度明显高于dt方法,即表明本发明上述基于dt-twsvm的识别方法在低osnr下具有较高的识别精度;而由于16qam和64qam信号属于难以识别的类别,当osnr为0db时,两者的识别精度为95%,而其他信号达到100%,即本发明上述基于dt-twsvm的识别方法在低osnr下仍然具有更高的识别精度,并且当osnr为-5db时,平均识别精度高于94%,本发明上述基于dt-twsvm的识别方法,还可以引入新的调制格式信号以扩展该方法的灵活性而表现出更好的兼容性,相应的则会增加算法的复杂性和整个识别系统的识别时间。

表2:在dt-twsvm,dt-svm和决策树下六种不同光信号调制格式识别精度。

为了验证本发明上述识别方法的计算速度性能,分别使用本发明上述基于dt-twsvm的识别方法与传统的dt-svm对高速光信号调制格式进行识别并比较所需的识别时间,比较结果图表3所示,由表3可以看出,两者的识别时间均为毫秒级,而本发明dt-twsvm的每个节点的识别时间均低于dt-svm的识别时间,且dt-twsvm的总识别时间为1116.2ms,而dt-svm的总识别时间约为dt-twsvm的4.3倍,另外这个总时间可以看作是基于串行思想设计的多分类dt-twsvm的识别时间,然而对于并行工作的dt-twsvm的识别时间实际上为516.69ms,是五个节点中子twsvm中时间最长的一个。即本发明识别方法在计算速度上具有优势,能够在相对短的时间内识别各种调制格式的光信号。

表3:各子dt-twsvm下识别过程消耗时间。

上述只是本发明的较佳实施例,并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明。因此,凡是未脱离本发明技术方案的内容,依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰,均应落在本发明技术方案保护的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1