基于多特征关联和贝叶斯网络的通信信号分类识别方法与流程

文档序号:17071478发布日期:2019-03-08 23:21阅读:568来源:国知局
基于多特征关联和贝叶斯网络的通信信号分类识别方法与流程

本发明属于通信信号处理技术领域,具体指一种基于多特征关联和贝叶斯网络的通信信号分类识别方法。



背景技术:

随着电子和通信技术的高速发展,无线电认知技术已经在民用频域资源监管、民用无线电通信、无线电子对抗等众多领域得到了广泛应用。无线电认知就是对无线通信信号进行的接收、识别、分析的过程。在信号确认、频谱监测等各种无线电管理领域中,无线电认知可以监视合法无线电电台是否合法使用频谱资源,同时侦听不法电台的干扰信号并对其进行识别。在无线电通信领域中,无线电认知可以在无线通信过程中,实现接收方自动识别发送数据的调制方式,从而提高频谱效率。而这些应用的需求,也在不断推进无线电认知技术的发展与进步。

对通信信号的认知过程可以划分为三步:首先,对信号进行预处理;其次,对某些关键的特征进行选择和提取;最后,通过构建分类器进行分类和识别。目前,对通信信号的认知和识别主要有两大类方法:一种是基于最大似然比的判别识别方法,另一种是基于特征选择和提取的统计模式识别方法。基于最大似然比的判别识别方法是把对信号的识别问题转化为假设检验问题,通过定义信号的似然函数并对其进行处理,得到可用于分类的特征量,然后输入到分类器中进行比较,从而得到识别的结果。最大似然比的判别识别方法目标是最大化似然概率,所以可以得到理论上的最优解,但是该方法表达式通常较为复杂,优化过程较为困难,同时对模型失配和参数偏差问题比较敏感,稳定性差。而基于特征选择和提取的统计模式识别方法是选择、提取信号的某些特征,例如幅度、频率、相位等直接特征或高阶累积量、循环累计量、混合矩等间接特征,然后按照一定的分类规则进行训练,从而对信号进行分类认知。该方法计算简单,较容易实现,而且在特征选择合适等情况下,可以近似得到最优解。

针对在真实且复杂的地理环境中,通信信号的种类繁多、通信信道的噪声干扰强、信号具有很大的不确定性的特点,设计一种准确高效的通信信号认知分类算法具有重要的研究意义。



技术实现要素:

本发明的目的是为了实现在复杂的电磁环境下,实现对无线通信信号进行用户分类认知的功能。针对信噪比波动范围大、训练样本不足等特点,对信号的时域、频域和空域的特征进行关联,并设计贝叶斯网络模型,对不同信噪比范围和较少样本数量的数据集进行训练,能够快速准确的得到用户认知结果。

本发明提出的基于多特征关联和贝叶斯网络的通信信号分类识别方法,具体步骤如下:

第一步,构建包括多种调制方式在内的通信信号样本数据集,选择并提取通信信号的时域、频域和空域维度的特征;并将所述的通信信号样本数据集分为训练集、交叉验证集和测试集三部分。

第二步,采用基于先验和聚类结合的方法对训练集数据进行离散化预处理;

第三步,输入训练集,对贝叶斯网络模型进行结构学习,得到贝叶斯网络模型的有向无环图;

第四步,对贝叶斯网络模型进行参数学习,得到各节点的条件概率分布表,构建出贝叶斯网络分类器;

第五步,对交叉验证集和测试集的信号进行特征提取和离散化处理后,输入到第四步已训练好的贝叶斯网络分类器中,最终可得到信号认知结果。

本发明的优点在于:

(1)采用贝叶斯网络分类器进行认知分类,能够充分挖掘各个维度的特征之间的依赖关系,物理意义明确,适用于小样本情况和不完备数据集;

(2)采用先验和聚类结合进行离散化预处理的方法,可以最大程度的保留原始数据信息,从而能够提高分类准确率;

(3)采用随机抽样的方法对贝叶斯网络模型进行参数学习,在信噪比波动范围大和训练样本数量不足的情况下,仍然可获得很好的分类准确率。

附图说明

图1是通信信号分类识别系统总体设计框图;

图2是本发明提供的通信信号分类识别方法整体流程图;

图3是通信信号数据集的构成;

图4是采用不同训练样本时,mcmc算法抽样次数与收敛曲线;

图5是训练出的贝叶斯网络分类器结构模型图;

图6是不同信噪比和训练样本数量时,交叉验证的分类准确率曲线图;

图7a、7b分别为测试数据集部分原始数据、预处理后的数据(截取190-200部分);

图8是测试数据集部分分类结果及测试准确率。

具体实施方式

下面结合附图,对本发明的具体实施方法作进一步的详细说明。

本发明提供一种基于多特征关联和贝叶斯网络的通信信号分类识别方法,如图1所示,是一种实现所述的通信信号分类识别方法的通信信号分类识别系统的结构框图,所述的系统包括输入模块、贝叶斯网络分类器和输出模块,所述的输入模块输入包括空域、频域以及时域等维度的特征关联构造的通信信号样本数据集,用于训练贝叶斯网络分类器;贝叶斯网络分类器是贝叶斯网络模型学习的结果,包括贝叶斯网络模型的结构和参数两部分;输出模块输出的是用户认知分类结果,根据输入的某一通信信号的特征,经过贝叶斯网络分类器推理,按后验概率大小将该通信信号归为主用户、次用户和非法用户中的某一类,实现对未知通信信号进行用户类型的分类识别。

本发明的一种基于多特征关联和贝叶斯网络的通信信号分类识别方法,分成两部分:训练阶段和测试阶段。训练阶段是指,根据构建的通信信号的样本数据集训练出贝叶斯分类器;测试阶段是指,对测试信号特征提取、预处理,经过贝叶斯网络分类器识别后,得到用户类型的分类识别结果的过程。如图2所示,所述的通信信号分类识别方法共包括以下几个步骤:

训练过程:

第一步,构建包括多种调制方式在内的通信信号样本数据集,选择并提取通信信号的时域、频域和空域维度的特征,并将所述的通信信号样本数据集分为训练集、交叉验证集和测试集三部分。

首先,构建通信信号样本数据集,该通信信号样本数据集的样本的构成如图3所示,包括2psk、4psk、8psk、16qam、64qam、2fsk、4fsk、8fsk、2ask、4ask和8ask在内的11种调试方式信号,其中样本标签分为主用户、次用户和非法用户共三类。从时域、频域和空域选取的特征分别为:频域特征“载波频率”;时域特征“平方谱单频分量”、“四次方谱单频分量”、“瞬时幅度绝对值的平均值”和“小波未幅度归一化处理的方差”;空域特征“来波方向”。选取通信信号的信噪比范围为10~30db。通信信号样本数据集的样本总数为2000个,其中训练集样本数为1600个,交叉验证集样本数为200个,测试集样本数为200个。

第二步,采用基于先验和聚类结合的方法对训练集数据进行离散化预处理。

先验和聚类结合的方法是先通过基于先验知识对连续变量的取值范围进行区域划分,再采用聚类的方法对划分的区域进行修正,在不断迭代更新后,将具有近似取值的连续变量划分为同一类。先验和聚类结合的方法在连续变量的取值具有没有明确的物理意义、难以进行人为划分的情况下,能够最大程度的保留变量节点彼此的因果关系等信息,使得贝叶斯网络模型结构更具有真实性,从而提高贝叶斯网络模型的分类准确率。先验和聚类结合的离散化算法的伪代码描述如表1所示。

表1先验和聚类结合的离散化算法

其中,s为特征总个数,i=0,1,2,…,s;n为迭代次数,j=0,1,2,…,n;z为聚类类别数,l=0,1,2,…,z;di(x)表示训练集d中第x个样本的第i个特征的取值,li(z)表示特征i中第z类中心点的取值,m(z)表示属于第z类的样本个数总和,li'表示特征i的第z类中心点新的取值。

经过基于先验和聚类结合的方法对连续变量数据(训练集数据)进行离散化预处理,将其中时域特征分别划分出3个聚类中心点,如表2所示。

表2离散化预处理后的各特征的聚类中心点

第三步,输入训练集,对贝叶斯网络模型进行结构学习,得到贝叶斯网络模型的有向无环图。

马尔可夫链蒙特卡罗(mcmc)法是一种基于随机抽样的结构学习算法。它通过设置“拒绝采样率”,来使抽样结果逐渐收敛于平稳分布p。mcmc算法通过对贝叶斯网络模型中各节点之间弧线增加、删减和换向的操作作为抽样过程的结果。同时需要提前设置好抽样的接受率,即每次根据上一轮的采样结果xt-1来获得当前抽样的候选样本x*并以设置好的接受率对候选样本x*进行接受或拒绝。

若设定用户给定的先验概率q(x*|xt-1),候选样本x*的接受率为a(x*|xt-1),则从采样结果xt-1到候选样本x*的转移概率为q(x*|xt-1)a(x*|xt-1)。若抽样结果可以趋近于某个平稳分布p,则有

p(x*)q(x*|xt-1)a(x*|xt-1)=p(xt-1)q(xt-1|x*)a(xt-1|x*)(1)

若将a(x*|xt-1)与a(xt-1|x*)同比例增大,直到两者中最大的一个为1。那么计算可得,需要提前设置的接受率为:

其中,p(x*)表示当前样本出现的概率;p(xt-1)表示上次样本出现的概率;q(xt-1|x*)表示已知x*的情况下xt-1出现的概率;a(xt-1|x*)表示已知x*的情况下xt-1的接受率。

mcmc算法通过随机抽样来选择收敛于平稳分布p下的最佳贝叶斯网络模型,可以避免陷入局部最优解的问题。

mcmc算法的伪代码描述如下所示。

表3贝叶斯网络模型mcmc算法

其中,g(t)表示第t个贝叶斯网络模型的结构。

mcmc算法在进行一定的抽样次数后,才能服从于某个平稳分布p,但抽样次数过多,会造成训练时间过长。如图4是抽样次数和样本接受与拒绝比的曲线,可以观察到当抽样次数达到250次后,比率已经趋于稳定,为了保证最后准确率的效果,最终选择mcmc算法的抽样次数为300次。

mcmc算法通过随机抽样来选择收敛于平稳分布p下的最佳贝叶斯网络模型,可以避免陷入局部最优解的问题。通过mcmc算法,可以构造出如图5所示的贝叶斯网络模型的有向无环图,其中x1~x6为属性节点(即代表6个输入特征)、c为类节点(即代表输出的用户认知结果),图中的有向线可以描述各节点之间的依赖关系。

第四步,在贝叶斯网络模型结构(有向无环图)的基础上进行参数学习,得到贝叶斯网络模型中所有节点的条件概率分布表,构建出完整的贝叶斯网络分类器。

贝叶斯估计法是认为某个事件服从一定的先验分布概率,在此基础上综合先验知识和训练集中样本发生的频率,对参数进行估计的方法。所以,当训练集中样本数不足的情况下,最大似然估计法对参数的估计会出现很大的误差,尤其是当nij=0(nij为训练集d中节点为i时,在其父集合中选取的集合为j的频数)的情况下,参数估计公式(nijk为训练集d中节点为i时,在其父集合中选取的集合为j,且该集合j中的节点取值为k时的频数)会出现错误。而贝叶斯估计法可以有效的解决这种问题。

在参数θ的先验概率未知的情况下,一般假设贝叶斯网络模型的参数θ服从dirichlet分布(也叫作狄利克雷分布),其先验分布概率为p(θ);训练集d的先验分布概率为p(d),根据贝叶斯公式,可得参数θ的后验分布概率p(θ|d)为:

其中,p(d|θ)为在已知参数θ的情况下,训练集d的后验概率。

经过推算,节点i的参数θ最大后验估计为:

其中,nijk为训练集d中节点为i时,在其父集合中选取的集合为j,且该集合j中的节点取值为k时的频数,nij为训练数据集d中节点为i时,在其父集合中选取的集合为j的频数;其中为dirichlet分布dir(αij1,αij2,...αijk)中的超系数,αij为αijk对所有参数k的求和(即),q1为父节点集合的个数,n1和r分别为节点i和第j个父节点集的总取值个数。

所有的变量节点的参数θ共同组成贝叶斯网络模型的条件概率分布表,当训练好贝叶斯网络模型的有向无环图和条件概率分布表后,贝叶斯网络分类器就已经构建完成。

第五步,对交叉验证集和测试集信号样本进行特征提取和离散化处理后,输入到第四步已训练好的贝叶斯网络分类器中,最终可得到通信信号认知结果。

当构建好贝叶斯网络分类器后,可以把分类问题转化为贝叶斯网络分类器的推理问题,即当给定属性变量节点的取值时,去选择类变量节点发生概率最大的情况当作本次分类的结果。

一般情况下,贝叶斯网络分类器的推理问题包括后验概率问题、最大后验假设问题和最大可能解释问题。在推理问题中,通常把取值已知的变量节点称为证据变量节点e,将需要推理的节点称为待查询变量节点q。贝叶斯网络的最大后验假设问题是指证据变量节点e和待查询变量节点均为某些变量节点的可能的状态组合,找出一个待查询变量节点的状态,可以使得所有证据变量节点e的发生概率为最大时的结果,即此时选择后验概率最大的类变量节点的取值作为分类的结果。其中,p(q=q2|e=e)表示已知e的情况下q发生的后验概率;m′表示后验概率最大时的假设,q2表示查询变量节点的取值,e表示证据变量节点的取值。

使用交叉验证集来验证贝叶斯网络分类器在不同训练样本和不同信噪比范围时的分类准确率的变化,如图6所示。

测试过程:

测试过程选取的测试集样本数为200个,与训练集、交叉验证集为独立同分布的关系。测试过程及结果如下所述:

第一步,对测试集内信号样本进行特征提取、离散化处理。测试集部分原始数据及预处理后的数据如图7a、7b所示。在图7a中,第1行为信号的序列号,第2行到第7行为信号的六个特征,第8行为信号的用户认知标签,其中,1代表主用户信号;2代表次用户信号;3代表非法用户信号。

第二步,输入到已训练好的贝叶斯网络分类器中,可得到信号认知结果。测试集部分分类结果及测试准确率如图8所示。测试结果中,左侧列为样本的预测用户认知结果,右侧列为样本的原本标签。可以观察到,本方法取得了较准确的用户分类识别结果,预测结果和原本标签结果一致。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1