一种基于支持数据的通信信号数据集修剪方法及装置

文档序号:36415974发布日期:2023-12-19 17:46阅读:71来源:国知局
一种基于支持数据的通信信号数据集修剪方法及装置

本发明涉及通信对抗领域,特别涉及一种基于支持数据的通信信号数据集修剪方法及装置。


背景技术:

1、随着卫星、通信和物联网技术的迅猛发展,电磁环境中的无线信号数量和种类急剧增加,严重威胁电磁环境的安全。因此,准确识别各种无线信号非常重要。近年来,基于深度学习的信号识别技术备受关注,已经成为维护电磁环境安全的重要手段。但是,基于深度学习的信号分类器通常需要在海量信号样本上训练才能达到先进水平,而海量信号样本组成的大型数据集需要占用大量内存和计算资源。大型数据集中往往存在冗余样本。若能对信号数据集进行修剪,只保留其中有价值的样本进行分类器训练,将有效降低训练成本。然而,哪些样本有价值、如何实现数据集修剪是亟待研究的问题。

2、已有研究指出,位于信号分类器决策边界附近的训练样例对于模型的训练至关重要。然而,神经网络的决策边界是隐式表示的,因此,找到靠近决策边界的样例是一项困难的任务。已有方法通过计算训练样例的几何属性或样例到决策边界的距离等方式来筛选边界样例,然而这些方法大多需要使用一个训练良好的分类器才能实现,具有一定局限性。


技术实现思路

1、本发明的目的在于克服现有技术中所存在的大型信号数据集数据冗余的问题,提供一种基于支持数据的通信信号数据集修剪方法,通过在训练早期就能找到对信号分类器训练重要的代表性子集,在保证模型识别精度的同时,缩减了信号训练集的规模,降低了对信号分类器内存和计算的要求。

2、为了实现所述发明目的,本发明提供了以下技术方案:

3、一种基于支持数据的通信信号数据集修剪方法,所述方法用于通信信号,包括以下步骤:

4、s1:获取通信信号,基于深度神经网络的信号分类器实现通信信号潜在特征的提取与分类;

5、s2:根据一对多规则建立边界样例选择器,用所述信号分类器的输出向量集训练所述边界样例选择器,给出信号分类器决策边界的显式表示,进而筛选出位于所述决策边界附近的支持数据;

6、s3:根据信号分类器训练早期每个训练样本被标注为所述支持数据的频率为衡量指标,评估训练样例对模型训练的重要性,其中,训练样例的重要性与其被标注为支持数据的次数呈正相关;

7、s4:将所述训练样例按照重要性降序排列,筛选出通信信号数据集的代表子集,将所述代表子集用于信号分类器的后续训练。

8、相比已有方法通过计算训练样例的几何属性或样例到决策边界的距离等方式来实现对大型数据集的修剪,本方案对信号分类器的要求不高,局限性更小,筛选通信信号的效率和可实施性均有提高。

9、其中,骤s1包括以下步骤:

10、s11:通过信号接收设备获取通信信号,构建基于深度神经网络的信号分类器,其中,信号分类器的最后一层以softmax为激活函数,将所述信号分类器的输出向量转化为离散的概率分布;

11、s12:在k类信号数据集上采用交叉熵损失进行信号分类器的优化,同时采用梯度下降法更新模型参数并得到输出向量集;

12、步骤s1是对原始信号样本进行初处理,将信号样本集映射为潜在输出向量集。这一转换提供的信息将有助于后续支持数据的寻找和标注。

13、进一步的,步骤s2具体包括以下步骤:

14、s21:构造边界样例选择器,所述选择器由k个支持向量机模型按一对多规则集成,用所述信号分类器的输出向量集训练所述边界样例选择器;

15、s22:通过所述边界样例选择器的超平面方程,给出信号分类器决策边界近似的显示表达式;

16、s23:利用边界样例选择器标注的支持向量坐标快速找到潜在特征空间中位于决策边界附近的输出向量,这些输出向量对应的原始信号样例即为边界样例。

17、可选的,步骤s3包括以下步骤:

18、s31:记录信号分类器前20次预训练过程中的每个通信信号样本被标注为支持数据的次数,并将其用于表征训练样本对模型训练的重要程度;

19、s32:根据被标注次数降序排列训练集样本;

20、s33:选择前m个原始信号样本组成代表性子集,加速模型的后续训练,m的取值为训练样本总数与训练样本保留比例的乘积。

21、本发明从降低大型信号数据集中的训练集规模的角度出发,首先设计了一个边界样例选择器来直接标注出决策边界的样例;其次根据训练早期每个训练样例出现于决策边界的频率,对训练样例进行降序排列,并选择出代表性子集,实现在模型训练早期找到对模型重要的数据子集的目的。

22、基于相同的发明构思,还提出了一种基于支持数据的通信信号数据集修剪装置,包括计算机系统和至少一个信号获取装置,信号获取装置与计算机处理系统电连接;计算机处理系统能够执行上述任一项的一种基于支持数据的通信信号数据集修剪方法,计算机处理系统设有指令,信号获取装置执行指令。

23、通过每个训练样例在模型训练早期被标注为支持数据的次数,来评估其对模型训练的重要程度,进而筛选出最具代表性的数据子集。本发明所提供的方法能够在降低信号分类器训练成本的同时,减少对信号分类器识别精度的影响,适用于内存和计算资源有限的信号识别任务。

24、与现有技术相比,本发明的有益效果:

25、1.针对深度神经网络决策边界隐式的本质导致的边界样例寻找困难的问题,本发明无需通过计算间接参数来反映样例与决策边界的关系进而寻找边界样例,更直接且精准。本发明设计了一个基于支持向量机的边界样例选择器,近似给出决策边界的显式表示,进而快速找到并标注出位于决策边界附近的支持数据。

26、2.本发明提出了一种基于支持数据的训练样例重要性评估方法,利用信号分类器训练早期的信息,评估样例对分类器训练的重要性。与大多数现有方法相比,该方法在模型训练早期就找到对模型训练重要的训练样例,无需模型收敛,具有重要的实用价值,且简单容易实施。

27、3.本发明利用每个训练样本被标注的次数信息筛选出数据子集,能有效降低分类器的训练成本的同时尽可能小的影响分类器的识别精度,加快训练速度。

28、4.通过对实验数据集rml2016.04c的仿真实验,本发明所提供的方法的性能明显优于其它数据集修剪方法,在保留训练样本比例比较小的时候,最接近最佳的识别精度。

29、5.通过对实验数据集rml2016.04c的仿真实验,本发明所提供的方法的性能明显优于其它数据集修剪方法,在保留训练样本比例小于等于0.3时,最接近最佳的识别精度。



技术特征:

1.一种基于支持数据的通信信号数据集修剪方法,其特征在于,所述方法用于识别通信信号,包括以下步骤:

2.根据权利要求1所述的一种基于支持数据的通信信号数据集修剪方法,其特征在于,步骤s1包括以下步骤:

3.根据权利要求1所述的一种基于支持数据的通信信号数据集修剪方法,其特征在于,步骤s2具体包括以下步骤:

4.根据权利要求1所述的一种基于支持数据的通信信号数据集修剪方法,其特征在于,步骤s3包括记录信号分类器前20次预训练过程中的每个信号样本被标注为支持数据的次数,并将其用于评估训练样本对模型训练重要程度。

5.一种基于支持数据的通信信号数据集修剪装置,其特征在于,包括计算机系统和至少一个信号获取装置,所述信号获取装置与所述计算机处理系统电连接;所述计算机处理系统能够执行权利要求1至4中任一项所述的一种基于支持数据的通信信号数据集修剪方法,所述计算机处理系统设有指令,所述信号获取装置执行所述指令。


技术总结
本发明涉及通信对抗领域,特别是一种基于支持数据的通信信号数据集修剪方法及装置。本发明在基于深度神经网络的信号分类器的基础上构建了一个基于支持向量机的边界样例选择器,近似给出信号分类器决策边界的显式表示,解决了由于信号分类器决策边界的隐式本质导致的边界样例寻找困难的问题,实现了对边界样例的快速锁定。同时,本发明提出了一种基于支持数据的训练样例重要性评估方法,在信号分类器训练早期就能准确筛选出最具代表性的数据子集,能够显著降低信号分类器的训练成本,同时尽可能减小对信号分类器识别精度的影响。本发明适用于内存和计算资源有限的信号识别任务。

技术研发人员:杨颖,朱立东,郭晟
受保护的技术使用者:电子科技大学
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1