一种面向信号识别深度学习模型训练的数据增强方法与流程

文档序号：33783619发布日期：2023-04-19 01:48阅读：75来源：国知局

本发明涉及信号识别，尤其涉及到一种面向信号识别深度学习模型训练的数据增强方法。

背景技术：

1、信号识别是对信号体制、网台类型的识别，对目标属性的判定有着重大意义，也可用于认知无线电、自适应通信等领域。传统的信号识别算法是通过对单一信号进行详细分析，人工提取高阶累积量、瞬时参数、循环平稳谱等特征，逐一形成单类别信号识别算法，研发难度大、周期长。随着通信技术的蓬勃发展，电磁环境中的信号种类迭代更新速度快、数量多、体制复杂，对信号识别算法的研发速度及识别准确度有更为严苛的要求。

2、基于神经网络的深度学习人工智能算法近年来引起了多个领域的关注，在计算机视觉、语音识别、自然语言处理等方向的应用都有远超传统算法的表现，智能信号识别已是大势所趋。鉴于计算机视觉领域的应用最为成熟，且时频数据同时反映了信号在时间和频率的二维信息，更有利于神经网络提取多维特征，目前大部分智能信号识别算法使用时频矩阵数据作为神经网络算法的输入。多项研究表明，神经网络的性能与模型大小是强相关的，而大模型需要的更多的样本数据训练优化参数，但对信号识别任务而言，复杂电磁环境应用背景下的目标信号，特别是短猝发、非协作类信号，数据样本的采集、分析、标注等环节所需时间成本、人力成本巨大，使得构建大规模样本数据集较为困难。

技术实现思路

1、本发明的主要目的在于提供一种面向信号识别深度学习模型训练的数据增强方法，旨在解决目前基于时频矩阵作为网络输入的人工智能信号识别算法的研发所存在的数据样本难以大量获取，数据标注专业性要求高、难度大，主流数据集构建及数据增强方法无法直接套用的技术问题。

2、为实现上述目的，本发明提供一种面向信号识别深度学习模型训练的数据增强方法，所述方法包括以下步骤：

3、s1：使用信号采集处理设备采集实际电磁环境下的基带信号样本数据；

4、s2：对信号进行预处理，形成单信号时域样本集，并确认样本标签信息；

5、s3：对单信号样本集进行多手段数据增强，形成扩充时域样本集；

6、s4：根据信号识别算法所需数据点数，对扩充时域样本集按信号属性进行切片或截取操作，形成定长时域样本集；

7、s5：根据信号识别算法输入时频图大小，对定长时域样本集进行短时傅里叶变换，形成可直接用于训练的数据增强后时域图像数据集。

8、可选的，所述步骤s2中，对信号进行预处理，分别在频域、时域对实际采集目标信号进行获取，具体包括：

9、对实际采集数据进行频域获取时，通过下变频、滤波、抽取，形成信号中心频率对应0hz,滤波带宽为信号带宽，抽取后信号采样率为四倍信号带宽的基带iq数据，确保数据集单样本仅包含单一频点信号；

10、对实际采集数据进行时域获取时，通过时域波形信号幅度的变化，找到信号的开始时间与结束时间，进行截取，形成多个单突发信号基带iq数据，确保数据集单样本仅包含单一频点的单突发信号。

11、可选的，所述步骤s3，具体包括：采用信号重采样技术、频域抖动、时域抖动、人工加噪、人工去噪手段中的一种或多种，对信号基带iq数据进行数据增强扩充并进行定长处理后，再通过特征域变换，采用短时傅里叶变换进行时频域的转换。

12、可选的，所述对信号基带iq数据进行数据增强时，采用基于数字上、下变频的频域抖动，表达式具体为：

13、fshift＝αbw,α∈[-0.25,0.25]

14、

15、其中，x(n)为信号原始基带iq数据，bw为信号带宽，α是频域抖动系数,为-0.25到0.25间的随机数，xfshift(n)为随机频域抖动后的信号基带iq数据,为基带iq数据长度。

16、可选的，所述对信号基带iq数据进行数据增强时，采用基于增添噪声点的时域抖动；

17、若时域抖动方向为向右，则为时域延迟，表达式具体为：

18、nshift＝βn,β∈[-0.25,0.25]

19、

20、若时域抖动方向为向左，则为时域提前，表达式具体为：

21、

22、其中，β为时域抖动系数，为-0.25到0.25间的随机数，n为基带iq数据长度。

23、可选的，所述对信号基带iq数据进行数据增强时，采用基于能量计算的人工加噪，表达式具体为：

24、

25、paddnoise＝px(n),γ∈(0,0.1]

26、xaddnoise()＝g(n)×paddnoise+x()

27、其中px(n)为原始基带数据功率，γ为添加噪声功率与原始基带数据功率的比值系数，g(n)为与原始基带数据等长的均值为0，方差为1的正态分布随机序列。

28、可选的，所述对信号基带iq数据进行数据增强时，采用基于小波变换的人工去噪，具体为：选取小波基函数为harr基及分解层数为2，对信号原始基带数据进行小波分解，计算每一层的小波系数；对每一分解层采用固定阈值估计法设置全局阈值，按照设定的阈值对每一层的小波高阶系数进行软阈值处理；根据处理后的小波系数对信号进行重构，得到去噪增强后的信号数据。

29、可选的，所述对信号基带iq数据进行数据增强时，采用基于多相滤波器实现的信号重采样，具体为：采用先插值，再滤波，最后进行抽取的分数倍变采样处理流程，设重采样后采样率与原始信号采样率的比值关系为l/m，且l＝100，m＝δl,δ∈[-0.3,0.3]，先将原始信号基带数据进行l倍上采样插值，再通过fir低通滤波器进行滤波，再进行m倍抽取下采样，得到重采样l/m倍后的增强数据；其中，低通滤波器的截止频率为增益为l。

30、可选的，所述步骤s4，具体包括：根据样本数据的采样点数与智能信号识别算法设定的输入所需的采样点数之间的关系，每一条样本数据需选择进行如下三种操作之一：1)对数据点数大于算法输入所需5倍的数据样本进行定长切分，2)对数据点数大于算法输入所需1倍且小于5倍的数据样本从起始点处进行定长截取，3)对数据点数小于算法输入所需的数据样本先进行补零填充，获得算法所需的数据点数，再添加噪声，最终将所有扩充后的所有单信号、单突发时域波形数据样本转换为定长信号时域波形数据样本集。

31、可选的，所述方法还包括步骤s5：对处理后的定长信号时域波形数据样本集进行特征域变换；具体包括：采用短时傅里叶变换操作，对数据进行有重叠率的、从前往后的滑动窗操作，选择合适的窗函数限制窗内信号的时频域范围，计算每一时刻滑动窗内的信号功率谱；其中，fft点数为1024，窗函数选取长度为256点的汉宁窗，重叠率设为0.5；根据滑动窗到达的先后次序，将计算得到的功率谱结果沿时间域进行拼接，形成二维时频矩阵即时频矩阵数据，拼接帧数为256帧，将信号时域波形数据转换为智能信号识别算法训练所需的时频矩阵数据，大小为256×256。

32、本发明具有的有益技术效果：

33、(1)降低了训练数据集采集信号样本的工作量。本发明针对面向深度学习人工智能信号识别算法的训练所用数据集提出了数据增强的扩充数据集方法；根据已有数据样本，可直接通过计算生成大量样本，扩大数据集的规模，降低了信号采集处理的时间、人力成本，并且，对于有监督神经网络算法，数据增强仅仅增加了数据样本量而不改变标签，减少了人工分析、标注的工作量；通过重采样数据增强手段，可以直接得到不同采样率下的信号数据，无需改变信号采集处理设备采样率参数设置，对同一信号进行多次不同采样率下的采集与分析处理，并且使用了基于多相滤波器结构的重采样计算方法，加快了处理变换速度；通过频域抖动数据增强手段，对已有数据进行微小的频率搬移，调整频偏，替代不同采集中心频率下的同一信号的信号采集处理工作；通过时域抖动数据增强方法，可快速获取信号样本的不同时间片段，避免对同一信号进行不同时隙的采集工作；通过人工加噪及人工去躁数据增强手段，可一定程度上模拟不同环境噪声等级下的信号样本数据，减少对同一信号不同信噪比情况下的信号采集处理工作。

34、(2)优化了主流数据增强方法，提升了数据增强样本质量，同时可用于多种信号识别算法输入形式。本发明针对信号识别算法所用信号数据，改进了现有图像数据增强方法，提出了基于电磁信号处理的专用数据增强手段，通过对原始时域波形进行处理，再进行特征域变换，采用短时傅里叶变换计算，使增强后的信号时频数据不仅有类似图像数据的增强效果，并且更贴近信号本身特性，更利于神经网络模型提取多维特征；针对现有面向图像数据的缩放增强技术，通过对原始数据采样率进行改变，变换信号带宽与采样率之间的关系，使信号时频数据中信号部分占据的大小发生改变，达到图像缩放的效果；针对现有面向图像数据的平移增强技术，通过对原始数据加入微小频偏，达到信号目标在时频矩阵沿频率轴进行平移的效果，通过对原始数据进行时域搬移，达到信号目标在时频矩阵沿时间轴进行平移的效果；针对现有面向图像数据的加噪增强技术，通过对时域信号进行人工加噪或去噪技术，改变信号数据的信噪比，再经过时频转化达到时频矩阵的加噪或去噪的效果。不同于直接对信号时频矩阵进行图像数据增强操作，通过对原始时域信号进行处理再转换为时频矩阵数据保证了信号数据的本质特性未发生改变，降低了数据增强对样本标签的影响，提高了信号样本集的质量；并且，提出的信号数据增强方法是通过对信号原始时域数据进行增强扩充操作，当信号识别算法以基带时域数据或其它变换域数据作为输入时，该数据增强方法同样适用，有一定的通用性。

35、(3)提高了智能信号识别算法的性能。本发明针对智能信号识别算法，提出了专用数据增强优化方式，通过提前对原有数据集进行增强扩充的离线实现方式或在训练过程中随机选择增强手段的在线实现方式，使网络结构参数能更充分地利用已有信号数据集，最大化数据集对网络训练的增益。通过专用的信号数据增强方式，增强后的数据集中将包含与已有原始数据集不同的数据样本，且本发明基于信号处理提出的信号数据增强手段一定程度上模拟了采集信号样本可能出现的情况，使增强数据更为真实。在进行网络模型的训练来优化网络参数时，数据样本的数量大大增加，降低了同等规模网络过拟合的倾向；数据样本的多样性，如：不同采样率、不同频偏、不同信噪比，提高了网络的鲁棒性、泛化性。在无法快速采集更多真实信号样本的情况下，本发明对已有网络算法的性能提升有较好效果。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：欧阳玫丹张宇阳解韦桐冯佳刘昊李贵
技术所有人：中国电子科技集团公司第十研究所
我是此专利的发明人

上一篇：一种绝对式编码器、制作方法及使用方法
上一篇：换热元件及换热器的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。