一种数据处理方法及装置与流程

文档序号:37647238发布日期:2024-04-18 20:21阅读:18来源:国知局
一种数据处理方法及装置与流程

本发明涉及大数据领域,尤其涉及一种数据处理方法及装置。


背景技术:

1、神经网络模型在训练参数时,需要有大量的样本数据支撑。在样本数据不足的情况下,可以使用数据增广的方法对既有的小样本数据进行扩充。数据增广(dataaugmentation)是一种增加数据的数量以及数据的多样性的策略,用于对数据进行变换处理从而生成新数据,以此扩大样本数据。

2、现有的样本数据的数据增广策略大多针对图像类样本数据,通过平移、旋转、变形、缩放等图像变换操作增加样本数据。而对于信号类样本数据,例如周期性的振荡信号、离散的数字信号等,主要通过加噪的方式进行样本数据扩充。目前,对样本数据的加噪通常仅根据信噪比对样本数据进行加噪,这种方法容易使加噪后的样本数据失真,无法满足给样本数据进行扩充的需求。


技术实现思路

1、本发明实施例提供一种数据处理方法及装置,通过先将时域上的离散信号经傅里叶变换变换至频域上,得到m个频率,再按照预设条件对m个频率中的m个频率加噪,从而实现给离散信号中除主频率之外的频率加噪,解决现有技术中加噪后的样本数据易失真的问题。

2、第一方面,本发明实施例提供一种数据处理方法,所述方法包括:获取第一离散信号,所述第一离散信号为时域上的离散信号;对所述第一离散信号进行傅里叶变换,得到第二离散信号,所述第二离散信号包括m个频率,所述频率为复数,所述m为大于1的整数;根据所述m个频率,获得m个频率的幅值;根据所述m个频率的幅值,按照预设条件,对所述m个频率中的m个频率加噪,获得第三离散信号,所述m为小于m的正整数;对所述第三离散信号进行傅里叶逆变换,获得第四离散信号,所述第四离散信号为时域上的离散信号。

3、在上述方案中,先将时域上的离散信号经傅里叶变换变换至频域上,得到m个频率,再按照预设条件对m个频率中的m个频率加噪,从而实现给离散信号中除主频率之外的频率加噪,由于主频率没有被加噪,从而解决加噪后的离散信号易失真的问题。

4、可选地,根据所述m个频率,获得m个频率的幅值,包括:确定所述m个频率中的每个频率的模值,将所述m个模值确定为所述m个频率的幅值。

5、基于上述方案,通过确定在频域中的离散信号的m个频率中的每个频率的模值,确定m个频率中的每个频率的幅值。通过获得幅值可以确定该离散信号的主频率。在本方案中,通过避免给主频率加噪,从而避免加噪后的离散信号易失真。

6、可选地,根据所述m个频率的幅值,按照预设条件,对所述m个频率中的m个频率加噪,包括:根据所述m个频率的幅值,对所述第二离散信号包括的m个频率按升序或降序排序;对所述m个频率中的幅值按从小到大顺序的前m个频率加噪。

7、通过采用上述方案,对第二离散信号包括的m个频率按升序或降序排序,便于确定该离散信号的主频率。接着,对m个频率中的幅值按从小到大顺序的前m个频率加噪从而避免给主频率加噪。

8、可选地,对所述m个频率中的幅值按从小到大顺序的前m个频率加噪,包括:对所述幅值按从小到大顺序的前m个频率加相同功率的噪声;或者,对所述幅值按从小到大顺序的前m个频率加不同功率的噪声。

9、上述方案中,可以给幅值按从小到大顺序的前m个频率加相同功率的噪声,也可以给幅值按从小到大顺序的前m个频率加不同功率的噪声,该方案提供了给离散信号加噪声的多种方法,有利于生成更多的新数据,从而扩大样本数据并满足给样本数据进行扩充的需求。

10、可选地,所述m个频率与m个序号一一对应;所述对所述第三离散信号进行傅里叶逆变换,获得第四离散信号之前,包括:将所述第三离散信号中的m个频率按序号顺序排序。

11、上述方案中,将所述第三离散信号中的m个频率按序号顺序排序,使得加噪后的信号按序号顺序排序。

12、可选地,所述第一离散信号包括离散信号序列、或者离散信号矩阵。

13、上述方案中,第一离散信号可以是离散信号序列,也可以是离散信号矩阵。本发明实施例可以对离散信号序列进行加噪,也可以对离散信号矩阵进行加噪,也即可用于处理用矩阵表示的数字图像。

14、可选地,所述m个频率为所述m个频率中除主频率之外的频率。

15、第二方面,本发明实施例提供了一种数据处理装置,该数据处理装置包括:获取单元,用于获取第一离散信号,所述第一离散信号为时域上的离散信号;处理单元,用于对所述第一离散信号进行傅里叶变换,得到第二离散信号,所述第二离散信号包括m个频率,所述频率为复数,所述m为大于1的整数;根据所述m个频率,获得m个频率的幅值;根据所述m个频率的幅值,按照预设条件,对所述m个频率中的m个频率加噪,获得第三离散信号,所述m为小于m的正整数;对所述第三离散信号进行傅里叶逆变换,获得第四离散信号,所述第四离散信号为时域上的离散信号。

16、可选地,所述处理单元,具体用于确定所述m个频率中的每个频率的模值,将所述m个模值确定为所述m个频率的幅值。

17、可选地,所述处理单元,具体用于根据所述m个频率的幅值,对所述第二离散信号包括的m个频率按升序或降序排序;对所述m个频率中的幅值按从小到大顺序的前m个频率加噪。

18、可选地,所述处理单元,具体用于对所述幅值按从小到大顺序的前m个频率加相同功率的噪声;或者,对所述幅值按从小到大顺序的前m个频率加不同功率的噪声。

19、可选地,所述m个频率与m个序号一一对应;所述处理单元,具体用于将所述第三离散信号中的m个频率按序号顺序排序。

20、可选地,所述第一离散信号包括离散信号序列、或者离散信号矩阵。

21、可选地,所述m个频率为所述m个频率中除主频率之外的频率。

22、第三方面,本发明实施例提供了一种计算设备,包括至少一个处理器以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述第一方面任一所述的数据处理方法。

23、第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有程序,当所述程序在计算机上运行时,使得计算机实现执行上述第一方面任意所述的数据处理方法。



技术特征:

1.一种数据处理方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述根据所述m个频率,获得m个频率的幅值,包括:

3.如权利要求1所述的方法,其特征在于,所述根据所述m个频率的幅值,按照预设条件,对所述m个频率中的m个频率加噪,包括:

4.如权利要求3所述的方法,其特征在于,所述对所述m个频率中的幅值按从小到大顺序的前m个频率加噪,包括:

5.如权利要求4所述的方法,其特征在于,所述m个频率与m个序号一一对应;

6.如权利要求1所述的方法,其特征在于,所述第一离散信号包括离散信号序列、或者离散信号矩阵。

7.如权利要求1所述的方法,其特征在于,所述m个频率为所述m个频率中除主频率之外的频率。

8.一种数据处理装置,其特征在于,包括:

9.一种计算设备,其特征在于,包括至少一个处理器以及至少一个存储器,其中,所述存储器存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行权利要求1至7任一权利要求所述的方法。

10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,当所述程序在计算机上运行时,使得计算机实现执行权利要求1至7任一项所述的方法。


技术总结
本发明实施例公开一种数据处理方法及装置,可以应用于大数据领域,用于解决现有技术中加噪后的样本数据易失真的问题。方法包括:获取第一离散信号;对第一离散信号进行傅里叶变换,得到第二离散信号,第二离散信号包括M个频率;根据M个频率,获得M个频率的幅值;根据M个频率的幅值,按照预设条件,对M个频率中的m个频率加噪,获得第三离散信号;对第三离散信号进行傅里叶逆变换,获得第四离散信号,第四离散信号为时域上的离散信号。该方法先将时域上的离散信号经傅里叶变换变换至频域上,得到M个频率,再按照预设条件对M个频率中的m个频率加噪,从而实现给离散信号中除主频率之外的频率加噪,以此解决加噪后的样本数据易失真的问题。

技术研发人员:林志鹏,徐强强,王昕,许丽星,李洁,于仲海,刘利明
受保护的技术使用者:海信集团控股股份有限公司
技术研发日:
技术公布日:2024/4/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1