一种数据处理方法及装置与流程

文档序号：37647238发布日期：2024-04-18 20:21阅读：18来源：国知局

本发明涉及大数据领域，尤其涉及一种数据处理方法及装置。

背景技术：

1、神经网络模型在训练参数时，需要有大量的样本数据支撑。在样本数据不足的情况下，可以使用数据增广的方法对既有的小样本数据进行扩充。数据增广(dataaugmentation)是一种增加数据的数量以及数据的多样性的策略，用于对数据进行变换处理从而生成新数据，以此扩大样本数据。

2、现有的样本数据的数据增广策略大多针对图像类样本数据，通过平移、旋转、变形、缩放等图像变换操作增加样本数据。而对于信号类样本数据，例如周期性的振荡信号、离散的数字信号等，主要通过加噪的方式进行样本数据扩充。目前，对样本数据的加噪通常仅根据信噪比对样本数据进行加噪，这种方法容易使加噪后的样本数据失真，无法满足给样本数据进行扩充的需求。

技术实现思路

1、本发明实施例提供一种数据处理方法及装置，通过先将时域上的离散信号经傅里叶变换变换至频域上，得到m个频率，再按照预设条件对m个频率中的m个频率加噪，从而实现给离散信号中除主频率之外的频率加噪，解决现有技术中加噪后的样本数据易失真的问题。

2、第一方面，本发明实施例提供一种数据处理方法，所述方法包括：获取第一离散信号，所述第一离散信号为时域上的离散信号；对所述第一离散信号进行傅里叶变换，得到第二离散信号，所述第二离散信号包括m个频率，所述频率为复数，所述m为大于1的整数；根据所述m个频率，获得m个频率的幅值；根据所述m个频率的幅值，按照预设条件，对所述m个频率中的m个频率加噪，获得第三离散信号，所述m为小于m的正整数；对所述第三离散信号进行傅里叶逆变换，获得第四离散信号，所述第四离散信号为时域上的离散信号。

3、在上述方案中，先将时域上的离散信号经傅里叶变换变换至频域上，得到m个频率，再按照预设条件对m个频率中的m个频率加噪，从而实现给离散信号中除主频率之外的频率加噪，由于主频率没有被加噪，从而解决加噪后的离散信号易失真的问题。

4、可选地，根据所述m个频率，获得m个频率的幅值，包括：确定所述m个频率中的每个频率的模值，将所述m个模值确定为所述m个频率的幅值。

5、基于上述方案，通过确定在频域中的离散信号的m个频率中的每个频率的模值，确定m个频率中的每个频率的幅值。通过获得幅值可以确定该离散信号的主频率。在本方案中，通过避免给主频率加噪，从而避免加噪后的离散信号易失真。

6、可选地，根据所述m个频率的幅值，按照预设条件，对所述m个频率中的m个频率加噪，包括：根据所述m个频率的幅值，对所述第二离散信号包括的m个频率按升序或降序排序；对所述m个频率中的幅值按从小到大顺序的前m个频率加噪。

7、通过采用上述方案，对第二离散信号包括的m个频率按升序或降序排序，便于确定该离散信号的主频率。接着，对m个频率中的幅值按从小到大顺序的前m个频率加噪从而避免给主频率加噪。

8、可选地，对所述m个频率中的幅值按从小到大顺序的前m个频率加噪，包括：对所述幅值按从小到大顺序的前m个频率加相同功率的噪声；或者，对所述幅值按从小到大顺序的前m个频率加不同功率的噪声。

9、上述方案中，可以给幅值按从小到大顺序的前m个频率加相同功率的噪声，也可以给幅值按从小到大顺序的前m个频率加不同功率的噪声，该方案提供了给离散信号加噪声的多种方法，有利于生成更多的新数据，从而扩大样本数据并满足给样本数据进行扩充的需求。

10、可选地，所述m个频率与m个序号一一对应；所述对所述第三离散信号进行傅里叶逆变换，获得第四离散信号之前，包括：将所述第三离散信号中的m个频率按序号顺序排序。

11、上述方案中，将所述第三离散信号中的m个频率按序号顺序排序，使得加噪后的信号按序号顺序排序。

12、可选地，所述第一离散信号包括离散信号序列、或者离散信号矩阵。

13、上述方案中，第一离散信号可以是离散信号序列，也可以是离散信号矩阵。本发明实施例可以对离散信号序列进行加噪，也可以对离散信号矩阵进行加噪，也即可用于处理用矩阵表示的数字图像。

14、可选地，所述m个频率为所述m个频率中除主频率之外的频率。

15、第二方面，本发明实施例提供了一种数据处理装置，该数据处理装置包括：获取单元，用于获取第一离散信号，所述第一离散信号为时域上的离散信号；处理单元，用于对所述第一离散信号进行傅里叶变换，得到第二离散信号，所述第二离散信号包括m个频率，所述频率为复数，所述m为大于1的整数；根据所述m个频率，获得m个频率的幅值；根据所述m个频率的幅值，按照预设条件，对所述m个频率中的m个频率加噪，获得第三离散信号，所述m为小于m的正整数；对所述第三离散信号进行傅里叶逆变换，获得第四离散信号，所述第四离散信号为时域上的离散信号。

16、可选地，所述处理单元，具体用于确定所述m个频率中的每个频率的模值，将所述m个模值确定为所述m个频率的幅值。

17、可选地，所述处理单元，具体用于根据所述m个频率的幅值，对所述第二离散信号包括的m个频率按升序或降序排序；对所述m个频率中的幅值按从小到大顺序的前m个频率加噪。

18、可选地，所述处理单元，具体用于对所述幅值按从小到大顺序的前m个频率加相同功率的噪声；或者，对所述幅值按从小到大顺序的前m个频率加不同功率的噪声。

19、可选地，所述m个频率与m个序号一一对应；所述处理单元，具体用于将所述第三离散信号中的m个频率按序号顺序排序。

20、可选地，所述第一离散信号包括离散信号序列、或者离散信号矩阵。

21、可选地，所述m个频率为所述m个频率中除主频率之外的频率。

22、第三方面，本发明实施例提供了一种计算设备，包括至少一个处理器以及至少一个存储器，其中，所述存储器存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行上述第一方面任一所述的数据处理方法。

23、第四方面，本发明实施例还提供了一种计算机可读存储介质，所述存储介质存储有程序，当所述程序在计算机上运行时，使得计算机实现执行上述第一方面任意所述的数据处理方法。

技术特征：

1.一种数据处理方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述根据所述m个频率，获得m个频率的幅值，包括：

3.如权利要求1所述的方法，其特征在于，所述根据所述m个频率的幅值，按照预设条件，对所述m个频率中的m个频率加噪，包括：

4.如权利要求3所述的方法，其特征在于，所述对所述m个频率中的幅值按从小到大顺序的前m个频率加噪，包括：

5.如权利要求4所述的方法，其特征在于，所述m个频率与m个序号一一对应；

6.如权利要求1所述的方法，其特征在于，所述第一离散信号包括离散信号序列、或者离散信号矩阵。

7.如权利要求1所述的方法，其特征在于，所述m个频率为所述m个频率中除主频率之外的频率。

8.一种数据处理装置，其特征在于，包括：

9.一种计算设备，其特征在于，包括至少一个处理器以及至少一个存储器，其中，所述存储器存储有计算机程序，当所述程序被所述处理器执行时，使得所述处理器执行权利要求1至7任一权利要求所述的方法。

10.一种计算机可读存储介质，其特征在于，所述存储介质存储有程序，当所述程序在计算机上运行时，使得计算机实现执行权利要求1至7任一项所述的方法。

技术总结
本发明实施例公开一种数据处理方法及装置，可以应用于大数据领域，用于解决现有技术中加噪后的样本数据易失真的问题。方法包括：获取第一离散信号；对第一离散信号进行傅里叶变换，得到第二离散信号，第二离散信号包括M个频率；根据M个频率，获得M个频率的幅值；根据M个频率的幅值，按照预设条件，对M个频率中的m个频率加噪，获得第三离散信号；对第三离散信号进行傅里叶逆变换，获得第四离散信号，第四离散信号为时域上的离散信号。该方法先将时域上的离散信号经傅里叶变换变换至频域上，得到M个频率，再按照预设条件对M个频率中的m个频率加噪，从而实现给离散信号中除主频率之外的频率加噪，以此解决加噪后的样本数据易失真的问题。

技术研发人员：林志鹏,徐强强,王昕,许丽星,李洁,于仲海,刘利明
受保护的技术使用者：海信集团控股股份有限公司
技术研发日：
技术公布日：2024/4/17

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林志鹏,徐强强,王昕,许丽星,李洁,于仲海,刘利明
技术所有人：海信集团控股股份有限公司
我是此专利的发明人

上一篇：一种虚拟屏下摄像头构成机构及其工作方法与流程
上一篇：一种用于人工智能机器人的储存装置

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。