本技术涉及生物电信号识别。具体地,本技术涉及一种生物电信号数据增强方法、装置和计算机设备。
背景技术:
1、生物电信号识别技术涉及分析和辨识人体产生的各种电信号,例如心电图(ecg)、脑电图(eeg)和肌电图(emg)。这些信号可以应用于诊断、疾病监测和运动控制等领域,具备广泛的应用潜力。
2、传统的生物电信号识别方法依赖于机器学习技术来构建生物电信号识别模型,以通过该模型对生物电信号进行分类和辨识。不过,生物电信号识别模型通常需要大量的样本数据进行训练。然而,由于采集生物电信号通常需要专门设备和专业知识,可用的样本数据集相对有限。此外,生物电信号容易受到运动干扰和设备噪声等影响,导致生物电信号识别模型的识别准确性较低。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种生物电信号数据增强方法、装置、计算机设备和存储介质。
2、第一方面,本技术提供了一种生物电信号数据增强方法。所述方法包括:
3、步骤s102,获取由原始数据构成的数据集;其中,所述原始数据为多通道生物电信号,所述多通道生物电信号包含多个通道的生物电信号时间序列;
4、步骤s104,基于多种信号多样性提高策略,分别对所述数据集中的原始数据进行增强,得到不同的信号多样性提高策略对应的第一增强数据;其中,所述信号多样性提高策略用于提高生物电信号的多样性;
5、步骤s106,基于多种噪声鲁棒性提升策略,分别对所述数据集中的原始数据进行增强,得到不同的噪声鲁棒性提升策略对应的第二增强数据;其中,所述噪声鲁棒性提高策略用于提升网络模型对噪声的鲁棒性;
6、步骤s108,基于多种过拟合降低策略,分别对所述数据集中的原始数据进行增强,得到不同的过拟合降低策略对应的第三增强数据;其中,所述过拟合降低策略用于降低过拟合现象;
7、步骤s110,基于多种网络训练加速策略,分别对所述数据集中的原始数据进行增强,得到不同的网络训练加速策略对应的第四增强数据;其中,所述网络训练加速策略用于加快网络模型的训练速度。
8、在其中一个实施例中,所述步骤s104包括:
9、步骤s1041,通过白化的方式,对所述原始数据进行归一化,得到归一化后的数据;
10、步骤s1042,在所述原始数据中,对每一通道内的生物电信号时间序列进行插值,得到插值后的数据;
11、步骤s1043,在所述原始数据中,逐一对每个通道内的生物电信号时间序列进行滤波,并将相邻通道内滤波后的数据进行混叠,得到通道混叠后的数据;
12、步骤s1044,在所述原始数据中,逐一对每个通道内的生物电信号时间序列进行缩放,得到缩放后的数据;
13、步骤s1045,分割所述原始数据,并对分割后的数据进行重新组合,得到重组后的数据;
14、步骤s1046,将所述归一化后的数据、所述插值后的数据、所述通道混叠后的数据、所述缩放后的数据和所述重组后的数据,确定为第一增强数据。
15、在其中一个实施例中,步骤s1041通过如下公式实现:
16、
17、其中,xnorm表示归一化后的数据,x表示原始数据,μ表示原始数据的均值,σ表示原始数据的标准差;
18、步骤s1042通过如下公式实现:
19、
20、其中,xinterp表示插值后的数据,t表示插值后的数据的时间戳,x1、x2表示相邻的原始数据,t1表示x1的时间戳,t2表示x2的时间戳;
21、步骤s1043通过如下公式实现:
22、
23、sum(w)=1
24、其中,c表示总通道数,i表示通道索引,x表示所有通道的生物电信号时间序列,w表示混叠矩阵;
25、步骤s1044通过如下公式实现:
26、xscal(t)=α·xi(t)
27、其中,xscal(t)表示缩放后的数据,α表示缩放因子,x(t)表示原始数据,i表示通道索引。
28、在其中一个实施例中,所述步骤s106包括:
29、步骤s1061,对所述原始数据添加噪声,得到噪声添加后的数据;
30、步骤s1062,对所述原始数据进行短时傅里叶变换,得到频谱图;
31、步骤s1063,获取所述频谱图中的最大幅值,并根据所述最大幅值和预设的波动因子,对所述频谱图进行波动,得到频率波动后的数据;
32、步骤s1064,在所述频谱图中,将高于全局频率均值且频率梯度为零的频率,替换为所述全局频率均值,得到尖峰去噪后的数据;
33、步骤s1065,将所述噪声添加后的数据、所述频率波动后的数据和所述尖峰去噪后的数据,确定为第二增强数据。
34、在其中一个实施例中,步骤s1061通过如下公式实现:
35、xjitter(t)=x(t)+0.1*∈(t)
36、
37、其中,xjitter(t)表示噪声添加后的数据,x(t)表示原始数据,∈(t)表示高斯噪声,μ表示期望,σ表示标准差;
38、步骤s1063通过如下公式实现:
39、xperturb(t,f)=xstft(t,f)+α·max(xstft)·∈(t)
40、
41、其中,xperturb(t,f)表示频率波动后的数据,xstft(t,f)表示频谱图,α表示波动因子;
42、步骤s1064通过如下公式实现:
43、
44、其中,xdenoised(t,f)表示尖峰去噪后的数据,xstft(t,f)表示频谱图,mean(xstft)表示全局频率均值,表示频率梯度。
45、在其中一个实施例中,所述步骤s108包括:
46、步骤s1081,通过时序遮盖的方式,抹除所述原始数据中的部分时间段数据,得到时序遮盖后的数据;
47、步骤s1082,在所述原始数据中,将多个通道的生物电信号时间序列进行随机排序,得到通道混洗后的数据;
48、步骤s1083,对所述原始数据进行短时傅里叶变换,得到频谱图;
49、步骤s1084,通过时域遮盖的方式,抹除所述频谱图中的部分时间段数据,得到时域遮盖后的数据;
50、步骤s1085,通过频域遮盖的方式,抹除所述频谱图中的部分频率数据,得到频域遮盖后的数据;
51、步骤s1086,滚动所述频谱图中的时间轴,得到时域替代后的数据;
52、步骤s1087,将所述时序遮盖后的数据、所述通道混洗后的数据、所述时域遮盖后的数据、所述频域遮盖后的数据和所述时域替代后的数据,确定为第三增强数据。
53、在其中一个实施例中,步骤s1081通过如下公式实现:
54、
55、其中,xmasked(t)表示时序遮盖后的数据,x(t)表示原始数据,tstart表示时序遮盖的起始时间,tend表示时序遮盖的结束时间;
56、步骤s1082通过如下公式实现:
57、xshuffled(t)=shuffle([x1(t),x2(t),…,xn(t)])
58、其中,xshuffled(t)表示通道混洗后的数据,xi(t)表示第i个通道的生物电信号时间序列,n表示总通道数;
59、步骤s1084通过如下公式实现:
60、
61、其中,xmasked(t,f)表示时域遮盖后的数据,xstft(t,f)表示频谱图,tstart表示时域遮盖的起始时间,tend表示时域遮盖的结束时间;
62、步骤s1085通过如下公式实现:
63、
64、其中,xmasked(t,f)表示频域遮盖后的数据,xstft(t,f)表示频谱图,fstart表示频域遮盖的起始时间,fend表示频域遮盖的结束时间;
65、步骤s1086通过如下公式实现:
66、xsubstitute(t,f)=xstft(t+δt,f)
67、其中,xsubstitute(t,f)表示时域替代后的数据,δt表示时间偏移量。
68、在其中一个实施例中,所述步骤s110包括:
69、步骤s1101,在所述数据集中,将所述原始数据按照时长进行升序排列,得到升序排列后的数据;
70、步骤s1102,对所述数据集中原始数据进行归一化,并对所述数据集中归一化后的数据进行均值偏移,得到全局均值偏移的数据;
71、步骤s1103,将所述升序排列后的数据和所述全局均值偏移的数据,确定为第四增强数据。
72、第二方面,本技术提供了一种生物电信号数据增强装置。所述装置包括:
73、数据获取模块,用于获取由原始数据构成的数据集;其中,所述原始数据为多通道生物电信号,所述多通道生物电信号包含多个通道的生物电信号时间序列;
74、多样性提高模块,用于基于多种信号多样性提高策略,分别对所述数据集中的原始数据进行增强,得到不同的信号多样性提高策略对应的第一增强数据;其中,所述信号多样性提高策略用于提高生物电信号的多样性;
75、鲁棒性提升模块,用于基于多种噪声鲁棒性提升策略,分别对所述数据集中的原始数据进行增强,得到不同的噪声鲁棒性提升策略对应的第二增强数据;其中,所述噪声鲁棒性提高策略用于提升网络模型对噪声的鲁棒性;
76、过拟合降低模块,用于基于多种过拟合降低策略,分别对所述数据集中的原始数据进行增强,得到不同的过拟合降低策略对应的第三增强数据;其中,所述过拟合降低策略用于降低过拟合现象;
77、训练加速模块,用于基于多种网络训练加速策略,分别对所述数据集中的原始数据进行增强,得到不同的网络训练加速策略对应的第四增强数据;其中,所述网络训练加速策略用于加快网络模型的训练速度。
78、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
79、步骤s102,获取由原始数据构成的数据集;其中,所述原始数据为多通道生物电信号,所述多通道生物电信号包含多个通道的生物电信号时间序列;
80、步骤s104,基于多种信号多样性提高策略,分别对所述数据集中的原始数据进行增强,得到不同的信号多样性提高策略对应的第一增强数据;其中,所述信号多样性提高策略用于提高生物电信号的多样性;
81、步骤s106,基于多种噪声鲁棒性提升策略,分别对所述数据集中的原始数据进行增强,得到不同的噪声鲁棒性提升策略对应的第二增强数据;其中,所述噪声鲁棒性提高策略用于提升网络模型对噪声的鲁棒性;
82、步骤s108,基于多种过拟合降低策略,分别对所述数据集中的原始数据进行增强,得到不同的过拟合降低策略对应的第三增强数据;其中,所述过拟合降低策略用于降低过拟合现象;
83、步骤s110,基于多种网络训练加速策略,分别对所述数据集中的原始数据进行增强,得到不同的网络训练加速策略对应的第四增强数据;其中,所述网络训练加速策略用于加快网络模型的训练速度。
84、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
85、步骤s102,获取由原始数据构成的数据集;其中,所述原始数据为多通道生物电信号,所述多通道生物电信号包含多个通道的生物电信号时间序列;
86、步骤s104,基于多种信号多样性提高策略,分别对所述数据集中的原始数据进行增强,得到不同的信号多样性提高策略对应的第一增强数据;其中,所述信号多样性提高策略用于提高生物电信号的多样性;
87、步骤s106,基于多种噪声鲁棒性提升策略,分别对所述数据集中的原始数据进行增强,得到不同的噪声鲁棒性提升策略对应的第二增强数据;其中,所述噪声鲁棒性提高策略用于提升网络模型对噪声的鲁棒性;
88、步骤s108,基于多种过拟合降低策略,分别对所述数据集中的原始数据进行增强,得到不同的过拟合降低策略对应的第三增强数据;其中,所述过拟合降低策略用于降低过拟合现象;
89、步骤s110,基于多种网络训练加速策略,分别对所述数据集中的原始数据进行增强,得到不同的网络训练加速策略对应的第四增强数据;其中,所述网络训练加速策略用于加快网络模型的训练速度。
90、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
91、步骤s102,获取由原始数据构成的数据集;其中,所述原始数据为多通道生物电信号,所述多通道生物电信号包含多个通道的生物电信号时间序列;
92、步骤s104,基于多种信号多样性提高策略,分别对所述数据集中的原始数据进行增强,得到不同的信号多样性提高策略对应的第一增强数据;其中,所述信号多样性提高策略用于提高生物电信号的多样性;
93、步骤s106,基于多种噪声鲁棒性提升策略,分别对所述数据集中的原始数据进行增强,得到不同的噪声鲁棒性提升策略对应的第二增强数据;其中,所述噪声鲁棒性提高策略用于提升网络模型对噪声的鲁棒性;
94、步骤s108,基于多种过拟合降低策略,分别对所述数据集中的原始数据进行增强,得到不同的过拟合降低策略对应的第三增强数据;其中,所述过拟合降低策略用于降低过拟合现象;
95、步骤s110,基于多种网络训练加速策略,分别对所述数据集中的原始数据进行增强,得到不同的网络训练加速策略对应的第四增强数据;其中,所述网络训练加速策略用于加快网络模型的训练速度。
96、上述生物电信号数据增强方法、装置、计算机设备、计算机可读存储介质和计算机程序产品,通过采用多种不同的信号多样性提高策略、噪声鲁棒性提升策略、过拟合降低策略、网络训练加速策略来对生物电信号进行数据增强,能够扩展信号多样性和信息量,提高降噪能力以更好地区分信号与噪声,降低深度学习过拟合现象以及加速网络训练过程,使得生物电信号识别模型在小样本数据和噪声干扰下的应用更加可靠和有效,有利于提高生物电信号识别性能。