面向深度卷积神经网络的心音信号分类的数据扩充方法与流程

文档序号:22738251发布日期:2020-10-31 09:18阅读:305来源:国知局
面向深度卷积神经网络的心音信号分类的数据扩充方法与流程

本发明属于生物信号处理、模式识别、医疗人工智能技术领域,利用深度学习技术及数据扩充方法对心音信号分类,尤其涉及一种面向深度卷积神经网络的心音信号分类的数据扩充方法。



背景技术:

心音是一种典型的非平稳信号,其中包含了各种生理病理信息。通过计算机自动提取心音信号的特征进行定量分析,辅助心脏疾病诊断具有重要的意义。近年来,随着gpu性能的提升及各种高效深度学习模型的提出,利用深度学习方法对心音信号分类逐渐成为研究的热点,与其他传统的机器学习方法相比具有明显的优势。如深度学习的方法独有的分层网络结构能够从大量的心音数据中挖掘抽象的、泛华性能强的特征所设计的模型具有端到端的特点。但是,由于目前训练深度学习的心音数据集规模不大尤其是病理性的心音数据稀缺直接导致了训练深度学习模型过程中产生过拟合的现象且训练的模型精度不理想。



技术实现要素:

发明目的:为了解决现有技术的不足,本发明提供了一种面向深度卷积神经网络的心音信号分类的数据扩充方法,有效解决了因心音数据稀缺、种类间不平衡导致深度学习模型训练过程易产生过拟合的现象,有效提高深度学习模型的分类精度和泛化性能。

技术方案:一种面向深度卷积神经网络的心音信号分类的数据扩充方法,包括如下步骤:

步骤(1)对原训练心音数据进行预处理操作;

步骤(2)从所述预处理后的一维心音信号转化成二维的mfsc特征图;

步骤(3)对所述mfsc特征图乘上掩模函数对其频域、时域随机掩盖处理;

步骤(4)扩充、平衡各个类别样本的数量,得到新的训练数据集;

步骤(5)将所述新的训练数据集训练深度卷积神经网络。

进一步的,所述的步骤(1)中,预处理操作包括下采样、滤波、归一化操作,具体如下:

a.对心音信号下采样,采样频率为2000hz;

b.利用6阶巴特沃斯滤波器带宽限制在25至900hz范围对心音滤波处理;

c.经滤波的信号进行幅值归一化处理,使得提取的特征具有更强的鲁棒性。如下式所示,x为滤波后的心音信号,y为归一化后的数值;

进一步的,所述的步骤(2)中,mfsc特征图产生过程包括:

a.对所述预处理后的心音信号进行预加重处理即用一阶高通滤波器提升高频部分使得信号频谱更加平坦,具体的预加重方式如以下的高通滤波器,其中取u为0.95;

h(z)=1-uz-1

b.对所述预加重后的心音信号分帧、加汉宁窗和短时傅里叶变换处理,其中窗口长度、帧移分别为40ms、20ms,窗函数如下:

a值为0.46,n为窗长设为80即40ms;

c.将每一帧功率谱结果经一组有64个mel滤波器组进行处理,分别和每个滤波器进行加权求和从而获得64个特征能量数值;

d.再对这64个特征值取对数;

e.进行一阶差分和二阶差分运算作为动态特征,并将这三种特征映射到图像rgb通道组合成rgb三通道的mfsc特征图。

进一步的,所述的步骤(3)中,掩模函数h(x,y)的设计方法如下:

a.频率域信息随机掩盖函数:

其中,f是小于f-f0的随机整数,f是mfsc特征图的最大通道数值,f0是小于f0的随机整数;

b.时域信息随机掩盖函数:

其中,t是小于t-t0的随机整数,t为mfsc特征图时域上最大的帧数,t0是小于t0的随机整数。

进一步的,所述的步骤(4)中,扩充、平衡原训练样本的过程如下:

a.找到类别中数目最多的mfsc特征图数目n;

b.将其他较少类别的mfsc特征图,通过乘上掩模函数h(x,y)扩充数据直到和n大小一致。

有益效果:本发明可以通过信号处理的手段对用于训练深度卷积神经网络的样本有效扩充和平衡,解决了样本量少、不均衡导致深度学习模型训练容易过拟合,分类效果不好的问题。

附图说明

图1是本发明的面向深度卷积神经网络的心音信号分类数据扩充方法流程示意图;

图2是本发明的心音信号预处理流程示意图;

图3是本发明的mfsc特征图产生流程示意图;

图4是本发明的用于训练的深度卷积神经网络结构示意图;

图5是本发明的经数据扩充前后的mfsc特征示意图;

图6是本发明的扩充前后深度卷积神经网络训练过程学习曲线对比情况示意图;

图7是本发明的深度卷积神经网络输出层向量t-sne可视化结果示意图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,以使本领域的技术人员能够更好的理解本发明的优点和特征,从而对本发明的保护范围做出更为清楚的界定。本发明所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

一种面向深度卷积神经网络的心音信号分类的数据扩充方法,具体包括如下步骤:

步骤(1)对原训练心音数据进行预处理操作;

步骤(2)从所述预处理后的一维心音信号转化成二维的mfsc特征图;

步骤(3)对所述mfsc特征图乘上掩模函数对其频域、时域随机掩盖处理;

步骤(4)扩充、平衡各个类别样本的数量,得到新的训练数据集;

步骤(5)将所述新的训练数据集训练深度卷积神经网络;

步骤(6)将所述训练好的深度卷积神经网络对心音数据进行验证。

所述的步骤(1)中,预处理操作包括下采样、滤波、归一化操作,具体如下:

a.对心音信号下采样,采样频率为2000hz;

b.利用6阶巴特沃斯滤波器带宽限制在25至900hz范围对心音滤波处理;

c.经滤波的信号进行幅值归一化处理,使得提取的特征具有更强的鲁棒性。如下式所示,x为滤波后的心音信号,y为归一化后的数值;

所述的步骤(2)中,mfsc特征图产生过程包括:

a.对所述预处理后的心音信号进行预加重处理即用一阶高通滤波器提升高频部分使得信号频谱更加平坦。具体的预加重方式如以下的高通滤波器,其中取u为0.95;

h(z)=1-uz-1

b.对所述预加重后的心音信号分帧、加汉宁窗和短时傅里叶变换处理,其中窗口长度、帧移分别为40ms、20ms,窗函数如下:

a值为0.46,n为窗长设为80即40ms;

c.将每一帧功率谱结果经一组有64个mel滤波器组进行处理,分别和每个滤波器进行加权求和从而获得64个特征能量数值;

d.再对这64个特征值取对数;

e.进行一阶差分和二阶差分运算作为动态特征,并将这三种特征映射到图像rgb通道组合成rgb三通道的mfsc特征图。

所述的步骤(3)中,掩模函数h(x,y)的设计方法如下:

a.频率域信息随机掩盖函数:

其中,f是小于f-f0的随机整数,f是mfsc特征图的最大通道数值,f0是小于f0的随机整数。

b.时域信息随机掩盖函数:

其中,t是小于t-t0的随机整数,t为mfsc特征图时域上最大的帧数,t0是小于t0的随机整数。

所述的步骤(4)中,扩充、平衡原训练样本的过程如下:

a.找到类别中数目最多的mfsc特征图数目n;

b.将其他较少类别的mfsc特征图,通过乘上掩模函数h(x,y)扩充数据直到和n大小一致。

本发明提出的面向深度卷积神经网络的心音信号分类数据扩充方法通过信号处理的手段对一维的心音信号转换成二维的mfsc特征图,并利用设计了掩模函数对其处理,有效扩充了训练样本,解决了原有训练样本少、类别间不均衡导致深度卷积神经网络训练容易过拟合,分类效果不好的问题。

为验证本发明效果,进行如下实验:

实验系统环境为ubuntu16.04,内存为64gb的nvidiageforcegtx1080tigpu,深度学习框架为tensorflow1.7.0,编程语言为python2.3。对包含正常2575例和异常665例共3240例心音信号分类实验。首先,对原始3240个一维的心音数据转换成mfsc特征图,其中正常心音mfsc特征图23781个,异常mfsc特征图7078个,并将此部分数据称之原数据集。然后,对较少类别的异常心音mfsc特征图利用掩模函数扩充,直到和正常心音mfsc特征图相等,扩充后的数据集称之为扩充数据集。原训练数据集和扩充后数据集按4比1比例对深度卷积神经网络训练验证,在同样的超参数下,分别在原数据集和扩充数据集上训练神经网络,训练过程学习曲线对比如图6所示。在原数据训练条件下模型验证正确率为76.5%,在扩充数据集下模型验证正确率达到了99.5%比为扩充数据集下提高了23%。

为了进一步验证本发明效果,提取深度学习模型最后一层向量对500个正常心音和500个异常心音样本通过tensorboardprojector的t-sne向量可视化,其结果如图7所示。可见每个高维向量被投影到一个二维空间里,同类别的向量彼此靠近,分类效果较好。

参考图1,本发明的实施例中,面向深度卷积神经网络的心音信号分类数据扩充方法流程,具体包括:预处理、mfsc特征图生成、时频信息掩盖、数据平衡扩充、训练深度卷积神经网络。

参考图2,本发明的实施例中,预处理操作包括下采样、滤波、归一化操作。具体如下:

1)对心音信号下采样,采样频率为2000hz;

2)利用6阶巴特沃斯滤波器带宽限制在25至900hz范围对心音滤波处理;

3)经滤波的信号进行幅值归一化处理,使得提取的特征具有更强的鲁棒性。如下式所示,x为滤波后的心音信号,y为归一化后的数值;

参考图3,本发明的实施例中,所述步骤mfsc提取过程具体为如下:

1)对所述预处理后的心音信号进行预加重处理即用一阶高通滤波器提升高频部分使得信号频谱更加平坦。具体的预加重方式如以下的高通滤波器,其中取u为0.95;

h(z)=1-uz-1

2)对所述预加重后的心音信号分帧、加汉明窗和短时傅里叶变换处理,其中窗口长度、帧移分别为40ms、20ms,窗函数如下:

a值为0.46,n为窗长设为80即40ms。

3)将每一帧功率谱结果经一组有64个mel滤波器组进行处理,分别和每个滤波器进行加权求和从而获得64个特征能量数值;

4)再对这64个特征值取对数;

5)进行一阶差分和二阶差分运算作为动态特征,并将这三种特征映射到图像rgb通道组合成rgb三通道的mfsc特征图。

参考图4,本发明的实施例中构造的深度卷积神经网络结构,主要由inception-resnet、reduction和stem模块组成。其中modefied-stem模块是由不同尺寸的卷积操作堆叠构成的深度卷积层,其中1×1的卷积不仅起到了降维的作用同时提升了网络的非线性特性;目标函数如公式(1)所示。

其中,ls和lc分别代表softmax损失和中心损失,分别由公式(2)、(3)给出。

公式(2、3)中,表示来自上一层的第j的维度的值,n表示分类的类别数即上一层输出的维度大小,xi∈rd表示第i个训练样本全连接层输出的特征向量,yi表示第i个训练样本的实际的类标签,表示为类标签yi维护的该类的中心。

参考图5,本发明的实施例中对原数据集扩充,扩充函数中的参数为t0=4,f0=4,以一个正常mfsc特征图为例扩充前后的mfsc特征图如图5所示。

参考图6,本发明的实施例中深度卷积神经网络训练过程学习曲线对比情况。

参考图7,本发明的实施例中深度卷积神经网络输出层高维向量t-sne可视化结果。

本发明可以通过信号处理的手段对用于训练深度卷积神经网络的样本有效扩充和平衡,解决了样本量少、不均衡导致深度学习模型训练容易过拟合,分类效果不好的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1