一种自动提取心音包络特征的心音分段方法与流程

文档序号:14655724发布日期:2018-06-12 03:35阅读:336来源:国知局

本发明涉及心音分段领域,具体涉及一种自动提取心音包络特征的心音分段方法。



背景技术:

心脏检测和分析是了解心脏和血管状态的一种不可缺少的手段。传统的心脏听诊技术是医师评估心脏存在病变及功能状态的最基本的方法之一。虽然人耳对中高频段和较大强度的心音可较好的分辨,但是对那些有重要诊断意义的低频心音及强度小的心音常不能分辨,人耳先天的局限和听诊者的临床经验在很大程度上影响了听诊的准确度,而且不能给出定量分析的结果。心电图检查是心脏变时性和变传导性的最佳监测方法,但也不能用来监测心脏的变力性。心音却可以反映出先天心脏瓣膜受损、心电传导组织病变引起的心脏机械活动障碍等异常。另外,某些心血管系统的病变在导致心音图出现异常前,首先导致心脏杂音和心音变异。心音检查有无创性、重复性好的优点,具有心电图、超声心动图不可取代的诊断优势,因此,对心音的分析愈来愈引起了广大研究工作者的关注。

心脏收缩舒张时产生的声音,可用耳或听诊器在胸壁听到,亦可用电子仪器记录下来(心音图)。可分为第一心音(S1)第二心音(S2)。每一心动周期可产生四个心音,通常能听到的是第一和第二心音。第一心音发生在心缩期,标志心室收缩期的开始。于心尖搏动处(前胸壁第5肋间隙左锁骨中线内侧)听得最清楚。其音调较低(40~60赫兹),持续时间较长(0.1~0.12秒),较响。其产生的原因:一是由于心室收缩时,血流急速冲击房室瓣而折返所引起的心室壁振动;二是由于房室瓣关闭,瓣膜叶片与腱索紧张等引起的振动;三是血液自心室射出撞击主动脉壁和肺动脉壁引起的振动。心室收缩力愈强,第一心音愈响。第二心音发生在心舒期,标志着心室舒张期的开始,它分为主动脉音和肺动脉音两个成分,分别在主动脉和肺动脉听诊区(胸骨右、左缘第二肋间隙)听得最清楚。它是由主动脉瓣和肺动脉瓣迅速关闭,血流冲击,使主动脉和肺动脉壁根部以及心室内壁振动而产生。其音调较高(60~100赫兹),持续时间较短(0.08秒),响度较弱。其强弱可反映主动脉压和肺动脉压的高低,动脉压升高,则第二心音亢进。

心音分析的第一步也是最重要的一步是对心音信号进行分段分析,拆解心音周期,只有心音周期分析对了,后面的病例分析才有基础。

一般的心音分析需要心电图的参考,这样的分析更容易进行,但是系统复杂度以及检测环境的复杂多变度显然提高了使用门槛。还有一种是基于心音信号包络来进行的,这种心音分段方法需要设置合适的检测门限来检测第一第二心音的峰值,但是由于心音测量时不可避免的有外部杂音或者干扰混入,因此造成心音分段性能和准确性的急剧下降。特别对于心脏病人特别是带有心脏杂音的心音信号,第一第二心音的峰值很可能因为杂音的存在而检测不出,因此该方法的局限性很大。



技术实现要素:

本发明的目的在于:提供一种自动提取心音包络特征的心音分段方法,解决了目前采用人工进行心音分段工作量大的技术问题。

本发明采用的技术方案如下:

一种自动提取心音包络特征的心音分段方法,其特征在于:包括以下步骤:

步骤1:对心音信号进行预处理;

步骤2:利用心电信号提取所述预处理后心音信号的分段标签;

步骤3:将分段标签作为最终输出结果构建深度学习神经网络;

步骤4:利用所述预处理后的心音信号对所述深度学习网络进行训练;

步骤5:将待分段的心音信号进行预处理后输入训练后的深度学习网络中,得到最终心音分段结果。

进一步的,所述步骤1中,预处理的具体步骤为:

S101:对心音信号进行重采样,降低所述心音信号的频率;

S102:利用5阶巴特沃斯带通滤波器对所述心音信号进行滤波,并对滤波后的心音信号进行归一化处理,归一化函数如下:

其中,X表示所述心音信号的序列,Xmin表示所述心音信号序列的最小值,Xmax表示所述心音信号序列的最大值。

进一步的,所述步骤2的具体步骤如下:

S201:对所述心电信号进行预处理;

S202:在所述预处理后的心电信号中寻找R-peak和T-wave end的位置;

S203:利用所述R-peak和T-wave end的位置寻找所述预处理后心音信号中的第一心音S1和第二心音S2的位置,所述R-peak的位置对应于第一心音S1的位置,所述T-wave end的位置对应于第二心音S2的位置;

S204:利用所述第一心音S1和第二心音S2的位置生成分段标签。

进一步的,所述步骤S204中,所述分段标签生成的具体内容为:

S2101:根据心音信号包络图的自相关系数获取整个心音的持续时间eHR和舒张期持续时间eSys;

S2102:假设第一心音S1持续的时间为dμs1,第二心音持续的时间为dμs2,即平均舒张期持续时间dμsiDia=(eHR-eSys)-dμs2 (2),平均收缩期持续时间dμsiSys=eSys-dμs1 (3),

结合第一心音S1和第二心音S2的位置即获得第一心音、第二心音、舒张期、收缩期四个阶段的分布,该分布即为所述分段标签。

进一步的,所述步骤3中,深度学习神经网络构建中的主要内容如下:

S301:利用卷积网络提取心音信号的特征,采用的公式如下:

p(yj|y<j,s)=soft max(g(hj)) (5),

hj=f(hj-1,x) (6),

zj=c+Vhj-1 (7),

其中,s表示所述深度学习神经网络中卷积网络的卷积层提取的中间特征,y表示预测的目标序列,x表示输入的预处理后心音信号的音频序列,j表示时刻,T表示输出序列的长度,yj表示j时刻预测的目标序列的一个元素,p(yi|y<j,s)表示目标序列的元素在j时刻的预测值由当前的输入的中间特征s和过去的预测值(<j的时刻)得到,hj表示模型隐层在j时刻的输出,g是尺度变换函数,对隐层的输出有一个尺度上的变化,zj表示模型的预测输出结果,Vhj-1表示一个尺度变换。

S302:利用所述特征得到各个分段标签的概率,其中采用的目标函数为:

其中,U表示输入序列的长度,j表示输出序列的某个时刻,J表示总时刻,Pr(y|x)表示在输入音频序列x的情况下输出y的概率,表示深度学习神经网络模型的预测输出,Lj表示训练深度学习神经网络所用的似然函数。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

1.本发明分段精度高,与人工分段精度相当,可以代替人工分段,分段精度高达94%-98%。

2.对于较短的数据有较好的分段效果,传统方法需要的心音录音长度较长,需要8秒左右,本方法在4秒甚至2秒作为输入的情况下也能取得良好的效果。

3.输入为原始的心音音频数据,卷积层提取中间特征,不用手动提取特征。

4.利用心电信号(ECG)对训练数据进行标定的方法解决了大数据量标定的问题。

5.采用的目标函数能很好的训练整个网络。

附图说明

本发明将通过例子并参照附图的方式说明,其中:

图1是本发明的流程图;

图2是本发明中基于心电图生成心音分段标签的图示;

图3是本发明中心音各分段的概率输出;

图4是本发明中作为深度神经网络输入的预处理后的心音信号;

图5是本发明的最终分段效果图。

具体实施方式

本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。

下面结合图1-5对本发明作详细说明。

一种自动提取心音包络特征的心音分段方法,其特征在于:包括以下步骤:

步骤1:对心音信号进行预处理;

预处理的具体步骤为:

S101:对心音信号进行重采样,降低所述心音信号的频率;

S102:利用5阶巴特沃斯带通滤波器对所述心音信号进行滤波,并对滤波后的心音信号进行归一化处理,归一化函数如下:

其中,X表示所述心音信号的序列,Xmin表示所述心音信号序列的最小值,Xmax表示所述心音信号序列的最大值。

步骤2:利用心电信号提取所述预处理后心音信号的分段标签;

S201:对所述心电信号进行预处理;

S202:在所述预处理后的心电信号中寻找R-peak和T-wave end的位置;

S203:利用所述R-peak和T-wave end的位置寻找所述预处理后心音信号中的第一心音S1和第二心音S2的位置,所述R-peak的位置对应于第一心音S1的位置,所述T-wave end的位置对应于第二心音S2的位置;

S204:利用所述第一心音S1和第二心音S2的位置生成分段标签。

所述分段标签生成的具体内容为:

S2101:根据心音信号包络图的自相关系数获取整个心音的持续时间eHR和舒张期持续时间eSys;

S2102:假设第一心音S1持续的时间为dμs1,第二心音持续的时间为dμs2,即平均舒张期持续时间dμsiDia=(eHR-eSys)-dμs2(10),平均收缩期持续时间dμsiSys=eSys-dμs1

(11),结合第一心音S1和第二心音S2的位置即获得第一心音、第二心音、舒张期、收缩期四个阶段的分布,该分布即为所述分段标签。

步骤3:将分段标签作为最终输出结果构建深度学习神经网络;

步骤4:利用所述预处理后的心音信号对所述深度学习网络进行训练;

其中深度学习神经网络构建中的主要内容如下:

S301:利用卷积网络提取心音信号的特征,采用的公式如下:

p(yj|y<j,s)=softmax(g(hj)) (13),

hj=f(hj-1,x) (14),

zj=c+Vhj-1 (15),

其中,s表示所述深度学习神经网络中卷积网络的卷积层提取的中间特征,y表示预测的目标序列,x表示输入的预处理后心音信号的音频序列,j表示时刻,T表示输出序列的长度,yj表示j时刻预测的目标序列的一个元素,p(yi|y<j,s)表示目标序列的元素在j时刻的预测值由当前的输入的中间特征s和过去的预测值(<j的时刻)得到,hj表示模型隐层在j时刻的输出,g是尺度变换函数,对隐层的输出有一个尺度上的变化,zj表示模型的预测输出结果,Vhj-1表示一个尺度变换。

S302:利用所述特征得到各个分段标签的概率,其中采用的目标函数为:

其中,U表示输入序列的长度,j表示输出序列的某个时刻,J表示总时刻,Pr(y|x)表示在输入音频序列x的情况下输出y的概率,表示深度学习神经网络模型的预测输出,Lj表示训练深度学习神经网络所用的似然函数。

步骤5:将待分段的心音信号进行预处理后输入训练后的深度学习网络中,得到最终心音分段结果。

具体实施例

一种自动提取心音包络特征的心音分段方法,包括以下步骤:

步骤1:对心音信号进行预处理;

预处理的具体步骤为:

S101:对心音信号进行重采样,降低所述心音信号的频率;心音信号的采样频率为4000Hz,由于心音信号多低于600Hz,为了减少数据量以降低后续数据处理的压力并滤除高频噪声,采用重采样将信号频率降至1600Hz;

S102:由于心音信号的有效频率范围在20-200Hz之间,采用5阶巴特沃斯带通滤波器对所述心音信号进行滤波,并对滤波后的心音信号进行归一化处理,归一化函数如下:

其中,X表示所述心音信号的序列,Xmin表示所述心音信号序列的最小值,Xmax表示所述心音信号序列的最大值。

步骤2:利用心电信号提取所述预处理后心音信号的分段标签;

具体步骤如下:

S201:对所述心电信号进行预处理,即对心电信号进行重采样,将信号频率降低至300Hz,由于心电信号的有效频率范围在0-150Hz之间,因此采用5阶巴特沃斯带通滤波器对信号进行滤波;

S202:在所述预处理后的心电信号中寻找R-peak和T-wave end的位置;

S203:利用所述R-peak和T-wave end的位置寻找所述预处理后心音信号中的第一心音S1和第二心音S2的位置,R-peak对应于第一心音S1的位置,T-wave end对应于第二心音的位置;

第一心音S1产生的原因包括心室肌的收缩,房室瓣突然关闭以及随后射血入主动脉等引起的振动;第一心音S1发生在心脏收缩期开始,音调低沉,持续时间较长(约0.15s),即相当于心电图上QRS波开始后0.02~0.04s,占时0.08~0.15s左右;第二心音S2产生的原因是半月瓣关闭,瓣膜互相撞击以及大动脉中血液减速和室内压迅速下降引起的振动;第二心音S2发生于心脏舒张期的开始,频率较高,持续时间较短(约0.08s),相当于心电图上T波终末部;本方法利用R-peak的位置,在心音信号包络图的该位置100ms内搜索最大值即为第一心音S1。

S204:利用所述第一心音S1和第二心音S2的位置生成分段标签。

所述分段标签生成的具体内容为:

S2101:根据心音信号包络图的自相关系数获取整个心音的持续时间eHR和舒张期持续时间eSys;

S2102:假设第一心音S1持续的时间为dμs1,第二心音持续的时间为dμs2,即平均舒张期持续时间dμsiDia=(eHR-eSys)-dμs2 (18),平均收缩期持续时间dμsiSys=eSys-dμs1 (19),

即获得第一心音、第二心音、舒张期、收缩期四个阶段的分布,其中第一心音用0表示,第二心音用2表示,收缩期由1表示,舒张期由3表示(如图2所示)。

该分布即为所述分段标签。

步骤3:将分段标签作为最终输出结果构建深度学习神经网络;

该深度学习神经网络的结构为:X=(RU)*,其中X为心音信号的原始音频,U为输入的固定长度;输出的目标空间为Z=L*,Z=(Z1,Z2,...,ZT)是有K个种类的离散集合,心音分段中K=4,标签集为{S1,收缩期,S2,舒张期},该深度学习神经网络实现了

Model:X→Z的非线性映射。

深度学习神经网络构建:

S301:利用卷积网络提取心音信号的特征,采用的公式如下:

p(yj|y<j,s)=soft max(g(hj)) (21),

hj=f(hj-1,x) (22),

zj=c+Vhj-1 (23),

其中,s表示所述深度学习神经网络中卷积网络的卷积层提取的中间特征,y表示预测的目标序列,x表示输入的预处理后心音信号的音频序列,j表示时刻,T表示输出序列的长度,yj表示j时刻预测的目标序列的一个元素,p(yi|y<j,s)表示目标序列的元素在j时刻的预测值由当前的输入的中间特征s和过去的预测值(<j的时刻)得到,hj表示模型隐层在j时刻的输出,g是尺度变换函数,对隐层的输出有一个尺度上的变化,zj表示模型的预测输出结果,Vhj-1表示一个尺度变换。

使用256个卷积产生了256个特征,然后进行了一次卷积操作和一次最大池化,接着一次卷积操作和一个最大池化,并进行了drop out操作;并采用2层双向LSTM(输出时间长度为200,特征维度为256的数据)后输入至一个全连接层作为预测概率输出层(如图3所示)。

S302:利用所述特征得到各个分段标签的概率,其中采用的目标函数为:

其中,U表示输入序列的长度,j表示输出序列的某个时刻,J表示总时刻,Pr(y|x)表示在输入音频序列x的情况下输出y的概率,表示深度学习神经网络模型的预测输出,Li表示训练深度学习神经网络所用的似然函数。

步骤4:利用所述预处理后的心音信号对所述深度学习网络进行训练;

该深度学习网络的输入为经过预处理的采样频率为1600Hz的4秒原始波形数据,也就是6400采样点的数据(如图4所示)。

步骤5:将待分段的心音信号进行预处理后输入训练后的深度学习网络中,得到最终心音分段结果(如图5所示)。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1