一种基于深度学习的睡眠鼾声分类检测方法及系统与流程

文档序号:15697151发布日期:2018-10-19 19:13阅读:574来源:国知局

本发明涉及疾病检测技术领域,特别涉及一种基于深度学习的睡眠鼾声分类检测方法及系统。



背景技术:

阻塞性睡眠呼吸暂停低通气综合征(osahs)是较为严重的睡眠呼吸障碍,病症主要表现为患者在睡觉过程中呼吸道软腭多次内陷,反复阻塞气道,导致呼吸受阻,临床表现为晚上睡觉时打鼾并伴随呼吸暂停或呼吸气流流量小。呼吸暂停是指患者在睡觉时呼吸气流消失超过10秒的情况,低通气是指患者在睡觉时呼吸气流强度低于基本值的50%,同时血氧浓度下降到低于正常水平96%的情况。

对于osahs的检测,传统的方法是通过多导睡眠监测装置对病人进行6至7小时的睡眠监督和测量,可记录并分析eeg(脑电图)、ecg(心电图)、eog(眼电图)、emg(肌电图),鼾声、血氧饱和度、呼吸频率、体位等多个睡眠时的体征参数,该方法准确可靠,但是由于需要在患者身上安置超过15个导联,影响到了患者的正常睡眠状态,并且价格不菲,而且通过多导睡眠图(psg)获取的信息必须利用人工辨别出现的问题,非常不便,人们正在寻找经济有效且可靠的辅助诊断方法。

鉴于鼾声的产生与呼吸道的生理结构关系紧密,鼾声极有可能能够反映出患者呼吸道发生病变的一些情况,并且有研究表明普通打鼾者发出的鼾声同osahs患者之间的鼾声存在一定的差异。ahi指数(暂停低通气指数)是判定osahs患者患病程度的最直观的标准,如果不对鼾声进行分类将很难从鼾声获取病人的ahi指数,因此对患病鼾声进行分类研究有其必要性,且通过将病患的整晚鼾声进行分类识别将有助于osahs患者病情的诊断和监控。



技术实现要素:

本发明的目的在于克服现有技术中的缺点与不足,提供一种基于深度学习的睡眠鼾声分类检测方法,将睡眠声信号进行处理有效信号提取,获取有声段图谱,使用深度学习对有声段图谱进行鼾声与非鼾声的分类,获取识别结果为纯鼾声的图谱及音频文件,再使用深度学习对纯鼾声的图谱及音频文件进行四类鼾声分类,完成对呼吸暂停低通气综合征鼾声的自动识别与检测,然后统计被测患者整晚各类鼾声的数量,获取被测患者整晚ahi指数。本发明方法使用深度学习对图谱进行了高准确度的识别,有利于准确评价打鼾对象是否患病及患病程度,为osahs患者提供数据参考。

本发明的另一目的在于,运用基于深度学习的睡眠鼾声分类检测方法,提出基于深度学习的睡眠鼾声分类检测方法的检测系统。

为实现以上目的,本发明采取如下技术方案:

一种基于深度学习的睡眠鼾声分类检测方法,包括下述步骤:

s1、通过传感器采集被测患者整晚的睡眠声信号,并对所述睡眠声信号中的有声段进行探测,获取睡眠声信号中的有声段图谱,有声段为一个鼾声或呼吸声;

s11、对所述睡眠声信号中的有声段进行探测:对所述睡眠声信号进行预加重和分帧的预处理,并对预处理后的睡眠声信号进行降噪处理,再将计算降噪处理后的睡眠声信号中有声段及残余噪声段的有效值,根据睡眠声信号的有效值轮廓,确定最终的有效值信号;

s12、根据步骤s11得到的睡眠声信号最终的有效值信号,获取睡眠声信号的有声段图谱;

s2、使用深度学习对有声段图谱进行鼾声与非鼾声的分类,并完成对鼾声与非鼾声的自动侦测与识别,保留识别结果为鼾声的图谱及音频文件;

所述使用深度学习对有声段图谱进行鼾声与非鼾声的分类,采用卷积神经网络,其过程包括:(1)确定卷积神经网络收敛方式;(2)选择激活函数;(3)选择网络输出预测结果概率函数;(4)通过卷积神经网络训练获取其参数;(5)根据损失函数对卷积神经网络参数进行调整,以完成对鼾声与非鼾声的自动识别;

s3、根据步骤s2获得的纯鼾声图谱及音频文件,采用如同步骤s2的深度学习对纯鼾声图谱及音频文件进行鼾声分类,完成对呼吸暂停低通气综合征鼾声的自动识别与检测;

s4、根据步骤s3的识别与检测结果,统计被测患者整晚各类鼾声的数量,获取被测患者整晚ahi指数,完成对被测患者整晚鼾声ahi指数的预测。

作为优选的技术方案,步骤s11具体包括下述步骤:

s111、对所述睡眠声信号进行预加重和分帧的预处理:利用一阶高通fir滤波器完成睡眠声信号的预加重,分帧时选择帧长为20ms,帧移为10ms、50%的重叠率;

s112、对预处理后的睡眠声信号进行降噪处理:使用谱减法和维纳滤波法相结合的方法或声纹技术对睡眠声信号进行降噪;

s113、计算降噪处理后的睡眠声信号的绝对值,每50个采样点内寻找所述睡眠声信号的绝对值最大值,求得睡眠声信号的最大值信号轮廓;在最大值信号中每50个最大值之间进行求和,形成初步的有效值信号轮廓,根据初步的有效值信号轮廓,确定有效值信号门限;再对初步的有效值信号通过10点滑动平均进行平滑处理,得到最终的有效值信号。

作为优选的技术方案,步骤s12中,所述睡眠声信号的有声段图谱包括信号图、频谱图、以及语谱图;

获取有声段的信号图:信号图为有声段的信号波形图,去掉坐标,只保留图形部分;

获取有声段的频谱图:对有声段信号做离散傅里叶变换所画出的频谱图,去掉坐标,只保留图形部分,傅里叶变换如下式(1):

其中,k表示离散频率,n表示傅里叶变换的点数,n表示做傅里叶变换的点的序数,j是虚数单位,x(n)表示时域下第n个点的值;

获取有声段的语谱图:语谱图是以时间为横坐标,以频率为纵坐标所得到的声音能量分布图,以不同颜色表征不同的能量大小,去掉坐标,只保留图形部分。

作为优选的技术方案,步骤s2具体包括下述步骤:

s21、确定卷积神经网络收敛方式:按照正则化后的梯度下降法收敛网络,具体利用如下公式:

w=w-ε(αw+▽wj(w;x,y))(2)

其中α为正则系数,ε为学习率,j(w,x,y)为目标函数,y为上一轮训练的输出值,w为滤波器权重;

s22、选择激活函数:选择relu函数作为激活函数,

其中x是上一卷积层计算所得数值;

s23、选择网络输出预测结果概率函数:选择softmax函数作为输出预测结果概率函数;假设存在一个数组z,zi是其中一个元素,则

其中yi是输出识别分数;因为要将有声段图谱分为鼾声与非鼾声两类,故对每张图谱输出两个y,softmax函数的作用即把输入的类别参数zi转换成识别分数,得分最高的即为分类器输出的最终辨识结果;

s24、通过卷积神经网络训练获取其参数:使用卷积神经网络对步骤s23所分类的图谱集进行初步试训,获取卷积神经网络训练参数大致范围,参数包括:学习率初始值和学习率变化方案、l1和l2正则系数、权值初始化方式、网络层数、池化方式、激活函数、以及训练和测试批大小;

s25、根据步骤s24训练及测试所得的损失函数曲线判断训练状态,以此状态为依据对卷积神经网络训练参数进行调整,得出最终训练结果,完成对鼾声与非鼾声的自动识别,并提取出鼾声的图谱及音频文件用作后续使用。

作为优选的技术方案,步骤s3中,所述鼾声包括呼吸紊乱前鼾声、呼吸紊乱中鼾声、呼吸紊乱后鼾声以及正常鼾声四类鼾声。

作为优选的技术方案,步骤s4中,步骤s4中,按时间顺序记录被测患者整晚四类鼾声;其中,当相邻的两次普通鼾声之间出现呼吸紊乱前鼾声、呼吸紊乱中鼾声和呼吸紊乱后鼾声中的至少一种时,将其记录为一次呼吸紊乱事件;统计每小时的呼吸紊乱事件次数,所得结果即为ahi指数。

基于深度学习的睡眠鼾声分类检测方法的分类检测系统,包括信号提取模块、计算模块、识别模块和统计预测模块;

所述信号提取模块,用于采集被测患者整晚的睡眠声信号,根据被测者整晚的睡眠声信号,获取睡眠声信号中的有声段;

所述计算模块,用于对睡眠声的有声段信号进行计算并获取有声段的图谱;

所述识别模块,分两部分,第一部分用于使用深度学习对有声段图谱进行鼾声与非鼾声的识别分类,并完成对鼾声与非鼾声的自动侦测与识别;第二部分用于在第一部分获取的纯鼾声中,使用深度学习对四类鼾声进行识别分类,完成对呼吸暂停低通气综合征鼾声的自动识别与检测;

所述统计预测模块,用于对整晚睡眠声信号进行统计,得到四类鼾声次数的统计结果,根据统计结果对ahi指数值进行预测。

作为优选的技术方案,所述信号提取模块包括预处理单元和有效值信号门限计算单元;

所述预处理单元,用于两方面工作:(1)将采集的睡眠声信号进行预加重和分帧的预处理工作:利用一阶高通fir滤波器完成睡眠声信号的预加重,分帧时选择帧长为20ms,帧移为10ms、50%的重叠率;(2)使用谱减法和维纳滤波法相结合的方法对睡眠声信号进行降噪;

所述有效值信号门限计算单元,用于对降噪预处理后的睡眠声信号进行幅值计算,对比有声段与相对无声段的幅值差异确定有声段信号门限,所述有声段信号门限用于有声信号段的侦测和切割。

作为优选的技术方案,所述分类检测系统采用电脑软件、手机app或者带数字信号处理器的硬件模块实现。

本发明相对于现有技术具有如下的优点和效果:

(1)本发明方法及系统通过将鼾声与呼吸紊乱事件适时结合,以呼吸紊乱事件为中心,定义普通鼾声及呼吸紊乱事件相关鼾声,将整晚睡眠鼾声进行四分类,避免过多复杂的分类影响分类系统的识别效果,研究四类鼾声的特征差异,较精确的实现了四类鼾声的自动分类,利用鼾声类型及鼾声前后声音类型判断整晚呼吸紊乱事件次数来预测ahi值,为osahs患者提供数据参考。

(2)本发明方法及系统根据鼾声与呼吸紊乱事件的时间关系划分鼾声类型:呼吸紊乱事件前鼾声、呼吸紊乱中鼾声、呼吸紊乱后鼾声和普通鼾声,分别对这四类鼾声进行信号图、频谱图、语谱图等图谱提取,取出图谱中的坐标等干扰因素,只保留图像,从时域和频域两个方面,使用深度学习对图谱进行了高准确度的识别,有利于准确评价打鼾对象是否患病及患病程度。

附图说明

图1是本发明实施例的基于深度学习的睡眠鼾声分类检测方法流程图;

图2是本发明实施例的基于深度学习的睡眠鼾声分类检测系统模块图。

具体实施方式

为了使本发明的目的、技术方案以及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用于解释本发明,并不限于本发明。

实施例

如图1所示,一种基于深度学习的睡眠鼾声分类检测方法,包括下述步骤:

s1、采集患者整晚的睡眠声信号,并对所述睡眠声信号中的有声段进行探测,获取睡眠声信号中的有声段图谱,有声段为一个鼾声或呼吸声或其他噪声;

s11、对所述睡眠声信号中的有声段进行探测:对所述睡眠声信号进行预加重和分帧的预处理,并对预处理后的睡眠声信号进行降噪处理,再将计算降噪处理后的睡眠声信号中有声段及残余噪声段的有效值,根据睡眠声信号的有效值轮廓,确定最终的有效值信号;

s111、对所述睡眠声信号进行预加重和分帧的预处理:利用一阶高通fir滤波器完成睡眠声信号的预加重,分帧时选择帧长为20ms,帧移为10ms、50%的重叠率;

s112、对预处理后的睡眠声信号进行降噪处理:使用谱减法和维纳滤波法相结合的方法或其他信号处理方法(声纹技术)对睡眠声信号进行降噪;

s113、计算降噪处理后的睡眠声信号的绝对值,每50个采样点内寻找所述睡眠声信号的绝对值最大值,求得睡眠声信号的最大值信号轮廓;在最大值信号中每50个最大值之间进行求和,形成初步的有效值信号轮廓,根据初步的有效值信号轮廓,确定有效值信号门限,所述有声段信号门限用于对有声信号段的侦测和切割;再对初步的有效值信号通过10点滑动平均进行平滑处理,得到最终的有效值信号。

s12、根据步骤s11得到的睡眠声信号最终的有效值信号,获取睡眠声信号的有声段图谱;

所述睡眠声信号的有声段图谱包括信号图、频谱图、以及语谱图;

获取有声段的信号图:信号图为有声段的信号波形图,去掉坐标,只保留图形部分;

获取有声段的频谱图:对有声段信号做离散傅里叶变换所画出的频谱图,去掉坐标,只保留图形部分,傅里叶变换如下式(1):

其中,k表示离散频率,n表示傅里叶变换的点数,n表示做傅里叶变换的点的序数,j是虚数单位,x(n)表示时域下第n个点的值;

获取有声段的语谱图:语谱图是以时间为横坐标,以频率为纵坐标所得到的声音能量分布图,以不同颜色表征不同的能量大小,去掉坐标,只保留图形部分;

获取其他时域及频域图谱,所考虑的图谱不受以上列出的图谱的任何形式的限制;

s2、使用深度学习对有声段图谱进行鼾声与非鼾声的分类,并完成对鼾声与非鼾声的自动侦测与识别,保留识别结果为鼾声的图谱及音频文件;具体包括下述步骤:

s21、确定卷积神经网络收敛方式:按照正则化后的梯度下降法收敛网络,具体利用如下公式:

w=w-ε(αw+▽wj(w;x,y))(2)

其中α为正则系数,ε为学习率,j(w,x,y)为目标函数,y为上一轮训练的输出值,w为滤波器权重;

s22、选择激活函数:线性模型解决非线性问题能力很差,在卷积神经网络中引入了激活函数来对模型加入非线性因素。基本方法是:给模型设定一个阈值,高于阈值的输出一定的值被激活,否则输出另外给定的值,经过多次激活后可以将输入转换为线性可分。常用的激活函数有:sigmod,tanh,relu以及一些对relu函数的改进型,本实施例选择如下的relu函数作为激活函数;

其中x是上一卷积层计算所得数值;

s23、选择网络输出预测结果概率函数:卷积神经网络的最终输出结果为预测概率值,需要将卷积神经网络运算得到的具体特征数值全部转化为概率,因此需要一个能实现这种功能的函数,本实施例中确定softmax函数作为输出预测结果概率函数。假设存在一个数组z,zi是其中一个元素,则

其中yi是输出识别分数;因为要将有声段图谱分为鼾声与非鼾声两类,故对每张图谱输出两个y,softmax函数的作用即把输入的类别参数zi转换成识别分数,得分最高的即为分类器输出的最终辨识结果;

s24、通过卷积神经网络训练获取其参数:使用卷积神经网络对步骤s23所分类的鼾声与非鼾声两类图谱集进行初步试训,获取卷积神经网络训练参数大致范围,参数包括:学习率初始值和学习率变化方案、l1和l2正则系数、权值初始化方式、网络层数、池化方式、激活函数、以及训练和测试批大小;

s25、根据步骤s24训练及测试所得的损失函数曲线判断训练状态,以此状态为依据对卷积神经网络训练参数进行调整,得出最终训练结果,完成对鼾声与非鼾声的自动识别,并提取出鼾声的图谱及音频文件用作后续使用。

s3、根据步骤s2获得的纯鼾声图谱及音频文件,采用如同步骤s2的深度学习对纯鼾声图谱及音频文件进行鼾声分类,完成对呼吸暂停低通气综合征鼾声的自动识别与检测;具体包括下述步骤:

s31、确定网络收敛方式为按照正则化后的梯度下降法收敛网络;

s32、选择relu函数作为激活函数;

s33、使用softmax函数作为输出预测结果概率函数;

s34、参数范围确定:将鼾声分为呼吸紊乱前鼾声、呼吸紊乱中鼾声、呼吸紊乱后鼾声以及正常鼾声四类,使用卷积神经网络对所得四类鼾声图谱集进行初步试训,获取神经网络参数大致范围,参数包括:学习率初始值和学习率变化方案、l1和l2正则系数、权值初始化方式、网络层数、池化方式、激活函数、以及训练和测试批大小等;

s35、根据步骤s34训练及测试所得的损失函数曲线判断训练状态,以此状态为依据对神经网络训练参数进行调整,得出最终训练结果,完成对四类鼾声的自动识别与检测。

s4、根据步骤s3的识别与检测结果,统计被测患者整晚四类鼾声的数量,获取被测患者整晚ahi指数,完成对被测患者整晚鼾声ahi指数的预测。

按时间顺序记录被测患者整晚四类鼾声;其中,当相邻的两次普通鼾声之间出现呼吸紊乱前鼾声、呼吸紊乱中鼾声和呼吸紊乱后鼾声中的至少一种时,将其记录为一次呼吸紊乱事件;统计每小时的呼吸紊乱事件次数,所得结果即为ahi指数。在本实施例中,将呼吸紊乱前鼾声、呼吸紊乱中鼾声、呼吸紊乱后鼾声分别记为ah1、ah2、ah3,按照信号时间顺序从左到右进行呼吸紊乱事件的判断,正常鼾声间隔一次呼吸紊乱事件包括的情形有:ah1ah3、ah1ah2ah3、ah1ah2、ah2ah3、ah1、ah2、ah3、n个ah1、n个ah2、n个ah3等;

在本实施中,一种基于深度学习的睡眠鼾声分类检测系统,包括信号提取模块、计算模块、识别模块和统计预测模块;

所述信号提取模块,用于采集被测患者整晚的睡眠声信号,根据被测者整晚的睡眠声信号,获取睡眠声信号中的有声段;

所述计算模块,用于对睡眠声的有声段信号进行计算并获取有声段的图谱;

所述识别模块,分两部分,第一部分用于使用深度学习对有声段图谱进行鼾声与非鼾声的识别分类,并完成对鼾声与非鼾声的自动侦测与识别;第二部分用于在第一部分获取的纯鼾声中,使用深度学习对四类鼾声进行识别分类,完成对呼吸暂停低通气综合征鼾声的自动识别与检测;

所述统计预测模块,用于对整晚睡眠鼾声信号进行统计,得到四类鼾声次数的统计结果,根据统计结果对ahi指数值进行预测。

在本实施例中,所述信号提取模块包括预处理单元和有效值信号门限计算单元;

所述预处理单元,用于两方面工作:(1)将采集的睡眠声信号进行预加重和分帧的预处理工作:利用一阶高通fir滤波器完成睡眠声信号的预加重,分帧时选择帧长为20ms,帧移为10ms、50%的重叠率;(2)使用谱减法和维纳滤波法相结合的方法对睡眠声信号进行降噪;

所述有效值信号门限计算单元,用于对降噪预处理后的睡眠声信号进行幅值计算,对比有声段与相对无声段的幅值差异确定有声段信号门限,所述有声段信号门限用于对有声信号段的侦测和切割。

本实施例的分类检测系统可以采用电脑软件、手机app或者带数字信号处理器的硬件模块实现。

以下为一个具体的应用实例:

选取10例广州医科大学第一附属医院经psg诊断为中重度osahs的患者。选取信号图作为识别对象,对睡眠声进行鼾声自动检测,检测到鼾声总样本数为22644个,在这些纯鼾声中共有呼吸紊乱鼾声1625个,其中呼吸紊乱前鼾声503个、呼吸紊乱中鼾声625个、呼吸紊乱后鼾声497个,呼吸紊乱鼾声数据集相对均匀,另外有普通鼾声21019个,从普通鼾声中随机挑选1532个与呼吸紊乱鼾声共同构成实施样本集。

在本应用实例中,从鼾声分类图谱中选取信号图作为识别对象,在长时间的网络参数和网络结构调整下,卷积神经网络对鼾声与非鼾声识别实现了90.54%的识别准确率,对四类鼾声同样取得了较好的识别效果。

综上所述,本发明方法及系统通过将鼾声与呼吸紊乱事件适时结合,以呼吸紊乱事件为中心,定义普通鼾声及呼吸紊乱事件相关鼾声,将整晚睡眠鼾声进行四分类,避免过多复杂的分类影响分类系统的识别效果,研究四类鼾声的特征差异,较精确的实现了四类鼾声的自动分类,利用鼾声类型及鼾声前后声音类型判断整晚呼吸紊乱事件次数来预测ahi值,为osahs患者提供数据参考。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以权利要求所述为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1