一种基于时频相似性的鼾声检测方法及装置与流程

文档序号：12045108阅读：188来源：国知局

本发明属于声音信号检测技术领域，具体而言，涉及一种基于时频相似性的鼾声检测方法及装置。

背景技术：

阻塞性呼吸暂停综合征(OSAHS)发病率约为3％-4％，临床上称之为“鼾症”。OSAHS严重影响患者的生活质量，易造成学习记忆能力减退，工作效率低下，交通事故频发以及内分泌及内皮系统的紊乱，极端情况下，易引发由夜间呼吸不足和心脑血管疾病引发的猝死。因此鼾声信号的检测对于睡眠过程的跟踪，睡眠质量的判断都有非常重要的意义。

而现有的鼾声信号检测一般利用多导睡眠图监测系统，这种方式设备复杂且极昂贵，“侵入式”的监测极易造成身体不适。而众多简易OSAHS诊断方法中，利用鼾声信号进行检测的相关研究较多。此外，现有的鼾声检测技术在处理真实场景中的录音数据时，存在以下缺点：一、依赖于特征的有效性和分类模型的可靠性，且现有技术中常用特征的提取过程非常复杂，运算成本较高，难以满足硬件实现和实时检测的需求；分类模型的可靠性依赖于大量有着良好标注信息的鼾声数据，这在真实场景中是很难获取的；二、逐帧提取特征的方法忽略了鼾声在更长的时间跨度内的周期性，方法的有效性难以泛化到大多数的鼾声。

技术实现要素：

为解决上述技术缺陷，本发明直接使用有声片段内的平均频谱能量和时域能量作为特征，使用相邻两个有声片段的时频相似性进行鼾声的检测，降低了运算成本，易满足硬件实现和实时检测的需求；同时，本发明忽略了鼾声的短时变化，而是从鼾声在长时间内的周期性出发去检测鼾声，不需要对鼾声数据的良好标注，且能够适应大多数的鼾声情形。

本发明提供了一种基于时频相似性的鼾声检测方法，包括如下步骤：

获取采集的鼾声音频信号，对鼾声音频信号进行噪声估计后利用端点检测技术进行有声片段提取；

计算当前有声片段与上一个有声片段的时域能量或频域能量的欧式距离，将欧式距离与阈值进行比较，根据比较结果判断鼾声状态。

进一步，所述获取采集的鼾声音频信号，对鼾声音频信号进行噪声估计后利用端点检测技术进行有声片段提取包括

获取鼾声音频信号的起始点；

判断起始点是否有声音信号，有则将起始时间作为有声判断起始点，并判断有声片段持续时间内是否满足无声判断条件，是则获取无声片段持续时间，否则获取有声片段的结束点。

进一步，所述获取采集的鼾声音频信号，对鼾声音频信号进行噪声估计后利用端点检测技术进行有声片段提取还包括

如果起始端点没有声音信号，则将起始时间作为无声判断起始点，并判断无声片段中是否满足有声判断的条件，是则获取有声片段持续时间，否则获取无线片段的结束点。

进一步，所述计算当前有声片段与上一个有声片段的时域能量或频域能量的欧式距离，将欧式距离与阈值进行比较，根据比较结果判断鼾声状态包括

获取每个有声片段的持续时间，计算所有有声片段的评价持续时间后计算平均时间内有声片段的平均频域能量；

按照时间顺序将有声片段进行排列，获取对应的有声片段的时域能量序列；

计算当前有声片段与前、后两个有声片段时域能量的欧式距离并与阈值进行比较，判断当前有声片段与前、后两个有声片段的欧式距离是否均不小于阈值，是则判断当前有声片段为鼾声片段。

本发明还提供了一种基于时频相似性的鼾声检测装置，包括

片段提取模块，用于获取采集的鼾声音频信号，对鼾声音频信号进行噪声估计后利用端点检测技术进行有声片段提取；

鼾声判断模块，用于计算当前有声片段与上一个有声片段的时域能量或频域能量的欧式距离，将欧式距离与阈值进行比较，根据比较结果判断鼾声状态。

进一步，片段提取模块包括

起始子模块，用于获取鼾声音频信号的起始点；

片段判断子模块，用于判断起始点是否有声音信号，有则将起始时间作为有声判断起始点，并判断有声片段持续时间内是否满足无声判断条件，是则获取无声片段持续时间，否则获取有声片段的结束点；

或，

进一步，鼾声判断模块包括

频域特征提取单元，用于获取每个有声片段的持续时间，计算所有有声片段的评价持续时间后计算平均时间内有声片段的平均频域能量；

时域特征提取单元，用于按照时间顺序将有声片段进行排列，获取对应的有声片段的时域能量序列；

判别单元，用于计算当前有声片段与前、后两个有声片段时域能量的欧式距离并与阈值进行比较，判断当前有声片段与前、后两个有声片段的欧式距离是否均不小于阈值，是则判断当前有声片段为鼾声片段。

综上，本发明以有声片段的平均频谱能量和时域能量为特征，使用相邻两个有声片段的时频相似性进行鼾声的检测，降低了运算成本，满足了硬件实现和实时检测的需求；同时本发明忽略了鼾声的短时变化，从鼾声在长时间内的周期性出发去检测鼾声，不需要对鼾声数据的良好标注，且能够适应大多数的鼾声情形。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1为本发明所述的基于时频相似性的鼾声检测方法的流程示意图；

图2为本发明所述的基于时频相似性的鼾声检测方法中有声片段及无声片段判断的的流程示意图；

图3为本发明所述的基于时频相似性的鼾声检测装置的框图结构示意图。

具体实施方式

为了使本领域的技术人员更好地理解本发明的技术方案，下面将结合附图对本发明作进一步的详细介绍。

下面通过具体的实施例并结合附图对本发明做进一步的详细描述。

如图1所示，一种基于时频相似性的鼾声检测方法，包括如下步骤：

S101、获取采集的鼾声音频信号，对鼾声音频信号进行噪声估计后利用端点检测技术进行有声片段提取；

本发明使用最优滤波器和最小统计量方法来进行鼾声音频信号的噪声估计，具体实施时，假设鼾声音频信号中只包含鼾声信号P和噪声N，且鼾声的吸气过程中鼾声信号P接近0，可以将鼾声信号递归的表示成下式：

P(t)＝αP(t-1)+(1-α)(P(t)+N(t))

其中，α为音频信号的平滑因子，随着时间的推移，使用最小统计量的方法来估计新的α，然后使用上述公式来估计噪声强度N，α的计算公式如下：

本发明使用一种基于信噪比的贝叶斯模型来进行鼾声音频信号的端点检测，噪声强度由前述噪声估计方法得到，信号强度可以直接统计鼾声音频信号的幅值，最后验证信噪比的计算公式如下：

端点检测过程中，先验信噪比的估计使用α＝0.96来进行平滑，假设有声片段为H₁，无声片段为H₀，端点检测的计算公式如下，当下式计算结果大于4且后验信噪比大于5的时候，即判断为有声，否则判断为无声。

S102、计算当前有声片段与上一个有声片段的时域能量或平均频域能量的欧式距离，将欧式距离与阈值进行比较，根据比较结果判断鼾声状态。

本发明在对鼾声音频信号的有声片段提取模块中，提取到的有声片段长度至少在0.5秒以上，对于鼾声在有声片段内部的细微变化并不敏感，而是直接使用平均的时域和频域能量进行相似性的计算，因此并不需要保存每帧声音信号的频谱细节，也不需要逐帧分析信号的相关性质，大大降低了存储和时间的消耗，进而降低了鼾声状态判断的成本，适合在低功耗资源受限的终端运行。同时，传统的基于分类的鼾声检测技术需要大量的有着良好标注信息的鼾声数据来进行有监督的学习，这种数据很难获取而且不具备良好的泛化能力，本发明使用有声片段的相似性进行鼾声状态的判断，避免了对标注数据的依赖，降低了数据获取的成本。

如图所示，进一步S101包括

获取鼾声音频信号的起始点；

判断起始点是否有声音信号，有则将起始时间作为有声判断起始点，并判断有声片段持续时间内是否满足无声判断条件，是则获取无声片段持续时间，否则获取有声片段的结束点。更进一步，S101还包括如果起始端点没有声音信号，则将起始时间作为无声判断起始点，并判断无声片段中是否满足有声判断条件，是则获取有声片段持续时间，否则获取无线片段的结束点。

具体实施时，有声判断条件可选的包括是否静音且有声片段长度是否小于预设的长度；无声判断条件可选的包括是否有声音且无声片段长度小于阈值；具体实施时，有声片段的长度可选(即最短时间)设为0.5秒，无声片段的长度(即最短持续时间)可选的设为0.05秒。

本发明首先对鼾声音频信号进行噪声估计，利用端点检测技术对鼾声音频信号进行检测，即起始信号端点检测判断该起始点是否有声，有则确定为有声片段开始点，否则确定为无声片段开始点，再按照有声判断条件、无声判断条件分别判断无声片段持续时间内、有声片段持续内是否包括有声片段、无声片段，进而获取有声或无形片段的结束点。具体实施时，对鼾声音频信号进行分析的判断条件为当前帧的端点检测结果为静音还是有声，以及当前的有声片段或无声片段持续长度是否超过阈值。本发明的目的在于判断有声片段是否为鼾声片段，因此若当前帧的声音状态被判断为“有声片段开始”或者“有声片段持续”，则对当前有声片段进行时频能量更新计算相似度；而若当前帧的声音状态被判断为“无声片段持续”且无声片段长度超过阈值，则对前一个有声片段进行鼾声的检测。

进一步，S102包括

获取每个有声片段的持续时间，计算所有有声片段的评价持续时间后计算平均时间内有声片段的平均频域能量；

按照时间顺序将有声片段进行排列，获取对应的有声片段的时域能量序列；

如图3所示，本发明还提供了一种基于时频相似性的鼾声检测装置，包括片段提取模块10、鼾声判断模块20。

其中，

片段提取模块10，用于获取采集的鼾声音频信号，对鼾声音频信号进行噪声估计后利用端点检测技术进行有声片段提取；具体实施时，鼾声音频信号可选的利用移动设备(如手机、pad、笔记本)、专用的睡眠医疗设备或声音采集设备等装置采集人体睡眠声音。本发明利用常规的设备采集声音降低了声音采集的成本，同时利用本发明所述的片段提取模块对采集的鼾声音频信号进行有声片段的提取，避免了使用专用的多导睡眠图监测系统的成本。

鼾声判断模块20，用于计算当前有声片段与上一个有声片段的时域能量或频域能量的欧式距离，将欧式距离与阈值进行比较，根据比较结果判断鼾声状态。

进一步，片段提取模块包括

起始子模块，用于获取鼾声音频信号的起始点；

片段判断子模块，用于判断起始点是否有声音信号，有则将起始时间作为有声判断起始点，并判断有声片段持续时间内是否满足无声判断条件，是则获取无声片段持续时间，否则获取有声片段的结束点；或，如果起始端点没有声音信号，则将起始时间作为无声判断起始点，并判断无声片段中是否满足有声判断的条件，是则获取有声片段持续时间，否则获取无线片段的结束点。

进一步，鼾声判断模块包括

频域特征提取单元，用于获取每个有声片段的持续时间，计算所有有声片段的评价持续时间后计算平均时间内有声片段的平均频域能量；

时域特征提取单元，用于按照时间顺序将有声片段进行排列，获取对应的有声片段的时域能量序列；

以上只通过说明的方式描述了本发明的某些示范性实施例，毋庸置疑，对于本领域的普通技术人员，在不偏离本发明的精神和范围的情况下，可以用各种不同的方式对所描述的实施例进行修正。因此，上述附图和描述在本质上是说明性的，不应理解为对本发明权利要求保护范围的限制。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：竹东翔
技术所有人：赛博龙科技（北京）有限公司
我是此专利的发明人

上一篇：一种高通过性OCT成像导管的制作方法与工艺
上一篇：一种医用智能手环和医用智能监护系统及方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。