本发明属于音频信号处理,具体涉及一种基于改进的卷积神经网络的呼吸音分类检测方法。
背景技术:
1、研究表明,呼吸音与呼吸系统的生理状态及病理变化密切相关,通过对呼吸音信号的采集与分析,可为呼吸系统疾病的早期筛查、风险评估及病程随访提供重要辅助依据。在临床实践中,异常呼吸音常出现在部分呼吸系统疾病患者的胸部听诊信号中,如鼾音、喘鸣音等,其产生通常与气道狭窄、分泌物潴留等异常生理状况相关,可作为哮喘等疾病的早期提示特征之一。因此,构建一种面向呼吸音的高效、准确的自动化分类与识别技术,对于提高呼吸系统疾病的辅助诊断效率具有现实应用价值。
2、目前,临床呼吸音听诊因操作简便、成本低廉,被广泛用于支气管炎、肺炎、支气管哮喘等疾病的早期筛查。然而,传统听诊方式主要依赖医生的经验判断,具有主观性强、易漏诊误诊、难以量化及记录不便等局限性;同时,在医护人员佩戴防护装备的情况下,听诊操作也可能受到影响。为降低人工主观性并提升诊断的可量化及可追溯能力,研究人员提出了基于信号处理与机器学习的呼吸音自动识别方法。近年来,深度学习技术在医学音频分析领域得到广泛应用,结合迁移学习可有效缓解标注数据不足的问题。例如,通过对预训练的音频或视觉 transformer 模型(如 ast、vit)进行微调,可用于呼吸音分类任务。然而,随着模型规模不断增大,全量微调通常需要较高的训练与存储开销,且在小样本医学场景下易发生过拟合,影响模型部署效率与实际应用效果。
3、经专利检索发现,公开号 cn111640439a 公开了一种基于深度学习的呼吸音分类方法。该方法通过对呼吸音进行重采样、高通滤波及周期分割,并结合多种数据增强方式提取声学组合特征,最终利用深度学习分类模型实现呼吸音的自动识别。然而,该现有技术仍存在以下局限:模型结构与训练依赖特征工程及较为复杂的数据预处理流程,整体处理链路较长;深度学习模型未针对边缘设备部署进行优化,推理过程对计算资源的需求较高,不利于在便携式或实时设备中使用;未涉及硬件加速策略,难以满足临床实时听诊场景中对延迟与计算效率的要求。
4、尽管现有研究已将深度学习方法应用于呼吸音自动分类,但相关技术仍存在若干不足。首先,部分方法依赖于较为复杂的特征工程与数据预处理流程,使得整体处理链路较长,难以满足实时性要求。其次,当前常用的深度学习模型规模较大、计算量高,在资源受限的嵌入式或可穿戴设备上难以高效运行,不利于在临床听诊、家庭监测等场景中推广。
技术实现思路
1、本发明是为了解决上述现有技术中的不足之处,提出一种基于改进的卷积神经网络的呼吸音分类检测方法,以期能对不同种类呼吸音的实时采集、处理与准确分类,从而能提高检测的实时性和识别准确率,进而能可广泛应用于生物医学信号处理技术领域。
2、本发明为达到上述发明目的,采用如下技术方案:
3、本发明一种基于改进的卷积神经网络的呼吸音分类检测方法的特点在于,是按如下步骤进行:
4、s1、采集实时呼吸音信号并构成呼吸音数据集,其中,表示第个呼吸音样本,表示呼吸音样本的总数;
5、s2、对进行预处理与特征提取,得到呼吸音的倒谱图特征矩阵数据集,其中,表示对应的倒谱图特征矩阵;
6、令对应的真实类别标签集合为,其中,表示对应的真实类别标签;
7、s3、构建改进的卷积神经网络,依次包括:第一卷积块、通道注意力机制模块、第一轻量模块、第二轻量模块、第二卷积块以及分类模块,并对进行处理,得到预测类别集,其中,表示对应的预测类别;
8、s4、基于和构建交叉熵损失,并利用adam优化器对所述卷积神经网络进行训练,并计算所述交叉熵损失以更新网络参数,直至迭代次数达到最大迭代次数或交叉熵损失收敛时完成训练,从而得到训练后的最优呼吸音快速分类检测模型并部署到zynq处理系统中,用于对呼吸音种类进行判别,并将呼吸音分类结果实时显示在hdmi显示屏上。
9、本发明所述的一种基于改进的卷积神经网络的呼吸音分类检测方法的特点也在于,s2包括:
10、s2.1、对进行归一化、分帧和加窗处理,得到个连续且部分重叠的第个短时帧集合,其中,为中第个短时帧,表示分割的总帧数;
11、s2.2、对第个短时帧进行点快速傅里叶变换,得到的第个呼吸音频域特征数据,对取模后再求平方,得到中第帧的功率谱,从而得到第个功率谱序列,其中,表示中第帧的功率谱,t表示转置;
12、s2.3、构建包含个滤波器的三角滤波器组,并对进行滤波处理,从而得到个滤波器输出的频带能量{;其中,表示第个滤波器输出的的第帧频带能量;
13、计算第个滤波器输出的的校正后的第帧频带能量 ,并对进行自然对数运算,得到个滤波器输出的的第帧对数能量特征;其中,表示第个滤波器输出的的第帧对数能量特征,表示预设的非零值;
14、s2.4、按照式(1)对进行离散余弦变换,得到的第帧倒谱系数向量,从而得到第个呼吸音样本对应的倒谱图特征矩阵;其中,表示的第个短时帧经离散余弦变换得到的第个倒谱系数,为倒谱系数的维数;
15、 (1)
16、式(1)中,表示余弦计算,表示滤波器的个数,表示圆周率。
17、进一步的,s3包括:
18、s3.1、所述第一卷积块由一层卷积层、一层批归一化层、一层最大池化层以及一层relu激活层组成,并对进行处理,得到第个初始呼吸音特征;
19、s3.2、所述通道注意力机制模块对进行处理,得到第个加权后的呼吸音特征;
20、s3.3、所述第一轻量模块对进行处理,得到第个呼吸音中层特征;
21、s3.4、所述第二轻量模块按照s3.3的过程对进行处理,得到第个呼吸音高层卷积特征;
22、s3.5、所述第二卷积块包括:一层最大池化层、一层卷积层及一层relu激活层,并依次对进行处理,得到第个呼吸音深层特征;
23、s3.6、所述分类模块包括:一层全连接层和softmax层,并依次对进行处理,得到对应的预测类别。
24、进一步的,s3.2包括:
25、s3.2.1、按照式(2)对进行全局特征汇聚操作,得到第个通道描述特征;
26、 (2)
27、式(2)中,maxpooling和averagepooling分别表示全局平均池化操作和全局最大值池化操作,代表元素相加,表示2个自适应融合权重,并有:
28、 (3)
29、式(3)中,表示中任一自适应融合权重;表示对应的权重和偏置参数,concat表示拼接操作;
30、s3.2.2、将依次经过第一映射层、relu激活层以及第二映射层的处理,得到第个预加权通道特征;
31、s3.2.3、对进行非线性映射,生成第个通道注意力权重系数;
32、s3.2.4、将扩展至与的尺寸一致,得到第个扩展后的通道注意力权重系数;
33、s3.2.5、将与相乘后,得到第个加权后的特征;
34、进一步的,s3.3包括:
35、s3.3.1、利用通道压缩单元对进行处理,得到第个压缩后的特征;
36、s3.3.2、利用两个具有不同卷积核大小的特征扩展单元分别对进行处理,相应得到第个呼吸音扩展后的第一特征和第个呼吸音扩展后的第二特征;
37、s3.3.3、将和进行融合后,得到第个呼吸音中层特征。
38、本发明一种电子设备,包括存储器及处理器的特点在于,所述存储器用于存储支持处理器执行所述基于改进的卷积神经网络的呼吸音分类检测方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。
39、本发明一种计算机可读存储介质, 计算机可读存储介质上存储有计算机程序的特点在于,所述计算机程序被处理器运行时执行所述基于改进的卷积神经网络的呼吸音分类检测方法的步骤。
40、与已有技术相比,本发明的有益效果在于:
41、1. 本发明采用改进的卷积神经网络实现呼吸音分类,能够直接从原始呼吸音信号中自动学习具有判别性的特征表示,避免了传统依赖人工特征提取方法所带来的局限性;通过综合挖掘呼吸音信号中的关键信息,提高了特征区分度,从而提升了呼吸音分类的准确率和稳定性,适用于复杂多变的临床音频环境。
42、2、本发明在所述改进的卷积神经网络中引入注意力机制模块,对呼吸音特征中不同通道的重要性进行自适应建模,并结合第一轻量模块和第二轻量模块进行逐层特征提取,增强了模型对不同类别呼吸音信号特征差异的感知能力,使模型在面对个体差异、微小波动或环境噪声干扰时仍能保持良好的鲁棒性和适应性。
43、3. 本发明通过对网络结构进行轻量化设计,并结合硬件加速机制,在保证分类性能的同时有效降低了模型的计算复杂度和存储资源占用,提高了模型的部署灵活性,使其能够在资源受限的嵌入式设备等应用场景中高效运行。