本公开涉及心音识别,具体而言,涉及一种心音识别方法、装置、电子设备及存储介质。
背景技术:
1、心音信号是人体最重要的生理信号之一,应用于听诊辅助治疗已经有了相当悠久的历史。心音信号含有大量的心脏功能状态的生理信息,具备普遍性、独特性和可采集性的特征。
2、现有的心音识别方法大多是直接将单一特征例如mfcc、fbank等声学特征输入到单一的分类网络进行识别,该方法在理想环境下采集的心音数据集上有较高的准确率,但是在实际场景下,采集的心音信号往往包含各种类型的噪声,例如环境音、设备音、呼吸音、说话声等,所以导致现有的心音分类算法在实际场景下的分类准确率下降严重,同时,单一的声学特征和单一的心音识别模型导致目前的心音识别算法的鲁棒性较差。
技术实现思路
1、本公开实施例至少提供一种心音识别方法、装置、电子设备及存储介质,采用多特征、多模型、多融合的方式提高模型的鲁棒性,提升心音分类的准确率。
2、本公开实施例提供了一种心音识别方法,包括:
3、获取原始心音信号;
4、提取所述原始心音信号对应的mfcc特征与gfcc特征,并将所述mfcc特征与所述gfcc特征融合生成目标融合特征;
5、划分所述目标融合特征为多个特征片段,针对每个所述特征片段,分别输入该特征片段至预先训练好的crnn模型与resnet18模型;
6、分别确定所述crnn模型与所述resnet18模型针对所述特征片段输出的心音分类结果中,归属于每个心音类别的片段数占片段总数的比例系数,以及所述特征片段对应每个所述心音类别的概率得分;
7、根据所述概率得分与所述比例系数,确定融合判决得分,并将所述crnn模型对应的所述融合判决得分以及所述resnet18模型对应的所述融合判决得分加权求和,确定目标判决得分;
8、将所述目标判决得分的最大值对应的列作为目标心音识别结果。
9、一种可选的实施方式中,在所述提取所述原始心音信号对应的mfcc特征与gfcc特征之前,所述方法还包括:
10、确定所述原始心音信号对应的原始分贝值;
11、根据预设期望分贝值与所述原始分贝值,确定音频增益调节因子;
12、根据所述音频增益调节因子针对所述原始心音信号进行增益调节,确定增益调节后的所述原始心音信号。
13、一种可选的实施方式中,根据预设期望分贝值与所述原始值,确定音频增益调节因子,具体包括:
14、确定使所述原始分贝值达到所述预设期望分贝值的分贝调节因子;
15、将所述预设期望分贝值作为增益调节后输出的实际分贝值,根据所述原始分贝值与所述分贝调节因子,确定增益调节前后心音信号对应的分贝增益变化;
16、根据所述分贝增益变化,确定所述音频增益调节因子。
17、一种可选的实施方式中,在所述获取原始心音信号之后,所述方法还包括:
18、针对所述原始心音信号进行降噪处理,确定降噪心音信号;
19、针对所述降噪心音信号进行分帧与加窗后,确定每帧所述降噪心音信号对应的短时平均能量以及短时过零率;
20、根据所述短时平均能量以及短时过零率,设定高能量阈值以及预设低能量阈值,将所述降噪心音信号划分为静音段、过渡段以及语音段;
21、过滤位于所述降噪心音信号两端的所述静音段。
22、一种可选的实施方式中,所述确定所述原始心音信号对应的原始分贝值,具体包括:
23、确定所述原始心音信号对应的序列长度以及序列均方根;
24、确定所述序列均方根对应的均方根序列长度;
25、确定所述原始心音信号对应的最大振幅值;
26、根据所述序列长度、所述序列均方根、所述均方根序列长度以及所述最大振幅值,确定所述原始分贝值。
27、一种可选的实施方式中,在所述根据所述音频增益调节因子针对所述原始心音信号进行增益调节,确定增益调节后的所述原始心音信号之后,所述方法还包括:
28、根据预设的采样率阈值,针对增益调节后的所述原始心音信号进行降采样;
29、将降采样后的所述原始心音信号输入至预设的带通滤波器,过滤包含的底噪信号。
30、本公开实施例还提供一种心音识别装置,包括:
31、获取模块,用于获取原始心音信号;
32、特征融合模块,用于提取所述原始心音信号对应的mfcc特征与gfcc特征,并将所述mfcc特征与所述gfcc特征融合生成目标融合特征;
33、特征划分模块,用于划分所述目标融合特征为多个特征片段,针对每个所述特征片段,分别输入该特征片段至预先训练好的crnn模型与resnet18模型;
34、分数判别模块,用于分别确定所述crnn模型与所述resnet18模型针对所述特征片段输出的心音分类结果中,归属于每个心音类别的片段数占片段总数的比例系数,以及所述特征片段对应每个所述心音类别的概率得分;
35、联合判决模块,用于根据所述概率得分与所述比例系数,确定融合判决得分,并将所述crnn模型对应的所述融合判决得分以及所述resnet18模型对应的所述融合判决得分加权求和,确定目标判决得分;
36、识别结果确定模块,用于将所述目标判决得分的最大值对应的列作为目标心音识别结果。
37、一种可选的实施方式中,所述装置还包括音频增益控制模块,所述音频增益控制模块用于:
38、确定所述原始心音信号对应的原始分贝值;
39、根据预设期望分贝值与所述原始分贝值,确定音频增益调节因子;
40、根据所述音频增益调节因子针对所述原始心音信号进行增益调节,确定增益调节后的所述原始心音信号。
41、本公开实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述心音识别方法,或上述心音识别方法中任一种可能的实施方式中的步骤。
42、本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述心音识别方法,或上述心音识别方法中任一种可能的实施方式中的步骤。
43、本公开实施例还提供一种计算机程序产品,包括计算机程序/指令,该计算机程序、指令被处理器执行时实现上述心音识别方法,或上述心音识别方法中任一种可能的实施方式中的步骤。
44、本公开实施例提供的一种心音识别方法、装置、电子设备及存储介质,通过获取原始心音信号;提取原始心音信号对应的mfcc特征与gfcc特征,并将mfcc特征与gfcc特征融合生成目标融合特征;划分目标融合特征为多个特征片段,针对每个特征片段,分别输入该特征片段至预先训练好的crnn模型与resnet18模型;分别确定crnn模型与resnet18模型针对特征片段输出的心音分类结果中,归属于每个心音类别的片段数占片段总数的比例系数,以及特征片段对应每个心音类别的概率得分;根据概率得分与比例系数,确定融合判决得分,并将crnn模型对应的融合判决得分以及resnet18模型对应的融合判决得分加权求和,确定目标判决得分;将目标判决得分的最大值对应的列作为目标心音识别结果。采用多特征、多模型、多融合的方式提高模型的鲁棒性,提升心音分类的准确率。
45、为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。