本技术涉及信息处理,尤其涉及一种模型训练方法、鼾声识别方法及相关设备。
背景技术:
1、鼾声是入睡后伴随着呼吸发出的呼吸粗鸣声。人在睡眠状态下,咽喉部肌肉松弛,咽喉部组织塌陷等等因素会造成上呼吸道出现通气不畅或阻塞。当呼吸气流受到阻碍,呼吸道软组织产生振动,继而发出声音。
2、在疾病诊断、睡眠环境调节等场景下,识别用户鼾声是非常重要的一步,然而现有的鼾声识别方法存在着识别准确性较低的问题。
技术实现思路
1、本技术实施例提供一种模型训练方法、鼾声识别方法及相关设备,可解决现有的鼾声识别方法对于鼾声的识别准确性较低的问题。
2、第一方面,本技术实施例提供了一种模型训练方法,该方法包括:
3、获取第一训练数据集,其中,所述第一训练数据集包括n个声音样本以及与所述n个声音样本一一对应的n个第一标签,所述第一标签用于指示对应的声音样本是否为鼾声,n为大于1的整数;
4、基于所述第一训练数据集,对预设模型进行训练,得到第一模型,并获取所述预设模型在所述训练过程中对于所述n个声音样本进行鼾声检测所输出的n个检测结果;
5、将所述n个检测结果和所述n个第一标签进行比对,获取所预设模型识别错误的t个检测结果,t为小于或等于n的正整数;
6、基于所述t个检测结果确定第二训练数据集,其中,所述t个检测结果对应的声音样本在所述第二训练数据集中所占的样本比例大于预设比例;
7、基于所述第二训练数据集对所述第一模型进行训练,得到鼾声识别模型。
8、可选地,所述将所述n个检测结果和所述n个第一标签进行比对,获取所预设模型识别错误的t个检测结果,包括:
9、按照所述n个声音样本各自对应的频率,将所述n个声音样本划分至m个频率区间,其中,m为小于或等于n的正整数;
10、基于所述n个检测结果和所述n个第一标签,从所述m个频率区间中确定至少一个硬负样本区间,其中,所述硬负样本区间为所述m个频率区间中,所述预设模型对于区间内的声音样本的检测错误率大于预设错误率阈值的区间,所述检测错误率基于对应的区间内的声音样本所对应的检测结果和第一标签确定,所述t个检测结果为所述硬负样本区间包括的声音样本所对应的检测结果。
11、可选地,所述基于所述n个检测结果和所述n个第一标签,从所述m个频率区间中确定至少一个硬负样本区间,包括:
12、从所述n个检测结果和所述n个第一标签中,确定与目标频率区间对应的l个检测结果和l个第一标签,其中,所述目标频率区间为所述m个频率区间中的任一区间,所述l个检测结果为所述目标频率区间包含的l个声音样本对应的检测结果,所述l个第一标签为所述目标频率区间包含的l个声音样本对应的第一标签,l为小于n的正整数;
13、将所述l个检测结果中,与所述l个目标标签不一致的检测结果占所述l个检测结果的比例,确定为所述目标频率区间对应的检测错误率;
14、在所述目标频率区间对应的检测错误率大于所述预设错误率阈值的情况下,将所述目标频率区间确定为所述硬负样本区间。
15、第二方面,本技术实施例还提供一种鼾声识别方法,所述方法包括:
16、采集待检测声音样本;
17、将所述待检测声音样本输入至鼾声识别模型进行鼾声识别,得到所述鼾声识别模型输出的鼾声识别结果,所述鼾声识别模型为根据上述第一方面所述模型训练方法得到的模型。
18、可选地,所述采集待检测声音样本,包括:
19、采集待检测环境的背景噪声能量;
20、基于所述背景噪声能量,确定环境感知动态阈值,其中,所述环境感知动态阈值的大小与所述背景噪声能量的大小呈反比;
21、将所述待检测环境内噪声能量大于所述环境感知动态阈值的声音样本确定为所述待检测声音样本。
22、可选地,所述基于所述背景噪声能量,确定环境感知动态阈值,包括:
23、获取p个预设噪声能量区间,其中,所述p个预设噪声能量区间与p个预设基础阈值一一对应,所述p个预设噪声能量区间与p个动态系数一一对应;
24、基于所述背景噪声能量在所述p个预设噪声能量区间中所处的区间,从所述p个预设基础阈值和所述p个动态系数中分别确定所述背景噪声能量所对应的目标阈值和目标系数;
25、获取所述背景噪声能量在所述p个预设噪声能量区间中所处的区间的噪声能量起始值;
26、将所述背景噪声能量和所述噪声能量起始值的差值,确定为第一参数;
27、将所述第一参数和所述目标系数的乘积,确定为第二参数;
28、将所述第二参数和所述目标阈值之和,确定为所述环境感知动态阈值。
29、可选地,所述采集待检测环境的背景噪声能量,包括:
30、按照预设时间窗,连续采集所述待检测环境的多段第一背景噪声;
31、分别对每一段所述第一背景噪声去除设备底噪,得到多段第二背景噪声,其中,所述设备底噪为采集所述多段第一背景噪声的设备对应的底噪;
32、分别对每一段所述第二背景噪声去除第一噪声和第二噪声,得到多段第三背景噪声,其中,所述第一噪声为所述第二背景噪声中对应的分贝小于第一分贝阈值的噪声,所述第二噪声为所述第二背景噪声中对应的分贝大于第二分贝阈值的噪声;
33、将所述多段第三背景噪声的平均噪声能量,确定为所述背景噪声能量。
34、第三方面,本技术实施例还提供一种模型训练装置,所述装置包括:
35、获取模块,用于获取第一训练数据集,其中,所述第一训练数据集包括n个声音样本以及与所述n个声音样本一一对应的n个第一标签,所述第一标签用于指示对应的声音样本是否为鼾声,n为大于1的整数;
36、第一训练模块,用于基于所述第一训练数据集,对预设模型进行训练,得到第一模型,并获取所述预设模型在所述训练过程中对于所述n个声音样本进行鼾声检测所输出的n个检测结果;
37、对比模块,用于将所述n个检测结果和所述n个第一标签进行比对,获取所预设模型识别错误的t个检测结果,t为小于或等于n的正整数;
38、第一确定模块,用于基于所述t个检测结果确定第二训练数据集,其中,所述t个检测结果对应的声音样本在所述第二训练数据集中所占的样本比例大于预设比例;
39、第二训练模块,用于基于所述第二训练数据集对所述第一模型进行训练,得到鼾声识别模型。
40、第四方面,本技术实施例还提供一种鼾声识别装置,所述装置包括:
41、采集模块,用于采集待检测声音样本;
42、识别模块,用于将所述待检测声音样本输入至鼾声识别模型进行鼾声识别,得到所述鼾声识别模型输出的鼾声识别结果,所述鼾声识别模型为根据上述第一方面所述的模型训练方法得到的模型。
43、第五方面,本技术实施例还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面所述的模型训练方法的步骤,或者实现如第二方面所述的鼾声识别方法的步骤。
44、第六方面,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的模型训练方法的步骤,或者实现如第二方面所述的鼾声识别方法的步骤。
45、第七方面,提供一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如第一方面所述的模型训练方法的步骤,或者实现如第二方面所述的鼾声识别方法的步骤。
46、本技术实施例中,利用第一训练数据集对预设模型进行训练,得到第一模型,并获取预设模型识别错误的t个检测结果,根据t个检测结果来生成第二训练数据集,其中,扩大t个检测结果对应的声音样本在所述第二训练数据集中的样本比例,使其大于预设比例。利用第二训练数据集来对第一模型进行训练,能够提高所得到的鼾声识别模型对于t个检测结果对应的声音样本识别能力,从而使得鼾声识别模型对于各种类型的声音样本都具备较强的识别能力,因此,通过所述鼾声识别模型来识别鼾声,可提高鼾声的识别准确性。