咳嗽检测模型训练方法、咳嗽检测方法及咳嗽检测装置与流程

文档序号:29933518发布日期:2022-05-07 13:13阅读:131来源:国知局
咳嗽检测模型训练方法、咳嗽检测方法及咳嗽检测装置与流程

1.本技术涉及人工智能技术领域,尤其涉及一种咳嗽检测模型训练方法、咳嗽检测方法及咳嗽检测装置。


背景技术:

2.临床上,咳嗽是患者向医生报告的常见症状,是呼吸系统疾病的征兆,通过病人的咳嗽情况可以反映病人的身体状况或者病人病情的恢复情况。检测评估咳嗽发生的频率、强度以及咳嗽患者身体尽可能多的健康数据可为医生提供宝贵的临床资料有利于医生对病人的病情做出及时、全面的诊断和治疗,也可作为治疗效果评估的依据。
3.在目前的咳嗽检测领域,常用技术手段只单独记录声音信号,由于监测信号单一且会同时将说话、打黔、外界汽车、音响等声音信号也加以记录,仅使用咳嗽声音信号进行识别,容易被周围环境中类似咳嗽的声音干扰,识别准确率低,可靠性低,对分析人员要求高,耗时长,不利于医生对咳嗽患者的病情及病情轻重的综合判定,严重影响了医生的诊断与治疗决策。


技术实现要素:

4.本技术提供一种咳嗽检测模型训练方法、咳嗽检测方法及咳嗽检测装置,以解决现有咳嗽检测技术中咳嗽检测准确率低、可靠性低、对分析人员耗时长的技术问题。
5.第一方面,提供一种咳嗽检测模型训练方法,所述方法包括:
6.获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态;
7.对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号;
8.对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特征用于表征所述咳嗽样本信号的最高幅值;
9.根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
10.第二方面,提供一种咳嗽检测方法,所述方法包括:
11.获取用户的待识别咳嗽信号;
12.将所述待识别咳嗽信号输入至目标咳嗽检测模型,所述目标咳嗽检测模型经过如第一方面所述的咳嗽检测模型训练方法训练得到;
13.通过所述目标咳嗽检测模型输出与所述待识别咳嗽信号对应的咳嗽或非咳嗽的
检测结果。
14.第三方面,提供一种咳嗽检测模型训练装置,所述装置包括:
15.样本获取模块,用于获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态;
16.有效样本提取模块,用于对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号;
17.特征提取模块,用于对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特征用于表征所述咳嗽样本信号的最高幅值;
18.模型训练模块,用于根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
19.第四方面,提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
20.获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态;
21.对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号;
22.对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特征用于表征所述咳嗽样本信号的最高幅值;
23.根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
24.第五方面,提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
25.获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态;
26.对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号;
27.对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特
征用于表征所述咳嗽样本信号的最高幅值;
28.根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
29.本技术可以实现如下有益效果:获取用户的咳嗽样本信号后,通过对声音样本信号和肌电样本信号进行有效样本提取,通过肌电样本信号对声音样本信号进行约束,能够准确的从声音样本信号中得到与肌电样本信号在时域上存在信号重叠的声音样本信号,剔除与肌电样本信号不匹配的声音样本信号,降低假阳性出现的概率。通过对有效咳嗽样本信号进行特征提取,得到与咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征,能够充分考虑咳嗽通过声门爆发出来的过程在能量上与非咳嗽及周围环境音相比存在的差异,并充分考虑到信号频率区别较小难以识别的情况,实现对咳嗽信号的增强,获得高质量数据。通过基于峰值特征、梅尔频率倒谱系数特征、能量特征进行模型训练,也就是使用高质量数据对模型进行训练,能大大提升训练后模型识别的准确率与可信度,降低对分析人员的要求,并提升分析人员的工作效率。
附图说明
30.图1为本技术实施例提供的一种咳嗽检测装置的结构示意图;
31.图2为本技术实施例提供的一种咳嗽检测模型训练方法的流程示意图;
32.图3为本技术实施例提供的一种咳嗽检测模型训练方法的流程示意图;
33.图4为本技术实施例提供的一种咳嗽检测模型训练方法的流程示意图;
34.图5为本技术实施例提供的一种咳嗽检测模型训练方法的流程示意图;
35.图6为本技术实施例提供的一种咳嗽检测方法的流程示意图;
36.图7为本技术实施例提供的一种咳嗽检测模型训练装置的结构示意图;
37.图8为本技术实施例提供的一种咳嗽检测装置的结构示意图;
38.图9为本技术实施例提供的一种计算机设备的结构示意图。
具体实施方式
39.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。
40.本技术的技术方案可适用于咳嗽检测的各种场景,具体的,本技术的技术方案适用于在咳嗽检测场景中通过咳嗽检测模型检测用户声音中包含的咳嗽声音与非咳嗽声音。在实际应用中,可以训练出具有咳嗽检测功能的咳嗽检测模型,通过训练好的咳嗽检测模型对该场景的用户声音进行检测,从而确定该用户声音中的咳嗽声音与非咳嗽声音。
41.本技术的技术方案可以应用于咳嗽检测装置,通过咳嗽监测装置的传感器获取用户的待识别咳嗽信号,然后通过应用于咳嗽检测装置的咳嗽检测模型对待识别咳嗽信号进行检测,确定出待识别咳嗽信号中包含的咳嗽声音与非咳嗽声音。
42.为便于理解本技术的技术方案,先对本技术中咳嗽检测模型可以适用的咳嗽检测装置进行介绍。如图1所示,该咳嗽检测装置包括咳嗽检测装置本体10、第一电极20、第二电极30、第三电极40以及声音采集装置50。其中,第一电极20、第二电极30、第三电极40以及声音采集装置50均与所述咳嗽检测装置本体10连接。在实际应用中,第一电极20为n极、第二电极30为p极,使用时,n极位于6~7根肋骨之间和肋骨中垂线的交点靠近心脏一侧,p极位
于6~7根肋骨之间和肋骨中垂线的交点,第三电极40位于右腿驱动,具体的,右腿驱动位于人体腹腔位置;声音采集装置50为麦克风,位于衣领下方位置,放置时以不易被触碰或者遮挡为原则。可以理解的,第一电极20、第二电极30以及第三电极40还可以是其它可以采集用户肌电信号的传感器或装置,声音采集装置50是其它可以采集用户声音信号的传感器或装置;第一电极20、第二电极30、第三电极40以及声音采集装置50可以通过导线与咳嗽检测装置本体10连接,也可以通过wifi、蓝牙等其它无线连接的方式与咳嗽检测装置本体10连接。
43.在实际应用中,对于上述咳嗽检测装置,开启咳嗽检测装置的电源后,咳嗽检测装置的信号灯闪烁,咳嗽检测装置进入工作状态。声音采集装置50采集用户的声音信号并发送给咳嗽检测装置本体10,第一电极20、第二电极30以及第三电极40采集用户的肌电信号并发送给咳嗽检测装置本体10,咳嗽检测装置本体10接收到用户的声音信号与肌电信号后将声音信号与肌电信号保存为二进制文件,然后将通过咳嗽检测模型对声音信号与肌电信号进行检测,从而确定出用户的咳嗽声音与非咳嗽声音。
44.在一个实施例中,如图2所示,本技术提出一种咳嗽检测模型训练方法,所述方法包括:
45.步骤201,获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态。
46.其中,通过声音采集装置采集用户的声音信号,通过肌电采集装置采集用户的肌电信号。采集到声音信号与肌电信号后,咳嗽检测装置会先将声音信号与肌电信号保存为二进制文件存储。在进行模型训练时,会从存储数据库中提取出二进制文件,然后利用预设的编码规则对二进制文件进行编码处理,得到声音样本信号和肌电样本信号,声音样本信号和肌电样本信号共同组成用户的咳嗽样本信号,得到咳嗽样本信号后便可对咳嗽检测模型进行训练。具体的,声音采集装置可以是如图1所述的声音采集装置50,肌电采集装置可以是如图1所述的第一电极20、第二电极30以及第三电极40。
47.其中,在获取到用户的咳嗽样本信号后,将咳嗽样本信号打上用于指示咳嗽样本信号对应的咳嗽状态的样本标签。具体的,咳嗽样本信号对应的咳嗽状态包括咳嗽与非咳嗽。
48.步骤202,对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号。
49.其中,人体的肌电反应这一生理现象通过肌电信号采集,可以表征为肌电信号。具体的,人体不咳嗽时的肌电信号与咳嗽时的肌电信号具有明显的差异。通过肌电信号对声音信号进行约束,能够准确的从声音信号中得到咳嗽时的声音信号,也就是有效咳嗽信号。因此,在通过咳嗽样本信号对咳嗽检测模型进行训练之前,可以对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号。具体的,有效咳嗽样本信号是在所述肌电样本信号的约束下,从所述声音样本信号中提取出的与所述肌电样本信号在时域上存在信号重叠的信号。在实际应用中,在时域上存在信号重叠是指声音样本信号对应的声音样本包络线与肌电样本信号对应的肌电样本包络线的包络线重叠;有效咳嗽样本信号是指包络线重叠部分的时间戳所对应的声音样本信号。
50.在具体的实施例中,如图3所示,所述对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号,包括:
51.步骤2021,提取所述声音样本信号对应的声音样本包络线,提取所述肌电样本信号对应的肌电样本包络线。
52.其中,声音样本包络线指的是声音采样点中由极大值(采样值绝对值)点构成的点的集合,能够反映声音样本信号时序上振幅的变化;对每一帧声音信号进行包络线提取,得到所述声音样本信号对应的声音样本包络线。
53.其中,肌电样本包络线指的是肌电采样点中由极大值(采样值绝对值)点构成的点的集合,能够反映肌电样本信号时序上振幅的变化;对每一帧肌电信号进行包络线提取,得到所述肌电样本信号对应的肌电样本包络线。
54.步骤2022,根据所述声音样本包络线与所述肌电样本包络线的包络线重叠情况,对所述咳嗽样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号。
55.其中,咳嗽时,声音样本信号时序上振幅的变化与肌电样本信号时序上振幅的变化具有一致性,通过判断声音样本包络线与所述肌电样本包络线的包络线重叠情况,便能够判断出声音样本信号的有效性。具体地,时序上某一时间戳对应的所述声音样本包络线与所述肌电样本包络线的包络线重叠部分(包络线交集)越多,说明该时间戳对应的声音样本信号可靠性越高,是咳嗽的声音的可能性越大。
56.示例性地,若第一时间戳对应的所述声音样本包络线与所述肌电样本包络线的包络线交集为90%,第二时间戳对应的所述声音样本包络线与所述肌电样本包络线的包络线交集为50%,第一时间戳对应的所述声音样本包络线与所述肌电样本包络线的包络线交集更多,则说明第一时间戳所对应的声音样本信号比第二时间戳所对应的声音样本信号可靠性更高,第一时间戳所对应的声音样本信号为咳嗽声音的可能性更高。因此,可以根据所述声音样本包络线与所述肌电样本包络线的包络线重叠情况,对所述咳嗽样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号。
57.在具体的实施例中,如图4所示,根据所述声音样本包络线与所述肌电样本包络线的包络线重叠情况,对所述咳嗽样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号,包括:
58.步骤2022a,提取所述声音样本包络线与所述肌电样本包络线对应的时间戳集。
59.其中,提取所述声音样本信号对应的声音样本包络线后,便可确定所述声音样本包络线对应的起始时间戳与终止时间戳。进一步地,便可以根据所述声音样本包络线对应的起始时间戳与终止时间戳确定出所述声音样本包络线对应的时间戳集。具体的,所述声音样本包络线对应的时间戳集包括所述声音样本包络线对应的起始时间戳与终止时间戳,以及所述声音样本包络线对应的起始时间戳与终止时间戳之间的多个时间戳。
60.其中,提取所述肌电样本信号对应的肌电样本包络线后,便可确定所述肌电样本包络线对应的起始时间戳与终止时间戳。进一步的,便可以根据所述肌电样本包络线对应的起始时间戳与终止时间戳确定出所述肌电样本包络线对应的时间戳集。具体的,所述肌电样本包络线对应的时间戳集包括所述肌电样本包络线对应的起始时间戳与终止时间戳,以及所述肌电样本包络线对应的起始时间戳与终止时间戳之间的多个时间戳。
61.步骤2022b,若第n个时间戳对应的所述声音样本包络线与所述肌电样本包络线重叠程度大于预设阈值,则将所述第n个时间戳对应的声音样本信号作为有效咳嗽样本信号;其中,所述第n个时间戳为所述时间戳集中的任一时间戳,n为不小于1的正整数。
62.在本实施例中,由于是在所述肌电样本信号的约束下,从所述声音样本信号中提取出与所述咳嗽样本信号对应的有效咳嗽样本信号。因此,在确定所述声音样本包络线对应的时间戳集以及所述肌电样本包络线对应的时间戳集后,需要对所述声音样本包络线对应的时间戳集以所述肌电样本包络线对应的时间戳集为标准进行时序上的对齐,使得所述声音样本包络线对应的时间戳集以及所述肌电样本包络线对应的时间戳集具有时序一致性。
63.示例性的,若所述声音样本包络线对应的时间戳集为{0.01ms,0.02ms,0.03ms,0.04ms,0.05ms,0.06ms,0.07ms,0.08ms......2.02ms,2.03ms},所述肌电样本包络线对应的时间戳集为{0.06ms,0.07ms,0.08ms......2.02ms,2.03ms},在所述肌电样本信号的约束下,将所述声音样本包络线对应的时间戳集对齐为{0.06ms,0.07ms,0.08ms......2.02ms,2.03ms}。
64.在本实施例中,对所述声音样本包络线对应的时间戳集以所述肌电样本包络线对应的时间戳集为标准进行时序上的对齐后,判断任一个时间戳对应的所述声音样本包络线与所述肌电样本包络线的包络线重叠部分(包络线交集),若包络线重叠部分(包络线交集)大于预设阈值,则说明该时间戳对应的声音样本信号可靠性越高,则将该时间戳对应的声音样本信号作为有效声音样本信号。示例性的,预设阈值可以根据实际需求进行灵活设置,例如可以是50%。在此基础上,对每一个时间戳对应的声音样本包络线与肌电样本包络线的包络线重叠部分进行阈值判断,得到多个有效声音样本信号,将多个有效声音样本信号组成有效声音样本集,作为与所述咳嗽样本信号对应的有效咳嗽样本信号。
65.在本实施例中,获取用户的咳嗽样本信号后,通过对声音样本信号和肌电样本信号进行有效样本提取,通过肌电样本信号对声音样本信号进行约束,能够准确的从声音样本信号中得到与肌电样本信号在时域上存在信号重叠的声音样本信号,剔除与肌电样本信号不匹配或匹配度较低的声音样本信号,降低假阳性出现的概率。
66.步骤203,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特征用于表征所述咳嗽样本信号的最高幅值。
67.其中,在声音处理领域中,梅尔频率倒谱(mel-frequency cepstrum)是基于声音频率的非线性梅尔刻度(mel scale)的对数能量频谱的线性变换。梅尔频率倒谱系数(mel-frequency cepstral coefficients,mfcc)就是组成梅尔频率倒谱的系数。所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征。
68.其中,所述能量特征用于表征所述咳嗽样本信号的信号幅值,具体的,用于表征所述咳嗽样本信号的信号强度,即,用于表征用户咳嗽的强度。信号幅值越大,说明咳嗽强度越大,对应的信号强度越大。
69.其中,所述峰值特征用于表征所述咳嗽样本信号的最高幅值,其中,指所述咳嗽样本信号在频域上的最高幅值。具体的所述峰值特征用于表征所述咳嗽样本信号的最大信号
强度;即,用于表征用户咳嗽的最大强度。
70.在具体的实施例中,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的梅尔频率倒谱系数特征,包括:先对有效咳嗽样本信号依次进行预加重、分帧和加窗处理;然后将加窗后的每一帧进行快速傅里叶变换,将时域信号变换至频域,得到对应的频谱;将上面的每一帧对应的频谱通过梅尔滤波器组得到梅尔频谱;在梅尔频谱上面进行倒谱分析,获得梅尔频率倒谱系数特征。
71.在本实施例中,对有效咳嗽样本信号进行梅尔频率倒谱系数特征提取后,可以得到由梅尔频率倒谱系数特征组成的特征序列。示例性的,可以是长度为20的特征序列,即mfcc1,mfcc2,

,mfcc19,mfcc20。
72.在本实施例中,通过提取梅尔频率倒谱特征,提高了检测的准确率,能够更为准确地区分咳嗽声音与环境杂音。
73.在具体的实施例中,所述对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征以及能量特征,之前还包括:对所述有效咳嗽样本信号进行频谱转换,得到与所述咳嗽样本信号对应的样本频谱图。
74.其中,由于信号在时域上的变化通常很难看出信号的特性,所以通常透过傅里叶变换将有效咳嗽样本信号变换成频域上的能量分布来观察,不同的能量分布,就能代表不同声音的特性。具体的,对所述有效咳嗽样本信号,按照所述有效咳嗽样本信号对应的所有时间戳对有效咳嗽样本信号进行裁剪,得到裁剪后的时域片段,然后将裁剪后的时域片段,按照短时傅里叶变换得到对应的样本频谱图。
75.在具体的实施例中,对有效咳嗽样本信号进行裁剪可以是对有效咳嗽样本信号进行分帧处理,具体的,是将有效咳嗽样本信号以帧为单位等分成若干有效咳嗽样本信号单元,该有效咳嗽样本信号单元由采样点组成。本实施例中,可以选取16000hz的采样频率,在频率范围内分析0-8000hz的频域数据,帧长可以设定在10~35ms之间。在实际应用中,可以以32ms分帧,即一帧有效咳嗽样本信号单元设有512个采样点,自然的,任意一帧有效咳嗽样本信号单元具有一定的帧长,本实施例任意帧的帧长为512。分帧后的有效咳嗽样本信号,经过一个高通滤波器,作为预加重处理。由于有效咳嗽样本信号中的噪声在低频部分能量一般较大,所以使用该高通滤波器可以衰减低频部分的份量,使降噪效果更好。其形式如下:
76.h(z)=1-αz-1
77.其中,α一般取值在0.75-0.95之间,这里α=0.9,可以取得较好的效果。
78.在本实施例中,可以对有效咳嗽样本信号进行分帧处理会带来帧信号边界处的不连续,而导致频率泄露。所以,对于分帧后的有效咳嗽样本信号要进行短时傅里叶变换。短时傅里叶变换可以理解为对帧信号先加窗再做傅里叶变换。加窗函数的目的就是为了在做短时傅里叶变换时,减少帧信号边界处的不连续而造成频率泄露,从而减少“块效应”。这里使用了一个长度等于帧长512点的汉明窗,它可以有效的降低吉布斯效应的震荡程度。
79.汉明窗函数定义如下:
80.win(n)=(1-a)-acos[2πn/(m-1)],0≤n≤m-1
[0081]
其中,不同的a值会产生不同的汉明窗,一般情况下a取0.46。
[0082]
短时傅里叶变换如下:
[0083][0084]
其中,m=512,为短时傅利叶变换的计算长度。m表示第m帧信号。
[0085]
在本实施例中,所述对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征以及能量特征包括:根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征以及能量特征。
[0086]
其中,得到与所述咳嗽样本信号对应的样本频谱图后,便可以得到有效咳嗽样本信号在对应的样本频谱图上的能量分布。具体的,可以得到所述样本频谱图上每个频率点所对应的能量,也就是与所述咳嗽样本信号对应的能量特征;还可以得到一个频率范围内的最大能量值,也就是与所述咳嗽样本信号对应的峰值特征。
[0087]
在具体的实施例中,所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征之前,还包括:对所述样本频谱图进行平滑处理,得到平滑后的样本频谱图。
[0088]
其中,将有效咳嗽样本信号从时域转为频域后,进行平滑操作。具体的,通过低通滤波器级联均值平滑窗口,得到得平滑后波形曲线图,然后在对应的波形图上提取峰值特征。
[0089]
在本实施例中,所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征,包括:根据所述平滑后的样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征。
[0090]
其中,所述峰值特征是指在一个频段内的峰值。在实际应用中,大部分的有效咳嗽样本信号的高能分布在0-2500hz区间,少数有效咳嗽样本信号的高能分布在2500-3000hz,但是有效咳嗽样本信号的高能出现在3000hz及以后的情况极少,因此通过获取峰值点的方式能够更好的统计高能特征。
[0091]
在具体的实施例中,在进行峰值特征提取时可以是:获取一定频段内的各采样点对应的幅值,若第n个采样点所对应的幅值大于其左右两侧任一采样点的幅值,则将所述第n个采样点所对应的幅值确定为所述一定频段内的极大值,并将该极大值作为该频段内波形图的峰值。以0-2500hz区间为例,可以理解的,所述一定频段可以是整个0-2500hz区间,也可以是将0-2500hz区间分割后的任一区间。若是分割后的任一区间,在进行峰值特征提取时可以是,采用区间遍历法,确定每一个分割后的区间上的峰值,从每一个分割后的区间上的峰值中确定出最大的一个峰值作为0-2500hz区间上的峰值。
[0092]
在本实施例中,尽管平滑后的曲线拟合了峰值的趋势,但仍有部分峰值距离过近,这种峰值的存在削弱了统计的意义,因此可以设置峰值间的间隔不小于50hz,在该规则的限制下,提取有效咳嗽样本信号在频域上的峰值特征,能够更加的符合实际波形趋势。示例性的,可以提取出三个间隔不小于50hz的峰值特征,命名为:max_point1,max_point2,max_point3。
[0093]
在具体的实施例中,所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的能量特征,包括:获取所述有效咳嗽样本信号进行频谱转换后在所述样本频谱图中的频谱长度以及所述样本频谱图中每个频率点对应的能量值;所述频谱长度用于指示频谱转换后与所述有效咳嗽样本信号对应的向量长度;根据
所述频谱长度、所述每个频率点对应的能量值以及预设的能量计算公式对所述有效咳嗽样本信号进行能量特征提取,得到与所述咳嗽样本信号对应的能量特征。
[0094]
其中,咳嗽通过声门爆发出来的过程在能量上与非咳嗽及周围环境音相比,具有明显差异。因此,本方案中通过获取咳嗽样本信号对应的能量特征,能够增加样本的准确性,从而提升咳嗽检测的准确性。
[0095]
其中,在对有效咳嗽样本信号进行频谱转换时,实际是将有效咳嗽样本信号降维成k个mfcc特征向量进行表示,所述频谱长度用于指示频谱转换后与所述有效咳嗽样本信号对应的向量长度。
[0096]
在本实施例中,在对有效咳嗽样本信号进行频谱转换后,获取所述有效咳嗽样本信号进行频谱转换后在所述样本频谱图中的频谱长度以及所述样本频谱图中每个频率点对应的能量值,根据以下公式确定所述咳嗽样本信号对应的能量特征:
[0097][0098]
其中,cal为频谱长度,p为每点的能量值。
[0099]
步骤204,根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
[0100]
其中,在得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征后,那便可对峰值特征、梅尔频率倒谱系数特征以及能量特征进行特征融合,并使用融合后的特征对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
[0101]
在具体的实施例中,如图5所示,所述据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型,包括:
[0102]
步骤2041,对所述峰值特征、所述梅尔频率倒谱系数特征以及所述能量特征进行特征融合,得到与所述咳嗽样本信号对应的目标样本特征。
[0103]
其中,对所述峰值特征、所述梅尔频率倒谱系数特征以及所述能量特征进行特征融合,建立新的特征,结构为:max_point1,max_point2,max_point3,mfcc1,

,mfcc20,p。对有效咳嗽样本信号进行特征提取后,便可对咳嗽检测模型进行训练。
[0104]
步骤2042,根据所述目标样本特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
[0105]
其中,建立新的特征后,便可得到最终的训练样本,为max_point1,max_point2,max_point3,mfcc1,

,mfcc20,p,label,其中前n-1维为有效咳嗽样本信号提取的特征,第n维是标签信息。使用最终的训练样本进行模型训练,其中,训练集和测试集按照30%和70%的比例划分,训练集在训练过程中设置为12倍交叉验证。通过本方案构建得到的特征结构,能够更加准确的区分咳嗽及非咳嗽声音各自的特征,有效地解决了咳嗽本身个体差异话明显,形态各异的问题。
[0106]
本技术提出一种咳嗽检测模型训练方法:获取用户的咳嗽样本信号后,通过对声音样本信号和肌电样本信号进行有效样本提取,通过肌电样本信号对声音样本信号进行约束,能够准确的从声音样本信号中得到与肌电样本信号在时域上存在信号重叠的声音样本
信号,剔除与肌电样本信号不匹配的声音样本信号,降低假阳性出现的概率。通过对有效咳嗽样本信号进行特征提取,得到与咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征,能够充分考虑咳嗽通过声门爆发出来的过程在能量上与非咳嗽及周围环境音相比存在的差异,并充分考虑到信号频率区别较小难以识别的情况,实现对咳嗽信号的增强,获得高质量数据。通过基于峰值特征、梅尔频率倒谱系数特征、能量特征进行模型训练,也就是使用高质量数据对模型进行训练,能大大提升训练后模型识别的准确率与可信度,降低对分析人员的要求,并提升分析人员的工作效率。
[0107]
在一个实施例中,如图6所示,本技术提出一种咳嗽检测方法,,所述方法包括:
[0108]
步骤601,获取用户的待识别咳嗽信号。
[0109]
其中,所述待识别咳嗽信号包括待识别声音信号和待识别肌电信号。通过声音采集装置采集用户的声音信号,通过肌电采集装置采集用户的肌电信号。采集到声音信号与肌电信号后,咳嗽检测装置会先将声音信号与肌电信号保存为二进制文件存储。在进行咳嗽检测时,会从存储数据库中提取出二进制文件,然后利用预设的编码规则对二进制文件进行编码处理,得到待识别声音信号和待识别肌电信号,待识别声音信号和待识别肌电信号共同组成用户的待识别咳嗽信号,得到待识别咳嗽信号后便可通过咳嗽检测模型进行咳嗽检测。具体的,声音采集装置可以是如图1所述的声音采集装置50,肌电采集装置可以是如图1所述的第一电极20、第二电极30以及第三电极40。
[0110]
步骤602,将所述待识别咳嗽信号输入至目标咳嗽检测模型,所述目标咳嗽检测模型经过本技术提出的所述咳嗽检测模型训练方法训练得到。
[0111]
其中,将所述待识别咳嗽信号输入至目标咳嗽检测模型后,目标咳嗽检测模型会对所述待识别咳嗽信号进行信号处理,最后根据处理后的信号进行咳嗽检测。
[0112]
在具体的实施例中,所述对所述待识别咳嗽信号进行信号处理可以是:在所述待识别肌电信号的约束下,从所述待识别声音信号中提取出与所述待识别咳嗽信号对应的待识别有效咳嗽信号待识别有效咳嗽信号;对待识别有效咳嗽信号进行特征提取,得到与所述待识别咳嗽信号对应的峰值特征:max_point1,max_point2,max_point3、梅尔频率倒谱系数特征:mfcc1,

,mfcc20以及能量特征p,并对所述峰值特征、所述梅尔频率倒谱系数特征以及所述能量特征进行特征融合,建立新的特征:max_point1,max_point2,max_point3,mfcc1,

,mfcc20,p,label,其中前n-1维为有效咳嗽样本信号提取的特征,第n维是标签信息。
[0113]
在具体的实施例中,所述咳嗽检测模型训练方法,所述方法包括:获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态;对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号;对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特征用于表征所述咳嗽样本信号的最高幅值;根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽
检测模型。
[0114]
步骤603,通过所述目标咳嗽检测模型输出与所述待识别咳嗽信号对应的咳嗽或非咳嗽的检测结果。
[0115]
在本实施例中,通过待识别肌电信号对待识别声音信号进行约束,能够准确的从待识别声音信号中得到与待识别肌电信号在时域上存在信号重叠的待识别声音信号,剔除与待识别肌电信号不匹配的声音信号,降低假阳性出现的概率。通过对待识别有效咳嗽信号进行特征提取,得到与待识别咳嗽信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征,能够充分考虑咳嗽通过声门爆发出来的过程在能量上与非咳嗽及周围环境音相比存在的差异,并充分考虑到信号频率区别较小难以识别的情况,实现对咳嗽信号的增强,获得高质量数据。从而大大提升训练后模型识别的准确率与可信度,降低对分析人员的要求,并提升分析人员的工作效率。
[0116]
如图7所示,在一个实施例中,本发明提供了一种咳嗽检测模型训练装置,所述装置包括:
[0117]
样本获取模块701,用于获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态。
[0118]
有效样本提取模块702,用于对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号。
[0119]
特征提取模块703,用于对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特征用于表征所述咳嗽样本信号的最高幅值。
[0120]
模型训练模块704,用于根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
[0121]
如图8所示,在一个实施例中,本发明提供了一种咳嗽检测装置,所述装置包括:
[0122]
获取模块801,用于获取用户的待识别咳嗽信号。
[0123]
输入模块802,用于将所述待识别咳嗽信号输入至目标咳嗽检测模型,所述目标咳嗽检测模型经过本技术提出的所述咳嗽检测模型训练方法训练得到。
[0124]
检测模块803,用于通过所述目标咳嗽检测模型输出与所述待识别咳嗽信号对应的咳嗽或非咳嗽的检测结果。
[0125]
如图9所示,在一个实施例中,为一种计算机设备的内部结构图。该计算机设备可以是一种咳嗽检测模型训练装置、或与一种咳嗽检测模型训练装置连接的终端或服务器。如图9所示,该计算机设备包括通过系统总线连接的处理器、存储器、和网络接口。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现一种咳嗽检测模型训练方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行一种咳嗽检测模型训练方法。网络接口用于与外接进行通信。本领域技术人员可以理解,图9中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成
对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0126]
在一个实施例中,本技术提供的一种咳嗽检测模型训练方法可以实现为一种计算机程序的形式,计算机程序可在如图9所示的计算机设备上运行。计算机设备的存储器中可存储组成该年龄预测装置的各个程序模板。比如,样本获取模块701,有效样本提取模块702,特征提取模块703,模型训练模块704。
[0127]
一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该计算机程序被该处理器执行时,使得该处理器执行如下步骤:获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态;对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号;对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特征用于表征所述咳嗽样本信号的最高幅值;根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
[0128]
在一个实施例中,所述对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号,包括:提取所述声音样本信号对应的声音样本包络线,提取所述肌电样本信号对应的肌电样本包络线;根据所述声音样本包络线与所述肌电样本包络线的包络线重叠情况,对所述咳嗽样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号。
[0129]
在一个实施例中,所述根据所述声音样本包络线与所述肌电样本包络线的包络线重叠情况,对所述咳嗽样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号,包括:提取所述声音样本包络线与所述肌电样本包络线对应的时间戳集;若第n个时间戳对应的所述声音样本包络线与所述肌电样本包络线重叠程度大于预设阈值,则将所述第n个时间戳对应的声音样本信号作为有效咳嗽样本信号;其中,所述第n个时间戳为所述时间戳集中的任一时间戳,n为不小于1的正整数。
[0130]
在一个实施例中,所述据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型,包括:对所述峰值特征、所述梅尔频率倒谱系数特征以及所述能量特征进行特征融合,得到与所述咳嗽样本信号对应的目标样本特征;根据所述目标样本特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
[0131]
在一个实施例中,所述对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征以及能量特征,之前还包括:对所述有效咳嗽样本信号进行频谱转换,得到与所述咳嗽样本信号对应的样本频谱图;所述对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征以及能量特征包括:根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征以及能量特征。
[0132]
在一个实施例中,所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征之前,还包括:对所述样本频谱图进行平滑处理,得到平滑后的样本频谱图;所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征,包括:根据所述平滑后的样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征。
[0133]
在一个实施例中,所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的能量特征,包括:获取所述有效咳嗽样本信号进行频谱转换后在所述样本频谱图中的频谱长度以及所述频谱图中每个频率点对应的能量值;所述频谱长度用于指示频谱转换后与所述有效咳嗽样本信号对应的向量长度;根据所述频谱长度、所述每个频率点对应的能量值以及预设的能量计算公式对所述有效咳嗽样本信号进行能量特征提取,得到与所述咳嗽样本信号对应的能量特征。
[0134]
一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时,使得该处理器执行如下步骤:获取用户的咳嗽样本信号及与所述咳嗽样本信号对应的信号标签,所述咳嗽样本信号包括声音样本信号和肌电样本信号,所述信号标签用于指示所述咳嗽样本信号对应的咳嗽状态;对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号;所述有效咳嗽样本信号为所述声音样本信号中与所述肌电样本信号在时域上存在信号重叠的信号;对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征、梅尔频率倒谱系数特征以及能量特征;所述梅尔频率倒谱系数特征用于表征所述咳嗽样本信号的频域特征;所述能量特征用于表征所述咳嗽样本信号的信号幅值;所述峰值特征用于表征所述咳嗽样本信号的最高幅值;根据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
[0135]
在一个实施例中,所述对所述声音样本信号和所述肌电样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号,包括:提取所述声音样本信号对应的声音样本包络线,提取所述肌电样本信号对应的肌电样本包络线;根据所述声音样本包络线与所述肌电样本包络线的包络线重叠情况,对所述咳嗽样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号。
[0136]
在一个实施例中,所述根据所述声音样本包络线与所述肌电样本包络线的包络线重叠情况,对所述咳嗽样本信号进行有效样本提取,得到与所述咳嗽样本信号对应的有效咳嗽样本信号,包括:提取所述声音样本包络线与所述肌电样本包络线对应的时间戳集;若第n个时间戳对应的所述声音样本包络线与所述肌电样本包络线重叠程度大于预设阈值,则将所述第n个时间戳对应的声音样本信号作为有效咳嗽样本信号;其中,所述第n个时间戳为所述时间戳集中的任一时间戳,n为不小于1的正整数。
[0137]
在一个实施例中,所述据所述峰值特征、所述梅尔频率倒谱系数特征、所述能量特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型,包括:对所述峰值特征、所述梅尔频率倒谱系数特征以及所述能量特征进行特征融合,得到与所述咳嗽样本信号对应的目标样本特征;根据所述目标样本特征以及所述信号标签对咳嗽检测模型进行训练,得到目标咳嗽检测模型。
[0138]
在一个实施例中,所述对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽
样本信号对应的峰值特征以及能量特征,之前还包括:对所述有效咳嗽样本信号进行频谱转换,得到与所述咳嗽样本信号对应的样本频谱图;所述对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征以及能量特征包括:根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征以及能量特征。
[0139]
在一个实施例中,所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征之前,还包括:对所述样本频谱图进行平滑处理,得到平滑后的样本频谱图;所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征,包括:根据所述平滑后的样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的峰值特征。
[0140]
在一个实施例中,所述根据所述样本频谱图,对所述有效咳嗽样本信号进行特征提取,得到与所述咳嗽样本信号对应的能量特征,包括:获取所述有效咳嗽样本信号进行频谱转换后在所述样本频谱图中的频谱长度以及所述频谱图中每个频率点对应的能量值;所述频谱长度用于指示频谱转换后与所述有效咳嗽样本信号对应的向量长度;根据所述频谱长度、所述每个频率点对应的能量值以及预设的能量计算公式对所述有效咳嗽样本信号进行能量特征提取,得到与所述咳嗽样本信号对应的能量特征。
[0141]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random access memory,ram)等。
[0142]
以上所揭露的仅为本技术较佳实施例而已,当然不能以此来限定本技术之权利范围,因此依本技术权利要求所作的等同变化,仍属本技术所涵盖的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1