本发明涉及语音识别,尤其涉及一种婴儿语音识别方法、系统、终端及计算机可读存储介质。
背景技术:
1、婴儿由于年龄太小,无法通过语言表达来自己的需求,通常都是通过哭声来进行表达,随着科技的发展,在市面上出现了越来越多的婴儿语音智能识别系统,现有的婴儿语音智能识别系统主要用于检测婴儿的状况,例如识别婴儿的哭声、笑声、吵闹声等。
2、但是,现有的婴儿语音识别方法无法让父母清楚了解婴儿的真实需求与诉求,从而无法使得父母及时对婴儿的意愿和需求进行反馈。
3、因此,现有技术还有待于改进和发展。
技术实现思路
1、本发明的主要目的在于提供一种婴儿语音识别方法、系统、终端及计算机可读存储介质,旨在解决现有技术中难以根据婴儿语音得出婴儿的真实诉求,使得监护者无法对婴儿的诉求及时作出反应的问题。
2、为实现上述目的,本发明提供一种婴儿语音识别方法,所述婴儿语音识别方法包括如下步骤:
3、获取目标婴儿的待识别婴儿哭声,将所述待识别婴儿哭声转换为数字信号;
4、对所述数字信号进行卡尔曼滤波处理,得到增强数字信号;
5、将所述增强数字信号输入至预先训练完成的特征提取模型,得到所述增强数字信号对应的多个特征数据;
6、将所有所述特征数据输入至预先训练完成的哭声识别模型,得到所述目标婴儿对应的哭声分析结果。
7、可选地,所述的婴儿语音识别方法,其中,所述获取待识别的目标婴儿的婴儿哭声,将所述婴儿哭声转换为数字信号,具体包括:
8、根据预设麦克风声音采集器对所述目标婴儿进行声音采集,得到所述目标婴儿的待识别婴儿哭声;
9、通过预设adc模块对所述待识别婴儿哭声进行转换,得到所述待识别婴儿哭声对应的数字信号。
10、可选地,所述的婴儿语音识别方法,其中,所述对所述数字信号进行卡尔曼滤波处理,得到增强数字信号,具体包括:
11、对所述数字信号进行分帧处理,得到多段第一数字信号;
12、根据所有所述第一数字信号建立所述数字信号对应的状态方程和观测矩阵;
13、根据所述状态方程和所述观测矩阵对所述数字信号进行卡尔曼滤波处理,以完成对所述数字信号的降噪和信号频率增强,得到增强数字信号。
14、可选地,所述的婴儿语音识别方法,其中,所述将所述增强数字信号输入至预先训练完成的特征提取模型,得到所述增强数字信号对应的多个特征数据,具体包括:
15、将所述增强数字信号输入至预先训练完成的特征提取模型;
16、对所述数字信号进行预加重操作和分帧处理,得到多个第二数字信号;
17、基于所有所述第二数字信号进行特征提取处理,得到每个所述第二数字信号对应的特征数据。
18、可选地,所述的婴儿语音识别方法,其中,所述基于所有所述第二数字信号进行特征提取处理,得到每个所述第二数字信号对应的特征数据,具体包括:
19、对所有所述第二数字信号进行加窗处理,并对所有加窗处理完毕的第二数字信号进行快速傅里叶变换,得到每个所述第二数字信号对应的频谱;
20、根据预设的三角带通滤波组对每个所述频谱进行滤波处理,计算每个滤波处理完的频谱对应的对数能量,并根据每个所述对数能量得到每个所述频谱对应的mel频谱;
21、对每个所述mel频谱进行离散余弦变换操作,得到每个所述第二数字信号对应的mfcc系数;
22、基于所有所述mfcc系数进行计算,得到每个所述第二数字信号对应的差分参数,并根据每个所述差分参数得到每个所述第二数字信号对应的特征数据。
23、可选地,所述的婴儿语音识别方法,其中,所述将所有所述特征数据输入至预先训练完成的哭声识别模型,得到所述目标婴儿对应的哭声分析结果,具体包括:
24、将所有所述特征数据输入至预先训练完成的哭声识别模型;
25、所述哭声识别模型根据所有所述特征数据进行分类预测操作,得到所述目标婴儿对应的哭声分析结果。
26、可选地,所述的婴儿语音识别方法,其中,所述得到所述目标婴儿对应的哭声分析结果,之后还包括:
27、将所述哭声分析结果显示在预设显示屏上;
28、根据所述哭声分析结果生成语音文本,并根据所述语音文本进行语音播报。
29、此外,为实现上述目的,本发明还提供一种婴儿语音识别系统,其中,所述婴儿语音识别系统包括:
30、信号采集模块,用于获取目标婴儿的待识别婴儿哭声,将所述待识别婴儿哭声转换为数字信号;
31、信号增强模块,用于对所述数字信号进行卡尔曼滤波处理,得到增强数字信号;
32、特征提取模块,用于将所述增强数字信号输入至预先训练完成的特征提取模型,得到所述增强数字信号对应的多个特征数据;
33、哭声分析模块,用于将所有所述特征数据输入至预先训练完成的哭声识别模型,得到所述目标婴儿对应的哭声分析结果。
34、此外,为实现上述目的,本发明还提供一种终端,其中,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的婴儿语音识别程序,所述婴儿语音识别程序被所述处理器执行时实现如上所述的婴儿语音识别方法的步骤。
35、此外,为实现上述目的,本发明还提供一种计算机可读存储介质,其中,所述计算机可读存储介质存储有婴儿语音识别程序,所述婴儿语音识别程序被处理器执行时实现如上所述的婴儿语音识别方法的步骤。
36、本发明中,获取目标婴儿的待识别婴儿哭声,将所述待识别婴儿哭声转换为数字信号;对所述数字信号进行卡尔曼滤波处理,得到增强数字信号;将所述增强数字信号输入至预先训练完成的特征提取模型,得到所述增强数字信号对应的多个特征数据;将所有所述特征数据输入至预先训练完成的哭声识别模型,得到所述目标婴儿对应的哭声分析结果。本发明提高了对婴儿哭声进行识别的响应速度,也提升了对婴儿哭声进行识别的准确性,从而使得用户可以更好地满足婴儿的需求,提高婴儿护理的质量和效率,降低婴儿的不适感。
1.一种婴儿语音识别方法,其特征在于,所述婴儿语音识别方法包括:
2.根据权利要求1所述的婴儿语音识别方法,其特征在于,所述获取待识别的目标婴儿的婴儿哭声,将所述婴儿哭声转换为数字信号,具体包括:
3.根据权利要求1所述的婴儿语音识别方法,其特征在于,所述对所述数字信号进行卡尔曼滤波处理,得到增强数字信号,具体包括:
4.根据权利要求1所述的婴儿语音识别方法,其特征在于,所述将所述增强数字信号输入至预先训练完成的特征提取模型,得到所述增强数字信号对应的多个特征数据,具体包括:
5.根据权利要求4所述的婴儿语音识别方法,其特征在于,所述基于所有所述第二数字信号进行特征提取处理,得到每个所述第二数字信号对应的特征数据,具体包括:
6.根据权利要求1所述的婴儿语音识别方法,其特征在于,所述将所有所述特征数据输入至预先训练完成的哭声识别模型,得到所述目标婴儿对应的哭声分析结果,具体包括:
7.根据权利要求1所述的婴儿语音识别方法,其特征在于,所述得到所述目标婴儿对应的哭声分析结果,之后还包括:
8.一种婴儿语音识别系统,其特征在于,所述婴儿语音识别系统包括:
9.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的婴儿语音识别程序,所述婴儿语音识别程序被所述处理器执行时实现如权利要求1-7任一项所述的婴儿语音识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有婴儿语音识别程序,所述婴儿语音识别程序被处理器执行时实现如权利要求1-7任一项所述的婴儿语音识别方法的步骤。