一种基于声纹识别的触摸屏语音唤醒系统的制作方法

文档序号:45434213发布日期:2026-05-07 12:54阅读:4来源:国知局

本发明涉及语音数据处理,具体是涉及一种基于声纹识别的触摸屏语音唤醒系统。


背景技术:

1、触摸屏是一种可接收触头等输入信号的感应式显示设备,用户通过手指或触控笔直接在屏幕上操作,实现人机交互;它结合了显示技术和输入技术,广泛应用于智能手机、平板电脑、atm机、工业控制设备、自助服务终端等各类电子设备中。

2、有的用户会使用特定的语音关键词唤醒触摸屏,若没有对用户的唤醒语音进行特征分析,当其他用户误说语音关键词后,则会唤醒触摸屏,导致其他用户能够使用触摸屏,进而出现用户隐私泄漏的情况。


技术实现思路

1、为解决上述技术问题,提供一种基于声纹识别的触摸屏语音唤醒系统,本技术方案解决了上述背景技术中提出的若没有对用户的唤醒语音进行特征分析,当其他用户误说语音关键词后,则会唤醒触摸屏,导致其他用户能够使用触摸屏,进而出现用户隐私泄漏的情况的问题。

2、为达到以上目的,本发明采用的技术方案为:

3、一种基于声纹识别的触摸屏语音唤醒系统,包括:

4、智能控制终端,所述智能控制终端用于控制各个模块之间进行数据传输和信息交互,所述智能控制终端用于控制各个模块对第一待分析的语音数据进行特征加重处理、数据计算处理以及计算验证处理,确定第二待分析的语音数据是否能够唤醒触摸屏;

5、数据库系统,所述数据库系统用于存储触摸屏的唤醒语音数据;

6、语音采集模块,所述语音采集模块用于对触摸屏周围环境进行音频数据采集处理,获取第一待分析的语音数据;

7、特征加重模块,所述特征加强模块用于对第一待分析的语音数据进行特征加重处理,获取第二待分析的语音数据;

8、特征向量计算模块,所述特征向量计算模块用于对唤醒语音数据进行计算处理,获取唤醒语音数据的特征向量;

9、语音验证模块,所述语音验证模块根据唤醒语音数据的特征向量对第二待分析的语音数据进行计算验证处理,确定第二待分析的语音数据是否能够唤醒触摸屏。

10、优选的,所述特征加强模块用于对第一待分析的语音数据进行特征加重处理,获取第二分析的语音数据具体包括如下步骤:

11、基于智能控制终端,对第一待分析的语音数据进行数据切割处理,获取若干组分段语音数据;

12、基于智能控制终端,对若干组分段语音数据进行数据加窗处理,获取若干组加窗语音数据;

13、基于智能控制终端,对若干组加窗语音数据进行能量分析处理,确定语音数据能量薄弱位置和无需增强特征的加窗语音数据;

14、基于特征加强模块,对语音数据能量薄弱位置进行特征加重处理,获取增强特征的加窗语音数据;

15、基于智能控制终端,将无需增强特征的加窗语音数据和增强特征的加窗语音数据进行合并处理,获取第二分析的语音数据。

16、优选的,所述基于智能控制终端,对若干组加窗语音数据进行能量分析处理,确定语音数据能量薄弱位置和无需增强特征的加窗语音数据具体包括如下步骤:

17、基于智能控制终端,对若干组加窗语音数据中的每帧语音信号进行数据计算处理,获取每帧语音信号的能量值;

18、基于智能控制终端,对每帧语音信号的能量值进行归一化处理,获取每帧语音信号的归一化能量值;

19、基于智能控制终端,对每帧语音信号的归一化能量值和设定归一化能量值阈值进行判断处理;

20、若每帧语音信号的归一化能量值中存在小于设定归一化能量值阈值的数据,基于智能控制终端,将小于设定归一化能量值阈值的数据所在位置设置为语音数据能量薄弱位置;

21、基于智能控制终端,将大于或等于设定归一化能量值阈值的数据设置为无需增强特征的加窗语音数据。

22、优选的,所述特征向量计算模块用于对唤醒语音数据进行计算处理,获取唤醒语音数据的特征向量具体包括如下步骤:

23、基于智能控制终端,对唤醒语音数据进行数据频域计算处理,确定唤醒语音的声道形状;

24、基于智能控制终端,对唤醒语音数据进行数据计算处理,确定唤醒语音的声学结构特征;

25、基于特征向量计算模块,对唤醒语音数据进行数据计算处理,获取唤醒语音数据的特征向量。

26、优选的,所述基于智能控制终端,对唤醒语音数据进行数据频域计算处理,确定唤醒语音的声道形状具体包括如下步骤:

27、基于短时傅里叶变换算法,对唤醒语音数据进行频域转换处理,获取唤醒语音数据的频域表示;

28、基于智能控制终端,对唤醒语音数据的频域表示进行梅尔频率转换,设计梅尔滤波器组;

29、基于智能控制终端,对梅尔滤波器组进行对数变换处理,获取梅尔滤波器组的对数能量;

30、基于离散余弦变换算法,对梅尔滤波器组的对数能量进行去相关处理,确定唤醒语音的声道形状。

31、优选的,所述基于智能控制终端,对唤醒语音数据进行数据计算处理,确定唤醒语音的声学结构特征具体包括如下步骤:

32、基于智能控制终端,对唤醒语音数据进行数据计算处理,确定唤醒语音数据的自相关函数;

33、基于智能控制终端,对唤醒语音数据的自相关函数进行数据查找处理,确定自相关函数的峰值;

34、基于智能控制终端,对自相关函数的峰值进行对比分析处理,确定自相关函数的基频。

35、优选的,所述基于智能控制终端,对自相关函数的峰值进行对比分析处理,确定自相关函数的基频具体包括如下步骤:

36、基于智能控制终端,对自相关函数的峰值和设定第一峰值阈值进行判断;

37、若自相关函数的峰值大于设定第一峰值阈值;

38、基于智能控制终端,对自相关函数的峰值和设定第二峰值阈值进行判断;

39、若自相关函数的峰值大于设定第二峰值阈值,基于智能控制终端,将大于设定第二峰值阈值的峰值所在位置频率设置为自相关函数的基频;

40、若自相关函数的峰值小于或等于设定第二峰值阈值,基于智能控制终端,将小于或等于设定第二峰值阈值所在位置频率设置为自相关函数的倍频;

41、若自相关函数的峰值小于或等于设定第一峰值阈值,自相关函数的峰值为虚假峰值。

42、优选的,所述基于特征向量计算模块,对唤醒语音数据进行数据计算处理,获取唤醒语音数据的特征向量具体包括如下步骤:

43、基于卷积神经网络算法,对唤醒语音数据进行维度数据提取处理,获取唤醒语音数据的高维声纹特征;

44、基于智能控制终端,对唤醒语音数据的高维声纹特征进行数据归一化处理,获取高维声纹特征的归一化数据;

45、基于智能控制终端,对高维声纹特征的归一化数据进行数据计算处理,获取唤醒语音数据的特征向量。

46、优选的,所述语音验证模块根据唤醒语音数据的特征向量对第二待分析的语音数据进行计算验证处理,确定第二待分析的语音数据是否能够唤醒触摸屏具体包括如下步骤:

47、基于特征向量计算模块,对第二待分析的语音数据进行计算处理,获取待验证语音的声道形状、声学结构特征以及特征向量;

48、基于智能控制终端,对唤醒语音数据的特征向量和待验证语音的特征向量进行距离对比处理,确定第二待分析的语音数据是否能够唤醒触摸屏。

49、优选的,所述基于智能控制终端,对唤醒语音数据的特征向量和待验证语音的特征向量进行距离对比处理,确定第二待分析的语音数据是否能够唤醒触摸屏具体包括如下步骤:

50、基于智能控制终端,对唤醒语音数据的特征向量和待验证语音的特征向量进行向量距离计算处理,获取语音数据的余弦距离;

51、基于语音验证模块,对语音数据的余弦距离和设定余弦距离范围进行判断处理;

52、若语音数据的余弦距离位于设定余弦距离范围内,且待验证语音的声道形状、待验证语音的声学结构特征和唤醒语音的声道形状、唤醒语音的声学结构特征完全相同,则第二待分析的语音数据能够唤醒触摸屏;

53、若语音数据的余弦距离不位于设定余弦距离范围内,或者待验证语音的声道形状、待验证语音的声学结构特征和唤醒语音的声道形状、唤醒语音的声学结构特征不完全相同,则第二待分析的语音数据不能够唤醒触摸屏。

54、进一步的,提出一种基于声纹识别的触摸屏语音唤醒方法,用于采用如上述的一种基于声纹识别的触摸屏语音唤醒系统,包括:

55、s100、通过触摸屏内部安装的语音采集模块对触摸屏周围环境进行音频数据采集,获取第一待分析的语音数据;

56、s200、通过特征加重模块对第一待分析的语音数据进行特征加重处理,获取第二待分析的语音数据;

57、s300、通过特征向量计算模块对触摸屏中存储的唤醒语音数据进行计算处理,获取唤醒语音数据的特征向量;

58、s400、通过语音验证模块根据唤醒语音数据的特征向量对第二待分析的语音数据进行计算验证处理,确定第二待分析的语音数据是否能够唤醒触摸屏。

59、与现有技术相比,本发明提供了一种基于声纹识别的触摸屏语音唤醒系统,具备以下有益效果:

60、本发明通过对用户提前输入的唤醒语音数据进行各项计算,确定独属于用户唤醒语音数据的声道形状、声学结构特征以及特征向量,后续当触摸屏采集到周围的语音数据后,对第一待分析的语音数据进行特征加重,用以提高特征强度,进而就能提高后续的语音验证精度,最后,通过唤醒语音数据的声道形状、声学结构特征、特征向量对待验证语音的声道形状、声学结构特征、特征向量进行验证,确定第一待分析的语音数据是不是录制唤醒语音数据用户发出的,若是,则唤醒触摸屏,若不是,则不唤醒触摸屏,保证了用户的隐私不会泄漏。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!