一种基于声纹角色分离与安全指令自动仲裁的方法及系统与流程

文档序号:43814436发布日期:2025-11-21 19:12阅读:22来源:国知局

本发明涉及角色分离与安全指令仲裁领域,尤其涉及一种基于声纹角色分离与安全指令自动仲裁的方法及系统。


背景技术:

1、随着语音识别技术和智能化系统的快速发展,如何在多角色协作环境中有效管理语音指令成为重要问题,尤其是在高风险领域如电力调度、工业控制等。多个角色同时发出指令时,指令冲突可能导致操作失误或安全事故。现有的语音指令识别系统多只能处理单一角色的指令,缺乏对多角色环境中冲突的有效处理。为了提高指令管理的安全性和智能化水平,本发明提出了一种基于声纹识别和自动仲裁机制的方法,能够精确区分不同角色的指令,并自动处理指令冲突,从而提升多角色协作环境下的指令执行效率和安全性。

2、公开号为cn 117877512 a的中国发明专利中公开一种针对音频信息的文字及声纹识别方法、系统及应用的方法。通过引入改进的conformer编码器,有效应对电网调度环境中的噪声干扰,并实现了文字识别与声纹识别的双重功能。然而,该方法依赖复杂的网络架构和计算步骤,导致计算开销较大,并且在高噪声环境中,尽管做出了优化,仍可能面临识别准确性不足的问题。尤其是在需要快速响应的调度场景中,八度卷积下采样操作的复杂性可能影响系统的实时性和效率。


技术实现思路

1、发明目的:本发明的目的是提供一种基于声纹角色分离与安全指令自动仲裁的方法及系统。

2、技术方案:本发明基于声纹角色分离与安全指令自动仲裁的方法,包括如下步骤:

3、(1)采集设备获取用户的语音信号,并对语音数据进行预处理;

4、(2)声纹特征提取,将时域信号转换为频域信号;

5、(3)将声纹特征提取后的模型进行深度神经网络训练;

6、(4)使用全连接神经网络进行角色识别;

7、(5)针对冲突指令进行判断以及智能裁决。

8、进一步地,所述步骤(1)预处理包括去噪处理和语音分割。

9、进一步地,所述预处理包括:

10、假设原始的时间域信号为x(t),短时傅里叶变换可以表示为:

11、

12、其中,x(f,t)是频域中的信号,w(t)是窗函数,用于对信号进行加窗操作,表示傅里叶变换,f表示频率;

13、利用谱减法进行去噪处理,通过计算一个静默区间内的噪声频谱来进行噪声估计:

14、n(f,t)=αn(f,t-1)+(1-α)|x(f,t)|2

15、n(f,t)是当前时刻的噪声频谱估计,x(f,t)是当前的频谱值,α是平滑因子,用于平滑噪声估计;

16、估计出噪声频谱n(f,t)后,从信号的频谱中减去噪声频谱:

17、

18、其中,是去噪后的频谱,表示从信号的频谱中减去了噪声的部分,使用max函数保证频谱不会为负数;

19、最后,通过逆短时傅里叶变换将去噪后的频谱转换回时域,得到最终的去噪信号:

20、

21、其中,是逆傅里叶变换,为去噪后的时域信号。

22、进一步地,所述语音分割包括:

23、对去噪后的信号进行语音分割:

24、xframe(t)=x(t)forn=[ms,ms+l],m=1,2,3,...

25、其中,x(t)为原始语音信号,xframe(t)为分割后的帧,l是帧长,s是帧移,m是帧的索引;

26、在分割之后,每个音频帧上进行加窗处理:

27、xwindowed(t)=xframe(t)·w(t)

28、w(t)是窗函数。

29、进一步地,所述步骤(2)声纹特征提取包括:

30、对每个音频帧进行傅里叶变换,将时域信号转换为频域信号;

31、进行短时傅里叶变化:

32、

33、梅尔滤波器组

34、对频谱进行梅尔滤波,将频谱映射到梅尔尺度上:

35、

36、其中,fmel是梅尔尺度下的频率,f是赫兹频率;

37、每个梅尔滤波器的响应函数h(f)通常是一个三角形函数,该函数在梅尔频率尺度上覆盖一定的频带,并且在频带的两侧呈现线性变化;

38、假设梅尔滤波器组包含m个滤波器,那么梅尔频谱的计算为:

39、

40、hi(f)是第i个梅尔滤波器的频率响应,fi是是第i个梅尔滤波器的中心频率,fi+1和fi-1是第i个滤波器的左侧和右侧的频带边界,m(fmel,t)是梅尔频谱,表示在时间t和梅尔频率fmel上的信号强度。

41、进一步地,所述步骤(3)包括输入层、卷积层、时间延迟神经网络、输出层、交叉熵损失函数、计算梯度以及参数更新。

42、进一步地,所述时间延迟神经网络tdnn通过卷积操作来捕捉时序数据中的长短期依赖关系:

43、

44、其中,h[l]是第l层的输入,是tdnn卷积核的权重,b[tdnn]是偏置项。

45、进一步地,所述交叉熵损失函数用于计算预测的x-vector与真实标签之间的差异,在多类别分类任务中,用于衡量每个类别的预测概率与实际标签之间的差异,表示为:

46、

47、其中,ti是真实标签的one-hot编码,pi是网络预测的概率值。

48、进一步地,所述步骤(4)包括:

49、输入层:接收经过dnn训练得到的x-vector特征,假设输入维度为d;

50、隐藏层:包含若干层全连接层,每层之间可能使用sigmoid激活函数进行非线性转换,隐藏层将从输入的x-vector特征中提取出有效的、能够区分不同角色的特征;

51、输出层:输出为角色类别的概率分布,通常使用softmax函数进行归一化,计算每个角色类别的预测概率;

52、softmax函数:

53、

54、其中,p(yi)是模型预测角色i的概率,zi是第i个角色的原始输出值,c是色类别数。

55、本发明所述的基于声纹角色分离与安全指令自动仲裁的系统,包括:

56、冲突检测模块:对所有接收到的指令进行实时分析,判断是否存在冲突,突检测通常包括以下两种方式:

57、规则判定模块:根据预设的规则库判断指令是否冲突;

58、条件判断模块:通过分析指令的内容和当前系统状态,判断指令是否能够同时执行;

59、角色优先级判定模块:每个角色的指令优先级根据其权限、职能、紧急程度因素设定;

60、智能裁决模块:当冲突指令发生时,系统会根据预设的规则和优先级矩阵,自动裁决,决定哪个指令应当优先执行。

61、有益效果:本发明与现有技术相比,具有如下显著优点:

62、(1)通过结合声纹识别技术和自动冲突指令仲裁机制,系统能够智能区分不同角色的指令,并在指令冲突时自动进行优先级裁决,确保指令的执行安全与高效,避免由于指令冲突或角色混淆导致的错误操作;

63、(2)精准的声纹识别:利用x-vector声纹特征提取算法,系统能够准确识别调度员、值班长、检修负责人等角色,有效提高角色识别的准确性,从而确保每个角色发出的指令根据其权限得到合理执行;

64、(3)多层次冲突处理:系统通过预设的规则库和角色权限矩阵,能够实时检测指令是否发生冲突,并根据指令的紧急程度和角色的优先级进行自动裁决,确保在多角色协作场景下的指令管理更加智能和安全;

65、(4)安全保障:通过智能裁决机制,涉及安全操作的指令(如紧急停机、暂停操作等)可以优先执行,确保在高风险操作过程中,安全指令能够优先被执行,从而保障系统的安全性。

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1