蓝牙耳机的佩戴者语音检测方法、系统及蓝牙耳机与流程

文档序号:41341003发布日期:2025-03-19 14:53阅读:127来源:国知局

本发明涉及音频识别领域,具体涉及一种蓝牙耳机的佩戴者语音检测方法、系统及蓝牙耳机。


背景技术:

1、语音活动检测是一种用于判断当前音频信号中是否包含语音的技术,能够实时监测蓝牙耳机佩戴者是否正在说话,一旦检测到蓝牙耳机佩戴者正在说话,蓝牙耳机可以自动触发一系列智能响应,如关闭主动降噪、暂停音乐播放、切换到环境音模式等,以提升用户在对话中的听觉体验。

2、现有方案主要基于骨振动传感器捕捉用户说话时头部骨骼的微小振动,并将其转化为电信号后,判断用户是否正在说话。然而,该方法依赖骨振动传感器的性能与精度,成本较高。


技术实现思路

1、为解决上述问题,本发明提供一种蓝牙耳机的佩戴者语音检测方法、系统及蓝牙耳机。

2、本发明第一方面公开了一种蓝牙耳机的佩戴者语音检测方法,用于包括前馈麦克风和通话麦克风的蓝牙耳机,所述语音检测方法包括:

3、获取第一声音信号和第二声音信号;其中,所述第一声音信号来自于所述通话麦克风,所述第二声音信号来自于所述前馈麦克风;

4、基于预设的所述前馈麦克风与所述通话麦克风接收佩戴者的语音的时间差,将所述第一声音信号与所述第二声音信号进行合成,得到合成信号;

5、根据语音活动检测算法,检测所述合成信号是否包括语音信号。

6、进一步的,所述时间差为δt:

7、

8、其中,d为所述前馈麦克风与所述通话麦克风的距离,θ为预设的佩戴者的语音信号的传输方向与所述前馈麦克风与所述通话麦克风的连线之间的夹角,c为声音在空气中的传播速度。

9、进一步的,基于预设的所述前馈麦克风与所述通话麦克风接收佩戴者的语音的时间差,将所述第一声音信号与所述第二声音信号进行合成,得到合成信号的步骤包括:

10、基于所述时间差,计算所述第一声音信号的第一加权系数和所述第二声音信号的第二加权系数;

11、依据所述第一加权系数和所述第二加权系数合成所述第一声音信号和所述第二声音信号:

12、y(t)=w1*xmic1(t)+w2*xmic2(t);

13、其中,t代表时间,w1代表第一加权系数,xmic1(t)代表所述第一声音信号,w2代表第二加权系数,xmic2(t)代表所述第二声音信号,y(t)代表合成信号。

14、进一步的,基于所述时间差,计算所述第一声音信号的第一加权系数和所述第二声音信号的第二加权系数包括:

15、将所述第一加权系数设置为1;

16、基于所述时间差设置所述第二加权系数:

17、w2=e-j2πfδt;

18、其中,f代表预设的语音频率,δt代表所述前馈麦克风与所述通话麦克风的接收佩戴者的语音的时间差。

19、进一步的,所述根据语音活动检测算法,检测所述合成信号是否包括语音信号的步骤包括:

20、对合成信号进行频域转换,得到频域合成信号;

21、根据预先设置的多个频带范围,将所述频域合成信号划分为多个子带信号;

22、计算每个子带信号的语音预测概率;

23、基于所有所述子带信号的所述语音预测概率,判断所述合成信号是否包括语音信号。

24、进一步的,所述计算每个子带信号的语音预测概率的步骤包括:

25、计算每个所述子带信号的能量;

26、将所述子带信号的能量输入至高斯语音检测模型,得到每个所述子带信号的语音预测概率。

27、进一步的,将所述子带信号的能量输入至高斯语音检测模型,得到每个所述子带信号的语音预测概率的步骤包括:

28、将所述子带信号的能量输入至高斯语音检测模型的语音信号高斯混合子模型,得到每个子带信号的初始语音预测概率;

29、将所述子带信号的能量输入至高斯语音检测模型的噪音信号高斯混合子模型,得到每个子带信号的噪音预测概率;

30、计算每个子带信号的初始语音预测概率和噪音预测概率的对数似然比,得到每个所述子带信号的语音预测概率。

31、进一步的,基于所有所述子带信号的所述语音预测概率,判断所述合成信号是否包括语音信号的步骤包括:

32、基于预设的所述子带信号的加权系数,修正对应的所述语音预测概率;

33、将所有所述子带信号修正后的语音预测概率求和;

34、根据求和结果,判断所述合成信号是否包括语音信号。

35、本发明第二方面公开了一种蓝牙耳机的佩戴者语音检测系统,包括:

36、获取模块,用于获取第一声音信号和第二声音信号;其中,所述第一声音信号来自于所述通话麦克风,所述第二声音信号来自于所述前馈麦克风;

37、合成模块,用于基于预设的所述前馈麦克风与所述通话麦克风接收佩戴者的语音的时间差,将所述第一声音信号与所述第二声音信号进行合成,得到合成信号;

38、检测模块,用于根据语音活动检测算法,检测所述合成信号是否包括语音信号。

39、本发明第三方面公开了一种蓝牙耳机,所述蓝牙耳机包括前馈麦克风、通话麦克风和处理器,所述处理器能执行如本发明第一方面任一项所述的蓝牙耳机的佩戴者语音检测方法。

40、本发明通过充分利用麦克风阵列的空间信息,在信号层面上实现了语音增强和噪声抑制,为后续的语音活动检测创造了有利条件。与传统的单麦克风方案相比,本发明无需引入额外的硬件设备,这不仅降低了系统的复杂度,减少了计算开销,而且也大大降低了硬件成本。



技术特征:

1.一种蓝牙耳机的佩戴者语音检测方法,其特征在于,用于包括前馈麦克风和通话麦克风的蓝牙耳机,所述语音检测方法包括:

2.根据权利要求1所述的一种蓝牙耳机的佩戴者语音检测方法,其特征在于,所述时间差为δt:

3.根据权利要求1所述的一种蓝牙耳机的佩戴者语音检测方法,其特征在于,基于预设的所述前馈麦克风与所述通话麦克风接收佩戴者的语音的时间差,将所述第一声音信号与所述第二声音信号进行合成,得到合成信号的步骤包括:

4.根据权利要求3所述的一种蓝牙耳机的佩戴者语音检测方法,其特征在于,基于所述时间差,计算所述第一声音信号的第一加权系数和所述第二声音信号的第二加权系数包括:

5.根据权利要求1所述的一种蓝牙耳机的佩戴者语音检测方法,其特征在于,所述根据语音活动检测算法,检测所述合成信号是否包括语音信号的步骤包括:

6.根据权利要求5所述的一种蓝牙耳机的佩戴者语音检测方法,其特征在于,所述计算每个子带信号的语音预测概率的步骤包括:

7.根据权利要求6所述的一种蓝牙耳机的佩戴者语音检测方法,其特征在于,将所述子带信号的能量输入至高斯语音检测模型,得到每个所述子带信号的语音预测概率的步骤包括:

8.根据权利要求5所述的一种蓝牙耳机的佩戴者语音检测方法,其特征在于,基于所有所述子带信号的所述语音预测概率,判断所述合成信号是否包括语音信号的步骤包括:

9.一种蓝牙耳机的佩戴者语音检测系统,其特征在于,包括:

10.一种蓝牙耳机,所述蓝牙耳机包括前馈麦克风、通话麦克风和处理器,所述处理器能执行如权利要求1-8任一项所述的蓝牙耳机的佩戴者语音检测方法。


技术总结
本发明涉及音频识别领域,具体涉及一种蓝牙耳机的佩戴者语音检测方法、系统及蓝牙耳机,包括:获取第一声音信号和第二声音信号;其中,所述第一声音信号来自于所述通话麦克风,所述第二声音信号来自于所述前馈麦克风;基于预设的所述前馈麦克风与所述通话麦克风接收佩戴者的语音的时间差,将所述第一声音信号与所述第二声音信号进行合成,得到合成信号;根据语音活动检测算法,检测所述合成信号是否包括语音信号。本发明与传统的单麦克风方案相比,本发明无需引入额外的硬件设备,这不仅降低了系统的复杂度,减少了计算开销,而且也大大降低了硬件成本。

技术研发人员:魏子凯
受保护的技术使用者:恒玄科技(上海)股份有限公司
技术研发日:
技术公布日:2025/3/18
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!