一种基于毫米波感知振动信号的抗噪声声纹识别方法

文档序号:36242989发布日期:2023-12-02 06:21阅读:123来源:国知局

本发明涉及无线智能感知领域,尤其涉及一种基于毫米波感知振动信号的抗噪声声纹识别方法。


背景技术:

1、随着声控设备和语音交互服务的快速增长,将基于声纹的生物识别技术用于用户认证、语音助理的研究越来越多。声纹是一种生理和行为相结合的生物特征,具有生物识别的普遍性、唯一性、持久性和可操作性等特点,因此可以通过提取说话人独特的声纹特征进行说话人的识别。现有的声纹感知主要通过特殊的硬件设备如麦克风、加速度计等实现,存在声音被截获或者模仿等识别的安全风险。

2、声带是一个非常重要的发声器官,其振动通过声腔发出具有独特特征的声音。通过毫米波感知方式,实现非接触式直接采集声带振动信号,可以实现便捷、安全的声纹识别,然而通过毫米波感知采集的声带振动信号非常微弱,容易被环境噪声淹没,从而导致无法提取能够正确识别说话人声纹的特征。


技术实现思路

1、针对现有技术的不足,本发明提出一种基于毫米波感知振动信号的抗噪声声纹识别方法,利用了由声带振动引起的目标人喉咙附近皮肤反射射频信号的独特干扰,通过毫米波感知接收反射射频信号,采用一系列信号智能分析方法,提取声纹特征,实现抗噪声声纹识别,从而区分说话人的身份。

2、具体技术方案如下:

3、一种基于毫米波感知振动信号的抗噪声声纹识别方法,包括以下步骤:

4、s1:使用毫米波雷达向目标人发射射频信号,并接收目标人说话时对发射信号调制后的回波信号,将回波信号与发射信号混合后的中频信号作为毫米波雷达的接收信号;

5、s2:通过波束成形算法提高接收信号的信噪比;通过波束成形后的接收信号表达式为:

6、

7、xl(t)=[x1,1(tk,ti),x1,2(tk,ti),…,xm,n(tk,ti)]

8、式中,θ为目标人相对毫米波雷达的方位角,为俯仰角,t为采样时间,x(tk,ti)为通过i次采样的第k个啁啾信号发射后得到的接收信号,表示导向矢量的共轭转置矢量,xl(t)表示信道l的接收向量;m、n分别为毫米波雷达虚拟天线阵列的行数、列数;

9、s3:对接收信号进行预处理:对毫米波雷达感知区域按单元进行划分,得到存在感知目标的候选单元集,去除其中判断为静态反射物和随机身体运动的候选单元,定位喉咙部位以获得声带振动的数据;

10、s4:对所述声带振动的数据进行特征提取:取喉咙部位单元中的采集的平均信号作为声带振动的射频接收信号采用提取mel频率倒谱系数的方式获得声带振动的轨迹;

11、s5:对声带振动的轨迹进行基于深度神经网络alexnet的声纹识别。

12、进一步地,所述s1具体为:

13、毫米波雷达发射调频连续波信号,通过目标人调制后反射回波信号,所述调频连续波信号和回波信号通过混频器混频得到中频信号,其表达式如下:

14、

15、式中,j为虚数单位,λc为载波波长,s为调频连续波信号的每个啁啾信号的斜率,c=3×108m/s为光速;公式中第三项值过小,能忽略不计;r(t)为毫米波雷达与目标人之间的位移,包含了两个位移信号,其表达式如下:

16、r(t)=r0+r(t)

17、式中,r0为毫米波雷达与目标人之间的固定距离,r(t)为声带振动引起的喉咙皮肤位移;

18、得到通过i次采样的第k个啁啾信号发射后,接收信号的表达式如下:

19、

20、进一步地,所述s2具体为:

21、对于m×n的多天线毫米波雷达,相当于m×n元素的虚拟天线阵列,第l信道(l=1,2,…,m×n)的接收信号表达式为:

22、

23、式中,dl为信道l引起的相对距离;

24、第m个发射天线的导向矢量和第n个接收天线的导向矢量分别表示为:

25、

26、

27、式中,rm,y表示发射天线m到目标人的距离的y坐标,rm,z表示发射天线m到目标人的距离的z坐标;rn,x表示接收天线n到目标人的距离的x坐标,rn,y表示接收天线n到目标人的距离的y坐标;指向方向的导向矢量为所有发射和接收天线的导向矢量的乘积,其表达式如下:

28、

29、式中,为m个发射天线的导向矢量的乘积,为n个接收天线的导向矢量的乘积。

30、进一步地,所述s3具体通过如下子步骤实现:

31、s3.1:对雷达感知信号空间按单元进行划分,根据毫米波雷达的距离分辨率,将雷达感知的区域划分为多个长方体单元,以距离分辨率为长方体单元的一个边长,每个长方体单元的长为δr,宽为高为其中,为距离分辨率,b为啁啾信号的带宽,δθ为方位角的间距,为俯仰角的间距,δθ和均为人为定义;

32、s3.2:形成感知目标的候选单元集。为了定位目标人的喉咙部位位置,通过二维自适应cfar算法判断每个长方体单元内是否存在感知目标,将存在感知目标的单元作为目标候选单元,每个长方体单元接收到的信号通过如下表达式表示:

33、

34、式中,d()表示假设检验,h0为原假设,h1为备择假设,n(t)为高斯白噪声信号;γ为决策阈值,γ=max(t1,t2),t1=α*μ1,是平均噪声功率和阈值因子α的乘积,e()表示均值,为每个固定方位角θ、俯仰角的表示,阈值因子α取决于所需的虚警概率pα=p(h0>α*μ1),p()表示求概率;t2=β*μ2,是平均噪声功率和阈值因子β的乘积,为每个固定信道l的表示,阈值因子β取决于所需的虚警概率pβ=p(h0>β*μ2);

35、若则认为该长方体单元内存在感知目标,该长方体单元记为候选单元,取所有候选单元,形成感知目标的候选单元集

36、s3.3:进行静态反射物检测,计算每个候选单元相位的方差统计值其表达式如下:

37、

38、式中,代表接收信号的相位,vart为t维度的方差;

39、如果则认为该候选单元为静态反射物反射的信号;

40、s3.4:进行随机身体运动检测,设定门限ηmax,若存在则认为该候选单元为随机身体运动;

41、若且随机身体运动没有周期性,而浊音信号的时域波形具有明显的短时周期性,还能通过自相关函数rx,x(τ)判断该候选单元是否为随机身体运动,rx,x(τ)的表达式如下:

42、

43、式中,x(t)表示候选单元中接收信号的值τ为延时;

44、因此,当或rx,x(τ)<γr时,该候选单元为随机身体运动反射的信号;

45、s3.5:在候选单元中将判断为静态反射物反射的信号的候选单元、判断为随机身体运动反射的信号的候选单元剔除后,剩余的候选单元组成目标位置,即感知声带振动的喉咙部位。

46、进一步地,所述s4具体通过如下子步骤实现:

47、s4.1:将射频接收信号经过短时傅里叶变换转换获得功率谱,使用m个三角带通的滤波器组将功率谱映射到非线性mel刻度上

48、s4.2:对每个mel频率下的数据进行对数压缩,并对其进行离散余弦变化,获得m个mel频率倒谱系数;

49、s4.3:对m个mel频率倒谱系数分别取一阶导数和二阶导数,从而获得m×3个mel频率倒谱特征值,即得到声带振动的轨迹。

50、进一步地,所述s5中,深度神经网络alexnet的配置依次为:

51、一个输入层,用于从m×3的mel频率倒谱系数特征值矩阵中读取数据;

52、两个卷积层,具有3×3的64通道滤波器;每个卷积层后面依次包括一个归一化层,用于归一化数据;一个线性整流函数层,用于激活函数,使准确率更高;

53、三个完全连接层,每个完全连接层具有1024个神经元;

54、一个具有2个神经元的完全连接层;一个1×2的softmax激活函数层,用于进行二分类,一类是通过说话人声纹识别的正确用户,另一个类是其他。

55、本发明的有益效果是:

56、(1)本发明提出基于距离分辨率的单元划分方法,联合静态反射物检测和随机身体运动检测抑制杂波影响,定位声带振动喉咙部位,提高声纹识别的抗噪性、准确性和鲁棒性。

57、(2)传统的声纹识别主要采用扬声器采集语言信号,容易受到伪造或重放攻击,本发明所用的方法通过毫米波雷达直接感知声带振动,减少识别的安全风险。

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1