本发明属于通信技术领域,具体的说是涉及一种用于盲源分离的特征提取方法。
背景技术:
盲源分离指在源信号和传输通道均未知的情况下,仅利用传感器检测到的混合信号来分离或估计原始源信号的过程。目前绝大多数的盲源分离方法都基于源信号在某变换域的稀疏特性进行研究。在稀疏假设的前提下,对观测信号在时频域携带的某些特征进行分析,并对具有同一特征(或相似特征)的时频点进行聚类,从而实现源信号的分离。但是由于聚类方法对畸值特别敏感,而传统的特征提取方法实际上无法保证所提取的特征不存在畸值,因此在实际应用中,某些时频点的估计误差会使分离效果急剧下降。
技术实现要素:
本发明为了解决现有技术中存在的不足,提供了一种利用深度学习方法做特征提取,并结合聚类方法来完成盲源分离的方法,从而可以实现对多种未知源信号的混合信号的分离。
本发明的技术方案为:
一种用于盲源分离的特征提取方法,其特征在于,包括以下步骤:
s1、对混合盲源信号进行预处理,获得时频特征,将其作为训练数据输入到神经网络中;
s2、对训练数据添加参考标签,原则是:根据各个源信号在时频点的能量大小来决定该时频点的标签,即在某一时刻时频点的能量最大的源信号标记为“1”,其余源信号标记为“0”;
s3、采用深度学习方法,拟合出具有如下特征的神经网络目标函数:根据参考标签极小化该目标函数的过程中,当目标函数收敛时,同一源信号的时频点的欧式距离和达到最小,不同时频点的欧式距离和达到最大;使得每个时频点位置能被正确编码,保证满足聚类的条件——不存在畸值,从而可以达到良好的分离效果;
s4、将混合盲源信号输入训练好的神经网络中,根据神经网络的输出,对不同源的信号进行聚类,利用特征集合构造时频掩蔽矩阵,计算频谱并得到分离后的时域信号。
进一步的,所述步骤s1的具体方法为:
对混合源信号使用32ms帧长、8ms窗口移位以及hann窗口平方根的短时傅里叶变换得到信号时频图,该谱图为t*f的矩阵,t为混合信号的时间长度,单位为s;f为混合信号的频域长度,单位为hz;对时频点作对数处理,记为log|xt,f|,作为训练数据。
进一步的,所述步骤s2的具体方法为:
本发明根据能量占优原则对训练数据设置参考标签。标签为根据各个源信号在时频点的能量大小来决定该时频点的标签。若训练时的混合信号由两个源构成,即c=2,源信号α在某一时频点大于源信号β在该时频点的能量,则该时频点的标签为(1,0);若训练时的混合信号由3个源信号构成,即c=3,源信号γ在某一时频点的能量大于源信号α,β,则该时频点的标签为(0,0,1)。
进一步的,所述步骤s3的具体方法为:
设定神经网络由2个具有600个隐藏单元的长短期记忆层和1个具有100个单元的全连接层构成;该网络对应于嵌入维度k,采用动量0.9和固定学习率10^(-5)进行随机梯度下降进行训练,relu函数用作输出层的激活函数,输出θ∈rtf*k是k维输出嵌入特征;神经网络的标签记为y={yn,c}∈rtf*c,c为混合源信号中源的数目;
采用深度学习方法,拟合的神经网络目标函数为:
其中
进一步的,所述步骤s4的具体方法为:
s41、设混合盲源信号中共有n个源信号,将其作为已训练好的神经网络的输入,得到输出嵌入特征θ,对嵌入特征θ的行向量进行聚类,将聚类数目设置为混合源数目n;
s42、聚类之后,得到一组属于不同源的特征集合ωn,n=1,2,...,n,由此构造二值时频掩蔽矩阵:
s43、通过下式获得时频域中的估计信号:
sn(t,f)=mn(t,f)x(t,f)
对频谱进行逆短时傅里叶变换(istft)后得到时域信号。
本发明的有益效果为:可以实现对多种未知源信号的混合信号的分离。
附图说明
图1为本发明的流程示意框图;
图2为深度学习提取特征模块示意图。
具体实施方式
在发明内容部分已经对本发明进行了详细描述,在此不再赘述。