1.一种采用端到端时域声源分离系统进行环境噪声智能监测的方法,其特征在于:包括以下步骤:
步骤1:建立训练数据集,在训练数据集中引入尽可能多的声源种类;
步骤2:从训练数据集中随机选择两个不同声源种类,并以随机信噪比进行混合获得混合声源;
步骤3:重复步骤2,得到大量混合声源数据;
步骤4:搭建端到端时域声源分离系统:
依据编码器-分离器-解码器的框架创建时域分离网络;其中编码器通过一维卷积层实现,其滤波器组的形式采用参数化听觉滤波器组;分离器用于估计声源的掩模;解码器为一维反卷积层;来自分离器的每个声源的掩模估计值与来自编码器的混合声的二维表达相乘,之后能够通过解码器合成分离声源的时域信号;
步骤5:利用步骤3得到的混合声源数据对时域分离网络进行训练,获得端到端时域声源分离系统;
步骤6:利用步骤5训练得到的端到端时域声源分离系统进行环境噪声智能监测,分离出目标噪声并进行后续噪声评估。
2.根据权利要求1所述一种采用端到端时域声源分离系统进行环境噪声智能监测的方法,其特征在于:所述参数化听觉滤波器组采用gammatone滤波器,滤波器的数量n不小于32;滤波器时域脉冲响应由gamma分布调制的纯音:
g(t)=atp-1e-2πbtcos(2πfct+φ)
其中p为阶数,fc为中心频率,b为带宽,φ为相位,a为幅度,通过阶数p与带宽b确定。
3.根据权利要求2所述一种采用端到端时域声源分离系统进行环境噪声智能监测的方法,其特征在于:幅度取值为
4.根据权利要求1所述一种采用端到端时域声源分离系统进行环境噪声智能监测的方法,其特征在于:步骤5进行训练前,根据人耳听觉系统的先验知识对各个滤波器的参数集
(1)各滤波器的阶数pi都初始化设定为4,对应人耳听觉系统中滤波器阶数的平均拟合值;
(2)各滤波器的中心频率
(3)各滤波器的初始化带宽bi由
(4)各滤波器的初始化相位φi设定为
5.根据权利要求1所述一种采用端到端时域声源分离系统进行环境噪声智能监测的方法,其特征在于:所述分离器采用基于深度卷积的网络结构,包含多个具有不同扩张因子的带洞卷积模块,每个模块中又包含卷积层、整流层、归一化层、深度卷积层以及留数和跳跃结构。
6.根据权利要求1所述一种采用端到端时域声源分离系统进行环境噪声智能监测的方法,其特征在于:步骤5训练时域分离网络时,以最小化真实声源和估计声源之间的尺度不变信号失真比作为训练目标,通过adam优化器训练网络,直到分离性能不再提高,获得端到端时域声源分离系统。