掩模计算装置、簇权重学习装置、掩模计算神经网络学习装置、掩模计算方法、簇权重学习方法和掩模计算神经网络学习方法与流程

文档序号：20167421发布日期：2020-03-24 21:55阅读：来源：国知局

技术特征：

1.一种掩模计算装置，其特征在于，具有：

特征量提取部，其从语音的观测信号中提取特征量，该语音包含至少1个以上的讲话者的语音，该1个以上的讲话者包含目标讲话者；

掩模计算部，其根据所述观测信号的特征量和适应用目标讲话者信号，计算从所述观测信号中提取目标讲话者的语音的掩模，该适应用目标讲话者信号是所述目标讲话者的语音的信号；以及

目标信号计算部，其基于所述掩模，根据所述观测信号计算所述目标讲话者的语音的信号。

2.根据权利要求1所述的掩模计算装置，其特征在于，

该掩模计算装置还具有簇权重计算部，该簇权重计算部根据所述适应用目标讲话者信号，使用第2神经网络来计算至少任意一个层被分解为多个簇的第1神经网络的与所述多个簇各自对应的权重，

所述掩模计算部根据所述观测信号的特征量，使用通过所述簇权重计算部所计算出的权重进行加权后的所述第1神经网络来计算所述掩模。

3.根据权利要求2所述的掩模计算装置，其特征在于，

所述掩模计算部针对通过向所述第1神经网络输入所述观测信号的特征量而获得的作为所述多个簇各自的输出的中间状态，使用通过所述簇权重计算部所计算出的与所述多个簇各自对应的权重进行加权后的中间状态来计算所述掩模。

4.一种簇权重学习装置，其特征在于，具有：

簇权重计算部，其根据特定讲话者的语音的信号，使用第2神经网络来计算至少任意一个层被分解为多个簇的第1神经网络的与所述多个簇各自对应的权重；

掩模计算部，其根据包含所述特定讲话者的1个以上的讲话者的语音的观测信号的特征量，使用通过所述簇权重计算部所计算出的权重进行加权后的所述第1神经网络来计算掩模，该掩模从所述1个以上的讲话者的语音的观测信号的特征量中提取所述特定讲话者的语音的特征量；

簇权重微分值计算部，其通过将所述第1神经网络和所述第2神经网络视作结合的神经网络，对该结合的神经网络进行误差反向传播，计算所述权重的微分值；以及

簇权重更新部，其根据所述簇权重微分值计算部所计算出的所述簇权重的微分值，对所述簇权重进行更新。

5.一种掩模计算神经网络学习装置，其特征在于，具有：

掩模计算部，其根据包含所述特定讲话者的1个以上的讲话者的语音的观测信号的特征量，使用所述簇权重计算部所计算出的权重进行加权后的所述第1神经网络来计算掩模，该掩模从所述1个以上的讲话者的语音的观测信号的特征量中提取所述特定讲话者的语音的特征量；

第1参数微分值计算部，其通过将所述第1神经网络和所述第2神经网络视作结合的神经网络，对该结合的神经网络进行误差反向传播，计算所述第1神经网络的参数的微分值；

第1参数更新部，其根据所述第1参数微分值计算部所计算出的参数的微分值，对所述第1神经网络的参数进行更新；

第2参数微分值计算部，其通过对所述结合的神经网络进行误差反向传播，计算所述第2神经网络的参数的微分值；以及

第2参数更新部，其根据所述第2参数微分值计算部所计算出的所述第2参数的微分值，对所述第2神经网络的参数进行更新。

6.一种掩模计算方法，由计算机执行，该掩模计算方法的特征在于，包含以下步骤：

特征量提取步骤，从语音的观测信号中提取特征量，该语音包含至少1个以上的讲话者的语音，该1个以上的讲话者包含目标讲话者；

掩模计算步骤，根据所述观测信号的特征量和适应用目标讲话者信号，计算从所述观测信号中提取目标讲话者的语音的掩模，该适应用目标讲话者信号是所述目标讲话者的语音的信号；以及

目标信号计算步骤，基于所述掩模，根据所述观测信号，计算所述目标讲话者的语音的信号。

7.一种簇权重学习方法，由计算机执行，该簇权重学习方法的特征在于，包含以下步骤：

簇权重计算步骤，根据特定讲话者的语音的信号，使用第2神经网络来计算至少任意一个层被分解为多个簇的第1神经网络的与所述多个簇各自对应的权重；

掩模计算步骤，其根据包含所述特定讲话者的1个以上的讲话者的语音的观测信号的特征量，使用通过所述簇权重计算步骤所计算出的权重进行加权后的所述第1神经网络来计算掩模，该掩模从所述1个以上的讲话者的语音的观测信号的特征量中提取所述特定讲话者的语音的特征量；

簇权重微分值计算步骤，通过将所述第1神经网络和所述第2神经网络视作结合的神经网络，对该结合的神经网络进行误差反向传播，计算所述权重的微分值；以及

簇权重更新步骤，其根据所述簇权重微分值计算步骤所计算出的所述簇权重的微分值，对所述簇权重进行更新。

8.一种掩模计算神经网络学习方法，由计算机执行，该掩模计算神经网络学习方法的特征在于，包含以下步骤：

掩模计算步骤，根据包含所述特定讲话者的1个以上的讲话者的语音的观测信号的特征量，使用通过所述簇权重计算步骤所计算出的权重进行加权后的所述第1神经网络来计算掩模，该掩模从所述1个以上的讲话者的语音的观测信号的特征量中提取所述特定讲话者的语音的特征量；

第1参数微分值计算步骤，通过将所述第1神经网络和所述第2神经网络视作结合的神经网络，对该结合的神经网络进行误差反向传播，计算所述第1神经网络的参数的微分值；

第1参数更新步骤，根据所述第1参数微分值计算步骤所计算出的参数的微分值，对所述第1神经网络的参数进行更新；

第2参数微分值计算步骤，通过对所述结合的神经网络进行误差反向传播，计算所述第2神经网络的参数的微分值；以及

第2参数更新步骤，根据所述第2参数微分值计算步骤所计算出的所述第2参数的微分值，对所述第2神经网络的参数进行更新。

完整全部详细技术资料下载

当前第2页1 2 3