技术特征:
技术总结
本发明公开一种单信道多说话人身份识别方法及系统,所述单信道多说话人身份识别方法包括:获取待识别的关于单信道多说话人的语音数据的混合帧级特征;将混合帧级特征输入至卷积神经网络模型,以由卷积神经网络模型推导关于多说话人各自作为参考目标说话人的帧级别概率分布;根据帧级别概率分布,预测关于多说话人各自作为参考目标说话人的语句级别概率分布;以及基于语句级别概率分布,识别语音数据所对应的说话人身份。本发明实施例的单信道多说话人身份识别方法,以卷积神经网络模型作为学习机器,提高了说话人身份识别的高精确度,并不需要对每种可能的说话人组合都建模,对计算和存储资源的消耗较低,提高了身份识别系统的性能。
技术研发人员:俞凯;钱彦旻;王帅
受保护的技术使用者:苏州思必驰信息科技有限公司;上海交通大学
技术研发日:2018.01.19
技术公布日:2018.08.17