用于语音欺骗检测的基于卷积长短期记忆端对端深度神经网络的制作方法

文档序号：12721602阅读：来源：国知局

技术特征：

1.一种用于端对端原波语音欺骗检测的卷积长短期记忆深度神经网络，其特征在于，包括：一个具备长短期记忆序列映射的卷积神经网络前端和一个神经网络直接分类器，其中：

所述的卷积神经网络前端包括：至少两个用于标准特征提取的CNN和至少一个用于标签预测的CNN，该用于标签预测的CNN标准特征以长短期记忆的序列方式进行标签预测。

2.根据权利要求1所述的卷积长短期记忆深度神经网络，其特征是，所述的用于标准特征提取的CNN采用时序卷积神经网络进行标准特征提取，其中：第一个CNN将导入的原波输入缩小为固定大小的向量，第二个CNN则对缩小后的特征信号进行不变性转化。

3.根据权利要求2所述的卷积长短期记忆深度神经网络，其特征是，所述的向量的大小与常量特征39维相似。

4.根据权利要求2所述的卷积长短期记忆深度神经网络，其特征是，所述的不变性转化是指：包括256个特征映射，在每个时间步长内一个样本产生一个256维的输入特征。

5.根据权利要求1所述的卷积长短期记忆深度神经网络，其特征是，所述的长短期记忆的序列方式为每个时间步长作一个向量的输出，并采用输出序列中的最后一个作为代表输出。

6.根据权利要求1所述的卷积长短期记忆深度神经网络，其特征是，所述的神经网络直接分类器为包含有两层标准前馈的深度神经网络，通过插入原波话语得到的相关分类的评分进行设计，并采用标准反传算法逐层训练得以实现。

7.根据权利要求1所述的卷积长短期记忆深度神经网络，其特征是，所述的原波语音根据目标帧大小分为同等大小的向量，帧的大小由波形文件的采样率决定。

8.根据权利要求2所述的卷积长短期记忆深度神经网络，其特征是，所述的标准特征提取，采用重叠以在单个帧内包含一个上下文信息。

完整全部详细技术资料下载

当前第2页1 2 3