基于支持向量机的说话人确认方法及其系统的制作方法

文档序号:10490238阅读:285来源:国知局
基于支持向量机的说话人确认方法及其系统的制作方法
【专利摘要】本发明公开了一种基于支持向量机的说话人确认方法,包括如下步骤:建立通用信道模型;将纯净语音经过所述通用信道模型,提取纯净特征参数;对测试语音直接提取测试特征参数;将纯净特征参数和测试特征参数融合,组合成融合特征参数;将融合特征参数通过说话人支持向量机模型进行匹配,得出确认结果。所述建立通用信道模型具体是:通过对来自不同信道的训练语音融合为一个多通道信息的带通滤波器;其中,所述训练语音为纯净语音。本发明还对应公开了一种基于支持向量机的说话人确认系统,包括建模模块、提取模块、融合模块和确认模块。采用本发明,具有识别率高的特点。
【专利说明】
基于支持向量机的说话人确认方法及其系统
技术领域
[0001] 本发明属于说话人识别技术领域,具体涉及一种基于支持向量机的说话人确认方 法及其系统。
【背景技术】
[0002] 说话人识别属于生物识别技术的一种,以其独特的方便性、经济性和准确性等优 势受到世人瞩目,广泛应用于安全控制、保密部门身份验证、法庭鉴别等行业。
[0003] 与文本无关的说话人识别技术是当前研究重点,目前最常用的方法有:基于VQ矢 量量化的方法,基于HMM概率统计模型的方法,基于GMM高斯混合模型的方法和基于ANN人工 神经网络的方法等.目前基于GMM的说话人识别系统,在安静环境下用高品质话筒采集语 音,对于几十名话者的识别率可达90%以上.
[0004] 但对于实际GSM网络传输的电话语音,存在噪声的实际环境语音进行识别时性能 显著恶化.识别环境与训练环境失配导致的语音声学参数的变异是识别率下降的主要原 因.减小环境失配影响的方法主要有特征参数补偿和鲁棒特征提取。MFCC就是一种目前广 泛采用具有鲁棒性的参数;实际应用中的特征参数补偿技术有:谱减法(SS)倒谱均值减。 (CMS)、特征映射等.其中谱减法主要用于消除环境中的加性干扰噪声,CMS可用于消除线性 信道干扰.而特征映射需要首先训练一个通用背景模型(GMMUBM) ,GMM-UBM结构复杂而且收 敛速度较慢.
[0005] 现有采用MFCC参数,基于GMM模型,设计了一个30人的说话人识别系统,在干净环 境(训练和识别语音未受任何加性和卷积噪声影响)下该系统的识别率可以达到93%,然而 在通信环境下(识别语音来自无线信道),识别率则大幅度下降,只能达到58%.对训练和识 别语音都做了CMS处理之后,系统识别率提升了 14%,但是对于总体而言,识别率还是不能 满足更高的要求。
[0006] 因此,通过支持向量机(Support Vector Machine,SVM)的说话人模型,是一种区 分性模型,着眼于两类数据的边界描述,不注重某类数据内部的分布,具有良好的区分性。 但是在实际测试过程总,在低频部分,信道变化比较大,而高频分变化比较小,在改善训练 和测试语音的特征参数匹配度上依然不高,最后导致识别率不高。

【发明内容】

[0007] 为了解决上述问题,本发明的第一目的提供一种基于支持向量机的说话人确认方 法,具有识别率高的特点。
[0008] 为实现上述目的,本发明按以下技术方案予以实现的:
[0009] 本发明所述的基于支持向量机的说话人确认方法,包括如下步骤:
[0010]建立通用信道模型;
[0011] 将纯净语音经过所述通用信道模型,提取纯净特征参数;
[0012] 对测试语音直接提取测试特征参数;
[0013] 将纯净特征参数和测试特征参数融合,组合成融合特征参数;
[0014] 将融合特征参数通过说话人支持向量机模型进行匹配,得出确认结果。
[0015] 进一步地,所述建立通用信道模型具体是:通过对来自不同信道的训练语音融合 为一个多通道信息的带通滤波器;其中,所述训练语音为纯净语音。
[0016] 进一步地,所述将纯净特征参数和测试特征参数融合步骤具体是:
[0017] 将纯净特征参数进行向量化,得到纯净高维向量;
[0018] 将测试特征参数进行向量化,得到测试高维向量;
[0019] 然后将纯净高维向量和测试高维向量堆叠在一起,组合成融合特征参数。
[0020] 进一步地,对所述纯净特征参数和测试特征参数的提取都包括对Mel频率倒谱系 数MFCC和感知线性预测系统PLP的提取。
[0021] 进一步地,所述将融合特征参数通过说话人支持向量机模型进行匹配,得出确认 结果的具体步骤是:
[0022I对融合特征参数进行预处理;
[0023] 提取预处理后的语音信息的特征参数;
[0024] 将所述特征参数与支持向量机模型的相关特征参数进行匹配,判断是否匹配,如 果是,则输出"肯定";否则,则输出"否定"。
[0025] 本发明的第二目的提供一种基于支持向量机的说话人确认系统,具有识别率高的 特点。
[0026] 为实现上述目的,本发明按以下技术方案予以实现的:
[0027] 本发明所述的基于支持向量机的说话人确认的系统,包括:
[0028] 建模模块,用于建立通用信道模型;
[0029] 提取模块,用于提取纯净语音和测试语音的特征参数,分别得到纯净特征参数和 测试特征参数,其中所述纯净语音首先需要经过所述通用信道模型;
[0030] 融合模块,用于将纯净特征参数和测试特征参数融合,得到融合特征参数;
[0031] 确认模块,用于将融合特征参数通过说话人支持向量机模型进行匹配,得出确认 结果。
[0032] 本发明的第三目的提供一种基于支持向量机的说话人确认方法,具有识别率高的 特点。
[0033] 为实现上述目的,本发明按以下技术方案予以实现的:
[0034] 本发明所述的基于支持向量机的说话人确认方法,包括如下步骤:
[0035] 将纯净语音进行特征参数的提取,得到纯净特征参数;
[0036] 将纯净特征参数进行特征补偿,得到纯净补偿特征参数;
[0037] 将训练语音进行特征参数的提取,得到训练特征参数;
[0038] 将训练特征参数进行特征补偿,得到训练补偿特征参数;
[0039] 将纯净补偿特征参数与训练补偿特征参数进行融合,得到融合补偿特征参数;
[0040] 将融合补偿特征参数通过说话人支持向量机模型进行匹配,得出确认结果。
[0041] 进一步地,所述将纯净特征参数进行特征补偿的具体步骤是:利用NMF非负矩阵分 解算法对纯净特征参数进行增加和降噪处理;
[0042] 所述将训练特征参数进行特征补偿的具体步骤是:利用NMF非负矩阵分解算法对 训练特征参数进行增加和降噪处理;所述将纯净补偿特征参数与训练补偿特征参数进行融 合步骤具体是:将纯净补偿特征参数进行向量化,得到纯净补偿高维向量;将训练补偿特征 参数进行向量化,得到训练补偿高维向量;然后将纯净补偿高维向量和训练补偿高维向量 堆叠在一起,得到融合补偿特征参数。
[O 04 3 ]进一步地,对所述纯净特征参数和训练特征参数的提取都包括对M e 1频率倒谱系 数MFCC和感知线性预测系统PLP的提取。
[0044] 本发明的第四目的提供一种基于支持向量机的说话人确认系统,具有识别率高的 特点。
[0045] 为实现上述目的,本发明按以下技术方案予以实现的:
[0046] 提取模块,用于提取纯净语音和训练语音的特征参数,分别得到纯净特征参数和 训练特征参数;
[0047] 补偿模块,用于对纯净特征参数和训练特征参数进行特征补偿,分别得到纯净补 偿特征参数和训练补偿特征参数;
[0048] 融合模块,用于将纯净特征补偿参数和训练补偿特征参数进入融合,得到融合补 偿特征参数;
[0049] 确认模块,用于将融合特征参数通过说话人支持向量机模型进行匹配,得出确认 结果。
[0050] 与现有技术相比,本发明的有益效果是:
[0051] 本发明所述的一种基于支持向量机的说话人确认方法,其中第一种方式是利用建 立通用信道模型,然后将纯净语音通过通用信道模型中进行滤波后,进行特征参数的提取, 得到纯净特征参数;与此同时,将测试语音直接进行特征参数的提取,得到测试特征参数; 然后将纯净特征参数与测试特征参数进行融合,得到融合特征参数。最后将所述融合特征 参数通过说话人支持向量机模型进行匹配,得出确认结果。其利用了在对不同信道的测试 结果中,多次测量得到的信道特征类似,所以采用在前期对已测信道特征的统计平均作为 实际信道的通用模型,并且将纯净语音通过该通用信道模型作为训练语音,通过实验表明, 经过该方式处理后,识别率有所提升。另外,对应于本发明所述的一种基于支持向量机的说 话人确认系统,其采用对应的建模模块用于建立通用信道模型,然后通过提取模块用于提 取纯净语音以及测试语音的特征参数,然后在通过融合模块对纯净特征惨呼和测试特征参 数融合,然后得到融合特征参数,该融合特征参数经过确认模块进行确认,得出最后的确认 结果。
[0052] 本发明所述的另一种基于支持向量机的说话人确认方法,通过将提取的特征参数 进行补偿,进而去除第一维和第二维的特征参数,接着再将补偿后的纯净补偿特征参数进 行融合,得到融合补偿特征参数,该融合补偿特征参数通过说话人支持向量机模型进行匹 配后,得出确认结果。该方法通过对提取的特征参数进行补偿后,将对识别存在较大影响的 第一维系数和第二维系数去掉,从而对整个识别效果会得到一定改善。另外,与之对应的一 种基于支持向量机的说话人确认系统,其设置有提取模块,补偿模块,融合模块以及确认模 块,其中补偿模块用于对纯净特征参数和训练特征参数进行特征补偿,使得提取后的特征 参数的特征的局部可区分化,进而提高了识别效果。
【附图说明】
[0053] 下面结合附图对本发明的【具体实施方式】作进一步详细的说明,其中:
[0054] 图1是本发明所述的基于支持向量机说话人确认方法中的实施例1的流程图;
[0055] 图2是本发明所述的基于支持向量机说话人确认方法中的实施例1的结构示意图;
[0056] 图3是本发明所述的基于支持向量机说话人确认方法中的实施例2的流程图;
[0057] 图4是本发明所述的基于支持向量机说话人确认方法中的实施例2的结构示意图;
[0058] 图5是本发明所述的基于支持向量机说话人确认方法将实施例1和实施例2分别实 验的示意图。
[0059] 图中:
[0060] 1:建模模块2:提取模块3:融合模块4:确认模块5:补偿模块
【具体实施方式】
[0061]以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实 施例仅用于说明和解释本发明,并不用于限定本发明。
[0062] 实施例1:
[0063]本发明所述的基于支持向量机的说话人确认方法,通过对前端的训练语音进行处 理,去除不同信道带来的测试结果的影响,因此建立通用信道模型,该通用信道模型是通过 前期已测信道特征的统计平均作为实际信道的通用模型,因此避免了每次信道不同带来的 识别影响。具体步骤如下:
[0064] S101:建立通用信道模型;
[0065] 通过对来自不同信道的训练语音融合为一个多通道信息的带通滤波器,也即是通 过前期已测信道特征的统计平均作为实际信道的通用模型;其中,所述训练语音为纯净语 音。
[0066] S102:将纯净语音经过所述通用信道模型,提取纯净特征参数;
[0067] 该提取的特征参数包括Mel频率倒谱系数MFCC和感知线性预测系统PLP。
[0068] S103:对测试语音直接提取测试特征参数;
[0069] S104:将纯净特征参数和测试特征参数融合,组合成融合特征参数;
[0070] 将纯净特征参数和测试特征参数分析进行向量化,得到纯净特征高维向量和测试 特征高维向量,然后将高维向量堆叠在一起,得到融合特征参数。
[0071 ] S105:将融合特征参数通过说话人支持向量机模型进行匹配,得出确认结果:
[0072] 其具体还包括:S1051:对融合特征参数进行预处理,所述预处理包括预加重处理 和分帧加窗处理,其中预加重处理用以去除辐射影响,分帧加窗处理用于克服吉布斯现象。 通过传递函数H(Z) = Iif1的一阶高通滤波器滤波实现预加重,其中a为预加重系数;同时 语音信号的分帧加窗,主要是为了克服吉布斯现象,使语音在短时(IOms~40ms)内能够平 滑过渡,保持其连续性,更加稳定.本文采用Hamming窗,其时域形式为:
[0073]
[0074] S1052:提取预处理后的语音信息的特征参数,具体如下:
[0075] 先对语音信号端点检测以提取语音的有用部分,去除静音段.因为浊音的能量较 大,清音和静音的能量较小,但清音的短时过零率很大,所以本文采用基于短时能量和过零 率双门限判别法提取有声部分。端点检测之后,对语音帧进行短时傅里叶变换并计算其短 时能量谱,再用S个Mel带通滤波器组滤波,最后对这S个滤波器的输出功率取对数和反离散 余弦变换之后就得到S个MFCC系数.一般取S前1216个。
[0076] S1053:将所述特征参数与支持向量机模型的相关特征参数进行匹配,判断是否匹 配,如果是,则输出"肯定";否则,则输出"否定"。
[0077] 本发明所述的基于支持向量机的说话人确认方法,通过建立通用信道模型,保证 训练语音能适用于各种不同的信道,进而保证后续再识别过程中的效率提高。
[0078] 与之对应的基于支持向量机的说话人确认系统,包括如图2所示的组成结构,具体 包括建模模块1、提取模块2、融合模块3和确认模块4。
[0079] 其中,所述建模模块1用于建立通用信道模型;
[0080] 所述提取模块2用于提取纯净语音和测试语音的特征参数,分别得到纯净特征参 数和测试特征参数,其中所述纯净语音首先需要经过所述通用信道模型;其中纯净特征参 数和测试特征参数的提取都包括对Mel频率倒谱系数MFCC和感知线性预测系统PLP的提取。
[0081] 所述融合模块3用于将纯净特征参数和测试特征参数融合,得到融合特征参数;
[0082] 所述确认模块4用于将融合特征参数通过说话人支持向量机模型进行匹配,得出 确认结果。
[0083] 在所述确认模块4在进行匹配的过程中,具体包括有对融合特征参数的预处理,该 预处理有包括有预加重处理和分帧加窗处理,其中预加重处理用以去除辐射影响,分帧加 窗处理用于克服吉布斯现象。通过传递函数H(Z) = Iif1的一阶高通滤波器滤波实现预加 重,其中a为预加重系数;同时语音信号的分帧加窗,主要是为了克服吉布斯现象,使语音在 短时(IOms~40ms)内能够平滑过渡,保持其连续性,更加稳定.本文采用Hamming窗,其时域 形式为:
[0084]
[0085] 本发明所述的基于支持向量机的说话人确认方法和系统,是通过对训练语音进行 前端处理,即设计一个通用信道模型,该通用信号模型是用于对已测信道特征的统计平均 作为实际信道的通用模型,因此避免了每次信道不同带来的不良影响。
[0086] 实施例2:
[0087]本发明另一种所述的基于支持向量机的说话人确认方法,是建立在对于已经提取 特征参数的训练语音和纯净语音进行补偿,该补偿可以对特征参数进行增加和降噪处理, 使得补偿后的特征参数的局部可区分性提高,进而为后序的确认效果提高打下了基础。如 图3所示,具体步骤如下:
[0088I S201:将纯净语音进行特征参数的提取,得到纯净特征参数;
[0089] 该提取过程中,包括对Mel频率倒谱系数MFCC和感知线性预测系统PLP的提取。
[0090] S202:将纯净特征参数进行特征补偿,得到纯净补偿特征参数;
[0091]该步骤中采用了 NMF非负矩阵分解算法对特征参数进行补偿,具体对特征参数进 行增加和降噪处理,以提高局部可区分性。
[0092] S203:将训练语音进行特征参数的提取,得到训练特征参数;
[0093] 该提取过程中,包括对Mel频率倒谱系数MFCC和感知线性预测系统PLP的提取。
[0094] S204:将训练特征参数进行特征补偿,得到训练补偿特征参数;
[0095] S205:将纯净补偿特征参数与训练补偿特征参数进行融合,得到融合补偿特征参 数;
[0096] 该步骤中具体是对纯净补偿特征参数和训练补偿特征参数分写进行向量化处理, 得到高维向量,然后将得到的高维向量堆叠在一起。
[0097] S206:将融合补偿特征参数通过说话人支持向量机模型进行匹配,得出确认结果。 [0098]该步骤具体还包括:
[00"] 其具体还包括:S2051:对融合补偿特征参数进行预处理,所述预处理包括预加重 处理和分帧加窗处理,其中预加重处理用以去除辐射影响,分帧加窗处理用于克服吉布斯 现象。通过传递函数H(Z) = I^z-1的一阶高通滤波器滤波实现预加重,其中a为预加重系数; 同时语音信号的分帧加窗,主要是为了克服吉布斯现象,使语音在短时(IOms~40ms)内能 够平滑过渡,保持其连续性,更加稳定.本文采用Hamming窗,其时域形式为:
[0100]
[0101] S2052:提取预处理后的语音信息的特征参数,具体如下:
[0102] 先对语音信号端点检测以提取语音的有用部分,去除静音段。因为浊音的能量较 大,清音和静音的能量较小,但清音的短时过零率很大,所以本文采用基于短时能量和过零 率双门限判别法提取有声部分。端点检测之后,对语音帧进行短时傅里叶变换并计算其短 时能量谱,再用S个Mel带通滤波器组滤波,最后对这S个滤波器的输出功率取对数和反离散 余弦变换之后就得到S个MFCC系数.一般取S前1216个。
[0103] S2053:将所述特征参数与支持向量机模型的相关特征参数进行匹配,判断是否匹 配,如果是,则输出"肯定";否则,则输出"否定"。
[0104] 本发明所述的基于支持向量机的说话人确认方法,通过对已经提取特征参数的训 练语音和纯净语音进行补偿,该补偿可以对特征参数进行增加和降噪处理,使得补偿后的 特征参数的局部可区分性提尚,以便后续提尚确认效率。
[0105] 与之对应的基于支持向量机的说话人确认系统,包括如图4所示的组成结构,具体 包括提取模块2、补偿模块5、融合模块3和确认模块4,其中:
[0106] 所述提取模块2用于提取纯净语音和训练语音的特征参数,分别得到纯净特征参 数和训练特征参数;
[0107] 所述补偿模块5用于对纯净特征参数和训练特征参数进行特征补偿,分别得到纯 净补偿特征参数和训练补偿特征参数;该补偿模块5利用NMF非负矩阵分解算法对特征参数 进行增加和降噪处理,进而使得特征参数的局部可区分性提高。
[0108] 所述融合模块3用于将纯净特征补偿参数和训练补偿特征参数进入融合,得到融 合补偿特征参数;
[0109] 所述确认模块4用于将融合特征参数通过说话人支持向量机模型进行匹配,得出 确认结果。
[0110] 在所述确认模块4在进行匹配的过程中,具体包括有对融合特征参数的预处理,该 预处理有包括有预加重处理和分帧加窗处理,其中预加重处理用以去除辐射影响,分帧加 窗处理用于克服吉布斯现象。通过传递函数H(Z) = Iif1的一阶高通滤波器滤波实现预加 重,其中a为预加重系数;同时语音信号的分帧加窗,主要是为了克服吉布斯现象,使语音在 短时(IOms~40ms)内能够平滑过渡,保持其连续性,更加稳定.本文采用Hamming窗,其时域 形式为:
[0111]
[0112] 为了更好的体现两种方式的识别率高的特点,本发明如下具体实例进行比较测 试:
[0113] 在实验语音数据来源于国际知名语音库Timit,随机选取其中30个说话人,每人10 句发音,作为实验测试对象。Timit数据库的语音本身为16khz采样率,由于一般电话信道带 宽小于4kHz,为了减小输入输出语音的不匹配程度,我们将所有试验用语音都降采样为 8khz.实验方法如图5所示,两台电脑Cl和C2放置于不同地点,将用到的300句语音存放在Cl 中,随机选择两部电话A和B分别放置于两电脑旁,用A电话呼叫B电话,B接听,保持通话中. 将Cl的播放功能打开,C2的录音功能打开.按顺序播放A旁边的电脑Cl中的300句语音,由电 话A通过基站传给电话B,并用B旁边的电脑C2录下来。
[0114] 本发明中采用GMM-EM算法训练得到各说话人的GMM模型.文中将原始的不通过无 线信道的语音称为干净语音,将通过信道的语音称为信道语音,然后将用干净和信道来代 替这两种语音.每一个说话人,4句用于训练,6句用于识别。我们通过测量多部电话机,一共 采用了300句语音做实验。我们对"干净一干净"、"干净一信道"、"干净一信道(CMS)"、"信 道一信道"等多种情况进行了测试,实验结果如下表1:
[0116] 表一
[0117] 其中"干净一干净"表示采用干净语音训练,并用干净语音识别的情况;"干净一信 道"表示采用干净语音训练,而用信道语音识别的情况,表中分别列出了直接测试结果以及 采用本文改进实施例1、实施例2后的结果;"信道一信道"则表示训练语音和识别语音经过 了相同信道的情况。
[0118] 分析表1可知,在干净环境下,识别率能达到93%,在训练和测试语音为相同信道 失真的情况下,系统的识别率也能达到88%,说明在环境匹配的情况下,系统的识别率还是 比较理想的.但是识别环境与训练环境失配情况下,由于信道对识别语音的干扰.系统识别 率会迅速降低,只能达到58% .采用传统的倒谱均值减方法(CMS),识别率提升了 14% .
[0119] 采用实施例1的方式,将干净语音送入实际测量得到的通用信道模型滤波后,再作 为训练语音,相应的识别率提高为84%,由此可知通过信道滤波技术能够使得语音的训练 和识别环境有效的匹配.但由于真实信道环境复杂多变,已测的通用信道模型不能很好的 拟合每个具体的信道,但在一定程度削弱了信道的影响.
[0120]采用实施例2的方式,将语音的MFCC第二维参数去掉,识别率也提高到81 %,正是 由于信道对于语音MFCC参数的第二维影响较大,所以去掉第二维后系统的识别率提升比较 明显.
[0121] 两种不同的处理方法都是为了尽量减小训练环境和识别环境不同造成的语音参 数失配.系统的识别率在原来干净一一信道的情况下都提高了 20%左右,与传统的CMS方法 相比,识别率提升了9%-12%。
[0122] 以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,故 凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何修改、 等同变化与修饰,均仍属于本发明技术方案的范围内。
【主权项】
1. 一种基于支持向量机模型的说话人确认方法,其特征在于,包括如下步骤: 建立通用信道模型; 将纯净语音经过所述通用信道模型,提取纯净特征参数; 对测试语音直接提取测试特征参数; 将纯净特征参数和测试特征参数融合,组合成融合特征参数; 将融合特征参数通过说话人支持向量机模型进行匹配,得出确认结果。2. 根据权利要求1所述的基于支持向量机的说话人确认方法,其特征在于: 所述建立通用信道模型具体是: 通过对来自不同信道的训练语音融合为一个多通道信息的带通滤波器; 其中,所述训练语音为纯净语音。3. 根据权利要求1所述的基于支持向量机的说话人的确认方法,其特征在于: 所述将纯净特征参数和测试特征参数融合步骤具体是: 将纯净特征参数进行向量化,得到纯净高维向量; 将测试特征参数进行向量化,得到测试高维向量; 然后将纯净高维向量和测试高维向量堆叠在一起,组合成融合特征参数。4. 根据权利要求1所述的基于支持向量机的说话人确认方法,其特征在于: 对所述纯净特征参数和测试特征参数的提取都包括对Mel频率倒谱系数MFCC和感知线 性预测系统PLP的提取。5. 根据权利要求1所述的基于支持向量机的说话人确认方法,其特征在于: 所述将融合特征参数通过说话人支持向量机模型进行匹配,得出确认结果的具体步骤 是: 对融合特征参数进行预处理; 提取预处理后的语音信息的特征参数; 将所述特征参数与支持向量机模型的相关特征参数进行匹配,判断是否匹配,如果是, 贝1J输出"肯定";否则,则输出"否定"。6. -种基于支持向量机的说话人确认系统,其特征在于,包括: 建模模块,用于建立通用信道模型; 提取模块,用于提取纯净语音和测试语音的特征参数,分别得到纯净特征参数和测试 特征参数,其中所述纯净语音首先需要经过所述通用信道模型; 融合模块,用于将纯净特征参数和测试特征参数融合,得到融合特征参数; 确认模块,用于将融合特征参数通过说话人支持向量机模型进行匹配,得出确认结果。7. -种基于支持向量机的说话人确认方法,其特征在于,包括如下步骤: 将纯净语音进行特征参数的提取,得到纯净特征参数; 将纯净特征参数进行特征补偿,得到纯净补偿特征参数; 将训练语音进行特征参数的提取,得到训练特征参数; 将训练特征参数进行特征补偿,得到训练补偿特征参数; 将纯净补偿特征参数与训练补偿特征参数进行融合,得到融合补偿特征参数; 将融合补偿特征参数通过说话人支持向量机模型进行匹配,得出确认结果。8. 根据权利要求7所述的基于支持向量机的说话人确认方法,其特征在于: 所述将纯净特征参数进行特征补偿的具体步骤是: 利用NMF非负矩阵分解算法对纯净特征参数进行增加和降噪处理; 所述将训练特征参数进行特征补偿的具体步骤是: 利用NMF非负矩阵分解算法对训练特征参数进行增加和降噪处理; 所述将纯净补偿特征参数与训练补偿特征参数进行融合步骤具体是: 将纯净补偿特征参数进行向量化,得到纯净补偿高维向量; 将训练补偿特征参数进行向量化,得到训练补偿高维向量; 然后将纯净补偿高维向量和训练补偿高维向量堆叠在一起,得到融合补偿特征参数。9. 根据权利要求7所述的基于支持向量机的说话人确认方法,其特征在于: 对所述纯净特征参数和训练特征参数的提取都包括对Mel频率倒谱系数MFCC和感知线 性预测系统PLP的提取。10. -种基于支持向量机的说话人确认系统,其特征在于: 提取模块,用于提取纯净语音和训练语音的特征参数,分别得到纯净特征参数和训练 特征参数; 补偿模块,用于对纯净特征参数和训练特征参数进行特征补偿,分别得到纯净补偿特 征参数和训练补偿特征参数; 融合模块,用于将纯净特征补偿参数和训练补偿特征参数进入融合,得到融合补偿特 征参数; 确认模块,用于将融合特征参数通过说话人支持向量机模型进行匹配,得出确认结果。
【文档编号】G10L17/02GK105845143SQ201610172974
【公开日】2016年8月10日
【申请日】2016年3月23日
【发明人】陈昊亮
【申请人】广州势必可赢网络科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1