基于置信度的关键词检出系统裁剪方法

文档序号：2819001阅读：436来源：国知局

专利名称：基于置信度的关键词检出系统裁剪方法
技术领域：
本发明涉及一种关键词检出系统中的局部路径裁剪方法，具体是在基于似然分裁剪的基础上添加基于置信度裁剪的方法。
背景技术：
关键词检出是从连续语音中识别出一组给定词的过程，它是一种非受限的语音信号处理系统，允许用户采用自然的说话方式，而不必局限于特定的语法。虽然近年来关键词检出技术获得了长足的进步，但是其检出效率仍不够高。一般的关键词检出系统，检出率通常能达到90%以上，但是系统效率始终是制约其进一步发展的瓶颈。为此，人们引入 Viterbi Beam解码过程来对未知语音进行解码，它基于似然分进行局部路径的裁剪。但是这种方法具有一定的局限性，如在解码过程中，没有考虑观察矢量的先验概率，解码得到的只是所有可能的词序列中与输入语音最匹配的词串，但是其置信度不一定足够高，也就是最匹配的词串不一定就是实际语音对应的词串。它只是扩展那些似然分高的局部路径，而忽略那些似然分低的局部路径，解码过程中完全没有考虑各条路径的可信程度。造成裁剪过程不充分，搜索空间中保留一些不可能的路径，增加系统的计算量，降低系统的实时性。因此，需要研究关键词检出中的裁剪过程，进一步提高系统的检出速度，改善系统的实时性。

发明内容
本发明的目的是为了解决现有关键词检出系统解码过程中，基于似然分的路径裁剪不能最大程度地缩减搜索空间，从而导致系统效率低下，关键词确认阶段计算量大的问题，本发明提供了一种基于置信度的关键词检出系统裁剪方法。本发明的基于置信度的关键词检出系统裁剪方法是通过以下步骤实现的步骤一、输入语音信号，对输入的语音信号进行预处理，特征提取得到特征矢量序列X= Ix1, &，... }，其中S代表自然数；步骤二、根据Viterbi解码算法，对每帧语音特征在预先定义的识别网络上进行解码，解码之前，为每条局部路径增加一个变量，用于记录该条局部路径上的累积置信度得分，并将累积置信度得分初始化为0 ；步骤三、在t时刻，所有局部路径向前扩展一次，得相应局部路径的活动模块，然后计算每个活动模型的状态q产生特征矢量^的概率，并累加到该条局部路径的似然分中，同时计算每个活动模型中状态q相对于\的后验概率，再将后验概率累加到对应的局部路径的置信度得分中，获得每条局部路径的置信度得分，其中，^ct e X，1 < t < S，t取自然数；步骤四、进行基于似然分的状态层局部路径裁剪；步骤五、进行基于置信度的状态层局部路径裁剪；步骤六、判断是否到达语音末尾，是则转步骤七，否则转步骤二；
步骤七、根据解码过程中生成的网格回溯查找关键词，并基于后验概率确认关键词候选从而得到最终的识别结果，完成基于置信度的关键词检出系统裁剪方法。本发明步骤三中获得每条局部路径的置信度得分的过程为步骤1、计算每个活动模型的状态q产生特征矢量^ct的先验概率P (xt)设在处理 Xt时，系统存在N个活动模型，累加每个活动模型中包含的所有状态q产生特征矢量^ct的概率，作为P (Xt)的近似值，即
权利要求
1.基于置信度的关键词检出系统裁剪方法，其特征在于基于置信度的关键词检出系统裁剪方法是通过以下步骤实现的步骤一、输入语音信号，对输入的语音信号进行预处理，特征提取得到特征矢量序列X =&1，&，...^}，其中3代表自然数；步骤二、根据Viterbi解码算法，对每帧语音特征在预先定义的识别网络上进行解码，解码之前，为每条局部路径增加一个变量，用于记录该条局部路径上的累积置信度得分，并将累积置信度得分初始化为0 ；步骤三、在t时刻，所有局部路径向前扩展一次，得相应局部路径的活动模块，然后计算每个活动模型的状态q产生特征矢量^ct的概率，并累加到该条局部路径的似然分中，同时计算每个活动模型中状态q相对于^的后验概率，再将后验概率累加到对应的局部路径的置信度得分中，获得每条局部路径的置信度得分，其中，^ct e X，1 < t < S，t取自然数；步骤四、进行基于似然分的状态层局部路径裁剪；步骤五、进行基于置信度的状态层局部路径裁剪；步骤六、判断是否到达语音末尾，是则转步骤七，否则转步骤二；步骤七、根据解码过程中生成的网格回溯查找关键词，并基于后验概率确认关键词候选从而得到最终的识别结果，完成基于置信度的关键词检出系统裁剪方法。
2.根据权利要求1所述的基于置信度的关键词检出系统裁剪方法，其特征在于步骤三中获得每条局部路径的置信度得分的过程为步骤1、计算每个活动模型的状态q产生特征矢量\的先验概率P (xt)设在处理&时，系统存在N个活动模型，累加每个活动模型中包含的所有状态q产生特征矢量Xt的概率，作为P(Xt)的近似值，即
3.根据权利要求1或2所述的基于置信度的关键词检出系统裁剪方法，其特征在于步骤四中进行基于似然分的状态层局部路径裁剪的过程为步骤1、按照从大到小的顺序依次保存任意t时刻所有局部路径似然分到数组 score [1. . . N]中，假设t时刻共N条局部路径；步骤2、任意时刻t，根据和该时刻t的N条局部路径中的最大似然分^iax,计算得到t 时刻的裁剪门限threshhold(t) = α X (Smax (t)-beam(t)) 其中，beam(t)为第时刻t时的束宽度；步骤3、遍历数组score[1. . . N]，对于其中的每一个得分score[i]，如果score[i]<threshhold(t)，则终止在其对应的局部路径上的搜索，否则，继续在该条局部路径上进行搜索，其中，1彡i彡N。
4.根据权利要求1或2所述的基于置信度的关键词检出系统裁剪方法，其特征在于步骤五中进行基于置信度的状态层局部路径裁剪的过程为步骤1、按照从大到小的顺序依次保存任意t时刻所有局部路径的置信度得分到数组 score [1. . . N]中，假设t时刻共N条局部路径；步骤2、任意时刻t，根据裁剪宽度beam(t)和该时刻t的N条局部路径中的最大置信度得分Smax，计算得到t时刻的裁剪门限threshhold(t) = α X (Smax (t)-beam(t)) 其中，beam(t)为第时刻t时的束宽度；步骤3、遍历数组score，对于其中的每一个得分score [i]，如果score [i]<threshhold(t)，则终止在其对应的局部路径上的搜索，否则，继续在该条局部路径上进行搜索。
全文摘要
基于置信度的关键词检出系统裁剪方法，涉及关键词检出系统中的局部路径裁剪方法。解决现有基于似然分的路径裁剪不能最大程度地缩减搜索空间，从而导致系统效率低，关键词确认阶段计算量大的问题。将语音特征提取得特征矢量序列，根据Viterbi解码，计算局部路径上活动模型状态产生特征矢量的概率，并累加得局部路径概率得分，再计算特征矢量的后验概率，累加得局部路径置信度得分；然后依次进行基于似然分和置信度的状态层局部路径裁剪，然后判断是否到达语音末尾，是则据解码过程生成的网格回溯找关键词，得到识别结果，否则重新解码。本发明能最大程度地缩减搜索空间，能减少30％的关键词候选。本发明适用于确认阶段计算量大的任务中。
文档编号G10L15/00GK102402984SQ20111028060
公开日2012年4月4日申请日期2011年9月21日优先权日2011年9月21日
发明者李海洋, 袁浩, 韩纪庆申请人:哈尔滨工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韩纪庆;袁浩;李海洋
技术所有人：哈尔滨工业大学
我是此专利的发明人

上一篇：基于自适应冗余字典的语音信号稀疏表示方法
上一篇：自动生成重读音节语音的方法和系统的制作方法