语音端点的检测方法和装置制造方法

文档序号:2827263研发日期:2014年阅读:237来源:国知局
技术简介:
本专利针对传统语音端点检测在噪声环境下误判率高的问题,提出基于多频段能量分析与噪音模型的解决方案。通过计算信号帧的低频、中频与全频能量比值及差异度,结合动态阈值判定,有效区分语音与噪声。利用头部噪音倒谱特征构建模型,提升终止帧检测精度,从而提高语音识别准确率。
关键词:语音端点检测,多频段能量分析,噪音模型
语音端点的检测方法和装置制造方法
【专利摘要】本发明提供了一种语音端点的检测方法和装置,所述方法包括:对待检测信号进行分帧处理得到信号帧序列;对于每个信号帧,获取其低频能量、中频能量以及全频能量后计算起始点判断特征值;根据所有信号帧的起始点判断特征值设定起始点判决门限后确定语音起始帧;根据语音起始帧之前的噪音帧建立噪音模型,计算语音起始帧之后的每个信号帧与语音起始帧之前的噪音帧的差异度;对于每个语音起始帧之后的信号帧,根据其低频能量、中频能量以及计算获取的差异度,计算终止点判断特征值;根据语音起始帧之后信号帧的终止点判断特征值设定终止点判决门限后确定语音终止帧。使用本发明能提高语音端点检测的准确率。
【专利说明】语音端点的检测方法和装置
【技术领域】
[0001]本发明涉及语音识别【技术领域】,尤其涉及一种语音端点的检测方法和装置。
【背景技术】
[0002]语音端点检测(Voice Activity Detection, VAD),其目的是从包含语音的信号中,分辨出语音信号和非语音信号,并准确地确定语音段的起始点和终止点。语音端点检测技术常用在语音识别系统中,用来排除非语音段对语音识别的干扰,提高识别效率和识别准确率。如果端点检测不准确,比如将非语音段判断为语音段,会造成语音识别系统将一些非语音段作为语音段进行处理,生成错误的识别结果;而另外一种情况,如果将某些语音段判断为非语音段,则会造成识别出的文字遗漏。
[0003]现有的语音端点检测方法中,首先将要检测的信号进行分帧处理,比如每30ms作为一帧,从而得到帧序列;然后对每帧信号提取特征值,该特征值可以是短时能量、即该帧信号的波形幅值大小,也可以是短时过零率、即该帧信号的波形穿过零电平的次数;根据该特征值计算出一个阈值,将每一帧的特征值与阈值进行比较,将其特征值超过阈值的帧标定为语音帧,而其特征值低于阈值的帧标定为非语音帧;根据所有帧的标定状态确定语音端点,例如,将帧序列中第一个标记为语音帧的信号帧确定为语音起始帧,最后一个标记为语音帧的信号帧确定为语音终止帧。
[0004]但是现有技术中,以短时能量或者短时过零率为特征值并设置阈值的方式,存在语音端点检测精确率低的问题。

【发明内容】

[0005]本发明的实施例提供的语音端点的检测方法和装置,能够解决现有技术中语音端点检测精确率低的问题。
[0006]第一方面,本发明实施例提供了语音端点的检测装置,所述装置包括:分帧单元,用于对接收到的待检测信号进行分帧处理,得到信号帧序列;计算单元,用于对所述分帧单元得到的所述信号帧序列中的每个信号帧,获取其低频能量、中频能量以及全频能量后计算起始点判断特征值,所述起始点判断特征值与所述低频能量和所述中频能量的比值成正t匕、与所述全频能量成正比;确定单元,用于根据计算单元计算得到的所述信号帧序列中的所有信号帧的起始点判断特征值设定起始点判决门限,并根据所述信号帧序列中的所有信号中贞的起始点判断特征值以及所述起始点判决门限确定语音起始巾贞;噪音模型建立单元,用于根据所述信号帧序列中在所述确定单元确定的所述语音起始帧之前的所有噪音帧建立噪音模型;所述计算单元,还用于根据所述噪音模型,计算所述信号帧序列中在所述语音起始帧之后的每个信号帧与所述语音起始帧之前的噪音帧的差异度;所述计算单元,还用于对于所述信号帧序列中在所述语音起始帧之后的每个信号帧,根据其低频能量、中频能量以及所述计算单元计算得到的差异度,计算终止点判断特征值,所述终止点判断特征值与所述差异度成正比、与所述低频能量和中频能量中的较大值成正比;所述确定单元,还用于根据所述计算单元计算得到的所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值设定终止点判决门限,并根据所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值以及所述终止点判决门限确定语音终止帧。
[0007]在第一方面的第一种可能的实现方式中,所述确定单元包括:第一计算模块,用于根据所述信号帧序列中所有信号帧的起始点判断特征值计算陡峭上升沿判断阈值;第一确定模块,用于在所述信号帧序列中确定第一个陡峭上升帧,所述第一个陡峭上升帧是其起始点判断特征值与其前一帧的起始点判断特征值的差值大于所述所述陡峭上升沿判断阈值且距离所述信号帧序列中的第一个信号帧最近的信号帧;所述第一确定模块,还用于在所述信号帧序列中确定第一坡底帧,所述第一坡底帧是所述第一个陡峭上升帧之前其起始点判断特征值小于其前一帧和后一帧的起始点判断特征值且距离所述第一个陡峭上升帧最近的信号帧;所述第一计算模块,还用于根据所述信号帧序列中在所述第一坡底帧之前信号帧的起始点判断特征值计算起始点判决门限;所述第一确定模块,还用于在所述信号帧序列中确定语音起始帧,所述语音起始帧是所述第一坡底帧之后第一个其起始点判断特征值大于所述起始点判决门限的信号帧。
[0008]结合第一方面或第一方面的第一可能的实现方式,在第二种可能的实现方式中,所述噪音模型建立单元包括:获取模块,用于获取头部噪音帧的倒谱特征系数值,所述头部噪音帧为所述信号帧序列中在所述语音起始帧之前的所有噪音帧;构造模块,用于构造噪音模型描述函数;计算模块,用于根据所述头部噪音帧的倒谱特征系数值计算所述噪音模型描述函数的参数。
[0009]结合第一方面或第一方面的第一种可能的实现方式或第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述确定单元包括:第二计算模块,用于根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值计算语音终止帧判断阈值;第二确定模块,用于在所述信号帧序列中确定备选语音终止帧,所述备选语音终止帧是其终止点判断特征值大于所述语音终止帧判断阈值且距离所述信号帧序列中的最后一个信号帧最近的信号帧;所述第二确定模块,还用于在所述信号帧序列中确定第二坡底帧,所述第二坡底帧是所述备选语音终止帧之后第一个其终止点判断特征值小于其前一帧和后一帧的终止点判断特征值的信号帧;所述第二计算模块,还用于根据所述信号帧序列中在所述第二坡底帧之后信号帧的终止点判断特征值计算终止点判决门限;所述第二确定模块,还用于在所述信号帧序列中确定语音终止帧,所述语音终止帧是所述第二坡底帧之前其终止点判断特征值大于所述终止点判决门限且距离所述第二坡底帧最近的信号帧。
[0010]第二方面,本发明实施例提供了语音端点的检测方法,所述方法包括:对接收到的待检测信号进行分帧处理,得到信号帧序列;对于所述信号帧序列中的每个信号帧,获取其低频能量、中频能量以及全频能量后计算起始点判断特征值,所述起始点判断特征值与所述低频能量和所述中频能量的比值成正比、与所述全频能量成正比;根据所述信号帧序列中的所有信号帧的起始点判断特征值设定起始点判决门限,并根据所述信号帧序列中的所有信号帧的起始点判断特征值以及所述起始点判决门限确定语音起始帧;根据所述信号帧序列中在所述语音起始帧之前的所有噪音帧建立噪音模型,并根据所述噪音模型,计算所述信号帧序列中在所述语音起始帧之后的每个信号帧与所述语音起始帧之前的噪音帧的差异度;对于所述信号帧序列中在所述语音起始帧之后的每个信号帧,根据其低频能量、中频能量以及所述计算得到的差异度,计算终止点判断特征值,所述终止点判断特征值与所述差异度成正比、与所述低频能量和中频能量的较大值成正比;根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值设定终止点判决门限,并根据所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值以及所述终止点判决门限确定语音终止帧。
[0011]在第二方面的第一种可能的实现方式中,所述根据所述信号帧序列中的所有信号帧的起始点判断特征值设定起始点判决门限,并根据所述信号帧序列中的所有信号帧的起始点判断特征值以及所述起始点判决门限确定语音起始帧具体为:根据所述信号帧序列中所有信号帧的起始点判断特征值计算陡峭上升沿判断阈值;在所述信号帧序列中确定第一个陡峭上升帧,所述第一个陡峭上升帧是其起始点判断特征值与其前一帧的起始点判断特征值的差值大于所述所述陡峭上升沿判断阈值且距离所述信号帧序列中的第一个信号帧最近的信号帧;在所述信号帧序列中确定第一坡底帧,所述第一坡底帧是所述第一个陡峭上升帧之前其起始点判断特征值小于其前一帧和后一帧的起始点判断特征值且距离所述第一个陡峭上升帧最近的信号帧;根据所述信号帧序列中在所述第一坡底帧之前信号帧的起始点判断特征值设定起始点判决门限;在所述信号帧序列中确定语音起始帧,所述语音起始帧是所述第一坡底帧之后第一个其起始点判断特征值大于所述起始点判决门限的信号中贞。
[0012]结合第二方面或第二方面的第一可能的实现方式,在第二种可能的实现方式中,所述根据所述信号帧序列中在所述语音起始帧之前的所有噪音帧建立噪音模型具体为:获取头部噪音帧的倒谱特征系数值,所述头部噪音帧为所述信号帧序列中在所述语音起始帧之前的所有噪音帧;构造噪音模型描述函数;利用所述头部噪音帧的倒谱特征系数值计算所述噪音模型描述函数的参数。
[0013]结合第二方面或第二方面的第一种可能的实现方式或第二方面的第二种可能的实现方式,在第三种可能的实现方式中,所述根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值设定终止点判决门限,并根据所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值以及所述终止点判决门限确定语音终止帧具体为:根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值计算语音终止帧判断阈值;在所述信号帧序列中确定备选语音终止帧,所述备选语音终止帧是其终止点判断特征值大于所述语音终止帧判断阈值且距离所述信号帧序列中的最后一个信号帧最近的信号帧;在所述信号帧序列中确定第二坡底帧,所述第二坡底帧是所述备选语音终止帧之后第一个其终止点判断特征值小于其前一帧和后一帧的终止点判断特征值的信号帧;根据所述信号帧序列中在所述第二坡底帧之后信号帧的终止点判断特征值设定终止点判决门限;在所述信号帧序列中确定语音终止帧,所述语音终止帧是所述第二坡底帧之前其终止点判断特征值大于所述终止点判决门限且距离所述第二坡底帧最近的信号中贞。
[0014]由上述本发明的实施例提供的技术方案可以看出,本方案对接收到的待检测信号进行分帧处理得到信号帧序列;对于信号帧序列中每个信号帧,获取其低频能量、中频能量以及全频能量后计算起始点判断特征值;根据信号帧序列中所有信号帧的起始点判断特征值设定起始点判决门限后确定语音起始帧;根据所述信号帧序列中在所述语音起始帧之前的噪音帧建立噪音模型后,计算在所述语音起始帧之后的每个信号帧与所述语音起始帧之前的噪音帧的差异度;对于语音起始帧之后的每个信号帧,根据其低频能量、中频能量以及所述计算获取的差异度,计算终止点判断特征值;根据语音起始帧之后的信号帧的终止点判断特征值设定终止点判决门限后确定语音终止帧。
[0015]使用本方案,通过语音起始帧的能量分布特性来确定语音起始帧,并且通过语音起始帧之前的噪音作为先验知识建立噪音模型,使得一段话结束部分的语音和噪音的特征得到明显区分,再结合语音终止帧的能量分布特性来确定语音终止帧,从而提高语音端点检测的准确率。
【专利附图】

【附图说明】
[0016]为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0017]图1为本发明实施例提供的语音端点的检测装置结构图;
[0018]图2为本发明另一实施例提供的语音端点的检测装置结构图;
[0019]图3为本发明再一个实施例提供的语音端点的检测装置结构图;
[0020]图4为本发明又一个实施例提供的语音端点的检测装置结构图;
[0021]图5为本发明实施例提供的语音端点的检测方法流程图;
[0022]图6为本发明另一实施例提供的语音端点的检测方法流程图;
[0023]图7为本发明实施例提供的基于计算机系统的语音端点检测装置结构图。
【具体实施方式】
[0024]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0025]现有技术中,采用的特征值为短时能量或短时过零率,但是对于能量大的噪音和能量小的语音,经常具有相同的特征值,从而导致误判;而且,现有技术采用前后统一的阈值设定方式,但是对于一段话的结束部分,其特征值往往低于开始部分的特征值,假如阈值设高了会导致结束端点的判断很不精确,而阈值设低了会导致起始端点的判断很不精确,因此,现有技术存在语音端点检测精确率低的问题。本发明利用了语音初始位置以及终止位置具有不同的能量分布特性,分别构造起始点判决门限以及终止点判决门限作为端点检测的依据,并且在识别出语音初始帧后,利用语音初始帧之前的噪音作为先验知识对信号进行匹配,使得结束部分的语音和噪音的特征能得到明显区分,从而提高了语音端点检测的精确率。
[0026]本发明一个实施例提供了语音端点的检测装置,请参照图1,该装置100包括:
[0027]分帧单元101,用于对接收到的待检测信号进行分帧处理,得到信号帧序列;
[0028]计算单元102,用于对分帧单元101得到的所述信号帧序列中的每个信号帧,获取其低频能量、中频能量以及全频能量后计算起始点判断特征值,所述起始点判断特征值与所述低频能量和所述中频能量的比值成正比、与所述全频能量成正比;
[0029]确定单元103,用于根据计算单元102计算得到的所述信号帧序列中的所有信号帧的起始点判断特征值设定起始点判决门限,并根据所述信号帧序列中的所有信号帧的起始点判断特征值以及所述起始点判决门限确定语音起始帧;
[0030]噪音模型建立单元104,用于根据所述信号帧序列中在确定单元103确定的所述语音起始帧之前的所有噪音帧建立噪音模型;
[0031]所述计算单元102,还用于根据所述噪音模型,计算所述信号帧序列中在所述语音起始帧之后的每个信号帧与所述语音起始帧之前的噪音帧的差异度;
[0032]所述计算单元102,还用于对于所述信号帧序列中在所述语音起始帧之后的每个信号帧,根据其低频能量、中频能量以及所述计算得到的差异度,计算终止点判断特征值,所述终止点判断特征值与所述差异度成正比、与所述低频能量和中频能量的最大值成正比;
[0033]所述确定单元103,还用于根据计算单元102计算得到的所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值设定终止点判决门限,并根据所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值以及所述终止点判决门限确定语音终止帧。
[0034]可选的,请参照图2,确定单元103,可以包括:
[0035]第一计算模块1031,用于根据所述信号帧序列中所有信号帧的起始点判断特征值计算陡峭上升沿判断阈值;
[0036]第一确定模块1032,用于在所述信号帧序列中确定第一个陆峭上升帧,所述第一个陡峭上升帧是其起始点判断特征值 与其前一帧的起始点判断特征值的差值大于所述所述陡峭上升沿判断阈值且距离所述信号帧序列中的第一个信号帧最近的信号帧;
[0037]所述第一确定模块1032,还用于在所述信号帧序列中确定第一坡底帧,所述第一坡底帧是所述第一个陡峭上升帧之前其起始点判断特征值小于其前一帧和后一帧的起始点判断特征值且距离所述第一个陡峭上升帧最近的信号帧;
[0038]所述第一计算模块1031,还用于根据所述信号帧序列中在所述第一坡底帧之前信号中贞的起始点判断特征值计算起始点判决门限;
[0039]所述第一确定模块1032,还用于在所述信号帧序列中确定语音起始帧,所述语音起始帧是所述第一坡底帧之后第一个其起始点判断特征值大于所述起始点判决门限的信
号中贞。
[0040]可选的,所述第一计算模块1031,用于根据所述信号帧序列中所有信号帧的起始点判断特征值计算陡峭上升沿判断阈值具体包括:所述第一计算模块1031,用于根据公式
【权利要求】
1.一种语音端点的检测装置,其特征在于,所述装置包括:分帧单元,用于对接收到的待检测信号进行分帧处理,得到信号帧序列;计算单元,用于对所述分帧单元得到的所述信号帧序列中的每个信号帧,获取其低频能量、中频能量以及全频能量后计算起始点判断特征值,所述起始点判断特征值与所述低频能量和所述中频能量的比值成正比、与所述全频能量成正比;确定单元,用于根据计算单元计算得到的所述信号帧序列中的所有信号帧的起始点判断特征值设定起始点判决门限,并根据所述信号帧序列中的所有信号帧的起始点判断特征值以及所述起始点判决门限确定语音起始帧;噪音模型建立单元,用于根据所述信号帧序列中在所述确定单元确定的所述语音起始帧之前的所有噪音帧建立噪音模型;所述计算单元,还用于根据所述噪音模型,计算所述信号帧序列中在所述语音起始帧之后的每个信号帧与所述语音起始帧之前的噪音帧的差异度;所述计算单元,还用于对于所述信号帧序列中在所述语音起始帧之后的每个信号帧,根据其低频能量、中频能量以及所述计算单元计算得到的差异度,计算终止点判断特征值,所述终止点判断特征值与所述差异度成正比、与所述低频能量和中频能量中的较大值成正比;所述确定单元,还用于根据所述计算单元计算得到的所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值设定终止点判决门限,并根据所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值以及所述终止点判决门限确定语音终止帧。
2.根据权利要求1所述的装置,其特征在于,所述确定单元包括:第一计算模块,用于根据所述信号帧序列中所有信号帧的起始点判断特征值计算陡峭上升沿判断阈值;第一确定模块,用于在所述信号帧序列中确定第一个陡峭上升帧,所述第一个陡峭上升帧是其起始点判断特征值与其前一帧的起始点判断特征值的差值大于所述所述陡峭上升沿判断阈值且距离所述信号帧序列中的第一个信号帧最近的信号帧;所述第一确定模块,还用于在所述信号帧序列中确定第一坡底帧,所述第一坡底帧是所述第一个陡峭上升帧之前其起始点判断特征值小于其前一帧和后一帧的起始点判断特征值且距离所述第一个陡峭上升帧最近的信号帧;所述第一计算模块,还用于根据所述信号帧序列中在所述第一坡底帧之前的信号帧的起始点判断特征值计算起始点判决门限;所述第一确定模块,还用于在所述信号帧序列中确定语音起始帧,所述语音起始帧是所述第一坡底帧之后第一个其起始点判断特征值大于所述起始点判决门限的信号帧。
3.根据权利要求2所述的装置,其特征在于,所述第一计算模块,用于根据所述信号帧序列中所有信号帧的起始点判断特征值计算陡峭上升沿判断阈值具体包括:所述第一计算模块,用于根据公式
4.根据权利要求2所述的装置,其特征在于,所述第一计算模块,用于根据所述信号帧序列中在所述第一坡底帧之前信号帧的起始点判断特征值计算起始点判决门限具体包括:所述第一计算模块,用于计算所述信号帧序列中在所述第一坡底帧之前信号帧的起始点判断特征值的平均值St后,根据公式cXst计算起始点判决门限,其中,c为预设定的放大系数。
5.根据权利要求1-4任一所述的装置,其特征在于,所述噪音模型建立单元包括:获取模块,用于获取头部噪音帧的倒谱特征系数值,所述头部噪音帧为所述信号帧序列中在所述语音起始帧之前的所有噪音帧;构造模块,用于构造噪音模型描述函数;计算模块,用于根据所述头部噪音帧的倒谱特征系数值计算所述噪音模型描述函数的参数。
6.根据权利要求5所述的装置,其特征在于,所述构造模块,用于构造噪音模型描述函数具体包括:所述构造模块,用于构造噪音模型描述函数,
7.根据权利要求1-6任一所述的装置,其特征在于,所述确定单元包括:第二计算模块,用于根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值计算语音终止帧判断阈值;第二确定模块,用于在所述信号帧序列中确定备选语音终止帧,所述备选语音终止帧是其终止点判断特征值大于所述语音终止帧判断阈值且距离所述信号帧序列中的最后一个信号帧最近的信号帧;所述第二确定模块,还用于在所述信号帧序列中确定第二坡底帧,所述第二坡底帧是所述备选语音终止帧之后第一个其终止点判断特征值小于其前一帧和后一帧的终止点判断特征值的信号帧;所述第二计算模块,还用于根据所述信号帧序列中在所述第二坡底帧之后信号帧的终止点判断特征值计算终止点判决门限;所述第二确定模块,还用于在所述信号帧序列中确定语音终止帧,所述语音终止帧是所述第二坡底帧之前其终止点判断特征值大于所述终止点判决门限且距离所述第二坡底帧最近的信号帧。
8.根据权利要求7所述的装置,其特征在于,所述第二计算模块,用于根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值计算语音终止帧判断阈值具体包括:所述第二计算模块,用于获得所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值的平均值vt后,计算语音终止帧判断阈值kXvt,其中k为指定的放大系数。
9.根据权利要求7所述的装置,其特征在于,所述第二计算模块,用于根据所述信号帧序列中在所述第二坡底帧之后信号帧的终止点判断特征值计算终止点判决门限具体包括:所述第二计算模块,用于在计算所述信号帧序列中在所述第二坡底帧之后信号帧的终止点判断特征值的平均值et后,根据公式bXet计算起始点判决门限,其中,b为预设定的放大系数。
10.一种语音端点的检测方法,其特征在于,所述方法包括:对接收到的待检测信号进行分帧处理,得到信号帧序列;对于所述信号帧序列中的每个信号帧,获取其低频能量、中频能量以及全频能量后计算起始点判断特征值,所述起始点判断特征值与所述低频能量和所述中频能量的比值成正t匕、与所述全频能量成正比;根据所述信号帧序列中的所有信号帧的起始点判断特征值设定起始点判决门限,并根据所述信号帧序列中的所有信号帧的起始点判断特征值以及所述起始点判决门限确定语音起始帧; 根据所述信号帧序列中在所述语音起始帧之前的所有噪音帧建立噪音模型,并根据所述噪音模型,计算所述信号帧序列中在所述语音起始帧之后的每个信号帧与所述语音起始帧之前的噪音帧的差异度;对于所述信号帧序列中在所述语音起始帧之后的每个信号帧,根据其低频能量、中频能量以及所述计算得到的差异度,计算终止点判断特征值,所述终止点判断特征值与所述差异度成正比、与所述低频能量和中频能量的较大值成正比;根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值设定终止点判决门限,并根据所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值以及所述终止点判决门限确定语音终止帧。
11.根据权利要求10所述的方法,其特征在于,所述根据所述信号帧序列中的所有信号帧的起始点判断特征值设定起始点判决门限,并根据所述信号帧序列中的所有信号帧的起始点判断特征值以及所述起始点判决门限确定语音起始帧具体为:根据所述信号帧序列中所有信号帧的起始点判断特征值计算陡峭上升沿判断阈值;在所述信号帧序列中确定第一个陡峭上升帧,所述第一个陡峭上升帧是其起始点判断特征值与其前一帧的起始点判断特征值的差值大于所述所述陡峭上升沿判断阈值且距离所述信号帧序列中的第一个信号帧最近的信号帧;在所述信号帧序列中确定第一坡底帧,所述第一坡底帧是所述第一个陡峭上升帧之前其起始点判断特征值小于其前 一帧和后一帧的起始点判断特征值且距离所述第一个陡峭上升帧最近的信号帧; 根据所述信号帧序列中在所述第一坡底帧之前信号帧的起始点判断特征值设定起始点判决门限;在所述信号帧序列中确定语音起始帧,所述语音起始帧是所述第一坡底帧之后第一个其起始点判断特征值大于所述起始点判决门限的信号帧。
12.根据权利要求11所述的方法,其特征在于,所述陡峭上升沿判断阈值的计算公式为
13.根据权利要求11所述的方法,其特征在于,所述根据所述信号帧序列中在所述第一坡底帧之前信号帧的起始点判断特征值设定起始点判决门限具体为:计算所述信号帧序列中在所述第一坡底帧之前信号帧的起始点判断特征值的平均值St后,设定起始点判决门限为c X st,其中,c为预设定的放大系数。
14.根据权利要求10-13任一所述的方法,其特征在于,所述根据所述信号帧序列中在所述语音起始帧之前的所有噪音帧建立噪音模型具体为:获取头部噪音帧的倒谱特征系数值,所述头部噪音帧为所述信号帧序列中在所述语音起始帧之前的所有噪音帧;构造噪音模型描述函数;利用所述头部噪音帧的倒谱特征系数值计算所述噪音模型描述函数的参数。
15.根据权利要求14所述的方法,其特征在于:所述噪音模型描述函数具体为
16.根据权利要求10-15任一所述的方法,其特征在于,所述根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值设定终止点判决门限,并根据所述信号帧序列中在所述语音起始帧之后所有信号帧的终止点判断特征值以及所述终止点判决门限确定语音终止帧具体为: 根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值计算语音终止帧判断阈值;在所述信号帧序列中确定备选语音终止帧,所述备选语音终止帧是其终止点判断特征值大于所述语音终止帧判断阈值且距离所述信号帧序列中的最后一个信号帧最近的信号帧;在所述信号帧序列中确定第二坡底帧,所述第二坡底帧是所述备选语音终止帧之后第一个其终止点判断特征值小于其前一帧和后一帧的终止点判断特征值的信号帧;根据所述信号帧序列中在所述第二坡底帧之后信号帧的终止点判断特征值设定终止点判决门限;在所述信号帧序列中确定语音终止帧,所述语音终止帧是所述第二坡底帧之前其终止点判断特征值大于所述终止点判决门限且距离所述第二坡底帧最近的信号帧。
17.根据权利要求16所述的方法,其特征在于,所述根据所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值计算语音终止帧判断阈值具体为:获得所述信号帧序列中在所述语音起始帧之后的所有信号帧的终止点判断特征值的平均值vt后,计算语音终止帧判断阈值kXvt,其中k为指定的放大系数。
18.根据权利要求16所述的方法,其特征在于,所述根据所述信号帧序列中在所述第二坡底帧之后信号帧的终止点判断特征值设定终止点判决门限具体为:计算所述信号帧序列中在所述第二坡底帧之后信号帧的终止点判断特征值的平均值et后,设定起始点判决门限为bXet,其中,b为预设定 的放 大系数。
【文档编号】G10L25/21GK103886871SQ201410042094
【公开日】2014年6月25日 申请日期:2014年1月28日 优先权日:2014年1月28日
【发明者】吴丽丽 申请人:华为技术有限公司
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!