语音特征信息的提取方法及电子设备的制造方法_3

文档序号:8923591阅读:来源:国知局
N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量。
[0061]具体的,携带信息量大的频带上分布的三角带通滤波器组的数量大于携带信息量小的频带上分布的三角带通滤波器组的数量,如此,使得三角带通滤波器组在信息量大的频带上分布的密度更高,在信息量小的频带上分布的密度低。
[0062]例如,以智能手机为例,智能手机A接收到用户B的语音信息,确定所述语音信息的频率带宽为200Hz到5000Hz的频率,若根据所述信息分布参数,从所述频率带宽中确定200Hz到2000Hz的频率中信息分布离散,2000Hz到3000Hz的频率中信息分布集中,3000Hz到4000Hz的频率中信息分布离散,以及4000Hz到5000Hz的频率中信息分布集中,从而可以将所述频率带宽划分为频率为200Hz到2000Hz的第一频带,且携带的信息量为a ;频率为2000Hz到3000Hz的第二频带,且携带的信息量为b ;频率为3000Hz到4000Hz的第三频带,且携带的信息量为C ;频率为4000Hz到5000Hz的第四频带,且携带的信息量为d,且分布在所述第一频带上的三角带通滤波器组的数量为al,分布在所述第二频带上的三角带通滤波器组的数量为bl,分布在所述第三频带上的三角带通滤波器组的数量为Cl,分布在所述第四频带上的三角带通滤波器组的数量为dl,若b>d>a>c,则bl>dl>al>cl。
[0063]接下来执行步骤104,在该步骤中,根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱。
[0064]在具体实施过程中,按照所述分布系数将三角带通滤波器组分布在所述频谱上,用于将所述频谱进行平滑化,并消除谐波,突显所述语音信息的共振峰,从而获得所述Mel频谱。
[0065]例如,参见图2,以智能手机为例,智能手机A接收到用户B的语音信息,确定所述语音信息的频率带宽为200Hz到5000Hz的频率,将所述频率带宽划分为4个频带,其中,所述4个频带中的第一个频带为200Hz到1500Hz的频率,且携带的信息量为a ;第二频带为1500Hz到2500Hz的频率,且携带的信息量为b,第三个频带为2500Hz到3500Hz的频率,且携带的信息量为c ;以及第四个频带为3500Hz到5000Hz的频率,且携带的信息量为d,且分布在所述第一频带上的三角带通滤波器组的数量为al,分布在所述第二频带上的三角带通滤波器组的数量为bl,分布在所述第三频带上的三角带通滤波器组的数量为Cl,分布在所述第四频带上的三角带通滤波器组的数量为dl,若c>b>a>d,则cl>bl>al>dl,将al、bl、cl和dl分布在所述频谱上进行滤波,获得所述Mel频谱。
[0066]接下来执行步骤105,在该步骤中,基于所述Mel频谱,获取Mel频率倒谱系数MFCC。
[0067]在具体实施过程中,将所述Mel频谱取对数,获得对数能量谱;将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。
[0068]具体来讲,将所述Mel频谱取对数,将获取的对数能量进行DCT,求出所述MFCC。
[0069]例如,以智能手机为例,智能手机A接收到用户B的语音信息,确定所述语音信息的频率带宽为200Hz到5000Hz的频率,将所述频率带宽划分为4个频带,其中,所述4个频带中的第一个频带为200Hz到1500Hz的频率,且携带的信息量为a ;第二频带为1500Hz到2500Hz的频率,且携带的信息量为b,第三个频带为2500Hz到3500Hz的频率,且携带的信息量为c ;以及第四个频带为3500Hz到5000Hz的频率,且携带的信息量为d,且分布在所述第一频带上的三角带通滤波器组的数量为al,分布在所述第二频带上的三角带通滤波器组的数量为bl,分布在所述第三频带上的三角带通滤波器组的数量为Cl,分布在所述第四频带上的三角带通滤波器组的数量为dl,若c>b>a>d,贝丨J cl>bl>al>dl,将al、bl、cl和dl分布在所述频谱上进行滤波,获得所述Mel频谱,将所述Mel频谱取对数,将获取的对数能量进行DCT,求出所述MFCC。
[0070]本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0071]其一、由于本申请实施例是获取语音信息在与所述语音信息对应的频谱上的信息分布参数,再基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应,再根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱,以及再基于所述Mel频谱,获取MFCC,由于三角带通滤波器组是根据所述信息分布参数来所述频谱上进行分布的,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,从而解决了现有的电子设备在获取语音特征信息时,存在不能根据实际情况自动调整三角带通滤波器组的分布的技术问题,实现了电子设备能够根据实际情况自动调整三角带通滤波器组的分布的技术效果。
[0072]其二、由于本申请实施例是将所述频率带宽划分为N个频带,再基于所述信息分布参数,确定三角带通滤波器组在所述N个频带中的每个频带上的分布系数,而且所述N个频带中的第一频带携带的第一信息量大于所述N个频带中的第二频带携带的第二信息量时,分布在所述第一频带中的三角带通滤波器组的第一数量大于分布在所述第二频带中的三角带通滤波器组的第二数量,使得所述频谱中携带信息量多的频带设置较多的三角带通滤波器组,以及携带信息量少的频带设置较少的三角带通滤波器组,进而使得根据MFCC值提取的有效语音信息量增大,提高语音识别性能。
[0073]基于与上述方法相同的技术构思,本申请一实施例提供了一种电子设备,所述电子设备例如是平板电脑、智能手机、笔记本电脑等电子设备。
[0074]参见图2,所述电子设备包括:语音信息获取单元201,用于获取语音信息;信息参数获取单元202,用于获取所述语音信息在与所述语音信息对应频率宽度中的信息分布参数;分布系数确定单元203,用于基于所述信息分布参数,确定三角带通滤波器组在频谱上的分布系数,所述频谱与所述语音信息对应;Mel频谱获取单元204,用于根据所述分布系数,将三角带通滤波器组分布在所述频谱上进行滤波,获取Mel频谱;MFCC获取单元205,用于基于所述Mel频谱,获取MFCC。
[0075]较佳的,所述电子设备包括频谱信息获取单元,用于对所述语音信息依次进行预加重、分帧、加窗户和快速傅里叶变换FFT处理,获取与所述语音信息对应的频谱信息;
[0076]所述信息参数获取单元,具体用于基于所述频谱信息,确定所述信息分布参数。
[0077]较佳的,所述信息参数获取单元,具体用于对所述频谱信息进行功率分析,获取所述功率分布参数,再基于所述功率分布参数,确定所述信息分布参数。
[0078]较佳的,所述基MFCC获取单元,具体用于将所述Mel频谱取对数,获得对数能量谱,再将所述对数能量谱进行离散余弦变换DCT,获得所述MFCC。
[0079]较佳的,所述分布系数获取单元,具体用于基于所述信息分布参数,将所述频率带宽划分为N个频带,
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1