一种提高语音辨识效率的方法及其语音辨识装置的制作方法

文档序号:2831163阅读:228来源:国知局
专利名称:一种提高语音辨识效率的方法及其语音辨识装置的制作方法
技术领域
本发明涉及一种提高语音辨识效率的方法及其语音辨识装置,尤其涉及一 种通过删除非语音区来提升语音辨识准确率的方法及装置。
背景技术
语音辨识最基本的定义,即"计算机能听懂人类说话的语句或命令,而做出 相对应的工作"。也就是,如果计算机配备有"语音辨识"的功能,当声音通过一 个转换装置转换为一种语音信号输入到一个电子装置内部,并加以储存后,语 音辨识程序便开始以你输入的声音样本与事先储存好的声音样本进行比对的工 作。语音信号比对工作完成的后,电子装置就会输入一个它认为最"像"的声音样 本序号,即可辨识刚才发出的声音是什么含意,进而执行此命令。但要真正建 立辨识率高的语音辨识程序组,其难度十分高。举例而言,如要辨识十个词汇,
那就是先把这十个字汇的声音念入计算机中,存成十个参考样本,辨识时,只 需将接收到的语音讯号与事先记录的十个参考样本一一比对,找出与测试样本 最像的样本,即可把测试样本辨识出來。但每个使用者念入计算机的语音长度、 音调、频率都不一样,甚至同一位使用者,尽管每次都念相同的声音,但波形
也会不尽相同,如果在一个有杂音的环境中,那情况将更糟。因此,许多人都 在研究如何解决这个难题。
对于此种问题,有人尝试用如傅立叶转换、倒频谱参数等,但是结果还是 不理想。
此外,准确率越高的语音辨识程序组所需要的运算量也就越大,所以就无 法在以往低运算量处理器的便携式装置上实现高准确率的语音辨识。然而,目 前便携式装置已经十分普遍,几乎是人人每天都会使用。鉴于以上问题本发明 提出了一种运算量低并且辨识准确率高的方法以及语音辨识装置。

发明内容
为了解决现有技术中所提到的辨识准确率低,需要处理器运算率高而现有 都是可携式装置的缺点,本发明提供了一种运算量低并且辨识准确率高的语音辨识方法及其语音辨识装置。
本发明的技术解决方案本发明为一种提高语言辨识效率的方法,其特殊 之处在于该方法包括以下步骤
1) 提供至少一辨识数据并在其中设置一第一特征参数;
2) 接收一语音信号;
3) 利用语音活动检测程序,侦测该语音信号的开始和结束的位置,从而取 得第一语音波段;
4) 判别第一语音波段中的语音区及非语音区,并在该第一语音波段的语音 区设置一第二特征参数,所述第二特征参数与第一特征参数相对应;
5) 利用语音活动检测程序,删除第一语音波段中的非语音区从而产生第二 语音波段;
6) 将辨识数据中的第一特征参数与第二语音波段中的第二特征参数进行比
对,以判断第二语音波段是否符合该辨识数据,以完成语音辨识。
上述辨识数据是已利用语音活动检测程序经过删除非语音区处理的辨识数据。
上述非语音区是指静音或噪音。 上述辨识数据、第二语音波段均是数字信号。 上述辨识数据是为使用者预先录制的语音数据或是厂商预先储存于电子装 置内的语音数据。
上述语音数据是语音指令。 上述语音信号是一语音指令。
一种使用上述的提高语言辨识效率的方法的语音辨识装置,其特殊之处在 于该装置包含用于储存至少一个已经过非语音区删除处理的辨识数据的储存 单元,用于接收声音并将声音转化为语音信号的接收单元,用于侦测语音信号 开始及结束的位置以取得第一语音波段、并删除第一语音波段中的非语音区以 产生第二语音波段,继而比对辨识数据与第二语音波段,以判断第二语音波段 是否符合辨识数据的处理单元,以及用于判别第一语音波段中语音区和非语音
区的判别单元;接收单元接入处理单元,处理单元分别与判别单元和储存单元 相连。本发明具有以下优点
(1) 本发明运用了语音活动侦测程序以决定进行语音辨识时语音讯号开始 和结束的位置,取得进行语音辨识的第一语音波段后,例如语音段落,再进 行二次处理,将第一语音波段段落中的非语音区(静音或噪声)消除后以产生 一不具非语音区的第二语音波段,并利用多个辨识数据辨识此第二语音波段, 依此提高辨识的效率。
(2) 本发明的方法中仅需处理语音的部分,这样就可以减少系统的负荷程 度或是不需要较高效能的微处理器(CPU)。


图1为本发明提高语音辨识效率的方法的步骤流程图; 图2为本发明的语音辨识装置的实施例方块图; 图3为本发明的实施例示意图一; 图4为本发明的实施例示意图二。
附图标记说明20-第一语音波段,201-语音区,202-非语音区,21-开始键, 22-结束键,23-歌手辨识键,24-歌手选单,25-进度条,26-第二语音波段,31-存储单元,32-接收单元,33-处理单元,34-判别单元,311-辨识数据,321-语音 信号,33〗-第一语音波段,332-第二语音波段。
具体实施例方式
如图1所示,为本发明提高语音辨识效率的方法的步骤流程图。该方法包
含以下步骤
Sll:提供至少一个辨识数据,且该辨识数据是已利用语音活动检测程序经 过删除非语音区(静音或噪声)处理的。这些辨识数据是为使用者预先录制的 语音数据,或是厂商预先储存于电子装置内的语音数据;此辨识数据可为语音 指令;在该辨识数据中设置第一特征参数;
S12:接收语音信号,例如使用者所输入的语音指令;
S13:利用语音活动侦测程序 (Voice Activity Detection, VAD)侦测该语音 信号开始及结束的位置以取得第一语音波段;
S14:判别第一语音波段中的语音区及非语音区(静音或噪声),并在该第 一语音波段的语音区设置一第二特征参数,第二特征参数与第一特征参数相对应;
S15:利用语音活动侦测程序 (Voice Activity Detection, VAD)将第一语音 波段中的非语音区删除以产生第二语音波段;
S16:比对辨识数据与第二语音波段,以判断第二语音波段是否符合该辨识 数据,即将辨识数据中的第一特征参数与第二语音波段中的第二特征参数进行 比对,以判断第二语音波段是否符合该辨识数据,以完成语音辨识。
若辨识数据符合第二语音波段,接着便执行此辨识数据所对应的指令,便 可达到语音输入指令的效果。
语音活动侦测程序(Voice Activity Detection,简称VAD)的目的是为决定语 音开始和结束的位置,在语音处理与辨识中,扮演一个重要的角色,如何有效 运用VAD技术将对于语音辨识效率有很大的影响。
更具体的描述,当使用者开始发出声音时,语音活动侦测程序便开始将声 音录制为语音信号,当侦测到发声结束后即停止录制,如此便取得第一语音波 段。其中,第一语音波段的语音区包含有第二特征参数,且当删除第一语音波 段的非语音区便产生第二语音波段时,第二语音波段也保留了第一语音波段中 的第二特征参数。辨识数据则包含有第一特征参数,此第二特征参数与第一特 征参数相对应,故辨识用的存储单元里所存的辨识数据即为第二语音波段的对 比资料。此辨识数据储存于存储单元中。
删除第一语音波段的非语音区,使进行语音辨识比对时所用的特征参数长 度縮短,例如縮小需记录的语音波段的长度,则需记录的第二特征参数亦随 之减少,提高语音辨识的速度。正因如此,在进行语音辨识时,将预先录下使 用者输入的正常语音并转换为第一语音波段,再将第一语音波段中的非语音区 删除以产生第二语音波段,接着才将第二语音波段与存储单元内的辨识数据做 比对,当辨识数据中第一特征参数与第二语音波段中的第二特征参数相对应时, 即可判别第二语音波段为何,则表示完成辨识。通过这种方法来提高辨识的精 确性以及减少程序资源的使用。
第二语音波段也可转换为一数位信号并与储存于存储单元中的辨识数据相 对应,其中,将声音转换为语音信号或将第二语音波段转换为数位信号的技术 为已知技术,其为本领域的技术人员所熟知,故在此不再多加阐述。参见图2,语音辨识装置是包含存储单元31、接收单元32、处理单元33 及判别单元34。存储单元31是用于储存至少一个辨识数据311,此辨识数据 311是已经过非语音区删除处理,接收单元32是用以接收声音并将其转化为语 音信号321,接收单元32可为麦克风或声音接收耳。处理单元33是侦测语 音信号321开始及结束的位置以取得第一语音波段331,判别单元33是判别 第一语音波段331的语音区及非语音区,接着处理单元32是删除第一语音波 段331的非语音区以产生第二语音波段332,并比对辨识数据311与第二语 音波段332,以判断第二语音波段332是否符合辨识数据311。第一语音波段 331的语音区包含第二特征参数,且当删除第一语音波段331的非语音区以产 生的第二语音波段332时,第二语音波段332也保留了第一语音波段331中 的第二特征参数。辨识数据311则包含有第一特征参数,此第二特征参数与第 一特征参数相对应,故辨识用的数据库31里所存的辨识数据311即为第二语 音波段332的对比资料。删除第一语音波段331的非语音区,使进行语音辨 识比对时所用的特征参数长度缩短,例如縮小需记录的语音波段的长度,则 需记录的第二特征参数亦随之减少,提高语音辨识的速度。
处理单元33是利用语音活动侦测程序侦测语音信号321开始及结束的位置 并删除其非语音区的波段。第二语音波段332也可转换为一位数信号与储存于 存储单元31中的辨识数据311相对应。
图3中,语音辨识装置提供语音辨识接口给使用者,当使用者按下开始键 21,声音接收端便接收使用者发出的声音并转换为语音信号,然后利用语音活 动侦测程序(Voice Activity Detection,简称VAD)侦测语音信号开始及结束的位 置以取得第一语音波段20,此第一语音波段20包含有第二特征参数,随后判 别第一语音波段20的语音区201及非语音区202。
图4中,利用VAD技术将非语音区202予以删除,则取得第二语音波段 26,此第二语音波段26是删除了第一语音波段20的非语音区202,只保留了 第一语音波段20的语音区201,故此第二语音波段26亦保留了第一语音波 段20的语音区201的第二特征参数,这种方法可以减少语音辨识装置需处理 的信号长度。
语音辨识装置是依据存储单元中至少一个辨识数据来辨识第二语音波段26,且此些辨识数据包含有第一特征参数,且此辨识数据是已经过非语音区删 除处理的。更具体的说,因第二特征参数与第一特征参数相对应,故这些识别 资料可视为第二语音波段的对应资料,另一方面,删除第一语音波段20的非 语音区202,使进行语音辨识比对时所用的特征参数长度縮短,例如縮小需
记录的语音波段的长度,则需记录的第二特征参数亦随之减少。
在进行语音辨识时,预先录下使用者输入的正常语音,并转换为第一语音
波段20,再将第一语音波段20中的非语音区删除以产生第二语音波段26,接 着才将第二语音波段26与存储单元内的辨识数据做比对,当第二特征参数与 第二语音波段26中的第一特征参数相对应时,即可判别第二语音波段为何, 完成辨识。通过此方法可以提高辨识的精确性以及减少程序资源的浪费。
请注意,特征参数的定义方法系为本领域工作者所熟知,故在此不在赘述。 第二语音波段26亦可转换为一数位讯号与储存于数据库中的辨识数据相对 应,其中,将声音转换为语音信号或将第二语音波段26转换为数位的技术系 为已知技艺,其系为本领域者所熟知,故在此不再多加阐述。
其中,如使用者欲在语音辨识过程中执行其它指令,语音辨识接口还提供 结束键22以供使用者终止语音辨识的动作,更甚者,语音辨识接口也包含一 进度条25以供使用者了解语音辨识的进度。另外,使用者进行歌手点歌时,可 点选本语音辨识接口中的歌手辨识键,由使用者输入语音信号(如歌手名称), 语音辨识装置将辨识相对应较符合的歌手候选名单24给使用者选择决定。
权利要求
1、一种提高语言辨识效率的方法,其特征在于该方法包括以下步骤1)提供至少一辨识数据并在其中设置一第一特征参数;2)接收一语音信号;3)利用语音活动检测程序,侦测该语音信号的开始和结束的位置,从而取得第一语音波段;4)判别第一语音波段中的语音区及非语音区,并在该第一语音波段的语音区设置一第二特征参数,所述第二特征参数与第一特征参数相对应;5)利用语音活动检测程序,删除第一语音波段中的非语音区从而产生第二语音波段;6)将辨识数据中的第一特征参数与第二语音波段中的第二特征参数进行比对,以判断第二语音波段是否符合该辨识数据,以完成语音辨识。
2、 根据权利要求1所述的提高语言辨识效率的方法,其特征在于所述辨 识数据是已利用语音活动检测程序经过删除非语音区处理的辨识数据。
3、 根据权利要求1所述的提高语言辨识效率的方法,其特征在于所述非语音区是指静音或噪音。
4、 根据权利要求1所述的提高语言辨识效率的方法,其特征在于所述辨识数据、第二语音波段均是数字信号。
5、 根据权利要求1所述的提高语言辨识效率的方法,其特征在于所述辨 识数据是为使用者预先录制的语音数据或是厂商预先储存于电子装置内的语音 数据。
6、 根据权利要求5所述的提高语言辨识效率的方法,其特征在于所述语 音数据是语音指令。
7、 根据权利要求1所述的提高语言辨识效率的方法,其特征在于所述语 音信号是一语音指令。
8、 一种使用权利要求1所述的提高语言辨识效率的方法的语音辨识装置, 其特征在于该装置包含用于储存至少一个已经过非语音区删除处理的辨识数 据的储存单元,用于接收声音并将声音转化为语音信号的接收单元,用于侦测语音信号开始及结束的位置以取得第一语音波段、并删除第一语音波段中的非 语音区以产生第二语音波段,继而比对辨识数据与第二语音波段,以判断第二 语音波段是否符合辨识数据的处理单元,以及用于判别第一语音波段中语音区 和非语音区的判别单元;所述接收单元接入处理单元,所述处理单元分别与判 别单元和储存单元相连。
全文摘要
本发明涉及一种提高语言辨识效率的方法及其语音辨识装置,包括步骤1)提供至少一辨识数据并在其中设置一第一特征参数;2)接收一语音信号;3)利用语音活动检测程序,侦测该语音信号的开始和结束的位置,从而取得第一语音波段;4)判别第一语音波段中的语音区及非语音区,并在该第一语音波段的语音区设置一第二特征参数,所述第二特征参数与第一特征参数相对应;5)利用语音活动检测程序,删除第一语音波段中的非语音区从而产生第二语音波段;6)将辨识数据中的第一特征参数与第二语音波段中的第二特征参数进行比对,以判断第二语音波段是否符合该辨识数据,完成语音辨识。本发明运算量低并且辨识准确率高。
文档编号G10L15/20GK101419797SQ200810232600
公开日2009年4月29日 申请日期2008年12月5日 优先权日2008年12月5日
发明者赵仁宏 申请人:无敌科技(西安)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1