嵌入式语音识别系统及方法与流程

文档序号：12128609阅读：来源：国知局

技术特征：

1.一种嵌入式语音识别系统，其特征在于，包括：

语音采集模块，用于获取语音信号，并对获取的所述语音信号进行分帧处理；

第一存储模块，用于存储所述语音信号的各个帧对应的梅尔频率倒谱系数；

第二存储模块，用于存储所述语音信号中包含的语音帧；

语音处理模块，包括预处理子模块、第一端点特征检测子模块、第一数据处理子模块和第二数据处理子模块；所述预处理子模块用于对所述语音信号的当前输入帧进行预处理；所述第一端点特征检测子模块用于计算所述当前输入帧的梅尔频率倒谱系数和短时能量值，并将所述当前输入帧的梅尔频率倒谱系数存储在第一存储模块中；

所述第一数据处理子模块用于根据所述当前输入帧的短时能量值判断当前输入帧是否为语音帧；当所述当前输入帧为语音帧时，将所述当前输入帧对应的梅尔频率倒谱系数存储至第二存储模块中；所述第二数据处理子模块用于当所述语音信号结束时，根据所述第二存储模块中的语音帧的梅尔频率倒谱系数进行语音特征识别。

2.根据权利要求1所述的嵌入式语音识别系统，其特征在于，所述系统还包括先入先出阵列；

所述第一数据处理子模块还用于当所述当前输入帧的短时能量值大于或等于第一能量阈值时，输出第一状态信号至所述先入先出阵列中；当所述当前输入帧的短时能量值小于所述第一能量阈值时，输出第二状态信号至所述先入先出阵列中；并当所述先入先出阵列中所述第一状态信号的个数大于或等于第一预设个数时，则判定当前输入帧为语音帧。

3.根据权利要求2所述的嵌入式语音识别系统，其特征在于，所述第一数据处理子模块还用于当下一输入帧的短时能量值小于或等于第二能量阈值时，输出第三状态信号至所述先入先出阵列中；当所述下一输入帧的短时能量值大于所述第二能量阈值时，输出第四状态信号至所述先入先出阵列中；当所述先入先出阵列中所述第三状态信号的个数大于或等于第二预设个数时，则判定当前输入帧为非语音帧。

4.根据权利要求1所述的嵌入式语音识别系统，其特征在于，所述语音处理模块还包括第二端点特征检测子模块和第三数据处理子模块，所述第二端点特征检测子模块用于根据连续输出的非语音帧的帧长获得非语音帧的持续时间；

所述第三数据处理子模块用于判断所述非语音帧的持续时间是否大于或等于第一预设时间；当所述非语音帧的持续时间大于或等于第一预设时间时，则判定所述语音信号结束，并将所述语音信号结束的信号传送至所述第二数据处理子模块和所述语音采集模块。

5.根据权利要求1所述的嵌入式语音识别系统，其特征在于，所述语音处理模块还包括运算子模块和第四数据处理子模块；

所述运算子模块用于当所述语音信号结束后，根据所述第二存储模块中一个或多个语音帧的帧长，获得所述语音信号的语音段的持续时间；

第四数据处理子模块用于判断所述语音段的持续时间是否大于或等于第二预设时间；当所述语音段的持续时间大于或等于第二预设时间时，则调用所述第二数据处理子模块进行语音特征识别；当所述语音段的持续时间小于所述第二预设时间时，则清空所述第一存储模块和所述第二存储模块。

6.根据权利要求1所述的嵌入式语音识别系统，其特征在于，所述语音处理模块还包括判断子模块，用于判断所述第二存储模块是否满载；

所述第二数据处理子模块还用于当所述第二存储模块满载时，根据所述第二存储模块中的语音帧的梅尔频率倒谱系数进行语音特征识别，并停止获取语音信号。

7.根据权利要求5或6所述的嵌入式语音识别系统，其特征在于，所述系统还包括语音识别模块；

所述第二数据处理子模块还包括归一化计算单元和差分计算单元；

所述归一化单元用于对所述第二存储模块中的一个或多个语音帧的梅尔频率倒谱系数进行归一化处理，获得归一化参数；

所述差分计算单元用于根据所述第二存储模块中的一个或多个语音帧的梅尔频率倒谱系数计算获得一阶差分参数和二阶差分参数；

所述语音识别模块用于根据所述归一化参数、所述一阶差分参数和所述二阶差分参数进行语音特征识别。

8.一种嵌入式语音识别方法，其特征在于，包括如下步骤：

获取语音信号，并对获取的所述语音信号进行分帧处理；

对所述语音信号的当前输入帧进行预处理；

计算所述当前输入帧的梅尔频率倒谱系数，并将所述当前输入帧的梅尔频率倒谱系数存储在第一存储模块中；

计算所述当前输入帧的短时能量值；

根据所述当前输入帧的短时能量值判断当前输入帧是否为语音帧；

当所述当前输入帧为语音帧时，将所述当前输入帧对应的梅尔频率倒谱系数存储至第二存储模块中；

当所述语音信号结束时，根据所述第二存储模块中的语音帧的梅尔频率倒谱系数进行语音特征识别。

9.根据权利要求8所述的嵌入式语音识别方法，其特征在于，根据所述当前输入帧的短时能量值判断当前输入帧是否为语音帧的步骤包括：

判断当前输入帧的短时能量值是否大于或等于第一能量阈值；

当所述当前输入帧的短时能量值大于或等于第一能量阈值时，输出第一状态信号至先入先出阵列中；

当所述当前输入帧的短时能量值小于所述第一能量阈值时，输出第二状态信号至所述先入先出阵列中；

当所述先入先出阵列中所述第一状态信号的个数大于或等于第一预设个数时，则判定当前输入帧为语音帧。

10.根据权利要求9所述的嵌入式语音识别方法，其特征在于，在判定当前输入帧为语音帧之后，所述方法还包括如下步骤：

判断下一输入帧的短时能量值是否小于或等于第二能量阈值；

当所述下一输入帧的短时能量值小于或等于第二能量阈值时，输出第三状态信号至所述先入先出阵列中；

当所述下一输入帧的短时能量值大于所述第二能量阈值时，输出第四状态信号至所述先入先出阵列中；

当所述先入先出阵列中所述第三状态信号的个数大于或等于第二预设个数时，则判定下一输入帧为非语音帧。

11.根据权利要求8所述的嵌入式语音识别方法，其特征在于，所述方法还包括如下步骤：

根据连续输出的非语音帧的帧长获得非语音帧的持续时间；

判断所述非语音帧的持续时间是否大于或等于第一预设时间；

当所述非语音帧的持续时间大于或等于第一预设时间时，则判定所述语音信号结束，根据所述第二存储模块中的语音帧的梅尔频率倒谱系数进行语音特征识别，并重新获取下一个语音信号。

12.根据权利要求8所述的嵌入式语音识别方法，其特征在于，当判定所述语音信号结束后，所述方法还包括如下步骤：

根据所述第二存储模块中一个或多个语音帧的帧长，获得所述语音信号的语音段的持续时间；

判断所述语音段的持续时间是否大于或等于第二预设时间；

当所述语音段的持续时间大于或等于第二预设时间时，则根据所述第二存储模块中的语音帧的梅尔频率倒谱系数进行语音特征识别；

当所述语音段的持续时间小于所述第二预设时间时，则清空所述第一存储模块和所述第二存储模块。

13.根据权利要求8所述的嵌入式语音识别方法，其特征在于，所述方法还包括如下步骤：

判断所述第二存储模块是否满载；

当所述第二存储模块满载时，根据所述第二存储模块中的语音帧的梅尔频率倒谱系数进行语音特征识别，并停止获取语音信号。

14.根据权利要求11或13所述的嵌入式语音识别方法，其特征在于，对获取的所述语音信号进行特征识别的步骤包括：

对所述第二存储模块中的一个或多个语音帧的梅尔频率倒谱系数进行归一化处理，获得归一化参数；

根据所述第二存储模块中的一个或多个语音帧的梅尔频率倒谱系数计算获得一阶差分参数和二阶差分参数。

完整全部详细技术资料下载

当前第2页1 2 3