语音控制系统及其唤醒方法、唤醒装置和家电、协处理器与流程

文档序号：11834512阅读：来源：国知局

技术特征：

1.一种语音控制系统的唤醒方法，其特征在于，包括：

采集步骤：采集语音信息；

处理步骤：对所述语音信息进行处理，确定所述语音信息中是否含有人声；若含有，分离出含有人声的语音信息片段，进入识别步骤；

识别步骤：对含有人声的语音信息片段进行唤醒词识别；若识别出唤醒词，则进入唤醒步骤；若未识别出唤醒词，则返回所述采集步骤；

唤醒步骤：唤醒语音识别处理器。

2.如权利要求1所述的语音控制系统的唤醒方法，其特征在于，所述语音信息由多个采集自不同时间段的语音信息片段组成，所有所述时间段拼接成完整连续的时间链；和/或，

所述采集步骤包括：

采集模拟信号格式的语音信息；

对所述模拟信号格式的语音信息进行数字转换，得到数字信号格式的语音信息。

3.如权利要求1所述的语音控制系统的唤醒方法，其特征在于，

所述唤醒步骤之前，所述唤醒方法还包括：构建唤醒词语音模型；则，

所述识别步骤包括：将含有人声的数据与所述唤醒词语音模型进行匹配；若匹配成功，则判断为：识别出唤醒词；若匹配未成功，则判断为：未识别出唤醒词。

4.如权利要求3所述的语音控制系统的唤醒方法，其特征在于，所述构建唤醒词语音模型包括：

采集若干人的唤醒语音数据；

将所有所述唤醒语音数据处理，训练得到唤醒词模型。

5.如权利要求4所述的语音控制系统的唤醒方法，其特征在于，

所述构建唤醒词语音模型包括：

在离线状态下，采集说话人在不同环境下录制的唤醒词，并做分帧处理；

分帧后，提取特征参数；

对所述特征参数进行聚类，建立隐马尔科夫HMM模型的观察状态；

通过Baum-Welch算法调整隐马尔科夫HMM模型参数，最大化P(σ|λ),λ为模型参数；σ为观察状态，调整模型参数λ，得到观察状态σ的概率最大，完成模型训练，存储唤醒词语音模型；

所述识别步骤包括：

将含有人声的数据的语音帧提取特征参数，得到一组新的观察值σ’，作为新的观察状态，计算P(σ’|λ)；

将P(σ’|λ)和置信阈值比较，得到是否识别出唤醒词。

6.如权利要求1-5任一项所述的语音控制系统的唤醒方法，其特征在于，所述处理步骤包括：

第一分离步骤：对数字信号格式的所述语音信息进行盲源分离处理，以分离出非高斯性数值最大的语音信号；

判断步骤：通过能量阈值判断所述语音信号是否含有人声；若超过能量阈值，则判断为：含有人声，进入第二分离步骤；若未超出能量阈值，则判断为：不含有人声，进入所述采集步骤；

第二分离步骤：分离出含有人声的语音信息，得到含有人声的语音信息片段。

7.如权利要求6所述的语音控制系统的唤醒方法，其特征在于，所述第一分离步骤中，所述盲源分离采用的方法为：基于负熵最大化、4阶统计量峭度、或时频变换的独立成分分析ICA算法。

8.一种协处理器，其特征在于，包括：

处理模块，用于对采集的语音信息进行处理，确定所述语音信息中是否含有人声；若含有，分离出含有人声的语音信息片段；

识别模块，用于所述处理模块分离出的含有人声的语音信息片段进行唤醒词识别；若识别出唤醒词，则生成唤醒指令；

唤醒模块，用于根据所述唤醒指令唤醒语音识别处理器。

9.如权利要求8所述的协处理器，其特征在于，所述处理模块包括：分离单元、判断单元；

所述分离单元，用于对数字信号格式的所述语音信息进行盲源分离处理，以分离出非高斯性数值最大的语音信号；

所述判断单元，用于通过能量阈值判断所述语音信号是否含有人声；若超过能量阈值，则分离出含有人声的语音信息，得到含有人声的语音信息片段。

10.如权利要求9所述的协处理器，其特征在于，所述识别模块包括：识别单元和存储单元；

所述存储单元，用于存储唤醒词模型；

所述识别单元，用于将所述判断单元分离得到的含有人声的语音信息片段与所述存储单元存储的所述唤醒词模型进行唤醒词匹配，若匹配成功，则生成唤醒指令。

11.如权利要求10所述的协处理器，其特征在于，

所述唤醒词语音模型的构建包括：

采集若干人的唤醒语音数据；

将所有所述唤醒语音数据处理，训练得到唤醒词模型。

12.如权利要求11所述的协处理器，其特征在于，

构建唤醒词语音模型包括：

在离线状态下，采集说话人在不同环境下录制的唤醒词，并做分帧处理；

分帧后，提取特征参数；

对所述特征参数进行聚类，建立隐马尔科夫HMM模型的观察状态；

所述识别模块的识别步骤包括：

将含有人声的数据的语音帧提取特征参数，得到一组新的观察值σ’，作为新的观察状态，计算P(σ’|λ)；

将P(σ’|λ)和置信阈值比较，得到是否识别出唤醒词。

13.一种语音控制系统的唤醒装置，其特征在于，包括：语音采集组件和权利要求8-12任一项所述的协处理器；其中，

所述语音采集组件，用于采集语音信息；

所述协处理器，用于对所述语音采集组件采集的所述语音信息进行处理，确定所述语音信息中是否含有人声；若含有，分离出含有人声的语音信息片段，对含有人声的语音信息片段进行唤醒词识别；若识别出唤醒词，则唤醒语音识别组件。

14.如权利要求13所述的语音控制系统的唤醒装置，其特征在于，所述语音采集组件包括：语音采集模块和A/D转换模块；

所述语音采集模块，用于采集模拟信号格式的语音信息；

所述A/D转换模块，用于对所述模拟信号格式的语音信息进行数字转换，得到数字信号格式的语音信息。

15.一种语音控制系统，其特征在于，包括：语音识别组件和权利要求13-14任一项所述的唤醒装置；所述语音识别组件与所述唤醒装置的协处理器连接；

所述语音识别组件，在工作激活状态时，用于语音识别；语音识别后，进入非工作休眠状态；

所述语音识别组件在所述非工作休眠状态向所述工作激活状态的切换由所述协处理器唤醒。

16.如权利要求15所述的语音控制系统，其特征在于，所述语音识别组件在所述工作激活状态向所述非工作休眠状态转换前，进入等待状态；

在设定时间段内，若所述语音识别组件未被唤醒，则进入所述非工作休眠状态；若所述语音识别组件被唤醒，则进入所述工作激活状态。

17.一种智能家电，其特征在于，包括权利要求15或16所述语音控制系统和家电本体；所述家电本体与所述语音控制系统连接。

完整全部详细技术资料下载

当前第2页1 2 3