一种声音识别方法、装置及语音交互方法与流程

文档序号：12179732阅读：来源：国知局

技术特征：

1.一种声音识别方法，其特征在于，包括：

获取采集的原始声音数据，所述原始声音数据包括若干采样声音信号；

按区间对所述原始声音数据进行划分，划分得到的每个区间包含至少一采样声音信号；

针对每一区间，根据所述区间包含采样声音信号的过零率和声音能量，以及，与所述区间包含采样声音信号的数量对应的目标声音的过零率范围和声音能量范围，识别所述区间包含的采样声音信号是否为目标声音。

2.根据权利要求1所述的方法，其特征在于，所述按区间对所述原始声音数据进行划分，划分得到的每个区间包含至少一采样声音信号，包括：

按照各采样声音信号的采集时间先后顺序，将所述原始声音数据均匀划分为若干区间，不同区间包含的采样声音信号不同；

或者，

自所述原始声音数据中首个采样声音信号开始，按照设定窗口大小及设定滑动步长，从所述原始声音数据中划分得到若干区间的采样声音信号，其中，所述设定窗口大小及设定滑动步长均以采样声音信号的个数为单位。

3.根据权利要求1所述的方法，其特征在于，所述针对每一区间，根据所述区间包含采样声音信号的过零率和声音能量，以及，与所述区间包含采样声音信号的数量对应的目标声音的过零率范围和声音能量范围，识别所述区间包含的采样声音信号是否为目标声音，包括：

针对每一区间，计算并判断所述区间包含采样声音信号的过零率，是否处于与所述区间包含采样声音信号的数量对应的目标声音的过零率范围内；

选取处于所述目标声音的过零率范围内的区间作为第一候选区间；

针对每一所述第一候选区间，计算并判断所述第一候选区间包含采样声音信号的声音能量，是否处于与所述第一候选区间包含采样声音信号的数量对应的目标声音的声音能量范围内；

若是，将所述第一候选区间包含的采样声音信号确定为目标声音。

4.根据权利要求3所述的方法，其特征在于，所述计算并判断所述第一候选区间包含采样声音信号的声音能量，是否处于与所述第一候选区间包含采样声音信号的数量对应的目标声音的声音能量范围内，包括：

按照设定抽样策略，从所述第一候选区间中抽取若干采样声音信号；

计算抽取的各采样声音信号的声音能量的绝对值的和值；

获取与所述第一候选区间包含采样声音信号的数量以及设定抽样策略对应的，目标声音的声音能量范围；

判断所述和值是否处于获取的所述目标声音的声音能量范围内，若是，执行所述将所述第一候选区间包含的采样声音信号确定为目标声音的步骤。

5.根据权利要求1所述的方法，其特征在于，所述针对每一区间，根据所述区间包含采样声音信号的过零率和声音能量，以及，与所述区间包含采样声音信号的数量对应的目标声音的过零率范围和声音能量范围，识别所述区间包含的采样声音信号是否为目标声音，包括：

针对每一区间，计算并判断所述区间包含采样声音信号的声音能量，是否处于与所述区间包含采样声音信号的数量对应的目标声音的声音能量范围内；

选取处于所述目标声音的声音能量范围内的区间作为第二候选区间；

针对每一所述第二候选区间，计算并判断所述第二候选区间包含采样声音信号的过零率，是否处于与所述第二候选区间包含采样声音信号的数量对应的目标声音的过零率范围内；

若是，将所述第二候选区间包含的采样声音信号确定为目标声音。

6.根据权利要求5所述的方法，其特征在于，所述计算并判断所述区间包含采样声音信号的声音能量，是否处于与所述区间包含采样声音信号的数量对应的目标声音的声音能量范围内，包括：

按照设定抽样策略，从所述区间中抽取若干采样声音信号；

计算抽取的各采样声音信号的声音能量的绝对值的和值；

获取与所述区间包含采样声音信号的数量以及设定抽样策略对应的，目标声音的声音能量范围；

判断所述和值是否处于获取的所述目标声音的声音能量范围内，若是，执行所述选取处于所述目标声音的声音能量范围内的区间作为第二候选区间的步骤。

7.根据权利要求1所述的方法，其特征在于，所述针对每一区间，根据所述区间包含采样声音信号的过零率和声音能量，以及，与所述区间包含采样声音信号的数量对应的目标声音的过零率范围和声音能量范围，识别所述区间包含的采样声音信号是否为目标声音，包括：

针对每一区间，计算并判断所述区间包含采样声音信号的过零率，是否处于与所述区间包含采样声音信号的数量对应的目标声音的过零率范围内；

选取处于所述目标声音的过零率范围内的区间作为第三候选区间；

针对每一区间，计算并判断所述区间包含采样声音信号的声音能量，是否处于与所述区间包含采样声音信号的数量对应的目标声音的声音能量范围内；

选取处于所述目标声音的声音能量范围内的区间作为第四候选区间；

将所述第三候选区间与所述第四候选区间中交集区间所包含的采样声音信号确定为目标声音。

8.根据权利要求1-7任一项所述的方法，其特征在于，在所述按区间对所述原始声音数据进行划分之前，该方法还包括：

对所述原始声音数据进行降噪处理。

9.根据权利要求1-7任一项所述的方法，其特征在于，所述目标声音为人声。

10.一种声音识别装置，其特征在于，包括：

原始声音数据获取单元，用于获取采集的原始声音数据，所述原始声音数据包括若干采样声音信号；

数据划分单元，用于按区间对所述原始声音数据进行划分，划分得到的每个区间包含至少一采样声音信号；

目标声音识别单元，用于针对每一区间，根据所述区间包含采样声音信号的过零率和声音能量，以及，与所述区间包含采样声音信号的数量对应的目标声音的过零率范围和声音能量范围，识别所述区间包含的采样声音信号是否为目标声音。

11.根据权利要求10所述的装置，其特征在于，所述数据划分单元包括：

第一数据划分子单元，用于按照各采样声音信号的采集时间先后顺序，将所述原始声音数据均匀划分为若干区间，不同区间包含的采样声音信号不同；

或者，

第二数据划分子单元，用于自所述原始声音数据中首个采样声音信号开始，按照设定窗口大小及设定滑动步长，从所述原始声音数据中划分得到若干区间的采样声音信号，其中，所述设定窗口大小及设定滑动步长均以采样声音信号的个数为单位。

12.根据权利要求10所述的装置，其特征在于，所述目标声音识别单元包括：

第一目标声音识别子单元，用于针对每一区间，计算并判断所述区间包含采样声音信号的过零率，是否处于与所述区间包含采样声音信号的数量对应的目标声音的过零率范围内；

第二目标声音识别子单元，用于选取处于所述目标声音的过零率范围内的区间作为第一候选区间；

第三目标声音识别子单元，用于针对每一所述第一候选区间，计算并判断所述第一候选区间包含采样声音信号的声音能量，是否处于与所述第一候选区间包含采样声音信号的数量对应的目标声音的声音能量范围内；若是，将所述第一候选区间包含的采样声音信号确定为目标声音。

13.根据权利要求12所述的装置，其特征在于，所述第三目标声音识别子单元包括：

第一声音能量判断子单元，用于按照设定抽样策略，从所述第一候选区间中抽取若干采样声音信号；

第二声音能量判断子单元，用于计算抽取的各采样声音信号的声音能量的绝对值的和值；

第三声音能量判断子单元，用于获取与所述第一候选区间包含采样声音信号的数量以及设定抽样策略对应的，目标声音的声音能量范围；

第四声音能量判断子单元，用于判断所述和值是否处于获取的所述目标声音的声音能量范围内，若是，执行所述将所述第一候选区间包含的采样声音信号确定为目标声音的步骤。

14.一种语音交互方法，其特征在于，包括：

获取采集的原始声音数据，所述原始声音数据包括若干采样声音信号；

按区间对所述原始声音数据进行划分，划分得到的每个区间包含至少一采样声音信号；

针对每一区间，根据所述区间包含采样声音信号的过零率和声音能量，以及，与所述区间包含采样声音信号的数量对应的人声的过零率范围和声音能量范围，识别所述区间包含的采样声音信号是否为人声；

将识别出的为人声的采样声音信号进行编码，并将编码后的采样声音信号发送给目标对象，所述目标对象为确定的需要进行语音交互的对象。

完整全部详细技术资料下载

当前第2页1 2 3