一种样本生成方法、装置、服务器及存储介质与流程

文档序号：20268226发布日期：2020-04-03 18:40阅读：来源：国知局

技术特征：

1.一种样本生成方法，其特征在于，包括：

确定已从音频样本集中选取的各个与目标唤醒词相关的目标音频样本的目标音素序列；

比较所有所述目标音素序列中第一音素的总数量和第二音素的总数量，得到比较结果，所述第一音素与所述目标唤醒词相关，所述第二音素与所述目标唤醒词无关；

判断所述比较结果是否满足预先设置的样本生成条件；

若所述比较结果不满足所述样本生成条件，从所述音频样本集中选取与所述目标唤醒词相关的目标音频样本；

基于所述比较结果对当前选取的所述目标音频样本的音素序列进行处理生成目标音素序列；

若所述比较结果满足所述样本生成条件，将已选取的各个所述目标音频样本的目标音素序列确定为所述目标唤醒词的样本。

2.根据权利要求1所述的方法，其特征在于，所述比较所有所述目标音素序列中第一音素的总数量和第二音素的总数量，得到比较结果，包括：

获取所有所述目标音素序列中第一音素的总数量以及所有所述目标音素序列中第二音素的总数量；

将所述第一音素的总数量和所述第二音素的总数量的第一比例确定为比较结果。

3.根据权利要求2所述的方法，其特征在于，所述判断所述比较结果是否满足预先设置的样本生成条件，包括：

判断所述比较结果是否位于预先设置的样本生成条件指示的阈值范围；

若所述比较结果位于所述阈值范围，确定所述比较结果满足所述样本生成条件；

若所述比较结果没有位于所述阈值范围，确定所述比较结果不满足所述样本生成条件。

4.根据权利要求1所述的方法，其特征在于，还包括：

从所述音频样本集中获取与所述目标唤醒词相关的目标音频样本；

确定当前获取的所述目标音频样本的音素序列中第一音素的总数量和第二音素的总数量的第二比例；

根据所述比较结果和所述第二比例确定是否选取当前获取的所述目标音频样本；

所述从所述音频样本集中选取与所述目标唤醒词相关的目标音频样本，包括：若根据所述比较结果和所述第二比例确定选取当前获取的所述目标音频样本，将当前获取的所述目标音频样本作为从所述音频样本集中选取与所述目标唤醒词相关的目标音频样本。

5.根据权利要求1所述的方法，其特征在于，所述基于所述比较结果对当前选取的所述目标音频样本的音素序列进行处理生成目标音素序列，包括：

获取与所述目标唤醒词的标准音素序列相关的至少一个标准子音素序列；

根据所述至少一个标准子音素序列确定当前选取的所述目标音频样本的音素序列中的第三音素以及第四音素，所述第三音素为当前选取的所述目标音频样本的音素序列中第一个第一音素，所述第四音素为当前选取的所述目标音频样本的音素序列中最后一个第一音素；

根据所述比较结果对当前选取的所述目标音频样本的音素序列中位于所述第三音素之前的音素以及位于所述第四音素之后的音素进行调整生成目标音素序列。

6.根据权利要求5所述的方法，其特征在于，所述根据所述至少一个标准子音素序列确定当前选取的所述目标音频样本的音素序列中第三音素以及第四音素，包括：

确定与当前选取的所述目标音频样本的音素序列相关的各个子音素序列，所述子音素序列和所述标准子音素序列中音素数量相同；

从各个所述子音素序列中选取出所述标准子音素序列；

获取所选取的标准子音素序列中的目标音素；

将当前选取的所述目标音频样本的音素序列中与所述目标音素对应的音素确定为第一音素，并将当前选取的所述目标音频样本的音素序列中除所确定的第一音素外的其他音素作为第二音素；

按照所确定的各个第一音素在当前选取的所述目标音频样本的音素序列中的顺序对所确定的各个第一音素进行排序，将排序最靠前的第一音素确定为第三音素，将排序最靠后的第一音素确定为第四音素。

7.根据权利要求6所述的方法，其特征在于，所述根据所述比较结果对当前选取的所述目标音频样本的音素序列中位于所述第三音素之前的音素以及位于所述第四音素之后的音素进行调整生成目标音素序列，包括：

从当前选取的所述目标音频样本的音素序列的第二音素中选取表征音频音素的第五音素；

将当前选取的所述目标音频样本的音素序列中所述第五音素的音素值修改为预设音素值生成第一音素序列；

根据所述比较结果对所述第一音素序列中位于所述第三音素之前的音素数量以及位于所述第四音素之后的音素数量进行调整生成第二音素序列。

8.根据权利要求1所述的方法，其特征在于，还包括生成与所述目标唤醒词的标准音素序列相关的至少一个标准子音素序列的过程，该过程包括：

根据所述目标唤醒词中各个字符的音素的标准音素值生成所述目标唤醒词的标准音素序列；

对所述标准音素序列中连续出现的音素值相同的各个音素值进行整合生成第一标准音素序列；

在所述第一标准音素序列的第一个音素之前和最后一个音素之后分别添加一个第六音素生成第二标准音素序列，所述第六音素的音素值为1；

按照所述第二标准音素序列中音素顺序依次生成与所述第二标准音素序列相关的各个标准子音素序列。

9.一种样本生成装置，其特征在于，包括：

目标音素序列确定单元，用于确定已从音频样本集中选取的各个与目标唤醒词相关的目标音频样本的目标音素序列；

比较单元，用于比较所有所述目标音素序列中第一音素的总数量和第二音素的总数量，得到比较结果，所述第一音素与所述目标唤醒词相关，所述第二音素与所述目标唤醒词无关；

第一判断单元，用于判断所述比较结果是否满足预先设置的样本生成条件；

第一选取单元，用于若所述比较结果不满足所述样本生成条件，从所述音频样本集中选取与所述目标唤醒词相关的目标音频样本；

第一生成单元，用于基于所述比较结果对当前选取的所述目标音频样本的音素序列进行处理生成目标音素序列；

第一确定单元，用于若所述比较结果满足所述样本生成条件，将已选取的各个所述目标音频样本的目标音素序列确定为所述目标唤醒词的样本。

10.一种服务器，其特征在于，至少一个存储器和至少一个处理器；所述存储器存储有程序，所述处理器调用所述存储器存储的程序，所述程序用于实现如权利要求1-8任意一项所述的样本生成方法。

11.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机可执行指令，所述计算机可执行指令用于执行权利要求1-8任意一项所述的样本生成方法。

完整全部详细技术资料下载

当前第2页1 2 3