语音数据处理方法、装置及电子设备与流程

文档序号：33279479发布日期：2023-02-24 20:35阅读：来源：国知局

技术特征：
1.一种语音数据处理方法，其特征在于，包括：接收第一语音；基于语音识别模型，对所述第一语音进行语音识别，确定所述第一语音对应的识别信息；其中，所述语音识别模型为基于样本语音数据库中的目标样本语音进行训练得到的，所述目标样本语音为对初始样本语音进行语音检测得到的；其中，所述语音检测包括：语速检测、关键词频次检测以及留白检测中的至少一种；根据所述识别信息，执行所述第一语音对应的处理操作。2.根据权利要求1所述的语音数据处理方法，其特征在于，所述对所述第一语音进行语音识别之前，所述方法还包括：接收所述初始样本语音；对所述初始样本语音进行所述语音检测，根据所述语音检测的检测结果，筛选满足预设样本要求的所述初始样本语音作为目标样本语音。3.根据权利要求2所述的语音数据处理方法，其特征在于，所述对所述初始样本语音进行所述语音检测，包括：将所述初始样本语音分割成多个语音帧，确定所述语音帧中的有效语音帧；筛选连续的有效语音帧的帧数量大于预设数量的语段作为有效语段；对包括所述有效语段的所述初始样本语音进行所述语音检测。4.根据权利要求3所述的语音数据处理方法，其特征在于，所述确定所述语音帧中的有效语音帧，包括：提取所述语音帧的声学特征；确定所述语音帧的声学特征符合预设特征条件的情况下，确定所述语音帧为所述有效语音帧。5.根据权利要求3所述的语音数据处理方法，其特征在于，在所述语音检测包括留白检测的情况下，所述对所述初始样本语音进行所述语音检测，包括：确定相邻的所述有效语段之间的间隔时长；确定所述间隔时长是否在第一标准时长范围之内。6.根据权利要求3所述的语音数据处理方法，其特征在于，在所述语音检测包括语速检测的情况下，所述对所述初始样本语音进行所述语音检测，包括：将所述有效语段的语段时长与第二标准时长范围进行比较，确定所述语段时长是否在所述第二标准时长范围之内。7.根据权利要求3所述的语音数据处理方法，其特征在于，在所述语音检测包括关键词频次检测的情况下，所述对所述初始样本语音进行所述语音检测，包括：对所述有效语段进行语音识别，确定所述有效语段中是否包含目标关键词，以及包含所述目标关键词的有效语段的数量是否大于预设阈值。8.根据权利要求2所述的语音数据处理方法，其特征在于，所述根据所述语音检测的检测结果，筛选满足预设样本要求的所述初始样本语音作为目标样本语音，包括：在所述语音检测包括单项检测的情况下，确定单项检测的检测结果满足预设样本要求的所述初始样本语音作为目标样本语音；在所述语音检测包括多项检测的情况下，确定多项检测中，至少预设数量的检测结果
满足预设样本要求的所述初始样本语音作为目标样本语音。9.根据权利要求2所述的语音数据处理方法，其特征在于，在所述接收所述初始样本语音之前，所述方法还包括：接收第二语音；确定所述第二语音中包含目标唤醒词的情况下，发送提示语音，和/或显示第一提示信息；所述提示语音及所述第一提示信息指示开始采集所述初始样本语音；其中，所述第一提示信息中包括以下至少一项:目标关键词；目标关键词的采集次数；目标关键词的之间的间隔时长。10.根据权利要求2所述的语音数据处理方法，其特征在于，所述方法还包括：确定所述初始样本语音不满足预设样本条件的情况下，显示第二提示信息；所述第二提示信息指示重新采集所述初始样本语音。11.一种语音数据处理装置，其特征在于，包括：接收模块，用于接收第一语音；识别模块，用于基于语音识别模型，对所述第一语音进行语音识别，确定所述第一语音对应的识别信息；其中，所述语音识别模型为基于样本语音数据库中的目标样本语音进行训练得到的，所述目标样本语音为对初始样本语音进行语音检测得到的；其中，所述语音检测包括：语速检测、关键词频次检测以及留白检测中的至少一种；执行模块，用于根据所述识别信息，执行所述第一语音对应的处理操作。12.一种电子设备，其特征在于，所述电子设备包括：一个或多个处理器；存储器；一个或多个应用程序，其中所述一个或多个应用程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行，所述一个或多个程序配置用于：执行根据权利要求1至10任一项所述的语音数据处理方法。13.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至10任一项所述的语音数据处理方法。

技术总结
本申请实施例提供了一种语音数据处理方法、装置、电子设备及计算机可读存储介质，涉及语音识别技术领域。该方法包括：通过接收第一语音，基于语音识别模型，对所述第一语音进行语音识别，确定所述第一语音对应的识别信息；根据所述识别信息，执行所述第一语音对应的处理操作。由于语音识别模型为基于目标样本语音进行训练得到的，所述目标样本语音为对初始样本语音进行语音检测得到的，这样，得到的目标样本语音的语音质量较高，从而使得基于该目标样本语音训练的语音识别模型的语音识别精度较高，提升了语音识别的准确度。提升了语音识别的准确度。提升了语音识别的准确度。

技术研发人员：王炳乾刘童
受保护的技术使用者：京东方科技集团股份有限公司
技术研发日：2022.09.27
技术公布日：2023/2/23

完整全部详细技术资料下载

当前第2页1 2