语音的处理方法和装置与流程

文档序号：23717295发布日期：2021-01-24 06:06阅读：来源：国知局

技术特征：
1.一种语音的处理方法，其特征在于，包括：获取原始语音数据；对所述原始语音数据进行预识别，以获得预识别文本；通过领域场景分类器模型对所述预识别文本进行处理，以获得所述预识别文本所属的领域场景信息；通过与所述领域场景信息对应的领域场景语言模型对所述预识别结果进行二次识别，以获得最终识别文本；对所述最终识别文本进行正确性修正和领域场景信息标注，以获得修正后文本；根据所述领域场景信息，将所述修正后文本加入到相应的所述领域场景语言模型的文本数据库中；对所述领域场景语言模型进行更新；将所述修正后文本加入到领域场景分类器模型的训练数据库中；对所述领域场景分类器模型进行迭代训练。2.根据权利要求1所述的方法，其特征在于，所述对所述领域场景语言模型进行更新，具体为：定时对所述领域场景语言模型进行更新，或者，在加入到所述文本数据库中的文本数量大于第一预设值的情况下，对所述领域场景语言模型进行更新。3.根据权利要求1所述的方法，其特征在于，所述对所述领域场景分类器模型进行迭代训练，具体为：定时对所述领域场景分类器模型进行迭代训练，或者，在加入到所述训练数据库中的文本数量大于第二预设值的情况下，对所述领域场景分类器模型进行迭代训练。4.根据权利要求1所述的方法，其特征在于，所述对所述领域场景分类器模型进行迭代训练，具体为：在bert预训练模型上利用所述修正后文本与所述领域场景信息对所述领域场景分类器模型进行微调。5.根据权利要求1所述的方法，其特征在于，所述领域场景分类器模型由对textcnn模型或者fasttext模型进行训练生成；所述领域场景语言模型由对n-gram模型或者神经网络进行训练生成。6.一种语音的处理装置，其特征在于，包括：获取模块，用于获取原始语音数据；预识别模块，用于对所述原始语音数据进行预识别，以获得预识别文本；分类模块，用于通过领域场景分类器模型对所述预识别文本进行处理，以获得所述预识别文本所属的领域场景信息；二次识别模块，用于通过与所述领域场景信息对应的领域场景语言模型对所述预识别结果进行二次识别，以获得最终识别文本；修正模块，用于对所述最终识别文本进行正确性修正和领域场景信息标注，以获得修正后文本；
第一加入模块，用于根据所述领域场景信息，将所述修正后文本加入到相应的所述领域场景语言模型的文本数据库中；更新模块，用于对所述领域场景语言模型进行更新；第二加入模块，用于将所述修正后文本加入到领域场景分类器模型的训练数据库中；迭代模块，用于对所述领域场景分类器模型进行迭代训练。7.根据权利要求6所述的装置，其特征在于，所述更新模块具体用于定时对所述领域场景语言模型进行更新，或者，在加入到所述文本数据库中的文本数量大于第一预设值的情况下，对所述领域场景语言模型进行更新。8.根据权利要求6所述的装置，其特征在于，所述迭代模块，具体用于定时对所述领域场景分类器模型进行迭代训练，或者，在加入到所述训练数据库中的文本数量大于第二预设值的情况下，对所述领域场景分类器模型进行迭代训练。9.根据权利要求6所述的装置，其特征在于，所述迭代模块，具体用于在bert预训练模型上利用所述修正后文本与所述领域场景信息对所述领域场景分类器模型进行微调。10.根据权利要求6所述的装置，其特征在于，所述领域场景分类器模型由对textcnn模型或者fasttext模型进行训练生成；所述领域场景语言模型由对n-gram模型或者神经网络进行训练生成。

完整全部详细技术资料下载

当前第2页1 2 3