语音识别方法、装置、设备及产品与流程

文档序号:42202381发布日期:2025-06-20 18:43阅读:35来源:国知局

本申请涉及语音识别领域,尤其涉及一种语音识别方法、装置、设备及产品。


背景技术:

1、随着智能语音识别技术的不断进步与广泛应用,其对多样化语言环境的支持需求也日益增长,特别是针对那些使用人数较少但文化价值较高的少数民族语言,其语音识别技术正逐渐成为研究热点。

2、尽管当前语音识别技术在主流语言的应用上已经取得了显著进展,但对于使用人数较少的语种而言,其对应的语音识别系统存在语音识别准确率较低的问题。因此,亟需针对该些使用人数较少但文化价值较高的语种,提升其语音识别效果。


技术实现思路

1、基于上述技术现状,本申请提供一种语音识别方法、装置、设备及产品,能够提高使用人数较少的语种的语音识别准确度。

2、为了达到上述技术目的,本申请具体提出如下技术方案:

3、根据本申请实施例的第一方面,提供了一种语音识别方法,包括:确定目标语种的语音信号对应的语言类型为所述目标语种的方言时,识别所述语音信号的方言类型;根据所述方言类型对应的语音优化策略,对所述语音信号的声学特征进行优化处理,得到优化声学特征,所述语音优化策略为根据所述方言类型的口音特点生成的,用于提升语音识别效果的策略;基于所述优化声学特征进行语音识别,得到所述语音信号的语音识别结果。

4、根据本申请实施例的第二方面,提供了一种语音识别装置,包括:方言类型识别单元,用于确定目标语种的语音信号对应的语言类型为所述目标语种的方言时,识别所述语音信号的方言类型;优化处理单元,用于根据所述方言类型对应的语音优化策略,对所述语音信号的声学特征进行语音优化处理,得到优化声学特征,所述语音优化策略为根据所述方言类型的口音特点生成的,用于提升语音识别效果的策略;语音识别单元,用于基于所述优化声学特征进行语音识别,得到所述语音信号的语音识别结果。

5、根据本申请实施例的第三方面,提出了一种电子设备,包括存储器和处理器;所述存储器与所述处理器连接,用于存储程序;所述处理器用于通过运行所述存储器中的程序,实现第一方面以及第一方面的实现方式中的任意一项所述的语音识别方法。

6、根据本申请实施例的第四方面,提出了一种计算机程序产品,包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器实现第一方面以及第一方面的实现方式中的任意一项所述的语音识别方法。

7、本申请实施例提供的一种语音识别方法、装置、设备及产品,该方法通过确定目标语种的语音信号对应的语言类型为目标语种的方言时,识别该语音信号的方言类型,进而根据方言类型对应的语音优化策略,对语音信号的声学特征进行优化处理,得到优化后的声学特征,最后基于优化后的声学特征进行语音识别,以获得最终的语音识别结果。其中,语音优化策略为根据方言类型的口音特点生成的,用于提升语音识别效果的策略。由于在根据声学特征进行语音识别之前,识别了方言类型,并对方言进行语音优化处理,以增强声学特征的语音质量,从而提升后续语音识别的准确度。



技术特征:

1.一种语音识别方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方言类型包括第一地域方言类型、第二地域方言类型或第三地域方言类型;

3.根据权利要求2所述的方法,其特征在于,所述根据所述方言类型对应的语音优化策略,对所述声学特征进行语音优化处理,得到优化声学特征,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述优化声学特征进行语音识别,得到所述语音信号的语音识别结果,包括:

5.根据权利要求1-4任一项所述的方法,其特征在于,所述方法通过语音识别模型执行,所述语音识别结果包括所述语音识别结果的置信度,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,所述获取修正后的语音识别结果,包括:

7.根据权利要求5所述的方法,其特征在于,所述基于所述修正后的语音识别结果对所述语音识别模型进行更新,得到更新语音识别模型,包括:

8.根据权利要求7所述的方法,其特征在于,所述根据所述修正后的语音识别结果,确定所述置信度小于或等于预设置信度阈值的影响因素,包括:

9.根据权利要求1-4任一项所述的方法,其特征在于,所述方法通过语音识别模型执行,所述语音识别结果包括所述语音识别结果的置信度,所述方法还包括:

10.根据权利要求4所述的方法,其特征在于,所述语料库采用如下步骤构建得到:

11.根据权利要求1所述的方法,其特征在于,所述方法还包括:

12.一种语音识别装置,其特征在于,包括:

13.一种电子设备,其特征在于,包括存储器和处理器;

14.一种计算机程序产品,其特征在于,包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器实现如权利要求1至11中任意一项所述的方法。


技术总结
本申请提供一种语音识别方法、装置、设备及产品,该方法包括:确定目标语种的语音信号对应的语言类型为目标语种的方言时,识别语音信号的方言类型;据方言类型对应根的语音优化策略,对语音信号的声学特征进行语音优化处理,得到优化声学特征,语音优化策略为根据方言类型的口音特点生成的,用于提升语音识别效果的策略;基于优化声学特征进行语音识别,得到语音信号的语音识别结果。本申请能够提高目标语种的语音信号的识别准确度。

技术研发人员:刘思坤,万根顺,熊世富,高建清,刘聪
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:
技术公布日:2025/6/19
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1