技术编号:18740723
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本申请涉及语音识别技术领域,尤其涉及一种用于语音识别的音频语料筛选方法、装置、计算机设备及计算机可读存储介质。背景技术一个好的语音识别模型离不开标记质量良好的标记语料,但是通过各种渠道采集和收集的语料通常无法保证其标注的准确性。一种常用的语料收集和存储方式就是一个音频一个对应的标注文本,由于种种因素,音频和标注的文本可能匹配度不高,这种不匹配的标记语料对语音识别模型的训练是有害的,会降低语音识别模型的准确性。发明内容本申请实施例提供了一种用于语音识别的音频语料筛选方法、装置、计算机设备及计算机可...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。