一种音频数据识别结果的调整方法及装置与流程

文档序号:19265500发布日期:2019-11-29 17:36阅读:来源:国知局

技术特征:

1.一种音频数据识别结果的调整方法,其特征在于,包括:

在接收到第一音频数据的第一识别结果时,获取所述第一识别结果中的指定文字信息,所述指定文字信息是人工校对第一识别结果时,发现的所述第一识别结果中的错误文字信息或可能错误的文字信息;

从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据;

获取所述指定音频数据的发音,并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息;

使用所述目标候选信息替换所述指定文字信息,以对所述第一识别结果进行调整。

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

当所述目标候选信息为至少两个时,按照至少两个所述目标候选信息中的每个所述目标候选信息的最近使用时间、历史使用频率、历史使用次数之和、历史使用地点中的一种或其组合确定至少两个所述目标候选信息的显示优先级;

按照所述显示优先级从高到低的顺序依次将至少两个所述目标候选信息进行排列显示。

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

当至少两个所述目标候选信息中的任一目标候选信息被选中后,按照所述任一目标候选信息与其他目标候选信息中的每个目标候选信息的关联度,确定后续目标候选信息,以将所述后续目标候选信息提示给用户,其中,所述其他目标候选信息为至少两个所述目标候选信息中除所述任一目标候选信息之外的目标候选信息,且所述后续目标候选信息为所述其他目标候选信息中与所述任一目标候选信息的关联度最高的目标候选信息。

4.根据权利要求1至3中任一项所述的方法,其特征在于,所述方法还包括:

当接收到音频识别任务时,识别接收到的第二音频数据;

对所述第二音频数据的第二识别结果进行分词,以得到至少一个词,其中,所述至少一个词包括至少一个独词和至少一个组合词中的一种或其组合;

对所述至少一个独词和所述至少一个组合词中的一种或其组合进行词频统计,以得到词频统计结果;

根据所述词频统计结果获取所述至少一个词中的高频词,并实时获取与所述高频词相关的关联信息;

根据所述高频词、所述相关信息和所述词频统计结果建立所述词频统计模型。

5.一种音频数据识别结果的调整装置,其特征在于,包括:

第一获取单元,用于在接收到第一音频数据的第一识别结果时,获取所述第一识别结果中的指定文字信息,所述指定文字信息是人工校对第一识别结果时,发现的所述第一识别结果中的错误文字信息或可能错误的文字信息;

第一确定单元,用于从所述第一音频数据中确定所述指定文字信息所对应的指定音频数据;

第二获取单元,用于获取所述指定音频数据的发音,并从已经建立的词频统计模型中获取与所述发音对应的目标候选信息;

调整单元,用于使用所述目标候选信息替换所述指定文字信息,以对所述第一识别结果进行调整。

6.根据权利要求5所述的装置,其特征在于,所述装置还包括:

第二确定单元,用于当所述目标候选信息为至少两个时,按照至少两个所述目标候选信息中的每个所述目标候选信息的最近使用时间、历史使用频率、历史使用次数之和、历史使用地点中的一种或其组合确定至少两个所述目标候选信息的显示优先级;

显示单元,用于按照所述显示优先级从高到低的顺序依次将至少两个所述目标候选信息进行排列显示。

7.根据权利要求6所述的装置,其特征在于,所述装置还包括:

第三确定单元,用于当至少两个所述目标候选信息中的任一目标候选信息被选中后,按照所述任一目标候选信息与其他目标候选信息中的每个目标候选信息的关联度,确定后续目标候选信息;

提示单元,用于将所述后续目标候选信息提示给用户,其中,所述其他目标候选信息为至少两个所述目标候选信息中除所述任一目标候选信息之外的目标候选信息,且所述后续目标候选信息为所述其他目标候选信息中与所述任一目标候选信息的关联度最高的目标候选信息。

8.根据权利要求5至7中任一项所述的装置,其特征在于,所述装置还包括:

识别单元,用于当接收到音频识别任务时,识别接收到的第二音频数据;

分词单元,用于对所述第二音频数据的第二识别结果进行分词,以得到至少一个词,其中,所述至少一个词包括至少一个独词和至少一个组合词中的一种或其组合;

统计单元,用于对所述至少一个独词和所述至少一个组合词中的一种或其组合进行词频统计,以得到词频统计结果;

第三获取单元,用于根据所述词频统计结果获取所述至少一个词中的高频词,并实时获取与所述高频词相关的关联信息;

建立单元,用于根据所述高频词、所述相关信息和所述词频统计结果建立所述词频统计模型。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1