一种句子发音测评的方法、装置及可读存储介质与流程

文档序号：30580201发布日期：2022-06-29 11:45阅读：来源：国知局

技术特征：
1.一种句子发音测评的方法，其特征在于，包括：步骤100，基于目标单词集合和高频单词集合构建解码网络；步骤200，对待测音频进行语音识别，得到候选解码路径集合；从候选路径集合中选择与待测评文本具有最小编辑距离的词序列作为候选词序列集合；在候选词序列对应的候选解码路径中选择解码得分最高的路径作为识别最优路径输出；步骤300，根据gop公式得到识别词序列中各个词的发音得分；步骤400，解析识别词序列和目标词序列，得到目标词序列中各个词的发音得分。2.根据权利要求1所述的句子发音测评的方法，其特征在于，所述步骤100中，所述解码网络中的目标单词相关路径包含目标文本的多读/漏读路径，所述解码网络以高频单词部分作为目标文本的错读路径。3.根据权利要求1所述的句子发音测评的方法，其特征在于，所述步骤100中，目标单词的语言模型代价分数被设置为每个词相同的一个定值。4.根据权利要求3所述的句子发音测评的方法，其特征在于，所述步骤100中，高频单词由训练数据统计得到，高频单词对应的语言模型代价得分为该单词在训练数据中出现概率乘以一个小于1的权重系数，且高频单词的语言模型代价分数大于目标单词的语言模型代价分数。5.根据权利要求4所述的句子发音测评的方法，其特征在于，所述步骤100包括：步骤101，在评测开始前编译生成一个顶层状态网络；步骤102，在评测时使用目标文本构建子状态网络；步骤103，将子状态网络嵌套在顶层状态网络中得到最终的状态解码网络。6.根据权利要求5所述的句子发音测评的方法，其特征在于，所述步骤101包括：根据高频词及其对应语言模型代价得分，添加一个目标词符号，构建词间跳转的词级解码网络，再结合常规发音词典和音素的状态绑定信息构建状态解码网络，作为顶层状态网络。7.根据权利要求6所述的句子发音测评的方法，其特征在于，所述步骤102包括：根据目标词及其对应语言模型代价得分，结合特定发音词典和音素的状态绑定信息构建状态解码网络。8.根据权利要求1所述的句子发音测评的方法，其特征在于，所述步骤200中，每条候选解码路径包含与时间帧长度相同的状态序列、每个状态的似然度/跳转概率、单词序列和状态序列的对应关系、以及单词的声学得分/语言模型得分代价。9.根据权利要求1所述的句子发音测评的方法，其特征在于，所述步骤200中，所述从候选路径集合中选择与待测评文本具有最小编辑距离的词序列作为候选词序列集合，包括：提取当前候选路径集合中的词序列，在去除重复后的词序列中寻找和目标词序列具有最小编辑距离的词序列集合，作为候选词序列集合。10.根据权利要求9所述的句子发音测评的方法，其特征在于，所述最小编辑距离词路径的选择基于加权有限状态转换机进行。11.根据权利要求10所述的句子发音测评的方法，其特征在于，所述最小编辑距离词路径的选择方法具体包括：
对当前的候选词序列集合和目标词序列分别构建一个有限状态接收器；建立目标词和候选词编辑代价对应的有限状态接收器，任意目标词和任意候选词之间都存在弧，当候选词和目标词相同时，弧的权重设为0，当候选词和目标词不同时，弧的权重设为1；空输入和候选词输出对应的弧的权重设为1，目标词和空输出的弧的权重设为0；对目标词序列对应的fsa和编辑代价函数对应的wfst进行复合操作，然后使用候选词序列集合对应的fsa和新的wfst进行复合操作得到每条候选词路径对应的编辑距离，选择代价最小路径/路径集合输出。12.根据权利要求1所述的句子发音测评的方法，其特征在于，所述步骤400包括：对识别词序列和目标词序列进行文本对齐，将目标词序列中对应
″
删除
″
和
″
替换
″
错误的单词对应得分置为最低分，其余单词得分保持不变。13.一种句子发音测评装置，特征在于，包括：解码网络构建模块，被配置为输入目标词集合和高频词集合，生成词间解码网络，再结合发音词典和hmm模型，输出生成状态级解码网络；解码模块，被配置为使用状态级解码网络对待测音频进行识别，输出候选解码路径集合；最优识别路径选择模块，被配置为在候选解码路径集合里选择和目标词序列具有最小编辑距离的词路径作为候选词路径集合，在候选词路径集合对应的候选解码路径中选择解码得分最高的路径输出；单词gop评分模块，被配置为输入最优识别路径对应的单词时间边界和单词似然度，输出识别词路径中每个词的gop评分；识别词序列解析模块，被配置为输入识别词路径中每个单词的gop评分，根据识别词序列和目标词序列的对齐结果对评分进行改写，输出最终的单词发音评分。14.一种句子发音测评装置，其特征在于，包括存储器和处理器；所述存储器，用于存储计算机程序；所述处理器，用于当执行所述计算机程序时，实现如权利要求1至12任一项所述的句子发音测评方法。15.一种可读存储介质，其特征在于，所述存储介质上存储有程序，当所述程序被处理器执行时，实现如权利要求1至12任一项所述的句子发音测评方法。

技术总结
本发明提供了一种句子发音测评的方法、装置及可读存储介质。该方法包括：基于目标词序列和高频单词集合构建含权重的词间解码网络；对待评测音频进行语音识别，得到候选解码路径集合；遍历当前候选解码路径集合对应所有可能的词序列，得到和目标文本具有最小编辑距离的新候选词序列集合，进一步在候选词序列对应的候选解码路径中选择解码得分最高的路径作为识别最优路径输出。本发明能在兼顾多读/漏读/错读单词评分的同时，尽可能地减少高分单词的评分错误。评分错误。评分错误。

技术研发人员：王佳珺唐浩元代大明王欢良
受保护的技术使用者：苏州奇梦者科技有限公司
技术研发日：2022.03.21
技术公布日：2022/6/28

完整全部详细技术资料下载

当前第2页1 2