汉语语音识别中重复出现词识别错误的自动修正方法

文档序号：6561637阅读：1063来源：国知局

专利名称：汉语语音识别中重复出现词识别错误的自动修正方法
技术领域：
本发明涉及语音识别技术领域，特别是涉及一种汉语语音识别中重复出现词识别错误的自动修正方法。
背景技术：
语音识别技术是一种利用计算机和数字信号处理技术准确地识别出人类语音内容的技术。目前面向特殊应用的中小词汇量语音识别技术已得到实际应用，然而，由于受到背景噪音、方言口音、口语化的自然语音以及语义理解等因素的限制，大词汇量说话人无关的连续语音识别技术还处在探索阶段。由于语音识别无法达到100%的识别准确率，因此，对识别结果中的识别错误进行修正是不可缺少的。识别错误修正是指在一句话识别后由说话人对识别结果中的错误进行修正。早期的识别错误修正方法主要有重新发音修正方法(re-speaking)，单词拼写修正方法 (spelling)，键盘输入修正方法，和手写输入修正方法。近期的识别错误修正方法有候选选择修正方法，识别系统对每个词给出多个候选，用户在语音输入的同时或完成之后通过选择候选修正识别错误。无论是早期的修正方法还是后来的候选选择修正方法，对于不同语句中的同一个词识别错误都需要重新修正，即对于同一个词，其每次的识别错误都需要有用户参与的修正；修正效率较低。

发明内容
本发明要解决的技术问题是利用之前已修正的识别结果，自动修正当前识别语句中重复出现词的识别错误，从而提高识别错误的修正效率，加快识别错误修正速度。本发明提供一种汉语语音识别中重复出现词识别错误的自动修正方法，其特征在于，包括(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配，以查找重复出现词组；( 根据查找得到的词组信息，重新计算相似概率值和字识别概率值；(3)根据新的概率值，对字混淆网络按照概率值大小排序；和⑷使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。其中，字混淆网络是所有可能识别结果的集合，字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果；词组库包括词组及其对应的中间识别结果；相似性匹配即计算词组库中的词组对应的中间识别结果与字混淆网络中的中间识别结果的相似程度，用相似概率值表示该相似程度，相似概率值大于零的词组为当前识别语句中可能再次出现的词；所述词组信息包括词组本身、词组的相似概率值以及词组在最优识别结果中的对应位置；语句中的重复出现词是指语句中的某个词在以前的语句中出现过，其在当前语句的再次出现叫做重复出现词，对其识别错误称为重复出现词识别错误；除了重复出现词识别错误外，还有首次出现的词被识别错误的情况，这种识别错误叫做非重复出现词识别错误。可选的，步骤(1)中所述进行相似性匹配包括计算词组及对应中间识别结果与当前字混淆网络的相似概率值；和保留相似概率值大于零的词组；其中，所述计算方式为
权利要求
1.一种汉语语音识别中重复出现词识别错误的自动修正方法，其特征在于，包括(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配，以查找重复出现词组；其中，字混淆网络是所有可能识别结果的集合，字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果；词组库包括词组及其对应的中间识别结果；(2)根据查找得到的词组信息，重新计算相似概率值和字识别概率值；(3)根据新的概率值，对字混淆网络按照概率值大小排序；和(4)使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。
2.根据权利要求1所述的自动修正方法，其特征在于，步骤(1)中所述进行相似性匹配包括计算词组及对应中间识别结果与当前字混淆网络的相似概率值；和保留相似概率值大于零的词组；其中，所述计算方式为
3.根据权利要求1所述的自动修正方法，其特征在于，词组中的每个字对应当前字混淆网络中的一列识别结果；步骤O)中所述重新计算相似概率值包括重新计算查找到词组中每个字的相似概率值；其中，重新计算查找到词组中每个字的相似概率值方式为
4.根据权利要求3所述的自动修正方法，其特征在于，步骤(2)中所述重新计算字识别概率值包括重新计算每个对应列中的字识别概率值；其中，重新计算每个对应列中的字识别概率值的方式为
5.根据权利要求1所述的自动修正方法，其特征在于，还包括(5)通过在混淆网络中选择正确的字、或者通过键盘输入、或者通过手写输入来修正非重复出现词识别错误，以得到不再包含任何识别错误的已修正识别结果。
6.根据权利要求5所述的自动修正方法，其特征在于，还包括(6)挖掘已修正识别结果中所有的词组；和(7)存储或更新得到的词组到词组库。
7.根据权利要求6所述的自动修正方法，其特征在于，步骤(6)中所述挖掘已修正识别结果中所有的词组包括计算已修正识别结果中每个字与相邻若干字组成词的概率值；选择组合概率最大的词组作为挖掘到的词组；其中，所述计算的方式为num(Scl) num(SC2) num{SCk)PKc1,…,ck、= Yj Σ …Σ PK八,···, ,O'ι=1 h=1k=1P (C1, c2,…，ck)表示已修正识别结果中第1个字与第2个到第k个字组成词的概率值，num(SCt)表示已修正识别结果中第k个字对应中间识别结果列中字的个数，％表示已修正识别结果中第k个字所对应中间识别结果列中的第ik个字，PK，c2’h，…，Ck h )表示字混淆网络中字％与、到％的组合概率值。
8.根据权利要求1所述的自动修正方法，其特征在于，所述词组库为词组文件或词组数据库。
全文摘要
本发明提供一种汉语语音识别中重复出现词识别错误的自动修正方法，包括(1)对每句话经识别后得到的字混淆网络与词组库中的词组及中间识别结果进行相似性匹配，以查找重复出现词组；其中，字混淆网络是所有可能识别结果的集合，字混淆网络包括最优识别结果即原有最优识别结果和最优识别结果中的每个字对应的中间识别结果；词组库包括词组及其对应的中间识别结果；(2)根据查找得到的词组信息，重新计算相似概率值和字识别概率值；(3)根据新的概率值，对字混淆网络按照概率值大小排序；和(4)使用排序结果替换字混淆网络的最优识别结果以及中间识别结果。优点在于利用之前已修正的识别结果中的经验知识，自动修正当前识别语句中重复出现词的识别错误，从而提高识别错误的修正效率，加快识别错误修正速度。
文档编号G06F17/30GK102324233SQ20111022084
公开日2012年1月18日申请日期2011年8月3日优先权日2011年8月3日
发明者李新辉, 林守勋, 王向东, 钱跃良申请人:中国科学院计算技术研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李新辉;王向东;钱跃良;林守勋
技术所有人：中国科学院计算技术研究所
我是此专利的发明人

上一篇：自适应模板大小的Gabor指纹图像增强方法
上一篇：基于集成学习的混合融合人脸识别方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。