语音识别方法、语音评分方法、语音识别系统及语音评分系统的制作方法

文档序号：9616939阅读：599来源：国知局

语音识别方法、语音评分方法、语音识别系统及语音评分系统的制作方法
【技术领域】
[0001] 本发明涉及一种语音识别方法和语音评分方法，并进一步涉及使用这样的语音识别方法的语音识别系统及使用这样的语音评分方法的语音评分系统。
【背景技术】
[0002] 目前，伴随着语音识别技术的不断发展，基于语音识别的应用也越来越广泛，这样的技术已经渗透入家庭生活、办公领域、娱乐等方面。用户通过利用对着个人计算机、笔记本电脑、平板电脑、专用的学习终端、智能手机等终端上外接或内置的麦克风来输入语音 (例如，朗读一句话），经由语音识别引擎（以下简称"引擎"）完成语音-文字的转换。现有的引擎的产品有很多，例如，被广泛使用的世界知名的Nuance、Google(谷歌）的语音识别服务、中国国内的科大讯飞的语音识别服务等。但是引擎在进行语音识别的最大问题是语音识别的准确率，即使是在现有的引擎产品中拥有最高语音识别准确率的Nuance，也无法避免以下问题：
[0003]al、诸如不常见的人名、地名等一些生僻的词汇不会被引擎准确识别，通常情况下会被识别为相同读音的词汇。
[0004] a2、在日语中，有时候希望引擎识别返回的是汉字，有时候希望识别返回的是假名，但是引擎无法分别。
[0005] 另一方面，越来越多的语言学习是通过基于互联网的远程学习系统来实现，并且也伴随有各式各样的测验系统，来检验用户（学习者）学习的成效。作为语言学习中非常重要的一环的口语学习，在远程学习系统中通常都配置有基于如上所述的语音识别方法的语音评分系统，来进行测验用户的口语。举例而言，用户通过终端中安装的软件完成与学习服务器的交互（即，构成用于实施语音评分方法的语音评分系统），经语音-文字转换、文字-文字匹配等一些技术手段最终获得该用户所输入的读音的评分，即表征用户是否用标准的读音朗读了该句话的评分。
[0006] 现有技术的在基于语音识别的语音评分系统中，主要采用如图1所示的语音评分方法：获取用户朗读原文所发出的语音（步骤S101)，利用引擎对获取的用户的语音进行语音识别（语音-文本的转换）（步骤S102)(步骤S101-S102实质为语音识别方法），通过将语音识别结果（文本）与原文（文本）进行相似度比较计算语音评分（步骤S103)，输出作为结果的语音评分（步骤S104)。
[0007] 由于上面所述的引擎在进行语音识别存在的语音识别准确率的问题，因而，在语音评分系统中会影响评分准确性。此外，除了语音识别准确率的问题，引擎在进行语音识别时还存在以下的不足：
[0008]b1、引擎在进行语音识别时常常会将语气词误判为无效语音而自动过滤掉。
[0009] b2、句末的疑问词读得比较轻的时候也会被引擎误判为无效的语音而自动过滤掉。
[0010] 综上所述，现有的语音识别系统中，由于现有的引擎在进行语音识别时客观存在不足，因而会影响其输出的语音识别结果的正确性。另外，基于这样的语音识别系统的语言学习系统的语音评分系统中语音评分的准确性也存在评判不准确、不合理等问题，会导致用户对其兴趣和信任度降低，非常不利于该语言学习系统的推广。

【发明内容】

[0011] 本发明的一个目的是提供一种语音识别方法，能够克服以上列举的现有技术中的缺陷中的至少一点缺陷，有效地提高语音识别准确率。
[0012] 本发明的另一个目的是提供一种语音评分方法，能够克服以上列举的现有技术中的缺陷中的至少一点缺陷，有效地提高语言学习系统的语音评分准确率。
[0013] 根据本发明的一个方面，提供一种语音识别方法，用于对用户的语音进行识别，生成语音识别结果，该方法包括以下步骤：语音获取步骤，获取用户的语音；语音识别步骤，通过语言识别处理将获取的语音转换为文本数据，作为初始语音识别结果；纠错步骤，查阅已记录有若干个原词汇-偏差词汇的关联的纠错列表，若纠错列表的某一个原词汇-偏差词汇的关联中的偏差词汇存在于初始语音识别结果中，则进行纠错处理，以将初始语音识别结果中的与偏差词汇相同的词汇替换为原词汇-偏差词汇的关联中的原词汇，从而获得纠错后的语音识别结果，作为语音识别方法生成的语音识别结果。
[0014] 根据本发明的另一个方面，提供一种语音评分方法，用于对用户朗读特定的原文的语音进行评判，输出表征其语音标准程度的评分，该方法包括：如上所述的语音识别方法，该语音识别方法基于用户朗读特定原文的语音生成语音识别结果；并进一步包括比较步骤，将原文与纠错后的语音识别结果进行相似度比较，如果原文与纠错后的语音识别结果完全一致，输出最高的评分，如果原文与纠错后的语音识别结果不一致，执行过滤步骤，在过滤步骤中，从原文中找出一个或多个在原文中存在、但是在初始语音识别结果中或纠错后的语音识别结果中没有相应的识别结果返回的未返回词汇，并建立相应的一个或多个未返回词汇-空白的关联，并通过查阅已记录有若干个未返回词汇-空白的关联的过滤词列表，当建立的一个或多个未返回词汇-空白的关联中的部分或全部未返回词汇-空白的关联已经被记录在过滤词列表中，则从原文中删除与部分或全部未返回词汇-空白的关联对应的未返回词汇，以生成过滤后的原文；输出步骤，将纠错后的语音识别结果与过滤后的原文进行相似度比较，计算并输出评分。
[0015] 根据本发明的又一个方面，提供了一种语音识别系统，用于对用户语音进行识别，生成语音识别结果，该语音识别系统包括：语音获取单元，获取用户的语音；语音识别单元，通过语言识别处理将获取的语音转换为文本数据，作为初始语音识别结果；纠错处理单元，查阅已记录有若干个原词汇-偏差词汇的关联的纠错列表，若纠错列表的某一个原词汇-偏差词汇的关联中的偏差词汇存在于初始语音识别结果中，则进行纠错处理，以将初始语音识别结果中的与偏差词汇相同的词汇替换为原词汇-偏差词汇的关联中的原词汇，从而获得纠错后的语音识别结果，作为语音识别系统生成的语音识别结果。
[0016] 根据本发明的又一个方面，提供了一种语音评分系统，用于对用户朗读特定的原文的语音进行评判，输出表征其语音标准程度的评分，该语音评分系统包括：如上所述的语音识别系统，基于用户朗读特定原文的语音生成语音识别结果；并进一步包括比较单元，将原文与纠错后的语音识别结果进行相似度比较，如果原文与纠错后的语音识别结果完全一致，输出最高的评分；比较单元还包括样本过滤单元，如果原文与纠错后的语音识别结果不一致，样本过滤单元执行过滤处理，以从原文中找出一个或多个在原文中存在、但是在初始语音识别结果或纠错后的语音识别结果中没有相应的识别结果返回的未返回词汇，并建立相应的一个或多个未返回词汇-空白的关联，并通过查阅已记录有若干个未返回词汇-空白的关联的过滤词列表，当建立的一个或多个未返回词汇-空白的关联中的部分或全部未返回词汇-空白的关联已经被记录在过滤词列表中，则从原文中删除与部分或全部未返回词汇-空白的关联对应的未返回词汇，以生成过滤后的原文；输出单元，将纠错后的语音识别结果与过滤后的原文进行相似度比较，计算并输出评分。
[0017] 通过采用本发明的语音识别方法和系统，能够有效地提高结合了这样的语音识别方法的语音识别准确率。
[0018] 通过采用本发明的语音评分方法和系统，能够有效地提高结合了这样的语音评分方法的语言学习系统的语音评分准确率。
【附图说明】
[0019] 图1是显示现有技术的在基于语音识别的语音评分系统中的语音评分方法的流程图。
[0020] 图2是显示根据第一实施例的语音识别方法的流程图。
[0021] 图3是显示根据第二实施例的纠错列表的生成方法的第一个实例的流程图。
[0022] 图4是显示根据第二实施例的纠错列表的生成

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶树灵;程钧杰;姚俊杰;陈剑;
技术所有人：株式会社理光;
我是此专利的发明人