语音评分方法、装置、计算机设备及存储介质与流程

文档序号:17096069发布日期:2019-03-13 23:52阅读:188来源:国知局
语音评分方法、装置、计算机设备及存储介质与流程

本发明涉及计算机技术领域,尤其涉及一种语音评分方法、装置、计算机设备及存储介质。



背景技术:

智能语音技术应用的范围越来越广泛,在通过智能语音技术输入语音信息时需对所输入的语音信息进行识别,由于语音识别仅适用于普通话而不适用于其他方言,而现有的语音信息识别方法无法获取用户所输入语音信息与普通话之间的匹配度,而在用户输入的语音信息与普通话之间的匹配度不高的情况下,大幅降低了对用户所输入语音信息进行识别的准确率。因而,现有的语音信息识别方法存在无法判断语音信息与普通话之间匹配度的问题。



技术实现要素:

本发明实施例提供了一种语音评分方法、装置、计算机设备及存储介质,旨在解决的现有技术方法无法对语音信息与普通话之间的匹配度进行判断的问题。

第一方面,本发明实施例提供了一种语音评分方法,其包括:

若接收到匹配度测量请求,从预设文本语句库中随机选择一条文本语句作为目标文本语句;

根据所述目标文本语句生成录入提示信息以提示用户录入与所述目标文本语句相对应的语音信息;

若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息;

通过预设文本转换模型将所述目标文本语句转换为第二拼音信息;

根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分。

第二方面,本发明实施例提供了一种语音评分装置,其包括:

目标文本语句获取单元,用于若接收到匹配度测量请求,从预设文本语句库中随机选择一条文本语句作为目标文本语句;

提示信息生成单元,用于根据所述目标文本语句生成录入提示信息以提示用户录入与所述目标文本语句相对应的语音信息;

第一拼音信息获取单元,用于若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息;

第二拼音信息获取单元,用于通过预设文本转换模型将所述目标文本语句转换为第二拼音信息;

语音评分获取单元,用于根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分。

第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的语音评分方法。

第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的语音评分方法。

本发明实施例提供了一种语音评分方法、装置、计算机设备及存储介质。通过随机选择得到目标文本语句,对用户所录入的语音信息进行转换并目标文本语句转换得到的拼音信息进行匹配度计算,以得到用户的语音评分,通过语音评分即可获取用户所输入语音信息与普通话之间的匹配度,能够对语音信息与普通话之间的匹配度进行准确计算,满足了用户的实际使用需求。

附图说明

为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的语音评分方法的流程示意图;

图2为本发明实施例提供的语音评分方法的子流程示意图;

图3为本发明实施例提供的语音评分方法的另一子流程示意图;

图4为本发明实施例提供的语音评分方法的另一子流程示意图;

图5为本发明实施例提供的语音评分方法的另一流程示意图;

图6为本发明实施例提供的语音评分装置的示意性框图;

图7为本发明实施例提供的语音评分装置的子单元示意性框图;

图8为本发明实施例提供的语音评分装置的另一子单元示意性框图;

图9为本发明实施例提供的语音评分装置的另一子单元示意性框图;

图10为本发明实施例提供的语音评分装置的另一示意性框图;

图11为本发明实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

请参阅图1,图1是本发明实施例提供的语音评分方法的流程示意图。该语音评分方法应用于用户终端中,用户终端即是用于执行语音评分方法以实现对语音信息进行评分的终端设备,例如手机、平板电脑、台式电脑、笔记本电脑等。

如图1所示,该方法包括步骤s110~s150。

s110、若接收到匹配度测量请求,从预设文本语句库中随机选择一条文本语句作为目标文本语句。

若接收用户所输入的匹配度测量请求,从用户终端的预设文本语句库中随机选择一条文本语句作为目标文本语句。匹配度测量请求即是用户(用户终端的使用者)在用户终端中所输入的对该用户的语音评分进行测量的请求信息,预设文本语句库即是用户终端中所预设的用于存储文本语句的语句库,预设文本语句中包含多条文本语句以供选择。为增强对用户的语音评分进行测量的准确性,通过随机选择的方式从包含多条文本语句中的预设文本语句库中选择一条作为目标文本语句,可减少测量过程中的偶然情况,以提高测量的准确性。

s120、根据所述目标文本语句生成录入提示信息以提示用户录入与所述目标文本语句相对应的语音信息。

根据所述目标文本语句生成录入提示信息以提示用户录入与所述目标文本语句相对应的语音信息,具体的,生成在该目标文本语句中录入语音信息的提示信息并在用户终端中进行显示,以提示用户在该目标文本语句中录入相应的语音信息,用户察看该提示信息并根据提示信息的内容对语音信息进行录入。

例如,若目标文本语句为“xxxx”,则生成对应的提示信息为“请用普通话朗读以下内容:xxxx”。

s130、若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息。

若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息。为对用户所录入的语音信息是否与相应文本语句相匹配进行判断,需通过将用户所录入的语音信息转换为第一拼音信息,语音转换模型即是用于将语音信息转换为第一拼音信息的具体模型,语音转换模型中具体包括声学模型和语音特征词典。

在一实施例中,如图2所示,步骤s130包括子步骤s131和s132。

s131、根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素。

根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素。具体的,用户所录入的语音信息由多个字符发音的音素而组成,一个字符的音素包括该字符发音的频率和音色。声学模型中包含所有字符发音的音素,通过将音频信息与声学模型中所有的音素进行匹配,即可对音频信息中单个字符的音素进行切分,通过切分最终得到该音频信息中所包含的多个音素。

s132、根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。

根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。语音特征词典中包含所有字符拼音对应的音素信息,通过将所得到的音素与字符拼音对应的音素信息进行匹配,即可将单个字符的音素转换为语音特征词典中与该音素相匹配的字符拼音,获取该语音信息中所有字符相对应的字符拼音即可实现将语音信息中所包含的所有音素转换为第一拼音信息。

s140、通过预设文本转换模型将所述目标文本语句转换为第二拼音信息。

通过预设文本转换模型将所述目标文本语句转换为第二拼音信息。预设文本转换模型即是用于将目标文本语句转换为第二拼音信息的模型,每一个汉字或数字的汉语读法均能够通拼音进行表示,文本转换模型中包含所有字符的拼音信息,通过将目标文本语句中所包含的汉字或数字与文本转换模型中的字符进行匹配,即可将目标文本语句转换为第二拼音信息。

在一实施例中,如图3所示,步骤s140包括子步骤s141和s142。

s141、通过预设文本转换模型获取目标文本语句中每一字符的拼音信息。

通过预设文本转换模型获取目标文本语句中每一字符的拼音信息。具体的,通过将目标文本语句中每一个汉字或数字与文本转换模型中的字符进行匹配,即可获取相应汉字或数字在文本转换模型中的拼音信息,也即是获取得到目标文本语句中每一字符的拼音信息。

例如,获取得到“果”的拼音信息为“guǒ”,“和”的拼音信息为“hé/hú/huó/huò”。

s142、通过预设文本转换模型对所得到的拼音信息进行组合以得到第二拼音信息。

通过预设文本转换模型对每一字符在目标文本语句中的位置对所得到的字符拼音进行组合以得到第二拼音信息。具体的,若某一个字符不是多音字,则直接将该字符的读音添加至该字符在目标文本语句中所处的位置;若某一个字符为多音字,则需通过预设文本转换模型通过对该字符及前后字符进行词性分析,以从该字符的多种读音中选择与该字符当前词性相匹配的一种读音添加至该字符在目标文本语句中所处的位置。

例如,若目标文本语句中某一段为“苹果和葡萄”,由于“和”为多音字,则对其前后字符进行词性分析,苹果及葡萄均为名词,则通过预设文本转换模型确定此时“和”的词性为结构助词,当“和”作为结构助词时的的拼音信息为“hé”。

s150、根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分。

根据预设匹配度计算模型对第一拼音信息与第二拼音信息之间的匹配度进行计算以得到用户所输入语音信息与普通话之间的匹配度,也即是该用户的语音评分。具体的,匹配度计算模型即是对第一拼音信息及第二拼音信息之间匹配度进行计算的模型,第一拼音信息为根据用户所输入语音信息转换得到的拼音信息,第二拼音信息为相应目标文本语句普通话读音的拼音信息,通过对第一拼音信息与第二拼音信息之间的匹配度进行计算,即可得到该用户所输入语音信息与相应目标文本语句的普通话读音之间的匹配度,也即是得到该用户的语音评分。

在一实施例中,如图4所示,步骤s150包括子步骤s151、s152和s153。

s151、对所述第一拼音信息及第二拼音信息中所包含字符拼音的数量是否相等进行判断。

在对用户的语音评分进行计算之前,需对第一拼音信息及第二拼音信息中所包含字符的数量是否相等进行判断,具体的,分别获取第一拼音信息及第二拼音信息中字符拼音的数量并进行判断即可得到判断结果。

若判断结果为第一拼音信息及第二拼音信息中所包含字符的数量不相等,则向用户发出语音信息录入错误的提示信息。可在用户终端的显示设备中显示该语音信息录入错误的提示信息,用户接收到提示信息后,可根据该提示信息的内容再次录入语音信息。

s152、若第一拼音信息及第二拼音信息中所包含字符拼音的数量相等,将第一拼音信息中每一个字符拼音与第二拼音信息中相应字符拼音进行匹配以得到字符拼音匹配数p。

若第一拼音信息及第二拼音信息中所包含字符拼音的数量相等,将第一拼音信息中每一个字符拼音与第二拼音信息中相应字符拼音进行匹配,即可得到字符拼音匹配数p。由于第一拼音信息及第二拼音信息中所包含字符拼音的数量相等,因此第一拼音信息中每一个字符拼音均与第二拼音信息中相应的一个字符拼音相对应,具体的,获取第一拼音信息中第一个字符拼音与第二拼音信息中第一个字符拼音进行匹配,若第一拼音信息中的第一个字符拼音与第二拼音信息中相应字符拼音相匹配,则匹配数加一;若不相匹配,则获取第一拼音信息中下一个字符拼音与第二拼音信息中相匹字符拼音进行匹配,直至第一拼音信息中最后一个字符拼音完成匹配,获取此时的匹配数即为最终的字符拼音匹配数p。

s153、根据匹配度计算模型中的匹配度计算公式:匹配度s=p/p0计算得到所述用户的语音评分,其中,p0为第二拼音信息中所包含字符拼音的数量。

根据匹配度计算模型中的匹配度计算公式:匹配度s=p/p0计算得到所述用户所输入语音信息与普通话之间的匹配度,也即是该用户的语音评分,其中,p0为第二拼音信息中所包含字符拼音的数量,p为字符拼音匹配数。

基于以上语音评分方法,对用户所输入的语音信息进行评分得到语音评分之后,可进一步通过在用户终端中设置匹配度阈值与所得的语音评分进行比较,若所得到的语音评分小于匹配度阈值,则不对用户随后输入的待识别语音信息进行语音识别;若所得到的语音评分不小于匹配度阈值,即可对用户随后输入的待识别语音信息进行语音识别,也即是在用户的语音评分达到一定要求之后再对该用户所输入的待识别语音信息进行语音识别,以大幅提高对用户所输入待识别语音信息进行识别的准确率。

此外,以上语音评分方法也可直接用于对用户自身的普通话水平进行训练,例如用户通过获取语音评分,也即是获取其所输入语音信息与普通话之间的匹配度,即可清楚了解自己所输入的语音信息是否标准,从而可通过上述方法对其自身的普通话水平进行训练。

在一实施例中,如图5所示,步骤s150之后还包括步骤s160。

s160、获取所述第一拼音信息中与所述第二拼音信息不相匹配的字符拼音以生成非匹配提示信息。

获取第一拼音信息中与第二拼音信息不相匹配的字符拼音并生成非匹配提示信息在用户终端中进行显示,以提示用户所输入的语音信息与目标文本语句的普通话读音之间不相匹配的字符拼音,用户察看该非匹配提示信息即可获取后续进行语音录入时所需进行改进的部分。

通过随机选择得到目标文本语句,对用户所录入的语音信息进行转换并目标文本语句转换得到的拼音信息进行匹配度计算,以得到用户的语音评分,通过语音评分即可获取用户所输入语音信息与普通话之间的匹配度,能够对语音信息与普通话之间的匹配度进行准确计算,满足了用户的实际使用需求。

本发明实施例还提供一种语音评分装置,该语音评分装置用于执行前述语音评分方法的任一实施例。具体地,请参阅图6,图6是本发明实施例提供的语音评分装置的示意性框图。该语音评分装置可以配置于台式电脑、笔记本电脑、平板电脑或手机等终端设备中。

如图6所示,语音评分装置100包括目标文本语句获取单元110、提示信息生成单元120、第一拼音信息获取单元130、第二拼音信息获取单元140和语音评分获取单元150。

目标文本语句获取单元110,用于若接收到匹配度测量请求,从预设文本语句库中随机选择一条文本语句作为目标文本语句。

若接收用户所输入的匹配度测量请求,从用户终端的预设文本语句库中随机选择一条文本语句作为目标文本语句。匹配度测量请求即是用户(用户终端的使用者)在用户终端中所输入的对该用户的语音评分进行测量的请求信息,预设文本语句库即是用户终端中所预设的用于存储文本语句的语句库,预设文本语句中包含多条文本语句以供选择。为增强对用户的语音评分进行测量的准确性,通过随机选择的方式从包含多条文本语句中的预设文本语句库中选择一条作为目标文本语句,可减少测量过程中的偶然情况,以提高测量的准确性。

提示信息生成单元120,用于根据所述目标文本语句生成录入提示信息以提示用户录入与所述目标文本语句相对应的语音信息。

根据所述目标文本语句生成录入提示信息以提示用户录入与所述目标文本语句相对应的语音信息,具体的,生成在该目标文本语句中录入语音信息的提示信息并在用户终端中进行显示,以提示用户在该目标文本语句中录入相应的语音信息,用户察看该提示信息并根据提示信息的内容对语音信息进行录入。

第一拼音信息获取单元130,用于若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息。

若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息。为对用户所录入的语音信息是否与相应文本语句相匹配进行判断,需通过将用户所录入的语音信息转换为第一拼音信息,语音转换模型即是用于将语音信息转换为第一拼音信息的具体模型,语音转换模型中具体包括声学模型和语音特征词典。

其他发明实施例中,如图7所示,所述第一拼音信息获取单元130包括子单元:音素获取单元131和音素匹配单元132。

音素获取单元131,用于根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素。

根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素。具体的,用户所录入的语音信息由多个字符发音的音素而组成,一个字符的音素包括该字符发音的频率和音色。声学模型中包含所有字符发音的音素,通过将音频信息与声学模型中所有的音素进行匹配,即可对音频信息中单个字符的音素进行切分,通过切分最终得到该音频信息中所包含的多个音素。

音素匹配单元132,用于根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。

根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。语音特征词典中包含所有字符拼音对应的音素信息,通过将所得到的音素与字符拼音对应的音素信息进行匹配,即可将单个字符的音素转换为语音特征词典中与该音素相匹配的字符拼音,获取该语音信息中所有字符相对应的字符拼音即可实现将语音信息中所包含的所有音素转换为第一拼音信息。

第二拼音信息获取单元140,用于通过预设文本转换模型将所述目标文本语句转换为第二拼音信息。

通过预设文本转换模型将所述目标文本语句转换为第二拼音信息。预设文本转换模型即是用于将目标文本语句转换为第二拼音信息的模型,每一个汉字或数字的汉语读法均能够通拼音进行表示,文本转换模型中包含所有字符的拼音信息,通过将目标文本语句中所包含的汉字或数字与文本转换模型中的字符进行匹配,即可将目标文本语句转换为第二拼音信息。

其他发明实施例中,如图8所示,所述第二拼音信息获取单元140包括子单元:字符拼音信息获取单元141和拼音信息组合单元142。

字符拼音信息获取单元141,用于通过预设文本转换模型获取目标文本语句中每一字符的拼音信息。

通过预设文本转换模型获取目标文本语句中每一字符的拼音信息。具体的,通过将目标文本语句中每一个汉字或数字与文本转换模型中的字符进行匹配,即可获取相应汉字或数字在文本转换模型中的拼音信息,也即是获取得到目标文本语句中每一字符的拼音信息。

拼音信息组合单元142,用于通过预设文本转换模型对所得到的拼音信息进行组合以得到第二拼音信息。

通过预设文本转换模型对每一字符在目标文本语句中的位置对所得到的字符拼音进行组合以得到第二拼音信息。具体的,若某一个字符不是多音字,则直接将该字符的读音添加至该字符在目标文本语句中所处的位置;若某一个字符为多音字,则需通过预设文本转换模型通过对该字符及前后字符进行词性分析,以从该字符的多种读音中选择与该字符当前词性相匹配的一种读音添加至该字符在目标文本语句中所处的位置。

语音评分获取单元150,用于根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分。

根据预设匹配度计算模型对第一拼音信息与第二拼音信息之间的匹配度进行计算以得到用户所输入语音信息与普通话之间的匹配度,也即是该用户的语音评分。具体的,匹配度计算模型即是对第一拼音信息及第二拼音信息之间匹配度进行计算的模型,第一拼音信息为根据用户所输入语音信息转换得到的拼音信息,第二拼音信息为相应目标文本语句普通话读音的拼音信息,通过对第一拼音信息与第二拼音信息之间的匹配度进行计算,即可得到该用户所输入语音信息与相应目标文本语句的普通话读音之间的匹配度,也即是得到该用户的语音评分。

其他发明实施例中,如图9所示,所述语音评分获取单元150包括子单元:判断单元151、字符拼音匹配数获取单元152和评分计算单元153。

判断单元151,用于对所述第一拼音信息及第二拼音信息中所包含字符拼音的数量是否相等进行判断。

在对用户的语音评分进行计算之前,需对第一拼音信息及第二拼音信息中所包含字符的数量是否相等进行判断,具体的,分别获取第一拼音信息及第二拼音信息中字符拼音的数量并进行判断即可得到判断结果。

若判断结果为第一拼音信息及第二拼音信息中所包含字符的数量不相等,则向用户发出语音信息录入错误的提示信息。可在用户终端的显示设备中显示该语音信息录入错误的提示信息,用户接收到提示信息后,可根据该提示信息的内容再次录入语音信息。

字符拼音匹配数获取单元152,用于若第一拼音信息及第二拼音信息中所包含字符拼音的数量相等,将第一拼音信息中每一个字符拼音与第二拼音信息中相应字符拼音进行匹配以得到字符拼音匹配数p。

若第一拼音信息及第二拼音信息中所包含字符拼音的数量相等,将第一拼音信息中每一个字符拼音与第二拼音信息中相应字符拼音进行匹配,即可得到字符拼音匹配数p。由于第一拼音信息及第二拼音信息中所包含字符拼音的数量相等,因此第一拼音信息中每一个字符拼音均与第二拼音信息中相应的一个字符拼音相对应,具体的,获取第一拼音信息中第一个字符拼音与第二拼音信息中第一个字符拼音进行匹配,若第一拼音信息中的第一个字符拼音与第二拼音信息中相应字符拼音相匹配,则匹配数加一;若不相匹配,则获取第一拼音信息中下一个字符拼音与第二拼音信息中相匹字符拼音进行匹配,直至第一拼音信息中最后一个字符拼音完成匹配,获取此时的匹配数即为最终的字符拼音匹配数p。

评分计算单元153,用于根据匹配度计算模型中的匹配度计算公式:匹配度s=p/p0计算得到所述用户的语音评分,其中,p0为第二拼音信息中所包含字符拼音的数量。

根据匹配度计算模型中的匹配度计算公式:匹配度s=p/p0计算得到所述用户所输入语音信息与普通话之间的匹配度,也即是该用户的语音评分,其中,p0为第二拼音信息中所包含字符拼音的数量,p为字符拼音匹配数。

通过在用户终端中设置匹配度阈值,并通过上述方法对用户所输入的语音信息进行评分得到语音评分,若所得到的语音评分小于匹配度阈值,则不对用户随后输入的待识别语音信息进行语音识别;若所得到的语音评分不小于匹配度阈值,即可对用户随后输入的待识别语音信息进行语音识别,也即是在用户的语音评分达到一定要求之后再对该用户所输入的待识别语音信息进行语音识别,以大幅提高对用户所输入待识别语音信息进行识别的准确率。

此外,用户通过获取语音评分,也即是获取其所输入语音信息与普通话之间的匹配度,即可清楚了解自己所输入的语音信息是否标准,因此用户可通过上述方法对其自身的普通话水平进行训练。老师可发布朗读作业并利用上述语音评分方法对学生所朗读的语音信息进行评分,以通过客观的方式对学生所完成的朗读作业与普通话读音之间的匹配度进行计算。。

其他发明实施例中,如图10所示,所述语音评分装置100还包括子单元:非匹配提示信息生成单元160。

非匹配提示信息生成单元160,用于获取所述第一拼音信息中与所述第二拼音信息不相匹配的字符拼音以生成非匹配提示信息。

获取第一拼音信息中与第二拼音信息不相匹配的字符拼音并生成非匹配提示信息在用户终端中进行显示,以提示用户所输入的语音信息与目标文本语句的普通话读音之间不相匹配的字符拼音,用户察看该非匹配提示信息即可获取后续进行语音录入时所需进行改进的部分。

通过随机选择得到目标文本语句,对用户所录入的语音信息进行转换并目标文本语句转换得到的拼音信息进行匹配度计算,以得到用户的语音评分,通过语音评分即可获取用户所输入语音信息与普通话之间的匹配度,能够对语音信息与普通话之间的匹配度进行准确计算,满足了用户的实际使用需求。

上述语音评分装置可以实现为计算机程序的形式,该计算机程序可以在如图11所示的计算机设备上运行。

请参阅图11,图11是本发明实施例提供的计算机设备的示意性框图。

参阅图11,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行语音评分方法。

该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行语音评分方法。

该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图11中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:若接收到匹配度测量请求,从预设文本语句库中随机选择一条文本语句作为目标文本语句;根据所述目标文本语句生成录入提示信息以提示用户录入与所述目标文本语句相对应的语音信息;若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息;通过预设文本转换模型将所述目标文本语句转换为第二拼音信息;根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分。

在一实施例中,处理器502在执行若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息的步骤时,执行如下操作:根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素;根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。

在一实施例中,处理器502在执行通过预设文本转换模型将所述目标文本语句转换为第二拼音信息的步骤时,执行如下操作:通过预设文本转换模型获取目标文本语句中每一字符的拼音信息;通过预设文本转换模型对所得到的拼音信息进行组合以得到第二拼音信息。

在一实施例中,处理器502在执行根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分的步骤时,执行如下操作:对所述第一拼音信息及第二拼音信息中所包含字符拼音的数量是否相等进行判断;若第一拼音信息及第二拼音信息中所包含字符拼音的数量相等,将第一拼音信息中每一个字符拼音与第二拼音信息中相应字符拼音进行匹配以得到字符拼音匹配数p;根据匹配度计算模型中的匹配度计算公式:匹配度s=p/p0计算得到所述用户的语音评分,其中,p0为第二拼音信息中所包含字符拼音的数量。

在一实施例中,处理器502在执行根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分的步骤之后,还执行如下操作:获取所述第一拼音信息中与所述第二拼音信息不相匹配的字符拼音以生成非匹配提示信息。

本领域技术人员可以理解,图11中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图11所示实施例一致,在此不再赘述。

应当理解,在本发明实施例中,处理器502可以是中央处理单元(centralprocessingunit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:若接收到匹配度测量请求,从预设文本语句库中随机选择一条文本语句作为目标文本语句;根据所述目标文本语句生成录入提示信息以提示用户录入与所述目标文本语句相对应的语音信息;若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息;通过预设文本转换模型将所述目标文本语句转换为第二拼音信息;根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分。

在一实施例中,所述若接收到所述用户根据所述录入提示信息所录入的语音信息,通过预设语音转换模型将所述语音信息转换为第一拼音信息的步骤,包括:根据语音转换模型中的声学模型对语音信息进行切分以得到语音信息中所包含的多个音素;根据文字识别模型中的语音特征词典对所得到的音素进行匹配以将所有音素进行转换得到第一拼音信息。

在一实施例中,所述通过预设文本转换模型将所述目标文本语句转换为第二拼音信息的步骤,包括:通过预设文本转换模型获取目标文本语句中每一字符的拼音信息;通过预设文本转换模型对所得到的拼音信息进行组合以得到第二拼音信息。

在一实施例中,所述根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分的步骤,包括:对所述第一拼音信息及第二拼音信息中所包含字符拼音的数量是否相等进行判断;若第一拼音信息及第二拼音信息中所包含字符拼音的数量相等,将第一拼音信息中每一个字符拼音与第二拼音信息中相应字符拼音进行匹配以得到字符拼音匹配数p;根据匹配度计算模型中的匹配度计算公式:匹配度s=p/p0计算得到所述用户的语音评分,其中,p0为第二拼音信息中所包含字符拼音的数量。

在一实施例中,所述根据预设匹配度计算模型对所述第一拼音信息与所述第二拼音信息之间的匹配度进行计算以得到所述用户的语音评分的步骤之后,还包括:获取所述第一拼音信息中与所述第二拼音信息不相匹配的字符拼音以生成非匹配提示信息。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1