一种基于语音识别的答题判定方法及装置与流程

文档序号：18354310发布日期：2019-08-06 22:53阅读：261来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及人机交互技术领域，尤其涉及一种基于语音识别的答题判定方法及装置。

背景技术：

随着计算机技术地快速发展和其在教育信息化领域地不断深入，各种智能学习设备越来越被家长和学生所接收及使用。

比如孩子通过家教机来进行学习互动，一般的家教机都有语音识别功能，然而对于幼儿这一特殊群体，往往存在口齿不清，发音不标准的情况。幼儿答题时，经常会口齿不清，如果识别关键字过于严苛，则会造成误判，挫败幼儿答题积极性。

技术实现要素：

本发明提供一种基于语音识别的答题判定方法及装置，用以解决幼儿答题时，由于口齿不清容易导致误判的技术问题。具体的，本发明的技术方案如下：

一方面，本发明公开了一种基于语音识别的答题判定方法，包括：

采集用户答题的语音信息；

对所述语音信息进行识别处理，获得答题拼音序列；

从所述答题拼音序列中提取关键字的拼音信息；

将所述关键字的拼音进行声母、韵母拆分；

根据拆分后的声母、韵母，在存储的声母、韵母混淆库中查找与所述拆分的声母、韵母对应的混淆声母、混淆韵母；

将所述拆分后的声母、韵母、混淆声母、混淆韵母重新进行搭配组合，获取新的关键字拼音信息；

将所述关键字的拼音信息、新的关键字拼音信息分别与当前问题答案的拼音信息进行匹配，判定所述用户答题是否正确。

优选地，所述对所述语音信息进行识别处理，获得答题拼音序列包括：

对所述语音信息进行识别处理，获得答题文本信息；

根据所述答题文本信息，获得答题拼音序列。

优选地，所述从所述答题拼音序列中提取关键字的拼音信息之后还包括：

将所述关键字的拼音信息与当前问题答案的拼音进行匹配；

当判定所述关键字的拼音信息与当前问题答案的拼音匹配时，判定所述用户回答正确；

当判定所述关键字的拼音信息与当前问题答案的拼音不匹配时，再将所述关键字的拼音进行声母、韵母拆分。

优选地，所述将所述关键字的拼音进行声母、韵母拆分包括：

根据所述关键字的拼音信息中包含的拼音个数，将所述关键字的拼音信息进行分组，每组包含一个汉字拼音；

将每组中的汉字拼音进行声母、韵母拆分；

将所述拆分后的声母、韵母、混淆声母、混淆韵母重新进行搭配组合，获取新的关键字拼音信息包括：

将每组中的声母与韵母进行搭配组合，获得所在组的第一识别拼音信息；

将每组中的声母与混淆韵母进行搭配组合，获得所在组的第二识别拼音信息；

将每组中的混淆声母与韵母进行搭配组合，获得所在组的第三识别拼音信息；

将每组中的混淆声母与混淆韵母进行搭配组合，获得所在组的第四识别拼音信息；

依次将每组拼音信息集中的每个识别拼音与其它组的拼音信息集中的各个识别拼音进行搭配组合，获得关键字拼音信息集；

对所述关键字拼音信息集进行去噪处理。

优选地，所述在采集用户答题的语音信息之前还包括：

构建声母、韵母混淆库，所述声母、韵母混淆库中存储了每个声母与对应的混淆声母的映射关系表，及每个韵母与对应的混淆韵母的映射关系表。

另一方面，本发明还公开了一种基于语音识别的答题判定装置，包括：

语音采集模块，用于采集用户答题的语音信息；

语音识别模块，用于对所述语音信息进行识别处理，获得答题拼音序列；

关键字提取模块，用于从所述答题拼音序列中提取关键字的拼音信息；

拆分查找模块，用于将所述关键字的拼音进行声母、韵母拆分；并根据拆分后的声母、韵母，在存储的声母、韵母混淆库中查找与所述拆分的声母、韵母对应的混淆声母、混淆韵母；

搭配组合模块，用于将所述拆分后的声母、韵母、混淆声母、混淆韵母重新进行搭配组合，获取新的关键字拼音信息；

答题判断模块，用于将所述关键字的拼音信息、新的关键字拼音信息分别与当前问题答案的拼音信息进行匹配，判定所述用户答题是否正确。

优选地，所述语音识别模块包括：

识别处理子模块，用于对所述语音信息进行识别处理，获得答题文本信息；

拼音获取子模块，用于根据所述答题文本信息，获得答题拼音序列。

优选地，所述答题判断模块，还用于将所述关键字的拼音信息与当前问题答案的拼音进行匹配；当判定所述关键字的拼音信息与当前问题答案的拼音匹配时，判定所述用户回答正确；当判定所述关键字的拼音信息与当前问题答案的拼音不匹配时，再通过所述拆分查找模块将所述关键字的拼音进行声母、韵母拆分。

优选地，所述拆分查找模块包括：

分组子模块，用于根据所述关键字的拼音信息中包含的拼音个数，将所述关键字的拼音信息进行分组，每组包含一个汉字拼音；

拆分子模块，用于将每组中的汉字拼音进行声母、韵母拆分；

查找子模块，用于根据每组拆分后的声母、韵母，从存储的声母、韵母混淆库中查找对应的混淆声母、混淆韵母；

所述搭配组合模块，还用于将每组中的声母与韵母进行搭配组合，获得所在组的第一识别拼音信息；将每组中的声母与混淆韵母进行搭配组合，获得所在组的第二识别拼音信息；将每组中的混淆声母与韵母进行搭配组合，获得所在组的第三识别拼音信息；将每组中的混淆声母与混淆韵母进行搭配组合，获得所在组的第四识别拼音信息；依次将每组拼音信息集中的每个识别拼音与其它组的拼音信息集中的各个识别拼音进行搭配组合，获得关键字拼音信息集；

所述基于语音识别的答题判定装置还包括：去噪处理模块，用于对所述关键字拼音信息集进行去噪处理。

优选地，所述基于语音识别的答题判定装置还包括：

构建存储模块，用于构建声母、韵母混淆库，所述声母、韵母混淆库中存储了每个声母与对应的混淆声母的映射关系表，及每个韵母与对应的混淆韵母的映射关系表。

本发明至少包含以下一项技术效果：

(1)本发明通过语音识别获取拼音序列，再对其进行关键字提取，再将关键字拼音做声母韵母拆分，然后将相似易混淆的声母韵母进行组合搭配，从而达到宽松答题，解决幼儿发音口误的问题。

(2)本发明采用关键字拼音来与答案的拼音匹配，而不是直接采集关键字来进行匹配，由于不同的汉字可能对应同一个拼音，因此，采用本发明的关键字拼音来匹配答案拼音则更为准确。

(3)本发明在提取到关键字拼音后，先对关键字拼音与当前问题答案的拼音进行匹配，如果匹配成功，则说明用户答题正确，无需进入后续步骤，如果匹配不成功，则可能是用户口齿不清，那么就需要继续进行后面的拆分，及将其与对应的易混淆的声母韵母进行组合搭配，再根据组合搭配后的新的关键字拼音信息与问题答案的拼音匹配结果来判定用户是否答题正确。如此，精简了流程，一旦根据用户语音识别提取出的关键字拼音可以与答案匹配上，则无需进行后续流程了。

(4)本发明在对拆分后的声母韵母，对应的易混淆的声母韵母进行组合搭配后获得的关键字拼音信息集进行了去噪处理，去除明显不正确的关键字拼音，减小了后续匹配工作量，提高了答题判定速度。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简要介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域的普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本发明一种基于语音识别的答题判定方法实施例的流程图；

图2为本发明一种基于语音识别的答题判定方法另一实施例的流程图；

图3为本发明一种基于语音识别的答题判定方法另一实施例的流程图；

图4为本发明一种基于语音识别的答题判定方法另一实施例的流程图；

图5为本发明一种基于语音识别的答题判定装置实施例的框图；

图6为本发明一种基于语音识别的答题判定装置另一实施例的框图。

附图标记：

10--语音采集模块；20--语音识别模块；21--识别处理子模块；22--拼音获取子模块；30--关键字提取模块；40--拆分查找模块；41--分组子模块；42--拆分子模块；43--查找子模块；50--搭配组合模块；60--答题判断模块；70--去噪处理模块；80--构建存储模块。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部份实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

本发明公开了一种基于语音识别的答题判定方法，实施例如图1所示，包括：

s101，采集用户答题的语音信息；

具体的，在进行语音答题时，设备每次播报完问题之后，便可通过麦克风采集用户答题的语音信息。

s102，对所述语音信息进行识别处理，获得答题拼音序列；

具体的，比如可以对语音信息进行识别处理，将语音信息转换为文字信息，再由文字信息转换为对应的拼音序列。当然，也可以不通过文字信息来转换为拼音信息，比如，可以从所述语音信息中获取到语音特征音频序列，然后对该语音特征音频序列进行拼音识别，获得对应的拼音序列。

s103，从所述答题拼音序列中提取关键字的拼音信息；

具体的，可以按照预设的规则来提取关键字的拼音信息。比如，根据答题拼音序列，便可获得其对应的文字序列(句子/短语/单字)，然后可以从该文字序列中提取用于识别的关键字来。比如，如果对应的文字序列是句子，这可对该句子进行分词、句式拆分，再根据各分词、词性及关联关系来提取关键字。如果对应的文字序列是一个词或者一个字，那么该词或字便可作为关键字。当然，也可以采用现有技术来进行关键字提取，本方案不做限定。

s104，将所述关键字的拼音进行声母、韵母拆分；

具体的，获取到关键字的拼音信息后，便可对其中的每个拼音进行声母、韵母拆分了。比如对拼音“hóu”进行声母、韵母拆分后，拆分成声母“h”、及韵母“ou”。

s105，根据拆分后的声母、韵母，在存储的声母、韵母混淆库中查找与所述拆分的声母、韵母对应的混淆声母、混淆韵母；

具体的，声母、韵母混淆库中存储了每个声母对应的混淆声母，每个韵母对应的混淆韵母。这样，根据前一步骤中拆分的声母、韵母，便可在声母、韵母混淆库中查找到匹配的混淆声母、混淆韵母。当然混淆声母或混淆韵母的个数可能是一个，也可能是多个，不同的声母、韵母情况可能不一样。

s106，将所述拆分后的声母、韵母、混淆声母、混淆韵母重新进行搭配组合，获取新的关键字拼音信息；

具体的，查找到每个拼音对应的混淆声母、混淆韵母后，再将拆分的声母、韵母、混淆声母、混淆韵母进行搭配组合，从而获得新的汉字拼音。如果关键字所包含的模糊汉字有三个，第一个模糊汉字对应的拼音(由拆分的声母、韵母、混淆声母、混淆韵母搭配组合而成)有4个，第二个模糊汉字对应的拼音有3个，第三个模糊汉字对应的拼音有2个，那么再将第一个模糊汉字中的4个拼音、第二个模糊汉字中的2个拼音、第三个模糊汉字中的3个拼音来进行搭配组合(每组从每个模糊汉字中选取一个拼音)，获得新的关键字拼音信息。

s107，将所述关键字的拼音信息、新的关键字拼音信息分别与当前问题答案的拼音信息进行匹配，判定所述用户答题是否正确。

具体的，可以将关键字拼音、新的关键字拼音来与当前问题答案的拼音进行匹配，只要其中任一一个关键字拼音可以与答案拼音匹配上，则可以视为用户答题正确。比如，可以先将最初提取的关键字的拼音与当前问题答案的拼音进行匹配看用户是否答题正确，如果不正确的话，可以再将第一个新的关键字拼音与当前问题答案的拼音进行匹配，看用户答题是否正确，不正确的话，则继续将第二个新的关键字拼音来与当前问题答案的拼音进行匹配，一旦有关键字拼音匹配成功，则认为用户答题正确，如果不成功，则继续匹配下一个新的关键字拼音，如果一直到所有的新的关键字拼音均匹配完仍未匹配成功，则判定用户答题错误。

本实施例通过语音识别获取对应的答题拼音序列，再将序列中的关键字拼音信息中的每个拼音进行拆分，获取到易混淆相似的声母韵母进行搭配组合，从而达到获取相似音的目的，从而解决幼儿口误的问题。

较佳的，上述方法实施例中，所述对所述语音信息进行识别处理，获得答题拼音序列包括：

对所述语音信息进行识别处理，获得答题文本信息；

根据所述答题文本信息，获得答题拼音序列。

具体的，比如：小孩回答“这个动物是老虎”时，可能发音成为“这个动物是老辅(音译)”，采集到用户答题语音信息后，对其进行识别处理，获得答题文本信息：这个动物是老辅，然后，根据该答题文本信息获得对应的答题拼音序列：zhègèdòngwùshìlǎofǔ。然后从该答题拼音序列中提取出关键字的拼音信息：“lǎofǔ”，然后将该关键字的拼音进行声母、韵母拆分，即将“lǎo”拆分为“l”和“ao”；将“fǔ”拆分为“f”和“u”。然后，从声母、韵母混淆库中查找与拆分后的声母、韵母对应的易混淆的混淆声母、混淆韵母。比如声母“l”对应的易混淆的声母为“n”，韵母“ao”对应的混淆韵母为“iao”；声母“f”对应的易混淆的声母为“h”，韵母“u”没有对应的混淆韵母。再将拆分后的声母、韵母、混淆声母、混淆韵母进行搭配组合，获得新的关键字拼音信息。比如搭配组合后获得7个新的关键字拼音：“nǎofǔ”、“nǎohǔ”“liǎofǔ”、“liǎohǔ”、“niǎofǔ”、“niǎohǔ”、“lǎohǔ”。获得这些新的关键字拼音后，再结合之前的关键字拼音“lǎofǔ”，将这8个关键字拼音信息分别与当前问题答案的拼音进行匹配，只要其中有一个关键字拼音能够匹配上即认为用户答题正确。比如，当前问题的答案是“老虎”，对应的答案的拼音是“lǎohǔ”；经匹配后发现搭配组合后获得的新的关键字拼音中“lǎohǔ”可以与当前问题答案的拼音匹配上，因此，可以判定用户当前问题回答正确。

本发明的另一实施例，如图2所示，包括：

s201，采集用户答题的语音信息；

s202，对所述语音信息进行识别处理，获得答题拼音序列；

s203，从所述答题拼音序列中提取关键字的拼音信息；

s204，判断所述关键字的拼音信息与当前问题答案的拼音是否匹配；若是，进入步骤s205；否则，进入步骤s206；

s205，判定所述用户回答正确；

s206，将所述关键字的拼音进行声母、韵母拆分；

s207，根据拆分后的声母、韵母，在存储的声母、韵母混淆库中查找与所述拆分的声母、韵母对应的混淆声母、混淆韵母；

s208，将所述拆分后的声母、韵母、混淆声母、混淆韵母重新进行搭配组合，获取新的关键字拼音信息；

s209，判断所述新的关键字拼音信息与当前问题答案的拼音是否匹配，若是，进入步骤s205，否则，进入步骤s210；

s210，判定所述用户答题错误。

本实施例在前面实施例的基础上，在提取到关键字的拼音信息后，即可先根据该关键字的拼音信息与当前问题答案的拼音的比对结果来初步判断用户当前答题是否正确，如果答题正确的话，则可直接进入下一题，如果不正确的话，则再进行后续的对关键字的拼音进行声母、韵母拆分，以及与对应的混淆声母、韵母组合搭配等步骤，避免由于幼儿口齿不清而造成误判，影响幼儿答题积极性。

同样的，还是前面的例子来进行说明。从答题拼音序列“zhègèdòngwùshìlǎofǔ”中提取出关键字的拼音信息“lǎofǔ”，然后将“lǎofǔ”与当前问题答案“老虎”的拼音“lǎohǔ”进行匹配，显然，匹配不上，那么就进入上述实施例的步骤s207，将“lǎofǔ”进行声母、韵母拆分，即将“lǎo”拆分为“l”和“ao”；将“fǔ”拆分为“f”和“u”。然后，从声母、韵母混淆库中查找与拆分后的声母、韵母对应的易混淆的混淆声母、混淆韵母。比如声母“l”对应的易混淆的声母为“n”，韵母“ao”对应的混淆韵母为“iao”；声母“f”对应的易混淆的声母为“h”，韵母“u”没有对应的混淆韵母。再将拆分后的声母、韵母、混淆声母、混淆韵母进行搭配组合，获得新的关键字拼音信息。比如搭配组合后获得7个新的关键字拼音：“nǎofǔ”、“nǎohǔ”“liǎofǔ”、“liǎohǔ”、“niǎofǔ”、“niǎohǔ”、“lǎohǔ”。获得这些新的关键字拼音后，将这7个新的关键字拼音信息分别与当前问题答案的拼音进行匹配，而之前的关键字拼音“lǎofǔ”则无需再进行匹配了(前面已匹配过，不正确)。只要其中有一个新的关键字拼音能够匹配上即认为用户答题正确。比如，当前问题的答案是“老虎”，对应的答案的拼音是“lǎohǔ”；经匹配后发现搭配组合后获得的新的关键字拼音中“lǎohǔ”可以与当前问题答案的拼音匹配上，因此，可以判定用户当前问题回答正确。

当然，如果用户语音信息转换成的拼音序列是“zhègèdòngwùshìlǎohǔ”，从中提取到关键字的拼音“lǎohǔ”，然后将其与当前问题答案“老虎”的拼音“lǎohǔ”进行匹配，匹配发现二者一致，可以匹配上，则可判定用户回答正确，则无需进行后续的声母、韵母拆分等步骤了，这样大大节省了操作时间，减小了工作量。

本发明方法的另一实施例，如图3所示，包括：

s301，采集用户答题的语音信息；

s302，对所述语音信息进行识别处理，获得答题拼音序列；

s303，从所述答题拼音序列中提取关键字的拼音信息；

s304，根据所述关键字的拼音信息中包含的拼音个数，将所述关键字的拼音信息进行分组，每组包含一个汉字拼音；

s305，将每组中的汉字拼音进行声母、韵母拆分；

s306，根据拆分后的声母、韵母，在存储的声母、韵母混淆库中查找与所述拆分的声母、韵母对应的混淆声母、混淆韵母；

s307，将每组中的声母与韵母进行搭配组合，获得所在组的第一识别拼音信息；

s308，将每组中的声母与混淆韵母进行搭配组合，获得所在组的第二识别拼音信息；

s309，将每组中的混淆声母与韵母进行搭配组合，获得所在组的第三识别拼音信息；

s310，将每组中的混淆声母与混淆韵母进行搭配组合，获得所在组的第四识别拼音信息；

s311，依次将每组拼音信息集中的每个识别拼音与其它组的拼音信息集中的各个识别拼音进行搭配组合，获得关键字拼音信息集；

s312，对所述关键字拼音信息集进行去噪处理；

s313，将经过去噪处理后剩余的关键字拼音信息与当前问题答案的拼音信息进行匹配，判定所述用户答题是否正确。

本实施例在前面方法实施例的基础上，将拆分后的声母、韵母、混淆声母、混淆韵母进行搭配组合的过程进行了细化，且在获得新的关键字拼音后，还对其进行了去噪处理，剔除明显不对的关键字拼音，只需将去噪筛选过后的新的关键字拼音进行匹配判断。

具体的，还是以前面的例子为例，从用户答题拼音序列中提取出关键字的拼音信息：“lǎofǔ”，这里关键字包含了两个拼音，因此，可将该关键字拼音划分为两组，第一组包含拼音“lǎo”，第二组包含拼音“fǔ”；然后将每组的拼音进行声母、韵母拆分，即将第一组的“lǎo”拆分为“l”和“ao”；将第二组的“fǔ”拆分为“f”和“u”。然后，从声母、韵母混淆库中查找与拆分后的声母、韵母对应的易混淆的混淆声母、混淆韵母。比如声母“l”对应的易混淆的声母为“n”，韵母“ao”对应的混淆韵母为“iao”；声母“f”对应的易混淆的声母为“h”，韵母“u”没有对应的混淆韵母。再将每组拆分后的声母、韵母、混淆声母、混淆韵母进行搭配组合，获得新的关键字拼音信息。

比如，第一组的拼音“lǎo”拆分后的声母为“l”，混淆声母为“n”；第一组拆分后的韵母为“ao”，对应的混淆韵母为“iao”；

将第一组拆分后的声母与韵母进行搭配组合，获得所在组的第一识别拼音信息：“lǎo”；

将第一组拆分后的声母与混淆韵母进行搭配组合，获得所在组的第二识别拼音信息：“liǎo”；

将第一组的混淆声母与韵母进行搭配组合，获得所在组的第三识别拼音信息：“nǎo”；

将第一组的混淆声母与混淆韵母进行搭配组合，获得所在组的第四识别拼音信息：“niǎo”。

当然，如果混淆声母或韵母不止一个，那么所获得的第二拼音信息、第三拼音信息、第四拼音信息也不止一个拼音。同样的将第二组中拆分后的声母、韵母、以及混淆声母、混淆韵母按照第一组的方式进行搭配组合，获得第二组的各识别拼音信息，这里第二组的拼音为“fǔ”，假如拆分后的韵母“ǔ”没有对应的混淆韵母，那么就只有第二组的第一识别拼音信息“fǔ”，及其第三识别拼音信息“hǔ”。

获取到各组的各识别拼音信息后，再依次将每组拼音信息集中的每个识别拼音与其它组的拼音信息集中的各个识别拼音进行搭配组合，获得关键字拼音信息集。上述将第一组的各识别拼音信息与第二组的各识别拼音信息进行搭配组合后获得关键字拼音信息集(包含原来提取的关键字的拼音信息及新的关键字拼音信息)，具体的，分别搭配组合后获得的关键字拼音信息集中包含：“lǎofǔ”、“nǎofǔ”、“nǎohǔ”“liǎofǔ”、“liǎohǔ”、“niǎofǔ”、“niǎohǔ”、“lǎohǔ”这8个关键字拼音。

然后再对这个关键字拼音信息集进行去噪处理，去噪的规则一般提前设定，比如如果关键字包含两个或以上汉字的话，则对其进行去噪处理，一般的，可根据其中的关键字拼音来获得对应的关键字，而如果根据该关键字拼音而获得的关键字均无法组成词语或短句，则视为该关键字拼音为噪音，将其进行剔除。比如，上述中“nǎofǔ”这一拼音无法获得对应的词语，该关键字拼音则为噪音，将其进行去除。最后将去噪后剩余的关键字拼音与当前问题答案的拼音进行匹配，只要其中有一个关键字拼音能够匹配上即认为用户答题正确。

本发明的另一实施例，在上述任一实施例的基础上，增加了声母、韵母混淆库的构建步骤，具体的，如图4所示，包括：

s401，构建声母、韵母混淆库，所述声母、韵母混淆库中存储了每个声母与对应的混淆声母的映射关系表，及每个韵母与对应的混淆韵母的映射关系表；

s402，采集用户答题的语音信息；

s403，对所述语音信息进行识别处理，获得答题文本信息；

s404，根据所述答题文本信息，获得答题拼音序列；

s405，从所述答题拼音序列中提取关键字的拼音信息；

s406，将所述关键字的拼音进行声母、韵母拆分；

s407，根据拆分后的声母、韵母，在存储的声母、韵母混淆库中查找与所述拆分的声母、韵母对应的混淆声母、混淆韵母；

s408，将所述拆分后的声母、韵母、混淆声母、混淆韵母重新进行搭配组合，获取新的关键字拼音信息；

s409，将所述关键字的拼音信息、新的关键字拼音信息分别与当前问题答案的拼音信息进行匹配，判定所述用户答题是否正确。

本实施例中，构建声母、韵母混淆库，所述声母、韵母混淆库中存储了每个声母与对应的混淆声母的映射关系表，及每个韵母与对应的混淆韵母的映射关系表，为后续根据拆分后的声母、拆分后的韵母查找对应的混淆声母、混淆韵母提供基础。该声母、韵母混淆库的构建，一般根据幼儿口齿发音习惯来建立对应的映射。比如，常见的声母“n”、“l”这两个容易混淆；“h”和“f”也容易混淆；再比如韵母“an”、“ang”这两个容易混淆等等。通过建立声母映射关系表和韵母映射关系表，则可快速从中查找到每个声母对应的混淆声母、每个韵母对应的混淆韵母，方便快捷。

基于相同的技术构思，本发明还公开了一种基于语音识别的答题判定装置，该装置可采用本发明的基于语音识别的答题判定方法来判定用户是否答题正确，具体的，如图5所示，本发明的基于语音识别的答题判定装置包括：

语音采集模块10，用于采集用户答题的语音信息；

语音识别模块20，用于对所述语音信息进行识别处理，获得答题拼音序列；

关键字提取模块30，用于从所述答题拼音序列中提取关键字的拼音信息；

拆分查找模块40，用于将所述关键字的拼音进行声母、韵母拆分；并根据拆分后的声母、韵母，在存储的声母、韵母混淆库中查找与所述拆分的声母、韵母对应的混淆声母、混淆韵母；

搭配组合模块50，用于将所述拆分后的声母、韵母、混淆声母、混淆韵母重新进行搭配组合，获取新的关键字拼音信息；

答题判断模块60，用于将所述关键字的拼音信息、新的关键字拼音信息分别与当前问题答案的拼音信息进行匹配，判定所述用户答题是否正确。

具体的，比如幼儿回答问题时，回答“是”，语音采集模块10(比如麦克风)采集到该用户的语音信息后，通过语音识别模块20进行识别处理，获得答题拼音序列(包含单个拼音)：shì。由于该拼音序列只包含了一个拼音，那么关键字提取模块30提取到的关键字的拼音信息即为该单个拼音“shì”，然后拆分查找模块40将该关键字的拼音进行声母、韵母拆分，拆分为声母“sh”和韵母“i”；然后再在声母、韵母混淆库中分别查找到对应的混淆声母和混淆韵母，比如，查找到sh和s相似，i和u相似。然后搭配组合模块50将拆分后的声母、韵母、混淆声母、混淆韵母搭配组合，形成新的关键字拼音，比如：shù、sì、sù。然后答题判断模块60将之前的关键字拼音信息“shì”、新的关键字拼音信息“shù、sì、sù”共计4个拼音分别与当前问题答案的拼音进行匹配，只要其中有一个拼音可以匹配上，则视为该幼儿答题正确。

本发明的基于语音识别的答题判定装置的另一实施例，如图6所示，在上述装置实施例的基础上，所述语音识别模块20包括：

识别处理子模块21，用于对所述语音信息进行识别处理，获得答题文本信息；

拼音获取子模块22，用于根据所述答题文本信息，获得答题拼音序列。

具体的，比如语音采集模块10采集到用户的答题语音后，识别处理子模块21对该语音信息进行识别处理，获得答题文本信息“这个动物是老虎”，然后，拼音获取子模块22根据该文本信息“这个动物是老虎”获得对应的答题拼音序列“zhègèdòngwùshìlǎohǔ”。

较佳的，在上述任一实施例的基础上，所述答题判断模块60，还用于将所述关键字的拼音信息与当前问题答案的拼音进行匹配；当判定所述关键字的拼音信息与当前问题答案的拼音匹配时，判定所述用户回答正确；当判定所述关键字的拼音信息与当前问题答案的拼音不匹配时，再通过所述拆分查找模块40将所述关键字的拼音进行声母、韵母拆分。

具体的，比如在语音识别模块20获取到答题拼音序列“zhègèdòngwùshìlǎohǔ”之后，关键字提取模块30从中提取出关键字的拼音“lǎohǔ”，然后，答题判断模块60将该关键字的拼音信息与当前问题答案的拼音进行匹配，如果当前问题的答案是“老虎”，则对应的答案拼音为“lǎohǔ”，那么该关键字的拼音信息与该答案拼音匹配成功，判定该用户答题正确。那么就无需进行后续的步骤了。简化了操作流程。

上述任一实施例中，所述拆分查找模块40包括：

分组子模块41，用于根据所述关键字的拼音信息中包含的拼音个数，将所述关键字的拼音信息进行分组，每组包含一个汉字拼音；

拆分子模块42，用于将每组中的汉字拼音进行声母、韵母拆分；

查找子模块，用于根据每组拆分后的声母、韵母，从存储的声母、韵母混淆库中查找对应的混淆声母、混淆韵母；

所述搭配组合模块50，用于将每组中的声母与韵母进行搭配组合，获得所在组的第一识别拼音信息；将每组中的声母与混淆韵母进行搭配组合，获得所在组的第二识别拼音信息；将每组中的混淆声母与韵母进行搭配组合，获得所在组的第三识别拼音信息；将每组中的混淆声母与混淆韵母进行搭配组合，获得所在组的第四识别拼音信息；依次将每组拼音信息集中的每个识别拼音与其它组的拼音信息集中的各个识别拼音进行搭配组合，获得关键字拼音信息集；

所述答题判定装置还包括：去噪处理模块70，用于对所述关键字拼音信息集进行去噪处理。

具体的，比如关键字提取模块30从用户答题拼音序列中提取出关键字的拼音信息：“tùjǐ”，这里关键字包含了两个拼音，因此，分组子模块41可将该关键字拼音划分为两组，第一组包含拼音“tù”，第二组包含拼音“jǐ”；然后拆分子模块42将每组的拼音进行声母、韵母拆分，即将第一组的“tù”拆分为“t”和“u”；将第二组的“jǐ”拆分为“j”和“i”。然后，查找子模块从声母、韵母混淆库中查找与拆分后的声母、韵母对应的易混淆的混淆声母、混淆韵母。假如声母“t”对应的易混淆的声母为“d”，韵母“u”没有对应的混淆韵母；声母“j”对应的易混淆的声母为“z”和“zh”，韵母“i”没有对应的混淆韵母。搭配组合模块50再将每组拆分后的声母、韵母、混淆声母、混淆韵母进行搭配组合，获得新的关键字拼音信息。

比如，第一组的拼音“tù”拆分后的声母为“t”，混淆声母为“d”；第一组拆分后的韵母为“u”，没有对应的混淆韵母；搭配组合模块50将第一组拆分后的声母与韵母进行搭配组合，获得所在组的第一识别拼音信息：“tù”；由于第一组没有混淆韵母，因此，该组的第二识别拼音信息和第四识别拼音信息均无；将第一组的混淆声母与韵母进行搭配组合，获得所在组的第三识别拼音信息：“dù”。

第二组的拼音“jǐ”拆分后的声母为“j”，对应的混淆声母为“z”和“zh”；拆分后的韵母为“i”，没有对应的混淆韵母。由于该组没有对应的混淆韵母，因此，该组的第二识别拼音信息和第四识别拼音信息为无，即没有。只有第一识别拼音信息：“jǐ”；以及第三识别拼音信息：“zǐ”和“zhǐ”。

搭配组合模块50获取到各组的各识别拼音信息后，再依次将每组拼音信息集中的每个识别拼音与其它组的拼音信息集中的各个识别拼音进行搭配组合，获得关键字拼音信息集。上述将第一组的各识别拼音信息与第二组的各识别拼音信息进行搭配组合后获得关键字拼音信息集(包含原来提取的关键字的拼音信息及新的关键字拼音信息)，具体的，分别搭配组合后获得的关键字拼音信息集中包含：“tùjǐ”、“tùzǐ”、“tùzhǐ”“dùjǐ”、“dùzǐ”、“dùzhǐ”这6个关键字拼音。

然后去噪处理模块70再对这个关键字拼音信息集进行去噪处理。去噪的规则一般提前设定，比如如果关键字包含两个或以上汉字的话，则对其进行去噪处理，一般的，可根据其中的关键字拼音来获得对应的关键字，而如果根据该关键字拼音而获得的关键字均无法组成词语或短句，则视为该关键字拼音为噪音，将其进行剔除。最后将去噪后剩余的关键字拼音与当前问题答案的拼音进行匹配，只要其中有一个关键字拼音能够匹配上即认为用户答题正确。

本发明装置的另一实施例，在上述任一实施例的基础上，如图6所示，所述基于语音识别的答题判定装置还包括：

构建存储模块80，用于构建声母、韵母混淆库，所述声母、韵母混淆库中存储了每个声母与对应的混淆声母的映射关系表，及每个韵母与对应的混淆韵母的映射关系表。

该声母、韵母混淆库的构建，一般根据幼儿口齿发音习惯来建立对应的映射。比如，常见的声母“n”、“l”这两个容易混淆；“h”和“f”也容易混淆；再比如韵母“an”、“ang”这两个容易混淆等等。通过建立声母映射关系表和韵母映射关系表，则可快速从中查找到每个声母对应的混淆声母、每个韵母对应的混淆韵母，方便快捷。

本发明的基于语音识别的答题判定装置与本发明的基于语音识别的答题判定方法对应，本发明的基于语音识别的答题判定方法的实施例的技术细节同样适用于本发明的基于语音识别的答题判定装置，为减少重复，不再赘述。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李丹
技术所有人：广东小天才科技有限公司
我是此专利的发明人

上一篇：微型转运途中的呼吸机和自动体外除颤器一体机的制作方法
上一篇：一种工作在工频下的谐振式压电泵的制作方法