移动设备上的实时口语评价系统及方法_4

文档序号：8283478阅读：来源：国知局

分阈值的字符或字符串。
[0077]以上述举例的英语句子为例，在比较出“Welcome”的发音得分低于预先定义的发音得分阈值的情况下，可以在整个英语句子中将“Welcome”标记出，可选地，将“Welcome”的颜色设置为红颜色。
[0078]由于上述各方法实施例与前述各装置实施例相对应，因此不再对各方法实施例进行详细描述。
[0079]在本说明书中，说明了大量的具体细节。然而，应当理解，本发明的实施例可以在没有这些具体细节的情况下实施。在一些实施例中，并未详细示出公知的方法、结构和技术，以便不使读者混淆对本说明书的原理的理解。
[0080]本领域技术人员可以理解，可以对各实施例中的装置中的模块进行自适应性地改变，并且把它们设置在与该实施例不同的一个或多个装置中。可以把实施例中的若干模块组合成一个模块或单元或组件，还可以把它们分成多个子模块或子单元或子组件。除了特征和/或处理相互排斥的情况之外，可以采用任何组合，对本说明书中公开的任何方法的所有步骤或者任何装置的所有模块进行组合。除非另外明确陈述，本说明书中公开的每个特征都可以由提供相同、等同或相似目的替代特征来代替。
[0081]本发明的各个装置实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP )来实现根据本发明实施例的装置中的一些或者全部模块的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的装置程序(例如，计算机程序和计算机程序产品)。
[0082]应当注意，上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不偏离所附权利要求的范围的情况下，可设计出各种替代实施例。在权利要求书中，特征的排序并不意味着特征的任何特定顺序，并且特别地，方法权利要求中各步骤的顺序并不意味着这些步骤必须按照该顺序来执行。相反地，这些步骤可以以任何适当的顺序执行。同样，装置权利要求中各模块执行处理的顺序也不应受权利要求中各模块的排序限制，而是可以以任何适当的顺序执行处理。在权利要求书中，不应将位于括号内的任何参考标记理解成对权利要求的限制。术语“包括”或“包含”不排除存在未列在权利要求中的模块或步骤。位于模块或步骤之前的术语“一”或“一个”不排除存在多个这样的模块或步骤。本发明可以借助于包括若干不同模块的硬件或者借助于适当编程的计算机或处理器来实现。在列举了若干模块的装置权利要求中，这些模块中的若干项可以通过同一个硬件模块来实现。术语“第一”、“第二”、以及“第三”等的使用不表示任何顺序，可将这些术语解释为名称。术语“连接”、“耦接”等在本说明书中使用时定义为以任何期望形式进行可操作地连接，例如，机械地、电子地、数字地、模拟地、直接地、间接地、通过软件、通过硬件等方式进行连接。
【主权项】
1.一种移动设备上的实时口语评价系统(100)，其包括: 采集模块(110)，用于采集待评价语音的语音数据，所述待评价语音中包括至少一个字符的语音或字符串的语音；识别模块(130)，用于将所述采集模块(110)采集到的语音数据识别为文本数据；匹配模块(150)，用于将所述识别模块(130)识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配，得到匹配结果；以及评价模块(170)，用于根据预先定义的评价策略和所述匹配模块(150)匹配得到的匹配结果，得到并输出所述待评价语音中至少一个字符或字符串的发音得分，和/或所述待评价语音的发音得分。
2.根据权利要求1所述的系统，所述系统还包括:显示模块，用于显示所述语音样本库中语音样本的文本数据；所述采集模块(110 )进一步用于采集用户按照所述显示模块显示的语音样本库中语音样本的文本数据输入的、作为待评价语音的语音数据。
3.根据权利要求2所述的系统，所述系统还包括: 得分比较模块，用于将所述评价模块(170)输出的待评价语音的发音得分，和/或所述待评价语音中至少一个字符或字符串的发音得分，与预先定义的发音得分阈值进行比较；标记模块，用于在所述待评价语音的发音得分低于预先定义的发音得分阈值的情况下，在所述显示模块显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的文本数据；和/或，在待评价语音中字符或字符串的发音得分低于预先定义的发音得分阈值的情况下，在所述显示模块显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的字符或字符串。
4.根据权利要求1所述的系统，其中，所述匹配模块(150)进一步用于根据Levenshtein Distance编辑距离算法，对所述识别模块(130)识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配计算，得到匹配结果。
5.根据权利要求1?4任一所述系统，其中，所述预先定义的评价策略为:在识别得到的文本数据与语音样本库中语音样本的文本数据匹配的情况下，将根据语音数据识别得到文本数据中字符或字符串的后验概率作为待评价语音中字符或字符串的发音得分；将待评价语音中所有字符或字符串的发音得分的平均分作为待评价语音的发音得分。
6.根据权利要求1?4任一所述的系统，其中，所述系统还包括: 存储模块，用于存储所述语音样本库，所述语音样本库中包括至少一个语音样本。
7.—种移动设备上的实时口语评价方法(200)，其包括: 采集待评价语音的语音数据，所述待评价语音中包括至少一个字符的语音或字符串的语音(S210)；将采集到的所述语音数据识别为文本数据(S230 ); 将识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配，得到匹配结果(S250);以及根据预先定义的评价策略和所述匹配结果，得到并输出所述待评价语音中至少一个字符或字符串的发音得分，和/或所述待评价语音的发音得分(S270)。
8.根据权利要求7所述的方法，在所述采集待评价语音的语音数据(S210)的步骤之前，所述方法还包括:显示语音样本库中语音样本的文本数据；所述采集待评价语音的语音数据(S210)的步骤为: 采集用户按照显示的语音样本库中语音样本的文本数据输入的、作为待评价语音的语音数据。
9.根据权利要求8所述的方法，所述方法还包括: 将输出的所述待评价语音的发音得分，和/或所述待评价语音中的至少一个字符或字符串的发音得分，与预先定义的发音得分阈值进行比较；在所述待评价语音的发音得分低于预先定义的发音得分阈值的情况下，在显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的文本数据；和/或，在待评价语音中的至少一个字符或字符串的发音得分低于预先定义的发音得分阈值的情况下，在显示的文本数据中标记出发音得分低于预先定义的发音得分阈值的字符或字符串。
10.根据权利要求7?9任一所述的方法，其中，所述将识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配，得到匹配结果的步骤为: 根据Levenshtein Distance编辑距离算法,对识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配计算，得到匹配结果。
【专利摘要】本发明公开了一种移动设备上的实时口语评价系统及方法，系统包括：采集模块，用于采集待评价语音的语音数据；识别模块，用于将采集模块采集到的语音数据识别为文本数据；匹配模块，用于将识别模块识别得到的文本数据与语音样本库中语音样本的文本数据进行匹配，得到匹配结果；以及评价模块，用于根据预先定义的评价策略和匹配模块匹配得到的匹配结果，得到并输出待评价语音中至少一个字符或字符串的发音得分，和/或待评价语音的发音得分。通过将口语评价系统在移动设备上完成，不但减少了口语评价系统对网络的依赖，而且还能够给用户即时口语评价反馈，提高用户体验效果。
【IPC分类】G10L25-60, G10L15-26
【公开号】CN104599680
【申请号】CN201310524873
【发明人】林晖, 胡哲人, 王翌
【申请人】语冠信息技术（上海）有限公司
【公开日】2015年5月6日
【申请日】2013年10月30日
【公告号】WO2015062465A1

完整全部详细技术资料下载

当前第4页1 2 3 4