用于文字性客观题的智能阅卷方法及系统的制作方法

文档序号：6627237阅读：276来源：国知局

用于文字性客观题的智能阅卷方法及系统的制作方法
【专利摘要】本发明公开了一种用于文字性客观题的智能阅卷方法及系统，该方法包括：获取文字性客观题答案图像；对所述答案图像进行切分，获得待识别答案字符串的一个或多个切分结果；判断是否有字数与标准答案字数相同的切分结果；如果没有，则确定答案错误；否则，计算所述字数与标准答案字数相同的切分结果的识别置信度，和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度；根据计算得到的识别置信度确定答案是否正确。利用本发明，可以实现文字性客观题的自动阅卷，减少人力资源消耗，提高阅卷效率及准确性。
【专利说明】用于文字性客观题的智能阅卷方法及系统

【技术领域】
[0001] 本发明涉及信息处理【技术领域】，具体涉及一种用于文字性客观题的智能阅卷方法及系统。

【背景技术】
[0002] 随着计算机技术和教育信息化的不断推进，计算机和人工智能技术已经逐步应用于日常的教育教学各项活动中，在教学辅助、教学评测等实际应用场景下都得到了相应的应用。国内现有的基础教育、学生学习状况的主要考察形式仍是各种类型的考试或测试，在此状况下，教师背负着很大的批改作业和试卷的工作压力。针对这种现象，在大中型或重要性高的考试或测试中已经逐渐推广和采用了各类自动阅卷系统，这类系统能够一定程度上减轻教师阅卷的工作量。
[0003] 然而，在现有的自动阅卷系统中，完全由计算机完成阅卷的部分多是对填涂性客观题（如选择题）的阅卷，而对于像填空题等文字性客观试题的阅卷，现今仍需要大量的教师集中进行，且在大型考试阅卷前还需要对阅卷老师进行集中培训、考试。因此，传统的自动阅卷系统人力资源消耗仍然较大，且在阅卷时因不同教师风格、情绪、心理状态等主观性因素可能造成判卷结果出现不公平不公正的现象。

【发明内容】

[0004] 本发明实施例提供一种用于文字性客观题的智能阅卷方法及系统，以实现文字性客观题的自动阅卷，减少人力资源消耗，提高阅卷效率及准确性。
[0005] 为此，本发明实施例提供如下技术方案：
[0006] -种用于文字性客观题的智能阅卷方法，包括：
[0007] 获取文字性客观题答案图像；
[0008] 对所述答案图像进行切分，获得待识别答案字符串的一个或多个切分结果；
[0009] 判断是否有字数与标准答案字数相同的切分结果；
[0010] 如果没有，则确定答案错误；
[0011] 否则，计算所述字数与标准答案字数相同的切分结果的识别置信度，和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度；
[0012] 根据计算得到的识别置信度确定答案是否正确。
[0013] 优选地，所述获取文字性客观题答案图像包括：
[0014] 获取答题卡图像；
[0015] 根据答题卡布局信息，分割并提取目标答题区域；
[0016] 从所述目标答题区域提取文字性客观题答案图像。
[0017] 优选地，所述获取答题卡图像包括：
[0018] 利用光标阅读设备、或者高拍仪、或者移动终端设备获取答题卡图像。
[0019] 优选地，所述对所述答案图像进行切分，获得待识别答案字符串的一个或多个切分结果包括：
[0020] 对所述答案图像进行细切分，得到多个细切分子块；
[0021] 对所述细切分子块进行合并，并计算合并可信度；
[0022] 根据所述可信度确定合并结果，得到待识别答案字符串的一个或多个切分结果。
[0023] 优选地，所述计算合并可信度包括：
[0024] 提取合并得到的字符的字符特征；
[0025] 利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
[0026] 优选地，所述计算所述字数与标准答案字数相同的切分结果的识别置信度包括：
[0027] 将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；
[0028] 基于全字符集的声学模型及通用的语言模型，对所述字数与标准答案字数相同的切分结果进行手写解码识别，得到各识别结果的似然得分；
[0029] 选取识别结果中解码路径与标准答案一致的路径的似然得分；
[0030] 计算所述路径的后验得分，并将所述后验得分作为所述字数与标准答案字数相同的切分结果的识别置信度；
[0031] 相应地，所述根据计算得到的识别置信度确定答案是否正确包括：
[0032] 如果有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值，则确定答案正确；否则确定答案错误。
[0033] 优选地，所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括：
[0034] 将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；
[0035] 基于全字符集的声学模型，计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分；
[0036] 选取所述识别结果中与标准答案一致的字符的识别结果的似然得分；
[0037] 计算选取的识别结果的后验得分，并将所述后验得分作为所述字符的识别置信度；
[0038] 相应地，所述根据计算得到的识别置信度确定答案是否正确包括：
[0039] 如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值，则确定答案正确；否则确定答案错误。
[0040] 优选地，所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括：
[0041] 将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；
[0042] 基于全字符集的声学模型及通用的语言模型，对所述字数与标准答案字数相同的切分结果进行手写解码识别，得到各识别结果的似然得分；
[0043] 计算各识别结果的后验概率，并根据各识别结果的后验概率，针对所述切分结果中的每个字符，累积各识别结果中该字符的识别结果与标准答案一致的后验概率，并将该后验概率作为该字符的置信度；
[0044] 相应地，所述根据计算得到的识别置信度确定答案是否正确包括：
[0045] 如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值，则确定答案正确；否则确定答案错误。
[0046] -种用于文字性客观题的智能阅卷系统，包括：
[0047] 图像获取模块，用于获取文字性客观题答案图像；
[0048] 切分模块，用于对所述答案图像进行切分，获得待识别答案字符串的一个或多个切分结果；
[0049] 第一判断模块，用于判断是否有字数与标准答案字数相同的切分结果，并在判断结果为没有与标准答案字数相同的切分结果时，触发输出模块输出答案错误的指示信息；否则，触发计算模块进行识别置信度计算；；
[0050] 所述计算模块包括：第一计算模块、和/或第二计算模块；所述第一计算模块用于计算所述字数与标准答案字数相同的切分结果的识别置信度，所述第二计算模块用于计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度；
[0051] 第二判断模块，用于根据所述计算模块计算得到的识别置信度确定答案是否正确，并在判断答案正确时，触发所述输出模块输出答案正确的指示信息；在判断答案错误时，触发所述输出模块输出答案错误的指示信息。
[0052] 优选地，所述图像获取模块包括：
[0053] 图像获取单元，用于获取答题卡图像；
[0054] 答题区域提取单元，用于根据答题卡布局信息，分割并提取目标答题区域；
[0055] 答案内容提取单元，从所述目标答题区域提取文字性客观题答案图像。
[0056] 优选地，所述图像获取单元具体为光标阅读设备、或者高拍仪、或者移动终端设备。
[0057] 优选地，所述切分模块包括：
[0058] 切分单元，用于对所述答案图像进行细切分，得到多个细切分子块；
[0059] 可信度计算单元，用于对所述细切分子块进行合并，并计算合并可信度；
[0060] 合并结果确定单元，用于根据所述可信度确定合并结果，得到待识别答案字符串的一个或多个切分结果。
[0061] 优选地，所述可信度计算单元包括：
[0062] 合并子单元，用于对所述细切分子块进行合并；
[0063] 提取子单元，用于提取合并得到的字符的字符特征；
[0064] 计算子单元，用于利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
[0065] 优选地，所述第一计算模块包括：
[0066] 对齐单元，用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；
[0067] 第一识别单元，用于基于全字符集的声学模型及通用的语言模型，对所述字数与标准答案字数相同的切分结果进行手写解码识别，得到各识别结果的似然得分；
[0068] 第一选择单元，用于选取识别结果中解码路径与标准答案一致的路径的似然得分；
[0069] 第一计算单元，用于计算所述路径的后验得分，并将所述后验得分作为所述切分结果的识别置信度；
[0070] 所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值时，判断答案正确；否则判断答案错误。
[0071] 优选地，所述第二计算模块包括：
[0072] 对齐单元，用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；
[0073] 第二识别单元，用于基于全字符集的声学模型，计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分；
[0074] 第二选择单元，用于选取所述识别结果中与标准答案一致的字符的识别结果的似然得分；
[0075] 第二计算单元，用于计算选取的识别结果的后验得分，并将所述后验得分作为所述字符的识别置信度；
[0076] 所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值时，判断答案正确；否则判断答案错误。
[0077] 优选地，所述第二计算模块包括：
[0078] 对齐单元，用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；
[0079] 第一识别单元，用于基于全字符集的声学模型及通用的语言模型，对所述字数与标准答案字数相同的切分结果进行手写解码识别，得到各识别结果的似然得分；
[0080] 第三计算单元，用于计算各识别结果的后验概率，并根据各识别结果的后验概率，针对所述字数与标准答案字数相同的切分结果中的每个字符，累积各识别结果中该字符的识别结果与标准答案一致的后验概率，并将该后验概率作为该字符的置信度；
[0081] 所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值时，判断答案正确；否则判断答案错误。
[0082] 本发明实施例提供的用于文字性客观题的智能阅卷方法及系统，对已知标准答案的文字性客观题，利用答案的先验信息辅助进行手写字符串的识别，从而完成文字性客观题的自动阅卷，解决了传统自动阅卷系统因不能应用计算机完全自动进行文字性客观题阅卷，而采用人工阅卷带来的人力资源消耗大、教师工作压力大、因教师主观因素导致的判卷结果不准确等问题。

【专利附图】

【附图说明】
[0083]为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。
[0084] 图1是本发明实施例用于文字性客观题的智能阅卷方法的流程图；
[0085] 图2是本发明实施例中答案图像切分示例；
[0086] 图3是本发明实施例中对答案图像进行切分的流程图；
[0087] 图4是本发明实施例中计算识别置信度的一种流程图；
[0088] 图5是本发明实施例中计算识别置信度的另一种流程图；；
[0089] 图6是本发明实施例中计算识别置信度的另一种流程图；；
[0090] 图7是本发明实施例用于文字性客观题的智能阅卷系统的结构示意图；
[0091] 图8是本发明实施例中第一计算模块的结构框图；
[0092] 图9是本发明实施例中第二计算模块的一种结构框图；
[0093] 图10是本发明实施例中第二计算模块的另一种结构框图。

【具体实施方式】
[0094] 为了使本【技术领域】的人员更好地理解本发明实施例的方案，下面结合附图和实施方式对本发明实施例作进一步的详细说明。
[0095] 本发明实施例用于文字性客观题的智能阅卷方法及系统，，针对具有标准答案的文字性试题（比如填空题）的考卷，利用标准答案的先验信息辅助进行手写字符串的识别，从而完成文字性客观题的自动阅卷。
[0096] 如图1所示，是本发明实施例用于文字性客观题的智能阅卷方法的流程图，包括以下步骤：
[0097] 步骤101，获取文字性客观题答案图像。
[0098] 所述文字性客观题答案图像即为答案字符串图像，在本发明实施例中，所述答案字符串可以是中文字串、英文字串等。
[0099] 获取答案图像的具体过程如下：
[0100] ⑴获取答题卡图像。
[0101] 答题卡图像的获取可以采用光标阅读设备进行扫描，或者采用高拍仪、移动终端等设备进行拍照获取。
[0102] (2)根据答题卡布局信息，分割并提取目标答题区域。
[0103] 在实际应用中，在分割提取目标答题区域之前，可以先对答题卡图像进行预处理，以提取到准确的目标答题区域。所述预处理可以包括：对答题卡图像进行定位、校准、降噪、对比度增强、灰度化等操作，具体处理方法与现有的自动阅卷系统中答题卡图像预处理方法相同，在此不再赘述。
[0104] 答题卡布局信息是已知的先验信息，如果需要对答题卡图像进行定位，则还可获得答题卡图像的定位信息，根据这些信息，再通过边缘检测即可准确地分割并提取目标答题区域。
[0105] (3)从所述目标答题区域提取文字性客观题答案图像。
[0106] 在得到目标答题区域后，根据答题卡布局信息，再通过边缘点检测即可得到答案图像，该答案图像是答案字符串的图像。
[0107] 步骤102,对所述答案图像进行切分，获得待识别答案字符串的一个或多个切分结果。
[0108] 具体切分过程将在后面详细说明。
[0109] 另外，需要说明的是，在实际应用中，在对所述答案图像进行切分之前，还可以对答案图像进行预处理，以得到更准确的切分结果。所述预处理可以包括：对答案图像进行二值化处理、矫正手写笔迹倾斜、笔迹细化等。
[0110] 步骤103,判断是否有字数与标准答案字数相同的切分结果。如果有，则执行步骤 104 ;否则，执行步骤106。
[0111] 由于会有多种不同的合并结果，因此在步骤102得到的多个切分结果的字数也会有所不同，而与标准答案字数相同的切分结果是最有可能正确的答案。由于本发明方案所针对的是具有标准答案的文字性客观试题，，因此，如果字数不同，即可确定答案是错误的。如果切分结果的字数与标准答案的字数相同，则需要进一步来判断该答案是否正确。
[0112] 步骤104,计算所述字数与标准答案字数相同的切分结果的识别置信度，和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度。
[0113] 步骤105,根据计算得到的识别置信度确定答案是否正确。
[0114] 识别置信度的计算方式可以有多种，相应地，根据不同计算方式得到的识别置信度来确定答案是否正确也有相应的判断，具体将在后面详细说明。
[0115] 步骤106,确定答案错误。
[0116] 本发明实施例提供的用于文字性客观题的智能阅卷方法，，对已知标准答案的文字性客观题，利用答案的先验信息辅助进行手写字符串的识别，从而完成文字性客观题的自动阅卷，解决了传统自动阅卷系统因不能应用计算机完全自动进行文字性客观题阅卷，而采用人工阅卷带来的人力资源消耗大、教师工作压力大、因教师主观因素导致的判卷结果不准确等问题。
[0117] 如图3所示，是本发明实施例中对答案图像进行切分的流程图，包括以下步骤：
[0118] 步骤301，对答案图像进行细切分，得到多个细切分子块。
[0119] 比如，从答案图像的最左上端的黑像素点开始进行8邻域黑色扩展，从而将整幅图像划分成几个由黑色像素组成的连通子区域，如图3所示是一个切分示例，可以看到通过将黑色笔迹部分进行连通域的分割后，原来的一个字符串图像被切分成了几个片段，这些片段都是组成单字的部件，依书写方式不同可能是偏旁部首也可能是单一笔迹部分，这些片段进行组合后就会组成不同的字符。
[0120] 步骤302,对所述细切分子块进行合并，并计算合并可信度。
[0121] 比如，可以对细切分子块进行穷举性合并，即将所有可能的合并都一一进行，比如有5个细切分子块，有以下几种合并：
[0122] (1)假设为一个字符，则将细切分子块1、2、3、4、5进行合并；
[0123] (2)假设为二个字符，则将细切分子块1、2、3、4进行合并；将细切分子块1、2、3合并、并将细切分子块4、5合并；将细切分子块1、2合并、并将细切分子块3、4、5合并；将细切分子块2、3、4、5合并；
[0124] 依此类推，一直假设到为五个字符。
[0125] 所述合并可信度代表了合并后得到的字符的准确度，具体地，可以提取出合并后字符的高度、宽度、高宽比、字符外间距、字符内间距等特征，根据系统预先训练的规则统计模型得到似然得分，将该得分作为当前合并结果的可信度。
[0126] 所述规则统计模型是根据提取出的训练数据切分后字符的高度、宽度、高宽比、字符外间距、字符内间距等特征，训练出的统计模型，该模型可以是GMM(Gaussian Mixture Model,高斯混合模型）或SVM(Support Vector Machine,支持向量机）等。
[0127] 合并可信度的计算，即计算合并结果所提取的特征通过规则统计模型计算出的似然得分（即合并得分），并根据该得分确定合并可信度，也可以直接将该得分作为对应的合并可信度。
[0128] 步骤303,根据所述可信度确定合并结果，得到待识别答案字符串的一个或多个切分结果。
[0129] 具体地，如果可信度大于设定的阈值，则认为该合并是可信的，否则认为该合并是不可信的。进而根据可信的合并结果得到一个或多个待识别答案字符串。
[0130] 需要说明的是，在实际应用中，在合并前或在判断合并可信度时，还可以根据经验或实验设定一些判断规则，比如一个汉字的笔迹不超过3个细切分子块等，以进一步辅助或指导完成字符串切分结果是否正确的判断，提高判断的准确性。
[0131] 在本发明实施例中，需要计算字数与标准答案字数相同的各切分结果的识别置信度，和/或计算字数与标准答案字数相同的各切分结果中每个字符的识别置信度，并根据计算得到的识别置信度确定答案是否正确。在实际应用中，可以有多种计算及判断方法，下面将分别加以说明。
[0132] 如图4所示，是本发明实施例中计算识别置信度的一种流程图。在该实施例中，需要计算各切分结果的识别似然得分，然后根据该识别似然得分计算该切分结果的识别置信度。
[0133] 针对每个字数与标准答案字数相同的切分结果，计算其识别置信度的具体过程包括以下步骤：
[0134] 步骤401，将切分结果与标准答案的文本字串对齐。
[0135] 也就是说，将切分结果中的各切分片段（每个切分片段代表了一个字符）顺序与标准答案的文本字串中的各字符一一对齐。
[0136] 步骤402,基于全字符集的声学模型及通用的语言模型，对所述切分结果进行手写解码识别，得到各识别结果的似然得分。
[0137] 所述语言模型可以是N-Gram模型，具体计算公式为：
[0138]

【权利要求】
1. 一种用于文字性客观题的智能阅卷方法，其特征在于，包括：获取文字性客观题答案图像；对所述答案图像进行切分，获得待识别答案字符串的一个或多个切分结果；判断是否有字数与标准答案字数相同的切分结果；如果没有，则确定答案错误；否则，计算所述字数与标准答案字数相同的切分结果的识别置信度，和/或计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度；根据计算得到的识别置信度确定答案是否正确。
2. 根据权利要求1所述的方法，其特征在于，所述获取文字性客观题答案图像包括：获取答题卡图像；根据答题卡布局信息，分割并提取目标答题区域；从所述目标答题区域提取文字性客观题答案图像。
3. 根据权利要求2所述的方法，其特征在于，所述获取答题卡图像包括：利用光标阅读设备、或者高拍仪、或者移动终端设备获取答题卡图像。
4. 根据权利要求1所述的方法，其特征在于，所述对所述答案图像进行切分，获得待识别答案字符串的一个或多个切分结果包括：对所述答案图像进行细切分，得到多个细切分子块；对所述细切分子块进行合并，并计算合并可信度；根据所述可信度确定合并结果，得到待识别答案字符串的一个或多个切分结果。
5. 根据权利要求4所述的方法，其特征在于，所述计算合并可信度包括：提取合并得到的字符的字符特征；利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
6. 根据权利要求1至5任一项所述的方法，其特征在于，所述计算所述字数与标准答案字数相同的切分结果的识别置信度包括：将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；基于全字符集的声学模型及通用的语言模型，对所述字数与标准答案字数相同的切分结果进行手写解码识别，得到各识别结果的似然得分；选取识别结果中解码路径与标准答案一致的路径的似然得分；计算所述路径的后验得分，并将所述后验得分作为所述字数与标准答案字数相同的切分结果的识别置信度；所述根据计算得到的识别置信度确定答案是否正确包括：：如果有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值，则确定答案正确；否则确定答案错误。
7. 根据权利要求1至5任一项所述的方法，其特征在于，所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括：将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；基于全字符集的声学模型，计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分；选取所述识别结果中与标准答案一致的字符的识别结果的似然得分；计算选取的识别结果的后验得分，并将所述后验得分作为所述字符的识别置信度；所述根据计算得到的识别置信度确定答案是否正确包括：：如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值，则确定答案正确；否则确定答案错误。
8. 根据权利要求1至5任一项所述的方法，其特征在于，所述计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度包括：将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；基于全字符集的声学模型及通用的语言模型，对所述字数与标准答案字数相同的切分结果进行手写解码识别，得到各识别结果的似然得分；计算各识别结果的后验概率，并根据各识别结果的后验概率，针对所述切分结果中的每个字符，累积各识别结果中该字符的识别结果与标准答案一致的后验概率，并将该后验概率作为该字符的置信度；所述根据计算得到的识别置信度确定答案是否正确包括：：如果有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值，则确定答案正确；否则确定答案错误。
9. 一种用于文字性客观题的智能阅卷系统，其特征在于，包括：图像获取模块，用于获取文字性客观题答案图像；切分模块，用于对所述答案图像进行切分，获得待识别答案字符串的一个或多个切分结果；第一判断模块，用于判断是否有字数与标准答案字数相同的切分结果，并在判断结果为没有与标准答案字数相同的切分结果时，触发输出模块输出答案错误的指示信息；否则，触发计算模块进行识别置信度计算；；所述计算模块包括：第一计算模块、和/或第二计算模块；所述第一计算模块用于计算所述字数与标准答案字数相同的切分结果的识别置信度，所述第二计算模块用于计算所述字数与标准答案字数相同的切分结果中各字符的识别置信度；第二判断模块，用于根据所述计算模块计算得到的识别置信度确定答案是否正确，并在判断答案正确时，触发所述输出模块输出答案正确的指示信息；在判断答案错误时，触发所述输出模块输出答案错误的指示信息。
10. 根据权利要求9所述的系统，其特征在于，所述图像获取模块包括：图像获取单元，用于获取答题卡图像；答题区域提取单元，用于根据答题卡布局信息，分割并提取目标答题区域；答案内容提取单元，从所述目标答题区域提取文字性客观题答案图像。
11. 根据权利要求10所述的系统，其特征在于，所述图像获取单元具体为光标阅读设备、或者高拍仪、或者移动终端设备。
12. 根据权利要求9所述的系统，其特征在于，所述切分模块包括：切分单元，用于对所述答案图像进行细切分，得到多个细切分子块；可信度计算单元，用于对所述细切分子块进行合并，并计算合并可信度；合并结果确定单元，用于根据所述可信度确定合并结果，得到待识别答案字符串的一个或多个切分结果。
13. 根据权利要求12所述的系统，其特征在于，所述可信度计算单元包括：合并子单元，用于对所述细切分子块进行合并；提取子单元，用于提取合并得到的字符的字符特征；计算子单元，用于利用预先训练得到的规则统计模型和所述字符特征计算该合并的可信度。
14. 根据权利要求9至13任一项所述的系统，其特征在于，所述第一计算模块包括：对齐单元，用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；第一识别单元，用于基于全字符集的声学模型及通用的语言模型，对所述字数与标准答案字数相同的切分结果进行手写解码识别，得到各识别结果的似然得分；第一选择单元，用于选取识别结果中解码路径与标准答案一致的路径的似然得分；第一计算单元，用于计算所述路径的后验得分，并将所述后验得分作为所述切分结果的识别置信度；所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果的识别置信度大于第一置信度阈值时，判断答案正确；否则判断答案错误。
15. 根据权利要求9至13任一项所述的系统，其特征在于，所述第二计算模块包括：对齐单元，用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；第二识别单元，用于基于全字符集的声学模型，计算所述字数与标准答案字数相同的切分结果中各字符的识别结果的似然得分；第二选择单元，用于选取所述识别结果中与标准答案一致的字符的识别结果的似然得分；第二计算单元，用于计算选取的识别结果的后验得分，并将所述后验得分作为所述字符的识别置信度；所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第二置信度阈值时，判断答案正确；否则判断答案错误。
16. 根据权利要求9至13任一项所述的系统，其特征在于，所述第二计算模块包括：对齐单元，用于将所述字数与标准答案字数相同的切分结果与所述标准答案的文本字串对齐；第一识别单元，用于基于全字符集的声学模型及通用的语言模型，对所述字数与标准答案字数相同的切分结果进行手写解码识别，得到各识别结果的似然得分；第三计算单元，用于计算各识别结果的后验概率，并根据各识别结果的后验概率，针对所述字数与标准答案字数相同的切分结果中的每个字符，累积各识别结果中该字符的识别结果与标准答案一致的后验概率，并将该后验概率作为该字符的置信度；所述第二判断模块具体用于在有任一字数与标准答案字数相同的切分结果中各字符的识别置信度均大于第三置信度阈值时，判断答案正确；否则判断答案错误。
【文档编号】G06K9/68GK104268603SQ201410472818
【公开日】2015年1月7日申请日期:2014年9月16日优先权日:2014年9月16日
【发明者】胡雨隆, 张银田, 竺博, 魏思, 胡国平, 胡郁, 刘庆峰申请人:科大讯飞股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡雨隆;张银田;竺博;魏思;胡国平;胡郁;刘庆峰
技术所有人：科大讯飞股份有限公司
我是此专利的发明人

上一篇：一种基于异常处理的海量文本自动标注方法
上一篇：网页渲染方法、装置及移动终端的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。