匹配目标试题答案的方法和装置制造方法

文档序号：6544621阅读：175来源：国知局

匹配目标试题答案的方法和装置制造方法
【专利摘要】本发明公开了一种匹配目标试题答案的方法和装置，其中，方法包括：获取包含目标试题的图像；对包含目标试题的图像进行识别，提取目标试题的文字内容；根据预设策略对所获取的文字内容进行处理，得到目标试题的特征信息；利用目标试题的特征信息与试题库中的试题进行匹配；如果试题库中的至少一个试题包含与所述目标试题的特征信息相匹配的信息，将该至少一个试题作为候选试题，获取候选试题对应的试题答案并显示。根据该方案，试题的输入、匹配，以及答案的获取均自动完成，大量减少了作答时间和用户操作，能够及时为用户提供答案，并保证答案的准确性。
【专利说明】匹配目标试题答案的方法和装置
【技术领域】
[0001]本发明涉及终端应用领域，具体涉及一种匹配目标试题答案的方法和装置。
【背景技术】
[0002]在中小学生写作业或者家长辅导学生的时候，常遇到不会做的试题或题目。这时用户常常通过互联网寻求试题的答案。
[0003]当前，已有多种服务于学生或家长的中小学生试题解析网站或网络应用，帮助用户获取答案，顺利完成作业，例如，作业帮，问他，作业宝等网站。用户通过手动输入试题内容进行检索，获取试题答案。
[0004]但现有的作业解析网站，app等都是通过人工回答，网站的其他用户，或在线教师查看试题后给出答案。从用户提问到获取到答案，存在时间成本的问题，不能快速满足用户的即时需求。在用户提问高峰期，或是对于难度较大的问题，有时会出现较长时间，如几个小时或一天内无人作答的情况，效率十分低下。长时间的等待也影响用户体验。并且，不同的作答可能多种不同的答案，令用户难以分辨。

【发明内容】

[0005]鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的匹配目标试题答案的方法和装置。
[0006]根据本发明的一个方面，提供了一种匹配目标试题答案的方法，包括:获取包含目标试题的图像；对包含目标试题的图像进行识别，提取目标试题的文字内容；根据预设策略对所获取的文字内容进行处理，得到目标试题的特征信息；利用目标试题的特征信息与试题库中的试题进行匹配；如果试题库中的至少一个试题包含与所述目标试题的特征信息相匹配的信息，将该至少一个试题作为候选试题，获取候选试题对应的试题答案并显示。
[0007]可选地，所述根据预设策略对提取的文字内容进行处理，得到所述目标试题的特征信息具体为:从所述目标试题的文字内容中截取一个或多个具有预设长度的文字片段作为所述目标试题的特征信息；
[0008]所述利用所述目标试题的特征信息与试题库中的试题进行匹配具体为:在所述试题库中匹配截取的一个或多个具有预设长度的文字片段。
[0009]可选地，所述根据预设策略对所获取的文字内容进行处理，得到所述目标试题的特征信息具体为:根据预设的抛词方法对所述目标试题的文字内容进行抛词处理，保留剩余文字内容作为所述目标试题的特征信息；
[0010]所述利用所述目标试题的特征信息与试题库中的试题进行匹配具体为:在所述试题库中匹配所述抛词处理后保留的剩余文字内容。
[0011]可选地，所述根据预设的抛词方法对所述目标试题的文字内容进行抛词处理具体为:从所述目标试题的文字内容的头部或尾部开始，每隔预设的文字数，抛去一个词，保留剩余文字内容。[0012]可选地，所述根据预设的抛词方法从所述目标试题的文字内容进行抛词处理之前还包括:
[0013]根据词与词之间的固定组合，保留所述目标试题的文字内容中有固定组合的词；
[0014]所述根据预设的抛词方法对所述目标试题的文字内容进行抛词处理具体为:对所述固定组合之外的目标试题的文字内容进行抛词处理；
[0015]所述固定组合通过分析所述试题库中试题的题目内容获得。
[0016]可选地，所述获取包含目标试题的图像包括:向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的图像；
[0017]所述对包含目标试题的图像进行识别具体为:对所述用户拍摄的包含目标试题的图像进行OCR识别。
[0018]可选地，所述获取包含目标试题的图像包括:
[0019]向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的初始图像；
[0020]根据用户选择的聚焦区域，对所述初始图像进行边缘检测，得到所述目标试题在所述初始图像中的边界；
[0021 ] 根据所述目标试题在所述初始图像中的边界，截取所述包含目标试题的图像；
[0022]所述对包含目标试题的图像进行识别具体为:对截取到的所述包含目标试题的图像进行OCR识别。
[0023]可选地，所述拍摄引导信息包括以下信息的一项或多项的组合:拍摄方向，拍摄角度，光线，提醒用户对目标试题所在区域进行聚焦。
[0024]根据本发明的另一方面，提供了一种匹配目标试题答案的装置，包括:图像获取模块，用于获取包含目标试题的图像；识别模块，用于对包含目标试题的图像进行识别，提取目标试题的文字内容；处理模块，用于根据预设策略对所获取的文字内容进行处理，得到目标试题的特征信息；匹配模块，用于利用目标试题的特征信息与试题库中的试题进行匹配；答案获取模块，用于在试题库中的至少一个试题包含与所述目标试题的特征信息相匹配的信息时，将该至少一个试题作为候选试题，获取候选试题对应的试题答案并显示。
[0025]可选地，所述处理模块包括:文字截取单元，用于从所述目标试题的文字内容中截取一个或多个具有预设长度的文字片段作为所述目标试题的特征信息；
[0026]所述匹配模块具体用于:在所述试题库中匹配截取的一个或多个具有预设长度的文字片段。
[0027]可选地，所述处理模块进一步包括:抛词单元，用于根据预设的抛词方法对所述目标试题的文字内容进行抛词处理，保留剩余文字内容作为所述目标试题的特征信息；
[0028]所述匹配模块具体用于:在所述试题库中匹配所述抛词处理后保留的剩余文字内容。
[0029]可选地，所述抛词单元具体用于:从所述目标试题的文字内容的头部或尾部开始，每隔预设的文字数，抛去一个词，保留剩余文字内容。
[0030]可选地，所述处理模块还包括:分析单元，用于分析所述试题库中试题的题目内容获得词与词之间的固定组合；
[0031]所述抛词单元具体用于:根据词与词之间的固定组合，保留所述目标试题的文字内容中有固定组合的词，对所述固定组合之外的目标试题的文字内容进行抛词处理。[0032]可选地，所述图像获取模块包括:拍照单元，用于向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的图像；
[0033]所述识别模块具体用于:对所述用户拍摄的包含目标试题的图像进行OCR识别。
[0034]可选地，所述图像获取模块进一步包括:
[0035]拍照单元，用于向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的初始图像；
[0036]边缘检测单元，用于根据用户选择的聚焦区域，对所述初始图像进行边缘检测，得到所述目标试题在所述初始图像中的边界；
[0037]图像截取单元，用于根据所述目标试题在所述初始图像中的边界，截取所述包含目标试题的图像；
[0038]所述识别模块具体用于:对截取到的所述包含目标试题的图像进行OCR识别。
[0039]可选地，所述拍摄引导信息包括以下信息的一项或多项的组合:拍摄方向，拍摄角度，光线，提醒用户对目标试题所在区域进行聚焦。
[0040]根据本发明的匹配目标试题答案的方法和装置，对获取包含目标试题的图像进行文字识别将图像转化为试题文字内容，之后，对文字内容进行处理得到特征信息，利用该特征信息在试题库中进行匹配，获取匹配通过的候选试题及答案。根据该方案，试题的输入、匹配，以及答案的获取均为自动完成，大量减少了作答时间和用户操作，能够及时为用户提供答案，并保证答案的准确性。
[0041]上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的【具体实施方式】。
【专利附图】

【附图说明】
[0042]通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中:
[0043]图1示出了根据本发明一个实施例的匹配目标试题答案的方法的流程图；
[0044]图2示出了根据本发明另一个实施例的匹配目标试题答案的方法的流程图；
[0045]图3示出了根据本发明另一个实施例的匹配目标试题答案的方法的流程图；
[0046]图4示出了根据本发明一个实施例的匹配目标试题答案的装置的结构框图。
【具体实施方式】
[0047]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。
[0048]图1示出了根据本发明一个实施例的匹配目标试题答案的方法的流程图，如图1所示，该方法包括如下步骤:
[0049]步骤S110，获取包含目标试题的图像。[0050]包含目标试题的图像可来自用户的现场拍摄，或选自本地文件，例如，手机相册，对电子文档的截图等。图像可以为bmp，jpg, jpeg等常见格式，也可以包括其它适于进行图像识别的电子文件格式，例如Pdf文件。
[0051]步骤S120，对包含目标试题的图像进行识别，提取目标试题的文字内容。
[0052]该步骤将包含目标试题的图像转换成计算机文字。
[0053]步骤S130，根据预设策略对所获取的文字内容进行处理，得到目标试题的特征信
肩、O
[0054]本步骤可以包括从初始识别的文字内容中截取一个或多个文字片段，作为特征信息，或者是抛词处理，即以一定策略从初始文字内容中去除部分文字内容，将剩余文字内容作为特征信息。对文字内容的处理可避免试题过长而导致的匹配效率下降等问题。本步骤还可以包括对文字内容的检测，具体的处理方法依检测结果而定。例如，当检测到文字长度大于匹配阈值时，去除以部分文字；当文字包含乱码时，通过抛词处理去除乱码。
[0055]步骤S140，利用目标试题的特征信息与试题库中的试题进行匹配。
[0056]试题库中有大量与预先收集的试题及相应的答案。试题库可以是一个或多个，例如，根据学科，年级对试题库进行分类。匹配时提醒用户在相应的类别中查找，或根据的关键词对目标题目进行自动分类，以提高查找效率。
[0057]步骤S150，如果试题库中的至少一个试题包含与目标试题的特征信息相匹配的信息，将该至少一个试题作为候选试题，获取候选试题对应的答案并显示。
[0058]候选试题即是匹配通过的试题。由于特征信息可能只反映试题的部分内容，因此，匹配通过的可能是多个相似的试题。获取全部候选试题题目及答案并显示，供用户查看。进一步地，由于试题的表述方式灵活多样，为提高召回率，该匹配可以是指仅部分特征信息的匹配，例如，通过相似度计算，将相似度在某一阈值以上的试题作为候选试题并返回题目和答案，给出相似度数据。
[0059]根据本发明上述实施例提供的方法，对获取包含目标试题的图像进行文字识别将图像转化为试题文字内容，无需用户手动输入，之后，对文字内容进行处理得到特征信息，利用该特征信息在试题库中进行匹配，获取匹配通过的候选试题及其答案。根据该方案，试题的输入、匹配，以及答案的获取都是自动完成，大量减少了作答时间和用户操作，能够及时为用户提供答案，并保证答案的准确性。
[0060]图2示出了根据本发明另一个实施例的匹配目标试题答案的方法的流程图，如图2所示,该方法包括如下步骤:
[0061]步骤S210，向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的图像。
[0062]拍摄引导信息包括拍摄方向，拍摄角度，光线，距离，以及提醒用户对目标试题所在区域进行聚焦等，通过引导信息对用户做适当的指示，使用户拍摄出的图像符合识别的质量要求。
[0063]本发明中的方法可实现为智能手机平台上的app，则具体地，该步骤可通过调用智能手机的摄像头或系统提供的摄像程序实现。
[0064]具体地，在用户拍照前给出文字说明及示例图片等作为引导信息，例如，提示用户采用垂直角度进行拍摄，选择良好光线，横向拍摄，显示一个用户可调的聚焦框等，在题目过长时，只拍摄一部分有效内容等。[0065]步骤S220，根据用户选择的聚焦区域，对初始图像进行边缘检测。
[0066]以步骤S210中用户拍摄的图像作为初始图像，通过边缘检测得到目标试题在初始图像中的边界。例如，智能手机的拍照程序通常会给出一个位于手机屏幕中间位置的聚焦框，由用户通过手动拖拽等方式调整其大小、位置，理想的情况是，用户按拍照引导信息进行调整后，聚焦框内包含目标试题的一部分有效内容，以该部分有效内容为基础，在整个初始图像上进行边缘检测，确定目标试题的边界，则边界中包含了并且只包含了目标试题的全部或部分内容。
[0067]步骤S230，根据目标试题在初始图像中的边界，截取包含目标试题的图像。
[0068]截取边界内的图像作为待识别图像。如上所述，如果用户按照引导信息进行了正确操作，则截取的图像中只包含目标试题的文字内容，这有效避免了由于相邻试题的部分文字在后续匹配过程中可能造成的干扰，而导致找不到候选试题的情况。
[0069]上述步骤S220和步骤S230为本实施例的可选步骤。
[0070]步骤S240，对截取的包含目标试题的图像进行OCR识别。
[0071]该实施例中，采用OCR (光学字符识别)技术对截取图像进行识别。OCR具有较高的识别速度和准确率。OCR中包括二值化，噪声去除，倾斜校正，字符切割等过程，当然，二值化及噪声去除也可以在预处理阶段完成。然后，通过特定的OCR算法得到目标试题的文字内容，现有技术中有多种OCR算法，例如基于模板匹配，特征提取或神经网络训练等方法，可根据需要进行选择。另外，OCR技术还包括版面分析及恢复过程，当未进行边缘检测及图片截取时，可通过版面分析仅提取出目标试题的文字内容。
[0072]步骤S250，从目标试题的文字内容中截取一个或多个具有预设长度的文字片段作为目标试题的特征信息。
[0073]如果OCR识别后的文字内容过长，则可能无法进行有效率的匹配。这时，可以从识别的目标试题的文字内容的前部、中部、后部截取分别适当长度的内容，截取的长度可根据试题长度以及匹配要求而定。
[0074]步骤S260，在试题库中匹配截取的一个或多个具有预设长度的文字片段。
[0075]将截取的一个或多个文字片段作为目标试题的特征信息，分别在试题库中匹配，或者将片段组合后进行匹配。
[0076]步骤S270，判断试题库中是否有至少一个试题包含与截取的文字片段相匹配的信息，如果是，执行步骤S280。
[0077]题库中可能存在大量相似度较高的试题，这些相似度较高的试题中包含同样的文字片段，则与截取的文字片段相匹配的试题的数量可能为多个。
[0078]如果匹配失败，还可以进一步查询试题库中是否存在一些试题，其中包含了与截取的文字片段或文字片段的组合相似度较高的内容。例如，可以对截取的多个片段进行进一步地截取，得到多个子片段，利用这些子片段或子片段的组合进行匹配，如果匹配出的题目与目标试题之间具有较高的相似度，可作为相关试题记录。由于试题的表达形式多变，这些相似度较高的相关试题可能对用户有提示作用。
[0079]步骤S280，将匹配通过的试题作为候选试题，获取答案并显示。
[0080]获取全部的候选试题的答案和题目并显示，进一步，可以给出与目标试题相似度较高的相关试题及答案，计算与目标试题之间的相似度，按相似度排序后显示，供用户查看。
[0081]根据本发明上述实施例提供的方法，向用户提供拍照引导信息，使用户易于拍出符合OCR识别要求的图像；通过对初始图像的边缘检测，截取到只包含目标试题文字内容的图像，这消除了不相关内容可能对识别及匹配造成的影响；对于识别出的过长文字内容，用截取的文字片段进行匹配，提高了匹配的效率。
[0082]图3示出了根据本发明另一个实施例的匹配目标试题答案的方法，如图3所示，该方法包括如下步骤:
[0083]步骤S310，向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的图像。
[0084]步骤S320，对用户拍摄的包含目标试题的图像进行OCR识别。
[0085]步骤S310和S320的【具体实施方式】可参照上一实施例，当然，该实施例中也可以包括对拍摄的图像进行边缘检测及图片截取的步骤，此处不再重复叙述。
[0086]步骤S330，根据预设的抛词方法对所述目标试题的文字内容进行抛词处理。
[0087]抛词是指以一定策略从初始文字内容中去除部分文字内容，将剩余文字内容作为特征信息。
[0088]具体地，抛词方法可以是:从OCR识别出的目标试题的文字内容的头部或尾部开始，每隔预设的文字数，抛去一个词，或固定数量的文字，所间隔的文字数根据试题长度和匹配要求而定。与上一实施例类似地，剩余文字内容包含试题的部分有效信息，可作为用于匹配的特征信息，用剩余内容的匹配也可能返回多个候选试题。
[0089]还可以在抛词之前对文字内容进行预处理，例如，由于图像质量和识别能力的原因，OCR识别得到的文字内容中可能包含一些乱码，并且，题目中经常包含一些提供有效信息的字词，例如“的”，“所”等，可以先抛去这些乱码和无意义的词，如果剩余文字内容仍不能满足匹配要求，再执行上述抛词过程。
[0090]作为示例，抛词之前的预处理可按如下方式进行:
[0091]根据词与词之间的固定组合，保留目标试题的文字内容中有固定组合的词。其中，固定组合通过分析试题库中大量试题的题目内容获得，包括学科术语，或是某一学科类别中的多个词语的惯用组合等，例如“摩擦力…大小..方向”等。
[0092]根据预设的抛词方法对目标试题的文字内容进行抛词处理具体为:在抛词过程中，保留这些固定组合，对固定组合之外的目标试题的文字内容进行抛词处理。这样，抛词处理更具有针对性，特征信息中保留了更多的有效信息。
[0093]步骤S340，在试题库中匹配抛词处理后保留的剩余文字内容。
[0094]步骤S350，获取匹配通过的候选试题的答案并显示。
[0095]与上一实施例类似地，候选试题可能有多个，还可以进一步给出与目标试题有较高相似度的试题及答案，此处不再赘述。
[0096]根据本发明上述实施例提供的方法，采用抛词的方法对OCR识别获得的文字内容进行处理，得到特征信息，通过抛词获得的特征信息中保留了更多的有效信息，有利于提高匹配效率。
[0097]图4示出了根据本发明一个实施例的匹配目标试题答案的装置的结构框图，如图4所示,该装置包括:
[0098]图像获取模块410，用于获取包含目标试题的图像。[0099]包含目标试题的图像可来自用户的现场拍摄，或选自本地文件，例如，手机相册，对电子文档的截图等。图像可以为bmp，jpg, jpeg等常见格式，也可以包括其它适于进行图像识别的电子文件格式，例如Pdf文件。
[0100]可选地，图像来自用户拍摄，则图像获取模块410进一步包括:拍照单元4101，用于向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的图像。
[0101]拍摄引导信息包括拍摄方向，拍摄角度，光线，距离，以及提醒用户对目标试题所在区域进行聚焦等。通过引导信息对用户做适当的指示，使用户拍摄出的图像识别的质量要求。
[0102]本发明中的匹配试题答案的装置可实现为智能手机平台上的app，具体地，拍照单元4101可通过调用智能手机的摄像头或系统提供的摄像程序获取图像。
[0103]可选地，图像获取模块410进一步包括:边缘检测单元4102，用于根据用户选择的聚焦区域，对用户拍摄的初始图像进行边缘检测，得到目标试题在初始图像中的边界；以及
[0104]图像截取单元4103，用于根据目标试题在初始图像中的边界，截取包含目标试题的图像。
[0105]图像截取单元4103截取边界内的图像作为待识别图像。如果用户操作正确，截取的图像中只包含目标试题的文字内容，这有效避免了由于相邻试题的部分文字在后续匹配过程中可能造成的干扰，而导致找不到候选试题的情况。
[0106]边缘检测单元4102和图像截取单元4103也可适用于图像获取模块410以其他方式获取的包含目标试题的图像。
[0107]识别模块420，用于对包含目标试题的图像进行识别，提取目标试题的文字内容。
[0108]识别模块420将包含目标试题的图像转换成计算机文字。
[0109]可选地，识别模块420用于:对获取到的包含目标试题的图像进行OCR识别。OCR识别具有较高的速度和准确率。具体地，识别模块420对图像可执行二值化，噪声去除，倾斜校正，字符切割等处理，然后，通过特定的OCR算法得到目标试题的文字内容，现有技术中有多种OCR算法，可根据需要进行选择。
[0110]可选地，包含目标试题的图像来自用户拍摄，则识别模块420具体用于:对用户拍摄的包含目标试题的图像进行OCR识别；
[0111]若图像经过了边缘检测单元4102和图像截取单元4103的处理，则识别模块420具体用于:对截取到的包含目标试题的图像进行OCR识别。
[0112]处理模块430，用于根据预设策略对所获取的文字内容进行处理，得到目标试题的特征信息。
[0113]具体地，处理模块430可用于从初始识别的文字内容中截取多个文字片段，作为特征信息，或者用于对文字内容做抛词处理，即以一定策略从初始文字内容中去除部分文字内容，将剩余文字内容作为特征信息。对文字内容的处理可避免试题过长而导致的匹配效率下降等问题。
[0114]可选地，处理模块430进一步包括:文字截取单元4303，用于从目标试题的文字内容中截取一个或多个具有预设长度的文字片段作为目标试题的特征信息。具体地，文字截取单元4303可以从识别的目标试题的文字内容的前部、中部、后部截取分别适当长度的内容，截取的长度可根据试题长度以及匹配要求而定；或者[0115]处理模块430对文字内容做抛词处理，则处理模块430进一步包括:抛词单元4302，用于根据预设的抛词方法对所述目标试题的文字内容进行抛词处理，保留剩余文字内容作为目标试题的特征信息。
[0116]抛词单元4302具体用于:从目标试题的文字内容的头部或尾部开始，每隔预设的文字数，抛去一个词，保留剩余文字内容。
[0117]可选地，处理模块进一步包括:分析单元4301，用于分析试题库中试题的题目内容获得词与词之间的固定组合；固定组合包括学科术语，或是某一学科类别中的多个词语的惯用组合等，例如“摩擦力…大小..方向”;则抛词单元4302具体用于:根据词与词之间的固定组合，保留目标试题的文字内容中有固定组合的词，对固定组合之外的目标试题的文字内容进行抛词处理。这样，抛词处理更具有针对性，特征信息中保留了更多的有效信肩、O
[0118]匹配模块440，用于利用目标试题的特征信息与试题库中的试题进行匹配；
[0119]可选地，若特征信息是文字截取单元4303截取的多个文字片段，则匹配模块440具体用于:将截取的一个或多个文字片段分别在试题库中匹配，或者将多个片段进行组合后进行匹配；
[0120]若特征信息是抛词单元4302获取的剩余文字内容，则匹配模块440具体用于:在试题库中匹配剩余文字内容。
[0121]答案获取模块450，用于在试题库中的至少一个试题包含与目标试题的特征信息相匹配的信息时，将该至少一个试题作为候选试题，获取候选试题对应的试题答案并显示。
[0122]题库中可能存在大量相似度较高的试题，这些相似度较高的试题中包含同样的文字片段，则答案获取模块450得到的候选试题的数量可能为一个以上，这时，可选地，答案获取模块450获取全部的候选试题的答案和题目并显示，进一步，可以给出与目标相似度较高的相关试题及答案，计算与目标试题之间的相似度，按相似度排序后显示，供用户查看。
[0123]根据本发明上述实施例提供的装置，图像获取模块获取包含目标试题的图像，识别模块对图像进行文字识别，将图像转化为试题的文字内容，之后，处理模块对文字内容进行处理得到特征信息，匹配模块利用该特征信息在试题库中进行匹配，答案获取模块获取匹配通过的候选试题及答案。根据该方案，试题的输入、匹配，以及答案的获取均为自动完成，大量减少了作答时间和用户操作，能够及时为用户提供答案，并保证答案的准确性。
[0124]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本发明也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本发明的内容，并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0125]在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。
[0126] 类似地，应当理解，为了精简本公开并帮助理解各个发明方面中的一个或多个，在上面对本发明的示例性实施例的描述中，本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】，其中每个权利要求本身都作为本发明的单独实施例。
[0127]本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0128]此外，本领域的技术人员能够理解，尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征，但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如，在下面的权利要求书中，所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0129]本发明的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的匹配目标试题答案的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如，计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。
[0130]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
【权利要求】
1.一种匹配目标试题答案的方法，包括: 获取包含目标试题的图像；对所述包含目标试题的图像进行识别，提取所述目标试题的文字内容；根据预设策略对所获取的文字内容进行处理，得到所述目标试题的特征信息；利用所述目标试题的特征信息与试题库中的试题进行匹配；如果试题库中的至少一个试题包含与所述目标试题的特征信息相匹配的信息，将该至少一个试题作为候选试题，获取候选试题对应的试题答案并显示。
2.根据权利要求1所述的方法，所述根据预设策略对提取的文字内容进行处理，得到所述目标试题的特征信息具体为:从所述目标试题的文字内容中截取一个或多个具有预设长度的文字片段作为所述目标试题的特征信息；所述利用所述目标试题的特征信息与试题库中的试题进行匹配具体为:在所述试题库中匹配截取的一个或多个具有预设长度的文字片段。
3.根据权利要求1-2任一项所述的方法，所述根据预设策略对所获取的文字内容进行处理，得到所述目标试题的特征信息具体为:根据预设的抛词方法对所述目标试题的文字内容进行抛词处理，保留剩余文字内容作为所述目标试题的特征信息；所述利用所述目标试题的特征信息与试题库中的试题进行匹配具体为:在所述试题库中匹配所述抛词处理后保留的剩余文字内容。
4.根据权利要求1-3任一项所述的方法，所述根据预设的抛词方法对所述目标试题的文字内容进行抛词处理具体为:从所述目标试题的文字内容的头部或尾部开始，每隔预设的文字数，抛去一个词，保留剩余文字内容。
5.根据权利要求1-4任一项所述的方法，所述根据预设的抛词方法从所述目标试题的文字内容进行抛词处理之前还包括: 根据词与词之间的固定组合，保留所述目标试题的文字内容中有固定组合的词；所述根据预设的抛词方法对所述目标试题的文字内容进行抛词处理具体为:对所述固定组合之外的目标试题的文字内容进行抛词处理；所述固定组合通过分析所述试题库中试题的题目内容获得。
6.根据权利要求1-5任一项所述的方法，所述获取包含目标试题的图像包括:向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的图像；所述对包含目标试题的图像进行识别具体为:对所述用户拍摄的包含目标试题的图像进行OCR识别。
7.根据权利要求1-6任一项所述的方法，所述获取包含目标试题的图像包括: 向用户提供拍摄引导信息，获取用户拍摄的包含目标试题的初始图像；根据用户选择的聚焦区域，对所述初始图像进行边缘检测，得到所述目标试题在所述初始图像中的边界；根据所述目标试题在所述初始图像中的边界，截取所述包含目标试题的图像；所述对包含目标试题的图像进行识别具体为:对截取到的所述包含目标试题的图像进行OCR识别。
8.根据权利要求1-7任一项所述的方法，所述拍摄引导信息包括以下信息的一项或多项的组合:拍摄方向，拍摄角度，光线，提醒用户对目标试题所在区域进行聚焦。
9.一种匹配目标试题答案的装置，包括: 图像获取模块，用于获取包含目标试题的图像；识别模块，用于对所述包含目标试题的图像进行识别，提取所述目标试题的文字内容；处理模块，用于根据预设策略对所获取的文字内容进行处理，得到所述目标试题的特征信息；匹配模块，用于利用所述目标试题的特征信息与试题库中的试题进行匹配；答案获取模块，用于在试题库中的至少一个试题包含与所述目标试题的特征信息相匹配的信息时，将该至少一个试题作为候选试题，获取候选试题对应的试题答案并显示。
10.根据权利要求9所述的装置，所述处理模块包括:文字截取单元，用于从所述目标试题的文字内容中截取一个或多个具有预设长度的文字片段作为所述目标试题的特征信息；所述匹配模块进一步用于:在所述试题库中匹配截取的一个或多个具有预设长度的文字片段。
【文档编号】G06F17/30GK103914567SQ201410165812
【公开日】2014年7月9日申请日期:2014年4月23日优先权日:2014年4月23日
【发明者】王艳丽, 吴凯申请人:北京奇虎科技有限公司, 奇智软件（北京）有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王艳丽;吴凯
技术所有人：北京奇虎科技有限公司;奇智软件（北京）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。