一种题目匹配的方法和系统与流程

文档序号:21890538发布日期:2020-08-18 17:48阅读:145来源:国知局
一种题目匹配的方法和系统与流程

本发明涉及题目收集技术领域,具体涉及一种题目匹配的方法和系统。



背景技术:

为了解决中小学的作业难题,目前,市场上出现了很多解决学生作业难题的搜题或错题汇总类应用程序,这些应用程序都是通过摄像头拍摄题目图片,然后通过裁剪和框选等方式得到框题内容,进而用于错题保存或用来搜索对应的答案。

因为框题内容为图片,用于错题保存,在打印重做时,因为摄像头像素以及其他原因,可能会导致打印不清晰。用于搜索答案时,需要字符识别找到该题目对应的答案,过程繁琐的同时,如果框题内容不清楚,很可能使得搜索失败或搜索到其他题的答案。



技术实现要素:

针对所述缺陷,本发明实施例公开了一种题目匹配的方法和系统,通过语音获得待收集题目的图片,操作简单,效率高。

本发明实施例第一方面公开一种题目匹配的方法,应用于智能终端中,所述方法包括:

智能终端获取目标页面图像,并将所述目标页面图像发送给服务器;

服务器识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;

服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;

服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;

智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;

所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述页眉部分和页脚部分确定搜索关键词,包括:

识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为第一条件;

检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书名以及品牌名中的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种作为第二条件;

检测所述页眉部分或/和页脚部分中的非字符部分中是否包括出版社以及品牌名中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种作为第二条件;

在存在第二条件时,将第一条件和第二条件作为搜索关键词。

作为一种可选的实施方式,在本发明实施例第一方面中,服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源,包括:

利用所述搜索关键词遍历题目资源库的索引集合;

将所述题目资源库的索引集合中包含搜索关键词所有信息的索引作为目标索引;

根据所述目标索引以及映射关系获取题目资源库中的目标题目资源。

作为一种可选的实施方式,在本发明实施例第一方面中,所述智能终端接收用户在承载体上的操作轨迹,之前,还包括:

服务器识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页面中相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关系页面对应的目标题目资源为目标页面图像对应的匹配资源;

所述在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容,包括:

在所述匹配资源的关系页面中获取与所述框题区域位置相同的内容作为框题内容。

作为一种可选的实施方式,在本发明实施例第一方面中,所述智能终端获取目标页面图像,包括:

接收用户发送的触发指令,智能终端根据所述触发指令启动摄像头对承载体进行拍照,获取目标页面图像。

作为一种可选的实施方式,在本发明实施例第一方面中,所述服务器根据所述操作轨迹和预设规则确定框题区域,包括:

服务器将在承载体上的操作轨迹通过坐标转换到在目标页面图像中上,得到在目标页面图像上的运行轨迹;

服务器根据所述运行轨迹以及预设规则确定对目标页面图像的框题区域。

作为一种可选的实施方式,在本发明实施例第一方面中,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容,包括:

获取关系页面对应的所有标识,从所述所有标识中选择所述框题区域对应位置的目标标识;

根据所述目标标识和映射关系获取关系页面中所述目标标识对应的内容;

将所述目标标识对应的内容作为框题内容。

本发明实施例第二方面公开一种题目匹配的系统,其包括智能终端和服务器;

所述智能终端,包括:

第一获取单元,用于获取目标页面图像,并将所述目标页面图像发送给服务器;

接收单元,用于接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;

所述服务器,包括:

第一识别单元,用于识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;

搜索单元,用于利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;

第二识别单元,用于从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;

第二获取单元,用于根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

作为一种可选的实施方式,在本发明实施例第二方面中,所述第一识别单元,包括:

第一筛选子单元,用于识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为第一条件;

第二筛选子单元,检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书名以及品牌名中的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种作为第二条件;

第三筛选子单元,检测所述页眉部分或/和页脚部分中的非字符部分中是否包括出版社以及品牌名中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种作为第二条件;

判断子单元,用于在存在第二条件时,将第一条件和第二条件作为搜索关键词。

作为一种可选的实施方式,在本发明实施例第二方面中,所述搜索单元,包括:

查询子单元,用于利用所述搜索关键词遍历题目资源库的索引集合;

第一确定子单元,用于将所述题目资源库的索引集合中包含搜索关键词所有信息的索引作为目标索引;

映射子单元,用于根据所述目标索引以及映射关系获取题目资源库中的目标题目资源。

作为一种可选的实施方式,在本发明实施例第二方面中,所述服务器还包括匹配单元,用于识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页面中相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关系页面对应的目标题目资源为目标页面图像对应的匹配资源。

作为一种可选的实施方式,在本发明实施例第二方面中,所述第一获取单元包括:拍照子单元,用于接收用户发送的触发指令,并根据所述触发指令启动摄像头对承载体进行拍照,获取目标页面图像。

作为一种可选的实施方式,在本发明实施例第二方面中,所述第二获取单元,包括:

转换子单元,用于将在承载体上的操作轨迹通过坐标转换到在目标页面图像中上,得到在目标页面图像上的运行轨迹;

第二确定子单元,用于根据所述运行轨迹以及预设规则确定对目标页面图像的框题区域。

作为一种可选的实施方式,在本发明实施例第二方面中,所述第二获取单元,还包括:

选择子单元,用于获取关系页面对应的所有标识,从所述所有标识中选择所述框题区域对应位置的目标标识;

第二映射子单元,用于根据所述目标标识和映射关系获取关系页面中所述目标标识对应的内容;

第三确定子单元,用于将所述目标标识对应的内容作为框题内容。

本发明实施例第三方面公开一种题目匹配的方法,所述方法包括:

智能终端获取目标页面图像,并将所述目标页面图像发送给服务器;

服务器识别所述目标页面图像中页眉部分和页脚部分,并将所述页眉部分和页脚部分均与题目资源库中存储的页眉页脚检测图像进行比对,所述页眉页脚检测图像与题目资源库中的题目资源一一对应;

如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对大于或等于第二阈值,服务器将页眉页脚检测图像对应的题目资源作为目标题目资源;

如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对小于第二阈值时,服务器根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;

服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;

服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;

智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;

所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

本发明实施例第四方面公开一种题目匹配的系统,包括智能终端和服务器;

所述智能终端,包括:

第一获取单元,用于获取目标页面图像,并将所述目标页面图像发送给服务器;

接收单元,用于接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;

所述服务器,包括:

比对单元,用于识别所述目标页面图像中页眉部分和页脚部分,并将所述页眉部分和页脚部分均与题目资源库中存储的页眉页脚检测图像进行比对,所述页眉页脚检测图像与题目资源库中的题目资源一一对应;

第一判断单元,用于如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对大于或等于第二阈值,将页眉页脚检测图像对应的题目资源作为目标题目资源;

第二判断单元,用于如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对小于第二阈值时,根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;

搜索单元,用于利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;

识别单元,用于从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;

第二获取单元,用于根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

本发明实施例第五方面公开一种智能终端,包括:

存储有可执行程序代码的存储器;

与所述存储器耦合的处理器;

所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面或第三方面公开的智能终端执行的部分或全部步骤。

本发明实施例第六方面公开一种服务器,包括:

存储有可执行程序代码的存储器;

与所述存储器耦合的处理器;

所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第一方面或第三方面公开的服务器执行的部分或全部步骤。

本发明实施例第七方面公开一种计算机可读存储介质,所述计算机可读存储介质存储了程序代码,其中,所述程序代码包括用于执行本发明实施例第一方面或第三方面公开的任意一种方法的部分或全部步骤的指令。

本发明实施例第八方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面或第三方面公开的任意一种方法的部分或全部步骤。

本发明实施例第九方面公开一种应用发布平台,所述应用发布平台用于发布所述计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本发明实施例第一方面或第三方面公开的任意一种方法的部分或全部步骤。

与现有技术相比,本发明实施例具有以下有益效果:

本发明实施例中,通过页眉页脚信息识别题目资源库中相关的目标题目资源。可见,实施本发明实施例,可以得到更为清晰的框题内容图片或字符文本,可保证后续错题收集的清晰度或搜索答案的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种题目匹配的方法的流程示意图;

图2是本发明实施例公开的一种练习册的页面结构图;

图3是本发明实施例公开的另一种练习册的页面结构图;

图4是本发明实施例公开的又一种练习册的页面结构图;

图5是本发明实施例公开的另一种题目匹配的方法的流程示意图;

图6是本发明实施例公开的一种题目匹配的系统的结构示意图;

图7是本发明实施例公开的另一种题目匹配的系统的结构示意图;

图8是本发明实施例公开的一种智能终端的结构示意图;

图9是本发明实施例公开的一种服务器的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定顺序。本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,示例性地,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例公开了一种题目匹配的方法和系统,其只要根据移动轨迹的起点坐标和终点坐标构建第一直线和第二直线即可得到选择框,操作十分简单方便,而且还能保证题目的完整性,提升用户体验,以下结合附图进行详细描述。

实施例一

请参阅图1,图1是本发明实施例公开的一种题目匹配的方法的流程示意图,题目匹配在智能终端和服务器的配合中完成。题目匹配是用于选取题目,应用于错题收集或搜索答案等。如图1所示,该题目匹配的方法包括以下步骤:

110、智能终端获取目标页面图像,并将所述目标页面图像发送给服务器。

目标页面图像是通过用户产生的触发指令后,智能终端根据触发指令启动摄像头对承载体的某个页面进行拍照取得。

触发指令的产生方式有多种,示例性地,可以通过语音交互形式产生,或者通过打开智能终端中的搜题应用程序或错题收集应用程序等产生,或者启动智能终端相应的触摸按键或机械按键,或者上述多种方式的结合。

智能终端包括但不限于学习机、家教机、点读机、平板电脑和手机等,摄像头可以是智能设备的前置或后置摄像头,也可以是分离于智能终端外且与智能终端存在通讯连接的外部摄像头。

承载体为题目内容的载体。在本发明实施例中,承载体主要是练习册。对承载体进行框题的操作体可以是手指、触控笔、铅笔、尺子以及小棍等,操作体可以在承载体上形成操作轨迹或操作点。

示例性地,服务器接收到目标页面图像后,可以先对目标页面图像进行预处理,以保证字符识别的准确性。预处理包括但不限于去噪、对比度增强以及形状矫正等,形状矫正主要针对摄像头视角问题拍摄到梯形图像或者承载体出现卷曲情况,形状矫正可以通过对目标页面图像的边缘拉伸等实现,最终得到的目标页面图像为矩形。

120、服务器识别所述目标页面图像中的页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种。

图2所示的练习册页面图像中,在页眉部分可以获取年级信息211(即七年级上)、科目信息212(即语文)、版本信息213(即人教版)以及品牌名信息214(即教材全解)。图3所示的练习册页面图像中,在页脚部分可以获取年级信息221(即六年级上册)、科目信息222(即语文)、品牌名信息223(即英才教程)以及书名信息224(即“快乐读书吧”导读与精炼)。图4所示的练习册页面图像中,在页脚部分可以获得年级信息231(即三年级下)、科目信息232(即数学)以及版本信息233(即r,r指代人教版),在页脚部分可以获得品牌名信息234(即带有博士帽的小孩图像,指代品牌名为黄冈小状元)。

由此可知,练习册中都会覆盖年级和科目信息,因此,将此部分信息作为第一条件,部分练习册还会存在书名、出版社、版本号和品牌名的一种或多种,将这些作为辅助的第二条件,当存在第二条件时,将第一条件和第二条件查询,不存在第二条件时,可以直接通过第一条件去查询。

具体地,识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为第一条件。示例性地,识别页眉部分和页脚部分的字符可以通过成熟的ocr(opticalcharacterrecognition,光学字符识别)技术实现,这里的字符主要为汉字。因为年级和科目是可以穷举的,因此,从所述字符中筛选年级和科目就是通过设置第一搜索库,穷举所有的年级信息和科目信息,去遍历页眉部分或/和页脚部分中的字符,即可得到年级和科目信息。

检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书名以及品牌名中的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种作为第二条件。与第一条件同样的方法,将常见的版本名、书名以及品牌名设置第二搜索库,遍历页眉部分或/和页脚部分中的字符,如果存在第二条件,则得到具体的第二条件信息。事实上,对于不同地区,其版本号是统一地,因此,在用户使用搜题应用程序或错题收集应用程序时,根据用户输入的基本信息也可以确定版本号,相当于版本号是已知的。

存在一些练习册,其出版社和品牌名使用图标实现,在这种情况下,可以检测所述页眉部分或/和页脚部分中的非字符部分中是否包括出版社以及品牌名中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种作为第二条件。其实现方式是将页眉部分或/和页脚部分中识别出的非字符部分与可以穷举的图标搜索库进行相似度比对即可,例如相似度达到90%以上,则认为识别出了对应的出版社信息或品牌名信息。

对于大部分用户而言,其在一定的时期内(例如一个学期)常使用的练习册是固定的,在第一次识别时按照上述方法进行精确查找获取目标题目资源库,即其使用的练习册对应的资源库,而在其他时候使用过程中,任意选取上述一两个信息即可快速获取目标题目资源库。

130、服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源。

题目资源库是将现有大部分练习册组建成资源库,该题目资源库中存储有多个小资源库,每个小资源库对应不同的练习册,这个小资源库中,可以将题目集中存储成字符文本,也可以将题目按照用户使用的练习册的布局方式存储成清晰的图片格式。如果是字符文本,则需要一个映射关系,通过该映射关系,可以快速得到用户练习册对应位置的题目内容。

索引集合是指每个小资源库对应的资源指引,包括上述第一条件和第二条件的所有信息,即这个资源索引要不少于搜索关键词的数量。资源索引除可以在资源练习册的页眉和页脚获得,也可以从练习册的封面或者其他位置例如首页等获取。资源索引单独存储于题目资源库中,其与对应的小资源库存在映射关系,基于该映射关系和资源索引可以得到对应的小资源库。

具体地,利用所述搜索关键词遍历题目资源库的索引集合;将所述题目资源库的索引集合中包含搜索关键词所有信息的资源索引作为目标索引;根据所述目标索引以及映射关系获取题目资源库中的目标题目资源(即目标小资源库)。

140、服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面。

在练习册的正文中,页眉部分或页脚部分中会显示练习册的页码。

根据页码可以得到目标题目资源的关系页面,对于字符文本存储方式的目标题目资源,可以通过页面映射关系获取到对应的关系页面内容,对于图片格式存储方式的目标题目资源,只需要根据页码找到目标题目资源对应的页面即可。

当页眉页脚的搜索关键词过少时,可能会得到多个不同的目标题目资源,因此,为避免该情况的发生,在本发明实施例中,对获取到的目标题目资源进行筛选和确认。

具体地,服务器识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页面中相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关系页面对应的目标题目资源为目标页面图像对应的匹配资源。

示例性地,可以选取目标页面图像正文起始位置的多个字符和结束位置的多个字符,来与关系页面中相同位置的字符进行相似度比对。对于字符文本存储方式的目标题目资源,可以在通过映射关系得到的关系页面的起始位置和终点位置中选择与目标页面图像相同数量的字符;对于图片格式存储方式的目标题目资源,可以在通过页码得到的关系页面的起始位置和终点位置中选择与目标页面图像相同数量的字符。

相似度比对可以将字符转换成向量,通过余弦距离或欧氏距离进行比对,当起始位置的多个字符和结束位置的多个字符之间的比对均大于预设的第一阈值例如95%时,确定该关系页面为目标页面图像对应的页面,关系页面所在的题目资源为目标页面图像对应的匹配资源,完成目标题目资源的筛选和确认过程。

150、智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器。

用户在承载体上的操作轨迹可以是闭合曲线,也可以是一个线段,或者一个操作点,具体操作轨迹的实现形式与对应的预设规则有关。

160、所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

服务器接收到操作轨迹后,通过仿射变换等坐标变换方式将在承载体上的操作轨迹转换到目标页面图像中,形成目标页面图像的运行轨迹,通过运行轨迹和预设规则确定在目标页面图像中的框题区域。

示例性地,对于闭合曲线而言,预设规则可以是闭合曲线本身为选择框,选择框内部内容为框题区域。对于一个线段而言,预设规则可以是这个线段覆盖的内容为框题区域,也可以是以该线段为对角线,构建形成的矩形为框题区域;对于一个操作点而言,预设规则可以是该点上方或下方预设范围内的部分为框题区域。

在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

对于字符文本存储的关系页面,可以先获取关系页面中对于的所有标识,这里的所有标识中的每个标识均对应在练习册上一个区域,通过标识和映射关系可以得到每个标识在关系页面中对于的题目内容。

选择框题区域对应位置的标识,记为目标标识,就可以根据目标标识和映射关系得到目标标识对应的题目内容,将这个题目内容作为框题内容即可用于错题保存或搜索答案。

对于图片根式存储的关系页面,可以将目标页面图像和关系页面转换成相同大小或获取二者的大小比例,基于框题区域在目标页面图像中的位置得到对应在关系页面中的位置,通过关系页面中的对应的框题区域即可得到题目内容,将这个题目内容作为框题内容即可用于错题保存或搜索答案。

实施本发明实施例,可以通过页眉页脚信息识别题目资源库中相关的目标题目资源,得到更为清晰的框题内容图片或字符文本,可保证后续错题收集的清晰度或搜索答案的准确性。

实施例二

请参阅图5,图5是本发明实施例公开的一种题目匹配的方法的流程示意图,题目匹配均在智能终端中完成。如图5所示,该题目匹配的方法包括以下步骤:

310、智能终端获取目标页面图像,并将所述目标页面图像发送给服务器。

320、服务器识别所述目标页面图像中页眉部分和页脚部分。

330、并将所述页眉部分和页脚部分均与题目资源库中存储的页眉页脚检测图像进行比对,所述页眉页脚检测图像与题目资源库中的题目资源一一对应,如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对大于或等于第二阈值,执行步骤340,反之执行步骤350。

一般地,练习册的页面部分和页脚部分的图像在整个练习册的正文部分,除了页面变化外,其他基本无变化。基于此,可以通过将所述页眉部分和页脚部分均与题目资源库中存储的页眉页脚检测图像进行比对快速确定目标题目资源。页眉页脚检测图像为根据预设规则将题目资源库中相应的练习册正文中任意页码的页眉和页脚构成页眉检测图像和页脚检测图像,预设规则采用与目标页面图像识别到的页眉部分和页脚部分采用相同的规则,例如,如果页眉和页脚出现分割线,则以分割线为选取边界进行图像分割得到,如果页眉和页脚之一或两个没有出现分割线,则以与正文部分的边界进行图像分割得到。

图像比对可以采用均值漂移算法实现,当目标页面图像的页眉部分和页脚部分分别与页眉检测图像和页脚检测图像进行比对,当二者的相似度均达到第二阈值,例如80%,执行步骤340,反之,如果练习册中出现较多的名人名言等干扰信息,则二者的相似度之一或所有可能达不到第二阈值,则执行步骤350。

340、服务器将页眉页脚检测图像对应的题目资源作为目标题目资源。

当目标页面图像的页眉部分和页脚部分分别与页眉检测图像和页脚检测图像进行比对的相似度均达到第二阈值时,可以认为页眉页脚检测图像对应的题目资源(小资源库)即为目标页面图像对应的目标题目资源,进而执行步骤370。

350、服务器根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种。

360、服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源。

370、服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面

380、智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器。

390、所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

步骤310与实施例一中的步骤110类似,步骤320与实施例一中步骤120的部分内容类似,步骤350与实施例一中步骤120的部分内容类似,步骤360~390与实施例一中的步骤130~160类似,这里不再赘述。

实施本发明实施例,可以通过页眉页脚信息识别题目资源库中相关的目标题目资源,得到更为清晰的框题内容图片或字符文本,可保证后续错题收集的清晰度或搜索答案的准确性。

实施例三

请参阅图6,图6是本发明实施例公开的一种题目匹配的系统的结构示意图,应用于智能终端中。如图6所示,该题目匹配的系统可以包括智能终端400和服务器500;

所述智能终端400,包括:

第一获取单元410,用于获取目标页面图像,并将所述目标页面图像发送给服务器;

接收单元420,用于接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;

所述服务器500,包括:

第一识别单元510,用于识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;

搜索单元520,用于利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;

第二识别单元530,用于从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;

第二获取单元540,用于根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

作为一种可选的实施方式,所述第一识别单元510,包括:

第一筛选子单元511,用于识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为第一条件;

第二筛选子单元512,检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书名以及品牌名中的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种作为第二条件;

第三筛选子单元513,检测所述页眉部分或/和页脚部分中的非字符部分中是否包括出版社以及品牌名中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种作为第二条件;

判断子单元514,用于在存在第二条件时,将第一条件和第二条件作为搜索关键词。

作为一种可选的实施方式,所述搜索单元520,包括:

查询子单元521,用于利用所述搜索关键词遍历题目资源库的索引集合;

第一确定子单元522,用于将所述题目资源库的索引集合中包含搜索关键词所有信息的索引作为目标索引;

第一映射子单元523,用于根据所述目标索引以及映射关系获取题目资源库中的目标题目资源。

作为一种可选的实施方式,所述服务器还包括匹配单元550,用于识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页面中相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关系页面对应的目标题目资源为目标页面图像对应的匹配资源。

作为一种可选的实施方式,所述第一获取单元410包括:拍照子单元411,用于接收用户发送的触发指令,并根据所述触发指令启动摄像头对承载体进行拍照,获取目标页面图像。

作为一种可选的实施方式,所述第二获取单元540,包括:

转换子单元541,用于将在承载体上的操作轨迹通过坐标转换到在目标页面图像中上,得到在目标页面图像上的运行轨迹;

第二确定子单元542,用于根据所述运行轨迹以及预设规则确定对目标页面图像的框题区域。

作为一种可选的实施方式,所述第二获取单元540,还包括:

选择子单元543,用于获取关系页面对应的所有标识,从所述所有标识中选择所述框题区域对应位置的目标标识;

第二映射子单元544,用于根据所述目标标识和映射关系获取关系页面中所述目标标识对应的内容;

第三确定子单元545,用于将所述目标标识对应的内容作为框题内容。

图6所示的题目匹配的系统,可以通过页眉页脚信息识别题目资源库中相关的目标题目资源,得到更为清晰的框题内容图片或字符文本,可保证后续错题收集的清晰度或搜索答案的准确性。

实施例四

请参阅图7,图7是本发明实施例公开的另一种题目匹配的系统的结构示意图,应用于智能终端中。如图7所示,该题目匹配的系统可以包括智能终端600和服务器700;

所述智能终端600,包括:

第一获取单元610,用于获取目标页面图像,并将所述目标页面图像发送给服务器;

接收单元620,用于接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;

所述服务器700,包括:

比对单元710,用于识别所述目标页面图像中页眉部分和页脚部分,并将所述页眉部分和页脚部分均与题目资源库中存储的页眉页脚检测图像进行比对,所述页眉页脚检测图像与题目资源库中的题目资源一一对应;

第一判断单元720,用于如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对大于或等于第二阈值,将页眉页脚检测图像对应的题目资源作为目标题目资源;

第二判断单元730,用于如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对小于第二阈值时,根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;

搜索单元740,用于利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;

识别单元750,用于从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;

第二获取单元760,用于根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。

图7所示的题目匹配的系统,可以通过页眉页脚信息识别题目资源库中相关的目标题目资源,得到更为清晰的框题内容图片或字符文本,可保证后续错题收集的清晰度或搜索答案的准确性。

实施例五

请参阅图8,图8是本发明实施例公开的一种智能终端的结构示意图。智能终端可以是学习机、家教机、点读机、平板电脑或手机等。如图8所示,该智能终端800可以包括:

存储有可执行程序代码的存储器810;

与存储器810耦合的处理器820;

其中,处理器820调用存储器810中存储的可执行程序代码,执行实施例一或实施例二中智能终端执行的部分或全部步骤。

实施例六

请参阅图9,图9是本发明实施例公开的一种服务器的结构示意图。如图9所示,该服务器900可以包括:

存储有可执行程序代码的存储器910;

与存储器910耦合的处理器920;

其中,处理器920调用存储器910中存储的可执行程序代码,执行实施例一或实施例二中服务器执行的部分或全部步骤。

本发明实施例公开一种计算机可读存储介质,其存储计算机程序,其中,该计算机程序使得计算机执行实施例一或实施例二任意一种题目匹配的方法中的部分或全部步骤。

本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一或实施例二任意一种题目匹配的方法中的部分或全部步骤。

本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行实施例一或实施例二任意一种题目匹配的方法中的部分或全部步骤。

在本发明的各种实施例中,应理解,所述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例所述方法的部分或全部步骤。

在本发明所提供的实施例中,应理解,“与a对应的b”表示b与a相关联,根据a可以确定b。但还应理解,根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其他信息确定b。

本领域普通技术人员可以理解所述实施例的各种方法中的部分或全部步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(read-onlymemory,rom)、随机存储器(randomaccessmemory,ram)、可编程只读存储器(programmableread-onlymemory,prom)、可擦除可编程只读存储器(erasableprogrammableread-onlymemory,eprom)、一次可编程只读存储器(one-timeprogrammableread-onlymemory,otprom)、电子抹除式可复写只读存储器(electrically-erasableprogrammableread-onlymemory,eeprom)、只读光盘(compactdiscread-onlymemory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

以上对本发明实施例公开的一种题目匹配的方法和系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1