一种图片试题的处理方法及装置与流程

文档序号:12063903阅读:382来源:国知局
一种图片试题的处理方法及装置与流程

本发明属于智能搜题技术领域,尤其涉及一种图片试题的处理方法及装置。



背景技术:

随着互联网的发展,各种试题库也呈现爆炸式的增长,越来越多的学生使用试题库搜索试题获得试题的解题思路或答案,最常用的方法就是拍照搜题,学生通过具有拍照功能的电子设备对待搜索的试题拍照后上传至服务器,服务器识别学生上传的试题后在试题库中匹配搜索相似的试题并将搜索到的试题的解题思路或答案反馈给学生。

但是,学生在使用拍照搜题的过程中,通常会遇到纯图片试题或者大部分是图片的试题,学生对纯图片试题或者大部分是图片的试题进行拍照搜题后,即使题库中有原题,仍然无法从题库中匹配搜索到相应的试题或搜索的试题并不是学生想要搜索的试题,造成学生通过拍照搜索含有图片的试题时无法搜索到相应的试题,搜题效率低的问题。



技术实现要素:

鉴于此,本发明实施例提供一种图片试题的处理方法及装置,以解决当试题本身为纯图片或者大部分为图片时,无法搜索到的问题。

本发明实施例的第一方面,提供一种图片试题的处理方法,所述方法包括:

获取题库中待处理的试题;

将所述待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息;

根据识别处理后的试题信息创建该试题的索引信息。

本发明实施例的第二方面,提供一种图片试题的处理装置,所述装置包括:

获取模块,用于获取题库中待处理的试题;

第一识别模块,用于将所述获取模块获取的待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息;

索引信息创建模块,用于根据所述第一识别模块识别处理后的试题信息创建该试题的索引信息。

本发明实施例与现有技术相比存在的有益效果是:本发明实施例获取题库中待处理的试题;将所述待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息;根据识别处理后的试题信息创建该试题的索引信息。由于将题库中含有图片的试题识别为文字信息后,根据识别后的文字信息创建索引信息,在用户搜题时,会将用户拍照的试题全部识别为文字信息,所以发出的搜题信息能够与题库中该试题的索引信息相对应,能够解决学生搜索含有图片的试题或者本身就是图片的试题时无法搜索到,搜题效率低的问题。本发明实施例操作方便、实现简单,对硬件的要求低,从而有利降低产品成本,使产品适用面更广,具有较强的易用性和实用性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的图片试题的处理方法的实现流程图;

图2是本发明第二实施例提供的图片试题的处理方法的实现流程图;

图3是本发明第三实施例提供的图片试题的处理装置的组成结构图;

图4是本发明第四实施例提供的图片试题的处理装置的示意框图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

实施例一:

参见图1,图1是本发明实施例一提供的图片试题的处理方法的示意流程图,如图1所示该方法可以包括以下步骤:

步骤S101,获取题库中待处理的试题。

在本发明实施例中,所述题库中待处理的试题是指题库中包含图片或者本身就是图片的试题。题库中存储试题后,通常是根据试题的文字信息创建索引信息,在创建该试题的索引信息时,往往不能根据试题图片中的内容创建索引信息,尤其是试题本身就是图片时。所以需要对题库中含有图片或者本身就是图片的试题进一步处理,以便于能够根据试题本身的信息创建索引信息。

步骤S102,将所述待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息。

在本发明实施例中,当终端用户有搜题请求时,所述搜题请求信息中携带的试题通常是拍照或者截屏得到的图片格式的试题,图片经过ORC(Optical Character Recognition,光学字符识别)识别为文字信息,所述ORC识别技术是将图片、照片中的文字内容,直接转换为可编辑的文字信息,根据ORC识别后的文字信息搜索该试题的解题思路和答案。所以在创建索引信息时也需要根据试题的文字信息创建索引信息。由于待处理的试题中包含图片或者试题本身就是图片,所以需要将试题中包含的图片经过ORC识别技术识别为文字信息。所述识别处理后的试题信息不再包含图片,而是由该试题原有的图片识别处理后的文字信息和原有的文字信息组成。

步骤S103,根据识别处理后的试题信息创建该试题的索引信息。

在本发明实施例中,所述索引信息相当于题库中试题的目录,可以根据目录快速找到所需搜索的试题信息。在实际搜索过程中,可以将题库中的试题与待搜索的试题一条一条比对,直到搜索到需要的试题信息;也可以为题库中的试题创建索引信息,先在索引信息中找到符合搜索条件的索引信息,然后通过索引信息指向的试题信息,查找到题库中对应的试题信息。在创建索引信息时,可以根据题库中识别处理后的试题信息中的文字信息提取关键词,将提取的关键词作为索引信息的内容。

本发明实施例获取题库中待处理的试题;将所述待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息;根据识别处理后的试题信息创建该试题的索引信息。由于将题库中含有图片的试题识别为文字信息后,根据识别后的文字信息创建索引信息,在用户搜题时,会将用户拍照的试题全部识别为文字信息,所以发出的搜题信息能够与题库中该试题的索引信息相对应,能够解决学生搜索含有图片的试题或者本身就是图片的试题时无法搜到,搜题效率低的问题。

实施例二:

参见图2,是本发明实施例二提供的图片试题的处理方法的示意流程图,如图2所示该方法可以包括以下步骤:

步骤S201,获取题库中待处理的试题。

该步骤与步骤S101相同,具体可参见步骤S101的相关描述,在此不再赘述。

步骤S202,将所述待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息。

可选的,所述将所述待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息包括:

获取所述待处理的试题中的图片以及所述图片在该试题中的位置信息;

将获取的图片识别为文字信息;

清除试题中的图片,并将识别返回的文字信息插入试题中图片所在的位置。

在本发明实施例中,所述图片在该试题中的位置信息是指试题中如果有图片也有文字信息,记录图片信息相对文字信息的位置关系。如果试题本身就是图片,不再记录图片在该试题中的位置信息,设置为图片位置即是试题的起始位置。将获取的图片经过ORC识别为文字信息,所述识别过程为空间识别方法,所述空间识别方法是图片中的文字信息在图片中的哪个位置,则相应识别后的文字依然保持在哪个位置。将图片识别为文字信息后,清除试题中的图片,并将识别返回的文字信息根据记录的图片信息相对文字信息的位置关系插入试题中,所得到的处理后的试题能够最大程度反应原试题的内容,避免了分段、换行等造成的位置错乱,或者试题中的数学公式带有上下角标造成的位置错乱,保证索引信息创建时能够按照试题的内容创建索引信息。

步骤S203,根据识别后的试题信息创建该试题的索引信息。

可选的,所述根据识别处理后的试题信息创建该试题的索引信息包括:

将识别处理前的试题信息和识别处理后的试题信息存入题库试题表中的相应字段中;

根据试题表中试题的相应字段创建该试题的索引信息。

在本发明实施例中,题库中的试题以试题表的形式存储在题库中,试题表包含多个字段,每个字段存储相应的内容,将识别处理前的试题信息和识别处理后的试题信息经过解析获取试题表中相应字段的内容并存储在题库试题表中的相应字段中,试题的索引信息创建过程并不是根据试题本身的内容创建索引信息,而是根据经过解析获得的试题表中相应字段的内容创建索引信息。所述索引信息可以根据试题表中一个字段或者多个字段创建。

所述试题表的相应字段包括试题标号、识别处理后的试题、试题答案、试题解析、识别处理前的试题。

在本发明实施例中,试题表的相应字段可以只包含上述所列举的字段中的一个或多个,也可以包括试题的分值、难度值、科目等信息,在此不做限制。

具体的,虽然试题表的相应字段包含了试题的相关信息,但是创建索引信息时可以只选取对搜索速度和搜索准确度有帮助的相应字段。例如一道试题,创建索引信息时,可以只根据识别处理后的试题创建索引信息,还可以根据试题答案和识别后的试题信息创建索引信息,这是因为有可能试题题干变换了说法,但是实际试题的答案和解题思路没变。在创建索引信息时,对搜索速度和搜索准确度没有帮助的字段可以不创建索引信息,例如,试题标号信息等。

步骤S204,接收终端用户发出的搜题请求信息。

在本发明实施例中,将题库中的含有图片的试题识别为文字信息再创建索引信息的目的是为了提高搜题的速度以及搜题的正确率。所述搜题请求信息包含终端用户通过终端设备拍照或者截屏等获得的试题,获得的试题本身就变成图片格式。需要说明的是,所述搜题请求信息中包含的试题信息可以是用户通过终端设备拍照或截屏获得的,还可以是通过其它接收装置获得的试题图片,比如存储卡,通信接口等获得的试题图像。

步骤S205,将接收的搜题请求信息中的试题识别为文字信息;

在本发明实施例中,所述搜题请求信息中包含的试题是经过拍照或者截图处理的图片信息,由于题库中试题的索引信息是根据文字信息创建的,所以在检索之前先将搜题请求信息中的图片试题识别为文字信息,再跟题库中存储的试题的索引信息匹配搜索。匹配搜索前将图片试题识别为文字信息的过程与在题库中创建试题的索引信息时将图片识别为文字信息的过程一致,都采用空间识别方法,这样就可以保证试题中图片在经过识别后得到的文字信息能够跟题库中图片识别的文字信息保持高度匹配。

步骤S206,根据所述文字信息,从题库中搜索与所述文字信息相关的试题信息,并将搜索到的试题信息反馈终端用户。

在本发明实施例中,可以根据步骤S205中识别后的文字信息生成与该试题内容相关的关键字,根据所述关键字从题库中匹配搜索与所述关键字相关的试题信息。由于用户拍照过程可能会出现获得的试题的图片不清晰,在将试题的图片识别为文字信息时会对识别结果造成影响,此时可以设定匹配阈值,若检索到的索引信息与搜题时该试题经过识别后的文字信息或关键字的匹配结果大于设定的匹配阈值,则该索引信息对应的试题就是所述终端用户搜索的试题,将该索引信息对应的试题的答案和解题思路反馈终端用户;若检索到的索引信息与搜题时该试题经过识别后的文字信息或关键字的匹配结果小于等于设定的匹配阈值,则将题库中匹配度前几名的索引信息对应的试题的答案和解题思路反馈终端用户,这样一次性反馈多个试题结果,供终端用户选择。

应理解,在上述实施例中,各步骤的序号的大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

实施例三:

参见图3,图3是本发明实施例三提供的图片试题的处理装置的示意框图,为了便于说明,仅示出与本发明实施例相关的部分。

该图片试题的处理装置可以是内置于终端(例如手机、平板电脑、笔记本、计算机等)内的软件单元、硬件单元或者软硬结合的单元,也可以作为独立的挂件集成到所述终端中。

所述图片试题的处理装置包括:

获取模31块,用于获取题库中待处理的试题;

第一识别模块32,用于将所述获取模块31获取的待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息;

索引信息创建模块33,用于根据所述第一识别模块32识别处理后的试题信息创建该试题的索引信息。

可选的,所述第一识别模块32包括:

获取单元321,用于获取所述待处理的试题中的图片以及所述图片在该试题中的位置信息;

识别单元322,用于将获取单元321获取的图片识别为文字信息;

处理单元323,用于清除试题中的图片,并将识别单元322识别返回的文字信息插入试题中图片所在的位置。

可选的,所述索引信息创建模块33包括:

试题字段生成单元331,用于将识别处理前的试题信息和识别处理后的试题信息存入题库试题表的相应字段中。

索引信息创建单元332,根据试题字段生成单元331得到的试题表中试题的相应字段创建该试题的索引信息。

可选的,所述试题表的相应字段包括试题标号、识别处理后的试题、试题答案、试题解析、识别处理前的试题。

可选的,所述装置还包括:

搜题请求信息接收模块,用于接收终端用户发出的搜题请求信息;

第二识别模块,用于将搜题请求信息接收模块接收的搜题请求信息中的试题识别为文字信息;

搜索模块,用于根据所述第二识别模块识别的文字信息,从题库中搜索与所述文字信息相关的试题信息,并将搜索到的试题信息反馈终端用户。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即所述系统的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元或模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元或模块既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例的对应过程,在此不再赘述。

实施例四:

参见图4,图4是本发明实施例四提供的图片试题的处理装置的示意框图。如图所示的该图片试题的处理装置可以包括:一个或多个处理器401(图中仅示出一个);一个或多个输入设备402(图中仅示出一个),一个或多个输出设备403(图中仅示出一个)和存储器404。上述处理器401、输入设备402、输出设备403和存储器404通过总线405连接。存储器404用于存储指令,处理器401用于执行存储器404存储的指令。其中:

所述处理器401,用于通过输入设备402获取题库中待处理的试题;所述处理器401还用于将所述待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息;所述处理器401还用于根据识别处理后的试题信息创建该试题的索引信息。

可选的,所述处理器401用于通过输入设备402获取所述待处理的试题中的图片以及所述图片在该试题中的位置信息;所述处理器401还用于将获取的图片识别为文字信息;所述处理器401还用于清除试题中的图片,并通过输出设备403将识别返回的文字信息插入试题中图片所在的位置。

可选的,所述处理器401用于将识别处理前的试题信息和识别处理后的试题信息存入题库试题表中的相应字段中;所述处理器401还用于根据试题表中试题的相应字段创建该试题的索引信息。

可选的,所述试题表的相应字段包括试题标号、识别处理后的试题、试题答案、试题解析、识别处理前的试题。

可选的,所述处理器401用于通过输入设备402接收终端用户发出的的搜题请求信息;所述处理器401还用于将接收到的搜题请求信息中的试题识别为文字信息;所述处理器401还用于根据所述文字信息,从题库中搜索与所述文字信息相关的试题信息,并通过输出设备403将搜索到的试题信息反馈终端用户。

所述存储器404,用于存储软件程序、模块和所述图片试题的处理方法中用到的数据信息,所述处理器401通过运行存储在所述存储器404的软件程序以及单元,从而执行各种功能应用以及数据处理,实现提高搜题效率的功能。

应当理解,在本发明实施例中,所称处理器401可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

输入设备402可以包括触控板、指纹采传感器(用于采集用户的指纹信息和指纹的方向信息)、麦克风、摄像装置、数据接收装置等,输出设备403可以包括显示器(LCD等)、扬声器等。

该存储器404可以包括只读存储器和随机存取存储器,并向处理器401提供指令和数据。存储器404的一部分还可以包括非易失性随机存取存储器。例如,存储器404还可以存储设备类型的信息。

具体实现中,本发明实施例中所描述的处理器401、输入设备402、输出设备403和存储器404可执行本发明实施例提供的图片试题的处理方法的实施例中所描述的实现方式,也可执行图片试题的处理装置的实施例中所描述的实现方式,在此不再赘述。

综上所述,本发明实施例获取题库中待处理的试题;将所述待处理的试题中的图片识别为文字信息,得到识别处理后的试题信息;根据识别处理后的试题信息创建该试题的索引信息。由于将题库中含有图片的试题识别为文字信息后,根据识别后的文字信息创建索引信息,在用户搜题时,会将用户拍照的试题全部识别为文字信息,所以发出的搜题信息能够与题库中该试题的索引信息相对应,能够解决学生搜索含有图片的试题时无法搜到相应的试题,搜题效率低的问题。本发明实施例操作方便、实现简单,对硬件的要求低,从而有利降低产品成本,使产品适用面更广,具有较强的易用性和实用性。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1