一种拍照搜题方法、搜题装置及终端设备与流程

文档序号:14953287发布日期:2018-07-17 23:02阅读:484来源:国知局

本发明属于图像识别技术领域,尤其涉及一种拍照搜题方法、搜题装置及终端设备。



背景技术:

目前市场上有很多搜题类应用,如小猿搜题、作业帮等,这类应用下载至移动终端后,将题目上传即可呈现答案。而相比于手动输入题目后再进行搜索,拍照上传题目的方式更加简单快捷。

但是由于用户使用移动终端对题目拍照时,无法长时间保持移动终端处于平稳状态,即拍题时常常出现拍照抖动的情况,导致拍摄图像不清晰,从而降低了搜题的效率和准确率。



技术实现要素:

有鉴于此,本发明实施例提供了一种拍照搜题方法、搜题装置及终端设备,以解决现有技术中拍照搜题时出现拍照抖动,导致拍摄图像不清晰,降低了搜题的效率和准确率的问题。

本发明实施例的第一方面提供了一种拍照搜题方法,包括:

获取拍摄装置的拍摄界面相对于被摄物体的倾斜角度;

当倾斜角度小于阈值时,对被摄物体进行对焦,并在对焦成功后,开始动态拍摄;

在接收到预定指令后,停止动态拍摄,并获取动态拍摄中的间隔预设帧数的图像;

计算间隔预设帧数的图像的清晰度,并对比清晰度,选择清晰度最大的图像;

识别清晰度最大的图像中的内容,并将识别的内容上传至服务器进行试题匹配;

接收并显示服务器反馈的与本次匹配到的试题对应的解题结果。

本发明实施例的第二方面提供了一种搜题装置,包括拍摄装置,还包括:

角度获取模块,用于获取拍摄装置的拍摄界面相对于被摄物体的倾斜角度;

判断模块,用于当倾斜角度小于阈值时,对被摄物体进行对焦,并在对焦成功后,开始动态拍摄;

图像获取模块,用于在接收到预定指令后,停止动态拍摄,并获取动态拍摄中的间隔预设帧数的图像;

计算模块,用于计算间隔预设帧数的图像的清晰度,并对比清晰度,选择清晰度最大的图像;

识别模块,用于识别清晰度最大的图像中的内容,并将识别的内容上传至服务器进行试题匹配;

接收模块,用于接收并显示服务器反馈的与本次匹配到的试题对应的解题结果。

本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一项方法的步骤。

本发明实施例的第四方面提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述任一项方法的步骤。

本发明实施例与现有技术相比存在的有益效果是:本发明实施例提供了一种拍照搜题方法,根据拍摄装置的拍摄界面相对于被摄物体的倾斜角度,判断是否开启拍摄装置的对焦模式以及动态拍摄模式,筛选出动态拍摄模式中清晰度最大的图像从而获得最清晰的图像,避免了用户在拍照搜题的过程出现拍照抖动,导致拍摄图像不清晰的问题,提高了拍照搜题的效率和准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明第一实施例提供的拍照搜题方法的实现流程示意图;

图2是图1中步骤s106的实施方法的流程示意图;

图3是图1中步骤s106的另一实施方法的流程示意图;

图4是本发明第二实施例提供的搜题装置的结构示意图;

图5是本发明第三实施例提供的终端设备的示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

如在本说明书和所附权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地,短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

实施例一

图1示出了本发明第一实施例提供的拍照搜题方法的实现流程示意图。如图所示,一种拍照搜题方法,可以包括:

步骤s101:获取拍摄装置的拍摄界面相对于被摄物体的倾斜角度。

在上述步骤s101中,所述倾斜角度可以通过重力传感器获取。首先,通过重力传感器可以获得拍摄装置的拍摄界面相对于水平地面的倾斜角度。而被摄物体通常为作业题本,在本实施例中,作业题本被放置在水平面上,则此时重力传感器所获取到的倾斜角度即为拍摄装置的拍摄界面相对于被摄物体的倾斜角度。

可以理解的是,拍摄装置设置在移动终端上,而移动终端中可以设置有重力传感器。

步骤s102:当所述倾斜角度小于阈值时,对所述被摄物体进行对焦,并在对焦成功后,开始动态拍摄。

在上述步骤s102中,较佳的是,所述倾斜角度的阈值为5度,当所述倾斜角度小于5度时,使得拍摄装置对所述被摄物体进行对焦,并在对焦成功后,开始动态拍摄。

优选地,在对焦成功后,还可以以光投射点闪烁的方式提醒用户对焦成功;即提醒用户对焦成功后尽量保持拍摄装置的平稳,以便后续动态拍摄中获取到较为清晰的图像。

需要说明的是,所述动态拍摄是指拍摄连续的动态图像,也指在短时间可拍摄连续的图像。

步骤s103:在接收到预定指令后,停止所述动态拍摄,并获取所述动态拍摄中的间隔预设帧数的图像。

在上述步骤s103中,所述预定指定可以为用户下达的快门指令、或者在搜题应用中的拍题指令。

需要说明的是,所述间隔预设帧数的图像中的帧,是帧生成数量的简称,由于每一帧都是静止的图象,快速连续地显示帧便形成了运动的假象,因此高的帧率可以得到更流畅、更逼真的动画。如果一个动画的帧率恒定为60帧每秒,那么它在一秒钟内的帧数为60帧。

在本实施例中,较佳的是,设定所述预设帧数为60帧。在实际拍题过程中,假定拍摄装置每秒钟能够拍摄120帧的图像,而从对焦成功,开始动态拍摄到结束使用了5秒,即开始动态拍摄,到接收预定指令,结束动态拍摄的用时为5秒,如果所述预设帧数为60帧,那么每间隔60帧获取一次图像,在本次拍题过程中最终可以获取到,为时5秒的动态拍摄中的10张间隔帧数为60帧的图像。

可以理解的是,假如没有接收到预定指令,则继续获取拍摄装置的拍摄界面相对于被摄物体的倾斜角度,并在所述倾斜角度小于阈值时,对所述被摄物体进行对焦,对焦成功后,继续开始动态拍摄。

步骤s104:计算所述间隔预设帧数的图像的清晰度,并对比所述清晰度,选择清晰度最大的图像。

在上述步骤s104中,所述计算间隔预设帧数的图像的清晰度包括:

步骤s1041:将所述动态拍摄中间隔预设帧数的图像作为样本图像。

步骤s1042:通过梯度函数计算所述样本图像的清晰度。

需要说明的是,在上述步骤s1042中,计算所述样本图像的清晰度可以通过计算图像梯度获得。具体地,在图像处理中,图像梯度可以用来进行边缘提取,对焦越好,图像边缘越锋利,应该具有更大的图像梯度值,如图像灰度梯度能量函数、robert梯度和拉普拉斯算子等都属于梯度函数。这些甘薯可以通过现有的程序接口直接调用,输出清晰度的数值,数值越大,表示图像越清晰。

较佳的是,在本实施例中,选择通过拉普拉斯变换计算判定所述样本图像的清晰度。

步骤s105:识别所述清晰度最大的图像中的内容,并将识别的内容上传至服务器进行试题匹配。

在上述步骤s105中,所述识别所述清晰度最大的图像中的内包括:通过ocr(opticalcharacterrecognition,光学字符识别)识别所述清晰度最大的图像的内容。

步骤s106:接收并显示所述服务器反馈的与本次匹配到的试题对应的解题结果。

在上述步骤s106中,所述解题结果包括:解题过程和答案;

具体地,如图2所示:所述显示所述服务器反馈的与本次匹配到的试题对应的解题结果包括:

步骤s1061a:显示所述服务器反馈的与本次匹配到的试题对应的解题过程并使用预设的第一非透明蒙层遮挡所述解题过程。

步骤s1061b:显示所述服务器反馈的与本次匹配到的试题对应的答案并使用预设的第二非透明蒙层遮挡所述答案。

如图3所示:在显示所述服务器反馈的与本次匹配到的试题对应的解题结果之后,还包括:

步骤s1062a:当接收到第一蒙层消除指令时,在所述第一蒙层消除指令的指示下消除所述第一非透明蒙层;

步骤s1062b:当接收到第二蒙层消除指令时,在所述第二蒙层消除指令的指示下消除所述第二非透明蒙层。

在上述步骤s1061a、s1061b、s1062a和s1061b中,通过设置非透明蒙层遮挡所述解题过程和所述答案,扩展了拍照搜题方法的应用场景,使得拍照搜题不再局限于搜索答案,给用户提供了思考空间,增加了拍照搜题的实用性。

例如,用户可以根据需要,先核对题目的答案是否解答正确,即仅消除第二非透明蒙层,而不消除第一非透明蒙层。假如用户答案并不正确,并且选择继续做题,则通过不消除第一非透明蒙层从而不查阅解题过程;假如用户选择直接查阅解题过程,则可以通过消除第一非透明蒙层查阅解题过程。

在本实施例中,提供了一种拍照搜题方法,根据拍摄装置的拍摄界面相对于被摄物体的倾斜角度,选择开启拍摄装置的对焦模式以及动态拍摄模式,并筛选动态拍摄模式中清晰度最大的图像从而获得最清晰的图像,避免了用户在拍照搜题的过程出现拍照抖动,导致拍摄图像不清晰的问题,提高了拍照搜题的效率和准确率。同时,在接收到解题过程和答案后,还可以设置透明蒙层遮挡解题过程和答案,使得拍照搜题不仅仅用于查找答案,还能够根据用户需求选择是否显示解题过程和/或答案,提高了拍照搜题的实用性。

应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

实施例二

图4是本发明第二实施例提供的搜题装置的结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。

如图所示:一种搜题装置4,可以包括拍摄装置40(图中未示出),该搜题装置4可以是内置于拍摄装置40或者移动终端内的软件单元、硬件单元或者软硬结合的单元,也可以作为独立的挂件集成到所述拍摄装置4或移动终端中。所述搜题装置4还包括:

角度获取模块41,用于获取所述拍摄装置的拍摄界面相对于被摄物体的倾斜角度;

判断模块42,用于当所述倾斜角度小于阈值时,对所述被摄物体进行对焦,并在对焦成功后,开始动态拍摄;

在上述判断模块42中,对所述被摄物体进行对焦,对焦成功后,还包括:以光投射点闪烁的方式提醒用户对焦成功。

图像获取模块43,用于在接收到预定指令后,停止所述动态拍摄,并获取所述动态拍摄中的间隔预设帧数的图像;

在上述图像获取模块43中,所述计算间隔预设帧数的图像的清晰度包括:将所述动态拍摄中间隔预设帧数的图像作为样本图像;通过梯度函数计算所述样本图像的清晰度。

计算模块44,用于计算所述间隔预设帧数的图像的清晰度,并对比所述清晰度,选择清晰度最大的图像;

识别模块45,用于识别所述清晰度最大的图像中的内容,并将识别的内容上传至服务器进行试题匹配;

在上述识别模块45中,所述识别所述清晰度最大的图像中的内包括:通过ocrocr(opticalcharacterrecognition,光学字符识别)识别所述清晰度最大的图像的内容。

接收模块46,用于接收并显示所述服务器反馈的与本次匹配到的试题对应的解题结果。

在上述接收模块46中,所述接收模块所接收的解题结果包括:

解题过程和答案;

所述接收模块46显示解题结果具体包括:

第一显示单元461,用于显示所述服务器反馈的与本次匹配到的试题对应的解题过程并使用预设的第一非透明蒙层遮挡所述解题过程;

第二显示单元462,用于显示所述服务器反馈的与本次匹配到的试题对应的答案并使用预设的第二非透明蒙层遮挡所述答案;

在所述接收模块46显示解题结果之后,还包括:

第一消除单元463,用于当接收到第一蒙层消除指令时,在所述第一蒙层消除指令的指示下消除所述第一非透明蒙层;

第二消除单元464,用于当接收到第二蒙层消除指令时,在所述第二蒙层消除指令的指示下消除所述第二非透明蒙层。

在本实施例中,提供了一种搜题装置,包括拍摄装置,根据拍摄装置的拍摄界面相对于被摄物体的倾斜角度,选择开启拍摄装置的对焦模式以及动态拍摄模式,并筛选动态拍摄模式中清晰度最大的图像从而获得最清晰的图像,避免了用户在拍照搜题的过程出现拍照抖动,导致拍摄图像不清晰的问题,提高了拍照搜题的效率和准确率。同时,在接收到解题过程和答案后,还可以设置透明蒙层遮挡解题过程和答案,使得搜题装置不仅仅用于查找答案,还能够根据用户需求选择是否显示解题过程和/或答案,提高了搜题装置的实用性。

实施例三

图5是本发明第三实施例提供的一种终端设备的示意图。如图5所示,该实施例的终端设备5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52。所述处理器50执行所述计算机程序52时实现上述各个搜题方法实施例中的步骤,例如图1所示的步骤s101至s106。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示模块41至46的功能。

示例性的,所述计算机程序52可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端设备5中的执行过程。例如,所述计算机程序52可以被分割成角度获取模块41、判断模块42、图像获取模块43、计算模块44和识别模块45。

所述终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器50可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器51可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述**装置/终端设备所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1