搜题内容的调整方法及装置与流程

文档序号:12365632阅读:360来源:国知局
搜题内容的调整方法及装置与流程

本发明实施例属于搜题领域,尤其涉及一种搜题内容的调整方法及装置。



背景技术:

现在市面上有很多搜题类的教育产品,用户通过拍摄图片,上传图片至服务器,再由服务器识别图片的文字内容,根据识别的文字内容进行题目搜索,最后输出搜索结果。但由于用户在拍摄图片时,可能由于书本位置摆放不正或因操作拍摄设备不当而经常拍摄出倾斜或弯曲的图片,而服务器难以准确识别倾斜或弯曲的图片中的文字内容,因此,用户需要放弃已拍摄的图片,重新拍摄端正的图片,再上传拍摄的端正的图片,多次拍摄给用户带来了极大的不便。



技术实现要素:

本发明实施例提供了一种搜题内容的调整方法及装置,旨在解决现有方法在拍摄到倾斜的图片时,需要重新拍摄图片,从而给用户带来极大的不便的问题。

本发明实施例是这样实现的,一种搜题内容的调整方法,所述方法包括:

获取包含题目信息的图片;

判断所述图片的题目信息是否发生倾斜;

在所述图片的题目信息发生倾斜时,调整所述图片的题目信息,以使所述图片的题目信息保持端正;

识别调整后的图片的题目信息,并根据识别结果搜索题目。

本发明实施例的另一目的在于提供一种搜题内容的调整装置,所述装置包括:

图片获取单元,用于获取包含题目信息的图片;

题目信息倾斜判断单元,用于判断所述图片的题目信息是否发生倾斜;

题目信息调整单元,用于在所述图片的题目信息发生倾斜时,调整所述图片的题目信息,以使所述图片的题目信息保持端正;

题目信息识别单元,用于识别调整后的图片的题目信息,并根据识别结果搜索题目。

在本发明实施例中,由于调整倾斜的图片的题目信息后再识别,因此,无需用户再次拍摄端正的图片,减少了用户操作,从而加快了题目搜索速度以及提高了用户的良好体验。

附图说明

图1是本发明第一实施例提供的一种搜题内容的调整方法的流程图;

图2是本发明第二实施例提供的一种搜题内容的调整装置的结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例中,获取包含题目信息的图片,判断所述图片的题目信息是否发生倾斜,在所述图片的题目信息发生倾斜时,调整所述图片的题目信息,以使所述图片的题目信息保持端正,识别调整后的图片的题目信息,并根据识别结果搜索题目。

为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。

实施例一:

图1示出了本发明第一实施例提供的一种搜题内容的调整方法的流程图,详述如下:

步骤S11,获取包含题目信息的图片。

该步骤中,可通过摄像头拍摄题目信息,搜题装置(如移动终端)获取摄像头拍摄的包含题目信息的图片。其中,题目信息包括题目的文字内容和/或数字。

步骤S12,判断所述图片的题目信息是否发生倾斜。

其中,判断图片的题目信息是否发生倾斜有几种方法:

第一种:

A1、在所述图片的题目信息为文字或数字时,判断文字或数字所在的行对应的直线与预设的标准基线的角度是否不在预设的角度范围。其中,预设的标准基线通常与图像预览界面的横截面平行。

A2、在文字或数字所在的行对应的直线与预设的标准基线的角度不在预设的角度范围时,判定所述图片的题目信息发生倾斜。当文字或数字所在的行对应的直线与预设的标准基线的角度越大,题目信息的倾斜也越大。当然,若题目信息的倾斜不严重时,不会给题目信息的识别结果造成过大的影响。可选地,预设的角度范围大于0°且小于或等于15°。

A3、在文字或数字所在的行对应的直线与预设的标准基线的角度在预设的角度范围时,判定所述图片的题目信息没有发生倾斜。

当文字或数字所在的行对应的直线与预设的标准基线的角度为0时,表明文字或数字所在的行对应的直线与预设的标准基线是平行的,此时,图片的题目信息完全没有发生倾斜。

第二种:

B1、在图片的题目信息包含至少3行文字时,统计每行包括的文字数量。

B2、判断相邻两行包括的文字数量的差是否在预设的差值范围。其中,预设的差值范围为0到1个字符。

B3、在存在相邻两行包括的文字数量的差在预设的差值范围时,判定所述图片的题目信息没有发生倾斜。具体地,只要存在任意相邻两行包括的文字数量的差在预设的差值范围时,判定所述图片的题目信息没有发生倾斜。由于在题目信息没有倾斜时,该题目信息对应的每一行文字信息占用的图片空间是相同的(例如用矩形框框选题目信息),因此,图片中相邻两行包括的文字数量应该大致相等。

B4、在不存在相邻两行包括的文字数量的差不在预设的差值范围时,判定所述图片的题目信息发生倾斜。

由于题目信息在最后一行包含的文字数量是最少的,因此,只要存在相邻两行包括的文字数量的差在预设的差值范围,就判定所述图片的题目信息没有发生倾斜。

第三种:

C1、判断所述图片的题目信息中同一行的首文字和尾文字是否均存在缺失部分。这里的首文字是指一行文字中的第一个文字,尾文字是指一行文字中的最后一个文字。

C2、在所述图片的题目信息中同一行的首文字和尾文字均存在缺失部分时,判断首文字的缺失部分在所述首文字的方位与尾文字的缺失部分在所述尾文字的方位是否相反。其中,相反的方位包括:上和下;左上方和右下方;左下方和右上方等。该步骤中,当图片的题目信息是倾斜时,例如,每一行的首文字是在图片的左下方,而同一行的尾文字是在图片的右上方,则由于框选题目信息的通常为矩形框,则该矩形框框选的题目信息中,可能使得同一行的首文字缺失首文字的左上方,而使得同一行的尾文字缺失尾文字的右下方。

C3、在首文字的缺失部分在所述首文字的方位与尾文字的缺失部分在所述尾文字的方位相反时,判定所述图片的题目信息发生倾斜,否则,判定所述图片的题目信息没有发生倾斜。

进一步地,由于图片的题目信息在没有发生倾斜时,其也可能为倒置的题目信息,因此,为了便于后续能够准确识别图片的题目信息,在所述判定所述图片的题目信息没有发生倾斜之后,包括:

D1、识别所述图片的部分题目信息。为了快速判断出题目信息是否发生倒置,则仅识别部分题目信息。例如,识别图片的题目信息中的一个或2个文字。

D2、在不能识别所述图片的部分题目信息时,调整图片的题目信息,以使调整后的题目信息与调整前的题目信息的夹角为180°。当不能识别选择出的图片的部分题目信息时,表明图片的题目信息可能发生了倒置,此时,调整图片的题目信息,使调整后的题目信息与调整前的题目信息的夹角为180°。

D3、识别调整后的图片的题目信息,并根据识别结果搜索题目。

步骤S13,在所述图片的题目信息发生倾斜时,调整所述图片的题目信息,以使所述图片的题目信息保持端正。

步骤S14,识别调整后的图片的题目信息,并根据识别结果搜索题目。

进一步地,输出搜索结果。

本发明第一实施例中,获取包含题目信息的图片,判断所述图片的题目信息是否发生倾斜,在所述图片的题目信息发生倾斜时,调整所述图片的题目信息,以使所述图片的题目信息保持端正,识别调整后的图片的题目信息,并根据识别结果搜索题目。由于调整倾斜的图片的题目信息后再识别,因此,无需用户再次拍摄端正的图片,减少了用户操作,从而加快了题目搜索速度以及提高了用户的良好体验。

应理解,在本发明实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

实施例二:

图2示出了本发明第二实施例提供的一种搜题内容的调整装置的结构图,该搜题内容的调整装置可应用于各种移动终端中,该移动终端可以包括经无线接入网RAN与一个或多个核心网进行通信的用户设备,该用户设备可以是移动电话(或称为“蜂窝”电话)、具有移动设备的计算机等,例如,用户设备还可以是便携式、袖珍式、手持式、计算机内置的或者车载的移动装置,它们与无线接入网交换语音和/或数据。又例如,该移动设备可以包括智能手机、平板电脑、个人数字助理PDA、销售终端POS或车载电脑等。为了便于说明,仅示出了与本发明实施例相关的部分。

该搜题内容的调整装置包括:图片获取单元21、题目信息倾斜判断单元22、题目信息调整单元23、题目信息识别单元24。其中:

图片获取单元21,用于获取包含题目信息的图片。

其中,题目信息包括题目的文字内容和/或数字。

题目信息倾斜判断单元22,用于判断所述图片的题目信息是否发生倾斜。

其中,判断图片的题目信息是否发生倾斜有几种方法:

第一种:

所述题目信息倾斜判断单元22包括:

直线与标准基线的角度判断模块,用于在所述图片的题目信息为文字或数字时,判断文字或数字所在的行对应的直线与预设的标准基线的角度是否不在预设的角度范围。其中,预设的标准基线通常与图像预览界面的横截面平行。

第一题目信息倾斜判定模块,用于在文字或数字所在的行对应的直线与预设的标准基线的角度不在预设的角度范围时,判定所述图片的题目信息发生倾斜。当文字或数字所在的行对应的直线与预设的标准基线的角度越大,题目信息的倾斜也越大。当然,若题目信息的倾斜不严重时,不会给题目信息的识别结果造成过大的影响。可选地,预设的角度范围大于0°且小于或等于15°。

第一题目信息没有倾斜判定模块,用于在文字或数字所在的行对应的直线与预设的标准基线的角度在预设的角度范围时,判定所述图片的题目信息没有发生倾斜。

当文字或数字所在的行对应的直线与预设的标准基线的角度为0时,表明文字或数字所在的行对应的直线与预设的标准基线是平行的,此时,图片的题目信息完全没有发生倾斜。

第二种,所述题目信息倾斜判断单元22包括:

文字数量统计模块,用于在图片的题目信息包含至少3行文字时,统计每行包括的文字数量。

文字数量比较模块,用于判断相邻两行包括的文字数量的差是否在预设的差值范围。其中,预设的差值范围为0到1个字符。

第二题目信息倾斜判定模块,用于在存在相邻两行包括的文字数量的差在预设的差值范围时,判定所述图片的题目信息没有发生倾斜。具体地,只要存在任意相邻两行包括的文字数量的差在预设的差值范围时,判定所述图片的题目信息没有发生倾斜。由于在题目信息没有倾斜时,该题目信息对应的每一行文字信息占用的图片空间是相同的(例如用矩形框框选题目信息),因此,图片中相邻两行包括的文字数量应该大致相等。

第二题目信息没有倾斜判定模块,用于在不存在相邻两行包括的文字数量的差不在预设的差值范围时,判定所述图片的题目信息发生倾斜。

由于题目信息在最后一行包含的文字数量是最少的,因此,只要存在相邻两行包括的文字数量的差在预设的差值范围,就判定所述图片的题目信息没有发生倾斜。

第三种,所述题目信息倾斜判断单元22包括:

文字缺失部分判断模块,用于判断所述图片的题目信息中同一行的首文字和尾文字是否均存在缺失部分。这里的首文字是指一行文字中的第一个文字,尾文字是指一行文字中的最后一个文字。

第三题目信息倾斜判定模块,用于在所述图片的题目信息中同一行的首文字和尾文字均存在缺失部分时,判断首文字的缺失部分在所述首文字的方位与尾文字的缺失部分在所述尾文字的方位是否相反。其中,相反的方位包括:上和下;左上方和右下方;左下方和右上方等。该步骤中,当图片的题目信息是倾斜时,例如,每一行的首文字是在图片的左下方,而同一行的尾文字是在图片的右上方,则由于框选题目信息的通常为矩形框,则该矩形框框选的题目信息中,可能使得同一行的首文字缺失首文字的左上方,而使得同一行的尾文字缺失尾文字的右下方。

第三题目信息没有倾斜判定模块,用于在首文字的缺失部分在所述首文字的方位与尾文字的缺失部分在所述尾文字的方位相反时,判定所述图片的题目信息发生倾斜,否则,判定所述图片的题目信息没有发生倾斜。

进一步地,由于图片的题目信息在没有发生倾斜时,其也可能为倒置的题目信息,因此,为了便于后续能够准确识别图片的题目信息,此时,所述搜题内容的调整装置包括:

部分题目信息识别单元,用于识别所述图片的部分题目信息。为了快速判断出题目信息是否发生倒置,则仅识别部分题目信息。例如,识别图片的题目信息中的一个或2个文字。

图片的题目信息调整单元,用于在不能识别所述图片的部分题目信息时,调整图片的题目信息,以使调整后的题目信息与调整前的题目信息的夹角为180°。

题目搜索单元,用于识别调整后的图片的题目信息,并根据识别结果搜索题目。

题目信息调整单元23,用于在所述图片的题目信息发生倾斜时,调整所述图片的题目信息,以使所述图片的题目信息保持端正。

题目信息识别单元24,用于识别调整后的图片的题目信息,并根据识别结果搜索题目。

进一步地,输出搜索结果。

本发明第二实施例中,由于调整倾斜的图片的题目信息后再识别,因此,无需用户再次拍摄端正的图片,减少了用户操作,从而加快了题目搜索速度以及提高了用户的良好体验。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1