图片的校正方法及装置的制造方法

文档序号:10553357阅读:367来源:国知局
图片的校正方法及装置的制造方法
【专利摘要】本发明适用于智能设备技术领域,提供了一种图片的校正方法及装置,所述校正方法包括:在拍照提问功能下,获取相机拍摄的图片;对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。本发明解决了图片方向倾斜的问题,进而降低了拍照提问功能中题目识别及截取的难度,提高了题目识别的准确度。
【专利说明】
图片的校正方法及装置
技术领域
[0001]本发明属于智能设备技术领域,尤其涉及一种图片的校正方法及装置。
【背景技术】
[0002]现有的拍照提问步骤包括:获取拍摄的图片一一从图片中截取题目一一上传题目一一搜索匹配题目一一反馈答案。然而,当用户拍摄的方向倾斜时,所述得到的图片也会倾斜,图片中的字符通常是没有平行于显示屏的上下边界的,对此类倾斜的图片进行题目识别及截取的难度大,题目识别的准确度低,有时候甚至无法识别出题目。

【发明内容】

[0003]鉴于此,本发明实施例提供一种图片的校正方法及装置,以解决现有拍照提问功能中图片方向倾斜的问题。
[0004]第一方面,提供了一种图片的校正方法,所述校正方法包括:
[0005]在拍照提问功能下,获取相机拍摄的图片;
[0006]对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。
[0007]第二方面,提供了一种图片的校正装置,所述校正装置包括:
[0008]获取模块,用于在拍照提问功能下,获取相机拍摄的图片;
[0009]校正模块,用于对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。
[0010]与现有技术相比,本发明实施例在拍照提问功能的拍照环节中增加了对拍摄得到的图片进行方向校正;通过在拍照提问功能下,获取相机拍摄的图片;对所述图片进行直线检测,然后根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上;从而解决了图片的方向倾斜的问题,使得校正后的图片中的字符平行于显示屏的上边界或下边界,进而降低了拍照提问功能中题目识别及截取的难度,提高了题目识别的准确度。
【附图说明】
[0011]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
[0012]图1是本发明实施例提供的图片的校正方法的实现流程图;
[0013]图2是本发明另一实施例提供的图片的校正方法的实现流程图;
[0014]图3是本发明另一实施例提供的图片的校正方法的实现流程图;
[0015]图4是本发明实施例提供的图片的校正装置的组成结构图。
【具体实施方式】
[0016]为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0017]本发明实施例在拍照提问功能的拍照环节中增加了对拍摄得到的图片进行方向校正;通过在拍照提问功能下,获取相机拍摄的图片;对所述图片进行直线检测,然后根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上;从而解决了图片的方向倾斜的问题,使得校正后的图片中的字符平行于显示屏的上边界或下边界,进而降低了拍照提问功能中题目识别及截取的难度,提高了题目识别的准确度。本发明实施例还提供了相应的装置,以下分别进行详细的说明。
[0018]图1示出了本发明实施例提供的图片的校正方法的实现流程。
[0019]在本发明实施例中,所述校正方法应用于智能设备,所述智能设备包括但不限于智能手机、平板电脑、计算机、家教机等。所述智能设备上设置有相机,能够进行拍摄并获取图片。
[0020]参阅图1,所述校正方法包括:
[0021]在步骤SlOl中,在拍照提问功能下,获取相机拍摄的图片。
[0022]本发明实施例在智能设备启动拍照提问功能时,启动相机以供用户拍摄待提问的题目。智能设备根据用户的操作进行拍摄,得到包含待提问的题目的图片。
[0023]在步骤S102中,对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。
[0024]在这里,待提问的题目中同一行的字符都是在同一直线上的。本发明实施例利用直线检测,拟合出所述图片中任意一行字符对应的直线。所述直线反应了该行字符的倾斜方向,即图片的倾斜方向;然后根据所述直线的倾斜方向来旋转图片,以校正图片的方向,使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上;从而解决了图片的方向倾斜的问题,使得校正后的图片中的字符为人眼视觉中的正方向,进而降低了拍照提问功能中题目识别及截取的难度,提高了题目识别的准确度。
[0025]作为本发明的一个优选实例,所述直线检测优选为霍夫直线检测。图2示出了本发明另一实施例提供的图片的校正方法的实现流程。
[0026]参阅图2,所述图片的校正方法包括:
[0027]在步骤S201中,在拍照提问功能下,获取相机拍摄的图片。
[0028]在步骤S202中,对所述图片进行变换,得到所述图片的频域图像。
[0029]在这里,所述变换为从时域到频域的变换,优选为傅里叶变换。本发明实施例通过对所述图片进行傅里叶变换,以分离实部和虚部,得到所述图片的频域图像。
[0030]在步骤S203中,对所述频域图像进行直线检测,得到经过所述图片中心的直线。
[0031]在这里,所述直线检测为霍夫直线检测。本发明实施例利用频域图像中的幅度数据,通过霍夫直线检测,拟合出所述图片中每行字符对应的直线,并选取经过图片中心的直线。所述直线反映了该行字符的倾斜方向,即图片的倾斜方向。
[0032]在步骤S204中,计算所述直线相对于显示屏下边界之间的倾斜角度。
[0033]在步骤S205中,按照所述倾斜角度旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。
[0034]在得到反映图片的倾斜方向的直线之后,计算所述直线相对于显示屏的下边界的倾斜角度,从而得到所述图片的倾斜角度。按照所述倾斜角度来旋转整个图片,以校正图片的方向,使得校正后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上,即图片中的字符方向为人眼视觉中的正方向,从而解决了图片倾斜的问题,进而降低了拍照提问功能中题目识别及截取的难度,提高了题目识别的准确度。
[0035]作为本发明的另一个优选示例,为了优化图片的显示效果,本发明实施例在进行傅里叶变换前,先对所述图片进行放大操作。示例性地,图3示出了本发明另一实施例提供的图片的校正方法的实现流程。
[0036]参阅图3,所述校正方法包括:
[0037]在步骤S301中,在拍照提问功能下,获取相机拍摄的图片。
[0038]在步骤S302中,放大所述图片。
[0039]在本发明实施例中,图片的放大尺寸与智能设备上的显示屏的显示区域对应。这里的放大是指在图片中增加像素点,并设置所述像素点的像素值为临近的像素点的像素值。通过放大图片,增加图片中的像素点,避免了像素过低时图片中存在的锯齿样,从而优化了图片的显示效果。
[0040]在步骤S303中,对所述图片进行变换,得到所述图片的频域图像。
[0041]在这里,所述变换为从时域到频域的变换,优选为傅里叶变换。本发明实施例通过对所述图片进行傅里叶变换,以分离实部和虚部,得到所述图片的频域图像。
[0042]在步骤S304中,对所述频域图像进行直线检测,得到经过所述图片中心的直线。
[0043]在这里,所述直线检测为霍夫直线检测。本发明实施例利用频域图像中的幅度数据,通过霍夫直线检测,拟合出所述图片中每行字符对应的直线,并选取经过图片中心的直线。所述直线反映了该行字符的倾斜方向,即图片的倾斜方向。
[0044]在步骤S305中,计算所述直线相对于显示屏下边界之间的倾斜角度。
[0045]在步骤S306中,按照所述倾斜角度旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。
[0046]作为本发明的另一个优选示例,在图1、图2和图3实施例所述的图片的校正方法中,在旋转所述图片后,所述校正方法还可以包括:
[0047]显示旋转后的所述图片。
[0048]本发明示例通过显示校正后的图片,使得用户能够对图片的校正效果进行预览,且方便了用户查验、确认所拍摄的待提问的题目。
[0049]需要说明的是,本发明上述实施例中所述的字符包括但不限于文字、字母或者数字。
[0050]综上所述,本发明实施例在拍照提问功能的拍照环节中增加了对拍摄得到的图片进行方向校正;通过在拍照提问功能下,获取相机拍摄的图片;对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上;从而解决了图片的方向倾斜的问题,使得校正后的图片中的字符平行于显示屏的上边界或下边界,进而降低了拍照提问功能中题目识别及截取的难度,提高了题目识别的准确度。
[0051]图4示出了本发明实施例提供的图片的校正装置的组成结构,为了便于说明,仅示出了与本发明实施例相关的部分。
[0052]在本发明实施例中,所述图片的校正装置用于实现上述图1或图2实施例中所述的图片的校正方法,可以是内置于智能设备的软件单元、硬件单元或者软硬件结合的单元。所述智能设备包括但不限于智能手机、平板电脑、计算机、家教机等。所述智能设备上设置有相机,能够进行拍摄并获取图片。
[°°53] 参阅图4,所述校正装置包括:
[0054]获取模块41,用于在拍照提问功能下,获取相机拍摄的图片;
[0055]校正模块42,用于对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。
[0056]进一步地,所述直线检测优选为霍夫直线检测,所述校正模块42包括:
[0057]变换单元421,用于对所述图片进行变换,得到所述图片的频域图像;
[0058]检测单元422,用于对所述频域图像进行直线检测,得到经过所述图片中心的直线;
[0059]计算单元423,用于计算所述直线相对于显示屏下边界之间的倾斜角度;
[0060]旋转单元424,用于按照所述倾斜角度旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。
[0061 ]在这里,所述变换为从时域到频域的变换,优选为傅里叶变换。
[0062]进一步地,所述变换模块还包括:
[0063]放大单元425,用于放大所述图片。
[0064]通过在对所述图片进行变换前放大所述图片,增加图片中的像素点,避免了像素过低时图片中存在的锯齿样,从而优化了图片的显示效果。
[0065]进一步地,所述校正装置还包括:
[0066]显示模块43,用于显示旋转后的所述图片。
[0067]本发明实施例通过显示校正后的图片,使得用户能够对图片的校正效果进行预览,且方便了用户查验、确认所拍摄的待提问的题目。
[0068]需要说明的是,本发明实施例所述的字符包括但不限于文字、字母或者数字。本实施例中的装置可以用于实现上述方法实施例中的全部技术方案,其各个功能模块的功能可以根据上述方法实施例中的方法具体实现,其具体实现过程可参照上述实例中的相关描述,此处不再赘述。
[0069]本发明实施例在拍照提问功能的拍照环节中增加了对拍摄得到的图片进行方向校正;通过在拍照提问功能下,获取相机拍摄的图片;对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上;从而解决了图片的方向倾斜的问题,使得校正后的图片中的字符平行于显示屏的上边界或下边界,进而降低了拍照提问功能中题目识别及截取的难度,提高了题目识别的准确度。
[0070]本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0071]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0072]在本申请所提供的几个实施例中,应该理解到,所揭露的图片的校正方法及装置,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块、单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0073]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0074]另外,在本发明各个实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元、模块单独物理存在,也可以两个或两个以上单元、模块集成在一个单元中。
[0075]所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(R0M,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0076]以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
【主权项】
1.一种图片的校正方法,其特征在于,所述校正方法包括: 在拍照提问功能下,获取相机拍摄的图片; 对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。2.如权利要求1所述的图片的校正方法,其特征在于,所述对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上包括: 对所述图片进行变换,得到所述图片的频域图像; 对所述频域图像进行直线检测,得到经过所述图片中心的直线; 计算所述直线相对于显示屏下边界之间的倾斜角度; 按照所述倾斜角度旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。3.如权利要求2所述的图片的校正方法,其特征在于,在对所述图片进行变换,得到所述图片的频域图像之前,所述校正方法还包括: 放大所述图片。4.如权利要求1至3任一项所述的图片的校正方法,其特征在于,所述校正方法还包括: 显示旋转后的所述图片。5.如权利要求1至3任一项所述的图片的校正方法,其特征在于,所述字符为文字、字母或者数字。6.—种图片的校正装置,其特征在于,所述校正装置包括: 获取模块,用于在拍照提问功能下,获取相机拍摄的图片; 校正模块,用于对所述图片进行直线检测,并根据直线检测结果旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。7.如权利要求6所述的图片的校正装置,其特征在于,所述校正模块包括: 变换单元,用于对所述图片进行变换,得到所述图片的频域图像; 检测单元,用于对所述频域图像进行直线检测,得到经过所述图片中心的直线; 计算单元,用于计算所述直线相对于显示屏下边界之间的倾斜角度; 旋转单元,用于按照所述倾斜角度旋转所述图片,以使得旋转后的图片中的字符平行于所述显示屏的上边界/下边界且所述字符的顶部朝向上。8.如权利要求7所述的图片的校正装置,其特征在于,所述变换模块还包括: 放大单元,用于放大所述图片。9.如权利要求6至8任一项所述的图片的校正装置,其特征在于,所述校正装置还包括: 显示模块,用于显示旋转后的所述图片。10.如权利要求6至8任一项所述的图片的校正装置,其特征在于,所述字符为文字、字母或者数字。
【文档编号】G06F17/30GK105913061SQ201610286127
【公开日】2016年8月31日
【申请日】2016年4月29日
【发明人】张樱
【申请人】广东小天才科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1