图片处理方法及装置的制作方法

文档序号:6375255阅读:112来源:国知局
专利名称:图片处理方法及装置的制作方法
技术领域
本发明涉及图片处理技术领域,尤其涉及一种图片处理方法及装置。
背景技术
随着电子技术的发展,人们可以通过各种随身携带的拍照装置来拍照记录想保留的影像。比如在展会、演讲和课堂等商务应用和教学场合,演讲者通常借助幻灯片来辅助演讲。很多听众使用有拍照功能的手机、移动终端和数码相机来记录幻灯片上的内容。在获得一系列的照片之后,用户需要将所有照片拷贝到电脑,然后创建一个幻灯片文件,将这些照片一幅一幅的拷贝到对应的页上,然后对照片进行剪裁,使得照片适合版面显示。或者用
户没有时间,需要回看记录内容的时候将图片一幅幅的打开,文件管理凌乱。现有的对照片的解决办法处理步骤复杂,需要PC辅助、人工对每一幅图片进行剪裁和粘贴。这样处理效率低、耗时长,因为每一页内容都是图片最后的文件大。还有一个重要的问题就是因为拍照的视角往往不是和图片垂直,造成播放幻灯片的矩形屏幕拍出来后变成了梯形或不规则四边形,影响视觉效果。综上可知,现有的图片处理技术,在实际使用上显然存在不便与缺陷,所以有必要加以改进。

发明内容
针对上述的缺陷,本发明的目的在于提供一种图片处理方法及装置,可以方便的对发生变形的图片进行校正,使还原之后的图片和真实显示的内容有更好的一致性。为了实现上述目的,本发明提供一种图片处理方法,所述方法包括对选择的图片裁剪处理;将裁剪处理后的图片进行梯形校正;将所述梯形校正后的图片进行光学字符识别处理。根据本发明的图片处理方法,所述对选择的图片裁剪处理步骤包括自动识别所述图片的裁剪内容区域;和/或手动选择所述图片的裁剪内容区域。根据本发明的图片处理方法,所述裁剪内容区域为四边形,所述四边形内容区域包括若干像素单元,所述将裁剪处理后的图片进行梯形校正步骤包括构造一可以包括所述四边形裁剪内容区域的矩形,使所述四边形的至少三个顶点位于所述矩形的边上;将所述四边形的四边分别映射到所述矩形的四边;根据所述四边形到矩形的映射关系,将每个像素单元按照其所在行和/或列的映射比例,分别在水平和/或垂直方向上进行缩放。根据本发明的图片处理方法,所述对选择的图片裁剪处理步骤之前还包括选择包括若干图片的图片组;
所述将所述梯形校正后的图片进行光学字符识别处理步骤之后还包括将所述图片组的图片合成为幻灯片文档。根据本发明的图片处理方法,所述图片组的若干图片是通过拍照装置拍照获取的若干照片,所述若干照片按拍照的时间顺序排列合成为所述幻灯片文档。本发明还相应的提供一种图片处理装置,包括裁剪处理模块,用于对选择的图片裁剪处理;图片校正模块,用于将所述裁剪处理后的图片进行梯形校正;光学字符识别模块,用于将所述梯形校正后的图片进行光学字符识别处理。根据本发明的图片处理装置,所述裁剪处理模块包括识别子模块,用于自动识别所述图片的裁剪内容区域;区域选择子模块,用于手动选择所述图片的裁剪内容区域。根据本发明的图片处理装置,所述裁剪内容区域为四边形,所述四边形内容区域包括若干像素单元,所述图片校正模块包括构造子模块,用于构造一可以包括所述四边形裁剪内容区域的矩形,使所述四边形的至少三个顶点位于所述矩形的边上;映射子模块,用于将所述四边形的四边分别映射到所述矩形的四边,并根据所述四边形到矩形的映射关系,将每个像素单元按照其所在行和/或列的映射比例,分别在水平和/或垂直方向上进行缩放。根据本发明的图片处理装置,所述图片处理装置还包括选择模块,用于选择包括若干图片的图片组;合成模块,用于将所述图片组的图片合成为幻灯片文档。根据本发明的图片处理装置,所述图片组的若干图片是通过拍照装置拍照获取的若干照片,所述合成模块将所述若干照片按拍照的时间顺序排列合成为所述幻灯片文档。本发明通过对选择的图片进行裁剪处理,可以获得用户需要的图片内容区域,然后对裁剪处理后的图片进行梯形校正,使变形的图片进行还原处理,使还原之后的图片和真实显示的内容有更好的一致性。最后对图片进行光学字符识别处理,借此可以将原来的图片的内容转换为字符,减小占用空间。更好的,本发明可以对若干照片进行处理,并将处理后的照片合成为幻灯片文档,方便用户的浏览及查阅。


图I是本发明一实施例的图片处理装置的结构示意图;图2是本发明另一实施例的图片处理装置的结构示意图;图3A是本发明一实施例的图片的结构示意图;图3B是图3A所示图片的处理结构示意图;图3C是图3B所示图片的局部结构处理示意图;图3D是图3B所示图片的处理结构示意图;图3E是图3D所示图片的处理结构示意图;图3F是图3E所示图片的处理结构示意图;图4是本发明的图片处理方法的流程图。
具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。参见图1,本发明提供了一种图片处理装置,该装置100可以是内置于拍照设备的处理单元,也可以是一独立的装置,比如移动终端、电脑等,其用于对图片的处理、合成。具体的,图片处理装置100包括裁剪处理模块10、图片校正模块20和光学字符识别模块30,其中裁剪处理模块10,用于对选择的图片裁剪处理。实际应用中,用户通过拍照装置拍照的特定图片会因为视角原因出现变形,以幻灯片为例,假定用户通过拍照装置拍照的某幻灯片如图3A所示,该图示中阴影部分AciBciCciDci表示幻灯片屏幕,周围空白处为屏幕的外围影像。通过裁剪处理模块10可以将幻灯片屏幕部分裁剪出来单独处理,裁剪后的图片如图
3B所示,该图示中,A1B1C1D1为图片的总体框架,在该框架内除AciBciCciDci区域外的部分优选为纯背景色,借此方便图片的后续处理。图片校正模块20,用于将裁剪处理后的图片进行梯形校正。正常的幻灯片屏幕为矩形结构,图片校正模块20可以通过计算处理对组成AciBciCciDci区域的像素单元进行对应的缩放处理,参见图3C 图3F,借此使AciBciCciDci区域还原为矩形结构。光学字符识别模块30,用于将梯形校正后的图片进行0CR(0ptical CharacterRecognition,光学字符识别)处理。在得到形状校正的图片文件之后,光学字符识别模块30采用OCR技术对图片内容进行字符识别,如果内容是字符的,可以将原来的图片的内容转换为字符,字符转换功能可以自由选择,也可以针对一幅图中的某个部分进行识别。识别后用户可以修改识别的部分内容,借此适应部分字符识别错误的情况。再结合图2,该实施例中,装置100还包括选择模块40,用户通过拍照装置获取一组幻灯片的照片,并交由图片处理装置100后,用户通过选择模块40选择该组幻灯片照片作为处理对象。优选的,裁剪处理模块10包括识别子模块11和区域选择子模块12。其中,识别子模块11用于自动识别所述图片的裁剪内容区域,具体应用中,由于幻灯片屏幕和周围亮度的差异,图3A所示照片中方格背景部分AciBciCciDci是高亮度,周围的背景区域是低亮度的,背景部分图片中的内容也不发生变化,并且在该组中的每幅图片上都有近似的区域。识别子模块11根据对比度的变化和背景部分的统计特性,提取出每幅图片中的高亮/活动区域AciBciCciDci作为裁剪内容区域。区域选择子模块12,用于手动选择图片的裁剪内容区域。若图3A中的区域AciBciCciDci周围具有较强的干扰影像,则用户可以通过区域选择子模块12选择需要裁剪的内容区域。本实施例中,图片中包括的幻灯片内容区域为不规则四边形,其包括若干像素单元(每个小方格为一个像素单元)。图片校正模块20包括构造子模块21、映射子模块22和缩放子模块23,具体的构造子模块21用于构造一可以包括四边形裁剪内容区域的矩形,并使四边形的至少三个顶点位于构造的矩形边上,如图3A所示的A1B1C1D1,其中,A1的横坐标等于Atl和Dtl横坐标的最小值,A1的纵坐标等于Atl和Btl纵坐标的最大值成的横坐标等于Btl和Ctl横坐标的最大值,B1的纵坐标等于A0和Btl纵坐标的最大值K1的横坐标等于Btl和Ctl横坐标的最大值,C1的纵坐标等于Ctl和Dtl纵坐标的最小值!D1的横坐标等于A0和Dtl横坐标的最小值,D1的纵坐标等于Dtl和Ctl纵坐标的最小值,借此保证该矩形是能包含所述四边形区域的最小矩形。映射子模块22用于将四边形的四边分别映射到所述矩形的四边。经过构造子模块21获取到矩形A1B1C1D1后,映射子模块22首先进行水平梯形校正。结合图3B,水平梯形校正是将四边形AciBtlCA还原为在水平方向上的梯形,即让四边形的边AtlDtl平行BA。校正的过程是将边AciDcZBciCci调整到和A1D1ZiB1C1的位置重合。首先调整边AtlDtl,根据纵坐标和A1D1相比可以判断需要调整顶点Dtl,再做一条水平方向的直线DTCT,D0在DtCt上,DtCt和BtlCtl的交点为P点。结合图3C,接下来将Dtl映射到DT,按照等比例放大算法将线段DtlP映射到线段0#,然后将DciCtl按比例映射到DtCci,具体的映射过程是将DciCtl与每个像素单元的交汇点都映射到DtCci,比如将M点映射到M,点,并将水平线NM上的每个像素单元在水平方向上按
等比例线段映射到水平线NT,通过同样的映射方法可将所有的像素单元按照其所在行的映射比例,分别在水平方向上进行缩放,借此得到如图3D所示映射后的图形区域AtlB1CtlDp根据同样的算法,将Ctl点映射到C1点,各像素单元也进行同样的缩放处理,得到图3E所示的梯形区域AciB1C1Dt,借此完成水平梯形校正。水平梯形校正之后,对梯形AciB1C1Dt进行垂直方向上的校正。根据相同的算法,分别完成Atl到ApB1Atl到B1A1UciB1C1Dt到A1B1C1Dt之间在点、线、面上的映射,完成Dt到D1^1Dt到C1D1^A1B1C1Dt到A1B1C1D1之间在点、线、面上的映射,映射过程中同时将各像素单元按照其所在列的映射比例,分别在垂直方向上进行缩放,完成后即可得到图3F所示的矩形图片。本发明在完成图片校正之后,原有图片文件中像素位置发生改变,可采取插值算法计算出像素所在位置的点的色彩值,得到梯形校正后的图片文件。该实施例中,图片处理装置100还包括一合成模块50,通过该合成模块50可将处理后图片组合成为幻灯片文档,供用户浏览使用。优选的,合成模块50按各图片拍照的时间顺序排列合成为幻灯片文档,借此使幻灯片文档具有原始文档的排列顺序,增加用户查阅的方便性。本发明能够让用户方便的通过手上的拍照装置拍照,并将所拍的一系列图片还原为一个幻灯片文件,适合商务人士参加展会、听报告和课堂记录。本发明的效率高,所得幻灯片不受拍摄角度的影响,且得到的文件占用空间较小,有利于存储。参见图4,本发明提供一种图片处理方法,其可以通过如图I或图2所示的图片处理装置100实现,该方法包括步骤S401,对选择的图片裁剪处理。具体的,用户选择待处理的图片后,即通过裁剪处理模块10对图片进行内容区域的裁剪。如果需要裁剪的内容区域与其周围的影响区别明显,则可以通过装置100自动识别出裁剪内容的区域进行裁剪处理,若裁剪的内容区域周围具有干扰影像,则用户可以手动选择裁剪内容区域。步骤S402,将裁剪处理后的图片进行梯形校正。本发明的应用中,裁剪内容区域通常四边形,且该四边形内容区域包括若干像素单元。对四边形区域进行校正时,图片校正模块20首先构造一可以包括所述四边形裁剪内容区域的矩形,并且使四边形的至少三个顶点位于所述矩形的边上,借此保证该矩形是可以包含以上区域的最小矩形。构造好上述矩形后,再将四边形的四边分别映射到所述矩形的四边,然后根据四边形到矩形的映射关系,将每个像素单元按照其所在行和/或列的映射比例,分别在水平和/或垂直方向上进行缩放,借此得到还原后的矩形相片。步骤S403,将所述梯形校正后的图片进行光学字符识别处理。在得到形状校正的图片文件之后,通过光学字符识别模块30采用OCR技术对图片内容进行字符识别,如果内容是字符的,可以将原来的图片的内容转换为字符,字符转换功能可以自由选择,还可以针对一幅图中的某个部分进行识别。识别后用户还可以修改识别的部分内容,可以适应部分字符识别错误的情况。更好的是,本发明的处理方法可以对一组图片分别进行处理,具体的可在步骤
S401之前通过选择模块40选择一组图片,该组图片优选是通过拍照装置拍照获取的若干照片,该组图片经前述步骤S403处理完毕后,可通过合成模块50将图片组的图片合成为幻灯片文档。且优选的,各照片按拍照的时间顺序排列合成,借此可还原为幻灯片的原始文档顺序,方便用户使用。更好的是,本发明不仅可以还原幻灯片文件,还可以用于单张图片的梯形校正,t匕如,用于名片识别和管理、翻拍图片和文件等功能。对于使用了动画效果的页面,可以在上述功能的基础上增加页面内容变化的判断,如果一幅图片是在上一张图片内容的基础上再增加一部分内容,可以判断该页面应用了动画效果,可以为图片中增添的部分设置一个显示效果。综上所述,本发明通过对选择的图片进行裁剪处理,可以获得用户需要的图片内容区域,然后对裁剪处理后的图片进行梯形校正,使变形的图片进行还原处理,使还原之后的图片和真实显示的内容有更好的一致性。最后对图片进行光学字符识别处理,借此可以将原来的图片的内容转换为字符,减小占用空间。更好的,本发明可以对若干照片进行处理,并将处理后的照片合成为幻灯片文档,方便用户的浏览及查阅。当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
权利要求
1.ー种图片处理方法,其特征在于,所述方法包括 对选择的图片裁剪处理; 将裁剪处理后的图片进行梯形校正; 将所述梯形校正后的图片进行光学字符识别处理。
2.根据权利要求I所述的图片处理方法,其特征在于,所述对选择的图片裁剪处理步骤包括 自动识别所述图片的裁剪内容区域;和/或 手动选择所述图片的裁剪内容区域。
3.根据权利要求2所述的图片处理方法,其特征在于,所述裁剪内容区域为四边形,所述四边形内容区域包括若干像素単元,所述将裁剪处理后的图片进行梯形校正步骤包括 构造一可以包括所述四边形裁剪内容区域的矩形,使所述四边形的至少三个顶点位于所述矩形的边上; 将所述四边形的四边分别映射到所述矩形的四边; 根据所述四边形到矩形的映射关系,将每个像素单元按照其所在行和/或列的映射比例,分别在水平和/或垂直方向上进行缩放。
4.根据权利要求I所述的图片处理方法,其特征在于,所述对选择的图片裁剪处理步骤之前还包括 选择包括若干图片的图片组; 所述将所述梯形校正后的图片进行光学字符识别处理步骤之后还包括 将所述图片组的图片合成为幻灯片文档。
5.根据权利要求4所述的图片处理方法,其特征在于,所述图片组的若干图片是通过拍照装置拍照获取的若干照片,所述若干照片按拍照的时间顺序排列合成为所述幻灯片文档。
6.ー种图片处理装置,其特征在于,包括 裁剪处理模块,用于对选择的图片裁剪处理; 图片校正模块,用于将所述裁剪处理后的图片进行梯形校正; 光学字符识别模块,用于将所述梯形校正后的图片进行光学字符识别处理。
7.根据权利要求6所述的图片处理装置,其特征在于,所述裁剪处理模块包括 识别子模块,用于自动识别所述图片的裁剪内容区域; 区域选择子模块,用于手动选择所述图片的裁剪内容区域。
8.根据权利要求7所述的图片处理装置,其特征在于,所述裁剪内容区域为四边形,所述四边形内容区域包括若干像素単元,所述图片校正模块包括 构造子模块,用于构造一可以包括所述四边形裁剪内容区域的矩形,使所述四边形的至少三个顶点位于所述矩形的边上; 映射子模块,用于将所述四边形的四边分别映射到所述矩形的四边,井根据所述四边形到矩形的映射关系,将每个像素单元按照其所在行和/或列的映射比例,分别在水平和/或垂直方向上进行缩放。
9.根据权利要求I所述的图片处理装置,其特征在于,所述图片处理装置还包括 选择模块,用于选择包括若干图片的图片组;合成模块,用于将所述图片组的图片合成为幻灯片文档。
10.根据权利要求9所述的图片处理装置,其特征在于,所述图片组的若干图片是通过拍照装置拍照获取的若干照片,所述合成模块将所述若干照片按拍照的时间顺序排列合成为所述幻灯片文档。
全文摘要
本发明适用于图片处理技术领域,提供了一种图片处理方法,所述方法包括对选择的图片裁剪处理;将裁剪处理后的图片进行梯形校正;将所述梯形校正后的图片进行光学字符识别处理。更好的,所述方法还包括选择包括若干图片的图片组;将所述图片组的图片处理合成为幻灯片文档。本发明还相应的提供一种实现上述方法的图片处理装置。借此,本发明可以更方便的对图片进行处理和校正,使还原之后的图片和真实显示的内容有更好的一致性。
文档编号G06K9/20GK102855482SQ20121029276
公开日2013年1月2日 申请日期2012年8月16日 优先权日2012年8月16日
发明者闫正航, 刘玉清, 郦伟强 申请人:东莞宇龙通信科技有限公司, 宇龙计算机通信科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1