一种图片处理方法及装置与流程

文档序号：11432735阅读：183来源：国知局

【
技术领域：
：】本发明涉及图片处理
技术领域：
：，尤其涉及一种图片处理方法及装置。
背景技术：
：：在参加会议、课程或讲座时，主讲人往往会使用展示文档进行讲解，听众一般通过移动设备拍照功能对所需的展示文档内容进行采集，并生成对应的图片。然而，由于受到外界环境的限制，图片采集的效果一般不够理想。比如，由于听众的拍摄位置不是正对所需采集的文档区域，导致图片中文档区域角度发生倾斜；再比如，听众往往只需要图片中的文档区域内容即可，实际过程中，文档区域的周围环境也被同时采集，图片中文档区域的外部会存在部分背景区域。基于以上问题，移动设备通常需要对采集到的图片进一步处理，来得到仅包括文档区域的图片。现有技术中，移动设备在采集到图片后，用户需要手动选取所需处理区域，然后通过切割或裁剪的方式将所需处理区域提取出来，再手动进行拉伸以调整到所需的形状，上述图片处理过程自动化程度较低，另外通过手动的方式进行图片处理的准确度也较低，从而造成对图片的处理区域的还原度较差，影响其最终的展示效果。技术实现要素：有鉴于此，本发明实施例提供了一种图片处理方法及装置，用以解决现有技术的图片处理过程中对处理区域还原度较差的问题。一方面，本发明实施例提供了一种图片处理方法，包括：采集待处理图片中的第一图片区域；将所述第一图片区域调整为指定形状，生成第一图片；识别所述第一图片中的文字信息，将所述第一图片中的图片信息和文字信息保存为指定格式的文档。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述采集待处理图片中的第一图片区域，具体包括：根据处理图片中各像素点的亮度值，通过预设策略确定第一图片区域的各个边缘；根据各所述边缘采集第一图片区域；其中，所述第一图片区域为四边形。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述将所述第一图片区域调整为指定形状，生成第一图片，具体包括：获取所述第一图片区域的四个顶点坐标，计算出所述第一图片区域对应的矩形区域的长宽比；根据所述第一图片区域的四个顶点坐标和所述矩形区域的长宽比，计算出所述第一图片区域转换为矩形区域的变换方程；利用所述变换方程将所述第一图片区域调整为矩形区域，生成第一图片。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述方法还包括：响应于针对所述文字信息的操作指令，对所述文字信息进行修改。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述指定格式为演示文稿ppt格式。本发明实施例的图片处理方法，在采集待处理图片中的第一图片区域后，将其调整为指定形状以生成第一图片，然后识别第一图片中的文字信息，并将第一图片中的图片信息和文字信息保存为指定格式的文档。与现有技术相比，本发明技术方案能够自动采集图片中的相应区域并进行调整，无需手动采集与调整，提升了图片处理的准确度和自动化程度，对处理区域图片内容的还原度较高，同时还可以对图片中的文字信息进行识别，并将图片信息和文字信息保存为指定格式的文档，方便用户对文档中内容的阅读与编辑。另一方面，本发明实施例提供了一种图片处理装置，包括：采集模块，用于采集待处理图片中的第一图片区域；生成模块，用于将所述第一图片区域调整为指定形状，生成第一图片；处理模块，用于识别所述第一图片中的文字信息，将所述第一图片中的图片信息和文字信息保存为指定格式的文档。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述采集模块具体用于：根据处理图片中各像素点的亮度值，通过预设策略确定第一图片区域的各个边缘；根据各所述边缘采集第一图片区域；其中，所述第一图片区域为四边形。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述生成模块具体用于：获取所述第一图片区域的四个顶点坐标，计算出所述第一图片区域对应的矩形区域的长宽比；根据所述第一图片区域的四个顶点坐标和所述矩形区域的长宽比，计算出所述第一图片区域转换为矩形区域的变换方程；利用所述变换方程将所述第一图片区域调整为矩形区域，生成第一图片。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述装置还包括：修改模块，用于响应于针对所述文字信息的操作指令，对所述文字信息进行修改。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述指定格式为演示文稿ppt格式。上述技术方案中的一个技术方案具有如下有益效果：本发明实施例的图片处理装置，在采集待处理图片中的第一图片区域后，将其矫正调整为指定形状以生成第一图片，然后识别第一图片中的文字信息，并将第一图片中的图片信息和文字信息保存为指定格式的文档。与现有技术相比，本发明技术方案能够自动采集图片中的相应区域并进行矫正调整，无需手动采集与调整，提升了图片处理的准确度和自动化程度，对处理区域图片内容的还原度较高，同时还可以对识别图片中的文字信息进行识别，并将图片信息和文字信息保存为指定格式的文档，方便用户对的文档中内容的文字阅读与编辑。【附图说明】为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。图1是本发明实施例所提供的一种图片处理方法的流程示意图；图2是本发明实施例所提供的一种图片处理装置的功能方块图。【具体实施方式】为了更好的理解本发明的技术方案，下面结合附图对本发明实施例进行详细描述。应当明确，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。应当理解，本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，a和/或b，可以表示：单独存在a，同时存在a和b，单独存在b这三种情况。另外，本文中字符“/”，一般表示前后关联对象是一种“或”的关系。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地，取决于语境，短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。在本发明实施例中，用户可以使用移动终端作为扫描设备，对拍摄文档、证件、海报等所形成的图片进行采集和调整，同时对图片的边界进行优化，去除图片边界的背景区域，还可以识别图片中文字信息，将其转换为可编辑的文档格式。基于此，本发明实施例给出一种图片处理方法，请参考图1，其为本发明实施例所提供的一种图片处理方法的流程示意图，如图所示，该方法包括以下步骤：步骤s101，采集待处理图片中的第一图片区域。进一步地，通过如下步骤对步骤s101进行细化：根据处理图片中各像素点的亮度值，通过预设策略确定第一图片区域的各个边缘；根据各所述边缘采集第一图片区域；其中，所述第一图片区域为四边形。此处描述的第一图片区域为待处理图片中用户需要采集的区域，第一图片区域的图片参数信息会存在部分明显区别于其他区域(即待处理图片中第一图片区域外部的其他区域)，也就是说，第一图片区域是具有明显界限的。举例来说，在拍摄文档(如ppt文档)所形成的图片时，由于对焦以及本身取景亮度的差异，取景区域中文档区域部分亮度较高，而文档区域外部的背景区域部分亮度较低，所以在最终成像时，图片中文档区域像素点的亮度值和文档区域外部区域像素点的亮度值差距会比较大，将图片中的每个像素点用像素值表示的话，图片中会存在明显的界限，界限内外的亮度值会存在明显的落差。本发明实施例中为了方便数据的计算与处理，以线性的方式进行界限确定，在检测出符合预设长度的界限线段后直接向两端延伸形成相应的界限直线，若文档内容是矩形的，即使时拍摄角度具有差异，最终照片上的文档内容区域也是四边形的，所以最终会确定出四条界限直线，四条界限围成的区域即为第一图片区域范围，确定出第一图片区域的范围后进行裁剪或分割后得出第一图片区域。上述先确定界限线段，在进行线段延伸生成界限直线的方式，因为只需确定部分界限线段，所以可以在很大程度上降低移动终端的处理组件的运算量，减少了图片处理过程对处理资源的占用，同时还可以提升图片处理速度，使用户可以获得更好的使用体验。步骤s102，将所述第一图片区域调整为指定形状，生成第一图片。进一步地，通过如下步骤对步骤s102进行细化：获取所述第一图片区域的四个顶点坐标，计算出所述第一图片区域对应的矩形区域的长宽比；根据所述第一图片区域的四个顶点坐标和所述矩形区域的长宽比，计算出所述第一图片区域转换为矩形区域的变换方程；利用所述变换方程将所述第一图片区域调整为矩形区域，生成第一图片。需要说明的是，受拍摄角度影响，第一图片区域通常并非矩形，智能设备可以将四边形区域调整为矩形区域后，生成对应的图片。具体的，在本发明实施例中，可以通过预设坐标原点，然后基于该坐标原点在第一图片区域上建立坐标系，这样就可以分别求出第一图片区域四个顶点的坐标，利用透视投影方程计算出该四边形区域对应的矩形区域的四个顶点坐标，根据矩形区域的四个顶点坐标计算出该矩形区域的长宽比，然后计算出所述第一图片区域转换为矩形区域的变换方程，这里所讲的变换方程可以为单应性变换，变换后可生成对应的矩形图片。步骤s103，识别所述第一图片中的文字信息，将所述第一图片中的图片信息和文字信息保存为指定格式的文档。需要说明的是，可通过ocr(opticalcharacterrecognition，光学字符识别)技术识别第一图片中的文字信息。ocr技术是指移动终端检查图片的字符信息，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字。本发明实施例在识别图片中文字信息后，将其文字信息和图片信息保存为指定格式的文档，以方便用户在使用中根据需求对文档内容进行编辑。其中，指定格式可以为doc格式、pdf格式、txt格式、ppt格式等。作为优选的，本发明实施例将第一图片中的图片信息和文字信息保存为ppt格式的文档，演示文稿ppt格式的文档可以同时兼容图片信息和文字信息，若待处理图片中第一图片区域对应的演示文稿ppt文档内容，在处理后仍将其保存为演示文稿ppt格式的文档，文档内容获得了较高的还原度，从而接近展示的原始演示文稿ppt文档，方便用户进行阅读，再者，演示文稿ppt格式的文档中的图片信和文字信息可以根据用户的需求进行进一步编辑。进一步地，本发明实施例的方法还包括：响应于针对所述文字信息的操作指令，对所述文字信息进行修改。需要说明的是，在实际应用过程中，用户有时候需要增加批注、阅读笔记、或内容上的增减，用户可以向移动终端输入针对所述文字信息的操作指令，移动终端可以响应于该操作指令，并根据该操作指令对文字信息进行对应修改。另外，如果本发明实施例将第一图片中的图片信息和文字信息保存为演示文稿ppt格式的文档，针对演示文稿ppt格式文档所有编辑操作，比如增加效果动画、替换背景图片、增加视频音频等都可以在用户的操作指令下，进行相应编辑。本发明实施例的图片处理方法，在采集待处理图片中的第一图片区域后，将其调整为指定形状以生成第一图片，然后识别第一图片中的文字信息，并将第一图片中的图片信息和文字信息保存为指定格式的文档。与现有技术相比，本发明技术方案能够自动采集图片中的相应区域并进行调整，无需手动采集与调整，提升了图片处理的准确度和自动化程度，对处理区域图片内容的还原度较高，同时还可以对图片中的文字信息进行识别，并将图片信息和文字信息保存为指定格式的文档，方便用户对文档中内容的阅读与编辑。需要说明的是，本发明实施例中所涉及的终端可以包括但不限于个人计算机(personalcomputer，pc)、个人数字助理(personaldigitalassistant，pda)、无线手持设备、平板电脑(tabletcomputer)、手机、mp3播放器、mp4播放器等。需要说明的是，s101～s103的执行主体可以为图片处理装置，该装置可以位于本地终端的应用，或者还可以为位于本地终端的应用中的插件或软件开发工具包(softwaredevelopmentkit，sdk)等功能单元，本发明实施例对此不进行特别限定。可以理解的是，所述应用可以是安装在终端上的应用程序(nativeapp)，或者还可以是终端上的浏览器的一个网页程序(webapp)，本发明实施例对此不进行限定。本发明实施例进一步给出实现上述方法实施例中各步骤及方法的装置实施例。请参考图2，其为本发明实施例所提供的图片处理装置的功能方块图。如图2所示，该装置包括：采集模块210，用于采集待处理图片中的第一图片区域；生成模块220，用于将所述第一图片区域调整为指定形状，生成第一图片；处理模块230，用于识别所述第一图片中的文字信息，将所述第一图片中的图片信息和文字信息保存为指定格式的文档。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述采集模块210具体用于：根据处理图片中各像素点的亮度值，通过预设策略确定第一图片区域的各个边缘；根据各所述边缘采集第一图片区域；其中，所述第一图片区域为四边形。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述生成模块220具体用于：获取所述第一图片区域的四个顶点坐标，计算出所述第一图片区域对应的矩形区域的长宽比；根据所述第一图片区域的四个顶点坐标和所述矩形区域的长宽比，计算出所述第一图片区域转换为矩形区域的变换方程；利用所述变换方程将所述第一图片区域调整为矩形区域，生成第一图片。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述装置还包括：修改模块，用于响应于针对所述文字信息的操作指令，对所述文字信息进行修改。如上所述的方面和任一可能的实现方式，进一步提供一种实现方式，所述指定格式为演示文稿ppt格式。本发明实施例的图片处理装置，在采集待处理图片中的第一图片区域后，将其调整为指定形状以生成第一图片，然后识别第一图片中的文字信息，并将第一图片中的图片信息和文字信息保存为指定格式的文档。与现有技术相比，本发明技术方案能够自动采集图片中的相应区域并进行调整，无需手动采集与调整，提升了图片处理的准确度和自动化程度，对处理区域图片内容的还原度较高，同时还可以对图片中的文字信息进行识别，并将图片信息和文字信息保存为指定格式的文档，方便用户对文档中内容的阅读与编辑。所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机装置(可以是个人计算机，服务器，或者网络装置等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(read-onlymemory，rom)、随机存取存储器(randomaccessmemory，ram)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。当前第1页12当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨辰
技术所有人：深圳天珑无线科技有限公司;深圳市天珑移动技术有限公司
我是此专利的发明人

上一篇：一种新型小工艺品陶瓷花盆的制造方法与工艺
上一篇：致动器布置结构的制造方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。