处理方法及其装置、打印控制方法和装置与流程

文档序号:11154229阅读:470来源:国知局
处理方法及其装置、打印控制方法和装置与制造工艺

本发明涉及成像控制技术领域,尤其涉及一种基于文档截取部分的处理方法及其装置、打印控制方法和装置。



背景技术:

目前,在进行诸如网页、pdf、word等格式文档打印时,有时用户只希望能够打印出自己感兴趣的部分内容,通常的做法是,用户通过浏览器自带的截屏插件或者其他截屏软件,从用户所浏览的文档中,捕获多个用户感兴趣的截取部分内容,然后将捕获的多个截取部分图像拼接起来,形成一个拼接图像,之后将拼接图像发送给打印机进行打印。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

特别地,若所捕获的多个截取部分图像是通过滚动一个文档,然后利用截屏插件或工具逐一捕获时,往往捕获的多个截取部分图像之间存在重叠的部分,需要用户手动将重叠的部分删除掉,然后再将多个截取部分图像拼接起来,之后再发送给打印机进行打印,上述用户手动删除重复部分的操作,费时费力,给用户带来不便。



技术实现要素:

有鉴于此,本发明实施例提供了一种基于文档截取部分的处理方法及其装置、打印控制方法和装置,能够自动识别出相邻两个截取部分存在的重叠部分并修正,无需用户手动将两个截取部分存在的重叠部分删除,使得根据多个截取部分进行打印的过程更加方便。

一方面,提供一种基于文档截取部分的处理方法,包括:

获取基于文档依次截取的多个截取部分,每两个相邻的截取部分作为一个截取组合;

分别针对所有截取组合中的每个截取组合进行重叠文字修正处理;

在所述分别针对所有截取组合中的每个截取组合进行重叠文字修正处理的过程中,针对每个截取组合进行重叠文字修正处理包括:

判断该截取组合中,在先截取部分与在后截取部分中是否存在重叠的文字部分,所述重叠的文字部分为在先截取部分的结束部分,所述重叠的文字部分为在后截取部分的起始部分;

若是,则将在先截取部分或者在后截取部分中所述重叠的文字部分删除。

具体地,所述判断该截取组合中,在先截取部分与在后截取部分中是否存在重叠的文字部分的过程包括:

判断在先截取部分的最后一个字符是否与在后截取部分的至少一个字符相同;

若是,则确定在后截取部分中与在先截取部分的最后一个字符相同的字符为待确定字符;

所述待确定字符的数目为m个,m为大于或等于1的整数;

对于每个所述待确定字符,判断是否存在i,使在先截取部分中由第i个字符至最后一个字符组成的字符串与在后截取部分中由第一个字符至该待确定字符组成字符串相同,i为大于或等于1的整数,所述在先截取部分中由第i个字符至最后一个字符组成的字符串的字符数目与所述在后截取部分中由第一个字符至该待确定字符组成的字符串的字符数目相等;

若是,则确定所述在先截取部分中由第i个字符至最后一个字符组成的字符串或者所述在后截取部分中由第一个字符至该待确定字符组成的字符串为待确定重叠部分;

当仅存在一个待确定重叠部分时,确定该待确定重叠部分为所述重叠的文字部分;

当存在多个待确定重叠部分时,确定字符数最多的待确定重叠部分为所述重叠的文字部分。

具体地,所述对于每个所述待确定字符,判断是否存在i,使在先截取部分中由第i个字符至最后一个字符组成的字符串与在后截取部分中由第一个字符至该待确定字符组成的字符串相同,i为大于或等于1的整数,所述在先截取部分中由第i个字符至最后一个字符组成的字符串的字符数目与所述在后截取部分中由第一个字符至该待确定字符组成的字符串的字符数目相等;若是,则确定所述在先截取部分中由第i个字符至最后一个字符组成的字符串或者所述在后截取部分中由第一个字符至该待确定字符组成的字符串为待确定重叠部分的过程包括:

判断该待确定字符是否为在后截取部分的第一个字符;

若是,则该待确定字符为待确定重叠部分;

若否,则根据w的取值依次判断在先截取部分的第a-w个字符与在后截取部分的第b-w个字符是否相同,直到w的当前取值使在先截取部分的第a-w个字符与在后截取部分的第b-w个字符不相同,或者直到w的当前取值使a-w=1,或者直到w的当前取值使b-w=1,a为在先截取部分中最后一个字符的排序位数,b为在后截取部分中该待确定字符的排序位数,w的取值依次为1、2、…、p-1,p为a和b中的最小值;

当w的当前取值使b-w=1时,确定在先截取部分中由第a-w个字符至最后一个字符组成的字符串或者在后截取部分中由第一个字符至第b个字符组成的字符串为待确定重叠部分。

可选地,在所述分别针对所有截取组合中的每个截取组合进行重叠文字修正处理的过程之前,还包括:

根据所述多个截取部分中的每个截取部分生成对应该截取部分的像素值分布图,所述像素值分布图的第一坐标用于表示截取部分的纵向位置,所述像素值分布图的第二坐标用于表示截取部分中的像素值,根据空白区域将所述像素值分布图在所述第一坐标的方向上分为多个像素区块,每个像素区块用于表示截取部分的纵向位置区间所对应的像素值,每两个相邻的像素区块之间具有空白区域;

所述判断该截取组合中,在先截取部分与在后截取部分中是否存在重叠的文字部分,所述重叠的文字部分为在先截取部分的结束部分,所述重叠的文字部分为在后截取部分的起始部分:若是,则将在先截取部分或者在后截取部分中重叠的文字部分删除的过程包括:

判断该截取组合中,在先截取部分对应的像素值分布图与在后截取部分对应的像素值分布图中是否存在重叠的像素区块区域,所述重叠的像素区块区域为在后截取部分对应的像素分布图的结束部分,所述重叠的像素区块区域为在先截取部分对应的像素分布图的起始部分;

若是,则将在先截取部分或者在后截取部分中所述重叠的像素区块区域所对应的文字部分删除。

具体地,所述判断该截取组合中,在先截取部分对应的像素值分布图与在后截取部分对应的像素值分布图中是否存在重叠的像素区块区域的过程包括:

判断在先截取部分对应的像素值分布图的最后一个像素区块是否与在后截取部分的至少一个像素区块相同;

若是,则确定在后截取部分对应的像素值分布图中与在先截取部分对应的像素值分布图的最后一个像素区块相同的像素区块为待确定像素区块;

所述待确定像素区块的数目为M个,M为大于或等于1的整数;

对于每个所述待确定像素区块,判断是否存在I,使在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块与在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块相同,I为大于或等于1的整数,所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块的像素区块数目与所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块的像素区块数目相等;

若是,则确定所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块或者所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块为待确定重叠部分;

当仅存在一个待确定重叠部分时,确定该待确定重叠部分为所述重叠的像素区块区域;

当存在多个待确定重叠部分时,确定像素区块数目最多的待确定重叠部分为所述重叠的像素区块区域。

具体地,所述对于每个所述待确定像素区块,判断是否存在I,使在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块与在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块相同,I为大于或等于1的整数,所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块的像素区块数目与所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块的像素区块数目相等;若是,则确定所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块或者所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块为待确定重叠部分的过程包括:

判断该待确定像素区块是否为在后截取部分对应的像素值分布图中第一个像素区块;

若是,则该待确定像素区块为待确定重叠部分;

若否,则根据W的取值依次判断在先截取部分对应的像素值分布图中第A-W个像素区块与在后截取部分对应的像素值分布图中第B-W个像素区块是否相同,直到W的当前取值使在先截取部分对应的像素值分布图中第A-W个像素区块与在后截取部分对应的像素值分布图中第B-W个像素区块不相同,或者直到W的当前取值使A-W=1,或者直到W的当前取值使B-W=1,A为在先截取部分对应的像素值分布图中最后一个像素区块的排序位数,B为在后截取部分对应的像素值分布图中该待确定像素区块的排序位数,W的取值依次为1、2、…、P-1,P为A和B中的最小值;

当W的当前取值使B-W=1时,确定在先截取部分对应的像素值分布图中由第A-W个像素区块至最后一个像素区块组成的连续像素区块或者在后截取部分对应的像素值分布图中由第一个像素区块至第B个像素区块组成的连续像素区块为待确定重叠部分。

另一方面,提供一种打印控制方法,包括:

上述的基于文档截取部分的处理方法;

获取通过所述基于文档截取部分的处理方法处理后的多个截取部分,并根据所述多个截取部分生成待打印图像;

将所述待打印图像发送至图像形成设备。

另一方面,提供一种基于文档截取部分的处理装置,包括:

截取部分获取模块,用于获取基于文档依次截取的多个截取部分,每两个相邻的截取部分作为一个截取组合;

修正模块,用于分别针对所有截取组合中的每个截取组合进行重叠文字修正处理;

所述修正模块具体用于,在针对每个截取组合进行重叠文字修正处理的过程中,判断该截取组合中,在先截取部分与在后截取部分中是否存在重叠的文字部分,所述重叠的文字部分为在先截取部分的结束部分,所述重叠的文字部分为在后截取部分的起始部分;若是,则将在先截取部分或者在后截取部分中所述重叠的文字部分删除。

具体地,所述修正模块包括:

第一字符判断单元,用于判断在先截取部分的最后一个字符是否与在后截取部分的至少一个字符相同;若是,则确定在后截取部分中与在先截取部分的最后一个字符相同的字符为待确定字符;所述待确定字符的数目为m个,m为大于或等于1的整数;

第二字符判断单元,用于对于每个所述待确定字符,判断是否存在i,使在先截取部分中由第i个字符至最后一个字符组成的字符串与在后截取部分中由第一个字符至该待确定字符组成字符串相同,i为大于或等于1的整数,所述在先截取部分中由第i个字符至最后一个字符组成的字符串的字符数目与所述在后截取部分中由第一个字符至该待确定字符组成的字符串的字符数目相等;若是,则确定所述在先截取部分中由第i个字符至最后一个字符组成的字符串或者所述在后截取部分中由第一个字符至该待确定字符组成的字符串为待确定重叠部分;

确定单元,用于当仅存在一个待确定重叠部分时,确定该待确定重叠部分为所述重叠的文字部分;当存在多个待确定重叠部分时,确定字符数最多的待确定重叠部分为所述重叠的文字部分。

具体地,所述第二字符判断单元具体用于,判断该待确定字符是否为在后截取部分的第一个字符;

若是,则该待确定字符为待确定重叠部分;

若否,则根据w的取值依次判断在先截取部分的第a-w个字符与在后截取部分的第b-w个字符是否相同,直到w的当前取值使在先截取部分的第a-w个字符与在后截取部分的第b-w个字符不相同,或者直到w的当前取值使a-w=1,或者直到w的当前取值使b-w=1,a为在先截取部分中最后一个字符的排序位数,b为在后截取部分中该待确定字符的排序位数,w的取值依次为1、2、…、p-1,p为a和b中的最小值;

当w的当前取值使b-w=1时,确定在先截取部分中由第a-w个字符至最后一个字符组成的字符串或者在后截取部分中由第一个字符至第b个字符组成的字符串为待确定重叠部分。

可选地,上述装置还包括:分布图生成模块,用于根据所述多个截取部分中的每个截取部分生成对应该截取部分的像素值分布图,所述像素值分布图的第一坐标用于表示截取部分的纵向位置,所述像素值分布图的第二坐标用于表示截取部分中的像素值,根据空白区域将所述像素值分布图在所述第一坐标的方向上分为多个像素区块,每个像素区块用于表示截取部分的纵向位置区间所对应的像素值,每两个相邻的像素区块之间具有空白区域;

所述修正模块具体用于,在针对每个截取组合进行重叠文字修正处理的过程中,判断该截取组合中,在先截取部分对应的像素值分布图与在后截取部分对应的像素值分布图中是否存在重叠的像素区块区域,所述重叠的像素区块区域为在后截取部分对应的像素分布图的结束部分,所述重叠的像素区块区域为在先截取部分对应的像素分布图的起始部分;若是,则将在先截取部分或者在后截取部分中所述重叠的像素区块区域所对应的文字部分删除。

具体地,所述修正模块包括:

第一分布图判断单元,用于判断在先截取部分对应的像素值分布图的最后一个像素区块是否与在后截取部分的至少一个像素区块相同;若是,则确定在后截取部分对应的像素值分布图中与在先截取部分对应的像素值分布图的最后一个像素区块相同的像素区块为待确定像素区块;所述待确定像素区块的数目为M个,M为大于或等于1的整数;

第二分布图判断单元,用于对于每个所述待确定像素区块,判断是否存在I,使在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块与在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块相同,I为大于或等于1的整数,所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块的像素区块数目与所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块的像素区块数目相等;若是,则确定所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块或者所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块为待确定重叠部分;

确定单元,用于当仅存在一个待确定重叠部分时,确定该待确定重叠部分为所述重叠的像素区块区域;当存在多个待确定重叠部分时,确定像素区块数目最多的待确定重叠部分为所述重叠的像素区块区域。

具体地,所述第二分布图判断单元具体用于,判断该待确定像素区块是否为在后截取部分对应的像素值分布图中第一个像素区块;

若是,则该待确定像素区块为待确定重叠部分;

若否,则根据W的取值依次判断在先截取部分对应的像素值分布图中第A-W个像素区块与在后截取部分对应的像素值分布图中第B-W个像素区块是否相同,直到W的当前取值使在先截取部分对应的像素值分布图中第A-W个像素区块与在后截取部分对应的像素值分布图中第B-W个像素区块不相同,或者直到W的当前取值使A-W=1,或者直到W的当前取值使B-W=1,A为在先截取部分对应的像素值分布图中最后一个像素区块的排序位数,B为在后截取部分对应的像素值分布图中该待确定像素区块的排序位数,W的取值依次为1、2、…、P-1,P为A和B中的最小值;

当W的当前取值使B-W=1时,确定在先截取部分对应的像素值分布图中由第A-W个像素区块至最后一个像素区块组成的连续像素区块或者在后截取部分对应的像素值分布图中由第一个像素区块至第B个像素区块组成的连续像素区块为待确定重叠部分。

另一方面,提供一种打印控制装置,包括:

上述的基于文档截取部分的处理装置;

打印处理模块,用于获取通过所述基于文档截取部分的处理装置处理后的多个截取部分,并根据所述多个截取部分生成待打印图像;

发送模块,用于将所述待打印图像发送至图像形成设备。

本发明实施例提供的基于文档截取部分的处理方法及其装置、打印控制方法和装置,通过对每两个相邻的截取部分进行判断是否需要文字修正处理,即判断在先截取部分的结束部分与在后截取部分的起始部分是否重叠,若重叠,则自动将在先截取部分或者在后截取部分中重叠的文字部分删除,无需用户手动删除各截取部分中重叠的文字部分,使得根据多个截取部分进行打印的过程更加方便。

【附图说明】

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。

图1为本发明实施例中一种终端的结构框图;

图2为本发明实施例中一种基于文档截取部分的处理方法的流程示意图;

图3为图2的处理方法中的部分流程示意图;

图4为图3的处理方法中的部分流程示意图;

图5为图4的处理方法中的部分流程示意图;

图6为本发明实施例中另一种基于文档截取部分的处理方法的流程示意图;

图7为本发明实施例三中一种在先截取部分对应的像素值分布图;

图8为本发明实施例三中一种在后截取部分对应的像素值分布图;

图9为图6的处理方法中的部分流程示意图;

图10为图9的处理方法中的部分流程示意图;

图11为图10的处理方法中的部分流程示意图;

图12为本发明实施例中一种基于文档截取部分的处理装置的结构框图;

图13为本发明实施例中另一种基于文档截取部分的处理装置的结构框图;

图14为本发明实施例中另一种基于文档截取部分的处理装置的结构框图;

图15为本发明实施例中另一种基于文档截取部分的处理装置的结构框图。

【具体实施方式】

为了更好的理解本发明的技术方案,下面结合附图对本发明实施例进行详细描述。

应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

如图1所示,本实施例提供一种终端100,终端100包括通信接口110,用户接口单元120,存储单元130,打印控制装置140,控制单元150,其中打印控制装置140包括打印处理模块1402、基于文档截取部分的处理装置1401和发送模块1043。其中终端100可以为诸如手机、电脑、pad、电子书设备的各种用户终端,这里不再冗述。

通过该通信接口单元110将终端10与外部装置进行连接,例如,通过通信接口单元110将终端100与图像形成装置10连接起来,还可以通过通信接口单元110将终端100与外部的网络服务器连接起来,通信接口单元110包括局域网络(LAN)接口、因特网接口、无线网络接口中至少一种;例如,该通信接口单元110可以通过因特网接口或者无线网络接口接收一个链接到外部服务器的网页,并可以通过局域网络(LAN)接口、因特网接口或者无线网络接口,传送该网页中待打印图像数据给图像形成装置10进行打印;特别地,该通信接口单元110可以网页经过打印控制装置140处理后,得到图像数据传送给图像形成设备10,后续会详细介绍。

用户接口单元120包括多个功能按键、显示器器等,该用户接口单元120还可以与鼠标、键盘等输入设备相互连接,用户通过这些功能按键可以设置或者选择终端100所支持的各种功能,并且通过用户接口单元120的显示器器显示终端100的各种信息。

用户接口单元120可以显示网页,通过安装在该终端100的web浏览器,用户操作web浏览器,通过通信接口单元110与外部服务器通信,获取网页内容,存储在该终端100的存储单元130内,并将对应的网页内容显示在用户接口单元120的显示器,用户可以利用web浏览器自带的截屏软件或者鼠标、键盘等输入设备、手动触摸等截取多个网页部分图像,并利用鼠标、键盘等输入设备或者手动触摸的方式选择web浏览器中的打印选项,发出打印命令。

用户接口单元120还可以显示诸如word、pdf等其他格式的文档,用户操作安装在终端100中的诸如word、pdf等文档的阅读应用程序,从而查看终端100中存储的各种类型的文档,之后利用鼠标、键盘等输入设备或者手动触摸的方式,操作截屏软件或者截图快捷按键,截取文档的多个截图,并利用鼠标、键盘等输入设备或者手动触摸的方式下发打印命令。

另外,用户接口单元120可以接收用户设置的各种打印参数,诸如期望的使用的打印的纸张尺寸等,用户接口单元120还可以给用户提供待打印图像的预览,特别地,用户接口单元120可以显示由打印控制装置140生成待打印图像数据,后续会详细介绍,用户可以通过预览操作,确定是否进行后续打印操作。

存储单元130可以包括一个显示数据缓存器,这里所述数据缓存器可以用来临时存储显示在用户接口单元120的网页数据、文档数据、截图数据,打印控制装置140从显示数据缓存器中获取信息,从而生成截取部分图像,存储单元还可以用来存储经过打印控制装置140的打印处理模块1041处理、基于文档截取部分的处理装置1401处理后的图像数据。该存储单元130可以为嵌入到终端100内部的存储介质,也可以是在终端100外部的存储单元,这里不进行限定,举例说明,为可移除的内存卡等。

本实施例中的打印控制装置140可以为诸如安装在终端100中,与终端100相连接的图像形成设备10对应的打印机驱动应用程序、pdf文档处理单元等图像数据处理单元,利用打印控制装置140将用户截取的部分转化为终端100或者图像形成设备可识别的字符串,之后将截取部分对应的字符串临时存储在存储单元130中,该图像处理单元还可以为图像形成设备10内的图像数据处理单元,或者与移动终端100相连接的服务器内的数据处理单元,在此不作限定。

打印控制装置140包括基于文档截取部分的处理装置1401,从存储单元130中获取多个截取部分对应的字符串,基于文档截取部分的处理装置1401通过分别对比在先的截取部分对应的字符串与在后的截取部分对应的字符串,识别在先截取部分与在后截取部分是否存在重叠部分,或者通过基于文档截取部分的处理装置1401通过分别对比在先的截取部分对应的像素值分布图与在后截取部分对应的像素值分布图是否存在重叠部分。

当基于文档截取部分的处理装置1401判断在先的截取部分对应的字符串与在后的截取部分对应的字符串之间存在重叠部分,将在先的截取部分或者在后的截取部分对应的字符串中的重叠字符串删除掉,并将修正处理后的截取部分对应的字符串存储于存储单元130,或者基于文档截取部分的处理装置1401判断在先截取部分对应的像素值分布图与在后截取部分对应的像素值分布图存在重叠部分,基于重叠部分,将在先截取部分或者在后截取部分中的重叠部分删除掉,并将修正处理后的裁剪部分对应的字符串存储于存储单元130中。

之后打印控制装置140的打印处理模块1402从存储单元130中读取出多个修正处理后的截取部分对应的字符串信息,并基于从用户接口单元120接收的用户设置的打印纸张尺寸,将修正处理后的截取部分的字符串信息重新排版,并由发送模块1043下发给图像形成设备10进行打印。

控制单元170用来控制终端100中的与其连接的其他单元,如控制打印控制装置140的打印处理模块1402将多个截取部分渲染成可打印字符串,控制打印控制装置140的基于文档截取部分的处理装置1401,通过比对在先的截取部分对应字符串与在后的截取部分对应的字符串之间,识别在先的截取部分对应的字符串与在后的截取部分对应的字符串之间是否存在重叠部分等,具体的识别方案,在下文有详细的描述。

实施例一

如图2所示,本发明实施例公开了一种基于文档截取部分的处理方法,包括:

步骤101、获取基于文档依次截取的多个截取部分,每两个相邻的截取部分作为一个截取组合;

在该步骤中的截取部分为用户基于文档依次截取的多个截取部分。需要说明的是,本实施例中的文档可以为网页形式的文档、word格式的文档、PDF格式的文档、幻灯片形式的文档或者图片形式的文档等,只要其中包含文字即可。本实施例中的截取是指通过截图或其他方式获取文档的部分内容。

用户通过操作安装在终端100中的文档浏览应用程序,如web浏览器、Microsoft、Adobe、福昕阅读器等,查看诸如网页、word、pdf等格式的文档,并利用截屏工具,鼠标、键盘等输入设备或者触摸等方式在文档中截取多个截取部分,之后用户利用鼠标、键盘等输入设备或者触摸等方式,点击文档“打印”选项,之后安装在终端100中的图像形成设备10对应的打印驱动或者pdf文档处理单元,或者利用与终端100相连接的服务器,或者图像形成设备10内的图像数据处理单元,将多个截取部分,分别转化为字符串,本实施例中的终端100或者图像形成设备10可以识别该字符串。

特别地,当用户利用鼠标、键盘等输入设备或者触摸等方式在可直接编辑的文档中截取多个截取部分,可直接编辑的文档为诸如word等格式的文档,用户在该可直接编辑的文档中截取的截取部分为由若干个字符组成的字符串,在用户利用鼠标、键盘等输入设备或者触摸等输入设备,待打印的文档被打印出来之前,图像处理单元中的识别部分可直接识别用户截取的多个截取部分是否存在重叠部分,若存在重叠部分,就直接删除重复的字符串,这样能够免去图像处理单元需要对重复部分渲染为字符串的操作。

步骤102、分别针对所有截取组合中的每个截取组合进行重叠文字修正处理;

如图3所示,在上述步骤102、分别针对所有截取组合中的每个截取组合进行重叠文字修正处理的过程中,针对每个截取组合进行重叠文字修正处理包括:

步骤1021、判断该截取组合中,在先截取部分与在后截取部分中是否存在重叠的文字部分,上述重叠的文字部分为在先截取部分的结束部分,上述重叠的文字部分为在后截取部分的起始部分;若是,则说明在先截取部分与在后截取部分存在需要删除的重叠文字,因此进入步骤1022、将在先截取部分或者在后截取部分中上述重叠的文字部分删除,若否,则说明该截取组合中的在先截取部分与在后截取部分不存在重叠的文字,进入步骤1023、不进行处理。

若用户截取部分为可直接编辑部分,比如说用户直接利用鼠、键盘等输入设备或者手动触摸等方式在诸如word等可直接编辑的文档中截取可直接编辑部分,步骤1021之后,用户截取部分对应的字符串不是打印机可识别的字符串,此时通过图像形成设备10对应到打印驱动分别将用户截取部分对应的字符串转化为图像形成设备10可识别的字符串,并拼接起来,并基于用户在用户接口单元120中设置的打印纸张尺寸进行排版,之后发送给图像形成设备10进行打印。

若用户截取部分不是可直接编辑部分,比如说为图像,步骤1021之前,上述图像处理单元分别将用户截取部分转化为字符串,此时的字符串可为图像形成设备可直接识别的字符串,步骤1021之后,可直接将用户截取部分对应的字符串拼接起来,并基于用户在用户接口单元120中设置的打印纸张尺寸进行排版,之后发送给图像形成设备10进行打印。

本发明实施例中基于文档截取部分的处理方法,通过对每两个相邻的截取部分进行判断是否需要文字修正处理,即判断在先截取部分的结束部分与在后截取部分的起始部分是否重叠,若重叠,则自动将在先截取部分或者在后截取部分中重叠的文字部分删除,无需用户手动删除各截取部分中重叠的文字部分,使得根据多个截取部分进行打印的过程更加方便。

实施例二

在实施例一的基础上,本发明实施例提供一种基于文档截取部分的处理方法,如图4所示,上述步骤1021、判断该截取组合中,在先截取部分与在后截取部分中是否存在重叠的文字部分的过程包括:

201、判断在先截取部分的最后一个字符是否与在后截取部分的至少一个字符相同;若是,则进入步骤202、确定在后截取部分中与在先截取部分的最后一个字符相同的字符为待确定字符;待确定字符的数目为m个,m为大于或等于1的整数;若否,则说明该截取组合中的在先截取部分与在后截取部分不存在重叠的文字,进入步骤1023、不进行处理。在步骤202中,可以分别对应每个待确定字符设置相应的标识,分别为k1、k2、…、kx、…、Km,针对每个待确定字符,均进入步骤203至步骤204或步骤203至步骤205,以确定该待确定字符是否对应待确定重叠部分以及该待确定重叠部分具体是什么。

在上述步骤202之后进入步骤203、对于每个待确定字符,判断是否存在i,使在先截取部分中由第i个字符至最后一个字符组成的字符串与在后截取部分中由第一个字符至该待确定字符组成的字符串相同,i为大于或等于1的整数,在先截取部分中由第i个字符至最后一个字符组成的字符串的字符数目与在后截取部分中由第一个字符至该待确定字符组成的字符串的字符数目相等;若是,则进入步骤204、确定在先截取部分中由第i个字符至最后一个字符组成的字符串或者在后截取部分中由第一个字符至该待确定字符组成的字符串为待确定重叠部分;若否,则进入步骤205、确定该待确定字符没有对应的待确定重叠部分。

当针对每个待确定字符,都完成步骤204或步骤205之后,进入步骤206、判断待确定重叠部分的数量为0、或者为1、或者为多个,当待确定重叠部分的数量为0,即不存在待确定重叠部分时,进入步骤1023、不进行处理,当待确定重叠部分的数量为1,即当仅存在一个待确定重叠部分时,进入步骤207、确定该待确定重叠部分为上述重叠的文字部分;当待确定重叠部分的数量为多个,即当存在多个待确定重叠部分时,进入步骤208、确定字符数最多的待确定重叠部分为上述重叠的文字部分。

需要说明的是,为了方便统计,步骤206至208可以采用以下方式,在步骤204中,可以将由第i个字符至最后一个字符组成的字符串的字符数目进行标记,例如k1对应的字符数目为flag1,k2对应的字符数目为flag2,以此类推,kx对应的字符数目为flagx,对于步骤205中确定该待确定字符没有对应的待确定重叠部分,则记为0,例如k3没有对应的待确定重叠部分,则记flag3=0。当针对所有的待确定字符,都完成步骤204或者步骤205之后,即对于每个待确定字符,都确定出其对应的待确定重叠部分或者确定其没有对应的待确定重叠部分后,将所有的flag1、flag2、…、flagm中取最大值flagmax,确定flagmax所对应的待确定重叠部分为上述重叠的文字部分,需要进行删除。

如图5所示,上述步骤203、对于每个待确定字符,判断是否存在i,使在先截取部分中由第i个字符至最后一个字符组成的字符串与在后截取部分中由第一个字符至该待确定字符组成的字符串相同,i为大于或等于1的整数,在先截取部分中由第i个字符至最后一个字符组成的字符串的字符数目与在后截取部分中由第一个字符至该待确定字符组成的字符串的字符数目相等;若是,则进入步骤204、确定在先截取部分的第i个字符至最后一个字符或者在后截取部分中由第一个字符至最后一个字符组成的字符串为待确定重叠部分;若否,则进入步骤205、确定该待确定字符没有对应的待确定重叠部分的过程包括:

步骤301、判断该待确定字符是否为在后截取部分的第一个字符;若是,则进入步骤302、确定该待确定字符为待确定重叠部分;若否,则进入步骤303、根据w的取值依次判断在先截取部分的第a-w个字符与在后截取部分的第b-w个字符是否相同,直到w的当前取值使在先截取部分的第a-w个字符与在后截取部分的第b-w个字符不相同,或者直到w的当前取值使a-w=1,或者直到w的当前取值使b-w=1,a为在先截取部分中最后一个字符的排序位数,b为在后截取部分中该待确定字符的排序位数,w的取值依次为1、2、…、p-1,p为a和b中的最小值;当w的当前取值使b-w=1时,在先截取部分的第a-w个字符至最后一个字符为待确定重叠部分。

步骤303包括:

步骤3031、判断在先截取部分的第a-w个字符与在后截取部分的第b-w个字符是否相同,若是,则进入步骤3032,若否,则进入步骤205、确定该待确定字符没有对应的待确定重叠部分;

步骤3032、判断w的当前取值是否使a-w=1或b-w=1,若是,则进入步骤3033,若否,则进入步骤3034;

步骤3033、判断w的当前取值是否使b-w=1,若是,则进入步骤3035,若否,则进入步骤205;

步骤3034、使w取下一个值,然后进入步骤3031;

步骤3035、确定在先截取部分中由第a-w个字符至最后一个字符组成的字符串或者在后截取部分中由第一个字符至第b个字符组成的字符串为待确定重叠部分。

以下通过两个具体的例子对本实施例的方法进行说明:

例子1

在先截取部分为“ABCDE”,在后截取部分为“RFABCDE”,在步骤201中判断在先截取部分的最后一个字符“E”与在后截取部分中的最后一个字符相同,因此在后截取的最后一个字符为待确定字符,在步骤301中判断该字符不是在后截取部分的第一个字符,进入步骤3031,判断在先截取部分的倒数第二个字符与在后截取的倒数第二个字符相同,再判断在先截取的倒数第三个字符与在后截取的倒数第三个字符相同,依次类推,在判断在先截取部分的第一个字符与在后截取的第三个字符的过程中,在步骤3032中判断w的当前取值为4,而a=5,因此a-w=1,进入步骤205,确定该待确定字符没有对应的待确定重叠部分,进入步骤206,待确定重叠部分的数量为0,进入步骤1023,不进行处理,即不需要进行修正。

例子2

在先截取部分为“RRFABCDE”,在后截取部分为“ABCDEBCDEKH”,在步骤201中判断在先截取部分的最后一个字符“E”与在后截取部分中的第五个字符和九个字符相同,因此在后截取的第五个字符和第九个字符均为待确定字符,分别标记为k1和k2,针对k1,在步骤301中判断该字符不是在后截取的第一个字符,进入步骤303,根据w的取值依次判断在先截取部分的第a-w个字符与在后截取部分的第b-w个字符是否相同,直到w=4时,b-w=1,确定在先截取部分中由第4个字符至最后一个字符组成的字符串或者在后截取部分中由第一个字符至第b个字符组成的字符串为k1对应的待确定重叠部分;针对k2,在步骤301中判断该字符不是在后截取的第一个字符,进入步骤303,根据w的取值依次判断在先截取部分的第a-w个字符与在后截取部分的第b-w个字符是否相同,直到w=4时,在先截取部分的第a-w=4个字符为“A”,与在后截取部分的第b-w=5个字符“E”不同,进入步骤205,确定对于k2,没有对应的待确定重叠部分。之后进入步骤206,判断待确定重叠部分的数量为1,即将对应的“ABCDE”从在先截取部分或在后截取部分中删除。

实施例三

在实施例一的基础上,本发明实施例提供一种基于文档截取部分的处理方法,本实施例与实施例二的区别在于,实施例二是通过直接对比字符的方式来判断在先截取部分与在后截取部分中是否存在重叠的文字部分,而本实施例时通过将截取部分生成对应的像素值分布图,然后根据对比像素值分布图中的像素区块来判断在先截取部分与在后截取部分中是否存在重叠的文字部分,其中将截取部分生成对应的像素值分布图是本领域技术人员所熟知的技术,在此不进行冗述。具体地,如图6所示,在上述步骤102、分别针对所有截取组合中的每个截取组合进行重叠文字修正处理的过程之前,还包括:

步骤1011、根据多个截取部分中的每个截取部分生成对应该截取部分的像素值分布图,如图7和图8所示,像素值分布图的第一坐标(例如横坐标)用于表示截取部分的纵向位置,由于截取部分的字符所在行的排序位数对应于纵向位置,因此像素值分布图的第一坐标可以反映截取部分的字符行数,例如如图7所示,像素区块G2的横坐标(假定其对应的横坐标范围为580-610)的位置对应在先截取部分中第一行字符,像素区块G3(假定其对应的横坐标范围为680-710)的位置对应在先截取部分中第二行字符,像素值分布图的第二坐标用于表示截取部分中的像素值,根据空白区域将像素值分布图在第一坐标的方向上分为多个像素区块h,图中仅标注了两个像素区块h,每个像素区块h用于表示截取部分的纵向位置区间所对应的像素值,每两个相邻的像素区块之间具有空白区域;需要说明的是,图中超出坐标系的纵向两条直线之间的部分为截取部分中正文部分,两条直线之外的部分为噪声部分,对于所有的截取部分,其初始噪声部分的特征均相同,其结束噪声部分得特征也均相同,因此可以根据这个特点区分截取部分中正文所对应的像素值分布图。由于每两行字符串之间必然有间隙,该间隙即对应像素值分布图中的空白区域,因此截取部分中以行为单位的字符串对应于像素区块,例如,如图7所示,横坐标580-610的位置为第二个像素区块,对应在先截取部分中第一行字符,横坐标680-710的位置为第三个像素区块,对应在先截取部分中的第二行字符,但是,并不一定所有的像素区块均对应以行为单位的字符区域,例如,当截取部分的文字部分之前具有附图的时候,附图在像素值分布图中也反映为像素区块,如图7中像素区块G1(假定其横坐标范围为100-500)为第一个像素区块,其对应在先截取部分中位于文字部分之前的附图,可以理解的,附图所对应的像素区块并不会影响本实施例中重叠文字修正处理的过程。

如图9所示,上述步骤1021、判断该截取组合中,在先截取部分与在后截取部分中是否存在重叠的文字部分,上述重叠的文字部分为在先截取部分的结束部分,上述重叠的文字部分为在后截取部分的起始部分:若是,则进入步骤1022、将在先截取部分或者在后截取部分中重叠的文字部分删除的过程包括:

步骤401、判断该截取组合中,在先截取部分对应的像素值分布图与在后截取部分对应的像素值分布图中是否存在重叠的像素区块区域,重叠的像素区块区域为在后截取部分对应的像素分布图的结束部分,重叠的像素区块区域为在先截取部分对应的像素分布图的起始部分;若是,则进入步骤402、将在先截取部分或者在后截取部分中所述重叠的像素区块区域所对应的文字部分删除;若否,则进入步骤403、不进行处理。需要说明的是,判断在先截取部分对应的像素值分布图与在后截取部分对应的像素值分布图中不存在重叠的像素区块区域,只能说明在先截取部分与在后截取部分不存在以行为单位的重叠部分,因此,在另外的实施例中,可以通过对比字符的方式进一步判断是否存在重叠的部分,并进行相应的修正。

由于截取部分中每行文字之间有间隔,而间隔的区域在像素值分布图中也反映为空白区域,因此像素值分布图中的每个像素区块h可以用来反映截取部分中的每行文字,若两个像素区块h相同,则说明其对应的两行文字也相同。根据这种原理,即可以以行为单位,判断在先截取部分与在后截取部分中是否存在重叠的文字。若存在,则将在先截取部分或者在后截取部分中重叠的文字删除。

具体地,如图10所示,上述步骤401、判断该截取组合中,在先截取部分对应的像素值分布图与在后截取部分对应的像素值分布图中是否存在重叠的像素区块区域的过程包括:

步骤4011、判断在先截取部分对应的像素值分布图的最后一个像素区块是否与在后截取部分的至少一个像素区块相同;若是,则进入步骤4012、确定在后截取部分对应的像素值分布图中与在先截取部分对应的像素值分布图的最后一个像素区块相同的像素区块为待确定像素区块;待确定像素区块的数目为M个,M为大于或等于1的整数;若否,则进入步骤403、不进行处理。

需要说明的是,由于像素值分布图中的像素区块可以反映截取部分中的每行文字,因此像素值分布图根据截取部分中文字的排序来确定像素区块的排序,例如第一行文字所对应的像素区块为像素值分布图中的第一个像素区块,第二行文字所对应的像素区块为像素值分布图中的第二个像素区块,以此类推。

在上述步骤4012之后,进入步骤4013、对于每个待确定像素区块,判断是否存在I,使在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块与在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块相同,I为大于或等于1的整数,在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块的像素区块数目与在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块的像素区块数目相等;若是,则进入步骤4014、确定在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块或者在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块为待确定重叠部分;若否,则进入步骤4015、确定该待确定像素区块没有对应的待确定重叠部分。

当针对每个待确定像素区块,都完成步骤4014或步骤4015之后,进入步骤4016、判断待确定重叠部分的数量为0、或者为1、或者为多个,当待确定重叠部分的数量为0时,即不存在待确定重叠部分时,进入步骤403、不进行处理;当待确定重叠部分的数量为1,即当仅存在一个待确定重叠部分时,进入步骤4017、确定该待确定重叠部分为重叠的像素区块区域;当待确定重叠部分的数量为多个,即当存在多个待确定重叠部分时,进入步骤4018、确定像素区块数目最多的待确定重叠部分为重叠的像素区块区域。

如图11所示,上述步骤4013、对于每个所述待确定像素区块,判断是否存在I,使在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块与在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块相同,I为大于或等于1的整数,所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块的像素区块数目与所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块的像素区块数目相等;若是,则进入步骤4014、确定在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块或者在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块为待确定重叠部分的过程包括:

步骤501、判断该待确定像素区块是否为在后截取部分对应的像素值分布图中第一个像素区块;若是,则进入步骤502、确定该待确定像素区块为待确定重叠部分;若否,则进入步骤503、根据W的取值依次判断在先截取部分对应的像素值分布图中第A-W个像素区块与在后截取部分对应的像素值分布图中第B-W个像素区块是否相同,直到W的当前取值使在先截取部分对应的像素值分布图中第A-W个像素区块与在后截取部分对应的像素值分布图中第B-W个像素区块不相同,或者直到W的当前取值使A-W=1,或者直到W的当前取值使B-W=1,A为在先截取部分对应的像素值分布图中最后一个像素区块的排序位数,B为在后截取部分对应的像素值分布图中该待确定像素区块的排序位数,W的取值依次为1、2、…、P-1,P为A和B中的最小值;当W的当前取值使B-W=1时,确定在先截取部分对应的像素值分布图中由第A-W个像素区块至最后一个像素区块组成的连续像素区块或者在后截取部分对应的像素值分布图中由第一个像素区块至第B个像素区块组成的连续像素区块为待确定重叠部分。

步骤503包括:

步骤5031、判断在先截取部分的第A-W个像素区块与在后截取部分的第B-W个像素区块是否相同,若是,则进入步骤5032,若否,则进入步骤4015确定该待确定像素区块没有对应的待确定重叠部分;

步骤5032、判断W的当前取值是否使A-W=1或B-W=1,若是,则进入步骤5033,若否,则进入步骤5034;

步骤5033、判断W的当前取值是否使B-W=1,若是,则进入步骤5035,若否,则进入步骤4015;

步骤5034、使W取下一个值,然后进入步骤5031;

步骤5035、确定在先截取部分中由第A-W个像素区块至最后一个像素区块组成的连续像素区块或者在后截取部分对应的像素值分布图中由第一个像素区块至第B个像素区块组成的连续像素区块为待确定重叠部分。

需要说明的是,本实施例中基于文档截取部分的处理方法,与实施例二相比,是先根据截取部分生成对应的像素值分布图,然后通过判断两个像素值分布图中是否存在重叠的像素区块区域,以此来判断对应的两个截取部分是否存在以行为单位的重叠文字,并根据判断结果进行修正,而实施例二是直接根据两个截取部分中的字符来判断是否存在重叠文字,并根据判断结果进行修正,判断的过程不同,但是原理相同,因此可以参考实施例二来理解本实施例的处理方法。另外,本实施例与实施例二相比,由于不需要针对单个字符进行判断,因此处理速度更快,但是只能以行为单位,判断精度更低。

实施例四

本发明实施例提供一种打印控制方法,包括:上述任意实施例中的基于文档截取部分的处理方法;获取通过上述基于文档截取部分的处理方法处理后的多个截取部分,并根据多个截取部分生成待打印图像;将待打印图像发送至图像形成设备。

其中,基于文档截取部分的处理方法的具体过程和原理与上述各实施例相同,在此不再赘述。

本实施例中的打印控制方法,通过对每两个相邻的截取部分进行判断是否需要文字修正处理,即判断在先截取部分的结束部分与在后截取部分的起始部分是否重叠,若重叠,则自动将在先截取部分或者在后截取部分中重叠的文字部分删除,无需用户手动删除各截取部分中重叠的文字部分,使得根据多个截取部分进行打印的过程更加方便。

实施例五

如图12所示,本发明实施例提供一种基于文档截取部分的处理装置,包括:截取部分获取模块1,用于获取基于文档依次截取的多个截取部分,每两个相邻的截取部分作为一个截取组合;修正模块2,用于分别针对所有截取组合中的每个截取组合进行重叠文字修正处理;所述修正模块具体用于,在针对每个截取组合进行重叠文字修正处理的过程中,判断该截取组合中,在先截取部分与在后截取部分中是否存在重叠的文字部分,所述重叠的文字部分为在先截取部分的结束部分,所述重叠的文字部分为在后截取部分的起始部分;若是,则将在先截取部分或者在后截取部分中所述重叠的文字部分删除。

本实施例中基于文档截取部分的处理装置可以应用上述实施例一、二或三中基于文档截取部分的处理方法,其具体过程和原理与上述实施例相同,在此不再赘述。

本发明实施例中基于文档截取部分的处理装置,通过对每两个相邻的截取部分进行判断是否需要文字修正处理,即判断在先截取部分的结束部分与在后截取部分的起始部分是否重叠,若重叠,则自动将在先截取部分或者在后截取部分中重叠的文字部分删除,无需用户手动删除各截取部分中重叠的文字部分,使得根据多个截取部分进行打印的过程更加方便。

实施例六

在实施例五的基础上,如图13所示,本发明实施例提供一种基于文档截取部分的处理装置,具体地,修正模块2包括:第一字符判断单元21,用于判断在先截取部分的最后一个字符是否与在后截取部分的至少一个字符相同;若是,则确定在后截取部分中与在先截取部分的最后一个字符相同的字符为待确定字符;所述待确定字符的数目为m个,m为大于或等于1的整数;第二字符判断单元22,用于对于每个所述待确定字符,判断是否存在i,使在先截取部分中由第i个字符至最后一个字符组成的字符串与在后截取部分中由第一个字符至该待确定字符组成字符串相同,i为大于或等于1的整数,所述在先截取部分中由第i个字符至最后一个字符组成的字符串的字符数目与所述在后截取部分中由第一个字符至该待确定字符组成的字符串的字符数目相等;若是,则确定所述在先截取部分中由第i个字符至最后一个字符组成的字符串或者所述在后截取部分中由第一个字符至该待确定字符组成的字符串为待确定重叠部分;确定单元23,用于当仅存在一个待确定重叠部分时,确定该待确定重叠部分为所述重叠的文字部分;当存在多个待确定重叠部分时,确定字符数最多的待确定重叠部分为所述重叠的文字部分。

第二字符判断单元22具体用于,判断该待确定字符是否为在后截取部分的第一个字符;若是,则该待确定字符为待确定重叠部分;若否,则根据w的取值依次判断在先截取部分的第a-w个字符与在后截取部分的第b-w个字符是否相同,直到w的当前取值使在先截取部分的第a-w个字符与在后截取部分的第b-w个字符不相同,或者直到w的当前取值使a-w=1,或者直到w的当前取值使b-w=1,a为在先截取部分中最后一个字符的排序位数,b为在后截取部分中该待确定字符的排序位数,w的取值依次为1、2、…、p-1,p为a和b中的最小值;当w的当前取值使b-w=1时,确定在先截取部分中由第a-w个字符至最后一个字符组成的字符串或者在后截取部分中由第一个字符至第b个字符组成的字符串为待确定重叠部分。

本实施例中基于文档截取部分的处理装置可以应用上述实施例二中基于文档截取部分的处理方法,其具体过程和原理与上述实施例相同,在此不再赘述。

实施例七

在实施例五的基础上,本发明实施例提供一种基于文档截取部分的处理装置,具体地,如图14所示,上述装置还包括:分布图生成模块3,用于根据所述多个截取部分中的每个截取部分生成对应该截取部分的像素值分布图,所述像素值分布图的第一坐标用于表示截取部分的纵向位置,所述像素值分布图的第二坐标用于表示截取部分中的像素值,根据空白区域将所述像素值分布图在所述第一坐标的方向上分为多个像素区块,每个像素区块用于表示截取部分的纵向位置区间所对应的像素值,每两个相邻的像素区块之间具有空白区域;修正模块2具体用于,在针对每个截取组合进行重叠文字修正处理的过程中,判断该截取组合中,在先截取部分对应的像素值分布图与在后截取部分对应的像素值分布图中是否存在重叠的像素区块区域,所述重叠的像素区块区域为在后截取部分对应的像素分布图的结束部分,所述重叠的像素区块区域为在先截取部分对应的像素分布图的起始部分;若是,则将在先截取部分或者在后截取部分中所述重叠的像素区块区域所对应的文字部分删除。

具体地,如图15所示,修正模块2包括:第一分布图判断单元31,用于判断在先截取部分对应的像素值分布图的最后一个像素区块是否与在后截取部分的至少一个像素区块相同;若是,则确定在后截取部分对应的像素值分布图中与在先截取部分对应的像素值分布图的最后一个像素区块相同的像素区块为待确定像素区块;所述待确定像素区块的数目为M个,M为大于或等于1的整数;第二分布图判断单元32,用于对于每个所述待确定像素区块,判断是否存在I,使在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块与在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块相同,I为大于或等于1的整数,所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块的像素区块数目与所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块的像素区块数目相等;若是,则确定所述在先截取部分对应的像素值分布图中由第I个像素区块至最后一个像素区块组成的连续像素区块或者所述在后截取部分对应的像素值分布图中由第一个像素区块至该待确定像素区块组成的连续像素区块为待确定重叠部分;确定单元33,用于当仅存在一个待确定重叠部分时,确定该待确定重叠部分为所述重叠的像素区块区域;当存在多个待确定重叠部分时,确定像素区块数目最多的待确定重叠部分为所述重叠的像素区块区域。

具体地,第二分布图判断单元32具体用于,判断该待确定像素区块是否为在后截取部分对应的像素值分布图中第一个像素区块;若是,则该待确定像素区块为待确定重叠部分;若否,则根据W的取值依次判断在先截取部分对应的像素值分布图中第A-W个像素区块与在后截取部分对应的像素值分布图中第B-W个像素区块是否相同,直到W的当前取值使在先截取部分对应的像素值分布图中第A-W个像素区块与在后截取部分对应的像素值分布图中第B-W个像素区块不相同,或者直到W的当前取值使A-W=1,或者直到W的当前取值使B-W=1,A为在先截取部分对应的像素值分布图中最后一个像素区块的排序位数,B为在后截取部分对应的像素值分布图中该待确定像素区块的排序位数,W的取值依次为1、2、…、P-1,P为A和B中的最小值;当W的当前取值使B-W=1时,确定在先截取部分对应的像素值分布图中由第A-W个像素区块至最后一个像素区块组成的连续像素区块或者在后截取部分对应的像素值分布图中由第一个像素区块至第B个像素区块组成的连续像素区块为待确定重叠部分。

本实施例中基于文档截取部分的处理装置可以应用上述实施例三中基于文档截取部分的处理方法,其具体过程和原理与上述实施例相同,在此不再赘述。

实施例八

如图1所示,本发明实施例提供一种打印控制装置,该打印控制装置可以用于终端100中,该打印控制装置包括:上述任意实施例中的基于文档截取部分的处理装置1401;打印处理模块1402,用于获取通过所述基于文档截取部分的处理装置处理后的多个截取部分,并根据所述多个截取部分生成待打印图像;发送模块1403,用于将所述待打印图像发送至图像形成设备。

该打印控制装置可以应用上述实施例五中的打印控制方法,其中基于文档截取部分的处理装置的具体工作过程和原理可以参考上述实施例一、二、三或四,在此不再赘述。

本实施例中的打印控制装置,通过对每两个相邻的截取部分进行判断是否需要文字修正处理,即判断在先截取部分的结束部分与在后截取部分的起始部分是否重叠,若重叠,则自动将在先截取部分或者在后截取部分中重叠的文字部分删除,无需用户手动删除各截取部分中重叠的文字部分,使得根据多个截取部分进行打印的过程更加方便。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机装置(可以是个人计算机,服务器,或者网络装置等)或处理器(Processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1