本发明涉及图像处理领域,尤其涉及文本图像处理方法、装置、设备和存储介质。
背景技术:
随着计算机识别技术的快速发展,光学字符检测识别技术的应用领域越来越广阔,光学字符检测去除文本图像中的噪音,在去除文本图像噪音过程中会出现文本笔画断裂和缺失的情况。
当前去除文本图像噪音可以归纳为二类;第一类基于颜色特征的方法:根据干扰线与文本字符颜色差异性,将干扰线从文本图像中分割出来,从而达到去除干扰线的目的,这类方法可以很好地去除与文本颜色信息差异较大的干扰线;当干扰线与文本字符颜色相似甚至相同时,此类方法不能去除这类干扰线。第二类基于宽度特征的方法:根据干扰线与文本字符笔画宽度差异性,当干扰线与字符笔画宽度不同时,可以通过适当的腐蚀膨胀操作去除干扰线且保留文本笔画;但当干扰线宽度与字符笔画宽度一致时,腐蚀膨胀操作去除干扰线的同时,也会丢失大量的字符笔画。
技术实现要素:
本发明的主要目的在于提供一种文本图像处理方法、装置、设备和存储介质,旨在解决当前文本图像去噪时,不可以准确地去除文本图像中干扰线的技术问题。
为实现上述目的,本发明提供文本图像处理方法,所述文本图像处理方法包括以下步骤:。
在接收到文本图像处理请求时,获取所述文本图像处理请求对应的文本图像,并对所述文本图像进行水平矫正;
在所述文本图像水平矫正完成时,获取所述文本图像中的目标像素带;
通过预设的高斯混合模型处理所述目标像素带,并判断所述目标像素带中是否存在与所述文本图像中文本笔画相交的交叉区域;
若所述目标像素带中存在交叉区域,将所述目标像素带中除所述交叉区域之外的作为干扰线,并删除所述文本图像中的所述干扰线。
在一实施例中,所述对所述文本图像进行水平矫正的步骤,包括:
对所述文本图像进行二值化处理,得到二值化区域;
通过预设的字符分类模型提取所述二值化区域中的文本二值化区域,将各所述文本二值化区域汇总生成二值化图像;
对所述二值化图像进行投影,得到所述文本图像中文本的倾斜角度,并按照所述倾斜角度调整所述文本图像中的文本,以完成所述文本图像的水平矫正。
在一实施例中,所述在所述文本图像水平矫正完成时,获取所述文本图像中的目标像素带的步骤,包括:
在所述文本图像水平矫正完成时,将所述文本图像按照预设方向划分为像素带,其中,预设方向包括水平方向和竖直方向;
确定所述像素带中灰色像素值占比和/或黑色像素值占比,获取所述灰色像素值占比和/或所述黑色像素值占比超过预设阈值的目标像素带。
在一实施例中,所述通过预设的高斯混合模型处理所述目标像素带,并判断所述目标像素带中是否存在与所述文本图像中文本笔画相交的交叉区域的步骤之前,包括:
在接收到高斯混合模型构建指令时,获取预定义的初始高斯模型,按照所述文本图像中的像素调整所述初始高斯模型的系数,得到高斯混合模型,其中,所述高斯混合模型的中包含算法:
所述p(x)表示像素值在两类的概率,所述k表示高斯混合模型分类类别k=2,所述πk表示混合系数总和为1,所述λ表示高斯混合模型的常数,所述μ表示类别中心,所述x表示像素值。
在一实施例中,所述通过预设的高斯混合模型处理所述目标像素带,并判断所述目标像素带中是否存在与所述文本图像中文本笔画相交的交叉区域的步骤,包括:
按预设的rgb三个通道的量化值分析所述目标像素带,将所述目标像素带划分为黑色像素带和灰色像素带;
通过预设的高斯混合模型对所述灰色像素带进行分类,判断所述灰色像素带中是否存在黑色像素集合;
若所述灰色像素带中存在黑色像素集合,则所述目标像素带中存在交叉区域;
若所述灰色像素带中不存在黑色像素集合,则所述目标像素带中不存在交叉区域。
在一实施例中,所述通过预设的高斯混合模型处理所述目标像素带,并判断所述目标像素带中是否存在与所述文本图像中文本笔画相交的交叉区域的步骤,包括:
通过预设的高斯混合模型处理所述目标像素带,将所述目标像素带与所述文本图像中的文字笔画进行比对;
若所述目标像素带与所述文字笔画之间的距离差值小于预设差值,则判定目标像素带中存在交叉区域;
若所述目标像素带与所述文字笔画之间的距离差值大于或等于预设差值,则判定目标像素带中不存在交叉区域。
在一实施例中,所述通过预设的高斯混合模型处理所述目标像素带,并判断所述目标像素带中是否存在与所述文本图像中文本笔画相交的交叉区域的步骤之后,包括:
若所述目标像素带中不存在交叉区域,则获取所述目标像素带中各个像素点的像素值;
在所述目标像素带中各个像素点的像素值相同时,将所述目像素带作为干扰线,并删除所述文本图像中的所述干扰线。
此外,为实现上述目的,本发明还提供一种文本图像处理装置,所述文本图像处理装置包括:
请求接收模块,用于在接收到文本图像处理请求时,获取所述文本图像处理请求对应的文本图像,并对所述文本图像进行水平矫正;
信息获取模块,用于在所述文本图像水平矫正完成时,获取所述文本图像中的目标像素带;
处理判断模块,用于通过预设的高斯混合模型处理所述目标像素带,并判断所述目标像素带中是否存在与所述文本图像中文本笔画相交的交叉区域;
干扰删除模块,用于若所述目标像素带中存在交叉区域,将所述目标像素带中除所述交叉区域之外的作为干扰线,并删除所述文本图像中的所述干扰线。
此外,为实现上述目的,本发明还提供一种文本图像处理设备;
所述文本图像处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现如上所述的文本图像处理方法的步骤。
此外,为实现上述目的,本发明还提供计算机存储介质;
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的文本图像处理方法的步骤。
本发明实施例提出的一种文本图像处理方法、装置、设备和存储介质,本发明实施例中通过对文本图像分析,获取文本图像中的书写辅助线作为目标像素带;通过预设的高斯混合模型处理目标像素带,并判断目标像素带中是否存在与文字笔画相交形成的交叉区域;若目标像素带中存在交叉区域,将目标像素带中除交叉区域之外的作为干扰线,并删除文本图像中的干扰线。实现干扰线的准确删除,有效地避免了文字笔画的错误删除。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图;
图2为本发明文本图像处理方法第一实施例的流程示意图;
图3为本发明文本图像处理方法第四实施例的流程示意图;
图4为本发明文本图像处理装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的终端(又叫文本图像处理设备,其中,文本图像处理设备可以是由单独的文本图像处理装置构成,也可以是由其他装置与文本图像处理装置组合形成)结构示意图。
本发明实施例终端可以固定终端,也可以是移动终端,如,带联网功能的智能空调、智能电灯、智能电源、智能音箱、自动驾驶汽车、pc(personalcomputer)个人计算机、智能手机、平板电脑、电子书阅读器、便携计算机等。
如图1所示,该终端可以包括:处理器1001,例如,中央处理器centralprocessingunit,cpu),网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真wireless-fidelity,wifi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如,磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,终端还可以包括摄像头、rf(radiofrequency,射频)电路,传感器、音频电路、wifi模块;输入单元,比显示屏,触摸屏;网络接口可选除无线接口中除wifi外,蓝牙、探针等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器;当然,移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的终端结构并不构成对终端的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,该计算机软件产品存储在一个存储介质(存储介质:又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等,存储介质可以是非易失性可读存储介质,如ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。
在图1所示的终端中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的计算机程序,并执行本发明以下实施例提供的文本图像处理方法中的步骤。
参照图2,在本发明文本图像处理方法的第一实施例中,所述文本图像处理方法包括:
步骤s10,在接收到文本图像处理请求时,获取所述文本图像处理请求对应的文本图像,并对所述文本图像进行水平矫正。
本实施例中的文本图像处理方法应用于终端,终端接收文本图像处理请求,文本图像处理请求的触发方式不作具体限定,即,文本图像处理请求可以是用户主动触发的,例如,用户在终端显示界面中点击“文本图像处理”按键,触发文本图像处理请求;此外,文本图像处理请求还可以是终端自动触发的,例如,终端进行图像扫描,终端确定被扫描图像中包含文本信息,终端自动触发文本图像处理请求。
终端在接收到文本图像处理请求时,终端获取文本图像处理请求对应的文本图像,其中,文本图像是指包含手写字和书写辅助线的文本图像,文本图像可以是用户扫描手写字文件得到,文本图像还可以是用户拍摄手写字文件得到,本实施例中的文本图像的格式不作具体限定,即,文本图像可以是bmp、jpg格式、png格式、tif格式或gif格式等等。
本实施例中文本图像处理的目的是去除文本图像中的干扰线,本发明实施例中的干扰线是指印刷过程中的书写辅助线,例如,书写的横行辅助线、纵向辅助线、田字格辅助线或者米字格辅助线,终端在文本图像处理之前,终端首先预先对文本图像进行水平矫正,再对矫正后的文本图像进行识别,本实施例中终端对文本图像进行水平矫正是指终端对文本图像中的文字进行平移、倾斜和旋转,使得水平矫正处理后文本图像中的文本处于水平方向。
步骤s20,在所述文本图像水平矫正完成时,获取所述文本图像中的目标像素带。
终端在对文本图像水平矫正完成时,终端将文本图像划分为不同的像素带,例如,终端将横坐标相同的纵坐标不同的像素点作为一个像素带,或者终端将横坐标不同的纵坐标相同的像素点作为一个像素带。
终端中预先按照像素值的高低,将像素值划分为两个范围,若像素值在第一像素范围内,则终端判定该像素值对应的像素点为空白区域;若像素值在第二像素范围内,则终端判定该像素值对应的像素点为非空白区域。
终端获取像素带中各个像素点的像素值,终端统计各个像素带的非空白区域的占比,若像素带的非空白区域的占比超过预设阈值,则终端判定该像素带对应书写辅助线;若像素带的非空白区域的占比不超过预设阈值,则终端判定该像素带为正常书写行。终端将非空白区域占比超过预设阈值的像素带作为目标像素带,其中,预设阈值可以根据具体情况灵活设置,例如,预设阈值设置为80%;终端获取目标像素带,以对目标像素待进行分析去除书写辅助线,具体地:
步骤s30,通过预设的高斯混合模型处理所述目标像素带,并判断所述目标像素带中是否存在与所述文本图像中文本笔画相交的交叉区域。
终端中预设的高斯混合模型,高斯混合模型是指预先设置的用于文本图像处理的模型,终端通过预设的高斯混合模型处理目标像素带,可以有效地判断目标像素带中是否存在与文本图像中文本笔画相交的交叉区域。
即,本实施例中给出了两种通过预设的高斯混合模型处理目标像素带,判断目标像素带中存在交叉区域的实现方式,具体地:
实现方式一:
步骤a1,按预设的rgb三个通道的量化值分析所述目标像素带,将所述目标像素带划分为黑色像素带和灰色像素带;
步骤a2,通过预设的高斯混合模型对所述灰色像素带进行分类,判断所述灰色像素带中是否存在黑色像素集合;
步骤a3,若所述灰色像素带中存在黑色像素集合,则所述目标像素带中存在交叉区域;
步骤a4,若所述灰色像素带中不存在黑色像素集合,则所述目标像素带中不存在交叉区域。
即,终端通过预设的高斯混合模型对目标像素带进行分类,终端将目标像素带划分为黑色像素带和灰色像素带(黑色像素带和灰色像素带,对于计算机而言,是通过rgb三个通道的量化值实现颜色的划分),然后,终端利用高斯混合模型将灰色像素带分为两类,一类是灰色像素集合,灰色像素集合是目标像素带本来颜色,一类是黑色像素集合,黑色像素集合是目标像素带与文字相交像素,终端根据目标像素带中灰色像素带分类,判断目标像素带是否与文本图像中文本笔画相交形成交叉区域,即,若灰色像素带中既包括灰色像素集合又包括黑色像素结合,则目标像素带中存在交叉区域;若灰色像素带中只包括灰色像素集合不包括黑色像素集合,则目标像素带中不存在交叉区域。
实现方式二:
步骤b1,通过预设的高斯混合模型处理所述目标像素带,将所述目标像素带与所述文本图像中的文字笔画进行比对;
步骤b2,若所述目标像素带与所述文字笔画之间的距离差值小于预设差值,则判定目标像素带中存在交叉区域;
步骤b3,若所述目标像素带与所述文字笔画之间的距离差值大于或等于预设差值,则判定目标像素带中不存在交叉区域。
即,终端通过预设的高斯混合模型处理目标像素带,终端将目标像素带与文本图像中的文字笔画进行比对,终端判断目标像素带与文字笔画之间的距离差值是否小于预设差值,其中,预设差值是指预先设置的距离临界值,例如,预设差值设置为0.5mm,若目标像素带与文字笔画之间的距离差值小于预设差值,则终端判定目标像素带中存在交叉区域;若目标像素带与文字笔画之间的距离差值大于或等于预设差值,则终端判定目标像素带中不存在交叉区域。
步骤s40,若所述目标像素带中存在交叉区域,将所述目标像素带中除所述交叉区域之外的作为干扰线,并删除所述文本图像中的所述干扰线。
若目标像素带中存在交叉区域,即文字笔画穿过横向的书写辅助线,或者文字笔画穿过竖向的书写辅助线时,终端将目标像素带除交叉区域之外的作为干扰线,并删除文本图像中的干扰线,例如:
方式一:横向目标像素带从上到下是灰->黑(一个或多个)->灰的过程,获取上下的灰色带像素(即a[0]和a[n-1])行像素;若目标像素带中存在交叉区域,即,文字笔画穿过横线时,横线的上下都会相交于文字,当a[0]和a[n-1]行与文字相交位置上下匹配,即计算横线上面一行像素是否存在非黑色像素,如果没有,即没有相交区域也就是纵向一致时,中间的横线像素不用去除,从而保证了文字笔画不会被切分;即,横向目标像素带上方找到与笔画相交区域,但其对应的横向目标像素带正下方没有找到笔画横线相交区域时,在正下方左右一定像素范围内寻找,如果找到,则上下对位形成斜线,并向上构建一定长度的延长线,如果延长线上被笔画黑色像素所覆盖,则不用去除上下接触位置的中间像素,否则不保留,实现去除了横向目标像素带上的一部分认为是横线的像素,又保留了认为是文字笔画重合的区域。
方式二:纵线目标像素带从左到右是灰->黑(一个或多个)->灰的过程,获取左右的灰色带像素(即a[n-1]和a[0])行像素;若目标像素带中存在交叉区域,即,文字笔画穿过纵线时,纵线的左右都会相交于文字,当a[n-1]和a[0]行与文字相交位置上下匹配,也就是纵向一致时,中间的横线像素不用去除,从而保证了文字笔画不会被切分。
在本实施例中通过对文本图像分析,获取文本图像中的书写辅助线作为目标像素带;通过预设的高斯混合模型处理目标像素带,并判断目标像素带中是否存在与文字笔画相交形成的交叉区域;若目标像素带中存在交叉区域,将目标像素带中除交叉区域之外的作为干扰线,并删除文本图像中的干扰线。实现干扰线的准确删除,有效地避免了文字笔画的错误删除。
进一步地,在本发明第一实施例的基础上,提出了本发明文本图像处理方法的第二实施例。
本实施例是第一实施例中步骤s10的细化,与本发明第一实施例的区别在于:
对所述文本图像进行二值化处理,得到二值化区域;
通过预设的字符分类模型提取所述二值化区域中的文本二值化区域,将各所述文本二值化区域汇总生成二值化图像;
对所述二值化图像进行投影,得到所述文本图像中文本的倾斜角度,并按照所述倾斜角度调整所述文本图像中的文本,以完成所述文本图像的水平矫正。
本实施例中,终端先对文本图像进行灰度化处理,得到灰度图像,然后,终端再对灰度图像进行二值化处理,二值化处理是指将灰度图像中的每个像素点的灰度值设置为0或255,即通过选取适当的二值化阈值,根据二值化阈值将灰度图像中每个像素点的灰度值设置为0或255,得到能够反映灰度图像的整体和局部特征的图像,终端对文本图像进行二值化处理,得到二值化区域。
终端中预设的字符分类模型,字符分类模型是指通过训练得到的字符分类模型,终端通过预设的字符分类模型提取二值化区域中的文本信息,终端将文本信息对应的二值化区域作为文本二值化区域,终端将各文本二值化区域汇总生成二值化图像。
终端按照投影算法对二值化图像进行投影,其中,投影算法是指对二值化区域进行不同角度的投影,每个角度的投影得到一个投影值,由各个投影值组成的曲线具有二次抛物线的特点,曲线的最大值位于抛物线的顶点,终端将位于抛物线的顶点的投影值所对应的角度作为文本的倾斜角度,终端倾斜角度对文本图像进行矫正,并根据倾斜角度对文本图像进行矫正。在本实施例中,终端在进行文本图像分析之前,终端先对文本图像进行方向矫正,以提高文本图像分析的准确性。
进一步地,在本发明上述实施例的基础上,提出了本发明文本图像处理方法的第三实施例。
本实施例中终端预先构建高斯混合模型,以通过高斯混合模型处理文本图像,具体地:
在接收到高斯混合模型构建指令时,获取预定义的初始高斯模型,按照所述文本图像中的像素调整所述初始高斯模型的系数,得到高斯混合模型,其中,所述高斯混合模型的中包含算法:
所述p(x)表示像素值在两类的概率,所述k表示高斯混合模型分类类别k=2,所述πk表示混合系数总和为1,所述λ表示高斯混合模型的常数,所述μ表示类别中心,所述x表示像素值。
本实施例中,终端接收高斯混合模型构建指令,高斯混合模型构建指令的触发方式不作具体限定,终端在接收到高斯混合模型构建指令时,终端获取预定义的初始高斯模型,终端按照文本图像中的像素调整初始高斯模型的系数,得到高斯混合模型,即,终端首先初始化预先定义的几个初始高斯模型,然后,终端对于文本图像中的每一个像素进行处理,确定文本图像是否匹配某个初始高斯模型,若匹配,则终端将初始高斯模型归入该模型中,并按照文本图像中的像素对该初始高斯模型进行更新,得到高斯混合模型。若不匹配,则终端删除该初始高斯模型。
本实施例中构建的高斯混合模型中包含算法:
其中,高斯混合模型分为二分类,所以k=2,μ表示类别中心,πk表示混合系数总和为1,λ表示高斯混合模型的常数,可以根据具体情况灵活设置,公式中的x为灰色带的像素值,高斯混合模型将灰色带的像素分为两类,也就是每个像素值会被分类为k1类或者k2类,两者为两个独立的高斯分布(正态分布),p(x)为像素值在两类的概率可能;k1和k2分别是灰色横线部分和与笔触相交部分,用两个类别的高斯分布的μ值来区分,一类是横线图像灰色带的本来颜色其μ值相对较小,一类是与文字相交像素其μ值相对较大。
在本实施例中说明了高斯混合模型的构建方法,以通过构建的高斯混合模型实现准确地文本图像分析。
进一步地,参照图3,在本发明上述实施例的基础上,提出了本发明文本图像处理方法的第四实施例。
本实施例是第一实施例中步骤s30之后的步骤,本实施例与其他实施例的区别在于:
步骤s50,若所述目标像素带中不存在交叉区域,则获取所述目标像素带中各个像素点的像素值。
若目标像素带中不存在交叉区域,终端则获取目标像素带中各个像素点的像素值,终端比对各个像素点的像素值是否相同,若各个像素点的像素值相同,终端判定该目标像素带为书写辅助线;若各个像素点的像素值不同,终端输出提示信息,以供用户确认。
步骤s60,在所述目标像素带中各个像素点的像素值相同时,将所述目像素带作为干扰线,并删除所述文本图像中的所述干扰线。
终端在目标像素带中各个像素点的像素值相同时,终端将目像素带作为干扰线,并删除文本图像中的所述干扰线;在本实施例中在进行干扰线删除的时候,终端根据目标像素带的像素值进行分析,避免出现错误删除的情况,提高了删除的准确性。
此外,参照图4,本发明实施例还提出一种文本图像处理装置,所述文本图像处理装置包括:
请求接收模块10,用于在接收到文本图像处理请求时,获取所述文本图像处理请求对应的文本图像,并对所述文本图像进行水平矫正;
信息获取模块20,用于在所述文本图像水平矫正完成时,获取所述文本图像中的目标像素带;
处理判断模块30,用于通过预设的高斯混合模型处理所述目标像素带,并判断所述目标像素带中是否存在与所述文本图像中文本笔画相交的交叉区域;
干扰删除模块40,用于若所述目标像素带中存在交叉区域,将所述目标像素带中除所述交叉区域之外的作为干扰线,并删除所述文本图像中的所述干扰线。
在一实施例中,所述请求接收模块10,包括:
二值化单元,用于对所述文本图像进行二值化处理,得到二值化区域;
生成汇总单元,用于通过预设的字符分类模型提取所述二值化区域中的文本二值化区域,将各所述文本二值化区域汇总生成二值化图像;
旋转矫正单元,用于对所述二值化图像进行投影,得到所述文本图像中文本的倾斜角度,并按照所述倾斜角度调整所述文本图像中的文本,以完成所述文本图像的水平矫正。
在一实施例中,所述信息获取模块20,包括:
图像划分单元,用于在所述文本图像水平矫正完成时,将所述文本图像按照预设方向划分为像素带,其中,预设方向包括水平方向和竖直方向;
确定获取单元,用于确定所述像素带中灰色像素值占比和/或黑色像素值占比,获取所述灰色像素值占比和/或所述黑色像素值占比超过预设阈值的目标像素带。
在一实施例中,所述的文本图像处理装置,包括:
模型构建模块,用于在接收到高斯混合模型构建指令时,获取预定义的初始高斯模型,按照所述文本图像中的像素调整所述初始高斯模型的系数,得到高斯混合模型,其中,所述高斯混合模型的中包含算法:
所述p(x)表示像素值在两类的概率,所述k表示高斯混合模型分类类别k=2,所述πk表示混合系数总和为1,所述λ表示高斯混合模型的常数,所述μ表示类别中心,所述x表示像素值。
在一实施例中,所述处理判断模块30,包括:
像素划分单元,用于按预设的rgb三个通道的量化值分析所述目标像素带,将所述目标像素带划分为黑色像素带和灰色像素带;
分类判断单元,用于通过预设的高斯混合模型对所述灰色像素带进行分类,判断所述灰色像素带中是否存在黑色像素集合;
第一判定单元,用于若所述灰色像素带中存在黑色像素集合,则所述目标像素带中存在交叉区域;
第二判定单元,用于若所述灰色像素带中不存在黑色像素集合,则所述目标像素带中不存在交叉区域。
在一实施例中,所述处理判断模块30,包括:
笔画比对单元,用于通过预设的高斯混合模型处理所述目标像素带,将所述目标像素带与所述文本图像中的文字笔画进行比对;
第三判定单元,用于若所述目标像素带与所述文字笔画之间的距离差值小于预设差值,则判定目标像素带中存在交叉区域;
第四判定单元,用于若所述目标像素带与所述文字笔画之间的距离差值大于或等于预设差值,则判定目标像素带中不存在交叉区域。
在一实施例中,所述的文本图像处理装置,包括:
像素获取模块,用于若所述目标像素带中不存在交叉区域,则获取所述目标像素带中各个像素点的像素值;
删除干扰模块,用于在所述目标像素带中各个像素点的像素值相同时,将所述目像素带作为干扰线,并删除所述文本图像中的所述干扰线。
其中,文本图像处理装置的各个功能模块实现的步骤可参照本发明文本图像处理方法的各个实施例,此处不再赘述。
此外,本发明实施例还提出一种计算机存储介质。
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的文本图像处理方法中的操作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。