一种基于像素追踪的倾斜文字判断识别方法

文档序号:9433113阅读:948来源:国知局
一种基于像素追踪的倾斜文字判断识别方法
【技术领域】
[0001] 本发明涉及图像识别领域,特别涉及一种基于像素追踪的倾斜文字判断识别方 法。
【背景技术】
[0002] 随着社会的发展和科技的进度,种类繁多的视听设备丰富了人们的日常生活;具 有拍照、摄像功能的电子设备随处可见,并随着智能手机的普及逐渐渗透到每个人的日常 生活中,大量的视听设备产生了数量巨大的图像、影像,并伴随着网络的发展和社交平台的 分享而快速传播;大量的图像传播的同时,人们对于图像识别和图像搜索技术的需求也在 快速增长,可以说图像识别和图像搜索将成为搜索技术的发展方向。
[0003] 在众多的图像识别技术中,对图像文字的识别技术显得尤为重要,这是因为图像 文字往往比单纯图像包含更加重要的可利用信息,而且图像文字识别技术所应用的领域也 很重要,比如说:银行签名的识别,交通管理网络中对于车牌号的追踪和识别,网络安全中 对于验证码的识别;这些应用都关系到重要的经济活动或者社会管理活动。
[0004] 目前图像文字识别中的难点在于:常见的待识别图像文字中往往包含各种噪声的 干扰,比如说背景噪声、线条噪声、污染物噪声等;而且图像中的文字往往还具有一些扭曲 特征,比如说旋转、倾斜等,目前在去除噪声干扰方面已经取得了良好的效果;但是对于倾 斜等扭曲特征的判断和矫正仍然困难重重;而且现有技术中在进行图像中文字的识别时, 首先需要将图像中的字符串切分开,形成包含单个文字的小图片,然后使用一定的方法对 切分后的文字进行识别。而进行文字切分最常用的方法为投影法,即是将图像文字二值化 处理后,通过垂直投影找到两个文字之间的分界线,根据分界线将文字切分开来。这样的切 分方式在文字有倾斜的情况下,会变得比较复杂;因为文字倾斜的时候,相邻文字间经过垂 直投影后的像素点可能会有重叠,这样就无法找到两个文字之间正常的界限;进而不能有 效的对文字进行切分。
[0005] 将倾斜的文字矫正,对于图像识别的意义重大;想要矫正倾斜文字,首先需要识别 出文字倾斜方向和角度。目前有采用Hough变换的方法来得到倾斜的角度,进而对文字进 行矫正,但是该方法的计算量特别大,很难满足识别的实时性的需求。

【发明内容】

[0006] 本发明的目的在于克服现有技术中所存在的上述不足,提供一种基于像素追踪的 倾斜文字判断识别方法。本方法在图像中选取一行向量,通过将该行向量与文字每个笔画 上的左右两侧的交点作为起始点,分别向左右两个方向追踪笔画的边缘点。如果笔画向左 (或向右)倾斜,那么向右(或向左)寻找的像素数量就非常有限,若追踪到的像素点数量 达到设置的阈值,则认为此次追踪有效;计算每次追踪的起点到终点的倾斜角度,通过分别 统计向左和向右有效追踪类元素的个数,确定文字的倾斜方向。在此基础上,将对应类中最 小的角度确定为文字的倾斜角度。通过本发明方法来判断文字倾斜角度的计算量较小,科 学准确,实现过程简单,便于使用,具有较好的实时性。
[0007] 为了实现上述发明目的,本发明提供了以下技术方案:
[0008] -种图像识别中倾斜文字判断方法,包含以下实现步骤:
[0009] (1-1)在图像中选择一行向量,确定该行向量与图像中文字每个笔画相交的最左 侧像素点坐标值和最右侧像素点坐标值。
[0010] (1-2)以所述行向量与每个笔画相交的最左侧像素点为起点,向左下方追踪对应 笔画的边缘点,并将判断结果存于Vectorl中;具体的判断过程如下:
[0011] 以所述行向量与每个相交笔画的最左侧像素点为起点;优先判断与其相邻的左下 方像素点是否为〇 ;如果为〇,则以上一像素点为基础继续判断与其相邻的左下方像素点是 否为0;
[0012] 否则,以上一像素点为基础判断其正下方的像素点是否为0 ;依次循环,直到某点 相邻的左下方和正下方像素点均不为0,结束判断;并将该点作为此次判断的终点。
[0013] 下面以其中一个最左侧像素点(第一左侧交点A)坐标(XA,Ya)为例说明判断过 程:
[0014] (1-2-1)以第一左侧交点A点为起点,首先判断A点的相邻左下方像素点Al的灰 度值是否为〇 (灰度值为〇表示该像素点颜色为黑色);如果为〇,则以Al点为新的起点,继 续判断该点Al相邻的左下方像素点All的灰度值是否为0 ;
[0015] 否则,以第一左侧交点A为基础判断该点(A)的正下方像素点A2的灰度值是否为 0,如果为0,则以A2为基础判断其左下方像素点(A21)的坐标值是否为0 ;依次循环;
[0016] (1-2-2)直到判断出某点的左下方像素点和正下方像素点的灰度值均不为0,结 束判断,并以该点为本次判断的终点(第一左侧终点Aend),假设坐标值为(Ι+ΛΤ,,);
[0017] (1-2-3)判断A,Aend两点之间的距离h是否达到预设的阈值Q ;如果达到阈值,则 认为该终点为有效终点Aend有效;
[0018] (1-2-4)计算A),(Aend两点之间的正切值: 并将该值存于类 Vectorl 中。
[0019] (1-3)以所述行向量与每个笔画相交的最右侧像素点为起点,向右下方追踪对应 笔画的边缘点,并将判断结果存于Vectorf中;具体的判断过程如下:
[0020] 以所述行向量与每个相交笔画的最右侧像素点为起点;优先判断与其相邻的右下 方像素点是否为〇 ;如果为〇,则以上一像素点为基础判断与其相邻的右下方像素点是否为 〇 ;
[0021] 否则,以上一像素点为基础判断与其相邻的正下方像素点是否为0 ;依次循环,直 到某点相邻的右下方和正下方像素点均不为〇,结束判断;并将该点作为此次判断的终点。
[0022] 下面以其中一个最右侧交点(第一右侧交点B)坐标(XB,Yb)为起点为例说明判断 过程:
[0023] (1-3-1)首先判断与B点相邻的右下方像素点Bl的灰度值是否为0 ;如果为0,判 断该点(BI)相邻的右下方像素点Bll的灰度值是否为0 ;
[0024] 否则,以B点为基础,判断与其相邻的正下方像素点B2的灰度值是否为0 ;如果为 0,则以B2为基础判断与其相邻的右下方像素点B21的坐标值是否为O ;依次循环;
[0025] (1-3-2)直到判断出某点的右下方像素点和正下方像素点的灰度值均不为0,结 束判断,并以该点为终点(第一右侧终点Bend),假设坐标值为);
[0026] (1-3-3)判断B,Bend两点之间的距离h是否达到预设的阈值Q ;如果达到阈值,则 认为该终点为有效终点Bend有效;
[0027] (1-3-4)计算B,Bend两点之间的正切值:
并将该值存于类 Vector2 中。
[0028] (1-4)比较Vectorl与Vector2的元素个数;如果Vectorl > Vector2,则判定文 字向右倾斜;如果Vectorl < Vector2,则判定文字向左倾斜。
[0029] (1-5)将选择所述Vectorl与Vector2中元素较多的类,作为倾斜角度判断的依 据;选择其中正切值最小的对应角度值Θ作为文字的倾斜角度。
[0030] 在判断出文字的倾斜方向和倾斜角度的基础上,本发明提供一种图像识别中倾斜 文字的矫正方法,在倾斜角度Θ的基础上,通过仿射变换来实现倾斜文字的矫正。具体的 过程包含以下实现步骤:
[0031] (2-1)在源图像上选择3组坐标值,根据倾斜角度,计算出矫正后的目标图像上的 对应
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1