一种基于freeman码的文档图像倾斜校正方法

文档序号：36475656发布日期：2023-12-22 06:19阅读：42来源：国知局

本发明属于文档图像倾斜校正，具体涉及一种基于freeman码的文档图像倾斜校正方法。

背景技术：

1、在日常生活中，我们对文档进行拍摄或者扫描时，由于相机聚焦变化、拍照角度、光照等原因，导致生成的电子图像出现倾斜的现象。倾斜的电子文档图像不仅会影响读者的阅读，对ocr识别也会造成影响。所以对文档图像进行倾斜校正很有必要，其中文档倾斜角度检测是校正的核心步骤。

2、目前，常用的倾斜检测算法有投影法、霍夫变换法、近邻法、傅里叶变换法等。由于近邻法的倾角检测精度低，傅里叶变换法的计算量太大，因此这两种方法用的较少。投影法是最为常见的算法之一，它简单直观，但是文档中的插图等非文本图像会对该算法的准确度造成影响；霍夫变换法主要是依据文档图像中的直线进行倾斜角检测，但是当在处理不含直线时和很少文本的图像时会出现检测错误的情况。

3、综上，在对含有插图、表格等复杂文档图像进行倾斜校正时，现有的常用文档图像倾斜算法具有一定的局限性，不具有鲁棒性。基于此，本发明设计了一种基于freeman码的文档图像倾斜校正方法，以解决上述问题。

技术实现思路

1、为解决现有技术存在的上述技术问题，本发明提供一种基于freeman码的文档图像倾斜校正方法，本发明支持含有插图、表格等的复杂文档图像的倾斜校正。

2、本发明采用的技术方案是：

3、一种基于freeman码的文档图像倾斜校正方法，其特征在于，具体包括如下步骤：

4、s1：文档图像预处理；

5、将图像转成灰度图像，对灰度图像进行二值化操作以及形态学处理；

6、s2：图像文本连通块提取；

7、将复杂的文档图像中的文本连通块和其他图像连通块分开，筛选出文本连通块，去除非文本图像，减少文档图像中其他图像对算法准确度的影响，提高算法的鲁棒性；

8、s3：连通块图像细化处理；

9、对文本连通块进行细化处理，提取出文字的骨架，去除骨架中的毛刺，进一步对图像进行去噪，提高算法的准确性；

10、s4：倾角计算；

11、提取每个连通块的轮廓，使用freeman码对文本连通块轮廓进行边界跟踪，进行freeman码计算，计算每个连通块轮廓的链码值以及所占的比例，把竖向和横向方向对应的链码值个数所占比例最高对应的角度作为文档图像的倾斜角；

12、s5：文档图像倾斜校正；

13、根据步骤s4计算出的倾斜角，对文档图像进行旋转转正，进而完成该图像的倾斜校正。

14、进一步的，在步骤s1中，所述文档图像预处理包括以下具体步骤：

15、把原始的文档图像转成灰度图像：读取图像，检测图像的通道数，如果图像为三通道，则将其转换为单通道灰度图像；

16、对灰度图像进行二值化操作：通过使用全局二值化算法对图像进行二值化计算，有利于计算方便，减少文档图像收集时的光照不均的影响；

17、对图像进行形态学处理：对图像进行膨胀操作，使得一个字符尽可能地连接在一起；对图像进行腐蚀操作，使得左右相邻字符可以分离。

18、进一步的，在步骤s2中，所述图像文本连通块提取包括以下具体步骤：

19、寻找图像所有连通块:使用种子填充算法中的八连接算法，提取出所有连通域，记录每个连通域外接矩形框的面积；

20、提取文本连通域:使用面积阈值法去除非文本连通域，计算出所有连通块外接矩形框的平均面积，下限面积为平均面积的0.5倍，上限面积为平均面积的4倍，当连通块外接矩形框的面积在该面积范围内时，说明该连通块为文本连通块，去除图像中的非文本连通块。

21、进一步的，在步骤s3中，所述连通块图像细化处理包括以下具体步骤：

22、图像细化：对筛选出的文本连通块进行细化处理，使用zhang-suen算法提取出文字骨架；

23、去除骨架毛刺:由于在骨架提取的过程中，由于提取方法的不同以及噪声的干扰，都会产生不同程度的毛刺，通过毛刺长度阈值判断毛刺，将其去除，提高算法的准确率。

24、进一步的，在步骤s4中，所述倾角计算包括以下具体步骤：

25、选定测试角度范围；

26、对于每个测试角，将原始的文档图像进行旋转，提取已去除毛刺的文本连通块的轮廓；

27、计算出每个连通块轮廓的方向，使用freeman码进行边界跟踪，计算出的freeman码值代表了该连通块的整体方向；

28、在每个连通块freeman码中，统计竖向和横向方向对应的链码值个数所占的比例；

29、如果连通块数大于3，则去除正向链码比例最高和最低项，再取平均值，平均值最高所对应的角度则为倾斜角。

30、与现有技术相比，本发明的有益效果体现在：

31、1.本发明支持含有插图、表格等的复杂文档图像，基于连通块外接矩形框面积阈值法筛选出了文本连通块；

32、2.本发明通过文字骨架提取和去毛刺处理，进一步去除文档图像中的噪声点，提高算法的精度；

33、3.通过对文本骨架进行freeman码边界跟踪，得到文本的整体方向，最后选出横向和竖向所占比例最高对应的角度作为倾斜角，考虑了文档图像整体，保证了算法的准确性。

技术特征：

1.一种基于freeman码的文档图像倾斜校正方法，其特征在于，具体包括如下步骤：

2.根据权利要求1所述的一种基于freeman码的文档图像倾斜校正方法，其特征在于，在步骤s1中，所述文档图像预处理包括以下具体步骤：

3.根据权利要求1所述的一种基于freeman码的文档图像倾斜校正方法，其特征在于，在步骤s2中，所述图像文本连通块提取包括以下具体步骤：

4.根据权利要求1所述的一种基于freeman码的文档图像倾斜校正方法，其特征在于，在步骤s3中，所述连通块图像细化处理包括以下具体步骤：

5.根据权利要求1所述的一种基于freeman码的文档图像倾斜校正方法，其特征在于，在步骤s4中，所述倾角计算包括以下具体步骤：

技术总结
本发明公开了一种基于freeman码的文档图像倾斜校正方法，具体包括：步骤一，图像预处理，将图像转换为灰度图像，进行二值化、形态学操作；步骤二，图像有效文本连通块提取，去除图像中的非文本图像；步骤三，连通块图像细化处理，提取文本连通块骨架，对其进行去毛刺处理；步骤四，倾角计算，提取文本连通块骨架的轮廓，对其进行freeman码边界跟踪，计算每个连通块轮廓的链码值以及所占的比例，把竖向和横向方向对应的链码值个数所占比例最高对应的角度作为旋转角度；步骤五，文档图像倾斜校正。本发明支持含有插图、表格等的复杂文档图像。

技术研发人员：季白杨,蔡梦菲
受保护的技术使用者：浙江工业大学
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：季白杨蔡梦菲
技术所有人：浙江工业大学
我是此专利的发明人

上一篇：一种耐的制作方法
上一篇：一种引线框架排片传输装置及排片传输方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。