一种基于弧微分的图像中畸变表格校正系统及其校正方法与流程

文档序号:31586146发布日期:2022-09-21 01:56阅读:67来源:国知局
一种基于弧微分的图像中畸变表格校正系统及其校正方法与流程

1.本发明涉及图像处理,图像文字校正技术领域,是一种基于弧微分的图像中畸变表格校正系统及其校正方法。


背景技术:

2.通过高拍仪等相机拍摄的方式对纸质文档进行采集的过程中,由于纸质文档放置方向倾斜、或本身不平整,从而导致采集的图像中表格线呈倾斜弯曲的状态,文字呈倾斜畸变状态。这会严重影响ocr识别的准确度。为了提高识别的准确度,需对采集的表格图像进行校正。已有技术用于表格图像的校正,如通过游程分析检测表格图像中最长的游程,将该游程的倾斜角度作为倾斜矫正的依据。类似的,通过hough变换检测图像中的直线,再根据倾角进行全局的旋转调整。投影法也可实现倾斜校正,设定旋转间隔后对图像进行多个角度的旋转,每次旋转后计算其水平方向和垂直方向投影的标准差,标准差取得最大时对应的旋转角度为表格的倾斜角度。此外,基于文本行最小外接矩形的方式,首先通过形态学的操作合并文字为行单位,从而得到每一文本行的最小外接矩形,外接矩形的倾斜角度即为文本行的倾斜角度。此类方法的不足在于仅适用于图像采集时,由于纸质文档在水平方向上发生倾斜而产生的图像内表格倾斜校正,不适用于文档发生弯曲畸变导致的图像中表格线畸变的校正。


技术实现要素:

3.本发明为克服现有技术的不足,本发明目的是提供基于弧微分的图像中畸变表格校正方法。用以改善现有技术对于图像中畸变表格校正能力的不足。本发明提供了一种基于弧微分的图像中畸变表格校正系统及其校正方法,本发明提供了以下技术方案:
4.一种基于弧微分的图像中畸变表格校正方法,所述方法包括以下步骤:
5.步骤1:对表格图像进行二值化处理,确定背景和表格文字;
6.步骤2:对二值化后的图像进行表格线提取,提取处表格线;
7.步骤3:建立拟合表格线函数,拟合表格线;
8.步骤4:根据拟合后的表格线,进行表格线校正;
9.步骤5:根据校正后的表格线,对图像中表格文字进行校正。
10.优选地,所述步骤1具体为:
11.通过大津法对图像进行全局的二值化处理,属于背景的像素值为255,属于表格、文字等像素的像素值为0。
12.优选地,所述步骤2具体为:
13.步骤2.1:进行表格线候选,将对应的x方向和y方向坐标之和最小的非背景点作为起始点,开始遍历其他非背景点;
14.步骤2.3:当其他非背景点与该点存在邻接关系,则构成候选表格线游程,继续遍历其他非背景点,当其他非背景点与游程邻接,则对游程进行拓展,直到没有进行合并的
点;再从未被合并的非背景点中,按照同样的方式选择起始点后重复上述过程;
15.步骤2.3:进行表格线筛选,根据长度筛选候选表格线,过滤长度较短的候选表格线,只保留长度高于设定阈值的表格线。
16.优选地,所述步骤3具体为:
17.对表格线进行函数拟合,根据构成表格线的所有点的坐标信息拟合表格线的函数,记为f1,f2,

,fm;
18.对于表格线弯曲方向满足任意riemann可积函数y=f(x),以表格线起始点(x0,y0)为准,将表格线上其他的点映射到y=y0上,在表格线起始点x0处的导数表示为在xi点处的导数用估计,则第i点(xi,yi)对应的校正后的坐标点为)对应的校正后的坐标点为
19.优选地,所述步骤4具体为:
20.对表格中的文字进行校正,将不属于的表格线的非背景像素点作为文字像素点。
21.优选地,
22.对文字像素点的校正方法具体为:确定表格线对点的修正坐标,以点到各个表格线的距离归一化结果作为权重的加和估计中间点修直后的位置;修正后的坐标点为其中选定p=2,表示与点距离最近的上下两条曲线进行加权,采用相邻两个函数值的线性插值估计修正后的位置。
23.一种基于弧微分的图像中畸变表格校正系统,所述系统包括:
24.二值化模块,所述二值化模块对表格图像进行二值化处理,确定背景和表格文字;
25.提取模块,所述提取模块对二值化后的图像进行表格线提取,提取处表格线;
26.拟合模块,所述拟合模块建立拟合表格线函数,拟合表格线;
27.表格线校正模块,所述表格线校正模块根据拟合后的表格线,进行表格线校正;
28.文字校正模块,所述文字校正模块根据校正后的表格线,对图像中表格文字进行校正。
29.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现基于弧微分的图像中畸变表格校正方法。
30.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行基于弧微分的图像中畸变表格校正方法。
31.本发明具有以下有益效果:
32.本发明通过弧微分校正表格线,既适用于文档图像中表格倾斜的场景,又适用于表格线弯曲的场景。从而能够将表格校正到一个理想的状态,进而有利于提高表格结构分析和内容识别的准确性。
33.本发明与现有技术相比,根据弧微分校正表格,既适用于文档图像中表格倾斜的场景,又适用于表格线弯曲的场景。从而能够将表格校正到一个较为理想的状态,进而有利
于提高表格结构分析和内容识别的准确性。
附图说明
34.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
35.图1为基于弧微分的图像中畸变表格校正方法流程图。
具体实施方式
36.下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
37.在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
38.在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
39.此外,下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
40.以下结合具体实施例,对本发明进行了详细说明。
41.具体实施例一:
42.根据图1所示,本发明为解决上述技术问题采取的具体优化技术方案是:本发明涉及一种基于弧微分的图像中畸变表格校正系统及其校正方法。一种基于弧微分的图像中畸变表格校正方法,所述方法包括以下步骤:
43.步骤1:对表格图像进行二值化处理,确定背景和表格文字;
44.步骤2:对二值化后的图像进行表格线提取,提取处表格线;
45.步骤3:建立拟合表格线函数,拟合表格线;
46.步骤4:根据拟合后的表格线,进行表格线校正;
47.步骤5:根据校正后的表格线,对图像中表格文字进行校正。
48.具体实施例二:
49.本技术实施例二与实施例一的区别仅在于:
50.通过大津法对图像进行全局的二值化处理,属于背景的像素值为255,属于表格、文字等像素的像素值为0。
51.具体实施例三:
52.本技术实施例三与实施例二的区别仅在于:
53.所述步骤2具体为:
54.步骤2.1:进行表格线候选,将对应的x方向和y方向坐标之和最小的非背景点作为起始点,开始遍历其他非背景点;
55.步骤2.3:当其他非背景点与该点存在邻接关系,则构成候选表格线游程,继续遍历其他非背景点,当其他非背景点与游程邻接,则对游程进行拓展,直到没有进行合并的点;再从未被合并的非背景点中,按照同样的方式选择起始点后重复上述过程;
56.步骤2.3:进行表格线筛选,根据长度筛选候选表格线,过滤长度较短的候选表格线,只保留长度高于设定阈值的表格线。
57.具体实施例四:
58.本技术实施例四与实施例三的区别仅在于:
59.所述步骤3具体为:
60.对表格线进行函数拟合,根据构成表格线的所有点的坐标信息拟合表格线的函数,记为f1,f2,

,fm;
61.对于表格线弯曲方向满足任意riemann可积函数y=f(x),以表格线起始点(x0,y0)为准,将表格线上其他的点映射到y=y0上,在表格线起始点x0处的导数表示为在xi点处的导数用估计,则第i点(xi,yi)对应的校正后的坐标点为)对应的校正后的坐标点为
62.具体实施例五:
63.本技术实施例五与实施例四的区别仅在于:
64.所述步骤4具体为:
65.对表格中的文字进行校正,将不属于的表格线的非背景像素点作为文字像素点。
66.具体实施例六:
67.本技术实施例六与实施例五的区别仅在于:
68.对文字像素点的校正方法具体为:确定表格线对点的修正坐标,以点到各个表格线的距离归一化结果作为权重的加和估计中间点修直后的位置;修正后的坐标点为其中选定p=2,表示与点距离最近的上下两条曲线进行加权,采用相邻两个函数值的线性插值估计修正后的位置。
69.具体实施例七:
70.本技术实施例七与实施例六的区别仅在于:
71.一种基于弧微分的图像中畸变表格校正系统,所述系统包括:
72.二值化模块,所述二值化模块对表格图像进行二值化处理,确定背景和表格文字;
73.提取模块,所述提取模块对二值化后的图像进行表格线提取,提取处表格线;
74.拟合模块,所述拟合模块建立拟合表格线函数,拟合表格线;
75.表格线校正模块,所述表格线校正模块根据拟合后的表格线,进行表格线校正;
76.文字校正模块,所述文字校正模块根据校正后的表格线,对图像中表格文字进行校正。
77.具体实施例八:
78.本技术实施例八与实施例七的区别仅在于:
79.本发明提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行,以用于实现基于弧微分的图像中畸变表格校正方法。
80.具体实施例九:
81.本技术实施例九与实施例八的区别仅在于:
82.本发明提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时,所述处理器执行基于弧微分的图像中畸变表格校正方法。
83.以上所述仅是一种基于弧微分的图像中畸变表格校正系统及其校正方法的优选实施方式,一种基于弧微分的图像中畸变表格校正系统及其校正方法的保护范围并不仅局限于上述实施例,凡属于该思路下的技术方案均属于本发明的保护范围。应当指出,对于本领域的技术人员来说,在不脱离本发明原理前提下的若干改进和变化,这些改进和变化也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1