一种定位弯曲书面基准线的方法

文档序号：8512971阅读：274来源：国知局

一种定位弯曲书面基准线的方法
【专利说明】
所属技术领域
[0001]本发明属于数字图像处理技术领域，涉及一种弯曲书面基准线确定方法。
【背景技术】
[0002]随着现代科技的不断进步和发展，电子产品的大量普及，越来越多的人们选择在电子平台进行阅读和学习。但是大量的文档只有纸质版，这就需要将大量的纸质文档进行电子化。由于数码相机的便携性、方便性，越来越多的人采用数码相机对文档进行图像采集。一些文档由于厚度较大，不能完全的展平，因此采集的图像，大多会出现类似于柱面中间凸、两边凹的现象，后期处理需要根据弯曲书面图像的基准线来计算书面各部分的曲率和深度信息，然后基于这些信息并利用曲面坐标系和平面坐标系之间的关系将弯曲书面展开成平面图像，这就需要提取书面的基准线；一些文档电子化只需要采集文档的文本部分，去除不包含信息的空白部分和不感兴趣的图像部分，这也需要利用图像的基准线信息。基准线提取的精度、速度，决定着下一步工作进行的好坏。

【发明内容】

[0003]本发明的目的是提供一种精度高速度快弯曲书面基准线定位方法，技术方案如下:
[0004]一种定位弯曲书面基准线方法，包括下列步骤:
[0005]I)采集弯曲书面的曲面图像；
[0006]2)对曲面图像进行灰度变换，并进行二值化；
[0007]3)根据图像的像素大小和经验值，删除二值图像中面积小于一个标点符号面积的对象，去除噪声的影响，得到经过预处理后的二值图像；
[0008]4)设定一个矩形，其长度根据两个字体中心之间的水平距离确定，宽度根据字体高度的1/2确定，利用此矩形对二值图像进行形态学的开闭运算，将每行文本连成同一连通区域；
[0009]5)根据文本行的高度预设一个高度阈值，根据文本行的长度预设一个长度阈值；
[0010]6)计算出每个连通区域的高度值和宽度值，将高度值大于此高度阈值的连通区域去除；将长度值短于长度阈值的连通区域去除，然后删除面积小于一个字体面积的对象，最终得到各个文本行连通区域。
[0011]7)分别求6)中得到的各个文本行连通区域的上边界和下边界，然后求出每组上边界和下边界对应横坐标的中值，经过采用三阶函数进行曲线拟合，得到弯曲书面的各个文本行的基准线。
[0012]本发明采用矩形结构对图像进行形态学的开闭运算，求出的文本行连通区域上下边界能够跟文本行的上下边界紧密贴合，使其连通区域不受字体内部比重的影响，求出的中线具有更高的精度。本方法只采用几种形态学的开闭运算和三阶曲线拟合运算，运算简单，具有更高的速度。
【附图说明】
[0013]图1初始图像。
[0014]图2形态学开闭运算后的模糊图像。
[0015]图3只含有文本行部分的模糊图像。
[0016]图4中线定位结果的局部放大图像(文本行中白色线条表示中线)。
[0017]图5基准线定位结果(文本行中黑色线条表示基准线)。
[0018]图6基准线定位结果的局部放大图像(文本行中黑色线条表示基准线)。
[0019]图7文档曲面图像基准线定位的流程图。
【具体实施方式】
[0020]下面结合附图和实施例对本发明进行说明。
[0021]本发明提供的定位方法，将弯曲书面上每个字体的边界框都看作平行四边形，上边框和下边框是平行的，不论书面发生放大、缩小或者弯曲，上下边框的中线都可以看作是文本行的中线，因此采用文本行中线来定位基准线。
[0022]包括下列步骤:
[0023]I)采集弯曲书面的曲面图像，如图1所示。
[0024]2)对曲面图像进行灰度变换，并进行二值化。然后根据图像的像素大小和经验值，删除二值图像中面积小于一个标点符号面积的对象，去除噪声的影响，得到经过预处理后的二值图像。
[0025]3)设定一个矩形，其长度根据两个字体中心之间的水平距离确定，宽度根据字体高度的1/2确定，利用此矩形对图像进行形态学的开闭运算，将每行文本连成同一连通区域，如图2所示。
[0026]4)根据文本行的高度预设一个高度阈值，大小约为文本行高度的三倍；根据文本行的长度预设一个长度阈值，大小约为文本行最大长度的3/4 ;
[0027]5)计算出每个连通区域的高度值和宽度值，将高度值大于高度阈值的连通区域去除，消除书面中高度较高的插图的影响；将长度值短于长度阈值的连通区域去除，消除书面中长度较短的文本行的影响；然后删除面积小于一个字体面积的对象，最终得到剩下的文本行连通区域。如图3所示。
[0028]6)分别求5)中得到的各个文本行连通区域的上边界和下边界，然后求出每组上边界和下边界对应横坐标的中值，如图4所示。对中值采用三阶函数进行曲线拟合，得到弯曲书面的各个文本行的基准线及其对应的方程基准线方程fn(X) = anx3+bnx2+cnx+dn,X e (0，len)，n e (1，N)，N为基准线数量，Ien曲面图像的宽度，fn(x)表示基准线的纵坐标值，X表示基准线的横坐标值，an，bn，cn, dj常数，下标η表示不同的基准线。基准线如图5和6所示。
[0029]本发明提出的基于文本行中线定位基准线的方法，算法不仅定位精度高，而且计算量小，速度快。通过限制连通区域的高度值和宽度值来提取文本行区域，只保留高度小于3倍文本行高度值的连通区域和宽度值大于书面宽度1/10的连通区域，实验结果如图3所示，具有较好的提取结果。
[0030]本发明中线的定位只需要求出每个文本行连通区域的上下边界，再求出上下边界的中线即可，计算量小，同时利于硬件实现，具有实际应用的价值。
【主权项】
1.一种定位弯曲书面基准线方法，包括下列步骤: 1)采集弯曲书面的曲面图像； 2)对曲面图像进行灰度变换，并进行二值化； 3)根据图像的像素大小和经验值，删除二值图像中面积小于一个标点符号面积的对象，去除噪声的影响，得到经过预处理后的二值图像； 4)设定一个矩形，其长度根据两个字体中心之间的水平距离确定，宽度根据字体高度的1/2确定，利用此矩形对二值图像进行形态学的开闭运算，将每行文本连成同一连通区域； 5)根据文本行的高度预设一个高度阈值，根据文本行的长度预设一个长度阈值； 6)计算出每个连通区域的高度值和宽度值，将高度值大于此高度阈值的连通区域去除；将长度值短于长度阈值的连通区域去除，然后删除面积小于一个字体面积的对象，最终得到各个文本行连通区域。 7)分别求6)中得到的各个文本行连通区域的上边界和下边界，然后求出每组上边界和下边界对应横坐标的中值，经过采用三阶函数进行曲线拟合，得到弯曲书面的各个文本行的基准线。
【专利摘要】本发明涉及一种定位弯曲书面基准线方法，包括：对曲面图像进行灰度变换，并进行二值化；去除噪声的影响，得到经过预处理后的二值图像；设定一个矩形对二值图像进行形态学的开闭运算，将每行文本连成同一连通区域；根据文本行的高度预设一个高度阈值，根据文本行的长度预设一个长度阈值；计算出每个连通区域的高度值和宽度值，将高度值大于此高度阈值的连通区域去除；将长度值短于长度阈值的连通区域去除，然后删除面积小于一个字体面积的对象，最终得到各个文本行连通区域；经过采用三阶函数进行曲线拟合，得到弯曲书面的各个文本行的基准线。本发明具有精度高速度快的优点。
【IPC分类】G06T7-00, G06T5-00
【公开号】CN104835119
【申请号】CN201510198135
【发明人】肖夏, 田健飞
【申请人】天津大学
【公开日】2015年8月12日
【申请日】2015年4月23日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖夏;田健飞;
技术所有人：天津大学;
我是此专利的发明人

上一篇：一种基于基准线的弯曲书面展平方法
上一篇：通过两路鱼眼摄像头采集全景图像的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。