文本图像的几何校正方法、装置和双目立体视觉系统的制作方法

文档序号:6650647阅读:784来源:国知局
专利名称:文本图像的几何校正方法、装置和双目立体视觉系统的制作方法
技术领域
本发明属于图像处理领域,涉及一种图像处理方法和装置,具体涉及一种文本图像的几何校正方法、装置和双目立体视觉系统。
背景技术
文本图像的采集,主要有两种方式通过扫描仪对文本进行扫描;通过各种相机、摄像头进行拍摄。用扫描仪扫描时,通常要将书稿拆开或展平后再进行扫描,一般情况下不采用。若将书稿直接放在扫描仪上扫描或采用相机、摄像头直接拍摄时,由于书脊、厚度等因素,不可避免使文稿本身产生弯曲等畸变,既影响了图像美观,又影响了后续的OCR识别应用中的版面分析、行提取等处理过程,因此对拍摄得到的文本图像进行几何校正就变得至关重要。目前一般文本图像几何校正的方法主要分为两类一类是通过在图像上设置一些已知的参考点,根据参考点在畸变前后的映射关系进行几何校正,该方法一般的实现过程如下,在待拍摄文本上放置一个模板,拍摄模板图像,获取模板图像上的已知参考点,并与原始模板中的参考点建立映射关系,最后根据该映射关系进行几何校正;另一类方法则直接通过分析文本图像本身的特点进行校正,但该方法无法针对一般的非特定畸变图像进行处理,根据处理得到的该类图像的某些特征进行校正。文本采集主要有两种用途,其一是为了资料的保存,通常用于某些珍贵的资料;其二是用于OCR识别。一般情况下,在图像数据采集过程中都会尽可能在横平竖直的角度采集书页文本图像,这样有利于后续的处理。对于第一类方法,采用一定的模板附于文稿上进行扫描或者拍摄,无论在资料保存还是用于OCR识别,操作都不方便。谷歌公司根据已知的一个迷宫图案模板,利用一套包含两台相机和红外线的系统来解决书页文稿弯曲的问题,作法是将两台红外线相机从不同角度把红外图像拍摄下来,根据这些图像用已知的立体成像技术加以组合取得该图案的3D对应效果,该图案落在书页表面,根据图案的3D图形与书页的3D表面相互对应,从而将书页展平。该方法克服了模板在拍摄过程中放置的不便问题,但是该方法系统复杂,成本高
BPP O对第二类方法,主要是依据文本中文本行的方向作为参考信息进行校正,这种方法较大程度上受到文本内容、排版的影响,对于排版复杂,既有文字,表格,又有花边、插图的文本图像,很难获得较好的校正效果。中国专利CN1804861A通过对图像进行游程涂黑处理,在游程图上划分区段,以段中规则部分带动不规则部分进行校正的方法,较好的解决了某一类文本图像的几何畸变问题。但是该类方法往往要先进行版面分析、二值化等预处理,这些预处理的结果直接影响畸变校正的质量,并且该类方法主要依赖文本行的信息,若文本中既有横排又有竖排的情况,则无能为力。

发明内容
本发明所要解决的技术问题是提出一种文本图像的几何校正方法、装置和双目立体视觉系统,采用双目立体视觉结合曲线拟合的方式重建文本图像,对于复杂图像有良好的校正效果,从而有效改善了图像的视觉效果,利于后续的OCR处理和识别。本发明公开了一种文本图像的几何校正方法,包括如下步骤
步骤一搭建双目立体视觉系统,进行系统标定后获取双目立体视觉系统中两镜头各自的内部参数和相互的外部参数,求取两镜头各自的投影矩阵;
步骤二 对经标定的双目立体视觉系统中两镜头所采集的图像分别进行特征提取,根据提取到的图像特征进行立体匹配,并对得到的匹配点进行提纯;
步骤三根据提纯得到的匹配点和标定后获得的内部参数、外部参数及投影矩阵,计算文本图像中对应点的三维坐标,从而判断文本图像中的文本走势方向;
步骤四根据获得的文本走势方向拟合文本走势曲线,将文本走势曲线离散展开后进行图像重建,从而得到校正后的文本图像。所述步骤一中双目立体视觉系统包括两台同样的第一镜头和第二镜头;第一镜头用于拍摄待校正的文本图像;第二镜头的视野包括第一镜头拍摄的文本图像。所述步骤二中特征提取时,采用尺度不变特征变换方法进行特征提取。所述步骤二中对得到的匹配点进行提纯时,对匹配点连线的角度进行统计,将180°划分为η个区间,统计所有匹配点连线角度落入各个区间的个数,取点个数最多的角度区间作为匹配点连线角度的范围进行初步提纯,然后根据初步提纯后的匹配点间的平均距离进行设定,如果
权利要求
1.一种文本图像的几何校正方法,其特征在于,包括如下步骤步骤一搭建双目立体视觉系统,进行系统标定后获取双目立体视觉系统中两镜头各自的内部参数和相互的外部参数,求取两镜头各自的投影矩阵;步骤二 对经标定的双目立体视觉系统中两镜头所采集的图像分别进行特征提取,根据提取到的图像特征进行立体匹配,并对得到的匹配点进行提纯;步骤三根据提纯得到的匹配点和标定后获得的内部参数、外部参数及投影矩阵,计算文本图像中对应点的三维坐标,从而判断文本图像中的文本走势方向;步骤四根据获得的文本走势方向拟合文本走势曲线,将文本走势曲线离散展开后进行重建,从而得到校正后的文本图像。
2.根据权利要求1所述的方法,其特征在于所述步骤一中双目立体视觉系统包括两台同样的第一镜头和第二镜头;第一镜头用于拍摄待校正的文本图像;第二镜头的视野包括第一镜头拍摄的文本图像。
3.根据权利要求1所述的方法,其特征在于所述步骤二中特征提取时,采用尺度不变特征变换方法进行特征提取。
4.根据权利要求1所述的方法,其特征在于所述步骤二中对得到的匹配点进行提纯时,将180°划分为η个区间,对匹配点连线角度进行统计,取匹配点个数最多的区间对匹配点进行初步提纯,然后根据初步提纯后的匹配点间的平均距离进行设定,如果φ「!.、 <τ其中,τ为设定的阈值,式为当前匹配点间的距离7为匹配点间的平均距离,则当前匹配点为提纯得到的匹配点。
5.根据权利要求4所述的方法,其特征在于所述区间η为36,设定的阈值T为0.1。
6.根据权利要求2所述的方法,其特征在于所述步骤三中判断文本图像中的文本走势方向,包括如下步骤根据设定的子带宽度在横纵两个方向分别对各匹配点进行子带划分;根据每个子带中匹配点对应方向的坐标计算在对应方向上该子带的离散度;在横纵两个方向上分别取对应离散度与匹配点个数乘积最大的子带,分别计算两子带中各匹配点在横纵两个方向上文本图像距第一镜头距离的变化程度,取变化程度较大对应的方向作为文本走势方向。
7.根据权利要求6所述的方法,其特征在于所述步骤四中根据获得的文本走势方向拟合文本走势时,根据文本走势方向选择文本图像中对应点的三维坐标中的X方向或Y方向坐标点,与Z方向坐标点进行曲线拟合,获得文本走势曲线。
8.根据权利要求1所述的方法,其特征在于所述步骤四中将文本走势曲线离散展开时,以水平线与文本走势曲线的交点为基点,计算各离散点相对于基点的曲线长度。
9.根据权利要求1所述的方法,其特征在于所述将文本走势曲线离散展开后进行重建时,根据文本走势曲线离散展开所得的目标位置进行后向映射,计算展开平面对应的文本图像中各坐标点在原图像中的位置,并采用双线性插值的方式进行重建,得到几何校正后的文本图像。
10.根据权利要求8所述的方法,其特征在于所述对文本走势曲线进行展开时,根据匹配点的三维空间坐标及匹配点对应的图像坐标,确定曲线的离散步长,以基点为起点,计算各离散点相对于基点的曲线长度。
11.一种双目立体视觉系统,包括第一镜头、第二镜头,其特征在于所述第一镜头和所述第二镜头并排固定于水平支架上;所述第一镜头用于拍摄待校正的文本图像;所述第二镜头的视野包括第一镜头拍摄的文本图像。
12.—种文本图像的几何校正装置,其特征在于,包括如下模块搭建模块搭建双目立体视觉系统,进行系统标定后获取双目立体视觉系统中两镜头各自的内部参数和相互的外部参数,求取两镜头各自的投影矩阵;提取模块对经标定的双目立体视觉系统中两镜头所采集的图像分别进行特征提取,根据提取到的图像特征进行立体匹配,并对得到的匹配点进行提纯;走势模块根据提纯得到的匹配点和标定后获得的内部参数、外部参数及投影矩阵,计算文本图像中对应点的三维坐标,从而判断文本图像中的文本走势方向;重建模块根据获得的文本走势方向拟合文本走势曲线,将文本走势曲线离散展开后进行重建,从而得到校正后的文本图像。
全文摘要
本发明公开了一种文本图像的几何校正方法、装置和双目立体视觉系统,属于图像处理领域。包括搭建双目立体视觉系统,获取双目立体视觉系统中两镜头各自的内部参数和相互的外部参数,求取两镜头各自的投影矩阵;对双目立体视觉系统中两镜头所采集的图像分别进行特征提取后进行立体匹配,并对得到的匹配点进行提纯;根据得到的匹配点计算文本图像中对应点的三维坐标,判断文本图像中的文本走势方向;根据文本走势方向拟合文本走势曲线,将文本走势曲线离散展开后进行重建,得到校正后的文本图像。本发明不受文本具体内容及排版影响,尤其适用于版面复杂的文本的几何畸变校正,可以用于处理各种类型的文本图像,大大提高了几何畸变校正的适用范围。
文档编号G06K9/46GK102592124SQ20111000701
公开日2012年7月18日 申请日期2011年1月13日 优先权日2011年1月13日
发明者林锦梅 申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1