影像资料歪斜侦测校正方法与装置的制作方法

文档序号:7944973阅读:116来源:国知局
专利名称:影像资料歪斜侦测校正方法与装置的制作方法
技术领域
本发明是为一种影像资料歪斜侦测校正方法与装置,尤指应用于影像 处理装置中的影像资料歪斜侦测校正方法与装置。
背景技术
随着光电技术的提升,产业界发展出了许多将纸张文件转为电磁数据 文件的装置,例如扫描机、复印机、传真机或实物投影机等等,为了能 排除纸张文件在扫描或摄影时不慎放歪,或是改善纸张传送过程中可能造 成的文件歪斜,各类装置中都运用了一些文件影像歪斜侦测与校正
(skewed document detection/correction)的技术。而此类技术的困难多
数存在于如何将文件中非文字的图形去除。其中较关键的现有技术有(i) 将相邻的像素(Pixel)全连结在一起成为新的对象,统计并留下可能为文 字的对象,然后将其余对象删除。但这需要可观的存储器容量,而且这样 的作法对于字号及影像噪声有一定的要求。(ii)利用某些运算,将文字的 部份化为一条条的直线,继而计算出这些直线的角度判断出该旋转的角 度。而除了去除文件中的图形之外,也有不理会文件内容,利用文件颜色 与背景颜色的差异性得到文件的四个角落或是边界,直接得到歪斜量,但 是此种技术在颜色差异不大或是边界不在扫瞄范围内的状况下就无法生 效。但无论如何,现存可靠的估算方法大多都脱离不了需要大量的存储器 储存分类、统计的信息而不利于使用硬件实现。因此,如何改善上述缺点 则为发展本发明的主要目的。

发明内容
本发明是为一种影像资料歪斜侦测校正方法,应用于一影像资料与一影像处理装置中,该方法包含下列步骤对该影像资料进行一二值化处理, 用以获得每个像素值仅需用一个位表达的一二值影像资料;对该二值影像 资料进行多种角度旋转,进而得到多个待测二值影像资料;将所述待测二 值影像资料中每一水平列的像素值分别进行加总而得到对应所述二值影
像资料的多个水平投影量统计曲线;对所述水平投影量统计曲线分别进行
一高通滤波程序,用以将所述水平投影量统计曲线中的低频噪声去除而得
到多个高频信号曲线;对所述高频信号曲线分别进行一总和的运算而算出 相对应的多个索引值;以及因应所述索引值中的最大值所对应的待测二值 影像资料的该旋转角度,进而对该影像资料进行歪斜的校正。
根据上述构想,本发明所述的影像资料歪斜侦测校正方法,其中该影 像资料是由一原始影像资料进行尺寸縮减而得。
根据上述构想,本发明所述的影像资料歪斜侦测校正方法,其中在进 行该二值化处理之前,是先对该影像资料进行一亮度转换及去除噪声的动 作,其是以一r^n窗口为单位来对该縮小后影像资料进行判断,当r^n的 窗口内有超过半数以上的像素的灰阶值是偏黑的,便将n*n的窗口内所有 的像素点进行亮度反转,并于二值化处理后的二值影像以内插或外插的方 式重建窗口边界部份。
根据上述构想,本发明所述的影像资料歪斜侦测校正方法,其中对该 二值影像资料进行多种角度旋转而得到多个待测二值影像资料是包含下 列步骤对该二值影像资料进行一预设角度的旋转而得到一个经预设角度 旋转的另一待测二值影像资料;以及当旋转角度还在一搜寻角度范围内 时,再对该另一待测二值影像资料进行该预设角度的旋转而得到再一待测 二值影像资料。
根据上述构想,本发明所述的影像资料歪斜侦测校正方法,其中对所 述高频信号曲线分别进行的该总和的运算,是仅将所述高频信号曲线中大 于零的数值来进行平方总和。
根据上述构想,本发明所述的影像资料歪斜侦测校正方法,其中因应 所述索引值中的最大值所对应的待测二值影像资料的该旋转角度而对该 影像资料进行歪斜的校正,是为将该最大值所对应的该旋转角度进行反相 而得到该影像资料的歪斜角度。本发明的另一方面是为一种影像资料歪斜侦测校正装置,应用于一影 像资料与一影像处理装置中,该装置包含 一歪斜侦测模块,接收该影像 资料并进行一二值化处理,用以获得每个像素值仅需用一个位表达的一二 值影像资料,并对该二值影像资料进行多种角度旋转,进而得到多个待测 二值影像资料,再将所述待测二值影像资料中每一水平列的像素值分别进 行加总而得到对应所述二值影像资料的多个水平投影量统计曲线,然后对 所述水平投影量统计曲线分别进行一高通滤波程序,用以将所述水平投影 量统计曲线中的低频噪声去除而得到多个高频信号曲线,再对所述高频信 号曲线分别进行一总和的运算而算出相对应的多个索引值,接着因应所述 索引值中的最大值所对应的待测二值影像资料的该旋转角度,进而侦测出 该影像资料的一歪斜角度;以及一影像旋转校正模块,信号连接至该歪斜 侦测模块,其是根据该歪斜角度来将该影像资料进行旋转校正,进而得到 一校正后影像资料。
根据上述构想,本发明所述的影像资料歪斜侦测校正装置,其中该影 像资料是由一原始影像资料进行尺寸縮减而得,而该影像旋转校正模块是 根据该歪斜角度来将该原始影像资料进行旋转校正,进而得到一校正后的 原始影像资料。
根据上述构想,本发明所述的影像资料歪斜侦测校正装置,其中该歪 斜侦测模块包含 一预处理模块,其是接收该影像资料并进行一二值化处 理,用以获得每个像素值仅需用一个位表达的一二值影像资料; 一存储器, 信号连接于该预处理模块,其是用以储存该二值影像资料; 一投影量处理 器,信号连接于该存储器,其是将所述待测二值影像资料中每一水平列的 像素值分别进行加总而得到对应所述二值影像资料的多个水平投影量统 计曲线; 一高通滤波器,信号连接于该投影量处理器,其是对所述水平投 影量统计曲线分别进行一高通滤波程序,用以将所述水平投影量统计曲线 中的低频噪声去除而得到多个高频信号曲线;以及一统计数据搜集与歪斜 角度决定器,信号连接于该影像旋转校正模块、该高通滤波器与该存储器, 其是对该存储器中的该二值影像资料进行多种角度旋转,进而得到多个待 测二值影像资料,并对所述高频信号曲线分别进行一总和的运算而算出相 对应的多个索引值,接着因应所述索引值中的最大值所对应的待测二值影像资料的该旋转角度,进而侦测出该影像资料的该歪斜角度并传送给该影 像旋转校正模块。
根据上述构想,本发明所述的影像资料歪斜侦测校正装置,其中该预 处理模块在进行该二值化处理之前,是先对该影像资料进行一亮度转换及 去除噪声的动作,其是以一 n*n窗口为单位来对该縮小后影像资料进行判 断,当n納的窗口内有超过半数以上的像素的灰阶值是偏黑的,便将n水n 的窗口内所有的像素点进行亮度反转,并于二值化处理后的二值影像以内 插或外插的方式重建窗口边界部份。
根据上述构想,本发明所述的影像资料歪斜侦测校正装置,其中该统 计数据搜集与歪斜角度决定器对所述高频信号曲线分别进行的该总和的 运算,是仅将所述高频信号曲线中大于零的数值来进行平方总和。
根据上述构想,本发明所述的影像资料歪斜侦测校正装置,其中该统 计数据搜集与歪斜角度决定器因应所述索引值中的最大值所对应的待测 二值影像资料的该旋转角度而侦测出该影像资料的该歪斜角度,是为将该 最大值所对应的该旋转角度ift行反相而得到该影像资料的歪斜角度。


本发明得由下列附图及说明,以便进一步深入的了解,其中 图1是本发明为改善现有手段缺点所发展出来的一影像资料歪斜侦测 与校正装置的较佳实施例功能方块示意图。
图2是本发明为改善现有手段缺失所发展出来的一文件影像歪斜侦测
与校正方法的较佳实施例步骤流程图。
图3(a)、 (b)是本发明将影像资料中每一水平列的像素值分别进行加
总而得到水平投影量统计曲线的示意图。
图4(a) 、 (b)是本发明将水平投影量统计曲线通过高通滤波器后的曲 线示意图。
图5是本发明对影像进行亮度反转的效果比较示意图。 图6是为本发明在二值化后的二值影像相对应的位置上直接删除窗口
边界上的高频噪声,再将空白部份以附近像素以外插或是内插的方式重建
的流程示意图。
具体实施例方式
请参见图1,其是本发明为改善现有手段缺点所发展出来的一影像资 料歪斜侦测与校正装置2的较佳实施例功能方块示意图。其中通过影像撷 取手段所得到的一原始影像资料1将先经过本发明所发展出来的歪斜侦测 模块21而得到一歪斜角度,然后再把该歪斜角度传送给影像旋转校正模
块22,于是,影像旋转校正模块22便可根据该歪斜角度来将该原始影像
资料l进行旋转校正,进而得到一校正后影像资料,然后再送到后端的显 示单元31或储存单元32来进行应用。
而本发明的歪斜侦测模块21主要由预处理模块210、存储器211、投 影量处理器212、高通滤波器213、统计数据搜集与歪斜角度决定器214 来组成,并可执行如图2所示的文件影像歪斜侦测与校正方法的较佳实施 例步骤流程图,细节叙述如下
一开始,预处理模块210可将接收到的原始影像资料1进行一尺寸縮 减程序(步骤41),其主要是将原始影像资料进行尺寸縮减,例如将影像尺 寸縮小至256X192的像素分辨率,用以节省后续运算的存储器使用量。 当然也可省略此一程序,只是存储器使用量会较大,资料运算的负担也较 大。
预处理模块210接着对縮小后影像资料进行一预处理程序,主要是进 行一二值化处理,用以获得每个像素值仅需用一个位表达的一二值影像资 料并存放至存储器211中(步骤42)。
接着,投影量处理器212将存储器211中的待测二值影像资料中每一 水平列的像素值(O或l)分别进行加总而得到该待测二值影像资料的一水 平投影量统计曲线,并利用高通滤波器213来将水平投影量统计曲线中的 低频噪声去除而相对应得到一高频信号曲线(步骤43),最后送到统计数据 搜集与歪斜角度决定器214来进行平方总和的运算(square sum)而算出一 索引值(步骤44)。
接着,统计数据搜集与歪斜角度决定器214对存储器211中的二值影 像资料进行一预设角度的旋转而得到一个经预设角度旋转的另一待测二 值影像资料(步骤45),然后当该旋转角度还在一搜寻角度范围内时,再进
9行上述步骤43与步骤44,而得到与该预设角度相对应的另一索引值,直
到判断出该预设角度已不在该搜寻角度范围后(步骤46)才结束,最后可以
从所有索引值中找出一最大值,而该最大值所对应的该旋转角度的反相值
便判断为该影像资料的歪斜角度(步骤47)。
于是该歪斜角度可传送给影像旋转校正模块22,让影像旋转校正模块 22可根据该歪斜角度来将该原始影像资料1进行旋转校正,进而得到该校 正后影像资料给后端的显示单元31进行显示或给储存单元32来进行储 存。至于上述统计数据搜集与歪斜角度决定器214中的该预设角度与搜寻 角度范围可通过一应用程序接口 30来完成设定。
而上述步骤42中对縮小后影像资料进行二值化处理之前,本发明还 可对縮小后影像资料先进行一亮度反转的动作,其主要以一n化的窗口为 单位来对该縮小后影像资料进行判断,当n*n的窗口内有超过半数以上的 像素的灰阶值是偏黑的,例如在8*8的窗口及白到黑的灰阶值范围为0至 255时,而有32个以上的像素的灰阶值大于128。则将8*8的窗口内所有 的像素点进行亮度反转,如此利用窗口来将整个縮小后影像资料都扫描处 理完后,再接着进行后续的二值化处理。而上述动作可针对现有手段经常 误判的黑底白字样式的文件影像进行亮度反转,用以增强文字特性及消除 部份的噪声,如此可将非文字部份造成的干扰减低,增加校正的正确度。 其效果可由图5的示意图看出,其中黑底白字原始图案51若直接进行二 值化运算将得到图案52,而图案52的文字特性将与图形产生混淆,容易 造成误判。但若是通过8*8的窗口 53扫描与亮度反转运算后,将得到如 图案54所示的结果,再将图案54进行二值化运算将得到图案55,可清楚 看出,图案55的文字特性被有效地增强,进而可降低误判的机率。而窗 口的大小当然可以任意改变,主要是可随对縮小后影像资料的尺寸来进行 调整。然而,要注意的是这样的亮度反转的方法可能让相邻窗口的亮度发 生剧烈变化,这在二值化的运算上会产生额外不想要的高频噪声,例如图 6中图案6的锯齿状黑线600,幸而它仅会发生在窗口的边界上,我们只 要在二值化后的二值影像相对应窗口边界的位置上直接删除此高频噪声 而成为如图6中图案60的格状空白601,接着将空白部份以附近像素以外 插或是内插的方式重建,例如图6中窗口 61的示例,根据内部相邻像素的像素值来重建出格状空白上的像素值,则可让重建完成的图案62上的 高频噪声不显著。
至于将影像资料中每一水平列的像素值分别进行加总而得到水平投
影量统计曲线的附图可参见图3(a)、 (b)所示的示意图,由其中可明显看
出,将图形中每一水平列上的像素值加总所得到的水平投影量统计曲线,
在纯文字的文件影像上,可以发现图3(a)所示的未歪斜的水平投影量峰值 (图中为60)会比图3(b)所示的歪斜些微角度的水平投影量峰值(图中为 40)来得高。
然而,上述方法所得到的水平投影量统计曲线的峰值在具有密密麻麻 文字的文件中旋转了一定的角度后,或是文件中掺杂了非文字的图形状况 下,往往就不太具有参考价值。但是,我们发现,文件的水平投影量除了 峰值的特性外,还有个更明显的特征在于未经旋转的文件水平投影量有着 波峰波谷的显著差异。因此,这里我们利用高通滤波器213来将水平投影 量统计曲线中的直流成分的低频噪声去除而得到投影量统计曲线中的属 于交流成分的高频信号曲线,用以将波峰波谷的差异特性筛选出来,例如 图4(a)、 (b)的所示,此举可弱化己歪斜文件的水平投影量或是相较于文 字、表格等,较不规则的图形投影量部份。而高通滤波器213可用常见的 有限脉冲滤波器(Finite I即ulse Response, FIR)来完成。
接着,投影量统计曲线中属于交流成分的高频信号曲线最后送到统计 数据搜集与歪斜角度决定器214来进行平方总和的运算(square sum)而算 出一索引值,其还可以只是将高频信号曲线上大于0的部份作平方总和的 运算(square sum)来作为索引值的组成,用以增加最大峰值的权重。
再者,为能找出可将已歪斜文件转正的正确角度,本发明可采用两阶 段方式来进行搜寻。首先,第一阶段中是从0度开始,而在搜寻角度范围 为正负45度内,以每次改变预设角度5度的方式来旋转,用以得到多个 经预设角度旋转的影像资料,再进而得到相对应于所述经预设角度旋转影 像资料的多个索引值,并可从其中找出一个最大值所对应出的一第一阶段 旋转角度。然后再从第一阶段中找到的该第一阶段旋转角度为中心,在搜 寻角度范围为正负5度内,以每次改变预设角度1度的方式来旋转影像资 料,然后再从中得到相对应于所述经预设角度旋转影像资料的多个索引值,最后再从其中找出一个最大值所对应出的一第二阶段旋转角度,而根 据第一阶段旋转角度与第二阶段旋转角度便可推算出该文件的歪斜角度。
于是该歪斜角度可传送给影像旋转校正模块22,让影像旋转校正模块22
可根据该歪斜角度来将该原始影像资料1进行旋转校正,进而得到该校正
后影像资料给后端的显示单元31进行显示或给储存单元32来进行储存。 综上所述,本发明针对可应用于扫描机、复印机、传真机或实物投影 机等装置上的文件影像歪斜侦测与校正技术提出了一新作法,在不需将文 件中非文字的图形去除的前提下,以较少的硬件资源便可完成歪斜侦测与 校正。因此可改善需要大量的存储器储存分类、统计的信息而不利于使用 硬件实现的先前技术手段。而且本发明方法可广泛应用于具有影像处理装 置的光电系统之上,故本发明得由熟习此技术的人士任施匠思而为诸般修 饰,然皆不脱本发明的权利要求范围所欲保护的内容。
权利要求
1.一种影像资料歪斜侦测校正方法,应用于一影像资料与一影像处理装置中,该方法包含下列步骤对该影像资料进行一二值化处理,用以获得每个像素值仅需用一个位表达的一二值影像资料;对该二值影像资料进行多种角度旋转,进而得到多个待测二值影像资料;将所述待测二值影像资料中每一水平列的像素值分别进行加总而得到对应所述二值影像资料的多个水平投影量统计曲线;对所述水平投影量统计曲线分别进行一高通滤波程序,用以将所述水平投影量统计曲线中的低频噪声去除而得到多个高频信号曲线;对所述高频信号曲线分别进行一总和的运算而算出相对应的多个索引值;以及因应所述索引值中的最大值所对应的待测二值影像资料的该旋转角度,进而对该影像资料进行歪斜的校正。
2. 如权利要求1所述的影像资料歪斜侦测校正方法,其中该影像资料 是由一原始影像资料进行尺寸縮减而得。
3. 如权利要求1所述的影像资料歪斜侦测校正方法,其中在进行该二 值化处理之前,是先对该影像资料进行一亮度转换及去除噪声的动作,其 是以一Wri窗口为单位来对该縮小后影像资料进行判断,当n*n的窗口内 有超过半数以上的像素的灰阶值是偏黑的,便将r^n的窗口内所有的像素 点进行亮度反转,并于该二值化处理后的该二值影像资料以内插或外插的 方式重建窗口边界部份。
4. 如权利要求1所述的影像资料歪斜侦测校正方法,其中对该二值影 像资料进行多种角度旋转而得到多个待测二值影像资料是包含下列步骤对该二值影像资料进行一预设角度的旋转而得到一个经预设角度旋 转的另一待测二值影像资料;以及当旋转角度还在一搜寻角度范围内时,再对该另一待测二值影像资料 进行该预设角度的旋转而得到再一待测二值影像资料。
5. 如权利要求1所述的影像资料歪斜侦测校正方法,其中对所述高频 信号曲线分别进行的该总和的运算,是仅将所述高频信号曲线中大于零的 数值来进行平方总和。
6. 如权利要求1所述的影像资料歪斜侦测校正方法,其中因应所述索 引值中的最大值所对应的待测二值影像资料的该旋转角度而对该影像资 料进行歪斜的校正,是为将该最大值所对应的该旋转角度进行反相而得到 该影像资料的歪斜角度。
7. —种影像资料歪斜侦测校正装置,应用于一影像资料与一影像处理 装置中,该装置包含一歪斜侦测模块,接收该影像资料并进行一二值化处理,用以获得每 个像素值仅需用一个位表达的一二值影像资料,并对该二值影像资料进行 多种角度旋转,进而得到多个待测二值影像资料,再将所述待测二值影像 资料中每一水平列的像素值分别进行加总而得到对应所述二值影像资料 的多个水平投影量统计曲线,然后对所述水平投影量统计曲线分别进行一 高通滤波程序,用以将所述水平投影量统计曲线中的低频噪声去除而得到 多个高频信号曲线,再对所述高频信号曲线分别进行一总和的运算而算出 相对应的多个索引值,接着因应所述索引值中的最大值所对应的待测二值 影像资料的该旋转角度,进而侦测出该影像资料的一歪斜角度;以及一影像旋转校正模块,信号连接至该歪斜侦测模块,其是根据该歪斜 角度来将该影像资料进行旋转校正,进而得到一校正后影像资料。
8. 如权利要求7所述的影像资料歪斜侦测校正装置,其中该影像资料 是由一原始影像资料进行尺寸縮减而得,而该影像旋转校正模块是根据该 歪斜角度来将该原始影像资料进行旋转校正,进而得到一校正后的原始影 像资料。
9. 如权利要求7所述的影像资料歪斜侦测校正装置,其中该歪斜侦测模块包含一预处理模块,其是接收该影像资料并进行一二值化处理,用以获得每个像素值仅需用一个位表达的一二值影像资料;一存储器,信号连接于该预处理模块,其是用以储存该二值影像资料; 一投影量处理器,信号连接于该存储器,其是将所述待测二值影像资 料中每一水平列的像素值分别进行加总而得到对应所述二值影像资料的多个水平投影量统计曲线;一高通滤波器,信号连接于该投影量处理器,其是对所述水平投影量 统计曲线分别进行一高通滤波程序,用以将所述水平投影量统计曲线中的低频噪声去除而得到多个高频信号曲线;以及一统计数据搜集与歪斜角度决定器,信号连接于该影像旋转校正模 块、该高通滤波器与该存储器,其是对该存储器中的该二值影像资料进行 多种角度旋转,进而得到多个待测二值影像资料,并对所述高频信号曲线 分别进行一总和的运算而算出相对应的多个索引值,接着因应所述索引值 中的最大值所对应的待测二值影像资料的该旋转角度,进而侦测出该影像 资料的该歪斜角度并传送给该影像旋转校正模块。
10. 如权利要求9所述的影像资料歪斜侦测校正装置,其中该预处理 模块在进行该二值化处理之前,是先对该影像资料进行一亮度转换及去除 噪声的动作,其是以一肿n窗口为单位来对该縮小后影像资料进行判断, 当n*n的窗口内有超过半数以上的像素的灰阶值是偏黑的,便将Mn的窗 口内所有的像素点进行亮度反转,并于该二值化处理后的该二值影像资料 以内插或外插的方式重建窗口边界部份。
11. 如权利要求9所述的影像资料歪斜侦测校正装置,其中该统计数 据搜集与歪斜角度决定器对所述高频信号曲线分别进行的该总和的运算, 是仅将所述高频信号曲线中大于零的数值来进行平方总和。
12. 如权利要求9所述的影像资料歪斜侦测校正装置,其中该统计数 据搜集与歪斜角度决定器因应所述索引值中的最大值所对应的待测二值 影像资料的该旋转角度而侦测出该影像资料的该歪斜角度,是为将该最大 值所对应的该旋转角度进行反相而得到该影像资料的歪斜角度。
全文摘要
本发明是为一种影像资料歪斜侦测校正方法与装置,应用于影像资料与影像处理装置中,该装置包含歪斜侦测模块以及影像旋转校正模块,该方法包含下列步骤歪斜侦测模块接收该影像资料并进行二值化处理,用以获得二值影像资料;对二值影像资料进行多种角度旋转,进而得到多个待测二值影像资料;将所述待测二值影像资料进行处理而得到多个水平投影量统计曲线;对所述水平投影量统计曲线分别进行一高通滤波程序而得到多个高频信号曲线并算出相对应的多个索引值;因应所述索引值中的最大值而侦测出该影像资料的一歪斜角度;以及影像旋转校正模块是根据该歪斜角度来将该影像资料进行旋转校正,进而得到校正后影像资料。
文档编号H04N1/04GK101540816SQ200910008348
公开日2009年9月23日 申请日期2009年2月26日 优先权日2009年2月26日
发明者吴永熙, 杜建辉, 罗正岳, 黄德玮 申请人:圆展科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1