一种基于多光谱成像技术的低质量文档图像二值化方法与流程

文档序号:12365655阅读:来源:国知局

技术特征:

1.一种基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,包括以下步骤:

步骤1:读取待处理文档的多光谱图像,并做线性归一化处理,获得到光谱分量图像;

步骤2:对光谱分量图像进行阈值化处理;包括局部对比度增强处理、高对比度像素检测处理、笔画宽度估计处理和局部精细二值化处理;

步骤3:目标检测;包括对步骤2中处理后的光谱分量图像进行光谱图像特征提取、估计自适应相干图像、基于梯度算子的图像阈值化和消除误判处理;

步骤4:阈值图像融合处理;包括二值图像融合和图像后处理。

2.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于:步骤1中所述获得到光谱分量图像,包括1个紫外光谱(340nm)、3个可见光谱(500nm、600nm、700nm)和4个红外光谱(800nm、900nm、1000nm、1100nm)。

3.根据权利要求1或2所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤1中所述线性归一化处理,计算公式如下:

<mrow> <msup> <mi>I</mi> <mo>&prime;</mo> </msup> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>I</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>I</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> <mrow> <msub> <mi>I</mi> <mi>max</mi> </msub> <mo>-</mo> <msub> <mi>I</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> </mrow> </mfrac> <mo>,</mo> </mrow>

其中,I(x,y)和I′(x,y)分别表示归一化前、后的图像灰度值,Imax和Imin分别表示光谱分量图像的灰度最大值和最小值。

4.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤2的具体实现包括以下子步骤:

步骤2.1:对光谱分量图像进行局部对比度增强处理,计算公式如下:

<mrow> <mi>C</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>I</mi> <mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>I</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> </mrow> <mrow> <msub> <mi>I</mi> <mi>max</mi> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>I</mi> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> </mrow>

其中,C(x,y)表示图像的局部对比度,Imax(x,y)和Imin(x,y)分别表示图像在以(x,y)为中心的3×3邻域内的灰度最大值和最小值;

步骤2.2:对于步骤2.1的输出图像进行高对比度像素检测处理;

对于步骤2.1的输出图像,记t∈[0,L-1]为图像前景与背景的分割阈值,L为灰度级分辨率;如果前景像素占图像比例前景像素平均灰度值背景像素占图像比例背景像素平均灰度值则图像的总体平均灰度值为其中,pi表示归一化直方图;

定义前景和背景图像的类间方差为:

<mrow> <msubsup> <mi>&sigma;</mi> <mi>B</mi> <mn>2</mn> </msubsup> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>=</mo> <msub> <mi>&omega;</mi> <mn>0</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <msup> <mrow> <mo>&lsqb;</mo> <msub> <mi>&mu;</mi> <mn>0</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>&mu;</mi> <mi>T</mi> </msub> <mo>&rsqb;</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&omega;</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <msup> <mrow> <mo>&lsqb;</mo> <msub> <mi>&mu;</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>&mu;</mi> <mi>T</mi> </msub> <mo>&rsqb;</mo> </mrow> <mn>2</mn> </msup> <mo>=</mo> <msub> <mi>&omega;</mi> <mn>0</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <msub> <mi>&omega;</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <msup> <mrow> <mo>&lsqb;</mo> <msub> <mi>&mu;</mi> <mn>0</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>&mu;</mi> <mn>1</mn> </msub> <mrow> <mo>(</mo> <mi>t</mi> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mn>2</mn> </msup> <mo>,</mo> </mrow>

实现高对比度像素检测的准则是,通过确定全局最优阈值t0,使分割后的前景和背景差异最大,即:

步骤2.3:基于步骤2.2检测出的高对比度像素进行笔画宽度估计处理;

步骤2.3.1:基于步骤2.2检测出的高对比度像素,利用Canny算子对图像进行边缘检测,每个边缘像素点p都具有一个方向梯度值dp;

步骤2.3.2:如果像素点p位于笔画边缘,计算p的方向梯度dp,并沿着射线r=p±n×dp(n≥0)梯度查找与之对应的另一个边缘像素点q,计算q的方向梯度dq,dp与dq的方向是大致相反的,即:

步骤2.3.3:执行下述判断;

如果边缘像素点p找不到对应匹配的q或者其方向梯度dp与dq不满足大致相反的要求,则舍弃该射线r;

如果边缘像素点p找到对应匹配的q或者其方向梯度dp与dq满足大致相反的要求,则在[p,q]路径上的每个像素点都指定为笔画宽度属性值,即欧式距离dist=||p-q||,除非该像素点已经被指定了一个更小的笔画宽度属性值;

步骤2.3.4:重复步骤2.3.2,直到计算出所有未被舍弃路径上的像素笔画宽度值,并统计其分布直方图H(dist),则笔画宽度估计为:SWE=argmax[H(dist)];

步骤2.4:基于步骤2.3估计的字符笔画宽度进行局部精细二值化处理;

基于步骤2.3估计的字符笔画宽度确定滑动邻域窗尺寸,从而实现字符前景与页面背景的精细分割,具体公式为:

其中,为w×w邻域内检测出的高对比度像素总数,为w×w邻域内由文档字符笔画宽度确定的最少像素下限值,I(x,y)为图像(x,y)处的灰度值,μw(x,y)和σw(x,y)分别表示以(x,y)为中心的w×w邻域内光谱分量图像的灰度平均值和标准偏差,B0(x,y)表示获得的二值图像。

5.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤3的具体实现包括以下子步骤:

步骤3.1:基于步骤2中处理后的光谱分量二值图像B0(x,y)进行光谱图像特征提取处理;

步骤3.1.1:基于步骤2中处理后的光谱分量二值图像B0(x,y)估计多光谱图像前景像素灰度平均值μFG、背景像素灰度平均值μBG及其差值Δ=μFGBG

步骤3.1.2:计算多光谱图像背景像素间的协方差矩阵:

Σ=E[(I-μBG)T(I-μBG)],

其中,I表示多光谱图像灰度矩阵,T表示矩阵转置,E表示数学期望;

步骤3.1.3:估计其广义逆矩阵Σ-1,使同时满足以下条件:

步骤3.2:估计自适应相干图像;

基于步骤3.1提取的多光谱图像特征,估计自适应相干图像计算公式为:

<mrow> <mover> <mi>I</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <msup> <mrow> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <mi>I</mi> <mo>-</mo> <msub> <mi>&mu;</mi> <mrow> <mi>B</mi> <mi>G</mi> </mrow> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <msup> <mi>&Sigma;</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mrow> <mo>(</mo> <msub> <mi>&mu;</mi> <mrow> <mi>F</mi> <mi>G</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>&mu;</mi> <mrow> <mi>B</mi> <mi>G</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mn>2</mn> </msup> <mrow> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <mi>I</mi> <mo>-</mo> <msub> <mi>&mu;</mi> <mrow> <mi>B</mi> <mi>G</mi> </mrow> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <msup> <mi>&Sigma;</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mrow> <mo>(</mo> <mi>I</mi> <mo>-</mo> <msub> <mi>&mu;</mi> <mrow> <mi>B</mi> <mi>G</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> <mo>&lsqb;</mo> <msup> <mrow> <mo>(</mo> <msub> <mi>&mu;</mi> <mrow> <mi>F</mi> <mi>G</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>&mu;</mi> <mrow> <mi>B</mi> <mi>G</mi> </mrow> </msub> <mo>)</mo> </mrow> <mi>T</mi> </msup> <msup> <mi>&Sigma;</mi> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mrow> <mo>(</mo> <msub> <mi>&mu;</mi> <mrow> <mi>F</mi> <mi>G</mi> </mrow> </msub> <mo>-</mo> <msub> <mi>&mu;</mi> <mrow> <mi>B</mi> <mi>G</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> </mfrac> <mo>,</mo> </mrow>

并将其动态范围限制在[0,1]之间,即:

步骤3.3:基于梯度算子的图像阈值化;

步骤3.2输出图像在位置(x,y)处的梯度定义为:

<mrow> <mo>&dtri;</mo> <mover> <mi>I</mi> <mo>^</mo> </mover> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mrow> <mo>&lsqb;</mo> <msubsup> <mi>G</mi> <mi>x</mi> <mn>2</mn> </msubsup> <mo>+</mo> <msubsup> <mi>G</mi> <mi>y</mi> <mn>2</mn> </msubsup> <mo>&rsqb;</mo> </mrow> <mrow> <mn>1</mn> <mo>/</mo> <mn>2</mn> </mrow> </msup> <mo>&ap;</mo> <mo>|</mo> <msub> <mi>G</mi> <mi>x</mi> </msub> <mo>|</mo> <mo>+</mo> <mo>|</mo> <msub> <mi>G</mi> <mi>y</mi> </msub> <mo>|</mo> <mo>,</mo> </mrow>

其中,分别表示图像沿x和y方向的一阶导数;

针对梯度图像进行高对比度像素检测处理、笔画宽度估计处理和局部精细二值化处理,获得二值化输出图像B1(x,y);

步骤3.4:消除误判处理;

步骤3.4.1:基于步骤3.2估计的自适应相干图像进行全局最优阈值化处理,得到二值图像B′1(x,y);

步骤3.4.2:将二值图像B0(x,y)和B′1(x,y)同时标记为前景的像素点视为真正的前景像素TP,并以此删除B0(x,y)中所有的伪前景点,得到二值图像B2(x,y):

其中,为w×w邻域内检测出的TP前景像素总数,为w×w邻域内预先确定的TP像素下限值。

6.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤4的具体实现包括以下子步骤:

步骤4.1:二值图像融合;

针对二值图像B1(x,y)和B2(x,y),采用以下公式进行二值图像融合:

其中,B(x,y)为融合后的二值图像;

步骤4.2:图像后处理

去除字符笔画边缘少于10个像素的椒盐噪声,并填充字符笔画内部少于10个像素的笔画空洞。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1