图像二值化方法和装置、视频分析系统的制作方法

文档序号:8457570阅读:1216来源:国知局
图像二值化方法和装置、视频分析系统的制作方法
【技术领域】
[0001]本发明涉及视频智能分析技术领域,尤其涉及一种图像二值化方法和装置、以及一种视频分析系统。
【背景技术】
[0002]在数字图像处理中,二值图像占有非常重要的地位。图像的二值化有利于图像的进一步处理,使图像变得简单,而且数据量减少,能凸显出感兴趣的目标的轮廓。很多相关技术必须使用二值化后的图像,例如字符识别、文档图像分析、目标检测等。
[0003]已经开发各种算法用来二值化图像,例如最大类间方差法(又叫大津算法,简称OTSU)、Bernsen算法(一种典型的局部阈值法)等。但这些算法各具有一定的局限性,因为其所依据的原理并不一定适合所有不同的复杂的情况,例如由于环境变化导致的图像目标与背景对比度不高、泛白、光照不均匀等情况。以OTSU为例,它仅对类间方差为单峰的图像产生较好的分割效果,当目标与背景的大小比例悬殊时,类间方差准则函数可能呈现双峰或多峰,难以获得满意的分割效果。

【发明内容】

[0004]本发明提供一种智能的图像二值化方法及装置。
[0005]根据本发明的第一方面,提供一种图像二值化方法,包括:对待处理区域或图像进行二值化处理,并获得二值化处理的阈值;对待处理区域或图像中像素值处于阈值偏移范围之外的像素采用神经网络进行训练,并根据训练结果进行二值化,其中,阈值偏移范围的下限为所述阈值减去预定偏移值,阈值偏移范围的上限为所述阈值加上所述预定偏移值。
[0006]根据本发明的第二方面,提供一种图像二值化装置,包括:阈值获取模块,用于对待处理区域或图像进行二值化处理,并获得二值化处理的阈值;训练模块,用于对待处理区域或图像中像素值处于阈值偏移范围之外的像素采用神经网络进行训练,其中,阈值偏移范围的下限为所述阈值减去预定偏移值,阈值偏移范围的上限为所述阈值加上所述预定偏移值;二值化模块,用于根据训练结果进行二值化。
[0007]根据本发明的第三方面,提供一种视频分析系统,其包括如上所述的图像二值化
>J-U ρ?α装直。
[0008]通过本发明的图像二值化方法,首先实现基本二值化处理,对明显高于或低于基本二值化处理所用阈值(即像素值在阈值偏移范围外)的像素采用神经网络算法进行训练,利用神经网络的自学习特点,使得图像的二值化更为智能。
【附图说明】
[0009]图1为本发明一种实施例的图像二值化方法的流程示意图;
图2为本发明一种实施例的图像二值化装置的结构示意图。
【具体实施方式】
[0010]本发明提出的图像二值化方法的基本原理是,利用现有的二值化算法,对待处理区域或图像实现基本的二值化处理,对于明显高于或低于该基本二值化处理所用阈值的像素,将其作为学习的样本来训练神经网络,然后利用训练好的神经网络对像素值靠近该阈值的像素进行二值化,从而实现智能化的二值化。
[0011]下面通过【具体实施方式】结合附图对本发明作进一步详细说明。
[0012]如图1所示,本发明一种实施例的图像二值化方法包括如下步骤S1-S3。
[0013]步骤S1:对待处理区域或图像进行二值化处理,并获得二值化处理的阈值。
[0014]步骤S2:对待处理区域或图像中像素值处于阈值偏移范围之外的像素采用神经网络进行训练,其中,阈值偏移范围的下限为步骤Si得到的阈值减去预定偏移值,阈值偏移范围的上限为该阈值加上预定偏移值。
[0015]步骤S3:根据训练结果进行二值化。
[0016]对于步骤SI,实施例中涉及的基本的二值化处理是采用OTSU算法,其它实施例中还可以采用已有的其它二值化算法,例如Bernsen算法、最大熵阈值法等。
[0017]OTSU算法是由日本学者大津展之提出的,是一种自适应的阈值确定方法。它是按图像的灰度特性,将图像分成背景和目标两部分,背景和目标之间的类间方差越大,说明构成图像的两部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此,使类间方差最大的分割算法意味着错分概率最小。对于图像I(x,y),前景(即目标)和背景的分割阈值记作T,属于前景的像素点数占整幅图像的比例记为Coci,其平均灰度记为μ ο;背景像素点数占整幅图像的比例记为O1,其平均灰度记为μι。图像的总平均灰度记为μ,类间方差记为4。假设图像的背景较暗,并且图像的大小为ΜΧΝ,图像中像素的灰度值小于阈值T的像素个数记作Ntl,像素灰度大于阈值T的像素个数记作N1,则有:
ω O=Nci/(MX N)(I)
ω ^N1/(ΜXN)(2)
NfN1=MXN(3)
ο ο+ ^ ι—1(4 )
μ=ω0ΧU1(5)
ζ=ω0Χ(μ0-μ) Wco1X(UrU)2(6)
将式(5)代入式(6),得到如下等价公式:
ζ=ω0Χω1Χ(μ0-μ1)2(7)
采用遍历的方法得到使类间方差最大的阈值Τ,即为所求的分割图像的最佳阈值。
[0018]在步骤SI中,首先利用OTSU等二值化算法获得二值化的阈值Τ,利用该阈值T可以对待处理区域或图像I进行二值化,即
P,(i,j)=255,如果 P(i,j)>T ;P’ (i,j)=0,如果 P(i,j)〈T;(8)
上式(8)中,P(i, j)为待处理区域或图像I中坐标位置(i,j)处像素点P的像素值,P’ (i, j)为二值化后待处理区域或图像I中坐标位置(i,j)处像素点P的像素值。
[0019]对于步骤S2,通过设定一阈值偏移范围来对像素值处在该范围外的像素进行学习。假设预定偏移值为d (又称阈值偏移),阈值偏移范围即为(T-d,T+d)。另外还假设待处理区域或图像I中坐标位置(i, j)处像素点P的N (N彡I)像素邻域为D(i, j), N像素邻域是指距离像素点P最近的N个像素所构成的集合,例如3X3邻域、5X5邻域等。
[0020]在步骤S2中,采用神经网络y=f (D)来学习明显可以实现的分类(目标和背景),所谓明显可以实现的分类是指像素值大于T+d和小于T-d的像素,例如,可以认为像素值大于T+d的像素为目标,像素值小于T-d的像素为背景。实施例中神经网络算法采用一个M个输入、一个输出的三层前向神经网络,其它实施例中还可以采用其它类型的神经网络。在采
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1