图像分割和增强的制作方法

文档序号:6477002阅读:142来源:国知局
专利名称:图像分割和增强的制作方法
专利说明图像分割和增强
背景技术
图像分割一般包括将图像的目标区域与该图像的背景区域分开。用于分割图像的许多不同方法已经被提出,包括基于阈值化、区域生长以及分水岭变换(watershed transform)的图像分割处理。这种处理的分割结果可被用于多种不同应用,包括用于目标描述或识别的目标提取。一般地,噪声降低了图像分割处理能够从背景区域中分割目标的精度。
由配备照相机的手持设备(例如,数码相机、蜂窝电话以及个人数字助理)所捕获的数字图像中的类文本(text-like)目标经常被不均匀的照明和模糊劣化。这些人工因素的存在显著降低了再现的数字图像的整体外观质量。此外,这种劣化不利地影响OCR(光学字符识别)精度。
所需要的是能够以对文本字体大小、模糊水平以及噪声稳健的方式分割和增强文档图像(document image)的装置和方法。


发明内容
在一个方面中,本发明的特征在于一种方法,根据该方法,确定给定图像的相应像素处的梯度幅度值。使用全局阈限对该梯度幅度值进行阈值化处理以生成阈值化的(thresholded)梯度幅度值。根据阈值化的幅度值的分水岭变换,将所述像素分割成相应的组。产生分类记录。该分类记录将所述像素中被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将所述像素中被分割到除了最大组之外的任何组中的像素标记为非背景像素。
本发明的特征还在于一种装置以及存储有使机器实现上述方法的机器可读指令的机器可读介质。
根据包括附图和权利要求书的以下描述本发明的其它特征和优点将变得显而易见。



图1是图像处理系统的实施例的框图。
图2是被不均匀照明的文本的图像的示例。
图3是图像处理方法的实施例的流程图。
图4是由根据附图3中的方法的实施例从图2的图像中导出的梯度幅度值所组成的图像的示例。
图5A是在说明性图像的相应像素处的所设计的(devised)梯度幅度值的阵列的图示。
图5B是根据基于分水岭变换的图像分割处理而分配给图5A中所示图像的像素的标签的阵列的图示。
图6A是包含文本的图像的示例。
图6B是示出不同标签的灰度级图像,其中根据图3中所示方法的分割处理的实施例,将所述标签分配给图6A中图像的像素。
图6C是根据图3中所示方法中的分类记录产生处理的实施例,从图6B的灰度级图像中产生的形式为二进制分割图(map)的分类记录的示例。
图7是以二进制分割图为形式的分类记录的示例,其中黑色像素代表在图2的图像中检测到的目标像素并且白色像素代表在图2的图像中检测到的背景像素。
图8是图1中所示的图像处理系统的实施例的框图。
图9是由根据本发明的实施例为图2中图像的像素所估计的照明值(illuminant value)所组成的图像的示例。
图10是根据本发明实施例的基于图9中所示的照明值从图2的图像中导出的照明校正图像的示例。
图11是根据本发明的实施例从图10中的图像导出的锐化图像的示例。
图12是合并了图1中的图像处理系统的实施例的装置的实施例的框图。
图13是合并了图1中的图像处理系统的实施例的装置的实施例的框图。

具体实施例方式 在接下来的描述中,相同的附图标记被用于标识相同的元件。进一步,附图打算以图解的方式示出示例性实施例的主要特征。附图并不打算描绘实际实施例的每一个特征,也不打算描绘所示出元件的相对尺寸,并且不是按比例绘制。
I.引言 以下详细描述的实施例能够以对模糊水平(blur level)和噪声稳健(robust)的方式来分割和增强图像。这些实施例以特别对于包含文本的图像达到改进的抗噪结果的方式在基于分水岭变换的图像分割之前合并了全局阈值化处理(thresholding)。在执行基于分水岭变换的图像分割之前,该全局阈值化处理消除或破坏图像中的噪声结构。一些实施例通过各种各样的方式使用分割结果来增强文档图像,所述方式包括校正不均匀照明、使对象目标区域(target objectregion)变暗以及锐化对象目标区域。这些实施例的实施对于以对文本字体大小、模糊水平以及噪声稳健的方式增强文本非常有用。
II.概述 图1示出了包括预处理模块12和分割模块14的图像处理系统10的实施例。该图像处理系统根据图像16生成分类记录18,该分类记录18将图像16的像素标记为背景像素或者非背景像素。在这一处理中,预处理模块12处理图像16以生成中间图像20,该中间图像20具有提高分割模块14能够将图像16中的对象目标区域与图像16中的背景区域区分开的准确性的特性。
图像16可以对应于任何类型的数字图像,包括由图像传感器(例如,数字摄像机、数字静止图像照相机或者光学扫描仪)所捕获的原始图像(例如,视频关键帧、静止图像或扫描图像)或这种原始图像的处理过的(例如,子抽样的、过滤的、重新格式化的、增强的或者以其它方式修改的)版本。图2示出了包括被不均匀照明的文本的图像16的示例22。在以下详细描述中,示例性图像22和从其获得的各种图像数据仅为了说明性目的而被用于解释本发明的一个或多个实施例的一个或多个方面。
一般地,分类记录18可以被用于各种不同目的,包括图像增强、目标检测、目标追踪、目标描述以及目标识别。以下详细描述的本发明的一些实施例使用分类记录18来对图像16执行以下图像增强操作中的一个或多个减少不均匀照明的影响;使类文本目标变暗和锐化。
III.将图像分割成背景区域和对象目标区域 A.概述 图3示出了由图像处理系统10所实施的方法的实施例。根据这一方法,预处理模块12确定图像16的相应像素处的梯度幅度值(图3,块24)。预处理模块12使用全局阈限对梯度幅度值进行阈值化处理以生成阈值化的梯度幅度值(图3,块26)。分割模块14根据阈值化的梯度幅度值的分水岭变换,将图像16的像素分割成若干组(图3,块28)。分割模块14产生分类记录18。分类记录18将所述像素中被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将所述像素中被分割到除了最大组之外的任何组中的像素标记为非背景像素(图3,块30)。
B.确定梯度幅度值 如上所述,预处理模块12确定图像16的相应像素处的梯度幅度值(图3,块24)。在一些实施例中,预处理模块12在确定梯度幅度值之前对图像16的像素值降噪。为了这一目的可以使用任何类型的降噪滤波器,包括高斯平滑滤波器以及双边平滑滤波器。在其它实施例中,预处理模块12直接从图像16的像素值确定梯度幅度值。
一般地,预处理模块12可以使用任何类型的梯度滤波器或者算子来确定梯度幅度值。如果图像16是灰度级图像,那么预处理模块12可以使用例如基本微分滤波器(basic derivative filter)、普鲁伊特(Prewitt)梯度滤波器、索贝尔(Sobel)梯度滤波器、高斯(Gaussian)梯度滤波器或者另一类型的形态学梯度滤波器来确定梯度幅度值。如果图像16为彩色图像,那么预处理模块12可以将图像16转变成灰度级图像,并且将上述所列类型的梯度滤波器应用到灰度值以确定梯度幅度。可选地,预处理模块12可以将彩色图像转变成YCrCb彩色图像,并且将上述所列类型的梯度滤波器应用到亮度(Y)值以确定梯度幅度。在一些实施例中,预处理模块12根据彩色图像的多个色彩空间分量(例如,红色、绿色和蓝色分量)计算每一个梯度幅度值。例如,在这些实施例的一些中,预处理模块12根据色彩梯度算子来确定彩色图像中的色彩梯度的幅度,SilvanoDiZenzo在Computer Vision,Graphics,and Image Processing的第33卷、第116-125页(1986)上的“ANote on the Gradient of a Multi-Image”一文中描述了所述色彩梯度算子。图4描绘了由色彩梯度幅度值构成的图像32的示例,其中,根据这种色彩梯度算子,从图像22(参见图2)的彩色版本中得到该色彩梯度幅度值。
C.对梯度幅度值进行全局阈值化处理 如上所述,预处理模块12使用全局阈限对梯度幅度值进行阈值化处理以生成阈值化的梯度幅度值(图3,块26)。该全局阈值化处理在执行基于分水岭变换的图像分割之前消除或破坏图像中的噪声结构。按这种方式,由于这种噪声结构而造成的过分割和不准确分割结果的问题可被减少。预处理模块12典型地使用根据经验确定的全局阈限来对梯度幅度值进行阈值化处理。在一些实施例中,预处理模块12使用全局阈限(τGLOBAL)来对梯度幅度值进行阈值化处理,该全局阈限(τGLOBAL)根据以下等式(1)来确定
其中k为实数,gMAX为最大梯度幅度值,以及τMIN为根据经验确定的最小全局阈限值。在一个示例性实施例中,梯度幅度值的范围为从0到255,k=0.1,以及τMIN=5。
与中间图像20(参见图1)对应的所得到的阈值化的梯度幅度值被传给分割模块14以用于分割处理。
D.分割阈值化的梯度幅度值 如上所述,分割模块14根据阈值化的梯度幅度值的分水岭变换将图像16的像素分割成若干组(图3,块28)。
在计算梯度幅度值的分水岭变换的过程中,分割模块14识别阈值化的幅度值中的盆地(basin)和分水岭,将相应的盆地标签分配给与识别的盆地对应的那些像素,将唯一共享标签分配给与分水岭对应的那些像素,并且对分配的标签执行连通分量分析(connected components analysis)。分割模块14可以根据各种不同方法中的任意一种来计算分水岭变换。在一些实施例中,首先找到盆地,并且可以通过取补集(setcomplement)来找到分水岭,而在其它实施例中,图像被完全分成盆地并且可以通过边界检测来找到分水岭(例如参见,J.B.T.M.Roerdink等在Fundamenta Informaticae的第41卷、第187-228页(2001)上的“TheWatershed TransformDefinitions,Algorithms and Parall elization Strategies”一文)。在一些实施例中,根据Luc Vincent等在IEEE Transactions on Pattern Analysis andMachine Intelligence的第13卷、第6期(1991.6)上的“Watersheds in Digital SpacesAn Efficient Algorithm Based on Immersion Simulation”一文中所描述的分水岭计算方法,分割模块14计算阈值化的梯度幅度值的分水岭变换。
一般地,分割模块14可以对分配的标签执行各种不同连通分量分析中的任何一种。例如,在一种连通分量标记方法中,分配给像素的标签被逐像素地检查,以识别连通像素区域(或者“团块(blob)”,其是被分配同样标签的邻近像素的区域)。对于每一个给定的像素,将分配给该给定像素的标签与分配给相邻像素的标签进行比较。基于被分配给相邻像素的标签,改变或者不改变分配给该给定像素的标签。检查的邻居的数量和用于确定是保持原始分配的标签还是重新分类该给定像素的规则取决于所使用的连通性的度量(例如,4连通或者8连通)。
图5A示出说明性图像的相应像素处的所设计的梯度幅度值的阵列34的图示。图5B示出根据基于分水岭变换的图像分割处理和基于4连通的连通分量重新标记(re-labeling)处理而分配给图5B中所示图像的像素的标签阵列的图示。在图5B中,标签B1和B2标识相应的盆地,并且标签W标识阵列34中检测到的分水岭像素。
图6A示出包含文本(即,单词“advantage”)的图像36的示例,并且图6B示出了所得到的(编号的)标签的灰度级图像38,其中根据图3中块28的分割处理的实施例,将所述标签分配给图像36的像素。
在一些实施例中,在执行了像素连通性分析之后,将分水岭像素与具有最大标签号的相邻区域融合,以生成图像16的像素到识别组的最终集合的分割。
E.产生分类记录 如上所述,分割模块14产生分类记录18,该分类记录将那些被分割到已识别组中被确定为在大小上是最大的一组中的像素标记为背景像素,以及将那些被分割到除了最大组之外的任何已识别组中的像素标记为非背景像素(图3,块30)。可以通过各种各样不同的方式识别出最大组。在一些实施例中,通过选择拥有最大像素数量的组来确定最大组。
在一些实施例中,分割模块14在分类记录18中为每一个被分割到最大组中的像素记录第一二进制值(例如,“1”或“白色”),并为每一个被分割到除了最大组之外的任意组中的像素记录第二二进制值(例如,“0”或“黑色”)。例如,图6C以二进制分割图40的形式示出了为图像36(参见图6A)所产生的分类记录的示例,其中根据图3中块30的分类记录产生处理的实施例由灰度级图像38(参见图6B)产生所述二进制分割图40。在二进制分割图40中,黑色像素代表图像36(参见图6A)中被检测到的目标像素,以及白色像素代表图像36中被检测到的背景像素。
回过头参照图6B,图3的块28中执行的基于分水岭变换的分割倾向于过分割出现在图像22、36中的文本字符。然而,如图6C所示,尽管有这种过分割,这些图像22、36中的背景像素能够容易地被识别为像素标签中最大的连通分量,这些像素标签由分水岭变换分割处理分配。
图7以二进制分割图42的形式示出为图像22(参见图2)而产生的分类记录的图形表示的示例,在该二进制分割图中黑色像素代表图像22中被检测到的目标像素,以及白色像素代表图像22中被检测到的背景像素。
IV.基于其关联的分类记录来增强图像 A.概述 如上所述,分类记录18可被用于各种不同目的,包括图像增强、目标检测、目标跟踪、目标描述以及目标识别。
图8示出另外包括图像增强模块46的图像处理系统10的实施例44。在一些实施例中,基于分类记录18,通过对图像16执行一个或多个以下的图像增强操作,图像增强模块46生成增强图像48减少不均匀照明的影响;将对象目标区域变暗;以及锐化对象目标区域。
B.照明校正 在一些实施例中,图像增强模块46可操作以通过校正图像16中的不均匀照明而生成增强的图像48。
在一些实施例中,照明校正基于下面的图像形成模型 I(x,y)=R(x,y)·L(x,y)(2) 其中分别地,I(x,y)是测量强度值,R(x,y)是表面反射率值,以及L(x,y)是在图像16的像素(x,y)处的照明值。
根据这一模型,背景像素的照明值(如分类记录18所指示的)被假定为与像素的亮度值成比例。如果图像16是灰度级图像,那么为背景像素估计的照明值

是背景像素(x,y)的灰度值。如果图像16是彩色图像,那么例如通过将图像16转变到灰度色彩空间或YCrCb色彩空间并且将估计的照明值

设置为转变后的图像中的背景像素(x,y)的亮度值(Y)或者灰度值,来获取为背景像素估计的照明值

可以以各种各样不同的方式根据相邻背景像素的被估计的照明值来估计非背景像素的照明值,所述方式包括使用插值法和图像修复(impainting)法。
图9描绘了由根据如上所述的方法为图像22(参见图2)的像素所估计的照明值组成的图像50的示例。
在一些实施例中,依照等式(3),根据空间上对应的图像16的像素值与从所估计的照明值中确定的相应色调值的比值来估计增强图像48的照明校正像素值E(x,y) 其中s为缩放因子,I(x,y)是图像16中像素(x,y)的值,

是为像素(x,y)所估计的照明值,以及

是将被估计的照明值映射到相应色调值的函数。在一个示例性实施例中,像素值的范围为从0到255,缩放因子s被设置为255。与函数T

相对应的色调映射典型地被存储到查找表(LUT)中。
在一些实施例中,色调映射函数

将估计的照明值映射到它们自身(即,在这些实施例中,所得到的增强图像48与原始图像16的照明校正版本对应。在其它实施例中,如下面详细描述的那样,色调映射函数

包括至少一个其它图像增强(例如,选择性变暗和选择性锐化)。
C.选择性变暗 在一些实施例中,色调映射函数合并了类似反锐化掩模(unsharp-masking-like)的对比度增强,该对比度增强被应用到在分类记录18中识别的目标区域(即,非背景区域)。在这些实施例当中的一些中,被用于目标区域像素的色调映射函数在以下等式(4)中被定义 其中,对于8位图像有s=255,b=tγ(1-t)I-γ以及t=I/s为图像的归一化平均亮度值,在这些实施例中,响应于确定对应估计的照明值低于照明阈限值,图像增强模块46将增强图像的像素值设置为比给定图像的空间上对应的那些像素值更暗。除此之外,响应于确定对应估计的照明值高于照明阈限值,图像增强模块46将增强图像的像素值设置为比给定图像的空间上对应的那些像素值更亮。
在这些实施例的其它一些中,被用于非背景(即,目标区域)像素的色调映射函数按如下等式(5)来定义 图10示出了基于图9中所示的照明值和等式(4)中定义的色调映射函数来从图像22(图2)中导出的照明校正图像52的示例。
D.选择性锐化 在一些实施例中,通过将反锐化掩模选择性地应用到在分类记录18中识别的对象目标区域(例如,文本区域)来实现选择性锐化。在这些实施例中的一些中,增强图像48的目标区域的像素值(EOBJECT(x,y))通过等式(6)中定义的选择性滤波器来计算,所述选择性滤波器合并了在等式(3)中定义的照明校正滤波器中的反锐化掩模单元 其中,α为指示锐化量的凭经验确定的参数值。
在一些实施例中,通过将等式(7)中定义的选择性滤波器应用到由等式(6)中定义的选择性锐化滤波器所产生的像素值(EOBJECT(x,y))而计算出增强图像48的目标区域像素值(E′OBJECT(x,y))。
E′(x,y)=(β+1)·EOBJECT(x,y)-β·G[EOBJECT](7) 其中G[]代表高斯平滑滤波器,以及参数β代表锐化量。在一些实施例中,高斯核的大小(w)和锐化量β分别从等式(8)和(9)中确定

其中[wmin,wmax]是根据经验为窗口大小确定的参数值范围,[βmin,βmax]是根据经验为锐化量确定的参数值范围,以及[gL,gH]为锐度的低和高阈限,gmax为图3所示方法的块24中确定的最大梯度幅度值。在一些实施例中,等式(7)中的高斯平滑滤波器G[]可以被不同类型的平滑滤波器(例如,平均滤波器)所代替。
图11描绘了根据等式(6)-(9)中定义的选择性锐化方法从图像52(参见图9)中导出的选择性锐化图像54的示例。
V.图像处理系统的示例性体系结构 A.既述 图像处理系统10的实施例(包括图8中所示的实施例44)可以由一个或多个分立的模块(或者数据处理部件)来实现,这些分立的模块并不限于任何特定的硬件、固件或软件配置。在图示的实施例中,这些模块可以在任何计算或数据处理环境中实施,包括在数字电子电路(例如,诸如数字信号处理器(DSP)的专用集成电路)中,或者在计算机硬件、固件、设备驱动器或软件中实施。在一些实施例中,这些模块的功能性被组合到单个数据处理部件中。在一些实施例中,一个或多个所述模块中的每一个的相应功能性由多个数据处理部件的相应集合执行。
在一些实施中,用于实现由图像处理系统10的实施例所执行的方法的处理命令(例如,诸如计算机软件的机器可读代码)以及它所产生的数据被存储于一个或多个机器可读介质中。适于有形地包含这些指令和数据的存储设备包括所有形式的非易失性计算机可读存储器,所述存储器例如包括比如EPROM、EEPROM以及闪存设备的半导体存储设备、比如内部硬盘和可移动硬盘的磁盘、磁光盘、DVD-ROM/RAM和CD-ROM/RAM。
一般地,图像处理系统10的实施例可以在各种电子设备的任何一种中实施,所述电子设备包括桌上型和工作站计算机、视频记录设备(例如,VCR和DVR)、能够解码和播放付费视频节目的有线或卫星机顶盒、以及数字照相机设备。由于其有效使用处理和存储器资源,图像处理系统10的一些实施例可以利用具有中等处理能力和中等存储容量的相对较小和便宜的部件来实施。结果,这些实施例非常适于合并到拥有明显的大小、处理和存储限制的紧凑照相机环境中,其包括但不限于手持电子设备(例如,移动电话、无绳电话、比如智能卡的便携式存储设备、个人数字助理(PDA)、固态数字音频播放器、CD播放器、MCD播放器、游戏控制器、寻呼机以及微型静态图像照相机或摄像机)、pc照相机、以及其它嵌入式环境。
B.第一示例性图像处理系统体系结构 图12示出了合并了此处所描述的图像处理系统10的任意实施例的计算机系统60的实施例。计算机系统60包括处理单元62(CPU)、系统存储器64以及将处理单元62耦合到计算机系统60的各个部件的系统总线66。处理单元62典型地包括一个或多个处理器,其中每一个处理器可以是各种各样商业可用的处理器中的任何一种的形式。系统存储器64典型地包括存储包含用于计算机系统60的启动例程的基本输入/输出系统(BIOS)的只读存储器(ROM)和随机存取存储器(RAM)。系统总线66可以是存储器总线、外围设备总线或局部总线,以及可以与各种总线协议中的任何一种兼容,所述总线协议包括PCI、VESA、微通道(Microchannel)、ISA以及EISA。计算机系统60还包括连接到系统总线66并包含一个或多个计算机可读介质盘的永久性贮存存储器68(例如,硬盘驱动器、软盘驱动器、CD ROM驱动器、磁带驱动器、闪存设备以及数字视频盘),所述计算机可读介质盘提供数据、数据结构和计算机可执行指令的非易失性或永久性存储。
用户可以使用一个或多个输入设备150(例如,键盘、计算机鼠标、麦克风、操纵杆以及触摸垫)与计算机60交互(如,输入命令或数据)。可以通过在显示控制器74控制的显示监视器72上显示给用户的图形用户界面(GUI)来呈现信息。计算机系统60还典型地包括外围输出设备,例如扬声器和打印机。通过网络接口卡(NIC)76,一个或多个远程计算机可连接到计算机系统140。
如图12所示,系统存储器64还存储图像处理系统10、GUI驱动器78以及包括与图像16和增强图象48对应的图像文件、中问处理数据以及输出数据的数据库80。在一些实施例中,图像处理系统10与GUI驱动器78和用户输入70对接以控制分类记录18和增强图像48的创建。在一些实施例中,计算机系统60另外还包括被配置成在显示监视器72上再现(render)图像数据并对图像16、48执行各种图像处理操作的图形应用程序。
C.第二示例性图像处理系统体系结构 图13示出合并了此处所描述的图像处理系统10的任何实施例的数字照相机系统82的实施例。该数字照相机系统82可被配置成捕获静态图像和视频图像帧中的一个或两者。该数字照相机系统82包括图像传感器84(例如,电荷耦合装置(CCD)或者互补金属氧化物半导体(CMOS)图像传感器),传感器控制器86、存储器88、帧缓冲器90、微处理器92、ASIC(专用集成电路)94、DSP(数字信号处理器)96、I/O(输入/输出)适配器98、以及存储介质100。一般地,图像处理系统10可以由一个或多个硬件和固件部件来实施。在图示的实施例中,图像处理系统10被实施为装载到存储器88中的固件。存储介质100可以由任何类型的图像存储技术来实施,包括紧凑闪存卡和数字视频带盒。通过I/O子系统98,存储在存储介质100中的图像数据可以被传输到外部处理系统(例如,计算机或工作站)的存储设备(例如,硬盘驱动器、软盘驱动器、CD-ROM驱动器、或者非易失性数据存储设备)。
微处理器92安排指导(choreograph)数字照相机系统82的操作。在一些实施例中,微处理器92被编程有一种操作模式,在所述操作模式中,为一个或多个捕获的图像计算相应分类记录18。在一些实施例中,基于它们对应的分类记录18来为一个或多个捕获的图像计算相应的增强图像48。
VI.结论 这里所详细描述的实施例能够以对噪声稳健的方式来分剂和增强图像。这些实施例以尤其对于包含文本的图像实现改进的抗噪声结果的方式在基于分水岭变换的图像分割之前合并了全局阈值化处理。在执行基于分水岭变换的图像分割之前,该全局阈值化处理消除或破坏了图像中的噪声结构。这些实施例还将唯一背景分割方法应用于基于分水岭变换的分割结果,这一方法使得包括文本的图像的背景区域被有效地分割,而没有对处理和存储资源提出重大的要求。一些实施例使用改进的分割结果来以各种各样的方式增强图像,所述方式包括校正不均匀照明、使对象目标区域变暗以及锐化对象目标区域。改进的分割结果不仅改进了对于对象目标区域的这种增强的局部化,还提高了用于实施这种增强的参数值的质量。
其它实施例也落入权利要求书的范围之内。
权利要求
1、一种方法,包括
确定给定图像(16)的相应像素处的梯度幅度值;
使用全局阈限对所述梯度幅度值进行阈值化处理以产生阈值化的梯度幅度值(20);
根据所述阈值化的幅度值(20)的分水岭变换将所述像素分割成相应组;以及
产生分类记录(18),该分类记录将所述像素中被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将所述像素中被分割到除了所述最大组之外的任何组中的像素标记为非背景像素。
2、根据权利要求1所述的方法,进一步包括在所述确定之前,从降噪的上游图像中导出所述给定图像(16)。
3、根据权利要求1所述的方法,进一步包括根据所述给定图像(16)的像素值和分类记录(18)生成增强图像(48),其中所述生成包括根据被标记为背景像素的所述给定图像的那些像素的值估计所述给定图像(16)的像素的相应照明值,其中所述给定图像(16)的像素包括那些被标记为非背景像素的像素。
4、根据权利要求5所述的方法,其中所述生成包括根据给定图像(16)的空间上对应的那些像素值与根据所估计的照明值确定的相应色调值的比值,来计算增强图像(48)的像素值。
5、根据权利要求6所述的方法,其中所述计算包括
响应于确定对应的估计的照明值低于照明阈限值,将所述增强图像(48)的像素值设置为比给定图像(16)的空间上对应的那些像素值更暗,以及
响应于确定对应的估计的照明值高于所述照明阈限值,将所述增强图像(48)的像素值设置为比给定图像(16)的空间上对应的那些像素值更亮。
6、根据权利要求6所述的方法,其中,所述生成包括锐化被标记为非背景像素的那些像素的值,以生成增强图像(48)的空间上对应的那些像素的值。
7、一种装置,包括
预处理模块(12),其可操作以确定给定图像(16)的相应像素处的梯度幅度值并且使用全局阈限对所述梯度幅度值进行阈值化处理以生成阈值化的梯度幅度值(20);以及
分割模块(14),其可操作以根据所述阈值化的幅度值(20)的分水岭变换将所述像素分割成相应组,并且产生分类记录(18),该分类记录将所述像素中被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素并将所述像素中被分割到除了所述最大组之外的任何组中的像素标记为非背景像素。
8、根据权利要求17所述的装置,进一步包括图像增强模块(46),其可操作以根据所述给定图像(16)的像素值和分类记录(18)生成增强图像(48)。
9、根据权利要求19所述的装置,其中,图像增强模块(48)可操作以根据被标记为背景像素的所述给定图像(16)的那些像素的值来估计所述给定图像(16)的像素的相应照明值,所述给定图像(16)的像素包括那些被标记为非背景像素的像素。
10、根据权利要求19所述的装置,其中图像增强模块(48)可操作以锐化被标记为非背景像素的那些像素的值以生成所述增强图像(48)的空间上对应的那些像素的值。
全文摘要
描述了用于分割和增强图像的方法、装置及机器可读介质。在一个方面中,给定图像(16)的相应像素处的梯度幅度值被确定。使用全局阈限对该梯度幅度值进行阈值化处理以产生阈值化的梯度幅度值(20)。根据阈值化的幅度值(20)的分水岭变换,将所述像素分割成相应组。产生分类记录(18)。该分类记录(18)将那些被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将那些被分割到除了所述最大组之外的任何组中的像素标记为非背景像素。
文档编号G06T7/00GK101689300SQ200880013757
公开日2010年3月31日 申请日期2008年4月24日 优先权日2007年4月27日
发明者J·范 申请人:惠普开发有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1