彩色数码影像的图像定位方法与装置的制作方法

文档序号:6619454阅读:162来源:国知局
专利名称:彩色数码影像的图像定位方法与装置的制作方法
技术领域
本发明涉及一种应用于彩色摄影机或数码相机所拍摄下来的彩色数码影像的图像定位方法与装置,利用影像处理的技术,将彩色数码影像中的图像精准定位,再以切割出来,作为后续影像辨识等的应用。
背景技术
目前应用于彩色数码影像中的几何或字符串图像的寻找与定位方法,较常使用的是先将彩色影像转为灰阶影像,再利用图像的灰阶梯度变化高于背景的灰阶梯度变化的特性来做判断,例如将彩色影像RGB(红绿蓝)的像素值(pixel)分别相加再除以3得出黑白灰阶影像,利用灰阶影像求取水平/垂直方向的梯度,再利用图像的水平/垂直方向梯度变化的特性,进行图像位置的定位,其中第(i,j)点的水平梯度Fi,j求法如下Fi,j=(r(i,j)+g(i,j)+b(i,j))/3Fi,j+1=(r(i,j+1)+g(i,j+1)+b(i,j+1))/3第i列第j行的水平梯度Fi,j=|Fi,j-Fi,j+1|其中r(i,j)=于坐标(i,j)的R Band(红色通道)像素值g(i,j)=于坐标(i,j)的G Band(绿色通道)像素值b(i,j)=于坐标(i,j)的B Band(蓝色通道)像素值此方法简单且方便使用,但却因为将彩色影像转换成黑白灰阶影像,因而丧失了许多有用的信息,当拍摄位置照明不足,或因为色彩的关系使得图像与背景灰阶值差异不大时,很容易导致图像与背景的灰阶梯度拉不开,而无法正确的找出图像位置,使得后续的辨识品质不能提升,进而降低辨识率。
另外一种方法,将彩色影像转换成HSI(色调、饱和度、亮度)色彩系统,并定义各种梯度侦测器用以侦测各种彩色边缘,再透过模糊隶属函数分别对H、I、S及彩色边缘图做处理,在模糊整合后取一个门槛值做二元化,以求得所要的图像区域,此方法因较为复杂,需要较长的数学运算时间,不适合在线系统使用。
鉴于上述缺点,现有的彩色图像寻找与定位方法未能达到最佳功效,因而有待改进。

发明内容
本发明的目的即在于提供一种应用于彩色摄影机或数码相机所拍摄下来的彩色数码影像的图像定位方法与装置,作为影像中特定几何或字符串图像寻找与定位的机制,保留彩色信息以增加整体辨识的正确率,方法简单易于运用并减少运算处理时间,同时可增进后续影像辨识或处理的正确率。
本发明以影像处理技术为核心,利用彩色摄影机或数码相机撷取包含图像的彩色数码影像,以图像的色彩/色彩饱和度/明暗的水平/垂直方向梯度变化的特性以及先前已知图像约略大小的信息,进行图像位置的寻找与定位。
本发明方法保持彩色影像的信息,将彩色影像的RGB Band分别抽出,再计算R Band、G Band及B Band的方向趋势变化(例如水平/垂直方向的梯度),例如其中第(i,j)点的水平梯度Fi,j求法如下第i列第i行的水平梯度Fi,j=((r(i,j)-r(i,j+1))2+(g(i,j)-g(i,j+1))2+(b(i,j)-b(i,j+1))2)1/2或Fi,j=|r(i,j)-r(i,j+1)|+|g(i,j)-g(i,j+1)|+|b(i,j)-b(i,j+1))|其中r(i,j)=于坐标(i,j)的R Band像素值g(i,j)=于坐标(i,j)的G Band像素值b(i,j)=于坐标(i,j)的B Band像素值本发明方法可以凸显彩色影像中RGB分别的梯度意义,而不仅仅是求取RGB的平均值来探讨黑白灰阶的梯度意义,故保留彩色影像的信息再配合先前已知图像约略大小及纹路(Texture)的信息,可以使得在图像的定位上更为精确。根据所找到的图像位置,可使用梯度及Morphology(形态学)的Dilation(扩张)及Erosion(侵蚀)的运算方法再进行图像的分割。
上述方法可以依图像的色彩,选择使用R、G、B Band任一、任二或全部的组合,如图像为白色,背景为绿色时,则可选择R及B Band来计算影像梯度(Gradient)值,以增加图像与背景的对比;而彩色RGB影像也可以转换成不同的色彩系统,如CMY、YIQ、HSI等,其运算方法与保留彩色信息的意义是相同的。


请参阅以下有关本发明一个较佳实施例的详细说明及其附图,将可进一步了解本发明的技术内容及其目的功效;有关该实施例的附图为图1为本发明的彩色图像位置定位模块流程实施例;图2为本发明的彩色图像位置定位、切割与辨识流程实施例;图3为本发明的彩色影像的图像定位方法与装置应用于自动化货柜辨识流程实施例。
具体实施例方式
请参阅图1所示,系彩色图像位置定位模块流程实施例。将彩色数码影像输入,为求加快运算速度,可对彩色数码影像做向下取样(Down-sampling),将宽跟高皆每两点取一点使影像缩小为原始的1/4大小,对缩小或未缩小的影像的RGB三个Band的像素值分别抽取出来,对RGB三个Band的像素值以Fi,j=((r(i,j)-r(i,j+1))2+(g(i,j)-g(i,j+1))2+(b(i,j)-b(i,j+1))2)1/2或Fi,j=|r(i,j)-r(i,j+1)|+|g(i,j)-g(i,j+1)|+|b(i,j)-b(i,j+1))|的方式计算其梯度值,此时所得到的梯度值因保留住彩色的信息,所以在任一色彩边缘都会较习用的灰阶影像所做出的梯度来的强烈,对图像的定位更加明显;接下来决定门槛值分别做水平/垂直梯度的二元化,以计算其平均边缘点,并决定有效列的临界值,当所有有效列都确定后,对这些有效列做群组化(意即距离近者归为一组),再来对这些群组以同样的方式作有效行的认定并做群组化的动作,因此每一列群组内可能会有多个行群组,再对每一列群组取其最大的行群组,最后产生多组候选区,再依先前已知图像的约略大小及图像纹理(Texture)特性过滤候选区位置,然后产生出图像最可能的候选区,再还原成原始大小供后续处理阶段使用。
图2所示的是彩色图像位置定位、切割与辨识流程实施例。整体彩色图像位置定位、切割与辨识流程包括(a)彩色影像输入;(b)彩色图像位置定位模块;(c)彩色图像切割模块;(d)辨识/处理模块;(e)辨识结果输出。这里所定义的图像以货柜号码为例,当货柜的彩色影像输入后,经由彩色图像位置定位模块利用彩色RGB所运算出的梯度(Gradient)信息,产生货柜号码的可能位置,从撷取到的货柜号码位置,利用彩色图像切割模块分割出货柜号码区域,并将各个货柜号码字符独立切割出来,再将切割出来的货柜号码字符影像逐一进入辨识/处理模块进行辨识,在辨识/处理模块中会将货柜辨识结果的前10码与最后一码做check sum(加总比对法)核对是否正确,最后输出完整的货柜号码。
图3所示的是详述本发明所提供的彩色数码影像的图像定位方法与装置应用于自动化货柜辨识流程实施例,主要包括有彩色数码影像1、彩色摄影机2、彩色图像撷取模块3、彩色图像定位模块4、彩色图像切割模块5、辨识/处理模块6及货柜数据库7。其中,彩色图像撷取模块3负责撷取由彩色摄影机2所拍取的单张彩色数码影像1,所拍取的货柜影像供彩色图像定位模块4做货柜号码位置的定位,再由彩色图像切割模块5做货柜号码字符串的切割与字符切割,最后由辨识/处理模块6来执行辨识与后续处理,货柜号码辨识结果进入货柜数据库7比对是否为核准放行的货柜车辆,用来作为货柜车辆进出管制的管理依据。
本发明所提供的彩色数字影像的图像定位方法与装置,与现有技术相互比较时,更具有下列的优点该方法不将彩色RGB影像转换为黑白灰阶影像,而是保持彩色影像的信息,将彩色影像的RGB Band分别抽出,再计算R Band、G Band及B Band的方向趋势变化(例如水平/垂直方向的梯度),以凸显彩色影像中RGB分别的梯度意义,而不仅仅是求取RGB的平均值来探讨黑白灰阶的梯度意义,故保留彩色影像的信息再配合先前已知图像约略大小及纹路(Texture)的信息,可以使得在图像定位与切割上更为精确。
可以依图像的色彩种类,选择使用R、G、B Band三者任一、任二或全部的组合,如图像为白色,背景为绿色时,则可选择R及B Band来计算影像梯度(Gradient)值,以增加图像与背景的对比。
彩色RGB影像可以转换成不同的色彩系统,如CMY(青、品红、黄,减色系统)、YIQ(Y指亮度;I、Q指色调,描述色彩及饱和度)、HSI(色调、饱和度、亮度)等,其运算方法与保留彩色信息的意义是相同的。
权利要求
1.一种彩色数码影像的图像定位方法,利用彩色CCD摄影机、数码相机或扫瞄器等彩色影像输出装置所产生的彩色数码影像,进行影像中感兴趣的图像的寻找与定位,其特征为保持彩色影像的信息,将彩色影像的RGB Band分别抽出,再计算R Band、G Band及B Band的方向趋势变化,以凸显彩色影像中RGB分别的梯度意义,可以使得在图像定位与切割上更为精确。
2.按权利要求1所述的彩色数码影像的图像定位方法,其特征为依图像与背景的色彩,选择使用R、G、B Band三者中的任一、任二或全部的组合来计算方向趋势变化,以增加图像与背景的对比。
3.按权利要求1或2所述的彩色数码影像的图像定位方法,其特征为其中的方向趋势变化为梯度计算。
4.按权利要求3所述的彩色数码影像的图像定位方法,其特征为其中的梯度计算方式为Fi,j=((r(i,j)-r(i,j+1))2+(g(i,j)-g(i,j+1))2+(b(i,j)-b(i,j+1))2)1/2。
5.按权利要求3所述的彩色数码影像的图像定位方法,其特征为其中的梯度计算方式为Fi,j=|r(i,j)-r(i,j+1)|+|g(i,j)-g(i,j+1)|+|b(i,j)-b(i,j+1))|。
6.按权利要求1所述的彩色数码影像的图像定位方法,其特征为其中的彩色RGB影像也可以转换成CMY色彩系统,计算C Band、M Band及Y Band的方向趋势变化,以凸显彩色影像中CMY分别的梯度意义,其运算方法与保留彩色信息的意义是相同的,可以使得在图像定位与切割上更为精确。
7.按权利要求1所述的彩色数码影像的图像定位方法,其特征为其中的彩色RGB影像也可以转换成YIQ色彩系统,计算Y Band、I Band及Q Band的方向趋势变化,以凸显彩色影像中YIQ分别的梯度意义,其运算方法与保留彩色信息的意义是相同的,可以使得在图像定位与切割上更为精确。
8.按权利要求1所述的彩色数码影像的图像定位方法,其特征为其中的彩色RGB影像也可以转换成HSI色彩系统,计算H Band、S Band及I Band的方向趋势变化,以凸显彩色影像中HSI分别的梯度意义,其运算方法与保留彩色信息的意义是相同的,可以使得在图像定位与切割上更为精确。
9.按权利要求6或7或8所述的彩色数码影像的图像定位方法,其特征为其中的方向趋势变化为梯度计算。
10.一种彩色数码影像的图像定位装置,包含彩色图像定位的处理器与内存,利用彩色摄影机、数码相机或扫瞄器等彩色影像输出装置所产生的彩色数码影像,进行影像中感兴趣的图像的寻找与定位,其特征为彩色图像定位的处理器保持彩色影像的信息,将彩色影像的RGB Band分别抽出,再计算R Band、G Band及B Band的方向趋势变化,以凸显彩色影像中RGB分别的梯度意义,可以使得在图像定位与切割上更为精确。
11.按权利要求10所述的彩色数码影像的图像定位装置,其特征为彩色图像定位的处理器依图像与背景的色彩,选择使用R、G、B Band三者中的任一、任二或全部的组合来计算方向趋势变化,以增加图像与背景的对比。
12.按权利要求10或11所述的彩色数码影像的图像定位装置,其特征为其中的方向趋势变化为梯度计算。
13.按权利要求12所述的彩色数码影像的图像定位装置,其特征为其中的梯度计算方式为Fi,j=((r(i,j)-r(i,j+1))2+(g(i,j)-g(i,j+1))2+(b(i,j)-b(i,j+1))2)1/2。
14.按权利要求12所述的彩色数码影像的图像定位装置,其特征为其中的梯度计算方式为Fi,j=|r(i,j)-r(i,j+1)|+|g(i,j)-g(i,j+1)|+|b(i,j)-b(i,j+1))|。
15.按权利要求10所述的彩色数码影像的图像定位装置,其特征为其中的彩色RGB影像也可以转换成CMY色彩系统,计算C Band、M Band及Y Band的方向趋势变化,以凸显彩色影像中CMY分别的梯度意义,其运算方法与保留彩色信息的意义是相同的,可以使得在图像定位与切割上更为精确。
16.按权利要求10所述的彩色数码影像的图像定位装置,其特征为其中的彩色RGB影像也可以转换成YIQ色彩系统,计算Y Band、I Band及Q Band的方向趋势变化,以凸显彩色影像中YIQ分别的梯度意义,其运算方法与保留彩色信息的意义是相同的,可以使得在图像定位与切割上更为精确。
17.按权利要求10所述的彩色数码影像的图像定位装置,其特征为其中的彩色RGB影像也可以转换成HSI色彩系统,计算H Band、S Band及I Band的方向趋势变化,以凸显彩色影像中HSI分别的梯度意义,其运算方法与保留彩色信息的意义是相同的,可以使得在图像定位与切割上更为精确。
18.按权利要求15或16或17所述的彩色数码影像的图像定位装置,其特征为其中的方向趋势变化为梯度计算。
全文摘要
本发明为一种彩色数码影像的图像定位方法与装置,利用彩色数码影像中图像的水平/垂直方向的色彩/色彩饱和度/明暗等的方向趋势变化的特性以及已知图像约略大小及纹路的信息,进行图像位置的定位;根据以上所定位出的图像,将其切割出来后,即可应用影像辨识或影像处理方法做后续的辨识与处理。
文档编号G06K9/20GK1687960SQ20051007247
公开日2005年10月26日 申请日期2005年5月20日 优先权日2005年5月20日
发明者吴坤荣, 柳恒崧, 白家荣 申请人:中华电信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1