一种图像处理的方法和装置制造方法

文档序号：6486711阅读：85来源：国知局

一种图像处理的方法和装置制造方法
【专利摘要】本发明公开了一种图像处理的方法和装置，能够使分割效果与视觉效果更加符合，提高分割效果的准确率，且保证分割后颜色种类的数量尽可能小。本发明实施例提供的一种图像处理的方法包括：将采集到的图像的RGB数据转换为LUV数据；设置分割后所期望的颜色种类数；将所设置的颜色种类数作为分割时所使用聚类中心的个数的最大值，利用K-MEANS方式对所述图像的LUV数据进行聚类分割。
【专利说明】一种图像处理的方法和装置
【技术领域】
[0001]本发明涉及数字音视频【技术领域】，特别涉及一种图像处理的方法和装置。
【背景技术】
[0002]图像分割在图形图像处理领域中一直是一个基础而重要的问题，对图形图像的进一步操作通常都基于分割的结果，分割的好与坏直接影响图形处理的最终结果。如通过机器人控制的无人驾驶汽车在行驶中如果对道路分割不准确，将直接影响汽车性能，甚至有可能会危害道路安全；而肤色分割可以帮助人们从背景中自动分离出人脸、手等身体部位，在进行人脸识别、表情识别、人手跟踪、人机交互、运动人体目标跟踪或色情图片过滤等的处理中都有着重要的应用价值。
[0003]现有方案一采用基于金字塔算法、mean-shif算法和分水岭算法进行图像分割；现有方案二采用基于某些颜色空间，如RGB颜色空间，并结合机器学习的方式来进行图像分割。
[0004]现有技术中至少存在如下缺陷:
[0005]对于方案一，现有方案所使用的分割算法有一个共同的缺点就是分割后得到的颜色种类数不能灵活指定，分割出来的颜色种类过多，一方面导致后续的图像处理操作复杂度，一方面也反映出分割的结果不够准确。且对于分水岭算法，如果要达到比较好的分割效果还需要人工干预，不便于操作，分割效率较低。
[0006]对于方案二，机器学习需要大量的样本，样本的选取很复杂，训练也费时间。总之，目前的机器学习方式训练的成本很高，计算复杂效率低，并且同样存在分割后的颜色的种类过多导致后续处理复杂、分割准确率较低的问题。

【发明内容】

[0007]本发明提供了一种图像处理的方法和装置，以解决现有方案分割后的颜色种类过多导致后续图像处理复杂度较高，分割准确率较低的问题等。
[0008]为达到上述目的，本发明实施例采用了如下技术方案:
[0009]本发明实施例提供了一种图像处理的方法，包括:
[0010]将采集到的图像的RGB数据转换为LUV数据；
[0011]设置分割后所期望的颜色种类数；
[0012]将所设置的颜色种类数作为分割时所使用聚类中心的个数的最大值，利用K-MEANS方式对所述图像的LUV数据进行聚类分割。
[0013]本发明实施例还提供了一种图像处理的装置，包括:
[0014]空间转换单元，用于将采集到的图像的RGB数据转换为LUV数据；
[0015]设置单元，用于设置分割后所期望的颜色种类数；
[0016]分割单元，用于将所设置的颜色种类数作为分割时所使用聚类中心的个数的最大值，利用K-MEANS方式对所述图像的LUV数据进行聚类分割。[0017]本发明实施例的有益效果是:
[0018]本发明实施例通过预先设置分割后所期望的颜色种类数，并根据所设置的颜色种类数使用LUV颜色空间结合基于K-MEANS方式的分割算法的技术手段，能够使分割效果与视觉效果更加符合，提高分割效果的准确率；且能够灵活控制分割后颜色种类的数量，保证分割后颜色种类的数量较小，大大降低了后续图像处理的复杂度。
【专利附图】

【附图说明】
[0019]图1为本发明实施例一提供的一种图像处理的方法流程图；
[0020]图2为本发明实施例三提供的一种图像处理的装置的结构示意图；
[0021]图3(a)为实验一中的原始图像；
[0022]图3(b)为对图3(a)中的图像采用本方案分割后的分割结果图；
[0023]图4(a)为实验二中的原始图像；
[0024]图4(b)为对图4(a)中的图像采用本方案分割后的分割结果图。
【具体实施方式】
[0025]为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。
[0026]本发明实施例采用了将图像从RGB(红绿蓝)颜色空间转换至LUV颜色空间，在LUV颜色空间中进行图像分割的方式。
[0027]RGB颜色空间是一种常用的颜色空间。许多硬件设备，如物理显示器、摄影机等，所采集和处理的图像数据都是RGB数据。然而，RGB主要是面向硬件的彩色模型，该模型一般用于彩色显示器或彩色摄像等，其与人眼视觉所感知的色彩偏差较大，且因为RGB颜色空间将色调、亮度、饱和度三个量放在一起表示，很难分开，其细节难以进行数字化的调整，不便于进行具体的图像处理操作。
[0028]LUV (L表示亮度，luminance ；U和V是色度坐标)颜色空间是CIE
[0029](国际发光照明委员会)提出的一种不同于RGB标准的颜色空间，其目的是建立与视觉统一的颜色空间(即对视觉可感知的颜色差别进行单位化的编码)，目前被广泛的应用于计算机彩色图像处理领域，对于一般的图像，色度坐标U和V的取值范围为-100到+100，亮度L取值为O到100。
[0030]由于LUV颜色空间是和人的视觉统一的颜色空间，本实施例采用在LUV颜色空间进行图像分割，以提高图像分割的效果。
[0031]参见图1，为本发明实施例一提供的一种图像处理的方法，包括:
[0032]11:将采集到的图像的RGB数据转换为LUV数据；
[0033]12:设置分割后所期望的颜色种类数；
[0034]13:将所设置的颜色种类数作为分割时所使用聚类中心的个数的最大值，利用K-MEANS方式对所述图像的LUV数据进行聚类分割。
[0035]对上述步骤11和12的执行前后次序不进行限定。
[0036]本发明实施例通过预先设置分割后所期望的颜色种类数，并根据所设置的颜色种类数使用LUV颜色空间结合基于K-MEANS方式的分割算法的技术手段，能够使分割效果与视觉效果更加符合，提高分割效果的准确率；且能够灵活控制分割后颜色种类的数量，保证分割后颜色种类的数量较小，大大降低了后续图像处理的复杂度。
[0037]下面对本发明实施例二提供的图像处理的方法进行说明，具体包括:
[0038]11:将采集到的图像的RGB数据转换为LUV数据。
[0039]本方案是在LUV颜色空间基础上进行聚类分割，但一般采集设备中获取的图像是使用RGB颜色空间，需要执行空间转换，转换的方法先从RGB颜色空间转换成XYZ颜色空间(RGB=>XYZ),再从XYZ颜色空间转换成LUV(XYZ=>LUV)。下面分别介绍RGB=>XYZ的转换和XYZ=>LUV的转换。
[0040]一)、RGB颜色空间转换成XYZ颜色空间
[0041]转换的具体操作可以以如下代码表示:
[0042]var_R=(R/255)//R from 0 to 255
[0043]var_G=(G/255)//G from 0 to 255
[0044]var_B=(B/255)//B from 0 to 255
[0045]if (var_R>0.04045) var_R= ((var_R+0.055)/1.055) ~2.4
[0046]elsevar_R=var_R/12.92
[0047]if (var_G>0.04045) var_G= ((var_G+0.055)/1.055) ~2.4
[0048]elsevar_G=var_G/12.92
[0049]if (var_B>0.04045) var_B= ((var_B+0.055)/1.055) ~2.4
[0050]elsevar_B=var_B/12.92
[0051]var_R=var_R*100
[0052]var_G=var_G*100
[0053]var_B=var_B*100
[0054]X=var_R*0.4124+var_G*0.3576+var_B*0.1805
[0055]Y=var_R*0.2126+var_G*0.7152+var_B*0.0722
[0056]Z=var_R*0.0193+var_G*0.1192+var_B*0.9505
[0057]二)、XYZ颜色空间转换成LUV颜色空间
[0058]var_U= (4*X) / (X+ (15*Y) + (3*Z))
[0059]var_V= (9*Y) / (X+ (15*Y) + (3*Z))
[0060]var_Y=Y/100
[0061]if(var_Y>0.008856)var_Y=var_Y~(1/3)
[0062]else
[0063]var_Y= (7.787*var_Y) + (16/116)
[0064]ref_X=95.047
[0065]ref_Y=100.000
[0066]ref_Z=108.883
[0067]ref_U=(4*ref_X)/(ref_X+(15*ref_Y)+(3*ref_Z))
[0068]ref_V=(9*ref_Y)/(ref_X+(15*ref_Y)+(3*ref_Z))
[0069]CIE_L*=(116*var_Y) - 16
[0070]CIE_u*=13*CIE_L**(var_U-ref_U)[0071 ] CIE_v*=13*CIE_L**(var_V-ref_V)
[0072]12:设置分割后所期望的颜色种类数。
[0073]优选的，本实施例预先设置的颜色种类数为小于12的数值。
[0074]13:将所设置的颜色种类数作为分割时所使用聚类中心的个数的最大值，利用K-MEANS方式对所述图像的LUV数据进行聚类分割。
[0075]K-MEANS方式的基本原理如下:接受输入量k，然后将η个数据对象划分为k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。
[0076]本实施例中K-MEANS方式的主要过程如下:首先从η个数据对象(图像中的像素点)任意选择k个(如2个)对象作为初始聚类中心；而对于所剩下其它对象，则根据它们与这些聚类中心的相似度(距离)，分别将它们分配给与其最相似的(聚类中心所代表的)聚类；然后再计算每个所获新聚类的聚类中心(该聚类中所有对象的均值)；不断重复这一过程直到满足终止条件。
[0077]本实施例根据上述基本原理所提供的K-MEANS方式的具体步骤包括:
[0078]S1:选取初始聚类中心，所述初始聚类中心的数目小于所设置的颜色种类数。聚类中心的个数与分割后得到的图像块的块数一致，也与分割后得到的颜色种类数一致。
[0079]示例性的，本实施例中初始聚类中心的取值可以默认为2。本实施例采用从较小聚类中心开始，在迭代中逐渐增多聚类中心的方式，相比于开始就采用与预设颜色种类数相同的个数的聚类中心的方式，能够提高聚类效果，从而提高分割准确度。
[0080]S2:计算图像中每一像素点与各所述初始聚类中心的距离，并将像素点分配至距离最小的聚类中心。分配至同一聚类中心的像素点构成一个图像块。
[0081]初始聚类中心可以为在图像中随机选取的像素点。
[0082]本实施例是在LUV空间下执行的分割操作，计算时采用像素点的LUV数据进行计算。上述距离采用欧式距离，具体计算方式可以表示如下:
【权利要求】
1.一种图像处理的方法，其特征在于，所述方法包括: 将采集到的图像的RGB数据转换为LUV数据；设置分割后所期望的颜色种类数；将所设置的颜色种类数作为分割时所使用聚类中心的个数的最大值，利用K-MEANS方式对所述图像的LUV数据进行聚类分割。
2.根据权利要求1所述的方法，其特征在于，所述将采集到的图像的RGB数据转换为LUV数据包括: 将所述图像的RGB数据转换为XYZ数据；将所述XYZ数据转换为LUV数据。
3.根据权利要求1所述的方法，其特征在于，所述将所设置的颜色种类数作为分割时所使用聚类中心的个数的最大值，利用K-MEANS方式对所述图像的LUV数据进行聚类分割包括: 选取初始聚类中心，所述初始聚类中心的数目小于所设置的颜色种类数；计算图像中每一像素点与各所述初始聚类中心的距离，并将像素点分配至距离最小的聚类中心；更新所述初始聚类中心并增加预定数目的新聚类中心，得到第二次迭代的聚类中心；计算图像中每一像素点与各所述第二次迭代的聚类中心的距离，并将像素点分配至距离最小的聚类中心；判断各聚类中像素点与聚类中心之间的距离是否小于距离阈值，若是，结束分割，若否，更新所述第二次迭代的聚类中心并在所使用的聚类中心的个数小于所设置的颜色种类数时增加预定数目的新聚类中心，得到下一次迭代的聚类中心，执行下一次迭代。
4.根据权利要求3所述的方法，其特征在于，采用如下方式更新聚类中心: 计算聚类中心所对应的聚类中所有像素点的数据的平均值，将该平均值作为新的聚类中心。
5.根据权利要求1至4任一项所述的方法，其特征在于，所述增加预定数目的新聚类中心包括:在图像中随机选取一个像素点作为所述新聚类中心。
6.一种图像处理的装置，其特征在于，所述装置包括: 空间转换单元，用于将采集到的图像的RGB数据转换为LUV数据；设置单元，用于设置分割后所期望的颜色种类数；分割单元，用于将所设置的颜色种类数作为分割时所使用聚类中心的个数的最大值，利用K-MEANS方式对所述图像的LUV数据进行聚类分割。
7.根据权利要求6所述的装置，其特征在于，所述空间转换单元，具体用于将所述图像的RGB数据转换为XYZ数据，将所述XYZ数据转换为LUV数据。
8.根据权利要求6所述的装置，其特征在于，所述分割单元包括迭代模块，所述迭代模块，用于选取初始聚类中心，所述初始聚类中心的数目小于所设置的颜色种类数；计算图像中每一像素点与各所述初始聚类中心的距离，并将像素点分配至距离最小的聚类中心；更新所述初始聚类中心并增加预定数目的新聚类中心，得到第二次迭代的聚类中心；计算图像中每一像素点与各所述第二次迭代的聚类中心的距离，并将像素点分配至距离最小的聚类中心；判断各聚类中像素点与聚类中心之间的距离是否小于距离阈值，若是，结束分割，若否，更新所述第二次迭代的聚类中心并在所使用的聚类中心的个数小于所设置的颜色种类数时增加预定数目的新聚类中心，得到下一次迭代的聚类中心，执行下一次迭代。
9.根据权利要求8所述的装置，其特征在于，所述分割单元包括聚类中心更新模块，所述聚类中心更新模块，用于计算聚类中心所对应的聚类中所有像素点的数据的平均值，将该平均值作为新的聚类中心。
10.根据权利要求6至9任一项所述的装置，其特征在于，所述聚类中心更新模块，还用于在图像中随机选取一个像`素点作为所述新聚类中心。
【文档编号】G06T7/40GK103514596SQ201210227213
【公开日】2014年1月15日申请日期:2012年6月30日优先权日:2012年6月30日
【发明者】杨志宇申请人:北京新媒传信科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨志宇
技术所有人：北京新媒传信科技有限公司
我是此专利的发明人

上一篇：多媒体评价系统、多媒体评价装置以及多媒体评价方法
上一篇：信息处理的方法、电子设备及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。