数字抠像处理中基于svm的交互式区域划分方法

文档序号：6524941阅读：319来源：国知局

数字抠像处理中基于svm的交互式区域划分方法
【专利摘要】本发明公开了一种数字抠像处理中的基于SVM的交互式图像区域划分方法。步骤为：1）载入图像；2）判断图像前景背景是否可分：如果没有重合，则图像区域为待处理图像区域，转下一步骤3）；否则，把图像区域划分为前景和背景颜色分布不重合的子区域，转下一步骤3）；3）步骤2）中待处理图像区域中，根据颜色差别标识出代表性的未处理的前景区域和背景区域；4）对于待处理图像区域中的未在所述步骤3）标识的区域的像素点执行SVM区域划分算法，得到划分概率数据；5）划分概率大的像素点归入已正确划分区域；对于归入已正确划分区域的像素点，可以再次参与下次区域划分。本发明具有速度快，自动化程度较高的特点，具有很好的实用价值。
【专利说明】数字抠像处理中基于SVM的交互式区域划分方法
【技术领域】
[0001]本发明涉及一种数字抠像处理中基于SVM的交互式区域划分方法。
【背景技术】
[0002]抠像就是把一张图像中的前景和背景分隔开来的技术。处理图像前景背景是否简单可分，是指前景和背景区域的颜色在颜色空间中的分布是否重合。如果重合，那么该图像前景背景非简单可分，否则简单可分。非简单可分的图像，其前景背景区域的划分靠算法实现几乎是不可能的。具体的图像是复杂的，任何精巧高效的算法，都是在仔细分析某一类图像的过程中形成的，一般只是针对该类图像有效，解决了一类问题，但往往对另一类问题失效。这也是图像处理和模式识别科研人员的苦恼，因为他们的研究对象没有万能通用的解法。要想实现通用的自动化程序高的图像识别算法，一定量的人工交互是必不可少的。对于全局非简单可分的图像，在一定范围的局部区域内，其前景背景可以是简单可分的。
[0003]目前，抠像技术可以分成三大类:第一类是基于采样的抠像技术。这类技术首先需要一个准确划分出前景区域、背景区域和待处理区域的三分图，通过采集待处理区域中的像素点P的周边的前景点和背景点，估算出P点的前景颜色F和背景颜色B，然后利用抠像方程估算出透明度值ct。比如Knockout方法、Hillman方法、Mishima方法和Bayesian方法等。基于采样的抠像技术有三个问题需要解决:首先需要预先得到一张准确的三分图，如果该图不准确，则抠像结果也不准确；其次，如何采集合适的前景点和背景点来估算F和B，也是一个难题；第三，如果图像颜色变化比较剧烈，往往抠像结果很差。第二类是基于相似性假设的抠像技术。这一类技术假设待处理图像在小范围内颜色平滑，它在处理过程中也需要一张准确的三分图，此外，对于图像颜色变化比较剧烈的情况，假设就不成立，其抠像效果也较差。比如泊松抠像、随机行走方法和测地线方法等；第三类是采样与相似性结合的抠像技术。此类方法需要计算每个待处理像素点的数据能量Ed以及待处理像素点之间的相似能量Es，并通过最小化两者的和来求得所有待处理像素的α值，如鲁棒抠像、快捷抠像等。这类方法在特定的情况下，可以通过少量的人工交互标识出小部分有代表性的确定的前景和背景区域，就可以得到较好的抠像结果，但是在大部分情况下，要取得好的抠像结果，一般也需要一张准确的三分图。

【发明内容】

[0004]准确的三分图需要大量人工交互才可以得到，这需要花费大量时间，通常要十几分钟甚至更长。我们需要在三分图的准确度和时间代价上取得一定的平衡，本发明提供了一种数字抠像处理中基于SVM的交互式区域划分方法。
[0005]数字抠像处理中的基于SVM (Support Vector Machine)的交互式图像区域划分方法，在数字抠像处理中，标识出部分前景和背景区域的基础上，使用SVM区域划分方法逐步把图像区域划分为确定的前景，确定的背景和未知区域三个部分，其步骤为:
[0006]I)载入图像；[0007]2)判断图像前景背景是否可分:图像区域中的前景和背景像素点在颜色空间中的颜色分布是否有重合，如果没有重合，则图像区域为待处理图像区域，转下一步骤3);否贝U，把图像区域划分为前景和背景颜色分布不重合的子区域，所述的子区域为待处理图像区域，转下一步骤3)；
[0008]3)步骤2)中所述的待处理图像区域中，根据颜色差别标识出代表性的未处理的前景区域和背景区域；
[0009]4)对于待处理图像区域中的未在所述步骤3)标识的区域的像素点执行SVM区域划分算法，得到每个像素点的区域划分结果概率数据；
[0010]5)划分概率大于0.95的像素点认为其划分结果正确，归入已正确划分区域；对于归入已正确划分区域的像素点，在以下两种情况下参与下次区域划分:一是像素所归属的背景或前景颜色单一，没有合适的其他像素点参与下次划分；二是像素点的颜色可划分出未划分区域的前景或背景区域；如果区域划分结果与不符合要求，进行矫正；如果区域划分尚未结束，回到步骤3)，直到所有待处理图像区域划分结束，并显示区域划分结果。
[0011]步骤3)中，所述的颜色差别在颜色空间中的分布应尽可能相互远离，所标识的颜色反差越大越好，以提高区域划分准确度。
[0012]步骤4)中，所述的SVM区域划分算法如下:设置像素点样本为八维向量{R, G, B，X, y, R/G, G/B, B/R}，其中R, G, B为该像素点的RGB颜色分量值，如果值为0，改为1，X, y为像素点在图像中的坐标位置，R/G, G/B, B/R为RGB颜色分量的比值；SVM区域划分具体步骤有:
[0013]3.1)把已知样本点的向量定标，把各分量的值定标在[0，I]范围之内；
[0014]3.2)利用定标后的样本点向量训练出一个分类模型:假设样本点数目为1，SVM分类的目标就是要找到分类超平面f(x) = wx+b, W为超平面的法向量，X为像素点，b为一待求实数，对于像素点Xi,如果为前景,有yi = f (Xi) = wXi+b≥1,如果为背景,则有yi = f (Xi)=wx^b ≤-1 ;再引入容错性,加入松弛变量ζ，有Yi [ (Wxi)+b]≥1- ζ i, (i = 1，2，...，1),分类超平面可以有无数个，如果低维线性不可分，通过核函数把向量映射到高维空间，使其线性可分，在实现当中，选择径向基函数作为核函数，前景样本点和背景样本点离选择的分类超平面越远，则分类效果越好，SVM训练的目标就是要找出距离前景背景样本点最远的超平面f (X) = wx+b,也即以下的优化问题:
[0015]
【权利要求】
1.一种数字抠像处理中基于SVM的交互式图像区域划分方法，其特征在于，在数字抠像处理中，标识出部分前景和背景区域的基础上，使用SVM区域划分方法逐步把图像区域划分为确定的前景，确定的背景和未知区域三个部分，其步骤为: 1)载入图像； 2)判断图像前景背景是否可分:图像区域中的前景和背景像素点在颜色空间中的颜色分布是否有重合，如果没有重合，则图像区域为待处理图像区域，转下一步骤3);否则，把图像区域划分为前景和背景颜色分布不重合的子区域，所述的子区域为待处理图像区域，转下一步骤3)； 3)步骤2)中所述的待处理图像区域中，根据颜色差别标识出代表性的未处理的前景区域和背景区域； 4)对于待处理图像区域中的未在所述步骤3)标识的区域的像素点执行SVM区域划分算法，得到每个像素点的区域划分结果概率数据； 5)划分概率大于0.95的像素点认为其划分结果正确，归入已正确划分区域；对于归入已正确划分区域的像素点，在以下两种情况下参与下次区域划分:一是像素所归属的背景或前景颜色单一，没有合适的其他像素点参与下次划分；二是像素点的颜色可划分出未划分区域的前景或背景区域；如果区域划分结果与不符合要求，进行矫正；如果区域划分尚未结束，回到步骤3)，直到所有待处理图像区域划分结束，并显示区域划分结果。
2.根据权利要求1所述的方法，其特征在于，步骤3)中，所述的颜色差别在颜色空间中的分布应尽可能相互远离，所标识的颜色反差越大越好，以提高区域划分准确度。
3.根据权利要求1所述的方法，其特征在于，步骤4)中，所述的SVM区域划分算法如下:设置像素点样本为八维向量{R, G, B，X, y, R/G, G/B, B/R}，其中R，G，B为该像素点的RGB颜色分量值，如果值为0,改为I, X，y为像素点在图像中的坐标位置，R/G, G/B, B/R为RGB颜色分量的比值；SVM区域划分具体步骤有: 3.1)把已知样本点的向量定标，把各分量的值定标在[0，I]范围之内； 3.2)利用定标后的样本点向量训练出一个分类模型:假设样本点数目为1，SVM分类的目标就是要找到分类超平面f(x) = wx+b, W为超平面的法向量，X为像素点，b为一待求实数，对于像素点Xi,如果为前景,有Yi = f (Xi) = wXi+b≥I,如果为背景,则有Yi = f (Xi)=wx^b ( -1 ;再引入容错性,加入松弛变量,有 Yi [ (Wxi) +b] ^ 1-1； (i = I, 2,..., I),分类超平面可以有无数个，如果低维线性不可分，通过核函数把向量映射到高维空间，使其线性可分，在实现当中，选择径向基函数作为核函数，前景样本点和背景样本点离选择的分类超平面越远，则分类效果越好，SVM训练的目标就是要找出距离前景背景样本点最远的超平面f (X) = wx+b,也即以下的优化问题:
根据 Yi [ (Wxi) +b] ^ 1-1； (i = I, 2,..., I)； 3.3)把未知像素点按照该模型进行分类，得到包含所有未知像素点分类概率的分类结果，在得到最优分类超平面fU) = wx+b后，根据Platt方法，利用神经元非线性作用函数来计算每个像素点的前景分类概率p:
【文档编号】G06K9/66GK103714539SQ201310714510
【公开日】2014年4月9日申请日期:2013年12月21日优先权日:2013年12月21日
【发明者】林生佑申请人:浙江传媒学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：林生佑;
技术所有人：浙江传媒学院;
我是此专利的发明人

上一篇：一种页面呈现方法及装置制造方法
上一篇：应用于行人姿势分类的3d人体模型的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。