一种利用层分解对图像和视频进行交互式颜色编辑的方法与流程

文档序号:12787360阅读:来源:国知局

技术特征:

1.一种利用层分解对图像和视频进行交互式颜色编辑的方法,其特征在于,主要包括层颜色(一);超像素分割(二);能量函数(三);计算单个像素权重(四);交互式颜色重建(五)。

2.基于权利要求书1所述的层颜色(一),其特征在于,由于人们在重组一个图像的颜色时也许有不同的目标,使用者可指定一个调色板或者使用自动调色板,自动调色板可提供一个有用的起始点,且能使颜色自动重组,为给可能的颜色空间提供直观的掌控,本方法模型可匹配人们从图像中提取的色板,基于颜色重建平均误差,为此模型添加一个惩罚项,此处,像素误差由测量像素颜色和调色板凸包之间的距离而得。

3.基于权利要求书1所述的超像素分割(二),其特征在于,利用邻近像素之间的高相关性,通过更小数量的超像素(超体素)求出层权重,然后用邻近超像素的一个线性组合计算出每个像素的层解决方案,为计算超像素,伴随迭代k-均值重新定义中心,通过手动指定超像素S的数量,且初始化每个超像素S到一个随机种子位置,此时超像素由种子区域生长算法(SRG)算出,且它们的重心和颜色被用作下一次SRG迭代的种子,做5次K-means迭代,关于超像素,我们通过6-连接来定义邻近像素:4个空间相邻像素和2个时间相邻像素,从每个超像素里,计算出了一个6维特征向量(r,g,b,x,y,t),此向量是通过连接平均像素颜色和超像素的时空重心形成的,颜色、空间和时间坐标归一化在0和1之间,且通过重要性重新计算权重。

4.基于权利要求书1所述的能量函数(三),其特征在于,计算一系列的单个像素层的贡献Lj∈L,此处,Lj是一个S×1列向量,此向量将层j的贡献传递给每个超像素,且L是(SN)×1列向量,此向量通过连接所有的Lj形成,为了量化定义一个好的层的构成,在超像素层贡献L方面,最小化了一个能量函数Θ(L),Θ(L)是4个项的权重总和:

Θ(L)=λmM(L)+λrR(L)+λuU(L)+λeE(L) (1)

这4个项分别是流型一致性M(L)、图像重建R(L)、一致性U(L)以及显式约束E(L),Θ(L)是L的一个二次函数,其可以通过求一个线性系统:

<mrow> <mo>(</mo> <msub> <mi>&lambda;</mi> <mi>m</mi> </msub> <msup> <mrow> <mo>(</mo> <mrow> <mi>I</mi> <mo>-</mo> <mi>M</mi> </mrow> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mo>(</mo> <mrow> <mi>I</mi> <mo>-</mo> <mi>M</mi> </mrow> <mo>)</mo> <mo>+</mo> <msub> <mi>&lambda;</mi> <mi>r</mi> </msub> <msup> <mi>R</mi> <mi>T</mi> </msup> <mi>R</mi> <mo>+</mo> <msub> <mi>&lambda;</mi> <mi>u</mi> </msub> <msup> <mi>U</mi> <mi>T</mi> </msup> <mi>U</mi> <mo>+</mo> <msub> <mi>&lambda;</mi> <mi>e</mi> </msub> <msup> <mi>E</mi> <mi>T</mi> </msup> <mi>E</mi> <mo>)</mo> <mi>L</mi> <mo>=</mo> <msub> <mi>&lambda;</mi> <mi>r</mi> </msub> <msup> <mi>R</mi> <mi>T</mi> </msup> <mi>B</mi> <mo>+</mo> <msub> <mi>&lambda;</mi> <mi>u</mi> </msub> <msup> <mi>U</mi> <mi>T</mi> </msup> <mover> <mn>1</mn> <mo>^</mo> </mover> <mo>+</mo> <msub> <mi>&lambda;</mi> <mi>e</mi> </msub> <msup> <mi>E</mi> <mi>T</mi> </msup> <mi>T</mi> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

从而得到最小化Θ(L)。

5.基于权利要求书4所述的流型一致性,其特征在于,层贡献应该是局部一致的,因为相邻且相似的超像素应该有相似的层分解,此流型由局部线性嵌入决定,将每个超像素si的颜色说成是它的Ks系邻近超像素的颜色的线性组合:

<mrow> <mo>|</mo> <mo>|</mo> <mi>C</mi> <mi>c</mi> <mi>o</mi> <mi>l</mi> <mi>o</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>k</mi> <mi>s</mi> </msub> </munderover> <mi>c</mi> <mi>o</mi> <mi>l</mi> <mi>o</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

求出权重wij且用一个S×S超像素流型矩阵W表示,流型一致性术语就是:

<mrow> <mtable> <mtr> <mtd> <mrow> <mi>M</mi> <mrow> <mo>(</mo> <mi>L</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mo>|</mo> <mo>|</mo> <mrow> <mo>(</mo> <msub> <mi>I</mi> <mi>S</mi> </msub> <mo>-</mo> <mi>W</mi> <mo>)</mo> </mrow> <msub> <mi>L</mi> <mi>j</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mo>|</mo> <mo>|</mo> <mrow> <mo>(</mo> <msub> <mi>I</mi> <mrow> <mi>s</mi> <mi>n</mi> </mrow> </msub> <mo>-</mo> <mi>M</mi> <mo>)</mo> </mrow> <mi>L</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

此处In是n×n恒等矩阵,M是一个块对角矩阵:

此矩阵总尺寸为SN×SN。

6.基于权利要求书4所述的图像重建,其特征在于,当层和其颜色相乘并求和时,色层应重新创建原图像,利用图像重建误差的平方:

<mrow> <mtable> <mtr> <mtd> <mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>L</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>d</mi> <mo>&Element;</mo> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <mi>g</mi> <mo>,</mo> <mi>b</mi> <mo>)</mo> </mrow> </mrow> </munder> <mo>|</mo> <mo>|</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>c</mi> <mrow> <mi>d</mi> <mi>j</mi> </mrow> </msub> <msub> <mi>L</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <msub> <mi>B</mi> <mi>d</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <mo>|</mo> <mo>|</mo> <mi>R</mi> <mi>L</mi> <mo>-</mo> <mi>B</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>

此处,Bd是通道d超像素颜色的S×1向量,cdj是j层颜色的通道d,R是整体尺寸为3S×(SN)的块矩阵:

<mrow> <mi>R</mi> <mo>=</mo> <mfenced open = "(" close = ")"> <mtable> <mtr> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>r</mi> <mn>1</mn> </mrow> </msub> <msub> <mi>I</mi> <mi>s</mi> </msub> </mrow> </mtd> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>r</mi> <mn>2</mn> </mrow> </msub> <msub> <mi>I</mi> <mi>s</mi> </msub> </mrow> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>r</mi> <mi>N</mi> </mrow> </msub> <msub> <mi>I</mi> <mi>s</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>g</mi> <mn>1</mn> </mrow> </msub> <msub> <mi>I</mi> <mi>s</mi> </msub> </mrow> </mtd> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>g</mi> <mn>2</mn> </mrow> </msub> <msub> <mi>I</mi> <mi>s</mi> </msub> </mrow> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>g</mi> <mi>N</mi> </mrow> </msub> <msub> <mi>I</mi> <mi>s</mi> </msub> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>b</mi> <mn>1</mn> </mrow> </msub> <msub> <mi>I</mi> <mi>s</mi> </msub> </mrow> </mtd> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>b</mi> <mn>2</mn> </mrow> </msub> <msub> <mi>I</mi> <mi>s</mi> </msub> </mrow> </mtd> <mtd> <mn>...</mn> </mtd> <mtd> <mrow> <msub> <mi>c</mi> <mrow> <mi>b</mi> <mi>N</mi> </mrow> </msub> <msub> <mi>I</mi> <mi>S</mi> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>7</mn> <mo>)</mo> </mrow> </mrow>

且B是所有Bd的连接。

7.基于权利要求书4所述的一致性,其特征在于,把每个超像素的层贡献归结为一,来帮助总贡献规范化,这个总贡献能影响一个单一超像素,形式为:

<mrow> <mi>U</mi> <mi>L</mi> <mo>=</mo> <mo>|</mo> <mo>|</mo> <mi>U</mi> <mi>L</mi> <mo>-</mo> <mover> <mn>1</mn> <mo>^</mo> </mover> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>8</mn> <mo>)</mo> </mrow> </mrow>

此处,是列向量当中的一个S×1列向量,U是一个S×(SN)标识矩阵,此矩阵的行和超像素对应,

<mrow> <msub> <mi>U</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>j</mi> <mo>-</mo> <mi>i</mi> <mo>&equiv;</mo> <mn>0</mn> <mrow> <mo>(</mo> <mi>mod</mi> <mi> </mi> <mi>S</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>j</mi> <mo>-</mo> <mi>i</mi> <mo>&NotEqual;</mo> <mn>0</mn> <mrow> <mo>(</mo> <mi>mod</mi> <mi> </mi> <mi>S</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>

同时,在每个列索引里的超像素和那个像素的层贡献对应如上。

8.基于权利要求书4所述的显示约束,其特征在于,某些情况下,来自使用者的、表明所提供的层应该贡献于一个所提供的图像区域的一些提示,可以帮助创造一个更好的层,例如,这些提示能把相似地建色但是语义上不同的区域分开,在设定C使用者约束的情况下,在层贡献偏离使用者约束时惩罚层贡献:

E(L)=‖EL-T‖2 (10)

此处,E是一个C×(SN)指示矩阵,此矩阵将用户设定的超像素层贡献从L里选出,T是一个长度C向量,包含用户设定的目标值,当用户没有设定层贡献约束时,算法会自动地用非常相似的颜色为每个层把约束加到像素里,这样能在许多的图像里达成层之间更好的分离,对于有独立区域、有着相似颜色的、更复杂的图像,由用户设定的约束就需要更好的分离这些区域。

9.基于权利要求书1所述的计算单个像素权重(四),其特征在于,使用局部线性嵌入的概念,从单个超像素层贡献L推出单个像素层贡献X,通过为每个像素计算一系列Kp型最近相邻超像素开始,一个像素和一个超像素之间的距离就通过利用6维超像素特征向量和每个像素的对应值之间的距离算出,下一步,将每个像素的颜色说成它的Kp系相邻超像素的颜色的线性组合,确切地,对于像素pi

<mrow> <mo>|</mo> <mo>|</mo> <mi>c</mi> <mi>o</mi> <mi>l</mi> <mi>o</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>K</mi> <mi>p</mi> </msub> </munderover> <msub> <mi>q</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mi>C</mi> <mi>o</mi> <mi>l</mi> <mi>o</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>s</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>11</mn> <mo>)</mo> </mrow> </mrow>

通过最小化对象至约束:来计算权重qij,用一个P×S matrix Q,代表所有的qij的这个系列,最后,通过简单的矩阵乘法:

Xj=QLj (12)

对于层贡献,由于迭代负抑制会正确地重建图像且会产生另外一个类似分层,且对于4000超像素,无约束线性解决方案只需花费几秒,故利用迭代负抑制的4个迭代来绑定层贡献的大小。

10.基于权利要求书1所述的交互式颜色重建(四),其特征在于,输入图像或视频,通过上述层分解算法,利用新的调色板来颜色重建一个图像或视频帧,并对调色板变化进行实时反馈,帮助用户在编辑图像和视频时产生更直观的视觉效果,从而实现交互式颜色重建。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1