一种基于距离测度学习的AP聚类图像标注方法与流程

文档序号：12468767阅读：来源：国知局

技术特征：

1.一种基于距离测度学习的AP聚类图像标注方法，其特征在于，包括以下步骤：

步骤1)进行半监督的距离测度学习，得到新的距离测度。

步骤2)利用所述新的距离测度进行AP聚类标注。

2.根据权利要求1所述的步骤1)，其特征在于，所述步骤1)包括：借助图像类别标注信息，采用半监督的距离测度学习方法，学习到新的距离测度矩阵M；所述步骤1)具体为：

选取语义相同的图像和语义不同的图像作为训练样本；

假设语义相同图像的训练样本集合表示为A{(f_i1，f_i2)}_m(其中i＝1……m，m表示相同语义图像训练样本个数，f_i1和f_i2分别表示语义相同的两个图像的底层特征)。A集合中每一对训练样本按照式(3)表示为

$<mrow> <msubsup> <mi>d</mi> <mrow> <mi>a</mi> <mi>b</mi> </mrow> <mi>M</mi> </msubsup> <mo>=</mo> <msup> <mrow> <mo>(</mo> <mrow> <mover> <msub> <mi>x</mi> <mi>a</mi> </msub> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <mover> <msub> <mi>x</mi> <mi>b</mi> </msub> <mo>&RightArrow;</mo> </mover> </mrow> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mo>·</mo> <mi>M</mi> <mo>·</mo> <mrow> <mo>(</mo> <mrow> <mover> <msub> <mi>x</mi> <mi>a</mi> </msub> <mo>&RightArrow;</mo> </mover> <mo>-</mo> <mover> <msub> <mi>x</mi> <mi>b</mi> </msub> <mo>&RightArrow;</mo> </mover> </mrow> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> <mo>;</mo> </mrow>$

语义不同的图像的训练样本集合B{(f_j1，f_j2)}_n(其中j＝1……n，n表示不同语义图像训练样本的个数，f_i1和f_i2分别表示语义不同的两个图像的底层特征)。B集合中每一对训练样本按照所述式(3)表示为

定义如下目标函数：

$<mrow> <mi>G</mi> <mrow> <mo>(</mo> <mi>M</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>min</mi> <mi>M</mi> </munder> <mo>{</mo> <mrow> <munder> <mi>max</mi> <mrow> <mi>i</mi> <mn>1</mn> <mo>&NotEqual;</mo> <mi>i</mi> <mn>2</mn> </mrow> </munder> <mrow> <mo>(</mo> <msubsup> <mi>d</mi> <mrow> <msub> <mi>i</mi> <mn>1</mn> </msub> <msub> <mi>i</mi> <mn>2</mn> </msub> </mrow> <mi>M</mi> </msubsup> <mo>)</mo> </mrow> <mo>-</mo> <munder> <mi>min</mi> <mrow> <mi>j</mi> <mn>1</mn> <mo>&NotEqual;</mo> <mi>j</mi> <mn>2</mn> </mrow> </munder> <mrow> <mo>(</mo> <msubsup> <mi>d</mi> <mrow> <msub> <mi>j</mi> <mn>1</mn> </msub> <msub> <mi>j</mi> <mn>2</mn> </msub> </mrow> <mi>M</mi> </msubsup> <mo>)</mo> </mrow> </mrow> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>$

根据式(5)将式(4)中的和近似转化为和

$<mrow> <mi>max</mi> <mo>{</mo> <msub> <mi>a</mi> <mn>1</mn> </msub> <mo>,</mo> <mo>...</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>}</mo> <mo>≤</mo> <msub> <mi>logΣ</mi> <mi>i</mi> </msub> <msup> <mi>e</mi> <msub> <mi>a</mi> <mi>i</mi> </msub> </msup> <mo>≤</mo> <mi>max</mi> <mo>{</mo> <msub> <mi>a</mi> <mn>1</mn> </msub> <mo>,</mo> <mo>...</mo> <msub> <mi>a</mi> <mi>n</mi> </msub> <mo>}</mo> <mo>+</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <mi>n</mi> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mo>(</mo> <mn>5</mn> <mo>)</mo> <mo>;</mo> </mrow>$

最后，求解新测度矩阵M，将(4)式转化为如下形式：

$<mrow> <msup> <mi>G</mi> <mo>,</mo> </msup> <mrow> <mo>(</mo> <mi>M</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mi>min</mi> <mi>M</mi> </munder> <mo>{</mo> <mrow> <mi>log</mi> <munder> <mi>Σ</mi> <mrow> <msub> <mi>i</mi> <mn>1</mn> </msub> <mo>&NotEqual;</mo> <msub> <mi>i</mi> <mn>2</mn> </msub> </mrow> </munder> <msup> <mi>e</mi> <msubsup> <mi>d</mi> <mrow> <msub> <mi>i</mi> <mn>1</mn> </msub> <msub> <mi>i</mi> <mn>2</mn> </msub> </mrow> <mi>M</mi> </msubsup> </msup> <mo>+</mo> <mi>log</mi> <munder> <mi>Σ</mi> <mrow> <msub> <mi>j</mi> <mn>1</mn> </msub> <mo>&NotEqual;</mo> <msub> <mi>j</mi> <mn>2</mn> </msub> </mrow> </munder> <msup> <mi>e</mi> <mrow> <mo>-</mo> <msubsup> <mi>d</mi> <mrow> <msub> <mi>j</mi> <mn>1</mn> </msub> <msub> <mi>j</mi> <mn>2</mn> </msub> </mrow> <mi>M</mi> </msubsup> </mrow> </msup> </mrow> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> <mo>,</mo> </mrow>$

M＞0 (7)，

trace(M)＝1 (8)。

3.根据权利要求1、2所述的步骤1)，其特征在于，求解新测度矩阵M的步骤具体为：

1)输入同语义训练集A{(f_i1，f_i2)}_m(m为A训练集个数)，输入不同语义训练集B{(f_j1，f_j2)}_n(n为B训练集个数)；

2)输入学习因子γ；

Repeat

3)其中代表训练集A中每一对样本的距离，代表训练集B中每一对样本的距离。计算函数G’(M)关于M的梯度

4)更新

5)约束条件：其中λ_i为M第i个特征值，为M的第i个特征向量(M＞0)；

6)约束条件：

Until循环结束或结果收敛。

4.根据权利要求1、2所述的步骤2)，其特征在于，所述步骤2)包括：

步骤一：对每一类图像应用所述新的距离测度进行AP聚类，确定每一类图像的聚类中心，将每一类图像按照聚类结果分类。

步骤二：计算待标注图像到每一类图像聚类中心的平均距离，求得平均距离最小的图像类别作为待标注图像类别，平均距离公式如式(9)所示，

$<mrow> <mi>M</mi> <mi>i</mi> <mi>n</mi> <mo>(</mo> <msub> <mi>D</mi> <mi>i</mi> </msub> <mo>)</mo> <mo>=</mo> <mi>M</mi> <mi>i</mi> <mi>n</mi> <mo>(</mo> <mfrac> <mrow> <munderover> <mi>Σ</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> </munderover> <mi>d</mi> <mrow> <mo>(</mo> <mi>A</mi> <mo>,</mo> <msub> <mi>B</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>)</mo> </mrow> </mrow> <msub> <mi>m</mi> <mi>i</mi> </msub> </mfrac> <mo>)</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> <mo>;</mo> </mrow>$

其中A代表待检测图像，B_ij代表第i类图像第j个聚类中心，d(A，B_ij)表示待检测图像到第i类图像第j个聚类中心的距离，m_i代表第i类图像聚类中心个数；

步骤三：在确定的类别内计算待标注图像到类内各聚类中心的距离，求得距离最小的图像类别作为待标注图像类内类别。统计该类别下图像的标注词汇，作为待标注图像的标注词。改进的AP聚类标注模型，是对于每一类图像进行聚类，避免了对整个训练集聚类时因训练数据集太大造成的聚类精度的缺失。

完整全部详细技术资料下载

当前第2页1 2 3