一种水质图像分类方法与流程

文档序号:12365662阅读:来源:国知局

技术特征:

1.一种水质图像分类方法,其特征在于使用多特征融合的词包对水质图像进行分类,具体包括以下步骤:

①水质图像采集,标记水质图像类别标签,以指示训练图像属于正常,水华污染,水葫芦污染,工厂排污污染和生活垃圾污染五种图像中的哪个类别;

②对水质图像使用图像金字塔进行关键点检测,并对水质图像中的关键点进行方向梯度直方图与颜色特征的提取,融合成描述当前关键点的特征向量;

③使用狄利克雷混合模型进行视觉词典学习,对图像生成的各关键点特征向量进行编码生成图像词包;

④使用图像词包和类别标签训练监督型主题模型,得到监督型主题模型参数,并将训练得到的监督型主题模型用于后续的分类任务中;

⑤将需要分类的水质图像作为输入图像,根据步骤②的方法对该输入图像进行特征提取操作,并量化成词包,然后使用步骤④得到的训练后的监督型主题模型进行分类,得到输入图像所属的类别。

2.如权利要求1所述的一种水质图像分类方法,其特征在于所述步骤①的具体过程为:

①-1、采用高清摄像机或照相机对水面图像进行采集,将采集的水质图像分成5类,分别为正常,水华污染,水葫芦污染,工厂排污污染和生活垃圾污染;

①-2、对采集的水质图像进行初步处理,去掉包含人和船只的图像。对于出现两类及以上污染的水质图像,将其所属污染区域分割开,作为多幅训练图像;

①-3、使用图像缩放方法,对图像大小进行调整,将其调整为400*400大小的图像;

①-4、对5类水质图像给定训练标签:正常标签为1,水华污染标签为2,水葫芦污染标签为3,工厂排污污染标签为4,生活垃圾污染标签为5。

3.如权利要求1所述的一种水质图像分类方法,其特征在于所述步骤②的具体过程为:

②-1、使用图像金字塔标定水质图像的关键点;

②-2、计算以当前关键点为中心的24*24邻域窗口内的所有像素点的R、G、B三个颜色通道颜色均值;

②-3、将256颜色通道转换为64颜色通道,将第c个颜色通道的颜色均值映射到64色颜色空间后的值记为blockc其中,1≤c≤3,c=1时第c个颜色通道为R颜色通道,c=2时第c个颜色通道为G颜色通道,c=3时第c个颜色通道为B颜色通道,block表示第c个颜色通道的颜色均值,colork表示64色颜色空间中的第k种颜色,1≤k≤64,符号“||||”为求欧氏距离符号,表示取使得||block-colork||的值最小的一种颜色,将最小的颜色取为当前通道的颜色值,三个通道共形成三个颜色特征;

②-4、采用Gamma校正法对输入图像进行颜色空间的归一化;

②-5、将当前关键点所在的24*24的像素区域分化成16个cell,(6*6像素/cell),计算单个cell中每个像素的梯度方向和梯度大小这里x和y表示该像素点的坐标,f(x,y)表示像素在x和y的灰度值,统计每个cell的梯度直方图,形成每个cell的描述;将相邻4*4的cell组成一个block,并将一个block内所有的cell的特征串联起来,得到该关键点的方向梯度直方图特征描述。

4.如权利要求1所述的一种水质图像分类方法,其特征在于所述步骤③的具体过程为:

设模型的后验概率为K为取值1000,将其作为每个关键点可能属于的类别数,是参数为γk,1k,2的贝塔分布,Vk是该分布的随机变量,为一实值随机数;是参数为的高斯威沙特分布,其中为一个35维的列向量,ak为实值,Bk为35*35的矩阵,I为35*35的单位矩阵,是该分布的随机变量,分别取两个随机向量,一个是35维的列向量,一个是35*35的矩阵;是参数为的多项式分布,表示第n个样本属于1000个类别中第1个类别的概率,zn是该分布的随机变量,为一实值整数随机数;

③-1、将类别数K作为初始化类别数,给定一个初始化模型参数λ,λ取高斯威沙特分布的四个参数,分别为均值参数0,方差矩阵,取35*35的方差矩阵I,自由度参数D,取值为35,尺度矩阵,取35*35的单位矩阵I,随机初始化参数表示每个样本属于K个样本的概率,总概率相加为1;

③-2、对于训练样本中的每个关键点,记其特征为Xi,计算后验概率中的贝塔分布参数以及共轭分布参数

<mrow> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>=</mo> <mn>1</mn> <mo>+</mo> <msub> <mi>&Sigma;</mi> <mi>i</mi> </msub> <msub> <mi>&phi;</mi> <mrow> <msub> <mi>z</mi> <mi>i</mi> </msub> <mo>,</mo> <mi>k</mi> </mrow> </msub> </mrow>

<mrow> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> <mo>=</mo> <mi>&alpha;</mi> <mo>+</mo> <msub> <mi>&Sigma;</mi> <mi>i</mi> </msub> <msub> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>&gt;</mo> <mi>k</mi> </mrow> </msub> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> </msub> </mrow>

<mrow> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>=</mo> <mn>2</mn> <mo>+</mo> <mi>D</mi> <mo>+</mo> <msub> <mi>&Sigma;</mi> <mi>i</mi> </msub> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> </mrow>

<mrow> <msub> <mi>&nu;</mi> <msub> <mi>u</mi> <mi>k</mi> </msub> </msub> <mo>=</mo> <msup> <mrow> <mo>(</mo> <mi>I</mi> <mo>+</mo> <msub> <mi>B</mi> <mi>k</mi> </msub> <msub> <mi>&Sigma;</mi> <mi>i</mi> </msub> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <msub> <mi>B</mi> <mi>k</mi> </msub> <msub> <mi>&Sigma;</mi> <mi>i</mi> </msub> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow>

<mrow> <msub> <mi>B</mi> <mi>k</mi> </msub> <mo>=</mo> <msup> <mrow> <mo>(</mo> <mo>(</mo> <mrow> <msub> <mi>&Sigma;</mi> <mi>i</mi> </msub> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> <mo>+</mo> <mn>1</mn> </mrow> <mo>)</mo> <mi>I</mi> <mo>+</mo> <msub> <mi>&Sigma;</mi> <mi>i</mi> </msub> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&nu;</mi> <msub> <mi>u</mi> <mi>k</mi> </msub> </msub> </mrow> <mo>)</mo> <msup> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&nu;</mi> <msub> <mi>u</mi> <mi>k</mi> </msub> </msub> </mrow> <mo>)</mo> </mrow> <mi>T</mi> </msup> <mo>)</mo> </mrow> <mrow> <mo>-</mo> <mn>1</mn> </mrow> </msup> </mrow>

其中D为关键点特征维数,取值为35,表示第i个样本属于k类别的后验概率,γk,1k,2是后验概率q(V,θ*,Z)中贝塔分布的两个参数,akBk,I表示q(V,θ*,Z)中高斯威沙特分布的四个参数,其中I为单位矩阵,k从1取到1000,α为模型参数,取值为0.001;

③-3、对于每个样本,根据以下公式求该样本对应每个类别的概率:

<mrow> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> <mo>=</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mi>&psi;</mi> <mo>(</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> <mo>-</mo> <mi>&psi;</mi> <mo>(</mo> <mrow> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> <mo>)</mo> <mo>+</mo> <msub> <mi>E</mi> <mi>q</mi> </msub> <mo>(</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mi>&theta;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>*</mo> </msubsup> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>+</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&lt;</mo> <mi>k</mi> </mrow> </munder> <mo>(</mo> <mrow> <mi>&psi;</mi> <mrow> <mo>(</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>&psi;</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>)</mo> </mrow>

其中的取值如下:

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>E</mi> <mi>q</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mi>&theta;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>*</mo> </msubsup> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <mo>(</mo> <mo>-</mo> <mfrac> <mi>D</mi> <mn>2</mn> </mfrac> <mi>log</mi> <mn>2</mn> <mi>&pi;</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mrow> <mo>(</mo> <mrow> <msub> <mi>&Sigma;</mi> <mi>d</mi> </msub> <mi>&psi;</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>+</mo> <mn>1</mn> <mo>-</mo> <mi>d</mi> </mrow> <mn>2</mn> </mfrac> <mo>)</mo> </mrow> <mo>+</mo> <mi>D</mi> <mi>log</mi> <mn>2</mn> <mo>+</mo> <mi>log</mi> <mo>|</mo> <msub> <mi>B</mi> <mi>k</mi> </msub> <mo>|</mo> </mrow> <mo>)</mo> </mrow> <mo>-</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>(</mo> <mrow> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&nu;</mi> <msub> <mi>u</mi> <mi>k</mi> </msub> </msub> </mrow> <mo>)</mo> </mrow> <msub> <mi>a</mi> <mi>k</mi> </msub> <msub> <mi>B</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&nu;</mi> <msub> <mi>u</mi> <mi>k</mi> </msub> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>*</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>B</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>-</mo> <mi>log</mi> <mn>2</mn> <mi>&pi;</mi> <mi>e</mi> <mo>)</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>

D为关键点特征维数,取值为35,e为自然底数,π为圆周率常数,ψ()为伽马函数的二阶导数。是参数为的高斯分布,包含两个参数,分别是均值向量和方差矩阵;

③-4、观察的变化情况,若该值不变,则停止更新,否则转③-2重新计算,当停止更新时,记住此时的变分后验概率参数γk,1k,2对于对应的所有N个样本,用狄利克雷混合模型估算得出N个样本所属类别,并将不同的类别数记为H,然后将H个不同的类别记为视觉词典;

③-5、对于每个关键点特征Xi,使用训练得到的γk,1k,2估算特征Xi属于每个类别的后验概率:

<mrow> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> <mo>=</mo> <mi>exp</mi> <mrow> <mo>(</mo> <mi>&psi;</mi> <mo>(</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> <mo>-</mo> <mi>&psi;</mi> <mo>(</mo> <mrow> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> <mo>)</mo> <mo>+</mo> <msub> <mi>E</mi> <mi>q</mi> </msub> <mo>(</mo> <mi>log</mi> <mi> </mi> <mi>f</mi> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mi>&theta;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>*</mo> </msubsup> </mrow> <mo>)</mo> <mo>)</mo> </mrow> <mo>+</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&lt;</mo> <mi>k</mi> </mrow> </munder> <mo>(</mo> <mrow> <mi>&psi;</mi> <mrow> <mo>(</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>&psi;</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>)</mo> </mrow>

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>E</mi> <mi>q</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mi>&theta;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>*</mo> </msubsup> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <mo>(</mo> <mo>-</mo> <mfrac> <mi>D</mi> <mn>2</mn> </mfrac> <mi>log</mi> <mn>2</mn> <mi>&pi;</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>(</mo> <msub> <mi>&Sigma;</mi> <mi>d</mi> </msub> <mi>&psi;</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>+</mo> <mn>1</mn> <mo>-</mo> <mi>d</mi> </mrow> <mn>2</mn> </mfrac> <mo>)</mo> </mrow> <mo>+</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>D</mi> <mi>log</mi> <mn>2</mn> <mo>+</mo> <mi>log</mi> <mo>|</mo> <msub> <mi>B</mi> <mi>k</mi> </msub> <mo>|</mo> <mo>)</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>(</mo> <mrow> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&nu;</mi> <msub> <mi>u</mi> <mi>k</mi> </msub> </msub> </mrow> <mo>)</mo> </mrow> <msub> <mi>a</mi> <mi>k</mi> </msub> <msub> <mi>B</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&nu;</mi> <msub> <mi>u</mi> <mi>k</mi> </msub> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>*</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>B</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>-</mo> <mi>log</mi> <mn>2</mn> <mi>&pi;</mi> <mi>e</mi> <mo>)</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>

③-6、找到当前关键点特征Xi在视觉词典中所属的视觉单词wi,估算公式如下:

<mrow> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>=</mo> <munder> <mi>argmax</mi> <mi>k</mi> </munder> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> </mrow>

在该编码中,找到使得最大的k值将其作为当前关键点特征Xi在视觉词典中的视觉单词wi,将其作为当前关键点特征Xi所属的视觉单词;

③-7、对于每幅水质图像,首先使用图像金字塔得到所有的关键点,然后得到每个关键点的35维特征向量,重复步骤③-5、③-6得到所有关键点属于词典中的哪个视觉单词,形成水质图像的视觉词包。

5.如权利要求1所述的一种水质图像分类方法,其特征在于所述步骤④、⑤的具体过程为:

④-1、输入每一副图像的视觉词包,将其记为r,以及对应的水质图像类别标签,将其记为C;

④-2、在监督型主题模型中,使用变分方法学习得到训练后的监督型主题模型;

⑤-1、将摄像头采集的水质图像进行特征提取,得到图像的每个关键点特征Xi的特征向量;

⑤-2、对于每个关键点特征Xi,估算Xi属于每个类别的概率:

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> <mo>=</mo> <mi>exp</mi> <mo>(</mo> <mi>&psi;</mi> <mrow> <mo>(</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>&psi;</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>k</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>E</mi> <mi>q</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mi>&theta;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>*</mo> </msubsup> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> <mo>+</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <munder> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>&lt;</mo> <mi>k</mi> </mrow> </munder> <mo>(</mo> <mrow> <mi>&psi;</mi> <mrow> <mo>(</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>&psi;</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>1</mn> </mrow> </msub> <mo>+</mo> <msub> <mi>&gamma;</mi> <mrow> <mi>j</mi> <mo>,</mo> <mn>2</mn> </mrow> </msub> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>)</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>

其中的取值如下:

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>E</mi> <mi>q</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>log</mi> <mi> </mi> <mi>f</mi> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mi>&theta;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> <mo>*</mo> </msubsup> </mrow> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <mo>(</mo> <mo>-</mo> <mfrac> <mi>D</mi> <mn>2</mn> </mfrac> <mi>log</mi> <mn>2</mn> <mi>&pi;</mi> <mo>+</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>(</mo> <msub> <mi>&Sigma;</mi> <mi>d</mi> </msub> <mi>&psi;</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>+</mo> <mn>1</mn> <mo>-</mo> <mi>d</mi> </mrow> <mn>2</mn> </mfrac> <mo>)</mo> </mrow> <mo>+</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>D</mi> <mi>log</mi> <mn>2</mn> <mo>+</mo> <mi>log</mi> <mo>|</mo> <msub> <mi>B</mi> <mi>k</mi> </msub> <mo>|</mo> <mo>)</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>(</mo> <mrow> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&nu;</mi> <mi>k</mi> </msub> </mrow> <mo>)</mo> </mrow> <msub> <mi>a</mi> <mi>k</mi> </msub> <msub> <mi>B</mi> <mi>k</mi> </msub> <mrow> <mo>(</mo> <mrow> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>&nu;</mi> <mi>k</mi> </msub> </mrow> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mi>a</mi> <mi>k</mi> </msub> <mo>*</mo> <mi>t</mi> <mi>r</mi> <mrow> <mo>(</mo> <msub> <mi>B</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> </mrow> <mo>)</mo> <mo>-</mo> <mi>log</mi> <mn>2</mn> <mi>&pi;</mi> <mi>e</mi> <mo>)</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>

然后计算当前关键点特征Xi在视觉词典中所属的视觉单词wi,估算公式如下:

<mrow> <msub> <mi>w</mi> <mi>i</mi> </msub> <mo>=</mo> <munder> <mi>argmax</mi> <mi>k</mi> </munder> <msub> <mi>&phi;</mi> <msub> <mi>z</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>k</mi> </mrow> </msub> </msub> </mrow>

对当前水质图像的所有关键点特征Xi,计算其所属视觉单词wi,然后形成图像词包;

⑤-3、将该幅水质图像的图像词包代入训练后的监督型主题模型中,得到类别标签。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1