一种水质图像分类方法与流程

文档序号：12365662阅读：459来源：国知局

本发明涉及一种图像分类技术，尤其是涉及一种水质图像分类方法。
背景技术：
：近年来随着人们对水环境越来越重视，水资源保护越来越受到关注。对于水资源监测，目前常用的方法有生物式水质监测方法和利用各种传感器进行水质监测的方法。生物式水质监测方法，例如德国的BBE公司研发的基于动态图像理解的生物式水质监测系统，其通过水蚤、鱼类的行为习惯和分布状态受水质的影响实现对水质的评价，但是这种方法受实验环境约束，在复杂的自然水环境下，易产生误判，同时不能对污染源做出判定。利用各种传感器进行水质监测的方法，例如利用温度、溶氧度、PH值等传感器，这种方法可以得到的水体质量的精确数据，但是成本相对较高且测量参数有限，直观性不足。运用图像分析技术进行水质评估，具有成本低廉、通用性强、数据采集便捷等优点，通过调查和采集，水质图像区域分布具有不规则性，出现的水质异常部分作为感兴趣区域，这些感兴趣区域作为分类的主要依据。对感兴趣区域划分，大致可分为：正常，水华污染，水葫芦污染，工厂排污污染，生活垃圾污染5种水质。正常的水质应该通透，无异常颜色，且具有斑驳感。水华污染的水质，颜色呈绿色，通透性弱，有粒状绿色区域。水葫芦污染的水质，水面上具有水葫芦区域。工厂排污的水质，主要是颜色出现异常，甚至会产生许多白色气泡。生活垃圾污染的水质，水面漂着大量无规则物体，水体浑浊。可见五类水质图像具有明显不同的特点。水质图像分类的难点有两方面：一是光照变化会使得水面发生很大变化，例如水体的颜色在不同光照下有明显不同；另一方面，污染区域的纹理在复杂的水情下也会产生变化，例如水华和水葫芦的纹理容易产生混淆。技术实现要素：本发明所要解决的技术问题是提供一种准确有效的水质图像分类方法。本发明解决上述技术问题所采用的技术方案为：一种水质图像分类方法，使用多特征融合的词包对水质图像进行分类，具体包括以下步骤：①水质图像采集，标记水质图像类别标签，以指示训练图像属于正常，水华污染，水葫芦污染，工厂排污污染和生活垃圾污染五种图像中的哪个类别；②对水质图像使用图像金字塔进行关键点检测，并对水质图像中的关键点进行方向梯度直方图与颜色特征的提取，融合成描述当前关键点的特征向量；③使用狄利克雷混合模型进行视觉词典学习，对图像生成的各关键点特征向量进行编码生成图像词包；④使用图像词包和类别标签训练监督型主题模型，得到监督型主题模型参数，并将训练得到的监督型主题模型用于后续的分类任务中；⑤将需要分类的水质图像作为输入图像，根据步骤②的方法对该输入图像进行特征提取操作，并量化成词包，然后使用步骤④得到的训练后的监督型主题模型进行分类，得到输入图像所属的类别。所述步骤①的具体过程为：①-1、采用高清摄像机或照相机对水面图像进行采集，将采集的水质图像分成5类，分别为正常，水华污染，水葫芦污染，工厂排污污染和生活垃圾污染；①-2、对采集的水质图像进行初步处理，去掉包含人和船只的图像。对于出现两类及以上污染的水质图像，将其所属污染区域分割开，作为多幅训练图像；①-3、使用图像缩放方法，对图像大小进行调整，将其调整为400*400大小的图像；①-4、对5类水质图像给定训练标签：正常标签为1，水华污染标签为2，水葫芦污染标签为3，工厂排污污染标签为4，生活垃圾污染标签为5。所述步骤②的具体过程为：②-1、使用图像金字塔标定水质图像的关键点；②-2、计算以当前关键点为中心的24*24邻域窗口内的所有像素点的R、G、B三个颜色通道颜色均值；②-3、将256颜色通道转换为64颜色通道，将第c个颜色通道的颜色均值映射到64色颜色空间后的值记为blockc，其中，1≤c≤3，c＝1时第c个颜色通道为R颜色通道，c＝2时第c个颜色通道为G颜色通道，c＝3时第c个颜色通道为B颜色通道，block表示第c个颜色通道的颜色均值，colork表示64色颜色空间中的第k种颜色，1≤k≤64，符号“||||”为求欧氏距离符号，表示取使得||block-colork||的值最小的一种颜色，将最小的颜色取为当前通道的颜色值，三个通道共形成三个颜色特征；②-4、采用Gamma校正法对输入图像进行颜色空间的归一化；②-5、将当前关键点所在的24*24的像素区域分化成16个cell，(6*6像素/cell)，计算单个cell中每个像素的梯度方向和梯度大小这里x和y表示该像素点的坐标，f(x,y)表示像素在x和y的灰度值，统计每个cell的梯度直方图，形成每个cell的描述；将相邻4*4的cell组成一个block，并将一个block内所有的cell的特征串联起来，得到该关键点的方向梯度直方图特征描述。所述步骤③的具体过程为：设模型的后验概率为K为取值1000，将其作为每个关键点可能属于的类别数，是参数为γk,1,γk,2的贝塔分布，Vk是该分布的随机变量，为一实值随机数；是参数为的高斯威沙特分布，其中为一个35维的列向量，ak为实值，Bk为35*35的矩阵，I为35*35的单位矩阵，是该分布的随机变量，分别取两个随机向量，一个是35维的列向量，一个是35*35的矩阵；是参数为的多项式分布，表示第n个样本属于1000个类别中第1个类别的概率，zn是该分布的随机变量，为一实值整数随机数；③-1、将类别数K作为初始化类别数，给定一个初始化模型参数λ，λ取高斯威沙特分布的四个参数，分别为均值参数0，方差矩阵，取35*35的方差矩阵I，自由度参数D，取值为35，尺度矩阵，取35*35的单位矩阵I，随机初始化参数表示每个样本属于K个样本的概率，总概率相加为1；③-2、对于训练样本中的每个关键点，记其特征为Xi，计算后验概率中的贝塔分布参数以及共轭分布参数γk,1=1+Σiφzi,k]]>γk,2=α+ΣiΣj>kφzi,j]]>ak=2+D+Σiφzi,k]]>vuk=(I+BkΣiφzi,k)-1(akBkΣiφzi,kXi)]]>Bk=((Σiφzi,k+1)I+Σiφzi,k(Xi-vuk)(Xi-vuk)T)-1]]>其中D为关键点特征维数，取值为35，表示第i个样本属于k类别的后验概率，γk,1,γk,2是后验概率q(V,θ*,Z)中贝塔分布的两个参数，I表示q(V,θ*,Z)中高斯威沙特分布的四个参数，其中I为单位矩阵，k从1取到1000，α为模型参数，取值为0.001；③-3、对于每个样本，根据以下公式求该样本对应每个类别的概率：φzi,k=exp(ψ(γk,1)-ψ(γk,1+γk,2)+Eq(logf(Xi|θzi,k*))+Σj<k(ψ(γj,2)-ψ(γj,1+γj,2)))]]>其中的取值如下：Eq(logf(Xi|θzi,k*))=(-D2log2π+12(Σdψ(ak+1-d2)+Dlog2+log|Bk|)-12((Xi-vuk)akBk(Xi-vuk)+ak*tr(Bk))-log2πe)]]>D为关键点特征维数，取值为35，e为自然底数，π为圆周率常数，ψ()为伽马函数的二阶导数。是参数为的高斯分布，包含两个参数，分别是均值向量和方差矩阵；③-4、观察的变化情况，若该值不变，则停止更新，否则转③-2重新计算，当停止更新时，记住此时的变分后验概率参数γk,1,γk,2，对于对应的所有N个样本，用狄利克雷混合模型估算得出N个样本所属类别，并将不同的类别数记为H，然后将H个不同的类别记为视觉词典；③-5、对于每个关键点特征Xi，使用训练得到的估算特征Xi属于每个类别的后验概率：φzi,k=exp(ψ(γk,1)-ψ(γk,1+γk,2)+Eq(logf(Xi|θzi,k*))+Σj<k(ψ(γj,2)-ψ(γj,1+γj,2)))]]>Eq(logf(Xi|θzi,k*))=(-D2log2π+12(Σdψ(ak+1-d2)+Dlog2+log|Bk|)-12((Xi-vk)akBk(Xi-vk)+ak*tr(Bk))-log2πe)]]>③-6、找到当前关键点特征Xi在视觉词典中所属的视觉单词wi，估算公式如下：wi=argmaxkφzi,k]]>在该编码中，找到使得最大的k值将其作为当前关键点特征Xi在视觉词典中的视觉单词wi，将其作为当前关键点特征Xi所属的视觉单词；③-7、对于每幅水质图像，首先使用图像金字塔得到所有的关键点，然后得到每个关键点的35维特征向量，重复步骤③-5、③-6得到所有关键点属于词典中的哪个视觉单词，形成水质图像的视觉词包。所述步骤④、⑤的具体过程为：④-1、输入每一副图像的视觉词包，将其记为r，以及对应的水质图像类别标签，将其记为C；④-2、在监督型主题模型中，使用变分方法学习得到训练后的监督型主题模型；⑤-1、将摄像头采集的水质图像进行特征提取，得到图像的每个关键点特征Xi的特征向量；⑤-2、对于每个关键点特征Xi，估算Xi属于每个类别的概率：φzi,k=exp(ψ(γk,1)-ψ(γk,1+γk,2)+Eq(logf(Xi|θzi,k*))+Σj<k(ψ(γj,2)-ψ(γj,1+γj,2)))]]>其中的取值如下：Eq(logf(Xi|θzi,k*))=(-D2log2π+12(Σdψ(ak+1-d2)+Dlog2+log|Bk|)-12((Xi-vk)akBk(Xi-vk)+ak*tr(Bk))-log2πe)]]>然后计算当前关键点特征Xi在视觉词典中所属的视觉单词wi，估算公式如下：wi=argmaxkφzi,k]]>对当前水质图像的所有关键点特征Xi，计算其所属视觉单词wi，然后形成图像词包；⑤-3、将该幅水质图像的图像词包代入训练后的监督型主题模型中，得到类别标签。与现有技术相比，本发明的优点在于：1)本发明方法首先采用高斯金字塔检测图像中的极值点，这样有利于消除图像特征中的冗余像素，提高识别精度；2)在建立视觉词典时，本发明方法使用狄利克雷混合模型进行水质图像视觉词典生成，相比于传统视觉词典学习中的传统的确定大小的模型相比，该算法能自动估算视觉词典数目，有利于消除视觉词典中视觉单词间的相关和冗余性；3)在进行识别时，利用视觉词典首先得到图像视觉词包模型，然后再训练监督型主题模型，引入该模型使得水质图像识别框架在统计角度描述了水质图像中的随机因素，同时在语义层次描述水质图像的各类特征，从而提高水质图像识别率。附图说明图1为本发明方法水质图像分类过程示意图；图2为本发明方法中不同尺度的高斯金字塔描述示意图；图3为本发明监督型主题模型图示意图；图4为狄利克雷混合模型概率图示意图；图5为不同污染水质的示意图片。具体实施方式以下结合附图实施例对本发明作进一步详细描述。一种水质图像分类方法，使用多特征融合的词包对水质图像进行分类，具体包括以下步骤：①-1、采用高清摄像机或照相机，对正常水面、水华污染水面、水葫芦污染水面、工厂排污污染水面和生活垃圾污染水面分别进行M次图像采集，得到每种水面的M幅水质图像，将采集的水质图像分成5类，分别为正常，水华污染，水葫芦污染，工厂排污污染和生活垃圾污染；在图像采集时，正常水面、水华污染水面、水葫芦污染水面、工厂排污污染水面和生活垃圾污染水面是通过人眼判定的，对每种水质图像采集最好在多个不同的地方采集，在此要求采集图片数目M≥100，这样可有效提高该水质图像分类方法的鲁棒性，在此基础上，M越大越好。①-2、对采集的水质图像进行初步处理，去掉包含人和船只的图像。对于出现两类及以上污染的水质图像，将其所属污染区域分割开，作为多幅训练图像；①-3、使用现有的图像缩放方法，对得到的所有水质图像大小进行调整，将其调整为像素为400*400大小的图像，使所有水质图像的大小一致；①-4、对5类水质图像给定训练标签：正常标签为1，水华污染标签为2，水葫芦污染标签为3，工厂排污污染标签为4，生活垃圾污染标签为5；②-1、使用图像金字塔标定水质图像的关键点，得到每幅水质图像中的每个关键点的位置信息，图2给出了采用高斯金字塔提取关键点的位置信息示意图；②-2、计算以当前关键点为中心的24*24邻域窗口内的所有像素点的R、G、B三个颜色通道颜色均值；②-3、将256颜色通道转换为64颜色通道，将第c个颜色通道的颜色均值映射到64色颜色空间后的值记为blockc，其中，1≤c≤3，c＝1时第c个颜色通道为R颜色通道，c＝2时第c个颜色通道为G颜色通道，c＝3时第c个颜色通道为B颜色通道，block表示第c个颜色通道的颜色均值，colork表示64色颜色空间中的第k种颜色，1≤k≤64，符号“||||”为求欧氏距离符号，表示取使得||block-colork||的值最小的一种颜色，将最小的颜色取为当前通道的颜色值，三个通道共形成三个颜色特征；②-4、采用Gamma校正法对输入图像进行颜色空间的归一化；②-5、将当前关键点所在的24*24的像素区域分化成16个cell，(6*6像素/cell)，计算单个cell中每个像素的梯度方向和梯度大小这里x和y表示该像素点的坐标，f(x,y)表示像素在x和y的灰度值，统计每个cell的梯度直方图，形成每个cell的描述；将相邻4*4的cell组成一个block，并将一个block内所有的cell的特征串联起来，得到该关键点的方向梯度直方图特征描述；设模型的后验概率为K为取值1000，将其作为每个关键点可能属于的类别数，是参数为γk,1,γk,2的贝塔分布，Vk是该分布的随机变量，为一实值随机数；是参数为的高斯威沙特分布，其中为一个35维的列向量，ak为实值，Bk为35*35的矩阵，I为35*35的单位矩阵,是该分布的随机变量，分别取两个随机向量，一个是35维的列向量，一个是35*35的矩阵；是参数为的多项式分布，表示第n个样本属于1000个类别中第1个类别的概率，zn是该分布的随机变量，为一实值整数随机数；③-1、将类别数K作为初始化类别数，给定一个初始化模型参数λ，λ取高斯威沙特分布的四个参数，分别为均值参数0，35*35的方差单位矩阵I，自由度参数D，取值为35，尺度矩阵，取为35*35的单位矩阵I，随机初始化参数表示每个样本属于K个样本的概率，总概率相加为1；③-2、对于训练样本中的每个关键点，记其特征为关键点特征Xi，计算后验概率中的贝塔分布参数以及共轭分布参数γk,1=1+Σiφzi,k]]>γk,2=α+ΣiΣj>kφzi,j]]>ak=2+D+Σiφzi,k]]>vuk=(I+BkΣiφzi,k)-1(akBkΣiφzi,kXi)]]>Bk=((Σiφzi,k+1)I+Σiφzi,k(Xi-vuk)(Xi-vuk)T)-1]]>其中D为关键点特征维数，取值为35，表示第i个样本属于k类别的后验概率，γk,1,γk,2是后验概率q(V,θ*,Z)中贝塔分布的两个参数，I表示q(V,θ*,Z)中高斯威沙特分布的四个参数，其中I为单位矩阵，k从1取到1000，α为模型参数，取值为0.001；③-3、对于每个关键点Xi，根据以下公式求该样本对应每个类别的概率：φzi,k=exp(ψ(γk,1)-ψ(γk,1+γk,2)+Eq(logf(Xi|θzi,k*))+Σj<k(ψ(γj,2)-ψ(γj,1+γj,2)))]]>其中的取值如下：Eq(logf(Xi|θzi,k*))=(-D2log2π+12(Σdψ(ak+1-d2)+Dlog2+log|Bk|)-12((Xi-vuk)akBk(Xi-vuk)+ak*tr(Bk))-log2πe)]]>D为关键点特征维数，e为自然常数，ψ()为伽马函数的二阶导数。是参数为的高斯分布，包含两个参数，分别是均值向量和方差矩阵；③-4、观察的变化情况，若该值不变，则停止更新，否则转③-2重新计算，当停止更新时，记住此时的变分后验概率参数γk,1,γk,2，对于对应的所有N个样本，用狄利克雷混合模型估算得出N个样本所属类别，并将不同的类别数为记为H，然后将H个不同的类别记为视觉词典；③-5、对于每个关键点特征Xi，使用训练得到的估算Xi属于每个类别的后验概率：φzi,k=exp(ψ(γk,1)-ψ(γk,1+γk,2)+Eq(logf(Xi|θzi,k*))+Σj<k(ψ(γj,2)-ψ(γj,1+γj,2)))]]>Eq(logf(Xi|θzi,k*))=(-D2log2π+12(Σdψ(ak+1-d2)+Dlog2+log|Bk|)-12((Xi-vk)akBk(Xi-vk)+a*tr(Bk))-log2πe)]]>③-6、找到当前关键点特征Xi在视觉词典中所属的视觉单词wi，估算公式如下：wi=argmaxkφzi,k]]>在该编码中，找到使得最大的k值将其作为当前关键点特征Xi在视觉词典中的视觉单词wi，将其作为当前关键点特征Xi所属的视觉单词；③-7、对于每幅水质图像，首先使用图像金字塔得到所有的关键点，然后得到每个关键点的35维特征向量，重复步骤③-5、③-6得到所有关键点属于词典中的哪个视觉单词，形成水质图像的视觉词包；④-1、输入每一副图像的视觉词包，将其记为r，以及对应的水质图像类别标签，将其记为C；④-2、在监督型主题模型中，使用变分方法学习得到监督型主题模型；⑤-1、将摄像头采集的水质图像进行特征提取，得到图像的每个关键点特征Xi的特征向量；⑤-2、对于每个关键点特征Xi，估算Xi属于每个类别的概率：φzi,k=exp(ψ(γk,1)-ψ(γk,1+γk,2)+Eq(logf(Xi|θzi,k*))+Σj<k(ψ(γj,2)-ψ(γj,1+γj,2)))]]>其中的取值如下：Eq(logf(Xi|θzi,k*))=(-D2log2π+12(Σdψ(ak+1-d2)+Dlog2+log|Bk|)-12((Xi-vk)akBk(Xi-vk)+a*tr(Bk))-log2πe)]]>然后计算当前关键点特征Xi在视觉词典中所属的视觉单词wi，估算公式如下：wi=argmaxkφzi,k]]>对当前水质图像的所有关键点特征Xi，计算其所属视觉单词wi，然后形成图像词包；⑤-3、将该幅水质图像的图像词包代入训练后的监督型主题模型中，得到类别标签。上述实施例中，监督型主题模型及如何通过变分方法学习得到训练后的监督型主题模型，采用现有技术《WangC,BleiD,LiFF.Simultaneousimageclassificationandannotation[C]//IEEEConferenceonComputerVision&PatternRecognition.2009:1903-1910.)》中的方法。当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵杰煜;叶绪伦;蒋玉;钟意伟;
技术所有人：宁波大学;
我是此专利的发明人

上一篇：一种全自动拆螺丝的设备的制作方法与工艺
上一篇：一种直线特征匹配方法及系统与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。