一种基于暗通道先验直方图的图像污染检测方法及系统与流程

文档序号:17008275发布日期:2019-03-02 02:07阅读:256来源:国知局
一种基于暗通道先验直方图的图像污染检测方法及系统与流程

本发明涉及农业气象观测领域,主要涉及一种基于暗通道先验直方图的图像污染检测方法和一种基于暗通道先验直方图的图像污染检测系统。



背景技术:

为了适应现代农业气象观测的需求,由于各种条件的限制,如在任何测量都不可避免的含有误差,包含粗大误差、系统性误差、随机误差和反演导入误差等。为获取高质量的农业气象自动观测资料和充分合理地使用这些观测资料,必须对观测资料进行质量检查和处理,这样才能揭示真实农田环境和农作物生长特征与规律,同时为多源信息的农作物群体长势定量监测研究提供准确可信的基础数据。

农业气象自动观测资料不同于普通的常规自动站观测数据,其观测数据源丰富,包括传统气象要素值、可视图像、模型估算值三大类十余种要素信息,且观测环境复杂、数据采集和传输自动化程度高,资料实时性强,这些特点增加了使用上述资料的难度。



技术实现要素:

本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。

为此,本发明的一个目的在于提供一种基于暗通道先验直方图的图像污染检测方法,其能够检测并剔除雾霾、降雨、灰尘等引起的污染图像,以提高作物图像视觉特征识别和图像处理结果的准确性和可用性。

本发明的另一个目的在于提供一种基于暗通道先验直方图的图像污染检测系统,其能够检测并剔除雾霾、降雨、灰尘等引起的污染图像,以提高作物图像视觉特征识别和图像处理结果的准确性和可用性。

为实现上述目的,本发明第一方面的技术方案提供了一种基于暗通道先验直方图的图像污染检测方法,包括:获取待检测图像中最低像素值形成第一暗通道图像;根据第一暗通道图像的灰度值生成第一灰度直方图;根据已污染图像和未污染图像生成分类模型;根据分类模型对第一灰度直方图进行分类,并生成分类结果;根据分类结果判断待检测图像是否被污染。

在该技术方案中,通过对传统气象要素、土壤要素和作物图像及模型估算值等多种传感器多种类型数据以及利用它们之间潜在规律与关联自动进行图像的分析处理,初步建立农作物实景观测中图像质量控制方法,确保以高质量农业气象信息数据进行实时现代农业生产和决策服务和未来卫星遥感准确性校验,研究具有良好的基础应用价值。

在上述技术方案中,优选地,根据已污染图像和未污染图像生成分类模型,包括:选取已污染图像和未污染图像作为训练样本集;获取训练样本集种最低像素值形成第二暗通道图像;根据第二暗通道图像的灰度值生成第二灰度直方图;根据预设的训练集和第二灰度直方图生成分类模型。

在上述任一技术方案中,优选地,分类模型为分割超平面和/或核函数。

在上述任一技术方案中,优选地,第一暗通道图像和第二暗通道图像的公式为:

其中,jc表示图像的r,g,b颜色通道,ω(x,y)表示以像素(x,y)为中心的图像块,(x,y)表示图像像素的坐标值;

第一灰度直方图和第二灰度直方图的公式为:

其中,h(xi)为第xi阶灰度出现的概率,s(xi)为灰度值为xi的所有像素数量,为图像总的像素数。

在上述任一技术方案中,优选地,训练集的公式为:

其中,yi表示给定特征xi的类别标签,rp为p维特征矢量;

分割超平面的公式为:

其中,ω为超平面的权重系数,b是超平面的偏置参数;

核函数的公式为:

其中,exp为以自然常数e为底的指数函数,δ为函数的尺度参数,决定了高斯函数的分布幅度。

本发明第二方面的技术方案提供了一种基于暗通道先验直方图的图像污染检测系统,包括:获取模块,用于获取待检测图像中最低像素值形成第一暗通道图像;直方图生成模块,用于根据第一暗通道图像的灰度值生成第一灰度直方图;分类模型构建模块,用于根据已污染图像和未污染图像生成分类模型;分类模块;用于根据分类模型对第一灰度直方图进行分类,并生成分类结果;判断模块,用于根据分类结果判断待检测图像是否被污染。

在该技术方案中,通过对传统气象要素、土壤要素和作物图像及模型估算值等多种传感器多种类型数据以及利用它们之间潜在规律与关联自动进行图像的分析处理,初步建立农作物实景观测中图像质量控制系统,确保以高质量农业气象信息数据进行实时现代农业生产和决策服务和未来卫星遥感准确性校验,研究具有良好的基础应用价值。

在上述技术方案中,优选地,分类模型构建模块包括:样本选取单元,用于选取已污染图像和未污染图像作为训练样本集;获取单元,用于获取训练样本集种最低像素值形成第二暗通道图像;直方图生成单元,用于根据第二暗通道图像的灰度值生成第二灰度直方图;分类模型构建单元,用于根据预设的训练集和第二灰度直方图生成分类模型。

在上述任一技术方案中,优选地,分类模型为分割超平面和/或核函数。

在上述任一技术方案中,优选地,第一暗通道图像和第二暗通道图像的公式为:

其中,jc表示图像的r,g,b颜色通道,ω(x,y)表示以像素(x,y)为中心的图像块,(x,y)表示图像像素的坐标值;

第一灰度直方图和第二灰度直方图的公式为:

其中,h(xi)为第xi阶灰度出现的概率,s(xi)为灰度值为xi的所有像素数量,为图像总的像素数。

在上述任一技术方案中,优选地,训练集的公式为:

其中,yi表示给定特征xi的类别标签,rp为p维特征矢量;

分割超平面的公式为:

其中,ω为超平面的权重系数,b是超平面的偏置参数;

核函数的公式为:

其中,exp为以自然常数e为底的指数函数,δ为函数的尺度参数,决定了高斯函数的分布幅度。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1示出了本发明一个实施例所涉及图像污染检测方法的流程框图;

图2示出了本发明另一个实施例所涉及图像污染检测方法的流程框图;

图3示出了本发明一个实施例所涉及图像污染检测系统的结构框图;

图4示出了本发明一个实施例所涉及分类模型构建模块的结构框图;

图5示出了夏玉米冠层的污染图像与未污染图像的对比图;

图6示出了暗通道图像的示例图;

图7示出了正样本图像的示例图;

图8示出了负样本图像的示例图;

图9示出了检测结果的分析示例图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。

下面参照图1至图9描述本发明一些实施例所涉及的基于暗通道先验直方图的图像污染检测方法及系统。

在实际观测中有可能出现镜头被灰尘或雾天污染等特殊情况,这些现象会直接影响到农作物的分割以及覆盖度和叶面积指数的准确计算。图5为图像污染时和图像清晰时的夏玉米冠层图像以及作物分割实例。从图中可以看出,镜头被污染时,图像偏色严重,作物分割时许多像素呈绿色,误将土壤背景分割为作物,当清晰拍摄时,相机白平衡正常,不存在偏色情况,因此分割结果理想。相机镜头模糊影响了相机白平衡自动调节,使得相机拍摄的照片整体偏色严重。因此,当利用作物分割算法进行作物提取时与非模糊情况相比会产生较大差异。

该方法和系统源于对大量自然图像进行观测时所产生的一种先验知识/规律,即在大多数非天空图像块中,一些像素点在至少一个颜色通道中具有很低的强度值。换句话说,这样的图像块的最低强度具有非常低的值。基于这样的观测规律,我们可以从一个新的视角来研究此类现象:暗通道图像。暗通道图像即是获得给定图像的暗像素之后的图像,暗像素表示那些在给定图像块中拥有最低强度值的像素。

如图1所示,按照本发明一个实施例的基于暗通道先验直方图的图像污染检测方法,包括:

s100,获取待检测图像中最低像素值形成第一暗通道图像;

s200,根据第一暗通道图像的灰度值生成第一灰度直方图;

s300,根据已污染图像和未污染图像生成分类模型;

s400,根据分类模型对第一灰度直方图进行分类,并生成分类结果;

s500,根据分类结果判断待检测图像是否被污染。

在该实施例中,通过对传统气象要素、土壤要素和作物图像及模型估算值等多种传感器多种类型数据以及利用它们之间潜在规律与关联自动进行图像的分析处理,初步建立农作物实景观测中图像质量控制方法,确保以高质量农业气象信息数据进行实时现代农业生产和决策服务和未来卫星遥感准确性校验,研究具有良好的基础应用价值。

其中,待检测图像、为已污染图像和未污染图像均为农作物图像。

另外,通过该方法可以在出现异常情况时会立即自动提醒台站观测人员进行及时的维护,以避免影响后续的自动观测任务。

在本实施例中,根据已污染图像和未污染图像生成分类模型是通过支撑向量机(supportvectormachines,简称svm)实现的。(supportvectormachines,简称svm)技术来完成训练与检测。支撑向量机是将核机制[muller,2001]应用到监督学习中的机器学习方法,它主要用来解决分类问题。一般来讲,一个分类任务通常由两部分组成,即训练阶段和测试阶段(或分类阶段)。在训练阶段中所采用的数据包括特征集以及每个特征对应的类别标记。支撑向量机(svm)的目标就是生成一个分类器模型,使之能够在测试阶段对给定的测试样本特征进行准确地分类。

如图2所示,按照本发明另一个实施例的基于暗通道先验直方图的图像污染检测方法,根据已污染图像和未污染图像生成分类模型包括:

s301,选取已污染图像和未污染图像作为训练样本集;

s302,获取训练样本集种最低像素值形成第二暗通道图像;

s303,根据第二暗通道图像的灰度值生成第二灰度直方图;

s304,根据预设的训练集和第二灰度直方图生成分类模型。

在本实施例中,首先人工选取若干张未污染图像和受污染图像分别作为正样本和负样本,组成训练样本集。然后获取正负样本图像的暗通道图像,并提取其暗通道直方图特征,再将该特征送入到支撑向量机计算分类模型。

具体而言,分类模型包括但不限于以下技术方案:

实施例1

分类模型为分割超平面。

在该实施例中,给定一组可分隔空间中的点集(特征),肯定存在一个超平面π:ω·x+b=0能够将这些特征xi,i=1,…,n分割成两个不同的类别。

实施例2

分类模型为核函数。

在该实施例中,对于非线性分类问题,svm的处理方法是选择一个核函数,通过将数据映射到高维空间,来解决在原始空间中线性不可分的问题。

在上述任一实施例中,优选地,第一暗通道图像和第二暗通道图像的公式为:

其中,jc表示图像的r,g,b颜色通道,ω(x,y)表示以像素(x,y)为中心的图像块,(x,y)表示图像像素的坐标值。

如图6所示,左列为原图,中间列为原图对应的暗通道图像,从图中可以发现,被污染图像的暗通道图像较未被污染图像灰度值整体偏高一些。要刻画这一灰度分布特点,直方图特征是个不错的选择。右列展示了暗通道图像对应的灰度直方图特征,图中两种直方图具有明显的区别。

暗通道图像的灰度直方图(记为h(p))实际上是灰度级的函数,描述图像中每一灰度级的像素个数(或某一灰度级像素出现的频率):其横坐标是灰度级(0~255),纵坐标表示图像中该灰度级出现的个数(频率)。

第一灰度直方图和第二灰度直方图的公式为:

其中,h(xi)为第xi阶灰度出现的概率,s(xi)为灰度值为xi的所有像素数量,为图像总的像素数。

训练集的公式为:

其中,yi表示给定特征xi的类别标签,rp为p维特征矢量;svm将特征向量xi(灰度直方图h(p))映射到一个更高维的空间,在这个空间里建立一个最大间隔超平面,以分开两类特征。在分开数据的超平面的两边建有两个相互平行的超平面,分隔超平面使得这两个平行超平面的距离最大化。因此,svm最终是为了解决二次规划问题。

分割超平面的公式为:

满足yi(ω·xi+b)≥1i=1,…,n,

其中,ω为超平面的权重系数,b是超平面的偏置参数;

核函数的公式为:

其中,exp为以自然常数e为底的指数函数,δ为函数的尺度参数,决定了核函数(高斯函数)的分布幅度。

如图3所示,按照本发明一个实施例的基于暗通道先验直方图的图像污染检测系统1000,包括:

获取模块100,用于获取待检测图像中最低像素值形成第一暗通道图像;

直方图生成模块200,用于根据第一暗通道图像的灰度值生成第一灰度直方图;

分类模型构建模块300,用于根据已污染图像和未污染图像生成分类模型;

分类模块400;用于根据分类模型对第一灰度直方图进行分类,并生成分类结果;

判断模块500,用于根据分类结果判断待检测图像是否被污染。

在该实施例中,通过对传统气象要素、土壤要素和作物图像及模型估算值等多种传感器多种类型数据以及利用它们之间潜在规律与关联自动进行图像的分析处理,初步建立农作物实景观测中图像质量控制系统,确保以高质量农业气象信息数据进行实时现代农业生产和决策服务和未来卫星遥感准确性校验,研究具有良好的基础应用价值。

另外,通过该系统可以在出现异常情况时会立即自动提醒台站观测人员进行及时的维护,以避免影响后续的自动观测任务。

在本实施例中,根据已污染图像和未污染图像生成分类模型是通过支撑向量机(supportvectormachines,简称svm)实现的。(supportvectormachines,简称svm)技术来完成训练与检测。支撑向量机是将核机制[muller,2001]应用到监督学习中的机器学习系统,它主要用来解决分类问题。一般来讲,一个分类任务通常由两部分组成,即训练阶段和测试阶段(或分类阶段)。在训练阶段中所采用的数据包括特征集以及每个特征对应的类别标记。支撑向量机(svm)的目标就是生成一个分类器模型,使之能够在测试阶段对给定的测试样本特征进行准确地分类。

如图4所示,按照本发明另一个实施例的基于暗通道先验直方图的图像污染检测系统,分类模型构建模块300包括:

样本选取单元301,用于选取已污染图像和未污染图像作为训练样本集;

获取单元302,用于获取训练样本集种最低像素值形成第二暗通道图像;

直方图生成单元303,用于根据第二暗通道图像的灰度值生成第二灰度直方图;

分类模型构建单元304,用于根据预设的训练集和第二灰度直方图生成分类模型。

在该实施例中,通过对传统气象要素、土壤要素和作物图像及模型估算值等多种传感器多种类型数据以及利用它们之间潜在规律与关联自动进行图像的分析处理,初步建立农业气象自动观测数据的质量控制系统,确保以高质量农业气象信息数据进行实时现代农业生产和决策服务和未来卫星遥感准确性校验,研究具有良好的基础应用价值。

具体而言,分类模型包括但不限于以下技术方案:

实施例1

分类模型为分割超平面。

在该实施例中,给定一组可分隔空间中的点集(特征),肯定存在一个超平面π:ω·x+b=0能够将这些特征xi,i=1,…,n分割成两个不同的类别。

实施例2

分类模型为核函数。

在该实施例中,对于非线性分类问题,svm的处理方法是选择一个核函数,通过将数据映射到高维空间,来解决在原始空间中线性不可分的问题。

在上述任一实施例中,优选地,第一暗通道图像和第二暗通道图像的公式为:

其中,jc表示图像的r,g,b颜色通道,ω(x,y)表示以像素(x,y)为中心的图像块,(x,y)表示图像像素的坐标值。

如图6所示,左列为原图,中间列为原图对应的暗通道图像,从图中可以发现,被污染图像的暗通道图像较未被污染图像灰度值整体偏高一些。要刻画这一灰度分布特点,直方图特征是个不错的选择。右列展示了中间列的暗通道图像所对应的灰度直方图特征,图中两种直方图具有明显的区别。

暗通道图像的灰度直方图(记为h(p))实际上是灰度级的函数,描述图像中每一灰度级的像素个数(或某一灰度级像素出现的频率):其横坐标是灰度级(0~255),纵坐标表示图像中该灰度级出现的个数(频率)。

第一灰度直方图和第二灰度直方图的公式为:

其中,h(xi)为第xi阶灰度出现的概率,s(xi)为灰度值为xi的所有像素数量,为图像总的像素数。

训练集的公式为:

其中,yi表示给定特征xi的类别标签,rp为p维特征矢量;svm将特征向量xi(灰度直方图h(p))映射到一个更高维的空间,在这个空间里建立一个最大间隔超平面,以分开两类特征。在分开数据的超平面的两边建有两个相互平行的超平面,分隔超平面使得这两个平行超平面的距离最大化。因此,svm最终是为了解决二次规划问题。

分割超平面的公式为:

满足yi(ω·xi+b)≥1i=1,…,n,

其中,ω为超平面的权重系数,b是超平面的偏置参数;

核函数的公式为:

其中,exp为以自然常数e为底的指数函数,δ为函数的尺度参数,决定了核函数(高斯函数)的分布幅度。

自动观测数据质量控制方法的实例应用:

为了验证本算法的有效性,我们以河南、山东和河北三地从2010年拍摄至2012年共三年的作物序列为例进行试验。选择小麦和玉米两种作物序列作为考察对象。为了生成svm分类器,从2010年拍摄的序列图像中获取正负训练样本,正样本为受污染的图像(如图7示例所示),负样本为正常图像(如图8示例所示),训练样本数量分别为100和250。为了减少计算时间,我们将原始采集的图像从3648×2736降采样到600×450。此外,计算暗通道图像时图像块长宽设为15个像素;对2011年至2012年的序列图像进行随机采样作为最后的测试样本。

关于svm分类器的参数,由于我们采用线性核进行训练和测试,因此只有惩罚因子c和最优分类超平面的参数需要学习。通过利用changetal.[2011]提供的libsvm库,以上的参数都可以自动求解。

实验中我们利用准确率(precision)和召回率(recall)两个参数来评估算法的性能。准确率定义为真的正样本(truepositives)数量tp与标记为受污染图像总数(真的正样本(truepositives)数量tp与假的真样本(falsepositives)数量fp之和)之比,公式如下所示:

真的正样本(truepositives)表示利用自动检测方法获取到的受污染图像中,真正被污染的数量;假的真样本(falsepositives)表示利用自动检测方法获取到的受污染图像中,没有被污染的数量。

而召回率定义为真的正样本数量tp与实际正样本数量(序列中真正受污染的数量,等于真的正样本数量tp与假的负样本数量fn之和)之比,公式如下所示:

一方面,当准确率越高时,自动检测算法所检测的结果就越可信,反之,越不可信。另外一方面,当召回率越高时,表示漏掉的数量就越少,越有利于保证后续的作物监测。因此,我们统计了六个序列自动检测算法的准确率和召回率。结果如表1所示。六个序列的平均准确率为95.67%,平均召回率为87.5%。

表1为多站点、多作物图像污染检测结果

经过分析,我们发现导致检测错误的主要原因包括:(1)户外强光照射下,图像出现亮斑使得图像呈现类似污染的特征(如图9a);(2)镜头拍摄时由于其它原因没有聚焦在作物上导致图片模糊,而实际并非污染所致(如图9b)。此外,导致召回率不高的情况主要发生在算法判别临界区域,例如:发生局部污染而并非全局污染(如图9c),或者是虽然受污染但是污染程度较低(如图9d)。

综上,实验结果表明本算法能够处理由于雨水、雾气或灰尘引起的图像模糊问题,特别是图像大面积污染(全局污染)问题;为了进一步提高准确率和召回率,下一步需要针对户外场景下的各种异常情况以及图像的局部污染进行自动检测算法的研究,以更加确保后续对观测作物的精细化提取与分析。

在本发明中,术语“第一”、“第二”、“第三”仅用于描述的目的,而不能理解为指示或暗示相对重要性;术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

本发明的描述中,需要理解的是,术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作,因此,不能理解为对本发明的限制。

在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1