本发明属于环境监测领域,具体涉及一种空气质量检测方法、检测系统,尤其是基于级联回归切比雪夫多项式拟合的空气质量检测方法、检测系统。
背景技术:
面对社会对空气质量日益加重的担忧,如何能够准确检测到空气中对人体有害的成分成为了值得研究人员进行探讨的课题。对于环境监测这种实际的数学问题,多元非线性方法在众多的核心技术中是比较理想的一种。
目前在不同的多元非线性方法中,有较好的优点及理论基础的第二类切比雪夫多项式回归法是一种较为新兴的非线性回归法。
然而这种方法与其他的多项式回归法有着相同的缺陷,即待拟合系数的个数会随着变量数增长而呈指数式增长。
与此对应的,目前主流的一类回归方法是以偏最小二乘回归法为典型例子,它尝试用多个多元线性回归器来代替一个多元非线性回归器,这种多个回归器组合的形式又被称为级联。
但此种方法的问题在于当此类方法应用于非线性回归问题时,普遍会出现误差较大的问题。原因可被归结为这类方法的核心方法还是采用了线性回归,即使采用了级联的形式,如果系统过于复杂我们同样无法通过这类回归方法获得令人满意的结果。
技术实现要素:
(一)要解决的技术问题
为了解决现有技术的上述问题,本发明提供一种空气质量检测方法,其基于级联回归切比雪夫多项式拟合的数据处理方法,能够同时保证对多元非线性回归问题的快速、准确地完成从输入特征到预测值的映射,能够更加快速、准确地检测空气质量。
本发明还提供一种空气质量检测系统,其基于级联回归切比雪夫多项式拟合的数据处理装置,能够同时保证对多元非线性回归问题的快速、准确地完成从输入特征到预测值的映射,能够更加快速、准确地检测空气质量。
(二)技术方案
为了达到上述目的,本发明采用的主要技术方案包括:
一种空气质量检测方法,其包括如下步骤:
S1、获得检测数据;
S2、通过级联回归切比雪夫多项式拟合对步骤S1获得的检测数据进行处理,包括:
S21、通过迭代法训练,获取整个级联回归器中各子回归器的回归系数及相关参数(例如:总的迭代次数、每次递归过程中生成的映射矩阵、归一化时生成的边界参数),
S22、结合步骤S21得到的回归系数及相关参数,对步骤S1获得的检测数据进行处理,得到用于预测空气质量的结果;
S3、得到空气质量的预测结果。
本发明一个实施例的空气质量检测方法,其中,步骤S1获得的检测数据包括空气中至少一种化学基的比例信息。
本发明一个实施例的空气质量检测方法,其中,步骤S1获得的检测数据包括CO的浓度值/小时、NMHC的浓度值/小时、NOx的浓度值/小时、NO2的浓度值/小时、O3的浓度值/小时、每小时平均温度、每小时相对湿度和每小时绝对湿度。
本发明一个实施例的空气质量检测方法,其中,步骤S21中,每次迭代过程包括:
S2141、计算本次迭代过程中的输入样本与对应标签的二阶相关矩阵,并获取该二阶相关矩阵的主成分映射矩阵;
S2142、利用该主成分映射矩阵将输入样本矩阵投影至主成分空间;
S2143、对投影后的特征样本分别进行针对输入样本与对应标签的多阶一元第二类切比雪夫多项式回归,获得回归系数;
S2144、获取输入样本与对应标签的残差矩阵作为下一轮迭代的输入。
进一步的,步骤S21中还包括:S2145、重复S2141~S2144,直至满足迭代条件。
本发明一个实施例的空气质量检测方法,其中,步骤S2141中,主成分映射矩阵是指二阶相关矩阵的主特征值所对应的特征向量组成的矩阵。
本发明一个实施例的空气质量检测方法,其中,步骤S21包括:
S211、获取各时段空气中不同化学基的比例信息,并送到信息处理终端;
S212、获取同时段同一所测区域内空气质量数据作为训练标签数据;
S213、对输入的数据进行归一化处理;
S214、通过训练获取整个级联回归器中各子回归器的回归系数及相关参数,其包括:
S2141、计算本次迭代过程中的输入样本与对应标签的二阶相关矩阵,并获取该二阶相关矩阵的主成分映射矩阵;
S2142、利用该主成分映射矩阵将输入样本矩阵投影至主成分空间;
S2143、对投影后的特征样本分别进行针对输入样本与对应标签的多阶一元第二类切比雪夫多项式回归,获得回归系数;
S2144、获取输入样本与对应标签的残差矩阵作为下一轮迭代的输入;
S2145、重复S2141~S2144,直至满足迭代条件;
S215、输出总的迭代次数、每次递归过程中生成的映射矩阵、归一化时生成的边界参数。
本发明一个实施例的空气质量检测方法,其中,步骤S22包括:
S221、获取各时段空气中不同化学基的比例信息,并送到信息处理终端;
S222、对输入的数据进行归一化处理,初始化预测值为零;
S223、计算各样本对应时段的空气质量水平,其包括:
S2231、利用训练过程中获取的主成分映射矩阵将每次迭代的输入样本投影至主成分空间;
S2232、计算样本对应的一元第二类切比雪夫多项式各阶值;
S2233、使用训练过程中针对标签生成的对应回归器的回归系数加权求和生成本次迭代过程的回归输出,将本次迭代生成的回归输出累加到最终预测值上;
S2234、根据针对输入样本生成的对应回归器的回归系数,对投影后的样本进行加权求和,生成本次迭代过程的回归输出,并获取回归残差作为下一轮迭代的输入;
S2235、重复S2231~S2234,直至达到训练时获得的总迭代次数;
S224、对生成的最终预测值进行逆归一化处理并输出。
本发明还提供一种空气质量检测系统,其包括:
传感器,用于检测空气中相应成分的含量信息;
信息处理终端,用于接收并处理来自传感器的数据,其包括基于级联回归切比雪夫多项式拟合的数据处理模块,用于对数据进行级联回归切比雪夫多项式拟合处理;
输出模块,用于输出空气质量检测结果。
本发明一个实施例的空气质量检测系统,其中,传感器为多路集成传感器,用于获取空气中多种化学成分的含量信息。
本发明一个实施例的空气质量检测系统,其中,基于级联回归切比雪夫多项式拟合的数据处理模块包括训练子模块和预测子模块,训练子模块用于通过训练获取整个级联回归器中各子回归器的回归系数及相关系数,预测子模块用于计算各样本对应时段的空气质量水平的最终预测值。
本发明一个实施例的空气质量检测系统,其中,训练子模块包括:
训练标签数据获取单元,用于获取同时段同一所测区域内空气质量数据作为训练标签数据;
训练归一化处理单元,用于对训练标签数据获取单元所获取的数据(包括X和Y)进行归一化处理;
迭代处理单元,用于通过训练获取整个级联回归器中各子回归器的回归系数及相关参数,其包括:
主成分映射矩阵获取子单元,用于计算每次迭代过程中的输入样本与对应标签的二阶相关矩阵,并获取该二阶相关矩阵的主成分映射矩阵,
训练投影子单元,用于利用主成分映射矩阵将输入样本矩阵投影至主成分空间;
回归系数获取子单元,用于对投影后的特征样本分别进行针对输入样本与标签的多阶一元第二类切比雪夫多项式回归,获取回归系数,
训练残差矩阵获取子单元,用于获取输入样本与对应标签的残差矩阵作为下一轮迭代的输入,
训练迭代条件判定子单元,用于根据迭代循环变量是否达到总的迭代次数来判定是否满足迭代条件,借以判定迭代循环是否终止;
数据输出单元,用于输出下列数据中的任一个或几个:总的迭代次数、各子回归器的回归系数、每次递归过程中生成的映射矩阵及归一化时生成的边界参数。
本发明一个实施例的空气质量检测系统,其中,预测子模块包括:
检测数据获取单元,用于获取检测得到的空气中相应成分的含量信息数据;
预测归一化处理单元,用于对检测数据获取单元所获取的数据(包括X)归一化处理,并初始化预测值为零;
预测计算单元,用于计算各样本对应时段的空气质量水平,其包括:
预测投影子单元,利用训练过程中获取的矩阵投影将每次迭代的输入样本投影至主成分空间,
多项式阶值计算子单元,用于计算样本对应的一元第二类切比雪夫多项式各阶值,
迭代回归输出生成子单元,用于使用训练过程中生成的对应子回归器的回归系数加权求和生成本次迭代过程的回归输出,
预测回归残差获取子单元,用于对投影后的样本进行针对输入样本的多阶第二类切比雪夫多项式回归,并获取回归残差作为下一轮迭代的输入,
预测值生成子单元,用于生成预测值并将之后每次迭代生成的回归输出累加到预测值上以得到最终预测值,
预测迭代条件判定子单元,用于根据迭代循环变量是否达到训练时获得的总迭代次数来判定是否满足迭代条件,借以判定迭代循环是否终止;
预测值输出单元,用于对生成的最终预测值进行逆归一化处理并输出。
(三)有益效果
本发明的有益效果是:本发明提出的空气质量检测方法,通过使用第二类切比雪夫多项式拟合法以提升预测的精度,在此基础上,为了缓解多项式拟合法在多元回归问题上的缺陷,提出使用类偏最小二乘拟合式的级联结构来简化第二类切比雪夫多项式拟合法的复杂度,能够同时保证对多元非线性回归问题的快速、准确地完成从输入特征到预测值的映射,有利于实现环境监测中的更准确检测。
附图说明
图1为本发明所述空气质量检测系统的框图;
图2为本发明所述空气质量检测方法的流程图;
图3为本发明一个实施例的检测结果示意图。
具体实施方式
为了更好的解释本发明,以便于理解,下面结合附图,通过具体实施方式,对本发明作详细描述。
本发明主要设计思路如下:
本发明利用多路传感器获取空气中各时段不同化学基的比例作为变量。随后对数据进行预处理得到回归器的输入。整个回归器分为训练和检测两个环节。在训练环节,每个训练样本及对应的标签将通过数次迭代获取对应次数的回归系数与辅助参数;而在测试环节则直接利用训练得到的参数及回归系数实现多次叠加后的空气质量的估计。
本发明的基于级联回归切比雪夫多项式拟合的空气质量检测方法,包括训练环节和预测环节。
其中,训练环节包括:
步骤一、由各路传感器获取各时段空气中不同化学基的比例信息,并将数据送到信息处理终端。
步骤二、获取同时段同一所测区域内空气质量数据作为训练标签数据。
步骤三、对输入的数据进行归一化处理。
步骤四、通过训练获取整个级联回归器中各子回归器的回归系数及相关参数,方法如下:
在每次迭代过程中,
(1)计算本次迭代过程中的输入样本与对应标签的二阶相关矩阵,并获取该二阶相关矩阵的主成分映射矩阵(即该二阶相关矩阵的主特征值所对应的特征向量组成的矩阵,且该特征映射矩阵即为迭代过程中要获取的参数之一);
(2)利用该映射矩阵将输入样本矩阵投影至主成分空间;
(3)对投影后的特征样本分别进行针对输入样本与标签的多阶一元第二类切比雪夫多项式回归,获取回归系数;
(4)获取输入样本与对应标签的残差矩阵作为下一轮迭代的输入;
(5)重复(1)~(4),直至满足迭代条件。
步骤五、输出总的迭代次数,各子回归器的回归系数,每次迭代过程中生成的主成分映射矩阵及归一化时生成的边界参数。
预测环节包括:
步骤一、由各路传感器获取各时段空气中不同化学基的比例信息,并将数据送到信息处理终端。
步骤二、对输入的数据进行归一化处理,初始化预测值为零。
步骤三、计算各样本对应时段的空气质量水平,方法如下:
在每次迭代过程中,
(1)利用训练过程中获取的主成分映射矩阵将每次迭代的输入样本投影至主成分空间;
(2)计算样本对应的一元第二类切比雪夫多项式各阶值;
(3)使用训练过程中针对标签生成的对应子回归器的回归系数加权求和生成本次迭代过程的回归输出,将本次迭代生成的回归输出累加到预测值上;
(4)利用训练过程中针对输入样本生成的对应子回归器的回归系数加权求和生成本次迭代过程的回归输出,并获取本次迭代过程中输入样本的回归残差矩阵,作为下一轮迭代的输入;
(5)重复(1)~(4),直至达到训练时获得的总迭代次数。
步骤四、对生成的最终预测值进行逆归一化处理并输出。
为了更好地解释本发明,下面以苯浓度预测实施例对本发明作进一步说明。
本实施例是对某城市某街道长达一年的环境监测实例,目的是通过传感器获取CO的浓度值/小时、NMHC的浓度值/小时、NOx的浓度值/小时、NO2的浓度值/小时、O3的浓度值/小时、每小时平均温度T、每小时相对湿度RH、每小时绝对湿度AH,再通过这8个值来预测苯浓度值/小时。
本实施例的空气质量检测方法的整体流程如图2所示,具体包括以下步骤:
其中,各步骤中涉及的参数定义以下:
X表示输入样本,Y表示训练用标签样本;
t表示迭代变量,T表示迭代次数;
Et,Ft表示第t次迭代过程中的输入样本矩阵、标签矩阵;
pt表示第t次迭代过程中的主成分映射矩阵;
Zt表示第t次迭代过程中通过投影后得到的特征矩阵生成的第二类切比雪夫多项式矩阵;
ct,rt分别表示第t次迭代过程中利用切比雪夫多项式回归法针对输入的训练样本和对应输入训练样本的输出预测值生成的回归系数矩阵。
训练环节包括:
步骤一、由各路传感器获取各时段空气中不同化学基的比例信息X,X∈RSampleNum×W,SampleNum为训练样本数,W为特征数(本实施例中为W=8),并将数据送到信息处理终端。
步骤二、获取同时段同一所测区域内空气质量数据作为训练标签数据Y,Y∈RSampleNum。
步骤三、依据式(1)、式(2)对输入的数据进行归一化处理,
其中,min表示对象的每一维特征的取最小值,max表示对象的每一维特征的取最大值,ε=0.001。
步骤四、初始化输入样本矩阵E1=X和标签矩阵F1=Y。
步骤五、通过训练获取整个级联回归器中各子回归器的回归系数及相关参数,方法如下:
在每次迭代过程中,
(1)计算本次迭代过程中的输入样本与对应标签的二阶相关矩阵并获取该二阶相关矩阵的主成分映射矩阵pt(即该二阶相关矩阵的主特征值所对应的特征向量组成的矩阵),且该主成分映射矩阵pt即为迭代过程中要获取的参数;
(2)利用该主成分映射矩阵pt将输入样本矩阵投影至主成分空间Etpt;
(3)对投影后的特征样本分别进行针对输入样本与标签的多阶一元第二类切比雪夫多项式回归,依据式(3)、式(4)获取回归系数ct,rt,
(4)获取输入样本与对应标签的残差矩阵Et+1,Ft+1作为下一轮迭代的输入,t=t+1(即下一轮迭代变量取值为本轮迭代变量取值加1);
(5)重复(1)~(4),直至满足迭代条件t=T。
步骤六、输出总的迭代次数T,各子回归器的回归系数ct,rt,每次迭代过程中生成的主成分映射矩阵pt及归一化时生成的边界参数min(Y),max(Y)。
其中,预测环节包括:
步骤一、由各路传感器获取某时段空气中不同化学基(与训练时的化学基一一对应)的比例信息X,X∈RSampleNum×W,SampleNum为测试样本数,W为特征数(本实施例中为W=8),并将数据送到信息处理终端。
步骤二、依据式(1)对输入的数据进行归一化处理,初始化输入样本矩阵E1=X和标签矩阵;Y=0。
步骤三、计算各样本对应时段的空气质量水平,方法如下:
在每次迭代过程中,
(1)利用训练过程中获取的主成分映射矩阵pt将每次迭代的输入样本投影至主成分空间Etpt,其中,pt∈RW×m,t=1,...,T;
(2)计算样本对应的一元第二类切比雪夫多项式各阶值,形成矩阵Zt;
(3)使用训练过程中生成的对应子回归器的回归系数rt对矩阵Zt加权求和生成本次迭代过程的回归输出依据式(5)将本次迭代生成的回归输出累加到预测值上,t=t+1;
(4)利用训练过程中生成的对应子回归器的回归系数ct对矩阵Zt加权求和生成本次迭代过程的回归输出依据式(6)获取输入样本与对应标签的回归残差矩阵Et+1作为下一轮迭代的输入,
(5)重复(1)~(4),直至达到训练时获得的总迭代次数T,获得最终预测值。
步骤四、依据式(7)对生成的最终预测值进行逆归一化处理并输出,
Y=Y×[max(Y)-min(Y)]-min(Y) 式(7)。
本实施例中,测试流程按5倍交叉验证方式进行,回归结果如图2所示,其中,横轴为实际获得的苯浓度标签,纵轴为通过本方法获取的预测苯浓度,每个点对应于一个样本。通过观察样本点是否集中分布于45°线(图中所标识的斜线)可以来评估本发明的方法,如果集中于45°线,说明样本的苯浓度实测值与预测值接近,方法表现很好;反之,则相差较远,方法表现不佳。通过观察图2可以获知,本发明的方法对大气中苯浓度的预测优异。
对于空气中的其他成分(例如:硫化物SOx、甲醛、重金属等)的检测,可参照苯浓度预测实施例进行,本发明不再赘述。
如图1所示,本发明还提供一种空气质量检测系统,其包括:
传感器,用于检测空气中相应成分的含量信息;
信息处理终端,用于接收并处理来自传感器的数据,其包括基于级联回归切比雪夫多项式拟合的数据处理模块,用于对数据进行级联回归切比雪夫多项式拟合处理;
输出模块,用于输出空气质量检测结果。
其中,传感器为多路集成传感器,用于获取空气中多种化学成分的含量信息。
其中,基于级联回归切比雪夫多项式拟合的数据处理模块包括训练子模块和预测子模块,训练子模块用于通过训练获取整个级联回归器中各子回归器的回归系数及相关系数,预测子模块用于计算各样本对应时段的空气质量水平的最终预测值。
其中,训练子模块包括:
训练标签数据获取单元,用于获取同时段同一所测区域内空气质量数据作为训练标签数据;
训练归一化处理单元,用于对训练标签数据获取单元所获取的数据(包括X和Y)进行归一化处理;
迭代处理单元,用于通过训练获取整个级联回归器中各子回归器的回归系数及相关参数,其包括:
主成分映射矩阵获取子单元,用于计算每次迭代过程中的输入样本与对应标签的二阶相关矩阵,并获取该二阶相关矩阵的主成分映射矩阵,
训练投影子单元,用于利用主成分映射矩阵将输入样本矩阵投影至主成分空间;
回归系数获取子单元,用于对投影后的特征样本分别进行针对输入样本与标签的多阶一元第二类切比雪夫多项式回归,获取回归系数,
训练残差矩阵获取子单元,用于获取输入样本与对应标签的残差矩阵作为下一轮迭代的输入,
训练迭代条件判定子单元,用于根据迭代循环变量是否达到总的迭代次数来判定是否满足迭代条件,借以判定迭代循环是否终止;
数据输出单元,用于输出下列数据中的任一个或几个:总的迭代次数、各子回归器的回归系数、每次迭代过程中生成的主成分映射矩阵及归一化时生成的边界参数。
其中,预测子模块包括:
检测数据获取单元,用于获取检测得到的空气中相应成分的含量信息数据;
预测归一化处理单元,用于对检测数据获取单元所获取的数据(包括X)归一化处理,并初始化预测值为零;
预测计算单元,用于计算各样本对应时段的空气质量水平,其包括:
预测投影子单元,利用训练过程中获取的矩阵投影将每次迭代的输入样本投影至主成分空间,
多项式阶值计算子单元,用于计算样本对应的一元第二类切比雪夫多项式各阶值,
迭代回归输出生成子单元,用于使用训练过程中生成的对应子回归器的回归系数加权求和生成本次迭代过程的回归输出,
预测回归残差获取子单元,用于对投影后的样本进行针对输入样本的多阶第二类切比雪夫多项式回归,并获取回归残差作为下一轮迭代的输入,
预测值生成子单元,用于生成预测值并将之后每次迭代生成的回归输出累加到预测值上以得到最终预测值,
预测迭代条件判定子单元,用于根据迭代循环变量是否达到训练时获得的总迭代次数来判定是否满足迭代条件,借以判定迭代循环是否终止;
预测值输出单元,用于对生成的最终预测值进行逆归一化处理并输出。
本发明的空气质量检测方法中根据若干检测值预测得到空气中其他成分含量的检测方法和系统,能够同时保证对多元非线性回归问题的快速、准确地完成从输入特征到预测值的映射,能够更加快速、准确地检测空气质量。