一种基于共同训练的机动车尾气遥测与车检结果一致性方法与流程

文档序号:14750362发布日期:2018-06-22 12:33阅读:198来源:国知局
本发明属于环境检测技术处理领域,特别涉及一种基于共同训练的机动车尾气遥测与车检结果一致性方法。
背景技术
:随着国民经济的快速发展和人民经济水平的提高,机动车保有量逐年增加,我国的空气污染问题日趋严重,严重灰霾现象时有出现,特别是京津冀地区更加常见。机动车尾气排放作为城市空气污染的主要污染源之一,其负面效应主要包括:引发人类呼吸系统疾病、地表臭氧含量过高、城市热岛效应加重,以及产生光化学烟雾等。因此,我国亟需机动车尾气遥感检测设备及制定相应环保政策,以减少和控制机动车尾气排放。遥感技术是一种非接触式的光学测量手段,可直接测量行驶中机动车的尾气排放,已在欧美等国家得到了普遍应用。遥测设备的优点是自动化程度高,一天可以测试上万辆机动车,已成为机动车尾气检测/维修(I/M)项目及筛查高排放车的主要手段。在如今的信息化时代,机动车尾气的检测更倾向于智能化、网络化和模块化。其中一种常见的方法就是利用机动车尾气立式遥感检测设备进行机动车尾气遥测。该方法主要利用多波长激光技术检测出机动车尾气中CO、NO、HC的体积浓度以及不透光烟度值;利用红外线发射接收装置得到机动车速度和加速度;利用图像识别技术识别机动车牌照号码。每个机动车尾气检测单元由多个安装在横跨车道的龙门架上垂直于路面的激光发射器构成,每个激光发射器以一定距离间隔安置,每个激光发射器均垂直向地面发射激光束,由于每个车道的激光接收器会受到不同车道激光的影响,他们接收到的是混叠信号,通过对激光接收器混叠信号的分析,得到机动车尾气污染物成分与体积浓度的混叠数据,每个接收器的数据会被发送到弱信号处理单元进行弱信号提取与分离。机动车尾气立式遥测设备可以实现对设备部署点的每一条机动车道上行驶的所有机动车尾气排放进行实时监控,可以在短时间内积累大量机动车尾气排放数据,大大降低了机动车尾气排放的检测成本,在筛选高污染排放车辆,豁免清洁车辆,识别限行车辆、对行驶中的机动车进行实时在线检测方面发挥重大作用,极大地解决了机动车进行车辆年检时采取简易工况法中存在的偶然性以及机动车尾气检测抽样间隔过长的问题,使得机动车监管更加高效。机动车尾气立式遥感检测设备的问世,积极响应了当前环境治理和大气污染防治的迫切需要,是对现有国内外机动车尾气遥测设备的一次技术大提升,加强对机动车尾气排放的有效监控,加速推动我国环境保护检测技术的发展,该设备将极大提升环保部门的工作效能和执法监管力度,帮助政府随时掌握机动车尾气排放情况,从而为有效控制和减少大气污染提供可靠的科学依据和强力的决策支持。在实验室条件下,遥测设备的准确率非常高,但是在室外条件下,汽车尾气颗粒的扩散受到环境条件(温度,湿度、风速、大气压)的影响较大,遥测设备测得的机动车尾气体积浓度与真实排放有差异。我们设定机动车年检结果为该机动车的真实尾气排放的结果,因此,应当克服环境因素与车载变量,使得遥测数据结果与车检结果一致,使得遥测设备的结果可靠性增加。申请号201510745166.0的申请文件公布了一种基于机动车比功率的速度对车辆排放因子修正方法。该发明专利根据机动车行驶速度计算机动车比功率,得到不同速度区间的比功率分布情况,并利用平均速度计算的修正系数对其进行修正。技术实现要素:本发明的目的在于:为解决机动车尾气遥感监测设备在进行机动车尾气遥测时,受到遥感监测设备安装点环境多样,气象条件变化复杂的影响,而导致数据与车检结果不一致的问题,提供一种基于共同训练的机动车尾气遥测数据与车检结果一致性方法,将两种影响因素分别进行讨论,有效的减少了不同类变量间的相关性,使得在训练后能够更精确的找到上述数据集的一致性。为了实现上述目的,本发明提供了一种基于共同训练的机动车尾气遥测与车检结果一致性方法,包括以下步骤:步骤1:将机动车尾气遥测数据与机动车车辆年检数据两个数据集合并成一个数据集,所述数据集包括:机动车尾气遥测数据中的环境相关变量、机动车信息相关变量、遥测尾气成分浓度,机动车车辆年检数据中的环境相关变量和机动车车检结果;最终合并的机动车尾气排放数据集中变量分为四类:环境相关变量、机动车信息相关变量、遥测尾气浓度变量以及机动车车检结果,对数据集中的数据做清洗处理;步骤2:提取步骤1数据集中环境相关变量与遥测尾气浓度变量,以机动车车检结果作为标签,采用BP网络模型,训练环境相关变量对机动车尾气遥测数据与机动车车辆年检数据差异的影响矩阵模型,得到分类的预测概率矩阵;步骤3:提取步骤1数据集中机动车信息相关变量与遥测尾气浓度变量,使用支持向量机算法,将机动车车检结果作为标签,训练出机动车信息相关变量对机动车尾气遥测数据与机动车车辆年检数据差异的影响矩阵模型,得出分类的预测概率矩阵;步骤4:将步骤2和步骤3分别训练出的所述预测概率矩阵,进行线性拟合,以达到使机动车尾气遥测结果与车检结果一致的目的。可选地,上述步骤1中环境相关变量包括:机动车尾气遥测数据中的温度、湿度、大气压和机动车车辆年检数据中的温度,湿度、大气压之间的差值;机动车信息相关变量包括:机动车使用性质、使用年限、机动车长度、发动机排量、基准质量、催化转化器、比功率;行驶信息:速度、加速度;遥测尾气浓度变量包括:机动车尾气排放的CO、HC、NO的体积浓度、不透光烟度值。具体数据集格式如下:1)机动车尾气排放数据集中的每条样本数据应包括每辆机动车尾气遥测数据集部分、车辆年检数据集部分以及机动车年检判定结果。因此,每条样本数据属性组成如下:其中,D(i)表示机动车尾气排放数据集的第i条样本数据,表示第i条样本数据中的尾气遥测数据集部分,表示第i条样本数据中的车辆年检数据集部分;2)尾气遥测数据集中属性组成如下:其中,尾气遥测数据集的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、速度、加速度、基准质量、发动机排量、比功率、风速、使用年限、机动车长度、使用性质、催化转化器、温度、大气压强、相对湿度;3)车辆年检数据集的属性组成如下:其中,车检数据集的数据属性依次分别表示机动车年检时的温度、大气压强、相对湿度,S(i)表示第i条样本数据的机动车年检判定结果;4)将机动车年检判定结果进行二值化分类,定义如下:S(i)={0,1}其中,将0定义为机动车年检判定结果超标,将1定义为机动车年检判定结果合格。车辆年检判定结果为第i条样本数据的标签。可选地,上述步骤2中采用BP神经网络模型,训练环境变量对遥测数据与车检数据差异的影响矩阵模型,得到分类的预测概率矩阵的方法如下:根据步骤1中所建立的机动车尾气排放数据集,将数据集中环境相关变量与遥测尾气浓度变量提取出作为特征。即数据格式为:DBP={CO,HC,NO,Opacity,WindSpeed,TTel-TIns,PTel-PIns,HTel-HIns,S}其中车检结果S(i)={0,1}作为标签。将数据集DBP按0.3:0.21:0.49的比例分为训练集、验证集和测试集。首先,搭建BP神经网络模型,其中包括一层输入层,两层隐藏层、一层原始输出层、一层Softmax层和一层最终输出层。将训练集作为输入,以100个数据为一个数据块依次循环2000次对网络进行训练。由于这是个二分类问题,其损失函数设为交叉熵:其中p(x)是标签的分类概率,q(x)是经过Softmax回归后的预测类别概率。同时,为了防止过拟合问题,本模型中加入了L1正则化操作,即在损失函数中加入每层的各个节点的权重的绝对值的总和,这相当于在损失函数中加入刻画模型复杂程度的指标,通过限制权重的大小,使得模型不能任意拟合训练数据中的随机噪声。在每次循环后计算损失函数的大小以及训练后的模型对验证集预测的准确率,二者稳定后即模型训练成功。通过调整每层节点个数以降低损失率,最终隐藏层节点个数分别为100个,200个,得到的测试集的概率矩阵形式为n×2,n是测试集的样本数量。可选地,上述步骤3中采用支持向量机算法,训练机动车信息相关变量对遥测数据与车检结果差异的影响矩阵模型,得到分类的预测概率矩阵的方法如下:根据步骤1中所建立的机动车尾气遥测数据集,将数据集中遥测数据的机动车速度、加速度、基准质量、发动机排量、比功率、使用年限、车长、使用性质和催化转化器作为特征提取出来作为输入变量的一部分。输入变量的另一部分是CO、HC、NO体积浓度以及不透光烟度。即数据格式为:DSVM={CO,HC,NO,Opacity,Speed,Acc,JZZL,FDJPL,VSP,Useryears,Length,SYXZ,CHZHQ,S}其中车检结果S(i)={0,1}作为标签。将数据集DSVM按0.3:0.21:0.49的比例分为训练集、验证集和测试集。将训练集作为输入数据,标签作为输出数据,建立支持向量机模型,选择多项式核函数来转换特征空间,训练一个超曲面将正负实例正确分开。因此,测试集在训练好的超曲面上的概率矩阵是n×2的,其中n是测试集的样本数量。可选地,上述步骤4中对步骤2和步骤3训练出的概率矩阵进行线性拟合,使得机动车尾气遥测数据的结果与车检结果一致的方法如下:将两个概率矩阵以加权方式相加,得到的概率矩阵包括每条机动车遥测数据类别属0的概率与类别属1的概率,取概率大于0.5的类别为上述共同训练的预测标签。与现有技术相比,本发明的优点在于:(1)本发明所解决的一致性问题中,车检结果与遥测数据之间的差异主要由两类影响因子导致。通过理论分析,环境因素通过影响污染物质的扩散,从而影响遥测设备对污染物质检测的误差;而机动车本身的行驶状态不同,其排放的污染物含量也不同,例如机动车在行驶中有各种状态,但在车辆年检中排放物质检测是在固定的行驶状态下。因此,从理论上说两个数据集的差异是由两类独立的因子所影响,其加权值也不应当相关性过大。本发明所采用的BP神经网络与支持向量机共同训练的算法,用两个模型分别对两种影响因素进行训练修正,得到相应的概率矩阵,充分保证了模型的独立性,同时也没有舍弃其最终结果的综合影响。因此,该算法更能准确的反映出二者数据的差异性。(2)环境影响因子在对污染物质扩散的影响中,根据参考的物理扩散模型,各种因素互相叠加,呈非线性相关,并且非常复杂。BP神经网络中可调控的参数很多,非线性激活函数保证了其非线性。只要隐藏层节点足够,便能拟合复杂的相关模型。因此BP神经网络对环境因素的拟合有很大的优势。(3)车辆行驶状态对尾气的排放影响是分段线性或者非线性。支持向量机的核函数可将数据映射到低维空间进行有效分类,由于其核函数可调,适用于不算复杂的非线性,因此对于此因子的建模有很高的效率与准确定。因此,本发明提出的算法将两种因素分别训练,排除了环境因素和机动车行驶状态因素间的相互干扰,可以在单个模型上的训练达到最优。因此,最终也能达到更好的效果。附图说明图1为一种基于共同训练的机动车尾气遥测与车检结果一致性方法流程图;图2为BP神经网络模型的网络结构图。具体实施方式为了使本发明的目的、技术方案及优点更加清晰明确,以下对本发明进行进一步详细说明。如图1所示,本发明具体实施过程如下:步骤1:将机动车尾气遥测数据与机动车车辆年检数据两个数据集合并成一个数据集,所述数据集包括:机动车尾气遥测数据中的环境相关变量、机动车信息相关变量、遥测尾气成分浓度,机动车车辆年检数据中的环境相关变量和机动车车检结果;最终合并的机动车尾气排放数据集中变量分为四类:环境相关变量、机动车信息相关变量、遥测尾气浓度变量以及机动车车检结果,对数据集中的数据做清洗处理。具体过程如下:机动车尾气遥测数据包括环境变量:温度、湿度、风速、大气压;基本信息:机动车使用性质、使用年限、机动车长度、发动机排量、基准质量、催化转化器、比功率;行驶信息:速度、加速度;以及机动车尾气排放的CO、HC、NO的体积浓度、不透光烟度值。车检数据包括:温度,湿度、大气压以及车检结果。具体数据集格式如下:1)机动车尾气排放数据集中的每条样本数据应包括每辆机动车尾气遥测数据集部分、车辆年检数据集部分以及机动车年检判定结果。因此,每条样本数据属性组成如下:其中,D(i)表示机动车尾气排放数据集的第i条样本数据,表示第i条样本数据中的尾气遥测数据集部分,表示第i条样本数据中的车辆年检数据集部分;2)尾气遥测数据集中属性组成如下:其中,遥测数据集的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、速度、加速度、基准质量、发动机排量、比功率、风速、使用年限、机动车长度、使用性质、催化转化器、温度、大气压强、相对湿度;3)车辆年检数据集的属性组成如下:其中,车检数据集的数据属性依次分别表示机动车年检时的温度、大气压强、相对湿度,S(i)表示第i条样本数据的机动车年检判定结果;4)将机动车年检判定结果进行二值化分类,定义如下:S(i)={0,1}其中,将0定义为机动车年检判定结果超标,将1定义为机动车年检判定结果合格。年检判定结果为该条数据的标签。对采集到的数据进行数据清洗的步骤包括:1)将机动车使用性质、催化转化器和机动车年检判定结果进行二值化处理,其方法如下表所示:10机动车使用性质营运非营运催化转化器安装未安装机动车年检判定结果合格超标2)对于数据中的缺失值,采用同类均值插补的方法,即根据数据标签分为车检合格与超标两类,分别以该类中样本的均值来插补同类别的缺失值。3)将发动机排量、基准质量、使用年限、机动车长度、比功率、速度、加速度、温度、相对湿度、大气压强、风速、不透光烟度值、CO、HC、NO的体积浓度,进行归一化处理,计算的公式如下:其中,x表示某项数据属性中某条样本值,xmax表示某项数据属性中的最大值,xmin表示某项数据属性中的最小值,x′表示归一化处理后的数值。步骤2:根据步骤1中所建立的机动车尾气遥测数据集,考虑机动车尾气遥测设备检测的结果与车辆年检结果的差异主要受到环境差异和机动车行驶状态条件差异的影响。因此,将数据集中遥测数据的环境变量:温度、湿度、大气压和风速,车检数据中的环境变量:温度、湿度、大气压作为特征提取出来,并取二者差值作为输入变量的一部分,其中考虑到车检环境可以认为风速为0。输入变量的另一部分是CO、HC、NO体积浓度以及不透光烟度。即数据格式为:DBP={CO,HC,NO,Opacity,WindSpeed,TTel-TIns,PTel-PIns,HTel-HIns,S}数据集DBP的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、风速、机动车尾气遥测数据与机动车车辆年检数据中温度、大气压、湿度的差值,其中车检结果S(i)={0,1}作为标签。将数据集DBP按0.3:0.21:0.49的比例分为训练集、验证集和测试集。首先,搭建BP神经网络模型,具体网络模型如图2,其中包括一层输入层,两层隐藏层、一层原始输出层、一层Softmax层和一层最终输出层。由于数据集共有8个特征,输出标签是2分类,因此网络结构中输入层节点为8,输出层节点为2个。将训练集作为输入,以100个数据为一个数据块依次循环2000次对网络进行训练。由于这是个二分类问题,其损失函数设为交叉熵:其中p(x)是标签的分类概率,q(x)是经过Softmax回归后的预测概率矩阵。同时,为了防止过拟合问题,本模型中加入了L1正则化操作,即在损失函数中加入每层的各个节点的权重的绝对值的总和,这相当于在损失函数中加入刻画模型复杂程度的指标,通过限制权重的大小,使得模型不能任意拟合训练数据中的随机噪声。在每次循环后计算损失函数的大小以及训练后的模型对验证集预测的准确率,二者稳定后即模型训练成功。通过调整每层节点个数以降低损失率,最终隐藏层节点个数分别为100个,200个,得到的测试集的概率矩阵PBP=[p(S=0),p(S=1)]形式为n×2,n是测试集的样本数量,p(S=0)是预测结果等于0的概率,p(S=1)是预测结果等于1的概率。步骤3:根据步骤1中所建立的机动车尾气遥测数据集,将数据集中遥测数据的机动车速度、加速度、基准质量、发动机排量、比功率、使用年限、车长、使用性质和催化转化器作为特征提取出来作为输入变量的一部分。输入变量的另一部分是CO、HC、NO体积浓度以及不透光烟度。即数据格式为:DSVM={CO,HC,NO,Opacity,Speed,Acc,JZZL,FDJPL,VSP,Useryears,Length,SYXZ,CHZHQ,S}数据集的数据属性依次分别表示CO、HC、NO的体积浓度、不透光烟度值、速度、加速度、基准质量、发动机排量、比功率、使用年限、机动车长度、使用性质、催化转化器,其中车检结果S(i)={0,1}作为标签。将数据集DSVM按0.3:0.21:0.49的比例分为训练集、验证集和测试集。将训练集作为输入数据,标签作为输出数据,建立支持向量机模型。通过选择不同的核函数以及各参数,最终发现选择多项式核函数来转换特征空间可以达到更好地效果,不会出现过拟合或欠拟合的现象,因此能够训练一个超曲面将正负实例正确分开。因此,测试集在训练好的超曲面上的概率矩阵PSVM=[p(S=0),p(S=1)]是n×2的,其中n是测试集的样本数量,p(S=0)是预测结果等于0的概率,p(S=1)是预测结果等于1的概率。步骤4:将步骤2和步骤3分别训练出的概率矩阵,进行线性拟合,以达到使机动车尾气遥测数据的结果与车检结果一致的目的。其方法如下:将两个概率矩阵以加权方式相加,得到的最终预测概率矩阵P=a*PBP+b*PSVM+c,其中a,b,c为加权系数,可通过线性拟合的方式获得取值,即a=0.4284,b=0.3756,c=0.098。该方法得到的概率矩阵包括每条机动车遥测数据类别属0的概率与类别属1的概率,取概率较大的类别为上述共同训练的预测标签:Pend=argmax[p(S=0),p(S=1)]其中Pend是概率矩阵中较大值的下标的集合。总之,本发明利用BP神经网络模型训练出环境变量对机动车尾气遥测结果和车检结果差异的影响;同时利用支持向量机算法利用机动车行驶状态的信息对机动车尾气遥测和车检结果差异做分析;将两种方法分别训练出的预测概率矩阵进行线性拟合,最终实现机动车尾气遥测结果与车检结果一致。提供以上实例仅仅是为了描述本发明的目的,而并非要限制本发明的范围。本发明的范围由所附权利要求限定。不脱离本发明的精神和原理而做出的各种等同替换和修改,均应涵盖在本发明的范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1