一种基于聚类分析的车辆尾气排放特征分析处理方法与流程

文档序号:11920871阅读:223来源:国知局
本发明具体涉及一种基于聚类分析的车辆尾气排放特征分析处理方法,属于环境
技术领域

背景技术
:由于近年来全国机动车保有量迅猛增长,致使市区以及各地交通拥堵现象日趋严重,大气环境质量也呈现出恶化趋势,机动车排气污染监控工作正面临着严峻的挑战。机动车尾气是城市大气环境污染的重要污染物,是城市空气污染的主要源头,其中老旧的排放未达标的车辆和缺失保养导致排放超标的车辆有必要进行有效监管的,这对研究一个城市的环境总量和环境决策是十分有帮助的。因此,有必要对机动车尾气中有害气体的排放进行建立一套科学完善的评估方法,以便相关部门对机动车进行有针对性的监测和管理,同时加强对机动车尾气污染的控制,加大对尾气排放检测和监管的力度。虽然国内遥测技术已经慢慢开始发展普及,但是其后续工作仍比较空白。传统的车辆尾气检测只是根据环保部门设定的检测阈值来判断检测车辆是否超标,没有考虑到车辆尾气检测受车辆类型、行驶工况、燃料类型、车辆使用年限、风速、气温等诸多因素的影响,没有应用关联规则、聚类分析等先进的数据分析方法,并且没有充分利用OBD、PEMS等较为精准的车辆检测数据、实时天气、当前路况信息等数据导致对车辆尾气评估分析不够精细,不能对机动车进行有针对性的监测和管理。这些都给后续的数据分析和环保政策的提出造成了巨大的困难。技术实现要素:本发明技术解决问题:克服现有技术的不足,提供一种基于聚类分析的车辆尾气排放特征分析处理方法,实现多元异构海量遥测数据的分析处理,为环境污染地域的联防联控和氮氧化物总量减排的政策提供强有力的科学技术依据。本发明技术解决方案:一种基于聚类分析的车辆尾气排放特征分析处理方法,包括以下步骤:(1)抽取机动车尾气遥测数据;(2)对抽取的机动车尾气遥测数据进行预处理;(3)对步骤(2)中的预处理后的数据,采用灰色关联分析方法从车辆类型、行驶工况、燃料类型、车辆使用年限、风速、气温等诸多因素找出影响尾气排放的主要影响因素,作为车辆尾气排放特征分析处理的核心维度特征参数,实现尾气污染物排放影响因素关联特征选择,得到影响尾气排放的主要影响因素特征属性;(4)根据步骤(3)得到的影响尾气排放的主要影响因素特征属性,采用基于密度的聚类算法对检测车辆尾气排放特征数据进行分类得到分群类别,并计算每个排放分群组别的排放得分,然后根据排放得分对分群组别排序,构建车辆尾气排放特征分析处理模型,根据车辆尾气排放特征分析处理模型对车辆尾气排放进行分析处理。所述步骤(1)中,抽取机动车尾气遥测数据的过程如下:(11)从车辆检测数据库中获取尾气检测表和车辆基本信息表,包括的数据项有:检测设备编号,检测时间,检测的车牌号码,车速,车辆加速度,车辆长度,CO2、CO、HC、NO浓度,烟度值,风速,风向,气温,湿度,气压,动态/静态测量,数据有效性,抓拍照片,燃料类型,车辆登记日期属性;(12)从道路车流量信息数据库,获取的数据项有:道路名称,时间,小型客车、中型客车等不同类型车辆的车流量;(13)从天气信息数据库,获取的数据项有:时间,城市,天气状况,温度,湿度,风速,PM2.5,PM10,AQI。所述步骤(2)中,机动车尾气遥测数据预处理如下:通过对尾气遥测数据的分析,找出缺失值、偏离过大的个别极端值进行丢弃处理,从原始数据中的众多属性中删除与遥测记录不相关冗余属性,对遥测数据中的车型数据、燃料类型、数据有效性的非数值型数据进行量化处理,再根据车辆登记日期以及车辆检测时间,构造车辆使用年限分级数据。所述步骤(4)中,尾气污染物排放影响因素关联特征选择如下:采用灰色关联分析方法从车辆类型、行驶工况、燃料类型、车辆使用年限、风速、气温等诸多因素找出影响尾气排放的主要影响因素,作为车辆尾气排放特征分析处理的核心维度特征参数。所述步骤(4)中,构建车辆尾气排放特征分析处理模型如下:对步骤(3)得到的特征属性采用基于密度的聚类算法对检测车辆尾气排放特征数据进行分类得到分群类别,利用层次分析法得到每个特征属性权重,按式Ik=w1c1k+w2c2k…+wmcmk计算每个排放分群组别的排放得分,然后根据排放得分对分群组别排序。所述基于密度的聚类算法的过程如下:(1)输入聚类数K,属性数据集S={s1,s2,…sn},n为属性数据集大小,密度参数α,倍率参数β;(2)从属性数据集S中计算所有对象距离数据表distTable={dist(si,sj)},i=1,2…n;j=1,2…n;i≠j;对距离数据表从小到大排序得到距离排序数组Array;(3)通过Array的percent范围内出现最多的数据点标记,得到初始点init,Array(percent)记为序列中值最小的percent比例部分,按式Array(percent)={distArray1,distArray2,…,distArrayroughNum}得到,每一个distArray对应两个不同数据点,其中,roughNum=percent×n×(n-1)/2;(4)根据初始点init计算出当前簇的Eps和初始MinPts,得到当前簇的以init为圆心的初始簇点;(5)计算当前簇的每一个点的密度,若大于MinPts,则标记为簇心点,簇心点的Eps范围内的点标记为当前簇类;(6)根据当前簇心点的平均MinPts,更新MinPts,重复步骤(5)直到当前簇点个数不再增加;(7)从属性数据集S中去掉当前簇的点,当前簇类加1,重复(2)~(6)直到当前簇标为K+1;(8)给每一个未被标记的数据点标记为与其相近最近标记点的簇标,最终聚类出K个数据簇,从而得到分群类别。本发明与现有方法相比的优点在于:传统车辆尾气检测根据相关标准的限定阈值将车辆分为超标和不超标,分类比较粗略。本方法充分利用遥测设备积累点海量数据,并考虑车辆基本属性数据,对检测车辆进一步精确分类,划分出不同排放水平,对车辆尾气排放的不同分级采取针对性整治措施,从而对机动车进行有针对性的监测和管理。附图说明图1本发明方法流程图。具体实施方式:如图1所示,本发明具体实现如下:(1)抽取机动车尾气遥测数据从车辆检测数据库中获取尾气检测表和车辆基本信息表,包括的数据项有:检测设备编号,检测时间,检测的车牌号码,车速,车辆加速度,车辆长度,CO2、CO、HC、NO浓度,烟度值,风速,风向,气温,湿度,气压,动态/静态测量,数据有效性,抓拍照片等29个属性。(2)机动车尾气遥测数据预处理对尾气遥测数据进行预处理,主要包括缺失值处理,数据构造。1)缺失值处理:如果缺失值的遥测记录占总记录数比例超过60%,则舍弃该类记录;如果缺失值的遥测记录所占总数比例不超过20%,而该属性是非连续值特征属性,那就把NaN作为一个新类别,加到类别特征中;若属性为连续值特征属性,会给定一个步长,然后把它离散化,之后把NaN作为一个类型加到属性类目中。2)数据构造:由于车型数据是以图像格式保存在数据库中,为便于分析,首先人工对车型图像数据进行标注,将车型分为无法识别车辆、客车、公交车、出租车、小轿车、轻型卡车、重型卡车,属性值分别记为0,1,2,3,4,5,6。根据车辆的燃料类型分为汽油、柴油、天然气,属性值分别记为0,1,2。根据车辆登记日期以及车辆检测时间,得到车辆使用年限分级。字段名字段说明年限分级使用年限1<=121~535~848~10根据车辆基准质量得到基准质量分级,(3)尾气污染物排放影响因素关联特征选择机动车排放污染物的排放特性复杂,受车辆类型、行驶工况(速度、加速度)、燃料类型、车辆使用年限、风速、气温等诸多因素影响。采用灰色关联分析方法找出影响尾气排放的主要影响因素特征。灰色关联度采用如下算法来判断影响因素:1)记原始数列x={x1,x2,…xn},x1为污染物数值属性,x2…xn依次为车辆类型,车辆行驶速度,加速度,燃料类型,车辆使用年限等属性列。构造初始化数列N为数据记录数。2)选取尾气污染物浓度作为参考数列为比较数列。3)计算比较数列yi对参考数列y1,在第k点的关联系数ρ为分辨系数,取值范围0~1,典型值为0.5。4)综合各比较序列点的关联系数,可以得出整个序列yi与参考序列y1的关联度按上述1)~4)对CO、HC、NO浓度,烟度值的影响因素进行关联度分析,按关联度大小进行排序。从车辆类型、行驶工况(速度、加速度)、燃料类型、车辆使用年限、风速、气温等属性中选取前m个属性作为车辆尾气排放特征分析处理的核心维度特征参数,分别记为X1,X2,…Xm。(4)构建车辆尾气排放特征分析处理模型对步骤(3)得到的m个属性特征构造数据集S,采用基于密度的聚类算法对检测车辆提取m个属性特征构成的数据集进行分类。具体实现算法如下:[1]输入聚类数K,包含n条对象的数据集S={s1,s2,…sn},密度参数α,倍率参数β;[2]从提取属性数据集S中计算所有对象距离数据表distTable={dist(si,sj)},(i=1,2…n;j=1,2…n;i≠j);对距离数据表从小到大排序得到距离排序数组Array。[3]通过Array的percent范围内出现最多的数据点标记,得到初始点init。Array(percent)记为序列中值最小的percent比例部分,按式:Array(percent)={distArray1,distArray2,…,distArrayroughNum}得到。每一个distArray对应两个不同数据点。其中,roughNum=percent×n×(n-1)/2。[4]根据初始点init计算出当前簇的Eps和初始MinPts,得到当前簇的以init为圆心的初始簇点。Eps和初始MinPts的计算方法如下:其中epsNum记为与初始点与数据集其他各点之间距离小于等于的数据点的个数。初始[5]计算当前簇的每一个点的密度,若大于MinPts,则标记为簇心点,簇心点的Eps范围内的点标记为当前簇类。[6]根据当前簇心点的平均MinPts,更新MinPts,重复步骤[5]直到当前簇点个数不再增加。按下式计算更新MinPts,更新当第i个数据点为当前第k簇点中心点时coreNumi=k,当不是中心点时,coreNumi=0。[7]从属性数据集S中去掉当前簇的点,当前簇类加1,重复[2]~[6]直到当前簇标为K+1。[8]给每一个未被标记的数据点标记为与其相近最近标记点的簇标,最终聚类出K个数据簇,从而得到分群类别。车辆尾气排放特征分析处理模型通过对每个检测车辆分群的m个属性的均值与总的m个属性均值相比,来区分检测车辆排放分级。每类分群的单个属性值大于该属性总体均值记为1,反之记为0,则一共有2m个排放水平分级。利用层次分析法得到每个特征属性权重,按下式计算每个排放分群组别的排放得分,然后根据排放得分对分群组别排序。Ik=w1c1k+w2c2k…+wmcmk,第k组分群的排放得分记为Ik,wi是由层次分析法得到的各特征属性权重,cik为第k组分群聚类中心各特征属性标准化后的值。根据总得分大小对排放分群进行排序分级,对车辆尾气排放的不同分级采取不同整治措施。本发明具体实施方式提高机动车尾气遥测执法的效率和可靠性,为机动车尾气执法监管提供科学决策支持。以上显示和描述了本发明的基本原理和主要功能。本行业的技术人员应该了解,本发明不受上述实例的限制,上述实例和说明书中的描述只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的发明范围内。本发明要求保护范围由所附权利要求书及其等效物界定。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1