基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法与流程

文档序号:18466026发布日期:2019-08-17 02:28阅读:263来源:国知局
基于多层特征选择的固废焚烧过程二噁英排放浓度软测量方法与流程

本发明属于软测量领域。



背景技术:

基于炉排炉的城市固废焚烧(mswi)技术是目前应用最广泛的生活垃圾资源化处理手段[1,2]。截止2017年,我国大陆已有mswi电厂303座,其中220座采用基于炉排炉的焚烧技术。目前引进的国外mswi过程多处于手动控制运行状态,难以保持稳定运行与进行优化控制[3]。针对发展中国家,当前最为紧迫的问题是控制mswi所造成的污染物排放[4,5],其中排放物二噁英(dxn)是目前世界上毒性最强的污染物[6],也是造成焚烧建厂存在“邻避效应”的主要原因。dxn是多氯代二苯并对二噁英(pcdds)、多氯代二苯并呋喃(pcdfs)以及部分具有类二噁英性质的多氯联苯所组成的持久性有机污染物的统称,被称为“世纪之毒”[7],其在生物体内具有显著的积累和放大效应[8,9]

当前,mswi焚烧企业的主要关注点是如何通过优化控制运行参数实现dxn排放的最小化[10]。为优化固废焚烧过程,实现dxn排放浓度的在线测量非常必要。现阶段主要检测方法包括离线直接检测法、指示物/关联物在线间接检测法和软测量方法,其中:第1种检测方法需要专门实验室和相应化验分析设备,滞后时间尺度为月/周;第2种检测方法分为在线采集烟气、检测指示物/关联物浓度和基于映射模型间接计算dxn排放浓度等3个步骤,需要昂贵复杂的在线化验分析设备,滞后时间尺度为天/小时;第3种检测方法不需要化验分析设备,滞后时间尺度为分钟/秒[11]。本文主要关注第3种方法的研究。

dxn排放浓度软测量的已有研究包括:依据机理和经验选择的输入特征,文献[12,13,14]采用数十年前欧美研究机构针对不同类型焚烧炉采集的小样本数据,基于线性回归、人工神经网络(ann)、选择性集成(sen)最小二乘-支持向量机(ls-svm)等方法构建模型;文献[15]选用台湾某焚烧厂4年多的实际过程数据,综合相关性分析、主成分分析(pca)和人工神经网络(ann)等算法,从23个易检测过程变量中选择13个为输入构建dxn软测量模型,指出贡献率较大的输入特征为活性炭注入频率、烟囱排放hcl气体浓度和混合室温度;文献[16]以炉膛温度、锅炉出口烟温、烟气流量、so2浓度、hcl浓度及颗粒物浓度为输入变量构建基于支持向量机(svm)的dxn排放浓度与毒性当量预测模型。实际mswi过程的变量有数百维,这些变量在不同程度上均与dxn的生成、吸收与排放相关[17]。上述过程均未结合mswi过程的多工序特性和变量间的共线性进行特征选择。此外,dxn软测量的标记样本难以获得,建模中应重点考虑小样本高维数据的特征选择问题。

特征选择的本质就是去除原始数据中的“无关特征”与“冗余特征”,保留重要特征。从消除“无关特征”的视角,应考虑mwsi过程中的单个特征(自变量)和dxn排放浓度(因变量)间的相关程度。文献[18]对高维数据利用相关系数进行维数约简,缩短运算时间和建模复杂度。文献[19]提出基于相关系数的多目标半监督特征选择方法。但研究表明,基于相关系数的线性方法难以描述自变量与因变量间的复杂任意映射关系[20]。文献[21]指出互信息对特征间的相关性具有良好的表征能力。文献[22]提出基于个体最佳互信息的特征选择方法。文献[23]提出基于条件互信息的特征选择方法,能够有效地对上一步所选择的特征进行评价。由此可知,相关系数与互信息均可以表征自变量和因变量间的相关性[24,25];前者的着重点在线性关系,后者的着重点在非线性关系[26,27]。针对实际的复杂工业过程,自变量和因变量间的映射关系难以采用单一的线性或非线性进行统一表征。上述这些方法均未考虑如何进行特征的自适应选择。

在获得与dxn具有较好相关性单输入特征的基础上,从消除“冗余特征”的视角,主要考虑mswi过程众多过程变量间的冗余性。文献[28]采用相关系数表示已选特征与当前特征之间的冗余性。文献[29]提出pca解决变量间的共线性问题,但所提取的潜在变量会破坏原始特征自身物理含义。文献[30]提出改进岭回归方法的回归系数为有偏估计量从而处理多重共线性问题。文献[31]验证了偏最小二乘(pls)对输入特征间的多重共线性问题有良好的解释与分解能力。文献[32]提出了结合遗传算法(ga)全局优化搜索能力和pls多重共线性处理能力的特征选择方法,即遗传-偏最小二乘算法(ga-pls)。汤等人的研究表明,ga-pls对高维谱数据具有良好的选择性[33],但在面对小样本高维数据时,ga的随机性导致其每次特征选择的结果存在着差异性,有必要对多次选择的特征进行统计,以提高鲁棒性和可解释性。

本文进行特征选择的目标是提高软测量模型的预测性能和可解释性。此外,上述特征选择过程主要从数据驱动视角出发,样本数量有限时可能存在偏差。依据已有的研究成果和先验知识,我们需要扩充机理含义明确的重要特征,使得软测量模型更具可解释性并且符合焚烧过程dxn排放特性,进而为后续的优化控制研究提供支撑。

综上,本文提出基于多层特征选择的mswi过程dxn排放浓度软测量方法。首先,从单特征与dxn相关性视角,结合相关系数和互信息构建综合评价值指标,实现mswi多个子系统过程变量的第1层特征选择;接着,从多特征冗余性和特征选择鲁棒性视角,多次运行基于ga-pls的特征选择算法,实现第2层特征选择;最后,结合上层选择特征的统计频次、模型预测性能及机理知识进行第3层特征选择,构建得到dxn排放浓度软测量模型。结合某焚烧厂的多年dxn检测数据验证了所提方法的有效性。

国内某厂的炉排炉焚烧工艺流程如图1所示:

由图1可知,msw由专用的运输车收集后运至卸料大厅,倾倒至密封的存放池内;由人工操控的吊斗将msw放入焚烧炉进料斗内,给料机将其推至炉排炉;在焚烧炉的炉排内依次经历干燥、点燃、燃烧和烧尽四个阶段,其中:燃尽后的残渣掉入水冷渣斗内,再由输渣机将其推入炉渣池内,收集后送至填埋场处理;焚烧产生的烟气由废热锅炉转换为高压蒸汽并推动汽轮机组发电,锅炉出口的待处理烟气进入脱酸反应器进行中和反应,并在反应器入口处添加石灰和活性炭以吸附其中的dxn和重金属,其中:飞灰进入飞灰储仓,烟气进入布袋除尘器;烟气在袋式除尘器中被除去烟气颗粒物、中和反应物和活性炭吸附物,处理后分为三个部分,其中:尾部飞灰进入灰仓后再运走进行无害化处理,部分烟灰混合物在混合器中加水后重新进入脱酸反应器,尾部烟气则由引风机经烟囱排入大气,排放的尾气中含有hcl、so2、nox、hf和dxn等质。

由上述过程产生的dxn形态包括焚烧灰、飞灰和排放气体3种,其中:焚烧灰量最大但dxn浓度较低、飞灰量稍小但dxn浓度较焚烧灰高,该两类需进行特殊处理;排放气体中的dxn浓度为最高,包括垃圾不完全燃烧和新规合成反应生成(denovosyhthesis)两类[34]。为保证有毒有机物的有效分解,焚烧烟气应达到至少850℃并保持至少2秒。在烟气处理阶段,石灰和活性炭被喷射进入反应器用以移除酸性气体和吸附dxn以及某些重金属,再经袋式过滤器过滤后通过引风机排入烟囱;此外,该阶段存在的dxn记忆效应会导致排放浓度增加。通常,上述炉内焚烧和烟气处理阶段中与dxn产生和吸收相关的过程变量以秒为周期由现场分布式控制系统进行存储。排放烟气中的易检测气体(co、hcl、so2、nox和hf等)浓度通过在线检测仪表实时检测。焚烧企业或环保部门通常以月或季为周期采用离线直接化验法对排放烟气进行dxn浓度检测。

综上可知,dxn排放浓度软测量存在的难点包括:msw的原始dxn含量未知、dxn生成和吸收阶段的机理复杂不清、烟气处理阶段dxn存在的记忆效应导致测量存在不确定性等。因此,非常有必要对mswi过程的输入特征进行分区域的特征选择。



技术实现要素:

结合焚烧工艺将mswi过程分为6个子系统:燃烧处理工程、锅炉设备工程、尾气处理工程、蒸汽发电工程、烟囱排放工程、公用传输工程。

本文中,软测量模型的输入数据x∈rn×p包括n个样本(行)和p个变量(列),其源于mswi流程的不同子系统。此处,将来自第ith个子系统的输入数据表示为即存在如下关系,

其中,i表示子系统个数,pi表示第ith个子系统包含的输入特征个数。

相应的,输出数据包括n个样本(行),其来源于采用离线直接检测法得到dxn检测样本。

显然,模型的输入/输出数据在时间尺度上具有较大的差异性:过程变量以秒为单位在dcs系统采集与存储,dxn排放浓度以月/季为周期离线直接化验获得,故存在n<<p。

为便于后文描述和理解,将xi改写为如下形式,

其中,表示第ith个子系统的第pith个输入特征,表示列向量。

本文提出基于多层特征选择的mswi过程dxn排放浓度软测量策略,如图2所示。

在图2中,表示针对第ith个子系统的输入特征采用相关系数和互信息度量所选择的候选特征集合,表示对基于相关系数法和互信息法所选择的候选特征集合采用综合评价值度量所选择的对第ith个子系统的第1层特征,表示串行组合全部子系统的第1层特征所得到的基于单特征相关性的第1层特征,表示运行第jth次ga-pls算法所选择的基于多特征冗余性的第2层特征,表示第1层特征中第个特征被选择的次数,表示依据特征选择阈值θ3rd和先验知识从中所选择的第3层特征,mpara表示软测量模型的参数,表示预测值。

算法实现

基于单特征相关性的第1层特征选择

基于相关系数的单特征相关性度量

首先,计算不同原始输入特征与dxn排放浓度间的原始相关系数。此处以第ith个子系统的第pth个输入特征为例进行描述,如下,

其中,分别表示第ith个子系统的第pth个输入特征及dxn排放浓度n个建模样本的平均值。将原始相关系数进行如下预处理,

其中,|·|表示取绝对值。

重复上述过程,获得全部原始输入特征的相关系数并记为设定第ith个子系统的权重因子ficorr,将基于相关系数选择输入特征的阈值采用如下公式计算,

其中,ficorr的最大(ficorr)max和最小值(ficorr)min采用如下公式计算,

其中,max(·)和min(·)分别表示取最大和最小值的函数。

作为阈值,第ith个子系统的第pith输入特征的选择准则如下所示,

选择其中的特征作为基于相关系数选择的候选特征并将其标记为对第ith个子系统的全部原始输入特征执行上述过程,并将所选择的候选特征标记为,

其中,表示基于相关系数选择的第ith个子系统的过程变量个数。

对全部子系统重复上述过程,基于相关系数度量选择的特征标记为

基于互信息的单特征相关性度量

首先,计算不同原始输入特征与dxn排放浓度间的互信息值。以第ith个子系统的第pth个输入特征为例,如下:

其中,表示联合概率密度,和prob(yn)表示边际概率密度。

重复上述过程,获得全部原始输入特征的互信息值并记为设定第ith个子系统的权重因子fimi,,将基于互信息选择输入特征的阈值采用如下公式计算,

其中,fimi的最大(fimi)max和最小值(fimi)min采用如下公式计算,

作为阈值,第ith个系统的第pith输入特征的选择准则如下所示,

选择其中的特征作为基于互信息选择的候选特征并将其表标记为对第ith个子系统的全部输入特征执行上述过程,并将所选择的候选特征标记为:

其中,表示基于互信息选择的第ith个子系统的全部特征的个数。

对全部子系统重复上述过程,基于互信息度量选择的特征可标记为

基于综合评价值的单特征相关性度量

以第ith个子系统为例,同时考虑具有相关系数和互信息贡献度的输入特征在中得到候选特征集合,其策略为:

其中,∩表示取交集。表示第ith个子系统的第个候选特征,其对应的相关系数值与互信息值为

为消除不同输入特征的相关系数值和互信息值的大小导致的差异性,按如下公式进行标准化处理,

其中,表示第ith个子系统的第个标准化的相关系数值和互信息值。

本文新定义一种候选输入特征的综合评价值其表示形式为,

其中,表示比例系数(默认取值为0.5),其满足

重复上述过程,获得全部候选输入特征的综合评价值并记为

设定第ith个子系统的权重因子ficorr_mi,将基于综合评价值选择输入特征的阈值采用下式计算,

其中,ficorr_mi的最大(ficorr_mi)max和最小值(ficorr_mi)min采用如下公式计算,

作为阈值,以第ith个子系统的第个候选输入特征为例,按如下规则进行选择,

对全部的原始候选输入特征执行上述过程,选择其中的变量作为基于综合评价值选择的输入特征,并标记为,

重复上述过程完成对全部子系统第1层特征的选择,并串行排列可得到基于单特征相关性的第一层特征

其中,表示第1层特征选择集合中的第个特征,表示全部第1层特征的数量。

基于多特征冗余性的第2层特征选择

上述第1层特征的选择过程仅考虑单输入特征与dxn排放浓度之间的相关性,未考虑多特征间存在的冗余性。此处采用基于ga-pls的特征选择算法同时考虑多个特征间的冗余性进行第2层特征选择。考虑到dxn排放浓度建模的小样本特点和ga算法的随机性,此处采用如下所示的第2层特征选择策略。

由图3可知:上述策略的输入为第1层选择特征运行第jth次ga-pls的输出为第2层选择特征最终输出为运行j次ga-pls后每个第1层输入特征的被选择次数,选择预测误差小于均值的jsel次第2层特征进行统计处理,其中第个特征的选择次数为相应的全部个第1层特征为j为ga-pls算法的运行次数,一般取值为100次以上;jsel为ga-pls模型预测误差小于j次运行均值的数量。

上述第2层特征选择的步骤如下:

第1步:设定ga-pls运行次数j,以及ga-pls算法参数:初始种群数量、最大遗传代数、变异概率、交叉方式、pls算法潜在变量(lv)数量,一般设定为6;设定j=1,启动第2层的特征选择过程,开始运行。

第2步:判断是否达到运行次数j,若满足,则转到第11步,否则,转到第3步;

第3步:采用二进制方式对特征进行编码,其中染色体的长度为输入特征个数,1表示特征被选中,0表示特征未被选中;

第4步:采用随机方式对种群初始化;

第5步:对种群进行适应度评价,采用留一法交叉验证法计算均方根验证误差rmsecv,值越小表明适应度越好;

第6步:判断是否达到最大遗传代数的终止条件,如不满足,转第7步,否则转第9步;

第7步:进行选择、交叉和变异遗传操作,其中:选择操作采用精英替代策略即采用适应度好的个体替换适应度较差的个体,交叉操作采用单点交叉,变异操作采用单点变异;

第8步:获得新种群,转到执行第5步;

第9步:获得第jth次运行ga-pls算法的最佳个体,进一步解码得到所选择的第2层特征,并将其记为

第10步:令j=j+1,转到第2步;

第11步:计算全部j次运行得到的预测模型的均方根误差(rmse)的平均值,将大于此平均值的ga-pls模型的数量标记为jsel。对jsel次所选择的第2层特征进行处理,统计个第1层特征的被选择次数,如下所示,

其中,为第个第1层特征的被选择次数。

基于模型预测性能的第3层特征选择与建模

基于上述步骤得到的全部个第1层特征的被选择次数为结合确定的比例系数确定用于第3层特征选择的阈值下限采用如下公式计算,

其中,floor(·)表示取整函数;值取1时表示阈值下限为全部第1层特征选择次数的均值,其最大值和最小值采用如下公式计算,

第3层特征选择的阈值上限取为全部个第1层特征被选择次数的最大值,

将第3层特征选择的阈值记为其值在之间。第3层特征的筛选机制为:

其中,表示第个第1层特征经j次ga-pls算法被选择的次数;μp表示第3层特征选择的阈值筛选标准。选择μp=1的特征变量依次存入中;接着,以为输入构建基于pls的dxn软测量模型,并计算rmse。

进一步,在之间逐个增加值,构建基于pls算法的dxn软测量模型,选择rmse最小的作为基于数据驱动选择过程变量的基于pls的dxn排放浓度软测量模型。

进一步,进一步,检查上述数据驱动软测量模型的输入中是否包括烟囱排放的co浓度、hcl浓度、o2浓度和nox浓度,同时去除公用传输系统中的特征;若未包括,则将上述特征进行补选,进而获得第3层的选择特征进一步,构建基于数据驱动与机理结合选择过程变量的基于pls的dxn软测量模型。。

综上可知,本文所提多层特征选择的过程可表示如下,

附图说明

图1基于炉排炉固废焚烧工艺流程

图2软测量策略

图3基于多特征冗余性的第2层特征选择策略图

图4焚烧子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值

图5锅炉子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值

图6烟气处理子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值

图7蒸汽发电子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值

图8尾气排放子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值

图9公用子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值

具体实施方式

建模数据描述

本文建模数据源于北京某基于炉排炉的mswi焚烧企业,包括dxn排放浓度检测样本的数量为34个,变量维数为287维(包含了mswi过程的全部过程变量)。可见,输入特征数量远远超过建模样本数量,进行维数约简非常有必要。本文中,将焚烧、锅炉、烟气处理、蒸汽发电、烟气排放和公用工程6个子系统标记为incinerator、boiler、fluegas、steam、stack和common。

建模结果

基于单特征相关性的特征选择结果

针对不同的子系统,取相关系数和互信息的特征选择权重因子ficorr、fimi和ficorr_mi均为0.8,均取为0.5,不同的子系统所选择的过程变量的相关系数值、互信息值和综合指标评价值如图4-9所示。

由图4-9可知,不同子系统过程变量的相关系数,互信息值和综合指标评价值的间存在差异,其最小值、均值和最大值的统计结果如表1所示。

表1不同子系统过程变量的相关性度量结果统计

由表1可知:(1)子系统过程变量相关系数值、互信息值和综合指标评价值平均值的最大值均源于烟气排放子系统,分别为0.2816、0.7401和0.2500;烟气排放子系统测量的是与dxn同时排放至大气中的气体,如′烟囱排放hcl浓度′、′烟囱排放o2浓度′、′烟囱排放nox浓度′、′烟囱排放co浓度′等,这与dxn的产生机理和文献中关于dxn排放检测的综述是相符的[11];(2)子系统过程变量相关系数值、互信息值和综合指标评价值最大值的最大值分别源于焚烧子系统、烟气排放子系统和烟气排放子系统,分别为0.6760、0.8665和0.2827,是与dxn生成过程相关的系统;(3)子系统过程变量相关系数值、互信息值和综合指标评价值最小值的最小值均源于公用工程子系统,从机理上讲,该子系统与dxn产生的物质流不具备直接的联系,但从单特相关性的度量结果可知,,其包含的部分过程变量与dxn间的相关系数值和互信息值还是较大的;(4)上述统计表明了dxn排放工业数据具有一定程度的可靠性,从单特征相关性的视角,排在前3的是与dxn生成、处理和排放相关的系统;但其他子系统的部分过程变量从数据视角也与dxn排放浓度的相关性较大,故需要结合机理知识进行最终的特征选择。

进一步,基于综合指标评价值所选择的过程变量数量如表2所示。

表2基于综合指标评价值所选择的过程变量数量

结合图4-9和表2可知,基于相关系数和互信息选择的特征数量并不相同;基于综合评价值选择的特征变量为132个,数量最多的子系统为焚烧(39)和公用工程(42)。此外,分别从各个子系统进行过程变量的选择保证了每个子系统均能够为下步变量选择贡献特征,也便于后续对不同子系统进行独立分析。

基于多特征冗余性的特征选择结果

对上述过程所选择的132个基于单特征相关性的过程变量,采用ga-pls算法确定最佳过程变量的组合,去除冗余特征。

ga-pls所采用的运行参数为:种群数量20、最大遗传代数40、最大lv数量6、遗传变异率0.005、窗口宽度1、收敛百分比98%、变量初始化百分比30%。

基于上述参数运行100次,所得预测模型的rmse统计结果如表3所示。

表3运行100次ga-pls的rmse统计结果

由表3可知,从预测性能的统计结果看,ga-pls的运行结果具有较大的波动性,这与本论文所采用的建模样本数量小和ga算法自身具有随机性相关。对大于预测均值的ga-pls算法所获得的预测模型进行统计,可得到用于特征选择频次统计的模型数量为49个。进一步,计算132个过程变量的被选择次数,如下表所示。

表4基于多特征选择的过程变量被选择次数统计表

由表4可知:(1)全部132个过程变量被选择的平均次数为13次,具有最大选择次数的过程变量源于公用工程子系统;(2)具有最大单特征相关性的烟气排放子系统的4个过程变量的被选择次数最大仅为6,可见进行多特征冗余性与单特征相关性的选择结果间存在差异性,同时,也说明ga-pls算法所存在的随机性;(3)仅是基于数据驱动的特征变量选择还是存在缺陷的,需要机理知识的补充。

基于模型预测性能的特征选择结果

基于上述ga-pls的运行结果,将特征选择阈值的范围设定为13-48。。

按照特征选择阈值与预测性能间的关系,将阈值确定为18,则所选择的过程变量数量为39个,在各个子系统中所选择的变量如表5所示。

表5基于模型预测性能选择的过程变量统计表

由表4可知,输入特征维数降为39,与dxn产生机理相关的特征为14个(焚烧7个,尾气处理6个,锅炉1个)。采用上述基于数据驱动选择的过程变量构建pls模型。

依据lv数量与预测性能rmse间的关系,当lv数量为2,其训练和测试rmse分别为0.01375和0.01929。不同lv提取的潜在变量贡献率如表6所示。

依据dxn产生的机理可知,焚烧发电子系统和公用工程子系统与dxn排放浓度的相关性不大,烟气排放子系统与dxn相关。此处,结合机理增加烟气排放子系统的4个过程变量(烟囱排放hcl浓度′′烟囱排放o2浓度′′烟囱排放nox浓度′′烟囱排放co浓度′)作为输入特征。

采用上述基于数据驱动与机理结合选择的18个过程变量构建pls模型。

依据lv数量与预测性能rmse间的关系,当lv数量为2时,其训练和测试rmse分别为0.01638和0.02048。不同lv提取的变量,贡献率如表6所示。

表6基于不同输入特征pls模型的lv贡献率

由表6可知,加入基于机理知识确定的过程变量后,lv在输入数据中的贡献率提高了2%,在输出数据中的贡献中降低了2%,可见去除和加入的过程变量对预测性能的影响是有限的。考虑到dxn建模数据预处理中是将24小时的数据进行均值化获得,对应的dxn检测值是连续采样8-9小时在离线化验1周获得的,在处理过程中难免会引入不确定因素。同时,此处以引入较小的预测误差为代价,引入部分机理相关的过程变量是适合的。具体的更深入的机理分析需要结合dxn排放过程的数值仿真研究深入进行。

比较与讨论

由上文可知,所提方法能够均衡的考虑相关系数与互信息度量的贡献度。采用pls算法建立基于上述不同输入特征的软测量模型,统计结果如表4所示。

表4基于不同输入特征的pls模型统计结果

由上述结果可知:采用相同lv数量,基于不同输入特征的pls建模方法在测试数据的预测性能相差不大,但在输入特征的维数约简上却差距明显。输入特征维数由高低分别为:原始特征287维、基于互信息235维、基于相关系数153维、基于综合评价值98维、基于本文数据驱动为39维、基于本文数据驱动与机理混合为18维;可见本文方法在特征数量上缩减了16倍。由此可见,本文所提方法对构建物理含义清晰、可解释的软测量模型是有效的。同时也表明,对工业过程数据的分析需要结合机理知识进行。

本文在进行特征选择时,涉及到多个特征选择系数,这些系数对特征选择结果和模型预测性能的影响还需要进一步的深入分析。此外,本文所采用的建模方法为简单的线性模型,所选择的特征为混合的线性与非线性特征,因此在更为合理的建模策略的选择上也还有待于研究。工业过程数据的可靠性如何度量也是值得深入考虑的问题。针对机理知识明晰的输入特征,需要考虑在遗传算法的初始化中利用先验知识,以保证选择具有较强机理相关性的过程变量,如烟囱排放co浓度等。

本文针对城市固废焚烧的剧毒副产品dxn的生成与排放机理复杂不清、难以实时在线检测,用于dxn软测量的高维输入特征难以有效选择及建模样本有限等问题,提出了基于多层特征选择的mswi过程dxn排放浓度软测量方法,主要贡献体现在:(1)定义综合评价值指标进行基于相关性的单特征选择与度量;(2)提出多次运行ga-pls的面向多特征冗余性的特征选择方法;(3)基于模型预测性能,结合数据驱动和机理知识选择最终输入特征构建软测量模型。结合某焚烧厂的多年dxn检测数据验证了所提方法的有效性。

参考文献

[1]arafatha,jijaklik,ahsana.environmentalperformanceandenergyrecoverypotentialoffiveprocessesformunicipalsolidwastetreatment[j].journalofcleanerproduction,2015,105:233-240

[2]zhouh,menga,longyq,liqh,andzhangyg.areviewofdioxin-relatedsubstancesduringmunicipalsolidwasteincineration[j].wastemanagement,36:106-118,2015.

[3]mukherjeea,debnathb,ghoshsk.areviewontechnologiesofremovalofdioxinsandfuransfromincineratorfluegas[j].procediaenvironmentalsciences,2016,35:528-540.

[4]yuananh,hefac,shut.thegrowingimportanceofwaste-to-energy(wte)incinerationinchina′santhropogenicmercuryemissions:emissioninventoriesandreductionstrategies[j].renewableandsustainableenergyreviews,2018,97:119-137.

[5]huangt,zhoul,liul,xiam.ultrasound-enhancedelectrokineticremediationforremovalofzn,pb,cuandcdinmunicipalsolidwasteincinerationflyashes[j].wastemanagement,2018,75:226-235.

[6]jonesph,degerlachej,martie,mischerg,scherrermc,bontinckmj,niessenhj,theglobalexposureofmantodioxins-aperspectiveonindustrial-wasteincineration[j].chemosphere,26(1993)1491-1497.

[7]baij,sunx,zhangc,gongc,huj,zhangj.mechanismandkineticsstudyontheozonolysisreactionof2,3,7,8-tcddintheatmosphere[j].journalofenvironmentalsciences,2014,26(1):181-188.

[8]俞明锋,付建英,詹明秀.生活废弃物焚烧处置烟气中二噁英排放特性研宄[j].环境科学学报,2018,38(05):1983-1988.(yuming-feng,fujian-yinig,zhanming-xiu.theresearchofpcdd/fsemissioncharacteristicsinfluegasfrommunicipalsolidwasteincinerations[j].actascientiaecircumstantiae,2018,38(05):1983-1988.)

[9]gouint,dalythl,waniaf,mackayd,joneskc.variabilityofconcentrationsofpolybrominateddiphenylethersandpolychlorinatedbiphenylsinair:implicationsformonitoring,modelingandcontrol[j].atmosphericenvironment,2005,39(1):151-166.

[10]zhanghj,niyw,chenjp,zhango.influenceofvariationintheoperatingconditionsonpcdd/fdistributioninafull-scalemswincinerator[j].chemosphere,2008,70(4):721-730.

[11]乔俊飞,郭子豪,汤健.面向城市固废焚烧过程的二噁英排放浓度检测方法综述[j].自动化学报(在审).(qiaojf,guozh,tangj.dioxinemissionconcentrationmeasurementapproachesformunicipalsolidwastesincinerationprocess:asurvey[j].actaautomaticasinica,intrial)

[12]changnb,huangsh.statisticalmodellingforthepredictionandcontrolofpcddsandpcdfsemissionsfrommunicipalsolidwasteincinerators[j].wastemanagement&research,1995,13,379-400.

[13]changnb,chenwc.predictionofpcdds/pcdfsemissionsfrommunicipalincineratorsbygeneticprogrammingandneuralnetworkmodeling[j].wastemanagement&research,2000,18(4)41-351.

[14]汤健,乔俊飞.基于选择性集成核学习算法的固废焚烧过程二噁英排放浓度软测量[j],化工学报,2019,70(02):696-706.(tangj,qiaojf.dioxinemissionconcentrationsoftmeasuringapproachofmunicipalsolidwasteincinerationbasedonselectiveensemblekernellearningalgorithm[j],journalofchemicalindustryandengineering(china),2019,70(02):696-706.)

[15]bunsans,chenwy,chenhw,chuangyh,grisdanurakn.modelingthedioxinemissionofamunicipalsolidwasteincineratorusingneuralnetworks[j].chemosphere,2013,92:258-264.

[16]肖晓东,卢加伟,海景,等.垃圾焚烧烟气中二噁英类浓度的支持向量回归预测[j].可再生能源,2017,35(8):1107-1114.(xiaoxd,lujw,haij.predictionofdioxinemissionsinfluegasfromwasteincinerationbasedonsupportvectorregression[j],renewableenergyresources,2017,35(8):1107-1114.)

[17]汤健,乔俊飞,郭子豪.基于潜在特征选择性集成建模的二噁英排放浓度软测量[j],自动化学报(在审).(tangj,qiaojf,guozh.softsensingofdioxinemissionconcentrationbasedonpotentialcharacteristicselectiveintegratedmodeling[j].actaautomaticasinica,intrial)

[18]hasnata,mollaau.featureselectionincancermicroarraydatausingmulti-objectivegeneticalgorithmcombinedwithcorrelationcoefficient[a].2016internationalconferenceonemergingtechnologicaltrends(icett)[c].2016:1-6.

[19]coelhof,bragaap,verleysenm.multi-objectivesemi-supervisedfeatureselectionandmodelselectionbasedonpearson’scorrelationcoefficient[a].iberoamericancongressonpatternrecognition.springer[c],berlin,heidelberg,2010:509-516.

[20]battitir.usingmutualinformationforselectingfeaturesinsupervisedneuralnetlearning[j].ieeetransactionsonneuralnetworks,1994,5(4):537-550.

[21]vergarajr,estévezpa.areviewoffeatureselectionmethodsbasedonmutualinformation[j].neuralcomputingandapplications,2014,24(1):175-186.

[22]jainak,duinrpw,maoj.statisticalpatternrecognition:areview[j].ieeetransactionsonpatternanalysisandmachineintelligence,2000,22(1):4-37.

[23]fleuretf.fastbinaryfeatureselectionwithconditionalmutualinformation[j].journalofmachinelearningresearch,2004,5:1531-1555.

[24]coelhof,bragaap,verleysenm.multi-objectivesemi-supervisedfeatureselectionandmodelselectionbasedonpearson′scorrelationcoefficient[j].lecturenotesincomputerscience,2010,6419:509-516.

[25]estévezpa,tesmerm,perezca,zuradajm.normalizedmutualinformationfeatureselection[j].ieeetransactionsonneuralnetworks,2009,20(2):189-201.

[26]amirif,yousefimmr,lucasc,shakerya,yazdanin.mutualinformation-basedfeatureselectionforintrusiondetectionsystems[j].journalofnetworkandcomputerapplications,34(2011)1184-1199.

[27]mohammadis,mirvazirih,ghazizadehahsaeem.multivariatecorrelationcoefficientandmutualinformation-basedfeatureselectioninintrusiondetection[j].informationsecurityjournalaglobalperspective,2017,26(5):229-239.

[28]pengh,longf,dingc.featureselectionbasedonmutualinformationcriteriaofmax-dependency,max-relevance,andmin-redundancy[j].ieeetransactionsonpatternanalysisandmachineintelligence,2005,27(8):1226-1238.

[29]汤健,田福庆,贾美英.基于频谱数据驱动的旋转机械设备负荷软测量[m].北京:国防工业出版社,2015.(tangj,tianfq,jiamy.softmeasurementofrotatingmachineryequipmentloadbasedonspectrumdatadrive[m].beijing:nationaldefenseindustrypress,2015.)

[30]tihonovan.solutionofincorrectlyformulatedproblemsandtheregularizationmethod[j].sovietmath.,1963,4:1035-1038.

[31]wolds,ruhea,woldh,dunniiiwj.thecollinearityprobleminlinearregression.thepartialleastsquares(pls)approachtogeneralizedinverses[j].siamjournalonscientificandstatisticalcomputing,1984,5(3):735-743.

[32]leardir,boggiar,terrilem.geneticalgorithmsasastrategyforfeatureselection[j].journalofchemometrics,1992,6(5):267-281.

[33]汤健,柴天佑,赵立杰,岳恒,郑秀萍,融合时频信息的磨矿过程磨机负荷软测量[j],控制理论与应用.2012,29(5):564-570.(tangj,chaity,zhaolj,yueh,zhengxp.softsensingmillloadingrindingprocessbytime/frequencyinformationfusion[j].controltheoryandapplications,2012,29(5):564-570.)

[34]bunsans,chenwy,chenhw,chuangyh,grisdanurakn.modelingthedioxinemissionofamunicipalsolidwasteincineratorusingneuralnetworks[j].chemosphere,2013,92:258-264.

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1