基于朴素贝叶斯源识别的非负约束因子的污染源解析方法

文档序号:9432821阅读:781来源:国知局
基于朴素贝叶斯源识别的非负约束因子的污染源解析方法
【技术领域】
[0001] 本发明属于水体中污染源解析的方法,具体设及一种基于朴素贝叶斯源识别的非 负约束因子的污染源解析方法。
【背景技术】
[000引源解析(sourceappcxrtionment)是研究污染源对周围环境污染的影响和作用的 一种方法。当前针对污染源解析的研究很少,主要的污染源解析方法就是通过对源谱和因 子荷载的图形观察实现定性比较,或通过计算源谱和因子荷载的偏差实现半定量比较。运 些方法多没有考虑污染源谱的非线性特征,解析结果不能真实反映因子荷载与污染源谱的 对应关系。
[0003] 多环芳控(PolycyclicAromaticHy化ocarbon,PAHs)污染源是指由两个W上的 苯环W线性排列、弯接或簇聚的方式构成的一类有机化合物,是一类广泛存在于环境中的 持久性有机污染物。通常我们所说的多环芳控污染源是指PAHs中优先控制的16种,分别是 糞、二氨起、起、巧、菲、蔥、巧蔥、巧、苯并(a)蔥、屈、苯并化)巧蔥、苯并似巧蔥、苯并(a) 巧、巧并(l,2,3-ed)巧、二苯并(a,h)蔥、苯并(曲i)巧。
[0004] 由于多环芳控具有强致癌特性,在水体中即使微量存在,通过迁移转化,也会严重 威胁水体生物和人类的健康。而只有对水体中多环芳控的来源进行明确的分析才能制定有 效的治理方案,因此水体中多环芳控污染源解析工作非常重要。
[0005] 传统的水体中污染物源解析技术只能大致给出对环境受体贡献较大的污染源类 另IJ,而不能给出具体排放源对受体贡献的大小,缺乏对污染防治工作的实际指导意义。

【发明内容】

[0006] 本发明的目的是克服传统水体中污染源解析技术的缺点,针对水体中多环芳控污 染,提供一种基于朴素贝叶斯源识别的非负约束因子的污染源解析方法。
[0007] 为了实现本发明所述目的,发明人提供了W下技术方案。
[0008] 基于朴素贝叶斯源识别的非负约束因子的污染源解析方法,包括W下操作步骤: 步骤一,确定水体多环芳控污染源调查区域。
[0009] 根据水流域沿线城市总体规划W及工业产业布局,选择排放源复杂、多环芳控污 染严重的区域作为调查区域。
[0010] 步骤二,针对确定的多环芳控污染源调查区域,收集基础资料,进行实地调查,确 定要进一步调查的污染源行业企业名单;检测污染水体中的多环芳控,建立多环芳控污染 信息数据集。
[0011] 基础资料包括群众投诉、污染源普查数据库、污染源档案、环境监测资料、环评报 告。收集基础资料的目的是为了掌握调查区域内多环芳控污染行业企业分布,从中筛选出 具有代表性、影响较为突出的行业企业(比如石化、焦炉等易产生多环芳控污染的工业),确 定要进一步调查的污染源行业企业名单。
[0012] 对重点污染源进行实地调查(包括布点、采样和分析测试)。根据污染源的生产 工艺、生产流程、污染物的产生机制W及排放形式等因素,参照污染源调查规范,确定布点 和采样方法。监测指标包括成分浓度指标。
[0013] 步骤=,分析不同情况下,调查区域内的污染源行业企业对环境的影响程度。
[0014] 不同情况包括:①单个污染源位于环境敏感点;②多个不同类型的污染源位于环 境敏感点;③多个相同类型的污染源位于环境敏感点。第①种情况下,根据污染源与环境敏 感点的相对位置关系,制定相应的监测方案,分析污染源对环境敏感点的影响程度。第②种 情况下,根据各污染源的特征污染物质进行分析判别。第③种情况比较复杂,需对污染源的 源强进行测试,并结合数学模型判定各污染源的影响大小。
[0015] 步骤四,建立各类排放源中多环芳控污染物的指纹图谱。
[0016] 各类排放源是指柴油机、汽油机、工业燃煤、民用燃煤、交通隧道、木材燃烧和焦炉 源。
[0017] 步骤五,采用Matl油软件编程,将步骤四得到的指纹图谱转化为计算机能够接受 的数量化矩阵,对数据进行标准化处理,消除量纲影响,得到污染源受体样本。
[0018] 步骤六,应用朴素贝叶斯源方法对污染源受体样本进行训练,包括: 第一步,将未知参数0视为随机变量(或向量),当0已知量时,样本X的联合分布 密度|1括巧就看成X对0的条件密度,记为P(X苗); 第二步,根据参数0的已知信息来确定先验分布II議; 第=步,利用条件分布密度P姑参和先验分布議麵,求出X与0的联合分布埼和样 本X的分布議誦,进而求得后验分布密度P巧邊; 第四步,利用后验概率密度iill作出对0的推断(估计0或对0作检验),进行分 类训练; 第五步,通过分类训练得到基于朴素贝叶斯子分类模型。
[0019] 步骤屯,应用非负约束因子分析方法进行计算,包括: 第一步,将监测点采样得到的多环芳控的检测数据进行标准化处理; 为解决不同污染物浓度的量纲不匹配,消除分析过程的偏差,需要对样品数据进行标 准化处理,目前主要有均值标准化方法和指数标准化方法两种。
[0020] 均值标准化: 投'二D/D 指数标准化:
鬆一一标准化后的数据矩阵; D-样品数据; P-一样品中某污染物的采样平均值; 辕銳i一一样品中某污染物浓度的最小值;ii*一一样品中某污染物浓度的最大值。
[0021] 第二步,提取主成分因子数; 主成分因子数的确定是源解析的重要内容,它主要由特征值、累计方差贡献率、决定系 数和化ter函数确定。
[0022] ii特征值大于1的所有因子作为主因子。
[0023]i|累计方差贡献率CV值大于85%。
[0024]
P为显著性因子个数;m为污染物个数;A为特征值。
[00巧] ''富决定系数大于0.9。
[0026]
公式中if"为对应于第j个污染物的决定系数;n为显著性因子选取个数;|||:为第i个 样品中第j项污染物的值;曜;巧3运算后第i个样品中第j项污染物的值;胃为所有样品中 第j项污染物的平均值。
[0027]譲;;Enter函数小于 0. 1。
[0028]
其中,替为化ter函数值;r,m,n分别为样品、污染物和源的个数,其余符号的含义同上。 龜的值理论上可W从0到无穷大,一般认为小于0. 1结果良好。
[002引第立步,因子分解; 显著性因子包括:特征值、特征向量、因子荷载矩阵和因子得分矩阵。为方便起见,标准 化后的样品数据矩阵仍用D表示。
[0030]
D一一标准化后的数据矩阵; --矩阵D的转置矩阵; 另Z的特征值矩阵为A,特征向量矩阵为B,因为特征向量矩阵是正交矩阵,则I:鮮楽i;;,I为单位矩阵。矩阵M可W表示为乃二best 因子荷载矩阵C和因子得分矩阵E可由W下公式得出追心:擁嫁
因子载荷矩阵c对应主要污染源的成分谱,因子得分矩阵E对应主要污染源的贡献率。
[0031] 第四步,非负约束因子旋转。
[0032] 将因子荷载矩阵C和因子得分矩阵E通过下式进行非负约束斜交旋转,T为转换 矩阵。
[0033]
r是将因子得分矩阵E中的负值换为0值后所得到的矩阵,然后将矩阵E和C进行如 下旋转:
同理,另一个转换矩阵N可根据旋转后的因子荷载矩阵挺计算得到:
其中接'是把旋转后的因子荷载矩阵變冲的负值转换为0值后得到的矩阵。接謹贈根据 下式继续进行非负旋转:
由上述过程迭代多次,直到因子荷载中的负值的平方和小于某设定值C=0.0001,迭代 过程终止,最终得到因子荷载矩阵C和因子得分矩阵E。
[0034] 步骤八,利用训练好的分类模型针对各高因子得分的主要污染源因子实现因子荷 载的污染源贡献率的计算,实现多环芳控污染物的源解析。
[0035] 本发明所述所述多环芳控污染物是指美国国家环保总局提出的优先控制的16种 多环芳控污染物。即糞、二氨起、起、巧、菲、蔥、巧蔥、巧、苯并(a)蔥、屈、苯并化)巧蔥、苯 并化)巧蔥、苯并(a)巧、巧并(l,2,3-ed)巧、二苯并(a,h)蔥、苯并(曲i)巧。
[0036] 本发明的的优点如下: (1)全面掲示了水中多环芳控源排放组成特征,并筛选出能够指示污染来源的特征标 识物,克服了现有技术不能给出具体排放源对受体贡献大小的缺陷。
[0037] (2)能够快速、准确的追溯水体中多环芳控污染物的来源,并量化各污染源的贡献 率,实用性强,有广泛的推广应用价值。
[0038] (3)能够为制定流域多环芳控污染控制对策及流域水环境质量改善提供技术支 持。环境管理部口面对水多环芳控污染问题时,可W应用本发明所述方法,迅速识别污染 源,从而进行有污染防控,为环境管理部口应对多环芳控污染事故、控制污染风险提供了可 靠的技术保障。
【附图说明】
[0039] 图1为本发明所述污染源解析方法的流程图。
[0040] 图2-9为实施例中测试数据
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1