一种多区域空气质量健康指数融合的方法与流程

文档序号:26585804发布日期:2021-09-10 19:10阅读:402来源:国知局
一种多区域空气质量健康指数融合的方法与流程

1.本发明涉及健康监测技术领域,尤其是一种多区域空气质量健康指数融合的 方法。


背景技术:

2.为了了定量地、客观地评价空气质量,空气污染指数(api)和空气质量指数 (aqi)相继被提出。相比于api而而言,aqi采用的标准更严、污染物指标更多、 发布频次更高,其评价结果也将更加接近公众的真实感受。然而aqi的计算取决 于偏离参考标准的单一污染物,不不能反映多种空气污染物对健康的总体影响。


技术实现要素:

3.针对现有技术的不足,本发明提供一种能更加客观反映空气污染物对健康的 总体影响的多区域空气质量健康指数融合的方法。
4.本发明的技术方案为:
5.一种多区域空气质量健康指数融合的方法,它首先利用分布滞后非线性模型 对地区辖区内多个区域内的死亡或者发病人数分别构建区域aqhi,然后将各区 域内的平均死亡或者发病人数与人口基数的比值作为权重,进而得到模型的调整 系数,最终得到地区的总aqhi。
6.具体的,所述构建区域aqhi的方法包括:
7.步骤一,获取地区内各区域内的空气污染物浓度数据、气象数据和死亡或者 发病人数数据(例如医院非意外原因发病门诊发病记录);
8.步骤二,在控制时间、温度、湿度、星期几变量和节假日变量的情况下,针 对空气污染物构建模型
9.log[e(y)]=α+s(x;η)+s(time)+s(temp)+s(humidity)+dow+holidoy
[0010]
其中y代表第t天第j个区域死亡或者发病人数数据,βi为空气污染物t在 模型中的回归系数,代表某种空气污染物浓度每升高1μg/m3时某类人群死亡或 者发病人数的增加,s()为自然三次样条平滑函数,df为自由度,time作为时 间变量控制了季节和时间的影响,temp控制了温度的影响,humidity控制了湿 度的影响,dow星期几变量和holiday节假日变量控制了每周的周期性和特殊日 期对死亡或者发病人数的影响,通过s(x
ij
,t;η)来描述区域j的空气污染物i 对死亡或者发病人数的影响,这里其维度等于滞后空间和非 线性空间两交叉基的维度,它的相关性由v
x
·
v
y
的值w和相关的参数η表示,其 中交叉基函数这个区间代表暴露在过去7天 的历史空气污染物浓度下的累积效应;
[0011]
步骤三,计算aghi,计算区域j空气污染物i在第t天对门诊人群产生的累 积历史6天以及当天空气污染物的影响下的相对风险值rr
ijt
,将每种空气污染物 累积滞后效应对
应的每天的rr
ijt
值减去1得到每种空气污染物的超额风险值 (er
ijt
),公式为
[0012]
er
ijt
=rr
ijt
‑1[0013]
其中rr
ijt
为区域j的第i中空气污染物第t天的相对风险,er
ijt
为区域j第i 种空气污染物第t天的超额风险,区域j第t天的总超额风险值为
[0014]
er
jt
=σer
ijt

[0015]
然后计算区域j第t天的aqhi为
[0016][0017]
最后根据每个区域每天的aqhi计算地区融合的aqhi,区域j第t天死亡或 者发病人数为y
ji
,该区域人口数为n
j
,区域j第t天对应的系数为计 算全地区的总aqhi,公式为
[0018][0019]
进一步地,所述步骤三还包括地区总aqhi的有效性验证,通过以下两种方 式来检验;
[0020]
第一方式,选取某地区连续四年的空气污染物浓度数据、气象数据和死亡或 者发病人数数据构建模型来计算第五年的rr值,接着用构建好的模型计算第五 年的地区总aqhi,并将其作为自变量预测日死亡或者发病人数;
[0021]
第二方式,比较地区总aqhi与广泛使用的单双污染物模型构建的aqhi与 死亡或者发病人数的相关性。
[0022]
本发明的有益效果为:将非线性模型引入aqhi的构建中,减少或者去除部 分非线性相关因果数据的影响;通过融合的方式构建的aqhi(地区总aqhi)比 传统方式构建的aqhi与健康结局的相关性更强;本发明具有比传统技术更强的 实用性。
附图说明
[0023]
图1为广州市区域和整体的空气污染物箱线图;
[0024]
图2为广州市区域和整体的门诊各类病人箱线图;
[0025]
图3总非意外门诊aqhi箱线图;
[0026]
图4为融合aqhi与传统aqhi和各类门诊率的相关性图。
具体实施方式
[0027]
本实施例以广州市作为研究对象,以便对技术方案进行详细说明。
[0028]
数据介绍
[0029]
本文中使用的空气污染物浓度数据取自2014年2月18号

2018年12月31 号广州市51个监测站点的记录,其中空气污染物包括so2、co、pm2.5、o3和 no2。为了控制气象因素的影响,本研究使用了同一时期的每日平均温度和每日 平均湿度。研究中使用的门诊数据(死亡或者发病人数数据)是来源于2014年 2月18号

2018年12月31号广州市299家医院因
非意外原因发病门诊的 28820248个病人记录。
[0030]
对以上数据进行处理可得到两类数据,一类为广州市11个行政区域每天的 空气污染物、气象和门诊数据(11个区域分别为越秀区、荔湾区、海珠区、天 河区、白云区、黄埔区、番禺区、花都区、南沙区、增城区和从化区),另一类 为广州市每天的空气污染物、气象和门诊数据。本研究通过反距离权重插值法对 十一个区域进行了空气污染物浓度的插值,然后计算得到每个区域每天每种空气 污染物的平均浓度,再结合相应的各个区域日门诊数据和气象数据即形成区域日 门诊、污染物浓度和气象数据。相应的,也可得到广州市日门诊、污染物浓度和 气象数据。
[0031]
模型
[0032]
本文首先采用分布式滞后非线性模型(dlnm)来构建每个区的空气污染物 与因发病去门诊人数之间的关系。
[0033]
在控制时间、温度、湿度、星期几变量和节假日变量的情况下,针对空气污 染物构建的模型则为
[0034]
log[e(y
jt
)]=α+s(x
ij
,t;η)+s(time)+s(temp
jt
)+s(humidity
jt
)+dow +holiday (1)
[0035]
其中y_jt代表第t日第j个区域因发病而门诊的人数,β_i为污染物t在模型中的回归系 数,代表某种污染物浓度每升高1μg/m^3时某类人群门诊率的增加。s()为自然三次样条平滑 函数,df为自由度,这里time作为时间变量控制了季节和时间的影响,temp控制了温度的影 响,humidity控制了湿度的影响。本研究使用自然三次样条函数中的自由度来反映这些控制 变量的非线性程度。根据以往的研究,我们设定时间趋势为7个自由度/年(peng et al.,2005), 温度为6个自由度,湿度为3个自由度(wong et al.,2008)。另外星期几变量(dow)和节假 日变量(holiday)控制了每周的周期性和特殊日期对门诊人数的影响。这里通过s(x_ij,t;η) 来描述区域j的空气污染物i对门诊人数的影响,这里s(x,t;η)=w_(x,t)^tη,其维度等于滞后 空间和非线性空间两交叉基的维度。它的相关性是由v_x
·
v_y的值w和相关的参数η表示。 其中交叉基函数s(x,t)为这个区间代表暴露在过去七天的历史空气浓度 下的累积效应(gasparrini et al.,2012)。
[0036]
aqhi的计算
[0037]
计算区域j空气污染物i在第t天对门诊人群产生的累积历史六天及当天空 气污染物的影响下的相对风险值rr_ijt。最后将每种污染物累积滞后效应对应的 每天的rr_ijt值减去1得到每种污染物的超额风险值(er_ijt),公式如下
[0038]
er
ijt
=rr
ijt
‑1ꢀꢀ
(2)
[0039]
其中rr_ijt为区域j的第i种污染物第t天的相对风险,er_ijt为区域j第i 种污染物第t天的超额风险。区域j第t日的总超额风险值为
[0040]
er
jt
=∑er
ijt

ꢀꢀ
(3)
[0041]
然后计算区域j第t日的aqhi为
[0042][0043]
最后根据每个区域每天的aqhi计算广州市融合的aqhi。区域j第t天因发 病门诊
的人数为y_jt,该区域2018年的人口数为n_j,区域j第t天对应的系数 为c_jt=y_jt/n_j,计算全市的aqhi
[0044][0045]
aqhi有效性的验证
[0046]
通过以下两种方式来检验融合性方式构建的aqhi的有效性。第一种方式, 先在2014

2017年的数据上构建模型用来计算2018年的rr值。接着用构建好的 模型计算2018年广州市的aqhi,并将其作为自变量预测日门诊率。第二种方式 是比较用融合方式构建的aqhi与广泛使用的单双污染物模型构建的aqhi与门 诊率的相关性。
[0047]
广泛使用的构建aqhi的方法是假设空气污染物对门诊率的影响是线性的, 首先通过单污染物模型选择对门诊率有显著影响的污染物:
[0048][0049]
通过双污染物模型验证污染物的稳定性:
[0050][0051]
在双污染物模型里仍然对门诊率有显著影响的污染物被用来构建aqhi。它 们在单污染物模型里的系数被用来计算超额风险和aqhi。污染物i第t天的超额 风险的计算方式如下:
[0052]
er
it
=100
×
[exp(β
i
x
i
)

1],
ꢀꢀ
(8)
[0053]
第t天广州市总的超额风险即为er
t
=∑
i
er
it
。第t天广州市的aqhi即为 aqhi_t=10
×
(er_t)/(max(er_1,

,er_n))。通过单双污染物模型和广州市2014

2017年的数据 确定构建aqhi的污染物及对应的系数,并使用2018年的数据计算广州市的aqhi。通过构 建aqhi与门诊人数的广义加性模型,计算aqhi每升高一个iqr时对应的门诊率的风险的 增长率。增长率越高,aqhi与门诊率的相关性越强,说明构建的指标越好。
[0054]
p<0.05被认为在统计意义上是显著的。所有的统计分析都是在r软件里进行 的。
[0055]
结果
[0056]
aqhi的计算
[0057]
广州市2014

2018年11个区域和全市的空气污染物浓度、气象数据的描述性统计如表3

1 所示,图1为其箱线图,广州市pm_2.5,no_2,so_2,co和o_3的日平均浓度分别为6.24μ g/m_3、5.41μg/m_3、8.05μg/m_3、7.71μg/m_3、0.20mg/m_3。对11个区域来看,五种空 气污染物日浓度较低的区域为从化区分别为27.69μg/m_3、11.76μg/m_3、25.92μg/m_3、 104.70μg/m_3、0.68mg/m_3。结合表3

1可以看出,不同的污染物在不同区域间的分布是有 差异的:对pm_2.5来说,荔湾区的日均浓度最大,其数值为40.66μg/m_3,且波动也高于 其他区域;对so_2来说,南沙区的日均浓度最大,其数值为32.21μg/m_3,而波动幅度最 大的区域为花都区;对no_2来说,越秀区的日均浓度最大,其数值为58.25μg/m_3,波动 幅度最大的为荔湾区;对o_3来说,花都区的日均浓度最大,为110.90μg/m_3,波动最大 的为南沙
区;对co来说,日均浓度的最大的区域为越秀区,从化区的浓度在研究期间波动 最大。
[0058]
表3

1 2014

2018年广州市区域和整体空气污染物和气象数据基本情况
[0059][0060]
表格3

2和图2总结广州市在2014

2018年间全市以及11个区域的各类门诊人数的相关 信息。由表可知,广州市在研究期间的日均非意外门诊人数为16218人,其中最小值为834 人,最大值为35400人。在不同疾病类型中,海珠区的总非意外疾病、心血管疾病、急性鼻 咽炎、特发性高血压、以及非意外门诊中的65岁以上人群、男性人群、女性人群的日均门诊 人数在11区域中位列第一,番禺区的呼吸系统疾病和非意外门诊中的0

6岁人群的日均门诊 人数在11个区域中位列第一。非意外门诊下细分的类别的分布与非意外门诊整体的分布是类 似的;在总非意外门诊病人中,老人的人数比儿童的人数多,而男性和女性的门诊人数相差 不大。
[0061]
表3

2 2014

2018年广州市区域和整体门诊数据基本情况
[0062][0063]
本文使用广州市门诊数据中的总非意外门诊人数,以及空气污染物数据、气 象数据等变量,通过dlnm模型计算11个区域的每日aqhi,再以区域人口数据 构建各个区域aqhi的权重,然后构建广州市的融合aqhi。用同样的方法计算了 不同疾病(心血管系统疾病、呼吸系统疾病、急性鼻咽炎、特发性高血压等)、 不同年龄段(0

6岁、65岁以上)和不同性别(男性、女性)的分区域aqhi和 融合aqhi。
[0064]
对以上计算融合aqhi,参照2018年stieb的方法进行区间统计,以了解广 州市在2018年aqhi的分布(表3

3)。由表可知,2018年间广州市每天的aqhi 有96%以上的天数小于3(即“低健康风险”),1.1%~3.3%的aqhi在4到6之间 (即“中等健康风险”),不存在7

10(“高健康风险”)以及大于10(“极高健康 风险”)的天数。
[0065]
表3

3 2018年基于门诊各类疾病计算的融合aqhi的分布
[0066] [0,3][4,6][7,10]>10总非意外门诊0.96710.03290.00000.0000心血管系统疾病0.98630.01370.00000.0000呼吸系统疾病0.96990.03010.00000.0000急性量咽炎0.99180.00820.00000.0000特发性高血压0.98900.01100.00000.0000非意外疾病0

6岁0.98080.01920.00000.0000非意外疾病65岁以上0.97810.02190.00000.0000非意外疾病男性0.96710.03290.00000.0000非意外疾病女性0.96990.03010.00000.0000
[0067]
在了解了门诊中不同健康结局融合aqhi的分布后,我们也计算了它们的相 关系数(见表3

4),可以看出不同健康结局之间的aqhi的相关性较高,位于 0.85

1.00之间;特别地,门诊各细类的aqhi和总非意外门诊的aqhi的相关系 数更是均大于0.95,表明本文构建的总非意外门诊的aqhi已经较全面的涵盖了 门诊的风险率变动信息,不需要再对非意外门诊数据进行细分。其中,非意外门 诊0

6岁人群数据构建的融合aqhi,和特发性高血压
构建的融合aqhi之间的相 关性仅为0.85,属于最小的相关系数,这在一定程度上可以说明0

6岁的门诊人 群与特发性高血压疾病的关系相对较弱一些。
[0068]
表3

4 2018年门诊各类疾病构建的融合aqhi之间的相关系数
[0069][0070]
总的aqhi与分指数aqhi的比较
[0071]
上节中我们计算了广州市11个区域的aqhi,并基于区域aqhi构建融合aqhi作为广 州市整体的aqhi,本节中将对以上aqhi的有效性进行验证,具体方法为以不同健康结局 的门诊率为因变量,aqhi和气象、节假日等因素作为自变量拟合门诊率。然后基于拟合的 模型计算各类aqhi每增长一个iqr,对应的门诊率的增长。
[0072]
从区域来看,花都区和白云区的融合aqhi每增加一个iqr对应的门诊率的 增长相比其他几个区域较大,说明这两个区域空气污染物浓度变化对门诊率的产 生影响较大;从门诊整体来看,非意外门诊变化率增长幅度最大的前三个区域为 花都区、白云区、黄埔区;从不同疾病类型来看,心血管系统疾病及其下的特发 性高血压的门诊率的增长相比于呼吸系统疾病及其下的急性鼻咽炎的增加较高; 从性别来看,广州市11区域和全市的非意外门诊率在女性门诊人群上的增长率 略微高于男性人群的增长率,但相差不大。
[0073]
表3

4 2018年广州市各类门诊构建的区域和全市aqhi每增加一个iqr所对 应的门诊率增长
[0074][0075]
融合aqhi和传统aqhi、aqi的比较
[0076]
2018年广州市的传统线性aqhi和融合aqhi的log rr值如表3

5所示,从 表可以看出融合aqhi的一个iqr的增加所对应的门诊率的增长是最高的,说明 本文构建的融合aqhi均比线性aqhi和aqi的有效性高。在门诊各类疾病中, 急性鼻咽炎构建的融合aqhi在增加一个iqr时对应的logrr值最大,为0.0756, 说明急性鼻咽炎构建的aqhi对广州市门诊率的影响最显著;对按年龄分组的门 诊人群来看,0

6岁非意外门诊构建的aqhi对门诊率的影响比65岁以上更大; 对按照性别分组的门诊人群来看,男性和女性构建的aqhi对门诊率的影响相差 无几,说明污染物对广州市门诊率的影响在性别上不具有明显的差异性。
[0077]
表3

5 2018年广州市融合aqhi、线性aqhi和aqi每增加一个iqr对应的门 诊率的增长
[0078]
门诊类型融合aqhi线性aqhiaqi总非意外门诊0.0633(0.0625

0.0641)0.0431(0.0422

0.044)0.0373(0.0363

0.0383)心血管系统疾病0.0631(0.0613

0.0649)0.0217(0.0196

0.0239)0.0449(0.0427

0.0472)
呼吸系统疾病0.074(0.0723

0.0758)0.046(0.044

0.0481)0.0461(0.0437

0.0484)急性鼻咽炎0.0756(0.07240.0788)0.0556(0.0518

0.0594)0.0503(0.0455

0.0551)特发性高血压0.0617(0.0594

0.0639)0.0147(0.0122

0.0173)0.0477(0.0448

0.0506)非意外疾病0

6岁0.0716(0.0683

0.0748)0.0506(0.047

0.0541)0.0437(0.0398

0.0476)非意外疾病65岁以上0.062(0.0607

0.0634)0.0436(0.0419

0.0452)0.0416(0.0398

0.0433)非意外疾病男性0.06(0.0587

0.0612)0.0315(0.0301

0.0328)0.0366(0.0351

0.0381)非意外疾病女性0.0677(0.0667

0.0688)0.0445(0.0432

0.0458)0.0379(0.0365

0.0393)
[0079]
表3

6中totaiaqhi一列为使用总非意外门诊构建的aqhi、污染物和气象数 据等为自变量,通过glm模型拟合不同类型的门诊率,然后计算出当总非意外 门诊构建的aqhi增加一个iqr时对应类型门诊率的增长;specificaqhi为门诊 各类型aqhi自身增加一个iqr时对应门诊率的增长。由表可知,对于不同类型 门诊人群来说,无论是总非意外门诊数据构建的aqhi还是自身门诊数据构建的 aqhi,在对应aqhi增加一个iqr时门诊率的增长幅度非常接近,这说明总非意 外门诊的aqhi和特定aqhi在分疾病、年龄、性别的每日门诊率的关联是很相 似的,因此不需要构建细类的aqhi。
[0080]
表3

6 2018年广州市非意外门诊整体aqhi和特定aqhi每增加一个iqr对 应的门诊率的增长
[0081]
门诊类型total aqhispecific aqhis总非意外门诊0.0633(0.0625

0.0641)

心血管系统疾病0.064(0.0622

0.0658)0.0631(0.0613

0.0649)呼吸系统疾病0.0704(0.0685

0.0722)0.074(0.0723

0.0758)急性鼻咽炎0.0736(0.0701

0.0772)0.0756(0.0724

0.0788)特发性高血压0.0607(0.0584

0.063)0.0617(0.0594

0.0639)非意外疾病0

6岁0.0524(0.0493

0.0555)0.0716(0.0683

0.0748)非意外疾病65岁以上0.0663(0.0649

0.0677)0.062(0.0607

0.0634)非意外疾病男性0.0601(0.0589

0.0613)0.06(0.0587

0.0612)非意外疾病女性0.0659(0.0648

0.0669)0.0677(0.0667

0.0688)
[0082]
讨论
[0083]
每个区域构建各自的aqhi是必要的。区域与区域之间的空气污染物的浓度 差别是较大的。比如说从化区的pm_2.5和no_2的浓度都较低。而荔湾区的 pm_2.5和no_2浓度较高。空气污染物浓度的差异造成了各区域的aqi的差异, 用统一的标准计算所有区域的指标可能不太合理。各区之间的门诊人数也存在差 异,空气质量和门诊人数的差别会造成构建aqhi时的差异,不同区域之间的空 气质量差异对人体健康的影响不同,在同一标准下构建的不同区域的aqhi可横 向比较,参考图3。由于每个区域的aqhi均由分布式滞后非线性模型构建并且 用同样的最大值进行调整,所以每个区域的aqhi是横向可比较的。(比如某某 区和某某区的aqhi就明显比较高,表明这几个区域空气污染增大了该区域的门 诊率。某某区和某某区的aqhi比较低,这几个区域的空气污染对门诊率并无什 么影响。)
[0084]
通过每个区域的aqhi构建融合的aqhi比广泛使用的方法直接对全市构建 aqhi能更好地反映整个城市的空气质量对人体健康的影响。由于广州市的区域 和区域之间的空气质量和门诊率存在较大的差异性,先计算广州市各区域的 aqhi,再融合成广州市的aqhi可以提高aqhi的有效性,即aqhi与门诊率的相 关性。每个区的aqhi与各区的门诊率的相关
性也不一样,比如南沙区的aqhi 与对应区域的总非意外门诊率相关性特别低,为3.1%(2.52%

3.69%),而花都区 的aqhi与对应区域的总非意外门诊率相关性特别高,达到了17.82% (17.07%

18.56%)。融合后的广州市的aqhi升高一个iqr时,对应的总非意外 门诊率升高6.33%(6.25%

6.41%)。而由glm模型直接对广州市计算出来的aqhi 升高一个iqr时,对应的总发病门诊率升高4.31%(4.22%

4.4%)。
[0085]
本研究的另一个优势是通过构建过去七天空气污染物对门诊率非线性的影 响来计算rr值。传统构建aqhi的方法是假设空气污染物对门诊率的影响是线 性的基础上,从过去三天中找到使得门诊率增加最大的一天,从而构建广义加性 模型来计算er值(li et al.2017,du et al.2020)。已有多篇论文描述了空气污染物 对人体健康的影响是非线性的(masound et al.2016,zhao et al.2019,bae et al. 2015)。因此本文采用非线性的方法,并且考虑过去一段时间空气污染物对人体 健康的累积效应而不是某日滞后的效应来构建aqhi。图4反映了融合的aqhi 和传统方法计算的aqhi与各类门诊率的暴露

反应浓度曲线。理论上来说,用非 线性和考虑了累积滞后效应的模型构建的aqhi比传统的方式效果更好。但是每 个城市构建aqhi的方法应根据当地空气污染物对人体健康造成的影响是否是线 性的来决定。这种通过dlnm模型以及融合的方法构建aqhi的方法并未在大量 不同的城市尝试,暂时无法确定这种融合方法计算城市或者省份甚至全国的 aqhi是否效果总是好的。对总的非意外门诊人数构建的aqhi与分类别的门诊人 数构建的aqhi的相关性以及分布进行讨论,看总的发病门诊人数是否能较好地 反映其他类别的门诊率。
[0086]
(对总的发病门诊人数构建的aqhi与分类别的门诊人数构建的aqhi的相 关性以及分布进行讨论,看总的发病门诊人数是否能较好地反映其他类别的门诊 率。)从表
‑‑‑‑‑‑
可以看出总非意外门诊数据构建的aqhi与不同疾病、不同性别、 不同年龄段的门诊率的相关性和用特定疾病、性别和年龄段的门诊数据构建的 aqhi与对应的门诊率的相关性相差不大。当总非意外门诊数据构建的aqhi增长 一个iqr时,不同疾病、不同性别、不同年龄段的门诊人数的增长率在 5.24%

7.36%。总体来说,总非意外门诊数据构建的aqhi与特定疾病、性别和年 龄段的数据构建的aqhi相关性较高,能较好地反映不同性别的人群或者高风险 人群的门诊率。因此不必要构建不同的分指数。
[0087]
结论
[0088]
我们用分布式滞后非线性模型构建的模型来构建广州市十一个区域的 aqhi,再通过融合的方法构建广州市整个城市2016

2018年的aqhi。通过融合 的方式构建的aqhi比传统的方式构建的aqhi与广州市的各类门诊率的相关性 更强。
[0089]
上述实施例和说明书中描述的只是说明本发明的原理和最佳实施例,在不脱 离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进 都落入要求保护的本发明范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1