本发明涉及一种热带气旋分类方法。特别是涉及一种能客观表征TCs特征属性的基于特征因子的热带气旋客观分类方法。
背景技术:
热带气旋(tropical cyclones,TCs)是一种生成于热带洋面上强大的气旋性漩涡,是全球发生频率最高的气象灾害之一,其发生期间往往伴随着强风、暴雨、风暴潮,甚至引发滑坡、泥石流等次生灾害,给人类的生命及财产安全造成巨大威胁。
TCs分类是获得TCs特征变化规律、评估TCs灾害的重要途径。Nakamura等(2009)在研究北大西洋TCs特征变化规律时采用了质量矩法,该方法将TCs的路径视为空间上的非闭合曲线,以曲线上的风速为权重,计算曲线的质心(径、纬度坐标)及三个协方差(径、纬向及对角线方向),将这5个参数作为TCs的表征参数;然后调整各表征参数权重,利用k均值聚类算法对TCs进行分类,分析得到各类TCs在生命史、生成位置、强度、路径形状等不同特征属性上的差异与联系。
质量矩法所采用的TCs表征参数,主要考虑TCs的路径形状及风速,而生命史、强度、能量等信息并未用于表征TCs,因此,TCs的量化存在一定的局限性;在以风速为权重计算TCs的5个表征参数时,不同学者所采用的权值存在差异,如Nakamura等(2009)以风速为权重,郑颖青等(2013)以风速的均方根为权重,权值的取值缺乏严格的理论依据,TCs的量化存在一定的主观性。因此,有必要提出客观表征TCs特征属性的指标,使TCs的分类结果能更好地反映TCs的特征变化规律,为TCs灾害的防御工作提供技术信息。
技术实现要素:
本发明所要解决的技术问题是,提供一种能更合理、客观地反映TCs特征的变化规律,为TCs灾害防御工作提供技术支持的基于特征因子的热带气旋客观分类方法。
本发明所采用的技术方案:一种基于特征因子的热带气旋客观分类方法,包括如下步骤:
1)基于热带气旋的历史数据,计算热带气旋的物理指标,实现对热带气旋的客观量化;
2)对热带气旋的物理指标做标准化处理,并比选出用以表征热带气旋的特征因子;
3)将各特征因子乘以权重指数,形成聚类数据集;
4)初始化聚类中心,利用聚类算法对热带气旋进行聚类,得到分类结果。
2.根据权利要求1所述的一种基于特征因子的热带气旋客观分类方法,其特征在于,步骤1)中所述的热带气旋的历史数据,包括年份、编号、等级、每6小时的经纬度位置、2分钟底层近中心平均最大风速及中心最低气压。
步骤1)中所述的计算热带气旋的物理指标如下:
(1)生命史:指TCs生成至消散的历时,单位d;
(2)路径长度:指TCs生成至消散经过的路程长度,单位km;
(3)位移:指TCs生成至消散的位移长度,单位km;
(4)路径走向:指TCs的位移(生成位置指向消散位置)与赤道东西向的夹角,单位°;
(5)曲直比:指TCs路径长度与TCs位移长度的比值,为无量纲数值;
(6)累计偏转角:指TCs各定位时次路径发生偏转的角度之和,单位°;
(7)最大偏转角:指TCs各定位时次路径发生最大偏转的角度,单位°;
(8)平均偏转角:指TCs各定位时次路径平均发生偏转的角度,单位°;
(9)强度:指TCs在其生命史内出现的最高风速,单位m·s-1;
(10)风速增速时间:指TCs风速持续增高的时间,单位h;
(11)风速增速速率:指TCs风速持续增高的速率,单位m·(s·h)-1;
(12)风速减速时间:指TCs风速持续降低的时间,单位h;
(13)风速减速速率:指TCs风速持续降低的速率,单位m·(s·h)-1;
(14)平均移动速度:指TCs的路径长度与生命史的比值,单位:km·h-1;
(15)能量耗散指数:Power Dissipation Index,简称PDI,是综合反映TCs强度、频次及生命史的指标,由Emanuel(2005)提出,数学表达式为
单位m3·s-2,其中T为TCs的生命史,v为TCs路径上的定位风速,单位m·s-1。
步骤2)中所述的标准化处理方法为z-score标准化方法。
步骤2)中所述的比选,是指根据各物理指标间的相关系数,确定作为特征因子的物理指标。
步骤2)中所述的特征因子是指表征热带气旋特征属性的物理指标。
步骤4)中所述的初始化聚类中心,是以随机选取的方式从步骤3)形成的聚类数据集中产生初始聚类中心。
步骤4)中所述的聚类算法为k均值聚类算法,具体为:
(1)以欧式距离作为相似度判定准则,将数据对象划归到相似度最高的类别中,并计算目标函数值;
(2)重复修正聚类中心与目标函数值,直至目标函数收敛,得到分类结果。
本发明的一种基于特征因子的热带气旋客观分类方法,以TCs的物理指标作为表征TCs的特征因子,更全面、客观地刻画TCs的特征属性;基于TCs的特征因子,利用聚类算法对TCs进行聚类,得到的分类结果可直接反映不同类别TCs的关联与差异,客观反映TCs特征变化规律,为TCs的预警及灾害的防御工作提供决策支持。
附图说明
图1是本发明一种基于特征因子的热带气旋客观分类方法的流程图;
图2是S负值个数及S平均值随分类数K的变化情况;
图3a是A类TCs路径图;
图3b是B类TCs路径图;
图3c是C类TCs路径图;
图3d是D类TCs路径图;
图3e是E类TCs路径图;
图3f是全部TCs路径图;
图4a是各类及全部TCs的生命史分布情况;
图4b是各类及全部TCs的强度分布情况;
图4c是各类及全部TCs的PDI分布情况。
具体实施方式
下面结合实施例和附图对本发明的一种基于特征因子的热带气旋客观分类方法做出详细说明。
如图1所示,本发明的一种基于特征因子的热带气旋客观分类方法,包括如下步骤,
1)基于热带气旋的历史数据,计算热带气旋的物理指标,实现对热带气旋的客观量化。
所述的热带气旋的历史数据,包括热带气旋的年份、编号、等级、每6小时的经纬度位置、2分钟底层近中心平均最大风速及中心最低气压。
所述的计算热带气旋的物理指标如下:
(1)生命史:指TCs生成至消散的历时,单位d;
(2)路径长度:指TCs生成至消散经过的路程长度,单位km;
(3)位移:指TCs生成至消散的位移长度,单位km;
(4)路径走向:指TCs的位移(生成位置指向消散位置)与赤道东西向的夹角,单位°;
(5)曲直比:指TCs路径长度与TCs位移长度的比值,为无量纲数值;
(6)累计偏转角:指TCs各定位时次路径发生偏转的角度之和,单位°;
(7)最大偏转角:指TCs各定位时次路径发生最大偏转的角度,单位°;
(8)平均偏转角:指TCs各定位时次路径平均发生偏转的角度,单位°;
(9)强度:指TCs在其生命史内出现的最高风速,单位m·s-1;
(10)风速增速时间:指TCs风速持续增高的时间,单位h;
(11)风速增速速率:指TCs风速持续增高的速率,单位m·(s·h)-1;
(12)风速减速时间:指TCs风速持续降低的时间,单位h;
(13)风速减速速率:指TCs风速持续降低的速率,单位m·(s·h)-1;
(14)平均移动速度:指TCs的路径长度与生命史的比值,单位:km·h-1;
(15)能量耗散指数:Power Dissipation Index,简称PDI,是综合反映TCs强度、频次及生命史的指标,由Emanuel(2005)提出,数学表达式为
单位m3·s-2,其中T为TCs的生命史,v为TCs路径上的定位风速,单位m·s-1。
2)对热带气旋的物理指标做标准化处理,并比选出用以表征热带气旋的特征因子;
所述的标准化处理方法为z-score标准化方法。
所述的比选,是指根据各物理指标间的相关系数,确定作为特征因子的物理指标。
所述的特征因子是指表征热带气旋主要特征属性的物理指标。
3)将各特征因子乘以权重指数,形成聚类数据集;
4)初始化聚类中心,利用聚类算法对热带气旋进行聚类,得到分类结果。
所述的初始化聚类中心,是以随机选取的方式从步骤3)形成的聚类数据集中产生初始聚类中心。
所述聚类算法为k均值聚类算法,算法的实施步骤与公知无异,具体为:
(1)欧式距离作为相似度判定准则,将数据对象划归到相似度最高的类别中,并计算目标函数值;
(2)重复修正聚类中心与目标函数值,直至目标函数收敛,得到分类结果。
下面给出具体实例:
本实例中,热带气旋(tropical cyclones,TCs)数据来源于中国气象局热带气旋资料中心(http://tcdata.typhoon.gov.cn/),包括1949-2013年西北太平洋海域(含南海)TCs的年份、编号、等级、每6小时的经纬度位置、2分钟底层近中心平均最大风速(MSW)及中心最低气压,选用MSW≥10.8m·s-1(TCs强度达热带低压及以上)、生命史≥24h的2079个TCs作为研究对象。
步骤1:基于热带气旋的历史数据,计算热带气旋的物理指标,实现对热带气旋的客观量化。
所述的热带气旋的物理指标,包括热带气旋的生命史、路径长度、位移、路径走向、曲直比、累计偏转角、最大偏转角、平均偏转角、强度、风速增速时间、风速增速速率、风速减速时间、风速减速速率、平均移动速度、能量耗散指数。
本实例中,以MSW首次达10.8m·s-1时定义TCs生成;MSW末次低于10.8m·s-1时定义TCs消散,各物理指标的定义及计算如下:
(1)生命史:指TCs生成至消散的历时,单位d;
(2)路径长度:指TCs生成至消散经过的路程长度,单位km;
(3)位移:指TCs生成至消散的位移长度,单位km;
(4)路径走向:指TCs的位移(生成位置指向消散位置)与赤道东西向的夹角,单位°;
(5)曲直比:指TCs路径长度与TCs位移长度的比值,为无量纲数值;
(6)累计偏转角:指TCs各定位时次路径发生偏转的角度之和,单位°;
(7)最大偏转角:指TCs各定位时次路径发生最大偏转的角度,单位°;
(8)平均偏转角:指TCs各定位时次路径平均发生偏转的角度,单位°;
(9)强度:指TCs在其生命史内出现的最高风速,单位m·s-1;
(10)风速增速时间:指TCs风速持续增高的时间,单位h;
(11)风速增速速率:指TCs风速持续增高的速率,单位m·(s·h)-1;
(12)风速减速时间:指TCs风速持续降低的时间,单位h;
(13)风速减速速率:指TCs风速持续降低的速率,单位m·(s·h)-1;
(14)平均移动速度:指TCs的路径长度与生命史的比值,单位:km·h-1;
(15)能量耗散指数:Power Dissipation Index,简称PDI,是综合反映TCs强度、频次及生命史的指标,由Emanuel(2005)提出,数学表达式为
单位m3·s-2,其中T为TCs的生命史,v为TCs路径上的定位风速,单位m·s-1。
步骤2:对热带气旋的物理指标做标准化处理,比选出用以表征热带气旋的特征因子。
所述标准化处理方法为z-score标准化方法。
所述的物理指标的比选,是指根据各物理指标间的相关系数,确定作为特征因子的物理指标。所述的特征因子是指表征热带气旋主要特征属性的物理指标。
TCs各物理指标间的相关系数如表1所示。TCs的生命史与路径长度间呈高度相关,但与平均移动速度呈微相关,说明TCs的移动速度并无明显差异;TCs路径的累计偏转角与最大偏转角、平均偏转角间分别呈显著相关、实相关,将累计偏转角作为特征因子;TCs的路径长度与位移呈现高度相关,可用曲直比来综合反映二者间关系,将曲直比作为特征因子;TCs的生命史与风速增速时间、风速减速时间呈显著相关,将生命史作为特征因子;TCs的强度与风速增速速率、风速减速速率呈显著相关,将TCs的强度作为特征因子;TCs的路径走向、PDI与其余物理指标间的相关性较弱,但二者分别反映TCs的路径空间方位与能量特征,将二者作为特征因子。生命史、累积偏转角、曲直比、路径走向、强度、PDI客观地反映了TCs在时间、路径形状、空间方位、强度、能量方面的特征属性。
步骤3:将各特征因子乘以权重指数,形成聚类数据集。
本实例为提高各类TCs在空间方位这一特征属性上的区分度,增大路径走向这一特征因子对于TCs聚类过程的重要程度,将其权重设置为2/7,其余特征因子采用均一权重1/7。至此形成包含2079个数据对象的聚类数据集。
步骤4:初始化聚类中心,利用聚类算法对热带气旋进行聚类,得到分类结果。
所述的初始化聚类中心,是以随机选取的方式从步骤3形成的聚类数据集中产生初始聚类中心。
所述的聚类算法为k均值聚类算法,算法实施步骤与公知无异,具体为:
(a)以欧式距离作为相似度判定准则,将数据对象划归到相似度最高的类别中,并计算目标函数值;
(b)重复修正聚类中心与目标函数值,直至目标函数收敛,得到分类结果。
分类数借助“轮廓值”确定,“轮廓值”的数学表达式为:
式中,αi、βi分别表示第i个数据对象与类内、类间数据对象的平均距离,n表示数据对象的数量。S均值及负值个数与聚类数K的关系曲线如附图2所示,S均值越大、负值个数越少,则说明聚类的效果越理想。本实例中,当K=5时,分类结果最优。各类及全部TCs的路径特征如图3a~图3f所示,各类及全部TCs的生命史、强度及PDI的分布情况分别如图4a~图4c所示。
上述实例仅结合附图对本发明进行了详细描述,本发明不局限于上述实例。