挖掘热带气旋移动轨迹通道方法

文档序号:6597542阅读:440来源:国知局
专利名称:挖掘热带气旋移动轨迹通道方法
挖掘热带气旋移动轨迹通道方法
技术领域
本发明涉及一种挖掘热带气旋移动轨迹通道方法。
背景技术
热带气旋是生成于热带或副热带洋面上,具有有组织的对流和确定的气旋性环流 的非锋面性涡旋的统称,包括热带低压、热带风暴、强热带风暴、台风、强台风和超强台风。 关于热带气旋的移动行为模式的研究对于预测和分类热带气旋的移动有显著的意义。轨迹 通道作为移动物体的一种时空模式,可以确定被频繁访问的有向空间区域,热带气旋移动 轨迹通道即为被热带气旋频繁访问过的有向空间区域。 数据挖掘是从大量数据中提取或挖掘知识,聚类分析作为数据挖掘的一个重要方 法,可以根据数据的相似性把大型数据集合划分成组。聚类分析可以获得数据分布的情况, 观察每个簇的特征,集中对某些特定的簇做进一步的分析。聚类分析方法可以有效地帮助 找到可以被连接的热带气旋移动轨迹簇,并且连接之后可以得到热带气旋移动轨迹通道。 但是针对不同数据类型,聚类方法不尽相同,特别是对于轨迹数据类型,目前发明的聚类方 法还相当有限,并且各自存在一定的缺陷和局限性,其中一个原因是轨迹数据面临相似性 评估难题。

发明内容
基于此,有必要提供一种能有效挖掘热带气旋移动轨迹通道的方法。
—种挖掘热带气旋移动轨迹通道方法,包括以下步骤A.网格切分热带气旋移动 轨迹,获取热带气旋移动的子轨迹;B.利用调整的离散弗雷歇距离计算热带气旋移动子 轨迹间的相似度;C.层次聚类热带气旋移动子轨迹,获取热带气旋移动子轨迹的轨迹簇; D.连接热带气旋移动子轨迹的轨迹簇,获取热带气旋移动轨迹通道。 优选的,该方法还包括根据计算得到的热带气旋移动子轨迹、轨迹簇、轨迹通道实 现可视化的步骤。 优选的,步骤A中网格切分热带气旋移动轨迹的步骤包括Al.通过按顺序遍历一 次全轨迹的全部数据点,将整个平面空间切分成mX n个网格单元,实现空间网格化,m、n均 为正整数;A2.将完整的热带气旋移动轨迹在每一个网格单元的边界切分开,形成热带子 轨迹,实现全轨迹的片断化;A3.将含有不够数目子轨迹的网格单元滤除。
优选的,所述切分方法为通过按顺序遍历一次全部轨迹的全部数据点,判定相邻 的数据点是否存在于相同网格单元,当相邻数据点存在于不同的网格单元,则将相邻数据 点连线所通过的所有网格单元边界均为切分点,原轨迹在切分点处断开,形成子轨迹片断。
优选的,步骤B中利用调整的离散弗雷歇距离计算热带气旋移动子轨迹间的相似 度的步骤包括Bl.调整离散弗雷歇距离定义将离散弗雷歇距离公式 8dF(P, 0) = ,nim, |p〗—q, |
中的I I运算修正为时空影响因素的加权和,对于子轨迹的顶点对(Pi,q》来说,
所述的I I运算被定义为
B2.对网格单元内的子轨迹,两两计算调整的离散弗雷歇距离得到一个距离矩阵, 并且通过排序生成距离索引表。 优选的,步骤C中层次聚类热带气旋移动子轨迹的步骤包括Cl.将每一个子轨迹
分配到各不相同的轨迹簇中,从距离索引表中获取当前距离最近的两个子轨迹,对于两个
子轨迹存在的轨迹簇如果不包含任子轨迹对且两轨迹簇之间距离超过设定阈值,将两个轨
迹簇合并;C2.将所有不包含足够子轨迹数目的轨迹簇或不包含轨迹簇的网格单元滤除。
优选的,步骤D中连接热带气旋移动子轨迹的轨迹簇的步骤包括网格单元顺序
遍历,单一方向检查轨迹簇,遍历到每一个网格单元,检查所述网格单元所存在的所有轨迹
簇的终点和其他在相邻网格单元的轨迹簇的起点;当网格单元所存在的所有轨迹簇的终点
和其他在相邻网格单元的轨迹簇的起点符合设定条件时进行笛卡儿积交叉连接。 优选的,设定条件依据网格单元所存在的所有轨迹簇的终点和其他在相邻网格单
元的轨迹簇的起点的空间位置关系或速度属性进行判断,当起点和终点属性类似,位置接
近时,判断为可连接。 上述挖掘热带气旋移动轨迹通道方法,通过网格切分空间及热带气旋移动轨迹, 可以获取热带气旋移动子轨迹片断,以子轨迹片断作为聚类单元可以有效识别同一热带气 旋在不同时期属于不同簇的情况,以网格作为操作单元,可以提高计算效率降低计算时间, 易于并行化处理。 通过调整离散弗雷歇距离定义,可以使得离散弗雷歇距离不仅能考虑到不同热带 气旋的相对位置和形状等空间因素,同时还能考虑到速度等时间因素。 同时,利用最近邻凝聚层次聚类模式和全连接判定相结合的聚类方式可以有效避 免热带气旋移动子轨迹相似性累加的影响。 通过遍历生成的热带气旋移动轨迹簇并且采用笛卡儿积交叉,可以在聚类分析之 后进一步获得热带气旋全局行为行为模式,即得到热带气旋移动轨迹通道。


图1是挖掘热带气旋移动轨迹通道方法的系统框架图;
图2是网格切分空间及热带气旋移动轨迹的算法流程图;
图3是层次聚类热带气旋移动子轨迹的算法流程图;
图4是连接热带气旋移动子轨迹的轨迹簇的算法流程图。
具体实施方式
下面主要结合

挖掘热带气旋移动轨迹通道的方法。
如图1所示,挖掘热带气旋移动轨迹通道的方法包括如下流程步骤
A、网格切分热带气旋移动轨迹,获取热带气旋移动子轨迹片断。
首先利用网格切分空间及热带气旋移动轨迹。在空间网格化步骤中,整个平面空
5间被切分为mXn个网格单元空间。在全轨迹片断化步骤中,完整的热带气旋移动轨迹在每 一个网格单元的边界被切分开,形成子轨迹,从而每一个子轨迹都属于某一个确定的网格 单元。切分方法通过按顺序遍历一次全部轨迹的全部数据点,判定相邻的数据点是否存在 于相同网格单元,从而决定是否进行截断操作。当相邻数据点存在于不同的网格单元,相邻 数据点连线所通过的所有网格单元边界均为切分点,原轨迹在切分点处断开,形成子轨迹 片断。在切分过程后,进行网格过滤步骤,含有不够数目子轨迹的网格单元将被滤除,因为 这些网格单元中不可能生成含有足够数量子轨迹的轨迹簇。算法如图2所示。 B、利用调整的离散弗雷歇距离计算热带气旋移动子轨迹间的相似度。 在利用调整的离散弗雷歇距离计算热带气旋移动子轨迹间的相似度的部分,每一
个操作均存在于某一个滤除过后被保留下的网格单元中。对某一个网格单元内的所有子轨
迹,两两计算调整的离散弗雷歇距离得到一个距离矩阵,并且通过排序生成索引表。离散弗
雷歇距离公式为 s战(p'切=,n r f m, JPi — q,
coupling G Ijpi,:q,JEG 其中原本I I运算为欧几里德距离或者其他空间标准距离。为了同时考虑时间 因素,例如速度,I I运算被修正为时空影响因素加权和。即对于热带气旋移动子轨迹的 顶点对(Pi, q》来说,I I定义为
Vajs(&c2 + ~2) +叫組2 这样,通过动态程序运行,可以计算出两两子轨迹的调整的离散弗雷歇距离。
C、层次聚类热带气旋移动子轨迹,获取热带气旋移动子轨迹的轨迹簇。
在层次聚类热带气旋移动子轨迹,获取热带气旋移动子轨迹的轨迹簇的部分,每 一个操作同样存在于某一个滤除过后被保留下的网格单元中,并且在建立距离矩阵和距离 索引表之后。层次聚类热带气旋移动子轨迹包括最近邻凝聚层次聚类模式,全连接判定和 轨迹簇过滤三个步骤。初始化时,每一个子轨迹被分配到各不相同的轨迹簇中,每次从距 离索引表中获取当前距离最近的两个子轨迹,两个子轨迹存在的轨迹簇如果通过全连结判 定,即两个轨迹簇中不包含任子轨迹对,其距离超过某一设定的阈值,则这两个轨迹簇将合 并。直到距离索引表达到某一个停止条件,则不再进行聚类。这种聚类通过逐层合并最邻 近簇,最终得到更加合适的轨迹簇大小,通过全连结判定,可以有效避免距离累加造成的层 次聚类的误差过大。最后所有不包含足够多子轨迹数目的轨迹簇将被滤除,该滤除条件等 同于之前切分轨迹部分的滤除条件。同时不包含轨迹簇的网格单元也将进一步被滤除。算 法如图3所示。 D、连接热带气旋移动子轨迹的轨迹簇,获取热带气旋移动轨迹通道。 在连接热带气旋移动子轨迹的轨迹簇,获取热带气旋移动轨迹通道的部分中,仅
对于那些包含轨迹簇的网格单元进行一次遍历即可。该部分包括网格单元顺序遍历,单一
方向检查轨迹簇以及笛卡儿积交叉连接两个步骤。在遍历到每一个网格单元时,检查该网
格单元所存在的所有轨迹簇的终点,如果有其他在相邻网格单元的轨迹簇的起点可以与它
连接,则进行笛卡尔积的交叉全连结。该方法可以仅遍历一次所有网格单元,并且仅判断每
一个网格中的轨迹簇的终点,即可获取所有可能存在的轨迹通道。可连接判定依据轨迹簇起讫点的空间位置关系,速度属性等进行判断,当起点和终点属性相似,位置相近时,判断 为可连接。算法如图4所示。 E、根据计算得到的热带气旋移动子轨迹、轨迹簇、轨迹通道实现可视化。
可视化软件可以显示热带气旋的完整移动轨迹,切分之后获得的子轨迹,以及聚 类之后的轨迹簇和连接之后的轨迹通道。可变参数包括滤除条件,聚类终止条件,全连结 判定依据,网格单元大小,调整的离散弗雷歇距离中的时空权重比。 上述挖掘热带气旋移动轨迹通道方法,通过网格切分空间及热带气旋移动轨迹,
获取热带气旋移动子轨迹片断;利用调整的离散弗雷歇距离计算热带气旋移动子轨迹间的
相似度;层次聚类热带气旋移动子轨迹,获取热带气旋移动子轨迹的轨迹簇;连接热带气
旋移动子轨迹的轨迹簇,获取热带气旋移动轨迹通道;根据计算得到的热带气旋移动子轨
迹,轨迹簇,轨迹通道实现可视化。最终可以量化并可视化得到所有热带气旋移动轨迹通
道,该通道对于研究热带气旋移动轨迹,预测和预防热带气旋影响有重要作用。 本发明提供的挖掘热带气旋移动轨迹通道方法基于数据挖掘技术,获取可靠且具
有足够精确度的热带气旋移动模式,将为气象研究,特别是热带气旋的预测和预防提供一
个掌握全局和决策辅助的工具。深入分析热带气旋移动轨迹可以降低热带气旋特别是台风
造成的人民生命财产的损失,同时最大程度的减免国家经济损失。 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并 不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员 来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保 护范围。因此,本发明专利的保护范围应以所附权利要求为准。
权利要求
一种挖掘热带气旋移动轨迹通道方法,其特征在于,包括以下步骤A.网格切分热带气旋移动轨迹,获取热带气旋移动的子轨迹;B.利用调整的离散弗雷歇距离计算热带气旋移动子轨迹间的相似度;C.层次聚类热带气旋移动子轨迹,获取热带气旋移动子轨迹的轨迹簇;D.连接热带气旋移动子轨迹的轨迹簇,获取热带气旋移动轨迹通道。
2. 如权利要求1所述的挖掘热带气旋移动轨迹通道方法,其特征在于,还包括根据计 算得到的热带气旋移动子轨迹、轨迹簇、轨迹通道实现可视化的步骤。
3. 根据权利要求1或2所述的挖掘热带气旋移动轨迹通道方法,其特征在于,所述步骤 A中网格切分热带气旋移动轨迹的步骤包括Al.通过按顺序遍历一次全轨迹的全部数据点,将整个平面空间切分成mXn个网格单 元,实现空间网格化,m、n均为正整数;A2.将完整的热带气旋移动轨迹在每一个网格单元的边界切分开,形成热带子轨迹,实 现全轨迹的片断化;A3.将含有不够数目子轨迹的网格单元滤除。
4. 根据权利要求3所述的挖掘热带气旋移动轨迹通道方法,其特征在于,所述切分方 法为通过按顺序遍历一次全部轨迹的全部数据点,判定相邻的数据点是否存在于相同网格 单元,当相邻数据点存在于不同的网格单元,则将相邻数据点连线所通过的所有网格单元 边界均为切分点,原轨迹在切分点处断开,形成子轨迹片断。
5. 根据权利要求1或2所述的挖掘热带气旋移动轨迹通道方法,其特征在于,所述步骤 B中利用调整的离散弗雷歇距离计算热带气旋移动子轨迹间的相似度的步骤包括Bl.调整离散弗雷歇距离定义将离散弗雷歇距离公式8dF(F,切=n|!imaf J化—^ |中的l l运算修正为时空影响因素的加权和,对于子轨迹的顶点对(Pi, q》来说,所 述的l l运算被定义为^/C1>SPX2 +智2) +叫舰2;B2.对网格单元内的子轨迹,两两计算调整的离散弗雷歇距离得到一个距离矩阵,并且 通过排序生成距离索引表。
6. 根据权利要求1或2所述的挖掘热带气旋移动轨迹通道方法,其特征在于,所述步骤 C中层次聚类热带气旋移动子轨迹的步骤包括CI.将每一个子轨迹分配到各不相同的轨迹簇中,从距离索引表中获取当前距离最近 的两个子轨迹,对于两个子轨迹存在的轨迹簇如果不包含任子轨迹对且两轨迹簇之间距离 超过设定阈值,将两个轨迹簇合并;C2.将所有不包含足够子轨迹数目的轨迹簇或不包含轨迹簇的网格单元滤除。
7. 根据权利要求1或2所述的挖掘热带气旋移动轨迹通道方法,其特征在于,所述步 骤D中连接热带气旋移动子轨迹的轨迹簇的步骤包括网格单元顺序遍历,单一方向检查 轨迹簇,遍历到每一个网格单元,检查所述网格单元所存在的所有轨迹簇的终点和其他在 相邻网格单元的轨迹簇的起点;当网格单元所存在的所有轨迹簇的终点和其他在相邻网格单元的轨迹簇的起点符合设定条件时进行笛卡儿积交叉连接。
8.根据权利要求7所述的挖掘热带气旋移动轨迹通道方法,其特征在于,所述设定条 件依据网格单元所存在的所有轨迹簇的终点和其他在相邻网格单元的轨迹簇的起点的空 间位置关系或速度属性进行判断,当所述的起点和所述的终点属性类似,位置接近时,判断 为可连接。
全文摘要
本发明提供了一种挖掘热带气旋移动轨迹通道方法,该方法包括A,网格切分空间及热带气旋移动轨迹,获取热带气旋移动子轨迹片断;B,利用调整的离散弗雷歇距离计算热带气旋移动子轨迹间的相似度;C,层次聚类热带气旋移动子轨迹,获取热带气旋移动子轨迹的轨迹簇;D,连接热带气旋移动子轨迹的轨迹簇,获取热带气旋移动轨迹通道。本发明能有效发现热带气旋移动轨迹通道,结合历史热带气旋路径数据,挖掘特定区域热带气旋移动行为模式,对台风灾害的分析和预测可以提供直接有效的工具,为防灾减灾提供决策支持。
文档编号G06F17/30GK101770516SQ20101004277
公开日2010年7月7日 申请日期2010年1月12日 优先权日2010年1月12日
发明者朱浩瀚, 罗军 申请人:深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1