一种移动对象轨迹监测方法

文档序号:6549464阅读:294来源:国知局
一种移动对象轨迹监测方法
【专利摘要】本发明公开一种移动对象轨迹监测方法,采用并行架构计算系统,分为任务管理层与协同计算层,任务管理层包括若干任务管理节点,协同计算层包括若干计算节点;其步骤包括:1)移动对象轨迹采集,获取移动对象轨迹数据集;2)提交移动对象轨迹数据集以及计算请求;3)对移动对象轨迹数据集进行初始分类得到初始分类样本集;并分配计算任务数据集;4)对移动对象轨迹数据集进行聚类分析,5)汇总各分类样本集信息及聚类子集信息,得到聚类结果轨迹;6)根据聚类结果轨迹进行移动对象的空间分布监测或行为模式监测。本发明适应大数据应用环境下海量移动对象轨迹监测的需求,提升整体计算性能达30%。
【专利说明】一种移动对象轨迹监测方法
【技术领域】
[0001]本发明涉及移动对象大数据分析研究与应用领域,具体涉及一种移动对象轨迹监测方法。
【背景技术】
[0002]移动对象管理(Mobile Object Management)覆盖交通、航空/航天/航海、安全监控、生态环保、物流、灾害防控等领域。是物联网时代信息技术重要的前沿应用领域。主要体现为对移动对象轨迹的监测。总得来说,移动对象根据行为模式可以分为三个类别:
[0003]1.受限移动对象:受限移动对象的行为受外部条件的约束,总体具有一定的规律性,个体在较为固定的模式下移动,无论宏观层面还是微观层面,对象的行为模式都具有较大的约束性;城市交通是具有典型代表性的受限移动对象。这一领域中的车辆行动模式与轨迹受城市路网的约束。
[0004]2.半受限移动对象:半受限移动对象在外部条件约束的情况下,一定程度上具有自由性;行为个体在微观层面呈现较大的非约束性;而宏观层面下群体呈现一定的规律性;航空/航海是具有典型代表性的半受限移动对象。这一领域中飞行器/船只总体按照航线移动,个体在移动过程中,具有一定的自由性。
[0005]3.非受限移动对象:非受限移动对象具有较小的外部约束条件,其个体行为具有较大的自由性;同时,群体行为呈现随机性;开放空间的人员监控室具有典型代表性的非受限移动对象。这一领域中,人员个体在开放空间中自由移动,人流总体的移动较为随机。
[0006]基于轨迹的行为分析与挖掘是移动对象轨迹监控的核心环节。通过轨迹的分类-聚类能够对特定约束条件下移动对象的行为模式进行识别与提取,对于特定群体的监控与管理、异常识别具有重要的应用价值。传统的轨迹分析技术,通常以受限移动对象为重点,在路网等较为严格的条件约束下,通过轨迹逐点空间位置对比实现相似度的计算。随着移动对象管理的应用范围向半受限以及非受限领域的延伸。这一计算方式已经不能适应移动对象管理的技术需求。主要体现在以下几个方面:
[0007]1.移动对象管理呈现典型的大数据特点:随着物联网技术、先进传感器技术以及高速网络/存储技术的发展;移动对象的管理呈现典型的大数据的特点。数据量爆发性的增长导致移动对象轨迹分析计算负载指数级的增长;从应用性能需求的角度出发,这一领域需要高性能计算架构保证海量对象大数据的快速分析。
[0008]2.移动对象轨迹分析过程呈现迭代性与协同性:在相似性计算的基础上实现分类-聚类是移动对象轨迹分析的核心逻辑。在这一逻辑需要在计算执行过程中针对数据集中未实现相似匹配对象迭代处理,实现新的分类建立,满足应用分类的正确性需求;
[0009]3.轨迹相似性从空间位置相似转变为几何相似:由于对象移动环境约束放松,对象的移动呈现较大的自由性;对象之间轨迹不再在空间位置上具有较强的关联关系。行为模式更多的体现在轨迹几何相似性的方面。
[0010]4.轨迹维度复杂性与计算基准一致性的保证:随着移动对象管理领域的延伸,对象的轨迹维度从传统的2维向3维、4维甚至更多维的方向发展。另一方面,由于轨迹之间并不完全相等,这就导致了在轨迹匹配过程中投影基准一致性保证的困难。
[0011]基于以上应用需求,移动对象轨迹检测需要面向各种类别的移动对象提供完善的分析与挖掘技术。这一技术需要针对大数据的应用背景提供完善的计算架构,利用这一架构实现挖掘活动中迭代分析与计算处理的协同组织;同时,在分析过程中需要在约束条件的基础上,从几何相似的角度出发,通过统一的投影变化实现轨迹相似性的计算、识别、分类与聚类。通过这一技术,实现各种约束条件下对象轨迹的准确挖掘与行为模式的提取。

【发明内容】

[0012]针对目前移动对象轨迹分析与挖掘领域的技术与新的发展需求之间的矛盾,本发明的目的在于提供一种基于并行架构的移动对象轨迹监测方法。通过这一方法实现大数据应用背景下各种类别移动对象轨迹高性能监测。在这一基础上实现各种约束条件下移动对象行为模式的监测,其监测结果为当前交通、航空/航天/航海、安全、生态环保、物流、灾害防控等领域的发展提供有效的技术支撑。
[0013]为达到上述目的,本发明公开一种移动对象轨迹监测方法,采用并行架构计算系统,所述系统分为任务管理层与协同计算层,所述任务管理层包括若干任务管理节点,所述协同计算层包括若干计算节点;其步骤包括:
[0014]I)对待检测移动对象轨迹进行采集,获取移动对象轨迹数据集;
[0015]2)通过一应用任务向一个任务管理节点提交所述移动对象轨迹数据集以及设定的计算请求;
[0016]3)所述任务管理节点对所述移动对象轨迹数据集进行初始分类得到初始分类样本集,并根据各个计算节点当前负载状态分配计算任务数据集;
[0017]4)所述任务管理节点根据所述计算任务数据集依次启动计算节点上的计算子任务对移动对象轨迹数据集进行聚类分析,得到分类样本集信息及聚类子集信息,
[0018]4-1)计算节点从移动对象轨迹数据集中提取一个当前对象的轨迹数据,通过计算当前对象的矢量畸变引导因子,根据系统阈值设置与矢量畸变引导因子的对比,确定当前对象的轨迹数据的特征点,根据特征点重构当前对象轨迹的几何形状,得到特征点重构轨迹;
[0019]4-2)从初始分类样本集中提取一个样本对象,计算该样本对象的矢量畸变引导因子与特征点,将该样本对象的特征点投影到该样本对象的距离维度投影空间中;
[0020]4-3)根据距离增量判断当前对象与前述样本对象的几何相似度,当几何相似度达到阈值设置时,将其作为有效对象进行相似度分析,否则将其作为未匹配对象;
[0021]4-4)将4-1)中获取的特征点重构轨迹投影到4-2)中获取的样本对象的距离维度投影中,计算当前对象与样本对象在距离维度投影空间中的相似度,根据阈值设置判断当前对象与样本对象的轨迹是否相似,如果达到阈值设置则将当前对象作为样本对象的有效聚类对象,否则作为未匹配对象;
[0022]4-5)计算当前对象与初始分类样本集中全部样本对象的聚类分析相似度取值,获取最高聚类分析相似度对应的样本对象,将当前对象作为所述样本对象的聚类子集;
[0023]4-6)如所述样本对象实现聚类匹配则通过消息中间件广播前述聚类子集的更新信息,否则计算节点通知任务管理节点缓存该样本对象的未匹配对象的信息;
[0024]4-7)任务管理节点缓存全部计算节点通知的未匹配对象的信息,当未匹配对象数量达到阈值设置时,将缓存的未匹配对象进行重新分类处理,得到新增的分类样本集,并将新增分类样本信息与聚类子集信息通过消息中间件广播给全部计算节点更新;
[0025]4-8)对移动对象轨迹数据集中所有移动对象轨迹进行前述4-1)至4-7)所述的聚类分析,计算节点汇聚新增的分类样本集的信息与聚类子集信息到任务管理节点。
[0026]5)任务管理节点汇总各分类样本集信息及聚类子集信息,得到聚类结果轨迹;
[0027]6)根据所述聚类结果轨迹进行移动对象的空间分布监测或行为模式监测。
[0028]通过上述过程,本发明针对当前大数据应用环境下海量移动对象轨迹监测的前沿技术需求,从并行计算的角度出发,构建完整技术方案。在基于计算逻辑的分层调度的基础上,通过并行节点之间的协同组织实现高性能计算。同时,在计算过程中,利用基于距离的维度投影实现轨迹计算基准统一性的保证,在这一基础上通过特征计算实现对象的分类与聚类处理。满足海量移动对象轨迹快速分析及准确监测的要求。
[0029]本发明在“数据驱动”的原则基础上,突破传统的并行计算模式,利用分层协同组织的方式实现海量轨迹数据快速分类-聚类分析;同时在计算过程中,通过轨迹点的特征提取实现数据压缩,利用基于尺度投影的特征相似度变换实现轨迹的快速匹配,通过这一技术满足移动对象管理应用领域的前沿技术需求。
[0030]与现有技术相比,本发明的积极成果体现在:
[0031]1.本发明以并行架构为基础。通过多点协同计算实现大数据的移动对象轨迹快速分析和实时监测。在分析和监测过程中,结合计算量预估实现作业调度与负载均衡。同时,本发明围绕移动对象轨迹分类-聚类核心分析计算逻辑提出任务协同与数据同步机制。实现并行环境下分类信息的汇聚与聚类处理的协同,在满足计算负载任务分布的同时,保证数据分析的精度与正确性;在轨迹计算的过程中,本发明提出一种在基于距离的维度投影下利用特征压缩的计算方法,解决大数据背景下,数据分析精度与计算量之间的矛盾问题。
[0032]2.在基于某市交通流量监测的实验中表明。本发明所提供的方法在整体计算性能提升方面达到30%,在保证足够计算精度的情况下有效提高海量移动对象轨迹监测的需求。
[0033]综上,本发明针对移动对象的个体与群体的行为实现高性能监测,提供大数据应用背景下海量移动对象轨迹监测的核心技术。利用并行架构、基于计算逻辑的作业调度与协同机制以及基于距离的维度投影的特征压缩计算轨迹相似性;在交通、航空、灾害防控、环境保护、人流监控、物流追溯等方面具有积极的应用价值。
【专利附图】

【附图说明】
[0034]图1为本发明实施例所述的系统的构成框架图。
[0035]图2为本发明实施例所述的移动对象轨迹分析挖掘协同组织过程图。
[0036]图3为本发明实施例所述的任务管理节点计算任务组织过程图。
[0037]图4为本发明实施例所述的计算节点计算任务执行与协同图。
[0038]图5为本发明实施例所述的作业调度过程图。
[0039]图6为本发明实施例所述的轨迹特征提取与计算示意图。[0040]图7为本发明实施例所述的MO对象轨迹特征提取过程图。
[0041]图8为本发明实施例所述的轨迹特征基于距离的维度投影示意图。
[0042]图9为本发明实施例所述的轨迹特征点对比取值示意图。
[0043]图10为本发明实施例所述的对象轨迹与样本轨迹相似性计算过程图。
【具体实施方式】
[0044]为使本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合所附图作详细说明如下。
[0045]移动对象覆盖车辆交通、航空航天、环境保护等多个领域;随着物联网技术、GPS技术以及先进传感器技术的技术进步与应用深化。移动对象轨迹监测工作核心之一是在移动对象之间进行轨迹对比、分类、聚类等处理,从而对特定约束条件下对象行为模式进行提取;在大数据的应用背景下,上述分析工作对其对处理逻辑的组织形式与性能提出了新的技术需求。本发明在并行计算的架构上,针对海量移动对象的增量过程分析建立计算框架与方法。这一计算框架由两个层次构成,针对移动对象轨迹分析业务逻辑建立并行计算任务调度策略。上层的任务管理节点负责对象数据管理、计算任务的分发与协同组织;下层的计算节点负责任务分包中对象轨迹的计算。同时,计算节点与任务管理节点之间利用消息中间件的方式实现共享数据交换。从而满足轨迹分析过程中样本聚合集数据的全局同步。一方面保证计算精度;另一方面使得整个计算架构具有良好的适应性与可扩展性;满足大数据应用背景下数据分析的基本要求。
[0046]在对象轨迹分析与聚类的过程中,首先依据时空约束关系,对对象的轨迹进行特征抽取。针对移动对象轨迹时空变化的特点。通过端点偏移与临点偏移的计算确定轨迹点在整个轨迹中的矢量畸变引导因子(VDF,Vector Distort1n Factor)。将其与全部轨迹点的矢量畸变引导因子经过基于距离的维度投影处理后,确定当前对象轨迹的畸变特征描述;在轨迹的聚类过程中,通过样本与对象的畸变特征描述相似度计算确定当前对象与样本的关系。同时,在增量过程中,针对对象的相似熵量计算,发现新的聚类样本,实现海量移动对象轨迹相似性的高性能分析;以获得高性能的监测。其具体技术方案如下:
[0047]移动对象轨迹的采集
[0048]通过在移动对象上安装GPS等传感器设备。在日常行为中以一定的频率上报其空间位置;系统收集这些移动对象的轨迹数据,经过时序组织后形成对象轨迹数据。
[0049]并行计算架构与执行
[0050]本发明为大数据背景下海量移动对象分析提供高性能计算服务。结合移动对象计算分析逻辑特点。本发明以并行架构实现计算任务的执行。如图1所示整个计算框架由两个层次构成:任务管理层与计算层,其中:
[0051]任务管理层:其主要由任务管理节点与消息总线构成。任务管理节点负责整个计算任务的协同与组织。其依据“负载平衡”的原则建立调度策略对任务进行分发与组织。在计算过程中,首先接受输入的待分析移动对象轨迹数据集。根据调度策略,首先对数据集初始样本进行提取;而后将对象轨迹数据集进行分包,针对每一个分包数据建立计算任务并将其绑定在一个底层计算节点中;完成任务分包后,将全部计算任务发送给给对应的计算节点进行分析处理;在计算过程中,计算节点在任务数据分包中对轨迹进行匹配与聚类;聚类的信息通过消息总线实现全局的数据同步更新;同时,将未能实现匹配的对象轨迹提交给任务管理节点。任务管理节点通过共享数据池进行未匹配对象的缓存。当缓存池中增量比达到阈值设置时,对缓存池中的对象进行分类处理;分类处理产生新的样本数据通过消息总线同步到下层的各个计算节点,实现新的分类信息更新。
[0052]计算层:其主要由计算节点构成。计算节点负责计算分包任务的计算处理工作。在任务执行过程中,其通过任务系统接口接受任务管理节点分发的计算任务分包。根据分包中对象的对象轨迹提取其轨迹基本特征;而后将该轨迹特征与样本集中的样本轨迹进行对比;在样本对比分析的过程中,通过最大相似度的方式消除轨迹相似复用的现象,实现轨迹聚类归一;同时,将对应的样本相似集中的对象进行更新;这一更新通过消息中间件的方式,同步到全局;实现并行计算节点之间的协同;如果当前轨迹未实现匹配,将其提交给任务管理节点,实现新的分类处理;计算节点的基本信息与负载信息记录在任务管理节点的元数据管理模块中;通过这一组织方式,实现计算框架良好的计算处理协同组织能力与扩展能力。
[0053]整个计算框架的基本任务协同组织逻辑如图2所示:
[0054]其基本过程如下:
[0055]1.系统任务管理节点接受分析任务请求,获取其提交的移动对象轨迹数据集MC ;
[0056]2.获取移动对象轨迹数据集MC中对象轨迹的总数量Num(MC);
[0057]3.根据预设的初始分类比IniD (预设值为:10% )从MC中提取额定数量的轨迹作为初始分类样本集MC ; [0058]4.在MC中对轨迹进行分类,形成初始分类集CC ;
[0059]5.通过系统元数据信息获取全部任务节点信息;
[0060]6.将对象轨迹数据集MC中的MC(1-1niD)对象的轨迹分包,并与计算节点对应建立子任务请求;
[0061]7.将计算节点与对应的子任务绑定,并将子任务请求、轨迹集分包、以及CC发送给对应的计算节点;同时,在本地启动分类值守子线程;
[0062]8.计算节点接受子任务请求、轨迹集分包以及CC,开始准备计算任务;为当前任务建立轨迹对象队列并将轨迹集分包中的数据防治在该任务轨迹对象队列中;同时,将CC放置在当前任务聚类样本集中;
[0063]9.令i = I,计算节点从当前任务轨迹对象对立中提取第i个对象Ti ;
[0064]10.提取当前Ti对象的轨迹特征;
[0065]11.令j = 1,从当前聚类样本集中提取第j个样本对象Sj ;
[0066]12.计算当前对象Ti与Sj的特征相似度值,记作,Tsij ;
[0067]13.令j = j+1,提取下一个样本对象;如果提取成功执行步骤12,否则执行步骤14 ;
[0068]14.完成当前Ti对象与样本集中全部样本的特征相似度计算,获取相似度最高值TS,如果TS≥相似辨识阈值设置(预设值为:60% )则执行步骤15 ;否则执行步骤19 ;
[0069]15.通过消息中间件将当前Ti对象与样本对比信息广播给其他计算节点与任务管理节点;这些节点接受到该信息后,将其同步更新在本地的聚类样本集中;
[0070]16.令i = i+Ι,提取下一个轨迹对象,如果提取成功则执行步骤10,否则执行步骤17 ;
[0071]17.完成全部轨迹分析处理,将任务完成信息返回任务管理节点;
[0072]18.任务管理节点查看任务执行日志;完成全部子任务,结束当前分类值守子线程,将聚类样本集中的数据处理后,输出返回;
[0073]19.在步骤14中当前Ti对象未与聚类样本集中的样本实现相似;计算节点该对象信息发送给任务管理节点;
[0074]20.任务管理节点收到未聚类的Ti对象信息后将缓存在本地共享数据池中;
[0075]21.分类值守子线程检查当前共享数据池中缓存的未聚类Ti对象数量是否超过IniD (预设值为:10% ),如果未超过,结束当前检查操作;否则执行步骤22 ;
[0076]22.任务管理节点从共享数据池中提取全部为聚类的对象数据,进行分类分析处理;将形成的分类信息通过消息中间件广播给计算节点,由其同步更新到本地的聚类样本集中;
[0077]23.任务管理节点将形成新的分类样本的对象从共享数据池中删除;将未实现重新分类的对象继续在缓存池中存储,等待后续操作。
[0078]任务管理节点与计算节点
[0079]本发明在并行架构 的基础上针对大数据应用背景下海量移动对象轨迹监测提供技术方案。由于轨迹分析中存在大量分类、聚类操作。传统的并行架构中并行计算节点负责对数据集的特定子集进行处理,这就导致初始分类操作中,样本容量与精度不足的问题;进而影响并行架构在轨迹大数据分析中效能的发挥。针对这一问题。本发明在整体架构设计上采用两层基本结构。上层的任务管理层负责作业调度的同时,还负责分类操作;下层的计算节点负责特定数据子集中对象聚类的工作;在分类-聚类的过程中,在计算节点中未能实现聚类匹配的节点,通过两层节点之间的数据交换汇聚在任务管理节点的共享数据池中;任务节点负责对这些未匹配轨迹数据进行再次分类处理,形成新的分类对象后,将其分类信息同步更新到下层计算节点中,实现新分类对象的聚类处理;在这一架构中任务管理节点与计算节点构成整体协同计算的对象。
[0080]任务管理节点:如前所述,任务管理节点负责任务的作业调度与分类处理,其定义如下:
[0081]taskMgr = {ClassFilter, JobRunner, mesger, dataCache, taskffatcher, nodelnf
ο}
[0082]其由一个六元组构成,其中:
[0083]ClassFilter是任务管理节点的分类处理器,其根据提交的轨迹数据集中的数据进行分类处理。在分类过程中依次提取轨迹数据集中轨迹的特征,通过对比实现类别的识别与创建;
[0084]JobRunner是任务管理节点的作业调度器,其根据前述的计算逻辑,将提交的分析任务请求,经过前期处理、任务分解、作业调度、未匹配数据回收再处理、结果汇聚等步骤完成整个分析任务的执行与协同组织;
[0085]mesger为任务管理节点的消息交换器,消息交换器与消息总线连接,通过PUB/SUB的方式建立消息主题与底层的计算节点实现数据交换;在任务执行过程中,计算节点中未能实现匹配的轨迹对象信息通过消息总线交换到任务管理节点的消息交换器,并实现缓存;
[0086]dataCache为任务管理节点的数据缓存。在任务执行过程中,数据缓存为每个任务建立缓存单元。缓存单元中缓存当前任务计算节点提交的未匹配对象轨迹数据信息,供再次分类处理使用;dataCache的定义如下:
[0087]dataCache = {(appID, 1bjIDj j = I, 2,....m}) j | i = 1,2,....η}
[0088]其中appID为当前任务ID ;
[0089]objID为未匹配对象的标识信息;
[0090]taskffatcher为任务值守,其在任务执行过程中对数据缓存中的数据进行监测,当数据缓存数量达到阈值设置(初始分类比IniD,预设值为:10% )时,将缓存池中的数据提取,进行再次分类分析处理;
[0091]nodeinfo为任务管理节点的元数据管理模块,其负责维护计算节点的基本信息以及负载动态信息;根据其中的信息,任务管理节点对任务进行分解、节点绑定与作业调度;
[0092]系统中计算节点的元数据定义如下格式:
[0093]nodeinfo = { (ID, IP, port, cpu, cpuload, memory, memory load) j | j =1,2,……1};
[0094]其中:ID为节点标识; [0095]IP为计算节点的IP地址;
[0096]Port为计算节点任务通信的端口;
[0097]cpu为计算节点的CPU计算性能指标;
[0098]cpuload为计算节点的当前负载;在系统运行中,这一信息根据时间间隔设置更新;
[0099]memory为计算节点的内存容量;
[0100]Memoryload为计算节点的内容负载;在系统运行中,这一信息根据时间间隔设置更新。
[0101]图3中展示任务管理节点整个计算任务协同组织的基本过程。
[0102]其过程如下:
[0103]1.任务管理节点接受任务请求MC ;
[0104]2.根据复杂度模型估算任务计算量;
[0105]3.根据各个计算节点负载分配计算任务;
[0106]4.完成作业调度分配;
[0107]5.在共享数据池中为当前任务建立共享数据集,这一数据集用于计算过程中迭代分类的对象数据缓存;
[0108]6.为当前计算任务启动任务值守线程;值守线程负责在任务执行过程中检测当前任务的共享数据集,并进行迭代分类;该线程启动后执行步骤13 ;
[0109]7.从当前任务MC中提取初始分类比IniD (预设值为:10% )个对象轨迹,形成初始分类;
[0110]8.将作业调度与初始分类信息发送给计算节点并启动并行聚类处理,并等待任务结束;
[0111]9.当前任务进程查看是否完成全部计算处理,如果完成则执行步骤10 ;否则继续等待;
[0112]10.当前任务完成全部计算,收集计算结果;
[0113]11.结束当前任务的值守线程、销毁共享数据池中当前任务的共享数据集;
[0114]12.结束当前计算任务;
[0115]13.计算任务的值守线程启动;
[0116]14.检测共享数据池中当前任务的共享数据集是否达到阈值限制IniD ;如果未达至|J,继续等待并执行步骤14,否则执行步骤15 ;
[0117]15.提取当前任务共享数据集中全部未实现聚类匹配的对象轨迹进行新的分类计算;将形成新的分类的对象从共享数据集中删除,为实现新分类的数据继续保存;
[0118]16.将新的分类信息同步给全部计算节点;
[0119]17.查看当前任务是否完成,如果完成则结束当前线程;否则执行步骤14。
[0120]计算节点:计算节 点承担对象轨迹聚类分析的工作。在本发明中,计算节点之间通过消息中间件同步计算过程中的聚类信息,利用计算节点的协同工作完成全部聚类处理;其定义如下:
[0121]jobNode = {ID, jobRunner, jobCache, mesglnter, sampleCache, Cluster, featureFilter}
[0122]其由一个七元组构成,其中:
[0123]ID为当前计算节点的标识;在整个计算架构中,这一标识为全局唯一;
[0124]jobRunner为当前计算节点的任务协同接口,通过这一接口,计算节点获取当前任务执行信息与初始分类信息;
[0125]jobCache为当前计算节点的任务数据缓存池,其由一个哈希表构成:
[0126]jobCahche = {(Hash (appIDj), MCi) i \ i = I, 2,....n}
[0127]其中:appID为当前计算任务的标识;其经过哈希处理后作为当前计算任务数据缓存
[0128]的主key !MCi为当前计算任务分配在本节点中的MC子集;
[0129]mesglnter为当前计算节点与消息中间件的访问接口 ;通过这一接口同步聚类消息;同时接受迭代分类消息;
[0130]sampleCache为当前计算节点中分类样本集,其由一个哈希表构成:
[0131]sampleCache = {(Hash (appIDj), ClassSeti) j | i = I, 2,.....η}
[0132]ClassSeti = {(Sample, {(MOIDk | k = I,.....p)})};
[0133]其中Sample为当前分类的样本对象数据;M0IDk为当前聚类集中与样本匹配的对象集合;
[0134]Cluser为当前计算节点对象聚类计算式,通过计算式实现对象特征与分类样本集中样本对比;
[0135]featrueFilter为当前计算节点中对象特征提取模块,通过这一模块从对象轨迹数据中提取特征,这一特征与分类样本集中样本特征对比结果进行聚类;
[0136]计算节点的任务执行过程如图4:
[0137]其过程如下:
[0138]1.计算节点接收任务管理节点发送的调度作业;[0139]2.在本节点的数据缓存中为当前任务建立缓存数据集,并将作业请求中的对象轨迹子集缓存在这一数据集中;
[0140]3.在本地分类样本集中为当前任务建立分类样本数据集,并将作业请求中的分类样本数据缓存在这一数据集中;
[0141]4.令i = I,计算节点从当前任务轨迹对象对立中提取第i个对象Ti ;
[0142]5.提取当前Ti对象的轨迹特征;
[0143]6.令j = I,从当前聚类样本集中提取第j个样本对象Sj ;
[0144]7.计算当前对象Ti与Sj的特征相似度值,记作,Tsij ;
[0145]8.令j = j+1,提取下一个样本对象;如果提取成功执行步骤9,否则执行步骤10 ;
[0146]9.完成当前Ti对象与样本集中全部样本的特征相似度计算,获取相似度最高值TS,如果TS≥相似辨识阈值设置(预设值为:60% )则执行步骤10 ;否则执行步骤11 ;
[0147]10.通过消息中间件将当前Ti对象与样本对比信息广播给其他计算节点与任务管理节点;这些节点接受到该信息后,将其同步更新在本地的聚类样本集中,执行步骤12 ;
[0148]11.将对象未匹配消息发送给任务管理节点,开展迭代分类;
[0149]12.令i = i+Ι,提取下一个轨迹对象,如果提取成功则执行步骤5,否则执行步骤13 ;
[0150]13.完成全部轨迹分析处理;
[0151]14.删除当前任务数据集;
[0152]15.删除当前任务分类样本集;
[0153]16.将本节点的聚类结果返回给任务管理节点;
[0154]17.结束;
[0155]18.在任务执行过程中,消息接口通过消息总线获取当前任务迭代分类信息;
[0156]19.将分类信息缓存在分类样本集中;
[0157]20.在任务执行过程中,消息接口通过消息总线获取当前任务同步聚类信息;
[0158]21.将同步聚类信息在当前样本集中更新。
[0159]计算任务拆分与调度策略
[0160]本发明以并行架构为基础,为大数据背景下海量移动对象轨迹聚类分析提供完成技术解决方案。在整个计算架构中任务管理节点负责对任务请求的分解,调度,任务请求转发等工作。为了充分发挥并行架构的效能,保证计算性能,在任务调度过程中依据“负载平衡”的原则对任务包的分解构成,请求定向绑定等操作进行处理。
[0161]分析任务的请求如下定义:
[0162]TaskReq = {MC, acFactor}
[0163]其中,MC为待分析的移动对象轨迹集,其由一组轨迹描述构成:
[0164]MC = Iti I i = 1,2,.....η},
[0165]t = {objID,{(X,y, V, t) j I j = 1,2,.....m}}
[0166]其中,objID为对象标识;(x,y, v, t)j为当前对象轨迹中第j个轨迹点的坐标、速度与时刻信息;
[0167]acFactor为当前计算任务精度约束;
[0168]在任务执行过程中,任务管理节点根据任务数据集与计算节点状态,将任务分解为节点子任务执行,子任务请求如下定义:
[0169]JobReq = {sub jobk | k = 1,2,....1}
[0170]SubJobk = {MCk, CC, appID, nodeID, acFacotr}
[0171]子任务请求由一组与计算节点数量对应的subjob对应;其中
[0172]MCk为当前子任务所要处理的移动对象轨迹集;
[0173]CC为当前任务初始初始分类集;
[0174]appID为当前分析任务标识;
[0175]nodeID为对应的计算节点标识;
[0176]调度过程就是将TaskReq分解为JobReq的逻辑过程,其定义为
[0177]schedule (TaskReq) = JobReq
[0178]这一过程如下:
[0179]i)首先从TaskReq中获取全部待分析的移动对象轨迹集中轨迹的数量TaskNum =Num(MC);
[0180]ii)从 TaskNum 中减去分类集 CC 的数目:TaskNum = TaskNum-1niD^TaskNum ;
[0181]iii)获取初始分类集CC中样本的数量:SNum = Num(CC);
[0182]iv)计算任务总体计算量
[0183]
【权利要求】
1.一种移动对象轨迹监测方法,采用并行架构计算系统,所述系统分为任务管理层与协同计算层,所述任务管理层包括若干任务管理节点,所述协同计算层包括若干计算节点;其步骤包括: 1)对待监测移动对象轨迹进行采集,获取移动对象轨迹数据集; 2)通过一应用任务向一任务管理节点提交所述移动对象轨迹数据集以及设定的计算请求; 3)所述任务管理节点对所述移动对象轨迹数据集进行初始分类得到初始分类样本集,并根据各个计算节点当前负载状态分配计算任务数据集; 4)所述任务管理节点根据所述计算任务数据集依次启动计算节点上的计算子任务对移动对象轨迹数据集进行聚类分析,得到分类样本集信息及聚类子集信息, 5)任务管理节点汇总各分类样本集信息及聚类子集信息,得到聚类结果轨迹; 6)根据所述聚类结果轨迹进行移动对象的空间分布监测或行为模式监测。
2.如权利要求1中所述的移动对象轨迹监测方法,所述步骤4)中聚类分析过程包括以下分步骤: 4-1)计算节点从移动对象轨迹数据集中提取一个当前对象的轨迹数据,通过计算当前对象的矢量畸变引导因子,根据系统阈值设置与矢量畸变引导因子的对比,确定当前对象的轨迹数据的特征点,根据特征点重构当前对象轨迹的几何形状,得到特征点重构轨迹;4-2)从初始分类样本集中提取一个样本对象,计算该样本对象的矢量畸变引导因子与特征点,将该样本对象的特征点投影到该样本对象的距离维度投影空间中; 4-3)根据距离增量判断当前对象与前述样本对象的几何相似度,当几何相似度达到阈值设置时,将其作为有效对象进行相似度分析,否则将其作为未匹配对象; 4-4)将4-1)中获取的特征点重构轨迹投影到4-2)中获取的样本对象的距离维度投影空间中,计算当前对象与样本对象在距离维度投影空间中的相似度,根据阈值设置判断当前对象与样本对象的轨迹是否相似,如果达到阈值设置则将当前对象作为样本对象的有效聚类对象,否则作为未匹配对象; 4-5)计算当前对象与初始分类样本集中全部样本对象的聚类分析相似度取值,获取最高聚类分析相似度对应的样本对象,将当前对象作为所述样本对象的聚类子集; 4-6)如所述样本对象实现聚类匹配则通过消息中间件广播前述聚类子集的更新信息,否则计算节点通知任务管理节点缓存该样本对象的未匹配对象的信息; 4-7)任务管理节点缓存全部计算节点通知的未匹配对象的信息;当未匹配对象数量达到阈值设置时,将缓存的未匹配对象进行重新分类处理,得到新增的分类样本集,并将新增分类样本信息与聚类子集信息通过消息中间件广播给全部计算节点更新; 4-8)对移动对象轨迹数据集中所有移动对象轨迹进行前述4-1)至4-7)所述的聚类分析,计算节点汇聚新增的分类样本集的信息与聚类子集信息到任务管理节点。
3.根据权利要求1所述的移动对象轨迹监测方法,其特征在于,所述任务管理节点用以实现作业调度及分类操作,计算节点用以实现对象轨迹聚类分析,计算节点之间以及计算节点与任务管理节点之间通过消息中间件通信;步骤I)中所述采集过程为,在移动对象上安装定位传感装置,并以一定的频率上报其空间位置的轨迹数据,再对轨迹数据进行收集,经过时序组织后得到移动对象轨迹数据集。
4.根据权利要求3所述的移动对象轨迹监测方法,其特征在于,任务管理节点还用以实现计算过程中的迭代分类;计算节点之间通过协同方式实现样本对象在初始分类样本集中有效聚类对象的匹配。
5.根据权利要求1所述的移动对象轨迹监测方法,其特征在于,步骤3)及步骤4)中,根据移动对象轨迹数据集的规模评估计算复杂度:TaskLoad = O(TaskNum-1SNum) ^O(HvcragcO)), I g MC 计算节点的当前负载状态根据计算节点负责监控的信息动态评估:
CAP = y"(l-cpuload,.)*cpu,.,cpu,.e nodef,Cpiiloadj g node,,node, e nodes 在前述信息动态评估的基础上获得计算任务数据集的规模/处理能力:
CAPRATE = Taskload/CAP ; 由此分配分配计算任务数据集,并启动各个计算节点的子任务:
NumMCk ^ CAPTATEX (l-cpuloadk) Xcpuloadk,
NumMCk+s>Num (MC) — NumMCk = Num (MC)-S。
6.根据权利要求4所述的移动对象轨迹监测方法,其特征在于,通过消息队列的方式实现计算过程中的迭代分类;在后续的计算中,各个计算节点将子任务数据集中轨迹与新增的分类样本集进行聚类处理;在消息队列中,迭代分类请求消息队列的消息发布者为全部计算节点,消息接收者为任务管理节点;消息定义如下:
classReqMsg = {appID, nodeID, MOID, closeTo, simValue} 迭代分类同步消息队列的发布者为任务管理节点,消息接收者为全部计算节点,消息定义如下:
ClassInfo = {appID, classID, sample, MC}。
7.根据权利要求2所述的移动对象轨迹监测方法,其特征在于,步骤4-1)中根据距离增量与偏移量的对比分布计算轨迹的矢量畸变引导因子,当某个轨迹点的数值超过阈值设置则将其识别为特征点,一个轨迹的特征由一组特征点构成;同时,特征点中保留原始轨迹距离增量的数值,通过特征点重构轨迹的几何形状的方式压缩轨迹的数据量,同时保证后续投影过程中当前对象的数据精度。
8.根据权利要求2所述的移动对象轨迹监测方法,其特征在于,步骤4-2)所述距离维度投影空间为I维空间。
9.根据权利要求2所述的移动对象轨迹监测方法,其特征在于,步骤4-4)中所述当前对象的特征点投影到样本对象的距离维度投影空间中,获得的投影点与样本特征点之间通过距离比判断计算有效性,当投影点与最近的样本对象的特征点之间距离比在阈值范围内时,将投影点中的特征信息与该样本对象的特征点进行对比计算,否则通过插值的方式在投影空间中获取投影点对应位置上的特征信息。
10.根据权利要求9所述的移动对象轨迹监测方法,其特征在于,步骤4-4)中计算投影点与样本对象特征点的特征信息构成分析空间维度,通过计算两者在所述分析空间维度中信息的夹角与位置关系确定投影点与样本对象特征点的相似值;一个当前对象与样本对象的相似度由该当前对象全部特征点的投影点与样本对象的特征点的相似值累加构成,当前述当前对象与样本的相似度达到精度要求时则将其视作与该样本对象相似的有效聚类对象,否则视为未匹配 对象。
【文档编号】G06F19/00GK104036139SQ201410260980
【公开日】2014年9月10日 申请日期:2014年6月12日 优先权日:2014年6月12日
【发明者】郭皓明, 丁治明, 张天为, 徐怀野, 郭黎敏 申请人:中国科学院软件研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1