本发明涉及一种数据共振系统及方法,特别是涉及一种基于时空轨迹异构多源数据共振系统及方法。
背景技术:
在传统的欧几里德距离函数的轨迹相似性计算过程中,要求轨迹等长且时间点对应,无法度量不等长且具有局部事件偏移的轨迹相似性。因此在发现异源同步轨迹集合过程中产生信息损失较大,影响轨迹数据的可用性。
技术实现要素:
本发明所要解决的技术问题是提供一种基于时空轨迹异构多源数据共振系统及方法,去能够避免欧式距离脱离实际的情况,保证数据的完整性和一致性,提高计算效率,使用范围广泛。
本发明是通过下述技术方案来解决上述技术问题的:一种基于时空轨迹异构多源数据共振系统,其特征在于,其包括:
实时序列流接收模块,用于实时接收时序向量,并保证数据传输过程中的完整性,一致性;
轨迹相似度计算模块,用于计算轨迹相似度并筛选出相似度大于一定阈值的轨迹,作为共振轨迹;
轨迹可视化模块,用于直观显示目标轨迹,轨迹数据同时包含空间和时间属性,数据量大且维度高,分析起来难度很大,可视化技术可以直观地呈现多维时空轨迹数据,并提供丰富的互动,以揭示数据中包含的时空规律。
优选地,所述实时序列流接收模块包括:
数据转换模块,用于将原始的轨迹数据转换为时序向量;
消息传输模块,用于将时序向量以消息的方式实时传送到相似度计算模块,并保证数据传输过程中的完整性,一致性。
优选地,所述轨迹相似度计算模块包括:
时序向量规则模块,用于规则化接收到的时序向量,保证计算的一致性;
相似度筛选模块,用于筛选出相似度大于一定阈值的轨迹,作为共振轨迹,进而大大减小计算量,提高计算效率;
轨迹缺失值补全模块,用于补全原查询轨迹,轨迹数据采集过程中常常会有缺失,把缺失的轨迹补全,以及经过这个轨迹点的时间范围的估计区域的尽量缩小,对于实际的业务应用非常有用。
本发明还提供一种基于时空轨迹异构多源数据共振方法,其包括以下步骤:
步骤一,将原始轨迹数据转换为时序向量;
步骤二,时序向量规则化;
步骤三,向量时间切片;
步骤四,通过相似度计算方法计算相似度作为共振率;
步骤五,筛选共振率大于一定数值的轨迹作为共振轨迹;
步骤六,补全原查询轨迹;
步骤七,轨迹可视化;
步骤八,结束。
优选地,所述步骤四根据哈希区域映射的时空距离计算方法计算点与点之间的距离,把测地距离通过一定的hash算法映射为区域点之间的距离,在实际计算相似度的时候,通过hash查找对应的测地距离作为相似度,使用hash距离通过时序偏移的时空三维向量序列的相似度计算方法计算相似度作为共振率;对于不同长度的序列向量的相似度,以及时间点不对齐的序列向量的相似度的计算,通过动态规划考虑时间轴可能偏移的情况,重新计算相似度,得到两个时空三维向量序列的最终相似度。
优选地,所述步骤六使用相似轨迹来进行哈希映射的轨迹缺失值补全方法,把缺失的轨迹点尽量准确的补全和经过时间范围估计缩小。
优选地,所述步骤七使用相似轨迹哈希映射的轨迹缺失值补全方法补全原查询轨迹,进行可视化展示。
本发明的积极进步效果在于:本发明能够在大量获取的数据存在准确性不高以及数据碎片化的情况下,在无法通过确定手段进行关联的情况下,通过数据共振,可以有效甄别数据,并将真实的数据关联起来;数据共振将数据上未直接反应出来的内在关系挖掘出来,深入揭示不同实体的时间空间关联,进而发现不同的独立数据间的彼此关系。
附图说明
图1为本发明的结构示意图。
图2为本发明的流程图。
具体实施方式
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
如图1所示,本发明基于时空轨迹异构多源数据共振系统包括实时序列流接收模块、轨迹相似度计算模块、轨迹可视化模块,其中:
实时序列流接收模块用于实时接收时序向量,并保证数据传输过程中的完整性,一致性;
轨迹相似度计算模块用于计算轨迹相似度并筛选出相似度大于一定阈值的轨迹,作为共振轨迹;
轨迹可视化模块用于直观显示目标轨迹,轨迹数据同时包含空间和时间属性,数据量大且维度高,分析起来难度很大,可视化技术可以直观地呈现多维时空轨迹数据,并提供丰富的互动,以揭示数据中包含的时空规律。
所述实时序列流接收模块包括数据转换模块、消息传输模块,其中:
数据转换模块用于将原始的轨迹数据转换为时序向量;
消息传输模块用于将时序向量以消息的方式实时传送到相似度计算模块,并保证数据传输过程中的完整性,一致性。
所述轨迹相似度计算模块包括时序向量规则模块、相似度筛选模块、轨迹缺失值补全模块,其中:
时序向量规则模块用于规则化接收到的时序向量,保证计算的一致性;
相似度筛选模块用于筛选出相似度大于一定阈值的轨迹,作为共振轨迹,进而可以大大减小计算量,提高计算效率;
轨迹缺失值补全模块用于补全原查询轨迹,轨迹数据采集过程中常常会有缺失,如何把缺失的轨迹补全,以及经过这个轨迹点的时间范围的估计区域的尽量缩小,对于实际的业务应用非常有用。
如图2所示,本发明基于时空轨迹异构多源数据共振方法包括以下步骤:
步骤一,将原始轨迹数据转换为时序向量;
步骤二,时序向量规则化;
步骤三,向量时间切片;
步骤四,通过相似度计算方法计算相似度作为共振率;
步骤五,筛选共振率大于一定数值的轨迹作为共振轨迹;
步骤六,补全原查询轨迹;
步骤七,轨迹可视化;
步骤八,结束。
所述步骤四根据哈希区域映射的时空距离计算方法计算点与点之间的距离,把测地距离通过一定的hash算法映射为区域点之间的距离,在实际计算相似度的时候,通过hash查找对应的测地距离作为相似度,使用hash距离通过时序偏移的时空三维向量序列的相似度计算方法计算相似度作为共振率;对于不同长度的序列向量的相似度,以及时间点不对齐(允许各种时间不等片的偏离)的序列向量的相似度的计算,通过动态规划考虑时间轴可能偏移的情况,重新计算相似度,得到两个时空三维向量序列的最终相似度。
所述步骤六使用相似轨迹来进行哈希映射的轨迹缺失值补全方法,把缺失的轨迹点尽量准确的补全和经过时间范围估计缩小。
所述步骤七使用相似轨迹哈希映射的轨迹缺失值补全方法补全原查询轨迹,进行可视化展示。
以上所述的具体实施例,对本发明的解决的技术问题、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。