一种基于方向统计的市民轨迹隐私保护技术的制作方法

文档序号:12787520阅读:315来源:国知局

本发明属于大数据分析范畴,更准确的讲,涉及到方向统计学、轨迹计算的相关技术。



背景技术:

在智慧城市中,对市民轨迹进行大数据分析,可以得到很多有价值的信息,最终更好的服务于市民。例如:通过车流来预测交通状况,通过人流来对突发事件进行预警,也可以通过个人的轨迹进行个性化画像。在给市民方便的同时,安全问题也是一个不容忽视的重要问题。有别于传统统计学,方向统计学(directional statistics)更关注方向变化信息,例如时钟、星空等,而不是地理位置信息。利用方向统计学对轨迹数据进行聚类分析,能够得到市民轨迹的关键特征。同时由于忽略了位置信息,也能更好的进行隐私保护。但是目前相关的方案和专利还没有。



技术实现要素:

本发明的目的是通过核聚类技术,对智慧城市中大量的市民轨迹数据进行隐私保护。本发明的技术要点如下:

1、轨迹数据的表示问题:常见的轨迹分析一般采用图方式进行表示与计算,这种方式存储量大,噪声多。同时,在轨迹计算中,位置变化的信息(频率、方向)可能更重要,传统的表示方法不能突出这些信息。本发明采用轨迹空间模型(TSM)来表示这种位置变化信息。假设(a1,a2)为图G中的两点,统计二者的位置改变次数,作为一个特征。经过此变换,一个n×n的轨迹图,就表示为一个2×n的向量。这种表 示存储量小,且更能反映位置变化信息;

2、球聚类问题:在TSM模型上,轨迹向量可以表示在一个球面上,利用方向统计对该向量进行聚类分析,常用的方法包括球形k-means、基于vmf模型的EM算法等。但是这些方法都不能解决“噪声维”问题,不适合处理高维数据。本发明利用“熵”平衡的方法来给不同的维度进行加权处理,重要的维度特征突出,相反,“噪声”维则抑制。

附图说明

图1为本发明的流程图。

具体实施方式

参见图1,本发明的主要步骤如下:

步骤1:对市民轨迹数据进行匿名、扰乱等预处理,隐去ID信息;

步骤2:用TSM模型对市民轨迹重新表示,隐去位置信息;

步骤3:基于方向统计对轨迹图进行聚类分析;

步骤4:基于聚类结果,重新对市民轨迹进行表示,并抽取特征。

最后所应说明的是,以上实施例仅用以说明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的实施例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或者等同地替换;而一切不脱离本发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1