一种分析用户WiFi活动轨迹规律的分布式实现方法与流程

文档序号:12494403阅读:来源:国知局

技术特征:

1.一种分析用户WiFi活动轨迹规律的分布式实现方法,其特征在于,包括以下步骤:

(a)轨迹提取:后台服务器查询模块查询后台服务器数据库中的用户移动端MAC地址所对应的WiFi扫描记录,所述WiFi扫描记录为由多台WiFi采集设备采集记录并由所述WiFi采集设备上传至所述后台服务器数据库;

将所述WiFi扫描记录按采集时间进行排序获得WiFi扫描轨迹E={ e1,e2,…,en },其中ei=<pi, ti>,i为自然数,ei表示轨迹点,pi表示地理位置,ti表示扫描时间;

(b)轨迹点预处理:后台服务器的数据处理模块依次遍历WiFi扫描轨迹E,对任意连续的两个轨迹点记录ei和ei+1,如果pi = pi+1且ti+1- ti < Δt,则将所述ei和ei+1两条记录合并为一个复合轨迹点记录ei'= <pi,tiin,tiout>,其中, tiin=ti, tiout= ti+1;由合并后的复合轨迹点记录ei'组成WiFi扫描轨迹E'={ e1', e2',…,en'},其中ei'=<pi,tiin,tiout>,n为自然数,pi表示地理位置,tiin表示ei'采集开始时间,tiout表示ei'采集结束时间;

(c)轨迹片段划分:根据预定规则对步骤(b)中获得的WiFi扫描轨迹E'进行分割,获得只包含有序位置轨迹点位置的多条轨迹片段,并由所述多条轨迹片段得到轨迹集合TR;

(d)频繁轨迹提取:采用并行算法计算步骤(b)中获取的轨迹集合TR中的轨迹点pi出现频率次数,得到频繁轨迹点,进而使用并行后缀树算法实现频繁轨迹提取;

(e)建立语义化模型:对频繁轨迹产生时间的星期和小时进行语义化定义;

(f)建立轨迹语义化:获取频繁轨迹的时间尺度频率次数中次数最多的星期和小时,根据语义化模型将轨迹路径进行分类,获取频繁轨迹的语义化模型。

2.根据权利要求1所述的分析用户WiFi活动轨迹规律的分布式实现方法,其特征在于,所述预定规则包括规则一和规则二:

规则一:如果一个轨迹点<pi,tiin,tiout>的停留时间τi= tiout - tiin >Δt,则将轨迹在pi处进行分割,且将地理位置点pi作为上一段轨迹片段的终点和下一段轨迹片段的起点;

规则二:如果两个轨迹点<pi,tiin,tiout>和<pi+1,ti+1in,ti+1out>的间隔时间τi'= ti+1in - tiout> Δt,则将轨迹在pi处进行分割,其中pi作为上一段轨迹片段的终点,pi+1作为下一段轨迹片段的起点;

根据规则一或规则二对WiFi扫描轨迹E'进行分割后获得轨迹集合TR={TR1, TR2, …, TRn},其中第i条轨迹片段TRi= {pi1, pi2, … , pim},pim表示第i条轨迹片段中的用户移动端经过的第m项轨迹点位置,pim对应WiFi采集设备地理位置。

3.根据权利要求2所述的分析用户WiFi活动轨迹规律的分布式实现方法,其特征在于,所述频繁轨迹提取包括以下步骤:

步骤一,对步骤(b)中的每个项pim对应的WiFi采集设备地理位置PI在TR中出现的频率次数进行计数,然后将WiFi采集设备PI出现频率次数进行降序排序,并从TR中过滤出WiFi采集设备PI出现频率次数大于最小支持度的项作为频繁轨迹点;

步骤二:采用均衡分组算法将步骤1中获得的对应频繁轨迹点均匀地划分到Q个分组中,平衡所有组内的计算负载,其中Q为大于1的自然数;

步骤三:获得每条轨迹片段TRi的后缀模式,所述轨迹片段TRi的后缀{pi1, pi2, … , pim}包括多种组成模式,所述组成模式为将轨迹片段TRi中所有的有序轨迹点位置任意分成两部分然后由后一部分有序轨迹点位置组成,一种所述组成模式为所述轨迹片段TRi的一种后缀模式;根据后缀模式中第一项是否为频繁轨迹点来判断所述后缀模式的分组,其中,若后缀模式中第一项为频繁轨迹点,则将所述后缀模式归属到其第一项对应的频繁轨迹点所在的分组;若后缀模式中第一项不是频繁轨迹点,则该后缀模式被自动过滤不进入任意分组中;

步骤四:对每个分组构建一个后缀树,获得Q个后缀树,由Q个后缀树构造并行后缀树,对并行后缀树进行并行处理;后缀树的创建为首先建立树的根节点,然后扫描同一个分组内的所有TRi的后缀模式,并对每个后缀模式创建分枝,所述后缀模式中任意轨迹点位置pim为所述后缀模式分枝的节点,将所有的后缀模式分枝连接到根节点,获得每个分组的后缀树,并对所述后缀树进行压缩处理;

步骤五:对后缀树每个后缀树模式分枝内有序的各节点依次计数,通过节点的计数与最小支持度的比较确定频繁轨迹片段,即若某一节点的计数小于最小支持度则停止对所述后缀树模式分枝内后续节点的计数且所述计数小于最小支持度时的节点前面所有节点组合形成一条频繁轨迹片段;或者若所述后缀模式分枝所有节点的计数均满足大于等于最小支持度则所述后缀模式分枝为频繁轨迹片段,由频繁轨迹片段组成频繁轨迹。

4.根据权利要求3所述的分析用户WiFi活动轨迹规律的分布式实现方法,其特征在于,所述最小支持度为频率次数阈值,所述频率次数阈值根据环境进行设置。

5.根据权利要求3所述的分析用户WiFi活动轨迹规律的分布式实现方法,其特征在于,对所述TRi的后缀模式形成的后缀树进行压缩处理方法为:所述后缀模式分枝内某一节点后的节点均为其子节点,若后缀模式分枝内的节点只有一个子节点,且满足该节点的计数与该节点的子节点的计数相同,则将该节点与其子节点合并为一个节点。

6.根据权利要求1所述的分析用户WiFi活动轨迹规律的分布式实现方法,其特征在于,根据频繁轨迹产生时间的星期和小时建立语义化模型,其中将星期分为工作日和休息日,当星期为工作日时,小时分为n个时间段,对n个时间段分别语义化定义n个事件;当星期为休息日时,小时分为m个时间段,对m个时间段分别语义化定义m个事件。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1