一种分析用户轨迹的方法及装置的制造方法

文档序号:10618188阅读:587来源:国知局
一种分析用户轨迹的方法及装置的制造方法
【专利摘要】本发明提供了一种分析用户轨迹的方法及装置,该方法包括:对采集到的用户的信令数据进行清洗;根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹,本发明的方法能简单、高效地分析信令数据。
【专利说明】
一种分析用户轨迹的方法及装置
技术领域
[0001]本发明涉及移动通信及数据挖掘技术领域,特别涉及一种分析用户轨迹的方法及装置。【背景技术】
[0002] 分析用户轨迹可以预测用户位置,挖掘用户移动的行为特征。目前基于信令数据的用户位置分析系统,尤其是在移动通信领域中通过信令数据来挖掘用户轨迹特征、预测用户位置的方法有:第一种,通过用户移动设备上安装终端工具,收集用户一定量的轨迹数据,对其进行抽象化处理,调用PrefixSpan挖掘算法得到基于用户位置信息的运动模式并进行建模,构造模式树(模式树包含所有运动模式及其采用不同起点和终点的概率),同时分析用户在线运动情况得到按照起点和终点位置数据进行组织的运动模式集,将运动模式集结果和挖掘出的运动模式进行匹配和查找来预测用户位置。第二种,通过移动通信网用户无线上网信息采集用户实时位置数据如时间字段信息、地点字段信息,同时对获取到的用户移动数据进行清洗处理,输出一个已处理的用户移动数据信息,并结合根据用户的历史移动行为分析得到的转移概率矩阵,构造马尔科夫模型进行分析计算,从而预测其访问各个地点的可能性,做出用户最大可能访问的地点预测。但这两种方法存在如下缺点:对信令数据采用的分析方法复杂且计算量大,同时缺少对历史数据的优化处理。
【发明内容】

[0003]本发明实施例的目的在于提供一种分析用户轨迹的方法及装置,能简单、高效地分析信令数据。
[0004] 为了达到上述目的,本发明的实施例提供了一种分析用户轨迹的方法,该方法包括:
[0005]对采集到的用户的信令数据进行清洗;
[0006]根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;
[0007]根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。
[0008] 其中,对采集到的用户的信令数据进行清洗的步骤包括:
[0009]对采集到的用户的信令数据中的残缺信令数据进行补全;
[0010]根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据;[〇〇11] 若是错误信令数据,则纠正该错误信令数据;
[0012]对纠正后的用户的信令数据进行去重处理。
[0013] 其中,根据清洗后的信令数据,得到用户的运动轨迹参数的步骤包括:
[0014] 从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;
[0015]根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;
[0016]根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
[0017]其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
[0018]根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;
[0019]判断该给定用户进入该小区的平均时间是否在第二预设时间段内;
[0020]若该给定用户进入该小区的平均时间在第二预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段;
[0021]若该给定用户在该小区的停留时间覆盖第三预设时间段,则确定该小区为该给定用户的居住地。
[0022]其中,根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据的步骤之后,方法还包括:
[0023]判断该给定用户进入该小区的平均时间是否在第四预设时间段内;
[0024]若该给定用户进入该小区的平均时间在第四预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段;
[0025]若该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段,则确定该小区为该给定用户的工作地。
[0026]其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
[0027]根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
[0028]其中,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:
[0029]根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。[〇〇3〇]本发明的实施例还提供了一种分析用户轨迹的装置,该装置包括:
[0031]清洗模块,用于对采集到的用户的信令数据进行清洗;
[0032]获得模块,用于根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;
[0033]确定模块,用于根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。
[0034]其中,清洗模块包括:
[0035]补全单元,用于对采集到的用户的信令数据中的残缺信令数据进行补全;
[0036]判断单元,用于根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据,并当补全后的用户的信令数据是错误信令数据时,触发纠正单元;
[0037]纠正单元,用于根据判断单元的触发,纠正该错误信令数据;
[0038]去重单元,用于对纠正后的用户的信令数据进行去重处理。
[0039]其中,获得模块包括:
[0040]第一单元,用于从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;
[0041]第二单元,用于根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;
[0042]第三单元,用于根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理, 得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
[0043]其中,确定模块包括:
[0044]第四单元,用于根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;
[0045]第五单元,用于判断该给定用户进入该小区的平均时间是否在第二预设时间段内,并当该给定用户进入该小区的平均时间在第二预设时间段内时,触发第六单元;
[0046]第六单元,用于根据第五单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段,并当该给定用户在该小区的停留时间覆盖第三预设时间段时,确定该小区为该给定用户的居住地。
[0047]其中,确定模块还包括:
[0048]第七单元,用于判断该给定用户进入该小区的平均时间是否在第四预设时间段内,并当该给定用户进入该小区的平均时间在第四预设时间段内时,触发第八单元;
[0049]第八单元,用于根据第七单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段,并当该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段时,确定该小区为该给定用户的工作地。
[0050]其中,确定模块还包括:
[0051]第九单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
[0052]其中,确定模块还包括:
[0053]第十单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
[0054]本发明的上述方案至少包括以下有益效果:
[0055]在本发明的实施例的分析用户轨迹的方法中,对采集到的用户的信令数据进行清洗,并根据清洗后的信令数据,得到用户的运动轨迹参数,再根据给定用户的唯一标识从用户的运动轨迹参数中确定出该给定用户的轨迹,从而简单、高效地分析信令数据,确定出给定用户的轨迹。【附图说明】
[0056]图1为本发明实施例中分析用户轨迹的方法的流程图;
[0057]图2为本发明实施例中图1中的步骤11的具体步骤流程图;
[0058]图3为本发明实施例中图1中的步骤12的具体步骤流程图;
[0059]图4为本发明实施例中分析用户轨迹的装置的结构示意图。【具体实施方式】
[0060]为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0061]本发明针对现有技术中分析信令数据较复杂的问题,提供了一种分析用户轨迹的方法及装置,能简单、高效地分析信令数据。
[0062]如图1所示,本发明的实施例提供了一种分析用户轨迹的方法,该方法包括:
[0063]步骤11,对采集到的用户的信令数据进行清洗。
[0064]在本发明的具体实施例中,对采集到的用户的信令数据进行清洗可以提高后续数据分析的正确性。
[0065]步骤12,根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间。
[0066]在本发明的具体实施例中,根据清洗后的信令数据,进行用户轨迹分析。具体地, 可以使用PrefixSpan算法对用户的信令数据进行分析,挖掘出用户的居住地,工作地,及用户习惯性的运动轨迹等。
[0067]步骤13,根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。
[0068]在本发明的具体实施例中,可根据给定用户的唯一标识,从步骤12中得到的用户的运动轨迹参数中确定出该给定用户的轨迹。
[0069]在本发明的具体实施例中,利用PrefixSpan算法分析用户行为轨迹,该分析方法简单高效,以便实现简单、高效地分析信令数据。其中利用PrefixSpan算法分析用户行为轨迹对于本领域的技术人员来说是公知常识,在此不再赘述。
[0070]其中,在本发明的上述实施例中,如图2所示,步骤11的具体步骤为:
[0071]步骤21,对采集到的用户的信令数据中的残缺信令数据进行补全。
[0072]在本发明的具体实施例中,可以通过线性、均值等常见的方式对采集到的用户的信令数据中的残缺信令数据进行补全。在补全的过程中,若出现无法补全的信令数据,则舍弃该信令数据。
[0073]步骤22,根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据。
[0074]步骤23,若是错误信令数据,则纠正该错误信令数据。
[0075]在本发明的具体实施例中,需要根据信令数据规则判断出补全后的信令数据中的错误信令数据,并纠正这些错误的信令数据。在纠正的过程中,若出现无法纠正的信令数据,则舍弃该信令数据。
[0076]步骤24,对纠正后的用户的信令数据进行去重处理。
[0077]在本发明的具体实施例中,需要去除纠正后的信令数据中的重复的信令数据,以便提高后续数据分析的正确性。
[0078]其中,在本发明的上述实施例中,如图3所示,上述步骤12的具体步骤为:
[0079]步骤31,从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序。
[0080]步骤32,根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间。
[0081]在本发明的具体实施例中,从清洗后的信令数据中获取用户每一天的所有信令数据,得到的信令数据的格式可以是{userlD, [cellIDl,entertime,residenceTime], [ce 11ID2, entertime, residenceTime],…},其中:userID 为某用户的唯一标识;cell ID 1 为用户进入此小区的唯一标识;entertime为用户userlD进入小区celllDl的进入时间; residenceTime为用户userlD进入小区celllDl的停留时间。获得每一天的所有信令数据后,会按照用户进入不同小区在时间的先后顺序对用户信令数据排序,从而得到用户每一天的轨迹。进一步地,还可以对上述每一天的信令数据进行处理得到其它的轨迹参数 (例如用户一天中平均进入小区celllDl的进入时间等)。具体地,可以经过分析处理得到如下格式的数据:{userlD, [celllDl, firstEntertime,endEntertime,avgEntertime, minResidenceTime,maxResidenceTime],[cellID2, firstEntertime, endEntertime, minResidenceTime,maxResidenceTime,avgResidenceTime],Probability},其中:userlD 为某用户的唯一标识;celllDl为用户进入此小区的唯一标识;firstEntertime为用户 userlD 一天中最早进入小区celllDl的进入时间;endEntertime为用户userlD —天中最晚进入小区celllDl的进入时间;avgEntertime为用户userlD —天中平均进入小区 celllDl的进入时间;minResidence为用户userlD进入小区celllDl的停留最短时间; maxResidence为用户userlD进入小区celllDl的停留最长时间;avgResidenceTime为用户userlD进入小区celllDl的平均停留时间;Probability为为用户userlD已经小区 celllDl后,可能会进入小区cellID2的概率。
[0082]步骤33,根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
[0083]在本发明的具体实施例中,可以根据用户当前的位置,实时更新用户轨迹分析挖掘出来的数据,且对最新(即离当前时刻最近)的数据赋予更高的权重,弱化历史数据的信息,从而为用户轨迹的分析提供最新的可靠信息。
[0084]在本发明的具体实施例中,具体的预设天数可根据业务的需求进行调整。接下来以35天为例进行说明。在获得用户UserlD在小区celllDl的最近35天的数据后。将35 天数据分为5周,计算出用户UserlD每周进入小区celllDl的最早进入时间,早进入时间, 最晚进入时间、最短停留时间,最长停留时间等,得到的每周的数据为{userlD, [celllDl, f irstEntertime, endEntertime,avgEntertime,minResidenceTime,maxResidenceTime],对五周数据进行加权处理。计算加权公式可以为:5*最近第一周数据+4*最近第二周数据+3* 最近第三周数据+2*最近第四周数据+最近第五周数据A5+4+3+2+1),根据此公式对历史数据进行了弱化,对最新数据赋予更高的权重。可得到用户userlD在小区celllDl最终的最早进入时间,最晚进入时间、最短停留时间,最长停留时间等。可以理解的是,在本发明的实施例中,并不限定加权处理的具体公式,只要对最新的数据赋予更高的权重,弱化历史数据即可。
[0085]在本发明的具体实施例中,根据用户的实时位置信息动态调整用户的轨迹参数, 提高了确定用户轨迹的精度。
[0086]其中,在本发明的具体实施例中,上述步骤13的具体步骤可以为:根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;判断该给定用户进入该小区的平均时间是否在第二预设时间段内;若该给定用户进入该小区的平均时间在第二预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段;若该给定用户在该小区的停留时间覆盖第三预设时间段,则确定该小区为该给定用户的居住地。
[0087]在本发明的具体实施例中,可以将第一预设时间设为5小时,第二预设时间段设为18点至24点,第三预设时间段设为凌晨1点至凌晨6点,可以理解的是,在本发明的实施例中,并不限定第一预设时间、第二预设时间段以及第三预设时间段的具体数值。
[0088]在本发明的具体实施例中,可根据给定用户放入userlD,扫描上述分析数据获取此用户在某小区最短停留时间大约5小时的数据,再获取进入此小区的平均进入时间,若平均进入时间为18点至24点,且停留时间可覆盖凌晨1点凌至晨6点的小区,可判断此小区为用户的居住地。
[0089]其中,在本发明的具体实施例中,根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据的步骤之后,方法还包括:判断该给定用户进入该小区的平均时间是否在第四预设时间段内;若该给定用户进入该小区的平均时间在第四预设时间段内,则进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段;若该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段,则确定该小区为该给定用户的工作地。
[0090]在本发明的具体实施例中,可将第四预设时间段设为7点至9点,第五预设时间段设为9点半至11点半,第六预设时间段设为14点半至17点半。可以理解的是,在本发明的实施例中并不限定第四预设时间段、第五预设时间段以及第六预设时间段的具体数值。
[0091]在本发明的具体实施例中,可根据给定用户的userlD,扫描上述分析数据获取此用户在某小区最短停留时间大约5小时的数据,再获取进入此小区的平均进入时间,若平均进入时间为7点至9点,且停留时间可覆盖9点半至11点半及14点半至17点半的小区, 可判断此小区为用户的工作地。
[0092]其中,在本发明的上述实施例中,上述步骤13的具体步骤还可以为:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
[0093]在本发明的具体实施例中,可根据给定用户的userlD、用户当前所在小区的ID以及进入此小区的时间,扫描上述分析数据,获取此用户在此小区的平均停留时间,再根据用户进入该小区的时间,可得到用户可能离开的时间。
[0094]其中,在本发明的上述实施例中,上述步骤13的具体步骤还可以为:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
[0095]在本发明的具体实施例中,可根据给定用户的userlD、用户当前所在小区的ID以及进入此小区的时间,扫描上述分析数据,获取用户接下来最有可能出现在哪个小区。具体地,可从分析数据中的Probability字段中得到在下一小区出现的概率,及在下一小区的停留时间。
[0096]为了更好的实现上述目的,如图4所示,本发明的实施例提供了一种分析用户轨迹的装置,该装置包括:
[0097]清洗模块41,用于对采集到的用户的信令数据进行清洗;
[0098]获得模块42,用于根据清洗后的信令数据,得到用户的运动轨迹参数,运动轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个小区内的最短停留时间和最长停留时间;
[0099]确定模块43,用于根据给定用户的唯一标识和用户的运动轨迹参数,确定给定用户的轨迹。
[0100]其中,清洗模块41包括:[〇1〇1]补全单元,用于对采集到的用户的信令数据中的残缺信令数据进行补全;
[0102]判断单元,用于根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据,并当补全后的用户的信令数据是错误信令数据时,触发纠正单元;
[0103]纠正单元,用于根据判断单元的触发,纠正该错误信令数据;
[0104]去重单元,用于对纠正后的用户的信令数据进行去重处理。
[0105]其中,获得模块42包括:
[0106]第一单元,用于从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先后顺序对获取到的每天的信令数据进行排序;
[0107]第二单元,用于根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,每天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;
[0108]第三单元,用于根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理, 得到用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。
[0109]其中,确定模块43包括:
[0110]第四单元,用于根据给定用户的唯一标识,通过扫描用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;
[0111]第五单元,用于判断该给定用户进入该小区的平均时间是否在第二预设时间段内,并当该给定用户进入该小区的平均时间在第二预设时间段内时,触发第六单元;
[0112]第六单元,用于根据第五单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第三预设时间段,并当该给定用户在该小区的停留时间覆盖第三预设时间段时,确定该小区为该给定用户的居住地。
[0113]其中,确定模块43还包括:
[0114]第七单元,用于判断该给定用户进入该小区的平均时间是否在第四预设时间段内,并当该给定用户进入该小区的平均时间在第四预设时间段内时,触发第八单元;
[0115]第八单元,用于根据第七单元的触发,进一步判断该给定用户在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段,并当该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段时,确定该小区为该给定用户的工作地。
[0116]其中,确定模块43还包括:
[0117]第九单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。
[0118]其中,确定模块43还包括:
[0119]第十单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时间,通过扫描用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一标识以及在该小区中停留的时间。
[0120]需要说明的是,本发明实施例提供的分析用户轨迹的装置是应用上述方法的装置,即上述方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。
[0121]以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【主权项】
1.一种分析用户轨迹的方法,其特征在于,包括:对采集到的用户的信令数据进行清洗;根据清洗后的信令数据,得到用户的运动轨迹参数,所述运动轨迹参数包括用户的唯 一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以及用户在每个 小区内的最短停留时间和最长停留时间;根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹。2.如权利要求1所述的方法,其特征在于,所述对采集到的用户的信令数据进行清洗 的步骤包括:对采集到的用户的信令数据中的残缺信令数据进行补全;根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数据;若是错误信令数据,则纠正该错误信令数据;对纠正后的用户的信令数据进行去重处理。3.如权利要求1所述的方法,其特征在于,所述根据清洗后的信令数据,得到用户的运 动轨迹参数的步骤包括:从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不同小区的时间先 后顺序对获取到的每天的信令数据进行排序;根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,所述每天的轨迹参数 包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早时间和最晚时 间以及用户每天在每个小区内的最短停留时间和最长停留时间;根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到用户的运动轨 迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。4.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户 的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识,通过扫描所述用户的运动轨迹参数,获取该给定用户在小 区内的最短停留时间为第一预设时间对应的运动轨迹数据;判断该给定用户进入该小区的平均时间是否在第二预设时间段内;若该给定用户进入该小区的平均时间在第二预设时间段内,则进一步判断该给定用户 在该小区的停留时间是否覆盖第三预设时间段;若该给定用户在该小区的停留时间覆盖第三预设时间段,则确定该小区为该给定用户 的居住地。5.如权利要求4所述的方法,其特征在于,所述根据给定用户的唯一标识,通过扫描所 述用户的运动轨迹参数,获取该给定用户在小区内的最短停留时间为第一预设时间对应的 运动轨迹数据的步骤之后,所述方法还包括:判断该给定用户进入该小区的平均时间是否在第四预设时间段内;若该给定用户进入该小区的平均时间在第四预设时间段内,则进一步判断该给定用户 在该小区的停留时间是否覆盖第五预设时间段和第六预设时间段;若该给定用户在该小区的停留时间覆盖第五预设时间段和第六预设时间段,则确定该 小区为该给定用户的工作地。6.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时 间,通过扫描所述用户的运动轨迹参数,得到该给定用户离开当前所在小区的时间。7.如权利要求1所述的方法,其特征在于,所述根据给定用户的唯一标识和所述用户 的运动轨迹参数,确定给定用户的轨迹的步骤包括:根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及进入该小区的时 间,通过扫描所述用户的运动轨迹参数,得到该给定用户下一个最可能出现的小区的唯一 标识以及在该小区中停留的时间。8.—种分析用户轨迹的装置,其特征在于,包括:清洗模块,用于对采集到的用户的信令数据进行清洗;获得模块,用于根据清洗后的信令数据,得到用户的运动轨迹参数,所述运动轨迹参数 包括用户的唯一标识、每个小区的唯一标识、用户进入每个小区的最早时间和最晚时间以 及用户在每个小区内的最短停留时间和最长停留时间;确定模块,用于根据给定用户的唯一标识和所述用户的运动轨迹参数,确定给定用户 的轨迹。9.如权利要求8所述的装置,其特征在于,所述清洗模块包括:补全单元,用于对采集到的用户的信令数据中的残缺信令数据进行补全;判断单元,用于根据信令数据规则,判断补全后的用户的信令数据是否为错误信令数 据,并当补全后的用户的信令数据是错误信令数据时,触发纠正单元;纠正单元,用于根据所述判断单元的触发,纠正该错误信令数据;去重单元,用于对纠正后的用户的信令数据进行去重处理。10.如权利要求8所述的装置,其特征在于,所述获得模块包括:第一单元,用于从清洗后的信令数据中获取用户每天的信令数据,并按照用户进入不 同小区的时间先后顺序对获取到的每天的信令数据进行排序;第二单元,用于根据排序后的信令数据,得到预设天数内用户每天的轨迹参数,所述每 天的轨迹参数包括用户的唯一标识、每个小区的唯一标识、用户每天进入每个小区的最早 时间和最晚时间以及用户每天在每个小区内的最短停留时间和最长停留时间;第三单元,用于根据预设权值,对预设天数内用户每天的轨迹参数进行加权处理,得到 用户的运动轨迹参数,其中,距离当前时刻越远的轨迹参数的预设权值越小。11.如权利要求8所述的装置,其特征在于,所述确定模块包括:第四单元,用于根据给定用户的唯一标识,通过扫描所述用户的运动轨迹参数,获取该 给定用户在小区内的最短停留时间为第一预设时间对应的运动轨迹数据;第五单元,用于判断该给定用户进入该小区的平均时间是否在第二预设时间段内,并 当该给定用户进入该小区的平均时间在第二预设时间段内时,触发第六单元;第六单元,用于根据所述第五单元的触发,进一步判断该给定用户在该小区的停留时 间是否覆盖第三预设时间段,并当该给定用户在该小区的停留时间覆盖第三预设时间段 时,确定该小区为该给定用户的居住地。12.如权利要求11所述的装置,其特征在于,所述确定模块还包括:第七单元,用于判断该给定用户进入该小区的平均时间是否在第四预设时间段内,并当该给定用户进入该小区的平均时间在第四预设时间段内时,触发第八单元;第八单元,用于根据所述第七单元的触发,进一步判断该给定用户在该小区的停留时 间是否覆盖第五预设时间段和第六预设时间段,并当该给定用户在该小区的停留时间覆盖 第五预设时间段和第六预设时间段时,确定该小区为该给定用户的工作地。13.如权利要求8所述的装置,其特征在于,所述确定模块还包括:第九单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及 进入该小区的时间,通过扫描所述用户的运动轨迹参数,得到该给定用户离开当前所在小 区的时间。14.如权利要求8所述的装置,其特征在于,所述确定模块还包括:第十单元,用于根据给定用户的唯一标识、该给定用户当前所在小区的唯一标识以及 进入该小区的时间,通过扫描所述用户的运动轨迹参数,得到该给定用户下一个最可能出 现的小区的唯一标识以及在该小区中停留的时间。
【文档编号】H04W24/02GK105989226SQ201510075261
【公开日】2016年10月5日
【申请日】2015年2月12日
【发明人】杨魁
【申请人】中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1