一种基于签到数据的时空轨迹相似性度量方法及系统的制作方法_2

文档序号:9489510阅读:来源:国知局
图3为本发明的基于签到数据的时空轨迹相似性度量系统的流程图。
【具体实施方式】
[0020] 下面给出本发明的【具体实施方式】,结合附图对本发明进行详细说明。
[0021] 本发明提供一种基于签到数据的时空轨迹相似性度量方法及系统,这部分提供算 法的详细说明,说明过程以两个用户的时空轨迹间的相似性度量为例,本方法可以推广到 计算多个用户的时空轨迹间的两两相似性度量。
[0022] 如图2所示,本发明公开一种基于签到数据的时空轨迹相似性度量方法,包括: 步骤1 :获取用户签到数据,包括用户ID、签到位置和签到时间等; 新浪微博、街旁、人人、Foursquare、Gowalla等基于地理位置的移动社交网络近年来发 展迅猛,大量用户通过智能手机以签到的方式记录时空行为轨迹,因此,可以通过它们提供 的API,抓取到需要的用户签到数据。
[0023] 步骤2 :对用户签到数据进行预处理,包括无用数据过滤、类型转换和格式统一; 分析表明,对位置数据中的无效用户(即注册后很少签到的用户,例如签到次数少于5 次的用户)进行挖掘是没有意义的,因此,需要移除无意义点,减少数据量。同时,还要对签 到数据进行预处理,将签到位置的经炜度坐标转换为平面直角坐标以及进行格式统一等。
[0024] 步骤3 :用户兴趣区域的计算; 如图1所示,用户通过手机在社交网站上签到的每一个地理位置称作一个兴趣点(PointofInterest,Ρ0Ι),把用户签到时间划分成T个时间段,利用OPTICS聚类算法对 每个时间段的用户签到兴趣点Ρ0Ι进行基于密度的分层聚类,将用户经常访问的兴趣点 Ρ0Ι进行分层聚集,从而得到不同时间段、不同空间划分尺度下的用户兴趣区域(Regionof Interest,R0I),避免了单一空间划分尺度对聚类结果的影响。同时,可以将用户偶尔访问 的或只有少数用户访问的兴趣点作为噪声过滤掉。
[0025] 步骤4 :相似兴趣区域的计算; 在每一层,计算用户在每个时间段的每个兴趣区域的签到次数与其在该时间段签到总 次数的比值,如果两个用户在某个兴趣区域上的比值的差值的绝对值小于设定的阈值,则 这两个用户在该兴趣区域上相似。
[0026] 步骤5 :单层相似度的计算; 两个用户的时空轨迹在h层、全都时间段上的相似度定义 heH,teT,Η为OPTICS聚类的层数,CM为两个用户在h层、t时间段的兴趣区域的个 数,M为两个用户在h层、t时间段相似兴趣区域的个数,α,为各个时间段的权值,
可以根据具体应用,设定各个时间段的权值。例如,在应用于交通信息服务时, 可以将早、晚高峰时段的权值加大,其余时间段的权值降低。
[0027] 步骤6 :跨层相似度的计算; 两个用户的时空轨迹间的跨层相似度定义
其中为各层的权
,层数越高,空间划分尺度越小,权值越大,如果跨层相似度大于设定的阈值, 则两个用户的时空行为轨迹相似。
[0028] 如图3所示,本发明还公开一种基于签到数据的时空轨迹相似性度量系统,包括: 获取用户签到数据模块:用于获取用户签到数据,包括用户ID、签到位置和签到时间 等; 预处理模块:用于对用户签到数据进行预处理,包括无用数据过滤、类型转换和格式统 , 用户兴趣区域计算模块:用于用户兴趣区域的计算; 相似兴趣区域计算模块:用于用户相似兴趣区域的计算; 单层相似度计算模块:用于用户单层相似度的计算; 跨层相似度计算模块:用户跨层相似度的计算。
[0029] 所述的基于签到数据的时空轨迹相似性度量系统,所述用户兴趣区域计算模块还 包括: 把用户签到时间划分成T个时间段,采用OPTICS对用户签到兴趣点进行基于密度的分 层聚类,得到不同时间段、不同空间划分尺度下的用户兴趣区域。
[0030] 所述的基于签到数据的时空轨迹相似性度量系统,所述相似兴趣区域计算模块还 包括: 在每一层,计算用户在每个时间段的每个兴趣区域的签到次数与其在该时间段签到总 次数的比值,如果两个用户在某个兴趣区域上的比值的差值的绝对值小于设定的阈值,则 这两个用户在该兴趣区域上相似。
[0031] 所述的基于签到数据的时空轨迹相似性度量系统,所述单层相似度计算模块还包 括:
两个用户的时空轨迹在h层、全都时间段上的相似度定义 heH,teT,Η为OPTICS聚类的层数,CM为两个用户在h层、t时间段的兴趣区域的个 数,M为两个用户在h层、t时间段相似兴趣区域的个数,α,为各个时间段的权值,
可以根据具体应用,设定各个时间段的权值。
[0032] 所述的基于签到数据的时空轨迹相似性度量系统,所述跨层相似度计算模块还包 括: 两个用户的时空轨迹间的跨层相似度定义 ,其中为各层的权
层数越高,空间划分尺度越小,权值越大,如果跨层相似度大于设定的阈值, 则两个用户的时空行为轨迹相似。
[0033] 本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下,还 可以对以上内容进行各种各样的修改。因此,本发明的范围并不仅限于以上的说明,而是由 权利要求书的范围来确定的。
【主权项】
1. 一种基于签到数据的时空轨迹相似性度量方法,其特征在于,包括: 步骤1 :获取签到数据,包括用户ID、签到位置和签到时间等; 步骤2 :对签到数据进行预处理,包括无用数据过滤、类型转换和格式统一; 步骤3:用户兴趣区域的计算; 步骤4 :相似兴趣区域的计算; 步骤5 :单层相似度的计算; 步骤6:跨层相似度的计算。2. 根据权利要求1所述的基于签到数据的时空轨迹相似性度量方法,其特征在于,所 述步骤3还包括: 步骤21 :把签到时间划分成T个时间段,采用OPTICS对签到兴趣点进行基于密度的分 层聚类,得到不同时间段、不同空间划分尺度下的用户兴趣区域。3. 根据权利要求1所述的基于签到数据的时空轨迹相似性度量方法,其特征在于,所 述步骤4还包括: 步骤31 :在每一层,计算用户在每个时间段的每个兴趣区域的签到次数与其在该时间 段签到总次数的比值,如果两个用户在某个兴趣区域上的比值的差值的绝对值小于设定的 阔值,则运两个用户在该兴趣区域上相似。4. 根据权利要求1所述的基于签到数据的时空轨迹相似性度量方法,其特征在于,所 述步骤5还包括: 步骤41 :两个用户的时空轨迹在h层、全都时间段上的相似度定义为,heH,teT,Η为OPTICS聚类的层数,Ch,t为两个用户在h层、t时间 段的兴趣区域的个数,C^h,t为两个用户在h层、t时间段相似兴趣区域的个数,α1为各 个时间段的权值,可W根据具体应用,设定各个时间段的权值。5. 根据权利要求1所述的基于签到数据的时空轨迹相似性度量方法,其特征在于,所 述步骤6还包括: 步骤51 :两个用户的时空轨迹间的跨层相似度定义为其中Ph为各 层的权值,层数越高,空间划分尺度越小,权值越大,如果跨层相似度大于设定 的阔值,则两个用户的时空行为轨迹相似。6. -种基于签到数据的时空轨迹相似性度量系统,其特征在于,包括: 获取用户签到数据模块:用于获取用户签到数据,包括用户ID、签到位置和签到时间 等; 预处理模块:用于对用户签到数据进行预处理,包括无用数据过滤、类型转换和格式统 * 用户兴趣区域计算模块:用于用户兴趣区域的计算; 相似兴趣区域计算模块:用于用户相似兴趣区域的计算; 单层相似度计算模块:用于用户单层相似度的计算; 跨层相似度计算模块:用户跨层相似度的计算。7. 根据权利要求6所述的基于签到数据的时空轨迹相似性度量系统,其特征在于,所 述用户兴趣区域计算模块还包括: 把用户签到时间划分成T个时间段,采用OPTICS对用户签到兴趣点进行基于密度的分 层聚类,得到不同时间段、不同空间划分尺度下的用户兴趣区域。8. 根据权利要求6所述的基于签到数据的时空轨迹相似性度量系统,其特征在于,所 述相似兴趣区域计算模块还包括: 在每一层,计算用户在每个时间段的每个兴趣区域的签到次数与其在该时间段签到总 次数的比值,如果两个用户在某个兴趣区域上的比值的差值的绝对值小于设定的阔值,贝U 运两个用户在该兴趣区域上相似。9. 根据权利要求6所述的基于签到数据的时空轨迹相似性度量系统,其特征在于,所 述单层相似度计算模块还包括: 两个用户的时空轨迹在h层、全都时间段上的相似度定义3,heΗ, teΤ,Η为OPTICS聚类的层数,Ch,t为两个用户在h层、t时间段的兴趣区域的个数,C' Μ为两个用户在h层、t时间段相似兴趣区域的个数,αt为各个时间段的权值,,可W根据具体应用,设定各个时间段的权值。10. 根据权利要求6所述的基于签到数据的时空轨迹相似性度量系统,其特征在于,所 述跨层相似度计算模块还包括: 两个用户的时空轨迹间的跨层相似度定义为,其中Ph为各层的权 值层数越高,空间划分尺度越小,权值越大,如果跨层相似度大于设定的阔值, 则两个用户的时空行为轨迹相似。
【专利摘要】本发明公开一种基于签到数据的时空轨迹相似性度量方法,所述方法包括:获取签到数据,包括用户ID、签到位置和签到时间等;对签到数据进行预处理,包括无用数据过滤、类型转换和格式统一;用户兴趣区域的计算;相似兴趣区域的计算;单层相似度的计算;跨层相似度的计算等步骤。本发明还公开一种基于签到数据的时空轨迹相似性度量系统,包括:获取用户签到数据模块;预处理模块;用户兴趣区域计算模块;相似兴趣区域计算模块;单层相似度计算模块;跨层相似度计算等模块。
【IPC分类】G06Q30/02, G06F17/30
【公开号】CN105243148
【申请号】CN201510694102
【发明人】刘兴伟, 夏梅宸, 牟峰, 周永, 曾晟珂, 张晓丽
【申请人】西华大学
【公开日】2016年1月13日
【申请日】2015年10月25日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1