一种基于移动轨迹模式的潜在好友发现方法及系统的制作方法

文档序号:10656691阅读:371来源:国知局
一种基于移动轨迹模式的潜在好友发现方法及系统的制作方法
【专利摘要】本发明公开了一种基于移动轨迹模式的潜在好友发现方法,所述方法包括:建立语义描述模型,根据POI数据集描述每一个停留点的语义信息,并对每一类服务进行加权,根据停留点的分布情况,将停留点聚类为位置,并描述每一个位置的语义信息,生成连续的种类轨迹序列,根据生成的种类轨迹序列,提取用户之间共同的种类轨迹子序列CTP,计算用户之间的相似度,为目标用户挑选前k个相似用户。本发明可以为用户发现与其生活模式相同的潜在好友,增加候选服务的个数,有效解决数据稀疏性问题,同时提高用户的服务体验质量,为未来基于位置的社交网络中用户个性化服务推荐提供有益的解决思路。
【专利说明】
-种基于移动轨迹模式的潜在好友发现方法及系统
技术领域
[0001] 本发明设及网络通信领域,特别设及一种基于移动轨迹模式的潜在好友发现方法 及系统。
【背景技术】
[0002] 近年来,随着各种移动终端设备的广泛应用及推广,基于位置的社交网络化BSN) 如!^ursquare JacebookPlace ,Twitter W及街旁等也获得了空前发展。基于位置的社交网 络,其特点是利用用户的签到信息,将在线社交网络和物理位置结合起来,W实现虚拟世界 中基于位置的服务资源的共享与传播。从而,在移动环境下,用户可W及时地获取网络服 务,例如:多媒体服务、天气预测、实时新闻W及交通信息等。经CISCO预测显示:到2016年, 移动数据流量将超过几个艾字节/月,其中视频服务所产生的流量将占总消费流量的86%。 因此,大量的互联网服务被推送到用户端,W提供给用户不同类型的服务选择。但是,由于 传统通信模式的限制,用户经常收到一些无用的信息,甚至用户感兴趣的服务已经被大量 的网络服务淹没。在运种情况下,服务推荐系统逐渐兴起并引起了许多学者的关注。服务推 荐系统可W在大量网络服务中发现满足用户需求的个性化服务W推荐给用户,并提供不同 功能和性能上的服务。
[0003] 与Web捜索引擎不同,服务推荐系统不仅关屯、捜索结果之间的关系和顺序,而且关 屯、用户对不同服务的个性化偏好。传统的服务推荐方法依赖"用户-条目"的二元组信息,包 括协同过滤推荐(CF)和基于内容的推荐(CBR)。尽管如此,随着用户个性化需求的不断增 加,仅仅考虑用户和条目的关系不能精确地向用户提供合适的服务。因此,当用户请求服务 时,上下文信息(例如:时间、位置、社会关系、环境、情感W及网络状态等)需要被考虑在内, W构成"用户-上下文-条目"的=元组信息。并且,随着上下文信息的不断改变,上下文感知 的服务推荐系统(CARS)可W为用户提供自动的、个性化的服务选择。例如:用户A喜欢在公 交车上浏览其感兴趣的小说,而不是在办公室;用户B喜欢在下班后查找相关促销广告信 息,而不是在上班时。因此,如何通过上下文信息挖掘用户的个性化偏好,成为服务推荐系 统的一个重要研究目标。
[0004] 相似用户发现是服务推荐系统的一个关键流程。在基于位置的社交网络中,服务 器凭借"check-in"服务捜集到每个用户日常的位置历史信息,从而利用地理空间和语义空 间之间的关系,提取用户的生活习惯和模式。对于GPS轨迹数据集,由于其空间复杂性和时 间连续性,通过传统的数据挖掘技术(例如:赃风跟踪和动物活动行为)很难提取出用户的 生活习惯。更重要的是,不同的访问位置序列可W反映用户不同的意愿,并且不同地理区域 的用户可能拥有相同的意愿。移动轨迹模式是指由一系列位置的语义信息按照一定的顺序 组成的一组序列,它可W有效地描述用户的生活规律和偏好。例如:如果一个用户的日常活 动顺序为"购物"^ "吃饭"^ "看电影",那么他/她的移动轨迹模式可W被提取为"商场"^ "餐馆电影院"。因此,从移动轨迹模式的角度出发,通过比较用户之间的轨迹模式相似 度,为目标用户发现其潜在好友,将为未来基于位置的社交网络中用户个性化服务推荐提 供有益的解决思路。

【发明内容】

[0005] 为了发现与用户生活模式相同的潜在好友,增加候选服务的个数,提高用户的服 务体验质量,本发明提供了一种基于移动轨迹模式的潜在好友发现方法及系统。所述技术 方案如下:
[0006] -种基于移动轨迹模式的潜在好友发现方法,所述方法包括:
[0007] 建立语义描述模型,根据POI数据集描述每一个停留点的语义信息,并对每一类服 务进行加权;
[0008] 根据停留点的分布情况,将停留点聚类为位置,并描述每一个位置的语义信息,生 成连续的种类轨迹序列;
[0009] 根据生成的种类轨迹序列,提取用户之间共同的种类轨迹模式CTP;
[0010] 计算用户之间的相似度,将用户按相似度进行排序,为目标用户挑选前k个相似用 户。
[0011] 所述语义描述模型包括:
[0012] 用S表示停留点的集合,计算一个停留点Si的坐标,得到由停留点组成的轨迹; [001引计算停留点的种类权重,得到停留点关于种类的特征向量。
[0014] 所述方法还包括:
[0015] 初始化停留点集合,计算移动轨迹的长度;
[0016] 判断任意两点间的距离是否小于阀值,并且时间是否大于阀值,如果否,则删除。 [0017]计算中屯、节点的坐标;
[001引将该中屯、节点添加至停留点集合中。
[0019] 所述种类轨迹描述方法包括:
[0020] 将停留点聚类为位置,得到位置轨迹序列;
[0021] 利用停留点中每一类型的非零权重值的个数,计算位置所对应的PO巧巾类的权重, 得到位置关于种类的特征向量;
[0022] 聚类位置的特征向量,使每一个位置被划分为不同的种类,得到种类轨迹序列。
[0023] 所述方法还包括:
[0024] 初始化位置集合,计算停留点集合中的元素个数;
[0025] 创建一个位置,将停留点加入到该位置中,并计算位置坐标;
[0026] 判断停留点到位置的距离是否大于阀值,如果是,则创建下一个位置,将停留点加 入到该位置中,计算位置坐标,如果否,则将停留点加入到该位置,更新位置坐标;
[0027] 将该位置添加至位置集合中。
[0028] 所述共同轨迹模式提取方法包括:
[0029] 初始化轨迹模式集合,定义子序列的长度;
[0030] 检索两个用户语义轨迹中的各个节点;
[0031] 判断两个语义点是否相同,如果否,则删除,继续检索,如果是,进行下一步;
[0032] 标记该点的位置,从该点开始查找是否有规定长度阀值的子序列,如果否,则删 除,继续检索,如果是,则将该子序列加入至轨迹模式集合中。
[0033] 所述相似用户发现方法包括:
[0034] 通过提取出的共同轨迹模式,从类型流行度和活动序列两个方面计算用户之间的 相似度;
[0035] 将用户按相似度按从大到小排序,从而为目标用户挑选出前k个相似用户。
[0036] -种基于移动轨迹模式的潜在好友发现系统,所述系统包括停留点检测模块、停 留点语义描述模块、位置检测模块、位置语义描述模块、共同轨迹模式提取模块W及相似用 户发现模块,其中,
[0037] 所述停留点检测模块,用于检测原始GPS轨迹数据中,所存在的具有一定驻留行为 的点;
[0038] 所述停留点语义描述模块,用于对检测到的停留点进行语义信息的描述;
[0039] 所述位置检测模块,用于检测停留点数据中,所存在的反映用户移动行为的点;
[0040] 所述位置语义描述模块,用于对检测到的位置进行语义信息的描述;
[0041] 所述共同轨迹模式提取模块,用于从语义轨迹中提取出用户之间共同的轨迹模 式;
[0042] 所述相似用户发现模块,用于计算用户之间的相似度,并为目标用户挑选前k个相 似用户。
[0043] 本发明实施例提供的技术方案带来的有益效果是:
[0044] 建立语义描述模型,根据POI数据集描述每一个停留点的语义信息,并对每一类服 务进行加权,根据停留点的分布情况,将停留点聚类为位置,并描述每一个位置的语义信 息,生成连续的种类轨迹序列,根据生成的种类轨迹序列,提取用户之间共同的种类轨迹子 序列CTP,计算用户之间的相似度,为目标用户挑选前k个相似用户。本发明实施例提供的方 案,可W为用户发现与其生活模式相同的潜在好友,增加候选服务的个数,有效解决数据稀 疏性问题,同时提高用户的服务体验质量,为未来基于位置的社交网络中用户个性化服务 推荐提供有益的解决思路。
【附图说明】
[0045] 图1是本发明实施例一提供的基于移动轨迹模式的潜在好友发现方法原理流程 图;
[0046] 图2是本发明实施例一提供的停留点检测算法示意图;
[0047] 图3是本发明实施例一提供的位置检测算法示意图。
[0048] 图4是本发明实施例一提供的共同轨迹模式提取算法示意图。
[0049] 图5是本发明实施例二提供的基于移动轨迹模式的潜在好友发现系统结构示意 图。
【具体实施方式】
[0050] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。
[0051] 本发明提出了一种基于移动轨迹模式的潜在好友发现方法,将用户的地理位置信 息映射为语义描述信息,挖掘用户的兴趣、偏好W及个人生活习惯,目的是为用户发现与其 生活模式相同的潜在好友,增加候选服务的个数,有效解决数据稀疏性问题,同时提高用户 的服务体验质量,为未来基于位置的社交网络中用户个性化服务推荐提供有益的解决思 路。
[0052] 本发明提供的语义描述模型,根据POI数据集描述每一个停留点的语义信息,并对 每一类服务进行加权,再根据停留点的分布情况,将停留点聚类为位置,并描述每一个位置 的语义信息,生成连续的种类轨迹序列,再根据生成的种类轨迹序列,提取用户之间共同的 种类轨迹子序列CTP,计算用户之间的相似度,为目标用户挑选前k个相似用户。
[0053] 实施例一
[0054] 如图1所示,为本发明实施例提供的基于移动轨迹模式的潜在好友发现方法原理 流程图,其中,
[0055] 步骤10,建立语义描述模型,根据POI数据集描述每一个停留点的语义信息,并对 每一类服务进行加权。
[0056] 在用户原始的轨迹数据中,每一个移动的地理位置都可W被看作是具有经缔度信 息的点。停留点的定义为:停留点表示一个区域,在运个区域内用户停留了一段时间,并且 做了一项有意义的活动。一种情况是用户进入到一座卫星信号弱的建筑内,例如:购物中 屯、、电影院、剧院或者博物馆等;另一种情况是用户在地理区域外部逗留,但并没有穿过该 区域,例如:观光旅游。
[0057] 用S表示停留点的集合,一个停留点Si可W表示为:
[0化引
無成(1)
[0059] 其中W(Ion)和W(Iat)分别代表每一个原始点W的经缔度,由停留点组成的轨迹 表示为 Tra_s = si 一 S2 一---->Sn〇
[0060] 为了挖掘用户的兴趣和偏好,只知道用户在地理空间上的活动轨迹是不够的,语 义空间能描述每一个地理位置所对应的语义信息,并且通过利用获取到的语义信息,本发 明能够挖掘出生活在不同地理区域的、具有相同语义信息的相似用户。POI标识了每一个地 理位置点所具有的服务名称、类别、W及经缔度信息,通过TF-IDF算法,停留点所对应的POI 种类的权重可W被计算为:
[0061]
公式口)
[0062] 其中,N表示在该区域中存在的总POI个数,n康示类型i的POI个数,S康示类型i的 停留点集合。
[0063] 每一个停留点的特征向量可W表示为fs=<Wl,W2, . . .,Wn>,从而停留点被赋予 了一定的语义信息。
[0064] 具体的停留点检测算法如图2所示,其中,
[0065] 1)初始化停留点集合,计算移动轨迹的长度。
[0066] 2)判断任意两点间的距离是否小于阀值,并且时间是否大于阀值,如果否,则返回 到1)。
[0067] 3)计算中屯、节点的坐标。
[0068] 4)将该中屯、节点添加至停留点集合中。
[0069] 步骤20,根据停留点的分布情况,将停留点聚类为位置,并描述每一个位置的语义 信息,生成连续的种类轨迹序列。
[0070] 停留点有时不能完全区分用户在一个语义空间上所具有的行为,例如:两个不同 的停留点,分别位于清华大学的两个不同的活动场地,但是运两个停留点属于相同的语义 描述范畴。为了给每个用户建立统一的行为描述信息,本发明利用下式将停留点聚类为位 置:
[00711
公式(3)
[0072] 一个用户的位置轨迹序列可W表示为ha_L = ^^L2^…^Ln,每一个位置L代表 一个地理区域,在该区域中包含一些语义空间上的停留点,例如:商场、电影院等。不同用户 的相似停留点被分配到相同的位置以中,从而为用户行为描述方法提供了统一地标准。
[0073] 具体的位置检测算法如图3所示,其中,
[0074] 1)初始化位置集合,计算停留点集合中的元素个数。
[0075] 2)创建一个位置,将停留点加入到该位置中,并计算位置坐标。
[0076] 3)判断停留点到位置的距离是否大于阀值,如果是,则创建下一个位置,将停留点 加入到该位置中,计算位置坐标,如果否,则将停留点加入到该位置,更新位置坐标。
[0077] 4)将该位置添加至位置集合中。
[0078] 基于步骤10中计算的停留点的语义信息,位置k的语义信息可W通过其包含的停 留点的语义信息综合表示。例如:一个位置中包含类型i和类型j的停留点,通过i和j的信息 更能精确地描述该位置。
[0079] 利用停留点中每一类型的非零权重值的个数,位置所对应的PCH种类的权重可W 被计算为:
[nn?n1 公式(4)
[ 公《口)
[0082] 其中,f S表示停留点的特征向量,每一个位置的特征向量可W表示为Fl = <Wi, 胖2, . . .,Wk〉。
[0083] 通过聚类特征向量,每一个位置都被划分为不同的种类,并且该用户的种类轨迹 序列可W表不为Tra_C = Ci 一 C2 一----^Cn,从而构建了用户移动轨迹模型。
[0084] 步骤30,根据生成的种类轨迹序列,提取用户之间共同的种类轨迹模式CTP。
[0085] 利用步骤20提供的用户移动轨迹模型,本发明能在每个用户之间提取共同的种类 轨迹子序列CTP,考虑到一个或者两个不同的种类组成的序列无法很好地反正用户的活动 模式,本发明规定子序列的长度不小于3。
[0086] 具体的共同轨迹模式提取算法如图4所示,其中,
[0087] 1)初始化轨迹模式集合,定义子序列的长度。
[0088] 2)检索两个用户语义轨迹中的各个节点。
[0089] 3)判断两个语义点是否相同,如果否,则返回到2)继续检索,如果是,进行下一步。
[0090] 4)标记该点的位置,从该点开始查找是否有规定长度阀值的子序列,如果否,则返 回到2)继续检索,如果是,则将该子序列加入至轨迹模式集合中。
[0091] 步骤40,计算用户之间的相似度,将用户按相似度进行排序,为目标用户挑选前k 个相似用户。
[0092] 通过共同轨迹模式提取算法,用户之间的CTP能够被提取出来,从而计算用户的相 似度。与传统的相似度计算方法不同,本发明主要考虑两个方面:
[0093] 第一,类型流行度,其反映用户的个性化偏好。类型流行度越高,所能体现的用户 相似度越低。因此,CTP中每一个类型Ck的相似度可W被计算为:
[0094]
公乂 (6)
[0095] 其中,POP(Ck)表示类型Ck的流行度,并且该值可W参考步骤10中的IDF值。
[0096] 第二,活动序列,代表用户访问位置的顺序。基于提取的CTP,每一个子序列的相似 度可W被计算为:
[0097]
么私口)
[009引其中,m表示用户Ui和U2中最长CTP的长度,am=2m-i。
[0099]因此,两个用户Ui和U2的相似度可W计算为:
[0iml 公 <(別
[0101] 其中,化和化分别代表用户Ul和U2访问位置的个数。
[0102] 最终,通过对2)的值按从大到小排序,本发明可W为目标用户挑选出前k个 相似用户。
[0103] 实施例二
[0104] 如图5所示,本发明实施例提供了一种基于移动轨迹模式的潜在好友发现系统,包 括停留点检测模块100、停留点语义描述模块200、位置检测模块300、位置语义描述模块 400、共同轨迹模式提取模块500W及相似用户发现模块600,具体如下:
[0105] 停留点检测模块100,用于检测原始GPS轨迹数据中,所存在的具有一定驻留行为 的点;
[0106] 停留点语义描述模块200,用于对检测到的停留点进行语义信息的描述;
[0107] 位置检测模块300,用于检测停留点数据中,所存在的反映用户移动行为的点;
[0108] 位置语义描述模块400,用于对检测到的位置进行语义信息的描述;
[0109] 共同轨迹模式提取模块500,用于从语义轨迹中提取出用户之间共同的轨迹模式;
[0110] 相似用户发现模块600,用于计算用户之间的相似度,并为目标用户挑选前k个相 似用户。
[0111] 需要说明的是:上述实施例提供的基于移动轨迹模式的潜在好友发现系统在挑选 相似用户时,仅W上述各功能模块的划分进行举例说明,实际应用中,可W根据需要而将上 述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,W完成 W上描述的全部或者部分功能。另外,上述实施例提供的数据传输装置与数据传输方法实 施例属于同一构思,其具体实现过程详见方法实施例,运里不再寶述。
[0112] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0113] 综上所述,在本发明实施例中,建立语义描述模型,根据POI数据集描述每一个停 留点的语义信息,并对每一类服务进行加权,根据停留点的分布情况,将停留点聚类为位 置,并描述每一个位置的语义信息,生成连续的种类轨迹序列,根据生成的种类轨迹序列, 提取用户之间共同的种类轨迹子序列CTP,计算用户之间的相似度,为目标用户挑选前k个 相似用户。本发明实施例提供的方案可W为用户发现与其生活模式相同的潜在好友,增加 候选服务的个数,有效解决数据稀疏性问题,同时提高用户的服务体验质量,为未来基于位 置的社交网络中用户个性化服务推荐提供有益的解决思路。
[0114] 本领域普通技术人员可W理解实现上述实施例的全部或部分步骤可W通过硬件 来完成,也可W通过程序来指令相关的硬件完成,所述的程序可W存储于一种计算机可读 存储介质中,上述提到的存储介质可W是只读存储器,磁盘或光盘等。
[0115] W上所述仅为本发明的较佳实施例,并不用W限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于移动轨迹模式的潜在好友发现方法,其特征在于,所述方法包括: 建立语义描述模型,根据POI数据集描述每一个停留点的语义信息,并对每一类服务进 行加权; 根据停留点的分布情况,将停留点聚类为位置,并描述每一个位置的语义信息,生成连 续的种类轨迹序列; 根据生成的种类轨迹序列,提取用户之间共同的种类轨迹模式CTP; 计算用户之间的相似度,将用户按相似度进行排序,为目标用户挑选前k个相似用户。2. 如权利要求1所述的方法,其特征在于,所述语义描述模型包括: 用S表示停留点的集合,计算一个停留点Si的坐标,得到由停留点组成的轨迹; 计算停留点的种类权重,得到停留点关于种类的特征向量。3. 如权利要求2所述的方法,其特征在于,所述方法还包括: 初始化停留点集合,计算移动轨迹的长度; 判断任意两点间的距离是否小于阀值,并且时间是否大于阀值,如果否,则删除; 计算中心节点的坐标; 将该中心节点添加至停留点集合中。4. 如权利要求1所述的方法,其特征在于,所述种类轨迹描述方法包括: 将停留点聚类为位置,得到位置轨迹序列; 利用停留点中每一类型的非零权重值的个数,计算位置所对应的POI种类的权重,得到 位置关于种类的特征向量; 聚类位置的特征向量,使每一个位置被划分为不同的种类,得到种类轨迹序列。5. 如权利要求4所述的方法,其特征在于,所述方法还包括: 初始化位置集合,计算停留点集合中的元素个数; 创建一个位置,将停留点加入到该位置中,并计算位置坐标; 判断停留点到位置的距离是否大于阀值,如果是,则创建下一个位置,将停留点加入到 该位置中,计算位置坐标,如果否,则将停留点加入到该位置,更新位置坐标; 将该位置添加至位置集合中。6. 如权利要求1所述的方法,其特征在于,所述共同轨迹模式提取方法包括: 初始化轨迹模式集合,定义子序列的长度; 检索两个用户语义轨迹中的各个节点; 判断两个语义点是否相同,如果否,则删除,继续检索,如果是,进行下一步; 标记该点的位置,从该点开始查找是否有规定长度阀值的子序列,如果否,则删除,继 续检索,如果是,则将该子序列加入至轨迹模式集合中。7. 如权利要求1所述的方法,其特征在于,所述相似用户发现方法包括: 通过提取出的共同轨迹模式,从类型流行度和活动序列两个方面计算用户之间的相似 度; 将用户按相似度按从大到小排序,从而为目标用户挑选出前k个相似用户。8. -种基于移动轨迹模式的潜在好友发现系统,其特征在于,所述系统包括停留点检 测模块、停留点语义描述模块、位置检测模块、位置语义描述模块、共同轨迹模式提取模块 以及相似用户发现模块,其中, 所述停留点检测模块,用于检测原始GPS轨迹数据中,所存在的具有一定驻留行为的 占 . 所述停留点语义描述模块,用于对检测到的停留点进行语义信息的描述; 所述位置检测模块,用于检测停留点数据中,所存在的反映用户移动行为的点; 所述位置语义描述模块,用于对检测到的位置进行语义信息的描述; 所述共同轨迹模式提取模块,用于从语义轨迹中提取出用户之间共同的轨迹模式; 所述相似用户发现模块,用于计算用户之间的相似度,并为目标用户挑选前k个相似用 户。
【文档编号】G06F17/30GK106022934SQ201610293497
【公开日】2016年10月12日
【申请日】2016年5月5日
【发明人】许长桥, 关建峰, 朱亮
【申请人】北京邮电大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1