一种移动社会网络中的人群划分方法

文档序号:6523735阅读:659来源:国知局
一种移动社会网络中的人群划分方法
【专利摘要】本发明公开了一种移动社会网络中的人群划分方法,包括以下步骤:a、导入用户地理轨迹日志文件,计算任意两个用户之间的离散地理轨迹相似度si,j;b、基于任意两用户的离散地理轨迹相似度,建立User-User相似性矩阵G、Locate-User矩阵L和User-Locate矩阵U;c、导入用户社交活动日志,根据用户彼此之间的手机呼叫历史记录建立社交网络模型,计算社交网络邻接矩阵F;d、计算分块矩阵并划分人群。本发明通过对手机网络或基于位置在线社交网络中的用户精准划分,可应用于个性化内容推荐系统,向目标用户推送个性化内容。
【专利说明】一种移动社会网络中的人群划分方法
【技术领域】
[0001]本发明涉及数据挖掘与用户行为分析技术,具体涉及一种移动社会网络中的人群划分方法。通过对手机网络或基于位置在线社交网络中的用户精准划分,可应用于个性化内容推荐系统。
【背景技术】
[0002]准确划分人群中的社团或聚类对于优化基于位置的互联网服务等个性化内容推荐系统具有重大意义,根据人群划分结果,可准确地向目标用户推送个性化内容。
[0003]现有划分人群的方法一般可以分为基于社会网络社团探测方法和基于数据特征的聚类方法。
[0004]一方面,基于社会网络的社团探测的方法根据个体之间的社交关系的紧密程度来划分传统意义上的社团,由于这种方法获得的社团可以很直观的反映社团内外的社交关系,因此很容易用来分析并解释一些普遍现象,可以很方便的应用到纯社交网络服务推荐或其他与社交关系紧密相关的问题研究中,但是人群并不一定仅仅具有社交属性,其他属性例如地理属性,社会属性等同样影响到个体的行为乃至社团的划分,进而影响其应用面。
[0005]另一方面,基于共同特征的数据聚类方法在数据挖掘领域已经有很多应用。这种方法基于不同个体维度的属性的相似性来获得个体之间的共同特征的聚类,从而划分不同类型的人群。这种方法已广泛应用到例如电子商务、多媒体内容推送等个性化推荐领域中,但这种方法针对性相对较强,仅能分析并探测用户在特定属性维度上的行为。

【发明内容】

[0006]针对现有技术的不足,本发明的目的在于提出一种移动社会网络中的人群划分方法,该方法基于离散地理轨迹相似性,同时结合个体的地理属性与社交属性,划分更为精准。
[0007]为实现以上发明目的,本发明采用以下技术方案:
[0008]一种移动社会网络中的人群划分方法,包括以下步骤:
[0009]a、导入用户地理轨迹日志文件,计算任意两个用户之间的离散地理轨迹相似度Si,j,其中,给定总用户数N,用户活动区域由M个基站完全覆盖,所述用户地理轨迹日志由用户ID与用户活动的基站序号列表组成;
[0010]b、基于任意两用户的离散地理轨迹相似度,建立User-User相似性矩阵G、Locate-User矩阵L和User-Locate矩阵U,其中,N*M维User-Locate矩阵U的矩阵兀素PVij表示用户i在位置j的出现概率;M*N维Locate-User矩阵L的矩阵元素LVij表示位置i上用户j出现的概率;N*N维User-User相似性矩阵G为:
[0011]
【权利要求】
1.一种移动社会网络中的人群划分方法,包括以下步骤: a、导入用户地理轨迹日志文件,计算任意两个用户之间的离散地理轨迹相似度Si,j,其中,给定总用户数N,用户活动区域由M个基站完全覆盖,所述用户地理轨迹日志由用户ID与用户活动的基站序号列表组成; b、基于任意两用户的离散地理轨迹相似度,建立User-User相似性矩阵G、Locate-User矩阵L和User-Locate矩阵U,其中,N*M维User-Locate矩阵U的矩阵兀素PVij表示用户i在位置j的出现概率;M*N维Locate-User矩阵L的矩阵元素LVij表示位置i上用户j出现的概率;N*N维User-User相似性矩阵G为:
2.根据权利要求1所述的划分方法,其中,任意用户i,j之间的离散地理轨迹相似度表示为两者所有共同位置的余弦相似性指标之和:
3.根据权利要求2所述的划分方法,其中,步骤a具体为: 首先导入任意两个用户的历史基站序号列表,对比两者共同的基站数量以及占各自的比例,计算各自在所有共有基站位置I的出现概率Pu,然后计算对应的余弦相似性指标,最后求和得到任意两用户的离散地理轨迹相似度。
4.根据权利要求1所述的划分方法,其中,步骤b还包括: 利用对称非负矩阵分解算法(SNMF)对User-User相似性矩阵G进行矩阵分解,得到个体地理轨迹的初步划分,即所属各分块矩阵的分属度。
5.根据权利要求1所述的划分方法,其中,所述用户i,j的社交关系的权重具体为用户i,j的社交互动频次,即用户i,j之间的通信次数与通话时长。
6.根据权利要求1所述的划分方法,其中,步骤c具体为:导入N个用户的社交活动日志,初始化N*N社交网络邻接矩阵F = O,循环读取每个用户的社交活动日志中对应的目标用户,根据个体间社交关系的权重,更新社交网络邻接矩阵中相应的矩阵元素,从而建立群体的社交网络邻接矩阵。
7.根据权利要求1所述的划分方法,其中,步骤d具体为:导入步骤b中的User-User相似性矩阵G、User_Locate矩阵U、Locate_User矩阵L以及步骤c中的社交网络邻接矩阵F,设定目标分块矩阵的初值X为步骤b中对User-User相似性矩阵G进行矩阵分解而得到的分属度矩阵,采用联合非负矩阵分解算法(JNMF)做矩阵分解,反复迭代直到目标分块矩阵I满足前后两次迭代的差值的模小于预定值,输出各节点所属各分块矩阵及其分属度,即得到群体的划分情况。`
【文档编号】G06Q50/00GK103700018SQ201310686372
【公开日】2014年4月2日 申请日期:2013年12月16日 优先权日:2013年12月16日
【发明者】陈述, 涂来, 黄本雄, 马雪琴 申请人:华中科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1