一种基于社会网络的移动终端用户分组方法

文档序号:9598367阅读:465来源:国知局
一种基于社会网络的移动终端用户分组方法
【技术领域】
[0001] 本发明涉及移动通信技术与数据挖掘领域,更具体的说,本发明涉及一种基于社 会网络的移动终端用户分组方法,可以有效挖掘用户属性以及用户之间的关系,进行合理 的分组。
【背景技术】
[0002] 由于真实世界中大数据的堆积生成,对于网络的研究成果越来越多的被人们发掘 并利用,为人们更为深入认识现实世界中的各类复杂的网络系统,并对这些系统控制或应 用提供了有效帮助。社会网络能够反映社会成员及其相互关系,而如何通过对社会网络的 分析,挖掘出隐藏在表面关系之下的隐形关系,并根据这些关系对用户进行分组,对于优化 现有通信网络资源分配、提高用户通信体验、同时给社会带来巨大经济效益等方面具有十 分重大的意义。这就需要从用户之间形成的错综复杂的社会关系中得到一种合理有效的用 户分组方案。
[0003] 而社会网络的形成主要来源于人与人之间客观存在的相互联系,与此同时,人们 主观上对于事物的偏好程度也影响着社会网络的形成,于是需要结合用户之间存在的客观 联系以及用户自身的特点,才能更加有效地挖掘用户之间的潜在关系,进行合理的社区分 组。
[0004] 在实现本发明的过程中,发明人发现:
[0005] 现有的技术方案中,并没有根据终端用户之间在移动通信网络场景中表现出的用 户历史行为设置用户之间的权重,用户之间的影响力不能很好的体现出来,同时对于用户 的属性预测不够全面,无法预测出用户不喜欢某一事物,并且在传统社区分组方法中根据 随机游走模型产生的用户之间转移概率矩阵运算复杂度较高,大大降低了终端用户分组方 法的可行性和实用性。

【发明内容】

[0006] 针对现有技术的不足,提出了一种降低了运算复杂度、提高了分组准确度的基于 社会网络的移动终端用户分组方法。本发明的技术方案如下:一种基于社会网络的移动终 端用户分组方法,其包括以下步骤:
[0007] A、输入终端用户数据,根据终端用户之间的通信关系建立社会关系图STGjPGi = {VI,El},其中,| VI | = η代表终端用户数,其中η代表代表终端用户数,El代表图中两个终 端用户之间通信的关联度,生成不同的社会关系分类,为处在不同类的用户分配相应的类 权值'(〃>,〃/),并根据类权值计算终端用户之间的亲密度ws(Ui, aj ;
[0008] B、建立属性关系图ARGJPG2= {¥232一},其中,以|=11,11代表终端用户数, |A| =m,m为属性数,E2代表图中用户对属性存在关联度,建立社会属性-关系增广图 (SARG),采用社会关系-属性链路预测(SAPLA)算法对不存在关联度的用户以及属性进行 预测,同时根据社会关系图(STG)中存在联系的终端用户之间的亲密度,对已存在关联度 的用户与属性之间的偏好程度进行调整,终端用户W对于属性&]之间的偏好程度表示为权 M Wa (ui; aj);
[0009] C.利用社会关系-属性合并(SARA)算法,获得终端用户之间的转移概率矩阵P, 给出随机行走距离矩阵R1;
[0010] D.根据随机行走距离矩阵R1以及聚类算法,设定目标函数,确定社区分组中心点, 对终端用户进行分组,直至目标函数收敛,完成移动终端用户分组
[0011] 进一步的,所述终端用户数据包括:终端用户集U = {Ul,u2,…un},终端用户属性 集A = {a^ a2,…,am},其中η ;个值,即竭=丨《,1,》,2,"鳴》,),3_$表示第」个属性的取值 为值域中第k个值。
[0012] 进一步的,所述步骤A中,通过统计终端用户基于通信时段CS、通信频率CF、 通信间隔CI、信道占用率C0的通信历史,对用户进行分类并分配给每一类用户类权值 在类内通过通信频率CF和信道占用率C0量化用户通信联系,从而获得终端用户 之间亲密度Ws(Ui, Uj)。
[0013] 进一步的,所述步骤B中,根据社会关系-属性链路预测(SAPLA)算法对终端用户 与属性之间的wa(Ul,a])进行预测,如果wa( Ul,a]) < 0,表示该用户对此属性的态度消极,即 用户与属性之间不可达,将pO^a,)置为0。
[0014] 进一步的,所述步骤C中,根据社会关系-属性合并(SARA)算法,即分别利用社会 关系图STG中得到的终端用户之间转移概率PU,ARG中的到的用户-属性转移概率Pua和属 性-用户转移概率Pau,调用公式
,其中c e (〇,1) 为随机游走的起始概率,获得终端用户之间的1步随机游走距离矩阵R1。
[0015] 进一步的,所述步骤D中,根据已获得的1步随机游走距离矩阵R1,确定与其他用 户联系较为紧密的k个用户节点,计算聚类系数%,将的值进行排列选取最大的k个 值,即为k个中心点?. + ···,4卜并将所有节点+e | V|分配给离它具有最大行走距离的 中心点,直至目标函数收敛。
[0016] 进一步的,根据ARG中的到的用户-属性转移概率Pua和属性-用户转移概率P au, Pua · Pau代表任意两个用户中是否存在共同的属性,式
表明如果两个用 户具有共同属性且已存在通信联系,则这两名用户之间转移的概率更大,即两名用户具有 更高的亲密度。
[0017] 本发明的优点及有益效果如下:
[0018] 本发明应用于移动通信网络中移动终端用户的分组问题。与现有技术相比,提出 的SAPLA算法可以对终端用户的偏好属性进行预测;SARA算法可以充分利用终端用户之间 的属性特征,同时降低了运算复杂度以及实现难度。随着移动终端设备的不断普及,伴随着 移动网络服务已被广泛应用于人们日常生活中,因此针对如何解决移动用户需求个性化以 及实时准确的为用户提供他们所感兴趣的移动网络服务的问题,使得终端用户分组具有越 来越广泛的应用前景,本专利将可能带来巨大的经济效益。
【附图说明】
[0019] 图1是本发明提供优选实施例利用社会网络在移动网络场景下对终端用户进行 分组的方法示意图;
[0020] 图2为在社会关系图STG中将用户关系分成四类示意图;
[0021 ] 图3为本发明的SAPLA算法示意图。
【具体实施方式】
[0022] 以下结合附图,对本发明作进一步说明:
[0023] 通过终端用户之间已经客观存在的通信联系,可以建立基于此的社会关系图STG, 与此同时,终端用户之间的转移过程特性满足马尔可夫特性,所以根据η步转移概率,可以 挖掘用户之间看似不存在直接联系下的隐含关系。而随着移动终端设备的不断普及,伴随 着移动网络服务已被广泛应用于人们日常生活中,如何解决移动用户需求个性化以及实时 准确的为用户提供他们所感兴趣的移动网络服务,使得社区分组的重要性日益突显。同时 区别于传统互联网网络,移动网络具有自己的特性,即其社会网络较为稀疏,因此将终端用 户的属性引入至社区分组,可以使更加准确合理的社区分组成为可能。
[0024] 本发明中具体包含如下:
[0025] Α.首先根据终端用户的通信历史,建立社会关系图STG,图2所示为在社会关系图 STG中将用户关系分成四类示意图。其中,定义四个指标如下:
[0026] 1)通信频率CF :即用户Ui在时间Δ t内与该用户联系次数N u占与所有用户的 联系次数的比值,因此CF可表示为
[0027] 2)通信时段CS :将通话时段分为两个时段segment = {working, leisure},其中 {9:00-12:00, 13:00-18:00}定义为工作时段,其他时间定义为闲暇时间。该指标描述用户 Ul在时间At内与该用户联系时段hu占工作时段的比例,因此CS可表示为
[0028] 3)信道占用率C0:即用户Ul在时间At内与该用户通话时长Xu占与所有用户 通话时长的比例,因此C0可表示为
[0029] 4)通信间隔CI :8卩Ul在时间At内与该用户联系距离上一次与联系的时间间隔 占与所有用户联系的时间间隔的比值,因此CI可表示为
[0030] B.考虑以上指标,可以生成不同的社会关系分类,为处在不同的类的用 户分配相应的类权值% 。调用公式
'并计算用户 之间的亲密度ws(Ul,Uj),可以表示为
,其中
[0031 ] 图3所示为本发明的SAPLA算法示意图。SAPLA算法具体过程为:
[0032] A.首先定义Np(Ul)表示与终端用户Ul相连的用户,Na( Ul)表示与终端用户化相 连的属
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1