统一通讯录信息处理方法和系统的制作方法

文档序号:6503326阅读:373来源:国知局
统一通讯录信息处理方法和系统的制作方法
【专利摘要】本发明提供了一种统一通讯录信息处理方法和系统,涉及移动互联网【技术领域】。该方法将统一通讯录抽象为多层图模型结构,将用户间的联系人、好友等关系叠加为一个统一的网络图,通过连通的多层图结构解决了传统的向量空间模型无法表达的友关系的传递性;本发明的技术方案利用联系人关联因子去除联系人关系图中可能存在的噪音信息,提出的改进的重启型随机游走算法,可以有效的挖掘用户社交关系,进而为业务交叉营销推广和衍生其他服务提供帮助。
【专利说明】统一通讯录信息处理方法和系统

【技术领域】
[0001]本发明涉及移动互联网【技术领域】,特别涉及一种统一通讯录信息处理方法和系统。

【背景技术】
[0002]随着互联网的爆炸式发展,与用户联系人、社交关系相关的业务越来越多,随之而来无论是好友关系拓展、用户群组划分等业务需求都需要对用户社交关系进行挖掘;当前互联网用户个人社交关系信息分散,同时缺乏有效手段对用户个人社交关系进行深度挖掘,统一通讯录中蕴含了丰富的用户社交关系,对统一通讯录建模并进行数据挖掘势在必行。
[0003]当前的社交关系挖掘方法大多通过向量空间模型构造用户的特征向量,再计算两个用户之间的相似度;还有一些方法利用一度好友进行关系拓展。现有的社交关系挖掘技术存在以下一些问题:向量空间模型仅仅计算两个用户之间的相似度,没有考虑社交关系的传递性;如QQ圈子等对社交关系的挖掘仅仅限于一度好友,没有做更深的分析,导致推荐的好友与用户实际上并无社交关系,关系挖掘的结果出现大量噪音信息。


【发明内容】

[0004]本发明的发明人发现上述现有技术中存在问题,并因此针对所述问题中的至少一个问题提出了一种新的技术方案。
[0005]本发明的一个目的是提供一种用于统一通讯录信息处理的技术方案。
[0006]根据本发明的第一方面,提供了一种统一通讯录信息处理方法,包括:
[0007]根据统一通讯录中用户、用户的联系人、用户的好友信息构建多层关系图,其中各个用户、用户的联系人、用户的好友分别作为多层关系图的节点;
[0008]在多层关系图中,在用户节点与用户的联系人属性节点和用户的好友属性节点之间分别生成边;将互为好友的用户的好友属性节点间生成边;将互为联系人的用户的联系人属性节点之间根据联系人关联因子确定在用户的联系人属性节点间生成边;
[0009]根据多层关系图的连接关系生成邻接矩阵;
[0010]根据初始概率矩阵基于邻接矩阵通过重启型随机游走算法确定稳定状态的概率矩阵。
[0011]可选地,联系人关联因子根据如下公式确定:

【权利要求】
1.一种统一通讯录信息处理方法,其特征在于,包括: 根据统一通讯录中用户、用户的联系人、用户的好友信息构建多层关系图,其中各个用户、用户的联系人、用户的好友分别作为所述多层关系图的节点; 在所述多层关系图中,在用户节点与所述用户的联系人属性节点和所述用户的好友属性节点之间分别生成边;将互为好友的用户的好友属性节点间生成边;将互为联系人的用户的联系人属性节点之间根据联系人关联因子确定在用户的联系人属性节点间生成边; 根据所述多层关系图的连接关系生成邻接矩阵; 根据初始概率矩阵基于所述邻接矩阵通过重启型随机游走算法确定稳定状态的概率矩阵。
2.根据权利要求1所述的方法,其特征在于,所述联系人关联因子根据如下公式确定: (ηΑ.Ι?) = ^('{Α,'^]*Ν C(A).C(B) 其中,Α、Β为用户节点,C(A H B)为A和B的共同联系人的数量,C㈧、C⑶为A、B各自的联系人数目,N为统一通讯录中总共的联系人数目。
3.根据权利要求1或2所述的方法,其特征在于,所述将互为联系人的用户的联系人属性节点之间根据联系人关联因子确定在用户的联系人属性节点间生成边包括: 确定互为联系人的用户的联系人属性节点间的联系人关联因子; 如果所述联系人关联因子大于设定阈值,则在将互为联系人的用户的联系人属性节点之间生成边。
4.根据权利要求1所述的方法,其特征在于,所述根据所述多层关系图的连接关系生成邻接矩阵包括: 根据所述多层关系图的连接关系生成所述邻接矩阵,其中,对于用户节点与所述用户的联系人属性节点以及所述用户的好友属性节点之间的边的权重为1,对于好友属性节点之间的边的权重为1,对于联系人属性节点之间的边的权重为归一化的联系人关联因子; 将所述邻接矩阵按列进行归一化。
5.根据权利要求1或4所述的方法,其特征在于,所述根据初始概率矩阵基于所述邻接矩阵通过重启型随机游走算法确定稳定状态的概率矩阵包括: 生成初始矩阵μ ^为n*i阶矩阵,令种子用户节点初始值为1,其他结点初始值为O ; 初始化μ = μ ο; 进行如下迭代: μ ?+ι=(?-λ )Μμ t+A μ 0,其中0〈 λ〈I, M为邻接矩阵,t为迭代次数; 直到稳定退出迭代,获得稳定状态的概率矩阵μ*。
6.根据权利要求5所述的方法,其特征在于,还包括: 根据所述稳定状态的概率举证计算种子用户和其他用户之间的紧密程度。
7.一种统一通讯录信息处理系统,其特征在于,包括: 关系图节点生成模块,用于根据统一通讯录中用户、用户的联系人、用户的好友信息构建多层关系图,其中各个用户、用户的联系人、用户的好友分别作为所述多层关系图的节占.关系图边生成模块,用于在所述多层关系图中,在用户节点与所述用户的联系人属性节点和所述用户的好友属性节点之间分别生成边;将互为好友的用户的好友属性节点间生成边;将互为联系人的用户的联系人属性节点之间根据联系人关联因子确定在用户的联系人属性节点间生成边; 邻接矩阵生成模块,用于根据所述多层关系图的连接关系生成邻接矩阵; 概率矩阵确定模块,用于根据初始概率矩阵基于所述邻接矩阵通过重启型随机游走算法确定稳定状态的概率矩阵。
8.根据权利要求7所述的系统,其特征在于,所述联系人关联因子根据如下公式确定:
其中,A、B为用户节点,C(A Π B)为A和B的共同联系人的数量,C㈧、C⑶为A、B各自的联系人数目,N为统一通讯录中总共的联系人数目。
9.根据权利要求7或8所述的系统,其特征在于,所述关系图边生成模块包括: 特征边生成单元,用于在用户节点与所述用户的联系人属性节点和所述用户的好友属性节点之间分别生成边; 好友边生成单元,用于将互为好友的用户的好友属性节点间生成边; 联系人边生成单元,用于确定互为联系人的用户的联系人属性节点间的联系人关联因子,如果所述联系人关联因子大于设定阈值,则在将互为联系人的用户的联系人属性节点之间生成边。
10.根据权利要求7所述的系统,其特征在于,所述邻接矩阵生成模块根据所述多层关系图的连接关系生成所述邻接矩阵,其中,对于用户节点与所述用户的联系人属性节点以及所述用户的好友属性节点之间的边的权重为1,对于好友属性节点之间的边的权重为1,对于联系人属性节点之间的边的权重为归一化的联系人关联因子;将所述邻接矩阵按列进行归一化; 或 所述概率矩阵确定模块用于生成初始矩阵Po,为N*1阶矩阵,令种子用户节点初始值为I,其他结点初始值为O ;初始化μ = μ (!,进行如下迭代: μ ?+ι=(?-λ )Μμ t+A μ 0,其中0〈 λ〈I, M为邻接矩阵,t为迭代次数; 直到稳定退出迭代,获得稳定状态的概率矩阵μ*。
【文档编号】G06F17/30GK104182422SQ201310202471
【公开日】2014年12月3日 申请日期:2013年5月28日 优先权日:2013年5月28日
【发明者】康为 申请人:中国电信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1