用于得到在电信呼叫图的节点之间的边缘的复合连结度量的方法和装置制造方法

文档序号:6496427阅读:164来源:国知局
用于得到在电信呼叫图的节点之间的边缘的复合连结度量的方法和装置制造方法
【专利摘要】一种用于得到电信呼叫图的节点之间的边缘的复合连结度量的方法,包括:接收具有描述性属性的原始值的描述性数据,该描述性属性与由在节点之间的边缘形成的电信呼叫图相关联。每个边缘涉及两个节点。每个原始值涉及边缘和形成相应的原始值的边缘属性对的描述性属性。描述性数据被存储在本地存储设备中。在考虑到相应的描述性属性的原始值的分布和描述性属性的公共基的情况下,确定对于每个描述性属性的缩放因子。确定每个描述性属性的加权因子。基于描述性属性的原始值、缩放因子和加权因子来计算边缘的复合连结度量。
【专利说明】用于得到在电信呼叫图的节点之间的边缘的复合连结度量
的方法和装置
【背景技术】
[0001]此申请基于2011年9月8日提交的美国临时申请N0.61/532,151,并要求其优先权,其全部内容通过引用合并于此。
[0002]本公开涉及用于基于在电信呼叫图的节点之间的边缘的多个属性来得到该边缘的复合连结度量的过程。例如,本公开描述了一种用于得到边缘的复合连结度量的方法的示例性实施例,该方法考虑到边缘的多个属性的值、在电信呼叫图中边缘的多个属性的值的分布、多个属性到共同尺度的转换、以及关于复合连结度量对每个属性的相对贡献的灵敏度对多个属性进行加权。本公开还描述了一种装置的示例性实施例,该装置基于经由与电信呼叫图相关联的电信网络通信的历史数据记录来得到边缘的复合连结度量。这里描述的方法和装置的各种实施例可以结合对服务提供商提供关于流失预测的建议来使用。然而,这里描述的方法和装置可以用于其他目的,诸如电信服务采用的预测、定向广告、定向市场营销、异常检测或可以从用户行为的预测获益的其他用途。
[0003]社交网络分析(SNA)是用于更好地理解用户的行为和关系的有效方法。通常在在线社交网络(OSN)的背景下应用SNA,在线社交网络诸如Facebook、Flickr和Twitter,其中,用户可以直接建立连结、共享信息以及加入群组以与具有类似兴趣的用户连接。在这些网络中,SNA对直接暗示用户之间的社交连接的属性进行操作。例如,两个用户是OSN上的好友、他们属于相同的群组、或他们彼此共享信息的事实可以各自单独用于推断出社交连结存在。
[0004]这样的OSN包含因果关系信息,即暗示存在社交连结的数据属性。然而,存在其他社交网络,其中仅可以观察到一个社交连结的效果。每个效果单独地取出并不直接表明社交连结强度。移动呼叫图是这样的社交网络的示例。在移动呼叫图中,强的社交连结的效果可能包括大量拨出的电话、花长时间的交谈以及在周末和晚上期间的很多电话。然而,没有任何属性本身直接暗示连结强度。例如,用户可能呼叫银行以查询余额并且支付帐单的次数比他们给朋友打电话的次数更多,即使友谊是更强的社交连结。
[0005]移动呼叫图表示大量用户彼此通信的方式,并且这些通信的模式涉及人们之间的社交连结。因此,对移动呼叫图应用SNA的研究受到欢迎。然而,这样的研究仅挑选关于在两个用户之间进行的呼叫的单个特征来定义社交关系。结果,由这些研究得到的结论仅基于可能存在的社交关系的单个效果。为了对呼叫图进行更加如实地考虑用户之间的社交关系的观察,需要对连结强度的改进的测量。
[0006]关于将SNA应用于移动呼叫图的研究的其他信息,参见例如=Dasgupta等人的“Social Ties and their Relevance to Churn in Mobile Telecom Networks,,,发表于2008年 3 月 25-30举行的第 11 次ACM International Conference on Extending DatabaseTechnology 的会刊第 668-677 页;ii) Onnela 等人的 “Structure and tie strengths inmobile communication networks”,发表于 2007 年 5 月 I 日的 the National Academyof Sciences of the United States 的会刊,vol.104,n0.18,第 7332 - 7336 页;iii)Richter 等人的 “Predicting customer churn in mobile networks through analysisof social groups”,发表于 2010 年 4 月 29 到 5 月 I 日举行的 SIAM InternationalConference on Data Mining 的会刊第 732-741 页;iv) Seshardi 等人的 “Mobile CallGraphs:Beyond Power-Law and Lognormal Distributions,,,发表于 2008 年 8 月 24-27 举行的 14th ACM Conference on Knowledge Discovery and Data Mining的会刊第596-604页;以及 v)Nanavati 等人的“On the Structural Properties of Massive Telecom CallGraphs:Findings and Implications”,发表于 2006 年 11 月 5-11 日举行的 15th ACMConference on Information and Knowledge Management 的会干丨J第 435-444 页。这 5 个文献的内容通过引入完全并入本文。
[0007]对计算社交连结强度的问题的现有解决方案适用于在线社交网络(0SN),其中存在因果关系的信息,即存在暗示社交连结存在的数据属性。例如,两个用户是OSN上的好友、他们属于相同的群组、或他们彼此共享信息的事实可以各自单独被用于推断社交连结存在。然而,对于电话网络,仅有社交连结的效果被观察到。每个效果单独取出并不直接表明关系强度。例如,在移动呼叫图中,强的社交连结的效果可能包括大量拨出的电话、花长时间的交谈以及在周末和晚上期间的很多电话。然而,没有任何属性本身直接暗示连结强度。例如,用户可能呼叫银行以查询余额并且支付帐单的次数比他们给朋友打电话的次数更多,即使友谊是更强的社交连结。
[0008]存在将SNA应用于移动呼叫图的大量研究。然而,这样的研究仅挑选关于在两个用户之间进行的呼叫的单个特征来定义社交关系。结果,由这些研究得到的结论仅基于可能存在的社交关系的单个效果。为了对呼叫图进行更加如实地考虑用户之间的社交关系的观察,需要对连结强度的改进的测量。
[0009]检测移动呼叫图的异常行为具有若干优点:使用率显著下降的链接可能是由于减少的呼叫活动而导致节点在未来可能流失的早期指示。在另一方面,显著增加的活动可以指示对于影响力传播的新的连结和可能的链接的形成。对呼叫图的异常检测具有用于执法机构的应用。海外通话、在一天中的不寻常时间期间打电话、某些节点之间的增加的呼叫活动以及甚至服务的不充分使用或者过度使用(与“扔掉”电话相关联)可能被检测为执法机构在调查案件时所利用的异常信号。复合连结变化度量的使用通过将多个属性上的异常活动合并成单个度量来促进异常检测。
[0010]异常检测还适用于监视在电信网络中的链路上的业务。电信网络由网络节点(即,电信设备)以及连接不同的网络节点和传输业务的链路构成。为了从网络获取最佳性能,有利的是使链路处于特定的活动水平并且能够检测链路是否偏离了其正常的期望行为。例如,过载链路可能降低性能并且使网络瘫痪,而未充分利用的链路表示损失收入的可能。检测链路的异常行为使得运营商能够采取行动,并且纠正该情况。为了准确的异常检测,需要考虑的链路的性能的多个因素;而不仅仅是单个测量。
[0011]出于这些和其他原因,需要基于电信呼叫图的节点之间的边缘的多个特性来定义表示该边缘的复合度量。

【发明内容】

[0012]在一个方面中,提供了一种用于得到电信呼叫图的节点之间的边缘的复合连结度量的方法。在一个实施例中,该方法包括:在计算设备处从远程存储设备接收多个描述性数据,其中多个描述性数据包括针对多个描述性属性j的原始值Xq,该多个描述性属性j与由在多个节点之间的多个边缘i形成的电信呼叫图相关联,其中,每个边缘i涉及多个节点中的两个节点,其中每个原始值Xq涉及电信呼叫图中的唯一的边缘i和针对相应的边缘i的唯一的描述性属性j,唯一的边缘i和唯一的描述性属性j形成与相应的原始值Xi,^相关的边缘属性对i,j ;至少临时地将多个描述性数据存储在本地存储设备中;以下述方式来确定用于每个描述性属性j的缩放因子:该方式考虑到针对相应的描述性属性j的原始值Xi, j的分布和针对多个描述性属性j的公共基;确定用于每个描述性属性j的加权因子;以及至少部分地基于下述来计算在第一节点和第二节点之间的第一边缘I1的复合连结度量S:与第一边缘I1相关联的第一属性J1的第一原始值、用于第一属性J1的第一缩放因子、用于第一属性i的第一加权因子、与第一边缘I1相关联的第二属性j2的第二原始值xh,iz、用于第二属性j2的第二缩放因子、以及用于第二属性j2的第二加权因子,其中,多个描述性属性j包括第一属性J1和第二属性j2。可以理解的是,这里描述的用于得到复合连结度量的过程可以用于超过示例性第一属性和第二属性的任何数目的属性。
[0013]在另一方面中,提供了一种用于得到电信呼叫图的节点之间的边缘的复合连结度量的装置。在一个实施例中,该装置包括:数据通信模块,被配置为从远程存储设备接收多个描述性数据,其中多个描述性数据包括针对多个描述性属性j的原始值Xy,该多个描述性属性j与由在多个节点之间的多个边缘i形成的电信呼叫图相关联,其中,每个边缘i涉及多个节点中的两个节点,其中每个原始值Xm涉及电信呼叫图中的唯一的边缘i和相应的边缘i的唯一的描述性属性j,唯一的边缘i和唯一的描述性属性j形成与相应的原始值Xi, j相关的边缘属性对i,j ;本地存储设备,被配置成至少临时地存储多个描述性数据;缩放/加权处理器,被配置成以下述方式来确定用于每个描述性属性j的缩放因子:该方式考虑到针对相应的描述性属性j的原始值Xi, J的分布和针对多个描述性属性j的公共基,并且被配置成确定用于每个描述性属性j的加权因子;以及复合连结度量处理器,被配置成至少部分地基于下述来计算在第一节点和第二节点之间的第一边缘ii的复合连结度量s:针对与第一边缘ii相关联的第一属性J1的第一原始值-Wh用于第一属性J1的第一缩放因子、用于第一属性J1的第一加权因子、`针对与第一边缘ii相关联的第二属性j2的第二原始值用于第二属性j2的第二缩放因子、以及用于第二属性j2的第二加权因子,其中,多个描述性属性j包括第一属性J1和第二属性j2。
[0014]在又一个方面中,提供了一种存储程序指令的非瞬时计算机可读介质,当由处理器执行时,该程序指令使得计算设备执行用于得到电信呼叫图的节点之间的边缘的复合连结度量的方法。在一个实施例中,该方法包括:在从远程存储设备接收多个描述性数据之后,其中多个描述性数据包括针对多个描述性属性j的原始值Xy,该多个描述性属性j与由在多个节点之间的多个边缘i形成的电信呼叫图相关联,以下述方式来确定用于每个描述性属性j的缩放因子:该方式考虑到针对相应的描述性属性j的原始值Xi, J的分布和针对多个描述性属性j的公共基,其中,每个边缘i涉及多个节点中的两个节点,其中每个原始值Xm涉及电信呼叫图中的唯一的边缘i和相应的边缘i的唯一的描述性属性j,唯一的边缘i和唯一的描述性属性j形成与相应的原始值Xi, j相关的边缘属性对i,j ;确定用于每个描述性属性j的加权因子;以及至少部分地基于下述来计算在第一节点和第二节点之间的第一边缘ii的复合连结度量S:针对与第一边缘ii相关联的第一属性J1的第一原始值用于第一属性J1的第一缩放因子、用于第一属性J1的第一加权因子、针对与第一边缘ii相关联的第二属性j2的第二原始值&^2、用于第二属性j2的第二缩放因子、以及用于第二属性j2的第二加权因子,其中,多个描述性属性j包括第一属性J1和第二属性j2。
[0015]根据下面提供的详细描述,本发明的进一步的适用范围将变得显而易见。然而,应当理解,详细描述和特定示例尽管指示本发明的优选实施例,但是他们仅通过例示的方式被给出,因为在本发明的精神和范围内的各种改变和修改对于本领域技术人员来说将变得显而易见。
【专利附图】

【附图说明】
[0016]本发明存在于设备的各部分的构建、布置和组合,以及方法的步骤,由此,所预期的目标被实现,如在下文中被更全面地阐述、在权利要求中被具体指出、并且在附图中被图不的,在附图中:
[0017]图1是示出在电信呼叫图中的边缘的若干示例性属性和复合连结度量之间的关联的一组图;
[0018]图2是示出在电信呼叫图中的边缘的若干示例性属性的复合连结度量质量的图;
[0019]图3是示出在电信呼叫图中的边缘的示例性属性的复合连结度量质量的图;
[0020]图4是示出在电信呼叫图中的边缘的另一示例性属性的复合连结度量质量的图;
[0021]图5是示出在电信呼叫图中的边缘的又一示例性属性的复合连结度量质量的图;
[0022]图6是用于得到电信呼叫图的节点之间的边缘的复合连结度量的过程的示例性实施例的流程图;
[0023]与图6相结合的图7是用于得到在电信呼叫图的节点之间的边缘的复合连结度量的过程的另一示例性实施例的流程图;
[0024]与图6相结合的图8是用于得到在电信呼叫图的节点之间的边缘的复合连结度量的过程的又一示例性实施例的流程图;
[0025]与图6和图8相结合的图9是用于得到在电信呼叫图的节点之间的边缘的复合连结度量的过程的又一示例性实施例的流程图;
[0026]与图6相结合的图10是用于得到在电信呼叫图的节点之间的边缘的复合连结度量的过程的又一示例性实施例的流程图;
[0027]与图6和图10相结合的图11是用于得到在电信呼叫图的节点之间的边缘的复合连结度量的过程的又一示例性实施例的流程图;
[0028]图12是用于得到在电信呼叫图的节点之间的边缘的复合连结度量的计算设备的示例性实施例的框图;以及
[0029]图13是由计算设备执行的用于得到在电信呼叫图的节点之间的边缘的复合连结度量的过程的示例性实施例的流程图,该计算设备具有执行存储在非瞬时计算机可读介质中的程序指令的处理器。 【具体实施方式】[0030]总体上,本公开描述了用于得到边缘度量的两个过程。第一度量是针对电信图边缘的基于变量的评分的测量,引起多个属性值的组合距离属性平均值的偏差。该过程基于主成分分析(PCA)方法的使用。本实施例可以用于检测异常行为。第二过程包括与社交连结强度有关的度量的计算。第二过程可以用于理解用户对其他用户的行为的社交影响力。
[0031]本公开例如使用用于测量用户之间的复合连结度量的方法来检查移动呼叫图。这里公开了用于通过很多呼叫属性的合成来量化合成连结度量的算法的各种实施例,该很多呼叫属性的值是社交连接的效果。关于连结强度的其他信息,参见例如Granovetter于American Journal of Sociology, Vol.78,Issue6, Mayl973, pp.1360 - 1380 发表的 “TheStrength of Weak Ties”,其全部内容通过引用合并于此。算法的各种实施例可以应用于由主要移动服务提供商所提供的呼叫图以研究在复合连结度量和呼叫图结构之间的关系。
[0032]在算法的一个示例性实施例中,移动呼叫图被定义为简单的有向图G= (V,E),其中该组顶点V表示移动电话用户,并且当且仅当a,be V并且a对b打电话时,边缘e= (a,b) e E。G表示在|V| = η个用户当中|E| = m个连结。目标在于定义加权函数S:E — R其将每个有向的边缘映射成一个值,该值以在边缘上附带的用户之间的关系为特征。
[0033]在本实施例中,每个边缘被表示为k个属性的向量。k个属性的对应向量可以组成mX k矩阵E,其中E的行对应于G的边缘,并且IE | tf是针对边缘i的属性j的值。为了将E的行向量映射成以在边缘上附带的用户之间的关系为特征的值,应用由主要成分分析(PCA)所启示的方法,该方法将数据投射到更好地表示在数据内存在的变化的子空间。投影使用向量的正交基集合,该向量指向其中数据的变化最大(称为主要分量(PO)的方向。该集合由E的协方差矩阵Σ的特征向量给出。关于PCA的其他信息,参见例如Jackson于Wiley-1nterscience, September, 10,2003,592pages发表的“A User’s Guide to PrincipalComponents”,其内容通过引用合并于此。
[0034]Σ的特征值的总和等于该数据内的总方差,如果具有零均值和单位方差,则其与数据的维度相同。换言之,Σ的 特征值使由投影的数据的每个维度解释的变化量与沿着原始数据的维度的变化相关。投影的数据的每个分量被乘以相应的特征值。这些加权的分量被求和以得到以两个用户之间的关系为特征的值。这给出了其中数据对复合连结度量值呈现出非常大的变化附加影响的维度。
[0035]在另一实施例中,该算法可以概括如下:
[0036]I)对于所有 j,设置,
【权利要求】
1.一种用于得到电信呼叫图的节点之间的边缘的复合连结度量的方法,包括: 在计算设备处从远程存储设备接收多个描述性数据,其中所述多个描述性数据包括多个描述性属性j的原始值XM,所述多个描述性属性j与由在多个节点之间的多个边缘i形成的电信呼叫图相关联,其中,每个边缘i涉及所述多个节点中的两个节点,其中每个原始值及所述电信呼叫图中的唯一的边缘i和针对相应的边缘i的唯一的描述性属性j,所述唯一的边缘i和所述唯一的描述性属性j形成与相应的原始值相关的边缘属性对i,j ; 至少临时地将所述多个描述性数据存储在本地存储设备中; 以下述方式来确定用于每个描述性属性j的缩放因子:该方式考虑到相应的描述性属性j的所述原始值Xy的分布和所述多个描述性属性j的公共基; 确定用于每个描述性属性j的加权因子;以及 至少部分地基于下述来计算在第一节点和第二节点之间的第一边缘I1的复合连结度量s:与第一边缘I1相关联的第一属性J1的第一原始值XiiJ1、用于第一属性J1的第一缩放因子、用于第一属性i的第一加权因子、与第一边缘I1相关联的第二属性j2的第二原始值A1J2、用于第二属性」2的第二缩放因子、以及用于第二属性」2的第二加权因子,其中,所述多个描述性属性j包括所述第一属性J1和所述第二属性j2。
2.根据权利要求1所述的方法,其中,所确定的用于每个描述性属性j的缩放因子至少部分地基于针对相应的描述性属性j的代表性的最大值|\|,以建立每个描述性属性j的单位基作为公共基。
3.根据权利要求2所述的方法,其中, 针对每个描述性属性j的代表性的最大值|χ」至少部分地基于如下表达式:
4.根据权利要求2所述的方法,进一步包括: 用所述第一属性J1的所述代表性的最大值μΑ|除所述第一原始值J1,以形成用于相应的第一边缘属性对L J1的第一缩放的值
5.根据权利要求1所述的方法,结合确定所述缩放因子和所述加权因子,所述方法进一步包括: 计算针对每个描述性属性j的代表性平均值%; 计算针对每个描述性属性j的标准差σ ^ ; 确定针对每个描述性属性j的每个原始值Xi,j和代表性平均值A之间的差,以形成针对每个描述性属性j的中间值的相应集合; 将每个描述性属性j的每个中间值為,|除以相应的描述性属性j的所述标准差σ P以形成针对每个描述性 属性j的缩放的值fy的相应集合,其中每个描述性属性j具有由零均值和单位方差表示的公共基;以及 根据所述多个描述性属性j的所述缩放的值fI,i形成协方差矩阵Σ。
6.根据权利要求1所述的方法,其中,所述缩放因子被确定为使得缩放的值先的相应集合根据每个描述性属性j的所述原始值Xi, j形成,使得每个描述性属性j的所述缩放的值為的所述公共基反映零均值和单位方差,所述方法进一步包括: 根据用于所述多个描述性属性j的所述缩放的值右J形成协方差矩阵Σ ;以及 找到所述协方差矩阵Σ的特征向量的集合和特征值的相应集合。
7.一种用于得到电信呼叫图的节点之间的边缘的复合连结度量的装置,包括: 数据通信模块,被配置为从远程存储设备接收多个描述性数据,其中所述多个描述性数据包括多个描述性属性j的原始值Xu,所述多个描述性属性j与由在多个节点之间的多个边缘i形成的电信呼叫图相关联,其中,每个边缘i涉及所述多个节点中的两个节点,其中每个原始值Xm涉及所述电信呼叫图中的唯一的边缘i和针对相应的边缘i的唯一的描述性属性j,所述唯一的边缘i和所述唯一的描述性属性j形成与相应的原始值Xm相关的边缘属性对i,j ; 本地存储设备,被配置成至少临时地存储所述多个描述性数据; 缩放/加权处理器,被配置成以下述方式来确定用于每个描述性属性j的缩放因子:所述方式考虑到相应的描述性属性j的所述原始值Xy的分布和所述多个描述性属性j的公共基,并且所述缩放/加权处理器被配置成确定用于每个描述性属性j的加权因子;以及 复合连结度量处理器,被配置成至少部分地基于下述来计算在第一节点和第二节点之间的第一边缘I1的复合连结度量S:与所述第一边缘I1相关联的第一属性J1的第一原始值用于第一属性J1的第一缩放因子、用于第一属性J1的第一加权因子、与第一边缘ii相关联的第二属性j2的第二原始值&ιΑ、用于第二属性j2的第二缩放因子、以及用于第二属性j2的第二加权因子,其中,所述多个描述性属性j包括所述第一属性J1和第二属性j2。
8.根据权利要求7所述的装置,其中,所述缩放/加权处理器被配置成至少部分地基于确定针对相应的描述性属性j的代表性的最大值IxfI来确定用于每个描述性属性j的缩放因子,以建立每个描述性属性j的单位基作为公共基。
9.根据权利要求7所述的装置,其中,所述缩放/加权处理器被配置成计算针对每个描述性属性j的代表性平均值&,被配置成计算针对每个描述性属性j标准差σ P被配置成确定针对每个描述性属性j的每个原始值Xi, j和代表性平均值%之间的差,以形成针对每个描述性属性j的中间值hi的相应集合,被配置为将针对每个描述性属性j的每个中间值勾J除以针对相应的描述性属性j的标准差σ P以形成针对每个描述性属性j的缩放的值hj的相应集合,其中所述每个描述性属性j具有由零均值和单位方差表示的公共基,并且被配置为根据针对所述多个描述性属性j的所述缩放的值矣,/形成协方差矩阵Σ。
10.根据权利要求7所述的装置,其中,所述缩放/加权处理器被配置成确定缩放因子,使得缩放的值fy的相应集合根据每个描述性属性j的所述原始值Xi,j形成,使得针对每个描述性属性j的所述缩放的值fy的公共基反映零; 其中,所述缩放/加权处理器被配置成根据所述多个描述性属性j的所述缩放的值fy形成协方差矩阵?,并且被配置成找到协方差矩阵σ的特征向量的集合和特征值的相应集合。
【文档编号】G06F17/30GK103890758SQ201280043804
【公开日】2014年6月25日 申请日期:2012年9月6日 优先权日:2011年9月8日
【发明者】V·B·门迪拉塔, D·多兰, C·法蒂克, H·乌祖纳利欧格鲁, D·库什尼尔 申请人:阿尔卡特朗讯
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1