1.一种识别重入网用户的方法,其特征在于,包括:
获取新/老号码的呼叫详单信息,根据所述呼叫详单信息分别建立新/老号码的呼叫指纹库;所述呼叫指纹库中的信息包含:所有与所述新/老号码通话的对端号码,以及各对端号码的呼叫特征信息;各对端号码的呼叫特征信息包括:其与所述新/老号码的通话次数和通话时长,以及其与所有号码的通话次数总和和通话时长总和;
根据各对端号码的呼叫特征信息,分别计算新/老号码的呼叫指纹库中各对端号码的影响系数;根据各对端号码的影响系数从新/老号码的呼叫指纹库中过滤掉无效呼叫指纹,得出有效呼叫指纹库;
根据新号码的有效呼叫指纹库与老号码的有效呼叫指纹库的相似度,判定所述新号码是否为重入网用户。
2.根据权利要求1所述的识别重入网用户的方法,其特征在于,按照如下公式计算新/老号码的呼叫指纹库中各对端号码的影响系数:
其中,TF-IDFuv为号码u的呼叫指纹库中对端号码v的影响系数;Tuv为对端号码v与号码u在设定时间内的通话时长;Tv为对端号码v在设定时间内与所有号码的通话时长总和;tfuv为对端号码v与号码u在设定时间内的通话次数;idfuv为对端号码v在设定时间内与所有号码的通话次数总和。
3.根据权利要求1所述的识别重入网用户的方法,其特征在于,根据各对端号码的影响系数从新/老号码的呼叫指纹库中过滤掉无效呼叫指纹,得出有效呼叫指纹库,包括:
将新/老号码的呼叫指纹库中的对端号码及其呼叫特征信息按照影响系数从高到低排序,获取排序在前的设定个数的对端号码及其呼叫特征信息,得到有效呼叫指纹库。
4.根据权利要求1所述的识别重入网用户的方法,其特征在于,根据新号码的有效呼叫指纹库与老号码的有效呼叫指纹库的相似度,判定所述新号码是否为重入网用户,包括:
在新/老号码的有效呼叫指纹库中,根据各对端号码的影响系数,分别确定各对端号码的呼叫特征权重,得到所述新/老号码的加权呼叫指纹库;
计算新号码的加权呼叫指纹库与老号码的加权呼叫指纹库的相似度,根据所述相似度判定所述新号码是否为重入网用户。
5.根据权利要求4所述的识别重入网用户的方法,其特征在于,在新/老号码的有效呼叫指纹库中,按照如下公式计算各对端号码的呼叫特征权重:
其中,wui为号码u的有效呼叫指纹库中第i个对端号码的呼叫特征权重;TF-IDFui为号码u的有效呼叫指纹库中第i个对端号码的影响系数;n为号码u的有效呼叫指纹库中对端号码的总数;Tui为第i个对端号码与号码u在设定时间内的通话时长;Ti为第i个对端号码在设定时间内与所有号码的通话时长总和;tfui为第i个对端号码与号码u在设定时间内的通话次数,idfui为第i个对端号码在设定时间内与所有号码的通话次数总和。
6.根据权利要求4所述的识别重入网用户的方法,其特征在于,按照如下公式计算新号码的加权呼叫指纹库与老号码的加权呼叫指纹库的相似度:
其中,Sim(D1,D2)表示号码1的加权呼叫指纹库D1与号码2的加权呼叫指纹库D2的相似度;w1k为号码1的加权呼叫指纹库D1中的第k个对端号码的呼叫特征权重;w2k为号码2的加权呼叫指纹库D2中的第k个对端号码的呼叫特征权重;n为有效呼叫指纹库中对端号码的总数。
7.根据权利要求4所述的识别重入网用户的方法,其特征在于,根据所述相似度判定所述新号码是否为重入网用户包括:
若所述相似度在设定的数值范围内,确定所述新号码为重入网用户。
8.一种识别重入网用户的装置,其特征在于,包括:
呼叫指纹获取模块,用于获取新/老号码的呼叫详单信息,根据所述呼叫详单信息分别建立新/老号码的呼叫指纹库;所述呼叫指纹库中的信息包含:所有与所述新/老号码通话的对端号码,以及的呼叫特征信息;各对端号码的呼叫特征信息包括:其与所述新/老号码的通话次数和通话时长,以及其与所有号码的通话次数总和和通话时长总和;
指纹过滤模块,用于根据各对端号码的呼叫特征信息,分别计算新/老号码的呼叫指纹库中各对端号码的影响系数;根据各对端号码的影响系数从新/老号码的呼叫指纹库中过滤掉无效呼叫指纹,得出有效呼叫指纹库;
重入网判定模块,用于根据新号码的有效呼叫指纹库与老号码的有效呼叫指纹库的相似度,判定所述新号码是否为重入网用户。
9.根据权利要求8所述的识别重入网用户的装置,其特征在于,所述指纹过滤模块包括:
影响系数计算单元,用于按照如下公式计算新/老号码的呼叫指纹库中各对端号码的影响系数:
其中,TF-IDFuv为号码u的呼叫指纹库中对端号码v的影响系数;Tuv为对端号码v与号码u在设定时间内的通话时长;Tv为对端号码v在设定时间内与所有号码的通话时长总和;tfuv为对端号码v与号码u在设定时间内的通话次数;idfuv为对端号码v在设定时间内与所有号码的通话次数总和;
和/或,
排序及筛选单元,用于将新/老号码的呼叫指纹库中的对端号码及其呼叫特征信息按照影响系数从高到低进行排序,获取排序在前的设定个数的对端号码及其呼叫特征信息,得出有效呼叫指纹库。
10.根据权利要求8所述的识别重入网用户的装置,其特征在于,所述重入网判定模块包括:
加权处理单元,用于在新/老号码的有效呼叫指纹库中,根据各对端号码的影响系数,分别确定各对端号码的呼叫特征权重,得到所述新/老号码的加权呼叫指纹库;
相似度计算单元,用于计算新号码的加权呼叫指纹库与老号码的加权呼叫指纹库的相似度;
以及,判定单元,用于根据所述相似度判定所述新号码是否为重入网用户。