一种通信号码的识别方法及装置与流程

文档序号:14914904发布日期:2018-07-11 00:27阅读:110来源:国知局

本发明涉及信息安全领域,尤其涉及一种通信号码的识别方法及装置。



背景技术:

目前,通信网中的异常号码已给用户的生活带来困扰,甚至造成财产损失。针对运营商基于流量阀值和黑名单进行异常号码拦截的策略,不法份子不断变换发起的策略,来规避运营商的监管。同时,基于流量阀值和黑名单拦截异常号码的方法,仅可以基于已有的黑名单拦截异常号码。因此,行之有效的识别通信号码的方法是必不可少的。

在公开的专利文献中,公开了“一种利用通话社会网络的垃圾短信发送用户识别方法及系统”,对于用户所接收的每一条短信,检测发送用户和接收用户在语音通话网络中的通话历史状态;运维服务器进行用户状态判别;对于可疑的发送用户统计其短信发送数量,根据短信发送数量计算垃圾短信的测量参数U;将测量参数U与预设值进行比较,若U值高于所述预设值,则判定该可疑用户为垃圾短信的发送用户。利用通话社会网络的垃圾短信识别方法,需要对通信网全网用户的历史通话状态进行判别,要么判别层次很浅,要么计算复杂度高、实现成本高。

除此之外,部分现有方案基于通信网全网用户上传的通讯录、黑名单和白名单聚合形成号码关系图,并据此识别垃圾短信以及更新好友列表。然而,依赖用户上传通讯录及黑白名单,收集到的数据有限,在此基础上建立的号码关系图存在局限,而且实现成本过高。



技术实现要素:

有鉴于此,本发明实施例期望提供一种通信号码的识别方法及装置,降低通信号码识别的成本。

为达到上述目的,本发明实施例的技术方案是这样实现的:

一种通信号码的识别方法,所述方法包括:

确定第一通信号码与第二通信号码之间的紧密度系数,所述第二通信号码位于可信白名单中;

将所述紧密度系数与设定阈值进行比较,确定所述紧密度系数大于所述设定阈值时,将所述第一通信号码添加至所述可信白名单中。

上述技术方案中,所述方法还包括:

监测所述可信白名单外的外部通信号码的通信行为,所述通信行为与设定的异常号码指标阈值匹配时,将所述外部通信号码确定为异常通信号码。

上述技术方案中,所述异常号码指标阈值的确定过程包括:统计所述可信白名单外的外部通信号码的通信行为指标,根据所述通信行为指标确定异常号码指标阈值。

上述技术方案中,所述方法还包括:

确定第三通信号码与第四通信号码建立社会关系时,第三通信号码与第四通信号码之间的紧密度系数增加第一预设值;或者,

确定第三通信号码与第四通信号码撤销社会关系时,第三通信号码与第四通信号码之间的紧密度系数减少第二预设值;

所述第三通信号码和第四通信号码位于所述可信白名单中。

上述技术方案中,所述方法还包括:

根据一个时间周期内第五通信号码与第六通信号码之间的通信次数,将第五通信号码与第六通信号码之间的紧密度系数增大pq/(p+q);其中,p为一个时间周期内通信过程中所述第五通信号码向所述第六通信号码发起通信的次数;q为一个时间周期内所述第六通信号码向所述第五通信号码发起通信的次数;和/或,

在一个时间周期内将第五通信号码与第六通信号码之间的紧密度系数减小衰减量;和/或,

在一个时间周期内,确定第五通信号码与第六通信号码之间的紧密度系数不大于所述设定阈值时,将所述第五通信号码从可信白名单中删除;

所述第五通信号码和第六通信号码位于所述可信白名单中。

上述技术方案中,所述确定第一通信号码与第二通信号码之间的紧密度系数,包括:

根据第一通信号码与第二通信号码之间的社会关系对应的加权系数、以及通信行为确定紧密度系数。

一种通信号码的识别装置,其特征在于,所述装置包括统计模块和判别模块;其中,

所述统计模块,用于确定第一通信号码与第二通信号码之间的紧密度系数,所述第二通信号码位于可信白名单中;

所述判别模块,用于将所述紧密度系数与设定阈值进行比较,确定所述紧密度系数大于所述设定阈值时,将所述第一通信号码添加至所述可信白名单中。

上述技术方案中,所述装置还包括监测模块,用于监测所述可信白名单外的外部通信号码的通信行为,所述通信行为与设定的异常号码指标阈值匹配时,将所述外部通信号码确定为异常通信号码。

上述技术方案中,所述监测模块,具体用于统计所述可信白名单外的外部通信号码的通信行为指标,根据所述通信行为指标确定异常号码指标阈值。

上述技术方案中,所述统计模块,具体用于确定第三通信号码与第四通信号码建立社会关系时,第三通信号码与第四通信号码之间的紧密度系数增加第一预设值;或者,

确定第三通信号码与第四通信号码撤销社会关系时,第三通信号码与第四通信号码之间的紧密度系数减少第二预设值;

所述第三通信号码和第四通信号码位于所述可信白名单中。

上述技术方案中,所述统计模块,具体还用于:

根据一个时间周期内第五通信号码与第六通信号码之间的通信次数,将第五通信号码与第六通信号码之间的紧密度系数增大pq/(p+q);其中,p为一个时间周期内通信过程中所述第五通信号码向所述第六通信号码发起通信的次数;q为一个时间周期内所述第六通信号码向所述第五通信号码发起通信的次数;和/或,

在一个时间周期内将第五通信号码与第六通信号码之间的紧密度系数减小衰减量;和/或,

在一个时间周期内,确定第五通信号码与第六通信号码之间的紧密度系数不大于所述设定阈值时,将所述第五通信号码从可信白名单中删除;

所述第五通信号码和第六通信号码位于所述可信白名单中。

上述技术方案中,所述统计模块,具体还用于根据第一通信号码与第二通信号码之间的社会关系对应的加权系数、以及通信行为确定紧密度系数。

本发明实施例的通信号码的识别方法及装置,确定第一通信号码与第二通信号码之间的紧密度系数,所述第二通信号码位于可信白名单中;将所述紧密度系数与设定阈值进行比较,确定所述紧密度系数大于所述设定阈值时,将所述第一通信号码添加至所述可信白名单中。可以看出,本发明实施例在确定可信白名单的过程中,只需要计算第一通信号码与第二通信号码之间的紧密度系数,计算量较小;进一步地,在通信号码的识别过程中,重点监测有明确范围的可信白名单的通信行为即可,从而可以降低通信号码识别的成本,减少了监管过程的人、财、物力的投入。

附图说明

图1为本发明实施例通信号码的识别方法实现流程示意图;

图2为本发明实施例中可信白名单的形成过程示意图;

图3为本发明实施例通信号码的识别装置组成结构示意图。

具体实施方式

本发明实施例中,确定第一通信号码与第二通信号码之间的紧密度系数r,所述第二通信号码位于可信白名单中;将所述紧密度系数r与设定阈值进行比较,确定所述紧密度系数r大于所述设定阈值时,将所述第一通信号码添加至所述可信白名单中。其中,根据第一通信号码与第二通信号码之间的社会关系对应的加权系数、以及通信行为确定紧密度系数。

这里,进一步地,所述方法还包括:监测外部通信号码的通信行为,所述通信行为与设定的异常号码指标阈值匹配时,将所述外部通信号码确定为异常通信号码。所述外部通信号码是指未包含在可信白名单中的通信号码。

其中,所述异常号码指标阈值的确定过程包括:统计外部通信号码的通信行为指标,根据所述通信行为指标确定异常号码指标阈值。所述外部通信号码为未位于可信白名单中的通信号码。所述通信行为指标包括但不限于一个时间周期内的通信过程中,作为主叫的次数、作为被叫的次数、作为主叫时的对端通信号码数量、作为被叫时的对端通信号码数量、交往圈稳定性等信息中的一个或多个。本过程可以通过专家经验或机器学习方法来确定。

进一步地,对于可信白名单中的通信号码,若确定第三通信号码与第四通信号码建立社会关系时,则第三通信号码与第四通信号码之间的紧密度系数r增加第一预设值;若确定第三通信号码与第四通信号码撤销社会关系时,则第三通信号码与第四通信号码之间的紧密度系数r减少第二预设值,从而对可信白名单中的通信号码之间的紧密度系数r进行更新。其中,所述社会关系可以为家庭关系或集团关系。

进一步地,根据一个时间周期内可信白名单中的第五通信号码与第六通信号码之间的通信次数,将第五通信号码与第六通信号码之间的紧密度系数r增大pq/(p+q)、即r=r+pq/(p+q);其中,p为一个时间周期内通信过程中所述第五通信号码向所述第六通信号码发起通信的次数;q为一个时间周期内所述第六通信号码向所述第五通信号码发起通信的次数;和/或,

在一个时间周期内将可信白名单中的第五通信号码与第六通信号码之间的紧密度系数r减小衰减量c,即r=r-c,其中,所述衰减量c可以根据运维人员的经验设定;和/或,

在一个时间周期内,确定可信白名单中的第五通信号码与第六通信号码之间的紧密度系数不大于所述设定阈值时,将所述第五通信号码从可信白名单中删除。

通过以上处理,可使可信白名单中的两个通信号码之间的紧密度系数r随这两个通信号码之间的通信次数的增加而增大,随通信时间间隔的增加而减小,并且,能够避免可信白名单中的部分通信号码之间实际联系已经减弱、出现离群点而无法识别的现象。

本发明实施例中,通信号码的识别方法实现流程如图1所示,包括以下步骤:

步骤101:确定第一通信号码与第二通信号码之间的紧密度系数r,所述第二通信号码位于可信白名单中;

这里,可信白名单为一个可信的第二通信号码集合,初始的时候可将运营商维护人员指定的VIP通信号码集或可信通信号码集作为可信白名单,或者移动运营商确定的可信的通信号码集。其中,第一通信号码不在可信白名单中。

紧密度系数r反映了第一通信号码与第二通信号码之间通信的紧密程度,因此,所述确定第一通信号码与第二通信号码之间的紧密度系数r,包括:根据第一通信号码与第二通信号码之间的社会关系对应的加权系数、以及通信行为确定紧密度系数r。

步骤102:将所述紧密度系数r与设定阈值进行比较,确定所述紧密度系数r大于所述设定阈值时,将所述第一通信号码添加至所述可信白名单中。

其中,所述设定阈值可以由运维人员根据经验值设定;也可以为一个时间周期内可信白名单中任意两个通信号码之间的紧密度系数r的最小值。

后续处理中,以当前的可信白名单为基础,继续以上的处理步骤,进一步扩展可信白名单,直到没有新的号码可添加到可信白名单为止。

基于当前的可信白名单,结合日常的通信行为及家庭关系、集团关系等社会关系,在一个固定的时间周期,如一个月、三个月等,对可信白名单内的通信号码的通信行为进行监测,根据通信号码在该时间周期内的社会关系及通信行为,确定每两个通信号码之间的紧密度系数r,以对这两个通信号码之间的紧密度系数r进行更新。

例如,若两个通信号码建立集团关系,这两个通信号码之间的紧密度系数r增加相应的集团关系预设值;若两个通信号码撤销集团关系,则这两个通信号码之间的紧密度系数r减少相应的集团关系预设值;否则不变。

若两个通信号码建立家庭关系,这两个通信号码之间的紧密度系数r增加相应的家庭关系预设值;若两个通信号码撤销了家庭关系,则这两个通信号码之间的紧密度系数r减少相应的家庭网预设值;否则不变。

此外,两个通信号码之间的紧密度系数r根据彼此的通信次数增加ab/(a+b)。其中,a和b分别为周期内两个通信号码之间往返通信次数。

同时,为了避免部分通信号码之间实际联系已经减弱,而紧密度系数r保持不变,造成可信白名单内部出现离群点而无法识别的现象,可以通过引入衰减机制来更新紧密度系数r,具体地,以一个时间周期为周期,周期性衰减可信白名单中的两个通信号码之间的紧密度系数r。

以上处理可以由移动网中的运维服务器来完成。

下面对本发明实施例所提供的通信号码的识别方法的技术方案做进一步地详细介绍。

由于通信网中正常通信号码之间的通信行为存在较强的交互性和传递性,而异常通信号码与正常通信号码之间的通信行为存在单向性、弱交互、弱传递,存在异常通信号码向大量正常通信号码群体单向联系的特征。因此,可以基于外部通信号码与可信白名单中的通信号码之间的通信行为,来不断维护更新可信白名单。

首先,初始可信白名单以可信白名单A0为基础,A0为一个通信号码集合,可以取自运营商维护人员指定的VIP通信号码集或可信通信号码集。然后,根据可信白名单A0外的第一通信号码与可信白名单A0中的第二通信号码之间的社会关系对应的加权系数、以及通信行为确定紧密度系数r,具体地,r=m*x+n*y+ab/(a+b)。其中,x为家庭关系加权系数,y为集团关系加权系数,由于满足家庭关系的通信号码之间的紧密程度通常要大于满足集团关系的通信号码之间的紧密程度,所以一般x的取值要大于y的取值,x、y的取值可以由运维人员根据经验设定。当可信白名单外的通信号码与可信白名单中的通信号码属于家庭关系时,m取值为1,否则m取值为0;当可信白名单外的通信号码与可信白名单中的通信号码属于集团关系时,n取值为1,否则n取值为0。a为一个时间周期内可信白名单中的通信号码与可信白名单外的通信号码,通信过程中发起通信的次数,例如,通信过程中发起通话的主叫次数、通信过程中发送短信的条数等;b为一个时间周期内可信白名单中的通信号码与可信白名单外的通信号码,通信过程中对端发起通信的次数。此外,在实际应用中,x、y的取值应与ab/(a+b)为同一数量级。

若第一通信号码与第二通信号码的紧密系数r大于设定阀值,则将第一通信号码添加到可信白名单。其中,所述设定阈值可以是由运维人员根据经验值设定;也可以为一个时间周期内,如三个月,可信白名单中存在通信行为的两个通信号码之间的紧密度系数r的最小值。如此,便可以完成以初始可信白名单A0为基础的首轮扩展,增加第一通信号码后的可信白名单集为A1,由此可信白名单中的通信号码集由A0扩展为A1。

接下来,再以A1为基础,完成与A0相同的通信号码识别过程,进一步扩展可信白名单,可信白名单A1进一步扩展为A2集合。不断重复这样的过程,在每次迭代结果中,如果有新的白名单添加到可信白名单,进行下一轮的搜索,直到没有新的号码可添加到可信白名单。

本发明实施例中可信更新白名单的形成过程如图2所示,具体如下:

初始的时候,通信号码A、B、C组成可信白名单,通信号码D、E、F未包含在可信白名单中,通信号码D分别与通信号码A、B存在通信行为,通信号码E、分别与通信号码B、C存在通信行为,通信号码F与通信号码B、E存在通信行为。基于从业务服务器侧得到的家庭关系、集团关系及信令服务器侧的通信信息,确定如下的通信行为关系:

这里,业务服务器通过监测通信号码D在一个时间周期内的通信行为,如三个月,确定通信号码D一直主动向通信号码A和B发起通信。例如,发起通话或者发送短消息。通信号码D作为被叫的次数为零,通信号码D作为被叫时对端通信号码数量为零。此外,通信号码D与通信号码A和B之间的通信行为存在单向性、弱交互、弱传递,存在异常通信号码向大量正常通信号码群体单向联系的特征。通信号码D的通信行为与设定的异常号码指标阈值匹配,判定通话号码D为异常通信号码,不能被添加至可信白名单。

接下来,业务服务器通过监测通信号码E在一个时间周期内的通信行为,通信号码E与通信号码B、C之间是双向通信,彼此之间有交互性,根据通信号码E分别与通信号码B、C之间的社会关系对应的加权系数、以及通信行为分别计算通信号码E分别与通信号码B、C之间的紧密度系数r,并将所述紧密度系数r与设定阈值进行比较。其中,所述设定阈值可以由运维人员根据经验值设定或是一个时间周期内可信白名单中存在通信行为的两个通信号码之间紧密度系数r的最小值。具体的,紧密度系数r=m*x+n*y+ab/(a+b)。通过确定通信号码E分别与通信号码B、C的家庭关系、社会关系及通信过程中通信号码E作为主叫的次数、作为被叫的次数、作为主叫时的对端通信号码数量、作为被叫时的对端通信号码数量,分别计算通信号码E与通信号码B、C的紧密度系数r,当通信号码E分别与通信号码B或C之间的紧密度系数r大于设定阈值时便可通信号码E添加至可信白名单,此时可信白名单中包含通信号码A、B、C和E。

接下来,业务服务器通过监测通信号码F在一个时间周期内的通信行为,由于通信号码F分别与通信号码B、E存在通信行为,根据通信号码F分别与通信号码B、E之间的社会关系对应的加权系数、以及通信行为分别计算通信号码F分别与通信号码B、E之间的紧密度系数r,并将所述紧密度系数r与设定阈值进行比较。当通信号码F分别与通信号码E之间的紧密度系数r大于设定阈值时便可通信号码F添加至可信白名单。因此,将通信号码F添加至可信白名单中,此时可信白名单中包含通信号码A、B、C、E和F。

继续以通信号码F为中心,发现没有新的通信号码可进入到可信白名单,则可信白名单更新为由通信号码A、B、C、E和F组成的可信白名单。

包含通信号码A、B、C、E和F可信白名单建立以后,结合日常的通信行为及家庭关系、集团关系等社会网关系,在一个固定的时间周期,如一个月、三个月等,对可信白名单内的通信号码的通信行为进行监测,根据各个通信号码在该时间周期内的社会关系及通信行为,确定每两个通信号码之间的紧密度系数r,以对这两个通信号码之间的紧密度系数r进行更新。如果两个通信号码建立家庭关系,则紧密度系数r增加x,如果两个通信号码撤消家庭关系,则紧密度系数r减少x;如果两个通信号码建立集团关系,则它们之间的紧密度系数r增加y,如果两个通信号码撤销集团关系,则紧密度系数r减少y;如果两个通信号码在周期内的往返通信次数分别为a、b,则紧密度系数r增加ab/(a+b);

同时,为了避免部分通信号码之间实际联系已经减弱,而紧密度系数r保持不变,造成可信白名单内部出现离群点而无法识别的现象,可以通过引入衰减机制来更新紧密度系数r。

以上得到的可信白名单,并未全部通信号码之间均存在通信行为,这是因为,由于社会关系的存在,可信白名单也是会划分为多个社会关系组的,因此,可信白名单内中,有紧密关系群体中的任意两个通信号码之间才会存在通信行为,从而存在紧密度系数。

为实现上述通信号码的识别方法,本发明实施例还提供了一种装置,所述装置的组成结构示意图如图3所示,包括:统计模块31和判别模块32;其中,

所述统计模块31,用于确定第一通信号码与第二通信号码之间的紧密度系数r,所述第二通信号码位于可信白名单中;

所述判别模块32,用于将所述紧密度系数r与设定阈值进行比较,确定所述紧密度系数r大于所述设定阈值时,将所述第一通信号码添加至所述可信白名单中。

其中,所述设定阈值可以由运维人员根据经验值设定;也可以为一个时间周期内可信白名单中任意两个通信号码之间的紧密度系数r的最小值。

这里,所述装置还包括监测模块,用于监测所述可信白名单外的外部通信号码的通信行为,所述通信行为与设定的异常号码指标阈值匹配时,将所述外部通信号码确定为异常通信号码。

其中,所述监测模块,具体用于统计所述可信白名单外的外部通信号码的通信行为指标,根据所述通信行为指标确定异常号码指标阈值。

这里,所述统计模块31,具体用于确定第三通信号码与第四通信号码建立社会关系时,第三通信号码与第四通信号码之间的紧密度系数增加第一预设值;或者,

确定第三通信号码与第四通信号码撤销社会关系时,第三通信号码与第四通信号码之间的紧密度系数减少第二预设值;

所述第三通信号码和第四通信号码位于所述可信白名单中。

其中,所述统计模块31,具体还用于:

根据一个时间周期内第五通信号码与第六通信号码之间的通信次数,将第五通信号码与第六通信号码之间的紧密度系数增大pq/(p+q);其中,p为一个时间周期内通信过程中所述第五通信号码向所述第六通信号码发起通信的次数;q为一个时间周期内所述第六通信号码向所述第五通信号码发起通信的次数;和/或,

在一个时间周期内将第五通信号码与第六通信号码之间的紧密度系数减小衰减量;和/或,

在一个时间周期内,确定第五通信号码与第六通信号码之间的紧密度系数不大于所述设定阈值时,将所述第五通信号码从可信白名单中删除;

所述第五通信号码和第六通信号码位于所述可信白名单中。

进一步的,所述统计模块31,具体还用于根据第一通信号码与第二通信号码之间的社会关系对应的加权系数、以及通信行为确定紧密度系数r。

在实际应用中,所述统计模块31、判别模块32和监测模块均可由位于运维服务器中的中央处理器(CPU,Central Processing Unit)、微处理器(MPU,Micro Processor Unit)、数字信号处理器(DSP,Digital Signal Processor)、或现场可编程门阵列(FPGA,Field Programmable Gate Array)等实现。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1