一种基于关键字和频次识别垃圾短信源的方法

文档序号:7743330阅读:149来源:国知局
专利名称:一种基于关键字和频次识别垃圾短信源的方法
技术领域
本发明涉及电信领域,尤其涉及垃圾短信的监控和治理,是一种结合关键字和发
送频次识别垃圾短信源的方法。
背景技术
短信息服务作为移动通信网络的一种基本业务,在为用户提供便捷消息通信服务的同时,也为信息垃圾的传播提供了渠道。而垃圾短信息有着愈演愈烈的趋势,垃圾短信不但带来用户投诉的不良影响,还存在恶意欠费问题,因此需要对垃圾短信进行实时监控拦截。 垃圾短信的发送特征有1、发送频次比较高,2、内容重复,多为诈骗或者广告,符合关键字特征。 当前垃圾短信源发现的手段大多基于纯频次统计和关键字。频次值设置过大,会漏拦垃圾短信源;频次值设置过小,造成误拦率较高;关键字设置条件简单,容易造成误拦;关键字复杂,不能覆盖完全。

发明内容
本发明的目的在于克服现有技术的缺陷而提供一种基于关键字和频次识别垃圾
短信源的方法,该方法根据垃圾短信的发送特征,即正常用户不会大量发送违反不同关键
字的内容,采用分析关键字短信和频次、不同关键字违反次数相结合的方法识别出垃圾短
消息用户的方法,限制此源发送短信,该方法是一种有效的拦截垃圾短信的方法。 实现上述目的的技术方案是一种基于关键字和频次识别垃圾短信源的方法,其
中, 设定关键字短信频率门限,该关键字短信频率门限为一段时间内违反同样关键字
的最大阈值,当设定的时间范围内的主叫源发送的违反同样关键字的短信数量超出该关键
字短信频率门限的最大阈值时,则该主叫源符合此关键字的短信将被拦截; 设定黑名单门限,即在设定的时间范围内主叫源超出关键字短信频率门限的不同
关键字个数的最大阈值,当设定的时间范围内主叫源违反不同的关键字的个数超出该最大
阈值时,则判定此主叫源为垃圾短信源,拦截此主叫源的所有短信。 上述的基于关键字和频次识别垃圾短信源的方法,其中,包括下列步骤 步骤Sl.设定关键字定义表,该关键字定义表包括关键字以及其所对应的关键字
代码; 步骤S2.设定关键字短信频率门限的门限条件A,即主叫源在时间段P内发送违反同样关键字的短信的最大阈值为Ml,其中,P为正数,Ml为正整数; 步骤S3.设定黑名单门限的门限条件B,即主叫源违反门限条件A的不同关键字个数的最大阈值为M2,其中,M2为正整数;
步骤S4.接收短信;
步骤S5.判断接收到的短信内容是否违反关键字,
若没有违反关键字,则返回步骤S4 ;
若违反关键字,则进入步骤S6 ; 步骤S6.存入短信队列,即记录步骤S5中违反关键字短信的主叫源的主叫号码、该主叫源发送此短信的发送时间、以及违反的关键字所对应的关键字代码,将该三个数据存入一短信队列中; 步骤S7.判断在时间段P内此主叫号码的此关键字的计数值是否达到了门限条件A,即判断步骤S6中主叫源的有关键字代码的短信队列是否达到了在时间段P同一关键字的计数值是否超过门限条件A中的最大阈值M1, 若未超过门限条件A中的最大阈值M1,则继续监测,返回步骤S4 ; 若超过门限条件A中的最大阈值Ml ,则进入步骤S8进一步判断; 步骤S8.判断该主叫源是否达到门限条件B,判断步骤S7中达到最大阈值M1的主
叫源是否达到了门限条件B,即主叫源达到门限条件A的不同关键字的次数是否超过门限
条件B中的最大阈值M2, 若未超出最大阈值M2,则此主叫源不列入黑名单,只记录该主叫源和
其关键字的对应关系到短信队列,转到步骤S9 ;
若超出最大阈值M2,则该主叫源列入黑名单,转到步骤S10 ;
步骤S9.拦截此主叫源中符合关键字的短信,然后返回步骤S4 ;
步骤S10.列入黑名单,即该主叫源为垃圾短信源,列入黑名单;
步骤Sll.拦截列入黑名单中的主叫源的所有短信。 本发明的有益效果是本发明通过基于关键字和频次识别垃圾短信源的方法,当主叫源的发送的短信内容违反特定关键字并且超出流量设定的关键字阈值时,只拦截用户违反超出关键字阈值的关键字的短信,而当用户同时违反不同关键字的个数达到关键字黑名单阈值时,才判定主叫源为垃圾短信源,拦截此源的所有短信,排除正常短信源短信偶尔违反关键字的情况,减少垃圾短信拦截误拦率。因此本发明即能识别出符合关键字的短信,又能减少误拦率,准确识别垃圾短信源。


图1是本发明的通过基于关键字和频次识别垃圾短信源的方法的一实施例的流程图; 图2是本发明的一实施例的按照关键字定义表示意图; 图3是本发明的一实施例的有关键字代码的短信队列的示意图; 图4是本发明的一实施例的按照主叫和关键字的统计队列的示意图。
具体实施例方式
—种基于关键字和频次识别垃圾短信源的方法,包括
设定关键字和关键字代码的对应关系; 设定关键字短信频率门限,该关键字短信频率门限为一段时间内违反同样关键字的最大阈值;
设定黑名单门限,即在设定的时间范围内主叫源超出关键字短信频率门限的不同关键字个数的最大阈值,超出该最大阈值,被列入黑名单进行拦截; 接收短信,判断是否违反设定的关键字,记录主叫源发送内容违反关键字的短信; 当设定的时间范围内的主叫源发送的违反同样关键字的短信数量超出该关键字
短信频率门限的最大阈值时,则该主叫源符合此关键字的短信将被拦截; 当设定的时间范围内此主叫源同时拦截的不同关键字个数超出黑名单门限中的
最大阈值,认为此主叫源是垃圾短信源,拦截此主叫源的所有短信。 下面将结合一实施例对本发明作进一步说明。 请参阅图l,该实施例中包括以下步骤 步骤SI.设定关键字定义表,请参阅图2,该关键字定义表包括关键字以及其所对应的关键字代码; 步骤S2.设定关键字短信频率门限的门限条件A,即主叫源在时间段P内发送违反同样关键字的短信的最大阈值为M1,其中,P为正数,M1为正整数,本实施例中,设置了关键字代码501/502/503代表的关键字,P = 1天,M1 = 5条,即最大阈值为Ml为5条同一关键字短信/天; 步骤S3.设定黑名单门限的门限条件B,即主叫源违反门限条件A的不同关键字的最大阈值为M2,其中,M2为正整数(此处请确认),本实施例中,M2 = 3,即3条关键字/天; 步骤S4.接收短信; 步骤S5.判断步骤S4中接收到的短信内容是否违反关键字,
若没有违反关键字,则返回步骤S4 ;
若违反关键字,则进入步骤S6 ; 步骤S6.存入短信队列,即记录步骤S5中违反关键字短信的主叫源的主叫号码、该主叫源发送此短信的发送时间、以及违反的关键字所对应的关键字代码,将该三个数据存入一短信队列中,请参阅图3,示出了该有关键字代码的短信队列; 步骤S7.判断在时间段P内此主叫号码的此关键字的计数值是否达到了门限条件A,即判断步骤S6中主叫源的有关键字代码的短信队列是否达到了在时间段P同一关键字的计数值是否超过门限条件A中的最大阈值M1, 若未超过门限条件A中的最大阈值M1,则继续监测,返回步骤S4 ; 若超过门限条件A中的最大阈值Ml ,则进入步骤S8进一步判断; 步骤S8.判断该主叫源是否达到门限条件B,判断步骤S7中达到最大阈值M1的主
叫源是否达到了门限条件B,即主叫源达到门限条件A的不同关键字的次数是否超过门限
条件B中的最大阈值M2,请参阅图4所示, 若未超出最大阈值M2,则此主叫源不列入黑名单,只记录该主叫源和 其关键字的对应关系到短信队列,转到步骤S9 ; 若超出最大阈值M2,则该主叫源列入黑名单,转到步骤S10 ; 步骤S9.当未超出最大阈值M2时,拦截此主叫源中符合关键字的短信,然后返回步骤S4 ;
步骤SIO.列入黑名单,如图4所示,达到了最大阈值为M2(3条关键字/天),即该主叫源为垃圾短信源,列入黑名单; 步骤Sll.拦截列入黑名单中的主叫源的所有短信。 综上所述,本发明是一种基于关键字和频次识别垃圾短信源的方法,它以关键字
和频次联合计算,对于源没有达到关键字短信最大阈值的关键字,不进行源和关键字的配
对拦截;对于达到关键字短信最大阈值的源,进行源和关键字配对拦截;再判断该源是否
达到黑名单最大阈值,对于没有达到最大阈值的源,只拦截其对应的关键字;对于达到黑名
单最大阈值的源,拦截该源的所有短信。采用该方法精确地识别出垃圾短信源。 对于短信优化系统采用了这种方法,能够减少了垃圾短信的误拦率,提高了垃圾
短信识别的命中度。 以上结合附图实施例对本发明进行了详细说明,本领域中普通技术人员可根据上述说明对本发明做出种种变化例。因而,实施例中的某些细节不应构成对本发明的限定,本发明将以所附权利要求书界定的范围作为本发明的保护范围。
权利要求
一种基于关键字和频次识别垃圾短信源的方法,其特征在于,设定关键字短信频率门限,该关键字短信频率门限为一段时间内违反同样关键字的最大阈值,当设定的时间范围内的主叫源发送的违反同样关键字的短信数量超出该关键字短信频率门限的最大阈值时,则该主叫源符合此关键字的短信将被拦截;设定黑名单门限,即在设定的时间范围内主叫源超出关键字短信频率门限的不同关键字个数的最大阈值,当设定的时间范围内主叫源违反不同的关键字的个数超出该最大阈值时,则判定此主叫源为垃圾短信源,拦截此主叫源的所有短信。
2. 根据权利要求1所述的基于关键字和频次识别垃圾短信源的方法,其特征在于,包括下列步骤步骤Sl.设定关键字定义表,该关键字定义表包括关键字以及其所对应的关键字代码;步骤S2.设定关键字短信频率门限的门限条件A,即主叫源在时间段P内发送违反同样关键字的短信的最大阈值为Ml,其中,P为正数,Ml为正整数;步骤S3.设定黑名单门限的门限条件B,即主叫源违反门限条件A的不同关键字个数的最大阈值为M2,其中,M2为正整数;步骤S4.接收短信;步骤S5.判断接收到的短信内容是否违反关键字,若没有违反关键字,则返回步骤S4 ;若违反关键字,则进入步骤S6;步骤S6.存入短信队列,即记录步骤S5中违反关键字短信的主叫源的主叫号码、该主叫源发送此短信的发送时间、以及违反的关键字所对应的关键字代码,将该三个数据存入一短信队列中;步骤S7.判断在时间段P内此主叫号码的此关键字的计数值是否达到了门限条件A,即判断步骤S6中主叫源的有关键字代码的短信队列是否达到了在时间段P同一关键字的计数值是否超过门限条件A中的最大阈值M1,若未超过门限条件A中的最大阈值Ml,则继续监测,返回步骤S4 ;若超过门限条件A中的最大阈值M1,则进入步骤S8进一步判断;步骤S8.判断该主叫源是否达到门限条件B,判断步骤S7中达到最大阈值M1的主叫源是否达到了门限条件B,即主叫源达到门限条件A的不同关键字的次数是否超过门限条件B中的最大阈值M2,若未超出最大阈值M2,则此主叫源不列入黑名单,只记录该主叫源和其关键字的对应关系到短信队列,转到步骤S9 ;若超出最大阈值M2,则该主叫源列入黑名单,转到步骤S 0 ;步骤S9.拦截此主叫源中符合关键字的短信,然后返回步骤S4 ;步骤SIO.列入黑名单,即该主叫源为垃圾短信源,列入黑名单;步骤Sll.拦截列入黑名单中的主叫源的所有短信。
全文摘要
本发明公开了一种基于关键字和频次识别垃圾短信源的方法,包括设定关键字短信频率门限,该关键字短信频率门限为一段时间内违反同样关键字的最大阈值,当主叫源发送的违反同样关键字的短信数量超出该关键字短信频率门限的最大阈值时,则该主叫源符合此关键字的短信将被拦截;设定黑名单门限,即在设定时间范围内主叫源超出关键字短信频率门限的不同关键字个数的最大阈值,当主叫源违反不同的关键字的个数超出该最大阈值时,则判定此主叫源为垃圾短信源,此主叫源的所有短信将被拦截。本发明根据垃圾短信的发送特征,采用关键字与频次相结合的方法拦截短信,对于同时违反多个关键字的源列入黑名单的方式,能有效拦截垃圾短信。
文档编号H04W4/12GK101771966SQ20101012168
公开日2010年7月7日 申请日期2010年3月11日 优先权日2010年3月11日
发明者伍贳跟, 肖克华 申请人:上海粱江通信系统股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1