一种实现短信过滤的方法及装置的制造方法_2

文档序号:8398514阅读:来源:国知局
,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。
[0041]图1为本发明实现短信过滤的方法的流程图;
[0042]图2为本发明实现短信过滤的系统的结构框图。
【具体实施方式】
[0043]为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0044]图1为本发明实现短信过滤的方法的流程图,如图1所示,包括:
[0045]步骤100、对手机号码,根据呼入呼出信息计算预设个数的疑似系数。
[0046]本步骤中,根据呼入呼出信息计算预设个数的疑似系数具体包括:
[0047]根据预设时长内手机号码的呼出数除以呼入数获得疑似系数;
[0048]根据连续的预设个数的预设时长,计算预设个数的疑似系数。
[0049]需要说明的是预设时长是根据本领域技术人员基于该预设时长的信息可以确定较为稳定的用户通话频率的信息,一般的可以取一周,或以周为基本单位的时长,例如两周或一个月,具体时长可以根据实际统计的数据进行分析后调整;预设个数是指为了通过多个样本来提高疑似系数的稳定性而设定的,一般的可以取预设个数为4,具体的可以根据实际情况进行调整。呼入呼出信息可以通过运营商记录的通讯信息获得,也可以通过通信系统中保存这些信息的网元获得。
[0050]假设预设时长取值为一个月,预设个数为4,手机号码为1800000000的用户连续四个月内的呼入呼出数据为:
[0051]第一个月:呼出为20,呼入为12 ;
[0052]第二个月:呼出为18,呼入为10 ;
[0053]第三个月:呼出为34,呼入为18 ;
[0054]第四个月:呼出为40,呼入为5 ;
[0055]获得的四个疑似系数为:5/3、9/5、17/9、40/5。
[0056]步骤101去除计算获得的疑似系数的歧义点后,将去除歧义点的疑似系数换算为疑似分数。
[0057]本步骤中,将去除歧义点的疑似系数换算为疑似分数为:
[0058]根据去除歧义点后的疑似系数的个数计算疑似系数均值,对疑似系数均值求反正切后获得弧度值;
[0059]将获得的弧度值乘以200得到的积值再除以,获得去除歧义点后的疑似系数对应的疑似分数。
[0060]需要说明的是,需要说明的是,去除歧义点的方法为本领域技术人员的惯用技术手段,通过现有算法可以实现对不稳定疑似系数,即呼入呼出不正常的个别疑似系数进行剔除,例如疑似系数分别为5/3、9/5、17/9、40/5时,通过现有的歧义点去除方法,40/5的疑似系数将被删除。
[0061 ] 弧度值乘以200得到的积值再除以JT是由:弧度值除以Ji *180除以90*100计算获得的,其中,弧度值除以π *180将弧度值转换为角度,由于疑似分数采用呼出呼入比值作为疑似分数,因此将角度值除以90在乘以100以后可以通过100以内的分数值来表示手机号码呼出和呼入的状态信息。通过转换为100以内的分数值,可以更为直观准确的分析所有手机号码的呼出呼入状态,有利于后续步骤中对预设分数阈值的调整,使疑似黑名单号码的判断更为准确,提高系统的垃圾短信的处理效率。
[0062]本发明方法还包括:
[0063]将所有手机号码按照预先设定的规则映射到由I开始的不同的内存位,在手机号对应的内存位中存储疑似分数。
[0064]需要说明的是,通过内存位进行疑似分数的存储,可以实现疑似分数的快速访问和处理,提高了短信过滤的处理过程。
[0065]步骤102、确定疑似分数大于预设分数阈值的手机号码为疑似黑名单号码。
[0066]需要说明的是,预设分数阈值是本领域技术人员基于数据分析获得的结果,一般的预设分数阈值越大,确定为黑名单的号码可能性越大;具体数值确定一般首先采用较高的预设分数阈值进行疑似黑名单号码的判断,当疑似黑名单号码中,疑似黑名单号码最终被确定为黑名单时,为了进一步降低判断是否为垃圾短信的工作压力,可以将预设分数阈值降低;反之,如果最终确定为黑名单的概率较小,则需要提高预设分数阈值的数值。当采用内存位进行疑似分数存储时,通过读取内存位中的数据,可以确定大于预设分数阈值的内存位对应的手机号码;手机号码被确定为黑名单时,可以快速的进行信息处理。
[0067]步骤103、判断疑似黑名单号码发送的短信是否是垃圾短信,当判断结果为垃圾短信时,将疑似黑名单号码确定为黑名单号码,过滤该手机号码发送的所有短信;判断结果为非垃圾短信时,允许该手机号码发送短信。
[0068]在根据呼入呼出信息计算预设个数的疑似系数之前,本发明方法还包括,实时获取所有手机号码发送的短信数量,当所有手机号码发送的短信数量小于处理压力阈值时,直接将手机号码确定为疑似黑名单号码,对疑似黑名单号码发送的短信进行是否是垃圾短信的判断;当所有手机号码发送的短信数量大于处理压力阈值时,根据呼入呼出信息计算预设个数的疑似系数并继续短信过滤的后续进程。即从步骤100开始执行本发明方法。
[0069]需要说明的是,获取所有手机号码发送的短信数量属于本领域技术人员的惯用技术手段,一般的通过各省的短信网关进行实时的短信吞吐量查询后累加即可获得。这里的处理压力阈值是指根据现有系统判断短信是否为垃圾短信时,系统所能处理的数据量确定的数量值,具体根据系统性能进行确定。
[0070]当疑似黑名单号码发送的短信为非垃圾短信时,该方法还包括:
[0071]将该手机号码的疑似分数减去预设数值。
[0072]这里,通过当疑似黑名单号码发送的短信为非垃圾短信时,对该手机号码的疑似分数减去预设数值,可以避免每次接收到短信时,都进行是否为垃圾短信的判断,只有在每一次按照周期重新确定新的疑似系数的情况下,才可能出现对该号码是否为黑名单号码的判断,避免不必要的重复判断,增加处理过程的工作效率。
[0073]本发明通过对发送短信的手机号码,通过呼入呼出信息确定疑似黑名单号码,对疑似黑名单号码发送的短信进行是否垃圾短息的判断,确定为垃圾短信时,将号码确定为黑名单号码并过滤短信,提高了垃圾短信的处理效率,降低了对所有短信进行是否垃圾短信判断的压力,避免了短信暴增造成的处理延时。
[0074]图2为本发明实现短信过滤的系统的结构框图,如图2所示,包括:第一判断装置和第二判断装置;其中,
[0075]第一判断装置包括:计算单元、换算单元、确定疑似单元及黑名单单元;其中,
[0076]计算单元,用于对手机号码,根据呼入呼出信息计算预设个数的疑似系数;
[0077]换算单元,用于去除计算获得的疑似系数的歧义点后,将去除歧义点的疑似系数换算为疑似分数;
[0078]确定疑似单元,用于确定疑似分数大于预设分数阈值的手机号码为疑似黑名单号码,并输出疑似黑名单号码发送的短信给第二判断装置;
[0079]黑名单单元,用于根据接收来自第二判断单元的黑名单号码,过滤所述黑名单号码发送的短信;对于未确定为黑名单号码的短信允许发送;
[0080]第二判断装置包括判断单元和发送单元,用于判断来自第一判断装置的疑似黑名单号码发送的短信是否是垃圾短信;当疑似黑名单号码发送的短信是垃圾短信时,确定疑似黑名单号码为黑名单号码,将黑名单号码发往第一判断装置;当疑似黑名单号码发送的短信是非垃圾短信时,允许该手机号码的短信发送;
[0081]发送单元,用于将确定为黑名单号码发往第一判断装置。
[0082]
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1