一种垃圾短信拦截方法及装置的制造方法

文档序号:10627357阅读:277来源:国知局
一种垃圾短信拦截方法及装置的制造方法
【专利摘要】本发明实施例公开了一种垃圾短信拦截方法及装置,可提高垃圾短信拦截的准确度。本发明实施例方法包括:获取短信;提取所述短信所包括的特征;调用预先构建的短信拦截模型,得到所述特征的权重值;根据所述特征的权重值判断所述短信是否为垃圾短信;对判定为垃圾短信的短信进行拦截处理。
【专利说明】
_种垃圾短信拦截方法及装置
技术领域
[0001]本发明涉及信息处理技术,尤其涉及一种垃圾短信拦截方法及装置。
【背景技术】
[0002]垃圾短信是指内容为诈骗、违法信息、及对客户端用户造成骚扰的无用信息。现有的垃圾短信拦截技术是采用人工编写拦截规则的方式来实现。人工编写的拦截规则一般包含发送者号码以及短信内容关键字等,例如一条人工编写的拦截规则是发送者:106012345678 ;关键字:澳门娱乐城,轮盘,百家乐”,当一条短信的发送号码与这条拦截规则中的发送号码一致,并且短信内容同时包含该拦截规则的所有关键字,则该短信会被判定为该拦截;若某条短信没有命中任何预先编写的拦截规则,则默认会放行该短信。
[0003]然而,短信内容千变万化,人工编写特定的拦截规则,难以准确地决定相关的短信该不该被拦截;而且,短信数量庞大,人工编写的拦截规则数目有限,无法覆盖如此庞大的短信数目,在维护上也十分繁琐,非常容易出现前后矛盾的情况。

【发明内容】

[0004]本发明实施例提供了一种垃圾短信拦截方法及装置,可提高垃圾短信拦截的准确度。
[0005]本发明实施例的第一方面提供一种垃圾短信拦截方法,包括:
[0006]获取短信;
[0007]提取所述短信所包括的特征;
[0008]调用预先构建的短信拦截模型,得到所述特征的权重值;
[0009]根据所述特征的权重值判断所述短信是否为垃圾短信;
[0010]对判定为垃圾短信的短信进行拦截处理。
[0011]本发明实施例第二方面提供了一种垃圾短信拦截装置,包括:
[0012]获取单元,用于获取短信;
[0013]提取单元,用于提取所述短信所包括的特征;
[0014]调用单元,用于调用预先构建的短信拦截模型,得到所述特征的权重值;
[0015]判断单元,用于根据所述特征的权重值判断所述短信是否为垃圾短信;
[0016]执行单元,用于对判定为垃圾短信的短信进行拦截处理。
[0017]本发明实施例提供的技术方案中,首先获取短信并提取该短信所包括的特征,再调用预先构建的短信拦截模型,得到这些特征的权重值,从而根据这些特征的权重值判断该短信是否为垃圾短信,并对判定为垃圾短信的短信进行拦截处理。因此相对于现有技术中直接判断短信中是否包含人工预先编写的拦截规则中的关键字,本发明实施例通过短信拦截模型确定特征的权重值,以短信所包括的特征的权重值来识别垃圾短信的方式会更准确,可有效提高垃圾短信拦截的准确度。
【附图说明】
[0018]图1为本发明实施例中垃圾短信拦截方法一个实施例示意图;
[0019]图2为本发明实施例中垃圾短信拦截方法另一实施例示意图;
[0020]图3为本发明实施例中垃圾短信拦截装置一个实施例示意图;
[0021]图4为本发明实施例中垃圾短信拦截装置另一实施例示意图;
[0022]图5为本发明实施例中垃圾短信拦截装置另一实施例示意图。
【具体实施方式】
[0023]本发明实施例提供了一种垃圾短信拦截方法及装置,可提高垃圾短信拦截的准确度,以下分别进行详细说明。
[0024]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0025]本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三…第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026]本发明实施例中的垃圾短信拦截方法及装置可以应用于手机应用程序中,以手机管家为例,本发明实施例可以作为手机管家骚扰拦截功能中的垃圾短信拦截功能背后的技术。客户端用户只需启用手机管家的垃圾短信拦截功能,即可实现对垃圾短信的拦截,无需额外操作。当客户端收到一条新短信时,手机管家会自动调用短信拦截功能来判断该短信是否需要拦截,如果需要拦截,则将该短信放入垃圾短信信箱中;如果可以放行,则将该短信放入客户端用户正常的短信信箱中。
[0027]需要说明的是,在其他一些实施例中,垃圾短信拦截方法及装置也可以应用于服务器,直接由服务器执行垃圾短信的拦截流程,或者在其他一些实施例中,垃圾短信拦截流程中的部分步骤由服务器执行,其他部分步骤由终端执行,具体此处不作限定。
[0028]请参阅图1,本发明实施例中垃圾短信拦截方法一个实施例包括:
[0029]101、获取短信;
[0030]可以理解的是,在本实施例中,可以是终端直接接收短信,也可以是服务器截获传输给终端的短信。
[0031]102、提取该短信所包括的特征;
[0032]在本实施例中,每条短信都有一系列的特征,其中,特征包括发送时间、发送者地区、接收者地区、发送者号码、短信用词、内容是否包含电话号码以及内容是否包含网址中的至少一个,当然,根据各类短信的更新,特征的选取还可以包含更多种类,具体此处不作限定。
[0033]103、调用预先构建的短信拦截模型,得到特征的权重值;
[0034]需要说明的是,在本实施例中,在短信拦截模型中,预先建立有特征集且计算有特征集中各特征的权重值,由此,通过调用短信拦截模型,可以确定该短信中各特征的权重值。
[0035]104、根据特征的权重值判断该短信是否为垃圾短信;
[0036]在本实施例中,在得到该短信中各特征的权重值后,可以根据这些特征值来判断该短信是否为垃圾短信,在本实施例中,可以基于多种不同的规则来判断这些特征的特征值是否满足相应的要求,从而根据判断结果来判定该短信是否为垃圾短信。
[0037]105、对判定为垃圾短信的短信进行拦截处理;
[0038]在本实施例中,当判定该短信为垃圾短信时,对该短信进行拦截处理,具体此处对短信的拦截处理方式不作限定。
[0039]本发明实施例提供的技术方案中,首先获取短信并提取该短信所包括的特征,再调用预先构建的短信拦截模型,得到这些特征的权重值,从而根据这些特征的权重值判断该短信是否为垃圾短信,并对判定为垃圾短信的短信进行拦截处理。因此相对于现有技术中直接判断短信中是否包含人工预先编写的拦截规则中的关键字,本发明实施例通过短信拦截模型确定特征的权重值,以短信所包括的特征的权重值来识别垃圾短信的方式会更准确,可有效提高垃圾短信拦截的准确度。
[0040]在图1所示实施例的基础上,下面进一步详细描述如何构建短信拦截模型,具体请参阅图2,本发明实施例中垃圾短信拦截方法另一实施例包括:
[0041]需要说明的是,短信拦截模型的构建可以离线进行,然后在线应用于垃圾短信拦截,优选地,在本实施例中,短信拦截模型的构建由服务器执行,以快速求解权重值,并同时向多个终端服务。
[0042]201、建立特征集;
[0043]在本实施例中,以多个已知是否为垃圾短信的短信作为短信样本,提取该短信样本中每条短信所包含的特征,得到特征集。为了保证覆盖面和准确度,在本实施例中,特征集收集的特征的个数可以达到千万个的级别,或者更多,具体此处不作限定。其中,特征包括发送时间、发送者地区、接收者地区、发送者号码、短信用词、内容是否包含电话号码以及内容是否包含网址中的至少一个,当然,根据各类短信的更新,特征的选取还可以包含更多种类,具体此处不作限定。
[0044]202、为特征集中的每个特征定义权重,针对该短信样本中的各短信构建以权重为变量的方程式,形成短信拦截方程组;
[0045]在本实施例中,为特征集中的每个特征引入一个特征系数,即权重,其可以反映特征对短信被拦截的贡献大小,然而针对该短信样本中的各短信构建以权重为变量的方程式,形成短信拦截方程组,以便通过该短信拦截方程组求解权重的权重值,具体包括:
[0046]将每条短信所包括的特征的权重进行相加;
[0047]若短信为垃圾短信,则将其对应相加的结果赋值为第一预设值;
[0048]若短信为垃圾短信,则将其对应相加的结果赋值为第二预设值。
[0049]下面以一具体的应用实例说明如何建立短信拦截方程组:
[0050]对上述短信样本的中的短信进行编号,得到编号为I至k的k条短信,其中,k为短信样本的样本容量;并且,对特征集中的特征进行编号,得到特征&至X n;
[0051]针对短信样本中的每条短信,将特征与其对应的权重之乘积进行相加,可参见计算式^1Xfa2Xda3X3+...+an Xn,其中,若在该条短信中不包含特征Xn,则Xn的值为0,否则,Xn的值为I ο在本实施例中,短信样本中每条短信均已知是否为垃圾短信,对每条垃圾短信,将上述计算式的计算结果统一赋值为第一预设值,对每条非垃圾短信,将上述计算式的计算结果统一赋值为第二预设值,即:
[0052]针对短信样本中的每条垃圾短信,可以得到方程:??+??+??+...+an Xn =第一预设值;
[0053]针对短信样本中的每条普通短信,可以得到方程M1XJa2Xi^a3X3+...+an Xn =第二预设值;
[0054]最后,将短信样本中每一条短信形成的方程连立起来,就得到短信拦截方程组,即:
[0055]B1X1 ⑴+a2X2 ⑴+a3X3 ⑴+...+an Xr^1)= y ι
[0056]B1X1 ⑵+a2X2 ⑵+a3X3 ⑵+...+an Xn ⑵=y 2
[0057]......
[0058]S1X1 (m) +a2X2 (m) +a3X3 (m) +...+an Xn (m)= y m
[0059]......
[0060]S1X1 (k) +a2X2 (k) +a3X3 (k) +...+an Xn (k)= y k
[0061]其中,当短信编号为第m的短信为垃圾短信时,yni的取值为第一预设值,否则,yni的取值为第二预设值;
[0062]Xn代表特征编号为第η的特征;a ?为X n的权重;X nW代表短信编号为第m的短信所包含的Xn,且m小于或等于k,其中,若短信编号为第m的短信不包含Xn,则Xnw的值为0,否则,Xnw的值为1
[0063]203、求解该短信拦截方程组中各特征的权重的权重值;
[0064]可以理解的是,在一些实施例中,为了保证覆盖面和准确度,短信样本的样本容量可以达到百亿级的数量,或者更多,由此,可以得到具有海量特征的超大规模方程组,并利用大数据处理技术求解该超大规模方程组。在方程组规模巨大的情况下,若单台计算机无法存储以及计算如此大的数据量,也可以使用大数据存储和大数据计算技术,分布式地存储方程组,并进行并行求解,最终求解出所有的权重值。
[0065]在步骤202的应用实例的基础上,通过执行步骤203,可以求解得到&1至a n的值。
[0066]上述步骤201至步骤203为短信拦截模型的构建流程,下面进一步描述如何利用短信拦截模型进行垃圾短信拦截:
[0067]优选地,在本实施例中,可以由终端执行垃圾短信的线上拦截流程:
[0068]204、获取短信;
[0069]205、提取该短信所包括的特征;
[0070]在本实施例中,在获取短信后,可以先对短信进行预处理,去除短信中常见的人为干扰字符、全角英文字符等,然后再提取该短信所包括的特征。其中,特征包括发送时间、发送者地区、接收者地区、发送者号码、短信用词、内容是否包含电话号码以及内容是否包含网址中的至少一个,当然,根据各类短信的更新,特征的选取还可以包含更多种类,具体此处不作限定。
[0071]206、调用预先构建的短信拦截模型,得到特征的权重值;
[0072]需要说明的是,并非每次拦截垃圾短信都要执行上述步骤201至步骤203中的短信拦截模型的构建流程,只需保证在调用时,已经构建有短信拦截模型即可。由于在短信拦截模型中,建立有特征集且计算有特征集中各特征的权重值,由此,通过调用短信拦截模型,可以确定该短信中各特征的权重值。
[0073]207、根据特征的权重值判断该短信是否为垃圾短信;
[0074]在本实施例中,在得到该短信中各特征的权重值后,可以根据这些特征值来判断该短信是否为垃圾短信,在本实施例中,可以基于多种不同的规则来判断这些特征的特征值是否满足相应的要求,从而根据判断结果来判定该短信是否为垃圾短信。下面对根据特征的权重值判断该短信是否为垃圾短信的具体方式进行举例说明:
[0075]第一种方式:对该短信中各特征的权重值进行相加,得到一个权重总和;判断该权重总和是否在该第一预设值和该第二预设值之中更接近该第一预设值,若是,则判定该短?目为垃圾短?目。
[0076]具体的,可利用计算式alXl+a2X2+a3X3+...+an Xn来得到权重总和,其中,若该条短信中不包含特征Xn,则Xn的值为0,否则Xn的值为I ;在得到权重总和后,计算该权重总和与第一预设值之间的差值的绝对值NI,并计算该权重总和与第二预设值之间的差值的绝对值N2 ;当NI小于N2时,判定该短信为垃圾短信。
[0077]在本实施例中,第一预设值可以设置为I,第二预设值可以设置为-1,则求解得到an值的正负可以表征该对应特征对拦截是具有正贡献还是负贡献,当权重总和大于O时,判定该短信为垃圾短信。
[0078]在一具体应用场景中,以如下短信A为例进行说明:
[0079]短信A:尊敬的XX用户,恭喜您在线时长超过1000分钟,特赠送砸金蛋送百元话费!登录网址XXX开始砸蛋,客服01058206555。
[0080]对该短信A提取的特征可以包括:发送者号码A1、发送时间A2、发送者地区A3、接收者地区A4、发送者内容包含电话号码A5、内容包含网址A6、内容包含金额A7、短信用词赠送A8以及短?目用词恭喜Ag。
[0081]上述特征均可以在特征集中查询到,且通过调用短信拦截模型,得到这些特征的权重值:发送者号码A1的权重值为0.01、发送时间A 2的权重值为-0.002、发送者地区A3的权重值为O、接收者地区A4的权重值为0、发送者内容包含电话号码A 5的权重值为0.005、内容包含网址A6的权重值为0.005、内容包含金额A7的权重值为0.001、短信用词赠送六8的权重值为0.002以及短信用词恭喜A9的权重值为0.001 ;其中,第一预设值为I,第二预设值为-1 ;
[0082]对该短信中各特征的权重值进行相加,得到权重总和0.01+( - 0.002)+0+0+0.005+0.005+0.001+0.002+0.001,等于0.022,由于0.022大于0,可以判定该短信为垃圾短信。
[0083]第二种方式:若第一预设值大于第二预设值,则判断该短信所包括的特征中是否有权重值大于第三预设值的特征,若有,则判定该短信为垃圾短信;若该第一预设值小于第二预设值,则判断该短信所包括的特征中是否有权重值小于第四预设值的特征,若有,则判定该短信为垃圾短信。
[0084]在一具体应用场景中,以如下短信A为例进行说明:
[0085]短信A:尊敬的XX用户,恭喜您在线时长超过1000分钟,特赠送砸金蛋送百元话费!登录网址XXX开始砸蛋,客服01058206555。
[0086]对该短信A提取的特征可以包括:发送者号码A1、发送时间A2、发送者地区A3、接收者地区A4、发送者内容包含电话号码A5、内容包含网址A6、内容包含金额A7、短信用词赠送A8以及短?目用词恭喜Ag。
[0087]上述特征均可以在特征集中查询到,且通过调用短信拦截模型,得到这些特征的权重值:发送者号码A1的权重值为0.01、发送时间A 2的权重值为-0.002、发送者地区A3的权重值为O、接收者地区A4的权重值为0、发送者内容包含电话号码A 5的权重值为0.005、内容包含网址A6的权重值为0.005、内容包含金额A7的权重值为0.001、短信用词赠送六8的权重值为0.2以及短信用词恭喜A9的权重值为0.001 ;其中,第一预设值为1,第二预设值为-1,第三预设值为0.15 ;
[0088]在第一预设值大于第二预设值的情况下,该短信所包括的特征中有权重大于第三预设值的特征(短信用词赠送^的权重为0.2),可以判定该短信为垃圾短信。
[0089]需要说明的是,上面仅以几个例子说明了如何根据特征的权重值判断该短信是否为垃圾短信,在实际应用中,还可以基于特征的权重值制定更多的判断方式,具体的判断方式此处不做限定。
[0090]208、对判定为垃圾短信的短信进行拦截处理;
[0091 ] 在本实施例中,当判定该短信为垃圾短信时,对该短信进行拦截处理,具体此处对短信的拦截处理方式不作限定。
[0092]上面对本发明实施例中的垃圾短信拦截方法进行了描述,下面对本发明实施例中的垃圾短信拦截装置进行描述,请参阅图3,本发明实施例中垃圾短信拦截装置一个实施例包括:
[0093]获取单元301,用于获取短信;
[0094]提取单元302,用于提取所述短信所包括的特征;
[0095]调用单元303,用于调用预先构建的短信拦截模型,得到所述特征的权重值;
[0096]判断单元304,用于根据所述特征的权重值判断所述短信是否为垃圾短信;
[0097]执行单元305,用于对判定为垃圾短信的短信进行拦截处理。
[0098]为便于理解,下面以一具体应用场景为例,对本实施例中垃圾短信拦截装置内部运作流程进行描述:
[0099]获取单元301获取短信;提取单元302提取所述短信所包括的特征;调用单元303调用预先构建的短信拦截模型,得到所述特征的权重值;判断单元304根据所述特征的权重值判断所述短信是否为垃圾短信;执行单元305,对判定为垃圾短信的短信进行拦截处理。
[0100]本发明实施例提供的技术方案中,首先通过获取单元301获取短信并由提取单元302提取该短信所包括的特征,再由调用单元303调用预先构建的短信拦截模型,得到这些特征的权重值,从而通过判断单元304根据这些特征的权重值判断该短信是否为垃圾短信,并由执行单元305对判定为垃圾短信的短信进行拦截处理。因此相对于现有技术中直接判断短信中是否包含人工预先编写的拦截规则中的关键字,本发明实施例通过短信拦截模型确定特征的权重值,以短信所包括的特征的权重值来识别垃圾短信的方式会更准确,可有效提高垃圾短信拦截的准确度。
[0101]在图3所示实施例的基础上,下面进一步详细描述包括构建短信拦截模型的垃圾短信拦截装置的具体结构,具体请参阅图4,本发明实施例中垃圾短信拦截装置另一实施例包括:
[0102]获取单元401,用于获取短信;
[0103]提取单元402,用于提取所述短信所包括的特征;
[0104]调用单元403,用于调用预先构建的短信拦截模型,得到所述特征的权重值;
[0105]判断单元404,用于根据所述特征的权重值判断所述短信是否为垃圾短信;
[0106]执行单元405,用于对判定为垃圾短信的短信进行拦截处理。
[0107]在本实施例中,所述垃圾短信拦截装置还进一步包括构建单元406,所述构建单元406包括:
[0108]提取模块4061,用于以多个已知是否为垃圾短信的短信作为短信样本,提取所述短信样本中每条短信所包括的特征,得到特征集;
[0109]构建模块4062,用于为所述特征集中的每个特征定义权重;针对所述短信样本中的各短信构建以权重为变量的方程式,形成短信拦截方程组;
[0110]计算模块4063,用于求解所述短信拦截方程组中各特征的权重的权重值。
[0111]可选地,所述构建模块4062,具体可以用于将每条短信所包括的特征的权重进行相加;若短信为垃圾短信,则将其对应相加的结果赋值为第一预设值;若短信为非垃圾短信,则将其对应相加的结果赋值为第二预设值。
[0112]可选地,所述判断单元404,具体可以用于对所述短信中各特征的权重值进行相加,得到一个权重总和;判断所述权重总和是否在所述第一预设值和所述第二预设值之中更接近所述第一预设值,若是,则判定所述短信为垃圾短信。
[0113]可选地,所述判断单元404,具体可以用于若所述第一预设值大于第二预设值,则判断所述短信所包括的特征中是否有权重值大于第三预设值的特征,若有,则判定所述短信为垃圾短信;若所述第一预设值小于第二预设值,则判断所述短信所包括的特征中是否有权重值小于第四预设值的特征,若有,则判定所述短信为垃圾短信。
[0114]可选地,所述特征包括发送时间、发送者地区、接收者地区、发送者号码、短信用词、内容是否包含电话号码以及内容是否包含网址中的至少一个。
[0115]上面从模块化功能实体的角度对本发明实施例中的垃圾短信拦截装置进行描述,下面从硬件处理的角度对本发明实施例中的垃圾短信拦截装置进行描述,请参阅图5,本发明实施例中垃圾短信拦截装置另一实施例包括:
[0116]输入装置501、输出装置502、处理器503和存储器504 (其中垃圾短信拦截装置中的处理器503的数量可以一个或多个,图5中以一个处理器503为例)。在本发明的一些实施例中,输入装置501、输出装置502、处理器503和存储器504可通过总线或其它方式连接,其中,图5中以通过总线连接为例。
[0117]其中,通过调用存储器504存储的操作指令,处理器503,用于执行如下步骤:
[0118]获取短信;
[0119]提取所述短信所包括的特征;
[0120]调用预先构建的短信拦截模型,得到所述特征的权重值;
[0121]根据所述特征的权重值判断所述短信是否为垃圾短信;
[0122]对判定为垃圾短信的短信进行拦截处理。
[0123]在本发明的一些实施例中,处理器503还可以用于执行以下步骤:构建短信拦截模型;所述短信拦截模型的构建包括:
[0124]以多个已知是否为垃圾短信的短信作为短信样本,提取所述短信样本中每条短信所包括的特征,得到特征集;
[0125]为所述特征集中的每个特征定义权重;
[0126]针对所述短信样本中的各短信构建以权重为变量的方程式,形成短信拦截方程组;
[0127]求解所述短信拦截方程组中各特征的权重的权重值。
[0128]在本发明的一些实施例中,处理器503具体用于执行以下步骤:
[0129]将每条短信所包括的特征的权重进行相加;
[0130]若短信为垃圾短信,则将其对应相加的结果赋值为第一预设值;
[0131]若短信为非垃圾短信,则将其对应相加的结果赋值为第二预设值。
[0132]在本发明的一些实施例中,处理器503具体可以用于执行以下步骤:
[0133]对所述短信中各特征的权重值进行相加,得到一个权重总和;
[0134]判断所述权重总和是否在所述第一预设值和所述第二预设值之中更接近所述第一预设值,若是,则判定所述短信为垃圾短信。
[0135]在本发明的一些实施例中,处理器503具体可以用于执行以下步骤:
[0136]若所述第一预设值大于第二预设值,则判断所述短信所包括的特征中是否有权重值大于第三预设值的特征,若有,则判定所述短信为垃圾短信;
[0137]若所述第一预设值小于第二预设值,则判断所述短信所包括的特征中是否有权重值小于第四预设值的特征,若有,则判定所述短信为垃圾短信。
[0138]在本发明的一些实施例中,所述特征包括发送时间、发送者地区、接收者地区、发送者号码、短信用词、内容是否包含电话号码以及内容是否包含网址中的至少一个。
[0139]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0140]在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0141]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0142]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0143]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0144]以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1.一种垃圾短信拦截方法,其特征在于,包括: 获取短ig ; 提取所述短信所包括的特征; 调用预先构建的短信拦截模型,得到所述特征的权重值; 根据所述特征的权重值判断所述短信是否为垃圾短信; 对判定为垃圾短信的短信进行拦截处理。2.如权利要求1所述的垃圾短信拦截方法,其特征在于,所述短信拦截模型的构建包括: 以多个已知是否为垃圾短信的短信作为短信样本,提取所述短信样本中每条短信所包括的特征,得到特征集; 为所述特征集中的每个特征定义权重; 针对所述短信样本中的各短信构建以权重为变量的方程式,形成短信拦截方程组; 求解所述短信拦截方程组中各特征的权重的权重值。3.如权利要求2所述的垃圾短信拦截方法,其特征在于,所述针对所述短信样本中的各短信构建以权重为变量的方程式,形成短信拦截方程组包括: 将每条短信所包括的特征的权重进行相加; 若短信为垃圾短信,则将其对应相加的结果赋值为第一预设值; 若短信为非垃圾短信,则将其对应相加的结果赋值为第二预设值。4.如权利要求3所述的垃圾短信拦截方法,其特征在于,所述根据所述特征的权重值判断所述短信是否为垃圾短信包括: 对所述短信中各特征的权重值进行相加,得到一个权重总和; 判断所述权重总和是否在所述第一预设值和所述第二预设值之中更接近所述第一预设值,若是,则判定所述短信为垃圾短信。5.如权利要求3所述的垃圾短信拦截方法,其特征在于,所述根据所述特征的权重值判断所述短信是否为垃圾短信包括: 若所述第一预设值大于第二预设值,则判断所述短信所包括的特征中是否有权重值大于第三预设值的特征,若有,则判定所述短信为垃圾短信; 若所述第一预设值小于第二预设值,则判断所述短信所包括的特征中是否有权重值小于第四预设值的特征,若有,则判定所述短信为垃圾短信。6.如权利要求1至5中任意一项所述的垃圾短信拦截方法,其特征在于,所述特征包括发送时间、发送者地区、接收者地区、发送者号码、短信用词、内容是否包含电话号码以及内容是否包含网址中的至少一个。7.—种垃圾短信拦截装置,其特征在于,包括: 获取单元,用于获取短信; 提取单元,用于提取所述短信所包括的特征; 调用单元,用于调用预先构建的短信拦截模型,得到所述特征的权重值; 判断单元,用于根据所述特征的权重值判断所述短信是否为垃圾短信; 执行单元,用于对判定为垃圾短信的短信进行拦截处理。8.如权利要求7所述的垃圾短信拦截装置,其特征在于,所述装置还包括构建单元;所述构建单元包括: 提取模块,用于以多个已知是否为垃圾短信的短信作为短信样本,提取所述短信样本中每条短信所包括的特征,得到特征集; 构建模块,用于为所述特征集中的每个特征定义权重;针对所述短信样本中的各短信构建以权重为变量的方程式,形成短信拦截方程组; 计算模块,用于求解所述短信拦截方程组中各特征的权重的权重值。9.如权利要求8所述的垃圾短信拦截装置,其特征在于, 所述构建模块,具体用于将每条短信所包括的特征的权重进行相加;若短信为垃圾短信,则将其对应相加的结果赋值为第一预设值;若短信为非垃圾短信,则将其对应相加的结果赋值为第二预设值。10.如权利要求9所述的垃圾短信拦截装置,其特征在于, 所述判断单元,具体用于对所述短信中各特征的权重值进行相加,得到一个权重总和;判断所述权重总和是否在所述第一预设值和所述第二预设值之中更接近所述第一预设值,若是,则判定所述短信为垃圾短信。11.如权利要求9所述的垃圾短信拦截装置,其特征在于, 所述判断单元,具体用于若所述第一预设值大于第二预设值,则判断所述短信所包括的特征中是否有权重值大于第三预设值的特征,若有,则判定所述短信为垃圾短信;若所述第一预设值小于第二预设值,则判断所述短信所包括的特征中是否有权重值小于第四预设值的特征,若有,则判定所述短信为垃圾短信。12.如权利要求7至11中任意一项所述的垃圾短信拦截装置,其特征在于,所述特征包括发送时间、发送者地区、接收者地区、发送者号码、短信用词、内容是否包含电话号码以及内容是否包含网址中的至少一个。
【文档编号】H04W4/14GK105992176SQ201510047399
【公开日】2016年10月5日
【申请日】2015年1月29日
【发明人】何锐邦
【申请人】腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1