短信拦截方法和装置与流程

文档序号:12162851阅读:292来源:国知局
短信拦截方法和装置与流程

本发明涉及通信领域,尤其涉及一种短信拦截方法和装置。



背景技术:

随着通信业务的发展,短信业务因价格便宜、形式新颖、方便快捷,赢得了广大用户的青睐。但是,随着短信服务的被广泛使用,垃圾短信问题也愈演愈烈,大量不法用户或商家借助短信平台发送广告信息、诈骗信息和恶意骚扰短信等。垃圾短信的泛滥,不但扰乱了用户正常的通信生活,还可能会给用户带来金钱上的损失。

为解决垃圾短信给用户带来的困扰,运营商一般使用垃圾短信系统对垃圾短信进行拦截。运营商对不同类型的垃圾短信,实际的拦截需求是不同的。例如,对于诈骗类和谣言传播类等影响恶劣的短信,需严格拦截;对于商业广告类或通知类的短信,可以使用较为宽泛的拦截策略。但是,目前的垃圾短信拦截系统配置单一,针对所有收到的垃圾短信均采用同种拦截策略,不能满足运营商的需求。



技术实现要素:

本发明的主要目的在于提供一种短信拦截方法和装置,旨在解决短信拦截策略单一的技术问题。

为实现上述目的,本发明提供一种短信拦截方法,所述短信拦截方法包括以下步骤:

接收短信,并获取所述短信的特征向量;

根据所述短信的特征向量,查找与所述短信匹配的垃圾短信模板;

根据与所述短信匹配的垃圾短信模板,以及预设的过滤条件,使用相应的拦截频次策略对所述短信进行拦截处理。

优选的,所述预设的过滤条件包括:短信的主叫号码、被叫号码和发送时间,所述接收短信,并获取所述短信的特征向量的步骤之前,包括:

获取用户输入的垃圾短信模板和垃圾短信模板的类型;

根据所述用户输入的垃圾短信模板的类型、主叫号码、被叫号码和发送时间段设置拦截频次策略;

获取所述用户输入的垃圾短信模板的特征向量;

根据所述垃圾短信模板的特征向量,筛选出具有相同特征向量的垃圾短信模板,形成列表供查找。

优选的,所述根据所述短信的特征向量,查找与所述短信匹配的垃圾短信模板的步骤包括:

根据所述短信的特征向量,查找具有相同特征向量的垃圾短信模板列表;

若找到具有相同特征向量的垃圾短信模板列表,则获取所述垃圾短信模板列表中,与所述短信的相似度最大的垃圾短信模板;

判断所述最大相似度是否满足阈值;

若所述最大相似度满足阈值,则获取与所述短信的相似度最大的垃圾短信模板,作为与所述短信匹配的垃圾短信模板。

优选的,所述根据所述短信的特征向量,查找与所述短信匹配的垃圾短信模板的步骤之后,还包括:

若未找到与所述短信匹配的垃圾短信模板,则采用默认的垃圾短信模板对所述短信进行拦截处理。

优选的,所述根据与所述短信匹配的垃圾短信模板,以及预设的过滤条件,使用相应的拦截频次策略对所述短信进行拦截处理的步骤包括:

获取与所述短信匹配的垃圾短信模板的类型;

将与所述短信匹配的垃圾短信模板的类型作为所述短信的类型;

根据所述短信的类型,以及预设的过滤条件,获取相应的拦截频次策略;

根据所述短信的类型和主叫号码,获取所述主叫号码发送此类型短信的发送频次;

判断所述主叫号码发送此类型短信的发送频次是否超过所述拦截频次策略的拦截频次;

若所述主叫号码发送此类型短信的发送频次超过所述拦截频次策略的拦截频次,则拦截所述短信;

若所述主叫号码发送此类型短信的发送频次未超过所述拦截频次策略的拦截频次,则放行所述短信。

此外,为实现上述目的,本发明还提供一种短信拦截装置,所述短信拦截装置包括:

接收模块,用于接收短信,并获取所述短信的特征向量;

匹配模块,用于根据所述短信的特征向量,查找与所述短信匹配的垃圾短信模板;

拦截模块,用于根据与所述短信匹配的垃圾短信模板,以及预设的过滤条件,使用相应的拦截频次策略对所述短信进行拦截处理。

优选的,所述预设的过滤条件包括:短信的主叫号码、被叫号码和发送时间,所述短信拦截装置还包括:

获取模块,用于获取用户输入的垃圾短信模板和垃圾短信模板的类型;根据所述用户输入的垃圾短信模板的类型、主叫号码、被叫号码和发送时间段设置拦截频次策略;

计算模块,用于获取所述用户输入的垃圾短信模板的特征向量;

列表模块,用于根据所述垃圾短信模板的特征向量,筛选出具有相同特征向量的垃圾短信模板,形成列表供查找。

优选的,所述匹配模块包括:

查找单元,用于根据所述短信的特征向量,查找具有相同特征向量的垃圾短信模板列表;

相似度计算单元,用于若找到具有相同特征向量的垃圾短信模板列表,则获取所述垃圾短信模板列表中,与所述短信的相似度最大的垃圾短信模板;

判断单元,用于判断所述最大相似度是否满足阈值;

匹配单元,用于若所述最大相似度满足阈值,则获取与所述短信的相似度最大的垃圾短信模板,作为与所述短信匹配的垃圾短信模板。

优选的,所述拦截模块还用于,

若未找到与所述短信匹配的垃圾短信模板,则采用默认的垃圾短信模板对所述短信进行拦截处理。

优选的,所述拦截模块包括:

类型单元,用于获取与所述短信匹配的垃圾短信模板的类型;将与所述短信匹配的垃圾短信模板的类型作为所述短信的类型;

策略单元,用于根据所述短信的类型,以及预设的过滤条件,获取相应的拦截频次策略;

频次单元,用于根据所述短信的类型和主叫号码,获取所述主叫号码发送此类型短信的发送频次;

判断单元,用于判断所述主叫号码发送此类型短信的发送频次是否超过所述拦截频次策略的拦截频次;

拦截单元,用于若所述主叫号码发送此类型短信的发送频次超过所述拦截频次策略的拦截频次,则拦截所述短信;

放行单元,用于若所述主叫号码发送此类型短信的发送频次未超过所述拦截频次策略的拦截频次,则放行所述短信。

本发明实施例提出的一种短信拦截方法和装置,通过运营商服务器接收短信,获取短信的特征向量,根据短信的特征向量,查找与短信匹配的垃圾短信模板,然后,根据与短信匹配的垃圾短信模板和过滤条件,使用相应的拦截频次策略对短信进行拦截处理。本发明实施例对不同类型的短信进行不同策略的拦截处理,实现了对短信的差异化拦截,满足了运营商的需求。

附图说明

图1为本发明短信拦截方法第一实施例的流程示意图;

图2为本发明短信拦截方法第二实施例的流程示意图;

图3为本发明短信拦截方法第三实施例的流程示意图;

图4为本发明短信拦截方法第四实施例的流程示意图;

图5为本发明短信拦截方法第五实施例的流程示意图;

图6为本发明短信拦截装置第一实施例的功能模块示意图;

图7为本发明短信拦截装置第二实施例的功能模块示意图;

图8为本发明短信拦截装置第三实施例的功能模块示意图;

图9为本发明短信拦截装置第五实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例的主要解决方案是:接收短信,并获取所述短信的特征向量;根据所述短信的特征向量,查找与所述短信匹配的垃圾短信模板;根据与所述短信匹配的垃圾短信模板,以及预设的过滤条件,使用相应的拦截频次策略对所述短信进行拦截处理。

由于现有技术的垃圾短信拦截系统配置单一,针对所有收到的垃圾短信均采用同种拦截策略,因此,不能满足运营商对不同类型的垃圾短信的不同拦截需求。

本发明提供一种解决方案,收到短信后根据短信的类型和过滤条件,按照对应的拦截策略,对短信进行的相应的操作进行拦截处理,满足了运营商对垃圾短信差异化的拦截需求。

参照图1,本发明短信拦截方法第一实施例提供一种短信拦截方法,所述短信拦截方法包括:

步骤S10、接收短信,并获取所述短信的特征向量。

本实施例方案主要应用于运营商服务器,当然也可以应用于其他具有短信拦截需求的服务器。本实施例以运营商服务器进行举例说明。

具体的,作为一种实施方式,首先,运营商服务器接收短信,得到短信的文本内容,和短信的相关信息,例如:短信的主叫号码、被叫号码和发送时间。

然后,获取短信的特征向量,以便后续获取与该短信匹配的垃圾短信模 板。

具体地,在获取短信的特征向量时,可以采用如下方案:

首先,运营商服务器去除短信文本的噪声,也即去除短信文本中的干扰词,如:标点符号。

然后,对得到的去除噪声后的短信文本进行分词处理,将短信文本拆分为单个的分词,并去除所得到的词组中的停用词。去除的停用词包括:副词、介词、语气助词、连接词等,这些词通常本身并无明确的意义,只有将其放入一个完整的句子中才有一定作用,如常见的“的”和“在”。

然后,将得到的单个的分词按照字符的编码顺序进行排序,得到短信的特征向量。在本实施例中,使用UTF-8编码(8-bit Unicode Transformation Format,万国码),将得到的单个的分词转化为UTF-8编码,得到表征所有分词的UTF-8编码;按照UTF-8编码的顺序,将得到的所有UTF-8编码进行排序,得到短信的特征向量。当然,也可以使用其他编码进行排序,可根据实际需要灵活设定。

步骤S20、根据所述短信的特征向量,查找与所述短信匹配的垃圾短信模板。

本实施例中,运营商服务器预先配置有不同类型的垃圾短信模板,根据与垃圾短信模板的相似度来决定垃圾短信的类型;然后根据不同的垃圾短信类型,结合过滤条件如主叫号码、被叫号码,配置不同的拦截策略,以满足运营商用户对于短信差异化拦截的要求。

在得到短信的特征向量后,运营商服务器以短信的特征向量为关键词,查找内存中具有相同特征向量的垃圾短信模板,并计算所找到的垃圾短信模板与短信的相似度。

然后,判断计算得到的相似度是否满足预设的阈值:若所得到的相似度满足预设的阈值,则所找到的垃圾短息模板与短信匹配,获取此垃圾短信模板。

若查找到多条与短信具有相同特征向量的垃圾短信模板,则分别计算所有找到的垃圾短信模板与短信的相似度,获取与短信的相似度最大的垃圾短信模板;然后,判断最大相似度是否满足预设的阈值:若最大相似度满足预 设的阈值,则判定此垃圾短信模板与短信匹配。

步骤S30、根据与所述短信匹配的垃圾短信模板,以及预设的过滤条件,使用相应的拦截频次策略对所述短信进行拦截处理。

在获取与短信匹配的垃圾短信模板后,以垃圾短信模板的类型为短信的类型。

然后,根据短信的类型和预设的过滤条件,查找并获取相应的拦截频次策略。本实施例所述的拦截频次策略是指同一主叫用户一定时间内,发送同类型的短信的频次达到设定的阈值后,就拦截该短信。因此,可以针对不同类型的短信设置不同的拦截频次。比如诈骗类短信,可以将拦截频次的阈值设置低一点,而商业广告类和通知类的短信可以将拦截频次的阈值设置高一点。

需要说明的是,预设的过滤条件可以为:短信的主叫号码、被叫号码,也可以为:短信的主叫号码、被叫号码和发送时间,可根据实际需要灵活设置。

然后,根据短信的类型和主叫号码,获取该主叫号码发送此类型短信的发送频次。

然后,判断得到的该主叫号码发送此类型短信的发送频次是否超过此短信相应的拦截频次阈值:若超过,则拦截短信;若未超过,则放行短信。

在本实施例中,运营商服务器接收短信,获取短信的特征向量,根据短信的特征向量,查找与短信匹配的垃圾短信模板,然后,根据与短信匹配的垃圾短信模板和预设的过滤条件,使用相应的拦截频次策略对短信进行拦截处理,从而对不同类型的短信进行不同策略的拦截处理,实现了对短信的差异化拦截,满足了运营商用户的需求。

进一步的,参照图2,本发明短信拦截方法第二实施例提供一种短信拦截方法,基于上述图1所示的实施例,所述预设的过滤条件包括:短信的主叫号码、被叫号码和发送时间,所述步骤S10之前还包括:

步骤S40、获取用户输入的垃圾短信模板和垃圾短信模板的类型。

运营商用户可根据需要拦截的短信,输入垃圾短信模板,并对输入的每个垃圾短信模板都进行类型的设置。需要说明的是,垃圾短信模板的类型可由用户自定义设置,也可以由用户选择预设的类型,可根据实际需要灵活设置。

运营商服务器获取运营商用户输入的垃圾短信模板,和垃圾短信模板的类型。

步骤S50、根据所述用户输入的垃圾短信模板的类型、主叫号码、被叫号码和发送时间段设置拦截频次策略。

运营商服务器获取运营商用户输入的垃圾短信模板后,针对不同的垃圾短信模板类型设置差异化的拦截策略。针对垃圾短信模板的拦截频次策略可以为预设的拦截频次策略,也可以获取运营商用户根据实际需要设置的拦截频次策略,可根据实际需要灵活设置。

具体的,作为一种实施方式,以获取运营商用户设置的拦截频次策略举例,根据垃圾短信模板的类型、主叫号码所属的不同用户组、被叫号码所属的不同用户组和发送的不同时间段,运营商用户可以设置相应的拦截频次策略。

由此,得到的每个拦截频次策略均包括如下信息:

短信的类型;

主叫号码所属的用户组;

被叫号码所属的用户组;

发送的时间段。

得到的拦截频次策略可以是策略树,也即每一个垃圾短信模板,依次根据垃圾短信模板类型、主叫号码所属的用户组、被叫号码所属的用户组和发送的时间段,均有对应的拦截频次策略。

其中,拦截频次策略为:同一主叫用户一定时间内,发送同类型的短信的频次达到设定的阈值后,就拦截该短信。例如:诈骗类的短信,须严格拦截,拦截频次的阈值可以设置的较低;商业广告类的短信,可放松拦截条件,拦截频次的阈值可以设置的较高。当然,拦截频次策略也可以为其他策略,可根据实际需要灵活设置。

主叫号码所属的用户组包括本网用户组、外网用户组、本省用户组、外省用户组、不同的号段组和SP(Service Provider,服务提供商)用户组,也可以为其他用户组,可根据实际需要灵活设置。

被叫号码所属的用户组包括本网用户组、外网用户组、本省用户组、外省用户组、不同的号段组和SP用户组,也可以为其他用户组,可根据实际需要灵活设置。

发送时间段可以小时为单位,也可以天为单位,也可以使用其他时间单位,可根据实际需要灵活设置。

步骤S60、获取所述用户输入的垃圾短信模板的特征向量。

运营商服务器获取运营商用户输入的垃圾短信模板后,获取垃圾短信模板的特征向量,以便后续筛选与短信匹配的垃圾短信模板。

具体的,作为一种实施方式,首先,去除垃圾短信模板文本的噪声,也即去除短信文本中的干扰词,如:标点符号。

然后,对得到的去除噪声后的垃圾短信模板文本进行分词处理,将垃圾短信模板文本拆分为单个的分词,并去除所得到的词组中的停用词。去除的停用词包括:副词、介词、语气助词、连接词等。

然后,将得到的单个的分词按照字符的编码顺序进行排序,得到垃圾短信模板的特征向量。在本实施例中,使用UTF-8编码,将得到的单个的分词转化为UTF-8编码,得到表征所有分词的UTF-8编码;按照UTF-8编码的顺序,将得到的所有UTF-8编码进行排序,得到垃圾短信模板的特征向量。

步骤S70、根据所述垃圾短信模板的特征向量,筛选出具有相同特征向量的垃圾短信模板,形成列表供查找。

在运营商服务器得到所有垃圾短信模板的特征向量后,以垃圾短信模板的特征向量为关键词,保存所有的垃圾短信模板。

在保存垃圾短信模板时,将特征向量相同的垃圾短信模板保存到同一列表中,得到具有相同特征向量的垃圾短信模板列表,以特征向量为关键词进行保存。

由此,得到垃圾短信模板列表,可供后续查找与接收到的短信匹配的垃 圾短信模板时使用。

在本实施例中,运营商服务器首先获取用户输入的垃圾短信模板和垃圾短信模板的类型,然后针对获取的垃圾短信模板的类型、主叫号码、被叫号码和发送时间段设置相应的拦截频次策略,得到差异化的拦截频次策略。运营商服务器获取用户输入的垃圾短信模板的特征向量,得到具有相同特征向量的垃圾短信模板列表,以供后续查找与接收到的短信匹配的垃圾短信模板使用。本实施例中运营商用户可根据实际需要,针对不同的垃圾短信模板设置不同的拦截频次策略,实现了在运营商服务器收到短信时,可使用差异化的拦截频次策略对收到的短信进行拦截处理,满足了运营商用户对不同短信的拦截需求。

进一步的,参照图3,本发明短信拦截方法第三实施例提供一种短信拦截方法,基于上述图2所示的实施例,所述步骤S20包括:

步骤S21、根据所述短信的特征向量,查找具有相同特征向量的垃圾短信模板列表。

在得到短信的特征向量后,以短信的特征向量为关键词,查找内存中具有相同特征向量的垃圾短信模板列表。其中,垃圾短信模板列表以特征向量为关键词进行保存。

步骤S22、若找到具有相同特征向量的垃圾短信模板列表,则获取所述垃圾短信模板列表中,与所述短信的相似度最大的垃圾短信模板。

在查找到与短信具有相同特征向量的垃圾短信模板列表后,分别计算列表中所有垃圾短信模板与短信的相似度。本实施使用最小编辑算法(Minimum edit distance)举例计算垃圾短信模板与短信的相似度,具体的,令短信为字符串a,垃圾短信模板为字符串b,然后:

计算从字符串a到字符串b需要经过的编辑次数,每次编辑只能增加、删除或替换1个字符,得到从字符串a到字符串b的最小编辑次数c,也即从字符串a到字符串b的最小编辑距离:c。

然后,取字符串a的长度为L,垃圾短信模板与短信的相似度为d,则有:

由此,得到垃圾短信模板与短信的相似度。

然后,获取与短信的相似度最大的垃圾短信模板,得到最大相似度。

步骤S23、判断所述最大相似度是否满足阈值。

在得到垃圾短信模板与短信的最大相似度后,判断所得到的最大相似度是否满足预设的阈值。

具体的,若最大相似度大于或等于预设的阈值,则判定最大相似度满足预设的阈值;

若最大相似度小于预设的阈值,则判定最大相似度不满足预设的阈值。

步骤S24、若所述最大相似度满足阈值,则获取与所述短信的相似度最大的垃圾短信模板,作为与所述短信匹配的垃圾短信模板。

若垃圾短信模板与短信最大相似度满足预设的阈值,则判定短信为垃圾短信。

然后,获取与短信的相似度最大的垃圾短信模板,作为与短信匹配的垃圾短信模板。

由此,得到与短信匹配的垃圾短信模板。

在本实施例中,运营商服务器首先获取与接收到的短信特征向量相同的垃圾短信模板列表,然后计算垃圾短信模板列表中各垃圾短信模板与短信的相似度,得到与短信的相似度最大的垃圾短信模板,和最大相似度;判断所得到的最大相似度是否满足阈值;当最大相似度满足阈值时,获取与短信的相似度最大的垃圾短信模,作为与短信匹配的垃圾短信模板。本实施例通过最大相似度与阈值的判定,得到垃圾短信模板列表中与接收到的短信最相似的垃圾短信模板,为后续获取最匹配的拦截频次策略提供了基础。

进一步的,参照图4,本发明短信拦截方法第四实施例提供一种短信拦截方法,基于上述图1至图3中所示任一实施例(本实施例以图1为例),所述步骤S20之后还包括:

步骤S80、若未找到与所述短信匹配的垃圾短信模板,则采用默认的垃圾短信模板对所述短信进行拦截处理。

在运营商服务器根据短信的特征向量,查找具有相同特征向量的垃圾短信模板时,若未找到,则视为未找到与短信匹配的垃圾短信模板;

若找到多个与短信具有相同特征向量的垃圾短信模板,则分别计算所有找到的垃圾短信模板与短信的相似度,获取与短信的相似度最大的垃圾短信模板;然后,判断最大相似度是否满足预设的阈值:若最大相似度不满足预设的阈值,则视为未找到与短信匹配的垃圾短信模板。

当运营商服务器未找到与短信匹配的垃圾短信模板时,采用默认的垃圾短信模板对所述短信进行拦截处理。

具体的,作为一种实施方式,营商服务器可以根据默认的垃圾短信模板和预设的过滤条件,查找并获取相应的拦截频次策略,对短信进行拦截处理。

作为另一种实施方式,运营商服务器可以采用默认的垃圾短信模板,获取默认的拦截频次策略,对短信进行拦截处理。

在本实施例中,运营商服务器未找到与短信匹配的垃圾短信模板时,采用默认的垃圾短信模板对短信进行拦截处理,使运营商服务器对接收到的短信均能进行拦截处理,实现了对短信的差异化拦截处理,满足了运营商用户的需求。

进一步的,参照图5,本发明短信拦截方法第五实施例提供一种短信拦截方法,基于上述图1至图3中所示任一实施例(本实施例以图1为例),所述步骤S30包括:

步骤S31、获取与所述短信匹配的垃圾短信模板的类型。

本实施例与上述图1至图3所示的任一实施例均可组合实施;本实施例以与图1所示的实施例组合实施,进行举例说明。

在本实施例中,运营商服务器通过比较短信和垃圾短信模板的相似度,找出一条与该短信相似度最大,且超过设定的相似度阈值的垃圾短信模板,以此条垃圾短信模板的类型做为该短信的类型。然后根据短信不同的类型,结合预设的过滤条件如主叫号码和被叫号码等因素,查找对应的拦截策略, 以实现垃圾短信的差异化拦截。

具体的,首先,在运营商服务器获取与短信匹配的垃圾短信模板后,获取此垃圾短信模板的类型。需要说明的是,垃圾短信模板的类型为运营商服务器预先设置的。

步骤S32、将与所述短信匹配的垃圾短信模板的类型作为所述短信的类型。

获取与短信匹配的垃圾短信模板的类型后,将短信视为此垃圾短信模板类型的垃圾短信。

然后,以此垃圾短信模板的类型,作为短信的类型。

步骤S33、根据所述短信的类型,以及预设的过滤条件,获取相应的拦截频次策略。

在运营商服务器获取短信的类型后,根据短信的类型和预设的过滤条件,获取相应的拦截频次策略。

具体的,作为一种实施方式,以预设的过滤条件为主叫号码、被叫号码和发送时间为例,运营商服务器依次根据短信的类型、短信的主叫号码、短信的被叫号码和短信的发送时间,查找拦截频次策略。详细查找过程如下说明:

首先,根据短信的类型,获取该类型对应的全部拦截频次策略;

然后,根据短信的主叫号码,获取短信的类型对应的全部拦截频次策略中,该主叫号码所属用户组对应的全部拦截频次策略;

然后,根据短信的被叫号码,获取短信的类型和主叫号码所属用户组对应的全部拦截频次策略中,该被叫号码所属用户组对应的全部拦截频次策略;

然后,根据短信的发送时间,获取短信的类型、主叫号码所属用户组和被叫号码所属用户组应的全部拦截频次策略中,该发送时间所属时间段对应的拦截频次策略。

若未找到短信的拦截频次策略,则获取默认的拦截频次策略。

由此,得到短信的拦截频次策略。

步骤S34、根据所述短信的类型和主叫号码,获取所述主叫号码发送此类型短信的发送频次。

在运营商服务器获取短信的拦截频次策略后,根据短信的类型和主叫号码,获取该主叫号码发送此类型短信的频次。

具体的,作为一种实施方式,短信的发送频次采用滑窗的方式进行保存,也即在本实施例中,仅能获取一段时间内该主叫号码发送此类型短信的发送频次。其中,滑窗的大小可由用户根据实际需要灵活设定。

因此,获取存储的该主叫号码发送此类型短信的发送频次后,将所得到的频次加1,得到该主叫号码发送此类型短信的发送频次。

步骤S35、判断所述主叫号码发送此类型短信的发送频次是否超过所述拦截频次策略的拦截频次。

在运营商服务器得到短信的拦截策略,根据短信的类型和主叫号码得到该主叫号码发送此类型短信的发送频次后,判断该主叫号码发送此类型短信的发送频次是否超过拦截频次策略的拦截频次阈值,也即判断短信是否达到被拦截的条件。

具体的,若该主叫号码发送此类型短信的发送频次大于或等于拦截频次策略的拦截频次阈值,则判定该主叫号码发送此类型短信的发送频次超过拦截频次策略的拦截频次阈值,该短信达到被拦截的条件;

若该主叫号码发送此类型短信的发送频次小于拦截频次策略的拦截频次阈值,则判定该主叫号码发送此类型短信的发送频次不超过拦截频次策略的拦截频次阈值,该短信未达到被拦截的条件。

步骤S36、若所述主叫号码发送此类型短信的发送频次超过所述拦截频次策略的拦截频次,则拦截所述短信。

若该主叫号码发送此类型短信的发送频次超过拦截频次策略的拦截频次阈值,短信已达到被拦截的条件,则控制拦截该短信。

步骤S37、若所述主叫号码发送此类型短信的发送频次未超过所述拦截频次策略的拦截频次,则放行所述短信。

若该主叫号码发送此类型短信的发送频次未超过拦截频次策略的拦截频次阈值,短信未达到被拦截的条件,则控制放行该短信。

在本实施例中,运营商服务器首先以与短信匹配的垃圾短信模板类型作为短信的类型;根据短信的类型和预设的过滤条件,获取相应的拦截频次策略;然后根据短信的类型和主叫号码获取该主叫号码发送此类型短信的发送频次,判断该主叫号码发送此类型短信的发送频次是否超过拦截频次策略的拦截频次:若超过,则拦截短信;若未超过,则放行短信。本实施例实现了针对不同类型的短信和过滤条件,获取相应的拦截频次策略,进行差异化的拦截,满足了运营商用户的需求。

本发明进一步提供一种短信拦截装置,参照图6,本发明短信拦截装置第一实施例提供一种短信拦截装置,所述短信拦截装置包括:

接收模块100,用于接收短信,并获取所述短信的特征向量。

本实施例方案主要应用于运营商服务器,当然也可以应用于其他具有短信拦截需求的服务器。

具体的,作为一种实施方式,首先,接收模块100接收短信,得到短信的文本内容,和短信的相关信息,例如:短信的主叫号码、被叫号码和发送时间。

然后,获取短信的特征向量,以便后续获取与该短信匹配的垃圾短信模板。

具体地,在获取短信的特征向量时,可以采用如下方案:

首先,接收模块100去除短信文本的噪声,也即去除短信文本中的干扰词,如:标点符号。

然后,接收模块100对得到的去除噪声后的短信文本进行分词处理,将短信文本拆分为单个的分词,并去除所得到的词组中的停用词。去除的停用词包括:副词、介词、语气助词、连接词等,这些词通常本身并无明确的意义,只有将其放入一个完整的句子中才有一定作用,如常见的“的”和“在”。

然后,接收模块100将得到的单个的分词按照字符的编码顺序进行排序,得到短信的特征向量。在本实施例中,使用UTF-8编码,将得到的单个的分 词转化为UTF-8编码,得到表征所有分词的UTF-8编码;按照UTF-8编码的顺序,将得到的所有UTF-8编码进行排序,得到短信的特征向量。当然,也可以使用其他编码进行排序,可根据实际需要灵活设定。

匹配模块200,用于根据所述短信的特征向量,查找与所述短信匹配的垃圾短信模板。

本实施例中,运营商服务器预先配置有不同类型的垃圾短信模板,根据与垃圾短信模板的相似度来决定垃圾短信的类型;然后根据不同的垃圾短信类型,结合过滤条件如主叫号码、被叫号码,配置不同的拦截策略,以满足运营商用户对于短信差异化拦截的要求。

在接收模块100得到短信的特征向量后,匹配模块200以短信的特征向量为关键词,查找内存中具有相同特征向量的垃圾短信模板,并计算所找到的垃圾短信模板与短信的相似度。

然后,匹配模块200判断计算得到的相似度是否满足预设的阈值:若所得到的相似度满足预设的阈值,则所找到的垃圾短息模板与短信匹配,获取此垃圾短信模板。

匹配模块200若查找到多条与短信具有相同特征向量的垃圾短信模板,则分别计算所有找到的垃圾短信模板与短信的相似度,获取与短信的相似度最大的垃圾短信模板;然后,判断最大相似度是否满足预设的阈值:若最大相似度满足预设的阈值,则判定此垃圾短信模板与短信匹配。

拦截模块300,用于根据与所述短信匹配的垃圾短信模板,以及预设的过滤条件,使用相应的拦截频次策略对所述短信进行拦截处理。

在匹配模块200获取与短信匹配的垃圾短信模板后,拦截模块300以垃圾短信模板的类型为短信的类型。

然后,拦截模块300根据短信的类型和预设的过滤条件,查找并获取相应的拦截频次策略。本实施例所述的拦截频次策略是指同一主叫用户一定时间内,发送同类型的短信的频次达到设定的阈值后,就拦截该短信。因此,可以针对不同类型的短信设置不同的拦截频次。比如诈骗类短信,可以将拦截频次的阈值设置低一点,而商业广告类和通知类的短信可以将拦截频次的 阈值设置高一点。

需要说明的是,预设的过滤条件可以为:短信的主叫号码、被叫号码,也可以为:短信的主叫号码、被叫号码和发送时间,可根据实际需要灵活设置。

然后,拦截模块300根据短信的类型和主叫号码,获取该主叫号码发送此类型短信的发送频次。

然后,拦截模块300判断得到的该主叫号码发送此类型短信的发送频次是否超过此短信相应的拦截频次阈值:若超过,则拦截短信;若未超过,则放行短信。

在本实施例中,接收模块100接收短信,获取短信的特征向量,匹配模块200根据短信的特征向量,查找与短信匹配的垃圾短信模板,然后,拦截模块300根据与短信匹配的垃圾短信模板和预设的过滤条件,使用相应的拦截频次策略对短信进行拦截处理,从而对不同类型的短信进行不同策略的拦截处理,实现了对短信的差异化拦截,满足了运营商用户的需求。

进一步的,参照图7,本发明短信拦截装置第二实施例提供一种短信拦截装置,基于上述图6所示的实施例,所述预设的过滤条件包括:短信的主叫号码、被叫号码和发送时间,所述短信拦截装置还包括:

获取模块400,用于获取用户输入的垃圾短信模板和垃圾短信模板的类型;根据所述用户输入的垃圾短信模板的类型、主叫号码、被叫号码和发送时间段设置拦截频次策略。

运营商用户可根据需要拦截的短信,输入垃圾短信模板,并对输入的每个垃圾短信模板都进行类型的设置。需要说明的是,垃圾短信模板的类型可由用户自定义设置,也可以由用户选择预设的类型,可根据实际需要灵活设置。

获取模块400首先获取运营商用户输入的垃圾短信模板,和垃圾短信模板的类型。

然后,获取模块400针对不同的垃圾短信模板类型设置差异化的拦截策略。针对垃圾短信模板的拦截频次策略可以为预设的拦截频次策略,也可以 获取运营商用户根据实际需要设置的拦截频次策略,可根据实际需要灵活设置。

具体的,作为一种实施方式,以获取运营商用户设置的拦截频次策略举例,根据垃圾短信模板的类型、主叫号码所属的不同用户组、被叫号码所属的不同用户组和发送的不同时间段,运营商用户可以设置相应的拦截频次策略。

由此,获取模块400得到的每个拦截频次策略均包括如下信息:

短信的类型;

主叫号码所属的用户组;

被叫号码所属的用户组;

发送的时间段。

获取模块400得到的拦截频次策略可以是策略树,也即每一个垃圾短信模板,依次根据垃圾短信模板类型、主叫号码所属的用户组、被叫号码所属的用户组和发送的时间段,均有对应的拦截频次策略。

其中,拦截频次策略为:同一主叫用户一定时间内,发送同类型的短信的频次达到设定的阈值后,就拦截该短信。例如:诈骗类的短信,须严格拦截,拦截频次的阈值可以设置的较低;商业广告类的短信,可放松拦截条件,拦截频次的阈值可以设置的较高。当然,拦截频次策略也可以为其他策略,可根据实际需要灵活设置。

主叫号码所属的用户组包括本网用户组、外网用户组、本省用户组、外省用户组、不同的号段组和SP(Service Provider,服务提供商)用户组,也可以为其他用户组,可根据实际需要灵活设置。

被叫号码所属的用户组包括本网用户组、外网用户组、本省用户组、外省用户组、不同的号段组和SP用户组,也可以为其他用户组,可根据实际需要灵活设置。

发送时间段可以小时为单位,也可以天为单位,也可以使用其他时间单位,可根据实际需要灵活设置。

计算模块500,用于获取所述用户输入的垃圾短信模板的特征向量。

获取模块400获取运营商用户输入的垃圾短信模板后,计算模块500获 取垃圾短信模板的特征向量,以便后续筛选与短信匹配的垃圾短信模板。

具体的,作为一种实施方式,首先,计算模块500去除垃圾短信模板文本的噪声,也即去除短信文本中的干扰词,如:标点符号。

然后,计算模块500对得到的去除噪声后的垃圾短信模板文本进行分词处理,将垃圾短信模板文本拆分为单个的分词,并去除所得到的词组中的停用词。去除的停用词包括:副词、介词、语气助词、连接词等。

然后,计算模块500将得到的单个的分词按照字符的编码顺序进行排序,得到垃圾短信模板的特征向量。在本实施例中,使用UTF-8编码,将得到的单个的分词转化为UTF-8编码,得到表征所有分词的UTF-8编码;按照UTF-8编码的顺序,将得到的所有UTF-8编码进行排序,得到垃圾短信模板的特征向量。

列表模块600,用于根据所述垃圾短信模板的特征向量,筛选出具有相同特征向量的垃圾短信模板,形成列表供查找。

在计算模块500得到所有垃圾短信模板的特征向量后,列表模块600以垃圾短信模板的特征向量为关键词,保存所有的垃圾短信模板。

在保存垃圾短信模板时,列表模块600将特征向量相同的垃圾短信模板保存到同一列表中,得到具有相同特征向量的垃圾短信模板列表,以特征向量为关键词进行保存。

由此,列表模块600得到垃圾短信模板列表,可供后续查找与接收到的短信匹配的垃圾短信模板时使用。

在本实施例中,获取模块400首先获取用户输入的垃圾短信模板和垃圾短信模板的类型,然后针对获取的垃圾短信模板的类型、主叫号码、被叫号码和发送时间段设置相应的拦截频次策略,得到差异化的拦截频次策略。计算模块500获取用户输入的垃圾短信模板的特征向量,列表模块600得到具有相同特征向量的垃圾短信模板列表,以供后续查找与接收到的短信匹配的垃圾短信模板使用。本实施例中运营商用户可根据实际需要,针对不同的垃圾短信模板设置不同的拦截频次策略,实现了在运营商服务器收到短信时,可使用差异化的拦截频次策略对收到的短信进行拦截处理,满足了运营商用 户对不同短信的拦截需求。

进一步的,参照图8,本发明短信拦截装置第三实施例提供一种短信拦截装置,基于上述图7所示的实施例,所述匹配模块200包括:

查找单元210,用于根据所述短信的特征向量,查找具有相同特征向量的垃圾短信模板列表。

在接收模块100得到短信的特征向量后,查找单元210以短信的特征向量为关键词,查找内存中具有相同特征向量的垃圾短信模板列表。其中,垃圾短信模板列表以特征向量为关键词进行保存。

相似度计算单元220,用于若找到具有相同特征向量的垃圾短信模板列表,则获取所述垃圾短信模板列表中,与所述短信的相似度最大的垃圾短信模板。

在查找单元210查找到与短信具有相同特征向量的垃圾短信模板列表后,相似度计算单元220分别计算列表中所有垃圾短信模板与短信的相似度。本实施使用最小编辑算法(Minimum edit distance)举例计算垃圾短信模板与短信的相似度,具体的,令短信为字符串a,垃圾短信模板为字符串b,然后:

计算从字符串a到字符串b需要经过的编辑次数,每次编辑只能增加、删除或替换1个字符,得到从字符串a到字符串b的最小编辑次数c,也即从字符串a到字符串b的最小编辑距离:c。

然后,取字符串a的长度为L,垃圾短信模板与短信的相似度为d,则有:

由此,得到垃圾短信模板与短信的相似度。

然后,相似度计算单元220获取与短信的相似度最大的垃圾短信模板,得到最大相似度。

判断单元230,用于判断所述最大相似度是否满足阈值。

在相似度计算单元220得到垃圾短信模板与短信的最大相似度后,判断单元230判断所得到的最大相似度是否满足预设的阈值。

具体的,若最大相似度大于或等于预设的阈值,则判断单元230判定最 大相似度满足预设的阈值;

若最大相似度小于预设的阈值,则判断单元230判定最大相似度不满足预设的阈值。

匹配单元240,用于若所述最大相似度满足阈值,则获取与所述短信的相似度最大的垃圾短信模板,作为与所述短信匹配的垃圾短信模板。

若垃圾短信模板与短信最大相似度满足预设的阈值,则判定短信为垃圾短信。

然后,匹配单元240获取与短信的相似度最大的垃圾短信模板,作为与短信匹配的垃圾短信模板

由此,匹配单元240得到与短信匹配的垃圾短信模板。

在本实施例中,首先查找单元210获取与接收到的短信特征向量相同的垃圾短信模板列表,然后相似度计算单元220计算垃圾短信模板列表中各垃圾短信模板与短信的相似度,得到与短信的相似度最大的垃圾短信模板,和最大相似度;判断单元230判断所得到的最大相似度是否满足阈值;最大相似度满足阈值时,匹配单元240获取与短信的相似度最大的垃圾短信模,作为与短信匹配的垃圾短信模板。本实施例通过最大相似度与阈值的判定,得到垃圾短信模板列表中与接收到的短信最相似的垃圾短信模板,为后续获取最匹配的拦截频次策略提供了基础。

进一步的,参照图6,本发明短信拦截方法第四实施例提供一种短信拦截方法,基于上述图6至图8中所示任一实施例(本实施例以图6为例),所述拦截模块300还用于,

若未找到与所述短信匹配的垃圾短信模板,则采用默认的垃圾短信模板对所述短信进行拦截处理。

在匹配模块200根据短信的特征向量,查找具有相同特征向量的垃圾短信模板时,若未找到,则视为未找到与短信匹配的垃圾短信模板;

若匹配模块200找到多个与短信具有相同特征向量的垃圾短信模板,则分别计算所有找到的垃圾短信模板与短信的相似度,获取与短信的相似度最 大的垃圾短信模板;然后,判断最大相似度是否满足预设的阈值:若最大相似度不满足预设的阈值,则视为未找到与短信匹配的垃圾短信模板。

当匹配模块200未找到与短信匹配的垃圾短信模板时,拦截模块300采用默认的垃圾短信模板对所述短信进行拦截处理。

具体的,作为一种实施方式,拦截模块300可以根据默认的垃圾短信模板和预设的过滤条件,查找并获取相应的拦截频次策略,对短信进行拦截处理。

作为另一种实施方式,拦截模块300可以采用默认的垃圾短信模板,获取默认的拦截频次策略,对短信进行拦截处理。

在本实施例中,匹配模块200未找到与短信匹配的垃圾短信模板时,拦截模块300采用默认的垃圾短信模板对短信进行拦截处理,使运营商服务器对接收到的短信均能进行拦截处理,实现了对短信的差异化拦截处理,满足了运营商用户的需求。

进一步的,参照图9,本发明短信拦截方法第四实施例提供一种短信拦截方法,基于上述图6至图8中所示任一实施例(本实施例以图6为例),所述拦截模块300包括:

类型单元310,用于获取与所述短信匹配的垃圾短信模板的类型;将与所述短信匹配的垃圾短信模板的类型作为所述短信的类型。

本实施例与上述图6至图8所示的任一实施例均可组合实施;本实施例以与图6所示的实施例组合实施,进行举例说明。

在本实施例中,通过比较短信和垃圾短信模板的相似度,找出一条与该短信相似度最大,且超过设定的相似度阈值的垃圾短信模板,以此条垃圾短信模板的类型做为该短信的类型。然后根据短信不同的类型,结合预设的过滤条件如主叫号码和被叫号码等因素,查找对应的拦截策略,以实现垃圾短信的差异化拦截。

具体的,首先,在匹配模块200获取与短信匹配的垃圾短信模板后,类型单元310获取此垃圾短信模板的类型,将短信视为此垃圾短信模板类型的垃圾短信。需要说明的是,垃圾短信模板的类型为预先设置的。

然后,类型单元310以此垃圾短信模板的类型,作为短信的类型。

策略单元320,用于根据所述短信的类型,以及预设的过滤条件,获取相应的拦截频次策略。

在类型单元310获取短信的类型后,策略单元320根据短信的类型和预设的过滤条件,获取相应的拦截频次策略。

具体的,作为一种实施方式,以预设的过滤条件为主叫号码、被叫号码和发送时间为例,策略单元320依次根据短信的类型、短信的主叫号码、短信的被叫号码和短信的发送时间,查找拦截频次策略。详细查找过程如下说明:

首先,根据短信的类型,获取该类型对应的全部拦截频次策略;

然后,根据短信的主叫号码,获取短信的类型对应的全部拦截频次策略中,该主叫号码所属用户组对应的全部拦截频次策略;

然后,根据短信的被叫号码,获取短信的类型和主叫号码所属用户组对应的全部拦截频次策略中,该被叫号码所属用户组对应的全部拦截频次策略;

然后,根据短信的发送时间,获取短信的类型、主叫号码所属用户组和被叫号码所属用户组应的全部拦截频次策略中,该发送时间所属时间段对应的拦截频次策略。

若未找到短信的拦截频次策略,则获取默认的拦截频次策略。

由此,策略单元320得到短信的拦截频次策略。

频次单元330,用于根据所述短信的类型和主叫号码,获取所述主叫号码发送此类型短信的发送频次。

在策略单元320获取短信的拦截频次策略后,频次单元330根据短信的类型和主叫号码,获取该主叫号码发送此类型短信的发送频次。

具体的,作为一种实施方式,短信的发送频次采用滑窗的方式进行保存,也即在本实施例中,仅能获取一段时间内该主叫号码发送此类型短信的发送频次。其中,滑窗的大小可由用户根据实际需要灵活设定。

因此,频次单元330获取存储的该主叫号码发送此类型短信的发送频次后,将所得到的频次加1,得到该主叫号码发送此类型短信的发送频次。

判断单元340,用于判断所述主叫号码发送此类型短信的发送频次是否超过所述拦截频次策略的拦截频次。

在策略单元320得到短信的拦截策略和频次单元330根据短信的类型和主叫号码得到该主叫号码发送此类型短信的发送频次后,判断单元340判断该主叫号码发送此类型短信的发送频次是否超过拦截频次策略的拦截频次阈值,也即判断短信是否达到被拦截的条件。

具体的,若该主叫号码发送此类型短信的发送频次大于或等于拦截频次策略的拦截频次阈值,则判定该主叫号码发送此类型短信的发送频次超过拦截频次策略的拦截频次阈值,该短信达到被拦截的条件;

若该主叫号码发送此类型短信的发送频次小于拦截频次策略的拦截频次阈值,则判定该主叫号码发送此类型短信的发送频次不超过拦截频次策略的拦截频次阈值,该短信未达到被拦截的条件。

拦截单元350,用于若所述主叫号码发送此类型短信的发送频次超过所述拦截频次策略的拦截频次,则拦截所述短信。

若该主叫号码发送此类型短信的发送频次超过拦截频次策略的拦截频次阈值,该短信已达到被拦截的条件,则拦截单元350控制拦截该短信。

放行单元360,用于若所述主叫号码发送此类型短信的发送频次未超过所述拦截频次策略的拦截频次,则放行所述短信。

若该主叫号码发送此类型短信的发送频次未超过拦截频次策略的拦截频次阈值,该短信未达到被拦截的条件,则放行单元360控制放行该短信。

在本实施例中,首先类型单元310以与短信匹配的垃圾短信模板类型作为短信的类型;策略单元320根据短信的类型和过滤条件,获取相应的拦截频次策略;然后频次单元330根据短信的类型和主叫号码获取该主叫号码发送此类型短信的发送频次;判断单元340判断该主叫号码发送此类型短信的发送频次是否超过拦截频次策略的拦截频次:若超过,则拦截单元350拦截短信;若未超过,则放行单元360放行短信。本实施例实现了针对不同类型 的短信和过滤条件,获取相应的拦截频次策略,进行差异化的拦截,满足了运营商用户的需求。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1