一种检测伪基站中心号码的方法及服务器的制造方法_4

文档序号:9792393阅读:来源:国知局
若存在,将在所述至少一个固定数字位上对 应所述至少一个固定数字建立为一条伪基站中屯、号码规则并保存。
[0094] 针对已确定的伪基站中屯、号,为了使用户手机能够及时拦截伪基站中屯、号发送的 短信,本申请实施例提供的检测伪基站中屯、号码的服务器还包括:发送模块38,用于在所述 确定所述疑似伪基站中屯、号码为伪基站中屯、号码之后,将所述伪基站中屯、号码发送至移动 终端,W使所述移动终端执行将所述伪基站中屯、号码发送的短信作为拦截对象进行拦截的 操作。
[0095] 在具体实施过程中,为了获得目标短信,所述服务器还包括:相似短信获取模块 39,用于在所述获得至少两条目标短信中每条所述目标短信对应的目标信息中屯、号码之 前,获得与至少一条参考短信相似的所述至少两条目标短信,所述参考短信为已确定的伪 基站发送的短信。
[0096] 其中,所述相似短信获取模块39包括:第一向量获取子模块,用于对每条所述参考 短信进行分词,并根据每条所述参考短信的每个分词和语料词矩阵获得每条所述参考短信 的特征词向量;第二向量获取子模块,用于根据所述至少一条参考短信的至少一个特征词 向量,获得所述至少一条参考短信的参考特征词向量;第=向量获取子模块,用于获得每条 待选短信的待选特征词向量;计算子模块,用于计算获得所述参考特征词向量与每条所述 待选特征词向量之间的相似度;确定子模块,用于将所述相似度大于设定阔值的每个所述 待选特征词向量对应的待选短信确定为与所述至少一条参考短信相似的所述目标短信。
[0097] 具体的,所述第一向量获取子模块用于:分别将每条所述参考短信的所述每个分 词输入词向量工具获得所述每个分词的词向量;通过将每条所述参考短信的所有分词的词 向量的乘积与所述语料词矩阵相乘获得所述特征词向量。
[0098] 具体的,所述第二向量获取子模块用于:当所述至少一条参考短信的参考短信数 量为1时,将所述参考短信的所述特征词向量作为所述至少一条参考短信的所述参考特征 词向量;或者,当所述至少一条参考短信的所述参考短信数量大于等于2时,获得所述至少 一条参考短信中的每条参考短信的特征词向量的均值作为所述参考特征词向量。
[0099] 具体的,所述计算子模块用于:计算获得所述参考特征词向量与每条所述待选特 征词向量之间的余弦值,将所述余弦值作为所述相似度;或者,计算获得所述目标词向量与 所述待选特征词向量之间的相关系数,将所述相关系数作为所述相似度。
[0100] 本申请实施例中提供的技术方案,至少具有如下技术效果或优点:
[0101] 根据本发明的一种检测伪基站中屯、号码的方法及服务器,通过获得多个目标短信 的目标信息中屯、号码,并从中获得出现概率较高的疑似伪基站中屯、号码,再反查出现概率 较高的疑似伪基站中屯、号码发送的所有短信是否绝大部分都是垃圾短信,若是,便可确定 运个疑似伪基站中屯、号码是伪基站的中屯、号码,从而检测出伪基站中屯、号码,进而可W根 据该中屯、号码判别出短信的发送方是否为伪基站,解决了现有技术中无法判别短信的发送 方是否是伪基站的技术问题,到达了有效识别伪基站短信的有益技术效果。
[0102] 在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。 各种通用系统也可W与基于在此的示教一起使用。根据上面的描述,构造运类系统所要求 的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可W利用各种 编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发 明的最佳实施方式。
[0103] 在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施 例可W在没有运些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构 和技术,W便不模糊对本说明书的理解。
[0104] 类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在 上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施 例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保 护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面 的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此, 遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身 都作为本发明的单独实施例。
[0105] 本领域那些技术人员可W理解,可W对实施例中的设备中的模块进行自适应性地 改变并且把它们设置在与该实施例不同的一个或多个设备中。可W把实施例中的模块或单 元或组件组合成一个模块或单元或组件,W及此外可W把它们分成多个子模块或子单元或 子组件。除了运样的特征和/或过程或者单元中的至少一些是相互排斥之外,可W采用任何 组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征W及如此公开的任 何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权 利要求、摘要和附图)中公开的每个特征可W由提供相同、等同或相似目的替代特征来代 替。
[0106] 此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所 包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围 之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之 一都可WW任意的组合方式来使用。
[0107] 本发明的各个部件实施例可W W硬件实现,或者W在一个或者多个处理器上运行 的软件模块实现,或者W它们的组合实现。本领域的技术人员应当理解,可W在实践中使用 微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的网关、代理服务器、系统中 的一些或者全部部件的一些或者全部功能。本发明还可W实现为用于执行运里所描述的方 法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。运样的 实现本发明的程序可W存储在计算机可读介质上,或者可W具有一个或者多个信号的形 式。运样的信号可W从因特网网站上下载得到,或者在载体信号上提供,或者W任何其他形 式提供。
[0108] 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领 域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中, 不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词"包含"不排除存在未 列在权利要求中的元件或步骤。位于元件之前的单词"一"或"一个"不排除存在多个运样的 元件。本发明可W借助于包括有若干不同元件的硬件W及借助于适当编程的计算机来实 现。在列举了若干装置的单元权利要求中,运些装置中的若干个可W是通过同一个硬件项 来具体体现。单词第一、第二、W及第=等的使用不表示任何顺序。可将运些单词解释为名 称。
[0109] 本发明公开了,AU-种检测伪基站中屯、号码的方法,其特征在于,包括:
[0110] 获得至少两条目标短信中每条所述目标短信对应的目标信息中屯、号码,所述目标 短信属于垃圾短信中的至少一类短信;
[0111] 获得所有所述目标信息中屯、号码中出现概率大于第一阔值的信息中屯、号码作为 疑似伪基站中屯、号码;
[0112] 获得在预设时间周期内通过所述疑似伪基站中屯、号码发送的所有下发短信;
[0113] 判断所述所有下发短信中垃圾短信的比例是否大于第二阔值;
[0114] 若所述所有下发短信中垃圾短信的比例大于第二阔值,确定所述疑似伪基站中屯、 号码为伪基站中屯、号码。
[0115] A2、根据Al所述的方法,其特征在于,在所述确定所述疑似伪基站中屯、号码为伪基 站中屯、号码之后,所述方法还包括:
[0116] 获得至少两个所述伪基站中屯、号码;
[0117] 判断所述至少两个所述伪基站中屯、号码中是否存在少一个固定数字位上对应至 少一个固定数字的至少两个中屯、号码;
[0118] 若存在,将在所述至少一个固定数字位上对应所述至少一个固定数字建立为一条 伪基站中屯、号码规则并保存。
[0119] A3、根据Al所述的方法,其特征在于,在所述确定所述疑似伪基站中屯、号码为伪基 站中屯、号码之后,所述方法还包括:
[0120] 将所述伪基站中屯、号码发送至移动终端,W使所述移动终端执行将所述伪基站中 屯、号码发送的短信作为拦截对象进行拦截的操作。
[0121] A4、根据Al所述的方法,其特征在于,所述垃圾短信包括:诈骗短信、骚扰短信及广 告短信。
[0122] A5、根据Al~A4任一所述的方法,其特征在于,在所述获得至少两条目标短信中每 条所述目标短信对应的目标信息中屯、号码之前,所述方法还包括:
[0123] 获得与至少一条参考短信相似的所述至少两条目标短信,所述参考短信为已确定 的伪基站发送的短信。
[0124] A6、根据A5所述的方法,其特征在于,所述获得与至少一条参考短信相似的所述至 少两条目标短信,包括:
[0125] 对每条所述参考短信进行分词,并根据每条所述参考短信的每个分词和语料词矩 阵获得每条所述参考短信的特征词向量;
[0126] 根据所述至少一条参考短信的至少一个特征词向量,获得所述至少一条参考短信 的参考特征词向量;
[0127] 获得每条待选短信的待选特征词向量;
[0128] 计算获得所述参考特征词向量与每条所述待选特征词向量之间的相似度;
[0129] 将所述相似度大于设定阔值的每个所述待选特征词向量对应的待选短信确定为 与所述至少一条参考短信相似的所述目标短信。
[0130] A7、根据A6所述的方法,其特征在于,所述根据每条所述参考短信的每个分词和语 料词矩阵获得每条所述参考短信的特征词向量,包括:
[0131] 分别将每条所述参考短信的所述每个分词输入词向量工具获得所述每个分词的 词向量;
[0132] 通过将每条所述参考短信的所有分词的词向量的乘积与所述语料词矩阵相乘获 得所述特征词向量。
[0133] A8、根据A6所述的方法,其特征在于,所述根据所述至少一条参考短信的至少一个 特征词向量,获得所述至少一条参考短信的参考特征词向量,包括:
[0134] 当所述至少一条参考短信的参考短信数量
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1