一种检测伪基站中心号码的方法及服务器的制造方法_5

文档序号:9792393阅读:来源:国知局
为1时,将所述参考短信的所述特征词 向量作为所述至少一条参考短信的所述参考特征词向量;或者
[0135] 当所述至少一条参考短信的所述参考短信数量大于等于2时,获得所述至少一条 参考短信中的每条参考短信的特征词向量的均值作为所述参考特征词向量。
[0136] A9、根据A6所述的方法,其特征在于,所述计算获得所述参考特征词向量与每条所 述待选特征词向量之间的相似度,包括:
[0137] 计算获得所述参考特征词向量与每条所述待选特征词向量之间的余弦值,将所述 余弦值作为所述相似度;或者
[0138] 计算获得所述目标词向量与所述待选特征词向量之间的相关系数,将所述相关系 数作为所述相似度。
[0139] 本发明还公开了,B10、一种检测伪基站中屯、号码的服务器,其特征在于,包括:
[0140] 第一号码获取模块,用于获得至少两条目标短信中每条所述目标短信对应的目标 信息中屯、号码,所述目标短信属于垃圾短信中的至少一类短信;
[0141] 第二号码获取模块,用于获得所有所述目标信息中屯、号码中出现概率大于第一阔 值的信息中屯、号码作为疑似伪基站中屯、号码;
[0142] 短信查询模块,用于获得在预设时间周期内通过所述疑似伪基站中屯、号码发送的 所有下发短信;
[0143] 判断模块,用于判断所述所有下发短信中垃圾短信的比例是否大于第二阔值;
[0144] 确定模块,用于若所述所有下发短信中垃圾短信的比例大于第二阔值,确定所述 疑似伪基站中屯、号码为伪基站中屯、号码。
[0145] Bl 1、根据BlO所述的服务器,其特征在于,所述服务器还包括:
[0146] 第=号码获取模块,用于在所述确定所述疑似伪基站中屯、号码为伪基站中屯、号码 之后,获得至少两个所述伪基站中屯、号码;
[0147] 规则建立模块,用于判断所述至少两个所述伪基站中屯、号码中是否存在少一个固 定数字位上对应至少一个固定数字的至少两个中屯、号码;若存在,将在所述至少一个固定 数字位上对应所述至少一个固定数字建立为一条伪基站中屯、号码规则并保存。
[014引12、根据BlO所述的服务器,其特征在于,所述服务器还包括:
[0149] 发送模块,用于在所述确定所述疑似伪基站中屯、号码为伪基站中屯、号码之后,将 所述伪基站中屯、号码发送至移动终端,W使所述移动终端执行将所述伪基站中屯、号码发送 的短信作为拦截对象进行拦截的操作。
[0150] B13、根据BlO所述的服务器,其特征在于,所述垃圾短信包括:诈骗短信、骚扰短信 及广告短信。
[0151] B14、根据BlO~B13任一所述的服务器,其特征在于,所述服务器还包括:
[0152] 相似短信获取模块,用于在所述获得至少两条目标短信中每条所述目标短信对应 的目标信息中屯、号码之前,获得与至少一条参考短信相似的所述至少两条目标短信,所述 参考短信为已确定的伪基站发送的短信。
[0153] B15、根据B14所述的服务器,其特征在于,所述相似短信获取模块包括:
[0154] 第一向量获取子模块,用于对每条所述参考短信进行分词,并根据每条所述参考 短信的每个分词和语料词矩阵获得每条所述参考短信的特征词向量;
[0155] 第二向量获取子模块,用于根据所述至少一条参考短信的至少一个特征词向量, 获得所述至少一条参考短信的参考特征词向量;
[0156] 第=向量获取子模块,用于获得每条待选短信的待选特征词向量;
[0157] 计算子模块,用于计算获得所述参考特征词向量与每条所述待选特征词向量之间 的相似度;
[0158] 确定子模块,用于将所述相似度大于设定阔值的每个所述待选特征词向量对应的 待选短信确定为与所述至少一条参考短信相似的所述目标短信。
[0159] B16、根据B15所述的服务器,其特征在于,所述第一向量获取子模块用于:
[0160] 分别将每条所述参考短信的所述每个分词输入词向量工具获得所述每个分词的 词向量;
[0161] 通过将每条所述参考短信的所有分词的词向量的乘积与所述语料词矩阵相乘获 得所述特征词向量。
[0162] B17、根据B15所述的服务器,其特征在于,所述第二向量获取子模块用于:
[0163] 当所述至少一条参考短信的参考短信数量为1时,将所述参考短信的所述特征词 向量作为所述至少一条参考短信的所述参考特征词向量;或者
[0164] 当所述至少一条参考短信的所述参考短信数量大于等于2时,获得所述至少一条 参考短信中的每条参考短信的特征词向量的均值作为所述参考特征词向量。
[0165] B18、根据B15所述的服务器,其特征在于,所述计算子模块用于:
[0166] 计算获得所述参考特征词向量与每条所述待选特征词向量之间的余弦值,将所述 余弦值作为所述相似度;或者
[0167] 计算获得所述目标词向量与所述待选特征词向量之间的相关系数,将所述相关系 数作为所述相似度。
【主权项】
1. 一种检测伪基站中心号码的方法,其特征在于,包括: 获得至少两条目标短信中每条所述目标短信对应的目标信息中心号码,所述目标短信 属于垃圾短信中的至少一类短信; 获得所有所述目标信息中心号码中出现概率大于第一阈值的信息中心号码作为疑似 伪基站中心号码; 获得在预设时间周期内通过所述疑似伪基站中心号码发送的所有下发短信; 判断所述所有下发短信中垃圾短信的比例是否大于第二阈值; 若所述所有下发短信中垃圾短信的比例大于第二阈值,确定所述疑似伪基站中心号码 为伪基站中心号码。2. 如权利要求1所述的方法,其特征在于,在所述确定所述疑似伪基站中心号码为伪基 站中心号码之后,所述方法还包括: 获得至少两个所述伪基站中心号码; 判断所述至少两个所述伪基站中心号码中是否存在少一个固定数字位上对应至少一 个固定数字的至少两个中心号码; 若存在,将在所述至少一个固定数字位上对应所述至少一个固定数字建立为一条伪基 站中心号码规则并保存。3. 如权利要求1所述的方法,其特征在于,在所述确定所述疑似伪基站中心号码为伪基 站中心号码之后,所述方法还包括: 将所述伪基站中心号码发送至移动终端,以使所述移动终端执行将所述伪基站中心号 码发送的短信作为拦截对象进行拦截的操作。4. 如权利要求1所述的方法,其特征在于,所述垃圾短信包括:诈骗短信、骚扰短信及广 告短信。5. 如权利要求1~4任一所述的方法,其特征在于,在所述获得至少两条目标短信中每 条所述目标短信对应的目标信息中心号码之前,所述方法还包括: 获得与至少一条参考短信相似的所述至少两条目标短信,所述参考短信为已确定的伪 基站发送的短信。6. 如权利要求5所述的方法,其特征在于,所述获得与至少一条参考短信相似的所述至 少两条目标短信,包括: 对每条所述参考短信进行分词,并根据每条所述参考短信的每个分词和语料词矩阵获 得每条所述参考短信的特征词向量; 根据所述至少一条参考短信的至少一个特征词向量,获得所述至少一条参考短信的参 考特征词向量; 获得每条待选短信的待选特征词向量; 计算获得所述参考特征词向量与每条所述待选特征词向量之间的相似度; 将所述相似度大于设定阈值的每个所述待选特征词向量对应的待选短信确定为与所 述至少一条参考短信相似的所述目标短信。7. 如权利要求6所述的方法,其特征在于,所述根据每条所述参考短信的每个分词和语 料词矩阵获得每条所述参考短信的特征词向量,包括: 分别将每条所述参考短信的所述每个分词输入词向量工具获得所述每个分词的词向 量; 通过将每条所述参考短信的所有分词的词向量的乘积与所述语料词矩阵相乘获得所 述特征词向量。8. 如权利要求6所述的方法,其特征在于,所述根据所述至少一条参考短信的至少一个 特征词向量,获得所述至少一条参考短信的参考特征词向量,包括: 当所述至少一条参考短信的参考短信数量为1时,将所述参考短信的所述特征词向量 作为所述至少一条参考短信的所述参考特征词向量;或者 当所述至少一条参考短信的所述参考短信数量大于等于2时,获得所述至少一条参考 短信中的每条参考短信的特征词向量的均值作为所述参考特征词向量。9. 如权利要求6所述的方法,其特征在于,所述计算获得所述参考特征词向量与每条所 述待选特征词向量之间的相似度,包括: 计算获得所述参考特征词向量与每条所述待选特征词向量之间的余弦值,将所述余弦 值作为所述相似度;或者 计算获得所述目标词向量与所述待选特征词向量之间的相关系数,将所述相关系数作 为所述相似度。10. -种检测伪基站中心号码的服务器,其特征在于,包括: 第一号码获取模块,用于获得至少两条目标短信中每条所述目标短信对应的目标信息 中心号码,所述目标短信属于垃圾短信中的至少一类短信; 第二号码获取模块,用于获得所有所述目标信息中心号码中出现概率大于第一阈值的 信息中心号码作为疑似伪基站中心号码; 短信查询模块,用于获得在预设时间周期内通过所述疑似伪基站中心号码发送的所有 下发短信; 判断模块,用于判断所述所有下发短信中垃圾短信的比例是否大于第二阈值; 确定模块,用于若所述所有下发短信中垃圾短信的比例大于第二阈值,确定所述疑似 伪基站中心号码为伪基站中心号码。
【专利摘要】本发明公开了一种检测伪基站中心号码的方法及服务器,该方法包括:获得至少两条目标短信中每条所述目标短信对应的目标信息中心号码,所述目标短信属于垃圾短信中的至少一类短信;获得所有所述目标信息中心号码中出现概率大于第一阈值的信息中心号码作为疑似伪基站中心号码;获得在预设时间周期内通过所述疑似伪基站中心号码发送的所有下发短信;判断所述所有下发短信中垃圾短信的比例是否大于第二阈值;若所述所有下发短信中垃圾短信的比例大于第二阈值,确定所述疑似伪基站中心号码为伪基站中心号码。通过上述技术方案,解决了现有技术中无法判别短信的发送方是否是伪基站的技术问题,到达了有效识别伪基站短信的有益技术效果。
【IPC分类】H04W12/12
【公开号】CN105554763
【申请号】CN201510955120
【发明人】张金晶, 李强, 常富洋
【申请人】北京奇虎科技有限公司, 奇智软件(北京)有限公司
【公开日】2016年5月4日
【申请日】2015年12月17日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1