一种垃圾短消息的识别方法及装置的制造方法_4

文档序号:9567642阅读:来源:国知局
概率值,再通过逻辑回归模 型相加组成的预测模型确定出所述短消息为垃圾短消息的概率值。
[0149] 较佳的,所述概率值确定单元202用于通过逻辑回归模型确定所述第一权重和所 述第二权重。
[0150] 本发明实施例中当第一通信设备在发送短消息给第二通信设备时,根据第一通信 设备与第二通信设备在预定时间段内的通信记录,获得第一设备与第二通信设备的通信交 互属性值。根据通信交互属性值可W得到第一通信设备发送的短消息为垃圾短消息的概 率,将发送短消息的概率高于预设阔值的短消息确定为垃圾短消息。通过对第一通信设备 历史通信记录,对第一通信设备发送的短消息是否为垃圾短消息进行预测,可W提高判断 垃圾短消息的效率和准确率。
[0151] 本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实 施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机 可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形 式。
[0152] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一 流程和/或方框、W及流程图和/或方框图中的流程和/或方框的结合。可提供送些计算 机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器W产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生 用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能 的装置。
[0153] 送些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备W特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0154] 送些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤W产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。
[0155] 显然,本领域的技术人员可W对本发明进行各种改动和变型而不脱离本发明的精 神和范围。送样,倘若本发明的送些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含送些改动和变型在内。
【主权项】
1. 一种垃圾短消息的识别方法,其特征在于,该方法包括: 网络设备确定第一通信设备发送给第二通信设备的短消息后,获取所述第一通信设备 的历史通信记录以及所述第二通信设备的历史通信记录,确定出所述第一通信设备与所述 第二通信设备的通信交互属性值; 根据由所述通信交互属性值获得的基准交互属性值确定出所述短消息为垃圾短消息 的概率值; 当所述概率值高于预设阈值时将所述短消息确定为垃圾短信,否则,将所述短消息确 定为非垃圾短信。2. 如权利要求1所述的方法,其特征在于,所述获取所述第一通信设备的历史通信记 录以及所述第二通信设备的历史通信记录之前,还包括: 将所述第一通信设备的历史通信记录中主叫号码和/或被叫号码为设定号码的通信 记录删除; 将所述第二通信设备的历史通信记录中主叫号码和/或被叫号码为设定号码的通信 记录删除。3. 如权利要求1所述的方法,其特征在于,所述通信交互属性值包括以下部分或全部: 第一通信设备与第二通信设备之间短消息的回复值; 第一通信设备作为发送方时的短消息通信对象的数量; 第二通信设备作为接收方时的短消息通信对象的数量; 第一通信设备与第二通信设备的共同通信对象的数量; 第二通信设备作为接收方时的语音通信对象的数量; 第一通信设备作为发送方时的语音通信对象的数量; 第一通信设备与第二通信设备的共同通信对象在第一通信设备与第二通信设备所有 的通信对象中所占的比例; 第一通信设备通信对象的数量与第二通信设备通信对象的数量的乘积; 第一通信设备到第二通信设备的最短路径; 第一通信设备到第二通信设备Μ跳以上采用贪心算法获得的权重值,其中Μ为正整 数; 第一通信设备与第二通信设备之间的相似度; 第一通信设备与第二通信设备之间可达的概率。4. 如权利要求1所述的方法,其特征在于,所述由所述通信交互属性值获得的基准交 互属性值,包括: 将所述通信交互属性值中心化后的值除以所述通信记录交互属性值的标准方差后获 得标准交互属性值。5. 如权利要求1所述的方法,其特征在于,所述根据由所述通信交互属性值获得的基 准交互属性值确定出所述短消息为垃圾短消息的概率值,包括: 将所述标准交互属性值通过由第一权重的决策树模型和第二权重的决策树模型相加 组成的预测模型确定出所述短消息为垃圾短消息的概率值。6. 如权利要求5所述的方法,其特征在于,通过逻辑回归模型确定所述第一权重和所 述第二权重。7. -种垃圾短消息的识别装置,其特征在于,该装置包括: 属性值确定单元,用于确定第一通信设备发送给第二通信设备的短消息后,获取所述 第一通信设备的历史通信记录以及所述第二通信设备的历史通信记录,确定出所述第一通 信设备与所述第二通信设备的通信交互属性值; 概率值确定单元,用于根据由所述通信交互属性值获得的基准交互属性值确定出所述 短消息为垃圾短消息的概率值; 垃圾短消息确定单元,用于当所述概率值高于预设阈值时将所述短消息确定为垃圾短 信,否则,将所述短消息确定为非垃圾短信。8. 如权利要求7所述的装置,其特征在于,所述属性值确定单元还用于: 将所述第一通信设备的历史通信记录中主叫号码和/或被叫号码为设定号码的通信 记录删除; 将所述第二通信设备的历史通信记录中主叫号码和/或被叫号码为设定号码的通信 记录删除。9. 如权利要求7所述的装置,其特征在于,所述属性值确定单元确定的通信交互属性 值包括以下部分或全部: 第一通信设备与第二通信设备之间短消息的回复值; 第一通信设备作为发送方时的短消息通信对象的数量; 第二通信设备作为接收方时的短消息通信对象的数量; 第一通信设备与第二通信设备的共同通信对象的数量; 第二通信设备作为接收方时的语音通信对象的数量; 第一通信设备作为发送方时的语音通信对象的数量; 第一通信设备与第二通信设备的共同通信对象在第一通信设备与第二通信设备所有 的通信对象中所占的比例; 第一通信设备通信对象的数量与第二通信设备通信对象的数量的乘积; 第一通信设备到第二通信设备的最短路径; 第一通信设备到第二通信设备Μ跳以上采用贪心算法获得的权重值,其中Μ为正整 数; 第一通信设备与第二通信设备之间的相似度; 第一通信设备与第二通信设备之间存在可达的概率。10. 如权利要求7所述的装置,其特征在于,所述概率值确定单元用于: 将所述通信交互属性值中心化后的值除以所述通信记录交互属性值的标准方差后获 得标准交互属性值。11. 如权利要求7所述的装置,其特征在于,所述垃圾短消息确定单元用于: 将所述标准交互属性值通过由决策树模型计算出来的概率值,再通过逻辑回归模型相 加组成的预测模型确定出所述短消息为垃圾短消息的概率值。12. 如权利要求11所述的装置,其特征在于,通过逻辑回归模型确定所述第一权重和 所述第二权重。
【专利摘要】本发明涉及通信技术领域,本发明实施例提供一种垃圾短消息的识别方法及装置,用以解决现有技术方案垃圾短消息识别效率低的问题。该方法包括:网络设备确定第一通信设备发送给第二通信设备的短消息后,获取所述第一通信设备的历史通信记录以及所述第二通信设备的历史通信记录,确定出所述第一通信设备与所述第二通信设备的通信交互属性值;根据由所述通信交互属性值获得的基准交互属性值确定出所述短消息为垃圾短消息的概率值;当所述概率值高于预设阈值时将所述短消息确定为垃圾短信,否则,将所述短消息确定为非垃圾短信。通过本发明实施例提供的方法,可以快速并准确的识别出垃圾短消息。
【IPC分类】H04W12/12
【公开号】CN105323763
【申请号】CN201410298514
【发明人】祝希路
【申请人】中国移动通信集团湖南有限公司
【公开日】2016年2月10日
【申请日】2014年6月27日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1