垃圾信息的识别方法、装置及系统的制作方法

文档序号:7856502阅读:139来源:国知局
专利名称:垃圾信息的识别方法、装置及系统的制作方法
技术领域
本发明涉及通信技术,尤其涉及一种垃圾信息的识别方法、装置及系统。
背景技术
随着移动通信技术的飞速发展,使用手机发送信息已成为人们日常沟通联系的重要方式。但与此同时,大量地广告信息、反动信息、以及层出不穷的诈骗信息等垃圾信息也开始泛滥,甚至严重扰乱社会的安定和谐,也给人们的生活及工作带来了诸多负面影响。为了解决垃圾信息泛滥成灾的问题,目前有依靠频次控制(即通过信息发送速度频率以识别垃圾信息)、关键字匹配(即通过设置屏蔽的关键字以识别垃圾信息)、以及基于用户号码关系进行判断(即每次发送信息时通过判断发送端号码与接收端号码之间有无通 f目往来以及往来程度而确定该彳目息是否为垃圾"[目息)等垃圾"[目息识别方法。但是对于依靠频次控制以及关键字匹配这两种方法容易被不法分子破解,造成拦截失效,例如,不法分子在应对频次控制方案时通过多号码连续低频发送的方式可以逃避拦截,而应对关键字匹配则通过添加字符、同音字、象形字等方法逃避拦截。另外目前基于用户社交关系进行判断的方法只是针对发送号码与接收号码之间的通信关系进行判断,而用户换号后的正常短信通知却会被认为是垃圾信息而被拦截。因此,上述这些方法并不能准确的识别垃圾信息,容易造成对垃圾信息漏识别或误识别的问题,特别是用户换号后的正常短信通知会被认为是垃圾短信而被误拦截。

发明内容
本发明的目的在于提供一种垃圾信息的识别方法及系统,通过对信息发送方的用户与信息接收方的用户之间的通信关系进行判断而确定所述信息是否为垃圾信息,从而提高了识别垃圾信息的准确度。本发明的第一个方面是提供一种垃圾信息的识别方法,包括接收发送方设备发送的短消息,所述短消息中包含发送方设备的用户号码以及接收方设备的用户号码;获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录;根据所述通信历史记录,确定所述短消息是否为垃圾信息。本发明的另一个方面是提供一种垃圾信息识别装置,包括短消息接收模块,用于接收发送方设备发送的短消息,所述短消息中包含发送方的用户号码以及接收方的用户号码;数据获取模块,用于获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录;垃圾信息判定模块,用于根据所述通信历史记录,确定所述短消息是否为垃圾信
肩、O
本发明的又一个方面是提供一种垃圾信息识别系统,包括上述垃圾信息识别装置和数据提供服务平台;所述数据提供服务平台用于接收所述垃圾信息识别装置发送的请求消息,并根据请求消息反馈用户数据。采用上述本发明技术方案的有益效果是本发明提供的垃圾信息的识别方法、装置及系统,是对基于信息发送方与信息接收方通信双方的用户关系进行判断,通过发送信息的用户与接收信息的用户之间的通信关系而确定当前发送的短消息是否为垃圾信息,从而提高识别垃圾信息的准确度。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图I为本发明垃圾信息识别方法实施例一的流程图;图2为本发明垃圾信息识别方法实施例二的流程图;图3为本发明垃圾信息识别方法实施例三的信令流程图;图4为本发明垃圾信息识别装置实施例一的结构示意图;图5为本发明垃圾信息识别装置实施例二的结构示意图;图6为本发明垃圾信息识别系统实施例一的结构示意图;图7为本发明垃圾信息识别系统实施例二的结构示意图;图8为图7所示系统实施例二的一种系统部署示意图。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图I为本发明垃圾信息识别方法实施例一的流程图,如图I所示,所述垃圾信息识别方法可以包括如下步骤步骤S101,接收发送方设备发送的短消息,所述短消息中包含发送方的用户号码以及接收方的用户号码;步骤S102,获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录;步骤S103,根据所述通信历史记录,确定所述短消息是否为垃圾信息。本实施例的执行主体可以是垃圾信息识别装置,其可以部署在移动信息服务运营商的短信中心中,也可以部署在第三方通信服务器中,或者单独部署并通过网络与短信中心和第三方通信服务器进行通信,通过对短信数据发送方的用户和接收方的用户之间的通信历史记录进行分析统计,以达到识别垃圾信息的目的。本实施例中所述的第三方通信服务器是指即时通信平台(Instant Messenger,简称頂)、电子邮件系统、社区服务系统、微薄服务系统或/和社会性网络服务系统(Social Networking Services,简称SNS)等网络通平台。以下以所述垃圾信息识别装置单独部署并通过网络与移动信息服务运营商的短信中心和第三方通信服务器进行通信为例进行说明。具体地,例如短消息数据发送方的用户为A,短消息数据接收方的用户为B,当用户A使用发送方设备向用户B的接收方设备发送短消息时,该短消息首先被发送至移动信息服务运营商的短信中心,短信中心再将该短消息发送请求提交至垃圾信息识别装置。其中,所述短消息发送请求中包含发送方用户A的用户号码以及接收方用户B的用户号码。具体地,所述发送方用户A的用户号码可以是用户A当前发送短消息的手机号码;所述接收方用户B的用户号码可以是接收方用户B当前接收发送方用户A发送的短消息的手机号码。在该实施例中,由于短消息发送请求中携带有发送方用户A当前发送短消息的手 机号码以及接收方用户B当前接收发送方用户A发送的短消息的手机号码,又基于目前各 种业务的实名制,因此可以通过用户A当前发送短消息的手机号码而关联用户A的身份识别码,并进一步通过用户A的身份识别码而关联用户A的所有手机号码以及用户A的网络通信身份标识号码(Identity,简称ID),同理,也可以通过用户B当前接收短消息的手机号码而关联用户B的身份识别码,并进一步通过用户B的身份识别码而关联用户B的所有手机号码以及用户B的网络通信ID ;或者通过用户A当前发送短消息的手机号码而关联用户A的身份识别码,并通过用户A的身份识别码而关联用户A的所有手机号码,再通过用户A 的所有手机号码而关联用户A的网络通信ID,类似的,也可以通过用户B当前接收短消息的手机号码而关联用户B的的身份识别码,并通过用户B的身份识别码而关联用户B的所有手机号码,再通过用户B的所有手机号码而关联用户B的网络通信ID。从而使得垃圾信息识别装置可以根据上述关联的信息而获取发送方用户A与接收方用户B之间的通信历史记录,包括发送方用户A的所有手机号码与接收方用户B的所有手机号码之间的语音通信记录、信息收发记录,以及发送方用户A的网络通信ID与接收方用户B的网络通信ID之间的网络通信记录等。在本实施例中,所述网络通信ID是指用户在即时通信平台頂、电子邮件系统、社区服务系统、微薄服务系统或/和社会性网络服务系统SNS等网络通信平台中使用的登录账号或用户名等。垃圾信息识别装置根据上述获取的发送方用户A与接收方用户B之间的通信历史记录而确定发送方用户A当前发送的短消息是否为垃圾信息。具体为垃圾信息识别装置根据获取的发送方用户A的所有手机号码与接收方用户B的所有手机号码之间的语音通信记录、信息收发记录,以及发送方用户A的网络通信ID与接收方用户B的网络通信ID之间的网络通信记录即可统计计算出发送方用户A主叫接收方用户B的通话时长、接收方用户B主叫发送用户A的通话时长、接收方用户B向发送方用户A发送短消息的数量、发送方用户A的短信息收发比、发送方用户A与接收方用户B的网络交互量等具体量化信息,并将上述统计计算出的具体量化信息与系统阈值进行比较,从而根据比较结果确定发送方用户A当前发送的短消息是否为垃圾信息。在本实施例中,由于对垃圾信息的判断依据并非只针对发送信息的号码与接收信息的号码之间的通信关系,而是扩展到发送方用户号码归属的用户与接收方用户号码归属的用户之间的通信关系,包括通信双方的用户在移动信息服务运营商提供的语音业务、信息业务之间的通信关系和第三方通信服务器提供的网络业务之间的通信关系,因此提高了垃圾信息判断的准确度。进一步地,在所述获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录之前,所述垃圾信息识别方法还包括对发送方用户号码归属的用户当前发送短消息的手机号码进行预判定,以确定发送方用户号码归属的用户当前发送短消息的手机号码是否为可疑号码,其预判定的方法如下所述垃圾信息识别装置接收到短消息发送请求后,向移动信息服务运营商系统的运营商业务支撑平台发送第三请求消息,所述第三请求消息中包含发送方用户A的用户号码,由上述实施例可知,发送方用户A的用户号码可以是发送方用户A当前发送短消息的手机号码;因此,运营商业务支撑平台可以根据发送方用户A的用户号码而对发送方用户A当前发送短消息的手机号码进行查询,以获取发送方用户A当前发送短消息的手机号码的入网时长、语音通话记录和短信收发记录,并将这些信息作为第三通信历史记录而反馈至所 述垃圾信息识别装置,垃圾信息识别装置则根据所述第三通信历史记录,确定发送方用户A当前发送短消息的手机号码是否为可疑号码。当然,所述垃圾信息识别装置接收到短消息发送请求后,也可以通过本地数据库对当前发送短消息的手机号码进行第三通信历史记录的查询。在本实施例中,垃圾信息识别装置根据接收到的第三通信历史记录,只需进行简单的计算统计即可获取发送方用户A当前发送短消息的手机号码的语音通话时长和短信收发比等信息,若所述发送方用户A当前发送短消息的手机号码的入网时长小于系统预设阈值、语音通话时长小于系统预设阈值、短信净发量大于预设阀值和短信收发比小于系统预设阈值,则确定所述发送方用户A当前发送短消息的手机号码为可疑号码,此时需要执行步骤S102进一步确定该短消息是否为垃圾信息;否则垃圾信息识别装置向短信中心反馈当前发送短消息的手机号码不为可疑号码,短信中心允许发送该条短消息。因该实施例在对发送方用户号码归属的用户以及接收方用户号码归属的用户之间的通信关系进行判断前,还要对发送方用户号码归属的用户当前发送短消息的手机号码进行预判定,在判断时通过简单的算法极大的减少了系统的工作量,因此在一定程度上提高了垃圾信息的识别效率。图2为本发明垃圾信息识别方法实施例二的流程图,如图2所示,所述垃圾信息识别方法可以包括如下步骤步骤S201,接收发送方设备发送的短消息,所述短消息中包含发送方的用户号码以及接收方的用户号码;需要说明的是,本实施例的执行主体可以是垃圾信息识别装置,其可以部署在移动信息服务运营商的短信中心中,也可以部署在第三方通信服务器中,或者单独部署并通过网络与短信中心和第三方通信服务器进行通信,通过对短信数据发送方的用户和接收方的用户之间的通信历史记录进行分析统计,以达到识别垃圾信息的目的。以下还是以所述垃圾信息识别装置单独部署并通过网络与移动信息服务运营商的短信中心和第三方通信服务器进行通信为例进行说明。
具体地,例如短消息数据发送方的用户为A,短信数据接收方的用户为B,当用户A使用发送方设备向用户B的接收方设备发送短消息时,该短消息首先被发送至移动信息服务运营商的短信中心,短信中心再将该短消息发送请求提交至垃圾信息识别装置。其中,所述短消息发送请求中包含发送方用户A的用户号码以及接收方用户B的用户号码。本实施例中,所述发送方用户A的用户号码可以是用户A当前发送短消息的手机号码;所述接收方用户B的用户号码可以是接收方用户B当前接收发送方用户A发送的短消息的手机号码。步骤S202,根据发送方用户号码以确定发送方用户号码归属的用户当前发送短消息的手机号码是否为可疑号码;所述垃圾信息识别装置接收到短消息发送请求后,向移动信息服务运营商系统的运营商业务支撑平台发送第三请求消息,所述第三请求消息中包含发送方用户A的用户号码,由上述实施例可知,发送方用户A的用户号码可以是发送方用户A当前发送短消息的手机号码,因此,运营商业务支撑平台可以根据发送方用户A的用户号码而对发送方用户A当前发送短消息的手机号码进行查询,以获取发送方用户A当前发送短消息的手机号码的入 网时长、语音通话记录和短信收发记录,并将这些信息作为第三通信历史记录而反馈至所述垃圾信息识别装置,垃圾信息识别装置则根据所述第三通信历史记录,确定发送方用户A当前发送短消息的手机号码是否为可疑号码。当然,所述垃圾信息识别装置接收到短消息发送请求后,也可以通过本地数据库对当前发送短消息的手机号码进行第三通信历史记录的查询。在本实施例中,垃圾信息识别装置根据接收到的第三通信历史记录,只需进行简单的计算统计即可获取发送方用户A当前发送短消息的手机号码的语音通话时长和短信收发比等信息,若所述发送方用户A当前发送短消息的手机号码的入网时长小于系统预设阈值、语音通话时长小于系统预设阈值、短信净发量大于预设阀值和短信收发比小于系统预设阈值,则确定所述发送方用户A当前发送短消息的手机号码为可疑号码,此时需要执行步骤S203进一步确定该短消息是否为垃圾信息;否则垃圾信息识别装置向短信中心反馈当前发送短消息的手机号码不为可疑号码,执行步骤S205。步骤S203,获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的第一通信历史记录,根据所述第一通信历史记录,确定所述短消息是否为疑似垃圾信息;在该实施例中,当发送方用户A向接收方用户B发送短消息时,垃圾信息识别装置根据短消息发送请求中携带的发送方的用户号码以及接收方的用户号码而获取发送方用户号码归属的用户A以及接收方用户号码归属的用户B之间的第一通信历史记录。具体为,所述垃圾信息识别装置向运营商业务支撑平台发送第一请求消息,所述第一请求消息中包含所述发送方用户A的用户号码以及接收方用户B的用户号码;并根据所述发送方用户A的用户号码和接收方用户B的用户号码接收所述运营商业务支撑平台反馈的第一通信历史记录。当然,所述垃圾信息识别装置也可以根据短消息发送请求中携带的发送方用户A的用户号码以及接收方用户B的用户号码而通过本地数据库获取发送方用户号码归属的用户A以及接收方用户号码归属的用户B之间的第一通信历史记录。本实施例中的第一通信历史记录可以是下述记录中的至少一种发送方用户号码归属的用户A主叫接收方用户号码归属的用户B的语音通话历史记录、接收方用户号码归属的用户A主叫发送方用户号码归属的用户B的语音通话历史记录以及接收方用户号码归属的用户B向发送方用户号码归属的用户A发送短消息的历史记录。在该实施例中,所述短消息发送请求中发送方用户号码可以是发送方用户A当前发送短消息的手机号码,所述接收方用户号码可以是接收方用户B当前接收短消息的手机号码。又基于目前各种业务的实名制,因此可以通过用户A当前发送短消息的手机号码而关联用户A的身份识别码,并进一步通过用户A的身份识别码而关联用户A的所有手机号码,同理,也可以通过用户B当前接收短消息的手机号码而关联用户B的身份识别码,并进一步通过用户B的身份识别码而关联用户B的所有手机号码。从而使得垃圾信息识别装置可以根据上述关联的信息而获取发送方用户A的所有手机号码与接收方用户B的所有手机号码之间的语音通信记录、信息收发记录等通信历史记录。以下通过一个具体的实施例对所述发送方用户号码归属的用户A以及所述接收方用户号码归属的用户B之间的第一通信历史记录进行说明,例如,当发送方用户号码归 属的用户A拥有多个手机号码如al、a2、......、an,接收方用户号码归属的用户B拥有多个
手机号码如bl、b2、……、bm时,则根据短消息发送请求中携带的用户A的用户号码通过上述方法可以关联到用户A拥有的多个手机号码al、a2、……、an,根据用户B的用户号码则可以关联到用户B拥有的多个手机号码bl、b2、……、bm,因此可以通过上述关联到的手机
号码而获得归属于用户A的手机号码(al、a2、......、an)与归属于用户B的手机号码(bl、
b2、……、bm)之间的语音通信记录、信息收发记录等通信历史记录信息,通过对这些通信历史记录信息进行简单的统计计算即可获取发送方用户A与接收方用户B之间的通信关系信息,如发送方用户A主叫接收方用户B的通话时长(TAMB)、接收方用户B主叫发送方用户A的通话时长(TBMA)、发送方用户B向发送方用户A发送的短信量(TBS{W&A)等,其中,
m n
■-p' r- -i
1A I 叫B 二 H5
n m
Tb上叫A —
J=I5
n m
Tb短位给a _
i=l /=1
O垃圾信息识别装置根据获取的发送方用户A与接收方用户B之间的上述通信关系数据而判定所述发送方用户A当前发送的短消息是否为疑似垃圾信息。具体为,垃圾信息识别装置将上述参数 Ta主叫B、Tb主叫a、Tb短信给a 与系统预设阈值进行比较,若上述任一参数大于预设阈值,则确定所述发送方用户A当前发送的短消息不为疑似垃圾信息,则进入步骤S205 ;否则确定所述短消息为疑似垃圾信息,执行步骤S204。在本发明实施例中,垃圾信息识别装置是针对用户之间的通信关系对垃圾信息进行判定,而并非只针对发送信息的号码与接收信息的号码之间的通信关系进行判定,因此,解决了现有技术中用户换号后的正常短信通知被误认为是垃圾信息而被拦截的问题。步骤S204,若所述短消息为疑似垃圾信息,则向第三方通信服务器发送第二请求消息,接收所述第三方通信服务器反馈的第二通信历史记录,根据所述第二通信历史记录,确定所述疑似垃圾信息是否为垃圾信息;在本实施例中,垃圾信息识别装置根据短消息发送请求中携带的发送方用户A的用户号码以及接收方用户B的用户号码而获取发送方用户号码归属的用户A以及接收方用户号码归属的用户B之间的第二通信历史记录。具体为若垃圾信息识别装置根据上述步骤确定所述短消息为疑似垃圾信息,则向第三方通信服务器发送第二请求消息,所述第二请求消息中包含所述发送方用户A的用户号码以及接收方用户B的用户号码;并接收所述第三方通信服务器反馈的第二通信历史记录。当然,所述垃圾信息识别装置也可以根据短消息发送请求中携带的发送方用户A的用户号码以及接收方用户B的用户号码而通过本地 数据库获取发送方用户号码归属的用户A以及接收方用户号码归属的用户B之间的第二通信历史记录。在本实施例中,所述第三方通信服务器可以包括即时通信平台頂、电子邮件系统、社区服务系统、微薄服务系统和社会性网络服务系统SNS等网络通信平台中的至少一种;所述第二通信历史记录可以包括所述发送方用户号码归属的用户A与接收方用户号码归属的用户B在即时通信平台中的历史交互记录、电子邮件系统中的历史交互记录、社区服务系统中的历史交互记录、微薄服务系统中的历史交互记录以及社会性网络服务系统中的历史交互记录中的至少一种。在该实施例中,由于短消息发送请求中携带有发送方用户A当前发送短消息的手机号码以及接收方用户B接收发送方用户A发送的短消息的手机号码,又基于目前各种业务的实名制,因此可以通过用户A当前发送短消息的手机号码而关联用户A的身份识别码,并进一步通过用户A的身份识别码而关联用户A在上述第三方通信服务器中的网络通信ID,同理,也可以通过用户B接收发送方用户A发送的短消息的手机号码而关联用户B的身份识别码,并进一步通过用户B的身份识别码而关联用户B在上述第三方通信服务器中的网络通信ID ;或者通过用户A当前发送短消息的手机号码而关联用户A的身份识别码,进一步通用户A的身份识别码而关联用户A的所有手机号码,再通过用户A的所有手机号码而关联用户A在上述第三方通信服务器中的网络通信ID,类似的,也可以通过用户B接收发送方用户A发送的短消息的手机号码而关联用户B的身份识别码,进一步通过用户B的身份识别码而关联用户B的所有手机号码,再通过用户B的所有手机号码而关联用户B在上述第三方通信服务器中的网络通信ID。从而使得垃圾信息识别装置可以根据上述关联的信息而获取发送方用户A与接收方用户B在第三方通信服务器中的通信历史记录,通过对这些通信历史记录信息进行简单的统计计算即可获取发送方用户号码归属的用户A与接收方用户号码归属的用户B在第三方通信服务器中的交互量信息,如发送方用户A与接收方用户B在即时通信平台中的历史交互量、电子邮件系统中的历史交互量、社区服务系统中的历史交互量、微薄服务系统中的历史交互量以及社会性网络服务系统中的历史交互量等信息。垃圾信息识别装置根据获取的发送方用户A与接收方用户B在第三方通信服务器中的交互量信息而判定所述疑似垃圾短消息是否为垃圾信息,其具体为垃圾信息识别装置将上述发送方用户A与接收方用户B在第三方通信服务器中的交互量信息与系统预设阈值进行比较,若所述发送方用户A与接收方用户B在即时通信平台中的历史交互量大于预设阈值、电子邮件系统中的历史交互量大于预设阈值、社区服务系统中的历史交互量大于预设阈值、微薄服务系统中的历史交互量大于预设阈值或社会性网络服务系统中的历史交互量大于预设阈值,则确定所述疑似垃圾短消息不为垃圾信息,执行步骤S205 ;否则确定所述疑似垃圾短消息为垃圾信息,执行步骤S206。步骤S205,通过短信中心发送该条短消息;步骤S206,对所述垃圾信息进行拦截处理。可选地,还可以进一步对所述步骤S204中判定的垃圾信息进行人工审核。在本实施例步骤S202、S203以及S204中,所述垃圾信息识别装置通过本地数据库获取发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的第一、第二、第三通信历史记录之前,还包括垃圾信息识别装置定期或不定期接收运营商业务支撑平
台发送的第一通信历史记录和第三方通信服务器发送的第二通信历史记录,并将其存储在本地数据库。其中,所述第一通信历史记录包括用户的语音通话历史记录和/或短信收发历史记录;所述第二基本通信历史记录包括下述记录中的至少一种用户在即时通信平台中的历史交互记录、电子邮件系统中的历史交互记录、社区服务系统中的历史交互记录、微薄服务系统中的历史交互记录以及社会性网络服务系统中的历史交互记录。本实施例中,通过判断发送信息的用户与接收信息的用户之间在移动信息服务运营商系统和第三方通信服务系统中的通信关系,而确定当前发送的短消息是否为垃圾信息,从而增强了垃圾信息的判别能力,进而提高了识别垃圾信息的准确度;由于本发明实施例对垃圾信息的判断依据针对的是用户之间的通信关系,而并非只针对发送信息的号码与接收信息的号码之间的通信关系,因此还避免了因用户换号后的正常短信通知被认为是垃圾信息而被误拦截的问题。图3为本发明垃圾信息识别方法实施例三的信令流程图,如图3所示,本实施例的垃圾信息识别方法包括步骤301,垃圾信息识别装置定期向运营商业务支撑平台发送获得第三基本通信历史记录的数据请求消息;步骤302,垃圾信息识别装置接收运营商业务支撑平台反馈的第三基本通信历史记录;本实施例中,所述第三基本通信历史记录包括用户的入网时长、语音通话历史记录和短信收发历史记录等信息;步骤303,垃圾信息识别装置根据设置好的判断规则对第三基本通信历史记录时行分析判断,以实现对用户进行筛选,从而确定需要重点关注的可疑用户号码列表,并定期更新;步骤304,用户发送短消息至短信中心;步骤305,短信中心将用户发送短消息的请求提交至垃圾信息识别装置;步骤306,垃圾信息识别装置将发送短消息的用户号码与需要重点关注的可疑号码列表进行比对,如果不在列表中则鉴权成功,反之则判定发送短消息的用户号码为可疑号码;步骤307,若发送方号码为可疑号码,则垃圾信息识别装置向运营商业务支撑平台发送获得第一通信历史记录的第一请求消息;
所述第一请求消息内携带有发送方的用户号码以及接收方的用户号码;步骤308,运营商业务支撑平台根据垃圾信息识别装置发送的第一请求消息,检索出发送方用户号码归属的用户与接收方用户号码归属的用户之间的第一通信历史记录,并返回给垃圾信息识别装置;其中,所述第一通信历史记录包括下 述信息中的至少一种发送方用户号码归属的用户主叫接收方用户号码归属的用户的语音通话时长、接收方用户号码归属的用户主叫发送方用户号码归属的用户的语音通话时长以及接收方用户号码归属的用户主发发送方用户号码归属的用户的短消息数量;步骤309,垃圾信息识别装置根据第一通信历史记录判定短消息是否为疑似垃圾信息,具体为,垃圾信息识别装置将运营商业务支撑平台返回的第一通信历史记录与设定的阈值进行比对形成判定结果,若第一通信历史记录内的任一参数大于设定的阈值,则判定该条短消息不为垃圾信息,否则判定该条短消息为疑似垃圾信息;步骤310,若垃圾信息识别装置判定短消息为疑似垃圾信息,则向第三方通信服务器发送获得第二通信历史记录的第二请求消息,所述第二请求消息内携带有发送方用户号码以及接收方用户号码;步骤311,第三方通信服务器根据垃圾信息识别装置发送的第二请求消息,检索出发送方用户号码归属的用户与接收方用户号码归属之间的第二通信历史记录,并返回给垃圾信息识别装置;其中,所述第二通信历史记录包括所述发送方用户号码归属的用户与接收方用户号码归属的用户在即时通信平台中的交互量、电子邮件系统中的交互量、社区服务系统中的交互量、微薄服务系统中的交互量以及社会性网络服务系统中的交互量记录中的至少一种;步骤312,垃圾信息识别装置根据第二通信历史记录判定所述疑似垃圾信息是否为垃圾信息,步骤313,垃圾信息识别装置将达到某一阀值的短消息发送请求进行人工审核;步骤314,垃圾信息识别装置向短信中心返回对短消息的判定或审核结果;步骤315,若短信中心收到的判定或审核结果显示该条短消息不为垃圾信息,则发送该条短消息,否则不发送;步骤316,垃圾信息识别装置定期对判定为发送垃圾短信的号码进行统计分析,确定需要进一步处理的黑名单号码列表,并将其提供给运营商业务支撑平台。本实施例中,由于垃圾信息识别装置定期对运营商业务支撑平台反馈的第三基本通信历史记录进行统计分析而生成重点关注列表,通过将发送短消息的用户号码与该列表进行比对,从而快速确认正常用户的短消息发送请求,因此节约了对垃圾信息的判断流程;并通过判断发送信息的用户与接收信息的用户之间在运营商业务支撑平台和第三方通信服务系统中的通信关系,从而确定当前发送的短消息是否为垃圾信息,因此增强了垃圾信息的判别能力,进而提高了识别垃圾信息的准确度。本领域普通技术人员可以理解实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括R0M、RAM、磁碟或者光盘等各种可以存储程序代码的介质。图4为本发明垃圾信息识别装置实施例一的结构示意图,如图4所示,所述垃圾信息识别装置包括短消息接收模块401,用于接收发送 方设备发送的短消息,所述短消息中包含发送方设备的用户号码以及接收方设备的用户号码;数据获取模块402,用于获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录;垃圾信息判定模块403,用于根据所述通信历史记录,确定所述短消息是否为垃圾信息。本实施例的垃圾信息识别装置可以用于执行图I所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。图5为本发明垃圾信息识别装置实施例二的结构示意图,本实施例在图4所示垃圾信息识别装置结构的基础上,进一步地,所述数据获取模块402包括第一请求消息发送单元501,用于向运营商业务支撑平台发送第一请求消息,所述第一请求消息中包含所述发送方的用户号码以及接收方的用户号码;第一通信历史记录接收单元502,用于接收所述运营商业务支撑平台根据所述发送方的用户号码和接收方的用户号码反馈的第一通信历史记录;所述垃圾信息判定模块403还包括第一判定单元510,用于根据所述第一通信历史记录,确定所述短消息是否为疑似垃圾信息。其中,所述第一通信历史记录可以包括下述记录中的至少一种所述发送方用户号码归属的用户主叫接收方用户号码归属的用户的语音通话历史记录、接收方用户号码归属的用户主叫发送方用户号码归属的用户的语音通话历史记录以及接收方用户号码归属的用户向发送方用户号码归属的用户发送短消息的历史记录。进一步,所述数据获取模块402还包括第二请求消息发送单元503,用于向第三方通信服务器发送第二请求消息,所述第二请求消息中包含所述发送方的用户号码以及接收方的用户号码;第二通信历史记录接收单元504,用于接收所述第三方通信服务器根据所述发送方的用户号码以及接收方的用户号码反馈的第二通信历史记录;所述垃圾信息判定模块403还包括第二判定单元511,用于根据所述第二通信历史记录,确定所述疑似垃圾信息息是否为垃圾信息。其中,所述第二通信历史记录可以包括下述记录中的至少一种所述发送方用户号码归属的用户与接收方用户号码归属的用户在即时通信平台中的历史交互记录、电子邮件系统中的历史交互记录、社区服务系统中的历史交互记录、微薄服务系统中的历史交互记录以及社会性网络服务系统中的历史交互记录等。进一步,所述数据获取模块402还包括本地数据存储单元505,用于接收并存储运营商业务支撑平台发送的第一通信历史记录和第三方通信服务器发送的第二通信历史记录;本地数据获取单元506,用于获取本地存储的发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录,包括第一通信历史记录和第二通信历史记录。其中,所述第一通信历史记录包括用户的语音通话历史记录和/或短信收发历史记录;所述第二通信历史记录包括下述记录中的至少一种用户在即时通信平台中的历史交互记录、电子邮件系统中的历史交互记录、社区服务系统中的历史交互记录、微薄服务系统中的历史交互记录以及社会性网络服务系统中的历史交互记录。进一步,所述装置还包括可疑号码判定模块404,所述可疑号码判定模块404还包括第三请求消息发送单元507,用于向运营商业务支撑平台发送第三请求消息,所述第三请求消息中包含所述发送方的用户号码;第三通信历史记录接收单元508,用于接收所述运营商业务支撑平台根据所述发送方的用户号码反馈的第三通信历史记录;·可疑号码判定单元509,用于根据所述第三通信历史记录,确定发送方用户号码是否为可疑号码。其中,所述第三通信历史记录包括所述发送方用户号码的入网时长、语音通话历史记录和短信收发历史记录。本实施例的垃圾信息识别装置可以用于执行图2所示方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。图6为本发明垃圾信息识别系统实施例一的结构示意图,如图6所示,所述垃圾信息识别系统包括本发明任意实施例提供的垃圾信息识别装置601和数据提供服务平台602,其中,所述数据提供服务平台602用于接收所述垃圾信息识别装置发送的请求消息,并根据请求消息反馈用户数据。本实施例通过数据提供服务平台提供的大量用户数据判断发送信息的用户与接收信息的用户之间的通信关系,而确定当前发送的短消息是否为垃圾信息,从而增强了垃圾信息的判别能力,进而提高了识别垃圾信息的准确度。图7为本发明垃圾信息识别系统实施例二的结构示意图,如图7所示,本实施例在图6所示垃圾信息识别系统结构的基础上,进一步地,所述数据提供服务平台602还包括运营商业务支撑平台701,用于接收所述垃圾信息识别装置601发送的第一请求消息并反馈第一通信历史记录;第三方通信服务器702,用于接收所述垃圾信息识别装置601发送的第二请求消息并反馈第二通信历史记录。其中,所述第三方通信服务器702可以包括即时通信平台、电子邮件系统、社区服务系统、微薄服务系统以及社会性网络服务系统中的至少一种。本实施例通过判断发送信息的用户与接收信息的用户之间在运营商业务支撑平台和第三方通信服务系统中的通信关系,而确定当前发送的短消息是否为垃圾信息,从而增强了垃圾信息的判别能力,进而提高了识别垃圾信息的准确度。下面采用一个具体的实施例并结合图3至图7的技术方案对本发明的垃圾信息识别系统的部署进行详细说明。图8为图7所示系统实施例二的一种系统部署示意图,如图8所示,所述垃圾信息识别系统包括垃圾信息监控中心、BSS系统和非运营商网络服务系统,其中,所述垃圾信息监控中心根据接收到的短消息发送请求而向BSS系统和非运营商网络服务系统发送数据请求消息,并根据BSS系统和非运营商网络服务系统返回的用户通信历史记录数据而判定该短消息是否为垃圾"[目息。在本实施例中,所述垃圾信息监控中心可以分为三层架构,即数据层、处理层和展现层,其中,所述数据层为本发明的垃圾信息监控中心提供数据支撑,所述数据层又包括基础通信数据库、鉴权数据缓存库、以及鉴权数据积累库。其中基础通信数据库用于存储BSS系统返回的用户的第三通信历史记录;鉴权数据缓存库用于存储BSS系统返回的第一通信历史记录和非运营商网络服务系统提供的第二通信历史记录;鉴权数据积累库是通过吸收基础通信数据库和鉴权数据缓存库的数据并经过一定时间的数据积累而形成的,当鉴权数据库积累的数据达到一定量后可直接用于鉴权,从而减少垃圾信息监控中心与BSS系统和非运营商网络服务系统的交互,以降低系统负荷。处理层是垃圾信息监控中心的核心部分,其包括重点监控号码生成器、重点监控 号码池、鉴权模块、审核缓存区、统计分析模块及黑名单库,其中,重点监控号码生成器根据配置规则及基础通信数据库内存储的用户的第三通信历史记录而计算出需要重点监控的号码,并将计算出的需要重点监控的号码发送至重点监控号码池中存放;审核缓存区用于存储待审核的短消息;鉴权模块首先通过重点监控号码池对发送该条待审核短消息的发送方的用户号码进行预审,若待审核短消息的发送方的用户号码不属于重点监控号码池中存放的号码,则根据鉴权数据缓存库内BSS系统返回的第一通信历史记录和非运营商网络服务系统提供的第二通信历史记录对审核缓存区内的待审核短消息进行审核,判定该条短消息是否为垃圾信息,并将达到某一预设阀值的短消息返回至审核缓存区;统计分析模块记录并分析鉴权模块对该短消息进行审核后的判定结果,对判定为垃圾信息或需要进一步处理的信息(如暂停短信功能)的用户号码生成黑名单,并发送至黑名单库中存放。展现层是维护操作人员直接接触的界面,又包括配置模块、人工审核模块以及统计报表展现模块,其中,配置模块用于设定阈值以及判定规则,并对阈值和判定规则进行更新、调整等相应的配置;人工审核模块用于对审核缓存区内存放的达到某一预设阀值的短消息进行人工审核处理;统计报表展现模块用于按预先设定的显示规则显示相关统计数据。在本实施例中,图7所示实施例的垃圾信息识别装置601可部署在图8所示实施例的垃圾信息监控中心中、运营商业务支撑平台701相当于图8所示的BSS系统、第三方通信服务器702相当于图8所示的非运营商网络服务系统,其各部分的实现原理和技术效果也与图7类似,此处不再赘述。类似地,图5所示实施例的垃圾信息识别装置也可部署在图8所示实施例的垃圾信息监控中心中,其中,图5所示实施例的短消息接收模块401可以部署在图8所示实施例的审核缓存区中、第三请求消息发送单元507和第三通信历史记录接收单元508可以部署在基础通信数据库中、第一请求消息发送单元501、第一通信历史记录接收单元502、第二请求消息发送单元503和第二通信历史记录接收单元504可以部署在鉴权数据库中、本地数据存储单元505和本地数据获取单元506可以部署在鉴权数据积累库中、可疑号码判断单元509和垃圾信息判定模块403可以部署在鉴权模块中,
本实施例通过重点监控号码生成器生成需要监控的用户号码名单,使得鉴权模块能够根据需要监控的用户号码名单快速确认待审核短消息的发送方用户号码是否属于监控的对象,在一定程度上提高了垃圾信息的识别效率;而通过本地数据层存储用于鉴权的数据,又减少了垃圾信息识别装置与网络数据层的交互,从而降低了系统的负荷;鉴权模块还可以通过网络数据层判断发送信息的用户与接收信息的用户之间的通信关系,而确定当前发送的短消息是否为垃圾信息,从而增强了垃圾信息的判别能力,进而提高了识别垃圾信息的准确度。最后应说明的是以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技 ·术方案的范围。
权利要求
1.一种垃圾信息的识别方法,其特征在于,包括 接收发送方设备发送的短消息,所述短消息中包含发送方设备的用户号码以及接收方设备的用户号码; 获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录; 根据所述通信历史记录,确定所述短消息是否为垃圾信息。
2.根据权利要求I所述的方法,其特征在于,所述获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录,具体为 向运营商业务支撑平台发送第一请求消息,所述第一请求消息中包含所述发送方的用户号码以及接收方的用户号码; 接收所述运营商业务支撑平台根据所述发送方的用户号码和接收方的用户号码反馈的第一通信历史记录; 所述根据所述通信历史记录,确定所述短消息是否为垃圾信息,具体为根据所述第一通信历史记录,确定所述短消息是否为疑似垃圾信息。
3.根据权利要求2所述的方法,其特征在于,所述第一通信历史记录包括下述记录中的至少一种 所述发送方用户号码归属的用户主叫接收方用户号码归属的用户的语音通话历史记录、接收方用户号码归属的用户主叫发送方用户号码归属的用户的语音通话历史记录以及接收方用户号码归属的用户向发送方用户号码归属的用户发送短消息的历史记录;所述根据所述第一通信历史记录,确定所述短消息是否为疑似垃圾信息,具体为若所述发送方用户号码归属的用户主叫接收方用户号码归属的用户的语音通话历史时长大于预设阈值、接收方用户号码归属的用户主叫发送方用户号码归属的用户的语音通话历史时长大于预设阈值或接收方用户号码归属的用户向发送方用户号码归属的用户发送短消息的历史数量大于预设阈值,则确定所述短消息不为疑似垃圾信息。
4.根据权利要求2所述的方法,其特征在于,若确定所述短消息为疑似垃圾信息,则所述方法还包括 向第三方通信服务器发送第二请求消息,所述第二请求消息中包含所述发送方的用户号码以及接收方的用户号码; 接收所述第三方通信服务器根据所述发送方的用户号码以及接收方的用户号码反馈的第二通信历史记录; 根据所述第二通信历史记录,确定所述疑似垃圾信息是否为垃圾信息。
5.根据权利要求4所述的方法,其特征在于,所述第二通信历史记录包括下述记录中的至少一种 所述发送方用户号码归属的用户与接收方用户号码归属的用户在即时通信平台中的历史交互记录、电子邮件系统中的历史交互记录、社区服务系统中的历史交互记录、微薄服务系统中的历史交互记录以及社会性网络服务系统中的历史交互记录;所述根据所述第二通信历史记录,确定所述疑似垃圾信息是否为垃圾信息,具体为若所述发送方用户号码归属的用户与接收方用户号码归属的用户在即时通信平台中的历史交互量大于预设阈值、电子邮件系统中的历史交互量大于预设阈值、社区服务系统中的历史交互量大于预设阈值、微薄服务系统中的历史交互量大于预设阈值或社会性网络服务系统中的历史交互量大于预设阈值,则确定所述短消息不为垃圾信息,否则确定所述短消息为垃圾信息。
6.根据权利要求1飞中任一项所述的方法,其特征在于,所述获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录之前,还包括 向运营商业务支撑平台发送第三请求消息,所述第三请求消息中包含所述发送方的用户号码; 接收所述运营商业务支撑平台根据所述发送方的用户号码反馈的第三通信历史记录; 根据所述第三通信历史记录,确定发送方用户号码是否为可疑号码。
7.根据权利要求6所述的方法,其特征在于,所述第三通信历史记录包括 所述发送方用户号码的入网时长、语音通话历史记录和短信收发历史记录; 所述根据所述第三通信历史记录,确定发送方用户号码是否为可疑号码,具体为 若所述发送方用户号码的入网时长小于预设阈值、语音通话历史时长小于预设阈值、短信净发量大于预设阀值和短信收发比小于预设阈值,则确定所述发送方用户号码为可疑号码。
8.根据权利要求I所述的方法,其特征在于,所述获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录,包括 获取本地存储的发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录。
9.根据权利要求8所述的方法,其特征在于,所述获取本地存储的发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录之前,还包括 接收并存储运营商业务支撑平台发送的第一通信历史记录或第三方通信服务器发送的第二通信历史记录; 所述第一通信历史记录包括用户的语音通话历史记录和/或短信收发历史记录; 所述第二通信历史记录包括下述记录中的至少一种用户在即时通信平台中的历史交互记录、电子邮件系统中的历史交互记录、社区服务系统中的历史交互记录、微薄服务系统中的历史交互记录以及社会性网络服务系统中的历史交互记录; 所述根据所述通信历史记录,确定所述短消息是否为垃圾信息,具体为 根据所述第一通信历史记录或第二通信历史记录,确定所述短消息是否为垃圾信息。
10.一种垃圾信息识别装置,其特征在于,包括 短消息接收模块,用于接收发送方设备发送的短消息,所述短消息中包含发送方设备的用户号码以及接收方设备的用户号码; 数据获取模块,用于获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录; 垃圾信息判定模块,用于根据所述通信历史记录,确定所述短消息是否为垃圾信息。
11.根据权利要求10所述的装置,其特征在于,所述数据获取模块包括 第一请求消息发送单元,用于向运营商业务支撑平台发送第一请求消息,所述第一请求消息中包含所述发送方的用户号码以及接收方的用户号码;第一通信历史记录接收单元,用于接收所述运营商业务支撑平台根据所述发送方的用户号码和接收方的用户号码反馈的第一通信历史记录; 所述垃圾信息判定模块还包括第一判定单元,用于根据所述第一通信历史记录,确定所述短消息是否为疑似垃圾信息。
12.根据权利要求11所述的装置,其特征在于,所述第一通信历史记录包括下述记录中的至少一种 所述发送方用户号码归属的用户主叫接收方用户号码归属的用户的语音通话历史记录、接收方用户号码归属的用户主叫发送方用户号码归属的用户的语音通话历史记录以及接收方用户号码归属的用户向发送方用户号码归属的用户发送短消息的历史记录。
13.根据权利要求11所述的装置,其特征在于,所述数据获取模块还包括 第二请求消息发送单元,用于向第三方通信服务器发送第二请求消息,所述第二请求消息中包含所述发送方的用户号码以及接收方的用户号码; 第二通信历史记录接收单元,用于接收所述第三方通信服务器根据所述发送方的用户号码以及接收方的用户号码反馈的第二通信历史记录; 所述垃圾信息判定模块还包括第二判定单元,用于根据所述第二通信历史记录,确定所述疑似垃圾信息是否为垃圾信息。
14.根据权利要求13所述的装置,其特征在于,所述第二通信历史记录包括下述记录中的至少一种 所述发送方用户号码归属的用户与接收方用户号码归属的用户在即时通信平台中的历史交互记录、电子邮件系统中的历史交互记录、社区服务系统中的历史交互记录、微薄服务系统中的历史交互记录以及社会性网络服务系统中的历史交互记录。
15.根据权利要求10 14中任一项所述的装置,其特征在于,还包括可疑号码判定模块,所述可疑号码判定模块还包括 第三请求消息发送单元,用于向运营商业务支撑平台发送第三请求消息,所述第三请求消息中包含所述发送方的用户号码; 第三通信历史记录接收单元,用于接收所述运营商业务支撑平台根据所述发送方的用户号码反馈的第三通信历史记录; 可疑号码判定单元,用于根据所述第三通信历史记录,确定发送方用户号码是否为可疑号码。
16.根据权利要求15所述的装置,其特征在于,所述第三通信历史记录包括 所述发送方用户号码的入网时长、语音通话历史记录和短信收发历史记录。
17.根据权利要求10所述的装置,其特征在于,所述数据获取模块还包括 本地数据获取单元,用于获取本地存储的发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录。
18.根据权利要求17所述的装置,其特征在于,所述数据获取模块还包括 本地数据存储单元,用于接收并存储运营商业务支撑平台发送的第一通信历史记录或第三方通信服务器发送的第二通信历史记录; 所述第一通信历史记录包括用户的语音通话历史记录和/或短信收发历史记录; 所述第二通信历史记录包括下述记录中的至少一种用户在即时通信平台中的历史交互记录、电子邮件系统中的历史交互记录、社区服务系统中的历史交互记录、微薄服务系统中的历史交互记录以及社会性网络服务系统中的历史交互记录; 所述垃圾信息判定模块还包括第一判定单元、第二判定单元,用于根据所述第一通信历史记录或第二通信历史记录,确定所述短消息是否为垃圾信息。
19.一种垃圾信息识别系统,其特征在于,包括如权利要求10 18任一项所述的垃圾信息识别装置和数据提供服务平台; 所述数据提供服务平台用于接收所述垃圾信息识别装置发送的请求消息,并根据请求消息反馈用户数据。
20.根据权利要求19所述的系统,其特征在于,所述数据提供服务平台包括 运营商业务支撑平台,用于接收所述垃圾信息识别装置发送的第一请求消息并反馈第一通信历史记录; 第三方通信服务器,用于接收所述垃圾信息识别装置发送的第二请求消息并反馈第二通信历史记录。
21.根据权利要求20所述的系统,其特征在于,所述第三方通信服务器包括即时通信平台、电子邮件系统、社区服务系统、微薄服务系统以及社会性网络服务系统中的至少一种。
全文摘要
本发明提供一种垃圾信息的识别方法、装置及系统,所述方法包括接收发送方设备发送的短消息,所述短消息中包含发送方设备的用户号码以及接收方的用户号码;获取所述发送方用户号码归属的用户以及所述接收方用户号码归属的用户之间的通信历史记录;根据所述通信历史记录,确定所述短消息是否为垃圾信息。本发明通过对信息发送方的用户与信息接收方的用户之间的通信关系进行判断而确定当前发送的短消息是否为垃圾信息,从而提高了识别垃圾信息的准确度,并且避免了用户换号后的正常短信通知被认为是垃圾信息而被误拦截的问题。
文档编号H04W24/02GK102802133SQ20121025691
公开日2012年11月28日 申请日期2012年7月23日 优先权日2012年7月23日
发明者赵晨斌, 张勇气, 李金夏, 宋雪娜, 冯立华, 张新荣 申请人:中国联合网络通信集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1