消息处理方法、装置及设备与流程

文档序号:24252255发布日期:2021-03-12 13:30阅读:57来源:国知局
消息处理方法、装置及设备与流程
本申请涉及通信
技术领域
,尤其涉及一种消息处理方法、装置及设备。
背景技术
:目前,垃圾短信的发送者通常持有大量的手机卡,并且为了提高垃圾短信的发送效率,通常使用同一个手机卡发送文本内容类似的垃圾短信,而运营商需要对发送垃圾短信的手机号码进行封禁,防止用户的手机中收到大量的垃圾短信。现有技术中,运营商通常根据一段时间内手机号码发送的垃圾短信的数量,确定需要封禁的手机号码。例如,在一个小时内,同一个手机号码发送的垃圾短信的数量大于预设值时,运营商会对该手机号码进行封禁。然而,为了避免手机号码的误封,运营商设置的预设值通常较大,而垃圾短信的发送者在一个小时内会保证同一个手机号码发送的垃圾短信的数量小于运营商设置的预设值,使得垃圾短信的发送号码在短时间内无法被运营商识别,进而导致运营商对发送垃圾短信的手机号码的识别精度较低。技术实现要素:本申请实施例提供一种消息处理方法、装置及设备,用于解决现有技术中对垃圾短信的手机号码的识别精度较低的技术问题。第一方面,本申请实施例提供一种消息处理方法,该方法包括:在第一消息集合中确定第二消息集合,所述第一消息集合包括至少一个终端设备在预设时段内接收到的消息,所述第二消息集合中的消息为预设类型;根据所述第二消息集合中各消息之间的相似度,将所述第二消息集合划分为至少一个第三消息集合,所述第三消息集合中的各消息之间的相似度大于或等于第一阈值;获取所述第三消息集合中每个消息对应的第一账号,所述第一账号为终端设备发送所述消息所使用的账号;在所述第一消息集合中确定每个第一账号对应的第一消息数量、所述第一账号在所述第三消息集合中对应的第二消息数量、所述第三消息集合中包括的第三消息数量,在账号集合中确定目标账号,所述账号集合包括所述第二消息集合中的消息对应的账号。在一种可能的实施方式中,根据所述第二消息集合中各消息之间的相似度,将所述第二消息集合划分为至少一个第三消息集合,包括:获取所述第二消息集合中各消息之间的相似度;根据所述相似度,对所述第二消息集合中的消息进行聚类处理,以将所述第二消息集合划分为至少一个第三消息集合。在一种可能的实施方式中,获取所述第二消息集合中各消息之间的相似度,包括:获取所述第二消息集合中各消息的字符属性,字符属性包括如下至少一种:所述消息中包括的字符数量或所述消息中包括的字符的笔画数;根据所述字符属性,确定所述第二消息集合中各消息之间的相似度。在一种可能的实施方式中,根据所述字符属性,确定所述第二消息集合中各消息之间的相似度,包括:根据所述字符属性,确定所述第二消息集合中各消息之间的编辑距离;根据所述编辑距离,确定所述第二消息集合中各消息之间的相似度。在一种可能的实施方式中,在所述第一消息集合中确定每个第一账号对应的第一消息数量、所述第一账号在所述第三消息集合中对应的第二消息数量、所述第三消息集合中包括的第三消息数量,在账号集合中确定目标账号,包括:根据所述第一消息数量、所述第三消息数量,确定第二阈值;根据所述第二消息数量和所述第二阈值,在账号集合中确定目标账号。在一种可能的实施方式中,根据所述第一消息数量、所述第三消息数量,确定第二阈值,包括:获取第一预设关系,所述第一预设关系包括多个消息数量和每个消息数量对应的比例系数;根据所述第一消息数量和所述第一预设关系,确定比例系数;根据所述第一消息数量、所述比例系数和所述第三消息数量,确定第二阈值。在一种可能的实施方式中,根据所述第二消息数量和所述第二阈值,在账号集合中确定目标账号,包括:判断所述第二消息数量是否大于第二阈值;若是,则在所述账号集合中确定所述第一账号为所述目标账号。第二方面,本申请实施例提供一种消息处理装置,该装置包括第一确定模块、划分模块、获取模块和第二确定模块,其中:所述第一确定模块用于,在第一消息集合中确定第二消息集合,所述第一消息集合包括至少一个终端设备在预设时段内接收到的消息,所述第二消息集合中的消息为预设类型;所述划分模块用于,根据所述第二消息集合中各消息之间的相似度,将所述第二消息集合划分为至少一个第三消息集合,所述第三消息集合中的各消息之间的相似度大于或等于第一阈值;所述获取模块用于,获取所述第三消息集合中每个消息对应的第一账号,所述第一账号为终端设备发送所述消息所使用的账号;所述第二确定模块用于,在所述第一消息集合中确定每个第一账号对应的第一消息数量、所述第一账号在所述第三消息集合中对应的第二消息数量、所述第三消息集合中包括的第三消息数量,在账号集合中确定目标账号,所述账号集合包括所述第二消息集合中的消息对应的账号。在一种可能的实施方式中,所述划分模块具体用于:获取所述第二消息集合中各消息之间的相似度;根据所述相似度,对所述第二消息集合中的消息进行聚类处理,以将所述第二消息集合划分为至少一个第三消息集合。在一种可能的实施方式中,所述划分模块具体用于:获取所述第二消息集合中各消息的字符属性,字符属性包括如下至少一种:所述消息中包括的字符数量或所述消息中包括的字符的笔画数;根据所述字符属性,确定所述第二消息集合中各消息之间的相似度。在一种可能的实施方式中,所述划分模块具体用于:根据所述字符属性,确定所述第二消息集合中各消息之间的编辑距离;根据所述编辑距离,确定所述第二消息集合中各消息之间的相似度。在一种可能的实施方式中,所述第二确定模块具体用于:根据所述第一消息数量、所述第三消息数量,确定第二阈值;根据所述第二消息数量和所述第二阈值,在账号集合中确定目标账号。在一种可能的实施方式中,所述第二确定模块具体用于:获取第一预设关系,所述第一预设关系包括多个消息数量和每个消息数量对应的比例系数;根据所述第一消息数量和所述第一预设关系,确定比例系数;根据所述第一消息数量、所述比例系数和所述第三消息数量,确定第二阈值。在一种可能的实施方式中,所述第二确定模块具体用于:判断所述第二消息数量是否大于第二阈值;若是,则在所述账号集合中确定所述第一账号为所述目标账号。第三方面,本申请实施例提供一种消息处理设备,包括:存储器、处理器和通信接口,所述存储器用于存储程序指令,所述处理器用于调用存储器中的程序指令执行如第一方面任一项所述的消息处理方法。第四方面,本申请实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序;所述计算机程序用于实现如第一方面任一项所述的消息处理方法。本申请实施例提供一种消息处理方法、装置及设备,在第一消息集合中确定第二消息集合,其中,第一消息集合包括至少一个终端设备在预设时间段内接收到的消息,第二消息集合中的消息为预设类型。根据第二消息集合中各消息之间的相似度,将第二消息集合划分为至少一个第三消息集合,其中,第三消息集合中的各消息之间的相似度大于或等于第一阈值,获取第三消息集合中每个消息对应的第一账号,其中,第一账号为终端设备发送消息所使用的账号。在第一消息集合中确定每个第一账号对应的第一消息数量、第一账号在第三消息集合中对应的第二消息数量、第三消息集合中包括的第三消息数量,在账号集合中确定目标账号,其中,账号集合包括第二消息集合中的消息对应的账号。在上述方法中,根据第二消息集合中各消息之间的相似度,可以准确的将文本内容相似的消息划分在同一个第三消息集合中,并根据第一账号在第一消息集合中发送的消息数量、第三消息集合中包括的消息数量以及第一账号在第三消息集合中发送的消息数量,可以准确的确定第一账号是否为目标账号,进而提高了运营商对发送垃圾短信的手机号码的识别精度。附图说明图1为本申请实施例提供的应用场景的示意图;图2为本申请实施例提供的一种消息处理方法的流程示意图;图3为本申请实施例提供的得到第三消息集合的过程示意图;图4为本申请实施例提供的另一种消息处理方法的流程示意图;图5为本申请实施例提供的消息处理方法的过程示意图;图6为本申请实施例提供的一种消息处理装置的结构示意图;图7为本申请实施例提供的消息处理设备的硬件结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了便于理解,首先对本申请实施例的应用场景进行介绍。图1为本申请实施例提供的应用场景的示意图。请参见图1,包括手机a、手机b和运营商。其中,手机a可以向手机b发送短信,手机b可以接收手机a发送的短信,手机a和手机b可以与运营商进行数据交互。在手机a向手机b发送垃圾短信时,运营商可以获取手机b接收的垃圾短信的发送方,例如,运营商可以根据垃圾短信对应的手机号码,确定垃圾短信的发送方。在运营商确定手机a为垃圾短信的发送方时,运营商可以封停手机a的号码,使得手机a无法向手机b发送垃圾短信。在相关技术中,由于垃圾短信的发送者在不影响阅读的前提下,通常会对垃圾短信的文本内容进行变换,并且在一段时间内使用同一个手机号码发送的垃圾短信的数量小于运营商设置的垃圾短信发送的上限,使得运营商短时间内无法识别发送垃圾短信的手机号码,导致运营商对发送垃圾短信的手机号码的识别精度较低。为了解决相关技术中运营商对发送垃圾短信的手机号码的识别精度较低的技术问题,在本申请实施例中,确定一段时间内终端设备发送的所有的短信中的第一垃圾短信集合,并根据第一垃圾短信集合中各垃圾短信之间的相似度,将垃圾短信分成不同类型的第二垃圾短信集合。确定第二垃圾短信集合中的垃圾短信对应的手机号码,并根据该手机号码在一段时间内发送的所有短信的数量和发送的该类垃圾短信的数量,以及该类第二垃圾短信集合中的垃圾短信的总数量,确定该手机号码是否为发送垃圾短信的手机号码。在上述方法中,根据垃圾短信集合中各垃圾短信之间的相似度,可以准确的将文本内容相似的垃圾短信划分在同一个第二垃圾短信集合中,若同一个第二垃圾短信集合中的多条垃圾短信为同一个手机号码发送的垃圾短信,则该手机号码为垃圾短信的发送号码,可以对该手机号码进行封停处理,这样可以提高运营商对发送垃圾短信的手机号码的识别精度。下面,通过具体实施例对本申请实施例所示的技术方案进行详细说明。需要说明的是,如下实施例可以单独存在,也可以相互结合,对于相同或相似的内容,在不同的实施例中不再重复说明。图2为本申请实施例提供的一种消息处理方法的流程示意图。请参见图2,该方法可以包括:s201、在第一消息集合中确定第二消息集合。本申请实施例的执行主体可以为服务器,也可以为设置在服务器中的消息处理装置。可选的,消息处理装置可以通过软件实现,也可以通过软件和硬件的结合实现。第一消息集合包括至少一个终端设备在预设时段内接收到的消息。其中,终端设备可以为任意具有消息接收功能的设备。例如,终端设备可以为手机、电脑等设备。例如,在终端设备为手机时,第一消息集合可以为预设时段内至少一个手机接收的短信、微信等消息集合。第二消息集合中的消息为预设类型。可选的,预设类型可以为垃圾消息。其中垃圾消息可以为未经用户同意而向用户发送的用户不愿接收的消息。例如,垃圾消息可以包括垃圾短信、垃圾邮件等。可选的,第二消息集合可以为垃圾消息集合。例如,第一消息集合为至少一个手机在预设时段内接收到的短信,其中,第一消息集合中的垃圾短信构成的集合为第二消息集合。可选的,垃圾消息也可以包括手机接收的垃圾微信消息、垃圾通知消息等。可选的,第二消息集合可以为垃圾邮件集合。例如,第一消息集合为至少一个邮箱在预设时段内接收到的邮件,其中,第一消息集合中的垃圾邮件构成的集合为第二消息集合。可选的,可以根据如下可行的实现方式在第一消息集合中确定第二消息集合:确定第二消息集合中消息的关键字,根据关键字在第一消息集合中确定第二消息集合。例如,第二消息集合为垃圾短信集合时,确定垃圾短信的关键字,根据关键字过滤算法,在第一消息集合中筛选出满足垃圾短信关键字的短信,进而构成第二消息集合。可选的,可以根据人工智能机器学习算法在第一消息集合中确定第二消息集合。例如,第二消息集合为垃圾短信集合时,可以根据样本垃圾短信和样本正常短信对模型进行训练,根据训练好的模型对垃圾短信进行识别,进而在第一消息集合中确定第二消息集合。s202、根据第二消息集合中各消息之间的相似度,将第二消息集合划分为至少一个第三消息集合。第三消息集合为预设类型的消息集合。例如,预设类型为垃圾消息时,第二消息集合为垃圾消息集合,根据第二消息集合划分的第三消息集合也为垃圾消息集合。可选的,第三消息集合中的各消息之间的相似度大于或等于第一阈值。例如,第三消息集合中的消息为垃圾消息时,各垃圾消息之间的文本内容的相似程度大于或等于第一阈值。可以根据如下可行的方式将第二消息集合划分为至少一个第三消息集合:获取第二消息集合中各消息之间的相似度。其中,相似度指各消息之间的文本内容的相似程度。例如,短信a和短信b中的文本内容相同,则短信a和短信b的相似度为百分之百。根据相似度对第二消息集合中的消息进行聚类处理,以将第二消息集合划分为至少一个第三消息集合。可选的,可以根据如下可行的方式获取第二消息集合中各消息之间的相似度:获取第二消息集合中各消息的字符属性,其中,字符属性包括如下至少一种:消息中包括的字符数量或消息中包括的字符的笔画数。根据字符属性,确定第二消息集合中各消息之间的相似度。例如,根据字符属性,确定第二消息集合中各消息之间的编辑距离,根据编辑距离,确定第二消息集合中各消息之间的相似度。其中,编辑距离是指文本内容的两个文本之间,由一个转成另一个所需的最少编辑操作次数。例如,编辑操作可以包括:替换一个文本、插入一个文本、删除一个文本等操作。可选的,一个文本变成另一个文本所需要的编辑操作次数越少,两个文本的相似度越大。例如,文本“一”编辑成文本“二”所需要的编辑操作次数为一次,则文本“一”和文本“二”的相似度高,文本“一”编辑成文本“删”所需要的编辑操作次数为六次,则文本“一”和文本“删”的相似度较低。例如,垃圾短信a中的文本内容的笔画数为100,垃圾短信b中的文本内容的笔画数为100,则垃圾短信a和垃圾短信b的相似度为百分之百,垃圾短信a和垃圾短信b在同一个第三消息集合中。可选的,可以根据第二消息集合中各消息之间的相似度,使用mean-shift聚类算法对第二消息集合中的消息进行聚类处理,进而得到至少一个第三消息集合。由于无法预知消息的类别数量,mean-shift聚类算法的滑窗半径的单位为莱文斯坦距离,可以控制消息类别的变化幅度。例如,消息的变化幅度大于滑窗半径时,将该消息认定为另一种类的消息。下面,结合图3,对将第二消息集合划分为至少一个第三消息集合的过程进行详细说明。图3为本申请实施例提供的得到第三消息集合的过程示意图。请参见图3,包括第二消息集合、第三消息集合a、第三消息集合b和第三消息集合c。其中,第二消息集合中包括8条消息(每一个圆代表一条消息),第三消息集合a中包括3条消息,第三消息集合b中包括2条消息,第三消息集合c中包括4条消息。请参见图3,获取第二消息集合中各消息的字符属性,并根据各消息的字符属性对第二消息集合中的消息进行相似度划分。消息之间的相似度越高,消息之间的距离越近,消息之间的相似度越低,消息之间的距离越远。对相似度划分后的消息进行聚类处理,得到第三消息集合a、第三消息集合b和第三消息集合c,其中,第三消息集合a中的各消息之间的相似度大于或等于第一阈值,第三消息集合b中的各消息之间的相似度大于或等于第一阈值,第三消息集合c中的各消息之间的相似度大于或等于第一阈值。s203、获取第三消息集合中每个消息对应的第一账号。第一账号为终端设备发送消息所使用的账号。例如,终端设备为手机时,手机发送短信的第一账号为手机号码,手机发送微信消息的第一账号为微信号码,手机发送邮件的第一账号为邮箱账号。可选的,可以根据第三消息集合中每个消息与账号的对应关系,确定第一账号。例如,消息与账号的对应关系可以如表1所示:表1消息账号消息1账号1消息2账号2消息3账号3…………需要说明的是,表1只是以示例的形式示意消息与账号的对应关系,并非对消息与账号的对应关系的限定。例如,第三消息集合中的的消息为消息1时,则第一账号为账号1;第三消息集合中的的消息为消息2时,则第一账号为账号2;第三消息集合中的的消息为消息3时,则第一账号为账号3。可选的,在第三消息集合为垃圾短信集合时,每个消息对应的第一账号为发送垃圾短信的手机号码,在第三消息集合为垃圾微信集合时,每个消息对应的第一账号为发送垃圾微信的微信账号,在第三消息集合为垃圾邮件集合时,每个消息对应的第一账号为发送垃圾邮件的邮箱账号。s204、在第一消息集合中确定每个第一账号对应的第一消息数量、第一账号在第三消息集合中对应的第二消息数量、第三消息集合中包括的第三消息数量,在账号集合中确定目标账号。第一消息数量为第一消息集合中第一账号发送的消息的数量。例如,在第一消息集合中包括100条消息,其中10条消息为第一账号发送的消息,则第一消息数量为10。可选的,可以根据第一消息集合中各消息与账号的对应关系,确定第一消息集合中第一账号发送的消息的数量。例如,第一消息集合中的消息对应的账号与第一账号相同时,该消息为第一消息集合中第一账号发送的消息。第二消息数量为第三消息集合中第一账号发送的消息的数量。例如,在第三消息集合中包括10条消息,其中3条消息为第一账号发送的消息,则第二消息数量为3。可选的,可以根据第三消息集合中各消息与账号的对应关系,确定第三消息集合中第一账号发送的消息的数量。例如,第三消息集合中的消息对应的账号与第一账号相同时,该消息为第三消息集合中第一账号发送的消息。第三消息数量为第三消息集合中包括的消息数量。例如,第三消息集合为垃圾短信集合时,第三消息集合中垃圾短信的总数量为第三消息数量。可选的,可以根据聚类处理的结果获取第三消息数量。例如,在对第二消息集合中各消息进行聚类处理时,可以确定划分的每个第三消息集合中的消息数量。账号集合包括第二消息集合中的消息对应的账号。可选的,可以将第二消息集合中每个消息对应的账号构成账号集合。例如,若第二消息集合中的消息为垃圾短信,则第二消息集合中所有垃圾短信对应的手机号码都为账号集合中包括的账号。可以根据如下两种可行的实现方式在账号集合中确定目标账号:一种可行的实现方式:根据第一消息数量、第三消息数量,确定第二阈值。根据第二消息数量和第二阈值,在账号集合中确定目标账号。可选的,第二阈值可以为预设的阈值,若第一账号在第三消息集合中对应的第二消息数量大于或等于第二阈值,则在账号集合中确定第一账号为目标账号。可选的,在第三消息集合中的消息为垃圾短信时,第一账号为发送垃圾短信的手机号码,在账号集合中确定目标手机号码时,运营商可以对目标手机号码进行停机一段时间、封禁等处理,降低用户手机收到垃圾短信的概率,进而可以提高用户的使用体验。另一种可行的实现方式:根据第一账号在第一消息集合中对应的第一消息数量和第一账号在第三消息集合中对应的第二消息数量,确定第一账号的可疑值。在可疑值大于或等于预设的阈值时,在账号集合中确定第一账号为目标账号。例如,可疑值可以为第一消息数量和第二消息数量的比值。例如,第一账号在第一消息集合中对应的第一消息数量为100,第一账号在第三消息集合中对应的第二消息数量为30,则第一账号的可疑值为0.3,预设的阈值为0.1时,第一账号为目标账号。本申请实施例提供的消息处理方法,在第一消息集合中确定第二消息集合,获取第二消息集合中各消息的字符属性,根据字符属性,确定第二消息集合中各消息之间的相似度。根据相似度,对第二消息集合中的消息进行聚类处理,以将第二消息集合划分为至少一个第三消息集合。获取第三消息集合中每个消息对应的第一账号,并确定第一账号对应的第一消息数量、第二消息数量和第三消息集合中包括的第三消息数量。根据第一消息数量、第三消息数量,确定第二阈值,根据第二消息数量和第二阈值,在账号集合中确定目标账号。在上述方法中,根据第二消息集合中各消息的字符属性,可以准确的获取第二消息集合中各消息之间的相似度,进而根据相似度,可以准确的得到多个第三消息集合,在第三消息集合中第一账号对应的消息数量大于或等于第二阈值时,说明第一账号发送过多个字符属性相似的预设类型的消息,可以在账号集合中确定第一账号为目标账号,进而对目标账号进行处理,这样可以提高运营商对发送垃圾短信的手机号码的识别精度。在图2所示实施例的基础上,下面结合图4,对上述消息处理方法进行详细说明。图4为本申请实施例提供的另一种消息处理方法的流程示意图。请参见图4,该方法可以包括:s401、在第一消息集合中确定第二消息集合。需要说明的是,s401的执行过程可以参照s201的执行过程,此处不再进行赘述。s402、根据第二消息集合中各消息之间的相似度,将第二消息集合划分为至少一个第三消息集合。需要说明的是,s403的执行过程可以参照s203的执行过程,此处不再进行赘述。s403、获取第三消息集合中每个消息对应的第一账号。需要说明的是,s403的执行过程可以参照s203的执行过程,此处不再进行赘述。s404、在第一消息集合中确定每个第一账号对应的第一消息数量、第一账号在第三消息集合中对应的第二消息数量、第三消息集合中包括的第三消息数量。需要说明的是,s404的执行过程可以参照s204的执行过程,此处不再进行赘述。s405、获取第一预设关系,根据第一消息数量和第一预设关系,确定比例系数。第一预设关系包括多个消息数量和每个消息数量对应的比例系数。例如,第一预设关系可以如表2所示:表2消息数量比例系数消息数量1比例系数1消息数量2比例系数2消息数量3比例系数3…………需要说明的是,表2只是以示例的形式示意第一预设关系,并非对第一预设关系的限定。可选的,可以根据第一消息数量和第一预设关系,确定比例系数。例如,在第一消息集合中第一账号对应的第一消息数量为消息数量1时,对应的比例系数为比例系数1;在第一消息集合中第一账号对应的第一消息数量为消息数量2时,对应的比例系数为比例系数2;在第一消息集合中第一账号对应的第一消息数量为消息数量3时,对应的比例系数为比例系数3。可选的,比例系数的取值为0-1之间。s406、根据第一消息数量、比例系数和第三消息数量,确定第二阈值。可以根据如下可行的实现方式确定第二阈值:根据第一消息数量、比例系数和第三消息数量确定第二阈值。例如,根据第一消息数量与第三消息数量的比值与比例系数相乘,得到第二阈值。例如,第一消息集合中第一账号对应的第一消息数量为100,第一账号所在的第三消息集合中的第三消息数量为10,比例系数为0.3,则第二阈值为3。s407、判断第二消息数量是否大于或等于第二阈值。若否,则执行s408。若是,则执行s409。s408、确定第一账号不是目标账号。s409、在账号集合中确定第一账号为目标账号。可选的,在账号集合中确定与第一账号相同的账号为目标账号。本申请实施例提供的消息处理方法,在第一消息集合中确定第二消息集合,根据第二消息集合中各消息之间的相似度,将第二消息集合划分为至少一个第三消息结合,获取第三消息集合中每个消息对应的第一账号,并在第一消息集合中确定每个第一账号对应的第一消息数量、第一账号在第三消息集合中对应的第二消息数量、第三消息集合中包括的第三消息数量。获取第一预设关系,根据第一消息数量和第一预设关系,确定比例系数,并根据第一消息数量、比例系数和第三消息数量确定第二阈值,在第二消息数量大于或等于第二阈值时,在账号集合中确定第一账号为目标账号。在上述方法中,根据第二消息集合中各消息之间的相似度,可以准确的将第二消息集合划分为多个第三消息集合,进而根据第一消息数量、比例系数和第三消息数量可以确定的第二阈值,可以降低运营商对账号误封的概率,同时在第二消息数量大于或等于第二阈值时,说明第一账号发送过多个相似度较高的消息,可以在账号集合中确定第一账号为目标账号,进而对目标账号进行处理,这样可以提高运营商对发送垃圾短信的手机号码的识别精度。在上述任意一个实施例的基础上,下面,结合图5,通过具体示例,对消息处理方法进行详细说明。图5为本申请实施例提供的消息处理方法的过程示意图。请参见图5,包括第一消息集合、第二消息集合、第三消息集合a和第三消息集合b,其中,第一消息集合中包括多条消息,第二消息结合中包括8条预设类型的消息(图5中一个圆圈代表一条消息),第三消息集合a中包括4条预设类型的消息,第三消息集合b中包括4条预设类型的消息,消息1为第三消息集合a中的消息。第三消息集合a中的各消息之间字符属性的相似度大于或等于第一阈值,第三消息集合b中的各消息之间字符属性的相似度大于或等于第一阈值。请参见图5,在第一消息集合中筛选出符合预设类型的消息,组成第二消息集合。根据各消息的字符属性对第二消息集合中的各消息之间进行相似度处理,消息相似度越高,图5中各圆圈之间的距离越小。对第二消息集合中的各消息进行聚类处理,得到第三消息集合a和第三消息集合b,其中,第三消息集合a中的消息与第三消息集合b中的消息的相似度较低。确定第三消息集合a中的消息1对应的第一账号,并确定第一账号在第一消息集合中对应的第一消息数量。第三消息集合a中的消息数量为4,根据第一预设关系和第一消息数量,确定比例系数,根据第一消息数量、比例系数和第三消息集合a中的消息数量可以确定第二阈值。确定第一账号在第三消息集合a中对应的第二消息数量,在第二消息数量大于或等于第二阈值时,在账号集合中确定第一账号为目标账号。在第三消息集合a中第一账号对应的消息数量大于或等于第二阈值时,说明第一账号发送过多个字符属性相似的预设类型的消息,可以在账号集合中确定第一账号为目标账号,进而对目标账号进行处理,这样可以提高运营商对发送垃圾短信的手机号码的识别精度。图6为本申请实施例提供的一种消息处理装置的结构示意图。该消息处理装置可以设置在终端设备中。请参见图6,所述消息处理装置10包括:第一确定模块11、划分模块12、获取模块13和第二确定模块14,其中:所述第一确定模块11用于,在第一消息集合中确定第二消息集合,所述第一消息集合包括至少一个终端设备在预设时段内接收到的消息,所述第二消息集合中的消息为预设类型;所述划分模块12用于,根据所述第二消息集合中各消息之间的相似度,将所述第二消息集合划分为至少一个第三消息集合,所述第三消息集合中的各消息之间的相似度大于或等于第一阈值;所述获取模块13用于,获取所述第三消息集合中每个消息对应的第一账号,所述第一账号为终端设备发送所述消息所使用的账号;所述第二确定模块14用于,在所述第一消息集合中确定每个第一账号对应的第一消息数量、所述第一账号在所述第三消息集合中对应的第二消息数量、所述第三消息集合中包括的第三消息数量,在账号集合中确定目标账号,所述账号集合包括所述第二消息集合中的消息对应的账号。在一种可能的实施方式中,所述划分模块12具体用于:获取所述第二消息集合中各消息之间的相似度;根据所述相似度,对所述第二消息集合中的消息进行聚类处理,以将所述第二消息集合划分为至少一个第三消息集合。在一种可能的实施方式中,所述划分模块12具体用于:获取所述第二消息集合中各消息的字符属性,字符属性包括如下至少一种:所述消息中包括的字符数量或所述消息中包括的字符的笔画数;根据所述字符属性,确定所述第二消息集合中各消息之间的相似度。在一种可能的实施方式中,所述划分模块12具体用于:根据所述字符属性,确定所述第二消息集合中各消息之间的编辑距离;根据所述编辑距离,确定所述第二消息集合中各消息之间的相似度。在一种可能的实施方式中,所述第二确定模块14具体用于:根据所述第一消息数量、所述第三消息数量,确定第二阈值;根据所述第二消息数量和所述第二阈值,在账号集合中确定目标账号。在一种可能的实施方式中,所述第二确定模块14具体用于:获取第一预设关系,所述第一预设关系包括多个消息数量和每个消息数量对应的比例系数;根据所述第一消息数量和所述第一预设关系,确定比例系数;根据所述第一消息数量、所述比例系数和所述第三消息数量,确定第二阈值。在一种可能的实施方式中,所述第二确定模块14具体用于:判断所述第二消息数量是否大于第二阈值;若是,则在所述账号集合中确定所述第一账号为所述目标账号。本申请实施例提供的一种消息处理装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。图7为本申请实施例提供的消息处理设备的硬件结构示意图。请参见图7,该消息处理设备20可以包括:处理器21和存储器22,其中,处理器21和存储器22可以通信;示例性的,处理器21和存储器22通过通信总线23通信,所述存储器22用于存储程序指令,所述处理器21用于调用存储器中的程序指令执行上述任意方法实施例所示的消息处理方法。可选的,消息处理设备20还可以包括通信接口,通信接口可以包括发送器和/或接收器。可选的,上述处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。本申请实施例提供一种可读存储介质,所述可读存储介质上存储有计算机程序;所述计算机程序用于实现如上述任意实施例所述的消息处理方法。本申请实施例提供一种计算机程序产品,所述计算机程序产品包括指令,当所述指令被执行时,使得计算机执行上述消息处理方法。实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一可读取存储器中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储器(存储介质)包括:只读存储器(英文:read-onlymemory,缩写:rom)、ram、快闪存储器、硬盘、固态硬盘、磁带(英文:magnetictape)、软盘(英文:floppydisk)、光盘(英文:opticaldisc)及其任意组合。本申请实施例是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理单元以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理单元执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。显然,本领域的技术人员可以对本申请实施例进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请实施例的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。在本申请中,术语“包括”及其变形可以指非限制性的包括;术语“或”及其变形可以指“和/或”。本本申请中术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。本申请中,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1