骚扰通信账号的识别方法及装置的制造方法

文档序号:10539084阅读:317来源:国知局
骚扰通信账号的识别方法及装置的制造方法
【专利摘要】本发明实施例公开了一种骚扰通信账号的识别方法,包括:接收待识别的目标通信账号以及与所述目标通信账号对应的目标设备标识;获取骚扰号码库,所述骚扰号码库中存储了骚扰设备标识以及与所述骚扰设备标识对应的骚扰通信账号;在所述骚扰号码库中查找与所述目标设备标识匹配的骚扰设备标识,获取查找到的骚扰设备标识对应的骚扰通信账号;获取所述骚扰通信账号的第一通信记录和所述目标通信账号的第二通信记录,计算所述第一通信记录与所述第二通信记录的相似度,根据所述相似度判定所述目标通信账号是否为骚扰通信账号。另外,本发明实施例还相应地公开了一种骚扰通信账号的识别装置。采用本发明,可提高识别骚扰通信账号的准确率。
【专利说明】
骚扰通信账号的识别方法及装置
技术领域
[0001] 本发明涉及计算机技术领域,尤其涉及一种骚扰通信账号的识别方法及装置。
【背景技术】
[0002] 在现有的通信和互联网的快速发展给人们生活带来越来越多的便利,例如可以使 人与人的沟通成了随时随地的事,同时也给我们的生活带来更多的方便。与此同时,日益严 重的骚扰电话、推销号码、中介号码给广大群众的正常生活增添了不少麻烦。因此,需要一 种对骚扰电话号码识别的机制来减少骚扰电话对用户的干扰。
[0003] 传统技术中的骚扰电话识别机制基于云安全服务器。当手机呼出/呼入一个陌生 号码时,通过网络发起一次号码查询服务;服务器收到请求后,下发给后台查询模块,并匹 配号码标记数据库;如果当一个号码被标记数据库匹配到,并且标记骚扰次数(假设为Μ次) 大于等于给定的Ν次时,则返回骚扰电话和被标记次数;假如号码标记骚扰次数低于Ν或者 标记数据库没有记录时,则作为普通号码返回结果。
[0004] 然而,发明人经研究发现,当某一个骚扰电话号码被收录到云安全服务器数据库 后,骚扰分子拨打电话的成功率将会严重降低,但是骚扰分子通常会快速换一张新的手机 卡继续打电话。由于目前换电话号码的成本很低,骚扰分子可以随时买入大量的电话号码, 每当其中一个号码被识别为骚扰电话并被拦截后,直接使用另一个号码继续拨打电话。因 此,传统技术中的云安全服务器对于此种情况下的骚扰电话号码在识别时会遗漏,从而导 致识别骚扰电话号码的准确度不高。

【发明内容】

[0005] 基于此,为解决传统技术中骚扰用户通过更换电话号码等通信账号的方式来规避 云安全服务屏蔽的方式所导致的识别骚扰通信账号的准确度不高的技术问题,特提出了一 种骚扰通信账号的识别方法。
[0006] -种骚扰通信账号的识别方法,包括:
[0007] 接收待识别的目标通信账号以及与所述目标通信账号对应的目标设备标识;
[0008] 获取骚扰号码库,所述骚扰号码库中存储了骚扰设备标识以及与所述骚扰设备标 识对应的骚扰通信账号;
[0009] 在所述骚扰号码库中查找与所述目标设备标识匹配的骚扰设备标识,获取查找到 的骚扰设备标识对应的骚扰通信账号;
[0010] 获取所述骚扰通信账号的第一通信记录和所述目标通信账号的第二通信记录,计 算所述第一通信记录与所述第二通信记录的相似度,根据所述相似度判定所述目标通信账 号是否为骚扰通信账号。
[0011] 可选的,在其中一个实施例中,所述通信记录包括通信账号对应的在预设的通信 时间属性、通信对象属性和/或通信频率属性下的属性值。
[0012] 可选的,在其中一个实施例中,所述计算所述第一通信记录与所述第二通信记录 的相似度的步骤为:计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通 信对象属性和/或通信频率属性下的属性值的余弦相似度,以所述余弦相似度作为所述第 一通信记录与所述第二通信记录的相似度。
[0013] 可选的,在其中一个实施例中,所述计算第一通信记录与所述第二通信记录各自 在所述通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相似度为根据 公式:
[0014]
[0015] 计算余弦相似度S1U;其中,j和i分别表示目标通信账号和查找到的骚扰通信账号 的标识,K为通信时间属性、通信对象属性和/或通信频率属性的数量,fi, k和fj, k分别为第一 通信记录和第二通信记录在第k个属性下的属性值。
[0016]可选的,在其中一个实施例中,所述通信记录还包括通信账号对应的通信内容。 [0017]可选的,在其中一个实施例中,所述计算所述第一通信记录与所述第二通信记录 的相似度的步骤还包括:计算所述第一通信记录中的通信内容与所述第二通信记录的通信 内容的内容相似度,结合所述余弦相似度和所述内容相似度得到所述第一通信记录与所述 第二通信记录的相似度。
[0018] 可选的,在其中一个实施例中,所述根据所述相似度判定所述目标通信账号是否 为骚扰通信账号的步骤为:判断所述相似度是否大于阈值,若是,则判定所述目标通信账号 为骚扰通信账号。
[0019] 可选的,在其中一个实施例中,所述方法还包括:获取所述目标通信账号对应的举 报次数,在所述举报次数大于阈值时,判定所述目标通信账号为骚扰通信账号,将所述被判 定为骚扰通信账号的目标通信账号及其对应的目标设备标识添加到所述骚扰号码库中。
[0020] 可选的,在其中一个实施例中,所述目标通信账号为电话号码、即时通信应用的用 户账号或社交网络应用的用户账号。
[0021 ]可选的,在其中一个实施例中,所述方法还包括:在所述目标通信账号与所述查找 到的骚扰通信账号相同时,判定所述目标通信账号为骚扰通信账号。
[0022] 此外,为解决传统技术中骚扰用户通过更换电话号码等通信账号的方式来规避云 安全服务屏蔽的方式所导致的识别骚扰通信账号的准确度不高的技术问题,特提出了一种 骚扰通信账号的识别装置。
[0023] -种骚扰通信账号的识别装置,包括:
[0024] 目标设备标识接收模块,用于接收待识别的目标通信账号以及与所述目标通信账 号对应的目标设备标识;
[0025] 骚扰号码库获取模块,用于获取骚扰号码库,所述骚扰号码库中存储了骚扰设备 标识以及与所述骚扰设备标识对应的骚扰通信账号;
[0026] 骚扰通信账号获取模块,用于在所述骚扰号码库中查找与所述目标设备标识匹配 的骚扰设备标识,获取查找到的骚扰设备标识对应的骚扰通信账号;
[0027] 第一骚扰通信账号判定模块,用于获取所述骚扰通信账号的第一通信记录和所述 目标通信账号的第二通信记录,计算所述第一通信记录与所述第二通信记录的相似度,根 据所述相似度判定所述目标通信账号是否为骚扰通信账号。
[0028] 可选的,在其中一个实施例中,所述通信记录包括通信账号对应的在预设的通信 时间属性、通信对象属性和/或通信频率属性下的属性值。
[0029] 可选的,在其中一个实施例中,所述第一骚扰通信账号判定模块还用于计算第一 通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属 性下的属性值的余弦相似度,以所述余弦相似度作为所述第一通信记录与所述第二通信记 录的相似度。
[0030] 可选的,在其中一个实施例中,所述第一骚扰通信账号判定模块还用于根据公式:
[0031]
[0032] 计算余弦相似度S1U;其中,j和i分别表示目标通信账号和查找到的骚扰通信账号 的标识,K为通信时间属性、通信对象属性和/或通信频率属性的数量,fi, k和fj, k分别为第一 通信记录和第二通信记录在第k个属性下的属性值。
[0033] 可选的,在其中一个实施例中,所述通信记录还包括通信账号对应的通信内容。
[0034] 可选的,在其中一个实施例中,所述第一骚扰通信账号判定模块还用于计算所述 第一通信记录中的通信内容与所述第二通信记录的通信内容的内容相似度,结合所述余弦 相似度和所述内容相似度得到所述第一通信记录与所述第二通信记录的相似度。
[0035] 可选的,在其中一个实施例中,所述第一骚扰通信账号判定模块还用于判断所述 相似度是否大于阈值,在所述相似度大于阈值时,判定所述目标通信账号为骚扰通信账号。
[0036] 可选的,在其中一个实施例中,所述装置还包括骚扰通信账号添加模块,用于获取 所述目标通信账号对应的举报次数,在所述举报次数大于阈值时,判定所述目标通信账号 为骚扰通信账号,将所述被判定为骚扰通信账号的目标通信账号及其对应的目标设备标识 添加到所述骚扰号码库中。
[0037] 可选的,在其中一个实施例中,所述目标通信账号为电话号码、即时通信应用的用 户账号或社交网络应用的用户账号。
[0038] 可选的,在其中一个实施例中,所述装置还包括第二骚扰通信账号判定模块,用于 在所述目标通信账号与所述查找到的骚扰通信账号相同时,判定所述目标通信账号为骚扰 通信账号。
[0039] 实施本发明实施例,将具有如下有益效果:
[0040] 采用了上述骚扰通信账号的识别方法及装置之后,即使骚扰用户更换了手机号等 通信账号,但只要他仍然使用相同的设备传播骚扰信息,服务器也能够根据更换的手机号 的通信记录与已被标记为骚扰账号的通信记录的相似性,将更换的手机号识别为骚扰号 码,从而在骚扰用户采用低成本的更换通信账号的方式传播骚扰信息时,也能够准确地识 别出骚扰号码,从而提高了骚扰通信账号识别的准确性。
【附图说明】
[0041] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。
[0042] 其中:
[0043]图1为传统技术中依赖用户举报数据的云识别骚扰号码的系统架构图;
[0044] 图2为一个实施例中一种骚扰通信账号的识别方法的流程示意图;
[0045] 图3为一个实施例中一种骚扰通信账号的识别装置的结构示意图;
[0046] 图4为一个实施例中运行前述骚扰通信账号的识别方法的计算机设备的结构示意 图。
【具体实施方式】
[0047] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他 实施例,都属于本发明保护的范围。
[0048]传统技术中的依赖用户举报式的骚扰通信账号识别系统,如图1所示,终端上安装 有通话应用、即时通信应用或社交网络应用的客户端程序。例如,用户在使用手机上的通话 应用接听电话时,手机上的通话应用则将接听到的目标电话号码上传给处于云端的(用于 处理骚扰号码的服务器集群)服务器上。服务器根据目标电话号码的历史记录中被举报的 次数判定是否目标电话号码是否为骚扰号码。然后,服务器将根据用户举报检测到的骚扰 电话号码存储为:
[0049] Ρ={ρι,ρ2· · ·ρν}〇
[0050] 若需要识别某个号码是否为骚扰号码,则判断该号码是否属于Ρ={Ρ1,ρ2...ρΝ}, 若是则该号码被识别为骚扰号码。但是,若骚扰用户更换了电话卡从而更改了电话号码之 后,则存在j,则ρ庙中查询不到,因此,对骚扰用户更换电话号 码的方式,传统技术中只能等待漫长的举报过程才能对其进行识别,识别准确率较低。
[0051] 为解决传统技术中骚扰用户通过更换电话号码等通信账号的方式来规避云安全 服务屏蔽的方式所导致的识别骚扰通信账号的准确度不高的技术问题,特提出了一种骚扰 通信账号的识别方法。该方法的实现可依赖于计算机程序,该计算机程序可运行于基于冯 诺依曼体系的计算机系统之上,该计算机程序可以是手机自动屏蔽骚扰电话或者骚扰短信 的应用程序的服务器程序,或者该计算机程序也可以是社交网络应用的服务器程序,该执 行上述服务器程序的计算机系统可以是上述应用相应的服务器设备。
[0052] 具体的,如图2所示,该骚扰通信账号的识别方法包括:
[0053]步骤S102:接收待识别的目标通信账号以及与目标通信账号对应的目标设备标 识。
[0054]目标通信账号可以是电话号码、即时通信应用的用户账号或社交网络应用的用户 账号。
[0055] 在一个手机上自动屏蔽骚扰电话应用的应用场景中,自动屏蔽骚扰电话应用的客 户端程序在手机接收到呼叫时,则通过API得到接收到的呼叫的电话号码,然后将该电话号 码上传服务器作为目标通信账号输入。同时,也将该手机的设备标识,例如,IMEI号(即 International Mobile Equipment Identity,国际移动设备标识,全球唯一的设备标识 号)一并上传至服务器。
[0056] 而在一个即时通信应用或社交网络应用自动屏蔽骚扰用户或广告用户的应用场 景中,骚扰用户或广告用户通过即时通信应用或社交网络应用的客户端发布骚扰内容时, 服务器会接收到骚扰用户或广告用户的用户账号作为目标通信账号,同时,服务器也可通 过网络层获取骚扰用户或广告用户的MAC地址作为目标设备标识。
[0057] 步骤S104:获取骚扰号码库,骚扰号码库中存储了骚扰设备标识以及与骚扰设备 标识对应的骚扰通信账号。
[0058] 在本实施例中,骚扰号码库基于前述的骚扰通信账号识别系统中根据用户举报的 数据已统计的存储的骚扰通信账号的集合P得到:
[0059] Ρ={ρι,ρ2. . ·Ρν};
[0060] 另外,在建立骚扰号码库的过程中,还记录了相应的骚扰用户使用的设备的骚扰 设备标识:
[0061] M= {mi,m2· · .ι?ν}。
[0062] 相应的,在骚扰号码库中存储的骚扰设备标识以及与所述骚扰设备标识对应的骚 扰通信账号即为:
[0063] R(p,m) = {(pi,mi),(P2,m2) · · · (pN,mN)};
[0064] 号码pi与设备ΠΗ对应。
[0065] 步骤S106:在骚扰号码库中查找与目标设备标识匹配的骚扰设备标识,获取查找 到的骚扰设备标识对应的骚扰通信账号。
[0066] 也就是说,若目标通信账号ρ和目标设备标识m为(Pl,nu),且i运[1, i¥],则由于仍已 经存储于骚扰号码库中,因此可判定PlS骚扰通信账号。而若目标通信账号P和目标设备标 识m为( Pj,nu),即表示,持有骚扰设备nu的骚扰用户更换了电话卡,使用了新的电话号码W, 但是使用的手机仍然是原来的手机nu。
[0067] 在此情况下,若按照传统技术中的识别方式,由于为新更换的电话卡,用户的举 报资料还较少,因此无法识别出W为骚扰电话号码。而在本发明实施例中,则可通过前述的 骚扰号码库中的R(p, M)查找到与W对应同一骚扰设备nu的骚扰通信账号Pl。
[0068] 步骤S108:获取骚扰通信账号的第一通信记录和目标通信账号的第二通信记录, 计算第一通信记录与第二通信记录的相似度,根据相似度判定目标通信账号是否为骚扰通 信账号。
[0069] 通信账号的通信记录即为通信账号历史的通信记录或操作记录,其表示的是用户 在使用通信账号进行通信时的行为习惯。若两个通信账号的通信记录相似,则同一人使用 该通信账号进行通信可能性较大。因此,若目标通信账号与骚扰通信账号的通信记录的相 似度较高,例如,呼叫或发送消息的频率、时间点较吻合,则使用目标通信账号和骚扰通信 账号的用户很可能为同一人,即骚扰用户。
[0070] 在本实施例中,通信记录包括通信账号对应的在预设的通信时间属性、通信对象 属性和/或通信频率属性下的属性值。
[0071] 例如,在一个自动屏蔽骚扰电话的手机应用的应用场景中,由于骚扰电话号码相 比与正常的电话号码而言,主要具有以下特点:
[0072] 1.通信次数多或频率高(骚扰电话会向大量的设备发起呼叫)
[0073] 2.接听电话少(骚扰电话只呼叫他人,但很少有正常用户拨打骚扰电话)
[0074] 3.通话时间短(正常用户在接听骚扰电话之后通常会迅速挂断电话)
[0075] 4.被挂断几率高(正常用户在接听骚扰电话之后很大几率会挂断电话,而不会等 待骚扰用户挂断电话)
[0076] 介于骚扰电话的上述4个特点,在一个实施例中,可分别设定多个通信时间属性、 通信对象属性和/或通信频率属性来描述骚扰电话的通信行为。
[0077] 例如,通信时间属性可包括:日平均每次呼入时间、日平均每次呼出时间、周平均 每次呼入时间、周平均每次呼出时间、周{:一、二、三、四、五、六、天}平均每次呼入时间等属 性项。
[0078] 例如,通信对象属性包括:呼叫用户人数、接听用户人数、被挂断次数比例等属性 项。
[0079] 例如,通信频率属性包括:日呼入次数、日呼出次数、周呼入次数、周呼出次数、、周 {:一、二、三、四、五、六、天}呼入次数、周{:一、二、三、四、五、六、天}呼出次数、周卜、二、三、 四、五、六、天}等属性项。
[0080] 设定上述这些属性项之后,可分别获取目标通信账号W和骚扰通信账号?1在这些 属性项下的属性值,然后再通过比较这些属性值的相似度得到目标通信账号和骚扰通信账 号的通信记录的相似度。
[0081] 例如,可计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信 对象属性和/或通信频率属性下的属性值的余弦相似度,以所述余弦相似度作为所述第一 通信记录与所述第二通信记录的相似度。
[0082]具体的,可根据公式:
[0083]
[0084] 计算余弦相似度S1U。其中,j和i分别表示目标通信账号和查找到的骚扰通信账号 的标识。K为通信时间属性、通信对象属性和/或通信频率属性的数量。例如前述的预设的 "日平均每次呼出时间、周平均每次呼入时间、周平均每次呼出时间......."等多个属性项 的数量和分别为第一通信记录和第二通信记录在第k个属性下的属性值。
[0085] 若计算得到的S1U大于或等于阈值,则表示pjPPl的通信行为高度相似,可以判定 为均为同一骚扰用户使用,因此可以判定目标通信账号为骚扰通信账号。
[0086] 进一步的,对于使用电话号码发送骚扰短信,或者使用即时通信应用或社交网络 应用发送骚扰信息的用户,其骚扰行为除了上述骚扰电话的4个特点之外,还具有发送的内 容较单一的特点。
[0087] 例如,利用短信、QQ、微信群发骚扰信息或广告信息的用户,通常不是手动发送,而 是将一份文本信息复制多份,因此,即使用户的电话号码被屏蔽或QQ、微信账号被封,再使 用新的通信账号进行骚扰行为时,仍会发送相同的骚扰内容。因此,通信账号的通信记录还 包括通信账号对应的通信内容。
[0088] 而在本实施例中,计算所述第一通信记录与所述第二通信记录的相似度的步骤还 包括:
[0089] 计算所述第一通信记录中的通信内容与所述第二通信记录的通信内容的内容相 似度,结合所述余弦相似度和所述内容相似度得到所述第一通信记录与所述第二通信记录 的相似度。
[0090] 例如,在一个骚扰短信屏蔽应用或即时通信应用或社交网络应用的应用场景中, 可获取目标用户账号和骚扰用户账号的短信文本或消息文本,然后通过doc2 VeC等工具计 算短信文本或消息文本之间的相似度D1U,然后通过对S1U和D 1U加权得到第一通信记录和 第二通信记录整体的相似度。
[0091] 这样,对于短信、即时通信消息或社交网络应用消息等可以获取通信内容的情况, 在比较目标通信账号和骚扰通信账号的通信行为时,不仅可以从通信行为的习惯来比较, 还可以通过通信的实质内容来比较两者的相似性,从而可更加准确地判断目标通信账号和 骚扰通信账号是否为同一骚扰用户使用。
[0092] 进一步的,若本发明实施例也支持通过用户举报来判定目标通信账号是否为骚扰 通信账号。即,服务器可获取目标通信账号对应的举报次数,在举报次数大于阈值时,判定 目标通信账号为骚扰通信账号,将被判定为骚扰通信账号的目标通信账号及其对应的目标 设备标识添加到骚扰号码库中。
[0093] 也就是说,若相似度比较的阈值较高,则很可能有部分"漏网之鱼"被漏检,此时, 也可参考用户对目标通信账号的举报数据来判定骚扰用户。进一步的,还可根据举报数据 来确定相似度比较的阈值是否合理,若根据举报数据得出上述识别方式的"漏网之鱼"较 多,则可适当地调低阈值,从而使得识别的要求更加"严格",进一步地提高识别的准确度。
[0094] 此外,为解决传统技术中骚扰用户通过更换电话号码等通信账号的方式来规避云 安全服务屏蔽的方式所导致的识别骚扰通信账号的准确度不高的技术问题,在一个实施例 中,还提出了一种骚扰通信账号的识别装置,如图3所示,上述骚扰通信账号的识别装置包 括目标设备标识接收模块102、骚扰号码库获取模块104、骚扰通信账号获取模块106以及第 一骚扰通信账号判定模块108,其中:
[0095] 目标设备标识接收模块102,用于接收待识别的目标通信账号以及与目标通信账 号对应的目标设备标识;
[0096] 骚扰号码库获取模块104,用于获取骚扰号码库,骚扰号码库中存储了骚扰设备标 识以及与骚扰设备标识对应的骚扰通信账号;
[0097] 骚扰通信账号获取模块106,用于在骚扰号码库中查找与目标设备标识匹配的骚 扰设备标识,获取查找到的骚扰设备标识对应的骚扰通信账号;
[0098] 第一骚扰通信账号判定模块108,用于获取骚扰通信账号的第一通信记录和目标 通信账号的第二通信记录,计算第一通信记录与第二通信记录的相似度,根据相似度判定 目标通信账号是否为骚扰通信账号。
[0099] 在一个实施例中,通信记录包括通信账号对应的在预设的通信时间属性、通信对 象属性和/或通信频率属性下的属性值。
[0100] 在一个实施例中,第一骚扰通信账号判定模块108还用于计算第一通信记录与第 二通信记录各自在通信时间属性、通信对象属性和/或通信频率属性下的属性值的余弦相 似度,以余弦相似度作为第一通信记录与第二通信记录的相似度。
[0101] 在一个实施例中,第一骚扰通信账号判定模块108还用于根据公式:
[0102]
[0103] 计算余弦相似度S1U;其中,j和i分别表示目标通信账号和查找到的骚扰通信账号 的标识,K为通信时间属性、通信对象属性和/或通信频率属性的数量,fi, k和fj, k分别为第一 通信记录和第二通信记录在第k个属性下的属性值。
[0104] 在一个实施例中,通信记录还包括通信账号对应的通信内容。
[0105] 在一个实施例中,第一骚扰通信账号判定模块108还用于计算第一通信记录中的 通信内容与第二通信记录的通信内容的内容相似度,结合余弦相似度和内容相似度得到第 一通信记录与第二通信记录的相似度。
[0106] 在一个实施例中,第一骚扰通信账号判定模块108还用于判断相似度是否大于阈 值,在相似度大于阈值时,判定目标通信账号为骚扰通信账号。
[0107] 在一个实施例中,如图3所示,上述装置还包括骚扰通信账号添加模块110,用于获 取目标通信账号对应的举报次数,在举报次数大于阈值时,判定目标通信账号为骚扰通信 账号,将被判定为骚扰通信账号的目标通信账号及其对应的目标设备标识添加到骚扰号码 库中。
[0108] 在一个实施例中,目标通信账号为电话号码、即时通信应用的用户账号或社交网 络应用的用户账号。
[0109] 在一个实施例中,如图3所示,上述装置还包括第二骚扰通信账号判定模块112,用 于在目标通信账号与查找到的骚扰通信账号相同时,判定目标通信账号为骚扰通信账号。
[0110] 实施本发明实施例,将具有如下有益效果:
[0111] 采用了上述骚扰通信账号的识别方法及装置之后,即使骚扰用户更换了手机号等 通信账号,但只要他仍然使用相同的设备传播骚扰信息,服务器也能够根据更换的手机号 的通信记录与已被标记为骚扰账号的通信记录的相似性,将更换的手机号识别为骚扰号 码,从而在骚扰用户采用低成本的更换通信账号的方式传播骚扰信息时,也能够准确地识 别出骚扰号码,从而提高了骚扰通信账号识别的准确性。
[0112] 在一个实施例中,如图4所示,图4展示了一种运行上述骚扰通信账号的识别方法 的基于冯诺依曼体系的计算机系统的终端10。该计算机系统可以是智能手机、平板电脑、掌 上电脑,笔记本电脑或个人电脑等终端设备。具体的,可包括通过系统总线连接的外部输入 接口 1001、处理器1002、存储器1003和输出接口 1004。其中,外部输入接口 1001可选的可至 少包括网络接口 10012。存储器1003可包括外存储器10032(例如硬盘、光盘或软盘等)和内 存储器10034。输出接口 1004可至少包括显示屏10042等设备。
[0113] 在本实施例中,本方法的运行基于计算机程序,该计算机程序的程序文件存储于 前述基于冯诺依曼体系的计算机系统10的外存储器10032中,在运行时被加载到内存储器 10034中,然后被编译为机器码之后传递至处理器1002中执行,从而使得基于冯诺依曼体系 的计算机系统10中形成逻辑上的目标设备标识接收模块102、骚扰号码库获取模块104、骚 扰通信账号获取模块106、第一骚扰通信账号判定模块108、骚扰通信账号添加模块110以及 第二骚扰通信账号判定模块112。且在上述骚扰通信账号的识别方法执行过程中,输入的参 数均通过外部输入接口 1001接收,并传递至存储器1003中缓存,然后输入到处理器1002中 进行处理,处理的结果数据或缓存于存储器1003中进行后续地处理,或被传递至输出接口 1004进行输出。
[0114] 以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范 围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
【主权项】
1. 一种骚扰通信账号的识别方法,其特征在于,包括: 接收待识别的目标通信账号以及与所述目标通信账号对应的目标设备标识; 获取骚扰号码库,所述骚扰号码库中存储了骚扰设备标识以及与所述骚扰设备标识对 应的骚扰通信账号; 在所述骚扰号码库中查找与所述目标设备标识匹配的骚扰设备标识,获取查找到的骚 扰设备标识对应的骚扰通信账号; 获取所述骚扰通信账号的第一通信记录和所述目标通信账号的第二通信记录,计算所 述第一通信记录与所述第二通信记录的相似度,根据所述相似度判定所述目标通信账号是 否为骚扰通信账号。2. 根据权利要求1所述的骚扰通信账号的识别方法,其特征在于,所述通信记录包括通 信账号对应的在预设的通信时间属性、通信对象属性和/或通信频率属性下的属性值。3. 根据权利要求1所述的骚扰通信账号的识别方法,其特征在于,所述计算所述第一通 信记录与所述第二通信记录的相似度的步骤为: 计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/ 或通信频率属性下的属性值的余弦相似度,以所述余弦相似度作为所述第一通信记录与所 述第二通信记录的相似度。4. 根据权利要求3所述的骚扰通信账号的识别方法,其特征在于,所述计算第一通信记 录与所述第二通信记录各自在所述通信时间属性、通信对象属性和/或通信频率属性下的 属性值的余弦相似度为根据公式:计算余弦相似度S1, ^其中,j和i分别表示目标通信账号和查找到的骚扰通信账号的标 识,K为通信时间属性、通信对象属性和/或通信频率属性的数量,fi,k和fj,k分别通信记录和 第二通信记录在第k个属性下的属性值。5. 根据权利要求4所述的骚扰通信账号的识别方法,其特征在于,所述通信记录还包括 通信账号对应的通信内容。6. 根据权利要求5所述的骚扰通信账号的识别方法,其特征在于,所述计算所述第一通 信记录与所述第二通信记录的相似度的步骤还包括: 计算所述第一通信记录中的通信内容与所述第二通信记录的通信内容的内容相似度, 结合所述余弦相似度和所述内容相似度得到所述第一通信记录与所述第二通信记录的相 似度。7. 根据权利要求5所述的骚扰通信账号的识别方法,其特征在于,所述根据所述相似度 判定所述目标通信账号是否为骚扰通信账号的步骤为: 判断所述相似度是否大于阈值,若是,则判定所述目标通信账号为骚扰通信账号。8. 根据权利要求1至7任一项所述的骚扰通信账号的识别方法,其特征在于,所述方法 还包括: 获取所述目标通信账号对应的举报次数,在所述举报次数大于阈值时,判定所述目标 通信账号为骚扰通信账号,将所述被判定为骚扰通信账号的目标通信账号及其对应的目标 设备标识添加到所述骚扰号码库中。9. 根据权利要求1至7任一项所述的骚扰通信账号的识别方法,其特征在于,所述目标 通信账号为电话号码、即时通信应用的用户账号或社交网络应用的用户账号。10. 根据权利要求1至7任一项所述的骚扰通信账号的识别方法,其特征在于,所述方法 还包括: 在所述目标通信账号与所述查找到的骚扰通信账号相同时,判定所述目标通信账号为 骚扰通信账号。11. 一种骚扰通信账号的识别装置,其特征在于,包括: 目标设备标识接收模块,用于接收待识别的目标通信账号以及与所述目标通信账号对 应的目标设备标识; 骚扰号码库获取模块,用于获取骚扰号码库,所述骚扰号码库中存储了骚扰设备标识 以及与所述骚扰设备标识对应的骚扰通信账号; 骚扰通信账号获取模块,用于在所述骚扰号码库中查找与所述目标设备标识匹配的骚 扰设备标识,获取查找到的骚扰设备标识对应的骚扰通信账号; 第一骚扰通信账号判定模块,用于获取所述骚扰通信账号的第一通信记录和所述目标 通信账号的第二通信记录,计算所述第一通信记录与所述第二通信记录的相似度,根据所 述相似度判定所述目标通信账号是否为骚扰通信账号。12. 根据权利要求11所述的骚扰通信账号的识别装置,其特征在于,所述通信记录包括 通信账号对应的在预设的通信时间属性、通信对象属性和/或通信频率属性下的属性值。13. 根据权利要求11所述的骚扰通信账号的识别装置,其特征在于,所述第一骚扰通信 账号判定模块还用于计算第一通信记录与所述第二通信记录各自在所述通信时间属性、通 信对象属性和/或通信频率属性下的属性值的余弦相似度,以所述余弦相似度作为所述第 一通信记录与所述第二通信记录的相似度。14. 根据权利要求13所述的骚扰通信账号的识别装置,其特征在于,所述第一骚扰通信 账号判定模块还用于根据公式:计算余弦相似度S1, ^其中,j和i分别表示目标通信账号和查找到的骚扰通信账号的标 识,K为通信时间属性、通信对象属性和/或通信频率属性的数量,f1>k和分别为第一通信 记录和第二通信记录在第k个属性下的属性值。15. 根据权利要求14所述的骚扰通信账号的识别装置,其特征在于,所述通信记录还包 括通信账号对应的通信内容。16. 根据权利要求15所述的骚扰通信账号的识别装置,其特征在于,所述第一骚扰通信 账号判定模块还用于计算所述第一通信记录中的通信内容与所述第二通信记录的通信内 容的内容相似度,结合所述余弦相似度和所述内容相似度得到所述第一通信记录与所述第 二通信记录的相似度。17. 根据权利要求15所述的骚扰通信账号的识别装置,其特征在于,所述第一骚扰通信 账号判定模块还用于判断所述相似度是否大于阈值,在所述相似度大于阈值时,判定所述 目标通信账号为骚扰通信账号。18. 根据权利要求11至17任一项所述的骚扰通信账号的识别装置,其特征在于,所述装 置还包括骚扰通信账号添加模块,用于获取所述目标通信账号对应的举报次数,在所述举 报次数大于阈值时,判定所述目标通信账号为骚扰通信账号,将所述被判定为骚扰通信账 号的目标通信账号及其对应的目标设备标识添加到所述骚扰号码库中。19. 根据权利要求11至17任一项所述的骚扰通信账号的识别装置,其特征在于,所述目 标通信账号为电话号码、即时通信应用的用户账号或社交网络应用的用户账号。20. 根据权利要求11至17任一项所述的骚扰通信账号的识别装置,其特征在于,所述装 置还包括第二骚扰通信账号判定模块,用于在所述目标通信账号与所述查找到的骚扰通信 账号相同时,判定所述目标通信账号为骚扰通信账号。
【文档编号】H04M3/436GK105898085SQ201610206839
【公开日】2016年8月24日
【申请日】2016年4月5日
【发明人】李健, 王海波, 邵付东
【申请人】腾讯科技(深圳)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1