养卡识别方法、装置、电子设备和存储介质与流程

文档序号:35925534发布日期:2023-11-04 15:44阅读:29来源:国知局
养卡识别方法、装置、电子设备和存储介质与流程

本发明涉及通信,尤其涉及一种养卡识别方法、装置、电子设备和存储介质。


背景技术:

1、养卡指的是渠道代理商为了从运营商处获取酬金返利,把卡养起来当做真实用户使用,而养卡号码并没有真正被使用。养卡行为造成了业务蓬勃发展的假象,浪费了有限且宝贵的号码资源,使得营销资源被占用,运营商损失了酬金,更妨碍其他用户享受优惠政策,给业务运营及管理带来很多问题。基于此,需要进行养卡识别,以确定养卡号码,从而打击养卡行为。

2、目前,大多人工自定义养卡识别规则,从而根据养卡识别规则,识别渠道代理商的养卡行为,并确定养卡号码。然而,人工自定义的养卡识别规则存在滞后性和局限性,导致养卡识别的准确率不高。


技术实现思路

1、本发明提供一种养卡识别方法、装置、电子设备和存储介质,用以解决现有技术中养卡识别的准确率不高的缺陷,实现高准确率的养卡识别。

2、本发明提供一种养卡识别方法,包括:

3、基于样本号码集的指标数据,从待识别号码集中确定出行为特征对应的目标号码;

4、基于所述目标号码,确定养卡号码;

5、其中,所述行为特征包括联合养卡行为特征,所述联合养卡行为特征对应的目标号码是联合养卡群体对应的号码,所述联合养卡群体是基于所述待识别号码集的号码轨迹相似度和所述待识别号码集的号码轨迹相似度对应的相似度阈值,进行对比得到的;

6、所述相似度阈值是基于所述样本号码集的号码轨迹相似度、所述指标数据和贪心算法的损失函数进行迭代训练得到的。

7、根据本发明提供的一种养卡识别方法,所述相似度阈值基于如下方式迭代训练得到:

8、确定当前迭代轮次的样本相似度阈值;

9、基于所述样本号码集的号码轨迹相似度和所述样本相似度阈值,从所述样本号码集中确定出联合养卡社区对应的第一号码集和非联合养卡社区对应的第二号码集;

10、基于所述第一号码集和所述第二号码集的指标距离,以及所述损失函数,对所述样本相似度阈值进行更新,得到下一迭代轮次的样本相似度阈值,并将所述下一迭代轮次作为所述当前迭代轮次,直至所述当前迭代轮次为最后的迭代轮次,以得到所述相似度阈值,所述指标距离是基于所述指标数据确定的。

11、根据本发明提供的一种养卡识别方法,所述指标距离包括主被叫次数的距离、流量的距离和开机天数的距离中的至少一种。

12、根据本发明提供的一种养卡识别方法,所述联合养卡群体基于如下方式确定:

13、从所述待识别号码集中确定出当前对比轮次的第一待对比号码和第二待对比号码;

14、基于所述第一待对比号码在第一预设时间段内所通信的第一基站的基站数、所述第二待对比号码在第一预设时间段内所通信的第二基站的基站数,以及所述第一待对比号码和所述第二待对比号码在第一预设时间段内所通信的共同基站的基站数,确定所述第一待对比号码和所述第二待对比号码的号码轨迹相似度,所述第一待对比号码和所述第二待对比号码的号码轨迹相似度包括所述共同基站与所述第一基站的相似度、所述共同基站与所述第二基站的相似度和所述共同基站的出现天数中的至少一种;

15、将所述第一待对比号码和所述第二待对比号码的号码轨迹相似度与所述相似度阈值,进行对比得到对比结果;

16、返回从所述待识别号码集中确定出当前对比轮次的第一待对比号码和第二待对比号码的步骤,直至所述当前对比轮次为最后的对比轮次;

17、基于所述待识别号码集的各所述对比结果,确定所述联合养卡群体。

18、根据本发明提供的一种养卡识别方法,所述对端号码渠道集中行为特征对应的目标号码基于如下方式确定:

19、确定所述待识别号码集中各待识别号码的对端号码,以及所述各待识别号码的对端号码所处的第一目标渠道;

20、从所述各待识别号码集中确定出当前分析轮次的待分析号码,并基于所述各待识别号码的对端号码和所述第一目标渠道,确定所述待分析号码的对端号码在各渠道的号码数,以及所述待分析号码的对端号码在各渠道的号码占比;

21、在所述号码数和所述号码占比均满足第一预设条件的情况下,将所述待分析号码作为所述对端号码渠道集中行为特征对应的目标号码,所述第一预设条件是基于所述指标数据确定的;

22、返回从所述各待识别号码集中确定出当前分析轮次的待分析号码的步骤,直至所述当前分析轮次为最后的分析轮次。

23、根据本发明提供的一种养卡识别方法,所述行为特征还包括渠道异常行为特征,所述渠道异常行为特征对应的目标号码基于如下方式确定:

24、确定所述待识别号码集中各待识别号码所处的第二目标渠道;

25、基于所述各待识别号码、所述第二目标渠道和第二预设条件,确定所述渠道异常行为特征对应的目标号码;

26、其中,所述第二预设条件包括以下至少一种:

27、在同一渠道上且同一国际移动设备识别码imei的第一号码的号码数大于第一预设阈值的情况下,所述第一号码为渠道异常行为特征对应的目标号码;

28、在同一渠道上且同一基站的第二号码的号码数大于第二预设阈值的情况下,所述第二号码为渠道异常行为特征对应的目标号码;

29、在同一渠道上且同一第一对端号码的第三号码的号码数大于第三预设阈值的情况下,所述第三号码为渠道异常行为特征对应的目标号码,所述第一对端号码为所述第三号码所通信最多的号码;

30、在同一渠道上且具有互打行为的第四号码的号码数大于第四预设阈值,以及大于第五预设阈值的情况下,所述第四号码为渠道异常行为特征对应的目标号码,所述第五预设阈值是基于目标放号量与预设百分比相乘得到的,所述目标放号量为所述第四号码所处的渠道在第二预设时间段内的放号量;

31、所述第一预设阈值、所述第二预设阈值、所述第三预设阈值、所述第四预设阈值和所述预设百分比,是基于所述指标数据确定的。

32、根据本发明提供的一种养卡识别方法,所述行为特征还包括沉默行为特征,所述沉默行为特征对应的目标号码基于如下方式确定:

33、确定所述待识别号码集中各待识别号码的通话主叫时长、通话被叫时长、使用流量;

34、从所述待识别号码集中确定出所述通话主叫时长小于或等于预设主叫时长阈值,且所述通话被叫时长小于或等于预设被叫时长阈值,且所述使用流量小于或等于预设流量阈值的第五号码,将所述第五号码作为所述沉默行为特征对应的目标号码;

35、其中,所述预设主叫时长阈值、所述预设被叫时长阈值和所述预设流量阈值是基于所述指标数据确定的。

36、根据本发明提供的一种养卡识别方法,所述行为特征还包括正常号码行为特征,所述正常号码行为特征对应的目标号码基于如下方式确定:

37、确定所述待识别号码集中各待识别号码的月均充值金额;

38、从所述待识别号码集中确定出所述月均充值金额大于预设金额阈值的第六号码,将所述第六号码作为所述正常号码行为特征对应的目标号码;

39、其中,所述预设金额阈值是基于所述指标数据确定的。

40、根据本发明提供的一种养卡识别方法,所述目标号码包括异常号码和正常号码行为特征对应的号码,所述异常号码包括所述联合养卡群体对应的号码、对端号码渠道集中行为特征对应的号码、渠道异常行为特征对应的号码、沉默行为特征对应的号码;

41、所述基于所述目标号码,确定养卡号码,包括:

42、确定所述联合养卡群体对应的号码、所述对端号码渠道集中行为特征对应的号码、所述渠道异常行为特征对应的号码、所述沉默行为特征对应的号码的并集;

43、基于所述正常号码行为特征对应的号码,去除所述并集中的正常号码得到养卡号码。

44、根据本发明提供的一种养卡识别方法,所述指标数据包括用户基本信息、通话行为、数据业务、基站信息、消费特征、交际圈、渠道特征及开关机特征中的至少一种。

45、本发明还提供一种养卡识别装置,包括:

46、第一确定模块,用于基于样本号码集的指标数据,从待识别号码集中确定出行为特征对应的目标号码;

47、第二确定模块,用于基于所述目标号码,确定养卡号码;

48、其中,所述行为特征包括联合养卡行为特征,所述联合养卡行为特征对应的目标号码是联合养卡群体对应的号码,所述联合养卡群体是基于所述待识别号码集的号码轨迹相似度和所述待识别号码集的号码轨迹相似度对应的相似度阈值,进行对比得到的;

49、所述相似度阈值是基于所述样本号码集的号码轨迹相似度、所述指标数据和贪心算法的损失函数进行迭代训练得到的。

50、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述养卡识别方法。

51、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述养卡识别方法。

52、本发明提供的养卡识别方法、装置、电子设备和存储介质,基于样本号码集的指标数据,从待识别号码集中确定出行为特征对应的目标号码;基于目标号码,确定养卡号码。通过上述方式,可以进行养卡识别,确定养卡号码,而行为特征包括联合养卡行为特征,联合养卡群体是基于待识别号码集的号码轨迹相似度和待识别号码集的号码轨迹相似度对应的相似度阈值,进行对比得到的,进而确定联合养卡群体对应的号码为目标号码,且相似度阈值是基于样本号码集的号码轨迹相似度、指标数据和贪心算法的损失函数进行迭代训练得到的,从而可以基于号码轨迹相似度自动进行训练得到相似度阈值,无需人工定义养卡识别规则,提高了养卡识别的准确性和高效性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1