性别预测方法、装置、设备、存储介质和系统与流程

文档序号:33946728发布日期:2023-04-26 08:29阅读:43来源:国知局
性别预测方法、装置、设备、存储介质和系统与流程

本技术涉及通信,尤其涉及一种性别预测方法、装置、设备、存储介质和系统。


背景技术:

1、目前,同一用户拥有多个移动终端的现象越来越普遍。在办理手机号卡业务实行实名制认证后,一证多卡模式应运而生。一证多卡是指同一有效身份信息可以办理多张手机号卡。然而,由于一证多卡的存在,导致部分一证多卡的副卡用户的性别存在误差。

2、现有的确认用户性别的方法,主要为通过语音外呼等方式向用户进行确认,或者以问卷调查、入户统计等方式来确定。

3、然而,现有的确定用户性别的方法存在时间成本高、人力资源消耗大且准确性低的缺陷。


技术实现思路

1、本技术提供一种性别预测方法、装置、设备、存储介质和系统,用以解决现有的确定用户性别的方法存在的时间成本高、人力资源消耗大且准确性低的缺陷。

2、第一方面,本技术提供一种性别预测方法,包括:

3、获取待预测用户的终端信令数据、通话数据和上网行为数据;

4、根据所述终端信令数据、通话数据和上网行为数据,获取所述待预测用户的用户特征,所述用户特征包括位置特征、通话特征、上网行为特征和身份特征;

5、将所述用户特征输入至性别预测模型中,得到所述待预测用户的性别预测结果;其中,所述性别预测模型是用于预测性别的分类模型。

6、可选的,所述根据所述终端信令数据、通话数据和上网行为数据,获取所述待预测用户的用户特征,包括:

7、根据所述终端信令数据中的位置信令,获取所述位置特征;

8、根据所述通话数据,获取所述通话特征,所述通话特征包括预设时间段内的男性通话信息、女性通话信息或满足预设通话条件的用户的性别信息中的至少一个;

9、根据所述上网行为数据,获取所述上网行为特征,所述上网行为特征包括访问满足预设条件的app的访问信息,所述访问信息包括访问时长、访问流量或访问次数中的至少一个;

10、根据所述终端信令数据、通话数据和上网行为数据,获取所述身份特征。

11、可选的,所述根据所述终端信令数据、通话数据和上网行为数据,获取所述身份特征,包括:

12、根据所述终端信令数据,获取所述待预测用户的移动速度,并根据所述移动速度获取所述待预测用户的第一候选身份特征;

13、根据所述通话数据中的通话记录,获取所述待预测用户的第二候选身份特征;

14、根据所述上网行为数据中的不同类型app的访问信息,获取所述待预测用户的第三候选身份特征;

15、根据所述第一候选身份特征、所述第二候选身份特征和所述第三候选身份特征,确定所述身份特征。

16、可选的,所述根据所述终端信令数据,获取所述待预测用户的移动速度,包括:

17、根据所述终端信令数据,获取所述待预测用户在预设时间段内的每次移动时的移动距离和移动时长;

18、根据每次移动时的移动距离和移动时长,获取总移动距离和总移动时长;

19、根据所述总移动距离和总移动时长,获取所述移动速度。

20、可选的,所述根据所述移动速度获取所述待预测用户的第一候选身份特征,包括:

21、根据所述移动速度所属的速度范围获取所述待预测用户的第一候选身份特征,其中,不同的速度范围对应不同的身份特征。

22、可选的,所述根据所述通话数据中的通话记录,获取所述待预测用户的第二候选身份特征,包括:

23、根据所述通话数据中的通话记录,获取预设时间段内通过虚拟号码通话的通话次数;

24、根据所述通话次数所属的次数范围,获取所述待预测用户的第二候选身份特征,其中,不同的次数范围对应不同的身份特征。

25、可选的,所述根据所述上网行为数据中的不同类型app的访问信息,获取所述待预测用户的第三候选身份特征,包括:

26、根据所述上网行为数据中的不同类型app的访问信息,获取预设时间段内每种类型的app的访问次数;

27、获取访问次数大于预设次数的app类型,并根据所述app类型获取第三候选身份特征,其中,不同app类型对应不同的身份特征。

28、可选的,所述根据所述第一候选身份特征、所述第二候选身份特征和所述第三候选身份特征,确定所述身份特征之前,所述方法还包括:

29、将第一向量中对应所述第一候选身份特征的位置处的元素取值为1;

30、将第二向量中对应所述第二候选身份特征的位置处的元素取值为1;

31、将第三向量中对应所述第三候选身份特征的位置处的元素取值为1;

32、所述根据所述第一候选身份特征、所述第二候选身份特征和所述第三候选身份特征,确定所述身份特征,包括:

33、将所述第一向量、所述第二向量和所述第三向量同一位置处的元素的取值相乘,得到所述身份特征。

34、可选的,所述分类模型为deepfm模型。

35、第二方面,本技术提供一种性别预测装置,包括:

36、获取模块,用于获取待预测用户的终端信令数据、通话数据和上网行为数据;

37、所述获取模块,还用于根据所述终端信令数据、通话数据和上网行为数据,获取所述待预测用户的用户特征,所述用户特征包括位置特征、通话特征、上网行为特征和身份特征;

38、预测模块,用于将所述用户特征输入至性别预测模型中,得到所述待预测用户的性别预测结果;其中,所述性别预测模型是用于预测性别的分类模型。

39、可选的,所述获取模块,具体用于根据所述终端信令数据中的位置信令,获取所述位置特征;

40、所述获取模块,具体用于根据所述通话数据,获取所述通话特征,所述通话特征包括预设时间段内的男性通话信息、女性通话信息或满足预设通话条件的用户的性别信息中的至少一个;

41、所述获取模块,具体用于根据所述上网行为数据,获取所述上网行为特征,所述上网行为特征包括访问满足预设条件的app的访问信息,所述访问信息包括访问时长、访问流量或访问次数中的至少一个;

42、所述获取模块,具体用于根据所述终端信令数据、通话数据和上网行为数据,获取所述身份特征。

43、可选的,所述获取模块,具体用于根据所述终端信令数据,获取所述待预测用户的移动速度,并根据所述移动速度获取所述待预测用户的第一候选身份特征;

44、所述获取模块,具体用于根据所述通话数据中的通话记录,获取所述待预测用户的第二候选身份特征;

45、所述获取模块,具体用于根据所述上网行为数据中的不同类型app的访问信息,获取所述待预测用户的第三候选身份特征;

46、所述性别预测装置还包括:确定模块;

47、所述确定模块,用于根据所述第一候选身份特征、所述第二候选身份特征和所述第三候选身份特征,确定所述身份特征。

48、可选的,所述获取模块,具体用于根据所述终端信令数据,获取所述待预测用户在预设时间段内的每次移动时的移动距离和移动时长;

49、所述获取模块,具体用于根据每次移动时的移动距离和移动时长,获取总移动距离和总移动时长;

50、所述获取模块,具体用于根据所述总移动距离和总移动时长,获取所述移动速度。

51、可选的,所述获取模块,具体用于根据所述移动速度所属的速度范围获取所述待预测用户的第一候选身份特征,其中,不同的速度范围对应不同的身份特征。

52、可选的,所述获取模块,具体用于根据所述通话数据中的通话记录,获取预设时间段内通过虚拟号码通话的通话次数;

53、所述获取模块,具体用于根据所述通话次数所属的次数范围,获取所述待预测用户的第二候选身份特征,其中,不同的次数范围对应不同的身份特征。

54、可选的,所述获取模块,具体用于根据所述上网行为数据中的不同类型app的访问信息,获取预设时间段内每种类型的app的访问次数;

55、所述获取模块,具体用于获取访问次数大于预设次数的app类型,并根据所述app类型获取第三候选身份特征,其中,不同app类型对应不同的身份特征。

56、可选的,所述性别预测装置,还包括:设置模块;

57、所述设置模块,用于将第一向量中对应所述第一候选身份特征的位置处的元素取值为1;将第二向量中对应所述第二候选身份特征的位置处的元素取值为1;将第三向量中对应所述第三候选身份特征的位置处的元素取值为1;

58、所述获取模块,具体用于将所述第一向量、所述第二向量和所述第三向量同一位置处的元素的取值相乘,得到所述身份特征。

59、可选的,所述分类模型为deepfm模型。

60、第三方面,本技术提供一种性别预测设备,包括:

61、存储器;

62、处理器;

63、其中,所述存储器存储计算机执行指令;

64、所述处理器执行所述存储器存储的计算机执行指令,以实现如上述第一方面及第一方面各种可能的实现方式所述的性别预测方法。

65、第四方面,本技术提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现如上述第一方面及第一方面各种可能的实现方式所述的性别预测方法。

66、本技术提供的性别预测方法,通过获取待预测用户的终端信令数据、通话数据和上网行为数据;根据所述终端信令数据、通话数据和上网行为数据,获取所述待预测用户的用户特征,所述用户特征包括位置特征、通话特征、上网行为特征和身份特征;将所述用户特征输入至性别预测模型中,得到所述待预测用户的性别预测结果;其中,所述性别预测模型是用于预测性别的分类模型;该方法能够准确地预测出用户的性别,大大地提高了对潜在用户分析的准确率,且节省了人力资源成本,适用性强。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1