基于时空大数据的家庭成员关系识别的方法与流程

文档序号:37239918发布日期:2024-03-06 17:05阅读:30来源:国知局
基于时空大数据的家庭成员关系识别的方法与流程

本技术涉及大数据分析,尤其涉及基于时空大数据的家庭成员关系识别的方法。


背景技术:

1、常规技术中,通过预先训练的识别模型来分析用户的通话记录或者用户在社交平台的好友关系,来识别用户的家庭成员关系,或者通过宽带网络的使用数据来识别家庭成员关系;但是识别模型的训练成本高,而且易受到干扰,例如工作导致的通话频率高或者网友互动频率高,导致家庭成员关系识别不准确;而通过宽带使用数据来识别家庭成员关系的方法无法避免多家庭共用宽带的情况,导致家庭成员关系识别准确性低。

2、上述内容仅用于辅助理解本技术的技术方案,并不代表承认上述内容是现有技术。


技术实现思路

1、本技术的主要目的在于提供一种基于时空大数据的家庭成员关系识别的方法,旨在提高家庭成员关系识别的准确性。

2、为实现上述目的,本技术提供一种基于时空大数据的家庭成员关系识别的方法,所述基于时空大数据的家庭成员关系识别的方法包括:

3、基于预设数量的用户每天的预设数量的信令数据,得到预设数量的用户每天的用户轨迹,所述用户轨迹包括运动态用户轨迹和/或驻留态用户轨迹;

4、根据所述用户轨迹,确定在预设数量的用户中任意两用户之间每天的伴随关系,所述伴随关系包括运动态伴随关系和驻留态伴随关系;

5、基于预设天数内任意两用户之间的所述伴随关系,识别任意两用户之间是否存在家庭成员关系。

6、可选地,所述基于预设数量的用户每天的预设数量的信令数据,得到预设数量的用户每天的用户轨迹的步骤,包括:

7、获取任一用户当天的信令数据,若所述任一用户在任一基站小区内驻留时长超过预设驻留门限,则将所述任一用户在所述任一基站小区内驻留时的信令数据,输出为所述任一用户的驻留态运动轨迹。

8、可选地,所述基于预设数量的用户每天的预设数量的信令数据,得到预设数量的用户每天的用户轨迹的步骤,包括:

9、获取任一用户当天的信令数据,若所述任一用户至少连续经过预设数量的基站小区,且在每个基站小区的驻留时长均不超过预设驻留门限,且所述任一用户在连续经过的预设数量的基站小区中具有相似的运动方向,则至少将所述任一用户经过所述基站小区时的信令数据,输出为所述任一用户的运动态运动轨迹。

10、可选地,所述驻留态用户轨迹的轨迹信息包括驻留时段、驻点位置、驻留小区;所述根据所述用户轨迹,确定在预设数量的用户中任意两用户之间每天的伴随关系的步骤,包括:

11、对于任意两用户中其中一用户的第一驻留态用户轨迹,和另一用户的第二驻留态用户轨迹,若同时满足:

12、第一驻留态用户轨迹上的第一驻点位置,与第二驻留态用户轨迹上的第二驻点位置在驻留时段上存在交集,且存在交集的交集时长超过预设重叠时长门限;

13、所述第一驻点位置与所述第二驻点位置之间的距离小于预设驻点距离门限;

14、所述第一驻点位置与所述第二驻点位置的驻留小区存在交集,且存在交集的驻留小区的驻留时长之和超过预设驻留总时长门限;

15、则确定任意两用户之间当天存在驻留态伴随关系。

16、可选地,所述根据所述用户轨迹,确定在预设数量的用户中任意两用户之间每天的伴随关系的步骤,包括:

17、基于任意两用户当天的运动态用户轨迹,进行轨迹od检测和/或时空伴随检测,得到检测结果;

18、基于所述检测结果,确定任意两用户之间当天是否存在运动态伴随关系。

19、可选地,所述运动态用户轨迹的轨迹信息包括轨迹时间戳、途经路段、轨迹总距离;所述基于任意两用户当天的运动态用户轨迹,进行时空伴随检测,得到检测结果的步骤,包括:

20、基于任意两用户当天的途经路段确定重合路段;

21、基于任意两用户当天的所述重合路段上的轨迹时间戳,确定任意两用户到达和/或离开所述重合路段的时刻;

22、若任意两用户到达和/或离开所述重合路段的时间差小于预设差值门限,则确定所述重合路段为短距离伴随路段;

23、统计任意两用户当天的运动态用户轨迹上所述短距离伴随路段的伴随总距离;

24、基于所述伴随总距离和任意两用户当天的运动态用户轨迹的轨迹总距离,计算得到伴随距离比;

25、若所述伴随总距离大于预设总距离门限,且所述伴随距离比大于预设伴随距离门限,则确定检测结果为任意两用户存在时空伴随。

26、可选地,所述基于所述检测结果,确定任意两用户之间当天是否存在运动态伴随关系的步骤,包括:

27、若所述检测结果为任意两用户的轨迹od相同,且任意两用户存在时空伴随,则确定任意两用户之间当天的伴随关系为运动态伴随关系。

28、可选地,所述基于预设天数内任意两用户之间的所述伴随关系,识别任意两用户之间是否存在家庭成员关系的步骤,包括:

29、统计在预设天数内,任意两用户之间在预设夜间时段的所述伴随关系为所述驻留态伴随关系的第一天数;

30、统计在预设天数内,任意两用户之间在一天内预设夜间时段之外的其它时段,同时存在所述运动态伴随关系和所述驻留态伴随关系的第二天数;

31、若所述第一天数与预设天数之比大于预设第一比值门限,且所述第二天数与预设天数之比大于预设第二比值门限,则确定任意两用户之间存在家庭成员关系。

32、可选地,所述方法还包括:

33、将存在所述家庭成员关系的用户,输出至待聚类用户列表;

34、依次遍历所述待聚类用户列表;

35、若当前遍历用户与已遍历用户之间不存在所述家庭成员关系,则新建所述当前遍历用户的家庭组;

36、若当前遍历用户与已遍历用户之间存在所述家庭成员关系,则将所述当前遍历用户加入所述已遍历用户的家庭组。

37、可选地,所述方法还包括:

38、若所述当前遍历用户至少与第一家庭组中的一个或多个已遍历用户,以及,与第二家庭组中的一个或多个已遍历用户之间均存在家庭成员关系,则至少将所述第一家庭组和所述第二家庭组合并为一个新的家庭组,并将所述当前遍历用户加入所述新的家庭组。

39、本技术提供的基于时空大数据的家庭成员关系识别的方法,所述基于时空大数据的家庭成员关系识别的方法包括:基于预设数量的用户每天的预设数量的信令数据,得到预设数量的用户每天的用户轨迹,所述用户轨迹包括运动态用户轨迹和/或驻留态用户轨迹;根据所述用户轨迹,确定在预设数量的用户中任意两用户之间每天的伴随关系,所述伴随关系包括运动态伴随关系和驻留态伴随关系;基于预设天数内任意两用户之间的所述伴随关系,识别任意两用户之间是否存在家庭成员关系。

40、常规技术中,通常通过预先训练的识别模型来识别家庭成员关系,或者通过宽带的使用数据来判断长期共用同一宽带的用户为家庭成员,上述方法中,通过识别模型判断家庭成员关系的训练成本高,而且易受到干扰,无法确保识别准确性;而通过共用宽带判断家庭成员关系的方法忽略了不使用宽带以及例如合租和宿舍等共用宽带的情况,识别方法单一、覆盖人群不全面,导致识别效果差,准确性低。

41、与常规技术不同,本技术提供的一种基于时空大数据的家庭成员关系识别的方法,基于运营商提供的海量信令数据,得到预设数量用户的用户轨迹,确保数据来源的准确性,并且避免了覆盖人群不全面的问题,只要用户携带的智能终端与其他设备或网络进行通信,就会产生即时的信令数据,即使是共用同一个宽带,也能根据用户信令数据中唯一的用户标识区分不同用户,有效扩大覆盖群体广度;然后通过用户轨迹去判断任意两用户之间的用户轨迹交集情况,将识别得到的用户轨迹分为运动态用户轨迹和驻留态用户轨迹,根据任意两用户的运动态用户轨迹确定两用户之间的运动态伴随关系,根据任意两用户的确定两用户之间的驻留态伴随关系,最后,基于任意两用户之间的伴随关系,识别任意两用户之间是否存在家庭成员关系;以此,通过对用户的信令数据进行处理,扩大覆盖群体的广度;同时,在获取到用户轨迹的基础上,获取任意两用户之间的伴随数据,从而确定任意两用户之间是否存在家庭成员关系,不需要对模型进行训练,有效降低识别家庭成员关系的成本,提高家庭成员关系识别的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1