数据分析方法、装置、设备和计算机存储介质与流程

文档序号:20033222发布日期:2020-02-28 10:41阅读:来源:国知局

技术特征:

1.一种数据分析方法,其特征在于,该方法包括:

从目标应用的用户行为数据中,获取流失用户的行为数据;

从所述流失用户的行为数据中提取用户行为特征,构成各流失用户的特征向量;

基于特征向量之间的距离对所述流失用户进行聚类,得到一个以上的用户簇;

分别针对各用户簇分析主成分特征,以确定各用户簇的主要流失原因。

2.根据权利要求1所述的方法,其特征在于,所述从目标应用的用户行为数据中,获取流失用户的行为数据包括:

从目标应用的用户行为数据中,确定在预设的连续时长内没有用户行为数据的用户为流失用户。

3.根据权利要求2所述的方法,其特征在于,从所述流失用户的行为数据中提取用户行为特征包括:

从所述预设连续时长之前所述流失用户最后n次使用目标应用的行为数据中提取用户行为特征,所述n为预设的正整数。

4.根据权利要求1所述的方法,其特征在于,所述分别针对各用户簇分析主成分特征包括:

确定各用户行为特征在各用户簇下的信息增益;

将用户簇下满足预设要求的信息增益对应的用户行为特征作为主成分特征。

5.根据权利要求1或4所述的方法,其特征在于,确定各用户簇的主要流失原因包括:

将用户簇主成分特征所反映的原因,确定为该用户簇的主要流失原因。

6.根据权利要求5所述的方法,其特征在于,所述确定各用户行为特征在各用户簇下的信息增益包括:

利用用户行为特征在所有流失用户的信息熵与该用户行为特征在用户簇的信息熵的差值,确定该用户行为特征在该用户簇下的信息增益。

7.根据权利要求1所述的方法,其特征在于,该方法还包括:

对各用户簇的主要流失原因进行汇总,得到所述目标应用的流失原因分布。

8.根据权利要求1~7任一项所述的方法,其特征在于,所述目标应用为地图类应用;

所述用户行为数据包括用户轨迹数据;

所述用户行为特征包括以下至少一种:

用户最后一次导航的估时误差比、途中偏航次数、终点附近偏航次数、用户实际轨迹和规划轨迹的重合比例。

9.根据权利要求8所述的方法,其特征在于,在从所述流失用户的行为数据中提取用户行为特征之前,还包括:

对所述流失用户的轨迹数据进行以下数据清洗中的至少一种:

过滤掉行进速度低于预设速度阈值的轨迹数据;

过滤掉轨迹点缺失比例超过预设比例阈值的轨迹数据;

将流失用户的轨迹数据匹配到道路单元上,过滤掉匹配失败的轨迹数据;

将流失用户的轨迹数据匹配到道路单元上,过滤掉匹配数据的稀疏状况高于预设标准的道路单元相关的轨迹数据。

10.一种数据分析装置,其特征在于,该装置包括:

用户确定单元,用于从目标应用的用户行为数据中,获取流失用户的行为数据;

特征提取单元,用于从所述流失用户的行为数据中提取用户行为特征,构成各流失用户的特征向量;

用户聚类单元,用于基于特征向量之间的距离对所述流失用户进行聚类,得到一个以上的用户簇;

原因分析单元,用于分别针对各用户簇分析主成分特征,以确定各用户簇的主要流失原因。

11.根据权利要求10所述的装置,其特征在于,所述用户确定单元,具体用于从目标应用的用户行为数据中,确定在预设的连续时长内没有用户行为数据的用户为流失用户。

12.根据权利要求11所述的装置,其特征在于,所述特征提取单元,具体用于从所述预设连续时长之前所述流失用户最后n次使用目标应用的行为数据中提取用户行为特征,所述n为预设的正整数。

13.根据权利要求10所述的装置,其特征在于,所述原因分析单元,具体用于:确定各用户行为特征在各用户簇下的信息增益;将用户簇下满足预设要求的信息增益对应的用户行为特征作为主成分特征;将用户簇主成分特征所反映的原因,确定为该用户簇的主要流失原因。

14.根据权利要求13所述的装置,其特征在于,所述原因分析单元,具体用于利用用户行为特征在所有流失用户的信息熵与该用户行为特征在用户簇的信息熵的差值,确定该用户行为特征在该用户簇下的信息增益。

15.根据权利要求10所述的装置,其特征在于,该装置还包括:

汇总单元,用于对各用户簇的主要流失原因进行汇总,得到所述目标应用的流失原因分布。

16.根据权利要求10~15任一所述的装置,其特征在于,所述目标应用为地图类应用;

所述用户行为数据包括用户轨迹数据;

所述用户行为特征包括以下至少一种:

用户最后一次导航的估时误差比、途中偏航次数、终点附近偏航次数、用户实际轨迹和规划轨迹的重合比例。

17.根据权利要求16所述的装置,其特征在于,该装置还包括:

数据清洗单元,用于对所述流失用户的轨迹数据进行以下数据清洗中的至少一种:

过滤掉行进速度低于预设速度阈值的轨迹数据;

过滤掉轨迹点缺失比例超过预设比例阈值的轨迹数据;

将流失用户的轨迹数据匹配到道路单元上,过滤掉匹配失败的轨迹数据;

将流失用户的轨迹数据匹配到道路单元上,过滤掉匹配数据的稀疏状况高于预设标准的道路单元相关的轨迹数据。

18.一种电子设备,其特征在于,包括:

至少一个处理器;以及

与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1~9中任一项所述的方法。

19.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行权利要求1~9中任一项所述的方法。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1