一种参数确定方法和装置与流程

文档序号:14835902发布日期:2018-06-30 12:23阅读:来源:国知局
一种参数确定方法和装置与流程

技术特征:

1.一种参数确定方法,其特征在于,包括:

从样本用户群组的访问日志和/或用户行为数据中提取每个用户的多个属性及每个所述属性的实际值,所述属性的种类是预置的;

按预置的属性顺序对所述样本用户群组依次进行拆分;

在每个属性对应的拆分过程中,通过判断每个用户的实际值是否在预置范围内将母用户群组拆分成两个子用户群组,并以是否为付费用户为判断标准计算两个子用户群组的混合度,然后将两个所述子用户群组作为下一个属性对应拆分过程中的两个母用户群组,所述预置范围与所述属性对应,所述母用户群组初始为样本用户群组,拆分形成的两个所述子用户群组对应一个混合度;

当出现混合度为0的两个子用户群组时或所述样本用户群组经过所有属性的拆分后,判定所述属性顺序对应的拆分结束;

将混合度最小的用户群组中付费用户多的用户群组对应的所述属性、所述属性顺序和所述实际值,作为成为付费用户潜在可能性大的普通用户的参数,所述用户群组包括拆分形成的所有子用户群组和样本用户群组。

2.根据权利要求1所述的参数确定方法,其特征在于,以是否为付费用户为判断标准计算两个子用户群组的混合度具体包括:

以是否为付费用户为判断标准计算两个子用户群组的基尼不纯度;

以是否为付费用户为判断标准计算两个子用户群组的熵。

3.根据权利要求1所述的参数确定方法,其特征在于,预置的所述属性顺序有多种;

所述用户群组包括样本用户群组和按每个所述属性顺序拆分形成的所有子用户群组。

4.根据权利要求1所述的参数确定方法,其特征在于,每个所述属性对应多个所述预置范围;

通过判断每个用户的实际值是否在预置范围内将母用户群组拆分成两个子用户群组,并以是否为付费用户为判断标准计算两个子用户群组的混合度,然后将两个所述子用户群组作为下一个属性对应拆分过程中的两个母用户群组具体包括:

对于每个所述预置范围,均通过判断每个用户的实际值是否在预置范围内将母用户群组拆分成两个子用户群组,并以是否为付费用户为判断标准计算两个子用户群组的混合度;

将混合度最小的两个子用户群组作为下一个属性对应拆分过程中的两个母用户群组。

5.根据权利要求1所述的参数确定方法,其特征在于,还包括:

计算所述样本用户群组的混合度;

将所述样本用户群组的混合度与所述用户群组的最小混合度比较,若差值在预设范围内,则改变所述属性的种类、改变预置的所述属性顺序、重新选取样本用户群组后或改变至少一个所述属性对应的所述预置范围,重新进行参数确定。

6.一种参数确定装置,其特征在于,包括:

取值单元,用于从样本用户群组的访问日志和/或用户行为数据中提取每个用户的多个属性及每个所述属性的实际值,所述属性的种类是预置的;

拆分单元,用于按预置的属性顺序对所述样本用户群组依次进行拆分,在每个属性对应的拆分过程中,通过判断每个用户的实际值是否在预置范围内将母用户群组拆分成两个子用户群组,然后将两个所述子用户群组作为下一个属性对应拆分过程中的两个母用户群组,所述预置范围与所述属性对应,所述母用户群组初始为样本用户群组,拆分形成的两个所述子用户群组对应一个混合度;

混合度计算单元,用于在每个属性对应的拆分过程中,以是否为付费用户为判断标准计算两个子用户群组的混合度;

判定单元,用于当出现混合度为0的两个子用户群组时或所述样本用户群组经过所有属性的拆分后,判定所述属性顺序对应的拆分结束;

确定单元,用于将混合度最小的用户群组中付费用户多的用户群组对应的所述属性、所述属性顺序和所述实际值,作为成为付费用户潜在可能性大的普通用户的参数,所述用户群组包括拆分形成的所有子用户群组和样本用户群组。

7.根据权利要求6所述的参数确定装置,其特征在于,所述混合度计算单元具体用于:

以是否为付费用户为判断标准计算两个子用户群组的基尼不纯度;

以是否为付费用户为判断标准计算两个子用户群组的熵。

8.根据权利要求6所述的参数确定装置,其特征在于,预置的所述属性顺序有多种;

所述用户群组包括样本用户群组和按每个所述属性顺序拆分形成的所有子用户群组。

9.根据权利要求6所述的参数确定装置,其特征在于,当每个所述属性对应多个所述预置范围时,所述拆分单元具体用于:

按预置的属性顺序对所述样本用户群组依次进行拆分,在每个属性对应的拆分过程中,对于每个所述预置范围,均通过判断每个用户的实际值是否在预置范围内将母用户群组拆分成两个子用户群组,并以是否为付费用户为判断标准计算两个子用户群组的混合度;

将混合度最小的两个子用户群组作为下一个属性对应拆分过程中的两个母用户群组。

10.根据权利要求6所述的参数确定装置,其特征在于,还包括:优化单元;

所述混合度计算单元,还用于计算所述样本用户群组的混合度;

所述优化单元,用于将所述样本用户群组的混合度与所述用户群组的最小混合度比较,若差值在预设范围内,则改变所述属性的种类、改变预置的所述属性顺序、重新选取样本用户群组后或改变至少一个所述属性对应的所述预置范围,重新进行参数确定。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1