1.一种基于算法回填的用户标签稠密化方法,其特征在于,所述方法包括:
获取需要回填的用户群和用户标签对应的第一回填标签表;
利用Fpgrouth算法回填所述第一回填标签表;
获取需要回填的用户群和用户标签对应的第二回填标签表;
利用Itemcf算法回填所述第二回填标签表;
获取需要回填的用户群和用户标签对应的第三回填标签表;
利用Usercf算法回填所述第三回填标签表。
2.如权利要求1所述基于算法回填的用户标签稠密化方法,其特征在于,所述利用Fpgrouth算法回填所述第一回填标签表,包括:
进行基于全量用户的Fpgrouth算法关联规则计算,得到对应的标签关联规则置信度和支持度;
将满足置信度阀值和支持度阀值的数据回填所述第一回填标签表。
3.如权利要求1所述基于算法回填的用户标签稠密化方法,其特征在于,所述利用Itemcf算法回填所述第二回填标签表,包括:
所述利用Itemcf算法,基于皮尔逊系数获取标签相似度,以回填所述第二回填标签表。
4.如权利要求1所述基于算法回填的用户标签稠密化方法,其特征在于,所述利用Usercf算法回填所述第三回填标签表,包括:
所述利用Usercf算法,基于皮尔逊系数获取标签相似度和邻域值,以回填所述第三回填标签表。
5.如权利要求1-4中任一项所述基于算法回填的用户标签稠密化方法,其特征在于,所述用户标签包括如下的一种或多种:忠诚度、活跃度、报名类活动偏好、摇一摇活动偏好、养生爱好者、新闻爱好者、娱乐爱好者。
6.一种基于算法回填的用户标签稠密化装置,其特征在于,所述装置包括:
第一回填标签表获取单元,用于获取需要回填的用户群和用户标签对应的第一回填标签表;
Fpgrouth算法单元,用于利用Fpgrouth算法回填所述第一回填标签表;
第二回填标签表获取单元,用于获取需要回填的用户群和用户标签对应的第二回填标签表;
Itemcf算法单元,用于利用Itemcf算法回填所述第二回填标签表;
第三回填标签表获取单元,用于获取需要回填的用户群和用户标签对应的第三回填标签表;
Usercf算法单元,用于利用Usercf算法回填所述第三回填标签表。
7.如权利要求6所述基于算法回填的用户标签稠密化装置,其特征在于,
所述Fpgrouth算法单元,具体用于进行基于全量用户的Fpgrouth算法关联规则计算,得到对应的标签关联规则置信度和支持度;
将满足置信度阀值和支持度阀值的数据回填所述第一回填标签表。
8.如权利要求6所述基于算法回填的用户标签稠密化装置,其特征在于,
所述Itemcf算法单元,具体用于利用Itemcf算法,基于皮尔逊系数获取标签相似度,以回填所述第二回填标签表。
9.如权利要求6所述基于算法回填的用户标签稠密化装置,其特征在于,
所述Usercf算法单元,具体用于利用Usercf算法,基于皮尔逊系数获取标签相似度和邻域值,以回填所述第三回填标签表。
10.如权利要求6-9中任一项所述基于算法回填的用户标签稠密化装置,其特征在于,所述用户标签包括如下的一种或多种:忠诚度、活跃度、报名类活动偏好、摇一摇活动偏好、养生爱好者、新闻爱好者、娱乐爱好者。