网络业务用户群组划分的方法和装置的制造方法_6

文档序号:9527397阅读:来源:国知局
,计算各标准化数据分别至C01的距离Dil 和至C02的距离Di2,选择Dil和Di2中较小值作为Ui标准至中心点集合{C01,C02}的距离, 比较各标准化数据至中心点集合{C01,C02}的距离的大小,选取至中心点集合{C01,C02} 的距离最大的标准化数据作为第三个初始群组中心点C03 ; 从除去C01、C02、C03之外的标准化数据中,计算各标准化数据分别至C01的距离 Dil、至C02的距离Di2和至C03的距离Di3,选择Dil、Di2和Di3中最小值作为Ui标准至中 心点集合{C01,C02,C03}的距离,比较各标准化数据至中心点集合{C01,C02,C03}的距离 的大小,选取至中心点集合{C01,C02,C03}的距离最大的标准化数据作为第四个初始群组 中心点C04 ; 以此类推,直至确定k个初始群组中心点C01、C02、……、C0k,其中k为预设的群组总 个数; 计算每一个标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最小的 初始群组中心点所在群组; 分别计算各个群组中标准化数据的平均值,分别作为第一次迭代后的k个修正群组中 心点 C11、C12、......、Clk; 计算每一个标准化数据至第一次迭代后的各修正群组中心点的距离,将标准化数据划 分到距离最小的修正群组中心点所在群组; 分别计算第一次迭代后各个群组中标准化数据的平均值,分别作为第二次迭代后的k 个修正群组中心点C21、C22、……、C2k; 以此类推,直至在计算本次迭代后的修正群组中心点与对应的前一次迭代后的修正群 组中心点之间的距离后,k个距离之和在预设范围内,或直至迭代次数达到预设次数,则将 本次迭代后的k个修正群组中心点作为最终群组中心点; 计算每一个标准化数据至各最终群组中心点的距离,将标准化数据划分到距离最小的 最终群组中心点所在群组。7. 如权利要求6所述的网络业务用户群组划分的方法,其特征在于,两个标准化数据 之间的距离为欧氏距离。8. 如权利要求4或5所述的网络业务用户群组划分的方法,其特征在于,所述根据各个 群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率,比较各个群组中同 一个统计指标的偏差概率大小,获取所述统计指标中偏差概率较其他群组差异最显著的群 组,将所述统计指标的数值特征作为该群组的群组特征的步骤包括: 计算所有标准化数据的各个统计指标的平均值:其中Q〇j?i为所有标准化数据中第j个统计指标的平均值; 在最终确定的群组中,分别计算各个群组中各统计指标的平均值Qtls?l、Qt2s?l、……、 Qtj标准、......、Qtme准,其中t为群组序号,1彡t彡k,Qtje准为第t个群组中第j个统计指 标的平均值; 分别计算各个群组中各个统计指标的偏差概率:其中,Ptjs?i为第t个群组中第j个统计指标的偏差概率; 比较Plj标准、P2j标准、……、Ptj标准、……、Pkj标准的大小,获取第j个统计指标中偏差概 率较其他群组差异最显著的群组,将第j个统计指标的数值特征作为该群组的群组特征。9. 如权利要求2所述的网络业务用户群组划分的方法,其特征在于,所述根据各个群 组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送信息的步骤之后还包 括: 获取下一个统计周期的用户的属性和/或行为数据,并将所述下一个统计周期的用户 的属性和/或行为数据转换为标准化数据; 将所述下一个统计周期的用户的标准化数据划分到距离最近的群组中心点所在群 组; 根据所述下一个统计周期的用户所在群组的群组特征,向所述下一个统计周期的用户 推送对应群组特征的业务推送信息。10. -种网络业务用户群组划分的装置,其特征在于,包括: 数据统计模块,用于获取多个用户在当前统计周期内的属性和/或行为数据,每个用 户的属性和/或行为数据包括多个统计指标; 数据转换模块,用于将所述属性和/或行为数据转换为标准化数据; 数据分组模块,用于根据所述标准化数据,确定多个群组中心点,将所述标准化数据划 分到距离最近的群组中心点所在群组; 特征确定模块,用于根据所述各个群组中的标准化数据,确定各个群组的群组特征; 信息推送模块,用于根据各个群组的群组特征,分别向各个群组的用户推送对应群组 特征的业务推送信息。11. 如权利要求10所述的网络业务用户群组划分的装置,其特征在于,所述特征确定 模块用于: 根据所述各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概率, 比较各个群组中同一个统计指标的偏差概率大小,获取所述统计指标的偏差概率较其他群 组差异最显著的群组,将所述统计指标的数值特征作为该群组的群组特征。12. 如权利要求11所述的网络业务用户群组划分的装置,其特征在于,所述数据统计 模块获取的属性和/或行为数据包括:其中,i为用户的序号,η为获取的用户总个数,Ui为第i个用户的属性和/或行为数 据,j为属性和/或行为数据的统计指标的序号,m为属性和/或行为数据的统计指标的总 个数,Xj为第j个统计指标的属性和/或行为数据,Xji为第i个用户的第j个统计指标的 属性和/或行为数据。13. 如权利要求12所述的网络业务用户群组划分的装置,其特征在于,当所述属性和/ 或行为数据为连续型数据时,所述数据转换模块采用以下公式将属性和/或行为数据转换 为标准化数据:其中,Xji 为Xji转换后的标准化数据,Xjmax为当前统计周期内第j个统计指标的 所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期内第j 个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据。14. 如权利要求12所述的网络业务用户群组划分的装置,其特征在于,当所述属性和/ 或行为数据为分类型数据时,所述数据转换模块采用以下方式将属性和/或行为数据转换 为标准化数据: 对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取值分为一类,分 类后的取值包括Y1、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e为取值的分类序 号,Ye为第e类取值; 判断f是否小于或等于2; 当f小于或等于2时,判断Y1和Y2是否仅为0或1 ; 如果是,则无需数值转换,原属性和/或行为数据作为标准化数据Xji ; 如果否,则将Y1转换为〇、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后的数据 作为标准化数据Xji ; 当f大于2时,若所述属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、除Ye 之外的取值为〇,按照Yl、Y2、……、Ye、……、Yf的排列顺序,将所述属性和/或行为数 据的取值转换为f位的二值型数据,并将转换后的二值型数据乘以ι/ν5,获得标准化数据 Xji标准。15. 如权利要求11所述的网络业务用户群组划分的装置,其特征在于,所述群组中心 点包括初始群组中心点、修正群组中心点和最终群组中心点;所述数据分组模块还用于: 从所有标准化数据中获取任一个作为第一个初始群组中心点coi; 从除去C01之外的标准化数据中查找距离C01最远的标准化数据,作为第二个初始群 组中心点C02 ; 从除去C01、C02之外的标准化数据中,计算各标准化数据分别至C01的距离Dil 和至C02的距离Di2,选择Dil和Di2中较小值作为Ui标准至中心点集合{C01,C02}的距离, 比较各标准化数据至中心点集合{C01,C02}的距离的大小,选取至中心点集合{C01,C02} 的距离最大的标准化数据作为第三个初始群组中心点C03 ; 从除去C01、C02、C03之外的标准化数据中,计算各标准化数据分别至C01的距离 Dil、至C02的距离Di2和至C03的距离Di3,选择Dil、Di2和Di3中最小值作为Ui标准至中 心点集合{C01,C02,C03}的距离,比较各标准化数据至中心点集合{C01,C02,C03}的距离 的大小,选取至中心点集合{C01,C02,C03}的距离最大的标准化数据作为第四个初始群组 中心点C04 ; 以此类推,直至确定k个初始群组中心点C01、C02、……、C0k,其中k为预设的群组总 个数; 计算每一个标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最小的 初始群组中心点所在群组; 分别计算各个群组中标准化数据的平均值,分别作为第一次迭代后的k个修正群组中 心点 C11、C12、......、Clk; 计算每一个标准化数据至第一次迭代后的各修正群组中心点的距离,将标准化数据划 分到距离最小的修正群组中心点所在群组; 分别计算第一次迭代后各个群组中标准化数据的平均值,分别作为第二次迭代后的k 个修正群组中心点C21、C22、……、C2k; 以此类推,直至在计算本次迭代后的修正群组中心点与对应的前一次迭代后的修正群 组中心点之间的距离后,k个距离之和在预设范围内,或直至迭代次数达到预设次数,则将 本次迭代后的k个修正群组中心点作为最终群组中心点; 计算每一个标准化数据至各最终群组中心点的距离,将标准化数据划分到距离最小的 最终群组中心点所在群组。16. 如权利要求15所述的网络业务用户群组划分的装置,其特征在于,两个标准化数 据之间的距离为欧氏距离。17. 如权利要求13或14所述的网络业务用户群组划分的装置,其特征在于,所述特征 确定模块还用于: 计算所有标准化数据的各个统计指标的平均值:其中Q〇j?i为所有标准化数据中第j个统计指标的平均值; 在最终确定的群组中,分别计算各个群组中各统计指标的平均值Qtls?l、Qt2s?l、……、 Qtj标准、......、Qtme准,其中t为群组序号,1彡t彡k,Qtje准为第t个群组中第j个统计指 标的平均值; 分别计算各个群组中各个统计指标的偏差概率:其中,Ptje?为第t个群组中第j个统计指标的偏差概率; 比较Plj标准、P2j标准、……、ptj标准、……、Pkj标准的大小,获取第j个统计指标中偏差概 率较其他群组差异最显著的群组,将第j个统计指标的数值特征作为该群组的群组特征。18.如权利要求11所述的网络业务用户群组划分的装置,其特征在于,所述数据统计 模块还用于,获取下一个统计周期的用户的属性和/或行为数据; 所述数据转换模块还用于,将所述下一个统计周期的用户的属性和/或行为数据转换 为标准化数据; 所述数据分组模块还用于,将所述下一个统计周期的用户的标准化数据划分到距离最 近的群组中心点所在群组; 所述信息推送模块还用于,根据所述下一个统计周期的用户所在群组的群组特征,向 所述下一个统计周期的用户推送对应群组特征的业务推送信息。
【专利摘要】本发明公开了一种网络业务用户群组划分的方法,包括步骤:获取多个用户在当前统计周期内的属性和/或行为数据,将属性和/或行为数据转换为标准化数据;根据标准化数据确定多个群组中心点,将标准化数据划分到距离最近的群组中心点所在群组;根据所述各个群组中的标准化数据,确定各个群组的群组特征;根据各个群组的群组特征,分别向各个群组的用户推送对应的业务推送信息。本发明还公开了一种网络业务用户群组划分的装置。本发明根据用户属性和/或行为数据对用户群组进行精细划分,使划分后的群组具备各自的群组特征,划分更加准确,使业务信息推送更加合理。
【IPC分类】H04L12/24, H04L12/18
【公开号】CN105281925
【申请号】CN201410307390
【发明人】杨向勇, 艾志兵, 刘黎春, 陈川
【申请人】腾讯科技(深圳)有限公司
【公开日】2016年1月27日
【申请日】2014年6月30日
【公告号】WO2016000562A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1