网络业务用户群组划分的方法和装置的制造方法_2

文档序号:9527397阅读:来源:国知局
.+Xjn标准)τη;
[0065]其中QOj所有标准化数据中第j个统计指标的平均值;
[0066] 在最终确定的群组中,分别计算各个群组中各统计指标的平均值Qtlsm、Qt2s 准、......、Qtj标准、......、Qtm标准,其中t为群组序可,1 <t<k,Qtj标准为弟t个群组中弟j 个统计指标的平均值;
[0067] 分别计算各个群组中各个统计指标的偏差概率:
[0068] Ptl标准、Pt2 标准、......、Ptj标准、......、Ptm标准;
[0069] Ptj标准=(Qtj标准一Q0j标准)+Q0j标准;
[0070]其中,Ptjsm为第t个群组中第j个统计指标的偏差概率;
[0071] 比较Plj标准、P2j标准、……、Ptj标准、……、Pkj标准的大小,获取第j个统计指标中 偏差概率较其他群组差异最显著的群组,将第j个统计指标的数值特征作为该群组的群组 特征。
[0072] 在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以 执行以下操作:
[0073] 获取下一个统计周期的用户的属性和/或行为数据,并将下一个统计周期的用户 的属性和/或行为数据转换为标准化数据;
[0074] 将下一个统计周期的用户的标准化数据划分到距离最近的群组中心点所在群 组;
[0075] 根据下一个统计周期的用户所在群组的群组特征,向下一个统计周期的用户推送 对应群组特征的业务推送信息。
[0076] 本实施例图1所描述的网络业务用户群组划分的装置所在服务器,根据用户属性 和/或行为数据对用户群组进行精细划分,使划分后的群组具备各自的群组特征,划分更 加准确,使业务信息推送更加合理。
[0077] 如图2所示,图2为本发明网络业务用户群组划分的方法的第一实施例的流程图。 本实施例提到的网络业务用户群组划分的方法,包括步骤:
[0078] 步骤S10,获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属 性和/或行为数据包括多个统计指标,将属性和/或行为数据转换为标准化数据;
[0079] 用户在通过终端设备访问网络业务时,服务器会接收到对应的操作指令,并根据 这些操作指令执行对应的网络业务操作,同时,为了对用户进行合理划分群组,服务器还对 用户操作的数据进行统计,包括用户周期内访问总天数、周期内访问总次数、周期内访问总 时长、参与的附加项目总个数、投入资本等多个统计指标的数据,多个统计指标的属性和/ 或行为数据组合起来,构成该用户的属性和/或行为数据,该属性和/或行为数据包括多个 维度,即一个维度对应一个统计指标。由于各个统计指标的单位和统计标准不同,为了便于 群组划分,需将属性和/或行为数据中各个统计指标的属性和/或行为数据转换为统一标 准,即标准化数据。
[0080] 步骤S20,根据标准化数据,确定多个群组中心点,将标准化数据划分到距离最近 的群组中心点所在群组;
[0081] 按照预设的群组划分个数确定群组中心点的个数,每一个群组包括一个群组中心 点,群组中心点可从标准化数据中选取,也可以由标准化数据求均值、均方根等方式获得, 或采用k-means聚类算法获得。在确定群组中心点后,将每一个标准化数据与各个群组中 心点比较,找到距离该标准化数据最近的一个群组中心点,将该标准化数据划分到该群组 中心点所在群组中。
[0082] 步骤S30,根据各个群组中的标准化数据,确定各个群组的群组特征;
[0083] 在完成群组划分后,需对该组特点进行分析。每个标准化数据中都包括了多个统 计指标,各个群组中标准化数据存在差异,对各个群组中标准化数据的差异性进行分析,几 个确定该群组的群组特征。
[0084] 步骤S40,根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的 业务推送信息。
[0085] 在完成群组划分以及特征分析后,服务器根据特征制定推送方案,向各个群组的 用户终端推送相应特征的业务信息,例如在网络视频业务中,对于访问新闻类视频较多的 用户推送更新的新闻资讯,对于访问电视剧较多的用户推送最近更新的热播电视剧等。 [0086] 本实施例根据用户属性和/或行为数据对用户群组进行精细划分,使划分后的群 组具备各自的群组特征,划分更加准确,使业务信息推送更加合理。
[0087] 进一步的,步骤S10中,属性和/或行为数据包括:
[0088] U1 = (XII, X21, ......, Xjl, , Xml);
[0089] U2 = (X12, X22, ......, Xj2, , Xm2);
[0090] ......;
[0091] Ui = (Xli, X2i, ......, Xji, , Xmi);
[0092] ......;
[0093] Un = (Xln, X2n, ......, Xjn, , Xmn);
[0094] 其中,i为用户的序号,n为获取的用户总个数,Ui为第i个用户的属性和/或行 为数据,j为属性和/或行为数据的统计指标的序号,m为属性和/或行为数据的统计指标 的总个数,Xj为第j个统计指标的属性和/或行为数据,Xji为第i个用户的第j个统计指 标的属性和/或行为数据。
[0095] 例如,将上述属性和/或行为数据表示为下表:
[0096]
[0097] 进一步的,当属性和/或行为数据为连续型数据时,例如连续数字的取值范围,将 属性和/或行为数据转换为标准化数据采用以下公式:
[0098]Xji标准=(Xji-Xjmin) +(Xjmax-Xjmin);
[0099]Ui标准=(Xli标准,X2i标准,......,Xji标准,......,Xmi标准);
[0100] 其中,Xji转换后的标准化数据,Xjmax为当前统计周期内第j个统计指 标的所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期 内第j个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据。
[0101] 采用上述方式将连续型属性和/或行为数据中各个统计指标的属性和/或行为 数据转换为统一标准的标准化数据,有利于弱化各个统计指标的单位和统计标准不同的问 题,简化了多维度的属性和/或行为数据的计算难度,便于群组划分的处理流程。
[0102] 如图3所示,图3为本发明网络业务用户群组划分的方法的第一实施例中分类型 数据标准化的步骤流程图。本实施例的属性和/或行为数据为分类型数据,例如用户等级 分为一级、二级、三级,会员类型分为非会员、普通会员、高级会员,与图2所示实施例中对 连续型数据标准化所采用的方式不同,本实施例要将分类型的属性和/或行为数据转换为 标准化数据,可采用以下步骤:
[0103] 步骤S101,对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取 值分为一类,分类后的取值包括Yl、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e 为取值的分类序号,Ye为第e类取值;
[0104] 步骤S102,判断f是否小于或等于2 ;如果是,则执行步骤S103 ;如果否,则执行步 骤S106;
[0105] 步骤S103,判断Y1和Y2是否仅为0或1;如果是,则执行步骤S104;如果否,则执 行步骤S105;
[0106] 步骤S104,无需数值转换,原属性和/或行为数据作为标准化数据Xji;
[0107] 对于f小于或等于2,且Y1和Y2仅为0或1的情况,举例说明,假设统计指标为会 员类型,包括会员和非会员两类,则会员对应取值为1,非会员对应取值为〇,则无需数值转 换,原属性和/或行为数据作为标准化数据Xji。
[0108] 步骤S105,将Y1转换为0、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后 的数据作为标准化数据Xji;
[0109] 对于f小于或等于2,且Y1和Y2不仅仅为0和1的情况,举例说明,假设统计指标 为用户等级,包括一级用户和二级用户两类,一级用户对应数值为1,二级用户对应数值为 2,则需将其进行数值转换,使转换后的一级用户赋值为0 (或1),转换后的二级用户赋值为 1 (或 〇)。
[0110] 步骤S106,若属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、除Ye之 外的取值为〇,按照Y1、Y2、……、Ye、……、Yf的排列顺序,将属性和/或行为数据的取值 转换为f位的二值型数据,并将转换后的二值型数据乘以lAG,获得标准化数据Xji
[0111] 对于f大于2的情况,举例说明,假设统计指标为会员类型,包括普通会员、银卡会 员、金卡会员三类,则需将其进行数值转换,普通会员对应Y1、银卡会员对应Y2、金卡会员 对应Y3 ;用户U1为普通会员,则Y1 = 1、Y2 = 0、Y3 = 0,用户U1的会员类型的取值转换 后的二值型数据为(1,〇,〇);用户U2为银卡会员,则Y1 = 0、Y2 = 1、Y3 = 0,用户U2的会 员类型的取值转换后的二值型数据为(〇,1,〇);用户U3为金卡会员,则Y1 = 0、Y2 = 0、Υ3 =1,用户U3的会员类型的取值转换后的二值型数据为(0,0,1)。此外,在计算两个标准化 数据之间距离时,为了使距离范围在〇~1之间,对于f大于2的情况,在进行二值型数据 转换后,还需将转换后的二值型数据乘以,上述实施例中,用户U1的会员类型的 标准化数据为(Ι/Vi, 〇,〇),用户U2的会员类型的标准化数据为(0,1/& > 0),用户U1的 会员类型的标准化数据为(〇,〇,1/1 )。
[0112] 采用上述方式将分类型属性和/或行为数据中各个统计指标的属性和/或行为数 据转换为统一标准的标准化数据,使不同取值的统计指标采用〇~1的标准化数据代替,简 化了多维度的属性和/或行为数据的计算难度,便于群组划分的处理流程。
[0113] 如图4所示,图4为本发明网络业务用户群组划分的方法的第一实施例中划分群 组的步骤流程图。本实施例是对图2所示实施例中的步骤S20详细说明,采用k-means聚 类算法进行群组划分,其中群组中心点包括了初始群组中心点、修正群组中心点和最终群 组中心点,步骤S20具体包括以下步骤:
[0114] 步骤S201,从所有标准化数据中获取任一个作为第一个初始群组中心点C01;
[0115] 步骤S202,从除去C01之外的标准化数据中查找距离C01最远的标准化数据,作为 第二个初始群组中心点C02;
[0116] 在所有的标准化数据中除去已经被选为第一个初始群组中心点C01的数据,剩下 的数据分别与C01计算距离。两个标准化数据之间的距离采用欧氏距离公式计算,例如,取C01 =U1 = (XII,X21,......,Xjl,......,Xml),计算Ui= (Xli,X2i,......,Xji,......, Xmi)与C01之间的距离,可采用以下公式:
[0117]
[0118] Di值最大的标准化数据即为距离C01最远的标准化数据,作为第二个初始群组中 心点C02。
[0119] 步骤S203,从除去C01、C02之外的标准化数据中,计算各标准化数据分别 至C01的距离Dil和至C0
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1