网络业务用户群组划分的方法和装置的制造方法

文档序号:9527397阅读:267来源:国知局
网络业务用户群组划分的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及到互联网技术领域,特别涉及到网络业务用户群组划分的方法和装 置。
【背景技术】
[0002] 随着互联网技术的发展,网络应用软件、网络游戏、网络资讯、网络视频等网络业 务被广泛应用,各种网络业务的用户数量众多,增长速度非常快,新老用户交替更新频率也 较高。为了进一步推广网络业务,运营商常常会向用户发送业务推广信息,以增加网络业务 及其附加业务的用户使用量。但是,现有的信息推送方式常常采用随机推送、全部推送等方 式,或者根据运营方经验来划分用户群组,针对不同的用户群组推送不同的信息。但是,由 于用户数量多,随机性较大,且每个时间段各用户关注的重点可能会发生变化,传统的划分 方式无法自适应的划分用户群组,可能会造成信息推广不合理,针对性较差,一方面达不到 信息推送目的,另一方面也会对用户造成困扰。

【发明内容】

[0003] 本发明实施例提供一种网络业务用户群组划分的方法和装置,使网络业务的用户 群组划分更加精细、合理。
[0004] 本发明实施例提出一种网络业务用户群组划分的方法,包括步骤:
[0005]获取多个用户在当前统计周期内的属性和/或行为数据,每个用户的属性和/或 行为数据包括多个统计指标,并将所述属性和/或行为数据转换为标准化数据;
[0006] 根据所述标准化数据,确定多个群组中心点,将所述标准化数据划分到距离最近 的群组中心点所在群组;
[0007] 根据所述各个群组中的标准化数据,确定各个群组的群组特征;
[0008] 根据各个群组的群组特征,分别向各个群组的用户推送对应群组特征的业务推送 信息。
[0009] 本发明实施例还提出一种网络业务用户群组划分的装置,包括:
[0010] 数据统计模块,用于获取多个用户在当前统计周期内的属性和/或行为数据,每 个用户的属性和/或行为数据包括多个统计指标;
[0011] 数据转换模块,用于将所述属性和/或行为数据转换为标准化数据;
[0012] 数据分组模块,用于根据所述标准化数据,确定多个群组中心点,将所述标准化数 据划分到距离最近的群组中心点所在群组;
[0013] 特征确定模块,用于根据所述各个群组中的标准化数据,确定各个群组的群组特 征;
[0014] 信息推送模块,用于根据各个群组的群组特征,分别向各个群组的用户推送对应 群组特征的业务推送信息。
[0015] 本发明实施例根据用户属性和/或行为数据对用户群组进行精细划分,使划分后 的群组具备各自的群组特征,划分更加准确,使业务信息推送更加合理。
【附图说明】
[0016] 图1为本发明实施例中网络业务用户群组划分的装置所在服务器的总线图;
[0017] 图2为本发明网络业务用户群组划分的方法的第一实施例的流程图;
[0018] 图3为本发明网络业务用户群组划分的方法的第一实施例中分类型数据标准化 的步骤流程图;
[0019] 图4为本发明网络业务用户群组划分的方法的第一实施例中划分群组的步骤流 程图;
[0020] 图5为本发明网络业务用户群组划分的方法的第一实施例中确定群组特征的步 骤流程图;
[0021] 图6为本发明网络业务用户群组划分的方法的第一实施例中确定群组特征的进 一步详细步骤流程图;
[0022] 图7为本发明网络业务用户群组划分的方法的第二实施例的流程图;
[0023] 图8为本发明实施例的网络业务用户群组划分的装置的结构示意图;
[0024] 图9为本发明实施例中同一个统计指标的各个群组的偏差概率的图表示意图。
[0025] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
【具体实施方式】
[0026] 应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0027] 如图1所示,图1为本发明实施例中网络业务用户群组划分的装置所在服务器的 总线图。该服务器可以包括:至少一个处理器101,例如CPU,至少一个网络接口 104,用户 接口 103,存储器105,至少一个通信总线102。其中,通信总线102用于实现这些组件之间 的连接通信。其中,用户接口 103可以包括显示屏(Display)、键盘(Keyboard),还可以包 括标准的有线接口、无线接口。网络接口 104可以包括标准的有线接口、无线接口(如WIFI 接口)。存储器105可以是高速RAM存储器,也可以是非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。存储器105还可以是至少一个位于远离前述处理器 101的存储装置。作为一种计算机存储介质的存储器105中可以包括操作系统、网络通信模 块、用户接口模块以及用户群组划分程序。
[0028] 在图1所示的网络业务用户群组划分的装置所在服务器中,网络接口 104主要用 于连接终端设备或其他服务器,与终端设备或其他服务器进行数据通信;而用户接口 103 主要用于接收管理员、运营商等用户指令,并与管理员、运营商等用户进行交互;而处理器 101可以用于调用存储器105中存储的用户群组划分程序,并执行以下操作:
[0029] 通过网络接口 104获取多个用户在当前统计周期内的属性和/或行为数据,每个 用户的属性和/或行为数据包括多个统计指标;
[0030] 将属性和/或行为数据转换为标准化数据;
[0031] 根据标准化数据,确定多个群组中心点,将标准化数据划分到距离最近的群组中 心点所在群组;
[0032]根据所述各个群组中的标准化数据,确定各个群组的群组特征;
[0033] 根据各个群组的群组特征,通过网络接口 104分别向各个群组的用户推送对应群 组特征的业务推送信息。
[0034] 在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以 执行以下操作 :
[0035] 根据所述各个群组中的标准化数据,分别计算各个群组中各个统计指标的偏差概 率,比较各个群组中同一个统计指标的偏差概率大小,获取所述统计指标的偏差概率较其 他群组差异最显著的群组,将所述统计指标的数值特征作为该群组的群组特征。
[0036] 在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以 执行以下操作 :
[0037] 当所述属性和/或行为数据为连续型数据时,采用以下公式将属性和/或行为数 据转换为标准化数据:
[0038]Xji标准=(Xji-Xjmin) +(Xjmax-Xjmin);
[0039]Ui标准=(Xli标准,X2i标准,......,Xji标准,......,Xmi标准);
[0040] 其中,Xji转换后的标准化数据,Xjrnax为当前统计周期内第j个统计指 标的所有属性和/或行为数据中数值最大的属性和/或行为数据,Xjmin为当前统计周期 内第j个统计指标的所有属性和/或行为数据中数值最小的属性和/或行为数据;
[0041] 在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以 执行以下操作 :
[0042] 当所述属性和/或行为数据为分类型数据时,采用以下方式将属性和/或行为数 据转换为标准化数据:
[0043] 对同一个统计指标中属性和/或行为数据的取值进行分类,相同的取值分为一 类,分类后的取值包括Yl、Y2、……、Ye、……、Yf,其中f为取值分类总个数,e为取值的 分类序号,Ye为第e类取值;
[0044] 判断f是否小于或等于2;
[0045] 当f小于或等于2时,判断Y1和Y2是否仅为0或1;
[0046] 如果是,则无需数值转换,原属性和/或行为数据作为标准化数据Xji;
[0047] 如果否,则将Y1转换为0、Y2转换为1,或将Y1转换为1、Y2转换为0,将转换后的 数据作为标准化数据Xji;
[0048] 当f大于2时,若所述属性和/或行为数据的取值为Ye,则使Ye对应的取值为1、 除Ye之外的取值为〇,按照Y1、Y2、……、Ye、……、Yf的排列顺序,将所述属性和/或行 为数据的取值转换为f位的二值型数据,并将转换后的二值型数据乘以l/V^,获得标准化 数据Xji?!。
[0049] 在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以 执行以下操作 :
[0050] 从所有标准化数据中获取任一个作为第一个初始群组中心点C01 ;
[0051] 从除去C01之外的标准化数据中查找距离C01最远的标准化数据,作为第二个初 始群组中心点C02;
[0052] 从除去C01、C02之外的标准化数据中,计算各标准化数据Ui_分别至C01的距离 Dil和至C02的距离Di2,选择Dil和Di2中较小值作为Ui标准至中心点集合{C01,C02}的 距离,比较各标准化数据至中心点集合{C01,C02}的距离的大小,选取至中心点集合{C01,C02}的距离最大的标准化数据作为第三个初始群组中心点C03;
[0053] 从除去C01、C02、C03之外的标准化数据中,计算各标准化数据Ui_分别至C01的 距离Dil、至C02的距离Di2和至C03的距离Di3,选择Dil、Di2和Di3中最小值作为Ui标 准至中心点集合{C01,C02,C03}的距离,比较各标准化数据至中心点集合{C01,C02,C03} 的距离的大小,选取至中心点集合{C01,C02,C03}的距离最大的标准化数据作为第四个初 始群组中心点C04;
[0054] 以此类推,直至确定k个初始群组中心点C01、C02、......、⑶k,其中k为预设的群 组总个数;
[0055] 计算每一个标准化数据至各初始群组中心点的距离,将标准化数据划分到距离最 小的初始群组中心点所在群组;
[0056] 分别计算各个群组中标准化数据的平均值,分别作为第一次迭代后的k个修正群 组中心点C11、C12、......、Clk;
[0057] 计算每一个标准化数据至第一次迭代后的各修正群组中心点的距离,将标准化数 据划分到距离最小的修正群组中心点所在群组;
[0058] 分别计算第一次迭代后各个群组中标准化数据的平均值,分别作为第二次迭代后 的k个修正群组中心点C21、C22、……、C2k;
[0059] 以此类推,直至在计算本次迭代后的修正群组中心点与对应的前一次迭代后的修 正群组中心点之间的距离后,k个距离之和在预设范围内,或直至迭代次数达到预设次数, 则将本次迭代后的k个修正群组中心点作为最终群组中心点;
[0060] 计算每一个标准化数据至各最终群组中心点的距离,将标准化数据划分到距离最 小的最终群组中心点所在群组。
[0061] 在一个实施例中,处理器101调用存储器105中存储的用户群组划分程序还可以 执行以下操作 :
[0062] 计算所有标准化数据的各个统计指标的平均值:
[0063]Q01标准、Q02标准、......、Q〇J·标准、......、Q〇m标准:
[0064] Q〇j标准=(Xjl标准+Xj2 标准 +.....
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1