运营商移动业务资源的优化方法与系统的制作方法

文档序号:6503462阅读:133来源:国知局
运营商移动业务资源的优化方法与系统的制作方法
【专利摘要】本发明公开了运营商移动业务资源的优化方法与系统。该方法包括:统计运营商客户历史拨打数据,拨打数据为连续变量;通过卡方分析将连续变量转变为离散的特征变量;以客户是否开通移动业务作为2值的分类变量,建立特征变量与分类变量的C4.5决策树模型,其中,在该决策树模型中,计算每一种分割所对应的信息增益率,选择信息增益率最大的分割阈值作为该属性的最佳分割阈值;根据该决策树模型,计算分类变量的取值,以获得客户是否开通移动业务的预测结果;根据预测结果对运营商的移动业务资源进行优化处理操作。通过本发明提供的技术方案,能够高效地从当前客户的拨打行为中,获得客户对移动业务的需求,以实现对运营商移动业务资源的优化部署。
【专利说明】运营商移动业务资源的优化方法与系统

【技术领域】
[0001] 本发明涉及通信领域,特别涉及一种运营商移动业务资源的优化方法与系统。

【背景技术】
[0002] 近年来,移动通信技术发展迅速。移动业务的运营商根据用户需求部署业务服务 器设备,以提供业务服务。
[0003] 运营商提供的业务是多元化的,运营商针对已有客户的使用需求,通常只有在该 客户购买新的移动号码或者签约新的移动业务时,才获知该需求。然而,这种方式对于移动 业务的业务资源部署存在滞后性,可能导致无法对移动业务资源的进行更优化的部署,例 如,无法满足用户需求,或者资源部署不合理导致系统负载不均衡。


【发明内容】

[0004] 根据本发明实施例的一个方面,所要解决的一个技术问题是:提供一种运营商移 动业务资源的优化方法与系统,以提供对运营商移动业务资源的优化部署。
[0005] 本发明实施例提供的一种运营商移动业务资源的优化方法,包括:
[0006] 统计运营商客户历史拨打数据,所述拨打数据为连续变量;
[0007] 通过卡方分析将所述连续变量转变为离散的特征变量;
[0008] 以所述客户是否开通移动业务作为2值的分类变量,建立所述特征变量与所述分 类变量的C4. 5决策树模型;其中,在所述C4. 5决策树模型中,将所述特征变量由小到大进 行排列,获得属性取值的属性取值序列{Alk,A2k,…,A" k},k为属性的个数,L为属性的取值 个数,从1种划分方式对应的1个分割点ai= (Aik+A(i+1)k)/2,计算每一种分割所对应的 信息增益率Gain_Ratio (Ak),选择其中信息增益率最大的分割阈值作为属性Ak的最佳分割 阈值 Thre sho 1 d (Ak);
[0009] 根据所述C4. 5决策树模型,计算所述分类变量的取值,以获得所述客户是否开通 移动业务的预测结果;
[0010] 根据所述预测结果对运营商的移动业务资源进行优化处理操作。
[0011] 本发明实施例提供的一种运营商移动业务资源的优化系统,包括:
[0012] 统计单元,用于统计客户历史拨打数据,所述拨打数据为连续变量;
[0013] 数据处理单元,用于通过卡方分析将所述连续变量转变为离散的特征变量;
[0014] 决策树建模单元,用于以所述客户是否开通移动业务作为2值的分类变量,建立 所述特征变量与所述分类变量的C4. 5决策树模型;其中,在所述C4. 5决策树模型中,将所 述特征变量由小到大进行排列,获得属性取值的属性取值序列{Alk,A2k,…,A" k},k为属性 的个数,L为属性的取值个数,从iyi种划分方式对应的iyi个分割点ai=(A ik+A(i+1)k)/2, 计算每一种分割所对应的信息增益率Gain_Ratio (Ak),选择其中信息增益率最大的分割阈 值作为属性Ak的最佳分割阈值Threshold (Ak);
[0015] 结果获取单元,用于根据所述C4. 5决策树模型,计算所述分类变量的取值,以获 得所述客户是否开通移动业务的预测结果;
[0016] 优化单元,用于根据所述预测结果对运营商的移动业务资源进行优化处理操作。
[0017] 基于本发明上述实施例提供的运营商移动业务资源的优化方法与系统,基于对 C4. 5算法中连续属性取值的离散化方法做了改进-局部最佳分割阈值选择法,从而使得决 策树的生成效率得到了提高,进一步,利用改进后的算法,利用所统计客户历史拨打数据, 高效地从当前客户的拨打行为中,获得客户对移动业务的需求,以实现对运营商移动业务 资源的优化部署,满足用户需求。
[0018] 通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其 优点将会变得清楚。

【专利附图】

【附图说明】
[0019] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 以根据这些附图获得其他的附图。
[0020] 同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际 的比例关系绘制的。相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一 个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0021] 构成说明书的一部分的附图描述了本发明的实施例,并且连同说明书一起用于解 释本发明的原理。
[0022] 参照附图,根据下面的详细描述,可以更加清楚地理解本发明,其中:
[0023] 图1示出本发明所提供的运营商移动业务资源的优化方法一种实施例的流程示 意图;
[0024] 图2示出本发明所提供的运营商移动业务资源的优化方法一种实施例的流程示 意图;
[0025] 图3示出本发明所提供的建立客户开通号码数量的线性预测模型一种实施例的 流程示意图;
[0026] 图4示出本发明所提供的建立线性预测模型的数据抽样过程的流程示意图;
[0027] 图5示出客户的拨打行为示意图;
[0028] 图6示出线性预测模型的R0C曲线示意图;
[0029] 图7示出本发明所提供的运营商移动业务资源的优化系统一种实施例的结构示 意图。

【具体实施方式】
[0030] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。应注 意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置不限制本发 明的范围。
[0031] 以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明 及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创 造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0032] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适 当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。
[0033] 在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不 是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
[0034] 参见图1所示,图1示出本发明所提供的运营商移动业务资源的优化方法一种实 施例的流程示意图。该实施例提供的运营商移动业务资源的优化方法,包括:
[0035] 101,统计客户历史拨打数据,拨打数据为连续变量。具体地,可以抽取部分客户拨 打明细数据作为建模的样本,分析拨打数据,从样本数据中统计出每个客户ID所拥有的电 信的〇个或者多个移动号码,或者内网固话拨打时长、频次,内网移动号码拨打时长、频次, 外网固话拨打时长、频次,外网移动号码拨打时长、频次。
[0036] 参见图5所示,该5图示出客户的拨打行为示意图,例如,包括号码之间的网内呼 口q,也包括与外网号码的呼叫。在一定时段的历史数据的基础上,能够分别统计每一个客户 ID的对内拨打频次、拨打时长、拨打金额、对外拨打频次、拨打时长、拨打金额、以及拨打的 最近时间等数据,并统计客户开通的移动号码数。示例性地,例如,以对内对外的拨打情况 作为特征变量,以建立一个分类模型。
[0037] 102,通过卡方分析将连续变量转变为离散的特征变量。
[0038] 103,以客户是否开通移动业务作为2值的分类变量(例如,未开通取值为0,开通 一个以上取值为1),建立特征变量与分类变量的C4. 5决策树模型;其中,在C4. 5决策树模 型中,将特征变量由小到大进行排列,获得属性取值的属性取值序列{Alk,A2k,…,A" k},k为 属性的个数,L为属性的取值个数,从iyi种划分方式对应的iyi个分割点ai=(A ik+A(i+1) k) /2,计算每一种分割所对应的信息增益率Gain_Ratio (Ak),选择其中信息增益率最大的 分割阈值作为属性Ak的最佳分割阈值Threshold (Ak)。
[0039] C4. 5决策树算法是基于信息论的机器学习方法,通过分析训练数据集,在整个数 据集上递归地建立一个决策树。在本发明中,103具体过程可以如下所描述的:
[0040] 以102获得的离散的特征变量作为整个数据集为T,可以根据实际需要对该数据 集进行分类,类别集为{Ap A2,…,Ak},每个类别对应一种属性,总共k个分类,对应的数据 子集为凡(1 < =i < =k)。令|T|为数据集T的样本数,|A」为数据集T中属于类别Ai的 样本数。各类别的先验概率SP^lAil/lTl,对数据集T进行分类所需要的信息熵为 :
[0041] KlAj, |A2|, . . , |Ak|)=-Σ (Pi*log2Pi) (1)
[0042] 属性Ak有Tj个不同的取值,构成属性值的取值序列{Alk, A2k,…,ATjk}。
[0043] 在该取值序列中共生成iyi个分割点,因此,对应有iyi种对数据集的划分方式。 第i (1彡i彡Tj)个分割点的取值为:
[0044] af (Aik+A(i+1)k)/2 (2)
[0045] 它将该节点上的数据集被划分为两个数据子集:[Alk,aj,(叫,ATJk)]
[0046] 属性Ak的iyi种分割中的每一种情况,都可以作为该属性的两个离散取值,重 新构造该属性的离散值,按照上述公式(2)计算每一种分割所对应的信息增益率Gain_ Ratio (Ak),选择其中信息增益率最大的分割阈值作为属性Ak的最佳分割阈值,即
[0047] Threshold (Ak) =Ak (3)
[0048] Gain_Ratio (Ak) =max {Gain_Ratio (a) } (4)
[0049] 其中,ak是ai彳目息增益率最大者。
[0050] 由于在衡量信息增益时,通常衡量特征能够为分类系统带来多少信息,带来信息 越多,该特征越重要。对于一个特征而言,系统拥有该特征与没有该特征的信息量将发生变 化。前、后信息量的差值为该特征给系统带来的信息量。
[0051] 在上述方法连续属性离散化过程中,通过快速选择一个最佳的划分阈值,避免了 对所有划分情况进行预测而占用大量时间。
[0052] 对比于在现有技术中,属性Ak可将数据集T划分为q个子集{1\,T2,··· ,m(j=l,2,?,q)中的样本在属性A k上具体具有相同的取值a#。|Τ」为子集L中的 样本数,|C/|为子集L中属于类别(^的样本数,则由描述属性A k划分数据集Τ所得信息 熵为:
[0053]

【权利要求】
1. 一种运营商移动业务资源的优化方法,包括: 统计运营商客户历史拨打数据,所述拨打数据为连续变量; 通过卡方分析将所述连续变量转变为离散的特征变量; 以所述客户是否开通移动业务作为2值的分类变量,建立所述特征变量与所述分类变 量的C4. 5决策树模型;其中,在所述C4. 5决策树模型中,将所述特征变量由小到大进行排 列,获得属性取值的属性取值序列{Alk,A2k,…,A" k},k为属性的个数,L为属性的取值个数, 从L-1种划分方式对应的iyi个分割点ai=(A ik+A(i+1)k)/2,计算每一种分割所对应的信息 增益率Gain_Ratio(A k),选择其中信息增益率最大的分割阈值作为属性Ak的最佳分割阈值 Threshold (Ak); 根据所述C4. 5决策树模型,计算所述分类变量的取值,以获得所述客户是否开通移动 业务的预测结果; 根据所述预测结果对运营商的移动业务资源进行优化处理操作。
2. 根据权利要求1所述的方法,还包括: 针对预测结果为开通移动业务的客户,根据所述客户的拨打数据,建立所述客户开通 号码数量的线性预测模型,其中,拨打数据为线性预测模型的自变量,客户开通号码数量为 因变量; 根据所述线性预测模型,获得所述客户开通移动号码数量的预测计算结果; 根据所述客户开通移动号码数量的预测计算结果,对运营商的移动业务资源进行优化 处理操作。
3. 根据权利要求2所述的方法,其中,建立所述客户开通号码数量的线性预测模型的 数据抽样过程包括: 将客户的拨打数据作为训练数据集,根据数据分割策略,将训练数据集分为预测数据 子集、验证数据子集和测试数据子集; 利用预测数据子集产生多种预测模型; 验证数据子集从所述多种预测模型中选择出一个最佳预测模型; 测试数据子集检验所述最佳预测模型的性能,响应于性能满足预定的要求,以所述最 佳预测模型作为所述客户开通号码数量的线性预测模型。
4. 根据权利要求3所述的方法,其中,所述数据分割策略,包括:定值分割或者自动分 割中的任意一种; 所述定值分割包括:根据预定的三个数据子集的大小和分割方式; 所述自动分割包括:随机地、顺序地或者周期性地将训练数据集数据分割至三个数据 子集。
5. 根据权利要求3所述的方法,其中,还包括: 利用受试者工作特征R0C曲线对所述最佳预测模型进行准确性检测,其中,在坐标轴 上,所述R0C曲线下房覆盖的面积大,准确性越高; 响应于准确性满足预定阈值,以所述最佳预测模型作为所述客户开通号码数量的线性 预测模型。
6. 根据权利要求1至5任意一项所述的方法,其中,所述拨打数据包括:内网固话拨打 时长、频次,内网移动号码拨打时长、频次,外网固话拨打时长、频次,外网移动号码拨打时 长、频次。
7. -种运营商移动业务资源的优化系统,包括: 统计单元,用于统计客户历史拨打数据,所述拨打数据为连续变量; 数据处理单元,用于通过卡方分析将所述连续变量转变为离散的特征变量; 决策树建模单元,用于以所述客户是否开通移动业务作为2值的分类变量,建立所述 特征变量与所述分类变量的C4. 5决策树模型;其中,在所述C4. 5决策树模型中,将所述特 征变量由小到大进行排列,获得属性取值的属性取值序列{Alk,A2k,…,A" k},k为属性的个 数,L为属性的取值个数,从1种划分方式对应的IV·· 1个分割点ai= (Aik+A(i+1)k) /2,计算 每一种分割所对应的信息增益率Gain_Ratio (Ak),选择其中信息增益率最大的分割阈值作 为属性Ak的最佳分割阈值Threshold (Ak); 结果获取单元,用于根据所述C4. 5决策树模型,计算所述分类变量的取值,以获得所 述客户是否开通移动业务的预测结果; 优化单元,用于根据所述预测结果对运营商的移动业务资源进行优化处理操作。
8. 根据权利要求7所述的系统,还包括: 号码数量计算单元,用于针对预测结果为开通移动业务的客户,根据所述客户的拨打 数据,建立所述客户开通号码数量的线性预测模型,其中,拨打数据为线性预测模型的自变 量,客户开通号码数量为因变量;根据所述线性预测模型,获得所述客户开通移动号码数量 的预测计算结果; 所述优化单元,还用于根据所述客户开通移动号码数量的预测计算结果,对运营商的 移动业务资源进行优化处理操作。
9. 根据权利要求8所述的系统,其中,所述号码数量计算单元,具体用于将客户的拨打 数据作为训练数据集,根据数据分割策略,将训练数据集分为预测数据子集、验证数据子集 和测试数据子集;利用预测数据子集产生多种预测模型;验证数据子集从所述多种预测模 型中选择出一个最佳预测模型;测试数据子集检验所述最佳预测模型的性能,响应于性能 满足预定的要求,以所述最佳预测模型作为所述客户开通号码数量的线性预测模型。
10. 根据权利要求9所述的系统,其中,所述数据分割策略,包括:定值分割或者自动分 割中的任意一种; 所述定值分割包括:根据预定的三个数据子集的大小和分割方式; 所述自动分割包括:随机地、顺序地或者周期性地将训练数据集数据分割至三个数据 子集。
11. 根据权利要求9所述的系统,其中,所述号码数量计算单元,还用于利用R0C曲线对 所述最佳预测模型进行准确性检测,其中,在坐标轴上,所述R0C曲线下房覆盖的面积大, 准确性越高;响应于准确性满足预定阈值,以所述最佳预测模型作为所述客户开通号码数 量的线性预测模型。
12. 根据权利要求7至11任意一项所述的系统,其中,所述拨打数据包括:内网固话拨 打时长、频次,内网移动号码拨打时长、频次,外网固话拨打时长、频次,外网移动号码拨打 时长、频次。
【文档编号】G06F19/00GK104217088SQ201310207885
【公开日】2014年12月17日 申请日期:2013年5月30日 优先权日:2013年5月30日
【发明者】曾庆怀, 苏淮, 朱国华, 张忠润, 崔毅杨, 周京, 刘奕红, 姚健, 吴一宁, 方捷, 张永, 卢美娴, 王晓华, 肖凤娜, 邬广林, 廖刘芳, 马刚均, 程晓歌, 谈新雁, 黄李强, 王玫, 夏惠君 申请人:中国电信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1