移动互联网用户投诉的预测方法和装置的制造方法_3

文档序号:9375970阅读:来源:国知局
设阈值可预先设定,如可以0. 9,0. 95等数值,也可以为其他表征分类结 果理想的数值。
[0088] 具体地,本实施例中,步骤202d可分为以下两个步骤执行。
[0089] 步骤202dl,若投诉准确率大于预设阈值,则确定构建的投诉预测模型为验证后的 投诉预测模型。
[0090] 本实施例中,若投诉准确率大于预设阈值,则说明构建的投诉预测模型分类结果 比较理想,将构建的投诉预测模型确定为验证后的投诉预测模型。
[0091] 步骤202d2,若投诉准确率不大于预设阈值,则依次执行以下操作:调整投诉预测 模型中关于每个投诉相关特征的权重,将每个训练样本输入到调整后的投诉预测模型中, 确定每个训练样本对应的调整后的投诉风险值;根据每个训练样本对应的调整后的投诉风 险值和投诉真实值,计算调整后的投诉准确率,直到调整后的投诉准确率大于预设阈值,则 停止操作。
[0092] 具体地,本实施例中,若投诉准确率不大于预设阈值,则说明构建的投诉预测模型 的分类结果不理想,原因可能是在设置关于每个投诉相关特征的权重时,并没有与移动互 联网用户投诉所看重的内容相匹配。
[0093] 为了很好的与移动用户投诉所看重的内容相匹配,首先,可根据移动用户投诉的 实际原因调整投诉模型中关于投诉相关特征的权重,或者根据某种规则调整投诉模型中关 于投诉相关特征的权重。其中,可调整每个投诉相关特征的权重,或调整其中几个投诉相关 特征的权重,本实施例中不做限定。
[0094] 然后,将每个训练样本输入到调整后的投诉预测模型中,确定每个训练样本对应 的调整后的投诉风险值。
[0095] 本实施例中,调整后的投诉预测模型为对投诉相关特征进行权重调整的投诉预测 模型。在将训练样本输入到调整后的投诉预测模型中,确定每个训练样本对应的调整后的 投诉风险值时,其技术方案与本实施例中的步骤202b相似,在此不再一一赘述。
[0096] 最后,根据每个训练样本对应的调整后的投诉风险值和投诉真实值,计算调整后 的投诉准确率。
[0097] 本实施例中,在根据每个训练样本对应的调整后的投诉风险值和投诉真实值,计 算调整后的投诉准确率时,其技术方案与本实施例中的步骤202c相似,在此不再一一赘 述。
[0098] 本实施例中,根据调整后的投诉准确率是否大于预设阈值,依次执行步骤202d2 中的操作,即是对该投诉预测模型进行训练获得验证后的投诉预测模型的过程。
[0099] 可选地,本实施例中,若投诉准确率不大于预设阈值,则说明构建的投诉预测模型 的分类结果不理想,原因还可能是因为训练集中的训练样本N1没有覆盖到全网移动互联网 用户的投诉相关特征的所有情况,则重新选择Ii 1个移动互联网用户,重新计算新选择的n i 个移动互联网用户对应的投诉相关特征,将重新选择的&个移动互联网用户的每个训练 样本输入到投诉预测模型中,确定每个训练样本对应的投诉风险值,根据每个训练样本对 应的投诉风险值和投诉真实值,计算投诉准确率,根据投诉准确率,对投诉预测模型进行验 证。此次验证时,若投诉准确率大于预设阈值,则确定构建的投诉预测模型为验证后的投诉 预测模型。
[0100] 可选地,若通过步骤202d2对投诉预测模型进行验证时,始终不能使调整后的投 诉准确率大于所述预设阈值,则说明六个投诉相关特征与移动用户投诉所看重的内容不能 很好的匹配,则重新根据统计周期内待预测的移动互联网用户对应的流量使用记录、历史 投诉数据记录、套餐及业务订购数据记录,计算待预测的移动互联网用户对应的另外的投 诉相关特征,替换原有的投诉相关特征中的一个或多个投诉相关特征,重新构建投诉预测 模型,对投诉预测模型进行验证。
[0101] 步骤203,获取待预测的移动互联网用户在统计周期内的上网数据记录。
[0102] 本实施例中,在执行步骤203之前,可选择性的执行步骤201和步骤202,若在执行 步骤203之前,投诉预测模型已进行构建和验证,则不执行步骤201和步骤202,若在执行步 骤203之前,投诉预测模型未进行构建和验证,则执行步骤201和步骤202。
[0103] 步骤204,根据上网数据记录,计算预测的移动互联网用户对应的流量使用数据记 录。
[0104] 步骤205,根据统计周期内待预测的移动互联网用户对应的流量使用记录、历史投 诉数据记录、套餐及业务订购数据记录,计算待预测的移动互联网用户对应的投诉相关特 征。
[0105] 本实施例中,步骤203-步骤205与本发明移动互联网用户投诉的预测方法实施例 一步骤101-步骤103相同,在此不再--赘述。
[0106] 步骤206,将投诉相关特征输入到验证后的投诉预测模型中,获取待预测的移动互 联网用户的投诉风险值。
[0107] 进一步地,本实施例中,步骤206可分为以下两个步骤执行。
[0108] 步骤206a,将投诉相关特征输入到验证后的投诉预测模型中,获取待预测移动互 联网用户对应的每个投诉相关特征的投诉子风险值。
[0109] 具体地,本实施例中,将待预测的移动互联网用户对应的每个投诉相关特征输入 到验证后的投诉预测模型相应的决策树中,使验证后的投诉预测模型中的每个决策树对相 应的投诉相关特征进行判断,确定该投诉相关特征属于投诉类还是非投诉类。若第i个决 策树预测待预测移动互联网用户相应的投诉相关特征为投诉类,则用投诉子风险值Q 1= 1 表示,若第i个决策树预测该训练样本相应的投诉相关特征为非投诉类,则用投诉子风险 值Qi = 0表示。
[0110] 步骤206b,根据投诉子风险值和验证后的投诉预测模型对应的权重,计算待预测 的移动互联网用户的投诉风险值。
[0111] 根据该待预测移动互联网用户的每个投诉相关特征对应的投诉子风险值P1和验 证后的投诉预测模型对应的权重β i,确定该待预测移动互联网用户对应的投诉风险值Q。
[0112] 其中,引入中间量泛= ,若>〇,则Q = L若=〇,则Q = 〇。
[0113] 步骤207,输出待预测的移动互联网用户的投诉风险值和投诉相关特征。
[0114] 本实施例中,步骤207和本发明移动互联网用户投诉的预测方法实施例一步骤 105相同,在此不再--赘述。
[0115] 本实施例提供的移动互联网用户投诉的预测方法,计算待预测的移动互联网用户 的多个投诉相关特征,并将多个投诉相关特征输入到验证后的随机森林模型中,获取待预 测的移动互联网用户的投诉风险值,由于随机森林模型具有处理大数据及训练速度快的优 势,可在短时间内获得多个待预测的移动互联网用户的准确的投诉风险值,以对移动互联 网用户的投诉进行快速而准确预测。
[0116] 图3为本发明移动互联网用户投诉的预测装置实施例一的结构示意图,如图3所 示,本实施例中提供的移动互联网用户投诉的装置包括:获取模块31,计算模块32和输出 模块33。
[0117] 其中,获取模块31,用于获取待预测的移动互联网用户在统计周期内的上网数据 记录。计算模块32,用于根据上网数据记录,计算待预测的移动互联网用户对应的流量使用 数据记录。计算模块32,还用于根据统计周期内待预测的移动互联网用户对应的流量使用 记录、历史投诉数据记录、套餐及业务订购数据记录,计算待预测的移动互联网用户对应的 投诉相关特征。获取模块31,还用于将投诉相关特征输入到验证后的投诉预测模型中,获取 待预测的移动互联网用户的投诉风险值。输出模块33,用于输出待预测的移动互联网用户 的投诉风险值和投诉相关特征。
[0118] 本实施例的移动互联网用户投诉预测的装置可以执行图1所示方法实施例的技 术方案,其实现原理和技术效果类似,此处不再赘述。
[0119] 图4为本发明移动互联网用户投诉的预测装置实施例二的结构示意图,如图4所 示,本实施例中提供的移动互联网用户投诉的装置包括:获取模块41,计算模块42,输出模 块43,构建模块44,确定模块45及验证模块46。
[0120] 其中,获取模块41,用于获取待预测的移动互联网用户在统计周期内的上网数据 记录。计算模块42,用于根据上网数据记录,计算待预测的移动互联网用户对应的流量使用 数据记录。计算模块42,还用于根据统计周期内待预测的移动互联网用户对应的流量使用 记录、历史投诉数据记录、套餐及业务订购数据记录,计算待预测的移动互联网用户对应的 投诉相关特征。获取模块41,还用于将投诉相关特征输入到验证后的投诉预测模型中,获取 待预测的移动互联网用户的投诉风险值。输出模块43,用于输出待预测的移动互联网用户 的投诉风险值和投诉相关特征。
[0121] 优选地,本实施例中,投诉相关特征为多个,投诉预测模型为随机森林模型。
[0122] 计算模块42,还用于计算在统计周期内的1^个移动互联网用户对应的投诉相关特 征,组成训练集N 1,其中,每个移动互联网用户对应的投诉相关特征为训练集N1中的一个训 练样本。构建模块44,用于构建投诉预测模型,投
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1