话费套餐推荐的方法和系统与流程

文档序号:18219084发布日期:2019-07-19 22:51阅读:589来源:国知局
话费套餐推荐的方法和系统与流程

本公开实施例涉及通信技术领域,特别涉及话费套餐推荐的方法和系统。



背景技术:

随着科学技术的发展,手机成了日常生活中必不可少的工具。

在现有技术中,主要通过用户自主选择话费套餐的方式对话费套餐进行选择。如,用户通过到营业厅咨询相关话费套餐,并从中选择一种话费套餐,由工作人员在网上登记后即可生效。当然,也有由工作人员基于用户当前时刻之前的某一段时间内用户的话费使用情况为用户进行话费套餐的推荐。也就是说,在现有技术中,主要通过人工的方式为用户推荐话费套餐。



技术实现要素:

本公开实施例提供一种话费套餐推荐的方法和系统。

第一方面,本公开实施例提供了一种话费套餐推荐的方法,包括:

获取样本用户在预设第一时长内的实际话费信息;

计算所述样本用户在所述第一时长内订购的话费套餐信息和其实际话费信息的相似度;

响应于所述相似度大于预设阈值,根据所述实际话费信息构建话费套餐推荐模型;

获取待推荐用户在预设第二时长内的实际话费信息;

根据所述话费套餐推荐模型和所述待推荐用户在第二时长内的实际话费信息,确定为所述待推荐用户推荐的话费套餐。

在一些实施例中,所述根据所述实际话费信息构建话费套餐推荐模型,包括:

对所述实际话费信息进行预处理,其中,所述预处理包括去除以下一种或多种信息:所述实际话费信息中数据字段的互相关系数大于预设系数的信息、所述实际话费信息中数据字段对应的值缺失的信息、所述实际话费信息中数据字段对应的值的方差小于第一阈值的信息;

根据预处理后的实际话费信息构建所述话费套餐推荐模型。

在一些实施例中,所述根据预处理后的实际话费信息构建所述话费套餐推荐模型,包括:

从预处理后的实际话费信息中选取第一比值的数据;

根据预设的提升树模型对所述第一比值的数据进行训练,得到初始模型;

从预处理后的实际话费信息中选取第二比值的数据,其中,所述第一比值与所述第二比值的和为1;

根据所述初始模型、所述第二比值的数据和预设的网格参数调优算法确定所述话费套餐推荐模型。

在一些实施例中,在所述根据所述初始模型、所述第二比值的数据和预设的网格参数调优算法确定所述话费套餐推荐模型之后,还包括:

将所述第一比值的数据分成n等份,其中n为大于1的整数;

将各个等份的数据分别输入至所述话费套餐推荐模型,得到n个推荐结果;

计算每一个推荐结果的准确率;

对n个准确率进行加权平均,得到所述话费套餐推荐模型的评价值。

在一些实施例中,,在所述根据所述初始模型、所述第二比值的数据和预设的网格参数调优算法确定所述话费套餐推荐模型之后,还包括:

根据预设的随机森林算法对所述话费套餐推荐模型进行更新;

所述根据所述话费套餐推荐模型和所述待推荐用户在第二时长内的实际话费信息,确定为所述待推荐用户推荐的话费套餐为:

根据更新后的话费套餐推荐模型和所述待推荐用户在第二时长内的实际话费信息,确定为所述待推荐用户推荐的话费套餐。

第二方面,本公开实施例提供了一种话费套餐推荐的系统,包括:

获取模块,用于获取样本用户在预设第一时长内的实际话费信息;

计算模块,用于计算所述样本用户在所述第一时长内订购的话费套餐信息和其实际话费信息的相似度;

构建模块,用于响应于所述相似度大于预设阈值,根据所述实际话费信息构建话费套餐推荐模型;

所述获取模块还用于,获取待推荐用户在预设第二时长内的实际话费信息;

确定模块,用于根据所述话费套餐推荐模型和所述待推荐用户在第二时长内的实际话费信息,确定为所述待推荐用户推荐的话费套餐。

在一些实施例中,所述构建模块具体用于:

对所述实际话费信息进行预处理,其中,所述预处理包括去除以下一种或多种信息:所述实际话费信息中数据字段的互相关系数大于预设系数的信息、所述实际话费信息中数据字段对应的值缺失的信息、所述实际话费信息中数据字段对应的值的方差小于第一阈值的信息;

根据预处理后的实际话费信息构建所述话费套餐推荐模型。

在一些实施例中,所述构建模块具体用于:

从预处理后的实际话费信息中选取第一比值的数据;

根据预设的提升树模型对所述第一比值的数据进行训练,得到初始模型;

从预处理后的实际话费信息中选取第二比值的数据,其中,所述第一比值与所述第二比值的和为1;

根据所述初始模型、除所述第二比值的数据和预设的网格参数调优算法确定所述话费套餐推荐模型。

在一些实施例中,所述构建模块还用于:

将所述第一比值的数据分成n等份,其中n为大于1的整数;

将各个等份的数据分别输入至所述话费套餐推荐模型,得到n个推荐结果;

计算每一个推荐结果的准确率;

对n个准确率进行加权平均,得到所述话费套餐推荐模型的评价值。

在一些实施例中,还包括:

更新模块,用于根据预设的随机森林算法对所述话费套餐推荐模型进行更新;

所述确定模块用于:根据更新后的话费套餐推荐模型和所述待推荐用户在第二时长内的实际话费信息,确定为所述待推荐用户推荐的话费套餐。

本公开实施例提供的获取样本用户在预设第一时长内的实际话费信息,计算样本用户在第一时长内订购的话费套餐信息和其实际话费信息的相似度,响应于相似度大于预设阈值,根据实际话费信息构建话费套餐推荐模型,获取待推荐用户在预设第二时长内的实际话费信息,根据话费套餐推荐模型和待推荐用户在第二时长内的实际话费信息,确定为待推荐用户推荐的话费套餐的技术方案,避免了现有技术中通过人工的方式为用户推荐话费套餐时造成的耗时费力的技术弊端,实现了自动为用户推荐话费套餐,且节约时间和成本,提高可靠性和精准度的技术效果。

附图说明

附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:

图1为根据本公开实施例的话费套餐推荐的方法的示意图;

图2为根据本公开实施例的构建话费套餐推荐模型的方法的示意图;

图3为根据本公开另一实施例的构建话费套餐推荐模型的方法的示意图;

图4为根据本公开实施例的得到评价话费套餐推荐模型的值的方法的示意图;

图5为根据本公开实施例的话费套餐推荐的系统的示意图;

图6为根据本公开另一实施例的话费套餐推荐的系统的示意图;

附图标记:1、获取模块,2、计算模块,3、构建模块,4、确定模块,5、更新模块。

具体实施方式

为使本领域的技术人员更好地理解本发明的技术方案,下面结合附图对本发明提供的话费套餐推荐的方法和系统进行详细描述。

在下文中将参考附图更充分地描述示例实施例,但是所述示例实施例可以以不同形式来体现且不应当被解释为限于本文阐述的实施例。反之,提供这些实施例的目的在于使本公开透彻和完整,并将使本领域技术人员充分理解本公开的范围。

如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。

本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由……制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或其群组。

本文所述实施例可借助本公开的理想示意图而参考平面图和/或截面图进行描述。因此,可根据制造技术和/或容限来修改示例图示。因此,实施例不限于附图中所示的实施例,而是包括基于制造工艺而形成的配置的修改。因此,附图中例示的区具有示意性属性,并且图中所示区的形状例示了元件的区的具体形状,但并不旨在是限制性的。

除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。

根据本发明实施例的一个方面,本公开实施例提供了话费套餐推荐的方法。

请参阅图1,图1为根据本公开实施例的话费套餐推荐的方法的示意图。

如图1所示,该方法包括:

s1:获取样本用户在预设第一时长内的实际话费信息。

s2:计算样本用户在第一时长内订购的话费套餐信息和其实际话费信息的相似度。

其中,话费套餐信息是指样本用户指定的套餐对应的话费信息(一般指一个月的话费信息)。如,48元套餐中包括的200分钟通话,100条免费短信,4g流量等。实际话费信息是指样本用户一个月内实际的话费消费的信息,如样本用户作为主叫通话时长为400分钟。

这里的“预设第一时长内”可基于需求进行设定。如,三个月。也就是说,获取三个月内样本用户的每个月的实际话费信息。

为确保话费套餐推荐的准确性,在步骤中,获取的为海量样本用户的话费套餐信息和实际话费信息,如25万样本用户。

可以理解的是,由于每个样本用户社交的差异性,每个样本用户的实际话费信息并不相同,而每个样本用户在对话费套餐进行选取时,也会出现差异。且,由于实际的需求,用户选取的话费套餐有可能不能满足用户的实际话费,也可能会超出用户的实际话费。

在该步骤中,对每个样本用户的话费套餐信息与实际话费信息的相似度进行计算。

响应于相似度大于预设阈值,执行s3:根据实际话费信息构建话费套餐推荐模型。

其中,预设阈值可以基于需求进行设定。如,预设阈值设置在90%-100%之间。如果25万样本用户中,有20样本万用户的话费套餐信息和实际话费信息的相似度大于阈值,则根据该20万样本用户的实际话费信息构建话费套餐推荐模型。

结合图2可知,在一些实施例中,s3包括:

s3-1:对实际话费信息进行预处理,其中,预处理包括去除以下一种或多种信息:实际话费信息中数据字段的互相关系数大于预设系数的信息、实际话费信息中数据字段对应的值缺失的信息、实际话费信息中数据字段对应的值的方差小于第一阈值的信息。

现结合表1对该步骤进行详细的阐述。

表1:数据字段表

结合表1(表1为实际话费信息中的数据字段表)可知,实际话费信息中包括多个数据字段。而有些字段为互相关字段,如1_total_fee、2_total_fee、3_total_fee和4_total_fee,则计算该4个字段的互相关系数,且计算发现该4个字段的互相关系数大于预设系数,则保留4个数据字段中的任意一个数据字段,将其它的数据字段对应的信息删除。

当某数据字段的值缺失时,则说明该数据字段对应的信息已无参考价值,则直接将该数据字段的信息删除。

当某数据字段对应的值的方差小于第一阈值(第一阈值接近于0),则说明该数据字段的值为相同或相近的值,则亦将该数据字段对应的信息删除。

通过对实际话费信息进行预处理,可以去除并无参考价值的数据,减少后续的运算量。

s3-2:根据预处理后的实际话费信息构建话费套餐推荐模型。

结合图3可知,在一些实施例中,s3-2包括:

s3-2-1:从预处理后的实际话费信息中选取第一比值的数据。

如,从预处理后的实际话费信息中选取70%的数据。即,从20万用户中选取1.4万用户的处理后的实际话费信息的数据。

在一些实施例中,预处理后的实际话费信息包括数据特征信息和业务特征信息,其中,数据特征信息包括金额、通话时长、流量和性别中的一种或多种,业务特征信息包括月消费金额、超额语音费用、超额流量、超额流量费用和月出账费用序列中的一种或多种。

优选地,针对数据特征信息,可进行下述优化处理。如:分别对金额、通话时长、流量进行最小值(min)计算,标准差(即var)计算,最大值计算,平均值值(即mean)计算,以及等级(即rank)。以使得不同数据字段之间的差异更加明显。当然,也可对不数据字段进行分组处理,可提高相同数据字段的数据的相似度。对金额,年龄可进行分层处理。对类别数据进行特征提取算法(即one-hot)处理。当然,还可以对多列特征信息有关系的进行组合。对金额与合约,与流量进行组合特征信息生成。对连续性特征信息做归一,对离散型数据做分类处理。如对于age和gender字段,除了填充缺失值以外,原数据中age和gender存在字符串形式、‘\\n‘形式、整数形式,这三种也能代表客户数据的收集方式所产生的不同,将三种方式做labelencoder编码,对于age字段,不同年龄段套餐类型存在较大差别,故映射age为[0,10,16,24,30,40,50,60,∞]区间。

优选地,针对数据特征信息,可进行下述优化处理。如:月消费金额=基本套餐费用+超额流量费用+超额语音费用。

超额语音费用:套外主叫通话时长(service1_caller_time)*0.15。

超额流量:(当月累计流量(month_traffic)-上月结转流量(last_month_traffic)-套餐赠送流量(tmp_traffic_free))。

超额流量费用:(tmp_traffic_free)/1024*60+(tmp_traffic_free)%1024*027。

月出账费用序列:1_total_fee至4_total_fee为用户月出账收入,每一个用户存在很大的序列关系,故用1_total_fee减/除2_total_fee,2_total_fee减/除3_total_fee,3_total_fee减/除4_total_fee,代表用户消费的时序变化。

s3-2-2:根据预设的提升树模型对第一比值的数据进行训练,得到初始模型。

在该步骤中,以提升树模型(英文名称为lightgbm)为基础模型,对第一比值的数据进行训练。第一比值的数据相当于提升树模型的输入特征。提升树模型据欧运算速度快,精度高等特征。因此,可以快速的得到可靠性高的初始模型。

s3-2-3:从预处理后的实际话费信息中选取第二比值的数据。其中,第一比值与第二比值的和为1。

也就是说,从预处理后的实际话费信息中选取剩下的30%的数据。

s3-2-4:根据初始模型、第二比值的数据和预设的网格参数调优算法确定话费套餐推荐模型。

在该步骤中,实际是通过30%的数据和网格参数调优算法(即gridsearch网格搜索方法)对初始模型的参数进行调整,直至得到最优的参数,进而得到最优的模型。

具体地,将30%的数据作为初始模型的输入特征,输入至初始模型,得到输出结果。将输出结果与预设的输出结果进行比较,当输出结果与预设的输出结果相差较大时(较大或较小可基于实际需求设定阈值,如果输出结果与预设的输出结果大于设定阈值,则说明输出结果与预设的输出结果相差较大,如果输出结果与预设的输出结果小于设定阈值,则说明输出结果与预设的输出结果相差较小),则通过网格参数调优算法对初始模型的参数进行调优计算,进而实现不断对参数进行迭代更新,直至最终的输出结果与预设的输出结果相差较小。该算法采用现有技术中的算法,此处不再赘述。

结合图4可知,在一些实施例中,在s3-2之后,还包括:

s3-3:将第一比值的数据分成n等份,其中n为大于1的整数。

将1.4万用户的处理后的实际话费信息的数据分成5等份。

s3-4:将各个等份的数据分别输入至话费套餐推荐模型,得到n个推荐结果。

将5等份中的每一等份的数据分别输入至话费套餐推荐模型,得到5个推荐结果。

s3-5:计算每一个推荐结果的准确率。

将5个推荐结果分别与预设的推荐结果进行比较,得到每一个推荐结果分别对应的准确率。即,共得到5个准确率。

s3-6:对n个准确率进行加权平均,得到话费套餐推荐模型的评价值。

计算5个准确率的总和,再求取综合的平均值(即综合除以5),得到话费套餐推荐模型的评价值。基于该评价值可以确定该话费套餐推荐模型的推荐结果的精准度。若评价值小于预设的值,则可重新对话费套餐推荐模型进行训练,或者通过调整费套餐推荐模型的参数的方式对费套餐推荐模型进行调优处理。

s3-3至s3-6的方案可以理解为对费套餐推荐模型的交叉验证的过程,通过对费套餐推荐模型的交叉验证,可获悉费套餐推荐模型的准确性和可靠性,以便及时对费套餐推荐模型进行调整,进而得到精确度高,可靠性强的费套餐推荐模型。

在一些实施例中,s3-2-4之后,该方法还包括:

s3-2-4-5:根据预设的随机森林算法对话费套餐推荐模型进行更新。

由于部分话费套餐的相似度极高,如,套餐金额为76元的套餐,包括赠送通话时间200分钟,赠送流量800mb,流量超过每g的金额为60。而存在同样金额的套餐(即另一76元的套餐),但是,赠送通话时间为300分钟,赠送流量700mb,流量超过每g的金额也为60。由于这两个话费套餐的内容相似,但是业务归口不同,因此无法将两个话费套餐进行合并。因此,基于随机森林算法对话费套餐推荐模型进行更新。以便实现小差额推荐,使得更新后的话费套餐推荐模型的推荐效果更佳。

需要说明的是,s3-2-11与s3-3至s3-6之间并无既定的先后关系。

s4:获取待推荐用户在预设第二时长内的实际话费信息。

如,获取待推荐用户三个月内的实际话费信息。

s5:根据话费套餐推荐模型和待推荐用户在第二时长内的实际话费信息,确定为待推荐用户推荐的话费套餐。

将实际话费信息作为话费套餐推荐模型的输入特征,输出即为与待推荐用户对应的话费套餐。

当话费套餐推荐模型时根据预设的随机森林算法对话费套餐推荐模型进行更新后的话费套餐推荐模型,则s5为:根据更新后的话费套餐推荐模型和待推荐用户在第二时长内的实际话费信息,确定为待推荐用户推荐的话费套餐。

根据本公开实施例的另一个方面,本公开实施例还提供了一种话费套餐推荐的系统。

请参阅图5,图5为根据本公开实施例的一种话费套餐推荐的系统的示意图。

如图5所示,该系统包括:

获取模块1,用于获取样本用户在预设第一时长内的实际话费信息;

计算模块2,用于计算样本用户在第一时长内订购的话费套餐信息和其实际话费信息的相似度;

构建模块3,用于响应于相似度大于预设阈值,根据实际话费信息构建话费套餐推荐模型;

获取模块1还用于,获取待推荐用户在预设第二时长内的实际话费信息;

确定模块4,用于根据话费套餐推荐模型和待推荐用户在第二时长内的实际话费信息,确定为待推荐用户推荐的话费套餐。

在一些实施例中,构建模块3具体用于:

对实际话费信息进行预处理,其中,预处理包括去除以下一种或多种信息:实际话费信息中数据字段的互相关系数大于预设系数的信息、实际话费信息中数据字段对应的值缺失的信息、实际话费信息中数据字段对应的值的方差小于第一阈值的信息;

根据预处理后的实际话费信息构建话费套餐推荐模型。

在一些实施例中,构建模块3具体用于:

从预处理后的实际话费信息中选取第一比值的数据;

根据预设的提升树模型对第一比值的数据进行训练,得到初始模型;

从预处理后的实际话费信息中选取第二比值的数据,其中,第一比值与第二比值的和为1;

根据初始模型、第二比值的数据和预设的网格参数调优算法确定话费套餐推荐模型。

在一些实施例中,构建模块3还用于:

将第一比值的数据分成n等份,其中n为大于1的整数;

将各个等份的数据分别输入至话费套餐推荐模型,得到n个推荐结果;

计算每一个推荐结果的准确率;

对n个准确率进行加权平均,得到话费套餐推荐模型的评价值。

结合图6可知,在一些实施例中,该系统还包括:

更新模块5,用于根据预设的随机森林算法对话费套餐推荐模型进行更新;

确定模块4用于:根据更新后的话费套餐推荐模型和待推荐用户在第二时长内的实际话费信息,确定为待推荐用户推荐的话费套餐。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本公开的范围的情况下,可进行各种形式和细节上的改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1