一种流量话单切分方法

文档序号:34989626发布日期:2023-08-03 20:35阅读:56来源:国知局
一种流量话单切分方法

本发明属于运营商通信,具体涉及一种流量话单切分方法。


背景技术:

1、在运营商系统中用户使用5g网络上网,是通过网络核心设备向业务支撑系统申请流量授权,核心设备通过反馈的授权流量进行控制,支撑系统通过对授权量的切分,实现上网流量的使用计量。现有话单切分方法通过固定流量或固定时长切分,随着用户数量的增加和用户上网时间的增加,通过固定切分流量话单,月话单量增长达到了300%,服务器资源需要定期扩容以满足话单处理的需求,增加了运营费用和运营风险。


技术实现思路

1、针对目前通信运营体系中用户使用流量产生的话单处理需求改变和话单增量大等问题,本发明提供了一种流量话单切分方法。

2、为了达到上述目的,本发明采用了下列技术方案:

3、k均值聚类(k-means)是基于样本集合划分的聚类算法。k均值聚类将样本集合划分为k个子集,构成k个类,将n个样本分到k个类中,每个样本到其所属类的中心距离最小,每个样本仅属于一个类,这就是k均值聚类,同时根据一个样本仅属于一个类,也表示了k均值聚类是一种硬聚类算法。

4、一种流量话单切分方法,包括以下步骤:

5、步骤1,计算用户的业务类别(rg)权重值;rg表示用户上网的业务类别;

6、步骤1.1,首先将用户的每个业务类别下的流量作为样本进行聚类,对用户的每个业务类别进行打标;

7、步骤1.2,用户的流量权重值选取;

8、首先,计算打标后各项业务流量flowi的变异系数vi,表示为:其中vi表示变异系数,σi表示标准差,表示均值,i表示用户数量;

9、然后,计算用户每个业务类别下的流量总和及权重wi,表示为:其中,wi表示用户流量权重,表示各项flowi的变异系数之和;

10、将用户业务类别下的流量总权重组成集合w={w1,w2,w3},作为用户流量动态步长判断的输入。

11、步骤2,基于注意力机制提取用户的关键信息;

12、步骤2.1,提取用户信息并进行简化和编号,得到用户信息标签t,将用户信息标签t组成集合j,表示为j={t1,t2,...,tn};

13、步骤2.2,根据用户信息标签进行联合结构特征融合,得到:地域流量特征,分时段流量特征,融合习好标识流量特征;

14、步骤2.3,基于注意力机制的编解码器模型进行注意力机制的权值分布计算,得到输入序列中每个特征对于当前输出信号的注意力分布概率分布值aij,表示为:aij=f(hi,hj),其中,hj表示输入数据xj在编码器中的隐藏状态,hj表示输出数据yj在解码器中的隐藏状态,f表示计算hj和hj符合用户流量使用习惯的概率值;

15、在解码器模块中计算出输入信息中各元素对应输出信号的注意力概率分布值,即是对于每个输出计算对应中间语义编码,使得不同的输入元素分配不同的权重值,突出权值大的数据,弱化权值小的数据,从而改善分类效果。

16、对于输出数据yj每个不同的输出元素yj都对应着不同的中间语义编码ej,表示为其中,s表示地域流量特征,表示分时段流量特征,cij表示融合习好标识流量特征,t表示输入数据的总个数;

17、解码器输出特征为:xt=d(cj,x1,x2,x3,...,xj-1),其中d表示用户流量使用特征,x1,x2,x3,...,xj-1为输出元素;

18、联合用户的业务类别聚类分类后的流量总权重组成集合,形成用户流量使用特征为:

19、p={w,xt}=(ej,x1,x2,x3,...,xj-1);

20、步骤3,基于循环神经网络(gru)的流量预测;

21、使用循环神经网络模型,对于长度n的输入序列{x1,x2,x3,...,xn},通过输入序列映射到隐藏层状态来学习序列中的特征信息,然后通过将多个隐藏层的特征信息堆叠在一起获取更高级别的信息;

22、将解码器输出特征xt作为循环神经网络模型的输入特征,循环神经网络模型的前向传播表示为:

23、zt=σ(wz*xt+uz*ht-1+bz)

24、rt=σ(wr*xt+ur*ht-1+br)

25、

26、

27、其中,rt表示t时刻的重置门;zt表示t时刻的更新门;表示t时刻的候选隐藏状态;ht表示t时刻的当前单元状态;ht-1表示上一时刻的单元状态;⊙表示哈达玛积;σ表示sigmoid激活函数,将数据转换为[0,1]的数值;wr表示重置门的权值矩阵;wz表示更新门的权值矩阵;wh表示候选隐藏状态的权值矩阵;w*和u*是卷积运算卷积核;b*为偏置项,作用是训练阶段的模型的参数;

28、为了在输出层生成与当前输入特征对应的用户流量使用值,建立一个包含两个卷积层的网络,然后使用softmax函数计算权重值,

29、st=us*tanh(wxs*xt+whs*ht-1+bs)+bus

30、xt是用户当天第t时特征值,ht-1是上一时刻单元状态,us,wxs,whs均表示卷积核,大小都是1×1;

31、st得到与当前输入xt对应的流量权值,表示为:其中,表示输入特征的注意力权重,大小在0~1之间,所有输入特征的注意力权重之和=1;

32、根据各个时刻特征向量,将得到的流量权重系数与输入特征相乘,得到用户当前时刻的动态流量授权值;表示为:

33、xt'=at⊙xt。

34、对于动态流量授权值,运营商系统根据流量授权值的使用情况生成话单,当一次动态流量授权值使用完后,生成话单,从固定值的拆分变为了动态值拆分,减少了话单的数量。

35、本文将注意力机制应用到特征提取中,将提取到的用户特征信息进行联合结构特征融合,提取出用户更显著的重要特征。降低了对于分类不明确特征的关注度,提升了整个流量预测模型的计算效率。

36、进一步,所述用户的业务类别分为三类:视频类:flow1={rg11,rg12,...,rg1n};网页类:flow2={rg21,rg22,...,rg2n};聊天类:flow3={rg31,rg32,...,rg3n}。

37、进一步,所述步骤2.1中用户信息标签包括:1-设备类型、2-性别、3-年龄、4-客户类型、5-在网时长、6-职业类型、7-是否出账户、8-是否极低使用量、9-用户近三月月均上网流量、10-是否固移融合套餐、11-社交达人、12-网红达人、13-当前信誉度、14-流量使用度、15-价值得分、16-有无5g流量、17-交费方式偏好、18-稳定度、19-是否高流量倾向用户、20-vip级别、21-稳定度得分、22-当月累计使用总流量、23-主机性能cpu、24-基站id。

38、进一步,所述地域流量特征集合表示为;s={u6,u9,u11,u12,u16,u17,u19,u24}。

39、进一步,所述分时段流量特征是根据时间特征θ,将用户的上网时段分为三段:θ1:8点整~12点整、14点整~18点整;θ2:12点整~14点整、18点整~24点整;θ3:0点整~8点整;用户在不同时间内流量使用情况的特征属性表示为其中,l表示一天内的不同时间,计算用户当前时间内与用户前一天24小时内流量使用情况相似度值进行度量;θ1的时间权重参数为1.5,θ2的时间权重参数为1.7,θ3的时间权重参数为0.8。

40、进一步,所述融合习好标识流量特征:在网用户的具体话务行为在不同使用习惯下的使用量是不同的;根据用户的访问网页触点点击率、职业类型、网络类型进行区分;

41、用户对不同网页触点的点击量cij表示为:

42、

43、其中,i表示用户数量,j表示网页触点;ji→jclick表示用户i对网页触点j的点击查看操作,ji→jlable表示用户i对网页触点j的收藏操作;

44、进一步,所述步骤2.3中基于注意力机制的编解码器模型包括编码器模块和解码器模块;

45、进一步,所述步骤2.3中注意力机制的权值分布计算是由地域流量特征、分时段流量特征和融合习好标识流量特征组成的联合特征的隐藏层状态与输入信号的隐藏状态语义进行符合用户流量使用习惯比较。

46、进一步,所述循环神经网络模型,包括两个门控单元,分别是更新门zt和重置门rt;其中,更新门是决定隐藏状态的记忆信息保存到当前时刻的信息;重置门通过控制是否将新的输入信息与隐藏状态的记忆信息相结合。

47、与现有技术相比本发明具有以下优点:

48、本发明先引入用户的多种特征,通过注意力机制算法,输出用户的关键标签;其次计算用户的上网类别流量权重值,作为用户的流量特征;再次引入主机性能作为主机参数信息;最后将用户的多种特征作为循环神经网络模型的输出,动态计算用户某一时刻的流量步长即流量授权值。通过这种方法,可以实现话单的精确切分,提升用户使用感知,减少话单量,降低主机存储扩容频率。

49、此方法的主要思想是当用户流量余额充足时,流量滑动窗口的流量步长较大,以此提高对流量授权值的实时动态估计。传统流量话单授权值生成单一,根据用户的使用场景生成话单数据,此类方法仅考虑用户的行为信息,忽略了用户的行为习惯对话单授权值的影响。本发明方法从用户的社交信息、流量使用习惯等多种维度出发,利用用户的性别、年龄、rg值、地域、当月累计使用总量、套餐流量、是否高流量倾向用户、近期每月使用流量趋势等行为特征,最终实现各类特征用户分类以及授予相应的流量步长,将月话单量的增长量从300%控制到了40%的增加,有效降低了系统运营风险。一方面可以实现话单的精确切分,减少话单量,降低主机存储扩容频率,另一方面提升用户使用感知。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1