本发明涉及数据处理,具体涉及一种专网切片用户组rb预留资源的分配方法及装置。
背景技术:
1、5g网络在垂直行业的应用部署,为运营商带来新的经济增长点的同时,也给5g网络能力构建与规划带来了新的调整。5g为垂直行业客户不同的业务需求提供了切片机制,为了满足切片之间的差异化需求,无线侧在qos(quality of service,服务质量)优先级的基础上叠加更大粒度的切片优先级,支持根据切片优先级进行差异化调度,相同业务在高优先级切片下可以得到优先调度保障。独立组网网络下,基站综合考虑qos与切片的组合进行调度,调度时先考虑5qi(5g qos identifier,5g服务质量标识),在5qi相同的情况下,进一步区分不同切片进行rb(resource block,资源块)预留,确保同种业务在高优先级优先得到确定性的资源保障。
2、其中,rb资源预留技术是保障一组确定性资源并提供资源隔离,通过为一组切片用户预留rb资源,实现无线资源的隔离和资源保障,rb资源预留后,可提供确定性的资源保障。将有资源共享需求且资源预留需求一致的切片划分为一个切片用户组,并预留专用资源、优先资源以及共享资源,其中,专用资源仅供切片用户组内使用,切片用户组内用户可优先使用优先资源,所有用户均可使用共享资源。
3、现有技术中,通过半静态和动态切片用户组资源预留技术为面对商家业务预留保障带宽,从用户面资源占用维度提供差异化业务保障。但是,现有技术中,针对切片用户组的预留资源比例是固定的,无法根据不同的业务需求和网络情况动态调整rb资源预留比例,无线网络资源利用率较低,且网络整体性能较差。
技术实现思路
1、鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的专网切片用户组rb预留资源的分配方法及装置。
2、根据本发明的一个方面,提供了一种专网切片用户组rb预留资源的分配方法,方法包括:
3、获取基站的待处理的rb资源状态信息;
4、其中,rb资源状态信息包括:任一专网切片用户组的rb预留资源比例、rb资源占用率以及平均服务质量满意度;
5、将待处理的rb资源状态信息输入至比例分配模型中进行处理,得到比例调整动作;其中,预先采用深度强化学习算法训练得到比例分配模型;
6、根据比例调整动作,调整该专网切片用户组的rb预留资源的分配。
7、可选地,方法执行之前,进一步包括:
8、获取基站的第一rb资源状态信息;
9、根据调整动作选取策略,确定第一比例调整动作;
10、根据第一比例调整动作,调整第一rb资源状态信息对应的专网切片用户组的rb预留资源的分配;
11、获取调整分配之后基站的第二rb资源状态信息以及第一rb资源状态信息对应的专网切片用户组中各个切片的反馈信息;
12、根据各个切片的反馈信息,确定各个切片的奖励回报信息,根据各个切片的奖励回报信息,确定系统奖励回报信息;
13、根据第一rb资源状态信息、第一比例调整动作、系统奖励回报信息以及第二rb资源状态信息,构建样本数据并存入记忆池中;
14、根据记忆池中包含的多个样本数据,对初始比例分配模型进行训练,得到比例分配模型。
15、可选地,根据调整动作选取策略,确定第一比例调整动作进一步包括:
16、设定预设贪心算法的概率控制参数;
17、生成随机值,将随机值与概率控制参数进行比较;
18、若随机值小于概率控制参数,则从调整动作集合中随机选择一个调整动作确定为第一比例调整动作;
19、若随机值不小于概率控制参数,则将第一rb资源状态信息输入至初始比例分配模型进行处理,得到第一比例调整动作。
20、可选地,切片的反馈信息包括:切片服务质量满意度以及切片rb资源利用率,根据各个切片的反馈信息,确定各个切片的奖励回报信息进一步包括:
21、针对于各个切片,根据预设的权重,计算切片服务质量满意度以及切片rb资源利用率的加权和,得到该切片的奖励回报信息。
22、可选地,切片服务质量满意度对应的权重通过如下公式计算:
23、α=σ(satsq-rusq);
24、其中,α表示切片服务质量满意度的权重,satsq表示切片服务质量满意度,rusq表示切片rb资源利用率,σ()表示sigmoid函数。
25、可选地,根据比例调整动作,调整该专网切片用户组的rb预留资源的分配进一步包括:
26、根据该专网切片用户组的rb预留资源比例以及比例调整动作,确定调整后的rb预留资源比例;
27、将调整后的rb预留资源比例映射为基站调度时隙周期内rb资源比例,并对该专网切片用户组分配rb预留资源。
28、可选地,方法执行之前,进一步包括:
29、根据签订的服务质量协定,确定各个专网切片用户组的初始rb预留资源比例;根据初始rb预留资源比例,为各个专网切片用户组分配rb预留资源。
30、根据本发明的另一方面,提供了一种专网切片用户组rb预留资源的分配装置,包括:
31、信息获取模块,适于获取基站的待处理的rb资源状态信息;
32、其中,rb资源状态信息包括:任一专网切片用户组的rb预留资源比例、rb资源占用率以及平均服务质量满意度;
33、信息处理模块,适于将待处理的rb资源状态信息输入至比例分配模型中进行处理,得到比例调整动作;其中,预先采用深度强化学习算法训练得到比例分配模型;
34、分配调整模块,适于根据比例调整动作,调整该专网切片用户组的rb预留资源的分配。
35、在一种可选的方式中,装置还包括:
36、模型训练模块,适于获取基站的第一rb资源状态信息;根据调整动作选取策略,确定第一比例调整动作;根据第一比例调整动作,调整第一rb资源状态信息对应的专网切片用户组的rb预留资源的分配;获取调整分配之后基站的第二rb资源状态信息以及第一rb资源状态信息对应的专网切片用户组中各个切片的反馈信息;根据各个切片的反馈信息,确定各个切片的奖励回报信息,根据各个切片的奖励回报信息,确定系统奖励回报信息;根据第一rb资源状态信息、第一比例调整动作、系统奖励回报信息以及第二rb资源状态信息,构建样本数据并存入记忆池中;根据记忆池中包含的多个样本数据,对初始比例分配模型进行训练,得到比例分配模型。
37、在一种可选的方式中,模型训练模块进一步适于:设定预设贪心算法的概率控制参数;生成随机值,将随机值与概率控制参数进行比较;若随机值小于概率控制参数,则从调整动作集合中随机选择一个调整动作确定为第一比例调整动作;若随机值不小于概率控制参数,则将第一rb资源状态信息输入至初始比例分配模型进行处理,得到第一比例调整动作。
38、在一种可选的方式中,切片的反馈信息包括:切片服务质量满意度以及切片rb资源利用率,模型训练模块进一步适于:针对于各个切片,根据预设的权重,计算切片服务质量满意度以及切片rb资源利用率的加权和,得到该切片的奖励回报信息。
39、在一种可选的方式中,切片服务质量满意度对应的权重通过如下公式计算:
40、α=σ(satsq-rusq);
41、其中,α表示切片服务质量满意度的权重,satsq表示切片服务质量满意度,rusq表示切片rb资源利用率,σ()表示sigmoid函数。
42、在一种可选的方式中,分配调整模块进一步适于:根据该专网切片用户组的rb预留资源比例以及比例调整动作,确定调整后的rb预留资源比例;将调整后的rb预留资源比例映射为基站调度时隙周期内rb资源比例,并对该专网切片用户组分配rb预留资源。
43、在一种可选的方式中,装置还包括:初始分配模块,适于根据签订的服务质量协定,确定各个专网切片用户组的初始rb预留资源比例;根据初始rb预留资源比例,为各个专网切片用户组分配rb预留资源。
44、根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
45、所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述专网切片用户组rb预留资源的分配方法对应的操作。
46、根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述专网切片用户组rb预留资源的分配方法对应的操作。
47、根据本发明的专网切片用户组rb预留资源的分配方法及装置,该方法包括:获取基站的待处理的rb资源状态信息;rb资源状态信息包括:任一专网切片用户组的rb预留资源比例、rb资源占用率以及平均服务质量满意度;将待处理的rb资源状态信息输入至比例分配模型中进行处理,得到比例调整动作;预先采用深度强化学习算法训练得到比例分配模型;根据比例调整动作,调整该专网切片用户组的rb预留资源的分配。通过上述方式,在深度强化学习的基础上搭建神经网络模型,将基站的切片用户组的三个维度的状态信息作为模型输入项,模型输出比例调整动作,根据输出的比例调整动作动态地调整专网切片用户组的rb预留资源,能够充分利用无线网络的rb资源,能够提升资源利用率以及用户使用体验。
48、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。