本发明属于无线电网络技术领域,具体涉及一种认知无线电网络中面向频谱需求不确定性的频谱投资策略。
背景技术:
长久以来国内的电信市场,移动,联通,电信三家大型基础电信运行商瓜分天下。近年来,mvno在我国逐渐兴起。mvno是国家为了让电信市场进一步开放,在三大基础电信运营商之外引入的民营企业。他们就像是代理商,从移动、联通、电信三大基础运营商那里承包一部分通讯网络的使用权,然后通过自己的计费系统、客服号、营销和管理体系把通信服务卖给消费者。mvno与电信运营商的最大区别在于,自身不拥有骨干和核心网络资源,需要通过租用电信运营商的基础设施,建立自己的虚拟网络来进行运营服务。这也是作为mvno的首要条件。而且,mvno以自己的品牌来标注向最终用户提供的服务内容。
然而近年来随着无线通信需求的不断增长,对无线通信技术支持的数据传输速率的要求越来越高。根据香农所提出的信息理论,这些通信系统对无线频谱资源的需求也相应增长,从而导致适用于无线通信的频谱资源变得日益紧张,成为制约无线通信发展的新瓶颈,进而制约mvno发展。认知无线电(cognitiveradio,cr)技术的发展使得传统mvno向认知移动虚拟运营商(c-mvno)转变。通过从时间和空间上充分利用那些空闲的频谱资源,从而有效解决难题。c-mvno通过向频谱拥有者(如中国移动)租赁获得稳定频谱和利用感知技术获得免费的空闲频谱。为了实现c-mvno收益最大化并给自己的用户群提供更高质量的服务,c-mvno需要获取接近真实的且准确的用户频谱需求,来帮助决策。对于波动的用户需求的处理方法主要分为两类:
(1)随机优化方法
(2)鲁棒优化方法
第一类方法一般细分为三种,第一种,给需求曲线一个上界和下界来确定波动的范围,每个时隙到来的用户频谱资源请求总数看作此范围内一个随机数。即将用户需求建模为排队模型中的随机到达;第二种,假设用户需求符合某个概率分布函数(pdf);第三种是利用马尔可夫模型。
然而在实际场景中,获得准确的分布函数费时费力,实际的用户需求可能不遵循马尔可夫的过程或任何简单的分布,近年来,使用鲁棒优化方法(即第二类方法)为不确定性条件优化建模,受到越来越多的关注。针对用户需求不确定性,它并不需要假设精确地pdf,而是将用户需求考虑为一个预定义的不确定集合,这个不确定集合包含最坏的情况。换言之,鲁棒优化的目的是求得这样一个解,对于可能出现的所有情况,约束条件均满足,并且使得最坏情况下的目标函数的函数值最优。其核心思想是将原始问题以一定的近似程度转化为一个具有多项式计算复杂度的凸优化问题。鲁棒优化的关键是建立相应的鲁棒对等模型。然后利用相关的优化理论将其转化为可求解的“近似”鲁棒对等问题,并给出鲁棒最优解。
本发明的主要目的是基于鲁棒性优化方法建模处理用户频谱需求不确定性问题(指c-mvno服务的用户群),进而帮助c-mvno决策租赁和感知的频谱数量从而实现收益最大化。要求的环境限制主要是以下两点。首先是针对认知无线电网络环境,这使得本发明的研究具有真实性以及可验证性的优点;其次是考虑单个频谱拥有者和单个c-mvno以及该c-mvno服务的用户群这种系统模型,这同样保证了研究的真实性与可验证性。
不同于以往的用户需求不确定的频谱投资研究,本发明的意义与重要性在于不需要费时费力获得实际场景中的需求分布也不需要将不确定性约束在某个固定阈值内。在建立好问题的系统模型之后通过提出一个新的不确定模型来获取用户需求不确定性的特征,具体说就是从用户需求的历史数据或者长期的观测数据中提取出用户需求的参照分布,然后定义一个不确定及并允许真实的需求分布围绕参照分布波动。这是我们首次提出使用分不确定模型描述用户需求的不确定性特征。其次我们利用机会约束近似和鲁棒最优化方法将带有随机变量的约束条件转化为典型的线性可解形式。
技术实现要素:
发明目的:为了克服现有技术中存在的不足,本发明提供一种认知无线电网络中面向频谱需求不确定性的频谱投资策略,是基于鲁棒性优化的方法解决认知无线电网络环境中用户需求不确定情况下的移动虚拟运营商频谱投资问题。
技术方案:为实现上述目的,本发明方案主要包括以下内容:
1)建立系统模型
建立系统模型是整个系统处理过程的第一部分,为后续的分布不确定模型的建立提供了基本信息。本发明主要目的是实现c-mvno的频谱投资收益最大化并同时满足用户需求,据此建立系统模型。
2)建立分布不确定模型
在前一部分已经完成系统建模,接下来我们从历史需求数据以及长期的观测数据中抽象出一个参照分布。利用kullback-leibler(kl)散度来描述真实分布和参照分布之间的差距。并定义两个连续分布之间的kl散度。
3)利用机会约束近似和鲁棒最优化方法转化带随机变量的约束条件
利用机会约束近似和鲁棒最优化方法转化带随机变量的约束条件,利用拉格朗日方法和karush-kuhn-tucker(kkt)条件处理中间函数,最后设计牛顿迭代算法求解鲁棒性频谱需求。将需求约束代入主问题并将求解主问题转化为求解线性规划问题,最后解出c-mvno在实现最大收益情况下的频谱决策。
本发明采用的具体的技术方案为:
一种认知无线电网络中面向频谱需求不确定性的频谱投资策略,包括以下步骤:
1)建立系统模型:
建立求解问题的系统模型,包含一个频谱拥有者,其将认证频谱分为主带和次带,c-mvno的频谱资源包括:租赁次带的频谱资源、通过动态频谱接入技术感知主带获得空闲的频谱资源,c-mvno将频谱资源出售实现频谱投资收益;该系统模型满足实现c-mvno的频谱投资收益最大化,且满足频谱投资总策略约束,所述频谱投资总策略约束为:在t时隙c-mvno频谱投资总策略要大于等于t时隙用户频谱需求;
2)建立分布不确定模型:
利用kl散度描述真实分布和参照分布之间的差距,并定义两个连续分布之间的kl散度,捕获用户频谱需求的随机特征;
3)利用机会约束近似和鲁棒最优化方法转化带随机变量的约束条件:
将带有随机变量的约束条件转化为典型的线性可解形式。
进一步的,所述步骤1)中,系统模型的公式表达为:
频谱投资收益最大化:
频谱投资总策略约束:
θ∈[0,1],π≥0,t∈t,
其中,t代表时隙序列,t∈t,π代表c-mvno出售单位频谱资源给其用户的价格,qt代表t时隙用户总需求,
进一步的,所述步骤2)的具体方法为:
步骤2.1:将t时隙的真实分布记作g(qt),其对应的参照分布记作ht(qt),真实的分布围绕着参照分布波动;
步骤2.2:两个连续分布之间的kl散度定义如下:
其中,s表示积分域,真实分布g(qt)和参照分布ht(qt)越接近,距离越接近0;利用kl散度,将用户需求分布不确定集合定义为:
γ(ht(qt,δt)={g(qt)|eg[lng(qt)-lnht(qt)]≤δt}(4)
δt表示距离极限,该值根据需求经验数据或实时测量数据得到;eg表示真实分布g(qt)的期望;真实的需求q波动的越剧烈,跟参照分布差距越大,即可调节δt至更大值;用户需求分布需遵循下列约束:
eg[lng(qt)-lnht(qt)]≤δt(5)
eg[1]≤1。
进一步的,所述步骤3)的具体方法为:利用机会约束近似和鲁棒最优化方法转化带随机变量的约束条件,利用拉格朗日方法和kkt条件处理中间函数,最后设计牛顿迭代算法求解鲁棒性频谱需求;将需求约束代入主问题并将求解主问题转化为求解线性规划问题,最后解出c-mvno在实现最大收益情况下的频谱决策。
进一步的,所述步骤3)的具体方法包括以下步骤:
步骤3.1:引入一个极小的值γ,控制所述频谱投资总策略约束
其中,γ定义为错误忍受率,表示用户频谱需求得不到满足这种情况的可接受概率;将上式转化为求解最优化问题如下:
满足eg[lng(qt)-lnht(qt)]≤δt(8)
eg[1]≤1(9)
其中,
步骤3.2:利用拉格朗日方法和kkt条件处理最坏情况下的错误概率
η和τ是和(8)、(9)式相关的拉格朗日乘子且τ>0;
步骤3.3:利用
步骤3.4:解线性规划问题,得到c-mvno在每个t时隙的频谱决策并求得总的最大收益。
进一步的,步骤3.1的具体方法为:
引入一个极小的值γ,控制所述频谱投资总策略约束的保守程度,转化为:
其中,γ定义为错误忍受率,表示用户频谱需求得不到满足这种情况的可接受概率;上式的鲁棒性表达式为:
该式等同于:
定义
将鲁棒性表达式转化为求解最优化问题如下:
满足eg[lng(qt)-lnht(qt)]≤δt
eg[1]≤1
其中,
进一步的,所述步骤3.2中,得到最坏情况的错误概率为:
有益效果:本发明提供的认知无线电网络中面向频谱需求不确定性的频谱投资策略,与现有技术相比,具有以下优势:本发明引入参照分布并定义不确定集来确定用户需求,相较于传统的随机几何方法和一般的鲁棒性方法有着更为广泛的应用,对真实的需求分布松紧度可控且人力物力开销小以及不容易受真实分布形式变动影响等优点。在鲁棒优化领域以及频谱投资领域都提出了新的可能性,最后,本发明的设计保证了整个机制的真实性。
附图说明
图1为系统模型示意图;
图2为牛顿迭代法流程示意图;
图3为不同
图4为不同
图5为鲁棒决策阈值
图6为感知系数θt随时隙t变化示意图;
图7为用户需求的鲁棒决策阈值
图8为c-mvno最大收益随时隙t变化示意图。
具体实施方式
本发明公开了一种认知无线电网络中面向频谱需求不确定性的频谱投资策略,主要用于提出一种基于鲁棒性优化的方法解决认知无线电网络环境中用户需求不确定情况下的移动虚拟运营商(mobilevirtualnetworkoperator,mvno)频谱投资问题,进而帮助mvno决策并实现收益最大化。本发明主要包括三个个部分:一是建立求解问题的系统模型;二是建立灵活的分布不确定模型,捕获用户频谱需求的随机特征;三是利用机会约束近似和鲁棒最优化方法将带有随机变量的约束条件转化为典型的线性可解形式。
下面结合附图和实施例对本发明作更进一步的说明。
实施例
如图1所示,本系统包含一个频谱拥有者,如中国移动。它根据历史信息,将认证频谱分为两部分:主频带(primaryband)和次频带(secondaryband)。主频带主要服务主用户(pus),也称为认证用户。次频带主要售卖给c-mvno,比如中国的乐语企业等。c-mvno拥有自己的用户,这些用户都是二级未认证用户。c-mvno通过和频谱拥有者签订长期合同租赁稳定频谱资源,或者通过动态频谱接入技术感知主带获得空闲的频谱资源。c-mvno将这两部分频谱资源整合,通过自己建立的售卖机制出售给自己的用户群以获得收益。租赁可以确保获得稳定的频谱资源,但付出的代价相对较高,这个代价主要取决于c-mvno和运营商协商的频谱售卖价格。相对而言,通过感知的方式获得频谱,开销较小,其主要开销来自感知时间和精力。图中显示,c-mvno的感知区也是认证用户通信带,为了避免和主用户冲突,感知获得的频谱资源将不稳定。为了帮助实现c-mvno收益最大化,需要根据用户频谱需求动态的调整频谱投资策略。
问题解决主要分为3个部分:建立系统模型,建立分布不确定模型以及利用机会约束近似和鲁棒最优化方法转化带随机变量的约束条件。具体过程如下:
1、建立系统模型
如附图1所示,该认知无线电网络运营模型包含一个频谱拥有者,如中国移动。它根据历史信息,将认证频谱分为两部分:主带(感知带)和次带(租赁带)。主频带主要服务主用户,也称为认证用户。次频带主要售卖给c-mvno,比如中国的乐语企业等。移动虚拟运营商拥有自己的用户,这些用户都是二级未认证用户。乐语通过和中国移动签订长期合同租赁稳定频谱资源,或者在征得中国移动的同意后通过动态频谱接入技术感知主带获得空闲的频谱资源。c-mvno将这两部分频谱资源整合,通过自己建立的售卖机制出售给自己的用户群以获得收益。租赁可以确保获得稳定的频谱资源,但付出的代价相对较高,这个代价主要取决于c-mvno和运营商协商的频谱售卖价格。相对而言,通过感知的方式获得频谱,开销较小,其主要开销来自感知时间和精力。
步骤1.1:本发明主要目的是实现c-mvno的频谱投资收益最大化,用公式表示:
其中,代表角频率,t代表时隙序列,t∈t,π代表c-mvno出售单位频谱资源给其用户的价格,qt代表t时隙用户总需求,
步骤1.2:c-mvno在实现频谱投资收益最大化同时需要满足其用户频谱需求。这一约束用公式表示如下:
t时隙c-mvno频谱投资总策略要大于等于t时隙用户频谱需求。即系统模型为:
最大化
使得
θ∈[0,1],π≥0,t∈t,
2、建立分布不确定模型
步骤2.1:在前一部分已经完成系统建模,接下来我们从历史需求数据以及长期的观测数据中抽象出一个参照分布。我们将t时隙的真实需求分布记作g(qt)g(qt),该提取的参照分布记作ht(qt),真实的分布围绕着参照分布波动。
步骤2.2:利用kullback-leibler(kl)散度来描述真实分布和参照分布之间的差距。两个连续分布之间的kl散度定义如下:
这里s表示积分域。分布g(qt)和分布ht(qt)越接近,距离越接近0。利用kl散度,将用户需求分布不确定集合定义为:
γ(ht(qt,δt)={g(qt)|eg[lng(qt)-lnht(qt)]≤δt},
δt表示距离极限,该值可以根据需求经验数据或实时测量数据得到。真实的需求q波动的越剧烈,跟参照分布差距越大,即可调节δt至更大值。总而言之,用户需求分布需遵循下列约束:
eg[lng(qt)-lnht(qt)]≤δt,
eg[1]≤1。
3、利用机会约束近似和鲁棒最优化方法转化带随机变量的约束条件
步骤3.1:我们要解决的主问题(即1中系统模型)可以拆分为(1)式和(2)式两个问题,分步解决。引入一个极小的值γ,控制约束(2)的保守程度,则约束(2)式可以转化为下式:
γ定义为错误忍受率,它表示用户频谱需求得不到满足这种情况的可接受概率。上式的鲁棒性表达式为:
该式等同于:
定义
将(4)式转化为求解最优化问题如下:
满足eg[lng(qt)-lnht(qt)]≤δt(8)
eg[1]≤1(9)
步骤3.2:利用拉格朗日方法和karush-kuhn-tucker(kkt)条件处理最坏情况下的错误概率
η和τ是和(8)式,(9)式相关的拉格朗日乘子且τ>0。除此之外我们得到最坏情况的错误概率为:
步骤3.3:利用
步骤3.4解线性规划问题,得到c-mvno在每个t时隙的频谱决策并求得总的最大收益。
4.实验结果
这里给出仿真结果,用于评估所提出的频谱投资策略的性能,并评估不同系统参数的影响。我们考虑以下参数,假设参考分布服从均值为
实验结果分析4.1:分布不确定集的影响
将错误忍受极限γ设置为0.1,研究不同
实验结果分析4.2错误忍受极限γ的影响
将
实验结果4.3c-mvno的最大收益与鲁棒阈值
假设每个时隙的感知系数θt服从均值为μ=0.5,标准差σ为0.15的正态分布,如附图6所示。通过之前的分析,我们计算出鲁棒阈值如附图7所示。将单位感知开销cs和单位租赁开销cl分别设置为0.4和1。最后我们解决的主问题已经转变成了线性问题。正如附图8所示,虚线表示:根据上面提出的频谱投资决策,c-mvno在每个时隙的最大收益,而实线表示,c-mvno只选择租赁频谱这一策略时的收益。曲线和横坐标轴围成的面积代表到t时隙为止c-mvno的总收益。明显可以看出虚线在实线上面,即c-mvno可以从混合策略中获得更大收益。
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。