一种面向高速列车的云无线接入网络资源分配方法及系统与流程

文档序号:17938244发布日期:2019-06-18 22:48阅读:163来源:国知局
一种面向高速列车的云无线接入网络资源分配方法及系统与流程

本发明属于云无线接入网络领域,特别涉及一种面向高速列车的云无线接入网络资源分配方法及系统。



背景技术:

高速列车作为绿色、高速、便捷的交通工具,在近几年取得了迅速的发展。据国家铁路局预测,到2020年,我国高铁线路长度将达到3万公里。在未来,高速铁路技术将与信息技术集成融合,构建一个可以高效利用资源,实现高铁移动装备、固定基础设施及内外部环境间信息的全面感知、泛在互联、科学决策的智能化高速铁路系统。而铁路系统高速化和智能化,将对现有的铁路通信系统提出更高的要求。

一方面,由于高速列车的高移动性(运行速度超过每小时350公里),在铁路沿线不同小区之间的切换将会频繁发生,这将会对数据传输的实时性、可靠性造成影响。另一方面,随着移动通信技术的飞速发展,人们对高速列车的期待也不仅仅是满足出行服务,同时希望可以在高速列车上享受各种各样的移动车载服务。同时,列车本身也具有安全监控、故障检测等服务需求;而铁路沿线布置的相关资源相对短缺,目前的铁路通信系统不能满足高数据率业务呈指数增长的需求,无法为乘客提供满意的服务质量。因此,高速列车迫切需要一个功能完善的资源分配方法和系统,既可以减少切换频率,实现灵活的操作,又可以提供合理的资源分配方案,在保证高速列车安全行进的前提下,满足乘客的各种娱乐需求。构建一个集可靠、安全运行、高效资源利用和信息共享于一体的综合系统。



技术实现要素:

本发明提出了一种面向高速列车的云无线接入网络资源分配方法及系统,可以将高速列车上的服务请求卸载到资源丰富的地面控制中心资源池中,以面对高速列车呈指数增长的高数据率业务增长需求。通过本发明所述方法,还减少了高速列车的通信切换频率,提高了资源利用效率,降低了服务拒绝率,提高了系统服务质量和总的系统效益。

为了实现上述技术目的,本发明的技术方案是,

一种面向高速列车的云无线接入网络资源分配方法,包括以下步骤:

步骤1:车载控制模块将来自于多个车载无线接入模块的服务请求划分为多个优先级别,并通过车载通信模块将服务请求发送至轨道旁的无线接入系统;

步骤2:地面控制中心接收到服务请求,并采用马尔可夫决策过程,对服务请求及当前系统状态进行建模;

步骤3:地面控制中心根据当前系统状态,建立对应所有可能的决策集合,并针对该集合中的每个决策,求解对应的状态值函数;

步骤4:根据求解的状态值函数,采取使状态值函数最大的相应决策,作为地面控制中心对该服务请求的最终资源分配决策。

所述的方法,步骤1中,在对服务请求进行划分时,是按照将乘客请求划分为低优先级,将列控信息服务请求划分为高优先级的原则进行划分。

所述的方法,步骤2中,建模包括以下步骤:

系统状态表示为:s={s|s=<s1,s2,…,sc,e(s)>},并满足其中m代表系统中的资源总数;

其中s1,s2,…,sc表示占据c个计算资源的服务的数量,c∈{1,2,…,c},c表示系统可以分配给一个服务请求的最大资源数目;e(s)∈{ah,al,d1,d2,…,dc},表示即将到来的事件,其中ah表示高优先级服务请求的到达,al表示低优先级服务请求的到达,dc表示服务完成离开并释放c个计算资源。

所述的方法,步骤3包括以下过程:

以a(s)表示系统在接收到新的请求e(s)之后所采取的动作,有:

其中a(s)=1,2,…,c表示系统选择接受服务并将c个计算资源分配给服务,a(s)=0表示拒绝服务请求,a(s)=-1表示服务请求完成并释放所占用的计算资源并更新s1,s2,…,sc的值;

以状态s和下一个状态s'的转移概率p(s'|s,a)是通过选择动作a(s)从状态s到状态s'的转换概率,则ζ(s,a)表示为(s,a)的决策期,即通过选择动作a(s)从状态s到状态s'的时间,以γ(s,a)表示事件的累积事件率,有

上述公式中,λl代表低优先级服务请求的到达速率,λh代表高优先级服务请求的到达速率,μp代表系统中单位计算资源对服务请求的处理速率,其中表示选择a=0即拒绝服务请求,则所占用的计算资源的总数不变,γ(s,a)为在选择拒绝服务请求之后从当前状态s到其他进程的速率之和;表示选择a=-1即完成服务请求并释放所占用的i个计算资源,γ(s,a)由i减小;γ(s,a)=表示选择a=1,2,…,c即存在新的服务请求,系统选择接受服务并将c个计算资源分配给服务,γ(s,a)由此增加;

然后为所有的决策设置一个当前决策所能产生的即时系统回报值函数以找到使系统整体报酬最大化的最优决策,即在状态s选择动作a(s)时的期望系统报酬r(s,a):

r(s,a)=k(s,a)-g(s,a),

其中k(s,a)是在状态s选择动作a(s)时的即时收入,

其中e表示当服务请求被接纳到系统时的收入,n和n是服务请求的优先级和服务请求的总优先级,β表示每单位服务时间的开销,β/cμp表示通过接受具有c个计算资源的新服务请求而导致的平均服务时间的开销,拒绝请求的惩罚因子表示为δ1;

g(s,a)是下一决策期之前的系统成本,表示为τ(s,a)*o(s,a),τ(s,a)是系统当前到下一决策期之前的时间,o(s,a)是每单位时间占用计算资源的成本,

所述的方法,所述的步骤4包括以下过程:

针对系统当前状态s,对应所有可能的决策集合a(s),状态转移概率p(s'|s,a)和对应下一可能状态s'的状态值函数v(s’),通过值迭代算法寻找状态值函数的最大值,并寻找使之最大的相应策略,求解状态值函数为:

其中λ表示当前决策产生的下一状态的长期回报函数值,会对当前状态长期回报函数产生的反馈影响。λ∈[0,1],λ越接近0,我们的决策越“短视”,λ更接近1则会使决策更“长远”的考虑该决策导致的未来状态会对当前决策产生的影响;α表示折扣因子,γ(s,a)表示事件的累积事件率。

利用值迭代的方法计算最优策略进行优化:首先,设置长期折扣奖励v(s)=0,并设迭代次数k=0,然后为每个状态s’计算v(s'),直到v(s)收敛到相同值,输出使系统状态值函数最大的策略,作为系统的最终决策策略。

所述的方法,在设置系统即时收入k(s,a)时,考虑到当前服务请求的优先级n和服务请求的总优先级n,n的数值越大表示该服务所属优先级别越高,根据服务请求所属的优先级n的取值大小,为高优先级的服务请求设置相对较高的接受请求系统收益和拒绝请求系统损失,为低优先级的服务请求设置相对较低的接受请求系统收益和拒绝请求系统损失。

一种面向高速列车的云无线接入网络资源分配系统,包括车载子系统、多个轨道旁无线接入系统和多个地面控制中心;

所述车载子系统包括互相通信连接的车载移动终端设备、列控信息模块模块、车载服务处理模块和车载通讯模块;

所述轨道旁无线接入系统沿高速列车专线布置,并与车载子系统中的车载通信模块之间进行双向通信,同时通过有线设备与地面控制中心建立连接;

所述地面控制中心包括互相通信连接的存储模块,决策模块、资源分配模块和计算模块。

所述的系统,所述车载移动终端设备为乘客随身携带的具有无线通信功能的移动终端;所述车载列控信息模块提供列车安全运行相关的安全监控和故障诊断信息;车载服务处理用于服务类型所属优先级别的标签划分;车载通信模块用于所有车载子系统中的服务请求的接入和管理,并将服务请求以及其所属优先级别标签发送至轨道旁无线接入系统。

所述的系统,所述地面控制中心的存储模块负责存储来自于轨道旁无线接入系统的各类数据;决策模块负责对不同的服务请求进行卸载决策和资源分配决策;资源分配模块负责执行决策模块作出的资源分配结果;计算模块负责处理计算和卸载到云端的各类服务。

本发明的技术效果在于,通过在铁路沿线布置多个无线接入点,通过光纤等有线设备与地面控制中心建立连接,一方面可以享受地面控制中心的计算资源,从而满足高速列车上的高速率服务需求,另一方面减少了列车通信的切换频率,提升了服务质量。服务请求被上传到地面控制中心后,建模为半马尔科夫决策过程,依据服务请求所属优先级别,同时考虑了如果接受服务请求会产生的系统收益、执行该决策会产生的计算开销,以及如果拒绝服务请求会产生的系统损失。最后求解系统的长期系统回报值函数,选取最优策略,最大化总的系统效益,提高了资源利用效率,降低了服务拒绝率,提高了系统服务质量。

附图说明

图1为面向高速列车的云无线接入网络系统架构图;

图2是面向高速列车的云无线接入网络系统硬件结构图;

图3是本发明的资源分配算法流程图。

具体实施方式

下面将结合附图和实施例,对本发明实施例中的技术方案进行进一步的说明。

如图1所示,面向高速列车的云无线接入网络系统架构图。在该架构中,高速列车可以访问路边的多个轨道旁无线接入系统,并通过高速前线链路连接到多个地面控制中心中的集中资源池。因此,大部分计算密集型任务都迁移到云数据中心的资源池中。具体来说,资源池可以根据各种服务质量要求和服务请求的优先级实现资源共享和动态资源调度。此外,乘客可以使用连接到资源池的各种设备随时访问计算资源。这种集中的信号处理结构可以减少列车通信的切换频率,降低能耗,提高硬件利用率,实现动态调度和灵活操作。

如图2所示,面向高速列车的云无线接入网络系统硬件结构图,由车载子系统、多个轨道旁无线接入系统和多个地面控制中心组成。

所述车载子系统包括车载移动终端设备、列控信息模块模块、车载服务处理模块和车载通讯模块。其中:

车载移动终端设备来自于乘客随身携带的具有无线通信功能的移动终端;

车载列控信息模块负责和列车安全运行相关的安全监控、故障诊断等服务;

车载服务处理负责服务类型所属优先级别的标签划分。

车载通信模块负责所有车载子系统中的服务请求的接入和管理,并将服务请求以及其所属优先级别标签发送至轨道旁无线接入系统。

所述轨道旁无线接入系统沿高速列车专线布置。负责与车载子系统中的车载通信模块之间进行双向通信,还可通过光纤等有线设备与地面控制中心建立连接。

所述地面控制中心包括存储模块,决策模块、资源分配模块和计算模块。其中:

存储模块负责存储来自于轨道旁无线接入系统的各类数据;

决策模块负责对不同的服务请求进行卸载决策和资源分配决策;

资源分配模块负责执行决策模块作出的资源分配结果;

计算模块负责处理计算卸载到云端的各类服务。

其中列车显示与广播控制单元主用用来处理司机的控制指令与音频、视频信号;乘客广播通信单元主要与列车显示与广播控制单元通信,完成对音频信号的广播以及视频信号的显示;司机语音控制单元主要负责处理司机的控制信号并传送给列车显示于广播控制单元。本系统的通信网络按照其功能分为列车级音频广播总线、列车级视频广播总线和列车级rs485控制总线。

如图3所示,本发明的资源分配算法流程图包括以下步骤:

步骤1:车载控制模块将来自于多个车载无线接入模块的服务请求划分为l个优先级别,并通过车载通信模块将服务请求发送至轨道旁无线接入系统;

步骤2:地面控制中心接收到服务请求,并采用马尔可夫决策过程,对服务请求及当前系统状态进行建模;

步骤3:地面控制中心根据当前系统状态,建立对应所有可能的决策集合,并针对该集合中的每个决策,求解对应的状态值函数;

步骤4:根据求解的状态值函数,采取使状态值函数最大的相应决策,作为地面控制中心对该服务请求的最终资源分配决策。

在上述算法中,首先要针对当前的系统状态,考虑被划分为l个优先级别的多个车载无线接入模块的服务请求,采用马尔可夫决策过程,对服务请求及当前系统状态进行建模。为了简单起见,我们考虑参与资源分配的两类服务:低优先级的乘客请求和高优先级的列控信息服务请求。

在可能的系统状态集合中,状态集合s由两个部分组成:一个是占据c个计算资源的服务的数量,表示为s1,s2,…,sc,其中c∈{1,2,…,c};另一个是即将到来的事件e(s)。

具体的,有三种类型的事件e(s):1)分别由al和ah表示的高优先级或低优先级服务请求的到达;2)服务完成离开并释放c个计算资源由dc表示。因此,事件是e(s)∈{ah,al,d1,d2,…,dc},系统状态可以表示为:s={s|s=<s1,s2,...,sc,e(s)>},并且需要满足

此外,在系统接收到新的请求e(s)之后,应道考虑针对该状态可以采取的所有可能的决策:如果有新的服务请求,系统可以选择接受服务并将c个计算资源分配给服务,用a(s)=c,c∈{1,2,…,c}表示;或者选择拒绝服务请求,用a(s)=0表示;。如果有服务请求完成并释放所占用的计算资源,则更新s1,s2,…,sc的值,并且a(s)=-1。

综上所述,动作空间a(s)概括如下:

此外,考虑每个决策会导致系统在下一时刻转变成何种状态,并求解转移到其他所有可能状态的概率。假设状态s和下一个状态s'的转移概率p(s'|s,a)是通过选择动作a(s)从状态s到状态s'的转换概率。ζ(s,a)可表示为(s,a)的决策期是通过选择动作a(s)从状态s到状态s'的时间。由于服务请求和车辆到达服从泊松分布,所以两个决策期之间的平均期望时间也具有指数分布。我们首先确定事件的累积事件率γ(s,a)。则

由于到达请求可以分为al和ah。当所选择的动作a(s)等于0,这意味着拒绝服务请求时,所占用的计算资源的总数不变,因此累积事件速率γ(s,a)可以表示为在选择动作a(s)之后从当前状态s到其他进程的速率之和。当所选动作a(s)等于-1时,将完成服务请求并释放所占用的i个计算资源。因此,累积事件率γ(s,a)由i减小。类似地,当所选动作a(s)等于c时,存在新的服务请求,系统可以选择接受服务并将c个计算资源分配给服务。因此累积事件率γ(s,a)由此增加。而状态间的转移概率为响应的服务到达率与总速率的比值。

此外,要为所有的决策设置一个当前决策所能产生的即时系统回报值函数。该即时系统回报值函数同时考虑了如果接受服务请求会产生的系统收益、执行该决策会产生的计算开销,以及如果拒绝服务请求会产生的系统损失。并且,根据服务请求所属的优先级,为高优先级的服务请求设置相对较高的接受请求系统收益和拒绝请求系统损失,为低优先级的服务请求设置相对较低的接受请求系统收益和拒绝请求系统损失。

为了找到使系统整体报酬最大化的最优决策,我们定义了在状态s选择动作a(s)时的期望系统报酬r(s,a)。

r(s,a)=k(s,a)-g(s,a),

其中,k(s,a)是在状态s选择动作a(s)时的即时收入,这可以计算为即时收入减去系统的成本。k(s,a)可以定义为:

其中e表示当服务请求被接纳到系统时的收入。n和n是服务请求的优先级和服务请求的总优先级。β表示每单位服务时间的开销,因此β/cμp表示通过接受具有c个计算资源的新服务请求而导致的平均服务时间的开销。拒绝请求的惩罚因子表示为δ1。对于服务使用c个计算资源并离开系统的事件,边缘云计算网络已经完成了相应的服务,这意味着不影响奖励。因此k(s,a)等于零。

g(s,a)是下一决策期之前的系统成本,可表示为ζ(s,a)×ο(s,a),,ο(s,a)是每单位时间占用计算资源的成本,可定义为

最后,针对系统当前状态s,对应所有可能的决策集合a(s),状态转移概率p(s'|s,a)和对应下一可能状态s'的状态值函数v(s’),通过值迭代算法寻找状态值函数的最大值,并寻找使之最大的相应策略,最大折扣模型问题可以表示为:

其中λ表示当前决策产生的下一状态的长期回报函数值,会对当前状态长期回报函数产生的反馈影响。λ∈[0,1],λ越接近0,我们的决策越“短视”,λ更接近1则会使决策更“长远”的考虑该决策导致的未来状态会对当前决策产生的影响;α表示折扣因子,γ(s,a)表示事件的累积事件率。

针对该模型的优化问题,利用值迭代的方法计算最优策略。首先,设置长期折扣奖励v(s)=0,并设迭代次数k=0。然后,为每个状态s’计算v(s'),直到v(s)收敛到相同值。输出使系统状态值函数最大的策略,作为系统的最终决策策略。

综上所述,本发明实施例提供的一种面向高速列车的云无线接入网络资源分配方法及系统,通过在铁路沿线布置多个无线接入点,通过光纤等有线设备与地面控制中心建立连接,一方面可以享受地面控制中心的计算资源,从而满足高速列车上的高速率服务需求,另一方面减少了列车通信的切换频率,提升了服务质量。为了达到这样的效果,首先,将高速铁路云无线接入网的资源分配问题建立为一个系统状态空间定义的半马尔科夫模型。奖励策略考虑了接受请求的收入、占用资源单元的消耗系数和拒绝请求的惩罚系数。其目标是最大化系统平均报酬。其次,为了合理配置稀缺资源,引入了服务请求的优先权概念。将不同类型的服务划分为几个优先级别,在优先保障列车相关列控信息的服务前提下,为乘客提供高质量的多样服务,保障了不同业务之间的优先级,提高了系统性能。最后,应用值迭代算法求解。从即时奖励和反馈奖励中可以得到最优策略。该方法适用于计算不同请求到达率下的动态最优策略,克服传统算法的短视性,最大限度地提高系统收益,降低服务拒绝率。

以上所述仅为本发明的较佳实施例,对本发明而言仅仅是说明性的,而非限制性的。本专业技术人员理解,在本发明权利要求所限定的范围内可对其进行许多修改,但都将落入本发明的保护范围内。本发明的研发由国家自然科学基金项目61672539,61672537,61803394,61873353,61772558提供部分支持。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1