一种触感通信遥操作系统上行调度方法与流程

文档序号:18002063发布日期:2019-06-25 22:57阅读:310来源:国知局
一种触感通信遥操作系统上行调度方法与流程

本发明涉及通信技术领域,具体而言,尤其涉及一种触感通信遥操作系统上行调度方法。



背景技术:

触感通信网络作为5g通信网络中最为重要的用例之一,以其超低延时及超高可靠性在工业及学术研究方面得到广泛发展与应用。其中,人类在环触感通信是触感通信网络中的典型用例。典型的触感遥操作通信系统由主设备、从设备及通信网络组成。主设备(即操作员)控制机器人完成远程复杂环境中的操作,主设备的速度位置信息实时传输给远地机器人,同时远地机器人采集到的声音、画面及触感信息(力或力矩)经由通信网络传回主设备,进而产生身临其境的效果。由于通信网络中控制回路的闭环状态,触感遥操作系统对于延时敏感。因此,需要结合控制领域及通信领域,来达到触感遥操作系统的高灵敏度要求。触感遥操作系统涉及两种典型的控制结构:时域被动结构(time-domainpassivityapproach,tdpa)及模型调节结构(model-mediatedteleoperation,mmt)。

时域被动结构是一种被动控制结构,不仅可以在变延迟网络环境下保证遥操作系统的稳定性,而且在存在丢包的情况下仍能够保证其系统的稳定性。但是随着网络延迟的增加,系统输出能量也随之增加,被动控制器将被频繁启动以降低能量,此操作会造成力反馈值的迅速下降,从而引起失真。模型调节结构则是将远程环境模型放置在主设备本地区域,从设备实时估计模型参数,当获得一个新模型参数时,从设备将参数传递回主设备,随后主设备根据接收到的模型参数更新本地模型。模型调节结构的力反馈信号是通过本地模型算出,不通过网络传输,不存在任何通信延迟。因此,模型调节结构可以在任意网络环境下保证遥操作系统的稳定性和透明性,其系统性能的好坏取决于本地模型与远地环境的匹配程度。因此,在不同的延迟条件下,tdpa和mmt对用户体验质量(qoe)有不同的影响。

对于多用户存在于同一遥操作系统中的情况,为了获得最佳的整体用户体验质量(qoe),需要一种新的调度准则,根据延迟条件选择具有不同控制结构的用户进行调度,减小延迟对整体qoe的影响。



技术实现要素:

根据上述提出的技术问题,而提供一种触感通信遥操作系统上行调度方法。本发明主要在实现控制-通信融合的基础上提供一种上行链路调度方法,即根据qoe-延时模型针对具有不同控制结构的用户,设计一种新的调度准则,进而达到整体qoe最大化的要求,尽可能减小往返延时对遥操作系统用户体验质量的影响。

本发明采用的技术手段如下:

一种触感通信遥操作系统上行调度方法,包括由主设备、从设备和通信网络组成的触感遥操作系统,包括如下步骤:

s1:初始化设定触感遥操作系统中各参数,包括:

控制应用个数b、控制应用的速度位置信息b1的id集合b1={1,...,b,...,b1}、控制应用的力反馈信息b2的id集合b2={1,...,b,...,b2}、每个调度周期tti中的可用资源块rb的个数k、可分配给b1的可用资源块rb的id集合n1={1,...,k,...,k/2}、可分配给b2的可用资源块rb的id集合n2={k/2+1,...,k,...,k}、最大容许延时mtd以及用于表示每一个调度周期内资源块的分配方式的调度标识符αabk,αabk在每一个调度周期对应的资源块分配结束后输出:

s2:建立qoe-延迟模型,包括qoe-延时参数;分别给出第b个控制应用的速度位置信息与力反馈信息在第a个调度周期使用第n个资源块传输的效用值p(a,b,n);

s3:将最大容许延时mtd划分为若干调度周期,计算控制应用b的速度位置信息及力反馈信息的最大允许调度周期个数

其中,为控制应用b的最大容许延时mtd,δ为一个调度周期的长度;

s4:调度控制应用的速度位置信息,在调度周期a,选择效用值p(a,b,n)最小的控制应用b进行调度:

选择资源块分配模式矩阵f提供的资源块分配模式中对应的qoe-延时参数最小的一种资源块分配模式,作为控制应用b分配最适的资源块k传输速度位置信息,同时更新剩余的资源分配模式的资源块id集合n1,即n1←n1-{k};

当控制应用b的实际传输速率rbk大于请求的传输速率rb,即rbk>rb时,表示传输完成;

当rbk≤rb时,表示传输未完成,需要继续在剩余的资源块集合中为控制应用b分配最适的资源块传输速度位置信息;

若当前调度周期无法传输其全部数据,则在下一调度周期继续传输,直至速度位置信息数据传输完成,且控制应用b应在最大允许调度周期个数内完成传输;

s5:判断调度周期a的前k/2个资源块中,是否有资源块未被分配且仍有控制应用需要被调度;

如果有,则重复s4,继续选择需要被调度的控制应用进行速度位置信息的传输;否则,进入s6;

s6:调度已经传输完成速度位置信息的控制应用的力反馈信息,在调度周期a′,选择效用值p(a′,b′,n)最小的控制应用b′进行调度:

选择资源块分配模式矩阵f提供的资源块分配模式中对应的qoe-延时参数最小的一种资源块分配模式,作为控制应用b′分配最适的资源块k'传输力反馈信息,同时更新剩余的资源分配模式的资源块id集合n2,即n2←n2-{k′};

当控制应用b′的实际传输速率rb′k′大于请求的传输速率rb′,即rb′k′>rb′时,表示传输完成;

当rb′k′≤rb′时,表示传输未完成,需要继续在剩余的资源块集合中为控制应用b′分配最适的资源块传输力反馈信息;

若当前调度周期无法传输其全部数据,则在下一调度周期继续传输,直至力反馈信息数据传输完成,且控制应用b′应在最大允许调度周期个数内完成传输;

s7:判断当前调度周期a′的后k/2个资源块中,是否有资源块未被分配且仍有控制应用需要被调度;如果有,则重复s6,继续选择需要被调度的控制应用进行力反馈信息的传输;否则结束调度并输出调度标识符αabk。

进一步地,qoe-延时参数p(μ,νp)通过如下公式表示:

其中,μ为通信系统的往返延时;

νp代表控制结构:

p=1时代表tdpa,aν1=2.088,bν1=-1.82,cν1=58.48,dν1=4.585;

p=2时代表mmt,aν2=0,bν2=-1.187,cν2=793.7,dν2=3.64;

效用值p(a,b,n)通过如下公式进行计算:

进一步地,资源分配模式矩阵f表示为:

f=[f1,...,fn,...,fn]

f∈{0,1}m×n

fn=[f1n,...,fmn,...,fmn]t∈{0,1}m×1,1≤n≤n,1≤m≤m

其中,n表示矩阵f列数,m表示矩阵f的行数,n=m(m+1)/2;n表示允许的n种资源块分配模式;m表示当前时刻下可用资源块个数;矩阵f中“1”表示分配该位置的资源块给控制应用。

较现有技术相比,本发明具有以下优点:

1、本发明提供的触感通信遥操作系统上行调度方法,不仅适用于5g网络,同时适用于所有mac层具有时-频联合复用结构(time-frequencyresourcestructure)的网络,如lte网络,lte-a网络,ofdma系统等。

2、本发明提供的触感通信遥操作系统上行调度方法,可以直接应用于无线传感器-执行器网络(wirelesssensoractuatornetwork),具有与该网络的完全兼容性。

3、本发明提供的触感通信遥操作系统上行调度方法,将遥操作系统的控制结构转化为通信应用/服务,实现对不同控制结构下的遥操作系统兼容性。

4、本发明提供的触感通信遥操作系统上行调度方法,基于先前研究中适用于不同控制结构的遥操作系统的用户体验质量qoe与通信延时的数学模型,针对多个遥操作系统共用同一网络的问题,提出了新的调度方法用以最大化总体qoe,降低通信延时对用户体验质量的影响。

综上,应用本发明的技术方案在实现控制-通信融合的基础上提供一种上行链路调度方法,即根据qoe-延时模型针对具有不同控制结构的用户,设计一种新的调度准则,进而达到整体qoe最大化的要求,尽可能减小往返延时对遥操作系统用户体验质量的影响。因此,本发明的技术方案解决了现有技术中多用户存在于同一遥操作系统中时整体用户体验质量较差的问题。

基于上述理由本发明可在通信技术等领域广泛推广。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为典型的人类在环式力反馈遥操作系统基本框图。

图2为针对不同控制方案的qoe性能与通信延迟的设想关系。

图3为本发明实施例1所述实验数据主观测试系统设置。

图4为本发明实施例1所述不同控制结构下的主观测试实验结果。

图5为本发明所述触感通信网络上行调度方法流程图

图6为网络簇族示意图。

图7为本发明实施例1所述仿真实验采用的数据示例。

图8为本发明实施例1所述仿真实验采用的数据示例。

图9为本发明实施例1所述仿真实验中用户数量固定时,所提出的方法与已存在的比例公平方法的吞吐量比较结果。

图10为本发明实施例1所述仿真实验中资源块数量固定时,本发明所述调度方法与已存在的比例公平方法的吞吐量比较结果。

图11为本发明实施例1所述仿真实验中远程操作会话数量固定时,本发明所述调度方法与已存在的比例公平方法的总吞吐量比较结果。

图12为本发明实施例1所述仿真实验中资源块数量固定时,本发明所述调度方法与已存在的比例公平方法的总吞吐量比较结果。

图13为本发明实施例1所述仿真实验中遥操作会话数量固定时,本发明所述调度方法与已存在的比例公平方法的延时比较结果。

图14为本发明实施例1所述仿真实验中资源块数量固定时,本发明所述调度方法与已存在的比例公平方法的延时比较结果。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例1

如图1所示,典型的人类在环式力反馈遥操作系统包括主设备(即操作员)、从设备(即远程机器人)和通信网络。操作员操纵控制机器人在复杂的远程环境中进行一系列的遥操作,通信网络将操作员的位置和速度信息实时传输给远程机器人,然后通过通信网络将远程机器人感知的音频、视觉和触觉信息(例如力、扭矩等)传输回操作员,为其提供一种身临其境的体验。操作员感到到相应的触感信息并对当前的操作进行相应的判断调整,进而使远地机器人完成相应任务。

不同于传统的基于内容的数据传送,每个遥操作系统需要传输双向的数据:从操作者到远地机器人的速度位置信息,以及从远地机器人到操作者的力反馈信息。因此,在一个具有无线连接端点的远程遥操作系统中,需要具备两个上行传输链路和两个下行传输链路,如图1所示。假设所有无线电资源都由基站(bs)中的上行链路和下行链路调度器管理,提供了一种下行链路调度器,以便与所提出的上行链路调度器耦合。这意味着一旦上行链路调度器调度该远程操作会话,下行链路调度器将立即以先入先出的方式服务远程操作系统。因此,下行链路引入控制环路的队列延迟将为定值。进而,遥操作系统的通信延时完全由上行链路决定。

如图2所示为针对不同控制方案的qoe性能与通信延迟的设想关系,以及根据主观测试数据进行曲线拟合后的不同控制结构下通信延时与qoe的关系模型,从通信的角度,对于具有不同控制结构的远程遥操作系统需要根据当前通信延迟动态地分配无线资源,以实现最好的性能,如附图2中虚线包络曲线所示。

如图5所示,本发明提供了一种触感通信网络上行调度方法,包括由主设备、从设备和通信网络组成的触感遥操作系统,采用了极大化极小值的方法,包括如下步骤:

s1:初始化设定触感遥操作系统中各参数,包括:

控制应用个数b、控制应用的速度位置信息b1的id集合b1={1,...,b,...,b1}、控制应用的力反馈信息b2的id集合b2={1,...,b,...,b2}、每个调度周期tti中的可用资源块rb的个数k、可分配给b1的可用资源块rb的id集合n1={1,...,k,...,k/2}、可分配给b2的可用资源块rb的id集合n2={k/2+1,...,k,...,k}、最大容许延时mtd以及用于表示每一个调度周期内资源块的分配方式的调度标识符αabk,αabk在每一个调度周期对应的资源块分配结束后输出:

在本实施例中,控制应用英文为controlapplication,也有写作controlsession控制会话,和需要被服务的用户等价;

在本实施例中,每个调度周期结束后都会相应得到对所选的资源块的分配方式,按照所选用户的情况和所选资源块的情况输出相应分配形式,调度标识符是指一个调度周期内,某一用户是否使用某一资源块,输出的调度标识符的数量根据用户和资源块的选择情况决定;

s2:建立qoe-延迟模型,包括qoe-延时参数;分别给出第b个控制应用的速度位置信息与力反馈信息在第a个调度周期使用第n个资源块传输的效用值p(a,b,n);效用值越大表示qoe越好,调度算法的优化目标是最大化所有遥操作系统应用的效用值之和;

s3:将最大容许延时mtd划分为若干调度周期,计算控制应用b的速度位置信息及力反馈信息的最大允许调度周期个数

其中,为控制应用b的最大容许延时mtd,δ为一个调度周期的长度;

s4:调度控制应用的速度位置信息,在调度周期a,选择效用值p(a,b,n)最小的控制应用b进行调度:

选择资源块分配模式矩阵f提供的资源块分配模式中对应的qoe-延时参数最小的一种资源块分配模式,作为控制应用b分配最适的资源块k传输速度位置信息,同时更新剩余的资源分配模式的资源块id集合n1,即n1←n1-{k};

当控制应用b的实际传输速率rbk大于请求的传输速率rb,即rbk>rb时,表示传输完成;

当rbk≤rb时,表示传输未完成,需要继续在剩余的资源块集合中为控制应用b分配最适的资源块传输速度位置信息;

若当前调度周期无法传输其全部数据,则在下一调度周期继续传输,直至速度位置信息数据传输完成,且控制应用b应在最大允许调度周期个数内完成传输;

s5:判断调度周期a的前k/2个资源块中,是否有资源块未被分配且仍有控制应用需要被调度;

如果有,则重复s4,继续选择需要被调度的控制应用进行速度位置信息的传输;否则,进入s6;

s6:调度已经传输完成速度位置信息的控制应用的力反馈信息,在调度周期a′,选择效用值p(a′,b′,n)最小的控制应用b′进行调度:

选择资源块分配模式矩阵f提供的资源块分配模式中对应的qoe-延时参数最小的一种资源块分配模式,作为控制应用b′分配最适的资源块k'传输力反馈信息,同时更新剩余的资源分配模式的资源块id集合n2,即n2←n2-{k′};

当控制应用b′的实际传输速率rb′k′大于请求的传输速率rb′,即rb′k′>rb′时,表示传输完成;

当rb′k′≤rb′时,表示传输未完成,需要继续在剩余的资源块集合中为控制应用b′分配最适的资源块传输力反馈信息;

若当前调度周期无法传输其全部数据,则在下一调度周期继续传输,直至力反馈信息数据传输完成,且控制应用b′应在最大允许调度周期个数内完成传输;

s7:判断当前调度周期a′的后k/2个资源块中,是否有资源块未被分配且仍有控制应用需要被调度;如果有,则重复s6,继续选择需要被调度的控制应用进行力反馈信息的传输;否则结束调度并输出调度标识符αabk。

进一步地,为了研究不同延迟条件下具有不同控制结构的力反馈遥操作系统的qoe性能,搭建了基于chai3d库的虚拟环境(vr),主设备为phantomomni,从设备为一个单独的质量忽略不计的触觉互联节点,并使用本地pc模拟具有可调延迟的通信网络;返延迟设置为0毫秒,10毫秒,25毫秒,50毫秒,100毫秒,和200毫秒。p(μ,νp)通过探究qoe与往返延时关系的一维弹簧系统的主观测试结果经曲线拟合后得出,具体表现为不同控制结构的系统具有不同的系数,导致其往返延时对qoe影响的不同,如图3所示为主观测试系统设置,图4为不同控制结构下的主观测试实验结果,根据实验结果根据曲线拟合的方式得出qoe-延时参数p(μ,νp)通过如下公式表示:

其中,μ为通信系统的往返延时;

νp代表控制结构:

p=1时代表tdpa,aν1=2.088,bν1=-1.82,cν1=58.48,dν1=4.585;

p=2时代表mmt,aν2=0,bν2=-1.187,cν2=793.7,dν2=3.64;

效用值p(a,b,n)是p(μ,νp)的归一化结果,通过如下公式进行计算:

在本实施例中,在传输速度位置信息时,使用的是两个上行链路与两个下行链路的固定延时时间,在传输力反馈信息时,由于速度位置信息已经传输完成,之前的延时已知,只需要在返回的链路里使用一个上行链路与一个下行链路的固定延时,与之前由于速度位置信息传输造成的延时相加就可以。

进一步地,在具体的5g网络的无线资源分配中引入了“网络分簇”的概念,如图6所示,假设基站至少分配a个子信道给控制应用,以保证控制信号的实时传输,确保控制系统的稳定性,调度器负责在每个调度周期将a个资源块分配给控制应用,由于同一个控制应用的数据必须分配给相邻的资源块,因此本发明定义资源分配模式矩阵f表示为:

f=[f1,...,fn,...,fn]

f∈{0,1}m×n

fn=[f1n,...,fmn,...,fmn]t∈{0,1}m×1,1≤n≤n,1≤m≤m

其中,n表示矩阵f列数,m表示矩阵f的行数,n=m(m+1)/2;n表示允许的n种资源块分配模式;m表示当前时刻下可用资源块个数;矩阵f中“1”表示分配该位置的资源块给控制应用;

下面对资源分配模式矩阵f的计算过程举例说明:

若m=3,则n=6,即有3个可用资源块,对应6种资源块分配模式;

具体的6种资源块分配模式分别为:

(1,0,0):选择资源块1;

(0,1,0):选择资源块2;

(0,0,1):选择资源块3;

(1,1,0):选择资源块1和2;

(0,1,1):选择资源块2和3;

(1,1,1):选择资源块1、2和3。

本实施例根据qoe-延时模型针对具有不同控制结构(时域被动结构tdpa或模型调节结构mmt)的用户,设计一种新的调度方法,对于多用户存在与同一遥操作系统中,新的调度准则能够根据延迟条件选择具有不同控制结构的用户进行调度;且能够最大程度地降低通信延迟对qoe的影响,即在有限的带宽下最小化qoe-延迟模型的值;该方法将原问题转化为极大化极小值问题,根据qoe-延时模型的特点,分为前向与后向信道的资源分配。

整个调度过程分为两部分:位置速度信息资源调度和力反馈信息资源调度;每个部分最多可以被分配n/2个资源块(令整个过程的可分配资源块个数为n)。由于所提出的qoe度量随着延迟的增大而增加,该算法选择具有最小qoe值的应用进行调度,进而达到使整体qoe最大的目的。

为了进一步验证本发明技术方案的性能和效果,下面通过多个不同控制结构下的力反馈遥操作系统共用同一网络的仿真实验对本发明技术方案做进一步说明:

上行链路调度器使用lte网络的开源模拟器lte-sim来实现,并通过与pf算法的比较来评估其性能。

实验场景为两蜂窝组成的多蜂窝场景,每个蜂窝的服务半径为1km,具有上下行链路,每个链路之中拥有25个子信道,带宽为5mhz。远程操作会话由每个蜂窝中的enb服务。假设两蜂窝彼此相邻,信息交换延迟忽略不计,并假设所有的遥操作会话共享相同的无线电资源。

假设tdpa中的速度位置信息与力反馈信息的数据包大小分别为24字节和24字节,而mmt中速度位置信息与力反馈信息的数据包大小分别为12字节和48字节。根据网络簇族的概念,在每个tti中,一个资源块(子信道)将只被分配给一个远程操作会话。此外,仿真实验引入了一个与所提出的上行链路调度器耦合的下行链路调度器,它通过增加7.5ms的恒定延迟来实现,在信道接入过程中由于握手协议引起的17.5ms的恒定延迟也被添加到系统中。此外,考虑到人类在环的遥操作系统的特殊性,力反馈信息只有在相应的速度位置信息被成功接收后才能被发送。

实验选取三组服务量(50%tdpa和50%mmt)来评估所提出的上行链路调度器:1)每个蜂窝种具有6个远程操作会话;2)每个蜂窝种具有8个远程操作会话;3)每个蜂窝中具有10个远程操作会话。实验选取吞吐量,总吞吐量,通信延时三个特性对所提出的算法进行性能分析,并与已存在的比例公平(pf,proportionalfair)算法进行性能比较,进一步分析其可行性与优越性。

仿真结果详见附图7至附图14。如图7和图8所示为主观测试数据示例。如图9所示,对于用户数量固定的情况下,吞吐量随资源块数量的增加而增加,并且所提出的调度器在所有情况下优于pf调度器。在资源块数量固定的情况下也可得出类似的结论,如图10所示。如图11所示,当远程操作会话数量固定时,两个调度器的总吞吐量都随资源块的增加而增加。但所提出的调度器的总吞吐量总是大于pf调度器的总吞吐量。对于资源块数量的固定数的情况也可得出类似的结论,如图12所示。由于qoe与通信延时成反比关系,可以通过通信延时变化来判断qoe的性能,如图13所示。当遥操作会话数量固定时,通信延迟随着资源块数量的增加而减小。但所提出的调度器的通信延时总是小于pf调度器更小的延迟。当资源块数量固定时,所提出的上行链路调度器的延迟随远程操作会话数量的增加而增加,但始终能够保持其通信延时小于pf调度器的通信延时,如图14所示。

使用本发明方案的调度机制的后受延迟影响较pf调度相比减小,从而qoe优于pf调度器,证明本发明方案的可行性。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1