一种基于信息新鲜度的车联网传输方法及装置与流程

文档序号:17431539发布日期:2019-04-17 03:33阅读:300来源:国知局
一种基于信息新鲜度的车联网传输方法及装置与流程

本发明涉及车联网技术领域,特别是涉及一种基于信息新鲜度的车联网传输方法及装置。



背景技术:

随着科技的发展和技术的进步,各种传感器设备不断普及,几乎遍及每个角落,它们主要用于信息的采集和传输,以支撑环境监测、车辆定位、异常检测等应用。这类信息的时效性尤其重要,其重要性也与时效性正相关,一般随着时间的流逝其重要性急剧下降。为了衡量信息的时效性,学者们提出了信息年龄这一指标。信息年龄可以用来衡量一个网络中信息的时效性,信息年龄的含义是指从信息产生到当前时刻为止的时间差,和时延最大的区别在于信息年龄不仅仅包含信息的传输时延,还包括信息在源节点的等待时间以及在目的节点的停留时间。对于包含多个源节点的信息更新网络,假设每个源节点需要收集信息,并汇聚到同一个目的节点,则在目的节点包含每个源节点的信息年龄。

对于每个源节点的信息年龄,定义为最新的信息的年龄,即每收到一个来自该源节点的新的数据包,目的节点中对于该源节点的信息年龄则变更为最新信息的信息年龄,否则该源节点的信息年龄线性增长。因此,目的节点中每个源节点的信息年龄都为锯齿形,如图1所示。图中hi(t)表示源节点i在时刻t的信息年龄,ti,k表示源节点i的第k个数据包的生成时间,t′i,k表示源节点i的第k个数据包到达目的节点的时间,表示源节点i的第k个数据包从生成到发送到目的节点的时差,即排队时延与传输时延之和。源节点i的更新公式可以表示为:

为了保证网络中信息的时效性,一般期望信息采集节点尽可能快的进行信息采集,但是由于网络资源有限,如果所有的节点都以较快的速率进行信息采集,将会导致网络负载较大,甚至导致网络拥塞,反而使得数据包无法有效的到达目的节点。因此,在网络资源受限的情况下,存在一个最佳的信息更新策略。为了得到最佳的信息更新策略,一般以最小化平均信息年龄或者峰值信息年龄为目标函数进行求解。平均信息年龄为一段时间内所有源节点的信息年龄的平均值,而峰值信息年龄则表示为一段时间内所有源节点的信息年龄的最大值。此外,信息更新策略还与节点排队策略有关,常见的排队策略有先入先出、先入后出、按优先级等。

车联网的发展目标是成为一个集感知、通信和计算为一体的智能平台,因此在车联网中信息采集更新占很大比重。在车联网中,每个车辆采集节点对周围环境进行信息采集,然后将采集到的信息发送给目标节点或者汇聚到某个节点,从而通过这些收集到的信息对智能交通、车辆定位跟踪、路线规划等需求提供指导。因此,在此情况下,信息的时效性将至关重要,太过陈旧的信息不仅无法提供帮助,有时候反而会引发交通拥堵甚至发生车祸。同时,车联网作为一个高动态性的网络,每个节点高速移动,因此,在优化信息年龄时,不仅要考虑每个节点的更新时间,还要结合每个信息的路由变化,即将信息更新与动态路由选择同时考虑。

车联网可以看作是manets(mobileadhocnetworks,移动自组织网络)的特殊情况,因此大多数车联网的路由算法都源于移动自组织网络中的路由算法。但是由于车联网的一些独有特性,导致不能直接移植移动自组织网络的路由算法。与移动自组织网络相比,车联网中的节点移动速度更快,导致剧烈的拓扑变化;车联网中环境更加复杂,建筑物遮挡等导致信道质量较差;车联网中的节点移动受到道路限制,具有更强的规律性。

根据路由算法的自适应性和学习能力,路由算法可以分为静态的非自适应路由算法和动态的自适应路由算法。车联网中节点高速移动,拓扑变化频繁,因此静止的非自适应路由算法不太适用,而动态的自适应路由算法较为适合,可以根据网络拓扑或者周围环境的变化自动调整路由策略。现有技术中,在多跳网络中通过优化吞吐量得到的路由算法,由于以吞吐量、时延等网络指标为优化目标,虽然可以最大化网络吞吐量,提高资源利用率,但是不能衡量网络中每个节点的信息时效性。



技术实现要素:

本发明实施例的目的在于提供一种基于信息新鲜度的车联网传输方法及装置,以降低网络中的信息年龄。具体技术方案如下:

本发明实施例提供了一种基于信息新鲜度的车联网传输方法,所述方法包括:

根据初始目标函数以及在预设时间段t内任一车辆采集节点不发送数据包时,确定该车辆采集节点的信息年龄为t2/2,得到更新目标函数所述初始目标函数表示使各车辆采集节点在预设时间段t内发送至接入点ap的最新数据包的信息年龄的平均值最小化;表示车辆采集节点的集合,ri(t)表示时刻t车辆采集节点i是否进行数据包采集,如果是,ri(t)=1,否则,ri(t)=0,表示所述ap在时刻t关于车辆采集节点i的信息年龄;

车辆采集节点i在时刻t产生的更新包的时延xi,k表示在时刻t车辆采集节点i是否采集第k个数据包,表示车辆采集节点i的第k个数据包从生成到发送到所述ap的时差,

根据lyapunov稳定性理论,得到lyapunov函数

qj(t)表示时刻t节点j的数据包个数,

节点j在时刻t+1的数据包个数

表示车辆采集节点、ap和车辆传输节点的集合,表示车辆采集节点和车辆传输节点的集合,i表示指示函数,如果否则fj,n(t)表示时刻t节点j是否向节点n发送数据包,如果是,fj,n(t)=1,否则,fj,n(t)=0,rj(t)表示时刻t节点j是否进行数据包采集,fn,j(t)表示时刻t节点n是否向节点j发送数据包;表示时刻t节点j是否向节点n发送了车辆采集节点i产生的第k个数据包,如果是,否则,表示时刻t节点n是否向节点j发送了车辆采集节点i产生的第k个数据包;

通过最小化lyapunov函数变化率对网络进行约束,得到最终目标函数minδlt-λφt,在预设时间段t内lyapunov函数的变化量δlt=l(θ(t+t))-l(θ(t)),λ表示非负可调参数,φt表示对所述更新目标函数进行优化处理后的优化函数;

计算所述最终目标函数在t=1时的上限,通过最小化所述上限确定最小化所述最终目标函数的次优解:

b为常数,qi(t)表示时刻t车辆采集节点i的数据包个数,sj表示节点j的邻居节点集合;

得到更新策略函数以及路由算法函数

根据所述更新策略函数确定更新策略为qmax表示车辆采集节点i的数据包最大个数,

根据q-learning算法和所述路由算法函数,得到基于q-learning的背压式算法,所述基于q-learning的背压式算法中,时刻t节点np的邻居节点na的衡量因子表示时刻t节点np所存储邻居节点na的q值,θ表示权重因子,qmax表示邻居节点na的数据包最大个数,表示时刻t邻居节点na的数据包个数;

根据所述更新策略进行信息更新决策,选取衡量因子最大的邻居节点对数据包进行传输。

本发明实施例提供了一种基于信息新鲜度的车联网传输装置,所述装置包括:

更新目标函数确定模块,用于根据初始目标函数以及在预设时间段t内任一车辆采集节点不发送数据包时,该车辆采集节点的信息年龄为t2/2,得到更新目标函数所述初始目标函数表示使各车辆采集节点在预设时间段t内发送至接入点ap的最新数据包的信息年龄的平均值最小化;表示车辆采集节点的集合,ri(t)表示时刻t车辆采集节点i是否进行数据包采集,如果是,ri(t)=1,否则,ri(t)=0,表示所述ap在时刻t关于车辆采集节点i的信息年龄;

车辆采集节点i在时刻t产生的更新包的时延xi,k表示在时刻t车辆采集节点i是否采集第k个数据包,表示车辆采集节点i的第k个数据包从生成到发送到所述ap的时差,

lyapunov函数确定模块,用于根据lyapunov稳定性理论,得到lyapunov函数

qj(t)表示时刻t节点j的数据包个数,

节点j在时刻t+1的数据包个数

表示车辆采集节点、ap和车辆传输节点的集合,表示车辆采集节点和车辆传输节点的集合,i表示指示函数,如果否则fj,n(t)表示时刻t节点j是否向节点n发送数据包,如果是,fj,n(t)=1,否则,fj,n(t)=0,rj(t)表示时刻t节点j是否进行数据包采集,fn,j(t)表示时刻t节点n是否向节点j发送数据包;表示时刻t节点j是否向节点n发送了车辆采集节点i产生的第k个数据包,如果是,否则,表示时刻t节点n是否向节点j发送了车辆采集节点i产生的第k个数据包;

最终目标函数确定模块,用于通过最小化lyapunov函数变化率对网络进行约束,得到最终目标函数minδlt-λφt,在预设时间段t内lyapunov函数的变化量δlt=l(θ(t+t))-l(θ(t)),λ表示非负可调参数,φt表示对所述更新目标函数进行优化处理后的优化函数;

更新策略及路由确定模块,用于计算所述最终目标函数在t=1时的上限,通过最小化所述上限确定最小化所述最终目标函数的次优解:

b为常数,qi(t)表示时刻t车辆采集节点i的数据包个数,sj表示节点j的邻居节点集合;

得到更新策略函数以及路由算法函数

根据所述更新策略函数确定更新策略为qmax表示车辆采集节点i的数据包最大个数,

根据q-learning算法和所述路由算法函数,得到基于q-learning的背压式算法,所述基于q-learning的背压式算法中,时刻t节点np的邻居节点na的衡量因子表示时刻t节点np所存储邻居节点na的q值,θ表示权重因子,qmax表示邻居节点na的数据包最大个数,表示时刻t邻居节点na的数据包个数;

数据包传输模块,用于根据所述更新策略进行信息更新决策,选取衡量因子最大的邻居节点对数据包进行传输。

本发明实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;

所述存储器,用于存放计算机程序;

所述处理器,用于执行所述存储器上所存放的程序时,实现上述任一所述的基于信息新鲜度的车联网传输方法的步骤。

本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一所述的基于信息新鲜度的车联网传输方法的步骤。

本发明实施例提供的基于信息新鲜度的车联网传输方法及装置,根据初始目标函数以及在预设时间段t内车辆采集节点不发送数据包时,车辆采集节点的信息年龄为t2/2,得到更新目标函数,初始目标函数表示使各车辆采集节点在预设时间段t内发送至ap的最新数据包的信息年龄的平均值最小化;根据lyapunov稳定性理论,得到lyapunov函数,通过最小化lyapunov函数变化率对网络进行约束,得到最终目标函数,计算最终目标函数在t=1时的上限,通过最小化上限确定最小化最终目标函数的次优解,得到更新策略函数以及路由算法函数,根据更新策略函数确定更新策略,根据q-learning算法和路由算法函数确定衡量因子。车辆采集节点根据更新策略进行信息更新决策,选取衡量因子最大的邻居节点对数据包进行传输。本发明在以最小化平均信息年龄为初始目标函数建模的基础上,为了能够直观的看出每次信息更新决策的收益,对初始目标函数进行了修正,得到更新目标函数,通过最小化lyapunov变化率对网络进行约束,得出最终目标函数。对最终目标函数进行计算,确定信息更新策略和基于q-learning的路由算法,可以降低计算复杂度,以及网络平均信息年龄。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为现有技术中节点i的信息年龄变化图;

图2为本发明实施例的基于信息新鲜度的车联网传输方法的流程图;

图3为本发明实施例中ap中节点i的信息年龄的收益图;

图4为本发明实施例的基于信息新鲜度的车联网传输装置的结构图;

图5为本发明实施例的电子设备的结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在车联网中,车辆可以作为信息收集器进行实时信息采集,然后通过v2x(vehicle-to-everything,车辆到所有)的方式发送给需要的用户或者汇聚到ap(accesspoint,接入点),进而根据获取的信息实现智能驾驶决策、实时路线规划、车辆定位跟踪等智能交通应用。信息年龄作为新提出的衡量信息时效性的网络指标得到了广泛关注,目前主要基于单跳或者多跳静态网络,而且将其与信息路由分离考虑。相较于单跳或者多跳静态网络,多跳动态网络场景更加复杂,更具有挑战性。本发明实施例提供了一种基于信息新鲜度的车联网传输方法及装置,可以在多跳动态网络场景下降低网络中的信息年龄。

下面首先对本发明实施例所提供的基于信息新鲜度的车联网传输方法进行详细介绍。本发明的研究场景为多个车辆节点作为信息源进行信息采集,并通过v2v(vehicle-to-vehicle,车辆到车辆)的方式汇聚到ap。车辆节点包括:车辆采集节点和车辆传输节点,车辆采集节点既可以作为中继转发信息,也可以进行信息采集,车辆传输节点只作为中继转发信息。当两个节点之间的距离小于通信距离的时,两个节点可以相互通信。

参见图2,图2为本发明实施例的基于信息新鲜度的车联网传输方法的流程图,包括以下步骤:

s201,根据初始目标函数以及在预设时间段t内任一车辆采集节点不发送数据包时,确定该车辆采集节点的信息年龄为t22,得到更新目标函数初始目标函数表示使各车辆采集节点在预设时间段t内发送至接入点ap的最新数据包的信息年龄的平均值最小化;表示车辆采集节点的集合,ri(t)表示时刻t车辆采集节点i是否进行数据包采集,如果是,ri(t)=1,否则,ri(t)=0,表示ap在时刻t关于车辆采集节点i的信息年龄;

车辆采集节点i在时刻t产生的更新包的时延xi,k表示在时刻t车辆采集节点i是否采集第k个数据包,表示车辆采集节点i的第k个数据包从生成到发送到ap的时差。

本发明实施例中,对初始目标函数进行求解可以得车辆采集节点信息更新策略和数据包的传输路径。但是,求取全局最优解的复杂度太高,且随着网络规模的增大复杂度呈指数型增长,不具可扩展性,而且针对环境复杂多变的车联网,复杂度较高的全局优化算法无法在现实场景中应用,因此为了适应动态的车联网场景,需要得出一个复杂度较低的具有可扩展性的分布式算法。但是由于从目标函数中不太容易直观地看到每一次更新决策的收益,因此可以对目标函数做调整。

参见图3,由于同一个节点每个最新数据包的信息年龄与上一个更新包的信息年龄无关,因此在更新策略和路由不变得情况下起始信息年龄不会影响之后的信息年龄走势。假设每个节点的起始信息年龄为0,如果在整个t时间内,ap都没有收到节点i的信息更新,那么节点i的信息年龄会一直增长下去,得到一个等腰直角三角形,面积为t2/2。也就是,预设时间段t内任一车辆采集节点不发送数据包时,该车辆采集节点的信息年龄为t2/2。而每成功收到一个数据包,则会减少一定的面积(如图3中阴影部分),计算可得,在预设时间段t内任一车辆采集节点发送数据包时,该车辆采集节点的信息年龄减小的值为,车辆采集节点发送数据包的时刻×(t-该数据包到达ap的时刻)。因此最小化初始目标函数等价于最大化整体的收益,即将最小化初始目标函数转化为最大化车辆采集节点的信息年龄减小的值,得到更新目标函数。

s202,根据lyapunov稳定性理论,得到lyapunov函数

qj(t)表示时刻t节点j的数据包个数,

节点j在时刻t+1的数据包个数

表示车辆采集节点、ap和车辆传输节点的集合,表示车辆采集节点和车辆传输节点的集合,i表示指示函数,如果否则fj,n(t)表示时刻t节点j是否向节点n发送数据包,如果是,fj,n(t)=1,否则,fj,n(t)=0,rj(t)表示时刻t节点j是否进行数据包采集,fn,j(t)表示时刻t节点n是否向节点j发送数据包;表示时刻t节点j是否向节点n发送了车辆采集节点i产生的第k个数据包,如果是,否则,表示时刻t节点n是否向节点j发送了车辆采集节点i产生的第k个数据包。

本发明实施例中,每个节点维护一个有一定空间的队列,用于缓存接收到的信息,而ap的队列长度可以认为是无限长的。对于每一个节点,队列长度可以用于表示其通信稳定性,队列中的信息积累越多,则通信负载越大,反之,负载越小。为了分析整个系统的稳定性,根据lyapunov理论,定义lyapunov函数l(θ(t))表示网络稳定状态。

s203,通过最小化lyapunov函数变化率对网络进行约束,得到最终目标函数minδlt-λφt,在预设时间段t内lyapunov函数的变化量δlt=l(θ(t+t))-l(θ(t)),φt表示对更新目标函数进行优化处理后的优化函数。

具体的,l(θ(t))是一个标量,具有非负性,并且当且仅当所有节点的队列长度为0时才等于0。系统越稳定,则l(θ(t))随着时间的变化越缓慢,因此为了描述系统稳定性,定义预设时间段t内lyapunov函数的变化量为:δlt=l(θ(t+t))-l(θ(t)),系统越稳定则该变化量越小。为了使系统稳定,对每两个相邻时隙的lyapunov系统状态差异进行约束,使其差异尽量小。将上述更新目标函数结合系统稳定性进行综合考虑,即使δlt最小化,且使φt最大化,得到最终目标函数minδlt-λφt。λ表示非负可调参数,表示信息年龄优化目标的所占比重,该值越大,则信息年龄权值越大。

s204,计算最终目标函数在t=1时的上限,通过最小化上限确定最小化最终目标函数的次优解:

b为常数,qi(t)表示时刻t车辆采集节点i的数据包个数,sj表示节点j的邻居节点集合。

本发明实施例中,计算最终目标函数在t=1时的上限,可以得到次优解。

由于而对于任意a,b,c≥0,满足[max(a-b,0)+c]2-a2≤b2+c2-2a(b-c),因此可以得到:

进而得到:

其中,

b为常数,n为车辆采集节点和车辆传输节点的总个数,m为车辆采集节点的个数;

根据得到:

上述次优解中,前两部分只和信息更新策略有关,后一部分只和信息传输策略有关,因此可以将信息更新策略和信息传输策略分为两部分考虑。

由此,得到更新策略函数以及路由算法函数

s205,根据更新策略函数确定更新策略为qmax表示车辆采集节点i的数据包最大个数。

具体的,因为当所有车辆采集节点都不采集信息的时候,更新策略函数的值为0,所以更新策略函数的最小值小于等于0。因此得到更新策略为:

当车辆采集节点自身队列长度较小时才更新信息,否则车辆采集节点更新信息之后,该信息会排在自身节点中很长的队列后面,需要等待很长时间才能成功发送,显然等到队列中的数据包全部发送完毕之后再进行信息更新是更好的选择。但是当自身队列长度长时间较长时,说明此时网络负载较大,且该车辆采集节点信息年龄会很大,而如果等待队列为空再进行更新的话,有可能一直等不到,因此当信息年龄超过容忍限度时也需要更新。更新策略函数中的λ是可调参数,表示信息年龄的重要性。λ越小,表明车辆采集节点数据更新频率越小,反之更新频率越大。

根据q-learning算法和路由算法函数,得到基于q-learning的背压式算法,基于q-learning的背压式算法中,时刻t节点np的邻居节点na的衡量因子表示时刻t节点np所存储邻居节点na的q值,θ表示权重因子,qmax表示邻居节点na的数据包最大个数,表示时刻t邻居节点na的数据包个数。

本发明实施例中,根据路由算法函数得到:

可以看出,每个链路的是否激活和两个节点的队列差成正比,即背压式算法。背压式算法属于吞吐量最优的算法,且能够起到平衡网络负载的作用,但是并不考虑时延。由于每个节点在同一时刻只能和一个节点通信,因此根据上式可得,每次选择邻居节点中队列长度最小且比自身节点队列长度小的节点作为中继。虽然背压式算法可以很好地平衡整个网络的通信负载,然而,该算法缺乏目的驱动力,会由于绕路太远导致传输时延较大。

为了增加目的驱动力减小传输时延,需要结合地理位置信息进行中继节点的选择,尽量避免数据包向远离目的节点的方向传输。但是由于车联网动态性较强且移动轨迹受到道路限制,单纯考虑地理位置很容易将数据包发送到拓扑空洞的位置,因此需要综合考虑几跳之外的情况选择中继。但是传统的基于路由表的算法不足以适应动态变化的车联网环境,因此需要采用自适应的路由算法。为了得到几跳之外的信息,本发明通过q-learning算法进行学习,然后结合背压式路由算法考虑队列长度的影响,最终得到基于q-learning的背压式路由算法。基于q-learning的背压式路由算法为:每个节点维护一个表格,表示该节点的每个邻居节点与目的节点的连接系数;每个节点每收到一个数据包就更新本节点的表格;当节点需要发送数据包时,综合考虑邻居节点到目的节点的连接系数以及队列长度进行中继的选择。

q-learning算法中,将数据包视为主体,每个车辆视为主体的状态,主体可以采取行为进行状态转移,即从某个车辆节点转移到其它车辆节点。在每个车辆节点中的表格存有数据包从当前车辆节点转移到各个邻居节点对应的q值,用于衡量选择相应车辆节点所得的收益。q-learning的目的就是通过每次决策的反馈不断地更新该表格,使得所得的结果逐渐逼近最优解。每当车辆节点收到选定的中继节点的反馈或者收到邻居节点的广播数据包之后,该车辆节点就更新自己的q表格。时刻t+1节点np所存储邻居节点na的q值更新公式表示为:

α为学习速率,γ为折扣因子,rw为收益函数,na表示节点np的邻居节点,β表示邻居节点na的优先级,表示邻居节点na所存储的关于节点nb的最大q值,表示节点na的邻居节点的集合。

为了衡量每个节点到目的节点的连接度,可以定义收益函数rw只有当节点na为目的节点时为100,其他情况均为0,即:

为了简化,可以只考虑距离因素用来衡量节点的优先级,当节点距离邻居节点越近时,链路越稳定,则优先级越高,反之优先级越低,且将优先级归一化到[0.9,1]的闭区间范围内,优先级β可以定义为:

表示时刻t节点na和节点np的距离。

需要注意的是,如果选择中继节点时每次都选取q值最大的节点,很容易受到现有经验的影响,无法找到最优解。因此,本发明采用ε-greedy更新策略,每次有ε的概率进行随机选取,1-ε的概率选择q值最大的节点。刚开始时ε取值较大,随着轮次的增加,逐渐减小,并稳定在一个较小值(例如0.01)。而且,在车联网中,随着车辆节点的移动,每个车辆节点的邻居节点会变化,此时需要将离开的车辆节点的q值删除,并为新加入的车辆节点创建新的q值。为了避免新加入的车辆节点的冷启动,新加入的车辆节点可以将本身表格的最大q值告知对方,作为对方表格的初始值。

当选择中继节点时,综合考虑q值和队列长度,选取最合适的车辆节点。

由此,确定衡量因子

s206,根据更新策略进行信息更新决策,选取衡量因子最大的邻居节点对数据包进行传输。

本发明实施例的基于信息新鲜度的车联网传输方法,根据初始目标函数以及在预设时间段t内车辆采集节点不发送数据包时,车辆采集节点的信息年龄为t2/2,得到更新目标函数,初始目标函数表示使各车辆采集节点在预设时间段t内发送至ap的最新数据包的信息年龄的平均值最小化;根据lyapunov稳定性理论,得到lyapunov函数,通过最小化lyapunov函数变化率对网络进行约束,得到最终目标函数,计算最终目标函数在t=1时的上限,通过最小化上限确定最小化最终目标函数的次优解,得到更新策略函数以及路由算法函数,根据更新策略函数确定更新策略,根据q-learning算法和路由算法函数确定衡量因子。车辆采集节点根据更新策略进行信息更新决策,选取衡量因子最大的邻居节点对数据包进行传输。本发明在以最小化平均信息年龄为初始目标函数建模的基础上,为了能够直观的看出每次信息更新决策的收益,对初始目标函数进行了修正,得到更新目标函数,通过最小化lyapunov变化率对网络进行约束,得出最终目标函数。对最终目标函数进行计算,确定信息更新策略和基于q-learning的路由算法,可以降低计算复杂度,以及网络平均信息年龄。

可选的,初始目标函数的确定方法包括:

表示节点j上关于节点i的信息年龄,则信息年龄更新策略表示为:

第一种情况表示节点j本身是源节点,如果时刻t节点j进行了信息采集,则t+1时刻节点j上关于自身的信息年龄为1;第二种情况表示节点j收到了节点n发来的节点i产生的第k个数据包,则节点j上关于节点i的年龄变为与节点n上关于节点i的年龄相同的值;否则,t+1时刻节点j上关于节点i的年龄等于时刻t的年龄加一。

根据排队理论,得到节点j在时刻t+1的数据包个数

若yi,k(t)表示时刻t节点i的第k个数据包是否已经采集,如果是,yi,k(t)=1,否则,yi,k(t)=0,并且同一时刻最多采集一个数据包,则

根据车辆采集节点i的第k+1个数据包在第k个数据包之后生成的规则,得到:

根据先入先出队列模型中信息先生成再发送的规则,得到:

根据先入先出队列模型中信息的收到时刻小于发送时刻的规则,得到:

表示表示节点j中存有的车辆采集节点i的第k个数据包的接收时刻,表示节点j中存有的车辆采集节点i的第k个数据包的发送时刻;

根据先入先出队列模型中信息发送满足先入先出协议,得到:

预先设置的干扰关系为:表示每个时刻一个节点只能作为接收器或者发射器,且只能和一个节点通信;

表示两个节点的距离小于通信范围,

dnj(t)表示节点n和节点j在时刻t的距离,r表示传输半径;

根据上述公式,得到初始目标函数

本发明的一种实现方式中,对更新目标函数进行优化处理后得到φt的方法包括:

代入上述得到:

td表示传输时延上界;则:

求解maxgt转化为求解maxφt,

相应于上述方法实施例,本发明实施例提供了一种基于信息新鲜度的车联网传输装置,参见图4,图4为本发明实施例的基于信息新鲜度的车联网传输装置的结构图,包括:

更新目标函数确定模块401,用于根据初始目标函数以及在预设时间段t内任一车辆采集节点不发送数据包时,该车辆采集节点的信息年龄为t2/2,得到更新目标函数初始目标函数表示使各车辆采集节点在预设时间段t内发送至接入点ap的最新数据包的信息年龄的平均值最小化;表示车辆采集节点的集合,ri(t)表示时刻t车辆采集节点i是否进行数据包采集,如果是,ri(t)=1,否则,ri(t)=0,表示ap在时刻t关于车辆采集节点i的信息年龄;

车辆采集节点i在时刻t产生的更新包的时延xi,k表示在时刻t车辆采集节点i是否采集第k个数据包,表示车辆采集节点i的第k个数据包从生成到发送到ap的时差,

lyapunov函数确定模块402,用于根据lyapunov稳定性理论,得到lyapunov函数

qj(t)表示时刻t节点j的数据包个数,

节点j在时刻t+1的数据包个数

表示车辆采集节点、ap和车辆传输节点的集合,表示车辆采集节点和车辆传输节点的集合,i表示指示函数,如果否则fj,n(t)表示时刻t节点j是否向节点n发送数据包,如果是,fj,n(t)=1,否则,fj,n(t)=0,rj(t)表示时刻t节点j是否进行数据包采集,fn,j(t)表示时刻t节点n是否向节点j发送数据包;表示时刻t节点j是否向节点n发送了车辆采集节点i产生的第k个数据包,如果是,否则,表示时刻t节点n是否向节点j发送了车辆采集节点i产生的第k个数据包;

最终目标函数确定模块403,用于通过最小化lyapunov函数变化率对网络进行约束,得到最终目标函数minδlt-λφt,在预设时间段t内lyapunov函数的变化量δlt=l(θ(t+t))-l(θ(t)),λ表示非负可调参数,φt表示对更新目标函数进行优化处理后的优化函数;

更新策略及路由确定模块404,用于计算最终目标函数在t=1时的上限,通过最小化上限确定最小化最终目标函数的次优解:

b为常数,qi(t)表示时刻t车辆采集节点i的数据包个数,sj表示节点j的邻居节点集合;

得到更新策略函数以及路由算法函数

根据更新策略函数确定更新策略为qmax表示车辆采集节点i的数据包最大个数,

根据q-learning算法和路由算法函数,得到基于q-learning的背压式算法,基于q-learning的背压式算法中,时刻t节点np的邻居节点na的衡量因子表示时刻t节点np所存储邻居节点na的q值,θ表示权重因子,qmax表示邻居节点na的数据包最大个数,表示时刻t邻居节点na的数据包个数;

数据包传输模块405,用于根据更新策略进行信息更新决策,选取衡量因子最大的邻居节点对数据包进行传输。

本发明实施例的基于信息新鲜度的车联网传输装置,根据初始目标函数以及在预设时间段t内车辆采集节点不发送数据包时,车辆采集节点的信息年龄为t2/2,得到更新目标函数,初始目标函数表示使各车辆采集节点在预设时间段t内发送至ap的最新数据包的信息年龄的平均值最小化;根据lyapunov稳定性理论,得到lyapunov函数,通过最小化lyapunov函数变化率对网络进行约束,得到最终目标函数,计算最终目标函数在t=1时的上限,通过最小化上限确定最小化最终目标函数的次优解,得到更新策略函数以及路由算法函数,根据更新策略函数确定更新策略,根据q-learning算法和路由算法函数确定衡量因子。车辆采集节点根据更新策略进行信息更新决策,选取衡量因子最大的邻居节点对数据包进行传输。本发明在以最小化平均信息年龄为初始目标函数建模的基础上,为了能够直观的看出每次信息更新决策的收益,对初始目标函数进行了修正,得到更新目标函数,通过最小化lyapunov变化率对网络进行约束,得出最终目标函数。对最终目标函数进行计算,确定信息更新策略和基于q-learning的路由算法,可以降低计算复杂度,以及网络平均信息年龄。

可选的,本发明实施例的基于信息新鲜度的车联网传输装置,还包括:

初始目标函数确定模块,用于若表示节点j上关于节点i的信息年龄,则信息年龄更新策略表示为:

根据排队理论,得到节点j在时刻t+1的数据包个数

若yi,k(t)表示时刻t节点i的第k个数据包是否已经采集,如果是,yi,k(t)=1,否则,yi,k(t)=0,

根据车辆采集节点i的第k+1个数据包在第k个数据包之后生成的规则,得到:

根据先入先出队列模型中信息先生成再发送的规则,得到:

根据先入先出队列模型中信息的收到时刻小于发送时刻的规则,得到:

表示表示节点j中存有的车辆采集节点i的第k个数据包的接收时刻,表示节点j中存有的车辆采集节点i的第k个数据包的发送时刻;

根据先入先出队列模型中信息发送满足先入先出协议,得到:

预先设置的干扰关系为:

dnj(t)表示节点n和节点j在时刻t的距离,r表示传输半径;

根据上述公式,得到初始目标函数

可选的,更新目标函数确定模块,具体用于在预设时间段t内任一车辆采集节点不发送数据包时,确定该车辆采集节点的信息年龄为t2/2,

在预设时间段t内任一车辆采集节点发送数据包时,该车辆采集节点的信息年龄减小的值为,车辆采集节点发送数据包的时刻×(t-该数据包到达ap的时刻),将最小化初始目标函数转化为最大化车辆采集节点的信息年龄减小的值,得到更新目标函数可选的,本发明实施例的基于信息新鲜度的车联网传输装置,还包括:优化函数确定模块,用于

代入上述

得到:

td表示传输时延上界;则:

求解maxgt转化为求解maxφt,

可选的,最终目标函数确定模块,具体用于在预设时间段t内lyapunov函数的变化量δlt=l(θ(t+t))-l(θ(t)),使δlt最小化,且使φt最大化,得到最终目标函数minδlt-λφt。

可选的,更新策略及路由确定模块,包括:

次优解确定子模块,用于

根据得到:

其中,

b为常数,n为车辆采集节点和车辆传输节点的总个数,m为车辆采集节点的个数;

根据得到:

可选的,更新策略及路由确定模块,还包括:

路由确定子模块,用于根据路由算法函数得到:

根据q-learning算法,得到

为时刻t+1节点np所存储邻居节点na的q值,α为学习速率,γ为折扣因子,rw为收益函数,na表示节点np的邻居节点,β表示邻居节点na的优先级,表示邻居节点na所存储的关于节点nb的最大q值,表示节点na的邻居节点的集合;

根据q-learning算法和路由算法函数,确定衡量因子

本发明实施例还提供了一种电子设备,参见图5,图5为本发明实施例的电子设备的结构图,包括:处理器501、通信接口502、存储器503和通信总线504,其中,处理器501、通信接口502、存储器503通过通信总线504完成相互间的通信;

存储器503,用于存放计算机程序;

处理器501,用于执行存储器503上所存放的程序时,实现上述任一基于信息新鲜度的车联网传输方法的步骤。

需要说明的是,上述电子设备提到的通信总线504可以是pci(peripheralcomponentinterconnect,外设部件互连标准)总线或eisa(extendedindustrystandardarchitecture,扩展工业标准结构)总线等。该通信总线504可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口502用于上述电子设备与其他设备之间的通信。

存储器503可以包括ram(randomaccessmemory,随机存取存储器),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器501可以是通用处理器,包括:cpu(centralprocessingunit,中央处理器)、np(networkprocessor,网络处理器)等;还可以是dsp(digitalsignalprocessing,数字信号处理器)、asic(applicationspecificintegratedcircuit,专用集成电路)、fpga(field-programmablegatearray,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时,实现上述任一基于信息新鲜度的车联网传输方法的步骤。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1