本发明属于网络,涉及wlan资源分配优化机制,尤其涉及一种基于汤普森采样的密集异构终端环境下的终端接入控制方法。
背景技术:
1、近年来,随着ieee802.11标准的不断发展,无线局域网(wireless localareanetwork,wlan)凭借其可靠、高效的特性得以在世界范围内普及和广泛部署,并成为一种可满足日益增长的带宽需求的无线网络接入方式,在全球移动流量增长中占据了相当大的份额。在人群密集、设备繁杂的场所中,包括手机、电脑、摄像头和其他iot智能终端等多种类型的用户设备通过部署的无线ap(access point,无线接入点)接入wlan。由于不同设备在支持的网络类型、处理能力和流量需求等方面存在差异,同一网络环境中终端设备的异构性显著。信道资源有限、终端资源需求差异等因素使得异构密集环境下的网络性能和实际用户体验并不令人满意。因此,如何将用户流量需求和有限的无线信道资源尽可能合理地分配给网络中的多个ap,即为终端指定合适的接入ap,从而有效提升wlan网络性能和改善用户体验,成为亟需解决的问题。
2、目前的终端关联控制方法可分为终端侧的关联ap选择和基础设施侧的终端接入控制。终端侧方法由于可获得的网络环境状态信息有限,难以准确评估ap性能,在复杂环境下的网络性能通常不太理想。此外,终端侧方法通常需要终端侧额外的软硬件支持,不便于在实际环境中部署和推广。基础设施侧的接入控制方法可以通过集中控制器获取全局的网络环境状态,从而更好地进行关联决策。然而,现有工作大多选择通过吞吐量、延迟等网络指标对网络性能和ap负载进行评估,所依据的网络环境状态信息不够全面,优化效果不佳。
技术实现思路
1、针对密集异构终端场景下,急剧增长的流量需求和差异化的用户体验偏好使得网络环境更加复杂的问题,本发明提出了基于多源状态信息的异构终端接入控制机制,通过中央控制器实时获取网络状态、终端状态和信道状态等信息准确评估全局网络环境状态,并利用汤普森采样算法进行在线决策,有效提升网络性能并改善用户体验。
2、具体的,本发明在基础设施侧提供一种基于汤普森采样的异构终端接入控制方法,包括基于集中控制型架构的终端接入控制框架、多源状态信息采集、异构终端关联决策。具体来说,当待接入终端到达时,ap并不回应终端发出的探测请求帧。同时,中央控制器从用户空间、内核和驱动等多层面获取全局网络环境状态信息,并结合待接入终端的qoe偏好进行在线决策,为待接入终端分配合理的关联ap。当终端开始下一轮主动扫描时,选中的ap向终端发送探测响应帧,完成后续关联流程。
3、为了达到上述目的,本发明提供如下技术方案:
4、基于汤普森采样的wlan异构终端接入控制方法,包括如下步骤:
5、步骤1,待接入终端发起主动扫描,其扫描范围内的ap接收到探测请求帧,并不予回应;
6、步骤2,ap将接收到的终端关联请求和自身的状态信息发送给中央控制器,实现多源状态信息采集;
7、步骤3,中央控制器估计当前的全局网络环境状态,采用异构终端关联决策算法为终端选择一个合适的ap;
8、步骤4,中央控制器将决策结果通知选中的ap;
9、步骤5,当终端开始下一轮主动扫描时,选中的ap向终端发送探测响应帧,进行关联。
10、进一步的,所述步骤2具体包括如下子步骤:
11、(1)通过扩展开源ap管理软件hostapd的终端接入控制相关功能模块获取待接入终端的状态信息;
12、(2)通过mac80211模块获取ap侧mac层的网络状态信息和已关联终端的状态信息;
13、(3)通过修改ap侧wi-fi驱动获取驱动层的信道状态信息和网络状态信息。
14、进一步的,所述步骤(1)中获取待接入终端的状态信息是指:从待接入终端的探测请求帧中提取其mac地址、接收信号强度指示符rssi值、流量类型和支持的信道宽度。
15、进一步的,所述步骤(2)中mac层的网络状态信息包括:ap当前的吞吐量、重传率、接收/发送数据速率和包错误率,关联终端状态信息包括:终端数量、终端接收/发送速率和终端活跃时间。
16、进一步的,所述步骤(3)中驱动层的信道状态信息包括:信道宽度、信道忙碌时间和信道信噪比,网络状态信息包括数据包和队列的统计信息。
17、进一步的,所述异构终端关联决策算法是将密集wlan中的异构终端关联决策问题建模为多臂赌博机问题,在中央控制器侧设计基于汤普森采样的异构终端关联决策算法,根据收集到的当前全局网络环境状态,并结合待接入终端的用户qoe偏好,为终端分配一个合适的ap接入。
18、进一步的,所述异构终端关联决策算法包括如下过程:
19、在满足关联约束和cca约束等限制条件的前提下,通过合理的ap-终端关联关系分配使得时间步t时的平均用户qoe最大化,建立优化目标为:
20、
21、其中,表示时间步t时终端i的qoe反馈,nt表示时间步t时wlan关联终端数量;
22、约束条件如下:
23、(a)关联约束:时间步t时wlan中的终端只能与一个apj关联,即:
24、
25、其中m表示ap的数量,表示在时间步t时终端i关联的ap;
26、(b)cca约束:对于时间步t时wlan中的终端其与关联ap之间的信号强度需高于设定的cca阈值θ,即:
27、
28、通过以下关联决策算法的具体步骤解决上述优化问题:
29、(1)使用多元高斯分布作为先验分布,在时间步t时达到终端i的先验分布表示为首先初始化先验分布的位置参数和形状参数x,其中的初始值为d维的零向量,x的初始值为d维的单位矩阵,v2∈[0,1]为常数,维度d与特征向量的维度保持一致;
30、(2)在每个时间步t,中央控制器接收一个新的终端到达事件it,并基于cca阈值确定该终端的可关联ap集合对于中的每个ap,控制器利用其状态信息,包括t时刻apa的信道利用率传输失败率重传率吞吐量关联终端数量待接入终端rssi值并结合待接入终端的应用类型形成特征向量最终形成特征矩阵用于估计当前全局网络环境状态;
31、(3)中央控制器从多元高斯分布中随机采样,形成先验概率采样值集合根据采样值集合和特征矩阵计算各ap的奖励似然即表示终端达到事件it完成接入后获得的奖励,选择最大奖励似然的ap作为时间步t的终端关联决策;
32、(4)中央控制器指定ap发送关联指令来执行关联决策,并接收终端关联后的qoe反馈作为奖励
33、(5)中央控制器更新分布的位置参数和形状参数完成当前终端到达事件it,其更新方式如下:
34、
35、
36、其中,为终端到达事件it发生时智能体观察到的特征矩阵,id为d维的单位矩阵。
37、与现有技术相比,本发明具有如下优点和有益效果:
38、1.本发明提出了一种密集wlan异构终端接入控制方法,依据实时获取的多源状态信息准确评估全局网络环境状态,利用汤普森采样算法进行在线决策,为待接入的终端选择合适的ap进行关联,有效提升网络性能并改善用户体验。
39、2.本发明部署在中央控制器上,在密集异构终端场景下具有全局视角,可以为终端做出更合理的关联决策。此外,本发明无需终端侧额外的软硬件支持,方便推广。