基于强化学习的多路径传输协议拥塞控制方法与流程

文档序号：11253760阅读：来源：国知局

技术特征：

技术总结
本发明公开了一种基于强化学习的多路径传输协议拥塞控制方法，通过建立马尔可夫决策过程，将拥塞控制形式化表示。用发送端的各个子流的拥塞窗口大小以及各个子流的RTT来表示各个子流当前的网络状态，定义发送端调整拥塞窗口和发送间隔的动作，建立目标方程，以获得最大平均吞吐量和最小平均时延为目的。通过建立网络模型，模拟产生多种网络环境。在不同的网络环境中，通过不断地试错，对当前网络环境做所有的动作，然后从环境给出的反馈中学习并优化动作。经过大量的线下学习，使得发送端可以在某一个状态区域做出相应的调整拥塞窗口大小和发送间隔的动作，以使得目标方程的值最大。

技术研发人员：薛超婧;李文中;陆桑璐
受保护的技术使用者：南京大学
技术研发日：2017.05.22
技术公布日：2017.09.15