一种基于深度Q学习的路由规划方法与流程

文档序号：14178941阅读：来源：国知局

技术特征：

技术总结
本发明公开一种基于深度Q学习的路由规划方法，该方法为：根据网络拓扑生成奖励值矩阵，使用一个训练好的深度神经网络模型代替普通Q学习的Q值表进行路由规划。本发明利用了神经网络抽象化高层数据、自动学习的特点，相比于传统的Dijkstra算法，在大规模应用部署时能更快速地规划出最短路径。

技术研发人员：李传煌;吴艳;程成;钱正哲;金蓉;王伟明
受保护的技术使用者：浙江工商大学
技术研发日：2017.10.24
技术公布日：2018.04.13