一种基于深度Q学习的路由规划方法与流程

文档序号:14178941阅读:来源:国知局

技术特征:

技术总结
本发明公开一种基于深度Q学习的路由规划方法,该方法为:根据网络拓扑生成奖励值矩阵,使用一个训练好的深度神经网络模型代替普通Q学习的Q值表进行路由规划。本发明利用了神经网络抽象化高层数据、自动学习的特点,相比于传统的Dijkstra算法,在大规模应用部署时能更快速地规划出最短路径。

技术研发人员:李传煌;吴艳;程成;钱正哲;金蓉;王伟明
受保护的技术使用者:浙江工商大学
技术研发日:2017.10.24
技术公布日:2018.04.13
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1