1.一种基于图深度学习的图组合优化问题求解方法,其特性在于,包括:
获取输入图信息并进行预处理,得到所述输入图的每一个顶点与权值相关的特征,通过分析关于steiner树的贪心算法得到更新后的矩阵x;
基于编码-处理-解码的架构构建图神经网络,将更新后的矩阵x作为所述图神经网络的输入,得到表示顶点信息的隐藏向量并进行深度强化学习训练;
利用贪心算法根据强化学习训练后的图神经网络选择当前状态下价值最大的顶点,完成图组合优化问题的求解。
2.如权利要求1所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述图神经网络的编码网络包括,
整合当前顶点状态和初始权重信息生成一个p维的潜在向量表示,计算公式如下:
μv=relu(θ1[sv,tv]+θ2xv)
其中,
3.如权利要求1所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述图神经网络的处理网络包括,
将获取的所述顶点嵌入向量μv处过网络进行处理,所述处理网络通过来自邻居节点的消息传递策略更新一个隐藏的顶点嵌入向量μ′v,即处理网络捕捉向量之间的变化,然后将它们拼接到p维向量的后面,所述隐藏的顶点嵌入向量μ′v计算公式为:
μ′v=lθrelu[μv,∑u∈n(v)(μv-μu)]
其中,n(v)表示顶点v邻居节点的集合。
4.如权利要求1所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述图神经网络的解码网络包括,
将图上所有顶点的状态∑u∈vμ′u和要被添加的顶点隐藏嵌入向量μ′v共同定义一个评价函数q,然后将其参数化为q(s,v;θ),即基于整个图的状态和当前顶点生成顶点的价值,所述q(s,v;θ)的计算公式为:
其中,
5.如权利要求1~4任一项所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述深度强化学习包括,
采用标准的q学习来更新所述图神经网络参数,每一步都采用sgd优化器去最小化均方误差,所述均方误差计算公式包括,
j(θ)=(y-q(st,vt;θ))2
其中,y来自于目标网络。
6.如权利要求5所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述目标网络的计算公式包括,
其中,γ表示折扣率,设置在0-1之间,表示来自下一状态的衰减程度。
7.如权利要求5所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述目标网络的计算公式进一步包括,
在环境网络中找到于最大q值相对应的顶点,计算公式如下:
v′=argmaxv′q(st+1,v′;θ)
将该计算公式代入所述目标网络的计算公式,得到一个新的目标网络估计,计算公式如下:
8.如权利要求1所述的基于图深度学习的图组合优化问题求解方法,其特征在于:所述矩阵x包括,
通过对所述输入图预处理获得图上每一个顶点与权值相关的特征;
当每次添加一个邻接顶点vi时,计算所述顶点vi与其他终端顶点的距离,采用一个矩阵
其中,第i行和第j列的元素xij表示顶点vi到终端顶点vj的最短距离,i∈|v|表示顶点的个数v,j∈|t|表示终端顶点的个数|t|。