1.基于深度强化学习算法的网络安全协议验证工具优化方法,其特征在于,该优化方法具体步骤如下:
2.根据权利要求1所述的基于深度强化学习算法的网络安全协议验证工具优化方法,其特征在于,步骤(1)中所述特征向量具体构建步骤如下:
3.根据权利要求2所述的基于深度强化学习算法的网络安全协议验证工具优化方法,其特征在于,步骤一中所述字符串约束链接具体表达公式如下:
4.根据权利要求2所述的基于深度强化学习算法的网络安全协议验证工具优化方法,其特征在于,步骤(2)中所述神经网络结构具体由一个公共的网络部分和两个分离的策略网络与价值网络相连组成。
5.根据权利要求4所述的基于深度强化学习算法的网络安全协议验证工具优化方法,其特征在于,步骤(4)中所述深度强化学习具体步骤如下:
6.根据权利要求5所述的基于深度强化学习算法的网络安全协议验证工具优化方法,其特征在于,步骤2中所述模拟验证采样动作选择具体计算公式如下: