1.基于强化学习的单一体系的分子生成方法,其特征在于,包括:
2.根据权利要求1所述的基于强化学习的单一体系的分子生成方法,其特征在于,对所述分子数据集通过原子替换的方式进行扩充过程中,使用br原子替代所述分子数据集中的smiles分子表达式中与c原子相连的h原子。
3.根据权利要求1所述的基于强化学习的单一体系的分子生成方法,其特征在于,通过去重处理后的所述扩充数据集,对transformer模型进行预训练,得到预训练模型v1的步骤包括:
4.根据权利要求3所述的基于强化学习的单一体系的分子生成方法,其特征在于,对所述预训练模型v1进行强化学习处理,得到预训练模型v2的步骤包括:
5.根据权利要求4所述的基于强化学习的单一体系的分子生成方法,其特征在于,设定的评分标准score为:
6.根据权利要求4所述的基于强化学习的单一体系的分子生成方法,其特征在于,对所述预训练模型v2进行微调处理的步骤包括:
7.根据权利要求6所述的基于强化学习的单一体系的分子生成方法,其特征在于,利用agent模型的输出和prior模型的输出构建的损失函数的公式为:
8.基于强化学习的单一体系的分子生成装置,其特征在于,包括:
9.根据权利要求8所述的基于强化学习的单一体系的分子生成装置,其特征在于,所述原始数据获取模块中,使用br原子替代所述分子数据集中的smiles分子表达式中与c原子相连的h原子;
10.根据权利要求9所述的基于强化学习的单一体系的分子生成装置,其特征在于,所述第三模型训练模块包括: