催化剂系统松弛能量预测模型构建方法和装置与流程

文档序号:36041007发布日期:2023-11-17 17:45阅读:27来源:国知局
催化剂系统松弛能量预测模型构建方法和装置与流程

本技术涉及计算机,特别涉及一种催化剂系统松弛能量预测模型构建方法和装置、计算设备、计算机可读存储介质及计算机程序产品。


背景技术:

1、催化剂作为化学反应的重要辅助手段,其广泛运用在化工、制造等领域。为化学反应选择合适的催化剂,是实现控制化学反应的速度、保障反应安全的重要手段。在传统方法中,一般通过大量的实验从海量的备选物质中挑出合适的催化剂,这一方法不但耗时耗力,而且会造成极大的浪费。为此,实验人员希望能提前预测催化剂的一些关键指标,来减少催化剂海选的备选数量,以实现快速发现合适的催化剂。松弛能量可以指示吸附物催化剂系统从初始状态到稳定状态中会释放的能量,是衡量催化剂性能的一项关键指标。而传统的基于量子力学的松弛能量预测方法计算复杂度高、计算量巨大,因而严重影响了催化剂研发效率。近年来,随着计算机技术的发展,利用深度学习方法构建松弛能量预测模型预测吸附物-催化剂系统的松弛能量受到越来越多的关注。


技术实现思路

1、鉴于此,本技术提供了一种催化剂系统松弛能量预测模型构建方法和装置、计算设备、计算机可读存储介质及计算机程序产品,期望缓解或克服上面提到的部分或全部缺陷以及其他可能的缺陷。

2、根据本技术的一个方面,提供了一种催化剂系统松弛能量预测模型构建方法,该方法包括:获取第一训练数据集,第一训练数据集包含多个第一训练数据,每个第一训练数据包含第一训练样本以及相应的第一样本标签,其中第一训练样本包括第一催化剂系统结构信息,且第一样本标签包括与第一催化剂系统结构信息对应的系统能量信息和原子受力信息;利用第一训练数据集训练催化剂系统能量预测模型,以得到预训练的催化剂系统能量预测模型;依据预训练的催化剂系统能量预测模型,构建催化剂系统松弛能量初始预测模型;获取第二训练数据集,第二训练数据集包含多个第二训练数据,每个第二训练数据包含第二训练样本以及相应的第二样本标签,其中第二训练样本包括第二催化剂系统结构信息,且第二样本标签包括与第二催化剂系统结构对应的松弛能量信息和原子位移信息;利用第二训练数据集训练催化剂系统松弛能量初始预测模型,以得到催化剂系统松弛能量预测模型。

3、根据本技术的另一方面,提供了一种催化剂系统松弛能量预测模型构建装置,该催化剂系统松弛能量预测模型构建装置包括:第一获取模块,其被配置成获取第一训练数据集,第一训练数据集包含多个第一训练数据,每个第一训练数据包含第一训练样本以及相应的第一样本标签,其中第一训练样本包括第一催化剂系统结构信息,且第一样本标签包括与第一催化剂系统结构信息对应的第一系统能量信息和第一原子受力信息;第一训练模块,其被配置成利用第一训练数据集训练催化剂系统能量预测模型,以得到预训练的催化剂系统能量预测模型;第一构建模块,其被配置成依据预训练的催化剂系统能量预测模型,构建催化剂系统松弛能量初始预测模型;第二获取模块,其被配置成获取第二训练数据集,第二训练数据集包含多个第二训练数据,每个第二训练数据包含第二训练样本以及相应的第二样本标签,其中第二训练样本包括第二催化剂系统结构信息,且第二样本标签包括与第二催化剂系统结构对应的松弛能量信息和原子位移信息;第二训练模块,其被配置成利用第二训练数据集训练催化剂系统松弛能量初始预测模型,以得到催化剂系统松弛能量预测模型。

4、在根据本技术的一些实施例的催化剂系统松弛能量预测模型构建装置中,利用第一训练数据集训练催化剂系统能量预测模型,以得到预训练的催化剂系统能量预测模型,包括:针对第一训练数据集中每一个第一训练数据,将该第一训练数据的第一催化剂系统结构信息输入到催化剂系统能量预测模型,以得到第一输出结果,该第一输出结果包括催化剂系统能量预测结果以及原子受力信息预测结果;针对第一训练数据集中每一个第一训练数据,基于催化剂系统能量预测结果与该第一训练数据的系统能量信息计算第一损失;针对第一训练数据集中每一个第一训练数据,基于原子受力信息预测结果与该第一训练数据的原子受力信息计算第二损失;根据第一训练数据集中每一个第一训练数据对应的第一损失和第二损失,确定催化剂系统能量预测模型的目标损失;基于目标损失,对催化剂系统能量预测模型的参数进行迭代更新直至目标损失满足第一预设条件,以得到预训练的催化剂系统能量预测模型。

5、在根据本技术的一些实施例的催化剂系统松弛能量预测模型构建装置中,第一预设条件包括下述至少一个:当前目标损失小于预定阈值;当前目标损失对应的迭代次数达到预定次数。

6、在根据本技术的一些实施例的催化剂系统松弛能量预测模型构建装置中,利用第二训练数据集训练催化剂系统松弛能量初始预测模型,以得到催化剂系统松弛能量预测模型,包括:针对第二训练数据集中每一个第二训练数据,将该第二训练数据的第二催化剂系统结构信息输入到催化剂系统松弛能量初始预测模型,以得到第二输出结果,该第二输出结果包括催化剂系统松弛能量预测结果以及原子位移信息预测结果;针对第二训练数据集中每一个第二训练数据,基于催化剂系统松弛能量预测结果与该第二训练数据的松弛能量信息计算第三损失;针对第二训练数据集中每一个第二训练数据,基于原子位移信息预测结果与该第二训练数据的原子位移信息计算第四损失;根据第二训练数据集中每一个第二训练数据对应的第三损失和第四损失,确定催化剂系统松弛能量初始预测模型的目标损失;基于目标损失,对催化剂系统松弛能量初始预测模型的参数进行迭代更新直至目标损失满足第二预设条件,以得到催化剂系统能量预测模型。

7、在根据本技术的一些实施例的催化剂系统松弛能量预测模型构建装置中,催化剂系统能量预测模型包含拓扑图确定子模型和图神经网络子模型,并且针对第一训练数据集中每一个第一训练数据,将该第一训练数据的第一催化剂系统结构信息输入到催化剂系统能量预测模型,以得到输出结果,包括:将第一催化剂系统结构信息输入到拓扑图确定子模型,以获得第一催化剂系统结构信息对应的拓扑图,该拓扑图用于表征第一催化剂系统结构信息对应的催化剂系统中各个原子之间的拓扑关联;将第一催化剂结构信息对应的拓扑图输入到图神经网络子模型,以获得催化剂系统能量预测结果以及原子受力信息预测结果。

8、在根据本技术的一些实施例的催化剂系统松弛能量预测模型构建装置中,拓扑图包含多个节点及将多个节点两两连接的边,每个节点表示对应的催化剂系统中的原子,且每个边表示该边对应的两个原子之间的关联,并且将第一催化剂系统结构信息输入到拓扑图确定子模型,以获得第一催化剂系统结构信息对应的拓扑图,包括:根据第一催化剂系统结构信息,确定第一催化剂系统结构信息对应的催化剂系统中各个原子的三维坐标;根据第一催化剂系统结构信息对应的催化剂系统中各个原子的三维坐标,确定第一催化剂系统结构信息对应的拓扑图的各个节点的位置以及各个原子两两之间的距离;针对拓扑图中每一个双节点组合,响应于该组合中两个节点分别对应的原子之间的距离小于或等于预定距离阈值,连接这两个节点的边的取值为1;针对拓扑图中每一个双节点组合,响应于该组合中两个节点分别对应的原子之间的距离大于预定距离阈值,连接这两个节点的边的取值为0。

9、在根据本技术的一些实施例的催化剂系统松弛能量预测模型构建装置中,获取第一训练集包括:获取多个样本催化剂系统中每一个的三维结构信息,该三维结构信息包括相应的样本催化剂系统中各个原子的三维坐标;基于多个样本催化剂系统中每一个的三维结构信息,通过量子力学方法确定每一个样本催化剂系统的系统能量信息和原子受力信息;根据每一个样本催化剂系统的三维结构信息及其对应的系统能量信息和原子受力信息,构造第一训练数据。

10、在根据本技术的一些实施例的催化剂系统松弛能量预测模型构建装置中,利用第一训练数据集训练催化剂系统能量预测模型,以得到预训练的催化剂系统能量预测模型,包括:基于预设的第一超参数集合,利用第一训练数据集训练催化剂系统能量预测模型,以得到预训练的催化剂系统能量预测模型,其中预设的第一超参数集合包括预设的第一学习率,并且,利用第二训练数据集训练催化剂系统松弛能量初始预测模型,以得到催化剂系统松弛能量预测模型,包括:基于预设的第二超参数集合,利用第二训练数据集训练催化剂系统松弛能量初始预测模型,以得到催化剂系统松弛能量预测模型,其中第二超参数集合包括预设的第二学习率,且第二学习率小于第一学习率。

11、在根据本技术的一些实施例的催化剂系统松弛能量预测模型构建装置中,第二学习率等于或小于第一学习率的十分之一。

12、根据本技术的另一个方面,提供了一种催化剂系统松弛能量预测方法,该方法包括:获取待预测催化剂系统的系统结构;将待预测催化剂系统的系统结构输入到根据前述任一实施例中的催化剂系统松弛能量预测模型,以得到待预测催化剂系统的松弛能量。

13、根据本技术的另一方面,提供了一种计算设备,包括:存储器,其被配置成存储计算机可执行指令;以及处理器,其被配置成当计算机可执行指令被处理器执行时执行根据本技术一些实施例的催化剂系统松弛能量预测模型构建方法的步骤。

14、根据本技术的另一方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,计算机可执行指令在被执行时实现根据本技术一些实施例的催化剂系统松弛能量预测模型构建方法的步骤。

15、根据本技术的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本技术一些实施例的催化剂系统松弛能量预测模型构建方法的步骤。

16、在根据本技术一些实施例的催化剂系统松弛能量预测模型构建方法和装置中,通过两阶段的多任务模型训练(即催化剂系统能量预测模型的预训练阶段,以及预训练的催化剂系统能量预测模型的微调阶段)来构建催化剂系统松弛能量预测模型。首先,在第一阶段(即预训练阶段)中,基于包含大量数据的第一训练数据集(例如,系统结构信息到系统能量信息和原子受力信息的训练数据)训练能并行处理多任务的催化剂系统能量预测模型(例如“能量-受力”预测模型,它根据催化剂系统结构预测催化剂系统的系统能量和原子受力),以得到预训练的催化剂系统能量预测模型,并将其作为催化剂系统松弛能量初始预测模型,从而提升了最终构建的催化剂系统松弛能量预测模型的初始参数的准确性,进而提升了松弛能量预测的准确性;其次,在第二阶段(即微调阶段),利用第二训练数据集(例如,系统初始结构信息到松弛能量信息和原子位移信息的训练数据)进一步训练能并行处理多任务的催化剂系统松弛能量初始预测模型(例如,它根据催化剂系统结构预测催化剂系统的松弛能量和原子位移),以得到最终的催化剂系统松弛能量预测模型。由于第一阶段和第二阶段的训练均是将模型训练为适应多任务(例如,第一阶段包含预测系统能量和原子受力两个任务,第二阶段包含预测松弛能量和原子位移两个任务),且第一阶段和第二阶段对模型的预期输出的维度是对应的(例如,系统能量和松弛能量的数据维度相同,原子受力和原子位移的数据维度相同),因此第二阶段的训练过程能更加快速和高效,最终的催化剂系统松弛能量预测模型的预测精度也更高。

17、因此,一方面,根据本技术一些实施例构建的催化剂系统松弛能量预测模型由于采用两阶段训练过程,显著提升了松弛能量预测的准确性,从而避免了相关技术的direct方法计算精度不高的问题;另一方面,根据本技术一些实施例构建的催化剂系统松弛能量预测模型可以基于系统初始结构信息直接预测松弛能量,无需迭代计算,计算速度较快,从而避免了传统量子力学方法以及相关技术的relax方法的计算复杂度高、计算过程繁琐、计算速度缓慢等问题;此外,根据本技术一些实施例的催化剂系统松弛能量预测模型构建方法由于在第一阶段和第二阶段均是针对多任务进行训练,其训练效率更高且得到的模型预测准确性更好,同时有效扩展了模型预测功能。因而,根据本技术的催化剂系统松弛能量预测模型构建方法更广泛地适用于不同的应用场景,例如大规模吸附物-催化剂系统松弛能量计算场景等。

18、根据下文描述的实施例,本技术的这些和其它优点将变得清楚,并且参考下文描述的实施例来阐明本技术的这些和其它优点。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1