本技术涉及有机晶体结构预测,具体而言,涉及一种有机晶体结构预测方法、装置、设备及存储介质。
背景技术:
1、有机晶体结构是指固态晶体有机化合物的微观分子堆积形式,是备受关注的固态特征之一。晶体结构对于固体物质的理化性质和生物效应有直接或间接的影响,因此探索有机化合物的晶体结构成为近年来的研究热点。
2、由于采用实验的方法进行晶体筛选难以全面匹配到稳定的晶体结构,目前出现了使用计算机技术进行晶体结构预测的方法,如基于量子力学计算的晶体结构预测。该方法通过随机搜索、网格搜索、遗传算法、蒙特卡洛模拟退火或其他生成方法生成初始试验晶体结构,通过计算试验晶体结构的晶格能来预测稳定的晶体结构。
3、但是,上述方法计算复杂度极高、计算周期长,因此进行有机晶体结构预测的实用性差、效率低。
技术实现思路
1、本技术的目的在于,针对上述现有技术中的不足,提供一种有机晶体结构预测方法、装置、设备及存储介质,以解决现有技术中有机晶体结构预测的实用性差、效率低的问题。
2、为实现上述目的,本技术采用的技术方案如下:
3、第一方面,本技术提供了一种有机晶体结构预测方法,所述方法包括:
4、获取目标化合物的分子结构,并根据所述目标化合物的特征描述符确定所述目标化合物的条件向量;
5、将所述条件向量输入预先训练得到的生成模型中,生成至少一个有机晶体结构;
6、确定各所述有机晶体结构的计算指标参数;
7、将所述目标化合物的分子结构输入预先训练得到的判别模型中,得到所述目标化合物对应的稳定有机晶体结构的预测指标参数;
8、根据所述计算指标参数、所述预测指标参数、预设的指标参数差值阈值以及各所述有机晶体结构,得到所述稳定有机晶体结构。
9、可选的,所述生成模型为生成对抗网络;
10、所述将所述条件向量输入预先训练得到的生成模型中,生成至少一个有机晶体结构,包括:
11、将所述条件向量输入所述生成对抗网络,由所述生成对抗网络的生成器根据所述条件向量生成至少一个有机晶体结构。
12、可选的,所述判别模型为图卷积网络,所述图卷积网络包括:依次连接的多个图卷积层以及预测层;
13、所述将所述目标化合物的分子结构输入预先训练得到的判别模型中,得到所述目标化合物对应的稳定有机晶体结构的预测指标参数,包括:
14、将所述分子结构输入首个图卷积层,并根据各图卷积层的连接顺序,由各图卷积层依次进行处理,得到所述分子结构的片段特征;
15、将所述片段特征输入所述预测层得到所述稳定有机晶体结构的预测指标参数。
16、可选的,所述根据所述计算指标参数、所述预测指标参数、预设的指标参数差值阈值以及各所述有机晶体结构,得到所述稳定有机晶体结构,包括:
17、根据所述计算指标参数、所述预测指标参数、预设的指标参数差值阈值,从多个有机晶体结构中筛选出多个中间有机晶体结构;
18、对所述中间有机晶体结构进行聚类,得到至少一个聚类后的有机晶体结构,并根据各所述聚类后的有机晶体结构的指标参数差对各所述聚类后的有机晶体结构进行排序,并根据排序结果得到所述稳定有机晶体结构。
19、可选的,所述根据所述计算指标参数、所述预测指标参数、预设的指标参数差值阈值,从多个有机晶体结构中筛选出多个中间有机晶体结构,包括:
20、根据所述计算指标参数和所述预测指标参数确定所述有机晶体结构的指标参数差;
21、根据所述指标参数差和预设的指标参数差值阈值从多个有机晶体结构中筛选出多个中间有机晶体结构。
22、可选的,所述根据目标化合物的特征描述符确定所述目标化合物的条件向量,包括:
23、获取所述目标化合物的特征描述符,并对所述特征描述符进行离散化处理,得到所述目标化合物的条件向量。
24、可选的,所述将所述条件向量输入所述生成对抗网络,由所述生成对抗网络的生成器根据所述条件向量生成至少一个有机晶体结构之前,包括:
25、将样本条件向量和噪声向量输入初始生成对抗网络,由所述初始生成对抗网络中的生成器生成多个试验有机晶体结构,并将所述试验有机晶体结构和预先标注的有机晶体结构输入所述初始生成对抗网络中的判别器,以确定所述试验有机晶体结构和预先标注的有机晶体结构的差异信息,并根据差异信息确定所述初始生成对抗网络的损失值,根据所述损失值对生成对抗网络进行迭代修正,得到所述生成对抗网络。
26、第二方面,本技术提供了一种有机晶体结构预测装置,所述装置包括:
27、获取模块,用于:获取目标化合物的分子结构,并根据所述目标化合物的特征描述符确定所述目标化合物的条件向量;
28、生成模块,用于:将所述条件向量输入预先训练得到的生成模型中,生成至少一个有机晶体结构;
29、确定模块,用于:确定各所述有机晶体结构的计算指标参数;
30、预测模块,用于:将所述目标化合物的分子结构输入预先训练得到的判别模型中,得到所述目标化合物对应的稳定有机晶体结构的预测指标参数;
31、筛选模块,用于:根据所述计算指标参数、所述预测指标参数、预设的指标参数差值阈值以及各所述有机晶体结构,得到所述稳定有机晶体结构。
32、可选的,所述生成模型为生成对抗网络;
33、可选的,所述生成模块具体用于:
34、将所述条件向量输入所述生成对抗网络,由所述生成对抗网络的生成器根据所述条件向量生成至少一个有机晶体结构。
35、可选的,所述判别模型为图卷积网络,所述图卷积网络包括:依次连接的多个图卷积层以及预测层;
36、所述预测模块具体用于:
37、将所述分子结构输入首个图卷积层,并根据各图卷积层的连接顺序,由各图卷积层依次进行处理,得到所述分子结构的片段特征;
38、将所述片段特征输入所述预测层得到所述稳定有机晶体结构的预测指标参数。
39、可选的,所述筛选模块具体用于:
40、根据所述计算指标参数、所述预测指标参数、预设的指标参数差值阈值,从所述多个有机晶体结构中筛选出多个中间有机晶体结构;
41、对所述中间有机晶体结构进行聚类,得到至少一个聚类后的有机晶体结构,并根据各所述聚类后的有机晶体结构的指标参数差对各所述聚类后的有机晶体结构进行排序,并根据排序结果得到所述稳定有机晶体结构。
42、可选的,所述筛选模块还具体用于:
43、根据所述计算指标参数和所述预测指标参数确定所述有机晶体结构的指标参数差;
44、根据所述指标参数差和预设的指标参数差值阈值从所述多个有机晶体结构中筛选出多个中间有机晶体结构。
45、可选的,所述获取模块还具体用于:
46、获取所述目标化合物的特征描述符,并对所述特征描述符进行离散化处理,得到所述目标化合物的条件向量。
47、第三方面,本技术提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述有机晶体结构预测方法的步骤。
48、第四方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述有机晶体结构预测方法的步骤。
49、本技术的有益效果是:生成模型可以探索到更多的有机晶体的结构,并且相比于现有的在数据库中进行匹配的方法,极大的降低了计算的复杂度。相比于现有的直接对匹配得到的有机晶体结构根据指标参数进行排序,本技术通过判别模型对稳定的有机晶体结构的指标参数进行预测,再根据预测指标参数和计算指标参数对有机晶体结构进行筛选和排序,可以有效的降低计算量,并快速的从多个有机晶体结构中确定稳定的有机晶体结构。总的来说,本技术的方法通过耦合生成模型和判别模型进行有机晶体结构的预测,有机晶体结构的生成和筛选过程完全由机器学习算法实现,在确保预测精度的前提下,有效的降低了计算的复杂度,具备很高的实用性。