材料基因工程高通量集成计算与数据管理的方法及系统与流程

文档序号:18850580发布日期:2019-10-13 00:49阅读:441来源:国知局
材料基因工程高通量集成计算与数据管理的方法及系统与流程

本发明涉及新材料研发领域,尤其涉及一种材料基因工程高通量集成计算与数据管理的方法及系统。



背景技术:

目前,利用计算机模拟的方法来研究材料的性质已经成为探索新材料的一种强有力的方式,其中,第一性原理计算已经能够成功且准确地对材料结构和性质进行预测。国际上已经有一些高通量材料计算软件或第一性原理计算数据库,例如Automatic FLOW软件和Materials Project数据库,但其开源程度以及数据的开放程度不高,影响国内用户的使用,并且需要用户自己搭建计算环境。因此,使用起来会有很大的局限性。

而且,单一的第一性原理计算无法满足大规模作业平行运行和数据集中管理的要求。尽管可以通过写一段脚本程序的方式初步实现批量作业的自动流程,但是需要用户自己编写代码,购买或租用计算集群,搭建计算环境,数据可视化和格式转换、数据抽取和存储,数据的可靠性评价等依然不易实现,尤其是不能实现计算数据的复用和共享。因此,实现高通量第一性原理计算,数据及计算资源的一体化集成式管理,降低用户开展第一性原理计算的门槛,显得尤为迫切。



技术实现要素:

本发明所要解决的技术问题是针对用户开展第一性原理计算的不便捷,及无法满足大规模作业平行运行和数据集中管理的要求,提供一种材料基因工程高通量集成计算与数据管理的方法及系统。

本发明解决上述技术问题的一种技术方案如下:

一种材料基因工程高通量集成计算与数据管理的方法,包括以下步骤:

步骤1,获取大量初始结构,所述初始结构可以由系统根据内置的计算模块进行高通量建模产生,也可以由用户直接提供,所述初始结构包括:晶体结构、相结构;

步骤2,选择第一性原理计算任务,包括:结构优化、静态计算、磁学性质计算、弹性常数计算(包括应力—应变法、应变—能量法两种方法)、电子态密度、能带结构、跟频率有关的介电函数以及结构预测和筛选,所选择的第一性原理计算任务可以是以上的一个,也可以是多个;

步骤3,对所述初始结构进行高通量筛选,得到有效结构;

步骤4,根据所述有效结构和所述第一性原理计算任务推荐计算参数,包括:结构优化参数、平面波截断能、计算方法参数、K点密度以及交换关联泛函参数信息,然后用户对所述计算参数进行修改和确认,或用户也可以选择直接上传计算参数,并保存所述计算参数;

步骤5,设置计算资源,包括选择计算集群、设置计算时长以及所需CPU核数,生成计算资源配置文件,并保存所述计算资源配置文件;

步骤6,将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集群,进行计算和监控,并自动纠错;

步骤7,计算完成后,得到计算结果文件,并对所述计算结果文件进行提取或处理,得到计算结果和描述符数据,并将所述计算结果和所述描述符数据保存到第一性原理计算数据库中,所述计算结果包括计算资源和计算参数数据,所述描述符数据包括结构和性质数据。

本发明的有益效果是:通过筛选大量初始结构,选择第一性原理计算任务,推荐计算参数,提交计算任务并监控,得到计算结果并存储,使用户可以便捷地开展自动流程高通量第一性原理计算。

在上述技术方案的基础上,本发明还可以做如下改进:

进一步地,所述系统内置的计算模块包括:支持单个结构建模和性质计算的原胞模块即Unit Cell模块、单个结构连续掺杂情况的结构筛选和性质计算的掺杂模块即Doping模块、固溶体合金建模以及性质计算的特殊准随机结构模块即SQS模块、批量结构开展能量计算的多结构模块即Batch calculations模块、用于结构表面吸附的表面吸附模块即Surface Adsorption模块、用于支持内部溶解扩散计算的扩散模块即Diffusion模块、以及支持过渡态搜索的过渡态搜索模块即Transition State Search模块。

采用上述进一步方案的有益效果是:通过系统内置的计算模块,可以根据不同的研究需求提供更多的高通量建模和自动流程计算,帮助用户便捷实现材料理论设计和相关研究。

进一步地,步骤3具体为:

步骤3.1,去除所述初始结构中的等价结构;

步骤3.2,去除所述初始结构中的不合理结构,例如不稳定结构;

步骤3.3,得到有效结构。

进一步地,步骤6具体为:

检测所述计算是否有误,如果有误,则自动进行纠错,纠错的方式为调整所述计算参数,并重新将修改过的计算参数和所述有效结构、所述计算资源配置文件提交至计算集群进行计算。

进一步地,步骤6中,自动纠错的纠错方式具体为:

检测是否有报错信息,如果有报错信息,根据报错信息的关键字从纠错规则库中确定纠错方案;检测计算结果文件是否完整,如果计算结果文件不完整,检查计算结果文件的中断信息,从纠错规则库中确定纠错方案;判断计算结果是否收敛,如果计算结果不收敛,调整计算收敛精度或调整计算步长,进行纠错,其中,纠错规则库包括计算错误的分类信息和针对错误的纠错方案。

进一步地,步骤6中,检测模块针对出错文件的自动纠错最大次数为5次,超过5次自动放弃纠错,并返回自动纠错未成功信息给用户。

进一步地,步骤7具体为:

步骤7.1,计算完成后得到初始计算结果,将所述初始计算结果保存为计算结果文件;

步骤7.2,对所述计算结果文件进行选择后下载,并保存;

步骤7.3,解析所述计算结果文件,生成计算结果报告;

步骤7.4,提取所述计算结果文件中的计算结果和描述符数据,并将所述计算结果和所述描述符数据存储在第一性原理计算数据库中。

进一步地,步骤7中,还可以对所述描述符数据进行一次加工或二次加工,并将一次加工或二次加工后的描述符数据存储在第一性原理计算数据库中。

进一步地,本发明所述的方法还包括:

步骤8,将所述有效结构和所述描述符数据进行可视化展示。

进一步地,第一性原理计算数据库中存储的数据默认为共享模式,所有平台用户都可以查看数据,数据作者也可以修改为暂不共享,其他用户无法看到数据。

采用上述进一步方案的有益效果是:通过对第一性原理计算数据库设置共享模式,提高数据的安全性。

本发明解决上述技术问题的另一种技术方案如下:

一种材料基因工程高通量集成计算与数据管理的系统,包括:依次连接的获取系统、高通量作业生成系统、文件系统、作业提交与监控系统、纠错系统、数据提取系统和第一性原理计算数据库,其中,

所述获取模块用于获取大量初始结构,所述初始结构可以由系统根据内置的计算模块进行高通量建模产生,也可以由用户直接提供,所述初始结构包括:晶体结构、相结构,所述获取模块还用于选择第一性原理计算任务;

所述高通量作业生成系统用于对所述初始结构进行高通量筛选,得到有效结构,还用于根据所述有效结构和所述第一性原理计算任务推荐计算参数,供用户对所述计算参数进行修改和确认,或接收用户直接上传的计算参数;

所述文件系统用于保存所述计算参数、计算资源配置文件和计算结果文件;

所述作业提交与监控系统用于设置计算资源,并生成计算资源配置文件,还用于将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集群,进行计算和监控;

所述纠错系统用于自动纠错;

所述数据提取系统用于对计算完成后得到的计算结果文件进行提取或处理,得到计算结果和描述符数据;

所述第一性原理计算数据库用于存储所述计算结果和所述描述符数据。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步地,系统内置的计算模块具体包括:支持单个结构建模和性质计算的原胞模块即Unit Cell模块、单个结构连续掺杂情况的结构筛选和性质计算的掺杂模块即Doping模块、固溶体合金建模以及性质计算的特殊准随机结构模块即SQS模块、批量结构开展能量计算的多结构模块即Batch calculations模块、用于结构表面吸附的表面吸附模块即Surface Adsorption模块、用于支持内部溶解扩散计算的扩散模块即Diffusion模块、以及支持过渡态搜索的过渡态搜索模块即Transition State Search模块。

进一步地,所述获取系统包括:高通量建模模块、结构输入模块和任务选择列表,所述高通量建模模块用于通过高通量建模产生大量初始结构,所述结构输入模块用于获取用户输入的初始结构,所述任务选择列表用于选择第一性原理计算任务;

所述高通量作业生成系统包括:高通量筛选模块和参数配置模块,所述高通量筛选模块用于对所述初始结构进行高通量筛选,得到有效结构,所述参数配置模块用于根据所述有效结构和所述第一性原理计算任务推荐计算参数,还用于接收用户直接上传的计算参数;

所述作业提交与监控系统包括:作业调度模块和监控模块,所述作业调度模块用于设置计算资源,并生成计算资源配置文件,还用于将所述有效结构、所述计算参数和所述计算资源配置文件提交到计算集群,进行计算,所述监控模块用于对计算过程进行监控;

所述纠错系统具体用于检测所述计算是否有误,如果有误,则自动进行纠错,纠错的方式为调整所述计算参数,并重新将修改过的计算参数和所述有效结构、所述计算资源配置文件提交至计算集群进行计算;

所述数据提取系统包括:提取处理模块和报告生成器,所述提取处理模块用于将计算完成后得到的初始计算结果保存为计算结果文件,并对所述计算结果文件进行选择后下载,还用于提取所述计算结果文件中的计算结果和描述符数据,所述报告生成器用于解析所述计算结果文件,生成计算结果报告。

进一步地,本发明所述的系统还包括可视化引擎,分别与所述文件系统与所述第一性原理计算数据库连接,用于对所述有效结构和所述描述符数据进行可视化展示。

本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。

附图说明

图1为本发明实施例提供的一种材料基因工程高通量集成计算与数据管理的方法的示意性流程图;

图2为本发明另一实施例提供的一种材料基因工程高通量集成计算与数据管理的方法的具体实施方式的示意性流程图;

图3为本发明另一实施例提供的一种材料基因工程高通量集成计算与数据管理的系统的装置结构图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

如图1给出了本发明实施例提供的一种材料基因工程高通量集成计算与数据管理的方法的示意性流程图。如图1所示,该方法包括:

S101,用户直接提供大量初始结构,或执行S102;

S102,系统根据内置的计算模块进行高通量建模产生大量初始结构,初始结构包括晶体结构和相结构;

S103,选择第一性原理计算任务,包括:结构优化、静态计算、磁学性质计算、弹性常数计算(包括应力—应变法、应变—能量法两种方法)、电子态密度、能带结构、跟频率有关的介电函数以及结构预测和筛选,所选择的第一性原理计算任务可以是以上的一个,也可以是多个;

S104,对初始结构进行高通量筛选,得到有效结构;

S105,根据有效结构和第一性原理计算任务推荐计算参数,包括:结构优化参数、平面波截断能、计算方法参数、K点密度以及交换关联泛函参数信息,然后用户对计算参数进行修改和确认,或用户也可以选择直接上传计算参数,并保存计算参数;

S106,设置计算资源,包括选择计算集群、设置计算时长以及所需CPU核数,生成计算资源配置文件,并保存计算资源配置文件;

S107,将有效结构、计算参数和计算资源配置文件提交到计算集群,进行计算和监控,并自动纠错;

S108,计算完成后,得到计算结果文件,并对计算结果文件进行提取或处理,得到计算结果和描述符数据,并将计算结果和描述符数据保存到第一性原理计算数据库中,所述计算结果包括计算资源和计算参数数据,所述描述符数据包括结构和性质数据。

上述实施例通过筛选大量初始结构,选择第一性原理计算任务,推荐计算参数,提交计算任务并监控,得到计算结果并存储,使用户可以便捷地开展自动流程高通量第一性原理计算。

可选地,作为本发明的一个实施例,如图2所示,为本发明一种材料基因工程高通量集成计算与数据管理的方法的具体实施方式,以本发明包含的Batch Calculations模块开展100个初始晶体结构的能量计算为例,该100个初始晶体结构通过对一个结构实施掺杂获得,通过VASP软件进行结构优化和静态计算。具体步骤包括:

S201,系统获取100个初始晶体结构。

S202,选择第一性原理计算任务,包括结构优化和静态计算。

S203,系统对这100个初始晶体结构进行高通量筛选,去除这100初始晶体结构中的等价结构和不合理结构,得到20个有效晶体结构。

S204,系统根据筛选后得到的有效结构和选择的结构优化、能量计算任务,推荐结构优化和静态计算参数(如结构优化方式ISIF、平面波截断能ENCUT、K点密度、交换关联泛函参数信息)。

S205,用户查看或修改结构优化、静态计算参数。

S206,用户设置计算资源,包括选择计算集群、设置计算时长和CPU核数,并保存为计算资源配置文件。

S207,将这20个有效结构、结构优化和静态计算参数、计算资源配置文件提交至计算集群开展计算,并监控计算进程。

S208,系统检测计算是否正确结束,检测内容包括:检查是否有报错信息,查看计算结果文件是否完整,判断计算结果(能量、力、位移)是否收敛。

S209,如果有计算出错,系统自动纠错,如果自动纠错次数超过5次,则返回自动纠错未成功信息给用户。

S210,计算完成后,系统将初始计算结果保存为计算结果文件,系统选择计算文件INCAR、KPOINTS、POSCAR、CHGCAR、WAVECAR、OUTCAR和vasprun.xml文件下载,并保存到文件系统中;

S211,报告生成器解析计算结果,包括优化后的结构、密度、体积、晶格常数、能量、受力等信息,生成计算结果报告;

S212,提取处理模块所提取计算结果和描述符数据,主要包括晶格常数、体积、密度、能量等,并提取优化后的结构文件CONTCAR,存储在第一性原理计算数据库中。

本发明还提供一种材料基因工程高通量集成计算与数据管理的系统,如图3所示,该系统包括:获取系统310、高通量作业生成系统320、文件系统330、作业提交与监控系统系统340、纠错系统350、数据提取系统360、可视化引擎370、第一性原理计算数据库380,其中:

获取模块310用于获取大量初始结构,初始结构由高通量建模产生,或由用户直接提供,初始结构包括晶体结构和相结构,获取模块还用于选择第一性原理计算任务;

高通量作业生成系统320用于对初始结构进行高通量筛选,得到有效结构,还用于根据有效结构和第一性原理计算任务推荐计算参数,供用户对计算参数进行修改和确认,或接收用户直接上传的计算参数;

文件系统330用于保存计算参数、计算资源配置文件和计算结果文件;

作业提交与监控系统340用于设置计算资源,并生成计算资源配置文件,还用于将有效结构、计算参数和计算资源配置文件提交到计算集群,进行计算和监控;

纠错系统350用于自动纠错;

数据提取系统360用于对计算完成后得到的计算结果文件进行提取或处理,得到计算结果和描述符数据;

可视化引擎370用于对有效结构和描述符数据进行可视化展示;

第一性原理计算数据库380用于存储计算结果和描述符数据。

上述实施例中提供的系统,使用户可以便捷地开展高通量第一性原理计算,并建立可以共享的第一性原理计算数据库,为采用材料基因工程方法开展材料理论设计或相关研究提供支撑。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所阐述的系统和模块,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或文件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

另外,在本发明各个实施例中的各模块可以集成在一个系统中,也可以是各个模块单独物理存在,也可以是两个或两个以上模块集成在一个系统中。上述集成的系统既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1