基于迁移学习的材料数据建模方法、系统和终端

文档序号:33003053发布日期:2023-01-18 01:56阅读:55来源:国知局
基于迁移学习的材料数据建模方法、系统和终端

1.本技术属于材料科学技术领域,涉及一种基于迁移学习的材料数据建模方法、系统和终端。


背景技术:

2.如今,工业生产、能源存储、电子信息技术等领域都离不开材料科学的发展。例如,半导体材料可用于集成电路、光伏薄膜、光催化剂等;绝缘体材料可用于大功率转换接口、固态电解质等;合金材料可用于电催化剂、仪表外壳等。
3.随着科学技术的发展,材料科学的研究体系也日渐复杂。由于传统的实验方法要经过制备与合成、表征、组装以及性能测试等繁琐的步骤,故需要耗费大量的人力、物力和财力,且需要承担一定的实验风险。计算材料学使得材料科学的理论研究从传统解析推导的束缚中解脱出来,更有利于从实验现象中揭示和证实客观规律。然而,基于高通量的理论计算方法,如密度泛函理论(densityfunctionaltheory,dft),在巨大的化学空间中进行材料发现和筛选的效率仍然很低,尤其是高精度的计算方法会极大地限制新材料发现和筛选的进程。
4.最近,基于理论计算的方法逐渐被机器学习方法所取代。机器学习方法是一种包含模型、策略和算法三要素的人工智能方法,在材料建模中可以捕捉到复杂的物理和化学信息,并加快计算过程。但是机器学习在材料预测中的应用仍然存在一个重大的挑战,即跨材料数据的建模与预测。所述跨材料数据是指在一个研究任务中包含不同的材料体系、不同的材料性质和不同的数据保真度。机器学习建模为了达到较高的预测精度,往往需要足够多的有效数据来捕捉物理特征和材料性质之间的相关性,这不可避免地在数据标注上消耗大量的时间成本。
5.因此,如何在不同的材料体系、不同材料性质和不同数据保真度的任务中建立可靠的、低成本的、高效率的材料数据模型,是材料科学技术领域尚待解决的一个技术难题。


技术实现要素:

6.鉴于以上所述现有技术的缺点,本技术的目的在于提供一种基于迁移学习的材料数据建模方法、系统和终端,用于解决现有基于迁移学习的材料数据建模方法中数据量大、标注成本高和可靠性低的技术问题。
7.第一方面,本技术提供一种基于迁移学习的材料数据建模方法,包括以下步骤:定义初始材料数据建模任务和目标材料数据建模任务,以及所述初始材料数据建模任务和所述目标材料数据建模任务的输入数据和输出数据;基于所述初始材料数据建模任务的输入数据和输出数据建立初始材料数据建模任务模型;迁移学习所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立目标材料数据建模任务模型。
8.本技术提出了将迁移学习应用在相同材料体系、相同材料性质、不同数据保真度
上的“纵向迁移”方法,应用在相同体系、不同材料性质、相同数据保真度的“横向迁移”方法以及应用在不同材料体系、不同材料性质、不同数据保真度上的“交叉迁移”方法,实现了在不同的材料体系、不同材料性质和不同数据保真度的任务中建立可靠的、低成本的、高效率的目标材料数据建模任务模型。
9.在第一方面的一种实现方式中,所述目标材料数据建模任务的输入数据包括与所述初始材料数据建模任务的输入数据相同或不同的材料体系,所述输出数据包括与所述初始材料数据建模任务的输出数据相同或不同的材料性质;所述材料性质的保真度包括实验测量值、高精度计算值或低精度计算值。
10.在第一方面的一种实现方式中,所述基于所述初始材料数据建模任务的输入数据和输出数据建立初始材料数据建模任务模型包括以下步骤:
11.基于所述初始材料数据建模任务的输入数据建立初始材料数据建模任务特征工程;
12.基于所述初始材料数据建模任务的输出数据选择初始材料数据建模任务机器学习模型;
13.基于所述初始材料数据建模任务特征工程训练所述初始材料数据建模任务机器学习模型,以获取初始材料数据建模任务模型。
14.本实现方式中,建立的初始材料数据建模任务模型同时满足了高精度和高效率的材料数据建模和材料性质预测要求。
15.在第一方面的一种实现方式中,所述基于所述初始材料数据建模任务的输入数据建立初始材料数据建模任务特征工程包括根据所述初始材料数据建模任务的输入数据的格式建立初始材料数据建模任务特征工程。
16.在第一方面的一种实现方式中,所述基于所述初始材料数据建模任务特征工程训练所述初始材料数据建模任务机器学习模型,以获取初始材料数据建模任务模型包括以下步骤:
17.选择初始材料数据建模任务机器学习模型;
18.对所述初始材料数据建模任务机器学习模型进行随机的参数初始化;
19.基于预设要求对所述初始材料数据建模任务机器学习模型进行训练。
20.在第一方面的一种实现方式中,所述迁移学习所述基于所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立目标材料数据建模任务模型包括以下步骤:
21.基于所述目标材料数据建模任务的输入数据建立目标材料数据建模任务特征工程;或基于所述初始材料数据建模任务特征工程建立目标材料数据建模任务特征工程,以实现所述初始材料数据建模任务特征工程到所述目标材料数据建模任务特征工程的迁移学习应用;
22.基于所述目标材料数据建模任务的输出数据选择目标材料数据建模任务机器学习模型;
23.基于所述目标材料数据建模任务特征工程训练所述目标材料数据建模任务机器学习模型,以获取目标材料数据建模任务模型。
24.本实现方式中,基于特征的迁移学习方法使得目标材料数据建模任务模型所需要
的数据量至少降低为初始材料数据建模任务模型的1/5,使得小数据建模成为可能。
25.在第一方面的一种实现方式中,所述基于所述目标材料数据建模任务特征工程训练所述目标材料数据建模任务机器学习模型,以获取目标材料数据建模任务模型包括将所述初始材料数据建模任务机器学习模型中的参数设置作为所述目标材料数据建模任务机器学习模型的训练起始点,以实现所述初始材料数据建模任务机器学习模型到所述目标材料数据建模任务机器学习模型的迁移学习应用。
26.本实现方式中,基于模型参数的迁移学习方法有效避免了在初始材料数据建模任务中建立构效关系的挑战。
27.在第一方面的一种实现方式中,所述基于所述目标材料数据建模任务特征工程训练所述目标材料数据建模任务机器学习模型,以获取目标材料数据建模任务模型包括采用以下任意一种方式调整所述目标材料数据建模任务机器学习模型:
28.对所述目标材料数据建模任务机器学习模型的所有参数进行调整;
29.对所述目标材料数据建模任务机器学习模型的部分参数进行调整;
30.基于预设要求对所述目标材料数据建模任务机器学习模型进行训练,以获取重新初始化后的目标材料数据建模任务机器学习模型。
31.本实现方式中,目标材料数据建模任务模型的精度基本与初始材料数据建模任务模型持平,大幅降低了模型优化时参数微调的计算成本。
32.通过目标材料数据建模任务模型可以对大量未知的材料体系进行快速预测,从而发现未知材料具有的新性质;也可以从目标材料数据建模任务模型得到的物理化学启发,进一步指导新材料的发现或对已知材料的定向设计,进而得到具有优良性能的材料,并将其应用至能源领域(电池材料,催化材料等)、环境领域(吸附剂,传感器等)、医疗领域(纳米纤维材料)、国防领域(火箭助推燃料、飞行器外壳等)等各个领域中。
33.第二方面,本技术提供一种基于迁移学习的材料数据建模系统,包括定义模块、初始材料数据建模任务模块和目标材料数据建模任务模块;
34.所述定义模块用于定义初始材料数据建模任务和目标材料数据建模任务,以及所述初始材料数据建模任务和所述目标材料数据建模任务的输入数据和输出数据;
35.所述初始材料数据建模任务模块与所述定义模块相连,用于基于所述初始材料数据建模任务的输入数据和输出数据建立初始材料数据建模任务模型;
36.所述目标材料数据建模任务模块与所述定义模块和所述初始材料数据建模任务模块相连,用于迁移学习所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立目标材料数据建模任务模型。
37.第三方面,本技术提供一种基于迁移学习的材料数据建模终端,包括处理器和存储器;
38.所述存储器用于存储计算机程序;
39.所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行上述基于迁移学习的材料数据建模方法。
40.如上所述,本技术所述的基于迁移学习的材料数据建模方法、系统和终端,具有以下有益效果:
41.(1)提出了将迁移学习应用在相同材料体系、相同材料性质、不同数据保真度上的“纵向迁移”方法,应用在相同体系、不同材料性质、相同数据保真度的“横向迁移”方法和应用在不同材料体系、不同材料性质、不同数据保真度上的“交叉迁移”方法,实现了在不同的材料体系、不同材料性质和不同数据保真度的任务中建立可靠的、低成本的、高效率的目标材料数据建模任务模型;
42.(2)基于特征的迁移学习方法使得目标材料数据建模任务模型所需要的数据量至少降低为初始材料数据建模任务模型的1/5,使得小数据建模成为可能;
43.(3)目标材料数据建模任务模型的精度基本与初始材料数据建模任务模型持平,大幅降低了模型优化时参数微调的计算成本;
44.(4)基于模型参数的迁移学习方法有效避免了在初始材料数据建模任务中建立构效关系的挑战;
45.(5)通过目标材料数据建模任务模型可以对大量未知的材料体系进行快速预测,从而发现未知材料具有的新性质;也可以从目标材料数据建模任务模型得到的物理化学启发,进一步指导新材料的发现或对已知材料的定向设计,进而得到具有优良性能的材料,并将其应用至能源领域(电池材料,催化材料等)、环境领域(吸附剂,传感器等)、医疗领域(纳米纤维材料)、国防领域(火箭助推燃料、飞行器外壳等)等各个领域中。
附图说明
46.图1显示为本技术实施例所述的基于迁移学习的材料数据建模方法于一实施例中的流程图。
47.图2显示为本技术实施例所述的基于迁移学习的材料数据建模方法于另一实施例中的流程图。
48.图3a显示为本技术实施例所述的基于迁移学习的材料数据建模方法于实施例1中迁移学习对c3n4和cd
2+
的吸附能预测示意图。
49.图3b显示为本技术实施例所述的基于迁移学习的材料数据建模方法于实施例2中神经网络对mose2和li2s6的吸附能预测示意图。
50.图3c显示为本技术实施例所述的基于迁移学习的材料数据建模方法于实施例3中神经网络对pbe带隙的预测示意图。
51.图4显示为本技术实施例所述的基于迁移学习的材料数据建模系统于一实施例中的结构示意图。
52.图5显示为本技术实施例所述的基于迁移学习的材料数据建模终端于一实施例中的结构示意图。
53.元件标号说明
54.41
ꢀꢀꢀꢀꢀꢀꢀ
定义模块
55.42
ꢀꢀꢀꢀꢀꢀꢀ
初始材料数据建模任务模块
56.43
ꢀꢀꢀꢀꢀꢀꢀꢀ
目标材料数据建模任务模块
57.51
ꢀꢀꢀꢀꢀꢀꢀ
处理器
58.52
ꢀꢀꢀꢀꢀꢀꢀ
存储器
59.s1~s3
ꢀꢀꢀꢀ
方法步骤
60.s21~s23方法步骤
61.s31~s33方法步骤
具体实施方式
62.以下通过特定的具体实例说明本技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本技术的其他优点与功效。本技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
63.需要说明的是,以下实施例中所提供的图示仅以示意方式说明本技术的基本构想,遂图式中仅显示与本技术中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
64.本技术以下实施例提供了一种基于迁移学习的材料数据建模方法、系统和终端,应用于材料设计与性质预测平台,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行详细描述。
65.如图1和图2所示,本实施例提供一种基于迁移学习的材料数据建模方法,包括以下步骤:
66.s1、定义初始材料数据建模任务和目标材料数据建模任务,以及所述初始材料数据建模任务和所述目标材料数据建模任务的输入数据和输出数据。
67.其中,所述初始材料数据建模任务代表具有足够数据集的材料数据建模任务,其输入数据是材料体系的晶体结构文件和化学式等,输出数据是材料体系对应的各种材料性质;所述输入数据和输出数据的数据量一般大于103,且为低成本、易获得的实验数据。
68.所述目标材料数据建模任务代表数据集不足的材料数据建模任务,其输入数据是材料体系的晶体结构文件和化学式等,输出数据是各种材料性质;所述输入数据和输出数据的数据量一般小于103,且为相对高成本、难获得的实验数据。
69.所述材料体系包括有机小分子材料、合金材料、二维材料、无机三维晶体材料等任意的无机和有机材料体系;所述材料性质包括电、光、力、磁、热等任意材料性质,如形成能、电子电导率、离子电导率、磁性、弹性模量、膨胀系数、热导率、光吸收系数等;所述材料性质的保真度包括实验测量值、高精度计算值或低精度计算值,其中所述高精度计算值或低精度计算值通过采用二阶微扰计算方法、密度泛函计算方法、半经验计算方法或经验计算方法中任意一种方法获取。
70.于一实施例中,所述目标材料数据建模任务的输入数据包括与所述初始材料数据建模任务的输入数据相同或不同的材料体系。
71.例如,当初始材料数据建模任务的输入数据为有机物时,目标材料数据建模任务的输入数据可以是有机物或无机物;当初始材料数据建模任务的输入数据为三维材料时,目标材料数据建模任务的输入数据可以是三维材料或二维材料。
72.于一实施例中,所述目标材料数据建模任务的输出数据包括与所述初始材料数据建模任务的输出数据相同或不同的材料性质。
73.例如,初始材料数据建模任务的输出数据是通过计算得到的离子电导率,而目标材料数据建模任务的输出数据是实验测量得到的离子电导率。此时初始材料数据建模任务的输出数据具有与目标材料数据建模任务的输出数据相同的材料性质,但是具有不同的材料性质保真度。
74.需要说明的是,若初始材料数据建模任务和目标材料数据建模任务对应的材料体系相同,材料性质相同,而材料性质的保真度不同,则将其中涉及的迁移学习算法定义为“纵向迁移”,即性质上的迁移;若初始材料数据建模任务和目标材料数据建模任务对应的材料体系相同,材料性质不同,材料性质的保真度相同,则定义为“横向迁移”,即材料上的迁移;若初始材料数据建模任务和目标材料数据建模任务对应的材料体系不同,材料性质不同和材料性质的保真度都不相同,则定义为“交叉迁移”,即材料和性质上的共同迁移。基于所述纵向迁移、横向迁移或交叉迁移方法能够实现在不同的材料体系、不同材料性质和不同数据保真度的任务中建立可靠的、低成本的、高效率的目标材料数据建模任务模型。
75.s2、基于所述初始材料数据建模任务的输入数据和输出数据建立初始材料数据建模任务模型。
76.于一实施例中,所述基于所述初始材料数据建模任务的输入数据和输出数据建立初始材料数据建模任务模型包括以下步骤:
77.s21、基于所述初始材料数据建模任务的输入数据建立初始材料数据建模任务特征工程。
78.于一实施例中,所述基于所述初始材料数据建模任务的输入数据建立初始材料数据建模任务特征工程包括根据所述初始材料数据建模任务的输入数据的格式建立初始材料数据建模任务特征工程。
79.例如,若所述初始材料数据建模任务的输入数据是化学式,则可以建立组分特征,如电负性、共价半径、价电子数、原子序数、第一电离能、极化率等孤立元素性质,以及元素的原子序数和元素占比等化学配比;若输入数据是包含原子坐标信息的晶体结构,则可以建立结构特征,如x射线衍射(x-raydiffraction,xrd)数据、径向分布函数(radialdistribution function,rdf)、内坐标,以及通过晶体图建立的图特征向量等。
80.s22、基于所述初始材料数据建模任务的输出数据选择初始材料数据建模任务机器学习模型。
81.于一实施例中,所述基于所述初始材料数据建模任务的输出数据选择初始材料数据建模任务机器学习模型包括根据所述初始材料数据建模任务的输出数据的格式选择合适的机器学习模型。
82.所述机器学习模型可以采用监督学习模型,例如,若所述初始材料数据建模任务的输出数据是连续的数值,则机器学习算法应选择回归算法,如线性回归、支持向量机、决策树、随机森林、神经网络等;若输出数据是离散的数值,则机器学习算法应选择分类算法,如逻辑回归、支持向量机、决策树、随机森林、神经网络等。此外,所述机器学习模型也可以采用无监督学习模型,如层次聚类算法,k-means聚类算法等。
83.s23、基于所述初始材料数据建模任务特征工程训练所述初始材料数据建模任务机器学习模型,以获取初始材料数据建模任务模型。
84.于一实施例中,所述基于所述初始材料数据建模任务特征工程训练所述初始材料
数据建模任务机器学习模型,以获取初始材料数据建模任务模型包括以下步骤:
85.选择初始材料数据建模任务机器学习模型;对所述初始材料数据建模任务机器学习模型进行随机的参数初始化;基于预设要求对所述初始材料数据建模任务机器学习模型进行训练。
86.于一实施例中,所述对所述初始材料数据建模任务机器学习模型进行随机的参数初始化包括采用random函数生成[0,1]区间上的随机数,并将生成的所述随机数作为所述初始材料数据建模任务模型中的初始权重。
[0087]
所述预设要求包括控制初始材料数据建模任务模型的相对误差或误判率不超过10%,能达到实际应用需求,在预测速度上比传统的实验方法和计算方法快至少5个数量级。本实现方式中,建立的初始材料数据建模任务模型同时满足了高精度和高效率的材料数据建模和材料性质预测要求。
[0088]
s3、迁移学习所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立目标材料数据建模任务模型。
[0089]
于一实施例中,所述迁移学习所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立目标材料数据建模任务模型包括以下步骤:
[0090]
s31、基于所述目标材料数据建模任务的输入数据建立目标材料数据建模任务特征工程;或基于所述初始材料数据建模任务特征工程建立目标材料数据建模任务特征工程,以实现所述初始材料数据建模任务特征工程到所述目标材料数据建模任务特征工程的迁移学习应用。
[0091]
于一实施例中,所述基于所述目标材料数据建模任务的输入数据建立目标材料数据建模任务特征工程包括根据所述目标材料数据建模任务的输入数据的格式建立目标材料数据建模任务特征工程。
[0092]
例如,若所述目标材料数据建模任务的输入数据是化学式,则可以建立组分特征,如电负性、共价半径、价电子数、原子序数、第一电离能、极化率等孤立元素性质,以及元素的原子序数和元素占比等化学配比;若输入数据是包含原子坐标信息的晶体结构,则可以建立结构特征,如xrd数据、rdf、内坐标,以及通过晶体图建立的图特征向量等。
[0093]
所述基于所述初始材料数据建模任务特征工程建立目标材料数据建模任务特征工程实现了基于特征的迁移学习方法,使得目标材料数据建模任务模型所需要的数据量至少降低为初始材料数据建模任务模型的1/5,同时使得小数据建模成为可能。
[0094]
s32、基于所述目标材料数据建模任务的输出数据选择目标材料数据建模任务机器学习模型。
[0095]
于一实施例中,所述基于所述目标材料数据建模任务的输出数据选择目标材料数据建模任务机器学习模型包括根据所述目标材料数据建模任务的输出数据的格式选择合适的机器学习模型。
[0096]
所述机器学习模型可以采用监督学习模型,例如,若所述目标材料数据建模任务的输出数据是连续的数值,则机器学习算法应选择回归算法,如线性回归、支持向量机、决策树、随机森林、神经网络等;若输出数据是离散的数值,则机器学习算法应选择分类算法,
如逻辑回归、支持向量机、决策树、随机森林、神经网络等。此外,所述机器学习模型也可以采用无监督学习模型,如层次聚类算法,k-means聚类算法等。
[0097]
于一实施例中,所述目标材料数据建模任务可以采用与所述初始材料数据建模任务相同或不同的机器学习模型。
[0098]
s33、基于所述目标材料数据建模任务特征工程训练所述目标材料数据建模任务机器学习模型,以获取目标材料数据建模任务模型。
[0099]
于一实施例中,所述基于所述目标材料数据建模任务特征工程训练所述目标材料数据建模任务机器学习模型,以获取目标材料数据建模任务模型包括将所述初始材料数据建模任务机器学习模型中的参数设置作为所述目标材料数据建模任务机器学习模型的训练起始点,以实现所述初始材料数据建模任务机器学习模型到所述目标材料数据建模任务机器学习模型的迁移学习应用。
[0100]
本实现方式中,基于模型参数的迁移学习方法有效避免了在初始材料数据建模任务中建立构效关系的挑战。
[0101]
于另一实施例中,所述基于所述目标材料数据建模任务特征工程训练所述目标材料数据建模任务机器学习模型,以获取目标材料数据建模任务模型包括采用以下任意一种方式调整所述目标材料数据建模任务机器学习模型:
[0102]
(1)对所述目标材料数据建模任务机器学习模型的所有参数进行调整;
[0103]
(2)对所述目标材料数据建模任务机器学习模型的部分参数进行调整;
[0104]
(3)基于预设要求对所述目标材料数据建模任务机器学习模型进行训练,以获取重新初始化后的目标材料数据建模任务机器学习模型。
[0105]
所述预设要求包括控制目标材料数据建模任务模型的精度和效率与初始材料数据建模任务模型在同一水平。例如,控制目标材料数据建模任务模型的相对误差或误判率不超过15%,能达到实际应用需求,在预测速度上比传统的实验方法和计算方法快至少5个数量级。
[0106]
本实现方式中,目标材料数据建模任务模型的精度基本与初始材料数据建模任务模型持平,大幅降低了模型优化时参数微调的计算成本。
[0107]
通过目标材料数据建模任务模型可以对大量未知的材料体系进行快速预测,从而发现未知材料具有的新性质;也可以从目标材料数据建模任务模型得到的物理化学启发,进一步指导新材料的发现或对已知材料的定向设计,进而得到具有优良性能的材料,并将其应用至能源领域(电池材料,催化材料等)、环境领域(吸附剂,传感器等)、医疗领域(纳米纤维材料)、国防领域(火箭助推燃料、飞行器外壳等)等各个领域中。
[0108]
实施例1
[0109]
在二维材料和不同的单原子离子的吸附能建模和预测中实现“横向迁移”包括以下步骤:
[0110]
s1、定义初始材料数据建模任务为二维材料c3n4(g相)在任意位点对单原子离子pb
2+
的吸附能建模与预测,其输入数据是c3n4和pb
2+
的结构坐标数据,其中pb
2+
的坐标是随机的,输出数据是每个结构坐标数据对应的吸附能,其通过dft计算获得,且初始材料数据建模任务的数据量为5000。
[0111]
定义目标材料数据建模任务为二维材料c3n4(g相)对其他单原子离子cd
2+
和hg
2+

吸附能建模与预测(即两个目标材料数据建模任务),其输入数据是c3n4和cd
2+
/hg
2+
的结构坐标数据,其中cd
2+
/hg
2+
的坐标是随机的;输出数据是每个结构坐标数据对应的吸附能,其通过dft计算获得。两个目标任务的数据量分别为500,即初始材料数据建模任务的1/10。
[0112]
s2、以初始材料数据建模任务的输入数据和输出数据作为数据集,建立吸附能预测模型。
[0113]
由于初始材料数据建模任务的输入数据是结构坐标数据,因此建立结构描述符作为特征。从每个原子的局部化学环境出发,以为阈值寻找每一个原子的邻居原子,再依次用三个原子构建笛卡尔坐标系(x、y、z三个轴),再计算径向和角度的分布,从而得到结构描述符矩阵。机器学习模型采用神经网络模型,神经网络由3层隐藏层组成,每一层包含20个神经元。将结构描述符作为神经网络的输入,对应的吸附能作为神经网络的输出,训练模型。模型开始训练时,神经网络中的参数进行随机初始化,并初始学习率设置为0.002,且随着模型的迭代逐步降低。最终得到高精度、高效率的初始材料数据建模任务的模型,吸附能预测的均方根误差小于0.1ev,预测速度比dft计算快6个数量级。
[0114]
s3、迁移学习所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立吸附能预测模型。
[0115]
同样地,由于目标材料数据建模任务的输入数据是结构坐标数据,因此建立与初始材料数据建模任务相同的结构描述符作为特征。机器学习模型同样采用神经网络模型,神经网络由3层隐藏层组成,每一层包含20个神经元。将结构描述符作为神经网络的输入,对应的吸附能作为神经网络的输出,训练模型。模型开始训练时,将初始材料数据建模任务中最终得到的神经网络参数作为本次神经网络初始点,实现模型的迁移,并设置初始学习率为0.001,且随着模型的迭代逐步降低。最终得到高精度、高效率的目标材料数据建模任务,吸附能预测的均方根误差小于0.1ev,预测速度比dft计算快6个数量级。
[0116]
如图3a所示,本实施例实现了c3n4(g相)在任意位点对单原子离子pb
2+
、hg
2+
、cd
2+
的吸附能预测功能。其中,初始材料数据建模任务使用了5000个数据,而两个目标材料数据建模任务只分别使用了500个数据,大幅降低了数据成本。该迁移学习方法可以被进一步扩展至其他材料体系,如对cr
6+
、u
6+
、te
3+
、co
3+
、se
6+
、pu
3+
、mn
4+
等离子的吸附能建模与预测中,对于发现和设计新型的污染物吸附剂具有重要的意义。
[0117]
实施例2
[0118]
在不同二维材料和多原子分子的吸附能建模和预测中实现“横向迁移”包括以下步骤:
[0119]
s1、定义初始材料数据建模任务为二维材料mose2在任意位点对多原子分子li2s4、li2s6、li2s8的吸附能建模与预测(三个初始材料数据建模任务),其输入数据是mose2和li2s4、li2s6、li2s8的结构坐标数据,li2s4、li2s6、li2s8的坐标是随机的,输出数据是每个结构坐标数据对应的吸附能,所述输出数据可通过dft计算获得,且初始材料数据建模任务的数据量为3000。
[0120]
定义目标材料数据建模任务为二维材料wse2对其他多原子分子li2s4、li2s6、li2s8的吸附能建模与预测(三个目标材料数据建模任务),其输入数据是wse2和li2s4、li2s6、li2s8的结构坐标数据,li2s4、li2s6、li2s8的坐标是随机的,输出数据每个结构坐标数据对应的吸附能,所述输出数据可通过dft计算获得,且三个目标材料数据建模任务的数据量分别
为500,为初始材料数据建模任务的1/6。
[0121]
s2、以初始材料数据建模任务的输入数据和输出数据作为数据集,建立吸附能预测模型。
[0122]
由于初始材料数据建模任务的输入数据是结构坐标数据,因此建立结构描述符作为特征。结构描述符和神经网络模型与实施例1相同。模型开始训练时,神经网络中的参数进行随机初始化,并初始学习率设置为0.002,且随着模型的迭代逐步降低。最终得到高精度、高效率的初始材料数据建模任务模型,吸附能预测的均方根误差小于0.2ev,预测速度比dft计算快6个数量级。
[0123]
s3、迁移学习所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立吸附能预测模型。
[0124]
同样地,由于目标材料数据建模任务的输入数据是结构坐标数据,因此建立与初始材料数据建模任务相同的结构描述符作为特征,机器学习模型也与实施例1相同。将结构描述符作为神经网络的输入,对应的吸附能作为神经网络的输出,训练模型。模型开始训练时,将初始材料数据建模任务中最终得到的神经网络参数作为本次神经网络初始点,实现模型的迁移,并设置初始学习率为0.001,且随着模型的迭代逐步降低。最终得到高精度、高效率的目标材料数据建模任务模型,吸附能预测的均方根误差小于0.2ev,预测速度比dft计算快6个数量级。
[0125]
如图3b所示,本实施例实现了mose2和wse2在任意位点对多原子分子li2s4、li2s6、li2s8的吸附能预测功能。其中,三个初始材料数据建模任务分别使用了3000个数据,而三个目标材料数据建模任务只分别使用了500个数据,大幅降低了数据成本。该迁移学习方法可以被进一步扩展至其他材料体系,如mos2、ws2、mote2、wte2等对li2s4、li2s6、li2s8等化合物的吸附能建模与预测中,这对于抑制锂硫电池的穿梭效应具有重要的意义,并助力锂硫电池新型正极材料的发现和设计。
[0126]
实施例3
[0127]
在无机晶体材料的低保真度带隙和高保真度带隙的建模和预测中实现“纵向迁移”包括以下步骤:
[0128]
s1、定义初始材料数据建模任务为二元金属氧化物、氮化物、硫化物(mxny,m是所有金属元素,n=o,n,s)的低保真度带隙预测,其带隙建立在pbe泛函计算上(简称pbe带隙),其输入数据是氧化物、氮化物、硫化物的结构坐标数据,其晶体结构是任意的,输出数据每个结构坐标数据对应的pbe带隙,且初始材料数据建模任务的数据量为1500。
[0129]
定义目标材料数据建模任务为二元金属氧化物、氮化物、硫化物(mxny,m是所有金属元素,n=o,n,s)的高保真度带隙预测,其带隙建立在hse06泛函计算上(简称hse06带隙),其输入数据是氧化物、氮化物、硫化物的结构坐标数据,其晶体结构是任意的,其输出数据每个结构坐标数据对应的hse06带隙,且目标材料数据建模任务的数据量为64,约为初始材料数据建模任务的1/20。
[0130]
s2、以初始材料数据建模任务的输入数据和输出数据作为数据集,建立pbe带隙预测模型。
[0131]
由于初始材料数据建模任务的输入数据是结构坐标数据,选择使用晶体图结构描述符作为特征。晶体图结构描述符将每一个原子看作结点,每条化学键看作边,以此构建图
矩阵,作为卷积神经网络的输入。卷积神经网络包含卷积层、池化层和全连接层。模型开始训练时,神经网络中的参数进行随机初始化,并初始学习率设置为0.01。最终得到高精度、高效率的初始材料数据建模任务模型,pbe带隙预测的平均绝对误差小于0.35ev,预测速度比pbe计算快4个数量级。
[0132]
s3、迁移学习所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立hse06预测模型。
[0133]
同样地,由于目标材料数据建模任务的输入数据是结构坐标数据,因此建立与初始材料数据建模任务相同的结构描述符作为特征,机器学习也采用卷积神经网络模型。将结构描述符作为神经网络的输入,对应的hse06带隙作为神经网络的输出,训练模型。模型开始训练时,将初始材料数据建模任务中最终得到的神经网络参数作为本次神经网络初始点,并固定卷积层和池化层的参数,只保留全连接层部分神经元,实现模型的迁移,并设置初始学习率为0.01。最终得到高精度、高效率的目标材料数据建模任务模型,吸附能预测的均方根误差小于0.35ev,预测速度比hse06计算快6个数量级。
[0134]
如图3c所示,本实施例实现了所有氧化物、氮化物、硫化物的高保真度带隙值的预测功能。其中,初始材料数据建模任务分别使用了1500个数据,而目标材料数据建模任务只分别使用了64个数据,大幅降低了数据成本。该迁移学习方法可以被进一步扩展至其他材料体系,如碳化物、磷化物,以及三元化合物、四元化合物等的高保真度带隙(其他杂化泛函带隙值、实验带隙值等)模型构建与预测中,这对于半导体材料的发现和设计具有重要指导意义。
[0135]
本技术实施例所述的基于迁移学习的材料数据建模方法的保护范围不限于本实施例列举的步骤执行顺序,凡是根据本技术的原理所做的现有技术的步骤增减、步骤替换所实现的方案都包括在本技术的保护范围内。此外,上述参照实施例是对基于迁移学习的低成本材料数据建模的通用方法的详细描述与有益效果证明,是说明性的而不是限定性的,可按照所限定范围列举出若干个实施例,包括改变材料体系、材料性质、特征工程、机器学习模型、优化算法、评估方法等,因此在不脱离本发明总体构思下的变化和修改,应属本发明的保护范围之内。
[0136]
本技术实施例还提供一种基于迁移学习的材料数据建模系统,所述基于迁移学习的材料数据建模系统可以实现本技术所述的基于迁移学习的材料数据建模方法,但本技术所述的基于迁移学习的材料数据建模方法的实现装置包括但不限于本实施例列举的基于迁移学习的材料数据建模系统的结构,凡是根据本技术的原理所做的现有技术的结构变形和替换,都包括在本技术的保护范围内。
[0137]
如图4所示,本实施例提供一种基于迁移学习的材料数据建模系统,所述基于迁移学习的材料数据建模系统包括定义模块41、初始材料数据建模任务模块42和目标材料数据建模任务模块43;
[0138]
所述定义模块41用于定义初始材料数据建模任务和目标材料数据建模任务,以及所述初始材料数据建模任务和所述目标材料数据建模任务的输入数据和输出数据;
[0139]
所述初始材料数据建模任务模块42与所述定义模块41相连,用于基于所述初始材料数据建模任务的输入数据和输出数据建立初始材料数据建模任务模型;
[0140]
所述目标材料数据建模任务模块43与所述定义模块41和所述初始材料数据建模
任务模块42相连,用于迁移学习所述初始材料数据建模任务模型,并基于所述初始材料数据建模任务模型、所述目标材料数据建模任务的输入数据和输出数据建立目标材料数据建模任务模型。
[0141]
本技术提供的基于迁移学习的材料数据建模系统的实施例与基于迁移学习的材料数据建模方法的实施例系统,此处不再赘述。
[0142]
如图5所示,本实施例提供一种基于迁移学习的材料数据建模终端,所述基于迁移学习的材料数据建模终端包括:处理器51和存储器52;
[0143]
所述存储器52用于存储计算机程序;
[0144]
所述处理器51用于执行所述存储器52存储的计算机程序,以使所述终端执行如权利要求1至8中任一项所述基于迁移学习的材料数据建模方法。
[0145]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置或方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅是示意性的,例如,模块/单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或单元可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0146]
作为分离部件说明的模块/单元可以是或者也可以不是物理上分开的,作为模块/单元显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块/单元来实现本技术实施例的目的。例如,在本技术各个实施例中的各功能模块/单元可以集成在一个处理模块中,也可以是各个模块/单元单独物理存在,也可以两个或两个以上模块/单元集成在一个模块/单元中。
[0147]
本领域普通技术人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0148]
本技术实施例还提供了一种计算机可读存储介质。本领域普通技术人员可以理解实现上述实施例的方法中的全部或部分步骤是可以通过程序来指令处理器完成,所述的程序可以存储于计算机可读存储介质中,所述存储介质是非短暂性(non-transitory)介质,例如随机存取存储器,只读存储器,快闪存储器,硬盘,固态硬盘,磁带(magnetictape),软盘(floppydisk),光盘(opticaldisc)及其任意组合。上述存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。该可用介质可以是磁性介质(例如,软盘、硬盘、磁带)、光介质(例如数字视频光盘(digitalvideodisc,dvd))、或者半导体介质(例如固态硬盘(solidstatedisk,ssd))等。
[0149]
本技术实施例还可以提供一种计算机程序产品,所述计算机程序产品包括一个或多个计算机指令。在计算设备上加载和执行所述计算机指令时,全部或部分地产生按照本技术实施例所述的流程或功能。所述计算机指令可以存储在计算机可读存储介质中,或者
从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机或数据中心进行传输。
[0150]
所述计算机程序产品被计算机执行时,所述计算机执行前述方法实施例所述的方法。该计算机程序产品可以为一个软件安装包,在需要使用前述方法的情况下,可以下载该计算机程序产品并在计算机上执行该计算机程序产品。
[0151]
上述各个附图对应的流程或结构的描述各有侧重,某个流程或结构中没有详述的部分,可以参见其他流程或结构的相关描述。
[0152]
上述实施例仅例示性说明本技术的原理及其功效,而非用于限制本技术。任何熟悉此技术的人士皆可在不违背本技术的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本技术所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本技术的权利要求所涵盖。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1