一种材料数据库的制作方法

文档序号:16430113发布日期:2018-12-28 20:05阅读:831来源:国知局
一种材料数据库的制作方法

本发明涉及一种材料科学领域,特别是涉及一种材料数据库。

背景技术

材料是人类用于制造物品、器件、构件、及其或者其他产品的那些物质。燃料和化学原料、工业化化学品、食物和药物,一般都不算是材料。材料总是和一定的用处相联系,可由一种或若干种物质构成。并且,即便是同一种物质,由于制备方法或者加工方法不同,可成为用途、类型和性能迥然不同的材料。其中,从物理化学属性来分,材料可分为金属材料、无机非金属材料、无机高分子材料、有机高分子材料和不同类型材料所组成的复合材料。

材料基因工程是材料科学的新型研发理念。通过从“试错法”向数据密集型工作模式的转变,实现新材料及工艺的理性设计,极大地提高研发效率。以“数据+人工智能”为标志的数据引领模式围绕数据产生与数据处理展开,代表了材料基因工程的核心理念与发展方向。其中,材料基因工程数据库是要素之一,需要收录符合fair(可发现、可获取、可互操作、可再利用)原则的数据资源【wilkinsonmd,dumontierm,aalbersbergij,etal.thefairguidingprinciplesforscientificdatamanagementandstewardship[j].scientificdata,2016,3:160018.】,供社会共享。“可发现”指数据及其元数据被赋予全球性唯一并持久的标识,数据被丰富的元数据所描述并在可检索的源中登记或建立索引,易于被第三方(人员与机器)方便地找到;“可获取”指数据及其源数据可使用标准通讯协议通过标识查询并获取;“可互操作”指数据及其元数据的表达使用正式、可获得、共享和广泛使用的语言;“可再利用”指数据及其元数据由多种准确并相关的特征所描述,与细致的出处信息相关联并符合相关领域的标准,从而被不同用户(人员与机器)方便地使用。因此,有必要建立一种适合材料基因工程需求的数据模型,规范数据的产生过程中必须收集的信息与遵循的格式,有利于今后对数据的充分有效利用。

数据,特别是源数据(即由测量或计算获得的未经进一步分析的数据)的可再利用性是材料基因工程的重要特征。以某一合金的x光衍射谱为例,它可用于获得材料的晶体结构,也可用于分析合金掺杂的成分,还可用于分析结晶程度、晶粒大小、晶体取向等参数。因此一组源数据在不同的使用者手中可以根据各自关切产出不同的结果。传统材料数据库一般仅收集由源数据处理而得到的分析结果(如各种材料性能参数等),而源数据本身通常分散在实验者手中,不被收录。同时,与数据相关的元数据通常也不在收录之列,因此难以满足fair原则。

美国密西根大学的预测性集成结构材料学(prism)中心开发的materialscommons是近期国际上出现的较为符合fair原则的数据平台【puchalab,tarceag,marquisea,etal.thematerialscommons:acollaborationplatformandinformationrepositoryfortheglobalmaterialscommunity[j].jom,2016,68:2035-2044.】。它采用的数据模型包含了样品、工艺、参数、测量值、数据文件、数据组几个部分,其中覆盖了样品历史(即样品元数据)、测量源数据、和经过处理的数据这三个层面的信息。尽管该模型考虑到对同一样品进行多次表征和对同一种多个样品进行表征的情况,但没有强调系统地赋予样品与测量事件以独特并持久的标识,也没有建立样品、源数据与经处理产生的数据间的系统性关联。这影响了之后的数据分析中对材料数据检索的完整性与建立材料变量间关联关系。



技术实现要素:

鉴于以上所述现有技术的缺点,本发明的目的在于提供一种材料数据库,用于解决现有技术中材料数据库平台不符合fair数据原则的问题。

为实现上述目的及其他相关目的,本发明是通过以下技术方案获得的。

本发明首先提供一种材料数据库,所述数据库包括:

材料样品的信息,是指对材料的样品的完整描述;

源数据信息,是指对样品进行测量或计算获得的未经进一步分析的数据;

分析数据信息,是指对源数据进行分析处理后得到的性能数据。

优选地,所述样品为实际样品或虚拟样品。

实际样品由特定制备方法在特定条件下产生。

实际样品的源数据由表征实验获得。

虚拟样品是由人为选定或用特定计算方法在特定条件下计算产生。

虚拟样品的源数据针对特定虚拟样品由特定计算方法在特定条件下通过计算获得。

优选地,材料实际样品的信息包括材料样品的规格和名称。

优选地,材料实际样品的信息还包括样品的制备元数据,如制备方法,制备条件等。

优选地,材料实际样品的信息还包括样品的独特且持久标识,如根据国标《科技资源标识(gb/t32843-2016)》生成的样品资源标识码或doi识别码等。

优选地,材料实际样品的源数据信息包括对每个样品的每次表征、测试实验的元数据,如方法、测试条件。

优选地,材料实际样品的源数据信息包括对每个实际样品的每次表征、测试实验的未经处理的数据。优选地,材料实际样品的源数据信息包括对每个样品的每次表征、测试实验的独特且持久的标识,如根据国标《科技资源标识(gb/t32843-2016)》生成的样品表征数据资源标识码或doi识别码等。

优选地,材料虚拟样品的信息包括样品的规格和名称。

优选地,材料虚拟样品的信息包括产生样品的计算方法和条件等元数据。

优选地,材料虚拟样品的信息包括样品的独特标识,如根据国标《科技资源标识(gb/t32843-2016)》生成的样品资源标识码或doi识别码等。

优选地,材料虚拟样品的源数据信息包括对每个虚拟样品的每次计算实验的元数据,如方法和条件。

优选地,材料虚拟样品的源数据信息包括对每个虚拟样品的每次计算实验的未经处理的数据。

优选地,材料虚拟样品的源数据信息包括对每个虚拟样品的每次计算实验的独特标识,如根据国标《科技资源标识(gb/t32843-2016)》生成的样品表征数据资源标识码或doi识别码等。

优选地,材料实际样品或虚拟样品的源数据信息包括样品的物理化学参数和综合表征参数。所述物理化学参数包括化学成分、物理性能、机械性能和加工性能。

优选地,材料样品的分析数据信息包括对源数据信息每次分析处理使用的分析方法和条件等元数据。优选地,分析数据信息包括对源数据信息每次分析处理后得到的每个性能数据的数值、单位、曲线、图形、表格、关系式。

优选地,分析数据信息包括对源数据信息每次分析处理后得到的每个性能数据的独特且持久的标识,如根据国标《科技资源标识(gb/t32843-2016)》生成的样品表征数据资源标识码或doi识别码等。

优选地,本申请中所述材料包括金属材料、无机非金属材料、无机高分子材料、有机高分子材料和复合材料。

本申请中材料数据库的数据模型具有三层结构的数据库,可以通过科技资源标识以及条目中的关键词等进行关联、检索,可为不同的用户与不同的用途反复使用。

附图说明

图1为本申请中数据模型的层次结构示意图。

图2为本申请中材料数据库的框架示意图。

图3为实施例1中fe-ni-cr组合材料样品制备示意图。

图4为实施例1中fe-ni-cr组合材料样品几何信息示意图。

图5为实施例1中fe-ni-cr组合材料样品的综合表征数据库示意图。

图6为(cocrcufeni)100-xnbx(x=0,4,8,12,16at.%)的综合表征数据库示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本发明的精神下进行各种修饰或改变。

须知,下列实施例中未具体注明的工艺设备或装置均采用本领域内的常规设备或装置。

此外应理解,本发明中提到的一个或多个方法步骤并不排斥在所述组合步骤前后还可以存在其他方法步骤或在这些明确提到的步骤之间还可以插入其他方法步骤,除非另有说明;还应理解,本发明中提到的一个或多个设备/装置之间的组合连接关系并不排斥在所述组合设备/装置前后还可以存在其他设备/装置或在这些明确提到的两个设备/装置之间还可以插入其他设备/装置,除非另有说明。而且,除非另有说明,各方法步骤的编号仅为鉴别各方法步骤的便利工具,而非为限制各方法步骤的排列次序或限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容的情况下,当亦视为本发明可实施的范畴。。

本申请实施例中提供一种构建材料数据库的数据模型,所述方法为将各材料的样品的数据参数集合形成一个标准化数据库;所述各材料的样品的数据参数包括各材料的的样品样品信息、样品的源数据信息、源数据信息经分析处理后得到的分析数据信息。

实施例1

本实施例为fe-ni-cr组合材料样品的综合表征数据。

采用离子束溅射方法制备完整覆盖fe-ni-cr材料体系成分的组合材料样品【xingh,zhaobb,wangyj,etal.rapidconstructionoffe-co-nicomposition-phasemapbycombinatorialmaterialschipapproach[j].acscombinatorialscience,2018,20:127-131.】。因为成分由各组分薄膜厚度之比决定,使用连续移动的掩模挡板,可以方便地制备完整覆盖三元成分空间的组合材料芯片叠层前驱体。样品基片为一片25x25毫米见方的石英玻璃。如图3所示,在薄膜的沉积过程中,挡板从正三角形基片的一边恒速向对角移动,从而得到厚度呈楔形分布的薄膜(如图3中的薄膜)。然后,将基片顺时针旋转120°,可进行下一元素沉积。将此过程重复两次,就完成了如图3所示的完备的三元材料体系组合材料芯片前驱体。将三片前驱体样品分别封入抽真空的石英管中,用马弗炉分别在500c、600c、700c温度下进行热处理2小时,获得各自温度下的fe-ni-cr组合材料样品为上述每一片组合材料芯片赋予一个独立的科技资源标识,在样品信息库对应条目中分别记录制备地点、人员、项目号、化学组分,制备方法与制备条件(包括设备型号,靶材、膜层数量、顺序,膜厚、fe、ni、cr组元梯度方向,热处理参数等)以及样品几何坐标系(尺寸大小、定位参考点等,如图4),及其它与样品有关的信息。这些信息可以由操作员手动输入,也可由条件具备的制备设备或实验管理系统自动生成。

对以上fe-ni-cr组合材料芯片逐点进行x射线衍射表征、x射线荧光光谱表征,微区电化学表征,研究化学组分、相组成与腐蚀性能的关系。对每一次表征赋予一个独立的科技资源标识,在源数据库对应条目中分别记录对应的实验时间、地点、人员、实验方法、实验装置、实验条件,样品科技资源标识,表征点的几何坐标信息和仪器输出的原始数据(源数据)。例如x射线衍射表征记录测试装置的衍射几何设置、射线能量(波长)、束斑尺寸、取样位置坐标、扫描顺序、单点采集时间、探测器、信号数据等;对于x射线荧光光谱表征记录探测器型号、几何设置、射线能量(波长)、束斑尺寸、取样位置坐标、扫描顺序、样品距离、单点采集时间、仪器输出谱图(源数据)等;对微区电化学表征记录电化学工作站型号、取样位置坐标、液滴尺寸、扫描速率、电极电位曲线(源数据)等。这些测量表征可以在不同时间、地点、条件下进行,对重复进行的同一表征将分别记录在不同的科技资源标识之下。

通过分析工具/软件对以上样品信息库和源数据库中的样品信息和表征源数据进行分析,或对已分析过的数据进行进一步分析,获得关于样品的分析数据。对每次数据分析分别赋予一个独立的科技资源标识,在分析数据库对应条目中记录地点、人员、分析方法、采用的分析工具/软件、分析条件参数、设计的样品、源数据、分析数据及其科技资源标识码。例如,对fe-ni-cr芯片上每一点源数据单独分析可以获得该点的化学成分,相组成、各相的结构、晶格常数等,其他使用者在另一时刻可能使用同一源数据分析样品的结晶度或晶粒尺寸并与其他来源的数据进行对照研究;对fe-ni-cr芯片上一组源数据进行整体分析可以获得成分空间分布、γ-α-δ-σ等组成相的空间分布、合金耐蚀性能的空间分布等分析数据;对已分析获得的成分空间分布与相空间分布结果进行再次分析可以获得相图。

由此构成具有三层结构的,可以通过科技资源标识以及条目中的关键词等进行关联、检索、可为不同的用户与不同的用途反复利用的数据库(图5)。

实施例2

本实施例为基于高通量第一性原理计算的高温合金共格增强相结构稳定性数据。

以所构造的每一种axbycz(a、b、c指化学元素,x、y、z指各元素的分数)化合物为一个样品,例如co,co3si,co3al,co3si0.5w0.5等,分别赋予一个独立的科技资源标识。在样品信息库对应条目中记录其化学信息,构造信息,结构信息等。

对每一个样品利用第一性原理计算软件分别计算总能量、弹性常数、结构参数等,对每一次计算分别赋予一个独立的科技资源标识,在源数据库对应条目中记录地点、人员、计算资源、计算软件、版本号、使用模块和计算条件等参数,以及计算所产生的输出数据等。

对样品信息库和源数据库中记录的信息检索,计算获得样品的形成能,例如对于纯物质,形成能=0;对于axbycz,形成能=axbycz的总能量-x*a的总能量-y*b的总能量-z*c的总能量。为每次分析赋予一个独立的科技资源标识,其结果形成一组关于形成能与样品成分或结构关系的数据。同样,利用所计算的弹性常数源数据,计算c11-c12的数值符号、c11+2c12的数值符号,并与c44的数值符号结合起来(c11、c12、c44等均为计算的弹性常数),通过判断其是否全部为正,从而判断有关样品的机械稳定性(正为稳定,负为不稳定),为每次分析赋予一个独立的科技资源标识,其结果形成一组关于机械稳定性与样品成分或结构关系的数据。类似地,通过比较化合物与纯物质的晶格常数,可以获得晶格匹配度,为每次分析赋予一个独立的科技资源标识,其结果形成一组关于晶格匹配度与样品成分或结构关系的数据。

由此构成具有三层结构的,可以通过科技资源标识以及条目中的关键词等进行关联、检索、可为不同的用户与不同的用途反复利用的数据库。

实施例3

本实施例中为采用从文献报道中收集的数据。

文章“microstructuresandmechanicalpropertiesofnb-alloyedcocrcufenihigh-entropyalloys”中【journalofmaterialsscience&technology34(2018)365-369,doi为10.1016/j.jmst.2017.11.007】,记载了5种不同nb含量比例的(cocrcufeni)100-xnbx(x=0,4,8,12,16at.%)高熵合金的晶体结构表征、微观组织观察、力学性能测试等实验数据。

根据文章所记录的样品信息和制备条件,将nb含量分别为0、4、8、12、16at%的5种不同成分的合金取作为5个样品,分别赋予一个独立的科技资源标识,在样品信息库对应条目中记录各自的化学成分信息、制备条件(熔炼7次)、处理状态(熔炼态),并记录文献出处及其doi码。对每一个样品进行事后热处理的情况,每经历一次热处理后的样品将被视作一个新样品,赋予另一个独立的科技资源标识,在样品信息库对应条目中除记录热处理之前的样品制备信息,即化学成分信息、制备条件(熔炼7次)、处理状态(熔炼态),并记录文献出处及其doi码之外,还包括新增的热处理条件。

文献中报道了对上述样品进行的x射线衍射表征、扫描电镜表征、能谱成分分析、力学性能测试等四种测试及数据。对每一条数据赋予一个科技资源标识,在源数据库对应条目中记录测试方法、相应的测试样品尺寸、处理方法、测试条件及结果图片作为原始数据,并记录文献出处及其doi码。

在分析数据库中,将文献中报道的有关能谱分析的数据表格、屈服强度随合金成分变化的曲线、laves相体积分数随合金成分变化的曲线等经分析获得的数据分别存储,记录其内容说明,并各自赋予一个独立的科技资源标识。

由此构成具有三层结构的,可以通过科技资源标识以及条目中的关键词等进行关联、检索、可为不同的用户与不同的用途反复利用的数据库(图6)

上述实施例仅例示性说明本发明的原理及其功效,而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下,对上述实施例进行修饰或改变。因此,举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变,仍应由本发明的权利要求所涵盖。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1