大数据、人工智能、超算协同的材料性能预测方法与流程

文档序号:16038286发布日期:2018-11-24 10:15阅读:502来源:国知局

本发明涉及材料性能预测技术领域,特别是指一种大数据、人工智能、超算协同的材料性能预测方法。

背景技术

材料的性能预测分析可以得到不同成分含量、环境与性能之间的关系,从而可以改进工艺加快设计出适合核材料领域抗辐照性能好的最佳材料。目前在材料领域常见的性能预测方法有:人工神经网络(artificialneuralnetwork,ann)、支持向量机(supportvectormachine,svm)、遗传算法(geneticalgorithm,ga)等。

材料的性能受多种因素(包括成分含量、加工工艺、环境条件等)的影响,且各因素之间存在非线性关系,因此机器学习的智能化方法很适合处理材料性能预测问题。人工神经网络是由神经元互相连接而形成的复杂网络结构,可以用于对材料成分含量的预测、力学性能预测、控制参数的预测等;支持向量机是通过核方法将问题由非线性空间映射到线性空间进行求解,可以用于材料领域的小样本预测,如材料热处理领域;遗传算法主要对人工神经网络进行优化,从而构建出更加准确的材料性能影响因子与材料性能的非线性映射预测模型。

核反应堆压力容器材料的性能数据主要来源于实验测试和模拟计算,不仅有上述多因素及非线性不确定的特点,还具有长周期、强关联、多依赖性的特征,对这种典型材料大数据的研究向传统的机器学习方法提出了挑战,为此需要新的智能化计算方法和满足海量数据存储及并行处理的超级计算机来处理这种材料大数据,从而保证材料性能预测的质量和效率。



技术实现要素:

本发明要解决的技术问题是提供一种大数据、人工智能、超算协同的材料性能预测方法,以提高材料性能预测的质量和效率。

为解决上述技术问题,本发明实施例提供一种大数据、人工智能、超算协同的材料性能预测方法,包括:

步骤1:获取原始数据集并进行预处理;

步骤2:创建多个不同的贝叶斯深度网络模型,给予每个贝叶斯深度网络模型赋予一组随机化的权重初始值;

步骤3:针对每个贝叶斯深度网络模型中每两个神经元之间的权重w,引入正则化项,构造权重w的高斯先验分布;

步骤4:针对所述权重w,构造似然函数;

步骤5:根据贝叶斯准则得到所述权重w的后验概率分布函数;

步骤6:利用高斯近似方法在超级计算机上gpu+cpu并行求解每个贝叶斯深度网络模型的参数后验p(w|d),对于其中任意一个贝叶斯深度网络模型来说,如果计算得到的p(w|d)不收敛,则回到步骤3继续更新w;若收敛,则继续下一步骤,从而得到比较好的一组w,其他的贝叶斯深度网络模型经过的步骤相同,最后,每个贝叶斯深度网络模型构建完毕;

步骤7:利用预测集通过每个贝叶斯深度网络模型得到预测输出,然后根据预测输出的准确度,计算每个贝叶斯深度网络模型的占所有网络的权重比;

步骤8:根据上述所有训练好的贝叶斯深度网络模型对预测集进行预测,并根据所述权重比加权得到最终预测值和预测值的误差条,至此,整个网络模型构建完毕。

进一步的,所述步骤1中预处理为标准差标准化,计算公式如下:

其中,x为原始数据,x*为进行标准差标准化处理后的数据,μ为所有原始数据集特征值列的均值,σ为所有原始数据集特征值列的标准差。

进一步的,所述步骤2中多个不同的贝叶斯深度网络模型的层数由2成偶数增长到20,每层的单元数由4每次加1增加到10,形成上百个不同的网络结构,使每个贝叶斯深度网络模型都有一套各自的参数。

进一步的,所述步骤3中高斯先验分布的计算公式如下:

其中,w是贝叶斯深度网络模型的每两个神经元之间连接的权重,α是控制权重和偏置分布的超参数,均已知,ew是正则化项。

进一步的,所述步骤4中似然函数的计算公式如下:

其中,d是样本数据,β是控制噪声方差的超参数,y是网络输出的预测值,t是样本x对应的实际值,ed是构造的误差项。

进一步的,所述步骤5进一步为:

根据贝叶斯准则得到所述权重w的后验概率分布函数,即:

进一步的,所述步骤6中采用梯度下降法来更新w。

进一步的,所述步骤6中p(w|d)的计算方式为:

高斯近似是对s(w)在极小点进行2阶泰勒展开然后将s(w)代入步骤5后验概率计算公式。

进一步的,所述步骤7中权重比evidence的计算公式如下:

p(t|hi)=∫p(t|w)p(w|d)dw

其中,hi代表第i个贝叶斯深度网络模型,t代表预测集。

进一步的,所述步骤8中预测值和预测值的误差条的计算公式如下:

预测值其中ti是第i个贝叶斯深度网络模型通过预测集得到的预测值;

预测值的误差条(即标准差)的计算公式如下:

其中,wmp是后验概率的最大值,a是步骤6中泰勒展开时已知的正定矩阵。

本发明的上述技术方案的有益效果如下:

上述技术方案中,首先,贝叶斯概率建模的方法可以通过控制模型复杂度来解决模拟过拟合的问题,以自然的方式处理不确定性,利用边缘化方法将参数的不确定性纳入预测;第二,概率建模驱动的深度学习方法在超级计算机上能够处理亿级材料大数据的性能挖掘与理解,提高了模型的可解释性和自适应性;第三,借助天河、神威超级计算机的计算能力优势,可以突破多尺度模拟在规模、精度方面的限制,实现材料辐照性能机理分析、获得材料宏观机理的新认识。

附图说明

图1是本发明大数据、人工智能、超算协同的材料性能预测方法的流程图;

图2是本发明中贝叶斯深度网络模型构建的过程示意图;

图3是本发明预测方法的简要框架图;

图4是本发明中贝叶斯深度网络模型学习具体实施框图;

图5是本发明中贝叶斯深度网络模型权重的数学计算过程图;

图6是本发明预测方法的结果与其他预测结果的误差对比表。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。

本发明针对现有技术中核反应堆压力容器材料的性能数据有多因素及非线性不确定的特点,还具有长周期、强关联、多依赖性的特征,提供一种大数据、人工智能、超算协同的材料性能预测方法,以提高材料性能预测的质量和效率。

如图1所示,本发明实施例提供的大数据、人工智能、超算协同的材料性能预测方法,包括:

步骤1:获取原始数据集并进行预处理;

原始数据集例如可以是来自中国原子能研究所收集的近20年的rpv钢的辐照硬化数据集,其具有长周期、数据量大、强关联、多依赖等特点,对数据集给予标准差标准化,经过处理的数据符合z-score标准化。每一特征值列进行标准差标准化的转化方程为:

其中,x为原始数据,x*为进行标准差标准化处理后的数据,μ为所有原始数据集特征值列的均值,σ为所有原始数据集特征值列的标准差。

步骤2:创建多个不同的贝叶斯深度网络模型,给予每个贝叶斯深度网络模型赋予一组随机化的权重初始值。

如图2所示,创建贝叶斯深度网络模型时,首先需要对接数据源,比如hadoop的hdfs,然后提取数据、转换、加载以及向量化,转换为机器学习理解的格式,建模时,充分利用超级计算机的gpu与cpu资源快速建模,然后对模型进行调优,最终完成整个模型的构建。

贝叶斯深度网络模型的层数可以由2成偶数增长到20,每层的单元数可以由4每次加1增加到10,形成上百个不同的网络结构,依次进行训练使每个贝叶斯深度网络模型都有一套各自的参数。

步骤3:针对每个贝叶斯深度网络模型中每两个神经元之间的权重w,引入正则化项,构造权重w的高斯先验分布,先验分布如下:

其中,w是贝叶斯深度网络模型的每两个神经元之间连接的权重,α是控制权重和偏置分布的超参数,均已知(随机初始化赋初值),ew是正则化项(一般的神经网络都需要构造)。

步骤4:针对所述权重w,构造似然函数,如下:

其中,d是样本数据,β是控制噪声方差的超参数,y是网络输出的预测值,t是样本x对应的实际值,ed是构造的误差项。

步骤5:根据贝叶斯准则得到所述权重w的后验概率分布函数,即:

图3是本发明预测方法的简要框架图,如图3所示,其从一开始的收集实验数据,然后存储数据,提取多种材料属性进行智能分析,以概率推理的方式得到各个模型的概率值,并根据概率分布估计预测结果的可靠程度。

图4是本发明的贝叶斯深度网络模型训练具体实施框图,如图4所示,其中引入先验信息,并行计算各模型的参数后验估计,得到预测结果及可靠程度的定量估计。

步骤6:利用高斯近似方法在超级计算机上gpu+cpu并行求解每个贝叶斯深度网络模型的参数后验p(w|d),每个贝叶斯深度网络模型对应一组参数后验值(在计算机中被保存为一个数组)。对于其中一个贝叶斯深度网络模型来说,如果通过计算得到的p(w|d)不收敛,则回到步骤3继续更新w(具体可以采用本领域常用的梯度下降法来更新);若收敛(每个模型的收敛的值不同),则继续下一步骤,从而得到比较好的一组w,其他的贝叶斯深度网络模型经过的步骤相同,最后,每个贝叶斯深度网络模型构建完毕。

高斯近似是对s(w)在极小点进行2阶泰勒展开然后将s(w)代入步骤5后验概率计算公式。

步骤7:利用预测集通过每个贝叶斯深度网络模型得到预测输出,然后根据预测输出的准确度,计算每个贝叶斯深度网络模型的占所有网络的权重比evidence(预测越精确的模型,evidence的值越大);

其中,预测集是从原始数据集中选取部分数据构建而成。

evidence的计算公式是p(t|hi)=∫p(t|w)p(w|d)dw,其中,hi代表第i个贝叶斯深度网络模型,t代表预测集。

图5是本发明中贝叶斯深度网络模型权重的数学计算过程图,图中仅表示了三层网络计算过程。

步骤8:根据上述所有训练好的贝叶斯深度网络模型对预测集进行预测,并根据所述权重比evidence加权得到最终预测值和预测值的误差条,至此,整个网络模型构建完毕。

预测值其中ti是第i个贝叶斯深度网络模型通过预测集得到的预测值;

预测值的误差条(即标准差)的计算公式如下:

其中,wmp是后验概率的最大值,a是步骤6中泰勒展开时已知的正定矩阵。

图6是本发明预测方法的结果与其他预测结果的误差对比表。从图中可以看出,本发明的基于贝叶斯深度网络模型的预测方法(bayesiandeeplearning)在rpv钢的辐照硬化预测实验中的预测结果比其他一般常见的模型如多层感知器(multilayerperceptron)、支持向量机(supportvectormachine)、随机森林(randomforest)、梯度提升(gradientboost)的效果都要好。

综上,本发明实施例的有益效果如下:

首先,贝叶斯概率建模的方法可以通过控制模型复杂度来解决模拟过拟合的问题,以自然的方式处理不确定性,利用边缘化方法将参数的不确定性纳入预测;第二,概率建模驱动的深度学习方法在超级计算机上能够处理亿级材料大数据的性能挖掘与理解,提高了模型的可解释性和自适应性;第三,借助天河、神威超级计算机的计算能力优势,可以突破多尺度模拟在规模、精度方面的限制,实现材料辐照性能机理分析、获得材料宏观机理的新认识。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1