一种基于神经网络的分子绝缘强度预测方法、装置及介质与流程

文档序号:36105559发布日期:2023-11-22 07:05阅读:34来源:国知局
一种基于神经网络的分子绝缘强度预测方法与流程

本发明涉及电气设备的绝缘领域,特别是涉及一种基于神经网络的分子绝缘强度预测方法、装置及介质。


背景技术:

1、分子材料的绝缘强度是筛选可替代气体的关键性质之一,传统上,人们通过实验室测试和材料表征来评估分子材料的绝缘性能,然而,这种实验方法费时费力,并且无法有效地筛选大量的分子候选材料,需要一种快速且准确的预测方法来替代传统的实验方法,因此,发展基于计算模型的方法来预测分子绝缘强度具有重要的实际意义。

2、目前,建立定量结构-性质关系(qspr)方程以预测新气体的介电强度的方法被广泛研究。但是在传统预测方法中存在描述符共线性、描述符和绝缘性质之间物理意义不明等问题,导致预测的进程缓慢;此外,传统预测算法通常对特征和目标之间的线性关系进行建模,其表达能力相对较弱,导致现有的分子绝缘强度预测方法的预测结果不准确。


技术实现思路

1、本发明提供一种基于神经网络的分子绝缘强度预测方法、装置及介质,以解决现有分子绝缘强度预测方法的预测结果准确率和预测效率低的问题。

2、为了解决上述问题,本发明提供了一种基于神经网络的分子绝缘强度预测方法,包括:

3、获取待预测分子的第一分子描述符,将所述第一分子描述符输入至预设的预测模型,使用所述预测模型的卷积层对所述第一分子描述符进行特征提取,得到特征数据;使用所述预测模型的池化层降低所述特征数据的维度;

4、使用所述预测模型的激活函数对降低维度后的所述特征数据进行处理,将处理得到的结果传递到所述预测模型的全连接层,进行特征提取与组合,得到分子绝缘强度的预测结果;

5、其中,所述预测模型是根据预设的训练集、验证集和测试集对cnn模型进行训练、验证和测试,且在测试时所述测试集的决定系数大于等于第一预设值时而获得;所述cnn模型是由卷积、池化和激活三个部分组成的卷积神经网络;所述训练集、验证集和测试集是由若干个分子的绝缘强度集和根据所述若干个分子求得的分子描述符集构成。

6、本发明是使用预设的预测模型来预测分子的绝缘强度,该模型是由cnn模型经过训练、验证和测试而得到的。在预测分子的绝缘强度时,使用卷积层来获取特征数据,能够避免传统识别算法中复杂的特征提取和数据重建的过程,加快特征提取的进程;通过聚合特征的形式,使用池化层可以捕获整个特征数据分子的全局特征,进而减少参数数量、加快计算速度;使用激活函数对特征数据进行处理,可以在特征数据中引入非线性性质,有助于网络学习复杂的分子描述符特征和关系,提高预测结果准确率;最后通过全连接层得到分子绝缘强度的预测结果。由于cnn模型是由卷积、池化和激活三个部分组成的卷积神经网络,能够处理复杂的数据分布和任务,通过训练集、验证集和测试集对cnn模型进行训练、验证和测试,训练集可以为模型提供特征和目标,使模型学习输入输出映射;验证集用于验证模型在训练过程中的效果,通过判断验证集中决定系数的大小可以选择得到最佳的模型;测试集可以保证最后得到的预测模型拥有优秀的预测能力,因此,最后经过测试得到的预测模型,是对cnn模型进行了数据处理能力和预测能力上的提升。相比于现有技术,本发明通过使用对预设的cnn模型进行训练、验证和测试后得到预测模型,来对分子绝缘强度进行预测,能够解决现有分子绝缘强度预测方法的预测结果准确率和预测效率低的问题。

7、作为优选方案,使用所述预测模型的卷积层对所述第一分子描述符进行特征提取,得到特征数据;使用所述预测模型的池化层降低所述特征数据的维度,具体为:

8、使用所述预测模型的卷积层捕获所述第一分子描述符中与绝缘强度相关的分子特征,得到特征数据;

9、使用所述预测模型的池化层,通过聚合特征的形式对所述特征数据的属性进行运算取和或者取平均值,来捕获所述特征数据的全局特征。

10、本优选方案是使用卷积层来获取特征数据,对于经过训练之后得到的预测模型来说,其卷积层提取特征的能力得到了加强,能够避免传统识别算法中复杂的特征提取和数据重建的过程,加快特征提取的进程;通过预测模型的池化层来捕获特征数据的全局特征,进而达到降低特征数据的维度这一目的,这里不是按照传统的最大池化或平均池化方式执行,而是通过聚合特征的形式执行,有助于捕获特征数据的全局特征。

11、作为优选方案,所述预测模型是根据预设的训练集、验证集和测试集对cnn模型进行训练、验证和测试,且在测试时所述测试集的决定系数大于等于第一预设值时而获得,具体为:

12、使用所述分子描述符集作为所述cnn模型的输入端,使用所述绝缘强度集作为所述cnn模型的输出端,根据预设的处理方式使所述cnn模型对所述训练集进行特征提取与学习,使用所述验证集对所述cnn模型进行验证;其中,所述预设的处理方式包括:优化器处理、卷积处理、激活函数处理、池化处理和全连接处理;

13、在对所述cnn模型进行训练和验证时,设置所述cnn模型的模型参数,若确定所述验证集的决定系数大于初始预设值,所述cnn模型完成训练和验证,得到第一模型;

14、使用所述测试集对所述第一模型进行测试,若确定所述测试集的决定系数大于等于第一预设值,所述第一模型完成测试,得到所述预测模型。

15、本优选方案是使用训练集、验证集和测试集对cnn模型进行训练、验证和测试,对于训练集和验证集来说,训练集可以为模型提供特征和目标,使模型学习输入输出映射;验证集用于验证模型在训练过程中的效果,随着模型训练的不断进行,验证集中样本分布与训练模型的样本分布会有变化,需要校验训练好的模型在验证集是否有同样的效果,即校验模型的稳定性、鲁棒性和泛化误差,因此通过判断验证集中决定系数的大小可以选择得到最佳的预测模型;

16、此外,通过预设的处理方式对cnn模型进行训练,其中,优化器处理能够基于训练数据迭代地更新cnn模型的神经网络权重;卷积处理可以增加模型的表达能力,提高模型的准确率;激活函数处理可以增加cnn模型的表达能力,使其能够学习更复杂的非线性关系;池化处理可以从输入的训练集中提取最显著的特征,将其保留下来,同时将其余特征舍弃,这样可以保留重要的特征,减少噪声的影响,提高模型的性能,并且,池化操作可以有效地减少模型的过拟合情况;全连接处理可以将输入训练集的特征与每个神经元之间的连接权重进行矩阵乘法和偏置加法操作,从而快速得到训练结果。

17、作为优选方案,使用所述测试集对所述第一模型进行测试,若确定所述测试集的决定系数大于等于第一预设值,所述第一模型完成测试,得到所述预测模型,具体为:

18、使用所述测试集对所述第一模型进行性能评估,若确定所述测试集的决定系数大于或者等于预设阈值时,所述第一模型通过测试,得到所述预测模型;

19、若确定所述测试集的决定系数小于预设阈值时,重新使用所述训练集和验证集对所述cnn模型进行训练和验证。

20、本优选方案使用独立的测试集进行模型评估,可以提供更可靠的评估结果,对于测试集来说,如果只使用训练集或者验证集进行评估,预测模型的性能指标可能会过于乐观,无法真实地反映预测模型在真实世界中的表现。

21、作为优选方案,所述训练集、验证集和测试集是由若干个分子的绝缘强度集和根据所述若干个分子求得的分子描述符集构成,具体为:

22、获取若干个分子,对所述若干个分子进行模型构建,得到分子模型集,对所述分子模型集进行结构优化;使用预设的开源化学信息工具对结构优化后的所述分子模型集进行计算,得到分子描述符集;

23、将所述分子描述符集和所述若干个分子的绝缘强度集整理为数组,将所述数组中的数据打乱后按照预设比例分为训练集、验证集和测试集。

24、本优选方案首先构建出分子模型集,然后对分子模型集进行结构优化,结构优化能够使每个分子都与实际结构更为接近,并使每个分子所蕴含的能量更为合理;同时,对分子结构进行优化,能够保证后续得到更合理的分子描述符集。

25、作为优选方案,使用预设的开源化学信息工具对结构优化后的所述分子模型集进行计算,得到分子描述符集,具体为:

26、使用开源化学信息工具包rdkit和分子波函数,通过分子smiles码和分子波函数计算,得到分子描述符集。

27、本优选方案中,rdkit作为一个用于化学信息学的开源工具包,基于对化合物2d和3d分子操作,能够利用机器学习方法进行化合物描述符生成,因此通过rdkit能快速获取分子描述符集;通过分子模型集计算得到分子描述符集,对于后续的模型训练、验证和测试而言,分子描述符可以用来描述分子结构、比较分子相似性和差异性,能够提供更为详细的分子结构信息,因此,本方案得到的分子描述符集可以为后续对cnn模型所进行的训练、验证和测试提供强有力的数据支持。

28、作为优选方案,使用预设的开源化学信息工具对结构优化后的所述分子模型集进行计算,得到分子描述符集,还包括:

29、使所述分子描述符集中的数据具有相似的尺度,对所述分子描述符集进行数据清洗和特征选择,对进行数据清洗和特征选择后所述分子描述符集中得到的特征向量进行标准化处理或归一化处理。

30、本优选方案通过对分子描述符集进行数据清洗,可以去除数据中冗余的信息,提高数据的利用率;对分子描述符集进行特征选择后,对得到的特征向量进行标准化或归一化处理,能够使数据处于一个相同的范围,使得计算机更容易处理,并且可以为模型提供清晰的特征权重反应,有利于提升模型表现。

31、本发明还提供了一种基于神经网络的分子绝缘强度预测装置,包括第一预测模块和第二预测模块:

32、其中,所述第一预测模块,用于获取待预测分子的第一分子描述符,将所述第一分子描述符输入至预设的预测模型,使用所述预测模型的卷积层对所述第一分子描述符进行特征提取,得到特征数据;使用所述预测模型的池化层降低所述特征数据的维度;

33、所述第二预测模块,用于使用所述预测模型的激活函数对降低维度后的所述特征数据进行处理,将处理得到的结果传递到所述预测模型的全连接层,进行特征提取与组合,得到分子绝缘强度的预测结果;

34、其中,所述预测模型是根据预设的训练集、验证集和测试集对cnn模型进行训练、验证和测试,且在测试时所述测试集的决定系数大于等于第一预设值时而获得;所述cnn模型是由卷积、池化和激活三个部分组成的卷积神经网络;所述训练集、验证集和测试集是由若干个分子的绝缘强度集和根据所述若干个分子求得的分子描述符集构成。

35、作为优选方案,所述第一预测模块具体为:

36、使用所述预测模型的卷积层捕获所述第一分子描述符中与绝缘强度相关的分子特征,得到特征数据;

37、使用所述预测模型的池化层,通过聚合特征的形式对所述特征数据的属性进行运算取和或者取平均值,来捕获所述特征数据的全局特征。

38、作为优选方案,所述第二预测模块包括预测单元:

39、所述预测单元,用于使用所述分子描述符集作为所述cnn模型的输入端,使用所述绝缘强度集作为所述cnn模型的输出端,根据预设的处理方式使所述cnn模型对所述训练集进行特征提取与学习,使用所述验证集对所述cnn模型进行验证;其中,所述预设的处理方式包括:优化器处理、卷积处理、激活函数处理、池化处理和全连接处理;

40、在对所述cnn模型进行训练和验证时,设置所述cnn模型的模型参数,若确定所述验证集的决定系数大于初始预设值,所述cnn模型完成训练和验证,得到第一模型;

41、使用所述测试集对所述第一模型进行测试,若确定所述测试集的决定系数大于等于第一预设值,所述第一模型完成测试,得到所述预测模型。

42、作为优选方案,所述第二预测模块包括测试单元:

43、所述测试单元,用于使用所述测试集对所述第一模型进行性能评估,若确定所述测试集的决定系数大于或者等于预设阈值时,所述第一模型通过测试,得到所述预测模型;

44、若确定所述测试集的决定系数小于预设阈值时,重新使用所述训练集和验证集对所述cnn模型进行训练和验证。

45、作为优选方案,所述第二预测模块包括数据划分单元:

46、所述数据划分单元,用于获取若干个分子,对所述若干个分子进行模型构建,得到分子模型集,对所述分子模型集进行结构优化;使用预设的开源化学信息工具对结构优化后的所述分子模型集进行计算,得到分子描述符集;

47、将所述分子描述符集和所述若干个分子的绝缘强度集整理为数组,将所述数组中的数据打乱后按照预设比例分为训练集、验证集和测试集。

48、作为优选方案,所述第二预测模块包括数据获取单元:

49、所述数据获取单元,用于使用开源化学信息工具包rdkit和分子波函数,通过分子smiles码和分子波函数计算,得到分子描述符集。

50、作为优选方案,所述第二预测模块包括数据处理单元:

51、所述数据处理元,用于使所述分子描述符集中的数据具有相似的尺度,对所述分子描述符集进行数据清洗和特征选择,对进行数据清洗和特征选择后所述分子描述符集中得到的特征向量进行标准化处理或归一化处理。

52、本发明还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被计算机调用并执行,实现如上所述一种基于神经网络的分子绝缘强度预测方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1