一种基于机器学习的钙钛矿太阳能电池设计方法及装置与流程

文档序号:36478612发布日期:2023-12-25 05:11阅读:66来源:国知局
一种基于机器学习的钙钛矿太阳能电池设计方法及装置与流程

本发明涉及一种基于机器学习的钙钛矿太阳能电池设计方法及装置,属于新材料性能分析。


背景技术:

1、随着现代科学技术的快速发展,能源对于人类生活愈加重要。目前,探索和研究高节能、高效率的新能源材料成为了解决可持续发展的核心途径。太阳能是地球上最充裕的可再生清洁能源,在过去几十年里,研究人员一直致力于寻找清洁、低成本、高效率的新型光伏材料。其中,钙钛矿材料具有众多优异的性质,如吸光系数高、载流子迁移率高、缺陷容忍度较高等特点。钙钛矿电池用13年时间走完了硅基电池40年的发展历程,显示出广阔的应用前景。但是,基于不同器件组成的钙钛矿太阳能电池(psc),每一层所用的材料、溶剂和沉积方法都有多种选择,形成了一个涉及大量因素的庞大实验领域。例如在过去的十年里,通过对钙钛矿的组分进行改变,用各种掺杂来替换卤化物、金属和有机物部分,进而改变结构本身,通过改进沉积策略和技术(一步、两步、旋涂、刮涂、气相沉积等),以及测试多种溶剂、抗溶剂、添加剂和钝化剂的组合等方法研究对钙钛矿电池性能的影响。如果考虑到材料和方法的所有选项,那么可以用来创建 psc 的配置数量几乎是无限的。由于机器学习具有较强的处理数据的能力,同时也可以有效降低工业开发中的人力物力成本,并且缩短研发周期,因此是一种最有效的替代实验的方法。

2、当前利用机器学习的方法对钙钛矿太阳能电池的光电转换效率进行预测的方法主要是将各个钙钛矿太阳能电池的各项数据输入预测模型中,并未对预测模型的预测效果进行探究,也并未对钙钛矿太阳能电池的各项数据进行重要性排序,从而实现选择性输入,因此当前对钙钛矿太阳能电池的光电转换效率的预测存在效果较差,预测效率较低的问题。


技术实现思路

1、本发明提供一种基于机器学习的钙钛矿太阳能电池设计方法、装置及计算机可读存储介质,其主要目的在于解决当前对钙钛矿太阳能电池的光电转换效率的预测存在效果较差,预测效率较低的问题。

2、为实现上述目的,本发明提供的一种基于机器学习的钙钛矿太阳能电池设计方法,包括:

3、获取钙钛矿原始数据集,对所述钙钛矿原始数据集进行预处理,得到钙钛矿目标数据集;

4、根据预设的关联特征项目集在所述钙钛矿目标数据集中提取原始项目特征数据集,根据预设的非连续特征项目集在所述原始项目特征数据集中识别非连续项目特征类别;

5、对所述原始项目特征数据集中的非连续项目特征类别进行编码,得到初始项目特征值集;

6、对所述初始项目特征值集进行规约合并处理,得到目标项目特征值集;

7、计算所述目标项目特征值集的皮尔森相关系数及互信息,利用所述皮尔森相关系数及互信息对所述目标项目特征值集进行一次筛选,得到第一项目特征值集;

8、利用预设的递归特征消除法,根据预构建的lgbm基学习器对所述第一项目特征值集进行二次筛选,得到第二项目特征值集;

9、利用所述第二项目特征值集对预构建的原始catboost模型进行训练,得到目标catboost模型;

10、接收用户输入的待评估项目特征值集,利用所述目标catboost模型,根据所述待评估项目特征值集预测当前光电转换效率,根据所述当前光电转换效率调整所述待评估项目特征值集,完成基于机器学习的钙钛矿太阳能电池设计。

11、可选地,所述对钙钛矿原始数据集进行预处理,得到钙钛矿目标数据集,包括:

12、获取样本选取范围,根据所述样本选取范围在所述钙钛矿原始数据集中选取钙钛矿可用数据集及钙钛矿缺失数据集;

13、依次获取所述钙钛矿缺失数据集中钙钛矿缺失数据的残余数据集,根据所述残余数据集,利用预构建的预测模型对所述钙钛矿缺失数据进行缺失值预测,得到缺失预测值,所述缺失值预测如下所示:

14、;

15、其中,表示钙钛矿缺失数据的缺失预测值,表示利用预测模型根据残余数据集对钙钛矿缺失数据进行预测,表示残余数据集,表示残余数据集中的第个残余数据,表示残余数据集中残余数据的个数;

16、汇总所有缺失预测值,得到缺失预测值集;

17、对所述钙钛矿可用数据集及预测缺失值集执行标准化处理,得到钙钛矿标准数据集;

18、对所述钙钛矿标准数据集进行离群点检测,得到钙钛矿离群数据集;

19、将所述钙钛矿标准数据集中的钙钛矿离群数据集进行剔除,得到钛矿初始数据集;

20、对所述钙钛矿初始数据集进行降维处理,得到钙钛矿低维数据集;

21、对所述钙钛矿低维数据集执行可视化操作,并提取数据分布特征;

22、根据预设的抽样方法,利用所述数据分布特征获取待补充数据;

23、汇总所述待补充数据及所述钙钛矿初始数据集,得到钙钛矿目标数据集。

24、可选地,所述对原始项目特征数据集中的非连续项目特征类别进行编码之前,所述方法还包括:

25、在非连续特征项目集中依次提取非连续特征项目;

26、识别所述非连续特征项目的非连续项目特征类别集;

27、根据预设的其它类别阈值判断所述非连续项目特征类别集中是否存在稀有特征类别;

28、若所述非连续项目特征类别集中存在稀有特征类别,则将所述稀有特征类别归类为其它特征类别;

29、在所述非连续项目特征类别集中依次提取非连续项目特征类别或其它特征类别,获取所述非连续项目特征类别或其它特征类别的光电转换效率均值,将所述光电转换效率均值作为所述非连续项目特征类别或其它特征类别的特征类别值,所述光电转换效率均值的计算方式如下所示:

30、利用如下公式计算所述光电转换效率均值:

31、;

32、其中,表示第个非连续项目特征类别或其它特征类别的光电转换效率均值,表示第个非连续项目特征类别或其它特征类别的权重系数,表示包含第个非连续项目特征类别或其它特征类别的第个样本的光电转换效率,表示样本总数,表示包含第个非连续项目特征类别或其它特征类别的样本数;

33、其中所述权重系数的计算方式如下所示:

34、;

35、其中,及f表示调节系数,且及f;

36、若所述非连续项目特征类别集中不存在稀有特征类别,则在所述非连续项目特征类别集中依次提取非连续项目特征类别,获取所述非连续项目特征类别的光电转换效率均值,将所述光电转换效率均值作为所述非连续项目特征类别的特征类别值。

37、可选地,所述对原始项目特征数据集中的非连续项目特征类别进行编码,得到初始项目特征值集,包括:

38、在所述原始项目特征数据集中依次提取非连续项目特征类别;

39、识别所述非连续项目特征类别对应的特征类别值,将所述特征类别值设定为所述非连续项目特征类别的初始项目特征值;

40、获取所述原始项目特征数据集中连续特征项目对应的初始项目特征值,汇总所述原始项目特征数据集中非连续项目特征类别及连续特征项目对应的初始项目特征值,得到所述初始项目特征值集。

41、可选地,所述对初始项目特征值集进行规约合并处理,得到目标项目特征值集,包括:

42、在所述初始项目特征值集中识别偏态连续特征值集;

43、对所述偏态连续特征值集进行离散化分桶处理,得到离散特征值集;

44、利用预构建的标准化公式对所述离散特征值集进行量纲消除处理,得到所述目标项目特征值集,其中所述标准化公式如下所示:

45、;

46、其中,表示标准化后的离散特征值,表示离散特征值,表示离散特征值所属连续项目特征类别或非连续项目特征类别的离散特征均值,表示离散特征值所属连续项目特征类别或非连续项目特征类别的标准差。

47、可选地,所述利用所述皮尔森相关系数及互信息对所述目标项目特征值集进行一次筛选,得到第一项目特征值集,包括:

48、根据所述目标项目特征值集计算皮尔森相关系数及互信息大于预设相关阈值的关联项目特征类别集;

49、将所述关联项目特征类别集进行去冗操作,得到去冗项目特征类别集;

50、获取所述去冗项目特征类别集对应的去冗项目特征值集,根据所述去冗项目特征值集计算所述去冗项目特征类别集中每项去冗项目特征类别的自方差;

51、识别自方差小于预设方差阈值的去冗项目特征类别,将自方差小于预设方差阈值的去冗项目特征类别在所述去冗项目特征类别集中剔除,得到第一项目特征类别集;

52、获取所述第一项目特征类别集对应的第一项目特征值集。

53、可选地,所述利用预设的递归特征消除法,根据预构建的lgbm基学习器对所述第一项目特征值集进行二次筛选,得到第二项目特征值集,包括:

54、根据所述第一项目特征值集,利用所述lgbm基学习器及递归特征消除法,计算所述第一项目特征类别集的特征重要性排序列表,所述特征重要性排序列表的计算方式如下:

55、根据递归特征消除公式,利用lgbm基学习器计算所述第一项目特征值集中每一个第一项目特征值的决定系数分值,其中所述递归特征消除公式如下所示:

56、;

57、其中,表示在所述第一项目特征值集中选择的特征值子集,表示第一项目特征集,表示lgbm基学习器在特征值子集上训练得到的决定系数分值;

58、判断所述特征重要性排序列表中项目特征类别数是否小于预设的特征类别阈值;

59、若所述特征重要性排序列表中项目特征类别数不小于所述特征类别阈值,则对所述特征重要性排序列表中的第一项目特征类别集进行重要性删减,并对所述特征重要性排序列表进行删减更新化,返回上述判断所述特征重要性排序列表中项目特征类别数是否小于预设的特征类别阈值的步骤;

60、若所述特征重要性排序列表中项目特征类别数小于所述特征类别阈值,则得到所述第二项目特征值集。

61、可选地,所述利用所述第二项目特征值集对预构建的原始catboost模型进行训练,得到目标catboost模型之前,所述方法还包括:

62、利用预设的钙钛矿训练数据集对预构建的随机森林模型、xgboost模型、adaboost模型、lgbm模型及catboost模型进行训练,得到测试随机森林模型、测试xgboost模型、测试adaboost模型、测试lgbm模型及测试catboost模型;

63、计算所述测试随机森林模型、测试xgboost模型、测试adaboost模型、测试lgbm模型及测试catboost模型的预测评估值;

64、根据所述预测评估值在所述随机森林模型、xgboost模型、adaboost模型、lgbm模型及catboost模型中选择目标预测模型,其中所述目标预测模型为catboost模型。

65、可选地,所述根据所述当前光电转换效率调整所述待评估项目特征值集,包括:

66、判断所述当前光电转换效率是否达到预设的目标光电转换效率;

67、若所述当前光电转换效率达到所述目标光电转换效率,则不调整所述待评估项目特征值集;

68、若所述当前光电转换效率未达到所述目标光电转换效率,则调整所述待评估项目特征值集中的待评估项目特征值,得到迭代待评估项目特征值集;

69、将所述迭代待评估项目特征值集输入所述目标catboost模型,得到迭代光电转换效率;

70、判断所述迭代光电转换效率是否达到所述目标光电转换效率;

71、若所述迭代光电转换效率未达到所述目标光电转换效率,则返回上述调整所述待评估项目特征值集中的待评估项目特征值的步骤;

72、若所述迭代光电转换效率达到所述目标光电转换效率,则完成对待评估项目特征值集的调整。

73、为了解决上述问题,本发明还提供一种基于机器学习的钙钛矿太阳能电池设计装置,所述装置包括:

74、非连续项目特征类别编码模块,用于获取钙钛矿原始数据集,对所述钙钛矿原始数据集进行预处理,得到钙钛矿目标数据集;根据预设的关联特征项目集在所述钙钛矿目标数据集中提取原始项目特征数据集,根据预设的非连续特征项目集在所述原始项目特征数据集中识别非连续项目特征类别;对所述原始项目特征数据集中的非连续项目特征类别进行编码,得到初始项目特征值集;

75、目标项目特征值集一次筛选模块,用于对所述初始项目特征值集进行规约合并处理,得到目标项目特征值集;计算所述目标项目特征值集的皮尔森相关系数及互信息,利用所述皮尔森相关系数及互信息对所述目标项目特征值集进行一次筛选,得到第一项目特征值集;

76、目标项目特征值集二次筛选模块,用于利用预设的递归特征消除法,根据预构建的lgbm基学习器对所述第一项目特征值集进行二次筛选,得到第二项目特征值集;

77、原始catboost模型训练模块,用于利用所述第二项目特征值集对预构建的原始catboost模型进行训练,得到目标catboost模型;

78、待评估项目特征值集调整模块,用于接收用户输入的待评估项目特征值集,利用所述目标catboost模型,根据所述待评估项目特征值集预测当前光电转换效率,根据所述当前光电转换效率调整所述待评估项目特征值集。

79、为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

80、至少一个处理器;以及,

81、与所述至少一个处理器通信连接的存储器;其中,

82、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以实现上述所述的基于机器学习的钙钛矿太阳能电池设计方法。

83、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于机器学习的钙钛矿太阳能电池设计方法。

84、相比于背景技术所述问题,首先需要根据关联特征项目集在所述钙钛矿目标数据集中提取原始项目特征数据集,由于所述钙钛矿原始数据集来源不一,因此需要对所述钙钛矿原始数据集进行预处理,得到钙钛矿目标数据集,在对目标项目特征值集进行筛选前,由于存在目标项目特征值属于非连续特征项目,因此需要先根据预设的非连续特征项目集在所述原始项目特征数据集中识别非连续项目特征类别,再对所述原始项目特征数据集中的非连续项目特征类别进行编码,得到初始项目特征值集,此时就可以进行目标项目特征值集的筛选,再进行目标项目特征值集的筛选前,需要对所述初始项目特征值集进行规约合并处理,得到目标项目特征值集,目标项目特征值集的筛选分为两次,第一次筛选是计算所述目标项目特征值集的皮尔森相关系数及互信息,利用所述皮尔森相关系数及互信息对所述目标项目特征值集进行一次筛选,得到第一项目特征值集,第二次筛选是利用预设的递归特征消除法,根据预构建的lgbm基学习器对所述第一项目特征值集进行二次筛选,得到第二项目特征值集,此时即可利用所述第二项目特征值集对预构建的原始catboost模型进行训练,得到目标catboost模型,最后通过接收用户输入的待评估项目特征值集,再利用所述目标catboost模型,根据所述待评估项目特征值集预测当前光电转换效率,再根据所述当前光电转换效率调整所述待评估项目特征值集,从而完成基于机器学习的钙钛矿太阳能电池设计,因此本发明提出的基于机器学习的钙钛矿太阳能电池设计方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决当前对钙钛矿太阳能电池的光电转换效率的预测存在效果较差,预测效率较低的问题。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1