本申请涉及核工程数据处理,尤其涉及核工程数据处理的高效缺失值填补。
背景技术:
1、核工程是一门关键的科学和技术领域,涉及到核反应堆、核材料、辐射监测和核能发电等方面的研究和应用。核工程领域产生了大量的数据,这些数据对于核反应堆性能分析、核材料研究以及核能发电的安全运营至关重要。
2、然而,在核工程研究和应用中,数据缺失是一个常见的问题。数据缺失可能由于设备故障、实验中的错误、数据收集错误、无法获取数据、数据传输问题以及实验条件的复杂性等多种原因导致。这些缺失值对于数据分析、建模和决策制定都构成了挑战,必将会对核工程领域的研究和分析造成严重影响。
3、数据缺失问题的解决对于确保核工程领域的数据质量、完整性和可用性至关重要。传统的数据填补方法,如均值插补和热平台插补,可能无法充分利用数据的潜在结构和特性,导致填补后的数据缺乏多样性,不适用于复杂的核工程问题。
技术实现思路
1、本发明目的是为了解决现有核工程数据处理技术精度和效率低的问题,提供了用于核工程数据处理的高效缺失值填补方法、设备和介质。
2、本发明是通过以下技术方案实现的,本发明一方面,提供一种用于核工程数据处理的高效缺失值填补方法,所述方法包括:
3、步骤1、从核工程数据集中自动识别和标记出缺失值所在的列;
4、步骤2、根据步骤1中的标记结果,将核工程数据分为已知数据和待填补数据,所述待填补数据包含至少一个缺失值的数据;
5、步骤3、建立核工程数据处理的多层感知机模型,包括:对所述已知数据进行前向传播和反向传播,使用均方误差损失函数来优化模型的权重和偏差;
6、步骤4、利用步骤3.1中训练后的多层感知机模型,对所述待填补数据的缺失值进行预测和填补,生成填补后的数据;
7、步骤5、将所述填补后的数据与原始数据合并,获取完整的核工程数据。
8、进一步地,所述核工程数据集的物理量包括热中子裂变产热、快中子裂变产热、堆γ场产热、芯块热导率、燃料不同位置温度和堆功率。
9、进一步地,所述核工程数据处理的多层感知机模型为多层感知机mlp模型,包括输入层、至若干个隐藏层和输出层;
10、其中,所述每个隐藏层均使用非线性激活函数,以引入非线性特性;所述输出层用于生成填补后的数据。
11、进一步地,采用gridsearchcv对所述核工程数据处理的多层感知机模型的超参数进行优化,具体包括:
12、步骤3.1、定义超参数搜索空间,所述超参数搜索空间包括:学习率、隐藏层大小和数量、训练周期数和批次大小;
13、步骤3.2、创建gridsearchcv对象,包括参数:mlp模型、超参数搜索空间、交叉验证折数和评价指标;
14、步骤3.3、进行超参数搜索,调用gridsearchcv对象的fit方法,执行以下操作:
15、创建mlp模型的一个副本,使用当前的超参数配置;
16、使用交叉验证来训练和评估模型,计算均方误差的负值作为性能指标;
17、记录该超参数配置的性能;
18、步骤3.4、获取最佳超参数配置和性能,包括:gridsearchcv完成搜索后,使用best_params_属性获取最佳的超参数配置,使用best_score_属性获取相应的性能指标,同时获取最佳配置和性能;
19、步骤3.5、使用最优的超参数配置来重新创建mlp模型,并将其应用于数据。
20、进一步地,所述若干个隐藏层为至少两个隐藏层。
21、进一步地,所述非线性激活函数包括relu激活函数。
22、进一步地,步骤3中,用于建立核工程数据处理的多层感知机模型的训练过程使用adam优化算法,并经过多个迭代周期。
23、第二方面,本发明提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,当所述处理器运行所述存储器存储的计算机程序时执行如上文所述的一种用于核工程数据处理的高效缺失值填补方法的步骤。
24、第三方面,本发明提供一种计算机可读存储介质,所述计算机可读存储介质中存储有多条计算机指令,所述多条计算机指令用于使计算机执行如上文所述的一种用于核工程数据处理的高效缺失值填补方法。
25、第四方面,本发明提供一种电子设备,包括:
26、至少一个处理器;以及,
27、与所述至少一个处理器通信连接的存储器;其中,
28、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上文所述的一种用于核工程数据处理的高效缺失值填补方法。
29、本发明的有益效果:
30、对于核工程领域,研究和应用高效的数据处理和缺失值填补方法至关重要。这不仅有助于提高数据质量和完整性,还支持更准确和有效的数据分析、模型训练和决策制定,从而推动核工程科学研究和技术的进步。在这一背景下,本发明提出了一种新的数据填补方法,以应对核工程数据中的缺失值问题。
31、1、核工程数据中的数据缺失问题相对常见,由于设备故障、数据收集错误或无法获取某些数据等原因引起,因此本发明考虑了核工程领域的数据处理要求。为了将mlp应用于核工程领域,本发明提供了数据规范化、数据分割、填补过程以及超参数优化,以适应核工程数据的特性和需求。
32、2、本发明提供了在核工程数据处理中使用mlp来填补缺失数据及超参数调优方法,模型的目标是高效地填补核工程数据中的缺失值,满足了在核工程领域中处理数据缺失的需求。mlp模型包括输入层、多个隐藏层和输出层,经过训练后,能够生成高质量的填补数据。这些填补后的数据可用于进一步的数据分析、建模,有望推动核工程科学研究和技术的进步。
33、本发明为处理核工程数据中的缺失问题提供了一种高效、可靠的解决方案,通过填补缺失数据,有望推动核工程科学研究和技术的进步。这意味着这个模型不仅仅是一个工具,还具有潜在的影响,可以改善核工程领域的数据质量和可用性,从而促进相关领域的发展。
34、本发明适用于核工程数据处理,目的是提供高效、可靠的数据填补方法。
1.一种用于核工程数据处理的高效缺失值填补方法,其特征在于,所述方法包括:
2.根据权利要求1所述的一种用于核工程数据处理的高效缺失值填补方法,其特征在于,所述核工程数据集的物理量包括热中子裂变产热、快中子裂变产热、堆γ场产热、芯块热导率、燃料不同位置温度和堆功率。
3.根据权利要求1所述的一种用于核工程数据处理的高效缺失值填补方法,其特征在于,所述核工程数据处理的多层感知机模型为多层感知机mlp模型,包括输入层、至若干个隐藏层和输出层;
4.根据权利要求3所述的一种用于核工程数据处理的高效缺失值填补方法,其特征在于,采用gridsearchcv对所述核工程数据处理的多层感知机模型的超参数进行优化,具体包括:
5.根据权利要求3所述的一种用于核工程数据处理的高效缺失值填补方法,其特征在于,所述若干个隐藏层为至少两个隐藏层。
6.根据权利要求3所述的一种用于核工程数据处理的高效缺失值填补方法,其特征在于,所述非线性激活函数包括relu激活函数。
7.根据权利要求1所述的一种用于核工程数据处理的高效缺失值填补方法,其特征在于,步骤3中,用于建立核工程数据处理的多层感知机模型的训练过程使用adam优化算法,并经过多个迭代周期。
8.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,当所述处理器运行所述存储器存储的计算机程序时执行权利要求1至7中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有多条计算机指令,所述多条计算机指令用于使计算机执行权利要求1至7中任一项所述的方法。
10.一种电子设备,其特征在于,包括: