本发明涉及生产供应链的智能制造领域,具体地,涉及一种针对产品零部件的自主机器学习需求预测方法及系统。
背景技术:
1、随着工业大数据的发展,生产供应链中对于备件需求预测精度要求越来越高,有别于传统耗时耗力且具有较强主观性的人工手工预测,备件订单的自动化预测可以优化采购计划和库存管理,帮助企业节省人力和经济上的支出,从而提高企业整体利润。
2、现有自动化时序产品所提供的模型选择大多较为单一,且未能对某一业务场景进行优化,对于产品使用者的数据处理与模型背景知识要求较高,通常要求产品使用者上传精细处理后的数据且对模型手动进行参数调整.如meta公司(在2022年)发布的自动化预测‘prophet’产品,要求使用者了解时序的相关知识以及预测数据本身的一些规律,从而选择相应的输入参数,譬如时序变化点,来优化预测表现。
技术实现思路
1、针对现有技术中的缺陷,本发明的目的是提供一种针对产品零部件的自主机器学习需求预测方法及系统,可以自动化进行数据处理,特征工程,特征筛选,参数优化,模型集成和预测,有助于减少需求预测的人力成本,同时提高预测的准确性。
2、根据本发明提供的一种针对产品零部件的自主机器学习需求预测方法,包括以下步骤:
3、s1通过数据预处理算法对数据进行自动预处理操作,获得预测性的需求量分布和待训练的时序数据;
4、s2通过自动化特征工程获取待训练的时序数据的特征值,结合预测因子构建时序模型;
5、s3通过自动化特征筛选对待训练的时序数据的各特征值进行重要性分值计算,获取最优特征,提高时序模型训练的效率;
6、s4自动化优化预测模型参数:基于待训练的时序数据的特征对预测模型参数进行优化,生成最优参数,基于最优特征、最优参数进行预测模型训练,获得需求预测结果。
7、进一步地,所述数据预处理算法是通过对产品数据进行可预测性分析与描述性分析,结合业务需求参数,实现数据聚合,获得待训练的时序数据。
8、进一步地,所述数据预处理算法的实现方法如下:
9、1)获取产品基础数据;
10、2)对产品基础数据进行可预测性分析与描述性分析,获取预测性的需求量分布;
11、3)获取业务需求参数,结合业务需求参数对需求量分布中的需求缺失值进行填充,实现数据聚合,获取待训练的时序数据。
12、进一步地,所述待训练的时序数据的特征值包括基础滞后特征、统计性特征、预测因子;
13、所述基础滞后特征是通过将时序数据按产品某一属性的不同维度进行分组排序,获取过去若干个时间颗粒度单元的需求值;
14、所述统计性特征是根据所述基础滞后特征而计算出的统计性的特征值;
15、所述预测因子是根据所述需求量分布的预测情况所提取的预测值;
16、进一步地,所述自动化特征筛选通过基础特征选择模型训练所述待训练的时序数据,并计算出各特征值的重要性分数,获取最优特征。
17、进一步地,所述最优参数通过optuna框架算法生成。
18、进一步地,所述最优特征、最优参数以及模型文件存储在服务器数据库中,能够随时调用。
19、进一步地,所述业务需求参数包括时间颗粒度、模型算法、预测步长、需求界限值、取整规则;
20、根据业务需要先选取时间颗粒度,选择模型算法与预测步长,然后根据业务需求添加需求界限值与取整规则;
21、进一步地,所述可预测性分析能够通过回测模型表现其预测的需求量分布结果,并选择表现好的模型进行下一轮预测,提高需求预测的灵活性和准确度。
22、进一步地,所述待训练的时序数据的特征提取采用tsfresh包裹算法来实现。
23、根据本发明提供的一种针对产品零部件的自主机器学习需求预测系统,包括如下模块:
24、自动预处理模块:通过数据预处理算法对数据进行自动预处理操作,获得预测性的需求量分布和待训练的时序数据;
25、时序模型构建模块:通过自动化特征工程获取待训练的时序数据的特征值,结合预测因子构建时序模型;
26、分值计算模块:通过自动化特征筛选对待训练的时序数据的各特征值进行重要性分值计算,获取最优特征,提高时序模型训练的效率;
27、自动化优化预测模型参数模块:基于待训练的时序数据的特征对预测模型参数进行优化,生成最优参数,基于最优特征、最优参数进行预测模型训练,获得需求预测结果。
28、与现有技术相比,本发明具有如下的有益效果:
29、1、本发明针对供应链备件场景优化自动化时序数据预测,自动完成可预测性分析与数据处理功能;模型选择多样化,用户可以选择传统的机器学习模型,也可以选择更为复杂的深度学习模型,甚至可以选择多种模型进行融合;使用时模型参数自动生成,用户可直接使用.
30、2、本发明业务人员可以根据自身掌握的业务知识,在模型训练前输入订单需求最大值、最小值参数来限定模型预测的范围,使得预测结果符合业务逻辑,以提高需求预测的准确度。
31、3、业务人员可以在预测任务看板中回测模型表现,选择表现好的模型进行下一轮预测,以提高需求预测的灵活性和准确度。
32、4、所有自动化流程中,获取的最优数据特征、最优模型参数和训练模型都存储在服务器的数据库中,实现持久化,满足业务人员随时调用的需求,以降低重复训练模型的成本。
1.一种针对产品零部件的自主机器学习需求预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的针对产品零部件的自主机器学习需求预测方法,其特征在于,所述数据预处理算法是通过对产品数据进行可预测性分析与描述性分析,结合业务需求参数,实现数据聚合,获得待训练的时序数据。
3.根据权利要求2所述的针对产品零部件的自主机器学习需求预测方法,其特征在于,所述数据预处理算法的实现方法如下:
4.根据权利要求1所述的针对产品零部件的自主机器学习需求预测方法,其特征在于,所述待训练的时序数据的特征值包括基础滞后特征、统计性特征、预测因子;
5.根据权利要求1所述的针对产品零部件的自主机器学习需求预测方法,其特征在于,所述自动化特征筛选通过基础特征选择模型训练所述待训练的时序数据,并计算出各特征值的重要性分数,获取最优特征。
6.根据权利要求1所述的针对产品零部件的自主机器学习需求预测方法,其特征在于,所述最优参数通过optuna框架算法生成。
7.根据权利要求1所述的针对产品零部件的自主机器学习需求预测方法,其特征在于,所述最优特征、最优参数以及模型文件存储在服务器数据库中,能够随时调用;
8.根据权利要求3所述的针对产品零部件的自主机器学习需求预测方法,其特征在于,所述业务需求参数包括时间颗粒度、模型算法、预测步长、需求界限值、取整规则;
9.根据权利要求3所述的针对产品零部件的自主机器学习需求预测方法,其特征在于,所述可预测性分析能够通过回测模型表现其预测的需求量分布结果,并选择表现好的模型进行下一轮预测,提高需求预测的灵活性和准确度。
10.一种针对产品零部件的自主机器学习需求预测系统,其特征在于,包括如下模块: