基于多重回归模型的产品加工价格预估方法及系统与流程

文档序号:22390631发布日期:2020-09-29 17:55阅读:85来源:国知局
基于多重回归模型的产品加工价格预估方法及系统与流程

本发明涉及自动化机械加工技术领域,尤其是一种基于多重回归模型的产品加工价格预估方法及系统。



背景技术:

cnc加工,通常是指计算机数字化控制精密机械加工,相应的加工设备包括cnc加工车床、cnc加工铣床和cnc加工镗铣床等,具有减少工装数量、加工精度高以及加工效率高等优点,在工业上已经得到广泛应用。

一直以来,通过数控设备加工产品的报价缺乏规范、有效的方式。现有技术中,可行的报价方式是人工报价,报价人员基于历史经验及对行业的理解等,预估产品加工时间、产品材料价格和表面处理的成本,并最终综合上述成本得出产品的报价。这种报价方式过于主观,难免存在报价偏高或偏低的问题。因此,现有技术亟需一种规范、准确的报价方式。



技术实现要素:

本发明提供一种基于多重回归模型的产品加工价格预估方法及系统,基于人工智能算法预估产品加工价格,提升报价的准确性。

根据本发明的第一方面,本发明提供一种基于多重回归模型的产品加工价格预估方法,包括如下步骤:

收集多个产品数据,建立产品原始数据集,所述产品数据包括产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价、材料密度和价格;

依据所述产品原始数据集,建立多线性回归模型,所述多线性回归模型的公式为:log(y)=β0+log(x1)+log(x2)+x3+x4+x5+x6+x7+x8+x9+x10+x11;

其中,y为价格,β0为常数项,x1-x11分别为产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价和材料密度;

将所述产品原始数据集划分为训练子集和测试子集,通过训练子集训练所述多线性回归模型,使用验证子集验证所述多线性回归模型的准确性,依据验证结果调整所述多线性回归模型,确定最终的多线性回归模型。

优选的,所述通过训练子集训练所述多线性回归模型,使用验证子集验证所述多线性回归模型的准确性,具体为:通过训练子集训练得到多线性回归模型中的常数项,将验证子集中的产品数据代入已确定常数项值多线性回归模型中,依据该多线性回归模型的输出结果确定该多线性回归模型的准确性。

优选的,在将验证子集中的产品数据代入已确定常数项值的多线性回归模型中后,若该线性回归模型输出的价格值与验证子集中的价格值的差值大于预定差值,则依据该差值调整所述多线性回归模型。

优选的,还包括如下步骤:建立测试数据集,使用测试数据集测试所述多线性回归模型的准确性。

优选的,所述产品公差等级与产品公差值具有预设映射关系,所述产品加工复杂度为产品加工复杂等级,所述产品可加工性为产品可加工等级。

根据本发明的第二方面,本发明提供一种基于多重回归模型的产品加工价格预估系统,包括:

数据收集模块,用于收集多个产品数据,建立产品原始数据集,所述产品数据包括产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价、材料密度和价格;

模型建立模块,用于依据所述产品原始数据集,建立多线性回归模型,所述多线性回归模型的公式为:

log(y)=β0+log(x1)+log(x2)+x3+x4+x5+x6+x7+x8+x9+x10+x11;

其中,y为价格,β0为常数项,x1-x11分别为产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价和材料密度;

验证确定模块,用于将所述产品原始数据集划分为训练子集和测试子集,通过训练子集训练所述多线性回归模型,使用验证子集验证所述多线性回归模型的准确性,依据验证结果调整所述多线性回归模型,确定最终的多线性回归模型。

优选的,所述验证确定模块用于通过训练子集训练得到多线性回归模型中的常数项,将验证子集中的产品数据代入已确定常数项值多线性回归模型中,依据该多线性回归模型的输出结果确定该多线性回归模型的准确性。

优选的,所述验证确定模块用于在将验证子集中的产品数据代入已确定常数项值的多线性回归模型中后,若该线性回归模型输出的价格值与验证子集中的价格值的差值大于预定差值,则依据该差值调整所述多线性回归模型。

优选的,所述基于多重回归模型的产品加工价格预估系统还包括数据测试模块,用于建立测试数据集,使用测试数据集测试所述多线性回归模型的准确性。

优选的,所述产品公差等级与产品公差值具有预设映射关系,所述产品加工复杂度为产品加工复杂等级,所述产品可加工性为产品可加工等级。

本发明具有如下技术效果:本发明基于大量的原始数据,建立了产品加工价格的多线性回归模型,通过训练子集训练多线性回归模型,还使用验证子集验证所述多线性回归模型的准确性,依据验证结果调整所述多线性回归模型,确定最终产品加工价格的多线性回归模型,改变了传统人工预估产品加工价格的方式,通过多线性回归模型来预估产品加工价格,提升了报价的准确性。

附图说明

图1为本发明一种实施例的基于多重回归模型的产品加工价格预估方法的流程图;

图2为本发明一种实施例的产品复杂性与价格的对应示意图;

图3为本发明一种实施例的基于多重回归模型的产品加工价格预估系统的结构示意图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。

本发明提供一种基于多重回归模型的产品加工价格预估方法,如图1所示,其包括如下步骤:

s100:收集多个产品数据,建立产品原始数据集。

产品数据可来源于历史交易数据,可以是加工方自行记录的交易数据,也可以是线上交易系统记录的数据。产品数据的规模可依据系统的计算能力确定,数据量越大,最终的模型越准确,一般可选用1000个产品的数据。每个产品的产品数据均包括产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价、材料密度和价格。

在产品数据收集齐之后,需要对其进行预处理,以符合学习模型的建立,具体的,通过导入中位数或删除多个数据点,解决某个数据缺失的问题;对杂乱数据进行整理,使其有序排列;删除重复数据,以防止重复数据对模型计算产生影响;使用log函数来消除特征数据偏斜,保证数据的准确性。由于人工智能学习模型仅接受数值数据,因此,上述产品数据均体现为数值。

在数据预处理完成之后,建立得到最终的产品原始数据集,该产品原始数据集包含多个产品的产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价、材料密度和价格这些产品数据。产品原始数据集将作为建立模型和数据计算的基础。

s200:依据所述产品原始数据集,建立多线性回归模型。

在上述产品原始数据集中,产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价和材料密度这些独立变量的变化均会影响价格,这些独立变量与价格这个独立变量高度相关,就存在多共线性,可基于此建立多线性回归模型,使得价格这个独立变量可以通过其他独立变量线性预测得到,这种模型的精确度很高。

上述多线性回归模型的公式为:

log(y)=β0+log(x1)+log(x2)+x3+x4+x5+x6+x7+x8+x9+x10+x11;

其中,y为价格,β0为常数项,x1-x11分别为产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价和材料密度。

产品表面积、产品x轴长度、产品y轴长度和产品z轴长度均与价格正相关,产品表面积越大或产品长度越长,则价格也越高。产品加工复杂度定义了基于产品图纸的复杂程度,可对产品加工复杂度进行分级,从而体现为数据,例如,可将产品加工复杂性定义为1-10的范围,如图2所示,随着复杂性的增加,价格会升高。产品公差等级可基于预设的产品公差分级表进行分级,每个产品公差级别对应有产品公差的范围,产品公差所处的范围所对应的等级,即为该产品公差的等级,产品公差越低,价格自然越高。刀具使用率具体可以是使用刀具加工产品的时间与产品总加工时间的占比,刀具可以是cnc设备上的铣刀、镗刀等多种刀具,刀具的使用率越高,价格也越高。产品数量与价格是正相关,但不适用于直接的倍数关系,对于高速运转的工业产线而言,当产品数量较多时,产品单价越低,当产品数量较少时,产品单价反而越高。由于不同材料价格存在差异,因此材料种类影响产品的成本的比重较大。部分软质材料容易加工,如塑料和铝,但有些硬质材料很难加工,如不锈钢和钛合金。对于这些非常坚硬的金属,要加工就需要投入额外的成本,因此加工不锈钢比加工铝需要更长的时间,这样会大大增加产品的价格。对于部分产品而言,并非是对整个进行加工,产品的一部分可能无法加工,产品可加工的占比越少,则加工投入越少,产品的加工价格越低。具体的,产品可加工性可通过产品可加工部分的面积、重量或体积与相应的整个产品的面积、重量或体积的占比来体现,可对产品可加工性进行分级,从而体现为数据。

s300:将所述产品原始数据集划分为训练子集和测试子集,通过训练子集训练所述多线性回归模型,使用验证子集验证所述多线性回归模型的准确性,依据验证结果调整所述多线性回归模型,确定最终的多线性回归模型。

为了能够有效验证多线性回归模型的准确性,将产品原始数据集划分为训练子集和测试子集这两个子集,每个子集均包含多个产品的产品数据。这两个子集的划分取决于样本总数和实际模型的需要,某些模型需要大量数据来训练和优化,因此训练子集所包含的数据更多。变量较少的模型很容易验证和调整,对此可以减少验证集的数据,但如果模型有许多变量,就需要一个更大数据量的验证子集。对于上述多线性回归模型,可将训练子集和验证子集的数据按照8:2的比率进行划分。

通过训练子集训练多线性回归模型,使多线性回归模型基于该训练子集进行深度学习。验证子集用来验证多线性回归模型的准确性,并根据验证结果来调整多线性回归模型,使多线性回归模型更加趋于准确,从而得到最终的多线性回归模型,可使用该多线性回归模型来进行产品加工价格的预估。

在一种实施例中,步骤s300中,通过训练子集训练所述多线性回归模型,使用验证子集验证所述多线性回归模型的准确性的步骤,具体可通过如下方式实现:

由于产品表面积、产品x轴长度、产品y轴长度、产品z轴长度、产品加工复杂度、产品公差等级、刀具使用率、产品数量、材料密度、材料单价和产品可加工性均是产品加工前已确知的,唯一需要调整的为常数项。因此,通过训练子集训练得到多线性回归模型中常数项,进而得到已确定出常数项值的已确值多线性回归模型,将验证子集中的产品数据该已确值多线性回归模型中,该模型将输出产品的预估价格,通过预估价格与产品实际加工价格的对比来确定该多线性回归模型的准确性。预估价格与产品实际加工价格越接近,则准确性越高。

在一种实施例中,考虑到多线性回归模型难以百分百准确预估所有产品的加工价格,不能认为在预估价格与实际产品价格不同时,多线性回归模型就不准确,本实施例会设定一个预定差值,该预定差值通常是实际产品价格的一定比值,例如可以是5%-10%,在将验证子集中的产品数据代入已确定常数项值的多线性回归模型中后,计算该线性回归模型输出的价格值与验证子集中实际的价格值的差值,如果该差值大于预定差值,则认为多线性回归模型不准确,此时需要对进行调整多线性回归模型。对多线性回归模型的调整具体可通过如下方式实现:

分别通过训练子集和验证子集训练多线性回归模型,使多线性回归模型进行深度学习。从而可以训练得到两组常数项值,这两组常数项值会存在一定差异,分别将两组数值进行相应比对,设定一个差异阈值(通常可以是比对数据的5%-10%),当比对的数据的差值小于该差异阈值,则保留训练子集训练得到的相应数据,如果比对的数据的差值大于或等于该差异阈值,则依据训练子集和验证子集的数据量占比对两个数据进行加权计算,得到最终的数据。例如,如果训练子集训练得到的常数项值和验证子集训练得到的常数项值的差值小于差异阈值,则最终多线性回归模型中的常数项值为训练子集训练得到的常数项值。如果训练子集训练得到的常数项值和验证子集训练得到的常数项值的差值大于或等于差异阈值,计算训练子集和验证子集的数据量占比,例如是8:2,再进行加权计算x=x1*80%+x2*20%,x为最终的多线性回归模型中常数项值,x1为训练子集训练得到的常数项值,x2为验证子集训练得到的常数项值。

在一种实施例中,步骤s300之后,还包括如下步骤:建立测试数据集,使用测试数据集测试所述多线性回归模型的准确性。测试数据集是独立的数据集,不在产品原始数据集中,此数据集用于对最终模型进行再次评估,以进一步验证模型的准确性。

本发明实施例还提供一种基于多重回归模型的产品加工价格预估系统,如图3所示,包括:

数据收集模块100,用于收集多个产品数据,建立产品原始数据集,所述产品数据包括产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价、材料密度和价格;

模型建立模块200,用于依据所述产品原始数据集,建立多线性回归模型,所述多线性回归模型的公式为:

log(y)=β0+log(x1)+log(x2)+x3+x4+x5+x6+x7+x8+x9+x10+x11;

其中,y为价格,β0为常数项,x1-x11分别为产品数量、产品表面积、产品加工复杂度、产品x轴长度、产品y轴长度、产品z轴长度、刀具使用率、产品公差等级、产品可加工性、材料单价和材料密度;

验证确定模块300,用于将所述产品原始数据集划分为训练子集和测试子集,通过训练子集训练所述多线性回归模型,使用验证子集验证所述多线性回归模型的准确性,依据验证结果调整所述多线性回归模型,确定最终的多线性回归模型。

在一种实施例中,所述验证确定模块300用于通过训练子集训练得到多线性回归模型中的常数项,将验证子集中的产品数据代入已确定常数项值多线性回归模型中,依据该多线性回归模型的输出结果确定该多线性回归模型的准确性。

在一种实施例中,所述验证确定模块用于在将验证子集中的产品数据代入已确定常数项值的多线性回归模型中后,若该线性回归模型输出的价格值与验证子集中的价格值的差值大于预定差值,则依据该差值调整所述多线性回归模型。

在一种实施例中,所述基于多重回归模型的产品加工价格预估系统还包括数据测试模块,用于建立测试数据集,使用测试数据集测试所述多线性回归模型的准确性。

在一种实施例中,所述产品公差等级与产品公差值具有预设映射关系,所述产品加工复杂度为产品加工复杂等级,所述产品可加工性为产品可加工等级。

考虑到上述基于多重回归模型的产品加工价格预估系统部分为基于多重回归模型的产品加工价格预估方法部分所对应的装置类内容,上述基于多重回归模型的产品加工价格预估系统部分的实施例可参考基于多重回归模型的产品加工价格预估方法部分的实施例,在此不再赘述。

以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1