基于人工智能随机森林方法建立不同车型分零件远程定损系统及方法

文档序号:10687621阅读:435来源:国知局
基于人工智能随机森林方法建立不同车型分零件远程定损系统及方法
【专利摘要】基于人工智能随机森林方法建立不同车型分零件远程定损系统及方法,属于车辆定损领域,为了解决车辆碰撞后,对于零件检测的问题,技术要点是:零件检测子系统,判断车辆碰撞时零件所产生的损伤等级;所述零件检测子系统对零件训练数据进行学习从而生成零件模型,所述零件模型建立使用随机森林方法。效果是:上述技术方案,可以实现对于车辆碰撞的零件检测,在远程定损的这个技术领域使用了机器学习的方法,针对的机器学习方法,在定损过程中,判别的准确率上得以提升。
【专利说明】
基于人工智能随机森林方法建立不同车型分零件远程定损系统及方法
技术领域
[0001]本发明属于车辆定损领域,涉及一种基于人工智能随机森林方法建立不同车型分零件远程定损系统及方法。
【背景技术】
[0002]针对车辆在低速运动(包括低速道路行驶、车辆停靠等)过程中频发碰撞事故而导致的理赔纠纷问题,远程定损技术通过采集车辆行驶过程中的多种信号(如速度、加速度、角速度、声音等)并用信号处理和机器学习技术加以分析,以判断碰撞是否发生以及碰撞后车辆的损毁情况。
[0003]车辆发生碰撞事故后,前端设备能够检测出碰撞的发生并截取碰撞过程的信号,通过无线网络发送至云端,远程服务器从收到的信号中抽取出事先设计的特征值,用机器学习算法进行分析,先判断碰撞数据的准确性,再判断碰撞物体和工况情况,以确定碰撞数据集对什么零件产生了哪种等级的损伤,然后根据零件损伤等级计算出参考理赔金额并发送至保险公司。这期间会涉及对于车型、工况、目标、零件和区域的检测。

【发明内容】

[0004]为了解决车辆碰撞后,对于零件检测的问题,本发明提出了一种基于人工智能随机森林方法建立不同车型分零件远程定损系统及方法,以实现定损过程中的零件检测。
[0005]为了解决上述技术问题,本发明提供的技术方案的要点是:包括:
[0006]车型选择子系统,选择车辆所对应的车型数据作为总数据集;
[0007]数据分类子系统,读取CAE仿真数据和实车数据,并相应对数据进行分类;
[0008]碰撞检测子系统,判断车辆在行车过程中是否发生碰撞;所述碰撞检测子系统对碰撞训练数据进行学习从而生成碰撞模型,所述碰撞模型建立使用随机森林方法;
[0009]工况检测子系统,判断碰撞发生的所有工况信息;所述工况检测子系统对工况训练数据进行学习从而生成工况模型,所述工况模型建立使用随机森林方法;
[0010]零件检测子系统,判断车辆碰撞时零件所产生的损伤等级;所述零件检测子系统对零件训练数据进行学习从而生成零件模型,所述零件模型建立使用随机森林方法。
[0011 ]有益效果:上述技术方案,可以实现对于车辆碰撞的零件检测,在远程定损的这个技术领域使用了机器学习的方法,针对的机器学习方法,在定损过程中,判别的准确率上得以提升;本发明通过选择车型来导入该车型所对应的数据,而数据分类则是为了模型训练和测试的目的而加入的步骤;零件的检测是该方案实现的目的,是经过一系列操作所要得到的结果。
【附图说明】
[0012]图1为本发明所述的系统的结构示意框图。
【具体实施方式】
[0013]为了对本发明作出更为清楚的解释,下面对本发明涉及的技术术语作出定义:
[0014]工况:碰撞角度、方向、目标、区域等全体碰撞信息;
[0015]车型:汽车型号;
[0016]目标:碰撞目标;
[0017]区域:碰撞位置;
[0018]零件:汽车零件;
[0019]工况检测:检测本车碰撞角度、方向、目标、区域等全体碰撞信息;
[0020]车型检测:检测与本车发生碰撞的汽车型号;
[0021]目标检测:检测本车碰撞目标;
[0022]区域检测:检测本车碰撞位置;
[0023]零件检测:检测本车汽车零件。
[0024]实施例1:
[0025]—种基于人工智能随机森林方法建立不同车型分零件远程定损系统,包括:
[0026]车型选择子系统,选择车辆所对应的车型数据作为总数据集;
[0027]数据分类子系统,读取CAE仿真数据和实车数据,并相应对数据进行分类;
[0028]碰撞检测子系统,判断车辆在行车过程中是否发生碰撞;所述碰撞检测子系统对碰撞训练数据进行学习从而生成碰撞模型,所述碰撞模型建立使用随机森林方法;
[0029]工况检测子系统,判断碰撞发生的所有工况信息;所述工况检测子系统对工况训练数据进行学习从而生成工况模型,所述工况模型建立使用随机森林方法;
[0030]零件检测子系统,判断车辆碰撞时零件所产生的损伤等级;所述零件检测子系统对零件训练数据进行学习从而生成零件模型,所述零件模型建立使用随机森林方法。
[0031 ]所述碰撞检测子系统包括,碰撞训练模块、碰撞测试模块、碰撞验证模块,所述碰撞训练模块用于对碰撞训练数据进行学习从而生成碰撞模型,碰撞测试模块用于将碰撞测试数据带入碰撞模型中检测碰撞模型的结果,碰撞验证模块使用真实跑车数据验证碰撞模型的可靠性和准确率;
[0032]所述工况检测子系统包括,工况训练模块、工况测试模块、工况验证模块,所述工况训练模块用于对工况训练数据进行学习从而生成工况模型,所述工况测试模块用于将工况测试数据带入模型中检测工况模型的结果,工况验证模块使用真实跑车数据验证工况模型的可靠性和准确率;
[0033]所述零件检测子系统包括,零件训练模块、零件测试模块、零件验证模块,所述零件训练模块用于将零件训练数据进行学习从而生成零件模型,零件测试模块用于将零件测试数据带入模型中检测零件模型的结果,零件验证模块使用真实跑车数据验证零件模型的可靠性和准确率。
[0034]所述随机森林方法的步骤是:
[0035]步骤1.使用随机森林方法建立模型;
[0036]步骤2.使用随机森林的预测。
[0037]其中,所述步骤I包括:
[0038]步骤1.1.给定训练集S,测试集T,特征维数F;
[0039]确定参数:使用到的CART的数量t,每棵树的深度d,每个节点使用到的特征数量f;
[0040]终止条件:节点上最少样本数s,节点上最少的信息增益m;
[0041]对于第Ι-t 棵树,i = l_t:
[0042]步骤1.2.从S中有放回的抽取大小和S—样的训练集S( i),作为根节点的样本,从根节点开始训练;
[0043]步骤1.3.如果当前节点上达到终止条件,则设置当前节点为叶子节点;
[0044]如果是分类问题,该叶子节点的预测输出为当前节点样本集合中数量最多的那一类C( j),概率P为c( j)占当前样本集的比例;
[0045]如果是回归问题,预测输出为当前节点样本集各个样本值的平均值,然后继续训练其他节点;
[0046]如果当前节点没有达到终止条件,则从F维特征中无放回的随机选取f维特征,利用f维特征,寻找分类效果最好的一维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划分到左节点,其余的被划分到右节点,继续训练其他节点;有关分类效果的评判标准在后面会讲。
[0047]步骤1.4.重复步骤2至步骤3,直到所有节点都训练过了或者被标记为叶子节点。
[0048]步骤1.5.重复重复步骤2至步骤4,直到所有CART都被训练过;
[0049]所述步骤2包括,对于第Ι-t棵树,i = l_t,进行如下操作:
[OO5O ]步骤2.1.从当前树的根节点开始,根据当前节点的阈值t h,判断是进入左节点(〈th),还是进入右节点(> = th),直到到达某个叶子节点,并输出预测值;
[0051 ]步骤2.2.重复执行步骤2.1,直到所有的t棵树都输出了预测值;
[0052]如果是分类问题,则输出为所有树中预测概率总和最大的那一个类,即对每个c(j)的P进行累计;如果是回归问题,则输出为所有树的输出的平均值。
[0053]对于分类问题(将某个样本划分到某一类),也就是离散变量问题,CART使用Gini值作为评判标准。定义为Gini = 1-E (P( i )*P( i)),P( i)为当前节点上数据集中第i类样本的比例。例如:分为2类,当前节点上有100个样本,属于第一类的样本有70个,属于,第二类的样本有30个,则Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,类别分布越平均,Gini值越大,类分布越不均勾,Gini值,越小。在寻找最佳的分类特征和阈值时,评判标准为:argmax(Gin1-GiniLeft-GiniRight),即寻找最佳的特征f和阈值th,使,得当前节点的Gini值减去左子节点的Gini和右子节点的Gini值最大。
[0054]实施例2:
[0055]—种基于人工智能随机森林方法建立不同车型分零件远程定损方法,包括以下步骤:
[0056]步骤一.选择车辆所对应的车型数据作为总数据集;
[0057]步骤二.读取CAE仿真数据和实车数据,并相应对数据进行分类;
[0058]步骤三.判断车辆在行车过程中是否发生碰撞;所述碰撞检测子系统对碰撞训练数据进行学习从而生成碰撞模型,所述碰撞模型建立使用随机森林方法;
[0059]步骤四.判断碰撞发生的所有工况信息;所述工况检测子系统对工况训练数据进行学习从而生成工况模型,所述工况模型建立使用随机森林方法;
[0060]步骤五.判断车辆碰撞时零件所产生的损伤等级;所述零件检测子系统对零件训练数据进行学习从而生成零件模型,所述零件模型建立使用随机森林方法。
[0061]具体步骤是:
[0062]步骤三包括:
[0063]S3.1.使用碰撞检测子系统对CAE碰撞仿真数据处理,再对其进行分类以产生碰撞训练数据和碰撞测试数据;
[0064]S3.2.在碰撞训练模块中对碰撞训练数据进行学习并产生碰撞模型,来模拟碰撞训练数据的效果;
[0065]S3.3.在碰撞测试模块中使用碰撞测试数据来测试碰撞模型的结果;
[0066]S3.4.使用真实跑车数据作为碰撞验证数据并带入碰撞验证模块,来验证碰撞模型的准确性;
[0067]步骤四包括:
[0068]S4.1.使用工况检测子系统对CAE工况仿真数据处理,再对其进行分类产生工况训练数据和工况测试数据;
[0069]S4.2.在工况训练模块中对工况训练数据进行学习并产生工况模型,来模拟工况训练数据的效果;
[0070]S4.3.在工况测试模块中使用工况测试数据来测试工况模型的结果;
[0071]S4.4.使用真实跑车数据作为工况验证数据并带入工况验证模块,来验证工况模型的准确性;
[0072]步骤五包括:
[0073]S1.使用零件检测子系统对CAE零件仿真数据处理,再对其进行分类以产生零件训练数据和零件测试数据;
[0074]S2.在零件训练模块中对零件训练数据进行学习并产生零件模型,来模拟零件训练数据的效果;
[0075]S3.在零件测试模块中使用零件测试数据来测试零件模型的结果;
[0076]S4.使用真实跑车数据作为零件验证数据并带入零件验证模块,来验证零件模型的准确性。
[0077]所述随机森林方法的步骤是:
[0078]步骤1.使用随机森林方法建立模型;
[0079]步骤2.使用随机森林的预测。
[0080]其中,所述步骤I包括:
[0081 ]步骤1.1.给定训练集S,测试集T,特征维数F;
[0082]确定参数:使用到的CART的数量t,每棵树的深度d,每个节点使用到的特征数量f;
[0083]终止条件:节点上最少样本数s,节点上最少的信息增益m;
[0084]对于第Ι-t 棵树,i = l_t:
[0085]步骤1.2.从S中有放回的抽取大小和S—样的训练集S( i),作为根节点的样本,从根节点开始训练;
[0086]步骤1.3.如果当前节点上达到终止条件,则设置当前节点为叶子节点;
[0087]如果是分类问题,该叶子节点的预测输出为当前节点样本集合中数量最多的那一类C( j),概率P为c( j)占当前样本集的比例;
[0088]如果是回归问题,预测输出为当前节点样本集各个样本值的平均值,然后继续训练其他节点;
[0089]如果当前节点没有达到终止条件,则从F维特征中无放回的随机选取f维特征,利用f维特征,寻找分类效果最好的一维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划分到左节点,其余的被划分到右节点,继续训练其他节点。
[0090]步骤1.4.重复步骤2至步骤3,直到所有节点都训练过了或者被标记为叶子节点。[0091 ] 步骤1.5.重复重复步骤2至步骤4,直到所有CART都被训练过;
[0092]所述步骤2包括,对于第Ι-t棵树,i = l_t,进行如下操作:
[0093]步骤2.1.从当前树的根节点开始,根据当前节点的阈值th,判断是进入左节点(<th),还是进入右节点(> = th),直到到达某个叶子节点,并输出预测值;
[0094]步骤2.2.重复执行步骤2.1,直到所有的t棵树都输出了预测值;
[0095]如果是分类问题,则输出为所有树中预测概率总和最大的那一个类,即对每个c(j)的P进行累计;如果是回归问题,则输出为所有树的输出的平均值。
[0096]对于分类问题(将某个样本划分到某一类),也就是离散变量问题,CART使用Gini值作为评判标准。定义为Gini = 1-E (P( i )*P( i)),P( i)为当前节点上数据集中第i类样本的比例。例如:分为2类,当前节点上有100个样本,属于第一类的样本有70个,属于,第二类的样本有30个,则Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,类别分布越平均,Gini值越大,类分布越不均勾,Gini值,越小。在寻找最佳的分类特征和阈值时,评判标准为:argmax(Gin1-GiniLeft-GiniRight),即寻找最佳的特征f和阈值th,使,得当前节点的Gini值减去左子节点的Gini和右子节点的Gini值最大。
[0097]实施例3:
[0098]作为实施例1或2的进一步补充:对随机森林方法进行说明:
[0099]在机器学习中,随机森林由许多的决策树组成,因为这些决策树的形成采用了随机的方法,因此也叫做随机决策树。随机森林中的树之间是没有关联的。当测,试数据进入随机森林时,其实就是让每一颗决策树进行分类,最后取所有决策树中分类结果最多的那类为最终的结果。因此随机森林是一个包含多个决策树的分类,器,并且其输出的类别是由个别树输出的类别的众数而定。随机森林可以既可以处理属性为离散值的量,比如ID3算法,也可以处理属性为连续值的量,比如,C4.5算法。另外,随机森林还可以用来进行无监督学习聚类和异常点检测。
[0100]随机森林由决策树组成,决策树实际上是将空间用超平面进行划分的一种方法,每次分割的时候,都将当前的空间一分为二,比如说下面的决策树(其属性的值都是连续的实数):
[0101 ]随机深林的优点:比较适合做多分类问题;训练和预测速度快;对训练数据的容错能力,是一种有效地估计缺失数据的一种方法,当数据集中有大比例的数据缺失时,仍然可以保持精度不变;能够有效地处理大的数据集;可以处理没有删减的成千上万的变量;能够在分类的过程中可以生成一个泛化误差的内部无偏估计;能够检测到特征之间的相互影响以及重要性程度;不过出现过度拟合;实现简单容易并行化。
[0102]本发明使用随机森林方法建立模型方法,具体实现方法如下:
[0103]步骤1.给定训练集S,测试集T,特征维数F。确定参数:使用到的CART的数量t,每棵树的深度d,每个节点使用到的特征数量f,终止条件:节点上最少样本数S,节点上最少的信息增益m。
[0104]对于第l_t 棵树,i = l_t:
[0105]步骤2.从S中有放回的抽取大小和S—样的训练集S(i),作为根节点的样本,从根节点开始训练
[0106]步骤3.如果当前节点上达到终止条件,则设置当前节点为叶子节点,如果是分类问题,该叶子节点的预测输出为当前节点样本集合中数量最多的那一类c(j),,概率P为c(j)占当前样本集的比例;如果是回归问题,预测输出为当前节点样本集各个样本值的平均值。然后继续训练其他节点。如果当前节点没有达到终止条,件,则从F维特征中无放回的随机选取f维特征。利用这f维特征,寻找分类效果最好的一维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划,分到左节点,其余的被划分到右节点。继续训练其他节点。有关分类效果的评判标准在后面会讲。
[0107]步骤4.重复(2)(3)直到所有节点都训练过了或者被标记为叶子节点。
[0108]步骤5.重复(2),(3),(4)直到所有CART都被训练过。
[0109]利用随机森林的预测过程如下:
[0110]对于第ι-t 棵树,i = l_t:
[0?11 ]步骤1.从当前树的根节点开始,根据当前节点的阈值th,判断是进入左节点(〈th)还是进入右节点(> = th),直到到达,某个叶子节点,并输出预测值。
[0112]步骤2.重复执行(I)直到所有t棵树都输出了预测值。如果是分类问题,则输出为所有树中预测概率总和最大的那一个类,即对每个c(j)的P进行累计;如果是回归问题,则输出为所有树的输出的平均值。
[0113]注:有关分类效果的评判标准,因为使用的是CART,因此使用的也是CART的评判标准,和C3.0,C4.5都不相同。
[0114]对于分类问题(将某个样本划分到某一类),也就是离散变量问题,CART使用Gini值作为评判标准。定义为Gini = 1-, Σ (P(i)*P(i)),P(i)为当前节点上数据集中第i类样本的比例。例如:分为2类,当前节点上有100个样本,属于第一类的样本有70个,属于,第二类的样本有30个,则Gini = 1-0.7 X 07-0.3X03 = 0.42,可以看出,类别分布越平均,Gini值越大,类分布越不均勾,Gini值,越小。在寻找最佳的分类特征和阈值时,评判标准为:argmax(Gin1-GiniLeft-GiniRight),即寻找最佳的特征f和阈值th,使,得当前节点的Gini值减去左子节点的Gini和右子节点的Gini值最大。
[0115]实施例4:具有与实施例1或2或3相同的技术方案,更为具体的是:
[0116]上述方案中的总体数据集:全部是CAE仿真数据和跑车数据;分为三份如下
[0117]1.训练数据集:是用来训练模型或确定模型参数(CAE仿真数据和跑车数据)。
[0118]2.验证数据集:是用来做模型选择(model ,select1n),即做模型的最终优化及确定的(CAE仿真数据和跑车数据)。
[0119]3.测试数据集:则纯粹是为了测试已经训练好的模型的推广能力。(CAE仿真数据和跑车数据)。
[0120]本实施例中还对定损过程中涉及的滤波、加权选取、特征提取、归一化、特征变换作出了说明。
[0121]1.滤波器技术:已实现的滤波方法包括FIR滤波、FIR切比雪夫逼近法、切比雪夫滤波、巴特沃兹滤波等,在主程序的Filtering.m文件实现。各滤波器均为常见的滤波器,Matlab都有相应的函数实现,具体算法可参考信号处理专业书籍。此处给出FIR滤波器的内容和流程的介绍。
[0122]有限冲击响应数字滤波器(FIR,Finite,Impulse,Response)是一种全零点的系统,FIR滤波器的设计在保证幅度特性满足技术要求的同事,很容易做到严格的线性相位特性,所以据有稳定和线性相位特性是FIR滤波器的突出优点。切比雪夫逼近法是一种等波纹逼近法,能够使误差频带均匀分布,对同样的技术指标,这种比肩发需要的滤波器阶数低,对于同样阶数的滤波器,这种逼近法最大误差最小,其设计的主要步骤如下:
[0123]步骤1:滤波器参数的设置
[0124]滤波器的参数包括:通带截止频率、阻带截止频率、通带最大衰减和阻带最小衰减;
[0125]步骤2:设置在通带和阻带上理想的幅频响应
[0126]步骤3:给定在通带截止频率和阻带截止频率点上的加权
[0127]步骤4:利用方程计算切比雪夫逼近法滤波器系数
[0128]步骤5:保存系数
[0129]步骤6:提取系数进行数据滤波
[0130]其中:滤波器参数的设置是为了保证信号在进行处理的过程中不会出现失真现象,滤波后的信号的截止频率和采样频率需要满足奈奎斯特定理,也就是在滤波后信号的最高频率不能超过原信号采样频率的1/2,否则就会出现漏频现象。根据目前项目中的信号采集板的采样频率主要是50Hz和IKHz,以50Hz为例根据公式F#±,〈50/2,故选择滤波器截止频率在25以下。
[0131]2.特征提取技术:特征抽取是在碰撞信号上进行的。判断碰撞使用的特征包括窗口内加速度绝对值的最大值、窗口内加速度最大值与最小值之间的差值、窗口内加速度的平均能量(窗口内所有点的加速度的平方和除以点数)、窗口内各点斜率的绝对值的平均值。
[0132]判断零件种类所使用的特征包括速度、加速度最大值到最小值之间的平均能量、最大值和最小值之间的幅值,/,两者之间的宽度、加速度最大值、加速度最小值、最大值所在半波的宽度、最小值所在半波的宽度、最大值和最小值之间的差值、最大值到最小值之间的跨度、各点斜率的绝对值的平均值、信号进行傅立叶变换后O?38频率范围内的信号的各个频率分量的幅值。
[0133]3.归一化技术:为了消除特征之间的量纲或数量级不同而对分类任务造成的不利影响,需要对特征数据进行归一化处理,使得各特征值之间具有可比性,避免数值较大的特征淹没数值较小的特征。原始的特征数据经过归一化处理后,各特征处于相同的值域范围。由于Z-Score的性能表现更好,使用Z-Score做为归一化方法。
[0134]4.特征变换技术:在特征较多的情况下,为了消除特征之间的相关性并减少冗余特征,需要对特征进行变换,用尽可能少的新特征来反映样本信息。在实验样本较少的情况下(本项目的实际情况)降低过多的特征维数,还能在一定程度上避免过拟合或欠拟合的发生。根据实际需要,目前已实现的特征变换是PCA。通过实验发现,PCA对于提高本项目的分类性能并无帮助,甚至还有所下降,这是由于目前所使用的特征较少,没有冗余特征,因此暂不使用PCA,但是随着后续特征的逐步增加,不排除以后使用PCA的可能性。
[0135]附图1中,记载的:车型选择即为本发明中的车型选择子系统;数据分类模块即为本发明中的数据分类子系统;碰撞判断模块即为本发明中的碰撞检测子系统;工况检测模块即为本发明的工况检测子系统;车型检测模块即为本发明的车型检测子系统;零件检测模块即零件检测子系统;目标检测模块即为本发明的目标检测子系统,区域检测模块即为本发明的区域检测子系统。
[0136]以上所述,仅为本发明创造较佳的【具体实施方式】,但本发明创造的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明创造披露的技术范围内,根据本发明创造的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明创造的保护范围之内。
【主权项】
1.一种基于人工智能随机森林方法建立不同车型分零件远程定损系统,其特征在于,包括: 车型选择子系统,选择车辆所对应的车型数据作为总数据集; 数据分类子系统,读取CAE仿真数据和实车数据,并相应对数据进行分类; 碰撞检测子系统,判断车辆在行车过程中是否发生碰撞;所述碰撞检测子系统对碰撞训练数据进行学习从而生成碰撞模型,所述碰撞模型建立使用随机森林方法; 工况检测子系统,判断碰撞发生的所有工况信息;所述工况检测子系统对工况训练数据进行学习从而生成工况模型,所述工况模型建立使用随机森林方法; 零件检测子系统,判断车辆碰撞时零件所产生的损伤等级;所述零件检测子系统对零件训练数据进行学习从而生成零件模型,所述零件模型建立使用随机森林方法。2.如权利要求1所述的基于人工智能随机森林方法建立不同车型分零件远程定损系统,其特征在于, 所述碰撞检测子系统包括,碰撞训练模块、碰撞测试模块、碰撞验证模块,所述碰撞训练模块用于对碰撞训练数据进行学习从而生成碰撞模型,碰撞测试模块用于将碰撞测试数据带入碰撞模型中检测碰撞模型的结果,碰撞验证模块使用真实跑车数据验证碰撞模型的可靠性和准确率; 所述工况检测子系统包括,工况训练模块、工况测试模块、工况验证模块,所述工况训练模块用于对工况训练数据进行学习从而生成工况模型,所述工况测试模块用于将工况测试数据带入模型中检测工况模型的结果,工况验证模块使用真实跑车数据验证工况模型的可靠性和准确率; 所述零件检测子系统包括,零件训练模块、零件测试模块、零件验证模块,所述零件训练模块用于将零件训练数据进行学习从而生成零件模型,零件测试模块用于将零件测试数据带入模型中检测零件模型的结果,零件验证模块使用真实跑车数据验证零件模型的可靠性和准确率。3.如权利要求1或2所述的基于人工智能随机森林方法建立不同车型分零件远程定损系统,其特征在于,所述随机森林方法的步骤是: 步骤I.使用随机森林方法建立模型; 步骤2.使用随机森林的预测。4.如权利要求3所述的基于人工智能随机森林方法建立不同车型分零件远程定损系统,所述步骤I包括: 步骤1.1.给定训练集S,测试集T,特征维数F,确定以下参数:使用到的CART的数量t,每棵树的深度d,每个节点使用到的特征数量f; 确定终止条件:节点上最少样本数S,节点上最少的信息增益m; 对于第1-t棵树,i = Ι-t: 步骤1.2.从训练集S中有放回的抽取大小和训练集S—样的训练集S( i),作为根节点的样本,从根节点开始训练; 步骤1.3.如果当前节点上达到终止条件,则设置当前节点为叶子节点; 如果是分类问题,该叶子节点的预测输出为当前节点样本集合中数量最多的那一类c(j),概率P为C( j)占当前样本集的比例; 如果是回归问题,预测输出为当前节点样本集各个样本值的平均值,然后继续训练其他节点; 如果当前节点没有达到终止条件,则从F维特征中无放回的随机选取f维特征,利用f维特征,寻找分类效果最好的一维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划分到左节点,其余的被划分到右节点,继续训练其他节点; 步骤1.4.重复步骤1.2至步骤1.3,直到所有节点都训练过了或者被标记为叶子节点; 步骤1.5.重复重复步骤1.2至步骤1.4,直到所有CART都被训练过。5.如权利要求3所述的基于人工智能随机森林方法建立不同车型分零件远程定损系统,其特征在于,所述步骤2,对于第1-t棵树,i = 1-t,进行如下操作: 步骤2.1.从当前树的根节点开始,根据当前节点的阈值th,判断是进入左节点(〈th),还是进入右节点(> = th),直到到达某个叶子节点,并输出预测值; 步骤2.2.重复执行步骤2.1,直到所有的t棵树都输出了预测值; 如果是分类问题,则输出为所有树中预测概率总和最大的那一个类,即对每个c(j)的P进行累计;如果是回归问题,则输出为所有树的输出的平均值。6.—种基于人工智能随机森林方法建立不同车型分零件远程定损方法,其特征在于,包括以下步骤: 步骤一.选择车辆所对应的车型数据作为总数据集; 步骤二.读取CAE仿真数据和实车数据,并相应对数据进行分类; 步骤三.判断车辆在行车过程中是否发生碰撞;对碰撞训练数据进行学习从而生成碰撞模型,所述碰撞模型建立使用随机森林方法; 步骤四.判断碰撞发生的所有工况信息;对工况训练数据进行学习从而生成工况模型,所述工况模型建立使用随机森林方法; 步骤五.判断车辆碰撞时零件所产生的损伤等级;对零件训练数据进行学习从而生成零件模型,所述零件模型建立使用随机森林方法。7.如权利要求6所述的基于人工智能随机森林方法建立不同车型分零件远程定损方法,其特征在于,具体步骤是: 步骤三包括: 53.1.使用碰撞检测子系统对CAE碰撞仿真数据处理,再对其进行分类以产生碰撞训练数据和碰撞测试数据; 53.2.在碰撞训练模块中对碰撞训练数据进行学习并产生碰撞模型,来模拟碰撞训练数据的效果; 53.3.在碰撞测试模块中使用碰撞测试数据来测试碰撞模型的结果; 53.4.使用真实跑车数据作为碰撞验证数据并带入碰撞验证模块,来验证碰撞模型的准确性; 步骤四包括: 54.1.使用工况检测子系统对CAE工况仿真数据处理,再对其进行分类产生工况训练数据和工况测试数据; 54.2.在工况训练模块中对工况训练数据进行学习并产生工况模型,来模拟工况训练数据的效果; 54.3.在工况测试模块中使用工况测试数据来测试工况模型的结果; 54.4.使用真实跑车数据作为工况验证数据并带入工况验证模块,来验证工况模型的准确性; 步骤五包括: 51.使用零件检测子系统对CAE零件仿真数据处理,再对其进行分类以产生零件训练数据和零件测试数据; 52.在零件训练模块中对零件训练数据进行学习并产生零件模型,来模拟零件训练数据的效果; 53.在零件测试模块中使用零件测试数据来测试零件模型的结果; 54.使用真实跑车数据作为零件验证数据并带入零件验证模块,来验证零件模型的准确性。8.如权利要求6或7所述的基于人工智能随机森林方法建立不同车型分零件远程定损方法,其特征在于,所述随机森林方法的步骤是: 步骤I.使用随机森林方法建立模型; 步骤2.使用随机森林的预测。9.如权利要求8所述的基于人工智能随机森林方法建立不同车型分零件远程定损方法,所述步骤I包括: 所述步骤I包括: 步骤1.1.给定训练集S,测试集T,特征维数F,确定以下参数:使用到的CART的数量t,每棵树的深度d,每个节点使用到的特征数量f; 确定终止条件:节点上最少样本数S,节点上最少的信息增益m; 对于第1-t棵树,i = Ι-t: 步骤1.2.从训练集S中有放回的抽取大小和训练集S—样的训练集S( i),作为根节点的样本,从根节点开始训练; 步骤1.3.如果当前节点上达到终止条件,则设置当前节点为叶子节点; 如果是分类问题,该叶子节点的预测输出为当前节点样本集合中数量最多的那一类c(j),概率P为C( j)占当前样本集的比例; 如果是回归问题,预测输出为当前节点样本集各个样本值的平均值,然后继续训练其他节点; 如果当前节点没有达到终止条件,则从F维特征中无放回的随机选取f维特征,利用f维特征,寻找分类效果最好的一维特征k及其阈值th,当前节点上样本第k维特征小于th的样本被划分到左节点,其余的被划分到右节点,继续训练其他节点; 步骤1.4.重复步骤1.2至步骤1.3,直到所有节点都训练过了或者被标记为叶子节点; 步骤1.5.重复重复步骤1.2至步骤1.4,直到所有CART都被训练过。10.如权利要求8所述的基于人工智能随机森林方法建立不同车型分零件远程定损方法,其特征在于,所述步骤2,对于第1-t棵树,i = 1-t,进行如下操作: 步骤2.1.从当前树的根节点开始,根据当前节点的阈值th,判断是进入左节点(〈th),还是进入右节点(> = th),直到到达某个叶子节点,并输出预测值; 步骤2.2.重复执行步骤2.1,直到所有的t棵树都输出了预测值; 如果是分类问题,则输出为所有树中预测概率总和最大的那一个类,即对每个c(j)的P进行累计;如果是回归问题,则输出为所有树的输出的平均值。
【文档编号】G06K9/62GK106056150SQ201610365554
【公开日】2016年10月26日
【申请日】2016年5月27日
【发明人】田雨农, 刘俊俍
【申请人】大连楼兰科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1