基于哈里斯鹰算法优化随机森林的良率预测方法及系统

文档序号:35466425发布日期:2023-09-16 06:08阅读:59来源:国知局
基于哈里斯鹰算法优化随机森林的良率预测方法及系统

本发明涉及大数据算法,尤其涉及一种基于哈里斯鹰算法优化随机森林的良率预测方法及系统。


背景技术:

1、在集成电路制造过程中,工艺参数是影响芯片表现的关键因素,工艺参数的异常会使得芯片性能下降,导致良率损失。为了全面地了解和监控制造工艺参数的影响,往往会在晶圆制造过程中进行大量的测试,以此有效地对制造过程中的工艺参数进行控制和改进,提高晶圆良率,降低芯片成本。

2、晶圆允收测试(wat)又称为电性测试(e-test),是一种重要的晶圆测试方式,其主要是在晶圆的划线槽空间制造一些特殊的测试结果,对晶圆上的芯片的电性参数进行测试,收集的晶圆电特性参数数据能间接地反映工艺参数。对于晶圆允收测试数据进行分析,能够有针对性地对ic制造过程中不好的工艺参数进行提升改进。在现有技术中,晶圆允收测试属于一种比较主流的测试方式,但是如何有效的对晶圆允收测试数据进行处理并且合理利用这些数据,一直是此技术领域的难题。其次,现有的算法模型存在准确度不高,数据处理量偏小等各种问题亟需克服。


技术实现思路

1、本发明针对现有技术中的缺点,提供了一种基于哈里斯鹰算法优化随机森林的良率预测方法及系统。

2、为了解决上述技术问题,本发明通过下述技术方案得以解决:

3、一种基于哈里斯鹰算法优化随机森林的良率预测方法,包括以下步骤:

4、获取历史晶圆允收测试数据集;

5、对历史晶圆允收测试数据集中的允收测试数据进行预处理,得到允收测试样本集;

6、通过哈里斯鹰算法迭代优化随机森林模型的关键框架参数并基于关键框架参数对随机森林模型进行修改,构建晶圆良率预测预训练模型;

7、基于允收测试样本集对晶圆良率测试预训练模型进行训练,得到晶圆良率预测模型;

8、将待测允收测试数据输入晶圆良率预测模型中,得到预测结果。

9、作为一种可实施方式,所述预处理至少包括异常值检测及处理、缺失值处理和数据归一化处理中的一种或多种。

10、作为一种可实施方式,所述缺失值处理包括缺失值删除或者缺失值填充;

11、所述缺失值填充包括:

12、基于平均值、众数、中位数对缺失值进行填充,或,建立预测模型对缺失值进行填充。

13、作为一种可实施方式,所述数据归一化处理包括标准归一化处理或最大最小值归一化处理。

14、作为一种可实施方式,所述通过哈里斯鹰算法迭代优化随机森林模型的关键框架参数并基于关键框架参数对随机森林模型进行修改,包括以下步骤:

15、预设哈里斯鹰算法的参数,包括种群数量、最大迭代次数、鹰群和猎物位置的变化范围及维度;

16、设置通过哈里斯鹰算法迭代优化随机森林算法的关键框架参数,所述关键框架参数至少包括最大弱学习器个数、决策树参数中的最大深度、最大特征数、内部节点再划分所需最小样本数和叶节点最少样本数;

17、分别初始化哈里斯鹰算法中鹰群与猎物的位置,选择随机森林算法的分类误差作为适应度函数,每次迭代中根据是否发现猎物、猎物的能量状态和适应度函数的大小选择不同的位置更新策略进行位置向量更新,当迭代次数达到预设的最大迭代次数时,完成优化,完成迭代后的位置向量即为优化后的关键框架参数;

18、其中,鹰群与猎物的位置均表示为一个1*dim大小的位置向量,dim表示维度,维度的大小代表需要优化的参数个数,在每次迭代过程中更新位置向量,所述位置向量通过所述关键框架参数构成,位置向量表示为:

19、xrb(t)=[x[0],x[1],x[2],x[3],x[4]]

20、其中,xrb(t)表示第t次迭代时的位置向量,t表示第t次迭代,x[0]表示最大弱学习器个数,x[1]表示决策树参数中的最大深度,x[2]表示最大特征数,x[3]表示内部节点再划分所需最小样本数,x[4]表示叶节点最少样本数。

21、作为一种可实施方式,所述适应度函数,表示如下:

22、f=1-auc score

23、其中,auc score表示评价指标。

24、作为一种可实施方式,所述哈里斯鹰算法,包括以下步骤:

25、在进行追逐前,根据下式确定猎物的逃逸能量:

26、

27、其中,e表示猎物的逃逸能量,t表示第t次迭代,t表示设置的最大迭代次数,e0表示(-1,1)之间的随机数;

28、当猎物的逃逸能量|e|≥1时,认为猎物逃逸能量较高,处于探索阶段,此时哈里斯鹰算法认为猎物体力充沛,鹰群在大范围内飞行寻找猎物,针对发现猎物和未发现猎物两种情况生成一个随机数q,根据q的大小选择不同策略更新下一次迭代的位置x(t+1);

29、当q≥0.5时,鹰群中任意一只个体都没有发现猎物的位置,根据下式随机选取鹰群中任意一只个体的飞行位置来更新自身位置:

30、x(t+1)=xrd(t)-r1|xrd(t)-2r2x(t)|

31、其中,xrd(t)表示第t次迭代时,从鹰群中随机挑选的一只鹰的位置,r1,r2为(0,1)之间的随机数;

32、当q<0.5时,鹰群发现猎物,鹰群中个体在其周围盘旋并更新位置,位置更新根据下式计算得出:

33、x(t+1)=(xrb(t)-xm(t))-r3[lb+r4(ub-lb)]

34、其中,xrb(t)表示第t次迭代时,猎物个体的位置,xm(t)表示第t次迭代时,鹰群中种群的平均位置;r3,r4表示(0,1)中的随机数;lb和ub分别表示位置的上界和下界,其中,xm(t)根据下式计算得出:

35、

36、其中,n表示种群数目,xi(t)表示第t次迭代时种群的位置;

37、当猎物的逃逸能量|e|<1时,进入从探索到开发的过渡阶段中,哈里斯鹰算法根据猎物的逃逸能量大小,从探索转移到开发阶段,并将选择不同的策略进行突袭;

38、当进入开发阶段,鹰群有四种不同的策略对猎物进行突袭,设r是猎物成功逃脱的概率;

39、当|e|≥0.5和r≥0.5时,鹰群针对猎物发起软围攻,位置更新根据下式计算得出:

40、x(t+1)=xrb(t)-x(t)-e|jxrb(t)-x(t)|

41、其中,xrb(t)表示第t次迭代时,猎物个体的位置,x(t)表示第t次迭代时,鹰群中个体的位置,j表示猎物随机跳跃强度,j根据下式计算得出:

42、j=2(1-r5)

43、其中,r5为(0,1)之间的随机数;

44、当|e|<0.5和r≥0.5时,鹰群发起硬围攻,位置更新根据下式计算得出:

45、x(t+1)=xrb(t)-e|xrb(t)-x(t)|

46、其中,xrb(t)表示第t次迭代时,猎物个体的位置,x(t)表示第t次迭代时,鹰群中个体的位置;

47、当|e|≥0.5和r<0.5时,鹰群发起渐进式俯冲软围攻,位置更新根据下式计算得出:

48、y=xrb(t)-e|jxrb(t)-x(t)|

49、z=y+s×lf(d)

50、

51、其中,xrb(t)表示第t次迭代时,猎物个体的位置,x(t)表示第t次迭代时,鹰群中个体的位置,j表示猎物随机跳跃强度,f表示适应度函数,s表示1*d维随机向量,lf(d)表示levy函数;

52、当|e|<0.5和r<0.5时,鹰群发起渐进式俯冲硬围攻,位置更新根据下式计算得出:

53、y=xrb(t)-e|jxrb(t)-xm(t)|

54、z=y+s×lf(d)

55、

56、其中,xrb(t)表示第t次迭代时,猎物个体的位置,xm(t)表示第t次迭代时,鹰群中种群的平均位置,j表示猎物随机跳跃强度,f表示适应度函数,s表示1*d维随机向量,lf(d)表示levy函数。

57、作为一种可实施方式,基于允收测试样本集对晶圆良率测试预训练模型进行训练,包括以下步骤:

58、将所述允收测试样本集划分为训练数据集、测试数据集和验证数据集;

59、基于所述训练数据集对晶圆良率测试预训练模型进行训练,基于所述验证数据集上对每次训练后的晶圆良率预测模型进行评价,终得到晶圆良率预测模型;

60、基于测试数据集对晶圆良率预测模型进行测试,输出对测试数据集中样本的晶圆良率预测结果。

61、一种基于哈里斯鹰算法优化随机森林的良率预测系统,包括数据处理模块、模型训练模块及预测评价模块;

62、所述数据处理模块,用于获取历史晶圆允收测试数据集;对历史晶圆允收测试数据集中的允收测试数据进行预处理,得到允收测试样本集;

63、所述模型训练模块,用于通过哈里斯鹰算法迭代优化随机森林模型的关键框架参数并基于关键框架参数对随机森林模型进行修改,构建晶圆良率预测预训练模型;基于允收测试样本集对晶圆良率测试预训练模型进行训练,得到晶圆良率预测模型;

64、所述预测评价模块,用于将待测允收测试数据输入晶圆良率预测模型中,得到预测结果。

65、一种基于哈里斯鹰算法优化随机森林的良率预测装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以上任意一项所述的方法。

66、一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机可读存储介质存储有执行以上任意一项所述的方法。

67、本发明由于采用了以上技术方案,具有显著的技术效果:

68、通过哈里斯鹰算法优化随机森林模型,得到晶圆良率预测模型,基于所述晶圆良率预测模型对所述晶圆的良率进行预测,降低了得到预测结果需要的人力及物力成本,与此同时,该模型也具有更高的预测准确度。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1