一种基于机器学习的集成电路芯片寿命的评估方法与系统与流程

文档序号:30613465发布日期:2022-07-02 00:18阅读:416来源:国知局
一种基于机器学习的集成电路芯片寿命的评估方法与系统与流程

1.本发明涉及一种集成电路芯片寿命评估方法与系统,属于半导体失效分析技术领域。


背景技术:

2.电子设备在军事及航空航天领域应用越来越广泛,其可靠性要求也不断提高。随着集成电路的设计技术和制造水平的提升,大型电子设备集成度越来越高,功能越来越复杂。随着电子芯片技术也得到迅猛的发展,cmos器件工艺特征尺寸越来越小型化、集成化,互联结构失效和热应力问题成为纳米集成电路设计中最具挑战的问题。集成密度和功耗的增加导致更高的芯片温度、芯片温度梯度和越加复杂的互联结构失效,进而影响其可靠性。因此,有必要对集成电路芯片的寿命进行评估。
3.传统寿命评估试验方法一般采取温度、湿度或温循等应力作为加速条件,通过加速寿命试验,定期对器件参数进行测量,根据阶段性测量数据大致得到器件失效时间,进而进行数据统计分析,通过不同梯度试验条件的寿命分布模型推算经验加速因子,进而估算正常条件下的加速寿命;或采用加速退化实验,定期检测互连结构剪切强度,计算互连结构伪寿命,后结合失效机理加速模型推出正常使用环境下封装体的寿命。利用此类方法对集成电路芯片进行寿命评估具有估算误差大,估算效率低的问题。
4.1)估算误差大:定期检测封装体敏感参数,获取参数退化趋势,根据参数趋势仿真拟合出最终失效时间,并非是真实芯片互连结构失效时间,其寿命估算结果与粗略的参数趋势拟合方法直接相关,因此估算误差较大;从仿真寿命分布模型中推算得平均寿命,不具备高可靠检验要求,以此平均寿命计算的正常寿命存在可信度不足;采用基于仿真寿命分布得到的特征寿命推算加速因子,没有考虑失效机理的关键影响性,仅通过传统的数据统计分析可靠性预计方法不具备科学性;或直接采用代入粗略估计参数的失效机理加速模型计算互连结构在正常使用条件下的寿命,适用性及准确度不足;
5.2)评估效率低:对芯片寿命仿真过程要通过有限样本芯片的寿命试验,获取相关实验数据,形成有限个寿命分布,根据粗略估计寿命,代入复杂的电迁移模型,开裂模型和热/振动疲劳模型等失效机理加速模型,计算互连结构在正常使用条件下的寿命。仿真过程耗费大量人力物力和时间,复杂失效物理模型组求解困难。
6.因此,此类方法不能准确且高效地评估集成电路芯片互连结构的寿命。


技术实现要素:

7.本发明所要解决的技术问题是:为克服传统加速寿命试验或加速退化实验在评估封装互连结构时存在的监测数据误差较大、平均寿命可靠度不合理、加速模型适用性不足的问题,本发明提出一种基于多材料叠层芯片结构建模机器学习技术的芯片寿命评估方法与系统,该方法可更加准确、有针对性的评估集成电路芯片的寿命。
8.本发明采用的技术方案是:一种基于机器学习的集成电路芯片寿命的评估方法,
包括:
9.步骤一、根据寿命试验记录集成电路芯片的真实数据集{ci,y
′i}并建立寿命分布函数;其中,yi′
为集成电路芯片的相关参数对应的集成电路芯片真实寿命值;
10.步骤二、根据集成电路芯片的使用环境工况,在使用环境工况对应的相关参数的参数范围内,随机生成n组参数组,模拟实际可能出现的各种使用环境情况,利用寿命分布函数求得相应的仿真寿命值,将仿真数据集表示为{ci,yi},i=1,...,n;n为正整数;其中,ci为集成电路芯片的相关参数,yi为相应的集成电路芯片仿真寿命值;
11.合并真实数据集和仿真数据集,组成训练优化机器学习回归模型的原数据集;
12.步骤三、对于所述原数据集中的参数型数据,通过特征提取得到参数型特征向量;
13.对于芯片多层纵向剖面物理结构,采用多材料叠层结构建模方法形成三维芯片结构的二维结构连接图;使用威斯费乐-莱曼迭代算法将二维结构连接图转换为特征向量,形成芯片的结构特征向量;
14.步骤四、合并参数型特征向量和结构特征向量,组成全特征向量集输入机器学习回归模型中进行模型融合,得到融合回归模型;
15.步骤五、将所述原数据集的a%作为训练集,剩下100%-a%作为测试集,将作为训练集的数据带入融合回归模型中得到预测值,利用多个损失函数优化融合回归模型的准确率,得到优化后的融合回归模型;利用测试集,带入优化后的融合回归模型中,检测准确率,最终形成端到端的芯片寿命预测模型,a为设定值。
16.所述多材料叠层结构建模方法将多元素叠层的芯片结构建模形成节点连接图,具体建模方式为:
17.将不同层不同元素区域抽象简化为一个节点,将不同元素区域的相邻关系抽象为无向边,使得代表不同元素的节点相互连接,将三维芯片结构建模为二维结构连接图模型;具体步骤如下:
18.a.将芯片多层纵向剖面物理结构中的所有元素依次标号;
19.b.识别出芯片多层纵向剖面物理结构每一层中的相同元素的连通区域,抽象成连接图中的一个节点,并且将这个节点标记成其元素对应的标号;两个相同元素连通区域如果接触的话,在连接图中的相对应的两个节点间添加一条无向边。
20.使用威斯费乐-莱曼迭代算法将二维结构连接图转换为特征向量,形成芯片的结构特征向量的具体步骤如下:
21.s3.1、得到所述二维结构连接图中每个节点的相邻节点;得到每个节点的相邻节点元素的标记,将所述标记放到一个无序列表li内;将该节点的元素放到所述无限列表li中;
22.s3.2、对于每个节点,根据s3.1中得到的无序列表li进行编码;
23.s3.3、统计所述二维结构连接图中每个编码的数量,将各编码有序排列以后形成结构特征向量。
24.所述机器学习回归模型如下:
[0025][0026]
其中,y是集成电路芯片的寿命,是特征提取以后得到的全特征向量。
[0027]
所述步骤四中,将全特征集送入k种机器学习算法组成的融合回归模型,通过重复
k次的有放回抽样,训练k个子模型,每次随机抽样训练1个模型,对k个模型结果进行voting/averaging融合;k为正整数,当k=1时,只使用一个模型,voting/averaging方法不变。
[0028]
一种根据上述基于机器学习的集成电路芯片寿命评估方法的评估系统,包括数据采集模块、数据存储模块、算法应用模块、显示模块:
[0029]
数据采集模块,根据寿命试验记录集成电路芯片的真实数据集{ci,y
′i}并建立寿命分布函数;
[0030]
根据集成电路芯片的使用环境工况,在使用环境工况对应的相关参数的参数范围内,随机生成n组参数组,模拟实际可能出现的各种使用环境情况,利用寿命分布函数求得相应的仿真寿命值,将仿真数据集表示为{ci,yi},i=1,...,n;n为正整数;
[0031]
合并真实数据集和仿真数据集,组成训练优化机器学习回归模型的原数据集,发送至数据存储模块进行存储;
[0032]
其中,yi′
为集成电路芯片的相关参数对应的集成电路芯片真实寿命值;ci为集成电路芯片的相关参数,yi为相应的集成电路芯片仿真寿命值;
[0033]
算法应用模块,读取数据存储模块中存储的所述原数据集,将所述原数据集中的参数型数据通过特征提取得到参数型特征向量;
[0034]
对于芯片多层纵向剖面物理结构,采用多材料叠层结构建模方法形成三维芯片结构的二维结构连接图;使用威斯费乐-莱曼迭代算法将二维结构连接图转换为特征向量,形成芯片的结构特征向量;
[0035]
合并参数型特征向量和结构特征向量,组成全特征向量集输入机器学习回归模型中进行模型融合,得到融合回归模型;
[0036]
将所述原数据集的a%作为训练集,剩下100%-a%作为测试集,将作为训练集的数据带入融合回归模型中得到预测值,利用多个损失函数优化融合回归模型的准确率,得到优化后的融合回归模型;利用测试集,带入优化后的融合回归模型中,检测准确率,最终形成端到端的芯片寿命预测模型;
[0037]
显示模块用于显示算法应用模块发送的数据,包括芯片寿命预测模型的准确率和芯片寿命预测值。
[0038]
本发明与现有技术相比的优点在于:
[0039]
(1)精确集成电路芯片寿命估计,具体表现在:机器学习算法的输入数据为结合实验数据与仿真数据的全数据集,一方面解决真实数据集样本不足的问题,另一方面克服上述寿命分布粗略估计和失效物理模型参数拟合导致的寿命估计不准确的问题。大幅降低对传统统计分析和模型估计的精度要求,生成仿真数据,使用真实数据进行机器学习模型的修正,增加模型准确度和鲁棒性;基于一种多材料叠层结构建模方法,融合威斯费乐-莱曼迭代算法,将芯片结构的信息准确地作为特征输入机器学习模型,极大地提升了模型预测准确率。
[0040]
(2)本发明能够进行超高效率的集成电路芯片寿命估计:本发明集成数据采集模块、数据存储模块、算法应用模块、显示模块,最终形成集成电路芯片寿命预测系统,完成从参数输入端到寿命输出端的“端到端”的直接寿命预测通路,不仅解决了传统实验方法为获得精确结果造成的高成本问题,而且完全代替传统仿真方法,突破仿真反复多次耗时费力
的局限性,预测速度提升至秒级,大幅提高集成电路芯片寿命预测的效率。
附图说明
[0041]
图1为芯片分层结构示意图;
[0042]
图2为芯片结构建模示意图;
[0043]
图3为机器学习算法流程图;
[0044]
图4为本发明的方法流程图。
具体实施方式
[0045]
下面结合附图具体说明一下实施方式。
[0046]
如图4所示,一种基于机器学习的集成电路芯片寿命的评估方法,包括步骤如下:
[0047]
一、数据采集
[0048]
数据源由两部分组成:寿命试验记录的真实数据集,以及根据真实数据建立寿命分布函数产生的仿真数据;
[0049]
仿真寿命值利用寿命分布函数在相关参数的波动范围随机生成n组(例如n=5000),每组数据包含芯片的相关参数数据表示为ci,相应的芯片寿命记为yi,将仿真数据集表示为{ci,yi},i=1,...,n。同时,将试验真实数据集按相同方式表示,合并真实和仿真数据集,组成训练优化机器学习回归模型的原数据集。
[0050]
二、特征提取
[0051]
特征提取是从每个芯片数据ci中提取与芯片寿命相关的一组特征的过程。这组特征通常被收集在一个向量中,称作特征向量,记作本发明中的特征大致分为两类:参数型与结构型。下面详细介绍这两类特征。
[0052]
1.参数型
[0053]
这类特征往往是描述芯片特性的一些参数。包括但不限于:
[0054]
环氧胶覆盖宽度,凸点排布方式,凸点数量,金线相对疲劳系数,器件热膨胀系数(/k),金线相对疲劳系数,基板热膨胀系数(/k)等等。
[0055]
2.结构型
[0056]
这类特征是用来表示芯片结构的特征。下面详细介绍结构型特征的提取方法。
[0057]
首先如图1所示,芯片一般是分层结构,每一层的不同区域包含不同元素。
[0058]
按照如下方法对这种结构建模,将芯片结构转换为一个图:
[0059]
(1)将每一层元素相同的区域当作图里的一个节点,并且用元素标记这个节点;
[0060]
(2)每一个元素区域如果和其他元素区域接触的话,则相对应的节点之间建立一条边;
[0061]
这样,对于每一个芯片,我们都能得到一个图来反映芯片的结构特征。
[0062]
图2显示的是图1的芯片结构按照我们的方法得到的图。
[0063]
三、结构特征转换
[0064]
使用威斯费乐-莱曼迭代算法将一个图转换为特征向量。
[0065]
以图2为例。我们进行如下处理,中间结果放在表1中
[0066]
(1)对于每一个节点,列出自己的节点元素标记。如表1第二列所示。
[0067]
(2)对于每一个节点,列出所有相邻节点的元素标记。如表1第三列所示。
[0068]
(3)根据第二列和第三列的组合进行编码。主语第三列每一行如果是多个元素的话,顺序无影响。
[0069]
(4)对于每一个结构图,统计表1第四列每种编码的个数。比如按照(h1,h2,h3,h4,h5)的顺序统计的话。图2中的图可以表示成(1,4,5,3,1,1)。这个向量就是得到的结构特征向量。
[0070]
表1威斯费乐-莱曼迭代算法中间结果
[0071][0072][0073]
最后,把参数型特征和结构型特征连接在一起就可以作为最终得到的特征
[0074]
四、机器学习算法的流程
[0075]
如图3所示,本发明的机器学习算法由训练和预测两部分构成。
[0076]
训练的过程是用历史数据通过特征提取之后得到一个回归模型的过程。对于训练数据,假设收集了n组数据,这些数据可以来自实验也可以来自仿真。每组数据包含芯片的相关数据c,以及相应的芯片寿命y。为了简便,可以将训练数据集表示为{ci,yi},i=1,...,n;n为正整数;
[0077]
预测的过程是对于新的芯片相关数据c
new
,经过与训练过程相同的特征提取方法,将得到的特征输入训练过程的到的回归模型,从而得到寿命的预测。
[0078]
五、回归模型
[0079]
回归模型是为了建模模型。在本发明中,y指的是芯片的寿命,是特征提取以后得到的特征向量。
[0080]
在本发明中,任何回归模型都可使用。包括但不限于:线性回归,贝叶斯回归,决策树,随机森林,梯度提升树,神经网络。通过重复k次的有放回抽样,训练k个子模型(每次随机抽样训练1个模型),对k个模型结果进行voting/averaging融合。k为正整数,当k=1时,只使用一个模型,voting/averaging方法不变。
[0081]
回归模型训练算法使用训练数据集得到可以较为准确预测新数据的模型。通常是先定义一个基于训练数据的损失函数,然后使用数值优化算法求出一组模型参数使得损失函数最小。对于一种模型,可以根据需求定义多种损失函数,并且根据需求使用多种数值优化算法。
[0082]
比如,对于线性回归模型,模型训练就是使得特征向量的加权组合的结果xθ与真实的芯片寿命y最接近,具体可以归结为如下无约束优化问题:
[0083]
对所有θ,求(xθ-y)2最小值;
[0084]
其中,是特征提取以后得到的特征向量,y指的是芯片的寿命,θ是个特征向量占比权重,i=1,2,3,

,n;n为正整数。
[0085]
或者转换为带惩罚项ρθ2的优化问题,ρ是惩罚项权重:
[0086]
最小化(xθ-y)2+ρθ2。
[0087]
可以使用的数值优化算法包括但不限于:梯度下降,随机梯度下降等。
[0088]
六、系统架构
[0089]
一种基于机器学习的集成电路芯片寿命的评估系统,包括数据采集模块、数据存储模块、算法应用模块、显示模块:
[0090]
数据采集模块,根据寿命试验记录集成电路芯片的真实数据集{ci,y
′i}并建立寿命分布函数;根据集成电路芯片的使用环境工况,在使用环境工况对应的相关参数的参数范围内,随机生成n组参数组,模拟实际可能出现的各种使用环境情况,利用寿命分布函数求得相应的仿真寿命值,将仿真数据集表示为{ci,yi},i=1,...,n;n为正整数;合并真实数据集和仿真数据集,组成训练优化机器学习回归模型的原数据集,发送至数据存储模块进行存储;
[0091]
其中,yi′
为集成电路芯片的相关参数对应的集成电路芯片真实寿命值;ci为集成电路芯片的相关参数,yi为相应的集成电路芯片仿真寿命值;
[0092]
算法应用模块,用于读取数据存储模块中存储的所述原数据集,将所述原数据集中的参数型数据通过特征提取得到参数型特征向量;
[0093]
对于芯片多层纵向剖面物理结构,采用多材料叠层结构建模方法形成三维芯片结构的二维结构连接图;使用威斯费乐-莱曼迭代算法将二维结构连接图转换为特征向量,形成芯片的结构特征向量;
[0094]
合并参数型特征向量和结构特征向量,组成全特征向量集输入机器学习回归模型中进行模型融合,得到融合回归模型;
[0095]
将所述原数据集的a%作为训练集,剩下100%-a%作为测试集,将作为训练集的数据带入融合回归模型中得到预测值,利用多个损失函数优化融合回归模型的准确率,得
到优化后的融合回归模型;利用测试集,带入优化后的融合回归模型中,检测准确率,最终形成端到端的芯片寿命预测模型;
[0096]
显示模块用于显示算法应用模块发送的数据,包括芯片寿命预测模型的准确率和芯片寿命预测值。
[0097]
所述采用多材料叠层结构建模方法将多元素叠层的芯片结构建模形成节点连接图,包括:
[0098]
将不同层不同元素区域抽象简化为一个节点,将不同元素区域的相邻关系抽象为无向边,使得代表不同元素的节点相互连接,将三维芯片结构建模为二维结构连接图模型,包括:
[0099]
将芯片多层纵向剖面物理结构中的所有元素依次标号;
[0100]
识别出芯片多层纵向剖面物理结构每一层中的相同元素的连通区域,抽象成连接图中的一个节点,并且将这个节点标记成其元素对应的标号;两个相同元素连通区域如果接触的话,在连接图中的相对应的两个节点间添加一条无向边。
[0101]
所述使用威斯费乐-莱曼迭代算法将二维结构连接图转换为特征向量,形成芯片的结构特征向量,包括:
[0102]
s3.1、得到所述二维结构连接图中每个节点的相邻节点;得到每个节点的相邻节点元素的标记,将所述标记放到一个无序列表li内;将该节点的元素放到所述无限列表li中;
[0103]
s3.2、对于每个节点,根据s3.1中得到的无序列表li进行编码;
[0104]
s3.3、统计所述二维结构连接图中每个编码的数量,将各编码有序排列以后形成结构特征向量。
[0105]
所述机器学习回归模型如下:
[0106][0107]
其中,y是集成电路芯片的寿命,是特征提取以后得到的全特征向量。
[0108]
所述合并参数型特征向量和结构特征向量组成全特征向量集,输入机器学习回归模型中进行模型融合,得到融合回归模型,包括:
[0109]
将全特征集送入k种机器学习算法组成的融合回归模型,通过重复k次的有放回抽样,训练k个子模型,每次随机抽样训练1个模型,对k个模型结果进行voting/averaging融合;k为正整数,当k=1时,只使用一个模型,voting/averaging方法不变。
[0110]
本发明未详细说明的部分属于本领域技术人员公知技术。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1