基于聚类和多任务学习的化学机械研磨时间设定方法

文档序号:8282538阅读:180来源:国知局
基于聚类和多任务学习的化学机械研磨时间设定方法
【技术领域】
[0001] 本发明属于自动控制、信息技术和先进制造领域。为解决现代微电子生产制造中 多品种混合生产模式下人工设定化学机械研磨时间所导致的返工率高,整条生产线的生产 效率偏低的问题,本发明采用基于逆向模型的优化设定方法,将工艺指标及产品状态作为 输入,影响工艺指标的关键因素一研磨时间作为输出建立逆向模型用于对研磨时间进行优 化设定。针对生产数据中所存在的产品品种多且单个品种数据量少的问题,提出一种基于 聚类和多任务学习的化学机械研磨时间设定方法,可实现对化学机械研磨时间的优化设 定,提高化学机械研磨工序的生产效率。
【背景技术】
[0002] 化学机械研磨是微电子制造过程中的关键工序,影响着整条生产线的生产效率。 由于现代微电子制造业多品种小批量的生产特点,企业常采用多品种混合生产的模式。在 这种混合生产模式下,传统的Run-to-Run(RtR)优化控制方法难以取得理想效果。RtR的 主要思想是利用上一批次乃至几批次的生产信息指导新来批次的生产,一般假设相同品种 的产品在一台设备上连续加工或假设若干台设备有规律的循环加工少量品种。但由于多品 种混合生产下若干台设备可能连续加工任意品种的产品,不同品种和设备间存在差异,传 统RtR方法效果较差。因此,目前研磨时间仍然依靠人工经验设定及先行片测试,一旦出现 不合格产品,整个批次都要进行返工,难以实现较高的生产效率,亟需对化学机械研磨的加 工时间进行优化设定。传统的操作参数优化设定方法需要首先对工艺指标进行建模,然后 在指标模型的基础上优化操作参数。工艺指标模型是以产品状态及操作参数为输入、工艺 指标为输出的正向模型,可是在数据较少的时候,很难准确建立指标模型,导致操作优化效 果不佳。借鉴RtR中用历史批次指导未来生产的想法,针对化学机械研磨数据品种多、每 个品种中数据少的特点,本发明将工艺指标及产品状态作为输入,影响工艺指标的关键因 素-研磨时间作为输出建立逆向模型用于对研磨时间进行优化设定,基于此提出一种基于 聚类和多任务学习的化学机械研磨时间设定方法。

【发明内容】

[0003] 为解决多品种混合生产环境下的化学机械研磨时间优化设定问题,本发明将工艺 指标及产品状态作为输入,影响工艺指标的关键因素-研磨时间作为输出建立逆向模型用 于对研磨时间进行优化设定,基于此提出一种基于聚类和多任务学习的化学机械研磨时间 设定方法。为处理实际生产数据中产品品种多,每个品种数据少的问题,提出一种基于聚类 和多任务学习的两步建模方法,将传统聚类多任务学习中的聚类过程和参数学习过程分开 考虑。品种聚类过程假设每个品种中的数据符合一个多维高斯分布,采用最大似然估计对 多维高斯分布的均值向量和方差矩阵进行估计。根据估计结果,采用巴氏距离表示两个多 维高斯分布的相似度。通过计算不同品种概率分布之间的相似度得到相似度矩阵。以相似 度矩阵作为输入采用仿射传播算法完成品种聚类。同时为了保证小样本下聚类所得的结果 中每个类别中的样本数量都足够大,将每个品种的样本数量作为一种先验知识嵌入到品种 聚类过程中。
[0004] 在每个类别中采用所提出的基于共有参数提取的多任务学习算法计算模型参数。 为了解决单个任务中样本数量少的问题,所提出的基于共有参数提取的多任务学习算法将 模型参数分解为共有部分和私有部分并同时学习这两部分。共有部分可以弥补样本数据不 足带来的模型偏差。
[0005] 基于聚类和多任务学习的化学机械研磨时间设定方法,其特征在于,所述方法是 在计算机上依次按以下步骤实现的:
[0006] 步骤(1):数据整理
[0007] 本方法中所建立的优化设定模型以4项工艺指标及产品状态组成模型输入行向 量X,其中包括:研磨材料去除速率、来片厚度、抽测先行片出片厚度和lot抽测出片厚度, 以化学机械研磨时间为模型输出y ;假设模型输入输出之间的关系满足下式:
[0008] y = xw+ δ
[0009] 其中列向量W表示待确定的模型参数,δ为噪声。
[0010] 不失一般性的,假设有m个产品品种;第i个产品品种的Ni个样本输入记为矩阵 足e RM气其第j行Xiw表示第i个产品品种的第j个样本的输入向量,d为模型输入变 量个数,本方法中d = 4 ;第i个产品品种的队个样本输出记为列向量
【主权项】
1.基于聚类和多任务学习的化学机械研磨时间设定方法,其特征在于,所述方法 是在计算机上依次按W下步骤实现的: 步骤(1);数据整理 本方法中所建立的优化设定模型W 4项工艺指标及产品状态组成模型输入行向量X, 其中包括;研磨材料去除速率、来片厚度、抽测先行片出片厚度和lot抽测出片厚度,W化 学机械研磨时间为模型输出y ;假设模型输入输出之间的关系满足下式: y = XW+ 5 其中列向量W表示待确定的模型参数,5为噪声。 假设有m个产品品种;第i个产品品种的Ni个样本输入记为矩阵G化^xd,其第j行 Xiw表示第i个产品品种的第j个样本的输入向量,d为模型输入变量个数,d = 4 ;第i个 产品品种的Ni个样本输出记为列向量yi e 其第j个元素;表示第i个产品品种的第 j个样本的输出,即化学机械研磨时间;为便于后续表示,用X表示由输入矩阵技i,X2,..., Xm_i,Xm]纵向排列所构成的矩阵;同样用Y表示由输出向量[yi,y2, . . .,ym_l,纵向排列 构成的列向量;X和Y均有iV =乙于,N表示所有的样本总数;列向量I e胺w表示每 个样本所属品种的标号,取值范围为(1,2, . . .; 步骤(2);计算不同品种的相似度矩阵 采用极大似然估计方法计算每个品种的概率分布函数;例如,对第i个品种,其多维高 斯分布的均值向量化;和方差矩阵么的估计值:
其中矩阵& = G化%"^+:〇,行向量21^表示矩阵Z 1的第j行,包含4个输入变 量和1个输出变量; 采用己氏距离比较不同品种之间的相似度,即比较不同品种多维高斯分布的相似度:
在多维高斯分布的假设下,己氏距离有解析表达式,假设两个多维高斯分布的概率分 布为Gi?N( y 1,E 1),G2?N( y 2, E 2)的距离计算方法为:
其中r=^& + I:2),|A|表示矩阵A的行列式; 根据上述的差异度计算方法,基于每个品种多元高斯分布均值向量知寻日方差矩阵么的 估计值,计算得到相似度矩阵;因后续仿射传播聚类方法所需输入为相似度,所W差异度取 负数得到相似度; 步骤(3);基于仿射传播的产品特征聚类

仿射传播聚类是一种基于信息累积的聚类方法,根据不同点的累积信息量确定聚类中 屯、,主要利用相似度矩阵计算两种信息量,r(i,k),a(i,k):
开始设置a(i,k) =0,然后根据上式迭代的更新r(i,k)和a(i,k)直到收敛; 仿射传播聚类中用偏好向量表示先验知识中每个任务成为聚类中屯、的可能性;在迭代 中用偏好向量代替相似度矩阵中的对角线元素进而影响聚类中屯、的选择;因为样本数目较 多的产品品种后续会得到更加准确的模型,更适合作为聚类中屯、,为了将样本数目该一先 验用于聚类的过程中,采用如下方法设置仿射传播方法中的偏好向量; 设偏好向量的设定值为P =虹,P2, . . .,Pm_l,Pm]:
其中Ni代表每个任务的样本数,L表示希望样本数量大于L的品种更倾向于成为聚类 中屯、;设定 a = 0. 005, b = 2000, L = 50 ; 步骤(4);基于共有参数提取的多任务学习 在聚类后得到的L个类别,对每个类别中的品种使用基于共有参数提取的多任务学习 方法,其主要思想是将每个品种的模型参数分为两部分:共享参数和私有参数;共享参数 是每个类别中所有品种的数据模型中相同的部分,用列向量UG吸d表示;而私有参数是每 个类别中每个品种的数据模型中不同的部分,用列向量vi G胺d表示;如果一个类别中有r 个品种,则r个列向量yi可构成一个r列的矩阵V;基于共有参数提取的多任务学习方法可 根据每个类别中的数据学习出该两部分的参数从而得到最终模型的参数,例如对第i个任 务,最终的模型参数为: w'= U+V ' 在进行模型学习W前,需要先对数据进行归一化处理;然后设定模型的参数,包括入1, 入2,^3,随机初始化共有参数向量U和私有参数矩阵V ; 迭代过程如下,其中X表示一类中r个品种的输入矩阵技1,X,,. . .,Xf_i,纵向排列 所构成的矩阵;同样用Y表示一类中r个品种的输出向量[yi,72, . . .,yt_i,yj纵向排列构 成的列向量 对第k次迭代计算:
上式中:

根据 Pk,Uk-1和 Q k,Vk-厘新 u k,Vk Uk= P k+a k (Pk-PE-i) Vk= Qk+a k(Qk-Qk-i) 其中 a G [〇,l],可令 a°=〇;心= = = 在迭代过程中,步长Ik采用如下方法确定: Zfc = 其中jk为使得下式成立的最小非负正整数:
对L个聚类所得的类别分别使用上述方法即可得到L个模型库,其包含了所有m个品 种的模型。

【专利摘要】基于聚类和多任务学习的化学机械研磨时间设定方法,属于自动控制、信息技术和先进制造领域,其特征在于,为实现多品种混合下微电子制造过程化学机械研磨时间优化设定,本方法将工艺指标及产品状态作为输入,影响工艺指标的关键因素-研磨时间作为输出建立逆向模型用于对研磨时间进行优化设定。在构建上述逆向模型过程中,针对生产品种种类多,单个品种数据少的问题,将相似品种按产品特征进行聚类,在每个类别中采用基于共有参数提取的多任务学习方法进行建模;所计算出的模型参数分为本类品种共有部分和单品种私有部分。
【IPC分类】G06F19-00
【公开号】CN104598720
【申请号】CN201410805040
【发明人】刘民, 段运强, 董明宇, 郝井华
【申请人】清华大学
【公开日】2015年5月6日
【申请日】2014年12月23日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1