使用基于机器学习的热图像处理监控化学机械抛光工艺的制作方法

文档序号:33713011发布日期:2023-04-01 00:55阅读:57来源:国知局
使用基于机器学习的热图像处理监控化学机械抛光工艺的制作方法

1.本公开涉及化学机械抛光(cmp),并且更具体地涉及监控以检测工艺漂移或工艺异常。


背景技术:

2.通常通过在硅晶片上顺序沉积导电层、半导电层、或绝缘层来在基板上形成集成电路。可能需要将基板表面平面化以移除填料层、或改进集成电路制造期间的光刻的平整性。
3.化学机械抛光(cmp)是一种被接受的平面化方法。这种平面化方法通常需要将基板安装在承载头或抛光头上。基板的暴露表面通常抵靠旋转的抛光垫放置。承载头提供在基板上的可控负载以将基板推靠在抛光垫上。通常将研磨抛光浆料供应到抛光垫的表面。
4.在抛光期间可使用各种原位监控系统(例如,光学或涡流监控系统)来测量基板层的厚度。还提出了使用红外相机对基板进行热成像。
5.作为平行的问题,诸如图形处理单元(gpu)和张量处理单元(tpu)之类的硬件资源上的进展已导致在深度学习算法及其应用中的大幅改善。深度学习的演进领域之一是计算机视觉和图像识别。此类计算机视觉算法大部分经设计用于图像分类或分割。


技术实现要素:

6.在一个方面中,一种化学机械抛光设备包括:工作台,所述工作台具有顶表面以固持抛光垫;承载头,所述承载头用于在抛光工艺期间将基板固持抵靠在抛光垫的抛光表面上;温度监控系统,所述温度监控系统包括定位在工作台上方以具有工作台上的抛光垫的一部分的视野的非接触式热成像相机;以及控制器。控制器被配置成从温度监控系统接收热图像,将热图像输入至由训练示例训练的机器学习模型中以确定针对以下各项中的一者或多者的指示:1)工艺偏差的存在,2)基板状态,或3)针对所述工艺偏差的诊断,以及从机器学习模型接收指示。
7.实施方式可包括以下各项中的一者或多者。机器学习模型可以是人工神经网络。人工神经网络可具有输入层、输出层、以及在输入层与输出层之间的一个或多个隐藏层,输入层具有多个输入节点以从热图像接收强度值,输出层具有输出节点以输出表示指示的值。
8.实施方式可包括但不限于以下潜在优点中的一者或多者。可以以低成本监控跨抛光垫的工艺差异。与原位基板监控系统相比,可以以更直接的方式来检测工艺差异,并且因此对工艺差异的检测可以更可靠。这可以改善抛光工艺的可预测性和改善晶片内均匀度。
9.低成本红外(ir)相机可以围绕平行于抛光表面的轴线安装在垫上方,以在工艺期间以指定时间间隔拍摄垫的热图像。这可允许收集大量(例如,数百个)抛光的热图像。通过使用热图像作为对机器学习过程的输入,可以更好地理解工艺异常。
10.所述方法可用于重建构所收集的图像并训练模型以基于输入图像来输出晶片的
状态。这可促进训练更复杂的模型以理解造成抛光工艺中的偏差的物理异常。例如,通过使用所收集的图像作为输入,所述方法可以监控晶片均匀度的漂移、工作台硬件可能有的问题、垫调节、扣环可能有的问题、头部压力的变化、以及处理期间的其他问题。
11.计量系统中的深度学习可具有高推断速度并且仍能够实现对工艺问题和漂移的高分辨率监控。这使得计量系统能够是针对存储器应用的快速且低成本的计量前和计量后测量工具,具有减少的工艺硬件性能问题。
12.一个或多个实施例的细节在附图和以下说明书中阐述。其他特征、对象和优点将从说明书和附图、以及从权利要求书中显而易见。
附图说明
13.图1a是示例抛光设备的示意截面图。
14.图1b是图1a的示例抛光设备的示意俯视图。
15.图2描绘使用深度学习方法来检测工艺漂移的方法的流程图。
16.图3描绘用作用于抛光设备的控制器的部件的神经网络。
17.各个附图中的相同附图标记指示相同的要素。
具体实施方式
18.在化学机械抛光期间,各式各样的问题可能导致与所期望的工艺的偏离(“偏差”)。例如,抛光速率可能偏离期望速率,或者可能发生不均匀的抛光速率。尽管可使用原位基板监控系统(例如,光学或涡流监控系统)来检测抛光速率上的变化,但此类系统可能不会提供工艺偏差的预警或提供足够信息来识别出偏差的根本原因。
19.然而,抛光垫的热成像可用于检测并且潜在地识别工艺偏差。在抛光工艺期间,由于基板表面与抛光垫之间的摩擦导致生成大量的热量。如果垫温度不像预期那样表现,则这可能指示工艺偏差和潜在问题。可将红外相机定位在抛光垫上方(例如,紧接在承载头的“下游”)来收集抛光垫的热图像。通过使用所收集的抛光垫的热图像作为对机器学习系统的输入,可以检测工艺偏差。此外,热图像可用于识别或监控跨基板的抛光速率的漂移,和/或工作台硬件、垫调节、扣环、或承载头压力可能有的问题。
20.图1a和图1b描绘化学机械抛光系统的抛光站20的示例。抛光站20包括可旋转的碟形工作台24,抛光垫30位于碟形工作台24上。工作台24可操作以围绕轴25旋转。例如,电机22可以转动驱动轴28以旋转工作台24(箭头c)。抛光垫30可以是具有外抛光层34和较软的背衬层32的双层抛光垫。
21.抛光站20可包括供应端口(例如,位于浆料供应臂39的末端)以将抛光液体38(诸如研磨浆料)分配至抛光垫30上。承载头70可操作以将基板10固持抵靠在抛光垫30上。承载头70从支撑结构72(例如,转盘或轨道)悬吊,并且由驱动轴74连接至承载头旋转电机76,使得承载头可围绕轴线71旋转(箭头d)。可选地,承载头70可以例如在转盘上的滑块上横向振荡、通过沿轨道的移动来横向振荡、或通过转盘本身的旋转振荡来横向振荡。
22.承载头70可包括扣环84以固持基板。在一些实施方式中,扣环84可包括接触抛光垫的塑料下部86,以及较硬材料的上部88。
23.操作中,使工作台围绕其中心轴线25旋转,并且使承载头围绕其中心轴线71旋转
并且跨抛光垫30的顶表面横向地平移。
24.承载头70可包括弹性隔膜80和多个可加压腔室82,弹性隔膜80具有基板安装表面以接触基板10的背侧,多个可加压腔室82用于将不同压力施加至基板10上的不同区域(例如,不同径向区域)。承载头还可包括扣环84以固持基板。
25.抛光系统20还包括温度控制系统100以控制抛光垫30和/或抛光垫上的浆料38的温度。温度控制系统100可包括冷却系统102和/或加热系统104。在一些实施方式中,冷却系统102和加热系统104中的一者或两者通过将温控介质(例如,液体、蒸气或喷雾)递送到抛光垫30的抛光表面36上(或递送到已经呈现在抛光垫上的抛光液体上)来操作。例如,多个喷嘴120可从臂110悬吊以分配(例如,喷洒)温控介质。替代地,冷却系统102和加热系统104中的至少一者,并且在一些实施方式中这两者,通过使用接触抛光垫的温度受控板通过传导修改抛光垫的温度来操作。例如,加热系统104可使用热板,例如,具有电阻加热的板或具有携载加热液体的通道的板。例如,冷却系统102可使用冷板,例如,热电板或具有携载冷却剂液体的通道的板)。作为又另一替代方式,温度控制系统100可包括嵌入在工作台24中的加热器(例如,电阻式加热器),或者可流经工作台24中的导管的温度控制流体。
26.尽管图1b描绘用于每个子系统(例如,加热系统102、冷却系统104和冲洗系统)的分开的臂,各个子系统可被包括在由公共臂支撑的单个组件中。例如,组件可包括冷却模块、冲洗模块、加热模块、浆料递送模块、以及可选的刮刀模块。
27.参照图1a和图1b,抛光站20具有温度监控系统150。温度监控系统100包括定位在抛光垫30上方的ir相机180。ir相机180具有对抛光垫30的部分190的视野195。在一些实施方式中,例如如图1a中所示,ir相机180可移动以改变所监控的垫的部分。例如,ir相机180可以可由致动器162旋转(由箭头160所示)或横向移动(由箭头165所示),以便跨抛光垫30的不同部分扫动视野195。替代地,ir相机180可被固定就位,但具有足够宽的视野195(例如,如图1b中所示)以涵盖感兴趣的范围,例如从抛光垫的旋转轴线径向延伸到垫边缘的区域。ir相机180及其视野195可以是紧接在承载头70的“下游”(即,沿着工作台24和抛光垫30的旋转方向(箭头c)的更远处)。特别地,视野195在承载头70与温度控制系统100的(多个)臂之间。
28.控制器90可配置成从相机180接收图像并操作(多个)致动器以控制所监控的部分190的位置。
29.图2描绘使用由机器学习技术生成的算法进行图像处理以用于检测工艺偏差的方法200。
30.在基板处理期间的多个时间点,从ir相机收集抛光垫的区域的热图像(步骤202)。如果ir相机跨抛光垫移动,则可选地,控制器可将多个单独的图像拼接成单个二维热图像,尽管如果ir相机有足够宽的视野以涵盖感兴趣的范围,则可能不需要这样做。
31.可选地,控制器可对所收集的图像应用维度缩减(步骤204)。将图像或经维度缩减的图像输入至通过机器学习技术生成的算法(例如,神经网络)(步骤206)。取决于如何训练算法,算法可输出以下各项中的一者或多者:1)对工艺偏差的存在/不存在的指示,2)对基板状态的指示,或3)针对工艺偏差的诊断。
32.算法(例如,神经网络)可被训练成基于热图像的输入来输出指示或诊断。算法可以例如用训练数据集使用反向传播的训练模式进行训练。训练数据集包括训练热图像和训
练值,其中每个训练热图像具有相关联的训练值。在一些实施方式中,算法使用的训练数据集具有来自抛光测试基板期间的多个不同时间点的抛光垫热图像。在一些实施方式中,训练值是仅两种状态(例如,“正常”或“异常”)中的一者。在一些实施方式中,训练值是仅三种状态中的一者。
33.在一些实施方式中,训练值指示工艺偏差的存在或不存在,例如“异常”或“正常”。因此,算法可被训练成基于输入热图像来输出“正常”或“不正常/异常”指示。这将允许算法输出工艺偏差的存在或不存在。
34.在一些实施方式中,训练值指示晶片状态,例如“均匀”、“抛光过度”、或“抛光不足”。因此,算法可被训练成基于输入热图像来输出“均匀”、“抛光过度”、或“抛光不足”指示。这将允许算法输出期望的晶片状态。
35.在一些实施方式中,训练值指示偏差的原因,例如“正常”、“扣环磨损”、“工作台旋转过慢”、“承载头腔室处于错误压力”等等。因此,算法可被训练成基于输入热图像来输出“正常”、“扣环磨损”、“工作台旋转过慢”、“承载头腔室处于错误压力”等等指示。这将允许算法生成指示偏差的原因的输出。
36.在一些实施方式中,测得的图像以群集(cluster)分组。经缩减的图像或群集由算法分析并且与工艺偏差、工艺偏差的原因、或基板的状态相关联。使用训练数据集来训练基于深度学习的算法(例如,神经网络)。训练数据集包括标记有在训练模型时的不同时间戳的来自干式计量工具的具有与抛光垫的中心相对应的热测量结果的图像。例如,可在所收集的具有广大范围的状态或异常的约50,000个图像上训练模型。
37.图3描绘神经网络320,神经网络320用作用于抛光设备100的控制器90的部件。神经网络320可以是经开发用于对来自抛光垫的输入热图像进行回归分析以生成模型来预测工艺漂移的深度神经网络。
38.神经网络320包括多个输入节点322。神经网络320可包括针对与输入彩色图像的每个像素相关联的每个颜色通道的输入节点、多个隐藏节点324(以下也称为“中间节点”)和输出节点326,输出节点326将生成工艺测量值。在具有单层隐藏节点的神经网络中,每个隐藏节点324可耦接至每个输入节点322,并且输出节点326可耦接至每个隐藏节点320。然而,作为实际问题,用于图像处理的神经网络很可能具有许多层的隐藏节点324。
39.一般而言,隐藏节点324输出的值是来自输入节点322或隐藏节点324所连接到先前层的隐藏节点的值的加权和的非线性函数。
40.例如,第一层的隐藏节点324(标记为节点k)的输出可表示成:
41.tanh(0.5*ak1(i1)+ak2(i2)+

+akm(im)+bk)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
等式1
42.其中tanh是双曲正切,akx是针对第k个中间节点与(m个输入节点中的)第x个输入节点之间的连接的权重,并且im是第m个输入节点处的值。然而,可使用其他非线性函数代替tanh,诸如整流线性单元(relu)函数及其变型。
43.神经网络320因此包括针对与输入热图像的每个像素相关联的每个颜色通道的输入节点322,例如,在存在j个像素和k个颜色通道时,则l=j*k是输入彩色图像中的强度值的数量,并且神经网络320将至少包括输入节点n1、n2、

、nl。
44.因此,在输入节点的数量与彩色图像中的强度值的数量相对应时,隐藏节点324(标记成节点k)的输出hk可表示成:
45.hk=tanh(0.5*ak1(i1)+ak2(i2)+

+akl(il)+bk)
46.假设测得的热图像s由列矩阵(i1,i2,

,il)表示,中间节点324(标记成节点k)的输出可表示成:
47.hk=tanh(0.5*ak1(v1
·
s)+ak2(v2
·
s)+

+akl(vl
·
s)+bk)
ꢀꢀꢀꢀꢀ
等式2
48.其中v是权重值(v1,v2,

,vl),其中vx是用于来自彩色图像的l个强度值中的第x个强度值的权重。
49.输出节点326可生成指示值cv,指示值cv是隐藏节点的输出的加权和。例如,这可表示成:
50.cv=c1*h1+c2*h2+

+cl*hl
51.其中ck是针对第k个隐藏节点的输出的权重。
52.指示值与对指示值的文字说明之间的对应关系可被存储在查找表中。
53.然而,神经网络320可以可选地包括一个或多个其他输入节点(例如,节点322a)以接收其他数据。这种其他数据可以来自原位监控系统对抛光垫的先前测量结果,例如,稍早前从工艺中收集的像素强度值,例如,在处理另一基板期间收集的像素强度值;来自抛光系统中的另一传感器,例如,温度传感器对垫或基板的温度的测量结果;来自用于控制抛光系统的控制器所存储的抛光配方,例如用于抛光基板的抛光参数(诸如承载头压力或工作台旋转速率);来自控制器所追踪的变量,例如,自从垫被更换以来的基板数量;或来自不是抛光系统的部件的传感器,例如,由计量站对底层膜厚度的测量结果。这允许神经网络320在确定指示(例如,偏差的原因)时考虑到其他处理变量或环境变量。
54.输出节点326处产生的工艺异常指示可被馈送至工艺控制模块330。基于异常指示,工艺控制模块可调整工艺参数,例如承载头压力、工作台旋转速率、等等。调整可针对将在基板或后续基板上进行的抛光工艺来进行。
55.针对训练,在神经网络320以训练模式(诸如反向传播模式)操作的同时,将来自热图像的值(v1、v2、

、vl)馈送至相应的输入节点n1、n2、

、nl,同时将表示指示的特征值cv馈送至输出节点326。可针对每一行重复此过程。此过程设定上面的等式1或2中的ak1等的值。
56.系统现在准备好运行。使用产线中(in-line)监控系统160或ir相机从抛光垫测量热图像。测得的热图像可由列矩阵s=(i1,i2,

,il)来表示,其中ij表示l个强度值中的第j个强度值处的强度值,其中当图像包括共n个像素并且每个像素包括三个颜色通道时l=3n。
57.在神经网络320在推断模式下使用时,这些值(s1、s2、

、sl)作为输入馈送到相应的输入节点n1、n2、

nl。作为结果,神经网络320在输出节点326处生成特征值,例如,指示工艺异常的存在或不存在的特征值。
58.神经网络320的架构可在深度和宽度上变化。例如,虽然神经网络320示出为具有单个列的中间节点324,但神经网络320可包括有多个列。中间节点324的数量可能等于或大于输入节点322的数量。
59.上述的抛光设备和方法可应用在各式各样抛光系统中。抛光垫或承载头中的任一者或这两者可移动以在抛光表面与基板之间提供相对运动。例如,工作台可绕轨道运行而非旋转。抛光垫可以是固定至工作台的圆形(或一些其他形状)的垫。抛光层可以是标准(例
如,具有或没有填料的聚氨酯)抛光材料、软材料、或固定研磨材料。
60.相对定位的术语用于表示系统或基板内的相对定位;应理解,在抛光操作期间可以以垂直定向或一些其他定向来固持抛光表面与基板。
61.控制器90的功能性操作可使用一个或多个计算机程序产品来实施,所述一个或多个计算机程序产品即有形地体现在非瞬时机器可读存储介质中的一个或多个计算机程序,以供数据处理设备执行或控制数据处理设备的操作,所述数据处理设备例如可编程处理器、计算机、或多个处理器或计算机。
62.已经描述了数个实施例。然而,将理解,可在不背离本发明的精神和范围的情况下做出各种修改。因此,其他实施例在所附权利要求书的范围内。
63.已经以降低测量结果中的误差为目标来在小晶粒ild0测试图案化基板上训练和验证各种深度模型架构。考虑到底层的特性的模型有较低的误差。此外,通过使用在一个工具上收集的数据来训练模型并使用模型对来自其他工具的数据进行推断,来进行初步工具对工具匹配验证。结果与使用来自同一工具的数据进行训练和推断相当。
64.一般而言,数据可用于控制cmp设备的一个或多个操作参数。操作参数包括例如工作台旋转速度、基板旋转速度、基板的抛光路径、跨板的基板速度、施加在基板上的压力、浆料组成、浆料流率、以及基板表面处的温度。操作参数可以被实时控制并且可以被自动调整,而无需进一步人为干预。
65.如在本说明书中所使用的,术语基板可包括例如产品基板(例如,其包括多个存储器或处理器晶粒)、测试基板、裸基板、选通基板。基板可处于集成电路制造的各种阶段,例如基板可以是裸晶片,或者基板可包括一个或多个沉积的和/或图案化的层。术语基板可包括圆形的盘碟和矩形的板片。
66.然而,上述的彩色图像处理技术在3d垂直nand(vnand)闪存的上下文中尤其有用。特别地,在vnand的制造中使用的层堆叠如此复杂,以至于当前的计量方法(例如,诺瓦(nova)频谱分析)可能无法在检测具有不当厚度的区域中以足够的可靠性执行。相反地,彩色图像处理技术在这种应用中可具有卓越的可靠性。
67.本发明的实施例和本说明书中所述的全部功能操作可被实施在数字电子电路系统中,或实施在计算机软件、固件、或硬件(包括本说明书中公开的结构构件及其结构等效物)、或它们的组合中。本发明的实施例可实施为一个或多个计算机程序产品,即有形地体现在非瞬时机器可读存储介质中的一个或多个计算机程序,以供由数据处理设备执行或控制数据处理设备的操作,所述数据处理设备例如可编程处理器、计算机、或多个处理器或计算机。
68.相对定位的术语用于表示系统的部件相对于彼此的定位,而不一定是相对于重力;应理解,可以以垂直定向或一些其他定向来固持抛光表面与基板。
69.已经描述了数个实施方式。然而,将理解,可进行各种修改。因此,其他实施方式在权利要求书的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1