产生聚合物阵列的方法与流程

文档序号:12271992阅读:405来源:国知局
产生聚合物阵列的方法与流程

本申请要求2015年8月13日提交的美国临时专利申请号62/204,937和2015年11月12日提交的美国临时专利申请号62/254,589的权益,所述申请各自全部以引用方式并入本文。

背景

聚合物分子的较大阵列具有广泛的应用,并且对于医疗、生物技术和医药产业来说极其重要。例如,寡核苷酸探针的阵列被证明是用于大规模DNA和RNA序列分析的强大工具。核酸检测领域已被微阵列改变,所述微阵列允许监测基因表达事件、表达谱分析、诊断和基因分型分析以及其他应用。承载核酸探针阵列的基底需要以一定的方式来制造,所述方式允许精确有效地进行测定如表达监测、基因分型和其他研究。随着在药物基因组学和诊断领域中考虑微阵列的更多敏感应用,例如,在本领域中存在对于以增加的精度、效率和更低的成本来生产聚合物阵列的方法和技术的需要。

概述

通常,在设计微阵列时,设计者面临“边界距离最小化问题”(BLMP),例如,如何在N x N大小的网格中放置相同长度的给定N x N系列,以使得在网格中的所有成对近邻上汇总的海明距离可得以最小化。(Kundeti等人“Border Length Minimization Problem on a Square Array”,Journal of Computational Biology 21.6(2014):446-455)如论文中论述,减少相邻嵌入之间的海明距离的此总和可减少合成误差的数目。

Feldman等人产生掩模组,试图最小化芯片的“边界距离”。(Feldman等人"Gray code masks for sequencing by hybridization."Genomics 23.1(1994):233-235)然而,所得芯片含有所有可能的n聚体的事实由于既定限制因素而使得它不适合于用作例如寡核苷酸条形码的来源。

在此确认需要制造含有聚合物阵列的芯片,其中“边界距离”可最小化并且所得聚合物适用于诸如寡核苷酸条形码的应用中。对于需要在特征之间没有间隙的芯片的应用来说,“边界距离”的此最小化可为尤其重要的。本公开提供产生具有误差矫正能力的聚合物(诸如DNA序列)的方法。所述方法可包括产生掩模组,其中相邻嵌入的编辑距离(例如,海明距离)可全部等于1(如果所有嵌入是独特的,那么1是成对嵌入之间的最小可能编辑距离),以使得编辑距离的总和可在其绝对最小值下,并且,同等地,“边界距离”可在其绝对最小值下。本公开的方法也可在聚合物(诸如DNA序列)合成期间减少误差风险。

本公开的方面提供包含至少1,000个不同聚合物的阵列,每个聚合物偶合至表面上的不同位置,其中每个聚合物与和它相邻的聚合物的差异为至多5个亚单位。在本文提供方面的一些实施方案中,每个聚合物与和它相邻的聚合物的差异为且仅为一个亚单位。在本文提供方面的一些实施方案中,第一聚合物与相邻第二聚合物的差异为单一亚单位的插入、缺失、取代和/或易位。在本文提供方面的一些实施方案中,阵列包含至少10,000个聚合物。在本文提供方面的一些实施方案中,阵列包含至少100,000个聚合物。在本文提供方面的一些实施方案中,聚合物中的每一个包含至少10个亚单位。在本文提供方面的一些实施方案中,聚合物中的每一个包含至少20个亚单位。在本文提供方面的一些实施方案中,聚合物中的每一个包含至少50个亚单位。在本文提供方面的一些实施方案中,聚合物中的每一个与至少两个其他聚合物相邻。在本文提供方面的一些实施方案中,聚合物中的每一个与至少三个其他聚合物相邻。在本文提供方面的一些实施方案中,固定在两个不相邻位置处的聚合物彼此差异为至少与两个不相邻位置之间的位置的数目相同数目的单一亚单位的插入、缺失、取代和/或易位。在本文提供方面的一些实施方案中,固定于两个不相邻位置处的聚合物具有至少与两个位置之间的位置的数目相同数目的不同亚单位数目。在本文提供方面的一些实施方案中,聚合物以具有n行和m列的二维图案布置于表面上,其中n和m为整数。在本文提供方面的一些实施方案中,n为至少30。在本文提供方面的一些实施方案中,n为至少1,000。在本文提供方面的一些实施方案中,n为至少5,000。在本文提供方面的一些实施方案中,m为至少30。在本文提供方面的一些实施方案中,m为至少1,000。在本文提供方面的一些实施方案中,m为至少5,000。在本文提供方面的一些实施方案中,聚合物中的每一个包含第一节段、第二节段和第一节段与第二节段之间的第三节段,节段中的每一个包含至少两个亚单位。在本文提供方面的一些实施方案中,第一节段与表面相邻并且第二节段远离表面。在本文提供方面的一些实施方案中,聚合物中的每一个具有相同的第三节段。在本文提供方面的一些实施方案中,固定于同一列中的相邻位置处的聚合物具有相同的第一节段并且在第二节段中的差异为至多5个亚单位。在本文提供方面的一些实施方案中,聚合物在第二节段中的差异为单一亚单位的至多5个插入、缺失、取代和/或易位。在本文提供方面的一些实施方案中,聚合物在第二节段中的差异为且仅为一个亚单位。在本文提供方面的一些实施方案中,聚合物在第二节段中的差异为单一亚单位的插入、缺失取代或易位。在本文提供方面的一些实施方案中,固定于同一行中的相邻位置处的聚合物具有相同的第二节段并且在第一节段中的差异为至多5个亚单位。在本文提供方面的一些实施方案中,聚合物在第一节段中的差异为单一亚单位的至多5个插入、缺失、取代和/或易位。在本文提供方面的一些实施方案中,聚合物在第一节段中的差异为且仅为一个亚单位。在本文提供方面的一些实施方案中,聚合物在第一节段中的差异为单一亚单位的插入、缺失、取代或易位。在本文提供方面的一些实施方案中,固定于同一列中的两个不相邻位置处的聚合物具有相同的第一节段并且在第二节段中彼此差异为至少与两个不相邻位置之间的位置的数目相同数目的单一亚单位的插入、缺失、取代和/或易位。在本文提供方面的一些实施方案中,固定于同一列中的两个不相邻位置处的聚合物在第二节段的亚单位的数目上的差异为至少与两个不相邻位置之间的位置的数目相同的数目。在本文提供方面的一些实施方案中,固定于同一行中的两个不相邻位置处的聚合物具有相同的第二节段并且在第一节段中彼此差异为至少与两个不相邻位置之间的位置的数目相同数目的单一亚单位的插入、缺失、取代和/或易位。在本文提供方面的一些实施方案中,固定于同一行中的两个不相邻位置处的聚合物在第一节段的亚单位的数目上的差异为至少与两个不相邻位置之间的位置的数目相同的数目。在本文提供方面的一些实施方案中,聚合物中的每一个定位于小于100μm2的面积中。在本文提供方面的一些实施方案中,聚合物中的每一个定位于小于10μm2的面积中。在本文提供方面的一些实施方案中,聚合物中的每一个定位于小于5μm2的面积中。在本文提供方面的一些实施方案中,聚合物以正方形配置来布置。在本文提供方面的一些实施方案中,聚合物以矩形配置来布置。在本文提供方面的一些实施方案中,至少50%的聚合物定位于具有相同大小的不同位置中。在本文提供方面的一些实施方案中,聚合物包含核酸分子。在本文提供方面的一些实施方案中,聚合物选自由以下组成的组:DNA、RNA、PNA、LNA和其混合物。在本文提供方面的一些实施方案中,聚合物是单链或双链。

本公开的另一个方面提供合成各自偶合至基底上的不同位置的至少1,000个聚合物的阵列的方法,其包含:(a)提供具有多个不同位置的基底;(b)提供一组掩模,所述组的每个掩模定义基底上的多个不同位置的不同子集;(c)通过使用计算机可执行逻辑,从掩模组中选择掩模来覆盖基底;(d)通过使用计算机可执行逻辑,选择一个或多个亚单位以便使用所选择的掩模来引入至基底上的多个不同位置的定义子集处;(e)使用一个或多个亚单位,在基底上的多个不同位置的定义子集处执行聚合物合成;并且(f)重复步骤(b)-(e)至少10次,由此产生至少1,000个聚合物的阵列,每个聚合物偶合至多个不同位置中的一个。

在本文提供方面的一些实施方案中,阵列包含至少10,000个聚合物。在本文提供方面的一些实施方案中,多个不同位置中的每一个具有小于5μm2的面积。在本文提供方面的一些实施方案中,至少90%的多个不同位置具有相同面积。在本文提供方面的一些实施方案中,多个不同位置中的每一个具有相同面积。在本文提供方面的一些实施方案中,多个不同位置中的每一个与至少两个其他不同位置相邻。在本文提供方面的一些实施方案中,所述组的每个个别掩模包含定义基底上的活动和无活动区域图案的多个开口,并且在合成期间,一个或多个亚单位只添加至基底的活动区域。在本文提供方面的一些实施方案中,每个个别掩模覆盖基底上的所有不同位置。在本文提供方面的一些实施方案中,开口在单一方向上对齐。在本文提供方面的一些实施方案中,开口中的每一个覆盖整数数目的不同位置并且具有相同形状。在本文提供方面的一些实施方案中,开口中的每一个具有矩形形状。在本文提供方面的一些实施方案中,开口中的每一个具有至少0.5μm的宽度。在本文提供方面的一些实施方案中,至少20%的开口具有不同宽度。在本文提供方面的一些实施方案中,至少50%的开口具有不同宽度。在本文提供方面的一些实施方案中,开口中的每一个具有至少500μm的长度。在本文提供方面的一些实施方案中,至少50%的开口具有相同长度。在本文提供方面的一些实施方案中,至少90%的开口具有相同长度。在本文提供方面的一些实施方案中,第一聚合物与相邻第二聚合物的差异为单一亚单位的至多5个插入、缺失、取代和/或易位。在本文提供方面的一些实施方案中,第一聚合物与相邻第二聚合物的差异为且仅为单一亚单位的一个插入、缺失、取代或易位。在本文提供方面的一些实施方案中,聚合物中的每一个使用由所述掩模组定义的独特系列合成步骤来形成,并且用于形成相邻位置中的毗邻聚合物的两个系列合成步骤的彼此差异为至多5个合成步骤。在本文提供方面的一些实施方案中,两个系列合成步骤的彼此差异为且仅为一个合成步骤。在本文提供方面的一些实施方案中,所述方法进一步包含,在步骤(b)之前,提供计算机可读介质,所述介质包含代码,所述代码在由一个或多个计算机处理器执行时,实施产生掩模设计文件的方法,所述掩模设计文件定义所述组的每个个别掩模上的开口图案。在本文提供方面的一些实施方案中,所述方法进一步包含将掩模设计文件转换成实体掩模。在本文提供方面的一些实施方案中,阵列的聚合物中的每一个包含第一节段、第二节段和第一节段与第二节段之间的共同第三节段,节段中的每一个包含至少两个亚单位。在本文提供方面的一些实施方案中,使用同一组掩模来形成聚合物的第一节段和第二节段。在本文提供方面的一些实施方案中,提供分别用于形成聚合物的第一节段和第二节段的第一组和第二组掩模,并且包含于第一组和第二组掩模中的开口在彼此垂直的两个方向上对齐。在本文提供方面的一些实施方案中,所述方法进一步包含提供单独掩模,所述掩模被设计来使基底上的所有不同位置曝光以形成聚合物的第三节段。在本文提供方面的一些实施方案中,基底包含选自由以下组成的组的材料:氮化硅、二氧化硅和玻璃。在本文提供方面的一些实施方案中,基底为芯片的一部分。在本文提供方面的一些实施方案中,所述组的每个掩模包含选自由以下组成的组的材料:聚合物、半导体和金属材料。在本文提供方面的一些实施方案中,所述组的每个掩模具有50μm-100mm范围内的厚度。在本文提供方面的一些实施方案中,(e)进一步包含(i)提供光源并且将所选择的掩模沿着光源与基底之间的光路来定位,从而在单一步骤的聚合物合成期间在基底上定义活动区域和无活动区域的图案;并且(ii)将来自光源的光束引导至基底以便在基底上的活动区域内的位置中执行光引导合成。在本文提供方面的一些实施方案中,光源在紫外线至近紫外线波长范围内。在本文提供方面的一些实施方案中,聚合物中的每一个包含至少15个亚单位。在本文提供方面的一些实施方案中,聚合物中的每一个包含至少20个亚单位。

本公开的其他方面和优势从以下详细说明变得容易为本领域技术人员显而易知,其中仅示出并描述本公开的例示性实施方案。如认识到,本公开能够实现其他和不同实施方案,并且其多个细节能够在各种明显方面加以改进,所述改进都不背离本公开。因此,附图和说明书在本质上视为例示性,并且不是限制性的。

以引用方式并入

在本说明书中提到的所有公布、专利和专利申请以引用的方式并入本文,其引用程度如同每个个别公布、专利或专利申请特定地和个别地指示以引用方式并入。

附图简述

本发明的新颖特征在附加权利要求中详细阐明。本发明的特征和优势的更好理解参考阐明例示性实施方案的以下详细说明来获得,在以下详细说明中利用本发明的原则和附图,在附图中:

图1A示出包含由中间节段分隔的上部节段和下部节段的示例性聚合物;

图1B示出具有本公开的不同位置的阵列的示例性基底;

图2示出本公开的示例性掩模;

图3A示出本公开的示例性多步制造方法(图中按呈现的顺序分别公开SEQ ID NO 5、6和6);

图3B示出示例性嵌入和使用示例性嵌入的合成聚合物(图中按呈现的顺序分别公开SEQ ID NO 7-10);

图4示出产生掩模设计文件的示例性工作流程;

图5示意性地示出经过编程或以其他方式配置来实施本公开的系统和方法的计算机系统;

图6A-6D示出合成聚合物的示例性程序(图6A公开SEQ ID NO:11);

图7示出通过使用一组掩模来合成的示例性聚合物条形码(图中按呈现的顺序分别公开SEQ ID NO 12-13);

图8示出示例性嵌入和使用本公开的方法来产生的所得DNA序列;

图9示出示例性嵌入产生方法和所得DNA序列(图中按呈现的顺序分别公开SEQ ID NO 14-17);

图10示出示例性嵌入产生方法和具有多个节段的所得DNA序列(图中按呈现的顺序分别公开SEQ ID NO 18-21);并且

图11示出使用级联嵌入来产生具有多个节段的聚合物的示例性方法。

详细描述

虽然本文已经示出并描述本发明的各种实施方案,但是本领域技术人员显而易知这些实施方案仅作为举例来提供。许多变化、改变和取代可由本领域技术人员想到而不背离本发明。应了解可使用本文描述的本发明的实施方案的各种替代方案。

定义

除非上下文另外明确指出,否则如在本文中使用,单数形式“一个(种)”和“所述”包括多个指示物。

如本文使用,术语“约”是指所指示的数值±10%。

如本文使用,开放术语,例如,“包含”、“含有”、“包括(include/including)”、“具有(have/having)”等是指包含,除非另外指示。

如本文使用,术语“嵌入”和“系列合成步骤”是指被设计来在基底上形成个别聚合物的一连串活动和无活动步骤并且可互换使用。举例来说,如果使用光引导合成方法,那么“嵌入”是指一连串曝光和非曝光步骤。

如本文使用,术语“编辑距离”是指将一种聚合物转化成另一种聚合物所需要的最小数目的变化(诸如插入、缺失、取代和易位)。举例来说,序列AGCGCTTAGCCTAGAGCTCTAG(SEQ ID NO:1)与GCGCTTAGCTTAGAGCTCTATTG(SEQ ID NO:2)之间的编辑距离是4。

如本文使用,术语“聚合物”是指由多个亚单位组成的任何种类的天然或非天然大分子。聚合物可包括只含有单一类型的重复亚单位的均聚物,和含有重复亚单位的混合物的共聚物。在一些情况下,聚合物是由各种不同但是在结构上相关的亚单位构成的生物聚合物,例如,由多个核苷酸亚单位构成的多核苷酸诸如DNA。

如本文使用,术语“亚单位”是指较大分子的子部分或与其他分子一起组装(或“共组装”)以形成较大分子复合物诸如聚合物的单一分子。亚单位的非限制性实例包括单体、简单碳水化合物或单糖部分、脂肪酸、氨基酸和核苷酸。

如本文使用,术语“核酸”总体上是指包含一个或多个核酸亚单位或核苷酸的聚合物。核酸可包括选自腺苷(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)和尿嘧啶(U)或其变体的一个或多个亚单位。核苷酸可包括A、C、G、T或U或其变体。核苷酸可包括可并入增长核酸链中的任何亚单位。这类亚单位可为A、C、G、T或U,或对于一个或多个互补A、C、G、T或U具有特异性,或与嘌呤(即,A或G或其变体)或嘧啶(即,C、T或U或其变体)互补的任何其他亚单位。亚单位可使得个别核酸碱基或碱基组(例如,AA、TA、AT、GC、CG、CT、TC、GT、TG、AC、CA或其尿嘧啶对应物)能够得以拆分。在一些实例中,核酸是脱氧核糖核酸(DNA)或核糖核酸(RNA)或其衍生物。核酸可为单链或双链。

如本文使用,术语‘相邻’或‘相邻于’包括‘附近’、‘邻近’和“毗邻”。在一个实例中,当第一位置与第二位置直接接触并且共有共同边界并且在两个位置之间没有空间时,第一位置与第二位置相邻。在一些情况下,相邻并非对角地相邻。

聚合物阵列

本公开的方面提供可用于执行多重测定的聚合物的阵列。阵列可包括至少100、250、500、750、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、120,000、140,000、160,000、180,000、200,000、250,000、300,000、350,000、400,000、450,000、500,000、600,000、700,000、800,000、900,000、1,000,000、10,000,000、20,000,000、30,000,000、40,000,000、50,000,000、60,000,000、70,000,000、80,000,000、90,000,000、100,000,000、200,000,000、300,000,000、400,000,000、500,000,000、600,000,000、700,000,000、800,000,000、900,000,000、1,000,000,000、2,000,000,000、3,000,000,000、4,000,000,000、5,000,000,000或更多个独特聚合物分子。在一些情况下,阵列中的独特聚合物分子的数目可在本文描述的任何两个值之间,例如,约150,000或250,000,000。

阵列的每个聚合物可固定于基底上的不同位置处。基底上的每个不同位置可与至少一个其他不同位置相邻。在一些情况下,每个不同位置可与至少两个、三个、四个、五个或更多个其他不同位置相邻。在一些情况下,基底上的一定百分比(例如,至少10%、20%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或更大)的不同位置可与至少一个、两个、三个、四个或更多个其他不同位置相邻。

固定于不同位置处的聚合物可不同,并且聚合物中的每一个与相邻聚合物的差异可为最大数目的单一亚单位。举例来说,在一些情况下,每个聚合物与相邻聚合物(即,固定于/偶合于相邻位置的聚合物)的差异为至多500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、18、16、14、12、10、9、8、7、6、5、4、3或2个亚单位,包括单一亚单位的取代、插入、缺失和/或易位。在一些情况下,聚合物中的每一个与其相邻聚合物的差异为且仅为一个亚单位。“相邻聚合物”是指固定于基底上的给定位置的相邻位置处的聚合物。在一些情况下,第一聚合物与固定于相邻位置处的第二聚合物的差异可为单一亚单位的取代、插入、缺失或易位。

阵列的每个聚合物可包括超过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、45、50、55、60、65、70、75、80、85、90、95、100、120、140、160、180、200、300、400、500、600、700、800、900或1,000个亚单位。亚单位可相同或可不相同。

阵列的聚合物可具有相同或不同长度(即,具有相同或不同数目的亚单位)。举例来说,在一些情况下,多于或等于10%、20%、30%、40%、50%、60%、70%、80%、90%,或更多的聚合物具有相同或不同长度。在一些情况下,少于或等于约100%、95%、90%、80%、70%、60%、50%、40%、30%、20%、10%或更少的聚合物具有相同或不同长度。在一些情况下,具有相同或不同长度的聚合物的百分比可在本文提供的任何两个值之间,例如,约55%、65%或75%。

阵列的每个聚合物可包括一个以上节段,每个节段可包括一个或多个亚单位。举例来说,每个聚合物可包括由第三节段分开的第一节段和第二节段。在一些情况下,阵列的一些或所有聚合物共有具有已知亚单位序列的共同第三节段。聚合物可固定于以图案,例如,具有行和列的图案形式布置的不同位置的阵列。固定于同一列中的相邻位置处的聚合物可具有相同的第一/第二节段,并且在第二/第一节段中的差异为最大数目的亚单位,例如,至多500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、18、16、14、12、10、9、8、7、6、5、4、3或2个亚单位,包括单一亚单位的取代、插入、缺失和/或易位。在一些实例中,固定于同一列中的相邻位置处的聚合物具有相同的第一/第二节段,并且在其第二/第一节段中的差异为且仅为一个亚单位(包括例如,单一亚单位的取代、插入、缺失或易位)。类似地,在一些情况下,固定于同一行中的相邻位置处的聚合物可具有相同的第二/第一节段,并且在第一/第二节段中的差异为最大数目的亚单位。在一些实例中,固定于同一行中的相邻位置处的聚合物具有相同的第二/第一节段,并且在其第一/第二节段中的差异为且仅为一个亚单位。

另外,固定于同一列中的两个不相邻位置处的聚合物可具有相同的第一/第二节段,并且在第二/第一节段的亚单位的数目上的差异为至少与两个不相邻位置之间的不同位置的数目相同的数目。固定于同一行中的两个不相邻位置处的聚合物可具有相同的第二/第一节段,并且在第一/第二节段的亚单位的数目上的差异为至少与两个不相邻位置之间的不同位置的数目相同的数目。举例来说,固定于同一列中的两个不同位置处的聚合物在其之间具有6个其他不同位置,可具有相同的第一/第二节段,同时在第二/第一节段的亚单位的数目上的差异为至少6个亚单位。亚单位差异可包括单一亚单位的取代、插入、缺失和/或易位。

图1A示出本公开的示例性聚合物。在图1A中,聚合物包含由第三节段103分隔的第一节段101和第二节段102。第一节段101、第二节段102和第三节段103可为任何长度并且在其中并入任何类型/数目的单体或亚单位。举例来说,聚合物分子可为核酸分子,其包括由具有已知序列TTT的第三节段分隔的第一节段(或上部节段)GCAGTGCCACAGA(SEQ ID NO:3)和第二节段(或下部节段)CAACAACTGA(SEQ ID NO:4)。在一些情况下,已知序列(例如,序列103)的唯一用途是在聚合物分子的两个节段(例如,图1A中的上部和下部节段101和102)之间进行区分。为了避免混淆,用于区分两个节段的序列被设计来使得两个节段都不含有相同这种序列。如上并且在本文中别处所述,固定于两个不同位置(相邻或不相邻)的聚合物的序列之间的差异可通过两个位置的相对位置来确定。如果在聚合物分子中包含一个以上节段,则固定于两个不同位置处的聚合物的每个节段之间的差异也可例如通过两个位置之间的不同位置的数目来确定。如果坐标系统用于确定每个不同位置的定位,那么每个不同位置可指派独特坐标并且这种坐标可用于确定聚合物序列之间的差异。每个坐标可进一步包含一个或多个子坐标。举例来说,如果位置以具有行和列的阵列来布置,那么每个独特坐标可进一步包含均可为整数的水平坐标和垂直坐标。水平和垂直坐标可用于计算分别固定于两个不同位置处的聚合物的第一和第二节段的亚单位的数目的差异。

图1B示出示例性位置阵列。如图示出,多个不同位置布置为正方形网格,其中每个单元具有相同边长。单元的边长可变化,涵盖1nm至几毫米。举例来说,单元的边长可大于或等于约1nm、5nm、10nm、20nm、40nm、60nm、80nm、100nm、200nm、400nm、600nm、800nm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、15μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、60μm、70μm、80μm、90μm、100μm、200μm、300μm、400μm、500μm、600μm、700μm、800μm、900μm、1mm、5mm、10mm,或更大。在一些情况下,单元的边长可小于或等于约50mm、25mm、10mm、5mm、1mm、800μm、600μm、400μm、200μm、100μm、75μm、50μm、40μm、30μm、20μm、10μm、8μm、6μm、4μm、2μm、1μm、750nm、500nm、250nm、100nm、75nm、50nm、25nm、10nm、5nm、1nm,或更小。在一些情况下,单元的边长可在本文描述的任何两个值之间,例如,约1.5μm。

坐标系统用于确定每个位置的独特坐标。每个位置可包括一个或多个聚合物并且固定于相同位置的聚合物具有相同坐标。在此实例中,每个聚合物具有两个节段(例如,上部节段和下部节段,如图1A中示出),并且每个位置具有其进一步包含X坐标和Y坐标的独特坐标。X和Y坐标用于确定分别固定于两个不同位置处的聚合物的下部和上部节段之间的最小编辑距离(包括例如,亚单位的数目的差异)。举例来说,固定于具有坐标(x1,y1)和(x2,y2)的位置处的两个聚合物分子的上部节段与下部节段之间的差异可通过以下方式来确定:(i)如果|x1-x2|≤4,那么聚合物在下部节段中的差异为|x1-x2|亚单位;(ii)如果|x1-x2|>4,那么聚合物在下部节段的亚单位的数目上的差异为至少4;(iii)如果|y1-y2|≤4,那么聚合物在上部节段中的差异为|y1-y2|亚单位;或(iv)如果|y1-y2|>4,那么聚合物在上部节段的亚单位的数目上的差异为至少4。

在图1B中,位置110和115的坐标分别为(2,3)和(6,3)。因此,使用坐标,可确定这些两个位置(即,110和115)处的聚合物分子具有相同上部节段但是不同的下部节段具有至少为4的编辑距离。

如本文提供,一些或所有不同位置可包括一个或多个聚合物并且固定于相同位置的聚合物可为相同的。举例来说,在一些情况下,至少1%、5%、10%、20%、40%、50%、60%、70%、80%、90%、99%或更多的不同位置包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、1000个聚合物,或更多。如果一个以上聚合物固定于不同位置,那么除了例如由聚合物合成期间的无效性导致的误差以外,聚合物是相同的。误差率,定义为具有误差的聚合物的总数具有正确序列的聚合物的总数的比率,可用于在使用之前筛选聚合物阵列。对于每个聚合物阵列,在其应用之前,误差率可确定并且与预定阈值(例如,5%、3%、1%、0.5%、0.1%、0.01%或0.001%)比较,并且仅具有低于预定阈值的误差率的阵列可发布供进一步使用。固定于两个不相邻位置的聚合物序列之间的差异可通过两个位置的相对位置来确定。在一些情况下,固定于两个不相邻位置的聚合物在聚合物序列上的差异可为至少两个不相邻位置之间的位置的相同数目。举例来说,固定于两个位置处的在其之间具有至少5个其他不同位置的聚合物可在序列上的差异为至少5个亚单位,包括亚单位的取代、插入、缺失和/或易位。

在一些情况下,两个位置的相对定位可通过计算两个位置之间的可通过位置测定器测量或识别的差异来确定。位置测定器可包括坐标系统,其使用一个或多个数字,或坐标,来确定每个不同位置的独特定位。在一些情况下,每个位置可1对1对映于它含有的聚合物序列,以使得例如如果聚合物的序列是确定的,那么聚合物固定的不同位置是已知的。

位置可采用各种形状,诸如圆形、正方形、矩形、多边形、椭圆形、狭长条、多边形,或任何其他规则或不规则形状或其组合。每个个别位置或位点的面积可变化。在一些情况下,每个位置具有大于或等于约1纳米(nm)2、10nm2、100nm2、500nm2、1000nm2、10,000nm2、50,000nm2、1微米(μm)2、5μm2、10μm2、20μm2、30μm2、40μm2、50μm2、60μm2、70μm2、80μm2、90μm2、100μm2、200μm2、300μm2、400μm2、500μm2、600μm2、700μm2、800μm2、900μm2、1,000μm2、2,000μm2、4,000μm2、6,000μm2、8,000μm2、10,000μm2、25,000μm2、50,000μm2、75,000μm2、100,000μm2或更大的面积。在一些情况下,每个位置具有小于或等于约1,000,000μm2、500,000μm2、100,000μm2、50,000μm2、10,000μm2、7,500μm2、5,000μm2、2,500μm2、1,000μm2、750μm2、500μm2、250μm2、100μm2、80μm2、60μm2、40μm2、20μm2、10μm2、5μm2、1μm2、75,000nm2、50,000nm2、25,000nm2、10,000nm2、5,000nm2、1,000nm2或更小的面积。在一些情况下,每个个别位置可具有本文描述的任何两个值之间的面积。

不同位置可以阵列形式布置于基底上。阵列可呈任何图案,诸如线状图案、二维图案(例如,倾斜、矩形、带心矩形、六边形(菱形)和正方形网格,或具有n个行和m个列的图案),或任何规则或不规则图案。如果位置以n个行和m个列的图案形式布置,那么可使用许多行和列。在一些情况下,n和/或m大于或等于1、5、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000或更大。在一些情况下,n和/或m小于或等于1,000,000、500,000、250,000、100,000、75,000、50,000、25,000、10,000、7,500、5,000、2,500、1,000、750、500、250、100、80、60、40、20、10、5,或更小。在一些情况下,n和/或m可如上所述的任何两个值之间的任何数字,例如,15、150或3,500。

基底可为固体或半固体。基底可包括一个或多个由相同或不同材料制成的层,诸如金属、玻璃、半导体、合成或天然材料和有机或无机材料。可用于形成基底的材料的非限制实例可包括玻璃、石英、硅、硅基材料(例如氮化硅或二氧化硅)、金属、塑料、聚合物材料(例如热固性、弹性体、热塑性、聚苯乙烯、尼龙、聚多巴胺(PDA)、聚氯乙烯(PVC)、聚(二甲基硅氧烷)(PDMS)、聚偏二氟乙烯等)、纸、水凝胶或其组合。基底可采用各种形状,1维、2维或3维,诸如薄片、球体、立方体、长方体、锥体、圆柱体、棱柱、角锥体、管、板、圆盘、棒或任何规则或不规则形状。在一些情况下,基底为芯片的一部分。芯片可包括数百万个微米尺度特征,每个特征含有独特聚合物,即,DNA序列的数千个拷贝。

基底可进一步包含表面。基底的表面可为平坦表面、弯曲表面或具有凸起和/或凹陷区域的表面,所述区域可促进实施本公开的方法。表面上的凸起/凹陷区域可为连续、半连续或不连续。在一些情况下,基底的表面可具有交替凸起和凹陷区域(例如,孔,所述孔可保持溶剂,即适合于执行本公开方法的试剂)。在一些情况下,基底的表面划分成许多独立区段并且每个个别区段包含多个不同位置并且被配置来产生不同类型的聚合物(例如,DNA、RNA和有机聚合物)。聚合物可包括具有许多单体或亚单位的任何类型的分子,例如,核酸分子。聚合物可为单链或双链。在一些情况下,聚合物选自由以下组成的组:DNA、RNA、PNA、LNA和其混合物。

基底的表面可修饰以促进或有助于产生或合成聚合物。举例来说,如果使用光刻技术,则基底表面可用对光不稳的保护基团来修饰。一旦表面经由光刻掩模来照明,那么反应性羟基可在照明区域中产生并且聚合物分子的单体或亚单位可连接至其上。通过连续地添加单体或亚单位至预先存在的链,聚合物分子得以合成。在一个实例中,将在5′羟基处用对光不稳的基团来保护的3′活化脱氧核苷提供至表面以使得偶合在已经曝露于光的位点处发生。脱氧核苷的5’-末端的保护防止后续不必要的(光)化学反应。选择性光去保护和偶合循环可重复直到获得所需探针组为止。此过程的变化可使用通过光刻技术来选择性图案化的聚合物半导体光阻剂,而非使用对光不稳的5′保护基团。在一些情况下,在添加每个单体或亚单位时,使用光活化保护性基团。这类光活化保护性基团本身对于光敏感并且可在曝露于光时活化。

如上并且在本文中别处所述,基底表面可划分成若干空间分离区段,每个区段可包括多个不同位置。取决于应用,每个区段可用于合成相同或不同类型的聚合物并且不同区段内的位置可或可不采用相同形状、具有相同面积和/或以相同图案来布置。

方法

本公开的另一个方面提供在基底上合成聚合物的阵列的方法。聚合物阵列可包括至少100、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、150,000、200,000、250,000、300,000、350,000、400,000、450,000、500,000、600,000、700,000、800,000、900,000、1,000,000、10,000,000、20,000,000、30,000,000、40,000,000、50,000,000、60,000,000、70,000,000、80,000,000、90,000,000、100,000,000、200,000,000、300,000,000、400,000,000、500,000,000、600,000,000、700,000,000、800,000,000、900,000,000、1,000,000,000、2,000,000,000、3,000,000,000、4,000,000,000、5,000,000,000,或更多个独特聚合物分子。首先,可提供可适合于聚合物合成用途的基底。基底可包括多个不同位置。每个位置可包括能够将聚合物的亚单位连接至基底的至少一个位点。每个位置可与至少一个、两个、三个、四个、五个或六个其他位置相邻。每个位置可具有或可不具有相同大小、形状或面积。在一些情况下,一定百分比的位置具有相同或不同大小、形状和/或面积,例如,大于或等于10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或99%的位置可具有相同大小、形状和/或面积。

随后,可提供一组掩模。所述组的每个掩模可用于在基底上定义不同位置的不同子集。每个掩模可包括多个开口,其定义基底上的活动区域和无活动区域的图案。在聚合物合成期间,亚单位可只添加至活动区域内的位置。

开口可采用各种规则或不规则的形状,诸如正方形、矩形、三角形、菱形、六边形和圆形。每个掩模可具有其自身开口设计,所述设计定义基底上的活动和无活动区域的不同图案。开口可在或可不在单一方向上对齐。每个开口可覆盖基底上的整数数目的不同位置。对于每个掩模,开口可具有或可不具有相同形状。对于基底上的每个不同位置,掩模组共同地可定义用于在此位置形成聚合物的独特系列合成步骤或嵌入(即,将要引入基底上的亚单位的序列)。每个掩模可用于形成聚合物的至少一个合成步骤。在一些情况下,掩模组被设计来使得用于在两个相邻位置处形成聚合物的每个成对系列的合成步骤(或嵌入)彼此差异为最大数目的合成步骤,例如,至多500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、18、16、14、12、10、9、8、7、6、5、4、3或2个合成步骤。在一些情况下,用于在两个相邻位置处形成聚合物的两个系列合成步骤彼此差异为且仅为一个合成步骤。举例来说,用于在两个相邻位置处合成毗邻聚合物的每一对嵌入的差异为且仅为一个曝光/非曝光步骤。

对于每个掩模,一定百分比(例如,1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、85%、90%、95%或更大)或所有的开口可具有相同长度和/或宽度。在一些情况下,开口的长度可与基底相同。在一些情况下,开口的长度可小于基底的长度以使得一个掩模只能够掩蔽基底的一部分。如果所有开口具有相同长度,那么其宽度可变化并且一个或多个开口可或可不具有相同宽度。举例来说,开口的宽度可大于或等于约1nm、10nm、50nm、100nm、250nm、500nm、750nm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、40μm、60μm、80μm、100μm、200μm、300μm、400μm、500μm、600μm、700μm、800μm、900μm、1,000μm,或更大。在一些情况下,开口的宽度可小于或等于约50mm、10mm、1,000μm、900μm、800μm、700μm、600μm、500μm、400μm、300μm、200μm、100μm、90μm、80μm、70μm、60μm、50μm、40μm、30μm、20μm、10μm、8μm、6μm、4μm、2μm、1μm,或更小。在一些情况下,开口的宽度可在本文描述的任何两个值之间,例如,约12μm。

开口的长度可变化。在一些情况下,开口中的每一个具有大于或等于约1μm、10μm、25μm、50μm、75μm、100μm、200μm、400μm、600μm、800μm、1,000μm、2,000μm、3,000μm、3,500μm、4,000μm、4,500μm、5,000μm、5,500μm、6,000μm、7,000μm、8,000μm、9,000μm、10,000μm,或更大的长度。在一些情况下,开口的长度可小于或等于约50,000μm、25,000μm、10,000μm、8,000μm、7,000μm、6,500μm、6,000μm、5,500μm、5,000μm、4,500μm、4,000μm、3,000μm、2,000μm、1,000μm、800μm、600μm、400μm、200μm、100μm,或更小。在一些情况下,开口的长度可在本文描述的任何两个值之间,例如,约4,900μm。

为了合成具有多个节段的聚合物,可提供超过一组掩模并且每一组掩模可用于合成例如聚合物的特定节段。举例来说,具有相同长度但是不同宽度的开口的第一组掩模可用于形成聚合物的第一节段并且具有相同宽度但是不同长度的开口的第二组掩模可用于形成聚合物的第二节段。第一组和第二组掩模的开口可分别在第一方向和第二方向上对齐,并且第一和第二方向可彼此垂直。在一些情况下,用于第一节段合成的同一组掩模可通过将掩模旋转90度来用于形成聚合物的第二节段。第三组掩模(或单独掩模)可在一些情况下用于形成聚合物的第三节段(例如,由所有聚合物共同共用的已知聚合物序列),其掩模可被设计来使所有位置经受聚合物合成。

掩模可由各种材料形成,诸如玻璃、硅基(例如,二氧化硅氮化物、二氧化硅)、聚合物、半导体或金属材料。在一些情况下,掩模包含光刻掩模(或光掩模)。掩模的厚度可变化。在一些情况下,掩模可具有大于或等于1μm、10μm、50μm、100μm、250μm、500μm、750μm、1毫米(mm)、2mm、3mm、4mm、5mm、6mm、7mm、8mm、9mm、10mm、15mm、20mm、25mm、30mm、35mm、40mm、45mm、50mm,或更大的厚度。在一些情况下,掩模可具有小于或等于约500mm、250mm、100mm、50mm、40mm、30mm、20mm、10mm、8mm、6mm、4mm、2mm、1mm、900μm、800μm、700μm、600μm、500μm、400μm、300μm、200μm、100μm,或更小的厚度。在一些情况下,掩模的厚度可在本文描述的任何两个值之间,例如,约7.5mm。

图2示出本公开的示例性掩模。如图2中示出,掩模中的开口(示出为白色矩形方框)用于合成聚合物分子(即,在掩模安置于基底上方时,在开口下方的位置将会曝光并且经受聚合物合成)。每个开口具有5μm的最小宽度并且可覆盖基底上的一个或多个位置,取决于例如每个个别位置的尺寸和面积。掩模被设计来使得在它相对于基底对齐时,基底上的选定位置可得以活化并且亚单位可添加至其上。

随后,可提供计算机可执行逻辑并且用于(i)选择覆盖基底的掩模;和(ii)选择使用掩模来引入至基底上的每个位置上的一个或多个亚单位。选择掩模一个或多个亚单位的计算机可执行逻辑被配置来产生聚合物阵列。在基底上的不同位置处合成(并且因此固定)的每个聚合物可具有独特序列(或系列亚单位)。固定于不同位置处的每个聚合物与固定于相邻不同位置处的另一个聚合物在序列上的差异可为最大数目的亚单位,例如,至多500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、18、16、14、12、10、9、8、7、6、5、4、3或2,包括单一亚单位的取代、插入、缺失和/或易位。随后,聚合物合成可使用选定掩模和系列亚单位来执行。

各种技术可用于在基底上合成聚合物,例如,化学合成、电化学合成或光电化学合成。在一些情况下,使用光引导合成。可提供光源。光源可在基底上执行聚合物分子的光引导合成。光源可提供各种形式的辐射,诸如可见光、紫外线(UV)、红外线(IR)、远紫外光刻(EUV)、X射线、电子和离子。光源可提供单一波长,例如激光或波长带。在一些情况下,由光源提供的光束可在紫外线至近紫外线波长范围内。可提供掩模并且沿着光源与基底之间的光路来定位。

如上并且在本文中别处所述,多个合成步骤可包含于整个聚合物合成过程中,并且在一些情况下,对于每个个别步骤,仅选择一个掩模并且沿着基底与光源之间的光路来安置。在一些情况下,为了合成具有亚单位的预先定义序列的聚合物分子,可使用一组掩模并且组合掩模确定用于基底上的所有位置的一组多个系列的合成步骤(一系列曝光和非曝光步骤)。聚合物阵列的示例性多步合成路线在图3A中示出。

如本文提供,如在下文进一步详细描述的计算机系统可用于产生掩模设计文件,其用于产生在合成反应中使用的实体掩模。计算机系统可包括计算机可读介质,所述介质包含代码,所述代码在由一个或多个计算机处理器执行时,实施产生掩模设计文件的方法。在一些情况下,掩模组可被设计来使得用于在相邻位置形成聚合物的所有成对系列的合成步骤彼此差异为至多500、400、300、200、100、90、80、70、60、50、45、40、35、30、25、20、18、16、14、12、10、9、8、7、6、5、4、3或2个合成步骤,例如,为且仅为一个合成步骤。这可极大地减少合成期间的误差的数目。图3B示出此实例。如图3B中示出,每个“系列曝光步骤”用于合成相应合成寡核苷酸。在给定“系列曝光步骤”中,“1”指示相应位置在此步骤期间得到曝光,并且沉积序列中的相应亚单位得以添加至合成寡核苷酸;“0”指示位置不获得曝光并且亚单位未得以添加。举例来说,第一“系列曝光步骤”中的前两个1在第一和第三位置处,所述位置对应于沉积序列中的A,然后G,因此第一寡核苷酸中的前两个碱基为“AG”等。相邻成对“系列曝光步骤”中的每一对(例如,位置1和2,2和3,3和4,和4和1)彼此差异仅为单一步骤。虽然在当前实例中,“系列曝光步骤”由系列“0”和“1”来表示,但是应了解各种方法可用于表示“系列曝光步骤”。

可选择沉积序列以使得合成步骤(或循环)的数目可得以最小化。在一些情况下,沉积序列可为反复添加某种短序列(例如,以上实例中的ACGT)。聚合物分子可通过沉积序列的足够长重复来合成直到分子到达预定长度为止。

图4示出产生嵌入列表(或系列合成步骤)的示例性工作流程。在第一操作400中,选择用于合成的沉积序列。随后,在第二操作405中,使用空的嵌入列表(例如,用于某一位置一系列曝光和非曝光步骤)。

在产生此嵌入列表之后,在第三操作410中,随机选择表示第一聚合物的掩模步骤的嵌入。然后,选定嵌入转化成相应聚合物。在一些情况下,在下一个操作415之前,转化聚合物针对多个预先定义限制因素来测试。可能限制因素的实例可包括但是不限于链长;聚合物的化学、物理、热、电气性质;生物性质诸如具体范围中的GC和/或AT含量;一定范围中的ATG含量;核苷酸重复序列;复杂性;与反向互补序列的编辑距离;与由嵌入列表中的嵌入隐含的其他聚合物的编辑距离;存在禁止序列(例如,在一行中具有一定数目的由G和C或A和T组成的组的核苷酸的序列,具有起始密码子的序列,或与共同、第三节段相同的序列);熔融温度;超过一定范围的均聚物延伸(或均聚物极限);形成分子内二级结构(例如,发夹结构)的倾向;分子间粘接的倾向;排除具体基元(例如,在使用限制酶时);与基因组DNA的较低相似性;与mRNA序列的较低相似性等;和其组合。如果转化分子符合限制因素415a,然后将选定嵌入添加至以前建立的空嵌入列表。否则必须选择另一个随机嵌入并且试验415b。

在步骤415a之后,一旦嵌入列表达到所需长度420,则它可用于合成聚合物分子420a以使得用于合成相邻位置中的毗邻分子的嵌入彼此差异为且仅为一个合成步骤(例如,在光引导聚合物合成中,用于合成相邻位置中的聚合物的所有成对嵌入的差异为且仅为一个曝光/非曝光步骤)。

然而,如果嵌入列表未到达预定长度,那么对于最近附加嵌入产生一个变化并且新产生的嵌入转化成其相应聚合物分子420b。举例来说,如果嵌入由系列“0”和“1”来表示(例如,“1010010010010001000101000111”,如用于图3B中),“一个变化”是指在使用光引导合成时,仅存在可改变的一个合成步骤诸如曝光步骤(即,“1”)或非曝光步骤(即,“0”)。此操作420b可重复执行直到嵌入列表达到所需长度为止。在步骤420b中的每个转化分子可任选地针对某些限制因素425来测试并且如果它未能满足一个或多个限制因素,那么产生另一个随机变化430。然而,如果转化分子通过测试,那么将产生分子的嵌入添加至嵌入列表并且步骤420-425可重复。

合成过程可通过将来自光源的光束在掩模图案中引导至基底来启始。活动区域内的位置可曝露于光束并且经受聚合物分子的光引导合成。聚合物的单体或亚单位可修饰以使得单体(或亚单位)的一个末端对于进一步作用不起反应并且每次仅有一个单体(或亚单位)可参与合成反应。

可提供坐标系统来确定基底上的每个位置的位置信息(例如,坐标)。使用坐标,位于两个不同位置的聚合物的亚单位的序列之间的差异可例如通过计算两个位置的相对位置(或坐标之间的差异)来确定。

可停止聚合物合成直到已经选择并使用所有掩模。可重复合成反应的合成步骤直到一定百分比(例如,大于或等于至少10%、20%、30%、40%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%、99.99%或更大)的位置具有连接至其上的至少一个聚合物分子和/或连接分子符合某些预先定义性质为止,所述性质诸如链长(例如,聚合物链含有至少10、20、30、40、50、60、70、80、90、100或更多个亚单位),组成(例如,聚合物链含有至少20%的A、G、T或C),GC含量(例如,不超过10%、20%、30%、40%、05 50%),相邻或毗邻分子之间的编辑距离(例如,毗邻分子具有1的编辑距离或最小距离),或如上或在本文中别处所述的任何限制因素或其组合。

在一些情况下,合成步骤可重复(例如,至少5、10、25、50、75、100、200、300、400、500、600、700、800、900,或更多次)直到基底具有至少10、50、100、200、400、600、800、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、1,000,000、10,000,000、20,000,000、30,000,000、40,000,000、50,000,000、60,000,000、70,000,000、80,000,000、90,000,000、100,000,000、200,000,000、300,000,000、400,000,000、500,000,000、600,000,000、700,000,000、800,000,000、900,000,000、1,000,000,000、2,000,000,000、3,000,000,000、4,000,000,000、5,000,000,000,或更多个位置具有在其上合成的聚合物分子。在一些情况下,其中具有分子的位置的数目可在本文描述的任何两个值之间,例如,250,000。

计算机系统

本公开提供计算机系统,其编程序或另外被配置来实施本文提供的方法,诸如产生掩模设计文件,所述文件定义每个个别位置的系列曝光步骤。图5示出计算机系统501,其包括中央处理单元(CPU,在本文中也称为“处理器”和“计算机处理器”)505,其可为单一核心或多核心处理器,或用于并行处理的多个处理器。计算机系统501还包括存储器或存储单元510(例如,随机存取存储器、只读存储器、闪速存储器),电子存储单元515(例如,硬盘),与一个或多个其他系统通信的通信接口520(例如,网络适配器),和外围装置525,诸如高速缓冲存储器、其他存储器、数据存储和/或电子显示适配器。存储器510、存储单元515、接口520和外围装置525经由通信总线(实线)诸如母板与CPU 505通信。存储单元515可为用于存储数据的数据存储单元(或数据储存库)。计算机系统501可借助于通信接口520来可操作地耦接至计算机网络(“网络”)530。网络530可为互联网、互联网和/或外联网或与互联网通信的内部网和/或外联网。网络530在一些情况下为电信和/或数据网络。网络530可包括一个或多个计算机服务器,其可实现分布式计算,诸如云计算。网络530在一些情况下借助于计算机系统501,可实施对等网络,其可使得耦接至计算机系统501的装置能够作为客户端或服务器来运作。

CPU 505可执行序列机器可读指令,所述指令可在程序或软件中具体实现。指令可存储于存储单元,诸如存储器510中。指令可被引导至CPU 505,其可随后编程或另外配置CPU 505来实施本公开的方法。由CPU 505执行的操作的实例可包括撷取、解码、执行和写回。

CPU 505可为电路的一部分,诸如集成电路。系统501的一个或多个其他部件可包含于电路中。在一些情况下,电路是专用集成电路(ASIC)。

存储单元515可存储文件,诸如驱动程序、文库和保存程序。存储单元515可存储使用者数据,例如,使用者偏好和使用者程序。计算机系统501在一些情况下可包括一个或多个额外数据存储单元,所述单元在计算机系统501外部,诸如位于经由内部网或互联网与计算机系统501通信的远程服务器上。计算机系统501可经由网络530与一个或多个远程计算机系统通信。

如本文描述的方法可经由机器(例如,计算机处理器)可执行代码来实施,所述代码存储于计算机系统501的电子存储位置上,例如像,存储器510或电子存储单元515。机器可执行或机器可读代码可以软件形式提供。在使用期间,代码可由处理器505执行。在一些情况下,代码可从存储单元515撷取并且存储在存储器510上准备由处理器505访问。在一些情况下,可排除电子存储单元515,并且机器可执行指令存储于存储器510上。

代码可预先编译并且被配置来供具有适于执行代码的处理器的机器来使用,或可在执行时间期间加以编译。代码可以程序语言来提供,可选择所述程序语言以使得代码能够以预先编译或原样编译方式来执行。

计算机系统501可编程序或另外被配置来调控一个或多个参数,诸如施加于纳米间隙电极对的电极两端的电压、温度、核酸分子的流动速率,和信号采集的时间周期。

本文提供的系统和方法,诸如计算机系统501的各个方面可在程序编制中具体实现。技术的各个方面可被认为是通常呈机器(或处理器)可执行代码和/或相关数据形式的“产品”或“制品”,所述数据承载或具体实现于一定类型的机器可读介质中。机器可执行代码可存储于电子存储单元,诸如存储器(例如,只读存储器、随机存取存储器、闪速存储器)或硬盘上。“存储”类型介质可包括计算机、处理器等的任何或所有有形存储器,或其相关联模块,诸如各种半导体存储器、磁带驱动器、磁盘驱动器等,其可在任何时候提供非暂时性存储用于软件编程。软件的全部或一部分可有时经由互联网或各种其他电信网络来传送。这类通信,例如,可使得将软件从一个计算机或处理器加载至另一个计算机或处理器,例如,从管理服务器或主机计算机加载至应用服务器的计算机平台中。因此,可承载软件元件的另一种类型的介质包括光、电和电磁波,诸如跨越本地装置之间的物理接口、经由有线和光学陆地线网络和各种空中链路所使用的光、电和电磁波。携带这些波的物理元件,诸如有线或无线链路、光链路等也可被认为是承载软件的介质。如本文使用,除非限于非暂时性、有形“存储”介质,术语诸如计算机或机器“可读介质”是指参与提供指令至处理器供执行的任何介质。

因此,机器可读介质,诸如计算机可执行代码,可采用许多形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储器介质包括,例如,光盘或磁盘,诸如任何计算机等中的任何存储装置,诸如在附图中示出的可用于实施数据库等的存储装置。易失性存储器介质包括动态存储器,诸如这类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光导纤维,包括构成计算机系统中的总线的导线。载波传输介质可采用电或电磁信号,或声或光波的形式诸如在射频(RF)和红外(IR)数据通信期间产生的信号。常见形式的计算机可读介质因此包括例如:软盘、软磁盘、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、冲孔卡纸带、具有孔图案的任何其他物理存储器介质、RAM、ROM、PROM和EPROM、快闪EPROM、任何其他存储器芯片或盒、运输数据或指令的载波、运输这类载波的电缆或链路,或计算机可读取编程代码和/或数据的任何其他介质。许多这些形式的计算机可读介质可涉及运送一个或多个指令的一个或多个序列至处理器供执行。

计算机系统501可包括或与电子显示器535通信,所述显示器包含用户接口(UI)540用于提供例如聚合物分子合成的进展。UI的实例包括但不限于图形用户接口(GUI)和基于网路的用户接口。

本公开的方法和系统可经由一个或多个算法来实施。算法可在由中央处理单元505执行时经由软件来实施。

应用

本公开的方法和聚合物阵列可适用于多种情形,例如,生物技术行业中的多重测定或核酸测序。通过本公开所描述的方法来产生的聚合物阵列可用于标记、跟踪、识别和/或测序任何试样或物质,诸如DNA或RNA分子。举例来说,大肠杆菌具有大约4.6Mb的基因组,其可在一个过程中测序。测序DNA或RNA的较大节段,例如50kb或100kb,可精确地表征一些重复序列和较大结构变化,但是可能会错误地描述兆碱基数量级上的结构变化。本文描述的方法和聚合物阵列可更精确地表征重复序列、较大结构变化和兆碱基尺度结构变化。所测序的核酸分子可为整个基因组,例如大肠杆菌基因组。所测序的核酸分子可为人DNA或染色体的极长链。

试样或物质可为例如用于试样处理的任何物质,诸如试剂或分析物。示例性试样可包括全细胞、染色体、多核苷酸、有机分子、蛋白质、多肽、碳水化合物、糖类、糖、脂质、酶、限制酶、连接酶、聚合酶、条形码、接头、小分子、抗体、荧光团、脱氧核苷酸三磷酸(dNTP)、双脱氧核苷酸三磷酸(ddNTP)、缓冲液、酸性溶液、碱性溶液、温度敏感酶、pH敏感酶、光敏感酶、金属、金属离子、氯化镁、氯化钠、锰、水性缓冲液、轻度缓冲液、离子缓冲液、抑制剂、油、盐、离子、洗涤剂、离子洗涤剂、非离子洗涤剂、寡核苷酸、核苷酸、DNA、RNA、肽多核苷酸、互补DNA(cDNA)、双链DNA(dsDNA)、单链DNA(ssDNA)、质粒DNA、粘粒DNA、染色体DNA、基因组DNA、病毒DNA、细菌DNA、mtDNA(线粒体DNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、微小RNA、dsRNA、核酶、核糖开关和病毒RNA、蛋白水解酶、核酸酶、蛋白水解酶抑制剂、核酸酶抑制剂、螯合剂、还原剂、氧化剂、探针、发色团、染料、有机物、乳化剂、表面活性剂、稳定剂、聚合物、水、药物、放射性分子、防腐剂、抗生素、适体等。

仅出于举例说明的目的,本公开包括但不限于以下实施方案:

1.一种阵列,其包含至少1,000个不同聚合物,每个聚合物偶合至表面上的不同位置,其中每个聚合物与和它相邻的聚合物的差异为至多5个亚单位。

2.如实施方案1所述的阵列,其中每个聚合物与和它相邻的聚合物的差异为且仅为一个亚单位。

3.如实施方案1或2所述的阵列,其中第一聚合物与相邻第二聚合物的差异为单一亚单位的插入、缺失、取代和/或易位。

4.如实施方案1至3中任一项所述的阵列,其包含至少10,000个聚合物。

5.如实施方案4所述的阵列,其包含至少100,000个聚合物。

6.如实施方案1至5中任一项所述的阵列,其中所述聚合物中的每一个包含至少10个亚单位。

7.如实施方案6所述的阵列,其中所述聚合物中的每一个包含至少20个亚单位。

8.如实施方案7所述的阵列,其中所述聚合物中的每一个包含至少50个亚单位。

9.如实施方案1至8中任一项所述的阵列,其中所述聚合物中的每一个与至少两个其他聚合物相邻。

10.如实施方案9所述的阵列,其中所述聚合物中的每一个与至少三个其他聚合物相邻。

11.如实施方案1至10中任一项所述的阵列,其中固定在两个不相邻位置处的聚合物彼此的差异为至少与所述两个不相邻位置之间的位置的数目相同数目的单一亚单位的插入、缺失、取代和/或易位。

12.如实施方案1至10中任一项所述的阵列,其中固定于两个不相邻位置处的聚合物具有至少与所述两个位置之间的位置的数目相同数目的不同亚单位数目。

13.如实施方案1至12中任一项所述的阵列,其中所述聚合物以具有n个行和m个列的二维图案布置于所述表面上,其中n和m为整数。

14.如实施方案13所述的阵列,其中n至少为30。

15.如实施方案14所述的阵列,其中n至少为1,000。

16.如实施方案15所述的阵列,其中n至少为5,000。

17.如实施方案13所述的阵列,其中m至少为30。

18.如实施方案17所述的阵列,其中m至少为1,000。

19.如实施方案18所述的阵列,其中m至少为5,000。

20.如实施方案1至19中任一项所述的阵列,其中所述聚合物中的每一个包含第一节段、第二节段和所述第一节段与所述第二节段之间的第三节段,所述节段中的每一个包含至少两个亚单位。

21.如实施方案20所述的阵列,其中所述第一节段与所述表面相邻并且所述第二节段远离所述表面。

22.如实施方案20或21所述的阵列,其中所述聚合物中的每一个具有相同的第三节段。

23.如实施方案20至22中任一项所述的阵列,其中固定于同一列中的相邻位置处的聚合物具有相同的第一节段并且在所述第二节段中的差异为至多5个亚单位。

24.如实施方案23所述的阵列,其中所述聚合物在所述第二节段中的差异为单一亚单位的至多5个插入、缺失、取代和/或易位。

25.如实施方案23所述的阵列,其中所述聚合物在所述第二节段中的差异为且仅为一个亚单位。

26.如实施方案25所述的阵列,其中所述聚合物在所述第二节段中的差异为单一亚单位的插入、缺失、取代或易位。

27.如实施方案20至22中任一项所述的阵列,其中固定于同一行中的相邻位置处的聚合物具有相同的第二节段并且在所述第一节段中的差异为至多5个亚单位。

28.如实施方案27所述的阵列,其中所述聚合物在所述第一节段中的差异为单一亚单位的至多5个插入、缺失、取代和/或易位。

29.如实施方案27所述的阵列,其中所述聚合物在所述第一节段中的差异为且仅为一个亚单位。

30.如实施方案30所述的阵列,其中所述聚合物在所述第一节段中的差异为单一亚单位的插入、缺失、取代或易位。

31.如实施方案20至22中任一项所述的阵列,其中固定于同一列中的两个不相邻位置处的聚合物具有相同的第一节段并且在所述第二节段中彼此差异为至少与所述两个不相邻位置之间的位置的数目相同数目的单一亚单位的插入、缺失、取代和/或易位。

32.如实施方案20至22中任一项所述的阵列,其中固定于同一列中的两个不相邻位置处的聚合物在所述第二节段的亚单位的数目上的差异为至少与所述两个不相邻位置之间的位置的数目相同的数目。

33.如实施方案20至22中任一项所述的阵列,其中固定于同一行中的两个不相邻位置处的聚合物具有相同的第二节段并且在所述第一节段中彼此差异为至少与所述两个不相邻位置之间的位置的数目相同数目的单一亚单位的插入、缺失、取代和/或易位。

34.如实施方案20至22中任一项所述的阵列,其中固定于同一行中的两个不相邻位置处的聚合物在所述第一节段的亚单位的数目上的差异为至少与所述两个不相邻位置之间的位置的数目相同的数目。

35.如实施方案1至34中任一项所述的阵列,其中所述聚合物中的每一个定位于小于100μm2的面积中。

36.如实施方案35所述的阵列,其中所述聚合物中的每一个定位于小于10μm2的面积中。

37.如实施方案36所述的阵列,其中所述聚合物中的每一个定位于小于5μm2的面积中。

38.如实施方案1至37中任一项所述的阵列,其中所述聚合物以正方形配置来布置。

39.如实施方案1至37中任一项所述的阵列,其中所述聚合物以矩形配置来布置。

40.如实施方案1至39中任一项所述的阵列,其中至少50%的所述聚合物定位于具有相同大小的不同位置中。

41.如实施方案1至39中任一项所述的阵列,其中所述聚合物包含核酸分子。

42.如实施方案41所述的阵列,其中所述聚合物选自由以下组成的组:DNA、RNA、PNA、LNA和其混合物。

43.如实施方案41或42所述的阵列,其中所述聚合物是单链或双链。

44.一种合成至少1,000个聚合物的阵列的方法,每个聚合物偶合至基底上的不同位置,所述方法包含:

a.提供具有多个不同位置的基底;

b.提供一组掩模,所述组的每个掩模定义所述基底上的所述多个不同位置的不同子集;

c.通过使用计算机可执行逻辑,从所述掩模组中选择掩模来覆盖所述基底;

d.通过使用所述计算机可执行逻辑,选择一个或多个亚单位以便使用所选择的掩模来引入至所述基底上的所述多个不同位置的定义子集处;

e.使用所述一个或多个亚单位,在所述基底上的所述多个不同位置的所定义子集处执行聚合物合成;并且

f.重复步骤(b)-(e)至少10次,由此产生至少1,000个聚合物的阵列,每个聚合物偶合至所述多个不同位置中的一个。

45.如实施方案44所述的方法,其中所述阵列包含至少10,000个聚合物。

46.如实施方案44或45所述的方法,其中所述多个不同位置中的每一个具有小于5μm2的面积。

47.如实施方案44或45所述的方法,其中至少90%的所述多个不同位置具有相同面积。

48.如实施方案47所述的方法,其中所述多个不同位置中的每一个具有相同面积。

49.如实施方案44至46中任一项所述的方法,其中所述多个不同位置中的每一个与至少两个其他不同位置相邻。

50.如实施方案44至46中任一项所述的方法,其中所述组的每个个别掩模包含定义所述基底上的活动和无活动区域图案的多个开口,并且其中在合成期间,所述一个或多个亚单位只添加至所述基底的所述活动区域。

51.如实施方案50所述的方法,其中所述每个个别掩模覆盖所述基底上的所有所述不同位置。

52.如实施方案50或51所述的方法,其中所述开口在单一方向上对齐。

53.如实施方案50至52中任一项所述的方法,其中所述开口中的每一个覆盖整数数目的所述不同位置并且具有相同形状。

54.如实施方案50至52中任一项所述的方法,其中所述开口中的每一个具有矩形形状。

55.如实施方案50至52中任一项所述的方法,其中所述开口中的每一个具有至少0.5μm的宽度。

56.如实施方案50至55中任一项所述的方法,其中至少20%的所述开口具有不同宽度。

57.如实施方案56所述的方法,其中至少50%的所述开口具有不同宽度。

58.如实施方案50至54中任一项所述的方法,其中所述开口中的每一个具有至少500μm的长度。

59.如实施方案50至54和58中任一项所述的方法,其中至少50%的所述开口具有相同长度。

60.如实施方案59所述的方法,其中至少90%的所述开口具有相同长度。

61.如实施方案44所述的方法,其中第一聚合物与相邻第二聚合物的差异为单一亚单位的至多5个插入、缺失、取代和/或易位。

62.如实施方案61所述的方法,其中所述第一聚合物与所述相邻第二聚合物的差异为且仅为单一亚单位的一个插入、缺失、取代或易位。

63.如实施方案44所述的方法,其中所述聚合物中的每一个使用由所述掩模组定义的独特系列合成步骤来形成,并且用于形成相邻位置中的毗邻聚合物的两个系列合成步骤的彼此差异为至多5个合成步骤。

64.如实施方案63所述的方法,其中所述两个系列合成步骤彼此差异为且仅为一个合成步骤。

65.如实施方案44所述的方法,其进一步包含,在步骤(b)之前,提供计算机可读介质,所述介质包含代码,所述代码在由一个或多个计算机处理器执行时,实施产生掩模设计文件的方法,所述掩模设计文件定义所述组的每个个别掩模上的开口图案。

66.如实施方案65所述的方法,其进一步包含将所述掩模设计文件转化为实体掩模。

67.如实施方案44或63所述的方法,其中所述阵列的所述聚合物中的每一个包含第一节段、第二节段和所述第一节段与所述第二节段之间的共同第三节段,所述节段中的每一个包含至少两个亚单位。

68.如实施方案44或66所述的方法,其中使用同一组掩模来形成所述聚合物的所述第一节段和所述第二节段。

69.如实施方案44或66所述的方法,其中提供分别用于形成所述聚合物的所述第一节段和所述第二节段的第一组和第二组掩模,并且其中包含于所述第一组和第二组掩模中的所述开口在彼此垂直的两个方向上对齐。

70.如实施方案44和68至69中任一项所述的方法,其进一步包含提供单独掩模,所述单独掩模被设计来使所述基底上的所有所述不同位置曝光以形成所述聚合物的所述第三节段。

71.如实施方案44或70所述的方法,其中所述基底包含选自由以下组成的组的材料:氮化硅、二氧化硅和玻璃。

72.如实施方案71所述的方法,其中所述基底为芯片的一部分。

73.如实施方案44和68至70中任一项所述的方法,其中所述组的每个掩模包含选自由以下组成的组的材料:聚合物、半导体和金属材料。

74.如实施方案73所述的方法,其中所述组的每个掩模具有50μm-100mm范围内的厚度。

75.如实施方案44所述的方法,其中(e)进一步包含(i)提供光源并且将所选择的掩模沿着所述光源与所述基底之间的光路来定位,从而在所述聚合物合成的单一步骤期间在所述基底上定义活动区域和无活动区域的图案;并且(ii)将来自所述光源的光束引导至所述基底以便在所述基底上的所述活动区域内的所述位置中执行光引导合成。

76.如实施方案75所述的方法,其中所述光源在紫外线至近紫外线波长范围内。

77.如实施方案44至76中任一项所述的方法,其中所述聚合物中的每一个包含至少15个亚单位。

78.如实施方案77所述的方法,其中所述聚合物中的每一个包含至少20个亚单位。

实施例

实施例1:合成聚合物分子

图6A-6D示出使用三组掩模来合成聚合物分子的示例性程序。聚合物分子包含多个DNA条形码,其实例在图6A中示出。在图6A中,示例性DNA条形码包含由3个T分隔的上部条形码、下部条形码。

DNA条形码使用光引导DNA合成法来合成并且曝光图案通过掩模来控制。下部条形码首先合成,然后合成3T,随后合成上部条形码。用于合成下部条形码的一个步骤的示例性条形码在图6B中示出,其中画有阴影的矩形表示掩模中的透明区域,其定义基底上的位置的活动区域。

一旦完成下部条形码的合成,在三个相同合成步骤期间将3T添加至所有合成条形码。因此,在这些步骤期间使用的掩模将基底上的所有位置(即,位置布置于其上的网格的所有区域)完全曝光。可用于这类用途的示例性掩模在图6C中示出。

用于合成下部条形码的一个步骤的示例性条形码在图6D中示出。类似于图6B,其中具有对角线的矩形表示掩模中的透明区域,所述区域然后定义基底上的活动区域。与其中矩形垂直地对齐的用于下部条形码的合成步骤的掩模相反,在此使用的掩模包含水平地对齐的矩形。

实施例2:使用一组掩模来合成聚合物分子

当在基底上合成多个DNA条形码时,在每次掩模曝光之后添加特定碱基的情况下,使用一组掩模。如上所述,可提供沉积序列用于聚合物合成。每个掩模恰好对应于一个亚单位添加步骤。对于基底上的给定位置,每个掩模使此位置曝光或不曝光以使得沉积序列中的相应亚单位添加至或不添加至将要在此位置合成的条形码。此位置的系列合成步骤(或嵌入)例如用1(曝光)和0(非曝光)来编码。

嵌入和所得条形码的实例在图7中示出。如附图示出,3T在条形码的中间合成,将下部条形码与上部条形码分隔。对应于3T序列的曝光步骤示出为粗体的1。

实施例3:产生用于合成下部DNA条形码的一组掩模的方法

产生用于合成下部梯型条形码的一组掩模由以下步骤组成:(1)选择在合成期间使用的核苷酸的沉积序列(例如,ACGTACGT…);(2)初始化空的嵌入列表并且确定所有嵌入的适当嵌入长度n。数字n也可为用于下部条形码合成的掩模组中的掩模的数目;(3)以长度n的随机嵌入(系列0和1)来开始。将此嵌入转化成相应下部条形码,并且如果条形码满足限制因素(例如,没有系列连续T),将嵌入附加至嵌入列表;否则,保持尝试随机嵌入直到一个起作用为止;(4)通过在恰好一个随机变化(0变化至1,或1变化至0)的情况下复制最近附加嵌入来产生候选嵌入。将此候选嵌入转化成相应下部条形码,并且如果条形码满足限制因素(例如,没有系列连续T,在与由列表中的嵌入隐含的其他下部条形码相比时,正确的编辑距离),将候选嵌入附加至嵌入列表;(5)重复步骤4直到嵌入列表达到预定长度(例如,如果条形码的所得网格假定由1平方μm的5100μm x 5100μm网格组成,那么我们需要5100个嵌入的列表)为止。如果步骤4连续重复100次而未将另一个嵌入附加至列表,然后通过10个最近添加嵌入从嵌入列表中移除来返回,然后继续重复步骤4;(6)然后通过考虑每个嵌入中的每个数字将嵌入列表转化成一组n掩模文件(例如,GDSII文件格式)。如果第j个嵌入中的第i个数字是1,那么将5100μm x 1μm垂直矩形与x坐标j一起添加至第i个掩模文件。如果第j个嵌入中的第i个数字是0,那么不需要添加任何矩形。所得掩模文件看似图6B中的图解;并且(7)然后将掩模文件转化成实体掩模;掩模文件中的所有矩形区域对应于相应实体掩模中的透明区域。掩模文件可通过产生光刻掩模的公司转化成用于光刻的实体掩模。类似步骤可用于产生用于合成聚合物分子的上部条形码的掩模。在一些情况下,下部条形码合成的同一组掩模可通过将掩模旋转90度来用于上部条形码合成。

实施例4:用于减少聚合物合成期间的误差风险的产生嵌入的方法

在一些情况下,可能发生掩模相对于基底未对齐并且在合成期间导致误差,从而在实际与所需聚合物序列之间产生不匹配。在大多数情况下,这类未对齐只在某些合成步骤中毗邻嵌入彼此不同时导致误差。为了减少由未对齐导致的误差风险,可优选地产生一组嵌入,其中使毗邻嵌入之间的差异的总数被最小化,例如,毗邻嵌入彼此差异为恰好一个变化。示例性嵌入组和所得聚合物序列在图8中示出。

在一些情况下,可能需要合成多个聚合物,所述聚合物具有(1)大约相等长度,和(2)较高远程最小编辑距离,对于某一给定D,如果两个聚合物在基底上间隔开≥D位置,如本文使用的远程最小编辑距离规定其编辑距离必须≥D。合成聚合物可较短或较长。如果需要短序列,则合成路线可包括(i)产生满足上述两个限制的所有可能长度的嵌入,即,所有所得聚合物具有大致上相同长度和较高远程最小编辑距离,并且(ii)使用产生足够聚合物用于合成的最短长度。示例性方法在图9中示出,所述方法开始于初始化空的列表嵌入并且选择长度n的随机嵌入(系列0和1)。然后,候选嵌入使用第一限制来随机选择。在包含于列表中的嵌入的数目达到预定值之后,应用第二限制并且未能满足此限制的嵌入从列表中移除。然后,所产生的这些嵌入可用于合成具有单一节段的聚合物。

在一些情况下,将两个或更多个(例如,2、3、4、5、6、7、9或10)所产生嵌入级联以形成新的一组嵌入,其可用于合成具有多个节段的聚合物。另外或替代地,具有比(例如,具有小于2、3、4、5、6、7、8、9或10的长度的系列0和1)短得多的长度并且不同于级联嵌入的共同已知嵌入可插入毗邻级联嵌入中以将其分离,并且每个级联嵌入可对应于聚合物的节段。举例来说,如图10中示出,每个嵌入通过将两个以前产生的嵌入级联(图9)并且在级联嵌入之间插入共同系列(即,10001)来产生。每个新形成的嵌入包含三个区段,其各自对应于所得聚合物的单一节段,例如,上部节段、中间节段和下部节段。上部和下部节段可分别编码x和y坐标,并且中间节段用于分隔上部和下部节段。在一些情况下,级联之前和之后的嵌入组被称为1D和2D嵌入并且所产生的1D和2D嵌入可个别地用于设计掩模,所述掩模用于合成分别具有单一和多个节段的聚合物。图11示出使用级联嵌入来产生2D DNA序列的示例性方法。

实施例5:使用所产生的聚合物阵列来测序极长DNA的方法

制备DNA提取物溶液,其包含大约4Mb长的模板DNA分子的长片段。引物结合位点通过在500bp的平均间隔下的转座子整合来添加至模板DNA分子。模板DNA通过在包含聚合物的空间定义阵列的基底(诸如载玻片)上进行分子梳理来伸展,每个聚合物偶合至基底的不同位置(或位点)。阵列的每个聚合物具有与模板DNA分子的引物结合位点序列互补的接头序列、核酸扩增引物序列(例如,PCR引物序列),和聚合物定位的点独有的条形码序列。阵列的聚合物杂交至以前整合至模板DNA分子中的引物结合位点。进行延伸反应以产生模板DNA分子(或其补体)的区域的多个拷贝,所述分子在5’末端以聚合物的PCR引物序列开始,接下来并入条形码序列,随后并入接头序列,然后延伸以将模板核酸序列并入至所得延伸产物中。因此,产生阵列结合延伸产物,其包含条形码序列和与模板DNA分子的区域互补的序列。将延伸产物组装并测序。序列读取的对齐和组装通过条形码信息来辅助,并且产生完整4Mb模板DNA序列。

虽然本文已经示出并描述本发明的优选实施方案,但是本领域技术人员显而易知这些实施方案仅作为举例来提供。许多变异、变化和取代现在将由本领域技术人员想到而不背离本发明。应了解可在实施本发明中使用本文描述的本发明的实施方案的各种替代方案。规定以下权利要求定义本发明范围并且这些权利要求和其均等物范围内的方法和结构由此得以覆盖。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1