用于遗传和化学分析的单分子阵列的制作方法

文档序号:432373阅读:1147来源:国知局

专利名称::用于遗传和化学分析的单分子阵列的制作方法
技术领域
:本发明涉及用于高通量分析个体分子群的方法和组合物,更具体的说,涉及有关单分子阵列制作的方法和组合物及其应用,尤其是在高通量核酸测序和遗传分析中。
背景技术
:大规模分子分析对于了解有关人类和经济上重要的植物和动物中健康和疾病状态的广泛生物学现象是重要的,例如Collins等(2003),Nature,422:835-847;Hirschhorn等(2005),NatureReviewsGenetics,6:95-108;NationalCancerInstitute,ReportofWorkingGrouponBiomedicalTechnology,"RecommendationforaHumanCancerGenomeProject",(2005年2月)。樣史型化已证实对于此类分析增大规模和降低成本极其重要,而达到微型化的重要途径是使用探针或分析物的微阵列。这样的阵列在大多数目前可利用的或者新出现的大规模遗传分析和蛋白质组技术中发挥重要作用,包括那些用于单核苦酸多态性检测、拷贝数估量、核酸测序等等的,例如Kennedy等(2003),NatureBiotechnology,21:1233-1237;Gunderson等(2005),NatureGenetics,37:549-554;Pinkel和Albertson(2005),NatureGeneticsSupplement,37:S11-S17;Leamon等(2003),Electrophoresis,24:3769-3777;Shendure等(2005),Science,309:1728-1732;Cowie等(2004),HumanMutation,24:261-271;等等。不过,目前用于此类技术的微阵列的规模仍然不符合达到真正低成本分析目标的要求,那样的分析会实现如下搡作,诸如个人基因组测序、环境测序(用以利用复杂微生物群落的变化作为个人或环境健康状态的指标)、将基因组特12征与复杂特性(诸如对癌症、糖尿病、心血管疾病的易感性)联系起来的研究等等,例如Collins等(见上文);Hirschhom等(见上文);Tringe等(2005),NatureReviewsGenetics,6:805-814;Service(2006),Science,311:1544-1546。由于阵列的特征大小降低到了分子水平,因而在用于DNA测序的基于阵列的方案中增大分析的规模是特别具有挑战性的,因为大多数方案不仅需要形成高密度阵列的规程,而且还需要重复使阵列完整性、信号产生、信号检测等等问题变复杂的复杂生化步骤循环,例如Metzker(2005),GenomeResearch,15:1767-1776;Shendure等(2004),NatureReviewsGenetics,5:335-344;Weiss(1999),Science,283:1676-1683。有些方法采用未扩增耙序列的高密度阵列,当使用"通过合成测序(sequencingbysynthesis)"化学法时,存在严重的信噪比考验,例如Balasubramanian等,美国专利6,787.308。其它方法采用原位扩增随机部署的靶序列,随后应用"通过合成测序"化学法。这样的方法也引起了各种各样的困难,包括(i)靶序列簇的大小的显著变异性,(ii)用聚合酶进行的延伸步骤中相(phase)的逐渐丟失,(iii)抑制阅读长度的测序循环效率缺乏,等等,例如Kartalov等(2004),NucleicAcidsResearch,32:2873-2879;Mitra等(2003),Anal.Biochem.,320:55-65;Metzker(见上文)。由于以上原因,如果存在可利用的分子阵列和排列技术,允许在单一的分析操作中平行的、有效且方便的分析大量个体分子,诸如基本上覆盖了整个哺乳动物大小基因组的DNA片段,那么对于医学、生命科学和农业领域而言将是有利的。发明概述一方面,本发明提供了高密度单分子阵列、制备和使用所述组合物的方法、及用于实施所述方法的试剂盒。一种形式的本发明组合物包括部署在表面上的众多不同单分子的随机阵列,其中所述单分子各自包含一个大分子结构和至少一个分析物,使得各个大分子结构包含能够与所述表面上的一个或多个官能度形成键的众多附着官能度。一方面,所述分析物是大分子结构的组分;另一方面,所述分析物通过所述结构上的独特官能度与所述分析物上的反应性基团或附着模块之间的联接而附着于所述大分子结构。另一方面,本发明的组合物包括部署在表面上的单分子随机阵列,其中所述单分子各自包含至少一个耙多核苷酸的串联物且各自通过所述表面上的一个或多个官能度与所述串联物上的互补官能度之间形成的联接而附着于所述表面。另一种形式的本发明组合物包括部署在表面上的单分子随机阵列,其中所述单分子各自包含至少一个靶多核苷酸与至少一个衔接头寡核苷酸的串联物且各自通过所述表面上的捕捉寡核苦酸与所述串联物中的附着寡核苷酸之间形成双链体而附着于所述表面。又一种形式的本发明组合物包括部署在表面上的单分子随机阵列,其中各个单分子包含具有一个独特官能度和众多互补官能度的双功能大分子结构,且其中各个单分子通过所述表面上的一个或多个官能度与所述双功能大分子结构上的互补官能度之间的联接而附着于所述表面,所述独特官能度具有就所述互补官能度而言的正交化学反应性(orthogonalchemicalreactivity)且能够与某种分析物形成共价联接。关于以上组合物,另一方面,所述单分子部署在平坦阵列中,其随机分布于具有限定位置的离散分隔区上。优选的,在这方面.,所述离散分隔区各自具有允许捕所围绕。一方面,本发明包括聚合物分子的阵列,其包含(a)具有表面的支持物;及(b)附着于所述表面的众多聚合物分子,其中各个聚合物分子具有随机缠绕状态且包含一个或多个线性聚合单元的多拷贝的分支或线性结构,使得所述聚合物分子在基本上相当于所述随机缠绕在所述表面上的投影的区域内附部署。正如下文更充分论述的,只要聚合物分子是线性的,在一个实施方案中,"基本上相当的"就上述投影而言指直径等于所述线性聚合物末端至末端距离均方根的基本上圆形的区域。在另一个实施方案中,对于线性的或分支的聚合物,"基^上相当的"指直径是所述聚合物总长度的一半或更小的、或者在另一个实施方案中是十分之一或更小的、或者在又一个实施方案中是百分之一或更小的基本上圆形的区域。另一方面,本发明包括多核苷酸分子的阵列,其包含(a)具有表面的支持物;及(b)附着于所述表面的众多多核芬酸分子,其中各个多核苷酸分子具有随机缠绕状态且包含多拷贝的靶序列的串联物,使得所述多核苷酸分子在基本上相当于所述随机缠绕在所述表面上的投影的区域内附着于所述表面且以使得至少30。/。的所述多核苷酸分子的最近相邻距离为至少50nm的密度随机部署。本发明提供了制备所提供的聚合物分子的阵列的方法,其中各个聚合物分子具有随机缠绕或相似的或其它三维状态且包含一个或多个线性聚合单元的多拷贝的分支或线性结构,使得现有的聚合物分子在基本上相当于所述随机缠绕在所述表面上的投影的区域内或者大小是所述聚合物总长度的一半或更小、十分之一或更小、或者百分之一或更小的区域内附着于所述表面,且以使得至少20%或至少30%的所述聚合物分子可独立检测的密度随机部署。又一方面,本发明提供了单分子的阵列,其包含(a)具有平坦表面的支持物,所述表面具有离散分隔区的规则阵列,其中各个离散分隔区的面积小于lpn^且其上附着有反应性官能度;及(b)附着于所述表面的众多单分子,其中各个单分子包含一个大分子结构和至少一个具有附着模块的分析物,使得各个大分子结构包含一个独特官能度和能够与所述离散分隔区的所述反应性官能度形成联接的众多附着官能度,且使得所述分析物通过所述独特官能度与所述分析物的所述附着模块之间的联接而附着于所述大分子结构,其中所述众多单分子随机部署于所述离散分隔区上,使得至少大多数所述离散分隔区只包含一个单分子。另一方面,本发明提供了多核苷酸分子的阵列,其包含(a)具有表面的支持物,所述表面其上附着有捕捉寡核苷酸;及(b)附着于所述表面的众多多核苷酸分子,其中各个多核苦酸分子包含多拷贝的耙序列与衔接头寡核香酸的串联物,使得所述多核苷酸分子通过所述捕捉寡核苷酸与所述衔接头寡核苷酸之间形成的一个或多个复合物而附着于所述表面,所述多核苷酸分子以使得至少大多数所述多核香酸分子的最近相邻距离为至少50nm的密度随机部署在所述表面上。在这个方面的一个实施方案中,所述表面是具有离散分隔区阵列的平坦表面,其中各个离散分隔区的大小相当于所述多核苷酸分子的大小且其上附着有捕4足寡核苷酸,且其中基本上所有这样的区域附着有至多一个所述多核苷酸分子。本发明进一步包括制备多核苷酸分子阵列的方法,其包括以下步骤(a)产生众多多核苷酸分子,各自包含来自来源DNA的DNA片段与衔接头寡核苷酸的串联物;并(b)将所述众多多核苷酸分子部署至具有表面的支持物上,所述表面其上附着有捕捉寡核香酸,使得所述多核香酸分子通过所述捕捉寡核苷酸与所述衔接头寡核苷酸之间形成的一个或多个复合物而固定于所述表面且使得所述多核苷酸分子以使得大多数所述多核苷酸分子的最近相邻距离为至少50nm的密度随机分布在所述表面上,从而形成多核苷酸分子阵列。另一方面,本发明提供了测定靶多核苷酸的核芬酸序列的方法,所述方法包括以下步骤(a)产生众多来自靶多核苷酸的靶串联物,各个靶串联物包含多拷贝的靶多核苷酸片段且所述众多靶串联物包含基本上覆盖所述靶多核苷酸的许多片段;(b)形成所述靶串联物的随机阵列,其以使得至少大多数所述靶串联物在光学上可分辨的密度固定于表面;(c)鉴定各个靶串联物中各个片段的至少一部分的序列;并(d)由所述串联物所述片段所述部分的序列的身份重建所述靶多核苷酸的核苷酸序列。在这方面的一个优选实施方案中,所述鉴定步骤包括以下步骤(a)使来自第一套探针的一种或多种探针与所述随机阵列在允许所述一种或多种探针与靶串联物上互补序列之间形成完美匹配双链体的条件下进行杂交;(b)使来自第二套4笨针的一种或多种揮:针与所述随机阵列在允许所述一种或多种探针与靶串联物上互补序列之间形成完美匹配双链体的条件下进行杂交;(c)连接与靶串联物在毗邻位点处发生杂交的来自第一套和第二套的探针;(d)鉴定所连接的第一和第二探针的序列;并(e)重复步骤(a)至(d)直至所述靶多核苷酸的序列可以由所连接探针的序列身^f分而确定。阵列应用(具体是一种或多种靶多核苷酸的高通量分析)的试剂盒。本发明通过提供单分子阵列展示了微阵列领域内的重大进展,所述单分子包含可能掺入了或附着有靶分析物分子的线性的和/或分支的聚合物结构。一种形式的所述单分子是以允许高效、高分辨率分析哺乳动物大小基因组的密度排列的靶多核苷酸串联物,所述分析包括所有的或实质部分的所述基因组的序列测定,来自多个基因组的选定区域的标记片段的序列测定,基因表达的数字读出,及拷贝数模式、曱基化模式、染色体稳定性、个体遗传变异的基因组范围评估,等等。附图简述图1A-1I图解了本发明方法和组合物的各种实施方案。图2A-2B图解了环化基因组DNA片段用于产生多核苦酸分析物串联物的方法。图3是包含大肠杆菌片段串联物部署的玻璃表面的图像。图4是衍生自用寡核苷酸探针选择性标记的、两个不同生物体的串联物的图像。图5是包含一个简并碱基的DNA片段的串联物的图像,各自是通过特异的连接探针鉴定的。图6是包含一段简并碱基的DNA片段的串联物的图像,各对是通过特异的探针鉴定的。图7是关于用酶促错配检测来鉴定参比序列与测试序列之间序列差异并由此构建DNA环的示意图。图8是关于用酶促错配检测来鉴定参比序列与测试序列之间序列差异并由此构建DNA环的另一示意图。发明详述除非另有说明,本发明的实施可采用有机化学、聚合物工艺、分子生物学(包括重组技术)、细胞生物学、生物化学和免疫学的常规技术和描述,它们都在本领域的技术范围内。所述的常规技术包括聚合物阵列合成、杂交、连接和用标记物进行的杂交^r测。参考下文实施例对合适的^^术进行了具体说明。然而,当然也可以使用其它等效的常规规程。所述的常规技术和描述可参阅标准实验室手册,诸如《GenomeAnalysis:ALaboratoryManualSeries》(第I-IV巻)、《UsingAntibodies:ALaboratoryManual》、《Cells:ALaboratoryManual》、《PCRPrimer:ALaboratoryManual》禾口《MolecularCloning:ALaboratoryManual》(都来自ColdSpringHarborLaboratoryPress)、《Biochemistry》第4版(Stryer,L.(1995)Freeman,NewYork)、《01igonucleotideSynthesis:APracticalApproach》(Gait(1984)IRLPress,London)、《Lehninger,PrinciplesofBiochemistry》第3版(Nelson和Cox(2000)W.H.FreemanPub.,NewYork,N.Y.)和《Biochemistry》第5版(Berg等(2002)W.H.FreemanPub"NewYork,N.Y),所有这些均全文收入本文作为所有目的的参考。本发明提供了随机单分子阵列,用于大规模平行分析分子群体,特别是DNA片段,诸如基因组DNA片段。本发明的单分子一般包含附着部分和分析物部分。附着部分包含大分子结构,供多价附着至表面,特别是表面上紧凑的或受限的区域,使得由它(附着部分)或所附着的分析物产生的信号是集中的。就是说,大分子结构占据了表面的一个紧凑的且有限的区域。本发明的大分子结构可以以多种方式结合于表面。多价的键可以是共价的或非共价的。非共价键包括在表面上的捕捉寡核苷酸与大分子结构中的互补序列之间形成双链体,通过有吸引力的非共价相互作用诸如范德华力、氢键、离子相互作用和疏7jC相互作用吸附于表面,等等。正如下文将要更充分描述的,多价的共价键合可通过在表面上提供可以与大分子结构中的众多互补官能度起反应的反应性官能度来实现。分析物部分可以经由独特的联接附着于大分子结构,或者可以形成大分子结构的一部分且与其是整合的。本发明的单分子通常自溶液随机部署到支持材料的表面上;如此,一方面,单分子均一分布在表面上,非常接近泊松分布。另一方面,单分子部署在包含离散分隔区的表面上,单分子就附着在所述离散分隔区中。大分子结构、制备方法及所述离散分隔区的面积优选选择成基本上所有这样的区域包含至多只有一个单分子。本发明的单分子(特别是串联物)优选大致以随机缠绕构型位于表面上且限制于离散分隔区的范围。一方面,离散分隔区在规则阵列中有限定的位置,它可以符合直线样式、六边形样式、等等。所述区域的规则阵列有利于分析过程中从所述阵列收集的信号的检测和数据分析。此外,单分子限制在离散分隔区的受限范围内使得信号更加集中或强烈,特别是在分析操作中使用荧光探针时,从而提供了更高的信噪比。本发明的单分子随机分布在离散分隔区上,使得给定区域通常同等可能的接受不同单分子中的任一种。换言之,所得阵列不是在制作后立即在空间上可设定地址的,但这可以通过进行鉴定或解码操作来实现。就是说,单分子的身份是可辨别的,但不是已知的。正如下文更充分描述的,在有些实施方案中,存在离散分隔区的子集,它们接受只来自相应子集的单分子,例如通过捕捉寡核苷酸与衔接头寡核香酸的互补序列所限定的。本发明的大分子结构包括聚合物,或分支的或线性的,而且可以是合成的,例如分支DNA,或者可以衍生自天然来源,例如来自患者基因组DNA的线性DNA片段。大分子结构通常包含线性单链DNA片段串联物,所述DNA片段可以是合成的,衍生自天然来源,或者可以是二者的组合。在用于本文时,术语"靶序列"指合成的核酸或衍生自天然来源(诸如患者标本)的核酸,等等。靶序列通常是通过本发明方法(例如通过RCR)产生的串联物的一部分,但也可以是其它结构诸如树状聚体和其它分支结构的一部分。当靶序列是合成的或衍生自天然来源时,通常在形成本发明的大分子结构或单分子的过程中通过各种方式来复制它们。应当了解所述方法可能在拷贝中引入错误,但它们仍然为术语"靶序列"所涵盖。可选择大分子结构的特定特征或组分来满足特定实施方案中的各种设计目标。例如,在有些实施方案中,维持分析物分子尽可能远离表面可能是有利的,例如通过提供不易弯曲的分子间隔物作为独特联接的一部分。再例如,可以将反应性官能度选择为具有有效阻止多个大分子结构附着于一个离散分隔区的尺寸。又例如,为了多种其它目的,例如增强溶解性、通过氬键促进二级结构形成、等等,可以提供具有其它官能度的大分子结构。一方面,大分子结构充分大,以致于它们的大小例如在常规生理盐水中所占据体积的线性尺度(诸如直径)大约相当于离散分隔区的大小。对于线性多核苷酸的大分子结构,一方面,大小的范围可以是几千个核芬酸(例如IO,OOO个)至数十万个核苷酸(例如10-20万个)。正如下文更充分解释的,在数个实施方案中,所述大分子结构可通过产生环状DNA然后在滚环复制反应中复制它们以形成环状DNA互补物的串联物来制备。以上概念在图1A-1G所示实施方案中有更充分的说明。在描述这些图之面,本发明的大分子结构是包含靶序列或片段串联物的单链多核苷酸。具体而言,这样的多核苷酸可以是耙序列与衔接头寡核苦酸的串联物。例如,来源核酸(1000)经处理(1001)形成单链片段(1006),优选在50-600个核香酸的范围内,更优选在300-600个核苷酸的范围内,然后与衔接头寡核瞽酸(1004)连接以形成衔接头-片段偶联物群体(1002)。来源核酸(1000)可以是使用常规技术从样品中提取的基因组DNA,或者是通过常规技术产生的cDNA或基因组文库,或者合成的DNA,等等。处理(1001)通常需要通过常规技术进行断裂,诸如化学断裂、酶促断裂或机械断裂,随后变性以产生单链DNA片段。在此实施例中,使用衔接头寡核苦酸(1004)通过图2A所示方法形成(1008)DNA环群体(1010)。一方面,群体(1010)内的各成员具有包含相同引物结合位点的衔接头和来自来源核酸(1000)的DNA片段。衔接头也可以具有其它功能性元件,包括但不限于标签序列、附着序列、回文序列、限制性位点、功能化序列、等等。在其它实施方案中,可以通过提供具有不同引物结合位点的衔接头来创建多个种类的DNA环。在形成DNA环(1010)后,可以加入引物和滚环复制(RCR)试剂,用以在常规RCR^应中产生(1011)衔接头寡核苷酸与DNA片段的互补物的串联物(1015)群体(1012),然后可以将该群体使用常规分离技术进行分离。或者,可以从包含所有可能序列的混合物中或者(在环是合成的时)从具有为环复制而选择的序列之寡核苷酸的有限混合物中通过连续连接短寡核苷酸(例如6聚物)来执行RCR。还可以通过存在与靶分子起点和终点二者互补的桥接模板DNA时连接靶DNA以产生串联物。一群不同的靶DNA可通过相应桥接模板的混合物转变成串联物。然后将分离的串联物(1014)部署(1016)到支持物表面(1018)上以形成单分子随机阵列。附着还可以包括不同严格性的清洗步骤以除去不完全附着的单分子或来自较早制备步骤且其存在不合需要的或者与表面(1018)非特异性结合的其它试剂。串联物(1020)可通过多种技术固定至表面(1018),包括共价附着和非共价附着。在一个实施方案中,表面(1018)可附着有捕捉寡核苦酸,该捕捉寡核苷酸与衔接头寡核苷酸区段(诸如引物结合位点或其它元件)形成复合物例如双链的双链体。在其它实施方案中,捕捉寡核苷酸可以包含与衔接头寡核苷酸形成三链体的寡核苷酸钳(clamp)或类似结构,例如Gryaznov等,美国专利5,473,060。在另一个实施方案中,表面(1018)可具有与串联物上互补官能度起反应而形成共价联接的反应性官能度,例如通过用于将cDNA附着至微阵歹寸的相同4支术,例如Smirnov等(2004),Genes,Chromosomes&Cancer,40:72-77;Beaucage(2001),CurrentMedicinalChemistry,8:1213-1244,收入本文作为参考。长DNA分子(例如数百个核苷酸或更长)也可以有效附着于疏水表面,诸如具有低浓度的各种反应性官能度(诸如-OH基团)的干净玻璃表面。在表面部署后,DNA片段的串联物还可以进一步原位扩增。例如在部署后,可以通过寡核苷酸杂交而重建衔接头序列内的限制性位点来切割串联物,之后将片段如下所述环化并通过RCR^应而原位扩增。图1B图示了单分子(诸如单链多核苷酸)随机阵列表面的剖面图(1102)。所述分子以本领域众所周知的方式在常规条件下(常规的DNA緩冲液,例如TE、SSC、SSPE等,室温)在溶液中形成大致填充直径大约100-300nm(取决于DNA的大小和緩冲条件)的球形体积的随机缠绕,例如Edvinsson,"Onthesizeandshapeofpolymersandpolymercomplexes",Dissertation69620(UniversityofUppsala,2002)。随才几缠绕聚合物(诸如单链DNA)的大小的一种量度是末端至末端距离的均方根,它大致是随机缠绕结构直径的量度。所述的直径,在此称为"随机缠绕直径",可以通过光散射来测量,使用诸如ZetasizerNanoSystem(MalvernInstruments,UK)的装置或类4以装置。本发明大分子结构的别的大小量度包括分子量(例如以道尔顿为单位)和聚合物总长度(在分支聚合物的情况中是其所有分支长度的总和)。在附着至表面后,取决于附着化学、联接密度、表面特性、等等,单链多核苷酸填充了平均由虚线圓圈(1108)所限定的区域(1107)为界的变平的球形体积,该虚线圆圏(1108)的直径大约等于随机缠绕构型的串联物的直径。换一种说法,一方面,大分子结构(例如串联物等)在基本上相当于其随机缠绕状态在表面(1102)上的投影的区域内附着于表面(1102),例如虚线圆圏(1108)所示。大分子结构所占据的面积可以变化,以致于在有些实施方案中,预期的面积可以在投影(1108)面积的2-3倍到所述区域的有些分数例如25-50%的范围内。如别处所示,在表面上保持紧凑形式的大分子结构使探针所产生的信号更强烈,所述探针例如焚光标记的寡核苷酸,具体是针对大分子结构或串联物的组分的。区域(1107)直径(1110)的大小和距包含单分子的最近相邻区的距离(1106)是阵列制造中感兴趣的两项数量(参数)。可釆用多种距离尺度来测量表面上单分子的紧密度,包括区域(1107)的中心至中心距离、区域(1107)的边界至边界距离、等等。在此通常采用中心至中心距离。本发明制造阵列中这些参数的选择部分取决于分析过程中所用的信号产生和检测系统。一般选择允许至少20%、或至少30%、或至少40%、或至少大多数分子通过所用信号产生和检测系统可单独解析的单分子密度。一方面,选择允许至少70。/。的信号分子可单独解析的密度。一方面,只要采用扫描电子显微术,例如用具有金纳米颗粒标记物的分子特异性探针,例如Nie等(2006),Anal.Chem.,78:1528-1534,收入本文作为参考,选择的密度使得至少大多数单分子具有50nm或更大的最近相邻距离;另一方面,选择的密度保证至少70%的单分子的最近相邻距离为100nm或更大。另一方面,只要采用光学显微术,例如用具有荧光标记物的分子特异性探针,选择的密度使得至少大多数单分子的最近相邻距离为200nm或更大;另一方面,选择的密度保证至少70%的单分子的最近相邻距离为200nm或更大。又一方面,只要使用光学显微术,例如用具有灵光标记物的分子特异性探针,选择的密度使得至少大多数单分子的最近相邻距离为300nm或更大;另一方面,选择的密度保证至少70%的单分子的最近相邻距离为300nm或更大、或者400nm或更大、或者500nm或更大、或者600nm或更大、或者700nm或更大、或者800nm或更大。在又一个实施方案中,只要使用光学显微术,选择的密度使得至少大多数单分子的最近相邻距离为显微4fe最小特征分辨率的至少两倍。另一方面,本发明的聚合物分子部署在表面上使得可独立检测的聚合物分子的密度是至少1000个/pm2、或至少10,000个/,2或至少100,000个/,2。本发明的另一方面,如图1C图示的一个具体实施方案,通过在表面上提供基本上是用于附着单分子的唯一位点的离散分隔区,避免了为保证理想的最近相邻距离而选择随机部署单分子密度的需要。即,在所述实施方案中,表面上离散分隔区之间的区域,在此称为"区域间空间/地带",就串联物或其它大分子结构不与这样的区域结合而言是惰性的。在有些实施方案中,这样的区域间地带可以用封闭剂处理,例如与串联物DNA无关的DNA、其它聚合物、等等。如图1A所示,来源核酸(1000)被断裂并衔接(1002)以供环化(1010),之后通过RCR(1012)形成串联物。然后将分离的串联物(1014)应用于具有离散分隔区(1122)规则阵列的表面(1120),各个离散分隔区的最近相邻距离(1124)由表面(1120)的设计和制造确定。如下文更充分描述的,具有微米和亚微米尺度、用于用捕捉寡核香酸或反应性官能度衍生化的离散分隔区(l122)阵列可以用常规半导体制造技术制造,包括电子束刻(electronbeamlithography)、纟内米印刻4支术(nanoimprinttechnology)、光刻(photolithography)、等等。一般连同附着化学、采用的大分子结构、等等来选择离散分隔区(1122)的面积,以符合本发明单分子的大小,使得当单分子应用于表面(1120)时基本上每个区域(1122)被不超过一个单分子所占据。通过选择反应性官能度或捕捉寡核苷酸的密度而导致所述模块比单分子上它们各自互补物要少,可以提高每个离散分隔区只具有一个单分子的可能性。因此,单分子将"占据"特定离散分隔区处所有与表面的联接,从而减少第二个单分子也将结合同一区域的机会。具体而言,在一个实施方案中,离散分隔区中基本上所有的捕捉寡核苷酸都与单个大分子结构上的衔接头寡核苷酸发生杂交。一方面,离散分隔区包含许多反应性官能度或捕捉寡核苦酸,它们的数目是单分子的互补官能度或衔接头寡核苷酸数目的大约10%至大约50%。捕捉寡核苷酸的长度和序列可以变化很大,而且可以依照众所周知的原则来选择,例如Wetmur,CriticalReviewsinBiochemistryandMolecularBiology,26:227-259(1991);Britten和Davidson,第1章,Hames等纟扁,NucleicAcidHybridization:APracticalApproach(IRLPress,Oxford,1985)。一方面,捕捉寡核香酸的长度在6-30个核苷酸的范围内;另一方面,在8-30个核苷酸的范围内,或者在10-24个核苦酸的范围内。选择捕捉寡核苷酸的长度和序列(i)以致于大分子结构与表面有效结合,使得分析操作各步骤(诸如清洗等)中大分子结构的丟失降至最低,并(ii)以致于避免对分析物分子的分析操作的干扰,特别是在分析物分子是串来物中的DNA片段时。关于(i),一方面,选择序列和长度使得捕捉寡核香酸与其互补物之间的双链体足够稳定,以致于它们在严格的清洗中不解离。关于(ii),若DNA片段来自特定物种的生物体,则在可获得的情况下可以利用数据库来筛选可以与DNA片段形成虚假的或不合需要的杂合物的潜在捕捉序列。在选择捕捉寡核苷酸的序列时的其它因素与选择引物、杂交探针、寡核苷酸标签、等等中所考虑的那些因素类似,对此有许多指导手册,正如下文定义部分所引用的参考文献所证实的。在有些实施方案中,离散分隔区可以包含一种以上的捕捉寡核苷酸,且每种不同的捕捉寡核香酸可以具有不同的长度和序列。在采用离散分隔区规则阵列的实施方案的一个方面,选择捕捉寡核苷酸的序列以致于位于最近相邻区的捕捉寡核香酸具有不同的序列。在直线阵列中,这样的构型是通过成排交替的序列类型实现的。在其它实施方案中,表面可具有众多离散分隔区子阵列,其中各个不同的子阵列的捕捉寡核苷酸具有不同于其它子阵列捕捉寡核苷酸的独特核苷酸序列。众多子阵列可包括2个子阵列,或者4个或更少子阵列,或者8个或更少子阵列,或者16个或更少子阵列,或者32个或更少子阵列,或者64个或更少子阵列。在其它实施方案中,表面可包含5000个或更少子阵列。一方面,捕4足寡核苦酸通过间隔物分子例如聚乙二醇或类似惰性链附着于阵列的表面,如同微阵列所做的,这是为了使表面基团不合需要的影响或者与捕捉寡核苷酸或其它试剂的相互作用降至最低。一方面,离散分隔区(1122)的面积小于lnm另一方面,离散分隔区(1122)的面积在0.04|11112至1|11112的范围内;又一方面,离散分隔区(1122)的面积在0.2|^112至1|_11112的范围内。另一方面,当离散分隔区的形状大约是圆形或正方形,使得其大小可以用单个线性尺度指示时,所述区域的大小在125nm至250nm的范围内,或者在200nm至500nm的范围内。一方面,区域(1122)的最近邻居的中心至中心距离在0.25^im至20pm的范围内;另一方面,所述距离在l(am至10iimi的范围内,或者在50-1000nm的范围内。一方面,区域(1122)可以实质上任何样式排列在表面(1120)上,其中区域(1122)具有限定的位置,即在任何规则阵列中,这使得信号收集和数据分析功能更加高效。这样的样式包括但不限于区域(1122)的同心圆、螺线样式、直线样式、六角形样式、等等。区域(1122)优选以直线或六角形样式排列。如图1D所示,在某些实施方案中,从来源核酸(1200)制备的DNA环不需要包含衔接头寡核苷酸。如前,将来源核酸(1200)断裂并变性(1202)以形成单链片段群体(1204),优选大小在大约50-600个核香酸的范围内,更优选大小在大约300-600个核苷酸的范围内,之后在非模板驱动反应中用环化连接酶i者如CircLigase(EpicentreBiotechnologies,Madison,WI)等3寻它们环4匕。在形成DNA环(1206)后,通过提供与选定序列结合的引物混合物而产生串联物。引物混合物可以选择成使DNA环(1206)的全部成员中只有一个子集产生串联物。在串联物产生之后(1208),将它们分离并应用至表面(1210)以形成本发明的随机阵列。如上所述,本发明的单分子包含附着部分和分析物部分,附着部分包含使得该单分子多价附着至表面的大分子结构。如图1E所示,大分子结构可以是通过RCR^应制备的串联物,其中反应中的DNA环是合成的。然后单分子的分析物部分经由串联物上的独特官能度而附着。实质上任何序列的合成DNA环都可以使用众所周知的技术来产生,方便的是大小高达数百个核香酸(例如200个),而4交困难的是好几百个核香酸(例如长达500个),例如Kool,美国专利5,426,180;Dolinnaya等(1993),NucleicAcidsResearch,21:5403-5407;Rubin等(1995),NucleicAcidsResearch,23:3547-3553;等等,均收入本文作为参考。将包含引物结合位点(1301)的合成DNA环(1300)在RCR反应(1306)中与引物(1302)联合以产生串联物(1308)。在此实施方案中,所有的环通常具有相同的序列,尽管可以采用不同的序列,例如用于通过互补附着模块(诸如衔接头序列与捕捉寡核苷酸)引导串联物子集至预先选定的阵列区域。将引物(1302)合成为在其5,端具有能够与分析物上的互补官能度起反应以形成共价联接的官能度(1304,表示为"R")。例示性的官能度包括氨基、巯基、等等,它们可以用商品化化学(例如GlenResearch)附着。将串联物(1308)应用至表面(1310)以形成阵列(1314),之后将具有附着模块的分析物(1312)应用至表面(1310),在此通过独特官能度R(1311)与附着模块的反应与串联物形成联接。或者,在应用至表面(1310)前,可以将串联物(1308)与分析物(1312)结合,使得附着模块和独特官能度可以起反应以形成联接,之后将所得偶联物应用至表面(1310)。在选择适当的附着模块和独特官能度用于连接串联物(1308)和许多种类分析物的方面,文献中有许多指导。一方面,为了将蛋白质或肽分析物与串联物连接,有许多同型和异型双功能试剂是商品化的(例如Pierce),而且才皮露于文献中诸如Hermanson,BioconjugateTechniques(AcademicPress,NewYork,1996),收入本文作为参考。例如,只要独特官能度是氨基,那么就可以使用3-(2-吡啶基二硫代)丙酸N-琥珀酰亚胺酯(N-succinimidyl3画(2-pyridyldithio)propionate,SPDP)、琥珀酰亚氨基氧羰基-ot匿曱基-a-(2-吡啶基二硫代)甲苯(succinimidyloxycarbonyl-a-methyl-oc-(2-pyridyldithio)toluene,SMPT)、4-(N-马来酰亚胺曱基)环己胺-1-羧酸琥珀酰亚胺酯(succinimidyl-4-(N-maleimidomethyl)cyclohexane-l-carboxylate,SMCC)、间陽马来酰亚胺苯曱酰基-N-羟基琥珀酰亚胺酯(m-maldmidobenzoyl—N匿hydroxysucxinimideester,MBS)、(4匿》#。S^l)m曱酸N-琥珀酰亚胺酯(N-succinimidyl(4-iodoacetyl)aminobenzoate,SIAB)、6-((碘乙酰基)氨基)己酸琥珀酰亚胺酯(succinimidyl6-((iodoacetyl)amino)hexanoate,SIAX)等等试剂将串联物(1308)与分析物上的巯基连接。分析物上合适的互补官能度包括氨基、巯基、羰基,它们可以是天然存在于分析物上的,或者可以通过与合适的同型或异型双功能试剂的反应而添加上去。分析物分子还可以通过非共价联接的方式而附着于大分子结构,诸如生物素-链霉亲合素联接、附着于串联物的第一寡核苷酸与附着于分析物的或者形成分析物一部分的互补寡核苷酸之间复合物(例如双链体)的形成、或类似联接。分析物包括生物分子,诸如核酸(例如DNA或RNA片段)、多糖、蛋白质等等。如上所述,本发明的大分子结构可以包括分支聚合物和线性聚合物,诸如DNA片段的串联物。例示性的分支聚合物结构如图1F和1G中所示。在图1F中,图示了包含一个主链多核苷酸(1400)和多个支链多核苷酸(1402)的分支DNA结构,各个分支多核芬酸(1402)通过其5,端与主链多核香酸(1400)连接以形成梳子样结构,所述结构的所有末端都是3,的,只有主链多核苷酸(1400)上有单个5,末端(1404),该5,末端(1404)经过书f生而具有一个独特官能度。如下所述,所述独特官能度可以是反应性化学基团,例如受到保护的或不受保护的氨基、巯基、等等,或者它可以是具有独特序列的寡核苷酸,用于捕捉具有序列与其互补的寡核苷酸的分析物。类似的,所述独特官能度可以是捕捉模块,诸如生物素等。这样的分支DNA结构是用已知技术合成的,例如Gryaznov,美国专利5,571,677;Urdea等,美国专利5,124,246;Seeman等,美国专利6,255,469;等等,均收入本文作为参考。只要所述大分子结构是多核苷酸,其组分的序列就可以选择成便于自我装配,或者它们可以经由专门的连接化学而连接,例如下文所公开的,在此情况中基于其它因素选择序列,包括在有些实施方案中的避免自身退火、容易与表面上的捕捉寡核苷酸结合、等等。在图1G中,图示了包含寡核苷酸(1406)的树状结构,它用各自具有两个官能度(1410,表示为"R")的多个三价连接基团(1408)衍生,通过所述官能度(1410)可附着另外的聚合物(1407)例如多核苷酸以与寡核苷酸(1406)形成联接从而形成大分子结构(1409),继而,如果类似地用多价接头衍生,该大分子结构(1409)可形成核酸树状聚体。用于寡核苷酸的三价接头(1408)披露于Iyer等,美国专利5,916,750,收入本文作为参考。如图1H所示,一旦构建了这样的树状聚体的或分支的结构(1411),它们就可以如上文关于线性多核香酸的描述附着于阵列(1420),之后分析物(1430)可以经由独特官能度(1410)而附着。任选的是,可以用常规技术给未反应的独特官能度(1422)加帽。或者,树状聚体的或分支的结构(1411)可以首先例如在溶液中与分析物(1430)结合,从而形成偶联物,然后将该偶联物部署在阵列(1420)上。当所述分析物是具有游离3,末端的多核苷酸(1440)时,如图1I所示,所述末端可以在原位RCR反应中延伸以形成靶序列的串联物或用于进一步添加的其它序列。类似的,多核苷酸分析物可以用常规技术通过连接来延伸。来源核酸和耙序列环化在本发明的一个方面,大分子结构包含多核苷酸分析物即靶序列的串联物,所述分析物提取或衍生自样品,诸如来自患者、有经济利益的生物体、等等的基因组DNA或cDNA。包含所述单分子的本发明随机阵列可用于提供基因组范围的分析,包括序列测定、SNP测量、等位基因定量、拷贝数测量、等等。对于哺乳动物大小的基因组,优选以至少两个阶^a进行断裂,第一阶段是产生大小在大约100Kb(千碱基)至大约250Kb范围内的一群片段,而第二阶段,分开应用于各个100-250Kb片段,产生大小在大约50-600个核苷酸范围内、更优选大约300-600个核苷酸范围内的片段,用于产生供随机阵列使用的串联物。在本发明的有些方面,第一阶段断裂还可用于选择所述片段的预定子集,例如包含编码信号转导途径蛋白质的基因的片段等。构建本发明阵列所需基因组DNA的量可变化很大。一方面,对于哺乳动物大小的基因组,自至少10个基因组当量的DNA产生片段;另一方面,自至少30个基因组当量的DNA产生片段;又一方面,自至少60个基因组当量的DNA产生片段。基因组DNA使用常规技术来获得,例如披露于Sambrook等,见上文,1999;CurrentProtocolsinMolecularBiology,Ausubel等,编(JohnWileyandSons,Inc.,NY,1999);等等。分离基因组DNA的重要因素包括l)DNA不含DNA加工酶和污染性盐类;2)整个基因组同等呈现;和3)DNA片段的长度在大约5,000和100,000bp之间。在许多情况中,不需要消化所提取的DNA,因为溶胞和提取过程中产生的剪切力将产生期望范围中的片段。在另一个实施方案中,可以使用限制性内切核酸酶通过酶促断裂而产生更短的片段(1-5kb)。在一个实施方案中,10-100个基因组当量的DNA保证片段群体覆盖整个基因组。在有些情况中,倘若只能得到小量的样品DNA且有经由非特异性结合(例如对容器壁的)而损失的风险等等,有利的是提供载体DNA,例如无关环状合成双链DNA,与样品DNA混合并一起使用。在任一阶段产生片段时,片段或者可以衍生自整个基因组,或者可以衍生自基因组的选定子集。许多技术可用于从基因组子集分离或富集片段,见收入本文作为参考的以下文献Kandpal等(1990),NucleicAcidsResearch,18:1789-1795;Callow等,美国专利出版物2005/0019776;Zabeau等,美国专利6,045,994;Deugau等,美国专利5,508,169;Sibson,美国专利5,728,524;Guilfoyle等,美国专利5,994,068;Jones等,美国专利出版物2005/0142577;Gullberg等,美国专利出版物2005/0037356;Matsuzaki等,美国专利出版物2004/0067493;等等。对于哺乳动物大小的基因组,基因组DNA的初步断裂可以通过用一种或多种"罕见"切割限制性内切核酸酶(诸如NotI、Ascl、Bael、CspCI、PacI、Fsel、Sapl、Sfil、Psrl等)进行消化来实现。所得片段可以直接使用,或者对于已经测序的基因组,可以从所述经消化的DNA分离特定片段供后续加工使用,如图2B所示。将基因组DNA(230)用罕见切割限制性内切核酸酶消化(232)以产生片段(234),之后将片段(234)用5,单链外切核酸酶(诸如人夕卜切核酸酶)进一步短期(即不让反应进行完全)消化以暴露片l殳末端与限制性位点序列相邻的序列(237)。所述暴露的序列对于每个片段将是独特的。因此,可以将对期望片段的末端特异性的生物素化引物(241)与捕捉寡核苷酸退火以供分离;或者,可以将所述片段与具有捕捉模块(诸如生物素)的引物退火并用没有链置换活性的DNA聚合酶(诸如Taq聚合酶Stoffel片段)延伸。所述延伸后,引物(241)的3,末端邻接片段的顶链(242),使得它们可以连接而形成连续的链。后一种方法还可以用具有链置换活性并通过合成置换顶链(242)的DNA聚合酶来进行。在任一种方法中,然后可以使用经链霉亲合素衍生化的固相支持物(239)来分离(240)生物素化的片段。另一方面,将基因组DNA模板的引物延伸用于产生目的基因组区域周围大于10kb的选定序列的线性扩增。例如,为了产生限定大小的靶物群体,用正向引物进行20个循环的线性扩增,然后用反向引物进行20个循环。在应用第二种引物前,将第一种引物用长DNA纯化标准柱除去或者降解(如果掺入了少数尿嘧咬碱基的话)。产生了相对于正向链更大数目的反向链,得到双链分子和单链反向链的群体。反向引物可以生物素化以捕捉至链霉亲合素珠,其可以加热以使所捕获的任何双链同型双链体解链。所有附着的分子将是单链的且代表最初基因组DNA的一条链。所产生的产物可以断裂至大小为0.2-2kb,更优选大小为0.3-0.6kb(将它们自固相支持物有效释放)并环化供RCR^应。在一种环化方法中,如图2A所示,在将基因组DNA(200)断裂和变性(202)后,首先将单链DNA片段(204)用末端转移酶处理(206)以将聚dA尾(208)附着至3,末端。然后借助一端与聚dA尾互补且另一端与任何序列互补(依靠一段简并核苷酸)的桥接寡核苦酸(210)进行分子内游离末端的连接(212)。桥接寡核香酸(210)的双链体区域(214)包含至少一个RCR引物结合位点,在有些实施方案中,还有提供捕捉寡核苷酸互补物的序列,它可以与引物结合位点序列相同或不同,或者可以与引物结合位点序列交叠。捕捉寡核苷酸的长度可以变化很大。一方面,捕捉寡核香酸及其在桥接寡核苦酸中的互补物的长度在10-100个核苷酸的范围内,更优选在10-40个核苷酸的范围内。在有些实施方案中,双链体区域(214)可以包含别的元件,诸如寡核苦酸标签,例如用于鉴定其关联DNA片段来源的来源核酸。就是说,在有些实施方案中,来自不同来源核酸的环或衔接头连接或串联物可以分开制备,期间使用包含独特标签的桥接衔接头,之后将它们混合以制备串联物或应用至表面以产生随机阵列。所述关联片段可以在这样的随机阵列上通过用与串联物中其相应标签序列互补的经标记标签杂交或通过对整个衔接头或衔接头的标签区域测序来鉴定。环状产物(218)可以通过常Mi屯化柱、用一种或多种适宜的外切核酸酶消化非环状DNA、或二者而方i^更的分离。如上所述,期望大小范围(例如50-600个核苦酸)的DNA片段可以使用环化酶(诸如CircLigase的无需模板就环化单链DNA的单链DNA连接酶)环化。CircLigase依照制造商(Epicentre,Madison,WI)的说明书使用。用于形成包含DNA片段和一种或多种衔接头的单链DNA环的一种优选规程使用标准连接酶(诸如T4连接酶)将衔接头连接至DNA片段的一个末端,然后使用CircLigase来闭环,如下文更完整描述的。用于产生包含衔接头寡核苷酸和靶序列的DNA环的例示性规程使用T4连接酶。靶序列是合成寡聚物T1N(序列5'-NNNNNNNNGCATANCACGANGNCGNNNNNNNN-3')(SEQIDNO:1)。衔接头由两条分开的寡聚物构成。连接至T1N5'末端的衔接头寡聚物是BR2-ad(序列5'-TATCATCTGGATGTTAGGAAGACAAAAGGAAGCTGAGGACATTAACGGAC-3')(SEQIDNO:2),连接至T1N3'末端的衔接头寡聚物是UR3-ext(序列5'-ACCTTCAGACCAGAT-3')(SEQIDNO:3)。UR3-ext包含IIs型限制性酶位点(AcuI:CTTCAG)以提供将DNA环线性化供插入第二衔接头的方法。将BR2-ad与BR2-temp(序列5'-NNNNNNNGTCCGTTAATGTCCTCAG-3')(SEQIDNO:4)退火以形成双链衔接头BR2衔接头。将UR3-ext与生物素化的UR3-temp(序列5'-[生物素]ATCTGGTCTGAAGGTNNNNNNN-3')(SEQIDNO:5)退火以形成双链衔接头UR3衔接头。将lpmol靶TlN在单个连接反应中连接至25pmo1BR2衔接头和10pmo1UR3衔接头,该反应含有50mMTris-Cl,pH7.8,10%PEG,lmMATP,50mg/LBSA,10mMMgCl2,0.3个单位/VlT4DNA连接酶(EpicentreBiotechnologies,WI)和10mMDTT,终体积10pl。将连接反应温育,温度循环程序为15。Cll分钟、37。Cl分钟,重复18次。通过70。C加热10分钟终止反29应。通过用链霉亲合素-兹珠(NewEnglandBiolabs,MA)捕捉连接产物来除去过量的BR2衔接头。将3.3pl4x结合緩沖液(2MNaCl,80mMTrisHC1pH7.5)加至连接反应,然后加入lx结合緩冲液(0.5MNaCl,20mMTrisHC1pH7.5)中的15吗链霉亲合素磁珠。于室温温育15分钟后,将磁珠用4倍体积的低盐緩冲液(0.15MNaCl,20mMTrisHC1pH7.5)清洗两次。将洗脱緩沖液(10mMTrisHC1pH7.5)预先加热至70。C,取l(Hd加至磁珠,于70。C温育5分钟。磁力分离后,保存上清液,作为初级纯化样品。将此样品进一步纯化,通过用预先结合有生物素化寡聚物BR-rc-bio(序列5'-[生物素]CTTTTGTCTTCCTAACATCC-3')(SEQIDNO:6)的磁珠除去过量的UR3衔接头,所述寡聚物与BR2-ad反向互补,与上文所述类似。通过尿素聚丙烯酰胺凝胶电泳分析来评估最终纯化样品中衔接头-靶连接产物的浓度。进行环化,通过在供应商提供的标准緩沖液和lmMATP中用0.2个单位/plT4多核苷酸激酶(EpicentreBiotechnologies)裤酸化连接产物并使用0.3个单位/jilT4DNA连接酶(EpicentreBiotechnologies)和lmMATP用IO倍摩尔过量的夹板(splint)寡聚物UR3-closing-88(序列5'-AGATGATAATCTGGTC-3')(SEQIDNO:7)环化。通过如下所述进行RCR^应来验证环化产物。通过滚环复制产生多核苷酸串联物在本发明的一个方面,单分子包含在常规滚环复制(RCR)反应中产生的多核苷酸串联物,所述多核苷酸通常是多核苷酸分析物,即靶序列。关于选择RCR^应的条件和试剂的指导参见普通技术人员可得到的许多参考文献,例如收入本文作为参考的以下文献Kool,美国专利5,426,180;Lizardi,美国专利5,854,033和6,143,495;Landegren,美国专利5,871,921;等等。RC版应成分一般包括单链DNA环、一种或多种能与DNA环退火的引物、具有链置酶延伸以形成DNA环成分串联物的条件下合并。例示性的RCR反应规程如下在50ial反应混合液中,混合以下成分2-50pmol环状DNA,0.5个单位/|11噬菌体cp29DNA聚合酶,0.2吗/^lBSA,3mMdNTP,IXcp29DNA聚合酶反应緩冲液(Amersham)。RCR^应于30。C进行12小时。在有些实施方案中,聚合酶反应中环状DNA的浓度可以选择成低的(每ml含大约IOO-IOOO亿个环,或每皮升含10-100个环),以避免纠缠和其它分子间相互作用。通过RCR产生的串联物优选在大小方面是大致均一的;因此,在有些实施方案中,制造本发明阵列的方法可以包括选择串联物大小的步骤。例如,一方面,串联物选择成分子量变异系数小于大约30%的群体;而在另一个实施方案中,小于大约20%。一方面,通过向RCR^应混合液中添加低浓度的链终止物(诸如ddNTP)以减少很大串联物(例如由聚合酶以更高速率合成的DNA环产生的)的存在,进一步提高了大小均一性。在一个实施方案中,所用ddNTP的浓度导致预期串联物大小在50-250Kb范围内,或者在50-100Kb范围内。另一方面,可以使用常规分离技术来富集特定大小范围的串联物,例如大小排阻层析、膜过滤、等等。包含分支聚合物和DNA装配物的大分子结构的产生在本发明的一个方面,大分子结构包含具有至少一个独特官能度(对于多核苷酸通常是5,或3,末端的官能度)和众多互补官能度(能够与固相支持物表面的反应性官能度特异性起反应)的聚合物。包含分支聚合物(尤其是分支多核苷酸)的大分子结构可以以多种方式来合成,4皮露于Gryaznov,见上文;Urdea,见上文;等等。一方面,本发明的分支聚合物包括;阮子型分支聚合物,其包含一个线性聚合单位,该线性聚合单位具有一个或多个位于内部单体和/或联接模块的分支点。本发明的分支聚合物还包括叉子型分支聚合物,其包含一个线性聚合单位,该线性聚合单位具有一个或多个位于末端单体和/或联接模块的分支点。本发明的大分子结构还包括通过一个或多个双链体或三链体结合在一起的线性和/或分支多核香酸的装配物。所述装配物可以是由线性多核苷酸成分自我装配得到的,例如披露于Goodman等,Science,310:1661-1665(2005);Birac等,J.Mol.GraphModel,(April18,2006);Seeman等,美国专利6,255,469;等等,收入本文作为参考。一方面,本发明的线性聚合单位的形式为"-(M-L)n--",其中L是接头模块而M是可以选自极其广泛的化学结构以提供一系列功能的单体,所述功能包括充当惰性非空间阻碍间隔物模块和提供反应性官能度,所述反应性官能度可充当供附着其它成分的分支点、供附着标记物的位点、供附着寡核苷酸或其它结合聚合物(供杂交或结合至扩增链或结构)的位点(例如披露于Urdea等,美国专利5,124,246或Wang等,美国专利4,925,785)、供附着"钩子"(hook)的位点(例如4皮露于Whiteley等,美国专利4,883,750)、或供附着影响溶解性、促进双链体和/或三链体形成的其它基团(诸如嵌入剂、烷化剂、等等)的位点。以下参考文献披露了适用于本发明的数种亚磷酰胺(phosphoramidite)和/或氢膦酸酯(hydrogenphosphonate)单体并提供了关于其合成和掺入寡核苷酸的指导Newton等,NucleicAcidsResearch,21:1155-1162(1993);Griffin等,J.Am.Chem.Soc"114:7976-7982(1992);Jaschke等,TetrahedronLetters,34:301-304(1992);Ma等,国际申请PCT/CA92/00423;Zon等,国际申请PCT/US90/06630;Durand等,NucleicAcidsResearch,18:6353-6359(1990);Salunkhe等,J.Am.Chem.Soc"114:8768-8772(1992);Urdea等,美国专利5,093,232;Ruth,美国专利4,948,882;Cruickshank,美国专利5,091,519;Hamlambidis等,NucleicAcidsResearch,15:4857-4876(1987);等等。更具体的说,M是直链的、环状的、或分支的有机分子结构,含l-20个碳原子和0-10个选自氧、氮和硫的杂原子。优选的是,M是含l-16个碳原子的烷基、烷氧基、烯基或芳基;含3-8个碳原子和l-3个选自氧、氮和硫的杂原子的杂环基;糖基;或核苷基。更优选的是,M是含l-8个碳原子的烷基、烷氧基、烯基或芳基;糖基;或核苷基。优选的是,L是磷(V)连接基团,可以是磷酸二酯、磷酸三酯、氨基磷酸酯、二硫代磷酸酯、硫代磷酸酯、膦酸酯的曱酯或.乙酯、等等。衍生自亚磷酰胺或氢膦酸酯前体的联接一般是优选的,使得本发明的线性聚合单位可以用商业性自动化DNA合成仪来常规合成,例如AppliedBiosystems,Inc.(FosterCity,Calif.)394型等。n可以显著变化,取决于M和L的性质。n的变化范围通常为大约3到大约100。当M是核苷或其类似物或者核苷大小的单体且L是磷(V)联接时,n的变化范围为大约12到大约100。优选的是,当M是核苷或其类似物或者核苷大小的单体且L是磷(V)联接时,n的变化范围为大约12到大约40。聚合单位通过在它们之间形成一个或多个共价桥接而装配。一方面,桥接是通过一个或多个成分上的硫醇、硫代磷酸酯或二硫代磷酸酯基团与一个或多个其它成分上的卣代酰基或卣代烷基氨基基团起反应而形成一个或多个硫代或二硫代磷酰基酰基或者硫代或二硫代磷酰基烷基桥接而形成的。所述桥接一般具有一种或多种以下形式—NHRSP(=Z)(0>--或-NHRS-,其中R是烷基或酰基而Z是硫或氧。装配反应可以牵涉2-20个成分,取决于具体的实施方案;但优选牵涉2-8个成分;更优选牵涉2-4个成分。优选的是,卣代酰基或卣代烷基氨基基团是卣代乙酰基氨基基团;更优选的是,卤代乙酰基氨基基团是溴代乙酰基氨基基团。卣代酰基或卣代烷基氨基基团的酰基或烷基模块含1-12个碳原子;更优选的是,所述模块含l-8个碳原子。反应可以在极其多种溶剂系统中进行;但装配反应一般在液态含水条件下或者在冷冻状态中在冰中进行,例如通过P条低液态含水反应混合液的温度而得到的。或者,DMSO/H20中硫代磷酰基乙酰基氨基桥接的形成已有报导,见Thuong等,TetrahedronLetters,28:4157-4160(1987)及Francois等,Proc.Natl.Acad.Sci.,86:9702-9706(1989)。典型的含水条件在25mMNaCl和15mM磷酸盐緩冲液(pH7.0)中含4pM反应物。硫代或二硫代磷酰基酰基或者硫代或二硫代磷酰基烷基氨基桥接是优选的,因为它们可以由氧化剂容易的且选择性的切割,诸如硝酸银、碘化钾、等等。优选用碘化钾Kl3在相当于大约100倍摩尔过量于桥接的浓度切割桥接。通常采用Kl3的浓度为大约0.1M。这些桥接易于切割在复杂大分子结构的合成方面是极其有利的,因为它提供了用于分析最终产物和验证最终产物的结构是正确的便利方法。将3'-卣代酰基或卣代烷基氨基(在此实施例中是卣代乙酰基氨基)衍生化寡核苷酸l与5'-硫代磷酸酯衍生化寡核苦酸2依照以下方案起反应5'-BBB...B-NHC(=0)CH2X+(1)S-P(O)(O國)-BBB...B-3,~>(2)5'画BBB...B-NHC(=0)CH2SP(=0)(0)0-BBB…B-3,其中X是卣素而B是核苷酸。应当了解核苷酸仅仅是更一般的聚合单位即上文所述(M-L)n的例示。化合物1可以通过将N,N-二曱基曱酰胺(DMF)中的卣代乙酸N-琥珀酰亚胺酯与硼酸钠緩沖液中的3'-氨基脱氧核糖核苦酸前体于室温起反应来制备。大约35分钟后,将混合物稀释(例如用H20),脱盐,并纯化(例如通过反相HPLC)。Y-氨基脱氧核糖核苦酸前体可以如Gryaznov和Letsinger,NucleicAcidsResearch,20:3403-3409(1992)所述来制备。简言之,去保护后,将经标准琥珀酰基联接与支持物相连的脱氧胸苦的5'羟基通过在适宜溶剂(诸如二氯曱烷/二异丙基乙胺)中与氯-(二异丙基乙基氨基)-曱氧基膦的反应而膦酸化(phosphitylate)。用四唑活化后,将5'-膦酸化胸苷与5'-三苯曱基-0-3'-氨基-3'-脱氧核苷起反应而形成核苷-胸苷二聚体,其中核苷模块通过氨基磷酸酯联接而共价连接。寡核苷酸的剩余部分通过标准亚磷酰胺化学来合成。切割琥珀酰基联接后,通过酸处理(例如80%含水乙酸,18-20小时,室温)切割氨基磷酸酯联接而产生含3'末端氨基基团的寡核苷酸。5,-33单硫代磷酸(酯)寡核苦酸2如下形成将5'单磷酸酯附着至寡核苷酸的5'末端,或是通过化学方法或是用激酶酶促的',例如Sambrook等,MolecularCloning:ALaboratoryManual,第2版,ColdSpringHarborLaboratory,NewYork,1989。优选的是,作为寡核苦酸合成的最后一步,通过化学磷酸化添力口单石舞酸酉旨,3口Thuong和Asscline,Eckstein编6々《OligonucleotidesandAnalogues))中的第12章(IRLPress,Oxford,1991)或Hom和Urdea,TetrahedronLett.,27:4705(1986)(例如^f吏用商业性试剂,诸如ClontechLaboratories(PaloAlto,Calif.)的5'Phosphate-ON.TM.)所述。然后使用常规硫化剂将5'-单磷酸酯碌L/f匕,例如用Ss在吡。^/CS2(1:1,v/v)中的5。/。溶液处理(45分钟,室温);或者用美国专利5,003,097、5,151,510或5,166,387所述硫化剂处理。单二硫代磷酸酯通过类似规程来制备,例如Froehler等,欧洲专利出版物0360609A2;Caruthers等,国际申请PCT/US89/02293;等等。与上文类似,将5'-闺代乙酰基氨基衍生化寡核苷酸3与3'-单硫代磷酸(酯)寡核苷酸4依照以下方案起反应3,-BBB..B-NHC(=0)CH2X+(3)S陽P(O)(CT)O-BBB…B-5,■>(4)3,-BBB...B-NHC(=0)CH2SP(=0)(0>BBB...B-5,其中各符号的定义与上文相同,只是j聚物和k聚物的核苷酸单体取向相反。在这种情况中,化合物3可以通过将N,N-二曱基曱酰胺(DMF)中的卤代乙酸N-琥珀酰亚胺酯与硼酸钠緩沖液中的5'-氨基脱氧核糖核苷酸前体于室温起反应来制备,如上文关于3'-氨基寡核苷酸所述。5'-氨基脱氧核苷依照以下参考文献所述来制备Glinski等,J.Chem.Soc.Chem.Comm.,915-916(1970);Miller等,J.Org.Chem.29:1772(1964);Ozols等,Synthesis,7:557-559(1980);Azhayev等,NucleicAcidsResearch,6:625-643(1979);收入本文作为参考。3'-单硫代磷酸(酯)寡核苷酸4可以如Thuong和Asscline(见上文)所述来制备。末端的聚合单位。用于附着支链的反应性官能度可以在多个位点引入。优选的是,氨基官能度引入到选定单体的聚合单位或环上或者连接模块上,然后转变成卣代乙酰基氨基基团,如上所述。核苷单体的氨基衍生化碱基可以如以下文献所述来引入Urdea等,美国专利5,093,232;Ruth,美国专利4,948,882;Haralambidis等,NucleicAcidsResearch,15:4857-4876(1987);等等。氨基官能度还可以通过ClontechLaboratories(PaloAlto,Calif.)的商业性脱保护羟胺亚磷酰胺像AminomodifierII.TM.来引入。优选的是,氨基官能度通过用12和烷基二胺氧化亚磷酸酯联接产生衍生化氨基磷酸酯联接来引入,例如Agrawal等,NucleicAcidsResearch,18:5419-5423(1990)及Jager等,Biochemistry,27:7237-7246(1988)。一般而言,对于上述规程,优选卣代酰基或卣代烷基氨基衍生化聚合单位与硫代磷酸酯衍生化聚合单位分开制备,否则硫代磷酸酯模块需要保护基团。用于构建随机阵列的固相表面极其多种支持物可用于本发明。一方面,支持物是具有表面、优选基本上平坦的表面的刚性固体,使得待查询的大分子处于同一平面。后一特征容许高效信号采集,例如通过检测光学。另一方面,本发明的固体支持物是无孔的,特别是在单分子随机阵列通过要求小体积的杂交反应来分析时。合适的固体支持物材料包括诸如玻璃、聚丙烯酰胺包被的玻璃、陶瓷、硅土/珪石、硅、石英、各种塑料等材料。一方面,平坦表面的面积可以在0.5-4cr^的范围内。一方面,固体支持物是具有均一石圭烷化表面的玻璃或石英,诸如显樣史镜载玻片/盖玻片。这可以使用常规方案来实现,例如用酸处理,然后浸入3-缩水甘油氧基丙基三曱氧基硅烷、N,N-二异丙基乙胺和无水二曱苯(8:1:24v/v)的80。C溶液,它形成环氧硅烷化表面,例如Beattie等(l"5),MolecularBiotechnology,4:213。这样的表面易于处理成容许捕捉寡核苷酸的末端附着,例如通过在应用于表面前提供具有3,或5,三甘醇磷酰基间隔物的捕捉寡核苷酸(参阅Beattie等,见上文)。许多其它方案可用于将反应性官能度添加至3皮璃和其它表面,如Beaucage(见上文)所纟皮露的。只要不需要酶促加工,捕捉寡核苷酸可以包含赋予有利特性(诸如提高的双链体稳定性)的非天然核芬单元和/或联接,所述化合物包括但不限于肽核酸(PNA)、锁定核酸(lockednucleicacid,LNA)、寡核苷酸N3'—P5'氨基磷酸酯、寡聚-2'-0-烷基核糖核苷酸、等等。在本发明的需要离散分隔区样式的实施方案中,光刻(photolithography)、电子束刻(electronbeamlithography)、纟内米印刻(nanoimprintlithography)禾口纟内米印刷(nanoprinting)可用于在极其多种表面上产生所述样式,例如Pimmg等,美国专利5,143,854;Fodor等,美国专利5,774,305;Guo,(2004)JournalofPhysicsD:AppliedPhysics,37:R123扁141;收入本文作为参考。一方面,包含众多离散分隔区的表面通过光刻来制作。将商业性的、光学上扁平的石英基片旋转覆盖上100-500nm厚的一层光抗蚀剂。然后将光抗蚀剂烘烤到石英基片上。使用分档器(stepper)将具有待活化区域样式的标线图像投影到光抗蚀剂表面上。曝光后,将光抗蚀剂显影,除去对UV源曝光的投射样式的区域。这是通过等离子刻蚀(一种能够产生很细细节的干法显影技术)实现的。然后将基片烘烤以加强剩余的光抗蚀剂。烘烤后,石英晶片准备好进行官能化了。然后将晶片进行3-氨基丙基二甲基乙氧基硅烷的蒸气沉积。氨基官能化单体的密度可以通过改变单体的浓度和基片的曝光时间而严密控制。只有通过等离子刻蚀而暴露的石英区域能与单体反应并捕获单体。然后将基片再次烘烤以使氨基官能化单体单层固化(cure)至暴露的石英。烘烤后,可以用丙酮除去剩余的光抗蚀剂。由于抗蚀剂与硅烷间附着化学的差异,基片上的氨基硅烷官能化区域可以在丙酮漂洗中保持完整。这些区域可以通过将它们与吡啶和N,N-二曱基曱酰胺溶液中的对苯二异碌b氰酸酯起反应而进一步官能化。此时基片能够与胺修饰的寡核苷酸起反应。或者,寡核苷酸可以用5,-羧基修饰的clO接头(GlenResearch)来制备。这种技术容许寡核苷酸直接附着至胺修饰的支持¥,由此避免另外的官能化步骤。另一方面,包含众多离散分隔区的表面通过纳米印刻(NIL)来制作。为了生成DNA阵列,将石英基片旋转覆盖上一层抗蚀剂,通常称为转移层。然后将第二种类型的抗蚀剂应用到转移层之上,通常称为印刻层。然后用原版印刻工具在印刻层上做出印痕。然后通过等离子刻蚀减小印刻层的整体厚度直至印记的底面到达转移层。因为转移层比印刻层难以除去,所以它很大程度上保持不变。然后通过加热来硬化印刻层和转移层。然后将基片置入等离子刻蚀机,直至印记的底面到达石英。然后如上所述通过蒸气沉积将基片衍生化。另一方面,包含众多离散分隔区的表面通过纳米印刷来制作。这种方法使用光刻、印刻或电子束刻来产生母模,它是打印头上所需要的特征的阴像。打印头通常由柔软的、柔性的聚合物制成,诸如聚二曱基硅氧烷(PDMS)。将这种材料或具有不同特性的材料层旋转覆盖到石英基片上。然后在受控温度和压力条件下用模子将特征压紋到抗蚀剂材料的顶层上。然后将打印头进行基于等离子体的刻蚀以提高打印头的高宽比并消除打印头由于随压紋材料的时间而松弛产生的畸变。通过将胺修饰寡核苷酸的样式沉积到均匀衍生化表面上,使用纳米印刷来制作随机阵列基片。这些寡核苷酸将充当RCR产物的捕捉探针。纳米印刷的一个潜在优点是将不同捕捉探针的交错样式印刷到随机阵列支持物上的能力。这将通过用多个打印头连续印刷来实现,各打印头具有不同的样式且所有样式组合在一起形成最终的结构化支持物样式。所述方法容许随机阵列内有一些DNA元件的位置编码。例如,包含特定序列的对照串联物可以以规则间隔结合于整个随机阵列。又一方面,亚微米大小的捕捉寡核苦酸斑点的高密度阵列使用自一束带芯线和包覆材料的大约l万-l亿根光纤或多束光纤成捆制备的打印头或印记原版来制备。通过拉扯和熔融纤维,产生了大约50-1000nm芯线以大小相似或者小/大2-5倍的包覆材料分隔的独特材料。通过差异刻蚀(溶解)包覆材料,得到具有很大数目纳米大小斑点的纳米打印头。该打印头可用于沉积寡核苷酸或其它生物学化合物(蛋白质、寡肽、DNA、适体)或化学化合物诸如具有各种活性基团的硅烷。在一个实施方案中,使用玻璃纤维工具作为压花支持物来沉积寡核苷酸或其它生物学或化学化合物。在这种情况中,只有通过刻蚀产生的斑点可以接触待沉积的材料。同样,可以使用熔融纤维束的平切(flatcut)来引导光穿过芯线并容许光诱导的化学只在芯线的顶端表面发生,由此消除对刻蚀的需要。在这两种情况中,可以使用相同支持物作为光引导/收集装置,用于对标签寡核苦酸或其它反应物的焚光标记物成像。该装置提供了具有大数值光圈(可能大于l)的大视野。可以使用执行活性材料或寡核苷酸沉积的冲压或印刷工具以交错样式印刷2-1OO种不同寡核苷酸。这种方法要求将打印头精确布置至大约50-500nm。这种类型的寡核苷酸阵列可用于附着2-100种不同DNA群体,诸如不同来源DNA。它们还可用于通过使用DNA特异性锚或标签对亚光解析度(sub-lightresolution)斑点进行平行阅读。可以通过DNA特异性标签得到信息,例如16种特异锚用于16种DNA,并通过5-6种颜色的组合、使用16个连接循环或者一个连接循环和16个解码循环阅读2个碱基。这种阵列制作方法是有效的,如果每种片段需要有限的信息(例如少数循环),如此每个表面每个循环或更多循环提供更多信息的话。在一个实施方案中,使用"惰性"串联物来制备供附着测试串联物的表面。首先将表面用与两种类型合成串联物(一种是捕捉串联物,另一种是间隔物串联物)上存在的结合位点互补的捕捉寡核香酸覆盖。间隔物串联物没有与制备测试串联物时所使用的衔接头互补的DNA区段,以大约5-50倍、优选10倍过量于捕捉串联物使用它们。将带捕捉寡核苦酸的表面用合成串联物(通过链连接或RCR制备)的混合物(其中使用大约10倍或5-50倍过量于捕捉串联物的间隔物串联物)."饱和"。因为间隔物与捕捉串联物间大约10:1的比率,捕捉串联物大多成为间隔物串联物海洋中的单独小岛。IO:I的比率使得两个捕捉串联物平均由两个间隔物串联物分开。如果串联物的直径是大约200nm,那么两个捕捉串联物的中心至中心距离是大约600nm。然后将该表面用于附着测试串联物或其它分子结构,它们具有与捕捉串联物上存在但间隔物串联物上不存在的区域互补的结合位点。捕捉串联物可以制备成拷贝数少于测试串联物中的结合位点数,以保证每个捕捉串联物斑点附着单个测试串联物。因为测试DNA只能结合捕捉串联物,所以测试串联物阵列可以制备成具有高位点占有率而无聚集。由于随机附着,表面上的有些区域可能没有附着任何串联物,但带游离捕捉寡核苦酸的这些区域可能不能结合测试串联物,因为它们设计成没有供捕捉寡核苷酸结合的位点。所述的个体测试串联物的阵列不会排列成栅格样式。有序栅格样式应当简化数据收集,因为需要更少的像素且还需要不太复杂的图像分析系统。一方面,可以将本发明的多个阵列置于单个表面上。例如,压花(pattemed)阵列基片可以制备成匹配标准的96孔或384孔板格式。生产格式可以是单片玻璃或塑料和其它光学相容材料上6mmx6mm阵列的9mm孔距(pitch)的8x12样式或者3.33mmx3.33mm阵列的4.5mm孔距的16x24样式。在一个例子中,每个6mmx6mm阵列由36xl(^个l(om孔距的250-500nn^区域组成。可以使用疏水性或其它表面或物理屏障来防止单位阵列间不同反应的混合。举例而言,供DNA样品结合的位点(即离散分隔区)通过用3-氨基丙基二曱基乙氧基硅烷或类似硅烷化试剂硅烷化硅、石英或玻璃表面上二氧化硅上光刻限定的位点,接着用对苯二异硫氰酸(盐/酯)或类似衍生化试剂衍生化来制备。例如,结合位点可以是通过光刻、直接书写电子束、或纳米印刻产生的正方形、圆形、或规则/不规则多边形。将结合位点间区域的非特异性结合降至最低。可以控制结合位点周围区域的湿润性(wetability)(疏水性比亲水性)和反应性以防止DNA样品在该区域中结合;就是说,在结合位点以38外的地方。例如,该区域可以用共价键合至表面的六曱基二硅氮烷(HMDS)或类似试剂制备成疏水性的,因此不适于DNA样品的亲水性键合。类似的,该区域可以用化学试剂覆盖,诸如基于氟的碳化合杨,使得它不与DNA样品起反应。关于前儿段中列出的三种表面制作工序,遵循以下例示性步骤。对于光刻1)清洁玻璃晶片2)用HMDS预备(prime)表面3)在光抗蚀剂中绘制结合位点样式4)用氧反应性离子刻蚀结合位点表面以除去HMDS5)用.3%3-氨基丙基二曱基乙氧基硅烷硅烷化6)用光抗蚀剂覆盖以在锯切过程中保护晶片7)将晶片锯切成芯片8)剥去光抗蚀剂9)用10%吡咬和90%N,N-二曱基曱酰胺(DMF)中的对苯二异硫氰酸(盐/酯)(PDC)溶液(每ml溶液使用2.25mgPDC)衍生化结合位点2小时,接着用曱醇、丙酮、和水漂洗。对于直接书写电子束表面制作1)清洁玻璃晶片2)用HMDS予员备(prime)表面3)用电子束在HMDS中绘制结合位点样式4)用氧反应性离子刻蚀结合位点表面以除去HMDS5)用.3%3-氨基丙基二甲基乙氧基硅烷硅烷化6)用光抗蚀剂覆盖以在锯切过程中保护晶片7)将晶片锯切成芯片8)剥去光抗蚀剂9)用10%吡啶和90%N,N-二曱基曱酰胺(DMF)中的对苯二异碌u氰酸(盐/酯)(PDC)溶液(每ml溶液使用2.25mgPDC)衍生化结合位点2小时,接着用甲醇、丙酮、和水漂洗。对于纳米印刻表面制作1)清洁玻璃晶片392)用HMDS预备(prime)表面3)用转移层覆盖晶片4)使打印样式接触转移层顶部的纳米印刻才莫板和光聚合物5)将样式干法刻蚀到转移层中6)用氧反应性离子刻蚀结合位点表面以除去HMDS7)用.3%3-氨基丙基二曱基乙氧基硅烷硅烷化8)用光抗蚀剂覆盖以在锯切过程中保护晶片9)将晶片锯切成芯片10)剥去光抗蚀剂11)用10%吡啶和90%N,N-二曱基曱酰胺(DMF)中的对苯二异硫氰酸(盐/酯)(PDC)溶液(每ml溶液使用2.25mgPDC)衍生化结合位点2小时,接着用曱醇、丙酮、和水漂洗。如上所述,还可以卩吏用玻璃表面来构建本发明的随机阵列。例如,合适的玻璃表面可以自显微镜盖玻片构建。将显微镜盖玻片(22mm2,约170阿厚)置于Teflon架子中。将它们在含3MKOH的95。/。乙醇/水中浸泡2分钟。然后将它们在水中漂洗,接着是丙酮漂洗。这除去了表面污染并将玻璃准备好进行硅烷化。等离子清洁是KOH清洁的替代方法。还可以用熔融硅土/硅石或石英替代玻璃。将干净的、干的盖玻片浸泡在含.3%3-氨基丙基二曱基乙氧基硅烷、.3%水的丙酮中。让它们反应45分钟。然后将它们在丙酮中漂洗,并于100。C固化1小时。可以用3-氨基丙基二曱基乙氧基硅烷替换3-氨基丙基三乙氧基硅烷,因为它在玻璃表面上形成单层。单层表面提供了更低的背景。还可以4吏用蒸气沉积来应用硅烷化试剂。3-氨基丙基三乙氧基硅烷在溶液相中沉积时趋向于形成更多的聚合表面。然后用硫氰酸根基团终止氨基修饰的硅烷。这是在10%吡啶和90%>^\[-二曱基曱酰胺(DMF)的溶液中进行的,每ml溶液使用2.25mg对苯二异硫氰酸(盐/酯)(PDC)。反应运行2小时,然后将盖玻片在曱醇中清洗,接着是丙酮和水漂洗。然后将盖玻片干燥并准备好结合探针。有别的化学可用于修饰硅烷化试剂末端的氨基基团。例如,可以用戊二醛将硅烷化试剂末端的氨基基团修饰成醛基,它可以偶联至氨基修饰的寡核苷酸。将捕捉寡核苷酸结合至盖玻片表面,通过将10-50mM捕捉寡核苷酸在100mM碳酸氢钠水溶液中的溶液应用至表面。让溶液干燥,然后在水中清洗。避免用PDC终止3-氨基基团并进行直接偶联(3-氨基末端的)至已经在5,末端用羧基基团或醛基基团修饰过的捕捉寡核苦酸可能是有益的。在羧基基团的情况中,寡核苷酸在含EDC(l-乙基-3-(3-二曱基氨基丙基)-碳二亚胺)的溶液中应用。在醛基基团的情况中,寡聚物保持湿润达5-10分钟,然后用硼氢化钠的1%溶液处理表面。在本发明的另一个方面,使用纳米大小的珠子来制备随机阵列。使用亚微米玻璃或其它类型的珠子(例如在20-50nm范围内),将其用与环中的衔接头寡核苷酸互补的短寡核苷酸(例如6-30个核苷酸)衍生化以产生串联物。可以控制珠子上寡核苷酸的数目和序列的长度以微弱结合溶液中的串联物。珠子的反应速率应当大大快于单独使用固体支持物的反应速率。在结合串联物后,容许珠子沉降在阵列基片的表面上。阵列基片具有更长、更稳定、更多的寡核苷酸,使得可以选择条件来容许优先结合至表面,从而形成串联物的带间隔阵列。如果珠子是磁性的,可以使用磁场将它们拉至表面,还可以使用磁场使它们围绕表面移动。或者,可以使用离心机将珠子集中至表面。例示性的规程如下1.将20(il串联物溶液(每jil含lxl0S个串联物)与20xl(^个纳米珠(带大约500条捕捉寡核苷酸,长度为大约8个碱基,可以在不同条件下使用6-16个碱基)混合。100nm纳米珠的面积为大约40,000nm2,可持有多达4000条短寡核苷酸。控制捕捉探针密度的一种方法是在使用具有与捕捉探针相同的附着化学、长度为2-4个碱基的寡核苷酸多大约8倍的情况中混合。同样,可以使用小得多的纳米珠(20-50nm)。2.调节反应条件(温度、pH、盐浓度),使得具有超过300个拷贝的串联物将以显著数目附着至纳米珠。3.在相同严格条件下将反应应用于支持物,4x4mm的压花表面有16xl(^个大小为大约200nm的活性位点,并容许或迫使纳米珠带着大串联物沉降在基片表面上。纳米珠-串联物需要移动的最大距离是大约lmm。珠子的垂直移动使可能遇到的串联物-串联物数目降至最低。反应液可以以等分试样应用,例如应用4次,每次5pl。在这种情况中,所应用溶液的厚度(例如纳米珠最大移动距离)只有大约250微米。4.进一步提高反应的严格性以从纳米珠释放串联物并将它们附着至支持物上的活性位点(带大约300条捕捉寡核苷酸,长度为20-50个碱基)。5.附着于纳米珠的串联物最初将主要沉降在支持物上活性位点之间,因为无活性表面比活性表面多25倍。可以应用轻微的水平移动力(例如基片倾斜等其它力量)使纳米珠-串联物在周围移动大约l微米至数微米。检测设备如上所述,自依照本发明制备的随机阵列上的单分子产生信号并可通过多种检测系统来检测,包括但不限于扫描电子显微术、近场扫描光学显微术(NSOM)、完全内部反射荧光显微术(TIRFM)、等等。文献中可以找到将此类技术应用于分析和检测表面上纳米尺度结构的丰富指导,正如收入本文作为参考的以下文献所i正明的Reimer等,编,ScanningElectronMicroscopy:PhysicsofImageFormationandMicroanalysis,第2版(Springer,1998);Nie等,Anal.Chem.,78:1528-1534(2006);Hecht等,JournalChemicalPhysics,112:7761-7774(2000);Zhu等,编,Near-FieldOptics:PrinciplesandApplications(WorldScientificPublishing,Singapore,1999);Drmanac,国际专利出版物WO2004/076683;Lehr等,Anal.Chem.,75:2414-2420(2003);Ne露hafer等,Biosensors&Bioelectronics,18:489-497(2003);Neuschafer等,美国专利6,289,144;等等。特别感兴趣的是TIRFM,例如披露于Neuschafer等,美国专利6,289,144;Lehr等(见上文);及Drmanac,国际专利出版物WO2004/076683。一方面,与本发明阵列一起使用的仪器包含三个基本构件(i)用于保存和转移检测和加工试剂(例如探针、洗液、等等)至阵列的流控系统;(ii)容纳或包含阵列且具有流通和温度控制能力的反应室或流动槽;及(iii)光照和检测系统。在一个实施方案中,流动槽具有温度控制于系统,其有能力将温度维持在大约5-95。C的范围内,或者更具体的是10-85。C,而且能以每秒钟大约0.5-2。C的速率改变温度。一方面,可以使用适合l平方英寸、170微米厚的盖玻片的流动槽,所述盖玻片已经衍生化以结合本发明的大分子结构。该槽通过在两个平面之间夹有玻璃和垫片而包围住"阵列"。一个平面有一个大小足以容许成像的开口和一个供盖玻片的分度沟(indexingpocket)。另一个平面有一个供垫片的分度沟、多个流体抢口、和一个温度控制系统。一个流体舱口连接注射泵,它自流动槽中"吸出"液体或向流动槽中"注入"液体。另一个舱口连接漏斗样混合室。该室继而配备液面传感器。将溶液分发到漏斗中,在需要时混合,然后吸到流动槽中。当液面传感器读到与流动槽相连的漏斗中有空气时,将泵翻转已知量,使液体回到漏斗中。这防止了空气进入流动槽。盖玻片表面可以分区,分成条,以适应由夹心式引起的液体流动/毛细管效应。此类基片42可以安置在"敞口"/"敞开,,室中以通过消除毛细管流效应而促进緩冲液均匀流过基片。成像可以用100倍物镜使用TIRF或epi照明和130万像素Hamamatsuorca-er-ag在Zeissaxiovert200或类似系统上实现。这种配置对随机结合至基片的RCR串联物(无序阵列)成像。通过降低物镜放大倍数、使用栅格压花的阵列和提高各图像中所收集的数据的像素数目,可以提高成像速度。例如,可以使用多达4台或更多照相机,优选在1000-1600万像素的范围内。还可以使用多带滤过器(multiplebandpassfilter)和分色镜来收集横跨多达4个或更多发射光谱的像素数据。为了补偿放大倍数降低的物镜的更低光收集功率(lowerlightcollectingpower),可以提高激发光源的功率。通过对各照相机使用一个或多个流动室,可以提高通过量,使得成像系统在样品进行杂交/反应时不是空闲的。因为探查阵列可以是不连续的,可以使用超过一台成像系统自一套阵列收集数据,进一步缩短测定时间。在成像过程中,基片必须保持焦点对准。维持焦点对准的一些关键因素是基片的平整度、基片与焦点面(focusplane)的正交性、和基片上可能使其变形的机械力。基片平整度可以较好的控制,很容易得到平整度优于^波的玻璃板。基片上不均匀的机械力可以通过正确设计杂交室而降至最低。与焦点面的正交性可以通过经过精细调整的高精度载物台来实现。自焦(即自动对焦)例程一般需要另外的时间来运行,所以只在必要时运行。在得到各图像后,使用快速算法进行分析以确定图像是否焦点对准。在图像焦点未对准的情况中,运行自动对焦例程。然后它将存储在下一个成像循环过程中返回该阵列该部分时将使用的物镜Z位置信息。通过在基片上多个位置定位物镜Z位置,我们将降低获取基片图像所需要的时间。一种适用于基于焚光的信号的照明和检测系统是ZeissAxiovert200,其配备了TIRF滑块(slider),与80毫瓦532nm固态激光器偶联。所述滑块经物镜以正确的TIRF照明角照明基片。通过经与基片光学偶联的棱镜照明基片,TIRF还可以在不使用物镜的条件下实现。还可以使用平面波导(planarwaveguide)在基片上实施TIRF。还可以采用Epi照明。光源可以加光栅,传播光束,相干的/耦合的(coherent),非相干的/非耦合的(incoherent),且源自单光谱或多光谱源。成像系统的一个实施方案包含视野为1.25mm的20倍透镜,检测使用l千万像素照相机来进行。这样的系统对以l微米孔距附着于压花阵列的大约150万个串联物成像。在此配置下,每个串联物有大约6.4个像素。通过扩大或缩小物镜的视野,可以调整像素数目/串联物。例如,lmm视野将产生10个像素/串联物的数值,而2mm视野将产生2.5个像素/串联物的数值。可以相对于物镜的放大倍数和NA来调整视野以产生仍能够通过光学装置和图像分析软件来分辨的最低像素计#1/串联物。TIRF和EPI这两种照明容许使用几乎任何光源。一个照明方案是在成像仪间共享一套公用的单色照明源(大约4台6-8种颜色的激光器)。各成像仪在不同波长以任何给定时间收集数据,而各光源经光学转换系统(6pticalswitchingsystem)转向各成像仪。在这样的一个实施方案中,照明源优选产生至少6种、但更优选8种不同波长。这样的照明源包括气体激光器、经光纤耦合器(fibercoupler)组合的复式二极管抽运的固态激光器(multiplediodepumpedsolidstatelaser)、过滤氣弧灯(filteredXenonArclamp)、可调谐激光器(tunablelaser)、或更新颖的SpectralumLightEngine(不久将由TidalPhotonics提供)。SpectralumLightEngine使用棱镜在光谱上将光分开。光谱4皮才殳射到数字光处理器(DigitalLightProcessor,TexasInstruments)上,它能选择性的将光i普的任何部分反射到光纤或光连接器中。该系统能够监测和校准横跨各波长的功率输出以保持它们恒定,从而自动补偿因灯泡寿命或灯泡变化间的强度差异。下表呈现了可能的激光、染料和滤光器的例子。<table>tableseeoriginaldocumentpage44</column></row><table>在24个小时里通过每个区域大约350幅(每种颜色大约60幅)图像对60亿个串联物成功的打分,可能需要联合平行的图像获取、提高的图像获取速度、和对每台成像仪扩大的视野。另外,成像仪可能支持6-8种颜色。商品化显微镜通常以0.8的NA在20倍放大倍数对大约lmm的视野成像。在0.5微米建议的串联物孔距,这翻译成约略4百万个串联物/图像。这为每个杂交循环60亿个斑点产生大约1,500幅图像,或者350个成像循环产生50万幅图像。在大规模测序操作中,各成像仪优选每天获得大约200,000幅图像,基于对1600万像素CCD的300毫秒曝光时间。如此,一种优选的装置设计是4台成像仪模块,各自服务于4个流动槽(总共16个流动槽)。上述成像方案假设各成像仪具有1千万像素的CCD检测器且以约略300毫秒的曝光时间使用。这应当是收集6种荧光团标记物数据的可接受方法。这种成像技术的一种可能的缺点是某些荧光团可能遭到光源的非故意光致褪色,而其它荧光团得到成像。保持照明功率低且曝光时间最短将大大降低光致褪色。通过使用增强型CCD(ICCD),在照明强度和曝光时间比标准CCD低数个数量级的条件下,可以收集品质与标准CCD约略相同的数据。一般可利用在100-140万像素范围内的ICCD。因为它们需要短得多的曝光时间,在标准CCD获取单幅图像的时间里,1百万像素ICCD能获取10幅或更多图像。在联合快滤光轮(fastfilterwheel)和高速流动槽载物台使用时,1百万像素ICCD应当能够收集与l千万像素标准CCD相同量的数据。能够以高数值光圈对更大视野成像的光学装置可以制作成定制透镜装配物(customlensassembly)。指示是可以制作能够以大于0.9的NA对3mm视野成像的20倍光学装置。两种这样的成像系统,在联合高像素计数CCD或CCD马赛克(即镶嵌)阵列时,应当能够在约略14个小时内对全部的八个流动槽测定成像。如所述的,使用16个流动槽可以实现更多的收获。通过减少每个视野的图像数,流动槽数目加倍将使成像时间缩短至9个小时。对串联物和其它随机DNA阵列的反应功效可能依赖于探针、锚或引物、和酶的有效j吏用。这可以通过混合液体(诸如在流通室中来回合并液体)、施加搅动或使用水平或垂直电场以4吏来自反应体积不同部分的DNA接近表面来实现。有效、低花费测定反应的一种方法是在薄层中应用反应混合物,诸如大小/厚度为大约l微米至几微米、但优选小于10微米的小滴或薄层。在为lxW效米斑点区域指派的lxlxl微米体积中,在lpmo1/1(^1(lpM浓度)中将有大约1000个分子的探针,密切接近1-1000个拷贝的DNA。4吏用多达100-300个分子的探针,不会显著降低探针浓度,而且将会提供足够的发生反应的探针以得到显著的信号。这种方法可用于开放式反应室,在清除和清洗探针和酶时可以保持开放或闭合。如上所述,可以使用多个照相机和多个流动槽来实现更高的吞吐量。单个机械臂液体操作台可以服务于例如16个流动槽。另外,所述系统的所有构件可以共享公用温度控制系统和成套试剂。对于组合式SBH测序操作,机械臂可以配制将要分发到流动槽漏斗中的探针集合和连接緩冲液。专用注射泵可以将清洗緩冲液和杂交緩沖液直接分发到各流动槽的漏斗抢口中。各成像仪可服务于一组2-4个流动槽。各组流动槽可定位在XY运动平台上,与研究用显微镜上经常看到的自动化载物台相似。所有系统构件间的系统控制和协调可以经由在主计算机上运行的软件来进行。控制软件可以异步运行测定循环,容许各成像仪在整个测定法期间连续运行。流动槽与具有一个加热器和一个冷却器的温度控制系统相连,容许根据指令独立加热或冷却各个流动槽或2-4个流动槽模块。可以监测各流动槽的温度,而且当流动槽的温度降至设定阈值以下时,可以打开通向热水再循环的阀门。类似的,当流动槽的温度超过设定阈值时,可以打开通向冷水再循环的阀门。如果流动槽在设定的温度范围内,那么两个阀门都不打开。再循环的热水和冷水流经铝制流动槽体,但与测定緩沖液和试剂保持分开和分离。耙序列串联物随机阵列的序列分析如上所述,生物分子(诸如基因组DNA片段或cDNA片段)的随机阵列提供了基于对序列标签计数的大规模序列测定和基因组范围测量的平台,其方式与通过基因表达连续分析(serialanalysisofgeneexpression,SAGE)或大量平4亍签名测序(massivelyparallelsignaturesequencing)进4亍的观"量相似,例如Velculescu等,(1995),Science270:484-487及Brenner等(2000),NatureBiotechnology,18:630-634。所述基因组范围测量包括但不限于多态性(包括核苷酸替代、删除和插入、倒位、等等)的测定、曱基化样式的测定、拷贝数样式等等,诸如可通过极其多种本领域普通技术人员知道的测定法来进4亍,侈'Ji口Syvanen(2005),NatureGeneticsSupplement,37:S5-S10;Gunderson等(2005),NatureGenetics,37:549-554;Fan等(2003),ColdSpringHarborSymposiaonQuantitativeBiology,LXVIII:69-78;及美国专利4,883,750;6,858,412;5,871,921;6,355,431;等等,收入本文作为参考。46多种测序方法学可用于本发明的随机阵列,包括7f旦不限于基于杂交的方法,诸如披露于Drmanac,美国专利6,864,052;6,309,824;和6,401,267;及Drmanac等,美国专利出版物2005/0191656,收入本文作为参考;通过合成方法进行的测序,例如Nyren等,美国专利6,210,891;Ronaghi,美国专利6,828,100;Ronaghi等(1998),Science,281:363-365;Balasubramanian,美国专利6,833,246;Quake,美国专利6,911,345;Li等,Proc.Natl.Acad.Sci.,100:414-419(2003),收入本文作为参考;和基于连接的方法,例如Shendure等(2005),Science,309:1728-1739,收入本文作为参考。一方面,依照本发明测定靶多核苷酸的核苦酸序列的方法包括以下步骤(a)自靶多核苦酸产生众多靶串联物,各靶串联物包含靶多核香酸的一个片段的多个拷贝,且所述众多靶串联物包括基本上覆盖靶多核苷酸的许多片段;(b)形成使得至少大多数靶串联物以光学上可分辨的密度固定在表面上的靶串联物随机阵列;(c)鉴定各靶串联物中各片段的至少一部分的序列;并(d)自串联物各片段各部分的序列的身份重建靶多核苷酸的核苷酸序列。通常,"基本上覆盖"指所分析DNA的量相当于靶多核苷酸的至少2个拷贝;或者另一方面,至少10个拷贝;或者另一方面,至少20个拷贝;或者另一方面,至少100个拷贝。靶多核苷酸可以包括DNA片段(包括基因组DNA片段和cDNA片段)和RNA片段。法包括以下步骤(a)产生众多多核苦酸分子,各自包含DNA或RNA片段的串联物;(b)形成使得至少大多数靶串联物以光学上可分辨的密度固定至表面的多核苷酸分子随机阵列;并(c)使用光学上可检测的反应物的至少一种化学反应鉴定可分辨多核苷酸中各DNA或RNA片段至少一部分的序列。在一个实施方案中,所述光学上可检测的反应物是寡核苷酸。在另一个实施方案中,所述光学上可^r测的反应物是核苷三磷酸,例如焚光标记的核苷三磷酸,其可用于延伸与串联物发生杂交的寡核苷酸。在另一个实施方案中,所述光学上可检测的试剂是通过连接在串联物上形成邻近双链体的第一和第二寡核苷酸而形成的寡核苷酸。在另一个实施方案中,所述化学反应是DNA或RNA的合成,例如通过延伸与串联物发生杂交的引物。在又一个实施方案中,上述光学上可检测的反应物是与核酸结合的寡肽或多肽或蛋白质。一方面,随机阵列上串联物的多核苷酸分析物的平行测序是通过组合SBH(cSBH)实现的,披露于Drmanac,见上文引用的专利。一方面,提供了第一套和第二套寡核苷酸探针,其中对于各套探针的规定长度,各套的成员探针包含具有每一种可能序列的寡核苷酸。例如,如果有一套包含长度为6的探针,那么它包含4096(即46)种探针。另一方面,第一套和第二套寡核香酸探针包含具有选定核苷酸序列的探针,所述序列设计用于检测选定组的靶多核苷酸。序列是如下测定的,用一种探针或探针集合进行杂交,用第二探针或第二探针集合进行杂交,连接在其輩巴序列上形成完美匹配双链体的探针,鉴定那些连接的揮:针以获得关于耙序列的序列信息,重复以上步骤直至所有探针或探针集合进行了杂交,并自杂交和鉴定步骤中积累的序列信息确定靶物的核芬酸序列。对于测序操作,在有些实施方案中,各套(探针)可以分成在集合中一起使用的子集,如美国专利6,864,052所披露的。来自第一套和第二套的探针可以与靶序列进行杂交,或是一起的或是序贯的,或是作为整套或是作为子集,或集合。一方面,第一套和第二套探针的长度在5-10个核苷酸的范围内,另一方面,在5-7个核苦酸的范围内,使得它们在连接后形成长度分别在10-20和10-14范围内的连^~产物。另一方面,使用此类技术,各个所附着DNA串联物的序列身份可以通过"签名"方法来测定。使用大约50-100种或者可能200种探针,使得将会有大约25-50%或在有些应用中10-30°/。的所附着串联物对各探针具有完全匹配的序列。这种类型的数据容许串联物内的各扩增DNA片段定位至参比序列。例如,通过这样的方法,可以在4色标记方案中使用16个杂交/剥离循环对64种4聚物(即所有可能的256种4聚物的25%)进行评分。在串联物中所扩增的60-70个碱基的片段上,64种探针中有大约16种将会是阳性的,因为长64个碱基的序列中存在64种可能的4聚物(即所有可能的4聚物的四分之一)。无关的60-70个碱基的片段将会有一套非常不同的大约16种阳性解码探针。64种探针中取16种探针的组合在每10亿个片段中出现的随机几率是l,这实际上提供了该串联物的独特签名。在20个循环中对80种探针进行评分并产生20种阳性探针,这产生了甚至更有可能是独特的签名发生几率是1018分之一。以前将"签名法"用于自cDNA文库中选出新基因。签名法的一种实施是分拣所有经测试探针得到的强度并选出直到满足阳性探针阈值的探针达到预定(预期)数目。这些探针将定位至预计在阵列中存在的所有DNA片段的序列(可以使用更长参比序列的滑动窗)。将具有所有或统计学足够数目的所选阳性探针的序列指派为给定串联物中DNA片段的序列。在另一种方法中,可以用预先测量的完全匹配和错配杂交/连接功效为所有所用探针定义预期信号。在这种情况中,可以计算与关联因子(correlationfactor)相似的量度。对4聚物进行评分的一种优选方式是连接各对探针,例如N(w)BBB与BN(7_9),其中B是规定碱基而N是筒并碱基。为了在更长DNA串联物探针上产生签名,将使用更多独特碱基。例如,长度为1000个碱基的片段中25%的阳性率将通过N(4.6)BBBB和BBN(6.8)来实现。注意,更长片段需要相同数目的大约60-80种探针(15-20个连接循环,使用4种颜色)。在一个实施方案中,可以使用给定长度的所有探针(例如4096种N2.4BBBBBBN2.4)或所有连接对来测定串联物中DNA的完整序列。例如,可以对N(5.7)B3与BBN(6.s)的1024种组合进行评分(256个循环,如果使用4种颜色的话)以测定直到大约250个碱基、优选直到大约100个碱基的DNA片段的序列。含多个N的测序解码探针可以自简并碱基处序列子集的多重合成来制备以将功效差异降至最低。将各子集以适当浓度加至混合物。还有,有些子集可以具有比其它子集更多的简并位置。例如,来自那套N(w)BBB的64种探针各自可以在4次不同合成中制备。第一次是规则的,所有5-7个碱基都是完全简并的;第二次是N0-3(A,T)5BBB;第三次是N0-2(A,T)(GC)(A,T)(G,C)(A,T)BBB;而第四次是N0-2(G,C)(A,T)(GC)(A,T)(GC)BBB。将来自三项特异合成的寡核苦酸制备物以实验测定的量添加至规则合成物中以提高与靶序列的杂合物产生,所述靶序列在BBB序列的前面有富含AT的序歹'J(例如AATAT)或(A或T)与(G或C)交替的序列(例如ACAGT或GAGAC)。预计这些序列形成杂合物方面不太有效。可以对所有1024种靶序列测试与N。.3NNNNNBBB探针形成杂合物的功效,而那些给出最微弱结合的类型可以在大约1-10项另外的合成中制备并添加至基础探针制备物。根据签名的解码。用于少数不同样品的更少数探针20种探针(5个循环,使用4种颜色)中有5-7种阳性有能力区分大约l-10万种不同片段。8-20聚物RCR产物的解码。在此应用中,阵列形成为DNA串联物形式的独特的8-20个碱基的识别序列的随机分布。需要对探针解码以确定8-20个碱基的探针区的序列。至少有两种选择可用于实现此目的,下面的例子描述了用于12聚物的方法。首先,通过利用短探针的杂交特异性和完全匹配杂合物的连接特异性,确定一半序列。与12聚物相邻的6-10个碱基预先确定并充当6聚物至10聚物寡核苷酸的支持物。这种短6聚物将在其3,末端连接至4种经过标记的6聚物至10聚物之一。这些解码探针由4种寡核苷酸的集合组成,其中每种寡核苦酸由4-9个简并碱基和l个确定碱基组成。这种寡核苷酸还将用四种荧光标记物之一标记。因此4种可能的碱基即A、C、G或T各自将由一种荧光染料来代表。例如,这5组4种寡核苷酸和1种通用寡核苷酸(U)可用于连接测定法以测定12聚物前5个碱基的序列B-4种碱基中的每一种,末端结合有特定染料或标签UUUUUUUU.BNNNNNNN*UUUUUUUU.NBNNNNNNUUUUUUUU.NNBNNNNNUUUUUUUU.NNNBNNNNUUUUUUUU.NNNNBNNN用另外的探针集合可以测定6个或更多碱基的序列。为了提高12聚物中央附近位置的辨别力,可以进一步将6聚物寡核苷酸定位到12聚物序列中。这使将简并碱基掺入未标记寡核苷酸的3,末端成为必要以适应移位。这是用于12聚物中第6和7位的解码探针的一个例子。UUUUUUNN.NNNBNNNNUUUUUUNN.NNNNBNNN以相似的方式,可以通过使用固定的寡核苦酸和5,标记的探针来解码12聚物右侧的6个碱基。在上文所述系统中,需要6个循环来界定12聚物一侧的6个碱基。凭借远离连接位点的碱基的多余循环分析,此方法可增至7个或8个循环。那么,总的来说,12聚物的完全测序可通过12-16个连接循环来实现。通过联合两种不同类型的解码探针文库进行的排列好的DNA的部分或完全测序。在这种方法中,一套探针是通用型N3.sB4-6(锚),与来自各套BN6-8、NBN5-7、N2BN4.6和N3BN3.5的前2种或前3种或前4种探针/探针集合连接。主要的要求是在少数循环中测试来自第一套的l种探针及来自第二套的2-4种或甚至更多种探针以在仅仅3-4个循环中读出更长连续序列,诸如5-6+3-4=8-10。在一个例子中,其过程是501)将l-4种4聚物或更多种5聚物锚进行杂交以获得70-80。/。的DNA每个有1种或2种锚。区别来自集合的哪种锚是阳性的一种方法是混合具有不同杂合物稳定性的特异探针(可能另外有不同数目的N)。锚还可以进行标记以确定来自集合的哪种锚与斑点发生了杂交。可以将标签(像另外的DNA区段)用于可调整的置换,作为4企测方法。例如,EEEEEEEENNNAAAAA和相应的置换物差异性的消除EEEEEEEENNNNN和FFFFFFFFNNNNNNNN,其中第二种更有效。可以使用分开的循环,仅仅用于确定哪种锚是阳性的。为此目的,可以将用多种颜色标记的锚连接至未标记的N7-N10支持物寡核苷酸。2)将对应于4种碱基有4种颜色的BNNNNNNNN探针进行杂交;有区别的进行清洗(或被标签的互补物置换)以读出哪两种评分碱基与哪种锚有关联,如果两种锚在一种DNA中是阳性的。如此,可以同时对两种7-10个石咸基的序列打分。在为另外的2-4个碱基延伸至4-6个碱基的锚的2-4个循环中,每个阵列运行16种不同的锚(32-64个物理循环,如果使用4种颜色的话)以测定每个片段大约16种可能的8聚物(总共大约100个碱基)(足以将其定位至参比序列(100聚物具有一套10种8聚物的概率小于1024分之一。通过组合在另一个阵列中在同一片段上平行打分的不同锚的数据,可以自交叠的7-10聚物产生该片段的完整序列,并延伸至整个基因组。为了解码或序列测定探针的更大多重性用DNA标签标记探针。代替直接标记探针,可以用天然碱基或新型合成碱基(诸如isoG和isoC)制成的不同寡核苷酸序列标记它们。使用不同的寡核苷酸长度(大约6-24个碱基)和/或序列,包括GC含量,标签可以设计成对它们的抗标签物具有非常精确的结合功效。例如,可以设计4种不同标签,它们可以用特异性抗标签物在4个序贯循环中或者在一个杂交继以区别性清洗的循环中来识别。在区别性清洗中,各标签的初始信号分别降至95-99%、30-40%、10-20%和0-5%。在这种情况中,通过获取两幅图像,得到了4项量度,假设具有不同标签的探针将很少与同一圆点发生杂交。具有许多不同标签(即使它们序贯解码,或者用2-16种不同颜色标记时一次2-16种)的另一个好处是在同一测定反应中使用大量可独立识别探针的能力。这样,可承担得起4-64倍更长测定时间(可提51供更特异性或更强烈的信号),如果探针在短温育和消除反应中解码的话。解码过程需要使用48-96种或更多种解码探针。通过将它们用四种各自具有不同发射光i普的荧光团编码,这些集合将进一步组合成12-24个或更多个集合。使用20倍物镜时,使用l千万像素照相机的话,各6mmx6mm阵列的完全覆盖可能需要约略30幅图像。各1微米阵列面积由大约8个像素读出。各图像在250毫秒中获得,150ms用于曝光,100ms用于移动载物台。使用这种快速获取,各阵列的成像将需要大约7.5秒,或者各基片上整套96个阵列的成像需要12分钟。在成像系统的一个实施方案中,这种高图像获取速率是通过使用四台各自对不同荧光团的发射光i普成像的1千万像素照相机来实现的。将照相机通过一系列分色光束分离器(dichroicbeamsplitter)偶联至显微镜。只在所得图像对焦不准时运行需要额外时间的自动对焦例程。然后它将存储在下一个成像循环过程中返回该阵列该部分时将使用的Z轴位置信息。通过在基片上定位各位置的自动对焦位置,我们将大大降低获取图像所需要的时间。各阵列需要大约12-24个循环来解码。各循环包括杂交、清洗、阵列成像、和剥离步骤。对于上文的例子,这些步骤以它们各自的次序可能各需要5、2、12和5分钟,每个循环总共24分钟,或者约略各阵列5-10个小时,如果各操作是线性进行的话。通过容许系统持续成像,务阵列解码需要的时间可以缩短一半。为了实现这一目的,各显微镜上两个分开的基片的成像交错进行。当一个基片在反应时,另一个基片在成像。使用cSBH的例示性解码循环包括以下步骤(i)将阵列的温度设成杂交温度(通常在5-25。C范围内);(ii)使用机械臂移液器来预先混合小量的解码探针与适宜量的杂交緩沖液;(iii)将混合后的试剂转移到杂交室中;(iv)杂交预定的时间;(v)使用泵(注射器或其它)从(杂交)室中排出试剂;(vi)添加緩沖液以清洗非杂合物的错配;(vii)将(杂交)室的温度调整至适宜的清洗温度(大约10-40。C);(viii)排干(杂交)室;(ix)添加更多的清洗緩沖液,如果改进成像需要的话;(x)对各阵列成像,优选用中间放大率(20倍)显微镜物镜,其在光学上偶联至高像素计数、高灵敏度ccd照相机、或照相机;载物台在物镜上移动(杂交)室(或者可能是具有输入漏斗的流动槽),或者物镜-光学装置装配物在(杂交)室下移动;可以采用某些光学排列(使用分色镜/光束分离器)来同时收集多光谱图像,如此降低图像获取时间;可以部分的或整个的对阵列成像,取决于阵列/图像大小/像素密度;可以通过排列图像将各部分装配在一起,使用统计学显著的在基片上预编码的空白区域(在活性位点产生过程中),或者可以使用多步骤纳米印刷技术来进行,例如可以使用特异捕捉探针打印位点(激活位点的栅格),剩下栅格中的空白区域;然后,使用分开的打印头在该区域中印刷不同的样式或捕捉探针;(xi)排干(杂交)室并用探针剥离緩冲液(或者用早就加载的緩冲液)置换,然后将(杂交)室加热至探针剥落温度(60-90。C);剥离步骤中可以使用高pH緩沖液以降低剥离温度;等待规定的时间;(xii)除去緩沖液;(xiii)用成套的下一种解码探针集合开始下一个循环。标记物和通过针对本发明阵列上的多核苷酸的探针进行的信号产生本发明的寡核苷酸探针可以以多种方式标记,包括放射性模块、荧光模块、比色模块、化学发光模块、等等的直接或间接附着。用于标记DNA和构建DNA衔接头的方法学的许多全面评论提供了可用于构建本发明寡核苷酸探针的指导。此类综述包括Rricka,Ann.Clin.Biochem.,39:114-129(2002);Schaferling等,Anal.Bioanal.Chem.,(April12,2006);Matthews等,Anal.Biochem"Vol169,pgs.1-25(1988);Haugland,HandbookofFluorescentProbesandResearchChemicals,第10片反(Invitrogen/MolecularProbes,Inc.,Eugene,2006);KellerandManak,DNAProbes,第2版(StocktonPress,NewYork,1993);及Eckstein,编,OligonucleotidesandAnalogues:APracticalApproach(IRLPress,Oxford,1991);Wetmur,CriticalReviewsinBiochemistryandMolecularBiology,26:227-259(1991);Hermanson,BioconjugateTechniques(AcademicPress,NewYork,1996);等等。可应用于本发明的许多更具体方法学披露于以下参考文献例子Fung等,美国专利4,757,141;Hobbs,Jr.等,美国专利5,151,507;Cmickshank,美国专利5,091,519;(用于附着报导基团的官能化寡核苷酸的合成);Jablonski等,NucleicAcidsResearch,14:6115-6128(1986)(酶-寡核苷酸偶联物);Ju等,NatureMedicine,2:246-249(1996);Bawendi等,美国专利6,326,144(衍生化荧光纳米晶体);Bruchez等,美国专利6,274,323(书亍生化荧光纳米晶体);等等。一方面,使用一种或多种荧光染料作为用于寡核苷酸探针的标记物,例如披露于Menchen等,美国专利5,188,934(4,7-二氯荧光素染料);Begot等,美国专利5,366,860(光谱可分辨的罗丹明染料);Lee等,美国专利5,847,162(4,7-二氯罗丹明染料);Khanna等,美国专利4,318,846(醚取代的荧光素染料);Lee等,美国专利5,800,"6(能量转移染料);Lee等,美国专利5,066,580(咕吨染料);Mathies等,美国专利5,688,648(能量转移染料);等等。标记还可以用量子点(quantumdot)来进行,如收入本文作为参考的以下专利和专利出版物所披露的:6,322,901;6,576,291;6,423,551;6,251,303;6,319,426;6,426,513;6,444,143;5,990,479;6,207,392;2002/0045045;2003/0017264;等等。在用于本文时,术语"焚光信号产生模块"指发信号的手段,它经由一种或多种分子的焚光吸收和/或发射特性来传送信息。所述荧光特性包括荧光强度、荧光寿命、发射光谱特征、能量转移、等等。可用于掺入标记寡核苷酸的商业性荧光核苷酸类似物包括例如Cy3画dCTP、Cy3-dUTP、Cy5-dCTP、Cy5-dUTP(AmershamBiosciences,Piscataway,NewJersey,USA)、荧光素-12-dUTP、四曱基罗丹明-6-dUTP、TexasRed-5-dUTP、CascadeBlue⑧画7画dUTP、BODIPYFL-14國dUTP、BODIPYR-14-dUTP、BODIPYTR-14-dUTP、RhodamineGreenTM-5-dUTP、OregonGreen488-5-dUTP、TexasRed-12-dUTP、BODIPY630/650-14-dUTP、BODIPY650/665-14陽dUTP、AlexaFluor488匿5-dUTP、AlexaFluor532-5-dUTP、AlexaFluor568-5-dUTP、AlexaFluor594-5-dUTP、AlexaFluor546-14-dUTP、焚光素-12-UTP、四曱基罗丹明-6-UTP、TexasRed-5-UTP、CascadeBlue-7-UTP、BODIPYFL-14-UTP、BODIPYT證-14-UTP、BODIPYTR匿14-UTP、RhodamineGreenTM-5-UTP、AlexaFluor488-5-UTP、AlexaFluor546-14-UTP(MolecularProbes,Inc.Eugene,OR,USA)。可用于合成后附着的其它焚光团包括AlexaFluor350、AlexaFluor532、AlexaFluor546、AlexaFluor568、AlexaFluor594、AlexaFluor647、BODIPY493/503、BODIPYFL、BODIPYR6G、BODIPY530/550、BODIPYTMR、BODIPY558/568、BODIPY558/568、BODIPY564/570、BODIPY576/589、BODIPY581/591、BODIPY630/650、BODIPY650/665、CascadeBlue、CascadeYellow、丹酰、丽丝胺罗丹明B、MarinaBlue、OregonGreen488、OregonGreen514、PacificBlue、罗丹明6G、罗丹明绿、罗丹明红、四曱基罗丹明、TexasRed(MolecularProbes,Inc.,Eugene,OR,USA)、及Cy2、Cy3.5、Cy5.5和Cy7(AmershamBiosciences,Piscataway,NJ,USA等)等。还可以使用FRET串联萸光团,诸如PerCP-Cy5.5、PE-Cy5、PE-Cy5.5、PE-Cy7、PE-TexasRed和APC画Cy7;还有PE-Alexa染料(610、647、680)和APC-Alexa染料。生物素或其书f生物也可以作为标记物用在检测寡核苷酸上,随后由可纟企测标记的亲合素/链霉亲合素衍生物(例如藻红蛋白偶联的链霉亲合素)或可检测标记的抗生物素抗体所结合。可以掺入地高辛配基(digoxigenin)作为标记物,随后由可4企测标记的抗地高辛配基抗体(例如荧光素化抗地高辛配基)所结合。可以将氨基烯丙基-dUTP残基掺入检测寡核芬酸,随后偶联至N-羟基琥珀酰亚胺(NHS)衍生化荧光染料,诸如上文所列。一般而言,可以将偶联物对的任何成员掺入检测寡核苷酸,倘若可检测标记的偶联物配偶体在结合后容许进行检测。在用于本文时,术语抗体指任何类别的抗体分子,或其子片段,诸如Fab。其它适用于检测寡核苷酸的标记物可以包括荧光素(FAM)、地高辛配基、二硝基酚(DNP)、丹酰、生物素、溴脱氧尿苷(BrdU)、六组氨酸(6xHis)、磷-氨基酸(例如P-tyr、P-ser、P-thr)、或任何其它合适的标记物。在一个实施方案中,使用以下半抗原/抗体对来进行检测,其中各抗体用可检测标记物进行衍生化生物素/抗生物素、.地高辛配基/抗地高辛配基、二硝基酚(DNP)/抗DNP、5-歡基荧光素(FAM)/抗FAM。如下文方案所述,探针还可以进行间接标记,尤其是用半抗原,之后该半抗原得到捕捉剂的结合,例如披露于Holtke等,美国专利5,344,757;5,702,888;和5,354,657;Huber等,美国专利5,198,537;Miyoshi,美国专利4,849,336;Misiura和Gait,PCT出版物WO91/17160;等等。许多不同的半抗原-捕捉剂对可用于本发明。例示性的半抗原包括生物素、des-生物素和其它衍生物、二硝基酚、丹酰、荧光素、CY5和其它染料、地高辛配基、等等。对于生物素,捕捉剂可以是亲合素、链霉亲合素或抗体。抗体可以用作其它半抗原的捕捉剂(许多染料-抗体对已商业化,例如MolecularProbes)。本发明的试剂盒在本文所述方法的商业化中,用于构建本发明随机阵列和用于将本发明随机阵列用于各种应用的某些试剂盒是特别有用的。用于应用本发明随机阵列的试剂盒包括但不限于用于测定靶多核苷酸的核苷列的试剂盒、用于大规模鉴定参比DNA序列与测试DNA序列间差异的试剂盒、用于外显子序型分析的试剂盒、等等。试剂盒通常包含至少一种具有表面的支持物和一种55或多种构建本发明随^L阵列或用其实施应用所必需或有用的试剂。所述试剂包括但不限于核酸引物、探针、衔接头、酶、等等,而且各自包装在容器中,诸如但不限于小瓶、管或瓶,在适于商业分发的包装中,诸如但不限于盒子、密封袋、泡罩(blisterpack)和硬纸盒。包装通常包含标签或包装插页,指明所包装物质的用途。在用于本文时,"包装材料"包括为了分发试剂盒中的物质而进行的包装中所使用的任何物品,包括但不限于容器、小瓶、管、瓶、袋、泡罩(blisterpackaging),标签、标牌、指示页和包装插页。一方面,本发明提供了用于自来源核酸制备DNA片段的串联物的随机阵列的试剂盒,其包含以下成分(i)具有表面的支持物;及(ii)至少一种衔接头寡核香酸,用于连接至各DNA片段并与其形成DNA环,各DNA环能够通过滚环复制反应进行复制以形成能够随机部署到表面上的串联物。在此类试剂盒中,所述表面可以是具有离散分隔区阵列的平坦表面,其中各离散分隔区的大小相当于所述串联物的大小。离散分隔区可以形成最近相邻距离在0.1-20iLim范围内的规则阵列。离散分隔区上的串联物可以具有使得它们在光学上可分辨的最近相邻距离。离散分隔区可以附着有捕捉寡核苦酸,而衔接头寡核苷酸可以各自具有与捕捉寡核苷酸互补的区域使得串联物能够通过在捕捉寡核苷酸与衔接头寡核苷酸的互补区域之间形成复合物而附着至离散分隔区。在有些实施方案中,串联物随机分布在所述离散分隔区上且最近相邻距离在0.3-3卞m范围内。此类试剂盒可以进一步包含(a)末端转移酶,用于将同聚物尾附着至所述DNA片段以提供供所述衔接头寡核苷酸的第一末端结合的位点,(b)连接酶,用于将所述衔接头寡核苷酸的一条链连接至所述DNA片段的末端以形成所述DNA环,(c)引物,用于与所述衔接头寡核苷酸链的一个区域退火,及(d)DNA聚合酶,用于使与链退火的引物在滚坏复制反应中延伸。上述衔接头寡核芬酸的第二末端可以具有数目在4-12个范围内的简并;咸基。另一方面,本发明提供了用于靶多核苷酸测序的试剂盒,其包含以下成分(i)具有平坦表面的支持物,所述表面具有光学上可分辨的离散分隔区的阵列,其中各离散分隔区的面积小于lnm、(ii)第一套探针,用于与随机部署在离散分隔区上的众多串联物杂交,所述串联物各自包含靶多核苷酸的DNA片段的多个拷贝;及(iii)第二套探针,用于与众多串联物杂交,使得只要来自第一套的探针和来自第二套的探针(与靶物)发生毗邻的杂交,两探56针就得到连接。此类试剂盒可以进一步包含连接酶、连接酶緩沖液、和杂交緩冲液。在有些实施方案中,离散分隔区可以附着有捕捉寡核苷酸,而串联物可以各自具有与捕捉寡核苷酸互补的区域,使得所述串联物能够通过形成捕捉寡核香酸与所述串联物的互补区域间的复合物而附着至离散分隔区。又一方面,本发明提供了用于构建单分子阵列的试剂盒,其包含以下成分(i)具有表面的支持物,所述表面具有反应性官能度;及(ii)众多大分子结构,各自具有一个独特官能度和多个互补官能度,所述大分子结构能够随机附着在表面上,其中所述附着是通过一个或多个反应性官能度与一个或多个互补官能度的反应所形成的一个或多个联接而形成的;且其中所述独特官能度能够与分析物分子上的官能度选择性起反应以形成单分子阵列。在此类试剂盒的有些实施方案中,所述表面是具有离散分隔区阵列的平坦表面,该离散分隔区包含所述反应性官能度,且其中各离散分隔区的面积小于lpm2。在又一个实施方案,所述离散分隔区形成最近相邻距离在0.1-20(im范围内的规则阵列。在又一个实施方案,离散分隔区上的串联物具有使得它们在光学上可分辨的最近相邻距离。在还有一个实施方案中,所述大分子结构可以是一个或多个DNA片段的串联物且其中所述独特官能度位于串联物的3,末端或5"末端。另一方面,本发明包括用于环化DNA片段的试剂盒,其包含以下成分(a)至少一种衔接头寡核苷酸,用于连接至一种或多种DNA片段并与其形成DNA环;(b)末端转移酶,用于将同聚物尾附着至所述DNA片段以提供供所述衔接头寡核香酸的第一末端结合的位点,(c)连接酶,用于将所述衔接头寡核苦酸的一条链连接至所述DNA片段的末端以形成所述DNA环,(d)引物,用于与所述衔接头寡核苷酸的所述链的一个区域退火,及(e)DNA聚合酶,用于在滚环复制反应中延伸与所述链退火的引物。在此类试剂盒的一个实施方案中,上述衔接头寡核苷酸的第二末端可以具有数目在4-12个范围内的筒并碱基。上述试剂盒可以进一步包含用于末端转移酶、连接酶和DNA聚合酶的反应緩冲液。又一方面,本发明包括用于<吏用Circligase酶(EpicentreBiotechnologies,Madison,WI)环化DNA片段的试剂盒,该试剂盒包含体积排阻聚合物(volumeexclusionpolymer)。另一方面,此类试剂盒进一步包含以下成分(a)反应緩冲液,用于为Circligase控制pH和提供经过优化的盐组合物,及(b)Circligase辅因子。另一方面,用于此类试剂盒的反应緩沖液含0.5MMOPS(pH7.5),0.1MKC1,50mMMgCl2,和10mMDTT。另一方面,此类试剂盒包含Circligase,例如10-100]liLCircligase溶液(浓度为100个单位/iiL)。例示性的体积排阻聚合物披露于美国专利4,886,741,包括聚乙二醇、聚乙烯吡咯烷酮、硫酸右旋糖苷、及类似聚合物。一方面,聚乙二醇(PEG)是500/0PEG4000。一方面,用于环形成的试剂盒包含以下成分量成分终浓度2jiLCircligaseIO版应缓冲液IX0单lmMATP250.5pL50mMMnCl21.25mM4)iL50%PEG400010%Circligase单链DNA连接酶(l00个单位/pL)10个单位/[iL单链DNA模板0.5-10pmol/fiL无菌水反应终体积20|iL。在如下规程中4吏用上述成分1.于60-96。C加热DNA,取决于DNA(具有5,-磷酸根和3,-羟基的单链DNA模板)的长度。2.于60。C预热2.2X^应混合液大约5-10分钟。3.若DNA预热至96。C,让其于60。C冷却。4.于60。C混合DNA和緩沖液,没有让它冷却,并温育2-3小时。5.加热灭活酶以终止连4妻反应。通过错配酶切割进行的大规^莫突变发现所使用的本发明阵列和测序方法可用于使用错配切割技术的大规模多态性鉴定。数种突变检测方法采用异源双链体,其中利用错配自身来进行切割识别。在用羟胺或四氧化锇修饰的错配处用哌啶进行化学切割,提供了释方丈切割片l殳的一种方法。以相似的方式,酶T7内切核酸酶I或T4内切核酸酶VII已经用于酶错配切割(EMC)技术,例如Youil等,Proc.Natl.Acad.Sci.,92:87-91(1995);Mashal等,NatureGenetics,9:177-183(1995);Babon等,MolecularBiotechnology,23:73-81(2003);Ellis等,NucleicAcidsResearch,22:2710-2711(1994);等等,收入本文作为参考。切割片段长度多态性(CFLP)技术中使用了切割酶,这种技术已经由ThirdWaveTechnologies实现商业化。当58容许单链DNA折叠并采耳又二级结构时,DNA将形成内部发夹环,其位置取决于链的碱基序列。切割酶将切割环5,端的单链DNA,然后可以通过PAGE或类似的大小解析技术来分离片段。错配结合蛋白(诸如MutS和MutY)鉴定突变位点的能力也依赖于异源双链体的形成。错配通常得到修复,但是酶的结合作用可用于经由凝胶电泳中的泳动率变化或通过针对外切核酸酶的保护而选择片段,例如Ellis等(见上文)。供异源双链体形成的模板是通过自基因组DNA延伸引物而制备的。对于参比DNA的同一基因组区域,以与测试DNA相同的方式但在分开的反应中制备过量的相对链。所生成的测试DNA链进行生物素化并附着至链霉亲合素支持物。通过力口热和消除互补链来防止同源双链体形成。现在将参比制备物与单链测试制备物混合并退火以生成异源双链体。此异源双链体有可能包含许多错配。在添加错配内切核酸酶之前洗去残余DNA,所述错配内切核酸酶预计将会为10kb引物延伸物产生大约10个片段,如果每lkb有一处错配的话。切割后,各个片段可以在各个末端结合衔接头并进入错配片段环选择过程。自大基因组片段捕捉错配切割的DNA。如上所述自大基因组片段制备的5-10kb基因组片,殳通过用末端转移酶在3,末端添加生物素化双脱氧核苷酸而生物素化,并通过过滤除去过量的生物素化核苷酸。用同一6碱基切割酶消化覆盖同一序列区域的参比BAC克隆以匹配自测试DNA产生的片段。将生物素化的基因组片段在存在BAC参比DNA时热变性并緩慢退火以产生生物素化异源双链体。参比BACDNA大大过量于基因组DNA,使得大多数生物素化产物将是异源双链体。然后可以将生物素化DNA附着至表面供消除参比DNA。在添加错配内切核酸酶之前洗去残余DNA。切割后,各个片段可以在各个末端结合衔接头并进入如下错配环选择过程。(a)在错配的两侧切割DNA。(b)产生可连接的5,悬垂(也通过用具有4碱基识别位点的适宜限制性内切核酸酶进行消化而产生3,悬垂)。(c)引入在一侧包含活性悬垂的衔接头。(d)将衔接头连接至两个所产生片段中的每一个(在将序列添加至上链的3,末端后,只连接至5,磷酸根的右边)。(e)将分子磷酸化并使用桥接寡核苷酸来连接单链分子的两个末端。(f)环化后,通过在RCR^应中延伸引物而生成串联物。自错配切割产物形成环方法I。上文产生的异源双链体可用于选择小DNA环,如图7和8所示。如图7所示,在此方法中,将样品的异源双链体(700)用错配酶处理,在两条链(704和706)上突变位点(702)附近都进行了切割,产生片段(707)和(705)。T7内切核酸酶I或类似的酶在两条链上在突变附近切割突变位点的5,端以展现不同长度的5,端悬垂。下一阶段是以适于扩增和测序的形式捕捉切割产物。将衔接头(710)连接至通过错配切割产生的悬垂(只显示了片段(705)),但是因为悬垂的本质未知,所以需要至少三种衔接头且每种衔接头用筒并碱基合成以适应所有可能的末端。衔接头可以制备成在非环化链上有内部生物素(708)以容许捕获物进行緩冲液交换和样品清洁,还在需要时容许在表面上直接扩增。因为突变之间的居间序列不需要测序且降低了系统的测序能力,所以在研究基因组衍生样品时将其消除。序列复杂性的降低是通过在远离酶识别序列的一个点处切割DNA的IIs型酶实现的。在这样做时,切割位点和所得悬垂将是所有碱基变体的组合。可以使用的酶包括MmeI(20个碱基,具有2个碱基的3,悬垂)和EcoP151(25个碱基,具有2个碱基的5,悬垂)。衔接头的长度约为50bp,为序列提供滚环复制的起始,还为环的形成提供填充序列,以及Hs型限制性内切核酸酶的识别位点(715)。一旦衔接头连接至片段,将DNA用IIs型限制酶消化(720)以释放所有序列,但包含突变位点的20-25个碱基仍然附着于衔接头。现在将连有衔接头的DNA片段附着至链霉亲合素支持物以消除过量的DNA片段。未与错配切割的末端连接的过量衔接头也将结合至链霉亲合素固相支持物。现在可以将由IIs型酶产生的新的简并末端连接至第二衔接头,其通过第二衔接头一条链的磷酸化来实现。另一条链是非磷酸化的且3,末端是用双脱氧核普酸封闭的。所形成的结构基本上是两个不同衔接头之间捕获的目的基因组片段。由此结构产生环仅仅需要该分子的两个末端聚到一起并连接,例如经由通过限制性位点(722)和(724)处的消化形成交错的末端,接着进行分子内连接。尽管此事件应当高效发生,但是仍有可能另一分子的末端与该分子的另一末端连接,产生二聚体分子或各个单元分子的更高级的多聚体。将此降至最低的一种方法是在稀释的条件下进行连接,使得只有分子内连接是有利的,然后将样品重新浓缩供将来的步骤4吏用。将环形成的效率升至最高且没有分子间连接的另一种策略是封闭表面上的过量衔接头。这可通过使用X外切核酸酶消化下链来实现。如果第二衔接头已经附着,那么它将免受消化,因为没有可用的5,磷酸。如果只有第一衔接头附着于表面,那么5'磷酸因衔接头下链的降解而暴露。这将导致过量的第一衔接头自表面上丧失。人外切核酸酶处理后,第一衔接头上链的5,末端准备好供连接第二衔接头的3,末端。这可通过将限制酶位点引入衔接头使得该分子可在连接时发生重新环化来实现。捕获到环状分子中的DNA的扩增以滚环复制进行,形成环的长线性串联物拷贝。如果延伸在生物素的5,端起始,那么环和新合成的链释放到溶液中。表面上的互补寡核苷酸负责浓缩并提供足够附着供下游应用。一条链是闭环并充当模板。3'末端暴露的另一条链充当起始引物并延伸。方法II。如图8所示,此方法与上述规程类似,但做了以下修改l)衔接头可制备成非环化链上有3,端生物素(808)以容许捕获物进行緩沖液交换和样品清洁。2)上文所述10kb异源双链体片段的序列复杂性降低经由切割4个碱基的限制酶的使用而发生,例如限制性位点(810)、(812)和(814)。一个反应中使用2种或3种酶,可以将基因组片段的大小降低至大约100个碱基。衔接头-DNA片段可附着至链霉亲合素支持物以消除过量的DNA片段。未连接至错配切割末端的过量衔接头也将结合至链霉亲合素固相支持物。现在可通过自5,末端降解的X外切核酸酶消除生物素化且磷酸化的链但非磷酸化链保持完整。为了自此结构产生环,现在需要分子的两个末端聚到一起并连接以形成环。数种方法可用于使用桥接寡核苷酸来形成环,如上所述。可以用末端转移酶将一条多核苷酸添加至3,末端以产生供桥接寡核苷酸(818)的一半与之发生杂交的序列,显示为polyA尾(816)。另一半将结合衔接头中的序列。或者,在添加外切核酸酶之前,可以将衔接头添加至由4碱基切割酶产生的末端,这将提供在用外切核酸酶消除一条链后供桥(桥接寡核苷酸)与之发生杂交的序列。这种选择规程的一个关键方面是选择供环化和扩增的链的能力。这确保了只有具有初始突变的链(来自5,端悬垂)而非来自衔接头的链得到扩增。如果3,端凹进链得到扩增,那么来自衔接头的错配会在突变位点处或附近产生虚假碱基呼叫(falsebasecall)。捕获到环状分子中的DNA的扩增以滚环复制进行,形成环的线性串联物拷贝。错配衍生环的其它应用。错配衍生的小环状DNA分子可通过其它手段来扩增,诸如PCR。可以将公用引物结合位点掺入衔接头序列。扩增得到的物质可用于通过诸如Sanger测序或基于阵列的测序等方法进行的突变检测。cDNA的无细胞克隆选择。传统的克隆方法有数项缺点,包括细菌倾向于排斥来自质粒复制的序列、产生个体cDNA分子的克隆所需要的方案费时且费试剂。可以自关闭到环状形式中的DNA分子的扩增来制备线性单链。当分到单个反应室中时,这些大型串联的、线性形式源自单分子且可充当高效的、分离的PCR把物,与挑取细菌菌落以获取包含cDNA的质粒的方式非常相似。我们计划将这种方法开发成无需经过基于细胞的克隆选择步骤就选择cDNA克隆的手段。此规程的第一步将牵涉连接针对5,末端的基因特异性寡核苷酸,其具有polydA序列供结合cDNA3,末端的polydT序列。此寡核苷酸充当桥以容许T4DNA连接酶来连接两个末端并形成环。反应的第二步是使用引物或桥接寡核苷酸,供链置换聚合物诸如Phi29聚合物产生环的串联物。然后将长线性分子稀释并排列在1536孔板中,使得可选择具有单分子的孔。为了确保大约10%的孔包含1个分子,将不得不牺牲大约90%的孔,即它们没有分子。为了检测阳性的孔,使识别靶物中通用子。通过与i《物素化捕捉寡聚物的杂交^^肖lj过量的树状聚体。用荧光读板仪分析各孔并对DNA的存在情况评分。然后将阳性孔重新排列,即将克隆合并,使板中的全部孔供进一步扩增。剪接变g测和外显子序型分析所述方法基于随机DNA阵列和"巧妙的"探针集合,用于对数以千计的基因及其剪接变体进行鉴定和表达水平定量。在真核生物中,随着自转录复合体出现初级转录物,剪接体与初级转录物上的剪接位点相互作用以切出内含子,例如Maniatis等,Nature,418:236-243(2002)。然而,或是因为改变剪接位点序列的突变或是因为影响剪接体与剪接位点相互作用的外部因素,可变剪接位点或隐蔽剪接位点可能得到选择,导致由具有不同外显子组的mRNA编码的蛋白质变体得以表达。对来自大规模EST测序计划的cDNA序列的调查指出超过50%的基因具有已知的剪接变体。在使用基于微阵列方法的最近的一项研究中,估计高达75%的基因是可变剪接的,例如Johnson等,Science,302:2141-2144(2003)。通过可变剪接产生的蛋白质的多样性可部分促成高等真核生物中的生物学过程的复杂性。这还暗示蛋白质变体形式的异常表达可引起疾病的发病机理。事实上,已经发现可变剪接与多种疾病有关联,像生长激素缺乏、帕金森氏病、嚢性纤维化和强直性肌营养不良,例如Garcia-Blanco等,NatureBiotechnology,22:535-546(2004)。由于难以分离和表征新的剪接变体,暗示剪接变体在癌症中的作用的证据可代表冰山的一角。凭借能迅速且可靠的表征mRNA剪接样式的工具的可用性,它将有助于阐明可变剪接在癌症中和在疾病发展中的一般作用。一方面,本发明的方法容许以如下步骤大规模测量剪接变体(a)制备所輩巴向的或所有的mRNA的全长的第一条cDNA链。(b)通过掺入衔接头序列将所产生的全长的(或所有的)第一条cDNA链分子环化。(c)通过使用与衔接头序列互补的引物,进行cDNA环的滚环复制(RCR)以形成具有超过100个拷贝起始cDNA的串联物。(d)通过将RCR所生成的"cDNA球"附着于用捕捉寡核苦酸(其与衔接头序列的一部分互补)包被的玻璃表面来制备随机阵列;凭借高级亚孩t米压花表面,lmn^可以有100-1000万个cDNA斑点;注意,附着是分子过程且不需要用机械臂对各个"cDNA球"或串联物点斑点。(e)自4096种6聚物和1024种经过标记的5聚物的预制通用文库开始,使用复杂的计算机程序和筒易的机械臂移液器来创建40-80个大约200种6聚物和20种5聚物的集合,用于测试样品生物体/组织中所靶向的1000种或更多直至所有已知基因中的所有10,000个或更多个外显子。(f)在一个4-8小时.的进程中,在相同的随机阵列上在40-80个循环中杂交/连接所有探针集合,使用配有灵敏的1千万像素CCD检测器的自动化显微镜样仪器为每个循环生成阵列图像。(g)使用计算机程序来进行斑点信号强度分析以鉴定哪种cDNA在哪个斑点上及任何所分析的基因中是否缺失了任何预期的外显子。通过对阵列中的出现计数,获得每种剪接变体的精确表达水平。此系统使用与经过标记的mRNA/cDNA杂交的当前表达阵列提供了单一转录物上外显子样式的完整分析,而非仅仅提供关于外显子使用率的比率或所转录基因整个群体上剪接事件的定量的信息。在其最大限度的灵敏度,它容许精确至数以百计的其它细胞中只有一个中存在mRNA各类型单个分子的详细分析;这将提供癌细胞早期诊断的独特潜力。选择性cDNA制备与标准384孔格式的"随机阵列的阵列,,及与通用短探针的"巧妙的"集合的组合在设计阵列时提供了极大的灵活性;例如,所选择的样品中少数基因的深入分析、或更多数目样品中更普遍的分析、或更小数目样品中多数基因的分析。这些分析同时提供了l)每种特定剪接变体的检测,2)野生型和可变剪接mRNA的表达的定量。它还可用于基于基因删除和基因易位的检测来监测总的染色体改变,其通过来自随机阵列上单一斑点上的相同转录物中两种基因的两种外显子子集的存在和杂合性的丧失。这种阵列的非凡容量(capacity)和忠实度(informativeness)与自非常小数量的mRNA的简单样品制备,基于所有预先制备的、经过验证的试剂(包括经过标记的和未经标记的通用探针及最终将为所有人类和模式生物基因开发的引物/衔接头的文库)的完全自动化的测定法有关系。建议的剪接变体序型分析方法相当于个别全长cDNA克隆的高通量测序;rSBH通过量可达到在4-8小时的测定中对十亿个cDNA分子进行序型分析。此系统将提供强有力的工具来监测疾病出现和进展过程中各种剪接变体表达水平的变化。它使人们能够发现新的剪接变体或者验证已知的剪接变体,用以充当生物标志物来监测癌症进展。它还可提供进一步了解可变剪接变体的作用及其作为治疗靶的可能用途的手段。这种低成本、高通量测定法的通用性质和灵活性为癌症研究和诊断学及在所有其它生物医学领域提供了极大的商业机会。这种高容量系统对提供服务的实验室和公司是理想的。供体外转录的模板的制备。将外显子序列克隆入质粒pBluescript或类似载体的多克隆位点(MCS)。为证明探针集合的有用性,不必克隆毗邻的全长序列,也不必维持正确的蛋白质编码框。对于短于lkb的基因,使用全长序列的基因特异性寡聚物自cDNA产生PCR产物。对于较长的基因,产生包含大约500bp的PCR产物,对应于外显子的毗邻嵌萃殳,并通过克隆入pBluescript的MCS中适宜克隆位点而安排好片段。这也是用于克隆可变剪接型式的方法,因为期望的变体可能不存在于用于PCR的cDNA来源中。MCS的最后一个位点用于插入一串40个A以模拟细胞mRNA的polyA尾。这是为了控制polyA尾可能干扰下文所述样品制备步骤的可能性,尽管预计这不是问题,因为如所述的在基因组片段的样品制备中掺入了poly-dA尾。T7RNA聚合酶将用于产生复印(run-off)转录物,而所产生的RNA将用标准方法纯化。供排列的样品的制备。因为探针集合是为特定基因设计的,所以只为那些特定基因制备cDNA。为引发逆转录反应,使用基因特异性引物,因此为641000种基因使用1000种引物。小心选择逆转录的引发位点的位置,因为期望高效合成》kb的cDNA是不合理的。相当常见的是,最后一个外显子将由编码序列末端和长3'非翻译区组成。在例如CD44的情况中,尽管全长mRNA是大约5.7kb,3'UTR包含3kb,而编码区只有2.2kb。因此,逆转录引物位点的合理位置通常紧挨着编码序列末端的下游。对有些剪接变体,可选外显子常常簇集在一起成一嵌段(block)以创建变异性区域。在TenascinC变体(8.5kb)的情况中,最常见的同等型(isoform)具有8个额外外显子的嵌段,而且有证据表明该区域的外显子使用率存在变异性。因而对于TenascinC,引物将紧挨着该区域的下游。因为对于合成长度〉2kb的cDNA的担心,对于长基因,用多种引物将外显子分成2kb的嵌段可能是必需的。逆转录反应可以用商业系统进行,例如Invitrogen(Carlsbad,CA)的SuperscriptIII系统和Stratagene(LaJolla,CA)的StrataScript系统。一旦产生单链cDNA分子,剩余规程牵涉放上衔接头序列、分子的环化、和RCR,如上所述。cDNA的5'末端基本上是掺入的基因特异性引物,其用于起始逆转录。通过在逆转录引发寡聚物的5'末端掺入7个碱基的通用标签,产生的所有cDNA将在5'末端携带相同的7个石成基的序列。如此,与梯f接头序列和通用标签二者互补的单一模板寡核苷酸可用于将衔接头与所有靶分子连接,无需使用具有筒并碱基的模板寡核苷酸。至于通常限定较弱的cDNA3'末端(mRNA5'末端),它可以像基因组片段的随机序列末端来对待。将应用添力口polyA尾的类似方法,如此还可以使用相同的闭环反应。逆转录酶倾向于过早终止而产生截短的cDNA。严重截短的cDNA大概不会具有足够的探针结合位点以鉴定出基因指派(名称)(geneassignment),如此不会进行分析。接近但非全然全长的cDNA分子可能表现为缺失5'外显子的剪接变体。如果没有来自序列数据库的确实证据支持这样的变体,可忽视它们。避免此类问题的一种方法是只选择全长cDNA(或那些具有期望的3'末端的)以与闭环反应相容,则任何截短的分子将不会进行环化,也不会进行复制。首先,可以将双脱氧胞嘧啶残基添加至所有cDNA的3'末端以封闭连接,然后通过使用靶向期望序列的错配寡聚物,可以使用T4内切核酸酶VI1通过酶错配切割产生新的3'末端。凭借新的3'末端,cDNA可以继续前行,即添加poly-dA尾及环化和复制的标准方案。经过复制且排列好的外显子片段串联物可以使用组合SBH来进行,如上第l步选择1000-2000个最短的外显子(合计约20-50kb),并为1024种可利用的已标记5聚物中的每一种找出匹配序列。平均每种5聚物将在20kb上出现20次,但有些可能出现超过50次或超过100次。通过选择最频繁的5聚物,将用单一已标记探针检测到最大数目的短外显子。一个目的是每个循环检测出大约50-100个短外显子(500个外显子的10%-20%)。如此,少于10种已标记探针和50-100种未标记6聚物就将是足够的。小数目的已标记探针是有利的,因为它使总体荧光背景降至最低。第2步找出与所有1000种基因中与10种选定的5聚物互补的所有位点毗邻的所有6聚物。平均每2kb基因中将存在20个这样的位点。位点总数将是大约20,000个,例如,每种6聚物平均将出现5次。根据命中频率分拣6聚物。最频繁的可具有超过20次命中,例如这样的6聚物通过联合10种已标记探针将检测出20种基因。如此,为了对500种基因中的每一种得到单一探针对,将需要最少25种6聚物探针。实际上,可能需要100-200种6聚物。由于使用预制的6聚物和5聚物探针文库的组合SBH的好处,使用已建立的移液机械臂容易的制备了40个探针集合,每个集合有大约200种探针。所产生的信息相当于每个外显子上有超过3种探针,因此8000种5聚物和6聚物的使用有效取代了单组1000种基因所需要的30,000种较长外显子特异性探针。外显子序型分析。外显子的序型分析可以以两个阶^殳进行基因鉴定阶段和外显子鉴定阶段。在基因鉴定阶段,阵列上的每个串联物可唯一的鉴定为特定基因。理论上,使用如下方案10个探针集合或杂交循环将足以鉴定IOOO种基因。每种基因指派一个唯一的二进制代码。二进制数字的位数如此取决于基因总数8种基因需要3位数,1024种基因需要10位数。每个探针集合设计成对应于二进制代码的一个数位,而且包含将会命中半数基因的独特组合的探针,而且每种基因只有一次命中。如此,对于每个杂交循环,对于该数位,独特的一半基因将得分1而另一半将得分0。使用IO个探针集合的IO个杂交循环将产生1024种唯一的二进制代码,足以将1OOO种独特基因指派给阵列上的所有串联物。为了提供鉴定数据的冗余,将使用15-20个循环。若使用20个循环,它将提供l百万个独特的二进制代码,而且应当有足够信息来解决由于缺失外显子或基因删除引起的信号丧失。它还将相当于平均每种基因有10个数据点(20个循环,每个循环500个数据点,合计产生10,000个数据点),或每个外显子有一个阳性探针对。在这点上,在20个循环后,这种系统能够将1百万个独特基因身份指派给串连物(ampliot)。因此通过对串连物的基因身份计数,可定量测定任何给定样品中所有基因的表达水平(但非剪接变体的亚型分型)。在将每个串连物鉴定为基因指派(名称)后,它的外显子样式将在外显子鉴定阶段中进行序型分析。对于外显子鉴定阶段,每个杂交循环测试所有或大多数基因中的一个外显子每种基因。在大多数情况中,10-20个外显子鉴定循环应当是足够的。如此,在使用20个外显子鉴定循环的情况中,我们将得到每种基因中10个外显子每个2种探针的信息。对具有超过20个外显子的基因,可以发展方法从而在同一循环中可以探查每种基因2个外显子。一种可能性是使用不同颜色的多种荧光团,另一种可能性是使用不同连接探针对的差异杂合物稳定性。总之,合计大约40个测定循环将提供足够信息以获得每个斑点处的基因身份,及为10,000个外显子中的每一个提供3个匹配的探针对,以足够的信息冗余提供因可变剪接或染色体删除而^:失的外显子的精确鉴定。实施例实施例l:盖玻片作为随机阵列支持物衍生化方案在此实施例中,将盖玻片(glasscoverslip)准备好用作部署DNA串联物(concatemer)的支持物。使用了以下材料Millipore去离子(DI)水2.5ml3-氨基丙基二曱基乙氧基硅烷(Gelest)1.6克对苯二异碌b氰酸(盐/酉旨)(AcrosOrganics/fisher)210克KOH(VWR)乙醇(VWR)曱醇(VWR)吡啶(VWR)N,N-二曱基曱酰胺(VWR)丙酮(VWR)设备100。C烘箱》兹力4觉4半台(magneticstirplate)l个2"x.5"》兹力4觉4半丰奉(magneticstirbar)2个4升Nunc烧杯7个4"x8"x4"玻璃容器l升量筒l个100ml量筒l台实验室天平l台Metzle沃平l个大称量碟(weighboat)l个小称量石莱l对厚的腈手套l个大漏斗lml移液器及带滤板的尖头l个nalgene搅拌棒l个密^J"容器(tupperware)使用大量筒量取950ml乙醇并倒入4升Nunc烧杯。用小量筒量取50ml去离子水并倒入前述Nunc烧杯。在实验室天平上在称量碟中称取21O克KOH颗粒。将搅拌棒和KOH颗粒置入烧杯。将烧杯置于搅拌台上并以低速搅动直至KOH完全溶解。在KOH溶解时,摆出6个预先清洗过的玻璃容器。向容器2-5中倒入去离子水至距顶部^英寸(约800ml)。向容器6中倒入丙酮至距顶部1/2英寸。将溶解后的K0H溶液小心倒入容器1至距顶部^英寸。将搁在架子上的盖玻片在容器1中放置3分钟,从容器l中取出架子并在容器2-5中清洗,即在每个容器中放置最少15秒钟。将架子在容器6中短暂淹没。将架子置于一边,使用大漏斗和厚腈手套将容器l和2中的溶液倒入碱性废水容器(basicwastecontainer),清洁和干燥实验器具。摆出7个干净且干燥的玻璃容器。将775ml丙酮倒入容器l并将2.5ml去离子水倒入容器l。用移液器尖头搅动容器l达20秒钟。用一个新的移液器尖头将2.5ml3-氨基丙基二曱基乙氧基硅烷加至容器l。用移液器尖头搅动10秒钟。将全部5个架子上的盖玻片浸入容器1。用聚丙烯盒盖盖上容器l。等待45分钟。反应完成前15分钟,向容器2-4中倒入丙酮至距顶部^英寸,向容器5中倒入水至距顶部K英寸。向容器6中倒入68丙酮至距顶部K英寸。在反应完成时U5分钟),将盖玻片架子1-5从容器1转移至容器2,等待15秒钟。重复这一操作至容器6。将架子置入空的容器7并置入100。C烘箱。等待1小时。摆出7个玻璃容器。从烘箱中取出架子后,使用Meltzer天平在小称量碟中称取1.6克对苯二异疏氰酸(盐/西旨)(PDC)。将720ml二曱基曱酰胺倒入清洁过的l升量筒,用吡啶补至800ml。将50%的前述溶液倒入一个干净的玻璃容器,然后倒回量筒以混匀(重复一次)。将前述溶液倒入容器1至距顶部1/2英寸。将PDC从称量碟加至容器1。使用搅拌棒混合溶液。碾压未溶解的PDC团块,然后再次搅动。盖玻片架子现在应当是凉的。将全部5个架子置入容器l。盖上聚丙烯盒盖。等待2小时。反应完成前10分钟,向容器2和3中倒入曱醇至距顶部K英寸。向容器4和5中倒入丙酮至距顶部乂2英寸。向容器6中倒入65。/。丙酮35。/c)水至距顶部i/2英寸。向容器7中倒入丙酮。将架子相继转移经过全部容器,在每次转移间等待15秒钟。从容器7中取出架子,并将容器l-7的内容物倒入有机废液缸(organicwastedrum)。将架子放回容器7,并在供箱中干燥15分钟。将干燥的架子置入密封的容器,它们现在为附着做好准备了。实施例2:自大肠杆菌基因组DNA制备RCR产物并部署在盖玻片上将大肠杆菌基因组DNA(32吗)(SigmaChemicalCo)用0.16UDNA酶I(Epicentre)于37。C消化10分钟,然后于95。C热灭活10分钟。根据琼脂糖凝胶电泳的测定,反应产物的分布以200bp为平均大小。如果反应产物没有达到所需大小分布,那么添加新鲜的酶进一步消化它们。终浓度为200ng/(xl基因组DNA。将DNA酶消化后的DNA(26ng/Vl)与购自NewEnglandBiolabs(NEB)的末端脱氧核芬酸转移酶(0.66U/^)在NEB供应的反应緩冲液中进行反应。反应含有dATP(2mM)并于37。C进行30分钟,然后于70。C热灭活10分钟。然后将DNA样品加热至95。C达5分钟,之后在冰上迅速冷却。然后将合成的DNA衔接头连接至基因组DNA的5,端,这通过首先65个碱基的寡核香酸(TATCATCTACTGCACTGACCGGATGTTAGGAAG寡核苷酸(NNNNNNNGTCCGTTAATGTGAC3'2'3'ddC)(SEQIDNO:9)在该65聚物的3,端形成杂合物,其中7个"N"形成突出端。较短的寡聚物将充当该65聚物与基因组片段5,端连接的夹板(splint)。夹板分子在其5,端包含7个筒并碱基以与基因组DNA5'端的可变碱基发生杂交。衔接头杂合物是通过在52(1l中緩慢杂交1200pmol衔接头与1200pmol夹板自95。C至室温达l小时形成的。将T4DNA连接酶(0.3U/V1)与基因组DNA(17ng/nl)和衔接头-夹板(0.5pM)在NEB供应的1X连接酶反应緩冲液中混合。连接于15。C进行30分钟、20°C进行30分钟,然后于70。C灭活10分钟。然后将第二夹板分子(AGATGATATTTTTTTT3'2'3'ddC)(SEQIDNO:10)(0.6^M)加至反应体系中并向混合液中添加更多的连接酶緩沖液和T4DNA连接酶(0.3U4U)。反应于15。C进行30分钟,然后于20。C进行30分钟,之后于70。C灭活1O分钟。然后将连接混合液用外切核酸酶I(NEB)(lU4il)于"。C处理60分钟,接着于80。C灭活20分钟。在含BSA(0.1pg/^1)、dNTP(每种0.2mM)、起始S1物(TCAGCTTCCTTTTGTCTTCCTAAC)(SEQIDNO:11)(2finol/Vl)、经外切核酸酶处理的基因组DNA连接物(24pg/pl)、和Phi29聚合酶(0.2U/)il)的NEB供应的反应緩冲液中进行滚环复制(RCR)。反应于30。C进行1小时,然后于70。C热灭活10分钟。将RCR^应产物附着至盖玻片的表面,这通过首先将经胺修饰的寡核苷酸附着于盖玻片的表面。在O.lpMNaHC03中将捕捉探针GG)(SEQIDNO:12)(50pM)加至经DITC衍生化的盖玻片并使之于40。C干燥约30分钟。将盖玻片在DDI水中漂洗15分钟并干燥。然后将RCR^应产物(4.5pl)与0.5^120XSSPE混合并加至盖玻片的中央。让样品风干并洗去未附着的物质,即在3xSSPE中清洗10分钟,然后在DDI水中短暂清洗。然后将盖玻片干燥,之后装配到显微镜上。显现附着的RCR产物,这通过TAMRA标记的、与衔接头的一个区域互补的ll聚物探针的杂交来实现。AAAAAAAAAAAA)(SEQIDNO:13)形成RCIL良应产物,只是未用TDT(末端脱氧核苦酸转移酶)添加polyA。RCR反应含有靶物分子,估算为12.6finol/pl。将反应产物(5pl)与SSPE(2X)和SDS(0.3%)在20^1总反应体积中混合。将样品施加至盖玻片,其中数行在含0.1pMNaHCO3的50nM溶液中沉积的捕捉探针([AMINOC6][Sp-C18]在湿盒(humidchamber)中放置30分钟。然后洗去溶液,即在3xSSPE中清洗IO分钟,然后在水中短暂清洗。对多种反应成分测试了它们对RCR产物形成的影响。发现将Phi29以0.1U4il而非0.2U/ial的终浓度添加至RCRA应产生更大比例的RCR产物,即在用检测探针进行杂交后亮度更大。还发现以相对于估算的靶物浓度10-100倍摩尔比添加起始?1物是最佳的。延长延伸时间产生更强的荧光信号但趋向于产生更散布的串联物。就当前的附着方案而言,2小时的延伸时间相对于1小时的温育产生增强的信号,对RCR产物形态学的有害影响最小。通过将RCR反应中合成的和基因组的靶物的估算浓度降低至0.1-0.25fmoLVl,实现了RCR产物的进一步优化。这通常使用附着方法l在显微镜盖玻片的表面上产生独特且唯一的RCR产物。对于RCRA应中可能存在更高浓度的靶物(例如〉5fmol4d)的合成靶物,可通过方法2来附着RCR产物。附着方法l:将RCR^应产物(4.5iil)与0.511120XSSPE混合并加至盖玻片的中央。使样品风干并洗去未附'着的物质,即在3xSSPE中清洗10分钟,然后在DDI水中短暂清洗。然后将盖玻片干燥,之后装配到显微镜上。显现附着的RCR产物,这通过TAMRA标记的、与衔接头的一个区域互补的ll聚物探针的杂交来实现。附着方法2:将RCR^应产物(l[il)与5(Hil3XSSPE混合并加至附着有捕捉探针的盖玻片的中央。发现添加SDS(0.3%)促进特异性附着至捕捉探针而非经衍生化的表面。将样品于室温温育30分钟并洗去未附着的物质,即在3xSSPE中清洗10分钟,然后在DDI水中短暂清洗。然后将盖玻片干燥,之后装配到显微镜上。显现附着的RCR产物,这通过TAMRA标记的、与衔接头的一个区域互补的ll聚物探针的杂交来实现。上述方案提供了大约每2-4平方微米有l个RCR产物的RCR产物密度。所得盖玻片的例示性图像见图3。实施例3:使用荧光标记的探针来区分随机阵列上的RCR产物将来自炭疽芽孢杆菌CBacZ〃wsawf/2racz》和鼠疫耶尔森氏菌(re"z'"/ape幼》的诊断区的PCR产物转变成单链DNA并附着至通用衔接头(universaladaptor)。然后将这两份样品混合,使用RCR—起复制并作为随机阵列沉积到玻璃表面上。与扩增子特异性4笨针的相继杂交显示,阵列上的每个斑点唯一的对应于两种序列之任一,而且它们可以用探针特异性的鉴定,如图4所示。这个结果证明了鉴定亚微米大小的DNA串联物(其具有通过RCR反应产生的大约100-1000个拷贝的DNA片段)中存在的DNA的灵敏性和特异性。使用标准PCR才支术用PCR引物(引物对中的一条引物是-岸酸化的)扩增来自炭疽芽孢杆菌的155bp扩增子序列和来自鼠疫耶尔森氏菌的275bp扩增子序列。通过使用X外切核酸酶降解磷酸化的那条链,产生单链形式的PCR产物。然后使用T4DNA多核苷酸激酶将剩余那条链的5'末端磷酸化,以容许单链产物与通用衔接头的连接。使用T4DNA连接酶将通用衔接头连接至靶物分子的5'末端,其得到与靶物的5,末端和通用衔接头的3'末端互补的模板寡核苷酸的辅助。然后使用其碱基与衔接头和靶物的3'末端互补的桥接寡核苷酸将连接了衔接头的靶物环化。通过外切核酸酶I的处理,除去线性DNA分子。通过混合单链模板和使用Phi29聚合酶环绕经环化的衔接头-靶物分子进行复制(以桥接寡核苷酸作为起始引物),产生RCR产物(DNA串联物)。为了准备好盖玻片供附着经胺修饰的寡核苷酸,将盖玻片首先在钾/乙醇溶液中清洁,接着漂洗和干燥。然后将它们用3-氨基丙基二曱基乙氧基硅烷、丙酮、和水的溶液处理45分钟,并在烘箱中于100。C固化(cure)l小时。作为第一步,将盖玻片用对苯二异硫氰酸(盐/酯)(PDC)、吡啶、和二曱基曱酰胺的溶液处理2小时。捕捉寡核苦酸(序列5'-GGATGTTAGGAAGACAAAAGGAAGCTGAGG-3')(SEQIDNO:14)与通用衔接头序列互补,而且在5'末端用胺基团和2个C-18接头修饰。为了附着,将10pl以1(HiM溶于0.1MNaHC03的捕捉寡聚物点到经衍生化的盖玻片的中央,在70。C烘箱中干燥10分钟,并用水漂洗。为了创建DNA串联物阵列,将含有DNA串联物的RCR^应液用3XSSPE稀释10倍,然后取20pl沉积在盖玻片表面上的固定化后的捕捉寡核苷酸之上,即在饱和湿盒(moisturesaturatedchamber)中放置30分钟。然后将带有DNA串联物的盖玻片装配到反应盒(reactionchamber)中并用2ml3XSSPE漂洗。对排列好的、衍生自炭疽芽孢杆菌和鼠疫耶尔森氏菌PCR扩增子的靶物串联物分子用TAMRA标记的以下寡聚物相继探查探针BrPrb3(序列5'-CATTAACGGAC-3'(SEQIDNO:15),与通用衔接头序列特异性互补)、探针Ba3(序列5'-TGAGCGATTCG-3'(SEQIDNO:16),与Ba3扩增子序列特异性互补)、探针Yp3(序列5'-GGTGTCATGGA-3',与Yp3扩增子序列特异性互补)。将探针以0.1pM浓度与阵列在3XSSPE中于室温杂交20分钟。用2ml3XSSPE洗去过量的探针。用TIRF显微镜采集图像。然后用lml3XSSPE于80。C5分钟剥离探针,为下一轮杂交准备排列好的靶物分子。通过叠加自3种探针的相继杂交得到的图像,如图4所示,可以看到与衔接头探针杂交的排列好的分子大多数只是与扩增子l探针(例如图4中的"A")和扩增子2探针(例如图4中的"B")中任一发生杂交,很少与二者都发生杂交。这种特异性杂交样式证明了阵列上的每个斑点只含有一种类型的序列,或是炭疽芽孢杆菌扩增子或是鼠疫耶尔森氏菌扩增子。实施例4:自含有一个简并碱基的合成80聚物寡核苷酸创建的排列好的串联物中一个g位置的解码可以将含有一个筒并碱基的合成寡核苦酸的各个分子分成4个亚群,每个可以在该特定位置具有A、C、G和T碱基中任一。在用这种合成DNA创建的串联物阵列中,含有每种碱基的斑点可各占大约25%。通过对4种碱基中每一种特异性的成对探针的四项相继杂交和连接,证明了这些串联物亚群的成功鉴定,如图5所示。将5'磷酸化的、3'TAMRA标记的5聚物寡核苷酸与四种6聚物寡核苷酸之一配对。这4对连接探针中每一对应当与含A、C、G或T型式的耙物中任一发生杂交。对大多数靶物得到了大于3的鉴别得分(discriminationscore),证明了鉴定纳米球(nanoball)靶物间单碱基差异的能力。鉴别得分为斑点的最高得分除以同一斑点的其它3种碱基特异性信号平均值。通过调整测定条件(缓冲液组成、所有成分的浓度、循环中每个步骤的时间和温度),预期可以得到更高的信号对背景比和完全匹配对错配比。在6聚物探针的斑点阵列上进行的类似连接测定实验证明了这一点。在这种情况中,完全匹配/背景比为大约50,而平均完全匹配M告配比为30。结果进一步证明了测定串联物中存在的DNA的部分或完全序列的能力,其通过增加连贯探针循环数或通过每个循环使用4种或更多种用不同染料标记的探针来实现。合成的寡核苷酸(T1A:5'-NNNNNNNNGCATANCACGANGTCATNAAAAAA-3')(SEQIDNO:13)在第32位包含一个筒并碱基。将通用衔接头连接73至此寡核苦酸并将衔接头-TlADNA环化,如上所述。将使用滚环复制(RCR)反应在此靶物上制备的DNA串联物排列到随机阵列上。因为此随机阵列上的每个斑点对应于源自单分子T1A的串联复制拷贝,因此特定排列斑点中的DNA在对应于T1A第32位的位置将包含A或C或G或T。为了鉴定这些亚群,使用对4种碱基中每一种特异性的一组4种连接探针。将5'磷酸化的、3'TAMRA标记的对应于TlA第33-37位的5聚物寡核苷酸(序列为CAAAC(探针TlA9b))与对应于第27-32位的以下6聚物寡核苦酸之一配对ACTGTA(探针TlA9a)、ACTGTC(探针TlA10a)、ACTGTG(探针TlAlla)、ACTGTT(探针TlA12a)。这4对连接探针中每一对应当与含A、C、G或T型式的T1A之任一发生杂交。对每个杂交循环,将探针与阵列在含T4DNA连接酶的连接/杂交缓沖液中于20。C温育5分钟。于20。C洗去过量的探针并用TIRF显微镜采集图像。剥离结合的探针,为下一轮杂交做准备。将衔接头特异性探针(BrPrb3)与阵列杂交以确定所有斑点的位置。然后将4对连接探针以0.4jaM与有碱基标识的阵列相继杂交,如图5为四个斑点所示。很清楚,大多数斑点只与4对连接探针之一有关,因此可特异性的确定位于T1A第32位的碱基的性质。实施例5:位于合成80聚物寡核苷酸末端的两个筒并碱基的解码上文所述相同的合成寡核苷酸在5'末端包含8个简并碱基以模拟随机基因组DNA末端。由此寡核苦酸创建的串联物可具有这8个简并碱基,紧挨着衔接头序列后面。为了证明对与已知的衔接头序列相邻的两个未知碱基测序的可行性,使用具有能与衔接头序列3'端杂交的特异性序列的12聚物寡核苷酸(UK0-12序列5'-ACATTAACGGAC-3')(SEQIDNO:17)作为锚(anchor),并4吏用一组16种TAMRA标记的、BBNNNNNN形式的寡核苷酸作为序列阅读探针(sequence-readingprobe)。对每个杂交循环,将0.2^MUK0-12锚探针和0.4一BBNNNNNN探针与阵列在含T4DNA连接酶的连接/杂交緩冲液中于20。C温育10分钟。于20。C洗去过量的探针并用TIRF显微镜采集图像。剥离结合的探针,为下一轮杂交做准备。使用BBNNNM^N探针集的一个子集(即以GA、GC、GG和GT替换BB),自靶物创建的串联物阵列上的斑点能够鉴定为与这4种探针之一特异性结合的斑点,平均完全匹配/错配比超过20,如图6所示。定义本文中所使用的核酸化学、生化、遗传学和分子生物学的术语和符号遵循本领域标准i仑文和教科书的术语和符号,例如Kornberg和Baker,DNAReplication,第2版,W.H.Freeman,NewYork,1992;Lehninger,Biochemistry,第2版,WorthPublishers,NewYork,1975;Strachan和Read,HumanMolecularGenetics,第2版,Wiley-Liss,NewYork,1999;Eckstein,编,OligonucleotidesandAnalogs:APracticalApproach,OxfordUniversityPress,NewYork,1991;Gait,编,OligonucleotideSynthesis:APracticalApproach,IRLPress,Oxford,1984;诸如此类。"扩增子"指多核苷酸扩增反应的产物。也就是说,它是自一条或多条起始序列复制得到的一群多核苷酸,通常是双链的。所述一条或多条起始序列可以是相同序列的一个或多个拷贝,或者可以是不同序列的混合物。扩增子可以通过多种扩增反应(其产物是一条或多条靶核酸的多个复制品)来生成。生成扩增子的扩增反应一般是"模板驱动的",即反应物(或是核苷酸或是寡核苷酸)的碱基配对在需要创造反应产物的模板多核苷酸中有互补物。一方面,模板驱动的反应指使用核酸聚合酶的引物延伸或使用核酸连接酶的寡核苷酸连接。此类反应包括但不限于聚合酶链式反应(PCR)、线性聚合酶反应、基于核酸序列的扩增(NASBA)、滚环复制等等,参阅收入本文作为参考的以下文献Mullis等,美国专利4,683,195;4,965,188;4,683,202;4,800,159(PCR);Gelfand等,美国专利5,210,015(使用"taqman"探针的实时PCR);Wittwer等,美国专利6,174,670;Kacian等,美国专利5,399,491("NASBA,,);Lizardi,美国专利5,854,033;Aono等,日本专利发表物JP4-262799(滚环复制);等等。一方面,本发明的扩增子是通过PCR生成的。扩增反应可以是"实时"扩增,如果能得到能随扩增反应的进行而测量反应产物的检测化学的话,例如下文所述"实时PCR"或Leone等,NucleicAcidsResearch,26:2150-2155(1998)及类似文献中记载的"实时NASBA"。在用于本文时,术语"扩增"指进行扩增反应。"反应混合物"指含有进行反应所必需的所有反应物的溶液,可包括但不限于緩冲剂(用于在反应期间将pH维持于选定的水平)、盐、辅因子、清除剂(scavenger)等等。"互补的或基本上互补的"指核香酸或核酸间双链体的形成或碱基配对或杂交,诸如例如双链DNA分子的两条链之间的或寡核苷酸引物与单链核酸上引物结合位点之间的。互补的核苷酸一般指A与T(或者A与U)、C与G。若一条核香酸链(最理想的是在比对和比较后且插入或删除了适宜的核普酸后)与另一条核苷酸链的至少大约80%、通常是至少大约90%至95°/。、且最优选大约98至100%发生配对,则说这两条单链RNA或DNA分子是基本上互补的。或者,若一条RNA或DNA链在选择性杂交条件下与其互补链发生杂交,则存在实质性的互补性。典型的,若在至少14-25个核苷酸的区段上有至少大约65%互补性、优选至少大约75。/。、更优选至少大约90%互补性,则会发生选择性杂交。参阅M.Kanehisa,NucleicAcidsRes.12:203(1984),收入本文作为参考。"双链体,,指至少两条完全或部分互补的寡核普酸和/或多核苷酸在它们的所有或大多数核苷酸中发生Watson-Crick型碱基配对,从而形成稳定的复合物。术语"退火"和"杂交"可互换使用,指形成稳定的双链体。"完美匹配的"就双链体而言指构成双链体的多核苷酸或寡核苦酸链彼此形成双链结构,使得每一条链中的每个核苷酸与另一条链中的核苷酸发生Watson-Crick碱基配对。术语"双链体"涵盖可采用的核香类似物诸如脱氧肌苷、具有2-氨基嘌呤碱基的核苷、PNA等等的配对。两条寡核苷酸或多核苦酸间双链体中的"错配"指双链体中的一对核苷酸不能发生Watson-Crick键合。"遗传基因座"或"基因座,,就基因组或靶多核苷酸而言指基因组或靶多核苦酸的毗邻(contiguous)亚区域(subregion)或区段。在用于本文时,遗传基因座或基因座可以指核苷酸、基因、或基因的一部分在基因组(包括线粒体DNA)中的位置,或者它可以指基因组序列的任何毗邻部分,无论它是否在基因内或与基因有关联。一方面,遗传基因座指基因组序列(包括线粒体DNA)的任何部分,长度从单个核苷酸至一段几百个核香酸,例如100-300个。"遗传变体"指遗传基因座处一个或多个核苷酸的替代、倒位、插入或删除,或者DNA自一个遗传基因座至另一个遗传基因座的易位。一方面,遗传变体指一群个体中可能存在的遗传基因座处的可选核苷酸序列,包括对该群体其它成员而言的核苷酸替代、插入和删除。另一方面,遗传基因座处的插入或删除包括所述基因座处与该群体另一个体的同一基因座相比1-10个核苷酸的添加或缺失。"杂交,,指两条单链多核苷酸非共价结合以形成稳定的双链多核苷酸的过程。术语"杂交,,还可以指三链杂交。所得(通常的)双链多核苷酸是"杂合物,,或"双链体"。"杂交条件"通常将包括低于大约1M、更通常的是低于大约500mM和低于大约200mM的盐浓度。"杂交緩沖液"指緩冲盐溶液,诸如5XSSPE等等。杂交温度可以低至5。C,但通常高于22。C,更通常的是高于大约30。C,且优选高于大约37。C。杂交通常在严格条件下进行,即探针会与其靶物子序列发生杂交的条件。严格条件是序列依赖性的,在不同情况中是不同的。较长的片段可能需要较高的杂交温度以实现特异性杂交。因为其它因素可能影响杂交的严格性,包括互补链的碱基组成和长度、有机溶剂的存在和碱基错配的程度,参数的组合比任何单独一项的绝对度量更重要。严格条件一般选择为比特定序列在限定的离子强度和pH的Tm低大约5。C。例示性的严格条件包括至少0.01M至不高于1MNa离子浓度(或其它盐)的盐浓度、7.0至8.3的pH、和至少25。C的温度。例如,5XSSPE(750mMNaCl,50mM磷酸的钠盐,5mMEDTA,pH7.4)的条件和25-30。C的温度适合于等位基因特异性探针杂交。关于严格条件参阅例如Sambrook,Fritsche和Maniatis,"MolecularCloningAlaboratoryManual"第2版ColdSpringHarborPress(1989)及Anderson,"NucleicAcidHybridization"第l版BIOSScientificPublishersLimited(1999),为上述所有目的完整收入本文作为参考。"与...(发生)特异性杂交"或类似表述指某分子与或只与某一种或某一些特定核苷酸序列在严格条件下在该序列存在于复杂的混合物(例如总的细胞DNA或RNA)中时结合、形成双链体、或发生杂交。"连接"指在模板驱动的反应中在两条或更多条核酸(例如寡核苷酸和/或多核苷酸)的末端之间形成共价键或联接。所述4建或联接的本质可以广泛变化,而且连接可以是酶促或化学进行的。在用于本文时,通常酶促进行连接以在一条寡核苦酸的末端核苷酸的5,碳与另一条寡核苷酸的3,碳之间形成磷酸二酯联接。收入本文作为参考的以下文献中记载了多种模板驱动的连接反应Whitely等,美国专利4,883,750;Letsinger等,美国专利5,476,930;Fung等,美国专利5,593,826;Kool,美国专利5,426,180;Landegren等,美国专利5,871,921;Xu和Kool,NucleicAcidsResearch,27:875-881(1999);Higgins等,MethodsinEnzymology,68:50-71(1979》Engler等,TheEnzymes,15:3-29(1982);及Namsaraev,美国专利出版物2004/0110213。酶促连接通常在连接酶緩冲液中发生,即含有所采用的特定连接酶所需要的任何二价阳离子、辅因子、等等的緩冲盐溶液。"微阵列"或"阵列"指具有通常是平坦的或基本上平坦的表面的固相支持物,其携带含有核酸的位点阵列,使得该阵列的每个成员位点包含固定化的寡核苦酸或多核苦酸的相同拷贝,而且在空间上是确定的、不与该阵列的其它成员位点交叠;也就是说,各位点在空间上是离散的。在有些情况中,微阵列的位点还可以是隔开的且离散的;也就是说,.不同位点不共享边界,但是由位点间区域分开,所述位点间区域通常没有结合核酸。在空间上确定的杂交位点可另外是"可设定地址的,,(addressable),即它的位置和它所固定化的寡核苷酸的身份是已知的或预先确定的,例如在使用前。在有些方面,寡核苷酸或多核芬酸是单链的,而且共价附着于固相支持物,通常经由5,末端或3,-末端。在其它方面,寡核苦酸或多核香酸非共价附着于固相支持物,例如通过生物素-链霉亲合素联接、与共价结合的捕捉寡核苷酸的杂交、诸如此类。以下文献回顾了常规微阵列技术Schena,编,Microarrays:APracticalApproach,IRLPress,Oxford,2000;Southern,CurrentOpin.Chem.Biol"2:404-410(1998);NatureGeneticsSupplement,21:1-60(1999)。在用于本文时,"随机阵列"或"随机微阵列"指其在空间上离散的寡核苷酸或多核苷酸区在空间上未设定地址的微阵列。也就是说,所附着的寡核苷酸或多核苷酸的身份(至少最初)不能根据其位置而辨别,但是可通过对该阵列的特定操作而确定,例如测序、杂交解码探针等等。随机微阵列通常由微珠(microbead)平面阵列形成,例3oBrenner等,NatureBiotechnology,18:630-634(2000);Tulley等,美国专利6,133,043;Stuelpnagel等,美国专利6,396,995;Chee等,美国专利6,544,732;诸如此类。"错配,,指Watson-Crick碱基对G-C和A-T以外的任何两个碱基A、T(或RNA时的U)、G和C之间的碱基对。八种可能的错配是A-A、T-T、G-G、C-C、T-G、C-A、T-C和A-G。"突变,,和"多态性,,有时可互换使用,通常指核苷酸序列因一个或多个石咸基、插入和/或删除而与参比DNA序列或野生型序列或正常组织序列不同的DNA分子,诸如基因。在有些情况中,遵循Cotton(MutationDetection,OxfordUniversityPress,Oxford,1997)的用法,即突变理解为任何碱基变化,78无论对生物体是否是病理性的,而多态性通常理解为没有直接病理后果的碱基变化。"核苷"在用于本文时包括天然的核苷,包括2'-脱氧和2'-羟基形式,例如Kornberg和Baker,DNAReplication,第2版,Freeman,SanFrancisco,1992中所记载的。"类似物"就核苷而言包括具有经修饰的碱基模块和/或经修饰的4唐才莫块的合成核苦,例唢口Scheit,NucleotideAnalogs,JohnWiley,NewYork,1980;Uhlman和Peyman,ChemicalReviews,90:543-584(1990)等等所记载的,前提是它们能够进行特异性杂交。这样的类似物包括设计用于增强结合特性、降低复杂性、提高特异性、诸如此类的合成核苷。包含具有增强的杂交或核酸酶抗性特性的类似物的多核香酸参阅Uhlman和Peyman(上文有引用);Crooke等,Exp.Opin.Ther.Patents,6:855-870(1996);Mesmaeker等,CurrentOpinioninStructualBiology,5:343-355(1995);诸如此类。能够增强双链体稳定性的例示类型的多核香酸包括寡核苷酸N3'—P5'氨基磷酸酯(phosphoramidate)(本文中称为"酰胺化物,,(amidates))、肽核酸(本文中称为"PNA")、寡-2'-0-烷基核糖核苷酸、含有C-5丙炔基嘧啶的多核苷酸、锁定核酸(lockednucleicacid,LNA)及类似化合物。这样的寡核苷酸或是可通过商业途径购买,或是可使用文献中记载的方法合成。"聚合^式反应"或"PCR"指通过互补DNA链的同时引物延伸用于体外扩增特定DNA序列的反应。换言之,PCR指用于制备侧翼为引物结合位点的靶核酸的多个拷贝或复制品的反应,这样的反应包括一次或多次重复以下步骤(i)使靶核酸变性,(ii)使引物与引物结合位点退火,和(iii)在存在核香三磷酸时通过核酸聚合酶使引物延伸。通常,反应在热循环设备中穿梭于为每个步骤优化的不同温度而循环。具体的温度、每个步骤的持续时间、和各步骤间变化的速率取决于本领域普通技术人员公知的许多因素,例如以下文献所例示的McPherson等,编,PCR:APracticalApproach及PCR2:APracticalApproach(IRLPress,Oxford,分别于1991和1995)。例如,在使用TaqDNA聚合酶的常规PCR中,可以使双链靶核酸于〉90。C的温度变性,使引物于50-75。C范围中的温度退火,并使引物于72-78。C范围中的温度延伸。术语"PCR"涵盖该反应的衍生形式,包括但不限于RT-PCR、实时PCR、嵌套PCR、定量PCR、多重PCR、诸如此类。反应体积的范围自几百纳升例如200nL至几百微升例如200pL。"逆转录PCR"或"RT-PCR"指首先进行逆转录反应将靶RNA转变成互补的单链DNA,然后进行扩增的PCR,例如Tecott等,美国专利5,168,038,收入本文作为参考。"实时PCR"指随反应进行而监测反应产物即扩增子的量的PCR。有多种形式的实时PCR,区别主要在于用于监测反应产物的检测化学,例如Gelfand等,美国专利5,210,015("taqman,,);Wittwer等,美国专利6,174,670和6,569,627(嵌入染料);Tyagi等,美国专利5,925,517(分子立标);收入本文作为参考。用于实时PCR的检测化学的综述参阅Mackay等,NucleicAcidsResearch,30:1292-1305(2002),也收入本文作为参考。"嵌套PCR"指如下的两阶段PCR,其中第一阶段PCR的扩增子作为第二阶段PCR的样品,所述第二阶段PCR使用一组新的引物,其中至少一条引物与第一扩增子的内部位置结合。在用于本文时,"初始引物"就嵌套扩增反应而言指用于产生第一扩增子的引物,而"第二引物"指用于产生第二或嵌套扩增子的一种或多种引物。"多重PCR"指在同一反应混合物中同时扩增多种靶序列(或者单一靶序列及一种或多种参比序列)的PCR,例如Bernard等,Anal.Biochem.,273:221-228(1999)(双色实时PCR)。通常,为所扩增的每种序列采用不同引物组。"定量PCR"指设计用于测量样品或标本中一种或多种特定靶序列的丰度的PCR。定量PCR包括所述耙序列的绝对定量和相对定量二者。定量测量^f吏用可以与耙序列分开或一起测定的一种或多种参比序列来进行。参比序列对于样品或标本可以是内源的或外源的,在后一种情况中,可以包含一种或多种竟争物模板。典型的内源参比序列包括以下基因的转录物区段p-肌动蛋白、GAPDH、^2-微球蛋白、核糖体RNA、诸如此类。用于定量PCR的技术是本领域普通技术人员公知的,在收入本文作为参考的以下文献中有例示Freeman等,Biotechniques,26:112-126(1999);Becker-Andre等,NucleicAcidsResearch,17:9437-9447(1989);Zimmerman等,Biotechniques,21:268-279(1996);Diviacco等,Gene,122:3013-3020(1992);Becker-Andre等,NucleicAcidsResearch,17:9437-9446(1989);诸如此类。"多核苷酸"或"寡核苦酸"可互换使用,各指核苷酸单体的线性聚合物。在用于本文时,这些术语还可以指双链形式。构成多核香酸和寡核苦酸的单体能够经由规则样式的单体-单体相互作用,诸如Watson-Crick型碱基配对、碱基堆积、Hoogsteen或反向(reverse)Hoogsteen型碱基配对等等,与天然多核苷酸特异性结合,以形成双链体或三链体形式。这样的单体及其核香间联接可以是天然存在的,或者可以是它们的类似物,例如天然存在的或非80天然存在的类似物。非天然存在的类似物可以包括PNA、石克代磷酸酯核苦间联接、含有容许标记物诸如荧光团或半抗原附着的连接基团的石威基、诸如此类。每当寡核苷酸或多核苦酸的使用需要酶促力口工时,诸如使用聚合酶的延伸、使用连接酶的连接等等,普通技术人员会理解,当这样的类似物与酶促反应不相容时,那些情况中的寡核苷酸或多核苦酸不会在任何或有些位置含有核苷间联接、糖模块或碱基的某些类似物。多核苷酸的大小范围通常是自几个单体单位(例如5-40个,此时它们通常称为"寡核香酸")至数千+单体单位。每当多核苷酸或寡核苷酸以字母(大写的或小写的)序列代表时,诸如"ATGCCTG",应理解,核苷酸从左向右是5'—3'次序,而且"A"表示脱氧腺苷,"C"表示脱氧胞苷,"G"表示脱氧鸟苷,而"T"表示脱氧胸苷,'T,表示脱氧肌苷,"U"表示尿苷,除非另有说明或根据上下文显而易见。除非另有说明,术语学和原子编号规定将遵循Strachan和Read,HumanMolecularGenetics2,Wiley-Liss,NewYork,1999中所才皮露的。多核香酸通常包含通过磷酸二酯键联接相连的四种天然核苷(例如对于DNA是脱氧腺苦、脱氧胞苷、脱氧鸟苷、脱氧胸苷,或者对于RNA是它们的核糖对应物);然而,它们还可以包含非天然核芬酸类似物,例如包括经过》l"饰的石咸基、糖或核苷间联接。对本领域技术人员清楚的是,若酶的活性具有特定的寡核苦酸或多核苷酸底物要求,例如单链DNA、RNA/DNA双链体等等,则寡核苷酸尤其是凭借以下论文的指导,诸如Sambrook等,MolecularCloning,第2版,ColdSpringHarborLaboratory,NewYork,1989及类似参考文献。"引物"指在与多核苷酸模板形成双链体后能够充当核酸合成的起始点,并自其3,末端沿模板延伸,从而形成延伸的双链体的寡核苦酸,或是天然的或是合成的。延伸过程中添加的核苷酸的序列是由模板多核苷酸的序列决定的。引物通常由DNA聚合酶延伸。引物的长度范围通常是9-40个核苦酸,或者在有些实施方案中是14-36个核苷酸。"读出"(Readout)指可转变成数字或数值的测量和/或4企测的一项或多项参数。在有些情况中,读出可以指这样收集或记录的凄t据的实际数字表示。例如,来自微阵列的荧光强度信号的读出指在微阵列的每个杂交位点所产生的信号的位置和荧光强度;如此,这样的读出可以以多种方式登记或存储,例如微阵列的图像、数表等等。"固体支持物"、"支持物"和"固相支持物"可互换使用,指具有一个或多个刚性或半刚性表面的一种或一组物质。在许多实施方案中,固体支持物的至少一个表面是基本上平坦的,尽管在有些实施方案中可能希望它在物理上分隔不同化合物的合成区,例如以孔、凸起区、插针(pin)、蚀刻沟等等。依照其它实施方案,固体支持物采取珠、树脂、凝胶、微球体或其它几何外形的形式。微阵列通常包含至少一个平坦的固相支持物,诸如显微镜盖玻片。DNA"参比序列"或"参比群,,指通过参比DNA群与测试DNA群二者的互补链间异源双链体的形成与DNA或RNA测试群(或"测试DNA序列"或"测试DNA群")进行比较的个别DNA序列或DNA集合(或由其衍生的RNA)。若形成完美匹配的异源双链体,则参比群和测试群各自的成员是相同的;否则,它们互为变体。参比群成员的核苷酸序列通常是已知的,序列通常列于序列数据库中,诸如Genbank、Embl等等。一方面,DNA参比群可以包括来自已知细胞类型或组织来源的cDNA文库或基因组文库。例如,DNA参比群可以包括衍生自健康个体的组织的cDNA文库或基因组文库,而DNA测试群可以包括衍生自患病个体的同一组织的cDNA文库或基因组文库。DNA参比群还可以包括各个多核苷酸、cDNA、基因或其外显子(例如编码所有已知的p53变体或其子集的基因或外显子)、信号转导途径的基因等等的装酉己集A(assembledcollection)-"特异性的"或"特异性"就一种分子与另一种分子的结合而言,诸如经标记的靶序列对于探针,指两种分子间的识别、接触和稳定复合物的形成,加之该分子与其它分子显著更少的识别、接触或复合物形成。一方面,"特异性的"就第一分子与第二分子的结合而言指第一分子识别反应或样品中的另一分子和与之形成复合物的程度,它与第二分子形成最大量的复合物。优选的,所述最大量是至少50%。牵涉特异性结合事件的分子一^:在它们的表面上或在穴(cavity)中有引起彼此结合的分子间的特异性识别的区域。特异性结合的例子包括抗体-抗原相互作用、酶-底物相互作用、多核苷酸和/或寡核香酸间双链体或三链体的形成、受体-配体相互作用、诸如此类。在用于本文时,"接触,,就特异性或特异性结合而言指两分子足够接近使得弱非共价化学相互作用,诸如范德华力、氢键、碱基堆积相互作用、离子和疏水性相互作用、诸如此类,在分子的相互作用中占优势。在用于本文时,术语"Tm,,即"解链温度"(meltingtemperature)。解链温度指一群双链核酸分子中有一半解离成单链时的温度。本领域公知用于计算核酸Tm的数个方程。如标准参考文献所示,Tm值的筒单估算可通过如下方程来计算Tm=8l.5+0.41(%G+C),当核酸存在于lMNaCl水溶液中时(参见例长口Anderson牙口Young,QuantitativeFilterHybridization,于NucleicAcidHybridization(1985》。其它参考文献(例如Allawi,H.T.&SantaLucia,J.,Jr.,Biochemistry36:10581_94(l"")包括在计算Tm时考虑结构和环境以及序列特征的备选计算方法。"样品,,通常指来自生物学、环境、医学或患者来源的一定数量的物质,试图对其进行靶核酸的;f全测、测量或标记。一方面,它意图包括标本或培养物(例如微生物学培养物)。另一方面,它意图包括生物学样品和环境样品二者。样品可包括合成来源的标本。生物学样品可以是动物,包括人、流体、固体(例如大便)或组织,以及液体和固体食品和飼料产品及成分,诸如奶制品条目、蔬菜、肉类和肉类副产品、及水。生物学样品可包括取自患者的物质,包括但不限于培养物、血液、唾液、脑脊液、胸水、乳汁、淋巴、痰、精液、穿刺样品(needleaspirate)、诸如此类。生物学样品可以从实足的属于多个科的家畜以及野性的或野生的动物获得,包括但不限于诸如有蹄类、熊、鱼、啮齿类等动物。环境样品包括环境物质,诸如表面物质、土壤、水和工业样品、以及从食品和奶制品加工仪器、装置、设备、器具、一次性的和非一次性的条目获得的样品。这些例子不应解释为限制可应用于本发明的样品类型。上述教导意图例示本发明,而非以其细节限制本发明权利要求的范围。尽管描述了本发明的优选例示性实施方案,对本领域技术人员显而易见的是可以在其中进行各种变化和修改而不偏离本发明,而且所附权利要求意图覆盖落入本发明真正精神和范围内的所有此类变化和修改。权利要求1.聚合物分子的阵列,其包含-具有表面的支持物;及-附着于所述表面的众多聚合物分子,其中各个聚合物分子具有随机缠绕状态且包含多拷贝的一个或多个线性聚合单元的分支或线性结构,使得所述聚合物分子在基本上相当于所述随机缠绕在所述表面上的投影的区域内附着于所述表面并以使得至少30%的所述聚合物分子可独立检测的密度随机部署。2.权利要求l的聚合物分子阵列,其中所说的一个或多个线性聚合单元各自是单链多核苷酸,且其中所说的表面其上附着有反应性官能度或捕捉寡核苷酸,且其中所说的聚合物分子各自通过一个或多个反应性官能度与所说的聚合物分子的互补官能度反应而形成的一个或多个联接或者通过所述捕捉寡核苷酸与所述聚合物分子的互补序列之间形成的一个或多个复合物而附着于所说的表面。3.权利要求2的阵列,其中所说的表面是具有离散分隔区阵列的平坦表面,其中各个离散分隔区的大小基本上相当于所说的聚合物分子的所说的随机缠绕的所说的投影且其上附着有所说的反应性官能度或所说的捕捉寡核苷酸。4.权利要求3的阵列,其中各个所说的离散分隔区的面积小于l^im2。5.权利要求4的阵列,其中所说的离散分隔区形成最近相邻距离在0.1-20^im范围内的规则阵列且其中大多数所说的离散分隔区包含不超过一个所说的聚合物分子。6.权利要求5的阵列,其中所说的聚合物分子随机分布在所说的离散分隔区上且其中所说的最近相邻距离在0.3-3pm范围内。7.权利要求6的阵列,其中各个所说的聚合物分子是包含多拷贝的靶序列与衔接头寡核苷酸的串联物的多核苷酸分子。8.权利要求4的阵列,其中所说的离散分隔区是所说的支持物中的孔,所述孔各自具有面积等于或小于所说的离散分隔区的面积的开口。9.多核苷酸分子的阵列,其包含-具有表面的支持物;及-附着于所述表面的众多多核苷酸分子,其中各个多核苷酸分子具有随机缠绕状态且包含多拷贝的靶序列的串联物,使得所述多核苷酸分子在基本上相当于所述随机缠绕在所述表面上的投影的区域内附着于所述表面并以使得至少30%的所述多核苷酸分子的最近相邻距离为至少50nm的密度随机部署。10.权利要求9的阵列,其中所说的表面其上附着有反应性官能度,且其中所说的多核苷酸分子各自通过一个或多个反应性官能度与所说的多核苷酸分子的互补官能度反应而形成的一个或多个联接而附着于所说的表面。11.权利要求10的阵列,其中所说的表面是具有离散分隔区阵列的平坦表面,其中各个离散分隔区的大小基本上相当于所说的多核苦酸分子的所说的随机缠绕的所说的投影且其上附着有所说的反应性官能度,且其中这样的区域附着有至多一个所说的多核香酸。12.权利要求ll的阵列,其中所说的反应性官能度是疏水性官能度。13.权利要求ll的阵列,其中所说的离散分隔区的面积小于lpm2。14.权利要求13的阵列,其中所说的离散分隔区是所说的支持物中的孔,所述孔各自具有面积等于或小于所说的离散分隔区的面积的开口。15.权利要求13的阵列,其中所说的多核苦酸随机分布在所说的离散分隔区上且其中所说的最近相邻距离在0.3-3,范围内。16.权利要求15的阵列,其中基本上每个所说的离散分隔区附着有一个多核苷酸。17.权利要求15的阵列,其中所说的串联物包含交替拷贝的所说的耙序列和所说的衔接头寡核苦酸。.18.权利要求17的阵列,其中各个所说的串联物包含至少10个拷贝的其各自的耙序列。19.权利要求17的阵列,其中所说的靶序列各自的长度在50-500个核苷酸范围内且其中所说的衔接头寡核苷酸的长度在6-60个核苷酸范围内。20.权利要求15的阵列,其中所有所说的反应性官能度是相同的。21.权利要求15的阵列,其中各个所说的串联物包含至少一种解码寡核普酸用于鉴定其各自的靶序列。22.权利要求15的阵列,其中所说的离散分隔区以直线模式部署在所说的平坦表面上,其中各个离散分隔区具有以直径0.1-10(om的圆圈所围绕的面积。23.权利要求ll的阵列,其中所说的离散分隔区形成最近相邻距离在0.1-20^m范围内的规则阵列。24.权利要求23的阵列,其中各个所说的离散分隔区被基本上没有所说的多核苷酸的区域间空间所围绕。25.权利要求10的阵列,其中所说的多核苷酸随机部署在所说的平坦表面上,使得至少大多数所说的多核苷酸在光学上可分辨。26.权利要求25的阵列,其中至少70。/。的所说的多核苷酸是光学上可分辨的。27.单分子的阵列,其包含-具有表面的支持物,所述表面具有离散分隔区的规则阵列,其中各个离散分隔区的面积小于1(11112且其上附着有反应性官能度;及-附着于所述表面的众多单分子,其中各个单分子包含大分子结构和至少一个具有附着模块的分析物,使得各个大分子结构包含一个独特官能度和能够与所述离散分隔区的所述反应性官能度形成联接的众多附着官能度且使得所述分析物通过所述独特官能度与所述分析物的所述附着模块之间的联接附着于所述大分子结构;-其中所述众多单分子随机部署在所述离散分隔区上,使得至少大多数所述离散分隔区只包含一个单分子。28.权利要求27的阵列,其中所说的大分子结构是分支的或线性的聚合物。29.权利要求28的阵列,其中所说的离散分隔区是所说的支持物中的孑L,所述孔各自具有面积等于或小于所说的离散分隔区的面积的开口。30.权利要求28的阵列,其中所说的离散分隔区各自的最近相邻距离在31.权利要求30的阵列,其中所说的最近相邻距离在0.3-3pm范围内。32.权利要求31的阵列,其中基本上每个所说的离散分隔区附着有一个单分子。33.权利要求31的阵列,其中所说的大分子结构是线性的多核香酸。34.权利要求31的阵列,其中所说的离散分隔区以直线模式部署在所说的平坦表面上,其中各个离散分隔区具有以直径0.1-10(im的圆圏所围绕的面积。35.权利要求31的阵列,其中所说的分析物是多核苷酸或蛋白质。36.权利要求31的阵列,其中各个所说的离散分隔区被基本上没有所说的大分子结构的区域间空间所围绕。37.权利要求31的阵列,其中所说的独特官能度是第一寡核香酸且其中所说的附着模块是具有与第一寡核苷酸互补的序列的第二寡核苷酸。38.权利要求37的阵列,其中所说的分析物是多核苷酸。39.多核苷酸分子的阵列,其包含-具有表面的支持物,所述表面其上附着有捕捉寡核香酸;及-附着于所述表面的众多多核苷酸分子,其中各个多核苷酸分子包含多拷贝的靶序列与衔接头寡核苦酸的串联物,使得所述多核苷酸分子通过所述捕捉寡核苷酸与所述衔接头寡核苷酸之间形成的一个或多个复合物而附着于所述表面,所述多核苷酸分子以使得至少大多数多核苦酸分子的最近相邻距离为至少50nm的密度随机部署在所述表面上。40.权利要求39的阵列,其中所说的表面是具有离散分隔区阵列的平坦表面,其中各个离散分隔区的面积小于1|^1112且其上附着有捕捉寡核香酸,且其中基本上所有这样的区域附着有至多一个所说的多核苷酸分子。41.权利要求40的阵列,其中所说的离散分隔区是所说的支持物中的孔,所述孔各自具有面积等于或小于所说的离散分隔区的面积的开口。42.权利要求40的阵列,其中所说的离散分隔区形成最近相邻距离在0.l-20pm范围内的规则阵列。43.权利要求42的阵列,其中所说的离散分隔区上的所说的多核香酸分子的最近相邻距离使得这些多核苷酸分子在光学上可分辨。44.权利要求42的阵列,其中各个所说的离散分隔区被基本上没有所说的多核苦酸分子的区域间空间所围绕。45.权利要求42的阵列,其中所说的多核苷酸分子随机分布在所说的离散分隔区上且其中所说的最近相邻距离在0.3-3pm范围内。46.权利要求45的阵列,其中基本上每个所说的离散分隔区附着有一个多核芬酸分子。47.权利要求45的阵列,其中所说的串联物包含交替拷贝的所说的把序列和所说的衔接头寡核苷酸。48.权利要求47的阵列,其中各个所说的串联物包含至少10个拷贝的其各自的把序列。49.权利要求47的阵列,其中所说的靶序列各自的长度在50-500个核苷酸范围内且其中所说的衔接头寡核苷酸的长度在6-60个核苦酸范围内。50.权利要求45的阵列,其中所有所说的捕捉寡核苷酸具有相同的核苷酸序列。51.权利要求45的阵列,其中各个所说的串联物包含至少一种解码寡核苦酸用于鉴定其各自的靶序列。52.权利要求45的阵列,其中所说的离散分隔区以直线模式部署在所说的平坦表面上,其中各个离散分隔区具有以直径O.l-l(Hmi的圓圈所围绕的面积。53.权利要求45的阵列,其中所说的捕捉寡核苦酸与所说的衔接头寡核香酸之间的所说的一个或多个复合物是双链体。54.权利要求40的阵列,其中所说的离散分隔区形成众多规则亚阵列,使得同一亚阵列内的所说的离散分隔区具有核苷酸序列相同的捕捉寡核香酸且不同亚阵列内的所说的离散分隔区具有核苦酸序列不同的捕捉寡核苷酸,且其中在所述众多亚阵列的任一个内各个所说的离散分隔区的最近相邻距离在l-2(Him范围内。55.权利要求54的阵列,其中所说的规则亚阵列各自是直线阵列且其中对于每一个而言所说的离散分隔区之间的所说的最近相邻距离是相同的。56.权利要求39的阵列,其中所说的多核苷酸分子随^L部署在所说的平坦表面上,使得至少大多数所说的多核苷酸分子在光学上可分辨。57.权利要求56的阵列,其中至少70。/。的所说的多核苷酸分子是光学上可分辨的。58.制备多核苷酸分子阵列的方法,所述方法包括以下步骤-产生众多多核苷酸分子,各自包含来自来源DNA的DNA片段与衔接头寡核苷酸的串联物;-将所述众多多核香酸分子部署至具有表面的支持物上,所述表面其上附着有捕捉寡核苷酸,使得所述多核苷酸分子通过所述捕捉寡核苷酸与所述衔接头寡核苷酸之间形成的一个或多个复合物而固定于所述表面且使得所述多核苷酸分子以使得大多数所述多核苷酸分子的最近相邻距离为至少50nm的密度随机分布在所述表面上,^v而形成多核苷酸分子的阵列。59.权利要求58的方法,其中所说的表面是具有离散分隔区阵列的平坦表面,其中各个离散分隔区的面积小于1,2且其上附着有所说的捕捉寡核苷酸,且其中基本上所有这样的区域附着有至多一个所说的多核苦酸分子。60.权利要求59的方法,进一步包括在将所说的多核苷酸分子部署至所说的支持物上后扩增它们的步骤。61.权利要求60的方法,其中所说的扩增步骤包括切割所说的串联物以形成第二片段,环化所述第二片段,并在各个所说的串联物的所说的离散分隔区内通过RCRA应扩增所述第二片段。62.权利要求61的阵列,其中所说的离散分隔区是所说的支持物中的孔,所述孔各自具有面积等于或小于所说的离散分隔区的面积的开口。63.权利要求59的方法,其中所说的离散分隔区形成最近相邻距离在0.l-20pm范围内的规则阵列。64.权利要求63的方法,其中所说的多核苷酸分子随机分布在所说的离散分隔区上且其中所说的最近相邻距离在0.3-3pm范围内。65.权利要求64的方法,其中所说的产生步骤进一步包括以下步骤断裂所说的来源DNA以产生所说的DNA片段,环化所说的DNA片段,并通过滚环复制形成所说的DNA片段的串联物。66.权利要求65的方法,其中所说的离散分隔区上的所说的多核苦酸分子的最近相邻距离使得这些多核苷酸分子在光学上可分辨。67.制备多核苷酸分子阵列的方法,所述方法包括以下步骤-产生众多多核苷酸分子,各自包含来自来源核酸的DNA片段的串联物;-将所述众多多核苷酸分子部署至具有表面的支持物上,所迷表面其上附着有反应性官能度,使得所述多核苷酸分子通过所述反应性官能度与所述多核苷酸分子上的互补官能度之间形成的一个或多个联接而固定于所述表面且使得所述多核苷酸分子以使得至少大多数多核香酸分子的最近相邻距离为至少50nm的密度随机部署在所述表面上,从而形成多核苷酸分子的阵列。68.权利要求67的方法,其中所说的表面是具有离散分隔区阵列的平坦表面,其中各个离散分隔区的面积小于1^2且其上附着有所说的反应性官能度,且其中基本上所有这样的区域附着有至多一个所说的多核苷酸分子。69.权利要求68的方法,其中所说的产生步骤进一步包括以下步骤断裂所说的来源DNA以产生所说的DNA片段,环化所说的DNA片段,并通过滚环复制形成所说的DNA片段的串联物。70.测定靶多核苷酸的核苷酸序列的方法,所述方法包括如下步骤(a)产生众多来自靶多核苷酸的靶串联物,各个靶串联物包含多拷贝的靶多核苷酸片段且所述众多靶串联物包含基本上覆盖所述靶多核苷酸的许多片段;(b)形成所述靶串联物的随机阵列,其以使得至少大多数所述靶串联物在光学上可分辨的密度固定于表面;(c)使来自第一套探针的一种或多种探针与所述随机阵列在允许所述一种或多种探针与靶串联物上互补序列之间形成完美匹配双链体的条件下进行杂交;(d)使来自第二套探针的一种或多种探针与所述随机阵列在允许所述一种或多种探针与靶串联物上互补序列之间形成完美匹配双链体的条件下进行杂交;(e)连接与靶串联物在毗邻位点处发生杂交的来自第一套和第二套的探针;(f)鉴定所连接的第一和第二探针的序列;并(g)重复步骤(c)至(f)直至靶多核苷酸的序列可以由所连接4罙针序列的身4分而确定。71.权利要求70的方法,其中所说的表面是具有离散分隔区阵列的平坦表面,其中各个离散分隔区的面积小于1,2且其中基本上所有这样的区域附着有至多一个所说的靶串联物。72.测定靶多核苷酸的核苷酸序列的方法,所述方法包括以下步骤(a)提供靶串联物的随机阵列,其固定于具有光学上可分辨的离散分隔区阵列的平坦表面,其中各个离散分隔区的面积小于1^11112且其中基本上所有这样的区域附着有至多一个所说的靶串联物,各个靶串联物包含多拷贝的靶多核*酸片段且存在许多不同的靶串联物使得它们各自的片段基本上覆盖所述靶多核苦酸;(b)使来自第一套探针的一种或多种探针与所述随机阵列在允许所述一种或多种探针与靶串联物上互补序列之间形成完美匹配双链体的条件下进行杂交;(c)使来自第二套探针的一种或多种探针与所述随机阵列在允许所述一下进行杂交;(d)连接与靶串联物在毗邻位点处发生杂交的来自第一套和第二套的探针;(e)鉴定所连接的第一和第二探针的序列;并(f)重复步骤(b)至(e)直至所述靶多核苷酸的序列可以由所连接探针序列的身份而确定。73.测定靶多核香酸的核普酸序列的方法,所述方法包括以下步骤(a)产生众多来自靶多核苷酸的靶串联物,各个靶串联物包含多拷贝的靶多核苷酸片段且所述众多靶串联物包含基本上覆盖所述靶多核苷酸的许多片段;(b)形成靶串联物的随机阵列,其以使得至少大多数靶串联物在光学上可分辨的密度固定于表面;(c)鉴定各个靶串联物中各个片段的至少一部分的序列;并(d)由所述串联物所述片段所述部分的序列的身份重建所述靶多核苷酸的核苷酸序列。74.用于制备来自来源核酸的DNA片段串联物随机阵列的试剂盒,所述试剂盒包含-具有表面的支持物;-至少一种衔接头寡核芬酸,用于与各个DNA片段连接并与之形成DNA环,各个DNA环能够通过滚环复制反应进行复制以形成能够随机部署在所述表面上的串联物。75.权利要求74的试剂盒,其中所说的表面是具有离散分隔区阵列的平坦平面,其中各个离散分隔区的大小相当于所说的串联物的大小。76.权利要求75的试剂盒,其中所说的离散分隔区形成最近相邻距离在,0.l-20pm范围内的规则阵列。77.权利要求76的试剂盒,其中所说的离散分隔区上的所说的串联物的最近相邻距离使得这些串联物在光学上可分辨。78.权利要求76的试剂盒,其中所说的离散分隔区附着有捕捉寡核苷酸且其中所说的衔接头寡核香酸各自具有与所述捕捉寡核苷酸互补的区域,使得所说的串联物能够通过所述捕捉寡核苷酸与所说的衔接头寡核苷酸互补区之间形成复合物而附着于所说的离散分隔区。79.权利要求78的试剂盒,其中所说的串联物随机分布在所说的离散分隔区上且其中所说的最近相邻距离在0.3-3,范围内。80.权利要求79的试剂盒,进一步包含(a)末端转移酶,用于将同聚物尾附着至所说的DNA片段以提供供所说的衔接头寡核苦酸的第一末端结合的位点,(b)连接酶,用于将所说的衔接头寡核苷酸的一条链连接至所说的DNA片段的末端以形成所说的DNA环,(c)引物,用于与所说的衔接头寡核苷酸所述链的一个区域退火,及(d)DNA聚合酶,用于在滚环复制反应中使与所述链退火的?1物延伸。81.权利要求80的试剂盒,其中所说的衔接头寡核苷酸具有简并碱基数目在4-12个范围内的第二末端。82.用于靶多核苷酸测序的试剂盒,所述试剂盒包含-具有平坦表面的支持物,所述表面具有光学上可分辨的离散分隔区阵歹寸,其中各个离散分隔区的面积小于l^m25-第一套探针,用于与随机部署在所述离散分隔区上的众多串联物进行杂交,所述串联物各自包含多拷贝的靶多核苷酸的DNA片段;-第二套探针,用于与众多串联物进行杂交,使得只要来自第一套的探针和来自第二套的探针与所述串联物发生毗邻的杂交,所说的探针就被连接。83.权利要求82的试剂盒,进一步包含连接酶、连接酶緩冲液和杂交緩冲液。84.权利要求83的试剂盒,其中所说的离散分隔区附着有捕捉寡核苷酸且其中所说的串联物各自具有与所述捕捉寡核苷酸互补的区域,使得所说的串联物能够通过所述捕捉寡核苷酸与所说的串联物互补区之间形成复合物而附着于所说的离散分隔区。85.用于构建单分子阵列的试剂盒,所述试剂盒包含-具有表面的支持物,所述表面具有反应性官能度;及-各自具有一个独特官能度和多个互补官能度的众多大分子结构,所述大分子结构能够随机附着在所述表面上,其中所说的附着是通过一个或多个反应性官能度与一个或多个互补官能度反应形成的一个或多个联接而形成的;且其中所述独特官能度能够选择性的与分析物分子上的官能度反应而形成单分子阵列。86.权利要求85的试剂盒,其中所说的表面是具有离散分隔区阵列的平坦表面且其中各个离散分隔区的面积小于l(im2,所述离散分隔区阵列包含所说的反应性官能度。87.权利要求86的试剂盒,其中所说的离散分隔区形成最近相邻距离在0.1-20iim范围内的规则阵列。88.权利要求87的试剂盒,其中所说的离散分隔区上的所说的串联物的最近相邻距离使得这些串^:物在光学上可分辨。89.权利要求88的试剂盒,其中所说的大分子结构是一个或多个DNA片段的串联物且其中所说的独特官能度位于所述串联物的3,末端或5,末端。全文摘要本发明提供了单分子随机阵列,用于执行大规模分析,特别是生物分子诸如基因组DNA、cDNA、蛋白质等等的大规模分析。一方面,本发明的阵列包含随机部署在离散分隔区规则阵列上的DNA片段串联物,使得基本上所有这样的区域包含不超过单个串联物。优选的是,所述区域的面积基本上小于1μm<sup>2</sup>且最近相邻距离容许每cm<sup>2</sup>有10<sup>9</sup>个单分子数量级的光学分辨率。许多分析化学可应用于本发明的随机阵列,包括通过杂交化学的测序、通过合成化学的测序、SNP检测化学等等,用于大大扩充此类技术的规模和潜在应用。文档编号C12Q1/68GK101466847SQ200680029826公开日2009年6月24日申请日期2006年6月13日优先权日2005年6月15日发明者乔治·杨,布赖恩·K·豪泽,拉多杰·德马纳克,斯尼扎纳·德马纳克,马修·J·卡洛申请人:考利达基因组股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1