测定核苷酸序列信息的方法

文档序号:426853阅读:1010来源:国知局
专利名称:测定核苷酸序列信息的方法
技术领域
本发明一般性地涉及检测方法,更具体地,涉及检测生物分子和对生物分子测序的方法。
背景技术
遗传信息以组织成染色体的非常长的脱氧核糖核酸(DNA)分子的形式储存。这些染色体包括形成人类基因组的大约30亿个核苷酸。染色体中的核苷酸序列在决定每一个体的特征中发挥巨大作用。许多常见的疾病都至少部分地基于个体之间的人基因组核苷酸序列中的变异。
人类基因组整个序列的测定已经为鉴定这些疾病的遗传依据提供了基础。然而,为了鉴定与每一种疾病相联系的遗传变异,仍有大量的实验工作需要去做。为了鉴定在DNA序列中促发疾病的特定变化,该实验要求对表现有每一种这样的疾病的个体或家族的染色体部分进行DNA测序。核糖核酸(RNA)是加工遗传信息时所需要的中间分子,它也能被测序以确定各种疾病的遗传基础。
目前的测序方法要求制得感兴趣的模板核酸的许多拷贝,把它们切为相互重叠的片段,并测序,之后再把相互重叠的DNA序列组合为完整的基因。这个过程费力、昂贵、低效而且耗时。它也通常需要使用荧光或放射性标记,这潜在地引起安全和废物处理问题。因此,需要改进的核酸测序方法,所述方法比现有方法成本更低,效率更高,更为安全。
要了解导致各种疾病的核苷酸序列变异需要检测这些变异的技术。特别地,检测核苷酸序列中的微妙变化的技术已经变得更为重要,这部分地由于在鉴定多态性,特别是单核苷酸多态性(SNPS)中取得的最新科学进展。而且,为了将遗传发现转化成精确的具有成本效率的遗传测试,检测核苷酸序列中的微妙变化的方法也已经变得更为重要。因此,需要灵敏而简单的用于基因型定型(genotyping)的检测方法,该方法能够区分具有微妙差异的目标分子。
现有的检测核苷酸变异的方法,需要不同的探针用于区别目标基因的各个等位基因;或在分析期间将探针用生物化学的方法修饰。这些方法费时且成本昂贵。因此,需要用于实施基因型分析的简单、灵敏且低成本的方法。


图1图示说明了本发明的方法。
图2说明了示范性的拉曼活性寡核苷酸探针的结构。
图3说明了示范性的生物芯片设计和使用生物芯片的示范性序列测定方法。
图4A-4D提供了一系列的拉曼光谱和相应的一系列寡核苷酸探针的寡核苷酸结构,这些寡核苷酸探针携带有带正电的增强子或不携带增强子。该图示出了由胺基团增强子导致的拉曼发射强度的增强。
图5A和5B说明了探针-目标复合物的同步荧光扫描光谱的例子。图5A图示说明了包含FRET对560、570的标记寡核苷酸探针510的核苷酸序列和探针位置,并说明了标记寡核苷酸探针510与各目标核酸520、530、540、550的比对。图5B显示了图5A中的各杂交对产生的荧光光谱。
图6说明了MEMS装置,其通过使用AC场进行探针-目标复合物检测。
发明详述 本公开的方法部分地基于发现了将通过杂交的测序与拉曼光谱术结合起来的优点。拉曼光谱术的优点在于,大量的拉曼活性信号分子是已知的(参见例如“Standard Raman Spectra”(Sadtler Research Laboratories);“TRC spectral data.Ramnan”(Thermodynamics Research Center)),并且可以被用于对杂交测序探针进行标记。因为可以制备出大量的拉曼活性信号分子,所以基于各个分子的信号特征进行测序便成为可能。此外,本公开的方法部分地基于发明了新颖的拉曼增强子(enhancer),该拉曼增强子使得检测在其他情况下拉曼光谱术无法检测的或产生强度非常低的拉曼发射的寡核苷酸成为可能。
本发明提供的核酸测序方法以及鉴定目标核酸位置上的核苷酸发生(nucleotide occurrence)的方法,可以比传统测序方法更快速地实施,这是因为它们包括了比传统方法更少的若干反应步骤,以及因为它们可以以高度平行的方式在微米或纳米级水平进行。因此,可以在相对短的时间里,获得相对大量的序列信息。此外,本文中公开的方法成本低,因为它们免去了昂贵的试剂,而这些昂贵的试剂用于使用传统方法进行的目标分子扩增和化学标记。
因此,在一个实施方案中,提供了核酸测序方法,该方法基于在利用杂交反应进行的测序中检测寡核苷酸探针的拉曼信号。用拉曼标记进行标记的各个被捕获的核酸探针的拉曼信号被检测。被捕获的探针的序列被用来鉴定被捕获的探针和互补目标核酸的核苷酸序列,它们然后进行比对(align),并用来获得核酸序列信息。该方法可以被用于例如大规模的基因组测序、检测单核苷酸多态性(SNPs)中的核苷酸发生、序列比较、基因型定型、疾病关联(disease correlation)和药物开发。
在另一实施方案中,提供了测定目标核酸的核苷酸序列的方法,其包括将核酸或其片段与结合到基质一系列点位置上的一群捕获寡核苷酸探针接触,以形成包含单链伸出端(overhangs)的探针-目标双链体多核苷酸;将探针-目标双链体核酸与一群拉曼活性寡核苷酸探针接触,以允许拉曼活性寡核苷酸探针结合到单链伸出端,其中每一拉曼活性寡核苷酸探针产生不同的拉曼信号,并使用拉曼光谱术检测结合模板核酸的拉曼活性寡核苷酸探针;从而确定所述目标核酸的核苷酸序列。而且,每一被捕获的拉曼活性寡核苷酸探针的点位置可以被鉴定,并用于确定目标核酸的核苷酸序列。
本发明的这些实施方案的方法在本文中有时称为杂交测序方法(sequencingby hybridization methods)。如图1所示,通常有两类探针被用于本实施方案的方法,用于探查目标核酸分子或其片段10,这两类探针是a)固定在基质20诸如生物芯片上的探针(即捕获寡核苷酸探针20);和b)拉曼活性寡核苷酸探针40。如在本文中更详细描述的,捕获探针20是具有已知的核苷酸序列的核酸分子。这些探针用标准的化学方法合成,并且不要求进行标记。它们通常以它们的5′端或3′端,固定在固体表面30上。标准的化学交联技术可以被用于探针固定,诸如硫醇-金连接(thiol-gold linkage)或胺-醛连接(amine-aldehyde linkage),参见在本文中更详细的描述。
拉曼活性寡核苷酸探针40包括具有已知的核苷酸序列的合成的核酸,并且可选地,包括一个或多个拉曼标记45或一个或多个带正电荷的增强子。如本文中更加详细描述的,拉曼标记45是具有可检测的和独特的拉曼信号特征的化学化合物。它们可以共价地被连接到核酸序列。增强子是刺激寡核苷酸的拉曼活性的化合物或化合物的一部分。
当拉曼活性寡核苷酸探针40通过目标序列依赖型反应捕获在表面30上时,通过检测相应的拉曼标记的存在来确定拉曼活性寡核苷酸探针的互补序列的存在(图2)。捕获步骤是一个固定过程,其可以通过序列特异性杂交或连接完成。如果目标序列的互补并没有在目标核酸上发生,那么该目标核酸以及拉曼活性寡核苷酸探针便不被固定住。
如上所述,本文中提供了一群拉曼活性寡核苷酸探针。每一拉曼活性寡核苷酸探针能够产生可检测的拉曼信号。这群拉曼活性寡核苷酸探针中至少一些寡核苷酸探针的拉曼信号可以固有地产生。当可检测的拉曼信号从没有共价连接有标记或带正电荷的增强子的寡核苷酸检测到时,寡核苷酸便是“固有地产生”拉曼信号。寡核苷酸是否固有地产生拉曼信号,将取决于用于检测信号的拉曼检测仪的灵敏性。如在本文实施例中描述,包括嘌呤残基,特别是腺苷残基和腺苷衍生物,诸如8-氮杂-腺嘌呤或二甲基-烯丙基-氨基-腺嘌呤的寡核苷酸更可能固有地产生可检测的拉曼信号。
在一些方面,不固有地产生拉曼信号或产生微弱的拉曼信号的寡核苷酸,被共价地结合到带正电荷的增强子。因此,本文公开的是寡核苷酸群,它们中的至少一些被共价地连接到带正电荷的增强子。如在本文实施例中说明的,例如,具有高百分比的嘧啶核苷酸的寡核苷酸可能具有微弱的或检测不到的固有拉曼活性。这些寡核苷酸可以共价地连接到带正电荷的基团上,以产生可检测的拉曼信号,或增强由寡核苷酸产生的固有信号,如本文实施例所示。不受理论限制,认为,带正电荷的基团增加了寡核苷酸与SERS表面之间的缔合和定向。可选择地,富含嘧啶的寡核苷酸可以完全或部分地杂交到富含腺苷的寡核苷酸上,以获得增强的拉曼信号。
例如,含有少于5、4、3、2或1个嘌呤残基的寡核苷酸可以共价地结合到带正电荷的增强子或与富含嘌呤或腺苷的寡核苷酸杂交。在其他实施例中,含有少于5、4、3、2或1个腺苷残基的寡核苷酸被共价地结合到本发明带正电荷的增强子,或与富含嘌呤或腺苷的寡核苷酸杂交。
因此,在另一实施方案中,提供了检测核酸的方法,其包括用光照射核酸,其中所述核酸包括带正电荷的增强子;和检测由被照射的核酸产生的拉曼信号。在某些方面,带正电荷的增强子是胺基团。在某些方面,在不存在带正电荷的增强子时,核酸不产生可检测到的信号。在某些方面,核酸由少于5、4、3、2或1个的嘌呤残基组成,和/或少于10%、5%或1%的嘌呤残基组成。在某些方面,核酸不含有嘌呤残基。
本发明带正电荷的增强子包括任何带正电荷的基团,其可以被连接到寡核苷酸上,而不会阻碍寡核苷酸与互补序列的结合。一般地,含有杂原子(即N、O、S、P)的任何基团可以携带正电荷。例如,携带正电荷的胺变成铵基团,羟基(-OH)变成水合氢离子,硫醇(-SH)变成SH2+。将这些带正电荷的增强子部分连接到寡核苷酸上的方法容易获得。在一个非限制性实施例中,增强子可以是携带有1、2、3、4、5、6、7、8、9、10、15、20或25个碳原子的烷基或芳基链的伯胺。带正电荷的基团可以连接到含有修饰的碱基或间隔物(spacer)的寡核苷酸上的任何活性基团。将间隔物引入到携带有活性氨基基团的寡核苷酸是商业上可获得的(即,Qiagen-Operon)。修饰的碱基可以是含胺碱基,诸如8-氮杂-腺嘌呤、玉米素、激动素、N6-苯甲酰腺嘌呤、4 pyridine carboxal doxime、二甲基-烯丙基-氨基-腺嘌呤;修饰的碱基也可以是含硫醇的碱基,诸如4-氨基-6-巯基吡唑并[3,4-d]嘧啶、2巯基-苯并咪唑、8-巯基腺嘌呤、6-巯基嘌呤。通过活性胺基团或硫醇基团进行化学连接,所有这些碱基都可以进一步进行修饰,以拥有阳性基团。所有化合物都可以从化学商家(Sigma-Aldrich,St.Louis,MO)获得。将活性基团转化为阳性基团的化学方法是本领域已知的。而且,如在本文实施例中说明的,带正电荷的增强子可以连接在寡核苷酸内或寡核苷酸的5′或3′端。将被理解的是,带正电荷的基团可以用任何合适的方法连接。
带正电荷的基团可以带单个正电荷或带多个正电荷。在某些方面,带正电荷的基因是氨基(或铵)基团,例如季铵标记物(参见例如美国专利6,268,129)。适当地,通过5′-NH2连接或通过将含有脂族NH2基团的碱基连接到寡核苷酸的3′端,氨基(或铵)基团被加入到合成的寡核苷酸中,其中例如使用末端转移酶或在Sanger链终止程序(Sanger chain termination protocol)中直接使用具有脂族NH2基团的终止碱基,通过所述NH2基团,带正电荷的基团可以被加入。然后将带正电荷的基因(其优选是含季铵的化合物)连接到核酸中的脂族-NH2基团上。为了方便,含季铵的化合物包括与脂族-NH2基团反应的羟基琥珀酰亚胺酯。该化合物可以是例如三甲基铵己酰-N-羟基琥珀酰亚胺酯(C5-NHS)。
在某些方面,所述拉曼活性寡核苷酸探针群中的每一个都包括拉曼标记。各种拉曼标记是本领域已知的,并可以用于本发明,只要它们能被连接到寡核苷酸,并且它们不抑制寡核苷酸与互补序列杂交。
可被连接到本文中公开的寡核苷酸探针的拉曼标记——在本文中也称为拉曼信号分子——的非限制性例子包括TRIT(四甲基罗丹明异硫醇)、NBD(7-硝基苯-2-氧杂-1,3-二唑)、德克萨斯红染料、邻苯二甲酸、对苯二甲酸、间苯二甲酸、甲酚固紫、甲酚蓝紫、亮甲酚蓝、对氨基苯甲酸、藻红、生物素、地高辛、5-羧基-4′,5′-二氯-2′,7′-二甲氧基荧光素、TET(6-羧基-2′,4,7,7′-四氯荧光素)、HEX(6-羧基-2′,4,4′,5′,7,7′-六氯荧光素)、Joe(6-羧基-4′,5′-二氯-2′,7′-二甲氧基荧光素)5-羧基-2′,4′,5′,7′-四氯荧光素、5-羧基荧光素、5-羧基罗丹明、Tamra(四甲基罗丹明)、6-羧基罗丹明、Rox(羧基-X-罗丹明)、R6G(罗丹明6G)、酞菁、偶氮甲碱(azomethine)、花菁(例如Cy3、Cy3.5、Cy5)、黄嘌呤、琥珀酰荧光素、N,N-二乙基-4-(5’-偶氮苯并三唑)-苯胺以及氨基吖啶。此外,拉曼活性标记包括那些已被鉴定用于基因探针的标记(参见Graham等,Chem.Phys.Chem.,2001;Isola等,Anal.Chem.,1998)。在一个方面,拉曼活性标记包括那些在Kneipp等,Chem.Reviews 99,2957(1999)中公开的标记。这些和其他拉曼标记可以从商业来源获得(例如,Molecular Probes,Eugene,OR)。
在某些方面,拉曼活性标记包括复合有机-无机纳米颗粒(参见美国专利申请号__,于2003年12月29日提交,名称为“Composite Organic-InorganicNanoparticles”(本文中称为COIN纳米颗粒或″COINs″))。在这些方面,捕获寡核苷酸探针和拉曼活性寡核苷酸探针的其中之一或两者与COIN纳米颗粒缔合,并使用SERS检测。
COINs是包括核心和表面的拉曼活性探针构建物,其中核心包括包含第一种金属和拉曼活性有机化合物的金属胶体。COIN还可以包括不同于第一种金属的第二种金属,其中第二种金属形成覆盖纳米颗粒表面的层。COINs还可以包括覆盖该金属层的有机层,该有机层包括探针。对于该实施方案,用于连接到SERS活性纳米颗粒表面的合适的探针包括但是不限于,抗体、抗原、多核苷酸、寡核苷酸、受体、配体和类似物。然而,对于这些实施方案,COIN典型地被连接到寡核苷酸探针上。
用于获得合适的SERS信号的金属在COIN中是固有的,且各种拉曼活性有机化合物可以被掺入到该颗粒中。事实上,通过利用含有具有不同结构、混合物和比例的拉曼活性有机化合物的纳米颗粒,可以产生大量独特的拉曼信号特征。因此,本文中描述的利用COINs的方法可以用于同时测定一个以上的,通常多于10个目标核酸的核苷酸序列信息。此外,因为许多COINs可以被掺入到单个COIN珠纳米颗粒,单个COIN颗粒的SERS信号比获自不含有在此描述的纳米颗粒的拉曼活性物质的SERS信号强。相比起不利用COINs的拉曼技术,这里的情况导致了增加的灵敏性。
使用标准的金属胶体化学方法,容易制备用于本发明方法的COINs。COINs的制备也利用了金属吸附有机化合物的能力。事实上,因为拉曼活性有机化合物在金属胶体形成期间被吸附到金属上,许多拉曼活性有机化合物可以被掺入到COIN,无需特殊的连接化学方法。
一般地,用于本发明方法的COINs按如下方法制备。制备含有下述物质的含水溶液合适的金属阳离子、还原试剂和至少一种合适的拉曼活性有机化合物。然后将溶液的组分置于将金属阳离子还原形成中性胶体金属颗粒的条件中。因为金属胶体的形成在合适的拉曼活性有机化合物存在下发生,在胶体形成期间拉曼活性有机化合物容易被吸附到金属上。该简单类型的COIN被称为类型I COIN。类型I COIN通常可以用膜过滤分离。此外,具有不同尺寸的COIN可以通过离心富集。
在可选择的实施方案中,COINs可以包括不同于第一种金属的第二种金属,其中所述第二金属形成覆盖于纳米颗粒表面的层。为了制备该类型的SERS活性纳米颗粒,将类型I COINs置于含有合适的第二金属阳离子和还原剂的含水溶液中。然后将该溶液的组分置于还原第二金属阳离子的条件中,以形成覆盖于纳米颗粒表面的金属层。在某些实施方案中,第二金属层包括金属,诸如银、金、铂、铝和类似物。该类型的COIN称为类型II COINs。类型II COINs可以用与类型I COINs相同的方式分离和/或富集。典型地,类型I和类型II COINs基本上是球形的,尺寸在约20nm至60nm范围内。相对于在检测期间被用于照射COINs的光的波长,所选择的纳米颗粒尺寸将非常小。
典型地,通过将有机化合物共价连接到金属层的表面,将有机化合物诸如寡核苷酸连接到类型II COINs中第二金属的层上。将有机层共价连接到金属层上可以用本领域技术人员熟知的许多方法完成,诸如例如通过硫醇-金属键。在可选择的实施方案中,被连接到金属层的有机分子可以被交联,以形成分子网络。
用于本发明方法的COIN可以包括含有磁性物质的核心,磁性物质诸如铁氧化物和类似物。磁性COINs可用常用的磁性颗粒处理系统处理,无需离心。事实上,磁性可以用作分离连接到磁性COIN颗粒的生物目标的手段,所述磁性COIN颗粒用特定的生物探针标记。
另一类型的拉曼标记是多环芳香族化合物。可以使用的其他标记包括氰化物、硫醇、氯、溴、甲基、磷和硫。在某些实施方式中,碳纳米管可用作拉曼标记。标记在拉曼光谱术中的应用是已知的(例如美国专利5,306,403和6,174,677)。
拉曼活性标记可以直接连接到探针,或可以通过各种连接化合物连接。被共价连接到拉曼标记的核苷酸可从标准商业来源获得(例如Roche MolecularBiochemicals,IN;Promega,Corp.,Madison,WI;Ambion,Inc.,Austis,TX;AmershanPharmacia Biotech,Piscataway,NJ)。含有活性基团的拉曼标记可以通过商业渠道获得(例如Molecular Probes,Eugene,OR),所述活性基团被设计成与其他分子诸如核苷酸或氨基酸共价反应。
在某些方面,在用SERS检测之前,将拉曼标记沉积在SERS基质上。将拉曼信号分子沉积在基质上的方法是本领域已知的。检测手段或检测装置可以被设计为通过拉曼光谱术检测和/或量化核苷酸。用拉曼光谱术检测核苷酸的各种方法为本领域已知。(参见,例如美国专利5,306,403;6,002,471;6,174,677)。然而,在单个分子水平上进行的标记或未标记的核苷酸的拉曼检测先前并没有展示过。已经公开了表面增强拉曼光谱术(SERS)或表面增强共振拉曼光谱术(surfaceenhanced resonance Raman spectroscopy,SERRS)的各种变化。在SERS和SERRS中,对于吸附在粗糙的金属表面诸如银、金、铂、铜或铝表面上的分子,拉曼检测的灵敏度被增强的系数为106或更多。
检测手段或检测单元的非限制性的例子在美国专利6,002,471中公开。在该实施方案中,激发光束由钕:钇铝石榴石(Nd:YAG)激光器产生,波长为532nm;或者由钛:蓝宝石(Ti:sapphire)激光器产生,波长为365nm。可以使用脉冲激光束或连续激光束。激发光束通过共聚焦光学元件和显微物镜,并聚焦在反应室上。来自核苷酸的拉曼发射光由显微物镜和共聚焦光学元件收集,然后连到单色仪上进行光谱分离。共聚焦光学元件用于降低背景信号,包括双色滤片、二次滤片、共聚焦孔、透镜和平面镜的组合。标准的全视场光学元件可以同共聚焦光学元件一起使用。拉曼发射信号由拉曼检测器检测。检测器包括与用于信号计数和数字化的计算机相连接的雪崩光电二极管。在某些实施方案中,包括银、金、铂、铜或铝的网格可以包含在反应室或通道中,以提供增强的信号,这是由于表面增强拉曼或表面增强拉曼共振的缘故。可选择地,可以包括含有拉曼活性金属的纳米颗粒。
检测手段或检测单元的可供选择的实施方式公开在例如美国专利5,306,403中,其包括Spex Model 1403双栅分光光度计,并配有砷化镓光电倍增管(RCAModel C31034或Burle Industries Model C3103402),它以单光子计数模式运作。激发源是来自SpectraPhysics的514.5nm线氩离子激光器,Model 166和氪离子激光器(Innova 70,Coherent)的647.1nm线。
可选择的激发源包括337nm的氮激光器(Laser Science Inc.)和325nm的氦-镉激光器(Liconox)(美国专利6,174,677)。激发光束可以用带通滤波器(Corion)进行光谱纯化,并可以用6X物镜(Newport,Model L6X)聚焦到反应室。可以用物镜来激发核苷酸和收集拉曼信号,其中使用全息光束分离器(KaiserOptical Systems,Inc.,Model HB 647-26N18),以产生激发光束和发射的拉曼信号的直角几何关系。可以使用全息陷波滤波器(Kaiser Optical Systems,Inc.)来减少瑞利散射。可选择的拉曼检测器包括ISA HR-320摄谱仪,其装配有红增强放大电荷耦合器件(RE-ICCD)检测系统(Princeton Instruments)。可以使用其他类型的检测器,如电荷注入器件、光电二极管阵列或光电晶体管阵列。
本领域已知的任何适当形式或构造的拉曼光谱术或相关技术都可以用来检测核苷酸,包括但不限于常规拉曼散射、共振拉曼散射(resonance Ramanscattering)、表面增强拉曼散射(surface enhanced Raman scattering)、表面增强共振拉曼散射(surface enhanced resonance Raman scattering)、相干反斯托克斯拉曼光谱术(CARS)、受激拉曼散射(stimulated Raman scattering)、反拉曼光谱术(inverseRaman spectroscopy)、受激增益拉曼光谱术(stimulated gain Raman spectroscopy)、超拉曼散射(hyper-Raman scattering)、分子光学激光检测器(molecular optical laserexaminer,MOLE)或拉曼显微探针(Raman microprobe)或拉曼显微镜(Ramanmicroscopy)或共聚焦拉曼微光谱测定法(confocal Raman microspectrometry)、三维或扫描拉曼(three-dimensional or scanning Raman)、拉曼饱和光谱术(Ramansaturation spectroscopy)、时间分辨共振拉曼(time resolved resonance Raman)、拉曼退耦光谱术(Raman decoupling spectroscopy)或紫外-拉曼显微术(UV-Ramanmicroscopy)。
拉曼标记可以在寡核苷酸探针合成之前掺入到核苷酸中。例如,考虑用于在腺嘌呤(A)和鸟嘌呤(G)位置上进行共价连接的内部氨基修饰。内部连接也可以在胸腺嘧啶(T)位置,使用商业上可获得的亚磷酰胺实施。在一些实施方案中,在A和G位置具有丙胺连接物的文库片段可以被用于将信号分子连接到编码探针上。内部氨烷基尾的引入使得能在合成后连接信号分子。连接物可以从商家诸如Synthetic Genetics(San Diego,CA)购得。在本发明的一个实施方案中,也可以考虑使用信号分子的合适的亚磷酰胺衍生物进行的自动偶联。此类信号分子可以在寡核苷酸合成期间被偶联到5′-末端。
一般地,拉曼标记将以使信号分子的空间位阻最小化的方式,共价连接到探针上,以便有助于编码的探针结合到目标分子,诸如与核酸杂交。可以使用赋予编码探针一定程度柔性的连接物。同质或异质双功能连接物可以从各种商业来源获得。
与寡核苷酸碱基的连接点可以随碱基而变化。尽管可能在任何位置上连接,在某些实施方案中,发生连接的位置不涉及到与互补碱基形成的氢键。因此,例如,连接可以是连接到嘧啶诸如尿嘧啶、胞嘧啶和胸腺嘧啶的位置5或6上。对于嘌呤诸如腺嘌呤和鸟嘌呤,连接可以通过位置8进行。
使用本实施方案中提供的方法测定的目标核酸核酸序列的范围从在目标核苷酸位置的单核苷酸发生至目标核酸的完整序列。在某些方面,目标位置是单核苷酸多态性位置。
可选择地,可以测定目标核酸的目标片段的连续位置上的一系列核苷酸发生。目标片段例如可以小于或等于所述捕获寡核苷酸探针和拉曼活性寡核苷酸探针的组合长度。例如,如果使用10个核苷酸的捕获探针和20个核苷酸的拉曼活性寡核苷酸探针,那么目标片段可以是30个核苷酸或更少。作为另一非限制性例子,目标片段可以小于或等于拉曼活性寡核苷酸探针的长度。因此,例如,如果拉曼活性寡核苷酸探针为10-mer,那么目标片段可以是10个碱基或更少。
在一些方面,测定整个目标核酸的核苷酸序列。这典型地通过使用本领域已知的方法比对被检测的目标序列来完成。目标序列例如可以是重叠序列,以加速比对过程。在一些方面,分别分析目标核酸序列的片段,然后将来自这些独立的分析的数据组合起来,以确定整个目标核酸分子的核苷酸序列。使用已知的方法诸如内切核酸酶切割可以获得目标核酸分子的片段。此外,目标核酸或其片段作为单链核酸典型地被用于杂交测序方法中,如将被理解的。例如,目标核酸分子可以在它与探针接触之前被变性。
通过拉曼扫描获得拉曼活性寡核苷酸探针的拉曼信号特征。例如,可以使用表面增强拉曼光谱术(SERS)。SERS拉曼扫描通常在微米或纳米水平实施。典型地,记录下各个拉曼探针的拉曼光谱。
如上所述,以及如图2所示,拉曼活性寡核苷酸探针40包括具有已知序列的寡核苷酸探针55,以及可选地,包括序列特异性拉曼标记45(在本文中也称为拉曼标签(tag))或带正电荷的增强子60。固定化的探针复合物70在本实施方案的方法中形成,该复合物包括捕获寡核苷酸探针20、结合的目标分子10,和结合的拉曼活性寡核苷酸探针40。如图2所示,银胶体或其他纳米颗粒可以与寡核苷酸和/或拉曼标记在存在单价盐的条件下聚集,形成由拉曼光谱术检测的银胶体-拉曼标记复合物80。所述金属胶体可以预先制备或原位合成。
拉曼活性探针分子的SERS扫描提供了高度灵敏的检测方法。事实上,已经报道单个核苷酸可以用SERS检测。通过对核苷酸的化学修饰,诸如通过连接带正电荷的增强子,可以获得更高的拉曼活性。因此,比起传统方法,需要更少拷贝的目标核酸和捕获寡核苷酸探针用于检测。因此,少至1000或更少、500或更少、250或更少、125或更少、100或更少、50或更少、25或更少、20或更少、15或更少、10、9、8、7、6、5、4、3、2或1个分子的拉曼活性寡核苷酸探针被检测。
拉曼特征被翻译成对应于探针的核酸子序列(sub-sequences)。在某些方面,捕获寡核苷酸探针的核苷酸序列由它们在基质上的位置决定,而拉曼活性寡核苷酸探针的序列通过拉曼信号特征确定,在一些实例中也通过它们在基质上的位置确定。因此,典型地,目标核酸或其片段(即子序列)的序列通过捕获探针序列和拉曼活性寡核苷酸探针序列确定。目标分子的完整序列可以通过比对核酸子序列推断得到。
鉴定杂交核苷酸来解码序列信息的方法是本领域已知的。例如,本文所包括的涉及杂交测序的引用文献提供了解码多核苷酸序列信息更为详细的方法,所述解码是基于通过杂交结果进行的测序。从多份纳米颗粒读取收集到的数据被用于确定多核苷酸序列,这基于序列比对原则(参见例如Laser Gene program(DNAStar,Mountain View,CA)。生物信息公司和政府机构提供了用于数据处理以测定DNA序列的必要工具、服务和其他相关的工具。
如上所述,典型地,两群探针被包括在通过杂交来测序的方法中,该方法使用了拉曼光谱术,如本文中所公开的。标记的寡核苷酸探针群在本文中也称为“标记寡核苷酸文库”。标记寡核苷酸群通常是包括已知的核苷酸序列部分——也称为探针部分——的杂交探针。寡核苷酸探针群包括捕获寡核苷酸探针群和拉曼活性寡核苷酸探针群。
在某些方面,探针群尤其是拉曼活性寡核苷酸探针群,包括具有对应于每一种可能的置换的核苷酸序列的寡核苷酸,所述可能置换的长度小于或等于寡核苷酸的长度。典型地,群中的所有核苷酸具有相同的长度。例如,在某些方面,寡核苷酸长度等于或小于250个核苷酸、200个核苷酸、100个核苷酸、50个核苷酸、25个核苷酸、20个核苷酸、15个核苷酸、10个核苷酸、9个核苷酸、8个核苷酸、7个核苷酸、6个核苷酸、5个核苷酸、4个核苷酸或3个核苷酸。例如,但不是限制性的,寡核苷酸长度为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、200或250个核苷酸。例如,标记的探针群包括在2至50个核苷酸之间的长度相同的探针,或例如3至25个核苷酸之间的长度相同的探针。例如,标记的寡核苷酸探针群可以包括长度为3个核苷酸的所有可能的寡核苷酸探针。
在某些方面,标记的寡核苷酸群包括至少10、20、30、40、50、100、200、250、500、1000、10,000个或更多的寡核苷酸。例如,该群可以包括具有相同长度的寡核苷酸的基本上所有或所有可能的核苷酸序列组合,如对于至少一些杂交测序反应所知道的(参见美国专利5,002,867)。对于给定的长度,基本上所有可能的核苷酸序列组合包括了足够的可能核苷酸序列,从而能够明确地检测杂交目标核酸。
对于拉曼活性寡核苷酸群,每一种被标记的探针可以产生独特的拉曼信号。用于本文中的独特的拉曼信号是提供拉曼特征的拉曼信号,该拉曼特征可与该群中所使用的其他拉曼标记的其他拉曼特征区分开来。
在一个实施方案中,提供了用于检测模板核酸中目标核苷酸位置上的核苷酸发生的方法,该方法包括将模板核酸与一个或多个捕获寡核苷酸探针接触,所述捕获寡核苷酸探针结合到目标核酸的紧靠目标核苷酸位置的5′侧,并与两个或多个标记的寡核苷酸探针接触,所述标记的寡核苷酸探针结合到在3′核苷酸处包括目标核苷酸位置的目标区域上。这些方面例如对于测定单核苷酸多态性(SNP)位点的核苷酸发生是有用的。
在某些方面,测定核苷酸序列的方法还包括可选的连接反应。连接反应通常涉及捕获寡核苷酸探针与结合到目标核酸相邻区域的拉曼活性寡核苷酸探针的连接。连接相邻寡核苷酸后,没有被固定到基质上的寡核苷酸可以被除去,例如通过提高温度或改变反应的pH以使核酸变性来完成。没有直接或者间接地被固定到基质上的寡核苷酸可以洗去,固定的寡核苷酸可以用SERS检测。连接和洗涤步骤增加了反应的特异性。
因此,如图1所示,捕获寡核苷酸探针20可以被固定在基质30上的各点25(图1中的A和B)。在包括连接步骤的方面,仅仅当目标核酸10包括与拉曼活性寡核苷酸探针40和捕获寡核苷酸探针20两者互补的目标片段时,拉曼活性寡核苷酸探针40才连接到捕获寡核苷酸探针20。在该方面,基于连接的拉曼探针的拉曼特征和捕获探针的相应位置,核苷酸序列得以确定。
相邻的标记寡核苷酸探针可以用已知的方法连接在一起(参见例如美国专利6,013,456)。引物依赖型连接可以使用长度至少6至8个碱基的寡核苷酸完成(Kaczorowski和Szybalski,Gene 179189-193,1996;Kotler等,Proc.Natl.Acad.Sci.USA 904241-45,1993)。连接与核酸模板杂交的寡核苷酸探针的方法是本领域已知的(美国专利6,013,456)。相邻寡核苷酸探针的酶法连接可以利用DNA连接酶,诸如T4、T7或Taq连接酶或大肠杆菌DNA连接酶。酶法连接的方法是已知的(例如Sambrook等,1989)。
本文中提供的核酸测序方法是利用杂交反应的测序,如本领域所知道的。一个或多个具有已知序列的寡核苷酸探针能够被杂交到目标核酸序列。标记的寡核苷酸与目标的结合表明在目标链中存在互补序列。多个标记探针可以同时与目标分子杂交,并同时检测。在可选择的实施方案中,结合的探针可以被鉴定为连接于各个目标分子,或可选择地,特定目标分子的多个拷贝可以同时结合到相互重叠的几组探针序列上。例如,使用与检测模式偶联的已知的分子梳技术,可以扫描各个分子。(参见例如Bensimon等,Phys.Rev.Lett.744754-57,1995;Michalet等,Science 2771518-23,1997;美国专利5,840,862;6,054,327;6,225,055;6,248,5376,265,153;6,303,296和6,344,319)。
不太可能的是,给定的目标核酸将杂交到完全覆盖该目标序列的连续的探针序列。相反,多个拷贝的目标可以杂交于标记寡核苷酸库(pools),从其中的每一个都可收集到一部分的序列数据。使用公众可获得的鸟枪法序列编辑程序(shotgunsequence compilation program),所述的各部分的序列可以汇编成完整的目标核酸序列。部分的序列也可以由目标分子群汇编,所述目标分子群可以同时结合于标记寡核苷酸探针文库,例如在溶液相中进行。
捕获探针固定于其上的基质可以是聚合物、塑料、树脂、多糖、硅石或硅石基材料、碳、金属、无机玻璃、膜。例如,基质可以是金属、玻璃或塑料。在一个方面,表面是光学透明的,并具有表面Si-OH官能性,诸如在硅石表面上发现的那些。
用于连接到表面和比对分子诸如寡核苷酸探针的方法和设备是本领域已知的(参见例如Bensimon,等,Phys.Rev.Lett.744754-57,1995;Michalet,等,Science2771518-23,1997;美国专利5,840,862;6,054,327;6,225,055;6,248,537;6,265,153;6,303,296和6,344,319)。表面的非限制性例子包括玻璃、功能化玻璃、陶瓷、塑料、聚苯乙烯、聚丙烯、聚乙烯、聚碳酸酯、PTFE(聚四氟乙烯)、PVP(聚乙烯吡咯烷酮)、锗、硅、石英、砷化镓、金、银、尼龙、硝化纤维或能够将捕获探针连接到表面上的本领域已知的任何其他材料。连接可以利用共价或非共价相互作用。尽管在本发明的某些实施方案中,表面是载玻片或盖玻片的形式,但表面的形状不受限制,表面可以是任何形状。在本发明的一些方面,表面是平面的。
核酸固定化在此被典型地使用,以将捕获探针固定到基质上。核酸的固定化可以通过本领域已知的各种方法完成。例如,固定化可以通过这样的方法完成,即用链霉抗生物素蛋白或抗生物素蛋白包覆基质,接着进行生物素化核酸的连接(Holmstrom等,Anal.Biochem.209278-283,1993)。固定化亦可这样实现,即用聚E-Lys(赖氨酸)包覆硅、玻璃或其他基质,接着用双功能交联剂共价连接氨基或巯基修饰的核酸(Running等,BioTechniques 8276-277,1990;Newton等,NucleicAcids Res.211155-62,1993)。通过使用用于交联的氨基硅烷,可以将胺基残基引入到基质上。
可以将5′-磷酸化核酸直接共价连接到化学修饰的基质,从而实现固定化(Rasmussen等,Anal.Biochem.198138-142,1991)。核酸与基质之间的共价键通过与水溶性碳二亚胺或其他交联剂的缩合而形成。这种方法有助于核酸通过其5′-磷酸进行主要的5′-连接。示范性修饰的基质将包括玻璃载片或盖片,其已经在酸浴中被处理,从而将SiOH基团暴露在玻璃上(美国专利5,840,862)。
要将DNA结合到玻璃上,通常要先对玻璃表面进行硅烷化,然后用碳二亚胺或戊二醛活化。可选择的方法可以使用诸如3-环氧丙氧基丙基三甲氧基硅烷(GOP)、乙烯基硅烷或氨丙基三甲氧基硅烷(APTS)的试剂,DNA通过整合到分子的3′或5′端的氨基连接物来联接。使用紫外辐射可以将DNA直接结合到膜基质。核酸固定化技术的其他非限制性实例公开在美国专利5,610,287、5,776,674和6,225,068。用于核酸结合的商业上可获得的基质可获自诸如Covalink、Costar、Estapor、Bangs和Dynal。本领域技术人员将认识到,本公开的方法不限于固定核酸,它们也可能用于例如将寡核苷酸编码探针的一端或两端连接到基质。
用于核酸或其他目标分子固定化的基质的类型没有限制。在本发明的各种实施方案中,该固定化基质可以是磁珠、非磁性珠、平表面或者任何其它构型的固体表面,它们可以包括几乎任何材料。可被使用的基质的非限制性例子包括玻璃、硅石、硅酸盐、PDMS(聚二甲基硅氧烷)、银或其它金属涂覆的表面、硝化纤维、尼龙、活化的石英、活化的玻璃、聚偏二氟乙烯(PVDF)、聚苯乙烯、聚丙烯酰胺,其它聚合物,诸如聚氯乙烯、聚甲基丙烯酸甲酯,以及光聚合物,其含有光活性物质如氮宾、卡宾和能与核酸分子形成共价连接的羰自由基(参见美国专利5,405,766和5,986,076)。
双功能交联剂可以用于本发明的各种实施方案中。可以根据双功能交联剂的功能基团特异性,例如氨基、胍基、吲哚或羧基特异性基团来划分它们。其中,涉及自由氨基基团的试剂是受欢迎的,因为它们可以通过商业途径获得、易于合成并且其可应用的反应条件温和。用于交联分子的示范性的方法在美国专利5,603,872和5,401,511中公开。交联剂包括戊二醛(GAD)、双功能环氧乙烷(OXR)、乙二醇二缩水甘油醚(EGDE)和碳二亚胺如1-乙基-3-(3-二甲基氨丙基)碳二亚胺(EDC)。
在某些方面,用于本文公开的方法的基质是生物芯片。图3提供了生物芯片设计和使用本文中提供的生物芯片和方法对目标核酸进行序列测定的方法的例子。该实施例的生物芯片含有许多探针区域310。每一探针区域310(例如“A”或“B”)具有多个捕获探针组320(例如,1和2)。在每一捕获探针组350中的捕获探针20具有相同的序列。换句话说,在点1A和1B的捕获探针20具有相同的核苷酸序列,但是位于不同的区室区域中。许多拉曼探针组320(例如,″a″和″b″)被制备。
每一拉曼活性寡核苷酸探针组350是不同的拉曼活性寡核苷酸探针40构成的库。每一组具有一个以上的寡核苷酸,每一寡核苷酸具有独特的标记。为了制备拉曼活性寡核苷酸探针40,合成具有相同序列的探针分子,并且根据该实施例,将独特的拉曼标记45连接到每一分子55(即,同样的核苷酸序列具有同样的拉曼标记45)。许多具有不同的核苷酸序列和不同的拉曼标记45的拉曼活性寡核苷酸探针40可以汇合成拉曼探针组340。用不同的探针序列55可以形成拉曼探针40的不同的组350。然而,同样的拉曼标记45可以被用于一个以上的拉曼探针组320。因此,拉曼探针序列55可以用它的组ID和它的拉曼标记识别。当多拷贝的目标序列10——例如来自未经扩增的生物样品——被打碎成为短的重叠的片段时,它们可以杂交到芯片上的捕获探针20。当拉曼探针组350被分别加入到探针区域310时,拉曼探针40将与目标核酸分子10杂交。在连接酶存在下,捕获探针分子20和拉曼探针分子40可以被连接起来,从而将以目标序列依赖型的方式固定拉曼探针分子40。各个拉曼探针45可以通过SERS扫描被检测。最后,目标序列被解析。
因此,在某些方面,将第一群拉曼活性寡核苷酸探针40与在一系列点340中的第一点上的探针-目标双链体核酸接触,将第二群拉曼活性寡核苷酸探针40与在一系列点340中的第二点上的探针-目标双链体核酸接触,其中第一群拉曼活性寡核苷酸探针40和第二群拉曼活性寡核苷酸探针40包括至少一个不同的寡核苷酸探针。而且,第一群拉曼活性寡核苷酸探针40和第二群拉曼活性寡核苷酸探针40包括至少一个携带相同的拉曼标记45的拉曼活性寡核苷酸探针40,但是不同的寡核苷酸55结合于该标记45。而且,在某些方面,每一点位置可以包括不同的捕获寡核苷酸探针20。此外,所述一系列的点位置包括具有相同的捕获寡核苷酸探针20的点位置,以及具有不同的捕获寡核苷酸探针20的点位置。
在另一实施方案中,提供了检测系统,其包括带有光源的拉曼光谱仪、与光源发生光通信的拉曼活性表面,和拉曼活性寡核苷酸探针群,该群包括与带正电荷的增强子连接的不可检测的寡核苷酸,其中,拉曼活性寡核苷酸探针沉积在拉曼活性表面上。如本文中所述,带正电荷的增强子可以是例如胺基团增强子。该系统被用于实施利用杂交进行测序的方法,其中使用了拉曼标记的寡核苷酸探针,如文中所述。
将被理解的是,使用本文中公开的方法产生的测序数据可以被用于生物医学研究和临床诊断。例如,本文中公开的方法可以被用于产生大规模基因组测序所需的序列信息、序列比较、基因型定型、疾病关联、药物开发、病原体检测和遗传筛选。例如,公开于本文中的方法可以被用于测定对象的一级序列信息,诸如与疾病相关的单核苷酸多态性、基因片段或完整基因的序列。因此,所述方法可以被用于诊断疾病或提供预后信息。
在某些方面,在目标分子用本发明的方法检测之前,将目标分子从生物样品中分离出来。例如,生物样品可以从哺乳动物对象,例如人对象获得。事实上,生物样品可以是任何生物样品,特别是含有来自对象的RNA或DNA的样品。生物样品例如是尿、血液、血浆、血清、唾液、精液、大便、痰、脑脊髓液、泪、粘液和类似物。生物样品可以是组织样品,其含有例如1至10,000,000;1000至10,000,000;或1,000,000至10,000,000个体细胞。样品不必含有完整的细胞,只要它含有足够用于本发明方法的RNA或DNA就可以,其在一些方面仅仅需要1个分子的RNA或DNA。根据生物样品来自哺乳动物对象的本发明的方面,生物或组织样品可以来自任何组织。例如,组织可以通过手术、组织切片、拭抹、排泄或其他收集方法获得。
在其他方面,生物样品含有病原体,例如病毒或细菌病原体。然而,在某些方面,在模板核酸与探针接触之前,将模板核酸从生物样品纯化出来。分离的模板核酸可以与反应混合物接触,无需扩增。
如本文中所使用,“约”是指在某个值的百分之十以内。例如,“约100”将指在90至110之间的值。
“核酸”包括DNA、RNA(核糖核酸),单链、双链或三链核酸,和其任何化学修饰。事实上,考虑核酸的任何修饰。“核酸”几乎可以是任何长度的,从2个或更多个碱基的寡核苷酸至全长染色体DNA分子。核酸包括但不限于寡核苷酸和多核苷酸。如本文中使用的,“多核苷酸”是包括至少25个核苷酸的核酸。
多态性是发生在群体中的等位基因变异。多态性可以是存在于一个位点上的单核苷酸差异,或者可以是一个或一些核苷酸的插入或缺失。这样,单核苷酸多态性(SNP)的特征是在群体中,在基因组诸如人基因组的特定位点上存在的一种或两种、三种或四种核苷酸发生(即,腺苷、胞苷、鸟苷或胸苷)。如本文中所示,本文中公开的方法可用于检测在SNP位置上的核苷酸发生,或对于双倍体生物体诸如哺乳动物来说检测在SNP位置上的两基因组核苷酸发生。而且,本文中公开的方法可用于在单个反应中检测1个以上的SNP,例如2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、50、100或更多个SNP。
“目标”或“分析物”分子是能够与标记的探针结合的任何分子,包括但是不限于核酸、蛋白质、脂类和多糖。在方法中的一些方面,标记探针与目标分子的结合可以被用于检测目标分子在样品中的存在。
待被用本文中提供的方法测序的核酸分子可以用本领域已知的任何技术制备。在本发明的某些实施方案中,核酸是天然存在的DNA或RNA分子。事实上,任何天然存在的核酸都可以用本文中公开的方法测序,包括但不限于染色体、线粒体和叶绿体DNA和核糖体RNA、转运RNA、不均一核RNA和信使RNA。在一些实施方案中,待被分析的核酸可以以细胞、组织或器官的粗匀浆或提取物的形式存在。在其他实施方案中,在分析之前,核酸可以部分地或完全地纯化。在可选择的实施方案中,待被分析的核酸分子可以通过化学合成或通过本领域已知的各种核酸扩增、复制和/或合成方法制备。
在一些方面,本发明的方法分析分离自细胞的核酸。纯化各种形式的细胞内核酸的方法是已知的。(参见例如,Guide to Molecular Cloning Techniques,eds.Berger and Kimmel,Academic Press,New York,NY,1987;Molecular CloningALaboratory Manual,2nd Ed.,eds.Sambrook,Fritsch and Maniatis,Cold Spring HarborPress,Cold Spring Harbor,NY,1989)。在所引用的参考文献中公开的方法仅仅是示例性的,可以使用本领域已知的任何变通的方法。在对单链DNA(ssDNA)进行分析的情况下,可以采用任何已知方法,从双链DNA(dsDNA)制备ssDNA。这些方法可以涉及加热dsDNA和使链分离,或者可以可选地涉及通过已知的扩增或复制方法,从dsDNA制备ssDNA,例如克隆到M13中。可以使用任何这样的已知方法制备ssDNA或ssRNA。
尽管本发明的某些实施方案涉及分析天然存在的核酸诸如多核苷酸,事实上任何类型的核酸都可以使用。例如,用各种扩增技术如聚合酶链式反应(PCR3)扩增制得的核酸可以被分析。(见美国专利4,683,195、4,683,202和4,800,159。)作为选择,待分析的核酸可以用标准载体克隆,标准载体如质粒、粘粒、BACs(细菌人工染色体)或YACs(酵母人工染色体)。(见,例如,Berger and Kimmel,1987;Sambrook et al.,1989。)核酸插入物可以从载体DNA中分离,例如,用合适的限制性内切核酸酶切割,然后进行琼脂糖凝胶电泳。核酸插入物的分离方法是本领域已知的。公开的方法不限制待被分析的核酸的来源,任何类型的核酸,包括原核生物的、细菌的、病毒的、真核生物的、哺乳动物和/或人的核酸都可以在要求保护的主题范围内进行分析。
在本发明的各种实施方案中,多拷贝的核酸可以通过与标记的寡核苷酸探针杂交来分析,如下所述。单个核酸的制备和多拷贝的形成——例如通过各种扩增和/或复制方法完成——是本领域已知的。可选择地,可以分离单个克隆,诸如BAC、YAC、质粒、病毒或含有单个核酸插入物的其他载体,并培养之,取出插入片段并纯化,用于分析。克隆并获得纯化的核酸插入物的方法是本领域已知的。
在本发明的各种实施方案中,目标核酸与标记寡核苷酸群的杂交可以在严紧型条件下实施,该严紧型条件仅仅允许完全互补的核酸序列之间的杂交。低严紧型条件通常是在0.15M至0.9M NaCl,在20℃至50℃的温度范围内实施。高严紧型条件通常是在0.02M至0.15M NaCl,在50℃至70℃的温度范围内实施。应该理解地是,合适严紧型的温度和/或离子强度部分地是由寡核苷酸探针的长度、目标序列的碱基组成、在杂交混合物中存在的甲酰胺、四甲基氯化铵或其他溶剂来决定。上面提及的范围是示范性的,并且特定杂交反应的合适的严紧型常常通过比较阳性和/或阴性对照经验性地决定。本领域普通技术人员能够常规性地调整杂交条件,以使得仅仅在精确互补的核酸序列之间发生严紧型杂交。
不太可能的是,给定的目标核酸将杂交到完全覆盖目标序列的连续的探针序列。相反,多拷贝的目标可以杂交于标记寡核苷酸的库,并从其中每一个收集到部分序列数据。使用公众可获得的鸟枪序列编辑程序,所述的部分的序列可以汇编成完整的目标核酸序列。
在本发明的某些实施方案中,当仍连接在目标分子上时,标记的寡核苷酸便被检测。假定短的寡核苷酸探针和目标核酸之间的结合相互作用具有相对较弱的强度,则这样的方法可能更加合适,其中例如标记的探针已经用交联剂被共价连接到目标分子上。
在本发明的各种实施方案中,寡核苷酸探针可以是DNA、RNA或其任何类似物,诸如肽核酸(PNA),其可以被用于鉴定核酸中的特异性互补序列。在本发明的某些实施方案中,可以制备一个或多个寡核苷酸探针文库,用于与一个或多个核酸分子杂交。例如,可以使用含有所有4096种或约2000种非互补6聚体,或所有16,384种或约8,000种非互补7聚体的一组标记寡核苷酸探针。如果非互补的寡核苷酸探针亚组将被使用,可以进行一系列杂交和序列分析,并将分析结果通过计算方法并入单个数据组。例如,如果仅包括非互补6聚体的文库被用于杂交和序列分析,则实施第二杂交和分析,其使用同样的目标核酸分子,该目标核酸分子与由第一文库排除的那些标记探针序列杂交。
标记的寡核苷酸群的寡核苷酸可以用任何已知的方法制备,诸如通过用Applied Biosystems 381A DNA合成仪(Foster City,CA)或类似的设备合成。可选择地,寡核苷酸可以从许多商家那里购得(例如Proligo,Boulder,CO;Midland CertifiedReagents,Midland,TX)。在寡核苷酸为化学合成的实施方案中,信号分子诸如拉曼标记或带正电荷的增强子,可以被共价连接到用于合成的一个或多个核苷酸前体上。可选择地,信号分子可以在寡核苷酸探针合成后被连接。在其他可选择的实施方案中,拉曼标记的连接可以与寡核苷酸合成同时进行。
在本发明的某些方面,标记的寡核苷酸探针包括肽核酸(PNAs)。PNAs是聚酰胺形式的DNA类似物,具有腺嘌呤、鸟嘌呤、胸腺嘧啶和胞嘧啶的单体单元。PNAs可通过商业渠道从公司诸如PE Biosystems(Foster City,CA)获得。可选择地,PNA合成可以用9-芴甲氧羰基(Fmoc)单体激活,并在叔胺N,N-二异丙基乙胺(DIEA)存在下,用O-(7-氮杂苯并三唑)-1,1,3,3,-四甲基脲六氟磷酸盐(tetramethyluronium hexafluorophosphate)(HATU)偶联来进行。PNAs可以通过反相高效液相色谱(RP-HPLC)纯化,并通过基质辅助激光解吸电离-飞行时间(matrixassisted laser desorption ionization-time of flight)(MALDI-TOF)质谱分析来检验。
本文进一步提供的是用于实施上述方法的试剂盒。该试剂盒包括拉曼活性寡核苷酸探针群,其中一个或多个拉曼活性寡核苷酸探针被结合到带正电荷的增强子。该试剂盒也可以包括携带有结合的捕获寡核苷酸探针群的基质,如本文所论述。在某些实施方案中,该试剂盒还包括银胶体或纳米颗粒。此外,该试剂盒可以包括拉曼活性表面。
下面的实施方案是基于发现了灵敏且简单的检测方法,该方法能够区分具有微妙差异的目标分子。该方法对于生物应用是重要的,诸如在基因型定型中的单核苷酸多态性检测,如上所述。该方法是有效的,因为无需化学修饰和冗长的样品制备技术,并且大量的目标可以在单个装置中,在短时间内被分析。此外,该方法成本相对低,这是因为仅需要非常少量的样品和试剂。
不受理论限制,公开的方法部分地基于这样的构思当同样的探针与具有微妙的结构差异的两目标形成复合体时,在连接到探针上的标记中具有构象差异,并且这些空间构象差异可以被光学技术分辨。本文中提供的数据表明,使用荧光方法,单个核酸探针可以检测完美匹配和错配目标之间的差异。
而且,在某些方面,用于检测微妙的结构差异的方法使用拉曼检测方法来实施。这些方面依靠装这样的事实,即拉曼检测方法比荧光检测方法提供了更多的结构信息。而且,SERS拉曼具有单个分子检测灵敏性的潜力。最后,微流体MEMS装置可以被用于在小的液体腔(cavities)内将样品分离成独自的探针-目标复合体,其可以用SERS检测。
因此,在另一实施方案中,提供了检测第一特异性结合对成员中的目标结构的方法,该方法包括将第一结合对成员与第二特异性结合对成员接触,其中第二特异性结合对成员结合第一特异性结合对成员,并且其中第二特异性结合对成员包括第一标记和第二标记,其中,当第一结合对成员结合到第二结合对成员时,以可受到第一结合对成员的目标结构的影响的方式,第一标记能够影响第二标记的光学信号。来自第二标记的信号被检测,并被用于测定第一结合对成员的目标结构。
在该实施方案中,第一特异性结合对成员是目标分子,第二特异性结合对成是探针。探针是特异性识别并结合它的配体(即目标分子)的分子聚合物(即蛋白质、核酸等)。探针分子是特异性结合对成员,例如是核酸,诸如寡核苷酸或多核苷酸;蛋白质或其肽片段,诸如受体或转录因子,抗体或抗体片段,例如遗传工程改造的抗体,单链抗体或人源化的抗体;凝集素;底物;抑制剂;激动剂;配体;激素;细胞因子;趋化因子和/或药物。例如,当目标分子是蛋白质时,探针是蛋白质(抗体);当目标是核酸时,探针通常是核酸诸如寡核苷酸。
如本文中所使用的,术语“特异性结合对成员(specific binding pair member)”指与特异性结合对的另一成员特异性结合或选择性杂交的分子。特异性结合对成员包括,例如,寡核苷酸和与该寡核苷酸选择性杂交的核酸,或者蛋白和与该蛋白质结合的抗体。如本文中使用的,术语“选择性杂交作用”或“选择性杂交”指在高严紧型生理条件下的杂交。术语“特异性结合”或“特异性结合活性”,当涉及抗体时,指抗体和特定表位的相互作用具有至少约1×10-6,一般至少约1×10-7,通常至少约1×10-8,特别地至少约1×10-9或1×10-10或更小的解离常数。
在相关的实施方案中,提供了测定在目标核酸的目标核苷酸位置上的核苷酸发生的方法,该方法包括将目标核酸与结合该目标核酸的标记寡核苷酸探针接触,以形成探针-目标复合体,其中标记寡核苷酸探针包括第一标记和第二标记,第一标记能够影响第二标记的光学特性;并检测探针-目标复合体的光学特性。目标核苷酸位置上的核苷酸发生影响第一标记和第二标记的取向,从而影响第二标记的光学特性。光学特性为,例如由第二标记产生的荧光信号和拉曼信号。产生的信号的特性使得能测定在目标核苷酸位置上的核苷酸发生。
在某些实施方案中,在被检测之前,将交流电(AC)施于所述探针-目标复合体,以增加在第一探针对第二探针荧光信号或拉曼信号的影响的差异,这取决于目标多核苷酸和标记探针在目标核苷酸位置是否含有互补的核苷酸。施用的AC电压可以是例如10-100mV,AC频率为1Hz至1MHz。
荧光信号和拉曼信号,例如分别是荧光光谱或拉曼光谱。检测荧光信号和拉曼信号的方法是本领域已知的,其中一些方法在本文中给出。在某些方面,第一标记和第二标记是FRET对,如在本文中更详细论述的。在一个实施例中,FRET对是TAMRA和ROX。
因此,标记是连接到探针的光学上可检测的部分。标记可以是荧光染料、拉曼标记或可以被光学技术识别的任何小分子。上文中提供了拉曼标记的例子。
选择探针的第一标记和第二标记,以形成包括荧光或拉曼供体和荧光或拉曼受体的供体/受体对,响应于对荧光或拉曼供体的激活,所述供体和受体能够相互间进行荧光共振能量转移或拉曼能量转移,所述激活通过具有预先确定的波长或波长带的光来完成。
荧光或拉曼标记和与之配对的标记的激发和发射光谱决定了它是荧光或拉曼供体还是荧光或拉曼受体。用于FRET的分子的例子包括染料荧光素和荧光素衍生物,诸如5-羧基荧光素(5-FAM)、6-羧基荧光素(6-FAM)、荧光素-5-异硫氰酸酯(FITC)、2′,7′-二甲氧基-4′,5′-二氯-6-羧基-荧光素(JOE);罗丹明和罗丹明衍生物,诸如N,N,N′,N′-四甲基-6-羧基罗丹明(TAMRA)、6-羧基罗丹明(R6G)、四甲基-吲哚碳菁(indocarbocyanine)(Cy3)、四甲基-苄吲碳菁(benzindocarbocyanine)(Cy3.5)、四甲基-吲哚二碳菁(Cy5)、四甲基-吲哚三碳菁(Cy7)、6-羰基-X-罗丹明(ROX);六氯荧光素(HEX)、四氯荧光素TET;R-藻红蛋白、4-(4′-二甲基氨基苯偶氮基)苯甲酸(DABCYL)和5-(2’-氨乙基)氨基萘基-1-磺酸(EDANS)。表1列出了示范性的供体和受体对,包括各自的最大吸光度(Abs)和发射(Em)。术语荧光受体包括荧光淬灭剂。示范性的淬灭剂染料是本领域已知的,例如由Clegg,″Fluorescence resonanceenergy transfer and nucleic acids,″Methods 211353-389(1992)所描述的。
表1示范性的FRET对
下面的段落中讨论的方法可以被用于将拉曼或荧光标记连接到寡核苷酸,用于本文中公开的任何实施方案中。荧光或拉曼标记可以被掺入或连接到寡核苷酸探针的5′-端核苷酸、寡核苷酸探针的3′-端核苷酸,以及寡核苷酸探针的非末端或内部核苷酸。在图5的实施方案中,荧光部分被连接到内部核苷酸。
对于5′-端标记的寡核苷酸,通常在合成之前,将荧光或拉曼标记(即,部分)连接到寡核苷酸探针的5′-端核苷酸,然后用已知的程序将标记的核苷酸并入寡核苷酸合成中(例如,Yang and Millar in Methods in Enzymology,Vol.278,第417-444页,(1997))。
对于内部标记,通常在合成期间,使用Amino-Modifier C6 dT(例如来自Glen Research),将氨基修饰的碱基引入到寡核苷酸中。然后在合成后,将该标记的活性酯衍生物偶联到氨基修饰的碱基。这是有益的,因为试剂诸如花菁-染料标记的核苷酸是容易获得的,并且该标记不会干扰探针的杂交。
将荧光或拉曼标记连接到寡核苷酸的可选择的方法描述于Khanna等,美国专利4,351,760;Marshall;Mechnen等,美国专利5,188,934;Woo等,美国专利5,231,191;和Hobbs,Jr等,美国专利4,997,928中。
在本发明的该实施方案的方法中,标记的寡核苷酸探针和目标核酸在产生杂交复合体的条件下杂交,在其中,荧光或拉曼供体和荧光或拉曼受体相互之间相隔一距离,以便响应于对荧光或拉曼供体的激活时,它们能够相互间进行荧光共振能量转移或拉曼散射能量转移,所述激活通过具有预先确定的波长的光来完成。对荧光或拉曼供体和荧光或拉曼受体的激活和检测可以在离散的光波长或波长带诸如通过滤波器来实施。
荧光或共振能量转移的效率据报道与D×10-6成正比,其中D是供体和受体之间的距离(Forster,Z.Naturforsch A,1949,4321-327)。因此,荧光共振能量转移通常发生在10-70埃之间的距离,在一些情况下,发生在30-60埃的距离。在杂交的探针对双链体中,荧光供体和荧光受体通常相距约5个碱基对(bp)至约24bp。当荧光受体是淬灭剂时,分开的距离可以更短些。
在某些方面,荧光或拉曼供体和荧光或拉曼受体在寡核苷酸探针上相距8bp-18bp。例如,荧光或拉曼供体和荧光或拉曼受体相距10bp-13bp。
通过检测由荧光或拉曼供体、荧光或拉曼受体,或者荧光和拉曼供体和受体两者(例如比率)发射的光来进行检测。在一种实施方案中,荧光或拉曼供体和荧光或拉曼受体两者都是荧光团。第一荧光团用合适波长或波长带的光激活,所述波长或波长带是具体荧光团的函数。荧光测量可以例如使用Wallac 1420Victor2 multilabel counter、Perkin Elmer LS50B发光分光光度计或其他合适的仪器完成。在可选择的方面,荧光供体是荧光团,荧光受体是淬灭剂,通过测量荧光团的发射来进行检测。由标记的寡核苷酸探针产生的荧光和/或拉曼光谱是有差别的,这取决于目标核酸分子的核苷酸序列。
本发明可以被用于在一个或多个样品中检测一个以上的目标核苷酸位置上的一个以上的核苷酸发生。目标位置可以位于不同的核酸上,或一个以上的目标位置可以位于一个特定的核酸上。在一个实施方案中,该方法采用一个以上的寡核苷酸探针对来实施,其中至少两个探针的供体/受体对是不同的,并且用于激活所述至少两个不同的探针的荧光或拉曼供体的光的波长或波长带是不同的。因此,在这些方面,使用一群标记的探针来测定一个或多个目标核苷酸的一系列的核苷酸发生。因此,这些方面的方法为分析生物样品中的一系列SNPs提供了强有力的工具。
在另一实施方案中,第一探针或者第二探针被固定在固体表面上。在该实施方案中,并不要求至少两探针对的供体/受体对是不同的,以及并不要求用于激活所述至少两个不同的探针的荧光或拉曼供体的光波长是不同的。通过探针的空间定位来确定每一目标位置上的核苷酸发生的具体类型(identity)和特异性。可选择地,目标核酸被固定或连接在不连续的位置上,以特异性地检测多个多核苷酸目标。对在目标核酸的目标位置上的核苷酸发生的检测可以用于各种应用,包括例如与单核苷酸多态性相关的核苷酸发生、插入、缺失和多突变的检测。
在本发明的各种实施方案中,目标核酸与标记的寡核苷酸探针的杂交可以在各种严紧型条件下实施。例如,可以进行低严紧型杂交。低严紧型杂交通常是在0.15M至0.9M NaCl,在20℃至50℃的温度范围内实施。高严紧型杂交通常是在0.02M至0.15M NaCl,在50℃至70℃的温度范围内实施。应该理解的是,合适严紧型的温度和/或离子强度部分地是由寡核苷酸探针的长度、目标序列的碱基组成、在杂交混合物中存在的甲酰胺、四甲基氯化铵或其他溶剂决定。上述提及的范围是示范性的,具体杂交反应的合适的严紧型常常通过比较阳性和/或阴性对照由经验决定。本领域普通技术人员能够常规性地调整杂交条件,以使得仅仅在精确互补的核酸序列之间发生严紧型杂交。
在某些方面,探针-目标复合体单独地通过光学检测仪,以读取由所述探针-目标复合体产生的荧光信号或拉曼光谱。例如,光学检测仪可以是本文下面公开的MEMS检测装置。使用该装置,利用微机电系统,例如各个探针-目标复合体可以单独地通过,该微机电系统具有足够窄到仅允许一个探针-目标复合体通过的通道。
图5提供了使用标记的寡核苷酸探针来检测目标位置上的核苷酸发生的例子,如在本文实施例部分中更为详细描述的。如图5A中所示,将荧光标记Rox 560和Tamra 570连接到合成的寡核苷酸序列(RTI)510上。标记的寡核苷酸探针被用作探针(RTl)510,以检测目标核酸520(TA)、530(TC)、540(TG)和550(TT)中的单核苷酸差异。这四个目标核酸520、530、540和550仅在对应于结合到标记的寡核苷酸探针510中的TAMRA的核苷酸的核苷酸位置上有差异(在目标核酸520、530、540和550中,分别为A、C、G和T)。在离子强度和pH值方面类似于生理盐水的溶液中,标记的寡核苷酸探针510和目标核酸520、530、540和550形成探针-目标复合体。
当探针分子结合到目标分子时,它们形成双链分子复合体。当碱基配对完全正确时(在中间的碱基中没有错配,如在RTl 510+TA 520中),双螺旋约每10个碱基对旋转一整圈。因为2个标记的位置相距约3-6nm,当它们被适当定向和激发时,可能有共振能量转移。因为2个标记——也称为标签部分——之间的能量转移效率(E)取决于距离(r)E=1/r^6,r大于获得50%效率时的距离(4-6nm)。在中间碱基(即,作为目标核苷酸位置的碱基)中的任何错配能够微微地改变r值,但是E值改变明显。当标记的RTl寡核苷酸探针510与在目标核苷酸位置不包含互补核苷酸的目标核酸(即TC530、TG540或TT550)结合时,这种情况便发生了。E的变化可以使用光学方法检测,并可以用荧光或拉曼光谱分析检测。
图5B显示了来自荧光分析的数据,所述荧光分析使用了图5A的探针-目标系统。在同步扫描光谱(δ=30nm)中的差异表明,在这些探针-目标复合体中,Rox和Tamra之间的相对距离存在差异。这些差异最有可能是由错配的碱基所引起的。
理论上讲,当使用拉曼散射技术——包括SERS拉曼时,可以从上述系统获得更多的信息。拉曼峰的相对强度可以用作不同序列结构的指示。除了核酸,该方法还可以被运用到其他系统,只要能获得合适的标记探针。
在另一方面,针对已知的基因型或已知的分子构建出光谱数据库或文库。例如,针对在已知的单核苷酸多态性(SNPs)处的核苷酸发生,可以产生光谱数据库或文库。如上所述的针对目标分子产生的拉曼光谱或荧光光谱可以与光谱数据库或文库进行比较,以鉴定目标多核苷酸的目标核苷酸位置上的核苷酸发生。
根据这些方面的方法然后可以被用于例如检测生物样品中SNPs处的核苷酸发生。生物样品例如是尿、血液、血浆、血清、唾液、精液、粪便、痰、脑脊髓液、泪、粘液和类似物,如上所述。
因此,本文提供了包括一群标记寡核苷酸探针的拉曼光谱谱型的数据库,所述寡核苷酸探针包括第一标记和第二标记,其中拉曼光谱包括一系列的拉曼光谱组,其中每一组的拉曼光谱由结合到一系列的目标多核苷酸的相同探针序列产生,除了在目标位置外,所述目标多核苷酸包括相同的核苷酸序列。在某些方面,目标位置代表了单核苷酸多态性(SNP)位置。
在某些方面,探针-目标复合体单独地通过光学检测装置,以读取由探针-目标复合体产生的荧光信号或拉曼光谱。使用该装置,利用微机电系统,例如各个探针-目标复合体可以单独通过,该微机电系统具有足够窄到一次仅允许一个探针-目标复合体通过的通道。
图6说明了用于单个探针-目标复合体检测的MEMS装置600。该装置典型地与本文中公开的方法一起使用,用于用包括第一标记(例如FRET供体)和第二标记(例如FRET受体565)的标记寡核苷酸探针检测目标核苷酸位置上的核苷酸发生,其中第一标记和第二标记565是FRET对。当样品含有多拷贝的目标核酸诸如生物样品时,将探针加入到样品中,以形成探针-目标复合体605。这些复合体605分别通过光学检测仪腔640,并记录各自的光谱。然后,例如可以在数据文库中搜索该数据。利用统计学的方法分析信息。例如,该文库可以包括在使用标记的寡核苷酸探针时针对目标核酸的目标位置上的所有已知的核苷酸发生的光谱。
为了能够分离单个复合体,可以使用MEMS装置600。让样品通过窄的分离通道650,以便在统计学上仅一个复合体605占据检测仪腔640。为了增强完全杂交的复合体和具有错配的复合体之间的差异,使用具有可调频率和电压的AC电源620产生交流(AC)场,以诱发错配复合体中的构象变化,错配复合体比完全匹配的复合体相对更具柔性。利用AC场的这些实施方案通常在本发明的利用荧光检测方法的方面中实施。不受理论限制,不同标记之间的相对距离的变化能够影响复合体中的电子分布,或改变光敏感标记之间的能量转移效率,其可以导致更具可区分性的信号。
因此,本发明提供了用于检测目标分子的微机电系统(MEMS)装置,该装置包括用于接收样品的样品入口,所述样品包括生物分子和标记的结合对成员形成的复合体,而标记的结合对成员包括第一标记和第二标记,其中第一标记能够影响第二标记的荧光信号或拉曼光谱,该装置也包括流体连接于该样品入口的分离通道650,以及光学检测装置和光学检测腔640。
检测装置典型地是荧光检测装置或拉曼检测装置,两者都是本领域熟知的。在某些方面,使用拉曼标记,检测装置是拉曼检测系统。
在某些方面,当利用荧光检测装置并利用荧光标记时,该装置还可以包括电极610和交流电源620。电源620可以被用于将AC电流施用于探针-目标复合体,如本文中所述。因此,交流电源620可以在光学检测腔640中产生交流场。
在某些方面,其中利用的是拉曼检测装置,分离通道足够窄,以便在统计学上一次仅一个探针-目标复合体占据检测腔。例如,通道可以在0.5至10微米范围内,因为对于光学检测来说,激光光斑(laser spot)尺寸在正常情况下大于0.3微米,通常1至5微米。在这些方面,光学组件进一步包括用于拉曼光谱术的光源,诸如Ar-离子激光。
MEMS是包括机械元件、传感器、执行器和电子器件的集成系统。所有这些组件通过微加工技术在普通的芯片上制造,所述芯片为硅基或等同的基质(例如,Voldman et al.,Ann.Rev.Biomed.Eng.1401-425,1999)。MEMS的传感器组件可以被用来测量机械、热、生物、化学、光学和/或磁现象,以检测标记。电子器件可以处理来自传感器的信息,并控制执行器组件,诸如泵、阀、加热器等,从而控制MEMS的功能。
MEMS的电子组件可以使用集成电路(IC)工艺(如CMOS、Bipolar工艺)制造。它们可以使用在计算机芯片制造中已知的光刻蚀和蚀刻方法来成型。微机械组件可以用相容的“微机械加工”工艺制造,该工艺选择性地蚀刻掉部分的硅晶片或加入新的结构层,从而形成机械和/或机电组件。
制造MEMS的基本技术包括,在基质上沉积薄膜材料,通过一些石印方法(lithographic method)在膜顶部施加具有一定图案的掩模,并选择性地蚀刻该膜。薄膜的厚度可以在几纳米至100纳米的范围内。使用的沉积技术可以包括化学方法,诸如化学气相沉积(CVD)、电解沉积、外延生长和热氧化,和物理程序,诸如物理气相沉积(PVD)和铸造。也可以使用制造纳米机电系统的方法(参见,例如Craighead,Science 2901532-36,2000)。
在一些实施方案中,仪器和/或检测仪可以被连接到各种充满流体的腔室,诸如微流态通道或纳米通道。设备的这些组件和其他组件可以形成为单个单元,例如,芯片(例如半导体芯片)和/或微毛细管或微流态芯片的形式。作为选择,各个组件可以分别制造并连接在一起。已知用于此类芯片的任何材料都可以用于本公开的设备,例如硅、二氧化硅、聚二甲基硅氧烷(PDMS)、聚甲基丙烯酸甲酯(PMMA)、塑料、玻璃、石英等。
分批制造芯片的技术是计算机芯片制造和/或微毛细管芯片制造领域已知的。此类芯片可以用本领域任何已知的方法制造,诸如照相平版法和蚀刻、激光烧蚀、注塑、铸造、分子束取向生长、浸蘸笔纳米平版法、化学气相沉积(CVD)加工、电子束或聚焦离子束技术或印迹技术。非限定性例子包括常规模塑;二氧化硅的干法蚀刻;电子束平版印刷。制造纳米机电系统的方法可用于某些实施方案(参见,例如Craighead,Science 2901532-36,2000)。各种形式的微制造芯片可以从商业渠道获得,例如Caliper Technologies Inc.(Mountain View,CA)和ACLARA BioSciences Inc.(Mountain View,CA)。
在某些实施方案中,设备的部分或全部可以被选择为对用于拉曼光谱术或荧光检测的处于激发和发射频率的电磁辐射是透明的。合适的组件可以由材料诸如玻璃、硅、石英或光学上清晰的其它任何材料制成。对于可以暴露于各种分析物诸如核酸、蛋白质和类似物的充满流体的室,暴露于这些分子的表面可以通过涂覆被修饰,以便例如将疏水性表面转化为亲水性表面,和/或减少分子吸附到表面。对普通的芯片材料诸如玻璃、硅、石英和/或PDMS的表面修饰是已知的(如美国专利6,263,286)。此类修饰可以包括例如用可商业获得的毛细涂料(Supelco,Bellafonte,PA)、具有各种功能基团(诸如聚环氧乙烷或丙烯酰胺等)的硅烷进行涂覆。
在某些实施方案中,这样的MEMS设备可以被用于制备标记的探针,用于将形成的标记探针与未被并入的组分分离,从而将标记的探针暴露于目标,和/或检测结合到目标的标记探针。
本发明还包括试剂盒,其用于实施测定目标核酸的目标位置上的核苷酸发生的分析。该试剂盒包括标记有第一和第二荧光或拉曼标记的第一寡核苷酸探针,如上文所公开。第一探针基本上或完全地与目标核酸互补。第一和第二荧光或拉曼标记(即供体或受体)是当响应于用预先确定的波长或波长带的光对供体的激活时,能够相互间进行荧光共振能量转移或拉曼能量转移的供体/受体对。该试剂盒还可以包括银胶体或纳米颗粒。此外,该试剂盒可以包括拉曼活性表面。
在本发明的某些实施方案中,实施本发明任何实施方案的方法的系统可以包括信息处理和控制系统。这些实施方案并不限制所使用的信息处理系统的类型。此系统可以被用于分析获自拉曼光谱仪检测系统或荧光检测系统的数据。一个示例性的信息处理系统可以包含计算机,其包括用于信息交流的总线和用于信息处理的处理器。在一个实施方案中,处理器可以选自Pentium系列处理器,包括但不限于PentiumII系列、PentiumIII系列和Pentium4系列处理器,它们可以从Intel Corp.(Santa Clara,CA)获得。在本发明可选的实施方案中,处理器可以是Celeron、Itanium、X-Scale或Pentium Xeon处理器(Intel Corp.,Santa Clara,CA)。在本发明的各种其他实施方案中,处理器可以基于Intel结构,如IntelIA-32或IntelIA-64结构。作为选择,可以使用其他处理器。
计算机还可以包括随机存取存储器(RAM)或其他动态存储装置、只读存储器(ROM)或其他静态存储器,和数据存储装置诸如磁盘或光盘和它的相应的驱动器。信息处理系统还可以包括本领域已知的任何外围设备,例如显示装置(例如阴极射线管或液晶显示器)、文字数字输入装置(例如键盘)、光标控制装置(例如鼠标、追踪球或光标方向键)和通信装置(例如用于连接到以太网、令牌网或其他类型的网络的调制解调器、网络接口卡或接口装置)。
在本发明特定的实施方案中,将拉曼光谱仪检测系统或荧光检测系统连接到信息处理系统。来自拉曼光谱仪或荧光检测仪的数据可以由处理器处理,并将数据储存在主存储器中。处理器可以分析来自拉曼光谱仪或荧光检测仪的数据,以鉴定和/或测定连接到表面的标记探针的序列。通过比对重叠的标记探针的序列,计算机可以编辑目标核酸的序列。
在本发明的某些实施方式中,可以使用客户定制软件包来分析由检测技术获得的数据。在本发明的可选实施方式中,可以使用信息处理系统及公开可利用的软件包,进行数据分析。可用于DNA序列分析的有用软件的非限制性例子包括PRISM3 DNA测序分析软件(Applied Biosystems,Foster City,CA)、Sequencher3软件包(Gene Codes,Ann Arbor,MI)和可通过美国国家生物技术信息机构(NationalBiotechnology Information Facility)获得的各种软件包,网址为nbif.org/links/1.4.1.php。
用于标记探针的制备、使用和/或检测的设备可以被整合入较大的设备和/或系统中。在某些实施方案中,设备可以包括微-电-机械系统(MEMS),如上公开。
下述实施例旨在举例说明本发明而不是限制本发明。
实施例1通过加入胺基团导致的寡核苷酸的拉曼强度增强 该实施例举例说明了通过将胺基团结合到寡核苷酸而提供的增加的强度。寡核苷酸由Qiagen-Operon(Alameda CA)专门合成并经HPLC纯化。使用本领域已知的技术,在寡核苷酸合成期间或之后,将氨基基团加入到3′末端、5′末端或者3′末端和5′末端两者上。使用氩离子激光器产生的514nm光,通过拉曼光谱术检测拉曼信号。
如图4A和4C所示,通过将具有6碳烷基链的伯氨基基团加入到寡核苷酸的末端,由仅仅包括鸟苷重复和随后的胸苷重复的寡核苷酸产生的拉曼光谱的强度被增加。如在图4B中所示,随着加入具有6碳烷基链的伯氨基基团,也能看见类似的增强效果,其中鸟苷和胸苷残基更随机地排列于序列中,其中一个或多个伯氨基基团被结合到探针寡核苷酸的末端或内部。对于包括嘌呤核苷酸的寡核苷酸,由伯胺引起的增强不那么明显(图4D)。因此,该实施例说明,带正电荷的增强子增强了包括嘧啶残基的寡核苷酸的拉曼信号。
实施例2使用荧光对检测单核苷酸错配 该实施例举例说明了一种方法,其中荧光对被用于检测目标核酸和寡核苷酸探针之间的单个核苷酸错配。使用已知的方法,由Qiagen-Operon合成寡核苷酸,对其进行HPLC纯化,并用ROX或TAMRA标记。使用LS55(Perkin Elmer)进行同步荧光扫描。在离子强度和pH方面类似于生理条件的条件下,进行杂交。更具体地,杂交在包括100mM NaCl、10mM Tris HCl和1mM EDTA的杂交反应混合物中在22℃进行。
图5提供了使用标记的寡核苷酸探针检测目标位置上的寡核苷酸发生的例子,如本文中所公开。如图5A中所示,荧光标记Rox 560和Tamra 570被连接到合成的寡核苷酸序列(RTI)510。标记的寡核苷酸探针被用作探针(RTI)510,以检测目标核酸520(TA)、530(TC)、540(TG)和550(TT)中的单核苷酸差异。四个目标核酸520、530、540和550仅在对应于标记的寡核苷酸探针510中结合到TAMRA的核苷酸的核苷酸位置上有差异(在目标核酸520、530、540和550中,分别为A、C、G和T)。在离子强度和pH值方面类似于生理盐水的溶液中,标记的寡核苷酸探针510和目标核酸520、530、540和550形成探针-目标复合体。
图5B显示了来自荧光分析的数据,所述荧光分析使用了图5A的探针-目标系统。在同步扫描光谱(δ=30nm)中的差异表明,在这些探针-目标复合体中,Rox和Tamra之间的相对距离存在差异。所述差异最有可能是由错配的碱基引起的。
尽管本发明已经参考上述实施例而被描述,将被理解的是,对其所作的修饰和变化包含在本发明的精神和范围之内。因此,本发明仅仅由权利要求书限定。
权利要求
1.一种测定目标核酸的核苷酸序列的方法,包括a)将该核酸或其片段与一群捕获寡核苷酸探针接触,以形成包括单链伸出端的探针-目标双链体核酸,所述一群捕获寡核苷酸探针结合到基质的一系列点位置上;b)将所述探针-目标双链体核酸与一群拉曼活性寡核苷酸探针接触,以允许所述拉曼探针与所述单链伸出端结合,其中每一拉曼活性寡核苷酸探针产生独特的拉曼特征;c)使用拉曼光谱术检测结合模板核酸的拉曼活性寡核苷酸探针;和e)鉴定每一个被捕获的拉曼活性寡核苷酸探针的点位置,从而测定所述目标核酸的核苷酸序列。
2.权利要求1的方法,其中每一拉曼活性寡核苷酸探针固有地产生可检测到的拉曼信号,或包括具有独特光谱的拉曼标记或带正电荷的增强子。
3.权利要求2的方法,其中至少一个所述的拉曼活性寡核苷酸包括带正电荷的增强子。
4.权利要求3的方法,其中所述带正电荷的增强子是胺基团。
5.权利要求1的方法,其中至少一个所述的拉曼活性寡核苷酸包括复合有机-无机纳米颗粒。
6.权利要求1的方法,其中被测定的核苷酸序列是在目标核苷酸位置上的核苷酸发生。
7.权利要求6的方法,其中所述目标位置是单核苷酸多态性位置。
8.权利要求1的方法,其中被测定的核苷酸序列是目标片段的相邻位置上的一系列核苷酸发生。
9.权利要求8的方法,其中所述目标片段小于或等于所述捕获寡核苷酸探针和所述拉曼活性寡核苷酸探针的组合长度。
10.权利要求8的方法,其中所述目标片段小于或等于所述拉曼活性寡核苷酸探针的长度。
11.权利要求8的方法,其中通过比对被检测的目标序列,整个目标核酸的核苷酸序列得以测定。
12.权利要求1的方法,还包括将所述捕获寡核苷酸探针与拉曼活性寡核苷酸探针连接起来,所述拉曼活性寡核苷酸探针结合到所述目标核酸的相邻片段上。
13.权利要求1的方法,其中所述目标核酸分离自生物来源,并与所述一群捕获寡核苷酸探针接触,不进行扩增。
14.权利要求13的方法,其中1000或更少数量的拉曼活性寡核苷酸探针分子被检测到。
15.权利要求1的方法,其中所述基质是生物芯片。
16.权利要求1的方法,其中所述拉曼标记使用表面增强拉曼光谱术(SERS)检测。
17.权利要求1的方法,其中将第一群拉曼活性寡核苷酸探针与在一系列点中的第一点上的所述探针-目标双链体核酸接触,并且将第二群拉曼活性寡核苷酸探针与在所述一系列点中的第二点上的所述探针-目标双链体核酸接触,其中所述第一群拉曼活性寡核苷酸探针和所述第二群拉曼活性寡核苷酸探针包括至少一个不同的寡核苷酸探针。
18.权利要求17的方法,其中所述第一群拉曼活性寡核苷酸探针和所述第二群拉曼活性寡核苷酸探针包括至少一个携带有结合到不同寡核苷酸上的相同拉曼标记的拉曼探针。
19.一种检测系统,包括a)包括光源的拉曼光谱仪;b)拉曼活性表面,其与所述光源发生光通信;和c)一群拉曼活性寡核苷酸探针,其包括与带正电荷的增强子关联的不可检测的寡核苷酸主架,其中所述拉曼活性寡核苷酸探针沉积到所述拉曼活性表面上。
20.权利要求19的方法,其中所述带正电荷的增强子是胺基团增强子。
21.权利要求19的方法,其中所述拉曼活性表面是生物芯片。
22.一种检测模板核酸的目标核苷酸位置上的核苷酸发生的方法,包括a)提供结合目标多核苷酸的标记的寡核苷酸探针;其中,所述标记的寡核苷酸探针包括第一标记和第二标记,基于所述第一标记相对于所述第二标记的定向,所述第一标记影响由所述第二标记产生的拉曼光谱或荧光信号;b)将所述标记的寡核苷酸探针与所述目标多核苷酸接触,以形成探针-目标复合体;和c)检测由所述第二标记产生的荧光信号或拉曼光谱,其中在所述目标核苷酸位置上的核苷酸发生影响所述第一标记相对于所述第二标记的定向,从而影响由所述第二标记产生的所述荧光信号或拉曼光谱,和允许测定在所述目标核苷酸位置上的核苷酸发生。
23.权利要求22的方法,其中荧光信号被检测。
24.权利要求23的方法,其中所述第一标记和所述第二标记是FRET对。
25.权利要求24的方法,其中一种标记是TAMRA,另一种标记是ROX。
26.权利要求22的方法,其中拉曼光谱被检测。
27.权利要求26的方法,还包括将所述被检测的拉曼光谱与已知光谱的数据库进行比较,从而鉴定在所述目标多核苷酸的所述目标核苷酸位置上的核苷酸发生。
28.权利要求22的方法,其中所述第一标记和所述第二标记在被标记的探针序列上相距约3-6nm。
29.权利要求22的方法,其中使用一群被标记的探针来测定一个或多个目标核苷酸的一系列核苷酸发生。
30.权利要求29的方法,其中探针-目标复合体单独地经过光学检测仪,从而读取由所述探针-目标复合体产生的荧光信号或拉曼光谱。
31.权利要求29的方法,其中使用微机电系统使各个探针-目标复合体单独地经过光学检测仪,所述微机电系统具有足够窄到仅允许一个探针-目标复合体经过的通道。
32.权利要求22的方法,其中在检测所述探针之前,将交流电(AC)施用于所述探针-目标复合体,从而增加在所述第一探针对所述第二探针荧光信号或拉曼光谱的影响中的差异,所述差异取决于所述目标多核苷酸和所述标记探针在所述目标核苷酸位置是否含有互补的核苷酸。
33.一种检测核酸的方法,包括a)用光照射所述核酸,其中所述核酸包括带正电荷的增强子;和b)检测由照射的核酸产生的拉曼信号。
34.权利要求33的方法,其中所述带正电荷的增强子是胺基团。
35.权利要求33的方法,其中在没有所述带正电荷的增强子的情况下,所述核酸不产生可检测到的信号。
36.权利要求33的方法,其中所述核酸由嘧啶残基组成。
全文摘要
本发明提供了核酸测序方法,该方法基于对寡核苷酸探针的拉曼特征的检测。检测各个被捕获的核酸探针的拉曼特征,可选地,所述核酸探针用拉曼标记或带正电荷的增强子标记。被捕获的探针的序列被用于鉴定被捕获的探针和互补的目标核酸的核苷酸序列,它们然后被比对,并被用于获得核酸序列信息。在另一实施方案中,提供了测定目标核酸的目标核苷酸位置上的核苷酸发生的方法,其利用目标核酸与结合该目标核酸的标记寡核苷酸探针的结合,其中标记的寡核苷酸探针包括第一标记和第二标记,所述第一标记能够影响第一标记的光学特性。
文档编号C12Q1/68GK1898398SQ200480038783
公开日2007年1月17日 申请日期2004年12月24日 优先权日2003年12月29日
发明者X·苏 申请人:英特尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1