核酸测序的方法和手段的制作方法

文档序号:6655883阅读:506来源:国知局
专利名称:核酸测序的方法和手段的制作方法
技术领域
本发明涉及核酸测序。
本发明特别涉及“高密度指纹法(high-density fingerprinting)”,其中将一组核酸探针与含有希望获得序列信息的模板的核酸退火,确定模板中是否存在与每个探针互补的序列,由此提供序列信息。本发明部分基于使用与模板至少部分相关的参考序列,克服了现有测序技术的各种问题,并且使得可以使用标准试剂和仪器在一天内获得非常大量的序列。优选的实施方案可以实现另外的优点。本发明还涉及序列分析的算法和技术,以及测序的仪器和系统。本发明仅使用本领域易于获得的标准实验室仪器即可使大量测序工作实现自动化。
本发明包括一组探针在顺序步骤中杂交以确定每个探针是否与模板杂交,由此形成靶的“杂交谱”,其中每个探针均包含一或多个寡核苷酸分子。优选地,调整探针组和模板链的长度以确保任何给定的模板链与“指示探针(indicative probe)”(精确地与模板链杂交一次的探针)的致密覆盖。本发明进一步包括将获得的杂交谱与预期含有一或多个与模板链相似的序列的参考数据库进行对比,确定模板链在一或多个参考序列内的可能位置。本发明进一步可以比较模板链的杂交谱与在这些位置的预期的杂交谱,从而获得模板链的至少部分序列信息。
尽管在基因组研究中使用许多不同方法,但是迄今为止直接测序仍是最有价值的。事实上,如果可以足够高效地进行测序,则基因组学中所有三个主要学术问题(序列确定、基因型分型和基因表达分析)均可以解决。可以对模型物种进行测序,可以通过完整基因组测序而确定个体基因型,及可以通过将RNA群转变为cDNA并进行测序而对其彻底分析(直接计数每个mRNA的拷贝数)。
可以通过测序解决的其它学术和医学问题包括外因基因组学(epigenomics)(对基因组中甲基化胞嘧啶进行的研究,通过将未甲基化的胞嘧啶经亚硫酸化转变为尿苷,然后比较所得序列与未转变的模板序列进行)、蛋白质-蛋白质相互作用(通过对在酵母双杂交实验中获得的结果(hit)测序进行)、蛋白质-DNA相互作用(通过对在染色体免疫沉淀之后获得的DNA片段测序进行)及许多其它问题。因此,需要高效DNA测序方法。
但是为了代替辅助方法如微阵列和PCR片段分析,需要极高测序通量。例如,活细胞含有大约300,000个拷贝的信使RNA,每个拷贝的平均长度为大约2,000个碱基。因此,为了对甚至一个细胞中的RNA进行完全测序,也需要探查6亿个核苷酸。在由许多不同细胞类型组成的复杂组织中,此任务变得甚至更加困难,因为细胞类型特异性转录体被进一步稀释。为了满足这些要求,需要千兆碱基(Gigabase)日通量。下表示出了对每个实验(指人,除非另有说明)需要的通量的一些估算
本发明在合理的成本内达到上述要求。
附图简述

图1示出凝胶图像,其示出用CviJ*在逐渐增加的时间内切割cDNA样品的结果(泳道4)。观察到平均片段长度逐步降低,接近于100bp(100bp是在大小标准物中的最小片段,泳道3)。最佳切割反应在泳道1上样,大约100bp的片段被纯化。
图2示出衔接物(adapter)连接。泳道1是大小标记,泳道2是未连接的片段,泳道3和4是连接的片段。大多数片段是正确连接的。
图3示出在环化之前(泳道1)和之后(泳道2)的片段样品。泳道3示出纯化后的结果。注意在泳道3中没有接头。
图4示出使用TecanTMLS400在4μm分辨率使用488nm激光和6FAM滤波器扫描的随机阵列玻片(random array slide)的大约0.8×2.4mm截面。点代表从各个环状模板分子中产生的扩增产物。
图5示出通过熔点分析(melting point analysis)测定的短寡核苷酸探针的稳定性图5A示出在100mM tris pH8.0,50mM NaCl中CTAB的作用;图5B示出在TaqExpress缓冲液(GENETIX,UK)中LNA的作用;图5C示出在TaqExpress缓冲液中LNA的特异性。
图5D示出导入简并位置的作用具有5LNA的7聚体(7-mer)(左侧),具有5LNA及2个简并位置的7聚体(中间),具有3LNA及2个简并位置的7聚体(右侧)。
图6示出与随机阵列杂交并通过荧光显微镜观察的FAM-标记的通用20聚体探针(左侧)和TAMRA-标记的7聚体探针(中间)。阵列是用两个模板合成的,这两个模板均应结合所述通用探针,但应该仅有一个模板在序列CGAACCT处结合所述7聚体探针。图象是使用Nikon DS1QM CCD照相机在Nikon TE2000倒置显微镜下以20×放大率记录的。右手侧示出有色复合物,表明正如所预期的所有TAMRA-标记的部分也是FAM阳性的。
DNA测序方法使用荧光双脱氧核苷酸的Sanger测序方法(Sanger et al.PNAS 74no.125463-5467,1977)是最广泛应用的方法,并已经在96-毛细管测序仪、甚至384-毛细管测序仪中成功自动化。然而,这个方法依赖于对大量相应于模板每个碱基位置的片段进行物理分离,并因此不易于超高通量测序(目前最佳的仪器每天可产生大约2百万核苷酸的序列)。
序列也可以通过用选自一组探针的探针探查靶多核苷酸而间接获得。
通过杂交进行的测序(sequencing-by-hybridization,SBH)使用代表直至某一长度所有可能的序列的一组探针(即一组所有k聚体,其中k由可以安装在微阵列表面上的探针数目限制;对于1百万个探针,可以使用k=10)并且与模板杂交。从探针组中重新构建模板序列很复杂,并且杂交动力学的固有的不可预知性质及对更大的模板进行测序所需的极大数目的探针的组合使得所述重新构建更为困难。即使这些问题可以克服,通量也会较低,因为对于每个模板,一个微阵列需要携带几百万探针,并且所述阵列通常不可重复使用。
SBH的另一种方案是将模板置于固体表面上,然后探针组顺序杂交。使用这种方案,可以对许多模板平行测序,但是探针组的大小受方案的连续性限制。结果,只有极短的模板可以被测序。事实上,可以用k聚体探针进行测序的预期长度仅为2k,或者说使用16384个探针(k=7)测序128个核苷酸。根据现实的杂交次数,这种方案不可行。Drmanac et al.Nature Biotech 1998(16)54-8)的作者通过在几百个可以进行平行杂交的单独的膜上复制每个模板而绕开这一问题。然而,这种变通限制了通量,并且对模板制备方法设置了额外的要求。
纳米孔测序(Nanopore sequencing)(US Genomics,U.S.Patent6,355,420)利用这样的事实,即当长DNA分子由于压力通过分离两个反应室的纳米孔(nanopore)时,结合的探针可以根据反应室之间的电导率变化而检测到。通过用所有可能的k聚体的亚集修饰DNA,可以推导部分序列。迄今为止,还没有通过纳米孔方案获得完整序列的可行方案,尽管如果其是可能的,理论上可以达到惊人的通量(在30分钟内1个人基因组的级别)。
已经设计了各种方案以通过合成进行测序(sequencing bysynthesis,SBS)。
为了增加测序通量,希望能观察到在平行的大量模板上每个碱基的掺入,例如在玻璃表面或者类似的反应室上。这通过SBS达到(见例如Malamede et al.US4863849,Kumar US5908755)。SBS有两个方案检测每个掺入的核苷酸中释放的副产物,或者检测永久附着的标记。
焦磷酸测序(Pyrosequencing)(例如W09323564)通过检测以无机二磷酸盐(PPi)形式掺入的每个单体的副产物而确定模板的序列。为了保持所有模板分子的反应同步,在同一时间加入一种单体,并且在下一次加入之前降解未掺入的单体。然而,均聚亚序列(相同单体的串联)引发问题,因为不能防止多重掺入。最后同步被破坏(因为在一小部分模板的掺入缺乏或者掺入错误累加至最终掩盖了真实信号),目前最佳的系统仅可以读出大约20-30个碱基,组合通量为大约200,000个碱基/天。
Sanger测序对于每个模板均要求精密仪器(即毛细管),焦磷酸测序易于在一个反应室中平行进行。US6274320描述了使用滚环扩增以产生附着于光纤上的串联重复的线性单链DNA分子,其在焦磷酸测序反应中被分析,然后可以进行平行处理。理论上,这种系统的通量仅受表面积(模板分子数)、反应速度和成像设备(分辨率)的限制。然而,防止PPi在转变为可检测的信号之前从检测仪中扩散意味着反应位点数在实践中必须被限制。在US6274320中,每个反应均限于在位于光纤尖端的一个微型反应容器中发生,因此将序列数限制为每个光纤1个序列。
焦磷酸测序更多的限制是读出长度较短(<50bp)。这种短序列不总是可用于全基因组测序,并且平衡反应的复杂设置使其难以将读出长度更进一步延伸。据报道只是偶尔及针对特殊的模板读出了多至100bp的长度。
利用检测释放的标记的一个类似方案在US6255083中描述。WO01/23610描述了顺序加入核苷酸并检测用核酸外切酶切下的标记的方案。
检测释放的标记或者副产物的理论上的优点是在随后的步骤中模板保持没有标记。然而,由于信号从模板中扩散,因此难以在一个固体表面如微阵列上平行进行这类测序方案。
本发明在各个方面巧妙地解决了现有技术问题。
本发明一方面提供了如权利要求1所述的一种测序方法,其各个实施方案在从属权利要求和说明书中阐述。
在权利要求1的方法中,通过滚环扩增方法扩增所述模板分子可包括在一定条件下加入聚合酶和三磷酸化物,所述条件是引起扩增引物延长和链置换,以形成包含靶序列多个拷贝的串联重复的扩增产物。
采用的探针组可以是全组或者一部分,如下文进一步阐述。
模板序列的参考序列是一种相似序列。参考序列与模板之间的相似性可以许多方式确定。例如,通常使用相同核苷酸位置的比例确定。更好的确定方法允许插入和缺失(例如Smith-Waterman排列对比)以及提供概率相似性值(例如Durbin et al.″Biological Sequence Analysis″(Cambridge University Press 1998))。
本发明方法要求的相似性程度通过几个因素确定,包括使用的探针数目和特异性、杂交数据的质量、模板长度和参考数据库的大小。例如,模拟示出在假定匹配和错配探针之间具有5℃解链温度差异(1℃变异系数)、256个探针及使用人基因组作为具有100bp模板的参考的情况下,则可以耐受多至5%的序列差异。这例如相应于使用人基因组作为参考对大猩猩基因组进行测序。进一步增加探针数、降低模板长度或者改良区分匹配/错配可以使得更低相似性的序列可以用作参考,例如5-10%、直至10%、5-20%、10-20%或者直至20%。
本发明可以在多种方面应用,包括用于再测序,表达谱分析,分析或者评价遗传可变性,及外因基因组学。
待测序的核酸可以是任何感兴趣的核酸,可以是或者得自或者衍生自整个基因组、BAC、一或多个染色体、cDNA和/或mRNA。
输入分子可以例如是双链或者单链的例如dsDNA、DNA/RNA、dsRNA、ssDNA或者ssRNA。
可如下进行各种实施方案第一步(步骤1)包括片段化,特别是产生短片段的鸟枪文库。可以采用产生片段的酶学和/或机械方法,例如包括酶学方法●用DnaseI降解(在Mn2+存在下),然后填补和/或经酶缩短摇摆的ssDNA末端;●用中等频率的切割酶如MboI等切割;●用非常高频率的切割酶如CviJI、CviJI*等部分切割;●用限制酶的混合物切割;机械方法●French压力(French press);●超声;●剪切;每种方法均随后进行经酶缩短和末端修复;
PCR●使用随机引物序列如六聚物(任选地用进行嵌套PCR(nestedPCR)的序列加尾);●使用简并引物或者低严格条件进行PCR;●使用基因家族特异性引物进行PCR(等)。
在PCR方法中,这个步骤可通过用导入RCA(滚环扩增)引物退火位点的序列对引物加尾而任选地与步骤2组合。
任选地在第一步之后,可以如下文所述进行步骤“X”。
第二步(步骤2)(任选地在步骤X之后)可包括导入RCA引物退火序列。这可以例如通过克隆进载体(例如细菌载体、噬菌体等)中、然后使用位于克隆位点以及引物基序外侧的限制酶切割实现;通过在一或两端连接双链形式的衔接物实现;或者通过在每端连接发夹衔接物(导致同时环化)实现。可以掺入的任选地其它功能特征包括有助于环化和/或辅助寡聚体结合位点,其中辅助寡聚体在接下来的分析中在FRET中可以作为供体或者受体。
任选地在步骤2之后,可以如下文描述进行步骤“X”。
第三步(步骤3)可包括产生单链环状DNA。这可以例如通过如下方法实现在解链和末端至末端自身退火之后连接发夹衔接物形成沙球形状;dsDNA自身连接随后解链;与辅助片段连接形成dsDNA环,随后解链;将发夹衔接物连接至dsDNA的两端形成哑铃形状;使用辅助接头(其也可以作为RCA引物)使ssDNA自身连接。
步骤2和步骤3可任选地组合为一个步骤,例如其中环化同时导入RCA引物退火序列及任何其它希望的特征。
第四步(步骤4)可包括滚环扩增(RCA)。这可以根据如下方案进行●将RCA引物与环状ssDNA退火。所述引物应该携带可用于固定化的反应成分。
●使用RCA引物的附着基团将引物/模板复合物随机固定在激活的阵列的表面。表面上的引物/模板复合物的密度应加以优化以使得表面上的引物/模板复合物的数目最大而在RCA扩增之后不产生重叠产物(如下所述)。表面上的引物/模板复合物的密度可以例如通过引物/模板复合物的浓度、表面上附着位点的密度和/或反应条件(时间、缓冲液、温度等等)控制。
或者●使用RCA引物的附着基团将引物随机固定在激活的阵列表面。表面上引物的密度应加以优化以使得表面上引物/模板复合物的数目最大,而在RCA扩增后不产生重叠产物(如下所述)。表面上引物的密度可以例如通过引物的浓度、表面上附着位点的密度和/或反应条件(时间、缓冲液、温度等)控制。
●使RCA引物与环状ssDNA退火。该引物应该携带可用于固定的反应成分。
在固定和退火后然后●加入聚合酶和4种dNTP以起始滚环扩增。
●任选地在RCA中掺入荧光标记,其在FRET中可作为荧光供体或者受体。
●任选地在RCA中掺入亲和标记,其可用于如下多种目的○通过使用与所述标记具有亲和性的多价接头分子进行内部交联而浓缩RCA产物;○使用与具有所述标记的亲和性的分子缀合的荧光标记进行扩增后标记。
或者,可以在溶液中进行RCA,及可以在扩增后使产物固定化。例如,可以使用相同的引物进行扩增和固定化。另一种选择是可以将携带固定化基团的修饰的dNTP在扩增过程中掺入,然后使用掺入的固定化基团固定扩增的产物。例如,可以使用生物素-dUTP或者氨基烯丙基-dUTP(Sigma)。
第五步(步骤5),序列确定●使用一组非独特的探针顺序杂交以确定阵列上各个模板的全部或者部分序列,如下进一步描述。
●任选地对比每个模板与所研究的样品的代表性序列的数据库的序列信息,从而确定样品中每个靶序列的相对比例和/或确定相对于数据库的任何遗传或其它结构差异。
步骤X已经在上文提及。这是选择片段大小范围的一个步骤(理想地具有极佳的分辨率-1-10%CV)。可以使用的技术包括如下技术●凝胶电泳和洗脱对于dsDNA使用PAGE对于ssDNA使用PAGE琼脂糖凝胶;●层析(例如HPLC、FPLC)●使用亲和标记,例如对于cDNA使用3′-生物素。
这些步骤提供了对于本发明的方面和实施方案的方法的进行步骤的优选和任选的步骤和途径的揭示。本发明提供了所述步骤中揭示的特征的所有组合,相当于本文逐字逐句地阐述了本发明的不同方面和实施方案。
本发明基于新的测序策略的发展,其改良了先前所述的测序方法,消除了大多数难题。这是一个易于平行进行的方案(不需要大小分级分离),并且提供了较长读出长度的可能性。
本发明的一种方法可包括三个基本步骤。首先,从含有多个模板链的样品中产生局部扩增的模板分子的随机阵列(优选在一个步骤完成)。其次,将该随机阵列与一组探针顺序杂交,确定阵列上每个扩增模板中是否存在与每个探针互补的序列。第三,将因此获得的杂交谱与参考序列数据库对比,确定可能的插入、缺失、多态性、剪接变体或者其它感兴趣的序列特点。对比步骤可在检索步骤中进一步分离,随后进行排列对比步骤。
随机阵列合成有许多方法以高密度提供扩增的模板。首先,扩增的模板可以通过机械方式排列,然而这需要对于每个个体模板分子进行单独的扩增反应(因此限制了通量并增加成本)。其次,可以使用凝胶中PCR(in-gelPCR)原位扩增模板(例如US6485944和Mitra RD,Church GM,″In situlocalized amplification and contact replication of many individual DNAmolecules″,Nucleic Acids Research 199927(24)e34所述),然而这种方法需要使用凝胶(因此严重妨碍随后的杂交反应)。
本发明有利地使用滚环扩增反应在一个反应中从含有多个模板分子的样品中合成随机阵列。可以获得直至105-107/mm2的密度。
本发明的实施方案中使用的随机阵列合成方案可包括a.提供具有活化的表面的表面(例如玻璃)。
b.附着引物,优选通过共价键附着,或者可以使用强非共价键(如生物素/链霉抗生物素)而不是共价键附着。
b.加入环状单链模板,优选以适合检测设备的密度加入。
c.使模板与引物退火。
d.使用滚环扩增方法扩增,以产生与表面每个位置均附着的长的单链串联重复的模板。
Lizardi等描述了“使用等温滚环扩增方法进行突变检测和单分子计数”(“Mutations detection and single-molecule counting usingisothermal rolling circle amplification”,Nature Genetics vol 19,p.225)。
对这种方法的修改包括在固定化之前预先将环状模板分子与激活的引物退火,和/或提供在与引物退火时环化的“开环”模板分子,及使用连接反应封闭。
“合适的密度”优选是使得通量最大化的密度,例如保证尽可能多的检测仪(或者检测仪的像素)检测单一模板分子的限制稀释。在任何常规阵列上,理想的限制稀释是使得所有位置中的37%具有一个单一模板(因为泊松(Poisson)分布的形成),剩余位置无模板或者有一个以上模板。
例如,在6μm像素(pixel)大小的Tecan LS400上,7.5×2.2cm反应表面具有4千5百万像素。使用限制稀释(泊松分布),其中37%具有一个单一模板,即1千7百万个模板。对每个模板上150个核苷酸测序在150次循环中产生2.5Gb的序列。若一次循环时间为5分钟,则每天通量为大约5Gbp,等于人体基因组的两个全部序列。实际上,需要一个以上的像素以可靠地检测特征,但是同理应把握检测仪是否是单像素还是多像素。
适于固相RCA的模板应该使得收获量最优化(相对于模板序列的拷贝数),同时提供适于接下来应用的序列。一般而言,优选小模板。特别地,模板可以由一个20-25bp引物结合序列和一个40-500bp插入序列组成,其可以是40-150bp的插入序列。然而,模板也可以是直至500bp或者直至1000bp或者直至5000bp,但是这样将产生较低拷贝数并因此在测序阶段信号较低。引物结合序列可用于环化最初线性的模板及在环化后起始RCA,或者所述模板可以含有一个单独的RCA引物结合位点。
为了增加从滚环扩增的模板中产生的信号,必需将其浓缩。由于RCA产物基本上是由原始环状模板的多如1000或者甚至10000个串联重复组成的单链DNA分子,因此该分子非常长。例如,使用RCA扩增1000次的100bp模板是30μm,并因此将其信号传播越过几个不同像素(假定5μm像素分辨率)。使用较低分辨率的仪器可能是没有帮助的,因为细小的ssDNA产物仅占据30μm像素的非常小部分的区域,并因此可能不能被检测到。因此,希望能将该信号浓缩进较小的区域中。
在(Lizardi等,如上所述)中,RCA产物通过使用表位标记的核苷酸及作为交联剂的多价抗体浓缩。另外的方法包括通过链霉抗生物素交联的生物素酰化的核苷酸。
或者,可以使用DNA浓缩剂如CTAB实现浓缩(见例如BiopolymersNucleic Acid Sciences中Bloomfeld“DNA condensationby multivalent cations”)。
为了将RCA引物寡核苷酸固定在表面上,已经描述了许多不同的方法(见例如Lindroos et al.″Minisequencing on oligonucleotide arrayscomparison of immobilisation chemistries″,Nucleic Acids Research 200129(13)e69所述)。例如,生物素酰化的寡聚体可以附着于链霉抗生物素包被的阵列上,NH2-修饰的寡聚体可以共价附着于环氧硅烷衍生的或者异硫氰酸酯包被的玻璃片,琥珀酰化的寡聚体可以通过肽键与氨基苯基衍生的或者氨基丙基衍生的玻璃偶联,二硫化物修饰的寡聚体可以通过硫醇/二硫化物交换反应固定在巯基硅烷化玻璃上。在文献中描述了更多固定化方法。
通过短探针的顺序杂交的再测序本发明的测序方法包括一组探针的杂交,并对每个探针和靶序列的匹配/错配加以辨别。结果是每个靶序列的“杂交谱”。另外,提供了所述谱位于其中并用于进行排列对比的参考序列,由此可以高精确性确定靶序列与参考序列的差异。
优化探针组和靶序列长度,以便杂交谱可用于(1)明确确定参考序列中的每个靶序列的位置,(2)精确分辨靶序列和参考序列之间的任何序列差异。
为了实现第一个要求,所述探针组应含有足够的信息(理论上的信息)以明确确定靶序列的位置。一个单一的长特异性探针足以确定一个单一的特异性靶序列的位置,但是不能使用,因为这对于每个可能的靶序列需要单独的探针。取而代之是使用短的非独特的探针。优化的探针组使用与每个靶序列的杂交具有50%统计学概率的探针,相当于每个探针1比特(bit)信息。50个这种探针能识别多于1万亿个靶序列。这种探针组具有能复原误差和遗传多态性的额外优点。我们的实验示出一组100个4聚体探针甚至在存在直至10个SNP的条件下也能独特地定位人转录体中的100bp靶序列。
为了实现第二个要求,探针组必须覆盖靶序列并且必须设计为序列的差异导致杂交谱中明确的改变。例如,一组所有可能的4聚体探针以4倍的冗余度完全覆盖任何给定的靶序列。任何单核苷酸改变均导致四个探针的杂交丧失并且产生四个其它特征的探针。
可以计算探针组的灵敏性探针是一或多个寡核苷酸的混合物。该混合物和每个寡核苷酸的序列限定了探针的特异性。探针的稀释因子是其含有的寡核苷酸的数目。探针的有效特异性是通过非简并的寡核苷酸的长度和其与靶序列结合的概率决定的。例如,由4个寡核苷酸组成的6聚体探针具有5个核苷酸的有效特异性,其第一个位置在所有4种核苷酸中变化(即是完全简并的)。
一组探针是一系列具有这样的性质的k聚体探针,即任何给定k长度的靶序列与该组中的一个并且仅有一个探针杂交。因此,一组探针是一系列完全的和非冗余的探针。
探针组的复杂性C是组中探针的数目。
一组内的一个位置的灵敏性是其在该位置能够区分的不同靶序列的集合(set)。例如,其中探针在一个位置是GC混合的或者AT混合的一组探针(以GC/AT表示)对于G-A、C-A、C-T和G-T差异(即转换)敏感,但是对颠换(G-C等)不敏感。
当用全部的探针组探查时,保证靶序列中每个位置均被组中每个位置探查,即由k交错重叠探针探查。然而,每个位置灵敏性可以不同,因此靶序列中的一些差异仅可通过低于k的探针检测。
例如,(GCAT)(GC/AT)(GC/AT)(G/C/A/T)(G/C/A/T)(GC/AT)(GC/AT)(GCAT)确定的探针组有8个位置(即k=8)。第一个和最后一个位置是完全简并的,因此被检测的靶序列中这些位置无改变。在每个探针中的6个位置检测到转换(GCAT),而仅在2个位置检测到颠换(GACT)。有效特异性可以通过将每个位置的有效特异性相加而计算0+0.5+0.5+1+1+0.5+0.5+0=4bp。
对于不是很小的靶序列,通常是探针在靶序列中重复的情况。这些探针丧失其对于在任何单一位置发生改变的灵敏性,因为其仍与另一个位置杂交。
给定靶序列的长度L,我们可以计算存在至少一个对于该位置的改变敏感的探针的概率(对于靶序列中的每个位置)。首先,我们需要查明有多少探针对于无重复的靶序列中感兴趣的改变敏感。将此称作kc,在先前的实施例中kc对于转换为6,对于颠换为2。
然后,我们注意到在靶序列中一或多个其它位置存在任何给定探针(即是重复的)的概率p(R)是P(R)=1-(C-1C)L-1]]>不是所有2kc灵敏性探针均是重复的的概率p(S)是P(S)=1-P(R)2kc]]>指数是2kc,因为任何改变均导致kc个探针消失及出现kc个新的探针。
给定靶序列长度,我们现在可以计算灵敏性。例如,C=256,kc=2,L=120,则p=98%,即具有256个探针的一组探针对于98%的颠换敏感(对于100%转换敏感,kc=6)。如果我们在组中仅使用一半的探针,由此kc=1,则p=86%(对于颠换)和99.7%(对于转换)(kc=3)。在如人这样的物种(具有63%转换)中整体平均灵敏性为95%。
只要SNP的数目与靶序列长度相比较低,即只要在一个探针长度内不出现多个SNP,则该理论是严格有效的。在实际的实验中,这个理论几乎总是正确的例如,人基因组DNA含有大约1个SNP/1000个核苷酸,因此在7个碱基中具有2个SNP是非常不可能的。
实际上,我们可能需要至少两个灵敏性探针以记录SNP(即因为杂交数据易于出错)。在这种情况中,概率P(S)成为1-p(R)2kc-1,此计算依旧是直接简单明了的。
当(为了节省时间和试剂)使用探针组亚集时,希望保证靶序列中的任何位置均在一条链或者另一条链上被探查。换句话说,我们寻求一探针亚集,其保证未被探查的任何k聚体均在相反链上被探查。这种亚集可以通过将(G/A)、(C/T)、(G/T)或者(C/A)置于中间位置而获得。例如,(G/A)不能探查靶序列中的G和A,在这种情况中保证相反链是C或T,它们可以被探查。其它变化也是可能的。
(GC/AT)简并位置具有两个希望的特征。首先,其保证了每个探针中的各个寡聚体具有相似的解链温度(因为它们全部是GC或者全部是AT)。其次,所述位置对于代表人类全部SNP的63%的转换敏感。
短寡聚体探针的杂交在本发明中,设想将一组探针与靶序列顺序杂交。为了限制探针组的复杂性,希望保持所述探针较短,优选仅具有3-6bp有效特异性。在此我们描述杂交短寡聚体探针的必要条件。
所述探针被稳定化以有效杂交。另外,稳定化可有助于探针与靶序列中可能存在的任何内部二级结构竞争。稳定化可以通过许多不同途径实现。
●通过杂交反应中的稳定化添加物例如盐、CTAB、镁、稳定化蛋白质实现。
●通过加入延伸探针的长度而不增加其复杂性的简并位置实现。例如,被延伸了“N”位置的6聚体探针将会真正是4个寡核苷酸的混合物,每个长度为7个碱基。一个(GC/AT)位置-表示G和C的混合物或者A和T的混合物-使得探针延伸一个碱基,同时仅使复杂性加倍(而不是4倍)。
●通过修饰探针化学性质,例如通过修饰锁定的核酸(Exiqon,Denmark)、肽核酸和/或小沟结合蛋白(Epoch Biosciences,US)实现。
●组合上述方法,例如具有LNA的简并探针在CTAB缓冲液中杂交。
在这些方法中,首先也要稳定靶序列(因此潜在地诱导防止杂交的稳定的二级结构)。优选选择性稳定探针的方法。
检测杂交已知许多检测杂交的方法。
●直接荧光。将探针标记并且通过与靶序列杂交的探针的局部浓度增加而检测杂交。这需要高放大倍率共焦光学器材(confocal optics)或者全内反射激发(total internal reflection excitation,TIRF)。
●能量转移。将探针用猝灭剂或者供体标记,及将靶序列用相反供体或者猝灭剂标记。通过降低供体荧光和/或增加猝灭剂荧光检测杂交。
●单碱基延伸。将杂交的探针作为引物进行掺入荧光染料的单碱基延伸反应(或者,释放的PPi可以如在焦磷酸测序中检测)。
一种优选的方法如下所述将探针用在落射荧光显微镜或者激光扫描仪中可以检测的荧光团例如Cy3标记。许多其它合适的染料可以商购。将探针与阵列在优化的浓度杂交,所述优化使得可以检测高出在所有液体中存在的背景的具有杂交的阵列特征的浓度局部增加。例如,可以使用400nM,或者根据光学设置探针可以在1nM-500nM或者500nM-5μM浓度杂交。这种检测方案的优势是其避免了洗涤步骤,由此检测可以在均衡杂交条件下进行,便于辨别匹配/错配。
能量转移方案如下所述所述靶序列携带与荧光供体持久杂交的辅助寡核苷酸。该辅助寡核苷酸设计为可以经受住使短探针解链的洗涤。所述探针携带一个强猝灭剂(dark quencher)。例如,所述供体可以是荧光素,所述猝灭剂是Eclipse Dark Quencher(Epoch Biosciences)。已知许多其它供体/猝灭剂对(见例如Haugland,R.P.,′Handbook of fluorescent probes andresearch chemicals′,Molecular Probes Inc.,USA)。一般而言,希望探针具有长Frster半径,能长距离猝灭。杂交通过在与探针杂交时供体荧光团的猝灭而检测。
杂交谱检索和对比排列给定靶序列的杂交谱,我们首先查寻靶序列在参考序列中的位置以查明序列差异。该检索可以通过用与靶序列相同大小的窗口扫描参考序列、对每个位置计算预期杂交谱、并将该位置的预期杂交谱与观察到的杂交谱进行对比简便地而进行。报告最高得分的位置。
由于本发明的方法在短时间内产生非常大量的杂交谱,因此优化检索步骤是重要的。例如,在一个目前的执行程序中,在高端工作站杂交谱检索每秒进行12亿匹配,我们估计需要10个工作站以跟上一个单一测序仪器。本发明另一方面使用可编程的硬件加速检索,即现场可编程门阵列(field-programmable gate arrays,FPGA)。通过将检索算法翻译为Mitrion-C(Mitrion AB,Sweden),在一个单一工作站计算机中仅使用两个FPGA芯片即可达到加速30倍。
一旦发现一或多个可能位置,我们就寻找可以解释观察到的和预期的杂交谱之间任何差异的对参考序列的修饰。我们在这个阶段可以将相关修饰导入参考序列中,例如SNP、短插入/缺失、长插入/缺失、微卫星、剪接变体等等。对于每种修饰或者修饰的组合,我们再次计算观察到的和预期的杂交谱之间相似性的分值。报告最可能修饰的参考序列。检索极大参数空间的方法为本领域所已知,例如Gibb取样、Markov-chain Monte Carlo(MCMC)和Metropolis-Hastings算法。
当对比杂交谱时,可以使用简便的二进制重叠分值(分值1代表每个探针在两个杂交谱中杂交或不杂交,0代表其它),或者更高级的统计学方法可以利用杂交谱重叠的渐进或概率特征。
在多个靶位于所述靶序列的相同位置的情况中,可以进行较高水平分析以评价在任何序列差异中的可信度。
用于自动化高通量测序的装置本发明的方法特别适于自动化,因为本发明的方法可以通过将许多试剂溶液循环通过置于任选地具有热控制系统的检测仪之上或之中的反应室而简便地进行。
在一个实施例中,所述检测仪是CCD成像仪,其可例如被经引导穿过滤管(filter cube)的白光操纵以产生适于与每一个靶序列结合的荧光团的分离的激发光路和发射光路。例如可以使用KodakKAF-16801E CCD,其具有16.7百万像素,成像时间为~2秒。在这种仪器上每日测序通量可高至10Gbp。
反应室提供●光学器件易于接触●密闭的反应室●向反应室中注入及从中除去试剂的入口
●使得空气和试剂进出所述反应室的出口反应室可以以如图3所示标准微阵列玻片形式构建,适于插入成像仪器中。反应室可以插入所述仪器中并在全部测序反应过程中保持在其中。一个泵和试剂瓶提供根据固定方案的试剂,一台计算机控制该泵和扫描仪,交替进行反应和扫描。任选地,所述反应室可以是温度控制的。还任选地,所述反应室可以置于定位台(positioning stage)上,以使得可以对反应室上的多个位置成像。
分配器单元(dispenser unit)可以与机动阀门连接以指导试剂的流动,全部系统的运转是在计算机控制下。整合系统由扫描仪、分配器、阀门和贮存器及控制计算机组成。
根据本发明的另一方面,提供了一种进行本发明方法的仪器,所述仪器包括能检测掺入的或释放的标记的成像组件,用于把持一或多个附着的模板的反应室,由此所述模板在每次循环中可接近成像组件至少一次,为反应室提供试剂的试剂分配系统。
反应室可以提供及成像组件能分辨如下密度的附着的模板至少100/cm2,任选地至少1,000/cm2、至少10000/cm2或者至少100,000/cm2,或者至少1,000,000/cm2、至少10,000,000/cm2或者至少100,000,000/cm2。
成像组件可例如使用选自如下的系统或者装置光电倍增管、光电二极管、电荷耦合装置、CMOS成像芯片、近场扫描显微镜、远场共焦显微镜,宽视野落射光显微镜和全内反射显微镜。
成像组件可检测荧光标记。
成像组件可检测激光诱导的荧光。
在本发明的仪器的一个实施方案中,反应室是一个密闭的结构,包括透明表面、盖子和将反应室附着于试剂分配系统的端口,所述透明表面在其内表面上把持模板分子,并且所述成像组件能通过所述透明表面成像。
本发明的另一方面提供了单链DNA分子的随机阵列,其中每个所述分子由初始序列的至少两个串联重复的拷贝组成,每个所述分子固定在表面上的随机位置,密度为103-107/cm2,优选104-105/cm2,或者优选105/cm2-107/cm2,每个所述初始序列代表一个来自包含单链或双链RNA或者DNA分子的混合物的初始靶DNA或者RNA文库的随机片段,所有所述DNA分子的所述初始序列具有大约相同的长度。
通常地,所述分子包含初始序列的至少100个串联重复拷贝,通常包含至少1000、2000、优选直至20000个串联重复拷贝。所述分子可包含初始序列的50个或更多个串联重复拷贝,它们可以使用标准显微镜术检测。
优选地,所述初始序列在50%CV内具有相同长度,优选在5-50%CV内、优选10%CV内、优选5%CV内具有相同长度,即所述分布是变异系数(CV)为例如5%的分布。CV=标准偏差除以平均值。初始序列可具有相同长度。
初始靶文库可以例如是或者包括一或多个RNA文库、mRNA文库、cDNA文库、基因组DNA文库、质粒DNA文库或者DNA分子的文库。
本发明另一方面提供了一系列或者一组探针,其中每个探针由一或多个寡核苷酸组成,每个所述寡核苷酸被稳定化,每个所述寡核苷酸携带一个报道成分,每个探针的有效特异性为3-10bp,所述探针组在统计学上与靶序列中全部位置的至少10%杂交。
所述有效特异性可以是4-6bp。所述有效特异性可以是3、4、5、6、7、8、9或者10bp。
所述探针组在统计学上与靶序列中全部位置的至少25%、至少50%、至少90%杂交,或者与靶序列中全部位置的100%杂交。
所述探针组可以与靶序列或其反向互补序列中全部位置的100%杂交,由此靶序列或其反向互补序列中每个位置均与所述探针系列中的至少一个探针杂交。
所述靶序列可以是任意靶序列。
本发明的探针组可以通过简并位置的导入、锁定的核酸单体的导入、肽核酸单体的导入及小沟结合物的导入中的一或多种方法加以稳定。
所述报道成分可例如选自荧光团、猝灭剂、强猝灭剂、氧化还原标记、以及可以通过酶或化学手段标记的化学反应基团,例如用于用标记的核苷酸进行引物延伸的游离3′-OH,或者用于在杂交后进行化学标记的胺。
应用实施例基因表达谱分析通过对cDNA片段进行随机测序,相应RNA的表达水平可以通过计数每个RNA中出现的片段的数目而量化。同时可以揭示结构特征(剪接变体、5′/3′UTR变体等)和遗传多态性。
遗传谱分析通过注意与参考基因组相比序列差异出现情况,可以使用对全基因组的鸟枪测序方法确定个体基因型。例如,以这种方式可易于发现SNP和插入/缺失及确定所述SNP和插入/缺失的基因型。为了区别杂合位点,需要密集的片段覆盖以保证两个等位基因均被测序。
技术人员通过本发明的教导将显而易见本发明的其它方面和实施方案。说明书中引用的所有文献均通过引用并入本文。
实施例1制备DNA模板以进行CANTALOUPE输入双链DNA模板。
模板分级分离我们使用了限制酶CviJ I*(EURx,Poland),其识别5′-GC-3′并在之间切割出平端。我们如下建立限制反应
将反应在37℃温育1小时。
切割的DNA用PCR cleanup试剂盒(Qiagen)根据厂商指导进行纯化。
我们在2%琼脂糖凝胶上分析了一个级分,并针对模板和酶的特异批次鉴别最佳反应条件(见图1,泳道4-8)。
我们重复了最佳切割反应以获得共5μg DNA(图1,泳道1)。
模板大小选择我们在8%非变性PAGE(高40cm,厚1mm)上纯化了DNA。每个孔均加样不超过1μgDNA,并包括一95-105bp阶梯,表明感兴趣的区域。所述阶梯由95、100和105个碱基对的3个PCR片段组成。
我们将凝胶用SYBR金染色并在扫描仪上分析结果,切下感兴趣的区域(95-105bp)并将希望范围的DNA用ElutaTubeTM(Fermentas)根据厂商指导进行电洗脱。
衔接物连接使用一种衔接物进行连接5′GCAGAATGCGCGGCCGCCTTAG 3′3′CGTCTTACGCGCCGGCGGAATC 5′其含有5’磷酸和一个内部Not I位点。
我们制备了如下连接混合物
在25℃温育15分钟。
使用PCR cleanup试剂盒(Qiagen)根据厂商指导进行纯化。见图2所示。
Not I限制消化建立如下反应
在37℃温育4小时或者过夜。
将样品使用PCR cleanup试剂盒(Qiagen)根据厂商指导进行纯化。我们重复PCR cleanup纯化直至尽可能多地除去过量的衔接物。
模板的环化我们通过在存在如下接头寡聚体的条件下使样品变性形成单链环5′-CGTCTTACGCGCCGGCGGAATCCGTCTTACGCGCCGGCGGAATC-3′。
如下进行混合
加热至93℃持续3分钟,置于冰上直至冷却,快速旋转。
加入50μl的2×Quick连接缓冲液(NEB)和1μl Quick连接酶(NEB),简单混合。
在25℃温育15分钟。
在此阶段形成环,样品可以进行RCA。见图3所示。
固定化将5μM RCA引物(与具有额外的5′-AAAAAAAAAA-C6-NH-3′尾的环化接头相同,其中C6是一个6碳接头,NH是胺基)在具有15%DMSO的100mM碳酸盐缓冲液pH9.0中固定在SAL-1玻片(AsperBiotech,Estonia)上。
在23℃温育10小时。
玻片表面上的剩余活性位点通过首先在具有15mM谷氨酸的碳酸盐缓冲液(如上述,但浓度为40mM)中在30℃浸泡40分钟,然后在2mg/ml聚丙烯酸pH8.0中在室温浸泡10分钟进行封闭。
将环状模板在缓冲液1(2×SSC,0.1%SDS)中在30℃退火2小时,然后在缓冲液1中洗涤20分钟,接着在缓冲液2(2×SSC,0.1%Tween)中洗涤30分钟,然后在0.1×SSC中漂洗,接着在1.5mM MgCl2中漂洗。
扩增在Phi29缓冲液、1mM dNTP、0.05mg/mL BSA和0.16u/μL Phi29酶(均得自NEB,USA)中在30℃进行滚环扩增2小时。
与环化接头互补的并用6-FAM标记的报道寡核苷酸如上述退火,随后在缓冲液3(5mM Tris pH8.0,3.5mM MgCl2,1.5mM(NH4)2SO4,0.01mM CTAB)中浸泡。图4示出小部分具有清楚可见的单个RCA产物的玻片。
探针组杂交根据如下方案设计每个探针(GCAT)(GC/AT)(GC/AT)(G/C/A/T)(GC/AT)(G/C/A/T)(GC/AT),每个探针在第2、4和6位均具有锁定的核酸(Exiqon,Denmark)及在3’末端具有Eclipse强猝灭剂(EpochBiosciences,USA)。
将探针在100nM缓冲液3中杂交。对于每个探针使用温度梯度以发现用于辨别匹配/错配的最佳温度。图5示出两个匹配/错配对的杂交结果。
权利要求
1.一种核酸测序方法,包括提供含有多个环状单链DNA模板分子的DNA样品,每个模板分子均包含一个引物退火序列和一个靶序列;形成一个固定化的和扩增的模板分子的随机阵列,所述阵列如下形成将所述模板分子与扩增引物接触以与所述引物退火序列退火,从而形成退火的引物/模板复合物,通过滚环扩增方法扩增所述模板分子,通过在与模板退火之前固定扩增引物、在扩增之前固定引物/模板复合物或者在扩增之后固定扩增的模板,确保所述扩增的模板分子固定在一固体支持物上;用一组探针在测试条件下探查串联重复的扩增产物,确定每个探针在测试条件下是否与靶序列杂交,从而获得靶的杂交谱;将所述杂交谱与包含多个参考序列的参考数据库中的参考序列的杂交谱相对比,其中所述参考数据库预期含有一或多个针对所述DNA模板序列的参考序列,从而确定在一或多个参考序列中所述靶序列的可能的一或多个位置;任选地通过对比实际杂交谱与在所述一或多个位置的预期的杂交谱,计算所述靶序列的可能序列和/或与一或多个参考序列对比在所述靶序列的序列中存在的差异。
2.权利要求1的方法,包括计算与一或多个参考序列对比在所述靶序列的序列中存在的差异,其中所述差异是选自如下的一或多个差异或者差异组合单核苷酸多态性、插入、缺失、可变剪接、可变转录起始位点、可变聚腺苷酸化及微卫星。
3.权利要求1或2的方法,其中所述探针组包括具有3-10个碱基有效特异性的探针。
4.权利要求3的方法,其中所述有效特异性是4-6个碱基。
5.权利要求1-4任一项的方法,其中调整每个靶序列的大小和全部或者部分探针的有效特异性,以便每个探针与每个靶序列杂交的统计学概率为5%-95%。
6.权利要求5的方法,其中所述统计学概率在10%-90%之间。
7.权利要求6的方法,其中所述统计学概率在25%-75%之间。
8.权利要求7的方法,其中所述统计学概率在40%-60%之间。
9.权利要求1-8任一项的方法,包括用多组探针探查,其中每组探针中的每个探针与其它每组探针中的每个探针均不同。
10.权利要求1-9任一项的方法,其中所述参考数据库是从与靶序列相同物种的核酸序列中汇总的。
11.权利要求1-9任一项的方法,其中所述参考数据库是从与靶序列不同物种的核酸序列中汇总的。
12.前述任一项权利要求的方法,包括形成单链DNA分子随机阵列,其中每个所述分子由一个初始序列的至少两个串联重复拷贝组成,每个所述分子以103-107/cm2的密度固定在表面上的随机位置,每个所述初始序列代表一个来自包含单链或双链RNA或DNA分子的混合物的初始靶DNA或RNA文库的随机片段,所有所述DNA分子的所述初始序列具有大约相同的长度。
13.权利要求12的方法,其中每个分子均包含一个初始序列的至少1000个串联重复拷贝。
14.权利要求12或者13的方法,其中所述密度为105/cm2-107/cm2。
15.权利要求12-14任一项的方法,其中所述初始序列在50%CV内具有相同长度。
16.权利要求15的方法,其中所述初始序列在10%CV内具有相同长度。
17.权利要求16的方法,其中所述初始序列在5%CV内具有相同长度。
18.权利要求12-17任一项的方法,其中所述初始靶文库是RNA文库、mRNA文库、cDNA文库、基因组DNA文库、质粒DNA文库或者DNA分子文库。
19.前述任一项权利要求的方法,其中在探针组中每个探针均由一或多个寡核苷酸组成,每个所述寡核苷酸均被稳定化,每个所述寡核苷酸均携带一个报道成分,每个探针的有效特异性为3-10bp,这组探针是这样的,即一个随机或者任意的靶序列中的全部位置的至少10%在统计学上与这组探针中的至少一个探针杂交。
20.权利要求19的方法,其中所述有效特异性为4-6bp。
21.权利要求19或者20的方法,其中所述探针组在统计学上与靶序列中全部位置的至少25%杂交。
22.权利要求21的方法,其中所述探针组在统计学上与靶序列中全部位置的至少50%杂交。
23.权利要求22的方法,其中所述探针组在统计学上与靶序列中所有位置的至少90%杂交。
24.权利要求23的方法,其中所述探针组在统计学上与靶序列中所有位置的100%杂交。
25.权利要求19-24任一项的方法,通过简并位置的导入、锁定的核酸单体的导入、肽核酸单体的导入和小沟结合物的导入中的一或多种而进行所述稳定。
26.权利要求19-25任一项的方法,其中所述报道成分选自荧光团、猝灭剂、强猝灭剂、氧化还原标记、和可以通过酶或者化学手段标记的化学反应基团,例如用于用标记的核苷酸进行引物延伸的游离3′-OH,或者用于在杂交后进行化学标记的胺。
27.前述任一项权利要求的方法,其中使用谱检索仪器比较杂交谱,所述仪器包括附于主机上的现场可编程门阵列(FPGA)和一个计算机可读存储器件,其中所述FPGA执行谱检索,所述计算机可读存储器件存储参考核苷酸序列和一组杂交谱,所述主机将参考核苷酸序列和每个所述杂交谱提供给所述FPGA,当所述参考核苷酸序列和杂交谱被提供给FPGA时,所述FPGA写入所述计算机可读存储器以存储所述杂交谱和所述参考核苷酸序列之间最佳匹配的位置。
28.一种计算机处理器,其被编程为控制权利要求1-27任一项的方法。
29.一种计算机可读器件,其携带用于权利要求28的计算机处理器的程序。
30.一种计算机处理器,其被编程为通过执行权利要求1-27任一项的方法提供核酸的序列信息。
31.一种计算机可读器件,其携带用于权利要求30的计算机处理器的程序。
32.单链DNA分子的随机阵列,其中每个所述分子由一个初始序列的至少两个串联重复拷贝组成,每个所述分子以103-107/cm2密度固定在表面上的随机位置,每个所述初始序列代表一个来自包含单链或双链RNA或DNA分子的混合物的初始靶DNA或RNA文库的随机片段,所有所述DNA分子的所述初始序列具有大约相同长度。
33.权利要求32的随机阵列,其中每个分子包含一个初始序列的至少1000个串联重复拷贝。
34.权利要求32或33的随机阵列,其中所述密度是105/cm2-107/cm2。
35.权利要求32-34任一项的随机阵列,其中所述初始序列在50%CV内具有相同长度。
36.权利要求35的随机阵列,其中所述初始序列在10%CV内具有相同长度。
37.权利要求36的随机阵列,其中所述初始序列在5%CV内具有相同长度。
38.权利要求32-37任一项的随机阵列,其中所述初始靶文库是RNA文库、mRNA文库、cDNA文库、基因组DNA文库、质粒DNA文库或者DNA分子文库。
39.探针组,其中每个探针由一或多个寡核苷酸组成,每个所述寡核苷酸被稳定化,每个所述寡核苷酸携带一个报道成分,每个探针的有效特异性为3-10bp,这组探针是这样的,即一个随机或者任意的靶序列中的全部位置的至少10%在统计学上与这组探针中的至少一个探针杂交。
40.权利要求39的探针组,其中所述有效特异性为4-6bp。
41.权利要求39或者40的探针组,其在统计学上与靶序列中所有位置的至少25%、至少50%、至少90%杂交。
42.权利要求41的探针组,其在统计学上与靶序列中所有位置的100%杂交。
43.权利要求39-42任一项的探针组,其通过简并位置的导入、锁定的核酸单体的导入、肽核酸单体的导入和小沟结合物的导入中的一或多种而稳定。
44.权利要求39-43任一项的方法,其中所述报道成分选自荧光团、猝灭剂、强猝灭剂、氧化还原标记、和可以通过酶或者化学方式标记的化学反应基团,例如用于用标记的核苷酸进行引物延伸的游离3′-OH,或者用于在杂交后进行化学标记的胺。
45.一种谱检索仪器,其包含附于主机上的现场可编程门阵列(FPGA)和一个计算机可读存储器件,其中所述FPGA执行谱检索,所述计算机可读存储器件存储参考核苷酸序列和一组杂交谱,所述主机将参考核苷酸序列和每个所述杂交谱提供给所述FPGA,当参考核苷酸序列和杂交谱被提供给所述FPGA时,所述FPGA写入所述计算机可读存储器以存储所述杂交谱和所述参考核苷酸序列之间最佳匹配的位置。
全文摘要
本发明涉及核酸测序,特别涉及高密度指纹法(high-density fingerprinting),其中将一组核酸探针与含有希望获得序列信息的模板的核酸退火,确定模板内是否存在与每个探针互补的序列,由此提供序列信息。使用与模板至少部分相关的参考序列。
文档编号G06F19/20GK101014719SQ200580016733
公开日2007年8月8日 申请日期2005年3月17日 优先权日2004年3月25日
发明者斯滕·林纳尔松 申请人:基尼宗生物科学公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1