cDNA文库制备的制作方法

文档序号:432444阅读:1134来源:国知局

专利名称::cDNA文库制备的制作方法cDNA文库制备发明领域总的来说,本发明涉及分子生物学领域,且具体涉及cDNA和DNA文库的生成。发明背景通过测序对转录物进行特征分析(profiling)的目前方法已限于全长cDNA克隆的Sanger测序、和/或来自每种mRNA的5'末端或3'末端的小"标记"的测序。这些测序方法是劳动密集型的,并且它们的普遍采用已被技术限制阻碍。一般地,用于测序mRNA的方法包括生成cDNA文库和测序cDNA文库的插入片段。适合于快速测序形式的cDNA文库产生是具有许多技术上困难步骤的长期繁重过程。总的来说,用于从细胞中分离mRNA的一般程序需要(1)破裂细胞以释放细胞内容物,(2)从细胞中分离总RNA,(3)通过使提取的RNA经过寡脱氧胸苷酸纤维素柱来选择mRNA群体,和(4)使用依赖于RNA的DNA聚合酶(逆转录酶)从RNA合成cDNA,以合成cDNA的第一条链,(5)通过依赖DNA的DNA聚合酶例如大肠杆菌(Ec'o/,)polI克列诺片段,从cDNA合成第二条链以产生双链cDNA,(6)将双链cDNA克隆到载体内,和(7)将载体转染到宿主(例如,细菌)内。在RNA存在的所有阶段,必需非常小心以确保制剂不接触到可以破坏RNA的活性核糖核酸酶。核糖核酸酶(RNA酶)是非常稳定的,因此即使mRNA制剂中非常少量的活性酶也将造成问题,例如RNA降解。因为cDNA克隆程序的目的是获得包含基因完整编码序列的"全长"cDNA克隆,所以使用维持mRNA完整性的程序是极其重要的。cDNA文库5,末端表现不足(underrepresentation)是目前技术的固有限制,且由许多因素引起。一种最重要的因素是通过逆转录酶的延长过程的随机失效。因为逆转录酶从mRNA的3'移动到5,末端,所以一定百分比的逆转录酶可能从RNA模板解离,从而引起cDNA合成过早终止。另一种起作用的因素是逆转录酶在mRNA二级结构区域暂停、减緩或停止。此外,3,末端偏倚也由污染性RNA酶引入,所述RNA酶经由降解去除mRNA的5,末端。这些因素的累积结果是mRNA的3'末端比更靠近5,末端的序列在统计学上更可能在目前的cDNA文库中表现。对于长转录物,这种3,偏倚进一步得到增强,因为更长的转录物对于每种3'偏倚因素更易感。目前cDNA文库生产技术的另外缺点包括使用克隆载体和宿主细胞以扩增文库。宿主载体复制和/或宿主细胞/病毒生长可能受cDNA插入片段影响,且某些序列在细菌或病毒cDNA文库中将表现不足。例如,当cDNA文库在宿主细胞中进行复制时,长cDNAs和具有明显重复或二级结构潜力的cDNAs可能重排或表现不足。此外,如果cDNA编码致死基因,那么它在宿主细胞中的生长可能受到损害。此外,如果cDNA文库来自共同宿主细胞,如大肠杆菌cDNA文库,那么宿主细胞RNA可能污染结果。不使用任何宿主细胞的方法可以避免这个问题。一般地,例如在涉及病毒或小組织或细胞样品的工作中,可用量的起始RNA或DNA可能被极大地限制(例如纳克级)。来自此类有限量的原材料的DNA或cDNA文库制备经由本领域目前使用的方法可能是非常困难的或甚至是不可能的。因此本领域需要使得能够从少量起始核酸制备高质量DNA或cDNA文库的方法。发明概述本发明提供了用于形成单链cDNA文库的新方法,所述方法通过使起始RNA(或起始RNAs群体)断裂,从断裂的起始RNA引发和合成单链cDNA,和使衔接子序列与单链cDNA末端连接来实现。所得到的单链cDNA在5,和3,末端包含已知衔接子序列,保留定向信息,且适合于在某些自动化测序系统中自动化测序而不需要克隆载体或宿主细胞,所述自动化测序系统例如由454LifeSciences,Branford,CT开发的测序系统。本发明的一个实施方案涉及用于从起始RNA产生单链DNA文库(例如,cDNA文库)的方法。该方法包括使RNA断裂以产生断裂的RNA的第一个步骤。断裂可以进行最优化以产生大小为100碱基-1000碱基,例如大小为150-500碱基的RNA片段。在任选步骤中,RNA片段可以使用已知技术例如凝胶电泳或层析进行大小分级分离。大小分级分离可以产生100-1000碱基或150-500石咸基的RNAs。断裂后,断裂的RNA与多个引物杂交,所述多个引物可以从断裂的RNA上的多个位置引发和延长。例如,如果第一个引物在其杂交区域中包含随机序列,从而使得此类引物群体可能具有可以与任何序列杂交的成员,那么这是可能的。杂交的引物用逆转录酶延长以形成单链cDNA。单链cDNA(sscDNA)合成后,RNA可以通过变性条件、NaOH水解、热处理或RNA酶处理来去除。RNA去除后,第一种DNA衔接子可以与cDNA的5,末端连接。在优选实施方案中,第一种衔接子具有双链部分,以及与sscDNA的5'末端互补的突出(单链)5'末端区域。此外,包含与单链cDNA的3,末端互补的突出3'末端区域的第二种衔接子可以与cDNA的3'末端连4^。5'-第一种衔接子-3'5'----------CDNA—......3'5'—第二种衔接子一3'3'_第一种衔接子5'3'.......第二种衔接子......5'应当指出在cDNA的5,末端的第一种衔接子连接不是必需的。还可以设计掺入非随机5,部分的第一链cDNA合成引物。这种非随机5,部分可以具有第一种衔接子的序列(关于示例衔接子序列参见图2)。因为任何所得到的cDNA在5,末端将已具有所需序列,所以在5,末端与第一种衔接子的另外连接不是必需的。第一种和第二种衔接子可以同时或以任何相继顺序与cDNA连接。此外,第一种衔接子、第二种衔接子、或两者可以包含结合对成员用于纯化。结合对可以是显示互相特异性结合的任何2种分子,例如FLAG/FLAG抗体;生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、受体/配体、抗原/抗体、受体/配体、polyHIS/镍、A蛋白/抗体及其衍生物。结合对可以与第一种或第二种衔接子的任一链附着。此外,衔接子的2条链可以各自用相同的结合对成员(例如,2种生物素)进行标记。与第一种和第二种衔接子连接的单链cDNA随后进行纯化以形成cDNA文库。sscDNA纯化可以通过大小分级分离来进行,因为cDNA比衔接子或引物更长。如果cDNA与结合对的一个成员(例如,下文描述的生物素)附着,那么它可以通过使用与固体支持体附着的结合对的第二个成员(例如,链霉抗生物素蛋白、抗生物素蛋白等)进行纯化。多个引物可以是包含具有已知特性的一个或多个非随机引物碱基的半随机引物。例如,引物长度可以为10碱基,其中第1碱基(从5,末端计数)和第4碱基具有已知序列(即,A、G、C、T或U),且其中其他碱基(碱基2、3和5-10)具有未知序列。在优选实施方案中,第一种衔接子包含与多个引物的非随机碱基互补的单链区域(参见,图1,衔接子A)。多个引物也可以是半随机的,其中非随机碱基这样设计,从而使得员退1。、多个;I物也可:是非随机的,、即是序列特异性的。、i果Ji物具有特异的非随机序列,那么它们可能使所得到的DNA或cDNA文库偏向特异表达的序列或基因组区域,或相关表达的序列或基因组区域的2个或更多成员。在本发明的任何方法中,寡核苷酸中的任何随机碱基位置(A、G、C、T或U)可以由肌普(I)占据,所述肌苷是能够与任何常见碱基A、G、C、T或U配对的碱基。请求保护的本发明的一个优点是无需使用依赖DNA的DNA聚合酶(例如,克列"i若,polI)即可生成cDNA或DNA文库。即,该方法可以只使用一种聚合酶_逆转录酶来进行。本发明的另一个优点是无需核酸扩增步骤即可生成DNA或cDNA文库。本发明还包含通过公开的方法产生的非扩增单链cDNA文库。此外,本发明的文库可以用于生产扣除(subtraction)文库,例如cDNA扣除文库。如果需要,通过添加依赖DNA的DNA聚合酶例如PolI或克列诺聚合酶连接衔接子后,sscDNA可以被制备成双链的。尽管这个步骤在本发明的方法中不是必需的,但它可以用于生成用于克隆或其他应用的双链cDNA文库。这些和其他实施方案在下述详细描述中被公开,或由于下述详细描述是显而易见的,且由下述详细描述包含。附图简述下述详细描述作为例子给出但不希望将本发明限于所述的具体实施方案,可以结合引入本文作为参考的附图理解,其中图l描述了将衔接子(A和B)定向连接到单链cDNA(sscDNA)上的一个实施方案。每个衔接子由具有设计为与sscDNA退火的单链部分的较长寡核苦酸,和变得与sscDNA的3'和5,末端连接的较短寡核苷酸组成。图2描述了Tseq(转录物测序)文库制备的一个实施方案。图3描述了来自肝cDNA文库的序列读数的5,至3,分布,显示了均匀的Tseq读数分布,即使对于长度超过5,000个核苷酸的转录物。图4描述了一种可能的引物序列。"N"表示任何碱基且"V,,表示除T外的任何碱基(即,"V"表示a、g或c)。图5描述了3'衔接子与用图4的引物产生的cDNA的退火。图6描述了Tseq衔接子结构的某些实施方案。图7描述了来自流感毒抹A/PuertoRico/8/34的病毒RNA的AgilentBioanalyzer迹线。峰上的数字表示核普酸的近似大小。25bp处的峰表示内部大小标准。图8描述了在断裂前(蓝色迹线)和断裂后(绿色迹线),来自流感毒林A/PuertoRico/8/34的病毒RNA的AgilentBioanalyzer迹线。红色迹线表示标准大小标记。25bp处的峰表示内部大小标准。图9描述了在特异性3,和5'衔接子连接前,从流感毒林A/PuertoRico/8/34病毒RNA获得的sscDNA的AgilentBioanalyzer迹线(红色)。蓝色迹线表示标准大小标记。25bp处的峰表示内部大小标准。图IO描述了在18个扩增循环(图10A);和25个扩增循环(图10B)后,从流感毒林A/PuertoRico/8/34病毒RNA获得的dscDNA的AgilentBioanalyzer迹线。25bp处的峰表示内部大小标准。图11描述了横过流感病毒RNA区段1-4获得的序列覆盖度深度图。图12描述了横过流感病毒RNA的3个不同区段获得的序列覆盖度深度图。图13描述的AgilentBioanalyzer迹线显示dscDNA文库中的大小分布和相对核酸量,所述dscDNA文库分别由10、20、50或200ng起始流感病毒RNA构建。25bp处的峰表示内部大小标准。图14描述了从10ng(蓝色)或200ng(红色)起始RNA获得的序列覆盖度深度图。数据分别对于A组(顶部;从5,到3'测序)和B组(底部;从起始RNA的3,到5'测序)进行标绘。这种数据还呈现于表3中。该图揭示从低输入(10ng)或较高输入(200ng)的起始RNA获得等价覆盖度模式。图15描述了本发明的cDNA文库制备方法的一个实施方案,其中单链衔接子与断裂的起始RNA的5,和3'末端连接。图16描述了本发明的cDNA文库制备方法的一个实施方案,其中单链衔接子与断裂的起始RNA的3,末端连接,且单链5'末端衔接子(B)在逆转录后添力口。图17描述了本发明的cDNA文库制备方法的一个实施方案,其中部分双链辨f接子与断裂的起始RNA的3'末端连接,且部分双链5'末端衔接子(B)在逆转录后添加。图18(A和B)描述了本发明的cDNA文库制备方法的一个实施方案,其中起始RNA在逆转录前无需被断裂。RNA使用随机或半随机引物进行逆转录,且A,和B衔接子序列通过连接加入所得到的sscDNA中。图19描述了本发明的DNA文库制备方法的一个实施方案,其中衔接的DNA文库来源于起始DNA。发明详述除非另有限定,本文使用的所有技术和科学术语都具有与本发明所属领域普通技术人员通常理解相同的含义。尽管与本文所述那些类似或等价的许多方法和材料可以在本发明实践中使用,但本文描述了优选材料和方法。本发明的方法提供了超过现有cDNA文库生产方法的许多利益和优点。这些优点包括(1)少的起始mRNA量(即,5ng-500ng,其中10ng-200ng是一般的起始量)需求,(2)与常规cDNA文库生产和测序比较,消除了3'偏倚,(4)包括更少的总体制备的更快速过程,(5)消除了待测序材料的克隆和扩增,和(6)cDNA合成过程自始至终保留了定向性信息(有义或反义方向)。本发明的方法提供了超过传统cDNA测序规程的显著改善,因为所得到的cDNA文库包含对于所有转录物类型显著减少的3'偏倚。所提供的方法通过使起始RNA断裂成一致大小范围(150-500个核普酸),克服了逆转录酶持续合成能力的固有问题,所述一致大小范围可以通过逆转录酶可行地逆转录而无显著的过早终止。如果起始RNA是mRNA,那么片段将随机跨越样品中呈现的每个转录物。这种断裂的RNA库随后经历由半随机引物(5'-P-TNNTN6-3')(SEQIDNO:1)驱动的逆转录反应。半随机引物的使用导致不同mRNAs的所有片段的一致随机逆转录,且值得注意的是,这种技术不会偏好RNAs(例如,转录物)的3,末端超过5,末端。由于2个原因将引物设计成半随机的。首先,随机性允许它横过RNA库内的所有片段进行引发,从而允许完全覆盖每个转录物。其次,引物的TNNT部分(图1)可以用作后续连接反应中的定向锚定位点。该方法的一个优点是不进行制备双链cDNA的传统第二条链合成,这节省了时间且进一步避免了由于体外核酸合成的任何人为产物。相反,进行连接反应以使正向(或A衔接子)和反向(或B衔接子)衔接子与sscDNA附着。A和B衔接子提供关于任何下游测序规程的定向信息(图1)。衔接子组(即,A和B衔接子)以这样的方式设计,从而使得允许定向连接正向和反向衔接子,从而导致正向与sscDNA分子的5,末端附着,且反向与sscDNA分子的3,末端附着。连接中使用的每个衔接子组由互补的2个引物组成,然而,一个引物比另一个长,且因此导致产生突出区段。连接反应中使用的衔接子单位的示意表示显示于图1中。较长引物的非互补部分将用作锚定单位以与sscDNA分子退火。一旦这种锚定完成,较短引物就可以与sscDNA的5,或3,末端连接。衔接子单位与sscDNA定向退火和其中发生连接的示意表示显示于图1中。许多方法可用于使连接的sscDNA与未连接的材料分离。在一种优选方法中,一个或两个衔接子可以在较长链(非连接链)上用生物素标记。商购可得的链霉抗生物素蛋白磁珠,例如MyOne(Dynal)用于纯化来自连接反应的连接的分子。在未连接的材料已从磁珠洗去后,使sscDNA分子解链。这是可能的,因为只有衔接子的非连接链是生物素化的。解链使与cDNA连接的连接链分开,且将连接链-cDNA结构释放到溶液中。这种sscDNA可以从溶液中进行纯化,以产生准备好用于测序的最终sscDNA文库。从溶液中纯化sscDNA的许多方法是已知的。在某些实施方案中,如聚丙烯酰胺葡聚糖(Sephacryl)S-400柱可以用于纯化。在优选实施方案中,sscDNA使用RNAclean(Agencourt)进行纯化,以帮助去除大多数非常小的片段以及衔接子的未连接的引物。在一个实施方案中,B衔接子组是生物素标记的,从而使得可以使用链霉抗生物素蛋白包被的磁珠使连接的cDNA分子与未连接的sscDNA分子以及未连接的衔接子分离。sscDNA从珠解链且在产生最终sscDNA文库前经历提纯步骤。这个文库随后进行定量和稀释至用于直接测序的正确浓度。直接测序可以例如使用454LifeSciences测序-见程和装置来进行。尽管使用454LifeSciences技术的测序是优选的,但测序可以使用任何技术,包括传统克隆和人工测序技术来进行。此类人工测序方法包括但不限于,Maxam-Gilbert测序、Sanger测序、合成测序,例如焦;寿酸测序(pyrosequencing)。另一种^则序方;^包4舌4吏用引4勿PCR扩增个别sscDNA,所述引物设计为与sscDNA任一末端上的已知序列(即,A衔接子和B衔接子区域)杂交,随后测序。已提供了用于产生RNA文库的策略概述,下文更详细地描述本发明的方法的每个个别步骤。趟始7M4RNA、核糖体RNA、转移RNA、病毒RNA和微小RNA。一个优选的RNA来源是细胞RNA。细胞RNA可以使用已知方法进行分离,例如使用8M盐酸胍或Tnzol试剂分离。本领域普通技术人员熟悉常用于处理RNA的技术,例如在与目的RNA接触的所有溶液中使用焦石友酸二乙酯(DEPC)处理的水。RNA可以但不需是聚腺苷酸富集的。如果聚腺苷酸富集的RNA是所需的,那么它可以使用产生聚腺苷酸RNA的任何方法获得。此类方法包括例如在寡脱氧胸苷酸纤维素基质上通过且结合聚腺普酸RNA溶液,从基质洗去未结合的RNA,且使用低离子强度緩沖液(低盐緩冲液)从基质释放聚腺苷酸RNA。分离聚腺苷酸RNA的其他方法包括使用寡脱氧胸苷酸偶联的磁介质,例如装填寡脱氧胸苦酸的磁珠(Dymil)。jRA^錄袭起始RNA可以通过本领域已知的任何方法进行断裂,所述方法包括机械剪切、超声处理和雾化。应当指出断裂是任选步骤。本发明的方法可以无需RNA断裂而进行。此外,本发明的方法可应用于使用或不使用断裂产生的任何大小的RNA,从10碱基、20碱基RNAs开始到1kb、10kb或更多的RNAs。RNA大小的上限取决于RNA逆转录酶的持续合成能力。这个上限将预期随着具有更大持续合成能力的新RNA逆转录酶或基因工程改造的逆转录酶的发现而增加。较低大小范围中的RNAs例子包括微小RNA和断裂或降解的RNA。用于使起始RNA断裂的一种优选方法是在钾和钙离子的存在下热诱导mRNA断裂。简言之,将RNA置于40mMTris-乙酸盐、100mM乙酸钾和31.5mM乙酸镁溶液中,且于82。C温育直至达到所需断裂量。我们已发现在上述Tds/乙酸钾/乙酸镁溶液中,2分钟温育足以使RNA减少至约150-500石威基的大小。断裂可以例如通过凝力交电泳或Bioanalyzer(Agilent)来监控。自然,离子浓度、温育温度、和时间调整可能是必需的,以使断裂技术适应不同环境。断裂后,RNA可以使用已知技术来纯化。一种RNA纯化方法是使RNA样品脱盐。脱盐可以使用来自商业供应者例如Qiagen的商购可得试剂盒(例如,旋转柱)来完成。卓遂cZ)A^0cZ)A^y>合4'.'断裂后,使用逆转录酶将RNA逆转录成cDNA。在一个优选实施方案中,第一条链cDNA合成使用具有序列5,-P-TNNTNNNNNN-3,(SEQIDNO:1)的半随机引物来进行,其中N表示随机序列(A、G、C或T)且P是5,磷酸。设计引物以使用3,NNNNNN区域(SEQIDNO:17)在断裂的mRNAs上随机引发。尽管这种poly(N)区域长度优选为6碱基,但也预期7碱基、8碱基、9碱基或10碱基的poly(N)区域。引物还包含可以用于正向衔接子后续定向连接的衔接子序列(5,-TNNT-3,)。应当理解本文公开的引物序列用于举例说明性目的,且引物序列TNNTNNNNNN(SEQIDNO:1)中的Ts可以替换为任何2种已知碱基。例如,下述引物也可以在本发明实践中起作用ANNANNNNNN(SEQIDNO:2)、GNNGNNNNNN(SEQIDNO:3)、C丽CNNNNNN(SEQIDNO:4)、ANNGNNNNNN(SEQIDNO:5)、A丽CNNNNNN(SEQIDNO:6)、ANNTNNNNNN(SEQIDNO:7)、GNNANNNNNN(SEQIDNO:8)、G丽CNNNNNN(SEQIDNO:9)、GNNTNNNNNN(SEQIDNO:10)、CNNANNNNNN(SEQIDNO:11)、CNNGNNNNNN(SEQIDNO:12)、C丽TNNNNNN(SEQIDNO:13)、TNNANNNNNN(SEQIDNO:14)、T丽GNNNNNN(SEQIDNO:15)和TNNCNNNNNN(SEQIDNO:16)。本发明的任何引物、寡核苷酸、核苷酸、核苷和核;咸基(nucleobase)可以包含本领域已知的一种或多种化学修饰和取代,例如硫代磷酸酯取代,修饰的糖部分例如2,-0-曱基或2,-0-乙基取代糖,化学发光或荧光标记,例如但不限于辣根过氧化物酶、罗丹明、荧光素、和可从MolecularProbes获得的Alexa标记,质量标记,封闭基团或保护基,和半抗原例如生物素。如前所述,预期具有(衔接子A)NNNNNN(SEQIDNO:17)的独特5,序列区域的5,引物的使用。在其5,末端具有衔接子序列的此类引物将节省第一种衔接子的后续连接(即,节省了一个连接步骤)。用此类引物合成cDNA后,只需要3'衔接子连接。使用引物和逆转录酶,可以从断裂的起始RNAs合成sscDNA。衔接子序列的序列可以例如在图2中找到。/伞#子遂凝.-第一条链合成后,将sscDNA纯化且置于连接反应内以给其5,和3,末端添加衔接子序列。衔接子是具有部分单链区域的短核酸,所述单链区域-没计为以定向方式与sscDNA杂交和连4妻(例如,游f接子A与sscDNA的5,末端且衔接子B与sscDNA的3,末端,参见图1)。示例衔接子结构显示于图6中。衔接子A可以是具有突出5,单链区域的双链DNA。例如,部分单链和部分双链的衔接子A可以包含序列5'-OH-nnnnnn-OH-3'(SEQIDNO:17)3'双脱氧(SEQIDNO:29)3,双脱氧防止链与另一种核酸连接。这种序列将与sscDNA的5,区域特异性杂交,所述sscDNA由序列5,-P-innJnnnnnn-3,(SEQIDNO:1)的引物延长来制备(参见,图1)。如上文所讨论的,衔接子A的下划线碱基设计为与引物序列的下划线碱基互补。作为进一步的举例说明,如果引物序列是5,-gnngnmmnn-3,(SEQIDNO:3),那么^f舒接子A应当具有序列5'-OH-nnnnnn-OH-3'(SEQIDNO:17)mm3'双脱氧-nnnnnn£nn£-生物素-5'(SEQIDNO:30)衔接子B可以是具有突出3'区域的任何双链DNA。例如,衔接子B可以具有序列5'-P-nnnnnn-3'双脱氧(SEQIDNO:17)mm3'-P-nnnnnnnnnn-OH-5'(SEQEDNO:18)这种衔接子可以与任何单链DNA的3,末端杂交,且衔接子B的较短链可以与单链DNA连接。应当指出本公开内容的图和上下文中所示的双脱氧表示防止核酸连接的封闭基团。这些双脱氧基团可以替换为功能相当的任何封闭基团(即,可以防止核酸链连接的封闭基团)。可替代地,可以不使用封闭基团。衔接子A和衔接子B的双链区域可以包含任何序列-包括随机序列。在优选实施方案中,衔接子B在其双链区域中可以包含限制性内切核酸酶切割位点、已知的测序引物位点、或两者。在更优选的实施方案中,衔接子A和衔接子B的双链区域可以包含结合对的一个成员-结合部分-以用于引物的后续纯化。衔接子A和衔接子B各自包含2条链-可以与单链核酸连接的链和不能与单链核酸连接的链-在本文中称为"连接链"和"非连接链"。在优选实施方案中,衔接子A或衔接子B的非连接链包含结合对的一个成员_例如生物素。有用的结合对包括例如,生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、polyHIS区域/NTA、FLAG/抗FLAG抗体、抗原/抗体或抗体片段等。纯化显著减少多联体例如引物二聚体的形成。单链cDNA文库的产生在衔接子连接后完成。cDNA文库可以用于需要cDNA文库的任何分子生物学程序。在一个实施方案中,cDNA由单个组织的RNA产生。在其他实施方案中,cDNA可以由多个组织、一种或多种细胞、体液、一个或多个生物、环境样品、生物膜、一种或多种细菌、一种或多种古菌、一种或多种真菌、一种或多种植物、一种或多种动物、一个或多个人、病毒、逆转录病毒、噬菌体、寄生物、肿瘤或胂瘤样品、和/或生物样品的RNA单个组织的表达水平(即,转录特征分析)。在优选实施方案中,测序使用来自454LifeSciences的方法和装置来进行。用于核酸直接测序的方法可以见于2004年1月28日提交的共同未决的美国专利申请USSN:10/767,779,2003年6月6日才是交的USSN:60/476,602;2003年6月6日提交的USSN:60/476,504;2003年1月29日提交的USSN:60/443,471;2003年6月6日提交的USSN:60/476,313;2003年6月6日提交的USSN:60/476,592;2003年4月23日提交的USSN:60/465,071;和2003年8月25日提交的USSN:60/497,985。,i的cZ)A^vX岸W遂^.'sscDNA可以在任选步骤中进行纯化。一种纯化方法是通过大小选择。从起始RNA产生的RNA片段大小为100碱基-1000碱基,优选大小为150-500碱基,且从RNA片段产生的sscDNA预期在大小方面是可比较的。这种大小大于衔接子和引物的大小。因此,cDNA可以通过大小分级分离进行纯化-所述大小分级分离可以通过柱层析(包括旋转柱)、聚丙烯酰胺凝胶电泳、琼脂糖凝胶电泳、或使用SPRI珠(RNAclean,Agencourt)来进行。在其中结合部分被掺入连接链内的情况下,sscDNA可以通过亲和结合来回收。例如,未连接的衔接子和衔接子的未连接的链可以通过变性条件例如热处理或碱处理来去除。变性处理后,包含结合对的一个成员(例如,生物素)的连接的SSCDNA可以与包含结合对的另一个成员的固体支持体(例如,抗生物素蛋白包被的磁珠)结合。洗涤以去除未结合的核酸后,纯化的sscDNA可以与固体支持体分开。在其中结合部分被掺入非连接链内的情况下,sscDNA可以通过使包含结合对的一个成员(例如,生物素)的非连接链与包含结合对的另一个成员的固体支持体(例如,抗生物素蛋白包被的磁珠)结合来回收。洗涤后,sscDNA可以通过变性条件来收集。在变性条件下,与非连接链杂交的sscDNA被释放到溶液中,而非连接链将保持与固体支持体结合。因此,可以收集含纯化的sscDNA的溶液。本发明的方法可以以各种方式使用,包括但不限于构建消减式(subtractive)cDNA文库和转录特征分析(Shimkets等人(1999)."Geneexpressionanalysisbytranscriptprofilingcoupledtoagenedatabasequery."NatBiotechnol17(8):798-803)。在第二个实施方案中,本发明的方法可以涉及转录物计数。在转录物计数中,第一个引物设计为与信使RNA的聚腺苷酸尾杂交。生产的cDNA文库将富集接近聚腺苷酸尾的cDNA序列。在这种方法中,RNA以与上述转录物测序(TSEQ)规程相同的方式来断裂。然而,在这种情况下,使用聚腺苷酸分离的RNA是高度优选的。用于cDNAs第一条(且大部分时间唯一的)链合成的引物具有2个区域。第一个区域是设计为与聚腺苷酸区域杂交的5'区域。这可以是寡脱氧胸苷酸区域。第二个区域包含由图4中的VN表示的衔接子序列。作为另外的选择,引物可以包含另外的5,区域,所述另外的5,区域包含衔接子序列。因此,引物序列可以是5'-(衔接子A)-ttttttttv-3'(SEQEDNO:19)。在更优选的实施方案中,引物序列可以是5'-(衔接子A)-ttttttttvn-3'(SEQIDNO:20)。在本说明书自始至终,"v"用于表示DNA或RNA碱基a、g或c。换言之,v是除t或u外的任何碱基。可替代地,引物可以包含基因特异性或基因家族特异性序列,以使文库构建偏向基因亚群。如果引物不包含衔接子序列(即,该引物具有如上文所示SEQIDNO:19或SEQIDNO:20所示结构,但缺乏"(衔接子A)"序列),那么衔接子序列可在cDNA合成后进行连接。cDNA合成后,可以使用下述衔接子结构5'(衔接子B')3'双脱氧immiii3-P-NNNNNN(衔接子B)-生物素-5'(SEQIDNO:35〉其中衔接子B和衔接子B'是互补序列。这种衔接子结构可以与CDNA的3,末端连接(参见图5)。应当指出连接后,一条链是生物素化的且连接的cDNA可以通过链霉抗生物素蛋白柱或链霉抗生物素蛋白珠进行纯化。所得到的cDNA可以用于以与上文所述Tseq测序相同的方式测序。在另外的实施方案中,起始RNA断裂后,单链寡核苷酸衔接子(其可以是DNA或RNA)可以与断裂的RNA连接(例如使用T4RNA连接酶)。如图15中所示,与RNA的3,末端连接的衔接子可以是衔接子A,且与RNA的5'末端连接的衔接子可以是衔接子B'。后续逆转录可以由与衔接子A互补的RT引物起始。逆转录后,RNA链可以通过本文公开的任何方法来去除,所述方法包括水解或RNA酶H处理,这之后最终衔接的sscDNA可以进行纯化。最终摊f接的sscDNA包含在5,末端的A,衔接子序列和3'末端的B衔接子序列。在另一个实施方案中(图16),起始RNA断裂后,单链寡核苷酸衔接子(其可以是DNA或RNA)可以与断裂的RNA的3,末端连接(例如使用T4RNA连接酶)。后续逆转录可以由与衔接子A互补的RT引物起始。逆转录后,RNA链可以通过本文公开的任何方法来去除,所述方法包括水解或RNA酶H处理。如图16中所示,所得到的A'衔接的sscDNA可以与部分双链的寡核苷酸衔接子组B连接。寡核苷酸衔接子组B的一条链包含在其3'末端的随机或半随机序列的单链部分,和在其5'末端的生物素或类似亲和标记。如本文其他地方所述,随后可以通过抗生物素蛋白或链霉抗生物素蛋白来捕获连接产物,并使最终A,-B衔接的sscDNA解链(图16)。在另外一个实施方案中(图17),起始RNA断裂后,如图17中所示,部分双链的寡核苷酸衔接子组A与RNA的3'末端连接。寡核苷酸衔接子组A的一条链包含在其3,末端的随机或半随机序列的单链部分,和在其5,末端的生物素(或其他合适的亲和标记)。随后可以通过抗生物素蛋白或链霉抗生物素蛋白(或其他合适的结合配偶体)来捕获连接产物,并使连接的RNA解链。随后,逆转录可以由至少部分与衔接子A序列互补的RT引物来起始。逆转录后,RNA链可以通过本文公开的任何方法来去除,所述方法包括水解或RNA酶H处理,这之后A衔接的sscDNA可以进行纯化。如图17中所示,使部分双链的DNA寡核苷酸衔接子组B与这种A衔接的sscDNA的3'末端连接(例如,使用T4DNA连接酶);寡核苷酸衔接子组B的一条链包含在其3,末端的随机或半随机序列的单链部分,和在其5,末端的生物素(或其他合适的亲和标记)。如本文其他地方所述,随后可以通过抗生物素蛋白或链霉抗生物素蛋白(或其他合适的结合配偶体)来捕获连接产物,并使最终A,-B衔接的sscDNA解链(图17)。在这个和本文所述的其他实施方案中,技术人员将理解不合需要的衔接子-衔接子连接事件可以通过下述来防止适当地将合适的化学结构(例如,磷酸基、或双脱氧基团的存在或不存在)放置在寡核苷酸的3,和/或5,末端上。在本发明的某些实施方案中,用于制备cDNA文库的方法不需要断裂起始RNA(例如图18A和B)。在这些实施方案中,随机或半随机逆转录引物与未断裂的起始RNA退火,且进行逆转录。例如,逆转录引物可以包含随机或半随冲几的5,部分和恒定的3,部分。如果使用的逆转录酶是非链置换的,那么逆转录可以从每个退火的引物延续直至下一个退火的引物,或直至达到RNA的5,末端。技术人员将理解所得到的sscDNA片段的平均长度尤其取决于引物与起始RNA的比率。逆转录后,RNA链可以通过本文公开的任何方法来去除,所述方法包括水解或RNA酶H处理,这之后各自在其5,末端包含逆转录引物的sscDNA片段可以进行纯化。sscDNA的5'末端随后可以与部分双链的寡核苷酸衔接子组A,连接(例如使用T4DNA连接酶)。衔接子组A,包含的一条链在其5'末端具有随机或半随机序列的单链部分。sscDNA的3,末端可以与部分双链的寡核苦酸衔接子组B连接(例如使用T4DNA连接酶)。衔接子组B包含的一条链在其3'末端具有随机或半随机序列的单链部分,和在其5,末端具有生物素(或其他合适的亲和标记)(图18A)。如本文其他地方所述,随后可以通过抗生物素蛋白或链霉抗生物素蛋白(或其他合适的结合配偶体)来捕获连接产物,并使最终A,-B衔接的sscDNA解链(图18B)。衔接子组A,的"底部,,链(根据图18)同样将解链,且可以通过本领域已知和本文描述的许多大小选择程序中的任何一种,例如SPRI珠,与所需的最终A'-B衔接的sscDNA分开。本发明的某些实施方案涉及DNA文库而不是cDNA文库的产生。在这些实施方案中,原材料是单链或双链DNA。起始DNA可以来源于任何生物(细胞或病毒)或合成来源。如果起始DNA是单链的,那么它可以例如已来源于变性双链DNA,或可以乂人单链DNA病毒中分离。如果起始DNA片段的长度超过所需DNA文库要求的长度,那么它可以通过本领域已知的任何方法来断裂,所述方法可以是酶促(例如限制酶)、化学、或机械的(例如剪切)。如果起始DNA是双链的,那么片段例如通过热处理进行变性以产生ssDNA片段。ssDNA片段的5,末端随后可以与部分双链的寡核苷酸衔接子组A,连接(例如使用T4DNA连接酶)。衔接子组A,包含的一条链在其5'末端具有随机或半随机序列的单链部分。ssDNA的3,末端可以与部分双链的寡核苷酸衔接子组B连接(例如使用T4DNA连接酶)。衔接子组B包含的一条链在其3,末端具有随机或半随机序列的单链部分,和在其5,末端具有生物素(或其他合适的亲和标记)(图19)。如本文其他地方所述,随后可以通过抗生物素蛋白或链霉抗生物素蛋白(或其他合适的结合配偶体)来捕获连接产物,并使最终A,-B衔接的ssDNA解链。衔接子组A,的"底部"链(根据图19)同样将解链,且可以通过本领域已知和本文描述的许多大小选择程序中的任何一种,例如SPRI珠,与所需的最终A,-B衔接的ssDNA分开。在本公开内容自始至终,术语"生物素""抗生物素蛋白"或"链霉抗生物素蛋白"已用于描述结合对的成员。应当理解这些术语仅用于举例说明使用结合对的一种方法。因此,术语生物素、抗生物素蛋白、或链霉抗生物素蛋白可以用结合对的任何一个成员替换。结合对可以是显示互相特异性结合的任何2种分子,且至少包括结合对,例如FLAG/FLAG抗体;生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、受体/配体、抗原/抗体、受体/配体、polyHIS/镍、A蛋白/抗体及其衍生物。其他结合对是已知的且在文献中公开。本公开内容中任何地方引用的所有专利、专利申请和参考文献均在此整体引入作为参考。本发明的其他实施方案和优点部分在随后的说明书中阐述,且部分由于本说明书将是显而易见的,且可以从本发明实践中学习。本发明现在将通过下述非限制性实施例进一步描述。实施例实施例1材冲牛和方法该规程已被开发用于从200ngmRNA材料开始工作。这种规程的示意图显示于图2中。关于该方法的起始体积为10^1。将样品置于冰上,且将2.5pl5X断裂緩沖液(0.2MTris乙酸盐、0.5M乙酸钾和157.5mM乙酸镁)加入样品中,且充分混合。将样品置于热循环仪中且加热至82°C,且允许于82。C温育2分钟。紧在于82。C温育后,将样品移回到冰上。在脱盐步骤中从样品中去除盐。使样品脱盐的方法是众所周知的。本文使用的规程包括根据制造商的说明书使样品通过Autos叫G-50柱(AmershamBiosciences)。回收的约20fil体积材料通过于45。C在speed-vac(SavantSpeedVacConcentratorSystems)中、在真空下(2Torr)离心干燥减少至10pl。逆转录引物与mRNA冲莫板的退火通过将2itil逆转录引物(200[iM5,-P-TNNTNNNNNN-3,,其中P表示石辟酸,SEQIDNO:l)添加到断裂的mRNA中来进行。随后,将样品在热循环仪中加热至70°C10分钟且在水上冷却。向反应管中加入8.5微升逆转录混合物(4.0pi5XSuperscriptIIFirstStrandBuffer,2.00.1MDTT,l.O^ldNTP混合物(各为10mM),1.0|ul50单位1的SuperscriptII酶(Invitrogen)和0.5pi125单位/^il的RNaseOut(Invitrogen))。使反应管充分混合且于45。C温育1小时。这个反应后sscDNA分子通过添加15W变性溶液(0.5MNaOH,0.25MEDTApH8.0)来分离、混合且于65。C温育20分钟。反应通过添加20中和纟爰沖液来纟冬止。随后,反应4吏用QiagenMinEluteDNAPurificationColumns根据制造商的说明书进行纯化,除了洗脱体积外。反应用12pi10mMTris-ClpH7.5来洗脱。衔接子A和衔接子B的连接通过向样品中添加6.5pi连接混合物(1.0^125^M衔接子A,1.0pi50^M衔接子B,1.8(illOXT4连接酶緩沖液,2.2|iU水和0.5(il2000单位1的高浓度T4DNA连接酶(NewEnglandBiolabs))来确立。使样品混合且于22。C温育12小时。连接产物通过生物素标记的B衔接子与MyOne链霉抗生物素蛋白磁珠(Dynal)结合根据下述程序来分离。应当理解与相应结合对结合的任何形式的磁珠例如链霉抗生物素蛋白珠将起作用。连接反应体积通过添加1XTEpH7.5增加至100|Lil。随后向样品中加入包含100pl洗过的磁珠的浆液。使样品于室温混合10-15分钟,且随后洗涤珠以去除任何未结合的材料。sscDNA进行解链且用100|ul洗脱缓沖液(25mMNaOH,1mMEDTA,0.1%Tween-20)从珠中洗脱。将洗脱的材料转移至新管,且用IOilU中和緩沖液(250mMHCl,250mMTris-CLpH8.0)进行中和。添加中和緩冲液后,使样品通过SephacrylS-400层析柱以从sscDNA样品中去除小片段。样品随后在QuiagenMinElute柱上根据制造商的规程进行纯化。最终sscDNA使用18jj10mMTris-HClpH7.5从柱洗脱且使用小等分试样以QC文库。对小鼠肝mRNA样品进行的这种规程的研究提供覆盖所有大小转录物的大量序列数据。为了测定较长转录物的序列覆盖度,标绘出大于5000个核苷酸的所有转录物的每个区域的命中数目。观察到序列覆盖度横过这些转录物全长的均匀分布,从而暗示即使长度大于5000个核苷酸的转录物也显示很少至没有3,偏倚(参考图3)。实施例2流感病毒基因组的cDNA文库制备和测序流感病毒抹A/PuertoRico/8/34的RNA基因组材料购自CharlesRiverLaboratories(Wilmington,MA)。流感基因组已知包含单链负义RNA的8个区段。所有区段的总长为3500nt。起始RNA材料被发现存在于对应于病毒RNA区段的不同大小级分中(图7)。在cDNA文库制备中使用各种起始量(10ng、20ng、50ng或200ng)的RNA。对于RNA断裂,将在10^U体积中的起始量RNA加入2.5pl5x断裂緩沖液(200mMTris-乙酸盐,500mM乙酸钾,157.5mM乙酸镁,pH8.1)中,短暂涡旋,且于82。C温育2分钟,随后在水上冷却。为了使断裂RNA提纯,用10mMTns-HCl,pH7.5将样品体积调整至50|iil。添加IOO微升RNAClean珠混合物(Agencourt,BeverlyMA),混合且在室温下温育10分钟。随后将珠收集到磁性颗粒收集器单元上。弃去上清液,且用70%乙醇将珠洗涤2次。将珠风干,随后用ll|iillOmMTris-HClph7.5洗脱RNA,得到约9.5|iil洗脱物。断裂导致产生广泛大小范围的RNA,其中峰在约500个核苷酸处(图8)。为了制备单链cDNA(sscDNA),全部洗脱物随后与2200pM引物P-TNNTNNNNNN(SEQIDNO:1)混合,且加热至70°C10分钟,随后在冰上快速冷却。此后,添加8.5(il冰冷的逆转录混合物(4|ul5XSSII第一链緩沖液(FirstStrandBuffer)[Invitrogen,Carlsbad,California],2pi0.1MDTT,1pidNTP混合物[IOmM每种dNTP],1piSuperscriptII逆转录酶[Invitrogen],和0.5piRNaseOut[Invitrogen]),随后混合。使混合物于45。C温育1小时,随后置于冰上。添加变性溶液(0.5MNaOH,0.25MEDTA),混合,且于65。C温育20分钟。添加cDNA中和溶液(0.5MHC1,0.5MTns-Cl)(10-40)以达到pH7-8.5。样品通过添加1.5体积RNAClean混合物来纯化,且在室温下温育10-15分钟。随后将珠收集到磁性颗粒收集器单元上。弃去上清液,且用70%乙醇将珠洗涤2次。将珠风干,随后用25(il10mMTns-HCl,pH7.5洗脱sscDNA。因此获得的sscDNA大小分布集中在约500个核苦酸处的峰周围(图9)。对于衔接子连接,使SAD1F寡核苷酸与sscDNA的5'末端连接,且使SAD1R寡核苷酸与sscDNA的3,末端连接。为此,向sscDNA样品中加入6pl衔接子/緩冲液混合物(3pi10XT4DNA连接酶緩沖液(LigaseBuffer)[NewEnglandBiolabs,Ipswich,MA],1pi50一SADlF/SADlFprime(1.2:1),1(al200|iMBio-SADlR/SADlRprime(1.2:1),和1(ilQuickLigase或T4DNALigaseHighCone.[NewEnglandBiolabs]),且于22。C温育12小时。这次温育后,添加IXTE(pH8.0)以达到具有lOO^il终体积的连接混合物。寡核苷酸序列显示于表1中。表1名称序列(5'-3')修饰SEQIDNOSAD1F(TCAG)GCCTCCCTCGCGCCATCAG无21SADFprimeO'CAG)N*A*N*NACTGATGGCGCGAGGGA*G*G*/3ddC*=硫代磷酸酯化》咸基,3'-双脱氧-C22SAD1R(TCAG)GCCTTGCCAGCCCGCTCAGNNNN*N*N*5'-生物素,3'-磷酸,*=硫代磷酸酯化碱基23SADlRprime(TCAG)CTGAGCGGGCTGGCAAGG/3ddC5,-磷酸,3'-双脱氧-C24部分双链的寡核苷酸SADlF/SADlFprime通过下述制备,以1:1.2的摩尔比组合SAD1F和SADlFprime单链寡核普酸,和使用下述热程序退火80。C5分钟,65。C7分钟,6(TC7分钟,55。C7分钟,5CTC7分钟,45。C7分钟,40。C7分钟,35。C7分钟,30。C7分钟,25。C7分钟,4。C不定。部分双链的寡核普酸SADlR/SADlRprime以相同方式由SAD1R和SADlRprime制备。为了在衔接子连接后分离sscDNA文库,首先,20pl/样品的链霉抗生物素蛋白石兹(StreptavidinMagnetic)珠(DynalBiotech)如下在B&WBuffer+Tween(10mMTris-ClpH7.5,1mMEDTApH8.0,2MNaCl,0.1%Tween-20)中平衡。在磁性颗粒捕获单元中使珠与液体分开,且弃去上清液。将珠在1mlB&WBuffer+Tween中洗涤,在磁性颗粒捕获单元中与液体分开,且弃去上清液。随后将珠重悬浮于IOO(ilB&WBuffer+Tween/20pi起始珠体积中,且加入100|al连接的混合物(参见上文)中,且搅动15分钟。在磁性颗粒捕获单元中使珠与液体分开,且弃去上清液。将珠在200pi0.5XB&WBuffer+Tween中洗涤,在磁性颗粒捕获单元中与液体分开,且弃去上清液。珠在200^1珠洗涤緩冲液(BeadWashBuffer)(10mMTris-ClpH7.5,1mMEDTApH8.0,30mMNaCl,0.1%Tween-20)中洗涤2次,每次在磁性颗粒捕获单元中使珠与液体分开,且弃去上清液。添加100pi珠洗脱緩冲液(BeadElutionBuffer)(25mMNaOH,1mMEDTA,0.1%Tween-20),且于室温将样品搅动10分钟。在磁性颗粒捕获单元中使珠与液体分开,且将上清液(包含sscDNA文库)转移至新PCR管。对于sscDNA文库纯化向珠洗脱緩冲液中的sscDNA中加入140(ilRNACleanMix,随后混合,且在室温下温育IO分钟。在磁性颗粒捕获单元中使珠与液体分开,且弃去上清液。珠在70%乙醇中洗涤2次,随后风干。sscDNA在30pl10mMTris-ClpH7.5中进行洗脱。如上重复RNAClean程序,除了从42plRNAClean混合物开始,和最后用12pl10mMTris-ClpH7.5洗脱sscDNA。因此获得的sscDNA文库是PCR扩增的。将来自上文的2-3^1最终sscDNA洗脱物加入5|tU10XAdvantage2PCRBuffer(Clontech,MountainView,CA)、1.0piSADIF引物(200pM)、1.0|nlSADIRprimer引物(200)、2.0pi10mM每种dNTP、1|nlAdvantage2聚合酶混合物(PolymeraseMix)(Clontech)、和水中至50|^1的总体积。随后对反应混合物实施下述热循环方案步骤1:90。C,4分钟;步骤2:94°C,30秒;步骤3:64°C,30秒;步骤4:转到步骤2,18次或25次;步骤5:68°C,2分钟;步骤6:14°C,不定。扩增后,反应物用AMPure珠(Agencourt)进行纯化。将80微升AMPure珠混合物加入PCR反应中,且在磁性颗粒捕获单元中使珠与液体分开,且弃去上清液。珠在70%乙醇中洗涤2次,随后风干。扩增的双《连cDNA(dscDNA)文库在12pi10mMTris-ClpH7.5中进行洗脱。发现18个扩增循环比25个扩增循环有利,因为在25个循环后(而不是在18个循环后),观察到不合需要的产物以及扩增引物的严重耗尽(参见图IOA和10B)。观察到由10、20、50或200ng起始病毒RNA获得的dscDNA文库的大小分布是高度相似的(图13),从而证实本发明的方法从微量RNA生产cDNA文库的惊人能力。随后通过由454LifeSciences(Branford,CT)开发的测序技术对因此获得的cDNA文库实施核苷酸测序。用于核酸直接测序的这些技术已公开于全部于2004年1月28日提交的共同未决的美国专利申请USSN:10〃67,779、10〃67,899、10/768729和10/767,779,以及2005年8月1曰4是交的USSN11/195,254中。获得约13600个高质量读数。在这些中,12820个(94.26%)在已知流感毒林A基因组中发现至少35nt的BLAST命中。12820个BLAST命中在8个区段或流感病毒林ARNA基因组中的分布显示于表2中。表2:通过流感病毒株A的基因组区段列出的具有BLAST命中的高质量读数数目。<table>tableseeoriginaldocumentpage28</column></row><table>横过流感病毒林aRNA的8个区段的覆盖度深度描述于图11和12中,这显示本发明的方法产生横过8个区段每一个的覆盖度。为了评估本发明的方法在不同起始RNA量上的性能,比较高质量读数、BLAST阳性读数数目、和BLAST阳性高质量读数百分比。数据显示不管测序方向,使用10、20、50或200ng原材料获得相似结果(表3和图14)。表3<table>tableseeoriginaldocumentpage28</column></row><table>表3:由10、20、50或200ng起始RNA获得的测序结果。测序从5,到3,(A:上面4行)和从3,到5,(B;下面4行)进行。HQ:高质量读数;Blast〉35nt:与已知流感病毒抹A序列具有超过35个核苷酸的阳性BLAST命中的HQ读数。%HQBLAST〉35nt:与已知流感病毒林A序列具有超过35个核苷酸的阳性BLAST命中的HQ读数百分比。部分这种数据在图14中图示。考虑到本文公开的本发明说明书和实践,本发明的其他实施方案和用途对于本领域技术人员将是显而易见的。无论是为了什么原因在本文中提及的所有专利、专利申请和其他参考文献都具体引入作为参考。说明书和实施例应仅视为示例性的,而本发明的真实范围和精神由下述权利要求指出。权利要求1.一种用于从RNA产生文库的方法,其包括下述步骤(a)使所述RNA断裂以产生断裂的RNAs;(b)使多个引物与所述断裂的RNAs杂交以形成杂交的引物;(c)用逆转录酶使所述杂交的引物延长,以从所述RNA形成多个单链cDNAs,其中所述单链cDNAs在5’末端包含所述多个引物;(d)使第一种衔接子与所述cDNA的所述5’末端连接,其中所述衔接子包含与所述单链cDNA的5’末端互补的突出5’末端区域,和连接包含与所述cDNA的3’末端互补的突出3’末端区域的第二种衔接子,以形成包含在5’末端的第一种衔接子和在3’末端的第二种衔接子的单链cDNA;(e)使所述单链cDNAs纯化以产生所述cDNA文库。2.权利要求1的方法,其中所述断裂步骤产生大小为20碱基-10kb-成基的断裂的RNAs。3.权利要求1的方法,其中所述断裂步骤产生大小为100碱基-1000碱基的断裂的RNAs。4.权利要求l的方法,其中所述断裂步骤产生大小为150bp-500bp的断裂的RNAs。5.权利要求1的方法,其进一步包括在所述断裂步骤后所述断裂的RNAs的大小选择步骤。6.权利要求4的方法,其中所述大小选择富集大小为150bp-500bp的RNA。7.权利要求1的方法,其进一步包括在延长和连接步骤之间、用RNA酶消化所述断裂的RNAs的步骤。8.权利要求1的方法,其中所述多个引物是包含具有已知特性的一个或多个非随机引物碱基的半随机引物。9.权利要求8的方法,其中所述第一种衔接子包含单链区域和双链区域,且其中所述单链区域是在随机序列内包含具有已知特性的一个或多个非随机衔接子碱基的半随机单链区域,且其中所述非随机引物碱基与所述非随机衔接子碱基互补。10.权利要求8的方法,其中所述多个引物包含序列xnnx且其中所述第一种衔接子的所述半随机单链区域包含序列ynny,其中x和y是互补碱基且其中n是随机碱基。11.4又利要求10的方法,其中xrnix是tnnt且yrniy是amia。12.权利要求9的方法,其中所述引物包含序列tnntnnnnnn(SEQIDNO.1)。13.权利要求1的方法,其中所述第一种衔接子或第二种衔接子进一步包含结合对的一个成员。14.权利要求13的方法,其中所述结合对选自FLAG/FLAG抗体;生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、受体/配体、抗原/抗体、受体/配体、polyHIS/镍、A蛋白/抗体及其衍生物。15.权利要求13的方法,其中所述纯化步骤包括通过所述结合对的一个成员纯化所述单链cDNA。16.权利要求l的方法,其中所述纯化步骤是大小分级分离步骤。17.权利要求1的方法,其中所述方法在不存在依赖DNA的DNA聚合酶的情况下进行。18.权利要求13的方法,其中所述结合对的一个成员是生物素,且其中所述纯化步骤通过使所述单链cDNA与链霉抗生物素蛋白包^f皮的固体支持体结合来进行。19.权利要求l的方法,其中所述第一种衔接子包含2条核酸链,且其中所述结合对的一个成员与所述链之一附着。20.权利要求l的方法,其中所述第二种衔接子包含2条核酸链,且其中所述结合对的一个成员与所述链之一附着。21.权利要求l的方法,其中所述纯化步骤包括使所述cDNA变性以去除与所述cDNA杂交的任何核酸。22.权利要求20的方法,其中所述变性步骤使所述cDNAs的所述5,和3'末端上的所述第一种和第二种衔接子变性。23.权利要求1的方法,其进一步包括测定所述单链cDNAs的至少部分核酸序列的步骤。24.权利要求1的方法,其进一步包括对所述cDNA文库进行cDNA扣除的步骤。25.权利要求l的方法,其中所述RNA来自单个组织。26.权利要求l的方法,其中所述RNA来自选自下述的来源多个组织、单种细胞、多种细胞、体液、单个生物、多个生物、环境样品、生物膜、细菌、古菌、真菌、纟直物、动物、人、病毒、逆转录病毒、噬菌体、寄生物、肿瘤、肿瘤样品或生物样品。27.权利要求1的方法,其中所述RNA来自处于相同细胞周期的细胞。28.—种非扩增的单链cDNA文库,其通过权利要求1的方法产生。29.—种扣除cDNA文库,其通过权利要求28的方法产生。30.—种用于从RNA产生文库的方法,其包括下述步骤(a)使所述RNA断裂以产生断裂的RNAs;(b)使多个引物与所述断裂的RNAs杂交以形成杂交的引物,其中所述引物包含具有衔接子序列的5'区域、和用于与所述断裂的RNA杂交的3'区域;(c)用逆转录酶使所述杂交的引物延长,以形成来自所述RNA的多个单链cDNAs,其中所述单链cDNAs在5'末端包含所述多个引物;(d)连接包含与所述cDNA的3,末端互补的突出3,末端区域的衔接子,以形成在3,末端包含衔接子的单链cDNA;(e)使所述单链cDNAs纯化以产生所述cDNA文库。31.权利要求30的方法,其中所述引物的所述3'区域包含序列rninmm。32.权利要求30的方法,其中所迷引物的所述3'区域包含序列mimmnv。33.权利要求30的方法,其中所述引物的所述3'区域包含序列ttttttv。34.权利要求30的方法,其中所述断裂步骤产生大小为20碱基-10kb;咸基的断裂的RNAs。35.权利要求30的方法,其中所述断裂步骤产生大小为IOO碱基-1000碱基的断裂的RNAs。36.权利要求30的方法,其中所述断裂步骤产生大小为150bp-500bp的断裂的RNAs。37.权利要求30的方法,其进一步包括在所述断裂步骤后所述断裂的RNAs的大小选择步骤。38.权利要求37的方法,其中所述大小选择富集大小为150bp-500bp的RNA。39.权利要求30的方法,其中所述RNA是富集聚腺苷酸RNAs的RNA群体。40.权利要求30的方法,其进一步包括在所述延长和所述连接步骤之间、用RNA酶消化所述断裂的RNAs的步骤。41.权利要求1的方法,其中所述引物或所述衔接子进一步包含结合对的一个成员。42.权利要求40的方法,其中所述结合对选自FLAG/FLAG抗体;生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、受体/配体、抗原/抗体、受体/配体、polyHIS/镍、A蛋白/抗体及其衍生物。43.权利要求42的方法,其中所述纯化步骤包括通过所述结合对的一个成员纯化所述单链cDNA。44.权利要求30的方法,其中所述纯化步骤是大小分级分离步骤。45.权利要求30的方法,其中所述方法在不存在依赖DNA的DNA聚合酶的情况下进行。46.权利要求43的方法,其中所述结合对的一个成员是生物素,且其中所述纯化步骤通过使所述单链cDNA与链霉抗生物素蛋白包被的固体支持体结合来进行。47.权利要求30的方法,其中所述衔接子包含2条核酸链,且其中所述结合对的一个成员与所述链之一附着。48.权利要求30的方法,其中所述纯化步骤包括使所述cDNA变性以去除与所述cDNA杂交的任何核酸。49.权利要求30的方法,其中所述变性步骤使所述cDNAs的所述3'末端上的所述衔接子变性。50.权利要求30的方法,其进一步包括测定所述单链cDNAs的至少部分核酸序列的步骤。51.权利要求30的方法,其进一步包括对所述cDNA文库进行cDNA扣除的步骤。52.权利要求30的方法,其中所述RNA来自单个组织。53.权利要求30的方法,其中所述RNA来自选自下述的来源多个组织、单种细胞、多种细胞、体液、单个生物、多个生物、环境样品、生物膜、细菌、古菌、真菌、植物、动物、人、病毒、逆转录病毒、噬菌体、寄生物、肿瘤、肿瘤样品或生物样品。54.权利要求30的方法,其中所述RNA来自处于相同细胞周期的细胞。55.—种非扩增的单链cDNA文库,其通过权利要求30的方法产生。56.—种扣除cDNA文库,其通过权利要求55的方法产生。全文摘要提供了使用与自动化测序系统相容的衔接子序列,用于使mRNA样品高通量加工成cDNA文库的新生物化学规程。所提供的方法生产没有与目前cDNA文库生产方法相关的3’偏倚的cDNA文库。还提供了用于从DNA生产DNA文库的新方法。文档编号C12Q1/68GK101263227SQ200680034002公开日2008年9月10日申请日期2006年9月18日优先权日2005年9月16日发明者D·A·威洛比,J·F·西蒙斯,S·K·哈奇森申请人:454生命科学公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1