使用Ⅲ型限制酶分离包括超过25个核苷酸的鉴定标志的制作方法

文档序号:453313阅读:423来源:国知局
专利名称:使用Ⅲ型限制酶分离包括超过25个核苷酸的鉴定标志的制作方法
技术领域
本发明涉及分子生物学领域和基因表达分析。在此范围内,其涉及使用III型限制酶分离转录物的限定区。
背景技术
通过基因工程方法对基因的结构和表达的修饰为各种医学、药物和农业应用提供了巨大的潜力。为了检测和选择用于基因工程的靶基因,通过表达谱广泛筛选在不同发育阶段和在各种环境条件(如应激)下的细胞、组织、器官或生物体。基因表达分析最有效的技术之一是由Velculescu等,Science 270484-487,1995开发的SAGETM(基因表达的系列分析)。
在最初的SAGETM方案(

图1)中,确定的细胞、组织或器官的信使RNA(mRNA)库用作来源材料,使用生物素化的寡聚-dT引物,通过反转录酶从mRNA反转录形成互补DNA(cDNA)。将产生的单链cDNA转换成双链DNA,并用限制酶NlaIII消化,其识别基序5’-CATG-3’。使用链霉抗生物素包被的磁珠回收双链cDNA的3’端片段。将cDNA分成两部分。然后将两个接头(接头1和接头2)连接到每个cDNA部分上。接头含有基序5′-GGGAC-3′。这是II型限制酶BsmFI的识别位点,其以3’方向将13bp从识别位点上切割下来。因此,BsmF1对连接的cDNAs的处理释放cDNA的13-bp片段,称作“标志”序列,连同接头片段(“接头-标志”片段)一起。然后将从cDNAs的两个部分中产生的两个接头-标志片段以两个标志在相邻的位置以形成双标志的这种方式相互连接,随后用对接头序列特异的引物进行PCR。通过NlaIII消化除去接头片段后,将双标志连接起来并克隆到适当的质粒中。质粒插入片段的测序显示一系列两侧是4-bp 5’-CATG-3’序列的9bp标志。使用13-bp标志序列,在许多情况中通过查询可利用的被表达序列标志(EST)数据库,可鉴定标志序列来源的基因。因此,测量了成千上万个标志的序列后,可计数样品中每个标志的数量,并且进一步鉴定与其对应的基因。
上述SAGETM方案因而是一种研究总体基因表达的有效方法。然而,标志序列的大小有限(仅13bp)不足以明确地鉴定标志来源的基因。一个标志序列可能对应于几种不同的EST序列,并且可能使进一步分析不知所措。
为了改进这种情况,最近开发了一种所谓的“LongSAGETM”方案,包括II型限制性内切酶MmeI。由于使用MmeI(代替最初SAGETM方案中的BsmFI),可回收19到21-bp长的标志(Saha等Nature Biotechnology20508-512,2002)。
MmeI消化产生3’-突出末端(2个碱基突出)。在双标志连接前,为了在MmeI消化后产生钝端,必需除去3’-突出。当前没有一种酶可用于填充3’-突出。产生钝端必需除去3’-突出,结果使标志序列的长度减少到17-19bp,导致标志序列中所包含的信息减少。
因此,在公开的LongSAGETM方案中(Saha等,Nature Biotechnology20508-512,2002),MmeI消化后末端没有被磨光,并且在具有3’-突出的片段之间进行连接。这意味着接头-标志片段自身仅与另一个含有相容3’-末端的接头-标志片段连接。这使得连接后形成的双标志不是标志随机联合的结果。该方法理论上扭曲了所得双标志中每种标志的表现,并且LongSAGETM的最后结果可能不能忠实地反映每种基因的表达量。因此,LongSAGETM不适合用于基因表达的准确定量分析。这表现了LongSAGETM的严重缺陷。由于这种原因,当前的LongSAGETM仅用于帮助注释通过常规SAGETM方案获得的13-bp标志序列。
LongSAGETM方案向前迈进了一步,因为它提高了成功鉴定与标志对应基因的可能性,假设可获得EST和/或基因组DNA序列信息。然而,为了将SAGETM方案应用于生物体,由于其没有EST或基因组DNA数据库可利用,因此必需使用标志序列作为引物,通过PCR恢复更长的cDNA,或者作为寡核苷酸探针,通过基于杂交的技术筛选相关的cDNA文库。对于这些目的,19-21bp的标志长度仍然太短,不能明确地鉴定标志序列来源的基因。
因此,急需一种分离显著更长,至少25bp长的标志的方法,使用该标志可进行表达的准确定量分析。然而,到目前为止一直没有得到这种方法。
发明概述本发明提供一种分离超过25bp长的“标志(tag)”序列的方法,优选地长26到50bp,最优选地长26到28bp,从DNAs的已知位置开始,因而提高了通过常规SAGETM分析可靠地鉴定相应基因的效率。此外,由于双标志是通过标志的随机联合制备的,因此通过该方法获得的基因表达谱理论上比那些从LongSAGE分析中获得的更准确。我们在下文中称这种具有超过25bp的新标志片段的改良SAGETM方法为“SuperSAGE”。
这里所描述的方法是基于使用III型限制酶,用于从cDNA的确定位置开始分离超过25bp长的标志序列。在本发明中,术语标志指能鉴定被表达基因的特异性核苷酸序列。标志的3’末端通过III型限制酶的切割位点确定,标志的5’末端通过最接近cDNA 3’末端的另一种限制酶的切割位点确定。
“限制酶”是能识别双链DNA上4到8个核苷酸的特异性序列并且切割该序列的内切酶的总称。当前将限制酶分成四个不同的类型,称作I、II、III和IV型(Roberts等2003,Nucleic Acids Res.311805-1812)。III型限制酶是由甲基化酶和内切酶亚单位构成并且识别靶DNA中非回文核苷酸序列的复合蛋白。对于核酸内切酶活性,它们需要与两个拷贝的识别序列在功能上合作,此外,这两个拷贝需要在DNA双链内方向相反(Muecke等2001,J.Molec.Biol.312687-698)。
在本发明中,使用上述III型限制酶分离长度超过25bp的标志序列。在http//rebase.neb.com/cgi-bin/azlist?re3.中公开了这种III型酶的实例。优选在本发明中使用的III型酶包括EcoPI、EcoP15I等。
在本发明最优选的实施方案中,III型限制酶是EcoP15I。III型限制酶EcoP15I识别靶DNA分子上两个未甲基化的反向5’-CAGCAG-3’位点,并且将25到28bp从识别位点之一的3’端消化下来。因此,EcoP15I提供具有突出的5’末端的片段,其使用常规3’填充反应很容易钝端化。
另一种酶的优选实例是能将cDNA切割成每个片段平均长200bp到300bp的酶,如

最优选的酶是NlaIII。
本发明也提供一种包括超过25个核苷酸并且能鉴定被表达基因的标志,其中标志的3’末端通过III型限制酶的切割位点确定,标志的5’末端通过最接近被表达基因的cDNA 3’末端的另一种限制酶的切割位点确定。
在本发明的优选实施方案中,III型酶是EcoP15I并且另一种限制酶是能将cDNA切割成每个片段平均长200bp到300bp的酶,如上所述。最优选的酶是NlaIII。
在下面表1中显示了本发明标志的实例。这些标志比常规SAGE标志或LongSAGE标志更长,并且允许更准确地鉴定对应的基因。
本发明进一步提供包括两个标志的双标志-寡核苷酸,其中的每一个标志来自不同的被表达基因。双标志-寡核苷酸通过包括下列步骤的方法制备1)使用包括寡-dT和III型限制酶识别序列的引物从被表达基因的mRNA合成cDNA库,随后用另一种限制酶消化cDNA库;2)从上述cDNA库中纯化包括多聚腺苷酸序列的片段,并将片段与接头-A或接头-B连接,两者都包括III型限制酶的识别序列;3)用III型限制酶消化上述片段,进行3’-填充反应后将得到的包括接头-A的片段与得到的包括接头-B的片段连接;和4)用步骤1)的另一种限制酶消化上述所连接的片段,以便将接头序列切割下来,因而获得双标志-寡核苷酸。
如在上述步骤中所示,通过用于从mRNA反转录形成cDNA的RT引物,将III型限制酶的第一个识别位点整合到靶cDNA中,通过接头序列将III限制酶的第二个识别位点整合到靶cDNA中。
由序列5’-N18-25-CAGCAG-T15-25-3’定义RT引物,其中N18-25是18到25个任意核苷酸序列,不包括序列5’-CAGCAG-3’和序列5’-CATG-3’。可修饰RT引物的5’末端,例如通过生物素修饰。
本发明的III型限制酶提供具有突出5’末端的片段,其可使用常规3’填充反应很容易地钝端化。换句话说,在上述步骤3)中,可以很容易地使包括接头-A的片段和包括接头-B的片段钝端化并且因而允许片段的随机联合而标志大小没有任何减小。
在本发明的优选实施方案中,III型限制酶是EcoP15I,另一种限制酶是能将cDNA切割成每个片段平均长200bp到300bp的酶,如NlaIII。
在本发明的生产双标志-寡核苷酸的方法中,使用两个接头(接头-A和接头-B)。接头A和接头-B是互不相同的双链DNA。参与连接的双链接头片段的一端包括与连接序列相邻的III限制酶的识别序列。例如,当III型限制酶是EcoP15I,另一种限制酶是NlaIII时,两个接头在它们第一条链的3’端都包括5’CAGCAGCATG-3’序列。有下划线的序列5’CAGCAG-3’构成EcoP15I的一个识别位点,5’-CATG-3’序列构成3’突出的单链区与NlaIII消化所产生的片段相连。
不参与连接的双链接头片段的另一端可通过标记试剂如FITC(异硫氰酸荧光素;第一链的5’末端)以及通过氨基部分(第二链的3’末端)进行修饰。
因此,通过将下列DNA(1)的第一链和DNA(2)的第二链退火而制备接头;DNA(1)5’-N30-40-CAGCAGCATG-3’DNA(2)3’-N30-40-GTCGTC-5’其中,DNA(1)的N30-40和DNA(2)的N30-40是30到40个碱基的任意核苷酸序列,其相互之间互补,并且其中可标记DNA(1)的5’末端以及可氨基修饰DNA(2)的3’末端。
本发明进一步提供通过连接上述双标志-寡核苷酸获得的多核苷酸。可通过PCR克隆并扩增每种双标志-寡核苷酸。多核苷酸包括至少2个双标志-寡核苷酸,优选包括2到200个双标志-寡核苷酸。通过两个标志的随机联合制备本发明的双标志-寡核苷酸,因此多核苷酸也是标志的随机串连。
本发明进一步提供基因表达分析的方法,包括多核苷酸的核苷酸序列分析,以及基于与多核苷酸中包含的被表达基因对应的标志的数量对所表达基因的表达水平进行定量。
例如,本发明的方法包括下列步骤1)使用包括寡-dT和III型限制酶识别序列的RT引物从表达基因的mRNA合成cDNA库,随后用另一种限制酶消化cDNA库;2)从上述cDNA库中纯化包括多聚腺苷酸序列的片段,以及将片段与接头-A或接头-B连接,两者都包括III限制酶的识别序列;3)用III型限制酶消化上述片段,3’-填充反应后将得到的包括接头-A的片段与得到的包括接头-B的片段连接;4)用步骤1)的另一种限制酶消化上述所连接的片段,以便将接头序列切下来,因此获得包括两个超过25个核苷酸并能鉴定被表达基因的标志的双标志-寡核苷酸;5)连接双标志-寡核苷酸产生多核苷酸;和6)分析上述多核苷酸的核苷酸序列,基于与多核苷酸中所包含的被表达基因对应的标志的数量对被表达基因的表达水平进行定量。
在该方法优选的实施方案中,III型酶是EcoP15I,另一种限制酶是能将cDNA切割成每个片段平均200bp到300bp长的酶,如NlaIII。关于接头,可优选使用上述双链DNA。
本发明进一步提供分离包括超过25个核苷酸并能鉴定被表达基因的标志的试剂盒,包括下列成分a)由序列5’-N18-25定义的RT引物,不包括序列5’-CAGCAG-3’和序列5’-CATG-3’,其中RT引物的5’末端可以生物素化。
b)接头-A和接头-B,其是互不相同的双链DNA并通过将下列DNA(1)的第一链和DNA(2)的第二链退火制备;DNA(1)5’-N30-40-CAGCAGCATG-3’DNA(2)3’-N30-40-GTCGTC-5’其中,(1)的N30-40和(2)的N30-40是30到40个任意的核苷酸序列,其相互之间互补,可标记DNA(1)的5’端以及可氨基修饰DNA(2)的3’端。
c)能与上述接头-A或接头-B杂交的引物试剂盒也可包括III型限制酶如EcoP15I酶和/或另一种限制酶如NlaIII。除了上面提到的成分外,试剂盒可进一步包括进行本发明基因表达分析所必需的其它成分。实例包括标记试剂、缓冲液、磁珠等。
附图简述图1显示常规SAGETM方案的示意图(Velculescu,等,Science270484-487,1995)。
图2显示使用EcoP15I分离26-bp cDNA SuperSAGE标志方法的示意图。
图3总结了使用通过EcoP15I所获得的26-bp标志的SuperSAGE分析的应用。
图4显示了EcoP15I消化后产物电泳的实例(步骤6,图2),通过FITC荧光显示。在图的右侧描述了每个片段的结构。在这个实例中,来自水稻叶的mRNA分子用作cDNA合成的模板。
图5显示来自图2步骤9的PCR产物的电泳(PAGE)实例。预期的PCR产物的大小是大约97bp。
图6显示PCR产物(步骤10)NlaIII消化后所得片段的电泳(PAGE)实例。双标志的大小是大约52bp。
图7显示双标志的串连片段的电泳实例(步骤11)。
图8显示菌落PCR产物的电泳实例(步骤14)。
图9显示克隆的多联体中所含DNA序列的实例(步骤15)。
图10显示使用从稻瘟病菌(Magnaporthe grisea)感染的水稻叶中分离的RNAs,使用26-bp标志序列作为PCR引物的RT-PCR结果。
图11显示在用马铃薯晚疫病菌(Phytophthora infestans)的INF1激发子(elicitor)蛋白处理或者用水作为对照处理的本塞姆氏烟草(Nicotiana benthamiana)中RT-PCR的结果。
图12显示由SuperSAGE鉴定的四个基因的基因表达的RT-PCR动态研究。
本发明的优选实施方案参考图2,以下描述使用EcoP15I作为III型限制酶的本发明的优选
III型限制-修饰的酶EcoP15I识别靶DNA分子中两个未甲基化的反向5’-CAGCAG-3’位点,并且将25到28bp从识别位点之一的3’-末端消化下来。本发明涉及EcoP15I酶用于从cDNAs的确定位置分离25-到28-bp标志序列的所有潜在的应用。
使用生物素化的寡-dT-锚式引物(以下称作“RT引物”或反转录引物)从mRNA合成双链cDNA。该RT引物包括18到25个碱基的任意核苷酸序列和5’-CAGCAG-3’序列,随后是15到25个碱基的寡-dT序列。在RT引物中所包含的5’-CAGCAG-3’序列构成EcoP15I的一个识别位点(图2,步骤1)。例如,包括22个核苷酸序列和5’-CAGCAG-3’序列,随后是19-dT序列的RT引物是5’-CTGATCTAGAGGTACCGGATCCCAGCAGTTTTTTTTTTTTTTTTTTT-3’(SEQ ID NO1)。
用限制性内切酶NlaIII消化合成的cDNA,该酶识别基序5’-CATG-3’。仅包括RT引物序列的消化片段(生物素标记)被链霉抗生物素蛋白包被的磁珠捕获(图2,步骤2和3)。
将双链接头片段(46bp)与磁珠捕获的cDNA片段(包括多聚腺苷酸序列)的末端连接。这种参与连接的接头片段的一端包括与第一链中5’-CATG-3’序列相邻的5’-CAGCAG-3’序列(图2,步骤4)。5’-CAGCAG-3’序列构成EcoP15I的一个识别位点,5’-CATG-3’序列构成与NlaIII消化所产生片段的粘性末端连接的3’突出的单链区。通过FITC(异硫氰酸荧光素;第一链的5’末端)和氨基部分(第二链的3’末端)修饰不参与连接的双链接头片段的另一末端。
在本发明中,使用两个接头。例如,通过将下列两个寡核苷酸退火而制备接头-AFITC-5′-TTTGGATTTGCTGGTGCAGTACAACTAGGCTTAATACAGCAGCATG-3’(SEQ ID NO2)和5′-CTGCTGTATTAAGCCTAGTTGTACTGCACCAGCAAATCCAAA-3′-NH2(SEQ ID NO3)。
通过将下列两个寡核苷酸退火制备接头-B
ETTC5′-TTTCTGCTCGAATTCAAGCTTCTAACGATGTACGCAGCAGCATG-3′(SEQ ID NO4)和5′-CTGCTGCGTACATCGTTAGAAGCTTGAATTCGAGCAGAAA-3′-NH2(SEQ ID NO5)。
将cDNA库分成两半,一半与接头-A连接,另一半与接头-B连接,得到“接头-A连接的cDNAs”和“接头-B连接的cDNAs”。
对于接头-A连接的cDNAs和接头-B连接的cDNAs,用EcoP15I消化结合到磁珠上的DNA片段(图2,步骤5)。EcoP15I识别一对反向基序5’-CAGCAG-3’,并且将25到28bp从识别位点之一的3’-末端上切下来。消化后,从磁珠上释放两个片段。一个是包括接头和27-或28-bp标志片段的片段(总的大小是69或70bp),另一个片段是位于双链cDNA片段中央的大小可变的片段。包括多聚腺苷酸序列的片段仍然与磁珠结合,不参与下列步骤。
在UV辐射下,通过FITC荧光显示包括接头和27-或28-bp标志序列的69-或70-bp片段,并且通过凝胶切除很容易地从聚丙烯酰胺凝胶中分离。
EcoP15I提供具有突出的5’末端的片段,其很容易地通过常规3’-填充反应钝端化,因而允许片段的随机联合。因此,通过3’-填充反应使分别由接头-A连接的cDNAs和接头-B连接的cDNAs产生的每个69-或70-bp片段(接头-标志片段)钝端化,并且相互连接,通过两个标志的随机联合形成双标志。通过氨基修饰阻断接头片段的3’末端,因此仅在钝端化的cDNA标志序列两侧之间发生连接(图2,步骤6,7)。
通过PCR扩增所得的双标志分子(图2,步骤9)。下面显示从接头序列设计的PCR引物的实例双标志引物1E生物素-5’-CAACTAGGCTTAATACAGCAGCA-3′(SEQ ID NO6)双标志引物2E生物素-5’-CTAACGATGTACGCAGCAGCA-3′(SEQID NO7)使用上述引物通过PCR获得的PCR产物的预期大小是大约97bp。
用NlaIII消化大约97bp的PCR产物(图2,步骤10),因而释放大约52-bp双标志片段。从凝胶中回收这些片段并纯化。
通过连接反应将双标志片段串连起来(图2,步骤11)。通过琼脂糖凝胶电泳分离多联体。从凝胶中洗脱并回收超过500bp的片段。
将根据大小分离的多联体片段连接到用SphI预消化并用小牛肠磷酸酶处理的适当质粒载体上(图2;步骤12),将质粒转化到大肠杆菌(E.coli)中(图2;步骤13)。
PCR扩增质粒的插入片段(图2;步骤14)。
对PCR产物直接测序(图2;步骤15)。一系列大约44-bp双标志序列的两侧是NlaIII识别序列CATG。该大约52(44+8)-bp序列信息提供两个从每个cDNA的确定位置分离的26-到28-bp标志序列。
计数样品中26-bp标志的数量后,可获得如在最初SAGETM方案中所述的基因表达谱。由于本发明的双标志是通过钝端化标志的随机联合形成的,因此结果忠实地反映了每种基因的表达情况。
26-bp标志序列含有足够的信息能唯一地鉴定标志来源的基因。由于26-bp DNA序列中的信息量,因此使对应基因的in silico鉴定变得很容易。甚至26-bp标志序列对Genbank序列整体的BLAST搜索将显示对标志来源基因的正确匹配(图3)。
如果将所描述的方法应用于没有可利用的DNA序列数据的生物体,那么26-bp标志序列可直接用作3’-RACE的PCR引物用以恢复cDNA的3’区。这种cDNA序列可用于BLAST搜索以鉴定基因(图3)。
如RT-PCR一样,可用26-bp标志序列直接进行3’-RACE以定量信息的量,用于证明SuperSAGE所揭示的样品之间的基因表达差异(图3)。
26-bp标志序列比引起“RNA干扰”(RNAi)所需DNA序列的最小大小(21bp)长(Elbashir等Nature 411494-498,2001)。因此,可将包括标志序列的双链RNA立即用于功能性分析以敲除与标志对应的基因。这意味着可将通过SuperSAGE进行的基因表达分析直接与具有26-bp标志分离的基因功能分析联系起来。
对于在植物物种的应用,可将上述3’-RACE片段克隆到植物病毒载体中,并用于“病毒-诱导的基因沉默(VIGS)”(Baulcombe,Curr.Opin.Plant Biol.2109-113,1999),因此所述的SuperSAGE法将基因表达分析也与植物中的基因功能分析联系起来。
实施例参考下列实施例更详细地描述本发明,尽管本发明的范围不限于这些实施例。
作为原理的证据,通过上述方法从水稻(Oryza sativa cv.Kakehashi)的模拟损害的突变体IB2020的叶中分离26-和27-bp标志序列。
1)制备mRNA通过常规RNA分离方法从水稻的叶片中分离总RNA。使用“mRNA纯化试剂盒”(Amersham Pharmacia)从该RNA中分离5μg mRNA。将mRNA溶于29μl DEPC水中,并用作来源材料。
2)使用寡-dT引物合成cDNA使用下列包括EcoP15I酶的识别序列5’-CAGCAG-3’基序的反转录引物,使用“cDNA合成系统”(Invitrogen)反转录该mRNA产生单链cDNA。
反转录引物5’-CTGATCTAGAGGTACCGGATCCCAGCAGTTTTTTTTTTTTTTTTTTT-3’(SEQ ID NO1)使用相同的试剂盒将产物转换成双链cDNA,乙醇沉淀,溶于20μLLoTE缓冲液(3mM Tris-HCl pH7.5,0.2mM EDTA)。
3)NlaIII消化将得到的双链cDNA(20μL)在200μL包括溶于含有0.1mg/ml BSA的1x NEB缓冲液4(NEB)的50单位NlaIII(New England BioLabs;NEB)的反应液中37℃消化90分钟。消化后,用TE-平衡的苯酚/氯仿/异戊醇(25∶24∶1;pH8.0)提取cDNA,乙醇沉淀,以及溶于20μl LoTE缓冲液。
在两个Eppendorf管的每一个中,转移1ml链霉抗生物素磁珠悬液(链霉抗生物素Magnesphere顺磁颗粒,Promega)。使用磁分离台(Magnesphere技术磁分离台),将磁珠用200μl 1x B&W溶液(5mMTris-HCl pH7.5,0.5mM EDTA,1M NaCl)冲洗一次。冲洗后,向每个管中添加100μl 1x B&W缓冲液和从上述步骤中获得的10μl cDNA以及90μl水,混合,并在室温孵育30分钟。将由磁珠结合的cDNA用1xB&W缓冲液冲洗3次并用LoTE缓冲液冲洗3次。
4)接头连接商业合成下列寡核苷酸(Qiagen)。
接头-A1FITC-5′-TTTGGATTTGCTGGTGCAGTACAACTAGGCTTAATACAGCAGCATG-3’(SEQ ID NO2)接头-A25′-CTGCTGTATTAAGCCTAGTTGTACTGCACCAGCAAATCCAAA-3′-NH2(SEQ ID NO3)接头-B1FITC5′-TTTCTGCTCGAATTCAAGCTTCTAACGATGTACGCAGCAGCATG-3′(SEQ ID NO4)接头-B25′-CTGCTGCGTACATCGTTAGAAGCTTGAATTCGAGCAGAAA-3′-NH2(SEQ ID NO5)通过T4多核苷酸激酶(NEB)使接头-A2和接头-B2的5’末端磷酸化。通过将接头-A1和磷酸化的接头-A2退火制备接头-A,通过将接头-B1和磷酸化的接头-B2退火制备接头-B。接头-A和接头-B两者都含有EcoP15I识别序列(5’-CAGCAG-3’)。
向含有与磁珠结合的cDNA的两个管中的每一个添加17μl LoTE、3μl 5X连接酶缓冲液(Invitrogen)和1μg接头-A或接头-B。混合后,将管在50℃孵育2分钟并置于室温中15分钟。随后,向管中添加2μl T4DNA连接酶(5单位/μl,Invitrogen)并在16℃孵育90分钟。接头连接后,将磁珠用1X B&W冲洗4次,用LoTE缓冲液冲洗3次以及用无菌蒸馏水冲洗一次。
5)EcoP15I消化在100μl反应混合物(10mM Tris-HCl pH8.0、10mM KCl、10mMMgCl2、0.1mM EDTA、0.1mM DTT、5μg/ml BSA、2mM ATP)中用10单位EcoP15I消化磁珠上接头连接的cDNA。将管在37℃孵育90分钟。
6)接头-标志片段的纯化EcoP15I消化后,将管置于磁台上。通过链霉抗生物素包被的磁珠除去生物素化的最外面的3’末端片段后,收集含有接头-标志片段的未结合部分,并转移到新管中。通过苯酚/氯仿/异戊醇(25∶24∶1;pH8.0)提取所收集的溶液,乙醇沉淀,溶于10μl LoTE缓冲液,并通过8%聚丙烯酰胺凝胶电泳分离。在相邻的泳道,加入用SYBR绿(FMC)预染的大小标记(20bp梯,TAKARA)。电泳后,将凝胶置于UV发光器上,通过其FITC介导的荧光显示大约69bp大小的接头-标志片段(图4)。也显示了两个推测来自接头-接头连接物(大约90bp)和单个接头片段(46bp)的额外片段。如果FITC-荧光产生太弱的信号,可用SYBR绿(FMC)将凝胶染色以显示接头-标志片段。将大约69-bp接头-标志片段从凝胶中切下来并置于底部有由注射器针所制备的针孔的0.5ml管中。将0.5ml管置于2ml管内,并以15000rpm离心2分钟。向在2ml管底部收集的小凝胶碎片中添加LoTE缓冲液(300μl),将它们在37℃孵育2小时,随后在65℃孵育15分钟。将凝胶悬液转移到SpinX柱(Coaster)中并以15000rpm离心2分钟。将回收的溶液通过苯酚/氯仿/异戊醇(25∶24∶1;pH8.0)提取一次,乙醇沉淀并溶于8μl LoTE缓冲液。
7)标志片段的钝化使用试剂盒(Blunting High;TOYOBO)通过DNA聚合酶填充接头-标志片段的5’突出。向含有接头-标志片段的溶液(8μl)中添加1μl反应缓冲液(KOD缓冲液;TOYOBO)和1μl KOD聚合酶(TOYOBO),并在72℃孵育2分钟。
8)连接形成双标志将来自接头-A和接头-B的接头-标志片段连接形成双标志片段。将等体积(2μl)的钝端化的接头-A-标志和接头-B-标志溶液混合,并添加6μl LoTE和10μl连接混合物(Ligation High,TOYOBO)。在16℃,孵育连接溶液4小时到过夜。
9)双标志PCR将得到的双标志溶液稀释5倍和10倍,并用作双标志PCR的模板。在288个(=96×3)每个含有50μL溶液的0.2ml管中进行PCR反应,其中溶液中含有1μL稀释的双标志模板、3单位Taq聚合酶(AmpliTaqGold;Applied Biosystems)、1x AmpliTaq Gold缓冲液和PCR引物。将PCR引物的5’末端进行如下生物素化(由Qiagen商业合成)。
双标志引物1E生物素-5’CAACTAGGCTTAATACAGCAGCA-3′(SEQ ID NO6)双标志引物2E生物素-5’-CTAACGATGTACGCAGCAGCA-3′(SEQID NO7)PCR由在95℃起始变性12分钟,随后进行27-29个循环,每个循环94℃40秒和60℃40秒构成。扩增的双标志片段的预期大小是大约97bp(图5)。
10)双标志PCR产物的纯化将双标志PCR产物(约300管)混合到10ml塑料管内。苯酚/氯仿/异戊醇(25∶24∶1;pH8.0)提取和乙醇沉淀后,将其溶于100μl LoTE缓冲液。将该PCR产物在1.5%低熔点的琼脂糖(SeaPlaque,FMC)凝胶上电泳,将大约97bp片段从凝胶上切下来,将其通过Qiagen凝胶提取试剂盒(Qiagen)进行纯化。
11)通过NlaIII消化除去接头用溶于含有0.1mg/ml BSA的1x NEB缓冲液4(NEB)的120单位MaIII(NEB)消化在121μl LoTE缓冲液中洗脱的经过纯化的大约97bp片段。通过凝胶电泳证实消化后(显示52bp、22bp和23bp大小的三个片段,图6),将消化液在室温下用链霉抗生物素蛋白磁珠处理30分钟除去接头片段。通过磁台收集管中的磁珠后,将上清液转移到新管中,用苯酚/氯仿/异戊醇(25∶24∶1;pH8.0)提取DNA,乙醇沉淀并溶于10μl LoTE缓冲液。
12)52bp双标志片段的纯化将回收的DNA在12%聚丙烯酰胺凝胶中电泳。为了显示片段,将凝胶用SYBR绿(FMC)染色。在UV透射仪上将大约52bp大小的片段从凝胶上切下来。根据上述方法从凝胶中洗脱DNA。将从凝胶中洗脱的DNA溶液用链霉抗生素磁珠在室温下处理30分钟。收集上清液,并通过苯酚/氯仿/异戊醇(25∶24∶1;pH8.0)提取,乙醇沉淀并溶于7μl LoTE缓冲液。
13)形成多联体对于双标志片段的串连,将7μl双标志溶液、2μl 5X连接酶缓冲液和5单位T4连接酶(Invitrogen)混合并在16℃孵育1-4小时。将连接溶液在65℃孵育10分钟,并加样到1%琼脂糖凝胶上(图7)。将大于500bp的DNA片段从凝胶中切下来并洗脱。将纯化的多联体溶于6μlLoTE缓冲液。
14)载体克隆将5μg克隆载体(pGEM3Z,Promega)用SphI消化,并用小牛小肠碱性磷酸酶(CIAP)处理。为了克隆多联体,使用T4连接酶(Invitorgen)连接这种消化的pGEM3Z载体和双标志多联体。4小时连接后,反应液用苯酚/氯仿/异戊醇(25∶24∶1)提取,并用乙醇沉淀。将沉淀用70%乙醇冲洗4次以完全除去盐,并溶于10μl无菌蒸馏水。
15)转化将电感受态大肠杆菌细胞(DH10B,Invitrogen)用于克隆含有双标志多联体的质粒。在管中,在冰上将40μl感受态细胞悬液与1μl经过纯化的连接的DNA混合,并转移到电穿孔杯内(0.1cm缝隙;BioRad)。电穿孔的条件如感受态细胞生产商所建议的(2.5kV,25μFD,100Ω)。电穿孔后,加入1ml SOC培养基(Invitrogen)并将溶液在37℃孵育1小时。将得到的大肠杆菌悬液平铺于含有100μg/ml氨苄青霉素、20μg/ml X-gal和0.1mM IPTG的LB培养基上。将平板在37℃培养14小时。
16)菌落PCR和测序使用牙签将在平板上产生的白色菌落挑出来,并在含有1X PCR缓冲液、0.4mM dNTP、0.05单位/μl Taq聚合酶(TAKARA)、2pmols/μlM13-20引物和2pmols/μl M13RV引物的PCR混合物中重悬。通过PCR扩增质粒中的克隆片段并通过琼脂糖凝胶电泳检查片段大小(图8)。使用PCR纯化试剂盒(Qiagen)纯化扩增的PCR片段。
17)多联体的测序将纯化的PCR片段(多联体)用BigDye终止子(AppliedBiosystems)和M13-20引物测序。测序反应后,通过“Montage SEQ96测序反应清除试剂盒”(Millipore)纯化DNA。通过RISA384毛细管DNA测序仪(Shimadzu)分析DNA序列。在图9显示了克隆片段的DNA序列的实例。通过CATG NlaIII位点界定了一系列包括两个26-或27-bp片段的52-到54-bp双标志。
18)数据分析从多联体的DNA序列中提取了26-bp标志序列并且使用由JohnsHopkins大学提供的SAGETM2000软件计数了每种标志的数量。测量几个克隆的序列后,进行了表1中所示的基因表达谱分析。
从水稻叶中获得的SuperSAGE结果的实例。显示除共有的NlaIII位点(CATG)外的标志序列。




因此,从水稻叶中成功地分离了与cDNAs的NlaIII位点相邻的26-或27-bp序列。可通过应用这里所描述的实验方法从任何cDNA中获得包括26-或27-bp序列的鉴定标志。基于分离包括26-或27-bp序列标志的该方案表现了对使用包括18-到21-bp序列标志的最先进SAGETM方法(称为“LongSAGETM”)的重要定性改进。
在SuperSAGE方法中,EcoP15I酶在标志中产生很容易通过DNA聚合酶钝端化的5’-突出端。因此,通过钝端化标志的随机联合形成双标志,因而确保标志的数量忠实地代表了与标志对应基因的表达。当在LongSAGETM方案中仅在包括相容的2-bp 3’-突出端的21-bp标志之间形成双标志时,不能利用这种性质。为了在LongSAGETM中保证标志的随机联合,应当通过除去3’-突出区使标志钝端化。这导致标志大小减少了2-bp并且因此减少了标志的信息量。因此,从标志具有更多信息量的观点来看,这里所描述的SuperSAGE法优于LongSAGETM法而且更忠实地代表基因表达谱。
为了证明SuperSAGE的26-bp大小的标志允许标志对基因非常可靠的注释,进行下列实验。
从表1中随机选择30个26-bp标志。将这些DNA序列从3’末端截短使得标志大小分别变成20、18和15bp。15bp大小的标志与常规SAGETM中使用的标志大小一致。当接头-标志片段相互连接,分别具有和不具有钝端时,从LongSAGETM的标志中提取18-bp或20-bp标志。使用不同大小标志中的每一种,在代表来自超过130,000个物种的DNA序列的Genbank所存储的整个DNA序列中进行BLAST搜索。对包含显示与指定大小的标志完全匹配的DNA序列的物种的数量进行计数,跨30个标志序列获得物种的平均和最大量。在表2中总结了搜索结果。
30个水稻SAGE标志对整个Genbank数据BLAST搜索的总结

DNA序列的数量显示与标志序列完全匹配,标志大小的增加减少了标志对基因注释的不明确性。
常规SAGETM同志(15bp)平均与4个以上,最多9个物种的DNA序列匹配。所有30个标志与两个或更多物种相关(表2)。18-bp标志平均与1.8个,最多7个物种匹配。30个中的10个标志与两个或更多的物种相关。20-bp标志平均与1.16个,最多4个物种匹配。30个中仅有3个标志与2个以上物种相关,提示对最初SAGETM同志长度(15bp)有很大改进。然而,注意到只有当接头-标志在不对末端进行钝化的情况下连接时可提取20-bp标志,因此该方法的最终结果不是必然代表准确的基因表达。SuperSAGE法的26-bp标志平均与1.06个,最大仅2个物种匹配。30个中仅有2个与2个以上物种的DNA序列相关。这些结果清楚地显示了26-bp DNA序列中的信息量大大提高了标志的基因注释的效率。
26-bp标志平均仅与一个物种的DNA序列匹配,在决大多数情况中仅与特定物种的一个基因匹配。因此,几乎完全可以进行标志序列的注释。在SuperSAGE中可对EST序列数据库以及对整个基因组序列进行标志注释。
SuperSAGE中26-bp标志的高信息量允许同时进行两个生物体的基因表达分析。作为实例,我们将所描述的方法用于研究受真菌稻瘟病菌(Magnaporthe grisea )导致的枯萎病(blast disease)感染的水稻作物的基因表达谱。从枯萎病感染的水稻叶中分离总计12,119个标志后,通过对水稻和稻瘟病菌(M.grisea)的所有基因组序列的BLAST搜索对每个标志进行注释。如预期的,大多数标志被注释为水稻基因(表3),而74个标志不与水稻序列匹配而与枯萎病序列匹配(表4) 通过Super SAGE所揭示的在枯萎病感染的水稻叶中10个最丰富表达的基因

*标志表示为除NlaIII位点(CATG)外的22-bp序列。
由SuperSAGE揭示的在枯萎病感染的水稻叶中表达的稻瘟病菌(Magnaporthe grisea)基因的部分列表

*标志表示为除NlaIII位点(CATG)外的22-bp序列**从与每个标志匹配的稻瘟病菌的cDNA序列或基因组序列中推定的基因名称。
为了证明由SuperSAGE获得的结果,使用下列锚式寡-dT引物从上述同一RNA通过反转录合成cDNA5’-GGCCACGCGTCGACTAGTACTTTTTTTTTTTTTTTTT-3’(SEQID NO8)。
用该cDNA作为模板,使用疏水蛋白、二磷酸核苷激酶和60S核糖体蛋白基因(表4)的26-bp标志与下列引物一起进行3’-RACE5’-GGCCACGCGTCGACTAGTAC-3’(SEQ ID NO9)。
获得所有这三种基因的特异性PCR产物(图10,左边)。在假接种的易患枯萎病的栽培品种(Kakehashi)、接种的易患枯萎病的栽培品种(Kakehashi)、假接种的枯萎病抗性栽培品种(Himenomochi)和接种的枯萎病抗性栽培品种(Himenomochi)中使用相同的引物组用于RT-PCR。如预期的那样,仅从用枯萎病真菌接种的易患品种中扩增了与三个枯萎病基因对应的PCR产物(图10,右侧),证明了SuperSAGE注释的可靠性。
不能通过以前的技术在与这里举例说明的相同样品中进行两个物种的基因表达的定量分析。使用26-bp标志进行基因表达分析(“SuperSAGE”)将极大地便于同时进行两个或更多相互作用的生物体如宿主和病原体的基因表达分析。
为了证明具有26-bp标志的SuperSAGE可用于无法获得其DNA序列数据的生物体的基因表达分析,进行下列实验。将SuperSAGE应用于植物物种,本塞姆氏烟草(Nicotiana benthamiana)的基因表达分析,其用马铃薯晚疫病菌(Phytophthora infestans)的蛋白激发子(elicitor)INF1处理(Kamoun等Mol.Plant-Microbe Interact.1013-20,1997)或者用水处理。激发子或水渗透(浸没)后一小时收集叶子,并从中分离RNA。
从每个样品中成功地分离了超过5000个标志(表5)。使用表5中列出的10个最常观察到的标志直接用于3’-RACE,并对所得的cDNA进行测序。CDNAs的BLAST搜索鉴定了与表5中所给标志对应的基因。
由SuperSAGE揭示的在本塞姆氏烟草(Nicotiana benthamiana)叶中10个最经常观察到的标志

*标志表示为除NlaIII位点(CATG)外的22-bp序列。
**从通过使用26-bp标志序列引物的3’RACE扩增的cDNA片段的序列中推定出的对应基因。
通过比较INF1-和浸没处理的样品中每种标志的频率,鉴定了在两个样品中统计学上有显著差异表现的标志(表6)。将这些标志直接用于3’-RACE,并将回收的cDNA用于BLAST搜索。这允许绝大多数标志的注释。
在INF1-和浸没处理的本塞姆氏烟草(Nicotiana benthamiana)叶中差异表达的基因

*标志表示为除NlaIII位点(CATG)外的22bp序列。
**从通过使用26-bp标志序列引物的3’RACE扩增的cDNA片段的序列中推定的对应基因。
将26-bp标志序列与锚式引物一起进行RT-PCR以证实表6中所显示的SuperSAGE的结果。RT-PCR结果(图11)清楚地证明了SuperSAGE结果忠实的反映了INF1和浸没处理的样本之间的基因表达差异。
可很容易地使用同样的26-bp标志引物进行RT-PCR,用于每种基因表达的动态研究(图12)。其显示用INF1处理后15分钟四种所检验基因(叶绿素a/b结合蛋白、光合系统II蛋白、磷酸甘油酸激酶和ATP合酶的基因)的表达被关闭。
这个实施例证明了SuperSAGE在不能获得其DNA序列数据的生物体中进行基因表达分析的巨大潜力。这种潜力来自标志的大小足以用作特异性PCR引物以及通过SuperSAGE获得的基因表达谱忠实地代表真实的基因表达的事实。
序列表文本SEQ ID NO1RT-引物SEQ ID NO2接头-A的第一链SEQ ID NO3接头-A的第二链SEQ ID NO4接头-B的第一链SEQ ID NO5接头-B的第二链SEQ ID NO6双标志引物(正向)SEQ ID NO7双标志引物(反向)SEQ ID NO8RT-引物SEQ ID NO93′-RACE的引物序列表<110>Iwate Prefectural GovernmentKAHL,GuenterWINTER,PeterKRUEGER,DetlevREICH,Stefanie<120>使用III型限制酶分离包括超过25个核苷酸的鉴定标志<130>PH-1719-PCT<140>
<141>
<160>9<170>PatentIn Ver.2.1<210>1<211>47<212>DNA<213>人工序列<220>
<223>发明人KAHL,Guenter;WINTER,Peter;KRUEGER,Detlev;REICH,Stefanie;MATSUMURA,Hideo;TERAUCHI,Ryohei<220>
<223>人工序列的描述RT-引物<400>1ctgatctaga ggtaccggat cccagcagtt tttttttttt ttttttt 47<210>2<211>46<212>DNA<213>人工序列<220>
<223>人工序列的描述接头-A的第一链<400>2tttggatttg ctggtgcagt acaactaggc ttaatacagc agcatg 46<210>3
<211>42<212>DNA<213>人工序列<220>
<223>人工序列的描述接头-A的第二链<400>3ctgctgtatt aagcctagtt gtactgcacc agcaaatcca aa 42<210>4<211>44<212>DNA<213>人工序列<220>
<223>人工序列的描述接头-B的第一链<400>4tttctgctcg aattcaagct tctaacgatg tacgcagcag catg44<210>5<211>40<212>DNA<213>人工序列<220>
<223>人工序列的描述接头-B的第二链<400>5ctgctgcgta catcgttaga agcttgaatt cgagcagaaa 40<210>6<211>23<212>DNA<213>人工序列<220>
<223>人工序列的描述双标志引物(正向)<400>6caactaggct taatacagca gca 23<210>7
<211>21<212>DNA<213>人工序列<220>
<223>人工序列的描述双标志引物(反向)<400>7ctaacgatgt acgcagcagc a21<210>8<211>37<212>DNA<213>人工序列<220>
<223>人工序列的描述RT-引物<400>8ggccacgcgt cgactagtac tttttttttt ttttttt 37<210>9<211>20<212>DNA<213>人工序列<220>
<223>人工序列的描述3’-RACE的引物<400>9ggccacgcgt cgactagtac 20
权利要求
1.III性限制酶用于从被表达基因的cDNA中分离包括超过25个核苷酸并且能够鉴定被表达基因的标志的用途,其中标志的3’末端通过III型限制酶的切割位点确定,标志的5’末端通过最接近被表达基因的cDNA 3’末端的另一种限制酶的切割位点确定。
2.权利要求1的用途,其中III型限制酶是EcoP15I。
3.权利要求2的用途,其中另一种限制酶是NlaIII。
4.一种包括超过25个核苷酸并且能够鉴定被表达基因的标志,其中标志的3’末端通过III型限制酶的切割位点确定,标志的5’末端通过最接近被表达基因的cDNA 3’末端的另一种限制酶的切割位点确定。
5.权利要求4的标志,其中III型限制酶是EcoP15I。
6.权利要求5的标志,其中另一种限制酶是NlaIII。
7.一种双标志-寡核苷酸,包括两个来自不同被表达基因的标志,其中每个标志包括超过25个核苷酸并且能够鉴定被表达基因,标志的3’末端通过III型限制酶的切割位点确定,标志的5’末端通过最接近被表达基因的cDNA 3’末端的另一种限制酶的切割位点确定。
8.权利要求7的双标志-寡核苷酸,由包括下列步骤的方法制备1)使用包括寡-dT和III型限制酶识别序列的引物从表达基因的mRNA合成cDNA库,随后用另一种限制酶消化cDNA库;2)从上述cDNA库中纯化包括多聚腺苷酸序列的片段,以及将片段与接头-A或接头-B连接,两者都包括III限制酶的识别序列;3)用III型限制酶消化上述片段,以及在进行3’-填充反应后将得到的包括接头-A的片段与得到的包括接头-B的片段连接;和4)用步骤1)的另一种限制酶消化上述连接的片段,以便将接头序列切割下来,因此获得双标志-寡核苷酸。
9.权利要求7或8的双标志-寡核苷酸,其中通过两个来自不同被表达基因的标志的随机联合制备双标志-寡核苷酸。
10.权利要求7、8或9的双标志-寡核苷酸,其中III型限制酶是EcoP15I
11.权利要求10的双标志-寡核苷酸,其中另一种限制酶是NlaIII。
12.权利要求11的双标志-寡核苷酸,其中接头-A和接头-B是互不相同的双链DNA并且通过将下列DNA(1)的第一链与DNA(2)的第二链退火而制备;DNA(1)5’-N30-40-CAGCAGCATG-3’DNA(2)3’-N30-40-GTCGTC-5’其中,DNA(1)的N30-40和DNA(2)的N30-40是相互互补的30到40个任意的核苷酸序列,其中可标记DNA(1)的5’末端以及可氨基修饰DNA(2)的3’末端。
13.包括至少两个权利要求7到12中任何一项的双标志-寡核苷酸的多核苷酸。
14.权利要求13的多核苷酸,其中多核苷酸包括2到200个双标志-寡核苷酸。
15.一种基因表达分析的方法,包括分析权利要求13或14的多核苷酸的核苷酸序列,以及基于与多核苷酸中所包含的被表达基因对应的标志的数量对被表达基因的表达水平进行定量。
16.一种基因表达分析的方法,包括下列步骤1)使用包括寡-dT和III型限制酶识别序列的引物从被表达基因的mRNA合成cDNA库,随后用另一种限制酶消化cDNA库;2)从上述cDNA库中纯化包括多聚腺苷酸序列的片段,以及将片段与接头-A或接头-B连接,两者都包括III限制酶的识别序列;3)用III型限制酶消化上述片段,以及在进行3’-填充反应后将得到的包括接头-A的片段与得到的包括接头-B的片段连接;和4)用步骤1)的另一种限制酶消化上述连接的片段,以便将接头序列切割下来,因此获得包括两个超过25个核苷酸并且能鉴定所表达基因的双标志-寡核苷酸;5)将双标志-寡核苷酸连接起来产生多核苷酸;6)分析上述多核苷酸的核苷酸序列,以及基于与多核苷酸中所包含的被表达基因对应的标志的数量对被表达基因的表达水平进行定量。
17.权利要求16的方法,其中III型限制酶是EcoP15I。
18.权利要求17的方法,其中另一种限制酶是NlaIII。
19.权利要求18的方法,其中接头-A和接头-B是互不相同的双链DNA并且通过将下列DNA(1)的第一链与DNA(2)的第二链退火而制备;DNA(1)5’-N30-40-CAGCAGCATG-3’DNA(2)3’-N30-40-GTCGTC-5’其中,DNA(1)的N30-40和DNA(2)的N30-40是相互互补的30到40个任意的核苷酸序列,其中可标记DNA(1)的5’末端以及可氨基修饰DNA(2)的3’末端。
20.分离包括超过25个核苷酸并且能鉴定表达基因的标志的试剂盒,包括下列成分a)由序列5’-N18-25-CAGCAG-T15-25-3’定义的RT引物,其中N18-25是不包括序列5’-CAGCAG-3’和序列5’-CATG-3’的18到25个任意的核苷酸序列,其中RT引物的5’末端可生物素化;b)接头-A和接头-B是互不相同的双链DNA并且通过将下列DNA(1)的第一链与DNA(2)的第二链退火制备;DNA(1)5’-N30-40-CAGCAGCATG-3’DNA(2)3’-N30-40-GTCGTC-5’其中,DNA(1)的N30-40和DNA(2)的N30-40是相互互补的30到40个任意的核苷酸序列,并且可标记DNA(1)的5’末端以及可氨基修饰DNA(2)的3’末端;c)能与上述接头-A或接头-B杂交的引物。
21.权利要求20的试剂盒,进一步包括EcoP15I和/或NlaIII。
全文摘要
用III型限制酶EcoP15I从被表达基因的cDNA中分离包括超过25个核苷酸并能鉴定所表达基因的标志,其中标志的3’末端通过III型限制酶的切割位点确定,标志的5’末端通过最接近被表达基因的cDNA 3’末端的另一种限制酶的切割位点确定。本发明的标志允许进行准确定量基因表达分析以及在没有可利用的被表达序列标志(EST)数据库的任何生物体中进行快速的基因表达谱分析。
文档编号C12N15/10GK1802439SQ0382676
公开日2006年7月12日 申请日期2003年5月9日 优先权日2003年5月9日
发明者彼得·温特, 冈特·卡尔, 德特列夫·克鲁格, 斯蒂芬尼·赖克, 松村英生, 寺内良平 申请人:岩手县
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1