一种染色体步移文库的构建方法

文档序号:3351121阅读:360来源:国知局
专利名称:一种染色体步移文库的构建方法
技术领域
本发明属于基因工程领域,具体涉及染色题步移文库的构建方 法,本发明还涉及用于构建文库的接头分子设计方法。
背景技术
目前,构建染色体步移文库的构建都是利用能产生平末端的DNA内切酶对基因组进行酶切,然后酶切产物直接与接头进行连接 而成。但是能产生平末端的DNA内切酶相对于能产生粘性末端的 DNA内切酶来说,种类较少,而且价格普遍较高,大大限制了构建 染色体步移文库的种类、增加了文库构建的成本。另外,构建染色体 步移文库所需要的接头,在设计上难以保证染色体步移PCR朝着预 计的方向进行或者容易出现非特异性条带,严重降低了染色体步移 PCR的扩增效率和PCR产物的准确性。发明内容针对上述不足,本发明提供了一种染色体步移文库的构建方法及 其接头分子设计。利用本方法可以选择任何DNA内切酶对基因组进 行酶切,包括能产生平末端的DNA内切酶、平末端DNA内切酶与 粘性末端DNA内切酶的组合以及不同粘性末端DNA内切酶的组合 等,酶切产物经过处理可直接与接头连接,大大增加了构建文库的种 类、降低了构建文库的成本;利用DNA合成的原理,通过对接头末 端核苷酸的分子设计则使染色体步移PCR按照预期的方向进行,能 有效提高染色体步移PCR的扩增效率和PCR产物的准确性。为实现上述目的,本发明的技术方案是釆用粘性末端内切酶对基 因组DNA进行消化,然后,通过单链核酸外切酶将突出的单链消化, 从而将粘性末端转化成平末端。然后可按照常规的方法构建文库。然而,本发明方法并不仅局限于使用粘性末端内切酶消化基因组DNA, 可以将平末端DNA内切酶与粘性末端DNA内切酶相组合,并按照 上述方法构建文库。因此,本发明的方案是至少使用一种粘性末端限 制性内切酶消化基因组DNA,并用单链外切酶将突出的单链消化, 并构建文库。在染色体步移构建文库时,对基因组DNA的酶切,如果选用的 是产生粘性末端的内切酶,可利用具有单链DNA外切酶功能的酶制 剂对其进行消化,使其产生平末端的基因组DNA片段。5'突出端的 酶切产物釆用具有5,-3'单链DNA外切酶进行消化,如枯草芽孢杆菌 核酸外切酶、核酸外切酶VII(五xo/0、粗糙脉孢菌核酸外切酶等。 3'突出端的酶切产物采用具有3'-5'单链DNA外切酶进行消化,如核 酸外切酶I (E.co//) DNA聚合I (Aco//)核酸外切酶III (Eco//) 及pfUDNA聚合酶等。此外,为防止非特异条带的出现、控制染色体步移PCR的方向, 本发明还提供了一种接头序列,其是由一条由50个碱基左右(如 40-60bp,优选50bp)的长链和一条10个碱基左右(如8-15bp,优 选10bp)的短链退火形成,其中短链序列与长链的3'端序列完全互 补,使接头端的PCR引物只能以基因特异引物扩增的条带为模板, 提高PCR扩增产物的特异性;为防止接头短链以长链为模板合成长 链的互补连,需要对短链3,端最后一个碱基进行分子设计,使其核 糖中的第三个碳原子上的羟基进行脱氧或者转换为一个甲基或者磷 酸化,以阻止DNA聚合酶以接头短链为引物进行延伸。应用本发明方法,可任意选择DNA内切酶构建染色体步移文库, 扩大了文库的种类,使获得染色体步移实验结果的效率大大提高,同 时降低了文库构建的成本;对接头进行的分子设计,可保证染色体步 移PCR只能以基因特异引物扩增的条带为模板,有效抑制非特异条 带的出现。


图1是常用的平末端DNA内切酶对基因组DNA酶切结果的示 意图;图2是5'端突出DNA内切酶酶切结果示意图;图3是3'端突出DNA内切酶酶切结果示意图;图4是平末端和3'端突出DNA内切酶酶切结果示意图;图5是平末端和5'端突出DNA内切酶酶切结果示意图;图6是图2、 3、 4、 5实验结果被相应的具有单链DNA外切酶消平后的结果示意图;图7是3'末端碱基甲基化的接头分子序列图,其中CH3N表示任意核苷酸(CH3A、 CH3T、 CH3G、 CH3C)中,核糖的第三个碳原子上的羟基转换为甲基;图8是3'末端碱基双脱氧化的接头分子序列图,其中ddN表示任意的双脱氧核糖核苷酸UdA、 ddT、 ddG、 ddC);图9是3'末端碱基磷酸化的接头分子序列图,其中H2P03N表示任意的磷酸化脱氧核糖核苷酸(H2P03A、 H2P03T、 H2P03G、 H2P03C )。 图10 12为腺嘌呤甲基化、双脱氧化和磷酸化结构式; 图13-15为鸟嘌呤甲基化、双脱氧化和磷酸化结构式; 图16 18为胞嘧啶甲基化、双脱氧化和磷酸化结构式; 图19~21为胸腺嗜甲基化、双脱氧化和磷酸化结构式; 图22为实施例1染色体步移反应中的起始PCR结果,其中,1 8泳道依次为五coR I 、 //z"(iin、 5am//1 、力a I 、 I 、 I 、户vwll 、^/ fl I 8种内切酶构建的染色体步移文库下游PCR结果,M为DNA分子量标准;图23为实施例1染色体步移反应中的二次PCR结果,其中,1~8 泳道依次为上述8种起始PCR反应液按1: 50比例稀释后做为模板 的二次PCR结果,M为DNA分子量标准。
具体实施方式
下面结合附图进一步说明本发明,但不应理解为对本发明的限 制。在不背离本发明精神和实质的情况下,对本发明方法、步骤或条 件所作的修改或替换,均属于本发明的范围。利用任意DNA内切酶对基因组DNA进行酶切,酶切产物可能 是如图1、 2、 3、 4、 5所示的5种结果。酶切产物1 (如图1)可直 接与接头进行连接;酶切产物2和5(如图2、 5)需要利用具有5,-3, 单链DNA外切酶功能的酶制剂,如枯草芽孢杆菌核酸外切酶、核酸 外切酶VII(£.co/0、粗糙脉孢菌核酸外切酶,对5'突出端进行消平; 酶切产物3、 4(如图3、 4)需要利用具有3,-5,单链DNA外切酶功 能的酶制剂,如核酸外切酶1(五.co//)、 DNA聚合I (Eco//)、核酸 外切酶III 及pfUDNA聚合酶等,对3'突出端消平。消平产物可直接与接头进行连接也可以对消平后的DNA片段进行回收,然 后利用DNA连接酶与接头连接。连接所采用的接头要具备图7和图8所示的分子特征由一条 50个左右碱基的长链和一条IO个碱基左右的短链组成,短链中除3, 端最后一个碱基外,其它序列要与长链的3'端序列完全互补,短链3, 末端最后一个碱基中的第三个碳原子被甲基化替换或脱氧或磷酸化。实施例l染色体步移文库的构建本例以辐射松为基因组DNA,构建以扩展蛋白基因(expansin gene,登陆号EU301698,本发明人利用此方法获得的基因)为目的基 因的Eco及I 、 /^"c in、 5am//1 、 I 、 5Vw I 、 I 、尸v" II 、 /f/ a I 8 种内切酶的染色体步移文库。 基因组DNA提取(CTAB法)1)称取2g植物幼嫩新鲜材料,置于预冷的研钵中,加入1/10 植物材料体积的PVPP,倒入液氮,快速将植物材料研磨成细粉末。2 )在液氮未完全挥发之前,用小匙将细粉末装入2ml离心管中,加入600W预热至65'C的2xCTAB提取液,再加入1 %的|3-巯基乙 醇,盖紧盖反复颠倒混匀,置65X:的水浴中保温20min,期间不时摇 动。3) 取出离心管,冷却至室温,加入等体积的氯仿/异戊醇(24: 1),轻轻反复颠倒离心管混勾。室温下,10000r/min,离心10min。4) 仔细吸取上清液,转入一新离心管中,加入等体积的氯仿/异 戊醇(24: 1),充分混匀后,室温下10000r/min,离心10min,再抽 提一次。5) 取上清液转入另一新离心管中,加入等体积的CTAB沉淀缓 冲液,轻轻混匀,室温下沉淀30min,时间越长DNA沉淀越好。6) 10000r/min,离心10min,弃掉上清液。加入100^1 TE缓冲液,溶液沉淀。7) 加入2倍体积的无水乙醇(-2(TC预冷),混匀,-20。C条件下 放置15min或更长时间。10000r/min,离心10min,弃掉上清液。8) 加入70%的乙醇400|il,混勾,放置5min。 10000r/min,离 心10min,弃掉上清液。沉淀自然吹干。9) 加入50pl的无菌水或TE溶液,溶解沉淀,-20°。冰箱中贮存基因组DNA酶切以Eco及lDNA内切酶为例,其它内切酶步骤相同,对胡枝子基因组DNA进程酶切,酶切体系如下ddH20 57plbuffer(H) 10plDNA 25jul£coi I 8jil 共lOOjil溶液混合后,轻轻震荡,低速离心,将溶液37'C过夜,回收酶切 粘性末端消平其中&wl 、 、 PvmII、 //pal4中内切酶产物可直接产生平末 端,无需消平。而五coRl 、 i7/"dl1、 Bam/H 、 vKal4中内切酶酶切 产物,产生3'突出的粘性末端DNA片段,构建染色体步移文库时需要 对粘性末端进行消平,pfii DNA聚合酶具有3'-5,外切酶活性。以 五co/UDNA内切酶产物为例,其它内切酶产物的消平步骤相同,反应体系如下pfU 10xbuffer 1^1 dNTP lpl pfu(2.5U/|ul)酶切DNA(^6ng/nl) 8ml 共ll|il混勾溶液,72"C水洛30分钟,4'C过夜。 接头连接釆用的长链和断链的序列分别为长链5'-ACCGGTTATC ACATGGAGGC GAATTCGAGC TCGGATCCGC CCGGGCTAAG-3 , 短链3,-(CH3C)GCCCGATTC-5,其中短链末端胞嘧嚏碱基甲基化。以上序列合成后,分别稀释至20(amol/L,等量混合,在PCR仪中 形成双链DNA。反应条件,94"C预热1分钟,6(TC退火30秒。然后与 上述8种消平的DNA片段连接,构建8个染色体步移文库。单个连接 体系如下-.DNA消平液 4^1 接头 1.9^x1 10x连接酶Buffer T4DNA连接酶 0.5pl 共8|al反应条件,16t:水洛过夜,70'C5分钟停止连接反应,加入72(ilTE 混匀溶液,离心备用。 染色体步移反应染色体步移PCR中的起始PCR是以API ( SEQ ID NO: 2 )和 GSP1 ( SEQ ID NO: 3)为引物,以构建的染色体步移文库为模板, 反应结束后将反应液稀释50倍并作为二次PCR的模板并以AP2 (SEQ ID NO: 4 )和GSP2 ( SEQ ID NO: 5)为引物进行PCR。染 色体步移PCR条件94。C变性lminl个循环,94。C变性30sec, 68°C 复性30sec, 72。C延伸2.5min,启始PCR为39个循环,二次PCR为 25个循环,72。C延伸10min, 4。C结東反应。将二次PCR结果进行回 收、测序、比对,确定是否目的片段。结果表明在起始PCR中, 每个文库的扩增结果都有条带,但比较模糊;二次PCR中,所有文 库的扩增结果条带比较清楚,其中第7泳道条带最长,选择第7泳道 条带切胶回收、连接T载体、测序后(测序结果如SEQIDNO: l所 示)在Gene Bank中BLAST,与其它树种中的expansin基因有很高 的同源性,说明染色体步移成功,如果还不是基因的完整序列,可以 获得的基因序列为模板重新设计步移引物,利用相同的文库进行另一 轮的染色体步移,选择最长扩增片段测序、分析,直到获得基因的全 长,在Gene Bank中登录。染色体步移的结果如图。综上所述,釆用本染色体步移文库构建方法具有如下优点1、 可选择的用于构建文库的内切酶的范围大大增加,提高了染 色体步移PCR扩增效率;2、 由于可选择的内切酶的范围增加,可釆用普通的内切酶构建 文库,成本大大降低;3、 接头序列是一条由40-60个碱基左右的长链和一条8-15个碱 基左右的短链退火形成,其中短链序列与长链的3,端序列完全互补, 使接头端的PCR引物只能以基因特异引物扩增的条带为模板,能够 大大提高PCR扩增产物的特异性。200810100936.6说明书第8/ll页序列表<110>北京林业大学<120> —种染色体步移文库的构建方法<130〉<160> 5〈170〉 Patentln version 3. 3〈210> 1 〈211〉 2526 〈212〉 DNA<213> 辐射松(Pinus radiata) 〈400〉 1tctg犯tagt gggcggctga tt犯cgg犯c taaatttctg cttttctttt gctattttaa 60 tgattttatt ttcgagggag geiggaaaccc taacccatgg tccatgctgt tggaattatc 120 aggcggacgg atagatgggg atctgttatc gagetaagcaeL gaaELacaaaeL gatttttaaa 180t肌3gtt肪3 ggt犯犯3犯犯t犯3犯t3 33gggggg3g 3Ctg犯ggCC Cg33g3g3tg 240ctgct卿tg acggtggccg ggtgggggtg gtttcgttcg Uattgttcg ttgagtgtga 300acgtggtgtt gcgcatttag tggttgatgt gatgttttga cggtgacttc acgtggg犯c 細gtcgcgaggg gccttgaaga gt犯gga犯g gattttgttt taactttgtt tattaaccga 420aggtggagaa肌tttagatt aggagagagt ttagattagt attaatcctg actattagga 4:80gatttaagtg aaccgagtta cgggaattga ttgtccttca tgtcctcgga cgtttaattt 540gttttcttta ttgggtgttt ttcggttttg caatccctat gtgggact3g gattgccggg 600taatttgatx ataattctaa ggttagtgtt tt犯tcggtc atggattcca cttattggga 660atcatcgtca tcaatgctga gttttttttg cataagtagt ggtcgatgtt cgccagtttc 720gccagtctca ttgtcgtatc ctatctccct ctgtgcattt tgctctgctc ccaggaagga 780tctcggttcc cttccctcag tactctgctc tgccttctga gattgtgtga gtagcaggag 840ggccacaagc caattctgtt ttaatgttgg tttggtttga tttggttcag ttcagtttgg 900tctagatctg tcttgtttct gtggatggg3 agcagaatat ttgcagca/tt tccctttgtt attcttga犯tgcgggttgt ttacccttga gggaatggga attccagtgc attttccgac tctggtgtat gggcgaatcc cgggtgttta aactttctac ggtgg肌gcg atgcctcggg atgtgtgtaa atggacattg cagtctatgg tgttgtttct gtggcgcagg gggtgcUgt ggagttc肌t ccgcagcatt gagcacagct tgctttgaga tcaaatgtgc gaatgaccca ttggtcactg gcaccaattt ctaccctccc tggtgcaatc cttgtcgccc ccatttgtga ttcttgaatt atttttggct tttgtaattg taaattttat ttgttagaac taatcactct 肌gatgaaga tscca犯ctt gga^t犯gatt tagtttgttg aagcagc犯t agatggaaaa agactcat3g tatatgtcac atacatcsgt ttgtaaagta tgtgcctggt aactccaaaa atgtgtatcc ccatacagtt catggtaata t城ggtaag ctag犯acca cctgtaagag gtttagggtt agccgcg犯a acccacggcc tggc鄉ttt gtagccaaga gtggttggag ggttgcgttg agccttcacg actgagttta t犯aacccag agtatggtta tgggtaatcc tttacaggta taggtataga tgtgttgtta acgtcataca agactggcgg ttgc犯tggt tcctttatat ggacatcaac atattcttttcggacaggca C3tcct3cat taatg犯cag 960atggtttgtt atgggggtat tcttc犯tgc 1020ctgactggtt ctttcttttt gcagaacgat 1080cgttttgttg ctgtttatcg ttagagcttg 1140tcagcctggg ccttggaatg aagcacatgc 1200caccatgggt tagtgaaatt agttactgcg 1260ggctccgttt ctagatctaa ctgagctttt 1320gggtatggca acctgtacag ccagggatat 1380ctgttcaaca gcgggct卿ctgtggagcc 1440gaatggtgtc acctgggtaa cccttcgatt 1500aactatgttt tgcctaatgg caatggtggt 1560attagtgtat gcttggtgaa atttattgtt 1620aaacatgttg agcttgatca acttaacatg 1680aacaattgtg aattaaagtt ggaaagattc 1740ttagaagaag ttgattgtgg cagtgtatat 1800acaagctaaa atattgtgtt gaaataaagc 1860aag犯3gtct agg3tgtttt gtagtggtcg 1920gttgtagatg tgttttcagc cttgtaagtc 1980taaaaactac tttgtatttg tEtgttttcat 2040tgaagtagga tagagattcc tcttggcatg 2100tagttgagtc gggtctgtgg agtgccttag 2160tgctctagtg taaaggctgt ggcccagagt 2220gccUggtgg catggttgag ggtgatccga 2280gata犯accc atgatgatat tagaggggga 2340taatggttga aagaacgatg tatgtgaagg 2400tagtacccat gcattccggt ggatggttgc 2460gttatgtttc aacacaacta gattttgcag 2520attgat 2526<210> 2〈211〉 25〈212〉 DNA <213>人工序列〈400> 2ggttatcaca tggaggcgaa ttcga 25〈210> 3<211〉 25<212> DNA <213>人工序列〈400〉 3atccttgtcg cccccatttg tgaat 25〈210> 4〈211〉 25〈212> DNA 〈213〉人工序列<400> 4gaattcgagc tcggatccgc ccggg 25<210> 5<211〉 25 〈212〉 DNA <213>人工序列<400> 5ttattgtttt cttgaattat ttttg
权利要求
1、一种构建染色体步移文库的方法,其特征在于,包括如下步骤采用至少一种粘性末端限制性内切酶消化基因组DNA或其片段,得到粘性末端DNA片段;用单链核酸外切酶处理粘性末端DNA片段,使其成为平末端DNA片段;与接头分子连接,得到染色体步移文库。
2、 如权利要求1所述的方法,其特征在于,所述的接头分子为 一长链和一短链构成的不完全双链,其中短链与长链的3'端完全互 补。
3、 如权利要求2所述的方法,其特征在于,在所述短链3,末端 最后一个碱基中,核糖的第三个碳原子上的羟基被甲基替换或脱氧或 磷酸化。
4、 如权利要求3所述的方法,其特征在于,所述长链为40-60 bp, 所述短链为8-15 bp。
5、 如权利要求4所述的方法,其特征在于,所述的长链为50bp, 所述短链为10bp。
6、 如权利要求1 5任一项所述的方法,其特征在于,所述的单 链核酸外切酶选自1) 5'-3,单链DNA外切酶枯草芽孢杆菌核酸外切酶、核酸外 切酶VII、粗糙脉孢菌核酸外切酶;2) 3,-5,单链DNA外切酶核酸外切酶I、 DNA聚合I、核酸 外切酶III及pfU DNA聚合酶。
全文摘要
本发明提供了一种染色体步移文库构建方法,其包括采用至少一种粘性末端限制性内切酶消化基因组DNA,得到粘性末端DNA片段,用单链核酸外切酶处理粘性末端DNA片段,使其成为平末端DNA片段,与接头分子连接,得到染色体步移文库。本发明的方法大大增加了构建文库的种类、降低了构建文库的成本,有效提高了染色体步移PCR的扩增效率和染色体步移结果的准确性。
文档编号C40B50/06GK101230490SQ20081010093
公开日2008年7月30日 申请日期2008年2月26日 优先权日2008年2月26日
发明者伟 李, 慧 李, 陈晓阳 申请人:北京林业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1