一种直接从环境宏基因组克隆新功能基因的方法

文档序号:576587阅读:650来源:国知局

专利名称::一种直接从环境宏基因组克隆新功能基因的方法
技术领域
:本发明涉及分子生物学领域,具体地,本发明涉及一种直接从环境宏基因组克隆新功能基因的方法。
背景技术
:"Metage謹e"是由Handelsmanetal.(1998)提出的新名词,其定义为"thege謹esofthetotalmicrobiotafoundinnature",艮卩生态环境中全部微小生物遗传物质的总和,国内学者将其翻译为"宏基因组",也有人翻译为"元基因组",主要指环境样品中微生物的基因组总和。宏基因组DNA既包含了可培养的又包含了不可培养的微生物基因组,避开了微生物分离培养的问题,极大地扩展了微生物资源的利用空间。宏基因组DNA的获得是直接提取环境中所有微生物的总DNA,因此环境宏基因组具有一些普遍的特点(l)宏基因组DNA的提取效果与其所处的环境相关,不同的环境组成成分不一样,对DNA的提取效果有直接影响。为了不影响后期的PCR反应,提取的DNA需要进行严格的纯化处理;(2)宏基因组DNA中包含有成千上万种微生物的DNA,即宏基因组DNA在组成上比较复杂,含有大量的基因信息;(3)宏基因组DNA中不同种微生物DNA的丰度存在极大的差异,高丰度菌的DNA的拷贝数可能是低丰度菌的上千倍。但是即使是高丰度的菌,与可培养的菌通过纯培养的方式提取的基因组DNA相比,在拷贝数上也是低了很多;(4)环境宏基因组DNA中,含有特定功能基因的基因组的DNA在整个宏基因组中所占的比率可能微乎其微。所以要从环境宏基因组中直接克隆功能基因与从单个纯化的菌中克隆基因相比,会复杂的多,必须要考虑模板的纯度,目标基因的丰度,以及其他模板DNA对PCR反应的影响。因为环境宏基因组DNA具有以上特点,直接用PCR的方法克隆全长的功能基因难度比较大,所以目前报道的从环境宏基因组DNA中克隆具有新颖性的功能基因都是通过构建宏基因文库的方法(Deslippe&Egger,2006;Krseketal.,2006;Wiseetal.,1999)。目前已采用土壤、深海等环境样品成功构建了宏基因组文库,并筛选到脂肪酶、蛋白酶、淀粉酶、几丁质酶、抗菌抗肿瘤活性物质及抗生素抗性基因等(Dangetal.,2008;Leeetal.,2007;Vogetetal.,2003),但该方法操作比较复杂,工作量巨大,通常获得的功能基因数量较少。因为构建文库对DNA的纯度和DNA的质量要求比较严格,并且环境宏基因组包含的基因信息量非常大,所以通常构建的文库库容量,相对整个宏基因组的基因信息而言所包含的基因信息比较小,不能满足从中克隆多个目标基因的要求。
发明内容本发明的目的是提供一种快速的、有效的直接克隆环境宏基因组中基因的方法,该方法不需要构建宏基因组文库,也不需要培养微生物。本发明提供的方法主要包括两部分第一部分,通过设计有效的简并引物直接通过降落PCR的方法从环境宏基因组中扩增大量的目标片段序列;第二部分,以第一部分中4获得的目标片段为基础,进一步通过改进的TAIL-PCR获得完整的目标功能基因。根据本发明的直接从环境宏基因组克隆新功能基因的方法,包括以下步骤1)分离含目的基因的环境宏基因组DNA;2)基于目的基因的保守序列设计简并引物对;3)利用简并引物从含目的基因的环境宏基因组DNA中克隆目的基因的部分片段,比对所得的目的基因的部分片段,并选出用于目的基因克隆的片段;4)根据用于目的基因克隆的片段的序列设计4个特异性引物对,从上游至下游依次为特异性引物对SP1、SP2、SP3和SP4,各特异性引物对分别包含特异性上游引物和特异性下游引物;5)以特异性引物对SP1对所述用于目的基因克隆的片段进行第一轮TAIL-PCR扩增;6)以特异性引物对SP2对和简并引物对第一轮TAIL-PCR产物进行第二轮TAIL-PCR扩增;7)以特异性引物对SP3对和简并引物对第二轮TAIL-PCR产物进行第三轮TAIL-PCR扩增;8)以特异性引物对SP4对和简并引物对第三轮TAIL-PCR产物进行第四轮TAIL-PCR扩增;9)分析第三轮和第四轮TAIL-PCR扩增产物,通过拼接获得目的基因的全序列。根据本发明的直接从环境宏基因组克隆目标功能基因的方法,基于环境宏基因组丰度低的特点,我们对TAIL-PCR的方法进行改进,采用四轮PCR的方法克隆目标基因,使其能够特异性的从宏基因组DNA中扩增目标基因侧翼的序列。首先,第一轮PCR反应,针对目标序列含量低的特点,我们增加了一步特异性引物SP1单引物对目标模板序列进行扩增,以提高目标片段的拷贝数。该PCR反应中,利用SP1引物经过80个循环对目标序列进行单引物扩增,理论上该反应可以对目标序列的拷贝数提高80倍;其次,第二轮PCR反应,单独的加入AD引物,通过低温退火,尽可能的与目标序列结合,合成目标序列的第二条链。在此过程中先不加入SP2引物,这样可以排除在低温退火时,SP2引物的非特异性扩增。当完成第二条链的扩增后,再加入SP2引物,利用TAIL-PCR的大循环的程序特异性的扩增目标序列。接下来的第三轮和第四轮PCR与常规的TAIL-PCR的第二轮和第三轮基本相似。同时再根据"用于目的基因克隆的片段"的序列设计上游和下游各四条TAIL-PCR特异性引物设计方向为需要扩增的未知区域方向,其基本思路如图1所示。为了能够特意的与目标序列结合,我们在引物设计时尽可能的考虑以下因素(l)引物的退火温度,在PCR反应时,如果设计的SP引物的退火温度太高,会影响SP引物与目标序列的结合效率,但如果退火温度偏低又容易造成SP引物的非特异性扩增。目前初步确定的退火温度是利用PrimerPrimier5预测的Tm值减去3t:确定为SP引物的退火温度;(2)引物的二级结构,为了提高引物的结合效率在SP引物中尽量避免二级结构,尤其是3'端;(3)引物3'端序列,为了减少SP引物的非特异性结合,在3'端的最后6-7个碱基中,最好含有3-4个A/T;(4)引物的设计部位,根据已知序列设计SP引物时,尽可能的考虑已知序列自身的的二级结构,SP引物最好设在二级结构比较弱的区域。通过本发明的方法克隆得到4个新的CP植酸酶,其氨基酸序列分别如SEQIDNo.1、SEQIDNo.2、SEQIDNo.3、和SEQIDNo.4所示。根据本发明的得到4个新的CP植酸酶基因序列分别如SEQIDNo.5、SEQIDNo.6、SEQIDNo.7、和SEQIDNo.8所示。根据本发明的直接从环境宏基因组克隆新CP植酸酶的方法包括以下步骤1)分离山羊和牛的瘤胃液宏基因组DNA;2)设计CP植酸酶的简并引物对,通过比对已报道的CP植酸酶的序列,寻找该类植酸酶中比较保守的序列,基于该类植酸酶的保守序列[V/M/I]-D-L-R-[Q/K/E]-E-[S/T]-H和W-L-H-F-H-C-[X]-[A/E]-G-[X]-G-R-T-T,设计一对有效的简并引物CP-F和CP-R:CP-F:5'-GTGGACCTRCGRSARGARWCICA-3',禾口CP-R:5'-GTCCGACCATTGCCTGCYTCRCARTGRAMRTGIADCCA-3'其中,Y代表C或T,R代表A或G,M代表A或C,D代表A,G或T,S代表C或G,N代表A,C,G,T,I代表A,C,G或T;3)利用上述简并引物从山羊和牛的瘤胃液宏基因组DNA中分别扩增目的基因的部分片段,本发明中从牛瘤胃和羊瘤胃中总共获得了100条相互间序列一致性低于95%的CP植酸酶的部分片段,利用简并引物通过PCR的方法能够从宏基因组DNA中扩增得到功能基因的部分片段,这为直接从宏基因组DNA中通过PCR的方法克隆得到基因的全长序列提供了一定的可能性,用于目的基因的克隆从以上获得的大量CP植酸酶片段中分别从牛瘤胃和羊瘤胃随机各挑选2个一致性低的植酸酶片段进行全基因的克隆;4)根据目的基因的已知序列片段设计4个目的基因的特异性引物对SP1、SP2、SP3和SP4,各特异性引物对分别包含特异性上游引物和特异性下游引物,其序列如表1所示;5)以特异性引物对SP1分别对所选出的CP植酸酶基因片段进行第一轮TAIL-PCR扩增,针对目标序列含量低的特点,本发明增加了一步特异性引物SPl单引物对目标模板序列进行扩增,以提高目标片段的拷贝数,该PCR反应中,利用SP1引物经过80个循环对目标序列进行单引物扩增,理论上该反应可以对目标序列的拷贝数提高80倍;6)以特异性引物对SP2对和简并引物对第一轮TAIL-PCR产物进行第二轮TAIL-PCR扩增,单独的加入AD引物,通过低温退火,尽可能的与目标序列结合,合成目标序列的第二条链,在此过程中先不加入SP2引物,这样可以排除在低温退火时,SP2引物的非特异性扩增,当完成第二条链的扩增后,再加入SP2引物,利用TAIL-PCR的大循环的程序特异性的扩增目标序列,接下来的第三轮和第四轮PCR与常规的TAIL-PCR(Liuetal.,1995;2007)的第二轮和第三轮基本相似;7)以特异性引物对SP3对和简并引物对第二轮TAIL-PCR产物进行第三轮TAIL-PCR扩增;8)以特异性引物对SP4对和简并引物对第三轮TAIL-PCR产物进行第四轮TAIL-PCR扩增;9)分析第三轮和第四轮TAIL-PCR扩增产物,通过拼接分别获得CP植酸酶基因的全序列。以上步骤中所用AD引物如表2所示。表1用于TAIL-PCR的SP引物片段名称引物名称引物序列长度(bp)Y18Y90Nl腦uSPl5'-CTTGTAGAACTCCACAAAGCGGTCA-3'25uSP25'-CTGTTCCGTCATTACTGACTCCACCT-3'26uSP35'-TATGTTCCCGTTCATTCACCTGCT-3'24usp45'-AGGTCTTGTAGCGGCTGTACCAG-3'23dSPl5'-TGAGCAGGTGAATGAACGGGAAC-3'23dSP25'-TGCCATACAAGCCAAGGATAAAGG-3'24dSP35'-GATTATGGATTATTCTGCACCCACCAG-3'27dsp45'-TGACCGCTTTGTGGAGTTCTACAAG-3'25uSPl5'-GACAAAGGCCATGAACTCCTCCA-3'23uSP25'-CGTTCCGTCATTACGTCCTTCG-3'22uSP35'-CGCCTCATCCAGTTCCACTTCC-3'22usp45'-CTTCTCCTCGTACCAGCTCACGG-3'23dSPl5'-GGCAAGGATGCTAAGGAAGTGGA-3'23dSP25'-TGGCAAGTCGGATACGGAAAGG-3'22dSP35'-GGAGTTCATGGCCTTTGTCGC-3'22dsp45'-GCGGCACTGCCGGAGGATGC-3'20uSPl5'-GAGAACGGTAGCATTCGAGGAACTGATC國3'28uSP25'-CTGCTTCTTGACGGCCTCGCTCT-3'23uSP35'-CGGTGATGGTCTGTCCCTTCAGCGAGT-3'27usp45'-GACCAGTTGATGTAGCCGTACCACGAC-3'27dSPl5'-TGTCGTGGTACGGCTACATCAACTGG-3'26dSP25'-TCCACTCGCTGAAGGGACAGACCA-3'24dSP35'-CACCGTCGATGTGGACAGTGCCT-3'23dsp45'-GATCAGTTCCTCGAATGCTACCGTTCTC-3'28uSPl5'-GGCTACATCAATGACCACGCTGTAAGC-3'27uSP25'-GCTGACGGCTGAGCAGGTGGATGA-3'24uSP35'-AGGCGTAGTATTTACCGCTCCAATCAAGG-3'29usp45'-TGGATTATTCCGCACCAACCAGGGA-3'25dSPl5'-TCCCTGGTTGGTGCGGAATAATCCA-3'25dSP25'-CTACCTTGATTGGAGCGGTAAATACTACGC-3'30dSP35'-GCAAATTATGTTCCCGTTCATCCACCT-3'27dsp45'-GCTTACAGCGTGGTCATTGATGTAGCC-3'27表2用于TAIL-PCR的AD引物7<table>tableseeoriginaldocumentpage8</column></row><table>因此,本发明以瘤胃环境宏基因组DNA为模板,利用从中克隆得到的4个具有新颖性的CP植酸酶基因片段,通过以上改进的TAIL-PCR的方法,分别获得到了这4个片段上下游的侧翼序列。经过拼接及开放阅读框的分析发现该4个基因都克隆得到了完整的阅读框,这些序列与已报道的序列相比都具有较高的新颖性,并且这些序列之间也具有较低的一致性。以上结果表明,利用TAIL-PCR从环境宏基因组DNA中直接克隆功能基因的侧翼的序列,是一种可行的克隆基因的方法。此外,该方法有效,经济,简单,可以特异性的从环境宏基因组文库中,直接克隆目标序列。并且该方法不需要分离培养微生物,也不需要构建宏基因组文库,因此该方法在从特殊环境中直接克隆具有特点的基因方面具有很好的应用前旦豕。图1:TAIL-PCR的图图2:提取的瘤胃液宏基因组DNA,其中,M:DNA分子量;其中图3"a为山羊瘤胃液宏基因组DNA,图》b为牛瘤胃液宏基因组DNA。图3:瘤胃液CP植酸酶基因片段扩增,M:DNA分子量;1:山羊瘤胃,2:牛瘤胃,PCR产物如箭头所示。图4:瘤胃液CP植酸酶基因Y90上游侧翼序列第三轮和第四轮TAIL-PCR产物电泳。具体实施例方式实施例1直接从环境宏基因组克隆新CP植酸酶—、瘤胃液微生物宏基因组DNA的提取为了尽可能获得瘤胃液中所有微生物的基因组,采用直接裂解法分别提取山羊和牛的瘤胃液微生物的宏基因组DNA(Brady,2007)。具体步骤如下1)取50mL瘤胃液,用纱布过滤除去未消化的草根及大颗粒,并用适量的灭菌磷酸盐缓冲液冲洗草根中吸附的部分微生物;2)上清转移至多个新的50mL离心管中,加入两倍体积预热的裂解缓冲液,70C水浴2h,其间每隔10min轻轻晃动混匀一次;3)取出后冷却至室温,5,000rpm离心10min,弃沉淀,重复离心一次;4)上清中加入0.7倍体积的异丙醇,轻柔混匀,冰上放置30min,10,OOOrpm离心30min,沉淀用70%的乙醇清洗一次真空干燥10min,溶于lmLddH20中;5)取5-10iiL此粗提的宏基因组DNA电泳检测;6)粗提的宏基因组DNA用0.8%琼脂糖凝胶电泳,切胶回收分子量在10_40kb的基因组DNA。利用以上方法分离得到的DNA,通过琼脂糖凝胶电泳分析,表明提取的DNA片段大小介于10-30kb之间(图1),可以直接用于通过PCR的方法从中扩增目标基因。二、CP植酸酶简并引物的设计〈2-l〉CP植酸酶保守区域的确定收集GenBank中包括环境宏基因组测序的序列以及Protein数据库中所收录的所有完整的CP植酸酶的氨基酸序列,并进行比对分析和去冗余处理。最终选择了8条比较有代表性的序列作进一步的比对分析。从这些序列的比对结果发现两个相对比较保守的区域[V/M/I]-D-L-R-[Q/K/E]-E-[S/T]-H和W-L-H-F-H-C-[幻_[A/E]_G_[幻-G-R-T-T,CP植酸酶这两个区域位于活性中心,非常保守。〈2-2〉CP植酸酶简并引物的设计按照CODEHAP引物设计的基本原理,根据这两个保守区域设计一对简并引物。在保证特异性扩增植酸酶基因的前提下,为了使引物能够与潜在的更多植酸酶基因配对结合,将设计的简并引物利用HarvardMedicalSchool的MS-BLAST进行BLAST比对分析,然后根据比对结果优化引物序列,设计了CP植酸酶的简并引物CP-F和CP-R,引物序列如下CP-F:5'-GTGGACCTRCGRSARGARWCICA-3'CP-R:5'-GTCCGACCATTGCCTGCYTCRCARTGRAMRTGIADCCA-3'(Y代表C或T;R代表A或G;M代表A或C;D代表A,G或T;S代表C或G;N代表A,C,G,T;1代表A,C,G或T)三、瘤胃液CP植酸酶基因片段的扩增分别以纯化的羊瘤胃液和牛瘤胃液的微生物宏基因组DNA为模板,用设计的CP植酸酶的简并引物CP-F和CP-R扩增植酸酶基因片段,扩增反应采用高效率的T叫mixDNA聚合酶。PCR反应体系如下2XTaqmixCP-F(20iimol/L)CP-R(20iimol/L)总基因组DNAddH2019iiL总体积50iiLPCR反应参数为:94°C5min;94°C30sec,58。C30sec,72。C30sec(每个循环后,复性温度下降O.5°C),IO个循环;然后94。C30sec,52。C30sec,72。C30sec,28个循环;72°C5min。PCR产物用1.5%琼脂糖凝胶电泳分析,如图2所示。通过琼脂糖凝胶回收试剂盒(TaKaRa公司),回收与估计目的条带大小(400bp左右)相符的片段,并用单引物对该回收的片段进行检测,确信该片段是由双引物所扩增出来的片段,再将其连结pGEMTeasy载体(Promega公司),接着转化大肠菌感受态细胞JM109。筛选转化子,并对转化子进行质粒提取检测,并随机挑选含有目的片段的转化子进行DNA序列的测定。结果分别从羊瘤胃环境和牛瘤胃环境中分离得到相互间一致性低于95%的片段60条和40条。四、CP植酸酶基因全长序列的扩增〈4-1>目标基因片段的选择从羊瘤胃的60条序列中选择了2条用于扩增全长序列,并在牛瘤胃的40条序列中也选择了2条用于扩增全长序列,即从整个瘤胃环境中选择了4个具有较高新颖性的CP植酸酶片段序列用于克隆CP植酸酶全长序列。〈4-2〉SP引物的设计SP引物的设计,根据已知序列片段分别设计扩增上游序列的引物uSP(uSPl,uSP2,uSP3,uSP4)和下游序列的引物dSP(dSPl,dSP2,dSP3,dSP4)(见表1)。与从普通的单菌中克隆基因的TAIL-PCR中的SP引物相比,mTAIL-PCR的SP引物的设计更加严格。为了提高SP引物与复杂的环境宏基因组DNA中含量极少的目标DNA序列特异性结合,所以如前所述,在引物设计上需要注意一些细节,特别是第一轮和第二轮PCR的SP引物。〈4-3>mTAIL-PCR扩增瘤胃环境中的CP植酸酶基因为了提高从复杂的环境宏基因组DNA中直接克隆目标基因的效率,采用了改进的由四个PCR程序构成的mTAIL-PCR的方法,克隆已知片段两侧的未知序列。以下是整个mTAIL-PCR的反应体系,PCR反应液的配置以及mTAIL-PCR的反应程序。第一轮mTAIL-PCR(TAIL1)的反应目的是利用SP1引物进行单引物扩增目标序列,特异性的提高目标序列的拷贝数。第一轮mTAIL-PCR的反应体系,反应液的配置以及反应程序如下DDW30.8iiL380.OilL10Xbuffer4.OilL48.0iiLd證(2.5mMeach)2.OilL24.0iiLSPl(10iiM)1.OilL12.OilLLATaq(2.5U/iiL)0.2iiL4.8iiLDNA模板(10-20ng)2.OilL24.0iiL体系40.0iiL40.0iiL分装PCR程序0094]1)95°C3min0095]2)94°C30sec,62。C30sec,72。C4min,45个循环(在第二步反应结束后,第三步反应之前,需要重新添加0.2iiLLATaq和1iiLdNTP)0096]3)94°C30sec,62。C30sec,72。C4min,35个循环0097]4)72°C10min,4。C0098]反应结束后利用PCR产物纯化试剂盒对以上PCR产物进行纯化,将所有纯化后的PCR产物溶于110iiL去离子水,并分成11份,每份10iiL用于第二轮的PCR扩增的模板。0099]第二轮mTAIL-PCR(TAIL2)的反应,主要通过SP2和AD引物对特异性序列进行初步扩增,所述AD引物序列(见表2)。反应体系,反应液的配置以及反应程序如下0100]X124.3iiL50.0iiL2.0iiL24.0iiLl.OiiL12.0iiLl.OiiL0.2iiL2.4iiL10.0iiL120.0iiL0101]0102]0103]0104]0105]0106]0107]DDW10Xbufferd證(2.5mMeach)AD(11条引物100iiM)LATaq(2.5U/iiL)DNA模板20.OilL19.0iiL分装^13个循环0108]体系0109]PCR程序0110]1)95°C2min0111]2)94°C30sec,30。C3min,72。C3min,0.3°C/sec,1个循环(第二步结束后,分别向每个PCR反应体系中加入SP2的特异性引物用于接下来的PCR扩增)0112]3)94°Clmin,62。C30sec,72。C3min,1个循环0113]4)94°C30sec,44。C30sec,72。C3min,5个循环0114]5)94°C30sec,62。C30see,72°C3min、94。C30sec,62°C30sec,72°C3min940C30sec,44oC30sec,72°C3min6)72°C10min,4。C保温第三轮mTAIL-PCR(TAIL3)与普通TAIL-PCR的第二轮PCR作用相似,整个反应的体系及反应程序相同。第三轮mTAIL-PCR的反应体系,反应液的配置以及反应程序如下X12DDW13.8iiL10Xbuffer2.0iiLd證(2.5mMeach)1.5iiLAD(ll条引物100iiM)l.OiiLSP3(10iiM)0.5iiLLATaq(2.5U/iiL)0.2iiL乂166.OilL24.0iiL18.OilL6.OilL2.4iiLDNA模板(TAIL2产物稀释50倍)1.0iiL体系20.0iiLPCR程序1)95°Clmin2)94°C20sec,62。C35sec,72。C3min,2个循环18.OilL3)94°C20sec,62°C30sec,72°C3min940C20sec,62。C30sec,72。C3min94。C20sec,44。C30sec,720C3min4)72。C10min,4。C保温、^14个循环乂第四轮mTAIL-PCR(TAIL4)的反应体系,反应液的配置以及反应程序X12DDW10Xbufferd證(2.5mMeach)AD(11条引物100iiM)SP4(10iiM)LATaq(2.5U/iiL)DNA模板(TAIL3产物稀释5037.5iiL5.OilL2.5iiL2.5iiL1.OilL0.5iiL1.OilL450.OilL60.OilL30.OilL12.OilL6.OilL倍)体系PCR程序1)95°Clmin50.0iiL36.5iiL分装、^IO个循环2)94。C20sec,62°C30sec,72°C2min94。C20sec,62°C30see,72。C2min94。C20sec,44。C30sec,72。C2min3)72°C10min,4°C保温乂〈4-4>TAIL产物的分析,测序及序列拼接通过琼脂糖凝胶电泳分别对每个基因的TAIL第三轮产物和第四轮产物进行电泳分析,并通过这两轮产物的大小以及扩增效果进行分析。结果表明已选择的四个片段的上下游都获得了不同大小的序列片段(图3)。对所获得的这些条片段,分别通过TAKARA的琼脂糖凝胶回收试剂盒进行纯化回收,并将所回收的片段连接到PGEMTEASY(PROMEGA)载体。接着转化大肠菌感受态细胞JM109。筛选转化子,并对转化子进行质粒提取检测,并将含有目的片段的转化子进行DNA测序分析。测序结果表明,这些基因上下游的序列都已经通过以上改进的TAIL-PCR获得。以上所获得的上下游序列和已知的片段序列都被输入序列分析软件VectorNTI10.0,并通过序列拼接程序,将每个基因的三条序列拼接成一条完整的序列。再使用ORFfind程序找到完整的植酸酶开放阅读框。这些基因的开放阅读框的大小分别由957bp、996bp、1113bp和957bp组成,都含有一段信号肽序列。五、CP植酸酶序列的分析从瘤胃环境克隆得到的4个完整的植酸酶基因之间序列一致性很低,这些序列都具有较高的新颖性,一方面是序列自身与目前报道的所有CP植酸酶序列具有较低的一致性,这些序列自身的一致性非常低,仅介于41-60%,另一方面,该序列是直接从环境宏基因组DNA中克隆得到的。(1)Y18植酸酶基因来源于羊瘤胃环境,基因全长957bp,编码318个氨基酸和一个终止密码子。用SignalP(http:〃www.cbs.dtu.dk/services/SignalP)进行分析表明N端25个氨基酸为预测的信号肽。预测该基因所编码的成熟蛋白的理论分子量为36.2kDa,等电点为6.6。将Y18基因序列及推导出的氨基酸序列在GenBank中进行BLAST比对发现,该基因与来源于MitsuokellamultacidaDSM20544的一个假定蛋白序列的一致性最高,氨基酸序列一致性为57%。其氨基酸序列如SEQIDNo.1所示:DYAKAHPQLDISWSQWCDQQGYTD其编码基因的核苷酸序列如SEQIDNo.5所示atgaagcagattacccggtgggcgtcaataatattggcaatgctggttttgttgagctgtggtctggta3tggcggccg朋ccgg33gtegg3gtec3ggtttte33gtttg3ccgc3ttgcggg朋tgg3C3肌3tgccc33tg33tetcgggc3gc3tcc33ggg3333ttc33gcgtgcc33333cg3tetet3tccc3ccc3gg3ggggct朋3gg3tttecgg3cttctggc3gc3gttettttgcc肌g朋tg朋ttc3肌gccttgctgc肌33g3ttccggc3g33gtgg33aatattgtggttttggacctgcgcaacgagtcccacggctacatcaatgaccatgctgtaagctggtacagccgctaC33g3ccttte3te33gggttg3c3gctg3gc3ggtg朋tg33cggg33c3te3tttgctte3gg33gccc3333ggctgg朋ccgtte3tettgcc3t3C33gcc33gg3t333ggcgtggtettteccgctcctetc朋ggtgg3gtc3gteatgacggaacaggaattcgtggagtccatgggggtaaagtatttccggattccgattatggattattctgcacccacC3gggc朋3tettg3ccgctttgtgg3gttctec33g朋tttgccggcc33tecctgg3ttc3tgctc3ctgtg33gCgggtgtcgg3cgg3ctecc朋c3cccttegc3tggtgg3tetg3ttc3te3tgctecc333ctc3gttetg3tg3g3te3tg3cc3g3C3ggttttg3tgggtggtc3gg3tgttcgc肌3tc3gcgg朋33ggcc3ctg3cccctete3肌3ggcc朋ttetccg3肌3gggc3g朋ttt3ctcgtcggtttt3tg3ct3tgcc肌ggc3C3tcctc3gttgg3tetc3gctggagccagtggtgtgaccagcagggttacaccgactaa(2)Y90植酸酶基因来源于羊瘤胃环境,基因全长957bp,编码318个氨基酸和一个终止密码子,预测分析表明,N端27个氨基酸为预测的信号肽。预测该基因所编码的成熟蛋白的理论分子量为33.lkDa,等电点为7.9。将Y90基因序列及推导出的氨基酸序列在GenBank中进行BLAST比对发现,该基因与来源于Selenomonasruminantium的CP植酸酶序列相似性最高,氨基酸序列一致性为42%。13其氨基酸序列如SEQIDNo.2所示MRVRIRYGGAIVFALL丽LLLASIACAEGTWRLDGDGKGGMPRNFRMASDDWHRALGRTEAPPRRGLDVRTKDTSLPWSAWLEQEREPKGTE其编码基因的核苷酸序列如SEQIDNo.6所示Atgagagttcgtattcgatatgggggcgcgattgtttttgccttgctgtggatgctgctgcttgcgtcc3ttgCCtgtgCtg3ggg^CgtggCggCtgg3Cgggg3tggg^3ggCggC3tgCCCCgg^CttCCgC3tggCttCgg3tg3CtggC3CCgggCgCtggggCgg3Cgg^gC3CCgCCCCgC3gggg3CtggattCCCtgC3tgCCtctgCC3gtgcccagacttcccttaagggactgtccgcattgtacaagaaactggcatctgcagcaccgaatccgaggcagatctecatggtgg3tttecggc3gg3gtccc3cggctttgcc^cggcgttcccgtg3gctggtecg3ggag肌g^ccgCgcc^tttcggc^gg3tgcte3gg^gtgg^ctggatg3ggcgg3gcggctg肌c3gcctgcgg^gc^^g3cgacctttgttccccttggcaagtcggatacggaaaggctcaagcccatgacctttgcgccgaaggacgtaatgacgg^cggg^gcggcac3gcgggc3gggttccggtetgtgcgcttcgccgctgcgg3C3tggtetggcccgatgcc肌^Cggtgg3gg3gttC3tggCCtttgtCgCggC3CtgCCgg3gg3tgCCtgg3tCC3CgtCC3ttgCg3ggC3ggC3atggtcgcaccacaagcttcctcgcattgtacgatcttctcaggaatccggacgtatccctggaagatgtggcaaggCggc3gteccttctcggcggc3cgg3ccttttctcg^g3gc3gcgggg3ggattggtetgccc3ggccc3c^tg3gcgggcggaaatgctgcgcctcttttatcgttatgccagtgaagtgcggacgaaggacacgtctcttccctggagtgC3tggctgg^c3gg^3g3g3gccg^gggg3cgg3gtea(3)Nl植酸酶来源于牛瘤胃环境,基因全长为1,113bp,编码370个氨基酸和一个终止密码子,预测N端33个氨基酸为预测的信号肽。预测该基因所编码的成熟蛋白的理论分子量为39.lkDa,等电点为5.6。Nl植酸酶基因序列及氨基酸序列在GenBank中进行BLAST比对分析,该基因与来源于Selenomonaslacticifex的CP植酸酶序列相似性最高,氨基酸序列一致性为40%。其氨基酸序列如SEQIDNo.3所示其编码基因的核苷酸序列如SEQIDNo.7所示atgaaagcaaaacaatttcactggcgcagccaattaagcattaagcatgttgcatcatgcattgtcctgctgggaatagtctcgtgcgtagactacggcgacaacccagtagtagaggacaaccaccgggattatccggccgaagtgtett3ttecctg朋c33ggcc33cg3gcgcg3g33cccctctg3gg33g朋cgcgcggtctecg3ggcc33gg3gtggcgcatggagtcgaagaacaccacggtgaccctgccccagaacttccgctggtgcggtggcgagttcaacgctaacgggttgaacgaggagttgcccgatcccacctacctccccaccactcagggactcaacacgctcatgatctccggcagtgcccgtttctccgacaaggagctgaacgcgcgcacctcgtgggtcactcatcagtggggtgacataccgcgttacgtcatcgacctgcggcaggagtctcacggcttcatcaacggtcaccatgtgtcgtggtacggctacatcaactggtcg^C3tCggC^肌3gCgCg3CC3g3ttctCC^g3gg3gg3gC3gCtgttCC3CtCgCtg^ggg3C3g3CC3tC3CCgtgggC33g3tC3gCtCgtC肌3C33CteCgtg3tg3CCg3CgCtC3gg3C3tC3CCgtCg3tgtgg3C3gtgCCtgg3CCg3g3gCg3ggCCgtC^g^gC3gggCtgggg3teC3ggCgtetC3CCgCCCtCg3CC3CgtgttCCCCtgCgacgagatcatcgatcagttcctcgaatgctaccgttctctgccacgtgatgcatgggtacacttccactgccaggccggccgcggacgcaccaccacgttcatgtcgttcttcgacatgctgcgcaaccccgacgtacccctgaaggacattctctatcgccaaaccgagttaggcggcaccagtctgtactaccaaggcacacgccccacggagcagccctggcgcgtagacctcttcaccgagaccagctggctcgtgcccctgctctacgactatgtgcaggacaacaagggcaacggctacaccatctcctggactgactggaagaagcgcaccttccagctctaa(4)N28植酸酶基因全957bp,编码318个氨基酸和一个终止密码子,预测N端25个氨基酸为预测的信号肽。将N28基因序列及推导出的氨基酸序列在GenBank中进行BLAST比对发现,该基因与来源于MitsuokellamultacidaDSM20544的一个假定蛋白序列的一致性最高,氨基酸序列一致性为57%。利用SWISS-MODEL预测其三级结构,被自动选为模板的序列结构是来源于Selenomonasruminantium的CP植酸酶。植酸酶N28与模板序列,在三维结构具有高的一致性。其氨基酸序列如SEQIDNo.4所示DYAKAHPKLDISWSQWCDQQGYTD其编码基因的核苷酸序列如SEQIDNo.8所示atgaagcggcttattcagtgggtgacagctgcatttatgttgatatttttgttggagtgcagtcttgttCttgcggc3g3gcc3g3tg^ggtetec3ggttctte3gttcg3ccg^ctgctgg^cggcteatetgccc^tg33tetcgggctgcatc^肌gg^^tttg3gcgggcccctg3tg3tetctetccttccc3gg3cgggtte^gg肌tgatattgtggtcttggacctgcgtaatgagtcccatggctacatcaatgaccacgctgtaagctggtatagccgctat^^ccttc^c^ggggctgacggctgagcaggtggatg^cggg^cat^tttgctteagg^gctc^^ggctgg^c3gtt^tetcgctetec^gcc肌gg3c肌3ggcgtegtettteccgctcc^tc^ggteg3gtcagteC3ggtgttggtcgtec^ctetc3c3ct肌gtetggtgg3tetectgc3te3tgccggtac3ctc3gctetg3tg^3ttetgacccggc3ggtgttg3tgggggggc3gg3tgttcgte肌tc3gccg^^ggcc3ctg3tccgtec^g肌3gct^ttetccg^3cgggcgg3gttc3ctcgtcggttttetg3ttetgcc^ggc3C3tcc^^ctggatete3序列表〈110〉中国农业科学院饲料研究所〈120〉一种直接从环境宏基因组克隆新功能基因的方法〈160〉8〈210〉1〈211>318〈212>PRT〈213〉羊(goat)〈400>1MKQITRWASIILAMLVLLSCGLVMAAEPEVGVQVLKFDRIAGMDKMPNEYRAASKGKFKR60AKNDIYPTQEGLKDLRTSGSSYFAKNEFKALLQKIPAEVENIVVLDLRNESHGYINDHAV120SWYSRYKTFNKGLTAEQVNEREHNLLKEAQKAGTVNIAIQAKDKGVVFIAPIKVESVMTE180QEFVESMGVKYFRIP頂DYSAPTRANIDRFVEFYKNLPANTWIHAHCEAGVGRTTNTLSM240VDMIHNATKLSYDEMTRQVLMGGQDVRKSAEKATDPYKKANYPKRAEFTRRFYDYAKAH300PQLDISWSQWCDQQGYTD318〈210>2〈211>318〈212>PRT〈213〉羊(goat)〈400>2MRVRIRYGGAIVFALL丽LLLASIACAEGTWRLDGDGKGGMPRNF薩SDDWHRALGRTE60APPRRGLDSLHASASAQTSLKGLSALYKKLASAAPNPRQIYMVDLRQESHGFANGVPVSW120YEEKNRANFGKDAKEVELDEAERLNSLRKQKTTFVPLGKSDTERLKPMTFAPKDVMTERE180AAQRAGFRYVRFAAADMVWPDAKTVEEFMAFVAALPEDAWIHVHCEAGNGRTTSFLALYD240LLRNPDVSLEDVARRQYLLGGTDLFSKSSGEDWYAQAHNERAEMLRLFYRYASEVRTKDT300SLPWSAWLEQEREPKGTE318〈210>3〈211>370〈212>PRT〈213〉牛(bow)〈400>3MKAKQFHWRSQLSIKHVASCIVLLGIVSCVDYGDNPVVEDNHRDYPAEVYYYLNKANERE60NPSEEERAVYEAKEWRMESKNTTVTLPQNFRWCGGEFNANGLNEELPDPTYLPTTQGLNT120LMISGSARFSDKELNARTSWVTHQWGDIPRYVIDLRQESHGFINGHHVSWYGYI丽SNIG180KKRDQILQEEEQLFHSLKGQTITVGKISSSNNYVMTDAQDITVDVDSAWTESEAVKKQGW240GYRRITALDHVFPCDEIIDQFLECYRSLPRDAWVHFHCQAGRGRTTTFMSFFDMLRNPDV300PLKDILYRQTELGGTSLYYQGTRPTEQPWRVDLFTETSWLVPLLYDYVQDNKGNGYTISW360TDWKKRTFQL370〈210>4〈211>318〈212>PRT〈213〉牛(bow)〈400>4MKRLIQWVTAAFMLIFLLECSLVLAAEPDEGIQVLKFDRTAGTANMPNEYRAASKGKFER60APDDIYPSQDGLKELRISGSSYFAKNEFQSLLKKIPAEVNDIVVLDLRNESHGYINDHAV120SWYSRYKTFNKGLTAEQVDEREHNLLKEAQKAGTVNIAIQAKDKGVVFTAPIKVESVMTE180QEYVESMGVKYFRIP頂DYSAPTRDNIDRFVEFYKNLPKTAWIHAHCEAGVGRTTITLSM240VDILHNAGTLSYDEMTRQVLMGGQDVRKSAEKATDPYKKANYPKRAEFTRRFYDYAKAH300PKLDISWSQWCDQQGYTD318〈210>5〈211>957〈212>DNA〈213〉羊(goat)〈400>53tg朋gC3g3ttecccggtgggcgtcaateatettggcaatgctggttttgttgagctgt60ggtctggteatggcggccgaaccggaagteggagtecaggtttteaagtttgaccgcatt120gcggg朋tggac朋朋tgccc朋tg朋tetcgggcagcatcc朋ggga朋attc朋gcgt180gcca朋朋cgatetetetccC3cccaggaggggcte朋ggatttecggacttctggcagc240agttettttgcc朋g朋tgaattc朋3gccttgctgca朋agattccggc3g朋gtgg朋300朋tettgtggttttggacctgcgcaacgagtcccacggctacatcaatgaccatgctgte3603gctggtecagccgctec朋gaccttteat3朋gggttgaC3gctg3gcaggtg朋tg朋420cggg朋cateatttgctteagg朋gccc朋朋ggctgg朋ccgtteatettgccatec朋■gcc朋ggateaaggcgtggtattteccgctcctetcaaggtggagtragt皿tgacgg皿540cagg朋ttcgtggagtccatgggggt腿gtetttccggattccgattetggattettct600gC3CCC3CC3gggca朋tettgaccgctttgtggagttctgccggccaat660acctggattcatgctcactgtg皿gcgggtgtcggacggactecc皿cacccttegcatg720gtgg3tetg3ttcateatgcteccaaactcagttetgatg3g3teatgac780ttgatgggtggtcaggatgttcgcaaatcagcgg腿郷ccactgaccc840gccaattetccg朋朋gggcagaatttectcgtcggttttatgactetgcC皿ggC3C3t■cctcagttggatetcagctggagcragtggtgtgaccagccgactea957〈210>6〈211>957〈212>DNA〈213〉羊(goat)〈400>63tg3g3gttCgtettcgatetgggggcgcgattgtttttgccttgctgtggatgctgctg60cttgcgtccattgcctgtgctg郷g雄gtggcggctgg3Cgggg3tggg腿ggcggc120atgccccggaacttccgcatggcttcggatgactggcaccgggcgctggggcggacgg皿180gcaccgccccgcaggggactggattccctgcatgcctctgccagtgcccagacttccctt240朋ggg3Ctgtccgcattgtegcatctgcagcaccgaatccg3ggcagatc300t織tggtggatttecggcaggagtcccacggctttgccaacggcgttcccgtgagctgg360tecgaggag3ag朋ccgcgccaatttcggc皿ggatgcte郷皿gtgga420gcgg3gcggctgaacagcctgcgg皿gc皿皿gacgacctttgttccccttgg咖gtcg■gatecgga朋ggctcaagcccatgacctttgcgccg皿gg3cgteatgacgg雄ggg皿540gcggcacagcgggc郷gttccggtetgtgcgcttcgccgctgcggacatggtetggccc600gatgcc朋朋Cggtgg3gg3gttcatggcctttgtcgcggcactgccggaggatgcctgg660atccacgtccattgcgaggcCgC3CC3C皿gcttcctcgcattgtecgat720cttctcaggaatccggacgtatccctggaagatgtgg咖ggcggragteccttctcggc780ggcacggaccttttctcgaagagragcgggg郷3ttggtatgcccaggcCC3C皿tg3g840cgggcgg腿tgctgcgcctcttttetcgttetgccagtg皿gtgcggacg皿gg3C3Cg■tctcttccctggagtgcatggctgg皿cagg皿3g3g3gCcg皿ggggacggagt皿957〈210>7〈211>1113〈212>DNA〈213〉牛(b'ow)〈400>7ctggcgcagcc皿tteagc3tteagcatgttgcatcatgc60attgtcctgctggg皿tegtctcgtgcgtegactecggcgacaacccagt3gtegaggac120朋CC3CCgggattetccggccg皿gtgtettettecctga3C皿ggCC皿Cg3gCgCg3g180aacccctctg3gg皿g皿Cgcgcggtctecg郷c咖ggagtggcgratggagtcg皿g240朋C3CC3Cggtgaccctgccccagaacttccgctggtgcggtggcgagttcaacgcteac30018gggttg雄gaggagttgcccgatcccacctecctccccaccactcagggactcaacacg360ctcatgatctccggcagtgcccgtttctccgac皿ggagctg皿cgcgcgcacctcgtgg420gtcactcatc3gtggggtg3cateccgcgttecgtcatcgacctgcggcaggagtctcac■ggcttcatcaacggtcaccatgtgtcgtggtecggctecatcaactggtcg皿catcggc540a朋朋gcgcgaccagattctCC皿g3gg3ggagragctgttccactcgctg皿ggg織g600accatcaccgtgggC3卿tcagctcgtca皿c皿ctecgtgatgaccg3cgctcaggac660atcaccgtcg3tgtgg織gtgcctggaccg卿gcg郷ccgtc皿g皿gc郷gctgg720ggatecaggcgtetcaccgccctcgaccacgtgttcccctgcgacgagatcatcgatcag780ttcctcgaatgcteccgttctctgccacgtgatgratgggtecacttccactgccaggcc840ggccgcggacgC3CC3CC3Cgttcatgtcgttcttcgacatgctgcgcaaccccgacgte■cccctgaaggacattctctetcgccaaaccgagtteggcggcaccagtctgtecteccaa960ggcacacgccCC3Cgg3gC3gccctggcgcgtegacctcttcaccgagaccagctggctc1020gtgcccctgctctecgactetgtgc郷ac皿C皿gggC3acggctecaccatctcctgg10803Ctg3Ctgg33g朋gCgC3Ccttccagctctea1113〈210>8〈211>957〈212>DNA〈213〉牛(bow)〈400>8atgaagcggcttettcagtgggtg織gctgcatttetgttgatatttttgttggagtgc60agtcttgttcttgcggc卿gCC3g3tg皿ggtet織ggttctteagttcgaccgaact120gctgg雄ggcteatetgcccgggctgcat3tttg3gCgg180gcccctgatgatetctetccttcccaggacgggtt腿ggaattgcgtet3tC3ggC3gC240agctettttgattccagtcca皿teccggc300gatettgtggtcttggacctgcgt皿tgagtcccatggctccacgctgte360agctggtetegccgcteteaaaccttcaac皿ggggctgaCggCtg3gC3ggtggatg皿420cggg朋cateatttgctteagg皿gctc皿皿ggctgg皿cagtteatetcgctetecaa■gcc朋ggaca朋ggcgtegtattteccgctcc皿tc皿ggtegagtcagt540cagg朋tecgttgagtccatgggagtea皿tetttccggattccteteatggattettcc600gC3CC朋CC3gggateatettgaccgatttgttgagtttt660gcctggatecatgcccattggttggtcgtecaactetcacacteagtetg720gtggatetectgcateatgccggtecactcagctetgatgccggcaggtg780ttg3tgggggggcaggatgttcgteaatcagccg朋皿ggccactgatccgtec皿ga朋840gcteattetccgaaacgggcggagttcactcgtcggttttatgattetgcC皿ggC3C3t■cc朋朋ctggateteagctggagcc皿tggtgtgatcagcagggatetectgactea95权利要求一种直接从环境宏基因组克隆新功能基因的方法,其特征在于,所述方法包括以下步骤1)分离含目的基因的环境宏基因组DNA;2)基于目的基因的保守序列设计简并引物对;3)利用简并引物从含目的基因的环境宏基因组DNA中克隆目的基因的部分片段,比对所得的目的基因的部分片段,并选出用于目的基因克隆的片段;4)根据用于目的基因克隆的片段的序列设计4个特异性引物对,从上游至下游依次为特异性引物对SP1、SP2、SP3和SP4,各特异性引物对分别包含特异性上游引物和特异性下游引物;5)以特异性引物对SP1对所述用于目的基因克隆的片段进行第一轮TAIL-PCR扩增;6)以特异性引物对SP2对和简并引物对第一轮TAIL-PCR产物进行第二轮TAIL-PCR扩增;7)以特异性引物对SP3对和简并引物对第二轮TAIL-PCR产物进行第三轮TAIL-PCR扩增;8)以特异性引物对SP4对和简并引物对第三轮TAIL-PCR产物进行第四轮TAIL-PCR扩增;9)分析第三轮和第四轮TAIL-PCR扩增产物,通过拼接获得目的基因的全序列。2.—种直接从环境宏基因组克隆新CP植酸酶的方法,其特征在于,所述方法包括以下步骤1)分离山羊和牛的瘤胃液宏基因组DNA;2)设计CP植酸酶的简并引物对CP-F:5'-GTGGACCTRCGRSARGARWCICA-3',禾口CP-R:5'-GTCCGACCATTGCCTGCYTCRCARTGRAMRTGIADCCA-3'其中,Y代表C或T,R代表A或G,M代表A或C,D代表A,G或T,S代表C或G,N代表A,C,G,T,I代表A,C,G或T;3)利用上述简并引物从山羊和牛的瘤胃液宏基因组DNA中分别扩增目的基因的部分片段,比对所得的目的基因的部分片段,为了克隆高新颖性的基因,分别选出一致性最低的片段,用于目的基因的克隆;4)根据上述选出片段的序列设计4个目的基因的特异性引物对SP1、SP2、SP3和SP4;5)以特异性引物对SP1分别对所选出的CP植酸酶基因片段进行第一轮TAIL-PCR扩增;6)以特异性引物对SP2对和简并引物对第一轮TAIL-PCR产物进行第二轮TAIL-PCR扩增;7)以特异性引物对SP3对和简并引物对第二轮TAIL-PCR产物进行第三轮TAIL-PCR扩增;8)以特异性引物对SP4对和简并引物对第三轮TAIL-PCR产物进行第四轮TAIL-PCR扩<formula>formulaseeoriginaldocumentpage2</formula>9)分析第三轮和第四轮TAIL-PCR扩增产物,通过拼接分别获得CP植酸酶基因的全序列。3.从环境宏基因组克隆的CP植酸酶,其特征在于,所述植酸酶的序列如SEQIDNo.1、SEQIDNo.2、SEQIDNo.3或SEQIDNo.4所示。4.权利要求3所述CP植酸酶的基因,其特征在于,其序列如SEQIDNo.5、SEQIDNo.6、SEQIDNo.7或SEQIDNo.8所示。全文摘要本发明涉及分子生物学领域,具体地,本发明涉及一种直接从环境宏基因组克隆新功能基因的方法。本发明提供的方法主要包括两部分第一部分,通过设计有效的简并引物直接通过降落PCR的方法从环境宏基因组中扩增大量的目标片段序列;第二部分,以第一部分中获得的目标片段为基础,进一步通过改进的TAIL-PCR获得完整的目标功能基因。该方法有效,经济,简单,可以特异性的从环境宏基因组文库中,直接克隆目标序列。并且该方法不需要分离培养微生物,也不需要构建宏基因组文库,因此该方法在从特殊环境中直接克隆具有特点的基因方面具有很好的应用前景。文档编号C12N9/16GK101724627SQ200910242379公开日2010年6月9日申请日期2009年12月15日优先权日2009年12月15日发明者史秀云,姚斌,孟昆,杨培龙,柏映国,王亚茹,石鹏君,罗会颖,袁铁铮,黄火清申请人:中国农业科学院饲料研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1