本发明涉及基因工程技术领域,具体涉及一种重组耶氏解脂酵母菌株及其构建方法与应用。
背景技术:
目前,甾体激素类药物是仅次于抗生素的第二类药物,在制备保健品、治疗呼吸系统疾病、内分泌失调、淋巴白血病、风湿病以及皮肤病等方面被广泛应用。作为制备各种甾体类药物的原材料,甾体激素中间体应用广泛,具有重要的医药价值和巨大的市场需求。其中一个重要中间体孕烯醇酮(pregnenolone)其合成是所有甾体激素合成的第一步也是限速步骤。该步骤由一个细胞色素p450侧链降解酶系统(p450scc)催化,包含细胞色素氧化酶cyp11a1及其电子传递系统中伴随蛋白铁氧还蛋白adx和铁氧还蛋白还原酶adr。具体反应如图1所示,首先nadph通过adr将电子传递给adx,adx再将电子传递给cyp11a1,继而cyp11a1催化胆固醇及其类似物生成孕烯醇酮。
一直以来,孕烯醇酮合成所涉及的p450电子传递系统这三种组分间适配性复杂,酶促反应效率较低,因此p450scc的优化和孕烯醇酮产量的提高始终是科学家研究的热点。2008年,novikova.l.a研究组在耶氏解脂酵母菌株(yarrowialipolytica)中构建了人(homosapiens)来源adx、adr与人(homosapiens)和牛(bostaurus)来源cyp11a1的p450scc表达体系,通过胆固醇添加实现了由胆固醇到孕烯醇酮的生物转化,但转化效率非常低,24h后检测到的孕烯醇酮占总甾醇比例仅为8%。2013年该课题组又在大肠杆菌中构建了牛的侧链降解系统,再次实现了胆固醇的生物转化,孕烯醇酮产量仅为420μg/l。2015年俄国另一研究者adriangerber发表了在巨大芽孢杆菌(bacillusmegaterium)中胆固醇及其类似物的生物转化的研究结果,推测利用该菌株内phb颗粒的原位催化效应使孕烯醇酮提高到了95mg/l。
虽然利用微生物转化法生产孕烯醇酮与传统方法相比具有很大优势,规避了化学合成步骤繁多、有机试剂排放等诸多弊端。但由于该反应是在微生物胞内甾体转化酶的催化作用下完成的,而甾体类物质通常具有较强的疏水性,一般很难溶解在培养基中,普遍采用的环糊精包埋方式也很难被微生物细胞吸收与酶接触反应,严重限制孕烯醇酮的生成。而合成生物学的快速发展使微生物中从头合成天然产物成为可能,利用简单碳源(如葡萄糖)对孕烯醇酮进行生物全合成,一方面可以规避疏水性底物添加造成的底物利用率低,另一方面还可以降低投料成本,更加有利于工业化生产。但是利用合成生物学方法在酵母菌株中从头合成孕烯醇酮相比于胆固醇添加的生物转化方法,其代谢路径更长、涉及到的基因更多、代谢调控更加复杂,因此在更具潜力的同时困难也更大。1998年,catherineduport在合成菜油甾醇基础上,于酿酒酵母中共表达牛细胞侧链降解酶系统p450scc,实现了单一碳源到孕烯醇酮的生物全合成,使产量达到60mg/l。但酿酒酵母中孕烯醇酮多以酯化形式存在,且甾体类物质通常具有较强的疏水性,在体内的储存及转运将成为制约后续甾体药物生产的瓶颈。而耶氏解脂酵母(yarrowialipolytica)是一种需氧的、无致病性的二型性非常规酵母。该酵母因其可以有效地利用碳水化合物或疏水性底物为唯一碳源进行生长繁殖而得到研究人员的关注。因此,亟待开发利用简单碳源(如葡萄糖)对孕烯醇酮进行生物全合成,高产孕烯醇酮的耶氏解脂酵母。
技术实现要素:
有鉴于此,本发明的目的是提供一种合成孕烯醇酮的重组耶氏解脂酵母菌株及其构建方法与应用。
为了实现上述发明目的,本发明提供以下技术方案:
本发明提供了一种重组耶氏解脂酵母菌株,包含细胞色素氧化酶cyp11a1基因、电子传递体adr基因和adx基因,其中所述细胞色素氧化酶cyp11a1基因为经优化和去除线粒体转运肽的野猪、雀或牛蛙来源cyp11a1基因序列;所述adr基因为经优化和去除线粒体转运肽的牛或耶氏解脂酵母来源adr基因序列;所述adx基因为经优化的和去除线粒体转运肽的牛或耶氏解脂酵母来源adx基因序列。
优选的,所述细胞色素氧化酶cyp11a1基因的核苷酸序列如seqidno:3、seqidno:6或seqidno:8所示。
优选的,所述adr基因的核苷酸序列如seqidno:11或seqidno:13所示;所述adx基因的核苷酸序列如seqidno:15或seqidno:17所示。
进一步优选的,所述重组耶氏解脂酵母菌株中所述细胞色素氧化酶cyp11a1基因的核苷酸序列如seqidno:3所示,所述adr基因的核苷酸序列如seqidno:11所示,所述adx基因的核苷酸序列如seqidno:15所示。
本发明还提供了所述重组耶氏解脂酵母菌株的构建方法,将细胞色素氧化酶cyp11a1基因整合到耶氏解脂酵母底盘菌基因组pbr322位置,将电子传递体adr基因和adx基因整合到耶氏解脂酵母底盘菌基因组intd位置。
其中,优选的,所述耶氏解脂酵母底盘菌为耶氏解脂酵母sybe_yl01070028。
进一步优选的,所述的构建方法具体包含如下步骤:
步骤1、将经优化和去除线粒体转运肽的cyp11a1基因两端分别引入bsai酶切位点,采用goldengate技术与puc57k-gpatp-pex16t质粒构建,获得puc57k-gpatp-mcyp11a1-pex16t质粒,pcr扩增获得gpatp-mcyp11a1-pex16t基因表达盒,利用in-fusioncloningreaction重组到pylex1质粒上,获得pylex1-gpatp-mcyp11a1-pex16t质粒,采用醋酸锂法将上述质粒转化耶氏解脂酵母底盘菌,sc-ura-leu固体培养基筛选转化子;
步骤2、将经优化和去除线粒体转运肽的adr基因两端分别引入bsai酶切位点,采用goldengate技术与puc57k-gpm1t-tefp-lip2t-gpdt质粒构建,获得puc57k-gpm1t-tefp-madr-lip2t-gpdt质粒,pcr扩增获得上游引入40bp同源序列获得gpm1t(40bp)-tefp-madr-lip2t-gpdt基因组整合片段;
将经优化和去除线粒体转运肽的adr和adx基因两端分别引入bsai酶切位点,采用goldengate技术与puc57k-gpdt-gpdp-octt-fba1t质粒构建,获得puc57k-gpdt-gpdp-madx-octt-fba1t质粒,pcr扩增获得上游引入40bp同源序列获得gpdt(40bp)-gpdp-madx-octt-fba1t基因组整合片段;
采用pcr扩增获得上游整合片段intd-l-gpm1t、下游整合片段intd-r;
步骤3、将步骤2获得的整合片段与克隆载体质粒进行gibson组装,酶切后获得intd-l-tefp-madr-lip2t-gpdp-madx-octt-intd-r片段;
步骤4、采用醋酸锂法将步骤3获得的片段转化到步骤1获得的耶氏解脂酵母转化子中,整合于基因组intd位置,含潮霉素的sc-ura-leu固体平板筛选转化子。
本发明还提供了所述的重组耶氏解脂酵母菌株在生产孕烯醇酮中的应用。
进一步,本发明还提供了一种生产孕烯醇酮的方法,将所述的重组耶氏解脂酵母菌株接入种子培养基活化;将活化后的菌株接种于发酵培养基中发酵培养,发酵培养后收集菌体细胞提取孕烯醇酮。
优选的,所述生产孕烯醇酮的方法具体为将本发明所述的重组耶氏解脂酵母菌株接入种子培养基在28℃、250rpm活化24h,转接至新鲜的种子培养基,在28℃、220rpm活化18h,转接至发酵培养基28℃、220rpm发酵169h,收集菌体提取孕烯醇酮;其中,所述种子培养基为22g/l葡萄糖、20g/l蛋白胨、10g/l酵母浸粉,余量为水;所述发酵培养基为50g/l葡萄糖、20g/l蛋白胨、10g/l酵母浸粉,余量为水。
本发明在耶氏解脂酵母菌株中以葡萄糖为碳源实现甾体药物重要中间体孕烯醇酮的生物全合成,在重组耶氏解脂酵母菌株中,野猪来源mcyp11a1(ss_mcyp11a1)与牛来源的madr(bt_madr)和madx(bt_madx)的组合具有最佳的生产孕烯醇酮的效果。利用本发明所述重组耶氏解脂酵母菌株生产孕烯醇酮相对于生物转化方法生产孕烯醇酮步骤简单且污染小,同时解决了酿酒酵母中生物全合成孕烯醇酮对后续甾体药物生产的瓶颈问题,为孕烯醇酮的工业生产提供了一种可行的办法,并为下游孕酮、雄烯二酮、糖皮质激素等甾体激素类药物的合成打下基础。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1示重组耶氏解脂酵母合成孕烯醇酮的路经图及侧链降解酶系统p450scc的催化反应过程;
图2示p450scc系统中细胞色素氧化酶cyp11a1及电子传递体adr、adx的线粒体转运肽截断方式对比图;a为cyp11a1基因;b为adr基因;c为adx基因;实线为已知的线粒体转运肽截断位置;虚线为推测的线粒体转运肽截断位置;
图3示耶氏解脂酵母中mcyp11a1整合型质粒构建过程图;
图4示耶氏解脂酵母中madr和madx在染色体d上的整合示意图;
图5示孕烯醇酮标准曲线;
图6示重组耶氏解脂酵母菌株36种p450scc组合的孕烯醇酮摇瓶产量比较图。
具体实施方式
本发明公开了一种重组耶氏解脂酵母菌株及其构建方法和应用。本领域技术人员可以借鉴本文内容,适当改进工艺参数实现。特别需要指出的是,所有类似的替换和改动对本领域技术人员来说是显而易见的,它们都被视为包含在本发明。本发明的方法及产品已经通过较佳实施例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的方法进行改动或适当变更与组合,来实现和应用本发明技术。
为实现本发明的目的,本发明提供以下技术方案:
本发明以高产菜油甾醇耶氏解脂酵母sybe_yl01070028为底盘菌株,选取9种不同物种来源细胞色素氧化酶cyp11a1,经优化且去除线粒体转运肽后利用单拷贝整合型质粒pylex1在底盘菌基因组上分别进行整合,获得9种成熟cyp11a1的菌株。再分别以上述9种菌株为底盘,选取4种不同物种来源的电子传递体adr、adx,经优化且去除线粒体转运肽后通过片段同源重组分别整合在9种底盘菌染色体d的intd位置,得到p450scc36种不同组合的菌株,通过摇瓶发酵筛选耶氏解脂酵母体内合成孕烯醇酮最优的p450scc组合。
9种不同来源的cyp11a1的基因来源包括人(homosapiens)、牛(bostaurus)、野猪(susscrofa)、小鼠(musmusculus)、鸡(gallusgallus)、雀(taeniopygiaguttata)、斑马鱼(daniorerio)、牛蛙(lithobatescatesbeiana)和木本棉(gossypiumarboreum)。4种不同来源的adr、adx基因,分别为人(homosapiens)、牛(bostaurus)、拟南芥(arabidopsisthaliana)和耶氏解脂酵母(yarrowialipolytica)。
本发明所述重组耶氏解脂酵母菌株中所述优化具体包含耶氏解脂酵母密码子优化、规避bsaⅰ限制性内切酶酶切位点和在基因两端额外添加核苷酸序列。
其中,在一些实施方案中,所述基因5’端额外添加的核苷酸序列如seqidno:18所示(gcggccgcggtctcca);3’端额外添加的核苷酸序列如seqidno:19所示(taaaggagaccgcggccgc)。
为进一步提高p450scc酶对前体菜油甾醇的获得性使催化反应在细胞质中进行,需通过pcr反应去除cyp11a1的线粒体转运肽,部分来源cyp11a1线粒体转运肽已知,未知来源根据序列比对进行推测,具体线粒体转运肽截断方式如图2所示。
经过优化和去除线粒体转运肽获得成熟cyp11a1,即mcyp11a1,依次简写为hs_mcyp11a1、bt_mcyp11a1、ss_mcyp11a1、mm_mcyp11a1、gg_mcyp11a1、tg_mcyp11a1、dr_mcyp11a1、lc_mcyp11a1、ga_mcyp11a1。经过优化和去除线粒体转运肽获得成熟。adr、adx,依次简写为hs_madr、hs_madx、bt_madr、bt_madx、at_madr、at_madx、yl_madr、yl_madx。
本发明筛选获得一种重组耶氏解脂酵母菌株,包含细胞色素氧化酶cyp11a1基因、电子传递体adr基因和adx基因,所述细胞色素氧化酶cyp11a1基因为经优化和去除线粒体转运肽的野猪、雀或牛蛙来源cyp11a1基因序列;所述adr基因为经优化和去除线粒体转运肽的牛或耶氏解脂酵母来源adr基因序列;所述adx基因为经优化的和去除线粒体转运肽的牛或耶氏解脂酵母来源adx基因序列。
在一些实施方案中,所述重组耶氏解脂酵母菌株中,所述细胞色素氧化酶cyp11a1基因的核苷酸序列如seqidno:3、seqidno:6或seqidno:8所示。
在一些实施方案中,所述重组耶氏解脂酵母菌株中,所述adr基因的核苷酸序列如seqidno:11或seqidno:13所示;所述adx基因的核苷酸序列如seqidno:15或seqidno:17所示。
进一步的,在一些优选实施方案中,所述的重组耶氏解脂酵母菌株,所述细胞色素氧化酶cyp11a1基因为经优化和去除线粒体转运肽的野猪来源cyp11a1基因序列,核苷酸序列如seqidno:3所示;所述adr基因为经优化和去除线粒体转运肽的牛来源adr基因序列,核苷酸序列如seqidno:11所示;所述adx基因为经优化的和去除线粒体转运肽的牛来源adx基因序列的核苷酸序列如seqidno:15所示。
本发明还提供了所述重组耶氏解脂酵母菌株的构建方法,将细胞色素氧化酶cyp11a1基因整合到耶氏解脂酵母底盘菌基因组pbr322位置,将电子传递体adr基因和adx基因整合到耶氏解脂酵母底盘菌基因组intd位置。
在一些实施方案中,所述构建方法中所述耶氏解脂酵母底盘菌优选为高产菜油甾醇耶氏解脂酵母sybe_yl01070028。
在一些实施方案中,所述构建方法具体包含如下步骤:
步骤1、将经优化和去除线粒体转运肽的cyp11a1基因两端分别引入bsai酶切位点,采用goldengate技术与puc57k-gpatp-pex16t质粒构建,获得puc57k-gpatp-mcyp11a1-pex16t质粒,pcr扩增获得gpatp-mcyp11a1-pex16t基因表达盒,利用in-fusioncloningreaction重组到pylex1质粒上,获得pylex1-gpatp-mcyp11a1-pex16t质粒,采用醋酸锂法将上述质粒转化耶氏解脂酵母底盘菌,sc-ura-leu固体培养基筛选转化子;
步骤2、将经优化和去除线粒体转运肽的adr基因两端分别引入bsai酶切位点,采用goldengate技术与puc57k-gpm1t-tefp-lip2t-gpdt质粒构建,获得puc57k-gpm1t-tefp-madr-lip2t-gpdt质粒,pcr扩增获得上游引入40bp同源序列gpm1t(40bp)-tefp-madr-lip2t-gpdt基因组整合片段;
将经优化和去除线粒体转运肽的adr和adx基因两端分别引入bsai酶切位点,采用goldengate技术与puc57k-gpdt-gpdp-octt-fba1t质粒构建,获得puc57k-gpdt-gpdp-madx-octt-fba1t质粒,pcr扩增获得上游引入40bp同源序列获得gpdt(40bp)-gpdp-madx-octt-fba1t基因组整合片段;
采用pcr扩增获得上游整合片段intd-l-gpm1t、下游整合片段intd-r;
步骤3、将步骤2获得的整合片段与克隆载体质粒进行gibson组装,酶切后获得intd-l-tefp-madr-lip2t-gpdp-madx-octt-intd-r片段;
步骤4、采用醋酸锂法步骤3获得的片段转化到步骤1获得的耶氏解脂酵母转化子中,整合于基因组intd位置,含潮霉素的sc-ura-leu固体培养基筛选转化子。
步骤1所述pcr扩增获得gpatp-mcyp11a1-pex16t基因表达盒具体为利用两端分别包含salⅰ、claⅰ限制性内切酶酶切位点及外侧碱基序列共15bp的核酸序列的引物进行pcr扩增,使gpatp-mcyp11a1-pex16t基因表达盒两端分别引入salⅰ、claⅰ限制性内切酶酶切位点及外侧碱基序列的15bp载体同源序列用于接下来与载体in-fusion同源重组。具体来讲,左边15bp含有sali的酶切位点,其余为载体上sali的酶切位点外侧的序列;右边15bp含有clai的酶切位点,其余为载体上clai的酶切位点外侧的序列。
在一些实施方案中,所述扩增获得gpatp-mcyp11a1-pex16t基因表达盒的引物序列如seqidno:20(f:aagggcatcggtcgaccaacttttcttgtcgacctgagatacc)和seqidno:21所示(r:gacagcttatcatcgattttccgagctcgatgctgg),下划线部分为酶切位点。
步骤2所述pcr扩增获得上游引入40bp同源序列的gpm1t(40bp)-tefp-madr-lip2t-gpdt基因组整合片段的引物序列为gi-yl-2-f:ttttcagcctgtcgtggtagcaat和gi-yl-2-r:atccacaatgtatcaggtatct。所述gpm1t(40bp)-tefp-madr-lip2t-gpdt基因组整合片段的上游40bp同源序列如seqidno:22所示(ttttcagcctgtcgtggtagcaatttgaggagtattatta)。
步骤2所述pcr扩增获得上游引入40bp同源序列获得gpdt(40bp)-gpdp-madx-octt-fba1t基因组整合片段的引物序列为gi-yl-3-f:acatgtaatatctgtagtagatacc和gi-yl-3-r:aaagatgagctaggcttttgt。所述gpdt(40bp)-gpdp-madx-octt-fba1t基因组整合片段的上游40bp同源序列如seqidno:23所示(acatgtaatatctgtagtagatacctgatacattgtggat)。
步骤2所述采用pcr扩增获得上游整合片段intd-l-gpm1t的引物序列为gi-puc18h(40)-f:tttcccagtcacgacgttgtaaaacgacggccagtgcgtcgcggccgcgacatgatacattctgttgctgg;gi-gpm1t-r:taataatactcctcaaattgct。所述上游整合片段intd-l-gpm1t序列如seqidno:24所示。
步骤2所述采用pcr扩增获得下游整合片段intd-r的引物序列为gi-hph(40)-f:actgaaaaccttgcttgagaaggttttgggacgctcgaagtgtgaagacggccagatacag;gi-puc18h(40)-r:caatttcacacaggaaacagctatgaccatgattacggtcgcggccgcaatgtctgtacctgacgttatctc。所述下游整合片段intd-r序列如seqidno:25所示。
本领域技术人员可以理解,步骤3所述克隆载体可以为常用的任意克隆载体,包括但不限于puc18h。
步骤4所述含潮霉素的sc-ura-leu固体培养基中所述潮霉素含量为100μg/ml。
利用本发明所述重组耶氏解脂酵母菌株生产孕烯醇酮,相对于生物转化步骤简单且污染小,同时可解决了酿酒酵母中生物全合成孕烯醇酮对后续甾体药物生产的瓶颈问题。因此本发明提供了所述重组耶氏解脂酵母菌株在生产孕烯醇酮中的应用。
进一步本发明提供了一种生产孕烯醇酮的方法,将所述的重组耶氏解脂酵母菌株接入种子培养基活化;将活化后的菌株接种于发酵培养基中发酵培养,发酵培养后收集菌体细胞提取孕烯醇酮。
在一些实施方案中,所述方法具体为将所述的重组耶氏解脂酵母菌株接入种子培养基在28℃、250rpm活化24h,转接至新鲜的种子培养基,在28℃、220rpm活化18h,转接至发酵培养基28℃、220rpm发酵169h,收集菌体提取孕烯醇酮;
其中,所述种子培养基为22g/l葡萄糖、20g/l蛋白胨、10g/l酵母浸粉,余量为水;所述发酵培养基为50g/l葡萄糖、20g/l蛋白胨、10g/l酵母浸粉,余量为水。
优选的,以包含野猪来源mcyp11a1(ss_mcyp11a1)与牛来源的madr(bt_madr)和adx(bt_madx)重组耶氏解脂酵母菌株sybe_yl02060029发酵生产孕烯醇酮。
为了进一步理解本发明,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如无特殊说明,本发明实施例中所涉及的试剂均为市售产品,均可以通过商业渠道购买获得。在本发明中所涉及的一些质粒载体、菌株均可由市场购得,puc57k-gpatp-pex16t、puc57k-gpm1t-tefp-lip2t-gpdt、puc57k-gpdt-gpdp-octt-fba1t表达盒保存于天津大学元英进实验室。存菌号为sybe_yl01070028的耶氏解脂酵母是一株高产菜油甾醇的耶氏解脂酵母菌株,保存于天津大学合成生物学元英进课题组(duhx,xiaowh,wangy,etal.engineeringyarrowialipolyticaforcampesteroloverproduction[j].plosone,2016,11(1):e0146773。该菌株基因型为:erg5::ura3-exp1p-dhcr7(xenopuslaevis)d409e-xpr2t)。
实施例1:外源功能基因元件cyp11a1、adr、adx的获得
外源基因为用于合成孕烯醇酮的p450scc系统,包含细胞色素氧化酶cyp11a1,电子传递体adr和adx:为筛选合成孕烯醇酮最优的基因来源,选取9种不同来源的cyp11a1基因,cyp11a1的基因来源包含人(homosapiens)、牛(bostaurus)、野猪(susscrofa)、小鼠(musmusculus)、鸡(gallusgallus)、雀(taeniopygiaguttata)、斑马鱼(daniorerio)、牛蛙(lithobatescatesbeiana)和木本棉(gossypiumarboreum)等,上述基因均经过耶氏解脂酵母密码子优化并适当规避bsaⅰ限制性内切酶酶切位点,在基因两端额外添加5’端gcggccgcggtctcca;3’taaaggagaccgcggccgc,通过人工合成得到。
为进一步提高p450scc酶对前体菜油甾醇的获得性使催化反应在细胞质中进行,需通过pcr反应去除cyp11a1的线粒体转运肽,部分来源cyp11a1线粒体转运肽已知,未知来源根据序列比对进行推测,获得的成熟cyp11a1(即mcyp11a1)依次简写为hs_mcyp11a1、bt_mcyp11a1、ss_mcyp11a1、mm_mcyp11a1、gg_mcyp11a1、tg_mcyp11a1、dr_mcyp11a1、lc_mcyp11a1、ga_mcyp11a1,具体线粒体转运肽截断方式如图2所示,经耶氏解脂酵母密码子优化后的基因序列如表1。
另选取4种不同来源的adr、adx基因,分别为人(homosapiens)、牛(bostaurus)、拟南芥(arabidopsisthaliana)和耶氏解脂酵母(yarrowialipolytica)。同理,上述基因均按照耶氏解脂酵母密码子优化并适当规避bsaⅰ限制性内切酶酶切位点,在基因两端额外添加5’端gcggccgcggtctcca;3’端taaaggagaccgcggccgc后人工合成,且根据序列比对截断线粒体转运肽获得成熟adr、adx,依次简写为hs_madr、hs_madx、bt_madr、bt_madx、at_madr、at_madx、yl_madr、yl_madx。具体线粒体转运肽截断方式如图2所示,经耶氏解脂酵母密码子优化后的基因序列见表1
表1经耶氏解脂酵母密码子优化的不同来源的cyp11a1、adr和adx基因序列
实施例2:构建生产孕烯醇酮的重组耶氏解脂酵母菌株
将获得的9种外源cyp11a1基因进行pcr扩增,获得线粒体转运肽截断的mcyp11a1基因,同时两端各引入一个bsaⅰ限制性内切酶酶切位点,将puc57k-gpatp-pex16t质粒(可在http://synbioml.org/免费获取)及获得的外源mcyp11a1基因用goldengate方法进行构建,获得9种来源mcyp11a1的puc57k-gpatp-mcyp11a1-pex16t大肠杆菌游离型多拷贝质粒。将获得的9种外源cyp11a1基因表达盒gpatp-mcyp11a1-pex16t进行pcr扩增,两端分别用引物扩增引入包含载体的salⅰ、claⅰ两个限制性内切酶酶切位点及外侧碱基序列共15bp的核酸序列,利用in-fusioncloningreaction重组到经salⅰ、claⅰ双酶切后的pylex1质粒上,获得9种来源mcyp11a1的pylex1-gpatp-mcyp11a1-pex16t耶氏解脂酵母整合型单拷贝质粒,构建过程如图3所示。
采用醋酸锂法将9种质粒分别转化到sybe_yl01070028底盘菌株中,整合于基因组pbr322platform位置,采用sc-ura-leu固体平板(合成酵母氮源ynb6.7g/l,葡萄糖22g/l,缺尿嘧啶和亮氨酸的混合氨基酸粉末2g/l,2%的琼脂粉)进行筛选,得到的转化子进行划线分纯培养后提取酵母基因组进行pcr验证,对验证正确的重组菌株保存甘油菌并分别命名为sybe_yl02060009-sybe_yl02060017。其中,各菌株基因组基因型见附表2。
然后,按照上述方法将获得的4种外源adr和adx基因进行pcr扩增,获得线粒体转运肽截断的madr和madx基因,同时两端各引入一个bsaⅰ限制性内切酶酶切位点,将puc57k-gpm1t-tefp-lip2t-gpdt质粒(可在http://synbioml.org/免费获取)及获得的外源madr基因用goldengate方法进行构建,获得4种来源madr的puc57k-gpm1t-tefp-madr-lip2t-gpdt大肠杆菌游离型多拷贝质粒。将puc57k-gpdt-gpdp-octt-fba1t质粒(可在http://synbioml.org/免费获取)及获得的外源madx基因用goldengate方法进行构建,获得4种来源madx的puc57k-gpdt-gpdp-madx-octt-fba1t大肠杆菌游离型多拷贝质粒。将上述质粒pcr扩增分别在madr和madx表达盒上游引入40bp的核酸序列,获得4种来源的gpm1t(40bp)-tefp-madr-lip2t-gpdt和gpdt(40bp)-gpdp-madx-octt-fba1t基因组整合片段。选择文献中报道但未经实验验证的耶氏解脂酵母染色体d上的可整合位点intd(yali0d1632529-yali0d1633537)作为madr、madx基因表达盒的在基因组的整合位置。如图4所示,上游整合片段的构建首先以noti酶切位点为分界将intd基因前段从耶氏解脂酵母基因组上pcr扩增,同时在上游引入puc18h的hincⅱ酶切位点上游40bp的核酸序列及noti酶切位点,在下游引入gpm1t核酸序列,获得上游整合片段intd-l-gpm1t。抗性基因整合片段的构建采用pcr方法扩增潮霉素抗性基因表达盒hph在上游引入40bp的fba1t核酸序列,获得抗性基因整合片段fba1t(40bp)-hph。下游整合片段的构建将intd基因后段从耶氏解脂酵母基因组上pcr扩增,同时在上游引入hph表达盒尾端40bp的核酸序列,在下游引入puc18h的hincⅱ酶切位点下游40bp的核酸序列及noti酶切位点,获得下游整合片段intd-r。将上述获得的所有整合片段(包含intd-l-gpm1t、gpm1t-tefp-madr-lip2t-gpdt、gpdt-gpdp-madx-octt-fba1t、fba1t-hph、intd-r)与经hincⅱ酶切后的puc18h质粒进行gibson组装,获得4种来源madr和madx的puc18h-intd-l-tefp-madr-lip2t-gpdp-madx-octt-intd-r的大肠杆菌游离型多拷贝质粒,后经noti酶切后获得4种来源基因组整合片段intd-l-tefp-madr-lip2t-gpdp-madx-octt-intd-r。
采用醋酸锂法将4种片段分别转化到sybe_yl02060009-sybe_yl02060017这9种底盘菌株中,整合于基因组intd位置,获得36种p45scc的不同组合。采用含潮霉素(100μg/ml)的sc-ura-leu固体平板进行筛选,pcr验证正确的重组菌株分别命名为sybe_yl02060020-sybe_yl02060055,各菌株基因组基因型见附表2。
表2各菌株基因组基因型列表
实施例3:菌株sybe_yl02060020-sybe_yl02060055的孕烯醇酮摇瓶产量比较
1、试验材料:
耶氏解脂酵母菌株sybe_yl02060020-sybe_yl02060055;
一级、二级种子培养基:22g/l葡萄糖、20g/l蛋白胨、10g/l酵母浸粉;
发酵培养基:50g/l葡萄糖、20g/l蛋白胨、10g/l酵母浸粉。
2、试验方法:
将上述菌株sybe_yl02060020-sybe_yl02060055接种于5ml一级种子培养基中,在28℃、250rpm培养24h,以初始菌体浓度od600=0.2分别接种于二级种子培养基中,在28℃、220rpm培养18h,再以初始菌体浓度od600=0.2分别接种于50ml发酵培养基中,每种菌株做两组平行,于28℃、220rpm条件下培养,发酵169小时结束,测定菌体密度(od600),取10ml菌液提取孕烯醇酮。
孕烯醇酮提取方法:取10ml发酵液,6000rpm离心5min收集菌体,水洗两次。用液氮冷冻细胞并在研钵中研磨,直到细胞被研磨成白色极细粉末,转移至新10ml离心管中,加入2ml甲醇配制的1.5mkoh,60℃水浴皂化反应过夜。皂化后加入2ml分析纯正己烷涡旋震荡10min对产物进行萃取,5000rpm离心10min收集一定量有机相真空冷冻干燥2h,加入400μl正己烷溶解再次冷冻干燥4h,加入400μl衍生化试剂n-甲基-n-三甲基硅基三氟乙酰胺(mstfa)30℃水浴2h,用2μm有机滤膜过滤后利用gc/ms检测孕烯醇酮含量。
3、试验结果:
统计不同菌株孕烯醇酮产量,结果见表3及图5和图6。
表3气相色谱-质谱联用(gc-ms)检测数据
结果显示,发酵169小时,p450scc所有36种组合的产量均较低,几乎一半的组合孕烯醇酮的产量在检测限以下,尤其是文献中报道使用的hs_mcyp11a1或bt_mcyp11a1与hs_madr和hs_madx的组合孕烯醇酮产量较低,不建议继续选用。但当组合细胞色素氧化酶为ss_mcyp11a1、tg_mcyp11a1或lc_mcyp11a1时,孕烯醇酮的产量较为显著,说明与电子传递体madr和madx相比,细胞色素氧化酶mcyp11a1对于p450scc系统的催化水平占主导作用,同时也表明推测的线粒体转运肽截断方式至少在tg_mcyp11a1、lc_mcyp11a1和yl_madr、yl_madx上是有效的。在所有组合中ss_mcyp11a1与bt_madr、bt_madx组合,即菌株sybe_yl02060029孕烯醇酮产量为203±17μg/l,表现出最佳的效果。
由此可知,侧链降解酶系统p450scc基因来源的组合的不同对于重组耶氏解脂酵母生产孕烯醇酮具有不同影响,在重组耶氏解脂酵母中野猪来源mcyp11a1(ss_mcyp11a1)与牛来源的madr(bt_madr)和madx(bt_madx)组合效果明显好于已报道最高产量的基因来源。
sequencelisting
<110>天津大学
<120>一种重组耶氏解脂酵母菌株及其构建方法与应用
<130>mp1701566
<160>25
<170>patentinversion3.3
<210>1
<211>1566
<212>dna
<213>homosapiens
<400>1
atgctggctaagggtctgcctcctcgatccgtgctggtcaagggttgtcagaccttcctg60
tctgctcctcgagagggtctgggtcgactgcgagtgcctaccggagagggtgctggtatc120
tctacccgatccccccgacccttcaacgagattccctcccccggcgacaacggatggctg180
aacctgtaccacttctggcgagagactggcacccacaaggtgcacctgcaccacgtccag240
aacttccagaagtacggccccatctaccgagagaagctgggaaacgtggagtccgtgtac300
gtcattgaccccgaggacgtcgccctgctgttcaagtctgagggacccaaccccgagcga360
ttcctgatccccccctgggtggcttaccaccagtactaccagcgacccattggtgtcctg420
ctgaagaagtctgccgcttggaagaaggaccgagtggccctgaaccaggaggtcatggcc480
cccgaggctaccaagaacttcctgcctctgctggacgccgtgtcccgagacttcgtgtct540
gtcctgcaccgacgaatcaagaaggctggatctggtaactactccggcgacatttctgac600
gacctgttccgattcgctttcgagtccatcaccaacgtgattttcggagagcgacagggc660
atgctggaggaggtggtcaaccctgaggctcagcgattcatcgacgctatctaccagatg720
ttccacacctctgtccccatgctgaacctgccccccgacctgttccgactgttccgaacc780
aagacctggaaggaccacgtggccgcttgggacgtcatcttctccaaggccgacatctac840
acccagaacttctactgggagctgcgacagaagggatctgtccaccacgactaccgagga900
atcctgtaccgactgctgggtgactctaagatgtccttcgaggacattaaggccaacgtg960
accgagatgctggctggcggagtcgacaccacctccatgaccctgcagtggcacctgtac1020
gagatggcccgaaacctgaaggtgcaggacatgctgcgagctgaggtcctggctgctcga1080
caccaggctcagggtgacatggctaccatgctgcagctggtgcccctgctgaaggcctcc1140
atcaaggagactctgcgactgcaccccatttctgtcaccctgcagcgatacctggtgaac1200
gacctggtcctgcgagactacatgatccccgctaagaccctggtgcaggtcgccatctac1260
gctctgggacgagagcccaccttcttcttcgaccccgagaacttcgaccccacccgatgg1320
ctgtctaaggacaagaacatcacctacttccgaaacctgggcttcggatggggtgtgcga1380
cagtgcctgggtcgacgaattgccgagctggagatgaccatcttcctgattaacatgctg1440
gagaacttccgagtggagatccagcacctgtccgacgtcggaaccaccttcaacctgatc1500
ctgatgcccgagaagcccatttctttcaccttctggcccttcaaccaggaggctacccag1560
cagtaa1566
<210>2
<211>1563
<212>dna
<213>bostaurus
<400>2
atgctggctcgaggcctgcctctgcgatctgccctggtgaaggcttgtccccccattctg60
tccaccgtgggagagggttggggacaccaccgagtcggtaccggagagggagctggtatc120
tctaccaagaccccccgaccctactctgagattccctcccccggtgacaacggctggctg180
aacctgtaccacttctggcgagagaagggctcccagcgaatccacttccgacacattgag240
aacttccagaagtacggtcccatctaccgagagaagctgggcaacctggagtctgtgtac300
atcattcaccccgaggacgtcgcccacctgttcaagttcgagggatcctaccccgagcga360
tacgacattcccccctggctggcttaccaccgatactaccagaagcccatcggcgtgctg420
ttcaagaagtctggaacctggaagaaggaccgagtggtcctgaacaccgaggtcatggcc480
cccgaggctatcaagaacttcattcccctgctgaaccccgtgtctcaggacttcgtctcc540
ctgctgcacaagcgaatcaagcagcagggctctggaaagttcgtgggcgacattaaggag600
gacctgttccacttcgccttcgagtccatcaccaacgtcatgttcggagagcgactgggt660
atgctggaggagactgtgaaccccgaggcccagaagttcattgacgctgtctacaagatg720
ttccacacctctgtgcctctgctgaacgtccctcctgagctgtaccgactgttccgaacc780
aagacctggcgagatcacgtggccgcttgggacaccatcttcaacaaggccgagaagtac840
accgagattttctaccaggacctgcgacgaaagaccgagttccgaaactaccccggaatt900
ctgtactgtctgctgaagtccgagaagatgctgctggaggacgtgaaggccaacatcacc960
gagatgctggctggcggagtcaacaccacctctatgaccctgcagtggcacctgtacgag1020
atggcccgatccctgaacgtgcaggagatgctgcgagaggaggtcctgaacgcccgacga1080
caggctgagggtgacatctctaagatgctgcagatggtccccctgctgaaggcttccatc1140
aaggagactctgcgactgcaccccatttctgtgaccctgcagcgataccccgagtccgac1200
ctggtcctgcaggactacctgatccccgccaagaccctggtgcaggtcgccatctacgct1260
atgggacgagatcccgctttcttctcttcccccgacaagttcgaccccacccgatggctg1320
tccaaggacaaggacctgattcacttccgaaacctgggtttcggttggggagtgcgacag1380
tgcgtcggacgacgaatcgccgagctggagatgaccctgttcctgatccacattctggag1440
aacttcaaggtggagatgcagcacattggtgacgtcgacaccatcttcaacctgattctg1500
acccccgacaagcccatcttcctggtgttccgacccttcaaccaggaccctcctcaggct1560
taa1563
<210>3
<211>1563
<212>dna
<213>susscrofa
<400>3
atgctggcccgaggactggctctgcgatctgtgctggtcaagggttgtcagcccttcctg60
tccgctcctcgagagtgccctggtcaccctcgagtcggtaccggagagggagcttgtatc120
tctaccaagaccccccgacccttctctgagatcccctcccccggagacaacggttggatt180
aacctgtaccgattctggaaggagaagggaacccagaagatccactaccaccacgtgcag240
aacttccagaagtacggccccatctaccgagagaagctgggaaacctggagtccgtctac300
atcattgaccccgaggacgtggccctgctgttcaagttcgagggccccaaccccgagcga360
tacaacattcccccctgggtcgcctaccaccagcactaccagaagcccgtgggtgtcctg420
ctgaagaagtctggcgcttggaagaaggaccgactggtcctgaacaccgaggtcatggcc480
cccgaggctatcaagaacttcattcccctgctggacaccgtgtcccaggacttcgtgggc540
gtcctgcaccgacgaatcaagcagcagggttctggcaagttctccggagacattcgagag600
gacctgttccgattcgccttcgagtctatcaccaacgtcattttcggcgagcgactggga660
atgctggaggagatcgtggaccccgaggcccagaagttcattgacgctgtctaccagatg720
ttccacacctccgtgcctatgctgaacctgcctcccgacctgttccgactgttccgaacc780
aagacctggcgagatcacgtcgccgcttgggacaccatcttcaacaaggccgagaagtac840
acccagaacttctactgggacctgcgacgaaagcgagagttcaacaactaccccggaatt900
ctgtaccgactgctgggtaacgacaagctgctgtctgaggacgtcaaggccaacgtgacc960
gagatgctggctggcggagtggacaccacctctatgaccctgcagtggcacctgtacgag1020
atggcccgatccctgaacgtccaggagatgctgcgagaggaggtgctgaacgcccgacga1080
caggctcagggagacacctccaagatgctgcagctggtccccctgctgaaggcttctatc1140
aaggagactctgcgactgcaccccatttccgtgaccctgcagcgatacctggtcaacgac1200
ctggtgctgcgagactacatgatccctgctaagaccctggtgcaggtcgctgtgtacgct1260
atgggtcgagatcccgctttcttctctaaccccggacagttcgaccctacccgatggctg1320
ggcaaggagcgggacctgatccacttccgaaacctgggattcggttggggcgtccgacag1380
tgcgtcggacgacgaattgccgagctggagatgaccctgttcctgatccacattctggag1440
aacttcaaggtcgagctgcagcacttctccgacgtggacaccatcttcaacctgattctg1500
atgcccgacaagcccattttcctggtgttccgacccttcaaccaggaccccctgcaggct1560
taa1563
<210>4
<211>1581
<212>dna
<213>musmusculus
<400>4
atgctggctaagggtctgtctctgcgatccgtgctggtcaagggctgtcagcccttcctg60
tctcctacctggcagggacctgtgctgtccaccggaaagggtgctggtacctccacctct120
tcccctcgatctttcaacgagatcccctcccccggagacaacggttggctgaacctgtac180
cacttctggcgagagtctggtacccagaagatccactaccaccagatgcagtccttccag240
aagtacggccccatctaccgagagaagctgggaaccctggagtctgtgtacatcgtcgac300
cccaaggacgcttctattctgttctcctgcgagggtcctaaccctgagcgattcctggtg360
cctccttgggtcgcttaccaccagtactaccagcgacccatcggagtgctgttcaagtct420
tccgacgcctggaagaaggaccgaatcgtgctgaaccaggaggtcatggctcccggagcc480
attaagaacttcgtgcctctgctggagggtgtcgctcaggacttcatcaaggtgctgcac540
cgacgaattaagcagcagaactctggcaacttctccggagtcatttctgacgacctgttc600
cgattctctttcgagtccatctcttccgtgattttcggagagcgaatgggcatgctggag660
gagatcgtcgaccccgaggctcagcgattcattaacgccgtgtaccagatgttccacacc720
tctgtccccatgctgaacctgccccccgacttcttccgactgctgcgaaccaagacctgg780
aaggaccacgccgctgcctgggacgtgatcttcaacaaggccgacgagtacacccagaac840
ttctactgggacctgcgacagaagcgagacttctctcagtaccctggtgtgctgtactcc900
ctgctgggtggaaacaagctgcccttcaagaacatccaggctaacattaccgagatgctg960
gccggtggcgtcgacaccacctccatgaccctgcagtggaacctgtacgagatggctcac1020
aacctgaaggtgcaggagatgctgcgagctgaggtcctggctgctcgacgacaggctcag1080
ggagacatggccaagatggtgcagctggtccccctgctgaaggcttctatcaaggagact1140
ctgcgactgcaccccatttccgtgaccctgcagcgatacaccgtgaacgacctggtcctg1200
cgaaactacaagattcccgccaagaccctggtgcaggtcgcttctttcgccatgggacga1260
gatcccggtttcttccccaaccccaacaagttcgaccccacccgatggctggagaagtcc1320
cagaacaccacccacttccgatacctgggattcggttggggcgtccgacagtgtctgggt1380
cgacgaatcgctgagctggagatgaccatcctgctgattaacctgctggagaacttccga1440
attgaggtgcagaacctgcgagacgtcggtaccaagttctccctgatcctgatgcccgag1500
aaccccattctgttcaacttccagcctctgaagcaggacctgggtcctgccgtgacccga1560
aaggacaacaccgtcaactaa1581
<210>5
<211>1527
<212>dna
<213>gallusgallus
<400>5
atgctgtcccgagctgctcctatcgctggttctttccaggcttgtcgatgcgctggtgga60
attcctgctctggctggtgtgcactaccctctgccttcttcctctggtgcccgacccttc120
gaccaggtccctggagagtggcgagctggttggctgaacctgtaccacttctggaaggag180
ggtggcttccacaacgtccacaacatcatggcctccaagttccagcgattcggccccatc240
taccgagagaagctgggagtgtacgagtccgtcaacatcatttctccccgagacgccgct300
accctgttcaagtccgagggtatgctgcccgagcgattctctgtgcctccttgggtcgct360
taccgagactaccgaaacaagccctacggtgtcctgctgaagaccggcgaggcttggcga420
tccgaccgactgaccctgaacaaggaggtgctgtccccccaggtggtcgactctttcgtg480
cccctgctggaccaggtgtctcaggacttcctgcgacgagcccgagctcaggtgcagcag540
tccggacgagagcgatggaccgccgacttctctcacgagctgttccgattcgctctggag600
tccgtgtgtcacgtcctgtacggagagcgactgggcctgctgcaggacttcgtggacccc660
gaggcccagcagttcatcgacgctgtcaccctgatgttccacaccacctcccctatgctg720
tacgtgcctcctgctctgctgcgacacctgaacaccaagacctggcgagatcacgtccac780
gcctgggacgctattttcacccaggctgacaagtgcatccagaacgtgtaccgagacatt840
cgactgcagcgaaagtctaccgaggagcacaccggaatcctgttctccctgctggtccag900
gacaagctgcccctggacgacattaaggcctctgtgaccgagatgatggctggaggtgtc960
gacaccacctccatgaccctgcagtgggccatgctggagctggctcgatctcccggaatc1020
caggagcgactgcgagctgaggtgctggctgctaagcaggaggctcagggtgaccgagtc1080
aagatgctgaagtctatccgactgctgaaggccgctattaaggagactctgcgactgcac1140
cctgtggctgtcaccctgcagcgatacaccacccaggaggtcatcctgcaggactaccga1200
attcctcctaagaccctggtgcaggtcggcctgtacgccatgggacgagatcccgaggtg1260
ttccccaagcccgagcagttcaaccccgagcgatggctggtcatgggatccaagcacttc1320
aagggtctgtctttcggtttcggacctcgacagtgtctgggtcgacgaattgccgagctg1380
gagatgcagctgttcctgatgcacatcctggagaacttcaagattgagactaagcgagcc1440
gtggaggtcggaaccaagttcgacctgatcctggtgcccgagaagcccatctacctgcga1500
ctgcgacccctgcagccccaggagtaa1527
<210>6
<211>1527
<212>dna
<213>taeniopygiaguttata
<400>6
atgctggctcgagtggtcaccaagcctggtgctctgcgaggatgtcctcgaggtgccgct60
gcccgatgccgacgactgggtggagctggtggtgctgtgccttccgctccccgacccttc120
aaccaggtccctggagagtggcgagctggttggctgaacctgtaccgattctggcgagag180
ggaggtctgtctgccctgcacctgtccatggctcagaagttccgacgattcggtcccatc240
taccgagagaagctgggcgtgcacgagactgtcaacatcatttctcctggagacgctgct300
accctgttccaggctgagggtgctctgcctgagcgattccgagtgcctccttgggtcgct360
taccgagacttccgaaacaagccctacggcgtgctgctgaagaccggagaggcttggcga420
tccgaccgactgctgctgaaccaggaggctctggctcctgctgctgtggctgccttcgtc480
cccctgctgtctgccgtgggagaggacttcgtccgacgagctcgagcccaggctcgacac540
tctggacacggttgttggaccggcgacttctcccacgagctgttccgattcgccctggag600
tctgtgtgccacgtcctgtacggccagcgactgggactgctgcaggacttcgtgcagcct660
gaggctcagcgattcattgaggccgtcgctcgaatgttccacaccaccgctcctatgctg720
tacctgcctcctgctctgctgcgacgactgcgatcccgaacctggcgagagcacgtgcac780
gcttgggacgctatcttctgtcaggccgacaagtgcattcagaacgtctaccgggacctg840
cgactgcagcgaaagtcttcccaggagtacatgggaatcctgggtaacctgattctgcga900
gacaagctgcccctggacgacatccgagcctccgtgaccgagatgatggctggcggagtc960
gacaccacctctatgaccctgcagtgggctatgctggagctggctcgagctcctggagtg1020
caggagcagctgcgagctgaggtcctggctgctaagcgagaggctggtggcgaccgagag1080
aagatgctgaagtctacccgactgctgaaggccaccattaaggagactctgcgactgcac1140
cccgtggctgtcaccctgcagcgatacaccacccacgaggtcatcctgcaggactaccga1200
attcctcctggtaccctggtgcaggtcggactgtacgccatgggtcgagatcccgacgtc1260
ttcccccgacccgagcgattccgacctcagcgatggctggctgctggtcctaagcccttc1320
ctgggcctgggattcggtttcggtcctcgacagtgtctgggacgacgaatcgccgagctg1380
gagatgcagctgttcctgatgcacatcctggagaacttcaagattgagactatgcgagct1440
gtggagatcggaaccaagttcgacctgatcctgattcccgaccagcccattcagctgacc1500
ctgcgacccctggacggccagccctaa1527
<210>7
<211>1529
<212>dna
<213>daniorerio
<400>7
atggcccgatggaacgtgaccctggctcgactggaccagtctctgtcttccctgaagaac60
ctgctgcaggtgaaggtcacccgatctggtcgagctcctcagaactccaccgtgcagccc120
ttcaacaagatccccggccgatggcgaaactctctgctgtccgtcctggctttcaccaag180
atgggcggactgcgaaacgtgcaccgaattatggtccacaacttcaagaccttcggtccc240
atctaccgagagaaggtcggcatctacgactccgtctacatcattaagcccgaggacgga300
gccatcctgttcaaggctgagggtcaccaccccaaccgaattaacgtggacgcctggacc360
gcttaccgagactaccgaaaccagaagtacggagtcctgctgaaggagggcaaggcctgg420
aagaccgaccgaatgatcctgaacaaggagctgctgctgcccaagctgcagggcaccttc480
gtgcccctgctggacgaggtcggacaggacttcgtggcccgagtcaacaagcagattgag540
cgatctggacagaagcagtggaccaccgacctgacccacgacctgttccgattctccctg600
gagtctgtgtccgctgtcctgtacggcgagcgactgggactgctgctggacaacatcgac660
cccgagttccagcacttcattgactgtgtgtctgtcatgttcaagaccacctcccctatg720
ctgtacctgcctcctggcctgctgcgatctatcggatccaacatttggaagaaccacgtg780
gaggcctgggacggaatcttcaaccaggctgaccgatgcatccagaacattttcaagcag840
tggaaggagaaccccgagggaaacggcaagtaccccggtgtgctggccattctgctgatg900
caggacaagctgtctatcgaggacattaaggcctccgtcaccgagctgatggctggtggc960
gtggactctgtcaccttcaccctgctgtggaccctgtacgagctggctcgacagcccgac1020
ctgcaggacgagctgcgagctgagatttctgccgctcgaattgctttcaagggagacatg1080
gtgcagatggtcaagatgatccccctgctgaaggccgctctgaaggagactctgcgactg1140
caccccgtggccatgtctctgccccgatacattaccgaggacaccgtcatccagaactac1200
cacattcctgctggtaccctggtgcagctgggtgtctacgctatgggccgagatcaccag1260
ttcttccccaagcccgagcagtactgtccctctcgatggatctcttccaaccgacagtac1320
ttcaagtccctgggcttcggattcggtcctcgacagtgcctgggtcgacgaattgccgag1380
actgagatgcagattttcctgattcacatgctggagaacttccgatcgagaagcagaagc1440
agattgaggtccgatctaagttcgagctgctgctgatgcccgagaagcccatcattctga1500
ccatcaagcccctgaacgcttcccgataa1529
<210>8
<211>1518
<212>dna
<213>lithobatescatesbeiana
<400>8
atgatgctgtcccgacgactgtgtctgctgccctcttcctctggaatgctgaactaccac60
ctggtggtgtctgagtcctcttccatgatccacaaccagtctggaacctcccctctgcct120
tacgaccagctgcctggtgactggcgaaacggttggtccggactgtaccacttcttccga180
aaggacggattccacaacattcaccacctgatggaggagaactaccagcgattcggtccc240
atctaccgagagaagctgggcacctacgactctgtctacatccagcgacccgaggacgcc300
gctatcctgttccaggtggagggcattcaccccgagcgactgcgaatccagccctggttc360
gagtaccgagactaccgaaacaagaagtacggcgtcctgctgaagtccggagaggactgg420
cgatgtcagcgactgaccctgaaccgagaggtgctgtccgtcgccggcatgaaccgattc480
ctgcccctgctggactctgtgggacaggacttcgtgcgacgagtctacacccacgtcgag540
cgatctggacgaggcaagtggaccgccgacctgtcccaggagctgttccgattcgctctg600
gagtctgtgtgcaacgtcctgtacggtcagcgactgggcctgctgcaggactacatcaac660
cccgagtctcaggagttcatcgactccattaacctgatgttcgacaccacctctcccatg720
ctgtacatccccccccgagtcttccgactgatgaacctgtctgtgtggaagaaccacgtc780
aagtcctgggacgccattttcaaccacgctgacctgtgtatccagggtatctactcttcc840
ctgcgacagcgatctgacaacacctactccggcgtgctgtcttccctgctgctgcagcac900
cagctgcctctggaggacatcaaggcctccattaccgagctgatggctggcggagtcgac960
accacctctatgaccctgcagtgggccatgtacgagctggcccgagctccctctgtgcag1020
gagaagctgcgatccgagattaaggccgctcgaaaggccgctggaaacgacctgaacgcc1080
ctgctgaagcgaatccccctggtgaaggccgctctgaaggagactctgcgactgcacccc1140
gtcgctatttccctgcagcgatacacccagcgagacaccgtgatccgaaactacatgatt1200
cctcgaggtaccctggtgcaggtcggactgtacgccatgggtcgaaaccccgacatcttc1260
ccctctcccgagaagttcttccccgagcgatggctgggtggcgagtctacccacttccga1320
tccctgggcttcggattcggtccccgacagtgcctgggacgacgaattgctgagatggag1380
atgaacctgttcctgatccacattctggagcacttccgaatcgagactaaccgaatgatt1440
gaagtgggtaccaccttcaagctgattctgttccccttcaagcccatccacctgaccctg1500
cgacccctggacgactaa1518
<210>9
<211>363
<212>dna
<213>gossypiumarboreum
<400>9
atgacccacgagcagtaccccgacctgaccatcgagggatctacccggggaaagtccggt60
accatgcagcgagtggagaaggccaccttccgaggagtggtcaccgaggtcgctcgagct120
gtggtcggaatgtgtggcggagacaaccactgccctcgatctgtgcctctgcagctgcag180
ggtgacaagatttgtaacctgcagcctacccctctgctgctgcgagagattggttggtgg240
ctgcgatccgtgcctctgctggtccgagagactcgattcgccgtcttcgacctgttccac300
tgtaacttccgagagactcgatctgctattttctccctgctgccctactgcctgggtggc360
taa363
<210>10
<211>1476
<212>dna
<213>homosapiens
<400>10
atggcctctcgatgttggcgatggtggggttggtccgcttggcctcgaacccgactgcct60
cctgctggttctaccccttccttctgtcaccacttctctacccaggagaagaccccccag120
atttgcgtggtcggttccggacctgctggattctacaccgctcagcacctgctgaagcac180
ccccaggcccacgtcgacatctacgagaagcagcctgtgcctttcggcctggtccgattc240
ggagtggctcccgaccaccccgaggtgaagaacgtcattaacaccttcacccagaccgct300
cactccggacgatgcgctttctggggtaacgtggaggtcggtcgagacgtgaccgtccct360
gagctgcgagaggcttaccacgctgtggtcctgtcctacggtgctgaggaccaccgagct420
ctggagatccccggagaggagctgcccggtgtctgttctgcccgagctttcgtgggttgg480
tacaacggcctgcctgagaaccaggagctggagcccgacctgtcctgcgacaccgccgtg540
atcctgggtcagggtaacgtcgctctggacgtggctcgaattctgctgacccctcctgag600
cacctggagcgaaccgacatcaccaaggctgctctgggtgtcctgcgacagtctcgagtg660
aagaccgtctggctggtgggacgacgaggtcctctgcaggtggccttcaccatcaaggag720
ctgcgagagatgattcagctgcctggtgctcgacccattctggaccccgtcgacttcctg780
ggactgcaggacaagatcaaggaggtgccccgaccccgaaagcgactgaccgagctgctg840
ctgcgaaccgctaccgagaagcctggacctgctgaggctgctcgacaggcttctgcttcc900
cgagcttggggtctgcgattcttccgatctccccagcaggtcctgccttcccctgacggt960
cgacgagctgctggagtccgactggctgtgacccgactggagggagtcgacgaggctacc1020
cgagctgtgcctaccggtgacatggaggacctgccctgtggactggtgctgtcttccatt1080
ggttacaagtctcgacccgtcgacccctctgtgcccttcgactccaagctgggcgtcatc1140
cccaacgtggagggacgagtcatggacgtgcccggtctgtactgctctggttgggtgaag1200
cgaggtcctaccggagtgatcgctaccaccatgaccgactccttcctgaccggtcagatg1260
ctgctgcaggacctgaaggctggcctgctgccttctggaccccgacccggttacgctgct1320
attcaggctctgctgtcttcccgaggagtccgacccgtgtctttctccgactgggagaag1380
ctggacgctgaggaggtcgctcgaggacagggtaccggcaagcctcgagagaagctggtg1440
gacccccaggagatgctgcgactgctgggccactaa1476
<210>11
<211>1479
<212>dna
<213>bostaurus
<400>11
atggctcctcgatgttggcgatggtggccttggtcttcctggacccgaacccgactgcct60
ccttctcgatccattcagaacttcggccagcacttctctacccaggagcagaccccccag120
atttgtgtggtcggttccggacctgctggattctacaccgctcagcacctgctgaagcac180
cactctcgagcccacgtcgacatctacgagaagcagctggtgcctttcggactggtccga240
ttcggtgtggctcccgaccaccccgaggtgaagaacgtcatcaacaccttcacccagacc300
gcccgatccgaccgatgtgctttctacggcaacgtggaggtcggacgagacgtgaccgtc360
caggagctgcaggacgcctaccacgctgtggtcctgtcttacggcgccgaggaccaccag420
gctctggacattcccggagaggagctgcctggtgtcttctccgctcgagctttcgtggga480
tggtacaacggtctgcctgagaaccgagagctggctcccgacctgtcttgcgacaccgct540
gtcatcctgggtcagggtaacgtcgctctggacgtggctcgaattctgctgacccccccc600
gaccacctggagaagaccgacatcaccgaggctgctctgggagctctgcgacagtcccga660
gtgaagaccgtctggattgtgggtcgacgaggacctctgcaggtggctttcaccatcaag720
gagctgcgagagatgattcagctgcctggtacccgacccatgctggaccctgctgacttc780
ctgggcctgcaggaccgaatcaaggaggccgctcgaccccgaaagcgactgatggagctg840
ctgctgcgaaccgctaccgagaagcctggagtggaggaggctgctcgacgagcttctgct900
tcccgagcttggggtctgcgattcttccgatctccccagcaggtcctgccttcccctgac960
ggacgacgagctgctggtatccgactggccgtgacccgactggagggaattggagaggct1020
acccgagctgtccctaccggcgacgtggaggacctgccttgtggtctggtcctgtcttcc1080
atcggctacaagtctcgacccattgacccttccgtgcctttcgaccctaagctgggagtg1140
gtccccaacatggagggtcgagtggtcgacgtccctggcctgtactgctctggatgggtc1200
aagcgaggtcccaccggcgtgattaccaccaccatgaccgactccttcctgaccggccag1260
atcctgctgcaggacctgaaggctggacacctgccttctggtccccgacccggatccgcc1320
ttcatcaaggctctgctggactctcgaggtgtctggcccgtgtctttctccgactgggag1380
aagctggacgccgaggaggtgtctcggggtcaggcttccggcaagccccgagagaagctg1440
ctggacccccaggagatgctgcgactgctgggacactaa1479
<210>12
<211>1452
<212>dna
<213>arabidopsisthaliana
<400>12
atgtctcgatacctggcccgatacatggtgtcccgatacttctcttccgcttcttcccga60
cccctgcacgtctgtattgtgggttccggacctgctggtttctacaccgctgacaaggtc120
ctgaaggcccacgagggagctcacgtggacatcattgaccgactgcctacccctttcggc180
ctggtccgatctggagtggctcctgaccaccccgagactaagatcgccattaaccagttc240
tctcgagtcgctcagcacgagcgatgctccttcatcggtaacgtgaagctgggctctgac300
ctgtctctgtccgagctgcgggacctgtaccacgtggtcgtgctggcttacggcgccgag360
tccgacaaggacctgggtatccccggcgagtctctgtccggcatctactctgcccgagag420
ttcgtctggtggtacaacggacaccccgactactcttccctgaagcccgacctgaagacc480
tctgactccgccgtgatcctgggtcagggtaacgtcgctctggacgtggctcgaattctg540
ctgcgacccaccaccgagctggcttccaccgacatcgctacccacgccctgtctgctctg600
aaggagtcttccatccgaaaggtctacctgattggacgacgaggtcctgtgcaggctgct660
ctgaccgctaaggagctgcgagaggtcctgggaattaagaacctgcacatccgaattaag720
cagaccgacctgtccgtgacccctgctgacgaggaggagatgaagacctctcgagctcga780
aagcgaatctacgagctgctgtccaaggccgctgccgctgccaagacctctgaggctgac840
cctgaccagcgagagctgcacttcgtcttcttccgacagcccgaccagttcctggagtct900
gacgagcgaaagggacacgtctccggtgtgaacctgcagaagaccatcctggagtccgtc960
ggaaccggcaagcagattgccgtgggcaccggagagttcgaggacctgaactgttccatg1020
gtcctgaaggctattggttacaagtctgtccccgtgaacggcctgcccttcgaccacaag1080
aagggcgtcgtgcccaacgtgaagggacgagtcgtgtctcacacctccggcgacatctct1140
cagaccgagcccggactgtacgtctgtggttggctgaagcgaggccccgtgggaatcatt1200
gccaccaacctgtactgcgctgaggagactgtcggatctatctccgaggacattgaggag1260
ggtgtgtggaagtcttccaaggccggttccaagggcctgatgcagctgctggagaagcga1320
aaggtcaagaaggtggagttctctggctgggagaagatcgacgctaaggagaagcagatg1380
ggaattgagcgaaacaagccccgagagaagctggtgacctgggaggacctgctggctgcc1440
gctgccaactaa1452
<210>13
<211>1395
<212>dna
<213>yarrowialipolytica
<400>13
atgatccgatccgtgcgacacctgtctaccctgcgatccacccctcgagtcgctgtggtc60
ggtgctggacctgctggattctacaccgctcaccgactgctgaagctgcagcccgacacc120
aagattgacctgttcgagtctctgcctgtgccttacggcctggctcgacacggagtggct180
cctgaccaccctgaggtcaagaactgccaggacaccttcgacgaagtgggtaacgacccc240
cgagtccagttcttcggtaacgtgaccgtcggcgacaccctgcccgtctccaagctgcga300
gacaactacaacgccgtggtcctgtcttacggcacccacaccgaccgaaagctgggtatc360
cctggagaggacctgcctggagtgatttccgcccgaaccttcgtcaactggtacaacggt420
caccccgagcacgagtctctgaacccccccctgcacaaggctgagactgtgaccatcgtc480
ggtaacggcaacgtggccctggacatcgctcgaattctgctgtcccccctggaccacctg540
aagtctaccgacatcacccagcaggcctacgagactctgaagacctccaaggtgaagcga600
gtccgaattatggcccgacgaggcctgctggagtctgctttcaccatcaaggagattcga660
gagctgttcaagctgcccgacaccggattcgtggccttcccccacaccaagtgggacgac720
gtcctggccgctcacaagtcttacaagcgacccctgtcccgaatcgtgaagctgattgag780
gagtacaacctgaaggccaagcagcgagatcccgcccacgcttctaccctgaagcagtgg840
tccctggactacctgctgtctcccaaggaggtcatcgctaaccccgacgaccccgagctg900
gtcaagaccctgattgccaccgagaacaagctggtgtctgctgacggatccggtcgaatc960
ggagtggagcccaccggtgtcaccgagtccttcgacaccgacctgatcttcacctctatt1020
ggttacgcttccacccctctggagggtatccctttcgacgaccgaaagtctgtcattccc1080
tcttcccgaggccgagtgaccgacaacggcgtctacgccgctggatgggtgaagaacggt1140
cccaccggcgtcattgccaccaccatggctgactccttcgacaccgcccaggctatctct1200
gacgacattaccgccggaaagctggacggtgctaagtctggctccgacaacctgacccag1260
tacctggaggacgccatctcctgggaccagtggaagaagctggaggctcacgagcactct1320
cagggagacgctgctggcaagcctcgagagaaggtgaacaacgtcgccaagatgctggag1380
attgctcgacagtaa1395
<210>14
<211>555
<212>dna
<213>homosapiens
<400>14
atggccgctgccggtggagctcgactgctgcgagctgcttccgctgtcctgggtggtcct60
gctggtcgatggctgcaccacgctggatctcgagccggttcttccggcctgctgcgaaac120
cgaggtcctggaggttccgctgaggcttcccgatctctgtccgtctctgctcgagcccga180
tcttcctctgaggacaagatcaccgtgcacttcattaaccgagacggagagactctgacc240
accaagggaaaggtcggtgactctctgctggacgtggtcgtggagaacaacctggacatt300
gacggcttcggagcttgtgagggtaccctggcctgttccacctgccacctgatcttcgag360
gaccacatctacgagaagctggacgctatcaccgacgaggagaacgacatgctggacctg420
gcctacggtctgaccgaccgatcccgactgggctgtcagatttgcctgaccaagtctatg480
gacaacatgaccgtccgagtgcctgagactgtcgctgacgctcgacagtccatcgacgtg540
ggaaagacctcttaa555
<210>15
<211>561
<212>dna
<213>bostaurus
<400>15
atggctgctcgactgctgcgagtcgcttccgctgctctgggtgacaccgctggccgatgg60
cgactgctggctcgaccccgagctggagctggtggactgcgaggttctcgaggtcctggc120
ctgggtggtggagctgtcgctacccgaaccctgtccgtgtctggtcgagctcagtcttcc180
tctgaggacaagatcaccgtgcacttcattaaccgagacggcgagactctgaccaccaag240
ggcaagatcggagactccctgctggacgtggtcgtgcagaacaacctggacattgacgga300
ttcggtgcctgtgagggaaccctggcttgttctacctgccacctgatcttcgagcagcac360
attttcgagaagctggaggccatcaccgacgaggagaacgacatgctggacctggcttac420
ggcctgaccgaccgatcccgactgggatgtcagatttgcctgaccaaggccatggacaac480
atgaccgtccgagtgcctgacgccgtctccgacgctcgagagtctatcgacatgggcatg540
aactcctctaagattgagtaa561
<210>16
<211>594
<212>dna
<213>arabidopsisthaliana
<400>16
atgatcggtcaccgaatttctcgactgggctccaccatcgtgaagcagctggctcgagag60
ggctacctggccacctacggaaccaagaacctgcaccgatcttacggacactacctgcag120
tccctgcctgtggtccctcgacaggctcgaacctctcaggaggcctggttcctgaagtcc180
cacaagttctgtacctcttccaccacctcttccgagaacggtgacgaggagactgagaag240
attaccatcattttcgtggacaaggacggcgaggagatccccgtgaaggtccccattgga300
atgtctgtcctggaggccgctcacgagaacgacatcgacctggagggcgcctgtgaggct360
tctctggcctgttccacctgccacgtgattgtcatggacaccgagtactacaacaagctg420
gaggagcccaccgacgaggagaacgacatgctggacctggctttcggactgaccgagact480
tctcgactgggttgccaggtcatcgcccgacccgagctggacggtgtccgactggctatt540
ccctccgccacccgaaacttcgctgtggacggcttcgtccccaagccccactaa594
<210>17
<211>486
<212>dna
<213>yarrowialipolytica
<400>17
atgctgcgaaccttctctcgacaggtgctgcaggtgtctcgagctgtgcctcgaaccttc60
cgacctgtcgctcctgctacccgactgttccagacctctgctcccgtgttccacggtcac120
gtccacaagcccaagcccggcgaggagatcaaggtgaccttcattaccaaggacggcgag180
cagatcgaggtcgacacctgtgagggagacaacctgctggacattgcccaggctaacaac240
ctggacatggagggtgcctgtggcggatcttgtgcttgctccacctgccacgtgatcgtc300
gaccccgagtactacgacaagctggaggagcccgacgacgacgagaacgacatgctggac360
ctggccttcggactgaccgagacttctcgactgggttgtcaggtgtgcatgtccaaggac420
ctggacggaatccgaattgccctgcccgctatgacccgaaacctgcaggcttccgacttc480
aactaa486
<210>18
<211>16
<212>dna
<213>人工序列
<400>18
gcggccgcggtctcca16
<210>19
<211>19
<212>dna
<213>人工序列
<400>19
taaaggagaccgcggccgc19
<210>20
<211>43
<212>dna
<213>人工序列
<400>20
aagggcatcggtcgaccaacttttcttgtcgacctgagatacc43
<210>21
<211>36
<212>dna
<213>人工序列
<400>21
gacagcttatcatcgattttccgagctcgatgctgg36
<210>22
<211>40
<212>dna
<213>人工序列
<400>22
ttttcagcctgtcgtggtagcaatttgaggagtattatta40
<210>23
<211>40
<212>dna
<213>人工序列
<400>23
acatgtaatatctgtagtagatacctgatacattgtggat40
<210>24
<211>709
<212>dna
<213>人工序列
<400>24
gcggccgcgacatgatacattctgttgctggaacaactattgtgctattggttgtttgat60
caccagtgccgtagtcttaccgtcgtaccattaccacatgagcttgacctacttgaaccg120
tacataactagtctccgtatcactaccgccgcttgagtcatttgcgtcgtaccggtacag180
acagagacagaagaggcactctagctcaacgccgtgccatgaggtatttcgaccacagcc240
cggtaacgagacatgtttacagctgcgaaacccgctattctcccccccagagcctcggcc300
gttctcacggctctactcatacatgttcctgtgctacattagttgatggtacattcatgt360
ggaggcccccaggaggctctggaaagcctgtcgaggcttggctcagctttctttttgccc420
cagatgggcaccagtcctcgatcggccacctctaagggctcaaaggtttgtctcctccac480
ccgcccaccgtggttcccgtctttacggtgtctgaagaatgaatgatttgatgatttctt540
tttccctccatttttcttactgaatatatcaatgatatagacttgtatagtttattattt600
caaattaagtagctatatatagtcaagataacgtttgtttgacacgattacattattcgt660
cgacatcttttttcagcctgtcgtggtagcaatttgaggagtattatta709
<210>25
<211>548
<212>dna
<213>人工序列
<400>25
aaaccttgcttgagaaggttttgggacgctcgaaggcttttgtgaagacggccagataca60
gacattcccagaggaacatgttccagagggacatgttgcagagggagatgggtcacgtga120
cggggtccacggtatgttcacgtgacgctattgttaccagtcatgtgacctaattcgact180
tgtctctacgtttctctcactcggatgcatgccagtcccactggggccaccagacgttgc240
tttttcccgccgccatttccagcggactagctcgaattctatctccgttttttctttctc300
ggtgcaactctgtcgcgtgccctctggagcgagagagttccgataaccgttcttttggct360
gttatcgagatgtcggagatgggccgacggtgatcgcgtgcccaagtcagccaccagaga420
ttggagcagatgagacaccaaattggaaccacaaaaacgctactgagtctggactgcaac480
aggttctagaagagctggtgagacatggtaccgatagagataacgtcaggtacagacatt540
gcggccgc548