运动发酵单胞菌乙醇发酵基因的克隆及应用的制作方法

文档序号:547513阅读:453来源:国知局
专利名称:运动发酵单胞菌乙醇发酵基因的克隆及应用的制作方法
技术领域
本发明涉及运动发酵单胞菌基因组文库的构建、参与发酵的功能基因的克隆及相应基因在构建工程菌株方面的应用。本发明还涉及运动发酵单胞菌工程菌发酵生产乙醇的用途。
背景技术
燃料乙醇是一类可补充或替代汽油的高效清洁环保燃料。但乙醇的生产成本较高,在价格上同汽油没有竞争力。在发酵生产乙醇的工艺方面,必须解决的关键性问题就是提高糖转化率,才能降低生产成本。
广泛应用于乙醇发酵研究和应用的传统酵母菌株主要为啤酒酵母(Saccharomycescerevisiae)。若是以糖质或淀粉质原料生产酒精,这类酵母的酒精转化率已接近最大理论值(92克乙醇/180克葡萄糖),可进一步挖掘的生产潜力已十分有限。
而分离自乙醇饮料物的运动发酵单胞菌被认为是可以降低发酵生产成本、大规模生产燃料乙醇的最佳替代微生物。运动发酵单胞菌为革兰氏阴性菌,自从1912年发现以来,其命名经过Termobacterium mobilis,Pseudomonas linderi,和Zymomonas mobilis的演变。Zymomonas mobilis是迄今为止所发现的唯一一株通过脱氧酮糖酸(Entner-Doudoroff,E-D)途径利用葡萄糖、果糖和蔗糖发酵生产乙醇的厌氧细菌。与酵母菌比较,具有糖的利用率高、发酵周期短、耐高渗透压,能在40%的葡萄糖(g/g)和13%乙醇(V/V)浓度下生长、在发酵中不需要控制氧气的添加量;以及容易进行遗传操作等优点。但野生型运动发酵单胞菌的生产乙醇的速度仍不够快,乙醇的产量只有在发酵72小时后才能达到最高。
在E-D代谢途径中,葡萄糖-6-磷酸脱氢酶催化葡萄糖-6-磷酸生成6-磷酸葡萄糖内酯,同时,还原NAD生成NADH。催化活性很好的内酯酶迅速水解内酯,然后6-磷酸葡萄糖酸脱氢酶将水解产物6-磷酸葡萄糖酸转化为2-酮-3-脱氧-6-磷酸葡萄糖酸。2-酮-3-脱氧-6-磷酸葡萄糖酸是E-D途径中独特的中间产物。特异性醛缩酶再将这种化合物裂解为丙酮酸和甘油醛-3-磷酸,后来再经过一系列在糖酵解途径中常见的反应转化为第二个丙酮酸分子。接着丙酮酸通过一种不寻常的丙酮酸脱羧酶催化转变成乙醛和二氧化碳,这种丙酮酸脱羧酶和酵母中丙酮酸脱羧酶不同之处在于它不需要硫胺素焦磷酸作为辅酶来维持其活力。最后两种乙醇脱氢酶(乙醇脱氢酶I和乙醇脱氢酶II)将乙醛还原为乙醇,乙醇脱氢酶I同常见的乙醇脱氢酶一样,是一个四聚体,金属鋅位于其活动中心,而乙醇脱氢酶II的不同之处在于铁位于其活性中心。如果乙醇浓度降低,乙醇脱氢酶I还原乙醛的Vmax值大约是氧化乙醇的2倍,而乙醇脱氢酶II氧化乙醇的速率要快一些;如果没有乙醇存在,两者催化还原乙醛的速率是一致的;如果乙醇浓度提高,则乙醇脱氢酶I受到强烈抑制,但是,此时乙醇生产仍然能持续进行,因为这种情形极大地提高了乙醇脱氢酶II还原乙醛的速率。因此在利用运动单胞菌进行发酵生产乙醇的过程中,运动发酵单胞菌的乙醇脱氢酶是将糖酵解途经中产生的丙酮酸高效转化为乙醇的关键酶,而乙醇脱氢酶II对反应速度的增加起着重要作用。

发明内容
本发明的目的是从运动发酵单胞菌中克隆乙醇脱氢酶II的编码基因,导入到野生型运动发酵单胞菌中,提高乙醇的产率。
本发明的技术方案是构建运动发酵单胞菌XW101的质粒基因文库,然后以乙醇脱氢酶II基因的部分序列为探针,从XW101的基因文库中筛选和克隆编码乙醇脱氢酶II酶的基因,直接或经过改造后,连接到广寄主范围的穿梭质粒载体上,然后导入到野生型运动发酵单胞菌或大肠杆菌中。
本发明构建基因组文库的方法是CTAB法(Wilson,K.Inf.M.et al 1987),提取运动发酵单胞菌XW101的总DNA,限制性内切酶Sau3AI部分酶切总DNA,酶切的合适片段连接到载体pLA2917上,连接产物电击转化到宿主大肠杆菌JM109中,在含有抗生素的LB平板上筛选含有重组质粒的菌株。克隆发酵功能基因的方法是,在已构建好的基因组文库中通过菌落原位杂交方法(DNA-DNA杂交)得到含有发酵基因重组质粒的菌落,将得到的重组质粒测序,分析出能翻译有功能蛋白的框架,进而得到所需基因。得到的基因可以根据试验目的与合适载体连接,用于构建工程菌株。所克隆的乙醇脱氢酶II的编码基因大小为1.267Kb,序列如SEQ ID NO1所示。将所述乙醇脱氢酶II的编码基因连接到质粒pLA2917后,得到重组质粒pLWP18(插入片段序列如SEQ ID NO2所示),转入到野生型菌株XW101后,可显著提高乙醇的发酵速度及产率,使乙醇转化效率提高8%。
本发明进行了如下实验A运动发酵单胞菌XW101基因文库的构建基因文库(genomic libary)是指用分子克隆手段,将提取的某种生物核基因组或细胞器基因组DNA,随机酶切或机械剪切为一定长度的片段,再与适当的载体DNA连接后转移到受体细胞中而形成的各种片段的重组子克隆的总和。一个完整的基因文库应囊括该生物基因组上的所有基因。基因文库的构建,借助合适的探针,通过分子杂交等途径即能筛选到目的基因。因此,基因文库的建立,对研究基因的结构、功能以及基因表达调控机制等,都具有特别重要的意义。
本发明使用CTAB法提取运动发酵单胞菌XW101的总DNA,用Sau3AI限制性内切酶将总DNA部分酶切为范围在15~23kb之间的片段后,连接到位于载体pLA2917上卡那霉素抗性基因中的BglII位点上,为确定染色体插入片段最适的连接条件,按载体和插入片段的不同比值(1∶1、1∶2和1∶3)设三个处理,同时设不加插入DNA的对照反应(表4-3)。将连接混合物在4摄氏度下过夜连接后,用电击转化到宿主大肠杆菌JM109中,在含有四环素抗生素的LB平板上筛选含有重组质粒或pLA2917的菌株。第一次经含有四环素抗性筛选的菌株再转接到含有卡那霉素的LB平板上,观察生长结果,只有那些不能在含有卡那霉素平板上生长的菌株中才含有插入运动发酵单胞菌XW101 DNA片段的重组质粒,计算重组质粒的个数,并得到基因文库的容量为6.75×104。
建立了基因文库,理论上基因文库合格与否可采用Clarke建立的如下统计公式进行检验。
N=Ln(1-p)Ln(1-f)]]>P任何一段DNA序列在文库中出现的概率f插入片段长度与全体基因组总长度的比值N重组总数]本试验用于连接的插入片段平均长度15kb,运动发酵单胞菌为革兰氏阴性菌,它的基因组大小约为1.56×106,如果以99%的概率筛选到任意基因,要求的重组子为4.67×102,达到基因文库的要求。
B 乙醇脱氢酶II基因的克隆比较相关基因核苷酸序列,设计出乙醇脱氢酶II两个基因的特异性引物,分别是Adh1(5’-TTA GAA ATC GGA GGC ATT GT-3’)和Adc2(5’-TCG GGT TGT TGC TTT AAACT-3’),经PCR得到1.267Kb产物。纯化这PCR产物,经沸水浴变性,用DIG-High-Primer标记,得到筛选阳性重组菌体所需的探针。将生长在培养基上的菌落转到尼龙膜上,碱法裂解菌体,80℃烘烤固定DNA。用前述PCR产物探针进行菌落原位杂交。随后洗脱杂交膜上非特异结合的探针,添加抗体溶液进行免疫学检测。最后用X-光底片曝光显示杂交结果。
杂交得到15个含目的基因的阳性重组菌,通过对重组质粒提取,经PCR和酶切鉴定分析,从中选取含插有目的基因的重组质粒pLWP18进行测序分析,得到插入基因的遗传结构。
C 带有目的基因的质粒的转化及其对乙醇产率的影响的测定基因工程常用的质粒在运动发酵单胞菌中不能稳定存在,对Z.mobilis来说,最佳的可负载外源基因的质粒是其自身的原生质粒片段与一些广寄主范围的质粒片段融合后产生的质粒。本发明选取了广寄主范围的质粒pLA2917作载体,将带有乙醇脱氢酶基因的阳性克隆质粒直接电转入XW101,通过四环素抗性筛选得到阳性转化子。
在实验室中经同等条件批发酵比较,转化子乙醇产率较未转化菌体高8%,表明转化子中重组质粒携带的乙醇脱氢酶基因有效表达,且基因的拷贝数直接影响到乙醇产率。
具体实施例方式实施例1运动发酵单胞菌XW101基因文库的构建1、CTAB法提取细菌总DNA1)取单菌落接种于5ml相应的培养基中,在合适的温度下培养。根据细菌的生长率不同培养时间可由几小时到几天不等。
2)取1.0ml菌液于1.5ml离心管中,13,000rpm离心2min,弃上清。
3)沉淀重悬于1.0ml 0.85%NaCl中。
4)室温13,000rpm离心2min,弃上清。
5)沉淀重悬于550μl1×TE中。
6)加17μl溶菌酶(35mg/ml),37℃温育30min。
7)加3μl蛋白酶K(20mg/ml),37℃温育30min。
8)加30μl 10%SDS,37℃温育30min。
9)加100μl 5M NaCl充分混匀。
10)加80μl CTAB/NaCl溶液,混匀,65℃水浴10min。
11)加等体积(0.7~0.8ml)氯仿/异戊醇(24∶1),轻轻振荡混匀。
12)室温,13,000rpm离心10min。
13)将上清液转移到一新1.5ml离心管中,加入等体积酚/氯仿/异戊醇(25∶24∶1)轻轻振荡混匀。
14)重复第12)步。
15)将上清液转移到一新1.5ml离心管中,加入等体积氯仿/异戊醇(24∶1)轻轻振荡混匀。
16)重复第12)步。
17)将上清液转移到一新1.5ml离心管中,加入0.6体积异丙醇,混匀后室温静置60min。
18)20℃13,000rpm离心20min。
19)弃上清,加500μl 70%乙醇,轻轻颠倒数次(洗盐)。
20)4℃ 15,000rpm离心20min。
21)重复洗盐两次。
22)倒置离心管,干燥DNA沉淀10~15min。
DNA沉淀溶于100μl 1×TE缓冲液,-20℃保存备用。
2、酶切DNA片断与质粒pLA2917连接反应10×buffer 2μlpLA2917 100ng酶切DNA片断 350ngT4连接酶(3U/μl) 2μl加水至20μl,4℃过夜连接。
3、电击转化感受态细胞的制备所有步骤均在冰浴条件下操作1)挑取LB固体培养基上的新鲜单菌落,接种于20ml LB液体培养基中,37℃220rpm振荡培养2小时,菌液OD值达到0.5-0.6,冰上冷却培养物至0℃。
2)将菌液转入灭菌离心管,4℃ 4000g收集菌体,去上清,在吸水纸上倒置空干。
3)加入20ml的预冷10%甘油,置于冰上,不时轻轻颠倒离心管,将菌体泡溶。
4)4℃4000g收集菌体,去上清,在吸水纸上倒置空干。
5)加入10ml的预冷10%甘油,轻摇离心管,将菌体泡溶。
6)重复步骤(4)7)加入10ml的预冷10%甘油,轻摇离心管,将菌液泡溶。
8)重复步骤(4)9)加入200ul的预冷10%甘油,溶解菌体,分装成40ul/1.5ml离心管。
连接产物转化感受态细胞1)将电转化仪(BIO-RAD Gene PulserII System)调到2.5kV,脉冲控制器调到400Ω。
2)将2ul连接产物(水溶)加入到盛有40ul新鲜制备的或融化的冻存的感受态细胞小管中,混匀。
3)将转化混合物转移到预冷的电转化池中,吸干池的外表面,然后放入样品槽中。
4)进行脉冲电转化,然后取出电转化池,马上加入1ml LB培养液,于37℃中速振荡培养60min。
5)取200ul涂布于含有四环素的LB平板上。
通过含有卡那霉素的LB平板筛选含有重组质粒的菌落。
实施例2 醇脱氢酶II基因的克隆1、PCR反应体系10×PCR buffer 2μl2.5mMdNTP2μl10×BSA 2μl50pM引物12μl50pM引物22μl模板DNA 5ng5U/μlTaq酶 0.25μl加无菌水至20μl2、PCR反应条件1、94℃预变性20s2、94℃ 0s54℃ 0s72℃ 40s(25个循环)3、72℃ 5min
3、DIG-DNA探针标记主要试剂1)灭菌dd-Water,15-25℃,用于稀释DNA2)EDTA0.2MpH 8.0 15-25℃,用于终止反应模板DNA纯度要求为用试剂盒纯化(BioDev公司)DNA片段大小模板DNA为线性,大小应大于100bp,当DNA模板大于5Kb时,先用识别4bp的限制性内切酶硝化。
DNA量原则上可标记10ng-3μg的模板DNA,如果单一拷贝基因的检测在复杂基因组进行至少300ng的DNA模板(探针浓度25ng/ml杂交溶液)需要标记。
步骤1)加1μg模板DNA(线性或超螺旋)、灭菌ddH2O终体积为16μl2)加热沸水中变性DNA10min,迅速置于冰浴中冷却。(注意要求完全变性)3)混合DIG引物,取4μl DIG引物加入到变性DNA中,混匀,并稍作离心。
4)37℃培养1小时(延长培养时间到20小时会增加标记产量)5)加入2μl 0.2M EDTA(pH8.0)或者加热65℃,10min终止反应(注意得到DIG标记片段的长度200-1000bp或更长,取决于模板长度)4、菌落原位杂交硝酸纤维素膜上菌落的培养1)将硝酸纤维素膜铺于含有选择性抗生素的平板上;2)用无菌牙签将菌落逐一对应地转移至实验板的滤膜上和含有抗生素的主平板上;3)在实验板上和主平板上各划一个含非重组质粒的克隆;4)倒置平板37℃培养16小时;5)在三个或更多不对称的位置标记滤膜,在主板相近的位置也做同样标记;6)用封口膜将主板封好,颠倒后置于4℃保存,直至得出杂交实验的结果;菌落的裂解和DNA与滤膜的结合1)将滤纸切成大小和形状适当的三张,使之适于三个玻璃托盘的底部,将三张滤纸分别浸泡在10%SDS、变性液、中和液三种液体中;2)倾去多余的液体,用一根玻璃棒滚压滤纸,除去滤纸与托盘底部间的气泡;3)用平头镊子揭下琼脂板上的硝酸纤维素膜,菌落面向上置于SDS浸湿的滤纸上,3min;4)将膜转到用变性液浸湿的第二张滤纸上,浸泡5min;5)将滤膜转到在中和液中浸泡的第三张滤纸上,浸泡5min;6)在托盘中放置100ml 2×SSC,使滤膜浮在液体表面数分钟。此后,在晃动容器的过程中让滤膜沉入液面以下并留在液体中,5min;7)干燥滤膜将滤膜置于干的滤纸上,菌落面向上,于室温至少30min;8)固定DNA用两张滤纸上下包夹滤膜,在烤箱内80℃烤干1-2小时;杂交1)确定杂交温度Tm=49.82+0.41(G+C%)-600/1(1为碱基对中杂交的长度);Topt=Tm-20到25℃2)DIG Easy Hyb工作液的准备将64ml无菌ddH2O分两次加入至DIG EasyHybGranules瓶中(第7号瓶),37℃振荡5min使之溶解;3)DIG EasyHyb(10ml/100cm2滤膜)适当的体积预热至杂交温度37-42℃;4)在适当的容器中轻轻摇动进行预杂交30min;5)沸水浴5min,使DIG标记探针变性,迅速置于0℃(注意不要用碱性溶液处理)6)将变性DIG标记探针与预热处理的DIGEasy Hyb(3.5ml/100cm2膜)混匀(避免产生气泡)7)倾去预杂交液加入探针/杂交混合液,轻轻摇动反应4hr。
8)大量2×SSC/0.1%SDS洗膜,15-25℃,5min,不时摇一摇液体;重复一次;9)用大量预热至65-68℃的0.5×SSC/0.1%SDS洗膜,5min,不时摇一摇液体;重复一次;免疫测定1)试剂盒工作液的制备终止液用顺丁烯二酸缓冲液稀释10×终止液(1∶10)抗体液使用前离心抗-DIG-AP,5min,10000rpm,从表面小心吸取所需的量,用终止液稀释之,1∶10000(75mU/ml)。
2)杂交并严格洗膜后,用洗涤缓冲液漂洗膜1-5min;3)100ml终止液中反应30min;4)20ml抗体液培养30min;5)100ml洗涤缓冲液漂洗15min洗2次;6)20ml测定缓冲液中平衡2-5min;
7)将膜(DNA面作记号)置于杂交袋中,加入1mlCSPD ready-to-use(5号瓶),15-25℃培养5min,8)挤出多余的溶液,封口;9)湿润的膜培养10min 37℃,以增强化学发光反应。
10)X-ray感光15-25min 15-25℃。
实施例3带有目的基因的质粒的转化及其对乙醇产率的影响1、电转方法同实施例1。
2、乙醇产率测定1)色谱条件色谱柱长2m,内径4mm。
固定相GDX-102,60-80目温度气化室190度,检测器190度,柱温170度。
气体流速载气(N2)40ml/min。
2)进样量5.0ul。
3)定性以乙醇标准出峰时间定性。乙醇标准应用液和样品测定液各进样5.0ul,分别测定保留时间,样品与标准出峰时间对照而定性。
4)定量样品测定液中乙醇含量测定取样品测定液5.0ul进样,测出乙醇峰高或峰面积,依据工作曲线或回归方程计算测定液中乙醇含量(%)。
工作曲线制作取20±0.5度的乙醇标准应用液适量用20±0.5度纯水稀释成乙醇含量(V/V)分别为0.20%、0.40%、0.60%、0.80%、1.00%的标准系列浓度。分别取上述乙醇标准系列浓度5.0ul进样,测得乙醇的峰高或峰面积。以乙醇的含量百分浓度为横坐标、相应的峰高或峰面积为纵坐标,制作工作曲线,或用最小二乘法计算其回归方程。
计算样品中乙醇含量乙醇含量(C2H5OH,%,V/V)=样品测定液中乙醇含量×ff-稀释倍数(1,50或100)。
5)乙醇实际产量与理论产量的百分数的计算

6)试验数据(10ml培养基)1、2、3为含乙醇脱氢酶和丙酮酸脱羧酶重组质粒的XW101的三个重复,4、5、6为野生菌XW101的三个重复

SEQUENCE LISTING<110>中国农业科学院生物技术研究所<120>运动发酵单胞菌乙醇发酵基因的克隆及应用<130>03-02<160>2<170>PatentIn version 3.1<210>1<211>1152<212>DNA<213>运动发酵单胞菌(Zymomonas mobilis)<400>11ATGGCTTCTT CAACTTTTTA TATTCCTTTC GTCAACGAAA TGGGCGAAGG TTCGCTTGAA61 AAAGCAATCA AGGATCTTAA CGGCAGCGGC TTTAAAAATG CGCTGATCGT TTCTGATGCT121 TTCATGAACA AATCCGGTGT TGTGAAGCAG GTTGCTGACC TGTTGAAAGC ACAGGGTATT181 AATTCTGCTG TTTATGATGG CGTTATGCCG AACCCGACTG TTACCGCAGT TCTGGAAGGC241 CTTAAGATCC TGAAGGATAA CAATTCAGAC TTCGTCATCT CCCTCGGTGG TGGTTCTCCC361 GAAGGTATCG ACAAATCTAA GAAACCTGCC CTGCCTTTGA TGTCAATCAA CACGACGGCT421 GGTACGGCTT CTGAAATGAC GCGTTTCTGC ATCATCACTG ATGAAGTCCG TCACGTTAAG481 ATGGCCATTG TTGACCGTCA CGTTACCCCG ATGGTTTCCG TCAACGATCC TCTGTTGATG541 GTTGGTATGC CAAAAGGCCT GACCGCCGCC ACCGGTATGG ATGCTCTGAC CCACGCATTT601 GAAGCTTATT CTTCAACGGC AGCTACTCCG ATCACCGATG CTTGCGCCTT GAAGGCTGCG661 TCCATGATCG CTAAGAATCT GAAGACCGCT TGCGACAACG GTAAGGATAT GCCAGCTCGT721 GAAGCTATGG CTTATGCCCA ATTCCTCGCT GGTATGGCCT TCAACAACGC TTCGCTTGGT781 TATGTCCATG CTATGGCTCA CCAGTTGGGC GGCTACTACA ACCTGCCGCA TGGTGTCTGC841 AACGCTGTTC TGCTTCCGCA TGTTCTGGCT TATAACGCCT CTGTCGTTGC TGGTCGTCTG901 AAAGACGTTG GTGTTGCTAT GGGTCTCGAT ATCGCCAATC TCGGTGATAA AGAAGGCGCA961 GAAGCCACCA TTCAGGCTGT TCGCGATCTG GCTGCTTCCA TTGGTATTCC AGCAAATCTG1021 ACCGAGCTGG GTGCTAAGAA AGAAGATGTG CCGCTTCTTG CTGACCACGC TCTGAAAGAT1081 GCTTGTGCTC TGACCAACCC GCGTCAGGGT GATCAGAAAG AAGTTGAAGA ACTCTTCCTG
1141 AGCGCTTTCT AA<210>2<211>13807<212>DNA<213>运动发酵单胞菌(Zymomonas mobilis)<400>21TACCCGCCGC CTTGGCGTTA TTCATGGCTT CATAAGCCAT GCCTGCCGTC ATCGAGCCAT61 CACCGATAAT CGCAACCGCT TTGTCGTCGC TGTCGGATAA TTTGCTGGCC ATCGCAAAGC121 CGAGCGCCGC AGAAATAGAA GTCGAACTAT GCGCTGCTCC AAAAGCGTCA TATTCGCTCT181 CCGCGCGCTG CGTAAAGCCC GATAAGCCGT CACGTTGCCG CAATGTCCGA ATACGATCAC241 GGCGACCTGT TAAAATCTTG TGAGGATAGG TTTGATGCCC AACATCCCAG ACCAAAGCGT301 CTTTGGCGTG TTGAAAACAT AATGAAGAGC TACCGTTAAT TCGATAACCC CCAGACCGGA361 ACCGAGATGT CCGCCGGTCA CACCCACTGC CGAGATGGTC TCTTTCCGTA ATTCATCCGC421 CAATTGCCGG AGGCTGTTGC GATCTAATTG ACGCAATTCT GCCGGTGTCT TGATCTTGTC481 TAACAACGGC GTCTTTTTAT TCGGAAACAT AGGCCTGAAA TCAAACTCTG CATTAGGCAT541 TTACCCGATA AAACGAAAAG CGGTTTTAAC AAGGTAAAGA CTTTATCTGA AAAATATTTC601 GTCGCCTTCA TAAGGCAAAC GCGGCTTTTC TGTACACTTT CACCGCCTGG ATGTAAAAAT661 AATAAAGCAG GCGAGCAAAA GGCCAGCTAT CAAAGAATTT CCCGCTATTA AACCCGAAAA721 GATTTCTGCC ATGGCTGAAA TCGGGGCGAA AATCCTGATA ATAGGCTTTA AATGGCAAAT781 TATTTATGAC GGTAGGCTTA ATAGCCTGTA AAAATTTGTA ACAATATTTT TTGTTTTTGC841 AATAAACAAA AACAAATGCC TCCGATTAGA AATCGGAGGC ATTGTTTGCT TGAAAATCAA901 GACAGGACGG AAAACCGTTT TCCTGTTTTG AAATTAGAAA GCGCTCAGGA AGAGTTCTTC961 AACTTCTTTC TGATCACCCT GACGCGGGTT GGTCAGAGCA CAAGCATCTT TCAGAGCGTG1021 GTCAGCAAGA AGCGGCACAT CTTCTTTCTT AGCACCCAGC TCGGTCAGGT TTGCTGGAAT1081 ACCAATGGGA GCAGCCAGAT CGCGAACAGC CTGAATGGTG GCTTCTGCGC CTTCTTTATC1141 ACCGAGATTG GCGATATCGA GACCCATAGC AACACCAACG TCTTTCAGAC GACCAGCAAC1201 GACAGAGGCG TTATAAGCCA GAACATGCGG AAGCAGAACA GCGTTGCAGA CACCATGCGG1261 CAGGTTGTAG TAACCGCCCA ACTGGTGAGC CATAGCATGG ACATAACCAA GCGAAGCGTT1321 GTTGAAGGCC ATACCAGCGA GGAATTGGGC ATAAGCCATA GCTTCACGAG CCGGCATATC1381 CTTACCGTTG TCGCAAGCGG TCTTCAGATT CTTAGCGATC ATGGAAGCTG CTTTCAAAGC1441 GCAAGCATCG GTGATCGGAG TAGCTGCCGT TGAAGAATAA GCTTCAAATG CGTGGGTCAG1501 AGCATCCATA CCGGTGGCGG CGGTCAGGCC TTTTGGCATA CCAACCATCA ACAGAGGATC1561 GTTGACGGAA ACCATCGGGG TAACGTGACG GTCAACAATG GCCATCTTAA CGTGACGGAC1621 TTCATCAGTG ATGATGCAGA AACGCGTCAT TTCAGAAGCC GTACCAGCCG TCGTGTTGAT1681 TGACATCAAA GGCAGGGCAG GTTTCTTAGA TTTGTCGATA CCTTCGTAGT CTTTGACTTC1741 ACCACCATTG GTTGCGACCA GAGCGATGGC TTTGGCGCAG TCATGGGGAC AACCACCACC
1801 GAGGGAGATG ACGAAGTCTG AATTGTTATC CTTCAGGATC TTAAGGCCTT CCAGAACTGC1861 GGTAACAGTC GGGTTCGGCA TAACGCCATC ATAAACAGCA GAATTAATAC CCTGTGCTTT1921 CAACAGGTCA GCAACCTGCT TCACAACACC GGATTTGTTC ATGAAAGCAT CAGAAACGAT1981 CAGCGCATTT TTAAAGCCGC TGCCGTTAAG ATCCTTGATT GCTTTTTCAA GCGAACCTTC2041 GCCCATTTCG TTGACGAAAG GAATATAAAA AGTTGAAGAA GCCATAGCTA TAACCTCACC2101 CTACATACTA GTTTAAAGCA ACAACCCGAA AACAACCATT TTCGAGAAAT CGCTTTCTAT2161 TGTTTTTGCG TTTTAATCCC GTTTTCGAGA CGTTTTCTCA AAGTTTTTCC TGAAAACGAG2221 TAAAATCACC AATTTTACGC ATTTTCAGCA ATCGGGCAGC GCAAAAGCAA TATGTCTATC2281 AGTTTTATCA GATCAAGGGG TTCGCTTTAT TCCAGCACAT TTATAGTCTG TNTTAACGAA2341 GCGACCTCTA TTTTCTGAAA GCCGAGATTT TTCTACTCGC GACAGCGGTG ATGAGCAAGG2401 CTGCTTGTTC TTTCTAAATA TGTATTTTTT ACATCAAGAC TTATGCAAAT TATGAAAAAG2461 TTGTCTTTTT ANTATGAAGT ATTGTTTAAT AATTGAGATG TGGTTACCGA TTTTGCCTTT2521 AAATTAAAAT AATAAATTTC AGGCGAAATA TTTTAAAATA AAACATTTAT GTTAAATTTT2581 AAGAAAGGAA ATTTTGAAGA ATCTGTTATT TTGTTCGTTT TTGAGGCTTT TTAGAGAAAG2641 ATAAGACTAA AAATAACATA GTTGTTAGGT ATTCATTCCA ATTTATTGTT CAAATATTAA2701 AAGCCAAATT GTAAATAGAA AACAAGAAAA TATCGTATAT GGCGAAATAT ACTGTATAAA2761 TTGCACAACA TTAAAATAAA GACATTTTCA GATATCCAAA TAGATTGTGA AAAAAGAAAT2821 AAAAGAATAA TTTGTAAGGA TGCAGGGGAA TAGTCAGGAA AAGAAGCTAT GGGGGTCGCG2881 GTAGCTTGAG GAGGAGGGGG GGGAGTGCTA CCGCCACCCG CTCTGCCGAA ATAGGGATAT2941 TCATCCATAA TAAAAATAGA AAAACCAGAC AATTATCGTT TCCATTTTTC ATCTAATCAA3001 TTGTCTCACA CGCTGCATCA AAAGCAGCTT GTTCTTTCTT CTGCTCAAAA TGGCAGATCA3061 GGCTTTCCTC AAAAAACGCA AAAAGACAAA AAAAATTGCA GCGGTAATGA AAAAATAAAA3121 GAAATTTTGA AAATTTTTGC CGCTTTTATG TGGAAGCGGA TATTTTATCT ATTTACAGTC3181 TCGACGAGAC AATCTTTGTT GTTGTTAAAG AAAAATCAGT AAGATGATGC TGTTTTGGAA3241 ACAATGATTC AACGGGGGGA TATATTTTTA TGAAGCGTTC CTTGCTATTT TTGCTAGCGA3301 CCAGTGCCAT CGCTTGGCAG GCACAAGCGA TACCAGCTGG AAATTCTGCA CCTCAACCTA3361 TGGCGATATC TGAAACGATT CCGGCTGCGG TTGATAAACC TTATAGCGGT CTCATTCGTC3421 TTAATGTCGA TGCCACAGAC ACGCAGCGCG GTATTGTTCG GGTAACGGAA ACGATTCCTG3481 TTCAGGCTGG TGCGCTGACT TTGCTCTATC CTGAATGGTT GCCGGGACAT CATAGTCCAT3541 CAGGTCCCAT CGAAAAATTG GCAGGTTTGA TTGTTACCGC CAATAATCAG GTTATTCCTT3601 GGCAACGCGA TTCTGTCGAT GTTTATGCCT TTCATCTTGA TATTCCGGCA GGCGTGACCG3661 AAATCACCGC CCAATATCAA TATCTCTCCC CGACTTCGGA GTCGCAGGGA AGAATCCAGT3721 CCACACCGGA AATGGTCAAT TTGCAGTGGA ATACGCTGGC TTTATATCCG GCCGGATATT3781 TTACCCGCCA AATCCAGATA CAGCCGACCG TTATTTATCC AACGGGTTGG AAATCGGCTT3841 CTGCCTTAGA AATTTCTGGT ATCACGCCTG ATGGACAGAC ACCCAATGTC GTCCAATATA3901 AAACTACCGA TTTTGATACG CTAATTGATT CGCCGGTAAT GGCGGGTCGT TATACGCGGA3961 CAGAAACGCT CGCCCCCGGG GTTCGTCTCA ATCTTATAGC AGACAAACCC GAAGATATGG
4021 TGATGACGGA CAAACAGCTT AACGCGCATC GCCAGCTCAT AACCCAAGCC GTAAAACTTT4081 ACGGCGCACA ACATTATAGC CATTATGATT TCTTGCTGGC TTTGTCCGAA AAGCTCGGTG4141 GTATTGGTTT AGAACATCAC CAATCTTCCG AAGATGGGGA AGGGGCTGAT TACTTCTCGA4201 AATGGGATAA ATCAGCCGTT GGTCGTGATC TCCTCGCCCA TGAATATAAC CATAGCTGGA4261 ATGGTAAATA TCGCCGCCCC GCTGATCTTT GGACACCGGA CTATAAAACG CCGATGCGGG4321 ATAGCCTCCT TTGGGTTTAT GAAGGTCAAA CCCAGTTTTG GGGTTATGTA TTGGCCGCGC4381 GTTCCGGTCT GTGGCAGCAA AAAGATGCCT TGGAAGCCTT GGCTTTGGTG GCCGCCACTT4441 ACGACAATCG GGCAGGCCGC CGTTGGCGTC CGGTGGAAGA TACCACTAAT GATCCGATTA4501 TTTCGCAACG CCGCCCCAAA GGCTGGCTAA GCTGGCAACG TTCCGAAGAT TACTACAGTG4561 AAGGTCAGTT GATCTGGCTT GATGTTGATA GCCTGCTCCG GCAACAAACT CATGGCAAAC4621 ATTCGCTTGA CGATTTTGCA AAAGCCTTTT TCGGAATGCG TGACCGTGAT TGGGGTGAGT4681 TAACCTATAA TTTTGACGAT GTCGTCAAAA CCTTAAATGA CATCATGCCT TATGACTGGG4741 CAGCCTTCTT TAACCAGCGT TTGAATCAGC GTTCGACCCA TGCGCCTTTG GACTGGATCA4801 GCCGTGGCGG TTACAAACTG GTTTACAGTG ATGAGCCAAC CGACTGGATC AAAGGTGTTG4861 AAGGCGCACG CCATATGGCC GAGTTGTCTT TCTCTTTGGG ATTATCGACT TCTGAAAAAG4921 GCAAAGTCTC TTCGGTGATG TGGGATAGCC CTGCCTTTAA CGCTGGATTG ACCGTAGGAA4981 GTGAATTGGT CGCGGTTGAT GGTCATGCCT TTAGCAATGA TCTGCTAAAA ACAGCGATCA5041 AAAATGCCAA GGCCAATAAA ACGCCGATCA AATTGCTCAT CAAGCAAGGC GATAATTATC5101 GGGATGTCGC GATTCCTTAT TATGACGGCT TCCGTTACCC GCGCCTTGAG AAAATCGATA5161 AAACCCATAG CTATCTCGAG GATTTACTCG CAGCCAAAAA CTAATTTTGA TCCATGATGA5221 AAAGCAGTCA GGTATAAAGC CGATTTCGGT GCTTGCCTGA CTGCTTTTTC AGTCTTATTA5281 AAAAAGAGTG CAGATTTCTT CTCCTCTCCG TCTGGAATTA GACAAATCAG CCCTGATGGC5341 AAACTGGCAA AGTTTGAACC GGATAACGGC TGGTCATTGT GGTGCCGCGA TCAAGGCTAA5401 TGGCTATGGT TTAGGGGCTG AACGCGTTCG TCATTATCTG GCACAGGCCG GATGTCGCGA5461 TTTTTTGTTT CCAGTTGGGA TGAAGCTCGC TTACTCGATA GTTCGGAAAA GGATTTCTCC5521 CTTTCTGTTC TCCATGGCCT AAGGGAAGAT GACCTCGGCT ATGCTCTGAA TTCTTCGGTC5581 AAGCCGGTTT TATGTAGTCC AGCGATGATT GCCCGCTGGA AACTCACGCG CCGAACCGTC5641 CCTGCGATGT CATGGTCGAT ACTGGAATGA ATCGGCTGGG TCTTTCGATG GAAGAGCGGG5701 TTCAGGCCTG CTGGATGGTC TTTCTATCGA CAATATTTTG AGCCATCTGG CCTGTGCAGA5761 CGAGGCAGAT CACCCGCTTA ATCAAAAGCA GCTTGAACGC TTTCGGATTT TAGCCGCCAG5821 AAAACAGGCA AAACGCTATA GTTTGGCTAA TTCTGCCGGT ATTTTTCTCA GCAAAGACTA5881 TCATTTTGAT CTGGCGCGTC CGGGCTTGGC GCTTTACGGC GGCCTGCCTG TTCCGCAATC5941 CAAAGATATT CTGAAACCCG TCGTTGCTAT TGCCGCCCAA GCCATTCAGG TAAGAGAAGT6001 CAGCGCCGGT GAGGCGATTG GCTATGGTGC TTGTTTTGTC ACGCCCAAAA AAATGCGGGT6061 GGCTATTTTG CATGTCGGTT ATGCTGATGG GTATTGGCGG GCTTTCTTTG AAAAAGGCCA6121 TGCCCGAAAA GACGGCGTTA TCTGTCCTTT GGCCGGTCGG GTTTCTATGG ATATGATAAC6181 GGTTGCCTTG CCGGATGTAT TGACAGCTCA CGAAGGTGAC TGGTTCTCGG TTGATTTTGA
6241CTTGCCTTCC CTTCGCAACA GACCGGATTA TCCCAATATG AACTACTGAC GGGCTTGGGG6301CATCGTTACC AATCTGTCTG GCAGGCAATA TAAATGCCGC CATTATCTAA TAATGTAGAG6361AGAGGATCAG CATTGCTTTT CCCTATTCGG TGCTTGGCCG CCATTGGTCG TTTGTTTATT6421GCTTTTTTGG CTGGCATCGG TCGGATAGCC CGTTTCGGAA TGACGATTTT GTTGAGAGGC6481GCTTTACCGC CTTATTATCC CGGTCGTTTT TTCCACGAAT TTTTTGAAAT CGGCTGGAAT6541TCGCTTCCAG TTGTGGCCTT AACCGCTGTT TTTACCGGAT CAGCCTTGGC ACAACAGGTC6601TATGCTGCGG CCAGCCGTTT TTCAGCGCAA TCGACAGTTC CGGCGGCGGT TGTTATCGGT6661ATGGTTCGGG AATTAGGCCC TGTTTTGGTC GGATTGATGG TTGTCGGTCG AGTCACTTCT6721GCGATTGCCG CCGAATTGGG CGCTATGCGG GTGACCGAGC AAATTGATGC GATGGAAACG6781CTGCATACAG ATCCCTATCG CTATCTTTTG GCACCTCGCC TTTATGCGGC TACCCTCGCT6841TTGCCTTTCT TGGTGATGCT GGCCAATGTT ATCGGCATTT TCGGGGGCTA TCTTCTTTCA6901ATCAGCAAAT TGGGCTTTAA CCCTGAAAAT TATCTCAAGG TAACACGCGA ATTCCTAAAG6961GCCGAAGATG TCCATATGGC GCTGGTAAAA TCGGCAGTTT TCGGTTTTCT CGTTGCATTA7021TTGGGCTGTT ATAATGGCTT TTTTGCCACC GGCGGCGCGG CAGGTGTTGG ACGTTCAACA7081AAGCGGGCGG TGGTCAGCGC CTTTATCATG ATCCTGTTTT CAAATCTGAT GATTACCATG7141TTCTTTTTCG GATAAAGAGT CTTATGCCTC AGACACAGCC TCTCATCCGA ATTCGCGGGT7201TAAGAAAATC TTTTGGCGAT CACGCTGTTT TACAAGGCGT GGATATTGAT ATCGACAAAG7261GACAGTCGGT TGTCATTATC GGCCAGTCCG CGCGGCAAAT CGGTTTGCTG AAACCATATT7321AGGCCTGATC GAAGCCGATG CCGGTTCTAT CGAAATAGAG GGGCAGGATA TTGAAACCAT7381GTCCCAAAGC CAATTGGCTT CTATTCGCGA TCATATCGGG ATGCTGTTCC AAGGCGGGGC7441GTTATTCGAT TCCTTGCCAG TTTGGCGCAA TATTACCTTT GCCATTACCC AAGGTCATTT7501ACGCGATACC GCCAAAATGC AAAAATTGGC GAGCGAATAT CTCGCACGGG TCGGATTGGA7561TGACAGGATT CTCAATCTTC GTTCTGGGGA ATTATCAGGA GGGATGCAAA AACGCGTAGC7621GATTGCGCGG GCGATTGCGG CTAAACCCGA AATCCTGTTG TTTGATGAAC CGACCGCAGG7681CCTCGACCCC ATTCGCTCTG ATGTCATTGA CGACTTAACG CTTAGCCTCG TGCGCGATAA7741TGGTATGACC GCAATTACCA TTACCCATGA CATGGCTTCG GTTTGCAAAA TTGCGGATAA7801GATCGCCTTC CTGCATGAAG GCCGTATTAT CTGGACAGGG AATACTCAAG ACCTTCGGAC7861AACCGACAAT CCCTATGTTC GGCAATTTTT TGATCGCAAA GCCGAAGGCC CCTTCATTGA7921AAACAGCCTA CTGACTGTTT GTATAACCAG TAACGATCTA AACGCTAGAA TTAATGAATG7981AAAAAAGAGG CTATAAACAT AATCTATAGC CTCTAATTTT ATTAAAAAAT TTAAGGCATC8041TTTATGCCGA CATGCGTTAT AAAATCATTC CATAAATTTT CGGCAGCCTC TTGTGAAGTT8101AATGGTTTAT TACTTAAAGA TCCTCCCCCT CTTAAAAGGA ACTGATTGTA TCATCTGAGG8161ATACTTGAAA CCACCCATTC ATTGAACCTT CTGGAGCATG TTCTGTAAAA GAAAATTGAA8221TATCTCCAAA AGAGGTAGAG TTTTTAGCGG ATCGGACGGT AATATAGGCA GTTTTATTCG8281CCATTTTTTT GTTTACGAGA GTGCATCCAA AAGATAATGA ATCAATTTCA TCAAAAGCCC8341ATGTAATCAT CTATTGAATT GATTCTGTTA TTGATCTTTA AAAAATTCTT TAATGGCATT8401GAAAGATTGT MTTTTGAATT CTGTBTTGTC AATTTGATCA AAATCTTTYT GAATTTGATA
8461TTSCCNYGAA ACATCCATCT BTSYBKCTTG GAATCGACTG GGAACATTGT TCGTATTTGT8521STGATACTGG ATAATATCTC GTAAGCCATT TACGATGCTC AAAAATGCAA GGTTTGTATT8581TGTCCACAGG CTGATGGGCT GTGCATCTYT TGGTAATGCT TTCAAACGGG ATAATTCTGT8641TACAGATTTC CAGTCACATG GTTCTGCGAT AATAGGAATT ACACGAGCCT CGCCTTTATC8701GTGACGATTT AGTGCATATC GCATTTCCGT ATCCATACAG TAAGGAGACG CGATAAAATC8761AGGCGTTATT ATTAGTAAAA ATAAATCACT ATTTTTTAAA TTAACCTTTA TTGTTTGATC8821TATTGAGTCT CCAGGTAATA TTTGATGATC AAACCATGCT TCGATGAGAC CGTCCCTTTT8881TTAACCCAGT AAGATGGGTT TTGAGATCAT TAAGAATATT CTCATCTTTA TGACAATAAG8941AGATAAACGC TTTCATAAAA AACCTTGTTT CTGAGTATTA GATAAAAATT AAAATAAATT9001TTATCTATAT TTACTGCATC TATACATAAT ATTATATATT TAATTTTCWW TTTTATAATA9061TATATTCTAA GATCACTAGC TGTAATCAGG GTTAGCTTCT AAAAAAATGA CCCTAATCTT9121GACCGCCTAT TTGGTCAGGT TGAAGCATCC GTTTTAAATA ATGGCCAGCC ACCAGTGCCA9181CCTTCAGGAC CCAGATCAAT TAGCCAATCA GCTGTCTTAA TGACATCCAG ATTATGCTCG9241ATCACGACAA TGCTATTTCC TTGATCGACT AGAGCATTCA GAACTTCCAG CAATTTTCGG9301ACATCTTCAA AATGAAGACC CGTGGTTGGT TCATCAAGAA TATACAGCGT TCGCCCTGTT9361GCCCTTTTCG ACAATTCTTT TGCTAATTTA ACGCGCTGCG CCTCACCGCC TGATAAAGTC9421GTCGCTTGCT GACCAACCTT GATATAGCCC AAACCAACAC GGGCAAGCAT TGCCATCTTG9481TCACGGATAG AAGGCACCGC TTCAAAAAAT TCTGCTGCCT GATCGACCGT CATATTCAAA9541ACATCGGCAA TAGATTGGCC TTTGAATTTG ACCTCCTGCG TTTCGCGATT ATAGCGCGCA9601CCATGACAGA CATCACAGGT GACATAAACA TCCGGCAAGA AATGCATCTC AATCTTTTTG9661ACGCCATCAC CTTGGCAAGC CTCACAACGC CCGCCCTTGA CGTTAAAACT AAAACGACCG9721GCTTTATAAC CGCGGGCTTG AGCCTCCGGT AATTTGGCAA ACCATTCCCG AATAGCGGTA9781AACGCACCGG TATAGGTTGC CGGATTGGAA CGGGGCGTGC GCCCAATAGG TGATTGGTCA9841ATATCAATCA CCTTATCGAG ATGCTCCAAT CCCGAAATAG ATTTATAGTC ACCACTAATC9901AGCCGCGCAC CATTCAATTC TCTGGCCGCC GCCGTATAAA GCGTATCCAA AATCAGGCTG9961GATTTACCGG AGCCGGAAAC CCCCGTGACA CAGGTGAAAG TCCCCAAAGG AATAGATGCC10021 GTCACATTTT GAAGGTTATT GGCGGTCGCT CCTTTAATGG TCAGCTTTTT ACCATTCCCC10081 TTGCGACGTT TATCGGGAAC TGCAATTTCC CGCCGCCCTG AAAGATAAGC GCCTGTCAAA10141 CTATCAGGAC AATCAATAAT ATCCTGTGGC GAACCGGCGG CAATCACTTT ACCACCCATC10201 ACCCCCGCAC CGGGGCCCAT ATCGACGACA TAATCGGCAA GACGAATAGC ATCTTCATCA10261 TGCTCGACAA CCAGAACTGA ATTGCCCAAA TCGCGCAATC GCTTCAAAGG TTTCAAGCAA10321 GCGATCATTA TCACGCTGAT GCAAACCGAT AGAGGGTTCA TCCAACACAT ATAAACACCG10381 GACAAACCGG AACCGATCTG ACTAGCGAGA CGGATGCGCT GACTTTCACC ACCAGAAAGT10441 GTGCCGGAAG AGCGGTCGAG GCTCAAATAA TCCAGCCCGA CATTATCGAG GAATCCTAGC10501 CTTTCGATAA TCTCTTTCAA AATGCGTTCA GCAATTTGAT TTTGTGCTTC CGTCAGCTTT10561 TCGGGTAACT GTCTGAAAAA TTCCAAAGCT GGCTTGACGG TCATCTTGGT CACATCAGAA10621 ATATTATGAT GGTCAATCAG AACGGCCAAG GCTTCCGGCC TTAATCTAGC ACCATGACAG
10681 ACCTCGCAGG GCGCTGCCGA TTGATAACGT CCAATATCTT CGCGAATGCT TTCGCTATCA10741 GTCGTTACCA GCCGCCTTTC CAAATTGCGG ATCACACCTT CAAAGCCTTT TTCAACCTCA10801 TAAATCTGAT TACCTTCAGA AAAGCGCAAA GGAATAACTT CGCCTTCACT CCCGTAAAGA10861 ATGACATTCT GAATTTTTTC AGGGAGCTTT TTCCAAGGCG TTTCCAACGA GAAATCATAA10921 TAACGCGCCA GACTGGATAA AATCTGCATA TAATAAGGGC TGGGCGGCGT GCTTCTCGCC10981 CAAGGCATCA AAGCCCCCTT CGCCAAAGAA AGGGATTCAT TCGGCACAAT CAACCGCACA11041 TCGAAATAAG GCTTTTCGCC CAACCCATCA CAAGCAGGGC AGGCACCCTG TGGCGCGTTA11101 AAAGAGAAAA GGCGTGGCTC GATTTCAGGA ATGGTAAAAC CTGATACTGG ACAAGAAAAA11161 TGCTCGGAAA AAAGCATCGG CTCGAAACTG CCTTCATCGG CTGGCTCGGA AATCGCAATC11221 CCGCCCGCCA ATTTTAATGC GGTTTCAAGC GATTGCGCCA AACGGGTTTC CAGCCCTTCT11281 TTGATAACCA GACGATCAAC CACAACCTCA ATGTCATGCT TGCGTTTCTT GTCAATTTTG11341 GGTGCTTCTT CGATCAGATA ATATTCACCA TCAATCCGAA GACGTGAAAA GCCCGCTTTC11401 TGCCATTCGG CCATTTCTTT GCGATATTCG CCTTTTCGTC CTCTGACGAC CGGAGCCAAC11461 AAATGCAATC GGCTCCCTTC CGGCAAAGCC ATCACCCGAT CAACCATCTG GCTGACGGTC11521 TGCGCGGTAA TAGGCAATCC TGTTGCCGGA GAATAAGGAA TCCCGACCCG CGCCCATAAC11581 AGCCGCATGT AATCATAAAT CTCGGTGACT GTGGCGACCG TCGAACGCGG ATTTTTGCTG11641 GTCGTTTTCT GTCCGATAGA AATCGCTGGC GATAAACCCT CAATATGATC GACATCCGGC11701 TTTTGCATCA TTTCCAAAAA TTGGCGNGCA TAAGCGGACA GGGATTCGAC ATAACGCCGC11761 TGTCCTTCGG CATAGATAGT ATCAAAAGCG AGGCTGGATT TACCCGACCC CGACAAGCCG11821 GTCATGACGA CAAGTTTATT GCGCGGAATA TCAATCGAAA CATTTTTGAG ATTATGTTCG11881 CGTGCGCCGC GAATAGAAAT AGTCGAAAGC ATAACAGGCA AAAATCCTAT CTTTCAGAAA11941 ATGGGTCTGG TGATGCGGGG CTATCAATCA GGGCGAGGAA AAGAGATGGA TATTCCCCCT12001 TTGTTCTACA AGAGGCTATC CAAAAACGGC AAGGCAAGGG ACTTTGAAAT CGGCAGAAAT12061 GTCATTCTGC TACCGTTCAT AGCCATTATA GCGATAAGCG CCATCCCAGC GATTGGACGG12121 ATATAAAAGC TGCCTATCCA GATGATTATA GCTGTGATTA TAGCGCATAG GATTATGATT12181 ATAGGGATTA TAACGATGGT TATAGCCCAT TGACCCATAG CGCGGCACAT AGCCAGACCA12241 GCCATAATGA CGGATATAGC CGGAATGATC ATAACCTCTG ACATAACCGG ATGAATAACC12301 GTTTCGGATA TATCCCGACC GCCCATAATG GCCATAGTGA TATCCACGGG GATAAGCCAT12361 GACCGCAACC GGAAGCGTCA AGGCAAGAAG CCCTATTCCA GCCCAGAAAA GATTTTTTCC12421 CATAAGATGA CTTCTTCTTT CATAAACAGG CGGCAACAGG CTATTCCAGC CCAGAAAAGA12481 TTTTTTCCCA TAAGATGACT TCTTCTTTCA TAAACAGGCG GCAACAGGCG GCGGCATAGC12541 TGCCATGACA AGACATGGCA GCTATTTTTC CGATAAATCA GGCTGGATCA GAATTCTGCT12601 GAATATAGCG TTCCAATCCC ATCAGCTCGA TCAGATTAAG CTGGGTATTC AGGAAATCGA12661 TATGGGCTTC TTCGGCGATC AAAATTTTGA CGAACAGATC GCGGGATACA AAATCATGCG12721 TTGATTCTGC ATAGGCGATG GCTACTTTCA AATCGCTGAC TGCTTTTCTC TCAAGCCGCA12781 AGTCCGTATT CAAAACCGCA GCACGTCTTC ACTAGCGGTA ATAGCTTCAT AACGCTGCAA12841 GTTAGGCAAG CCGCCAAGAT AAAAAATCCG CTCGATCAAA GCATCGGCAT GGCCTCTTTC
12901 TTCAAGAGAT TCTTCGGATT CTTTTCTGGC AAGAACCGAA ACGGCCCAAT GTTCTAAACT12961 GCGGGCATGG AGAAAATATT GATTGATGAC CGTCAATTCA TTGGTAAGTT GGCGGTTAAG13021 ATGTTCGATT ATTTTAGGAT CTGCGCTCAT TGATGGGTGC CTTTCGCTCT TTAGCTTTTA13081 TTAGCCTAGC ATTAAAACTT TATTATAAAA AAATTAACTT TGCCAATATC ATTATCATAT13141 AAATTCTATC GGAACGGGGC ATTACTGTGT TTATATCCGG CTTCTCTCAA TGATTCCGTC13201 ACACAGCATC GATACAGCGA ACTGGCTGTA ACTGACGTGA AATGTGCGTA ACAACATTTA13261 GAAGCGATTC GTTGCTTTCT CCGGGCGAGA TTTCGCGGCA GCCCTTTACC TGATCTTGTC13321 CGGCGCGAAG GCGAGGGCGG TTTTGCGATT TCGGCCAAAC TGCATCCACT GGAATCCTCA13381 GGCCGAATTG ATCCCGTAAC CATTGGTATC GGGCTTGCAC CTCGGGCATC CTCGCGTCAG13441 GTGCGCGTTA ATGGCGTGAC GACTTCGGCT AATGCCTTAT CGGAATGGCT GGCGATATTA13501 TGGCTTACCC CTGCAATGGA CAGATTGTAT CAGGAAGGTG CTTCTTCGCG CCGCCGTTTT13561 CTAGATCGGC TGACATTGAC GATTTTTCCG TCTCATGCCC GACATTACAG CCGTTATGAA13621 GCAGCGATGC GACAACGGAA CAAGCTGCTT TCCGATGAAA AAGGCTATGA TCCTCTTTGG13681 TTAGACGGCT TGGAACAGAT TATGGCGGAA CAGGCGACCC ATATTCTTTT GGCACGGCGG13741 CAGCTTGTCG ATTTACTATC CGAAGAAATT GCCAAACAGG AAGACGGCCT TTTCGCCAAA13801 GCGGATC
权利要求
1.编码乙醇脱氢酶II的DNA序列,如SEQ ID NO1所示。
2.一种重组质粒,含有SEQ ID NO2所示的DNA序列。
3.权利要求1所述的DNA序列的制备方法,包括构建运动发酵单胞菌基因组文库、克隆参与发酵的功能基因。
4.权利要求3所述的制备方法,所述构建基因组文库的方法是CTAB法,即提取运动发酵单胞菌XW101的总DNA,用限制性内切酶Sau3AI部分酶切总DNA,将酶切的合适片段连接到载体pLA2917上,连接产物电击转化到宿主大肠杆菌JM109中,在含有抗生素的LB平板上筛选含有重组质粒的菌株。
5.权利要求3所述的制备方法,所述克隆发酵功能基因的方法是,在已构建好的基因组文库中通过菌落原位杂交方法得到含有发酵基因重组质粒的菌落,将得到的重组质粒测序,分析出能翻译有功能蛋白的框架,进而得到所需基因。
6.权利要求1所述的DNA用于制备运动发酵单胞菌工程菌的用途。
7.一种运动发酵单胞菌工程菌,包含有权利要求1所述的DNA。
8.权利要求7所述的运动发酵单胞菌工程菌生产乙醇的用途。
9.一种生产乙醇的方法,其特征是用权利要求7所述的运动发酵单胞菌工程菌发酵。
全文摘要
本发明构建了运动发酵单胞菌XW101的质粒基因文库,然后以乙醇脱氢酶II基因的部分序列为探针,从上述基因文库中筛选和克隆编码乙醇脱氢酶II酶的基因,连接到广寄主范围的穿梭质粒载体上,然后导入到野生型运动发酵单胞菌或大肠杆菌中。所克隆的乙醇脱氢酶II的编码基因序列如SEQ ID NO1所示。将所述乙醇脱氢酶II的编码基因导入到野生型运动发酵单胞菌后,可显著提高乙醇的发酵速度及产率。
文档编号C12N15/09GK1600862SQ0315751
公开日2005年3月30日 申请日期2003年9月23日 优先权日2003年9月23日
发明者徐玉泉, 武志强, 张维, 于晓瑾, 李红权, 林敏 申请人:中国农业科学院生物技术研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1