多核苷酸文库的重组酶介导的整合的制作方法

文档序号:11109474阅读:1380来源:国知局
多核苷酸文库的重组酶介导的整合的制造方法与工艺

本申请包括计算机可读形式的序列表,将其通过引用结合在此。

发明领域

本发明涉及用于使用位点特异性重组酶将感兴趣的多核苷酸文库整合到丝状真菌宿主细胞的染色体中的方法,包括宿主细胞和多核苷酸构建体的多核苷酸文库表达系统,连同包含多核苷酸文库的所得丝状真菌宿主细胞及其培养物以生产多肽。

发明背景

已经发现大量的天然存在的有机体产生有用的多肽产物,例如酶,希望酶的大规模生产用于研究和商业目的。

已经描述了宿主细胞的构建,其中,一个高表达染色体基因被替换为位点特异性重组酶的识别序列,以通过使用重组酶识别所述序列(EP 1 405 908 A1;ProBioGen AG)允许将单一产物编码多核苷酸后续插入该位点。

已经披露通过利用自由可逆的位点特异性重组系统在基因组的已知位置插入DNA。这些可逆系统包括以下项:来自细菌噬菌体P1的Cre-lox系统;酿酒酵母的FLP-FRT系统;鲁氏结合酵母(Zygosaccharonzyces rouxii)的R-RS系统;来自细菌噬菌体Mu的改良的Gin-gix系统;来自枯草芽孢杆菌质粒的β-重组酶-six系统和来自细菌转座子Tn1000的Δ-γ-res系统。Cre、FLP、R、Gin、β-重组酶和γ-Δ是重组酶,并且lox、FRT、RS、gix、six和res是各自的重组位点(赛杜斯路(Sadowslu)1993年,美国实验生物学会联合会会志(FASEB J.)7:750-67;奥(Ow)和梅德贝里(Medberry)1995年,植物科学评论(Crit.Rev.Plant Sci.)14:239-261作了综述)。

以上位点特异性重组系统的共同之处在于单一多肽重组酶催化相同或几乎相同的序列的两个识别位点之间的重组的属性。

当克隆和筛选编码真菌宿主细胞中的感兴趣的多肽的多核苷酸时,尤其是当筛选编码真菌宿主细胞分泌的感兴趣的多肽的变体的多核苷酸文库以改进特性时,希望真菌宿主细胞以可比较的水平表达多核苷酸,这样使得它们的特性可以被直接测定,而不必首先进行归一化步骤。这个问题通过使用包括真菌复制起始序列(例如,熟知的AMA1序列)的克隆和表达载体已被解决,例如,在EP 1124949中。

发明概述

我们在此提供快速并且位点特异性将编码感兴趣的多肽的多核苷酸文库插入丝状真菌宿主的染色体中的有效方式,由于所插入的基因在每个转化和选择的宿主细胞的精确相同的基因组位置的仅一个单独的拷贝中的存在,从而实现转化体中高度一致的表达水平。

所得选择转化的细胞甚至可以直接用于以对应于初步筛选的那些的改进的高级表达水平生产编码选择的多肽。

因此,在第一方面,本发明涉及用于使用位点特异性重组酶将感兴趣的多核苷酸文库整合到丝状真菌宿主细胞的染色体中的方法,所述方法包括以下步骤:

a)提供丝状真菌宿主细胞,它按以下顺序在其染色体中包含:

i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;

ii)第一选择标记;

iii)该重组酶的第二识别序列;以及任选地

iv)非功能部分第二选择标记;

b)用核酸构建体转化所述宿主细胞,该核酸构建体按以下顺序包含:

i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;

ii)感兴趣的多核苷酸文库;

iii)第二选择标记或非功能部分第二选择标记,如果步骤(a)(iv)的相应但任选的非功能第二选择标记被包括在宿主细胞染色体中的话;和

iv)该重组酶的第二识别序列;

c)在所述宿主细胞中表达编码该位点特异性重组酶的基因;和

d)选择转化的宿主细胞,该宿主细胞表达该第二选择标记,而不是该第一选择标记,

其中这一感兴趣的多核苷酸文库是通过该重组酶位点特异性地以正确的方向整合到该宿主细胞的染色体中,由此,从该染色体切离该第一可选择标记,并且由此任何非功能部分第二可选择标记被重组,以形成该染色体中的功能第二选择标记。

在第二方面,本发明涉及多核苷酸文库表达系统,包括:

a)丝状真菌宿主细胞,它按以下顺序在其染色体中包含:

i)位点特异性重组酶的第一识别序列或在整合位点的5’或3’的区域;

ii)第一选择标记;

iii)该重组酶的第二识别序列;以及任选地

iv)非功能部分第二选择标记;和

b)核酸构建体,该核酸构建体按顺序在以下元件中包含:

i)该重组酶的第一识别序列或在整合位点的5’或3’的区域;

ii)感兴趣的多核苷酸文库;

iii)第二选择标记或非功能部分第二选择标记,如果步骤(a)(iv)的任选的非功能第二选择标记被包括在宿主细胞染色体中的话;和

iv)该重组酶的第二识别序列,和

c)编码位点特异性重组酶的基因包括在丝状真菌宿主细胞中;优选地在染色体中,在第二核酸构建体中,或在步骤(b)中列出的元件之外的核酸构建体中;

其中,当用这一个或多个核酸构建体转化宿主细胞时,感兴趣的多核苷酸文库是通过重组酶位点特异性地以正确的方向整合到宿主细胞的染色体中,由此,从染色体切离第一可选择标记,并由此第二选择标记也被整合并且表达或任何非功能部分第二可选择标记被重组,以形成表达的染色体中的功能第二选择标记。

在第三方面,本发明涉及所得丝状真菌宿主细胞,它按以下顺序在其染色体中包含:

i)位点特异性重组酶的第一识别序列或在整合位点的5’或3’的区域;

ii)感兴趣的多核苷酸文库;和

iii)选择标记和该重组酶的第二识别序列;抑或

iv)第一部分选择标记,该重组酶的第二识别序列和第二部分选择标记,

其中该宿主细胞表达该多核苷酸文库和选择标记。

在最后方面,本发明涉及产生感兴趣的多肽的方法,该方法包括以下步骤:

a)在有利于产生由多核苷酸文库编码的多肽的条件下,培养第三方面的丝状真菌宿主细胞,并且;任选地

b)回收该多肽。

附图简要说明

图1示出载体p002的示意图。

图2示出载体pFRT-GIAMG的示意图。

图3示出载体p007的示意图。

图4示出载体pFRT-BsAMG的示意图。

图5示出载体pDAu571的示意图。

图6示出载体pDAu703的示意图。

图7示出以下项的示意图:

-顶端部分:在米曲霉宿主菌株DAu716中的染色体的amy2区域,其中两个FRT-位点已被插入;

-中间部分:线性化的载体pDAu724;和

-底部部分:通过各自的FRT-位点之间的双同源重组的pDAu724的FLP介导的整合后,米曲霉宿主菌株DAu716中的染色体的amy2区域。

图8示出载体pDLHD0075的示意图。

图9示出质粒pJfyS156的限制性图谱。

图10示出pQM43的限制性图谱。

图11示出pQM45的限制性图谱。

定义

胞嘧啶脱氨酶:胞嘧啶脱氨酶(EC 3.5.4.1)催化胞嘧啶和5-氟胞嘧啶(5FC)的脱氨以分别形成尿嘧啶和有毒5-氟尿嘧啶(5FU)。当包含胞嘧啶脱氨酶的遗传修饰过的细胞与5FC组合时,它被转化为有毒5FU,因此胞嘧啶脱氨酶编码基因潜在地是有效的阴性选择标记。也已示出,嘧啶从头(de novo)合成途径中的抑制剂可以用于创造如下条件,在该条件下细胞依赖于通过胞嘧啶脱氨酶进行的嘧啶补充物到尿嘧啶的转化。因此,只有表达胞嘧啶脱氨酶基因的细胞可以在阳性选择介质中被解救,该阳性选择介质包括嘧啶从头合成抑制剂连同肌苷和胞嘧啶(参见魏(Wei)和休伯(Huber),1996,生物化学杂志(J Biol Chem)271(7):3812的图1)。抑制剂优选N-(磷酸乙酰)-L-天冬氨酸(PALA),它抑制天冬氨酸氨基甲酰转移酶。如果需要的话,胞嘧啶脱氨酶的活性可以通过基因测定进行定量(弗雷德里科(Frederico)L.A.等人,1990,生物化学(Biochemistry)29:2532-2537)。

等位基因变体:术语“等位基因变体”意指占用同一染色体基因座的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生,并且可以导致群体内多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

催化结构域:术语“催化结构域”意思指酶的包含该酶的催化机器的区域。

cDNA:术语“cDNA”意指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。

编码序列:术语“编码序列”意指直接指定一个多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框架决定,该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。

控制序列:术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。

表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。

表达载体:术语“表达载体”意直链性或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列连接。

片段:术语“片段”是指从成熟多肽或结构域的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的一种多肽或一个催化或结合结构域;其中该片段已经保留其催化或结合活性。

宿主细胞:术语“宿主细胞”意指易于用包括本发明的一种多核苷酸的一种核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。

改进的特性:术语“改进的特性”意指与变体相关的与亲本相比得到改进的特征。在本发明中,改进的特性是相对于亲本,变体的增加的表达产量。

增加的表达产量:术语“增加的表达产量”意指相对于在相同的培养条件下,培养每升表达亲本基因的相同的宿主细胞产生的分泌的活性酶的量(g),来自培养每升表达变体基因的宿主细胞的培养基的分泌的酶的更高量(g)。在一方面,与亲本酶相比,变体具有至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加的表达产量。

分离的:术语“分离的”意指处于非天然存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然发生的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然发生的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及比与编码该物质的基因天然相关联的启动子更强的启动子的使用)而修饰的任何物质。

成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。本领域已知,宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。

成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有催化或结合活性的成熟多肽的多核苷酸。

核酸构建体:术语“核酸构建体”意指单链-或双-链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成包含核酸的区段,或是合成的,该核酸分子包括一个或多个控制序列。

可操作地连接:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置,从而使得该控制序列指导该编码序列的表达。

序列一致性:用参数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。所使用的参数是空位开放罚分10、空位延伸罚分0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的:

(一致的残基X 100)/(比对长度-比对中的空位总数)

出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,同上)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的:

(一致的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)

子序列:术语“子序列”是指具有从成熟多肽编码序列的5’和/或3’端缺失的一个或多个(例如,若干个)核苷酸的多核苷酸;其中该子序列编码具有催化或结合活性的片段。

变体:术语“变体”意指在一个或多个(例如,若干个)位置处包括改变(即,取代、插入和/或缺失)的具有催化或结合活性的一个多肽。取代意指用一个不同氨基酸置换占用一个位置的氨基酸;缺失意指去除占据一个位置的氨基酸;并且插入意指在邻接并且紧随占据位置的氨基酸之后添加氨基酸。保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及蛋氨酸)。通常不改变比活性的氨基酸置换是本领域已知的并且例如由H.诺伊拉特(H.Neurath)和R.L.希尔(R.L.Hill),1979,在蛋白质(The Proteins),学术出版社(Academic Press),纽约(New York)中进行描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、以及Asp/Gly。可替代地,氨基酸变化是这样一种性质,使得多肽的理化性质被改变。例如,氨基酸改变可以改进多肽的热稳定性、改变底物特异性、改变最适pH等。可以根据本领域已知的方法,如定点诱变或丙氨酸扫描诱变鉴定多肽中的必需氨基酸(康宁汉(Cunningham)和韦尔斯(Wells),1989,科学(Science)244:1081-1085)。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且对所得突变体分子的活性进行测试以鉴定对于该分子的活性至关重要的氨基酸残基。还参见希尔顿(Hilton)等人,1996,生物化学杂志(J.Biol.Chem.)271:4699-4708。也可结合假定接触位点氨基酸的突变,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记进行确定的对结构进行物理学分析,从而确定酶的活性位点或其他生物学相互作用。参见,例如德·沃斯(de Vos)等人,1992,科学(Science)255:306-312;史密斯(Smith)等人,1992,分子生物学杂志(J.Mol.Biol.)224:899-904;沃达维尔(Wlodaver)等人,1992,欧洲生物化学学会联盟通讯(FEBS Lett.)309:59-64。还可以从与相关多肽的比对推断鉴定必需氨基酸。可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,罗曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向诱变(德比舍尔(Derbyshire)等人,1986,基因(Gene)46:145;内尔(Ner)等人,1988,DNA 7:127)。

诱变/改组方法可以与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的诱变多肽的活性(奈斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。

发明详述

本发明涉及用于使用位点特异性重组酶将感兴趣的多核苷酸文库整合到丝状真菌宿主细胞的染色体中的方法,包括宿主细胞和多核苷酸构建体的多核苷酸文库表达系统,连同包含多核苷酸文库的所得丝状真菌宿主细胞及其培养物以生产多肽。

在本发明的一个优选实施例中,多核苷酸文库是包含编码感兴趣的多肽的变体的多核苷酸的基因文库;优选地,这一感兴趣的多肽是一种酶;更优选地,这一感兴趣的多肽是一种水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶、或β-木糖苷酶。

在另一个优选实施例中,多核苷酸文库包含控制序列的文库,例如,启动子,前导肽区,分泌信号或终止子的文库。

优选的是,本发明的丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞;优选地,该宿主细胞是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

在本发明的一个优选实施例中,位点特异性重组酶是酿酒酵母2μm翻转酶FLP,噬菌体TP901-1整合酶,细菌噬菌体P1CRE整合酶,细菌XerC重组酶,细菌XerD重组酶,λ噬菌体整合酶或HP1整合酶;优选地,该位点特异性重组酶是酿酒酵母2μm翻转酶FLP。

两个独立的策略可以应用于确保在宿主细胞的染色体中的染色体整合发生在正确的方向。如果使用相同的第一和第二识别序列,则该整合有可能在两个方向发生,但是第二选择标记可以被定制,这样使得仅正确整合的片段导致第二选择标记的表达。另一方面,使用不同的第一和第二识别序列也是一个选项,例如FRT-F和FRT-F3,为了确保该片段被整合在一个特定的方向。本发明的一个方面涉及使用体内同源重组,该体内同源重组在转化到宿主细胞的核酸构建体的区域,以及在与位点特异性重组酶识别序列组合的染色体中预期整合位点的5’或3’区域之间,以确保感兴趣的多核苷酸文库是经由与受重组酶影响的位点特异性重组组合的体内同源重组,以特定方向整合到染色体中。

因此,优选的是,重组酶的第一和第二识别序列是相同的或不同的;优选地,该重组酶的第一和第二识别序列是不同的,以影响在宿主细胞染色体中这一感兴趣的多核苷酸文库的定向整合。优选地,重组酶的第一和第二识别序列是酿酒酵母2μm翻转酶FLP的不同的识别序列,以影响在宿主细胞染色体中感兴趣的多核苷酸文库的定向整合;优选地,该重组酶的第一和第二识别序列分别是FRT-F(SEQ ID NO:27)和FRT-F3(SEQ ID NO:28),或反之亦然。

另一方面,还优选地是,一个非功能部分第二选择标记被包括在步骤(a)中第一方面的宿主细胞中,并且另一个非功能部分第二选择标记被包括在步骤(b)中第一方面的核酸构建体中,其中当感兴趣的多核苷酸文库经由其识别序列通过重组酶位点特异性地以正确的方向整合到宿主细胞的染色体中时,部分第二选择标记被重组以形成功能第二选择标记;优选地,一个非功能部分第二选择标记包含编码选择标记的多核苷酸的启动子和任选地一个或多个完整5’外显子,并且另一个非功能部分第二选择标记包含选择标记的剩余编码序列。

在本发明的第二方面的优选实施例中,一个非功能部分第二选择标记被包括在宿主细胞中并且另一非功能部分第二选择标记被包括在核酸构建体中,其中当感兴趣的多核苷酸文库经由其识别序列通过重组酶位点特异性地以正确的方向整合到宿主细胞的染色体中时,部分第二选择标记被重组以形成功能第二选择标记;优选地,一个非功能部分第二选择标记包含编码选择标记的多核苷酸的启动子和任选地一个或多个完整5’外显子,并且其中另一个非功能部分第二选择标记包含选择标记的剩余编码序列。

在第二方面的优选实施例中,丝状真菌宿主细胞被转化。

在第三方面的优选实施例中,重组酶的第一和第二识别序列是相同的或不同的;优选地,该重组酶的第一和第二识别序列是不同的。

在第三方面的另一个优选实施例中,重组酶的第一和第二识序列是酿酒酵母的2μm翻转酶FLP的不同的识别序列;优选地,该重组酶的第一和第二识别序列分别是FRT-F(SEQ ID NO:27)和FRT-F3(SEQ ID NO:28),或反之亦然。

在另一个优选实施例中,在整合位点的5’或3’的区域,即,整合位点的侧翼5’或3’,与第二识别序列一起使用,以影响在整合位点的感兴趣的多核苷酸文库的定向整合。

在第三方面的一个最后优选实施例中,重组酶的第二识别序列位于将第一部分选择标记与第二部分选择标记分开的内含子中,如在图7中所概述。

具有酶活性的多肽的来源

本发明的具有酶活性的多肽可以从任何属的微生物中获得。出于本发明的目的,如在此结合给定的来源使用的术语“从…中获得”应意指由多核苷酸编码的多肽是由该来源或者由其中已经插入来自该来源的多核苷酸的菌株产生的。在一方面,从给定来源中获得的多肽被分泌到细胞外。

该多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,如具有[酶]活性的芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、土芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)或链霉菌属(Streptomyces)多肽;或革兰氏阴性细菌多肽,如弯曲杆菌属(Campylobacter)、大肠杆菌(E.coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)或脲原体属(Ureaplasma)多肽。

在一方面,该多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚硬芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。

在另一方面,该多肽是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)、或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。

在另一方面,该多肽是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)、或浅青紫链霉菌(Streptomyces lividans)多肽。

该多肽可以是一种真菌多肽。例如,该多肽可以是酵母多肽,如假丝酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母、或耶氏酵母属多肽;或丝状真菌多肽,例如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、乳白蚁属(Coptotermes)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、线黑粉酵母属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、香菇属(Lentinula)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、黑果菌属(Melanocarpus)、亚灰树花菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉菌属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。

在另一方面,该多肽是卡氏酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酶母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)多肽。

在另一方面,该多肽是解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporium keratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、毡金孢子菌(Chrysosporium pannicola)、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、带纹金孢子菌(Chrysosporium zonatum)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢菌(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢菌(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟枝孢镰孢菌(Fusarium sporotrichioides)、硫色镰孢菌(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢菌(Fusarium trichothecioides)、镶片镰孢菌(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、白囊耙齿菌(Irpex lacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、绳状青霉菌(Penicillium funiculosum)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、无色梭孢壳(Thielavia achromatica)、成层梭孢壳菌(Thielavia albomyces)、白毛梭孢壳(Thielavia albopilosa)、澳洲梭孢壳(Thielavia australeinsis)、粪梭孢壳(Thielavia fimeti)、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、秘鲁梭孢壳(Thielavia peruviana)、毛梭孢壳(Thielavia setosa)、瘤孢梭孢壳(Thielavia spededonium)、耐热梭孢壳(Thielavia subthermophila)、土生梭孢壳(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)多肽。

将理解的是,对于以上提到的物种而言,本发明涵盖完全状态和不完全状态(perfect and imperfect states)二者、以及其他分类学等效物,例如无性型,而不管它们已知的物种名称是什么。本领域普通技术人员将容易地识别适当等效物的身份。

这些物种的菌株可以容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(NRRL)。

可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等等)获得的DNA样品鉴定和获得该多肽。用于从自然生活环境中直接分离微生物和DNA的技术是本领域熟知的。然后可以通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用探针检测到编码多肽的多核苷酸,则可以通过利用本领域普通技术人员所知的技术分离或克隆多核苷酸(参见,例如萨姆布鲁克(Sambrook)等人,1989,上文)。

核酸构建体

本发明还涉及包含与一个或多个控制序列可操作地连接的本发明多核苷酸的核酸构建体,其中所述控制序列指导编码序列在适合的宿主细胞中在与所述控制序列相容的条件下的表达。

可以用许多方式操作所述多核苷酸以便于多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操纵可以是令人希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

该控制序列可以是启动子,即,被宿主细胞识别以对编码本发明的多肽的多核苷酸进行表达的多核苷酸。启动子包含介导多肽表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变、截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。

在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的适合启动子的实例是获得自以下各项的基因的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶–样蛋白酶(WO 96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(达莉亚)(WO 00/56900)、镶片镰孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导子替换未翻译的前导子;非限制性实例包括来自编码中性α-淀粉酶的黑曲霉基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的构巢曲霉或米曲霉基因的未翻译的前导子替换未翻译的前导子);及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。

控制序列还可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3’-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。

用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。

该控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定子区域,它增加该基因的表达。

该控制序列还可以是前导子,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导子可操作地连接到编码该多肽的多核苷酸的5’-末端。可以使用在宿主细胞中起作用的任何前导子。

用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。

控制序列还可以是聚腺苷酸化序列,可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将聚腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因中获得的:构巢曲霉邻氨基苯甲酸合成酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖镰孢胰蛋白酶样蛋白酶。

控制序列也可以是编码信号肽的信号肽编码区,其中所述信号肽与多肽的N-末端连接并且指导多肽进入细胞的分泌途径。多核苷酸的编码序列的5’-末端可以内在地包含在翻译阅读框中与编码多肽的编码序列的区段天然连接的信号肽编码序列。可替代地,编码序列的5’-末端可以包含相对于编码序列为外来的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外来信号肽编码序列。可替代地,外来信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。

用于丝状真菌宿主细胞的有效信号肽编码序列是从黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶的基因获得的信号肽编码序列。

控制序列也可以是编码位于多肽N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉角质酶和酿酒酵母α-因子的基因获得前肽或前肽原编码序列。

在信号肽和前肽序列两者都在的情况下,将前肽序列紧邻多肽的N-末端定位并且将信号肽序列紧邻前肽序列的N-末端定位。

也可能令人希望的是添加调节序列,所述调节序列调节相对于宿主细胞的生长的多肽的表达。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列可操作地连接。

多核苷酸构建体

本发明还涉及包括本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组多核苷酸构建体或表达载体。不同的核苷酸和控制序列可以连接在一起以产生一个重组表达载体,这一重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该变体的多核苷酸。可替代地,该多核苷酸可以通过将该多核苷酸或包括该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。

重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是一种线性的或闭合的环状质粒。

载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可包含任何用以保证自我复制的要素。可替代地,该载体可以是这样载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入到宿主细胞的基因组中的总DNA)或转座子。

该载体优选包含一个或多个允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。

用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶),连同其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。在木霉属细胞中优选使用的是adeA、adeB、amdS、hph以及pyrG基因。

选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统。在一方面中,双选择性标记是hph-tk双选择性标记系统。

载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一个方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。

对于自主复制,载体可以进一步包含使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点(origin of replication)”或“质粒复制子(plasmid replicator)”意指使得质粒或载体可在体内复制的多核苷酸。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO 00/24883中的方法完成。

可以将本发明的多核苷酸的多于一个拷贝插入宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。

用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,同上)。

宿主细胞

本发明还涉及重组宿主细胞,这些宿主细胞包含可操作地连接到一个或多个控制序列的本发明的多核苷酸,这些控制序列指导本发明的多肽的产生。将包含多核苷酸的构建体或载体引入宿主细胞中,从而该构建体或载体被维持为染色体整合体。

术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。

宿主细胞可以是真菌细胞。如在此所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如霍克斯沃思(Hawksworth)等人定义,引自:安斯沃斯(Ainsworth)和比斯比(Bisby)的真菌大词典(Dictionary of The Fungi),第8版,1995,国际CAB,大学出版社(University Press),剑桥(Cambridge),英国)。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如霍克斯沃思等人,1995,上文定义)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。

丝状真菌宿主细胞可以是枝顶孢霉属细胞、曲霉属细胞、金担子菌属细胞、烟管菌属(Bjerkandera)细胞、拟蜡菌属细胞、金孢属细胞、鬼伞属细胞、革盖菌属(Coriolus)细胞、隐球菌属细胞、绒黑粉类酵母细胞、镰刀菌属细胞、腐质霉属细胞、巨座壳属细胞、毛霉属细胞、毁丝霉属细胞、新美鞭菌属细胞、脉孢菌属细胞、拟青霉属细胞、青霉属细胞、平革菌属细胞、射脉菌属(Phlebia)细胞、梨囊鞭菌属细胞、侧耳属细胞、裂褶菌属细胞、蓝状菌属细胞、嗜热子囊菌细胞、梭孢壳属细胞、弯颈霉属细胞、栓菌属(Trametes)细胞或木霉属细胞。

例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

可以通过涉及原生质体形成、原生质体转化、以及以本身已知的方式进行细胞壁再生的过程来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法在马拉迪耶(Malardier)等人,1989,基因(Gene)78:147-156和WO 96/00787中描述。

生产方法

本发明还涉及产生感兴趣的多肽的方法,包括以下步骤:a)在有益于产生多核苷酸文库编码的多肽的条件下培养第三方面的丝状真菌宿主细胞,并且;任选地,b)回收该多肽。

这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的一种营养培养基中培养的。例如,可以通过在适合的培养基中和在允许表达和/或分离该多肽的条件下,进行摇瓶培养,或者在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续、分批、分批补料、或固态发酵)来培养细胞。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包括碳和氮来源及无机盐。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽分泌到该营养培养基中,那么可直接从培养基中回收多肽。如果多肽不被分泌,那么其可从细胞裂解液中进行回收。

可以使用特异性针对这些多肽的本领域已知的方法来检测该多肽。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定该多肽的活性。

可以使用本领域已知的方法来回收多肽。例如,该多肽可以通过常规程序,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从该营养培养基回收。在一方面,回收包含该多肽的发酵液。

可以通过本领域已知的多种方法纯化多肽,所述方法包括但不限于色谱(例如,离子交换色谱法、亲和色谱法、疏水色谱法、聚焦色谱法和大小排阻色谱法)、电泳方法(例如,制备性等电聚焦)、差异性溶解(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,蛋白质纯化(Protein Purification),编者詹森(Janson)和赖登(Ryden),VCH出版公司,纽约,1989),以便获得基本上纯的多肽。

在替代性方面,不回收多肽,而是使用表达该多肽的本发明宿主细胞作为多肽的来源。

通过以下实例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。

实例

分子克隆技术描述于萨姆布鲁克(Sambrook),J.,弗里奇(Fritsch),E.F.,马尼亚蒂斯(Maniatis),T.30(1989)分子克隆实验手册(Molecular cloning:a laboratory manual)(第2版)冷泉港实验室(Cold Spring Harbor Laboratory),冷泉港(Cold Spring Harbor),纽约。

用于DNA操作的酶(例如限制性内切核酸酶,连接酶等)从新英格兰生物学实验室有限公司(New England Biolabs,Inc.)获得,并可根据制造商的说明书使用。

培养基和试剂

除非另外说明,使用以下培养基质和试剂;用于缓冲液和底物的化学品是分析等级的商品:

-Cove:342.3g/L蔗糖、20ml/L COVE盐溶液、10mM乙酰胺、30g/L诺布尔(noble)琼脂。

-Cove顶层琼脂:342.3g/L蔗糖、20ml/L COVE盐溶液、10mM乙酰胺、10g/L低熔点琼脂糖。

-Cove-N平板由以下构成:30g蔗糖、20ml Cove盐溶液、3g NaNO3和30g诺布尔琼脂,并且水补足至1升。

-COVE盐溶液由以下构成:26g KCl、26g MgSO4·7H2O、76g KH2PO4和50ml Cove痕量金属,并且水补足至1升。

-用于COVE的痕量金属溶液由以下构成:0.04g NaB4O7 10H2O、0.4g的CuSO4 5H2O、1.2g的FeSO4 7H2O、1.0g MnSO4H2O、0.8g中性淀粉酶II MoO22H2O和10.0g ZnSO4 7H2O,并且水补足至1升。

-1/4YPM由以下构成:2.5g酵母提取物、5g蛋白胨和5g麦芽糖(pH4.5),并且水补足至1升。

-STC缓冲液由以下构成:0.8M山梨糖醇、25mM Tris(pH 8)、和25mM CaCl2,并且水补足至1升。

-STPC缓冲液由以下构成:在STC缓冲液中的40%PEG4000。

-MLC由以下构成:40g葡萄糖、50g大豆粉、4g/柠檬酸(pH5.0),并且水补足至1升。

-纤维素酶诱导培养基(CIM)由以下构成:20g的纤维素、10g的玉米浆固体、1.45g的(NH4)2SO4、2.08g的KH2PO4、0.28g的CaCl2、0.42g的MgSO4·7H2O、0.42ml的木霉痕量金属溶液、1-2滴消泡剂、并且去离子水补足至1升;pH调节至6.0。

-COVE平板由以下各项构成:342.3g的蔗糖、20ml的COVE盐溶液、10ml的1M乙酰胺、10ml的1.5M CsCl、25g的诺布尔琼脂(Difco)、并且去离子水补足至1升。

-COVE盐溶液由以下构成:26g的KCl、26g的MgSO4·7H2O、76g的KH2PO4、50ml的COVE痕量金属溶液、并且去离子水补足至1升。

-COVE痕量金属溶液由以下构成:0.04g的NaB4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO2·2H2O、10g的ZnSO4·7H2O、并且去离子水补足至1升。

-LB+Amp培养基由以下各项构成:10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、并且去离子水补足至1升。在高压灭菌之后,添加在水中的1ml的100mg/ml的氨苄青霉素溶液。

-PDA平板由以下各项构成:39g的马铃薯右旋糖琼脂(Difco),并且去离子水补足至1升。

-PEG缓冲液由以下构成:500g的聚乙二醇4000(PEG 4000)、10mM CaCl2、10mM Tris-HCl pH 7.5,并且去离子水补足至1升;过滤除菌。

-SOC培养基由以下构成:0.5g的NaCl、5g的酵母提取物、20g的胰蛋白胨、10ml的250mM KCl、并且去离子水补足至1升。

-STC由以下构成:1M山梨醇、10mM CaCl2、以及10mM Tris-HCl,pH 7.5,过滤除菌。

-TAE缓冲液由以下各项构成:4.84g的Tris碱、1.14ml的冰醋酸、2ml的0.5M EDTA(pH 8)、并且去离子水补足至1升。

-木霉基本培养基(TrMM)平板(用于亚培养)由以下构成:30g蔗糖、20ml COVE盐溶液、0.6g的CaCl2.2H2O、6g的(NH4)2SO4、25g的诺布尔琼脂、并且去离子水补足至1升。

-木霉痕量金属溶液由以下构成:216g的FeCl3·6H2O、58g的ZnSO4·7H2O、27g的MnSO4·H2O、10g的CuSO4·5H2O、2.4g的H3BO3、336g的柠檬酸、并且去离子水补足至1升。

-YP培养基由以下各项构成:10g的酵母提取物、20g的细菌蛋白胨、并且去离子水补足至1升。

-2XYT加氨比西林平板由以下各项构成:16g的胰蛋白胨、10g的酵母提取物、5g的氯化钠、15g的细菌用琼脂(Bacto agar)并且去离子水补足至1升。在高压蒸汽处理的培养基回火到55℃后,添加1ml的100mg/ml的氨比西林。

采购的材料和菌株

使用大肠杆菌DH5-α(东洋公司(Toyobo))用于质粒构建和扩增。使用凯杰质粒试剂盒(Qiagen Plasmid Kit)(凯杰公司)来回收扩增的质粒。使用DNA连接试剂盒(宝生物公司(TAKARA))或T4DNA连接酶(宝灵曼公司(BOEHRINGER MANNHEIM))来进行连接。QIAQUICKTM凝胶提取试剂盒(凯杰公司)被用于纯化PCR片段并从琼脂糖凝胶中提取DNA片段。

克隆试剂盒和大肠杆菌细胞(Fusion-Blue)被用于构建pDAu571表达载体连同pDAu703。PCR扩增使用高保真DNA聚合酶进行。

表达宿主菌株黑曲霉NN059095通过诺维信分离并且是从土壤中分离的黑曲霉NN049184的衍生物。NN059095经遗传修饰以破坏淀粉葡糖苷酶活性的表达。

里氏木霉菌株981-O-8(D4)是里氏木霉RutC30(ATCC 56765;蒙特尼考特(Montenecourt)和伊夫利(Eveleigh),1979,化学进展丛书(Adv.Chem.Ser.)181:289-301的一种诱变菌株。

里氏木霉菌株AgJg115-104-7B1(WO 2011/075677)是里氏木霉菌株981-O-8(D4)的ku70-衍生物。

曲霉的转化

曲霉属物种的转化可使用用于酵母转化的一般熟知的方法实现。将黑曲霉宿主菌株接种至100ml的补充有10mM尿苷的YPG培养基上,并且在32℃下在80rpm下孵育16hr。将球粒进行收集并且用0.6M KCl洗涤,并且将其再悬浮于包含商业葡聚糖酶产品(GLUCANEXTM,诺维信公司(Novozymes A/S),鲍斯韦(Bagsvaerd),丹麦)的20ml 0.6M KCl(终浓度为20mg/ml)中。将悬浮液在32℃下伴随振荡(80rpm)孵育直到形成原生质体,并且然后用STC缓冲液洗涤两次。将这些原生质体用血细胞计数器计数,并且在STC:STPC:DMSO的8:2:0.1溶液中再悬浮并且调整至2.5x 107个原生质体/ml的终浓度。

将大约4pg的质粒DNA添加至100pl的原生质体悬浮液中,轻轻混合,并且冰上孵育30分钟。添加1ml的SPTC,并且将原生质体悬浮液在37℃下孵育20分钟。在添加10ml的50℃Cove顶层琼脂糖之后,将反应液倾例于Cove琼脂平板上,并且将平板于32℃下孵育5天。

PCR扩增

5x PCR缓冲液(包含MgCl2)20μl

2.5mM dNTP混合物10μl

正向引物(100pM)1μl

反向引物(100pM)1μl

扩展高保真聚合酶(罗氏公司(Roche))1μl

模板DNA(50-100ng/pl)1μl

蒸馏水补足至100μl

PCR条件:

1.94℃,2min

2.94℃,0.5min

3.55℃,0.5min

4.72℃,1-2min

2-4.30个循环

5.72℃,10min

用于酶产生的MTP培养:

将曲霉文库的孢子接种于96深孔板的0.5-1ml的1/4YPM培养基中,并在600rpm,30℃下培养2-3天。

Southern杂交

将所选择的转化体的菌丝体从在100ml YPG培养基中的过夜培养物中收获,用蒸馏水冲洗,干燥并且冷冻在-80℃下。将研磨的菌丝体用蛋白酶K和RNA酶A在65℃下孵育1小时。将基因组DNA通过苯酚/CHCl3萃取两次进行回收,随后进行EtOH沉淀并且在蒸馏水中再悬浮。

遵循制造商的说明书,使用PCR DIG探针合成试剂盒(罗氏应用科学公司(Roche Applied Science),印第安纳州,印第安纳波利斯(Indianapolis,IN))合成非放射性探针。根据制造商的说明书,使用QIAQUICKTM凝胶提取试剂盒(凯杰公司,巴伦西亚,加利福尼亚州)将DIG标记的探针进行凝胶纯化。

将5微克的基因组DNA用适当的限制性内切酶完全消化16小时(40μl总体积、4U酶/μl DNA)并且在0.8%琼脂糖凝胶上运行。将该DNA在凝胶中通过用0.2M HCl处理进行片段化、变性(0.5M NaOH,1.5M NaCl)并且进行中和(1M Tris,pH 7.5;1.5M NaCl)用于随后在20X SSC中转移到海邦(Hybond)N+膜(安玛西亚公司(Amersham))上。将该DNA进行UV交联到该膜上并且在42℃下在20ml DIG Easy Hyb(罗氏诊断产品有限公司(Roche Diagnostics Corporation),曼海姆,德国)中预杂交1小时。

将变性的探针直接添加至DIG Easy Hyb缓冲液中并且在42℃下进行过夜杂交。在杂交后洗涤(在2X SSC中、室温、5分钟洗涤两次;并且在0.1X SSC中、68℃洗涤两次,各15min),根据制造商的方案,使用DIG检测系统和CPD-Star(罗氏公司)进行化学发光检测。DIG-标记的DNA分子量标记II(罗氏公司)被用于标准标记。

实例1.用于采用无启动子的选择标记将酶编码基因文库插入到基因组中的黑曲霉宿主/载体系统

分两个步骤构建包含插入其基因组中的酶编码多核苷酸文库的黑曲霉,通过先整合由p002表示的质粒(SEQ ID NO:1中提供的完整DNA序列,并在图1中示出其示意图),该质粒包括(按以下顺序):

a)黑曲霉酸性α-淀粉酶编码基因的5’基因组侧翼区;

b)可操作地与FLP编码重组酶编码基因和米曲霉硝酸还原酶基因终止子连接的构巢曲霉木聚糖酶基因启动子;

c)曲霉中性淀粉酶基因启动子,

d)第一重组酶识别序列:

5’ttgaagttcctattccgagttcctattctctagaaagtataggaacttc(SEQ ID NO:2),

e)可操作地与一个潮霉素B抗性标记基因和amdS终止子连接的amdS启动子;

f)第二重组酶识别序列

5’ttgaagttcctattccgagttcctattcttcaaatagtataggaacttca(SEQ ID NO:3),

g)不具有启动子但具有终止子的乙酰胺酶(amdS)编码基因;以及最后地

h)黑曲霉酸性α-淀粉酶编码基因的3’基因组侧翼区。

P002质粒转化到黑曲霉菌株1007-8(WO 121600093中披露)中,随后是潮霉素B选择。获得的转化体通过Southern印迹分析证实具有正确地整合的预期的基因组序列。选择阳性转化体,并且原生质体从菌株制成。

在第二步骤中,表达载体pFRT-GlAMG是基于pUC19载体构建的;pFRT-GIAMG的完整DNA序列在SEQ ID NO:4中提供并且示意图在图2示出。载体包括(按以下顺序):

a)重组酶识别序列,

b)来自密粘褶菌的葡糖淀粉酶基因(SEQ ID NO:5中的DNA;SEQ ID NO:6中的氨基酸序列)可操作地与黑曲霉葡糖淀粉酶终止子连接;

c)米曲霉翻译延伸因子1(TEF1)启动子,以在整合后,驱动在宿主细胞的基因组中的基因组无启动子选择标记的表达,由此也确保正确定向的整合;和

d)重组酶识别序列。

1μg的质粒转化到原生质体中,以在Cove基础平板上产生200-300菌落(科夫D.J.(Cove D.J.)1966.生物化学与生物物理学学报(Biochem.Biophys.cta)113:51-56),这些平板补充有1.0M的蔗糖作为碳源和1%木糖。菌落接种到包含0.1%支链淀粉的czapec-DOX平板通过碘染色(0.15%I2/1.5%KI)来确认葡糖淀粉酶活性。选择一个阳性转化体并且表示为黑曲霉1007-002-44-11。

实例2.采用无启动子部分选择标记的黑曲霉宿主/载体系统

质粒p007(图3;SEQ ID NO:7),如下构建:用SpeI-FRTF3-amdS和amdS-F-探针的一个引物对,并以质粒p002作为模板以扩增amdS(4.0kbp)的SpeI位点识别序列C末端的DNA区来产生第一PCR片段。扩增的PCR产物然后通过SpeI和PacI消化。

引物SpeI-FRTF3-amdS(81mer;SEQ ID NO:8):

5’tggcgtagactagttgaagttcctattccgagtcctattcttcaaatagtataggaacttcatcagggagatgtaacaac

引物amdS-F-探针(22mer;SEQ ID NO:9):

5’ctatggagtcaccacatttccc

包括重组酶识别序列和与酶编码基因可操作地连接的中性淀粉酶启动子的DNA片段(1.0kbp),是通过用PacI和BgIII的质粒p002的双重消化制备的。

包含可操作地与潮霉素抗性编码基因和amdS终止子连接的amdS启动子的DNA片段(3.0kbp)是通过用BgIII和SpeI的p002的双重消化制备的。

这三个DNA片段连接在一起,并转化到大肠杆菌DH5α中。所得质粒命名为p007。

p007质粒包含可操作地与FLP重组酶基因连接的启动子和终止子、另外的NA2启动子、具有FRTs之间的启动子和终止子的潮霉素基因,和缺乏N-末端序列及其第一个内含子的一半的部分amdS选择标记基因,所有两侧是两个酸性α-淀粉酶侧翼基因组区域。

质粒p007转化到黑曲霉菌株1007-8(WO 121600093中披露)中,随后是潮霉素B选择。获得的转化体通过Southern印迹分析证实具有正确的整合的序列。

表达载体,pFRT-BsAMG(图4;SEQ ID NO:10),是基于pUC19载体构建的,它包括(按以下顺序):

a)重组酶识别序列,

b)来自Byssocorticium的葡糖淀粉酶基因(SEQ ID NO:11中示出的DNA序列,SEQ ID NO:12中编码的氨基酸序列)或一个突变的葡糖淀粉酶编码基因,连同黑曲霉葡糖淀粉酶终止子,

c)米曲霉TEF1启动子(旨在驱动在受体宿主细胞的基因组中的选择标记的表达)可操作地与部分N-末端乙酰胺酶amdS基因连接;和

d)重组酶识别序列。

该载体是通过将SEQ ID NO:13中示出的部分乙酰胺酶基因插入到TEF1启动子(Ptef1)和第二识别序列之间,并且将来自粘褶菌属的葡糖淀粉酶基因交换为Byssocorticium葡糖淀粉酶基因。

在作为模板的pFRT-BsAMG上使用M13M4和M13RV引物进行PCR,并且扩增包含第一重组酶识别序列的4kb的片段、来自Byssocorticium的葡糖淀粉酶基因(或突变的葡糖淀粉酶基因)、黑曲霉葡糖淀粉酶终止子、TEF1启动子、部分N末端乙酰胺酶基因和第二重组酶识别序列。

引物M13RV(SEQ ID NO:14):caggaaacagctatgac

引物M13M4(SEQ ID NO:15):gttttcccagtcacgac

pFRT-BsAMG和PCR片段均被转化并在Cove基础平板上和1%木糖培养。菌落接种到包含0.1%支链淀粉的czapec-dox平板通过碘染色(0.15%I2/1.5%KI)来确认葡糖淀粉酶活性。

实例3.黑曲霉中的单拷贝定点基因插入

使用In-Fusion克隆的质粒文库构建(Clontech公司)

40ng的pFRT-GlAMG表达载体被限制性内切酶XhoI和BsiW1消化,以切除存在的AMG编码基因。用2个引物对进行两个PCR,正向简并引物和与表达载体具有多于15bp的重叠的引物,和M13 M4和与简并引物具有15bp重叠的反向引物,使用pFRT-GIAMG载体作为模板:

融合载体R中的引物(SEQ ID NO:16):tatgcgttatcgtacgcac

引物M13 M4(SEQ ID NO:17):gttttcccagtcacgac

用于BsAMG文库的引物对如下所示:

引物M49X F(27mer;SEQ ID NO:18):gtcaacccggactacnnktacacatgg

引物M49X R(18mer;SEQ ID NO:19):gtagtccgggttgacttg

消化的载体和PCR片段与In-Fusion混合物混合,转化到大肠杆菌DH5α中。合并获得的大肠杆菌转化体并提取质粒用于文库构建。

PCR文库构建

用两个引物对,简并引物,和SOE-MR R和SOE-M4F,和简并引物的配对反向引物,使用pFRT表达载体作为模板进行第一PCR。

用引物对,SOE-F和SOE-R,以及来自第一PCR的PCR片段进行第二SOE PCR。回收所得4kb片段作为PCR片段文库用于曲霉文库构建。

引物SOE-M4F(SEQ ID NO:20):5’gtactatctggcattggtacgttttcccagtcacgac

引物SOE-MR R(SEQ ID NO:21):5’tggttatgatttcggcgatgcaggaaacagctatgac

引物SOE-F(SEQ ID NO:22):5’gtactatctggcattggtac

引物SOE-R(SEQ ID NO:23):5’tggttatgatttcggcgatg

1μg的每种质粒或PCR片段文库转化到黑曲霉1007-002-44-11宿主菌株中。转化体在包含COVE-N甘氨酸琼脂(100μl/孔)的96孔MTP中分离,并在32℃下培养1周以具备足够的孢子形成。添加100μl/孔的0.01%吐温20至每个孔中,并且孢子悬浮液接种在包含YPG 96孔MTP中,并在30℃下伴随振荡培养3天。然后筛选文库。

来自曲霉克隆的DNA分离

通过如下描述的直接菌落PCR扩增方法或通过使用引物对“插入解救F”和“R”在分离染色体DNA上的PCR扩增曲霉菌株的插入DNA。

引物插入解救F(SEQ ID NO:24):5’aatctcagaacaccaatatc

引物插入解救F(SEQ ID NO:25):5’aacactatgcgttatcgtac

菌落PCR如下进行:添加Conidias至1,5ml管,添加500μl的TE-缓冲液并简单混合。该管内容物在水中稀释10-20倍,并且将1μl的稀释的混合物用作模板用于PCR。扩增的DNA通过琼脂糖凝胶电泳和QIAquick凝胶提取试剂盒(凯杰公司)纯化,并且然后测序来检查构建的文库的质量。该文库是正确的。

实例4米曲霉宿主/载体系统

米曲霉菌株JaL1394(在WO 2012/160093中披露)在此实例中被用作宿主菌株。我们已经构建了由pDAu571表示的整合表达载体(图5;SEQ ID NO:26),用于使用FLP/FRT系统,位点特异性重组到米曲霉JaL1394的染色体中。

载体pDAu571是由三部分构成(部分-I,部分-II,部分-III;图5):

部分-I是由两个短FRT(翻转酶识别目标)位点限定。在FRT位点之间发现以下元件:

●具有可以使用独特的限制性酶切位点BamHI,XhoI,替换为任何基因或感兴趣的多核苷酸文库(GOI)的“填充序列”的表达盒。

●构巢曲霉的pyrG选择标记,用来因为它们在没有补充尿苷的基本培养基上生长的能力选择转化的宿主细胞;pyrG标记可操作地与其天然启动子和黑曲霉葡糖淀粉酶基因(Tamg)(SEQ ID NO:26的位置4057-5918)的终止子连接。

质粒的这一部分经由宿主和载体中的各自FRT位点之间的FLP辅助的重组被整合到宿主有机体的染色体中。当评估基因文库时,有利地确保载体的部分-I以相同的方向被整合到所有转化体中。这减少了来自侧翼区(例如,来自通读)基因表达的任何变化。在染色体中FRT-F和FRT-F3位点的序列和确保染色体中整合部分的正确的方向的载体之间存在小差异。宿主染色体和载体中的FRT-F3位点将通过FLP翻转酶彼此重组,并且FRT-F位点也将如此。

FRT-F(SEQ ID NO:26的位置1-49):

5’-ttgaagttcctattccgagttcctattctctagaaagtataggaacttc(SEQ ID NO:27)

FRT-F3(SEQ ID NO:26的位置5925-5974):

5’-ttgaagttcctattccgagttcctattcttcaaatagtataggaacttca(SEQ ID NO:28)

表达盒包含人工NA2TPI启动子,该启动子构建自融合至构巢曲霉磷酸丙糖异构酶的非翻译前导序列的黑曲霉中性淀粉酶II启动子(SEQ ID NO:26的位置73-814)。

此外,表达盒包含所谓的“填充序列”,它在这种情况下是编码来自大豆的脂氧合酶I的基因(SEQ ID NO:22的位置824-3343)。如已经提到的,载体中填充序列可以使用两个独特限制酶位点BamHI,XhoI被替换为感兴趣的任何其他基因。

最后,表达盒包含黑曲霉葡糖淀粉酶基因的终止子(SEQ ID NO:26的位置3358-4048)。

pDau571载体的部分-II是翻转酶编码基因(sFLP)的合成版本(SEQ ID NO:26的位置4875-6143(反向链))。翻转酶基因表达通过米曲霉翻译延伸因子1α启动子(pTEF1)(SEQ ID NO:26的位置7759-8447(反向链))连同米曲霉硝酸还原酶终止子(TniaD))(SEQ ID NO:26的位置5991-6478(反向链))来控制。

对于在大肠杆菌中质粒的增殖,pDau571载体的部分-III是必需的,并且包括大肠杆菌β-内酰胺酶(ampR)可选择标记和源自熟知的pUC质粒的大肠杆菌复制起点(SEQ ID NO:26的位置8448-11101)。

质粒pDAu571(其中填充序列由所感兴趣的多核苷酸文库替换)被转化到菌株Jal1394的原生质体中,如下:

100μl原生质体与10μl小量制备质粒DNA(未消化或线性化)或跨越pDAu571的部分-I和部分-II的PCR产物和300μl 60%的PEG在室温下孵育20min;然后添加5ml Topagar(+10mM NaNO3),并将整个转化混合物平铺在蔗糖/10mM NaNO3平板上。37℃下孵育平板,直到可以发现孢子。为了纯化单一转化体,菌落再次复制到新蔗糖/10mM NaNO3平板上,并在37℃下孵育,直到孢子发育。

获得的转化体可以通过使用位于表达盒侧翼两侧的amy2基因座内的诊断引物的PCR来验证表达盒的amy2基因座的正确整合,该表达盒包括FRT位点和位于表达盒内的基因特异性引物。

实例5.分裂标记米曲霉的宿主/载体系统的构建

先前实例提供了用于进入适合的丝状真菌宿主细胞的翻转酶介导的位点特异性重组和整合的表达载体。通过使用不同的重组酶识别序列确保整合表达盒的染色体中的正确的方向。

确保正确的方向的另一方式是采用分裂选择标记,其中标记的一个非功能部分存在于宿主染色体中,并且标记的另一非功能部分是在进来的载体上。然后只有正确定向的整合生成功能第二选择标记。该分裂标记原理在此实例中说明;在此第二选择标记被定向在一个方向上,但它刚好也可以已经按其他方式被定向。

曲霉原生质体转化和重组细胞的选择所必需的培养基和溶液:

痕量金属

盐溶液

COVE培养基

20ml盐溶液

20g琼脂

218g山梨醇

H2O补足1l

高压灭菌并且然后添加:

50ml 20%葡萄糖

10ml1M尿素。

Cove-N-甘氨酸斜面

蔗糖培养基

20ml盐溶液。

342g蔗糖。

H2O补足1l

高压灭菌并且然后添加:

10mM硝酸钠

ST 0.6M山梨醇

100mM Tris/HCl pH 7.0

STC 1.2M山梨醇

10mM CaCl2

10mM Tris/HCl pH7.5。

PEG 60%(W/V)PEG 4000(BDH)(6g PEG+~5ml无菌水,置于60℃-65℃)

10mM CaCl2(50μl的2M CaCl2)

10mM Tris/HCl pH 7.5。(100μl的1M的Tris)

蔗糖琼脂平板

10g琼脂

10ml盐溶液

1M蔗糖补足至500ml

高压灭菌器灭菌

乙酰胺平板

10ml盐溶液

10g琼脂

1M蔗糖补足至500ml1

高压灭菌。

冷却至大约65℃,添加10mM乙酰胺和15mM CsCl。

对于500毫升,Triton X-100 50μl(仅在复制平板中)

在米曲霉DAu716的amy2基因座的FRT位点的引入

质粒pJAl1258(在WO 12160097A1中描述)被改良生成由pDAu703表示的质粒。质粒pDAu703按顺序包含以下元件(图6;SEQ ID NO:29):

●amy2-3’侧翼区(490bp);SEQ ID NO:29的位置449-938;

●pyrG启动子可操作地与包含pyrG CDS的5’端(第一外显子及其第一内含子的5’端)的部分的pyrG基因连接;

●FRT-F3位点(50bp);SEQ ID NO:29的位置1452-1501;

●黑曲霉AMG终止子(Tamg)可操作地与amdS编码基因,SEQ ID NO:29的位置1511-2200连接;

●构巢曲霉乙酰胺酶基因(amdS),SEQ ID NO:29的位置2232-4131;

●强磷酸丙糖异构酶启动子(Ptpi)可操作地与Amds编码基因连接;这允许在乙酰胺和ClCs上生长,即使按照预期基因组中仅存在AmdS选择盒的一个拷贝,如果质粒pDAU703被整合到位于FRT位点的amy2基因座的一个拷贝中。SEQ ID NO:29的位置4140-4894;

●FRT-F位点(49bp);SEQ ID NO:29的位置4903-4951;

●amy2-5’侧翼区(1114bp);SEQ ID NO:29的位置4964-6077;

●质粒的其余部分是由对于维持质粒作为细菌宿主细胞大肠杆菌中的复制质粒所必需的一部分DNA(大肠杆菌复制起点和氨苄青霉素抗性盒)构成。

质粒DNA pDAu703用NotI限制性内切酶消化,以从质粒的现在不相干大肠杆菌部分分离包含整合盒的DNA。

将线性化质粒pDAu703使用描述的标准程序(例如在WO 98/01470中)转化进入米曲霉菌株Jal1338的原生质体(在WO 12160097 A1中披露),但是因为该菌株是的pyrG负型,需要补充10mM尿苷至培养基,因此其在没有尿苷下不能生长。在AmdS选择平板上选择转化体

所得重组宿主菌株已经具有两个FRT位点连同分裂pyrG标记(第一外显子和天然内含子的一部分)的5’端,该标记通过同源重组在amy2基因座与其自己的整合的启动子可操作地连接,如在图7中的顶部小图中所示。在amy2基因座上的正确整合通过Southern印迹分析使用退火到amy2的3’端的探针检查(图7)。FRT盒的整合分别在EcoRI和XhoI消化物中的5114bp和2637bp处产生杂交信号(未示出)。该模式与Jal1338宿主不同,其中该amy2基因座不被破坏。选择正确的菌株并用米曲霉DAu716表示(图7,上图)。

用携带脂肪酶编码基因的pDAU724载体的DAu716的转化

这个实例展示了FRT/FLP重组和分裂pyrG标记可以如何被用于有效地使表达盒的单拷贝插入以高频存在于米曲霉中。我们使用来自绵毛嗜热丝孢菌的脂肪酶基因(例如在WO 2008008950中披露)作为报告基因来测量在转化的宿主中产生的脂肪酶的水平。

像在先前实例中,构建表达载体,这样使得其一部分可以使用翻转酶作为位点特异性重组介质,在FRT-位点被整合到宿主细胞的染色体中。要被整合到基因组中的质粒的一部分携带可操作地与NA2/TPi启动子和黑曲霉AMG基因的终止子连接的脂肪酶基因。为了能够选择经由FRT位点已经成功整合表达盒的重组细胞,pyrG选择标记的剩余部分也被包括在FRT位点之间。启动子和第一外显子存在于DAu716宿主中并且pyrG标记的剩余部分存在于进来的质粒上。当位点特异性重组时,pyrG标记将被重构为完整基因(其中其第一内含子内的FRT序列,将当然,从mRNA拼接出)并且重组细胞将能够表达PyrG和生长在NaNO3作为单一氮源的平板上。

质粒pDAU724(图7,中间;SEQ ID NO:30)由以下组成:

要被整合到曲霉属宿主细胞的基因组DNA中的的部分-I,并且它由具有有表达盒的两个FRT位点和分裂pyrG标记的一部分组成;

将不被整合到宿主细胞的基因组中的部分-II,并且它包含FLP酶表达盒连同大肠杆菌选择标记和复制起点。

菌株DAu716生长在Cove-N-甘氨酸介质的斜面上直至可以看见孢子。

将10-20毫升的蔗糖培养基或YPD培养基添加至该斜面,并且通过漩涡振荡斜面悬浮孢子。孢子悬浮液转移到包含100ml蔗糖培养基和10mM硝酸钠(或其它氮源)的聚碳酸酯摇瓶(500毫升)中。在30℃下孵育烧瓶24hr(200rpm)。

通过神奇滤布(miracloth)过滤收集菌丝体,并且使用200ml 0.6M MgSO4洗涤。从菌丝体吸出剩余液体,例如使用塑料移液器。

1-2g的菌丝体被转移到小的(100ml)聚碳酸酯烧瓶中,瓶中包含:

75-150mg Glucanex

10ml 1.2M MgSO4

100ul 1M NaH2PO4pH 5.8

并且悬浮菌丝体,添加1ml的12mg/ml的BSA(无菌过滤的)

在37℃孵育悬浮液1/2-2hr,并且经常通过显微术监测原生质体形成。

将原生质体悬浮液通过神奇滤布(miracloth)过滤到25毫升离心管中,并且将悬浮液用5ml ST(小心不要与下层混合)覆盖。将所得原生质体,通过离心(2500rpm/1350g,15min,缓慢加速)分带。回收原生质体的界面带,并且转移到新鲜的管中。

用两体积的STC稀释原生质体,随后离心(2500rpm/1350g,5min)。然后用5ml STC洗涤原生质体两次(使用再悬浮和离心),并且然后在STC中再悬浮至大约5x107个原生质体/ml的浓度。

对于每次转化,将正在转化的DNA添加至例如14ml管的底部,并且添加100μl的原生质体。添加300μl的PEG,并且将该管用手轻轻混合。孵育20分钟(室温)后,在50℃的温度下添加6ml顶层琼脂,并立即将该悬浮液倒在具有10mM的NaNO3的选择性蔗糖琼脂平板上。

将平板在37℃孵育,直至转化体清晰可见并且开始形成孢子。20个转化体复制到具有Triton的新选择平板上,以分离菌落,可以通过发酵,Southern印迹分析或酶活性测定进一步分析这些菌落。

确认染色体中存在的amdS标记已经通过在包含CsCl(内源乙酰胺酶的抑制剂)和作为唯一氮源的乙酰胺的平板上将转化体划线,在转化体中被引进的脂肪酶基因替换。正确的转化体不应该能够在这些平板上生长。我们测试了20个重组细胞,这些重组细胞是pDAu724的转化成DAu716后获得的,并与亲本宿主菌株DAu716相比,仅观察到轻微的生长表型,其中AmdS选择标记仍然存在。

证实所有20个转化体均包含正确插入在FRT位点的脂肪酶表达盒的一个插入的拷贝。

将20个转化体接种至3ml YPD在10ml 24深孔板(沃特曼(Whatman)公司)中,用Airpore胶带(Quiagen公司)密封,并且在200rpm的搅拌下30摄氏度孵育4天。收集上清液用于进一步分析(脂肪酶测定和SDS-PAGE),并收集菌丝体用于基因组提取和Southern分析。

20个转化体在脂肪酶测定中示出可比较脂肪酶活性,连同在SDS-PAGE凝胶上示出可比较脂肪酶蛋白水平。此外,Southern印迹证实,所有20个转化体仅具有正确地整合到染色体中的预期单一脂肪酶基因拷贝。

实例6:野生型红豆(Vigna angularis)木葡聚糖内糖基转移酶16(VaXET16)的克隆,用于在米曲霉筛选菌株中表达

在此密码子优化野生型红豆(Vigna angularis)木葡聚糖内糖基转移酶16(VaXET16)cDNA通过酵母重组克隆克隆到米曲霉Flp/FRT穿梭载体pDAu571(图5)中,生成载体pDLHD0075(图8)。

表达载体pDLHD0075被构建为包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)可选择标记、URA3酵母可选择标记、酵母2微米复制起点、NA2-tpi启动子、密码子优化飞VaXET16开放阅读框(cDNA序列为SEQ ID NO:31并且氨基酸序列为SEQ ID NO:32)、黑曲霉葡糖淀粉酶终止子、构巢曲霉pyrG选择标记、米曲霉TEF1启动子和米曲霉NIAD终止子之间的酿酒酵母2μm翻转酶ORF、和酿酒酵母2μm翻转酶识别目标FRT-F和FRT-F3。

质粒pDLHD0075通过使用酵母重组克隆合并四个DNA片段生成:片段1包含翻转酶表达盒,FRT-F3,和来自pDAU571的AMG终止子,以及与片段4和2同源的侧翼序列。片段2包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)选择标记、URA3酵母选择标记、来自pDLHD0044的酵母2微米复制原点、和与片段1和3同源的侧翼序列。片段3包含所述NA2-tpi启动子、来自pDLHD0044的VaXET16密码子优化基因、和与片段2和4同源的侧翼序列。片段4包含黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)和作为来自pDAU571的可选择标记的构巢曲霉乳清苷-5’-磷酸脱羧酶基因(pyrG),以及与片段3和1同源的侧翼序列。

使用以下所示的引物615726(正义)和引物615728(反义)扩增片段1。这些引物被设计成包含分别与片段4和2同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。

引物615726(正义):

accgggaggaaggctggaaaGCTTACGAGAAAAGAGTTGGACTTTGAGGG(SEQ ID NO:33)

引物615728(反义):

tgagcgaggaagcggAAGAGCGCCCAATACGCAAACCGCC(SEQ ID NO:34)

片段1在反应中通过PCR来扩增,该反应由10ng的pDAU571、0.5μl的DNA聚合酶、20pmol的引物615726、20pmol的引物615728、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得3.3kb PCR产物(片段1)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR反应管中,充分混合,并且在37℃下孵育60分钟。

使用以下所示的引物615729(正义)和引物615731(反义)扩增片段2。这些引物被设计成包含分别与片段1和3同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。

引物615729(正义):

tgcgtattgggcgctcttCCGCTTCCTCGCTCACTGACTC(SEQ ID NO:35)

引物615731(反义):

tatactttctagagaataggaactcggaataggaacttcaaGGAACAACACTCAACCCTATCTCGGTC(SEQ ID NO:36)

片段2在反应中通过PCR来扩增,该反应由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615729、20pmol的引物615731、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得4.2kb PCR产物(片段2)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR反应管中,充分混合,并且在37℃下孵育60分钟。

使用以下所示的引物615730(正义)和引物615611(反义)扩增片段3。这些引物被设计成包含分别与片段2和4同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。

引物615730(正义):

tccgagttcctattctctagaaagtataggaacttcGCATTTATCAGGGTTATTGTCTCATGAGCGG(SEQ ID NO:37)

引物615611(反义):

tctagatctcgagtcaGATGTCCCTATCGCGTGTACACTCG(SEQ ID NO:38)

片段3在反应中通过PCR来扩增,该反应由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615730、20pmol的引物615611、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得1.7kb PCR产物(片段3)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR反应管中,充分混合,并且在37℃下孵育60分钟。

使用以下所示的引物615610(正义)和引物615727(反义)扩增片段4。这些引物被设计成包含分别与片段3和1同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。

引物615610(正义):

acacgcgatagggacatcTGACTCGAGATCTAGAGGGTGACTGAC(SEQ ID NO:39)

引物615727(反义):

aactcttttctcgtaagcTTTCCAGCCTTCCTCCCGGTAC(SEQ ID NO:40)

片段4在反应中通过PCR来扩增,该反应由10ng的pDAU571、0.5μl的DNA聚合酶、20pmol的引物615610、20pmol的引物615727、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得1.9kb PCR产物(片段4)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR反应管中,充分混合,并且在37℃下孵育60分钟。

使用基于酵母同源性的重组克隆,使用以下程序来合并四个PCR片段。将PCR片段的每种的10μl等分试样与来自鲑鱼睾丸的100μg的单链脱氧核糖核酸(西格玛奥德里奇,圣路易斯,密苏里州,美国)、100μl的菌株YNG318的感受态酵母细胞(酿酒酵母ATCC 208973)、和600μl的PLATE缓冲液(西格玛奥德里奇,圣路易斯,密苏里州,美国)合并,并且混合。将反应在30℃下以200rpm振荡孵育30分钟。然后将该反应在42℃下在没有振荡的情况下继续15分钟。将这些细胞通过在5,000x g下离心1分钟进行沉淀,并且弃去上清液。将细胞球粒悬浮于200μl的高压蒸汽处理的水中,并且分在两个包含合成的所定义的培养基缺少尿苷的琼脂平板,并且在30℃下孵育3天。将这些酵母菌落使用1ml的高压蒸汽处理的水从平板中分离。将这些细胞通过在13,000x g下离心30秒进行沉淀,并且将100μl等分试样的玻璃珠添加到该管中。将细胞和珠混合物悬浮在250μl的P1缓冲液(凯杰公司,巴伦西亚,加利福尼亚州,美国)中,并且然后涡旋1分钟来裂解这些细胞。使用旋转迷你制备型试剂盒纯化质粒DNA。根据制造商的说明书,然后将3μl等分试样的质粒DNA转化到大肠杆菌ONE TOP10电转化感受态细胞中。将50μl的转化细胞散布于每ml补充有100μg氨比西林的2XYT平板上,并且在37℃下孵育过夜。将转化体各自挑入每ml补充有100μg的氨比西林的3ml的LB培养基中,并且在37℃下在250rpm的振荡下生长过夜。使用旋转迷你制备型试剂盒从菌落中纯化质粒DNA。将使用3130XL遗传分析仪的DNA测序用来确认指定为质粒pDLHD0075的最终质粒中三个片段中的每个的存在(图8)。

实例7:在米曲霉筛选菌株JaL1394中按单拷贝的野生型红豆(Vigna angularis)木葡聚糖内糖基转移酶16(VaXET16)表达的确认

米曲霉JaL1394(在WO 2012/160093中披露)用包含密码子优化VaXET16基因的质粒pDLHD0075转化。

将来自米曲霉JaL1394的大约107孢子的接种于500ml摇瓶中的补充有10mM尿苷的100ml的YP+2%葡萄糖培养基中,并且在28℃和110rpm下孵育过夜。将10ml的过夜培养物在125ml无菌真空滤器中过滤,并且将菌丝用50ml的0.7M KCl-20mM CaCl2洗涤两次。将剩余液体通过真空过滤去除,留下垫在滤器上。将菌丝体再悬浮于10ml的0.7M KCl-20mM CaCl2中,并且转移到无菌125ml摇瓶中,该摇瓶包含20mg的200G(诺维信瑞士股份公司(Novozymes Switzerland AG),Neumatt,瑞士)/ml和0.2mg的几丁质酶(西格玛奥德里奇,圣路易斯,密苏里州,美国)/ml(在10ml的0.7M KCl-20mM CaCl2中)。将该混合物在37℃和100rpm下孵育30-90分钟,直到从菌丝体中产生原生质体。将该原生质体混合物通过衬有(Calbiochem公司,圣迭哥,加利福尼亚州,美国)的无菌漏斗进行过滤,到无菌50毫升塑料离心管中,以去除菌丝体碎片。将在上的碎片彻底地用10ml的0.7M KCl-20mM CaCl2进行洗涤并且在2500rpm下,在20℃-23℃下,离心10分钟。去除该上清液,并且将原生质体球粒再悬浮于20ml的1M山梨醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)中。将该步骤重复两次,并且将最终的原生质体球粒再悬浮于1M山梨醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)中,以获得2x107/ml的最终原生质体浓度。

原生质体通过添加两μg的pDLHD0075至无菌12ml塑料离心管的底部转化。将一百μl的原生质体添加至管中,随后添加在10mM CaCl2-10mM Tris-HCl(pH 6.5)中的300μl的60%PEG-4000。将该管用手轻轻混合,并且在37℃下孵育30分钟。将添加五ml的1M山梨糖醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)添加到该转化中,并且将该混合物转移到150mm基本培养基琼脂平板上。将转化板在37℃下孵育直到转化体出现。

挑出单个转化体到新基本培养基琼脂平板,并且在37℃下培养4天,直到转化体形成孢子。新鲜孢子转移到48孔深孔板,这些板包含2ml的YP+2%麦芽糊精培养基,覆盖有可透气密封件,并且在没有振荡下在28℃下生长4天。在4天生长后,将每个转化体的培养基针对木葡聚糖内糖基转移酶活性并且针对木葡聚糖内糖基转移酶表达通过如下所概述的SDS-PAGE来测定。

活性测定展示,转化体产生活性木葡聚糖内糖基转移酶。

碘比色法测定来确定木葡聚糖内糖基转移酶活性

木葡聚糖内糖基转移酶活性使用由布洛瓦(Sulova)等人,1995,分析生物化学(Analytical Biochechemistry)229:80-85中描述的碘比色测定的修改版本进行测定。对于每个反应,5μl的罗望子木葡聚糖(麦格酶公司,布雷,英国)(5mg/ml在水中)与20μl的木葡聚糖低聚物(麦格酶公司,布雷,英国)(5mg/ml在水中)、10μl的400mM柠檬酸钠pH5.5合并,并且分散到96孔板中。反应通过添加5μl的液体培养液至每个孔中启动,并且在37℃孵育板10分钟。反应通过添加200μl的由14%(w/v)Na2SO4、0.2%KI、0.1M HCl和0.5%I2构成的溶液猝灭,并且在黑暗中孵育30分钟,然后在 M5分光光度计(Molecular Devices公司,桑尼维尔,加利福尼亚州,美国)中在620nm测量吸光度。

使用8%-16%无染色SDS-PAGE凝胶(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)进行SDS-PAGE,并且使用以下设置,将该凝胶用无染色成像仪(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)成像:5分钟活化,自动成像曝光(强带),高亮饱和像素=ON,颜色=考马斯酸性染料,和带检测、分子量分析和报告禁用。SDS-PAGE揭示了大约32kDa的野生型VaXET16带。

实例8:红豆(Vigna angularis)木葡聚糖内糖基转移酶16(VaXET16)的改进的表达变体的构建和鉴定

VaXET16基因突变体文库通过位点饱和诱变构建。VaXET16基因的突变体文库(文库的每个片段包括突变VaXET16基因+构巢曲霉乳清苷-5’-磷酸脱羧酶pyrG选择标记与FRT-F和FRT-F3翻转酶识别靶序列)与包括米曲霉TEF1启动子和米曲霉NIAD基因终止子之间的酿酒酵母2μm翻转酶ORF的pDLHD0095载体一起转化到如先前实例中所述的米曲霉JaL1394的原生质体中。37℃下在基本培养基琼脂平板上原生质体恢复4天后,挑出单个菌落至包含2ml的YP+2%麦芽糖糊精培养基的48孔深孔板中,覆盖有透气密封,并且在没有振荡下在28℃下生长4天。在液体培养基生长4天后,如在先前实例中所述测定木葡聚糖内糖基转移酶活性,并且更高活性变体被打分为表达命中。

孢子纯化单个突变体菌株,并且再次培养以产生新鲜培养液,用于使用密码子优化基因,相对于表达野生型VaXET16米曲霉JaL1394菌株进行再次测试。如在先前实例中所述,通过SDS-PAGE分析培养液,用于增加木葡聚糖内糖基转移酶蛋白产物的生产。

十一个表征的变体在来自48孔深孔板培养的4天培养液中,优于亲本基因的表达产量的相对改进在下表1中示出。相同的培养液的SDS-PAGE分析展示所有变体的优于野生型VaXET的增加强度的VaXET带,这与在活性测定中观察到的相对改进很好地相关。野生型VaXET及其变体的SDS-PAGE带为32kDa,除包含N175S突变的变体由于另外的糖基化具有大约37kDa的带。

表1.

实例9:米曲霉中红豆(Vigna angularis)木葡聚糖内糖基转移酶16变体(VaXET16)基因的改进的表达的发酵规模确认

发酵工艺被用来相对于野生型VaXET16,表达VaXET16变体、A40G+I53A+N175S和A40G+F183I。

摇瓶培养基由以下构成:50g的蔗糖、10g的KH2PO4、0.5g的CaCl2、2g的MgSO4·7H2O、2g的K2SO4、2g的尿素、10g的酵母提取物、2g的柠檬酸、0.5ml的痕量金属溶液、以及去离子水补足至1升。痕量金属溶液由以下构成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O、3g的柠檬酸、以及去离子水补足至1升。

将一百ml的摇瓶培养基添加至500ml摇瓶。用来自固体平板培养的两个塞接种摇瓶,并且在轨道摇床上以200rpm在34℃孵育24小时。将50ml的烧瓶培养液用于接种3升发酵容器。

每升分批发酵培养基(Fermentation batch medium)由以下构成:10g的酵母提取物、24g的蔗糖、5g的(NH4)2SO4、2g的KH2PO4、0.5g的CaCl2·2H2O、2g的MgSO4.7H2O、1g的柠檬酸、2g的K2SO4、0.5ml的止泡剂、和0.5ml的痕量金属溶液。每升痕量金属溶液由以下构成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O,和3g的柠檬酸。发酵补料培养基(fermentation feed medium)由麦芽糖构成。

将总计1.8升的发酵分批培养基添加到三升玻璃套发酵器中。发酵补料培养基以0到4.4g/l/hr的速度给予。将发酵容器维持在34℃的温度,pH控制在6.1+/-0.1的设定点。将空气以l vvm的速率添加到容器中,且且用以1100到1300rpm旋转的Rushton叶轮搅拌。在发酵运行的第3、4、5、6和7天取样,并且在3000x g离心以去除生物质。将上清液过滤灭菌,并且在5℃至10℃储存。

可以通过以下概述的荧光偏振测定并且通过SDS-PAGE分析(参见上文),相对于野生型密码子优化基因,确定VaXET16变体表达水平。

针对木葡聚糖内糖基转移活性的荧光偏振测定

根据由周(Zhou)等人,2006,生物催化与生物转化(Biocatalysis and Biotransformation)24:107-120所描述的程序,通过木葡聚糖低聚物的还原端的还原氨化,随后在100mM碳酸氢钠(pH 9.0)在室温下将XGO的氨基基团结合到荧光素异硫氰酸酯异构体I(西格玛奥德里奇(Sigma Aldrich),圣路易斯,密苏里州,美国)24小时,来产生荧光素异硫氰酸酯标记的木葡聚糖低聚物(FITC-XGO)。将结合反应产物在真空中浓缩干燥,溶解于0.5ml的去离子水,并且通过硅胶层析进行纯化,该硅胶层析用从100:0:0.04至70:30:1梯度的乙腈:水:乙酸作为流动相进行洗脱。通过蒸发该缓冲液、溶解于D2O(西格玛奥德里奇,圣路易斯,密苏里州,美国),并且使用Varian400MHz MercuryVx(安捷伦(Agilent),圣克拉拉,加利福尼亚州,美国)通过1H NMR分析来确认纯度和产物同一性。在-20℃下在黑暗中,储存干燥的FITC-XGO,并且在解冻过程中干燥。

一mg的FITC-XGO与在200μl反应中的每ml的20mM柠檬酸钠pH 5.0的1mg的罗望子木葡聚糖(麦格酶公司,布雷,英国)和18mg的VaXET16一起孵育至少30分钟。合并样品混合物并且通过添加冰冷的乙醇至80%(v/v)的终浓度进行沉淀,并且在4℃下孵育过夜。沉淀的荧光素异硫氰酸标记木葡聚糖(FITC-XG)通过使用LEGENDTM RT加离心机(赛默飞世尔科技公司(Thermo Scientific),沃尔瑟姆,马萨诸塞州,美国)在3000rpm离心,倾析乙醇进行回收,并且在室温下干燥24小时。将FITC-XG溶解在最小体积的去离子水中直到溶解并储存在-20℃。将冷冻的FITC-XG解冻并且冻干过夜。将冻干粉末溶解在500μl的去离子水中并且通过在488nm的吸光度定量。

按以下方式制备大规模批次的FITC-XG。在去离子水中制备每ml溶液7.9mg的FITC-XGO。彻底混合四十ml的10mg的罗望子木葡聚糖(麦格酶公司,布雷,英国)/ml的去离子水、452ml的7.9mg的FITC-XGO/ml的去离子水、2ml的400mM柠檬酸钠(pH 5.5)、和1.2ml的1.4mg的VaXET16/ml的20mM柠檬酸钠(pH 5.5),并且在室温下孵育过夜。在过夜孵育后,通过添加冰冷的乙醇至终体积110ml来沉淀FITC-XG,彻底混合,并且在4℃下整夜孵育。用水洗涤沉淀的FITC-XG,并且然后转移到圆底烧瓶(Erlenmeyer bulb)中。通过使用EZ-2Elite蒸发器(SP Scientific/Genevac公司,斯通里奇,纽约,美国)蒸发4小时来去除残余的水和乙醇。将干燥的样品溶解于水中,并且用去离子水将体积调整到48ml,以产生,在所希望的100kDa的平均分子量下,5mg/ml的最终FITC-XG浓度。

使用以下测定来评估木葡聚糖内糖基转移活性。如以上描述的制备200μl的反应,该反应包含1mg的罗望子木葡聚糖/ml、0.01mg/ml FITC-XGO,并且将10μl的适当稀释的XET在25℃下在不透明96孔微量滴定板中的20mM柠檬酸钠(pH 5.5)中孵育10分钟。在这个时间段,以顶级阅读方向,用490nm的激发波长、520nm的发射波长、激发路径中495截止滤波器、高精度(100次读取)、和中光电倍增管的灵敏度,使用 M5酶标仪(分子器件公司(Molecular Devices),森尼维耳市,加利福尼亚州,美国)连续监测荧光偏振。将荧光XGO以XET依赖性掺入非荧光XG中导致随着时间增加荧光偏振。使用偏振时间进程曲线的线性区域的斜率来确定该活性。

相对于野生型VaXET16,对于两个变体的7天培养液,优于亲本基因,产量相对改进在下表2中示出。按比野生型VaXET16 3.1X更大的量产生变体A40G+I53A+N175S,而按比野生型VaXET16 1.2X更大的量产生变体A40G+F183I。相同的培养液的SDS-PAGE分析示出两个变体的优于野生型VaXET的增加强度的VaXET带这与在活性测定中观察到的相对改进很好地相关。在第3,4,5,6,和7天所取的样品的SDS-PAGE分析示出VaXET的增加的生产,并且各变体日益增强,其中在第7天最强。

表2.

在此描述并且要求保护的本发明不局限于在此披露的特定方面的范围,因为这些方面旨在作为本发明若干方面的说明。预期任何等效方面都处于本发明的范围内。实际上,除在此所示和描述的那些之外,本发明的不同修改对于本领域普通技术人员而言从前述描述将变得清楚。这样的修改也旨在落入所附权利要求的范围内。在有冲突的情况下,以包括定义的本披露为准。

实例10:里氏木霉原生质体产生与转化

使用基于宾替拉(Penttila)等人,1987,基因(Gene)61:155-164的以下方案进行原生质体制备与转化。将里氏木霉菌株在25ml的补充有2%(w/v)葡萄糖和10mM尿苷的YP培养基中在27℃下、伴随着以90rpm进行的轻轻搅拌培养17小时。将菌丝体通过使用真空驱动一次性过滤系统(密理博公司(Millipore))过滤来收集,并且用去离子水洗涤两次,并且用1.2M山梨醇洗涤两次。通过在20ml的每ml包含15mg的200G(诺维信公司,鲍斯韦,丹麦(Novozymes A/S,Bagsvaerd,Denmark))和每ml包含0.36单位的壳多糖酶(西格玛化学有限公司(Sigma Chemical Co.)的1.2M山梨醇中在34℃下伴随着以90rpm的进行的轻轻振荡来悬浮经洗涤的菌丝体,持续15-25分钟,从而产生原生质体。将原生质体通过在400x g下离心7分钟来收集,并用冷的1.2M山梨醇洗涤两次。将原生质体使用血球计数器来计数,并再悬浮于STC中至1x108个原生质体/ml的终浓度。

将大约1-10μg的DNA添加至100μl的原生质体溶液中并且轻轻混合。然后添加PEG缓冲液(250μl),并且混合转化反应,并且在34℃下孵育30分钟。然后添加STC(3ml)到该转化反应并且混合。然后将转化反应物散布到COVE平板上用于amdS选择。将这些平板在28℃下孵育6-11天。

对于需要潮霉素选择的转化,在STC中的反应混合物散布到补充有1M的蔗糖的PDA平板上。在28℃下孵育16小时后,将20ml的、每ml补充有35μg的潮霉素B的覆层PDA培养基添加至各平板。将这些平板在28℃下孵育4-7天。

实例11:来自里氏木霉菌株的基因组DNA提取

使这些里氏木霉菌株在补充有在250ml带挡板的摇瓶中的2%葡萄糖(w/v)的50ml的YP培养基中在28℃下伴随着以200rpm的搅拌生长2天。使用漏斗衬里的(EMD化学品公司(EMD Chemicals Inc.))收集来自各培养的菌丝体,挤压干燥,并在液氮下冷冻。将冷冻的菌丝体转移到预冷的研钵和研杵。每个菌丝制剂磨成细粉,并且用液氮保持冷冻。将总共1-2克的粉末转移到50ml管中,并且使用植物Maxi试剂盒(凯杰公司)从研磨菌丝粉末中提取基因组DNA。将预热至65℃的五ml的缓冲液AP1(凯杰公司)添加到50ml管中,随后添加10μl的RNA酶A 100mg/ml原液(凯杰公司),并且在65℃孵育2-3小时。添加共1.8ml AP2缓冲液(凯杰公司),并将管在冰上孵育5分钟,随后用LEGENDTMRT吊桶式离心机(赛默飞世尔科技公司(Thermo Fisher Scientific Inc.))在3000-5000X g离心5分钟。将上清液转移到置于50毫升收集管中的QIAShredderTM大核酸纯化柱(凯杰公司),并且在室温下(15℃-25℃)在3000-5000x g下甩平式转子中离心5分钟。在收集管中的流过液体被转移到新50ml管中,同时不干扰沉淀。1.5mL体积的缓冲液AP3/E(凯杰公司)添加到澄清的裂解液中,并且通过涡旋振荡立即混合。包括可能已经形成的任何沉淀的样品(最多15毫升),吸移到置于50毫升收集管中的大核酸纯化柱(凯杰公司)中,并且在室温下(15℃-25℃)在3000-5000x g下甩平式转子中离心5分钟。弃去流过液体。十二ml的缓冲液AW(凯杰公司)添加至大核酸纯化柱,并在3000-5000x g离心10分钟,以干燥该膜。弃去流过液体和收集管。大核酸纯化柱转移到新50ml管中。通过添加预热至65℃的1-1.5ml的试剂盒提供的缓冲液AE直接洗脱DNA到大核酸纯化柱膜上,在室温下(15℃-25℃)孵育5分钟,并且然后在3000-5000X g离心5分钟。基因组DNA的浓度和纯度通过在260nm和280nm测量吸光度确定。

实例12:转化体的Southern印迹分析

用选择的一种或多种限制性内切酶消化来自每个转化体的两μg的基因组DNA。这些消化提交至在TAE缓冲液中的0.7%-0.8%琼脂糖凝胶电泳,并且使用(GE医疗集团生命科学部(GE Healthcare Life Sciences))印迹至 N+印迹膜(GE医疗集团生命科学部(GE Healthcare Life Sciences))或超负荷膜(施莱歇&许尔生物科技公司(Schleicher&Schuell BioScience))持续大约1-2小时。该膜与地高辛标记基因特异性或位点特异性探针杂交,这些探针是通过使用PCR DIG探针合成试剂盒(罗氏应用科学公司)的PCR合成。

将该探头煮沸持续5分钟,在冰上冷却持续2分钟,并添加至10ml的DIG Easy Hyb中以产生该杂交溶液。杂交在DIG Easy Hyb缓冲液中在42℃下进行15-17小时。然后将该膜用2X SSC加上0.1%SDS在室温下洗涤5分钟,随后在65℃下用0.5X SSC加上0.1%SDS洗涤两次,每次15分钟。在1X封闭液(罗氏应用科学公司)洗涤至少一小时,洗涤一次后,将膜用50ml包含3.75U的抗洋地黄毒苷-AP Fab片段(罗氏应用科学公司)的封闭液孵育10分钟,随后在1X洗涤液(罗氏应用科学公司)中洗涤两次。即用试剂(二钠2-氯-5-(4-甲氧基螺(1,2-二氧杂环丁烷-3,2’-(5’-氯)三环[3.3.1.13,7]癸烷}-4-基)-1-苯基磷酸酯;罗氏应用科学公司)然后被施加至膜,并且通过放射自显影方法检测探针-靶杂交体。

实例13:FLP/FRT整合质粒pJfyS148B的构建

FRT-F3位点首先使用 II XL定点诱变试剂盒(安捷伦科技),用以下所示的诱变插入引物被插入到质粒pSMai155(WO 05/074647)中。

正向引物:

5'-

CGAATTCTGCATTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCAGATATCCATCACACTGGCG-3'(SEQ ID NO:41)

反向引物:

5'-

GCCAGTGTGATGGATATCTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAATGCAGAATTCGC-3’(SEQ ID NO:42)

诱变PCR包含10ng的pSMai155、200μM dNTP、125ng的每个引物、1X反应缓冲液(安捷伦科技)、3μl的试剂(安捷伦科技)以及2.5单位的Pfu超高保真DNA聚合酶(安捷伦科技),最终体积为50μl。PCR在热循环仪中进行,程序为1个循环,在95℃下持续1分钟;18个循环,每个循环在95℃下持续50秒,在60℃下持续50秒,以及在68℃下持续40秒;以及1个循环,在68℃下持续7分钟。添加一μl的试剂盒提供的Dpn I,并且在37℃下孵育1小时。两μl的Dpn I处理后的反应添加至14ml管中45μl的试剂盒提供的XL10-Gold超活性大肠杆菌细胞(安捷伦科技),并且在冰上孵育30分钟。将该管在42℃下孵育30秒,此后添加0.5ml的SOC培养基。然后在37℃下伴随200rpm搅拌,将该管孵育1小时,此后将250μl各自涂板至2X 150mm 2XYT+氨苄西林平板上并在37℃孵育过夜。将大肠杆菌转化体接种到在14ml管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,伴随在200rpm的搅拌。使用9600(凯杰公司)分离质粒DNA。插入通过DNA测序来确认。一个转化体被鉴定为包含对应于FRT-F3位点的希望的序列插入,并且该质粒指定为pJfyS148A。

然后将FRT-F序列使用优越PCR克隆试剂盒(克罗泰克实验有限公司(Clontech Laboratories,Inc.))插入到质粒pJfyS148A中。FRT-F位点首先使用以下所示的引物,通过PCR,从质粒pRika147(WO2012/120093)扩增。

正向引物:

5'-

ATATCCATCACACTGGCGGCCGCTCAACTCTCTCCTCTAGGTTGAAGTTCCTATTCCGAGTTC-3’(SEQ ID NO:43)

反向引物:

5'-

AGGATGCATGCTCGAGCATGCACTAGCTAGTTGAAGTTCCTATAC-3’

(SEQ ID NO:44)

该PCR由以下各项构成:20ng的pRika147、200μM dNTP、0.4μM引物、1X反应缓冲液(赛默飞世尔科技公司)、以及2单位的高保真DNA聚合酶(赛默飞世尔科技公司),最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;30个循环,每个循环在95℃下持续25秒,在50℃下持续25秒,以及在72℃下持续40秒;以及1个循环,在72℃下持续7分钟。将完成的PCR提交至在TAE缓冲液中的2%琼脂糖凝胶电泳,其中从凝胶切离0.1kb片段,并且使用凝胶提取试剂盒(凯杰公司)提取琼脂糖。简言之,将3体积的试剂盒-提供的缓冲液QG添加至该凝胶切片并在50℃下溶解持续大约10分钟。通过转移到该柱并且在13,000rpm下离心持续1分钟,将溶解的凝胶切片施用于试剂盒-提供的旋转柱。将该柱用750μl的试剂盒-提供的缓冲液PE洗涤并再次离心。用10μl的试剂盒-提供的缓冲液EB洗脱DNA。

将0.1kb PCR产物使用优越PCR克隆试剂盒插入到Sal I-消化的pJfyS148A中。该反应由以下各项构成:在10μl反应体积中1X反应缓冲液、125ng的pJfyS147A、20ng的FRT-F PCR产物、和1μl的酶。将该反应在50℃下孵育15分钟。然后通过添加至包含这些感受态细胞的单次使用管中并且将这些细胞在冰上孵育5分钟,添加40μl的Te至该反应,并且2μl被转化到ONE TOP10大肠杆菌化学感受态细胞(英杰公司)。将该试管在42℃下培养,持续30秒之后,添加250μl的SOC培养基。然后在37℃下伴随200rpm搅拌,将该管孵育1小时,并且将250μl转移到150mm 2XYT+氨苄西林平板上并且在37℃孵育过夜。将大肠杆菌转化体接种到在14ml管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,伴随在200rpm的搅拌。使用9600(凯杰公司)分离来自大肠杆菌转化体的质粒DNA。插入通过DNA测序来确认。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pJfyS148B。

实例14:质粒pJfyS156的构建

构建质粒pJfyS156,cbh2基因启动子和翻转酶基因使用以下所示基因特异性引物进行PCR扩增,并且插入到质粒pJfyS148B中。

翻转酶

正向引物:

5'-CACCCTCTGTGTATTGCACCATGCCCCAGTTCGATATCCTCTGCA-3'(SEQ ID NO:45)

反向引物:

5'-AAACTCTAGGATGCATGCAAGTGAGGCTATTGCCTATCAGCTC-3'(SEQ ID NO:46)

cbh2基因启动子

正向引物:

5'-CATCACACTGGCGGCCGCGAATTCTAGGCTAGGTATGC-3'(SEQ ID NO:47)

反向引物:

5'-GGTGCAATACACAGAGGGTG-3'(SEQ ID NO:48)

该PCR由以下各项构成:对于翻转酶PCR,20ng的模板pRiKa147,或对于cbh2启动子PCR,150ng的里氏木霉981-O-8基因组DNA、200μM dNTPs、0.4μM引物、1X反应缓冲液、和2单位的高保真DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;30个循环,每个循环在95℃下持续30秒,在57℃下持续30秒,以及在72℃下持续2分钟;以及1个循环,在72℃下持续7分钟。完成的PCR被提交至在TAE缓冲液中的1%琼脂糖凝胶电泳,其中从凝胶切离1.2和0.6kb带,分别对应于酿酒酵母翻转酶基因的编码区和NIAD终止子以及cbh2基因启动子,并且使用提取II试剂盒(Macherey-Nagel有限公司,美国宾夕法尼亚州伯利恒(Bethlehem,PA,USA))提取琼脂糖。将三体积的试剂盒提供的NT缓冲液添加至该凝胶切片上,并将该样品在50℃下加热10分钟。将全部溶液转移到试剂盒提供的离心柱。将该柱在13,000rpm下离心持续1分钟并且用试剂盒-提供的洗涤缓冲液NT3进行洗涤并再离心。将DNA用30μl的试剂盒-提供的洗脱NE缓冲液进行洗脱并且在13,000rpm下离心持续1分钟。

cbh2基因启动子和翻转酶编码序列使用优越PCR克隆试剂盒以单一步骤被插入到Xho I位线性化pJfyS148B中。该反应物由以下构成:在10μl反应体积中1X反应缓冲液、180ng的Xho I-位线性化pJfyS148B、100ng 0.6kb的cbh2启动子PCR产物、240ng的1.2kb的翻转酶PCR产物、和1μl酶。该反应在37℃下孵育15分钟,并且接着在50℃下持续15分钟。根据实例14,然后添加40μl的TE至该反应,并且2μl被转化到ONE TOP10大肠杆菌化学感受态细胞中。将大肠杆菌转化体接种到在14ml管中的3ml的LB+Amp培养基中,并且在37℃下孵育过夜,伴随在200rpm的搅拌。使用9600分离质粒DNA。插入通过DNA测序来确认。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pJfyS155。

使用以下所示的引物,通过PCR,从pEJG107(WO 05/047499)扩增烟曲霉β-葡糖苷酶基因。

正向引物:

5'-ACCGCGGACTGCGCACCATGAGATTCGGTTGGCTCGAGG-3'(SEQ ID NO:49)

反向引物:

5'-TTCGCCACGGAGCTTACTAGTAGACACGGGGCAGAGGC-3'(SEQ ID NO:50)

该PCR由以下各项构成:20ng的pEJG107、200μM dNTP、0.4μM引物、1X反应缓冲液、以及2单位的高保真DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;25个循环,每个循环在95℃下持续30秒,在57℃下持续30秒,以及在72℃下持续2分钟;以及1个循环,在72℃下持续7分钟。将完成的PCR提交至在TAE缓冲液中的1%琼脂糖电泳,其中从凝胶切离3kb带并且使用凝胶提取试剂盒提取琼脂糖(实例13)。

将烟曲霉β-葡糖苷酶PCR产物使用优越PCR克隆试剂盒被插入到Nco I/Pac I消化的pJfyS155中。该反应由以下各项构成:在10μl反应体积中150ng的Nco I/Pac I消化pJfyS155、100ng的烟曲霉β-葡萄糖苷酶PCR产物、1X优越缓冲液、和1μl的酶。该反应在37℃下孵育15分钟,并且接着在50℃下持续15分钟。根据实例13,然后添加40μl的TE至该反应,并且2μl被转化到ONE TOP10大肠杆菌化学感受态细胞中。使用9600分离来自大肠杆菌转化体的质粒DNA。插入通过DNA测序来确认。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pJfyS156(图9)。

实例15:质粒pDM313的构建

包含hpt标记的一部分、FRT-F3位点和里氏木霉gpdA启动子的一部分的0.38kb PCR片段使用以下所示的引物从pJfyS156扩增。

正向引物:

5’-CGTGTTTCTTCCCATTCGCATGCGACCTCGTGGTCATTGAC-3’(SEQ ID NO:51)

反向引物:

5’-

GCTTTGACGTTACATTGACGTACTTATAAGCGGCCGCCAGTGTGATGGA-3’(SEQ ID NO:52)

该PCR由以下构成:50皮摩尔的各引物、100ng的pJfyS156的DNA、1X的PHUSIONTM高保真热启动DNA聚合酶缓冲液(赛默飞世尔科技公司)、1μl的10mM dNTPs的共混物,和1个单位的PHUSIONTM高保真热启动DNA聚合酶(赛默飞世尔科技公司),最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒,在59℃下持续30秒,以及在72℃下持续1分钟;以及1个循环,在72℃下持续10分钟。

包含里氏木霉gpdA启动子的1.0kbPCR片段使用以下所示的引物,从里氏木霉RutC30基因组DNA扩增。

正向引物:

5’-

TCCATCACACTGGCGGCCGCTTATAAGTACGTCAATGTAACGTCAAAGC-3’(SEQ ID NO:53)

反向引物:

5’-

TGCAGAGGATATCGAACTGGGGCATTTTGTATCTGCGAATTGAGCTTG-3’(SEQ ID NO:54)

该PCR由以下构成:50皮摩尔的各引物、100ng的里氏木霉RutC30基因组DNA、1X的PHUSIONTM高保真热启动DNA聚合酶缓冲液、1μl的10mM dNTPs的共混物,和1个单位的PHUSIONTM高保真热启动DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒,在59℃下持续30秒,以及在72℃下持续1分钟;以及1个循环,在72℃下持续10分钟。

包含酿酒酵母翻转酶基因的编码区和niaD终止子的1.8kb PCR片段使用以下所示的引物从质粒pJfyS156扩增。

正向引物:

5’-

CAAGCTCAATTCGCAGATACAAAATGCCCCAGTTCGATATCCTCTGCA-3’(SEQ ID NO:55)

反向引物:

5’-GCTGTTTAAACTCTAGGATGCATGCAAGTGAGGCTATTGCC-3’(SEQ ID NO:56)

该PCR由以下构成:50皮摩尔的各引物、100ng的pJfyS156 DNA、1X的PHUSIONTM高保真热启动DNA聚合酶缓冲液、1μl的10mM dNTPs的共混物,和1个单位的PHUSIONTM高保真热启动DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒,在59℃下持续30秒,以及在72℃下持续1分钟;以及1个循环,在72℃下持续10分钟。

上述三个完成的PCR通过在TAE缓冲液中的0.8%琼脂糖凝胶电泳进行分析,其中0.38kb,1.0kb,和1.8kb的片段被确认。在原始反应中的PCR片段被用作如下描述的SOE PCR的模板。

0.38kb和1.0kb PCR片段使用如下所示的引物,通过SOE PCR被连接。

正向引物:

5’-CGTGTTTCTTCCCATTCGCATGCGACCTCGTGGTCATTGAC-3’(SEQ ID NO:57)

反向引物:

5’-

TGCAGAGGATATCGAACTGGGGCATTTTGTATCTGCGAATTGAGCTTG-3’(SEQ ID NO:58)

该PCR由以下构成:50皮摩尔的各引物、0.3μl的0.38kb片段PCR、0.6μl的1.0kb片段PCR、1X的PHUSIONTM高保真热启动DNA聚合酶缓冲液、1μl的10mM dNTPs的共混物,和1个单位的PHUSIONTM高保真热启动DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;34个循环,每个循环在98℃下持续15秒,60℃下持续30秒,以及在72℃下持续1.5分钟;以及1个循环,在72℃下持续10分钟。进行五个SOE PCR并且合并反应。1.36kb SOE PCR片段和包含翻转酶编码序列和niaD终止子的1.8kb PCR片段通过在TAE缓冲液中的0.8%琼脂糖凝胶电泳被分离,其中从凝胶切离1.36kb片段和1.8kb片段,并且使用的提取II试剂盒提取(实例14)。

十七μg的pJfyS156DNA用SphI消化并且通过在TAE缓冲液中的0.8%琼脂糖凝胶电泳被纯化,其中从凝胶切离大约8.7kb片段,并且使用的提取II试剂盒提取(实例14)。

1.36 kb SOE PCR片段和包含翻转酶编码序列和niaD终止子的1.8 kb PCR片段,使用 HD克隆试剂盒被插入SPH I消化的pJfyS156中。该反应由以下各项构成:在10μl反应体积中116ng的Sph I消化的pJfyS156、57ng的1.36 kb SOE PCR片段、69ng的1.8kb PCR片段、和2μl的具有酶的缓冲液。将该反应在50℃下孵育15分钟并且然后在冰上冷却。添加TE的40μl等分试样。根据实例13,两μl的反应转化到ONE TOP10大肠杆菌化学感受态细胞中。使用9600,将质粒DNA从转化体中分离。通过用Nsi I的限制性内切酶消化筛选转化体,这产生2.1kb,2.6kb,和7kb片段。一个克隆的DNA测序证实构建体包含没有PCR错误的正确插入。该构建体指定为pDM313。

实例16:质粒pQM43的构建

通过FRT-F位点,构建质粒pQM43,用于将在其5’侧翼是FRT-F位点的非功能amdS片段(指定为“非功能amdS片段3”)靶向至里氏木霉cbh1基因座。在该构建体中,FRT-F位点(49bp)添加至如以下描述的大约1kb非功能amdS片段的第一内含子内。包含里氏木霉cbh1 5’侧翼区和FRT-F片段的大约400bp片段使用如下所示的引物1208187和1208194从里氏木霉RutC30基因组DNA扩增。使用如下所示的引物1208195和1208196,从pAllo1(WO 04/111228)扩增侧翼是FRT-F位点的非功能amdS片段3。

引物1208187:

5’-GATTGAGTTGAAACTGCCTAAGATCTCG-3’(SEQ ID NO:59)

引物1208194:

5’-

CTATACTTTCTAGAGAATAGGAACTCGGAATAGGAACTTCAAGGTGCGCAGTCCGCGGTTGAC-3’(SEQ ID NO:60)

引物1208195:

5’-

CTATTCCGAGTTCCTATTCTCTAGAAAGTATAGGAACTTCGGCGTTGTTACATCTCCCTGAG-3’(SEQ ID NO:61)

引物1208196:

5’-GCGTCAGGCTTTCGCCACGTCTACGCCAGGACCGAGCAAG-3’(SEQ ID NO:62)

第一PCR由以下各项构成:100ng的里氏木霉RutC30基因组DNA、1μl的10mM的dNTPs、1μM引物、1X的高保真反应缓冲液(赛默飞世尔科技公司)、和1单位的热启动高保真DNA聚合酶(赛默飞世尔科技公司),最终体积为50μl。第二PCR由以下各项构成:100ng的pAllo1、1μl的10mM的dNTPs、1μM的引物、1X的高保真反应缓冲液,和1单位的热启动高保真DNA聚合酶,最终体积为50μl。两个反应均在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;35个循环,每个循环在95℃下持续15秒,在60℃下持续30秒,以及在72℃下持续1分15秒;以及1个循环,在72℃下持续10分钟。PCR产物通过在TAE缓冲液中的0.7%琼脂糖凝胶电泳被分离,其中从凝胶切离大约400kb和1kb片段,并且使用提取II试剂盒提取(实例14)。

第三PCR由以下各项构成:100ng的400bp和1kb纯化的PCR产物,1μl的10mM的dNTPs、1X的高保真反应缓冲液,和1单位的热启动高保真DNA聚合酶,最终体积为48μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;和5个循环,每个循环在95℃下持续15秒,在60℃下持续30秒,以及在72℃下持续2分钟。然后按1μM的终浓度添加引物1208187和1208196,并且继续30个循环,每个循环在95℃下持续15秒,在60℃下持续30秒,以及在72℃下持续2分钟;以及1个循环,在72℃下持续10分钟。如以上所述,PCR产物通过在TAE缓冲液中的0.7%琼脂糖凝胶电泳被分离,其中从凝胶切离大约1.4kb的片段,并且使用提取II试剂盒提取。

将1.4kb PCR产物使用IN-FUSIONTM HD克隆试剂盒(克罗泰克实验有限公司(Clontech Laboratories,Inc.))插入到大约9.3kb BgIII/Pac I消化的pJfyS139(WO 2013/028927)中。该反应由以下各项构成:在10μl反应体积中1X IN-FUSIONTM HD酶预混物(克罗泰克实验有限公司(Clontech Laboratories,Inc.))、200ng的BgIII/Pac I消化的pJfyS139、和61ng的1.4kb PCR产物。将该反应在50℃下孵育15分钟。根据实例13,孵育期后,1μl等分试样被转移到ONE TOP10化学感受态细胞。使用9600,将质粒DNA从转化体中分离。插入通过DNA测序来确认。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pQM43(图10)。

实例17:里氏木霉菌株AgJg115-104-7B1的原生质体产生和转化,用来缺失里氏木霉42kDa天冬氨酸蛋白酶,从而产生里氏木霉AgJg115-118-1H1

根据实例10,进行里氏木霉菌株AgJg115-104-7B1的原生质体制备和转化。

将九十六μg的转化质粒pAgJg118(WO 2011/075677)用Pme I消化,并且通过在TAE缓冲液中的1%琼脂糖凝胶电泳被纯化,其中从凝胶切离DNA带,并且使用凝胶提取试剂盒(凯杰公司)提取。简言之,将3体积的试剂盒-提供的缓冲液QG添加至该凝胶切片并在50℃下溶解持续大约10分钟。将溶解的凝胶切片转移到旋转柱,并且在13,000rpm下离心持续1分钟。将该柱用750μl的试剂盒-提供的缓冲液PE洗涤并然后重复该离心。用25μl的试剂盒-提供的缓冲液EB洗脱DNA。将大约1μl的所得纯化的DNA片段添加至100μl的原生质体溶液,用于如以上描述的潮霉素选择转化。将七个转化体传代培养到新PDA平板上以产生孢子。

里氏木霉菌株AgJg115-104-7B1的转化体通过真菌孢子PCR筛选pAgJg118缺失载体在42kDa的天冬氨酸蛋白酶基因座的存在。将来自每个转化体的少量孢子悬浮于20μl的稀释缓冲液(植物直接PCR试剂盒,赛默飞世尔科技公司(Thermo Fisher Scientific))中。将该孢子悬浮液用作PCR中的模板,来筛选天冬氨酸蛋白酶缺失。每个反应由以下各项构成:在20μl反应中0.5μl的孢子悬浮液、50pmol的引物069134(如下所示)、50pmol的引物067947(如下所示)、10μl的2X植物PCR缓冲液(植物直接PCR试剂盒)、以及0.4μl的热启动II DNA聚合酶(植物直接PCR试剂盒)。反应在热循环仪中进行,程序为1个循环,在98℃下持续5分钟;40个循环,每个循环在98℃下持续5秒,在58℃下持续5秒,以及在72℃下持续2分20秒;1个循环,在72℃下持续2分钟;以及10℃保持。引物069134位于5’侧翼区上游并且引物067947位于大肠杆菌潮霉素磷酸转移酶(hpt)基因编码区域的起始部位。如果将缺失载体整合到天冬氨酸蛋白酶基因座,该扩增的PCR片段将长2.4kb。指定为里氏木霉AgJg115-118-1的一个转化体被鉴定为具有缺失的天冬氨酸蛋白酶基因。

引物069134(正向):

5’-CGCAATCTATCGAATAGCAG-3’(SEQ ID NO:63)

引物067947(反向):

5’-CTACATCGAAGCTGAAAGCACGAGA-3’(SEQ ID NO:64)

缺失构建体pAgJg118包含大肠杆菌潮霉素磷酸转移酶(hpt)基因和侧翼是直接重复的单纯疱疹病毒胸苷激酶(tk)基因。插入直接重复以促进hpt和tk可选择的标记的固化并且产生42kDa天冬氨酸蛋白酶的完全缺失。

将来自里氏木霉AgJg115-118-1的孢子散布到木霉属基本培养基平板上,这些平板包包含1μM 5-氟-2’-脱氧尿苷(Fd U)并且在28℃下孵育。在PDA板上将九个分离株传代培养并且在28℃下孵育。以如上所述的相似的方式,然后通过真菌孢子PCR筛选这些分离株以检查是否不存在hpt和tk标记。该PCR筛选由以下各项构成:在20μl反应中0.5μl的孢子悬浮液、50pmol的引物069134、50pmol的引物1200593、10μl的2X植物PCR缓冲液、以及0.4μl的热启动II DNA聚合酶。反应在热循环仪中进行,程序为1个循环,在98℃下持续5分钟;40个循环,每个循环在98℃下持续5秒,在58℃下持续5秒,以及在72℃下持续1分45秒;1个循环,在72℃下持续1分钟;以及10℃保持。引物069134位于5’侧翼区的上游,并且引物067947位于3’侧翼区的下游。如果该天冬氨酸蛋白酶编码序列被缺失,并且hpt和tk标记被环出,那么扩增的PCR片段将长3.6kb。

里氏木霉AgJg115-118-1分离株的基因组DNA如实例11中所述制备,并且如实例12中所述通过Southern印迹分析来分析,以确认42kDa的天冬氨酸蛋白酶的缺失。如实例12所述,对于Southern印迹分析,用10单位的Nco I在30μl反应体积中消化2μg的每个基因组DNA,并且经受在TAE缓冲液中的0.7%琼脂糖电泳,并且转移到超负荷膜。

将该膜与500bp地高辛标记的里氏木霉C 42kDa天冬氨酸蛋白酶探针杂交,其中使用如下所示的引物通过PCR,通过掺入地高辛-11-dUTP合成该探针。

引物069860(正义):

5’-CTTCTATCTTGGGATGCTTCACGATACGTGA-3’(SEQ ID NO:65)

引物069861(反义):

5’-CGCGCCCTTGAATATCGGAGAAGGT-3’(SEQ ID NO:66)

该PCR由以下各项构成:5μl的10X Taq缓冲液(纽英伦生物技术有限公司)、2.5μl的PCR DIG标记的混合物(罗氏应用科学公司)、5ng的pAgJg118、10pmol每种引物、2.5μl的10mM dNTP、5单位的Taq DNA聚合酶(纽英伦生物技术有限公司)、以及36.5μl的水。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;30个循环,每个循环在95℃下持续30秒,在56℃下持续30秒,以及在72℃下持续40秒;1个循环,在72℃下持续15分钟;以及4℃保持。如以上所述,该探针通过在TAE缓冲液中的1%琼脂糖凝胶电泳被纯化,从凝胶切离,并且使用凝胶提取试剂盒提取。

Southern印迹分析对初级转化体里氏木霉AgJg115-118-1H1的鉴定为:包含该替换并且缺乏hpt/tk标记。

实例18:里氏木霉菌株QMJi057的构建,用于将侧翼是FRT-F位点的非功能amdS片段3靶向至里氏木霉cbh1基因座

用1-5μg的Pme I消化的pQM43转化里氏木霉AgJg115-118-1H1(实例17),用来在cbh1基因座插入在在其5’侧翼是FRT-F位点的非功能amdS片段3。获得二十六个转化体并且将每一个挑出并且转移到PDA平板,并且在30℃下孵育7天。转化体在2ml的CIM中培养,并且在30℃下伴随250rpm搅拌孵育3天并。来自每个培养的上清液经受使用8%-16%TGX无污凝胶(伯乐实验室有限公司)和PRECISION蛋白未染色标准(伯乐实验室有限公司)的SDS-PAGE。由于在cbh1基因座pQM43的成功靶向整合有效破坏了cbh1基因,目测分析SDS-PAGE凝胶的CBH1蛋白从蛋白质组的损失。里氏木霉QMJi057-5被鉴定为不产生CBHI蛋白并且被选择用于基因组DNA提取和Southern印迹分析,以确认在里氏木霉cbh1基因座的包含FRT-F位点的非功能amdS片段3的整合。根据实例11中所述的程序从转化体中分离基因组DNA。

基因组DNA用Nhe I消化,用于用地高辛标记的里氏木霉cbh1 3’探针的根据实例12的Southern印迹分析,和使用PCR DIG探针合成试剂盒(罗氏应用科学公司)和如下所示的引物,通过PCR合成该探针。

引物0610249:

5’-GAGAACACAGTGAGACCATAGC-3’(SEQ ID NO:67)

引物0610250:

5’-TCTCAACCCAATCAGCAACATG-3’(SEQ ID NO:68)

DIG探针合成PCR由以下各项构成:大约100pg的作为模板的用于制造pQM21(WO 2013/028912)的包含里氏木霉cbh1 3’侧翼区的PCR片段、1μM引物、5μl的PCR DIG合成混合物(罗氏应用科学公司),具有MgCl2的1X PCR缓冲液(罗氏应用科学公司),和0.75μl的酶混合物(罗氏应用科学公司),最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续2分钟;10个循环,每个循环在95℃下持续30秒,在60℃下持续30秒,以及在72℃下持续40秒;20个循环,每个循环在95℃下持续30秒,在60℃下持续30秒,以及在72℃下持续40秒,加上对于每个后续循环另外的20秒;以及1个循环,在72℃下持续7分钟。PCR产物通过在TAE缓冲液中的1%琼脂糖凝胶电泳被分离,其中从凝胶切离720bp带,并且使用提取II试剂盒提取(实例14)。

转化体QMJi057-5通过Southern印迹分析确认包含在cbh1基因座的在其5’侧翼是FRT-F位点的非功能amdS片段3,这导致了由里氏木霉cbh1 3’探针识别的在大约7.1kb的杂交信号。

实例19:在菌株QMJi057-5中,在里氏木霉cbh1基因座的位点特异性整合

包含黑曲霉甘露糖苷酶的编码序列的大约3Kb DNA片段(DNA序列为SEQ ID NO:69并且氨基酸序列为SEQ ID NO:70)从黑曲霉Bo-1衍生物菌株CKle47用引物0614762和0614763扩增,并且克隆至Nco I和Pac I消化的pMJ09(US 8318458B2;大约7.2kb),生成质粒pQM27(SEQ ID NO:71)。在pQM27中的黑曲霉甘露糖苷酶表达盒随后是功能amdS标记。

包含黑曲霉甘露表达盒、非功能amdS片段4和FRT-F位点的大约6.7kbDNA片段从pQM27用引物1201956和1201606扩增。该PCR由以下各项构成:100ng的pQM27、200μM dNTP、0.4μM引物、1X反应缓冲液、以及1单位的高保真DNA聚合酶,最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在98℃下持续2分钟;35个循环,每个循环在98℃下持续15秒,在60℃下持续30秒,以及在72℃下持续3.5分钟;以及1个循环,在72℃下持续10分钟。6.7kb PCR产物通过在TAE中的0.7%琼脂糖凝胶电泳被分离,从凝胶切离,并且使用提取II试剂盒提取(实例14)。

纯化的6.7kb的PCR产物被用作模板,使用引物1201956和1201957扩增包含FRT-F位点的片段。所得包含FRT-F位点的PCR片段通过TAE中的0.7%琼脂糖凝胶电泳你分离,并且然后从凝胶切离,并且使用提取II试剂盒提取(实例14)。

引物1210956:

5’-

TGATTACGAATTGTTTAAACGGATCCGAATGTAGGATTGTTATCCG-3’(SEQ ID NO:72)

引物1201606:

5’-

GAAGTTCCTATACTTTCTAGAGAATAGGAACTCGGAATAGGAACTTCAACCTTATGGGACTATCAAGCTGAC-3’(SEQ ID NO:73)

引物1210957:

5’-

GTTACATTGACGTACTTATAAGAAGTTCCTATACTTTCTAGAGAATAGGA-3’(SEQ ID NO:74)

纯化的包含FRT-F位点的PCR片段使用IN-FUSIONTMHD克隆试剂盒插入到XbaⅠ和Psi I消化的pDM313(大约5.4Kb)。该反应由以下各项构成:在15μl反应体积中1X IN-FUSIONTMHD酶预混物、323ng的Xba I/Psi I消化的pDM313,以及200ng的6.7kb包含FRT-F位点的PCR产物。将该反应在50℃下孵育15分钟。培养期后,通过添加至包含感受态细胞的管中,并且在冰上孵育细胞30分钟,2μl等分试样被转化到50μl的StellarTM大肠杆菌化学感受态细胞(克罗泰克实验有限公司(Clontech Laboratories,Inc.))中。将该试管在42℃下培养,持续45秒之后,添加450μl的SOC培养基。然后在37℃下伴随250rpm搅拌,将该管孵育1小时。50μl和150μl的体积被转移到两个150mm2XYT加氨苄青霉素平板。将这些平板在37℃下孵育过夜。使用9600分离质粒DNA,并且测序。一个转化体被鉴定为包含没有PCR错误的插入,并且该质粒指定为pQM45(图11)。

质粒pQM45被用Pme I消化,并且用来测试在菌株QMJi057-5中里氏木霉cbh1基因座的位点特异性整合。根据实例10,PME I消化的pQM45被转化到里氏木霉菌株QMJi057-5的原生质体中,并且将转化反应散布在COVE平板上,并且在30℃下孵育7-10天。所有的转化生成COVE平板上可见转化体,这表明插入FRT-F位点至amdS基因的第一内含子允许功能amdS标记的重组和在目标位点的整合。

根据在实例11中所述的程序从六个转化体中分离基因组DNA。基因组DN用EcoR I消化,用于用358bp的地高辛标记的里氏木霉cbh15’探针的根据实例12的Southern印迹分析(参见下文),该探针使用PCR DIG探针合成试剂盒,通过PCR,通过地高辛-11-dUTP的掺入合成。

所有六个转化体的Southern印迹分析生成在由里氏木霉cbh15’探针识别的在大约4.2kb的杂交信号,表明在cbh1基因座的正确整合。

里氏木霉CBH15’探针序列:

5’-TAGGGTCGGCAACGGCAAAAAAGCACGTGGCTCACCGAAAAGCAAGATGTTTGCGATCTAACATCCAGGAACCTGGATACATCCATCATCACGCACGACCACTTTGATCTGCTGTAAACTCGTATTCGCCCTAAACCGAAGTGCGTGGTAAATCTACACGTGGGCCCCTTTCGGTATACTGCGTGTGTCTTCTCTAGGTGCCATTCTTTTCCCTTCCTCTAGTGTTGAATTGTTTGTGTTGGAGTCCGAGCTGTAACTACCTCTGAATCTCTGGAGAATGGTGGACTAACGACTACCGTGCACCTGCATCATGTATATAATAGTGATCCTGAGAAGGGGGGTTTGGAGCAATGTGGG-3’(SEQ ID NO:75)

实例20:质粒pQM37,pQM38和pQM39(具有在amdS内含子中的FRT-F3位点的功能amdS标记的)的构建

构建质粒pQM37,pQM38和pQM39,以测试插入FRT-F3片段至amdS基因的3个内含子中的一个后的对amdS功能的影响。如下所示的引物被设计成使用 II XL定点突变试剂盒引入FRT-F3片段至质粒pAllo1中的amdS基因中的3个内含子的每一个中。引物1205503和1205504被用来构建质粒pQM37,其中FRT-F3位点被插入到amdS基因的内含子1中。引物1205505和1205506被用来构建质粒pQM38,其中FRT-F3位点被插入到amdS基因的内含子2中。引物1205507和1205508被用来构建pQM39,其中FRT-F3位点被插入到amdS基因的内含子3中。

引物1205503:

5’-

GGGAGATGTAACAACGCCTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCAACCTTATGGGACTATCAAG-3’(SEQ ID NO:76)

引物1205504:

5’-

CTTGATAGTCCCATAAGGTTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAGGCGTTGTTACATCTCCC-3’(SEQ ID NO:77)

引物1205505:

5’-

GCCCCTAAGTCGTTAGATGTTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCACCCTTTTTGTCAGC-3’(SEQ ID NO:78)

引物1205506:

5’-

GCTGACAAAAAGGGTGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAGGAACTTCAAACATCTAACGACTTAGGGGC-3’(SEQ ID NO:79)

引物1205507:

5’-

CTATACCAGGCCTCCACTTGAAGTTCCTATTCCGAGTTCCTATTCTTCAAATAGTATAGGAACTTCATGTCCTCCTTTCTTGC-3’(SEQ ID NO:80)

引物1205508:

5’-

GCAAGAAAGGAGGACATGAAGTTCCTATACTATTTGAAGAATAGGAACTCGGAATAG GAACTTCAAGTGGAGGCCTGGTATAG-3’(SEQ ID NO:81)

这些PCR由以下各项构成:10ng的pAllo1、1μl的10mM dNTPs、1X反应缓冲液、125ng的每个引物、1μl的试剂、和2.5单位的PfuUltraTM HF DNA聚合酶(安捷伦科技),最终体积为50μl。反应在热循环仪中进行,程序为1个循环,在95℃下持续1分钟;和18个循环,每个循环在95℃下持续50秒,在60℃下持续50秒,以及在68℃下持续7分钟;以及1个循环,在68℃下持续7分钟。10个单位的Dpn I被添加到各反应,并且在37℃下孵育一小时。2μl的每个Dpn I处理的反应被转化到XL10-Gold高效感受态大肠杆菌细胞中。将转化反应散布在2XYT加氨苄青霉素平板上。挑出每个转化约4-6个菌落并在3ml的LB加氨苄青霉素培养基在37℃下,伴随250rpm搅拌培养15-17小时。使用旋转迷你制备型试剂盒从每个菌落提取质粒DNA,并且提交用于DNA测序。包含插入到amdS基因的内含子1的FRT-F3位点的一个转化体被指定为pQM37。包含插入到amdS基因的内含子2的FRT-F3位点的一个转化体被指定为pQM38。包含插入到amdS基因的内含子3的FRT-F3位点的一个转化体被指定为pQM39。

约30-40μg的每个pAllo1,pQM37,pQM38、和pQM39用EcoR I和Pac I消化。消化的DNA使用提取II试剂盒被纯化(实施例14)。根据实例10,pAllo1,pQM37,pQM38、和pQM39的纯化线性DNA片段各自转化到里氏木霉RutC30原生质体中。将转化反应物散布在COVE平板上,并且在28℃下孵育7-10天。所有的转化生成COVE平板上可见转化体,表明amdS可以被用作具有插入到三个amdS内含子中任一个的FRT-F3位点的功能选择标记。

序列表

<110> 诺维信公司(Novozymes A/S)

<120> 多核苷酸文库的重组酶介导的整合

<130> NZ 12719-WO-PCT

<160> 81

<170> PatentIn版本3.5

<210> 1

<211> 16935

<212> DNA

<213> 人工序列

<220>

<223> 质粒 p002

<220>

<221> 尚未归类的特征

<222> (11869)..(11869)

<223> n is a, c, g, or t

<400> 1

ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 60

taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 120

tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 180

ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg 240

caacaggcag aatatcttcc gaattcaatc gactgcgcga tgcaagttgg ctagcaacgg 300

cgtacacctt gggattatgc gctgctcaac cgatggtcag ctatcaaaca aaatttggga 360

agatcgggct atactgacgg tgacattata gtacggcaag ctgagtgaca tctacggtcg 420

caagccactg cttctttggg catatgtttt ctttggcgtg ggatgcatta tcaggtagat 480

actccctttt tcttatacgc tggtttgctg gttcgtgctg acagctgttt ccctagcggt 540

attggtcgag acatggcgac tgtcatattg gggcgtgcaa tcagcggaat tgggggtgct 600

ggaacaatgg cgatgggctc tatcattatc acaggtaggc tagcagctta tcaggttgaa 660

agaactgtca ctgaacatag gcagatattg ttcctcgtcg agatgttgcc cattggcggg 720

cgtacatcaa tatcgcgatg actctgggtc gtagcgcagg aggcccaatc ggcggatggc 780

taaccgatac aatcggatgg agatggtatg ctttgcgcct ttgtgaccgc ttctctcact 840

aaattgtggc caaggtcgtt tattatccaa ggccccttag ccgctgtggc agctctgttg 900

gtgatatgga agctcaaact cgccaatcca gtcactgaga agagcatccg ccgtgtcgac 960

tttctcggaa cattcctcct ggccgtcggt attgttacaa tcaccgttat catggaccaa 1020

gcagggcagt ccttcgcatg ggcatcattg tcaacagcaa tccttgcaac tctcagtcta 1080

tcagcattcg tcgccttcgt ccttgttgaa ctctacgtag cccctgaacc gattttcgaa 1140

cttcgcatgt tgcggaagcc gaatgtgacg cccagttacc tgatcggatc gctgcagatc 1200

accgcccaag ttggaatgat gttctccgtg ccgttatatt ttcaggtgac atcgaaagcc 1260

tctgccaccg tagctggagg gcatctggtt cctgcagtga tcggaaacac gcttggcggc 1320

ttaatcgcgg gagcctttat ccgtcgcacc ggccaattca aggtcctctt gatccttgcc 1380

ggtctcgttg cgtccgtcgc ctatctactc ctcatccttc gctggaacgg tcatactgga 1440

ttctgggagt ccttgtacat tattcccggt ggtatgggta ctggtttctg ctctgcagct 1500

gcttttgtca gtatgacggc gtttttgatg ccgcaggaag tggccatggc aacaggaggt 1560

tacttcctat tattcagctt cgccatgacg gccggtgtca ctgtcactaa cagtctgctg 1620

gggacggttt tcaagcgcca gatggaacag cacctgacgg gtccaggagc caagaaggtt 1680

ggtatccccg caccttttct gcgtcactta ctaacgagta tatgaagatc atcgagcgcg 1740

cgctgtccga caccagctat atcaacggtt tgcagggtca tgtccgggat gtagtggtaa 1800

aaggatatgt gactggtctc cgctacactt actgtaagtc gtttgaatca tgcatccacc 1860

gtccacctta ttaacttggt gccagtattt tccctcattc tttcgctcct tggatcggtc 1920

ctcgcttgga ctgtacgaaa acaccaacta tgaggaacca gcacggcagc tgatagtatc 1980

cgaaagctgc aaattgcttc atcgaggctg gcattcgata gaagaaagaa ctatagacaa 2040

ctagtcttac aatatgacaa ttctctttga ttaataaatg aaaataacac ttgtgtcagc 2100

ctaatagccg agtggcgggc atctctggcg gcctcccgag cagcgtggat ctggaagtgc 2160

gttgatcatt attccccgaa aatgtagtac ccagtaagtg gtctagcggt ggctatggta 2220

ggacatctat gcctaagctg gagttctcat tgaacgtgta ccggccgatt gccctaaact 2280

ctgattgaga gccggaaacc tcatctacct gatgctcagg ggccatccaa tagcttccga 2340

tagcattaca gacagatgga ctcgtcttgg cccacgggtc tagaacagtc gccggaactg 2400

cctctatttg aaacggagct gaaccatgat acttaagcgt gccaagcggc gccgtttccc 2460

actggaacaa ggagcaatag aattctgcag agattcttca ttcaggctat tcagcaattc 2520

ggtttgtgga gcggatcggg gtccactggg tttagtctgg ggtttttctt tgcccgcatg 2580

ggctctagca catgcacagc ttgcagttgc tgctacgcta tctgggaaaa cgaatggcta 2640

ttcaggagtt tataaccaaa agagccggaa acaggctgat tgccctctca cggggagacg 2700

ttgtacttct gatccagagg ctattaaccg gacactacct ataaaggagg tagcattcct 2760

ttctgtccgg ctcccagatt ccaacaaccc aactgacagg ggatccacca tgccccagtt 2820

cgatatcctc tgcaagaccc cccccaaggt cctcgtccgc cagttcgtcg agcgcttcga 2880

gcgcccctcc ggcgagaaga tcgccctctg cgccgccgag ctcacctacc tctgctggat 2940

gatcacccat aacggcaccg ccatcaagcg cgccaccttc atgtcctaca acaccatcat 3000

ctccaactcc ctctccttcg atatcgtcaa caagtccctc cagttcaagt acaagaccca 3060

gaaggccacc atcctggagg cctccctcaa gaagctcatc cccgcctggg agttcaccat 3120

catcccctac tacggccaga agcatcagtc cgatatcacc gatatcgtct cctccctcca 3180

gctccagttc gagtcctccg aggaggccga taagggcaac tcccattcca agaagatgct 3240

caaggccctc ctctccgagg gcgagtccat ctgggagatc accgagaaga tcctcaactc 3300

cttcgagtac acctcccgct tcaccaagac caagaccctc taccagttcc tcttcctcgc 3360

caccttcatc aactgcggcc gcttctccga tatcaagaac gtcgatccca agtccttcaa 3420

gctcgtccag aacaagtacc tcggcgtcat catccagtgc ctcgtcaccg agaccaagac 3480

ctccgtctcc cgccatatct acttcttctc cgcccgcggc cgcatcgatc ccctcgtcta 3540

cctcgatgag ttcctccgca actccgagcc cgtcctcaag cgcgtcaacc gcaccggcaa 3600

ctcctcctcc aacaagcagg agtaccagct cctcaaggat aacctcgtcc gctcctacaa 3660

caaggccctc aagaagaacg ccccctactc catcttcgcc atcaagaacg gccccaagtc 3720

ccatatcggc cgccatctca tgacctcctt cctctccatg aagggcctca ccgagctcac 3780

caacgtcgtc ggcaactggt ccgataagcg cgcctccgcc gtcgcccgca ccacctacac 3840

ccatcagatc accgccatcc ccgatcatta cttcgcacta gtctcccgct actacgccta 3900

cgatcccatc tccaaggaga tgatcgccct caaggatgag accaacccca tcgaggagtg 3960

gcagcatatc gagcagctca agggctccgc cgagggctcc atccgctacc ccgcctggaa 4020

cggcatcatc tcccaggagg tcctcgatta cctctcctcc tacatcaacc gccgcatctg 4080

agtcgagatt atccaaggga atgacttaat gagtatgtaa gacatgggtc ataacggcgt 4140

tcgaaacata tacagggtta tgtttgggaa tagcacacga ataataacgt taataggtac 4200

caaagtcctt gatacattag cacggtagaa aaagaataat acaacgagct gggaatattc 4260

tttaatataa aactccaaga agagctggtg cggtggagct tgttttcgac tctcagtaat 4320

atttcctcat atccaagcgc gctaggaggt ggtcgaatac acatgtaggc gcttctctgg 4380

atgcaaaagt cgtgccggac ctgccgaaag actttgaaga tgcgttcacg ccatctaagt 4440

tgcgtagata attcacaaaa agggatgttt gtttccggaa tgtagcaaag agctgatagg 4500

caatagcctc actttcgtgg cgcacgccgc tcgttccatc catcctcgac aatggagcaa 4560

atgtcaaaat cgtaccgaaa atactttgct agcccgttaa attgccgtcg tcagccgtta 4620

aattaccgat taatcccgat aaatttccga gatctccgtt aaattgccgt tcgcagccgt 4680

taaattaccg gggacgaccg ataaatttcc gcgatgaatt catggtgttt tgatcatttt 4740

aaatttttat atggcgggtg gtgggcaact cgcttgcgcg ggcaactcgc ttaccgatta 4800

cgttagggct gatatttacg taaaaatcgt caagggatgc aagaccaaac cgttaaattt 4860

ccggagtcaa cagcatccaa gcccaagtcc ttcacggaga aaccccagcg tccacatcac 4920

gagcgaagga ccacctctag gcatcggacg caccatccaa ttagaagcag caaagcgaaa 4980

cagcccaaga aaaaggtcgg cccgtcggcc ttttctgcaa cgctgatcac gggcagcgat 5040

ccaaccaaca ccctccagag tgactagggg cggaaattta tcgggattaa tttccactca 5100

accacaaatc acagtcgtcc ccggtaattt aacggctgca gacggcaatt taacggcttc 5160

tgcgaatcgc ttggattccc cgcccctggc cgtagagctt aaagtatgtc ccttgtcgat 5220

gcgatgtatc acaacatata aatactggca agggatgcca tgcttggagc aacaatctca 5280

gaacaccaat atcaattcat ctcgagtctg aactcagaca acacaaattc ttcaaaattg 5340

aggatttagt cttgatcttg aagttcctat tccgagttcc tattctctag aaagtatagg 5400

aacttcttaa ttaacctagc cgttattact ctaccgcaag gcaacaacca gctcacccct 5460

gaggcacggg taccatgggt tgagtggtat ggggccatcc agagtcacct gtggcagcat 5520

gagactgcac tcgaagcagc catcaaccca gccaatattc tgggctttcc atccttagat 5580

cacatttgag atataaccca tttggtgaga gacacttgtg ccgttatacg tgtctagact 5640

ggaaacgcaa ccctgaaggg attcttcctt tgagagatgg aagcgtgtca tatctcttcg 5700

gttctacggc aggttttttt ctgctctttc gtagcatggc atggtcactt cagcgcttat 5760

ttacagttgc tggtattgat ttcttgtgca aattgctatc tgacacttat taggtcgagc 5820

tattcctttg ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct 5880

acacagccat cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc 5940

ccggctccgg atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa 6000

ttgccgtcaa ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg 6060

agccgcggcg atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc 6120

atacaagcca accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg 6180

aacatcgcct cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg 6240

ttggagccga aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc 6300

atcagctcat cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc 6360

cagtgataca catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga 6420

ccgattcctt gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg 6480

atcgcatcca tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg 6540

tcttgcaacg tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat 6600

tccccaatgt caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca 6660

taacgatctt tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct 6720

cctacatcga agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag 6780

acgctgtcga acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcgac 6840

attgctgagg tgtaggatcg atccgtttaa actctgtgtt agcttatagt caggatgttg 6900

gctcgacgag tgtaaactgg gagttggcat gagggttatg taggcttctt tagccccgca 6960

tccccctcat tctcctcatt gatcccgggg gagcggatgg tgttgataag agactaatta 7020

tagggtttag ctggtgccta gctggtgatt ggctggcttc gccgaatttt acgggccaag 7080

ggaagctgca gaaccgcggc actggtaaac ggtaattaag ctatcagccc catgctaacg 7140

agtttaaatt acgtgtattg ctgataaaca ccaacagagc tttactgaaa gatgggagtc 7200

acggtgtggc ttccccactg cgattattgc acaagcagcg agggcgaact tgactgtcgt 7260

cgctgagcag cctgcagtca aacatacata tatatcaacc gcgaagacgt ctggccttgt 7320

agaacacgac gctccctagc aacacctgcc gtgtcagcct ctacggttgt tacttgcatt 7380

caggatgctc tccagcgggc gagctattca aaatattcaa agcaggtatc tcgtattgcc 7440

aggattcagc tgaagcaaca ggtgccaagg aaatctgcgt cggttctcat ctgggcttgc 7500

tcggtcctgg cgtagactag tgcatgcttg aagttcctat tccgagttcc tattcttcaa 7560

atagtatagg aacttcaacc atgcctcaat cctgggaaga actggccgct gataagcgcg 7620

cccgcctcgc aaaaaccatc cctgatgaat ggaaagtcca gacgctgcct gcggaagaca 7680

gcgttattga tttcccaaag aaatcgggta tcctttcaga ggccgaactg aagatcacag 7740

aggcctccgc tgcagatctt gtgtccaagc tggcggccgg agagttgacc tcggcggaag 7800

ttacgctagc attctgtaaa cgggcagtaa tcgcccagca gttagtaggg tcccctctac 7860

ctctcaggga gatgtaacaa cgccacctta tgggactatc aagctgacgc tggcttctgt 7920

gcagacaaac tgcgcccacg agttcttccc tgacgccgct ctcgcgcagg caagggaact 7980

cgatgaatac tacgcaaagc acaagagacc cgttggtcca ctccatggcc tccccatctc 8040

tctcaaagac cagcttcgag tcaaggtaca ccgttgcccc taagtcgtta gatgtccctt 8100

tttgtcagct aacatatgcc accagggcta cgaaacatca atgggctaca tctcatggct 8160

aaacaagtac gacgaagggg actcggttct gacaaccatg ctccgcaaag ccggtgccgt 8220

cttctacgtc aagacctctg tcccgcagac cctgatggtc tgcgagacag tcaacaacat 8280

catcgggcgc accgtcaacc cacgcaacaa gaactggtcg tgcggcggca gttctggtgg 8340

tgagggtgcg atcgttggga ttcgtggtgg cgtcatcggt gtaggaacgg atatcggtgg 8400

ctcgattcga gtgccggccg cgttcaactt cctgtacggt ctaaggccga gtcatgggcg 8460

gctgccgtat gcaaagatgg cgaacagcat ggagggtcag gagacggtgc acagcgttgt 8520

cgggccgatt acgcactctg ttgagggtga gtccttcgcc tcttccttct tttcctgctc 8580

tataccaggc ctccactgtc ctcctttctt gctttttata ctatatacga gaccggcagt 8640

cactgatgaa gtatgttaga cctccgcctc ttcaccaaat ccgtcctcgg tcaggagcca 8700

tggaaatacg actccaaggt catccccatg ccctggcgcc agtccgagtc ggacattatt 8760

gcctccaaga tcaagaacgg cgggctcaat atcggctact acaacttcga cggcaatgtc 8820

cttccacacc ctcctatcct gcgcggcgtg gaaaccaccg tcgccgcact cgccaaagcc 8880

ggtcacaccg tgaccccgtg gacgccatac aagcacgatt tcggccacga tctcatctcc 8940

catatctacg cggctgacgg cagcgccgac gtaatgcgcg atatcagtgc atccggcgag 9000

ccggcgattc caaatatcaa agacctactg aacccgaaca tcaaagctgt taacatgaac 9060

gagctctggg acacgcatct ccagaagtgg aattaccaga tggagtacct tgagaaatgg 9120

cgggaggctg aagaaaaggc cgggaaggaa ctggacgcca tcatcgcgcc gattacgcct 9180

accgctgcgg tacggcatga ccagttccgg tactatgggt atgcctctgt gatcaacctg 9240

ctggatttca cgagcgtggt tgttccggtt acctttgcgg ataagaacat cgataagaag 9300

aatgagagtt tcaaggcggt tagtgagctt gatgccctcg tgcaggaaga gtatgatccg 9360

gaggcgtacc atggggcacc ggttgcagtg caggttatcg gacggagact cagtgaagag 9420

aggacgttgg cgattgcaga ggaagtgggg aagttgctgg gaaatgtggt gactccatag 9480

gtaagctccg tggcgaaagc ctgacgcacc ggtagattct tggtgagccc gtatcatgac 9540

ggcggcggga gctacatggc cccgggtgat ttattttttt tgtatctact tctgaccctt 9600

ttcaaatata cggtcaactc atctttcact ggagatgcgg cctgcttggt attgcgatgt 9660

tgtcagcttg gcaaattgtg gctttcgaaa acacaaaacg attccttagt agccatgcat 9720

tttaagataa cggaatagaa gaaagaggaa attaaaaaaa aaaaaaaaac aaacatcccg 9780

ttcataaccc gtagaatcgc cgctcttcgt gtatcccagt accacggcaa aggtatttca 9840

tgatcgttca atgttgatat tgttcccgcc agtatggctc cacccccatc tccgcgaatc 9900

tcctcttctc gaacgcggta gtggcgcgcc aattggtaat gacccatagg gagacaaaca 9960

gcataatagc aacagtggaa attagtggcg caataattga gaacacagtg agaccatagc 10020

tggcggcctg gaaagcactg ttggagacca acttgtccgt tgcgaggcca acttgcattg 10080

tctagagaat gcaatcataa cagaaagtac agccagcgct gtgtcataaa gaagtccagt 10140

tgggaaacga aagactagaa tcaaactaaa agtaatccgg ccgatatggc ttcacgtgcg 10200

aagtctcgcc ttgaggggac attgtccttg caggtgattg accattgcgt tcatatggcg 10260

cgatgtttgg tagtgtgggt gtagccggtg acctcacgga aggactaaag gccacatacc 10320

cttctgagtg cctcttctct tcgtggtcgg aactctcgaa tgggtttttg acagttgcac 10380

tcgtttggtt gtggtcattt gaaggtctgc gttcggtctt ctgttcgcgc aggcgagctg 10440

actgagggat tgaaagctgc atagccatcg ttggcatgcg ttaattcgcc aaagctcagc 10500

ggcgaaacag gcctgacctc taatccatgc atctgctctg cactcgattg ttcgtggtgt 10560

ccttgcgaag aaagagaagc cttggactcg gatgactttc tggacgaggt ggtaggatca 10620

tcatgattgt aatgagactg tagcacatca tgcgaatcat tcgacacacg gtgtctgccc 10680

aagttgacgt cagcatcggt atgcatttcg gtatggtcct catggttctc agcatgtccc 10740

tccagagggg actcatttcc agcggaagga ttataagcaa cataattgtc atgtggctgc 10800

gacctttcgt gagactccga gtttgatctc actgtggact catgggcgat atgcggctca 10860

tcatgatctt cgaatggaga gaaatggttg aagtcggagg acacgggtga tttagcagca 10920

gggttgaatg caacatagcc agtctcgcgc tcttcatgtg agctatatga gtcatgtggc 10980

ctgtcatggt ccagaggctc cggatgctca tggctagatt catcgtgtgc cgaaatcgcg 11040

tcactagcaa agggcgaggt tgacacattg gctgcaggac tgaacgccac ataaccactc 11100

tcaggctctt catgtgagtt ataggagctg tgcggcatat catagtcctg aggttcacga 11160

tgctcatggc tggattcatc gtgtgccgaa atagcgtgac tagcaaaagg cgagggcgaa 11220

gcattggttg ccggactgaa cgccacatag ccgtccccat tggctgaact gactggtgac 11280

aacgtcctac ccatggcgtc ggccgggcca gcggcttggt gagagtgaag accattagaa 11340

gtagctggac tgaacgatcg cagcgggtat tcgttttctt gagctggata aggggctgcg 11400

ccatgctggc tgaaaggtga gaatgttcgg ggtgctgctc tatcaccagg gaaggcagac 11460

gctggagtca aagaacgagt gttggatcaa ttgccggact gtatgaacgg aaaggagtgc 11520

tgattgttta aatggcccgt agccttcgct aggacctcgt gattcgggga ccgttggccc 11580

atacccagga gctggtgtaa aattggaacg cgacacgggt gtttggttgc gcagaatttg 11640

cggtgccggc gaggcgtgat caatctggct gtaacctggg cctggggtgt agtttgagac 11700

aggtgtttgt gttcgtggca tttgtggcgc tggcgacgct ctgtcagtcg gcccatatcc 11760

aggcgccgaa ggtgtgggcg taaacccttg ccgtgattta attaagaatt ctcctgtagg 11820

cttgagagtt caaggaagaa acagtgcaat tatctttgcg aacccaggng ctggtgacgg 11880

aattttcata gtcaagctat cagagtaaag aagaggagca tgtcaaagta caattagaga 11940

caaatatata gtcgcgtgga gccaagagcg gattcctcag tctcgtaggt ctcttgacga 12000

ccgttgatct gcttgatctc gtctcccgaa aatgaaaata gactctgcta agctattctt 12060

ctgcttcgcc ggagcctgaa gggcgtacta gggttgcgag gtccaatgca ttaatgcatt 12120

gcagatgagc tgtatctgga agaggtaaac ccgaaacgcg ttttattctt gttgacatgg 12180

agctattaaa tcactagaag gcactctttg ctgcttggac aaatgaacgt atcttatcga 12240

gatcctgaac accatttgtc tcaactccgg agctgacatc gacaccaacg atcttatatc 12300

cagattcgtc aagctgtttg atgatttcag taacgttaag tggatcgatc cggatagcgc 12360

gggttccttc cggtattgtc tccttccgtg tttcagttag cctcccccat ctcccgggca 12420

aacgtgcgcg ccaggtcgca tatcgtcggt atggagccgg gggtggtgac gtgggtctgg 12480

accatcccgg aggtaagttg cagcagggcg tcccggcagc cggcgggcga ttggtcgtaa 12540

tccaggataa agacgtgcat ggaacggagg cgtttggcca agacgtccaa ggcccaggca 12600

aacacgttat acaggtcgcc gttgggggcc agcaactcgg ggccccgaaa cagggtaaat 12660

aacgtgtccc cgatatgggg tcgtgggccc gcgttgctct ggggctcggc accctggggc 12720

ggcacggccg tccccgaaag ctgtccccag tcctcccgcc acgacccgcc gcactgcaga 12780

taccgcaccg tattggcaag tagcccgtaa acgcggcgaa tcgcagccag catagccagg 12840

tccagccgct cgccggggcg ctggcgtttg gccaggcggt cgatgtgtct gtcctccgga 12900

agggccccaa gcacgatgtt ggtgccgggc aaggtcggcg ggatgagggc cacgaacgcc 12960

agcacggcct ggggggtcat gctgcccata aggtaccgcg cggccgggta gcacaggagg 13020

gcggcgatgg gatggcggtc gaagatgagg gtgagggccg ggggcggggc atgtgagctc 13080

ccagcctccc ccccgatatg aggagccaga acggcgtcgg tcacggcata aggcatgccc 13140

attgttatct gggcgcttgt cattaccacc gccgcgtccc cggccgatat ctcaccctgg 13200

tcgaggcggt gttgtgtggt gtagatgttc gcgattgtct cggaagcccc cagcacccgc 13260

cagtaagtca tcggctcggg tacgtagacg atatcgtcgc gcgaacccag ggccaccagc 13320

agttgcgtgg tggtggtttt ccccatcccg tggggaccgt ctatataaac ccgcagtagc 13380

gtgggcattt tctgctccgg gcggacttcc gtggcttctt gctgccggcg agggcgcaac 13440

gccgtacgtc ggttgctatg gccgcgagaa cgcgcagcct ggtcgaacgc agacgcgtgt 13500

tgatggccgg ggtacgaagc catacgcgct tctacaaggc gctggccgaa gaggtgcggg 13560

agtttcacgc caccaagatc gatctacagc tggtggggag agcaggaaaa tatggcaaca 13620

aatgttggac tgacgcaacg accttgtcaa ccccgccgac acaccgggcg gacagacggg 13680

gcaaagctgc ctaccaggga ctgagggacc tcagcaggtc gagtgcagag caccggatgg 13740

gtcgactgcc agcttgtgtt cccggtctgc gccgctggcc agctcctgag cggcctttcc 13800

ggtttcatac accgggcaaa gcaggagagg cacgatattt ggacgcccta cagatgccgg 13860

atgggccaat tagggagctt acgcgccggg tactcgctct acctacttcg gagaaggtac 13920

tatctcgtga atcttttacc agatcggaag caattggact tctgtaccta ggttaatggc 13980

atgctatttc gccgacggct atacacccct ggcttcacat tctccttcgc ttactgccgg 14040

tgattcgatg aagctccata ttctccgatg atgcaataga ttcttggtca acgaggggca 14100

caccagcctt tccacttcgg ggcggagggg cggccggtcc cggattaata atcatccact 14160

gcacctcaga gccgccagag ctgtctggcg cagtggccgt tattactcag cccttctctc 14220

tgcgtccgtc cgtctctccg catgccagaa agagtcaccg gtcactgtac agagctcaag 14280

cttcgattaa ctcgaggggg ggcccggtac ccaattcgcc ctatagtgag tcgtattaca 14340

attcactggc cgtcgtttta caacgtcgtg actgggaaaa ccctggcgtt acccaactta 14400

atcgccttgc agcacatccc cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg 14460

atcgcccttc ccaacagttg cgcagcctga atggcgaatg gaaattgtaa gcgttaatat 14520

tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 14580

aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 14640

agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 14700

cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc 14760

gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 14820

gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 14880

ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 14940

gccgctacag ggcgcgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg 15000

tttatttttc taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat 15060

gcttcaataa tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat 15120

tccctttttt gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt 15180

aaaagatgct gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag 15240

cggtaagatc cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa 15300

agttctgcta tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg 15360

ccgcatacac tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct 15420

tacggatggc atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac 15480

tgcggccaac ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca 15540

caacatgggg gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat 15600

accaaacgac gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact 15660

attaactggc gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc 15720

ggataaagtt gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga 15780

taaatctgga gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg 15840

taagccctcc cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg 15900

aaatagacag atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca 15960

agtttactca tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta 16020

ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca 16080

ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg 16140

cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga 16200

tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa 16260

tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc 16320

tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg 16380

tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac 16440

ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct 16500

acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc 16560

ggtaagcggc agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg 16620

gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg 16680

ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct 16740

ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga 16800

taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg 16860

cagcgagtca gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc 16920

gcgttggccg attca 16935

<210> 2

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> FLP 重组酶识别序列

<400> 2

ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttc 49

<210> 3

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> FLP 重组酶识别序列

<400> 3

ttgaagttcc tattccgagt tcctattctt caaatagtat aggaacttca 50

<210> 4

<211> 6055

<212> DNA

<213> 人工序列

<220>

<223> 载体 pFRT-GIAMG

<400> 4

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cttgaagttc ctattccgag 420

ttcctattct ctagaaagta taggaacttc ctcgagacca tgtaccgctt ccttgtctgt 480

gctctcgggc ttctggggac agtcctcgct cagtcagtcg acagttatgt cggcagcgaa 540

ggccccatag caaaggccgg cgtccttgcc aacattgggc cgaacggctc aaaggcctct 600

ggtgcagccg ccggcgtggt ggtggctagc cccagcaagt cggatcccga ctattggtac 660

acttggacgc gtgactcgtc actcgttttc aagtctctca ttgatcagta caccactggt 720

atcgacagca cgagttcgtt gaggtctctg atagacagtt tcgttattgc cgaggccaac 780

attcagcagg tctctaatcc cagcggcact cttactaccg gcggcttggg agagccaaaa 840

ttcaatgtcg atgaaactgc attcaccggt gcatggggtc gaccccagcg cgacggacct 900

gcgctccgtg cgactgcttt gatcacctac ggtaactggc tcttgtcaaa cgggaacacg 960

acctgggtta ccagtacgct gtggccgatc atccagaacg atctcaacta cgtcgttcag 1020

tactggaacc agaccacctt cgacctctgg gaagaagtga actcttcctc gttcttcacc 1080

actgcagtgc agcaccgtgc cttgcgcgaa ggcgcagcat tcgctaccaa gatcggtcag 1140

acctcctcgg tcagcagcta cacaacccaa gcggcgaatc tactttgctt tttgcagtct 1200

tactggaacc ccacttccgg atatatcacc gctaacactg gcggtggtcg gtccggcaag 1260

gacgccaaca ccctcttggc atccatccac acttacgacc ccagcgcggg ctgcgatgcc 1320

acgaccttcc agccctgctc cgacaaagcc ctctcgaatc tgaaggttta cgtcgactcc 1380

ttccgttctg tctactccat caacagcggt attgcctcta acgccgctgt cgccactggt 1440

cgctacccgg aagacagcta ccagggcggg aacccatggt acctcactac gttcgccgtc 1500

gccgagcagc tctatgacgc cctcaatgtc tgggctgctc agggctccct caatgtcacc 1560

tccatctccc tccccttctt ccagcagttc tcctctagtg tcactgccgg cacttacgct 1620

tcgagctcca ccacttacac gactctgacc tccgccatta agagcttcgc ggatggattc 1680

gtcgctatca acgcccagta cacgccgtcc aacggtggcc tcgctgagca gttcagcagg 1740

agcaacggcg ctcccgtcag cgctgttgat ttgacatgga gctatgcatc tgcattgacc 1800

gcgtttgaag cgaggaataa tactcagttc gccggctggg gcgcggtagg tttgactgtg 1860

ccgacctcgt gctccagcaa cagtggtgga ggcggaggat cgactgtcgc cgtgacgttc 1920

aacgtgaacg cccaaacggt ttggggcgaa aacatctaca tcactggctc ggttgacgct 1980

ctgagtaact ggtctcccga caacgccctc ttgctctcgt ctgccaacta cccgacctgg 2040

agcattaccg tgaatttacc cgcgagcact gccattcagt ataagtatat ccgcaagaac 2100

aacggagctg tcacctggga atccgatccc aacaacagca taactactcc agccagcggc 2160

tccgtgaccg agaatgacac ttggcgttaa ttaattaata ataaataacg gattgtgtcc 2220

gtaatcacac gtgcccgtgg tgcgtacgat aacgcatagt gtttttccct ccacttaaat 2280

cgaagggttg tgtcttggat cgcgcgggtc aaatgtatat ggttcatata catccgcagg 2340

cacgtaataa agcgaggggt tcgaatcccc ccgttacccc cggtaggggc ccagatccgg 2400

gtgactgaca cctggcggta gacaatcaat ccatttcgct atagttaaag gatggggatg 2460

agggcaattg gttatatgat catgtatgta gtgggtgtgc ataatagtag tgaaatggaa 2520

gccaagtcat gtgattgtaa tcgaccgacg gaattgagga tatccggaaa tacagacacc 2580

gtgaaagcca tggtctttcc ttcgtgtaga agaccagaca gacagtccct gatttaccct 2640

tgcacaaagc actagaaaat tagcattcca tccttctctg cttgctctgc tgatatcact 2700

gtcattcaat gcatagccat gagctcatct tagatccaag cacgtaattc catagccgag 2760

gtccacagtg gagcagcaac attccccatc attgctttcc ccaggggcct cccaacgact 2820

aaatcaagag tatatctcta ccgtccaata gatcgtcttc gcttcaaaat ctttgacaat 2880

tccaagaggg tccccatcca tcaaacccag ttcaataata gccgagatgc atggtggagt 2940

caattaggca gtattgctgg aatgtcgggg ccagttggcc cggtggtcat tggccgcctg 3000

tgatgccatc tgccactaaa tccgatcatt gatccaccgc ccacgaggcg cgtctttgct 3060

ttttgcgcgg cgtccaggtt caactctctc cactagtcta gcggggttca aatgcaaaca 3120

agtacaacac gcagcaaacg aagcagccca ccactgcgtt gatgcccagt ttgactgtcc 3180

gaaatccacc ggaaaggtgg aaacatacta tgtaacaatc agagggaaga aaaaattttt 3240

atcgacgagg caggatagtg actgatggtg gggtcatggt cgggtctccg agcgaaagag 3300

aaccaaggaa acaagatcaa cgaggttggt gtacccaaaa ggccgcagca acaagagtca 3360

tcgcccaaaa gtcaacagtc tggaagagac tccgccgtgc agattctgcg tcggtcccgc 3420

acatgcgtgg tgggggcatt acccctccat gtccaatgat aagggcggcg gtcgagggct 3480

taagcccgcc cactaattcg ccttctcgct tgcccctcca tataaggatt ccccctcctt 3540

cccctcccac aacttttttc cttctttctc tcttcgtccg catcagtacg tatatctttc 3600

ccccatacct cctttcctac tcttcttcca ttcattcaac tcttctcctt actgacatct 3660

gttttgctca gtacctctac gcgatcagcc gtagtatctg agcaagcttc tctacagaat 3720

ctttctagta tcttacaaag aactacaaag ttcgcaccat tgaagttcct attccgagtt 3780

cctattcttc aaatagtata ggaacttcag catgcaagct tggcgtaatc atggtcatag 3840

ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc 3900

ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc 3960

tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa 4020

cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 4080

ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 4140

ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 4200

gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 4260

gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 4320

taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 4380

accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 4440

tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 4500

cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 4560

agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 4620

gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 4680

gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 4740

tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 4800

acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 4860

cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 4920

acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 4980

acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 5040

tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 5100

ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 5160

ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 5220

tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 5280

aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 5340

ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 5400

ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 5460

gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 5520

gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 5580

cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 5640

actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 5700

ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 5760

tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 5820

ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 5880

agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 5940

aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc 6000

attattatca tgacattaac ctataaaaat aggcgtatca cgaggccctt tcgtc 6055

<210> 5

<211> 1731

<212> DNA

<213> 密粘褶菌

<400> 5

atgtaccgct tccttgtctg tgctctcggg cttctgggga cagtcctcgc tcagtcagtc 60

gacagttatg tcggcagcga aggccccata gcaaaggccg gcgtccttgc caacattggg 120

ccgaacggct caaaggcctc tggtgcagcc gccggcgtgg tggtggctag ccccagcaag 180

tcggatcccg actattggta cacttggacg cgtgactcgt cactcgtttt caagtctctc 240

attgatcagt acaccactgg tatcgacagc acgagttcgt tgaggtctct gatagacagt 300

ttcgttattg ccgaggccaa cattcagcag gtctctaatc ccagcggcac tcttactacc 360

ggcggcttgg gagagccaaa attcaatgtc gatgaaactg cattcaccgg tgcatggggt 420

cgaccccagc gcgacggacc tgcgctccgt gcgactgctt tgatcaccta cggtaactgg 480

ctcttgtcaa acgggaacac gacctgggtt accagtacgc tgtggccgat catccagaac 540

gatctcaact acgtcgttca gtactggaac cagaccacct tcgacctctg ggaagaagtg 600

aactcttcct cgttcttcac cactgcagtg cagcaccgtg ccttgcgcga aggcgcagca 660

ttcgctacca agatcggtca gacctcctcg gtcagcagct acacaaccca agcggcgaat 720

ctactttgct ttttgcagtc ttactggaac cccacttccg gatatatcac cgctaacact 780

ggcggtggtc ggtccggcaa ggacgccaac accctcttgg catccatcca cacttacgac 840

cccagcgcgg gctgcgatgc cacgaccttc cagccctgct ccgacaaagc cctctcgaat 900

ctgaaggttt acgtcgactc cttccgttct gtctactcca tcaacagcgg tattgcctct 960

aacgccgctg tcgccactgg tcgctacccg gaagacagct accagggcgg gaacccatgg 1020

tacctcacta cgttcgccgt cgccgagcag ctctatgacg ccctcaatgt ctgggctgct 1080

cagggctccc tcaatgtcac ctccatctcc ctccccttct tccagcagtt ctcctctagt 1140

gtcactgccg gcacttacgc ttcgagctcc accacttaca cgactctgac ctccgccatt 1200

aagagcttcg cggatggatt cgtcgctatc aacgcccagt acacgccgtc caacggtggc 1260

ctcgctgagc agttcagcag gagcaacggc gctcccgtca gcgctgttga tttgacatgg 1320

agctatgcat ctgcattgac cgcgtttgaa gcgaggaata atactcagtt cgccggctgg 1380

ggcgcggtag gtttgactgt gccgacctcg tgctccagca acagtggtgg aggcggagga 1440

tcgactgtcg ccgtgacgtt caacgtgaac gcccaaacgg tttggggcga aaacatctac 1500

atcactggct cggttgacgc tctgagtaac tggtctcccg acaacgccct cttgctctcg 1560

tctgccaact acccgacctg gagcattacc gtgaatttac ccgcgagcac tgccattcag 1620

tataagtata tccgcaagaa caacggagct gtcacctggg aatccgatcc caacaacagc 1680

ataactactc cagccagcgg ctccgtgacc gagaatgaca cttggcgtta a 1731

<210> 6

<211> 576

<212> PRT

<213> 密粘褶菌

<400> 6

Met Tyr Arg Phe Leu Val Cys Ala Leu Gly Leu Leu Gly Thr Val Leu

1 5 10 15

Ala Gln Ser Val Asp Ser Tyr Val Gly Ser Glu Gly Pro Ile Ala Lys

20 25 30

Ala Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly

35 40 45

Ala Ala Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp

50 55 60

Tyr Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu

65 70 75 80

Ile Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Ser

85 90 95

Leu Ile Asp Ser Phe Val Ile Ala Glu Ala Asn Ile Gln Gln Val Ser

100 105 110

Asn Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe

115 120 125

Asn Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg

130 135 140

Asp Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly Asn Trp

145 150 155 160

Leu Leu Ser Asn Gly Asn Thr Thr Trp Val Thr Ser Thr Leu Trp Pro

165 170 175

Ile Ile Gln Asn Asp Leu Asn Tyr Val Val Gln Tyr Trp Asn Gln Thr

180 185 190

Thr Phe Asp Leu Trp Glu Glu Val Asn Ser Ser Ser Phe Phe Thr Thr

195 200 205

Ala Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Lys

210 215 220

Ile Gly Gln Thr Ser Ser Val Ser Ser Tyr Thr Thr Gln Ala Ala Asn

225 230 235 240

Leu Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ser Gly Tyr Ile

245 250 255

Thr Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu

260 265 270

Leu Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Thr

275 280 285

Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr

290 295 300

Val Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Ile Ala Ser

305 310 315 320

Asn Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly

325 330 335

Gly Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr

340 345 350

Asp Ala Leu Asn Val Trp Ala Ala Gln Gly Ser Leu Asn Val Thr Ser

355 360 365

Ile Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Ser Val Thr Ala Gly

370 375 380

Thr Tyr Ala Ser Ser Ser Thr Thr Tyr Thr Thr Leu Thr Ser Ala Ile

385 390 395 400

Lys Ser Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Gln Tyr Thr Pro

405 410 415

Ser Asn Gly Gly Leu Ala Glu Gln Phe Ser Arg Ser Asn Gly Ala Pro

420 425 430

Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala

435 440 445

Phe Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Val Gly

450 455 460

Leu Thr Val Pro Thr Ser Cys Ser Ser Asn Ser Gly Gly Gly Gly Gly

465 470 475 480

Ser Thr Val Ala Val Thr Phe Asn Val Asn Ala Gln Thr Val Trp Gly

485 490 495

Glu Asn Ile Tyr Ile Thr Gly Ser Val Asp Ala Leu Ser Asn Trp Ser

500 505 510

Pro Asp Asn Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser

515 520 525

Ile Thr Val Asn Leu Pro Ala Ser Thr Ala Ile Gln Tyr Lys Tyr Ile

530 535 540

Arg Lys Asn Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser

545 550 555 560

Ile Thr Thr Pro Ala Ser Gly Ser Val Thr Glu Asn Asp Thr Trp Arg

565 570 575

<210> 7

<211> 16642

<212> DNA

<213> 人工序列

<220>

<223> 质粒 p007

<220>

<221> 尚未归类的特征

<222> (11576)..(11576)

<223> n is a, c, g, or t

<400> 7

ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg ggcagtgagc gcaacgcaat 60

taatgtgagt tagctcactc attaggcacc ccaggcttta cactttatgc ttccggctcg 120

tatgttgtgt ggaattgtga gcggataaca atttcacaca ggaaacagct atgaccatga 180

ttacgccaag ctcgaaatta accctcacta aagggaacaa aagctggagc tccaccgcgg 240

caacaggcag aatatcttcc gaattcaatc gactgcgcga tgcaagttgg ctagcaacgg 300

cgtacacctt gggattatgc gctgctcaac cgatggtcag ctatcaaaca aaatttggga 360

agatcgggct atactgacgg tgacattata gtacggcaag ctgagtgaca tctacggtcg 420

caagccactg cttctttggg catatgtttt ctttggcgtg ggatgcatta tcaggtagat 480

actccctttt tcttatacgc tggtttgctg gttcgtgctg acagctgttt ccctagcggt 540

attggtcgag acatggcgac tgtcatattg gggcgtgcaa tcagcggaat tgggggtgct 600

ggaacaatgg cgatgggctc tatcattatc acaggtaggc tagcagctta tcaggttgaa 660

agaactgtca ctgaacatag gcagatattg ttcctcgtcg agatgttgcc cattggcggg 720

cgtacatcaa tatcgcgatg actctgggtc gtagcgcagg aggcccaatc ggcggatggc 780

taaccgatac aatcggatgg agatggtatg ctttgcgcct ttgtgaccgc ttctctcact 840

aaattgtggc caaggtcgtt tattatccaa ggccccttag ccgctgtggc agctctgttg 900

gtgatatgga agctcaaact cgccaatcca gtcactgaga agagcatccg ccgtgtcgac 960

tttctcggaa cattcctcct ggccgtcggt attgttacaa tcaccgttat catggaccaa 1020

gcagggcagt ccttcgcatg ggcatcattg tcaacagcaa tccttgcaac tctcagtcta 1080

tcagcattcg tcgccttcgt ccttgttgaa ctctacgtag cccctgaacc gattttcgaa 1140

cttcgcatgt tgcggaagcc gaatgtgacg cccagttacc tgatcggatc gctgcagatc 1200

accgcccaag ttggaatgat gttctccgtg ccgttatatt ttcaggtgac atcgaaagcc 1260

tctgccaccg tagctggagg gcatctggtt cctgcagtga tcggaaacac gcttggcggc 1320

ttaatcgcgg gagcctttat ccgtcgcacc ggccaattca aggtcctctt gatccttgcc 1380

ggtctcgttg cgtccgtcgc ctatctactc ctcatccttc gctggaacgg tcatactgga 1440

ttctgggagt ccttgtacat tattcccggt ggtatgggta ctggtttctg ctctgcagct 1500

gcttttgtca gtatgacggc gtttttgatg ccgcaggaag tggccatggc aacaggaggt 1560

tacttcctat tattcagctt cgccatgacg gccggtgtca ctgtcactaa cagtctgctg 1620

gggacggttt tcaagcgcca gatggaacag cacctgacgg gtccaggagc caagaaggtt 1680

ggtatccccg caccttttct gcgtcactta ctaacgagta tatgaagatc atcgagcgcg 1740

cgctgtccga caccagctat atcaacggtt tgcagggtca tgtccgggat gtagtggtaa 1800

aaggatatgt gactggtctc cgctacactt actgtaagtc gtttgaatca tgcatccacc 1860

gtccacctta ttaacttggt gccagtattt tccctcattc tttcgctcct tggatcggtc 1920

ctcgcttgga ctgtacgaaa acaccaacta tgaggaacca gcacggcagc tgatagtatc 1980

cgaaagctgc aaattgcttc atcgaggctg gcattcgata gaagaaagaa ctatagacaa 2040

ctagtcttac aatatgacaa ttctctttga ttaataaatg aaaataacac ttgtgtcagc 2100

ctaatagccg agtggcgggc atctctggcg gcctcccgag cagcgtggat ctggaagtgc 2160

gttgatcatt attccccgaa aatgtagtac ccagtaagtg gtctagcggt ggctatggta 2220

ggacatctat gcctaagctg gagttctcat tgaacgtgta ccggccgatt gccctaaact 2280

ctgattgaga gccggaaacc tcatctacct gatgctcagg ggccatccaa tagcttccga 2340

tagcattaca gacagatgga ctcgtcttgg cccacgggtc tagaacagtc gccggaactg 2400

cctctatttg aaacggagct gaaccatgat acttaagcgt gccaagcggc gccgtttccc 2460

actggaacaa ggagcaatag aattctgcag agattcttca ttcaggctat tcagcaattc 2520

ggtttgtgga gcggatcggg gtccactggg tttagtctgg ggtttttctt tgcccgcatg 2580

ggctctagca catgcacagc ttgcagttgc tgctacgcta tctgggaaaa cgaatggcta 2640

ttcaggagtt tataaccaaa agagccggaa acaggctgat tgccctctca cggggagacg 2700

ttgtacttct gatccagagg ctattaaccg gacactacct ataaaggagg tagcattcct 2760

ttctgtccgg ctcccagatt ccaacaaccc aactgacagg ggatccacca tgccccagtt 2820

cgatatcctc tgcaagaccc cccccaaggt cctcgtccgc cagttcgtcg agcgcttcga 2880

gcgcccctcc ggcgagaaga tcgccctctg cgccgccgag ctcacctacc tctgctggat 2940

gatcacccat aacggcaccg ccatcaagcg cgccaccttc atgtcctaca acaccatcat 3000

ctccaactcc ctctccttcg atatcgtcaa caagtccctc cagttcaagt acaagaccca 3060

gaaggccacc atcctggagg cctccctcaa gaagctcatc cccgcctggg agttcaccat 3120

catcccctac tacggccaga agcatcagtc cgatatcacc gatatcgtct cctccctcca 3180

gctccagttc gagtcctccg aggaggccga taagggcaac tcccattcca agaagatgct 3240

caaggccctc ctctccgagg gcgagtccat ctgggagatc accgagaaga tcctcaactc 3300

cttcgagtac acctcccgct tcaccaagac caagaccctc taccagttcc tcttcctcgc 3360

caccttcatc aactgcggcc gcttctccga tatcaagaac gtcgatccca agtccttcaa 3420

gctcgtccag aacaagtacc tcggcgtcat catccagtgc ctcgtcaccg agaccaagac 3480

ctccgtctcc cgccatatct acttcttctc cgcccgcggc cgcatcgatc ccctcgtcta 3540

cctcgatgag ttcctccgca actccgagcc cgtcctcaag cgcgtcaacc gcaccggcaa 3600

ctcctcctcc aacaagcagg agtaccagct cctcaaggat aacctcgtcc gctcctacaa 3660

caaggccctc aagaagaacg ccccctactc catcttcgcc atcaagaacg gccccaagtc 3720

ccatatcggc cgccatctca tgacctcctt cctctccatg aagggcctca ccgagctcac 3780

caacgtcgtc ggcaactggt ccgataagcg cgcctccgcc gtcgcccgca ccacctacac 3840

ccatcagatc accgccatcc ccgatcatta cttcgcacta gtctcccgct actacgccta 3900

cgatcccatc tccaaggaga tgatcgccct caaggatgag accaacccca tcgaggagtg 3960

gcagcatatc gagcagctca agggctccgc cgagggctcc atccgctacc ccgcctggaa 4020

cggcatcatc tcccaggagg tcctcgatta cctctcctcc tacatcaacc gccgcatctg 4080

agtcgagatt atccaaggga atgacttaat gagtatgtaa gacatgggtc ataacggcgt 4140

tcgaaacata tacagggtta tgtttgggaa tagcacacga ataataacgt taataggtac 4200

caaagtcctt gatacattag cacggtagaa aaagaataat acaacgagct gggaatattc 4260

tttaatataa aactccaaga agagctggtg cggtggagct tgttttcgac tctcagtaat 4320

atttcctcat atccaagcgc gctaggaggt ggtcgaatac acatgtaggc gcttctctgg 4380

atgcaaaagt cgtgccggac ctgccgaaag actttgaaga tgcgttcacg ccatctaagt 4440

tgcgtagata attcacaaaa agggatgttt gtttccggaa tgtagcaaag agctgatagg 4500

caatagcctc actttcgtgg cgcacgccgc tcgttccatc catcctcgac aatggagcaa 4560

atgtcaaaat cgtaccgaaa atactttgct agcccgttaa attgccgtcg tcagccgtta 4620

aattaccgat taatcccgat aaatttccga gatctccgtt aaattgccgt tcgcagccgt 4680

taaattaccg gggacgaccg ataaatttcc gcgatgaatt catggtgttt tgatcatttt 4740

aaatttttat atggcgggtg gtgggcaact cgcttgcgcg ggcaactcgc ttaccgatta 4800

cgttagggct gatatttacg taaaaatcgt caagggatgc aagaccaaac cgttaaattt 4860

ccggagtcaa cagcatccaa gcccaagtcc ttcacggaga aaccccagcg tccacatcac 4920

gagcgaagga ccacctctag gcatcggacg caccatccaa ttagaagcag caaagcgaaa 4980

cagcccaaga aaaaggtcgg cccgtcggcc ttttctgcaa cgctgatcac gggcagcgat 5040

ccaaccaaca ccctccagag tgactagggg cggaaattta tcgggattaa tttccactca 5100

accacaaatc acagtcgtcc ccggtaattt aacggctgca gacggcaatt taacggcttc 5160

tgcgaatcgc ttggattccc cgcccctggc cgtagagctt aaagtatgtc ccttgtcgat 5220

gcgatgtatc acaacatata aatactggca agggatgcca tgcttggagc aacaatctca 5280

gaacaccaat atcaattcat ctcgagtctg aactcagaca acacaaattc ttcaaaattg 5340

aggatttagt cttgatcttg aagttcctat tccgagttcc tattctctag aaagtatagg 5400

aacttcttaa ttaacctagc cgttattact ctaccgcaag gcaacaacca gctcacccct 5460

gaggcacggg taccatgggt tgagtggtat ggggccatcc agagtcacct gtggcagcat 5520

gagactgcac tcgaagcagc catcaaccca gccaatattc tgggctttcc atccttagat 5580

cacatttgag atataaccca tttggtgaga gacacttgtg ccgttatacg tgtctagact 5640

ggaaacgcaa ccctgaaggg attcttcctt tgagagatgg aagcgtgtca tatctcttcg 5700

gttctacggc aggttttttt ctgctctttc gtagcatggc atggtcactt cagcgcttat 5760

ttacagttgc tggtattgat ttcttgtgca aattgctatc tgacacttat taggtcgagc 5820

tattcctttg ccctcggacg agtgctgggg cgtcggtttc cactatcggc gagtacttct 5880

acacagccat cggtccagac ggccgcgctt ctgcgggcga tttgtgtacg cccgacagtc 5940

ccggctccgg atcggacgat tgcgtcgcat cgaccctgcg cccaagctgc atcatcgaaa 6000

ttgccgtcaa ccaagctctg atagagttgg tcaagaccaa tgcggagcat atacgcccgg 6060

agccgcggcg atcctgcaag ctccggatgc ctccgctcga agtagcgcgt ctgctgctcc 6120

atacaagcca accacggcct ccagaagaag atgttggcga cctcgtattg ggaatccccg 6180

aacatcgcct cgctccagtc aatgaccgct gttatgcggc cattgtccgt caggacattg 6240

ttggagccga aatccgcgtg cacgaggtgc cggacttcgg ggcagtcctc ggcccaaagc 6300

atcagctcat cgagagcctg cgcgacggac gcactgacgg tgtcgtccat cacagtttgc 6360

cagtgataca catggggatc agcaatcgcg catatgaaat cacgccatgt agtgtattga 6420

ccgattcctt gcggtccgaa tgggccgaac ccgctcgtct ggctaagatc ggccgcagcg 6480

atcgcatcca tggcctccgc gaccggctgc agaacagcgg gcagttcggt ttcaggcagg 6540

tcttgcaacg tgacaccctg tgcacggcgg gagatgcaat aggtcaggct ctcgctgaat 6600

tccccaatgt caagcacttc cggaatcggg agcgcggccg atgcaaagtg ccgataaaca 6660

taacgatctt tgtagaaacc atcggcgcag ctatttaccc gcaggacata tccacgccct 6720

cctacatcga agctgaaagc acgagattct tcgccctccg agagctgcat caggtcggag 6780

acgctgtcga acttttcgat cagaaacttc tcgacagacg tcgcggtgag ttcaggcgac 6840

attgctgagg tgtaggatcg atccgtttaa actctgtgtt agcttatagt caggatgttg 6900

gctcgacgag tgtaaactgg gagttggcat gagggttatg taggcttctt tagccccgca 6960

tccccctcat tctcctcatt gatcccgggg gagcggatgg tgttgataag agactaatta 7020

tagggtttag ctggtgccta gctggtgatt ggctggcttc gccgaatttt acgggccaag 7080

ggaagctgca gaaccgcggc actggtaaac ggtaattaag ctatcagccc catgctaacg 7140

agtttaaatt acgtgtattg ctgataaaca ccaacagagc tttactgaaa gatgggagtc 7200

acggtgtggc ttccccactg cgattattgc acaagcagcg agggcgaact tgactgtcgt 7260

cgctgagcag cctgcagtca aacatacata tatatcaacc gcgaagacgt ctggccttgt 7320

agaacacgac gctccctagc aacacctgcc gtgtcagcct ctacggttgt tacttgcatt 7380

caggatgctc tccagcgggc gagctattca aaatattcaa agcaggtatc tcgtattgcc 7440

aggattcagc tgaagcaaca ggtgccaagg aaatctgcgt cggttctcat ctgggcttgc 7500

tcggtcctgg cgtagactag ttgaagttcc tattccgagt tcctattctt caaatagtat 7560

aggaacttca tcagggagat gtaacaacgc caccttatgg gactatcaag ctgacgctgg 7620

cttctgtgca gacaaactgc gcccacgagt tcttccctga cgccgctctc gcgcaggcaa 7680

gggaactcga tgaatactac gcaaagcaca agagacccgt tggtccactc catggcctcc 7740

ccatctctct caaagaccag cttcgagtca aggtacaccg ttgcccctaa gtcgttagat 7800

gtcccttttt gtcagctaac atatgccacc agggctacga aacatcaatg ggctacatct 7860

catggctaaa caagtacgac gaaggggact cggttctgac aaccatgctc cgcaaagccg 7920

gtgccgtctt ctacgtcaag acctctgtcc cgcagaccct gatggtctgc gagacagtca 7980

acaacatcat cgggcgcacc gtcaacccac gcaacaagaa ctggtcgtgc ggcggcagtt 8040

ctggtggtga gggtgcgatc gttgggattc gtggtggcgt catcggtgta ggaacggata 8100

tcggtggctc gattcgagtg ccggccgcgt tcaacttcct gtacggtcta aggccgagtc 8160

atgggcggct gccgtatgca aagatggcga acagcatgga gggtcaggag acggtgcaca 8220

gcgttgtcgg gccgattacg cactctgttg agggtgagtc cttcgcctct tccttctttt 8280

cctgctctat accaggcctc cactgtcctc ctttcttgct ttttatacta tatacgagac 8340

cggcagtcac tgatgaagta tgttagacct ccgcctcttc accaaatccg tcctcggtca 8400

ggagccatgg aaatacgact ccaaggtcat ccccatgccc tggcgccagt ccgagtcgga 8460

cattattgcc tccaagatca agaacggcgg gctcaatatc ggctactaca acttcgacgg 8520

caatgtcctt ccacaccctc ctatcctgcg cggcgtggaa accaccgtcg ccgcactcgc 8580

caaagccggt cacaccgtga ccccgtggac gccatacaag cacgatttcg gccacgatct 8640

catctcccat atctacgcgg ctgacggcag cgccgacgta atgcgcgata tcagtgcatc 8700

cggcgagccg gcgattccaa atatcaaaga cctactgaac ccgaacatca aagctgttaa 8760

catgaacgag ctctgggaca cgcatctcca gaagtggaat taccagatgg agtaccttga 8820

gaaatggcgg gaggctgaag aaaaggccgg gaaggaactg gacgccatca tcgcgccgat 8880

tacgcctacc gctgcggtac ggcatgacca gttccggtac tatgggtatg cctctgtgat 8940

caacctgctg gatttcacga gcgtggttgt tccggttacc tttgcggata agaacatcga 9000

taagaagaat gagagtttca aggcggttag tgagcttgat gccctcgtgc aggaagagta 9060

tgatccggag gcgtaccatg gggcaccggt tgcagtgcag gttatcggac ggagactcag 9120

tgaagagagg acgttggcga ttgcagagga agtggggaag ttgctgggaa atgtggtgac 9180

tccataggta agctccgtgg cgaaagcctg acgcaccggt agattcttgg tgagcccgta 9240

tcatgacggc ggcgggagct acatggcccc gggtgattta ttttttttgt atctacttct 9300

gacccttttc aaatatacgg tcaactcatc tttcactgga gatgcggcct gcttggtatt 9360

gcgatgttgt cagcttggca aattgtggct ttcgaaaaca caaaacgatt ccttagtagc 9420

catgcatttt aagataacgg aatagaagaa agaggaaatt aaaaaaaaaa aaaaaacaaa 9480

catcccgttc ataacccgta gaatcgccgc tcttcgtgta tcccagtacc acggcaaagg 9540

tatttcatga tcgttcaatg ttgatattgt tcccgccagt atggctccac ccccatctcc 9600

gcgaatctcc tcttctcgaa cgcggtagtg gcgcgccaat tggtaatgac ccatagggag 9660

acaaacagca taatagcaac agtggaaatt agtggcgcaa taattgagaa cacagtgaga 9720

ccatagctgg cggcctggaa agcactgttg gagaccaact tgtccgttgc gaggccaact 9780

tgcattgtct agagaatgca atcataacag aaagtacagc cagcgctgtg tcataaagaa 9840

gtccagttgg gaaacgaaag actagaatca aactaaaagt aatccggccg atatggcttc 9900

acgtgcgaag tctcgccttg aggggacatt gtccttgcag gtgattgacc attgcgttca 9960

tatggcgcga tgtttggtag tgtgggtgta gccggtgacc tcacggaagg actaaaggcc 10020

acataccctt ctgagtgcct cttctcttcg tggtcggaac tctcgaatgg gtttttgaca 10080

gttgcactcg tttggttgtg gtcatttgaa ggtctgcgtt cggtcttctg ttcgcgcagg 10140

cgagctgact gagggattga aagctgcata gccatcgttg gcatgcgtta attcgccaaa 10200

gctcagcggc gaaacaggcc tgacctctaa tccatgcatc tgctctgcac tcgattgttc 10260

gtggtgtcct tgcgaagaaa gagaagcctt ggactcggat gactttctgg acgaggtggt 10320

aggatcatca tgattgtaat gagactgtag cacatcatgc gaatcattcg acacacggtg 10380

tctgcccaag ttgacgtcag catcggtatg catttcggta tggtcctcat ggttctcagc 10440

atgtccctcc agaggggact catttccagc ggaaggatta taagcaacat aattgtcatg 10500

tggctgcgac ctttcgtgag actccgagtt tgatctcact gtggactcat gggcgatatg 10560

cggctcatca tgatcttcga atggagagaa atggttgaag tcggaggaca cgggtgattt 10620

agcagcaggg ttgaatgcaa catagccagt ctcgcgctct tcatgtgagc tatatgagtc 10680

atgtggcctg tcatggtcca gaggctccgg atgctcatgg ctagattcat cgtgtgccga 10740

aatcgcgtca ctagcaaagg gcgaggttga cacattggct gcaggactga acgccacata 10800

accactctca ggctcttcat gtgagttata ggagctgtgc ggcatatcat agtcctgagg 10860

ttcacgatgc tcatggctgg attcatcgtg tgccgaaata gcgtgactag caaaaggcga 10920

gggcgaagca ttggttgccg gactgaacgc cacatagccg tccccattgg ctgaactgac 10980

tggtgacaac gtcctaccca tggcgtcggc cgggccagcg gcttggtgag agtgaagacc 11040

attagaagta gctggactga acgatcgcag cgggtattcg ttttcttgag ctggataagg 11100

ggctgcgcca tgctggctga aaggtgagaa tgttcggggt gctgctctat caccagggaa 11160

ggcagacgct ggagtcaaag aacgagtgtt ggatcaattg ccggactgta tgaacggaaa 11220

ggagtgctga ttgtttaaat ggcccgtagc cttcgctagg acctcgtgat tcggggaccg 11280

ttggcccata cccaggagct ggtgtaaaat tggaacgcga cacgggtgtt tggttgcgca 11340

gaatttgcgg tgccggcgag gcgtgatcaa tctggctgta acctgggcct ggggtgtagt 11400

ttgagacagg tgtttgtgtt cgtggcattt gtggcgctgg cgacgctctg tcagtcggcc 11460

catatccagg cgccgaaggt gtgggcgtaa acccttgccg tgatttaatt aagaattctc 11520

ctgtaggctt gagagttcaa ggaagaaaca gtgcaattat ctttgcgaac ccaggngctg 11580

gtgacggaat tttcatagtc aagctatcag agtaaagaag aggagcatgt caaagtacaa 11640

ttagagacaa atatatagtc gcgtggagcc aagagcggat tcctcagtct cgtaggtctc 11700

ttgacgaccg ttgatctgct tgatctcgtc tcccgaaaat gaaaatagac tctgctaagc 11760

tattcttctg cttcgccgga gcctgaaggg cgtactaggg ttgcgaggtc caatgcatta 11820

atgcattgca gatgagctgt atctggaaga ggtaaacccg aaacgcgttt tattcttgtt 11880

gacatggagc tattaaatca ctagaaggca ctctttgctg cttggacaaa tgaacgtatc 11940

ttatcgagat cctgaacacc atttgtctca actccggagc tgacatcgac accaacgatc 12000

ttatatccag attcgtcaag ctgtttgatg atttcagtaa cgttaagtgg atcgatccgg 12060

atagcgcggg ttccttccgg tattgtctcc ttccgtgttt cagttagcct cccccatctc 12120

ccgggcaaac gtgcgcgcca ggtcgcatat cgtcggtatg gagccggggg tggtgacgtg 12180

ggtctggacc atcccggagg taagttgcag cagggcgtcc cggcagccgg cgggcgattg 12240

gtcgtaatcc aggataaaga cgtgcatgga acggaggcgt ttggccaaga cgtccaaggc 12300

ccaggcaaac acgttataca ggtcgccgtt gggggccagc aactcggggc cccgaaacag 12360

ggtaaataac gtgtccccga tatggggtcg tgggcccgcg ttgctctggg gctcggcacc 12420

ctggggcggc acggccgtcc ccgaaagctg tccccagtcc tcccgccacg acccgccgca 12480

ctgcagatac cgcaccgtat tggcaagtag cccgtaaacg cggcgaatcg cagccagcat 12540

agccaggtcc agccgctcgc cggggcgctg gcgtttggcc aggcggtcga tgtgtctgtc 12600

ctccggaagg gccccaagca cgatgttggt gccgggcaag gtcggcggga tgagggccac 12660

gaacgccagc acggcctggg gggtcatgct gcccataagg taccgcgcgg ccgggtagca 12720

caggagggcg gcgatgggat ggcggtcgaa gatgagggtg agggccgggg gcggggcatg 12780

tgagctccca gcctcccccc cgatatgagg agccagaacg gcgtcggtca cggcataagg 12840

catgcccatt gttatctggg cgcttgtcat taccaccgcc gcgtccccgg ccgatatctc 12900

accctggtcg aggcggtgtt gtgtggtgta gatgttcgcg attgtctcgg aagcccccag 12960

cacccgccag taagtcatcg gctcgggtac gtagacgata tcgtcgcgcg aacccagggc 13020

caccagcagt tgcgtggtgg tggttttccc catcccgtgg ggaccgtcta tataaacccg 13080

cagtagcgtg ggcattttct gctccgggcg gacttccgtg gcttcttgct gccggcgagg 13140

gcgcaacgcc gtacgtcggt tgctatggcc gcgagaacgc gcagcctggt cgaacgcaga 13200

cgcgtgttga tggccggggt acgaagccat acgcgcttct acaaggcgct ggccgaagag 13260

gtgcgggagt ttcacgccac caagatcgat ctacagctgg tggggagagc aggaaaatat 13320

ggcaacaaat gttggactga cgcaacgacc ttgtcaaccc cgccgacaca ccgggcggac 13380

agacggggca aagctgccta ccagggactg agggacctca gcaggtcgag tgcagagcac 13440

cggatgggtc gactgccagc ttgtgttccc ggtctgcgcc gctggccagc tcctgagcgg 13500

cctttccggt ttcatacacc gggcaaagca ggagaggcac gatatttgga cgccctacag 13560

atgccggatg ggccaattag ggagcttacg cgccgggtac tcgctctacc tacttcggag 13620

aaggtactat ctcgtgaatc ttttaccaga tcggaagcaa ttggacttct gtacctaggt 13680

taatggcatg ctatttcgcc gacggctata cacccctggc ttcacattct ccttcgctta 13740

ctgccggtga ttcgatgaag ctccatattc tccgatgatg caatagattc ttggtcaacg 13800

aggggcacac cagcctttcc acttcggggc ggaggggcgg ccggtcccgg attaataatc 13860

atccactgca cctcagagcc gccagagctg tctggcgcag tggccgttat tactcagccc 13920

ttctctctgc gtccgtccgt ctctccgcat gccagaaaga gtcaccggtc actgtacaga 13980

gctcaagctt cgattaactc gagggggggc ccggtaccca attcgcccta tagtgagtcg 14040

tattacaatt cactggccgt cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc 14100

caacttaatc gccttgcagc acatccccct ttcgccagct ggcgtaatag cgaagaggcc 14160

cgcaccgatc gcccttccca acagttgcgc agcctgaatg gcgaatggaa attgtaagcg 14220

ttaatatttt gttaaaattc gcgttaaatt tttgttaaat cagctcattt tttaaccaat 14280

aggccgaaat cggcaaaatc ccttataaat caaaagaata gaccgagata gggttgagtg 14340

ttgttccagt ttggaacaag agtccactat taaagaacgt ggactccaac gtcaaagggc 14400

gaaaaaccgt ctatcagggc gatggcccac tacgtgaacc atcaccctaa tcaagttttt 14460

tggggtcgag gtgccgtaaa gcactaaatc ggaaccctaa agggagcccc cgatttagag 14520

cttgacgggg aaagccggcg aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg 14580

gcgctagggc gctggcaagt gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc 14640

ttaatgcgcc gctacagggc gcgtcaggtg gcacttttcg gggaaatgtg cgcggaaccc 14700

ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 14760

gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 14820

cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 14880

tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 14940

tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 15000

cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 15060

tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 15120

agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 15180

ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 15240

ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 15300

aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 15360

gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 15420

tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 15480

ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 15540

cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 15600

atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 15660

cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 15720

ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 15780

cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 15840

ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 15900

tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 15960

taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 16020

caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 16080

agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 16140

gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 16200

gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 16260

ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 16320

acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 16380

tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 16440

ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 16500

ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 16560

ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 16620

tccccgcgcg ttggccgatt ca 16642

<210> 8

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> 引物 SpeI-FRTF3-amdS

<400> 8

tggcgtagac tagttgaagt tcctattccg agtcctattc ttcaaatagt ataggaactt 60

catcagggag atgtaacaac 80

<210> 9

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物 amdS-F-探针

<400> 9

ctatggagtc accacatttc cc 22

<210> 10

<211> 6330

<212> DNA

<213> 人工序列

<220>

<223> 载体 pFRT-BsAMG

<400> 10

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cttgaagttc ctattccgag 420

ttcctattct ctagaaagta taggaacttc ctcgagacca tgtacttcgc tcgccttctc 480

tccggactct ctctcatcac ctctgcggtt ctcgcccaga ccgttgactc ctatgtcagc 540

actgagggcc ccatcgcgaa ggcgggcctc cttgcgaaca ttggtcccag tggttccaaa 600

tccaacggtg cccatgctgg agttgtcgtc gctagcccta gccaagtcaa cccggactac 660

atgtacacat gggtccgcga ctcttccctc gtgttcaagg tcctcgtcga ccagctcgct 720

tccggccagg acacctctgt ccgtagcctg atcgatgcat tcgtcgcagc ggagtcggcg 780

atgcagcaca cccccaaccc cagtggtgac atcaacactg gtggtcttgc tgagcccaag 840

ttcaacatcg acaccaccgc cttcactggc gcatggggcc gcccgcagcg agatggccct 900

gctctccgtt ctaccaccgt catcaactac gccaactacc tccttgctaa tggcaacacc 960

actgcttggg tggtggccaa cctctggccc atgatcaagc tcgacttgga ctacatccag 1020

aacaactgga accagtctac cttcgacctg tgggaggagc tcaactcctc gtccttcttc 1080

accaccgctg ttcagcaccg tgctctccgc gagggtatta ctctcggcgc gaagctctcg 1140

aagactgccg ataccgccaa ctatggcacc caggccggca acatcctttg cttcctccag 1200

tcatactgga accctaccgc caactacgtg acctccaaca ccggtggtgg acgctccggc 1260

aaggactcca actccgtcct tacttccatc cacactttcg accccgatgc cggatgtgat 1320

gctaccacct tccagccctg ctccgacaag gccctgtcca acctcaaggt ttacgtcgac 1380

tcgttccgct ccatctgggc catcaacgct ggcgctgctg ccaccgctcc cgtcgctgtc 1440

ggccgctacc ccgaggacac ttactacaac ggtaacccct ggtacctctc tactttcgcc 1500

gtcgccgagc agctctacga tgccatcatc gtctggaaca agcagggatc catccaggtc 1560

accagccttt cccttccctt cttccagcag ttcatctcga ccctcaagac cggcacgtac 1620

acccagagct ccacccagtt ccagaccctc gtccctgcca tcaaggcctg ggctgacggc 1680

ttcgtcgcca tcaaccagaa gtacactcct cctaacggtg gtctcggtga acagtacgac 1740

aaggtctctg gcgaccctgt cagcgctgtt gaccttacct ggtcgtatgc ttccgctctc 1800

accgtcttca acgctcgtgc cggaaactac tcccccggct ggggtgccaa gggcctgacc 1860

gtcccggcag tctgccagcc caacgctggc cctcaagtcc aggtgacgtt caaggttcag 1920

gccacgacgg tctacggcga gaacatttac ctcactggtg ctaacccagc tctgtcgaac 1980

tggtcgcccg acaccgccct cgccatgtct gctgctaact accctacctg gtctgtcaca 2040

gtcaccctcc cggcgaacag cgtcatccag tacaagtaca tcaggaagaa caacggcgcc 2100

gtcacctggg agtctgaccc caacaaccag gtcaccatcc cagcgagcgg cacctacacc 2160

gtcaacgata actggcggta attaattaat aataaataac ggattgtgtc cgtaatcaca 2220

cgtgcccgtg gtgcgtacga taacgcatag tgtttttccc tccacttaaa tcgaagggtt 2280

gtgtcttgga tcgcgcgggt caaatgtata tggttcatat acatccgcag gcacgtaata 2340

aagcgagggg ttcgaatccc cccgttaccc ccggtagggg cccagatccg ggtgactgac 2400

acctggcggt agacaatcaa tccatttcgc tatagttaaa ggatggggat gagggcaatt 2460

ggttatatga tcatgtatgt agtgggtgtg cataatagta gtgaaatgga agccaagtca 2520

tgtgattgta atcgaccgac ggaattgagg atatccggaa atacagacac cgtgaaagcc 2580

atggtctttc cttcgtgtag aagaccagac agacagtccc tgatttaccc ttgcacaaag 2640

cactagaaaa ttagcattcc atccttctct gcttgctctg ctgatatcac tgtcattcaa 2700

tgcatagcca tgagctcatc ttagatccaa gcacgtaatt ccatagccga ggtccacagt 2760

ggagcagcaa cattccccat cattgctttc cccaggggcc tcccaacgac taaatcaaga 2820

gtatatctct accgtccaat agatcgtctt cgcttcaaaa tctttgacaa ttccaagagg 2880

gtccccatcc atcaaaccca gttcaataat agccgagatg catggtggag tcaattaggc 2940

agtattgctg gaatgtcggg gccagttggc ccggtggtca ttggccgcct gtgatgccat 3000

ctgccactaa atccgatcat tgatccaccg cccacgaggc gcgtctttgc tttttgcgcg 3060

gcgtccaggt tcaactctct ccactagtct agcggggttc aaatgcaaac aagtacaaca 3120

cgcagcaaac gaagcagccc accactgcgt tgatgcccag tttgactgtc cgaaatccac 3180

cggaaaggtg gaaacatact atgtaacaat cagagggaag aaaaaatttt tatcgacgag 3240

gcaggatagt gactgatggt ggggtcatgg tcgggtctcc gagcgaaaga gaaccaagga 3300

aacaagatca acgaggttgg tgtacccaaa aggccgcagc aacaagagtc atcgcccaaa 3360

agtcaacagt ctggaagaga ctccgccgtg cagattctgc gtcggtcccg cacatgcgtg 3420

gtgggggcat tacccctcca tgtccaatga taagggcggc ggtcgagggc ttaagcccgc 3480

ccactaattc gccttctcgc ttgcccctcc atataaggat tccccctcct tcccctccca 3540

caactttttt ccttctttct ctcttcgtcc gcatcagtac gtatatcttt cccccatacc 3600

tcctttccta ctcttcttcc attcattcaa ctcttctcct tactgacatc tgttttgctc 3660

agtacctcta cgcgatcagc cgtagtatct gagcaagctt ctctacagaa tctttctagt 3720

atcttacaaa gaactacaaa gttcgcacca atgcctcaat cctgggaaga actggccgct 3780

gataagcgcg cccgcctcgc aaaaaccatc cctgatgaat ggaaagtcca gacgctgcct 3840

gcggaagaca gcgttattga tttcccaaag aaatcgggta tcctttcaga ggccgaactg 3900

aagatcacag aggcctccgc tgcagatctt gtgtccaagc tggcggccgg agagttgacc 3960

tcggcggaag ttacgctagc attctgtaaa cgggcagtaa tcgcccagca gttagtaggg 4020

tcccctctac ctcttgaagt tcctattccg agttcctatt cttcaaatag tataggaact 4080

tcacgcatgc aagcttggcg taatcatggt catagctgtt tcctgtgtga aattgttatc 4140

cgctcacaat tccacacaac atacgagccg gaagcataaa gtgtaaagcc tggggtgcct 4200

aatgagtgag ctaactcaca ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa 4260

acctgtcgtg ccagctgcat taatgaatcg gccaacgcgc ggggagaggc ggtttgcgta 4320

ttgggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt cggctgcggc 4380

gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca ggggataacg 4440

caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa aaggccgcgt 4500

tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 4560

gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 4620

ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 4680

cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt tcggtgtagg 4740

tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 4800

tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 4860

cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca gagttcttga 4920

agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc gctctgctga 4980

agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa accaccgctg 5040

gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa ggatctcaag 5100

aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac tcacgttaag 5160

ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta aattaaaaat 5220

gaagttttaa atcaatctaa agtatatatg agtaaacttg gtctgacagt taccaatgct 5280

taatcagtga ggcacctatc tcagcgatct gtctatttcg ttcatccata gttgcctgac 5340

tccccgtcgt gtagataact acgatacggg agggcttacc atctggcccc agtgctgcaa 5400

tgataccgcg agacccacgc tcaccggctc cagatttatc agcaataaac cagccagccg 5460

gaagggccga gcgcagaagt ggtcctgcaa ctttatccgc ctccatccag tctattaatt 5520

gttgccggga agctagagta agtagttcgc cagttaatag tttgcgcaac gttgttgcca 5580

ttgctacagg catcgtggtg tcacgctcgt cgtttggtat ggcttcattc agctccggtt 5640

cccaacgatc aaggcgagtt acatgatccc ccatgttgtg caaaaaagcg gttagctcct 5700

tcggtcctcc gatcgttgtc agaagtaagt tggccgcagt gttatcactc atggttatgg 5760

cagcactgca taattctctt actgtcatgc catccgtaag atgcttttct gtgactggtg 5820

agtactcaac caagtcattc tgagaatagt gtatgcggcg accgagttgc tcttgcccgg 5880

cgtcaatacg ggataatacc gcgccacata gcagaacttt aaaagtgctc atcattggaa 5940

aacgttcttc ggggcgaaaa ctctcaagga tcttaccgct gttgagatcc agttcgatgt 6000

aacccactcg tgcacccaac tgatcttcag catcttttac tttcaccagc gtttctgggt 6060

gagcaaaaac aggaaggcaa aatgccgcaa aaaagggaat aagggcgaca cggaaatgtt 6120

gaatactcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 6180

tgagcggata catatttgaa tgtatttaga aaaataaaca aataggggtt ccgcgcacat 6240

ttccccgaaa agtgccacct gacgtctaag aaaccattat tatcatgaca ttaacctata 6300

aaaataggcg tatcacgagg ccctttcgtc 6330

<210> 11

<211> 1722

<212> DNA

<213> Byssocorticium

<400> 11

atgtacttcg ctcgccttct ctccggactc tctctcatca cctctgcggt tctcgcccag 60

accgttgact cctatgtcag cactgagggc cccatcgcga aggcgggcct ccttgcgaac 120

attggtccca gtggttccaa atccaacggt gcccatgctg gagttgtcgt cgctagccct 180

agccaagtca acccggacta catgtacaca tgggtccgcg actcttccct cgtgttcaag 240

gtcctcgtcg accagctcgc ttccggccag gacacctctg tccgtagcct gatcgatgca 300

ttcgtcgcag cggagtcggc gatgcagcac acccccaacc ccagtggtga catcaacact 360

ggtggtcttg ctgagcccaa gttcaacatc gacaccaccg ccttcactgg cgcatggggc 420

cgcccgcagc gagatggccc tgctctccgt tctaccaccg tcatcaacta cgccaactac 480

ctccttgcta atggcaacac cactgcttgg gtggtggcca acctctggcc catgatcaag 540

ctcgacttgg actacatcca gaacaactgg aaccagtcta ccttcgacct gtgggaggag 600

ctcaactcct cgtccttctt caccaccgct gttcagcacc gtgctctccg cgagggtatt 660

actctcggcg cgaagctctc gaagactgcc gataccgcca actatggcac ccaggccggc 720

aacatccttt gcttcctcca gtcatactgg aaccctaccg ccaactacgt gacctccaac 780

accggtggtg gacgctccgg caaggactcc aactccgtcc ttacttccat ccacactttc 840

gaccccgatg ccggatgtga tgctaccacc ttccagccct gctccgacaa ggccctgtcc 900

aacctcaagg tttacgtcga ctcgttccgc tccatctggg ccatcaacgc tggcgctgct 960

gccaccgctc ccgtcgctgt cggccgctac cccgaggaca cttactacaa cggtaacccc 1020

tggtacctct ctactttcgc cgtcgccgag cagctctacg atgccatcat cgtctggaac 1080

aagcagggat ccatccaggt caccagcctt tcccttccct tcttccagca gttcatctcg 1140

accctcaaga ccggcacgta cacccagagc tccacccagt tccagaccct cgtccctgcc 1200

atcaaggcct gggctgacgg cttcgtcgcc atcaaccaga agtacactcc tcctaacggt 1260

ggtctcggtg aacagtacga caaggtctct ggcgaccctg tcagcgctgt tgaccttacc 1320

tggtcgtatg cttccgctct caccgtcttc aacgctcgtg ccggaaacta ctcccccggc 1380

tggggtgcca agggcctgac cgtcccggca gtctgccagc ccaacgctgg ccctcaagtc 1440

caggtgacgt tcaaggttca ggccacgacg gtctacggcg agaacattta cctcactggt 1500

gctaacccag ctctgtcgaa ctggtcgccc gacaccgccc tcgccatgtc tgctgctaac 1560

taccctacct ggtctgtcac agtcaccctc ccggcgaaca gcgtcatcca gtacaagtac 1620

atcaggaaga acaacggcgc cgtcacctgg gagtctgacc ccaacaacca ggtcaccatc 1680

ccagcgagcg gcacctacac cgtcaacgat aactggcggt aa 1722

<210> 12

<211> 573

<212> PRT

<213> Byssocorticium

<400> 12

Met Tyr Phe Ala Arg Leu Leu Ser Gly Leu Ser Leu Ile Thr Ser Ala

1 5 10 15

Val Leu Ala Gln Thr Val Asp Ser Tyr Val Ser Thr Glu Gly Pro Ile

20 25 30

Ala Lys Ala Gly Leu Leu Ala Asn Ile Gly Pro Ser Gly Ser Lys Ser

35 40 45

Asn Gly Ala His Ala Gly Val Val Val Ala Ser Pro Ser Gln Val Asn

50 55 60

Pro Asp Tyr Met Tyr Thr Trp Val Arg Asp Ser Ser Leu Val Phe Lys

65 70 75 80

Val Leu Val Asp Gln Leu Ala Ser Gly Gln Asp Thr Ser Val Arg Ser

85 90 95

Leu Ile Asp Ala Phe Val Ala Ala Glu Ser Ala Met Gln His Thr Pro

100 105 110

Asn Pro Ser Gly Asp Ile Asn Thr Gly Gly Leu Ala Glu Pro Lys Phe

115 120 125

Asn Ile Asp Thr Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg

130 135 140

Asp Gly Pro Ala Leu Arg Ser Thr Thr Val Ile Asn Tyr Ala Asn Tyr

145 150 155 160

Leu Leu Ala Asn Gly Asn Thr Thr Ala Trp Val Val Ala Asn Leu Trp

165 170 175

Pro Met Ile Lys Leu Asp Leu Asp Tyr Ile Gln Asn Asn Trp Asn Gln

180 185 190

Ser Thr Phe Asp Leu Trp Glu Glu Leu Asn Ser Ser Ser Phe Phe Thr

195 200 205

Thr Ala Val Gln His Arg Ala Leu Arg Glu Gly Ile Thr Leu Gly Ala

210 215 220

Lys Leu Ser Lys Thr Ala Asp Thr Ala Asn Tyr Gly Thr Gln Ala Gly

225 230 235 240

Asn Ile Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ala Asn Tyr

245 250 255

Val Thr Ser Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ser Asn Ser

260 265 270

Val Leu Thr Ser Ile His Thr Phe Asp Pro Asp Ala Gly Cys Asp Ala

275 280 285

Thr Thr Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val

290 295 300

Tyr Val Asp Ser Phe Arg Ser Ile Trp Ala Ile Asn Ala Gly Ala Ala

305 310 315 320

Ala Thr Ala Pro Val Ala Val Gly Arg Tyr Pro Glu Asp Thr Tyr Tyr

325 330 335

Asn Gly Asn Pro Trp Tyr Leu Ser Thr Phe Ala Val Ala Glu Gln Leu

340 345 350

Tyr Asp Ala Ile Ile Val Trp Asn Lys Gln Gly Ser Ile Gln Val Thr

355 360 365

Ser Leu Ser Leu Pro Phe Phe Gln Gln Phe Ile Ser Thr Leu Lys Thr

370 375 380

Gly Thr Tyr Thr Gln Ser Ser Thr Gln Phe Gln Thr Leu Val Pro Ala

385 390 395 400

Ile Lys Ala Trp Ala Asp Gly Phe Val Ala Ile Asn Gln Lys Tyr Thr

405 410 415

Pro Pro Asn Gly Gly Leu Gly Glu Gln Tyr Asp Lys Val Ser Gly Asp

420 425 430

Pro Val Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr

435 440 445

Val Phe Asn Ala Arg Ala Gly Asn Tyr Ser Pro Gly Trp Gly Ala Lys

450 455 460

Gly Leu Thr Val Pro Ala Val Cys Gln Pro Asn Ala Gly Pro Gln Val

465 470 475 480

Gln Val Thr Phe Lys Val Gln Ala Thr Thr Val Tyr Gly Glu Asn Ile

485 490 495

Tyr Leu Thr Gly Ala Asn Pro Ala Leu Ser Asn Trp Ser Pro Asp Thr

500 505 510

Ala Leu Ala Met Ser Ala Ala Asn Tyr Pro Thr Trp Ser Val Thr Val

515 520 525

Thr Leu Pro Ala Asn Ser Val Ile Gln Tyr Lys Tyr Ile Arg Lys Asn

530 535 540

Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Gln Val Thr Ile

545 550 555 560

Pro Ala Ser Gly Thr Tyr Thr Val Asn Asp Asn Trp Arg

565 570

<210> 13

<211> 283

<212> DNA

<213> 构巢曲霉

<400> 13

atgcctcaat cctgggaaga actggccgct gataagcgcg cccgcctcgc aaaaaccatc 60

cctgatgaat ggaaagtcca gacgctgcct gcggaagaca gcgttattga tttcccaaag 120

aaatcgggta tcctttcaga ggccgaactg aagatcacag aggcctccgc tgcagatctt 180

gtgtccaagc tggcggccgg agagttgacc tcggtggaag ttacgctagc attctgtaaa 240

cgggcagcaa tcgcccagca gttagtaggg tcccctctac ctc 283

<210> 14

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 引物 M13 RV

<400> 14

caggaaacag ctatgac 17

<210> 15

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 引物 M13 M4

<400> 15

gttttcccag tcacgac 17

<210> 16

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 在融合载体R中的引物

<400> 16

tatgcgttat cgtacgcac 19

<210> 17

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 引物 M13 M4

<400> 17

gttttcccag tcacgac 17

<210> 18

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 引物 M49X F

<220>

<221> 尚未归类的特征

<222> (16)..(17)

<223> n is a, c, g, or t

<400> 18

gtcaacccgg actacnnkta cacatgg 27

<210> 19

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 引物 M49X R

<400> 19

gtagtccggg ttgacttg 18

<210> 20

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物 SOE-M4 F

<400> 20

gtactatctg gcattggtac gttttcccag tcacgac 37

<210> 21

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> 引物 SOE-MR R

<400> 21

tggttatgat ttcggcgatg caggaaacag ctatgac 37

<210> 22

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 SOE-F

<400> 22

gtactatctg gcattggtac 20

<210> 23

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 SOE-R

<400> 23

tggttatgat ttcggcgatg 20

<210> 24

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物插入物解救F

<400> 24

aatctcagaa caccaatatc 20

<210> 25

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物插入物解救R

<400> 25

aacactatgc gttatcgtac 20

<210> 26

<211> 11101

<212> DNA

<213> 人工序列

<220>

<223> 载体 pDAu571

<400> 26

ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttca gtacccgggt 60

ataagctagc ttccgttaaa ttgccgtcgt cagccgttaa attaccgatt aatcccgata 120

aatttccgag atctccgtta aattgccgtt cgcagccgtt aaattaccgg ggacgaccga 180

taaatttccg cgatgaattc atggtgtttt gatcatttta aatttttata tggcgggtgg 240

tgggcaactc gcttgcgcgg gcaactcgct taccgattac gttagggctg atatttacgt 300

aaaaatcgtc aagggatgca agaccaaacc gttaaatttc cggagtcaac agcatccaag 360

cccaagtcct tcacggagaa accccagcgt ccacatcacg agcgaaggac cacctctagg 420

catcggacgc accatccaat tagaagcagc aaagcgaaac agcccaagaa aaaggtcggc 480

ccgtcggcct tttctgcaac gctgatcacg ggcagcgatc caaccaacac cctccagagt 540

gactaggggc ggaaatttat cgggattaat ttccactcaa ccacaaatca cagtcgtccc 600

cggtaattta acggctgcag acggcaattt aacggcttct gcgaatcgct tggattcccc 660

gcccctggcc gtagagctta aagtatgtcc cttgtcgatg cgatgtatca caacatataa 720

atactggcaa gggatgccat gcttggagtt tccaactcaa tttacctcta tccacacttc 780

tcttccttcc tcaatcctct atatacacaa ctggggatcc accatgttct cggcaggcca 840

caagattaag ggtacagtcg tcctcatgcc taaaaacgag ttggaagtga accccgatgg 900

ctccgcagtc gataacctca acgcattcct cggacgttcg gtgtcgctcc agctcatctc 960

cgcgaccaaa gccgacgccc acggtaaggg aaaggtgggc aaggacacgt tcttggaagg 1020

tatcaacact tcgctcccta ccttgggagc aggagagtcc gcattcaaca ttcacttcga 1080

gtgggacggt tcgatgggca ttcccggagc gttctatatc aagaactata tgcaggtgga 1140

gttcttcttg aagtccttga ccttggaggc aatctcgaac cagggtacca tccgtttcgt 1200

gtgtaactcg tgggtctaca acaccaagct ctacaaatcc gtgcggatct tcttcgcgaa 1260

ccacacttac gtcccttcgg agacacctgc ccctttggtg tcgtaccgcg aggaggaatt 1320

gaagtccctc cgtggtaacg gtactggaga aaggaaggag tatgatagga tctacgacta 1380

cgacgtctat aacgatttgg gtaaccccga caaatcggaa aagttggcac gtcctgtgtt 1440

gggaggctcc tccaccttcc cctaccctcg acgcggccgc acgggacgcg gtcccactgt 1500

caccgatccg aacacagaga agcagggcga agtcttctac gtgcccaggg acgaaaacct 1560

cggccacttg aagtcgaagg atgcattgga gattggaacc aagtccctct cccagatcgt 1620

ccagcctgca ttcgaatcgg cgttcgattt gaaatcgacg cccatcgagt tccactcgtt 1680

ccaggacgtc catgacttgt atgaaggtgg tatcaaattg cctcgggacg tcatctccac 1740

cattatcccc ctccccgtga tcaaggaatt gtaccgcacc gacggccagc atattctcaa 1800

attcccccag ccgcacgtcg tccaggtctc gcagtccgca tggatgacag atgaggaatt 1860

cgcgagggaa atgattgcag gtgtcaaccc gtgtgtcatc cgaggcttgg aggagttccc 1920

tcctaagtcc aacctcgatc ctgccatcta tggagaccag tcctccaaga ttacagccga 1980

ttccctcgat ctcgacggtt atactatgga tgaagcactc ggttccaggc gattgttcat 2040

gctcgattat catgatatct tcatgcccta tgtgcgccag atcaaccagt tgaactcggc 2100

aaaaacatat gcaacgagga cgatcctctt cctccgagaa gacggcacac tcaagcctgt 2160

ggcaatcgag ctctcgctcc cccattccgc aggcgatctc tccgcagccg tgtcgcaggt 2220

ggtgttgcct gcaaaagaag gagtggagtc gaccatctgg ctcttggcca aagcatatgt 2280

gattgtgaac gattcctgtt atcaccagct catgtcgcat tggctcaaca ctcacgcggc 2340

aatggaaccc ttcgtgatcg ccacgcaccg gcacctctcg gtgctccacc cgatctacaa 2400

gctcctcact ccccactacc gtaacaacat gaacattaac gccttggcac ggcagtcgtt 2460

gatcaacgcg aacggcatca ttgagacaac gttcctcccc tccaagtact ccgtcgaaat 2520

gtcgtccgca gtctacaaaa actgggtctt caccgaccag gcgttgcctg ccgacttgat 2580

caaacgaggc gtcgcaatca aagatccctc cactcctcat ggcgtccgcc tcttgatcga 2640

ggactacccc tacgcagcgg acggattgga aatctgggca gccatcaaga cctgggtgca 2700

ggaatacgtc cctttgtact atgcgaggga cgatgatgtc aaaaacgact cggaactcca 2760

gcattggtgg aaggaggcag tggaaaaggg ccatggagat ctcaaggata aaccctggtg 2820

gcctaagctc cagaccttgg aggacctcgt cgaagtgtgt ttgatcatta tctggatcgc 2880

atccgcgttg catgcagccg tgaacttcgg acagtatccc tatggaggcc tcatcatgaa 2940

ccgtcccacc gcatccagga ggctcctccc cgaaaaagga acacccgaat acgaagaaat 3000

gatcaacaac cacgaaaagg catacctccg gaccatcact tccaaactcc cgaccttgat 3060

ctcgctctcc gtgatcgaga ttttgtcgac acatgcgtcg gacgaggtct atttgggtca 3120

gcgggataac ccgcactgga catccgattc caaggccctc caggcgttcc agaagttcgg 3180

caacaagctc aaggagatcg aggagaaact cgtgaggcgg aacaacgacc cttccctcca 3240

gggaaaccgg ttgggacctg tccagctccc gtatacgttg ctctacccct cctcggaaga 3300

aggcctcact ttcaggggta tccccaactc gatttccatc tgactcgaga tctagagggt 3360

gactgacacc tggcggtaga caatcaatcc atttcgctat agttaaagga tggggatgag 3420

ggcaattggt tatatgatca tgtatgtagt gggtgtgcat aatagtagtg aaatggaagc 3480

caagtcatgt gattgtaatc gaccgacgga attgaggata tccggaaata cagacaccgt 3540

gaaagccatg gtctttcctt cgtgtagaag accagacaga cagtccctga tttacccttg 3600

cacaaagcac tagaaaatta gcattccatc cttctctgct tgctctgctg atatcactgt 3660

cattcaatgc atagccatga gctcatctta gatccaagca cgtaattcca tagccgaggt 3720

ccacagtgga gcagcaacat tccccatcat tgctttcccc aggggcctcc caacgactaa 3780

atcaagagta tatctctacc gtccaataga tcgtcttcgc ttcaaaatct ttgacaattc 3840

caagagggtc cccatccatc aaacccagtt caataatagc cgagatgcat ggtggagtca 3900

attaggcagt attgctggaa tgtcggggcc agttggccgg gtggtcattg gccgcctgtg 3960

atgccatctg ccactaaatc cgatcattga tccaccgccc acgaggcgcg tctttgcttt 4020

ttgcgcggcg tccaggttca actctctctt aattaaatag cgacaagccg aacggcaccg 4080

gcaggtacaa tggttcgctg tacttgcttg cgcaagcggg tctttgggga ttgagcgcat 4140

ttggtgttgc aaaggatttg atgtaaatgt agtcgacatc ttagcacaga ggggagagtt 4200

gataaaatgt ggtctgtttg aatgatagtc gggttcgtga cctatattcg tgatagtgga 4260

gataggtctg cgcctatctt atcgggccgg agcaaaaatt ccaccgcagc ggggtgagtt 4320

ttcgttatac agccatccca cttccagctt caaattgtca gtttaatcca gcccaattca 4380

atcattggag aaccggtttt atgtcttcga agtcccacct cccctacgca attcgcgcaa 4440

ccaaccatcc caacccttta acatctaaac tcttctccat cgccgaggag aagaaaacca 4500

acgtcaccgt ctccgcagac gttactactt ccgccgagct cctcgatctt gctgaccgcc 4560

taggccccta tatcgcagtt ctgaaaaccc acatcgacat cctcaccgat ctcaccccgt 4620

cgaccctttc ctcgctccaa tccctcgcga caaagcacaa cttcctcatc tttgaggacc 4680

gcaagttcat cgacatcggc aacaccgtgc aaaagcagta ccacggtggc gctctccgca 4740

tctccgaatg ggcacacatc atcaactgcg ccatcctgcc gggcgaaggg atcgtcgagg 4800

ccctcgcaca gacaaccaag tctcctgact ttaaagacgc gaatcaacga ggtctcctga 4860

ttcttgccga gatgacgagt aagggatctc ttgcgacagg ggagtacacg gcacgctcgg 4920

ttgagtacgc gcggaagtat aaggggtttg tgatgggatt cgtgagtaca agggcgttga 4980

gtgaggtgct gcccgaacag aaagaggaga gcgaggattt tgtcgtcttt acgactgggg 5040

tgaatctgtc ggataagggg gataagctgg ggcagcagta tcagacacct gggtcggcgg 5100

ttgggcgagg tgcggacttt atcattgcgg gtaggggcat ctataaggcg gacgatccag 5160

tcgaggcggt tcagaggtac cgggaggaag gctggaaagc ttacgagaaa agagttggac 5220

tttgagggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 5280

ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 5340

aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 5400

agacaccgtg aaagccatgg tctttccttc gtgtagaaga ccagacagac agtccctgat 5460

ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5520

tatcactgtc attcaatgca tagccatgag ctcatcttag atccaagcac gtaattccat 5580

agccgaggtc cacagtggag cagcaacatt ccccatcatt gctttcccca ggggcctccc 5640

aacgactaaa tcaagagtat atctctaccg tccaatagat cgtcttcgct tcaaaatctt 5700

tgacaattcc aagagggtcc ccatccatca aacccagttc aataatagcc gagatgcatg 5760

gtggagtcaa ttaggcagta ttgctggaat gtcggggcca gttggccggg tggtcattgg 5820

ccgcctgtga tgccatctgc cactaaatcc gatcattgat ccaccgccca cgaggcgcgt 5880

ctttgctttt tgcgcggcgt ccaggttcaa ctctctcctc taggttgaag ttcctattcc 5940

gagttcctat tcttcaaata gtataggaac ttcaactagc tagtgcatgc gtacgatttt 6000

gacatttgct ccattgtcga ggatggatgg aacgagcggc gtgcgccacg aaagtgaggc 6060

tattgcctat cagctctttg ctacattccg gaaacaaaca tccctttttg tgaattatct 6120

acgcaactta gatggcgtga acgcatcttc aaagtctttc ggcaggtccg gcacgacttt 6180

tgcatccaga gaagcgccta catgtgtatt cgaccacctc ctagcgcgct tggatatgag 6240

gaaatattac tgagagtcga aaacaagctc caccgcacca gctcttcttg gagttttata 6300

ttaaagaata ttcccagctc gttgtattat tctttttcta ccgtgctaat gtatcaagga 6360

ctttggtacc tattaacgtt attattcgtg tgctattccc aaacataacc ctgtatatgt 6420

ttcgaacgcc gttatgaccc atgtcttaca tactcattaa gtcattccct tggataatct 6480

cgactcagat gcggcggttg atgtaggagg agaggtaatc gaggacctcc tgggagatga 6540

tgccgttcca ggcggggtag cggatggagc cctcggcgga gcccttgagc tgctcgatat 6600

gctgccactc ctcgatgggg ttggtctcat ccttgagggc gatcatctcc ttggagatgg 6660

gatcgtaggc gtagtagcgg gagactagtg cgaagtaatg atcggggatg gcggtgatct 6720

gatgggtgta ggtggtgcgg gcgacggcgg aggcgcgctt atcggaccag ttgccgacga 6780

cgttggtgag ctcggtgagg cccttcatgg agaggaagga ggtcatgaga tggcggccga 6840

tatgggactt ggggccgttc ttgatggcga agatggagta gggggcgttc ttcttgaggg 6900

ccttgttgta ggagcggacg aggttatcct tgaggagctg gtactcctgc ttgttggagg 6960

aggagttgcc ggtgcggttg acgcgcttga ggacgggctc ggagttgcgg aggaactcat 7020

cgaggtagac gaggggatcg atgcggccgc gggcggagaa gaagtagata tggcgggaga 7080

cggaggtctt ggtctcggtg acgaggcact ggatgatgac gccgaggtac ttgttctgga 7140

cgagcttgaa ggacttggga tcgacgttct tgatatcgga gaagcggccg cagttgatga 7200

aggtggcgag gaagaggaac tggtagaggg tcttggtctt ggtgaagcgg gaggtgtact 7260

cgaaggagtt gaggatcttc tcggtgatct cccagatgga ctcgccctcg gagaggaggg 7320

ccttgagcat cttcttggaa tgggagttgc ccttatcggc ctcctcggag gactcgaact 7380

ggagctggag ggaggagacg atatcggtga tatcggactg atgcttctgg ccgtagtagg 7440

ggatgatggt gaactcccag gcggggatga gcttcttgag ggaggcctcc aggatggtgg 7500

ccttctgggt cttgtacttg aactggaggg acttgttgac gatatcgaag gagagggagt 7560

tggagatgat ggtgttgtag gacatgaagg tggcgcgctt gatggcggtg ccgttatggg 7620

tgatcatcca gcagaggtag gtgagctcgg cggcgcagag ggcgatcttc tcgccggagg 7680

ggcgctcgaa gcgctcgacg aactggcgga cgaggacctt ggggggggtc ttgcagagga 7740

tatcgaactg gggcatggtg ctcagatact acggctgatc gcgtagaggt actgagcaaa 7800

acagatgtca gtaaggagaa gagttgaatg aatggaagaa gagtaggaaa ggaggtatgg 7860

gggaaagata tacgtactga tgcggacgaa gagagaaaga aggaaaaaag ttgtgggagg 7920

ggaaggaggg ggaatcctta tatggagggg caagcgagaa ggcgaattag tgggcgggct 7980

taagccctcg accgccgccc ttatcattgg acatggaggg gtaatgcccc caccacgcat 8040

gtgcgggacc gacgcagaat ctgcacggcg gagtctcttc cagactgttg acttttgggc 8100

gatgactctt gttgctgcgg ccttttgggt acaccaacct cgttgatctt gtttccttgg 8160

ttctctttcg ctcggagacc cgaccatgac cccaccatca gtcactatcc tgcctcgtcg 8220

ataaaaattt tttcttccct ctgattgtta catagtatgt ttccaccttt ccggtggatt 8280

tcggacagtc aaactgggca tcaacgcagt ggtgggctgc ttcgtttgct gcgtgttgta 8340

cttgtttgca tttgaacccc gcggtcgttc gagtccttaa ttggtccgct cccggtcaac 8400

acccaagcag ctgtggcccg gccgagtggc gcctgtctgg tccacagtaa gcttggcgta 8460

atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8520

acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8580

aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8640

atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8700

gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8760

ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8820

aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 8880

ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8940

aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9000

gaccctgccg cttaccggat acctgtccgc ctttttccct tcgggaagcg tggcgctttc 9060

tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9120

tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9180

gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9240

cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9300

cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9360

agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9420

caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 9480

ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 9540

aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 9600

tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 9660

agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 9720

gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 9780

accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 9840

tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 9900

tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 9960

acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10020

atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10080

aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10140

tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10200

agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10260

gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10320

ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10380

atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10440

tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 10500

tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 10560

tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 10620

cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 10680

ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 10740

gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 10800

agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 10860

gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 10920

caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 10980

ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 11040

gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac 11100

c 11101

<210> 27

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> FRT-F

<400> 27

ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttc 49

<210> 28

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> FRT-F3

<400> 28

ttgaagttcc tattccgagt tcctattctt caaatagtat aggaacttca 50

<210> 29

<211> 8299

<212> DNA

<213> 人工序列

<220>

<223> 质粒 pDAu703

<400> 29

taggcgtatc acgaggccct ttcgtctcgc gcgtttcggt gatgacggtg aaaacctctg 60

acacatgcag ctcccggaga cggtcacagc ttgtctgtaa gcggatgccg ggagcagaca 120

agcccgtcag ggcgcgtcag cgggtgttgg cgggtgtcgg ggctggctta actatgcggc 180

atcagagcag attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt 240

aaggagaaaa taccgcatca ggcgccattc gccattcagg ctgcgcaact gttgggaagg 300

gcgatcggtg cgggcctctt cgctattacg ccagctggcg aaagggggat gtgctgcaag 360

gcgattaagt tgggtaacgc cagggttttc ccagtcacga cgttgtaaaa cgacggccag 420

tgaattggcc tccatggccg cggccgcgct ttgctaaaac tttggttgat ggaaggtatc 480

tggcgataaa ctccgacgac gtctagaagc aacaatctta tgcaaacgct cattggttct 540

tttcgaccgc aacatccatc atgaaactgg tattttgtct gtgtcagcag tctagaaccc 600

cttgccgggt attttagcat ttcatttttc tataaaaagg taccagcatg tatggatcgt 660

atcttccgta ccgtggttat taaatcccag cagaggccga taggcttaag aagtgaacat 720

ggcatggtta aggaagaagc cattactgag tatatatggc tagaataatc gctgggaaag 780

atttatgctt ccaagaggcg taggacggta taccatacag tacggtattt atgaacaatt 840

cgataatacc actccccaaa gcgggagata ggacacccgc ctcaggcacc aaccaccccc 900

tttttcaact gtcagtggtg cacgtttcca tcgagcataa gcttggtacc ctaaggatag 960

gccctaatct tatctacatg tgactgcatc gatgtgtttg gtcaaaatga ggcatgtggc 1020

tcaccccaca ggcggagaaa cgtgtggcta gtgcatgaca gtcccctcca tagattcaat 1080

ttaatttttc gcggcaattg tcgtgcagtt tgtatctaca tttcattcca tatatcaaga 1140

gttagtagtt ggacatcctg attattttgt ctaattactg aaaactcgaa gtactaacct 1200

actaataagc cagtttcaac cactaagtgc tcatttatac aatatttgca gaaccccgcg 1260

ctacccctcc atcgccaaca tgtcttccaa gtcgcaattg acctacagcg cacgcgctag 1320

caagcacccc aatgcgctcg taaagaagct cttcgaggtt gccgaggcca agaaaaccaa 1380

tgtcaccgtt tccgccgacg tgacaaccac caaagagctg ctggatttgg ctgaccgtat 1440

gcgcaccggg gttgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 1500

attaattaaa ggagagagtt gaacctggac gccgcgcaaa aagcaaagac gcgcctcgtg 1560

ggcggtggat caatgatcgg atttagtggc agatggcatc acaggcggcc aatgaccacc 1620

gggccaactg gccccgacat tccagcaata ctgcctaatt gactccacca tgcatctcgg 1680

ctattattga actgggtttg atggatgggg accctcttgg aattgtcaaa gattttgaag 1740

cgaagacgat ctattggacg gtagagatat actcttgatt tagtcgttgg gaggcccctg 1800

gggaaagcaa tgatggggaa tgttgctgct ccactgtgga cctcggctat ggaattacgt 1860

gcttggatct aagatgagct catggctatg cattgaatga cagtgatatc agcagagcaa 1920

gcagagaagg atggaatgct aattttctag tgctttgtgc aagggtaaat cagggactgt 1980

ctgtctggtc ttctacacga aggaaagacc atggctttca cggtgtctgt atttccggat 2040

atcctcaatt ccgtcggtcg attacaatca catgacttgg cttccatttc actactatta 2100

tgcacaccca ctacatacat gatcatataa ccaattgccc tcatccccat cctttaacta 2160

tagcgaaatg gattgattgt ctaccgccag gtgtcagtca ccctctagat ctcgagctcg 2220

ctagagtcga cctatggagt caccacattt cccagcaact tccccacttc ctctgcaatc 2280

gccaacgtcc tctcttcact gagtctccgt ccgataacct gcactgcaac cggtgcccca 2340

tggtacgcct ccggatcata ctcttcctgc acgagggcat caagctcact aaccgccttg 2400

aaactctcat tcttcttatc gatgttctta tccgcaaagg taaccggaac aaccacgctc 2460

gtgaaatcca gcaggttgat cacagaggca tacccatagt accggaactg gtcatgccgt 2520

accgcagcgg taggcgtaat cggcgcgatg atggcgtcca gttccttccc ggccttttct 2580

tcagcctccc gccatttctc aaggtactcc atctggtaat tccacttctg gagatgcgtg 2640

tcccagagct cgttcatgtt aacagctttg atgttcgggt tcagtaggtc tttgatattt 2700

ggaatcgccg gctcgccgga tgcactgata tcgcgcatta cgtcggcgct gccgtcagcc 2760

gcgtagatat gggagatgag atcgtggccg aaatcgtgct tgtatggcgt ccacggggtc 2820

acggtgtgac cggctttggc gagtgcggcg acggtggttt ccacgccgcg caggatagga 2880

gggtgtggaa ggacattgcc gtcgaagttg tagtagccga tattgagccc gccgttcttg 2940

atcttggagg caataatgtc cgactcggac tggcgccagg gcatggggat gaccttggag 3000

tcgtatttcc atggctcctg accgaggacg gatttggtga agaggcggag gtctaacata 3060

cttcatcagt gactgccggt ctcgtatata gtataaaaag caagaaagga ggacagtgga 3120

ggcctggtat agagcaggaa aagaaggaag aggcgaagga ctcaccctca acagagtgcg 3180

taatcggccc gacaacgctg tgcaccgtct cctgaccctc catgctgttc gccatctttg 3240

catacggcag ccgcccatga ctcggcctta gaccgtacag gaagttgaac gcggccggca 3300

ctcgaatcga gccaccgata tccgttccta caccgatgac gccaccacga atcccaacga 3360

tcgcaccctc accaccagaa ctgccgccgc acgaccagtt cttgttgcgt gggttgacgg 3420

tgcgcccgat gatgttgttg actgtctcgc agaccatcag ggtctgcggg acagaggtct 3480

tgacgtagaa gacggcaccg gctttgcgga gcatggttgt cagaaccgag tccccttcgt 3540

cgtacttgtt tagccatgag atgtagccca ttgatgtttc gtagccctgg tggcatatgt 3600

tagctgacaa aaagggacat ctaacgactt aggggcaacg gtgtaccttg actcgaagct 3660

ggtctttgag agagatgggg aggccatgga gtggaccaac gggtctcttg tgctttgcgt 3720

agtattcatc gagttccctt gcctgcgcga gagcggcgtc agggaagaac tcgtgggcgc 3780

agtttgtctg cacagaagcc agcgtcagct tgatagtccc ataaggtggc gttgttacat 3840

ctccctgaga ggtagagggg accctactaa ctgctgggcg attgctgccc gtttacagaa 3900

tgctagcgta acttccaccg aggtcaactc tccggccgcc agcttggaca caagatctgc 3960

agcggaggcc tctgtgatct tcagttcggc ctctgaaagg atcaccgatt tctttgggaa 4020

atcaataacg ctgtcttccg caggcagcgt ctggactttc cattcatcag ggatggtttt 4080

tgcgaggcgg gcgcgcttat cagcggccag ttcttcccag gattgaggca tgtgcatgca 4140

atgtgtgttt atgtggaagt aagatacgac gagtttgatt gagaaaagac agggtgattg 4200

tcaagttcag tatggaagaa agagtagaag aagatcagac gacagggaag agcgatgaca 4260

taaaaggtgg aagacggaag aaaaacgaac caaatcaatc ccactctatg gcgggggttg 4320

gactgcctga ggccggcact ggtggggctt atcgataagt tctcgtcacc ggatgcaatg 4380

cgctgtcaac tgctgacttg gccctgaaca tcctgtcctc tacagatcca tactatacaa 4440

tgatcccagt tatagtgcgg taaggtgcat atcatatctc attctcatga ctcattcgac 4500

ttttttttag agaaagtaca tacgtggaac atacactaaa cgcaacaggt cgcgacaaca 4560

ctggtataca aaacggtccc cggtgaatga cgttattagt gtctatcccc cactcacacc 4620

cgaaaagaat aatagaaact aacagaaaaa gcggcccgag gataagagga acattcaaac 4680

agaaggggaa tcataaaaac cgaaaaatgc aaggaaaaga gaactcaaat caataatttt 4740

cataatactg tcgagagtaa tacggaccag cgtctctcag ggacatgcgt cggcgcaagg 4800

catcatccaa tctctcatct aacacatcca gcattcgtgt tcgatagtct aactgcttct 4860

ctcggcgctc aagtcttgct tcccgatcat cgagttaatt aagaagttcc tatactttct 4920

agagaatagg aactcggaat aggaacttca aggtaccgag ctctatcctc aataccctat 4980

tttccacgat tccattgtca tatccaattc cgttttcttt tcttgttttc ccctcatcca 5040

atcccgtcca tcatttactc ctttttcttg tgaatgcaag tggcactaag aaatccaacc 5100

cccagacaaa ttttcctact caggaacaca aaaacctcgt ttctgctccc ttctcgtact 5160

tcattcctat cgtctcggaa tttcctcaac aaccctttcc gactttgcga cagcgtcgcg 5220

attccagact tatgtgttct cgttcctact gtcgttacca gtctatttat tccgaaacct 5280

ctgatcgctg aatttcacac acaacacccc cccgttgatg ctggtggaga atccgtagcg 5340

tcaagagttg aattcactcc atgttgtaac gaagtccacg aattgagacg attgatgatt 5400

acaaccccgc gatcgcctat cgacgattcg acgagatgcc attctcatcc tcctcatcct 5460

cctccacccc cgaggtgtct accaccccgc tcgcagatta cttctggatc gcaggtgtcg 5520

atggcgcgga aatcttagag actttccaaa gactcggcga cgaatacagg gcaaacagtg 5580

ccaccgctcc tggccccgct cttgcggaca cgatcgagga agatgcggac gcggaggagg 5640

cacacgaccc ccgtctggac tccctctctc gacccaattc catggctggg ggccgcaatt 5700

ccttccagcg gttctcaatg cgctcaggag actccagtga gtccagtggg aatggtacca 5760

gcagcaaccg gagcagtctg accatcaagg gtaatcagtc gcccagaggg tcgtcgtttc 5820

tagaagattt cgactttgac aaggccctgt tcaagtttgc aaacgagcgg gagtcgttcc 5880

tgtcggatct gagtctcagt gccggagcaa tcactcccac ctcccgtcct aggtccaggt 5940

tacgtacaca gaagattgtc tccgaggaaa gtccctccca gccatccagc ttgcttcgat 6000

caggcattgg tagtgtgcgg cgtcatatgg cattcagaga catgaatagt atgaaacggc 6060

agccgtcagt tgctcgtcgc ggccgcagct tggcgtaatc atggtcatag ctgtttcctg 6120

tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta 6180

aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg 6240

ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga 6300

gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg ctgcgctcgg 6360

tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg ttatccacag 6420

aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag gccaggaacc 6480

gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac gagcatcaca 6540

aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga taccaggcgt 6600

ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt accggatacc 6660

tgtccgcctt tttcccttcg ggaagcgtgg cgctttctca tagctcacgc tgtaggtatc 6720

tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc cccgttcagc 6780

ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta agacacgact 6840

tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat gtaggcggtg 6900

ctacagagtt cttgaagtgg tggcctaact acggctacac tagaagaaca gtatttggta 6960

tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct tgatccggca 7020

aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt acgcgcagaa 7080

aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct cagtggaacg 7140

aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc acctagatcc 7200

ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 7260

acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 7320

ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 7380

gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 7440

taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 7500

tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 7560

gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 7620

cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 7680

aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 7740

cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 7800

tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 7860

gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 7920

tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 7980

gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 8040

ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 8100

cgacacggaa atgttgaata ctcatactct tcctttttca atattattga agcatttatc 8160

agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat aaacaaatag 8220

gggttccgcg cacatttccc cgaaaagtgc cacctgacgt ctaagaaacc attattatca 8280

tgacattaac ctataaaaa 8299

<210> 30

<211> 8614

<212> DNA

<213> 人工序列

<220>

<223> 质粒 pDAU724

<400> 30

gaattcgagc tcggtacctt gaagttccta ttccgagttc ctattctcta gaaagtatag 60

gaacttcagt acccgggtat aagctagctt ccgttaaatt gccgtcgtca gccgttaaat 120

taccgattaa tcccgataaa tttccgagat ctccgttaaa ttgccgttcg cagccgttaa 180

attaccgggg acgaccgata aatttccgcg atgaattcat ggtgttttga tcattttaaa 240

tttttatatg gcgggtggtg ggcaactcgc ttgcgcgggc aactcgctta ccgattacgt 300

tagggctgat atttacgtaa aaatcgtcaa gggatgcaag accaaaccgt taaatttccg 360

gagtcaacag catccaagcc caagtccttc acggagaaac cccagcgtcc acatcacgag 420

cgaaggacca cctctaggca tcggacgcac catccaatta gaagcagcaa agcgaaacag 480

cccaagaaaa aggtcggccc gtcggccttt tctgcaacgc tgatcacggg cagcgatcca 540

accaacaccc tccagagtga ctaggggcgg aaatttatcg ggattaattt ccactcaacc 600

acaaatcaca gtcgtccccg gtaatttaac ggctgcagac ggcaatttaa cggcttctgc 660

gaatcgcttg gattccccgc ccctggccgt agagcttaaa gtatgtccct tgtcgatgcg 720

atgtatcaca acatataaat actggcaagg gatgccatgc ttggagtttc caactcaatt 780

tacctctatc cacacttctc ttccttcctc aatcctctat atacacaact ggggatccac 840

catgaggagc tcccttgtgc tgttctttgt ctctgcgtgg acggccttgg ccagtcctat 900

tcgtcgagag gtctcgcagg atctgtttaa ccagttcaat ctctttgcac agtattctgc 960

agccgcatac tgcggaaaaa acaatgatgc cccagctggt acaaacatta cgtgcacggg 1020

aaatgcctgc cccgaggtag agaaggcgga tgcaacgttt ctctactcgt ttgaagactc 1080

tggagtgggc gatgtcaccg gcttccttgc tctcgacaac acgaacaaat tgatcgtcct 1140

ctctttccgt ggctctcgtt ccatagagaa ctggatcggg aatcttaact tcgacttgaa 1200

agaaataaat gacatttgct ccggctgcag gggacatgac ggcttcactt cgtcctggag 1260

gtctgtagcc gatacgttaa ggcagaaggt ggaggatgct gtgagggagc atcccgacta 1320

tcgcgtggtg tttaccggac atagcttggg tggtgcattg gcaactgttg ccggagcaga 1380

cctgcgtgga aatgggtatg atatcgacgt gttttcatat ggcgcccccc gagtcggaaa 1440

cagggctttt gcagaattcc tgaccgtaca gaccggcgga acactctacc gcattaccca 1500

caccaatgat attgtcccta gactcccgcc gcgcgaattc ggttacagcc attctagccc 1560

agagtactgg atcaaatctg gaacccttgt ccccgtcacc cgaaacgata tcgtgaagat 1620

agaaggcatc gatgccaccg gcggcaataa ccagcctaac attccggata tccctgcgca 1680

cctatggtac ttcgggttaa ttgggacatg tctttagtgg ccggcgcggc tgggtcgact 1740

ctagcgagct cgagatctag agggtgactg acacctggcg gtagacaatc aatccatttc 1800

gctatagtta aaggatgggg atgagggcaa ttggttatat gatcatgtat gtagtgggtg 1860

tgcataatag tagtgaaatg gaagccaagt catgtgattg taatcgaccg acggaattga 1920

ggatatccgg aaatacagac accgtgaaag ccatggtctt tccttcgtgt agaagaccag 1980

acagacagtc cctgatttac ccttgcacaa agcactagaa aattagcatt ccatccttct 2040

ctgcttgctc tgctgatatc actgtcattc aatgcatagc catgagctca tcttagatcc 2100

aagcacgtaa ttccatagcc gaggtccaca gtggagcagc aacattcccc atcattgctt 2160

tccccagggg cctcccaacg actaaatcaa gagtatatct ctaccgtcca atagatcgtc 2220

ttcgcttcaa aatctttgac aattccaaga gggtccccat ccatcaaacc cagttcaata 2280

atagccgaga tgcatggtgg agtcaattag gcagtattgc tggaatgtcg gggccagttg 2340

gccgggtggt cattggccgc ctgtgatgcc atctgccact aaatccgatc attgatccac 2400

cgcccacgag gcgcgtcttt gctttttgcg cggcgtccag gttcaactct ctcttaatta 2460

atgtacatta gtgatacccc actctaagaa aatagaccaa tctccagctg caccttcaga 2520

cactccggta caaattctcg tctatgttgg agattgttgt gactttgaaa catgaccctt 2580

gaccctgatt ttgaatttgt ccatatatcg aggcaggtgt cttattcgta cggagagggt 2640

atctgtcgta gacacatagt agtagtcatt tcgagtgctg aatttataaa tcgcatcata 2700

cttgcgacat actgccataa aaggagtacg tatccaccac tacttattgc gcaccaacac 2760

gcttcaggta tgcatcccat ccctccttct ggtactgctt cgccgcctcc acgggatcag 2820

gagcagcata aattccacgg ccagcaataa taaagtcggc accgcgtcca acagccgact 2880

caggagtttg gtactgctgt cccagcttgt cacccttcga ggagaggttg acacctgtcg 2940

tgaagacgac aaaatcttcc tcctccgaag gcgagctaac ttcagactga acctcgccaa 3000

ggtgacgtgt cgagacgaat cccatcacaa acttcttata cttccgagca tagtcaacag 3060

aagaagtagt atattgaccg gtagccaaag atcccttgga ggtcatctcc gcaaggatca 3120

aaaggcccct ctcggagccg taggggaagt cctcggccga agcagtctgg gccagagcct 3180

cgacgatacc ctcaccgggc agaatactgc agttgatgat gtgggcccac tcagagatac 3240

gcagagtgcc gccatggtac tgcttttgga ctgtgtttcc gatatcgatg aacttgcgat 3300

cttcgaagat gaggaaattg tgcttctctg caagggcctt cagaccggtg atggtttctt 3360

cgctgaaatc ggagaggata tcgatgtgag ttttgatcac ggcaatgtac ggaccgagtc 3420

ctgttatata atccaccatt aaccattact agatcacatg taagtggcat tgaagttcct 3480

atactatttg aagaatagga actcggaata ggaacttcaa cgtacgattt tgacatttgc 3540

tccattgtcg aggatggatg gaacgagcgg cgtgcgccac gaaagtgagg ctattgccta 3600

tcagctcttt gctacattcc ggaaacaaac atcccttttt gtgaattatc tacgcaactt 3660

agatggcgtg aacgcatctt caaagtcttt cggcaggtcc ggcacgactt ttgcatccag 3720

agaagcgcct acatgtgtat tcgaccacct cctagcgcgc ttggatatga ggaaatatta 3780

ctgagagtcg aaaacaagct ccaccgcacc agctcttctt ggagttttat attaaagaat 3840

attcccagct cgttgtatta ttctttttct accgtgctaa tgtatcaagg actttggtac 3900

ctattaacgt tattattcgt gtgctattcc caaacataac cctgtatatg tttcgaacgc 3960

cgttatgacc catgtcttac atactcatta agtcattccc ttggataatc tcgactcaga 4020

tgcggcggtt gatgtaggag gagaggtaat cgaggacctc ctgggagatg atgccgttcc 4080

aggcggggta gcggatggag ccctcggcgg agcccttgag ctgctcgata tgctgccact 4140

cctcgatggg gttggtctca tccttgaggg cgatcatctc cttggagatg ggatcgtagg 4200

cgtagtagcg ggagactagt gcgaagtaat gatcggggat ggcggtgatc tgatgggtgt 4260

aggtggtgcg ggcgacggcg gaggcgcgct tatcggacca gttgccgacg acgttggtga 4320

gctcggtgag gcccttcatg gagaggaagg aggtcatgag atggcggccg atatgggact 4380

tggggccgtt cttgatggcg aagatggagt agggggcgtt cttcttgagg gccttgttgt 4440

aggagcggac gaggttatcc ttgaggagct ggtactcctg cttgttggag gaggagttgc 4500

cggtgcggtt gacgcgcttg aggacgggct cggagttgcg gaggaactca tcgaggtaga 4560

cgaggggatc gatgcggccg cgggcggaga agaagtagat atggcgggag acggaggtct 4620

tggtctcggt gacgaggcac tggatgatga cgccgaggta cttgttctgg acgagcttga 4680

aggacttggg atcgacgttc ttgatatcgg agaagcggcc gcagttgatg aaggtggcga 4740

ggaagaggaa ctggtagagg gtcttggtct tggtgaagcg ggaggtgtac tcgaaggagt 4800

tgaggatctt ctcggtgatc tcccagatgg actcgccctc ggagaggagg gccttgagca 4860

tcttcttgga atgggagttg cccttatcgg cctcctcgga ggactcgaac tggagctgga 4920

gggaggagac gatatcggtg atatcggact gatgcttctg gccgtagtag gggatgatgg 4980

tgaactccca ggcggggatg agcttcttga gggaggcctc caggatggtg gccttctggg 5040

tcttgtactt gaactggagg gacttgttga cgatatcgaa ggagagggag ttggagatga 5100

tggtgttgta ggacatgaag gtggcgcgct tgatggcggt gccgttatgg gtgatcatcc 5160

agcagaggta ggtgagctcg gcggcgcaga gggcgatctt ctcgccggag gggcgctcga 5220

agcgctcgac gaactggcgg acgaggacct tggggggggt cttgcagagg atatcgaact 5280

ggggcatggt gctcagatac tacggctgat cgcgtagagg tactgagcaa aacagatgtc 5340

agtaaggaga agagttgaat gaatggaaga agagtaggaa aggaggtatg ggggaaagat 5400

atacgtactg atgcggacga agagagaaag aaggaaaaaa gttgtgggag gggaaggagg 5460

gggaatcctt atatggaggg gcaagcgaga aggcgaatta gtgggcgggc ttaagccctc 5520

gaccgccgcc cttatcattg gacatggagg ggtaatgccc ccaccacgca tgtgcgggac 5580

cgacgcagaa tctgcacggc ggagtctctt ccagactgtt gacttttggg cgatgactct 5640

tgttgctgcg gccttttggg tacaccaacc tcgttgatct tgtttccttg gttctctttc 5700

gctcggagac ccgaccatga ccccaccatc agtcactatc ctgcctcgtc gataaaaatt 5760

ttttcttccc tctgattgtt acatagtatg tttccacctt tccggtggat ttcggacagt 5820

caaactgggc atcaacgcag tggtgggctg cttcgtttgc tgcgtgttgt acttgtttgc 5880

atttgaaccc cgcggtcgtt cgagtcctta attggtccgc tcccggtcaa cacccaagca 5940

gctgtggccc ggccgagtgg cgcctgtctg gtccacagta agcttggcgt aatcatggtc 6000

atagctgttt cctgtgtgaa attgttatcc gctcacaatt ccacacaaca tacgagccgg 6060

aagcataaag tgtaaagcct ggggtgccta atgagtgagc taactcacat taattgcgtt 6120

gcgctcactg cccgctttcc agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg 6180

ccaacgcgcg gggagaggcg gtttgcgtat tgggcgctct tccgcttcct cgctcactga 6240

ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca gctcactcaa aggcggtaat 6300

acggttatcc acagaatcag gggataacgc aggaaagaac atgtgagcaa aaggccagca 6360

aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 6420

tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 6480

aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 6540

gcttaccgga tacctgtccg cctttttccc ttcgggaagc gtggcgcttt ctcatagctc 6600

acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 6660

accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 6720

ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 6780

gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 6840

aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 6900

ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 6960

gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 7020

cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 7080

cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 7140

gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 7200

tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 7260

gggcttacca tctggcccca gtgctgcaat gataccgcga gacccacgct caccggctcc 7320

agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 7380

tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 7440

agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 7500

gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 7560

catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 7620

ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 7680

atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 7740

tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 7800

cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 7860

cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 7920

atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 7980

aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 8040

ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 8100

aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga 8160

aaccattatt atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtct 8220

cgcgcgtttc ggtgatgacg gtgaaaacct ctgacacatg cagctcccgg agacggtcac 8280

agcttgtctg taagcggatg ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt 8340

tggcgggtgt cggggctggc ttaactatgc ggcatcagag cagattgtac tgagagtgca 8400

ccatatgcgg tgtgaaatac cgcacagatg cgtaaggaga aaataccgca tcaggcgcca 8460

ttcgccattc aggctgcgca actgttggga agggcgatcg gtgcgggcct cttcgctatt 8520

acgccagctg gcgaaagggg gatgtgctgc aaggcgatta agttgggtaa cgccagggtt 8580

ttcccagtca cgacgttgta aaacgacggc cagt 8614

<210> 31

<211> 876

<212> DNA

<213> 人工序列

<220>

<223> 密码子优化的 VaXET16 开放阅读框

<400> 31

atgggctcgt ccctctggac ttgtttgatc ctcctctcct tggcatcggc atccttcgca 60

gcgaaccctc gaactccgat cgatgtgcct ttcggacgga actacgtgcc gacatgggca 120

ttcgaccaca ttaagtattt gaacggaggc tcggagatcc agttgcatct cgacaagtac 180

accggcactg gtttccagtc gaagggctcc tacttgttcg gacatttctc catgtacatc 240

aaattggtgc ctggtgactc ggcaggaact gtcaccgcat tctacctctc gtcgacaaac 300

gcagagcatg acgaaatcga cttcgagttc ctcggcaaca ggacaggaca gccgtacatc 360

ctccagacca acgtcttcac aggaggcaaa ggtgatcggg aacagcggat ctacttgtgg 420

ttcgatccca caacccagta ccataggtac tcggtgctct ggaacatgta tcagatcgtc 480

ttctacgtcg acgattatcc gatccgagtg ttcaagaact ccaacgactt gggcgtcaaa 540

ttccccttca accagcccat gaagatttac aactcgttgt ggaacgccga cgattgggca 600

accaggggtg gtctcgagaa gacagattgg tcgaaagcac ctttcatcgc gtcgtacaag 660

ggtttccaca tcgacggatg tgaagcctcc gtgaacgcca agttctgtga cacccagggc 720

aaacgatggt gggatcagcc ggaattccgg gatttggatg cagcccagtg gcagaagctc 780

gcgtgggtca ggaacaagta caccatctat aactactgta ccgatcggaa acgatattcg 840

caggtgcctc ccgagtgtac acgcgatagg gacatc 876

<210> 32

<211> 292

<212> PRT

<213> 豇豆属

<400> 32

Met Gly Ser Ser Leu Trp Thr Cys Leu Ile Leu Leu Ser Leu Ala Ser

1 5 10 15

Ala Ser Phe Ala Ala Asn Pro Arg Thr Pro Ile Asp Val Pro Phe Gly

20 25 30

Arg Asn Tyr Val Pro Thr Trp Ala Phe Asp His Ile Lys Tyr Leu Asn

35 40 45

Gly Gly Ser Glu Ile Gln Leu His Leu Asp Lys Tyr Thr Gly Thr Gly

50 55 60

Phe Gln Ser Lys Gly Ser Tyr Leu Phe Gly His Phe Ser Met Tyr Ile

65 70 75 80

Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr Leu

85 90 95

Ser Ser Thr Asn Ala Glu His Asp Glu Ile Asp Phe Glu Phe Leu Gly

100 105 110

Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe Thr Gly

115 120 125

Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp Pro Thr

130 135 140

Thr Gln Tyr His Arg Tyr Ser Val Leu Trp Asn Met Tyr Gln Ile Val

145 150 155 160

Phe Tyr Val Asp Asp Tyr Pro Ile Arg Val Phe Lys Asn Ser Asn Asp

165 170 175

Leu Gly Val Lys Phe Pro Phe Asn Gln Pro Met Lys Ile Tyr Asn Ser

180 185 190

Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Glu Lys Thr

195 200 205

Asp Trp Ser Lys Ala Pro Phe Ile Ala Ser Tyr Lys Gly Phe His Ile

210 215 220

Asp Gly Cys Glu Ala Ser Val Asn Ala Lys Phe Cys Asp Thr Gln Gly

225 230 235 240

Lys Arg Trp Trp Asp Gln Pro Glu Phe Arg Asp Leu Asp Ala Ala Gln

245 250 255

Trp Gln Lys Leu Ala Trp Val Arg Asn Lys Tyr Thr Ile Tyr Asn Tyr

260 265 270

Cys Thr Asp Arg Lys Arg Tyr Ser Gln Val Pro Pro Glu Cys Thr Arg

275 280 285

Asp Arg Asp Ile

290

<210> 33

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 引物 615726 (正义)

<400> 33

accgggagga aggctggaaa gcttacgaga aaagagttgg actttgaggg 50

<210> 34

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物 615728 (反义)

<400> 34

tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 40

<210> 35

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物 615729 (正义)

<400> 35

tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 40

<210> 36

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 引物 615731 (反义)

<400> 36

tatactttct agagaatagg aactcggaat aggaacttca aggaacaaca ctcaacccta 60

tctcggtc 68

<210> 37

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> 引物 615730 (正义)

<400> 37

tccgagttcc tattctctag aaagtatagg aacttcgcat ttatcagggt tattgtctca 60

tgagcgg 67

<210> 38

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 引物 615611 (反义)

<400> 38

tctagatctc gagtcagatg tccctatcgc gtgtacactc g 41

<210> 39

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 引物 615610 (正义)

<400> 39

acacgcgata gggacatctg actcgagatc tagagggtga ctgac 45

<210> 40

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物 615727 (反义)

<400> 40

aactcttttc tcgtaagctt tccagccttc ctcccggtac 40

<210> 41

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 41

cgaattctgc attgaagttc ctattccgag ttcctattct tcaaatagta taggaacttc 60

agatatccat cacactggcg 80

<210> 42

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 42

gccagtgtga tggatatctg aagttcctat actatttgaa gaataggaac tcggaatagg 60

aacttcaatg cagaattcgc 80

<210> 43

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 43

atatccatca cactggcggc cgctcaactc tctcctctag gttgaagttc ctattccgag 60

ttc 63

<210> 44

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 44

aggatgcatg ctcgagcatg cactagctag ttgaagttcc tatac 45

<210> 45

<211> 45

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 45

caccctctgt gtattgcacc atgccccagt tcgatatcct ctgca 45

<210> 46

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 46

aaactctagg atgcatgcaa gtgaggctat tgcctatcag ctc 43

<210> 47

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 47

catcacactg gcggccgcga attctaggct aggtatgc 38

<210> 48

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 48

ggtgcaatac acagagggtg 20

<210> 49

<211> 39

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 49

accgcggact gcgcaccatg agattcggtt ggctcgagg 39

<210> 50

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 50

ttcgccacgg agcttactag tagacacggg gcagaggc 38

<210> 51

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 51

cgtgtttctt cccattcgca tgcgacctcg tggtcattga c 41

<210> 52

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 52

gctttgacgt tacattgacg tacttataag cggccgccag tgtgatgga 49

<210> 53

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 53

tccatcacac tggcggccgc ttataagtac gtcaatgtaa cgtcaaagc 49

<210> 54

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 54

tgcagaggat atcgaactgg ggcattttgt atctgcgaat tgagcttg 48

<210> 55

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 55

caagctcaat tcgcagatac aaaatgcccc agttcgatat cctctgca 48

<210> 56

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 56

gctgtttaaa ctctaggatg catgcaagtg aggctattgc c 41

<210> 57

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 正向引物

<400> 57

cgtgtttctt cccattcgca tgcgacctcg tggtcattga c 41

<210> 58

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 反向引物

<400> 58

tgcagaggat atcgaactgg ggcattttgt atctgcgaat tgagcttg 48

<210> 59

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 引物 1208187

<400> 59

gattgagttg aaactgccta agatctcg 28

<210> 60

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 引物 1208194

<400> 60

ctatactttc tagagaatag gaactcggaa taggaacttc aaggtgcgca gtccgcggtt 60

gac 63

<210> 61

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 引物 1208195

<400> 61

ctattccgag ttcctattct ctagaaagta taggaacttc ggcgttgtta catctccctg 60

ag 62

<210> 62

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 引物 1208196

<400> 62

gcgtcaggct ttcgccacgt ctacgccagg accgagcaag 40

<210> 63

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 引物 069134

<400> 63

cgcaatctat cgaatagcag 20

<210> 64

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物 067947

<400> 64

ctacatcgaa gctgaaagca cgaga 25

<210> 65

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 引物 069860

<400> 65

cttctatctt gggatgcttc acgatacgtg a 31

<210> 66

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 引物 069861

<400> 66

cgcgcccttg aatatcggag aaggt 25

<210> 67

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物 0610249

<400> 67

gagaacacag tgagaccata gc 22

<210> 68

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 引物 0610250

<400> 68

tctcaaccca atcagcaaca tg 22

<210> 69

<211> 3021

<212> DNA

<213> 黑曲霉

<400> 69

atgcgccaca gcatcggatt ggcagcggcc ctactggcac caaccctacc tgtagcgttg 60

ggtcaatata ttcgagactt aagcaccgag aaatggactc tcagtagtcg agccttgaat 120

cggacagtac ctgctcaatt tccatcgcag gttcacttag atctactaag ggccggagtg 180

attggtgagt actatttgga agtcaagtcc tgtgagtata caaccgctaa cagcctcaat 240

agatgatccg taagtgactt catctgccat ggatgagaat tgaatcgcac taaatattgc 300

tggagatacc atggtttgaa cgatttcaat cttcgctgga tcgctgctgc caactggact 360

tataccagtc aacccatcaa aggcctgtga gtcgctgtga agtttgtgca atgtcgttcg 420

acaatactaa gaaccaatag cctggacaat tacgactcaa cttggctcgt gtttgacgga 480

ctggacactt tcgcaacaat ctcattctgt gggcagcaaa tcgcatccac ggacaatcag 540

tttcgccagt atgcgttcga tgtatccacc gcactagggt cctgcaaagg agatcctgtt 600

ctgagcatca actttggaag cgcaccgaat attgttgatg ctatcgcaca ggactctaat 660

tcgcaaagta agtttcagag gtgggggact gccgaagttg ttacatgcta attgtatata 720

gaatggcccg atgacgtcca actcacctac gagtacccaa atcggtggtt tatgcgcaaa 780

gaacaatcgg acttcggatg ggattggggt ccagcatttg cccctgcagg tccatggaag 840

cctgcatata ttgttcagct agacaagaaa gaaagtgtct atgtcctgaa cacggatttg 900

gatatatacc gaaagggcca aattaactac cttccgccag accagagcca accttgggtc 960

gtcaacgcta gcattgacat tttgggtcca ctacctacca aaccaaccat gtcgattgaa 1020

gtgcgcgata ctcattctgg cacgattctt acttcgcgga ctctgaacaa tgtcagtgtg 1080

gctggtaatg ccataactgg tgtcaccgtt ctcgacgggc tgaccccgaa actgtggtgg 1140

ccgcaaggcc tcggtgatca gaacctctac aatgtttcta tcactgtcca aagtagagga 1200

aaccagaccg tggccagtgt gaacaaacgg acgggcttcc gcaccatttt tctcaaccag 1260

cgcaacatta ctgaagcaca gcgtgcgcaa ggaatcgccc ctggagcaaa ctggcacttt 1320

gaagtcaacg gtcatgagtt ctacgcaaaa ggatcgaacc ttatcccacc agacagtttc 1380

tggacccgtg ttacagaaga gaagatgtca cggctattcg atgcagtggt cgttggaaac 1440

cagaatatgc tccgtgtctg gtcctccggc gcgtacctgc atgactacat ctatgatctg 1500

gccgatgaaa agggcattct cttatggagc gagttcgagt tcagtgacgc tttatatccc 1560

tccgacgacg ctttcctcga gaacgttgct gctgagatag tatacaatgt tcgacgagtg 1620

aaccaccatc cctccttggc tctatgggct ggcggaaatg aaatcgaatc cttgatgctc 1680

ccacgtgtca aagatgcagc cccatcttca tattcctact atgtgggcga gtatgagaag 1740

atgtacatta gcctcttctt gcctctggtc tacgagaaca cgcgttccat ctcatactcc 1800

cccagcagca caaccgaagg ctacctgtac attgaccttt ctgcccctgt cccaatggct 1860

gaacgttacg acaacactac ctccggctca tactacggcg atacagacca ctacgactac 1920

gacactagcg tggcgtttga ctacggttcc tatccggtag gccgctttgc caacgaattc 1980

ggcttccaca gcatgcccag cctccagaca tggcaacaag ctgtcgacac tgaggatctt 2040

tacttcaaca gcagcgtcgt catgctgcgc aaccaccacg atcccgcagg tggtctcatg 2100

acggacaact acgcgaactc ggccactggc atgggcgaaa tgaccatggg cgtggtaagc 2160

tactatccga taccgagtaa atccgaccac atctccaact tcagcgcctg gtgccatgcc 2220

acccagctct ttcaggcaga catgtacaaa agtcagatcc agttctaccg tcgtggaagt 2280

ggcatgcccg agcgccagct tggctccttg tattggcagc tcgaagatat ctggcaagcg 2340

ccatcatggg caggcattga gtacggtggt agatggaagg tccttcacca cgttatgaga 2400

gatatctatc agcctgttat tgtttcacct ttttggaact atactaccgg ctcgttggat 2460

gtctatgtta cttccgatct gtggagccct gcagcaggta ctgtcgactt gacctggttg 2520

gacctgtccg gccgccctat tgcgggtaac gcgggcacgc caaaatctgt tccctttacc 2580

gtgggaggtc tcaacagcac tcgcatctat gggacgaatg tttcttctct gggcttgccg 2640

gatactaaag atgctgttct gatcctctcg ctctcggctc acggccgtct tccgaactca 2700

gaccggacca ccaacttgac tcatgagaat tacgctacgc tttcttggcc caaggatttg 2760

aagattgttg acccgggact taagatagga cacagctcaa agaagacaac cgttacggtg 2820

gaagctacat ccggtgtttc attgtacacc tggctcgact acccagaggg tgtggtggga 2880

tactttgaag agaatgcctt cgtcttagca ccaggcgaga agaaagagat tagttttact 2940

gttctagagg acactactga cggggcttgg gtccgtaaca tcaccgtcca gagtctctgg 3000

gaccaaaagg ttcgcggttg a 3021

<210> 70

<211> 931

<212> PRT

<213> 黑曲霉

<400> 70

Met Arg His Ser Ile Gly Leu Ala Ala Ala Leu Leu Ala Pro Thr Leu

1 5 10 15

Pro Val Ala Leu Gly Gln Tyr Ile Arg Asp Leu Ser Thr Glu Lys Trp

20 25 30

Thr Leu Ser Ser Arg Ala Leu Asn Arg Thr Val Pro Ala Gln Phe Pro

35 40 45

Ser Gln Val His Leu Asp Leu Leu Arg Ala Gly Val Ile Gly Glu Tyr

50 55 60

His Gly Leu Asn Asp Phe Asn Leu Arg Trp Ile Ala Ala Ala Asn Trp

65 70 75 80

Thr Tyr Thr Ser Gln Pro Ile Lys Gly Leu Leu Asp Asn Tyr Asp Ser

85 90 95

Thr Trp Leu Val Phe Asp Gly Leu Asp Thr Phe Ala Thr Ile Ser Phe

100 105 110

Cys Gly Gln Gln Ile Ala Ser Thr Asp Asn Gln Phe Arg Gln Tyr Ala

115 120 125

Phe Asp Val Ser Thr Ala Leu Gly Ser Cys Lys Gly Asp Pro Val Leu

130 135 140

Ser Ile Asn Phe Gly Ser Ala Pro Asn Ile Val Asp Ala Ile Ala Gln

145 150 155 160

Asp Ser Asn Ser Gln Lys Trp Pro Asp Asp Val Gln Leu Thr Tyr Glu

165 170 175

Tyr Pro Asn Arg Trp Phe Met Arg Lys Glu Gln Ser Asp Phe Gly Trp

180 185 190

Asp Trp Gly Pro Ala Phe Ala Pro Ala Gly Pro Trp Lys Pro Ala Tyr

195 200 205

Ile Val Gln Leu Asp Lys Lys Glu Ser Val Tyr Val Leu Asn Thr Asp

210 215 220

Leu Asp Ile Tyr Arg Lys Gly Gln Ile Asn Tyr Leu Pro Pro Asp Gln

225 230 235 240

Ser Gln Pro Trp Val Val Asn Ala Ser Ile Asp Ile Leu Gly Pro Leu

245 250 255

Pro Thr Lys Pro Thr Met Ser Ile Glu Val Arg Asp Thr His Ser Gly

260 265 270

Thr Ile Leu Thr Ser Arg Thr Leu Asn Asn Val Ser Val Ala Gly Asn

275 280 285

Ala Ile Thr Gly Val Thr Val Leu Asp Gly Leu Thr Pro Lys Leu Trp

290 295 300

Trp Pro Gln Gly Leu Gly Asp Gln Asn Leu Tyr Asn Val Ser Ile Thr

305 310 315 320

Val Gln Ser Arg Gly Asn Gln Thr Val Ala Ser Val Asn Lys Arg Thr

325 330 335

Gly Phe Arg Thr Ile Phe Leu Asn Gln Arg Asn Ile Thr Glu Ala Gln

340 345 350

Arg Ala Gln Gly Ile Ala Pro Gly Ala Asn Trp His Phe Glu Val Asn

355 360 365

Gly His Glu Phe Tyr Ala Lys Gly Ser Asn Leu Ile Pro Pro Asp Ser

370 375 380

Phe Trp Thr Arg Val Thr Glu Glu Lys Met Ser Arg Leu Phe Asp Ala

385 390 395 400

Val Val Val Gly Asn Gln Asn Met Leu Arg Val Trp Ser Ser Gly Ala

405 410 415

Tyr Leu His Asp Tyr Ile Tyr Asp Leu Ala Asp Glu Lys Gly Ile Leu

420 425 430

Leu Trp Ser Glu Phe Glu Phe Ser Asp Ala Leu Tyr Pro Ser Asp Asp

435 440 445

Ala Phe Leu Glu Asn Val Ala Ala Glu Ile Val Tyr Asn Val Arg Arg

450 455 460

Val Asn His His Pro Ser Leu Ala Leu Trp Ala Gly Gly Asn Glu Ile

465 470 475 480

Glu Ser Leu Met Leu Pro Arg Val Lys Asp Ala Ala Pro Ser Ser Tyr

485 490 495

Ser Tyr Tyr Val Gly Glu Tyr Glu Lys Met Tyr Ile Ser Leu Phe Leu

500 505 510

Pro Leu Val Tyr Glu Asn Thr Arg Ser Ile Ser Tyr Ser Pro Ser Ser

515 520 525

Thr Thr Glu Gly Tyr Leu Tyr Ile Asp Leu Ser Ala Pro Val Pro Met

530 535 540

Ala Glu Arg Tyr Asp Asn Thr Thr Ser Gly Ser Tyr Tyr Gly Asp Thr

545 550 555 560

Asp His Tyr Asp Tyr Asp Thr Ser Val Ala Phe Asp Tyr Gly Ser Tyr

565 570 575

Pro Val Gly Arg Phe Ala Asn Glu Phe Gly Phe His Ser Met Pro Ser

580 585 590

Leu Gln Thr Trp Gln Gln Ala Val Asp Thr Glu Asp Leu Tyr Phe Asn

595 600 605

Ser Ser Val Val Met Leu Arg Asn His His Asp Pro Ala Gly Gly Leu

610 615 620

Met Thr Asp Asn Tyr Ala Asn Ser Ala Thr Gly Met Gly Glu Met Thr

625 630 635 640

Met Gly Val Val Ser Tyr Tyr Pro Ile Pro Ser Lys Ser Asp His Ile

645 650 655

Ser Asn Phe Ser Ala Trp Cys His Ala Thr Gln Leu Phe Gln Ala Asp

660 665 670

Met Tyr Lys Ser Gln Ile Gln Phe Tyr Arg Arg Gly Ser Gly Met Pro

675 680 685

Glu Arg Gln Leu Gly Ser Leu Tyr Trp Gln Leu Glu Asp Ile Trp Gln

690 695 700

Ala Pro Ser Trp Ala Gly Ile Glu Tyr Gly Gly Arg Trp Lys Val Leu

705 710 715 720

His His Val Met Arg Asp Ile Tyr Gln Pro Val Ile Val Ser Pro Phe

725 730 735

Trp Asn Tyr Thr Thr Gly Ser Leu Asp Val Tyr Val Thr Ser Asp Leu

740 745 750

Trp Ser Pro Ala Ala Gly Thr Val Asp Leu Thr Trp Leu Asp Leu Ser

755 760 765

Gly Arg Pro Ile Ala Gly Asn Ala Gly Thr Pro Lys Ser Val Pro Phe

770 775 780

Thr Val Gly Gly Leu Asn Ser Thr Arg Ile Tyr Gly Thr Asn Val Ser

785 790 795 800

Ser Leu Gly Leu Pro Asp Thr Lys Asp Ala Val Leu Ile Leu Ser Leu

805 810 815

Ser Ala His Gly Arg Leu Pro Asn Ser Asp Arg Thr Thr Asn Leu Thr

820 825 830

His Glu Asn Tyr Ala Thr Leu Ser Trp Pro Lys Asp Leu Lys Ile Val

835 840 845

Asp Pro Gly Leu Lys Ile Gly His Ser Ser Lys Lys Thr Thr Val Thr

850 855 860

Val Glu Ala Thr Ser Gly Val Ser Leu Tyr Thr Trp Leu Asp Tyr Pro

865 870 875 880

Glu Gly Val Val Gly Tyr Phe Glu Glu Asn Ala Phe Val Leu Ala Pro

885 890 895

Gly Glu Lys Lys Glu Ile Ser Phe Thr Val Leu Glu Asp Thr Thr Asp

900 905 910

Gly Ala Trp Val Arg Asn Ile Thr Val Gln Ser Leu Trp Asp Gln Lys

915 920 925

Val Arg Gly

930

<210> 71

<211> 10207

<212> DNA

<213> 人工序列

<220>

<223> 质粒 pQM27

<400> 71

gcccaatacg caaaccgcct ctccccgcgc gttggccgat tcattaatgc agctggcacg 60

acaggtttcc cgactggaaa gcgggcagtg agcgcaacgc aattaatgtg agttagctca 120

ctcattaggc accccaggct ttacacttta tgcttccggc tcgtatgttg tgtggaattg 180

tgagcggata acaatttcac acaggaaaca gctatgacca tgattacgaa ttgtttaaac 240

gtcgaccgaa tgtaggattg ttatccgaac tctgctcgta gaggcatgtt gtgaatctgt 300

gtcgggcagg acacgcctcg aaggttcacg gcaagggaaa ccaccgatag cagtgtctag 360

tagcaacctg taaagccgca atgcagcatc actggaaaat acaaaccaat ggctaaaagt 420

acataagtta atgcctaaag aagtcatata ccagcggcta ataattgtac aatcaagtgg 480

ctaaacgtac cgtaatttgc caacggcttg tggggttgca gaagcaacgg caaagcccca 540

cttccccacg tttgtttctt cactcagtcc aatctcagct ggtgatcccc caattgggtc 600

gcttgtttgt tccggtgaag tgaaagaaga cagaggtaag aatgtctgac tcggagcgtt 660

ttgcatacaa ccaagggcag tgatggaaga cagtgaaatg ttgacattca aggagtattt 720

agccagggat gcttgagtgt atcgtgtaag gaggtttgtc tgccgatacg acgaatactg 780

tatagtcact tctgatgaag tggtccatat tgaaatgtaa gtcggcactg aacaggcaaa 840

agattgagtt gaaactgcct aagatctcgg gccctcgggc cttcggcctt tgggtgtaca 900

tgtttgtgct ccgggcaaat gcaaagtgtg gtaggatcga acacactgct gcctttacca 960

agcagctgag ggtatgtgat aggcaaatgt tcaggggcca ctgcatggtt tcgaatagaa 1020

agagaagctt agccaagaac aatagccgat aaagatagcc tcattaaacg gaatgagcta 1080

gtaggcaaag tcagcgaatg tgtatatata aaggttcgag gtccgtgcct ccctcatgct 1140

ctccccatct actcatcaac tcagatcctc caggagactt gtacaccatc ttttgaggca 1200

cagaaaccca atagtcaacc gcggactgcg caccatgcgc cacagcatcg gattggcagc 1260

ggccctactg gcaccaaccc tacctgtagc gttgggtcaa tatattcgag acttaagcac 1320

cgagaaatgg actctcagta gtcgagcctt gaatcggaca gtacctgctc aatttccatc 1380

gcaggttcac ttagatctac taagggccgg agtgattggt gagtactatt tggaagtcaa 1440

gtcctgtgag tatacaaccg ctaacagcct caatagatga tccgtaagtg acttcatctg 1500

ccatggatga gaattgaatc gcactaaata ttgctggaga taccatggtt tgaacgattt 1560

caatcttcgc tggatcgctg ctgccaactg gacttatacc agtcaaccca tcaaaggcct 1620

gtgagtcgct gtgaagtttg tgcaatgtcg ttcgacaata ctaagaacca atagcctgga 1680

caattacgac tcaacttggc tcgtgtttga cggactggac actttcgcaa caatctcatt 1740

ctgtgggcag caaatcgcat ccacggacaa tcagtttcgc cagtatgcgt tcgatgtatc 1800

caccgcacta gggtcctgca aaggagatcc tgttctgagc atcaactttg gaagcgcacc 1860

gaatattgtt gatgctatcg cacaggactc taattcgcaa agtaagtttc agaggtgggg 1920

gactgccgaa gttgttacat gctaattgta tatagaatgg cccgatgacg tccaactcac 1980

ctacgagtac ccaaatcggt ggtttatgcg caaagaacaa tcggacttcg gatgggattg 2040

gggtccagca tttgcccctg caggtccatg gaagcctgca tatattgttc agctagacaa 2100

gaaagaaagt gtctatgtcc tgaacacgga tttggatata taccgaaagg gccaaattaa 2160

ctaccttccg ccagaccaga gccaaccttg ggtcgtcaac gctagcattg acattttggg 2220

tccactacct accaaaccaa ccatgtcgat tgaagtgcgc gatactcatt ctggcacgat 2280

tcttacttcg cggactctga acaatgtcag tgtggctggt aatgccataa ctggtgtcac 2340

cgttctcgac gggctgaccc cgaaactgtg gtggccgcaa ggcctcggtg atcagaacct 2400

ctacaatgtt tctatcactg tccaaagtag aggaaaccag accgtggcca gtgtgaacaa 2460

acggacgggc ttccgcacca tttttctcaa ccagcgcaac attactgaag cacagcgtgc 2520

gcaaggaatc gcccctggag caaactggca ctttgaagtc aacggtcatg agttctacgc 2580

aaaaggatcg aaccttatcc caccagacag tttctggacc cgtgttacag aagagaagat 2640

gtcacggcta ttcgatgcag tggtcgttgg aaaccagaat atgctccgtg tctggtcctc 2700

cggcgcgtac ctgcatgact acatctatga tctggccgat gaaaagggca ttctcttatg 2760

gagcgagttc gagttcagtg acgctttata tccctccgac gacgctttcc tcgagaacgt 2820

tgctgctgag atagtataca atgttcgacg agtgaaccac catccctcct tggctctatg 2880

ggctggcgga aatgaaatcg aatccttgat gctcccacgt gtcaaagatg cagccccatc 2940

ttcatattcc tactatgtgg gcgagtatga gaagatgtac attagcctct tcttgcctct 3000

ggtctacgag aacacgcgtt ccatctcata ctcccccagc agcacaaccg aaggctacct 3060

gtacattgac ctttctgccc ctgtcccaat ggctgaacgt tacgacaaca ctacctccgg 3120

ctcatactac ggcgatacag accactacga ctacgacact agcgtggcgt ttgactacgg 3180

ttcctatccg gtaggccgct ttgccaacga attcggcttc cacagcatgc ccagcctcca 3240

gacatggcaa caagctgtcg acactgagga tctttacttc aacagcagcg tcgtcatgct 3300

gcgcaaccac cacgatcccg caggtggtct catgacggac aactacgcga actcggccac 3360

tggcatgggc gaaatgacca tgggcgtggt aagctactat ccgataccga gtaaatccga 3420

ccacatctcc aacttcagcg cctggtgcca tgccacccag ctctttcagg cagacatgta 3480

caaaagtcag atccagttct accgtcgtgg aagtggcatg cccgagcgcc agcttggctc 3540

cttgtattgg cagctcgaag atatctggca agcgccatca tgggcaggca ttgagtacgg 3600

tggtagatgg aaggtccttc accacgttat gagagatatc tatcagcctg ttattgtttc 3660

acctttttgg aactatacta ccggctcgtt ggatgtctat gttacttccg atctgtggag 3720

ccctgcagca ggtactgtcg acttgacctg gttggacctg tccggccgcc ctattgcggg 3780

taacgcgggc acgccaaaat ctgttccctt taccgtggga ggtctcaaca gcactcgcat 3840

ctatgggacg aatgtttctt ctctgggctt gccggatact aaagatgctg ttctgatcct 3900

ctcgctctcg gctcacggcc gtcttccgaa ctcagaccgg accaccaact tgactcatga 3960

gaattacgct acgctttctt ggcccaagga tttgaagatt gttgacccgg gacttaagat 4020

aggacacagc tcaaagaaga caaccgttac ggtggaagct acatccggtg tttcattgta 4080

cacctggctc gactacccag agggtgtggt gggatacttt gaagagaatg ccttcgtctt 4140

agcaccaggc gagaagaaag agattagttt tactgttcta gaggacacta ctgacggggc 4200

ttgggtccgt aacatcaccg tccagagtct ctgggaccaa aaggttcgcg gttgattaat 4260

taagctccgt ggcgaaagcc tgacgcaccg gtagattctt ggtgagcccg tatcatgacg 4320

gcggcgggag ctacatggcc ccgggtgatt tatttttttt gtatctactt ctgacccttt 4380

tcaaatatac ggtcaactca tctttcactg gagatgcggc ctgcttggta ttgcgatgtt 4440

gtcagcttgg caaattgtgg ctttcgaaaa cacaaaacga ttccttagta gccatgcatt 4500

ttaagataac ggaatagaag aaagaggaaa ttaaaaaaaa aaaaaaaaca aacatcccgt 4560

tcataacccg tagaatcgcc gctcttcgtg tatcccagta ccacggcaaa ggtatttcat 4620

gatcgttcaa tgttgatatt gttcccgcca gtatggctcc acccccatct ccgcgaatct 4680

cctcttctcg aacgcggtag tggcgcgcca attggtaatg acccataggg agacgaatta 4740

actagaggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 4800

ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 4860

aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 4920

agacaccgtg aaagccatgc tctttccttc gtgtagaaga ccagacagac agtccctgat 4980

ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5040

tatcactgtc attcaatgca tctggaaacg caaccctgaa gggattcttc ctttgagaga 5100

tggaagcgtg tcatatctct tcggttctac ggcaggtttt tttctgctct ttcgtagcat 5160

ggcatggtca cttcagcgct tatttacagt tgctggtatt gatttcttgt gcaaattgct 5220

atctgacact tattagctat ggagtcacca catttcccag caacttcccc acttcctctg 5280

caatcgccaa cgtcctctct tcactgagtc tccgtccgat aacctgcact gcaaccggtg 5340

ccccatgata cgcctccgga tcatactctt cctgcacgag ggcatcaagc tcactaaccg 5400

ccttgaaact ctcattcttc ttatcgatgt tcttatccgc aaaggtaacc ggaacaacca 5460

cgctcgtgaa atccagcagg ttgatcacag aggcataccc atagtaccgg aactggtcat 5520

gccgtaccgc agcggtaggc gtaatcggcg cgatgatggc gtccagttcc ttcccggcct 5580

tttcttcagc ctcccgccat ttctcaaggt actccatctg gtaattccac ttctggagat 5640

gcgtgtccca gagctcgttc atgttaacag ctttgatgtt cgggttcagt aggtctttga 5700

tatttggagt cgccggctcg ccggatgcac tgatatcgcg cattacgtcg gcgctgccgt 5760

cagccgcgta gatatgggag atgagatcgt ggccgaaatc gtgcttgtat ggcgtccacg 5820

gggtcacggt gtgaccggct ttggcgagtg cggcgacggt ggtttccacg ccgcgcagga 5880

taggagggtg tggaaggaca ttgccgtcga agttgtagta gccgatattg agcccgccgt 5940

tcttgatctt ggaggcaata atgtccgact cggactggcg ccagggcatg gggatgacct 6000

tggagtcgta tttccaaggc tcctgaccga ggacggattt ggtgaagagg cggaggtcta 6060

acatacttca tcagtgactg ccggtctcgt atatagtata aaaagcaaga aaggaggaca 6120

gtggaggcct ggtatagagc aggaaaagaa ggaagaggcg aaggactcac cctcaacaga 6180

gtgcgtaatc ggcccgacaa cgctgtgcac cgtctcctga ccctccatgc tgttcgccat 6240

ctttgcatac ggcagccgcc catgactcgg ccttagaccg tacaggaagt tgaacgcggc 6300

cggcactcga atcgagccac cgatatccgt tcctacaccg atgacgccac cacgaatccc 6360

aacgatcgca ccctcaccac cagaactgcc gccgcacgac cagttcttgt tgcgtgggtt 6420

gacggtgcgc ccgatgatgt tgttgactgt ctcgcagacc atcagggtct gcgggacaga 6480

ggtcttgacg tagaagacgg caccggcttt gcggagcatg gttgtcagaa ccgagtcccc 6540

ttcgtcgtac ttgtttagcc atgagatgta gcccattgat gtttcgtagc cctggtggca 6600

tatgttagct gacaaaaagg gacatctaac gacttagggg caacggtgta ccttgactcg 6660

aagctggtct ttgagagaga tggggaggcc atgaagtgga ccaacgggtc tcttgtgctt 6720

tgcgtagtat tcatcgagtt cccttgcctg cgcgagagcg gcgtcaggga agaactcgtg 6780

ggcgcagttt gtctgcacag aagccagcgt cagcttgata gtcccataag gtggcgttgt 6840

tacatctccc tgagaggtag aggggaccct actaactgct gggcgattgc tgcccgttta 6900

cagaatgcta gcgtaacttc caccgaggtc aactctccgg ccgccagctt ggacacaaga 6960

tctgcagcgg aggcctctgt gatcttcagt tcggcctctg aaaggatccc cgatttcttt 7020

gggaaatcaa taacgctgtc ttccgcaggc agcgtctgga ctttccattc atcagggatg 7080

gtttttgcga ggcgggcgcg cttatcagcg gccagttctt cccaggattg aggcattctg 7140

tgttagctta tagtcaggat gttggctcga cgagtgtaaa ctgggagttg gcatgagggt 7200

tatgtaggct tctttagccc cgcatccccc tcattctcct cattgatccc gggggagcgg 7260

atggtgttga taagagacta attatagggt ttagctggtg cctagctggt gattggctgg 7320

cttcgccgaa ttttacgggc caaggaaagc tgcagaaccg cggcactggt aaacggtaat 7380

taagctatca gccccatgct aacgagttta aattacgtgt attgctgata aacaccaaca 7440

gagctttact gaaagatggg agtcacggtg tggcttcccc actgcgatta ttgcacaagc 7500

agcgagggcg aacttgactg tcgtcgctga gcagcctgca gtcaaacata catatatatc 7560

aaccgcgaag acgtctggcc ttgtagaaca cgacgctccc tagcaacacc tgccgtgtca 7620

gcctctacgg ttgttacttg cattcaggat gctctccagc gggcgagcta ttcaaaatat 7680

tcaaagcagg tatctcgtat tgccaggatt cagctgaagc aacaggtgcc aaggaaatct 7740

gcgtcggttc tcatctgggc ttgctcggtc ctggcgtaga atgcatccta gagtttaaac 7800

agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa 7860

cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc 7920

accgatcgcc cttcccaaca gttgcgcagc ctgaacggcg aatggcgcct gatgcggtat 7980

tttctcctta cgcatctgtg cggtatttca caccgcatat ggtgcactct cagtacaatc 8040

tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc tgacgcgccc 8100

tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt ctccgggagc 8160

tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa gggcctcgtg 8220

atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagac gtcaggtggc 8280

acttttcggg gaaatgtgcg cggaacccct atttgtttat ttttctaaat acattcaaat 8340

atgtatccgc tcatgagaca ataaccctga taaatgcttc aataatattg aaaaaggaag 8400

agtatgagta ttcaacattt ccgtgtcgcc cttattccct tttttgcggc attttgcctt 8460

cctgtttttg ctcacccaga aacgctggtg aaagtaaaag atgctgaaga tcagttgggt 8520

gcacgagtgg gttacatcga actggatctc aacagcggta agatccttga gagttttcgc 8580

cccgaagaac gttttccaat gatgagcact tttaaagttc tgctatgtgg cgcggtatta 8640

tcccgtattg acgccgggca agagcaactc ggtcgccgca tacactattc tcagaatgac 8700

ttggttgagt actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa 8760

ttatgcagtg ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg 8820

atcggaggac cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc 8880

cttgatcgtt gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg 8940

atgcctgtag caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta 9000

gcttcccggc aacaattaat agactggatg gaggcggata aagttgcagg accacttctg 9060

cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 9120

tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 9180

tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 9240

gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 9300

gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 9360

atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cgtagaaaag 9420

atcaaaggat cttcttgaga tccttttttt ctgcgcgtaa tctgctgctt gcaaacaaaa 9480

aaaccaccgc taccagcggt ggtttgtttg ccggatcaag agctaccaac tctttttccg 9540

aaggtaactg gcttcagcag agcgcagata ccaaatactg ttcttctagt gtagccgtag 9600

ttaggccacc acttcaagaa ctctgtagca ccgcctacat acctcgctct gctaatcctg 9660

ttaccagtgg ctgctgccag tggcgataag tcgtgtctta ccgggttgga ctcaagacga 9720

tagttaccgg ataaggcgca gcggtcgggc tgaacggggg gttcgtgcac acagcccagc 9780

ttggagcgaa cgacctacac cgaactgaga tacctacagc gtgagctatg agaaagcgcc 9840

acgcttcccg aagggagaaa ggcggacagg tatccggtaa gcggcagggt cggaacagga 9900

gagcgcacga gggagcttcc agggggaaac gcctggtatc tttatagtcc tgtcgggttt 9960

cgccacctct gacttgagcg tcgatttttg tgatgctcgt caggggggcg gagcctatgg 10020

aaaaacgcca gcaacgcggc ctttttacgg ttcctggcct tttgctggcc ttttgctcac 10080

atgttctttc ctgcgttatc ccctgattct gtggataacc gtattaccgc ctttgagtga 10140

gctgataccg ctcgccgcag ccgaacgacc gagcgcagcg agtcagtgag cgaggaagcg 10200

gaagagc 10207

<210> 72

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> 引物 1210956

<400> 72

tgattacgaa ttgtttaaac ggatccgaat gtaggattgt tatccg 46

<210> 73

<211> 72

<212> DNA

<213> 人工序列

<220>

<223> 引物 1201606

<400> 73

gaagttccta tactttctag agaataggaa ctcggaatag gaacttcaac cttatgggac 60

tatcaagctg ac 72

<210> 74

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 引物 1210957

<400> 74

gttacattga cgtacttata agaagttcct atactttcta gagaatagga 50

<210> 75

<211> 357

<212> DNA

<213> 人工序列

<220>

<223> 里氏木霉cbh1 5' 探针序列

<400> 75

tagggtcggc aacggcaaaa aagcacgtgg ctcaccgaaa agcaagatgt ttgcgatcta 60

acatccagga acctggatac atccatcatc acgcacgacc actttgatct gctgtaaact 120

cgtattcgcc ctaaaccgaa gtgcgtggta aatctacacg tgggcccctt tcggtatact 180

gcgtgtgtct tctctaggtg ccattctttt cccttcctct agtgttgaat tgtttgtgtt 240

ggagtccgag ctgtaactac ctctgaatct ctggagaatg gtggactaac gactaccgtg 300

cacctgcatc atgtatataa tagtgatcct gagaaggggg gtttggagca atgtggg 357

<210> 76

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 引物 1205503

<400> 76

gggagatgta acaacgcctt gaagttccta ttccgagttc ctattcttca aatagtatag 60

gaacttcaac cttatgggac tatcaag 87

<210> 77

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 引物 1205504

<400> 77

cttgatagtc ccataaggtt gaagttccta tactatttga agaataggaa ctcggaatag 60

gaacttcaag gcgttgttac atctccc 87

<210> 78

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 引物 1205505

<400> 78

gcccctaagt cgttagatgt ttgaagttcc tattccgagt tcctattctt caaatagtat 60

aggaacttca ccctttttgt cagc 84

<210> 79

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 引物 1205506

<400> 79

gctgacaaaa agggtgaagt tcctatacta tttgaagaat aggaactcgg aataggaact 60

tcaaacatct aacgacttag gggc 84

<210> 80

<211> 83

<212> DNA

<213> 人工序列

<220>

<223> 引物 1205507

<400> 80

ctataccagg cctccacttg aagttcctat tccgagttcc tattcttcaa atagtatagg 60

aacttcatgt cctcctttct tgc 83

<210> 81

<211> 83

<212> DNA

<213> 人工序列

<220>

<223> 引物 1205508

<400> 81

gcaagaaagg aggacatgaa gttcctatac tatttgaaga ataggaactc ggaataggaa 60

cttcaagtgg aggcctggta tag 83

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1