苔藓表达促进区域的制作方法

文档序号:3572795阅读:661来源:国知局
专利名称:苔藓表达促进区域的制作方法
莒藓表达促进区域
本申请是申请号2004800229689,申请日为2004年7月30曰的 同名专利的分案申请。
本发明涉及分离的核酸分子,这些分子促进多肽在遗传修饰的真 核宿主细胞中的表达。
蛋白质类物质(蛋白质、肽、多肽及其片段,以及这些分子的翻 译后修饰的形式,在此后被称为"多肽",在例如实施例部分中与"蛋 白质"作为同义词一同使用)在遗传修饰的细胞中的表达是提供这些 通常是稀缺或者贵重物质制备物的主要来源。为了在遗传修饰的宿主 细胞中表达这些多肽,需要有对这一表达有正面控制("激活"、"促 进")的DNA区域的存在。启动子是这种区域的重要实例,它们使RNA 聚合酶结合到DNA上,起始DNA转录为mRNA (Watson等 人,"Recombinant DNA" (1992),Chapter I.1和2)。
作为研究植物生理和发育的有用研究对象,苔藓(moss)吸引了 越来越多的注意力,因为它们简单的特征(苔藓位于高等植物进化的 最底部)为高等植物的复杂生物学提供了信息。苔藓简单的形态学和
的模型生物。苔藓可以毫不费力地使用包括纯性培养(axenic culture)在内的体外技术,在控制的条件下培养,不仅仅在培养皿中 而且在液体培养基例如生物反应器中。单倍体的配子体可以在无菌的 培养基中进行光自养生长,并且很容易在细胞水平观察到。
莒藓的另一个主要优势是它们的转化能力尽管有很多研究,但 是在植物中的乾向整合事件很少达到l(T4,这阻碍了植物功能基因组 学的基因把向方法的一般使用。与所有其他至今被检测的植物相比, 同源DNA序列在苔藓(特别是已经建立的苔藓模型生物例如小立碗藓(Physcomitrella patens )(其分子遗传学的综述参见Reski, 1999)) 的基因组中的整合主要是以同源重组的方式出现在靼向的位置上。通 常使用PEG介导的原生质体摄取质粒DNA、粒子枪法DNA转移、电穿 孔以及显微注射(Cove等人,1997 )进行莒藓的转化,这些很容易进 行。根据转化构建体的设计主要会出现随机或者靶向的整合。
尽管使用苔藓作为科学工具用于植物生理学研究,但是至今为止 使用苔藓在苔藓细胞中制备异源重组多肽仍然是相当有限,尽管已经 具备了有效的制备方法(例如根据EP 1 206 561 A中的描述培养原丝 体苔藓组织)。
在真核宿主细胞特别是动物细胞或者高等植物细胞中转化技术的 一个主要限制总是缺少有效的启动子用于在这样的宿主细胞中进行外 源基因的高的组成型表达。基于这个目的,花椰菜花叶病毒(CaMV) 35S启动子已经被广泛地用于许多植物转化系统中(参见例如W0 01/25456 A),但是在一些植物物种中CaMV 35S启动子活性低(特别 是单子叶植物例如水稻(McElroy等人,1991,))。对于单子叶植物 的转化,已经使用了水稻肌动蛋白1 5'区域用于蛋白质的异源表达 (McElroy等人,1991,)。但是仍然存在对新型表达促进手段的不断需 要用于在遗传修饰的真核宿主细胞中表达重组(外源)多肽。
对于苔藓,特别是小立碗藓至今为止仍然没有发表同源的(在这 里同源的定义是苔藓来源的)适当的来自细胞核的表达启动子或者其 他来自细胞核的表达启动序列(Holtdorf等人,2002)。研究人员因此
已经使用了异源的(在这里异源的定义是非苔藓来源的)启动子用于 表达选择标记基因和其他目的基因。但是这些启动子中只有很少能够 在某些苔藓中可靠地起作用(例如CaMV 35S启动子;在Holtdorf等 人,2002中予以总结;CaMV 35S启动子在某些其他的物种中不起作用
(Zeidler等人,1999); TET-启动子(在Reski (1998)中予以综述)。
6因此,已经在本领域内开发了用于对苔藓进行遗传操作的其他方法,
例如基因捕获和增强子捕获系统(Hiwatashi等人,2001;但是还使用 了 (缩短的)CaMV 35S启动子;作者在瞬时表达实验中表明这个35S 启动子的缩短形式是作为一个弱启动子起作用;实际上,这篇文章涉 及了在增强子捕获菌抹中表达报告基因,但是没有显示这一表达与任 何莒藓的调控元件有任何联系)。
尽管在以上提及的在苔藓中使用同源重组的研究中,异源启动子 的使用是必要的(因此不需要同源启动子,而且它们在大多数情况下 是没有用的),但是对于用于工业使用苔藓制备重组多肽或者用于过 量表达同源多肽的适宜的苔藓来源的表达促进手段的需要仍然存在并 且尚未解决。这些表达促进手段应该使得在应用的培养条件下存在稳 定和组成型的表达,并且应该优选地使表达与CaMV35S启动子的表达 相当或者更高。
因此,本发明提供了编码苔藓表达促进区域(MEPR),即来自野生 型苔藓的表达促进区域的分离的核酸分子。本发明中提供了莒藓来源 的表达区域(即来自野生型莒藓的细胞核来源的区域),它可以使在 遗传修饰的宿主细胞中特别是在苜藓中有组成型的表达,这样就解决 了在现有技术中提出的对于这种工具的需要(Holtdorf等人,2002 ; Schaefer等人,2002)。
根据本发明,MEPR的基本特征还有MEPR的表达促进活性是在特 异宿主细胞中起作用的异源启动子(例如在小立碗藓中用于表达重组 多肽的CaMV 35S启动子)表达促进活性的至少30%,优选为至少50%, 因为不具有这种表达促进活性的莒藓启动子不能被正确地用于解决本 发明的目标,因此不被当做MERP。
因此,根据本发明MEPR从野生型莒藓,即没有通过引入非莒藓物种的启动子(例如高等植物或者(植物)病原的启动子例如CaMV35S 启动子或者TET启动子)被遗传修饰的苔藓,的细胞核中分离。还4艮 清楚,具有微小序列改变(例如在对于表达促进活性没有负面影响(破 坏)的区域中有1,2, 3,4,或者5个碱基的交换)的MEPR,也被认为是 根据本发明的MEPR,它们可能是由于例如天然植抹序列变异或者由于 在MEPR的分离过程中出现的事件而造成的。用于分析表达促进活性的 方法或者用于分析这种微小序列改变对于这一活性的影响的方法是技 术人员已知的(例如通过与已知的CaMV 35S构建体进行比较)并且在 下面的实施例部分中进行描述。
根据本发明,非孢子体(sphorophyte )特异的MEPR表达促进被 定义为组成型MEPR,优选地MEPR促进在来自配子体的细胞中的表达, 更为优选地,MEPR促进在原丝体细胞中的表达。
根据本发明,组成型表达优选地被定义为蛋白质的表达导致该蛋 白在一般用于光自养生长的苔藓的液体培养条件下(例如摇瓶培养, 生物反应器培养(EP 1 206 561 A))以及用于在下面描述的瞬时表达 系统的条件下具有可以被检出的量。因此,组成型表达应当给予根据 本发明的MERP,优选地不必在培养基中添加特殊培养添加物,还有优 选地不必在培养基中添加糖、植物激素或者这些物质混合物。组成型 表达应该以稳定的形式进行;尽管它可能是瞬时的。
在本发明的说明中使用的术语"苔藓"包括所有的苔藓类植物(苔 类(hepatics )或者地钱(liverworts )、 角苔(hornworts )和苫 藓)。苔藓的特点是它们的异型世代交替,即两个细胞核DM含量和 形态截然不同的世代的交替。二倍体的孢子体只在其年轻时具有光合 活性,它需要从占据优势的绿色的单倍体配子体上获得营养供给。配 子体以两种形态显著不同的形式存在被称为原丝体的年轻配子体以
及被称为配子托的成年配子体。与原丝体相反,成年的配子体(配子
8托)具有性器官。
在本发明的背景下,瞬时表达被定义为如下所述将基于附加体核
酸的构建体(例如MEPR和目的基因)引入苔藓的原生质体中,导致或 者允许载体的瞬间表达,表达优选地导致细胞外蛋白向培养基中的分 泌。原生质体来自苔藓细胞,优选地来自配子体细胞,更为优选地来 自原丝体细胞。
尽管根据根据本发明的MEPR可以从任何苔藓物种中取得,优选 地,MEPR从通常的模型莒藓物种中分离。因此,MEPR优选地分离自立 碗藓属(physcomitrella )、 葫芦藓属(Funaria )、 泥炭藓属 (Sphagnum)、 角齿藓属(Ceratodon)、 地钱属(Marchantia)和 Sphaerocarpos中,特另'J是小立碗薛(Physcomi trel la patens )、 萌 ,藓(Funaria hygrometrica )和地钱(Marchantia polymorpha)。
根据本发明的适宜MEPR选自序列编号l到27或者它们的表达促 进片段。"表达促进片段"是MEPR的片段,其具有的表达促进活性是 在特异宿主细胞中起作用的异源启动子(例如在小立碗藓中用于表达 重组多肽的CaMV 35S启动子)的表达促进活性的至少30%,优选为至 少50%。
根据本发明的MEPR可以包含特异的区域,例如启动子区域("启 动子"),5'未翻译区域("5'-UTRs") 、 5'内含子或者3'-UTRs。对于 一些MEPR,存在只含有5'内含子的表达促进片段。通常启动子总是独 自作为表达促进片段而有活性。因此,根据本发明的MEPR优选地包含 苔藓的启动子,优选是5'-UTR区域和/或5'内含子和/或3'-UTR。
尽管如果达到某种组成型表达通常就足够了 ,但是许多情况下最 好能够获得高的表达率,特别是对于工业制备重组多肽。已经证明根据本发明的多数MEPR与CaMV 35S启动子相比能够为一个给定的重组 多肽提供更高的表达率,特别是在同源系统中(例如立碗藓属的MEPR 用于多肽在立碗藓属中的表达)。因此,根据本发明优选的MEPR其表 达促进活性至少与花椰菜花叶病毒(CaMV)35S启动子的表达促进活性 相同,特别是,但是不止限于在MEPR分离的苔藓物种中。更为优选的 MEPR表达促进活性是花椰菜花叶病毒(CaMV) 35S启动子的表达促进活 性的至少200%、优选地至少500%、特别地至少1000%,特别地,但是 不止限于在MEPR分离的苔藓物种中。
根据本发明的分离的核酸分子优选地用于转化特异的宿主细胞, 用于制备重组转基因多肽,优选地,但是不止限于,工业规模。因此 核酸分子作为适宜的栽体提供,使转基因在宿主细胞中转化并表达。 在根据本发明的MEPR用于代替苔藓中的天然启动子(这样使同源苔藓 多肽在MEPR的控制下表达,MEPR在苔藓中的位置是它通常在野生型 植林中不在的位置)的可能性中,本发明MEPR的广泛工业应用性是异 源("外源")基因在生产性宿主细胞中,特异地是在植物细胞中, 特别是在苔藓细胞中的表达的控制。因此,根据本发明的核酸分子还 包含重组多肽产物的编码区域,所述的编码区域在MEPR的控制下。
如果根据本发明的分离的核酸分子还包含选择标记和/或其他能 够使被选择的适当转化方法进行所需的区域,则这也是有利的(参见 例如Cove等人1997; Schaefer, 2002 )。例如,如果优选乾向整合,
列同源的序列。这样使得分离的核酸分子通过同源重组靶向整合入被 转化的物种的基因组中。
而且,根据本发明的分离的酸分子可以用于筛选和确定表达促进 区域的共有序列。这种共有序列(区域,盒子,它们对于表达促进活 性是重要和/或必需的)的筛选在重组DNA技术中是一笔宝贵的财富,特别是对于使用苔藓进行工业生物技术而言。
根据另一个方面,本发明还涉及在真核宿主细胞中表达重组多肽
产物的方法,包括以下的步骤提供了重组DNA克隆载体,该载体包 含根据本发明的编码MEPR的分离核酸分子,以及选择性地包含所述重 组多肽产物的编码区域,所述的编码序列在所述的宿主中,在所述核 酸分子的MEPR的控制下;转化所述的真核宿主细胞,该细胞在天然情 况下不含有在所述的MEPR控制下的所述编码序列;在适宜的培养基中 培养转化的真核宿主细胞;表达所述的重组多肽以及分离表达的重组 多肽。
如以上所述,根据本发明的MEPR原则上具有在各种不同细胞类型 中实现组成型表达的能力,真核宿主细胞优选地选自植物细胞,优选 是苔藓细胞,特别是小立碗藓细胞。
对于本发明特别优选的系统是在苔藓原丝体培养(原丝体苔藓组 织)中培养。为了这样做,将EP 1 206 561 A中描述的方法以及其
优选的实施方案在这里明确引用作为参考,它们可以立即用于本发明。
不需要在培养基中加入各种不同的添加物,特别是没有用于特异 分化或者促进不同组织生长的添加物使用根据本发明的方法进行多肽 的组成型表达是可能的。因此,除了电解质、选择药剂以及培养基稳 定剂以外,培养基优选不含有任何额外的添加物用于供给细胞营养。 用于稳定转化植物的培养基优选地没有外加的糖类、植物激素或者其 混合物。用于瞬时转化的原生质体的培养基优选地没有外加的植物激 素。
优选的莒藓细胞为来自以下莒藓的苜藓细胞立碗藓属、葫芦藓 属、泥炭藓属、角齿藓属、地钱属以及Sphaerocarpos,特别是在原丝体培养物中。
根据另外一个方面,本发明还提供了编码MEPR的分离的核酸分子 用于工业上制备多肽,特别是用于提供产生所述多肽的重组细胞。工 业制备使得可以在生物反应器中大规模制备给定的目标多肽,达到克 的量或者更高(商业产量)。这与制备出足够用于研究用(毫克量) 或者分析用途(微克量)的制备不同,用于上面两种目的的制备当然 也可以按照本发明进行。在瞬时表达系统中足够用于这种分析目的的 蛋白质的量可以很容易地使用现有的DNA分子获得。
所以,本发明还包括了使用编码MEPR的分离的核酸分子表达莒藓 多肽(所述苔藓多肽的表达在天然情况下不受所述MEPR的控制),特 别用于提供表达所述多肽的重组苔藓细胞。这一使用可以在实际中用 于研究目的和用于工业规模的苔藓多肽制备。
根据另一个方面,本发明还提供了编码MEPR的分离的核酸分子的 用途,用于表达参与特异的翻译后修饰的蛋白(例如糖基转移酶), 特别是用于提供表达多肽的重组苔藓细胞,多肽具有的翻译后修饰通 常不存在于未转化的苫藓细胞中,或者以另外一个比例存在。
根据另外一个方面,本发明还提供了使用编码MEPR的分离的核酸 分子表达涉及代谢途径的蛋白,特别是用于提供重组苔藓细胞,这些 细胞的代谢物例如次级代谢物的含量改变了 。
根据另外一个方面,本发明还提供了使用编码MEPR的分离的核酸 分子表达反义分子、siRM分子或者核酶,特别是用于提供重组苔藓 细胞,这些细胞中特异的蛋白质含量减少,导致出现了改变的表型, 例如形态上的或者生化上的。
12根据另外一个优选的方面,本发明还涉及根据本发明的编码MEPR 的分离的核酸分子用于翻译后修饰蛋白的重组表达,特别是用于制备 翻译后修饰的蛋白质。有了这样一项技术,就有可能制备翻译后被特 异修饰的蛋白质(与在天然宿主细胞中不同),这样使例如植物细胞 或者苕藓培养物以例如哺乳动物或者甚至人类的糖基化型式产生蛋白
质。应用于特异的糖基转移酶的这种技术的示例在例如WO 00/49153 A 和W001/64901 A中有所描述。
根据本发明的编码MEPR的分离的核酸分子的另外一项优选的用 途涉及重组蛋白的体外表达。体外翻译技术使重组产物在更加控制的 条件下产生,而不需要承担与宿主细胞相联系的不确定性。
根据本发明的核酸分子的另外一项优选的使用是它们用于代谢修 饰蛋白质(例如修饰(翻译后)翻译的氨基酸链修饰的蛋白质)的重 组表达(参见例如Berlin等人,1994 )。
本发明还通过以下的实施例和附图进行阐述,但是不限于这些实 施例和附图。
附图
图l小立碗藓中的p-微管蛋白基因,
图2小立碗藓中p-微管蛋白的表达促进区域分析,
图3通过瞬时转化rhVEGF构建体分析Pptubl的表达促进区域,
图4通过瞬时转化rhVEGF构建体分析Pptub2的表达促进区域,
图5通过瞬时转化rhVEGF构建体分析Pptub3的表达促进区域,
图6通过瞬时转化rhVEGF构建体分析Pptub4的表达促进区域,
图7小立碗藓肌动蛋白基因的基因组结构
图8不同的5'肌动蛋白区域表达活性的比较
图9 Ppact 1构建体

图10 Ppact 5构建体
图11 Ppact 7构建体
图12 Ppact 3:: vegf构建体
图13 Ppactl启动子5,内含子替代
图14 Ppactl启动子vegf缺失突变体
图15 Ppact3启动子vegf缺失突变体
图16 Ppact5启动子vegf缺失突变体
图17 Ppact7启动子vegf缺失突变体
图18不同苔藓种中的肌动蛋白基因,以及
图19来自小立碗藓和葫芦藓的同源肌动蛋白基因启动子序列的
比较
材料和方法 植物材料
以前已经对小立碗藓(Hedw. ) B. S. G.进行了性质研究(Reski 等人1994)。它是植林16/14的再培养物,植抹16/14由H. L. K. Whi tehouse在英国Gransden Wood, Hunt ingdonshire收集,由Engel 进行增殖(1968; Am J Bot 55, 438-446)。
标准培养条件
植物在无菌条件下进行纯培养,使用普通的改进Knop无机液体培 养基(1000mg/L Ca(N03)2x 4H20 250mg/L KCl, 250mg/L KH2P04, 250rag/L MgS04 x 7H20和12. 5mg/L FeS04 X 7H20 ; pH 5. 8 (Reski和Abel (1985) Planta 165, 354-358)。植物在含有200毫升培养基的500毫升 Erlenmeyer摇瓶中培养,或者在含有固化Knop培养基(10g/L琼脂) 的9厘米平皿中培养。摇瓶在Certomat R摇床(B. Braun Biotech International,德国)上振荡,转速为120rpm。生长温室的条件是 25+/-3°C,光-暗周期是16:8小时。通过提供35 |a mol/m_2s—1光强的 荧光管(Osram L 58 W/25)从上方照射培养物。每周进行一次液体培养物的传代培养(subculturing),使用Ultra-Turrax匀浆器(IKA, Staufen,德国)分界后接种与两个新的含有100毫升新鲜Knop培养 基的500毫升Erlenmeyer摇瓶中。此外,在去整合后3或4天过滤 培养物,然后转移至新鲜的Knop培养基中。
生物反应器培养物分别生长在Knop培养基或者1/10Knop培养基 中,在搅拌的玻璃生物反应器(Aplikon, Schiedam,荷兰)中培养, 工作体积是5升(如Hohe and Reski, Plant Sci. 2002,163, 69-74 中所描述)。使用船推进式搅拌器(marine impeller)进行搅拌,搅 拌速度是500rpm。培养物通入0. 3vvm [(通气体积)/ (培养基体积)/ 分钟]的空气。容器25'C的培养物温度通过双水套冷却系统进行控制。 50 jamol/nTY1的光强由荧光管(Osram L 8W/25)提供,光/暗节律是 16/8小时。培养物内的pH值(pH 6.5-7.0)不进行调节。
原生质体分离
用于小立碗藓的分离原生质体的不同的实验方案已有描述 (Grimsley等人1977; Schaefer等人1991; Rother等人1994; Zeidler等人1999; Hohe and Reski 2002 ; Schaefer 2001)。对 于这里提出的工作,使用以前描述的方法的修改/组合
苔藓组织在Ca(N03)2含量降低(10°/ )的Knop培养基中培养7 天。在去整合后3或4天过滤培养物,然后转移至新鲜的Ca(N03)2含 量降低(10%)的Knop培养基中。过滤后在0. 5M甘露醇中对莒藓的原 丝体进行预孵育。30分钟后向悬液中加入4°/。的崩溃酶(Sigma, Deisenhofen,德国)。崩溃酶溶解于0. 5M甘露醇(pH 5.6-5.8)中, 3600rpm离心10分钟,通过0.22微米滤器(MillexGP, Millipore Corporation,美国)过滤除菌。含有1%崩溃酶(终浓度)的悬液在黑 暗中室温孵育并且轻微摇动(2小时孵育后得到最好的原生质体产 量)。悬液通过100孩吏米和50;微米孔径的筛子(Wilson, CLF, Germany)。
15悬液在无菌的离心管中离心,室温55g(加速3;减速3; Multifuge 3 S-R, Kendro,德国)10分钟沉淀原生质体。将原生质体轻轻地重悬 于W5培养基(125 mM CaCl2x 2 H20; 137 mM NaCl; 5.5mM葡萄糖;10 mM KCU pH 5. 6 ; 660-680 m0sm渗透压;无菌过滤;Menczel等人 1981)中。悬液再次在室温55g (加速3;减速3; Multifuge 3 S-R, Kendro,德国)10分钟沉淀原生质体。再次将原生质体轻轻地重悬于 W5培养基中。将少量的悬液转移到Fuchs Rosenthal小室中对原生 质体进行计数。
瞬时转化
已经对小立碗藓的不同转化方法进行了描述(Schaefer等人1991; Reutter and Reski 1996, Schaefer 2001)。对于这里提出的工作, 使用以前描述的方法的修改/组合
将原生质体在冰上在暗处孵育30分钟用于转化。接下来,在室温 55g (加速3;减速3; Multifuge 3 S-R, Kendro) 10分钟沉淀原生 质体。将原生质体重悬于3M培养基(15 mMCaCl2x2H20 ; 0. 1°/。MES; 0. 48 M甘露醇;pH5.6 ; 540 mOsm渗透压;过滤除菌,Schaefer等人 (1991) Mol Gen Genet 226,418-424)中,浓度为1.2 x106个原生 质体每毫升。将250微升该原生质体悬液置于一个新的无菌离心管中, 加入50微升DNA溶液(层析柱(Qiagen, Hilden,德国)纯化的DNA, 溶于水);加入10-100;微升的含有60孩吏克DM (最佳量)的溶液, 最终加入250微升PEG溶液(40% PEG 4000; 0. 4 M甘露醇;0. 1 M Ca(N03) 2 ;高压灭菌后pH 6)。悬液立即轻轻混和,然后在室温下 孵育6分钟,不断轻轻混和。加入1,2, 3和4毫升的3M培养基对 悬液进行连续稀释。悬液在20摄氏度55g(加速3;减速3;Multifuge 3 S-R, Kendro)离心10分钟。沉淀重悬于400微升3M培养基中。 在48孑L培养板(Cel 1 s tar, greiner bio-one, Frickenhausen)中培 养转化的原生质体。瞬时转化在25摄氏度弱光(4. 6 pmolm_2s—')下 孵育。在24小时和48小时后分别取样,用新鲜培养基替换培养基的一半(200微升)。培养基不完全被替代,因为原生质体必须在液 体中保存。取出的培养基(含有重組蛋白)在-20摄氏度储存。用ELISA 测量48小时的样品。
稳定转化
已经对小立碗藓的不同转化方法进行了描述(Schaefer等人1991; Reutter and Reski 1996, Protocol Schaefer 2001)。对于这里提 出的工作,使用以前描述的方法的修改/组合
将原生质体在冰上在暗处孵育30分钟用于转化。接下来,在室温 55g (加速3;减速3; Multifuge 3 S-R, Kendro ) 10分钟沉淀原生 质体。将原生质体重悬于3M培养基(15 mMCaCl2 x 2H20 ; 0. 1%MES; 0. 48 M甘露醇;pH 5.6 ; 540m0sm渗透压;过滤除菌,Schaefer等人 (1991) Mol Gen Genet 226, 418-424)中,浓度为1.2 x106个原生 质体每毫升。将250微升该原生质体悬液置于一个新的无菌离心管中, 加入50孩i升DNA溶液(层析柱(Qiagen, Hilden,德国)纯化的DNA, 溶于水);加入10-100微升的含有60微克DNA (最佳量)的溶液, 最终加入250 ;欽升PEG溶液(40% PEG 4000; 0.4 M甘露醇;0.1 M Ca(N03)2 ;高压灭菌后pH 6)。悬液立即轻轻混和,然后在室温下孵 育6分钟,不断轻轻混和。加入1, 2, 3和4毫升的3M培养基对悬液 进行连续稀释。悬液在20摄氏度55g (加速3;减速3; Multifuge3 S-R, Kendro)离心10分钟。沉淀重悬于3毫升再生(regenerat ion ) 培养基中。根据Strepp等人(1998)的描述进行选择步骤。
ELISA
瞬时转化的莒藓原生质体表达的重组VEGF121用ELISA(R & D Systems, Wiesbaden,德国)进行定量。ELISA根据生产商的说明进行。 稀释样品用于定量。
17细菌菌林和克隆载体
对于所有的克隆和增殖实验使用大肠杆菌菌林ToplO (Invitrogen, Karlsruhe,德国)。使用pCR2. 1-T0P0 (Invitrogen, Karlsruhe,德国),pCR4-T0P0 (Invitrogen, Karlsruhe,德国), pZErO-2 (Invitrogen, Karlsruhe,德国)或者pRT101 (T6pfet等人 (1987), NAR, 15, p5890)作为载体克隆DNA片段。
基因组DNA:制备、消化、连接
使用CTAB实验方案(Schlink and Reski, 2002)从13天龄的原 丝体提取小立碗藓基因组DNA。
用30单位的不同限制性内切酶(例如BamHI, EcoRI, HindIII, Kpnl, NcoI,NdeI,PaeI, Pagl, Xbal ;所有内切酶来自MBI Fermentas: St. Leon-Rot,德国)切割基因组DNA ( 3-5微克),总体积为30微 升,37摄氏度下消化2小时,每一次消化使用一种内切酶。根据供应 商的使用手册,用PCR Purification Columns (Qiagen, Hilden, Germany)纯化消化后的DNA( 30微升消化产物+ 200微升PB緩沖液)。 使用50微升洗脱緩沖液(EB ; Qiagen, Hilden,德国)进行洗脱。在 进一步处理以前,用琼脂糖凝胶(0, 5%)分析IO微升的洗脱物。
剩余的DNA使用5单位的T4连接酶(MBI Fermentas, St. Leon-Rot,德国)连接,总体积为300微升,室温连接2小时后再在4 摄氏度连接两天。在加酶之前,将连接混合物置于50摄氏度5分钟然 后置于冰上,目的是融化勦性的末端碱基配对。加入0. 3M乙酸钠(pH 4.8)用乙醇沉淀并且使用70%的乙醇洗涤沉淀两次以后,重新连接的 DNA用200微升的EB重悬。从该重新连接的基因组DM中取l-3微升 用于I-PCR。
醒制备在液氮中研磨植物组织,使用E. Z. N. A. Plant RNA Kit (PeqLab) 或者RNeasy Plant Mini Kit (Qiagen, Hilden,德国),根据供应商 的操作手册提取小立碗藓的总RNA。总RNA用凝胶进行分析,定量 (OD260),分别于-20摄氏度或者-80摄氏度保存。
DNA酶处理和笫一链cDNA的合成
根据供应商的使用指南用DNA酶(GIBCO BRL)消化1微克的总 RNA,总体积为11微升。根据供应商的使用指南使用01igodT(12-18) 引物和SUPERSCRIPT II RNase H逆转录酶(GIBCOBRL),用4. 5孩吏 升该DNA酶处理后的总RNA ( ~ 400纳克)制备第 一链cDM。得到的cDNA 用无菌ddH20稀释IO倍,保存于-20摄氏度。
普通PCR
如果未特殊说明,使用Advantage cDNA Polymerase Mix (BD Biosciences Clontech, Heidelberg,德国)进行PCR。对于所有其他 的PCR方法,使用下面的DNA聚合酶Taq重组聚合酶(MBI FermenUs St. Leon-Rot, 德国),Pfu天然聚合酶 (MBI Fermentas, St. Leon-Rot, Germany), Platinum Pfx DM 聚合酶 (Invitrogen, Karlsruhe, 德国)或者 TripleMaster PCR 系统 (Eppendorf, Hamburg,德国)。注册的温度循环仪是Mastercycler梯度PCR 4义 (Eppendorf, Hamburg, 德国)。所有的引物由MWG Biotech AG, Ebersberg,德国合成。根据供应商的使用指南,使用GFX PCR DNA 和Gel Band Purification Kit (Amersham Bioscience, Freiburg, 德 国)进行PCR产物的纯化或者凝胶洗脱。
重组质粒的构建和克隆
基本上按照Sambrook等人(1989), Molecular Cloning: A Laboratory Manual, 第二版.Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press的描述进行通常的分子生物学实验方案。反向PCR(I-PCR)和巢式PCR
使用0. 25微升Advantage cDNA Polymerase Mix和緩沖液(包括 3,5 mM乙酸镁,均来自BD Biosciences Clontech, Heidelberg,德 国)、0. 2mM每种引物、0. 2mM dNTP和1-3微升基因组重新连接产物(参 见上面),总体积25微升进行I-PCR。循环条件是起始步骤96摄 氏度2分钟,第二步是96摄氏度20秒,67摄氏度10秒(之后每一 个循环降低0. 15摄氏度),68摄氏度10分钟,重复35-40次,最后 一步是68摄氏度20分钟,然后在程序结束时冷却至4摄氏度。PCR 产物从琼脂糖凝胶上洗脱。用30微升进行洗脱。洗脱的PCR产物或者 直接克隆到TOPO TA载体(pCR4-TOPO, Invitrogen, Karlsruhe,德 国)中或者作为巢式PCR中重新确证的模板。在巢式PCR中,将凝胶 洗脱的巢式PCR产物克隆到T0P0 TA载体(pCR4-TOPO, Invitrogen, Karlsruhe,德国)中。巢式PCR的循环条件是起始步骤96摄氏度 l分钟,接下来第二步是94摄氏度20秒,56摄氏度10秒,68摄氏 度4分钟,重复25次,最后一步是68摄氏度10分钟。
pRT101new的产生,用于克隆扩增的启动子片段 使用Pfu天然聚合酶(MBI Fermentas, St.Leon-Rot,德国)重新 扩增pRT101p21 (Gorr 1999),使用引物320和321 (对于这些引物 和所有接下来的引物参见表1 )。引物320 (正向)从VEGF信号肽的 第二个密码子开始(5'- (atg) aac...)。引物321 (反向)从35S启 动子之前的多克隆位点以内的HincII位点中央开始(5' -gac...)。使 用引物321,又引入了一个Xhol位点。PCR产物的重新连接导致35S 启动子的丧失和HincII位点的恢复。通过测序确证VEGF基因的序列。 这个新的载体被称为pRT101new,用于分别通过XhoI或者HincII位 点将表达促进区域克隆到报告基因之前。
测序所有的观'J序反应由SEQLAB Sequence Laboratories, Goettingen, 德国进行。 软件
使用Sci Ed Central, Clone Manager Suite用于引物设计、二 重以及多重序列比对。使用Lasergene, DNASTAR (第五版)Megalign 和SeqMan分析测序数据。使用BLAST 2 (Altschul等人,1997)进 行同源性搜索。
实施例
通过4个苔藓表达促进区域的实施例阐述本发明第一个,小立 碗藓各种不同的微管蛋白家族成员表达促进区域的分离和分析。在第
二个实施例中提供了来自多个不同苔藓的肌动蛋白基因家族的表达促 进区域。第三和第四个实施例涉及泛素的表达促进区域以及RBCS表达
促进区域。
实施例1:小立碗藓P微管蛋白基因及其表达促进区域的克隆和
分析
概述
为了从小立碗藓(Pp)中得到P微管蛋白(tub)的调控/启动子序 列,第一步通过聚合酶链式反应(PCR)分离出p微管蛋白同源物的编码 序列。为此使用了所有9个发表的拟南芥的p微管蛋白基因组序列 (Attub l-9)的比对设计高度保守编码区内的引物(8F, 9F和10R;对 于这些引物和接下来的所有引物参见表1)。此外,还使用了小立碗藓 公共EST数据的序列信息,但是只有三个显示了与P微管蛋白的同源 性。使用其中一个设计了预测的编码区上游的基因特异的引物(F7)。 对使用提及的引物得到的所有克隆的PCR产物以及EST数据进行序列 对比得到3组克隆,这3组克隆的DNA序列在组内是相同的,但是在 組间不同,主要(但是不仅仅)是由于内含子的差异。这些P微管蛋白直向同源物(orthologues )净皮分别命名为Pptub 1, Pptub 2和 Pptub 3。
而且,由于在项目进行当中有更多的EST数据(在2002年初在 NCBI/dbEST中有50000以上的新条目),所以对所有121个小立碗 藓中与P微管蛋白有高度相似性的EST进行了详细的分析,得到了三 个新的上游和三个下游EST组,各组序列在组内是相同的但是组间不 同且不同于任何其他组,与Pptub l-3也不同。对每个新的组使用来
自预测的非编码上游和下游区域的引物进行PCR (参见下面)并且改 变所有引物组合的次序,确定了相应的上游和下游组与特定的基因座
(分别命名为Pptub 4, Pptub 5和Pptub 6)之间的联系。克隆所 有三个新的基因座的基因组和cDNA扩增产物并且测序,这将小立碗藓 中P^t管蛋白直向同源物的数目增加到6个。
与Pptub 5和6相反,Pptub 1到4在EST数据库中出现得更为 频繁。主要使用原丝体和年轻得配子托的RM制备了相应的cDNA文库。 因此,对于这四个基因,根据获得的序列数据,进行反向PCR(I-PCR) 方法以获得在基因组上这些序列周围的区域。
Pptub 1
如第一步中已经提到的,使用小立碗藓基因组DM和引物8F和 10R进行两次独立的PCR,克隆Taq (MBI Fermentas, St. Leon-Rot, Germany) PCR片段。对两个PCR中分别得到的 一个(2-1)和两个 (8-l,8-2)克隆进行部分测序,发现它们的序列是相同的。将相应的基 因座命名为Pptub 1。
使用这 一 初步的序列信息设计引物以进行基因组步移,对重新连 接的EcoRI和Hindlll基因组消化产物使用I-PCR方法(引物35, 36 ) 得到Pptubl的包围区域。通过巢式PCR (引物40, 38 )对产物进行重
22新确证。巢式PCR产物PCR产生的两个克隆(E#l和H 1. 7)进行完全测 序。
Hind III克隆H 1. 7不含有内部的HindIII位点,很有可能是 由于酶的星活性或者是随机双链断裂的连接。但是通过两次独立的基 因组DNA PCR (引物113, 67和113, 90)对第一个EcoRI位点上游的 序列进行了确证。此外,克隆了另外一个cDNAPCR产物(引物89,91 ; Pfu天然聚合酶(MBI Fermentas, St. Leon-Rot,德国))。
所有提及的克隆帮助产生和重新确证了序列数据。总共得到了起 始密码子上游~ 1500bp和终止密码子下游 1500bp的序列。
Pptub 2
如以上已经提到的,使用小立碗藓发表的EST序列信息设计预测 编码区域上游基因特异的引物(F7)。对小立碗藓基因组DNA的PCR(引 物F7,10R)以及接下来PCR产物的克隆和测序证明了,该PCR产物以 及所有三个迄今发表的Pptub EST (Pptub EST 1-3)都属于一个基因 座,命名为Pptub2。可以通过比较EST与基因组序列证实内含子的位 置。
使用这一初步的序列信息设计内含子内的基因特异引物(引物95 和71)以进行Pptub2相邻基因组区域的基因组步移,对重新连接的 Pag I, BamH I和Nde I基因组消化产物使用I-PCR方法。通过巢式 PCR (引物38, 35)对PCR产物进行重新确证。巢式PCR产物产生的两 个克隆(C"Pag和M2Nde)进行完全测序。Nde I克隆D#2不含有内 部的Ndel位点,很有可能是由于酶的星活性或者是随机双链断裂的连 接。但是使用C并2Pag和第三个I-PCR克隆(95f8BamHI ;引物149和 71)确证了序列数据。此外通过两次独立的基因组DNA PCR (引物 205, 149; Taq (MBI Fermentas, St. Leon—Rot,德、国)和引物205, 206 )确证了产物的长度。克隆了 205-206 PCR产物和另外的基因组下游PCR 产物(引物71, 206 ; Pfu天然聚合酶(MBI Fermentas, St. Leon-Rot, 德国))并且帮助证实了序列数据。
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到 了起始密码子上游~ 1400bp和终止密码子下游 1400bp的序列。
Pptub 3
如第一步中已经提到的,使用小立碗藓基因组DNA和cDM以及引 物9F和10R进行两次独立的PCR,克隆Taq (MBI Fermentas, St. Leon-Rot, Germany) PCR片段。从两个PCR中分别得到的克隆(#3-3基 因组得到的克隆,#4-3 cDNA得到的克隆)进行部分测序,发现它们的 序列是相同的。将相应的基因座命名为Pptub 3。
使用这一初步的序列信息设计内含子内的基因特异引物(引物69 和70)以进行Pptub 3相邻区域的基因组步移,对重新连接的Pag I 和Nco I基因组消化产物使用I-PCR方法。通过巢式PCR(引物38, 35 ) 对PCR产物进行重新确证。产生的两个克隆(AHNco和井4-lPag)进行 完全测序。A#lNco是巢式PCR产物(38,35)产生的克隆而并4-lPagl 是开始I-PCR产物(69,70)产生的克隆。此外克隆了基因组PCR产物(引 物203, 204 )帮助证实序列数据。
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到 了起始密码子上游 1900bp和终止密码子下游 llOObp的序列。
Pptub 4
已经提到,对于Pptub 4使用EST数据设计基因特异的上游和下 游引物(297, 299)得到基因组和cDNA克隆。使用天然Pfu聚合酶 (MBI Fermentas, St. Leon-Rot,德国)得到的其他基因组克隆帮助证实序列数据。
将引物297和299反向(337, 383)用于进行Pptub 4相邻基因组 区域的基因组步移,对重新连接的Nde I和Nco I基因组消化产物^f吏 用I-PCR方法。产生了两个克隆(48井2Nco和A02#3Nde)以及另外的 基因组克隆(引物547和374 ; Advantage cDNA Polymerase Mix (BD Biosciences Clontech, Heidelberg, 德国)和 Triple Master (Eppendorf, Hamburg, 德国))。
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到 了起始密码子上游 2300bp和终止密码子下游 llOObp的序列。
Pptub 5和6
已经提到,对于Pptub 5和6使用EST数据设计基因特异的上游 和下游引物(Pptub 5: 298, 300和Pptub 6: 296, 336)得到每一个 基因的基因组和cDNA克隆。对于Pptub 5使用天然Pfu聚合酶(MBI Fermentas, St. Leon-Rot,德国)得到的其他基因组克隆帮助证实 序列数据。
所有提及的克隆帮助并且产生和重新确证了序列数据。总共得到 了 Pptub 5的2031bp基因组序列和Pptub 6的3161bp基因組序列。
克隆策略
使用Taq重組聚合酶产生了最初的Pptub 1 (2-l,8-l,8-l ;所 有都是基因组的)和Pptub 3 (3-3基因组的,4-3 cDNA的)克隆。将 PCR产物连接到TOPO TA载体(pCR4-T0P0, Invitrogen, Karlsruhe, 德国)中。PCR的条件是2. 5单位的Taq重组聚合酶,酶緩冲液,3. 3mM MgCl2(所有均来自MBI Fermentas, St.Leon-Rot,德国),0.4raM每一 种引物,100纳克cDM或者基因组DM作为模板,总体积是25微升。循环条件是起始步骤95摄氏度5分钟,然后是第二步95摄氏度45 秒,60摄氏度(引物8F)或者65摄氏度(引物9F) 10秒,72摄氏 度1分钟,重复30-35次,最后一步是72摄氏度5分钟,然后在程序 结束时冷却至4摄氏度。
所有其他的基因组和cDNA克隆是 Pptub 1: 113-67, 113-90, 89-90, 89-91cDNA Pptub 2: F7/R10, 205-206, 71-206 Pptub 3: 203-204
Pptub 4: 547-374 (+ TrippleMaster) , 297-299 cDNA +基因组 (+ Pfu)
Pptub 5: 298-300 cDNA +基因组(+ Pfu) Pptub 6: 296-336 cDNA +基因组
以上力口下划线的克隆使用Advantage cDNA Polymerase Mix产生, 每20微升PCR体系使用0. 25微升酶混合物,緩冲液(包括3,5mM乙 酸镁,都来自BD Biosciences Clontech, Heidelberg,德国),0. 25mM 每一种引物,0.25mM dNTP和10-20纳克的模板。循环条件是起始 步骤96摄氏度2分钟,然后是第二步96摄氏度20秒,60摄氏度10 秒和68摄氏度2分钟每kb,重复35-40次,最后一步是68摄氏度15 分钟,然后在程序结束时冷却至4摄氏度。具有合适长度的PCR产物 从琼脂糖凝胶上洗脱。根据扩增产物的量,用30-50微升进行洗脱。 洗脱的PCR产物克隆到TOPO TA载体(pCR4-TOPO, Invitrogen, Karlsruhe,德国)中。
所有其他的克隆,同两个其他的基因组克隆297-299和298-300 一样,使用Pfu天然聚合酶聚合酶,每20微升PCR体系使用0. 3微 升聚合酶(-O. 75单位),緩冲液,2-4 mM硫酸镁(所有均来自MBI Fermentas, St. Leon-Rot,德国),0. 25mM每一种引物,0. 2mM譜P 和10-20纳克的模板。循环条件是起始步骤96摄氏度2分钟,然后
26是第二步96摄氏度20秒,60摄氏度10秒和72摄氏度2分钟每kb, 重复35-40次,最后一步是72摄氏度IO分钟,然后在程序结束时冷 却至4摄氏度。具有合适长度的PCR产物从琼脂糖凝胶上洗脱。根据 扩增产物的量,用30-50微升进行洗脱。洗脱的PCR产物克隆到经 EcoRV线性化的pZEr0-2 (Invitrogen, Karlsruhe,德国)中。
使用TripleMaster PCR系统产生了另外一个克隆547-374,每 20微升PCR体系使用0. 25微升聚合酶混合物(=1.25单位),调整緩 冲液(包括2. 5mM Mg2+,均来自Eppendorf, Hamburg,德国),0. 2mM 每一种引物,0.2mMdNTP和10-20纳克的才莫板。循环条件是起始步 骤96摄氏度2分钟,然后是第二步96摄氏度20秒,60摄氏度20秒 和72摄氏度3分钟,重复40次,最后一步是72摄氏度IO分钟,然 后在程序结束时冷却至4摄氏度。具有合适长度的PCR产物从琼脂糖 凝胶上洗脱。根据扩增产物的量,用30-50微升进行洗脱。洗脱的PCR 产物克隆到TOPO TA载体(pCR4-T0P0, Invitrogen, Karlsruhe,德 国)中。
总之,对小立碗藓基因组DNA的PCR和PCR产物的克隆产生了 6 个转录的小立碗藓P微管蛋白基因的序列信息。此外,使用了EST和 cDNA数据确证了基因组序列数据和内含子/外显子的边界。对于Pptub l到4,反向PCR得到了未转录的5'和3'包围的基因组序列。所有6 个基因组区域的一般概括在图1中给出。
基因结构和保守
已经强调了, Pptub 1到4在EST数据库中出现得最多。此外, 它们对应的EST中多数来自全长的cDNA文库。这两个事实帮助计算机 (in silico)确定Pptub 1到4的转录起始位点(TSS) 。 5'EST与 相应的上游基因组区域的多重比对显示Pptub 1到3的确具有精确 的转录起始27个Pptub 1 5'EST中的20个,20个Pptub 2 5'EST中的16个以及14个Pptub 3 5'EST中的9个都在相同的最上游位置 开始,标记为+1 (图3-6)。此外所有三个TSS均被共有序列包围(参 见下面)。对于Pptub 4而言,23个EST表明在100bp以内有多 个TSS。最上游的5' EST的起始位点被确定为+1。
3'EST与相应的下游基因组区域的类似多重比对重新确证了植物 基因几乎总是携带一个以上poly(A)位点,且该共有序列不象在例如 哺乳动物基因中那样非常明确,在哺乳动物中序列AAUAAA几乎是遍布 的(综述参见Rothnie等人,1996 )。
六个克隆的小立碗藓基因座没有显示任何无义终止密码子而且可 以预测与已知P微管蛋白具有高度相似性的适当蛋白。 一般在编码区 域以外相似性立即并且显著下降。考虑到5'的可能调控元件,对所有 4个上游区域进行详细比较后发现在基因家族内部或者没有整体的保 守性,或者与其他已知的植物P微管蛋白基因的5'区域也没有保守 性。但是可以在基因家族内部检测到一些有趣的保守性匹配。
a) Pptub 1到3中确定的TSS在所有三种情况下都属于共有序列 T/C C G/C T G T G C,且它们被包含在富含C/T的区域内(与 plantProm 数据库,网址为 ht tp://mendel. cs. rhul. ac. uk/mende1. php topic-plantprom中171个无关的TATA植物启动子 的共有序列T/C C A(+l) N M N比较)
b) Pptub 1到3中可以发现在TSS上游22-24bp--这处于植物 TATA启动子的典型距离内(参见plantProm数据库)--有一个弱的 8bpTATA盒子,位于一个保守的20-25bp—段序列内部。来自171个 无关的植物启动子的TATA盒子共有序列是T96 A95 T96 A, A62 /T38 A97 T" /A38 A73 (参见plantProm数据库),对于Pptub 1到3,共有序 列是T t T A T c T c/t/A,大写字母表示与共有序列有关。
c) 所有四个基因在它们的5' UTR中确实有非常低水平(9-16%)的腺噤呤。
d) Pptub 4的5' UTR C/T总含量达到74%,此外在最短、最靠下 游的5'EST的起始点之后还含有一个C/T一段序列(约50bp)。
e) Pptub 2在TSS上游450bp附近(-450到-489)含有一个40bp 的polyA—段序列
f) Pptubl和4上游大约-420位置处开始了非常富含A/T的区域 (Pptub 1在大约900bp中有80%以上的A/T; Pptub4 1750bp中有
75%的A/T,使得该基因上游可能存在骨架/核基质附着区(S/MARs; (Liebich等人,2002)。
P微管蛋白启动子的功能性鉴定和定量
在瞬时表达系统中使用非再生的小立碗藓原丝体作为表达系统对 Pptub 1到4的可能5'调控序列进行功能定量,确定提供最大启动子 活性的最小启动子片段。对于每一个启动子将几个包括了上游区域和 5' UTR的不同长度的构建体准确地置于报告基因的起始密码子之前。 作为报告基因,人蛋白质(重组人血管内皮生长因子121: rhVEGF121 ; Gorr 1999 )通过其自己的信号肽被分泌到培养基中。rhVEGF121在苔 藓培养物上清中的量使用ELISA进行定量,它反应了系统中启动子或 者启动子片段的强度。数值与使用35S启动子得到的数值相联系。每 一个构建体在两到三次不同的转化实验中转化最少6次。分别在24 小时和48小时后取样,48小时的样品进行适当稀释用ELISA测定两 次。结果的总结在图2中给出。
Pptub 1到4的表达促进区域被公开为序列编号1到8。
将Pptub 1到4的扩增启动子片段克隆到pRT101 new中 Pptub 1: 1-0 (引物364Xho1, 363cat)
l一l (引物219Xho1, 363cat)
l一3 (引物549Xho1, 363cat)1-4 (引物226XhoI, 363cat) 1-5 (引物550XhoI, 363cat) Pptub 2: 2-0 (引物291, 225cat) Pptub 3: 3-0 (引物292, 223cat) Pptub 4: 4-0 (引物373Xho1, 374cat) 4-1 (引物548Xho1, 374cat)
以上给出的启动子片段使用Pfu天然聚合酶(MBI Fermentas, St. Leon-Rot,德国)用基因组DNA扩增,使用从ATG起始密码子反向互 补序列开始的反向引物(cat...)以及部分的含有Xhol位点的正向引 物。PCR产物使用Xhol切割并连接入XhoI/HincII中或者不进行切割 连接入用HincII打开的pRT101new中。产生的克隆通过测序进行证实。 克隆l-2 (XhoI/EcoRI), 2-l(BglII), 2-2 (Sail), 2-3 (EcoRI/Sal I), 2-4 (EcoRI/Sa11), 3-2 (Sail), 3-3 (Ecol47I/Hinc11) , 3-4 (XhoI/SalI)通过从长克隆内部进行删除而得到。剩余的载体通过凝胶 洗脱并且重新连接。如果单链凸出末端不相匹配的话,在根据供应商 的使用手册使用Klenow片段(MBI Fermentas, St. Leon-Rot,德国) 填平3'凹进端之后进行连接。
Pptub 1
将六个长度不同的启动子克隆到转化载体pRT101p21中的报告 基因之前。所有构建体的数据在图3中给出。(5'UTR = +1 (TSS)到 +226, +227= ATG)
1-0 -1307 bp (Pptub 1 5'区域1533 bp )
l一l -985 bp (Pptub 1 5'区域1211 bp )
l一2 —416 bp (Pptub 1 区域642 bp )
l一3 —248 bp (Pptub 1 区域474 bp )
1-4 -83 bp (Pptub 1 区域309 bp )
1-5 -71 bp (Pptub 1 5'区域297 bp )启动子片段1-2可以确定为提供高表达率的最短启动子片段。与 35S启动子产生的表达率(将其设定为100%)相比,表达率是其大约 150%。注意最小启动子片段1-2的上游开始了长的非常富含A/T的区 域(在近900bp中有80%以上的A/T )。
Pptub 2
将五个长度不同的启动子克隆到转化载体pRT101p21中的报告 基因之前。所有构建体的数据在图4中给出。(5'UTR - +1 (TSS)到 +122, +123= ATG)
2-0 —1075 bp (Pptub 2 区域1197 bp )
2-1 —676 bp (Pptub 2 区域798 bp )
2-2 -425 bp (Pptub 2 区域547 bp )
2-3 -245 bp (Pptub 2 区域367 bp )
2- 4 -67 bp (Pptub 2 区域189 bp )
启动子片段2-2可以确定为提供高表达率的最短启动子片段。与 3SS启动子产生的表达率(100%)相当。
Pptub 3
将长度不同的启动子克隆到转化载体pRT101p21中的报告基因 之前。四个构建体的数据在图5中给出。(5,UTR-+1 (TSS)到+112, +113= ATG)
3- 0 -1274 bp (Pptub 3 5'区域1 386 bp ) 3-2 -765 bp (Pptub 3 区域879 bp ) 3-3 -272 bp (Pptub 3 区域384 bp ) 3-4 + 52 bp (Pptub 3 区域60 bp )
启动子片段3-2可以确定为提供高表达率的最短启动子片段。与 3SS启动子产生的表达率(将其设定为100%)相比,表达率是其大约 300%。Pptub 4
将两个长度不同的启动子克隆到转化载体pRT101p21中的报告 基因之前。数据在图6中给出。(5'UTR-TSSs (+1到+103)到+205, +206= ATG)
4-0 -419 bp (Pptub 4 5'区域624 bp ) 4一1 -1 bp (Pptub 4 区域206 bp )
启动子片段4-1提供的表达率是使用与35S启动子得到的表达率 (将其设定为100%)的大约250%。注意该最小启动子片段(4-0)的 上游开始了长的非常富含A/T的区域(在1750bp中有75°/。的A/T)。
总之,对Pptub 1到4的基因组上游区域的瞬时启动子活性进行 了研究。确定了显示最大启动子活性的最小启动子片段,它们的表达 率最高可达35S启动子产生的活性的3倍。
Pptub构建体总结(还请参见序列表) Pptubl上游
- 1533至-1(+1 =起始密码子) -1533至-644 =81% AT
- 1533 VEGF l-O (引物364)
- 1211 VEGF l-l (引物219) -642 VEGF 1-2 (EcoRI/XhoI) -474 VEGF 1-3 (引物549) 一 309 VEGF 1-4 (引物226)
- 297 VEGF 1-5 (引物550;无推定的TATA盒子-304至-295)
- 226 TSS (5'UTR开始)
Pptubl下游
1至1539 (1 =终止密码子之后) 332最长的EST结束(3'UTR)
321539引物90的开始 Pptub2上游
-1197至-l(+l =起始密码子) -1197 VEGF 2—0 (引物291) -798 VEGF 2-l(BglII) -547 VEGF 2-2 (Sail) -450至-489 = poly A序列
- 367 VEGF 2-3(EcoRI/Sa11) -189 VEGF 2-4 (Xhol/Sall) -122 TSS (5'UTR开始)
Pptub2下游
1至1012 (1 =终止密码子之后) 297最长的EST结束(3'UTR) 1012引物206开始
Pptub3上游 -1386至-l(+l =起始密码子)
- 1386 VEGF 3-0 (引物292) -879 VEGF 3-2 (Sail)
-384 VEGF 3-3(Ecol47I/Hinc11) -112 TSS (5' UTR的开始) -60 VEGF 2-4(XhoI/Sa11)
Pptub3下游
1到997 (1 =终止密码子之后) 203最长的EST结束(3'UTR) 1012引物204开始Pptub4上游
—624至-1 (+1 =起始密码子) -624 VEGF 4-1 (引物373) -206 VEGF 4-2 (引物548)
- 205至-103 TSS的区域(5' UTR的开始)
- 55至-93 CT序列
Pptub4下游
1至1146 (1 =终止密码子之后) 466最长的EST结束(3'UTR) 1141至1164 Ncol
实施例2来自不同莒藓种的肌动蛋白基因及其表达促进区域的 克隆和分析
2.1小立碗藓肌动蛋白基因的基因组结构
已经从藓类小立碗藓中分离了四个肌动蛋白基因和启动子区域, 从藓类葫,藓和苔类地钱中分离了三个肌动蛋白基因和启动子区域, 构建表达载体用于苔藓中。
使用根据公共数据库中的立碗藓属EST序列设计的特异寡聚核苷 酸,通过几轮反向PCR从基因组中分离出了四个肌动蛋白基因(Ppactl Ppact3, Ppact5和Ppact7)并且须'J序。
在立碗藓属中分离的基因中的一个(Ppactl)其结构类似于高等 植物肌动蛋白基因的保守结构组织。未翻译的前导肽被一个较长 (955bp)的内含子打断,该内含子位于起始密码子ATG上游14核苷酸处。编码区域具有三个较小的内含子,它们的位置与其他植物物种肌
动蛋白内含子的位置相同。第一个内含子位于密码子20 (lys)和21 (ala)之间,第二个内含子将密码子152(gly)分开,第三个内含子在
密码子356 (gln)和357 (met)之间。这--般结构与三个其他的立碗
藓属肌动蛋白基因(Ppact3, Ppact5,和Ppact7)看起来不同。在那三 个基因中,5'UTR内含子(分别是434bp, 1006bp和1055bp)也位 于ATG前14核苷酸处,但是编码区域只被一个位于密码子21 (lys)和 22 (ala)之间的内含子打断(图7)。
2. 2肌动蛋白基因表达促进区域的活性研究
为了研究不同立碗藓属肌动蛋白表达促进区域(序列编号5到8) 的活性以及不同基因5'UTR的作用,设计了不同的载体,在所研究的 5'区域控制下表达hVEGF蛋白。
从基因组DNA中通过反向PCR分离转录起始位点上游大约2kb的 基因组区域并且测序,构建含有由启动子引导的人VEGF cDNA以及包 括^内含子的准确前导序列的载体,用于瞬时转染苔藓的原生质体。 通过校对PCR扩增出完整的5'表达促进区域,使用的引物是395和 332用于Ppact 1, 408和333用于Ppact3,511和334用于Ppact5, 以及413和335用于Ppact7。
对于每个待测构建体使用相同数目的分子转化原生质体,同时做 一个对照实验,转化携带在CaMV 35S启动子控制下的hVEGF cDNA的 构建体。hVEGF蛋白在N端含有26个氨基酸的信号肽,它使得重组蛋 白被分泌到培养基中。原生质体转化后孵育48小时后取不同稀释度的 原生质体培养基,用ELISA对转化进行分析。
不同的立碗藓属5'肌动蛋白区域引导表达的能力与组成型的35S启动子的活性进行比较。
在所有分析的情况中,肌动蛋白基因的5'区域都比35S启动子的 活性高。但是表达水平随不同的肌动蛋白调控序列而有所差异。这样, Ppact3的5'序列只能将VEGF的表达相对于35S启动子提高大约2倍。 当含有Ppactl和Ppact7 5'区域的载体用于转化时,测量出了更高水 平的VEGF。在那些情况下得到了 4-8倍相当于35S的数值。但是在使 用Ppact 5基因的5'区域时观察到了最显著的差异,在某些情况下, 得到了与35S的表达相比高出11倍的表达(图8)。
为了进一步研究高活性的立碗藓属肌动蛋白基因5'UTR的功能, 制备了含有5'UTR内含子删除、组合和替代的载体,用于莒藓原生质 体的瞬时表达分析。
与4吏用完整Ppact 1 5'区域的表达相比,Ppact 1 5'内含子的删 除显著降低了瞬时表达的水平。在这种情况下,在原生质体培养基中 检测到的分泌出的VEGF蛋白的量非常接近于通过CaMV 35S启动子得 到的表达量。这表明Ppact 1 5'内含子对于基因从Ppact 1启动子 的有效表达是必不可少的。当包含前导内含子的5'UTR与35S启动子 的下游融合时得到了相同的结果。这一构建体与完整的35S启动子产 生了相同量的分泌蛋白,表明5'UTR区域对于非Ppactl启动子的其他 启动子的活性没有任何显著的影响。重要的是表明仅仅携带Ppact 1 5'UTR区域的构建体比35S启动子对促进蛋白产生减少了 30%。这可能 提示在该基因的这个区域具有小的启动子活性,或者剩余的启动子活 性存在于载体的主链序列中(图9)。
使用相同的方法研究Ppact5和Ppact7基因中含有的5'UTR区 域对启动子活性的影响。分析了 5'内含子被删除的构建体,它们得到 了与Ppactl相似的结果,即对于Ppact5而言得到的蛋白质量与使用35S启动子得到的蛋白质量大致相同,且对于Ppact7而言得到的蛋白 质量还要低一些,表明在5'UTR中内含子的存在对于启动子的有效活 性是必不可少的。同样,使用只含有5'转录区域至ATG的构建体进行 了转化,也观察到了一些残余的促进活性。而且,对于这两个基因, 5'UTR与35S启动子下游的融合,与单独使用35S启动子相比使VEGF 蛋白产生了更高的表达率(2到7倍)(图10,11)。对于Ppact3观 察到了相似的结果,使用5'UTR自身或者与CaMV 35S的下游融合分别 产生相对于35S两倍和三倍的表达(图12 )。这些结果提示在这三个 基因的5'转录区域中存在增强子的活性,即使将它们置于一个不同的 启动子之下。
为了进一步研究Ppact 1, Ppact5和Ppact7基因中存在的5' 内含子的作用, <吏用Ppact5和Ppact7的5'内含子替换Ppact 1基 因的前导内含子,在栽体中进行工程操作,用于瞬时转化。同时用 Ppact 1基因的编码区中存在的内含子替4戈Ppactl 5'内含子。
用Ppact 1基因编码区中的内含子1和3替代Ppactl 5'内含子 导致表达水平降低了大约25%。但是检测出的蛋白表达量仍然比使用 CaMV 35S启动子的表达高大约2-3倍。奇怪的是,使用编码区的内含 子2代替5'内含子使得启动子丧失了活性(图13)。但是在检查了构 建体的序列之后,发现内含子的拼接位点不正确。制备了携带正确拼 接序列的新构建体,在莒藓转化之后表明内含子2的作用与其他的替 代相同。
使用对应于Ppact5和Ppact7基因的5'内含子进行替代,也观 察到了蛋白质表达的降低,但是这时降低的程度略小。
2.3.肌动蛋白基因表达促进区域的缺失构建体制备了肌动蛋白基因启动子的5'未转录区的缺失构建体,通过将 这些构建体瞬时转化苔藓原生质体对其进行分析,进一步研究不同肌 动蛋白基因启动子的特点。
这样对于Ppactl,制备了携带转录起始(+l)上游不同基因组区 域长度(-1823bp,-992bp,-790bp,-569bp,-383bp,-237bp,和-82bp) 的构建体。原理上除了-82bp的构建体以外,所有的构建体都应该具 有完全的启动子活性。但是-383bp构建体表现出活性的下降,其活性 与-82bp构建体达到了相似的水平(图14)。
对Ppact3启动子区域的缺失构建体进行分析发现了一些有趣的 特征。如以上所描述的,该启动子与其他肌动蛋白基因启动子比较活 性较低,尽管与CaMV 35S启动子相比它的活性略高。这里对下面的 5' 未 转 录 区 域 进 行 检 测 -2210bp,-995bp,-821bp,-523bp,-323bp,-182bp和-81bp。奇怪的是 构建体中含有启动子区域直至-821bp时,启动子的活性与CaMV 35S 启动子的活性大致相同。而含有从-523开始直至转录起始更短区域的 构建体产生两倍量的重组蛋白。这可能表明在瞬时转化试验中(图15) 位于-523bp上游的顺式作用区域下调了该基因的转录。
对于Ppact 5 ,制备了含有该基因转录起始上游 -1872bp,-758bp,-544bp,-355bp,和-121bp片段的构建体。从瞬时试 验得到的结果表明启动子的完全活性位于转录起始(+1)的-758和 -121之间的区域(图16)。
对以下的Ppact7基因5'未转录区域的缺失构建体进行分析 -1790bp,-107Qbp,-854bp,-659bp广484bp,-299bp,和-66bp。得到 的结果表明在-484bp和-299bp之间包含的区域对在瞬时试验分析中 启动子的完全活性是必需的(图17)。为了得到一套立碗藓属肌动蛋白基因的异源启动子,使用另外两
个种藓类葫声藓和苔类地钱分离含有肌动蛋白基因的基因组DM片 段。为此,设计具有不同程度简并性的寡聚核苷酸,使用来自两个种 的基因组DNA作为模板进行PCR反应。
2.4来自不同苔藓种小立碗藓、葫芦藓和地钱的不同肌动蛋白基 因的比较
小立碗藓
从小立碗藓中分离的四个不同的基因组肌动蛋白序列可能代表了 该基因的全部功能性序列,包括5'启动子序列,5' UTR+5'内含子, 0RF+内部的内含子以及3'UTR和进一步的3'下游序列。总共分离了 Ppact 1 5809 bp, Ppact3 5633 bp,Ppact5 8653 bp以及Ppact7 6351 bp的基因组序列(图18A)。除了 Ppact 1的ORF是1134bp以外, 分离的立碗藓属肌动蛋白cDNA的编码区域几乎全部都是1137bp长。 相对应的蛋白质是378个氨基酸长,Ppactl具有377个氨基酸。在核 苷酸水平上编码序列之间的同源性在86. 6%到98. 9%之间。蛋白质序列 的相同性在97. 1%和99. 7%之间(DNA STAR, MegAlign程序,Clustal V (加权)序列比对软件)。
对于所有四个立碗藓属肌动蛋白基因可以通过反向PCR分离ATG 起始位点5'的延伸基因组DNA序列并且进行测序Ppactl 2973nt, Ppact3 3091 nt ,Ppact5 3095 nt, Ppact7 3069 nt 。对于Ppactl, Ppact5和Ppact7使用Gene Racer Kit (Invi trogen)进行5, RACE(它 只扩增全长的cDNA)确定基因的VUTR。对于Ppact3,通过数据库中 不同EST的长度确定5'UTR。通过比较cDNA与基因组的反向PCR片段, 可以显示大的5'内含子的存在。对于Ppactl, Ppact3, Ppact5和 Ppact7,所有位于-14位置到ATG起始密码子的5'内含子的长度分别 是955 bp, 434 bp, 1006 bp和1055 bp (图18A)。通过比较基因组序列和衍生的蛋白质序列以及来自拟南芥肌动蛋白基因的cDNA序列 和蛋白质序列,确定0RF内部的内含子的位置。现有的立碗藓属肌动 蛋白基因的5'启动子序列分别有Ppactl 1824 nt, Ppact3 2270 nt, Ppact5 1909 bp, Ppact7 1805 bp (图18 A)。
通过对基因组DNA的简并PCR从葫芦藓中总共发现了 4个不同的 肌动蛋白基因(表达促进区域序列编号9至12),从地钱中总共发 现了 3个不同的肌动蛋白基因(表达促进区域序列编号13至15)。 因为目的主要是从不同的苔藓种中分离可能的不同肌动蛋白基因同源 物的5'启动子区域,至今为止3'端的大多数序列还是不完整的。(图 18B/C)。
葫芦藓
对于葫芦藓属,发现的肌动蛋白基因被命名为Fhactl, Fhact4. 4, Fhact5和Fhact5b。通过反向PCR可以分离的不同肌动蛋白基因的 基因组序列有Fhactl 3951 bp, Fhact4. 4 2417 bp, Fhact5 4432 bp 和Fhact5b 722 bp。对于编码序列为1134个核苷酸的Fhactl基因, 可以分离完整的编码cDNA序列。对于其他的葫芦藓属肌动蛋白基因目 前有部分的序列,没有3'端Fhact4.4 906 bp, Fhact5 965 bp以 及Fhact" 722 bp (图18 B)。分离的编码序列具有的同源性范围在 核苷酸水平上是87. 4%到99. 2%。得到的蛋白质序列有90. 8阔99. 2% 是相同的(DM STAR, MegAlign程序,Clustal V (weighted加权)序 列比对软件)。
除了 Fhact5b以外,可以通过反向PCR分离ATG起始密码子5' 上游的序列并且测序。已有的序列有Fhactl 1824 bp, Fhact4. 4 1333 bp, Fhact5 3289bp。使用Gene Racer Kit (Invi trogen)进行5'RACE 确定不同5'UTR的长度。通过比较cDNA序列和反向PCR获得的基因組 序列以及与立碗藓属的基因比较确定内含子-外显子的结构。对于立碗藓属肌动蛋白基因而言,发现的葫芦藓属肌动蛋白基因含有大的5'
内含子,它们位于cDNA的-14位置上,其长度对于Fhactl Fhact4. 4和 Fhact5分别是928 bp, 1015 bp和656 bp。至今为止已经分离并且 测序了 Fhact 1 700 bp, Fhact4. 4 145 bp以及Fhact 5 2515 bp的 5'启动子序列。对于Fhactl分离了 419 bp的3'区域。葫芦藓属肌动 蛋白基因的5'区域和3'区域通过葫芦藓基因组DNA的PCR产生,使用 的引物是Fhactl 5'区域引物908和909; Fhactl 区域引物 983和984; Fhact4. 4 区域:引物1000和1001; Fhact5 5'区域引 物611和612。
地钱
发现的地钱属的肌动蛋白基因^皮命名为Mpactl, Mpact4和 Mpactl5。所有3个序列都缺少3'端。至今为止分离并且测序的序列 有Mpactl 2229 bp,Mpact4 3987 bp以及Mpact15 2174 bp的基团 组序列。对于Mpactl, Mpact4和Mpactl5分离的编码cDNA序歹'J分 别有997 nt, 962 nt和995 nt (图18C)。与另外两个莒藓种相比, 地钱属肌动蛋白基因内的序列同源性略微低一些,在核苷酸水平上介 于78. 3%和85. 5%之间,在氨基酸水平上介于94. 7%和96. 1%之间(DNA STAR, MegAlign #呈序,Clustal V (加斥又)序列比对软件)。对于所 有三个鉴定出的不同的地钱属肌动蛋白基因都通过反向PCR分离了 ATG的5'上游序列并且进行了测序Mpactl 937 bp, Mpact4 3025 bp 以及Mpact15 910 bp。地钱属肌动蛋白基因同源物的5'区域通过地4戈 基因组DNA的PCR产生,使用的引物是对于Mpactl的5'端^f吏用引 物950和951,对于Mpact4 <吏用引物960和961,对于Mpactl5寸吏用 引物970和971。通过比较来自不同吝藓种的不同肌动蛋白基因序列 得到了 ORF的内含子外显子结构。分离的Mpactl的5'序列显示在-14 位置具有内含子拼接位点的共有序列(aggt),表明与其他立碗藓属和 葫芦藓属基因一样存在5'内含子。在Mpact4和Mpactl5的5'上游序 列中不存在内含子拼接位点共有序列,提示没有5'内含子(图18C)。小立碗藓、葫芦藓和地钱肌动蛋白基因的比较
如上面提到的, 一般情况下来自一个物种内的不同分离肌动蛋白 基因的核苷酸和蛋白质序列的同源性非常高,特别是在蛋白质水平上。 关系非常密切的两个苦藓种小立碗藓和葫,藓之间的同源性也非常
高。在核苷酸水平上肌动蛋白基因显示的同源性在86. 9%到96. 3%之间 的相同性,而在氨基酸水平上的同源性范围在95. 5°/。到99.7°/。之间。
相反苔类植物地钱与其他两个种之间更远的关系从在核苷酸水平 上基因更低的同源性上可以反映出来。立碗藓属和地钱属肌动蛋白基 因之间的同源性范围只有75.2%到78. 8%之间而葫芦藓属和地钱属之 间的同源性范围是75. 5%到80.4%。在氨基酸水平上,地钱属肌动蛋白 基因与立碗藓属相比同源性在93. 0%到96. 1%之间,与葫,藓属相比同 源性在93. 4°/。到96. 7%之间。
内含子-外显子结构(图18A/B/C)
如前面所表明的,立碗藓属肌动蛋白基因的内含子-外显子结构 与高等植物内含子-外显子结构有一定程度的相似性但是仍然有明显 的差异。所有分离的立碗藓属基因都在5'未翻译区域含有一个大的5' 内含子,这也是几乎所有被研究的高等植物肌动蛋白基因所具有的。 只有Ppact 1在0RF中含有3个内部内含子,反映了例如所有拟南芥 分离肌动蛋白基因的情况。Ppactl 0RF内部的内含子位置与高等植物 肌动蛋白基因相比也是保守的。相反Ppact3, Ppact5和Ppact7在 0RF中只含有一个内部内含子。
在分离的葫芦藓属肌动蛋白基因中可以发现相同的基因组结构, 在5'UTR中有一个延伸的内含子。Fhactl与Ppactl有相同的保守 内含子-外显子结构而Fhact4. 4和Fhact5在ORF序列中只含有一个 内部内含子。分离的Fhact5b序列太短,所以关于它的内含子-外显子结构不能看得很清楚,但是与Fhactl或者Ppactl相比它至少不含 有内部内含子2。
在地钱属中分离肌动蛋白基因的基因组结构看起来更为不同。重 要的是表明在三个不同苔藓种中不同肌动蛋白基因的数目还不知道, 有可能从地钱属中分离出的三个肌动蛋白基因不代表独立的有功能的 同源基因。有可能在地钱属中存在三个以上的肌动蛋白基因,在立碗 藓属和葫芦藓属中存在四个以上的肌动蛋白基因。
但是Mpactl的内含子外显子结构看起来与Ppactl和Fhactl的结 构相同,5'UTR中有一个5'内含子以及0RF内部内含子1和2的保守 位置。Mpactl5还含有保守的0RF内部内含子1和内含子2,但是在 5'UTR中的-14位置或者-IO位置上没有如同在立碗藓属或者一些拟南 芥肌动蛋白5'内含子中发现的保守内含子拼接位点,显示缺少5'内含 子。对于Mpact4也发现了同样的情况,很可能缺少5'内含子。此外 Mpact4在0RF中也不具有内含子1或者内含子2,这与目前分离出来 的所有苔藓肌动蛋白基因都不同。
推测的同源苔藓肌动蛋白基因
尽管从立碗藓属和葫,藓属中分离的不同肌动蛋白基因的内含子 -外显子结构可能对两个种之间的同源基因提出了推断,但是我们不 能从基因组结构中得到这个结论。例如Ppactl和Fhactl具有相同的 保守内含子-外显子结构但是正如以上所示,还不清楚在两种植物的 基因组中是否存在更多的具有相同基因组结构的基因。为了就同源基 因给出一个结论,还需要表达数据以提议功能同源性。而且从蛋白质 或者编码的cDNA序列的序列同源性中不能就两个种之间的相应同源 基因作出任何假设,因为这两个种太相似了。
但是有趣的是对于立碗藓属和葫声藓属,还发现在UTR序列、内含子序列和启动子序列等非编码序列中有非常高的序列同源性。因此
在Ppactl和Fhactl以及Ppact3和Fhact5之间发现了高的同源性。 在两种情况下内含子序列都显示了非常高的保守性。对于Ppactl和 Fhactl,同源性如下5'内含子58%;内含子1: 64%,内含子2: 52 %以及内含子3: 55%。对于Ppact3和Fhact5同源性是对于5'内含 子是51%对于内含子1是48%。
在两种情况中分离的5'启动子序列显示了高的同源性。图19A图 示了 Ppactl和Fhactl的分离的启动子区域的比较。转录起始定为位 置l, 5'启动子区域的第一个核苷酸定为-l。 Fhactl的5'启动子区域 分离的267bp与Ppactl 5'启动子区域的前267bp有58%的总体同源性。 在这些序列中可以,见察到具有不同同源性的部分。-267和-129之间的 序列同源性是51%。后面的29bp有62°/。的相同性,在-100到-l位置之 间同源性几乎是70%。考虑到Ppactl和Fhactl内含子和启动子序列 之间的高度序列相同性,有理由将这两个基因作为这两个苔藓中的同 源基因。另一个有趣的方面是观察到不同的Ppactl: vegf缺失构建体 之间表达的下降(图15 )。表达的显著下降出现在-237和-82缺失构 建体之间。这显示了 5'启动子区域-129和-1之间的重要功能,因为 刚刚提到Ppactl和Fhactl的启动子区域序列高度保守,-82缺失构 建体不含有所有的高度保守序列而-237缺失构建体含有所有的高度
保守序列。
也可以观察到Ppact3和Fhact5启动子内的高度保守区域。这两 个基因分离的启动子区域要长得多。因此在两个5'启动子区域之间发 现更多的同源区域(图19B) 。 Ppact3从-1到-2270以及Fhact5从 -64到-2325的启动子区域显示了一些有趣的同源性特征。起始位点 位置的差异可能是由于Fhact5的5'UTR是由实验确定的而Ppact3的 5'UTR是通过分析数据库中的EST确定的。Ppact3 -2270和-1876之间的序列与Fhact5 - 2325和-1948之 间相同的序列区域之间只有很低(29%)的同源性。之后有一个大约 1100核苷酸的延伸区域,具有非常高的同源性(82%)。接下来的Ppact3 140nt区域和Fhact5启动子的152nt区域"只"显示了 53%的同源性。 Ppact3 -641和-463之间的序列与Fhact5的-705和-528之间的区域 再次显示了 76%的高度保守性。接下来大约180nt再次显示了较低的 同源性(5 3%) 。 Ppac 13启动子序列的最后288bp与Fhac 15后面的28 Obp 之间再次显示较高的同源性73%。两个同源基因之间具有不同同源性 程度的这些区域可能显示在5'区域中存在调控性的活性元件。
对于Ppactl和Fhactl,这里对不同Ppact3: vegf缺失构建体的 表达分析也是有趣的(图17)。与-523删除构建体相比,-2210, -995,-821缺失构建体的vegf表达水平有显著的升高。这三个缺失构 建体至少含有Ppact3和Fhact5中-1876和-779之间发现的延伸同源 区域的一部分,它们的表达水平达到了 35S启动子的表达水平,而-523 缺失构建体与35S启动子或者更长的缺失构建体相比,表达有2^倍的

增加。这可能显示在这个Ppact3和Fhact5之间具有82%同源性的区 域中存在负调控因子。
对于地钱属,没有发现与来自立碗藓属和葫芦藓属的不同肌动蛋 白基因之间有相当的序列同源性。
对于Fhact5基因,制备了一个含有1157bp 5'未转录区域与hVEGF cDNA融合的构建体,用它在立碗藓属原生质体上进行瞬时转化实验。 在这种情况下检测出的蛋白量与使用CaMV 3SS启动子得到的蛋白量处 于相同的范围内但是略高一些(直到两倍)。Fhact5基因与Ppact3 基因具有最高的同源性,有趣的是在瞬时试验中两个启动子在立碗藓 属原生质体上显示了相似的活性。2.5稳定的转基因品系
将包含由Ppactl, Ppact5和Ppact7的5'MEPR引导VEGF c醒 表达的盒子引入立碗藓属植物的基因组中。对于每个MEPR得到5-10 个稳定的转化植物,并且检测了 rhVEGF的表达。对于这三个检测的 MBPR,在植物生长的培养基(标准Knop培养基)的上清中检测出了来 源于苔藓的表达和分泌的rhVEGF,表明当MEPR整合到基因组的其他 部分中时会促进蛋白质在非诱导条件(标准条件)下的表达。在那些 表达系中可以测量的蛋白质的量从每毫克苔藓干重7ng VEGF到每亳克 苔藓干重53ng VEGF,这取决于构建体和稳定的品系。
使用一个含有Ppact5控制下的VEGF cMA转基因苔藓林进行生物 反应器培养。通过ELISA测定生物反应器培养物上清中来自莒藓的重 组VEGF的量是每毫克莒藓千重40-50ng VEGF。
实施例3小立碗藓和葫^藓泛素基因及其表达促进区域的克隆 和分析
利用存在几个对应于立碗藓属聚泛素基因的EST序列,设计特异 的寡聚核苷酸分离与数据库中最广泛存在的泛素基因同源序列的EST 相对应的基因组序列,将其命名为Ppubql 。通过反向PCR鉴定出Ppubql 区域的2146bp。通过5'race确定了 ORF开始之前有129bp转录了的 5'前导序列。使用小立碗藓基因组DNA和引物777与602通过PCR扩 增出Ppubql的5'区域。
构建携带不同部分启动子和引导hVEGF cDNA表达的5'UTR区域的 载体,分析立碗藓属原生质体瞬时转化中启动子的活性。
结果表明该启动子与Ppact5启动子有相似的活性(或者更高)。 检测的构建体、1. 6kb和1. 3kb的启动子片段表达水平比CaMV 35S启动子的表达水平高大约4倍和几乎7倍。
通过对葫芦藓属的总RNA进行5'race PCR,使用来自Ppubql编 码序列的引物,发现了来自葫芦藓属的泛素基因Fhubql。使用分离的 5' UTR序列和部分编码序列设计引物对葫,藓的基因组连接产物进行 反向PCR。这样发现了 5'UTR 5'上游的序列。使用引物943和944从 葫芦藓的基因组DNA中PCR扩增出区域。
实施例4小立碗藓RBCS表达促进区域的克隆和分析
作为肌动蛋白、微管蛋白和泛素基因之后的可能候选者,考虑核 酮糖-1, 5-二磷酸羧化酶/氧化酶的小亚基(rbcS)基因。在核基因组上 编码不同的rbcS基因。这些rbcS基因是一个基因家族的成员。rbcS 基因主要在能够固定二氧化碳的植物的所有绿色部分中表达。因此该 基因家族在从不同莒藓的不同rbcS基因区域得到5'和3'包围的表达 促进区域方面是有用的。第一步对立碗藓属的EST数据库进行分析。 发现来自小立碗藓的rbcS基因组织成为一个基因家族,由12个基因 组成。
将rbcS基因中最广泛存在的EST - -Pprbc-S12作为候选的EST 查找其5'和3'表达促进序列。从EST序列数据开始,通过反向PCR 确定该基因的5'和3'包围区域并且对克隆的5'和区域进行测序。 使用引物839和858从小立碗藓基因组DNA上PCR扩增出5'区域。使 用引物904和901PCR扩增出3'区域。
在所附的序列列表中给出了以下的序列(序列编号/序列名称/相 对于蛋白编码区5'或者3'区)1Pptubl5,
2Pptubl3,
3Pptub25,
4Pptub23,
5Pptub35,
6Pptub33,
7Pptub45,
8Pptub43,
9Ppactl5,
10Ppactl3,
11Pp3Ct35,
12Ppact33,
13Ppact55,
14Ppact53,
15Ppact75,
16Ppact73,
17Fhactl5,
18Fhactl3,
19Fhact4.4 5
20Fhact55,
21Mpactl5,
22Mpact45,
23Mpactl5)5,
24Ppubql
25Fhubql5,
26PprbcS12 527PprbcS12 3,1:芸?一J,
No. tj 一5、-3、一_
35 讓G醫iGOCG
38 AC,TI籠CTGC
40 GGBicGIOA醫c
69 GKGTCATSACGACMGACCGGGGATCCACS:
70 TCAGT謹CCGTG養謹CTC謹TG
71 i,GA,CTCC謹謹TGTG
89 T簡IA簡GiGGGC,
91 OTGC,MTicTG,MI
95 SGG,CTGC51A
113 TABBiT謹歸
149 OTOACCAOOCAATGOOTATOO
203 Cci歸i謹c5c
2CH GATCG1TGCTGC1C謹C
205 TCGCAGGMGTGTCCTTAGTCGAG芸
219 TTSCTCGAGMGTCCMMT讀讓ATAC
223 1謹震8CABG
225 CATCTTCA0TGTG0T0TACCTCACG
226 CTACTCGMOSVTS-AMS-GCS-AGTGCC
291 GAC1TCIGTCG,IGGGSG
292 GACCCGTGGGACTTAGTTGTCTTSCTTC
296 GQ-GC3TCTCGTSTGT0T
291 icc画謹謹c
298 GT謹G,謹GG
299 ATCGCTTCTCGACT0TT3CC
300 IGCTCGIGCG8
321 GACCTGSGGCSCgGCTTGTMTCATGG3SG
332 CATTTCTTMTACCGACCTGCCC窝S
333 c雲iG,8il讓G
335 CATTTTTTAGMT習C9CAGGAGTTC
336 AGA3GGCMGTTCCCTTCG
337 GAA1霞I誓G
338 GGMGASGTCGA聖GCGAT
势溢 a 誡45/91:3
Mo. ^f^ 一5、-3、一_
363 CATCTTOTCCMOTACCOOOSXCGAACOO
364 S5T, jT羅cc
373 GiG謹醫薩AGACBB
374 CATCTTG醫謹iG0TC
395 ATGTCGAGGATCCATTCAACGSGGATMOT
408 CASI,CTGT1謹TTTG
413 ivma-finmoM-TSG-TTA3GOCSGGT
511 TTACTCGAGACTCTAOTMTTGMAMTATG
547 0 CMGATTO0AGGTTCCTTSG
548 TC,CGIC0TCCG8醫TI
549 GTGCCTClcACATCCCicc
550 liA,ooci,,
S2 CATCCTTACAGGACGTACTGG
612 GBGATG,GTTCTG
.3 TT芸CTCGAGATACMGAGTTATMATCMATAC
839 S-ATCTCGAGMGCS-GTRRGATRMTCCMTTA
858 1CT,T3CCHTCGS
9W M-ATCTGCAGTCATGMACTTT9TTATGTMC
ATATGCOOCCGCGGAACGBATTTGTCGAGCTCTCT
908 CTTTCGT3TGC0TCMGA0TG
943 ATATCTCGAGGMTTCATTTCCATTMCGAGMTATGAC
944 ,TCACMCGCTTTATC5C
950 CAT,GT1GTTGTGG
mcGIICICC
9S1 ,CG震A,CCG
970 MGCmGCMGCAGCTCTCG詞
911 ATCGM!SA緊TGCgGCC
983 AGGAOTGTTACACATCTTTT;ic
9S GGCT芸GACGM;GCATTCTGTG
li GG3iGGiiG
1001 CGCT望CMTGATCCTGSTAG
10R TC0OTGMCTCCATCTCGTCST
8F CGG3CCTACMGGGCCTCTCG
9F TGGGACGTATCAGGGTACGTCT
F7 TAT,G歸CGCicc参考文献
Altschul et Nucleic Acids Research 25 (1997), 3389-3402.
Berlin et al., Genetic modification of plant secondary metabol-ism: Alteration of product levels by overexpression of amino acid decarboxylases, in: Advances in Plant Biology, Studies in Plaht Science, Vol. 4, pp 57 — 81, DdY .Ryu and S Furasaki (eds), Elsevier, Amsterdam 1994.
Cove et al. Trends Plant Sci. 2 (1997〉, 99—105 Engel, Am. J. Bot. 55 (1968), 438-楊 EP 1 206 561 A
Frahm 、、Biologie der Moose〃 (2001), Spektrum Akad. Verlag
Gorr (1999) Biotechnologische Nutzung von Physcomitrella patens
(Hedw.) B.S.G,. Dissertation, UniversitSt Hambu:tg.
Grimsley et al. , Mol. Gen. Genet. 154 (1977), 97-100
Hiwatashi et al. , Plant J. 28(1) (2001)., 105-116
Hohe et al. , Plant Sci. 163 (2002〉, 69-74
Holtdorf et al., Plant Cell Rep. 21 (2002), 341-346
Liebich et al., Nucleic Acids Research 30 (2002), 3433-3442.
McElroy et al., Mol. Gen. Genet. 231 (1991), 150-160
Reski et al. , Planta 165 (1985), 354-358
Reski et al. , Mol. Gen. Genet. 244 (1994), 352-359
Reski, Botanica Acta工工I (1998), 1-15
Reski, Planta 208 (1999), 301-309
Reutter et al., Plant Tissue Culture and Biotechnology 2 (1996), 142-147
Richter et al., Gene 290 (2002), 95-105
Rothnie et al., Plant Mol Biol.32 (1996), 43-61.
Rother et al., J. Plant Physiol, 143 (1994), 72-77
Sambrook et al. (1989), Molecular Cloning: A Laboratory Manual, 2nd edn. Cold Spring Harbor, NY: Cold Spring Harbor Iiaboratory Press Schaefer et al., Mol Gen Genet 226 (1991), 418-424
Schaefer (2 001) Principles and protocols fox the moss Physcomitrella patens http:〃www.un土l.ch/lpc/docs/PPprotocol52001.pdf Schaefer, Annu. Rev. Plant Biol. 53 (2002), 477-501 Schlink et al., Plant Mol. Biol. Rep. 20 (2002), 423a-423f Strepp et al. , Proc. Natl. Acad. Sci. USA 95 (1998), 4368-4373 T6pfer et al., 船R 15 (1987), 5890
Watson et al., "Recombinant DNA〃 (1992), Chapter 1.1 and 2 Zeidler et al., J. Plant Physiol. 154 (1999), 641-650序列表
<110〉 greenovation Biotech GmbH <120〉苔藓表达促进区域 <130〉 R 42095 <160> 27
<170〉 Patentln version 3. 1
<210〉 1 <211〉 1533 <212〉 腿
<213〉 小立碗藓(Physcomitrella patens) <400〉 1
tagcataaga taaagatgtt ctctacctaa tttattttta tttatcacta ataactcata 60 tcaatctaaa atatataaat gcctttaaca atagaagaat atgattcaac aaacccaatt 120 ctatcattaa aaatatatct aagattagat atgataaaaa taga.taataa tattaataaa 180 tcattttaag gttgtaatgc aactataata atttttaata ttataacttt ttagtttttt 240 aaaataaaaa taaaatgtta aaatattata aaataattat actttatata tttatgatca 3003gttagta_ca_ ttgatscatt t犯agtcca^ a^t犯ttt犯tgata^cc^c ttgc3a^aB3 360
tttMtatt3 tta^3tatt ttaaeiaagtt ^gagc犯ga肌犯ttattc ta^tsg^t 化0
tcataccatg gtattataaa gatacaaaga atcaatgtgt atttatttat tttacataca 480
tt8cttgcaa tatatggttt atactac犯a tgactatata ttgeLagatac taaccac犯a 540
83t333a8tc cagcacta^ga t已3ttct333 aacstgaast 3C33t3333C 3tt3C3ttac 600
tagcttatat ggttactaaa tatttttaaa ttatacaaat aaaaaataaa aataaaacaa 660
aaaaatccta tagtgacaag aaataaaata aaataaaaaa attataattg accaatccct 720
肌肌catt^ tattt肌ggg atsttcatat gsc犯taa^g at朋tttatt tcatgg朋cc 780
ttgattattt tatcttttaa aggtggtatt tttaaaattg tttaatggta cttaaaatat 840
tgtatttata tagagaaaat cctcc犯a犯aMtctctca caagggaata gaattcctca 900
agtttttctc ttgactaaat tgaccaacca ccaaacaacc cacgtcatcc atccatccaa 960
cccccacaca acccaattgt ttctccattg tagacatcga caaatgaaaa tcatccgatg 1020
acgtatacac ttcatcctct g'gtccctcca gggtgccatg agccacatcc cgaccgccta 1080
tttcagatcc gacggcacag ggtgacagag cagcggtctc agaccacgcc atttggaact 1140
cgccagccct gccccagcta acagtttcaa agctgcccgc cataacccgg tcctcccagg 1200
gccgttagat cgtccatcct acgggagcac atataatact gccctagtgc cctaatccga 1260
tgggaacggg gagtccttta tctctctcgg a犯gcgactc attcgccagt gtgcgcatcg 1320
cccgtgtccc aaggcaccgg gccagactct cgcatcggct ctacccacac tcacccccac 1380
tcaccctgtg ttttctctgc ccccttcgcg ctcttcgtgt gtgtgtgttt tttcacggtc 1440
gattggcgag ttgc卿gga gggcaagggt gctgtggtgc agcatcagct ggtagt卿t 1500
cagtcagggt tcgggtcgcg gtagttggac aag 1533
〈210〉 2<211〉 1539 <212〉 DNA <213〉 小立碗藓
〈400〉 2
atgtatttcg gagcgatttc gtgtgctgtt ggtgtctUt ggttggaagc gatttaaaca 60
ggagagtctg tttggtggct tagggtaatt cggtggagcc tg犯agatat tgctacgtct 120
tgaaatacca tcttgtttca gtgcgcattg cttgcaaaag cattgatagt tgtagcggga 180
tatggtgctg tttatggttg tatttgagca tatgtttcgt gacatctgtg ttgcttgttg 240
ggcttgccat actggtagtg tcttgttgag tatcatattt actttccaat gtaatattca 300
acattttctc ctagcattac tataccattt ccatctattx ccaatggcgc tatcgtctcc 360
ctgggataca tttaacccat atttgtagtc cagtgcatta aatgcatgtg aaatcgcatt 420
tatagatgcg catatttaat gtca犯ttag acatcttcac tcat3taata csttttacca 480
aaaaatgaaa tgtacacaca gaatattttc aaactgccga ctatctcaaa aacctataca 540
ttatcaatct cattgacata cctcattgaa atactcctca ttgaaatact acataatttt 600
csttgtcaat attgccaaca ttc肌ccatg agaagctgat tattatttct tttatactgc 660
ttactctctt aatgcaaatt caccattcct catgagagca gctgtatcta ctcccctgat 720
caatattact actaacttct caggaatagt actcgatatg ttgcgctggt tcagttacgc 780
aattataaag tccatcgtgt aaaccataat cgtcacaact ggatatctga tgccagaatt 840
tcagcaaatt ttagtgccga tccgaccagt tcaatgcaga agagg肌tat aactatctag 900
aggttgttca caatcttttt cattac兆tg cagccaaagt tctgcaacga agatacattc 960
gcaacttgca tgcaaggtga agacacatat cgcggctaga tcctcagttc gttgttaata 1020cctgggaaag aaaatcaaca aatcgaattt ttctgcatca aatagccatg acaaagatta 1080
gtacttccag tgcaagtata gtctgcggaa atatatcgca gtcctcgtac tacagcttca 1140
aaatttgggt acatgacgag gatttcgacg cacaagaaca gaattaaccc gatcgtatcg 1200
agcgttacag taaacgagac gaagtgcctg tgtcttcaaa ccggcagatc tctacgaagt 1260
aagaatctac tcagcagtga gagcgagagc gitctggtgtg gcagaatcta ctatgattac 1320
aag'tgcccta tactgaatgt agaagcctgt atccacctca tatagg肌ac gaagtaatcc 1380
ataccgacat gttacatatc tccactgaag cagttccg'ta tg'ggcataca ggaaatgatg 1440
aag'cacaacg cgtataccaa ttttttatca gatacacaat cacccaattc肌aacgcacg 1500
tttatacaac caacacgcca tgLctcaagat gagcaggca 1539
<210> 3 〈211〉 1〗97 <212> 腿 <213〉 小立碗藓
<400〉 3
tccttagtcg agaaggcgcg ggacgtgsgt gagctctgaa gataagcttc caatttgcca 60
ctgcaagtgt aacctgctcc atcgggcgcg agtccgtagg gatcatgaac acctcatttc 120
acttggcgtt agtgcactct agcggcattg ,c組cca tgccctc卿atgagtcgcg 180
gggggcagtg aacgaactag ttaaga組c cagtaatgac ggcaccacat cggcagatcc 240
agatccattg cagattatcc tcttcagccg gaccgaataa accatgccta aataaccacc 300
ggaatgtgtc ctgtgcggga ctgattgttt tccaaagaaa cactaactaa ttatatccag 360
acagtgggat gtatgcgggt atccgtg, ccagatatga gatctctgst犯Eicctgagg 420aagatgtctt acatggcggc acgggaaaca cgaagaaaag ccgaggagaa ggtattgaaa 480
gctgagcata gccsttggct ggtgagga犯gggcstgc犯c犯ctc3tcg 3犯gcgg3gt 540
肌actttgaa已tcccgtagg cttcatgcga tgttctaaat tcttagcctc gacgacgatt 600
tcaaggtctg attcgaagct tccgagcggg gctccggaac tgtcacttca gtcgactttg 660
aaatgtga^g cgactttgct cacttgtgac acagcaattc aactccacaa tataa犯aaa 720
tcgcgaaaca aaaaaaaaaa aaaaaaaatc tactttactc gtcgatgttc cactcgaaga 780
caaacagctt taaagcgttt acctgtggta gagatagatt tcggcgaagg aattcaaatc 840
cagcaaccct cccactcgta ccgcagacct tgagtttgaa cggttctgtt gctgtttgcg 900
gtgagttcaa aactcgactg acctctctga aaccaaaagt ttaccttgag ctgcccgeiga 960
atctccgaac gttcgtatata agatccaacg gtctcaagaB attctccctc gaggaacacc 1020
tatgcccagg ggcagggggt tcctttatct ttctccctct gccgcaatcc atttcattgt 1080
gcttgcagga ctg'tcatccc tccccttgtt gccagtggta tccggaggtt cccgcgacac 1140
cttctggtgc cggaactaag gtctgttgtt cctttcgtga ggtagagcac actgaag 1197
<210〉 4 <211〉 1012 〈212〉 DNA <213〉 小立碗藓
<400〉 4
atgcgacccg aaggatgagt acacgcgttt tggttttacg ttactgactt ttagctcctc 60
cattcacact gcaggccctg gtttactgtt g犯agcacgg ttataccctc cgtaaactga 120
acattctgtt tcagcgcgtc gtgtcttag't tgtcctttgg ttcacttttt agtttggaag 180caagtcgttg tatagatgat acttagcaca tatagttgct gtcgatttgt tttaagttca 240
gcattccgct gcctgaattt cagtaaatac cttgtccaac ttcgatgcaa tataagttgg !300
cttcagtatc cagtcttgcc ttactccttc attgcaatct tggtggcggt ctggtgcgcc 360
tcgtccactt tcacgatgta cctcgtcagc ttgtttgaac acttcctttc tcctactgag 420
tatggcgttg gcctcttttt ccaagctctg ttgatgtagg tcctaccttg tcaaaacatc 480
acccacagag atttg'acgac aatcgtaatt ttaatccgat tgtatggggt tcctgtcata 540
gtcaatatat taacgcccat cctctcactt accaacgtct gttaccaact ggacaataat 600
gcattcacaa ccaaagtgca atttttgtat gagttggaaa tatcga肌ca gttagtgcca 660
gtaattcacg caaatagttg tgtcatggaa actttttttt aactttctgt tgtccaatca 720
tcgtgctgaa acatttagaa atgtggcag已cagttgcatt tgatgtatca actgctgtgg 780
tagtaacact tgttga犯ct gtaagataga catgccaact ttctggtgct atgtgctaat 840 tgtttatatc ttcctgaaga atggtacaat tcaaatga犯gtgggtggga gaattgatat 900 cattgatagt ggaataggtt attgcaatca gtgagtcctt ttttcagggt agctaatatt 960
ccttactgat tatccattga ccaccagtgt ggcttgtgga atgcgtgaag tt
1012
<210> 5
<211〉 1386
<212〉 醒
<213〉 小立碗藓
<400〉 5
ccgtgggact tagttgtctt cacttcatta ggaaatctgt ttgagcctct ttccattcca 60 atcttctcg3 c朋33taggt Utttcagtg 3ctcat朋ct t3ttgtgctt tgc朋朋ttc 120
56ccactaatcc gaaatgtatg gtgtgatcac cgagctttta aattgattgt gtttgggcag 180
tctacgaaaa atccagacgt ggagccttcg aggaacaggt tgttcgcgca ccgctacttc 240
tgaacttcac aacgccgcgt ctatgtcgct ctaactcaga ggctataaca caagttagcg 300
atgtccatcc ctctagtctt catatttgca acattaggag gaggcacacg ctggtcgaga 360
tgcccgtgga actcttccag attgctacca tcaatgcact cgtagacaga tccaaaagtc 420
attccacatt attcaacatt aagggatccc caactgacca accaagagca ggtgctatga 480
gtggaacttg ttattttcca aatgagcgtc gactacatat gcccaggcag aaggatatgc 540
cgaggtatct gggggggcag gcatgtgttt tgtgta肌gt acccccgagg t犯gaacttt 600
taagcggcgg cactggattc agaaacagtg gacagatata tccattgcca atgtattgat 660
tggctggcga agaactgttg caaaccacgs ccagccgtag gggcgtaaaa tttgaatcca 720
ctgtttaaat ttcaaatttc aaacctcgac ggagtttcct ttagcttttc agatgggcgc 780
agaacg'gtta ggaaactgtc ccgtcgcccg aatttgaatt taaaaaataa atcaaaacgc 840
tagagcttcg attagtatgg gcttttttca ctcttctgtc caMtctttt tgttttttac 900
ctcatgcaag gcggtcggct aaagtgactt acagggagga atattactga gagc犯gagt 960
tttaccacgt tgtaggatct ggag肌atcc aacgatgcta ggcctacgca acgagtgtga 1020
ttcaacgcca gctataatct cattcgtgcc gtcgatcccg ccatccaacg gcgcagacgc 1080
tttgcgtggg aattgtacct tgcctacgat tggaatttga ctggcagctc ttgagctgga 1140
atttacttgt ctgcctgaga aagttgaagc gtaagatgct cgatccaacg atgggcagaa 1200
agtgttcgtg ggcaggaacc aaagccctag ggcgggctcc tccttttatc tatctctctg 1260
gcatatctct tctcagtgtg cccccaggga cgtcttcttc tctccttttg ttcagcgtct 1320
cagtgctcga gggacggttt gccgtctttg tttcttcgtt ctcgttgtag atcatcctta 1380
gcgaag
1386〈210> 6
〈211〉 997
<212〉 画
<213〉 小立碗藓
<400> 6
ttgtgacctc tcctctcgtt atcattacgt agcacgctac gaacaggaca ttctgtttca 60
gcgtctag'gg tctttcattc agcatttaga accaaatcat tgtatagatt tcacccagca 120
taccaagtag ctattgattt gttgtgagtt cagcatgctg ctgtctgatc cgaagattat 180
ttgtaattga ctgttatatt tgagcatttc tgttcaatca tgtggtgtgg gtttgaattt 240
taattagcag gcactgagtt ccgtgacccg a犯ag肌ttt tctgagaata gcc3ggtg3g 300
ttgcttcctc ttttgctgtc ggggat.attt cttccgaaat atgggttatc cagcgctcta 360
tccgcttctg ctctgtgcta tgtg肌catg aatgcaattg atattcttcc aacatccata 420
taactaatgc atacttcata agaaagcaga ccgtcacgga t肌tgggaga犯cattttcc 480
agtcatctcc gtgtccacat ttctctcaca cgctaaccat gttagtaaac cgcaaggact 540
gttatt肌gc犯tg83t3tg tctg朋33tc gtstgtgatc tgttgtc犯3 gtgtc3tsgt 600
acccgtcatc gccgcattgt gcactgctgt cagatccgca gtaaataccc gct犯cgaaa 660
ggaagagaaa gatgagagaa gatgagattg tcaccgggag agaatcagac gcagtcatca 720
gtgatactat tcgacggacc taacctcgtc cgtaaaatgc aagaatttaa cgaggcagta 780
aaatcagctt aaaacctccc cgcacgctta acgtaaccat ggctgtgcta aacatccacc 840
aagagaggaa acaccgcaca tgaacaactc ttctg肌cta cacgtgaagc agagattgag 900
gcgaaaagaa agccacagat cgctgctcct caagtggtga atttattttc ccttggaaca 960aaaatggagg tgtggaggcc肪gcagcaat ttcgatc
<210> 7
<211〉 624
<212〉 DNA
<213> 小立碗藓
997
〈400〉 7
ctcgagtgca gtagacgaca aaatggaagg atgcgaccag ggatgaacgg gaagagtatc 60
attaatgcga gacccttgga gttgaaggcc acgagtggga cagcgatgcc gagaaaaatt 120
tgaaaatcgc tcatcccaga caaaMatct gtgggccagc cagggtttcc cagccagctg 180
ctctgccgtg ccagccgtag atctgctcat ccgacggcca ctgcgcccca tcctggactt 240
gtaccctccg gcatttggaa agtgtcagcc tctccctgac gaaca.tttca cctcggctgc 300
ccggg鄉cc aggagcgtca gatgggagat ctgacggcgg ggcggaggag卿cctg肌c 360
cggcgggcag gggaacgatg tcgttgcttg ttcttctggc tgaggcgtcc atccccttta 420
cctccgctgt gtgtttcaaa ggccgatatc tgcgcttccc ttgcggaccg恥ctctgtcc 480
cgctcgctta cttctctccc accgagcttc cgaggttggg cattcccacc cttccttctc 540
ttctcctctc cttctctgct cttcttctct gttgtctgcg gattaggtct tgtggtcttt 600
cgagcttcgc acagcttgag caag
<210> 8
<211〉 1146
<212> DNA
<213> 小立碗藓
624〈400〉 8
gcgcgcggU ggctgg犯ga卿gtcgaga agcgatgtgc ggcagcggca gcagcaggag 60
gggcaggcag tcag'gtgcag cacgtcgctg gggtgatgcg gagggactU gccggUggc 120
tggggtacag卿cgagggg ta组atagt a卿ttacgc gcggcgg卿gacgcgatgg 180
ccaacgaggt gg已ggggttg gggcggtttt acgtgtacag tatgagsctg acactgacgt 240
tgatcctgcg cgaaccaccg gggctagcgg tagtagatag ttggagcgag agttcgggag 300
cgttgttgcg gataagctcc ggcgtttgac cccagggtgc肌ccgtagtt gcatgggggt 360
ggtgggggga ttgaaattgg aaccggactt ggagttg, agttcgggtt gtttttggag 420
gcagttgaaa gacgttttta agaagtttga gctgttggaa atacattgtt accctgagct 480
taagcagtgt gtagtggcga tgtgtttaat tgtctgattc ctgtatgttg gtgtgtgcga 540
ggcgtgtgag tgcgtggttg tgtgcttgac gtggcggtta tgggccgtgc tgtcgg组g 600
atttactgga ttatttggtc cattggtttc gtggactgga gacggtggat gtttgtagtg 660
cttgtgtgaa caaggcgggc atgcagatga tgggctcgca ataaagacag ggtcatgtcg 720
ggtattgccc卿tgaaagt ctcttttggt gatgccgata cgg肌组gg ,ttggtac 780
agtcgcacgt tcaggcgtca tgggttgcct tgg卿tttg cattgga, g,gttgag 840
ggtgtcctgg atgatgtcca cgaggtggtg tttg组cga tgttgtgcgs犯t卿cctg 900
agcaccgatg tgtgacaccg g组ggtgag tttgtgtcaa tg犯ctgtga gcgttttgat 960
tgaggcagac attccaaggg gatggttttt cggttttgtc ttttaaggct ggcgcctgcc 1020
tagcctcctt tgtccttcag cgcatgtttg cttgtgacgt ttgcgttggg attgttagta 1080
ttggtctgga tggaaatttt atcgtttcta tcggcagcaa ctaagtgcgt cttgtcattc 1140
ccatgg 1146〈210〉 9
<211〉 2973
<212〉 DNA
<213〉 小立碗藓
〈400〉 9
ggatccattc aacggaggat aagtatgtag ggtgatactt aggctcattc attcattcaa 60
ggcgtattta attaactact aaagaaaaaa agggggttaa ttggggtgat tgggttatgg 120
aatgaataaa tgaataaatg ggtccccccc ctccccttcc tttcccttcc ctgcattaca 180
t自t自ta tatatatggc atgcggtgct gagggtgtgc atgtgggggg gggggtgtgt 240
tgagagtgtc aacggtgcca gccacactct ccggacccct tcccattttc ctttcctttc 300
ctgccctgtt ccctgtccct gctcccaccc actttccatg cccttgaaca cttcctgata 360
aaggccctcc atccctccct ttcccttctc aacccattta attctatggc ttaaacatct 420
aaatcattac attcttatgt actaaaattt tatttataga ttgataattt tcttttaatg 化O
aattaagttt gaattttatc tatgttttag ttccacaaga tttgttttat ttattacatg 540
aaacttcaaa agggatttga atatattaaa aatttccatt tataaatgaa tattcgagtg 600
agtttaatta aaattatttt tagcgtatat atatatatat atatagatat ggataaaata 660
caattgaatt aacctaggtt taatttttat aacaatgttg aagtgacctt catgtagtgt 720
gagtgcaagg atgtatttgg atatggatgt acttc肌a犯aaacatgata犯taattgca 780
tagt3tt肌3 gttt^tgc^ ta犯g犯gct ag肌gitgact a犯犯ttatc sca^gcttat 840
taactcacaa acaaatcaat gatatttcat atcaagtgaa actgttaaca aaagaaagaa 900
ttacgtgtat atttcatgat catattcttt tgataattaa tggtagggta acactatgaa 960
61cataaaatta ttgctctcta caatttatca aaagtataat aaaacaaaaa taaaacagaa 1020
atcataattt atgagtctct acagggattc actgtcaaat attgtaagta aagtgtgtac 1080
t3tt犯ttgs ggggattgtg gt3tgccstt ggMt3cgtg g3tc犯幼gc tg肌3C3c朋 1140
g'aattttgaa actcaaaatt acattaaaat gtttgaaaaa taaacacaaa atacaatttc 1200
ttctigaaBaa aaa肌aaBaa accatcgtca ataatgac兆tcaaca犯gt cagcatgcat 1260
gacgagctca ttgtatttcc tccaaaaaaa aaaaaaaaaa gaagaa犯ag tgggccctca 1320
gttei肌tcag ag组gccac atggtgatag gag犯gagcc gatcatsggt gatacgtggt 1380
catggg'atca tcgtttccat gcgcggaaat agatcgaacc cctctcagtg tctgacgggt 1440
caacacgggt gatcgggtgg acccaccctg accagcccaa caaaacgcag ggaggaagag 1500
gtggcaagta agtaagtccc acgtggattc gagac犯aac gttgtacgaa taatatacga 1560
agtgagaaaa aaccacagag cgggtggcag tcacgaagtc gcagacac朋eiccgggctgc 1620
ttgacacggc gacccgttcc ctgttctgcc gcccgttccg tcgccatctt tgtctcattc 1680
gcacaaggtt ccttttccag tgccttctgc gcgggtccca ccctctccat ctgacccggc 1740
ccgggct肌c ccgttccgga gcagatgatg atcgacccgt ctcgcaggct ccttttgtgc 1800
accgcgtggc ttcgtgattg ggccattgtt gctgtttgct gtttgttgct ctgctttctg 1860
tgtccgggcg gcattcctga gaggcgattt g'catgcgcag gctcgttgta gagcagcagc 1920
agcgctgagg gtctcgtcta ggcttagtct gcttctatcc ttcgctgctg tcgcctctgc 1980
ttcatcgtcg ccgtctcttc tcaggttaga gcactttcaa gtgttggcca ggactgagta 2040
taggaaggag ggtttattta tttatttatt tatttattta tttttctgtt atttttattg 2100
ctggctgatg tccatcttcc gacgcgatcg tcgttttttt ttttttgttt gtttgtttca 2160
ttgtgttgga gg郞tgtaag atttaatcgg atgcataggt tgtgtgtttt gcatgcgttt 2220
agagcgttta catgtgcgat gcacgagctc tggtgtcgtt tagaggccac tgatttagta 2280gtttcttgtg cg娜g卿t t卿tcttgt
gCgatggCgt tttat犯tt3 3C3t3t兆tt
at哪U3gg tacggatcgg gcgattgtgg ttctcttcta ttgcgattgg ccagttctta g33C8aBtta肌ctcstcg3 ctgaMtttt gaaaatttga ttgatagtga ttgtttagtt attctgaatt肌tctcaatg tattttgacs c肌ttcgatt gagtattgcc tgcagatttt aacttgsctt cctgtggatt tt3朋c恥ta ctccatttct tctaatcgct atttccgaag ctgtcctgat tgcgagacat gttttacgac ttctgaaatg gttgggcagg tcggtattaa
<210〉 10
<211〉 1128
<212〉 DNA
<213> 小立碗藓
accgcaagat gttgctccgg ggttgtggtg 2340
caatggtgat gatttaatta gcagtggtgc 2400
atccggactc gtgttcaaca ataggctgga 2460
catgcaatcg ggtacacgat cgctgaagta 2520
gccgtctcct g朋ctgtcga aatagsgctt 2580
ctctgcgaaa tcgttctaca taatctttaa 2640
tcagctgatc gcttgtccgc tcgctcagtt 2700
tcagaaaaat ttaagtaatt tgatagtaag 2760
tagcatatga agtgccaggt tttctgaatc 2820
acttctatac agtatggagg gcgttctgta 2880
gaaaatttac tgctccttag aactaaaatc 2940
gaa 2973
〈400〉 10
agcagtgcga cacatctttt gcttttttca cgattgctaa cgtttgtggc caccgaatta atgttgcaga aagcttttgt ttgt犯a肌t atataattca gtgccattcs cattatttgt
gcacgtctct tagctcggct tattgaactt 60
ggcctgctag cgtagatcaa ttagaggtcc 120
兆ctgatatc tggacgcata cgactggctg 180
t肌caggtcc agggttgttt gtagagtcgg 2403cagratttc tcgtcggaat gttggcgccg UUgtgs犯tgadaggtgEL ttatgggtaa 300aatgcataca tagtcctgtt gactatggct gagtggataa gatatatttc catcacaggt 360tagatttcct gcggagtgtg aactgtgacg taaaatcaca gagtgcgtcg tctteigccct 420agcccccgaa tcatccttta cgatggatgc atgttcggat gttataattt gatttttttt 480ttttttcgtt gtttacggat ttttgaccag tttaccattt gttgtttcag ttgtgatggt 540ttggttctgc gtagataagt ttgagttgag tatatttcgt gagacgtcct acgccactgg 600atatgtatcg ctg'aagcaga atactgagta ttgtaattgt atgttccaga cgtttcagta 660gttagtgaca gtggaatgaa gcaacttggt ttttctcttc tatggtcttg ccaatcgttt 720 ccgtcgcgag attgagcgta cctggtcaag ttgtgttatt ggtgagctca atgtgcttgt 780gattggtcaa tttccatata taagtgaagc gccattttca aggagacaag gagctctatt 840ctaggcattc accagtcctc ggctccaggg gcactcggga gatgaggtca agtctcattg 900ctagagtcgg ttggtgacca ctctgaggtg gct.cattact tgggatatat tccatggcga %0ggtttggttt tgcatgctat cgacg^gcg gct兆aeictc tggga3tct3 att3ttttgt 1020ctaatccgtt gcaggacgat cagccgtgaa acagatacct atattttaag组gtttatt 1080cttgtgtgcc atgtgtttgt tattgaagaa taatcttcgg tgacggtg1128<210〉 11 <21〗〉3035〈212〉 函<213〉 小立碗藓〈400〉 11c卿atcggt ctgtaagccc tgtatttggc atggaatatc ttttaacaaa gaagatcca力 6064cttttagttt ctcataatgt tgaacaacgt acttaaggat ttagaaagtg tgtttcgttg 120cttctcttgt tagaatggcg ttatgagcct gtgctgtgtt cttcttttta gctggatgaa 180ctgtacaatg tttcacaact gtagcctagt tgatcgtgca tatttgcgtc atgactcccg 240gcaagttgat gtgttttttt cttgcttttg犯tcccttca acctgtattt ggtggctcgg 300acagtaactg ctacgatata cgtcagtctt tagtaagtaa tatgttcctt tttctctcgc 360ctcacgtatg tcatatttcc tgagatagtt ttttaatttt cgctctgtgg tttcttgtag 420tcctttcact gcgtgccgct atcacagctt ggtcatagag gaggccacat ttccagcgga 480ccaacttgag gttacagcat g'g'actgagga cgggcttgtg atgggagtcc gtcacaaagt 540ctacaagcac attcaaggag tgcaatttca tcctgagagc atccgaactc aaaacgggat 600gcagatcgtc gga肌ctttc ttaagatttt agatagaaag gagacggctg acaagaagga 660gttgaaacac a犯ttttgga gagtgtttga gtgatgagtg atactgggat ccttttttat 720gggaaagatt gccagcagca gtaagcttgc ttttgttaga ttcctctccc tacagcgtgt 780acctcctcga atatgcactc aagcaagcct agaggttgct gctatagatt tctxggtaag 840acagggtatt attgaggcat tttttgcgct tcc卿tgga gctactacca c卿tatcta 900tcctattatt atctttaact tcgatggatt tgccatgatc actgaggtac gtcgaagttg %0tgattggact tgtagtgatc acttcc卿g cgagctatca犯ctggtgcc tagaggagca 1020acgcaaggag tgctgaatta ttctaatgat ctcatttagc ctaagttttc cgtcaaacat 1080agtgatgttt tteuagttcat ctcgttagtg犯acatctcEL犯g3aggt3c 3ccstt朋3t 1140tattgcaggg gttgtgatga ctttatttaa tagttgacct cttcaattga g已acgcgttg 1200ct:ctccttt.t gtatagtttc aatcatatca aagctctatt tgttctctgt accttaagcc 1260ttgtgtaagg cattta犯ta atxtcttcca cgattaagat ggtagttatg tcgccggttg 1320caacttccaa gatgtcctaa tgctatagtt ctcattcaca actcaggagg tttgttgttt 1380tatgtttttg aaagtgacga agg犯attgt ttacttttcg ctttgtgtct gtgtatttta 1440gaatagtacc ttaacttctt acacaatggt gtctaatttg ttattcttgt gtatcacgag 1500cgttaatcgg tttggacgtc ggaccctttt aaccaatctc aattgcttct gttctaatcc 1560acgcgtccca cgsatggcag gtc犯atacc gattattgcc cgactct組cgtgacagtc 1620actgagacta ataacgggag gtcactatct tgtgacgttc tcgttatttt aaaatctgta 1680taatggcaat ccctttctgc accacggcga actcatgatg attcttatcg agtcctgctc 1740accaacttta tcacaagacc ctacggatct aactatgatg accaaaagct tgttctacg'c 1800atgcatgagt cccttcgttt gggagatttt agaattctta ggaactcaca cgttgtccat 1860aaattttaac caccgggcaa cataggatgt tgacatgtag tcacaaattt agaaaaaccg 1920acttcaa朋g gttgcccacg tagacaaaac aactcg肌cg cagaaatcca ggcgaccggt 1980gaaattgg論cattcacaac aaagcgag肌gaggttc論a aaaaccgcag agtaaaccct 2040atgcgccaga ggggaatggg agatccacgg gattcggaga tgaaaaggca tcgcgcgagt 2100aa犯acaaag agtgcgggga gcaagggcat ccagaagagt ttcactgaga tctacagtgt 2160aactcagaaa gggagccact ggtacaaatg ccagctttgc aacgcag犯c gaacgcggga 2220gagctaacag atccgggctc aaaatctcct tcttctacct ctcaagccgt ccacaaccct 2280cattctccat tctcgcacta ttctcctcaa accagttgca tctgcggttc cctccatctc 2340caaccctacg gctttcgtgc gagcttattt gttgcctata ctaaggttaa acccactcac 2400tttgttgcct atactttgct ttgctatttg gttgctttcg tcttcgcttt tgttctttgg 2460tttatctcaa gtgcacertgt tctcgcgacg ctgtgccgct gtaggggctg gtgggcttat 2520,cctgagc accgaggcgt gggtttgctt cgactggctg tggttgttag c卿gtgttc 2580tcgt訊ggta gttgtgttca gagct,tc ttgtgacggt gatgcg犯aa atgcgttcat 2640cagagttaag tgatagaggg gcttttcgtg柳tctgctt ctgtgatgga tctgctgtga 2700aagcggtccg cgttctcctt tatcttcagc tctgtgtctg atgtttggga aatgcatcct 2760ttggatacgg tgcgattcag gctgtatatt gaatccccga gttttggaaa tctttatgac 2820ctcacttaat ccgaaagcta atgggctgta ttgagtgagg ctaatacaca tctctccata 2880ccg'cg'cttcg gtttcgactc gtcttaccga ccacattgat tcacatgcgg agacatcagt 2940gttggatcac ttacagtctg acctaaatag cacgtgtgct acacatagtt tcaatgccag 3000taacagtctt ttgatgtgca gagtatttct tctcc 3035<210〉 12<211〉 1221<212〉 廳〈213〉 小立碗藓<400〉 12gctagtgcat acctgtctcc tgaaatgcta tcacaccttg tcaggtgggg ttatggagtt 60tatttgtagt agctaagcsg ctcgaagagg ccagtgagag actgattttt caggggttgc 120aagggaatgg ttactcgagt aaagagccag cgctgtcgag accttcttgg tgcaattcca 180tctttgaaag tatgcatcac aagttagatt cgtggctttt gagcttgtcc tcattatttt 240gcctaccatt tatgtttttg tggatttagc atccgcggcg tttaagtttt tgttttaaca 300ttctttcttg taggttcgga tagaatgttg gggacatttt atgcttgaag agcgtcttgc 犯Oactgtcggac tgtaatgcaa tgcttgtgga cctcagcctg gcctgcaata cttgtatatt 420cgtgaaaaca atcatagcga ctctgtgtta ttcttcccat gtcattcact ggctctcgaa 480ctttgtcgaa tacatctgat gggcacgcgt gcag犯gccg ttctttaacc tcgatgggat 540ggattagtac gatttgctgt catttaaaac tatttgctat ccgtatttgt cttctgttcg 600gaaatttgtg tagcttgtta ttttatggta tgttgtagga aatcagcttt ggtgagaaat 660ttgtttcata acgacacaat ggaatgatga attaaattgt tgccagacca atatcgtatg 720tgtcaatctg attcctcaat gcagatatgg ttgtggagcg tctgctgtac ctccttgttt 780taaccgccgt atctgaacca actcgaacgt 3gtttgaaaa atgcactaaa tgstgcatat 840tcaatcggtc aagtcatatt aaacacgcgg ttttgaaagg tagcaggtgt atataatata 900aacatgtata tcgcaaaggc ccattcctga cattggatgg tgct肌ttaa gatctaatga %0accgttcctg gcaatgtatc tatcaagcaa actgaagaca caatgaatcg ttgagtgtat 1020gtagaaacac肌aacgatct tgtatttcct tttcatgtgc cagagtgagc ctcatcgatg 1080tacactgata ggactcaact ttgatatttt ttgaagattc ttatgcctga ataaggtact 1140tggaatcata gttctttgtc tcatggctta acttgattaa gatttgggga tttggaacct 1200ttgtaaggag gcaatgaatt c 1221<210〉 13 <211〉 3060 <212> DNA <213> 小立碗藓<220〉<221〉 misc—特征<222〉 (1).. (2301)<223〉 a, t, g或c<400〉 1368agactctact aattgacaag tatgtgacta caaaaggcca caagactctc tctgcactat 60aactataagg ctcatatttt ttgtccatgt agcttgtata tatatatata tatatatata 120tgtatsttta aatca^3t3 ttttt3ttc3 3^ac^肌t ax;犯ta^^ scc犯肌^t 180attttaaaaa taaataaaaa attattaata cttttatgaa gctattattc aaatttattt 240ttaatttcta atttaagatt tattattttt tcttaaattt attaaacttt ggaatttatt 300ttt33朋tM 3t犯c33t33 33t犯ttt3t 3gtgttttt3 ttg3t3兆t3 333tt^g3g 360ctaaatttgg atcattatta ca犯gttata stacttaaat attt3ttgag 3tal3ttt犯 420;attt朋ttaa tattttttat taagttatat atatatatsit atacacatat tatga肌tta 480tttaaaagaa gttagtagac ttttaaatat tttttaccat gttttaattc tagtacaatg 540tatttaaatt atcttattaa gttatggaaa agaagttagt aggttattaa atgttttgtt 600agattggttg taaaggtttt atgataatct tgtatgataa ggttgtttag catagtttat 服0tttgcttaat ta肌aaaaat tacatcttgt tacatttaaa tttaaaaaat acatactaUi 720cacatatctg tatttagatt gcttttacaa tttttatctt tttgtttttt gcatatttca 780aagaaagccc agcatgtgta taataatttg tataaccctt agaaattaat aatatttaag 840tema.taatnc ttatttat犯ataaattact gtttggtttt taatncaaga attta肌a印 900ccc犯ttgtt tattccaaag taatagtagc ncattaat^ aaatccttca訊a3tg3aac 960t3肌ca犯cc犯tgC3tctc s犯tga犯ag gag肌g犯tg atctt3ca1:a gacanccaca 1020aggagggac已tgac已actta attagactat gggtttagga acatcaacca ttccctacta 1080ccaaaaaagc Uacatgatt ttaaataaca caatattcct tgtgactttt gtgcattettt 1140gaggatatcc atctatctag attttggaca atgttttact gccc肌attt caataagaac 1200cattcacata ttttgaaaca catttgatac actctacatt catgtctaga gtatagggac 1260ttgggtttaa gattagggtt tcagattagg gcttgcaggg ttacagtt犯卿ttaggat 1320taaagattta gatggagtct tggttcagag agaaaaaagg atttggggta aagtttttat 1380g朋agagaM catcgcccaa ac犯gtagcg ggactgctga atgccttttg caatg犯tga 1440aaatttatca acgtccgtca atatgtacaa gaccatcaca taatggcccc cctgaccaca 1500atttgaaaaa cacacacttc ctgcctggaa ccagtaatac aagtcattgt aggggagaga 1560gagagaggga gagagagctg tagctgcgta taataagggc ctcgcagatt cagtgctacg 1620tcgtatggat acaccgtatc acttctggtg tacaggttac taaatactac tcgacacggg 1680gcgggccgat ctgcggaacg cgccggggcc atgtcccagg gccctaggcc cgccatattt 1740ctctcgtcca cccgggccta cgc犯acttt cccttctcac tttcccagct cacgctctct 1800gttcaacg'ca caacaacgcg tagccgagac gggttcggag cac肌agtca cccagcccgg 1860cccgacccgt gcccgtctgg cgcctatctc tctccgcctc tgggcccgtt tcgctcctgt 1920ccttgtgtgc tctgtctggc ccttcaccgc gcttcattgc ttcttcgacc gagagcctct 1980tagctccgtc ttgttcacca ctgccgcggc actccgaccc cttgcatact ctcttctgcg 2040gtgcctgctt ctccccatct cctgceitcgg tgccctgttg tgtttttttt taaaggtcag 2100tccctctatc acgtcagtgt ttcgcatttc cgtgaagtgc tcagggtttt ttttgctgcg 2160aactgtcggt ggagatgtgc tttUgtcgt gtttgatgtg tgtgcggtgc agcgatggtg 2220ggtttcttgg aggaggaggg卿gtcttat tttagtcttg ttgcccggtg tgctcggggc 2280gcg组gtgg gtttatggta ncgcacaggt ctgcgtttgc gatatgtgtg tagaaccctg 2340tgccgagcga tcatcataat agtagtttct cgtttcggag gggctgggct tgtcaagtgg 2400肌cgcag兆t cgtagttttg agagttccag acgcgcatcg cgcagctgta gtgagatgta 2460gcttctcggt gtgUtagtc aaggtttcgc ttttccgatc tcggatcatg tttacgtccg 2520tcctttaagc tggatctctt gttctttaca gaacttgttc atcgccctga ctaagttgct 2580ccagtgttgg tctgaagacg acaagcctct ttctttcttg aatagtaaga agagg犯ttt 2640aatctgaagg cttgttttgt acagtagttg gtcgtttatt ctttgatgtt taacttagcg 2700tttcgttgta cttctactaa tgtactcttt agcttggtcc gaggctatta tttaatgagt 2760catgccctga agtcgggaac agcgggttgc acctacaatc atatggatat gaggattcgg 2820gtcgagtatt aacttgtagt. cctttgttca ttgtttttga ttgcggggtt tagctggtgc 2880aactgcctga atagcacgca ctgctttccc tgcgttcgaa tcgtcatcaa cattactatt 2940g'tgttaatcca catggctaca gctgctgtaa ggttctgcgt c犯gggcgtt cttc船gaaa 3000taacctatgt cttccttgaa attaaatatt ggtggttgtt gtgcaggtcc gtattaaata 3060<210〉 14<211〉 4124<212〉 DNA〈213〉 小立碗藓〈400〉 14attgtccatg tgcactacta aacatttttc agcacactcc cttccccggg attgagctct 60tgctgtgtag aactctcgtt gcaagtatca gtgattgcag actttgactg gtgagcacag 120attcaacaga ggtttatttc gcagatgact atggtttgta a犯atagcag atatctgggc 180tcaattctaa cggctggtat atgtcagtac ctataaactt aactgtttgt agctctagat 240cggtgtggta aagtccggta ccaattcttg tcccttttcg tattaaataa agggtatttt 300atttxatata tcgtcttttc cttttgtcat cacatctcta tcctgtgcat atcatggttg 360tattctcagt cgtaatggtc tttcaagtgg aatgatggct ttgatgatgt gcscctggtt 420gtgtctctgg gcgtcatggg cttcacatga gctgcggtta cagatcacgt ccagcctcac 480acaattaact aggcatgctt tccatttcct tctgacgtaa atgacaggct ctgacaacaa 540tgcctggcac ttcctgacgt gggacccgtc gattggtgcc gaagtcgagc aaaattctaa 600 cctccacaac tggtatcgtg aatattctag cctcttcctg agaacagtgc cggtcgatct t360 cgaattacct cgtaatagtc gtcaggcatg tatgtatgtt taaaaatact ccatgcggct 720 aaattatttt ttaaaattta tctttggatt tgaaatgaat ttctaccttt ttttacttta 了80 ag'ttacgagc tgcgattcca actaatgaag ttttacatac taatcagaag aatgtcgttt 840 tttgaaatta acaggttaag tgttttgaag aatta犯gtei tgatgattcg tcttttttat 900 atcaaatgag ttttgaatga ttcgtcgttg cattttttaa atcttgg犯t gaattgcgtg 960tatgtgacgt gtatggaaag atacaaatct catgtagtcg agtacaaga_c aattacacct 1020cttatgttta tggttcattt gtacatagtc tacgttagct t犯ggtcatc gtgtgtgagt 1080atagtatatc tcattaccta atttgaagtc cagtaaatgt tagttatgtt accatcgacc 1140agttatcacc gatgttgctg ag犯gc朋tg tgaatcttag gaaacgagtg atatttgaac 1200tggatattaa ttcatccgta atctataaac agacatgctc tactagcgtt aaaacataag 1260ctacagcaca aa^tgatcta犯aa犯tgtc atcaatcata兆ctgtgtst aMacatccc 1320atg'aatatca acagtatgag tttgggtgtt tgtgcacacg taaaaacgaa ccctcgaatc 1380gaaatgtgta ttactgaatt cacatgcaaa tgaattgttt ggatcattta ctgattaggt 1440ctgtactcta ttaatgaaac atataataga tttaagactg tccagtcagt tttgaattaa 1500gccttgggat ttgtggtctc ttcctcttcg gccactaaaa gtttaattca cattgatgtg 1560aaagaaaaag tcacaactca gccttcgctg tgttagaaaa gctgcacgtg tgaggacttc 1620tcaggcagcc tttccttttt cagttgagtg tcgaagtagg agcacacgtc gtcggtaacc 1680ggctacagga ggtgtgcact gtccctttac cggatgtggg aagtcaccct atcctgagta 1740tggctcacac ccaacgttgc tactccatcg cacagacagt tccacatgat agactgctcc 1800gcgagaagcg tcactctcgt gcggtctcac ggcttctgtt gcggccgatt cagtgcaggg 1860agtcgttttc gagcttgcga agtggctctc ttgtcattcc cctgcttctt ccggcggcca 1920
ttttgatgca g组tgcgaa ttctgcagaa tatgttgaga actcgtcttg ggggttttcg 1980
gatgaggagc taaaacccta gagggacgga caattctgtg gagcttgctt gtaatcctgc 2040
3gtac朋tag a3t3at3gag cgacstgtcg acgctttcg3 ctcstgctcg cgtgtcgtcs 2100
ctgtcatcag tgtcgacagc gtcgaatgtg gtggcaaatg tggctgtgag gccgtgtatg 2160
atagtatctc ttctgccggt tgcgagaggg ttgtgctcta ggaaggggtt gatgtcgcgt 2220
ggacctctcc gaagacattc ttgtatgaag agtgtttcag taatgccgag agcttctctc 2280
ggtcaactgc ctgaccctga acaggtggac ttgtacatta atgcgttgtc ccagacgccg 2340
ggicgccctgc agggattgct ttcgcggacc gaggggctct ttttcacatt ggcggatgtt 2400
gctgtggcga ctgatcccag ccaggtcacc gacgctgtag tgcagaaaca ggacggaggc 2460
tggcttggag gtgtctcgaa ttctcttgag atagctctta ccgtaagctc tttttatttt 2520
tatttttata tatttttgtt tcttttttga actgtgaatt gtgtatattg ttttcctctg 2580
aaattttctt tcagaatcta ggtggtaaaa cattctgata cttatgctta ttgcacggtt 2640
tatctaattt actaagattt agtgtgaatg tgatgatata attttactaa aatttaagat 2700
ttttctaaaa tttaattgca gctagtgtta tctttcgagt cgatgctaaa acattcctgt 2760
tgacacgatg atcatg犯ag ttagatgtgg cttaataaca aalgcaggaa ttaatgaatt 2820
ttatttattt atttattttt gcagtttttg aaggatacca ttgctaagct aggcatacct 2880
tattcgtatg gtttcgcaat tattctttta actattttag tgaaggcagc tacttatcct 2940
cttacaaaaa agcaggtttg ttgttctact gattttctta ttttgtgctt tctttctttc 3000
actttttgcg tacaaatcat ttttgtgata tactaattta ttgtgt肌aa ctaeiaagaat 3060
tactatattt ttcagctaaa tatctgtcga tgtcctgtat ttactcataa gttttatggg 3120
tttaagatag tacccagaca ggactgagtt ccattggtag gtcagtactc ctgttagatt 3180agggaggctt ctattgttgt atatctaatt gaaagtggtt atgtttaaca ggtagaatca 3240
actttagcta tgcaaaactt acaacctaag ataaaagcta ttcagactcg ctstcagggg 3300
gatcaagagc gcattcaatt agagactgca agattgtata agcaggctgg agtcaaccct 3360
ctcgcaggtg caattttgtx gaagtcctcg aagcattaat gttaagaatg cttgcagatc 3420
actttccggt ttttgacgga cacaaaatac agtcgaaggg actaatactc aataacttgg 3480
ttctgtatgg tagctcataa gggttgtggt ttatgatttt acagggtgtc tgcctactct 3540
cgcaacccta ccagtatgga ttggattgta tcgtgctcta tcaaatgttg ctaatgaggt 3600
attgcatcat gaactggagt gcttgaaaca gttgtccttg tgcggcatgt tgttccacct 3660
tagtttattg tg肌acatag gcgtcattag ac组ccaca tttagagtaa tacaggaagg 3720
tcttaccata tattcatttc aaagaggttc aacagacatc gtaatgcaaa gttctgtaca 3780
ttttctcttg acttcaacgg gagaatatct attcttaaat gagatatttt ctgtggtact 3840
ggtattcaag tatgaatgta tgtaactatg atttacttat gcagttctgg ctttgcaggg 3900
gctcttgact gaggggttct tctggattcc atccttggca ggccctacaa cgattgctgc 3960
tcgttccagt gggagtggca tttcgtggct atttcccttt gtggttagtt agtcccttca 4020
gatgcttgtc ttcgttattt tttttccata tcaaatgt犯tgatgctggt catacagtaa 4080
catatagtga atttgttgat caa组ggtt gtccatggaa gctt 4124
<210〉 15 <211〉 3053 <212〉 DNA 〈213〉 小立碗藓
<400> 15ttgttgaatc atgttaattg ccaatggtta tt肌tgacca tcatattgta cctggaatgc 60
attggaaaag taatgttcca ctaaataaaa gttgatccac caaatattgt tgtctagtca 120
tatcgacaaa tagattcaaa ataaattaaa attaaaattg aaaatgtata aacattggca 180
tg'肌船tg8t 8tt犯ttt犯aa_ca_3ttC£L£i 3acttELt8C3 att3ttt3^ 3t^LC3tt兆t 240
caccgggtta aaggagacag actgacag肌ttggattgcg gcaatcagta gcactgcaca 300
aata犯ttta acatg;a犯ac attatgattg ctaatactct gtttgcatgc acttctacaa 360
caacaaaaac aaaaaataca atcaaacaaa acaagcaaac aataaatgat tttagatttt 420
gcatgataca agcaccagag ataattatga cc3tgtgata aatacaattt ggaccattta 480
tstcctacaa a^m3g犯a 3肌g肌aB8a g肌肌gtttt tgtttgtatt tgatstcttt 540
attttgttac caaaattaga taattgcaag ccttgtattg tctgaga_tgg aatgtatatg 600
ta3c;ac3ttt gagcaa肌M ttgL犯tta^1 ttaaa_tt^a_ t幼gattttt ttiatststa^g 660
taaattgtaa aattgaccca aacatttact aaatcaaccc acccattcta accatcataa 720
gaagaattcc gctatc論at ccaggttggt tgaaaaccaa tgaa犯aatg gttggcttct 780
caaccaatga taatggatgg gttaatttaa taaattcatg ggtcaattta aaaattccat 840
3tatat肌tt肌犯atcaat tgc犯aa^at 3ttttgacac aatcsc3cgt gttttg朋aa 900
tcatacatgg acaaaaatac aaagagattt tttaaccaat attttggaaa cacatttagc 恥0
aaggtgtcca atgcccttcg atacccacaa g犯cacacct tactttgccc atatttaccg 1020
atatatgctg cagtcagtta gggttgaatc cctgagggag gggggctccc gtgtgaacaa 1080
agtcc犯tgt ggggccgccc aggattaggg caccaggtgt geiacgaggct ccacccgagc 1140
g;agagccagg aatttgaaac tggcatggga犯gggggttg gttccacctg atggcacctg 1200
cccaccacca ctagtaaaga ttcaatgccc accacactgg tttttgaata taggatcttc 1260
cttctccttc taattcttct cttgatggat gaat犯tata accgatg犯t gagtgggcac 1320atggacgggc ctcgccccct ctctactctc tgcaatacat tacaaaatac atacatgtat 1380
acatagggat ttgatgactt caatacatac acactacaaa accgggtcag gaggggggta 1440
taaccaggca agcccgagtg gcgggcagta acaaatacac acccccaaat cgtatgggcc 1500
ggacacgtct gagcgacacg cgggtgccct gccctcctgc cccttccctc gccccttttc 1560
tctcgaccgc ctgtcgccgg cccggcccag actcctgcca acctgggaac caacccccct 1620
ttttggtgag tgctcttcac ttccctcgca ctcgctgctc aagttgaggg agggagggag 1680
taggagtagt cactcacccg gcctggcccg gtccggttcc ggtccgcggg ggctgcgttg 1740
cgcgacccgt tctcgtgggg ttatctctgg ttctctatcg ctcgctcttg tgcatcgtac 1800
tgctcctact ttttcccatt gttgctatgc tcgctgccct gcgctgcttg gccgtccgtt 1860
gtgcccctcg ctcgtcaacc aagcactgca gttcgctccc gcattccttt ctgcagcacg 1920
gtgtatctct ctctctctct ctctctctcc tcatctgttt agcgctggtg ccggttctct 1980
taaggtgaga gcttctgttc tatcggtgtt ctcggttttg gtatgtgtgg tgaccgacga 2040
tcggtttgtt gtgcacggtc gctggatgta tggtcgtctt tgttcttgtt tagttctgtg 2100
tggcg'attaa cgtgttcttg gaggagtatt tttggccttt gtctgctgat gcgctcagca 2160
gcgttgcgtt agtgtaggct tgtgcttcac atgagcgtgc cgcgcgtcta ggcgtggtgt 2220
ttgagttgaa tcttttgccg aatgactata gttattgatt tcttgttatc tgaagatctt 2280
gtgctgagat atgtggtgta gggattcgag aagtgctatc cccttgttgt gatgaacagt 2340
tttcatttga tgtggttatc atactttgga gccttgcatt ccgg'atcgtc attagcttca 2400
tctacgtggc tggatttttc cgtcaaccgt aggctgaagt gccttaaggg gttacatgtg 2柳
ctgagttgac tacatgt犯c aatggcatgc aaactgattg cgtgcacttc atacttgtat 2520
tcagttcgtt gtagagtccg ggatatatgt taggt已gaat aaagaatctt atctctcggc 2580
attcgaataa aaatttcatc ctttttgaat gcaccttgtt tgaaaggtcg ccccatgccc 2640
76acggttgact gagaacaatg tctgcgcatc agttactgat ggtcgcacct gttgtcacta 2700
atttgagtga ttaaggtttc ctaccggctt tttcttttcc actgatttag tttattcttc 2760
atcaagttta caaatattgc tctgtatatc acggtttttg ttagtctttg atgtaatcat 2820
attacctggg tttfittatct agtgaactst gactgatatg ctggcgcata ttctcctsct 2880
taatttgacc ttattagaag atgttcgtac ttagagtacc ttttactt論tgtaactgaa 2940
tctatcattg ctttcgttct taatcgtgct acaaaattta actcattctc tcgttaacta 3000
atgtttttga gcacttgcac tgtttttgaa ctcctgtagg atcattctaa aaa 3053
〈210〉 16
<211〉 1879
<212〉 DNA
〈213〉 小立碗藓
<400〉 16
atctgtactg cacagtttta catttttcag gcttgcattt tgctgggatt gagttcttgt 60
tttgatag犯ctctggacgc aaatgtcttt gactgcttag ttgggctggc gagcacacag 120
taagaagtgg tacatgttgc cgaaactatg gatttgtaaa aatgaaacgt atctgggcgc 180
ataacgaact gcttatatat gtcgctgtct gttaacttca atctctacat gtccagatcg 240
atgcggtaga acccgaccat tttttgatcg atgtttgaac ctttttatgt taaataaaag 300
gtaccatgtt ttcagcgcat taatcatatt tattttggtc actatggact tgatgtacac 360
cggatgttac agctcagttc tacttcacag ttattcactg acttgccctg aaaaagtcgg 420
agtgc柳tc tcgttgtgtt Uggtaatct ggttggccag tctcagagct ctatUUtg 480
atgaatccag ttgattggca ctcaatgttt ttttttattt tttactttta tcatagtgtc 540
77aaggttgcta cgccaggaat gctgtgaggc acattctacc cgtatgaatt tcctcgttcg 600
caatagctgc aagctcaatt taggtttttc tgagcaagtt gtagaactat cgtgtactct 660
caccagattt cagcctctca gtgctgagtg ctttcgtcac gttaactaat tgtggaagat 720
ttggaatcat ggttgcatcc cttagtttga cagaattcac agtcgttagt tgacctctct 780
atcttggtcc accatatgtc幼cctgttca agagggctgt gctcggttag gtaatcactc 840
agaagtttct tcctacagaa aacttgtttt gtgggcatca tctacgtgga agaattgttt 900
gagcattaaa tcattcaaca ccttcagtta catgaagtag gttggaagca gtgccttgaa 960
gagatccttc acagaaagcc tctcaattct catgaagtct gcatctaact tcttttgaag 1020
tttgtacacg tgtgggcaga attgaagttg gttttgtgtt gtttg犯aca actgtaattt 1080
aataaatccc aaacaagact aaggccatct aacgttttca catgttttaa aaaattacat 1140
tgaactttgg gctaccgtag ttttagacag atgcaatt犯aaata肌aag aaaa犯atga 1200
aaagaaaaaa gtcttgtttg ttttagttgt ctgttttgta cagttttgtg' acctatttta 1260
gagtgtcatg tatcgaacat ttgactcaca attataaggt tttatatttt aaatgagtct 1320
tgttgtcttt tattttattt tgttctacat tctgtaatat taaaacttct attgaaaaca 1380
caacaaacat ttaatttcaa gtttttcaaa tttatatatg catattttgt atgtaaattg 1440
tacaaatgtt cataatgcaa attgaaatat ttaatgtaag attatagcac ttaaacctga 1500
tccda肌gat肌taattttg ggc肌ataat taa犯ttatg 3t邓eicaaag ttteig^tgt 1560
tgtaataaaa atttatggta agtgctaaag tatgtaaaac aaatttcata aagaattgct 1620
tgtagcattt tcaagagaaa aa犯taaata cttacgacta tttttaaaat gacacaaata 1680
gtsaeite^c3 atatattgat gaggatstst Btststaatc 3a^tt犯cc sttsgtgstt 1740
tttaacctgc atagtattaa tgtatgggac cgcaaggtag acacctacct ctactggata 1800
gcacctctca tatacacaat aaaactttta ccttgctaaa agtccaaggg aatttacaaa 1860agaaattctt ttaaaaact 1879
<210〉 17 <2〗1> 1823
<212〉 DNA
<213〉 葫芦藓(Funaria hygrometrica) <400〉 17
ctttcgtgtt gcctcaagag tgcctcgcga agaaagaagg ttccagcaac aactagag肌 60
tgggtacagc attcataaaa ctacagataa ttatccttca aataagtaag aaaaaagaag 120
gaagg犯ttg 3t肪ataagc aagsaattsa gca犯gcsgc cax:tcggct3 gacaaasgag 180
actgcacacg ggtggccaag gaaagcgccg gtcatagggg atatgcggtc atggggtcac 240
tgtttccggc agccggaatc gattgcaccc tcgcagtggc tgacgagtca gaaccgggtg 300
ccaagtggac ccagctcagt cgcgggcagg ccgaggtggc accgaagcct ggtc肌cgtg 360
gaatggatac gaatgtactg gatacgagat acgaatacga tacagtagag aaagaacgcg 420
gcgagggtgg cacgaattcg cagacacaac cgagtcggcc tgac犯ggcg ccccgcctgt 480
tctgccgccc cttccatcac ccgctttgtc tcattcatcc acggctcctt tttagtgtct 540
ctgcgcgggt cccaccccct ctcactggac tcgagatgcc gccctgcgct gcctgactcc 600
acctggcccg gcccgacccg ccccgacccg ttccatggca g'atgttgatc gccccgtctc 660
gcagctcctt ttgtgcaccg cgtggcttcg tacttggcca ttgttgctgt tgctgttgcc 720
ggtgctctgc tctgtcttcg cgaggcactc ttgaggcgat tttttttgta gtagcgcaag 780
ctcgttgtgg agccgcgccc agtaaatcat ctaggcttag tctgtatcca ctaccctccg 840
ctgcgatcac ccctgcttcg ttgtcggcgt ctatttctca ggtt.cgagtg tttctgagtg 900
79ttggcgagga ttgagtgt已g gagcgggagg ggtttgctgt tgtttttgtc gctggcggat 兆0
gtcgatcttt cgacgcgatc gcatttttct tttgattgtt ctgttttgga gaacggaatc 1020
ttttgattgg atatatagat tgtgtgtttt gcatgcgttt agaacgttta cacgggcgat 1080
gcatgagtcc tggtgtcgtt tggaggcc3c ggstttagt3 gtttcttgtg caaggtggct 1140
tagatcttgt actacgagat gtttctccat gattgtggtg gcgatgactt tgtatacttg 1200
acgtgtagtt taatggtgat gattc抓ta tcagtggtgc atgattttgt tacggatcgg 1260
atgatcctgg atccctgatg attctttttc aagtaggttt aattctctgc aagcgcgaac 1320
ggttggtcgt ctcattctaa tggtggcatg atcgcttatt aaattacgtc gactgaattt 1380
tctccgtctc ctgaattgtt ggagtagcgc ctggaaattt gttagatgga gatttttcca 1440
ttatccggga aattattcta ttaattcttt tagactcact cgctcataac gcatattgaa 1500
ataaaccaca gatgattgct tgatcacttei ttcatttgaa tttgacagaa tacttcccct 1560
tcctgtttcg gtgaattaaa ttatttcgat atttagaatt taatttaata ttatttttac 1620
acagtacaac gaatgcaaag tggaggagtt gtcaggacaa ctgaatccct cagtttttct 1680
agtctatatt tctgaagact tccacacaat atagtagacg ttctgtgcta tcctgactgc 1740
aagacaaaat ttacg'acgca aagtaacatc tcctttttta atctgagatc tcttcaaatg 1800
gttgggcagg tccgtattaa gaa
<210> 18
<211> 419
<212〉 DNA
〈213〉 葫芦藓
1823
<400〉 18aggagtgtta cacatctttt acttttttca gcacgcctct tcgctcggct tattgaactt 60
cgattacaaa cttgtgtggg taccg犯cta ggccggctag cgtagatcga gtagaggtcc 120
ttgttgcagg aagttttcgt ttgtaaaaat agctgatatc tggacacata cgagtggctg 180
attggattca gtgacattca cattatttgt taacaggtcc agggttgttc gtagagtctg 240
gccccatttc tcgtcggaat gttggcgccg ttttgtgtga aatgatggtg attatggtta 300
aaatgcatgc gtagtcctgt tgactatggc tgaatggata agatatattt ccatcatagg 360
ttagatttca agcggagcgt gaactgtgac gctcaatcac agaatgcgtc gtcttagcc 419
〈210〉 19
〈211〉 1333
〈212〉 DNA
<213〉 葫卢藓
<400> 19
ggatccgaga ggaaagagag ag犯gaggga gcgactcatc tagccaggcc cggtccggtc 60
ctctgccctg cctggcgcga cccgttctcg tgcctatctg tggttctcta tcgctcttgt 120
gcctcgccct gcacctcctt ttcccattgt tgctgctttc tgccctgtgc tgcttggccg 180
ttcgttgtgc ccctcacctg tacactctcg cagccaagca ctgcagtggc agttcgcctc 240
cgcattcctt tcgtggccgc gtatcccccc cgtcatcttt ttcgtcggtg acagttcttt 300
gaaggttaga gcctctgtcc tgctgccgtt ctcgctgtgc ttgtgttgtg gccgacgatc 360
gggtttgttg tgcaaggtcg ctgtgcgcat cgtcttgttt agtattgtat gtcgattact 420
gtgttgtagg agcagtggct aagctttgtc cgctgatgtg gcacccaacg gcgtcgctca 480
agtgtaggct ttttctttac acgagcttgg tccgcgttta tggtgtttgg atgttacttt 540tttcccgaat gacgatatgt tgtgatttct ttacaacaag agattttgtg acgtgaactg 600
tagtttgtgg attcgaaaag tgttgtttcc tcgtttttga tggacattac ttatgccttt 660
tagttgtcac ggttggtggc tttgcattct tggtcgtcat tagtttcatc cgatgctgga 720
c;dttcgctac catcccaagc tgaagtgctg aagttgattt catatgttca gtttgctgtg 780
tgcaccagta tgagtcaaaa ctgattggat gtccttcaca acttcattct cttcatctta 840
aagtcgagta caaatcaata ggtacaggac tcctatattt tggtgttccg ccatagttat 900
cgtctttcgt caaaattacc ttattgagag gacttttcct tgcaaaggtc tcatcgagac 恥O
caatctctca gagtcagata cctatggtcg cagcaga犯t ctctagtcaa tgtttctaag 1020
ctctcctaag gattttcgct ctttcatcag atgtattcta tccaactcca agttcgcaac 1080
aatttcttca tacatcattg tcttctggtc tttctgttct gatactgcac cgattcattt 1140
taggatctta taatccgtgc ttgatgtgcg gatatgtgaa ttccctgagt gttcacctca 1200
acgtactcaa agttgttcta ctttcagcat ctttcagcca atgcggcaga tgcgatcact 1260
tccgaggact ttaaaattct gtactgtttc tttaaaacgc ctttttcgat tctatgcagg 1320
atcattgt肌gcg'
<210〉 20
<2il〉 3289
<212〉 DNA
〈213〉 葫戶藓
1333
〈400〉 20
atgcatggca aaacatcccc tgtcttccat gatgagaaag gcgaacctgg actgcttgat 60 gg'tcUccca ggtatctcat tgtgcttcgg tagttgttga cgtcttcact tctgcttctt 120tcgcttcctc ttcttcttct tcttcttctt ctttctctct ctctctctct ctctcccaaa 180
ccttccttct gtcttccttc ctcttatttt cctatgtcaa tgaagtttag cacctcctaa 240
aatttttgga tgctgttttt taaatagaag ggacgggatc aaaggacgag tgagtgtcgg 300
cttttgcatt gcttccgttt tataacaacc tattaaggac gtagatcgtg tctgtaaagt 360
catctcttat agccttttat agtcttttta agagagaaga gccacctctg agtttcttat 420
agattcg'gac aagagatgtg acgacttagg aagtgtcttt cggaattttt cttgtgataa 480
tggcgttgca tttcttgtcc tgtcttattt ttaactgaac agtatgtacc atttttccgt 540
atagtcctta ctttataata tgtcctcttt tctttcgcct cacgttcatc atattctttg 600
atatgtacta ttaactttcg ctatctgttt tcttgtagtc ctttcaccgc gtgccgctat 660
cacagcttgg tcatagagga ggcctcattt ccagctgacc aactcgagat tacagcatgg 720
actgaggacg ggcttgtgat gggggttcgt cacaaagtct ac肌gcacat ccaaggagtg 780
caatttcatc ctgagagcat ccggactcaa aatgggatgc agatcgttgg犯attttctc 840
a卿ttttag ata卿a卿ggcggctgac卿gaaggag ctgaaatgaei aattttggag 900
agtgtttgag tgatgagttg tactggtata tcttttcttg tgc卿attg ccagcatttg 960
tcagcttgct tttgttagag tcctgacccc cagcgtataa ctccttgagt atatgcccaa 1020
gcaggcctag atgctgctgc aataaccttc tcggtg,c agggtagttt ttgaggtatt 1080
tttgcacttc cagatggagc tactactaca aatatctatc cttatcttac gttaaactac 1140
gatggaattg ccatgatcac tcaggtacgt ttaagttgtg attggacttt tagtgattac 1200
tttcagagcg agctatc犯a ctggtgcttg gaggagcaac gcaaggaatg ctg组tttt 1260
ctaatgatct aattcagctt aagtttttcg tcaaacttag tgatattttg etagttcatct 1320
cgttagtgaa acatctcaaa gaagtacgcc attaaattat tgcagggctt gtgatgacst 1380
tatttgatag tttacctctt aaactgagaa cgcattgctc tcctttgtat agttccagtc 1440atttgaaagc tctatttgct ctctgtaact t犯gccttgt tcaaggcatt taaattccct 1500
cttccacgat aaaaatggta gttatgttgc tggttggaac tttcaagata ccataacatt 1560
gtggtt.ctca ttcacaacgc aggaagtttg ttgacctata tttttgaaag tggcgagtga 1620
aattgtttac tcatcacttt atgtgtgttt ctagtatgtc acttcaattc cttcctcaac 1680
tg'tgcctaat ttttcatctc tgtgtgtcac gagcgtaatt tggcttagac gttggaacat 1740
tctaaggttc cagtaaccag ttttcattta ttatttttaa attcacagcg cctcaagtaa 賜O
tgaaaggaca aacgccgatc attgcgcaac tctaattgtg acggtcttca agacaact犯 1860
cggcaggtca ctctcttgtg atgttctcgt tgttgtc犯a cctgtat肌t ggcaattcat 1920
ttcgacatca cggca犯ctc atgatggttt ttaacgtgat ttgctcacca cctttcattc 1980
aaagttatca ccgacaccct atgggtttaa ccatgttatc tgaaagcttt ctctacgtat 2040
gtatgaatct gctcattagg gtgaMttgg aacttaaaga atctxacacg atgtccatga 2100
attttgttac tggacaacat atactgttga ccacatagat atgcatgttt agaactgcaa 2160
aaaagtttgt tcacgaagac agaacgjacta gaacgcagaa tacctgcgat cggtggaatg 2220
ggatcatttg cagtaaagct agta犯ggat cgaaatagac gcagagtaaa cccgatgcgt 2280
tagaggggaa tgggagatcc acaggactcg gagagaaaat gcaeiccctgc gggtaaa肌t 2340
agagaacgcg aggaggaagg gtagccagaa gagtttcacc gggatctaca gtataagccg 2400
caaagggagc cacgggtact agtgcc兆ct ttgcagcaga gagcg肌cgc gagggagcga 2460
acagatccgg gccccaaatc cccttcttct atctctcaag ccgtccacag ccttcattct 2520
ccatcctcgc actattctcc tcacagcagt tgcatttgtg gttctctcca tcttcaaccc 2580
ttcgactttg gtgcaagccc gcttgttatc tatcccaagg tttcacgcac tccccccttc 2640
gctgtgtgtt tcgttgcaat atttttggct ttagttttta ggtttataca tagtgcacat 2700
gctctcgcaa aaccgtgccg cttcagggga tcgtggttct gtagacttga gcacagagat 2760gcgggtgaac tcttagtggt cgccgctgca tccccagagt agttatgcta cctaaagaag 2820
cgtgctcgta cggtcgatat gtttagagat ggatatttag acgatggtgc gtgtcctgcg 2880
gtcatcagag taggtgaagg gatttttcgt aagatctgct tttgtgacgg atctgcaatg 2940
caggaggtct gcgtctttct ttttcttcag cttcgtgccc aatgcgtcaa atgcgcaccc 3000
attgcacaga gtgctattaa ggcggcttca tgaagctccc agttttgtga atcatgttaa 3060
cttgtccact gatcagaacg ttcgggctgg catacgtgaa gcgaatacac atttttctac 3120
agcatgttcc ttattttagt cttcstactc actgcttcga ttgccggagg gcctccatgt 3180
tcgaccacat cttcacacgg ggcttatcat ctgacctaaa tcgcacgtgg cctctgtatt 3240
gtgtcaatgc cagtaacagt ctttttgatg cgcagaacat ttcatctcc 3289
<210> 21 <211> 937 <212〉 DNA
<2〗3〉 地钱(Marchantia polymorpha)
<400〉 21
catatgcgta cggagttgtg gtccccgatc aggattcttt gcttcgcttc ctaatgtagg cttcgtttgg acacatacat ctggatcttg g'tattgcgtc atctttgcga ggtaacggcc gactcaagga atcttccctc tcctgctcca tggg'aaatct ttcatcttgt tgaccatcga tctgcatgtg atactagcgc agtcttcatg
gccgtagttg ctgttggtgt ctggtcacag 60
tggccagggg tggatcgtct tcctcctacg 120
agaggaacac gtgaattaga gttacatgcg 180
gcgccgcaga cctagcggtt gcttctgcgc 240
tcactggaat gagagttgca gtctgatctt 300
ctctgtcctc tcgatgaggt ctgggatgat 360
attgtcacat gcatccagat gcgacatctg 420
85gcgcgctttg tgcttggtca tagccgcctt tttccagacg tggacggcag atcggtcata gtttgcgtgg tctacctctg ctggcctgcg taaacattag gctcttcagt tgtctcgctc gtgtgttgct atgtcagccc gtgtagtctc txatgacgg'c acgtatctcg tcgccccgaa tctgcgtcct cgttcatgtt gacatgaatg gttgacatat acattgtgat gctcatgtct tcatcttctt tcattttggt taggtaactt
〈210〉 22
<211〉 3025
<212〉 賺
<213〉 地钱
cttttatctt gatttgccta atgagcccca 480
aggtccaaga gcaggaaatg ctatgaggcc 540
aa犯gactgc ctgtccgact tcaatatctt 600
agaccattat tatgagttat tgttaccgta 660
gtc犯tttct ggagggtaat gcgaacttgt 720
gatcaccctt gttgagaagg atttcatgcg 780
atagaagccg ttctgaagsc acga犯tgtg 840
tttgtcgagt caccaagatc cgcaaccatc 900
cgcgaaa 937
<400〉 22
tcatgatgtt aagcgttttc ataatcc論a ctgaatatgc aagcatcata ttctaaattt tttctttttc tttaaatt犯atttccttca gagtattttc cgactataga tcttagggta ttttttctaa ttttatgaaa agagataaat gaaattcaca ga朋atacca tttttgtctc atggtcatat acttgggata ttttt肌att
gaggttttgt atatagataa aatttacttt 60
aatcgaacat aattttttct gagctttctc 120
ctgcaatttt tttattacga ctcccacgag 180
tataactata tatcacgctx gttctaaaca 240
3tWL^t33 t£Lta_ggtta_t ttagattstt 300
attcgatatg ttctagatgt gtgtgcgtat 360
gtgaatacaa gattataaca aagttatcat 420tgcaaaatac taaagataag ttatctttgg tgagaagaca tgatatacca tctgcatatt 480
acttattcac caattgacca aagatttaca atctaccttg atgaaccata犯tttgagaa 540
ttttatatgc agatatttgc ggatctttcc aatcattatc tagctcttgt ttacattttt 600
gctttcacaa aaatgcaata atgtgaaagt tgatgcaata atc.cctttag gttttttgac 660
tcataacaat tttctctcca aagcattgag attcaatgtg gacgtgatac ataaattcac 720
atcttgatta gttacatata aMgtggaac tgccgtattt gtcggaaagt tcatac犯tt 780
ttttttgttc atttgaagat cat犯gatag ctgcatatat caccattagt gatgatatga 840
tatatgacat gagaaaaata taacttaata tgaaggaagt cttgatatgc cttgctatcc 900
ctaggttgg'g gtaggtcttt ctttcatttg cgattattat tactgtgagg aatattcggt 960
agaatggatt ccttggaagt gttgtatttt tgacctctca taattaagca cagattaatc 1020
ccttcatttg tggtctatca atcaagtggt ctacgaatga ctctaMttt aagattattt 1080
ttgtagttgt gtg'gtgtttt agtagttacc aatcttatac ttgaaagaaa atgaaagcaa 1140
tgattactca tactactcaa tgccaagatc ggaggctaaa tccaatgtat acaagtatag 1200
aaatttgtaa agagttaagc tctttctttg ttcatgtagc tttgaggctt tgtaaaaata 1260
tggacattga ttcggatala gaggtgagtt gtgcac犯ga gatgaccsta cttggtgtca 1320
aggtgtagca tttttttcag attatttata agaaaataat caggaaagga aaataagtag 1380
tattcatcct agatataaca tttgtcgaga aatctacgag at肌acattt tttcagacga 1440
gaacaattct tcaaattttc agatgcaagg gtacgcattt agcattgcgc tgatatteiga 1500
gctagtctcc tattgcatgt ttgatttcat acatgtacca cccattcttg ttactgcagt 1560
gtgtgaaact tgttgaat肌gaagttccgc aattatttca aattattgag agtcttctta 1620
cataattttt acttatccaa aattcttaag aaccccacaa taaMtcagt gatacgcttt 1680
gaatggctca ccagttactg gactgccaca attcgcagca ttggagactt ggcc犯ctca 1740acc3gsg犯g
ggtgCElgtat
cgg'gtacagt cg柳agttg
aatctgattc agtgtctcag tagcttcttg cagtcccggg tcgtttggga gagg肌tgca
gtgcgagcgg gatccgcatg gggg卿Uc gag,ttcg agcgatattc ccgatcttcc tgtgctccca tgaccatcac gagcagctca ttcttcggac
ggaccacgtc tgtccaagtc aaagttgcca aagtccsagg ctcgaaacct ctgtgaaeigt ttagtctgat cgtataatct agattaatct
aaccagcgga ggggacga犯 cgacggacat
gggttggggc tgag组gcg
attctgtttt gtgcttctgt cgccttcagg 3tcgcttcgt acctccttcg
g犯cgatcta ctggaatgtc
ctcggggcac tgtttcgcca
tcctgtgaat g^ctgttga gcttccgcta cggacgggaa ccacgta肌g gggaccgccc ggatcggcgt tgggggc, cg,caggt acagggcgag atdagagcgg cacagagctc ctcggatctg acgctcacgc taacgcgttt ttaac
cctccctccc gatccagccg gcaacga已cc atctccctgg gcgttatgat cttcataccc gttagttagt taMggtta^ agctcgagga tatgcgtcgc aggcccacga aggccgacca ttggttgcgg
aaggaacacc agcactgtgg gggacattcg ttcgtcgaac ctctgctcgg ccaacgcaag gcggagatct
agtgagtgag c鄉accagg acagatccgg tagaattaga
cagcattatg asgttcaggc actcttgaat tgcacsgcag gagttccgag cagtccagca cctgatgtca tccagaagcg gstcgtgggg gatgatgctg ggcag犯tgg
agagcctctc cttcgcgctt 肌tttcgagt tcgaggtttc
tgagtcttcg 卿atcgggc gacgatctag atccatagcc cgtccccgtt
cttctcgtaa tacgacatat t犯ttttggg taggagtgag gcccagctgt ggg,gctg ggcgaggagg
aaactcgctt gttgttcttg cg肌gta^gc gcgttcg,
1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3025<210〉 23
<211〉 909
<212〉 DNA
<213〉 地钱
〈400〉 23
aagcttagca agcagctctc gcagcggatc tgctcttctg ctgctccctc tgcttcctcg 60
tg'ctacacgg tcttcgtcct cgcttcctcc acgcttcctc gcgctctctc caggtactcg 120
tcgcctcgcg ctctttcttc ttcctagttc gtccgttcct cgtaccggga tagggcggtc 180
gcgggtctcg tgagggtttt ttcgagc卿gtgcgtgagc aagttcatat cggtgggc犯 240
tg'catggggc gaacctggtc gg'gccctttt ccgaggccgc cggagagcct agtctccaag 300
ctgtagtatc ggtgttctcg aagatcggtc ggtgtctgca tctctccatc tcgattcgtt 360
tcgtctgagc tgatccgccg gtcgattttg acgatgtcgt gtcctcacct acgcaagttt 420
ggUccgagg attagttUg a,tgctgt c组gggaag tttagctctt ggttcgtgat 480
tagtttggac acggtcacat gaatcgtagg gacccaggtg tcgggcggaa tcttcagcag 540
tcatttcggt ttccgtaacg ctggatttaa gctgaaaacg ttcatcgatg gattgcggat 600
acc.atgacct aatggatcgt ccagctt已tt cttctggaag tetagacgtg tgatggctgt 660
ggcctgtggt agggttggac acgcccgcag tggtctctcc gaatttg组gtcgcaatgg 720
tcgatgtgct ctgccgattt ggggaatcga agtggc犯ac cggtcgttcg gactgtcgag 780
tgtatgcctg ctgcttgtgc gatgtagtgt ggatttttcc tccgatgttt tccaaacgtg 840
gtcgggattg cagttcttca atctaccagc ggagctaatt tcgtctttgg cttgcagtct 900
atcgtcgat 909<210> 24
<211〉 2146
<212〉 DNA
<213> 小立碗藓
24
atacaagagt tat3aatcat atacaatgat tactttcata t犯ttgttgs atattattgt 60
tacaacctaa gtaacaataa cattcaatta aacattcatt gtggttttca agcatattaa 120
tcattctttc ttctctaccc tatagtgatg ggaaattatc ccaaactcaa tgtcatactc 180
caggcaattc agaaatatag tgagatgaat accaggaata tttattcaca tcgaccccta 240
tcgccgggca atgccactcc caccgcggaa tgagaaactc cttgaaaaaa caagtccctt 300
cccagctgcc cgaaatcggc cgcctggtca gcacggcacg acactgccca cgtgcaatcc 360
tgacgtggcc tctacgtccg gaaggcggcg ccgttagcga tgtcctccta tgcaagttcc 420
txttgtggcg gggcagtgtg cccgccaact tcaccgtcac cctccacccc aacaagtggc 480
ccaaattact caggggcagc ccagcttcga aattttaagc ggtgaccgcc ccttctcatc 540
gtcacgcgtt acttcttttt cactcaatcg agtctgttta ttattggccg ctaggaaatt 600
gcagcttcca actccgcatc accgcgtgca gtacagtgga gatcttc肌g' agtgtcctca 660
ccaggaattt gcaacttgct ccttgcaatt tgtaataaat ggacagagaa gcctagattc 720
cgcatccaca gtgatgggtc acgtatc犯t aagcgaagct gcgttggc犯ctatggcaat 780
tggtttggtg tcttcgttcc tgtcaagttt gaaaagaaga gggagatctg atttcttaat 840
aagtgtcgsc ttgtctgggt agtggattgc gtggggcgtg tcgtagtgcg acgcgatcgc ■
atcaaattca tcgcctcaaa atttgtcacg ttgttgggtc aattgcaacg aactgcgatt 960gaaggattct tctcggtggc cttcaaattt gctttagtat gacagaagtt ttgcagctgt 1020
actcggcgtt tggaaggagt gg犯gtgagg tggatcacca cgcaccggag ttggtgaatt 1080
gtttactgca gaaaa犯atg gctttgatca catcagaatg attgatgttt cagcttgaat 1140
ttcacctcaa gatgtgttct catcatgaaa tttttattgg gccaggatgt actttcattg 1200
ttttgaaaga atattttaag acgcttgtgt tttacaacct ttcgg犯gat gcgtccttga 1260
ttgaaagtgg tt犯tgtttt gtacatcatt actggatatg犯aataccaa taa犯tgaaa 1320
tacaataaaa tatttttttg aaatgaaaat tggtttaaat aagcatgtaa ataatagacg 1380
gtggagt^aa ga犯aggt肌ta^aa犯犯a agtatgaatt ctattwtct tc^tatsaa 1440
agtaagaggt gtccgtttgc aagc犯t犯a aattcagtaa ttgctagata aattcaaaag 1500
ccaaccaata cacaccattg' ttttgctgca aagctagggt ttctaaggcc acaattcaat 1560
gactagtgac ttacatatta cttccaaacc gaagcaaagc aagggtactc cacgattgta 1620
tatatactca cttgtttatt tttaaaccat ctgaaatcac acaaaaatgt tgtgaccctg 1680
cttcattatg ataattaagt gacgttttaa tctcattaaa tttaatgcca ccgtaggtta 1740
tggacggaaa tggatggatg taaatggaaa gatcggcggc犯aaagacca aattccatac 1800
tactgcccga gtccgataaa gacggaaaca atgcgataaa agtaaaagtg agcagaagaa 1860
agtgcacggt cgaaggcggc gtttgtttac atttacttca ccaaaaccga gcaggatatc 1920
gggcacacgg tcaggaagaa attgttcatg acggtcagaa cattctggat ggttggcgtg 1980
cttgctataa gaacactgct cctccgatct aaacctcgga ttgtgcgctt ctagatactg 2040
aatttgtttc gaccctgcct tgttgagtgg ccgtagaggc tcgacagtta ggatcagtgt 2100
gccgttgaat ttagtgattg tgtagcgscc agtacgtcct gtasgg 2146
〈210〉 25 <211〉 524<212〉 DNA <213〉 葫卢藓
〈400〉 25
gaattcattt ccatt肌cga g犯tatgaca gtgggaagag cttccacgtc atcca犯ctc 60
aaagtatccg acgtggtcaa tccaagtgcc agtgccacct cagctccttc accagtccat 120
ctcgcggata agggtgacag caaggcgcgg tattactgga taagagaagc ggccaaggcg 180
gcagccactg tggtccactt tgctgcgtca ctacctactg cgattgtaat gacgagcggc 240
agcgtcgtgt gacaggcttg aaccgaccgc tgcttcagcc gcaggcagac tagaaaagtt 300 tactcgctgt cccactcgtt ttctgggtgt gcatccgaag tttctggatg gttgcccgtc 360
gttcaataaa ttgtcgcgcg tcgagctagc ggacactttt gtcaccgttc ttctctgttt 420
attctggacc ag.aggtgctg ttagctttgt tgtgtgtgag tccttgggga aatccctgcg 480
cgtcacgaga gtttattgca ggg肌gtgat a肌gcgttgt gaag 524
<210〉 26
<211> 2088
<212> 廳
<213〉 小立碗藓
〈400〉 26
atgcatgtaa gataattcca attagaatct ataaatttct tattataatt ttttaaaaac 60
aaagtaccaa aatattatta ttttaatatc ctctaagtta aatccatata ttaagtagaa 120
acaattattc taataaataa tgataaaeiat tagacatctt gcaataaaat ttcttttt肌 180aaatagatac ataacatgaa aaatatccca t肌atagcta acaccatcaa aacatttgac 240
caaatatgca cttttagatg tgtcaagaca aaaagaaata tttgcaagat tttggagtat 300
ctaaactaat gtttgtcctc tttgcactat gagtaggatt tcttttattt tgtttagtga 360
a肌gatacat tgc犯tttgt tttcat犯ta aa肌ctatax t犯tga^td gtgcta肌肌 420
ataacaagat taaaaaaaca taacccttct tacaacctta aatccttcta attsgactac 480
ctcaaagttg tgccatttag cac肌aaacc attcttttaa atctactt犯ccctccaatt 540
tccaatgagc ttcatgtgca tacacaagca tgctttcttt ctttctttct tgaagaaaac 600
ttatctgaac a肌cgttaat actctacttg ttgatgaaag tggaactttg accacataca 660
ggcttggtga tgtactttgt atatctcctc acagttagtc tggtgcaatc caaccatgca 720
catagaatat gaatgggg'ac atgcttccag ccactcgggt gtgcagaaaa cttgacaagc 780
gagattcaag caacggcgac tacgacgccg atcacgcaat acaaagcatt gttagtatgt 840
gataaaccag ag犯agagat cgagtatgtg cacacaaaaa cacacagatc cacaggtatt 900
gtctacggcg ccaccaccat ccgtcaaagc taccatctcg tcgaggaaga atggtatttc 960
t.朋aactagc aatac肌ccg ctgatggaa3 caaccg犯ag ctatgtcatt ggagagggcg 1020
cacgagttca tggaatacac agtgagaaga gataaagaaa taaaataata taaaatacaa 1080
gtgtgcatca gcaagacatg gccgaaatct aacaactgtc tgcacatgct gtggtg'ggtt 1140
gtatcceicgc gctggaggaa gt肌ctttcc tacatgcaca gaaaaacatt ttcagattag 1200
aaagctcttc tgttctagct aatctctagt accaagctca gacgtgtagc cgacgaagcc 1260
组agcagct gggtatgcta gtcactgatt ctg卿cggc cggtgtgtcg attgcgatgt 1320
atxtcagttc ggcgaaggcc tgtgtctgga acatgggaag agggtcttct tgcactcgtc 1380
aatctctcac agcaactggg c邻ggttgta tccgaacgtg ga肌acgcag caaccgttgt 1440
tgaaccaaag gatggtattt ttctccgaga aaaacgccgt ggcttatctg gtgtagacga 1500
93tccctaatcc ggacatgacc gccgctgtgc aggtgttggg aaaccacaat gcgcsagaga 1560
tgcgagagat ggaggagtgc aagaagtacg actgcgaagc tacatgcttc atcgagcaat 1620
gaagtct.ggg ttttctccaa cttccgcatg cacacacttt tctcgacgac atccgtttca 1680
aggtacgcat cgggaaactg acgattctct gcactggtgt tcagactctc cggagaggcg 1740 gtgtcatgtt ctgagctctt tttcgataag gtgctgttga agtccagaat组ggggtct 1800
ggattatcct ctggacggct ccgcttctgg tcgaaaaaat ttcatcccaa aaaaggactt 1860
atctgttgac tgaaaalgtt taattgtggt gaggattgca tgcagcgacg tcgtaaagat 1920
agggtgacaa ggagcgttcc agagctcagc tcggggcatg ccccggcact ccctagcata 1980
taaacatacc gggtggaatt tgtacccacc aggtcttgct cggtgtcccc tgtgcccaag 2040
ctgttggctg cattgccctt gcgattcgag tgtggagaga ttttagca 2088
〈210〉 27 <211> 500 〈212〉 DNA <213> 小立碗藓
<400> 27
ggaacgaatt tgtcgagctc tctggttctg ggtcgggtag cagtagcttt gatggtgagg 60
cactgacagt cagtcgctca cacggcaaag tagcctggat gtgcttcgca acgaactctt 120
g肌tttgeigt atgtgagttc ELCtttgsaca tcccagaagc犯肌g犯tgg gttttttcat 180
gtttgaattt tatUtgtat agttgtgttg agccgcgatt tctatctgtc acttggcttg 240
atattctgag tttctccgat acgaatagcg aagtccactt gaacatctgt aacggcagca 300
attgcgtcag gtc组cctc tcagattctt tcggtgcttt tgtcgtaaac tagcttgatt 360gttgtccatt aagcttggtt gcttttcgtg agaaagcatg aaacttctat gacgaaaccc 420 ggttg已ttgt aatgtaacta gtttgattgt agtttg肌tt tggtaattgc gttgtatgst 480 acataatgaa agtttcatga 500
权利要求
1.编码野生型细胞核来源的苔藓表达促进区域(MEPR)的分离的核酸分子。
2. 根据权利要求1的分离的核酸分子,其特征在于MEPR选自立碗 藓属(Phys国itrella )、葫,藓属(F固ria)、泥炭藓属(Sphag画)、 角齿藓属(Ceratodon)、地钱属(Marchantia)以及Sphaerocarpos 的MEPR,优选地选自小立碗藓(Physcomitrella patens)、葫芦藓(Funar ia hygrometrica )和地钱(Marchant ia polymorpha )的MEPR。
3. 根据权利要求1或者2的分离的核酸分子,其特征在于MEPR选 自序列编号1到27的序列或者其表达促进片段。
4. 根据权利要求1到3中任何一项的分离的核酸分子,其特征在 于它包含苔藓启动子以及优选地,5' UTR区域和/或5'内含子和/或 3'UTR。
5. 根据权利要求1到4中任何一项的分离的核酸分子,其特征在于 MEPR具有的表达促进活性至少与花椰菜花叶病毒(CaMV)35S启动子的 表达促进活性相等。
6. 根据权利要求1到5中任何一项的分离的核酸分子,其特征在 于MEPR具有的表达促进活性至少是花椰菜花叶病毒(CaMV)35S启动子 表达促进活性的200%,优选至少是500%,特别至少是1000%。
7. 根据权利要求1到6中任何一项的分离的核酸分子,其特征在 于它还包含重组多肽产物的编码区,所述的编码区在MEPR的控制下。
8. 根据权利要求1到7中任何一项的分离的核酸分子,其特征在 于它还包含选择标记。
9. 根据权利要求1到7中任何一项的分离的核酸分子,其特征在于 它还包含与将要用其转化的物种的基因组序列同源的序列,以使在该物 种中靶向整合。
10. 根据权利要求1到5中任何一项的分离的核酸分子,其特征在 于核酸分子以反义或者核酶分子的形式提供。
11. 在真核宿主细胞中表达重组多肽产物的方法,包括以下的步 骤提供重组DNA克隆载体,该栽体包含根据权利要求1到10中任何 一项的编码MEPR的分离的核酸分子,以及选择性地包含所述重组多肽 产物的编码区域,所述的编码序列在所述的宿主中,在所述核酸分子的 MEPR控制下;转化所述的真核宿主细胞,该细胞在天然情况下不含有在 所述的MEPR控制下的所述编码序列;在适宜的培养基中培养转化的真 核宿主细胞;表达所述的重组多肽以及分离表达的重组多肽。
12. 根据权利要求11的方法,其特征在于所述的真核宿主细胞选 自植物细胞,优选是莒藓细胞,特别是小立碗藓细胞。
13. 根据权利要求11或者12的方法,其特征在于所述的宿主细胞 是原丝体莒藓组织细胞。
14. 根据权利要求11到13中任何一项的方法,其特征在于培养基 不含有向其中添加的植物激素。
15. 根据权利要求11到14中任何一项的方法,其特征在于细胞 选自来自立碗藓属、葫芦藓属、泥炭藓属、角齿藓属、地钱属以及Sphaerocarpos的莒藓细胞。
16. 根据权利要求11到15中任何一项的方法,其特征在于宿主细 胞瞬时表达所述的重组多肽产物。
17. 根据权利要求1到10中任何一项的编码MEPR的分离的核酸分 子的用途,用于在工业上制备多肽,特别是用于提供制备所述多肽的重 组细胞。
18. 根据权利要求1到10中任何一项的编码MEPR的分离的核酸分 子的用途,用于表达苔藓多肽,所述苔藓多肽的表达在天然情况下不由 所述的MEPR控制,特别用于提供表达所述多肽的重组苔藓细胞。
19. 根据权利要求1到10中任何一项的编码MEPR的分离的核酸 分子的用途,用于筛选和确定表达促进区域的共有序列。
20. 根据权利要求1到10中任何一项的编码MEPR的分离的核酸分 子的用途,用于重组表达翻译后修饰蛋白,特别是制备翻译后被修饰的 蛋白。
21. 根据权利要求1到10中任何一项的编码MEPR的分离的核酸分 子的用途,用于体外表达重组蛋白。
22. 根据权利要求l到10中任何一项的编码MEPR的分离的核酸分 子的用途,用于重组表达代谢修饰蛋白。
全文摘要
公开的是编码野生型细胞核来源的苔藓表达促进区域(MEPR)的分离核酸分子以及使用这种MEPR制备重组多肽的方法。
文档编号C07K14/415GK101555479SQ20081013111
公开日2009年10月14日 申请日期2004年7月30日 优先权日2003年8月11日
发明者A·威斯, G·戈尔, M·罗德里格斯-佛朗哥, W·约斯特 申请人:格里革新生物技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1