絮凝酵母絮凝基因、其表达产物及其用途的制作方法

文档序号:575827阅读:345来源:国知局
专利名称:絮凝酵母絮凝基因、其表达产物及其用途的制作方法
技术领域
本发明涉及一种自絮凝酵母的絮凝基因FLOsc、其产物、及其应用。
背景技术
自絮凝酵母是大连理工大学白凤武教授实验室自行选育的具有良好絮凝性状而 且发酵性能优良的酵母菌株Mccharomyces cerevisiae f Io (驯化选育的自絮凝酵母变异 株及应用,中国发明专利200610025259. 7)。利用自絮凝酵母进行乙醇发酵,可提高发酵罐 中细胞密度,缩短发酵时间,提高生产强度,同时降低乙醇分离过程的能源动力消耗,降低 乙醇生产成本,而该菌株为原生质体融合菌株,获得其絮凝基因,并对其功能进行研究,进 一步构建新的具有自絮凝特征的生产菌株具有重要的意义。现有的获得自絮凝酵母的方法包括自然分离、原生质体融合,以及利用导入絮凝 基因的遗传工程方法等。其中自然分离方法带有一定随机性,而且分离得到的酵母存在遗 传背景不清楚,发酵性状难以预知等缺点,原生质体融合手段需要筛选大量的融合子,而且 在亲本酵母不存在选择标记的情况下难以进行。而利用絮凝基因进行絮凝酵母的转基因育 种则可选择发酵性能优良的亲本酵母,实现定向选育优良絮凝酵母。现有获得絮凝基因的方法是通过PCR获得(Agric. Biol. Chem. 1991,55 1547-1552),或者将絮凝酵母基因组酶切后连接4-61Λ左右片段通过功能验证方法获得 (微生物学报,2002,42:110-113)。传统PCR扩增存在保真性问题,而且扩增31Λ以上的片 段时就难以实现,即使可以获得,得到的基因也可能存在点突变,不能保证代表原始菌株的 序列,而且山于絮凝基因存在非常长的重复序列,在PCR过程中很难扩增。此外,由于该基 因较大,FLOl的启动子区存在大约51Λ的多种抑制蛋白的结合区(EMBO J. 2001,20(18) 5219-31),因此构建表达载体进行功能互补的时候难以包装完整的片段,从而影响功能鉴 定。而且功能筛选需要进行大量重组子的培养和性状观察,工作量很大,因此也难以通过功 能互补获得。因此,本领域仍需要一种获得絮凝酵母絮凝基因的方法,该方法具有保真性好、筛 选快速的优点。

发明内容
本发明人首次采用建立R)smid基因组文库的方法,利用絮凝基因的保守探针进 行文库的PCR筛选,获得了新的絮凝基因。与传统的SuperCos载体相比,Fosmid文库构建 时不采用限制性酶切,避免了酶切位点的偏好性,而且其拷贝数低,更具有稳定性。利用PCR 快速筛选,成功获得了絮凝基因的全长,该基因长达81Λ,如此长的基因很难通过传统PCR 手段获得,也难以通过连接4-61Λ片段进行功能互补获得。由此完成本发明。本申请一个目的是提供一种分离的核酸,选自(a)含有SEQ ID N0:1或3所示核 苷酸序列的核酸;和(b)与(a)所述核酸具有至少75%序列相同性、同时保留了 SEQ ID NO 1或SEQ ID NO 3的絮凝功能的核酸。所述核酸可选自SEQ ID NO 1或SEQ ID NO :3。
本申请的另一目的是提供一种蛋白质,选自(i)含有SEQ ID NO :2或SEQ ID NO: 4所示的氨基酸序列的蛋白质;和(ii)在(i)的蛋白质的氨基酸序列中经过取代、缺失或 添加一个或几个氨基酸且具有絮凝功能的由(i)衍生的蛋白质。所述蛋白质可以选自SEQ ID NO 2或SEQ ID NO 4所示的蛋白质。本申请也包括编码本申请所述的蛋白质的核酸。本申请再一目的是提供一种表达载体,其含有本申请所述的核酸序列,例如,含有 前述(a)或(b)项的核酸序列,或者含有编码前述(i)项或(ii)项所述的蛋白质的核酸序 列。本申请的表达载体可含有TPSl启动子或者含有PGKl启动子。当含有TPSl启动 子时,转化了此表达载体的絮凝酵母诱导型表达絮凝基因;当含有PGKl启动子时,转化了 此表达载体的絮凝酵母组成型表达絮凝基因。诱导型表达絮凝基因意指在一定的诱导条件 下(例如存在一定的乙醇)表达絮凝基因;而组成型表达絮凝基因则意指不需要任何诱导 条件,细胞从开始生长即表达絮凝基因。本申请再一目的是提供一种絮凝酵母,其含有本申请所述的表达载体。本申请的絮凝酵母包括保藏号为CGMCC 3408或CGMCC 3409的酿酒酵母 (Saccharomycescerevisiae),两种酿酒酵母已于2009年11月5日保藏于中国微生物菌 种保藏管理委员会普通微生物中心(CGMCC,中国北京市朝阳区北辰西路1号院3号,邮编 100101)。本申请再一目的是提供一种获得絮凝酵母全长絮凝基因的方法,该方法包括以下 步骤(1)用i^osmid载体构建插入片段约为35-401Λ的絮凝酵母基因组文库;(2)将所获得 的文库转染细菌,平板涂布,经鉴定文库合格后挑取平板上的单克隆于培养基中培养;(3) 提取培养的单克隆的DNA,PGR扩增,并对PCR扩增产物进行检测,获得含有絮凝基因的阳性 克隆;和(4)对该阳性克隆进行测序,获得该絮凝酵母的絮凝基因。所用细菌可以是大肠杆 菌等。本申请又一目的是提供一种生产絮凝蛋白的方法,该方法包括构建本申请的表 达载体,用该表达载体转化絮凝酵母,和在使转化的絮凝酵母表达絮凝蛋白的条件下培育 该絮凝酵母,从而生产絮凝蛋白。


图1显示絮凝蛋白C-端与模式菌株蛋白的比较。图2显示絮凝酵母(左)和破坏子(右)的絮凝性状。图3显示S288C的PGKl启动子电泳图。图4显示S288C的TPSl启动子电泳图。图5显示絮凝基因表达载体的构建。图6显示转基因絮凝酵母的絮凝形态。a,组成型絮凝酵母BHLOl ;b,诱导型絮凝 酵母ZLHOl ;c,含有空载体的游离宿主酵母;d,野生型絮凝酵母S.cerevisiae flo。图7显示诱导型絮凝酵母ZLHOl在不同乙醇添加浓度下的絮凝性状比较。图下标 注的浓度为乙醇浓度(0-8% ),上部为整体培养物图像,下部为试管底图像,显示沉降的细 胞。
具体实施例方式本申请提供一种获得絮凝酵母的絮凝基因的方法,该方法包括以下步骤(1)用 R)smid载体构建插入片段约为35-401Λ的絮凝酵母基因组文库;( 将所获得的文库转染 细菌,例如大肠杆菌,平板涂布,经鉴定文库合格后挑取平板上的单克隆于培养基中培养; (3)提取培养的单克隆的DNA,PCR扩增,并对PCR扩增产物进行检测,获得含有絮凝基因的 阳性克隆;和⑷对该阳性克隆进行测序,获得该絮凝酵母的絮凝基因。絮凝酵母基因组文库的构建可包括提取絮凝酵母基因组DNA、制备所述长约 35-40kb的插入片段,以及将该插入片段与R)Smid载体连接等步骤。R)smid载体可从各种 市售途径获得,例如,可使用 Copycontrol Fosmid Library Production Kit (Epicentre, USA)提供的R)smid载体。基因组DNA的提取以及插入片段的制备可采用常规的方法实施。 在将插入片段与i^osmid载体连接前,可先将该插入片段用Klenow片段进行末端补平。进 一步地,还可通过酚氯仿抽提乙醇沉淀精制该补平的DNA片断。精制后的DNA片段可经过 脉冲场电泳确认。可将所获得的文库包装、转染和平板涂布,并鉴定该文库是否合格。包装可使用市 售获得的唾菌体包装蛋白,如 Copycontrol Fosmid Library Production Kit, Epicentre 体外包装。然后可转染大肠杆菌,涂布于含有氯霉素的LB平板中。随机挑取单克隆接种, 过夜培养,用碱裂解法提取DNA,再用NotI作酶切鉴定,脉冲场电泳检测插入片断的长度。 根据涂平板的结果和插入片断的长度,判断文库是否合格。PCR扩增优选使用如SEQ ID NOS :5_8所示的引物。扩增所得产物可采用转座子 Tn5随机插入目的载体的基因操作方法,利用转座子两端的引物位点进行测序。值得提出的 是,由于絮凝基因内部存在很长的重复区,因此常规测序技术很难测序,通过转座方法可以 克服这一难点,获得精确的含有较长重复区的基因序列。可采用以下方法对所获得的絮凝基因进行功能分析通过PCR技术获得一段带有 筛选标记和酵母同源区域的目的基因,通过电转化法,将目的基因导入自絮凝酵母,使筛选 标记与酵母FLOsc基因发生同源重组,破坏该基因的功能,得到一株非絮凝的菌株;由于 FLOsc基因破坏后絮凝功能丧失,可以说明该基因负责细胞的絮凝性状。本申请也涉及絮凝基因的外源组成型表达,即利用3-磷酸甘油酸激酶(PGKl)的 启动子启动絮凝基因的表达,构建整合表达载体整合入无絮凝性状的酵母的HO位点,获得 发酵性能提高的新一代絮凝酵母,从而实现絮凝基因的外源组成型表达。由于使用整合载 体,该重组酵母培养时不需要抗生素选择,而且克服了复制型载体容易丢失的缺点,遗传稳 定,传代十次以上均能稳定絮凝。本申请也涉及絮凝基因的外源条件性表达,即利用海藻糖合成酶(TPSl)的启动 子启动絮凝基因的表达,构建表达载体整合入无絮凝性状的酵母的HO位点,所获得的酵母 转化子在乙醇生成达到3%左右开始絮凝,避免了过早过强絮凝导致的对生长和乙醇发酵 的抑制。本申请得到了自絮凝酵母Mccharomyces cerevisiae变种的絮凝基因,并构建了 组成型絮凝和诱导型絮凝的新一代絮凝酵母,提高了菌株的耐温性和发酵效率。本申请的絮凝基因可用于构建应用于其它领域的酵母菌株,如重金属离子吸附,医药蛋白表达,单细胞蛋白的生产等。本申请的絮凝基因如SEQ ID NO :1和3所示。本申请包括含有SEQ ID N0:1或 SEQ IDNO :3所示DNA序列的分离的核酸。术语“分离的”指其所修饰的物质至少缺乏某些 其它成分的制品,这些成分也可存在于这些物质或类似物质天然状况或最初从其制备时。术语“多肽”和“蛋白质”指氨基酸残基的聚合物,并不限于产物的最小长度。因 此,肽、寡肽、二聚物、多聚物等都包括在该定义中。全长的蛋白质及其片段包括在该定义 中。该术语还包括多肽的表达后修饰,例如糖基化、乙酰化、磷酸化等。另外,为了本发明的 目的,“多肽”指包括天然序列的修饰,例如缺失、添加和取代(通常性质保守),只要蛋白质 维持所需活性。这些修饰可以通过定点诱变设计,或可以是偶然的,例如通过产生蛋白质的 宿主突变,或由于PCR扩增引起的错误。术语“类似物”指具有天然多肽序列和结构,以及相对于天然分子的一个或多个氨 基酸添加、取代(通常性质保守)和/或缺失的化合物,只要修饰不破坏衍生该类似物的原 始多肽的活性。制备多肽类似物和突变蛋白的方法是本领域已知的,如下进一步所述。特别优选的类似物包括性质上保守的取代,即这些取代发生在与它们的侧链有 关的一类氨基酸中。具体而言,氨基酸一般被分成四类(1)酸性——天冬氨酸和谷氨酸; (2)碱性——赖氨酸、精氨酸、组氨酸;C3)非极性——丙氨酸、缬氨酸、亮氨酸、异亮氨酸、 脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸;(4)无电荷的极性——甘氨酸、天冬酰胺、谷氨酰胺、 半胱氨酸、丝氨酸、苏氨酸、酪氨酸。有时将苯丙氨酸、色氨酸和酪氨酸归为芳族氨基酸。例 如,有理由预测单独用异亮氨酸或缬氨酸取代亮氨酸、用谷氨酸取代天冬氨酸、用丝氨酸 取代苏氨酸,或者用结构上相关的氨基酸取代类似的保守的氨基酸,这样的取代将不会对 生物活性有重要影响。例如,感兴趣的多肽可包括多达约2-6个保守的或不保守的氨基酸 取代,甚至多达约5-10个保守的或不保守的氨基酸取代,或2-10之间任何整数,只要该分 子的所需功能仍维持完整。本领域的熟练技术人员可结合本领域熟知的Hopp/Woods和 Kyte-Doolittle曲线图,容易地测定感兴趣的分子中可耐受改变的区域。可用“相同性”或“同源性”来限定本发明的多肽或核苷酸序列。“相同性”或“同源 性”指两条多核苷酸或多肽序列上准确的核苷酸对核苷酸或者氨基酸对氨基酸对应。通过 排列两个分子的序列直接比较它们的序列信息,计算两条排列的序列间匹配的准确数量, 将其除以最短序列的长度,然后乘以100,从而可得到相同性百分数。在同源性和相同性分析中可辅助使用易于获得的计算机程序,如ALIGH、Dayhoff、 Μ. 0. (Atlas of Protein Sequence and Structure^ M. 0. Dayhoff 编 辑,5 Suppl. , 3 353-358, National Biomedical Research Foundation, Washington, DC),它适用于 Smith 和 Waterman 分析肽用的局部同源性算法(Advances in App 1. Math.,2 =482-489,1981)。 可从 WisconsinSequence Analysis Package (第 8 版,从 Genetics Computer Group, Madison, WI获得)获得测定核苷酸序列同源性的程序,例如,BESTFIT、FASTA和GAP程 序,这些程序也依赖于Smith和Waterman算法。使用制造者建议的和上述Wisconsin Sequence Analysis Package所述的默认参数可容易地使用这些程序。例如,可使用Smith 和Warerman的同源性算法的默认计分表和6个核苷酸位置的间隔罚分(gap penalty)测 定的核苷酸序列与参比序列的同源性百分数。本发明建立同源性百分数的另一方法是使用版权属于爱丁堡大学、由JohnF. Collins 禾口 Shane S. Sturrok 开发、由 IntelliGenetics, Inc. (Mountain View, CA)发行 的MPSRCH程序包。Smith-Waterman算法可在这套程序包中使用,其中,在计分表中使用默 认参数(例如,间隔开放罚分=12,间隔延伸罚分=1,间隔=6)。从这批数据产生的“匹 配”值反映出“序列同源性”。计算序列间的相同性百分数或相似性百分数的其它合适的 程序在本领域中一般都是已知的,例如,另一种排列程序是BLAST,使用默认参数。例如,可 使用下述默认参数的BLASTN和BLASTP 基因编码=标准;过滤=无;链=两;截留=60 ; 期望值=10 ;矩阵=BL0SUM62 ;描述=50个序列;排序=HIGH SCORE ;数据库=无冗余, GenBank+EMBL+DDBJ+PDB+GenBankCDS 翻译 +Swiss 蛋白 +Spupdate+PIR。在 http://www. ncbi. nim. gov/cgi-bin/BLAST网址上可查到这些程序的详细描述。或者,在同源区域之间形成稳定的双链的条件下进行多核苷酸杂交,接着用单链 特异性核酸酶消化,然后测定消化的片段的大小,从而测出同源性。在如(对具体的体系所 定义的)严格条件下进行的Southern杂交试验中,可鉴别基本同源的DNA序列。确定适当 的杂交条件在本领域熟练技术人员所掌握的知识之内。例如,参见Sambrook等,同上;DNA Cloning,同上;Nucleic Acid Hybridization,同上。因此,本申请包括与SEQ ID NO :1或SEQ ID NO :3具有至少70%、至少75%、至 少80 %、至少85 %、至少90 %、至少95 %、至少98 %、至少99 %的序列相同性的核酸。本申 请也包括包含与SEQ ID NO :1或SEQ ID NO :3具有至少70%、至少75%、至少80%、至少 85 %、至少90 %、至少95 %、至少98 %、至少99 %的序列相同性的核酸的核酸。本申请包括SEQ ID NO 2和4所示的氨基酸序列,以及包含所示氨基酸序列的蛋 白质。本申请也包括与SEQ ID NO :2或SEQ ID NO :4具有至少70%、至少75%、至少80%、 至少85 %、至少90 %、至少95 %、至少98 %、至少99 %的序列相同性的氨基酸序列。另一方面,本申请包括编码在SEQ ID NO :2或4限定的氨基酸序列中经过取代、缺 失或添加一个或几个氨基酸其具有絮凝蛋白活性的由SEQ ID NO :2或4衍生的蛋白质的核 酸。在本申请的蛋白质中,也包括在SEQ I D NO :2或4限定的氨基酸序列中经过取 代、缺失或添加一个或几个氨基酸其具有絮凝蛋白活性的由SEQ ID NO :2或4衍生的蛋白 质。本申请也包括本申请蛋白质的编码序列。本申请包括含有本申请核苷酸序列的表达载体。本申请的表达载体可含有SEQ ID NO :1或SEQ ID NO :3所示核苷酸序列。在本申请的表达载体中可包含TPSl启动子或PGKl 启动子。本申请也包括含有本申请表达载体的细胞或真菌。在优选实施例中,所述真菌是 酵母,在更优选的实施方式中,所述酵母是酿酒酵母。本申请包括一种生产絮凝蛋白的方法,该方法包括构建本申请的表达载体,用该 表达载体转化絮凝酵母,和在使转化的絮凝酵母表达絮凝蛋白的条件下培育该絮凝酵母, 从而生产絮凝蛋白。在一个具体身上发生中,本申请包括利用TPSl启动子诱导表达絮凝蛋白的方法, 该方法包括构建含有TPSl启动子的絮凝基因表达载体,用该表达载体转染絮凝酵母,和在 使该启动子诱导表达絮凝蛋白的条件下培育该絮凝酵母,诱导絮凝蛋白的表达。下文将结合具体实施例对本申请作出进一步的描述。应理解,所述实施例仅仅是阐述性的,而非限制性的。实验中所使用的试剂,除非另有说明,都是可从市场上购得常规 的试剂。实施例实施例1 自絮凝酵母基因组中的絮凝基因的获得1.提取自絮凝酵母基因组DNA用YPD培养基(以g/L计,葡萄糖20,酵母粉10,蛋白胨20)在30°C,150rpm过夜培 养自絮凝酵母S. cerevisiae f Io (中国普通微生物菌种保藏管理中心保藏号CGMCC0587), 取菌体适量,用低熔点琼脂糖包埋,然后用细胞裂解液(1M山梨醇,0. IM乙二胺四乙酸钠 盐缓冲液PH7. 5,蜗牛酶5. 5mg/ml)过夜处理,得到自絮凝酵母的全基因组DNA。2.制备基因组文库插入片段取适量自絮凝酵母的基因组DNA,用DNA破碎仪(Hydro-Siear 0703,美国 GeneMachine)将基因组DNA打断,然后将片断化的基因组DNA通过脉冲场电泳分离,在避免 紫外照射的条件下切胶回收35 401Λ的片断。3.0嫩片断末端补平与^)81^(1载体连接将回收后的DNA片断用Klenow片段进行末端补平,并通过酚氯仿抽提乙醇沉淀精 制DNA片断,精制后的DNA片段经过脉冲场电泳确认,连入Copycontrol Fosmid Library ProductionKit (Epicentre, USA) 白勺 Fosmid i^#。4.文库的包装、转染、平板涂布、鉴定111 ^^ Q (Copycontrol Fosmid Library Production Kit,Epicentre) 体外包装,转染大肠杆菌EPI300,然后涂布于含有氯霉素的LB平板中。随机挑取M个单克 隆接种,过夜培养,用碱裂解法提取DNA,再用NotI作酶切鉴定,脉冲场电泳检测插入片断 的长度。根据涂平板的结果和插入片断的长度,判断文库是否合格。5.自絮凝酵母基因组文库的筛选用无菌牙签挑取单克隆,加入1. 5mL含有氯霉素12. 5 μ g/mL的LB培养基37°C振 荡过夜培养。每个样品取适量,加入终浓度为20%的甘油,在-70°C保存。然后每个样品再 取150 μ L,30个一组混合,99°C煮沸IOmin破菌,取适量做模板进行PCR检测。由于絮凝酵母的絮凝基因序列未知,所以尝试根据模式菌株的FLOl序列分别设 计两对PCR筛选引物(CF/CR和NF/NR,其中F代表正向引物,R代表反向引物),用于在基 因组文库中筛选自絮凝酵母的絮凝基因,其中CF/CR扩增的是絮凝基因C端约11Λ的序列, NF/NR扩增的是絮凝基因N端约500bp的序列。CF :5,-GCGGAATTCCCTCTGGTTCTTCTGAGAGC-3,(SEQ ID NO 5)CR :5,-GCGAAGCTTGTAAGCTGTTGGCACTGC-3,(SEQ ID NO 6)NF :5,-GGCGAATTCCTTGAAATTAGCTCGGT -3,(SEQ ID NO 7)NR :5,-GCGAAGCTTGCATATCCATAAGCCAT-3,(SEQ ID NO 8)PCR扩增体系模板2 μ L正向引物(CF或 NF) (10pmol/yL)IyL反向引物(CR或 NR) (lOpmol/μ L)IyLIOx 缓冲液2. 5 μ L
dNTP (dATP、dGTP、dCTP、dTTP 各 2. 5mM) Ex Taq DNA 聚合酶(TaKaRa) (5U/ μ L) 蒸馏水PCR反应条件




权利要求
1.一种分离的核酸,选自(a)含有SEQID NO :1或SEQ ID NO 3所示核苷酸序列的核酸;和(b)与(a)所述核酸具有至少75%序列相同性、同时保留了SEQ ID NO :1或SEQ ID NO 3的絮凝功能的核酸。
2.如权利要求1所述的核酸,其特征在于,所述核酸为SEQID NO :1或SEQID NO :3。
3.一种蛋白质,选自(a)含有SEQID NO :2或SEQ ID NO 4所示的氨基酸序列的蛋白质;和(b)在(a)的蛋白质的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有 絮凝功能的由(a)衍生的蛋白质。
4.编码权利要求3所述的氨基酸序列的核酸。
5.一种表达载体,其含有权利要求1、2或4所述的核酸。
6.如权利要求5所述的表达载体,其特征在于,所述表达载体含有TPSl启动子或者含 有PGKl启动子。
7.一种絮凝酵母,其含有权利要求5或6所述的表达载体。
8.一种获得絮凝酵母全长絮凝基因的方法,该方法包括以下步骤(1)用R)smid载体构建插入片段约为35-401Λ的絮凝酵母基因组文库;(2)将所获得的文库转染细菌,平板涂布,经鉴定文库合格后挑取平板上的单克隆于培 养基中培养;(3)提取培养的单克隆的DNA,PCR扩增,并对PCR扩增产物进行检测,获得含有絮凝基 因的阳性克隆;和(4)对该阳性克隆进行测序,获得该絮凝酵母的絮凝基因。
9.一种生产絮凝蛋白的方法,该方法包括构建权利要求5或6所述的表达载体,用该表达载体转化絮凝酵母,和在使转化的絮凝酵母表达絮凝蛋白的条件下培育该絮凝酵母,从而生产絮凝蛋白。
10.选自保藏号为CGMCC3408或CGMCC 3409的酿酒酵母 (Saccharomycescerevisiae)。
全文摘要
本发明提供一种获得絮凝酵母的絮凝基因的方法,由此获得的絮凝基因、其编码蛋白,含有该絮凝基因的表达载体、含有该表达载体的菌株,以及用不同启动子利用此絮凝基因构建的新生产菌株。
文档编号C12N15/10GK102086455SQ20091020009
公开日2011年6月8日 申请日期2009年12月8日 优先权日2009年12月8日
发明者李倩, 李凡, 白凤武, 贺雷雨, 赵心清 申请人:大连理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1