可放大的发酵方法

文档序号:432216阅读:765来源:国知局
专利名称:可放大的发酵方法
技术领域
本发明涉及一种生产噬菌体VLP的有效发酵方法。该方法提升了VLP的产量,并且可放大至商业生产规模。该方法包括噬菌体重组衣壳蛋白在允许衣壳蛋白自发自装配为VLP的条件下在细菌宿主中表达。
可通过本发明的方法生产的VLP的具体例子是噬菌体的VLP,优选RNA噬菌体的VLP。在本发明的一个优选实施方式中,本发明的病毒样颗粒包含RNA噬菌体的外壳蛋白、其突变体或片段,或基本由这些物质组成,或由这些物质组成。优选地,RNA噬菌体选自a)噬菌体Qβ;b)噬菌体R17;c)噬菌体fr;d)噬菌体GA;e)噬菌体SP;f)噬菌体MS2;g)噬菌体M11;h)噬菌体MX1;i)噬菌体NL95;k)噬菌体f2;l)噬菌体PP7和m)噬菌体AP205。
在本发明的一个优选实施方式中,生产了包含RNA噬菌体的外壳蛋白、其突变体或片段的VLP,其中该外壳蛋白具有选自以下序列的氨基酸序列(a)SEQ ID NO5,指QβCP;(b)SEQ ID NO5和SEQID NO15的混合物(QβA1蛋白);(c)SEQ ID NO16(R17衣壳蛋白);(d)SEQ ID NO17(fr衣壳蛋白);(e)SEQ ID NO18(GA衣壳蛋白);(f)SEQ ID NO19(SP衣壳蛋白);(g)SEQ ID NO19和SEQ ID NO20的混合物;(h)SEQ ID NO21(MS2衣壳蛋白);(i)SEQ ID NO22(M11外壳蛋白);(j)SEQ ID NO23(MX1衣壳蛋白);(k)SEQ ID NO24(NL95衣壳蛋白);(l)SEQ ID NO25(f2衣壳蛋白);(m)SEQ ID NO26(PP7衣壳蛋白);和(n)SEQ ID NO12(AP205衣壳蛋白)。
在大肠杆菌中表达时,Qβ外壳蛋白的N-末端甲硫氨酸通常被去除(Stoll,E.等人.J.Biol.Chem.252990-993(1977))。由N-末端甲硫氨酸已被去除的Qβ外壳蛋白组成的VLP,或包含N-末端甲硫氨酸被切除或仍然存在的Qβ外壳蛋白混合物的VLP也在本发明的范围之内。
在本发明的一个优选实施方式中,VLP是一种嵌合VLP,其包含或由RNA噬菌体外壳蛋白、其突变体或片段的多于一种氨基酸序列、优选两种氨基酸序列组成。
在一个非常优选的实施方式中,VLP包含或由两种不同的RNA噬菌体外壳蛋白组成,所述两种外壳蛋白具有氨基酸序列SEQ IDNO5和SEQ ID NO15或SEQ ID NO19和SEQ ID NO20。
在本发明的优选实施方式中,生产的VLP包含、或基本由、或由RNA噬菌体Qβ、fr、AP205或GA的重组外壳蛋白、其突变体或片段组成。
在一个优选实施方式种,VLP是RNA噬菌体Qβ的VLP。Qβ的衣壳或病毒样颗粒显示出具有25nm直径和T=3准对称的二十面体噬菌体样衣壳结构。该衣壳包含衣壳蛋白的180个拷贝,它们通过二硫桥以共价五聚体和六聚体连接(Golmohammadi,R.等人.Structure4543-5554(1996))。
优选的RNA噬菌体的病毒样颗粒,特别是根据本发明的Qβ和fr的病毒样颗粒,在WO02/056905中公开,该公开文本在此全文引入作为参考。WO02/056905的实施例18给出了由Qβ制备VLP颗粒的详细描述。
在另一个优选实施方式中,VLP是RNA噬菌体AP205的VLP。AP205VLP的有装配能力的突变体形式,包括在氨基酸5位的脯氨酸被替换为苏氨酸的AP205外壳蛋白,也可用于本发明的实践中,并且导致了本发明的其他优选实施方式。WO2004/007538,特别是在实施例1和实施例2中,描述了如何获得包含AP205外壳蛋白的VLP,由此特别描述了其表达和纯化。WO2004/007538在此引入作为参考。
在一个优选实施方式中,VLP包含或由病毒、优选RNA噬菌体的突变外壳蛋白组成,其中该突变外壳蛋白已经通过取代和/或缺失而去除了至少一个赖氨酸残基而被修饰。在另一优选实施方式中,本发明的VLP包含或由病毒、优选RNA噬菌体的突变外壳蛋白组成,其中该突变外壳蛋白已经通过取代和/或插入而添加了至少一个赖氨酸残基而被修饰。缺失、取代或添加至少一个赖氨酸残基允许改变与抗原的偶联程度。
Qβ外壳蛋白的VLP或衣壳在其表面上展示限定数量的赖氨酸残基,其限定的拓朴学结构为三个赖氨酸残基指向衣壳内部并与RNA相互作用,并且另外四个赖氨酸残基暴露于衣壳外部。
暴露的赖氨酸残基被精氨酸取代的Qβ突变体也包含在本发明中。优选地,这些突变外壳蛋白包含或由选自下组的氨基酸序列组成a)Qβ-240(SEQ ID NO7,Lys13→Arg);b)Qβ-243(SEQ ID NO8,Asn10→Lys);c)Qβ-250(SEQ ID NO9,Lys2→Arg);d)Qβ-251(SEQID NO10,Lys16→Arg);和e)Qβ-259(SEQ ID NO11,Lys2→Arg,Lys16→Arg)。上述提到的Qβ突变外壳蛋白、突变的Qβ外壳蛋白VLP和衣壳的构建、表达和纯化分别描述于WO02/056905中。特别参考上述申请的实施例18。
在一个进一步优选的实施方式中,重组衣壳蛋白是具有SEQ IDNO12所示氨基酸序列的噬菌体AP205的衣壳蛋白或其突变体,它能够形成VLP,例如蛋白质AP205P5T(SEQ ID NO13)或AP205N14D(SEQ ID NO14)。
在一个非常优选的实施方式中,所述重组衣壳蛋白由大肠杆菌RNA噬菌体Qβ的133个氨基酸的外壳蛋白C组成,该外壳蛋白C包含或优选地由SEQ ID NO5所示的氨基酸序列组成,其中优选地所述重组衣壳蛋白能够通过自装配形成VLP。
在一个实施方式中,表达构建体包含第一终止密码子和第二终止密码子,其中所述第一终止密码子直接定位于所述第一核苷酸序列的3’,并且所述第二终止密码子直接定位于所述第一终止密码子的3’,并且其中第一或第二终止密码子中的至少一个是TAA。例如,质粒pTac-nSDAP205(SEQ ID NO30)包含天然存在的TAA终止密码子作为第一终止密码子和附加的直接位于第一终止密码子3’的TGA终止密码子。
在一个优选实施方式中,表达构建体包含第一核苷酸序列和第二核苷酸序列,其中所述第一核苷酸序列编码一种重组衣壳蛋白,优选QβCP,或其突变体或片段,最优选地是SEQ ID NO5,并且其中所述第二核苷酸序列编码任一其他蛋白质,优选Qβ A1蛋白或其突变体或片段,最优选地是SEQ ID NO15,并且其中所述第一和第二核苷酸序列被正好一个包含至少一个TAA终止密码子的一段序列隔开。在一个实施方式中,所述TAA终止密码子通过将天然存在的终止密码子(优选TGA)置换为序列TAA而产生。可选地并且更优选地,所述TAA终止密码子通过将天然存在的终止密码子(优选TGA)置换为序列TAATGA(SEQ ID NO32)而产生。
例如,Qβ基因C区域对应于NCBI genebank登录号M99039(核苷酸46-1062)。基因C包含编码133个氨基酸的Qβ外壳蛋白(SEQ IDNO5)的第一核苷酸序列和编码329个氨基酸的通读蛋白A1((SEQ IDNO15)的第二核苷酸序列。SEQ ID NO6的核苷酸1-399(NCBI GenBank登录号M99039的核苷酸46-444)对应于所述编码133个氨基酸的QβCP的所述第一核苷酸序列,SEQ ID NO6的核苷酸400到402对应于强TAA终止密码子,并且SEQ ID NO6的403到405对应于渗漏TGA终止密码子,其后紧跟着是所述第二核苷酸序列(QβA1)。令人吃惊的是,发现在表达构建体中与A1有关的核苷酸序列的存在导致更高的RNA稳定性,因此,导致与A1序列缺失的构建体相比提高的QβCP和VLP的产量。
重组蛋白的表达可显著降低细菌宿主的生长速率,这是由于累积的蛋白质的毒性效应和由蛋白质合成引起的代谢负担。特别地,可能会发生细胞裂解和低质粒保持。诱导型启动子提供了将发酵过程的生长期与生产期分开的可能性。诱导型启动子在细菌宿主的生长期中被一种阻遏物分子阻遏,在生产期中通过将细菌宿主暴露于诱导环境而被诱导。诱导型启动子因此允许细菌宿主快速生长,优选地在生长期内以对数速率生长并到达高细胞密度。因此,诱导型启动子在生产期结束时提供了表达产物的高产量。因此,优选地将诱导型启动子用于重组蛋白的表达。
诱导型启动子的一种公知的例子是lac启动子,其形成了lac操纵子的一部分,并可通过添加乳糖或强合成诱导物异丙基硫代-β-D-半乳糖苷(IPTG)到细菌宿主的生长培养基中而被诱导。Donavan等人.2000(Can.J.Microbiol 46532-541)报道了一种在lac启动子的控制下表达单克隆抗体的改进的方法。诱导型启动子的进一步的例子在Makrides 1996(Microbiological Reviews,p.512-538)的表1中提供。
基于诱导型启动子的表达系统的一个典型缺陷是启动子的“渗漏性”,意思是启动子在生长期中被不充分地阻遏而引起重组蛋白的一定的表达率。这典型地导致细胞密度降低或导致质粒的不稳定性,并且,结果导致重组蛋白的产量降低。Makrides 1996(MicrobiologicalReviews,p.512-538)。倾向于不充分阻遏的启动子的一个例子是VHb启动子,其在高氧条件下被阻遏并且在缺氧时被诱导。
为了本发明的目的,优选被严格阻遏的启动子。在一个实施方式中,启动子被阻遏物lacI阻遏。所述启动子的例子公开于Makrides1996(Microbiol.Rev.60512-538)、Goldstein和Doi 1995(Biotechnology Annual Review 1105-128)、Hannig和Makrides 1998(TIBTECH 1654-60)和Stevens 2000(Structures 8,R177-R185)中。在一个优选实施方式中,启动子被乳糖诱导,更优选地选自lac、lacUV5、tac、trc、Psyn lppa、lpp-lac、T7-lac、T3-lac和T5-lac。对于本发明的目的特别优选的是tac启动子(SEQ ID NO2)或其突变体或变体。在本发明的范围内包括与SEQ ID NO2具有至少50%、60%、70%、80%、90%或95%、优选98%到100%、最优选99%的序列同源性的tac启动子的突变体或截短或缺失变体。其中所述突变的截短或缺失变体的启动子的强度与SEQ ID NO2的启动子强度相当。熟练技术人员可以利用标准方法通过比较表达研究确定给定序列的启动子强度。在一个本发明的特定实施方式中,驱动重组衣壳蛋白表达的启动子包含或由SEQ ID NO2组成。Tac启动子是lacUV5启动子的-10区和trp启动子的-35区的融合产物,并且将trp的高转录效率和lac启动子的调节元件结合起来(de Boer等人.1983,PNAS 8021-25;Amann等人.1983 Gene 25167-178)。它提供了充分的高表达率和高蛋白产量,同时避免了在使用更强的启动子例如T7启动子时可能出现的不溶性的或不正确折叠的重组蛋白的形成。Trc和tic启动子是tac启动子的突变形式(Brosius等人.1985,The Journal of BiologicalChemistry 260(6)3539-3541)。在一个进一步优选的实施方式中,启动子选自tic、trc和tac。
为了为本发明目的构建表达构建体,启动子通过核糖体结合位点(Shine-Dalgarno序列,SD)与所述编码重组衣壳蛋白的第一核苷酸序列有效连接,典型地在其3’末端包含ATG起始密码子。适合本发明目的的Shine-Dalgarno序列是本领域公知的

等人.1988,DNA7(6)399-405;Ringquist等人.1992,Mol.Micr.61219-1229)。在本发明的一个实施方式中,表达构建体包含SEQ ID NO4所示的

等人.1988(DNA 7(6)399-405)的SD序列。在另一个优选的实施方式中,表达构建体包含Ringquist等人.1992(Mol.Micr.61219-1229,SEQID NO3,nSD)的Shine-Dalgarno序列。令人吃惊的是,发现SEQ IDNO3特别适合于本发明,因为它导致重组衣壳蛋白的表达水平提高和产量提高。SEQ ID NO3特别适合提高AP205衣壳蛋白的表达。在一个本发明的优选实施方式中,表达构建体包含选自SEQ ID NO3和SEQ ID NO4的Shine-Dalgarno序列,优选地所述Shine-Dalgarno序列是SEQ ID NO3。
转录终止子是表达构建体的功能型元件。熟练技术人员将可以从广泛的来源中选择适当的终止子序列。在一个本发明的优选实施方式中,所述表达构建体包含一种终止子序列,其中优选地所述终止子序列与所述第一核苷酸序列有效连接,其中进一步优选地,所述终止子序列是rRNB终止子序列,最优选SEQ ID NO28。
为了质粒选择的目的,熟练技术人员一般利用抗生素抗性标记基因。广泛用于本领域并且适于本发明目的的抗生素抗性基因的例子是抗生素氨苄青霉素、四环素、卡那霉素抗性基因。通常优选利用卡那霉素作为生产VLP的方法中的选择试剂,因为卡那霉素与可选的抗生素相比具有更低的变应原潜力,并且利用VLP作为疫苗导致更低的安全性问题。而且,卡那霉素与可选的抗生素如氨苄青霉素相比提供了更好的质粒保持。源于转座子Tn903的卡那霉素3’-磷酸转移酶基因(SEQ ID NO29)因此是特别有用的选择性标记基因。
出于成本和安全方面的原因,向培养基中添加抗生素通常在商业生产过程中是不期望的。在本发明的上下文中,选择表达株典型且优选地使用抗生素,优选卡那霉素。生产过程中使用的培养基基本上没有抗生素,特别是卡那霉素。然而,添加抗生素到用于生产接种物(用于生产培养)的预培养物中可在整个过程中提高质粒的保持(实施例10)。
熟练技术人员通过利用分子生物学的标准方法结合上述基因元件可产生包含表达构建体的表达质粒,所述构建体对于生产噬菌体的VLP是有用的。对于本发明目的特别有用的表达质粒是用于Qβ VLP生严的pTac-nSDQb-mut(SEQ ID NO1)和用于AP205 VLP生产的pTac-nSDAP205(SEQ ID NO30)。这些特定表达质粒的构建在实施例部分详细描述。
通过任何本领域已知的方法,优选地通过电穿孔,将表达质粒转化入细菌表达宿主中。在细胞裂解后通过SDS-PAGE根据重组衣壳蛋白的最大表达选出包含表达质粒的宿主的个别克隆。选出的包含表达质粒的表达宿主的克隆可储存为冷冻的甘油培养物。
所述细菌宿主可以选自任何在细胞分裂过程中能够复制和保持所述表达质粒的细菌菌株。优选的细菌宿主是具有以下部分描述的特定特征的大肠杆菌菌株。
细菌宿主过量表达阻遏物可增强启动子的阻遏。在一个实施方式中,所述细菌宿主的所述培养以分批培养的方式在所述启动子被lacI阻遏的条件下进行。在一个优选实施方式中,引起所述lacI在所述细菌宿主中过量表达的基因定位于质粒上,优选地定位于所述表达质粒上。可选地,所述基因定位于包含在所述细菌宿主中的分离质粒上,其中所述分离质粒优选地是高拷贝数的质粒。可选地,并且最优选地,所述基因定位于所述细菌宿主的染色体上。
导致lacI过量表达的一个例子是lacIq(Menzella等人.2003,Biotechnology and Bioengineering 82(7)809-817),其在lacI启动子区域的-35处有一个CG到TA的改变,引起lacI表达的提高10倍。另一个例子是lacIQ1(Glascock和Weickert 1998,Gene 223(1-2)221-231)。在生长期中增强的启动子阻遏导致增强的质粒保持和更高的细胞密度,最终导致提高的蛋白质产量。例如,包含lacIq基因的细菌菌株过量表达lacI阻遏物分子并且因此在生长期比包含野生型基因的菌株相比更有效地阻止重组蛋白的形成。在一个优选实施方式中,导致所述lacI过量表达的基因是lacIQ1或lacIq,优选lacIq。在一个特别优选的实施方式中,所述细菌宿主在其染色体上包含lacIq基因。
在一个实施方式中,所述启动子的所述诱导利用诱导物进行,其中所述诱导物优选地选自IPTG和乳糖,最优选地所述诱导物是乳糖。细菌宿主暴露于诱导物时,阻遏物被灭活而启动子成为有活性的。添加强诱导物IPTG到培养基中导致重组蛋白的表达率立即上升到高水平,因为IPTG通过扩散直接进入细胞并且结合并灭活活性阻遏物lacI。失活的lacI阻遏物分子从操纵子上解离下来,并且允许从启动子开始高水平转录。IPTG不被细胞代谢并且转录以高比率持续直到其他代谢参数成为限制性的。
如以前提到的,高表达率可能导致不能通过自装配形成VLP的不溶性重组蛋白的形成。利用高浓度IPTG诱导蛋白质表达特别倾向于形成不溶性蛋白质。因此,启动子的诱导优选地通过以低于导致发生最大表达率表达的浓度的浓度添加IPTG来实现(Kopetzki等人.1989,Mol Gen Genet 216149-155)。
在一个优选实施方式中,所述启动子的所述诱导利用IPTG进行,其中培养基中所述IPTG的浓度为大约0.001到5mM,优选0.001到1mM,更优选0.005到1mM,更优选0.005到0.5mM。在一个特别优选的实施方式中,所述IPTG的浓度为大约0.001mM,最优选0.001mM。
可选地,启动子的诱导通过添加乳糖而实现。利用乳糖诱导重组蛋白表达需要细菌宿主能够从培养基中吸收乳糖,例如,通过Lac通透酶吸收乳糖,并且需要细菌宿主包含β-半乳糖苷酶活性。细胞依赖Lac通透酶吸收乳糖的动力学比通过扩散吸收IPTG遵循更慢。而且,乳糖不直接与lac操纵子作用,但是被β-半乳糖苷酶转化为异乳糖(1-6-O-β-吡喃半乳糖基-D-葡萄糖),异乳糖是启动子的实际上的诱导物。通过添加乳糖诱导重组蛋白表达是有益的,因为它避免了表达率在添加诱导物后立即增加到最大值,因而降低了不溶性蛋白质形成的风险。
异乳糖在生产期被细菌宿主代谢,并且对细菌代谢贡献碳和代谢能量。与用IPTG诱导相比这可以进一步有助于提高蛋白质产量。而且,乳糖诱导在一定程度上允许通过培养基中的乳糖浓度控制重组蛋白在生产期中的表达率。乳糖诱导进一步在药物生产过程中是优选的,因为IPTG是昂贵的并且被认为是有毒的。它的去除需要在生产过程的最后进行证明。
在一个优选实施方式中,所述启动子的所述诱导是通过添加乳糖到所述分批培养物中进行的,其中优选地所述细菌宿主能够从培养基中吸收乳糖,并且其中进一步优选地所述细菌宿主包含β-半乳糖苷酶活性。所述细菌菌株可以获自,例如,菌株保藏机构,如ATTC(http://www.atcc.org)。在一个优选实施方式中,所述细菌宿主是大肠杆菌菌株,优选地是选自RB791、DH20、Y1088、W3110和MG1655的大肠杆菌菌株。最优选地,所述细菌宿主是大肠杆菌RB791。在一个更优选的实施方式中,所述启动子是tac启动子或其突变体或变体,并且所述细菌宿主是进一步包含导致tac启动子的阻遏物过量表达的基因的大肠杆菌菌株,其中所述基因优选地是lacIq。细菌宿主的培养基的pH可在发酵过程中控制,通过利用本领域公知的方法添加酸性或碱性溶液而调整。在一个实施方式中,所述细菌宿主的培养和所述分批培养物的补料在控制培养基的pH的条件下进行。在一个优选实施方式中,所述pH在5.5到8.0之间,更优选在6.5到7.5之间,更优选在6.7到7.0之间,最优选地所述培养基的pH是6.8。所述培养基的pH可在过程中保持恒定,或可在过程的不同阶段在上述pH范围内遵循某种分布。在一个优选实施方式中,所述pH保持恒定在6.7到7.0之间的值,优选地所述pH保持恒定在6.8。
本发明的方法包含生长期,其中所述生长期包含分批期和补料期,其中所述生长期和同时的所述分批期起始于所述细菌宿主的培养,并且其中所述补料期起始于用所述主碳源对所述分批培养物的补料。
细菌细胞的氧化能力是有限的,底物的高浓度可能导致还原产物例如醋酸盐的形成,其可能导致不期望的培养基的酸化,并导致细菌的生长减慢。因此,细菌宿主在具有有限量的底物的基本培养基上以补料分批培养的方式生长。在一个实施方式中,所述细菌宿主的培养在包含所述主碳源的培养基中进行,其中所述培养基优选地是一种基本培养基,优选一种化学成分确定的基本培养基。最优选地所述培养基是如实施例5所述的R27培养基。
在分批期的最后,当包含在培养基中的底物几乎被耗尽时,用包含主碳源的培养基(补料培养基)以与期望的细菌宿主生长速率相同的速率向所述分批培养物中补料,即,细菌宿主的生长速率被底物的补料速率所限制。熟练技术人员可以理解决定性的参数是底物(优选主碳源)和其他保持生长所需的营养成分的实际物质流量。由于在实践中可以设定补料培养基的恒定组成,流速是指培养基的体积流量。对共补料培养基有同样的考虑(见下面)。
因此,在一个实施方式中,用所述主碳源对所述分批培养物的补料以一定的流速进行,其中所述流速限制了所述细菌宿主的生长速率。
在补料期,如果不发生抑制,生长速率可在几乎高达最大生长速率(μmax)的宽范围内自由选择。μmax的实际值高度依赖于细菌菌株、表达构建体和生长条件。熟练技术人员将能理解μmax的确定在启动子被阻遏的条件下进行。
对于给定的试验设置,μ可通过以下步骤由培养生长曲线确定将例如根据OD600或细胞湿重(CWW)确定的生物量浓度(x)对培养时间作图,并基于等式x=x0eμt确定指数生长系数μ。μmax的实际值被确定为当不发生底物限制时,即在不通过补料提供附加培养基的情况下,指数生长的分批培养物在分批培养期开始时的生长速率μ。生长速率μ可通过计算在时间t2测量的总生物量X2的自然对数和在时间t1测量的总生物量X1的自然对数的差与时间差(t2-t1)的比值来确定μ=(lnX2-lnX1)/(t2-t1)。
补料分批培养允许保持恒定的生长速率(μ)。在一个优选实施方式中,底物,优选主碳源,在补料期根据生物量(x)的指数增长而补加。如果在补料期以与消耗速率相同的速率提供底物,则培养处于准稳定状态,类似于在连续培养中的培养。由于生物量的形成和底物消耗是以参考底物的产率系数Yx/s(生物量[g]/底物[g])相互联系,每时间单元(t)待提供的底物量(s)根据公式ds/dt=μ/Yx/sx0toteμt计算,其中x0tot是在补料开始时的总生物量。
因此,在一个优选实施方式中,利用所述主碳源对所述分批培养物的补料以一定的流速进行,其中所述流速以指数系数μ增长,并且其中优选地所述指数系数μ低于μmax。因此,所述细菌宿主在补料期的生长速率设定为低于μmax的数值。在一个优选实施方式中,所述指数系数μ大约为μmax的30%到70%,最优选地大约为μmax的50%。在本发明的一个特定实施方式中,μ被设定为0.15到0.45h-1、更优选0.25到0.35h-1的绝对值、最优选地μ为0.3h-1,只要该方法的设置使这些数值小于μmax。
细菌能够利用广泛范围的不同底物。对于本发明的目的,优选的主碳源是葡萄糖和甘油,优选甘油。虽然可以达到的表达宿主的最大比生长速率(μmax)在利用葡萄糖时比利用甘油时更高,但是甘油引起更少的醋酸盐形成并提供每份底物更高的生物量(Yx/s),并且最终提供更高的重组蛋白产量。而且,液体底物甘油的处理比固体碳源如葡萄糖更容易,固体碳源的处理需要在一个独立的步骤中溶解。
如前面提到的,质粒的保持,即表达质粒在发酵过程中在细菌宿主中的保持,对于重组蛋白的最优生产是关键的。质粒保持的评价可通过将细菌细胞涂布在固体培养基上形成单个菌落,并测试各个菌落的抗生素抗性。例如,100%的质粒保持意味着100个测试菌落中有100个包含由表达质粒赋予的特定抗生素抗性。对于本发明的目的,在发酵过程的最后质粒保持高于80%,优选高于90%,更优选高于95%,甚至更优选高于97%,最优选为100%。
细菌菌株的最适生长温度是其达到最大生长速率(μmax)时的温度。在其他的非限制性条件下,对于大多数大肠杆菌菌株,该温度为大约37℃。然而,包含表达构建体的细菌菌株在最适生长温度和没有选择性抗生素条件下的生长可能促进表达质粒的损失,而当表达菌株在较低的温度下生长时质粒保持通常被提高。尽管与在最适生长温度下生长时相比,菌株在低于其最适生长温度的温度下生长时表达菌株的最大生长速率较低,但是由于质粒保持提高,在较低温度下重组蛋白的产量可能相同或甚至更好。
在本发明的一个实施方式中,所述细菌宿主的培养和/或利用所述主碳源对所述分批培养物的补料和/或利用诱导物诱导所述启动子在低于所述细菌宿主的最适生长温度的温度下进行。在一个优选实施方式中,所述温度在20到37℃之间,优选地在23到35℃之间,更优选地在25到33℃之间,甚至更优选地在27到32℃之间,更优选在28到31℃之间。更优选地所述温度大约是30℃,最优选地所述温度是30℃。
本发明的方法包含生产期,其中所述生产期起始于用一种诱导物诱导所述启动子。所述生产期起始的时间点可基于培养时间和/或生长参数而确定。
在发酵过程中细菌宿主的生长可通过测定在600nm下的光密度(OD600)、细胞湿重(CWW[g/l])和细胞干重(CDW[g/l])而评价。这些参数可用于确定通过向培养基中添加诱导物(优选乳糖)启动生产期的最佳时间点。熟练技术人员显然知道,一方面在生产期起始时较高的CWW可通过延长补料期而获得并且可导致重组蛋白的产量提高,但是另一方面,过于老化的培养物可能表现出不充分的蛋白表达。因而需要对特定生产条件确定通过用诱导物诱导所述启动子而启动的生产期起始的最佳时间点。例如,对于总体积为2升的大肠杆菌RB791中的Qβ CP表达,诱导开始于大约14小时之后,当OD600达到大约40到60时。令人惊讶的是,在50升规模的同样过程中发现了类似的参数,其中诱导也开始于大约14小时之后,当OD600达到大约50时。
因此,在本发明的一个实施方式中,利用所述诱导物对所述启动子进行所述诱导在开始所述生长期后10小时到16小时进行,优选地在12小时到15小时之后,更优选地在13小时到15小时之后,最优选地在大约14小时之后进行,其中优选地在OD600达到大约40到60、优选大约50时利用所述诱导物对所述启动子进行所述诱导。
在一个进一步的实施方式中,利用所述诱导物对所述启动子的所述诱导在延长的补料期之后进行,其中优选地在开始在培养基中培养所述细菌宿主14小时到20小时之后,优选地在15到18小时之后,更优选地在16小时到17小时之后,最优选地在大约16.5小时之后,利用所述诱导物对所述启动子进行所述诱导,其中优选地在OD600达到大约80到90时、优选大约85时利用所述诱导物对所述启动子进行所述诱导。
在本发明的一个实施方式中,利用所述诱导物对所述启动子的所述诱导在OD600达到数值25到60、优选25到55、更优选30到50、最优选30到40时进行。在一个特别优选的实施方式中,利用所述诱导物对所述启动子的所述诱导在OD600为35时进行。
在本发明的另一实施方式中,利用所述诱导物对所述启动子的所述诱导在延长的补料期之后,当OD600达到值60到120、优选70到110、更优选80到100、最优选80到90时进行。在一个特别优选的实施方式中,在延长的补料期之后,当OD600为大约85时,优选为85时,开始诱导。
利用IPTG的诱导在本发明的一个实施方式中,利用诱导物对所述启动子的所述诱导通过添加IPTG实现,其中优选地继续用主碳源对培养物进行补料。由于IPTG不被细菌宿主代谢,可通过单次添加IPTG达到期望的浓度而实现诱导。可选地,可通过将IPTG连续流加到培养物中而实现诱导。在一个优选实施方式中,可通过以单次添加或连续流加的方式添加IPTG进行诱导,其中用主碳源向分批培养物中的所述补料以所述主碳源的恒定的或渐增的流速持续,主碳源的流速以指数增加。
利用乳糖的诱导如上所述,蛋白质表达的诱导可选地通过添加乳糖到培养基中而获得。在本发明的一个实施方式中,在生产期开始时,中断底物的指数补料,并且以恒定流速向培养物中提供包含100到300g/l、优选100g/l乳糖作为唯一碳源的诱导培养基(乳糖补料培养基)。优选地,乳糖的恒定流速大约等于在补料期最后的底物流速。
在本发明的一个优选实施方式中,用诱导物对所述启动子的所述诱导通过添加乳糖而获得,其中优选地所述乳糖以连续流加方式补加到所述分批培养物中,并且优选地,不继续用所述主碳源对所述分批培养物进行补料。
在添加乳糖到培养物中后,β-半乳糖苷酶活性增加,乳糖转化为异乳糖,异乳糖诱导tac启动子,启动了重组衣壳的表达。平行地,异乳糖进一步被代谢并且有助于对细菌宿主的能量供应。诱导培养基的补料速率和细胞的乳糖消耗的平衡因此决定了表达率。该级联中涉及的酶反应允许以包涵体形成被最小化的方式控制该过程。诱导步骤的进程可通过确定培养物中的β-半乳糖苷酶活性而监测,例如,通过使用β-半乳糖测试试剂盒(Invitrogen,K1455-01)。
在本发明的一个更优选的实施方式中,用诱导物对所述启动子的所述诱导通过添加乳糖而获得,其中优选地所述乳糖以连续流加方式补加到所述分批培养物中,并且其中优选地,继续用所述主碳源对所述分批培养物进行补料。
诱导物的不连续添加所述诱导物可通过在生产期开始时单次添加或通过在生产期中少数几次随后的添加而不连续地添加到培养物中。当诱导物是IPTG时,诱导物的不连续添加,特别是单次添加是特别适合的,因为IPTG不被细菌宿主所代谢。因此,典型地和优选地,在生产期中替换被代谢的IPTG是不必要的。在一个实施方式中,用诱导物对所述启动子的所述诱导通过添加所述诱导物到培养基中而进行,所述诱导物优选为IPTG或乳糖,最优选为IPTG,其中所述诱导物在生产期开始时通过单次添加马上添加到大约其最终浓度,其中优选地继续用所述主碳源对所述分批培养物进行补料。在一个优选实施方式中,用诱导物对所述启动子的所述诱导通过添加IPTG到所述培养基中进行,其中所述IPTG通过单次添加马上添加到大约其最终浓度,其中优选地,继续用所述主碳源对所述分批培养物进行补料。可选地,用诱导物对所述启动子的所述诱导通过添加所述诱导物到所述培养基中而进行,所述诱导物优选为IPTG或乳糖,最优选为乳糖,其中所述添加在生产期中分几个步骤进行,优选为1到5个,更优选2到4个,最优选3个步骤,其中优选地继续用所述主碳源对所述分批培养物进行补料。
诱导物的连续添加(补料)优选地,所述诱导物以连续流加方式添加到培养基中,优选地贯穿生产期之中。诱导物的连续添加特别适合于乳糖,因为乳糖被细菌宿主代谢,因此在生产期中连续添加乳糖允许在培养基中保持一定的乳糖浓度,这允许启动子的有效诱导。在一个优选实施方式中,用所述诱导物对所述启动子的所述诱导通过用所述诱导物向所述分批培养物中补料而进行,其中优选地所述诱导物是IPTG或乳糖,最优选乳糖,并且其中所述补料以连续流加方式进行,其中进一步优选地所述补料在整个生产期之中进行。
诱导物和主碳源的共补料重组蛋白的表达是一种需要能量的过程。为防止可能由细菌宿主过度消耗诱导物引起的产量损失和其导致的低表达率,可在生产期中向培养物中另外补充底物,优选主碳源,其中诱导物和/或主碳源的流速是恒定的或渐增的,优选是恒定的。当在生产期中以渐增的流速向培养物中补充底物时,流速优选地以指数速度增长。
以恒定流速共补料在一个优选实施方式中,用诱导物对所述启动子的所述诱导通过用所述诱导物和所述主碳源向所述分批培养物中共补料而进行,其中所述诱导物优选是IPTG或乳糖,最优选是乳糖,并且其中所述主碳源是葡萄糖或甘油,优选甘油,其中所述诱导物,优选乳糖和所述主碳源,优选甘油,以一定流速向所述分批培养物中共补料,其中所述流速优选地是大约恒定的。在一个进一步优选的实施方式中,选择所述流速以允许以与生长期最后大致相同的速率补加所述主碳源到所述分批培养物中。在一个进一步优选的实施方式中,所述诱导物(优选乳糖)和所述主碳源(优选甘油)包含在同一培养基(共补料培养基)中。在一个进一步优选的实施方式中,所述共补料培养基以一定的流速补加到所述分批培养物中,其中所述流速优选大约是恒定的,并且其中进一步优选地选择所述流速以允许以与生长期最后大约相同的速率补加所述主碳源到所述分批培养物中。在一个非常优选的实施方式中,所述培养物是乳糖并且所述主碳源是甘油,其中所述乳糖和所述甘油以大约2∶1到1∶4的比例(w/w)向所述分批培养物中共补料。
在本发明的进一步优选的实施方式中,乳糖和所述主碳源,优选甘油,以0∶1到1∶0(w/w)、优选大约2∶1到大约1∶4(w/w)、更优选大约1∶1到1∶3(w/w)、最优选大约1∶3(w/w)的比例向所述分批培养物中共补料。在一个优选实施方式中,乳糖和主碳源(优选甘油)的比例是1∶1(w/w)。在另一个优选实施方式中,乳糖和主碳源(优选甘油)的比例是1∶3(w/w)。在一个更优选的实施方式中,所述共补料培养基包含大约200g/l乳糖和大约200g/l甘油。在一个更优选的实施方式中,共补料培养基包含大约100g/l乳糖和大约300g/l甘油。
以渐增的流速共补料可选地,用诱导物对所述启动子的所述诱导通过用所述诱导物和所述主碳源向所述分批培养物中共补料而进行,其中所述诱导物优选是IPTG或乳糖,最优选乳糖,并且其中所述主碳源是葡萄糖或甘油,优选甘油,其中所述诱导物,优选乳糖和所述主碳源,优选甘油,以一定的流速向所述分批培养物中补料,其中所述流速是渐增的,其中所述流速可以线性或指数特征增加,其中优选地选择起始流速以允许以与生长期最后大约相同的速率将所述主碳源补加到所述分批培养物中。
进一步可选地,用诱导物对所述启动子的所述诱导通过用所述诱导物和所述主碳源向所述分批培养基中共补料而进行,其中所述诱导物优选为IPTG或乳糖,最优选为乳糖,并且其中所述主碳源是葡萄糖或甘油,优选甘油,其中所述诱导物,优选乳糖,以第一流速补加到所述分批培养物中,并且其中所述主碳源,优选甘油,以第二流速补加到所述分批培养物中,其中所述第一流速是恒定的或渐增的,优选恒定的,并且其中所述第二流速是恒定的或渐增的,优选渐增的,其中优选地选择所述第二流速的起始流速,以允许以与生长期最后大约相同的速率将所述主碳源补加到所述分批培养物中。在一个非常优选的实施方式中,所述诱导物是乳糖并且所述主碳源是甘油,其中所述乳糖和所述甘油以大约2∶1到1∶4(w/w)的比例向所述分批培养物中共补料。
通过CDW、CWW或OD600确定的细菌宿主的生长在生产期过程中以低于生长期并且随时间降低的生长速率持续。在本发明的一个进一步的实施方式中,用诱导物对所述启动子的所述诱导通过以渐增的流速用所述诱导物(优选乳糖)和所述主碳源(优选甘油)向所述分批培养物中共补料而进行,优选地流速的增加适合培养物的实际生长速率。在一个进一步优选的实施方式中,所述诱导物(优选乳糖)和所述主碳源(优选甘油)包含在同一培养基(共补料培养基)中,其中优选地乳糖和甘油在所述培养基(共补料培养基)中的比例范围是从大约0∶1到1∶0(w/w),优选大约2∶1到大约1∶4(w/w),更优选大约1∶1到1∶3(w/w),最优选的比例是大约1∶3(w/w)。在一个优选实施方式中,乳糖和主碳源(优选甘油)的比例是1∶3(w/w)。在一个更优选的实施方式中,所述培养基(共补料培养基)包含大约200g/l乳糖和大约200g/l甘油。在一个更优选的实施方式中,诱导培养基包含大约100g/l乳糖和大约300g/l甘油。
在本发明的一个实施方式中,用诱导物对所述启动子的所述诱导通过用所述诱导物(优选乳糖)和所述主碳源(优选甘油)向所述分批培养物中共补料而进行,其中所述诱导物(优选乳糖)和所述主碳源(优选甘油)包含在分别的培养基中,所述培养基分开补加到所述培养物中。
在生产期结束时,通过离心收获细胞。一般在诱导起始后大约5小时,当最终OD600达到90到130时收获细胞。生产期的进一步延长导致更高的OD600和CWW值,并且因此导致表达构建体的产量进一步提高。
收获的细胞可在储存缓冲液中悬浮,并且储存在-80℃下,用于进一步的处理。
在细胞裂解后通过SDS PAGE或LDS PAGE并与蛋白标准比较而确定细胞的总蛋白质含量。可溶性蛋白质的含量通过HPLC确定。表达的衣壳蛋白的身份通过western blotting确定。装配的VLP的浓度可通过大小排阻色谱法进行分析(实施例18)。VLP可通过色谱方法从裂解的细胞中制备纯化。
仅仅只进行小的修改就可将本发明的方法放大为大体积。本发明包括在100毫升到6000升范围内的培养体积。优选的培养体积是40到100升,最优选地是大约50升。熟练技术人员显然知道更大的培养体积特别需要更大体积的用于接种的预培养物。例如,预培养可以分两个或多个预培养体积渐增的步骤进行。为了确保在大培养体积中的质粒保持,用作接种物的预培养物可包含一种抗生素以保持选择压力。熟练技术人员意识到,可通过降低达到期望的最终细胞密度所必需的代数而进一步提高质粒保持。因此,以高细胞密度接种预培养物和分批培养物是有利的。在一个优选实施方式中,预培养物的起始OD600是0.1到0.4,优选大约0.3。
在一个实施方式中,在所述培养步骤之前,所述方法进一步包括将所述细菌宿主导入到培养基中的步骤,其中所述导入利用接种物进行,其中所述接种物在预培养过程中生产,该预培养过程包括所述细菌宿主在含有抗生素(优选卡那霉素)的培养基中生长的步骤。更优选地,所述预培养过程包括所述细菌宿主在第一培养基中生长的步骤,所述第一培养基包含一种抗生素,优选卡那霉素,并且用第二培养基稀释含有细菌宿主的所述第一培养基到OD600为0.1到0.4,优选大约0.3,其中所述第二培养基基本上不含抗生素,并且进一步培养所述细菌宿主。
而且,熟练技术人员显然知道,本发明的发酵过程是一种需氧过程,其需要向培养中的细菌充分供应氧气。细菌宿主的氧气需求尤其随着细胞密度和生长速率的增加而增加。根据总体积和细菌宿主的氧气需求,例如,可以通过搅拌和/或通过通气提供氧气。或者,也可通过用纯氧或纯氧和任何其他气体(优选空气)的混合物进行通气而提供氧气,其中纯氧指通常为技术目的可获得的技术上纯化的气体。给细菌宿主提供氧气的另一个可能性是通过提高发酵罐中的压力提高培养基中的氧分压。
在本发明的一个优选实施方式中,所述细菌宿主的所述培养和/或对所述分批培养物的所述补料和/或利用诱导物对所述启动子的所述诱导在一定条件下进行,其中对所述细菌宿主供应氧气,优选地通过利用空气通气,最优选地通过利用空气以恒定速率通气,其中优选所述氧气的供应贯穿整个过程中,最优选地贯穿延迟期、生长期和生产期,并且其中进一步优选地监测培养基中的氧分压,并且其中可选地或另外通过用纯氧通气给细菌宿主提供氧气,优选地当培养基中的氧分压(pO2)低于某一阈值时。在一个特别优选的实施方式中,所述pO2的阈值在范围0%到6%之间,优选10%到50%之间,更优选20%到45%之间,最优选地所述阈值为大约40%。
在本发明的方法中,优选地对于2升或更高的培养体积,常规应用于氧气供应,优选地通过空气和/或纯氧通气供氧,以维持上述优选的pO2。在放大的过程中,最优选地在40升到100升及以上时,以所述方式进行氧气通气是特别优选的。
因此,本发明的一个实施方式是一种表达能够通过自装配形成VLP的噬菌体重组衣壳蛋白或其突变体或片段的方法,所述方法包括以下步骤a)将表达质粒导入细菌宿主,其中所述表达质粒包含一种表达构建体,其中所述表达构建体包含(i)编码所述重组衣壳蛋白或其突变体或片段的第一核苷酸序列,和(ii)可被乳糖诱导的启动子;b)在包含主碳源的培养基中培养所述细菌宿主;其中所述培养以分批培养方式在所述启动子被lacI阻遏的条件下进行,其中所述细菌宿主过量表达所述lacI;c)用所述主碳源向所述分批培养物中补料;和d)用一种诱导物诱导所述启动子,其中继续用所述主碳源对所述分批培养物进行补料;其中贯穿所述过程的步骤b)到d),向所述细菌宿主中供氧,使所述培养基中的pO2至少为大约10%到50%,优选大约40%,并且其中进一步优选地通过用空气、纯氧或两者的混合物、优选用空气和纯氧的混合物通气而提供所述氧气。
实施例 实施例1 表达质粒pTac-nSD-Qb-mut(SEQ ID NO1)的克隆策略 大肠杆菌RNA噬菌体Qβ的外壳蛋白编码基因(C)从质粒pSDQb-mut(SEQ ID NO33)中扩增。质粒中包含编码133-aa Qβ外壳蛋白(CP)和329-aa通读蛋白(A1)的基因C的序列。为防止通读,NCBI GenBank登录号M99030的核苷酸445-450,TGAACA(SEQ ID NO31),被序列TAATGA(SEQ ID NO32)取代。
来自质粒pSDQb-mut的外壳蛋白编码基因C通过PCR扩增。具有内部EcoRI位点和合成Shine-Dalgarno(SD,SEQ ID No4)序列的寡核苷酸Qb-FOR3/2(SEQ ID NO34)与Qβ CP基因的5’末端退火。寡核苷酸Qblang-REV2/2(SEQ ID NO35)包含内部HindIII位点,并且作为引物与基因C的非编码区的3’末端杂交。1054bp的扩增PCR片段包括NCBI GenBank登录号M99039(除了上述核苷酸改变以外)的核苷酸46-1062和合成的SD序列。PCR片段用限制性酶HindIII/EcoRI消化,并且将产生的1036bp片段插入到修饰的pKK223-3载体(Pharmacia,NCBI GenBank登录号M77749,SEQ ID NO27)的HindIII/EcoRI限制性位点。在这种修饰的pKK223-3载体中,氨苄青霉素抗性基因被载体pUC4K(Pharmacia,NCBI GenBank登录号X06404,SEQ ID NO37)的卡那霉素抗性基因取代。
载体pTac-nSDQb-mut(SEQ ID NO33)与载体pTacQb-mut在Shine-Dalgarno序列上不同。经PCR通过由质粒pTacQb-mut扩增Qβ外壳蛋白编码基因C而导入Shine-Dalgarno序列(nSD,SEQ ID NO3)。具有内部EcoRI位点和相应合成的Shine-Dalgarno(nSD)序列的寡核苷酸nSDQb-mutEcoRIfor(SEQ ID NO36)与Qβ CP基因的5’末端退火。寡核苷酸Qblang-REV2/2(SEQ ID NO35)包含一个内部HindIII位点,并且作为引物与基因C的非编码区的3’末端杂交。1054bp扩增的PCR片段包括NCBI GenBank登录号M99039(除了上述核苷酸改变之外)的核苷酸46-1062和合成的nSD序列。PCR片段用限制性酶HindIII/EcoRI消化,并且将产生的1036bp片段插入到修饰的pKK223-3载体(Pharmacia,NCBI GenBank登录号M77749,SEQ IDNO27)的HindIII/EcoRI限制性位点。在这种修饰的pKK223-3载体中,氨苄青霉素抗性基因被载体pUC4K(Pharmacia,NCBI GenBank登录号X06404,SEQ ID NO37)的卡那霉素抗性基因所取代。
实施例2 表达质粒pTac-nSD-AP205(SEQ ID NO30)的克隆策略 不动杆菌(Acinetobacter)噬菌体AP205的外壳蛋白编码基因从质粒pAP205-58中扩增。该质粒包含编码噬菌体AP205的131个氨基酸的衣壳蛋白的外壳蛋白基因序列(相应于NCBI GenBank登录号AF334111的核苷酸1908-2303)。
外壳蛋白编码基因通过PCR扩增。具有内部EcoRI位点和合成的Shine-Dalgarno(nSD)序列的寡核苷酸nSDAP238-EcoRIfor(SEQ IDNO38)与外壳蛋白基因的5’末端退火。寡核苷酸AP238HindIIIrev(SEQ ID NO39)包含内部HindIII位点,并且作为引物与外壳蛋白基因的3’末端杂交。该寡核苷酸在外壳蛋白的天然存在的终止密码子之后导入第二终止密码子。438bp扩增的PCR片段包括NCBI GenBank登录号AF334111的核苷酸1908-2303和合成的nSD序列。PCR片段利用限制性酶HindIII/EcoRI消化,并且将得到的420bp片段插入到修饰的载体pKK223-3(Pharmacia,NCBI GenBank登录号M77749,SEQ ID NO27)的HindIII/EcoRI限制性位点。在这种修饰的pKK223-3载体中,氨苄青霉素抗性基因被载体pUC4K(Pharmacia,NCBIGenBank登录号X06404,SEQ ID NO37)的卡那霉素抗性基因所取代。
实施例3 在tac启动子和nSD控制下的Qβ CP的表达 大肠杆菌菌株RB791用质粒pTac-nSD-Qb-mut(SEQ ID NO1)转化。克隆在摇瓶中生长。每个摇瓶中包含100ml含有卡那霉素(25μg/ml)的R40培养基(主培养基,Hypep 7455,甘油,见实施例5),并且用过夜培养物接种,起始OD600为0.3。摇瓶于30℃和220rpm搅拌下培养4小时(OD600在4和5之间)。诱导用0.5%的乳糖进行4小时。蛋白质产量通过SDS-PAGE确定。显示出强烈的蛋白条带的凝胶被鉴定为Qβ CP。
实施例4 在tac启动子和SD(与nSD对比)的控制下的AP205 CP的表达 在摇瓶中筛选出pTac-nSDAP205(SEQ ID NO30)的9个克隆和pTac-SDAP205的6个克隆。pTac-SDAP205(SEQ ID NO40)除了包含SEQ ID NO4的Shine-Dalgarno序列而不是SEQ ID NO3的Shine-Dalgarno序列之外与pTac-nSDAP205相同。每个摇瓶包含50ml含有卡那霉素(25μg/ml)的R40培养基(主培养基,Hypep 7455,甘油,见实施例5),用过夜培养物接种,起始OD600为0.3(对于pTac-nSDAP205)或0.4(对于pTac-SDAP205)。摇瓶在30℃和220rpm搅拌下培养4小时。用0.5%乳糖进行诱导。蛋白质产量通过SDS-PAGE确定。对于所有测试克隆,源于pTac-nSDAP205的AP205CP表达显著强于源于pTac-SDAP205的表达。
实施例5 培养基的组成 培养基的组成如表1所述 表1培养基的组成
实施例6 在补料分批过程中Qβ CP的表达(2升规模) 发酵过程在生物反应器(Applikon 5L凹底)中进行,其配备2个盘式搅拌器(

6cm)、隔板(3×16cm),具有pH-、pO2-和温度控制,以及发酵软件BioXpert Version 2.22。
将质粒pTac-nSD-Qb-mut转化的RB791的5μL低温培养物接种到包含50ml培养基R40(25μg/mL卡那霉素)的100ml锥形烧瓶中,并在30℃和220RPM下培养14小时过夜。14小时之后OD600值达到6.0。对于分批发酵,将2升培养基(R40)泵入生物反应器中。表2中列出了培养参数。
表2分批阶段的参数设定点
生物反应器用100mL接种物接种。采集2mL样品,测量OD600,并且以14,000RPM离心。分离沉淀物和上清液,冷冻以进一步分析。生物量浓度[g/L]使用下式计算 OD600×0.45[g×L-1×OD600-1]=生物量[g/L]. 总蛋白质含量中的Qbeta百分含量如下计算,假定大肠杆菌生物量中的50%为蛋白质 生物量[g×L-1]/2=总蛋白质[g×L-1] Qbeta[g×L-1]/总蛋白质[g×L-1]×100=Qbeta/总蛋白质[%]。
在补料分批模式中,其按照分批模式增加一个补料期。在补料期中,按照限定的分布向反应器中的细胞供应底物。补料分布依赖于选择的生长速率μ、产率系数生物量比甘油(Yx/甘油)、体积(Vf)、补料中底物的浓度(cf)。底物浓度。补料利用下式计算 补料公式 mf=(μ/Yx/s+m)Vf×Xf×eμt 泵=(mf/cf+b)/a mf=质量流速[g/h] μ=比生长速率[l/h] Yx/Glycerol=生物物质产量比甘油[g/g] m=能量保持[g*g-1*h-1] Vf=在补料开始的体积 Xf=在补料开始的生物量 cf=补料中的底物浓度[g/mL] a+b=泵校准公式的偏移/斜率 为了确定校准参数a和b,进行泵校准。另外,具有补料瓶的补料管被钳在补料泵中,泵以7%、14%和21%的泵性能运行。记录每次泵入的补料体积。在泵性能[%]与被泵入的补料液的关系的结果图表中,确定斜率(a)和Y-轴(b)。对于补料分批培养,在生物反应器中设定表3的参数。
表3生物反应器中的补料分批培养参数
在达到大约7小时的过程时间之后(分批结束),补料泵自动开启。在进一步培养7小时之后,当OD600达到55-60时,将补料培养基(用于生物物质的繁殖)更换为诱导培养基R42(用于生物物质的繁殖和诱导)。5小时之后停止R42补料,通过离心收获培养物。
过程参数的分析 常规分析下述过程参数。在整个过程时间中联机测量pO2、pH、温度和搅拌速度。脱机测量600nm的光密度。β-半乳糖苷酶活性的确定利用β-半乳糖测试试剂盒(Invitrogen,目录号K1455-01)进行。活性用单位每ml表示,OD600=1.0。其定义为每分钟每mL细菌悬浮液(OD600=1.0)水解邻硝基苯基-β-D-吡喃半乳糖苷(ONPG)的量(以nmol表示)。累积的产物通过SDS-PAGE分析,确定总蛋白质含量(可溶性和不溶性蛋白质),并且利用HPLC分析测定可溶性部分。大肠杆菌的细胞裂解在裂解缓冲液(50mM葡萄糖,25mM tris/HCl(pH 8),15mM EDTA(pH 8.0))中利用超声匀浆器(Bandlin Sonoplus,HD2070)进行。OD600为50的250μL细菌悬浮液以1400RPM离心10分钟。沉淀物在250μL裂解缓冲液中重悬浮(涡旋),置于室温下5分钟。然后,利用超声波在10%装置性能下裂解细胞20秒(细胞置于冰上),然后将细胞悬浮液在14000RPM下离心10分钟。上清液(可溶性蛋白质)通过SDS-PAGE和HPLC进行分析。
诱导之前和生产期最后(5小时诱导之后)的样品从生物反应器中取出以通过标准化为OD5.0的SDS-PAGE分析Qβ的形成。在培养最后,收获1.9升的培养物。离心之后,在三个独立的反应流程中获得下列细胞沉淀物1)最终OD600为84194g CWW;2.)最终OD600为88200g CWW;3.)最终OD600为86201g CWW。
在反应1和2中的质粒保持在诱导开始时为100%,在收获时为100%。基于在SDS-PAGE上与QβCP标准的对比,产量大概估计为大约5g/l QβCP。HPLC分析揭示了浓度大约为6g/l QβVLP。
实施例7 碳源和细菌菌株的选择 比较了作为碳源的葡萄糖和甘油。为了测试菌株DH20和RB791中的每一个在这些碳源上的生长表现,利用包含葡萄糖的培养基(R27)和包含甘油的培养基(R40)进行了摇瓶试验。两种培养基中都补充了25μg/ml的卡那霉素。每种培养在起始OD600为0.3时开始。通过添加0.5%乳糖进行诱导。确定的最大比生长速率(μmax)和产率系数(Yx/s)列于表4中。RB791在葡萄糖和甘油两者中都生长较快。另外,获得的产率系数较高。虽然葡萄糖允许更高的最大比生长速率(μmax),但是甘油的产率系数(Yx/s)更高。
表4使用RB791和DH20在葡萄糖和甘油上的培养实验的最大比生长速率和产率系数
实施例8 最适温度的确定 研究了温度对于产物形成的影响。接种了两个摇瓶培养物,在30℃和220rpm下培养。在OD600达到5之后,用乳糖诱导培养物。随后,一种培养物在37℃下继续培养,而另一种培养物在23℃下培养。SDS-PAGE的结果显示了在诱导后4和5小时的表达水平在37℃诱导的培养物中更高。在23℃诱导的培养物中培养物诱导19小时显示了较高的Qβ水平。
实施例9 通过乳糖和甘油共补料的诱导 配制由20%甘油和20%乳糖组成的补料溶液(R42),在诱导开始时加于实施例6描述的发酵中。

图1提供了贯穿整个过程时间的相关过程参数的概要。在13.5小时在OD600大约为5.5时诱导表达。诱导后,将补料泵速设定为恒定的。甘油不随补料而累积。乳糖累积到4g/l,然后开始减少。β-半乳糖苷酶活性上升到10U/ml,然后降低。与以前的发酵流程相比a)乳糖在诱导起始时单次添加,不补料;b)连续补加没有甘油的乳糖,与流程a)和b)进行4小时相比,活性高于7U/ml并且在2小时后达到最大活性。
实施例10 质粒保持 下述操作条件对质粒保持的影响在实施例6描述的过程中进行检测1)预培养物初始体积,2)在预培养物中的卡那霉素,3)在37℃相比30℃时的生长和/或诱导。结果总结在表5中。预培养由来自细胞储存小瓶的5μl体积开始。小体积的接种允许预培养物生长过夜。用于QT0103F8的预培养物包含25mg/l的卡那霉素,而用于QT0103的预培养物不包含任何卡那霉素。这两种发酵都在30℃下进行,诱导5小时。从5小时诱导之前和之后的质粒保持判断,向预培养物中补充卡那霉素对于质粒保持具有积极效果。在5小时诱导之前和之后质粒保持为98%。相反,当预培养物中省略卡那霉素时,质粒保持仅仅达到80%。对于随后的流程,QT0203F7,预培养也以5μl开始,在包含卡那霉素的培养基中生长。在生物反应器中的发酵从一开始就在37℃下进行。在37℃运行对于质粒稳定性具有有害的影响。诱导之前的质粒保持为99%,而在5小时诱导后降低到0%。为了测试较短的预培养和因此较少的代数是否在5小时诱导之后提高质粒保持,一系列预培养从来自解冻的细胞储存小瓶的300μl体积开始并在没有卡那霉素的培养基中生长。两个发酵罐在30℃下进行整个流程。另外两个发酵罐首先在30℃下进行细胞生长,然后切换到37℃进行生产阶段。得到的质粒稳定性在诱导之前和5小时之后都为100%。
表5根据预培养的代数,预培养中有或没有卡那霉素,在37℃的生长和/或诱导的不同操作条件下在诱导之前或5小时之后获得的质粒保持力的概述
实施例11 诱导时间点的变化 在基本上如实施例6所述的过程中,指数补料分布编程为在生物反应器接种后7小时开始。在标准条件下,诱导的预定时间为14小时过程时间。为了测试诱导时间点的变化对于最终细胞密度的影响,在13.5小时诱导(导致6.5小时的指数补料)一种培养物,并且在14.5小时(导致7.5小时的指数补料)诱导另一种培养物。在常规14小时时间点诱导的培养物作为对照(7小时的指数补料)。结果总结在表6中。细胞密度随着补料时间的延长而增加。从可获得的最终CWW数据点的线性回归分析判断,存在线性相关(r2=0.92)。
表6诱导时间点的变化根据OD600和CWW对最终细胞密度的影响
实施例12 收获时间点的变化 在基本上如实施例6所述的过程中的培养物收获以手工进行。在标准条件下,收获的预定时间为19小时过程时间。“收获”的操作涉及手工终止生物反应器的运行。为测试收获时间点的变化对最终细胞密度的影响,一种培养物在18.8小时收获(导致4.8小时的诱导),另一种在19.5小时收获(导致5.5小时的诱导)。一种培养物在常规的19小时时间点收获作为对照(5小时的诱导)。结果总结在表7中。细胞密度随着诱导时间的延长而增加,因为细胞在诱导时仍然生长。
表7收获时间点的变化根据OD600和CWW对最终细胞密度的影响
实施例13 温度的影响 在基本如实施例6所述的过程中发酵温度的影响通过在5个不同温度设定点进行6次发酵进行研究。结果总结在表8中。最终细胞密度对于发酵温度是敏感的,最适温度是30℃。
表8不同温度设置点对根据OD600和CWW的最终细胞密度的结果总结
实施例14 放大的发酵(50升) 将实施例6所述的过程放大到50升体积以评价从2升工作体积生物反应器系统到更大体积的放大能力。放大过程的关键的过程参数总结在表9中。
表9在50L生物反应器中的过程参数 *相对于预生物反应器接种的时间 两个预培养扩增步骤是必要的。在第一步骤中,细胞如2L过程(实施例6)中所建立的那样扩增。在此步骤之后,将细胞分到两个5000ml摇瓶培养物中,每个包含750ml培养基。进一步扩增5小时。在50L生物反应器中的培养按照与2L系统(实施例6)所述相同的时间分布进行。在诱导开始时OD600是46,最终OD600是128。质粒保持在诱导前是100%,在培养最后是98%。培养结束时培养基中QβCP蛋白的浓度利用SDS-PAGE大概估计为8g/l。该反应器运行的Qβ的总量估计是大约300g。
实施例15 延长的指数补料的效果 根据实施例6或14进行的发酵的指数补料期为7小时。在此时间之后,细胞达到诱导的密度,其在诱导过程中增加到大约100到130的目标最大OD600作为最终细胞密度。确定如实施例6和14所述、优选如实施例14所述进行的反应器运行的最终OD600、最终CWW、最终CDW、在诱导开始和收获时的质粒保持、培养结束时的Qβ浓度,其中指数补料期延长到高达11小时、优选10小时的持续时间。
实施例16 在生产过程中增加补料的效果 实施例9证实了甘油在生产期不累积,表明了生产可以不受诱导培养基的补料速率的限制。在如实施例6和14所述、优选如实施例14所述的反应器运行中,确定增加诱导培养基的补料速率对最终OD600、最终CWW、最终CDW、诱导开始和收获时的质粒保持、培养结束时的Qβ浓度的影响,其中在生产过程中提高补料速率。可选地或另外,补料培养基中乳糖和甘油的比例转向更高的甘油和更低的乳糖浓度。
实施例17 QβCP的HPLC分析 QβCP利用HPLC系统如下测定将包含QβCP的样品在包含10mM 1,4-二硫-DL-苏糖醇的1x反应缓冲液(50mM三(羟甲基)氨基甲烷缓冲液,pH8.0)中适当地稀释,并在50℃下在热混合器中温育15分钟。温育之后,将样品离心,在2℃到10℃储存上清液直到HPLC分析。注射10到100μl的样品。
从50℃热平衡的C4反相柱300

,5μm,4.6×150mm,Vydac Inc.Hesperia,USA(目录号214TP5415)上洗脱后,利用对215nm处检测的HPLC峰面积回归的已知Qβ标准的回归曲线,对Qβ进行定量。通过系统的流速是1ml/min,由流动相A(0.12%三氟醋酸水溶液)和流动相B(在乙腈中的0.12%的三氟醋酸)组成,流动相B具有下述梯度0到2分钟恒定在40%,2到8分钟线性增加到50%,8到10分钟恒定在50%,10到10.1分钟线性降低到40%,10.1到12分钟恒定在40%。
实施例18 通过分析性大小排阻色谱确定Qβ VLP 通过分析性大小排阻色谱对Qβ颗粒的分析利用TskgelG5000PWXL-柱(10μm,7.8×300mm,TosoH Biosep;目录号08023)进行,该柱用磷酸缓冲液(20mM Na2HPO4/NaH2PO4,150mM NaCl pH 7.2)平衡。以0.8ml/min在磷酸缓冲液中进行等度梯度洗脱20分钟。根据对260nm下检测的HPLC峰面积回归的已知Qβ标准的回归曲线确定Qβ浓度。
实施例19 延长的指数补料的效果 根据实施例6或14进行的发酵的指数补料期是7小时。在此时间之后,细胞达到诱导密度,其在诱导过程中增加到大约100到130的目标最大OD600作为最终细胞密度。确定如实施例6和14所述、优选如实施例14所述进行的反应器运行的最终OD600、最终CWW、诱导之前和收获时的质粒保持和培养结束时的Qβ浓度,其中指数补料期延长到高达12小时的持续时间。另外,在诱导补料中的甘油和乳糖的浓度分别改变为300g/L和100g/L。结果总结在表10中。
表10培养结束时的OD600和CWW,诱导之前和培养结束时的质粒保持,以及氧质量流量峰值。在不同的指数补料持续时间内进行培养。

根据LDS-PAGE分析,除了利用12小时指数补料的培养外,所有培养的特定的Qβ浓度是相同的。最佳的绝对Qβ产量和氧消耗在9.5小时的指数补料中发现。因此,优选进行具有9.5小时的指数补料期的过程。
实施例20 放大的发酵(50升) 将实施例6中描述的过程和如实施例19中所述的具有300g/l甘油和100g/l乳糖的9.5小时指数补料期的过程放大到50L体积,以评价从2L工作体积的生物反应器系统到更大体积的放大能力。该放大的过程的关键过程参数总结在表11中。
表1150L规模的过程参数 *相对于生物反应器接种时间 为了在更大的反应器中接种大约相同的细胞密度,改变预培养步骤是必要的。在50L生物反应器中的培养利用如实施例19所述对2L规模优化的时间分布进行。六个培养的最终细胞湿重是188g/L±9。在培养结束时的质粒保持是97.3%±1.4。培养结束时培养基中Qβ CP蛋白的浓度通过C4反相HPLC(实施例17)确定为10.8g/L±0.3。对于一次50L的运转,Qβ CP的总量是540g。分析Qβ CP和Qβ VLP的大约两倍浓缩的生物量的粗提取物(实施例18)。Qβ CP的浓度是19.1g/L±0.4(C4反相HPLC),Qβ VLP的浓度是18.8g/L±1.1。因此,在收获时估计发酵过程的VLP产率大约是9-11g/l发酵液。
序列表
<110>赛托斯生物技术公司
M·埃默林格
F·亨内克
H·普夫伦德
M·里尔
P·斯坦纳
<120>可放大的发酵方法
<130>P1049PC00
<150>EP05011416.4
<151>2005-05-26
<150>EP05106729.6
<151>2005-0721
<160>40
<170>PatentIn version 3.3
<210>1
<211>5579
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>1
ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct caaggcgcac tcccgttctg 60
gataatgttt tttgcgccga catcataacg gttctggcaa atattctgaa atgagctgtt120
gacaattaat catcggctcg tataatgtgt ggaattgtga gcggataaca atttcacaca180
ggaaacagaa ttctaaggag gaaaaaaaaa tggcaaaatt agagactgtt actttaggta240
acatcgggaa agatggaaaa caaactctgg tcctcaatcc gcgtggggta aatcccacta300
acggcgttgc ctcgctttca caagcgggtg cagttcctgc gctggagaag cgtgttaccg360
tttcggtatc tcagccttct cgcaatcgta agaactacaa ggtccaggtt aagatccaga420
acccgaccgc ttgcactgca aacggttctt gtgacccatc cgttactcgc caggcatatg480
ctgacgtgac cttttcgttc acgcagtata gtaccgatga ggaacgagct tttgttcgta540
cagagcttgc tgctctgctc gctagtcctc tgctgatcga tgctattgat cagctgaacc600
cagcgtatta atgactgctc attgccggtg gtggctcagg gtcaaaaccc gatccggtta660
ttccggatcc accgattgat ccgccgccag ggacaggtaa gtatacctgt cccttcgcaa720
tttggtccct agaggaggtt tacgagcctc ctactaagaa ccgaccgtgg cctatctata780
atgctgttga actccagcct cgcgaatttg atgttgccct caaagatctt ttgggcaata840
caaagtggcg tgattgggat tctcggctta gttataccac gttccgcggt tgccgtggca900
atggttatat tgaccttgat gcgacttatc ttgctactga tcaggctatg cgtgatcaga960
agtatgatat tcgcgagggc aagaaacctg gtgctttcgg taacattgag cgattcattt 1020
atcttaagtc gataaatgct tattgctctc ttagcgatat tgcggcctat cacgccgatg 1080
gcgtgatagt tggcttttgg cgcgatccat ccagtggtgg tgccataccg tttgacttca 1140
ctaagtttga taagactaaa tgtcctattc aagccgtgat agtcgttcct cgtgcttagt 1200
aactaaggat gaaatgcatg tctaagcttg gctgttttgg cggatgagag aagattttca 1260
gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat ttgcctggcg 1320
gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg1380
ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca tcaaataaaa1440
cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct1500
ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca acggcccgga1560
gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca gaaggccatc1620
ctgacggatg gcctttttgc gtttctacaa actcttttgt ttatttttct agagccacgt1680
tgtgtctcaa aatctctgat gttacattgc acaagataaa aatatatcat catgaacaat1740
aaaactgtct gcttacataa acagtaatac aaggagtgtt atgagccata ttcaacggga1800
aacgtcttgc tcgaggccgc gattaaattc caacatggat gctgatttat atgggtataa1860
atgggctcgc gataatgtcg ggcaatcagg tgcgacaatc tatcgattgt atgggaagcc1920
cgatgcgcca gagttgtttc tgaaacatgg caaaggtagc gttgccaatg atgttacaga1980
tgagatggtc agactaaact ggctgacgga atttatgcct cttccgacca tcaagcattt2040
tatccgtact cctgatgatg catggttact caccactgcg atccccggga aaacagcatt2100
ccaggtatta gaagaatatc ctgattcagg tgaaaatatt gttgatgcgc tggcagtgtt2160
cctgcgccgg ttgcattcga ttcctgtttg taattgtcct tttaacagcg atcgcgtatt2220
tcgtctcgct caggcgcaat cacgaatgaa taacggtttg gttgatgcga gtgattttga2280
tgacgagcgt aatggctggc ctgttgaaca agtctggaaa gaaatgcata agcttttgcc2340
attctcaccg gattcagtcg tcactcatgg tgatttctca cttgataacc ttatttttga2400
cgaggggaaa ttaataggtt gtattgatgt tggacgagtc ggaatcgcag accgatacca2460
ggatcttgcc atcctatgga actgcctcgg tgagttttct ccttcattac agaaacggct2520
ttttcaaaaa tatggtattg ataatcctga tatgaataaa ttgcagtttc atttgatgct2580
cgatgagttt ttctaaacgc gtgaccaagt ttactcatat gtactttaga ttgatttaaa2640
acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa2700
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg2760
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc2820
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac2880
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca2940
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt3000
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc3060
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg3120
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc3180
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac3240
gagggagctc ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct3300
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc3360
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt3420
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac3480
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg3540
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccgca tatggtgcac3600
tctcagtaca atctgctctg atgccgcata gttaagccag tatacactcc gctatcgcta 3660
cgtgactggg tcatggctgc gccccgacac ccgccaacac ccgctgacgc gccctgacgg 3720
gcttgtctgc tcccggcatc cgcttacaga caagctgtga ccgtctccgg gagctgcatg 3780
tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc agctgcggta aagctcatca 3840
gcgtggtcgt gaagcgattc acagatgtct gcctgttcat ccgcgtccag ctcgttgagt 3900
ttctccagaa gcgttaatgt ctggcttctg ataaagcggg ccatgttaag ggcggttttt 3960
tcctgtttgg tcactgatgc ctccgtgtaa gggggatttc tgttcatggg ggtaatgata 4020
ccgatgaaac gagagaggat gctcacgata cgggttactg atgatgaaca tgcccggtta 4080
ctggaacgtt gtgagggtaa acaactggcg gtatggatgc ggcgggacca gagaaaaatc 4140
actcagggtc aatgccagcg cttcgttaat acagatgtag gtgttccaca gggtagccag 4200
cagcatcctg cgatgcagat ccggaacata atggtgcagg gcgctgactt ccgcgtttcc 4260
agactttacg aaacacggaa accgaagacc attcatgttg ttgctcaggt cgcagacgtt 4320
ttgcagcagc agtcgcttca cgttcgctcg cgtatcggtg attcattctg ctaaccagta 4380
aggcaacccc gccagcctag ccgggtcctc aacgacagga gcacgatcat gcgcacccgt 4440
ggccaggacc caacgctgcc cgagatgcgc cgcgtgcggc tgctggagat ggcggacgcg 4500
atggatatgt tctgccaagg gttggtttgc gcattcacag ttctccgcaa gaattgattg 4560
gctccaattc ttggagtggt gaatccgtta gcgaggtgcc gccggcttcc attcaggtcg 4620
aggtggcccg gctccatgca ccgcgacgca acgcggggag gcagacaagg tatagggcgg 4680
cgcctacaat ccatgccaac ccgttccatg tgctcgccga ggcggcataa atcgccgtga 4740
cgatcagcgg tccaatgatc gaagttaggc tggtaagagc cgcgagcgat ccttgaagct 4800
gtccctgatg gtcgtcatct acctgcctgg acagcatggc ctgcaacgcg ggcatcccga 4860
tgccgccgga agcgagaaga atcataatgg ggaaggccat ccagcctcgc gtcgcgaacg 4920
ccagcaagac gtagcccagc gcgtcggccg ccatgccggc gataatggcc tgcttctcgc 4980
cgaaacgttt ggtggcggga ccagtgacga aggcttgagc gagggcgtgc aagattccga 5040
ataccgcaag cgacaggccg atcatcgtcg cgctccagcg aaagcggtcc tcgccgaaaa 5100
tgacccagag cgctgccggc acctgtccta cgagttgcat gataaagaag acagtcataa 5160
gtgcggcgac gatagtcatg ccccgcgccc accggaagga gctgactggg ttgaaggctc 5220
tcaagggcat cggtcgacgc tctcccttat gcgactcctg cattaggaag cagcccagta 5280
gtaggttgag gccgttgagc accgccgccg caaggaatgg tgcatgcaag gagatggcgc 5340
ccaacagtcc cccggccacg gggcctgcca ccatacccac gccgaaacaa gcgctcatga 5400
gcccgaagtg gcgagcccga tcttccccat cggtgatgtc ggcgatatag gcgccagcaa 5460
ccgcacctgt ggcgccggtg atgccggcca cgatgcgtcc ggcgtagagg atccgggctt 5520
atcgactgca cggtgcacca atgcttctgg cgtcaggcag ccatcggaag ctgtggtat 5579
<210>2
<211>245
<212>DNA
<213>人工序列
<220>
<223>启动子序列
<400>2
cgactgcacg gtgcaccaat gcttctggcg tcaggcagcc atcggaagct gtggtatggc 60
tgtgcaggtc gtaaatcact gcataattcg tgtcgctcaa ggcgcactcc cgttctggat120
aatgtttttt gcgccgacat cataacggtt ctggcaaata ttctgaaatg agctgttgac180
aattaatcat cggctcgtat aatgtgtgga attgtgagcg gataacaatt tcacacagga240
aacag245
<210>3
<211>19
<212>DNA
<213>人工序列
<220>
<223>SD序列
<400>3
taaggaggaa aaaaaaatg19
<210>4
<211>18
<212>DNA
<213>人工序列
<220>
<223>SD序列
<400>4
aggaggtaaa aaacgatg 18
<210>5
<211>133
<212>PRT
<213>噬菌体Qbeta
<400>5
Met Ala Lys Leu Glu Thr Val Thr Leu Gly Asn Ile Gly Lys Asp Gly
1 5 10 15
Lys Gln Thr Leu Val Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly
20 25 30
Val Ala Ser Leu Ser Gln Ala Gly Ala Val Pro Ala Leu Glu Lys Arg
35 40 45
Val Thr Val Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys
50 55 60
Val Gln Val Lys Ile Gln Asn Pro Thr Ala Cys Thr Ala Asn Gly Ser
65 70 75 80
Cys Asp Pro Ser Val Thr Arg Gln Ala Tyr Ala Asp Val Thr Phe Ser
85 90 95
Phe Thr Gln Tyr Ser Thr Asp Glu Glu Arg Ala Phe Val Arg Thr Glu
100 105 110
Leu Ala Ala Leu Leu Ala Ser Pro Leu Leu Ile Asp Ala Ile Asp Gln
115 120 125
Leu Asn Pro Ala Tyr
130
<210>6
<211>1017
<212>DNA
<213>人工序列
<220>
<223>表达构建体
<400>6
atggcaaaat tagagactgt tactttaggt aacatcggga aagatggaaa acaaactctg 60
gtcctcaatc cgcgtggggt aaatcccact aacggcgttg cctcgctttc acaagcgggt120
gcagttcctg cgctggagaa gcgtgttacc gtttcggtat ctcagccttc tcgcaatcgt180
aagaactaca aggtccaggt taagatccag aacccgaccg cttgcactgc aaacggttct240
tgtgacccat ccgttactcg ccaggcatat gctgacgtga ccttttcgtt cacgcagtat300
agtaccgatg aggaacgagc ttttgttcgt acagagcttg ctgctctgct cgctagtcct360
ctgctgatcg atgctattga tcagctgaac ccagcgtatt aatgactgct cattgccggt420
ggtggctcag ggtcaaaacc cgatccggtt attccggatc caccgattga tccgccgcca480
gggacaggta agtatacctg tcccttcgca atttggtccc tagaggaggt ttacgagcct540
cctactaaga accgaccgtg gcctatctat aatgctgttg aactccagcc tcgcgaattt600
gatgttgccc tcaaagatct tttgggcaat acaaagtggc gtgattggga ttctcggctt660
agttatacca cgttccgcgg ttgccgtggc aatggttata ttgaccttga tgcgacttat720
cttgctactg atcaggctat gcgtgatcag aagtatgata ttcgcgaggg caagaaacct780
ggtgctttcg gtaacattga gcgattcatt tatcttaagt cgataaatgc ttattgctct840
cttagcgata ttgcggccta tcacgccgat ggcgtgatag ttggcttttg gcgcgatcca900
tccagtggtg gtgccatacc gtttgacttc actaagtttg ataagactaa atgtcctatt960
caagccgtga tagtcgttcc tcgtgcttag taactaagga tgaaatgcat gtctaag 1017
<210>7
<211>132
<212>PRT
<213>噬菌体Qbeta
<400>7
Ala Lys Leu Glu Thr Val Thr Leu Gly Asn Ile Gly Arg Asp Gly Lys
1 5 10 15
Gln Thr Leu Val Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly Val
20 25 30
Ala Ser Leu Ser Gln Ala Gly Ala Val Pro Ala Leu Glu Lys Arg Val
35 40 45
Thr Val Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys Val
50 55 60
Gln Val Lys Ile Gln Asn Pro Thr Ala Cys Thr Ala Asn Gly Ser Cys
65 70 75 80
Asp Pro Ser Val Thr Arg Gln Lys Tyr Ala Asp Val Thr Phe Ser Phe
85 90 95
Thr Gln Tyr Ser Thr Asp Glu Glu Arg Ala Phe Val Arg Thr Glu Leu
1 100 105 110
Ala Ala Leu Leu Ala Ser Pro Leu Leu Ile Asp Ala Ile Asp Gln Leu
115 120 125
Asn Pro Ala Tyr
130
<210>8
<211>132
<212>PRT
<213>噬菌体Qbeta
<400>8
Ala Lys Leu Glu Thr Val Thr Leu Gly Lys Ile Gly Lys Asp Gly Lys
1 5 10 15
Gln Thr Leu Val Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly Val
20 25 30
Ala Ser Leu Ser Gln Ala Gly Ala Val Pro Ala Leu Glu Lys Arg Val
35 40 45
Thr Val Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys Val
50 55 60
Gln Val Lys Ile Gln Asn Pro Thr Ala Cys Thr Ala Asn Gly Ser Cys
65 70 75 80
Asp Pro Ser Val Thr Arg Gln Lys Tyr Ala Asp Val Thr Phe Ser Phe
85 90 95
Thr Gln Tyr Ser Thr Asp Glu Glu Arg Ala Phe Val Arg Thr Glu Leu
100 105 110
Ala Ala Leu Leu Ala Ser Pro Leu Leu Ile Asp Ala Ile Asp Gln Leu
115 120 125
Asn Pro Ala Tyr
130
<210>9
<211>132
<212>PRT
<213>噬菌体Qb
<400>9
Ala Arg Leu Glu Thr Val Thr Leu Gly Asn Ile Gly Arg Asp Gly Lys
1 5 10 15
Gln Thr Leu Val Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly Val
20 25 30
Ala Ser Leu Ser Gln Ala Gly Ala Val Pro Ala Leu Glu Lys Arg Val
35 40 45
Thr Val Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys Val
50 55 60
Gln Val Lys Ile Gln Asn Pro Thr Ala Cys Thr Ala Asn Gly Ser Cys
65 70 75 80
Asp Pro Ser Val Thr Arg Gln Lys Tyr Ala Asp Val Thr Phe Ser Phe
85 90 95
Thr Gln Tyr Ser Thr Asp Glu Glu Arg Ala Phe Val Arg Thr Glu Leu
100 105 110
Ala Ala Leu Leu Ala Ser Pro Leu Leu Il e Asp Ala Ile Asp Gln Leu
115 120 125
Asn Pro Ala Tyr
130
<210>10
<211>132
<212>PRT
<213>噬菌体Qbeta
<400>10
Ala Lys Leu Glu Thr Val Thr Leu Gly Asn Ile Gly Lys Asp Gly Arg
1 5 10 15
Gln Thr Leu Val Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly Val
20 25 30
Ala Ser Leu Ser Gln Ala Gly Ala Val Pro Ala Leu Glu Lys Arg Val
35 40 45
Thr Val Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys Val
50 55 60
Gln Val Lys Ile Gln Asn Pro Thr Ala Cys Thr Ala Asn Gly Ser Cys
65 70 75 80
Asp Pro Ser Val Thr Arg Gln Lys Tyr Ala Asp Val Thr Phe Ser Phe
85 90 95
Thr Gln Tyr Ser Thr Asp Glu Glu Arg Ala Phe Val Arg Thr Glu Leu
100 105 110
Ala Ala Leu Leu Ala Ser Pro Leu Leu Ile Asp Ala Ile Asp Gln Leu
115 120 125
Asn Pro Ala Tyr
130
<210>11
<211>132
<212>PRT
<213>噬菌体Qbeta
<400>11
Ala Arg Leu Glu Thr Val Thr Leu Gly Asn Ile Gly Lys Asp Gly Arg
1 5 10 15
Gln Thr Leu Val Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly Val
20 25 30
Ala Ser Leu Ser Gln Ala Gly Ala Val Pro Ala Leu Glu Lys Arg Val
35 40 45
Thr Val Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys Val
50 55 60
Gln Val Lys Ile Gln Asn Pro Thr Ala Cys Thr Ala Asn Gly Ser Cys
65 70 75 80
Asp Pro Ser Val Thr Arg Gln Lys Tyr Ala Asp Val Thr Phe Ser Phe
85 90 95
Thr Gln Tyr Ser Thr Asp Glu Glu Arg Ala Phe Val Arg Thr Glu Leu
100 105 110
Ala Ala Leu Leu Ala Ser Pro Leu Leu Ile Asp Ala Ile Asp Gln Leu
115 120 125
Asn Pro Ala Tyr
130
<210>12
<211>131
<212>PRT
<213>噬菌体AP205
<400>12
Met Ala Asn Lys Pro Met Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile
1 5 10 15
Val Trp Ser Asp Pro Thr Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu
20 25 30
Leu Arg Gln Arg Val Lys Val Gly Ile Ala Glu Leu Asn Asn Val Ser
35 40 45
Gly Gln Tyr Val Ser Val Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly
50 55 60
Cys Ala Asp Ala Cys Val Il e Met Pro Asn Glu Asn Gln Ser Ile Arg
65 70 75 80
Thr Val Ile Ser Gly Ser Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu
85 90 95
Trp Glu Thr His Lys Arg Asn Val Asp Thr Leu Phe Ala Ser Gly Asn
100 105 110
Ala Gly Leu Gly Phe Leu Asp Pro Thr Ala Ala Ile Val Ser Ser Asp
115 120 125
Thr Thr Ala
130
<210>13
<211>131
<212>PRT
<213>噬菌体AP205
<400>13
Met Ala Asn Lys Thr Met Gln Pro Ile Thr Ser Thr Ala Asn Lys Ile
1 5 10 15
Val Trp Ser Asp Pro Thr Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu
20 25 30
Leu Arg Gln Arg Val Lys Val Gly Ile Ala Glu Leu Asn Asn Val Ser
35 40 45
Gly Gln Tyr Val Ser Val Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly
50 55 60
Cys Ala Asp Ala Cys Val Ile Met Pro Asn Glu Asn Gln Ser Ile Arg
65 70 75 80
Thr Val Ile Ser Gly Ser Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu
85 90 95
Trp Glu Thr His Lys Arg Asn Val Asp Thr Leu Phe Ala Ser Gly Asn
100 105 110
Ala Gly Leu Gly Phe Leu Asp Pro Thr Ala Ala Ile Val Ser Ser Asp
115 120 125
Thr Thr Ala
130
<210>14
<211>131
<212>PRT
<213>噬菌体AP205
<400>14
Met Ala Asn Lys Pro Met Gln Pro Ile Thr Ser Thr Ala Asp Lys Ile
1 5 10 15
Val Trp Ser Asp Pro Thr Arg Leu Ser Thr Thr Phe Ser Ala Ser Leu
20 25 30
Leu Arg Gln Arg Val Lys Val Gly Ile Ala Glu Leu Asn Asn Val Ser
35 40 45
Gly Gln Tyr Val Ser Val Tyr Lys Arg Pro Ala Pro Lys Pro Glu Gly
50 55 60
Cys Ala Asp Ala Cys Val Ile Met Pro Asn Glu Asn Gln Ser Ile Arg
65 70 75 80
Thr Val Ile Ser Gly Ser Ala Glu Asn Leu Ala Thr Leu Lys Ala Glu
85 90 95
Trp Glu Thr His Lys Arg Asn Val Asp Thr Leu Phe Ala Ser Gly Asn
100 105 110
Ala Gly Leu Gly Phe Leu Asp Pro Thr Ala Ala Ile Val Ser Ser Asp
115 120 125
Thr Thr Ala
130
<210>15
<211>329
<212>PRT
<213>噬菌体Qbeta
<400>15
Met Ala Lys Leu Glu Thr Val Thr Leu Gly Asn Ile Gly Lys Asp Gly
1 5 10 15
Lys Gln Thr Leu Val Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly
20 25 30
Val Ala Ser Leu Ser Gln Ala Gly Ala Val Pro Ala Leu Glu Lys Arg
35 40 45
Val Thr Val Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys
50 55 60
Val Gln Val Lys Ile Gln Asn Pro Thr Ala Cys Thr Ala Asn Gly Ser
65 70 75 80
Cys Asp Pro Ser Val Thr Arg Gln Ala Tyr Ala Asp Val Thr Phe Ser
85 90 95
Phe Thr Gln Tyr Ser Thr Asp Glu Glu Arg Ala Phe Val Arg Thr Glu
100 105 110
Leu Ala Ala Leu Leu Ala Ser Pro Leu Leu Ile Asp Ala Ile Asp Gln
115 120 125
Leu Asn Pro Ala Tyr Trp Thr Leu Leu Ile Ala Gly Gly Gly Ser Gly
130 135 140
Ser Lys Pro Asp Pro Val Ile Pro Asp Pro Pro Ile Asp Pro Pro Pro
145 150 155 160
Gly Thr Gly Lys Tyr Thr Cys Pro Phe Ala Ile Trp Ser Leu Glu Glu
165 170 175
Val Tyr Glu Pro Pro Thr Lys Asn Arg Pro Trp Pro Ile Tyr Asn Ala
180 185 190
Val Glu Leu Gln Pro Arg Glu Phe Asp Val Ala Leu Lys Asp Leu Leu
195 200 205
Gly Asn Thr Lys Trp Arg Asp Trp Asp Ser Arg Leu Ser Tyr Thr Thr
210 215 220
Phe Arg Gly Cys Arg Gly Asn Gly Tyr Ile Asp Leu Asp Ala Thr Tyr
225 230 235 240
Leu Ala Thr Asp Gln Ala Met Arg Asp Gln Lys Tyr Asp Ile Arg Glu
245 250 255
Gly Lys Lys Pro Gly Ala Phe Gly Asn Ile Glu Arg Phe Ile Tyr Leu
260 265 270
Lys Ser Ile Asn Ala Tyr Cys Ser Leu Ser Asp Ile Ala Ala Tyr His
275 280 285
Ala Asp Gly Val Ile Val Gly Phe Trp Arg Asp Pro Ser Ser Gly Gly
290 295 300
Ala Ile Pro Phe Asp Phe Thr Lys Phe Asp Lys Thr Lys Cys Pro Ile
305 310 315 320
Gln Ala Val Ile Val Val Pro Arg Ala
325
<210>16
<211>129
<212>PRT
<213>噬菌体R17
<400>16
Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asn Asp Gly Gly Thr Gly
1 5 10 15
Asn Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp
20 25 30
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
35 40 45
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
50 55 60
Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala
65 70 75 80
Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe Ala
85 90 95
Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met G1n Gly Leu Leu
100 105 110
Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile
115 120 125
Tyr
<210>17
<211>130
<212>PRT
<213>噬菌体fr
<400>17
Met Ala Ser Asn Phe Glu Glu Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Lys Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Asn Asn Arg Lys Tyr Thr Val Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Val Gln Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Met Asn Met Glu Leu Thr Ile Pro Val Phe
85 90 95
Ala Thr Asn Asp Asp Cys Ala Leu Ile Val Lys Ala Leu Gln Gly Thr
100 105 110
Phe Lys Thr Gly Asn Pro Ile Ala Thr Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr
130
<210>18
<211>130
<212>PRT
<213>噬菌体GA
<400>18
Met Ala Thr Leu Arg Ser Phe Val Leu Val Asp Asn Gly Gly Thr Gly
1 5 10 15
Asn Val Thr Val Val Pro Val Ser Asn Ala Asn Gly Val Ala Glu Trp
20 25 30
Leu Ser Asn Asn Ser Arg Ser Gln Ala Tyr Arg Val Thr Ala Ser Tyr
35 40 45
Arg Ala Ser Gly Ala Asp Lys Arg Lys Tyr Ala Ile Lys Leu Glu Val
50 55 60
Pro Lys Ile Val Thr Gln Val Val Asn Gly Val Glu Leu Pro Gly Ser
65 70 75 80
Ala Trp Lys Ala Tyr Ala Ser Ile Asp Leu Thr Ile Pro Ile Phe Ala
85 90 95
Ala Thr Asp Asp Val Thr Val Ile Ser Lys Ser Leu Ala Gly Leu Phe
100 105 110
Lys Val Gly Asn Pro Ile Ala Glu Ala Ile Ser Ser Gln Ser Gly Phe
115 120 125
Tyr Ala
130
<210>19
<211>132
<212>PRT
<213>噬菌体SP
<400>19
Met Ala Lys Leu Asn Gln Val Thr Leu Ser Lys Ile Gly Lys Asn Gly
1 5 10 15
Asp Gln Thr Leu Thr Leu Thr Pro Arg Gly Val Asn Pro Thr Asn Gly
20 25 30
Val Ala Ser Leu Ser Glu Ala Gly Ala Val Pro Ala Leu Glu Lys Arg
35 40 45
Val Thr Val Ser Val Ala Gln Pro Ser Arg Asn Arg Lys Asn Phe Lys
50 55 60
Val Gln Ile Lys Leu Gln Asn Pro Thr Ala Cys Thr Arg Asp Ala Cys
65 70 75 80
Asp Pro Ser Val Thr Arg Ser Ala Phe Ala Asp Val Thr Leu Ser Phe
85 90 95
Thr Ser Tyr Ser Thr Asp Glu Glu Arg Ala Leu Ile Arg Thr Glu Leu
100 105 110
Ala Ala Leu Leu Ala Asp Pro Leu Ile Val Asp Ala Ile Asp Asn Leu
115 120 125
Asn Pro Ala Tyr
130
<210>20
<211>329
<212>PRT
<213>噬菌体
<400>20
Ala Lys Leu Asn Gln Val Thr Leu Ser Lys Ile Gly Lys Asn Gly Asp
1 5 10 15
Gln Thr Leu Thr Leu Thr Pro Arg Gly Val Asn Pro Thr Asn Gly Val
20 25 30
Ala Ser Leu Ser Glu Ala Gly Ala Val Pro Ala Leu Glu Lys Arg Val
35 40 45
Thr Val Ser Val Ala Gln Pro Ser Arg Asn Arg Lys Asn Phe Lys Val
50 55 60
Gln Ile Lys Leu Gln Asn Pro Thr Ala Cys Thr Arg Asp Ala Cys Asp
65 70 75 80
Pro Ser Val Thr Arg Ser Ala Phe Ala Asp Val Thr Leu Ser Phe Thr
85 90 95
Ser Tyr Ser Thr Asp Glu Glu Arg Ala Leu Ile Arg Thr Glu Leu Ala
100 105 110
Ala Leu Leu Ala Asp Pro Leu Ile Val Asp Ala Ile Asp Asn Leu Asn
115 120 125
Pro Ala Tyr Trp Ala Ala Leu Leu Val Ala Ser Ser Gly Gly Gly Asp
130 135 140
Asn Pro Ser Asp Pro Asp Val Pro Val Val Pro Asp Val Lys Pro Pro
145 150 155 160
Asp Gly Thr Gly Arg Tyr Lys Cys Pro Phe Ala Cys Tyr Arg Leu Gly
165 170 175
Ser Ile Tyr Glu Val Gly Lys Glu Gly Ser Pro Asp Ile Tyr Glu Arg
180 185 190
Gly Asp Glu Val Ser Val Thr Phe Asp Tyr Ala Leu Glu Asp Phe Leu
195 200 205
Gly Asn Thr Asn Trp Arg Asn Trp Asp Gln Arg Leu Ser Asp Tyr Asp
210 215 220
Ile Ala Asn Arg Arg Arg Cys Arg Gly Asn Gly Tyr Ile Asp Leu Asp
225 230 235 240
Ala Thr Ala Met Gln Ser Asp Asp Phe Val Leu Ser Gly Arg Tyr Gly
245 250 255
Val Arg Lys Val Lys Phe Pro Gly Ala Phe Gly Ser Ile Lys Tyr Leu
260 265 270
Leu Asn Ile Gln Gly Asp Ala Trp Leu Asp Leu Ser Glu Val Thr Ala
275 280 285
Tyr Arg Ser Tyr Gly Met Val Ile Gly Phe Trp Thr Asp Ser Lys Ser
290 295 300
Pro Gln Leu Pro Thr Asp Phe Thr Gln Phe Asn Ser Ala Asn Cys Pro
305 310 315 320
Val Gln Thr Val Ile Ile Ile Pro Ser
325
<210>21
<211>130
<212>PRT
<213>噬菌体MS2
<400>21
Met Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asp Asn Gly Gly Thr
1 5 10 15
Gly Asp Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu
20 25 30
Trp Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser
35 40 45
Val Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu
50 55 60
Val Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val
65 70 75 80
Ala Ala Trp Arg Ser Tyr Leu Asn Met Glu Leu Thr Ile Pro Ile Phe
85 90 95
Ala Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu
100 105 110
Leu Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly
115 120 125
Ile Tyr
130
<210>22
<211>133
<212>PRT
<213>噬菌体M11
<400>22
Met Ala Lys Leu Gln Ala Ile Thr Leu Ser Gly Ile Gly Lys Lys Gly
1 5 10 15
Asp Val Thr Leu Asp Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly
20 25 30
Val Ala Ala Leu Ser Glu Ala Gly Ala Val Pro Ala Leu Glu Lys Arg
35 40 45
Val Thr Ile Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys
50 55 60
Val Gln Val Lys Ile Gln Asn Pro Thr Ser Cys Thr Ala Ser Gly Thr
65 70 75 80
Cys Asp Pro Ser Val Thr Arg Ser Ala Tyr Ser Asp Val Thr Phe Ser
85 90 95
Phe Thr Gln Tyr Ser Thr Val Glu Glu Arg Ala Leu Val Arg Thr Glu
100 105 110
Leu Gln Ala Leu Leu Ala Asp Pro Met Leu Val Asn Ala Ile Asp Asn
115 120 125
Leu Asn Pro Ala Tyr
130
<210>23
<211>133
<212>PRT
<213>噬菌体MX1
<400>23
Met Ala Lys Leu Gln Ala Ile Thr Leu Ser Gly Ile Gly Lys Asn Gly
1 5 10 15
Asp Val Thr Leu Asn Leu Asn Pro Arg Gly Val Asn Pro Thr Asn Gly
20 25 30
Val Ala Ala Leu Ser Glu Ala Gly Ala Val Pro Ala Leu Glu Lys Arg
35 40 45
Val Thr Ile Ser Val Ser Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys
50 55 60
Val Gln Val Lys Ile Gln Asn Pro Thr Ser Cys Thr Ala Ser Gly Thr
65 70 75 80
Cys Asp Pro Ser Val Thr Arg Ser Ala Tyr Ala Asp Val Thr Phe Ser
85 90 95
Phe Thr Gln Tyr Ser Thr Asp Glu Glu Arg Ala Leu Val Arg Thr Glu
100 105 110
Leu Lys Ala Leu Leu Ala Asp Pro Met Leu Ile Asp Ala Ile Asp Asn
115 120 125
Leu Asn Pro Ala Tyr
130
<210>24
<211>330
<212>PRT
<213>噬菌体NL95
<400>24
Met Ala Lys Leu Asn Lys Val Thr Leu Thr Gly Ile Gly Lys Ala Gly
1 5 10 15
Asn Gln Thr Leu Thr Leu Thr Pro Arg Gly Val Asn Pro Thr Asn Gly
20 25 30
Val Ala Ser Leu Ser Glu Ala Gly Ala Val Pro Ala Leu Glu Lys Arg
35 40 45
Val Thr Val Ser Val Ala Gln Pro Ser Arg Asn Arg Lys Asn Tyr Lys
50 55 60
Val Gln Ile Lys Leu Gln Asn Pro Thr Ala Cys Thr Lys Asp Ala Cys
65 70 75 80
Asp Pro Ser Val Thr Arg Ser Gly Ser Arg Asp Val Thr Leu Ser Phe
85 90 95
Thr Ser Tyr Ser Thr Glu Arg Glu Arg Ala Leu Ile Arg Thr Glu Leu
100 105 110
Ala Ala Leu Leu Lys Asp Asp Leu Ile Val Asp Ala Ile Asp Asn Leu
115 120 125
Asn Pro Ala Tyr Trp Ala Ala Leu Leu Ala Ala Ser Pro Gly Gly Gly
130 135 140
Asn Asn Pro Tyr Pro Gly Val Pro Asp Ser Pro Asn Val Lys Pro Pro
145 150 155 160
Gly Gly Thr Gly Thr Tyr Arg Cys Pro Phe Ala Cys Tyr Arg Arg Gly
165 170 175
Glu Leu Ile Thr Glu Ala LysAsp Gly Ala Cys Ala Leu Tyr Ala Cys
180 185 190
Gly Ser Glu Ala Leu Val Glu Phe Glu Tyr Ala Leu Glu Asp Phe Leu
195 200 205
Gly Asn Glu Phe Trp Arg Asn Trp Asp Gly Arg Leu Ser Lys Tyr Asp
210 215 220
Ile Glu Thr His Arg Arg Cys Arg Gly Asn Gly Tyr Val Asp Leu Asp
225 230 235 240
Ala Ser Val Met Gln Ser Asp Glu Tyr Val Leu Ser Gly Ala Tyr Asp
245 250 255
Val Val Lys Met Gln Pro Pro Gly Thr Phe Asp Ser Pro Arg Tyr Tyr
260 265 270
Leu His Leu Met Asp Gly Ile Tyr Val Asp Leu Ala Glu Val Thr Ala
275 280 285
Tyr Arg Ser Tyr Gly Met Val Ile Gly Phe Trp Thr Asp Ser Lys Ser
290 295 300
Pro Gln Leu Pro Thr Asp Phe Thr Arg Phe Asn Arg His Asn Cys Pro
305 310 315 320
Val Gln Thr Val Ile Val Ile Pro Ser Leu
325 330
<210>25
<211>129
<212>PRT
<213>噬菌体f2
<400>25
Ala Ser Asn Phe Thr Gln Phe Val Leu Val Asn Asp Gly Gly Thr Gly
1 5 10 15
Asn Val Thr Val Ala Pro Ser Asn Phe Ala Asn Gly Val Ala Glu Trp
20 25 30
Ile Ser Ser Asn Ser Arg Ser Gln Ala Tyr Lys Val Thr Cys Ser Val
35 40 45
Arg Gln Ser Ser Ala Gln Asn Arg Lys Tyr Thr Ile Lys Val Glu Val
50 55 60
Pro Lys Val Ala Thr Gln Thr Val Gly Gly Val Glu Leu Pro Val Ala
65 70 75 80
Ala Trp Arg Ser Tyr Leu Asn Leu Glu Leu Thr Ile Pro Ile Phe Ala
85 90 95
Thr Asn Ser Asp Cys Glu Leu Ile Val Lys Ala Met Gln Gly Leu Leu
100 105 110
Lys Asp Gly Asn Pro Ile Pro Ser Ala Ile Ala Ala Asn Ser Gly Ile
115 120 125
Tyr
<210>26
<211>128
<212>PRT
<213>噬菌体PP7
<400>26
Met Ser Lys Thr Ile Val Leu Ser Val Gly Glu Ala Thr Arg Thr Leu
1 5 10 15
Thr Glu Ile Gln Ser Thr Ala Asp Arg Gln Ile Phe Glu Glu Lys Val
20 25 30
Gly Pro Leu Val Gly Arg Leu Arg Leu Thr Ala Ser Leu Arg Gln Asn
35 40 45
Gly Ala Lys Thr Ala Tyr Arg Val Asn Leu Lys Leu Asp Gln Ala Asp
50 55 60
Val Val Asp Cys Ser Thr Ser Val Cys Gly Glu Leu Pro Lys Val Arg
65 70 75 80
Tyr Thr Gln Val Trp Ser His Asp Val Thr Ile Val Ala Asn Ser Thr
85 90 95
Glu Ala Ser Arg Lys Ser Leu Tyr Asp Leu Thr Lys Ser Leu Val Ala
100 105 110
Thr Ser Gln Val Glu Asp Leu Val Val Asn Leu Val Pro Leu Gly Arg
115 120 125
<210>27
<211>4586
<212>DNA
<213>人工序列
<220>
<223>克降载体
<400>27
ttctgtttcc tgtgtgaaat tgttatccgc tcacaattcc acacattata cgagccgatg 60
attaattgtc aacagctcat ttcagaatat ttgccagaac cgttatgatg tcggcgcaaa120
aaacattatc cagaacggga gtgcgccttg agcgacacga attatgcagt gatttacgac180
ctgcacagcc ataccacagc ttccgatggc tgcctgacgc cagaagcatt ggtgcaccgt240
gcagtcgata agctccggat cctctacgcc ggacgcatcg tggccggcat caccggcgcc300
acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga tcgggctcgc360
cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc cgtggccggg420
ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt gctcaacggc480
ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga gcgtcgaccg540
atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc600
gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg660
ctctgggtca ttttcggcga ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg720
cttgcggtat tcggaatctt gcacgccctc gctcaagcct tcgtcactgg tcccgccacc780
aaacgtttcg gcgagaagca ggccattatc gccggcatgg cggccgacgc gctgggctac840
gtcttgctgg cgttcgcgac gcgaggctgg atggccttcc ccattatgat tcttctcgct900
tccggcggca tcgggatgcc cgcgttgcag gccatgctgt ccaggcaggt agatgacgac960
catcagggac agcttcaagg atcgctcgcg gctcttacca gcctaacttc gatcactgga 1020
ccgctgatcg tcacggcgat ttatgccgcc tcggcgagca catggaacgg gttggcatgg 1080
attgtaggcg ccgccctata ccttgtctgc ctccccgcgt tgcgtcgcgg tgcatggagc 1140
cgggccacct cgacctgaat ggaagccggc ggcacctcgc taacggattc accactccaa 1200
gaattggagc caatcaattc ttgcggagaa ctgtgaatgc gcaaaccaac ccttggcaga 1260
acatatccat cgcgtccgcc atctccagca gccgcacgcg gcgcatctcg ggcagcgttg 1320
ggtcctggcc acgggtgcgc atgatcgtgc tcctgtcgtt gaggacccgg ctaggctggc 1380
ggggttgcct tactggttag cagaatgaat caccgatacg cgagcgaacg tgaagcgact 1440
gctgctgcaa aacgtctgcg acctgagcaa caacatgaat ggtcttcggt ttccgtgttt 1500
cgtaaagtct ggaaacgcgg aagtcagcgc cctgcaccat tatgttccgg atctgcatcg 1560
caggatgctg ctggctaccc tgtggaacac ctacatctgt attaacgaag cgctggcatt 1620
gaccctgagt gatttttctc tggtcccgcc gcatccatac cgccagttgt ttaccctcac 1680
aacgttccag taaccgggca tgttcatcat cagtaacccg tatcgtgagc atcctctctc 1740
gtttcatcgg tatcattacc cccatgaaca gaaattcccc cttacacgga ggcatcaagt 1800
gaccaaacag gaaaaaaccg cccttaacat ggcccgcttt atcagaagcc agacattaac 1860
gcttctggag aaactcaacg agctggacgc ggatgaacag gcagacatct gtgaatcgct 1920
tcacgaccac gctgatgagc tttaccgcag ctgcctcgcg cgtttcggtg atgacggtga 1980
aaacctctga cacatgcagc tcccggagac ggtcacagct tgtctgtaag cggatgccgg 2040
gagcagacaa gcccgtcagg gcgcgtcagc gggtgttggc gggtgtcggg gcgcagccat 2100
gacccagtca cgtagcgata gcggagtgta tactggctta actatgcggc atcagagcag 2160
attgtactga gagtgcacca tatgcggtgt gaaataccgc acagatgcgt aaggagaaaa 2220
taccgcatca ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc ggtcgttcgg 2280
ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac agaatcaggg 2340
gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag 2400
gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca caaaaatcga 2460
cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc gtttccccct 2520
ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata cctgtccgcc 2580
tttctccctt cgggaagcgt ggcgctttct catagctcac gctgtaggta tctcagttcg2640
gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca gcccgaccgc2700
tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga cttatcgcca2760
ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg tgctacagag2820
ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg tatctgcgct2880
ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg caaacaaacc2940
accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga3000
tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa cgaaaactca3060
cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat ccttttaaat3120
taaaaatgaa gttttaaatc aatctaaagt atatatgagt aaacttggtc tgacagttac3180
caatgcttaa tcagtgaggc acctatctca gcgatctgtc tatttcgttc atccatagtt3240
gcctgactcc ccgtcgtgta gataactacg atacgggagg gcttaccatc tggccccagt3300
gctgcaatga taccgcgaga cccacgctca ccggctccag atttatcagc aataaaccag3360
ccagccggaa gggccgagcg cagaagtggt cctgcaactt tatccgcctc catccagtct3420
attaattgtt gccgggaagc tagagtaagt agttcgccag ttaatagttt gcgcaacgtt3480
gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt ttggtatggc ttcattcagc3540
tccggttccc aacgatcaag gcgagttaca tgatccccca tgttgtgcaa aaaagcggtt3600
agctccttcg gtcctccgat cgttgtcaga agtaagttgg ccgcagtgtt atcactcatg3660
gttatggcag cactgcataa ttctcttact gtcatgccat ccgtaagatg cttttctgtg3720
actggtgagt actcaaccaa gtcattctga gaatagtgta tgcggcgacc gagttgctct3780
tgcccggcgt caacacggga taataccgcg ccacatagca gaactttaaa agtgctcatc3840
attggaaaac gttcttcggg gcgaaaactc tcaaggatct taccgctgtt gagatccagt3900
tcgatgtaac ccactcgtgc acccaactga tcttcagcat cttttacttt caccagcgtt3960
tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa agggaataag ggcgacacgg4020
aaatgttgaa tactcatact cttccttttt caatattatt gaagcattta tcagggttat4080
tgtctcatga gcggatacat atttgaatgt atttagaaaa ataaacaaaa gagtttgtag4140
aaacgcaaaa aggccatccg tcaggatggc cttctgctta atttgatgcc tggcagttta4200
tggcgggcgt cctgcccgcc accctccggg ccgttgcttc gcaacgttca aatccgctcc4260
cggcggattt gtcctactca ggagagcgtt caccgacaaa caacagataa aacgaaaggc4320
ccagtctttc gactgagcct ttcgttttat ttgatgcctg gcagttccct actctcgcat4380
ggggagaccc cacactacca tcggcgctac ggcgtttcac ttctgagttc ggcatggggt4440
caggtgggac caccgcgcta ctgccgccag gcaaattctg ttttatcaga ccgcttctgc4500
gttctgattt aatctgtatc aggctgaaaa tcttctctca tccgccaaaa cagaagcttg4560
gctgcaggtc gacggatccc cgggaa 4586
<210>28
<211>425
<212>DNA
<213>人工序列
<220>
<223>终止序列
<400>28
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg 300
atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg 360
ccaggcatca aattaagcag aaggccatcc tgacggatgg cctttttgcg tttctacaaa 420
ctctt 425
<210>29
<211>816
<212>DNA
<213>人工序列
<220>
<223>抗性基因
<400>29
ttagaaaaac tcatcgagca tcaaatgaaa ctgcaattta ttcatatcag gattatcaat 60
accatatttt tgaaaaagcc gtttctgtaa tgaaggagaa aactcaccga ggcagttcca 120
taggatggca agatcctggt atcggtctgc gattccgact cgtccaacat caatacaacc 180
tattaatttc ccctcgtcaa aaataaggtt atcaagtgag aaatcaccat gagtgacgac 240
tgaatccggt gagaatggca aaagcttatg catttctttc cagacttgtt caacaggcca 300
gccattacgc tcgtcatcaa aatcactcgc atcaaccaaa ccgttattca ttcgtgattg 360
cgcctgagcg agacgaaata cgcgatcgct gttaaaagga caattacaaa caggaatcga 420
atgcaaccgg cgcaggaaca ctgccagcgc atcaacaata ttttcacctg aatcaggata 480
ttcttctaat acctggaatg ctgttttccc ggggatcgca gtggtgagta accatgcatc 540
atcaggagta cggataaaat gcttgatggt cggaagaggc ataaattccg tcagccagtt 600
tagtctgacc atctcatctg taacatcatt ggcaacgcta cctttgccat gtttcagaaa 660
caactctggc gcatcgggct tcccatacaa tcgatagatt gtcgcacctg attgcccgac 720
attatcgcga gcccatttat acccatataa atcagcatcc atgttggaat ttaatcgcgg 780
cctcgagcaa gacgtttccc gttgaatatg gctcat816
<210>30
<211>4963
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>30
ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct caaggcgcac tcccgttctg 60
gataatgttt tttgcgccga catcataacg gttctggcaa atattctgaa atgagctgtt 120
gacaattaat catcggctcg tataatgtgt ggaattgtga gcggataaca atttcacaca 180
ggaaacagaa ttctaaggag gaaaaaaaaa tggcaaataa gccaatgcaa ccgatcacat 240
ctacagcaaa taaaattgtg tggtcggatc caactcgttt atcaactaca ttttcagcaa 300
gtctgttacg ccaacgtgtt aaagttggta tagccgaact gaataatgtt tcaggtcaat360
atgtatctgt ttataagcgt cctgcaccta aaccggaagg ttgtgcagat gcctgtgtca420
ttatgccgaa tgaaaaccaa tccattcgca cagtgatttc agggtcagcc gaaaacttgg480
ctaccttaaa agcagaatgg gaaactcaca aacgtaacgt tgacacactc ttcgcgagcg540
gcaacgccgg tttgggtttc cttgacccta ctgcggctat cgtatcgtct gatactactg600
cttaatgaag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa660
atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt720
cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg780
gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga840
aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa900
atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac960
gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt 1020
ttgcgtttct acaaactctt ttgtttattt ttctagagcc acgttgtgtc tcaaaatctc 1080
tgatgttaca ttgcacaaga taaaaatata tcatcatgaa caataaaact gtctgcttac 1140
ataaacagta atacaaggag tgttatgagc catattcaac gggaaacgtc ttgctcgagg 1200
ccgcgattaa attccaacat ggatgctgat ttatatgggt ataaatgggc tcgcgataat 1260
gtcgggcaat caggtgcgac aatctatcga ttgtatggga agcccgatgc gccagagttg 1320
tttctgaaac atggcaaagg tagcgttgcc aatgatgtta cagatgagat ggtcagacta 1380
aactggctga cggaatttat gcctcttccg accatcaagc attttatccg tactcctgat 1440
gatgcatggt tactcaccac tgcgatcccc gggaaaacag cattccaggt attagaagaa 1500
tatcctgatt caggtgaaaa tattgttgat gcgctggcag tgttcctgcg ccggttgcat 1560
tcgattcctg tttgtaattg tccttttaac agcgatcgcg tatttcgtct cgctcaggcg 1620
caatcacgaa tgaataacgg tttggttgat gcgagtgatt ttgatgacga gcgtaatggc 1680
tggcctgttg aacaagtctg gaaagaaatg cataagcttt tgccattctc accggattca 1740
gtcgtcactc atggtgattt ctcacttgat aaccttattt ttgacgaggg gaaattaata 1800
ggttgtattg atgttggacg agtcggaatc gcagaccgat accaggatct tgccatccta 1860
tggaactgcc tcggtgagtt ttctccttca ttacagaaac ggctttttca aaaatatggt 1920
attgataatc ctgatatgaa taaattgcag tttcatttga tgctcgatga gtttttctaa 1980
acgcgtgacc aagtttactc atatgtactt tagattgatt taaaacttca tttttaattt 2040
aaaaggatct aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag 2100
ttttcgttcc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 2160
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 2220
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 2280
cagataccaa atactgtcct tctagtgtag ccgtagttag gccaccactt caagaactct 2340
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 2400
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 2460
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 2520
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 2580
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gctcccaggg2640
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga2700
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt2760
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct2820
gattctgtgg ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga2880
acgaccgagc gcagcgagtc agtgagcgag gaagcggaag agcgcctgat gcggtatttt2940
ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag tacaatctgc3000
tctgatgccg catagttaag ccagtataca ctccgctatc gctacgtgac tgggtcatgg3060
ctgcgccccg acacccgcca acacccgctg acgcgccctg acgggcttgt ctgctcccgg3120
catccgctta cagacaagct gtgaccgtct ccgggagctg catgtgtcag aggttttcac3180
cgtcatcacc gaaacgcgcg aggcagctgc ggtaaagctc atcagcgtgg tcgtgaagcg3240
attcacagat gtctgcctgt tcatccgcgt ccagctcgtt gagtttctcc agaagcgtta3300
atgtctggct tctgataaag cgggccatgt taagggcggt tttttcctgt ttggtcactg3360
atgcctccgt gtaaggggga tttctgttca tgggggtaat gataccgatg aaacgagaga3420
ggatgctcac gatacgggtt actgatgatg aacatgcccg gttactggaa cgttgtgagg3480
gtaaacaact ggcggtatgg atgcggcggg accagagaaa aatcactcag ggtcaatgcc3540
agcgcttcgt taatacagat gtaggtgttc cacagggtag ccagcagcat cctgcgatgc3600
agatccggaa cataatggtg cagggcgctg acttccgcgt ttccagactt tacgaaacac3660
ggaaaccgaa gaccattcat gttgttgctc aggtcgcaga cgttttgcag cagcagtcgc3720
ttcacgttcg ctcgcgtatc ggtgattcat tctgctaacc agtaaggcaa ccccgccagc3780
ctagccgggt cctcaacgac aggagcacga tcatgcgcac ccgtggccag gacccaacgc3840
tgcccgagat gcgccgcgtg cggctgctgg agatggcgga cgcgatggat atgttctgcc3900
aagggttggt ttgcgcattc acagttctcc gcaagaattg attggctcca attcttggag3960
tggtgaatcc gttagcgagg tgccgccggc ttccattcag gtcgaggtgg cccggctcca4020
tgcaccgcga cgcaacgcgg ggaggcagac aaggtatagg gcggcgccta caatccatgc4080
caacccgttc catgtgctcg ccgaggcggc ataaatcgcc gtgacgatca gcggtccaat4140
gatcgaagtt aggctggtaa gagccgcgag cgatccttga agctgtccct gatggtcgtc4200
atctacctgc ctggacagca tggcctgcaa cgcgggcatc ccgatgccgc cggaagcgag4260
aagaatcata atggggaagg ccatccagcc tcgcgtcgcg aacgccagca agacgtagcc4320
cagcgcgtcg gccgccatgc cggcgataat ggcctgcttc tcgccgaaac gtttggtggc4380
gggaccagtg acgaaggctt gagcgagggc gtgcaagatt ccgaataccg caagcgacag4440
gccgatcatc gtcgcgctcc agcgaaagcg gtcctcgccg aaaatgaccc agagcgctgc4500
cggcacctgt cctacgagtt gcatgataaa gaagacagtc ataagtgcgg cgacgatagt4560
catgccccgc gcccaccgga aggagctgac tgggttgaag gctctcaagg gcatcggtcg4620
acgctctccc ttatgcgact cctgcattag gaagcagccc agtagtaggt tgaggccgtt4680
gagcaccgcc gccgcaagga atggtgcatg caaggagatg gcgcccaaca gtcccccggc4740
cacggggcct gccaccatac ccacgccgaa acaagcgctc atgagcccga agtggcgagc4800
ccgatcttcc ccatcggtga tgtcggcgat ataggcgcca gcaaccgcac ctgtggcgcc4860
ggtgatgccg gccacgatgc gtccggcgta gaggatccgg gcttatcgac tgcacggtgc 4920
accaatgctt ctggcgtcag gcagccatcg gaagctgtgg tat 4963
<210>31
<211>6
<212>DNA
<213>人工序列
<220>
<223>终止密码子
<400>31
tgaaca 6
<210>32
<211>6
<212>DNA
<213>人工序列
<220>
<223>终止密码子
<400>32
taatga 6
<210>33
<211>4525
<212>DNA
<213>人工序列
<220>
<223>质粒
<400>33
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cagacatgca tttcatcctt420
agttactaag cacgaggaac gactatcacg gcttgaatag gacatttagt cttatcaaac480
ttagtgaagt caaacggtat ggcaccacca ctggatggat cgcgccaaaa gccaactatc540
acgccatcgg cgtgataggc cgcaatatcg ctaagagagc aataagcatt tatcgactta600
agataaatga atcgctcaat gttaccgaaa gcaccaggtt tcttgccctc gcgaatatca660
tacttctgat cacgcatagc ctgatcagta gcaagataag tcgcatcaag gtcaatataa720
ccattgccac ggcaaccgcg gaacgtggta taactaagcc gagaatccca atcacgccac780
tttgtattgc ccaaaagatc tttgagggca acatcaaatt cgcgaggctg gagttcaaca840
gcattataga taggccacgg tcggttctta gtaggaggct cgtaaacctc ctctagggac900
caaattgcga agggacaggt atacttacct gtccctggcg gcggatcaat cggtggatcc960
ggaataaccg gatcgggttt tgaccctgag ccaccaccgg caatgagcag tcattaatac 1020
gctgggttca gctgatcaat agcatcgatc agcagaggac tagcgagcag agcagcaagc 1080
tctgtacgaa caaaagctcg ttcctcatcg gtactatact gcgtgaacga aaaggtcacg 1140
tcagcatatg cctggcgagt aacggatggg tcacaagaac cgtttgcagt gcaagcggtc1200
gggttctgga tcttaacctg gaccttgtag ttcttacgat tgcgagaagg ctgagatacc1260
gaaacggtaa cacgcttctc cagcgcagga actgcacccg cttgtgaaag cgaggcaacg1320
ccgttagtgg gatttacccc acgcggattg aggaccagag tttgttttcc atctttcccg1380
atgttaccta aagtaacagt ctctaatttt gccatcgttt tttacctcct tctagagtca1440
ttatggtttt gccatacatc agtatggtgt agcagcactt attataatct ttattgcctc1500
ttaaaactta atccacatca aaactcaaat acttttaacc ccagcgtcct gtaagctctg1560
cattaatgaa tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct1620
tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac1680
tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga1740
gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat1800
aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac1860
ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct1920
gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg1980
ctttctcata gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg2040
ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt2100
cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg2160
attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac2220
ggctacacta gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga2280
aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt2340
gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt2400
tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga2460
ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc2520
taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct2580
atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata2640
actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca2700
cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga2760
agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga2820
gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg2880
gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga2940
gttacatgat cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt3000
gtcagaagta agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct3060
cttactgtca tgccatccgt aagatgcttt tctgtgactg gtgagtgggg ggggggggcg3120
ctgaggtctg cctcgtgaag aaggtgttgc tgactcatac caggcctgaa tcgccccatc3180
atccagccag aaagtgaggg agccacggtt gatgagagct ttgttgtagg tggaccagtt3240
ggtgattttg aacttttgct ttgccacgga acggtctgcg ttgtcgggaa gatgcgtgat3300
ctgatccttc aactcagcaa aagttcgatt tattcaacaa agccgccgtc ccgtcaagtc3360
agcgtaatgc tctgccagtg ttacaaccaa ttaaccaatt ctgattagaa aaactcatcg3420
agcatcaaat gaaactgcaa tttattcata tcaggattat caataccata tttttgaaaa 3480
agccgtttct gtaatgaagg agaaaactca ccgaggcagt tccataggat ggcaagatcc 3540
tggtatcggt ctgcgattcc gactcgtcca acatcaatac aacctattaa tttcccctcg 3600
tcaaaaataa ggttatcaag tgagaaatca ccatgagtga cgactgaatc cggtgagaat 3660
ggcaaaagct tatgcatttc tttccagact tgttcaacag gccagccatt acgctcgtca 3720
tcaaaatcac tcgcatcaac caaaccgtta ttcattcgtg attgcgcctg agcgagacga 3780
aatacgcgat cgctgttaaa aggacaatta caaacaggaa tcgaatgcaa ccggcgcagg 3840
aacactgcca gcgcatcaac aatattttca cctgaatcag gatattcttc taatacctgg 3900
aatgctgttt tcccggggat cgcagtggtg agtaaccatg catcatcagg agtacggata 3960
aaatgcttga tggtcggaag aggcataaat tccgtcagcc agtttagtct gaccatctca 4020
tctgtaacat cattggcaac gctacctttg ccatgtttca gaaacaactc tggcgcatcg 4080
ggcttcccat acaatcgata gattgtcgca cctgattgcc cgacattatc gcgagcccat 4140
ttatacccat ataaatcagc atccatgttg gaatttaatc gcggcctcga gcaagacgtt 4200
tcccgttgaa tatggctcat aacacccctt gtattactgt ttatgtaagc agacagtttt 4260
attgttcatg atgatatatt tttatcttgt gcaatgtaac atcagagatt ttgagacaca 4320
acgtggcttt cccccccccc ccattattga agcatttatc agggttattg tctcatgagc 4380
ggatacatat ttgaatgtat ttagaaaaat aaacaaatag gggttccgcg cacatttccc 4440
cgaaaagtgc cacctgacgt ctaagaaacc attattatca tgacattaac ctataaaaat 4500
aggcgtatca cgaggccctt tcgtc4525
<210>34
<211>56
<212>DNA
<213>人工序列
<220>
<223>引物序列
<400>34
gcgcgcgaat tcaggaggta aaaaacgatg gcaaaattag agactgttac tttagg 56
<210>35
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物序列
<400>35
gcatgcaagc ttagacatgc atttcatcct tag 33
<210>36
<211>57
<212>DNA
<213>人工序列
<220>
<223>引物序列
<400>36
gcgcgcgaat tctaaggagg aaaaaaaaat ggcaaaatta gagactgtta ctttagg 57
<210>37
<211>3914
<212>DNA
<213>人工序列
<220>
<223>克隆载体
<400>37
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ccccggatcc gtcgacctgc420
aggggggggg gggcgctgag gtctgcctcg tgaagaaggt gttgctgact cataccaggc480
ctgaatcgcc ccatcatcca gccagaaagt gagggagcca cggttgatga gagctttgtt540
gtaggtggac cagttggtga ttttgaactt ttgctttgcc acggaacggt ctgcgttgtc600
gggaagatgc gtgatctgat ccttcaactc agcaaaagtt cgatttattc aacaaagccg660
ccgtcccgtc aagtcagcgt aatgctctgc cagtgttaca accaattaac caattctgat720
tagaaaaact catcgagcat caaatgaaac tgcaatttat tcatatcagg attatcaata780
ccatattttt gaaaaagccg tttctgtaat gaaggagaaa actcaccgag gcagttccat840
aggatggcaa gatcctggta tcggtctgcg attccgactc gtccaacatc aatacaacct900
attaatttcc cctcgtcaaa aataaggtta tcaagtgaga aatcaccatg agtgacgact960
gaatccggtg agaatggcaa aagcttatgc atttctttcc agacttgttc aacaggccag 1020
ccattacgct cgtcatcaaa atcactcgca tcaaccaaac cgttattcat tcgtgattgc 1080
gcctgagcga gacgaaatac gcgatcgctg ttaaaaggac aattacaaac aggaatcgaa 1140
tgcaaccggc gcaggaacac tgccagcgca tcaacaatat tttcacctga atcaggatat 1200
tcttctaata cctggaatgc tgttttcccg gggatcgcag tggtgagtaa ccatgcatca 1260
tcaggagtac ggataaaatg cttgatggtc ggaagaggca taaattccgt cagccagttt 1320
agtctgacca tctcatctgt aacatcattg gcaacgctac ctttgccatg tttcagaaac 1380
aactctggcg catcgggctt cccatacaat cgatagattg tcgcacctga ttgcccgaca 1440
ttatcgcgag cccatttata cccatataaa tcagcatcca tgttggaatt taatcgcggc 1500
ctcgagcaag acgtttcccg ttgaatatgg ctcataacac cccttgtatt actgtttatg 1560
taagcagaca gttttattgt tcatgatgat atatttttat cttgtgcaat gtaacatcag 1620
agattttgag acacaacgtg gctttccccc ccccccctgc aggtcgacgg atccggggaa 1680
ttcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 1740
caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 1800
cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 1860
gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggc gctcttccgc 1920
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 1980
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 2040
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 2100
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 2160
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 2220
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 2280
gctttctcaa tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 2340
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 2400
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 2460
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 2520
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 2580
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 2640
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 2700
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 2760
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 2820
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 2880
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 2940
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 3000
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 3060
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 3120
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt 3180
ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 3240
agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 3300
tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 3360
tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 3420
attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 3480
taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 3540
aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 3600
caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 3660
gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 3720
cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 3780
tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 3840
acctgacgtc taagaaacca ttattatcat gacattaacc tataaaaata ggcgtatcac 3900
gaggcccttt cgtc3914
<210>38
<211>57
<212>DNA
<213>人工序列
<220>
<223>引物序列
<400>38
gcgcgcgaat tctaaggagg aaaaaaaaat ggcaaataag ccaatgcaac cgatcac 57
<210>39
<211>44
<212>DNA
<213>人工序列
<220>
<223>引物序列
<400>39
gcatgcaagc ttcattaagc agtagtatca gacgatacga tagc 44
<210>40
<211>4962
<212>DNA
<213>人工序列
<220>
<223>表达构建体
<400>40
ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct caaggcgcac tcccgttctg 60
gataatgttt tttgcgccga catcataacg gttctggcaa atattctgaa atgagctgtt120
gacaattaat catcggctcg tataatgtgt ggaattgtga gcggataaca atttcacaca180
ggaaacagaa ttcaggaggt aaaaaacgat ggcaaataag ccaatgcaac cgatcacatc240
tacagcaaat aaaattgtgt ggtcggatcc aactcgttta tcaactacat tttcagcaag300
tctgttacgc caacgtgtta aagttggtat agccgaactg aataatgttt caggtcaata360
tgtatctgtt tataagcgtc ctgcacctaa accggaaggt tgtgcagatg cctgtgtcat420
tatgccgaat gaaaaccaat ccattcgcac agtgatttca gggtcagccg aaaacttggc480
taccttaaaa gcagaatggg aaactcacaa acgtaacgtt gacacactct tcgcgagcgg540
caacgccggt ttgggtttcc ttgaccctac tgcggctatc gtatcgtctg atactactgc600
ttaatgaagc ttggctgttt tggcggatga gagaagattt tcagcctgat acagattaaa660
tcagaacgca gaagcggtct gataaaacag aatttgcctg gcggcagtag cgcggtggtc720
ccacctgacc ccatgccgaa ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg780
tctccccatg cgagagtagg gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa840
agactgggcc tttcgtttta tctgttgttt gtcggtgaac gctctcctga gtaggacaaa900
tccgccggga gcggatttga acgttgcgaa gcaacggccc ggagggtggc gggcaggacg960
cccgccataa actgccaggc atcaaattaa gcagaaggcc atcctgacgg atggcctttt 1020
tgcgtttcta caaactcttt tgtttatttt tctagagcca cgttgtgtct caaaatctct 1080
gatgttacat tgcacaagat aaaaatatat catcatgaac aataaaactg tctgcttaca 1140
taaacagtaa tacaaggagt gttatgagcc atattcaacg ggaaacgtct tgctcgaggc 1200
cgcgattaaa ttccaacatg gatgctgatt tatatgggta taaatgggct cgcgataatg 1260
tcgggcaatc aggtgcgaca atctatcgat tgtatgggaa gcccgatgcg ccagagttgt 1320
ttctgaaaca tggcaaaggt agcgttgcca atgatgttac agatgagatg gtcagactaa 1380
actggctgac ggaatttatg cctcttccga ccatcaagca ttttatccgt actcctgatg 1440
atgcatggtt actcaccact gcgatccccg ggaaaacagc attccaggta ttagaagaat 1500
atcctgattc aggtgaaaat attgttgatg cgctggcagt gttcctgcgc cggttgcatt 1560
cgattcctgt ttgtaattgt ccttttaaca gcgatcgcgt atttcgtctc gctcaggcgc 1620
aatcacgaat gaataacggt ttggttgatg cgagtgattt tgatgacgag cgtaatggct1680
ggcctgttga acaagtctgg aaagaaatgc ataagctttt gccattctca ccggattcag1740
tcgtcactca tggtgatttc tcacttgata accttatttt tgacgagggg aaattaatag1800
gttgtattga tgttggacga gtcggaatcg cagaccgata ccaggatctt gccatcctat1860
ggaactgcct cggtgagttt tctccttcat tacagaaacg gctttttcaa aaatatggta1920
ttgataatcc tgatatgaat aaattgcagt ttcatttgat gctcgatgag tttttctaaa1980
cgcgtgacca agtttactca tatgtacttt agattgattt aaaacttcat ttttaattta2040
aaaggatcta ggtgaagatc ctttttgata atctcatgac caaaatccct taacgtgagt2100
tttcgttcca ctgagcgtca gaccccgtag aaaagatcaa aggatcttct tgagatcctt2160
tttttctgcg cgtaatctgc tgcttgcaaa caaaaaaacc accgctacca gcggtggttt2220
gtttgccgga tcaagagcta ccaactcttt ttccgaaggt aactggcttc agcagagcgc2280
agataccaaa tactgtcctt ctagtgtagc cgtagttagg ccaccacttc aagaactctg2340
tagcaccgcc tacatacctc gctctgctaa tcctgttacc agtggctgct gccagtggcg2400
ataagtcgtg tcttaccggg ttggactcaa gacgatagtt accggataag gcgcagcggt2460
cgggctgaac ggggggttcg tgcacacagc ccagcttgga gcgaacgacc tacaccgaac2520
tgagatacct acagcgtgag ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg2580
acaggtatcc ggtaagcggc agggtcggaa caggagagcg cacgagggag ctcccagggg2640
gaaacgcctg gtatctttat agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat2700
ttttgtgatg ctcgtcaggg gggcggagcc tatggaaaaa cgccagcaac gcggcctttt2760
tacggttcct ggccttttgc tggccttttg ctcacatgtt ctttcctgcg ttatcccctg2820
attctgtgga taaccgtatt accgcctttg agtgagctga taccgctcgc cgcagccgaa2880
cgaccgagcg cagcgagtca gtgagcgagg aagcggaaga gcgcctgatg cggtattttc2940
tccttacgca tctgtgcggt atttcacacc gcatatggtg cactctcagt acaatctgct3000
ctgatgccgc atagttaagc cagtatacac tccgctatcg ctacgtgact gggtcatggc3060
tgcgccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc3120
atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc3180
gtcatcaccg aaacgcgcga ggcagctgcg gtaaagctca tcagcgtggt cgtgaagcga3240
ttcacagatg tctgcctgtt catccgcgtc cagctcgttg agtttctcca gaagcgttaa3300
tgtctggctt ctgataaagc gggccatgtt aagggcggtt ttttcctgtt tggtcactga3360
tgcctccgtg taagggggat ttctgttcat gggggtaatg ataccgatga aacgagagag3420
gatgctcacg atacgggtta ctgatgatga acatgcccgg ttactggaac gttgtgaggg3480
taaacaactg gcggtatgga tgcggcggga ccagagaaaa atcactcagg gtcaatgcca3540
gcgcttcgtt aatacagatg taggtgttcc acagggtagc cagcagcatc ctgcgatgca3600
gatccggaac ataatggtgc agggcgctga cttccgcgtt tccagacttt acgaaacacg3660
gaaaccgaag accattcatg ttgttgctca ggtcgcagac gttttgcagc agcagtcgct3720
tcacgttcgc tcgcgtatcg gtgattcatt ctgctaacca gtaaggcaac cccgccagcc3780
tagccgggtc ctcaacgaca ggagcacgat catgcgcacc cgtggccagg acccaacgct3840
gcccgagatg cgccgcgtgc ggctgctgga gatggcggac gcgatggata tgttctgcca3900
agggttggtt tgcgcattca cagttctccg caagaattga ttggctccaa ttcttggagt3960
ggtgaatccg ttagcgaggt gccgccggct tccattcagg tcgaggtggc ccggctccat4020
gcaccgcgac gcaacgcggg gaggcagaca aggtataggg cggcgcctac aatccatgcc4080
aacccgttcc atgtgctcgc cgaggcggca taaatcgccg tgacgatcag cggtccaatg4140
atcgaagtta ggctggtaag agccgcgagc gatccttgaa gctgtccctg atggtcgtca4200
tctacctgcc tggacagcat ggcctgcaac gcgggcatcc cgatgccgcc ggaagcgaga4260
agaatcataa tggggaaggc catccagcct cgcgtcgcga acgccagcaa gacgtagccc4320
agcgcgtcgg ccgccatgcc ggcgataatg gcctgcttct cgccgaaacg tttggtggcg4380
ggaccagtga cgaaggcttg agcgagggcg tgcaagattc cgaataccgc aagcgacagg4440
ccgatcatcg tcgcgctcca gcgaaagcgg tcctcgccga aaatgaccca gagcgctgcc4500
ggcacctgtc ctacgagttg catgataaag aagacagtca taagtgcggc gacgatagtc4560
atgccccgcg cccaccggaa ggagctgact gggttgaagg ctctcaaggg catcggtcga4620
cgctctccct tatgcgactc ctgcattagg aagcagccca gtagtaggtt gaggccgttg4680
agcaccgccg ccgcaaggaa tggtgcatgc aaggagatgg cgcccaacag tcccccggcc4740
acggggcctg ccaccatacc cacgccgaaa caagcgctca tgagcccgaa gtggcgagcc4800
cgatcttccc catcggtgat gtcggcgata taggcgccag caaccgcacc tgtggcgccg4860
gtgatgccgg ccacgatgcg tccggcgtag aggatccggg cttatcgact gcacggtgca4920
ccaatgcttc tggcgtcagg cagccatcgg aagctgtggt at 496权利要求
1.一种表达能够通过自装配形成VLP的噬菌体重组衣壳蛋白或其突变体或片段的方法,所述方法包括以下步骤
a)将一种表达质粒导入细菌宿主中,其中所述表达质粒包含一种表达构建体,其中所述表达构建体包含(i)编码所述重组衣壳蛋白或其突变体或片段的第一核苷酸序列,和(ii)可被乳糖诱导的启动子;
b)在包含主碳源的培养基中培养所述细菌宿主;其中所述培养以分批培养方式在所述启动子被lacI阻遏的条件下进行,其中所述细菌宿主过量表达所述lacI;
c)用所述主碳源向所述分批培养物中补料;和
d)利用一种诱导物诱导所述启动子,其中继续用所述主碳源向所述分批培养物中补料。
2.权利要求1的方法,其中所述噬菌体是RNA噬菌体。
3.权利要求1或2的方法,其中所述噬菌体选自
a.)噬菌体Qβ;
b.)噬菌体AP205;
c.)噬菌体fr;
d.)噬菌体GA;
e.)噬菌体SP;
f.)噬菌体MS2;
g.)噬菌体M11;
h.)噬菌体MX1;
i.)噬菌体NL95;
j.)噬菌体f2;
k.)噬菌体PP7;和
l.)噬菌体R17。
4.权利要求2的方法,其中所述RNA噬菌体是Qβ。
5.权利要求4的方法,其中所述重组衣壳蛋白具有氨基酸序列SEQ ID NO5。
6.权利要求1到5任一项的方法,其中所述表达构建体包含第一终止密码子和第二终止密码子,其中所述第一终止密码子直接定位于所述第一核苷酸序列的3’,并且其中第二终止密码子直接定位于所述第一终止密码子的3’,并且其中所述第一或第二终止密码子的至少一个是TAA。
7.权利要求1的方法,其中所述表达构建体包含第一核苷酸序列和第二核苷酸序列,其中所述第一核苷酸序列编码QβCP,或其突变体或片段,并且其中所述第二核苷酸序列编码QβA1蛋白或其突变体或片段,并且其中所述第一和第二核苷酸序列通过正好一个包含至少一个TAA终止密码子的一段序列而隔开。
8.权利要求1的方法,其中所述表达构建体包含核苷酸序列SEQID NO6或由核苷酸序列SEQ ID NO6组成。
9.权利要求1的方法,其中所述表达质粒包含核苷酸序列SEQ IDNO1或优选地由核苷酸序列SEQ ID NO1组成。
10.权利要求4的方法,其中所述第一核苷酸序列编码噬菌体的突变外壳蛋白。
11.权利要求1到7任一项的方法,其中所述启动子选自
a.)tac启动子;
b.)trc启动子;
c.)tic启动子;
d.)lac启动子;
e.)lacUV5启动子;
f.)Psyn启动子;
g.)lppa启动子;
h.)lpp-lac启动子;
i.)T7-lac启动子;
j.)T3-lac启动子;
k.)T5-lac启动子;和
l.)与SEQ ID NO2具有至少50%序列同源性的启动子。
12.权利要求1到10任一项的方法,其中所述启动子包含核苷酸序列SEQ ID NO2。
13.权利要求1到12任一项的方法,其中所述主碳源是甘油。
14.权利要求1到13任一项的方法,其中所述分批培养物的所述补料以一定的流速进行,其中所述流速以指数系数μ增长,并且其中优选地所述指数系数μ低于μmax。
15.权利要求1到14任一项的方法,其中所述启动子的所述诱导通过用所述诱导物和所述主碳源以恒定的流速向所述分批培养物中共补料而进行。
16.权利要求1到14的任一方法,其中所述启动子的所述诱导通过用所述诱导物和所述主碳源以渐增的流速向所述分批培养物中共补料而进行。
17.权利要求15或权利要求16的方法,其中所述诱导物是乳糖,并且其中优选地所述乳糖和所述主碳源以大约2∶1到1∶4(w/w)的比例共补料到所述分批培养物中。
18.权利要求1到16任一项的方法,其中所述诱导物是IPTG,并且其中优选地所述IPTG在所述培养基中的浓度是0.001到5mM。
19.权利要求18的方法,其中所述IPTG在所述培养基中的浓度是大约0.01mM。
20.权利要求1到19任一项的方法,其中所述lacI被所述细菌宿主过量表达,其中所述过量表达由lacIq或lacQl引起,优选地由lacIq引起。
21.权利要求1到20任一项的方法,其中所述细菌宿主在其染色体上包含lacIq基因。
22.权利要求1到21任一项的方法,其中所述细菌宿主在质粒上包含lacIq基因。
23.权利要求1到17任一项的方法,其中所述诱导物是乳糖,并且其中所述细菌宿主包含β-半乳糖苷酶活性。
24.权利要求1到23任一项的方法,其中所述培养和所述分批培养物的补料和所述启动子的所述诱导在比所述细菌宿主的最适生长温度低的温度下进行。
25.权利要求9的方法,其中
a)所述主碳源是甘油;
b)所述分批培养物的所述补料以一定的流速进行,其中所述流速以指数系数μ增长,并且其中优选地所述指数系数μ低于μmax;
c)所述诱导物是乳糖;
d)并且所述乳糖和所述主碳源以2∶1到1∶4(w/w)、优选1∶1到1∶3(w/w)、最优选1∶3(w/w)的比例向所述分批培养物中共补料;
e)所述细菌宿主是大肠杆菌RB791;并且
f)所述培养和所述分批培养物的补料和所述启动子的所述诱导在大约30℃的温度下进行。
26.权利要求1的方法,其中
a)所述表达质粒包含或优选地由核苷酸序列SEQ ID NO30组成;
b)所述主碳源是甘油;
c)所述分批培养物的所述补料以一定的流速进行,其中所述流速以指数系数μ增长,并且其中优选地所述指数系数μ低于μmax;
d)所述诱导物是乳糖;
e)所述乳糖和所述主碳源以2∶1到1∶4(w/w)、优选1∶1到1∶3(w/w)、最优选1∶3(w/w)的比例向分批培养物中共补料;
f)所述细菌宿主是大肠杆菌RB791;并且
g)所述培养和所述分批培养物的补料和所述启动子的所述诱导在大约30℃的温度下进行。
27.权利要求1到26任一的方法,其中贯穿所述方法的步骤b)到d),以至少大约40%的培养基中的pO2为所述细菌宿主供应氧。
全文摘要
本发明提供了一种表达通过自装配形成VLP的噬菌体衣壳蛋白的高效的发酵方法,其中该方法可放大至商业生产规模,并且其中控制衣壳蛋白的表达速率以获得提高的可溶性衣壳蛋白的产量。这可通过将补料分批培养和乳糖诱导表达系统的优点与特定过程参数相结合而获得,所述参数提供在生长期中提高的启动子阻遏和贯穿该过程的高质粒保持。
文档编号C12N7/02GK101213294SQ200680023620
公开日2008年7月2日 申请日期2006年5月24日 优先权日2005年5月26日
发明者M·埃默林格, F·亨内克, H·普夫伦德, M·里尔, P·斯坦纳 申请人:赛托斯生物技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1