用于快速筛选微生物宿主以鉴定某些在表达异源蛋白质方面具有改善的产量和/或质量...的制作方法

文档序号:570480阅读:1595来源:国知局

专利名称::用于快速筛选微生物宿主以鉴定某些在表达异源蛋白质方面具有改善的产量和/或质量...的制作方法
技术领域
:本发明在蛋白质生产领域内,具体涉及鉴定对于大规模生产正确加工的异源蛋白质最佳的宿主细胞。
背景技术
:超过150种重组生产的蛋白质和多肽已经获得美国食品和药品管理局(FDA)批准作为生物技术药物和疫苗使用,另有370种处于临床试验中。与经由化学合成所生产的小分子治疗剂不同,蛋白质和多肽是在活细胞中最有效生成的。然而,当前在细菌中生产重组蛋白质的方法通常生成不正确折叠的、聚集的或没有活性的蛋白质,而且许多类型的蛋白质要求使用已知方法时低效率实现的次级修饰。已经开发了许多尝试以提高正确折叠的蛋白质在重组系统中的生成。例如,调查人员变更了发酵条件(Schein(1989)Bio/Technology,7:1141-1149),改变了启动子强度,或者使用了过量表达的伴侣蛋白(Hockney(1994)TrendsBiotechnol.12:456-463),其能有助于防止包含体的形成。已经开发了多种策略来将蛋白质从细胞分泌入上清液中。例如美国专利No.5,348,867;美国专利No.6,329,172;PCT公开文本号WO96/17943;PCT公开文本号WO02/40696;及美国申请公开文本2003/0013150。用于提高表达的其它策略致力于将蛋白质靶向至周质。一些调查聚焦于非Sec型分泌(参见例如PCT公开文本号WO03/07卯07;美国公开文本No.2003/0180937;美国公开文本No.2003/0064435;及PCT公开文本号WO00/59537)。然而,大多数研究聚焦于用Sec型分泌系统分泌外源蛋白质。已经记载了许多在表达重组多肽或蛋白质中使用的分泌信号。参见例如美国专利No.5,914,254;美国专利No.4,963,495;欧洲专利No.0177343;美国专利No.5,082,783;PCT公开文本号WO89/10971;美国专利No.6,156,552;美国专利No.6,495,357;6,509,181;6,524,827;6,528,298;6,558,939;6,608,018;6,617,143;美国专利No.5,595,898;5,698,435;及6,204,023;美国专利No.6,258,560;PCT公开文本号WO01/21662,WO02/068660和美国申请公开文本2003/0044906;美国专利No.5,641,671;及欧洲专利No.EP0121352。异源蛋白质生产通常导致不溶性或不正确折叠的蛋白质的形成,它们难以恢复,而且可能是没有活性的。此外,特定宿主细胞蛋白酶的存在可以降解感兴趣的蛋白质,如此降低最终的产量。没有会改善所有异源蛋白质生产的单因素。因此,本领域中需要能够分泌和正确地加工重组多肽的改良大头见模表达系统以生产正确加工形式的转基因蛋白质。发明概述本发明提供了用于快速鉴定能够以改善的产量和/或质量依照想要的规格(specification)生成至少一种异源多肽的宿主细胞群体的组合物和方法。该组合物包含两个或更多个如下的宿主细胞群体,其已经进行过遗传修饰以拔_高一种或多种牵涉蛋白质生成的靶基因的表达、降低一种或多种牵涉蛋白质降解的靶基因的表达、表达影响蛋白质产物的异源基因、或组合。在多种经修饰宿主细胞中表达感兴趣多肽的能力提供了用于为感兴趣多肽确定最佳宿主细胞的快速且高效的手段。想要的规格会随感兴趣的多肽而变化,但是包括产量、质量、活性等。公认的是,宿主细胞群体可以进行修饰以表达如下核酸序列的许多组合,所述核酸序列影响促进感兴趣多肽表达的内源序列和/或外源序列的表达以提高一种或多种牵涉感兴趣异源蛋白质的正确表达、加工、和/或转运之一项或多项的靶基因的表达。在另一个实施方案中,所述靶基因是蛋白质折叠调控物(modulator)。在另一个实施方案中,所述蛋白质折叠调控物选自表l中的列表。在另一个实施方案中,一个或多个宿主细胞群体已经进行过遗传修饰以降低一种或多种牵涉蛋白水解降解的靶基因的表达。在另一个实施方案中,所述靶基因是蛋白酶。在另一个实施方案中,所述蛋白酶选自表2中的列表。在一个实施方案中,编码感兴趣蛋白质的核苷酸序列是与本文中所描述的焚光"(艮单月包菌(尸'sew(iomow(xy/7womycem1,/!//Momscem1)Sec系统分泌信号可操作连接的。阵列中的一个或多个菌抹可以在周质区室(periplasmcompartment)中表达感兴趣的异源蛋白质。在某些实施方案中,一个或多个菌抹还可以穿过细胞外壁向胞外分泌异源蛋白质。宿主细胞包括真核细胞(包括酵母细胞、昆虫细胞、哺乳动物细胞、植物细胞等)和原核细胞(包括细菌细胞,诸如荧光假单胞菌、大肠杆菌CE.co//)如指明的那样,可以对宿主细胞群体的文库进行快速筛选以鉴定异源表达的蛋白质的产量和/或质量得到改善的某些菌林。菌抹阵列对于筛选任何感兴趣蛋白质的表达改善是有用的,包括治疗性蛋白质、激素、生长因子、胞外受体或配体、蛋白酶、激酶、血液蛋白质、趋化因子、细胞因子、抗体等。附图简述图1A描绘了用于荧光假单胞菌中工程化基因组删除的质粒pDOW1261-2。图1B是基因X删除的构建的示意图。图2是对zl,c/、/Weg尸2、z!La2和gr;^^"X/共表达菌抹中诱导后0小时和24小时时(分别为I0和I24)制备的可溶性细胞级分的Westem印迹分析(实施例6)。顶部箭头指向共表达的菌抹中而不是对照(DC440)中的完全装配的单克隆抗体。产重组体;n-r-非重组体。发明详述现在会在下文中参照附图更详细地描述本发明,附图中显示了本发明的一些但不是所有实施方案。实际上,这些发明可以以许多不同形式体现,而且不应当解释为限于本文中所提出的实施方案;而应解释为,提供这些实施方案以使本公开内容会满足适用的法定要求。这些发明所属
技术领域
的技术人员会想到本文中所提出的发明的许多改良和其它实施方案,它们具有上述说明及附图中所呈现的教导的好处。因此,要理解的是,本发明不限于所公开的具体实施方案,并且意图将改良和其它实施方案包括在本发明的范围内。虽然本文中采用特定的术语,但是它们仅以普通的且描述的意义使用,并且不是出于限制目的。总论提供了用于鉴定对于在宿主细胞中生成高水平的正确加工的异源多肽最佳的宿主菌林(例如荧光假单胞菌宿主菌抹)的组合物和方法。具体地,提供了宿主菌林的文库(或"阵列"),其中该文库中的每个菌抹(或"宿主细胞群体")已经进行过遗传修饰以调控一种或多种靶基因在该宿主细胞中的表达。可以根据与该阵列中表型独特的宿主细胞的其它群体相比所表达感兴趣蛋白的数量、质量、和/或位置来鉴定或选择"最佳的宿主菌抹"。如此,最佳的宿主菌抹是依照想要的规格生成感兴趣多肽的菌抹。虽然想要的规格会随所生成的多肽而变化,但是所述规格包括蛋白质的质量和/或数量(无论该蛋白质是隔离的还是分泌的)、蛋白质折叠等。一般而言,"异源的"、"异源表达的"或"重组的"指如下基因或蛋白质,所述基因或蛋白质对宿主细胞而言不是内源的或者对它在天然基因组中存在的位置而言不是内源的,并且已经通过注射、转染、显微注射、电穿孔、显微喷射等添加至细胞。对阵列中的一个或多个宿主细胞群体进行修饰以调控一种或多种靶基因在该宿主细胞中的表达。通过"耙基因,,意指影响宿主细胞中异源蛋白质生成的基因。影响异源蛋白质生成的靶基因包括编码调控异源蛋白质的表达、活性、溶解度、转运、蛋白水解降解和/或切割的蛋白质的基因。例如,把基因可以编码至少一种宿主细胞蛋白酶、蛋白质折叠调控物、转录因子、翻译因子、分泌调控物、或任何其它牵涉感兴趣异源蛋白质的正确转录、翻译、加工、和/或转运的蛋白质。"靶蛋白"指自靶基因表达得到的蛋白质或多肽。提高或降低一种或多种靶基因的表达和/活性,这取决于所述靶基因或蛋白质的功能。例如,可以降低一种或多种宿主细胞蛋白酶的表达,而可以提高一种或多种蛋白质折叠调控物的表达。本文中所描述的阵列对于快速鉴定对感兴趣异源蛋白质或肽的生成最佳的宿主细胞是有用的。异源蛋白质生成经常导致不溶性或不正确折叠的蛋白质的形成,它们难以恢复,而且可能是没有活性的。此外,特定宿主细胞蛋白酶的存在可以降解感兴趣的蛋白质,如此降低最终的产量。没有会最佳地生成所有感兴趣多肽或蛋白质的单一宿主细胞群体。如此,使用本发明的主细胞。然后可以使用最佳的宿主菌抹来生成足够量的感兴趣蛋白质,或者用于商业生产。类似地,可以基于最佳的宿主菌抹来修饰宿主菌株以表达感兴趣的蛋白质。在一个实施方案中,该方法包括获得至少包含荧光假单胞菌细胞的第一和第二群体的阵列,其中每个群体选自下组(i)如下荧光假单胞菌细胞的群体,其已经进行过遗传修饰以降低至少一种牵涉蛋白质降解的靶基因的表达;(ii)如下荧光假单胞菌细胞的群体,其已经进行过遗传修饰以提高至少一种牵涉蛋白质生成的耙基因的表达;和(iii)如下荧光假单胞菌细胞的群体,其已经进行过遗传修饰以降低至少一种牵涉蛋白质降解的靶基因的表达并提高至少一种牵涉蛋白质生成的耙基因的表达;向每个群体的至少一个细胞中导入包含编码至少一种感兴趣异源蛋白质的至少一种基因的表达构建体;在足以在至少一个细胞群体中表达所述感兴趣蛋白质的条件下维持所述细胞;并选择所述感兴趣异源蛋白质得以生成的最佳细胞群体;其中所述阵列中的每个群体是不相同的,且其中每个群体在物理上是;^皮此分开的;其中与该阵列中的其它群体相比,所述感兴趣异源蛋白质在所述最佳的细胞群体中展现出改善的表达、改善的活性、改善的溶解度、改善的移位、或降低的蛋白水解降解或切割之一项或多项。阵列可以进一步包含如下宿主细胞(例如荧光假单胞菌宿主细胞)的群体,其没有进行过遗传修饰以改变宿主细胞蛋白酶或蛋白质折叠调控物的表达。此群体可以是野生型菌抹,或者可以是如下菌株,其进行过遗传修饰以改变一种或多种不牵涉蛋白质生成、加工、或移位的基因的表达(例如可以进行过遗传修饰以表达例如选择标志基因)。在一个实施方案中,荧光假单胞菌宿主细胞的每个群体在表型方面是彼此独特的(即"不相同的")。通过"表型独特的"意指每个群体生成可测量程度上不同量的一种或多种靶蛋白质。在此实施方案中,每个菌林进行过遗传修饰以改变一种或多种不同靶基因的表达。若在宿主细胞群体中调控超过包含多个表型独特的依照本发明的宿主细胞群体的阵列是提供多个群体的阵列,从中选择一种或多种对生成感兴趣异源蛋白质或多肽有用的菌抹。本领域技术人员会理解的是,此类阵列还可以包含任何一种或多种宿主细胞群体的复制品(例如一式两份、一式三份等)。阵列本文中提供了宿主细胞群体的阵列(即"菌抹阵列"),其能快速进行筛选以鉴定某些具有改善的异源蛋白质产量和/或质量的菌抹。如本文中所使用的,术语"菌抹阵列"指多个寻址位置或可寻址位置(例如孔,诸如深孔或微孔)。该阵列中每个微孔或微孔组的位置通常是已知的,以便容许鉴定对于感兴趣异源蛋白质的表达最佳的宿主细胞。菌抹阵列包含多个表型独特的宿主菌林。该阵列可以是低密度阵列或高密度阵列,并且可以含有约2个或更多个、约4个或更多个、约8个或更多个、约12个或更多个、约16个或更多个、约20个或更多个、约24个或更多个、约32个或更多个、约40个或更多个、约48个或更多个、约64个或更多个、约72个或更多个、约80个或更多个、约96个或更多个、约192个或更多个、约384个或更多个宿主细胞群体。本发明的宿主细胞群体可以在多孔或深孔器皿中维持和/或筛选。该器亚可以含有任何想要数目的孔,不过,微型化细胞培养微阵列平台对于个别地和同时地使用最少的试剂和相对较少数目的细胞来筛选每个宿主细胞群体是有用的。在此测定法中有用的一种典型的多孔、微量滴定器皿是多孔板,包括但不限于10孔板、28孔板、96孔板、384孔板、和具有大于384孔的板。或者,也可以使用管(tubes)、台架(holders)、筒(cartridges)、微型管(minitubes)、微量离心管(microfugetubes)、冷冻管(cryovials)、方孑L4反管(squarewellplatestubes)、板(plates)、斜面(slants)、或培养瓶(cultureflasks)的阵列,这取决于想要的体积。器m可以由任何适合于培养和/或筛选感兴趣宿主细胞(例如假单胞菌属)的材料制成。例如,器i可以是可容易地进行灭菌的材料,诸如塑料或其它人造聚合物材料,只要该材料是生物相容的。可以使用任何数目的材料,包括但不限于聚苯乙烯;聚丙蹄;聚乙烯化合物(例如聚氯乙烯);聚碳酸酯(PVC);聚四氟乙烯(PTFE);聚乙醇酸(PGA);纤维素;玻璃、含氟聚合物、氟化乙烯丙烯、聚偏乙烯、聚二曱基硅氧烷、硅等。自动化细胞转化和自动化菌落拣选机会促进想要的细胞的快速筛选。可以使用本领域中已知的测位仪装置(例如自动化机器人装置)来创建和/或筛选阵列。綠因本发明的菌抹阵列包含多个表型和基因型独特的宿主细胞群体,其中阵列中的每个群体已经进行过遗传修饰以调控一种或多种把基因在该宿主细胞中的表达。通过"靶基因"意指影响宿主细胞中异源蛋白质生成的基因。靶基因可以编码宿主细胞蛋白酶或内源或外源蛋白质折叠调控物、转录因子翻译因子、分泌调控物、或任何其它牵涉感兴趣异源蛋白质的正确表达、加工、和/或转运的基因。"靶蛋白"指自靶基因表达得到的蛋白质或多肽。提高或降低一种或多种把基因的表达和/活性,这取决于所述耙基因或蛋白质的功能。靶基因可以是宿主细胞内源的,或者可以是阵列中的每个宿主细胞群体中异源表达的基因。在一个实施方案中,一种或多种靶基因是至少一种蛋白质折叠调控物、推定的蛋白质折叠调控物、或折叠调控物的辅因子或亚基。在一些实施方案中,一种或多种靶基因可以选自侣伴蛋白、折叠酶、肽基脯氨酰异构酶和二硫键异构酶。在一些实施方案中,一种或多种靶基因可以选自htpG、cbpA、dnaJ、dnaK和fkbP。来自焚光假单胞菌的例示性蛋白质折叠调控物列于表l中。在其它实施方案中,靶基因包含至少一种推定的蛋白酶、蛋白酶样蛋白、或蛋白酶的辅因子或亚基。例如,一种或多种靶基因可以是丝氨酸、苏氨酸、半胱氨酸、天冬氨酸或金属肽酶。在一个实施方案中,一种或多种靶基因可以选自hslV、hsiU、clpA、clpB和clpX。靶基因还可以是蛋白酶的辅因子。来自荧光假单胞菌的例示性蛋白酶列于表2中。来自多种生物体的蛋白酶可以参见由WellcomeTrustSangerInstitute,Cambridge,UK维护的MEROPS肽酶凄欠-提,'牟(参网iihmerops.Sanger.acuk/)。蛋白质折叠调控物在宿主细胞中生成异源蛋白质的另一项主要障碍在于该细胞通常没有足够配备来生成可溶性或活性蛋白质。虽然蛋白质的一级结构由其氨基酸序列限定,但是二级结构由a-螺旋或P-片层的存在限定,而三级结构由相邻蛋白质段之间的共价键诸如二硫键限定。在表达异源蛋白质时(特别在大规模生产中),蛋白质自身的二级结构和三级结构是至关重要的。蛋白质结构的任何显著变化可以产生没有功能活性的分子,或具有显著降低的生物学活性的蛋白质。在许多情况中,宿主细胞表达对于活性异源蛋白质的正确生成而言必需的蛋白质折叠调控物(PFM)。然而,在生成可用的、经济学上满意的生物技术产品所一般要求的高水平表达,细胞通常不能生成足够的一种或多种天然蛋白质折叠调控物来加工异源表达的蛋白质。在某些表达系统中,异源蛋白质的过表达可以伴随其错误折叠和隔离成不溶性聚集物。在细菌细胞中,这些聚集物称为包含体。在大肠杆菌中,折叠调控物/伴侣蛋白的网络包括Hsp70家族。主要的Hsp70伴估蛋白,即DnaK有效地阻止蛋白质聚集,而且支持受损的蛋白质重折叠。将热休克蛋白掺入蛋白质聚集物中可以促进解聚。不过,在某些情况中,加工成包含体的蛋白质可以经由对不溶性级分的别的加工来恢复。包含体中找到的蛋白质通常必须经由多个步骤来纯化,包括变性和复性。用于包含体耙向蛋白质的典型复性方法牵涉如下尝试,即将聚集物溶解于浓缩的变性剂中,随后通过稀释来除去变性剂。在此阶段经常再次形成聚集物。额外的加工增加成本,不能保证体外重折叠会产生有生物活性的产物,而且所恢复的蛋白质可包括大量的片段杂质。最近通过分子伴侣(其通过瞬时与折叠中间体相互作用来促进对其它多肽的正确异构化和细胞靶向)和折叠酶(其使限速步骤沿着折叠途径加速)帮助体内蛋白质折叠的实现已经提供了与包含体形成问题作斗争的别的方法(参见例如ThomasJG等(1997)如/S/oc/ew肠fec/wo/66:197-238)。在某些情况中,已经发现了伴侣蛋白的过表达增加聚集倾向的蛋白质的可溶性产量(参见Baneyx,F.(1999)CWr(9p/".fi/。阮/.10:41l-421及其中的参考文献)。与这些伴侣蛋白的胞内浓度增加有关的有益效果表现出高度依赖于过度生成的蛋白质的性质,而且可以不需要为所有的异源蛋白质过表达相同的蛋白质折叠调控物。蛋白质折叠调控物(包括伴侣蛋白、二碌"A异构酶、和肽基脯氨酰顺反异构酶(PPI酶))是一类存在于所有细胞中的蛋白质,其有助于新生多肽的折叠、解折叠和降解。伴侣蛋白通过结合至新生多肽、使它们稳定并让它们正确地折叠来起作用。蛋白质拥有疏水性和亲水性两种残基,前者通常暴露于表面上,而后者埋藏在结构内,在那里它们与其它亲水性残基而不是该分子周围的水相互作用。然而,在正在折叠的多肽链中,亲水性残基经常暴露一定的时间段,因为蛋白质以部分折叠或错误折叠的状态存在。在此时间期间,正在形成的多肽可以变为永久错误折叠的或者与其它错误折叠的蛋白质相互作用并在细胞内形成大聚集物或包含体。一般而言,伴侣蛋白通过结合至部分折叠链的疏水区域并防止它们完全错误折叠或与其它蛋白质聚集来起作用。伴倡蛋白甚至可以结合至包含体中的蛋白质,并让它们解聚(Ranson等1998)。GroES/EL、DnaKJ、Clp、Hsp90和SecB折叠调控物家族都是具有伴侣蛋白样活性的蛋白质的例子。另一种重要类型的折叠调控物是二硫键异构酶。这些蛋白质催化非常特异性的一组反应来帮助正在折叠的多肽形成正确的蛋白质内二硫键。任何具有超过两个半胱氨酸的蛋白质有在错误残基之间形成二硫键的风险。二硫键形成家族由催化二硫键在周质的非还原性环境中形成的Dsb蛋白组成。在周质多肽错误折叠时,二硫键异构酶即DsbC能够重新排列二硫键,并容许蛋白质以正确的连接重新形成。脯氨酸残基在氨基酸中的独特之处在于其前面紧接的肽键可以采取顺式或反式构象。对于所有其它氨基酸,由于位阻,这不是有利的。肽基脯氨酰顺反异构酶(PPI酶)催化此键从一种形式向另一种转换。这种异构化可以帮助蛋白质折叠、重折叠、亚基装配和细胞中的运输(Dolinski等l"7)。在似乎以非特异性方式与蛋白质相互作用的通用伴侣蛋白外,还有帮助特定靶物折叠的伴侣蛋白。这些蛋白质特异性伴侣蛋白与其靶物形成复合物,阻止聚集和降解,并为它们装配成多亚基结构留出时间。P叩D伴侣蛋白是此类型的一个公知的例子(Lombardo等1997)。折叠调控物还包括例如HSP70蛋白、HSP110/SSE蛋白、HSP40(DNAJ相关)蛋白、GRPE样蛋白、HSP90蛋白、CPN60和CPN10蛋白、胞质溶胶陪伴蛋白(cytosolicchaperoning)、HSP100蛋白、小HSP、钙联接蛋白和钙网蛋白、PDI和硫氧还蛋白相关蛋白、肽基脯氨酰异构酶、亲环蛋白PPI酶、FK-506结合蛋白、纟田小蛋白PPI酶、个别的陪伴蛋白(individualchaperoning)、蛋白质特异性伴侣蛋白、或分子内伴侣蛋白。折叠调控物一般性记载于"GuidebooktoMolecularChaperonesandProtein-FoldingCatalysts"(1997)MGething编,MelbourneUniversity,Australia。大肠杆菌胞质中表征最好的分子伴侣是ATP依赖性DnaK-DnaJ-GrpE和GroEL-GroES系统。基于体外研究和同源性考虑,已经提出了许多别的胞质蛋白质在大肠杆菌中起分子伴侣的作用。这些包括ClpB、HtpG和IbpA/B,像DnaK-DnaJ-GrpE和GroEL-GroES—样,它们是属于应激调节子的热休克蛋白(Hsp)。X-Pro键的反式构象在新生蛋白质链中是能量方面有利的;不过,在天然蛋白质中找到占全部约5。/。的脯氨酰肽键为顺式构象。反式向顺式的X-Pro键异构化在许多多肽的折叠中是限速的,并且在体内由肽基脯氨酰顺/反异构酶(PPI酶)催化。至今在大肠杆菌中已经鉴定出3种胞质PPI酶,即SlyD、SlpA和触发因子(TF)。已经假设了TF(—种与50S核糖体亚基结合的48kDa蛋白质)在大肠杆菌中与伴侣蛋白合作以保证新合成的蛋白质的正确折叠。至少5种蛋白质(硫氧还蛋白1和2及谷氧还蛋白1、2和3,分别为trxA、trxC、grxA、grxB和grxC基因的产物)牵涉胞质酶中瞬时出现的二硫桥的还原。如此,靶基因可以是容许正确的二硫^:形成的二碌^t形成蛋白或伴侣蛋白。表l:荧光假单胞菌菌林MB214蛋白质折叠调控物ORFID基因功能家族位置GroES/ELRXF02095.1groES伴侣蛋白HsplO胞质的RXF06767.1:groEL伴侣蛋白Hsp60胞质的:rxf02.090RXFO1748.1ibpA小热休克蛋白(sHSP)IbpAHsp20胞质的PA3126;起GroESL折叠支持物的作用RXF03385.1hscB伴倡蛋白hscBHsp20胞质的Hsr70(DnaK/J)周质的RXF05399.1dnaK伴侣蛋白Hsp70RXF06954.1dnaK伴侣蛋白Hsp70胞质的RXF03376.1hscA伴侣蛋白Hsp70胞质的RXF03987.2cbpA弯曲DNA结合蛋白,Hsp40胞质的dnaJ样活性RXF05406.2dnaJ伴侣蛋白dnaJHsp40胞质的RXF03346.2dnaJ分子伴侣(DnaJ家族)Hsp40非分泌的RXF05413.1grpF二热休克蛋白GrpEPA4762GrpE胞质的HsplOO(Clp/Hsl)胞质的RXF04587.1clpAATP依赖性clp蛋白酶HsplOOATP结合亚基clpARXF08347.1clpBClpB蛋白HsplOO胞质的RXF04654.2clpXATP依赖性clp蛋白酶HsplOO胞质的ATP结合亚基clpXRXF04663.1clpPATP依赖性clp蛋白酶MEROPS胞质的蛋白水解亚基(EC3.4.21.92)肽酶家族S14RXFO1957.2hslUATP依赖性hsl蛋白酶HsplOO胞质的ATP结合亚基hslURXF01961.2hslVATP依赖性hsl蛋白酶MEROPS胞质的蛋白水解亚基肽酶亚家族T1B14Hsp33RXF04254.2yrfl33kDa陪伴蛋白(热休克蛋白33同系物)(HSP33)htpG伴倡蛋白htpGHsp90RXF05455.2SecBRXF0223UsecB分泌特异性伴侣蛋白SecB二碌L键异构酶RXF07017.2dsbARXF08657.2RXFO1002.1RXF03307.1dsbA/dsbC/dsbG/fernAdsbA/dsbCdsbC二^s克化物异构酶二^危化物异构酶二;5克化物异构酶二硫化物异构酶RXF04890.2dsbG二硫化物异构酶肽基脯氨酰顺反异构酶RXF03768.1ppiARXF05345.2RXF06034.2RXF06591.1RXF05753.2RXFO1833.2RXF04655.2RXF05385.1RXF00271.1ppiBfklB細/臉fkbPslyDtigyaad肽基脯氨酰顺反异构酶A(EC5.2.1.8)肽基脯氨酰顺反异构酶B肽基脯氨酰顺反异构酶FklBfk506结合蛋白肽基脯氨酰顺反异构酶(EC5.2.1.8)肽基脯氨酰顺反异构酶(EC5.2.1.8)肽基脯氨酰顺反异构酶SlyD触发因子,PPI酶(EC5.2丄8)可能是FKBP型16kDa肽基脯氨酰顺反异构酶(EC5.2.1.8)(PPI酶)(旋转异构酶)肽基脯氨酰顺反异构酶(EC5.2.1.8)Hsp33PPI酶:FKBP型胞质的Hsp90胞质的SecB非分泌的DSBA胞质的氧化还原酶DSBA胞质的氧化还原酶DSBA氧化还原酶/周质的硫氧还蛋白谷氧还蛋白/周质的硫氧还蛋白谷氧还蛋白/周质的硫氧还蛋白PPI酶:亲环蛋白型周质的PPI酶:亲环蛋白型胞质的PPI酶:FKBP型外膜PPI酶:FKBP型周质的PPI酶:FKBP型外膜PPI酶:FKBP型非分泌的PPI酶:FKBP型胞质的PPI酶:FKBP型非分泌的非分泌的菌毛装配伴侣蛋白(papD样)RXF06068.1RXF05719.1RXF03406.2RXF04296.1c叩ecpDecpD;csuGespD',^半4吕蛋白cup伴侣蛋白ecpD伴侣蛋白ecpD14MS蛋白ecpD菌毛装商己papD菌毛装配papD菌毛装配papD菌毛装配papD周质的质号号周二一一口信15RXF04553.1cupespD;伴4吕蛋白ecpD菌毛装配papD周质的RXF04554.2cupespD;4半"f吕蛋白ecpD菌毛装配papD周质的RXF05310.2cupespD;4半"f吕蛋白ecpD菌毛装配papD周质的RXF05304.1cupespD;4半"f吕蛋白ecpD菌毛装配papD周质的RXF05073.1cupgltF革兰氏阴性菌毛装配伴侣蛋白周质功能菌毛装配papD信号肽蛋白酶对异源表达的蛋白质的不想要的降解呈现有效使用某些表达系统的一项障碍。在细胞进行修饰以生成大量靶蛋白时,细胞被放置在压力下,并常常通过诱导或阻抑其它蛋白质来做出反应。宿主细胞在异源蛋白质生成过程中经历的压力可以提高例如特定蛋白质或辅因子的表达以引起过表达的异源蛋白质的降解。代偿性蛋白质的表达升高能对表达高水平的有活性的、全长的异源蛋白质的目的起反作用。其它蛋白质的表达降低或缺乏足够表达可以导致异源表达的蛋白质的错误折叠和聚集。虽然已知压力下的细胞会改变其蛋白质表达概况,但是并不是所有异源表达的蛋白质都会调控相同蛋白质在特定宿主细胞中的表达。如此,可以使用包含多个宿主细胞群体的阵列来鉴定最佳的宿主菌林(例如荧光假单胞菌宿主菌株),所述宿主细胞群体已经进行过遗传改造以降低一种或多种蛋白酶的表达。在一个实施方案中,通过降低至少一种来自基因组的蛋白酶的表达、抑制或除去至少一种来自基因组的蛋白酶来修饰一个或多个宿主细胞群体。该修饰还可以是对超过一种蛋白酶的。在一个相关的实施方案中,通过降低蛋白酶辅因子或蛋白酶蛋白的表达来修饰细胞。在另一个实施方案中,通过抑制蛋白酶或相关蛋白的启动子(其可以是天然启动子)来修饰宿主细胞。或者,基因修饰可以用于调控与靶基因同源的蛋白质。可以如下筛选包含经修饰宿主菌抹的阵列,即表达感兴趣的异源蛋白质,并评估蛋白质生成的质量和/或数量,如下文所描述的。或者,可以独立地将感兴趣异源蛋白质的分离物与自每个蛋白酶缺陷型宿主细胞群体收集的溶胞物一起温育,并可以使用蛋白水解降解的水平来鉴定最佳的宿主细胞。在此实施方案中,最佳的宿主细胞群体是导致最少量异源蛋白质降解的。如此,在一个实施方案中,来自最佳宿主细胞群体的溶胞物可以被降解了小于约50%的异源蛋白质、小于约45%、小于约40%、小于约35%、小于约30%、小于约25%、小于约20%、小于约10%、小于约5%、小于约4%、约3%、约2%、约1%、或更少的所述蛋白质。例示性的靶蛋白酶基因包括那些分类如下的蛋白酶氨肽酶;二肽酶;二肽基肽酶和三肽基肽酶;肽基二肽酶;丝氨酸型羧肽酶;金属羧肽酶;半胱氨酸型羧肽酶;co肽酶;丝氨酸蛋白酶;半胱氨酸蛋白酶;天冬氨酸蛋白酶;金属蛋白酶;或不明机制的蛋白质。氨肽酶包括胞质溶胶氨肽酶(亮氨酰氨肽酶)、膜丙氨酰氨肽酶、半胱氨酰氨肽酶、三肽氨肽酶、脯氨酰氨肽酶、精氨酰氨肽酶、谷氨酰氨肽酶、x-pro氨肽酶、细菌亮氨酰氨肽酶、嗜热氨肽酶、梭菌氨肽酶、胞质溶胶丙氨酰氨肽酶、赖氨酰氨肽酶、x-trp氨肽酶、色氨酰氨肽酶、曱硫氨酰氨肽酶、d—立体特异性氨肽酶、氨肽酶ey。二肽酶包括x-his二肽酶、x-arg二肽酶、x-曱基-his二肽酶、cys-gly二月太酶、glu-glu二月太酶、pro-x二月太酶、x-pro二月太酶、met-x二肽酶、非立体特异性二肽酶、胞质溶胶非特异性二肽酶、膜二肽酶、卩-ala-his二肽酶。二肽基肽酶和三肽基肽酶包括二肽基肽酶i、二肽基肽酶ii、二肽基肽酶iii、二肽基肽酶iv、二肽基二肽酶、三肽基肽酶I、三肽基肽酶II。肽基二肽酶包括肽基二肽酶a和肽基二肽酶b。丝氨酸型羧肽酶包括溶酶体pro-x羧肽酶、丝氨酸型D-ala-D-ala羧肽酶、羧肽酶C、羧肽酶D。金属羧肽酶包括羧肽酶a、羧肽酶B、赖氨酸(精氨酸)羧肽酶、gly-X羧肽酶、丙氨酸羧肽酶、胞壁酰五肽羧肽酶、羧肽酶h、谷氨酸羧肽酶、羧肽酶M、胞壁酰四肽羧肽酶、锌d-ala-d-ala羧肽酶、羧肽酶A2、膜pro-x羧肽酶、微管蛋白基-tyr羧肽酶、羧肽酶t。w肽酶包括酰氨酰肽酶、肽基甘氨酰胺酶、焦谷氨酰肽酶I、(3-天冬氨酰肽酶、焦谷氨酰肽酶II、n-曱酰曱硫氨酰肽酶、蝶酰聚Y-谷氨酸羧肽酶、Y-glu-X羧肽酶、酰基胞壁酰-ala肽酶。丝氨酸蛋白酶包括胰凝乳蛋白酶、胰凝乳蛋白酶c、metridin、胰蛋白酶、凝血酶、凝结因子Xa、纤溶酶、肠肽酶、顶体蛋白、a-溶解蛋白酶、谷氨酰内肽酶、组织蛋白酶G、凝结因子viia、凝结因子ixa、cucumisi、脯氨酰寡肽酶、凝结因子xia、brachyurin、血浆激肽释放酶、组织激肽释放酶、胰弹性蛋白酶、白细胞弹性蛋白酶、凝结因子xiia、凝乳酶(chymase)、补体成分clr55、补体成分cls55、经典补体途径c3/c5转化酶、补体因子I、补体因子D、旁路补体途径c3/c5转化酶、cerevisin、hypoderminC、赖泉醜内狀酵、内月太醉Ia、y-reni、venombinab、亮氨酰内肽酶、类胰蛋白酶、scutelarin、kexin、枯草杆菌蛋白酶、水稻素、内肽酶k、嗜热霉菌素(thermomycolin)、thermitase、内肽酶SO、T-纤溶酶原激活物、蛋白C、胰内肽酶E、胰弹性蛋白酶ii、IGA特异性丝氨酸内肽酶、U-纤溶酶原激活物、venombinA、弗林蛋白酶、成髓细胞蛋白酶、semenogelase、粒酶A或细胞毒性T-、淋巴细胞蛋白酶l、粒酶B或细胞毒性T-淋巴细月包蛋白酶2、streptogrisinA、treptogrisinB、谷氨酰内肽酶II、寡肽酶B、鲎凝血因子c、鲎凝血因子、鲎凝固酶、omptin、阻抑物lexa、细菌前导肽酶I、togavirin、flavirin。半胱氨酸蛋白酶包括组织蛋白酶B、木瓜蛋白酶、无花果蛋白酶、木瓜凝乳蛋白酶、萝摩蛋白酶、梭菌蛋白酶、streptopain、锕类(actinide)、组织蛋白酶l、组织蛋白酶H、钙蛋白酶、组织蛋白酶t、甘氨酰内月太酶、癌<足1是剂、纟且织蛋白酶S、picornain3C、picomain2A、caricain、ananain、茎干菠萝蛋白酶、果实菠萝蛋白酶、legumain、histolysain、白介素-卩转化酶。天冬氨酸蛋白酶包括胃蛋白酶A、胃蛋白酶B、胃亚蛋白酶、凝乳酶(chymosin)、组织蛋白酶D、neopenthesin、肾素、retropepsin、阿黑皮素專争4匕i酶(proopiomelanocortinconvertingenzyme)、曲霉胃蛋白酶I(aspergillopepsinI)、曲霉胃蛋白酶II(aspergillopepsinII)、青霉胃蛋白酶(penicillopepsin)、根霉胃蛋白酶(rhizopuspepsin)、内座壳胃蛋白酶(cndodiiapepsh)、毛霉胃蛋白酶(mucorop印sin)、假丝酵母胃蛋白酶(candidapepsin)、糖胃蛋白酶(saccharopepsin)、红酵母胃蛋白酶(rhodotomlapepsin)、绒泡菌胃蛋白酶(physaropepsin)、顶柱霉胃蛋白酶(acrocylindropepsin)、多孑L菌胃蛋白酶(polyporopepsin)、朱红密孑L菌胃蛋白酶(pycnoporopepsin)、斗主霉胃蛋白酶a(scytalidopepsina)、斗主霉胃蛋白酶b(scytalidopepsinb)、黄色单胞菌胃蛋白酶(xanthomonapepsin)、组织蛋白酶e、屏障胃蛋白酶(barrierpepsin)、细菌前导肽酶I、假单胞菌胃蛋白酶(pseudomonapepsin)、plasmepsin。金属蛋白酶包4舌衲脊虫它〉容血素a(atrolysina)、微生物胶原酶、白细胞溶素、间质胶原酶、中性溶酶、envelysin、iga特异性金属内肽酶、前胶原N-内肽酶、甲拌磷寡肽酶、溶神经素、溶基质蛋白酶l、meprinA、前胶原C-内肽酶、肽基-lys金属内肽酶、虾红素、溶基质蛋白酉争2、matrilysin明月交酶、气单月包菌;容素(aeromonolysin)、pseudolysin、嗜热菌蛋白酶、芽孢杆菌蛋白酶(bacillolysin)、金霉蛋白酶(aureolysin)、球菌蛋白酶(coccolysin)、真菌蛋白酶(mycolysin)、卩-溶解金属内肽酶、肽基-asp金属内肽酶、嗜中性粒细胞胶原酶、明胶酶B、利什曼原虫蛋白酶(leishmanolysin)、saccharolysin、自〉容素、deuterolysin、沙雷氏菌蛋白酶(serralysin)、3内脊虫它;容血素B、衲脊虫它溶血素C、atroxase、衲脊虫它溶血素E、枘脊蛇溶血素F、adamalysin、horrilysin、mberlysin、bothropasin、bothrolysin、ophiolysin、trimerelysinI、trimerelysinII、mucrolysin、pitrilysin、insulysin、O-唾液酸糖蛋白内肽酶(O-syaloglycoproteinendopeptidase)、russellysin、线粒体中间体肽酶、dactylysin、nardilysin、magnolysin、meprinB、纟戋4立体力口工月太酶、巨口苤细胞弹性蛋白酶、choriolysin、toxilysin。不明才几制的蛋白酶包括thermopsin和多催化性内肽酶复合物。表2:焚光假单胞菌菌株MB214蛋白酶类别家族RXF基因安排的功能天冬氨酸肽酶A8(信号肽酶1I家族)RXF05383.2脂蛋白信号肽酶(EC3.4.23.36)A24(IV型前菌毛蛋白肽酶家族)RXF05379.14型前菌毛蛋白肽酶pild(EC3.4.99,)半胱氨酸肽酶C15(焦谷氨酰肽酶I家族)RXF02161.1C40RXF01968.1RXF04920.1RXF04923.1C56(Pfpl内肽酶家族)RXF01816.1金属蛋白酶MlRXF08773.1M3RXF00561.2prlC吡咯烷酮羧酸肽酶(EC3.4.19.3)侵入相关蛋白,P60侵入相关蛋白,P60磷酸酶相关蛋白papq肽酶I(EC3.4,,)膜丙氨酸氨肽酶(EC3.4.11.2)寡肽酶A(EC3.4.24.70)位置细胞质膜细胞质膜胞质的信号肽胞质的信号肽非分泌的非分泌的胞质的RXF04631.2Zn依赖性寡肽酶胞质的M4(嗜热菌蛋白酶家族)RXF05113.2胞外金属蛋白酶前体(EC3.4.24.-)胞外的M41(FtsH内肽酶家族)RXF05400.2细胞分裂蛋白ftsH(EC3.4.24,)细胞质膜M10RXF04304.1沙雷氏菌蛋白酶(EC3.4.24,40)胞外的RXF04500.1沙雷氏菌蛋白酶(EC3.4.24.40)胞外的RXF01590.2沙雷氏菌蛋白酶(EC3.4.24.40)胞外的RXF04495.2沙雷氏菌蛋白酶(EC3.4.24.40)胞外的RXF02796.1沙雷氏菌蛋白酶(EC3.4.24.40)胞外的M14(羧肽酶A家族)RXF09091.1锌羧肽酶前体(EC3.4.17.-)胞质的M16(pitrilysin家族)RXF03441.1辅酶pqq合成蛋白F(EC3.4.99,)非分泌的RXF01918.1锌蛋白酶(EC3.4.99,)信号肽RXF01919.1锌蛋白酶(EC3.4.99,)周质的RXF03699.2加工肽酶(EC3.4.24.64)信号肽M17(亮氨酰氨肽酶家族)RXF00285.2胞质溶胶氨肽酶(EC3.4.11.1)非分泌的M18RXF07879.1天冬氨酰氨肽酶(EC3.4.11.21)胞质的M20RXF00811.1dapE琥珀酰基二氨基庚二酸酯胞质的脱琥珀酰酶(EC3.5.1.18)RXF04052.2Xaa-His二肽酶(EC3.4.13.3)信号肽RXF01822.2羧肽酶G2前体(EC3.4.17.11)信号肽RXF09831.2::N-酰基-L-氨基酸氨基信号肽RXF04892.1水解酶(EC3.5.1.14)M28(氨肽酶Y家族)RXF03488.2^4性磷酸酶同工酶转化外膜20M42M22M23(谷氨酰氨肽酶家族)RXF05615.1RXF05817.1RXRB065.2RXF01291.2RXF03916.1RXF09147.2M24RXF04693.1RXF03364.1RXF02980.1RXF06564.1M48(Ste24内狀酶家族)RXF05137.1RXF05081.1M50(S2P蛋白酶家族)RXF04692.1丝氨酸肽酶Sl(胰凝乳蛋白酶家族)RXF01250.2RXF07210.1S8(枯草杆菌蛋白酶家族)RXF06755.2RXF08517.1RXF08627.2RXF0628URXF08978.1RXF0645U蛋白前体(EC3.4.11,)去封闭氨肽酶(EC3.4.11,)细胞壁内肽酶家族M23/M37与金属内肽酶相关的膜蛋白细胞壁内肽酶家族M23/M37甲硫氨酸氨肽酶(EC3.4.11.18)曱石泉氨酸氨肽酶(EC3.4.11.18)Xaa-Pro氨肽酶(EC3.4.11.9)Xaa-Pro氨肽酶(EC3.4.1.9)热休克蛋白HtpX锌金属蛋白酶(EC3.4.24,)膜金属蛋白酶蛋白酶do(EC3.4.21,)蛋白酶do(EC3.4.21,)丝氨酸蛋白酶(EC3.4.21,)丝氨酸y菱白酶(EC3.4.21,)胞外丝氨酸蛋白酶(EC3.4.21,)胞外丝氨酸蛋白酶前体(EC3.4.21.-)胞外丝氨酸蛋白酶(EC3.4.21.-)丝氨酸蛋白酶(EC_非分泌的O-唾液酸糖蛋白内肽酶(EC3.4.24.57)胞外的糖蛋白酶蛋白质家族非分泌的信号肽信号肽信号肽胞质的非分泌的胞质的胞质的细胞质膜信号肽细胞质膜周质的周质的非分泌的胞外的信号肽非分泌的外膜信号肽S9(脯氨酰寡肽酶家族)RXF02003.2蛋白酶ii(EC3.4.21.83)RXF00458.2水解酶Sll(D-Ala-D-Ala羧肽酶A家族)RXF04657.2D-丙氨酰-D-丙氨酸内肽酶(EC3.4.99,)RXF00670.1D-丙氨酰-D-丙氨酸羧肽酶(EC3.4.16.4)S13(D-Ala-D-Ala肽酶C家族)RXF00133.1RXF04960.2S14(ClpP内肽酶家族)RXF04567.1clpPRXF04663.1clpPS16(lon蛋白酶家族)RXF04653.2RXF08653.1RXF05943.1S24(LexA家族)RXF00449.1RXF03397.1S26(信号肽酶I家族)RXF01181.1S33RXF05236.1RXF04802.1RXF04808.2pip3piplPiP2D-丙氨酰内消旋二氨基庚二酸酯内肽酶(EC3.4,,)D-丙氨酰内消^走二氨基庚二酸酯内肽酶(EC3.4,,)ATP依赖性Clp蛋白酶蛋白水解亚基(EC3.4.21.92)ATP依赖性Clp蛋白酶蛋白水解亚基(EC3.4.21.92)ATP依赖性蛋白酶La(EC3.4.21.53)ATP依赖性蛋白酶La(EC3.4.21.53)ATP依赖性蛋白酶La(EC3.4.21.53)LexA阻抑物(EC3.4.21.88)LexA阻抑物(EC3.4.21.88)信号肽酶I(EC3.4.21.89)脯氨酸亚氨基肽酶(EC3.4.11.5)脯氨酸亚氨基肽酶(EC3.4.11.5)脯氨酸亚氨基肽酶(EC3.4.11.5)周质的非分泌的周质的细胞质膜外膜外膜非分泌的胞质的胞质的胞质的胞质的非分泌的胞质的细胞质膜非分泌的非分泌的胞质的S41(C端加工肽酶家族)RXH)6586.1尾部特异性蛋白酶(EC3.4.21,)信号肽RXF01037.1尾部特异性蛋白酶(EC3.4.21,)信号肽S45RXF07170.1pacB2青霉素酰化酶(EC3.5丄11)信号肽RXF06399.2pacBl青霉素酰化酶ii(EC3.5丄11)信号肽S49(蛋白酶IV家族)RXF06993.2RXF01418.1S58(DmpA氨肽酶家族)RXF06308.2苏氨酸肽#Tl(蛋白酶体家族)RXF01961.2hslVT3(Y-谷氨酰转移酶家族)RXF02342.1ggtlRXF04424.2ggt2未分类的肽酶U32RXF00428.1RXF02151.2U61RXF04715.2U62RXF04971.2pmbAPmbA蛋白胞质的RXF04968.2TldD蛋白胞质的非MEROP蛋白酶RXF00325.1阻抑物蛋白C2非分泌的RXF02689.2微粒体二肽酶(EC3.4.13.19)胞质的RXF02739.1膜二肽酶(EC3.4.13.〗9)_信号肽可能的蛋白酶sohb(EC3.4,.-)非分泌的蛋白酶iv(EC3.4.-,)非分泌的D-氨肽酶(EC.3.4.11.19)细胞质膜ATP依赖性蛋白酶hslV胞质的(EC3.4.25,)1谷氨酰转肽酶家族(EC2.3.2.2)周质的7-谷氨酰转肽酶家族(EC2.3.2.2)周质的蛋白酶(EC3.4.-,)胞质的蛋白酶(EC3.4,.-)胞质的胞壁酰四肽羧肽酶(EC3.4.17.13)非分泌的RXF03329.2假设的胞质溶胶蛋白质胞质的RXF02492.1Xaa-Pro二肽酶(EC3.4.13.9)胞质的RXF04047.2caax氨基端蛋白酶家族细胞质膜RXF08136.2蛋白酶(转谷氨酰胺酶样蛋白质)胞质的RXF09487.1锌金属蛋白酶(EC3.4.24.-)非分泌的别的蛋白质修饰酶在另一个实施方案中,靶基因包含牵涉正确的蛋白质加工和/或修饰的基因。常见的修饰包括二硫键形成、糖基化、乙酰化、酰化、磷酸化、和,羧基化,它们都能调控蛋白质折叠和生物学活性。数类牵涉蛋白质加工的酶的非穷尽性列表参见表3。本领域技术人员会认识到如何从表3中所列出的各类蛋白质修饰酶中鉴定出在为阵列所选定的宿主细胞中有用的靶基因,或对感兴趣异源蛋白质有用的靶基因。靶基因可以是所利用宿主细胞内源的,可以是衍生感兴趣异源蛋白质的生物体内源的,或者可以是已知促进异源表达的感兴趣蛋白质正确加工的。还认识到,可以依照感兴趣异源蛋白质想要的规格来靶向任何牵涉蛋白质生成的基因。_表3:牵涉蛋白质加工的酶的类别__类别例子糖基转移酶(EC2.4.1.18)ot-葡聚糖-分支糖基转移酶酶促分支因子分支糖基转移酶酶Q葡聚糖转糖基酶糖原分支酶直链淀粉异构酶植物分支酶a-1,4-葡聚糖a-1,4-葡聚糖-6-糖基转移酶淀粉分支酶UDP-N-乙酰-D-半乳糖胺:多肽N-乙酰氨基半乳糖基转移酶GDP-岩藻糖蛋白O-岩藻糖基转移酶2<table>tableseeoriginaldocumentpage25</column></row><table>PPT-确酸酶PTP酶蛋白质磷酸酶PTP磷酸酶用于调控耙基因表达的方法可以通过本领域中已知的任何技术来^f务饰阵列中的一个或多个宿主细胞群体,例如通过其中在基因组中敲除至少一种靶基因的技术,或者通过突变至少一种靶基因来降低该基因的表达,通过改变至少一种靶基因的至少一种启动子来降低该靶基因的表达,或者通过在宿主基因组中(与感兴趣的异源蛋白质或多肽一起)共表达靶基因或靶基因的抑制物来实现。如上文所讨论的,靶基因可以是阵列中的宿主细胞群体内源的,或者可以是在每个宿主细胞群体中异源表达的。可以通过例如向宿主群体的至少一个细胞中导入包含牵涉蛋白质生成的一种或多种耙基因的表达栽体来提高靶基因的表达。还可以通过例如突变耙基因的启动子来提高耙基因表达。表达异源蛋白质的宿主细胞或生物体还可以进行遗传修饰以提高至少一种牵涉蛋白质生成的靶基因的表达,和降低至少一种牵涉蛋白质降解的靶基因的表达。基因组可以进行修饰以调控一种或多种靶基因的表达,其通过在基因组中或在具有表达载体的宿主中包括外源基因或启动子元件,通过增强特定靶基因产生mRNA或蛋白质的能力,通过删除或破坏靶基因或启动子元件,或者通过降低靶基因产生mRNA或蛋白质的能力来实现。可以经由例如替代、删除("敲除")、共表达、或插入("敲入',)技术来改变遗传密码,由此影响靶基因的转录和/或翻译。还可以插入想要的蛋白质或调节序列的别的基因,其调控现有靶序列的转录。基因组修饰宿主细胞的基因组可以经由遗传靶向事件来修饰,所述遗传靶向事件可以通过插入或重组,例如同源重组来实现。同源重组指基于序列同源性的DNA重组过程。同源重組容许内源基因中的位点特异性修饰,如此可以将新的变化工程化改造入基因組中(参见例如Radding(1982)Ann.Rev.Genet.16:405;美国专利号4,888,274)。可以为把基因座处的同源重组制备多种构建体。通常,构建体可以包括与所鉴定的基因座同源的至少10bp、20bp、30bp、40bp、50bp、70bp、100bp、500bp、lkbp、2kbp、4kbp、5kbp、10kbp、15kbp、20kbp、或50kbp的序列。确定靶基因序列的同源性程度可以牵涉多项考虑因素,诸如例如耙基因座的大小、序列的可得性、双交换事件在靶基因座处的相对效率及耙序列与其它序列的相似性。经修饰的基因可以包括如下序列,其中基本上同基因的DNA位于要修饰的基因组中相应靶序列的想要的修列修饰侧翼。"经修饰的基因"是导入基因组中以改变蛋白酶或蛋白质折叠调控物在宿主细胞中的表达的序列。"靶基因"是被经修饰的基因替换的序列。基本上同基因的序列可以与相应的靶序列(除想要的序列修饰外)至少约95%、97-98%、99.0-99.5%、99.6-99.9%、或100%相同。经修饰的基因和被靶定的基因可以共享100%相同的至少约10、20、30、50、75、150或500个碱基对的DNA段。可以设计核香酸构建体来修饰内源的靶基因产物。经修饰的基因序列可以具有设计用于破坏所得基因产物的功能的一处或多处删除、插入、替代或其组合。在一个实施方案中,改变可以是与靶基因的上游序列以符合阅读框的方式融合的选择标志基因的插入。还可以使用插入失活来修饰基因组。在此实施方案中,通过在基因中重组抑制基因产物形成的序列来修饰基因组。此插入可以或是通过插入不同的元件来破坏基因,或是除去该基因的必需部分。在一个实施方案中,插入删除还包括编码对特定应激物诸如抗生素的抗性或用于在特定培养基中生长(例如用于生成必需氨基酸)的基因的插入。还可以通过使用转座子来修饰基因組,转座子是能够通过与同源重组无关的机制来在原核基因组中的位点处插入的遗传元件。转座子可以包括例如大肠杆菌中的Tn7、Tn5、或丁n10,金黄色葡萄球菌CS.awwM力中的Tn554,畐'j结核分枝杆菌(Mparam^rcw/o^)中的IS900,来自大西洋假单胞菌(尸化^fomomw必/a""c力的IS492,来自链霉菌(5^印to^yce》的ISl16及来自副结核分枝杆菌的IS900。认为牵涉转座的步骤包括切割转座子末端以产生3,OH;链转移,其中转座酶集合转座子3,OH暴露的末端和所鉴定的序列;及单步酯交换反应以产生转座子与所鉴定DNA的共价连接。一般而言,认为由转座酶所实施的关键反应是产生切口或链交换,其余的过程由宿主酶完成。200880022208.6在一个实施方案中,如下提高靶基因或蛋白质的表达或活性,即通过重组来将编码靶蛋白的遗传序列或其同系物掺入基因组中。在另一个实施方案中,将启动子插入基因组中以增强靶基因或同系物的表达。在另一个实施方案中,通过用无活性的基因重组来降低靶基因或其同系物的表达或活性。在另一个实施方案中,可以经由重组来将编码不同基因的序列插入基因组中,所述不同基因在细胞中可以具有不同的功能,或者可以是报告基因诸如抗性标志或其它方面可检测的标志基因。在又一个实施方案中,经由重组来将靶基因的至少一部分的一个拷贝插入基因组中,所述靶基因的至少一部分在一个或多各位置进行过突变。突变型靶基因可能不编码蛋白质,或者由该突变型基因编码的蛋白质可能变得无活性,活性可以进行调控(升高或降低),或者突变型蛋白质在与天然蛋白质比较时可以具有不同活性。存在有敲除细菌中的基因的策略,它们一般已经在大肠杆菌中例示。一种路径是将基因内部DNA片段克隆入含有抗生素抗性基因(例如氨苄青霉素)的载体中。在经由接合转移、化学转化或电穿孔来转化细胞前(Puehler等(1984)AdvancedMolecularGeneticsNewYork,Heidelberg,Berlin,Tokyo,SpringerVerlag),切除复制起点诸如无性繁殖质粒复制起点(oriV基因座),再连接剩余的DNA片段,并纯化(Sambrook等(2000)Molecularcloning:Alaboratorymanual,第3版ColdSpringHarbor,N.Y"ColdSpringHarborLaboratoryPress)。或者,可以使用具有DNA复制起点的抗生素抗性质粒。转化后,将细胞铺板至例如含有合适的抗生素(例如200ug/mL氨苄青霉素)的LB琼脂板上。在含有抗生素的板上生长的菌落假定经历了单一重组事件(Snyder,L.,W.Champness等(1997)MolecularGeneticsofBacteriaWashingtonDC,ASMPress),其导致整个DNA片段在同源基因座处整合入基因组中。通过例如诊断性PCR来对抗生素抗性细胞进一步分析以证实已经在想要的基因座处发生了想要的基因敲除(McPherson,M.J.,P.Quirke等(1991)PCR:APracticalApproachNewYork,OxfordUniversityPress)。这里,设计至少2种PCR引物一种在用于基因敲除构建的DNA区以外杂交;而一种在剩余的质粒主链内杂交。具有正确大小的DNA片段的成功PCR扩增继而进行DNA序列分析会证实在细菌染色体中的正确位置处已经发生了基因敲除。然后可以通过例如SDS聚丙烯酰胺凝胶电泳来分析新构建的突变抹的表型(Simpson,R.J.(2003)ProteinsandProteomics-ALaboratoryManual.ColdSpringHarbor,N.Y"ColdSpringHarborLaboratoryPress)。产生基因敲除的一种备选路径是通过使用温度敏感性复制子,诸如pSC101复制子来促进基因替换(Hamilton等(1989)JournalofBacteriology171(9):4617-22)。该方法通过染色体上的基因与DNA复制对温度敏感的质粒上携带的同源序列之间的同源重组来进行。将质粒转化入合适的宿主中后,有可能在44'C选择质粒进入染色体中的整合。这些共整合物在3(TC的随后生长导致第二次重组事件,导致它们的拆分。取决于第二次重组事件发生的位置,染色体会经历基因替换或保留基因的初始拷贝。已经开发了其它策略来抑制特定基因产物的表达。例如,已经广泛地开发RNA干扰(RNAi)(特别是使用小干扰RNA(siRNA)的)来降低或者甚至消除特定基因产物的表达。siRNA是短的、双链RNA分子,其可以靶向互补mRNA以进行降解。RNAi是如下现象,其中双链RNA的导入抑制同源基因的表达。dsRNA分子在体内被减小至21-23ntsiRNA,其是RNAi效应的介导物。导入后,双链RNA被称作Dicer的RNA酶III样酶加工成20-25个核苷酸的siRNA(起始步骤)。然后,siRNA装配成称为RNA诱导的沉默复合物(RISC)的含有内切核糖核酸酶的复合物,其在该方法中解旋。随后,siRNA链引导RISC至互补的RNA分子,在那里它们切割并破坏关联RNA(效应器步骤)。对关联RNA的切割在由siRNA链结合的区域的中部附近发生。已经成功使用RNAi来降低多种生物体中的基因表达,包括斑马鱼、线虫(秀丽隐杆线虫(C.e/ega似))、昆虫(黑腹果虫黾(DraTO//w7awe/awogaWer))、、;呙虫(planaria)、刺月包动物(cnidaria)、4,虫(trypanosome)、小鼠和哺乳动物纟田月包。还可以通过突变编码靶基因的可读框中的一个或多个核苷酸来修饰基因组。用于遗传突变的技术(例如定点诱变)是本领域中公知的。一些办法聚焦于在染色体DNA中产生随机突变,诸如那些由X射线和化学品诱导的。共表达在一个实施方案中,可以通过包括一种或多种编码靶基因的载体来修饰宿主细胞中的一种或多种靶基因以促进靶基因与异源蛋白质或肽的共表达。在另一个实施方案中,通过为靶基因增强启动子,包括通过向宿主细胞基因组添加外源启动子来#"饰宿主细胞。在另一个实施方案中,通过包括一种或多种编码靶基因抑制剂(诸如蛋白酶抑制剂)的载体来修饰宿主细胞中的一种或多种靶基因以抑制靶蛋白酶的活性。此类抑制剂可以是限制耙基因表达的反义分子、耙基因的辅因子或靶基因的同系物。一般而言,反义用于指具有与靶基因的至少一部分互补的序列的核酸分子。另外,抑制剂可以是干扰RNA或编码干扰RNA的基因。在真核生物体中,此类干扰RNA可以是小干扰RNA或核酶,如记载于例如Fire,A.等(1998)Nature391:806-11,Elbashir等(2001)Genes&Development15(2):188-200,Elbashir等(2001)Nature411(6836):494-8,CarnegieInstitute的美国专利号6,506,559,Benitec的6,573,099,WhiteheadInst.的美国专利申请号2003/0108923,和2003/0114409,PCT开文本号WO03/006477,WO03/012052,WO03/023015,WO03/056022,WO03/064621和WO03/070966的。抑制剂还可以是另一种蛋白质或肽。抑制剂可以是例如具有靶蛋白质共有序列的肽。抑制剂还可以是能在宿主中生成靶蛋白质的直接或间接抑制分子的蛋白质或肽。例如,蛋白酶抑制剂可以包括阿吗他定(Amastatin)、E-64、抗痛素(Antipain)、弹性蛋白酶抑制剂(Elastatinal)、APMSF、亮抑酶肽(Le叩eptin)、笨丁抑制素(Bestatin)、胃蛋白酶抑制剂(Pepstatin)、苄脒(Benzamidine)、1,10-菲咯啉(Phe廳throline)、糜凝乳蛋白酶抑制剂(Chymostatin)、磷酸阿米酮(Phosphoramidon)、3,4-二氯异香豆素(dichloroisocoumarin)、TLCK、DFP、TPCK。迄今为止已经鉴定出超过IOO种天然存在的蛋白质蛋白酶抑制剂。它们已经在从细菌至动物和植物的多种生物体中分离。它们表现为蛋白酶的紧密结合的、可逆的或假不可逆的抑制剂,经由位阻来阻止底物接近活性位点。它们的大小也是极端易变的,从50个残基(例如BPTI:牛胰腺胰蛋白酶抑制剂)至多达400个残基(例如a-lPI:a-l蛋白酶抑制剂)。除经由分子阱机制结合和抑制大多数蛋白酶的a-巨球蛋白家族的蛋白质(例如ot-2巨球蛋白)外,它们是严格类别特异性的。可以将外源载体或DNA构建体转染或转化入宿主细胞中。用于用外源核酸分别转染和转化真核细胞和原核细胞的技术是本领域中公知的。这些可以包括脂嚢泡介导的摄取、磷酸钙介导的转染(磷酸钙/DNA共沉淀)、病毒感染(特别是使用经修饰的病毒诸如例如经修饰的腺病毒的)、显微注射和电穿孔。对于原核转化,技术可以包括热休克介导的摄取、与完整细胞的细菌原生质体融合、显微注射和电穿孔。用于植物转化的技术包括土壤杆菌(Agrobacterium)介导的转移(诸如通过根瘤土i裏杆菌(A^me/ac^ra)实现的)、被快速推进的鴒或金微粒、电穿孔、显微注射和聚乙二醇介导的摄取。DNA可以是单链的或双链的、线性的或环状的、;松弛的或超螺旋的DNA。对于用于转染哺乳动物细胞的多种技术,参见例如Keown等(1990)ProcessesinEnzymology第185巻,第527页-第537页。可以构建编码靶基因或其增强剂或抑制剂的表达构建体,如下文关于包含感兴趣的异源蛋白质或多肽的表达构建体所描述的。例如,构建体可以含有一个或超过一个内部核糖体进入位点(IRES)。构建体还可以含有与如下核酸序列可操作连接的启动子,所述核酸序列编码靶基因的至少一部分、或靶基因的辅因子、靶基因的至少一部分的突变型式、或(在一些实施方案中)耙基因的抑制剂。或者,构建体可以是无启动子的。在构建体不被设计成掺入细胞DNA/基因组中的情况中,载体通常含有至少一种启动子元件。在核酸序列外,表达载体还可以含有选择标志序列。表达构建体可以进一步含有转录起始、终止的位点和/或核糖体结合位点。可以将经鉴定的构建体插入任何原核或真核细胞中,并可以在其中进行表达,包括但不限于细菌细胞(诸如荧光假单胞菌或大肠杆菌)、酵母细胞、哺乳动物细胞(诸如CHO细胞)、或植物细胞。可以依照本领域中已知的方法来制备构建体。可以装配多种片段,导入合适的载体中,克隆,分析,然后进一步操作,直至已经实现了想要的构建体。可以对序列进行多种修饰,以便容许限制性分析、切割、探针鉴定等。根据需要,可以导入沉默突变。在各个阶段,可以采用限制性分析、测序、用聚合酶链式反应进行的扩增、引物修复、体外诱变等。用于掺入抗生素抗性基因和负选择因子的方法对本领域普通技术人员会是熟悉的(参见例如WO99/15650;美国专利号6,080,576;美国专利号6,136,566;Niwa等,J.Biochem.113:343-349(1993);及Yoshida等,TransgenicResearch,4:277-287(1995))。可以使用细菌载体来制备构建体,包括原核复制系统,例如可被原核细胞诸如焚光假单胞菌或大肠杆菌识别的起点。可以采用与要用于插入的标志物相同或不同的标志物,其可以在导入宿主细胞中前除去。一旦完成了含有该构建体的载体,便可以对它进一步操作,诸如通过某些序列的删除、线性化、或者通过将突变、删除或其它序列导入同源序列中来进行。在一个实施方案中,靶基因构建体和异源蛋白质构建体是同一表达载体的部分,并且可以是或者不是在同一启动子元件的控制下的。在另一个实施方案中,它们在分开的表达载体上。最终的操作后,可以将构建体导入细胞中。细胞生长条件本文中所描述的宿主细胞的细胞生长条件包括促进感兴趣的蛋白质在阵列中的至少一种菌林(或其至少一定比例的细胞)中的表达的、和/或促进所表达的感兴趣蛋白质的发酵的。如本文中所使用的,术语"发酵"包括采用字面上的发酵的实施方案和釆用其它非发酵培养模式的实施方案两者。可以以任何规模实施阵列中的宿主细胞群体的生长、维持、和/或发酵。然而,若同时筛选多个宿主细胞群体,则所述规模会由不同群体的数目和培养和测试多个宿主细胞群体的能力所限制。在一个实施方案中,发酵培养基可以自丰富培养基、基本培养基、和矿物盐培养基中选择。在另一个实施方案中,选择基本培养基或矿物盐培养基。在又一个实施方案中,选4奪基本培养基。在又一个实施方案中,选择矿物盐培养基。矿物盐培养基由矿物盐和碳源(诸如例如葡萄糖、哀糖、或甘油)组成。矿物盐培养基的例子包括例如M9培养基、假单胞菌培养基(ATCC179)、Davis和Mingioli培养基(参见BDDavis和ESMingioli(1950)J.Bact.60:17-28)。用于构成矿物盐培养基的矿物盐包括那些自例如磷酸钾、硫酸铵或氯化铵、硫酸镁或氯化镁、和痕量矿物(诸如氯化4丐,硼酸盐,及铁、铜、锰和锌的硫酸盐)之中选择的。矿物盐培养基中不包括有机氮源,诸如蛋白胨、胰蛋白胨、氨基酸、或酵母提取物。使用无机氮源代替,并且这可以自例如铵盐、氨水、和氨气中选择。一种优选的矿物盐培养基会含有作为碳源的葡萄糖。与矿物盐培养基相比,基本培养基也可以含有矿物盐和碳源,但是可以补充有例如低水平的氨基酸、维生素、蛋白胨、或其它成分,虽然这些以极低水平添力口。在一个实施方案中,可以使用下文表4中所列出的成分来制备培养基。可以以如下顺序添加各成分首先可将(NH4)HP04、KH2P04和柠檬酸溶解于约30L蒸馏水中;然后可添加痕量元素的溶液,接着添加消泡剂,诸如UcolubN115。然后,热灭菌(诸如于约121。C)后,可以添加葡萄糖、MgS04和盐酸硫胺素的无菌溶液。可以使用氨水来将pH控制在约6.8。然后可添加无菌蒸馏水来将起始体积调至371减去甘油原液(123mL)。化学品可以购自多个供应商,诸如Merck。表4:培养基组成成分起始浓度KH2P04(NH4)2HP044.ogr1柠檬酸i.7grMgS04-7H20i.2gr1痕量金属溶液10mlr1盐酸;克胺素4.5mg1"葡萄糖-H2027.3gr1消泡剂UcolubN1150.1mlr1补料溶液MgS04-7H20i9.7gr1葡萄糖-H20770gr1NH323g痕量金属溶液6g1"柠檬酸铁(III)1.5gr1MnCl2-4H200.8gI-1ZmCH2COOI2-2H200.3gr1H3B030.25gl扁1Na2Mo04-2H200.25g厂1CoCl26H200.15gl—1CuCl22H200.84gl—1乙4掌二次氮基四乙酸Na2盐2H20(TritriplexIII,Merck)在本发明中,在容许宿主细胞生存的温度范围内,优选于约4。C-约55。C的范围内(包括端点)的温度实施经转化宿主细胞的生长、培养和/或发酵。如此,例如如本文中关于本发明宿主细胞所使用的,术语"生长"、"培养"和"发酵"内在地指约4。C-约55。C的温度范围内(包括端点)的"生长"、"培养"和"发酵"。另外,"生长"用于指明活跃的细胞分裂和/或扩大的生物学状态以及非分裂和/或非扩大的细胞在新陈代谢方面得到维持的生物学状态两者,术语"生长"的后一种应用与术语"维持"同义。维持。可以根据选定宿主细胞的已知生长要求,容易地选择此类正常生长温度。优选地,培养物建立期间,及特别是筛选过程期间,在用感兴趣的异源蛋白质或多肽转化之前和之后,将细胞培养物在适合于选定细胞生长的受控C(VN2湿度中温育。控制温育的湿度以使来自培养器皿的蒸发最小化,并容许较小体积的使用。作为控制湿度的替代/在控制湿度之外,可以用盖子覆盖器皿,以便使蒸发最小化。温育温度的选择主要取决于所利用宿主细胞的身份。控制蒸发的百分比湿度的选择基于选定的器皿体积和器皿中细胞培养物的浓度和体积,以及温育温度。如此,湿度可以自约10%变化至约80%。应当理解,合适条件的选择完全在本领域的技术范围内。筛选可以对本文中所描述的菌抹阵列筛选其中要表达感兴趣的异源蛋白质的最佳宿主细胞群体。可以根据所表达的感兴趣蛋白质的数量、质量、和/或位置来鉴定或选择最佳的宿主细胞群体。在一个实施方案中,最佳的宿主细胞群体是如下的,其与阵列中表型独特的宿主细胞的其它群体相比导致宿主细胞内感兴趣蛋白质或多肽的产量升高。或者,升高的生成可以是每克所生成蛋白质或每克宿主蛋白质中正确加工的蛋白质或多肽的水平升高。升高的生成还可以是每克异源蛋白质或每克宿主细胞蛋白质中所产生的可回收蛋白质或多肽的水平升高。升高的生成还可以是下列各项的任意组合总蛋白质的水平升高、正确加工或正确折叠的蛋白质的水平升高、或者有活性的或可溶性的蛋白质的水平升高。在此实施方案中,术语"升高的"或"改善的"是相对于在阵列中一个或多个其它宿主细胞群体中表达感兴趣蛋白质或多肽时生成的、正确加工的、可溶性的、和/或可回收的蛋白质或多肽的水平而言的。升高的生成可以通过例如降低能量消耗、提高可用资源的使用、或降低对生长培养基中生长补充物的要求而优化细胞或生物体的效率。升高的生成还可以是对所表达蛋白质的蛋白水解降解降低的结果。在一个实施方案中,阵列中的至少一种菌抹生成至少0.1mg/ml正确加工的蛋白质。正确加工的蛋白质具有天然蛋白质的氨基端。在另一个实施方案中,至少一种菌抹在细胞中生成0.1-10mg/ml正确加工的蛋白质,包括至少约0.2、约0.3、约0.4、约0.5、约0.6、约0.7、约0.8、约0.9或至少约1.0mg/ml正确加工的蛋白质。在另一个实施方案中,由阵列中的至少一种菌抹所生成的总的正确加工的感兴趣蛋白质或多肽是至少1.0mg/ml、至少约2mg/ml、至少约3mg/ml、约4mg/ml、约5mg/ml、约6mg/ml、约7mg/ml、约8mg/ml、约1Omg/ml、约15mg/ml、约20mg/ml、约25mg/ml、约30mg/ml、约35mg/ml、约40mg/ml、约45mg/ml、至少约50mg/ml、或更大。在一些实施方案中,所生成的正确加工的蛋白质的量是正确加工形式的总的异源蛋白质的至少约5%、约10%、约15%、约20%、约25%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%、约96%、约97%、约98%、至少约99%、或更多。感兴趣蛋白质或多肽的改善的表达还可以指蛋白质的溶解度升高。可以生成感兴趣的蛋白质或多肽,并自宿主细胞的胞质、周质或胞外培养液回收。蛋白质或多肽可以是可溶性的或不溶性的。蛋白质或多肽可以包括一种或多种靶向(例如信号或前导)序列或帮助纯化的序列,如上文所讨论的。如本文中所使用的,术语"可溶性的"指在生理学条件下的緩冲液中旋转10-30分钟时不被约5,000和20,000x重力之间的离心沉淀的蛋白质。可溶性蛋白质不是包含体或其它沉淀块的一部分。类似地,"不溶性的"指在生理学条件下的緩冲液中旋转10-30分钟时能被5,000和20,000x重力之间的离心沉淀的蛋白质或多肽。不溶性蛋白质或多肽可以是包含体或其它沉淀块的一部分。术语"包含体"意图包括细胞内含有的任何胞内体,其中已经隔离蛋白质或多肽的聚集体。在另一个实施方案中,最佳的宿主细胞群体生成增加量的感兴趣蛋白质,其被转运至宿主细胞的周质或者被分泌入胞外间隙中。在一个实施方案中,阵列中的至少一种菌抹在周质区室中生成至少0.1mg/ml蛋白质。在另一个实施方案中,至少一种菌抹在细胞中生成0.1-10mg/ml周质蛋白质,或至少约0.2、约0.3、约0.4、约0.5、约0.6、约0.7、约0.8、约0.9或至少约1.0mg/ml周质蛋白质。在一个实施方案中,由阵列中的至少一种菌株所生成的总的感兴趣蛋白质或多肽是至少1.0mg/ml、至少约2mg/ml、至少约3mg/ml、约4mg/ml、约5mg/ml、约6mg/ml、约7mg/ml、约8mg/ml、约10mg/ml、约15mg/ml、约20mg/ml、至少约25mg/ml、或更大。在一些实施方案中,所生成的周质蛋白质的量是所生成的总的感兴趣蛋白质或多肽的至少约5%、约10%、约15%、约20%、约25%、约30%、约40%、约50%、约60%、约70%、约80%、约90%、约95%、约96%、约97%、约98%、约99%、或更多。本发明阵列中的至少一种菌株还可以导致感兴趣蛋白质或多肽的产率升高。在一个实施方案中,至少一种菌抹生成占总的细胞蛋白质(tcp)至少约5%、至少约10%、约15%、约20%、约25%、约30%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、或更大的感兴趣蛋白质或多肽。"百分比总的细胞蛋白质"是宿主细胞中蛋白质或多肽的量占聚集细胞蛋白质的百分比。用于测定百分比总的细胞蛋白质的方法在本领域中是公知的。在一个具体的实施方案中,在矿物盐培养基中培养(即于约4。C-约55。C的温度范围内,包括约10。C、约15。C、约20。C、约25。C、约30。C、约35。C、约40。C、约45。C、和约50。C)时,阵列中的至少一个宿主细胞群体可以具有至少1%tcp的异源蛋白质生成水平和至少40mg/ml的细胞密度。在一个特别优选的实施方案中,在矿物盐培养基中培养(即于约4。C-约55。C的温度范围内,包括端点)时,表达系统会具有至少5。/。tcp的蛋白质或多肽表达水平和至少40g/L的细胞密度。实践中,通常在培养基中找到靶向至周质的异源蛋白质(参见欧洲专利号EP0288451),这可能是由于对细胞外膜的破坏或细胞外膜流动性的增加。这种"被动"分泌的速率可以通过使用透化细胞外膜的多种机制来提高,包括大肠杆菌素(Miksch等(1997)Arch.Microbiol.167:143-150);生长速率(Shokri等(2002)AppMiocrobiolBiotechnol58:386-392);TolIII过表达(Wan和Baneyx(1998)ProteinExpressionPurif.14:13-22);纟田菌素释放蛋白(Hsiung等(1989)Bio/Technology7:267-71);大肠杆菌素A溶解蛋白(Lloubes等(1993)Biochimie75:451-8)突变体,其泄露周质蛋白质(Furlong和Sundstrom(1989)DevelopmentsinIndus.Microbio.30:141-8);禹虫合酉己4禺(Jeong禾口Lee(2002)Appl.Environ.Microbio.68:4979-4985);或通过渗压震扰进行的回收(Taguchi等(1990)BiochimicaBiophysicaActa1049:278-85)。工程化蛋白质向周质间隙的转运(随后定位于培养基中)已经用于在大肠杆菌中生成正确折叠的且有活性的蛋白质(Wan和Baneyx(1998)ProteinExpressionPurif.14:13-22;Simmons等(2002)J.Immun.Meth.263:133-147;Lundell等(1990)J.Indust.Microbio.5:215-27)。该方法还可以包括自周质或自胞外培养液纯化感兴趣蛋白质或多肽的步骤。异源蛋白质或多肽可以以如下方式表达,其中它被连接至标签蛋白,而且可以自细胞或胞外培养液纯化"带有标签的"蛋白质。在一些实施方案中,感兴趣蛋白质或多肽也可以由阵列中的至少一种菌抹以活性形式生成。术语"有活性的,,指生物学活性的存在,其中所述生物学活性与相应的天然蛋白质或多肽的生物学活性相当或基本上对应。在蛋白质的背景中,这通常意味着多核苷酸或多肽包含在使用标准参数衡量时与相应的天然蛋白质或多肽相比具有至少约20%、约50%、优选至少约60-80%、最优选至少约90-95%活性的生物学功能或效应。然而,在一些实施方案中,可能希望生成具有与天然蛋白质相比改变的或改善的活性的多肽(例如具有改变的或改善的免疫反应性、底物特异性等的)。改变的或改善的多肽可以源自由阵列的一个或多个宿主细胞群体所产生的特定构象。可以利用特定蛋白质或多肽相应的标准靶向比较生物学测定法来实施蛋白质或多肽活性测定,所述测定法可以用于评估生物学活性。与本发明阵列中的一种或多种其它菌林相比,最佳的宿主菌抹中还可改善有活性的感兴趣蛋白质或多肽的回收。活性蛋白质可具有衍生该序列的天然蛋白质或多肽的比活的至少约20。/。、至少约30%、至少约40%、约50%、约60%、至少约70%、约80%、约90%、或至少约95%的比活。此外,任选地,底物特异性(k^/Km)基本上类似于天然蛋白质或多肽。通常,k^/Km会是至少约30%、约40%、约50%、约60%、约70%、约80%、至少约90%、至少约95%、或更大。测定和量化蛋白质和多肽活性和底物特异性(k^/Km)的度量的方法对于本领域技术人员是公知的。蛋白质活性的测量异源表达的感兴趣蛋白质或多肽的活性可以与先前建立的天然蛋白质或多肽标准活性进行比较。或者,感兴趣蛋白质或多肽的活性可以在同时的、或基本上同时的比较测定法中与天然蛋白质或多肽一起测定。例如,可以使用体外测定法来测定感兴趣蛋白质或多肽与靶物之间(例如所表达的酶与底物之间,所表达的激素与激素受体之间,所表达的抗体与抗原之间等)的任何可检测的相互作用。此检测可包括量热变化、增殖变化、细胞死亡、细胞排斥、放射性变化、溶解度变化、通过凝胶电泳和/或凝胶排阻方法所测量的分子量变化、磷酸化能力、抗体特异性测定法(诸如ELISA测定法)等的测量。另外,体内测定法包括但不限于用于检测与天然蛋白质或多肽的生理学效应相比异源表达的蛋白质或多肽的生理学效应(例如重量增加、电解质平衡的变化、血液凝固时间的变化、凝块溶解的变化和抗原应答的诱导)的测定法。一般而言,可以使用任何体外或体内测定法来测定容许与天然蛋白质或多肽进行比较分析的感兴趣蛋白质或多肽的活性本质,只要此类活性是可测定的。或者,可以对本发明阵列的至少一种菌抹中所生成的蛋白质或多肽测定刺激或抑制蛋白质或多肽和通常与所述蛋白质或多肽相互作用的分子(例如信号途径中通常与天然蛋白质相互作用的成分或底物)之间的相互作用的能力。此类测定法通常可以包括如下步骤,即在容许感兴趣蛋白质或多肽与靶分子相互作用的条件下组合蛋白质与底物分子,并检测蛋白质与靶分子相互作用的生化后果。可用于测定蛋白质或多肽活性的测定法记载于例如Ralph,P.J.等(1984)J.Immunol.132:1858或Saiki等(1981)J.Immunol.127:1044;Steward,W.E.II(1980)TheInterferonSystems.Springer-Verlag,Vienna和NewYork;Broxmeyer,H.E.等(1982)Blood60:595;MolecularCloning:ALaboratoryManua",第2版:ColdSpringHarborLaboratoryPress,Sambrook,J.,E.RFritsch和T.Maniatis编,1989;及MethodsinEnzymology:GuidetoMolecularCloningTechniques,AcademicPress,Berger,S.L.和A.R.Kimmel编,1987;AKPatra等,ProteinExprPurif,18(2):p/182-92(2000);Kodama等,J.Biochem.99:1465-1472(1986);Stewart等,Proc.Nat,lAcad.Sci.USA90:5209-5213(1993);Lombillo等,丄CellBiol.128:107-115(1995);Vale等,Cell42:39-50(1985)。活性可以在自阵列中的一个或多个其它宿主细胞群体衍生的异源表达的蛋白质的样品之间比较,和/或可以与天然蛋白质的活性比较。可以对分离的蛋白质实施活性测量,或者可以在宿主细胞中在体外实施活性测量。在另一个实施方案中,可以通过在例如常规的显微镜、光度计、或读板仪上的荧光或分光术测量来在培养物中直接监测蛋白质生成和/或活性。若感兴趣的蛋白质是其底物已知的酶,则将该底物添加至培养基,其中在底物被酶转化成产物时发出焚光信号。在一个实施方案中,编码感兴趣异源蛋白质或多肽的表达构建体进一步编码报告蛋白。通过"报告蛋白"指如下蛋白质,即通过其在细胞中或在细胞上的存在或在培养液中分泌时容许区分该细胞与不含报告蛋白的细胞。感兴趣异源蛋白质的生成导致宿主细胞群体可检测的变化。报告分子可以是萤火虫萤光素酶和GFP或任何其它焚光分子,以及(3-半乳糖苷酶基因((3.gal)及氯霉素和乙酰转移酶基因(CAT)。用于连同这些报告基因元件之每一种所产生的表达的测定法是本领域技术人员公知的。报告基因可以编码可检测的蛋白质或可间接检测的蛋白质,或者报告基因可以是存活基因。在一个优选的实施方案中,报告蛋白是可检测的蛋白质。"可检测的蛋白质"或"检测蛋白"(由可检测的基因或检测基因编码的)是能作为直接标记物使用的蛋白质;即该蛋白质在不进行进一步操作的情况中就是可检测的(且优选地,包含可检测蛋白质的细胞是可检测的)。如此,在此实施方案中,报告基因的蛋白质产物自身可以用来区分表达可检测基因的细胞。在此实施方案中,合适的可检测基因包括那些编码自发焚光蛋白的。如本领域中所知晓的,有多种已知的自发焚光蛋白;一般而言,这些是基于来自多管水母(Aequorea)的绿色荧光蛋白(GFP)及其变体;包括但不限于GFP(Chalfie等(1994)Science263(5148):802-805);增强型GFP(EGFP;Clontech-Genbank登录号U55762)、蓝色荧光蛋白(BFP;QuantumBiotechnologies,Inc.,Montreal,Canada;Stauber(1998)Biotechniques24(3):462-471;Heim和Tsien(1996)Curr.Biol.6:178-182)、增强型黄色荧光蛋白(EYFP;ClontechLaboratories,Inc.,PaloAlto,CA)和红色荧光蛋白。另外,最近有来自海肾(Renilla)和海笔(Ptilosarcus)物种的自发荧光蛋白的报告。参见WO92/15673;WO95/07463;WO98/14605;WO98/26277;WO99/49019;美国专利号5,292,658;美国专利号5,418,155;美国专利号5,683,888;美国专利号5,741,668;美国专利号5,777,079;美国专利号5,804,387;美国专利号5,874,304;美国专利号5,876,995;及美国专利号5,925,558;本文通过提及而明确收录其全部内容。感兴趣蛋白质或多肽的分离为了测量感兴趣蛋白质的产量、溶解度、构象、和/或活性,可能希望自阵列中的一种或多种菌林分离蛋白质。分离可以是粗略的、半粗略的、或纯净的分离,这取决于用于进行合适的测量的测定法的要求。蛋白质可以在细胞质中生成,靶向至周质,或可以分泌入培养物或发酵培养基中。为了释放靶向至周质的蛋白质,使用了牵涉如下化学品的处理,诸如氯仿(Ames等(1984)J.Bacteriol.,160:1181-1183)、盐酸胍、和TritonX陽100(Naglak和Wang(19卯)EnzymeMicrob.Technol.,12:603-611)。然而,这些化学品不是惰性的,并且可能对许多异源蛋白质产物或随后的纯化规程具有有害的影响。也有报告,对大肠杆菌细胞的甘氨酸处理(引起外膜的透化)释放周质内容物(Ariga等(1989)J.Ferm.Bioeng.,68:243-246)。异源蛋白质的周质释放的最广泛使用的方法是渗压震扰(Nosal和Heppel(1966)J.Biol.Chem.,241:3055-3062;Neu和Heppel(1965)J.Biol.Chem.,240:3685-3692)、鸡蛋清(HEW)溶菌酶/乙二胺四乙酸(EDTA)处理(Neu和Heppel(1964)J.Biol.Chem.,239:3893-3900;Witholt等(1976)Biochim.Biophys.Acta,443:534-544;Pierce等(1995)IChemeResearch.Event,2:995-997)、和HEW溶菌酶/渗压震扰组合处理(French等(1996)EnzymeandMicrob.Tech.,19:332-338)。弗氏法牵涉细胞在分级緩冲液中的重悬,接着是周质级分的回收,其中渗压震扰就在溶菌酶处理后。通常,这些规程包括渗压稳定化培养基中的起始破坏,接着是非稳定化培养基中的选择性释放。这些培养基的组成(pH、保护剂)和所使用的破坏方法(氯仿、HEW溶菌酶、EDTA、超声处理)在所报告的具体规程中有所不同。使用双极性离子型去垢剂替换EDTA的一种HEW溶菌酶/EDTA处理变化形式记载于Stabel等(1994)VeterinaryMicrobiol.,38:307-314。关于使用胞内溶胞酶系统来破坏大肠杆菌的一般性综述,参见Dabora和Cooney(1990)于AdvancesinBiochemicalEngineering/Biotechnology,巻43,A.Fiechter,编(Springer-Verlag:Berlin),页11-30。用于自细胞质作为可溶性蛋白质或折射颗粒回收感兴趣蛋白质或多肽的常规方法牵涉通过机械破坏来碎裂细菌细胞。机械破坏通常牵涉在液体悬浮液中产生局部空化、用刚性珠进行的快速搅动、超声处理、或细胞悬液的研磨(BacterialCellSurfaceTechniques,Hancock和Poxton(JohnWiley&SonsLtd,1988),章3,页55)。HEW溶菌酶以生化方式起水解细胞壁肽聚糖骨架的作用。该方法最初由Zinder和Arndt(1956)Proc.Natl.Acad.Sci.USA,42:586-590开发,他们用卵清蛋白(其含有HEW溶菌酶)处理大肠杆菌以产生后来称为原生质球的圆形细胞球。这些结构保留了一些细胞壁成分但是具有大的表面积,其中细胞质膜是暴露的。美国专利No.5,169,772披露了用于自细菌纯化肝素酶的方法,包括使用例如EDTA、溶菌酶、或有机化合物在渗压稳定化培养基(例如20%蔗糖溶液)中破坏细菌的包膜,通过将细菌暴露于低离子强度緩沖液来自被破坏细菌的周质间隙释放非肝素酶样蛋白质,和通过将经低离子强度清洗的细菌暴露于緩冲盐溶液来释放肝素酶样蛋白质。已经对广泛的表达系统使用了这些方法的许多不同改良,获得了不同程度的成功(Joseph-Liazun等(1990)Gene,86:291-295;Carter等(1992)Bio/Technology,10:163-167)。诱导重组细胞培养物生成溶菌酶的努力已经有报告。EP0,155,189披露了用于诱导重组细胞培养物生成溶菌酶的手段,通常预期所述手段会通过破坏或溶解细胞壁结构的手段来杀死此类宿主细胞。美国专利No.4,595,658披露了用于促进转运至细菌周质间隙的蛋白质外化(extemalization)的方法。这种方法容许在不需要对细胞进行溶菌酶处理、机械研磨、或渗压震扰处理的情况中选择性分离位于周质中的蛋白质。美国专利No.4,637,980披露了如下生成细菌产物,即用编码(直接地或间接地)产物的DNA分子转化温度敏感性溶原性细菌,在允许性条件下培养转化体以在胞内表达基因产物,并通过提高温度来诱导噬菌体编码的功能而使产物外化。Asami等(1997)J.Ferment,andBioeng.,83:511-516披露了通过T4噬菌体感染来同步破坏大肠杆菌细胞,而Tanji等(1998)J.Ferment,andBioeng.,85:74-78披露了T4噬菌体中所编码溶解基因的受控表达,用以温和破坏大肠杆菌细胞。细胞溶解后,基因组DNA泄露出细胞质而进入培养基中,并导致流体粘度的显著升高,这可阻止固体在离心场中的沉降。在没有剪切力(诸如那些在机械破坏过程中所施加的用以打碎DNA聚合物的)的情况中,固体穿过粘性流体的较慢沉降速率导致离心期间固体与流体的分开不足。除机械剪切力之外,还存在有降解DNA聚合物的核酸降解酶。在大肠杆菌中,内源基因endA编码内切核酸酶(成熟蛋白质的分子量为约24.5kD),其通常分泌至周质,并以内切核酸降解方式将DNA切割成寡脱氧核糖核苷酸。已经提出,endA由大肠杆菌相对较弱地表达(Wackemagel等(1995)Gene154:55-59)。若想要的话,可以通过本领域中公知的标准技术来分离并纯化使用本发明阵列中的一种或多种菌抹生成的蛋白质至基本上纯净,包括但不限于硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、镍层析、羟磷灰石层析、反相层析、凝集素层析、制备电泳、去污剂增溶、用诸如柱层析的物质进行的选择性沉淀、免疫纯化法等。例如,可以将具有已确立的分子粘附特性的蛋白质与配体可逆地融合。凭借合适的配体,可以将蛋白质选择性吸附至纯化柱,然后以相对纯净的形式从柱中释放。然后通过酶活性切出所融合的蛋白质。另外,可以使用免疫亲和柱或Ni-NTA柱来纯化蛋白质。一^:性技术进一步记载于例如R.Scopes,ProteinPurification:PrinciplesandPractice,Springer-Verlag:N.Y.(1982);Deutscher,GuidetoProteinPurification,AcademicPress(1990);美国专利No.4,511,503;S.Roe,ProteinPurificationTechniques:APracticalApproach(PracticalApproachSeries),OxfordPress(2001);D.Bollag等,ProteinMethods,Wiley-Lisa,Inc.(1996);AKPatra等,ProteinExprPurif,18(2):p/182-92(2000);及R.Mukhija等,Gene165(2):页303-6(1995)。还可参见例如Ausubel等(1987和定期补充);Deutscher(1990)"GuidetoProteinPurification",MethodsinEnzymology巻182,及此丛书中的其它巻;Coligan等(1996和定期补充)CurrentProtocolsinProteinScienceWiley/Greene,NY;及制造商关于蛋白质纯产品的文南大,例^口Pharmacia,Piscataway,N丄或Bio-Rad,Richmond,Calif。与重组技术的组合容许与合适的区段融合,例如与FLAG序列或等同物,它们可经由蛋白酶可切除的序列来融合。还可参见例如Hochuli(1989)ChemischeIndustrie12:69-70;Hochuli(1990)"PurificationofRecombinantProteinswithMetalChelateAbsorbent"于Setlow(编)GeneticEngineering,PrincipleandMethods12:87-98,PlenumPress,NY;及Crowe等(1992)QIAexpress:TheHighLevelExpression&ProteinPurificationSystemQUIAGEN,Inc.,Chatsworth,Calif。通过本领域中已知的方法来实现所表达蛋白质的检测,包括例如放射性免疫测定法、Western印迹纟支术或免疫沉淀。由本发明阵列中的菌抹所表达的某些蛋白质可以形成不溶性聚集体("包含体")。数种方案适于自包含体纯化蛋白质。例如,包含体的纯化通常牵涉通过破坏宿主细胞(例如通过在50mMTRIS/HCLpH7.5、50mMNaCl、5mMMgCl2、lmMDTT、O.lmMATP、和lmMPMSF的緩冲液中温育)对包含体的提取、分离和/或纯化。通常通过2-3次通过French压碎器来裂解细胞悬浮液。细胞悬浮液也可以使用Polytron(BrinkmanInstruments)进行匀浆或在冰上进行超声处理。裂解细菌的备选方法对于本领域技术人员是显而易见的(参见例如Sambrook等,见上文;Ausubel等,见上文)。在必要时,可以溶解包含体,并且通常可以对裂解的细胞悬浮液离心,以便除去不想要的不溶性物质。可以通过用相容的緩冲液进行的稀释或透析来使形成包含体的蛋白质复性。合适的溶剂包括但不限于尿素(约4M-约8M)、曱酰胺(至少约80%,体积/体积计)、和盐酸胍(约4M-约8M)。虽然盐酸胍和类似的试剂是变性剂,但是这种变性不是不可逆的,并且复性可以在除去(例如通过透析)或稀释变性剂后发生,这容许免疫学和/或生物学活性蛋白质的重新形成。其它合适的緩冲液对于本领域技术人员是已知的。通过本领域技术人员公知的标准分离技术能将上清液中存在的异源表达的蛋白质与宿主蛋白质分开。例如,起始的盐分级可将许多不想要的宿主细胞蛋白质(或自细胞培养基衍生的蛋白质)与感兴趣蛋白质或多肽分开。一个这样的例子可以是硫酸铵。硫酸铵通过有效地降低蛋白质混合物中的水量而使蛋白质沉淀。然后蛋白质根据它们的溶解度而沉淀。蛋白质越疏水,其越有可能在较低的硫酸铵浓度沉淀。一个典型方案包括将饱和硫酸铵添加至蛋白质溶液,使得所得硫酸铵浓度在20-30%之间。此浓度会沉淀大多数疏水性蛋白质。然后弃去沉淀物(除非感兴趣蛋白质是疏水的),并将硫酸铵添加至上清液至已知使感兴趣蛋白质沉淀的浓度。然后将沉淀物溶解于緩沖液中,并在必要时除去过量的盐,其经由透析或渗滤实现。依赖于蛋白质溶解度的其它方法(诸如冷乙醇沉淀)对于本领域技术人员是公知的,并可用于对复杂的蛋白质混合物进行分级。可以利用感兴趣蛋白质或多肽的分子量来将其与较大和较小尺寸的蛋白质分离,其使用穿过不同孔径的膜(例如Amicon或Millipore膜)的超滤来实现。作为第一步,蛋白质混合物可以穿过孔径的分子量截留比感兴趣蛋白质的分子量低的膜而进行超滤。然后超滤的保留物可以针对分子截留比感兴趣蛋白质的分子量大的膜进行超滤。感兴趣蛋白质或多肽会穿过膜而进入滤液中。然后可以对滤液进行层析,如下文所述的。所表达的感兴趣蛋白质或多肽也可以根据其大小、表面净电荷、疏水性、和对配体的亲和力而与其它蛋白质分开。另外,可以将针对蛋白质所产生的抗体偶联至柱基质,并对蛋白质免疫纯化。所有的这些方法在本领域中是公知的。对于技术人员会显而易见的是,可以以任何规模和使用来自许多不同制造商(例如PharmaciaBiotech)的仪器实施层析技术。复性和重折叠若异源表达的蛋白质以变性形式生成,则不溶性蛋白质可以复性或重折叠以产生二级和三级蛋白质结构构象。必要时,可以在完成异源产物的构造中使用蛋白质重折叠步骤。可以使用本领域中已知的用于促进蛋白质解离/结合的试剂来实现重折叠和复性。例如,可将蛋白质与二硫苏糖醇一起温育,接着与氧化型谷胱甘肽二钠盐一起温育,接着与含有重折叠试剂(诸如尿素)的緩沖液一起温育。也可以例如通过使其针对磷酸盐緩沖盐水(PBS)或50mM醋酸钠,pH6緩沖液加200mMNaCl透析来4吏感兴趣蛋白质或多肽复性。或者,可以在固定化于柱(诸如NiNTA柱)上时,通过使用500mMNaCl、20%甘油、20mMTris/HClpH7.4(含有蛋白酶抑制剂)中的6M-1M尿素线性梯度来使蛋白质重折叠。可以在1.5小时或更长的一段时间里实施复性。复性后,可以通过添加250mM咪哇来洗脱蛋白质。可以通过针对PBS或50mM醋酸钠pH6緩冲液加200mMNaCl的最终透析步骤来除去咪唑。纯化的蛋白质可以于4。C贮存或于-80。C冷冻。其它方法包括例如那些可记载于MHLee等,ProteinExpr.Purif.,25(1):页166-73(2002);W.K.Cho等,J.Biotechnology,77(2-3):页169-78(2000);Ausubel等(1987和定期补充);Deutscher(1990)"GuidetoProteinPurification,"MethodsinEnzymology巻182,及此丛书中的其它巻;Coligan等(1996和定期补充)CurrentProtocolsinProteinScienceWiley/Greene,NY;S.Roe,ProteinPurificationTechniques:APracticalApproach(PracticalApproachSeries),OxfordPress(2001);D.Bollag等,ProteinMethods,Wiley-Lisa,Inc.(1996)。表达载体可以通过向每种菌林中导入编码感兴趣异源蛋白质的表达载体来在一种或多种本文中所公开的宿主细胞中生成感兴趣异源蛋白质。在一个实施方案中,载体包含与能够在选定的宿主细胞中运行的启动子以及所有其它所需要的转录和翻译调控元件可搡作连接的编码感兴趣蛋白质的多核苷酸序列。术语"可操作连接的"指任何如下的构造,其中转录和任何翻译调控元件以相对于编码序列的这样一种或多种布置共价附着于编码序列以使得在宿主细胞中和通过宿主细胞的作用,调控元件可指导编码序列的表达。可以自如下多核苦酸表达感兴趣异源蛋白质,在所述多核芬酸中异源多肽编码序列可操作连接至转录和翻译调控元件以形成功能基因,宿主细胞能44自该功能基因表达蛋白质或多肽。编码序列可以是异源多肽的天然编码序列,或者可以是已经为了在选定的表达宿主细胞中的应用进行选择、改善、或优化的编码序列例如,通过合成基因来反映宿主物种的密码子使用偏爱。在本发明的一个实施方案中,宿主物种是荧光假单胞菌,并在设计多肽编码序列时考虑荧光假单胞菌的密码子偏爱。在一种或多种载体内构建一种或多种基因或者将一种或多种基因插入一种或多种载体中,然后可将所述载体转化入表达宿主细胞中。其它调控元件可包括在载体(也称为"表达构建体")中。载体通常会包含一种或多种表型选择标志和复制起点以确保载体的维持,并在想要时提供宿主内的扩增。别的元件包括但不限于例如转录增强子序列、翻译增强子序列、其它启动子、激活子、翻译起始和终止信号、转录终止子、顺反子调节物、多顺反子调节物、或标签序列(诸如核苷酸序列"标签"和"标签"多肽编码序列),其促进所表达的多肽的鉴定、分开、纯化、和/或分离。在另一个实施方案中,表达载体进一步包含与感兴趣蛋白质或多肽的编码序列邻近的标签序列。在一个实施方案中,此标签序列容许纯化蛋白质。标签序列可以是亲和标签,诸如六组氨酸亲和标签。在另一个实施方案中,亲和标签可以是谷胱甘肽-S-转移酶分子。标签还可以是荧光分子,诸如YFP或GFP,或此类荧光蛋白的类似物。标签还可以是对纯化有用的已知结合配偶的配体或已知抗原、或抗体分子的一部分。在蛋白质编码序列之外,依照本发明的蛋白质编码基因还可包括与其可操作连接的下列调控元件启动子、核糖体结合位点(RBS)、转录终止子、翻译起始和终止信号。有用的RBS可自在依照本发明的表达系统中可用作宿主细胞的任何物种获得,优选自选定的宿主细胞获得。许多特有的和多种共有的RBS是已知的,例如那些记载于D.Frishman等,Gene234(2):257-65(1999年7月8日);及B.E.Suzek等,Bioinfo腿tics17(12):1123-30(2001年12月)的和由它们提及的。另外,可使用天然的或合成的RBS,例如那些记载于EP0207459(合成的RBS);0.Ikehata等,Eur.J.Biochem.181(3):563-70(1989)的(天然RBS序列AAGGAAG)。本发明中有用的方法、载体、及翻译和转录元件及其它元件的进一步的例子记载于例如Gilroy的美国专利No.5,055,294和Gilroy等的美国专利No.5,128,130;Rammler等的美国专利No.5,281,532;Barnes等的美国专利No.4,695,455和4,861,595;Gray等的美国专利No.4,755,465;及Wilcox的美国专利No.5,169,760。通过将增强子序列插入载体或质粒中来增加编码感兴趣异源蛋白质的DNA的转录。典型的增强子是大小通常约10-300bp的DNA顺式作用元件,其作用于启动子以增加其转录。例子包括多种假单胞菌增强子。一般而言,异源表达载体会包括复制起点和容许宿主细胞转化的选择标志和自高度表达的基因衍生以指导下游结构序列转录的启动子。此类启动子可以自编码酶(诸如3-磷酸甘油酸激酶(PGK)、酸性磷酸酶或热休克蛋白等)的操纵子衍生。若使用信号序列,则异源编码序列以合适的状态与翻译起始和终止序列和能够指导所翻译蛋白质区室积累或分泌的信号序列装配在一起。任选地,异源序列可编码包含赋予想要的特性(例如所表达异源产物的稳定化或简化的纯化)的N端鉴定多肽的融合酶。融合多肽还可以包含一种或多种靶蛋白质或其抑制剂或增强剂,如上文所讨论的。用于在宿主细胞中表达异源蛋白质的载体在本领域中是已知的,并且可使用这些中的任一种来表达依照本发明的基因。此类载体包括例如质粒、粘pBBRlMCS、pDSK519、pKT240、pML122、pPS10、RK2、RK6、pRO1600、和RSF1010。此类有用的载体的其它例子包括那些记载于例如N.Hayase,于Appl.Envir.Microbiol.60(9):3336-42(1994年9月);A.A.Lushnikov等,于BasicLifeSci.30:657-62(1985);S.Graupner和W.Wackemagel,于Biomolec.Eng.17(1):11-16.(2000年10月);H.P,Schweizer,于Curr.Opin.Biotech.12(5):439-45(2001年10月);M.Bagdasarian和K.N.Timmis,于Curr.TopicsMicrobiol.Immunol.96:47-67(1982);T.Ishii等,于FEMSMicrobiol.Lett.116(3):307-13(1994年3月1曰);I.N.Olekhnovich和Y.K.Fomichev,于Gene140(1):63-65(1994年3月11日);M.Tsuda和T.Nakazawa,于Gene136(l-2):257-62(1993年12月22日);C.Nieto等,于Gene87(1):145-49(1990年3月1日);J.D.Jones和N.Gutterson,于Gene61(3):299-306(1987);M.Bagdasarian等,于Gene16(l-3):237-47(1981年12月);H.P.Schweizer等,于Genet.Eng.(NY)23:69-81(2001);P.Mukhopadhyay等,于J.Bact.172(0:477-80(1990年1月);D.O.Wood等,于J.Bact.145(3):1448-51(1981年3月);及R.Holtwick等,于Microbiology147(Pt2):337-44(2001年2月)的。可用于本发明宿主细胞的表达载体的进一步例子包括那些列于表5中46的、自指示的复制子衍生的。表5:有用的表达载体的例子<table>tableseeoriginaldocumentpage47</column></row><table>表达质粒RSF1010记载于例如F.Heffron等,于Proc.Nat,lAcad.Sci.USA72(9):3623-27(1975年9月)及K.Nagahari和K.Sakaguchi,于J.Bact.133(3):1527-29(1978年3月)。质粒RSF1010及其衍生物是本发明中特别有用的载体。例示性的、有用的RSF1010衍生物(其在本领域中是已知的)包括例如pKT212、pKT214、pKT231及相关质粒,和pMYC1050及相关质粒(参见例如Thompson等的美国专利No.5,527,883和5,840,554),诸如例如的美国专利No.5,169,760),其携带来自RSF1010质粒的可调型四环素抗性标志及复制和转移基因座(replicationandmobilizationloci)。其它例示性的有用的载体包括那些记载于Puhler等的美国专利No.4,680,264的。在一个实施方案中,表达质粒作为表达载体使用。在另一个实施方案中,RSF1010或其衍生物作为表达载体使用。在又一个实施方案中,pMYC1050或其衍生物,或pMYC4803或其衍生物作为表达载体使用。可通过在质粒中包含选^4示志基因来在宿主细胞中维持质粒。这可以是抗生素抗性基因(其中将相应的抗生素添加至发酵培养基),或本领域中已知的任何其它类型的选择标志基因,例如原养型恢复基因,其中在相应的性状(例如生物催化性状,诸如氨基酸生物合成或核苷酸生物合成性状,或碳源利用性状)营养缺陷的宿主细胞中使用所述质粒。可调型启动子的常见例子包括那些自lac启动子(即lacZ启动子)衍生的家族的,特别是记载于DeBoer的美国专利No.4,551,433的toc和^r启动子,以及Ptacl6、Ptacl7、PtacII、PlacUY5、和T71ac启动子。在一个实施方案中,启动子不是自宿主细胞生物体衍生的。在某些实施方案中,启动子是自大肠杆菌生物体衍生的。在依照本发明的表达系统中有用的非lac型启动子的常见例子包括例如那些列于表6的。表6:非/ac启动子的例子启动子诱导物Pr古,、曰向/皿Pl兩温Pm烃基或卣代苯曱酸盐Pu烃基或卣代曱苯Psal水杨酸盐参见例^口J.Sanchez-MicrobiologyandBiotechnology(A.Demain禾口J.Davies纟扁)页460-74(ASMPress,Washington,D,C.);H.Schweizer(2001)CurrentOpinioninBiotechnology,12:439-445;及R.Slater和R.Williams(2000MolecularBiologyandBiotechnology(J.Walker和R.Rapley编)页125-54(TheRoyalSocietyofChemistry,Cambridge,UK))。还可使用具有对于选定的细菌宿主细胞而言天然的启动子的核苦酸序列的启动子来控制编码靶多肽的转基因的表达,例如假单胞菌邻氨基苯曱酸盐或苯曱酸盐操纵子启动子(Pant,Pben)。还可使用串联启动子,其中一个以上的启动子共价附接至另一个启动子,无论序列是相同的还是不同的(例如Pant-Pben串联启动子(启动子间的杂合物)或P/ac-P/ac串联启动子),或者无论是自相同的还是不同的生物体衍生的。可调型启动子利用启动子调控蛋白以控制启动子是其一部分的基因的转录。若在本文中使用可调型启动子,则相应的启动子调控蛋白也会是依照本发明的表达系统的一部分。启动子调控蛋白的例子包括激活蛋白,例如大肠杆菌分解代谢物激活蛋白,MalT蛋白;AraC家族转录激活物;阻抑蛋白,例如大肠杆菌LacI蛋白;和双功能调控蛋白,例如大肠杆菌NagC蛋白。48许多可调型启动子/启动子调控蛋白对在本领域中是已知的。在一个实施方案中,靶蛋白质和感兴趣异源蛋白质的表达构建体在同一调控元件的控制下。启动子调控蛋白与效应器化合物相互作用,所述效应器化合物即如下化合物,其可逆地或不可逆地与调控蛋白相结合以使得所述蛋白质能够释放或结合启动子控制下的基因中的至少一个DNA转录调控区,由此容许或阻断转录酶在启动基因转录中的作用。效应器化合物分类为诱导物或协阻抑物,并且这些化合物包括天然效应器化合物和义务诱导物化合物。许多可调型启动子/启动子调控蛋白/效应器化合物三元组合在本领域中是已知的。虽然效应器化合物可贯穿细胞培养或发酵使用,但是在使用可调型启动子的一个优选的实施方案中,在宿主细胞生物量生长到想要的数量或密度后,将合适的效应器化合物添加至培养物以直接地或间接地导致编码所述感兴趣蛋白质或多肽的想要基因的表达。举例而言,在利用/ac家族启动子的情况中,lacl基因也可存在于系统中。lacl基因(其(通常)是组成型表达的基因)编码Zw阻抑蛋白(LacD蛋白),其结合这些启动子的/ac操纵基因。如此,在利用/ac家族启动子的情况中,lacl基因也可包括在表达系统中,并在表达系统中表达。在/ac启动子家族成员(例如tac启动子)的情况中,效应器化合物是诱导物,优选义务诱导物,诸如IPTG(异丙基-D-1-硫代吡喃半乳糖苷,也称作"异丙基硫代半乳糖苷")。对于感兴趣蛋白质或多肽的表达,也可使用任何植物启动子。启动子可以是植物RNA聚合酶II启动子。植物启动子中包括的元件可以是通常位于转录起始位点上游(5,)约25-35个碱基对的TATA框或Goldberg-Hogness框,和位于上游70和100个碱基对之间的CCAAT框。在植物中,CCAAT框可具有不同于哺乳动物启动子功能类似序列的共有序列(Messing等(l983)于GeneticEngineeringofPlants,Kosuge等编,页211-227)。另外,几乎所有启动子都包括自转录起始位点上游约-100bp至-l,000bp或更多延伸的别的上游激活序列或增强子(Benoist和Chambon(1981)Nature290:304-310;Gruss等(1981)Proc.Nat.Acad.Sci.78:943-947;及Khoury和Gruss(1983)Cell27:313-314)。表达系统可能希望将感兴趣蛋白质或多肽靶向至阵列中的一个或多个宿主细胞群体的周质,或者靶向入胞外间隙中。在一个实施方案中,表达载体进一步49包含编码分泌信号序列多肽的核苷酸序列,其可操作连接至编码感兴趣蛋白质或多肽的核苷酸序列。在一些实施方案中,在信号序列和感兴趣蛋白质或多肽之间没有进行修饰。然而,在某些实施方案中,掺入额外的切割信号以促进对多肽氨基端的正确加工。载体可以具有上文所描述的任何特征。在一个实施方案中,包含感兴趣蛋白质或多肽的编码序列的载体进一步包含信号序列,例如分泌信号序列。因此,在一个实施方案中,此分离的多肽是分泌信号与感兴趣蛋白质或多肽的融合蛋白。然而,在将蛋白质耙向至周质后,也可自蛋白质切除分泌信号。在一个实施方案中,对Sec系统分泌信号和蛋白质或多肽之间的连接进行修饰以提高对分泌信号的切割。CHAMPIONpET表达系统提供了高水平的蛋白质生产。自T71ac强启动子诱导表达。此系统利用噬菌体T7RNA聚合酶的高活性和特异性来高水平地转录感兴趣基因。位于启动子区中的lac操纵基因提供了比传统的基于T7的载体更紧密的调控,这改善了质粒稳定性和细胞生存力(Studier和Moffatt(1986)JMolecularBiology189(1):113-30;Rosenberg等(1987)Gene56(1):125-35)。T7表达系统使用T7启动子和T7RNA聚合酶(T7RNAP)来高水平地转录感兴趣基因。在T7表达系统中实现高水平表达,因为T7RNAP比天然的大肠杆菌RNAP更易前行(processive),而且致力于转录感兴趣基因。通过在宿主细胞中提供T7RNAP的来源来诱导所鉴定基因的表达。这通过使用含有T7RNAP基因染色体拷贝的BL21大肠杆菌宿主来实现。T7RNAP基因在可由IPTG诱导的lacUV5启动子的控制下。T7RNAP在诱导后进行表达,并转录感兴趣基因。pBAD表达系统经由特定碳源(诸如葡萄糖、甘油和阿拉伯糖)的存在而容许感兴趣蛋白质或多肽的紧密控制的、可滴定的表达(Guzman等(1995)JBacteriology177(14):4121-30)。独特地设计pBAD载体以对表达水平给予精确的控制。在araBAD启动子处启动来自pBAD载体的异源基因表达。启动子受到araC基因产物的正向和负向调控。AraC是与L-阿拉伯糖形成复合物的转录调节物。在没有L-阿拉伯糖的情况中,AraC二聚体阻断转录。为了最大限度的转录激活,需要两种事件(i)L-阿拉伯糖结合至AraC,这容许转录开始;和(ii)cAMP激活蛋白(CAP)-cAMP复合物结合至DNA,并刺激AraC结合至启动子区的正确位置。50加表达系统容许大肠杆菌中自加启动子的高水平、可调型表达。加表达载体已经得到了优化以在大肠杆菌中表达真核基因。^r启动子是自色氨酸(化p)和乳糖(/ac)启动子衍生的杂合强启动子。它受到lacO操纵基因和lacIQ基因产物的调控(Brosius,J.(1984)Gene27(2):161-72)。可使用本领域中已知的任何转化方法来实施本文中所公开的载体对宿主细胞的转化,而且可以作为完整细胞或作为原生质体(即包括细胞质)来转化细菌宿主细胞。例示性的转化方法包括穿孔法例如电穿孔、原生质体融合、细菌接合、和二价阳离子处理例如氯化钙处理或CaCl/Mg"处理、或本领域中其它公知方法。参见例如Morrison,J.Bact.,132:349-351(1977);Clark-Curtiss和Curtiss,MethodsinEnzymology,101:347-362(Wu等编,1983);Sambrook等,MolecularCloning,ALaboratoryManual(第2版,1989);Kriegler,GeneTransferandExpression:ALaboratoryManual(1990);及CurrentProtocolsinMolecularBiology(Ausubel等编,1994)。感兴趣蛋白质本发明的方法和组合物对于鉴定如下荧光假单胞菌菌林是有用的,所述焚光假单胞菌菌抹对于生成高水平的正确加工的感兴趣蛋白质或多肽是最佳的。阵列对于筛选任何物种的和任何大小的感兴趣蛋白质或多肽的生产是有用的。然而,在某些实施方案中,感兴趣蛋白质或多肽是在治疗方面有用的蛋白质或多肽。在一些实施方案中,蛋白质可以是哺乳动物蛋白质,例如人蛋白质,而且可以是例如生长因子、细胞因子、趋化因子或血液蛋白质。感兴趣蛋白质或多肽可以以与天然蛋白质或多肽类似的方式加工。在某些实施方案中,感兴趣蛋白质或多肽是小于100kD、小于50kD、或小于30kD大小的。在某些实施方案中,感兴趣蛋白质或多肽是具有至少约5个、10个、15个、20个、30个、40个、50个或100个或更多个氨基酸的多肽。感兴趣蛋白质或多肽的编码序列可以是多肽的天然编码序列(若可获得的话),但是会更优选的是如下编码序列,其已经经过选择、改良或优化以在阵列的菌抹中以可表达形式使用例如,通过优化基因来反映假单胞菌物种(诸如焚光假单胞菌)或其它合适的生物体的密码子使用偏爱。为了基因优化,可以除去一种或多种罕见的密码子以避免核糖体停转,并使氨基酸错参最小化。还可以消除一种或多种基因内部核糖体结合位点来避免截短的蛋51白质产物。可以除去长段的C和G核苷酸以避免RNA聚合酶滑动,其可以导致移码。还可以消除强基因内部茎-环结构,特别是覆盖核糖体结合位点的。在其它实施方案中,蛋白质在生成时还包括别的靶向序列,例如将蛋白质靶向周质或胞外培养基的序列。在一个实施方案中,所述别的靶向序列是可操作连接至蛋白质羧基末端的。在另一个实施方案中,蛋白质包括自运输物(autotransporter)、只又酉己寸禺分泌系统(twopartnersecretionsystem)、主端分4支系统(mainterminalbranchsystem)或菌毛引座孔蛋白(fimbrialusherporin)的分泌信号。在一种或多种载体中构建所得基因或者将所得基因插入一种或多种载体中,然后将该载体转化入阵列中的每一个宿主细胞群体中。要以"可表达形式"提供的核酸或多核苷酸意指含有至少一种能由一种或多种本发明宿主细胞群体表达的基因的核酸或多核苷酸。分子遗传学和遗传工程技术所要求的大量序列信息是可广泛地公开荻得的。可自GenBank于网站www.ncbi.nlm.nih.gov/Entrez获4寻哺乳动物以及人的基因、cDNA序列、氨基酸序列和基因组的完整核苷酸序列的访问(access)。别的信息也可自GeneCards(来自魏茨曼科学基因组和生物信息学研究所(WeizmannInstituteofScienceGenomeandBioinformatics)的整合关于基因及其产物和生物医学应用的信息的电子百科全书(bioinformatics.weizmann.ac.il/cards))获得,核苦酸序歹'〗信息也可自EMBL核苷酸序歹'J数据库(www.ebi.ac.uk/embl/)或日本DNA数据库(DDBJ,www.ddbi.nig.ac.ii)获得;关于氨基酸序列的信息的别的站点包括Georgetown的蛋白质信息资源网站(www-nbrf.Reorgetown.edu/pirl)和Swiss-Prot(au.expasy.org/sprot/sprot-top.html)。可以在本发明中表达的蛋白质的例子包括如下分子,诸如例如,肾素、生长激素,包括人生长激素;牛生长激素;生长激素释放因子;曱状旁腺激素;促曱状腺激素;脂蛋白;a-l-抗胰蛋白酶;胰岛素A链;胰岛素B链;胰岛素原;血小板生成素;促卵泡激素;降钙素;黄体生成素;胰高血糖素;凝血因子,诸如因子VIIIC、因子IX、组织因子、和vonWillebrands因子;抗凝血因子,诸如蛋白C;心房钠尿肽;肺表面活性剂;纤溶酶原激活物,诸如尿激酶或人尿或组织型纤溶酶原激活物(t-PA);铃蟾肽;凝血酶;造血生长因子;肺瘤坏死因子-a和-P;脑啡肽酶;血清清蛋白,诸如人血清清蛋白;缪勒抑制物质(mullerian-inhibitingsubstance);;^弛素A《连;水〉弛素B链;水〉弛素原;小鼠促性腺激素相关多肽;微生物蛋白质,诸如p-内酰胺酶;DNA酶;抑制素;活化素(activin);血管内皮生长因子(VEGF);激素的或生长因子的受体;整联蛋白;蛋白A或D;类风湿因子;神经营养因子,诸如脑衍生神经营养因子(BDNF)、神经营养蛋白-3、-4、-5、或-6(NT-3、NT-4、NT-5、或NT-6)、或神经生长因子,诸如NGF-(3;心肌营养蛋白(心脏肥大因子),诸如心肌营养蛋白-1(CT-1);血小板衍生生长因子(PDGF);成纤维细胞生长因子,诸如aFGF和bFGF;表皮生长因子(EGF);转化生长因子(TGF),诸如TGF-a和TGF-卩,包括TGF-(31、TGF隱卩2、TGF-卩3、TGF-(34、或TGF画(35;胰岛素样生长因子-I和-II(IGF-I和IGF-II);des(l-3)-IGF-I(脑IGF-I)、胰岛素样生长因子结合蛋白;CD蛋白,诸如CD-3、CD-4、CD-8、和CD-19;红细胞生成素;骨诱导因子;免疫毒素;骨形态发生蛋白(BMP);干扰素,诸如干扰素-a、-(3、和-r,集落刺激因子(CSF),例如M-CSF、GM-CSF、和G-CSF;白介素(IL),例如IL-1至IL-10;抗HER-2抗体;超氧化物歧化酶;T纟田月包受体;表面膜蛋白;衰变加速因子;病毒抗原,诸如例如AIDS包膜的一部分;转运蛋白;归巢受体;地址素;调控蛋白;抗体;及上文所列多肽中任一种的片段。在某些实施方案中,蛋白质或多肽可选自IL-1、IL-la、IL-lb、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL陽IO、IL-11、IL-12、IL-12dasti、IL-13、IL-15、IL陽16、IL-18、IL-18BPa、IL-23、IL-24、VIP、红细胞生成素、GM-CSF、G-CSF、M-CSF、血小板衍生生长因子(PDGF)、MSF、FLT-3配体、EGF、成纤维细胞生长因子(FGF;例如a-FGF(FGF-l)、卩-FGF(FGF-2)、FGF-3、FGF-4、FGF-5、FGF-6、或FGF-7)、胰岛素样生长因子(例如IGF-1、IGF-2);肿瘤坏死因子(例如TNF、淋巴毒素)、神经生长因子(例如NGF)、血管内皮生长因子(VEGF);干扰素(例如IFN-ouIFN-卩、IFN-y);白血病抑制因子(LIF);睫状节神经营养因子(CNTF);制瘤素M;干细胞因子(SCF);转化生长因子(例如TGF-a、TGF-卩1、TGF-|32、TGF-(33);TNF超家族(例如LIGHT/TNFSF14、STALL-1/TNFSF13B(BLy5、BAFF、THANK)、TNFa/TNFSF2和TWEAK/TNFSF12);或趋化因子(BCA-1/BLC-1、BRAK/Kec、CXCL16、CXCR3、ENA-78/LIX、Eotaxin-l、Eotaxin陽2/MPIF-2、Exodus-2/SLC、Fractalkine/Neurotactin、GROa/MGSA、HCC-1、I-TAC、淋53巴细胞趋化蛋白/ATAC/SCM、MCP-1/MCAF、MCP-3、MCP-4、MDC/STCP-1/ABCD-1、MIP-1.quadrature.、MIP-1.quadrature.、MIP-2.quadrature./GRO.quadrature.、MIP-3.quadrature./Exodus/LARC、MIP陽3/Exodus-3/ELC、MIP-4/PARC/DC-CK1、PF-4、RANTES、SDF1、TARC、或TECK、微生物毒素、ADP核糖基化毒素、微生物或病毒抗原)。在本发明的一个实施方案中,感兴趣蛋白质可以是多亚基蛋白质或多肽。可以表达的多亚基蛋白质包括同聚体和异聚体蛋白质。多亚基蛋白质可以包括两个或更多个亚基,它们可以是相同的或不同的。例如,蛋白质可以是包含2个、3个、4个、5个、6个、7个、8个、9个、10个、ll个、12个或更多个亚基的同聚体蛋白质。蛋白质也可以是包含2个、3个、4个、5个、6个、7个、8个、9个、10个、ll个、12个、或更多个亚基的异聚体蛋白质。例示性的多亚基蛋白质包括受体,包括离子通道受体;胞外基质蛋白质,包括软骨素;胶原;免疫调节剂,包括MHC蛋白、全链抗体、和抗体片,殳;酶,包括RNA聚合酶、和DNA聚合酶;及膜蛋白。在另一个实施方案中,感兴趣蛋白质可以是血液蛋白质。在此实施方案中所表达的血液蛋白质包括但不限于载体蛋白,诸如清蛋白(包括人的和牛的清蛋白)、运铁蛋白、重组运铁蛋白半分子、触珠蛋白、血纤蛋白原和其它凝结因子、补体成分、免疫球蛋白、酶抑制剂、物质(诸如血管紧张素和缓激肽)的前体、胰岛素、内皮缩血管肽、和球蛋白(包括a、(3、y-球蛋白),及主要在哺乳动物的血液中找到的其它类型的蛋白质、多肽及其片段。已经报告了许多血液蛋白质的氨基酸序列(参见S.S.Baldwin(1993)Comp.BiochemPhysiol.106b:203-218),包括人血清清蛋白的(Lawn,L.M.等(1981)NucleicAcidsResearch,9:6103-6114)和人血清运铁蛋白的(Yang,F.等(1984)Proc.Natl.Acad.Sci,USA81:2752-2756)氨基酸序列。在另一个实施方案中,感兴趣蛋白质可以是酶或辅因子。在此实施方案中所表达的酶和辅因子包括但不限于醛缩酶、胺氧化酶、氨基酸氧化酶、天冬氨酸酶、B12依赖性酶、羧肽酶、羧酸酯酶(carboxyesterase)、羧酸分解酶(carboxylyase)、4匕学月夷蛋白酶(chemotrypsin)、需要CoA的酶(CoArequiringenzyme)、羟腈合成酶、月先石克醚合酶(cystathionesynthase)、脱羧酶、脱氢酶、醇脱氢酶、脱水酶、心肌黄酶(diaphorase)、加双氧酶、烯酸还原酶(enoatereductase),环氧4b物7jM匕酶(epoxidehydrase)、延胡索酸酶(fumerase)、半乳糖氧化酶、葡萄糖异构酶、葡萄糖氧化酶、糖基转移酶、甲基转移酶、腈水化酶(nitrilehydrase)、核苦磷酸化酶、氧化还原酶、氧腈酶(oxynitilase)、肽酶、糖基转移酶、过氧化物酶、与治疗活性多肽融合的酶、组织纤溶酶原激活物;尿激酶、reptilase、链激酶;过氧化氢酶、超氧化物歧化酶;DNA酶、氨基酸水解酶(例如天冬酰胺酶、酰胺水解酶);羧肽酶;蛋白酶、胰蛋白酶、胃蛋白酶、胰凝乳蛋白酶、木瓜蛋白酶、菠萝蛋白酶、胶原酶;神经氨酸酶;乳糖酶、麦芽糖酶、蔗糖酶、和阿拉伯呋喃糖苷酶。在另一个实施方案中,感兴趣蛋白质可以是单链、Fab片段和/或全链抗体或其片段或部分。单链抗体可以包括在稳定折叠的多肽单链上的、抗体的抗原结合区。Fab片段可以是特定抗体中的一段。Fab片段可以含有抗原结合位点。Fab片段可以含有2条链轻链和重链片段。这些片段可经由接头或二硫键连接。在其它实施方案中,感兴趣蛋白质是在约20至约42。C的温度有活性的蛋白质。在一个实施方案中,蛋白质在生理温度是有活性的,而在加热至高的或极端的温度(诸如超过65。C的温度)时净皮灭活。在一个实施方案中,感兴趣蛋白质是如下蛋白质,其在约20至约42。C的温度是有活性的,和/或在加热至高的或极端的温度(诸如超过65。C的温度)时被灭活;是天然蛋白质(诸如天然哺乳动物或人蛋白质)或与其基本上同源,并且不是自多联体形式的核酸表达的;其中启动子不是阵列中所使用的宿主细胞中的天然启动子,而是衍生自另一种生物体,诸如大肠杆菌。宿主细胞在一个实施方案中,本发明提供了荧光假单胞菌宿主细胞的阵列,自此以最佳地生成感兴趣的异源蛋白质或肽。荧光假单胞菌已经证明是用于生产多种蛋白质的改良平台,并且已经自此生物体鉴定出数种有效的分泌信号(参见美国申请公开文本号2GG6/()()G8877,通过提及而完整收入本文)。与其它细菌表达系统相比,假单胞菌系统为多肽和酶的商业性表达提供优势。具体地,荧光假单胞菌已经鉴定为有利的表达系统。荧光假单胞菌涵盖一组常见的、非病原性腐生生物,其拓殖土壤、水和植物表面环境。自荧光假单胞菌衍生的商品化酶已经用于降低环境污染,用作去污添加剂,及用于立体选"^性水解。焚光假单胞菌还在农业上用于控制病原体。美国专利号554,695,462记载了重组细菌蛋白质在焚光假单胞菌中的表达。然而,可以使用备用的宿主细胞,或者甚至多种不同宿主细胞来产生包含多个表型独特的宿主细胞的阵列,所述表型独特的宿主细胞已经进行过遗传修饰以调控一种或多种耙基因的表达,如上文所讨论的。宿主细胞可以是任何可以在其中改变耙基因的生物体。鉴定与那些在表1和表2中所列出的靶基因同源的靶基因的方法是本领域已知的。此外,本领域技术人员会理解如何鉴定对于感兴趣的宿主细胞而言是天然的或者在感兴趣的宿主细胞中有用的耙基因。这些蛋白质中许多是本领域中公知的。参见例如美国专利申请7>开文本号2006/0110747。宿主细胞可以选自"革兰氏阴性变形菌门(Proteobacteria)亚组18"。"革兰氏阴性变形菌门亚组18"定义为物种荧光假单胞菌的所有亚种、变种、菌抹和其它亚物种单位的组,包括那些属于例如下列各项的(圓括号中显示了例示性菌株的ATCC或其它保藏号)焚光假单胞菌生物型A,也称为生物变型1或生物变型I(ATCC13525);焚光^^单胞菌生物型B,也称为生物变型2或生物变型II(ATCC17816);荧光^(艮单胞菌生物型C,也称为生物变型3或生物变型III(ATCC17400);焚光假单胞菌生物型F,也称为生物变型4或生物变型IV(ATCC12983);荧光假单胞菌生物型G,也称为生物变型5或生物变型V(ATCC17518);焚光假单胞菌生物变型VI;荧光假单胞菌Pf0-l;荧光假单胞菌Pf-5(ATCCBAA-477);荧光假单胞菌SBW25;及荧光假单胞菌纤维素亚种(NCIMB10462)。宿主细胞可以选自"革兰氏阴性变形菌门亚组19"。"革兰氏阴性变形菌门亚组19"定义为焚光假单胞菌生物型A的所有菌林的组。此生物型的一种特别优选的菌林是焚光假单胞菌菌林MBIOI(参见Wilcox的美国专利No.5,169,760)及其衍生物。它优选的衍生物的例子是荧光假单胞菌菌抹MB214,它是通过将天然大肠杆菌PlacI-lacI-lacZYA构建体(即其中删除了PlacZ)插入MB101染色体aW(天冬氨酸脱氢酶基因)基因座中而构建的。可以在本发明中使用的别的荧光假单胞菌菌林包括荧光假单胞菌Migula和荧光假单胞菌Loitokitok,其具有下列ATCC名称[NCIB8286];NRRLB-1244;NCIB8865菌抹C01;NCIB8866菌抹(302;1291[ATCC17458;IFO15837;NCIB8917;LA;NRRLB-1864;吡咯烷;PW2[ICMP3966;NCPPB967;NRRLB-899];13475;NCTC10038;NRRLB-1603[6;IFO15840];52-1C;CCEB488-A[BU140];CCEB553[EM15/47];IAM1008[AHH-27];IAM1055[AHH-23];1[IFO15842];12[ATCC25323;NIH11;denDoorendeJong216];18[IFO15833;WRRLP陽7];93[TR画10];108[52-22;IFO15832];143[IFO15836;PL];149[2-40画40;IFO15838];182[IFO3081;PJ73];184[IFO15830];185[W2L-l];186[IFO15829;PJ79];187[NCPPB263];188[NCPPB316];189[PJ227;1208];191[IFO15834;PJ236;22/1];194[KlingeR-60;PJ253];196[PJ288];197[PJ290];198[PJ302];201[PJ368];202[PJ372];203[PJ376];204[IFO15835;PJ682];205[PJ686];206[PJ692];207[PJ693];208[PJ722];212.[PJ832];215[PJ849];216[PJ885];267[B-9];271[B-1612];401[C71A;IFO15831;PJ187];NRRLB-3178[4;IFO.15841];KY8521;3081;30-21;[IFO3081];N;PYR;PW;D946-B83[BU2183;FE固-P3328];P-2563[FERM画P2894;IFO13658];IAM-1126[43F];M-l;A506[A5-06];A505[A5-05匿l];A526[A5-26];B69;72;NRRLB-4290;PMW6[NCIB11615];SC12936;Al[IFO15839];F1847[CDC-EB];1,1848[CDC93];NCIB10586;P17;F-12;AmMS257;PRA25;6133D02;6519E01;Ni;SC]5208;BNL-WVC;NCTC2583[NCIB8194];H13;1013[ATCC11251;CCEB295];IFO3903;1062;或Pf-5。在一个实施方案中,宿主细胞可以是能够生成感兴趣蛋白质或多肽的任何细胞,包括上文所描述的荧光假单胞菌细胞。由于它们在大型分批培养中相对便宜的生长要求和生产蛋白质的潜在能力,用于生成感兴趣蛋白质或多肽的最常用系统包括某些细菌细胞,特别是大肠杆菌。酵母也用于表达生物学有关蛋白质和多肽,特别是用于研究目的的。系统包括酿酒酵母(5bcc/flramyce51cerev/w'ae)或巴斯德毕赤氏酵母CP/c/z/a/cwtor/》。这些系统是充分表征的,提供一般可接受水平的总蛋白质生成,而且是比较快速且便宜的。昆虫细胞表达系统也已经显现为用于表达生物学活性形式的重组蛋白的备选。在一些情况中,可生成经翻译后修饰的正确折叠的蛋白质。哺乳动物细胞表达系统(诸如中国仓鼠卵巢细胞)也已经用于表达感兴趣蛋白质或多肽。这些表达系统在小规模上通常是有效的。某些生物制品可自蛋白质衍生,特别是在动物或人保健应用中。在另一个实施方案中,宿主细胞是植物细胞,包括但不限于烟草细胞、玉米、来自拟南芥(Arabidopsis)物种的细胞、马铃薯或稻细胞。57在另一个实施方案中,宿主细胞可以是原核生物,诸如细菌细胞,包括但不限于埃希氏菌属(Escherichia)或假单胞菌属(Pseudomonas)物种。典型的细菌纟田胞记载于例如"BiologicalDiversity:BacteriaandArchaeans,,,即由MJFarabee十專士(EstrellaMountainCommunityCollege,Arizona,USA)在网乡占www.emc.maricotpa.edu/faculty/farabee/BIOBK/BioBookDiversity才是供的在线生物学书籍的一章。在某些实施方案中,宿主细胞可以是假单胞菌细胞,而且通常可以是荧光假单胞菌细胞。在其它实施方案中,宿主细胞也可以是大肠杆菌细胞。在另一个实施方案中,宿主细胞可以是真核细胞,例如昆虫细胞,包括但不限于来自灰翅夜蛾属(Spodoptera)、粉紋夜蛾属(Trichoplusia)、果蝇属(Drosophila)或顶灯蛾属(Estigmene)物种的细胞,或哺乳动物细胞,包括但不限于鼠细胞、仓鼠细胞、猴、灵长类或人细胞。在一个实施方案中,宿主细胞可以是任何细菌分类单位的成员。例如,细胞可以是真细菌的任何物种的成员。宿主可以是下列分类单位之任一的成员酸杆菌门(Addobacteria)、放线杆菌门(Actinobacteira)、产液菌门(Aquificae)、拟杆菌门(Bacteroidetes)、绿菌门(Chlorobi)、衣原体门(Chlamydiae)、绿屈挠菌门(Choroflexi)、金矿菌门(Chrysiogenetes)、蓝细菌门(Cyanobacteria)、脱纟失杆菌门(Deferribacteres)、异常j求菌(Deinococcus)、网团菌门(Dictyoglomi)、丝状杆菌门(Fibrobacteres)、厚壁菌门(Firmicutes)、梭杆菌门(Fusobacteria)、芽单月包菌门(Gemmatimonadetes)、黏胶球形菌门(Lentisphaerae)、;肖4匕虫系s走菌门(Nitrospirae)、)'孚霉^犬菌门(Planctomycetes)、变形菌门(Proteobacteria)、螺旋体门(Spirochaetes)、热脱硫杆菌门(Thermodesulfobacteria)、热孩史菌门(Thermomicrobia)、才西热对包菌门(The誦togae)、栖热菌属(The匪s)(栖热菌目(The謹les))、或疣微菌门(Vermcomicrobia)。在真细菌宿主细胞的一个实施方案中,细胞可以是真细菌(除蓝细菌门之夕卜)的任何物种的成员。细菌宿主还可以是变形菌门的任何物种的成员。变形菌门宿主细胞可以是分类单位a-变形菌纲、(3-变形菌纲、Y-变形菌纲、5-变形菌纲或s-变形菌纲中任一种的成员。另夕卜,宿主可以是分类单位a-变形菌纲、(3-变形菌纲或丫-变形菌纲中任一种的成员,和y-变形菌纲的任何物种的成员。在Y-变形菌纲宿主的一个实施方案中,宿主会是分类单位气单胞菌目(Aeromonadales)、交替单月包菌目(Alteromonadales)、肠4干菌目(Enterobacteriales)、々I单月包菌目(Pseudomonadales)、或黄单月包菌目(Xanthomonadales)中任一种的成员;或肠杆菌目或假单胞菌目的任何物种的成员。在一个实施方案中,宿主细胞可以是肠杆菌目的,宿主细胞会是肠杆菌牙牛的成员,或可以是欧文氏菌属(Erwinia)、埃希氏菌属(Escherichia)、或沙雷氏菌属(Serratia)中任一种的成员;或埃希氏菌属的成员。若宿主细胞是4i单胞菌目的,则宿主细胞可以是假单胞菌科的成员,包括假单胞菌属。y-变形菌纲宿主包括物种大肠杆菌的成员和物种荧光假单胞菌的成员。其它假单胞菌生物体也可能是有用的。假单胞菌和紧密相关的物种包括革兰氏阴性变形菌门亚组l,其包括属于由R.E.Buchanan和N.E.Gibbons(编):Bergey,sManualofDeterminativeBacteriology,页217-289(第8版,1974)(TheWilliams&WilkinsCo"Baltimore,Md.,USA)(下文中的"Bergey(1974),,)以"革兰氏阴性好氧杆菌和球菌"描述的科和/或属的变形菌门组。表7呈现了这些科和属的生物体。表7:"革兰氏阴性好氧杆菌和球菌"部分(Bergey(1974))中所列的科和属牙牛I,j叚单月包菌牙斗(Pseudomomonaceae)葡糖杆菌属(Gluconobacter)寸艮单月包菌属(Pseudomonas)黄单胞菌属(Xanthomonas)动胶菌属(Zoogloea)科II.固氮菌科(Azotobacteraceae)氮单月包菌属(Azomonas)固氮菌属(Azotobacter)拜p十一木克氏菌属(Beijerinckia)德克斯氏菌属(Derxia)科III.根瘤菌科(Rhizobiaceae)土》裏^干菌属(Agrobacterium)才艮瘤菌属(Rhizobium)科IV.曱基单胞菌科(Methylomonadaceae)曱基球菌属(Methylococcus)曱基单胞菌属(Methylomonas)科V.盐杆菌科(Halobacteriaceae)盐杆菌属(Halobacterium)盐球菌属(Halococcus)其它属醋杆菌属(Acetobacter)产威菌属(Alcaligenes)博德特氏菌属(Bordetella)59<table>tableseeoriginaldocumentpage60</column></row><table>"革兰氏阴性变形菌门亚组l"还包括依照分类中所使用的标准会分类在此标题中的变形菌门。该标题还包括先前分类在此部分中但不再在此部分中的组,诸如食酸菌属(Acidovorax)、短波单胞菌属(Brevundimonas)、伯克霍尔德氏菌属(Burkholderia)、氢噬胞菌属(Hydrogenophaga)、海洋单胞菌属(Oceanimonas)、罗尔斯通氏菌属(Ralstonia)、和寡养单月包菌属(Stenotrophomonas),鞘氨醇单胞菌属(Sphingomonas)(及自其衍生的属芽单胞菌属(Blastomonas))(其通过对属于黄单胞菌属(且先前称为黄单胞菌属的种)的生物体重新分组而创建)、酸单胞菌属(Acidomonas)(其通过对属于Bergey(1974)中定义的醋杆菌属(Acetobacter)的生物体重新分组而创建)。另外,宿主可包括来自下组的细胞假单胞菌属、海洋假单胞菌(尸化M^wo"os(ATCC14393)、生黑假单胞菌(尸化M^mo"wm'g〃/"c^;w')(ATCC19375)、和腐败假单胞菌(尸化w^wo"^/wfre/ac/em)(ATCC8071),它们已经分别被重新分类为河豚毒素交替单胞菌04"eramo朋skj/,/a献to)、产黑交替单月包菌(yl/z^ra附owaww'gn力c/e朋)、和腐败交3齐单月包菌(yl/eramtwas/zz/re/flc,'era)。类似、i4,例^口后来食酉交4艮单月包菌(尸化wciowcwas1flc/(iovora似)(ATCC15668)和睾丸酮假单胞菌(尸化w^wo"OT(ATCC11996)已经被分别重新分类为食酸丛毛单胞菌(Cb,www"asac/Jovorara)和睾丸酮丛毛单胞菌(Cbwawo"asfe^oWeram');而生黑假单胞菌(ATCC19375)和杀鱼假单胞菌(尸化^owo"^;^c/c/Ja)(ATCC15057)已经被分别重新分类为生黑假交替单月包菌CP化Mcfoa/terawo"a5"w'g/^y^c/e似)牙口杀鱼1支交替单月包菌(尸化^fofl/teramo腦5p&c/cWa)。"革兰氏阴性变形菌门亚组1,,还包括变形菌门中分类为属于任何如下科的假单胞菌科、固氮菌科(现在通常以同义词即假单胞菌科的"固氮菌组"称呼)、根瘤菌科、和甲基单胞菌科(现在通常以同义词即"曱基球菌科,,称呼)。因此,在那些于本文中其它部分所述的属之外,变形菌门中落入"革兰氏阴性变形菌门亚组r内的其它属包括l)嗜氮根瘤菌属(Azorhizophilus)的固氮菌组细菌;2)纤维弧菌属(Cellvibrio)、寡源杆菌属(Oligella)、和Teredinibacter的假单胞菌科细菌;3)螯合杆菌属(Chelatobacter)、啮'J菌属(Ensifer)、Liberibacter(也-尔为"CandidatusLiberibacter")、和中华才艮瘤菌属(Sinorhizobium)的才艮瘤菌牙牛细菌;及4)甲基细菌属(Methylobacter)、曱基暖菌属(Methylocaldum)、曱基农i菌属(Methylomicrobium)、曱基八叠球菌属(Methylosarcina)、和甲基3求形菌属(Methylosphaera)的曱基球菌科细菌。在另一个实施方案中,宿主细胞选自"革兰氏阴性变形菌门亚组2"。"革兰氏阴性变形菌门亚组2"定义为下列属的变形菌门组(在圓括号中指明产品目录列出的、公众可获得的、已保藏的其菌林的总数,均保藏于ATCC,除非另有指明)酸单胞菌属(2);酸杆菌属(93);葡糖杆菌属(37);短波单胞菌属(23);拜叶林克氏菌属(Beyerinckia)(13);德克斯氏菌属(2);布鲁氏菌属(4);土壤杆菌属(79);螯合杆菌属(2);剑菌属(3);才艮瘤菌属(144);中华根瘤菌属(24);芽单胞菌属(l);鞘氨醇单胞菌属(27);产石咸菌属(88);博德特氏菌属(43);伯克霍尔德氏菌属(73);罗尔斯通氏菌属(33);食酸菌属(20);氢噬胞菌属(9);动胶菌属(9);曱基细菌属(2);曱基暖菌属(在NCIMB的l种);曱基球菌属(2);曱基微菌属(2);甲基单胞菌属(9);曱基八叠球菌属(l);曱基球形菌属;氮单胞菌属(9);嗜氮根瘤菌属(5);固氮菌属(64);纤维弧菌属(3);寡源杆菌属(5);假单胞菌属(1139);弗朗西丝氏菌属(4);黄单胞菌属(229);寡养单胞菌属(50);和海洋单胞菌属(4)。"革兰氏阴性变形菌门亚组2"的例示性宿主细胞物种包括但不限于下列细菌(在圓括号中显示其例示性菌抹的ATCC或其它保藏号)曱醇酸单胞菌(」c/(io歸顧膨A(3"o//—(ATCC43581);醋化醋杆菌(Jceto/a"erac幼〕(ATCC15973);氧化葡糖杆菌(G7"co"o6acferox少&m)(ATCC19357);缺陷短波单胞菌(^^v,Amo腦sA脂'冊to)(ATCC11568);印度拜叶林克氏菌C8e,)'en'"ch'a/"&ca)(ATCC9039和ATCC19361);胶德克斯氏菌gwmwow)(ATCC15994);马耳他布鲁氏菌CSrace〃a(ATCC23456);流产布鲁氏菌(&wce//aWoW^)(ATCC23448);根癌土壤杆菌(Xgro6a"en'wmfwme/ac/em1)(ATCC23308)、》文射形土i裏冲干菌(v4gro6a"en'wmrad/o6acfer)(ATCC19358)、发才艮土壤杆菌(^grakcten'wwr/z/zogewe力(ATCC11325);何氏螯合杆菌(C7ze/atoZ^"er/^'"te")(ATCC29600);粘着剑菌(五m77^"a(i/2aerem1)(ATCC33212);豆死豆才艮瘤菌(//z/zo6z'Mm/egM/w'/msan/w)(ATCC10004);费氏中华根瘤菌(S/"oA/zoZ)/m/w(ATCC35423);5/osto附o"(zs1"atoton'a(ATCC35951);少动鞘氨醇单月包菌(5^/7/"gomowas61p做c/wo&fo)(ATCC29837);粪产i咸菌(^/c""gew^/aecato)(ATCC8750);百曰咳博德特氏菌(5orafe&〃apeWw^/力(ATCC9797);洋葱伯克霍尔德氏菌CSwr狄o/(ien.acepac/a)(ATCC25416);皮氏罗尔斯通氏菌属(ia&tom.ap/cfem7)(ATCC27511);敏捷食酸菌04cWovorax/a"7&)(ATCC11228);黄色氬噬胞菌(/fy(iragewci/7/z(3g"_/7avo)(ATCC33667);生枝动胶菌(Zoog7oear函/gera)(ATCC19544);藤黄曱基细菌(Mw/^/oZ^cter/w&w力(ATCC49878);Ma/7>Voca/<iMmgrac,/e(NCIMB11912);荚膜甲基J求菌0W^/2y/ococcwsca/ww/af附)(ATCC19069);活泼曱基微菌(Me/;^/om/craWwmap7e)(ATCC35068);曱烷曱基单胞菌(Me^y/omo"osweAam.ca)(ATCC35067);她f/2少/osa/r細,Zrato(ATCC700909);Me~/,/z<aeraA(ms細7(ACAM549);敏捷氮单胞菌(j加wo"oy(ATCC7494);雀稗嗜氮根瘤菌(/^0^&0;/7^p^;a//)(ATCC23833);褐球固氮菌0^oto6acferc/zraococcww)(ATCC9043);混合纤维弧菌(Ce〃vAn'om"/M力(UQM2601);尿道寡源杆菌((9//ge〃ai^Ara//》(ATCC17960);铜绿假单胞菌CPseMcfomo"waen/g/wasa)(ATCC0145),荧光假单胞菌(尸化wcfowo腦sy/womce"s)(ATCC35858);土拉热弗朗西丝氏菌(Fra/'化〃a似/fl"m/力(ATCC6223);嗜麦芽糖寡养单月包菌(5Vewo"'o//zowow(3w附a/to//H7/a)(ATCC13637);罢予油菜黄单月包菌(义aW/7owowflst'"附/e边刮(ATCC33913);和(9caaw/ww7ascfowdora^/(ATCC27123)。在另一个实施方案中,宿主细胞选自"革兰氏阴性变形菌门亚组3"。"革兰氏阴性变形菌门亚组3"定义为下列属的变形菌门组短波单胞菌属;土壤杆菌属;根瘤菌属;中华根瘤菌属;芽单胞菌属;鞘氨醇单胞菌属;产碱菌属;伯克霍尔德氏菌属;罗尔斯通氏菌属;食酸菌属;氢噬胞菌属;曱基细菌属;曱基暖菌属;曱基球菌属;曱基微菌属;曱基单胞菌属;曱基八叠球菌属;曱基球形菌属;氮单胞菌属;嗜氮根瘤菌属;固氮菌属;纤维弧菌属;寡源杆菌属;假单胞菌属;Teredinibacter;弗朗西丝氏菌属;寡养单胞菌属;黄单胞菌属;和海洋单胞菌属。在另一个实施方案中,宿主细胞选自"革兰氏阴性变形菌门亚组4"。"革兰氏阴性变形菌门亚组4"定义为下列属的变形菌门组短波单胞菌属;芽单胞菌属;鞘氨醇单胞菌属;伯克霍尔德氏菌属;罗尔斯通氏菌属;食酸菌属;氢噬胞菌属;曱基细菌属;曱基暖菌属;曱基球菌属;曱基微菌属;曱基单胞菌属;曱基八叠球菌属;曱基球形菌属;氮单胞菌属;嗜氮根瘤菌属;62固氮菌属;纤维弧菌属;寡源杆菌属;假单胞菌属;Teredinibacter;弗朗西丝氏菌属;寡养单胞菌属;黄单胞菌属;和海洋单胞菌属。在另一个实施方案中,宿主细胞选自"革兰氏阴性变形菌门亚组5"。"革兰氏阴性变形菌门亚组5"定义为下列属的变形菌门组甲基细菌属;曱基暖菌属;曱基球菌属;曱基微菌属;曱基单胞菌属;曱基八叠球菌属;曱基球形菌属;氮单胞菌属;嗜氮根瘤菌属;固氮菌属;纤维弧菌属;寡源杆菌属;假单胞菌属;Teredinibacter;弗朗西丝氏菌属;寡养单胞菌属;黄单胞菌属;和海洋单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组6"。"革兰氏阴性变形菌门亚组6"定义为下列属的变形菌门组短波单胞菌属;芽单胞菌属;鞘氨醇单胞菌属;伯克霍尔德氏菌属;罗尔斯通氏菌属;食酸菌属;氢噬胞菌属;氮单胞菌属;嗜氮根瘤菌属;固氮菌属;纤维弧菌属;寡源杆菌属;假单胞菌属;Teredinibacter;寡养单胞菌属;黄单胞菌属;和海洋单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组7"。"革兰氏阴性变形菌门亚组7"定义为下列属的变形菌门组氮单胞菌属;嗜氮根瘤菌属;固氮菌属;纤维弧菌属;寡源杆菌属;假单胞菌属;Teredinibacter;寡养单胞菌属;黄单胞菌属;和海洋单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组8"。"革兰氏阴性变形菌门亚组8"定义为下列属的变形菌门组短波单胞菌属;芽单胞菌属;鞘氨醇单胞菌属;伯克霍尔德氏菌属;罗尔斯通氏菌属;食酸菌属;氢噬胞菌属;假单胞菌属;寡养单胞菌属;黄单胞菌属;和海洋单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组9"。"革兰氏阴性变形菌门亚组9"定义为下列属的变形菌门组短波单胞菌属;伯克霍尔德氏菌属;罗尔斯通氏菌属;食酸菌属;氢噬胞菌属;假单胞菌属;寡养单胞菌属;和海洋单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组10"。"革兰氏阴性变形菌门亚组10"定义为下列属的变形菌门组伯克霍尔德氏菌属;罗尔斯通氏菌属;假单胞菌属;寡养单胞菌属;和黄单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组ll"。"革兰氏阴性变形菌门亚组ll"定义为下列属的变形菌门组假单胞菌属;寡养单胞菌属;和黄单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组12"。"革兰氏阴性变形63菌门亚組12"定义为下列属的变形菌门组'.伯克霍尔德氏菌属;罗尔斯通氏菌属;假单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组13"。"革兰氏阴性变形菌门亚组13"定义为下列属的变形菌门组伯克霍尔德氏菌属;罗尔斯通氏菌属;假单胞菌属;和黄单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组14"。"革兰氏阴性变形菌门亚組14"定义为下列属的变形菌门组假单胞菌属和黄单胞菌属。宿主细胞可选自"革兰氏阴性变形菌门亚组15"。"革兰氏阴性变形菌门亚组15"定义为假单胞菌属的变形菌门组。宿主细胞可选自"革兰氏阴性变形菌门亚组16"。"革兰氏阴性变形菌门亚组16"定义为下列假单胞菌物种的变形菌门组(在圆括号中显示了例示性菌抹的ATCC或其它保藏号)i^ewdomowasaZ^tom>/z//a(ATCC700689);铜绿假单胞菌(i^eM^wcww^n^/"osa)(ATCC10145);产碱假单胞菌(ATCC14909);病鳝々I单月包菌(户化"(icw70"ayawgwz'〃^e/^cfl)(ATCC33660);香茅醇々支单月包菌(尸化M(icw7wzayc"ra"e〃ofc)(ATCC13674);变黄假单胞菌(尸化Mcfowo"as/7m^ce"力(ATCC51555);门多萨假单胞菌(尸^^/o"w"^mem/oc/"")(ATCC25411);硝基还原假单胞菌(/^ez^/omo"(Zs(ATCC33634);食油<叚单月包菌(/^ewdomowoso/eovoram1)(ATCC8062);类产石咸叶叚单月包菌(尸"W(iomowa/wewdoa/cfir/Zgewas1)(ATCC17440);食树脂假单胞菌(尸^w6fomo"osm^'"ovorara)(ATCC14235);稻草假单胞菌(尸化wt/omo腦sWra服'"ea)(ATCC33636);伞菌假单月包菌(尸A,(io附ow(a^aga厂/('0(ATCC25941);/^ewdomowosa/ca/一z,/a;尸化M(io附o腦so/g/wovora;尸seM(io"7(9was1aw<iersom'/;4失角蕨"f艮单月包菌(尸sew(iomowfls<3wp/em7)(ATCC23835);壬二酸假单月包菌(尸wwdowo"ay"ze/a/ca)(ATCC27162);拜氏々i单月包菌(尸^M(iomowas6e_yen>ch7)(ATCC19372);Zwreafc;北i成々I单月包菌(i^ewcfowowas(ATCC33662);Z尸owz,caceflra附;食丁酉臾1^单月包菌CPjeM(icww7asZwto"ovora)(ATCC43655);T^ewcfomowasce〃w/osa(ATCC55703);桔黄^l单月包菌(i^ei/(iomowasawra"riaca)(ATCC33663);绿针假单胞菌CPsew^ww"wc/z/orarap/z/力(ATCC9446,ATCC13985,ATCC17418,ATCC17461);莓实假单胞菌OP化Mcfowo"w/rag0(ATCC49");隆德假单胞菌(i^ew^mo"os/m"&"m》(ATCC4"68);腐臭假单胞菌(尸化W(io附o/7as1taefra/ms)(ATCC4683);青紫葛假单胞菌(/^ew<iomcwas"M/co/a)(ATCC33616);晕斑假单胞菌(尸"Mt/omo"cwcorawq/^f".ms);64尸sew(icw(9"asci/te^pemj^/n'/a;4申长布支单月包菌(尸seM(iomow(xye/o"gata)(ATCC10144);弯曲假单胞菌(尸w"^mo"osy/e"ms)(ATCC12775);产氮假单胞菌(尸化M(iowo""sazc^q/^,(3ra);/^Womo"oy6re""g〃';i^ewc/o附o"oyce<ire〃";铍纟丈布I单月包菌(/^ewt/cwo"oco;rwg(3e)(ATCC29736);尸化wflbm(9"as荧光布支单月包菌(/^ew(iomowwyZwomscera)(ATCC35858);尸化z^cwo"agrasaW/;/z'Z)""e腦、;尸化wcfowo"as1wa"cfe/〃(ATCC700871);边缘假单胞菌(/^ew^mo"osma^/"a"力(ATCC10844);/^ewt/omowas1m/gw/ae;霉口未々支单月包菌(i^ewcfomowaywwczWo/era)(ATCC4685);东方"f叚单月包菌(尸化M^ifomo;7as:on'ewto/Z力;尸sewc/owowosr/zocfes/ae;类黄々支单月包菌(尸化M(i細(9way,xa涵")(ATCC9890);托拉氏假单胞菌(尸化W(io膨wayto/aos7./)(ATCC33618);尸5eM^fomowosveram7(ATCC700474);i^eMt/owo"os1^^/en'fe^e/^em^;弯曲々支单月包菌(i^ewdomowoygem'cw/ato)(ATCC19374);尸化wtfowo"os1g/"gen';i^ewcfomo/^gra加'm's;格氏假单胞菌(/^ewc/cwcwaygr/mcw"z');盐脱氮1"艮单月包菌(/^ei^fow(9"as1/za/cxiew"nyC(3ra);口耆盐作£单月包菌(As'eM(io附o/7as1Zza/op/zZ/a);才西木冲堇布支单月包菌(7^ew(i(9momw/z/Z^c/co/a)(ATCC19867);哈特假单胞菌(尸化w^wo"似/wm'emz'力(ATCC14670);噬氢假单胞菌(尸sew(:/o附(9way/zj^ragewovora);/^ez^/。wcwoyy'es^em7.(ATCC700870);/^ewt/ow(9wash7o/7e"s&;/^ew^iowowas"/awceo/ato;(ATCC14669);Z^eM(iomo"a5//"/;划界假单胞菌(/^e^owowomarg/腦to)(ATCC25417);臭味假单胞菌"7e//7//7'ca)(ATCC33665);脱氮々I单月包菌(尸化wt/om(9"ast/emYr折cara)(ATCC19244);百日咳々支单月包菌(尸"iAiomowaypeWwc/"ogewa)(ATCC190);皮克特假单胞菌CP化Mcfowo"asp/ctoram)(ATCC23328);尸5ew(iomowos1/^syc/zrap/w'/a;黄净曷,支单月包菌//va)(ATCC31418);蒙氏1支单月包菌(尸5e^/o附6wosmo"fe〃")(ATCC700476);/^ewcsfowcwawas^e///;才西稻々支单月包菌(/^ewcfomcwayo/3^z7za6/tom)(ATCC43272);变形,支单胞菌(尸wwt/owo"asp/ecog/o^z'c/^)(ATCC700383);恶臭假单胞菌(尸sew(iomcwas1/M〃(i(2)(ATCC12633);i^ew/omowosreactara;多刺4,支单月包菌(尸sewfifomow(35s//"o9a)(ATCC14606);Za/ean'ca;》'戋黄々支单月包菌(7^ewfifomowas/wteo/a)(ATCC43273);施氏々支单月包菌(/^eMctomo"asWwteen')(ATCC17588);扁桃假单胞菌CP化w^wo"wam_Kgt/a//)(ATCC33614);尸sew(iowo"ayave〃朋ae(ATCC700331);番木瓜假单胞菌(/^ewofcw70"as65can'cflpa/a_yae)(ATCC33615);菊苣,支单月包菌(/^e"(iowowas1c/c/zon.z')(ATCC10857);天仙果假单胞菌OP化wfifomomw,cwectoe)(ATCC35104);褐鞘假单月包菌(T^ew(icwo"a5/"scovag/"ae);苦才束々i单月包菌(ATCC33050);丁香假单胞菌CP化^fowo"os矽n'"goe)(ATCC19310);绿黄假单胞菌(ftew^mo"osWn^yara)(ATCC13223);热食碳酸假单胞菌(尸5^M(iomo"as1^2emoc(3T6oxy(iovorara)(ATCC35961);耐热々支单月包菌(尸jgM(^o附o"o/2er附c^o/^73"s);//2/verva/e"j7.j;;J显哥华^艮单刀包菌(尸化m^wo"wva"cowe^"^)(ATCC700688);威斯康辛假单胞菌(尸sew(iomo"as1w/sco"w."em7、);禾口厦门^支单月包菌(/^ew(iomoway:d(2me"ews/s)。宿主细胞可选自"革兰氏阴性变形菌门亚组17"。"革兰氏阴性变形菌门亚组17"定义为本领域中已知"发荧光的假单胞菌"的变形菌门组,所述发焚光的假单胞菌包括那些属于例如下列假单胞菌物种的产氮假单胞菌;尸seMcfo附0was1ex^ewon'ewto//s;荧光,支单月包菌;i^ewciowowfiwge^ara//;f^e〃c/omowas1//6twem,/s;jPsewdomwzas1边纟彖"(叚单月包菌;尸化M(icw70W(5wm/gw/"e;霉味假单月包菌;东方假单胞菌;尸化"(iomowasr/z<9<ias7'ae;类黄布支单胞菌;托拉氏假单月包菌;和尸wMt/owo"氾其它合适的宿主包括那些分类在参考文献的其它部分中的,诸如革兰氏(+)变形菌门。在一个实施方案中,宿主细胞是大肠杆菌。已经为大肠杆菌MG1655建立了大肠杆菌的基因组序列(Blattner等(1997)ThecompletegenomesequenceofEscherichiacoliK-12,Science277(5331):1453-74),而且对于大肠杆菌K12,DNA微阵列是商品化的(MWGInc,HighPoint,N.C.)。大肠杆菌可在丰富培养基诸如Luria-Bertani(LB)(10g/L胰蛋白胨、5g/LNaCl、5g/L酵母提取物)或具有合适的碳源(诸如1%葡萄糖)的限定基本培养基诸如M9(6g/LNa2HP04、3g/LKH2P04、lg/LNH4Cl、0.5g/LNaCl、pH7.4)中培养。常规的是,将大肠杆菌细胞的过夜培养物稀释,并接种入摇瓶或发酵罐中的新鲜的丰富培养基或基本培养基中,并于37。C培养。宿主细胞也可以是哺乳动物起源的,诸如自包括任何人或非人哺乳动物的哺乳动物衍生的细胞。哺乳动物可以包括但不限于灵长类、猴、猪(porcine)、绵羊(ovine)、牛、啮齿类、有蹄类、猪(pig)、猪(swine)、绵羊(sheep)、羔羊、山羊、牛、鹿、骡、马、猴、猿、犬、猫、大鼠、和小鼠。宿主细胞也可以是植物起源的。可以选择来自任何植物的细胞以在其中筛选感兴趣异源蛋白质的生成。合适的植物的例子包括但不限于苜蓿(alfalfa)、苹果(apple)、杏(apricot)、拟南芥(Arabidopsis)、朝鲜蓟(artichoke)、芝麻菜(arugula)、,夢(asparagus)、金f梨(avocado)、香蕉(banana)、大麦(barley)、豆类(beans)、甜菜(beet)、黑莓(blackberry)、蓝莓(blueberry)、花椰菜(broccoli)、4包子甘蓝(brusselssprouts)、甘蓝(cabbage)、芸苔(canola)、网纟丈瓜(cantaloupe)、胡萝卜(carrot)、木薯(cassaya)、蓖麻(castorbean)、花椰菜(cauliflower)、芽菜(celery)、樱桃(cheny)、菊苣(chicory)、芫荽(cilantro)、柑橘(citrus)、克莱门氏小柑橘(Clementines)、车轴草(clover)、椰子(coconut)、咖啡(coffee)、玉米(corn)、棉(cotton)、酸果蔓(cranberry)、黄瓜(cucumber)、黄杉(Douglasfir)、痴子(eggplant)、苣荬菜(endive)、菊苣(escarole)、按(eucalyptus)、茴香(fennel)、无花果(figs)、蒜(garlic)、葫芦(gourd)、葡萄(grape)、葡萄柚(grapefruit)、蜜瓜(honeydew)、豆薯(jicama)、猕猴桃(kiwifruit)、莴苣(lettuce)、葱(leeks)、柠檬(lemon)、来檬(lime)、火炬松(Loblollypine)、亚麻(linseed)、芒果(mango)、《计瓜(mdon)、蘑恭(mushroom)、油冲兆(nectarine)、坚果(nut)、燕麦(oat)、油4乐(oilpalm)、油菜(oilseedrape)、牙火葵(okra)、扭t才览(olive)、葱(onion)、#计橘(orange)、观赏植物、棕榈(palm)、番木瓜(papaya)、欧芹(parsley)、欧防风(parsnip)、豌豆(pea)、桃(peach)、花生(peanut)、梨(pear)、胡椒(pepper)、柿子(persimmon)、4公(pine)、凤梨(pineapple)、车前(plantain)、4每(plum)、石才留(pomegranate)、杨(poplar)、马铃薯(potato)、南瓜(p腿pkin)、榲梓(quince)、辐射冲公(radiatapine)、菊苣(radiscchio)、萝卜(radish)、油菜冲予(rapeseed)、悬钩子(raspberry)、稻(rice)、黑麦(rye)、高粱(sorghum)、南方^^(Southempine)、大豆(soybean)、蔆菜(spinach)、西葫芦(squash)、草莓(strawberry)、甜菜(sugarbeet)、甘蔗(sugarcane)、向曰葵(sunflower)、甘薯(sweetpotato)、才风香树(sweetgum)、橘(tangerine)、茶(tea)、烟草(tobacco)、番痴(tomato)、黑小麦(1xiticale)、草皮(turf)、芫箐(turnip)、藤(vine)、西瓜(watermelon)、小麦(wheat)、薯蕷(yam)、和绿皮西葫芦(zucchini)。在一些实施方案中,所述方法中有用的植物是拟南芥、玉米、小麦、大豆、和棉。试剂盒本发明还提供了对于鉴定如下宿主菌抹(例如荧光假单胞菌宿主菌抹)67有用的试剂盒,所述宿主菌抹对于生成感兴趣的异源蛋白质或多肽是最佳的。试剂盒包含多种表型独特的宿主细胞,其中每个群体已经进行过遗传修饰以提高一种或多种牵涉蛋白质生成的靶基因的表达和/或降低一种或多种牵涉蛋白质降解的靶基因的表达。阵列可以进一步包含一个或多个如下细胞群体,其没有进行过遗传修饰以调控牵涉蛋白质生成的基因或牵涉蛋白质降试剂以及供感兴趣的异源蛋白质或多肽表达用的试剂和/或构建体。试剂盒中可以以任何适合于细胞群体贮存、转运、和重建的方式提供宿主细胞群体。可以在管中、在板上、或者在斜面上提供活着的细胞群体,或者可以在管或管形瓶中保存冷冻干燥的或冷冻的细胞群体。细胞群体可以包含贮存培养基中的别的成分,诸如甘油、蔗糖、清蛋白、或其它合适的保护剂或贮存剂。为了例示而非为了限制,^是供了以下实施例。实施例总论异源蛋白质生成经常导致不溶性或不正确折叠的蛋白质的形成,所述不溶性或不正确折叠的蛋白质难以恢复,而且可能是没有活性的。此外,特定宿主细胞蛋白酶的存在可以降解感兴趣的蛋白质,如此降低最终的产量。没有会改善所有异源蛋白质生成的单一因素。如此,寻找一种方法来从可能的候选物库鉴定对特定异源蛋白质特异性的因素。使用SystemsBiology工具,挖掘荧光假单胞菌基因组来鉴定宿主细胞蛋白质折叠调控物和蛋白酶基因。然后,实施整体基因表达分析来以优先顺序排列上调的靶物,此后,构建新的蛋白质生产菌抹。结果,装配"Pfenex菌抹阵列",其由多种表型独特的荧光假单胞菌宿主菌抹组成,所述表型独特的荧光假单胞菌宿主菌抹是宿主细胞蛋白酶缺陷的或者容许蛋白质折叠调控物的共过表达。可以使用此菌抹阵列来筛选特异性增强某些异源蛋白质产量或质量的因素。提供多种表型独特的宿主菌抹增加成功鉴定如下宿主菌林的机会,所述宿主菌株会提高任何个别的感兴趣异源蛋白质的生成。本发明提供了荧光假单胞菌中异源蛋白质生成的改善。具有可用的相同遗传背景中的宿主菌抹文库容许快速筛选和鉴定提高异源表达的蛋白质的产量和/或质量的因素。已经给荧光假单胞菌的基因组序列作注释,并且已经68鉴定出被靶定的宿主细胞折叠调控物和蛋白酶。折叠调控物帮助蛋白质的正确折叠,并且包括伴侣蛋白、陪伴蛋白、肽基-脯氨酰异构酶(PPI酶)、和二硫键形成蛋白。蛋白酶可以降解感兴趣的蛋白质,如此影响异源蛋白质产量和质量。使用来自文献的背景知识和DNA^:阵列分析来鉴定可能的靶物,汇编了约80种靶基因的列表。在具有相同遗传背景的宿主细胞中,将这些基因自基因组除去或克隆入质粒中以能够与异源蛋白质一起共过表达。以96孔形式排列所得的菌林,并在转化表达感兴趣的异源蛋白质的质粒后,筛选改善的蛋白质产量和/或质量。实施例l:荧光假单胞菌菌林MB214基因组中折叠调控物基因的鉴定折叠调控物是一类存在于所有细胞中的蛋白质,其帮助对新生的和异源的多肽的折叠、解折叠和降解。折叠调控物包括伴侣蛋白、陪伴蛋白、肽基-脯氨酰顺反异构酶、和牵涉蛋白质二硫键形成的蛋白质。作为构建具有帮助折叠异源蛋白质能力的新的生产菌抹的第一步,挖掘荧光假单胞菌基因组以鉴定宿主细胞折叠调控物基因。使用以下方法来对焚光假单胞菌MB214基因组中6,433种预测的ORF之每一种分析它们编码折叠调控物的概率。Dow研究人员已经通过对基因组注释的分析鉴定出数种感兴趣的折叠调控物(Ramseier等2001)。使用蛋白质/蛋白质BLAST来鉴定这些起始蛋白质的同系物,其中起始蛋白质作为询问(query),而所有MB214翻译的ORF的数据库作为对象(subject)。将那些以显著的同源性匹配询问蛋白质的翻译ORF添加至列表以进一步分析。显著的同源性在这里定义为具有le-30或更小的e得分,其中允许基于比对长度和质量进行的人判断。此研究的意图是要非常广泛,以使所有潜在的折叠调控物会得到鉴定的机会最大化。基于其来自含有关键词"伴侣蛋白"的先前注释的安排功能,将更多种ORF添加至列表。最后,通过蛋白质特征(signature)家族搜寻程序InterProScan(Quevillon等2005)针对InterPro数据库第7.0版(Mulder等2005)分析所述ORF。由InterProScan软件给ORF指定蛋白质家族以及与那些家族有关的基因本体论(GeneOntology,GO)分类(GeneOntologyConsortium.2004)。4吏用这些自动GO指定,将所有已经指定GO项"GO:0006457生物学过程蛋白质折叠,,或"GO:0003754分子功能伴侣蛋白活性',的ORF添加至列表以进行进一步分析。然后分析列表以除去具有低的编码折叠调控物的概率的ORF。再一次,此研究的意图是要非常广泛的,但是通过这些半自动化方法而指定至列表的许多ORF基于有限的标准和人判断可以被容易地鉴定为不编码折叠调控物。排除某种ORF的最常见理由是此ORF实际上是折叠调控物的证据较弱,即如下的基于先前的注释而已经被指定至列表的ORF,其中用于将ORF注释为折叠调控物的推理是不清楚的或矛盾的。InterProScan实际上是不同程序的集成,并且认为这些程序中的一些比其它的更可靠。如果仅基于ScanRegExp或ProfileScan组件(component)的输出将ORF指定至列表,那么将其除去。荧光假单胞菌折叠调控物的最终列表具有43位成员,并显示于表l中。实施例2:荧光假单胞菌菌林MB214基因组中蛋白酶基因的鉴定蛋白酶是水解肽键且对所有活的生物的存活必需的酶。然而,它们在细胞中的作用意味着蛋白酶对任何异源蛋白质表达系统(其也包括Pfenex表达技术TM)中的重组蛋白质产量和/或质量可以是不利的。作为构建自基因组除去蛋白酶基因的新的生产菌抹的第一步,挖掘荧光假单胞菌基因组以鉴定宿主细胞蛋白酶基因。使用以下方法来对荧光假单胞菌MB214基因组中6,433种预测的ORF之每一种分析它们编码蛋白酶的概率。WellcomeTrustSanger研究所(Cambridge,UK)的研究人员手工安排了MEROPS数据库(Rawlings等2006,http:〃merops.sanger.ac.uk)。它是经由实验室实验以及通过与已知蛋白酶家族的同源性两者而发现的蛋白酶的全面列表。该数据库的强项之一在于MEROPS分级分类方案。在此系统中,将共享相同功能的同系物一起分组成家族(family)。基于进化亲缘关系将家族分组成异种集团(clan),这再次基于相似的结构特征。该方法极大地利用该数据库来鉴定荧光假单胞菌基因组内的蛋白酶同系物。使用蛋白质/蛋白质BLAST来鉴定MEROPS数据库的同系物,其中每种MB214翻译的ORF作为询问,而所有MEROPS蛋白质的数据库作为对象。将那些以显著的同源性匹配询问蛋白质的翻译ORF添加至列表以进一步分析。在此情况中显著的同源性在这里定义为具有le^或更小的e得分,其中允许基于比对长度和质量进行的人判断。此步骤为列表产生109种潜在的蛋白酶。70还通过蛋白质特征家族搜寻程序InterProScan(Quevillon等2005)针对InterPro数据库第7.0版(Mulder等2005)分析所述ORF。由InterProScan软件给ORF指定蛋白质家族以及与那些家族有关的基因本体论(GeneOntology,GO)分类(GeneOntologyConsortium.2004)。使用这些自动GO指定,将所有已经指定含有字符串"肽酶"、"蛋白酶"或"蛋白水解"的GO名称的ORF添加至列表以进行进一步分析。此步骤产生先前步骤中没有鉴定出的另外的70种潜在的蛋白酶。基于其来自含有关键词"肽酶"或"蛋白酶"的先前注释(Ramseier等2001)的安排功能,将更多种ORF添加至列表。此步骤产生先前步骤中又没有鉴定出的32种潜在的蛋白酶。然后分析列表以除去具有低的编码蛋白酶的概率的ORF。再一次,此研究的意图是要非常广泛的,但是通过这些半自动化方法而指定至列表的许多ORF基于有限的标准和人判断可以被容易地鉴定为不编码蛋白酶。排除基因的两种最常见理由是某种ORF实际上是蛋白酶的证据较弱,或者特定基因与已知为蛋白酶同系物但自身不是蛋白酶的另一种蛋白质显示最大的同源性。荧光假单胞菌蛋白酶的最终列表具有90位成员,并显示于表2中。实施例3:折叠调控物和蛋白酶蛋白质的计算机(insilico)细胞位置预测Pfenex表达技术TM的强项之一在于其控制细胞区室的能力,所述细胞区室中可以隔离特定的异源蛋白质。如此,预测其中定位鉴定出的宿主细胞折叠调控物和蛋白酶蛋白质的细胞区室。为了进行这些预测,选择两种程序。PsortB2.0组合12种分开的算法的结果,其预测给定肽的亚细胞位置。大多数算法依赖于检测询问蛋白质和已知亚细胞定位的蛋白质之间的同源性。PsortB还包括诸如HMMTOP和SignalP的算法,它们使用隐蔽马尔科夫模型(HiddenMarkovModel,HMM)分别检测跨膜折叠域或I型分泌信号序列的存在。在PsortB结果外,还使用SignalPHMM来预测I型分泌信号序列的存在。这是必须的,因为PsortB的输出在检测出信号序列但是没有给出指明亚细胞位置的其它具体信息时是含糊的。在这些情况中,PsortB指明蛋白质的亚细胞定位是未知的,因为其确实能隔离至细胞质膜、周质、外膜或胞内区室之任一项。然而,有足够信息知晓的是,该蛋白质可能不定位于胞质中,使其值得在表中记录那种蛋白质。如此,除在那种结果未知的情况中外,表2列出了PsortB算法的结果。在这些情况中,给出单独的SignalPHMM的结果,其中"信号肽"指明检测出信号肽,而"非分泌的"指明没有检测出信号肽。实施例4:能够共it^达折叠调控物的质粒的构建将折叠调控物基因克隆入pCN(Nieto等1990)的质粒衍生物中,pCN与另一种常规用于表达感兴趣的异源蛋白质的质粒是相容的(Squires等2004;Chew等2005)。例示了含有甘露醇诱导型w/^-^/""/C/的质粒的构建。与下文所概述的类似地克隆其它折叠调控物一一在操纵子中组织时为单基因或多基因。采用自荧光假单胞菌MB214分离的基因组DNA(DNeasy;Qiagen,Valencia,CA)作为模板和引物RC199(5-ATATACTAGTAGGAGGTAACTTATGGCTGACGAACAGACGCA陽3,)(SEQIDNO:1)和RC200(5,-ATATTCTAGATTACAGGTCGCCGAAGAAGC-3,)(SEQIDNO:2),使用7yw7^Zw(Stratagene,LaJolla,CA)按照制造商的推荐来扩增gr/^-d"a^/基因。用S/^i和;^gi(限制性位点在上文的引物中加下划线)消化所得的4kbPCR产物,并连接入pDOW1306-6(Schneider等2005b)衍生物pDOW2236中以创建pDOW2240,其含有toc启动子控制下的^7五-^aX7操纵子。然后用6)el和历,7^in消化质粒pDOW2240,并使用Qiaquick(Qiagen,Valencia,CA)对所得的含有gr/^-^o&7的4.0kbDNA片段进行凝胶纯化,并连接入也用S;eI和/7/^/in消化的pDOW2247中,所述pDOW2247是携带荧光假单胞菌甘露醇调控型启动子的pCN的衍生物(Schneider等2005a)。所得的质粒即pDOW3501含有甘露醇启动子控制下的g/7五-^aX7操纵子。然后通过在补充有250ug/ml尿嘧啶的M9葡萄糖板上选择,将质粒pDOW3501转化入DC388和其它尿嘧啶营养缺陷型菌抹中。实施例5:具有蛋白酶基因的基因组删除的焚光假单胞菌菌林的构建如下构建能够创建基因组删除的质粒,即扩增要删除基因5,和3,两端的500-1000bpDNA片段。所得的5,PCR产物通常以要删除基因的翻译起始密码子(ATG或GTG或TGT)结束,而3,PCR产物通常以要删除基因的终止密码子(TAA或TGA或TAG)开始。使用SOEPCR(Horton等1990),经由另一个扩增步骤将这两种PCR产物融合在一起,然后克隆入pDOW1261(图l)(Chew等722005)中。实施例6:对荧光假单胞菌菌林中异源蛋白质表达的高通量培养和分析质粒pDOW2787编码单克隆抗体(单抗)gal2;重链与Pbp分泌前导一起表达,且在toc启动子的控制下。轻链与OprF分泌前导一起表达,且在甘露醇启动子的控制下。将质粒电穿孔入63种携带定向基因删除或pDOW2247的菌抹和5种含有野生型菌抹的对照菌抹的感受态细胞中,所述pDOW2247携带供共表达用的折叠调控物。通过以300rpm摇动将细胞一式多份地在装有具有甘油的生长培养基的深孔块中培养。在24时时用0.lmM异丙基-P-D-硫代吡喃半乳糖苷(IPTG)和l。/。甘露醇诱导蛋白质表达。诱导后第24小时,裂解等分试样,测量抗原的抗原结合以定量活性抗体量。用该数值除以OD6oo以测量纟田月包比活。菌才朱A;rc/、Afifeg尸2、ALa2、Ac/;尸、禾口Aprc2、Aprc2、gr/五c/waX7共表达菌抹A^g、Ac/pX、和A/w7均比对照菌抹高2.4倍或更多倍,其是统计学显著的(p〈0.5)。自Apr7、Atfeg尸2、ALa2和gr;五^a^/共表达菌抹制备可溶性细胞级分,并进行Western分析(图2)。在4种测试菌抹中而不是在对照中检测出大小与完全装配的抗体一致的条带。参考文献Chew,L.C.,T.M.Ramseier,D.M.Retallack,J.C.Schneider,C.H.Squires和H.W.Talbot(2005).Pseudomonasfluorescens.ProductionofRecombinantProteins.NovelMicrobialandEucaryoticExpressionSystems.G.Gellissen.Weinheim,WILEY-VCH:45-66Dolinski,K,Heitman,J.1997.Peptidyl-prolylisomerases-anoverviewofthecyclophilin,FKBPandparvulinfamilies.于GuidebooktoMolecularChaperonesandProtein-FoldingCatalysts.GethingM-J编OxfordUniversityPressInc.,NewYork:359-369Gardy,J丄.,MR.Laird,F.Chen,S.Rey,C丄Walsh,M.Ester,和F.S丄.Brinkman2005PSORTbv.2.0:expandedpredictionofbacterialproteinsubcellularlocalizationandinsightsgainedfromcomparativeproteomeanalysis.Bioinformatics21(5):617-623.GeneOntologyConsortium.2004.TheGeneOntology(GO)databaseandinformaticsresource.NucleicAcidsResearch32:D258-D261.GethingM-J编1997.GuidebooktoMolecularChaperonesandProtein-FoldingCatalysts.OxfordUniversityPressInc.,NewYork.Horton,R.M.,Z.Cai,S.N.Ho和LR.Pease(1990)."Genesplicingbyoverlapextension:tailor-madegenesusingthepolymerasechainreaction,"BioTechniques8(5):528-30,532,534-5Lombardo,M-J,Thanassi,DG,Hultgren,SJ.1997.EscherichiacoliPapD.inGuidebooktoMolecularChaperonesandProtein-FoldingCatalysts.GethingM-J编OxfordUniversityPressInc.,NewYork:463-465MulderNJ,ApweilerR,AttwoodTK,BairochA,BatemanA,BinnsD,BradleyP,BorkP,BucherP,CeruttiL,CopleyR,CourcelleE,DasU,DurbinR,FleischmannW,GoughJ,HaftD,HarteN,HuloN,KahnD,KanapinA,KrestyaninovaM,LonsdaleD,LopezR,LetunicI,MaderaM,MaslenJ,McDowallJ,MitchellA,NikolskayaAN,OrchardS,PagniM,PontingCP,QuevillonE,SelengutJ,SigristCJ,SilventoinenV,StudholmeDJ,VaughanR,WuCH.2005.InterPro,ProgressandStatusin2005.NucleicAcidsRes.33,DatabaseIssue:D201-5.Nieto,C.,E.Femandez陽Tresguerres,N.Sanchez,M.Vicente,口R.Diaz(1990)."Cloningvectors,derivedfromanaturallyoccurringplasmidofPseudomonassavastanoi,specificallytailoredforgeneticmanipulationsinPseudomonas."Gene87(1):145-9.QuevillonE.,SilventoinenV"PillaiS.,HarteN.,MulderN.,ApweilerR.,LopezR.(2005)InterProScan:proteindomainsidentifier.NucleicAcidsResearch33:W116-W120.RamseierTM,S.C.,PayneJ,ChewL,RothmanLD,SubramanianM.2001.ThePseudomonasfluorescensMB214GenomeSequence.CRICRI2001001442;BIOTECH01-007.TheDowChemicalCompany.Ranson,NA,White,HE,Saibil,HR.1998.ChaperoninsBiochem.J.333,233-242.Rawlings,N.D.,Morton,F.R.和Barrett,AJ.2006.MEWOPS:thepeptidasedatabase.NucleicAcidsRes34,D270-D272.74Schneider,J.C.,A.F.Jenings,D.M.Mun,P.M.McGovern和L.C.Chew(2005a)."AuxotrophicmarkerspyrFandproCcanreplaceantibioticmarkersonproteinproductionplasmidsinhigh-cell-densityPseudomonasfluorescensfermentation."BiotechnologyProgress21(2》343-348.Schneider,丄C.,B,Rosner和A.Rubio(2005b).MannitolInducedPromoterSystemsinBacterialHostCells.USA,TheDowChemicalCompany.Squires,C.H.,D.M.Retallack,L.C.Chew,T.M.Ramseier,J.C.Schneider和H.W.Talbot(2004)."HeterologousproteinproductioninP.fluorescens."BioProcessInternational2(11):54-56,58-5975<table>tableseeoriginaldocumentpage76</column></row><table>RXF05073.145RXF04495.288RXF02090137RXF04500.189RXF04567.190RXF04631.291RXF04653.292RXF04657.293RXF04663.194RXF04692.195RXF04693.196RXF04715.197RXF04802.198RXF04808.299RXF04920.1100RXF04923.1101RXF04960.202RXF04968.2103RXF04971.2104RXF05081.1105RXF05113.2106RXF05137.1107RXF05236.1108RXF05379.1109RXF05383.2110RXF05400.2111RXF05615.1112RXF05817.1113RXF05943.1114RXF06281.1115RXF06308.2116RXF06399.2117-RXF06451.1118RXF06564.1119RXF06586.1120RXF06755.2121RXF06993.2122RXF07170.1123RXF07210.1124RXF07879.1125RXF08136.2126RXF08517.1127RXF08627.2128RXF08653.1129RXF08773.1130RXF08978.1131RXFO麵.l132RXF09147.2133RXF09487.1134RXF09831.2135RXF04892.113677说明书中所提及的所有出版物和专利申请指明本发明所属领域中技术人员的水平。本文通过提及而收录所有出版物和专利申请,其程度就像明确且单独指明通过提及而收录每篇单独的出版物或专利申请一样。虽然出于理解清晰的目的,已经通过例示和实施例较为详细地描述了上述发明,但是显而易见的是,可以在所附权利要求书的范围内实施某些变化和改良。78权利要求1.一种阵列,其至少包含荧光假单胞菌细胞的第一群体和第二群体,其中每个群体选自下组a)至少一个如下的荧光假单胞菌细胞群体,其已经进行过遗传修饰以降低至少一种牵涉蛋白质降解的靶基因的表达;b)至少一个如下的荧光假单胞菌细胞群体,其已经进行过遗传修饰以提高至少一种牵涉蛋白质生成的靶基因的表达;和c)至少一个如下的荧光假单胞菌细胞群体,其已经依照(a)和(b)进行过遗传修饰;其中所述阵列中的每个群体是不相同的,且其中每个群体在物理上是彼此分开的。2.权利要求l的阵列,其中所述至少一种牵涉蛋白质降解的靶基因是蛋白酶。3.权利要求2的阵列,其中所述至少一种蛋白酶选自表2中所列出的蛋白酶。4.权利要求l的阵列,其中所述至少一种牵涉蛋白质生成的靶基因是牵涉异源蛋白质的正确蛋白质转录、翻译、加工、或转运的基因。5.权利要求4的阵列,其中所述至少一种靶基因是蛋白质折叠调控物。6.权利要求5的阵列,其中所述蛋白质折叠调控物选自表l中所列出的蛋白质折叠调控物。7.权利要求l-6任一项的阵列,其进一步包含至少一个如下的荧光假单胞菌细胞群体,其尚未进行遗传修饰以提高牵涉蛋白质生成的靶基因或牵涉蛋白质降解的靶基因的表达。8.权利要求1-7任一项的阵列,其中至少一个群体已经进行过遗传修饰以提高两种或更多种牵涉蛋白质生成的靶基因的表达。9.权利要求l-7任一项的阵列,其中至少一个群体已经进行过遗传修饰以降低两种或更多种牵涉蛋白质降解的靶基因的表达。10.权利要求1-9任一项的阵列,其中所述阵列处于有益于高通量筛选所述阵列的形式。11.权利要求10的阵列,其中所述形式是96孔形式。12.权利要求l-ll任一项的阵列,其中至少一个群体在用包含编码至少一种感兴趣异源蛋白质的至少一种基因的表达构建体转化时能够表达所述至少一种感兴趣异源蛋白质。13.—种试剂盒,其包含权利要求1-12任一项的阵列。14.一种用于鉴定对于表达至少一种感兴趣异源蛋白质最佳的荧光假单胞菌宿主细胞的方法,包括a)获得至少包含荧光假单胞菌细胞的第一和第二群体的阵列,其中每个群体选自下组i)至少一个如下的焚光假单胞菌细胞群体,其已经进行过遗传修饰以降低至少一种牵涉蛋白质降解的靶基因的表达;ii)至少一个如下的荧光假单胞菌细胞群体,其已经进行过遗传修饰以提高至少一种牵涉蛋白质生成的靶基因的表达;和iii)至少一个如下的荧光假单胞菌细胞群体,其已经依照(a)和(b)进行过遗传修饰;其中所述阵列中的每个群体是不相同的,且其中每个群体在物理上是彼此分开的;b)向每个群体的至少一个细胞中导入包含编码所述至少一种感兴趣异源蛋白质的至少一种基因的表达盒;c)在足以在至少一个细胞群体中表达所述感兴趣蛋白质的条件下维持所述细胞;并d)选4奪所述感兴.趣异源蛋白质得以生成的最佳纟田月包群体;其中与所述阵列中的其它群体相比,所述感兴趣异源蛋白质在所述最佳的细胞群体中展现出改善的表达、改善的活性、改善的溶解度、改善的转运、或降低的蛋白水解降解之一项或多项。15.权利要求14的方法,其中所述至少一种牵涉蛋白质降解的靶基因是蛋白酶。16.权利要求15的方法,其中所述蛋白酶选自表2中所列出的蛋白酶。17.权利要求14的方法,其中所述至少一种牵涉蛋白质生成的靶基因是牵涉异源蛋白质的正确蛋白质转录、翻译、加工、或转运的基因。18.权利要求17的方法,其中所述至少一种靶基因是蛋白质折叠调控物。19.权利要求18的方法,其中所述蛋白质折叠调控物选自表l中所列出的蛋白质折叠调控物。20.权利要求14-19任一项的方法,其中所述阵列进一步包含至少一个如下的荧光假单胞菌细胞群体,其尚未进行遗传修饰以提高牵涉蛋白质生成的靶基因或牵涉蛋白质降解的靶基因的表达。21.权利要求14-20任一项的方法,其中至少一个群体已经进行过遗传修饰以提高两种或更多种牵涉蛋白质生成的靶基因的表达。22.权利要求14-20任一项的方法,其中至少一个群体已经进行过遗传修饰以降低两种或更多种牵涉蛋白质降解的靶基因的表达。23.权利要求14-22任一项的方法,其中所述阵列处于有益于高通量筛选所述阵列的形式。24.权利要求23的方法,其中所述形式是96孔形式。25.权利要求14的方法,其中所述表达盒进一步包含与所述感兴趣异源蛋白质可操作连接的信号肽。26.权利要求19的方法,其中所述信号肽是分泌信号肽。27.权利要求19的方法,其中所述信号肽对于所述荧光假单胞菌宿主细胞而言是天然的。28.—种用于鉴定对于表达感兴趣异源蛋白质最佳的荧光假单胞菌宿主细胞的方法,包括a)获得至少包含荧光假单胞菌细胞的第一和第二群体的阵列,其中每个群体已经进行过遗传修饰以降低至少一种牵涉蛋白质降解的蛋白质的表达,其中所述阵列中的每个群体是不相同的,且其中每个群体在物理上是彼此分开的;b):容解所述细胞;c)使来自每个细胞群体的溶解物与所述感兴趣异源蛋白质接触;并d)选择最佳的细胞群体;其中所述最佳的细胞群体是如下的群体,其与所述阵列中的其它群体相比导致步骤(c)中对所述感兴趣异源蛋白质的降解水平降低。全文摘要本发明提供了一种阵列,其用于快速鉴定能够以改善的产量和/或质量生成异源蛋白质的宿主细胞群体。该阵列包含一个或多个如下宿主细胞群体,所述宿主细胞群体已经进行过遗传修饰以提高一种或多种牵涉蛋白质生成的靶基因的表达和/或降低一种或多种牵涉蛋白质降解的靶基因的表达。该阵列中的一种或多种菌株可以在周质区室中表达感兴趣的异源蛋白质,或者可以穿过细胞外壁向胞外分泌异源蛋白质。该菌株阵列对于筛选任何感兴趣蛋白质的表达改善是有用的,包括治疗性蛋白质、激素、生长因子、胞外受体或配体、蛋白酶、激酶、血液蛋白质、趋化因子、细胞因子、抗体等。文档编号C12N15/78GK101688213SQ200880022208公开日2010年3月31日申请日期2008年4月25日优先权日2007年4月27日发明者托马斯·M·拉姆塞尔,拉塞尔·J·科尔曼,查尔斯·D·赫什伯格,简·C·施奈德申请人:陶氏环球技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1