宿主细胞修饰的方法与流程

文档序号:13176215阅读:505来源:国知局
1介绍本文描述将核酸序列插入宿主细胞的方法。本文还描述包含插入核酸序列的遗传稳定的宿主细胞和将这样的宿主细胞用于产生蛋白的方法,以及这样的宿主细胞用于糖基化蛋白的用途。2背景单一基因或小DNA片段的重组表达最经常通过在质粒上提供重组基因来进行。质粒可以通过分子生物学技术有效地产生和操作[1]。将它们快速插入宿主细胞中并通过也在环状质粒分子上编码的抗性盒赋予具有质粒的宿主细胞的抗生素选择来维持。通常,重组蛋白使用含有编码该蛋白的基因的质粒来表达。大DNA片段的重组表达具有各种限制。例如标准表达质粒在插入大DNA片段之后经常是遗传不稳定的。经常,使用粘粒(cosmids)和/或F粘粒(fosmids),其含有通过几种机制稳定化插入的DNA的元件,以试图克服质粒不稳定性。进一步,质粒的拷贝数经不同数量级范围,这取决于复制起始点,并且它们可以额外受到生长状态[2]、培养基组成和个体细胞与细胞的差异[3]的影响。此外,仅有有限数量的粘粒和F粘粒可用。因此,通常难于在单一细胞中组合多个大DNA片段。质粒的额外缺点通常是需要选择压力来维持细胞中的附加型元件,无论它们是大质粒或小质粒。选择压力需要使用抗生素,这对于医学产品的生产是不期望的,这是由于针对抗生素的过敏反应的危险以及用于制造的额外成本。此外,选择压力经常不完全,导致产生不均一的细菌培养物,其中一些克隆已丢失质粒,并因此不再产生重组产物[4]。进一步,大DNA片段染色体在宿主细胞中插入是困难的。尽管已使用多种策略来将大DNA片段插入大肠杆菌基因组中[5],但目前已有方法不允许将大于8kb的DNA片段在期望的位点插入宿主细胞基因组中。3概述一个方面,本文提供用于将DNA连续序列、例如大的DNA连续序列插入宿主细胞基因组的方法。这样的DNA序列可包含多种组分,例如基因、启动子、终止子等,并可以选择性地插入宿主细胞基因组中的期望位置处。在某些实施方案中,DNA序列、例如大DNA序列可以选择性地插入宿主细胞基因组的区域,使得宿主细胞表达片段中存在的一种或多种组分(例如基因),例如,宿主细胞表达通常不由该宿主细胞表达的一种或多种组分(例如基因),和/或宿主细胞表达由该宿主细胞天然表达的组分(例如基因),但表达更多这样的组分。插入DNA的方法描述于下面5.1节中。在一个具体实施方案中,本文提供用于将大DNA序列插入宿主细胞基因组的方法,其中所述大DNA序列包含一个、两个、三个、四个、五个、或者更多个基因。在某些实施方案中,根据本文所述的方法插入宿主细胞中的DNA序列中存在的基因在也存在于DNA序列中的一种或多种调节序列或启动子控制下。在某些实施方案中,根据本文所述的方法插入宿主细胞中的DNA序列可以包含对于大DNA序列中存在的基因的表达必要或者有利的额外元件,例如增强子、终止子。在另一个具体实施方案中,本文提供用于将大DNA序列插入宿主细胞基因组的方法,其中所述大DNA序列包含一种或多种操纵子,例如,在共同调节信号或启动子控制下的基因簇。在另一个具体实施方案中,本文提供用于将大DNA序列插入宿主细胞基因组的方法,其中所述宿主细胞基因组进一步具有通常与宿主细胞基因组相关的DNA的缺失,即该方法同时导致异源DNA插入宿主细胞基因组中以及通常存在的DNA从宿主细胞基因组中去除。在具体实施方案中,大DNA序列的插入在DNA序列从同等大小的宿主细胞基因组去除的位点处进行,即宿主细胞基因组的DNA被插入的DNA序列替换。在某些实施方案中,本文所述的方法包括将辅助质粒和供体质粒引入宿主细胞中。如本文所使用,辅助质粒意图涵盖包含将大DNA序列插入宿主细胞基因组所需的元件(例如编码基因)的质粒。根据本文所述的方法,辅助质粒本身不将任何DNA并入宿主细胞基因组中,而是促进本文所述的供体质粒中存在的插入DNA的并入。辅助质粒更详细地描述于下面的5.1.1节。如本文所使用,供体质粒意图涵盖包含待插入宿主细胞基因组中的大DNA序列的质粒,即供体质粒“捐出”自身部分至宿主细胞基因组中(即捐出待插入宿主细胞基因组中的大DNA序列)。在某些实施方案中,本文提供的供体质粒包含大DNA序列插入宿主细胞基因组所需或者有用的其它元件。供体质粒更详细地描述于下面的5.1.2节。在另一个方面,本文提供包含其中已经根据本文所述的方法插入DNA序列、诸如大DNA序列的基因组的宿主细胞(例如原核细胞,例如大肠杆菌)。不受理论所束缚,本文所述的方法可以用于产生遗传稳定的宿主细胞,其能够产生目的蛋白,例如用作疫苗的蛋白、糖基化蛋白、用于化妆品中的蛋白等。由于本文提供的插入方法,这样的宿主细胞不需要在某些标记物、例如抗生素选择标记物存在的情况下进行维持和/或增殖,这是由于包含目的基因的DNA被直接插入宿主细胞基因组中的事实。在某些实施方案中,本文所述的宿主细胞包含其中已经插入一种或多种DNA序列的基因组,其中所述DNA序列编码蛋白或包含参与蛋白的糖基化(例如,蛋白的N-糖基化)的操纵子/基因簇。例如,在某些实施方案中,本文所述的宿主细胞包含其中已经插入以下中的一种或多种的基因组:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,本文提供的宿主细胞包含其中已经插入DNA序列的基因组,其中所述插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第二DNA序列插入其中,其中所述第二插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第三DNA序列插入其中,其中所述第三插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第四DNA序列插入其中,其中所述第四DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供的宿主细胞包含其中已经插入DNA序列的基因组,其中所述插入的DNA序列包含以下中的两种或更多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞的基因组额外地已经将第二DNA序列插入其中,其中所述第二插入的DNA序列包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第三DNA序列插入其中,其中所述第三插入的DNA序列包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供包含供体质粒和辅助质粒的宿主细胞,(a)其中所述辅助质粒包含:(i)在第一启动子控制下的编码lamdared重组酶的开放阅读框;和(ii)在第二启动子控制下的编码限制性内切核酸酶的开放阅读框,所述限制性内切核酸酶具有宿主细胞基因组中不存在的识别序列;以及(b)其中所述供体质粒包含:(i)从5'至3':(1)限制性内切核酸酶的识别序列;(2)至少0.5千碱基(kb)的第一同源区,(3)至少8kb的异源插入DNA;和(4)至少0.5kb的第二同源区;以及(ii)反选择标记物。在一个具体实施方案中,所述识别序列包含至少18个碱基对。在另一个具体实施方案中,所述限制性内切核酸酶为SceI。在一个具体实施方案中,所述异源插入DNA包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。可以插入本文所述的宿主细胞的编码寡糖基转移酶的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是衍生自原核生物的寡糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是来自弯曲菌属的寡糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是来自空肠弯曲菌(Campylobacterjejuni)的寡糖基转移酶核酸序列(例如,来自空肠弯曲菌的pglB基因)。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是衍生自真核生物的寡糖基转移酶核酸序列。可以插入本文所述的宿主细胞的编码糖基转移酶的核酸序列是本领域中已知的。在某些实施方案中,插入本文所述的宿主细胞的糖基转移酶核酸序列是国际专利申请公开号WO2011/138361(其公开内容以其整体通过引用并入本文)中描述的糖基转移酶的核酸序列。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自革兰氏阳性细菌,例如,所述糖基转移酶核酸序列衍生自金黄色葡萄球菌。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列是来自金黄色葡萄球菌的荚膜多糖5的糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列是来自金黄色葡萄球菌的荚膜多糖8的糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自革兰氏阴性细菌,例如大肠杆菌。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自真核生物。可以插入本文所述的宿主细胞的编码差向异构酶的核酸序列是本领域中已知的。在某些实施方案中,插入本文所述的宿主细胞的差向异构酶核酸序列是国际专利申请公开号WO2011/062615(其公开内容以其整体通过引用并入本文)中描述的差向异构酶核酸序列。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的差向异构酶核酸序列是由大肠杆菌菌株O157的Z3206基因代表的差向异构酶核酸序列。参见,例如,WO2011/062615和Rush等人,2009,TheJournalofBiologicalChemistry285:1671-1680,其以其整体通过引用并入本文。可以插入本文所述的宿主细胞的包含rfb基因簇的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的rfb基因簇是来自大肠杆菌的rfb基因簇,例如来自本领域中已知的任何O血清群/O抗原的大肠杆菌rfb簇,例如,O1、O2、O3、O4、O5、O6、O7、O8、O9、O10、O11、O12、O13、O14、O15、O16、O17、O18、O19、O20、O21、O22、O23、O24、O25、O26、O27、O28、O29、O30、O32、O33、O34、O35、O36、O37、O38、O39、O40、O41、O42、O43、O44、O45、O46、O48、O49、O50、O51、O52、O53、O54、O55、O56、O57、O58、O59、O60、O61、O62、O63、O64、O65、O66、O68、O69、O70、O71、O73、O74、O75、O76、O77、O78、O79、O80、O81、O82、O83、O84、O85、O86、O87、O88、O89、O90、O91、O92、O93、O95、O96、O97、O98、O99、O100、O101、O102、O103、O104、O105、O106、O107、O108、O109、O110、O111、O112、O113、O114、O115、O116、O117、O118、O119、O120、O121、O123、O124、O125、O126、O127、O128、O129、O130、O131、O132、O133、O134、O135、O136、O137、O138、O139、O140、O141、O142、O143、O144,O145、O146、O147、O148、O149、O150、O151、O152、O153、O154、O155、O156、O157、O158、O159、O160、O161、O162、O163、O164、O165、O166、O167、O168、O169、O170、O171、O172、O173、O174、O175、O176、O177、O178、O179、O180、O181、O182、O183、O184、O185、O186或O187及其亚血清型。在另一个具体实施方案中,插入本文所述的宿主细胞的rfb基因簇是来自假单胞菌菌株(例如,铜绿假单胞菌(P.aeruginosa)菌株)、沙门氏菌菌株(例如,肠炎沙门氏菌(S.enterica)菌株)、耶尔森氏菌菌株、肺炎克雷伯氏菌菌株、弗朗西斯菌株(例如,土拉热弗朗西斯氏菌(F.tularensis))、鲍氏不动杆菌(Acinetobacterbaumannii)菌株、伯克霍尔德氏菌菌株或志贺氏菌菌株的rfb基因簇。可以插入本文所述的宿主细胞的包含荚膜多糖的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的荚膜多糖基因簇是来自大肠杆菌菌株、链球菌(Streptococcus)菌株(例如,肺炎链球菌(S.pneumoniae)、化脓链球菌(S.pyrogenes)、无乳链球菌(S.agalacticae))、葡萄球菌(Staphylococcus)菌株(例如,金黄色葡萄球菌(S.aureus))或伯克霍尔德氏菌菌株(例如,鼻疽伯克霍尔德氏菌(Bmallei)、类鼻疽伯克霍尔德氏菌(B.pseudomallei)、泰国伯克霍尔德氏菌(B.thailandensis))。可以插入本文所述的宿主细胞的编码载体蛋白的核酸序列是本领域中已知的。由本文所述的宿主细胞产生的载体蛋白包含至少一种N-糖基化共有序列,例如,共有序列(i)Asn-X-Ser(Thr),其中X独立地选自除了Pro以外的任何氨基酸;或(ii)D/E-X-N-Z-S/T,其中X和Z独立地选自除了Pro以外的任何氨基酸。因此,插入本文所述的宿主细胞的编码载体蛋白的DNA序列在载体蛋白核酸序列内包含编码N-糖基化共有序列的至少一种核酸序列。插入本文所述的宿主细胞的编码载体蛋白的DNA序列可以编码本领域中已知的任何载体蛋白,包括下面5.2.1.2节中描述的载体蛋白。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码铜绿假单胞菌的外毒素A(EPA)、包括已经遗传修饰以包含至少一种N-糖基化共有序列的EPA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码霍乱毒素B的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码AcrA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码HlA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码ClfA的核酸序列。在某些实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1、2、3、4、5、6、7、8、9或10。在一个具体实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1或2。在另一个具体实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1。可以根据本文所述的方法使用的示例性原核宿主细胞包括但不限于埃希氏菌种、志贺氏菌种、克雷伯氏菌种、黄单胞菌(Xhantomonas)种、沙门氏菌种、耶尔森氏菌种、乳球菌种、乳杆菌种、假单胞菌种、棒杆菌(Corynebacterium)种、链霉菌种、链球菌种、葡萄球菌种、芽孢杆菌种和梭状芽胞杆菌(Clostridium)种。根据本文所述的方法插入宿主细胞基因组中的DNA(例如异源插入DNA)可以包含选择标记物。在某些实施方案中,当插入DNA(例如异源插入DNA)包含选择标记物时,选择标记物侧接翻转酶识别目标(FRT)位点。在某些实施方案中,第一和第二同源区是与宿主细胞基因组的相邻区域同源的。本文所述的供体质粒的第一和第二同源区可以是对于插入异源插入DNA所需或所期望的任意大小。例如,同源区可以是约或至少0.5kb、0.6kb、0.7kb、0.8kb、0.9kb、1kb、1.1kb、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2.0kb、或者大于2.0kb。在某些实施方案中,第一和第二同源区可以是相同大小的。在某些实施方案中,第一和第二同源区可以是不同大小的。在某些实施方案中,使用本文提供的方法插入本文所述的宿主细胞中的DNA(例如异源插入DNA)在大小上是较大的,例如,DNA(例如异源插入DNA)是不能使用本领域中已知的标准方法插入宿主细胞基因组中的大小。例如,在某些实施方案中,使用本文提供的方法插入本文所述的宿主细胞中的DNA(例如异源插入DNA)是约或至少8kb、9kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb、17kb、18kb、19kb、20kb、21kb、22kb、23kb、24kb、或者25kb。3.1缩写和术语如本文所使用,同源区(缩写为HR)是指本文所述的供体质粒上存在的DNA区域。HR是与意图插入DNA的宿主细胞基因组上存在的DNA区域同源的DNA的区域。在某些实施方案中,HR是与意图插入DNA的宿主细胞基因组上存在的DNA区域至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或99.5%同源的。在某些实施方案中,HR是与意图插入DNA的宿主细胞基因组上存在的DNA区域100%同源的。在某些优选实施方案中,HR是与意图插入DNA的宿主细胞基因组上存在的DNA区域至少99.5%同源的。如本文所使用,目标位点是指与本文所述的供体质粒的同源区互补的、宿主细胞基因组上存在的位点。如本文所使用,异源插入DNA是指使用本文所述的方法插入目标宿主细胞基因组中的本文所述的供体质粒上存在的DNA序列。如本文所使用,在DNA的背景下,插入是指将异源插入DNA引入另一段DNA(例如宿主细胞基因组)中的过程,其导致产生包含异源插入DNA的DNA分子(例如,经修饰的宿主细胞基因组)。如本文所使用,受体细胞是指根据本文提供的方法修饰的宿主细胞,例如,受体细胞包含基因组,该基因组经修饰以包含异源插入DNA。如本文所使用,盒是指DNA序列,其含有基因及其基因功能的表型表达(例如抗生素抗性)所需的调节序列。盒还可含有侧翼序列,所述侧翼序列帮助从受体细胞基因组或者从另一DNA序列(例如质粒)去除所述盒。可与盒相关的示例性侧翼序列包括翻转酶识别目标(FRT)位点。根据本文所述的方法,抗生素选择(例如,表达特定抗生素抗性标记物的宿主细胞的选择)可在生长培养基中使用选择盒和抗生素进行。盒可以通过抗生素缩写和随后针对抗性的大写R进行缩写,例如,ampR是指赋予针对氨苄青霉素(amp)抗性的盒。因此该命名法描述表型而不是基因型。根据本文所述的方法使用的抗生素缩写提供于下面的表6中。如本文所使用,O抗原簇和rfb簇是指负责O抗原生物合成的基因簇[6]。如本文所使用,十一异戊烯醇磷酸酯(Undecaprenolphosphate)缩写为Und-P;以及十一异戊烯醇焦磷酸酯(undecaprenolpyrophosphate)缩写为Und-PP。如本文所使用,脱毒的铜绿假单胞菌外毒素A缩写为EPA。本文所述的EPA可以使用本领域中已知的方法进行脱毒[7]。本文引用来自不同收集的大肠杆菌菌株。在这样的引用中,upecGVXN“编号”、CCUG“编号”和StGVXN“编号”表示来自收集尿路致病性大肠杆菌的流行病学研究、瑞典哥德堡(Goteborg)的培养物收集和GlycoVaxyn菌株收集的菌株,其中“编号”是指分配至菌株的特定编号。4附图简述图1.供体质粒pDOC-C和相关元件的示意图。ampR:编码赋予β内酰胺抗性的基因的DNA盒;sacB:赋予蔗糖敏感性的表达盒;oriT:复制起始点;MCS:多克隆位点;SceI:用于从供体质粒移动DNA的归巢(homing)内切核酸酶限制性位点;DNA插入片段:替换HR1和HR2之间的受体细胞DNA的DNA段;HR1、HR2:同源区1和2,这些是宿主细胞中存在的DNA区域,在此发生交换和同源重组;选择盒:筛选整合克隆的可选择标记物基因,该盒可以侧接位点特异性同源重组位点,这允许去除盒;目的DNA:在选择盒去除之后保留在目标菌株中替换目标菌株DNA的外来DNA。图2.整合程序的方案。该程序的不同步骤通过方括号中的数字标记。使含有辅助质粒、供体质粒(标记pTKRED和pDOC的圆圈)和染色体(涂鸦状)的目标细胞(矩形)生长(1)并用IPTG和阿拉伯糖诱导(2)以诱导同源重组酶lamdared和归巢内切核酸酶SceI(剪刀状)的表达。后者切割pDOC供体质粒并从而移动插入DNA,在细胞内导致产生线性化的插入DNA(3)。线性化的插入DNA是lamdared重组酶的最佳底物,所述酶促进在同源重组位点HR1和2处的交换和同源重组(粗体黑条)。酶促重组通过交叉的细黑线表示(4)。所得菌株含有插入DNA,其替换以前存在于HR1和2之间的DNA。然后通过如文本中所示的不同程序从目标细胞中丢失(“治愈”)辅助和供体质粒。图3.(A)上小图显示供体质粒的大肠杆菌O1rfb簇,且侧翼HRs是用连接至菌株W3110的受体基因组中的目标位点(与插入DNA中的HR区同源的位点)上的细线表示的;斜体显示基因名称,空心箭头表示来自供体质粒的基因,实心箭头表示来自W3110的受体rfb簇,其在整合之后被去除。黑色的窄实心框表示用于通过FLP介导的位点特异性重组去除clmR的位点特异性重组位点。大的实心框表示W3110的wbbL基因,其包括使得菌株W3110O抗原阴性的破坏性插入元件。细箭头和数字表示用于PCR测试和供体质粒克隆的寡核苷酸的退火区和编号。(B)描述证实O1rfb簇存在于细胞中的菌落PCR的结果。下小图是通过电泳在琼脂糖凝胶上分离的PCR测试反应,用GelRedDNA染料染色,并用UV光照射以显现DNA。PCR反应含有寡核苷酸2241和2242(参见A),并重悬对照菌株以及rfb簇插入、waaL缺失和选择盒去除之后的菌株的菌落:1,W3110ΔO16::O1-clmR;2,W3110ΔO16::rfbO1;3,W3110ΔO16::rfbO1ΔwaaL::clmR;4,W3110ΔO16::rfbO1ΔwaaL;5,W3110ΔwaaL;6,W3110。图4.菌株构建的不同阶段的O1-糖表达的测试。整合rfb簇(W3110ΔrfbO16::rfbO1-clmR,小图A)、去除clmR盒(W3110ΔrfbO16::rfbO1,小图B)、waaL破坏(W3110ΔrfbO16::rfbO1ΔwaaL::clmR,小图C)和从waaL缺失体中去除clmR盒(W3110ΔrfbO16::rfbO1ΔwaaL,小图D)之后,蛋白酶K处理的来自大肠杆菌细胞的全细胞提取物。使培养物在LB培养基中生长,在37℃孵育过夜,并通过溶于SDSLämmli样品缓冲液中并与蛋白酶K在65℃孵育1h而处理细胞裂解物。通过SDSPAGE分离提取物,并且使用银染直接显色(以显现LPS,A、C、D上小图),或者通过电转移转移至硝酸纤维素膜上、随后用抗-O1抗血清免疫检测(αO1;A、B、C、D下小图)。将对照进行平行分析(小图A、B:upecGVXN140,它是用来扩增O1rfb簇用于随后整合的临床分离物)。标示泳道编号,并且在黑色框中给出菌株命名。M:标记物泳道,分子量以kDa表示。标记“克隆”的行表示来自实验的不同分析的克隆。图5.通过2AB标记和MS/MS分析来自菌株W3110ΔrfbO16::rfbO1ΔwaaL的大肠杆菌O1O抗原。A.大肠杆菌O1重组O抗原的HPLC分析。将细胞提取物如所述进行处理:水解并纯化来自细胞的干燥有机提取物。从脂质中释放所得Und-PP连接的多糖,进一步纯化,并在还原端用2AB通过还原胺化进行标记。在通过GlycoSepN柱上的正相HPLC分离经标记的多糖之后,测量荧光发射。色谱图(实线)是依赖于洗脱时间的荧光痕迹(菌株W3110ΔrfbO16::rfbO1ΔwaaL)。点状痕迹是不表达O抗原的对照样品(W3110ΔwaaL)。1、2、3、4星号表示对应于1、2、3和4个O抗原重复单元的峰;5星号是6个重复单元分子的片段。B.来自小图A的两星HPLC洗脱级分的MALDI-TOF/TOF分析。对于MS/MS,选择对应于两个O1重复单元Na+离子加合物的预期质量的[m/z]=1849,标示证实预期单糖序列的Y片段离子系列。图6.通过EPA4位点的O1糖基化的插入菌株的EPA-O1糖蛋白的小规模表达测试。如下文实施例中所述,用EPA表达质粒(p659)和五种不同的pglB表达质粒转化大肠杆菌细胞(W3110ΔrfbO16::rfbO1ΔwaaL)。使细胞生长,并在37℃过夜孵育之后用阿拉伯糖和IPTG诱导,收获细胞并制备周质蛋白提取物。然后通过SDSPAGE分离提取物,通过电印迹转移至硝酸纤维素膜,并免疫检测。左小图:使用抗-EPA抗血清的Western印迹,右小图:使用抗-O1抗血清的Western印迹。在泳道上方标示PglB质粒(A,p114:未密码子优化的、含有HA标签的pglB;B,p939:密码子优化的、含有HA标签的;C,p970:密码子优化的、去除HA标签的;D,密码子优化的、含有HA标签的、去除天然糖基化位点N543Q的;和E,密码子优化的、去除HA标签的、去除天然糖基化位点N534Q的);标示分子量标记物泳道大小。图7.在不同构建阶段,来自大肠杆菌O2O抗原缀合物生产菌株的菌株构建的PCR菌落筛选。通过使用特异性寡核苷酸的PCR测试来自文本中所示的插入实验的大肠杆菌细胞的基因分型特征。A.上小图显示供体质粒中的rfb簇,且侧翼HR是用连接至菌株W3110的受体基因组中的目标位点的细线表示的;斜体显示基因名称,空心箭头表示来自供体质粒的基因,实心箭头表示受体rfb簇。黑色的窄实心框表示用于通过FLP介导的位点特异性重组去除clmR的位点特异性重组位点。大的实心框表示W3310的破坏的wbbL基因,包括插入元件。细箭头和数字表示用于PCR测试和供体质粒克隆的寡核苷酸的退火区。B.下小图是GelRed染色的电泳的琼脂糖凝胶,用UV光照射以显现PCR测试反应的产物,以测试waaL的缺失。PCR反应含有寡核苷酸1114和1326,并重悬对照菌株和整合、waaL缺失和选择盒去除之后的菌株的菌落:1,St4043=W3110ΔO16::O2-kanR;2,St4044=W3110ΔO16::O2-kanRΔwaaL::clmR;3,W3110ΔrfbO16::rfbO2ΔwaaL;4W3110ΔwaaL;5,W3110;6,W3110ΔwaaL::clmR。未修饰序列的预期扩增子大小为1.7kb,clmR插入的预期扩增子大小为1.5kb,clmR盒去除之后的预期扩增子大小为0.5kb。图8.菌株构建的不同阶段的O2O抗原表达的测试。整合rfb簇(W3110ΔrfbO16::rfbO2-kanR,小图A)、waaL破坏、随后去除clmR和kanR盒(W3110ΔrfbO16::rfbO2ΔwaaL,小图B)之后的蛋白酶K处理的大肠杆菌细胞全细胞提取物从在LB培养基中生长、在37℃过夜孵育的培养物制备。通过溶于SDSLämmli样品缓冲液中并与蛋白酶K在65℃孵育1h而处理细胞裂解物。然后通过SDSPAGE分离提取物,并且使用银染直接显色(以显现LPS,小图B,左侧),或通过电印迹转移至硝酸纤维素膜,并用抗O2抗血清(αO2)免疫检测,以检测Und-PP连接的O6多糖(Und-PP连接的O抗原,小图A、B右侧)。平行分析对照样品,在大多数情况下是亲本原型菌株。标示泳道编号,并且在黑色框中给出菌株名称。小图A:泳道2含有来自用于通过PCR产生目的DNA的临床分离物(upecGVXN116)的提取物。小图B:泳道2含有waaL缺失之前的插入菌株。图9.通过2AB标记的来自菌株W3110ΔrfbO16::rfbO2ΔwaaL的大肠杆菌O2O抗原表达。如所述处理细胞:水解并纯化来自细胞的干燥有机提取物。通过用2AB在还原末端的还原胺化标记多糖,并通过在GlycoSepN柱上的正相HPLC分析。A.来自菌株W3110ΔrfbO16::rfbO2ΔwaaL的大肠杆菌O2重组O抗原的HPLC分析。色谱图(实线)是依赖于洗脱时间的荧光痕迹。点状痕迹是不表达O抗原的对照样品。1、2、3个星号表示对应于具有与1、2和3个O抗原重复单元一致的洗脱时间的峰的峰。B.小图A中通过两个星号标记的峰级分的MALDI-TOF/TOF分析。对于MS/MS,选择对应于连接Na+离子的两个O2O抗原重复单元的预期质量,且标示证实正确单糖序列的Y片段离子系列。图10.用于EPA4个位点的O2糖基化的整合菌株的小规模测试。如文本中所述,用p659和两种不同的pglB表达质粒转化大肠杆菌细胞(W3110ΔrfbO16::rfbO2ΔwaaL)。使细胞生长,并在37℃过夜孵育之后用阿拉伯糖和IPTG诱导,收获细胞并制备周质蛋白提取物。然后通过SDSPAGE分离提取物,通过电印迹转移至硝酸纤维素膜,并免疫检测。左小图:使用抗EPA抗血清(αEPA)的Western印迹,右小图:使用抗O2抗血清(αO2)的Western印迹。通过大写字母在泳道上方标示质粒(B,密码子优化的、含有HA标签的pglB表达质粒(p939),D,密码子优化的、不含HA标签的(p970)),标示分子量标记物泳道大小。作为对照,分析来自含有p659和p939的临床大肠杆菌分离物upecGVXN124(StGVXN3947)的提取物(x泳道)。图11.在不同构建阶段,来自大肠杆菌O6O抗原缀合物生产菌株的菌株构建的菌落的PCR筛选。通过使用特异性寡核苷酸的PCR针对基因分型特征测试来自实施例中所示的整合实验的大肠杆菌细胞。小图A显示供体质粒中的rfb簇,和连接至W3110基因组中的受体位点中的HR区的细线表示的侧接HR;斜体显示基因名称,空心箭头显示来自供体质粒的基因,实心箭头显示W3110中的受体rfb簇。黑色的窄实心框表示用于通过FLP重组去除kanR的位点特异性重组位点。大的实心框表示W3310的被破坏的wbbL基因。细箭头和编号表示用于PCR测试和供体质粒克隆的寡核苷酸的退火区和编号。下小图(B-D)是GelRed染色的琼脂糖凝胶,其用UV光照射以显现PCR测试反应的产物。PCR反应含有上小图中所示的寡核苷酸,并重悬对照菌株以及整合、waaL破坏和选择盒去除之后的菌株的菌落:1,W3110;2,W3110ΔwaaL;3,W3110ΔrfbO16::rfbO6-kanRΔwaaL;4和5,W3110ΔrfbO16::rfbO6ΔwaaL的两个不同克隆。标示所测试的寡核苷酸对。用于测试5'HR区转换的PCR(小图B)导致产生1.697kb的PCR产物,对于3'HR区转换在存在或不存在kanR盒的情况下为3.6kb或2.3kb(小图C),以及对于O6wzy(c2564)PCR为0.783kb(小图D)。图12.菌株构建不同阶段的O6O抗原表达的测试。整合rfb簇(W3110ΔrfbO16::rfbO6-kanR,图A)、waaL破坏(W3110ΔrfbO16::rfbO6-kanRΔwaaL::clmR,图B)和clmR盒去除(W3110ΔrfbO16::rfbO6-kanRΔwaaL,图C)之后的蛋白酶K处理的大肠杆菌细胞全细胞提取物从生长于LB培养基中、在37℃过夜孵育的培养物中制备。通过将细胞沉淀溶于SDSLämmli样品缓冲液中并与蛋白酶K在65℃孵育1小时而制备细胞裂解物。然后通过SDSPAGE分离提取物,并且使用银染直接显色(以显现LPS,小图B和C,左),或通过电印迹转移至硝酸纤维素膜,并用抗O6抗血清(αO6)免疫检测,以检测脂质连接的O6多糖(O抗原,小图A、B右侧,小图C右侧)。平行分析对照样品,在大多数情况下是所示的直接原型菌株。标示泳道编号,并且在黑色框中给出菌株名称。小图A:泳道3含有来自野生型大肠杆菌O6菌株(CCUG27)的提取物。图13.用于编码4个位点的EPA的O6糖基化的整合菌株的小规模测试。用EPA(p659)和如文本中所述的pglB表达质粒(密码子优化的、含有HA标签的pglB表达质粒,p939)转化大肠杆菌细胞(W3110ΔrfbO16::rfbO6-kanRΔwaaL)。使细胞生长,并用阿拉伯糖和IPTG诱导,在37℃过夜孵育之后收获细胞并制备周质蛋白提取物。然后通过SDSPAGE分离提取物,通过电印迹转移至硝酸纤维素膜,并免疫检测。左小图:使用抗EPA抗血清(αEPA)的western印迹,右小图:使用抗O6抗血清(αO6)的western印迹。图14.不同糖缀合物生产系统的比较分析。用p659和p939(具有C末端HA标签的密码子优化的pglB)转化产生O1(小图A)、O2(小图B)和O6(小图C)O抗原的不同大肠杆菌ΔwaaL细胞,并测试糖缀合物的表达。使表达培养物于补充10mMMgCl2的TB培养基中于37℃下生长。通过添加0.2%阿拉伯糖和1mMIPTG在0.4-1.2的OD600时诱导培养物。在过夜诱导(20小时)之后收获细胞,并通过溶菌酶方法制备周质提取物。然后通过SDSPAGE分离提取物,通过电印迹转移至硝酸纤维素膜,并使用抗EPA抗血清(A、B和C,左小图)和O1、O2或O6抗原特异性抗血清(A、B、C,右小图)免疫检测。宿主细胞是临床大肠杆菌分离物(泳道1)、如本专利申请中所述的插入的W3110细胞(泳道2:A,W3110ΔrfbO16::rfbO1ΔwaaL,B,W3110ΔrfbO16::rfbO2ΔwaaL,C,W3110ΔrfbO16::rfbO6-kanRΔwaaL)、或者含有粘粒(pLAFR)上的相应rfb簇的W3110ΔwaaL细胞(泳道3)。标示分子大小标记物质量,以及用于各Western印迹的探测血清。图15.来自W3110菌株中的类志贺氏邻单胞菌(P.shigelloides)O17rfb簇的整合的菌落的PCR筛选。通过使用特异性寡核苷酸的PCR针对基因分型特征测试来自如文本中所示的整合实验的大肠杆菌细胞。测试两种不同受体菌株,W3110和W3110ΔwecA-wzzEΔwaaL。上小图(A)显示供体质粒中的类志贺氏邻单胞菌rfb簇(具有和不具有wzz)和黑色框中的侧接HR,以及W3110基因组中的目标位点,斜体显示基因名称,空心箭头显示来自供体质粒的基因,空白显示来自受体位点。黑色的窄实心框表示用于通过FLP驱动的位点特异性重组去除clmR的位点特异性重组位点。大的实心框表示W3310的通过插入元件天然破坏的wbbL基因区域。箭头和编号表示退火位置和用于PCR测试的寡核苷酸的名称。测试以下寡核苷酸对:a)1226和1227,用于证实大肠杆菌O16wzy的缺失,导致当wzy缺失时不存在PCR产物,以及当wzy存在时产生0.9kb产物;b)1549和1550,针对类志贺氏邻单胞菌wzy&wbgV的存在,导致产生1.522kb产物;c)1284和1513,针对HR1转换区,导致产生具有wzz的2.545kb产物,以及不具有wzz的克隆的1.103kb产物。B:含有整合菌落裂解物(白色数字)和所示寡核苷酸对的PCR反应混合物的琼脂糖凝胶电泳。O16的wzy的不存在、wzy-wbgV和HR1(5')转换区的存在指示成功整合。标示DNA标记条带大小。验证以下菌株:W3110ΔwecA-wzzEΔwaaLΔrfbO16::rfbPsO17-clmR,不具有wzz:克隆3,W3110ΔwecA-wzzEΔwaaLΔrfbO16::PsO17-clmR,具有wzz,克隆51,W3110ΔrfbO16::rfbPsO17-clmR,不具有wzz,克隆7,以及W3110ΔrfbO16::rfbPsO17-clmR,具有wzz,克隆46。图16.菌株构建的不同阶段的类志贺氏邻单胞菌O抗原表达的测试。将来自插入实验并通过PCR筛选选择的大肠杆菌细胞通过银染(左小图)或者使用宋内志贺氏菌(S.sonnei)抗血清的Western印迹(右小图)测试糖脂产生。W3110ΔwecA-wzzEΔwaaLΔrfbO16::rfbPsO17-clmR,不具有wzz:克隆3(泳道3),W3110ΔwecA-wzzEΔwaaLΔrfbO16::rfbPsO17-clmR,具有wzz,克隆51(泳道4),W3110ΔrfbO16::rfbPsO17-clmR,不具有wzz,克隆7(泳道1),以及W3110ΔrfbO16::rfbPsO17-clmR,具有wzz,克隆46(泳道2)。图17.整合rfp和rfb基因簇替换W3110的rfb簇之后的痢疾志贺氏菌(S.dysenteriae)1型O抗原表达的测试。作为用于插入的目标菌株,使用W3110以及W3110ΔwaaL细胞。通过菌落PCR筛选来自插入实验的大肠杆菌克隆。通过银染(左小图)和针对抗痢疾志贺氏菌1型抗血清的Western印迹(右小图)分析糖脂产生。泳道3、4:整合之后的W3110以及W3110ΔwaaL菌株;泳道1、2:整合并去除clmR盒之后的W3110以及W3110ΔwaaL。图18.通过2AB标记和HPLC分析痢疾志贺氏菌1型O抗原表达。如实施例中所述处理W3110ΔrfbO16::rfbSd1ΔwaaL。色谱图(小图A)是依赖于洗脱时间的荧光痕迹。星号表示对应于具有与2(**)、3(***)和4(****)个O抗原重复单元一致的洗脱时间的峰的峰,如通过MALDI-TOF/TOFMS所分析(小图B)[8,9]。图19.使用p293和p114在W3110ΔrfbO16::rfbSd1ΔwaaL中产生痢疾志贺氏菌1型O抗原糖缀合物。A.SECHPLC分析。B.用于单糖组成分析的PMP标记。使用单糖混合物来校准葡萄糖、鼠李糖和2-N-乙酰氨基葡萄糖的洗脱时间。C.糖缀合物的SDSPAGE分离和通过考马斯蓝染色的检测,以及在电转移至硝酸纤维素膜之后的抗痢疾志贺氏菌1抗血清检测。D.肼解分析。通过肼解将糖蛋白制备中的多糖从蛋白分开,通过2AB标记并通过HPLC分析。收集所示峰,并且MS/MS分析是与2或3个重复单元O抗原结构相一致的。图20.通过gtrII或gtrX交换分支葡萄糖基转移酶gtrS之后的弗氏志贺氏菌(S.flexneri)糖脂表达的测试。A.相关O抗原的重复单元结构。该图显示弗氏志贺氏菌2a和3a的差异在于分支葡萄糖残基的连接位置。抗群II和抗群7、8的抗血清能够区别那些连接位点。B.gtrII整合至W3110基因组中的菌落PCR分析。通过由融合至clmR盒的gtrII组成的扩增子替换gtrS基因。该图显示成功同源重组之后的gtr簇周围的染色体段,仍然存在clmR盒。箭头标示用于菌落PCR的寡核苷酸的退火位置。泳道1(W3110ΔwbbIJKΔgtrS::gtrII-clmR)显示用重组克隆的菌落PCR的结果,泳道2(W3110ΔwbbIJK)为对照。clmR盒侧接dif位点,所述dif位点诱导通过来自大肠杆菌的Xer重组酶通过位点特异性重组盒的剪切。这意味着在菌落PCR中观察到对应于含有和缺乏clmR盒的片段的条带(预期大小为2.8和1.8kb)。对照显示1.6kb的条带,如对于母菌株所预期。C.通过银染(左小图)、抗群II抗血清和抗群7、8抗血清Western印迹(中和右小图),分析在质粒上含有弗氏志贺氏菌2457Trfb簇的W3110大肠杆菌细胞。泳道1:W3110;泳道2:W3110ΔgtrS::gtrII;泳道3:W3110ΔgtrS::gtrX。图21.使用p293和p114在W3110ΔrfbO16::rfbpSf2aΔwaaL中产生弗氏志贺氏菌2a型O抗原糖缀合物。A.糖缀合物的SDSPAGE分离和通过考马斯蓝染色的检测,以及在电转移至硝酸纤维素膜之后的抗II型抗血清检测。B.纯化的EPA糖蛋白的SECHPLC分析。C.用于单糖组成分析的PMP标记。使用单糖来针对葡萄糖、鼠李糖和葡糖胺的洗脱时间进行校准。通过箭头标示洗脱时间。D.肼解分析。通过肼解将糖蛋白制备物中的多糖从蛋白分开,通过2AB标记并通过HPLC分析。收集所示峰,并且MS/MS分析是与2或3个重复单元O抗原结构及其片段相一致的。重要的是,通过MSMS清晰地检测到葡萄糖支链(未显示)。图22.分析来自注射的SpragueDawley大鼠的血清的针对弗氏志贺氏菌2aLPS的IgG效价。显示来自各个体大鼠血清的对数效价。在第三次注射之后2周收获血清。在第三次注射之后(3周后)2周达到抗2aIgG的相应水平,并显示各组之间的统计学差异(根据Mann-Whitney检验)。已经使用酶联免疫吸附测定(ELISA)检测到动物血清的特异性IgG效价。将提取自弗氏志贺氏菌2a菌株ATCC700930的2aLPS吸附至微量培养板的孔。然后通过添加待分析血清的连续稀释物来测定2a抗体效价。在酶促比色反应中使用偶联至抗大鼠/或抗小鼠IgG二抗的辣根过氧化物酶来测定效价。将终点效价定义为高于预免疫合并物平均值+预免疫血清的标准偏差的3倍的最高稀释度,并表示为Log10。图23.在整合PA103O抗原簇之后的铜绿假单胞菌(P.aeruginosa)O11O抗原表达的测试。通过针对抗铜绿假单胞菌群E抗血清的Western印迹分析来自整合实验并通过PCR筛选和表型测试选择的大肠杆菌细胞的糖脂产生。分析整合的目标菌株(泳道1-4)以及源自含有供体质粒p1012(泳道5)和p1013(泳道6)的DH5α细胞的对照提取物。图24.16kb嵌合簇的整合导致产生可以制造重组糖缀合物的细胞,所述16kb嵌合簇由含有替换O11wzy和wbjA的盒(由融合至clmR盒的cap5HIJK基因构成)的铜绿假单胞菌O11rfb簇构成。从过夜生长的细胞制备全细胞提取物,并在SDSLämmli缓冲液中裂解,以及用蛋白酶K处理1小时。使用SDSPAGE从这些样品分离糖脂,并使用银染或者针对抗CP5抗血清的Western印迹来鉴定CP5多糖。泳道1-3:用p471、p477或p498构建的整合克隆。p471含有对应于来自W3110的wecA上游和wzzEORF序列下游的DNA的HR1和2。在W3110宿主细胞中进行插入。还使用供体质粒制备泳道5、6和7中分析的DH5α细胞中的对照提取物(p498、p477或p471);泳道4含有阴性对照(p473)。泳道8代表从含有产生CP5多糖的质粒p393的W3110ΔwecA细胞的提取物制备的阳性对照[10]。图25描述通过MG1655waaL::pglB-galK大肠杆菌宿主菌株产生pglB和O1-EPA的Western印迹分析,所述宿主菌株具有表达O1抗原的质粒和表达EPA的质粒。左小图显示用抗-HIS抗体探测EPA的结果;右小图显示用抗-HA抗体探测pglB的结果。图26描述用于纯化载体蛋白-糖抗原生物缀合物的策略。图27描述在宿主细胞的渗透压冲击之后获得的粗提取物的色谱图,所述宿主细胞包含插入宿主细胞基因组中的pglB且具有产生糖抗原(志贺氏菌O1)和载体蛋白(EPA)的质粒。色谱图描述经第一阴离子交换柱(SourceQ)运行渗透压冲击级分的结果。在粗提取物的合并级分A6-A9中鉴定的O1-EPA描述于考马斯染色的凝胶上(插图)。图28描述获得自经第一SourceQ柱运行蛋白的级分中存在的蛋白的考马斯染色结果,所述蛋白分离自培养的MG1655waaL::pglB-galK大肠杆菌宿主菌株的周质,所述宿主菌株具有表达O1抗原的质粒和表达EPA的质粒。图29描述获得自经第二SourceQ柱运行蛋白的级分中存在的蛋白的考马斯染色结果,所述蛋白分离自培养的MG1655waaL::pglB-galK大肠杆菌宿主菌株的周质,所述宿主菌株具有表达O1抗原的质粒和表达EPA的质粒。图30描述在宿主细胞进行渗透压冲击、经第一阴离子交换柱(SourceQ)运行以及经第二阴离子交换柱(SourceQ)运行之后获得的产物的色谱图,所述宿主细胞包含插入宿主细胞基因组中的pglB且具有产生糖抗原(志贺氏菌O1)和载体蛋白(EPA)的质粒。图31描述获得自经Superdex200柱运行蛋白的级分中存在的蛋白的考马斯染色的结果,所述蛋白分离自培养的MG1655waaL::pglB-galK大肠杆菌宿主菌株的周质,所述宿主菌株具有表达O1抗原的质粒和表达EPA的质粒。图32描述在宿主细胞进行渗透压冲击、经第一阴离子交换柱(SourceQ)运行、经第二阴离子交换柱(SourceQ)运行以及经Superdex200柱运行之后获得的产物的色谱图,所述宿主细胞包含插入宿主细胞基因组中的pglB且具有产生糖抗原(志贺氏菌O1)和载体蛋白(EPA)的质粒。图33(A)通过SDS-PAGE分析来自大肠杆菌菌株W3110ΔrfbO16::rfb2457T,ΔgtrS::gtrII,ΔwaaL,::pO121pglB(泳道1)和含有p114的大肠杆菌菌株W3110ΔrfbO16::rfb2457T,ΔgtrS::gtrII,ΔwaaL(泳道2)的全细胞提取物,且通过Western印迹使用抗-HA抗体检测HA-标记的PglB。(B)在用p150转化的大肠杆菌菌株W3110ΔrfbO16::rfb2457T,ΔgtrS::gtrII,ΔwaaL,::pO121pglB中产生生物缀合物。使用亲和层析从周质提取物纯化EPA。通过SDS-PAGE、随后考马斯蓝染色分析EPA的纯化。(WC:全细胞提取物;PE:周质提取物;FT:不结合至亲和层析柱的流通物;W:亲和柱的洗涤级分;A10-A14:亲和柱的洗脱级分)。图34描述表达寡糖基转移酶、载体蛋白和弗氏志贺氏菌2arfb簇的大肠杆菌菌株的生物缀合物表达产生的生物缀合物(参见分子量标记90-170kDa之间的信号,其对应于弗氏志贺氏菌2a-EPA生物缀合物)。5详述一个方面,本文提供用于将DNA连续序列(包括大的DNA连续序列)插入宿主细胞基因组的方法。这样的DNA序列可包含多种组分,例如基因、启动子、终止子等,并可以选择性地插入宿主细胞基因组中的期望位置处。在某些实施方案中,DNA序列可以选择性地插入宿主细胞基因组的区域,使得宿主细胞表达片段中存在的一种或多种组分(例如基因),例如,宿主细胞表达通常不由该宿主细胞表达的一种或多种组分(例如基因),和/或宿主细胞表达由该宿主细胞天然表达的组分(例如基因),但表达更多这样的组分。插入DNA的方法描述于下面5.1节中。在一个具体实施方案中,本文提供用于将大DNA序列插入宿主细胞基因组的方法,其中所述大DNA序列包含一个、两个、三个、四个、五个、或者更多个基因。在某些实施方案中,根据本文所述的方法插入宿主细胞中的DNA序列中存在的基因在也存在于DNA序列中的一种或多种调节序列或启动子控制下。在某些实施方案中,根据本文所述的方法插入宿主细胞中的DNA序列可以包含对于大DNA序列中存在的基因的表达必要或者有利的额外元件,例如增强子、终止子。在另一个具体实施方案中,本文提供用于将大DNA序列插入宿主细胞基因组的方法,其中所述大DNA序列包含一种或多种操纵子,例如,在共同调节信号或启动子控制下的基因簇。在另一个具体实施方案中,本文提供用于将大DNA序列插入宿主细胞基因组的方法,其中所述宿主细胞基因组进一步具有通常与宿主细胞基因组相关的DNA的缺失,即该方法同时导致异源DNA插入宿主细胞基因组中以及通常存在的DNA从宿主细胞基因组中去除。在具体实施方案中,大DNA序列的插入在DNA序列从同等大小的宿主细胞基因组去除的位点处进行,即宿主细胞基因组的DNA被插入的DNA序列替换。在某些实施方案中,本文所述的方法包括将辅助质粒和供体质粒引入宿主细胞中。如本文所使用,辅助质粒意图涵盖包含将大DNA序列插入宿主细胞基因组所需的元件(例如编码基因)的质粒。根据本文所述的方法,辅助质粒本身不将任何DNA并入宿主细胞基因组中,而是促进本文所述的供体质粒中存在的插入DNA的并入。辅助质粒更详细地描述于下面的5.1.1节。如本文所使用,供体质粒意图涵盖包含待插入宿主细胞基因组中的大DNA序列的质粒,即供体质粒“捐出”自身部分至宿主细胞基因组中(即捐出待插入宿主细胞基因组中的大DNA序列)。在某些实施方案中,本文提供的供体质粒包含大DNA序列插入宿主细胞基因组所需或者有用的其它元件。供体质粒更详细地描述于下面的5.1.2节。在另一个方面,本文提供包含其中已经根据本文所述的方法插入DNA序列(诸如大DNA序列)的基因组的宿主细胞(例如原核细胞,例如大肠杆菌)。不受理论所束缚,本文所述的方法可以用于产生遗传稳定的宿主细胞,其能够产生目的蛋白,例如用作疫苗的蛋白、糖基化蛋白、用于化妆品中的蛋白等。由于本文提供的方法,这样的宿主细胞不需要在某些标记物、例如抗生素选择标记物存在的情况下进行维持和/或增殖,这是由于包含目的基因的DNA被直接插入宿主细胞基因组中的事实。在某些实施方案中,本文所述的宿主细胞包含其中已经插入一种或多种DNA序列的基因组,其中所述DNA序列编码蛋白或包含参与蛋白的糖基化(例如,蛋白的N-糖基化)的操纵子/基因簇。例如,在某些实施方案中,本文所述的宿主细胞包含其中已经插入以下中的一种或多种的基因组:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,本文提供的宿主细胞包含其中已经插入DNA序列的基因组,其中所述插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第二DNA序列插入其中,其中所述第二插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第三DNA序列插入其中,其中所述第三插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第四DNA序列插入其中,其中所述第四DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供的宿主细胞包含其中已经插入DNA序列的基因组,其中所述插入的DNA序列包含以下中的两种或更多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞的基因组额外地已经将第二DNA序列插入其中,其中所述第二插入的DNA序列包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第三DNA序列插入其中,其中所述第三插入的DNA序列包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供包含供体质粒和辅助质粒的宿主细胞,(a)其中所述辅助质粒包含:(i)在第一启动子控制下的编码lamdared重组酶的开放阅读框;和(ii)在第二启动子控制下的编码限制性内切核酸酶的开放阅读框,所述限制性内切核酸酶具有宿主细胞基因组中不存在的识别序列;以及(b)其中所述供体质粒包含:(i)从5'至3':(1)限制性内切核酸酶的识别序列;(2)至少0.5千碱基(kb)的第一同源区,(3)至少8kb的异源插入DNA;和(4)至少0.5kb的第二同源区;以及(ii)反选择标记物。在一个具体实施方案中,所述识别序列包含至少18个碱基对。在另一个具体实施方案中,所述限制性内切核酸酶为SceI。在一个具体实施方案中,所述异源插入DNA包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。可以插入本文所述的宿主细胞的编码寡糖基转移酶的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是衍生自原核生物的寡糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是来自弯曲菌属的寡糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是来自空肠弯曲菌(Campylobacterjejuni)的寡糖基转移酶核酸序列(例如,来自空肠弯曲菌的pglB基因)。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是衍生自真核生物的寡糖基转移酶核酸序列。可以插入本文所述的宿主细胞的编码糖基转移酶的核酸序列是本领域中已知的。在某些实施方案中,插入本文所述的宿主细胞的糖基转移酶核酸序列是国际专利申请公开号WO2011/138361(其公开内容以其整体通过引用并入本文)中描述的糖基转移酶的核酸序列。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自革兰氏阳性细菌,例如,所述糖基转移酶核酸序列衍生自金黄色葡萄球菌。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列是来自金黄色葡萄球菌的荚膜多糖5的糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列是来自金黄色葡萄球菌的荚膜多糖8的糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自革兰氏阴性细菌,例如大肠杆菌。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自真核生物。可以插入本文所述的宿主细胞的编码差向异构酶的核酸序列是本领域中已知的。在某些实施方案中,插入本文所述的宿主细胞的差向异构酶核酸序列是国际专利申请公开号WO2011/062615(其公开内容以其整体通过引用并入本文)中描述的差向异构酶核酸序列。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的差向异构酶核酸序列是由大肠杆菌菌株O157的Z3206基因代表的差向异构酶核酸序列。参见,例如,WO2011/062615和Rush等人,2009,TheJournalofBiologicalChemistry285:1671-1680,其以其整体通过引用并入本文。可以插入本文所述的宿主细胞的包含rfb基因簇的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的rfb基因簇是来自大肠杆菌的rfb基因簇,例如来自本领域中已知的任何O血清群/O抗原的大肠杆菌rfb簇,例如,O1、O2、O3、O4、O5、O6、O7、O8、O9、O10、O11、O12、O13、O14、O15、O16、O17、O18、O19、O20、O21、O22、O23、O24、O25、O26、O27、O28、O29、O30、O32、O33、O34、O35、O36、O37、O38、O39、O40、O41、O42、O43、O44、O45、O46、O48、O49、O50、O51、O52、O53、O54、O55、O56、O57、O58、O59、O60、O61、O62、O63、O64、O65、O66、O68、O69、O70、O71、O73、O74、O75、O76、O77、O78、O79、O80、O81、O82、O83、O84、O85、O86、O87、O88、O89、O90、O91、O92、O93、O95、O96、O97、O98、O99、O100、O101、O102、O103、O104、O105、O106、O107、O108、O109、O110、O111、O112、O113、O114、O115、O116、O117、O118、O119、O120、O121、O123、O124、O125、O126、O127、O128、O129、O130、O131、O132、O133、O134、O135、O136、O137、O138、O139、O140、O141、O142、O143、O144,O145、O146、O147、O148、O149、O150、O151、O152、O153、O154、O155、O156、O157、O158、O159、O160、O161、O162、O163、O164、O165、O166、O167、O168、O169、O170、O171、O172、O173、O174、O175、O176、O177、O178、O179、O180、O181、O182、O183、O184、O185、O186或O187及其亚血清型。在另一个具体实施方案中,插入本文所述的宿主细胞的rfb基因簇是来自假单胞菌菌株(例如,铜绿假单胞菌菌株)、沙门氏菌菌株(例如,肠炎沙门氏菌菌株)、耶尔森氏菌菌株、肺炎克雷伯氏菌菌株、弗朗西斯菌株(例如,土拉热弗朗西斯氏菌)、鲍氏不动杆菌菌株、伯克霍尔德氏菌菌株或志贺氏菌菌株的rfb基因簇。可以插入本文所述的宿主细胞的包含荚膜多糖的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的荚膜多糖基因簇是来自大肠杆菌菌株、链球菌(Streptococcus)菌株(例如,肺炎链球菌(S.pneumoniae)、化脓链球菌(S.pyrogenes)、无乳链球菌(S.agalacticae))、葡萄球菌(Staphylococcus)菌株(例如,金黄色葡萄球菌(S.aureus))或伯克霍尔德氏菌菌株(例如,鼻疽伯克霍尔德氏菌(Bmallei)、类鼻疽伯克霍尔德氏菌(B.pseudomallei)、泰国伯克霍尔德氏菌(B.thailandensis))。可以插入本文所述的宿主细胞的编码载体蛋白的核酸序列是本领域中已知的。由本文所述的宿主细胞产生的载体蛋白包含至少一种N-糖基化共有序列,例如,共有序列(i)Asn-X-Ser(Thr),其中X独立地选自除了Pro以外的任何氨基酸;或(ii)D/E-X-N-Z-S/T,其中X和Z独立地选自除了Pro以外的任何氨基酸。因此,插入本文所述的宿主细胞的编码载体蛋白的DNA序列在载体蛋白核酸序列内包含编码N-糖基化共有序列的至少一种核酸序列。插入本文所述的宿主细胞的编码载体蛋白的DNA序列可以编码本领域中已知的任何载体蛋白,包括下面5.2.1.2节中描述的载体蛋白。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码铜绿假单胞菌的外毒素A(EPA)(包括已经遗传修饰以包含至少一种N-糖基化共有序列的EPA)的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码霍乱毒素B的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码AcrA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码HlA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码ClfA的核酸序列。在某些实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1、2、3、4、5、6、7、8、9或10。在一个具体实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1或2。在另一个具体实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1。在某些实施方案中,本文提供的宿主细胞包含基因缺失,其中目的DNA序列已经在基因缺失位点插入宿主细胞基因组。在一个具体实施方案中,本文提供的宿主细胞是具有waaL基因的缺失的大肠杆菌。在一个具体实施方案中,将编码寡糖基转移酶的DNA序列在waaL基因缺失的位点插入大肠杆菌宿主细胞中。在另一个具体实施方案中,本文提供的宿主细胞是具有wecG基因的缺失的大肠杆菌。在一个具体实施方案中,将编码载体蛋白的DNA序列在wecG基因缺失的位点插入大肠杆菌宿主细胞中。在另一个具体实施方案中,本文提供的宿主细胞是具有waaL基因的缺失和具有wecG基因的缺失的大肠杆菌,其中将寡糖基转移酶在缺失的waaL基因的位点插入大肠杆菌宿主细胞且其中将载体蛋白(例如,包含N-糖基化共有序列的EPA)在缺失的wecG基因的位点插入大肠杆菌宿主细胞。5.1DNA插入的方法该(5.1)节中详述将DNA序列(包括大DNA序列)(即异源插入DNA)插入宿主细胞的基因组的新型方法。本领域技术人员将理解,该节中描述的方法具有几个优点并允许宿主细胞(例如原核宿主细胞)的产生,所述宿主细胞可以用于商品(包括疫苗)的生物学生产。根据本文所述的方法产生的遗传学稳定的宿主细胞具有的示例性优点包括,但不限于,(i)对于染色体插入的DNA,选择压力是不必要的;(ii)严格调节异源插入DNA内的基因拷贝数,和(iii)宿主细胞基因组中的异源插入DNA经宿主细胞增殖多代保持稳定。这样的稳定宿主细胞对于例如工业发酵是有用的。在某些实施方案中,使用本文所述的方法将DNA的序列(例如,DNA的大的连续序列)引入宿主细胞(例如,大肠杆菌)(参见下文)。在某些实施方案中,使用下面5.1.6节中描述的一种或多种方法将DNA的序列引入宿主细胞(例如,大肠杆菌)。本领域技术人员将容易理解,本发明的方法可以通过修饰方法中所使用的各种组分进行实施。例如,本文所述的供体质粒和辅助质粒可包含多种不同元件,只要它们在本文所述的方法中保持功能性。对本文所述的供体质粒、本文所述的辅助质粒和本文所述的宿主细胞的示例性修饰在5.1.1节及其之后呈现。在示例性实施方案中,将大DNA序列(即异源插入DNA)插入宿主细胞基因组的方法包括使用(i)供体质粒和(ii)辅助质粒,所述供体质粒包含(a)侧接同源区(HR)例如长同源区(例如,任意适当大小(例如,0.4-2.0kb)的HR)的异源插入DNA,其引导宿主细胞基因组中的重组位点(使用这样的HR增加插入效率),以及(b)抑制包含供体质粒的宿主细胞生长的反选择标记物,所述供体质粒即在供体质粒引入宿主细胞后未整合的供体质粒(使用反选择标记物消除假阳性克隆[11]);所述辅助质粒包含编码lambdared重组酶的开放阅读框和编码限制性内切核酸酶的开放阅读框,所述酶具有宿主细胞基因组中不存在的识别序列(例如,SceI限制性内切核酸酶)。在辅助质粒中,编码lambdared重组酶的开放阅读框和编码限制性内切核酸酶的开放阅读框(所述酶具有宿主细胞基因组中不存在的识别序列(例如SceI限制性内切核酸酶)),可在不同启动子(例如,第一启动子和第二启动子)控制下用于开放阅读框产生的蛋白的一致表达[12]。供体质粒也可包含辅助质粒中存在的限制性内切核酸酶的识别序列。本文所述的方法允许一个接一个的多轮插入,即首先大DNA插入片段可以在一个位置插入,并且之后可以使用相同方法进行更多插入。这些连续插入可靶向至宿主细胞基因组的任何部分,即也靶向至先前插入的DNA或者宿主细胞中存在的原始染色体序列。此外,该方法与其它插入方法相容,如根据Datsenko和Wanner的同源重组(DatsenkoKA,WannerBL:One-stepinactivationofchromosomalgenesinEscherichiacoliK-12usingPCRproducts.ProcNatlAcadSciUSA2000,97(12):6640-6645.)。本文所述的方法的插入步骤,即异源插入DNA插入宿主细胞基因组的步骤,基于同源DNA段的体内同源重组或交换。在同源重组期间,一个DNA同源物必须在目标位点中,且一个在供体构建体(即供体质粒)中。根据本文所述的方法,可将插入所需元件引入宿主细胞中,例如,引入引入宿主细胞中的一个或多个质粒。本领域技术人员将容易理解如何将质粒引入宿主细胞中,且如此做的示例性方法提供于下面的5.1.3节中。可将异源插入DNA插入宿主细胞基因组中的方法可包括多个步骤。例如,在进行该方法之前,可需要工程改造供体质粒和/或辅助质粒。进一步,可在插入方法之前或期间进行宿主细胞的修饰。本领域技术人员将容易理解,基于期望插入给定宿主细胞中的异源插入DNA,需要进行哪些步骤。通常,本文所述的异源插入DNA插入宿主细胞的方法可包括以下步骤的一些或全部:(1)制备供体质粒。将期望的异源插入DNA序列(即包含一个或多个目的基因的异源插入DNA序列)克隆至适于用作供体质粒的质粒的克隆位点(例如,多克隆位点,缩写为MCS)中(参见5.1.2节)。将适于用作同源区的DNA序列(即与宿主细胞基因组上的插入位置同源的DNA序列)也克隆至供体质粒中,使得同源区侧接异源插入DNA。供体质粒的这些克隆和组装方法可以根据任何确定和众所周知的技术进行,以修饰和合成DNA,诸如但不限于,使用限制酶和连接酶的分子克隆、转座酶、化学合成等,所述技术是本领域技术人员已知的[1]。此外,在某些实施方案中,将包含编码赋予抗生素抗性的蛋白的开放阅读框的选择盒定位于同源臂之间。包含插入其基因组中的异源插入DNA的宿主细胞可以通过在包含抗生素的培养基上培养它们而鉴定,选择盒的抗生素抗性基因提供对所述抗生素的抗性。在某些实施方案中,选择盒可侧接FRT位点[13],这允许在以后通过定点重组而去除盒。以该方式将FRT位点并入供体质粒、因此确保选择盒不会保持整合在宿主细胞基因组中。在另一个实施方案中,可以在整合之后经由dif位点介导的定点同源重组[14]或者通过其它定点染色体诱变技术去除选择盒。还工程改造本文所述的供体质粒以包含编码反选择蛋白的开放阅读框。编码本领域技术人员已知适用于反选择方法中的蛋白的任何基因都可以并入本文所述的供体质粒中。在一个具体实施方案中,sacB基因用于反选择。还工程改造本文所述的供体质粒以包含复制起始点。本领域技术人员将容易理解,并入供体质粒中的复制起始点应当适用于正在进行基因组修饰的宿主细胞中。例如,当在大肠杆菌中进行克隆时,必须存在大肠杆菌复制起始点。在一个具体实施方案中,复制起始点是oriT。本领域技术人员将容易理解,可以使用本领域中已知的方法产生穿梭质粒(即能够在多种宿主细胞(例如,多种细菌种)中复制的质粒),并且这样的质粒可用来插入许多类型的宿主细胞中,例如原核细胞、古细菌细胞、真细菌细胞、或者真核细胞。这样的穿梭质粒可包含生物特异性表达控制元件和复制起始点。(2)制备辅助质粒。工程改造辅助质粒以编码用于介导DNA插入本文所述的宿主细胞中,以及用于在进行重组的宿主细胞内维持辅助质粒的所有必需活性。在某些实施方案中,本文所述的辅助质粒包含(i)用于宿主细胞中的质粒维持的选择盒,(ii)用于表达重组酶的调节子,所述重组酶即支持和增强同源DNA段之间的交换效率的一种或多种酶,(iii)用于表达功能的调节子,所述功能线性化DNA插入片段,导致产生可以进行同源重组的末端同源序列,(iv)为不具有自己的recA拷贝的宿主细胞表达RecA同源物的调节子,和(v)条件复制起始点。在下文更详细描述这些元件。在某些实施方案中,用于根据本文所述的方法中的辅助质粒包含类似于辅助质粒pTKRED(GenebankGU327533.1;[12])的组分。在一个具体实施方案中,将辅助质粒pTKRED(GenebankGU327533.1;[12])用于本文所述的方法中。(3)将供体质粒和辅助质粒引入相同宿主细胞中。可以通过本领域技术人员已知的许多不同技术进行供体和辅助质粒的插入,所述技术包括但不限于,电穿孔、使用化学感受态细胞、热休克和噬菌体转导。然后可以将宿主细胞在选择性条件培养,以富集携带所引入质粒的细胞。(4)开始插入程序。示例性插入程序包括以下步骤:可以在例如30℃下于培养基中过夜生长阳性克隆(即包含辅助和供体质粒两者的宿主细胞)的培养物,所述培养基包含用于选择的适当抗生素(这样的抗生素可以容易地由本领域技术人员基于供体/辅助质粒中存在的选择盒进行选择)。然后可以将培养基稀释,并在例如30℃下生长,直至适当抗生素存在的情况下的指数阶段。在这些条件下,辅助和供体质粒得到维持,但沉默。接下来,将培养基用含有用于选择的抗生素以及质粒中存在的条件性元件(例如可诱导启动子或者条件复制起始点)的任何诱导物的培养基替换,随后进一步孵育细胞。在这段时间,表达辅助质粒中的限制性内切核酸酶(例如SceI)和辅助质粒中的重组酶(例如lambdared重组酶),导致供体质粒在同源臂处的切割,以及同源DNA在宿主细胞基因组中的同源位点处的同源重组(参见图2)。接下来,在含有供体质粒反选择标记物对应的组分(例如蔗糖,如果反选择标记物是sacB)的培养基上将细胞铺板。该步骤导致产生包含供体质粒的细胞(即供体质粒以未插入状态存在的细胞)的反选择。这样的培养基还包含供体质粒插入盒中存在的抗性标记物(即存在于供体质粒HR之间的抗生素抗性盒),以选择含有异源插入DNA的细胞。在过夜孵育之后,然后针对显示与(i)丢失辅助和供体质粒和(ii)存在异源DNA插入片段一致的抗生素抗性表型的重组克隆筛选细胞。本领域技术人员将理解,可以使用标准实验方法改良前述条件。例如,可以基于所使用的特定宿主细胞、所使用的选择和反选择标记物等,改变某些条件。示例性插入菌株呈现于表1和2中。在一个具体实施方案中,将DNA插入宿主细胞中的方法包括以下:将阳性克隆(即含有辅助和供体质粒)的过夜培养物在含有选择抗生素(spec和供体质粒的一种或两种可选择标记物)的液体LB培养基中于30℃下生长,稀释至0.05的OD600并在壮观霉素和DNA插入片段选择标记物(kanR或clmR)存在的情况下于30℃生长直至指数阶段。在这些条件下,辅助和供体质粒得到维持,但沉默。然后,将培养基用含有选择抗生素、0.2%阿拉伯糖和1mMIPTG的LB培养基替换,并将细胞进一步于30℃下孵育几个小时(2、4、6、8小时)。在该时间期间,表达SceI和Red重组酶蛋白,导致供体质粒在同源臂处的切割,和同源DNA在基因组同源位点处的同源重组(图2)。然后,将细胞在含有10%蔗糖(以反选择含有供体质粒的细胞)和插入盒中存在的抗性标记物(kanR或clmR)的LB培养基上铺板,以选择仍然含有DNA插入片段的细胞。其它选择和反选择标记物可能需要调整条件。在37-42℃下过夜孵育之后,针对显示与(i)丢失辅助质粒和ii)供体质粒以及(iii)存在DNA插入片段一致的抗生素抗性表型的重组克隆筛选细胞。将克隆复制铺板在补充amp、spec和kan或clm的LM上,以筛选敏感性菌落。指示可能含有DNA插入片段的候选细菌菌落的组合表型是:对氨苄青霉素的敏感性(指示供体质粒的丢失);壮观霉素敏感性(指示辅助质粒的丢失);Clm或kan抗性(指示DNA插入片段的存在)。如下面的工作实施例中所证实,使用前述方法来将包含O抗原和荚膜多糖簇的异源DNA序列插入大肠杆菌基因组的特定位置中,而同时在过程中从大肠杆菌基因组中去除了天然地先前存在的O抗原和荚膜簇。使用所得宿主细胞产生由在所述宿主细胞的周质间隙中表达的载体蛋白组成的糖蛋白,所述载体蛋白在特定位点含有共价连接的O抗原多糖。本领域技术人员将容易理解,可以应用这样的方法来将任何期望的异源DNA序列插入宿主细胞中。5.1.1辅助质粒本文所述且根据本文所述的方法使用的辅助质粒编码用于介导DNA插入且用于将辅助质粒在进行重组的宿主细胞中维持必需时间段的所有必需组分,所述细胞即通过本文所述的方法插入异源DNA的宿主细胞。以下是可以引入本文所述的辅助质粒中的某些组分。5.1.1.1选择标记物将可选择标记物引入本文所述的辅助质粒中,以确保辅助质粒适当引入如本文所述修饰的宿主细胞中。具体而言,可以使用可选择标记物来选择已在转化之后接受质粒的宿主细胞,并且在重组程序期间维持质粒。许多选择系统是本领域中已知的,并且是本领域技术人员可获得的。实例包括但不限于基因盒,其赋予(i)对抗生素(例如,amp、kan、spec、clm、gen、tmp、tet)的抗性[15];(ii)在选择培养基上的生长,例如,营养缺陷型标记系统(RégisSodoyer,VirginieCourtois,IsabellePeubezandCharlotteMignon(2012).Antibiotic-FreeSelectionforBio-Production:MovingTowardsaNew\GoldStandard\,AntibioticResistantBacteria-AContinuousChallengeintheNewMillennium,MarinaPana(Ed.),ISBN:978-953-51-0472-8,InTech,可获得自:http://www.intechopen.com/books/antibiotic-resistant-bacteria-a-continuous-challenge-in-the-new-millennium/antibiotic-free-selection-for-bio-production-moving-towards-a-new-gold-standard),(iii)毒素-抗毒素系统,以及(iv)对抗微生物剂如例如三氯生(triclosan)的抗性[16]。下面的表6还提供可以用于选择的抗生素列表。在一个具体实施方案中,壮观霉素抗性盒用于辅助质粒选择,即用于维持目标细胞中的辅助质粒。5.1.1.2重组酶本文所述的辅助质粒包含重组酶,以支持DNA同源部分的交换(同源重组)和再连接。可以根据本文所述的方法使用的示例性重组酶包括但不限于lambdared重组酶、来自Rac原噬菌体的RecE/RecT[17]和来自细菌噬菌体lambda的RedαβΔ[18-20]。在一个具体实施方案中,用于本文所述的辅助质粒中的重组酶是lambdared重组酶。在另一个具体实施方案中,lambdared重组酶在lac启动子的控制下。Lambdared重组酶催化同源重组反应(交换),并由由质粒上的三个开放阅读框编码的三个功能亚单位组成。第一个基因是gam,其为宿主核酸酶抑制蛋白Gam家族的成员。Gam蛋白抑制RecBCD核酸酶,并在细菌和细菌噬菌体两者中发现。第二个基因是beta,并编码RecT家族的蛋白。RecT蛋白是DNA单链退火蛋白(SSAPs),诸如RecT、Red-beta、ERF和Rad52,并在RecA依赖的和RecA不依赖的DNA重组途径中起作用。第三个基因是exo基因,其编码YqaJ样病毒重组酶结构域蛋白。该蛋白家族在许多不同细菌种中发现,但是病毒来源的。该蛋白形成寡聚体并作为进行性的碱性外切核酸酶发挥功能,其在Mg(2+)依赖的反应中消化线性双链DNA。它对5'-磷酸化DNA末端具有优先性。这三种蛋白促进大肠杆菌和其它生物中的同源重组事件。在某些实施方案中,辅助质粒上存在的重组酶在除了lac启动子以外的启动子的控制下。这样的其它启动子可包括但不限于araBAD启动子[21]、鼠李糖启动子[22]、热诱导型启动子[23]、水杨酸启动子[24]、四环素启动子[25]等。5.1.1.3内切核酸酶辅助质粒上的内切核酸酶线性化供体质粒,并由此移动DNA插入片段。因此本文所述的给定方法中使用的供体质粒具有辅助质粒上存在的限制性内切核酸酶的识别序列。通过重组酶的同源重组依赖于单链DNA插入片段末端作为底物与目标位点进行配对。因此,线性化(即产生双链末端)是活化DNA插入片段的重要步骤。开放的双链DNA末端被酶促消化成单链,然后单链是配对和重组的实际底物。本文所使用的内切核酸酶可在宿主细胞的细胞质中起作用,由此它们可切割供体质粒,但不应影响宿主细胞染色体稳定性。通常,任何限制酶或DNA双链切割物都可以用于本文所述的方法中,只要它不切割宿主细胞基因组DNA。在具体实施方案中,可以使用在细胞质中起作用并靶向长且稀有的识别位点的内切核酸酶,因为这样的内切核酸酶通过具有稀有识别序列而是高度位点特异性的。例如,可以选择具有大于15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30个碱基对识别位点的识别序列的内切核酸酶用于本文所述的方法中。在一个具体实施方案中,将归巢内切核酸酶用于本文所述的方法中。归巢内切核酸酶是由内含子编码的特殊类型的限制酶或内含肽类。它们包含不同结构组,例如LAGLIDADG(SEQIDNO:1)、GIY-YIG(SEQIDNO:2)、H-N-H和His-Cys盒家族。归巢内切核酸酶的示例性列表在下面的表4中给出。本文所使用的内切核酸酶可以存在于辅助质粒上,使得它们在也存在于辅助质粒上的诱导型启动子的控制下。在一个具体实施方案中,由本文所述的辅助质粒编码的内切核酸酶是SceI。SceI是LAGLIDADG(SEQIDNO:1)DNA内切核酸酶家族的成员。这是由DNA移动元件编码的位点特异性DNA内切核酸酶的家族。在功能上,SceI是切割18碱基对识别序列TAGGGATAACAGGGTAAT(SEQIDNO:3)的归巢限制性内切核酸酶,其从不存在于大肠杆菌基因组中。特定的、稀有的且长的识别序列对于其在本发明中的应用是关键的。在某些实施方案中,SceI在诱导型启动子例如阿拉伯糖启动子的控制下。5.1.1.4RecARecA是细菌酶,其在同源重组、DNA修复和SOS应答的诱导方中具有作用。RecA将ATP水解与DNA链交换相偶联,即它催化实际的重组反应。为了如本文所述的重组目的,recA活性必须存在于宿主细胞中。然而,在大多数情况下,野生型宿主细胞基因组中存在的拷贝足以发生重组。因此,无需将recA引入内源表达recA的宿主细胞中。在不表达recA的宿主细胞中,可以在辅助质粒上将recA引入宿主细胞中。RecA同源物存在于几乎每种生物中。因此,本领域技术人员将理解,任何recA功能基因都可以根据本文所述的方法使用,即或者基于其在宿主细胞中的天然存在使用,或者通过将recA功能引入宿主细胞(例如天然不包含recA的宿主细胞)中使用。5.1.1.5条件复制起始点复制起始点是辅助质粒的DNA复制以及在细胞分裂期间将质粒拷贝分布到子细胞中所需的。条件复制起始点可以用来增加或减少细胞中的质粒拷贝数。例如,温度敏感性复制起始点可以用于本文所述的方法中。这样的复制起始点在高于37℃的温度下是无功能的,导致了质粒丢失。其它条件复制起始点是本领域中已知的,并可以与本文所述的方法一起使用[26]。条件复制起始点的示例性列表提供于表5中。在一个具体实施方案中,本文使用的复制起始点是温度敏感性pSC101复制起始点[27],其导致在高温下生长后质粒的丢失。可以使用的其它复制起始点包括来自pMB1、ColE1、R100、IncW和其它的那些(参见例如[28])。5.1.1.6诱导型启动子和诱导物控制辅助质粒功能的能力对于在细胞生长期间降低重组活性到有限时间是重要的,因为如果促进连续重组,则可能发生不需要的副反应。因此,可采用诱导型启动子和诱导物来确保辅助质粒的某些组分仅在期望时才表达。示例性诱导型启动子包括但不限于araBAD启动子系统(通过阿拉伯糖的存在可诱导)和tac启动子(通过IPTG的存在可诱导)。表7提供可以根据本文所述的方法使用的诱导型组分的进一步列表。5.1.2供体质粒本文所述的供体质粒为宿主细胞“捐出”期望的异源插入DNA序列,导致产生具有稳定整合的异源插入DNA的宿主细胞。在一个具体实施方案中,本文所述的方法中使用的供体质粒基于质粒pDOC-C(GenebankGQ889494.1;[11])。pDOC-C是pEXT100T的衍生物[29]。所述质粒含有用于选择的氨苄青霉素抗性基因(ampR)、用于复制的起始点(oriT)和sacB基因。SacB是来源于枯草芽孢杆菌的果聚糖蔗糖酶(levansucrase)操纵子的分泌蛋白。在蔗糖存在的情况下,sacB赋予致死性。因此,通过简单地将蔗糖添加至培养基中,可以使用sacB作为系统来针对具有质粒的细胞进行反选择[30]。此外,pDOC-C编码侧接SceI位点的多克隆位点,用于体内线性化。以下是可以引入本文所述的辅助质粒中的某些组分。5.1.2.1选择标记物存在于本文所述的供体质粒上的选择标记物可选自如上述5.1.1.1节所提供的相同列表,以及下面表6中所列举的那些。还可以使用其它选择系统,例如基于营养缺陷型标记物的选择系统可对于选择插入事件是有用的。当受体菌株在使菌株营养缺陷(即其生长依赖于某些培养基组分)的基因中含有缺失时,该基因可包括在DNA插入片段中。在一个具体实施方案中,供体质粒包含clmR和/或kanR盒。5.1.2.2异源插入DNA本领域技术人员将容易理解,任何基因或基因组合都可以包括在异源插入DNA中,并随后使用本文所述的方法插入宿主细胞基因组中。在一个具体实施方案中,插入本文所述的宿主细胞中的异源插入DNA包含基因簇。在一个具体实施方案中,基因簇是编码荚膜多糖的基因簇。在另一个具体实施方案中,基因簇是编码O抗原的基因簇。可以使用包含这样的插入基因簇的宿主细胞例如来合成可以用作疫苗的重组糖蛋白产品。本领域技术人员将理解,本发明允许将大DNA序列稳定插入宿主细胞基因组中。例如,DNA序列可包含1kb直至40kb。在某些实施方案中,异源插入DNA大于8kb、9kb、10kb、11kb、12kb、13kb、14kb、15kb、16kb、17kb、18kb、19kb、或20kb。在某些实施方案中,异源插入DNA大于25kb。在某些实施方案中,异源插入DNA大于30kb。在某些实施方案中,异源插入DNA大于35kb。在某些实施方案中,异源插入DNA大于40kb。在一个实施方案中,使用本文所述的方法将包含大肠杆菌菌株的rfb簇的DNA序列插入宿主细胞中。插入的rfb簇可属于本领域中已知的任何O血清群/O抗原,例如O1、O2、O3、O4、O5、O6、O7、O8、O9、O10、O11、O12、O13、O14、O15、O16、O17、O18、O19、O20、O21、O22、O23、O24、O25、O26、O27、O28、O29、O30、O32、O33、O34、O35、O36、O37、O38、O39、O40、O41、O42、O43、O44、O45、O46、O48、O49、O50、O51、O52、O53、O54、O55、O56、O57、O58、O59、O60、O61、O62、O63、O64、O65、O66、O68、O69、O70、O71、O73、O74、O75、O76、O77、O78、O79、O80、O81、O82、O83、O84、O85、O86、O87、O88、O89、O90、O91、O92、O93、O95、O96、O97、O98、O99、O100、O101、O102、O103、O104、O105、O106、O107、O108、O109、O110、O111、O112、O113、O114、O115、O116、O117、O118、O119、O120、O121、O123、O124、O125、O126、O127、O128、O129、O130、O131、O132、O133、O134、O135、O136、O137、O138、O139、O140、O141、O142、O143、O144,O145、O146、O147、O148、O149、O150、O151、O152、O153、O154、O155、O156、O157、O158、O159、O160、O161、O162、O163、O164、O165、O166、O167、O168、O169、O170、O171、O172、O173、O174、O175、O176、O177、O178、O179、O180、O181、O182、O183、O184、O185、O186或O187,及其血清亚型。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含假单胞菌菌株的rfb簇的DNA序列插入宿主细胞中。在一个具体实施方案中,假单胞菌菌株为铜绿假单胞菌(P.aeruginosa)菌株。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含沙门氏菌(Salmonella)菌株的rfb簇的DNA序列插入宿主细胞中。在一个具体实施方案中,沙门氏菌菌株为肠炎沙门氏菌(S.enterica)菌株。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含耶尔森氏菌(Yersinia)菌株的rfb簇的DNA序列插入宿主细胞中。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含肺炎克雷伯氏菌(Klebsiellapneumoniae)菌株的rfb簇的DNA序列插入宿主细胞中。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含土拉热弗朗西斯氏菌(Francisellatularensis)菌株的rfb簇的DNA序列插入宿主细胞中。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含鲍氏不动杆菌(Acinetobacterbaumannii)菌株的rfb簇的DNA序列插入宿主细胞中。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含伯克霍尔德氏菌(Burkholderia)菌株的rfb簇的DNA序列插入宿主细胞中。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含志贺氏菌(Shigella)菌株的rfb簇的DNA序列插入宿主细胞中。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法将包含生物体的荚膜多糖基因簇的DNA序列插入宿主细胞中。在一个具体实施方案中,生物体为大肠杆菌菌株。在另一个具体实施方案中,生物体为链球菌(Streptococcus)菌株(例如肺炎链球菌(S.pneumoniae)、化脓链球菌(S.pyrogenes)、无乳链球菌(S.agalacticae))、葡萄球菌(Staphylococcus)菌株(例如金黄色葡萄球菌(S.aureus))、伯克霍尔德氏菌菌株(例如鼻疽伯克霍尔德氏菌(Bmallei)、类鼻疽伯克霍尔德氏菌(B.pseudomallei)、泰国伯克霍尔德氏菌(B.thailandensis))。在一个具体实施方案中,宿主细胞为原核宿主细胞。在另一个具体实施方案中,宿主细胞为大肠杆菌。在另一个实施方案中,使用本文所述的方法插入包含合成十一异戊烯基焦磷酸酯上的寡糖或多糖的一种或多种酶的DNA序列。在某些实施方案中,通过将在rfb簇之外编码的遗传元件引入所述宿主细胞中而优化宿主细胞。例如,可以将编码糖基转移酶和乙酰基转移酶的基因引入宿主细胞中,所述糖基转移酶和乙酰基转移酶在rfb簇和荚膜多糖簇之外发现并修饰重组多糖。作为另一个实例,在大肠杆菌和志贺氏菌O抗原中,存在原噬菌体基因簇中编码的葡萄糖基转移酶[31,32]。这些基因簇被称为gtr,并组织于由以下组成的操纵子中:将单一葡萄糖残基添加至十一异戊烯醇磷酸酯上的葡萄糖基转移酶(GtrA)、将葡萄糖磷酸酯结合的十一异戊烯醇翻转至膜的周质面的GtrB和然后将十一异戊烯基磷酸酯结合的葡萄糖转移至生长的O抗原链上的特异性Gtr转移酶。可以将包含这样基因的DNA引入本文所述的宿主细胞中。类似的修饰是乙酰化。O抗原的乙酰化在志贺氏菌中是普遍的,并且在大肠杆菌中程度较低。修饰通过单一乙酰基转移酶催化,所述单一乙酰基转移酶有时候在(大肠杆菌O16)内编码,但也在rfb簇(弗氏志贺氏菌(S.flexneri)3a)之外编码[33]。可以将含有这样的乙酰基转移酶的DNA引入本文所述的宿主细胞中。O抗原的分支和修饰对于多糖的有效且特异性免疫应答经常是重要的。因此,这些修饰途径可以包括在插入的生产菌株中,以产生含有自然界中发现的所有可能表位的缀合物。本发明的一个进一步实施方案是用于重组蛋白生产的表达盒的插入,其由诱导型启动子系统控制。这意味着,不仅含有表达盒而且含有调控蛋白的表达构建体的大DNA段是所呈现技术的合理目标。可以根据本文所述的方法插入宿主细胞中的其它DNA序列包括但不限于源自已知来源的包含/编码寡糖基转移酶和糖基转移酶、例如原核寡糖基转移酶和糖基转移酶和/或真核寡糖基转移酶和糖基转移酶的DNA;包含/编码差向异构酶的DNA;和包含/编码载体蛋白的DNA。可以插入本文所述的宿主细胞的编码寡糖基转移酶的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是衍生自原核生物的寡糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是来自弯曲菌属的寡糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是来自空肠弯曲菌(Campylobacterjejuni)的寡糖基转移酶核酸序列(例如,来自空肠弯曲菌的pglB基因)。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是衍生自真核生物的寡糖基转移酶核酸序列。可以插入本文所述的宿主细胞的编码糖基转移酶的核酸序列是本领域中已知的。在某些实施方案中,插入本文所述的宿主细胞的糖基转移酶核酸序列是国际专利申请公开号WO2011/138361(其公开内容以其整体通过引用并入本文)中描述的糖基转移酶的核酸序列。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自革兰氏阳性细菌,例如,所述糖基转移酶核酸序列衍生自金黄色葡萄球菌。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列是来自金黄色葡萄球菌的荚膜多糖5的糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列是来自金黄色葡萄球菌的荚膜多糖8的糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自革兰氏阴性细菌,例如大肠杆菌。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自真核生物。可以插入本文所述的宿主细胞的编码差向异构酶的核酸序列是本领域中已知的。在某些实施方案中,插入本文所述的宿主细胞的差向异构酶核酸序列是国际专利申请公开号WO2011/062615(其公开内容以其整体通过引用并入本文)中描述的差向异构酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的差向异构酶核酸序列是由大肠杆菌菌株O157的Z3206基因代表的差向异构酶核酸序列。参见,例如,WO2011/062615和Rush等人,2009,TheJournalofBiologicalChemistry285:1671-1680,其以其整体通过引用并入本文。可以插入本文所述的宿主细胞的编码载体蛋白的核酸序列是本领域中已知的。由本文所述的宿主细胞产生的载体蛋白包含至少一种N-糖基化共有序列,例如,共有序列(i)Asn-X-Ser(Thr),其中X独立地选自除了Pro以外的任何氨基酸;或(ii)D/E-X-N-Z-S/T,其中X和Z独立地选自除了Pro以外的任何氨基酸。因此,插入本文所述的宿主细胞的编码载体蛋白的DNA序列在载体蛋白核酸序列内包含编码N-糖基化共有序列的至少一种核酸序列。插入本文所述的宿主细胞的编码载体蛋白的DNA序列可以编码本领域中已知的任何载体蛋白,包括下面5.2.1.2节中描述的载体蛋白。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码铜绿假单胞菌的外毒素A(EPA)(包括已经遗传修饰以包含至少一种N-糖基化共有序列的EPA)的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码霍乱毒素B的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码AcrA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码HlA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码ClfA的核酸序列。(a)同源区的选择用于根据本文所述的方法使用的同源区(HR)的长度可以通过实验确定。通常,HR可具有约0.1kb至3.0kb或者更大范围的长度。在某些实施方案中,HR为0.1kb至0.5kb、0.5kb至1kb、1kb至3kb、3kb至5kb、5kb至10kb、10kb至15kb、15kb至20kb、或者大于20kb。在某些实施方案中,HR为相同长度或者长度相当的。在某些实施方案中,HR为不同长度或者长度不相当的。HR之间的距离也可以通过实验确定。HR之间的距离可在.1kb至12kb、或者更大的范围,并且可以通过异源插入DNA和/或宿主细胞基因组中待缺失DNA段(例如,可以缺失宿主细胞基因组的长段,只要它们不包含对宿主细胞存活所必需的基因)的长度来确定。异源DNA插入片段的位置通过HR序列进行定义。因此,可以在宿主细胞基因组中事实上任意位置(例如,在宿主细胞任意染色体上的任意位置)进行插入。在某些实施方案中,可以使用本文所述的方法来将大DNA片段克隆至目标细胞中存在的质粒中,只要供体质粒的HR存在于宿主细胞中存在的目标质粒上,例如,而不是在目标染色体中。本文所述的方法的一个重要方面是,DNA插入片段插入通过相应选择同源重组区而选择的基因组位置(HR1和HR2,参见图1)。HR1和HR2侧接供体质粒上的DNA插入片段,并且它们还侧接插入之后由DNA插入片段替换的DNA。在下面提供的工作实施例中,选择位于目标染色体上彼此间隔3(替换wecA-wzzE)或者12kb(替换rfb簇)的HRs,并观察到成功插入。可以以多种方式选择插入位置,包括但不限于:I)可因为期望通过用期望的途径来替换可能的竞争性或者干扰性途径而去除它而选择插入区(参见下面的实施例);II)可选择在目标细胞天然含有类似簇的位置处插入。然后可平衡表达水平和位置用于优化表达;III)插入位置可与所插入的DNA无关,并且可以完全通过经验针对重组DNA插入片段在具体位置所显示的表达水平进行选择,即可以进行多个不同的随机插入并选择最佳生产菌株;和IV)插入可以缺失不期望的功能,或者缺失可以用于选择重组蛋白的功能。(b)在插入位点的DNA缺失在某些实施方案中,本文所述的方法导致宿主细胞DNA的缺失,例如编码可干扰插入DNA的期望结果的一种或多种基因的基因组DNA的缺失。在某些实施方案中,用异源插入DNA直接替换待去除的宿主细胞基因组DNA。这种概念,即通过用期望的途径替换可能的竞争性或干扰性途径而去除它,是选择DNA插入位点的合理方式。在一个具体实施方案中,在期望用使用本文所述的方法而产生的经修饰宿主细胞来工程改造蛋白糖缀合物的情况下,缺失以下基因是有用的:编码降低糖蛋白产率的基因,包括但不限于waaL,编码肠杆菌共同抗原(ECA)基因簇(也称为wec簇)的基因,gtr噬菌体基因簇基因,参与核苷酸糖生物合成的基因,编码周质蛋白酶的基因,和Und-P生物合成和循环基因。在一些情况下,宿主细胞糖基转移酶可干扰由DNA插入片段编码的重组多糖产生。因此,本发明一个进一步实施方案是修饰导致产生具有不期望特征的杂合结构的重组多糖的宿主细胞糖基转移酶的缺失。(c)插入DNA的去除当重组细菌菌株用于GIMP下的临床材料生产时,不需要和不必要的序列是要关注的。因此,在某些实施方案中,一旦不再需要辅助DNA序列时,就将它们从根据本文所述的方法产生的宿主细胞中去除。例如,随后可以将与目的DNA一起插入的选择盒去除,使得它们不再与所产生的宿主细胞相关。为了在DNA插入之后去除这样的元件,可以使用不同方法[34]。例如,可以使用FRT/FLP来源的位点特异性重组[35](参见实施例)。在这样的情况下,对于侧接待去除序列的FLP序列特异性的重组酶(例如识别28bp序列的FLP重组酶)可以重组序列,由此切除这些特定序列之间的DNA。替代切除系统是loxP/Cre和difXer系统[14,36]。5.1.2.3其它修饰在某些实施方案中,本文所述的糖缀合物在优化的生长培养基中产生。在某些实施方案中,生长培养基通过改变以下中的一种或多种而优化:(i)培养基中酵母提取物的量(例如5至35g/l),(ii)培养基的Mg2+浓度(例如0至25mM),(iii)培养基的蛋白胨提取物浓度(例如5-25g/l),(iv)培养基的胰蛋白胨提取物浓度(例如5-25g/l),和/或(v)添加分子伴侣至培养基中,例如添加海藻糖(例如25mM-50mM)、乙二醇(例如0.5%)、谷氨酸(例如0.1M)、腐胺(例如25mM)、三甲基-N-氧化物(例如5mM)和/或L-脯氨酸(例如5mM)。在某些实施方案中,生长培养基通过改变培养基的pH而优化。例如,可以评价pH6.5至8.5的改变对糖缀合物产率的影响。某些基因在某些pH下最佳地发挥作用。因此,可以在选择来优化特定基因的pH值下使用生长培养基。例如,PglB活性在~pH8下是最佳的。因此,在具体实施方案中,在本文所述的方法中,宿主细胞的生长在pH8下进行。在另一个具体实施方案中,在本文所述的方法中,宿主细胞的生长在4-6、5-7、6-8或7-9范围的pH下进行。5.1.3质粒引入方法可以使用本领域技术人员已知的任何方法来将质粒例如供体和辅助质粒以及DNA引入宿主细胞中。这样的方法可包括但不限于电穿孔、通过热休克的化学转化、天然转化、噬菌体转导和缀合。5.1.4宿主细胞本文涵盖通过本文所述的方法工程改造的宿主细胞,其中所述宿主细胞包含编码目的蛋白的一种或多种基因。在一个具体实施方案中,通过本文所述的宿主细胞产生的蛋白为抗原,例如可以用于疫苗中的病毒或细菌抗原。在另一个具体实施方案中,通过本文所述的宿主细胞产生的蛋白为载体蛋白,其中所述载体蛋白通过本文所述的宿主细胞修饰,以便具有一种或多种有利特征,例如载体蛋白是糖基化的。在某些实施方案中,使用上面5.1节中描述的方法工程改造本文提供的宿主细胞。在某些实施方案中,使用下面5.1.6节中描述的方法工程改造本文提供的宿主细胞。在某些实施方案中,当使用包括使用辅助和供体质粒的方法工程改造宿主细胞(例如,如上面5.1节中所述)时,辅助和供体质粒中编码的元件确定本发明是否可以用于某些宿主细胞中。下面实施例中的某些描述在革兰氏阴性大肠杆菌宿主细胞中应用本文所述的方法;然而,本领域技术人员已知的任何宿主细胞都可用作用于DNA插入的受体细胞,包括古细菌、原核宿主细胞和真核宿主细胞。可以根据本文所述的方法使用的示例性原核宿主细胞包括但不限于埃希氏菌种、志贺氏菌种、克雷伯氏菌种、黄单胞菌种、沙门氏菌种、耶尔森氏菌种、乳球菌种、乳杆菌种、假单胞菌种、棒杆菌种、链霉菌种、链球菌种、葡萄球菌种、芽孢杆菌种和梭状芽胞杆菌种。在某些实施方案中,本文所述宿主细胞包含其中已经插入一种或多种DNA序列的基因组,其中所述DNA序列编码蛋白或包含参与蛋白的糖基化(例如,蛋白的N-糖基化)的操纵子/基因簇。例如,在某些实施方案中,本文所述宿主细胞包含其中已经插入以下中的一种或多种的基因组:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,本文提供的宿主细胞包含其中已经插入DNA序列的基因组,其中所述插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第二DNA序列插入其中,其中所述第二插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第三DNA序列插入其中,其中所述第三插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第四DNA序列插入其中,其中所述第四DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供的宿主细胞包含其中已经插入DNA序列的基因组,其中所述插入的DNA序列包含以下中的两种或更多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞的基因组额外地已经将第二DNA序列插入其中,其中所述第二插入的DNA序列包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第三DNA序列插入其中,其中所述第三插入的DNA序列包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供包含供体质粒和辅助质粒的宿主细胞,(a)其中所述辅助质粒包含:(i)在第一启动子控制下的编码lamdared重组酶的开放阅读框;和(ii)在第二启动子控制下的编码限制性内切核酸酶的开放阅读框,所述限制性内切核酸酶具有宿主细胞基因组中不存在的识别序列;以及(b)其中所述供体质粒包含:(i)从5'至3':(1)限制性内切核酸酶的识别序列;(2)至少0.5千碱基(kb)的第一同源区,(3)至少8kb的异源插入DNA;和(4)至少0.5kb的第二同源区;以及(ii)反选择标记物。在一个具体实施方案中,所述识别序列包含至少18个碱基对。在另一个具体实施方案中,所述限制性内切核酸酶为SceI。在一个具体实施方案中,所述异源插入DNA包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。可以插入本文所述的宿主细胞的编码寡糖基转移酶的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是衍生自原核生物的寡糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是来自弯曲菌属的寡糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是来自空肠弯曲菌(Campylobacterjejuni)的寡糖基转移酶核酸序列(例如,来自空肠弯曲菌的pglB基因)。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的寡糖基转移酶核酸序列是衍生自真核生物的寡糖基转移酶核酸序列。可以插入本文所述的宿主细胞的编码糖基转移酶的核酸序列是本领域中已知的。在某些实施方案中,插入本文所述的宿主细胞的糖基转移酶核酸序列是国际专利申请公开号WO2011/138361(其公开内容以其整体通过引用并入本文)中描述的糖基转移酶的核酸序列。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自革兰氏阳性细菌,例如,所述糖基转移酶核酸序列衍生自金黄色葡萄球菌。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列是来自金黄色葡萄球菌的荚膜多糖5的糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列是来自金黄色葡萄球菌的荚膜多糖8的糖基转移酶核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自革兰氏阴性细菌,例如大肠杆菌。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的糖基转移酶核酸序列衍生自真核生物。可以插入本文所述的宿主细胞的编码差向异构酶的核酸序列是本领域中已知的。在某些实施方案中,插入本文所述的宿主细胞的差向异构酶核酸序列是国际专利申请公开号WO2011/062615(其公开内容以其整体通过引用并入本文)中描述的差向异构酶核酸序列。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的差向异构酶核酸序列是由大肠杆菌菌株O157的Z3206基因代表的差向异构酶核酸序列。参见,例如,WO2011/062615和Rush等人,2009,TheJournalofBiologicalChemistry285:1671-1680,其以其整体通过引用并入本文。可以插入本文所述的宿主细胞的包含rfb基因簇的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的rfb基因簇是来自大肠杆菌的rfb基因簇,例如来自本领域中已知的任何O血清群/O抗原的大肠杆菌rfb簇,例如,O1、O2、O3、O4、O5、O6、O7、O8、O9、O10、O11、O12、O13、O14、O15、O16、O17、O18、O19、O20、O21、O22、O23、O24、O25、O26、O27、O28、O29、O30、O32、O33、O34、O35、O36、O37、O38、O39、O40、O41、O42、O43、O44、O45、O46、O48、O49、O50、O51、O52、O53、O54、O55、O56、O57、O58、O59、O60、O61、O62、O63、O64、O65、O66、O68、O69、O70、O71、O73、O74、O75、O76、O77、O78、O79、O80、O81、O82、O83、O84、O85、O86、O87、O88、O89、O90、O91、O92、O93、O95、O96、O97、O98、O99、O100、O101、O102、O103、O104、O105、O106、O107、O108、O109、O110、O111、O112、O113、O114、O115、O116、O117、O118、O119、O120、O121、O123、O124、O125、O126、O127、O128、O129、O130、O131、O132、O133、O134、O135、O136、O137、O138、O139、O140、O141、O142、O143、O144,O145、O146、O147、O148、O149、O150、O151、O152、O153、O154、O155、O156、O157、O158、O159、O160、O161、O162、O163、O164、O165、O166、O167、O168、O169、O170、O171、O172、O173、O174、O175、O176、O177、O178、O179、O180、O181、O182、O183、O184、O185、O186或O187及其亚血清型。在另一个具体实施方案中,插入本文所述的宿主细胞的rfb基因簇是来自假单胞菌菌株(例如,铜绿假单胞菌菌株)、沙门氏菌菌株(例如,肠炎沙门氏菌菌株)、耶尔森氏菌菌株、肺炎克雷伯氏菌菌株、弗朗西斯菌株(例如,土拉热弗朗西斯氏菌)、鲍氏不动杆菌菌株、伯克霍尔德氏菌菌株或志贺氏菌菌株的rfb基因簇。可以插入本文所述的宿主细胞的包含荚膜多糖的核酸序列是本领域中已知的。在一个具体实施方案中,插入本文所述的宿主细胞的荚膜多糖基因簇是来自大肠杆菌菌株、链球菌(Streptococcus)菌株(例如,肺炎链球菌(S.pneumoniae)、化脓链球菌(S.pyrogenes)、无乳链球菌(S.agalacticae))、葡萄球菌(Staphylococcus)菌株(例如,金黄色葡萄球菌(S.aureus))或伯克霍尔德氏菌菌株(例如,鼻疽伯克霍尔德氏菌(Bmallei)、类鼻疽伯克霍尔德氏菌(B.pseudomallei)、泰国伯克霍尔德氏菌(B.thailandensis))。可以插入本文所述的宿主细胞的编码载体蛋白的核酸序列是本领域中已知的。由本文所述的宿主细胞产生的载体蛋白包含至少一种N-糖基化共有序列,例如,共有序列(i)Asn-X-Ser(Thr),其中X独立地选自除了Pro以外的任何氨基酸;或(ii)D/E-X-N-Z-S/T,其中X和Z独立地选自除了Pro以外的任何氨基酸。因此,插入本文所述的宿主细胞的编码载体蛋白的DNA序列在载体蛋白核酸序列内包含编码N-糖基化共有序列的至少一种核酸序列。插入本文所述的宿主细胞的编码载体蛋白的DNA序列可以编码本领域中已知的任何载体蛋白,包括下面5.2.1.2节中描述的载体蛋白。在一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码铜绿假单胞菌的外毒素A(EPA)、包括已经遗传修饰以包含至少一种N-糖基化共有序列的EPA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码霍乱毒素B的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码AcrA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码HlA的核酸序列。在另一个具体实施方案中,插入本文所述的宿主细胞的基因组的载体蛋白核酸序列是编码ClfA的核酸序列。在某些实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1、2、3、4、5、6、7、8、9或10。在一个具体实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1或2。在另一个具体实施方案中,本文所述的宿主细胞中的插入DNA(例如,异源插入DNA)内的基因的拷贝数是1。5.1.5分析方法在某些实施方案中,对于本文所述的方法的功能性应用,使用用于质粒维持(辅助质粒、供体质粒)和DNA插入片段选择的不同选择系统的组合。这些选择系统应当彼此相容,即它们在已有系统中(specR、ampR和clmR或kanR),或者有用的抗生素盒和/或替代质粒选择系统的任何替代组合中可以是相似的。可以通过用于DNA分析的任何方法来检查候选插入克隆的基因型。筛选必须基于分析DNA插入片段在染色体插入位置的背景中的存在。这意味着DNA插入片段必须邻近目标位点找到,即目标位点区域之外的序列。可以进行PCR来显示已通过重组切除的基因的不存在,例如当O抗原簇被不同的抗原簇替换时。或者其可用于显示DNA插入片段的存在。或者其可以用于使用侧接HRs的寡核苷酸扩增DNA段,显示染色体DNA和DNA插入片段的连接已经发生。DNA测序可以显示相同结果,即DNA插入片段必须连续地连接至不受同源重组影响的染色体DNA序列。或者可以使用southern印迹来鉴定染色体DNA片段,所述染色体DNA片段含有DNA插入片段和邻接插入(HR)位点的未受影响的染色体序列。或者可以使用具有对于DNA插入片段特异性的PCR探针的菌落杂交。显示DNA插入片段的存在的另一种方式是通过评估插入基因的活性。候选克隆的表型分析允许检查DNA插入片段的活性,但无法检查正确的插入位置。在下面显示的实例中,插入重组多糖生物合成基因簇,因此在插入重组细胞之后显示多糖存在的简单实验足以证实成功的重组。这可通过使用多糖特异性抗血清的免疫印迹(western印迹、菌落印迹、斑点印迹等)进行,可能地但非必需地组合通过SDS-PAGE或层析分离细胞提取物随后Western印迹或ELISA;还有,高分辨率技术如MS、NMR、HPLC或者用于产物的化学或物理鉴定方法对于证实DNA插入片段活性是有用的。5.1.6额外的插入方法除了上述(例如,在5.1节中)新型插入方法以外,可以使用其它方法将DNA插入宿主细胞的基因组中。在某些实施方案中,使用本领域中已知的任何位点特异性插入方法将DNA插入宿主细胞的基因组中。在某些实施方案中,使用本领域中已知的任何随机整合方法将DNA插入宿主细胞的基因组中。下面更详细地描述这样的方法。在某些实施方案中,使用包括转座子介导的插入的方法将DNA插入宿主细胞(例如,大肠杆菌)基因组中。这样的随机插入允许在宿主细胞基因组的多个位置插入目的DNA,并因此允许鉴定其中已经插入DNA的宿主细胞中的最佳插入位点,例如,可以关于插入DNA的产生效率将具有插入DNA的宿主细胞与彼此进行比较,并可以选择具有最高效率的宿主细胞效率用于将来使用。将核酸序列转座子介导的插入宿主细胞基因组中的方法是本领域中是已知的。例如,在某些实施方案中,使用pUTminiTn5递送系统(Biomedical;Sevilla,Spain)将基因稳定插入宿主细胞(诸如细菌宿主细胞)的基因组中。然后可以鉴定和分离其中已经插入DNA的菌株。还参见Herrero等人,1990,J.Bacteriology172(11):6557-6567和DeLorenzo等人,1990,J.Bacteriology172(11):6568-6572,其各自以其整体通过引用并入本文。此外,在某些实施方案中,使用DNA插入的基于Tn-7的方法实现将DNA转座子介导的宿主细胞基因组中的插入。参见McKenzie等人,2006,BMCMicrobiology6:39和Sibley等人,2012,NucleicAcidsRes.40:e19,其各自以其整体通过引用并入本文。在某些实施方案中,使用允许位点特异性DNA克隆的StabyCloningTM试剂盒或StabyCodonT7试剂盒(DelphiGenetics,Charleroi,Belgium)将DNA插入宿主细胞(例如,大肠杆菌)基因组中。在某些实施方案中,使用DNA克隆和染色体整合的“克隆整合(clonetegration)”方法将DNA插入宿主细胞(例如,大肠杆菌)基因组中。参见St.Pierre等人,2013,ACSSyntheticBiology2:537-541,其公开内容以其整体通过引用并入本文。在某些实施方案中,使用如Haldimann和Wanner,2001,J.Bacteriology183:6384-6393(其公开内容以其整体通过引用并入本文)所述的涉及条件型复制、整合和模块(CRIM)质粒的方法将DNA插入宿主细胞(例如,大肠杆菌)基因组中。在某些实施方案中,使用例如Sharan等人,2009,Nat.Protoc.4:206-223;Yu等人,2000,PNASUSA97:5978-5983;Kuhlman等人,2010,NucleicAcidsRes.38:e92;和Zhang等人,1998,Nat.Genet.20:123-128(其各自以其整体通过引用并入本文)描述的重组工程改造方法将DNA插入宿主细胞(例如,大肠杆菌)基因组中。本文进一步提供本文所述的额外的插入方法中使用的分离的供体DNA构建体。工程改造所述DNA构建体,使得它们可以用于所应用的整合方法中,并且包含编码/包含待根据所进行的方法插入宿主细胞基因组中的一种或多种蛋白/操纵子/基因簇的核酸。在某些实施方案中,分离的供体DNA构建体包含编码/包含参与蛋白的糖基化(例如,蛋白的N-糖基化)的一种或多种蛋白或操纵子的核酸。在一个具体实施方案中,分离的供体DNA构建体包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。5.2应用5.2.1蛋白糖基化在某些实施方案中,本文提供的经修饰的宿主细胞可以用于蛋白糖基化。可设计蛋白糖基化来生产缀合物疫苗,即含有设计疫苗所针对的病原体的多糖和蛋白抗原的疫苗。5.2.1.1抗原编码与以下多糖抗原相关的基因的DNA可以用作根据本文所述的方法的插入DNA:大肠杆菌(O1、O2、O3、O4、O5、O6、O7、O8、O9、O10、O11、O12、O13、O14、O15、O16、O17、O18、O19、O20、O21、O22、O23、O24、O25、O26、O27、O28、O29、O30、O32、O33、O34、O35、O36、O37、O38、O39、O40、O41、O42、O43、O44、O45、O46、O48、O49、O50、O51、O52、O53、O54、O55、O56、O57、O58、O59、O60、O61、O62、O63、O64、O65、O66、O68、O69、O70、O71、O73、O74、O75、O76、O77、O78、O79、O80、O81、O82、O83、O84、O85、O86、O87、O88、O89、O90、O91、O92、O93、O95、O96、O97、O98、O99、O100、O101、O102、O103、O104、O105、O106、O107、O108、O109、O110、O111、O112、O113、O114、O115、O116、O117、O118、O119、O120、O121、O123、O124、O125、O126、O127、O128、O129、O130、O131、O132、O133、O134、O135、O136、O137、O138、O139、O140、O141、O142、O143、O144,O145、O146、O147、O148、O149、O150、O151、O152、O153、O154、O155、O156、O157、O158、O159、O160、O161、O162、O163、O164、O165、O166、O167、O168、O169、O170、O171、O172、O173、O174、O175、O176、O177、O178、O179、O180、O181、O182、O183、O184、O185、O186、O187)、沙门氏菌种(肠道沙门氏菌亚种Enterica、肠道沙门氏菌亚种Salamae、肠道沙门氏菌亚种arizonae、肠道沙门氏菌亚种Diarizonae、肠道沙门氏菌亚种Houtenae、帮戈沙门氏菌(S.bongori)和肠道沙门氏菌亚种Indica,以及O型1-67,详见[37])、假单胞菌种(铜绿假单胞菌O血清型1-20[38])、克雷伯氏菌种(特别是肺炎克雷伯氏菌血清型O1、O2(和血清亚型)、O3、O4、O5、O6、O7、O8、O9、O10、O11、O12,[39])、不动杆菌O抗原(特别是[40]中鉴定的鲍氏不动杆菌O抗原)、沙眼衣原体O抗原(血清型A、B、C、D、E、F、G、H、I、J、K、L1、L2、L3)、霍乱弧菌O抗原O1至155、李斯特氏菌种(特别是单核细胞增生李斯特氏菌(L.monocytogenes)1、2、3、4型及其血清亚型)、嗜肺军团菌血清型1至15O抗原、副百日咳博得特氏菌O抗原、鼻疽伯克霍尔德氏菌和类鼻疽伯克霍尔德氏菌O抗原、土拉热弗朗西斯氏菌,弯曲菌种(空肠弯曲菌)的O抗原;艰难梭状芽胞杆菌(血清型A、G、H、K、S1、S4、D、Cd-5,KToma等人1988,以及产气荚膜梭状芽胞杆菌血清型A、B、C、D和E)、金黄色葡萄球菌5和8型、化脓链球菌(组B链球菌荚膜血清型多糖)、大肠杆菌、无乳链球菌(组A链球菌荚膜多糖)、脑膜炎奈瑟氏菌(血清型A、B、C、W、Y、X)、白色念珠菌、流感嗜血杆菌、粪肠球菌荚膜多糖I-V型的荚膜多糖;以及其它表面多糖结构,例如伯氏疏螺旋体糖脂([41])、脑膜炎奈瑟氏球菌菌毛蛋白O聚糖[42,43]和脂寡糖(LOS)、流感嗜血杆菌LOS、硕大利什曼原虫脂磷聚糖[44,45]),肿瘤相关碳水化合物抗原(疟疾糖基磷脂酰肌醇、结核分枝杆菌阿拉伯甘露聚糖[46])。5.2.1.2载体蛋白本文可以使用适用于缀合疫苗生产的编码/包含任何载体蛋白的核酸。示例性的载体蛋白包括但不限于铜绿假单胞菌外毒素A(EPA)、CRM197、白喉类毒素、破伤风类毒素、脱毒的金黄色葡萄球菌溶血素A、聚集因子A、聚集因子B、大肠杆菌FimH、大肠杆菌FimHC、大肠杆菌不耐热肠毒素、大肠杆菌不耐热肠毒素的脱毒变体、霍乱毒素B亚基(CTB)、霍乱毒素、霍乱毒素的脱毒变体、大肠杆菌sat蛋白、大肠杆菌sat蛋白的信使结构域、空肠弯曲菌AcrA和空肠弯曲菌的天然糖蛋白。在某些实施方案中,用于本文所述的缀合疫苗生产的载体蛋白是经修饰的,例如以使得蛋白毒性更低和/或更易糖基化等的方式修饰。在一个具体实施方案中,用于本文所述的缀合疫苗生产的载体蛋白是经修饰的,使得载体蛋白中的糖基化位点数以这样的方式最大化,其允许施用更低浓度的蛋白,例如在免疫原性组合物中、以其生物缀合物形式施用。因此在某些实施方案中,修饰本文所述的载体蛋白以包括比通常与载体蛋白相关的糖基化位点多1、2、3、4、5、6、7、8、9、10或更多个糖基化位点(例如相对于与天然/自然的状态、例如“野生型”状态的载体蛋白相关的糖基化位点数)。在具体实施方案中,糖基化位点的引入通过糖基化共有序列(例如,(i)共有序列Asn-X-Ser(Thr),其中X独立地选自除了Pro以外的任何氨基酸;或(ii)共有序列D/E-X-N-Z-S/T,其中X和Z独立地选自除了Pro以外的任何氨基酸)在蛋白一级结构的任意位置的插入来实现。这样的糖基化位点的引入可以通过以下来实现,例如通过将新氨基酸添加至蛋白的一级结构(即全部或部分地添加糖基化位点),或者通过突变蛋白中的已有氨基酸使得产生糖基化位点(即氨基酸不添加至蛋白,但突变蛋白的所选氨基酸以形成糖基化位点)。本领域技术人员将理解,使用本领域中已知的方法(例如包括编码蛋白的核酸序列的修饰的重组方法)可以容易修饰蛋白的氨基酸序列。在具体实施方案中,将糖基化共有序列引入载体蛋白的特定区域中,例如蛋白的表面结构,在蛋白的N或C末端和/或在蛋白基础上通过二硫键稳定的环中。在某些实施方案中,典型的5氨基酸糖基化共有序列可通过赖氨酸残基延长以更有效糖基化,且因此插入的共有序列可编码应当插入或者替换受体蛋白氨基酸的5、6或7个氨基酸。在某些实施方案中,用于本文所述的缀合疫苗产生中的载体蛋白包含“标签”,即允许分离和/或鉴定载体蛋白的氨基酸序列。例如,将标签添加至本文所述的载体蛋白可用于纯化该蛋白,且从而可用于纯化包含标记的载体蛋白的缀合疫苗。本文可以使用的示例性标签包括但不限于组氨酸(HIS)标签(例如六组氨酸标签,或者6XHis-Tag)、FLAG-TAG和HA标签。在某些实施方案中,本文所使用的标签是可去除的,例如一旦不再需要它们,例如在蛋白已纯化后,则通过化学试剂或者通过酶促手段去除。5.2.1.3宿主细胞修饰在某些实施方案中,将用于产生本文所述的缀合疫苗的宿主细胞工程改造以包含异源核酸,例如编码一种或多种载体蛋白的异源核酸和/或编码一种或多种蛋白的异源核酸,例如编码一种或多种蛋白的基因。在一个具体实施方案中,可将编码参与糖基化途径(例如原核和/或真核糖基化途径)的蛋白的异源核酸引入本文所述的宿主细胞中。这样的核酸可编码蛋白,包括但不限于寡糖基转移酶和/或糖基转移酶,以及差向异构酶和抗原基因簇。可以使用本领域技术人员已知的任何方法将异源核酸(例如编码载体蛋白的核酸和/或编码其它蛋白例如参与糖基化的蛋白的核酸)引入本文所述的宿主细胞中,所述方法例如电穿孔、通过热休克的化学转化、自然转化、噬菌体转导和缀合。在具体实施方案中,使用质粒将异源核酸引入本文所述的宿主细胞中,例如异源核酸通过质粒(例如表达载体)在宿主细胞中表达。在另一个具体实施方案中,使用本文提供的插入方法将异源核酸引入本文所述的宿主细胞中。在某些实施方案中,可将额外的修饰引入(例如使用重组技术)本文所述的宿主细胞中。例如,可以以使它们失活/失去功能的方式(即缺失/修饰的宿主细胞核酸不编码功能性蛋白或者不编码任何蛋白)在宿主细胞背景(基因组)中缺失或修饰编码蛋白的宿主细胞核酸(例如基因),所述蛋白形成可能的竞争性或干扰性糖基化途径的一部分(例如与重组引入宿主细胞中的参与糖基化的一种或多种异源基因竞争或干扰重组引入宿主细胞中的参与糖基化的一种或多种异源基因)。在某些实施方案中,当从本文提供的宿主细胞基因组中缺失核酸时,它们被期望的序列(例如对于糖蛋白产生有用的序列)替换。这样的替换可以通过本文所述的一种或多种插入方法的方式,其中插入宿主细胞中的异源插入DNA可替换从宿主细胞中缺失的一种或多种基因的功能。宿主细胞中可以缺失的示例性基因(以及在一些情况下,用其它期望的核酸序列替换)包括参与糖脂生物合成的宿主细胞基因,诸如waaL(参见例如Feldman等人,2005,PNASUSA102:3016-3021)、脂质A核心生物合成簇、半乳糖簇、阿拉伯糖簇、可拉酸(colonicacid)簇、荚膜多糖簇、十一异戊烯醇-磷酸酯生物合成基因、und-P循环基因、参与核苷酸活化的糖生物合成的代谢酶、肠道细菌共同抗原簇和原噬菌体O抗原修饰簇如grabs簇。在一个具体实施方案中,修饰本文所述的宿主细胞,使得它们不产生除由于通过本文所述的方法将异源插入DNA插入宿主细胞基因组中而产生的O抗原之外的任何O抗原。在另一个具体实施方案中,修饰本文所述的宿主细胞,使得它们不产生除了由于通过本文所述的方法将异源插入DNA插入宿主细胞基因组中而产生的荚膜多糖之外的任何荚膜多糖。在某些实施方案中,本文提供的宿主细胞包含基因缺失,其中目的DNA序列已经在基因缺失位点插入宿主细胞基因组。在一个具体实施方案中,本文提供的宿主细胞是具有waaL基因的缺失的大肠杆菌。在一个具体实施方案中,将编码寡糖基转移酶的DNA序列在waaL基因缺失的位点插入大肠杆菌宿主细胞中。在另一个具体实施方案中,本文提供的宿主细胞是具有wecG基因的缺失的大肠杆菌。在一个具体实施方案中,将编码载体蛋白的DNA序列在wecG基因缺失的位点插入大肠杆菌宿主细胞中。在另一个具体实施方案中,本文提供的宿主细胞是具有waaL基因的缺失和具有wecG基因的缺失的大肠杆菌,其中将寡糖基转移酶在缺失的waaL基因的位点插入大肠杆菌宿主细胞且其中将载体蛋白(例如,包含N-糖基化共有序列的EPA)在缺失的wecG基因的位点插入大肠杆菌宿主细胞。5.2.1.4糖缀合物本文所述的方法可以用于产生宿主细胞,所述宿主细胞产生包含糖基化载体蛋白(参见例如5.2.1.2节)的糖缀合物。在具体实施方案中,本文提供包含载体蛋白(参见例如5.2.1.2节)的糖缀合物,所述载体蛋白用本文所述的抗原(例如多糖)(例如5.2.1.1节所述的抗原)糖基化。在具体实施方案中,所述载体蛋白是EPA。在一个具体实施方案中,本文提供包含EPA和一种或多种不同多糖(例如5.2.1.1节所述的一种或多种多糖)的糖缀合物。在另一个具体实施方案中,本文提供包含载体蛋白的糖缀合物,所述载体蛋白缀合至大肠杆菌O1、O2、O4、O6、O7、O8、O11、O15、O16、O17、O18、O20、O22、O25、O73、O75和/或O83中的一种或多种。在一个具体实施方案中,所述载体蛋白是EPA。在另一个具体实施方案中,本文提供包含载体蛋白的糖缀合物,所述载体蛋白缀合至一种或多种不同的铜绿假单胞菌多糖。在一个具体实施方案中,所述载体蛋白是EPA。在另一个具体实施方案中,本文提供包含载体蛋白的糖缀合物,所述载体蛋白缀合至一种或多种不同的肺炎克雷伯氏菌多糖。在一个具体实施方案中,所述载体蛋白是EPA。5.2.1.5益处本文所述的产生糖缀合物的方法具有特别的商业重要性和关联性,因为它们以更低风险允许大规模发酵,这是由于染色体插入的DNA增加的稳定性和因此在发酵期间的目的DNA的表达。用于维持插入DNA表达的某些已知方法基于携带插入DNA的附加体。需要通过抗生素选择维持这些附加体。本文所述的方法中的某些因此优于插入DNA的质粒源性表达,尤其是因为一旦异源DNA插入宿主细胞基因组中,就不需要发酵期间的抗生素选择。也就是说,当插入DNA插入染色体中时,其不需要进行选择,因为它随着宿主基因组的复制而增殖。进一步,质粒源性系统的一个已知缺点是,丢失质粒的风险随着每一代(即宿主细胞复制的周期)而增加。这种质粒丢失是由于在细胞分裂期间的细胞分离阶段,有时候质粒不适当地分布到子代细胞中。在大规模,细菌细胞培养物比更小发酵规模中更频繁复制,以达到高细胞密度。因此,更高的细胞稳定性和插入DNA表达导致更高的产率,提供明显优势。而且细胞稳定性是由监管机构批准的工艺接受标准,而抗生素选择由于各种原因在发酵期间通常是不期望的,所述原因例如抗生素在医学终产品中作为杂质存在并具有引起变态反应的风险,且抗生素可促进抗生素抗性(例如通过抗性病原体的基因转移或选择)。因此,本文提供的宿主细胞是有利的,因为它们包含较少数目的产生生物缀合物所需的质粒。例如,生物缀合物可以从包含2种、1种质粒或无质粒的宿主细胞(例如大肠杆菌)产生,即将生物缀合物产生所需的异源机制中的一些或全部插入宿主细胞的基因组,由此减少所需的质粒的数目。本文所述的方法的另一个优点是,在某些实施方案中,大片段DNA可以一次性插入宿主细胞基因组中(“一次性插入”)。用于将DNA引入宿主细胞基因组的某些已有方法采用通过同源重组的小DNA片段的重复插入[47]。因此,不受限于理论,本文所述的一次性插入方法是有利的,因为它们允许避免多次插入。5.2.1.6分析方法可以使用各种方法来分析本文所述的糖缀合物的结构组成和糖链长度。在一个实施方案中,可以使用肼解分析聚糖。首先,通过根据制造商说明(LudgerLiberateHydrazinolysisGlycanReleaseKit,Oxfordshire,UK)与肼孵育而从它们的蛋白载体中释放多糖。亲核肼攻击多糖和载体蛋白之间的糖苷键,并允许释放所连接的聚糖。N-乙酰基在该处理期间丢失,且必须通过再次N-乙酰化而重构。在碳柱上纯化游离聚糖,并随后在还原末端用荧光团2-氨基苯甲酰胺标记[48]。将标记的多糖在GlycoSep-N柱(GLSciences)上根据Royle等人的HPLC方案分离[49]。所得荧光色谱图标示多糖长度和重复单元数。可以通过收集个体峰并随后进行MS/MS分析来收集结构信息。由此单糖组成和重复单元序列可以得到证实,并可以额外地鉴定多糖组成的不均一性。在肼解和2AB标记之后获得的HPLC色谱图显示于实施例之一中(图21)。可以通过MALDI-MS/MS分析低分子量的具体峰,并使用结果来证实聚糖序列。每个峰对应于由特定数量的重复单元及其片段组成的聚合物。所述色谱图因此允许测量聚合物长度分布。洗脱时间是聚合物长度的指示,荧光强度与各自聚合物的摩尔丰度相关。在另一个实施方案中,可以使用SDS-PAGE或毛细管凝胶电泳来评估聚糖和糖缀合物。这里合成的O抗原聚糖的聚合物长度通过线性组装的重复单元数进行定义。这意味着典型的梯样模式是组成聚糖的不同重复单元数的结果。因此,在SDA-PAGE中或通过大小分离的其它技术中的两条彼此邻近的条带仅相差单一重复单元。当分析糖蛋白的聚糖大小时,利用这些离散差分。未糖基化的载体蛋白和具有不同聚合物链长的糖缀合物根据它们的电泳迁移率分离。测量糖缀合物上存在的首先可检测的重复单元数(n1)和平均重复单元数(n平均)。可以使用这些参数来证明批次间一致性或者多糖稳定性。在另一个实施方案中,可以应用高质量MS和大小排阻HPLC来测量完整糖缀合物的大小。在另一个实施方案中,可以使用蒽酮-硫酸测定法来测量多糖产率[50]。(a)糖基化位点使用中的变化为了显示具体蛋白中的位点使用相对于插入系统在三质粒系统中发生改变,必须定量糖基化位点使用。如此做的方法列于下面。糖肽LC-MS/MS:用一种或多种蛋白酶消化糖缀合物,并通过合适的层析方法(C18、亲水相互作用HPLCHILIC、GlycoSepN柱、SEHPLC、AEHPLC)分离肽,并使用MS/MS鉴定不同肽。可以在有或没有通过化学(smith降解)或酶促方法缩短前述糖链的情况下使用该方法。使用214至280nm处的UV检测的糖肽峰定量允许相对确定糖基化位点使用。大小排阻HPLC:更高的糖基化位点使用通过来自SEHPLC柱的更早洗脱时间来反映。也参见(a)。(b)均一性可以使用测量聚糖长度和流体动力学半径的方法来评价糖缀合物均一性(即所连接的糖残基的均一性)(参见上述和5.3.5节)。5.2.2其它潜在的临床/实践应用本文所述的方法可以用于构建期望将大DNA片段引入宿主细胞基因组中的任何宿主细胞,其中在产生携带插入DNA的宿主细胞系(例如大规模产生宿主细胞系以产生期望产物,例如由插入DNA编码的蛋白)期间维持DNA片段。例如,本文所述的方法可以用于产生包含插入DNA的宿主细胞,所述插入DNA非限制性地编码抗生素类、生物碱类、类胡萝卜素类、烟酰胺和其它次级代谢产物以及通过相同细胞内的多种酶促反应合成的辅因子。因此,本文提供包含编码这样的组分的插入DNA的宿主细胞。5.2.3更高蛋白产率整合菌株可以产生更高产率的糖缀合物,这是由于与三质粒系统相比抗生素选择负荷降低。此外,由于对细胞的代谢负荷降低而更少发生蛋白酶解降解。5.2.4更高蛋白均一性整合菌株使得糖缀合物具有更短的、更少分散的多糖长度分布。因此,糖缀合物更容易表征且更好地定义。此外,插入可降低对细胞的周质应激程度,这可导致发酵过程中更少的产物的蛋白酶解,这是由于与三质粒系统相比抗生素选择负荷降低。5.2.5更高的生产菌株稳定性蛋白糖基化系统需要生产宿主中的三种重组元件:载体蛋白表达DNA、寡糖基转移酶表达DNA和多糖表达DNA。现有技术的细菌生产系统含有质粒上的这三种元件。因此,由于质粒丢失而在制造期间存在不稳定的风险,特别是因为用于维持质粒的抗生素禁止在GIMP材料发酵期间存在。由于插入菌株含有更少的移动元件,它们经许多代更稳定。这意味着更大规模发酵和更长孵育时间(更高代数)是更可行的。此外,不存在用于选择的抗生素制造更安全的产品,这是由于不存在可以在敏感受试者中引起变态反应的痕量抗生素[4]。5.2.6生产过程的更高再现性插入菌株在遗传学上更稳定,这是由于固定的染色体插入,因此导致生产过程期间(例如在包含插入异源DNA的宿主细胞的培养期间)期望蛋白产物的更高再现性。5.2.7测试益处的分析方法产率。产率被测量为源自在受控的且优化的条件下在生物反应器中生长的一升细菌生产培养物的碳水化合物量。在纯化糖缀合物之后,碳水化合物产率可以通过蒽酮测定法(参见例如5.2.1.7节)或者使用碳水化合物特异性抗血清的ELISA直接测量。通过使用蛋白量(通过众所周知的BCA、Lowry或bradford测定法所测量的)以及聚糖长度和结构来计算每克蛋白的理论碳水化合物量,间接测量是可能的。此外,也可以通过干燥来自挥发性缓冲液的糖蛋白制备物并使用天平测重来测量产率。均一性。均一性意指聚糖长度和可能的糖基化位点数的变化性。上文列举的方法可以用于该目的。SE-HPLC允许测量流体动力学半径。载体中更高数量的糖基化位点导致与具有更少糖基化位点的载体相比的更高流体动力学半径的变化。然而,当分析单一聚糖链时,它们可更均一,这是由于更受控的长度。聚糖长度通过肼解、SDS-PAGE和CGE测量(参见5.1.2.7节)。此外,均一性也可以意指某些糖基化位点使用模式变成更宽/更窄的范围。可以通过糖肽LC-MS/MS测量这些因子(参见5.1.2.7节)。菌株稳定性和再现性。在不存在选择压力的情况下的细菌发酵期间的菌株稳定性通过直接和间接方法测量,所述方法证实生产培养细胞中重组DNA的存在或不存在。可以通过延长培养时间(意味着增加的世代时间)来刺激培养体积影响。发酵中的世代越多,就越有可能丢失重组元件。重组元件的丢失被认为是不稳定性。间接方法依赖于选择盒与重组DNA的关联性,例如质粒中的抗生素抗性盒。将生产培养细胞铺板在选择培养基上,例如补充抗生素或者与选择系统相关的其它化学物的LB板上,且抗性菌落被认为是对于与各选择化学物相关的重组DNA阳性的。在三质粒系统的情况下,计数所有三种抗生素的抗性菌落,且含有所有三种抗性的细胞的比例被认为是稳定群体。或者,可以使用定量PCR来测量存在或不存在选择的情况下以及在不同发酵时间点的三种重组元件的重组DNA的量。因此,测量并比较重组DNA的相对和绝对量。通过本申请中所述方法对一致性批次的完全分析来测量生产过程的再现性。5.3组合物5.3.1包含质粒的组合物在一个实施方案中,本文提供包含本文所述的一种或多种质粒(例如一种或多种供体或辅助质粒)的组合物。在一个具体实施方案中,本文提供包含供体质粒的组合物,其中所述供体质粒包含(i)从5'到3':(1)限制性内切核酸酶的识别序列,(2)至少0.5千碱基(kb)的第一同源区,(3)至少8kb的异源插入DNA;和(4)至少0.5kb的第二同源区;以及(ii)反选择标记物。在另一个具体实施方案中,本文提供包含辅助质粒的组合物,其中所述辅助质粒包含(i)在第一启动子控制下的编码lamdared重组酶的开放阅读框;和(ii)在第二启动子控制下的编码限制性内切核酸酶的开放阅读框,所述限制性内切核酸酶具有宿主细胞基因组中不存在的识别序列。在另一个具体实施方案中,本文提供包含供体质粒和辅助质粒的组合物,其中所述供体质粒包含(i)从5'到3':(1)限制性内切核酸酶的识别序列,(2)至少0.5千碱基(kb)的第一同源区,(3)至少8kb的异源插入DNA;和(4)至少0.5kb的第二同源区;以及(ii)反选择标记物;且其中所述辅助质粒包含(i)在第一启动子控制下的编码lamdared重组酶的开放阅读框;和(ii)在第二启动子控制下的编码限制性内切核酸酶的开放阅读框,所述限制性内切核酸酶具有宿主细胞基因组中不存在的识别序列。5.3.2包含宿主细胞的组合物在一个实施方案中,本文提供包含本文所述的宿主细胞中的一种或多种的组合物。这样的组合物可以用于产生本文所述的缀合疫苗的方法中,例如可以在适于产生蛋白的条件下培养所述组合物。随后,可以从所述组合物分离生物缀合物。本文提供的包含宿主细胞的组合物可以包含适于本文所述的宿主细胞的维持和存活的额外组分,并且可以额外包含宿主细胞产生蛋白所需或有利的额外组分,例如用于诱导型启动子的诱导物,诸如阿拉伯糖、IPTG。在一个具体实施方案中,本文提供的组合物包含宿主细胞,其中所述宿主细胞包含供体质粒和辅助质粒,(a)其中所述辅助质粒包含:(i)在第一启动子控制下的编码lamdared重组酶的开放阅读框;和(ii)在第二启动子控制下的编码限制性内切核酸酶的开放阅读框,所述限制性内切核酸酶具有宿主细胞基因组中不存在的识别序列;以及(b)其中所述供体质粒包含:(i)从5'至3':(1)限制性内切核酸酶的识别序列;(2)至少0.5千碱基(kb)的第一同源区,(3)至少8kb的异源插入DNA;和(4)至少0.5kb的第二同源区;以及(ii)反选择标记物。在一个具体实施方案中,所述识别序列包含至少18个碱基对。在另一个具体实施方案中,所述限制性内切核酸酶为SceI。在另一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供的组合物包含宿主细胞,其中所述宿主细胞包含其中已经插入DNA序列的基因组,其中所述插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞的基因组额外地已经将第二DNA序列插入其中,其中所述第二插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第三DNA序列插入其中,其中所述第三插入的DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第四DNA序列插入其中,其中所述第四DNA序列包含以下之一:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供的组合物包含宿主细胞,其中所述宿主细胞包含其中已经插入DNA序列的基因组,其中所述插入的DNA序列包含以下中的两种或更多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞的基因组额外地已经将第二DNA序列插入其中,其中所述第二插入的DNA序列包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在另一个具体实施方案中,所述宿主细胞的基因组额外地已经将第三DNA序列插入其中,其中所述第三插入的DNA序列包含以下中的一种或多种:编码寡糖基转移酶的DNA、编码糖基转移酶的DNA、编码载体蛋白的DNA、包含rfb基因簇的DNA、包含荚膜多糖基因簇的DNA和/或编码差向异构酶的DNA。在一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,本文提供的组合物包含宿主细胞,其中所述宿主细胞包含已经插入其基因组的DNA序列,其中所述插入的DNA序列包含编码寡糖基转移酶的基因。在一个具体实施方案中,所述寡糖基转移酶是衍生自原核生物的寡糖基转移酶。在另一个具体实施方案中,所述寡糖基转移酶是来自弯曲菌属的寡糖基转移酶。在另一个具体实施方案中,所述寡糖基转移酶是来自空肠弯曲菌的寡糖基转移酶(例如,来自空肠弯曲菌的pglB基因)。在另一个具体实施方案中,所述寡糖基转移酶衍生自真核生物。在另一个具体实施方案中,所述寡糖基转移酶是美国专利申请公开号20120156723(其在此以其整体通过引用并入)中描述的寡糖基转移酶。在另一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,所述宿主细胞是具有waaL基因的缺失的大肠杆菌,且所述寡糖基转移酶在缺失的waaL基因的位点插入大肠杆菌宿主细胞。在另一个具体实施方案中,本文提供的组合物包含宿主细胞,其中所述宿主细胞包含已经插入其基因组的DNA序列,其中所述插入的DNA序列包含编码载体蛋白的基因,其中所述载体蛋白包含至少一种N-糖基化共有序列,例如,共有序列(i)Asn-X-Ser(Thr),其中X独立地选自除了Pro以外的任何氨基酸;或(ii)D/E-X-N-Z-S/T,其中X和Z独立地选自除了Pro以外的任何氨基酸。所述载体蛋白可以是本领域中已知的任何载体蛋白,包括下面5.2.1.2节中描述的载体蛋白。在一个具体实施方案中,所述载体蛋白是铜绿假单胞菌的外毒素A(EPA),包括已经遗传修饰以包含至少一种N-糖基化共有序列的EPA。在另一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,所述宿主细胞是具有wecG基因的缺失的大肠杆菌,且所述载体蛋白(例如,EPA)在缺失的wecG基因的位点插入大肠杆菌宿主细胞。在另一个具体实施方案中,本文提供的组合物包含宿主细胞,其中所述宿主细胞包含已经插入其基因组的第一DNA序列和第二DNA序列,其中所述第一插入的DNA序列包含编码寡糖基转移酶的基因,且所述第二插入的DNA序列包含编码载体蛋白(例如,下面5.2.1.2节中描述的载体蛋白)的基因,其中所述载体蛋白包含至少一种N-糖基化共有序列,例如,共有序列(i)Asn-X-Ser(Thr),其中X独立地选自除了Pro以外的任何氨基酸;或(ii)D/E-X-N-Z-S/T,其中X和Z独立地选自除了Pro以外的任何氨基酸。在一个具体实施方案中,所述寡糖基转移酶是衍生自原核生物的寡糖基转移酶。在另一个具体实施方案中,所述寡糖基转移酶是来自弯曲菌属的寡糖基转移酶。在另一个具体实施方案中,所述寡糖基转移酶是来自空肠弯曲菌的寡糖基转移酶(例如,来自空肠弯曲菌的pglB基因)。在另一个具体实施方案中,所述寡糖基转移酶衍生自真核生物。在另一个具体实施方案中,所述寡糖基转移酶是美国专利申请公开号20120156723(其在此以其整体通过引用并入)中描述的寡糖基转移酶。在另一个具体实施方案中,所述载体蛋白是铜绿假单胞菌的外毒素A(EPA),包括已经遗传修饰以包含至少一种N-糖基化共有序列的EPA。在另一个具体实施方案中,所述宿主细胞是大肠杆菌。在另一个具体实施方案中,所述宿主细胞是具有waaL基因的缺失和具有wecG基因的缺失的大肠杆菌,其中将所述寡糖基转移酶在缺失的waaL基因的位点插入大肠杆菌宿主细胞且其中将所述载体蛋白(例如,EPA)在缺失的wecG基因的位点插入大肠杆菌宿主细胞。5.3.3免疫原性组合物5.3.3.1包含糖基化蛋白的组合物在一个实施方案中,本文提供包含由本文所述的宿主细胞产生的一种或多种糖缀合物的免疫原性组合物。这样的糖缀合物可包含连接至蛋白例如载体蛋白内编码的糖基化共有序列的O抗原聚糖。在一个具体实施方案中,所述载体蛋白可以是包含一个或多个引入的糖基化位点的外毒素A,或者所述载体蛋白可以是FimCH并包含一个或多个引入的糖基化位点。在其它具体实施方案中,所述载体蛋白可包含含有一个或多个所引入的糖基化位点的大肠杆菌蛋白抗原。在一个具体实施方案中,所述O抗原是来自病原性大肠杆菌分离物的大肠杆菌O抗原,例如O1、O2、O4、O7、O8、O9、O11、O15、O16、O17、O18;O20、O22、O25、O73、O75、或O83。在另一个具体实施方案中,本文提供的免疫原性组合物包含载体蛋白(例如5.2.1.2节所述载体蛋白),其缀合至本文所述的抗原,例如5.2.1.1节所述的抗原。在一个具体实施方案中,所述载体蛋白是EPA。在另一个具体实施方案中,所述抗原是大肠杆菌抗原,例如大肠杆菌多糖。在另一个具体实施方案中,本文提供的免疫原性组合物包含载体蛋白(例如5.2.1.2节所述的载体蛋白,例如EPA),其通过O1血清型的大肠杆菌O抗原(O1-EPA)糖基化。在另一个具体实施方案中,本文提供的免疫原性组合物包含载体蛋白(例如5.2.1.2节所述的载体蛋白,例如EPA),其通过O2血清型的大肠杆菌O抗原(O2-EPA)糖基化。在另一个具体实施方案中,本文提供的免疫原性组合物包含载体蛋白(例如5.2.1.2节所述的载体蛋白,例如EPA),其通过O6血清型的大肠杆菌O抗原(O6-EPA)糖基化。在其它具体实施方案中,本文提供的免疫原性组合物包含载体蛋白(例如5.2.1.2节所述的载体蛋白,例如EPA),其通过O1、O2、O4、O7、O8、O9、O11、O15、O16、O17、O18;O20、O22、O25、O73、O75、或O83血清型的大肠杆菌O抗原糖基化。本文提供的免疫原性组合物可以用于在施用组合物的宿主中激发免疫应答。因此,本文所述的免疫原性组合物可以用作疫苗并可以因此配制为药物组合物。在一个具体实施方案中,本文所述的免疫原性组合物用于预防大肠杆菌感染受试者(例如人受试者)。在一个具体实施方案中,本文所述的免疫原性组合物用作针对由大肠杆菌感染所引起的尿道感染的疫苗。例如,用作针对由大肠杆菌感染所引起的尿道感染的疫苗的本文所述的免疫原性组合物可包含载体蛋白(例如5.2.1.2节所述的载体蛋白,例如EPA),其通过大肠杆菌抗原(例如5.2.1.1节所述的大肠杆菌抗原)糖基化。在一个具体实施方案中,大肠杆菌抗原是O1、O2、O4、O7、O8、O9、O11、O15、O16、O17、O18;O20、O22、O25、O73、O75、或O83血清型的O抗原。在另一个具体实施方案中,本文所述的免疫原性组合物用于预防假单胞菌感染受试者(例如人受试者)。在另一个具体实施方案中,本文所述的免疫原性组合物用于预防志贺氏菌感染受试者(例如人受试者)。包含本文所述的生物缀合物的组合物可包含适合用于药物施用的任何额外组分。在具体实施方案中,本文所述的免疫原性组合物是单价制剂。在其它实施方案中,本文所述的免疫原性组合物是多价制剂。例如,多价制剂包含多于一种本文所述的生物缀合物。在某些实施方案中,本文所述的组合物额外包含防腐剂,例如汞衍生物硫柳汞。在一个具体实施方案中,本文所述的药物组合物包含0.001%至0.01%硫柳汞。在其它实施方案中,本文所述的药物组合物不包含防腐剂。在某些实施方案中,本文所述的组合物(例如免疫原性组合物)包含佐剂,或者与佐剂组合施用。用于与本文所述的组合物组合施用的佐剂可在施用所述组合物之前、同时、或者之后施用。在一些实施方案中,术语“佐剂”是指当与本文所述的组合物联合或作为其部分施用时提高、增强和/或加强针对生物缀合物的免疫应答、但当单独施用该化合物时不产生针对生物缀合物的免疫应答的化合物。在一些实施方案中,佐剂产生针对多聚生物缀合物多肽的免疫应答并且不产生过敏反应或其它不良反应。佐剂可以通过几种机制增强免疫应答,所述机制包括例如淋巴细胞募集、B和/或T细胞的刺激和巨噬细胞的刺激。佐剂的具体实例包括但不限于铝盐(明矾)(诸如氢氧化铝、磷酸铝和硫酸铝),3脱-O-酰基单磷酰脂质A(MPL)(参见英国专利GB2220211),MF59(Novartis),AS03(GlaxoSmithKline),AS04(GlaxoSmithKline),聚山梨酯80(Tween80;ICLAmericas,Inc.),咪唑并吡啶化合物(参见国际申请号PCT/US2007/064857,作为国际公开号WO2007/109812公开),咪唑并喹噁啉化合物(参见国际申请号PCT/US2007/064858,作为国际公开号WO2007/109813公开)和皂苷,诸如QS21(参见Kensil等人,VaccineDesign:TheSubunitandAdjuvantApproach(Powell&Newman编辑,PlenumPress,NY,1995);美国专利号5,057,540)。在一些实施方案中,佐剂是弗氏佐剂(完全的或不完全的)。其它佐剂是水包油乳剂(诸如角鲨烯或花生油),任选与免疫刺激剂诸如单磷酰脂质A(参见Stoute等人,N.336,86-91(1997))组合。另一种佐剂是CpG(BioworldToday,1998年11月15日)。5.4治疗和免疫的方法在一个实施方案中,本文提供治疗受试者中的感染的方法,其包括将本文所述的糖缀合物或其组合物施用于受试者。在一个具体实施方案中,本文所述的用于治疗感染的方法包括将有效量的本文所述的糖缀合物或其组合物施用于有需要的受试者。在另一个实施方案中,本文提供用于诱导受试者中的免疫应答的方法,其包括将本文所述的糖缀合物或其组合物施用于受试者。在一个具体实施方案中,用于诱导针对本文所述的糖缀合物的免疫应答的方法包括将有效量的本文所述的生物缀合物或其组合物施用于有需要的受试者。在另一个实施方案中,本文提供用于使用本文所述的生物缀合物或其组合物产生单克隆抗体以预防感染的方法。在一个具体实施方案中,施用糖缀合物或其组合物的受试者具有或者易受感染,例如细菌感染。在另一个具体实施方案中,施用生物缀合物或其组合物的受试者感染大肠杆菌或者易受大肠杆菌感染。6实施例6.1实施例1:用于大肠杆菌O1O抗原缀合物产生的菌株构建插入的第一步是通过标准分子克隆技术[1]将O1rfb簇克隆至供体质粒pDOC中。将O1rfb簇区域克隆至质粒pLAFR1中以证实活性(A,下文),并平行克隆至供体质粒pDOC中以将O1簇插入基因组中(B,下文)。A.将O1rfb簇及其侧接1.5kb区域亚克隆至粘粒载体pLAFR1(GenBank:AY532632.1)中。使用寡核苷酸2193/2161(参见表3)通过PCR从名为upecGVXN032(StGVXN3736)的临床分离物的染色体DNA扩增O1簇。寡核苷酸2193/2161在侧接O1rfb簇的基因中(即在galF中和gnd后)退火。将PCR产物克隆至p157的SgsI位点中。p157是含有由两个互补寡核苷酸(300/301)构成的盒的pLAFR1,将其克隆至EcoRI位点中,导致产生p947。使用p947作为模板,使用寡核苷酸2198/2166进行PCR以从5'末端(galF’)至簇的最后基因(wekO)末端的侧接区扩增O1rfb簇DNA(参见图3)。将产物克隆至p967的BamHI/SgsI位点,导致产生p985。p967从pDOC-C(GenBank:GQ889494.1)克隆,且含有MCS和kanR盒(对于细节,参见6.2节)。使用p985作为模板进行O1rfb簇的PCR,用于进一步插入p562中(参见下文)。B.如下制备p562:使用两种PCR产物和寡核苷酸1187/1188由组装PCR导致产生插入片段(参见表3)。使用寡核苷酸1188/1189从pKD3(GenBank:AY048742.1)产生一种PCR产物(参见表3;编码clmR盒和FRT位点),以及另一种是源自用寡核苷酸1186/1187的W3110基因组DNA的PCR的3'同源区(参见表3;即W3110基因组中的O16rfb簇下游的DNA,其编码基因间区域和gnd基因)。使用BamHI/EcoRI切割组装的DNA,并克隆至pDOC-C的相同位点中,导致产生p482。然后使用W3110染色体DNA和寡核苷酸1171/1515产生5'同源区的PCR产物(表示为galF'的galF基因的编码部分,以及galF和第一个O16基因之间的基因间区域),用BamHI和SpeI切割,并克隆至p482的SpeI/BamHI位点中,导致产生p562。p562编码具有位于其间的MCS和反向clmR抗性盒的5'和3'同源区(5':O16rfb簇的rmlB上游1kb;3':O16rfb簇的最后基因的1.6kb下游DNA)。MCS是用来插入使用寡核苷酸2214/2215从p985扩增的的O1rfb簇。所得质粒p1003是用于插入O1rfb簇的供体质粒,并含有如图3A和表1所示的元件。插入和选择:通过电穿孔将辅助质粒p999(GenBank:GU327533.1)引入W3110细胞中。因为p999的温度敏感的复制表型,所得细胞一直于30℃下生长于补充用于选择p999的壮观霉素的LB中。在下一步中,通过电穿孔将p1003引入含有p999的W3110细胞中。在30℃在LB培养基中针对氨苄青霉素和壮观霉素抗性选择细胞。将质粒插入受体细胞中以使得辅助质粒上编码的酶能够在相同细胞内存在供体质粒DNA的情况下表达。接下来,进行插入程序。在氨苄青霉素和壮观霉素存在的情况下,在30℃下以5ml规模以180rpm于LB培养基中使新鲜转化的菌株生长过夜。将10μl稠密培养物转移至含有1ml补充spec和amp的LB的新管中。然后以180rpm于30℃使新培养物生长2小时,将细胞以5000rpm于4℃离心5分钟,通过补充spec、0.2%阿拉伯糖(w/v)和1mMIPTG的LB培养基替换上清液。培养基组成支持辅助质粒选择,以及重组酶和SceI内切核酸酶表达以使得能够插入。将细胞重悬浮并进一步于30℃以180rpm孵育4-18小时。在培养基更换后的不同时间点,将0.5ml培养物在补充clm(用于选择DNA插入片段)和10%(w/v)蔗糖(以针对供体质粒反选择)的LB板上铺板,并在37℃孵育过夜(以针对温度敏感的辅助质粒的丢失进行选择)。为了针对正确插入表型筛选所得菌落,将细胞在补充spec、amp、或clm的LB板上复制铺板。将对clm抗性(存在插入片段)、但对amp和spec敏感(不存在供体和辅助质粒)的菌落针对插入进行进一步分析。为了证实菌株丢失源自W3110的替换DNA并含有DNA插入片段,进行菌落PCR。挑取具有正确表型(氨苄青霉素敏感性、氯霉素抗性、壮观霉素敏感性、蔗糖抗性)的候选菌落,并进行菌落PCR测试。使用PCR策略[51]鉴定肠外大肠杆菌(ExPEC)菌株中的O血清型。使用对于14种普通ExPECO血清型的rfb簇中存在的独特基因序列特异性的寡核苷酸对。在O1插入的情况下,使用了从O1(2241和2242)或O16扩增wzx的部分的寡核苷酸。检查各个克隆。通过用O16特异性寡核苷酸的PCR产物的不存在(未显示)和用O1寡核苷酸特异性信号的存在(图3B)在一些克隆中证实成功的插入。将所得菌株命名为W3110ΔrfbO16::rfbO1-clmR。在下一步中,通过使用如所报道[35]表达FLP重组酶的温度敏感的pCP20质粒将clmR盒从与O1rfb簇一起插入的DNA中去除。针对对clm的敏感性测试所得细胞,以及然后进一步测试。将所得菌株命名为W3110ΔrfbO16::rfbO1。此外,为了最佳糖缀合物生产,将O抗原连接酶(waaL)从生产菌株中缺失。这通过噬菌体转导进行。使用P1vir噬菌体(大肠杆菌遗传储备中心#12133)从W3110ΔwaaL::clmR菌株产生裂解物,其中waaL基因被使用寡核苷酸623和624通过PCR从pKD3中扩增的clmR盒替换[13,52]。在W3110ΔrfbO16::rfbO1上进行噬菌体转导,并将所得菌株命名为W3110ΔrfbO16::rfbO1ΔwaaL::clmR。随后,通过FLP驱动的重组去除氯霉素抗性盒(W3110ΔrfbO16::rfbO1ΔwaaL)。在重组工程改造和选择的每个阶段,针对O1wzx的存在进行PCR测试以证实O1rfb簇的存在(图3B)。可以进行进一步的PCR测试,其使用特异性扩增插入片段5'和3'末端的重组区域的寡核苷酸,即在HR1和2区域之外退火的寡核苷酸对(“5'和3'转换区PCR”)。例如,可以产生在W3110基因组中退火的一种PCR寡核苷酸,和在DNA插入片段中退火的另一种PCR寡核苷酸。因此,只有插入成功,阳性PCR信号才是可能的。然后可以对所得PCR产物测序以证实染色体受体菌株DNA和DNA插入片段的连接。此外,PCR和测序可以用来证实噬菌体转导和clmR盒去除修饰。为了证实插入DNA的活性,在菌株构建的不同阶段测试含有O1抗原多糖的插入菌株的糖脂生产。根据来自通过抗生素和蔗糖敏感性表型预筛以及PCR测试的阳性结果,选择来自初始插入实验的候选克隆。使细胞在LB培养基中生长过夜,并制备全细胞提取物。为了分析所产生的糖脂,用蛋白酶K处理提取物以去除可能的蛋白干扰。将所得样品在SDS-PAGE上运行,并通过银染染色,或者在转移至硝酸纤维素膜之后,使用抗O1特异性抗血清通过免疫染色检测。当通过银染分析来自推定整合体的提取物时,观察到指示LPS的25至55kDa之间的梯样模式(图4A,上小图,泳道1、2),如对照菌株中(泳道3)。Western印迹显示相同分子量范围的梯样信号,这证实LPS含有O1抗原(图4A,下小图,泳道1、2),如源自临床O1分离物的对照LPS(泳道3)。这些结果证实W3110ΔrfbO16::rfbO1-clmR中的脂质A上表现出的O1抗原产生。再次通过Western印迹(图4B,泳道1、2)测试W3110ΔrfbO16::rfbO1菌株(在去除clmR盒之后)以证实O1LPS产生,尽管进行了修饰。为了证实菌株W3110ΔrfbO16::rfbO1ΔwaaL::cat中通过噬菌体转导的waaL缺失,再次分析LPS产生(图4C,泳道1)。梯样信号如预期从银染测定中消失(上图)。Western印迹分析仍然检测到梯样信号(泳道1,下图),虽然具有低于对照菌株(W3110ΔrfbO16::rfbO1)的强度,所述对照菌株仍含有waaL基因(泳道2)并能够产生LPS,如银染所显现。更弱的信号源自Und-PP连接的O1O抗原,其由于waaL基因的缺失而不能转移至脂质A。这意味着通过噬菌体转导的waaL缺失如预期发生,证实基因型W3110ΔrfbO16::rfbO1ΔwaaL::cat。针对以与通过FLP源性重组相同的方式去除clmR盒选择所选克隆。通过银染和Western印迹分析所得克隆(W3110ΔrfbO16::rfbO1ΔwaaL)(图4D),并显示如图4D泳道1中观察到的相当的表型。通过额外的方法表征最终菌株W3110ΔrfbO16::rfbO1ΔwaaL。为了证实那些细胞在Und-PP上的O抗原的产生,使用允许通过荧光2AB标记、随后HPLC和MS/MS分子表征脂质连接的寡糖(Und-PP连接的O抗原)的方法。使W3110ΔrfbO16::rfbO1ΔwaaL和对照菌株(W3110ΔwaaL)于37℃在摇瓶中生长过夜。收获等于400的OD600的细胞,并用0.9%NaCl洗涤一次。将洗涤的细胞沉淀冻干。通过重复几轮涡旋并在冰上孵育10min而用95%甲醇(MeOH)从干燥的细胞中提取脂质。通过添加ddH2O将悬浮液转变成85%MeOH并在冰上进一步孵育10min,同时有规律地涡旋。离心之后,收集上清液并在N2下干燥提取物。将干燥的脂质溶于1:1(v/v)甲醇/水(M/W)中,并通过C18SepPak预装柱(WatersCorp.,Milford,MA)。用10mlMeOH调节预装柱,随后以1:1M/W的10ml10mMTBAP平衡。上样样品之后,以1:1M/W的10ml10mMTBAP洗涤预装柱,并用5mlMeOH、随后用5ml10:10:3氯仿/甲醇/水(C/M/W)洗脱。将合并的洗脱液在N2下干燥。通过将干燥样品溶于2ml50%正丙醇中的1M三氟乙酸(TFA)中并加热至50℃持续15min而水解脂质样品。将水解样品在N2下干燥,溶于4ml3:48:47C/M/W中并通过C18SepPak预装柱以将脂质与水解的聚糖分离。用10mlMeOH调节预装柱,随后用10ml3:48:47C/M/W平衡。将样品应用至预装柱,并收集流通物。用4ml3:48:47C/M/W洗涤预装柱,并使用SpeedVac干燥合并的流通物。根据Bigge等人[48]用2-氨基苯甲酰胺(2AB)标记干燥样品。如Merry等人[53]所述使用纸盘法进行聚糖清除。使用根据Royle等人[49]的GlycoSepN正相柱通过HPLC进行2AB标记聚糖的分离,但修改为三溶剂系统。溶剂A:80%乙腈中的10mM甲酸铵,pH4.4。溶剂B:40%乙腈中的30mM甲酸铵,pH4.4。溶剂C:0.5%甲酸。柱温为30℃,并通过荧光检测2AB标记的聚糖(λex=330nm,λem=420nm)。梯度条件:以0.4mlmin-1流速经160min的100%A至100%B的线性梯度,随后2min100%B至100%C,经2min回到100%A并在100%A以1mlmin-1的流速运行15min,然后使流速回到0.4mlmin-1,持续5min。将样品注入ddH2O中。为了鉴定O-抗原特异性聚糖,将来自对照细胞的2AB聚糖概况与获得自W3110ΔrfbO16::rfbO1ΔwaaL的概况相比较(图5A)。收集W3110ΔrfbO16::rfbO1ΔwaaL特异性峰,并在MALDISYNAPTHDMSQ-TOF系统(WatersCorp.,Milford,MA)上分析2AB聚糖(图5B)。将样品溶于5:95乙腈/水中,并用80:20甲醇/水中的20mgml-1DHB以1:1点样。用PEG(现成的混合溶液,WatersCorp.,Milford,MA)进行校准,用60:40:0.1乙腈/水/三氟乙酸中的5mgml-1α-氰基-4-羟基肉桂酸(CHCA,Sigma-Aldrich,Switzerland)以1:3点样。仪器配备有200Hz固态UV激光器。以正离子模式记录质谱。对于MSMS:激光能以200Hz发射率固定在240,碰撞气体为氩气,使用碰撞能谱根据m/z使碰撞能渐变(ramp)。合并所有光谱,减去背景、平滑(SavitzskyGolay)并使用MassLynxv4.0软件(WatersCorp.,Milford,MA)集中。该方法也描述于US2011/0274720A1。通过MALDI-TOF/TOF分析,源自W3110ΔrfbO16::rfbO1ΔwaaL特异性峰中的几个(图5B)的片段化离子系列与针对大肠杆菌的O1A血清亚型报道的的单糖序列[54]一致。由此证实适用于糖缀合物形成的产生O1AO抗原的基于W3110的大肠杆菌菌株的构建。为了显示该菌株的O1A糖缀合物的产生,将编码弯曲空肠菌的PglB寡糖基转移酶(五种不同变体,参见下文)和铜绿假单胞菌的载体蛋白外毒素A(编码4个糖基化共有序列,p659)的诱导型表达的质粒通过电穿孔引入W3110ΔrfbO16::rfbO1ΔwaaL中。将生产细胞接种至补充5mMMgCl2、spec和amp的LB培养基中,并在37℃下生长过夜至静止期。然后将细胞稀释至0.05的OD600,并在含有spec和amp的TB中生长直至0.8的OD600。通过添加0.2%阿拉伯糖和1mMIPTG来起始EPA和PglB表达,并使培养物再生长20小时。然后通过离心收获细胞,并使用溶菌酶方法[55]制备周质细胞提取物。通过SDSPAGE分离周质提取物(针对OD600均一化),并在电转移后通过免疫印迹分析(图6)。用抗EPA抗血清(左小图)和抗O1抗血清(右小图)检测都显示对于所有样品100至130kDa之间的清楚梯样模式,强烈表明由EPA蛋白和O1多糖组成的糖蛋白。用单独的EPA抗血清获得的信号(大于70kDa)对应于未糖基化的EPA。显然,不同PglB变体导致不同的糖蛋白比生产率:用对应于原始野生型弯曲空肠杆菌蛋白序列的含有C末端HA标签的PglB(p114,[9])获得了最小产率。单独的密码子优化(p939),密码子优化和HA标签去除(p970),密码子优化和天然PglB糖基化位点突变为N534Q(p948),以及密码子优化、HA标签去除和天然PglB糖基化位点的去除(p971),导致表明几倍更高产率的更强信号。更高产率可通过当使用密码子优化的基因时PglB翻译的更有效方式以及C末端HA标签妨碍PglB蛋白的活性或折叠来解释。生物反应器中的插入菌株可以以10l规模产生糖蛋白,用于表现出如用三质粒系统观察到的更短聚糖长度的高纯糖缀合物的制备型纯化。可以使用毛细管凝胶电泳来分析糖缀合物的纯度和大小。例如,连接至糖缀合物的多糖可以通过肼解从蛋白去除,并通过2AB标记和HPLC-MS/MS进行分析,用于分析多糖结构和长度。可以使用这样的分析来证实O1AO抗原连接至糖蛋白载体。此外,可以进行PMP分析用于单糖组成测定,NMR分析和气相层析用于结构证实。此外,可以进行动物免疫以产生针对聚糖和载体蛋白的抗体。抗感染活性可以使用临床前测定(诸如调理吞噬杀灭测定和/或被动保护)显示。6.2实施例2:用于大肠杆菌O2O抗原缀合物产生的菌株构建类似于实施例1进行菌株构建。将O2rfb簇克隆至由HR区和盒组成的pDOC质粒中,如表1中详述。用寡核苷酸2207/2166从临床分离物upecGVXN116(StGVXN3949)扩增O2rfb簇,并克隆至p967的BamHI/SgsI位点中。O2rfb扩增子含有从galF内直至wekR的所有序列。从DNA插入片段中删掉wekR和gnd之间的DNA。通过将由两个部分互补寡核苷酸(2167/2168)构成的寡聚盒插入p946的XhoI和BamHI位点而克隆p967。通过用AscI消化p843、用DNA聚合酶的Klenow片段处理线性化质粒以填平粘性限制性位点末端以及质粒的连续再连接而获得p946。使用相同的酶,将使用寡核苷酸2066和2068(参见表3)衍生自pKD4[13]的PCR扩增子克隆至p482的BamHI和SgsI位点来产生p843。所得供体质粒p1003含有来自upecGVXN116的上游HR1区和rfb簇,随后是可去除的kanR盒,并且随后是HR2区(图7)。通过电穿孔将p999辅助质粒(GenBank:GU327533.1)引入W3110细胞中[1]。将水中的5-500ngDNA与50μl电感受态细胞悬浮液在冰上的标准电穿孔槽中混合,并以1.8kV的电压在BioRadMicroPulser(BioRad,Hercules,CA)中电穿孔2-10ms。因为p999的温度敏感的复制表型,将所得细胞铺板并一直在30℃生长。在下一步中,通过在补充用于选择p999的壮观霉素的LB中使含有p999的W3110在30℃生长而制备感受态细胞,并通过电穿孔将p1003引入细胞中,以及在30℃于LB板上针对氨苄青霉素和壮观霉素抗性选择细胞。将质粒插入受体细胞中以使得辅助质粒上编码的酶能够在相同细胞中存在供体质粒DNA的情况下表达。在氨苄青霉素和壮观霉素存在的情况下,在30℃下以5ml规模以180rpm于LB培养基中使新鲜转化的菌株生长过夜。将10μl培养物转移至含有1ml补充spec和amp的液体LB的新管中。然后以180rpm于30℃使新培养物生长2小时。然后,将细胞以5000rpm于4℃离心5分钟,丢弃上清液,并添加补充壮观霉素、0.2%阿拉伯糖(w/v)和1mMIPTG的LB培养基以支持辅助质粒选择(Spec)和重组酶(阿拉伯糖)和SceI内切核酸酶(IPTG)表达。将重悬浮细胞进一步于30℃以180rpm孵育4-18小时。在培养基更换后4至18小时的不同时间点,将0.5ml培养物在补充kan(用于选择DNA插入片段)和10%(w/v)蔗糖(以针对供体质粒反选择)的LB上铺板,并在37℃孵育过夜(以针对温度敏感的辅助质粒的丢失进行选择)。为了针对正确插入表型筛选所得菌落,将细胞在补充spec、amp、或kan的LB板上复制铺板。将对kan抗性(存在插入片段)、但对amp和spec敏感(不存在供体和辅助质粒)的菌落针对插入进行进一步分析。在下一步中,如上所述通过噬菌体转导破坏waaL基因。针对clm(waaL缺失)和kan(O2rfb簇插入)抗性选择来自噬菌体转导的所得菌株,导致产生基因型W3110ΔrfbO16::rfbO2-kanRΔwaaL::cat。如所述使用pCP20通过FLP重组酶驱动的重组在单一步骤中去除kan(来自rfb簇插入)和clm(waaL缺失)的抗生素抗性盒[35]。使用以前公开的寡核苷酸2243和2244,通过PCR针对O16wzx的不存在和O2wzy的存在测试DNA插入片段的插入(图7A)。[51]。进一步分析可以包括5'和3'转换区PCR和测序。使用侧接waaL基因的DNA区域中退火的寡核苷酸1114和1326(参见表3),通过菌落PCR方法测试waaL缺失(图7B)。当存在完整waaL拷贝时,用这些寡核苷酸的PCR产物大于1.5kb(泳道1和5),如果waaL被clmR盒替换,则略微更小(低于1.5kb,泳道2和6),且在去除clmR盒之后,PCR扩增子为约0.5kb大小(图7B)。因此,waaL缺失是成功的。可以通过5'和3'转换区PCR测试最终菌株(W3110ΔrfbO16::rfbO2ΔwaaL)。使用LPS样品的O2分型血清的银染和Western印迹用来证实菌株构建期间的O抗原产生表型(图8)。当用抗O2抗血清探测时,在来自推定整合体(W3110ΔrfbO16::O2-kanR,A,泳道1)的提取物中以及阳性对照株临床大肠杆菌O2分离物(泳道2)中检测到梯带。这表明整合体含有活性O2rfb簇。通过银染(图8B,左小图)和Western印迹(图8B,右小图)针对LPS和Und-PPO抗原产生测试最终菌株(W3110ΔrfbO16::rfbO2ΔwaaL)。尽管waaL阳性菌株产生LPS,如通过具有梯样信号的银染所显现(泳道2),但在waaL缺失和抗生素盒去除后,信号不存在(泳道1)。Western印迹(图B)在两种样品中都显示出梯样模式,虽然waaL缺失菌株中强度低得多。这表明waaL缺失菌株的确产生Und-PP连接的O2反应性多糖。为了证实这些细胞产生Und-PP上的O抗原,使用如上所述的2AB标记方法(6.2节)。当与不能产生O抗原的菌株比较荧光痕迹时,观察到对于W3110ΔrfbO16::rfbO2ΔwaaL特异性的信号。特定峰洗脱时间是与以前鉴定的O2重复单元一致的,如通过MALDIMS/MS所分析(图9A)。如上所述通过MALDI-TOF/TOF分析来自几个收集峰的片段化离子系列。片段化模式是与O2O抗原重复单元一致的(图9B)。由此证实基于产生O2O抗原的W3110的大肠杆菌菌株W3110ΔrfbO16::rfbO2ΔwaaL的构建。为了显示W3110ΔrfbO16::rfbO2ΔwaaL的O2糖缀合物的产生,将用于弯曲空肠菌的PglB寡糖基转移酶(两种不同变体)和载体蛋白EPA(编码4个糖基化共有序列,p659)的诱导型表达的质粒通过电穿孔引入W3110ΔrfbO16::rfbO2ΔwaaL中。将细胞接种至补充5mMMgCl2、spec和amp的LB培养基中,并在37℃下生长过夜至静止期。然后将细胞稀释至0.05的OD600,并在含有spec和amp的TB中生长直至0.8的OD600。通过添加0.2%阿拉伯糖和1mMIPTG来起始EPA和PglB表达,并使培养物再生长20小时。然后通过离心收获细胞,并使用溶菌酶方法[55]制备周质细胞提取物。通过SDSPAGE分离周质提取物(针对细胞密度均一化),并通过western印迹分析(图10)。用抗EPA抗血清(左小图)和抗O2抗血清(右小图)检测都显示大于100kDa的典型O抗原梯样模式的两个簇,强烈表明由EPA蛋白和O1多糖组成的糖蛋白。用单独的EPA抗血清获得的信号(大于70kDa)对应于未糖基化的EPA。第一个簇(100和130kDa之间)对应于单糖基化的EPA蛋白,第二个较弱的簇(高于130kDa)对应于双糖基化的EPA蛋白。在抗O2western印迹中观察到的梯样信号最可能是仍含有多糖部分的EPAO2糖缀合物的降解产物。显然两种PglB变体导致相似的糖蛋白的比生产率。upecGVXN124(StGVXN3947)是临床O2血清型分离物,其中缺失waaL基因[13],并通过电穿孔将质粒p659和p939引入其中。使用该对照表达系统作为比较物(泳道x),从源自W3110ΔrfbO16::rfbO2ΔwaaL的提取物(泳道B)观察到比从使用临床分离物(upecGVXN124)作为表达宿主的表达系统更强的信号。因此,W3110中的插入可以导致产生与天然菌株中的糖基化相比更高的糖缀合物产率。生物反应器中的插入菌株也可以以10l规模产生糖蛋白,用于表现出如用三质粒系统观察到的更短聚糖长度的高纯糖缀合物的制备型纯化。可以使用毛细管凝胶电泳来分析糖缀合物的纯度、量和大小。连接至糖缀合物的多糖可以通过肼解从蛋白去除,并通过2AB标记和HPLC-MS/MS进行分析,用于分析多糖结构和长度。可以使用该分析来证实O2O抗原连接至糖蛋白载体。此外,可以进行PMP分析用于单糖组成测定,NMR分析和气相层析用于结构验证。进一步,可以进行动物免疫以产生针对聚糖和载体蛋白的抗体。抗感染活性可以通过使用测定(诸如调理吞噬杀灭测定和/或被动保护)显示。6.3实施例3:用于大肠杆菌O6O抗原缀合物生产的菌株构建如上所述进行菌株构建。将O6rfb簇克隆至由HR区和kanR盒组成的pDOC质粒中,如表1中详述。用寡核苷酸1907/1908从来自大肠杆菌菌株CCUG11309的基因组DNA扩增O6簇(图11A),并克隆至p843的BamHI和BcuI位点中,导致产生p914。通过电穿孔将p999辅助质粒(GenBank:GU327533.1)引入W3110细胞中[1]。将水中的5-500ngDNA与50μl电感受态细胞悬浮液在冰上的标准电穿孔槽中混合,并以1.8kV的电压在BioRadMicroPulser(BioRad)中电穿孔2-10ms。因为p999的温度敏感的复制表型,将所得细胞铺板并一直在30℃生长。在下一步中,通过电穿孔将p914引入具有p999的W3110中,并在30℃在LB板上针对amp和spec抗性选择细胞。将质粒插入受体细胞中以使得辅助质粒上编码的酶能够在相同细胞中存在供体质粒DNA的情况下表达。在amp和spec存在的情况下,在30℃下以5ml规模以180rpm于LB培养基中使含有辅助和供体质粒的电穿孔克隆生长过夜。将10μl培养物转移至含有1ml补充spec和amp的液体LB的新管中。然后以180rpm于30℃使新培养物生长2小时。然后,更换培养基:将培养物以5000rpm于4℃离心5分钟,丢弃上清液,并将细胞沉淀重悬浮于补充spec、0.2%阿拉伯糖(w/v)和1mMIPTG的LB培养基中以支持辅助质粒选择(Spec)和重组酶(ara)和SceI内切核酸酶(IPTG)表达。将重悬浮细胞进一步于30℃以180rpm孵育4-18小时以允许重组事件发生。在培养基更换后4至18小时的不同时间点,将0.5ml培养物在补充kan(用于选择DNA插入片段)和10%(w/v)蔗糖(以针对供体质粒反选择)的LB上铺板,并在37℃孵育过夜(以针对温度敏感的辅助质粒的丢失进行选择)。为了针对正确插入表型(W3110ΔrfbO16::rfbO6-kanR)筛选所得菌落,将细胞在补充spec、amp、或kan的LB板上复制铺板。将对kan抗性(存在DNA插入片段)、但对amp和spec敏感(不存在供体和辅助质粒)的菌落针对插入进行进一步分析。此外,进行菌落印迹。将生长在补充kan的LB上的复制铺板的菌落通过“菌落提升(colonylifting)”转移至硝酸纤维素膜:将圆形硝酸纤维素膜铺在LB板上正在生长的菌落之上,直至膜完全湿润。提起膜后,将粘附于膜的菌落在补充Tween20(0.02%w/v)的PBS中洗掉。此后,将膜处理作为使用抗O6抗血清的western印迹,用于检测产生O6抗原的菌落。在膜显色之后,阳性菌落显示为黑点。如所述使用质粒pCP20通过FLP重组酶驱动的重组在单一步骤中去除kan(来自rfb簇插入)和clm(waaL缺失)的抗生素抗性盒[35]。通过针对O16wzx的不存在和O6wzy的存在的PCR[51](图11D)、通过5'(图11B)和3'(图11C)转换区PCR、LPS样品的银染和使用O6分型血清的western印迹分析(图12)测试DNA插入片段的插入。当用抗O6血清分析时,只有克隆A(图12A,泳道1)产生梯样O抗原信号(如大肠杆菌O6对照菌株,泳道3),而克隆B是阴性的(泳道2)。所有进一步测试对于rfb簇的功能性活性都是阳性的。在下一步中,如上所述通过来自克隆A的噬菌体转导破坏waaL基因[52]。银染显示waaL缺失菌株不存在O抗原(图12B,左小图,泳道1),以及western分析显示相同提取物中作为典型的弱梯样信号的Und-PP连接的O6O抗原(图12B,右小图,泳道1)。在waaL缺失之前,清楚地观察到LPS(两个小图,泳道2)。该结果显示成功的waaL缺失。通过FLP重组在两个连续步骤中去除clm(waaL缺失)以及然后kan(rfb簇插入)的抗生素抗性盒[35]。图12C显示在clmR去除之后具有剩余Und-PP连接的信号的两个克隆(泳道1,2)(western印迹,右小图)。通过5'和3'转换区PCR测试最终菌株(两个克隆,W3110ΔrfbO16::rfbO6ΔwaaL)(图11A和B)。可以进行LPS的银染,Western印迹和Und-PP连接的多糖的荧光2AB标记随后HPLC和MS/MS分析来证实。所有数据都可以证实成功的插入,以及两个所选克隆中的rfb簇的功能活性。为了显示O6糖缀合物的产生,通过电穿孔将提供弯曲空肠杆菌的PglB寡糖基转移酶(p939)和载体蛋白EPA(编码4个糖基化共有序列,p659)的诱导型表达的质粒引入W3110ΔrfbO16::rfbO6-kanRΔwaaL(即最终菌株W3110ΔrfbO16::rfbO6ΔwaaL的原型)中。使细胞生长并添加诱导物,并使细胞进一步生长过夜。收集样品,并使用溶菌酶方法[55]制备周质细胞提取物。通过SDSPAGE分离周质提取物(针对细胞密度均一化),并在电转移后通过免疫印迹进行分析。用抗EPA抗血清和抗O6抗血清两者的检测都显示两个清楚的梯样信号簇,一个在100和130之间,且一个高于130kDa(图13)。这些信号强烈指示由EPA蛋白和O6多糖组成的糖蛋白。用单独的EPA抗血清获得的信号(高于70kDa)对应于未糖基化的EPA。显然检测到两个梯样簇,指示在两个位点糖基化的EPA。还可以在生物反应器中以10l规模通过插入菌株产生糖蛋白,用于糖缀合物的制备型纯化。连接至糖缀合物的多糖可以通过肼解从蛋白去除,并通过2AB标记和HPLC-MS/MS分析为Und-PP连接的O抗原。该分析可以证实O6抗原连接至糖蛋白载体。为了在缀合物产生的质量和数量方面分析插入菌株,将插入菌株的O1、O2和O6EPA糖缀合物产生的性能与替代生产系统进行比较,所述替代生产系统是“三质粒系统”,即具有现有技术[9]中所述附加体上编码的rfb簇的系统,或者“野生型菌株”系统。在前者中,W3110ΔwaaL菌株用作表达宿主。该系统中与插入的和野生型系统相比存在一些技术差异。三质粒系统需要在宿主中引入和维持三种质粒。这意味着发酵期间不得不将三种不同的抗生素添加至培养基中以确保质粒维持。三种质粒的共存需要相容的载体骨架。尤其是大的rfb簇序列需要指定维持系统和强选择压力。对于重组微生物发酵产物,质粒维持是生产过程中产率降低的恒定原因,主要是因为发生质粒丢失,且因此受影响的细胞停止产生重组产物,或者因为质粒维持将该负担施加于细胞使得产率降低。由于人对抗生素的潜在过敏性不良事件,监管机构越来越要求不含抗生素的生产过程。因此,将以前存在于附加体上的生物合成簇整合至染色体具有明确优点。第二种可能的生产系统基于源自受感染个体或者来自野外的天然临床分离物,并使用它们作为生产平台。由于它们天然产生目的O抗原,简单的waaL缺失使得那些菌株成为合适的天然插入生产菌株。然而,由于大肠杆菌临床分离物中编码并表达许多毒素和因子,监管机构对来自这样的系统的产品要求更高的质量标准,这是昂贵且费时的。因此,插入充分研究且安全的宿主W3110中代表合适的替代方案:减少质粒相关的缺点,并满足经济需求。我们针对所有三种大肠杆菌O抗原分析所有三种生产系统(图14)。将EPA(p659)和PglB(p939)的表达质粒引入在基因组中(插入菌株或临床分离物)或质粒上(三质粒系统)含有rfb基因座的宿主细胞中。首先使细菌培养物在LB培养基中生长过夜,所述LB培养基含有维持细胞中存在的质粒必需的所有抗生素。然后,将培养物在TB培养基中稀释至0.05的OD600,并生长直至0.4-1.2的OD600,且添加诱导物(阿拉伯糖0.2%,IPTG1mM)。在37℃诱导后20小时,收获细胞,并使用溶菌酶方法制备周质提取物。然后通过SDSPAGE和免疫检测(western印迹)分析周质裂解物。在抗-EPA印迹中观察到高于70kDa的未糖基化的EPA。高于100kDa成簇的梯样模式代表具有典型O抗原多糖长度分布的全长糖缀合物。通常,所有系统都产生相似数量级的糖缀合物。然而,三质粒系统在抗-EPA和抗多糖Western印迹中产生似乎比插入菌株(野生型和插入的)分布更广(图14,小图A,比较泳道3和2)或者达到更高分子量水平(所有小图,比较泳道3和2)的梯样信号。这显示插入策略是用于糖缀合物产生的强力的过程调节工具(图14)。可以进行长多糖糖缀合物(由三质粒系统制备)和插入菌株的临床前比较,以确定后者缀合物是否更有免疫原性且更确定的。可以进行生产培养物中培养物均一性和重组DNA元件的维持的比较,以显示来自插入宿主菌株的细胞能够产生更高水平的产物、表现出更好的再现性模式且它们是遗传上更稳定的,由此证实插入由于扩大规模的高可行性是优异的。6.4实施例4:用于宋内志贺氏菌(S.sonnei)O抗原产生的菌株构建类志贺氏邻单胞菌O17簇与宋内志贺氏菌rfb簇在功能上是相同的,但不在不稳定的病原性质粒上编码,并由此从类志贺氏邻单胞菌克隆。用寡核苷酸1508/1509(不具有wzz)和1528/1509(具有wzz)从来自类志贺氏邻单胞菌O17的基因组DNA扩增该簇。将类志贺氏邻单胞菌O17的rfb簇克隆至pDOC衍生质粒p562中,导致产生p563(其中包括wzz)和p568(缺乏wzz基因)。辅助质粒由HR区和选择盒组成,如表1中详述。如实施例1所述进行菌株构建。通过针对O16wzy的不存在和宋内志贺氏菌wzy-wbgV的存在的PCR、通过5'和3'转换区PCR(图15)、LPS样品的银染和使用宋内志贺氏菌分型血清的Western印迹分析(图16)测试DNA插入片段的插入。6.5实施例5:用于痢疾志贺氏菌(S.dysenteriae)O抗原糖缀合物产生的插入菌株尽管痢疾志贺氏菌的rfp和rfb簇形成在大肠杆菌中产生O抗原的功能单元,但在痢疾志贺氏菌基因组中,它们存在于不同位置([8])。将两个簇克隆至由HR区和选择盒组成的pDOC质粒中,如表1中详述。将来自含有rfb/rfp([8])的质粒pSDM7的BamHI片段亚克隆至含有合适MCS盒的pLAFR1中。由此,使用寡核苷酸1261和1272(参见表3)将一个扩增子中的rfp/rfb克隆至pDOC衍生的p503中,导致产生p504。p503从p482克隆(参见6.1节):编码用于插入的HR1区、含有galF的一部分(galF')和菌株W3110的galF和rmlB之间的基因间区域(使用寡核苷酸1171/1263)的PCR扩增子用SpeI和BamHI消化,并连接至用相同的酶消化的p482中(导致产生p503)。rfp和rfb作为痢疾志贺氏菌I型基因组上的两个分离簇而发现,并进行克隆,当从p504表达时,对于galF'、rfp、rfb和gnd的翻译方向是相同的。DNA插入片段的插入在waaL阳性和阴性菌株中进行,并通过针对O16wzy的不存在的PCR、通过5'和3'转换区PCR、LPS样品的银染和使用分型血清的Western印迹分析来测试(未显示)。图17显示clmR盒去除之前和之后的插入的W3110ΔrfbO16::rfbSd1ΔwaaL和W3110ΔrfbO16::rfbSd1的糖脂分析。当在SDSPAGE之后通过银染分析提取物时,只有waaL阳性菌株显示LPS的典型O抗原模式,而ΔwaaL菌株则没有显示。所有菌株都应答于抗痢疾志贺氏菌1O抗原特异性抗血清,这证实这些菌株中重组O抗原的产生(图17)。为了分析重组O抗原的结构的分子细节,通过细胞的水解有机提取物的2AB标记和正相HPLC分析来自W3110ΔrfbO16::rfbSd1-clmRΔwaaL的Und-PP结合的多糖合并物(图18)。痕迹显示SDSPAGE中经常观察到的梯样模式。可以使用特定峰的MS/MS分析来证实痢疾志贺氏菌1型多糖序列。W3110ΔrfbO16::rfbSd1-clmRΔwaaL是用于如下所述产生EPA痢疾志贺氏菌1缀合物的宿主。为了证实使用该菌株产生糖缀合物疫苗候选,将表达质粒p293和p114转化至菌株中并在生物反应器中以10l规模发酵。纯化EPA缀合物,并通过经典层析法去除未糖基化的EPA。通过SECHPLC(图19A),SDSPAGE随后通过考马斯染色或者免疫检测(图19C),单糖组成分析(图19B),以及肼解随后2AB标记、HPLC分析和MS/MS(图19D)分析所得最终批次以证实糖结构和缀合物质量。6.6实施例6:用于弗氏志贺氏菌(S.flexneri)2aO抗原糖缀合物产生的插入菌株志贺氏菌O抗原在免疫学上是多样的。对于使用O抗原多糖作为抗原的针对志贺氏菌的综合疫苗,据信必须包括至少五种血清型的O抗原结构,以导致足够覆盖范围。目的是包括尽可能多的来自最流行感染菌株的抗原性元件,并含有痢疾志贺氏菌1型、宋内志贺氏菌和弗氏志贺氏菌6型以及弗氏志贺氏菌2a和3aO抗原[56]。血清型2a和3a基于称为血清型Y的相同O抗原骨架多糖结构。在弗氏志贺氏菌中存在巨大的O血清型多样性。这是由于通过葡萄糖和乙酰基对Y血清型重复单元的修饰。这类修饰是构成2a或3a血清型结构的原因(图20A)。Y骨架修饰是多样的,并且不同修饰的组合导致许多血清学上交叉反应的多糖结构。血清学2a和3a含有志贺氏菌中经常发现的两种不同的葡萄糖和一种乙酰化分支修饰,并因此包括于疫苗中以针对其它交叉反应性抗原进行保护。产生结构多样性的修饰酶是特定转移酶,其将葡萄糖和乙酰基残基连接至血清型Y的骨架。尽管所述骨架全部在rfb簇中编码,但负责添加葡萄糖或乙酰基的酶在rfb簇之外编码。对一些大肠杆菌O抗原(例如O16)进行相同的观察。由于在许多情况下,据信骨架修饰对于免疫原性是重要的,所以它们必须包括在插入的生产菌株中。对于需要位于rfb簇之外的糖基转移酶(或者乙酰基转移酶)的产生O抗原的插入大肠杆菌菌株的构建,首先构建含有额外转移酶的宿主菌株,并通过共表达来自质粒的rfb簇来测试其功能性。在进一步步骤中,进行替换W3110rfb簇的O抗原簇的插入。这些事件的顺序纯粹是实用的而不是系统化的,即顺序可以倒置。执行该程序以制备弗氏志贺氏菌2aO抗原,并且显示用该菌株制备的糖缀合物在临床前测试中是功能活性的。我们选择大肠杆菌W3110作为用于2a和3a糖缀合物产生的宿主菌株,因为它具有证明的有效糖缀合物产生能力。W3110是O抗原产生缺陷的,这是由于O16rfb簇中糖基转移酶基因被破坏。然而,为了避免来自rfb簇的剩余活性潜在干扰我们计划的测定,缺失rfb糖基和乙酰基转移酶基因wbbIJK[13]。通过使用由大肠杆菌重组酶使用的dif位点发挥功能的位点特异性重组自动去除选择盒[14]。当表达克隆自菌株弗氏志贺氏菌2457T(血清型2a)的弗氏志贺氏菌rfb簇时,提取物的糖脂分析显示弗氏志贺氏菌血清型Y表型。来自这些提取物的LPS对侧链修饰特异性的抗群II和抗群7、8抗血清没有反应(图20C,泳道1)。为了将葡萄糖修饰添加至Y血清型,利用大肠杆菌W3110中存在的已有修饰系统。葡萄糖修饰经常由源自原噬菌体DNA插入片段的酶促机制所催化[57]。大肠杆菌W3110含有这种称为gtr操纵子的遗传元件。gtr操纵子含有三个基因。前两个基因是高度保守的,并且是迄今鉴定的大多数gtr簇共有的(gtrAB)。第三个基因编码葡萄糖基转移酶,所述葡萄糖基转移酶将葡萄糖添加至膜周质侧上的正在生长的O抗原链中的特定位置。在W3110的情况下,该基因命名为gtrS。在弗氏志贺氏菌2a和3a中,存在gtr簇。各自的gtrAB基因是高度同源的,而第三个基因(2a中的gtrII和3a中的gtrX)是不同的[32]。由于它们与W3110系统的机制同源性,据推理,用gtrII或gtrX交换gtrS也将转移葡萄糖修饰活性。为了测试该假设,通过同源重组[13]使用如所述[14]的盒剪切策略用gtrII或gtrX交换gtrS基因。将侧接dif位点的clmR盒置于质粒p411中的化学合成的gtrII或gtrXORFs的下游。使用寡核苷酸1018和1019从p411产生编码gtrII和clmR的PCR片段。寡核苷酸突出端与gtrSORF上游(gtrB序列)和下游的序列相同。使用该扩增子,进行同源重组[13]。通过菌落PCR(使用寡核苷酸1016/1017)检查正确的重组,并且将PCR产物测序(图20B)。为了检查gtr酶是否可以修饰Y型骨架结构,用表达来自菌株2457T的rfb簇的质粒转化阳性菌株。来自这些细胞的提取物含有LPS,如通过银染所分析,但它们的电泳迁移率似乎与单独表达rfb簇的对照菌株存在轻微差异(图20C,左小图,比较泳道1、2、3)。如以前用葡萄糖侧链特异性抗血清探测相同提取物,并且如预期,抗群II抗血清对W3110ΔgtrS::gtrII菌株产生信号,且用抗群7、8抗血清,W3110ΔgtrS::gtrX菌株产生信号。因此,gtr基因交换将葡萄糖修饰的特定能力转移至大肠杆菌W3110,导致产生菌株W3110ΔgtrS::gtrII和W3110ΔgtrS::gtrX。类似地,可以将整个gtr簇或者还可以仅将第三个基因(即特定葡萄糖基转移酶)插入合适宿主菌株中,以产生重组糖缀合物表达菌株中的修饰活性。为了用乙酰化修饰完成弗氏志贺氏菌3a结构,可以使用类似策略将已知乙酰基转移酶基因插入生产菌株中。对于2a血清型,可以使用基因组测序和同源性分析来鉴定可以针对多糖修饰活性进行测试的候选乙酰基转移酶基因。为了用重组2aO抗原适应蛋白糖基化,通过同源重组[13,14]缺失waaL基因,导致产生菌株W3110ΔgtrS::gtrIIΔwaaL。此外,如实施例1所述用来自弗氏志贺氏菌2457T的rfb簇交换大肠杆菌W3110rfb簇,导致产生W3110ΔrfbO16::rfb2457TΔgtrS::gtrIIΔwaaL。通过插入使用寡核苷酸1171和1172制备的PCR扩增子,从p482构建供体质粒p487。此外,为了避免用于诱导载体蛋白的阿拉伯糖的代谢降解,破坏该菌株中的araBAD簇。众所周知的是,当重组蛋白受araBAD启动子系统控制时,araBAD缺失增加产率。因此,用制备自菌株W3110ΔaraBAD::cat的噬菌体裂解物转导菌株W3110ΔrfbO16::rfb2457TΔgtrS::gtrIIΔwaaL。通过同源重组使用DNA插入片段制备W3110ΔaraBAD::clmR,所述DNA插入片段通过使用寡核苷酸1562和1563以及pKD3作为模板[13]的PCR制备。为了将所得菌株W3110ΔaraBAD::clmRΔrfbO16::rfb2457TΔgtrS::gtrIIΔwaaL用于工业规模疫苗候选生产,将含有2个糖基化位点的EPA载体蛋白的表达质粒(p293)和含有HA标签的pglB寡糖基转移酶的表达载体(p114)通过电转化引入W3110ΔaraBAD::clmRΔrfbO16::rfb2457TΔgtrS::gtrIIΔwaaL中。以10l规模发酵所得菌株,并从所得生物量纯化EPA糖缀合物。进行纯化以去除宿主细胞杂质和未糖基化的载体蛋白。通过SECHPLC(图21B),SDSPAGE随后考马斯染色和免疫检测(图21A),肼解随后MS/MS(图21D),单糖组成分析(图21C),和用于绝对单糖构型的GC/MS(未显示)表征缀合物(参见5.2.1.7和5.3.5)。该数据证实菌株的插入和染色体修饰导致产生用于产生弗氏志贺氏菌2a疫苗产品候选的有效的生产系统。为了显示疫苗候选在动物模型中是有功能的,测试在含有p114和p293的插入菌株W3110ΔaraBAD::clmRΔrfbO16::rfb2457TΔgtrS::gtrIIΔwaaL中产生的2a-EPA大肠杆菌糖缀合物疫苗的免疫原性。用含有PBS中的2.5μg碳水化合物的2a-EPA缀合物或单独的PBS以三周间隔三次皮下施用于大鼠(图22)。结果显示大多数个体中的显著血清转化,并且与接受对照注射(PBS)的动物相比,在免疫动物(di-BC和Flex-BC组)中的平均对数效价是统计学显著更高的。该结果还显示,对于免疫原性和由此可能的效力,O抗原的乙酰化是不需要的。通过使用相同程序、但生产菌株弗氏志贺氏菌2aΔwaaL具有引入的p114和p293,在减毒的弗氏志贺氏菌2a菌株(菌株2457T)中产生乙酰化的2a-EPA糖缀合物(Flex-BC)。已知菌株2457T乙酰化其O抗原[58]。6.7实施例7:用于铜绿假单胞菌O11O抗原产生的插入菌株将O11O抗原簇克隆至由HR区和选择盒组成的pDOC质粒中,如表1中详述。用寡核苷酸2245/2247(参见表3)从铜绿假单胞菌菌株PA103扩增O抗原簇。如实施例1中所述进行菌株构建。通过针对O16wzx的不存在和O11的存在的PCR、通过5'和3'转换区PCR、LPS样品的银染和使用铜绿假单胞菌抗群E(O11)分型血清的western印迹分析来测试DNA插入片段(具有wzz)在W3110ΔwaaL中的插入。在所示实例中,针对O11O抗原产生测试具有正确抗生素抗性表型的4个克隆(A至D,泳道1-4),并且当用抗群E血清分析时,它们产生典型的梯样O抗原信号,其具有对应于约34kDa大小的电泳迁移率(图23)。使用了含有具有wzz和不具有wzz的供体质粒的大肠杆菌DH5a细胞作为对照(泳道5和6)。对照菌株含有活性waaL基因,并因此产生O11LPS,其显示不同于O11Und-PP的模式(泳道1-4)。因此,信号更强且在更高的分子量范围中观察到。在不存在wzz的情况下(泳道6),信号集中于更小的分子量,这表明大肠杆菌O16wzz可以有效接管该功能。综上,这些结果显示铜绿假单胞菌O11O抗原簇在大肠杆菌中的成功插入和功能表达。额外的数据表明铜绿假单胞菌O11wzz对于大肠杆菌DH5a中的链调节是有活性的,并且其活性可以通过wzz类的大肠杆菌链长调节剂酶类进行功能性替换。6.8.实施例8:嵌合的非天然簇的插入在大肠杆菌中实现了革兰氏阳性荚膜多糖产生和使用该多糖对载体蛋白的糖基化[10]。多糖通过由融合构建体构成的引入DNA合成,所述融合构建体由O抗原簇片段和CPS簇片段组成以制备具有CPS结构的重组O抗原。将这样构建的嵌合簇在两个不同位置插入W3110基因组中,以测试Und-PP-CP5的生产率。为了引导插入,将不同的同源区克隆至供体质粒中。在一种情况下,目标位点是如上述实施例中的W3110rfb簇,即HR区是来自O16rfb簇中含有的ORFs的上游和下游区域。为了将HR位点插入pDOC-C中,用HindIII和XhoI切割pDOC-C,并将用相同的酶切割的组装PCR产物连接至其中。用寡核苷酸1182和1184在两种PCR产物上进行组装,所述PCR产物使用i)寡核苷酸1181和1182、或ii)寡核苷酸1183和1184产生,并且在两种情况下均以W3110ΔwaaL的基因组DNA作为模板DNA。所得质粒为p473。使用寡核苷酸1142和771(或1281)从质粒(p393,US2011/0274720A1)扩增产生嵌合CP5的基因簇,用于通过使用Eco81I克隆至p473中,导致产生p477(或p498)。p498以在该质粒中缺失O11簇的wzz和wzx(与其中存在wzz和wzx的p477相比)的方式克隆。在另一种情况下,插入在侧接ECA基因wecA和wzzE的目标位点处进行。由于wecA可与重组多糖竞争细胞中可用的Und-P,因此推理wecA的缺失导致产生更高的CP5多糖产率。为了制备允许wecA和wzzE替换的供体质粒,首先用两个HR区以及然后用插入的CP5嵌合簇修饰pDOC-C。使用W3110染色体DNA作为模板,使用寡核苷酸1126和1129以及1127和1128扩增HR区1和2。使用寡核苷酸1126和1127组装PCR产物,并将组装的HRs克隆至pDOC-C的XhoI和HindIII位点中,导致产生p467。使用寡核苷酸1142和771从质粒(p393,US2011/0274720A1)扩增产生嵌合CP5的基因簇,并将相应PCR产物克隆至p467的位点Eco81I中,导致产生p471。使用p471、p498和p477在两个位置中的插入详细如实施例1中所述进行。将供体和辅助质粒电穿孔至W3110细胞中,并如上所述处理细胞。使用菌落PCR方法证实正确插入位置。为了显示所述插入导致产生能够产生重组O抗原的菌株,通过SDSPAGE分离蛋白酶K处理的来自插入克隆和对照细胞的细胞裂解物,并且通过银染色,或者转移至硝酸纤维素膜,并用抗CP5特异性抗血清探测。作为对照,分析来自含有相应供体质粒的DH5α细胞或含有表达CP5修饰的O抗原的p393粘粒(US2011/0274720A1)的W3110ΔwecA的提取物。获得不同的梯样信号强度(图24),供体质粒p471的信号最强(泳道7),p498的信号类似地强(泳道5),p477的信号弱(泳道6)。泳道4含有具有p473的阴性对照细胞,其不含嵌合的CP5簇,仅含HR1和2区,并且没有CP5信号。低分子量的梯样信号最可能是由于ECA多糖而不是CP5,因为用CP5特异性抗血清没有检测到它们。p498和p477的区别在于编码铜绿假单胞菌O11wzz和wzx基因的小DNA段,其存在于p477中。因此得出结论,wzz-wzx由于启动子效应而限制糖脂产生。含有包括wzz-wzx的嵌合簇的p471最可能从HR1中存在的ECA启动子转录。因此,p471中的位置支持CP5生物合成。插入的克隆使用p471(泳道1)、p477(泳道2)和p498(泳道3)作为供体质粒来制备。尽管信号通常弱得多,但检测到中间梯带和低分子量条带的特异性检测。源自最强供体质粒的克隆的强度最强(图24)。因此,该数据证实呈现的插入方法可以将至少达16kb长的DNA片段插入不同的可选择位置。6.9.实施例9:具有插入寡糖基转移酶的细菌菌株产生生物缀合物本实施例表明,可以通过已通过将编码寡糖基转移酶的核酸插入细菌宿主细胞基因组中而遗传修饰的细菌宿主菌株成功产生生物缀合物。使用Staby™CodonT7技术(DelphiGenetics,Charleroi,Belgium)将具有HA标签的空肠弯曲菌的PglB基因稳定插入大肠杆菌菌株MG1655(K12)的基因组中。作为产生具有插入pglB的大肠杆菌菌株的方法的一部分,将pglB从p114质粒分离,融合至galK基因,并插入宿主细胞基因组中替换waaL基因。证实所得大肠杆菌菌株MG1655waaL::pglB-galK含有正确序列的稳定整合pglB。为了评估MG1655waaL::pglB-galK产生生物缀合物的能力,将两个质粒引入菌株中。第一个质粒p64包含编码痢疾志贺氏菌O1基因簇的核酸。第二个质粒p271包含编码具有组氨酸标签的EPA载体蛋白的核酸。将宿主细胞培养4小时或过夜,分离,并用抗-HA抗体进行Western印迹分析以鉴定pglB产生,以及用抗-his抗体分析以鉴定EPA产生。Western印迹证实,表达质粒p64和p271的MG1655waaL::pglB-galK宿主菌株成功产生EPA和pglB蛋白两者。参见图25。重要的是,鉴定到O1-EPA生物缀合物,表明插入的pglB基因在宿主细胞中产生功能性寡糖基转移酶的能力,并由此表明pglB基因可以插入细菌宿主细胞中且保留其功能。参见图25。在评估MG1655waaL::pglB-galK产生生物缀合物的能力的另一个实验中,将不同质粒引入菌株中。第一个质粒p281包含编码痢疾志贺氏菌O1基因簇的核酸。第二个质粒p293包含编码EPA载体蛋白的核酸。将宿主细胞在生物反应器中培养长达16小时。在各个时间点,使用抗-EPA和抗-HA抗体通过Western印迹分析评估pglB和EPA的产生。如图26中所示,Western印迹证实,表达质粒p281和p293的MG1655waaL::pglB-galK宿主菌株成功产生EPA和pglB蛋白两者。重要的是,如用表达质粒p64和p271的MG1655waaL::pglB-galK宿主菌株所观察到,表达质粒p281和p293的MG1655waaL::pglB-galK宿主菌株产生O1-EPA生物缀合物,表明插入的pglB基因在宿主细胞中产生功能性寡糖基转移酶的能力,并由此证实pglB基因可以插入细菌宿主细胞中且保留其功能。接下来,使用生物缀合物纯化策略成功分离表达质粒p281和p293的MG1655waaL::pglB-galK宿主菌株产生的O1-EPA生物缀合物。参见图26。简言之,将从生长过夜的表达质粒p281和p293的MG1655waaL::pglB-galK宿主菌株的周质级分分离的蛋白经第一Q-琼脂糖柱运行。描述结果的色谱图显示于图27中;观察到O1-EPA的强产生(参见级分A6-A9和插入图片)。将级分在SDS-PAGE凝胶上运行,随后考马斯染色,以鉴定含有O1-EPA的级分。参见图28。将鉴定为富含O1-EPA的级分A6-A9合并,并经第二Q-琼脂糖柱运行,并将从第二柱获得的级分在SDS-PAGE凝胶上运行,随后考马斯染色,以鉴定含有O1-EPA的级分。参见图29。描述结果的色谱图显示于图30中;在级分B4-B6中观察到O1-EPA的强产生。最后,将鉴定为富含O1-EPA的级分B4-B6合并,并经Superdex200柱运行,随后考马斯染色,以鉴定含有纯化的O1-EPA生物缀合物的级分。通过图31中的考马斯染色显示,发现分离的O1-EPA生物缀合物的最终合并物是高度纯化的(参见图32),并证明与使用三质粒系统制备的O1-EPA生物缀合物具有相同的质量,在三质粒系统中,pglB基因通过质粒的方式引入大肠杆菌宿主细胞中,而不是通过插入宿主细胞基因组中。6.10.实施例10:含有一种产生生物缀合物的质粒的细菌菌株本实施例表明,生物缀合物可以由细菌宿主菌株成功地产生,所述细菌宿主菌株已经通过交换编码rfb基因簇的核酸区域且通过将编码寡糖基转移酶的核酸插入细菌宿主细胞基因组而遗传修饰。对于生物缀合物产生仅需要编码载体蛋白的单一质粒。通过同源重组(参考文献13),使用如所述(参考文献14)的盒切除策略,将大肠杆菌O121rfb簇启动子的转录控制下的HA标记的空肠弯曲菌pglB基因稳定插入大肠杆菌菌株W3110ΔrfbO16::rfb2457TΔgtrS::gtrIIΔwaaL(描述于实施例6)的基因组中。通过SDS-PAGE分析pglB-阳性菌株的全细胞提取物,且通过Western印迹使用抗-HA抗体检测HA-标记的PglB。PglB的表达在大肠杆菌菌株W3110ΔrfbO16::rfb2457T,ΔgtrS::gtrII,ΔwaaL,::pO121pglB中得到验证(图33A,泳道1)。将由大肠杆菌菌株W3110ΔrfbO16::rfb2457T,ΔgtrS::gtrII,ΔwaaL,::pO121pglB表达的PglB与由携带含有pTac启动子的转录控制下的pglB的质粒的大肠杆菌菌株W3110ΔrfbO16::rfb2457TΔgtrS::gtrIIΔwaaL表达PglB进行比较(图33A,比较泳道1和2)。为了评估W3110ΔrfbO16::rfb2457T,ΔgtrS::gtrII,ΔwaaL,::pO121pglB产生生物缀合物的能力,将含有经工程改造以包含两个N-糖基化位点和组氨酸标签(p150)的EPA载体蛋白的表达质粒引入菌株。将所得菌株培养过夜且使用Ni2+-亲和层析从周质提取物纯化2a-EPA。通过SDS-PAGE、随后考马斯蓝染色分析纯化的EPA,并检测2a-EPA糖缀合物(图33B)。据证实,可以使用具有寡糖基转移酶和rfb簇以及插入其基因组中的异源rfb簇并具有表达载体蛋白的单一质粒的大肠杆菌宿主细胞来成功地产生生物缀合物。6.11.实施例11:含有一种产生生物缀合物的质粒的细菌菌株本实施例表明,生物缀合物可以由细菌宿主菌株成功地产生,所述细菌宿主菌株已经通过交换编码rfb基因簇的核酸区域且通过将编码寡糖基转移酶的核酸插入细菌宿主细胞基因组而遗传修饰。对于生物缀合物产生仅需要编码载体蛋白的单一质粒。使用两种不同的大肠杆菌菌株:(i)StGVXN8905(基因型:ΔaraBADΔgtrS::gtrIIΔrfbO16::rfb2457TΔwaaL::pglBcuo),其包含插入宿主细胞基因组的pglb和弗氏志贺氏菌2arfb簇(rfb2457T)两者以及编码EPA载体蛋白的质粒(pGVXN1198);(ii)StGVXN5083(基因型:ΔaraBADΔgtrS::gtrIIΔrfbO16::rfb2457TΔwaaL),其包含表达pglb的质粒(pGVXN970),表达EPA载体蛋白的质粒(pGVXN1198),和插入宿主细胞基因组中的弗氏志贺氏菌2arfb簇。对于空肠弯曲菌寡糖基转移酶pglB和rfb簇的基因组整合,使用本文所述的同源重组。如图34中所示,表达寡糖基转移酶、载体蛋白和弗氏志贺氏菌2arfb簇的两种大肠杆菌菌株均产生生物缀合物(参见分子量标记90-170kDa之间的信号,其对应于弗氏志贺氏菌2a-EPA生物缀合物)。重要的是,该观察包括包含寡糖基转移酶和rfb簇的双重整合的菌株StGVXN8905。因此,本实施例表明不仅在基因/基因簇双重插入宿主细胞基因组中之后可以产生稳定的宿主细胞,而且基因的功能得到维持。具体地,插入的寡糖基转移酶和插入的rfb簇的功能得到保持,导致产生生物缀合物。综上所述,前述实施例中已证实可以使用细菌宿主细胞成功产生生物缀合物,该宿主细胞已被工程改造以稳定表达作为其基因组一部分的寡糖基转移酶和复杂产生正确的十一异戊烯基-焦磷酸酯(Und-PP)连接的多糖的其它遗传元件,其为生物缀合物产生的必要组分。有利地,使用该新系统生产生物缀合物比目前已知的通过使用异源糖基化机制在宿主细胞中产生生物缀合物的系统需要更少的质粒,例如仅单一质粒(例如实施例10和11)。本公开内容不应通过本文所述的具体实施方案限制范围。事实上,除了所述的主题以外,本文提供的主题的各种改变,对于本领域技术人员而言,从前面的描述和附图将变得显而易见。这样的改变意图落入所附权利要求的范围之内。本文引用各种出版物、专利和专利申请,其公开内容以其整体通过引用并入。a参见图1。bHR1,编码galF和rmlB之间的基因间区域以及galF基因的C末端片段的W3110rfb簇的rmlB上游的1kbDNA;c从大肠杆菌菌株W3110克隆的wbbL(O16rfb簇的最后基因)的1.6kb下游DNAd从pKD3和pKD4[13]克隆的氯霉素抗性盒(clmR)和kan抗性盒(kanR);e当rfb簇的序列是公开的时,给出标识符。如果rfb簇从临床分离物或者从没有rfb簇公开序列的菌株克隆,则指示相近的公开序列并用星号*标记。f痢疾志贺氏菌I型rfb簇由两个操纵子组成,一个从rmlB-rfbQ延伸(位于痢疾志贺氏菌基因组中的galF和gnd之间),且第二个由双顺反子操纵子rfpA和rfpB组成(hisH和rfe(wecA)之间)g从类志贺氏邻单胞菌O17克隆h参见[10];该簇能够产生与金黄色葡萄球菌的CP5荚膜多糖重复单元结构相同的O抗原。j将两个版本的嵌合簇插入rfb基因座中,一个含有来自铜绿假单胞菌PA103的wzz-wzx基因,且一个缺乏来自铜绿假单胞菌PA103的wzz-wzx基因。表2.额外的插入菌株DNA插入片段DNA插入片段长度/kb插入位置/菌株;受体菌株中被替换的DNA(HR1至2)通过以下显示的插入DNA的功能性肺炎链球菌CP14簇(wchA至wciY)8kb大肠杆菌W3110;rfb簇(galF至gnd)和可拉酸簇(colanicacid)(wcaM的上游至wcaA的下游)肺炎链球菌CP14PS产生来自CCUG11450的大肠杆菌rfb簇血清型O414kb大肠杆菌W3110;rfb簇(galF至gnd)大肠杆菌O4O多糖产生来自临床分离物upecGVXN436的大肠杆菌rfb簇血清型O2516kb大肠杆菌W3110;rfb簇(galF至gnd)大肠杆菌O25O多糖产生来自菌株CCUG31的大肠杆菌rfb簇血清型O7512.5kb大肠杆菌W3110;rfb簇(galF至gnd)大肠杆菌O75O多糖产生表5:复制起始点列表起始点名称拷贝数评价IncWR100pUC500-700来自pUC19(修饰的pMB1)pMB115-20来自质粒pBR322BAC1repA,rep101~5来自pSC101p15A10-12来自pMR101pSC101TS突变的repA,仅在30℃增殖F质粒起始点1-2表6:分子生物学中使用的抗生素缩写抗生素amp氨苄青霉素clm氯霉素红霉素gen庆大霉素kan卡那霉素neo新霉素萘啶酸利福平spec壮观霉素链霉素tet四环素tmp甲氧苄啶博来霉素(zeocin)表8:细菌表达株大肠杆菌沙门氏菌种志贺氏菌耶尔森氏菌黄单胞菌假单胞菌种乳杆菌乳球菌葡萄球菌链球菌链霉菌不动杆菌柠檬酸杆菌等效方案:本文公开的方法、宿主细胞和组合物不应通过本文所述的具体实施方案限制范围。事实上,除了所述的方法、宿主细胞和组合物以外,对所述方法、宿主细胞和组合物的各种改变,对于本领域技术人员而言,从前面的描述和附图将变得显而易见。这样的改变意图落入所附权利要求的范围之内。本文引用各种出版物、专利和专利申请,其公开内容以其整体通过引用并入。序列表<110>GlycoVaxynAG<120>宿主细胞修饰的方法<130>13064-041-228<140>TBA<141>同一日提交<150>US61/889,672<151>2013-10-11<160>72<170>FastSEQ用于Windows版本4.0<210>1<211>9<212>PRT<213>人工序列<220><223>归巢内切核酸酶中发现的结构组<400>1LeuAlaGlyLeuIleAspAlaAspGly15<210>2<211>6<212>PRT<213>人工序列<220><223>归巢内切核酸酶中发现的结构组<400>2GlyIleTyrTyrIleGly15<210>3<211>18<212>DNA<213>人工序列<220><223>SceI识别的序列<400>3tagggataacagggtaat18<210>4<211>24<212>DNA<213>构巢曲霉(Aspergillusnidulans)<220><223>归巢内切核酸酶AniI的识别位点<400>4ttgaggaggtttctctgtaaataa24<210>5<211>24<212>DNA<213>构巢曲霉(Aspergillusnidulans)<220><223>归巢内切核酸酶AniI的识别位点<400>5ttatttacagagaaacctcctcaa24<210>6<211>26<212>DNA<213>eugametos衣藻(Chlamydomonaseugametos)<220><223>归巢内切核酸酶CeuI的识别位点<400>6taactataacggtcctaaggtagcga26<210>7<211>26<212>DNA<213>eugametos衣藻(Chlamydomonaseugametos)<220><223>归巢内切核酸酶CeuI的识别位点<400>7tcgctaccttaggaccgttatagtta26<210>8<211>30<212>DNA<213>土生衣藻(Chlamydomonashumicola)<220><223>归巢内切核酸酶ChuI的5-引物识别位点<400>8gaaggtttggcacctcgatgtcggctcatc30<210>9<211>30<212>DNA<213>土生衣藻(Chlamydomonashumicola)<220><223>归巢内切核酸酶ChuI的5-引物识别位点<400>9gatgagccgacatcgaggtgccaaaccttc30<210>10<211>23<212>DNA<213>pallidostigmata衣藻(Chlamydomonaspallidostigmata)<220><223>归巢内切核酸酶CpaI的识别位点<400>10cgatcctaaggtagcgaaattca23<210>11<211>23<212>DNA<213>pallidostigmata衣藻(Chlamydomonaspallidostigmata)<220><223>归巢内切核酸酶CpaI的识别位点<400>11tgaatttcgctaccttaggatcg23<210>12<211>20<212>DNA<213>pallidostigmata衣藻(Chlamydomonaspallidostigmata)<220><223>归巢内切核酸酶CpaII的识别位点<400>12cccggctaactctgtgccag20<210>13<211>20<212>DNA<213>pallidostigmata衣藻(Chlamydomonaspallidostigmata)<220><223>归巢内切核酸酶CpaII的识别位点<400>13ctggcacagagttagccggg20<210>14<211>30<212>DNA<213>莱茵衣藻(Chlamydomonasreinhardtii)<220><223>归巢内切核酸酶CreI的识别位点<400>14ctgggttcaaaacgtcgtgagacagtttgg30<210>15<211>30<212>DNA<213>莱茵衣藻(Chlamydomonasreinhardtii)<220><223>归巢内切核酸酶CreI的识别位点<400>15ccaaactgtctcacgacgttttgaacccag30<210>16<211>30<212>DNA<213>运动硫还原球菌(Desulfurococcusmobilis)<220><223>归巢内切核酸酶DmoI的识别位点<400>16atgccttgccgggtaagttccggcgcgcat30<210>17<211>30<212>DNA<213>运动硫还原球菌(Desulfurococcusmobilis)<220><223>归巢内切核酸酶DmoI的识别位点<400>17atgcgcgccggaacttacccggcaaggcat30<210>18<211>24<212>DNA<213>大肠杆菌pI-DreI<220><223>归巢内切核酸酶DreI的识别位点<400>18caaaacgtcgtaagttccggcgcg24<210>19<211>24<212>DNA<213>大肠杆菌pI-DreI<220><223>归巢内切核酸酶DreI的识别位点<400>19cgcgccggaacttacgacgttttg24<210>20<211>24<212>DNA<213>大肠杆菌SPO1<220><223>归巢内切核酸酶HmuI的识别位点<400>20agtaatgagcctaacgctcagcaa24<210>21<211>24<212>DNA<213>大肠杆菌SPO1<220><223>归巢内切核酸酶HmuI的识别位点<400>21ttgctgagcgttaggctcattact24<210>22<211>24<212>DNA<213>大肠杆菌SP82<220><223>归巢内切核酸酶HmuII的识别位点<400>22agtaatgagcctaacgctcaacaa24<210>23<211>24<212>DNA<213>大肠杆菌SP82<220><223>归巢内切核酸酶HmuII的识别位点<400>23ttgttgagcgttaggctcattact24<210>24<211>24<212>DNA<213>乳酸乳球菌<220><223>归巢内切核酸酶LlaI的识别位点<400>24cacatccataaccatatcattttt24<210>25<211>24<212>DNA<213>乳酸乳球菌<220><223>归巢内切核酸酶LlaI的识别位点<400>25aaaaatgatatggttatggatgtg24<210>26<211>30<212>DNA<213>Monomastix种<220><223>归巢内切核酸酶MsoI的识别位点<400>26ctgggttcaaaacgtcgtgagacagtttgg30<210>27<211>30<212>DNA<213>Monomastix种<220><223>归巢内切核酸酶MsoI的识别位点<400>27ccaaactgtctcacgacgttttgaacccag30<210>28<211>30<212>DNA<213>激烈热球菌(Pyrococcusfuriosus)Vc1<220><223>归巢内切核酸酶PI-PfuI的识别位点<400>28gaagatgggaggagggaccggactcaactt30<210>29<211>30<212>DNA<213>激烈热球菌(Pyrococcusfuriosus)Vc1<220><223>归巢内切核酸酶PI-PfuI的识别位点<400>29aagttgagtccggtccctcctcccatcttc30<210>30<211>15<212>DNA<213>kodakaraensis热球菌(Pyrococcuskodakaraensis)KOD1<220><223>归巢内切核酸酶PI-PkoII的识别位点<400>30cagtactacggttac15<210>31<211>15<212>DNA<213>kodakaraensis热球菌(Pyrococcuskodakaraensis)KOD1<220><223>归巢内切核酸酶PI-PkoII的识别位点<400>31gtaaccgtagtactg15<210>32<211>25<212>DNA<213>嗜器官热棒菌(Pyrobaculumorganotrophum)<220><223>归巢内切核酸酶PorI的识别位点<400>32gcgagcccgtaagggtgtgtacggg25<210>33<211>25<212>DNA<213>嗜器官热棒菌(Pyrobaculumorganotrophum)<220><223>归巢内切核酸酶PorI的识别位点<400>33cccgtacacacccttacgggctcgc25<210>34<211>29<212>DNA<213>多头绒泡菌(Physarumpolycephalum)<220><223>归巢内切核酸酶PpoI的识别位点<400>34taactatgactctcttaaggtagccaaat29<210>35<211>29<212>DNA<213>多头绒泡菌(Physarumpolycephalum)<220><223>归巢内切核酸酶PpoI的识别位点<400>35atttggctaccttaagagagtcatagtta29<210>36<211>30<212>DNA<213>热球菌种(Pyrococcussp.)<220><223>归巢内切核酸酶PI-PspI的识别位点<400>36tggcaaacagctattatgggtattatgggt30<210>37<211>30<212>DNA<213>热球菌种(Pyrococcussp.)<220><223>归巢内切核酸酶PI-PspI的识别位点<400>37acccataatacccataatagctgtttgcca30<210>38<211>28<212>DNA<213>好望角酵母(Saccharomycescapensis)<220><223>归巢内切核酸酶ScaI的识别位点<400>38tgtcacattgaggtgcactagttattac28<210>39<211>28<212>DNA<213>好望角酵母(Saccharomycescapensis)<220><223>归巢内切核酸酶ScaI的识别位点<400>39gtaataactagtgcacctcaatgtgaca28<210>40<211>30<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceI的识别位点<400>40agttacgctagggataacagggtaatatag30<210>41<211>30<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceI的识别位点<400>41ctatattaccctgttatccctagcgtaact30<210>42<211>39<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶PI-SceI的识别位点<400>42atctatgtcgggtgcggagaaagaggtaatgaaatggca39<210>43<211>39<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶PI-SceI的识别位点<400>43tgccatttcattacctctttctccgcacccgacatagat39<210>44<211>29<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceII的识别位点<400>44ttttgattctttggtcaccctgaagtata29<210>45<211>29<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceII的识别位点<400>45tatacttcagggtgaccaaagaatcaaaa29<210>46<211>29<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceIII的识别位点<400>46attggaggttttggtaactatttattacc29<210>47<211>29<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceIII的识别位点<400>47ggtaataaatagttaccaaaacctccaat29<210>48<211>29<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceIV的识别位点<400>48tcttttctcttgattagccctaatctacg29<210>49<211>29<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceIV的识别位点<400>49cgtagattagggctaatcaagagaaaaga29<210>50<211>24<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceV的识别位点<400>50aataattttcttcttagtaatgcc24<210>51<211>24<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceV的识别位点<400>51ggcattactaagaagaaaattatt24<210>52<211>24<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceVI的识别位点<400>52gttatttaatgttttagtagttgg24<210>53<211>24<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceVI的识别位点<400>53ccaactactaaaacattaaataac24<210>54<211>28<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceVII的识别位点<400>54tgtcacattgaggtgcactagttattac28<210>55<211>28<212>DNA<213>酿酒酵母<220><223>归巢内切核酸酶SceVII的识别位点<400>55gtaataactagtgcacctcaatgtgaca28<210>56<211>19<212>DNA<213>集胞蓝细菌种(Synechocystissp.)PCC6803<220><223>归巢内切核酸酶Ssp6803I的识别位点<400>56gtcgggctcataacccgaa19<210>57<211>19<212>DNA<213>集胞蓝细菌种(Synechocystissp.)PCC6803<220><223>归巢内切核酸酶Ssp6803I的识别位点<400>57ttcgggttatgagcccgac19<210>58<211>24<212>DNA<213>大肠杆菌噬菌体T4<220><223>归巢内切核酸酶TevI的识别位点<400>58agtggtatcaacgctcagtagatg24<210>59<211>24<212>DNA<213>大肠杆菌噬菌体T4<220><223>归巢内切核酸酶TevI的识别位点<400>59catctactgagcgttgataccact24<210>60<211>30<212>DNA<213>大肠杆菌噬菌体T4<220><223>归巢内切核酸酶TevII的识别位点<400>60gcttatgagtatgaagtgaacacgttattc30<210>61<211>30<212>DNA<213>大肠杆菌噬菌体T4<220><223>归巢内切核酸酶TevII的识别位点<400>61gaataacgtgttcacttcatactcataagc30<210>62<211>30<212>DNA<213>大肠杆菌噬菌体RB3<220><223>归巢内切核酸酶TevIII的识别位点<400>62tatgtatcttttgcgtgtacctttaacttc30<210>63<211>30<212>DNA<213>大肠杆菌噬菌体RB3<220><223>归巢内切核酸酶TevIII的识别位点<400>63gaagttaaaggtacacgcaaaagatacata30<210>64<211>22<212>DNA<213>人工序列<220><223>归巢内切核酸酶PI-TliI的识别位点<220><221>misc_feature<222>6,12<223>n=A,T,C或G<400>64taygcngayacngacggyttyt22<210>65<211>22<212>DNA<213>海滨嗜热球菌(Thermococcuslitoralis)<220><223>归巢内切核酸酶PI-TliI的识别位点<220><221>misc_feature<222>11,17<223>n=A,T,C或G<400>65araatccgtcngtrtcngcrta22<210>66<211>30<212>DNA<213>海滨嗜热球菌(Thermococcuslitoralis)<220><223>归巢内切核酸酶PI-TliII的识别位点<400>66aaattgcttgcaaacagctattacggctat30<210>67<211>30<212>DNA<213>海滨嗜热球菌(Thermococcuslitoralis)<220><223>归巢内切核酸酶PI-TliII的识别位点<400>67atagccgtaatagctgtttgcaagcaattt30<210>68<211>19<212>DNA<213>热变形菌种(Thermoproteussp.)IC-061<220><223>归巢内切核酸酶Tsp061I的识别位点<400>68cttcagtatgccccgaaac19<210>69<211>19<212>DNA<213>热变形菌种(Thermoproteussp.)IC-061<220><223>归巢内切核酸酶Tsp061I的识别位点<400>69gtttcggggcatactgaag19<210>70<211>24<212>DNA<213>distributa火山鬃菌(Vulcanisaetadistributa)IC-141<220><223>归巢内切核酸酶Vdi141I的识别位点<400>70cctgactctcttaaggtagccaaa24<210>71<211>24<212>DNA<213>distributa火山鬃菌(Vulcanisaetadistributa)IC-141<220><223>归巢内切核酸酶Vdi141I的识别位点<400>71tttggctaccttaagagagtcagg24<210>72<211>5<212>PRT<213>人工序列<220><223>合成的-N-糖基化共有序列<220><221>MISC_FEATURE<222>(1)..(1)<223>Xaa=Asp或Glu<220><221>MISC_FEATURE<222>(2)..(2)<223>Xaa=除了Pro以外的任何天然氨基酸<220><221>MISC_FEATURE<222>(4)..(4)<223>Xaa=除了Pro以外的任何天然氨基酸<220><221>MISC_FEATURE<222>(5)..(5)<223>Xaa=Ser或Thr<400>72XaaXaaAsnXaaXaa15
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1