染色体着陆垫及相关用途

文档序号：510585阅读：731来源：国知局

染色体着陆垫及相关用途
【专利摘要】本发明提供了在宿主细胞中稳定整合和/或表达一种或多种重组多核苷酸的方法。所述重组多核苷酸通常被整合入宿主基因组中的一些天然染色体整合位点处。所述整合可由同源重组来介导或用靶向特定染色体位置的杂合重组酶来介导。宿主细胞中的天然染色体整合位点支持外来基因的稳定整合和强转录活性，这些天然染色体整合位点位于CHO基因组的特定基因之内或附近，所述基因为锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C-Mos基因和Nephrocystin-1/Mal基因。还提供了将位点特异性重组序列（染色体着陆垫）插入到这些特定染色体位置的方法和核酸分子。进一步提供了含有整合入天然染色体整合位点的染色体着陆垫或转基因的工程化宿主细胞。进一步提供了用于在带有插入的染色体着陆垫的宿主细胞中整合和表达异源多核苷酸的方法和组合物（例如试剂盒）。
【专利说明】染色体着陆垫及相关用途
[0001]对优先权文件的引用
[0002]本申请根据35U.S.C.§ 119(e)要求2011年4月5日提交的美国临时专利申请序列号61/516,612的优先权。本申请要求上述提交日的优先权，上述临时专利申请的公开内容通过引用以其整体納入本文。
[0003]序列表的纳入
[0004]本申请包括与纸质序列表对等的电子版序列表，通过EFS网站电子提交，还包括通过EFS网站电子提交的计算机可读形式的序列表，含有文件名为“37651505001W0SEQUENCELISTING.txt”的文件，该文件大小为 213476 字节，创建于 2012 年4月5日，这些序列表通过引用以其整体納入本文。
【背景技术】[0005]出于治疗目的(例如，基因治疗)以及在体外生产有用的蛋白或多肽时，会常规地将异源多核苷酸整合到哺乳动物细胞的基因组中。通过非同源重组在基因组的随机位置插入需要几轮筛选和克隆扩增以产生可接受的表达系统。每次寻找针对新基因的表达系统时还需要重复这种方法。由于整合事件的随机性，插入了重组基因的ー些位置根本不能支持转录事件。这是因为表达水平很大程度上受基因位点上局部遗传环境作用(位置作用)的影响。此外，来自很多染色体位点的表达随时间而減少。某些情况下，这种不稳定性是由于转基因的DNA甲基化。因此，根据整合的位点，整合的基因的表达水平可能有很大的差异。此外，某些情况下，随机整合入基因组的外源DNA会打断重要的细胞基因，产生改变的表型。
[0006]除随机插入以外，已描述了重组酶介导的整合，用于将转基因插入到基因组中的特定位点。然而，获得整合的转基因的稳定、高效表达仍然是很复杂和繁琐的，需要大量被筛选的克隆以选择所需的整合细胞。
[0007]本领域需要用于在哺乳动物细胞中实现异源多核苷酸的稳定整合和/或高水平基因表达的方法。本公开解决了这ー需要以及其它需要。

【发明内容】

[0008]一方面，本申请提供了用于在宿主细胞中稳定整合和表达异源多核苷酸的方法。所述方法包括将异源多核苷酸插入到宿主细胞基因组中位于选自下组的基因之内或附近的天然染色体位点处:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4) >C-Mos基因和Nephrocystin-1/Mal基因。一些方法中，用同源重组或杂合重组酶介导异源多核苷酸插入到宿主基因组中。ー些方法中，宿主细胞是哺乳动物细胞，例如中国仓鼠卵巣(CHO)细胞。在一些此类方法中，天然染色体插入位点位于或靠近以下位置:Ank2基因 SEQ ID NO:1 的位置 130-131，Cpsf4 基因 SEQ ID NO: 2 的位置 629-630，C-Mos 基因SEQ ID N0:3 的位置 272-273，或 N印hrocystin-1/Mal 基因 SEQ ID NO: 4 的位置 239-240。ー些方法中，待整合到宿主基因组的异源多核苷酸可编码多肽，例如治疗性蛋白或エ业蛋白。[0009]在相关方面，提供了用于将异源多核苷酸序列稳定整合到哺乳动物细胞基因组中的重组或工程化多核苷酸。所述重组多核苷酸通常含有第一同源臂、所述异源多核苷酸序列、和第二同源臂。所述第一和第二同源臂分别与侧接于位于选自下组的基因之内或附近的天然染色体插入位点的5’ -和3’ -序列基本相同:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C_Mos基因和Nephrocystin-1/Mal基因。通常,所述天然染色体插入位点能够支持外来基因的稳定整合。ー些方法中，异源多核苷酸序列编码多肽，例如治疗性蛋白或エ业蛋白。ー些其他方法中，异源多核苷酸序列含有位点特异性重组序列(染色体着陆垫(chromosomal landing pad))。例如，位点特异性重组序列可以是被曬菌体整合酶识别的识别序列，诸如被phiC-31噬菌体整合酶识别的attP位点或attB位点。ー些方法中，宿主哺乳动物细胞是中国仓鼠卵巣(CHO)细胞。在这些方法中，天然染色体插入位点可位于或靠近以下位置:Ank2基因SEQ ID NO:1的位置130-131，Cpsf4基因SEQ IDNO: 2 的位置 629-630，C-Mos 基因 SEQ ID NO: 3 的位置 272-273，或 N印hrocystin-1/Mal 基因SEQ ID N0:4的位置239-240。相关实施方式中，本发明还提供了含有重组或工程化多核苷酸的载体。
[0010]另ー方面，提供了工程化的哺乳动物细胞。所述细胞携帯有被稳定整合到其基因组中位于选自下组的基因之内或附近的ー个或多个天然染色体插入位点处的异源多核苷酸:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C-Mos基因和Nephrocystin-1/Mal基因。通常,所选的天然染色体插入位点支持外来基因的稳定整合。ー些方法中，异源多核苷酸编码多肽，例如治疗性蛋白或エ业蛋白。ー些其他方法中，异源多核苷酸含有位点特异性重组序列(染色体着陆垫)。例如，位点特异性重组序列可以是被噬菌体整合酶识别的识别序列，诸如被phiC-31噬菌体整合酶识别的attP位点或attB位点。一些优选的实施方式涉及重组或工程化的中国仓鼠卵巣(CHO)细胞。在这些实施方式中，异源多核苷酸可优选整合在以下位置或以下位置附近:Ank2基因SEQ ID N0:1的位置130-131，Cpsf4基因 SEQ ID N0:2 的位置629-630，C_Mos基因 SEQ ID NO: 3 的位置 272-273，或 N印hrocysti n-1/Mal 基因 SEQ ID NO:4 的位置 239-240。
[0011]在仍然另一个相关方面，提供将异源多核苷酸稳定整合到哺乳动物细胞基因组的方法。这些方法必需包括(a)将位点特异性重组序列插入到细胞基因组中，其中所述插入是在位于选自下组的基因之内或附近的天然染色体插入位点处:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C-Mos基因和N印hrocystin-1/Mal基因；以及(b)通过同源重组将异源多核苷酸整合到细胞基因组中插入的位点特异性重组序列处。选择用于这些方法的天然染色体插入位点通常支持外来基因的稳定整合。ー些方法中，位点特异性重组序列是被噬菌体整合酶识别的第一识别序列，例如PhiC-31噬菌体整合酶的attP位点或attB位点。这些方法中，异源多核苷酸通常连接于噬菌体整合酶的第二识别序列，所述第二识别序列与所述第一识别序列例如被噬菌体整合酶识别的attB位点或attP位点是同族的(cognate)。ー些方法中，使用的哺乳动物宿主细胞是中国仓鼠卵巢(CHO)细胞。在这些方法中，位点特异性重组序列可优选被插入到基因组中的以下位置或以下位置附近:Ank2 基因 SEQ ID NO:1 的位置 130-131，Cpsf4 基因 SEQ ID NO: 2 的位置 629-630，C-Mos 基因 SEQ ID N0:3 的位置 272-273，或 N印hrocystin-1/Mal 基因 SEQ ID NO: 4 的位置239-240。ー些方法中，异源多核苷酸含有可操作性连接于启动子序列的靶多肽编码序列。通常，异源多核苷酸在宿主基因组中的整合在噬菌体整合酶的存在下发生。在ー些此类方法中，噬菌体整合酶可由引入到细胞中的载体表达。
[0012]通过參考本申请说明书和权利要求书的其他部分可以进一歩理解本发明的本质和优点。
【专利附图】

【附图说明】
[0013]图1显示了用于随机整合到CHO基因组中以鉴定支持强转录活性的天然染色体插入位点的质粒的结构。该质粒含有sv40启动子驱动的EGFP表达盒。BamHI位点位于EGFP和潮霉素抗性基因之间(用于在稳定整合之前进行线性化)。
[0014]图2显示了用于将attP位点引入到在CHO基因组中鉴定出的天然染色体插入位点中的质粒。attP位点在Neo基因的5’内。左同源臂被克隆到Neo基因和attP的5’;右同源臂被克隆到Neo基因的3’。HSV-TK基因用于阴性筛选。所显示的序列是被phi_C31噬菌体整合酶识别的attP和attB位点的双链序列:attP (SEQ ID N0:5和SEQ ID NO: 6),attB(SEQ ID NO:7 和 SEQ ID NO:8)。 [0015]图3显示了 CHO细胞基因组的锚蛋白2 (Ank2)基因中的天然染色体插入位点和侧接序列(SEQ ID NO:1)。
[0016]图4显示了 CHO细胞基因组的切割和多腺苷酸化特异性因子4 (Cpsf4)基因中的天然染色体插入位点和侧接序列(SEQ ID NO:2)。
[0017]图5显示了 CHO细胞基因组的C-Mos基因中的天然染色体插入位点和侧接序列(SEQ ID NO:3)o
[0018]图6显示了 CHO细胞基因组的Nephrocystin-1/Mal基因中的天然染色体插入位点和侧接序列(SEQ ID NO:4)。
【具体实施方式】
[0019]1.概沭
[0020]本文公开了哺乳动物细胞中能够使重组基因具有强转录活性的天然染色体位点及它们作为“着陆垫”来进行重组构建物的位点特异性整合的用途。具体而言，鉴定出哺乳动物基因组(例如中国仓鼠卵巣(CHO)基因组)中几个基因内的促进整合的外来基因的强表达的染色体位置。如下文所述，这些天然染色体插入位点的鉴定包括:在基因组中随机整合含有用于选择(例如潮霉素抗性基因和编码增强型绿色荧光蛋白EGFP)的基因的质粒。随机整合之后，在最初转染后三周，就潮霉素抗性选择细胞并用荧光激活的细胞分选(FACS)来就EGFP表达分选细胞。使所选择的细胞恢复并在无选择条件下再生长几周。然后再进行FACS细胞分选。将具有最高EGFP水平的细胞分选入96孔板的各孔中。克隆由单个细胞生长出并被培养几周。然后重新检测细胞的EGFP表达。进ー步筛选细胞以鉴定生长速率与母细胞系生长速率相当或比母细胞系生长速率更高的那些细胞。然后分析这些基因中插入位点的序列。这些研究鉴定出几个基因:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4) ,C-Mos基因和N印hrocystin-1/Mal基因，它们带有能够支持重组基因稳定和強烈的转录活性的天然染色体位点。
[0021]本文还描述了作为用于所需的靶多核苷酸序列的一致整合的染色体着陆垫的天然染色体位点的鉴定。为了该目的，通过同源重组将被噬菌体整合酶识别的噬菌体结合位点attP引入到天然染色体位点中。通过将位点特异性重组序列(即，attP位点)插入基因组中，就可以容易地在噬菌体整合酶(例如，phiC-31噬菌体整合酶)的存在下用含有被该噬菌体整合酶识别的同族重组序列(即，attB结合位点)的载体将重组基因引入到细胞中。噬菌体整合酶允许两个同族重组序列(即attB和attP位点)重组，从而整个含有attB的载体能够被整合到染色体中的单个attP位点。
[0022]本文提供了在宿主细胞中稳定整合和/或表达异源多核苷酸的方法。还提供了宿主细胞，所述宿主细胞含有在一个或多个鉴定出的基因(即，Cpsf4、Ank2、C-MosJPNephrocystin-1/Mal基因)之内或附近稳定整合的异源多核苷酸。进ー步提供了用于将异源多核苷酸例如位点特异性重组序列(染色体着陆垫)插入到哺乳动物基因组中、特别是插入到本文所述的ー个或多个天然染色体插入位点中的多核苷酸和相关载体。还提供了工程化的哺乳动物细胞，其具有被稳定整合到其基因组中本文所述的ー个或多个天然染色体插入位点处的异源的、位点特异性重组序列。并且，还提供了使异源多核苷酸在哺乳动物细胞中的一个或多个插入的染色体着陆垫处稳定整合并表达的方法，所述异源多核苷酸编码感兴趣的靶多肽。本文还提供了由此产生的用于表达异源多核苷酸的细胞。
[0023]本文描述的具体的方法、操作方案和试剂可以变化。除非另外指出，否则可使用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术，这些在本领域的技能范围内。这些技术在文献中有充分的说明。例如，以下文献描述了示例性万法，Sambrook 等，Molecular Cloning:A Laboratory Manual, Cold Spring HarborPress (3rd ed., 2001) ; Brent 等，Current Protocols in Molecular Biology, JohnWiley&Sons, Inc.(ringbou ed.，2003);Freshney，Culture of Animal Cells:A Manual ofBasic TechniquejWiley-Lissj Inc.(4th ed.，2000);以及 Weissbach&Weissbach，Methodsfor Plant Molecular Biology, Academic Press, NY,第 VIII 部分，pp.421-463，1988。
[0024]I1.定义
[0025]除非另有定义，否则·本文使用的所有技术和科学术语具有本公开所属领域的一般技术人员通常理解的含义。以下参考文献为本领域技术人员提供了本公开所用的很多术语的一般定义:Academic Press Dictionary of Science andTechnology,Morris(Ed.)，Academic Press(1st ed.，1992) ;Oxford Dictionary ofBiochemistry and Molecular Biology, Smith 等(Eds.), Oxford University Press(revised ed.，2000);Encyclopaedic Dictionary of Chemistry, Kumar(Ed.)，AnmolPublications Pvt.Ltd.(2002);Dietionary of Microbiology and MolecularBiology，Singleton 等(Eds.), John Wiley&Sons (3rd ed., 2002) ; Dictionary of Chemistry, Hunt (Ed.)，Routledge (1st ed.，1999) ; Dictionary of Pharmaceutical Medicine, Nahler (Ed.), Springer-Verlag Telos (1994);Dictionary of Organic Chemistry, Kumarand Anandand(Eds.), Anmol Publications Pvt.Ltd.(2002);以及 A Dictionary ofBiology (Oxford Paperback Reference)，Martin 和 Hine(Eds.)，Oxford UniversityPress (4th ed.，2000)。本文提供了当这其中的一些术语特别应用于本公开时对它们的进ー步的说明。
[0026]如本文所用，除非上下文另有明确定义，否则单数形式“a/an (—)”和“所述”包括复数意义。因此，例如，提及“ a cell (—个细胞)”时包括多个这种细胞,提及“ a protein(ー种蛋白)”包括ー种或多种蛋白以及本领域技术人员已知的等同物，等等。
[0027]术语“试剂”包括任何物质、分子、元素、化合物、实体或者它们的组合。其包括但不局限于，例如，蛋白、多肽、小有机分子、多糖、多核苷酸等。它可以是天然产物、合成化合物、或化学化合物、或两种或更多种物质的组合。除非另有规定，否则本文中术语“试剤”、“物质”和“化合物”可以互换使用。
[0028]术语“染色体着陆垫”(或简单而言“着陆垫”)是指稳定整合入宿主细胞基因组(例如哺乳动物细胞诸如CHO细胞)中的位点特异性识别序列或位点特异性重组位点(例如attP位点)。具体而言，位点特异性识别序列或重组位点被插入到宿主基因组中的ー个或多个天然染色体插入位点处，所述天然染色体插入位点存在于本文公开的几个特定基因中，即锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C-Mos基因和Nephrocystin-1/Mal基因。在宿主基因组中存在的异源位点特异性重组序列允许重组酶(phiC-31整合酶)介导将异源多核苷酸或转基因位点特异性插入到宿主基因组中。通常，为了整合到着陆垫中，要将异源多核苷酸或转基因连接到也被重组酶识别的同族识别序列或重组位点(例如，如果插入的位点特异性重组位点是attP位点，则同族识别序列或重组位点是attB位点)。
[0029]词组“感兴趣的多核苷酸”(或“感兴趣的基因”或“靶基因”)意在包括编码多肽或蛋白产物(“感兴趣的多肽”或“靶多肽”)的顺反子、开放阅读框(ORF)、或多核苷酸序列。对于在携帯有本文描述的染色体着陆垫的工程化宿主细胞中的稳定整合和表达，感兴趣的多核苷酸还可含有可操作性连接于编码序列的合适的转录调控元件(如启动子序列)以及同族位点特异性重组序列(例如attB或attP位点)。可由感兴趣的多核苷酸编码和表达各种靶多肽，例如治疗性蛋白、营养蛋白和エ业用蛋白。
[0030]本文所用术语“内源的”指一般在野生型宿主中发现的核酸或多肽，而术语“外源的”指一般不会在野生型宿主中发现的核酸或多肽。
[0031]“宿主细胞”指其中将要或已经引入了异源多核苷酸序列的活细胞。活细胞既包括培养的细胞也包括活生物体内的细胞。将异源多核苷酸序列引入细胞的方式是公知的，例如，转染、电穿孔、磷酸钙沉淀、显微注射、转化、病毒感染、和/或等等方法。通常，拟被引入细胞中的异源多核苷酸序列是可复制的表达载体或克隆载体。一些实施方式中，可将宿主细胞工程化以在其染色体上或基因组中纳入所需的基因。很多可作为宿主的宿主细胞(例如CHO细胞)是本领域已知的。參见，例如，Sambrook等，Molecular Cloning:A LaboratoryManual, Cold Spring Harbor Press (3rd ed., 2001);以及 Brent 等，Current Protocolsin Molecular Biology, John Wiley&Sons, Inc.(ringbou ed.，2003)。一些优选实施方式中，宿主细胞是哺乳动物细胞。
[0032]术语“核苷酸序列”、“核酸序列”、“核酸”、或“多核苷酸序列”，指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物，并且除非另有限定，其包括以和天然存在的核苷酸类似的方式与核酸杂交的天然核苷酸的类似物。核酸序列可以是例如原核序列、真核mRNA序列、来自真核mRNA的cDNA序列、来自真核DNA(例如哺乳动物DNA)的基因组DNA序列、和合成的DNA或RNA序列，但不限于这些。
[0033]术语“可操作性连接”或“可操作性结合”指遗传元件之间以使它们能够发挥它们正常的功能的方式接合的的功能性连接。例如，当基因的转录处于启动子控制之下并且产生的转录产物被正确翻译成通常由该基因编码的蛋白时，该基因可操作性连接于启动子。类似地，如果增强子元件使感兴趣基因的转录上调，则该增强子可操作性结合于所述基因。
[0034]“基本上相同的”核酸或氨基酸序列指，通过本文所述的公知程序之一(例如BLAST)、用标准參数检测，核酸或氨基酸序列包含与參考序列具有至少75%、80%或90%序列同一性的序列。序列同一性优选至少95%,更优选至少98%,最优选至少99%。一些实施方式中，对象序列与參考序列相比其长度大体相同，即由数目大体相同的连续氨基酸残基(对于多肽序列)或核苷酸序列(对于多核苷酸序列)组成。
[0035]可以容易地用本领域已知的各种方法来确定序列同一性。例如，BLASTN程序(对于核苷酸序列)使用缺省字长(W) 11，期望值(E) 10，M=5, N=-4，并对两条链作比较。对于氨基酸序列，BLASTP程序使用缺省字长(W) 3，期望值(E) 10，和BL0SUM62评分矩阵(參见Henikoff&Henikoff, Proc.Natl.Acad.Sc1.USA89:10915 (1989))。通过在比较窗ロ上比较两个最佳比对的序列来确定序列同一性百分比，其中为了两个序列的最佳比对，比较窗ロ中的多核苷酸序列部分与參考序列(不包含增加或者缺失)相比可包含增加或者缺失(即，缺ロ)。通过以下方式计算该百分比:确定在两个序列中存在的相同核酸碱基或氨基酸残基的位置的数目以产生配对位置的数目，用配对位置的数目除以比较窗口中总的位置数目，再将该结果乘以100来产生序列同一性百分比。
[0036]如本文所用，单向位点特异性重组酶(或简单而言，位点特异性重组酶)指来自细菌和单细胞酵母的ー组重组酶。它们包括酪氨酸重组酶和解离酶/转化酶或丝氨酸重组酶家族(例如，噬菌体整合酶如来自噬菌体phiC31、R4、和TP-901的整合酶)。酪氨酸重组酶包括酪氨酸整合酶(例如来自\、HK022、P22、HP1和L5的整合酶)和其他酪氨酸重组酶(例如Cre和Flp)。丝氨酸重组酶的例子包括丝氨酸整合酶(例如来自phiC-31、R4、TP901的整合酶)和其他丝氨酸重组酶(例如Y S、Tn3、噬菌体ii重组酶)。
[0037]优选地，位点特异性重组酶可包括介导两个不同的DNA识别序列即噬菌体结合位点attP和细菌结合位点attB之间的单向位点特异性重组的整合酶(尤其是噬菌体整合酶)。酪氨酸家族的整合酶，例如、整合酶，利用催化性酪氨酸来介导链断裂，容易识别较长的attP序列，并需要由噬菌体或宿主细菌编码的其他蛋白。丝氨酸家族的噬菌体整合酶(例如，phiC-31噬菌体整合酶)更大，其利用催化性丝氨酸来进行链断裂，识别较短的attP序列，并且不需要宿主的辅因子。因为attB和attP位点是不同的序列，所以重组将产生一段核酸(对于左边的和右边的，称为attL或attR)，这段核酸既不是attB序列也不是attP序列，并且在功能上不会被相关的整合酶识别为重组位点，因此消除了酶催化第二个重组反应(该第二个重组反应将逆转第一个重组反应)的可能性。这将产生单向位点特异性整合事件。
[0038]Ph1-C31整合酶指能够高效率地且以严谨的序列特异性在哺乳动物细胞中催化基因组重组的噬菌体整合酶。本领域对该酶的功能特征有所描述，例如，Kuhstoss and RaojJ.Mol.Biol.222，897-908，1991;Rausch and Lehmann,NucleicAcids Researchl9,5187-5189,1991;以及 Groth 等，Proc.Natl.Acad.Sc1.USA97, 5995-6000, 2000。
[0039]噬菌体整合酶(例如噬菌体phi_C31整合酶)的天然attB和attP识别位点的一般长度约为34至40个核苷酸。參见，例如本文图2以及Groth等，Proc.Natl.Acad.Sc1.USA97:5995-6000, 2000。这些位点通常按如下排列:attB包含第一 DNA序列attB5’，核心区，以及第二DNA序列attB3’，从5’至3’的相对顺序为attB5’-核心区-attB3’ JttP包含第一DNA序列attP5’，核心区，和第二DNA序列attP3’，从5’至3’的相对顺序为attP5’-核心区-attP3’。Ph1-C31的attP和attB的核心区具有序列5’ -TTG-3’。
[0040]转基因动物或植物指下述的非人动物或植物，在该动物或植物的一个或多个细胞的基因组中整合有转基因或转基因元件。该术语涵盖了所有细胞或几乎所有细胞都含有遗传修饰的动物或植物(例如，完全转基因动物，尤其是具有可遗传的转基因的转基因动物)以及嵌合转基因动物或植物，其中该动物或植物的一个亚组的细胞被修饰为含有基因组整合的转基因。转基因植物或动物包括处于所有发育阶段的个体动物或植物。对于转基因而言，本文考虑农场动物(例如，鸡、猪、山羊、绵羊、牛、马、兔、等)，啮齿类动物(如小鼠)，非人灵长类动物(如恒河猴)和家养宠物(例如猫和狗)。ー些优选实施方式中，动物是小鼠或大鼠。 [0041]“治疗性基因”指编码为宿主提供一些治疗益处的分子的多核苷酸序列，所述分子包括蛋白(例如，分泌型蛋白，膜结合蛋白(例如受体)，结构蛋白，细胞质蛋白，等)、功能性RNA (反义，锤头型核酶)、等。分泌型蛋白包括可在对象体液(例如，血液、淋巴、唾液、胃肠道分泌物、等)中发现的那些。一些实施方式中，哺乳动物对象是人对象，引入的多核苷酸序列编码人蛋白或其它人基因产物。
[0042]术语“载体”或“构建物”指下述的多核苷酸序列元件，这些多核苷酸序列元件以确定的组织模式排列从而可操作性连接于这些元件的基因/基因产物的表达能够被可预期地控制。通常，它们是可转移的多核苷酸序列(例如，质粒或病毒)，可向其中剪接入一段外来多核苷酸序列从而将该外来DNA引入到宿主细胞中以促进其复制和/转录。
[0043]克隆载体是能够在宿主细胞中自主复制并且其特点为具有一个或较少数目的限制性内切酶识别位点的多核苷酸序列(通常是质粒或噬菌体)。可将外来多核苷酸序列片段在这些位点剪接入到载体中以实现该片段的复制和克隆。载体可包含ー个或多个适用于鉴定转化的细胞的标记物。例如，标记物可提供四环素或氨苄青霉素抗性。
[0044]表达载体类似于克隆载体但是在转化入宿主后能够诱导克隆到该载体中的多核苷酸序列的表达。克隆的多核苷酸序列通常置于某些调控序列诸如启动子或增强子的控制之下(即，可操作性连接于)。启动子序列可以是组成型、诱导型或阻抑型。
[0045]II1.在天然染色体整合位点插入异源多核苷酸
[0046]本文描述了几个具体的基因，它们含有支持插入的异源多核苷酸(外源基因或转基因)稳定和高效表达的天然染色体整合位点。这些天然染色体整合位点适于异源多核苷酸在宿主细胞中的稳定整合和/或表达。例如，编码有用的多肽(例如治疗性蛋白或エ业蛋白)的转基因或重组基因可这样在宿主细胞中整合和表达。此外，可利用这些位点将位点特异性重组序列(染色体着陆垫)插入到宿主基因组中。然后可用携帯这些插入的染色体着陆垫的宿主细胞进行异源多核苷酸的插入和表达。
[0047]天然染色体插入或整合位点指其中可整合入(例如，通过随机整合)异源多核苷酸、并且可在细胞基因组中天然存在的染色体位置或位点。换言之，该位点不是例如通过重组方式插入到基因组中的。除非另有说明，本文使用的该术语具体指基因组中支持外来基因的稳定整合及其有效率的转录的位置，该位置位于CHO基因组中几个基因之一的内部或附近，所述基因包括:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C-Mos基因和Mal基因(本文也称为Nephrocystin-1/Mal基因)。其还涵盖在其他哺乳动物种(例如小鼠、大鼠和人)中这些基因的直系同源物或同源区域(由序列比对来确定)中的具有相似功能或活性的染色体位置。
[0048]如本文详述的，本文对于在CHO基因组中鉴定出的四个基因的每ー个均描述了ー个具体的天然染色体插入位点(“示例位置”;见图3-6)。但是，本文考虑的天然染色体插入位点不限于这些具体的位置。只要支持整合的异源多核苷酸的稳定整合和/或有效率的转录，天然染色体插入位点相对于所述示例位点的确切位置并不是至关重要的。相反，天然染色体位点可在所述四个基因之一的内部或附近的任何位置。可根据本领域公知的标准程序或本文示例的方法来确定所述四个基因之一的内部或附近的感兴趣的具体染色体位置是否支持整合的外来基因的稳定整合和有效率的转录。一些优选实施方式中，本文示例的CHO基因组中的具体位置或其他哺乳动物基因组(例如，小鼠、大鼠或人基因组)中的对应位置(由序列比对来确定)被用作天然染色体插入位点。在ー些其他实施方式中，本文考虑的天然染色体位点优选靠近所示例的位置之一，例如，位于示例位置之一的少于约lkb、500bp、250bp、100bp、50bp、25bp、10bp、或少于约5bp之内。在仍然一些其他的实施方式中，所用的天然染色体位点与示例位置之一相隔约1000、2500、5000或更多个碱基对。
[0049]可容易地将异源多核苷酸(例如，重组基因或染色体着陆垫)插入到本文描述的天然染色体整合位点中以进行稳定整合和/或表达。可用多种方式，例如通过同源重组或使用特异性靶向位于整合位点的序列的杂合重组酶，将异源多核苷酸插入到宿主基因组的天然染色体整合位点。对于同源重组，同源的多核苷酸分子对齐并交換其一段序列。如果转基因侧接于同源基因组序列，则该转基因可在此交换过程中被引入。例如，如下文所述，可用这种方式在天然染色体整合位点将染色体着陆垫(含有attP位点的序列)插入到宿主基因组中。
[0050]可通过在同源的染色体区域引入断点(break)来提高哺乳动物细胞中同源重组的效率。这可通过将核酸酶靶向该区域来实现。例如，通过使用DNA结合蛋白，所述DNA结合蛋白识别天然染色体位置中的序列。实现这种靶向的ー种方式是使用锌指核酸酶。这些蛋白具有模块组成并含有各锌指结构域，每ー个结构域可识别靶序列(例如上述的天然染色体整合位点)中的3-核苷酸序列。一些实施方式可利用具有靶向多个染色体位置的各锌指结构域的组合的锌指核酸酶。例如，所公开的围绕着Cpsf4、Ank2、C-Mos和Nephrocystin-1/Mal基因中的示例整合位点的染色体序列分别含有8、6、7和8个候选位点，这些位点可被エ程化的锌指核酸酶靶向。
[0051]除同源重组之外，可也通过使用杂合重组酶来实现将异源多核苷酸插入到在Cpsf4、Ank2、c_Mos和Nephrocystin-1/Mal基因之内或附近的天然染色体整合位点中。重组的重组酶是ー种工程化的蛋白，它具有与DNA靶向结构域(例如锌指结构域)连接的重组酶结构域(例如，来自phiC31整合酶)。可将这样的分子祀向到在Cpsf4、Ank2、c_Mos和N印hrocystin-1/Mal基因之内或附近所含有的位点。这些重组蛋白将使重组构建物能够被整合到这些染色体位置中。这种方式的优点包括不需要提前引入着陆垫即能够靶向到细胞系内(如下文所述)，以及比同源重组更高的效率。[0052]虽然对锌指蛋白结合DNA的能力已作了充分的研究，并且这些蛋白适合上述的应用，但有可能通过使用其他方式例如通过突变其他类型的DNA结合结构域来特异性靶向Cpsf4、Ank2、c_Mos和Nephrocystin-1/Mal基因。其他的DNA结合结构域包括亮氨酸-拉链和螺旋-转折-螺旋结构。也有可能通过使用与Cpsf4、Ank2、c-Mos和Nephrocystin-1/Mal基因中的序列碱基配对的核酸部分来特异性靶向这些基因。[0053]一些实施方式包括通过同源重组或通过使用杂合重组酶将转基因直接整合到天然染色体整合位点。转基因可以是编码治疗性蛋白或エ业蛋白例如激素或酶的任何重组基因，如下文所详述。ー些其他实施方式涉及将一个或多个重组酶识别的位点特异性重组序列(染色体着陆垫)插入到本文公开的天然染色体整合位点。如本文详述,稳定插入到宿主基因组的染色体着陆垫可继而用于在宿主细胞(例如，CHO细胞或其他哺乳动物细胞)中整合和表达转基因。在本文公开的天然染色体整合位点携帯有ー个或多个染色体着陆垫的工程化宿主细胞可用于任何所需的靶基因的位点特异性整合和稳定表达。[0054]IV.通过同源重组整合异源多核苷酸[0055]在ー个方面，公开了通过同源重组将异源多核苷酸稳定整合到天然染色体整合位点中的方法和组合物。本发明提供了用于将异源多核苷酸(转基因或位点特异性重组序列)插入到宿主基因组中本文公开的天然染色体整合位点或具体染色体位置的多核苷酸分子和载体(“插入载体”)。多核苷酸和/或插入载体通常含有异源多核苷酸序列(例如，重组基因或染色体着陆垫)，第一同源臂，和第二同源臂。多核苷酸或载体还可另外含有用于阳性和/或阴性选择的标记物基因或序列。[0056]如本文所述，插入到宿主基因组中的异源多核苷酸序列可编码任何治疗上可用的或エ业上可用的蛋白。它也可以是重组酶识别的整合位点(染色体着陆垫)，该整合位点(染色体着陆垫)然后用于转基因的插入和表达，如下文详述。所述第一和第二同源臂意在将异源多核苷酸序列靶向到具体的染色体位置(例如，本文公开的天然染色体插入位点)以进行同源重组。因此，它们是分别与天然染色体整合位点的5’ -和3’-侧翼序列基本相同的序列。如上文所解释的，天然染色体整合位点位于4个具体基因之一的编码或非编码区的内部或附近，所述4个具体基因即Ank2基因、Cpsf4基因、C-Mos基因、和Nephrocystin-1/Mal基因。Nephrocystin-1基因在Mal基因的5’。摘入位点可以是Wphrocystin-1和Mal基因之间的Mal基因的5’。该基因组区域在本文中称为“Nephrocystin-1/Mal”。由于可以容易地确定在这些基因之一的内部或周围的某给定位置插入异源多核苷酸是否会产生稳定整合和/表达，对于基因组中这些基因的每ー个，天然染色体整合位点的确切位置不是至关重要的。然而，本文描述了中国仓鼠卵巣(CHO)细胞的ー些优选天然染色体整合位点。如下文实施例所示例的，CHO细胞的天然染色体整合位点可优选位于Ank2基因SEQ ID NO:1的位置130-131之间，Cpsf4基因SEQ ID NO:2的位置 629-630 之间，C-Mos 基因 SEQ ID NO: 3 的位置 272-273 之间，Nephrocystin-1/Mal基因SEQ ID NO:4的位置239-240之间。CHO细胞的天然染色体整合位点还可位于锚蛋白2基因的NCBI吣.丽_003615916.1的位置26，123-175，773之间(5￡0 ID NO:9的位置 23 和 152，773 之间)或锚蛋白 2 基因的 NCBI N0.NW_003635654.1 (SEQ ID NO: 10)的核苷酸 844-845 之间，位于 Cpsf4 基因的 NCBI NW_003614125.1 的位置 858，966-859，967之间(SEQ ID NO: 11 的位置 966 - 967)或 Cpsf4 基因的 NCBI NW_003614125.1 的位置 858，533-859，237 之间(SEQ ID NO: 11 的位置 533 - 1237)，位于 C-Mos 基因的 NCBINW_003614707.1 的位置 400，355-400, 356 之间(SEQ ID NO: 12 的位置 355 - 356)或位于C-Mos 基因的 NCBINW_003614707.1(SEQ ID NO: 12)的位置 398，595-399，212 之间，和位于N印hrocystin-1/Mal 基因的NCBI NW_003613665.1 的位置 1，578，738-1，578，739之间(SEQID N0:13 的位置 738 - 739)或 N印hrocystin-1/Mal 基因的 NCBI NW_003613665.1 (SEQ IDNO: 13)的位置1,574,453-1，625，306之间。这些序列和NCBI參考号通过引用以它们的整体纳入本文。
[0057]应理解，天然染色体整合位点在细胞系类型和细胞系类型之间可能不同。例如，CHO DG44细胞系的Ank2基因的核苷酸序列可能与CHO-Kl细胞系的Ank2基因的核苷酸序列不同，正如这两个细胞系类型的天然染色体整合位点的确切位置可能不同一祥。因此，在某些实施方式中，所选择的用于插入异源核苷酸序列(转基因或染色体着陆垫)的天然染色体整合位点可位于CHO基因组的每一个这些具体位置处或每一个这些具体位置附近。可基于不同哺乳动物种中相同基因之间的序列同源性来确定细胞系类型之间或其他哺乳动物细胞(例如，小鼠细胞、大鼠细胞和人细胞)的优选天然染色体整合位点。
[0058]一旦确定了用于插入异源多核苷酸序列的确切天然染色体整合位点，即可容易地设计和合成与侧翼序列基本相同的同源臂。同源臂的长度不是至关重要的，只要它们能够在需要的位点指导同源重组。因此，同源臂可以是包含侧接于所需的天然染色体插入位点的至少 10bp、25bp、50bp、100bp、200bp、500bp、lkb、2、kb、5kb、10kb 或更多连续的核苷酸对的序列。某些实施方式中，同源臂包含与侧接于CHO基因组中示例性染色体插入位点之一(图3-6)或其他哺乳动物基因组中的相应位置(如序列比对所确定的)的序列相同的序列。ー些其他实施方式中，将与天然整合位点的侧翼序列基本相同(例如至少75%、80%、90%、95%或99%相同)的序列用作本文描述的多核苷酸分子和载体中的同源臂。例如，同源臂可包括侧接于CHO细胞内这些基因的每ー个中的示例性天然整合位点(如图3-6所示)的序列的部分或全部。
[0059]本领域中也已描述·了多个物种的细胞(例如CHO细胞)中的这些基因(Ank2、Cpsf4、C-Mos基因、和Nephrocystin-1/Mal基因)。例如，本领域中已表征了人 Ank2 基因(登录号 NG_009006;NW_003615916.1;NW_003635654.1)，Cpsf4 基因(登录号 EF191081;NW_003614125.1)，C-Mos 基因(Neel 等，Proc.Natl.Acad.Sc1.USA, 79:7842-6,1982;以及 Morris 等，Hum.genetics81:339-342;登录号Nff_003614707.1), Nephrocystin-1/Mal 基因(Alonso 等，Proc.Natl.Acad.Sc1.USA84:1997-2001, 1987;以及 Rancano 等，J.Biol.Chem.269:8159-8164，1994;登录号NW_003613665.1)。本领域技术人员能够容易地设计和合成合适的同源臂序列以用于各种应用。如实施例中所示例的，可将长度约为Ikb至5kb的侧接于所鉴定出的整合位点之一的序列用作插入载体的同源臂以将异源多核苷酸(例如，着陆垫)同源整合到宿主基因组中。一些实施方式中，可用整个的基因座。其他实施方式中，可用整个基因座再加5'和3'端中的至少一端上的1、2或更多kb。某些实施方式中，诸如对于Cpsf4基因和C-Mos基因，可使用整个基因组再加5'和3'端的每一端上的2kb。其他实施方式中，诸如对于Nephrocystin-1/Mal基因和锚蛋白_2基因，可使用整个基因座。
[0060]某些【具体实施方式】中，待插入到宿主基因组的异源多核苷酸序列是被位点特异性重组酶识别的位点特异性重组序列，所述位点特异性重组酶例如噬菌体整合酶，诸如phiC-31噬菌体整合酶。待插入到天然染色体整合位点的位点特异性重组序列可以是支持位点特异性重组并且被单向位点特异性重组酶识别的任何序列。优选地，位点特异性重组序列包含被整合酶(例如酪氨酸整合酶或丝氨酸整合酶)识别的噬菌体结合位点(例如，attP位点)或细菌结合位点(例如，attB位点)。这些序列的例子包括被几种噬菌体整合酶例如phiC-31整合酶或入整合酶识别的attB和attP序列(以及假性(pseudo) att位点)。合适的重组位点还包括被突变的整合酶识别的序列。在噬菌体基因组整合到其宿主(例如E.coli细胞)基因组的过程中，该酶催化噬菌体基因组的attP位点和细菌基因组的attB位点之间的DNA交換，导致attL和attR位点的形成。通过将被噬菌体整合酶(例如，phiC-31整合酶)识别的位点特异性重组位点(例如，attP位点)插入到宿主基因组中(例如，在本文公开的天然染色体整合位点处)，连接于同族识别位点(例如，attB位点)的异源多核苷酸可通过由噬菌体整合酶催化的位点特异性重组容易地被插入到宿主基因组中。
[0061]可将被任何位点特异性重组酶(例如，丝氨酸或酪氨酸噬菌体整合酶)识别的曬菌体结合位点(attP)和细菌结合位点(attB位点)用作本文所述的位点特异性重组序列。这些既包括被给定的噬菌体整合酶识别的野生型(天然的)attB和attP位点，也包括假性位点。本领域已知并且已表征了各种噬菌体及其他物种的位点特异性重组酶和它们各自的识别序列(attP和attB位点)。例子包括入噬菌体整合酶(Enquist 等，Cold Spring Harbor Symp.Quant.Biol.43:1115 - 1120, 1979),HK022 噬菌体整合酶(Yagil 等，J.Mol.Biol.207:695 - 717，1989)，P22 噬菌体整合酶(Leong 等，J.Biol.Chem.260:4468 - 4477，1985)，HPl 噬菌体整合酶(Waldman 等，J.Bacteriol.165:297-300，1986)，L5 噬菌体整合酶(Lee 等，J.Bacteriol.175:6836 -6841，1993)，phiC-31 噬菌体整合酶(Kuhstoss and Rao, J.Mol.Biol.222:897 -908，1991)，R4 噬菌体(Groth 等，Proc.Natl.Acad.Sc1.USA97:5995 - 6000，2000)，TP901 噬菌体整合酶(Christiansen 等，J.Bacteriol.178:5164 - 5173，1996)，YS转座子解离酶( Reed等，Nature300:381 - 383, 1982)，Tn3转座子解离酶(Krasnow 等，Cell32:1313 - 1324，1983)和 Mu 卩遼菌体转化酶 Gin(Kahmann等，Cell41:771 - 780，1985)。
[0062]除了被位点特异性重组酶识别的野生型重组位点之外，用于着陆垫插入的多核苷酸分子或载体中存在的位点特异性重组序列还可包含因至少ー个碱基对改变(替换、缺失或插入)而与野生型识别位点(例如，野生型attP位点)不同的序列。序列改变可以在位点特异性重组序列内的任何位置。一些实施方式中，经修饰的位点特异性重组序列与野生型识别位点相比有多个序列改变。当这样的经修饰的位点特异性重组序列(例如，经修饰的attP位点)被整合到本文所述的工程化宿主细胞的基因组中时，可能需要相应的整合酶的野生型或突变形式(例如，突变的phi_C31整合酶)以将异源多核苷酸或转基因納入重组位点中。本领域还已知多种突变的整合酶(例如，突变的phiC-31整合酶)。參见，例如，Smith等，Nuc.Acids Res.32，2607-2617，2004;以及Kevarala等，Mol.Ther.17，112 - 120，2008。
[0063]对于将异源多核苷酸序列(转基因或染色体着陆垫)插入到宿主基因组而言，上述的多核苷酸通常存在于载体(“插入载体”)中。这些载体通常是环形的，在用于同源重组之前被线性化。除了同源臂和异源多核苷酸(例如，着陆垫)之外，这些载体还可包含适用于选择或筛选的标记物、复制起点、和其他元件。如本文实施例示例的，载体既可包含阳性选择标记物，又可包含阴性选择标记物。阳性选择标记物，例如抗生素抗性基因，用于鉴定其中稳定整合了载体的宿主细胞。这些标记物的例子包括新霉素、杀稻瘟素、潮霉素和zeocin的抗生素抗性基因。阴性选择标记物，例如，自杀基因，用于去除随机整合了载体序列的细胞，同时保留在需要的位置进行了同源重组的细胞。所述阴性选择标记物的ー个例子是如本文实施例中示例的HCV-TK基因。阳性筛选标记物(例如增强型绿色荧光蛋白)用于鉴定稳定整合了载体的宿主细胞(例如，通过使用荧光激活的细胞分选，FACS)。阴性筛选标记物，例如青色荧光蛋白，用于鉴定随机整合了载体序列的细胞(例如，通过FACS)。针对含有阳性筛选标记物但没有阴性筛选标记物的细胞的FACS将鉴定出在需要的位置进行了同源重组的细胞。
[0064] 插入载体(以及下文描述的靶向载体)的另ー个成分是复制起点。复制起点是独特的DNA片段，其含有被多聚体起点-结合蛋白识别并且在复制起点上组装DNA复制酶中起到关键作用的多个短重复序列。用于载体中的合适的复制起点包括，例如，EBV oriP、SV40、E.coli oriC、colEl质粒起点、ARS、等。表达载体中的另ー个有用的元件是多克隆位点或多聚连接子。将编码一系列限制性内切酶识别位点的合成DNA插入到质粒载体中，例如，在启动子元件的下游。工程化这些位点以将DNA方便地克隆到载体中的具体位置。
[0065]可根据分子生物学领域已知的标准方案(例如，Sambrook等，见上文；和Brent等，见上文)和本文的公开内容容易地构建用于将异源多核苷酸插入到宿主基因组中的多核苷酸或载体。为了产生载体，可将上文所述的含有同源臂和异源多核苷酸序列(例如，转基因或染色体着陆垫)的多核苷酸插入到用于转染哺乳动物宿主细胞的各种已知的质粒中。此类已知的质粒包括，例如，BPV、EBV、基于牛痘病毒的载体、SV40、2-微米圏、pcDNA3.l、pcDNA3.1/GS、pYES2/GS、pMT、p IND、pIND (Spl)、pVgRXR(Invitrogen)、等等，或它们的衍生物。这些质粒都是本领域已有描述和公知的(Botstein等，Miami Wntr.SyTnp? 19:265-274，1982;Broach，The Molecular Biology of the Yeast Saccharomyces: LifeCycle and Inheritance,冷泉港实验室，冷泉港，N.Y.，p.445-470，1981;Broach，Cell28:203-204, 1982;Dilon 等，J.Clin.Hemato1.0ncol.10:39-48, 1980;以 R ManiatisjCellBiology:A Comprehensive Treatise,Vol.3，Gene Sequence Expression, AcademicPress, NY, pp.563-608，1980。
[0066]V.带有整合的异源多核苷酸的工程化细胞
[0067]本发明提供了含有异源多核苷酸(重组基因或染色体着陆垫)的重组的或工程化的宿主细胞，所述异源多核苷酸被稳定整合到基因组中ー个或多个本文公开的天然染色体整合位点。在本文所公开的位点整合有重组基因的细胞允许所述基因编码的多肽的稳定和強烈的表达。带有整合的染色体着陆垫的细胞允许靶多核苷酸或感兴趣基因的有效率的位点特异性整合和/或表达。工程化的宿主细胞还可包括携帯此类插入的染色体着陆垫、然后具有ー个或多个整合到着陆垫中的转基因的细胞，如下文阐释。利用上文描述的多核苷酸分子或插入载体，可通过将重组基因或染色体着陆垫插入到本文描述的ー个或多个具体染色体位置来修饰各种细胞。
[0068]可通过本领域所知的任何方式将上文所述的重组多核苷酸或插入载体(或下文所述的靶向载体)引入到合适的宿主细胞(例如，哺乳动物细胞诸如CHO细胞)中。通常，经合适的限制酶消化以产生与宿主染色体同源的游离端之后，可将多核苷酸转染到宿主细胞中。可用本领域常规实施的标准程序将线性化的插入载体引入到宿主细胞中。例如，可通过磷酸钙共沉淀、常规的机械方法例如显微注射或电穿孔、通过插入包裹在脂质体中的质粒、以及通过病毒载体将载体转染到宿主细胞中。这些技术都是本领域公知和常规实施的，例如Freshney,见上文；Sambrook等，见上文；和Brent等，见上文)。可用载体上存在的选择标记物来鉴定和分离携带有转染的重组插入载体的宿主细胞。然后可将大量的受体细胞在能够选择含有载体的细胞的培养基中培养。
[0069]本文(图2)示例了用于将位点特异性重组序列(即，attP序列)插入到天然染色体插入位点的ー个具体载体。除attP序列之外，该载体还带有同源臂以及选择标记物，所述同源臂支持在标示的天然染色体插入位点的同源重组。为了整合入CHO基因组中所需的天然插入位点处，首先通过限制性消化将载体线性化。将线性化的序列转染到宿主细胞(例如，CHO细胞)中之后，将细胞进行阳性和阴性选择以鉴定通过同源重组整合了位点特异性重组位点(attP位点)的细胞。然后可对如此鉴定出的细胞进行进ー步检测以确定在所选择的天然染色体插入位点整合了异源多核苷酸。如本文所公开的，带有整合的重组基因的细胞可直接用于生产由这些基因编码的治疗性蛋白或エ业蛋白。或者，带有插入的染色体着陆垫的细胞可用于通过在染色体着陆垫中整合编码靶多肽的多核苷酸序列来生产靶多肽。[0070]优选地，用于在天然染色体插入位点插入ー个或多个异源多核苷酸的宿主细胞是真核细胞。真核载体/宿主系统，尤其是哺乳动物表达系统，允许表达的哺乳动物蛋白发生适当的翻译后修饰，例如，初级转录物的适当加工，糖基化，磷酸化以及，有利地，表达产物的分泌。因此，真核细胞诸如哺乳动物细胞是将异源多核苷酸(重组基因或染色体着陆垫)插入到本文所述的天然染色体位置的优选宿主细胞。合适的细胞既包括动物细胞(诸如昆虫、啮齿动物、牛、山羊、兔、绵羊、非人灵长类、人、等的细胞)也包括植物细胞(诸如水稻、玉米、棉花、烟草、番茄、土豆、等)。这些宿主细胞系的具体例子包括CHO、BHK、HEK293、VERO,HeLa、COS、MDCK、PER.C6、和 W138。
[0071]一些实施方式中，提供了重组细胞，所述重组细胞具有已经稳定整合到着陆垫中的感兴趣的多核苷酸或转基因，所述着陆垫已提前插入到本文所述的天然染色体位置。下文更详细地描述了用于将靶多核苷酸整合到已插入到宿主基因组中的染色体着陆垫中的靶向载体。如本文所述，着陆垫含有被位点特异性重组酶(例如，噬菌体整合酶诸如phi_C31整合酶)识别的识别序列(例如，attP位点)。通过连接到同样被该重组酶识别的同族识别序列(例如，attB位点)，感兴趣的多核苷酸以及合适的转录调控元件通过该重组酶介导的位点特异性重组被整合到着陆垫中。重组细胞中整合的感兴趣的多核苷酸可编码具有エ业应用或治疗应用的任何蛋白或多肽。此类多肽和蛋白的具体例子描述于上文。这些包括例如，酶(例如，蛋白酶、磷脂酶、等)，蛋白酶抑制剂，激素(例如，垂体激素)，生长因子，细胞因子，趋化因子，趋化素(chemotactin)，促性腺激素，脂质结合蛋白，生长调节素(somatamedian),促性腺激素,和免疫球蛋白。其他感兴趣的蛋白包括抗微生物多肽(例如抗细菌、抗真菌、抗病毒、和/或抗寄生虫多肽)，以及抗体(例如，orthoclone0KT-e (抗-⑶3)、GPIIb/IIa单克隆抗体)或其抗原结合抗体片段(例如，FAbs)。
[0072]除哺乳动物细胞之外，本文所述的用于插入异源多核苷酸的宿主细胞还可以是酵母细胞或植物细胞。如此工程化的酵母或植物细胞适于通过酵母或植物表达载体引入到宿主中的转基因的稳定整合和表达。合适的昆虫细胞的例子包括果蝇幼虫的细胞。当使用昆虫细胞时，可通过合适的插入载体将异源多核苷酸引入到细胞中。例如,可如本领域所述使用杆状病毒载体(Jasny, Science238:1653, 1987;和 Miller 等,IniGeneticEngineering (1986), Setlow, J.K.,等，eds., Plenum, Vol.8, pp.277-297)。当使用昆虫细胞作为宿主时，任选地，可将果蝇-醇脱氢酶启动子用于插入载体中以插入异源多核苷酸(Rubin, Science240:1453-1459，1988)。
[0073]V1.将靶多核苷酸整合到染色体着陆垫中
[0074]如上所述，可将编码多肽(即“感兴趣的多肽”或“感兴趣的基因”)的靶多核苷酸或转基因直接整合到本文公开的天然染色体整合位点。可用这种方式实现任何下文描述的治疗性蛋白或エ业蛋白的稳定和有效率的表达和生产。或者，可通过已插入到本文公开的天然染色体整合位点的染色体着陆垫将靶多核苷酸整合到宿主基因组中。利用本文公开的带有插入的染色体着陆垫的工程化宿主细胞，还提供了用于在该细胞中整合和表达异源多核苷酸或转基因的载体(“靶向载体”)和方法。可将编码各种有用的靶多肽的感兴趣的多核苷酸稳定地整合到本文描述的工程化宿主细胞的基因组中。感兴趣的多核苷酸对于宿主细胞可以是内源的或者外源的。外源多核苷酸是具有不在宿主细胞中天然存在的序列的核酸分子，而内源多核苷酸是具有在宿主细胞中先前已存在的序列的核酸分子。下文描述了可表达的蛋白或多肽的很多具体例子。
[0075]根据要用的工程化宿主，多种靶向载体都适于使用。由于带有插入的染色体着陆垫的优选宿主细胞是哺乳动物细胞(例如，CHO细胞)，靶向载体优选是用于真核表达的载体。一般而言，靶向载体将具有连接于同族重组位点或识别序列的感兴趣的基因。载体上的同族重组位点也被识别插入的染色体着陆垫的位点特异性重组酶(例如，phiC-31整合酶)识别。因此，载体上的同族重组位点将支持重组酶介导的靶多核苷酸整合入着陆垫。例如，对于在带有具体的噬菌体整合酶的插入的噬菌体结合位点(attP)的工程化宿主细胞中的整合和表达，载体将具有与同族细菌结合位点(attB位点)连接的靶多核苷酸，所述同族细菌结合位点(attB位点)也被相同的整合酶识别。类似地，如果插入的着陆垫包含噬菌体整合酶的attB位点，那么靶向载体将包含被该整合酶识别的同族attP位点。一些噬菌体整合酶，诸如ph1-C31和R4，优先整合入噬菌体结合位点(attP位点)而非细菌结合位点。对于这些酶，靶向载体应携带attB位点而着陆垫应包含attP位点。其他噬菌体整合酶优先整合入细菌结合位点(例如假性attB)而非噬菌体结合位点。具有这种优先性的酶的例子是phiBTl整合酶和A118整合酶。当使用这些酶时,祀向载体应携带attP位点而非attB位点，而相应的宿主细胞应在插入的着陆垫中含有attB位点。
[0076]为了支持靶核苷酸整合在着陆垫之后的表达，靶向载体还可含有可操作性连接于靶多核苷酸的启动子序列和其他转录调控元件(例如，增强子序列)。一般而言，可选择启动子从而它们在它们所导入的细胞类型中是有功能的。可用本领域所知的很多启动子在哺乳动物宿主细胞中进行表达。例子包括但不限于小鼠金属硫蛋白I基因序列的启动子(Hamer等,J.Mol.Appl.Gen.1:273-288，1982);疱疹病毒 TK 启动子(McKnight, Cell31:355-365，1982) ;SV40 早期启动子(Benoist 等,Nature (London) 290:304-310, 1981);酵母 gall基因序列启动子(Johnston 等,Proc.Natl.Acad.Sc1.(USA) 79:6971-6975，1982) ; Silver等，Proc.Natl.Acad.Sc1.(USA) 81:595ト 59SS, 1984)，CMV 启动子，EF-1 启动子、肌动蛋白启动子、磷酸甘油酸激酶启动子、泛素启动子和胸苷激酶启动子、蜕皮素响应启动子(ー种或多种)、四环素响应启动子、等。
[0077]此外,祀向载体可具有选择或筛选标记物序列、复制起点、等。与上文所述插入载体中所用的标记物一祥，靶向载体中的选择或筛选标记物也提供了针对仅那些含有载体的细胞的生长进行选择或筛选的ー个途径。这种选择标记物通常有两种类型:药物抗性和营养缺陷型。药物抗性标记物使细胞能够解除外加药物的毒性，如果没有药物抗性标记物则该药物会杀死细胞。营养缺陷型标记物使细胞在缺少某必要成分(通常为氨基酸)的培养基中生长时能够合成该必要成分。常见的可选择性标记物基因包括对抗生素有抗性的基因，所述抗生素诸如氨苄青霉素、四环素、卡那霉素、博来霉素、链霉素、潮霉素、新霉素、Ze0cinTM、G418、等。可选择性营养缺陷型基因包括，例如hisD，其使细胞能够在组氨醇的存在下在不存在组氨酸的培养基中生长。
[0078]选择标记物序列和转录调控元件应连接于载体中的靶多核苷酸和同族重组酶识别序列，连接的方式应使得一旦在着陆垫处发生位点特异性重组则选择标记物序列和转录调控元件将与靶多核苷酸一同整合到宿主基因组中。根据本说明书的教导可使用分子生物学领域所知的方法来构建本文所述的靶向载体。參见，例如Sambrook等,Molecular Cloning:A Laboratory Manual, Cold Spring Harbor Press Trded.，2001) ;Brent等，Current Protocols in Molecular Biology, John Wiley&Sons, Inc.(ringbou ed.,2003);和 Freshney, Culture of Animal Cells:A Manual of BasicTechnique, ffiley-Liss, Inc.(4th ed.，2000)。通常,通过在合适的载体骨架中插入与着陆垫同族的重组位点、感兴趣的多核苷酸、编码选择标记物的序列、和本文所述的其他任选元件来组装靶向载体。
[0079]除了携帯有插入的染色体着陆垫的工程化宿主细胞和靶向载体之外，在着陆垫(例如，attP位点)处位点特异性整合靶多核苷酸还需要相应的重组酶(例如，噬菌体整合酶诸如phiC-31整合酶)的催化活性。重组酶(例如，phiC-31整合酶)可在靶向载体的引入之前、同时、或之后被引入·到靶细胞。如上文解释的，本文考虑多种噬菌体整合酶。用于将靶多核苷酸整合入工程化宿主细胞的具体整合酶应与宿主基因组的着陆垫中的位点特异性重组序列和靶向载体中的同族识别序列相对应并识别这些序列。某些实施方式中，单向位点特异性重组酶是丝氨酸整合酶。可用于体外和体内重组的丝氨酸整合酶包括但不限于来自噬菌体 ph1-C31、R4、TP901-1、phiBTl、Bxbl、RV-1、A118、U153、和 phiFCl 的整合酶，以及长丝氨酸整合酶家族的其他酶。參见,例如,Gregory等，J.Bacteriol.，185:5320-5323, 2003; Groth and Calos, J.Mol.Biol.335:667-678，2004; Groth等,Proc.Natl.Aacd.Sc1.97:5995-6000, 2000; Olivares等，Gene278:167-176，2001; Smith and Thorpe, Molec.Microbiol., 4:122-129, 2002;and Stoll 等,J.Bacteriol., 184:3657-3663,2002。除这些野生型整合酶之外，本领域还知晓带有突变的改变的整合酶(參见，例如，Sclimenti等，Nuc.Acid Res.29:5044-5051, 2001)。这些与野生型相比具有改变的活性或特异性的整合酶也可用于靶多核苷酸的重组反应及整合入工程化宿主基因组中。
[0080]一些实施方式中，将纯化的酶多肽引入到宿主细胞中以介导靶向载体的整合。将功能蛋白引入细胞的方法是本领域公知的。例如，可通过多种方式包括脂质体、涂覆的颗粒、触须(whiskers)、显微注射、电穿孔、和肽转运子将噬菌体整合酶多肽诸如phiC-31整合酶直接引入到细胞中(參见，例如，Siprashvili等，Mol.Ther.,9:721-728，2004)。一些其他实施方式中，可用合适的表达载体将编码整合酶的多核苷酸引入细胞中。可由表达感兴趣基因的同一靶向载体表达整合酶。或者，可通过第二载体将编码整合酶的多核苷酸引入到宿主细胞中。一些实施方式中，在表达载体上将编码整合酶的DNA序列引入到宿主细胞中。这可按本领域中的描述进行，例如Olivares等，Gene, 278:167-176，2001;以及 Thyagarajan 等，Mol.Cell Biol.21:3926-3934，2001。ー些其他实施方式中，位点特异性整合依赖于编码重组酶多肽的RNA分子的瞬间存在。例如，可如例如Groth等，J.Mol.Biol.335:667-678，2004;和 Hollis 等，Repr.Biol.Endocrin.1:79，2003 所述将编码噬菌体整合酶的mRNA分子引入到宿主细胞中并表达。一般优选整合酶只在将靶向载体插入到工程化宿主细胞基因组中所需的时间里存在。引入编码整合酶的RNA(例如，mRNA)可以保证瞬时表达，并消除编码整合酶的核酸永久掺入到靶基因组的可能性。也可通过其他方式实现位点特异性重组酶的瞬时表达。例如，可将表达酶的多核苷酸置于可调节的启动子(即，启动子的表达可被选择性诱导或阻抑)控制之下。
[0081]根据靶细胞的位置，可使用任何方便的方案将表达噬菌体整合酶的第二载体和/或靶向载体体外或体内引入到靶细胞中。例如，当工程化宿主细胞是分离的细胞时，可在允许靶细胞存活的细胞培养条件下直接将靶向载体引入到细胞中，例如，通过使用标准的转化技木。这些技术包括，但不一定限于:病毒感染、转染、接合、原生质体融合、电穿孔、粒子枪技术、磷酸钙沉淀、直接显微注射、病毒载体递送、等。方法的选择一般取决于被转化的细胞的类型和发生转化的环境(即，体外、离体、或体内)。对这些方法的概述可參见例如Brent等(见上文)。
[0082]或者，当工程化的宿主细胞(ー个或多个)是多细胞生物体的一部分时，可将靶向载体给予生物体或宿主，给予的方式使得靶向载体能够进入到宿主细胞(ー个或多个)中，例如，通过体内或离体方案。“体内”指将靶构建物给予活的动物体。“离体”指在体外修饰细胞或器官。这些细胞或器官通常被返回到活体。给予核酸构建物的方法是本领域公知的。例如，核酸构建物的递送可用阳离子脂质(Goddard等，Gene Therapy, 4:1231-1236, 1997;Gorman 等，Gene Therapy4:983-992, 1997;Chadwick等，Gene Therapy4:937-942, 1997;Gokhale 等，Gene Therapy4:1289-1299，1997;Gaoand Huang, Gene Therapy2:710-722,1995),利用病韋载体(Monahan 等，GeneTherapy4:40-49, 1997; Onodera 等，Blood91:30-36，1998),通过摄入“裸 DNA”,等等。可用本领域公知的用于细胞转染的技术(參见上文)来离体给予核酸构建物。可经验性地选择石角切的配方、给予途径和剂量。參见例如Fingl等，1975，The Pharmacological Basis ofiherapeutics, Ch.lpl)。
[0083]VI1.拟用工程化宿主细胞表达的靶多肽或蛋白
[0084]上文描述的工程化宿主细胞可用于稳定表达任何感兴趣的多核苷酸。感兴趣的多核苷酸可编码具有医疗或エ业应用的各种多肽。某些实施方式中，将要整合入工程化宿主细胞中的着陆垫内的靶多核苷酸或感兴趣的多核苷酸可以编码治疗性蛋白。治疗性蛋白的例子包括因子VII1、因子IX、(6-珠蛋白、低密度脂蛋白受体、腺苷脱氨酶、嘌呤核苷磷酸化酶、神经磷脂酶、葡糖脑苷脂酶、囊性纤维化跨膜传导调节子、a-抗胰蛋白酶、CD-18、鸟氨酸氨甲酰转移酶、精氨琥珀酸合成酶、苯丙氨酸羟化酶、支链a-酮酸脱氢酶、延胡索酰こ酰こ酸水解酶、葡萄糖-6_磷酸酶、a-L-岩藻糖苷酶、(6-葡萄糖醛酸苷酶、a-L-艾杜糖醛酸苷酶、半乳糖-1-磷酸尿苷酰基转移酶、白细胞介素、细胞因子、小肽、等等。可由工程
化宿主细胞中的整合的靶多核苷酸表达的其他治疗性蛋白可包括，例如，Herceptin?，来
自各种病原体诸如致病细菌或病毒(例如，大肠杆菌(E.coli)、绿脓杆菌(P.aeruginosa),金黄色葡萄球菌(S.aureus)、疟疾、HIV、狂犬病毒、HBV、和巨细胞病毒)的多肽抗原，以及其他蛋白诸如乳铁蛋白、硫氧还蛋白和P -酪蛋白疫苗(beta-caseinvaccines)。
[0085]感兴趣蛋白的另外的例子包括，但不一定限于，胰岛素，促红细胞生成素，组织血纤维蛋白溶酶原激活剂(tPA),尿激酶，链激酶，神经生成(neutropoesis)刺激蛋白(也称为非格司亭(filgastim)或粒细胞集落刺激因子(G-CSF))，血小板生成素(TP0)，生长激素，血红蛋白(emoglobin),促胰岛激素，伊米苷酶(imiglucerase),沙格司亭(sarbramostim),内皮素(endothelian),可溶性 CD4,和抗体(例如，orthoclone OKT-E(抗-⑶3)，GPIIb/IIa单克隆抗体)和/或其抗原结合片段(例如，FAbs)，睫状神经突转化因子(CNTF)，粒细胞巨噬细胞集落刺激因子(GM-CSF)，脑源性神经突因子(BDNF)，甲状旁腺激素(PTH)样激素，促胰岛激素，胰岛素样生长因子-1 (IGF-1)，血小板衍生生长因子(TOGF)，表皮生长因子(EGF)，酸性成纤维细胞生长因子，碱性成纤维细胞生长因子，转化生长因子P，神经突生长因子(NGF)，干扰素(IFN)(例如，IFN-a 2b、IFN-a 2a、IFN-a N1、IFN-P lb、IFN- y ),白细胞介素(例如，IL-1、IL-2、IL-8)，肿瘤坏死因子(TNF)(例如，TNF-a，TNF-^ )，转化生长因子-a和-P，过氧化氢酶，降钙素，精氨酸酶，苯丙氨酸解氨酶，L-天冬酰胺酶，胃蛋白酶，尿酸酶，胰蛋白酶，胰凝乳蛋白酶，弾性蛋白酶，羧肽酶，乳糖酶，蔗糖酶，内因子，血管活性肠肽(VIP)，降钙素，Ob基因产物，胆囊收缩素(CCK)，5-羟色胺，和胰高血糖素。
[0086]可由整合的靶多核苷酸表达的合适的感兴趣的多肽还包括具体的膜蛋白或其他细胞内蛋白。膜蛋白的例子包括，但不一定限于，肾上腺素能受体，5-羟色胺受体，低密度脂蛋白受体，CD-18，肌聚糖蛋白(在肌营养不良症中缺乏该蛋白)，等等。有用的细胞内蛋白包括主要位于细胞室内的蛋白或在细胞内显示出所需要的生物活性的蛋白。此类细胞内蛋白可包括延胡索酰こ酰こ酸水解酶(FAH)，该酶在具有遗传性I型酪氨酸血症的患者中缺乏。细胞内蛋白的其他具体例子包括抗病毒蛋白(例如，可提供对病毒复制的抑制的蛋白或选择性杀死受感染细胞的蛋白)，结构蛋白诸如胶原，即VII型胶原C0L7A1基因(在隐性营养不良型大疱性表皮松解症(Recessive Dystrophic Epidermolysis Bullosa(RDEB))中缺乏)和抗肌萎縮蛋白(在肌营养不良中缺乏)。
[0087]VII1.试剂盒和含有整合的转基因的转基因动物
[0088]本发明提供了用于上文描述的工程化宿主细胞的试剂盒。所述试剂盒使本领域技术能够在工程化宿主细胞中位点特异性整合和/或表达异源多核苷酸，所述工程化宿主细胞在本文公开的ー个或多个天然染色体整合位点带有靶转基因或插入的染色体着陆垫。本文所述的ー些试剂盒含有具有直接插入到基因组中的天然染色体整合位点处的靶多核苷酸的工程化宿主细胞(例如，CHO细胞)。一些其他试剂盒含有插入到ー个或多个染色体着陆垫的靶多核苷酸的工程化宿主细胞，所述染色体着陆垫已提前整合到基因组的天然染色体整合位点中。本文描述的仍然ー些其他试剂盒含有在ー个或多个天然染色体整合位点处具有插入的染色体着陆垫的重组细胞以及用于将靶多核苷酸插入到染色体着陆垫中的其他试剂。
[0089]作为示例，本文描述的ー些试剂盒，其含有至少ー种或多种以下成分:在本文所述的ー个或多个天然染色体位点带有插入的着陆垫(例如，attP位点)的工程化宿主细胞(例如CHO细胞系)，用于克隆和整合异源多核苷酸的靶向载体，和整合酶成分(例如，phiC-31)。试剂盒还可任选含有待克隆到靶向载体并在宿主细胞中表达的靶多核苷酸。通常，在克隆到靶向载体之后，异源靶多核苷酸就会连接到用于在插入的着陆垫中整合的也被该整合酶所识别的同族序列(例如，attB位点)。如本文所述，可以任何合适的形式(例如，作为配制成用于引入到靶细胞中的蛋白或在整合酶载体中，该载体在被引入到工程化宿主细胞中之后提供所需的整合酶的表达)提供整合酶成分。因此，ー些试剂盒可含有基本上纯化的重组酶多肽(例如，phiC-31)。一些其他试剂盒可含有允许酶在宿主细胞中表达的第二载体。本文描述的试剂盒可任选含有其他成分，例如用于克隆靶多核苷酸的限制酶、对照质粒、缓冲剂、等等。根据需要，试剂盒的各种成分可存在于不同的容器中或者某些相容的成分可提前组合到单个容器中。 [0090]除各种试剂之外，本文描述的试剂盒通常还含有在整合和表达感兴趣多核苷酸中使用试剂盒的成分的说明。对于实施本发明方法的说明一般记录在合适的记录介质上。例如，这些说明可打印在基材上，所述基材诸如纸或塑料等。因此，这些说明可作为包装插页存在于试剂盒中，存在于试剂盒或其成分的容器的标签中(即，与包装或与分包装相连)。其他实施方式中，这些说明是作为电子存贮数据文件存在于合适的计算机可读存贮介质例如CD-ROM、软盘等上。仍然ー些其他的实施方式中，试剂盒中不存在实际的说明，而是提供了从远程来源例如通过网络获得说明的方式。这种实施方式的例子是含有网址的试剂盒，可由该网址查看说明和/或下载说明。和说明一祥，获得说明的方式也记录在合适的基材上。
[0091]本发明还提供了转基因非人动物或植物，所述转基因非人动物或植物的基因组已通过在本文公开的ー个或多个天然染色体整合位点插入异源多核苷酸(转基因或染色体着陆垫)而进行了修饰。所述转基因非人动物或植物还可具有插入了染色体着陆垫并然后通过在插入的着陆垫处整合一个或多个靶多核苷酸而进行了修饰的基因组。可用本文所述方法生产的转基因动物的例子包括小鼠、大鼠、鸡、猫、狗、兔、猪、山羊、绵羊、牛、马，以及非人灵长类诸如恒河猴。可通过将异源多核苷酸或转基因整合入基因组中的ー个或多个天然染色体整合位点来生产本文所述的转基因非人动物或植物。如本文所述，通过将靶多核苷酸整合到已插入到基因组中的染色体着陆垫来生产其他转基因动物或植物。靶细胞可以是适合用本文所述系统和方法进行遗传修饰并适于产生本文所述转基因动物的任何细胞。靶细胞可以是分离的(例如在培养物中)或在多细胞有机体中(例如，在胚泡中，在胎儿中，在产后动物中，等等)。示例性靶细胞包括，但不一定限于，原代细胞、次代细胞、转化的细胞、卵细胞、受精卵细胞、单细胞胚胎、体细胞(例如，肌肉、骨、软骨、韧带、腱、皮肤(真皮、表皮、等)、内脏细胞(例如、肺、肝、胰腺、胃肠道(ロ、胃、肠)、等)、干细胞(例如，胚胎干细胞(例如，具有胚胎干细胞表型的细胞)、成体干细胞、多能干细胞、造血干细胞、间充质干细胞、等)、和生殖细胞(例如，原始生殖细胞、胚胎生殖细胞、等)。
[0092]可用本领域技术人员常规实施的方法来产生转基因动物或植物。參见，例如，Brinster,等,Proc.Nat.Acad.Sc1.USA82:4438, 1985;Houdebine and Chourrout,Experientia47:897-905，1991;Teratocarcinomas and Embryonic Stem Cells, A PracticalApproach, E.J.Robertson, ed., IRL 出版社(1987);Hogan 等，Manipulating the MouseEmbryo (冷泉港出版社 1986) ; Krimpenfort 等,Bio/Technology9:86, 1991; Palmiter等,Cel141:343, 1985;Kraemer 等,Genetic Manipulation of the Early MammalianEmbryo (冷泉港实验室出版社 1985);Hammer 等，Nature, 315:680，1985;Purcel等，Science,244: 1281，1986;Pursel,等，Science244:1281-1288，1989;Simms等，Bio/Technology6: 179-183，1988;以及 U.S.Pat.N0.5，175，384，U.S.PatentNos.4945050，5175384 和 5175385。
[0093]实施例
[0094]提供以下实施例以进ー步阐释本文描述的内容，但并非限制其范围。其他变动对本领域一般技术人员而言是显而易见的并且涵盖在所附的权利要求书中。
[0095]实施例1鉴定具有强转录活性的天然染色体位点
[0096]用于随机整合到CHO基因组的质粒:基于Thyagarajan等(2001，Mol CellBiol.21 (12):3926-34)描述的含有attP的原始质粒进行修饰。具体而言，修饰该原始质粒以用新霉素标记物取代Zeocin标记物。此外，用SV40启动子控制的EGFP基因代替萤火虫萤光素酶基因(图1)。
[0097]稳定转染:用Qiagen Midiprep柱纯化经修饰的质粒。25 ii g DNA用限制酶BamHI消化过夜以将质粒线性化。然后将产生的线性DNA转染到CHO细胞中以产生稳定的整合。转染后两天，将细胞分到新的培养板中，加潮霉素到培养基以选择稳定整合事件。使细胞培养生长3周然后收获进行FACS分析
[0098]FACS:在潮霉素选择下培养生长3周之后，将稳定的细胞汇集在一起在ScrippsFACS Core Facility进行大量分选(bulk sorting);收集EGFP表达最高的1%的细胞，将其返回到培养基中并允许其恢复并生长几周。当细胞培养板汇合时，收集细胞并再次用FACS分选。这一次，将表达EGFP最高的1%的细胞作为单独的细胞分选到96孔板的孔中。
[0099]单细胞群体:使分选到96孔板中的细胞在这些板上生长2-3周，然后转移到24孔板中。I周后，将细胞转移到6孔板中进行扩增培养。在这个阶段，检查EGFP表达以确保单细胞群体含有稳定整合的含有attP的质粒构建物并维持EGFP表达。
[0100]生长率检查:确定EGFP表达之后，检查单细胞群体以及母代CHO细胞系的生长率。将细胞接种到6孔板中，10，000细胞/孔。在三个时间点计数细胞数目:铺板后24小时；48小时和72小吋。只有生长率等于或快于母代CHO细胞系的细胞进行进ー步培养以进行稳定性研究。
[0101]稳定性研究:将单细胞群体继续培养最长达4个月以确定表达稳定性。每个月检查一次细胞的EGFP表达。在培养期末，检查生长率和EGFP表达以确保单细胞群体维持了高水平的EGFP表达并且生长和母代CHO细胞ー样快或甚至更快。在这个阶段之后，选择20个单细胞群体作为好的候选物来鉴定染色体整合位点。
[0102]整合位点的鉴定:从最高的20个单细胞群体中纯化基因组DNA。检查各个DNA样品的浓度，并用四个产生平端的限制酶EcoRV、Pvu1、StuI和HincII将10 y g总DNA进行酶消化。然后将完全消化的DNA样品用苯酚和氯仿纯化。然后用こ醇沉淀这些DNA样品，并将其连接到双链DNA连接子分子(Genome Walker Adaptors)。[0103]基于潮霉素抗性基因设计了三个基因特异性引物(GSP)。GSPl和APl (接头引物I)用于初级PCR反应；GSP2(巢式基因特异性引物)和AP2(接头引物2)用于二级PCR反应。如果需要，GSP3和AP2用于三级PCR反应以获得特异性产物。
[0104]结果表明，CHO基因组中支持稳定整合和强转录活性的天然染色体整合位点存在于锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C-Mos基因、和N印hrocystin-1/Mal基因。用于整合异源序列的确切基因位置分别示于图3_6 (SEQ IDNO:1-4)。
[0105]实施例2在鉴定出的天然染色体整合位点插入着陆垫
[0106]同源重组:鉴定出整合位点侧翼的基因组DNA并将其克隆到含有阳性和阴性选择标记物的质粒中(图2)。对于每个位点，较长的同源臂(长度为3-4kb)被克隆到新霉素抗性基因的5’。短的同源臂(长度为1.5-2kb)被克隆到新霉素抗性基因的3’。ー个单独的噬菌体结合位点attP位于长同源臂的末端。
[0107]用NotI酶消化同源重组质粒以线性化质粒；长同源臂在该线性DNA的一端。转染到CHO细胞中之后，加新霉素到培养基中以选择在细胞染色体中整合有该线性DNA的细胞。4-6周之后获得了抗性克隆的库。然后在培养基中加入更昔洛韦对细胞进行阴性选择，更昔洛韦会杀死具有随机整合的质粒的细胞。只有在靶位点进行了同源重组的细胞才能既通过阳性选择又通过阴性选择而存活。两轮选择之后，挑出存活下来的细胞并在24孔培养板中培养，然后扩增到6孔板中。然后从这些细胞克隆分离基因组DNA并检查整合到靶位置中的attP位点。
[0108]着陆垫整合:确证了 attP位点插入到了所需位置之后，这些细胞系可用于利用噬菌体Phi_C31整合酶系统将重组基因整合到attP位点中。将重组基因克隆到含有单个attB位点的质粒中。含有重组基因和Ph1-C31整合酶基因的质粒共转染之后，可就特异性整合事件选择细胞。
[0109]***
[0110]虽然为了清楚理解的目的，通过阐释和示例详细描述了前述发明，但鉴于本发明的教导，对本领域一般技术人员显而易见的是可对本发明进行某些改变和改动而不脱离所附权利要求书的精神和范围。
[0111]本说明书中引用的所有出版物、数据库、GenBank序列、专利、和专利申请均通过引用納入本文，如同具体和独立地说明每一篇通过引用納入本文一祥。
【权利要求】
1.在宿主细胞中稳定整合并表达异源多核苷酸的方法，包括将所述异源多核苷酸插入到宿主细胞基因组中位于选自下组的基因之内或附近的天然染色体位点处:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4) ,C-Mos基因和N印hrocystin-1/Mal基因。
2.权利要求1的方法，其中所述异源多核苷酸的插入是由同源重组或由杂合重组酶介导的。
3.权利要求1的方法，其中所述宿主细胞是哺乳动物细胞。
4.权利要求1的方法，其中所述宿主细胞是中国仓鼠卵巣(CHO)细胞。
5.权利要求4的方法，其中天然染色体插入位点位于或靠近以下位置:Ank2基因SEQID N0:1 的位置 130-131，Cpsf4基因 SEQ ID NO: 2 的位置 629-630，C-Mos 基因 SEQ ID NO: 3的位置 272-273，Nephrocystin-1/Mal 基因 SEQ ID NO:4 的位置 239-240。
6.权利要求1的方法，其中所述异源多核苷酸编码多肽。
7.权利要求6的方法，其中所述多肽是治疗性蛋白或エ业蛋白。
8.用于将异源多核苷酸序列稳定整合到哺乳动物细胞基因组中的重组多核苷酸，含有: 第一同源臂、所述异源多核苷酸序列、和第二同源臂；其中所述第一和第二同源臂分别与侧接于位于选自下组的基因之内或附近的天然染色体插入位点的5’ -和3’ -序列基本相同:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子 4 基因(Cpsf4)、C-Mos 基因和 Nephrocystin-1/Mal 基因。
9.权利要求8的多核苷酸，其中所述天然染色体插入位点支持外来基因的稳定整合。
10.权利要求8的多核苷酸，其中所述异源多核苷酸序列编码多肽。
11.权利要求8的多核苷酸，其中所述多肽是治疗性蛋白或エ业蛋白。
12.权利要求8的多核苷酸，其中所述异源多核苷酸序列包含位点特异性重组序列(染色体着陆垫)。
13.权利要求12的多核苷酸，其中所述位点特异性重组序列是被噬菌体整合酶识别的识别序列。
14.权利要求13的多核苷酸，其中所述噬菌体整合酶是phiC-31整合酶。
15.权利要求13的多核苷酸，其中所述识别序列是被所述噬菌体整合酶识别的attP位点或attB位点。
16.权利要求8的多核苷酸，其中所述哺乳动物细胞是中国仓鼠卵巢(CHO)细胞。
17.权利要求16的多核苷酸，其中所述天然染色体插入位点位于或靠近以下位置:Ank2 基因 SEQ ID NO:1 的位置 130-131，Cpsf4 基因 SEQ ID NO: 2 的位置 629-630，C-Mos 基因 SEQ ID NO:3 的位置 272-273,Nephrocystin-1/Mal 基因 SEQ ID NO:4 的位置 239-240。
18.包含权利要求8的重组多核苷酸的载体。
19.工程化的哺乳动物细胞，包含稳定整合到其基因组中位于选自下组的基因之内或附近的ー个或多个天然染色体插入位点处的异源多核苷酸:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C-Mos基因和N印hrocystin-1/Mal基因。
20.权利要求19的细胞，其中所述天然染色体插入位点支持外来基因的稳定整合。
21.权利要求19的细胞，其中所述异源多核苷酸序列编码多肽。
22.权利要求21的细胞，其中所述多肽是治疗性蛋白或エ业蛋白。
23.权利要求19的细胞，其中所述异源多核苷酸包含位点特异性重组序列(染色体着陆垫)。
24.权利要求23的细胞，其中所述位点特异性重组序列是被噬菌体整合酶识别的识别序列。
25.权利要求24的细胞，其中所述噬菌体整合酶是phiC-31整合酶。
26.权利要求24的细胞，其中所述识别序列是被所述噬菌体整合酶识别的attP位点或attB位点。
27.权利要求19的细胞，其为中国仓鼠卵巢(CHO)细胞。
28.权利要求27的细胞，其中所述异源多核苷酸整合在以下位置或以下位置附近:Ank2 基因 SEQ ID NO:1 的位置 130-131，Cpsf4 基因 SEQ ID NO: 2 的位置 629-630，C-Mos 基因 SEQ ID NO:3 的位置 272-273,Nephrocystin-1/Mal 基因 SEQ ID NO:4 的位置 239-240。
29.将异源多核苷酸稳定整合到哺乳动物细胞的基因组中的方法，包括: (a)将位点特异性重组序列插入到所述细胞的基因组中，其中所述插入位于选自下组的基因之内或附近的天然染色体插入位点处:锚蛋白2基因(Ank2)、切割和多腺苷酸化特异性因子4基因(Cpsf4)、C-Mos基因和Nephrocystin-1/Mal基因； (b)通过同源重组将所述异源多核苷酸整合到所述细胞的基因组中的所述插入的位点特异性重组序列处。·
30.权利要求29的方法，其中所述天然染色体插入位点支持外来基因的稳定整合。
31.权利要求29的方法，其中所述位点特异性重组序列是被噬菌体整合酶识别的第一识别序列。
32.权利要求31的方法，其中所述噬菌体整合酶是phiC-31整合酶。
33.权利要求31的方法,其中所述第一识别序列是attP位点或attB位点。
34.权利要求31的方法，其中所述异源多核苷酸连接干与所述第一识别序列同族的所述噬菌体整合酶的第二识别序列。
35.权利要求34的方法,其中所述第二识别序列是attB位点或attP位点。
36.权利要求29的方法，其中所述细胞是中国仓鼠卵巢(CHO)细胞。
37.权利要求36的方法，其中所述位点特异性重组序列插入到基因组中的以下位置或以下位置附近:Ank2基因SEQ ID NO:1的位置130-131，Cpsf4基因SEQ ID NO: 2的位置629-630，C-Mos 基因 SEQ ID NO: 3 的位置 272-273，N印hrocystin-1/Mal 基因 SEQ ID NO:4的位置239-240。
38.权利要求29的方法，其中所述异源多核苷酸包含可操作性连接于启动子序列的靶多肽编码序列。
39.权利要求31的方法，其中所述整合在所述噬菌体整合酶的存在下发生。
40.权利要求39的方法，其中所述噬菌体整合酶由引入到所述细胞中的载体表达。
【文档编号】C12N15/09GK103597083SQ201280025685
【公开日】2014年2月19日申请日期:2012年4月5日优先权日:2011年4月5日
【发明者】V·P·莫罗, 周伟, B·坎宁安, G·M·伊德尔曼申请人:斯克利普斯研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：V·P·莫罗;周伟;B·坎宁安;G·M·伊德尔曼
技术所有人：斯克利普斯研究所
我是此专利的发明人

上一篇：制备乳蛋白质组合物的方法
上一篇：属于芽孢杆菌属的菌株、微生物制剂及植物的栽培方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。