内源启动子在表达异源蛋白中的用途的制作方法

文档序号:407173阅读:909来源:国知局
专利名称:内源启动子在表达异源蛋白中的用途的制作方法
技术领域
本发明通常涉及内源转录控制途径在调节异源蛋白的表达中的用途。
背景技术
在哺乳动物细胞中表达重组蛋白提出了几种挑战。首先,异源DNA需要稳定地引入哺乳动物基因组中。许多方法,例如病毒转染程序和非病毒转染程序,将DNA随机整合至基因组中,产生脱靶效应和可变表达。虽然基于重组的策略(例如,Cre-A^rP或Flp-/^T)能够使异源DNA插入至限定的位置,但必须首先产生并表征包含特定重组位点的细胞系。这不仅是个耗时的过程,而且还使重组酶位点随机放置。第二,异源DNA需要与强启动子连接。一般而言,使用病毒来源的启动子但这些易于沉默。所需的是能精确地靶向并整合异源DNA至哺乳动物基因组中,使得其自强的内源启动子表达。发明简沭
本文提供了用于将编码异源蛋白的序列整合至基因组中的靶定位置使得内源调节系统调节异源蛋白的表达的方法。本公开内容的一个方面包含一种方法,所述方法用于在细胞的染色体中整合编码至少一种异源蛋白的序列,使得所述至少一种异源蛋白的表达通过内源调节系统调节。所述方法包括将以下物质引入细胞中(i)至少一种靶向内切核酸酶或编码靶向内切核酸酶的核酸,其中所述靶向内切核酸酶能结合靶序列并切割编码内源蛋白的染色体序列中的切割位点;和(ii)包含编码所述至少一种异源蛋白的序列的至少一种供体多核苷酸,所述序列与编码2A肽的序列连接以形成异源蛋白编码序列。所述在供体多核苷酸中的异源蛋白编码序列被上游序列和下游序列侧接,所述上游序列和下游序列与染色体序列中切割位点的任一侧有基本的序列同一性。所述方法还包括将细胞保持在这样的条件下,所述条件使得通过同源性定向的修复过程修复通过靶向内切核酸酶引入所述染色体序列中的双链断裂,使得所述供体多核苷酸中的异源蛋白编码序列符合读框地整合至靶定染色体序列中,从而所述至少一种异源蛋白的表达通过调节内源蛋白表达的内源调节系统调节。另一个方面提供了包含编码至少一种异源蛋白的染色体整合序列的细胞,其中所述编码至少一种异源蛋白的序列与编码内源蛋白的染色体序列符合读框地整合。所述至少一种异源蛋白的表达与细胞内内源蛋白的表达被同等地控制。本公开内容的又一个方面包含供体多核苷酸。所述供体多核苷酸包含编码至少一种异源蛋白的序列,所述序列与编码2A肽的序列连接以形成异源蛋白编码序列。此外,所述供体多核苷酸中的异源蛋白编码序列被与靶细胞染色体序列中切割位点的任一侧享有基本序列同一性的上游序列和下游序列侧接。另一个方面提供了一种试剂盒,所述试剂盒用于将编码至少一种异源蛋白的序列整合至编码内源蛋白的染色体序列中。所述试剂盒包含编码锌指核酸酶的至少一种核酸,其中所述锌指核酸酶能结合靶序列并切割染色体序列中的切割位点。所述试剂盒还包含至少一种供体多核苷酸。所述供体多核苷酸包含编码至少一种异源蛋白的序列,所述序列与编码2A肽的序列连接以形成异源蛋白编码序列,其中所述异源蛋白序列被与细胞染色体序列中切割位点的任一侧有基本序列同一性的上游序列和下游序列侧接。而另一个方面提供了利用内源调节系统调节至少一种异源蛋白的表达的方法。所述方法包括提供包含与编码2A肽的序列连接的编码至少一种异源蛋白的染色体整合序列的细胞,其中所述编码异源蛋白和2A肽的序列与编码内源蛋白的染色体序列符合读框地整合。所述方法还包括将所述细胞保持在这样的条件下,所述条件使得内源调节系统的 活化产生编码异源蛋白、2A肽和内源蛋白的一种转录物,其中所述2A肽中断翻译使得所述异源蛋白和内源蛋白各自作为不连续的实体产生。以下更完全地描述本公开内容的其它方面和特征。彩图的引用
本申请文件包含至少一张以彩色完成的图片。含彩图的本专利申请出版物的拷贝将在请求并支付必要费用时由专利局提供。附图简述
图I描述了在人基因座上的靶定整合。(A)图示用于整合异源编码序列的靶区的染色体序列(SEQ ID NO:9)、染色体靶区上的ZFN结合位点(带边框的区域)、ZFN切割位点(黄色箭头)和整合位点(绿色箭头)。整合位点在切割位点的下游7bp处。(B)出示了 TZ/似7沒基因座、整合位点、SH2生物传感器(biosensor)的设计以及成功整合后表达的蛋白的不意图。图2描述了包含了被靶区上的TUBAlA序列侧接的SH2生物传感器序列的供体质粒的图谱。图3出示了野生型和含靶定整合的细胞的蛋白印迹的图像。图4出示了表达GFP-2xSH2(Grb2)-2A蛋白的单独分离的细胞克隆的微分干涉相差(DIC)显微术图像和荧光显微术图像。荧光图像显示了在曝露于100 ng/mL的EGF后生物传感器易位的时程。图5描述了人JCTi 基因座的靶定整合。显示了用于整合异源编码序列的靶区的染色体序列(SEQ ID NO: 10)、染色体靶区中的ZFN结合位点(黄色序列)、ZFN切割位点(上方,黄色箭头)和标签序列整合位点(下方,绿色/黄色箭头)。图6出示了包含被靶区上JCTS序列侧接的SH2生物传感器序列的供体质粒的图
-i'TfeP曰。图7描述了表达GFP-2XSH2 (Grb2) -2A (上图)和RFP- β -肌动蛋白(下图)的单独分离的细胞克隆的荧光显微术图像。出示了在曝露于100 ng/mL的EGF后的时程。图8描述了 LMNBl基因座的靶定整合。显示了用于整合异源编码序列的靶区的染色体序列(SEQ ID NO: 11)、染色体靶区中的ZFN结合位点(黄色序列)、ZFN切割位点(黄色箭头)和标签序列整合位点(绿色箭头)。图9显示了中国仓鼠卵巢(CHO)细胞JCTS基因座中的靶定整合的位点。显示了用于整合异源编码序列的靶区的染色体序列(SEQ ID NO: 12)、ZFN结合位点(带边框的区域)、ZFN切割位点和靶定整合位点。

图10描述了包含SEAP-2A-GFP序列的供体质粒的图谱,所述序列被ZFN切割位点上游和下游的CHO ACTB序列侧接。图11描述了 SEAP-2A-GFP序列的靶定整合至CHO细胞的JCTS基因座的接头PCR分析(junction PCR analysis)。扩增片段为预期大小。发明详述 本文公开的各种方面之中为一种方法,所述方法用于将编码至少一种异源蛋白的序列整合至细胞染色体中的靶定位置使得所述异源蛋白的表达通过内源的转录控制系统调节。因此,与其使用外源(例如,病毒的)启动子,倒不如通过内源系统调节表达,所述内源系统不仅包含启动子序列,而且还包含位于转录起始位点上游和下游的其它顺式调节元件。有利地,内源系统不易于沉默效应。此外,通过连接异源编码序列至2A肽编码序列,翻译期间得到单独的异源蛋白和内源蛋白。通过靶向内切核酸酶基因组编辑方法将编码所述异源蛋白的序列整合至靶定染色体位置。本文还提供了包含编码至少一种异源蛋白的染色体整合序列的细胞和利用内源调节系统表达异源蛋白的方法,所述序列与内源调节系统可操作地连接。(I)包含异源序列的细胞,该序列的表达通过内源调节系统调节
本公开内容的一个方面包括一种细胞,所述细胞包含编码至少一种异源蛋白的染色体整合序列,所述序列的表达通过内源调节系统调节。具体而言,编码异源蛋白的序列与编码内源蛋白的内源染色体序列符合读框地整合。靶向内切核酸酶基因组编辑介导的方法用于靶定并整合异源编码序列至目标内源染色体序列。此外,所述异源编码序列与2A肽编码序列连接。在转录的活化时,所述异源序列和所述内源序列作为单一转录物转录。翻译期间,所述2A肽中断翻译使得所述异源蛋白从内源蛋白中“切离”,从而允许来自一个开放阅读框的多于一种蛋白的同等合成。(a)异源序列
一种或多种异源蛋白的身份(identity)可改变并会改变。一般而言,编码任何蛋白的序列可整合至靶定的染色体位置。所述异源蛋白可为天然存在的蛋白或其片段、重组蛋白、融合蛋白、报告蛋白、标签蛋白、野生型蛋白、治疗蛋白、诊断蛋白、抗体等。例如,所述异源蛋白可为抗体重链或抗体轻链。所述异源蛋白可来源于多种来源,包括例如哺乳动物、脊椎动物、无脊椎动物、植物、微生物、细菌和古细菌。在一些实施方案中,编码多于一种异源蛋白的序列可整合至染色体序列中。例如,编码两种、三种、四种或更多种异源蛋白的序列可整合至染色体序列中使得内源调节系统调节两种、三种、四种或更多种异源蛋白的表达。—般而言,编码异源蛋白的序列可为针对目标细胞中的最佳表达而密码子优化的。所述编码异源蛋白的序列可包含外显子(或蛋白编码)序列。或者,所述编码异源蛋白的序列可包含内含子序列和外显子序列。
如上所示,编码异源蛋白的序列与2A肽连接。本文所用术语“2A肽”是指任何2A肽或其片段、任何2A样肽或其片段或包含必需氨基酸的人工肽。所述2A肽最初在正链RNA病毒中表征,所述病毒产生多蛋白,所述多蛋白在翻译期间“被切割”成成熟的单独蛋白。更具体地,2A肽区(约20个氨基酸)介导在其自身C端的“切割”以将其从所述多蛋白的2B区中释放出来。2A肽序列以甘氨酸残基和脯氨酸残基终止。在2A肽的翻译期间,核糖体在甘氨酸残基后中止,导致新生多肽链的释放。翻译重新开始,2A序列的脯氨酸残基变为下游蛋白的首个氨基酸。与异源编码序列连接的2A肽编码序列可编码全长2A肽。或者,其可编码2A肽的C端片段。所述C端片段可包含C末端的约19个、18个、 17个、16个、15个、14个、13个、12个、11个、10个、9个、8个、7个、6个、5个或4个氨基酸残基。编码2A肽的序列可连接至编码异源蛋白的序列的5’端或3’端。在其中异源序列在内源编码序列的起始附近整合的实施方案中,所述2A肽序列可连接至编码异源蛋白的序列的3’端。因此,所得mRNA具有以下定向5’ _(异源蛋白-2A肽)n-内源蛋白-3’,其中η表示异源蛋白的数目。在其中异源序列在内源编码序列末尾附近整合的实施方案中,所述2Α肽序列可连接至编码异源蛋白的序列的5’端。因此,所得mRNA具有以下定向5’ -内源蛋白_(2Α肽-异源蛋白)η_3’,其中η如上定义。(b)内源调节系统
一般而言,选择用于异源序列的整合的内源染色体序列可视所需的表达性质而定。本文所用术语“内源调节系统”是指共同协作以调节染色体序列转录的染色体序列(即,转录控制元件例如启动子、增强子等)和调节控制蛋白(即,通用转录因子和特异性转录因子)。靶序列包含转录控制序列元件(例如,启动子和其它控制元件)和被转录的染色体序列(即,非翻译序列和翻译序列)。尽管蛋白编码序列的表达可被多种序列元件调节,但出于方便讨论的目的在以下使用术语“启动子”。在一些实施方案中,靶定利用组成型启动子的内源靶序列可为所需的。组成型启动子倾向于在许多类型的细胞中有活性。合适的组成型启动子的非限制性实例包括调节以下物质的表达的那些细胞骨架蛋白(例如α-微管蛋白、β-微管蛋白、α-肌动蛋白、β_肌动蛋白等);普遍存在的细胞蛋白(例如组蛋白、核糖体蛋白、翻译因子、转录因子、细胞周期蛋白、蛋白酶体蛋白等);涉及氨基酸代谢、碳水化合物代谢或脂类代谢、柠檬酸循环、线粒体功能等的酶。一些组成型启动子还可被称为强启动子,因为它们的活化导致产生高水平的基因产物。在其它的实施方案中,表达在例如以下的特定细胞类型中可为所需肌肉细胞、神经细胞、肝细胞、胰β细胞、心脏细胞、乳腺细胞等。本领域的技术人员对可用于细胞特异性或组织特异性表达的合适的细胞特异性启动子是熟悉的。而在另一个实施方案中,可调节表达或诱导型表达可为所需的。合适的诱导型启动子包括被类固醇激素、生长因子、金属离子、热休克等调节的那些。示例性的人或哺乳动物表达调节系统的非限制性实例包括编码和调节微管蛋白、肌动蛋白或核纤层蛋白的表达的那些。一般而言,编码异源蛋白的序列与编码目标蛋白的内源序列符合读框地整合。所述异源序列可在内源编码序列的起始密码子之后被符合读框地整合。或者,所述异源序列可在内源编码序列的终止密码子之前被符合读框地整合。(C)细胞
包含编码上述异源蛋白的染色体整合序列的细胞类型可改变并会改变。一般而言,所述细胞可为真核细胞。在一些实例中,所述细胞可为原代细胞、培养细胞或永生的细胞系细胞。合适的细胞包括真菌或酵母(例如毕赤酵母属O0ZcAia)、酵母属{Saccharomyces、或裂殖酵母属{Schizosaccharomyces)、;昆虫细胞(例如来自草地贪夜蛾{Spodopterafrugiperda)的SF9细胞或来自黑腹果蚬iJ)rosophila meIanogaster)的S2细胞)和动物细胞(例如小鼠细胞、大鼠细胞、仓鼠细胞、非人灵长类细胞或人细胞)。示例性细胞为哺乳动物。所述哺乳动物细胞可为原代细胞。一般而言,可使用对双链断裂敏感的任何原代细胞。所述细胞可为多种细胞类型,例如成纤维细胞、肌原细胞、T细胞或B细胞、巨噬细胞、上皮细胞等。当使用哺乳动物细胞系时,所述细胞系可为任何已建立的细胞系或尚未描述的原代细胞系。所述细胞系可为贴壁或不贴壁的,或者所述细胞系可利用本领域的技术人员已知的标准技术在一定条件下生长,所述条件促进贴壁、不贴壁或器官型生长。合适的哺乳动物细胞系的非限制性实例包括中国仓鼠卵巢(CHO)细胞、SV40转化的猴肾CVI系(C0S7)、人胚肾系293、幼仓鼠肾细胞(BHK)、小鼠支持细胞(TM4)、猴肾细胞(CVI-76)、非洲绿猴肾细胞(VERO)、人宫颈癌细胞(HeLa)、犬肾细胞(MDCK)、布法罗大鼠肝细胞(BRL 3A)、人肺细胞(W138)、人肝细胞Ofep G2)、小鼠乳腺肿瘤细胞(MMT)、大鼠肝癌细胞(HTC)、HIH/3T3细胞、人U2-0S骨肉瘤细胞系、人A549细胞系、人K562细胞系、人HEK293细胞系、人HEK293T细胞系和TRI细胞。对于哺乳动物细胞系的广泛列表,本领域普通技术人员可参考美国典型培养物保藏中心目录(ATCC ,Mamassas, VA)。而在其它的实施方案中,所述细胞可为干细胞。合适的干细胞包括但不限于胚胎干细胞、ES样干细胞、胎儿干细胞、成体干细胞、多潜能干细胞、诱导多能干细胞、多能干细胞、寡能干细胞和单能干细胞。在另外的实施方案中,所述细胞可为单细胞胚胎。所述胚胎可为脊椎动物或无脊椎动物。合适的脊椎动物包括哺乳动物、鸟、爬行动物、两栖动物和鱼。合适的哺乳动物的实例包括但不限于啮齿动物、伴侣动物、家畜和非灵长类。啮齿类动物的非限制性实例包括小鼠、大鼠、仓鼠、沙鼠和豚鼠。合适的伴侣动物包括但不限于猫、狗、兔、刺猬和雪貂。家畜的非限制性实例包括马、山羊、绵羊、猪、牛、驼马和羊驼。合适的非灵长类包括但不限于卷尾猴、黑猩猩、狐猴、猕猴、狨猴、絹毛猴、蜘蛛猴、松鼠猴和黑长尾猴。鸟的非限制性实例包括鸡、火鸡、鸭和鹅。或者,所述动物可为无脊椎动物(例如昆虫、线虫等)。昆虫的非限制性实例包括果蝇属{Drosophila)和蚊子。(II)用于整合异源编码序列的方法
本公开内容的另一个方面提供了一种方法,所述方法用于将编码至少一种异源蛋白的核酸整合至细胞染色体中的靶定位置使得所述异源蛋白的表达通过内源调节系统控制。所述方法包括使用靶向内切核酸酶以介导异源编码序列符合读框地与内源编码序列的整合。更具体地,所述方法包括向细胞内弓I入至少一种靶向内切核酸酶或编码靶向内切核酸酶的核酸以及包含异源编码序列的至少一种供体多核苷酸。所述方法还包括将细胞保持在一定条件下,所述条件使得通过同源性定向的修复过程修复通过靶向内切核酸酶引入内源染色体序列中的双链断裂,使得所述供体多核苷酸中的异源序列符合读框地与靶定染色体序列的编码序列整合,从而连接异源编码序列至内源调节系统。在以下详述所述方法的组成。(a)靶向内切核酸酶
所述方法部分包括向细胞内引入至少一种靶向内切核酸酶或编码靶向内切核酸酶的核酸。所述靶向内切核酸酶可为天然存在的蛋白或改造的蛋白。在一些实施方案中,所述靶向内切核酸酶可为大范围核酸酶或寻靶内切核酸酶。在其它的实施方案中,所述靶向内切核酸酶可为转录激活因子样效应子(TALE)-核酸酶。在优选的实施方案中,所述靶向内切核酸酶可为锌指核酸酶。典型地,锌指核酸酶包含DNA结合结构域(即,锌指)和切割结构域(即,核酸酶),其在以下描述。(1)锌指结合结构域
锌指结合结构域可被改造以识别并结合任何选定的核酸序列。参见,例如,Beerli 等(2002) Nat. Biotechnol. 20:135-141 ;Pabo 等(2001) Ann. Rev. Biochem.70:313-340 ;Isalan 等(2001) Nat. Biotechnol. 19:656-660 ;Segal 等(2001)Curr. Opin. Biotechnol. 12:632-637 ;Choo 等(2000) Curr. Opin. Struct. Biol.10:411-416 ;Zhang 等(2000) J. Biol. Chem. 275 (43):33850-33860 ;Doyon 等(2008)Nat. Biotechnol. 26:702-708 和 Santiago 等(2008) Proc. Natl. Acad. Sci. USA105:5809-5814。改造的锌指结合结构域相对于天然存在的锌指蛋白可具有新的结合特异性。改造方法包括但不限于合理设计和多种类型的选择。合理设计包括,例如,利用包含双联体、三联体和/或四联体核苷酸序列和单独的锌指氨基酸序列的数据库,其中各个双联体、三联体或四联体核苷酸序列与结合特定的三联体或四联体序列的锌指的一条或多条氨基酸序列相关。参见例如,美国专利第6,453,242号和第6,534,261号,其公开内容通过引用以其整体结合于本文中。作为实例,美国专利6,453,242中所述的算法可用于设计锌指结合结构域以靶向预选定的序列。备选方法,例如使用非简并性识别密码表的合理设计也可用于设计锌指结合结构域以祀向特定序列(Sera等(2002) Biochemistry41:7074-7081)。用于鉴定DNA序列中的潜在靶位点和设计锌指结合结构域的公众可用的基于网络的工具可分别参见 http://www. zincfingertools. org 和 http://bindr. gdcb.iastate. edu/ZiFiT/ (Mandell 等(2006) Nuc. Acid Res. 34:W516-ff523 ;Sander 等(2007) Nuc. Acid Res. 35:W599-W605)。锌指结合结构域可被设计以识别并结合长度在约3个核苷酸-约21个核苷酸的DNA序列,或长度在约8个核苷酸-约19个核苷酸的DNA序列。一般而言,本文公开的锌指核酸酶的锌指结合结构域包含至少三个锌指识别区(即,锌指)。在一个实施方案中,所述锌指结合结构域可包含四个锌指识别区。在另一个实施方案中,所述锌指结合结构域可包含五个锌指识别区。而在另一个实施方案中,所述锌指结合结构域可包含六个锌指识别区。锌指结合结构域可被设计以结合任何合适的靶DNA序列。参见,例如,美国专利第6,607,882号;第6,534,261号和第6,453,242号,其公开内容通过引用以其整体结合于本文中。选择锌指识别区的示例性方法可包括噬菌体展示和双杂交系统,并公开于美国专利第 5,789,538 号;第 5,925,523 号;第 6,007,988 号;第 6,013,453 号;第 6,410,248号;第 6,140,466 号;第 6,200,759 号和 6,242,568 号;以及 W098/37186 ;W098/53057 ;W000/27878 ;W001/88197和GB2,338,237,其各自通过引用以其整体结合于本文中。此外,针对锌指结合结构域的结合特异性的增强已在例如W002/077227中描述。锌指结合结构域和用于设计和构建融合蛋白(以及编码所述融合蛋白的多核苷酸)的方法为本领域的技术人员已知并且详述于美国专利申请公布号20050064474和20060188987,其各自通过引用以其整体结合于本文中。锌指识别区和/或多指锌指蛋白可利用合适的接头序列连接在一 起,所述接头序列包括例如长度在5个或更多个氨基酸的接头。关于长度在六个或更多个氨基酸的接头序列的非限制性实例,参见美国专利第6,479,626号;第6,903,185号和第7,153,949号,其公开内容通过引用以其整体结合于本文中。本文所述的锌指结合结构域可包含蛋白的单独锌指之间的合适接头的组合。在一些实施方案中,所述锌指核酸酶还可包含核定位信号或核定位序列(NLS)。NLS为促进锌指核酸酶蛋白靶向至核中以在染色体的靶序列上引入双链断裂的氨基酸序列。核定位信号为本领域已知。参见,例如Makkerh等(1996) Current Biology6:1025-1027。示例性锌指DNA结合结构域识别并结合与选自SEQ ID NO: 1、2、3、4、5、6、8和9的序列有至少约80%序列同一性的序列。在其它的实施方案中,所述序列同一性可为约81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或
100% O(H)切割结构域
锌指核酸酶还包含切割结构域。本文所公开的锌指核酸酶的切割结构域部分可获自任何内切核酸酶或外切核酸酶。可自其获得切割结构域的内切核酸酶的非限制性实例包括但不限于限制性内切核酸酶和寻靶内切核酸酶。参见,例如,2002-2003目录,New EnglandBiolabs, Beverly, Mass.和 Belfort 等(1997) Nucleic Acids Res. 25:3379-3388 或www. neb. com。切割DNA的其它酶为已知的(例如,SI核酸酶;绿豆核酸酶;胰DNA酶I ;微球菌核酸酶;酵母HO内切核酸酶)。还参见Linn等(编辑)Nucleases, Cold SpringHarbor Laboratory Press, 1993。这些酶中的一种或多种(或其有功能的片段)可用作切割结构域的来源。切割结构域还可来源于如上所述的酶或其部分,其需要二聚化用于切割活性。切割可能需要两个锌指核酸酶,因为各个核酸酶包含有活性的酶二聚体的单体。或者,单个锌指核酸酶可包含两个单体以产生有活性的酶二聚体。本文所用“有活性的酶二聚体”为能切割核酸分子的酶二聚体。所述两个切割单体可来源于相同的内切核酸酶(或其有功能的片段),或者各单体可来源于不同的内切核酸酶(或其有功能的片段)。当两个切割单体用于形成有活性的酶二聚体时,优选布置两个锌指核酸酶的识别位点,使得两个锌指核酸酶与其各自的识别位点的结合使切割单体彼此以允许所述切割单体例如通过二聚化形成有活性的酶二聚体的空间定向放置。因此,识别位点的近边可被约5个-约18个核苷酸分离。例如,所述近边可被约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个或18个核苷酸分离。然而应理解的是,任何整数的核苷酸或核苷酸对可插入两个识别位点之间(例如约2个-约50个核苷酸对或更多对)。锌指核酸酶的识别位点的近边,例如本文详细描述的那些,可被6个核苷酸分离。一般而言,切割位点位于识别位点之间。
限制性内切核酸酶(限制性酶)存在于许多物种中并能序列特异性结合DNA(在识别位点上),并且在结合位点上或附近切割DNA。某些限制性酶(例如,IIS型)在远离识别位点的位点上切割DNA并且具有可分离的结合结构域和切割结构域。例如,IIS型酶FokI在一条链上距其识别位点9个核苷酸处和在另一条链上距其识别位点13个核苷酸处催化DNA的双链切割。参见,例如,美国专利第5,356,802号;第5,436,150号和第5,487,994号;以及 Li 等(1992) Proc. Natl. Acad. Sci. USA 89:4275-4279 ;Li 等(1993) Proc.Natl. Acad. Sci. USA 90:2764-2768 ;Kim 等(1994a) Proc. Natl. Acad. Sci. USA91:883-887 ;Kim 等(1994b) J. Biol. Chem. 269:31,978-31,982。因此,锌指核酸酶可包含来自至少一种IIS型限制性酶的切割结构域和一种或多种锌指结合结构域,其可被改造或可不被改造。示例性IIS型限制性酶描述于例如国际公布W007/014,275中,其公开内容通过引用以其整体结合于本文中。另外的限制性 酶还包含可分离的结合结构域和切割结构域,并且其也包含于本公开内容中。参见,例如,Roberts等(2003) Nucleic AcidsRes. 31:418-420。其切割结构域可从结合结构域中分离出来的示例性IIS型限制性酶为FokI。该特定酶作为二聚体是有活性的(Bitinaite等(1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10, 575)。因此,对于本公开内容的目的,用于锌指核酸酶中的FokI酶的部分被认为是切割单体。因此,对于使用FokI切割结构域的靶定双链切割,各自包含FokI切割单体的两个锌指核酸酶,可用于重构有活性的酶二聚体。或者,也可使用包含锌指结合结构域和两个FokI切割单体的单个多肽分子。在某些实施方案中,切割结构域可包含一个或多个改造的切割单体,其使均二聚化最小化或阻止均二聚化,如描述于例如美国专利公布第20050064474号、第20060188987号和第20080131962号中,其各自通过引用以其整体结合于本文中。作为非限制实例,在FokI 的 446 位、447 位、479 位、483 位、484 位、486 位、487 位、490 位、491 位、496 位、498 位、499位、500位、531位、534位、537位和538位的氨基酸残基为影响FokI切割半结构域的二聚化的全部靶标。形成强制性异二聚体的FokI的示例性的改造切割单体包含一对单体,其中第一切割单体在FokI的氨基酸残基位置490和538处包含突变并且第二切割单体在氨基酸残基位置486和499处包含突变。因此,在一个实施方案中,氨基酸位置490的突变用Lys(K)代替Glu (E);氨基酸残基538的突变用Lys (K)代替Iso(I);氨基酸残基486的突变用Glu(E)代替Gln (Q);并且499位的突变用Lys (K)代替Iso (I)。具体地,改造的切割单体可通过以下制备将一个切割单体中的490位从E突变成K并将538位从I突变成K以产生命名为〃E490K: I538K〃的改造切割单体,以及将另一个切割单体中的486位从Q突变成E并将499位从I突变成L以产生命名为〃Q486E:I499L〃的改造切割单体。上述改造的切割单体为必要的异二聚体突变体,其中异常的切割被最小化或被消除。改造的切割单体可利用合适的方法(例如,通过如美国专利公布第20050064474号中所述的野生型切割单体(FokI)的定向诱变(参见实施例5))来制备。上述的锌指核酸酶可被改造以在整合的靶定位点引入双链断裂。所述双链断裂可在整合的靶定位点,或者其可距整合位点多至I个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个或1000个核苷酸。在一些实施方案中,所述双链断裂可在距整合位点多至I个、2个、3个、4个、5个、10个、15个或20个核苷酸处。在其它的实施方案中,所述双链断裂可在距整合位点多至10个、15个、20个、25个、30个、35个、40个、45个或50个核苷酸处。而在其它实施方案中,所述双链断裂可在距整合位点多至50个、100个或1000个核苷酸处。(Hi)勒1 定切割的另外的方法
染色体序列中具有靶位点的任何核酸酶可用于本文所公开的方法。例如寻靶内切核酸酶和大范围核酸酶具有非常长的识别序列,其中的一些基于统计学可能在人大小的基因组中出现一次。在细胞基因组中具有独特靶位点的任何此类核酸酶可代替锌指核酸酶或加上锌指核酸酶用于细胞染色体的靶定切割。寻靶内切核酸酶的非限制性实例包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI, I-Scell, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 和 I-TevIII0 这些酶的识别序列为本领域已知。还参见美国专利第5,420,032号;美国专利第6,833,252 号;Be I fort 等(1997) Nucleic Acids Res. 25:3379-3388 ;Dujon 等(1989) Gene82:115-118 ;Perler 等(1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996)Trends Genet. 12:224-228 ;Gimble 等(1996) J. Mol. Biol. 263:163-180 ;Argast 等(1998) J. Mol. Biol. 280:345-353 和 the New England Biolabs 目录。尽管大多数寻靶内切核酸酶的切割特异性并不绝对针对其识别位点,但所述位点具有足够长度以致单个切割事件/哺乳动物大小的基因组可通过在包含其识别位点的单拷贝的细胞中表达寻靶内切核酸酶来获得。还已报道寻靶内切核酸酶和大范围核酸酶的特异性可被改造以结合非天然的祀位点。参见,例如,Chevalier等(2002) Molec. Cell10:895-905 ;Epinat 等(2003) Nucleic Acids Res. 31:2952-2962 ;Ashworth 等(2006)Nature 441:656-659 ;Paque 等(2007) Current Gene Therapy 7:49-66。(iv)编码锌指核酸酶的核酸
锌指核酸酶可以编码锌指核酸酶的核酸引入细胞中。所述编码锌指核酸酶的核酸可为DNA或RNA。在一个实施方案中,所述编码锌指核酸酶的核酸可为DNA。例如,包含锌指核酸酶编码序列的质粒DNA可引入细胞中。在另一个实施方案中,所述编码锌指核酸酶的核酸可为RNA或mRNA。当所述编码锌指核酸酶的核酸为mRNA时,所述mRNA分子可为5’加帽的。相似地,当编码锌指核酸酶的核酸为mRNA时,所述mRNA分子可被聚腺苷酸化。因此,本方法的核酸可为编码锌指核酸酶的加帽和聚腺苷酸化的mRNA分子。用于加帽和聚腺苷酸化mRNA的方法为本领域已知。(b)供体多核苷酸
用于将异源编码序列整合至靶定染色体序列的方法还包括向细胞中引入至少一种包含异源编码序列的供体多核苷酸。供体多核苷酸不仅包含如章节(I) (a)在上文详述的异源编码序列,而且还包含上游序列和下游序列。所述上游序列和下游序列侧接供体多核苷酸中的异源编码序列。此外,所述上游序列和下游序列与染色体中整合位点的任一侧享有基本的序列同一性。选择供体多核苷酸中的上游序列和下游序列以促进靶定染色体序列和供体多核苷酸之间的重组。本文所用的上游序列是指与整合的靶定位点上游的染色体序列享有序列相似性的核酸序列。相似地,所述下游序列是指与整合的靶定位点下游的染色体序列享有序列相似性的核酸序列。所述供体多核苷酸中的上游序列和下游序列与靶定染色体序列可具有约75%、80%、85%、90%、95%或100%的序列同一性。在其它的实施方案中,所述供体多核苷酸中的上游序列和下游序列与靶定染色体序列可具有约95%、96%、97%、98%、99%或100%的序列同一性。在示例性实施方案中,所述供体多核苷酸中的上游序列和下游序列与靶定染色体序列可有约99%或100%的序列同一性。上游序列或下游序列可包含约20bp_约2500bp。在一个实施方案中,上游序列或下游序列可包含约 50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400 或 2500bp。示例性的上游序列或下游序列可包含约200bp-约2000bp、约600bp-约IOOObp或更具体地约700bp-约IOOObp。典型地,所述供体多核苷酸可为DNA。所述供体多核苷酸可为DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、DNA的线性碎片、PCR片段、裸核酸或与递送载体(例如脂质体或泊洛沙姆)复合的核酸。在一个实施方案中,包含异源编码序列的供体多核苷酸可为DNA质粒。在另一个实施方案中,包含异源编码序列的供体多核苷酸可为 BAC0本领域的技术人员能使用熟知的标准重组技术(参见,例如,Sambrook等,2001和Ausubel等,1996)构建如本文所述的供体多核苷酸。(C)递送至细胞
将在上文章节(II) (a)和(II) (b)中详述的锌指核酸酶或编码锌指核酸酶的核酸和供体多核苷酸引入细胞中。合适的递送方法包括显微注射、电穿孔、声致穿孔(sonoporation)、生物弹射、磷酸 丐介导的转染、阳离子转染、脂质体转染、树形高分子转染、热休克转染、核转染、磁转染、脂转染、基因交付(impalefection)、光转染、核酸的专有试剂增强摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工毒粒的递送。在一个实施方案中,所述分子可通过核转染引入细胞中。在另一个实施方案中,所述分子可通过显微注射引入。所述分子可显微注射进细胞的核或胞质中。包含异源编码序列的供体多核苷酸与锌指核酸酶或编码锌指核酸酶的核酸的比例可改变并会改变。一般而言,所述供体多核苷酸与所述锌指核酸酶分子的比例可为约1:10-约10:1。在不同的实施方案中,供体多核苷酸与锌指核酸酶分子的比例可为约1:10、1:9、1:8、1:7、1:6、1:5、1:4、1:3、1:2、1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1或10:1。在一个实施方案中,所述比例可为约1:1。在其中将多于一种锌指核酸酶分子和多于一种供体多核苷酸引入细胞中的实施方案中,所述分子可同时或序贯引入。例如,各自对不同识别序列特异的锌指核酸酶分子以及相应的供体多核苷酸,可同时引入。或者,各锌指分子以及相应的供体多核苷酸可序贯引入。(d)培养细胞
所述方法还包括将细胞保持在合适的条件下,使得可发生锌指核酸酶介导的整合。细胞可使用标准程序培养以允许锌指核酸酶的表达。标准细胞培养技术描述于例如Santiago等(2008) PNAS 105:5809-5814 ;Moehle 等(2007) PNAS 104:3055-3060 ;Urnov 等(2005)Nature 435:646-651 和 Lombardo 等(2007) Nat. Biotechnology 25:1298-1306。本领域的技术人员理解的是用于培养细胞的方法为本领域已知并且可以且会视细胞类型而变化。在所有情况下可使用常规优化,以确定用于特定细胞类型的最佳技术。在其中细胞为单细胞胚胎的实施方案中,所述胚胎可在体外(例如,在细胞培养物中)培养。典型地,所述胚胎在合适的温度下和含有必需的o2/co2比例的合适培养基中培养以允许锌指核酸酶的表达。培养基的合适的非限制性实例包括M2、M16、KS0M、BM0C和HTF培养基。技术人员应理解的是培养条件可以并且会视胚胎的种类而变化。在所有情况下可使用常规优化,以确定用于胚胎的特定种类的最佳培养条件。在一些实例中,所述胚胎还可通过将胚胎转移至雌性宿主的子宫中在体内培养。一般而言,所述雌性宿主来自与所述胚胎相同或相似的物种。优选地,所述雌性宿主为假孕的。制备假孕雌性宿主的方法为本领域已知。此外,将胚胎转移至雌性宿主的方法是已知的。体内培养胚胎允许胚胎发育并且可导致来源于胚胎的动物的活产。在该方法的该步骤中,所述锌指核酸酶(在一些情况下其表达自引入的核酸)识 另O、结合并切割染色体中的靶序列。通过锌指核酸酶引入的双链断裂经由与供体多核苷酸同源重组而被修复,使得供体多核苷酸的异源编码序列整合至染色体位置。所述供体多核苷酸可被物理地整合,或者所述供体多核苷酸可用作用于断裂修复的模板,导致异源编码序列以及供体多核苷酸的上游序列和下游序列的全部或部分整合至染色体。 (III)利用内源调节子系统调节异源蛋白的表达的方法
又一个方面提供了使用内源调节系统调节异源蛋白的表达的方法。所述方法包括利用如以上章节(I)中详述的包含编码至少一种异源蛋白的染色体整合序列的细胞,或如以上章节(II)中详述地将编码至少一种异源蛋白的序列整合至靶定染色体位置。所述方法还包括将细胞保持在一定条件下,所述条件使得内源调节系统被活化,并使内源编码序列和异源编码序列转录成单一转录物。由于2A肽的存在所致,在翻译期间产生分离的内源蛋白和异源蛋白。因此,异源蛋白的表达通过内源的转录调节机制控制。(IV)应用
本文公开的方法可用于多种商业用途、研究用途和临床用途。由于内源序列和异源序列转录为含一个开放阅读框的转录物,所产生的各蛋白的量是基本相似的。因此,细胞中产生的异源蛋白的水平可通过选择合适的内源调节系统来控制。此外,由于内源调节系统用于调节其表达,所述异源序列典型地不经历沉默效应。本文提供的方法和细胞可用于产生大量具有多种商业应用的重组蛋白。所述重组蛋白可为抗体、抗体片段、单克隆抗体、抗体重链、抗体轻链、人源化抗体、人源化单克隆抗体、嵌合抗体、糖蛋白、酶、治疗蛋白、营养制剂蛋白、疫苗和作血液因子、血栓溶解剂、抗凝血剂、激素、生长因子、干扰素或白细胞介素起作用的蛋白。此外,本文公开的方法和细胞也可用于将治疗蛋白递送至细胞中,使得所述细胞在合适的水平下持续产生治疗蛋白。定义
除非另外定义,否则本文所用的所有技术术语和科学术语具有本发明所属领域的技术人员通常理解的含义。以下引用提供技术人员本发明所用的许多术语的普遍定义Singleton 等,Dictionary of Microbiology and Molecular Biology (第二片反 1994);The Cambridge Dictionary of Science and Technology (Walker 编辑,1988) ;TheGlossary of Genetics,第五版,R. Rieger 等(编辑),Springer Verlag (1991)以及Hale 和 Marham, The Harper Collins Dictionary of Biology (1991)。除非另有规定,否则本文所用的以下术语具有赋予其的含义。当介绍本公开内容或其优选实施方案的要素时,冠词“一种”、“一个”、“所述”和“该”意指存在一个或多个要素。术语“包括”、“包含”和“具有”意味着包括性的并且意指可存在除列出要素之外的其它要素。本文所用“基因”是指编码基因产物的DNA区(包含外显子和内含子),以及调节所述基因产物产生的所有DNA区,无论此类调节序列是否与编码序列和/或转录序列邻接。因此,基因包括但并不一定限于启动子序列、终止子、翻译调节序列(例如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座控制区。“异源蛋白”是对于目标细胞或有机体并非天然的(即,外来的)蛋白。术语“核酸”和“多核苷酸”是指呈线性或环状构象和呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。对于本公开内容的目的,就聚合物的长度而言这些术语并不应理解为限制。所述术语可包含天然核苷酸的已知类似物以及在碱基、糖和/或磷酸酯部分(或例如硫代磷酸酯骨架)被修饰的核苷酸。一般而言,特定核苷酸的类似物具有相同的碱基配对特异性,即,A的类似物可与T碱基配对。术语“多肽”和“蛋白”可互换用于指代氨基酸残基的聚合物。术语“重组”是指遗传信息在两个多核苷酸之间的交换过程。对于本公开内容的目的,“同源重组”是指例如在细胞的双链断裂的修复期间发生的此类交换的专化形式。该过程需要两个多核苷酸之间的序列相似性,将“供体”或“交换”分子用于“靶”分子(即经历双链断裂的那个分子)的模板修复,以及不同地被称作“非交换型基因转换”或“短道基 因转换”,因为其导致遗传信息从供体向靶的转移。在不被任何特定理论限制的情况下,此类转移可涉及异源双链DNA的错配校正(所述异源双链DNA在断裂的靶和供体之间形成),和/或“合成依赖性链退火”(其中所述供体用于重新合成将成为靶的一部分的遗传信息),和/或相关过程。此类专化同源重组往往导致靶分子中序列的改变,使得所述供体多核苷酸中序列的部分或全部掺入靶多核苷酸中。 本文所用术语“靶位点”或“靶序列”是指这样的核酸序列,其限定待编辑的染色体序列的一部分,并且锌指核酸酶经改造以识别并结合该核酸序列,条件是存在用于结合的充足条件。用于确定核酸和氨基酸的序列同一性的技术为本领域已知。典型地,此类技术包括确定基因的mRNA的核苷酸序列和/或确定由其编码的氨基酸序列,并将这些序列与第二核苷酸或氨基酸序列比较。还可以该方式确定并比较基因组序列。一般而言,同一性是指两个多核苷酸或多肽序列分别的精确的核苷酸与核苷酸对应性或氨基酸与氨基酸对应性。两个或更多个序列(多核苷酸或氨基酸)可通过确定其同一性百分比来比较。两个序列(无论核酸或氨基酸的序列)的同一性百分比,为两个比对序列之间的精确匹配的数目除以较短序列的长度,并乘以100。核酸序列的近似比对由Smith和Waterman, Advancesin Applied Mathematics 2:482-489 (1981)的局部同源性算法提供。该算法可通过使用由 Dayhoff, Atlas of Protein Sequences and Structure, M. 0. Dayhoff 编,5 增刊3:353-358, National Biomedical Research Foundation, Washington, D. C. , USA 开发并由Gribskov, NucI. Acids Res. 14(6) :6745-6763 (1986)归一化的打分矩阵而应用于氨基酸序列。确定序列同一'I"生百分比的该算法的示例性工具由Genetics Computer Group(Madison, ffis.)提供于“BestFit”实用应用中。计算序列之间的同一'I"生百分比或相似性的其它合适的程序一般在本领域中为已知的,例如,另一个比对程序是BLAST,其使用默认参数。例如,BLASTN和BLASTP可通过使用下面的默认参数来使用遗传密码=标准;过滤器=无;链=两者;截止=60 ;期望=10 ;矩阵=BL0SUM62 ;描述=50个序列;排序=高分;数据库=非冗余的,GenBank+EMBL+DDBJ+PDB +GenBank CDS 翻译+Swiss 蛋白 +Spupdate+PIR。这些程序的细节可见于GenBank网站。关于本文所述的序列,序列同一性的所需程度的范围为约80%至100%以及其之间的任何整数值。通常,序列之间的同一性百分比为至少70-75%、优选80-82%、更优选85-90%、甚至更优选92%、仍更优选95%和最优选98%序列同一性。。或者,多核苷酸之间的序列相似性的程度可通过如下确定在允许享有一定程度序列同一性的区之间形成稳定双链体的条件下杂交多核苷酸,随后用单链特异性的核酸酶消化,并确定消化片段的大小。当如使用以上方法所确定的,在分子的限定长度内序列表现出至少约70%-75%,优选80%-82%,更优选85%_90%,甚至更优选92%,还更优选95%并且最优选98%序列同一性时,两个核酸或两个多肽序列为彼此基本相似的。本文所用的基本相似还指对特定的DNA或多肽序列显示出完全同一性的序列。基本相似的DNA序列可在例如如对该特定系统限定的严格条件下的Southern杂交实验中鉴定。限定合适的杂交条件在本领域的技术之内。参见,例如,Sambrook等,见上文;Nucleic Acid Hybridization: APractical Approach,编者B. D. Hames和S. J. Higgins, (1985) Oxford; Washington,D. C. ; IRL Press)。两个核酸片段的选择性杂交可如下确定。两个核酸分子之间的序列同一性的程度影响此类分子之间杂交事件的效率和强度。部分相同的核酸序列可至少部分抑制完全相同序列与靶分子的杂交。完全相同序列的杂交的抑制可使用本领域熟知的杂交测定来评价(例如,Southern (DNA)印迹、Northern (RNA)印迹、溶液杂交等,参见Sambrook等,Molecular Cloning: A Laboratory Manual,第二版,(1989) Cold Spring Harbor,N. Y.)。这类测定可用不同程度的选择性来进行,例如使用从低严格性到高严格性变化的条件。若应用低严格性的条件,则非特异性结合的缺乏可利用第二探针来评价,所述第二探针甚至缺少部分程度的序列同一性(例如,与靶分子有少于约30%序列同一性的探针),使得在不存在非特异性结合事件的情况下,所述第二探针不会与靶标杂交。当运用基于杂交的检测系统时,选择与参考核酸序列互补的核酸探针,并接着通过选择合适条件,使探针与参考序列彼此选择性地杂交或结合以形成双链体分子。在中度严格性的杂交条件下能选择性地与参考序列杂交的核酸分子典型地在一定条件下杂交,所述条件允许检测与选定核酸探针的序列有至少约70%序列同一性的、长度为至少约10-14个核苷酸的靶核酸序列。严格的杂交条件典型地允许检测与选定核酸探针的序列有大于约90-95%的序列同一性的、长度为至少约10-14个核苷酸的靶核酸序列。当探针和参考序列有特定程度的序列同一性时,可如本领域已知地来确定可用于探针/参考序列杂交的杂交条件(参见,例如 Nucleic Acid Hybridization: A Practical Approach,编者 B. D.Hames 和 S. J. Higgins, (1985) Oxford; Washington, D. C. ; IRL Press))。杂交的条件为本领域的技术人员所熟知。
杂交严格性是指杂交条件不利于包含错配核苷酸的杂合体的形成的程度,更高的严格性与不匹配杂合体的较低容许限度相关。影响杂交严格性的因素为本领域的技术人员熟知并且包括但不限于温度、pH、离子强度和有机溶剂(例如甲酰胺和二甲基亚砜)的浓度。如本领域的技术人员已知,杂交严格性通过较高的温度、较低的离子强度和较低的溶剂浓度来增加。关于杂交的严格性条件,本领域熟知的是,可应用许多同等条件以通过改变例如以下因素来建立特定的严格性序列的长度和性质、不同序列的碱基组成、盐和其它杂交溶液组分的浓度、杂交溶液中存在或不存在阻断剂(例如,葡聚糖硫酸酯和聚乙二醇)、杂交反应温度和时间参数以及不同的洗涤条件。杂交条件的具体组合可依据本领域中的标准方法来选择(参见,例如,Sambrook 等,Molecular Cloning: A Laboratory Manual,第二版,(1989) Cold Spring Harbor, N. Y.)。 实施例包含以下实施例以阐述本发明。实施例I:利用TUBAlB启动子表达异源蛋白
以下实施例详述了利用微管蛋白启动子调节异源蛋白的表达。编码微管蛋白α-lB,被选择为靶染色体序列。设计一对锌指核酸酶(ZFN)以靶向人TZ/似7沒基因座的位置。对于关于ZFN和用于编辑染色体区的方法的更多细节参见PCT/US2010/43167,其公开内容通过引用以其整体结合于本文中。设计了一种结合序列5’ CTTCGCCTCCTAATC 3’(SEQID NO: I)的 ZFN,并设计了另一种结合序列 5’ CACTATGGTGAGTAA 3’(SEQ ID NO: 2)的 ZFN(图1Α)。在结合时,所述ZFN对在位于两个ZFN识别序列之间的序列5’ CCTAGC 3’中引入双链断裂。利用已知的分子生物学技术产生了编码ZFN对的加帽的、聚腺苷腺化的mRNA。目标基因(即,SH2生物传感器)包含编码GFP的序列,其与两个SH2结构域(来自Grb2衔接蛋白)和2A肽结构域连接(参见图1B)。构建质粒(图2)以用作将SH2生物传感器序列靶定整合至人细胞系的TZ/似基因座的供体多核苷酸。该质粒包含被通过ZFN对引入的切割位点上游和下游的IKb和700 bp TZ/似7沒基因座序列侧接的SH2生物传感器编码序列。设计质粒使得SH2生物传感器编码序列与恰好在微管蛋白起始密码子下游处的内源序列符合读框地整合。在基因座活化时,得到两种分离的蛋白,如图IB中所述。将供体质粒和编码ZFN的RNA对转染至U20S、A549、K562、HEK293或HEK293T细胞中。所述核酸混合物包含一份供体DNA比一份ZFN RNA。接着将转染的细胞在标准条件下培养。单独的细胞克隆的分析表明了 GFP荧光,提示异源生物传感器的表达。蛋白印迹分析证实了 α -微管蛋白的表达不受靶定整合的影响(图3)。包含SH2 (Grb2)的生物传感器被EGF激活并经历核易位。将A549细胞用核酸转染并培养以允许TUBAlB基因座的整合和表达。将细胞暴露于100ng/ml的EGF下并拍照。图4出示了 SH2生物传感器的核易位的时程。实施例2使用ACTB启动子表达异源蛋白
设计以下实施例以检测更强启动子的用途。熟知的强启动子在JCTS基因座内,JCTS基因座编码β-肌动蛋白。设计一对ZFN靶向人JCTS基因座(图5)。设计了一种结合序列 5’ GTCGTCGACAACGGCTCC 3,(SEQ ID NO: 3)的 ZFN,并设计了另一种结合序列 5’TGCAAGGCCGGCTTCGCGG 3’(SEQ ID NO:4)的ZFN。在结合时,ZFN对将双链断裂引入位于两个ZFN识别序列之间的序列5’ GGCATG 3,中。设计供体质粒以提供SH2生物传感器序列,以及标记内源产生的β -肌动蛋白(即,GFP-2x-SH2 (Grb2)-2A-RFP)(图6)。将核酸引入细胞中,并制得两种荧光蛋白(即,GFP-SH2生物传感器和RFP-肌动蛋白)。利用荧光显微术监控各蛋白的荧光。将A549细胞用核酸转染并培养以允许JCTS基因座的整合和表达。将细胞暴露于100 ng/ml的EGF下并拍照。图7出示了 GFP_Grb2生物传感器的易位的时程以及RFP-肌动蛋白的位置。产生的生物传感器的量如此高以致于有高水平的未结合或“游离”的生物传感器,从而极大地增加了背景荧光的量。实施例3使用LMNBI启动子表达异源蛋白
为了靶向基因座(其编码核纤层蛋白BI蛋白),制备了另一对ZFN (图8)。设计了一种结合序列5’ CCTCGCCGCCCCGCT 3’(SEQ ID NO: 5)的ZFN,并设计了另一种结合序列5’GCCGCCCGCCATGGCG 3’ (SEQ ID NO:6)的ZFN。在结合时,ZFN对将双链断裂引入位于两个识别序列之间的序列5’ GTCTCC 3’中。可构建供体质粒以包含编码异源蛋白的序列,所述序列被ZFN切割位点上游和下mUMNBl序列侧接。编码ZFN的核酸和供体质粒可被引入细胞中,并且可如上详述地监测细胞。实施例4使用ACTB启动子表达两种异源蛋白
设计该实施例以确定是否可从相同的内源启动子同时表达两种异源蛋白。选择JCTS基因座用于编码分泌性碱性磷酸酶(SEAP ;约56kD)和GFP (约27kD)的序列的整合。选择这些蛋白是由于其具有与抗体的轻链和重链近似相同的大小。设计ZFN靶向中国仓鼠卵巢(CHO)细胞的JCTS基因座(参见图9),使得异源序列恰好整合至起始密码子的下游。设计了一种结合序列5’ CTTTTGTGCCCTGATA 3’ (SEQ IDNO:8)的 ZFN,并设计另一种结合序列 5’ GCCATGGATGACGATATC 3’ (SEQ ID NO:9)的 ZFN。在结合时,ZFN对将双链断裂引入位于两个识别序列之间的序列5’ TAGTTC 3’中。构建包含待整合序列(即,SEAP-2A-GFP)的供体质粒,所述待整合序列被ZFN切割位点上游和下游的CHO JCTS序列侧接(图10)。编码ZFN的核酸和供体质粒(以低浓度或高浓度)核转染至CHO细胞中,并如上详述地保持细胞。靶定整合通过利用HAdet+2和SEAP-500引物的接头PCR分析来证实,所述引物如预期地扩增1,232个碱基对的片段(图11)。CHO细胞的特征在于供体DNA的高速随机整合。为了检查这个特征,利用GFP追踪靶定插入和随机插入基因座的靶定整合产生GFP-肌动蛋白,其可在细胞中作为绿色微丝可见。随机整合产生均匀的绿色细胞而无定位的GFP蛋白。然而,编码SEAP和GFP的序列至ACTS基因座U20S细胞的整合(如以上的实施例2中所详述地),导致靶定整合对比随机整合的高得多的比例。可能的是,通过掺入自杀基因至供体质粒来消除CHO细胞中的随机整合。通过随机整合仅发生自杀基因的掺入。由于自杀基因的活性,在随机整合的情况下将无活细胞。因此,可分离靶定整合克隆。实施例5使用ACTB启动子表达抗体
CHO细胞常用于生产治疗蛋白(例如抗体)。以上详细描述的CHO供体质粒中的SEAP编码序列可交换为编码抗体的轻链和重链的序列。供体质粒中的序列可如上详述地 整合至CHO细胞的JCTS基因座中。表达的抗体分子可使用标准程序从CHO细胞中纯化。
权利要求
1.一种将编码至少一种异源蛋白的序列整合至细胞的染色体中使得所述至少一种异源蛋白的表达通过内源调节系统来调节的方法,所述方法包括 a)将以下物质引入细胞中(i)至少一种靶向内切核酸酶或编码靶向内切核酸酶的核酸,所述靶向内切核酸酶能结合靶序列并切割编码内源蛋白的靶定染色体序列中的切割位点;和(ii)包含编码所述至少一种异源蛋白的序列的至少一种供体多核苷酸,所述序列与编码2A肽的序列连接以形成异源蛋白编码序列,所述异源蛋白编码序列被与切割位点任一侧有基本序列同一性的上游序列和下游序列侧接;和 (b)将所述细胞保持在这样的条件下,所述条件使得通过同源性定向的修复过程修复通过靶向内切核酸酶引入靶定染色体序列中的双链断裂,使得所述供体多核苷酸中的所述异源蛋白编码序列符合读框地整合至靶定染色体序列中,从而所述至少一种异源蛋白的表达通过调节内源蛋白表达的内源调节系统来调节。
2.权利要求I的方法,其中所述靶向内切核酸酶为锌指核酸酶。
3.权利要求I的方法,其中所述编码2A肽的序列连接至编码异源蛋白的序列的5’或3,。
4.权利要求I的方法,其中所述异源蛋白编码序列在靶定染色体序列的蛋白编码序列的起始或末尾附近整合。
5.权利要求I的方法,其中所述至少一种异源蛋白为抗体重链或抗体轻链。
6.权利要求I的方法,其中所述细胞为人细胞或哺乳动物细胞。
7.权利要求I的方法,其中所述靶定染色体序列编码肌动蛋白、微管蛋白或核纤层蛋白。
8.权利要求I的方法,其中所述靶向内切核酸酶为锌指核酸酶,其结合与选自SEQIDNO: 1、2、3、4、5、6、7和8的序列有至少约80%序列同一1丨生的序列。
9.权利要求8的方法,其中所述序列同一性为约85%、90%、95%、99%或100%。
10.权利要求8的方法,其中所述细胞为中国仓鼠卵巢(CHO)细胞,所述靶定染色体序列编码肌动蛋白,并且所述锌指核酸酶结合选自SEQ ID NO: 7和SEQ ID NO: 8的序列。
11.一种包含编码至少一种异源蛋白的染色体整合序列的细胞,所述编码至少一种异源蛋白的序列与编码内源蛋白的染色体序列符合读框地整合,使得所述至少一种异源蛋白的表达与所述内源蛋白的表达被同等地控制。
12.权利要求11的细胞,其中编码所述至少一种异源蛋白的序列通过编码2A肽的序列与编码所述内源蛋白的染色体序列连接。
13.权利要求12的细胞,其中所述内源蛋白和异源蛋白各自作为不连续的实体产生。
14.权利要求12的细胞,其中编码2A肽的序列连接至编码异源蛋白的序列的5’或3,。
15.权利要求11的细胞,其中所述编码异源蛋白的序列在内源蛋白编码序列的起始或末尾附近整合。
16.权利要求11的细胞,其中所述染色体序列编码肌动蛋白、微管蛋白或核纤层蛋白。
17.权利要求11的细胞,其中所述细胞为人细胞或哺乳动物细胞。
18.权利要求11的细胞,其中所述细胞为中国仓鼠卵巢(CHO)细胞,所述染色体序列编码肌动蛋白,并且所述异源蛋白为抗体重链或抗体轻链。
19.一种供体多核苷酸,所述供体多核苷酸包含编码至少一种异源蛋白的序列,所述序列与编码2A肽的序列连接以形成异源蛋白编码序列,所述异源蛋白编码序列被与靶细胞的染色体序列中切割位点的任一侧享有基本序列同一性的上游序列和下游序列侧接。
20.权利要求19的供体多核苷酸,其中所述供体多核苷酸为质粒载体。
21.权利要求19的供体多核苷酸,其中所述编码2A肽的序列连接至编码异源蛋白的序列的5’或3’。
22.权利要求19的供体多核苷酸,其中所述染色体序列编码肌动蛋白、微管蛋白或核纤层蛋白。
23.权利要求19的供体多核苷酸,其中所述靶细胞为人细胞或哺乳动物细胞。
24.权利要求19的供体多核苷酸,其中所述供体多核苷酸为质粒载体,所述靶细胞为中国仓鼠卵巢(CHO)细胞,并且所述染色体序列编码肌动蛋白。
25.权利要求24的供体多核苷酸,其中所述异源蛋白为抗体重链或抗体轻链。
26.一种将编码至少一种异源蛋白的序列整合至编码内源蛋白的染色体序列中的试剂盒,所述试剂盒包括 (a)至少一种编码锌指核酸酶的核酸,所述锌指核酸酶能结合靶序列并切割染色体序列中的切割位点,和 (b)至少一种供体多核苷酸,所述供体多核苷酸包含编码至少一种异源蛋白的序列,所述序列与编码2A肽的序列连接以形成异源蛋白编码序列,所述异源蛋白序列被与细胞染色体序列中切割位点的任一侧有基本序列同一性的上游序列和下游序列侧接。
27.权利要求26的试剂盒,其中所述至少一种编码锌指核酸酶的核酸为核糖核酸。
28.权利要求26的试剂盒,其中所述锌指核酸酶结合与选自SEQID N0:l、2、3、4、5、6、7和8的序列有至少约80%序列同一性的序列。
29.权利要求28的试剂盒,其中所述序列同一性为约85%、90%、95%、99%或100%。
30.权利要求26的试剂盒,其中所述至少一种供体多核苷酸为质粒载体。
31.权利要求26的试剂盒,其中所述编码2A肽的序列连接至编码异源蛋白的序列的.5,或 3,。
32.权利要求26的试剂盒,其中所述染色体序列编码肌动蛋白、微管蛋白或核纤层蛋白。
33.权利要求26的试剂盒,其中所述靶细胞为人细胞或哺乳动物细胞。
34.权利要求26的试剂盒,其中所述供体多核苷酸为质粒载体,所述靶细胞为中国仓鼠卵巢(CHO)细胞,并且所述染色体序列编码肌动蛋白。
35.权利要求34的试剂盒,其中所述锌指核酸酶结合选自SEQID NO: 7和SEQ ID NO:8的序列。
36.权利要求34的试剂盒,其中所述异源蛋白为抗体重链或抗体轻链。
37.一种利用内源调节系统调节至少一种异源蛋白的表达的方法,所述方法包括 (a)提供包含编码至少一种异源蛋白的染色体整合序列的细胞,所述染色体整合序列与编码2A肽的序列连接,所述编码异源蛋白和2A肽的序列与编码内源蛋白的染色体序列符合读框地整合,和(b)将所述细胞保持在这样的条件下,所述条件使得内源调节系统的活化产生编码异源蛋白、2A肽和所述内源蛋白的一种转录物,其中所述2A肽中断翻译使所述异源蛋白和所述内源蛋白各自作为不连续的实体产生。
38.权利要求37的方法,其中所述编码2A肽的序列连接至编码异源蛋白的序列的5’或3,。
39.权利要求37的方法,其中编码异源蛋白的序列在内源蛋白编码序列的起始或末尾附近整合。
40.权利要求37的方法,其中所述染色体序列编码肌动蛋白、微管蛋白或核纤层蛋白。
41.权利要求37的方法,其中所述细胞为人细胞或哺乳动物细胞。
42.权利要求37的方法,其中所述细胞为中国仓鼠卵巢(CHO)细胞,所述染色体序列编码肌动蛋白,并且所述异源蛋白为抗体重链或抗体轻链。
全文摘要
本发明提供了利用内源的转录控制系统调节异源蛋白的表达的方法。具体而言,靶定基因组编辑用于将编码异源蛋白的序列符合读框地与内源的编码序列整合,使得所述异源序列和内源序列的表达通过内源控制系统来调节。
文档编号C12N15/00GK102959078SQ201180029129
公开日2013年3月6日 申请日期2011年4月13日 优先权日2010年4月13日
发明者G.戴维斯, D.马尔科夫, N.津泽 申请人:西格马-奥尔德里奇有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1