Sorf构建体和多基因表达的制作方法

文档序号:393261阅读:971来源:国知局
专利名称:Sorf构建体和多基因表达的制作方法
SORF构建体和多基因表达相关申请的交叉引用本申请要求Gerald R. Carson等人于2009年10月30日提交的美国临时专利申请系列号61/256,544的权益,该申请通过引用整体并入本文。关于联邦资助研究或开发的声明不适用对序列表、表格或计算机程序列表光盘附件的引用不适用(提供了序列表,但不是作为光盘附件)。
背景在重组表达技术领域,希望的蛋白产物的高生产水平的实现和产生希望的纯度的产物的能力,代表正在发生的挑战。对于包括生物治疗剂(它们是抗体)在内的蛋白产物而言,这样的挑战是特别相关的,但是在该领域的进展还与其它生物制品有关。本发明的某些实施方案至少部分地解决了这些挑战的ー个或多个方面。

发明内容
下面的缩写是适用的0RF,开放读码框;sORF,单个开放读码框;丽,分子量;HC或H,免疫球蛋白重链;LC或L,免疫球蛋白轻链;pab, Pyrococcus abyssi ;pfu,激烈火球菌(Pyrococcus furiosus) ;pho,掘越氏火球菌(Pyrococcus horikoshii) 0T3 ;aa 或 AA,氨基酸;SP,信号肽;LCSP,轻链信号肽;MTX,甲氨蝶呤。本发明的实施方案一般地涉及表达盒、载体构建体、重组宿主细胞以及重组多蛋白和前蛋白的重组表达和加工(包括翻译后加工)的方法。在一些实施方案中,一种或多种表达的产物是免疫球蛋白。在一些实施方案中,所述表达载体包含ー个或多个内含肽区段。在一些实施方案中,所述内含肽区段源自生物体Pyrococcus abyssi、激烈火球菌和掘越氏火球菌0T3的一种或多种Ion内含肽。在一些实施方案中,关于某些元件的次序和存在与否,构造构建体的结构。在一个实施方案中,某些载体基因区段的次序是HL,其中H和L分别指示免疫球蛋白重链和轻链。在另ー个实施方案中,所述次序是LH。在ー个具体实施方案中,所述构建体具有标记为(-)的设计,其中減号指示,所述构建体具有在ORF开始处的ー个信号肽和插入在内含肽的最后ー个氨基酸和第二个蛋白亚基(例如,在内含肽之后的成熟抗体链)的第一个氨基酸之间的甲硫氨酸。在ー个具体实施方案中,所述构建体具有标记为(+)的设计,其中加号指示,第一个信号肽在ORF开始处的存在和第二个信号肽在位于内含肽下游的第二个蛋白亚基开始处的存在。在ー个具体实施方案中,所述构型是HL(-)。在一些实施方案中,本发明提供了 sORF(单个开放读码框)构建体设计,当在来自在瞬时表达条件下的实验的培养物上清液中测量时,其能够生产大于2、5、10、20、30、40或50微克/ml的分泌产物的蛋白表达水平。在一些实施方案中,本发明提供了 sORF构建体,当在来自使用稳定的CH0(中国仓鼠卵巣)细胞表达系统条件的实验的培养物上清液中测量时,其能够生产大于20微克/ml/天的蛋白表达水平。在一个实施方案中,所述表达水平(Ug/ml/天)是在1-24、大于10或大于20的范围内。在ー个具体实施方案中,所述表达水平是24i!g/ml/天。在一些实施方案中,所述蛋白表达属于分泌型抗体,其已经自我装配成重链和轻链的多聚单元。在一些实施方案中,所述抗体属于IgG同种型。在一个实施方案中,本发明提供了用于产生一种或多种重组蛋白产物的分离的或纯化的表达载体,所述表达载体包含单个开放读码框插入物;所述插入物包含(a)编码信号肽的信号肽核酸序列;(b)编码第一多肽的第一核酸序列;(c)编码第一蛋白切割位点的第一插入核酸序列,其中所述第一蛋白切割位点由 火球菌属的Ion蛋白酶基因的内含肽区段、或火球菌属或甲烷球菌属的klbA基因的内含肽区段、或源自它们的修饰的内含肽区段提供;和(d)编码第二多肽的第二核酸序列;其中所述编码所述第一蛋白切割位点的第一插入核酸序列可操作地位于所述第一核酸序列和所述第二核酸序列之间;其中所述编码所述信号肽的信号肽核酸序列可操作地位于所述第一核酸序列之前;且其中所述表达载体能够表达单个开放读码框多肽,所述多肽可在所述第一蛋白切割位点处被切割。为了清楚,在包含不同的插入区段和方法的实施方案的背景下,编码蛋白切割位点的插入核酸序列可以是这样的所述插入核酸序列至少编码第一蛋白切割位点。在规范的内含肽中,例如,切割反应通常以自动持续的且快速的方式进行。另ー种解释部分地依赖于根本机理的理解。从观察外显肽组分的加工后角度看,可以理解,存在分别朝向内含肽区段的N-端和C-端的第一蛋白切割位点和第二蛋白切割位点。切割位点的命名无意必然地与切割反应可能发生的次序相对应,并认识到,可以认为切割反应是在一个切割反应位点处的单个且相对协调的事件,即使认识到给定机理中的动力学上不同的步骤。本说明书也提供了组合物和方法的实施方案,如本领域会理解的,它们具有包含一个或多个切割位点的插入区段。另外,根据加工机理的理解,包含I个切割位点或2个切割位点的区段可以各自允许插入区段的部分或完全切除。在一个实施方案中,插入核酸序列另外编码第二蛋白切割位点。在表达载体的一个实施方案中,所述第一蛋白切割位点由下述内含肽区段提供Pyrococcus abyssi、激烈火球菌或掘越氏火球菌0T3的Ion蛋白酶基因的内含肽区段;或Pyrococcus abyssi、激烈火球菌或詹氏甲烧球菌(Methanococcus jannaschii)的 klbA基因的内含肽区段;或分别源自它们的修饰的内含肽区段。在一个实施方案中,所述内含肽区段或修饰的内含肽区段编码倒数第二位残基,所述残基是赖氨酸、丝氨酸或不是组氨酸。在一个实施方案中,所述内含肽区段或修饰的内含肽区段能够被切割,但是不能使所述第一多肽与所述第二多肽完全相连。在一个实施方案中,所述第一蛋白切割位点是由下述内含肽区段提供包含选自SEQ ID N0:l、3、4、6、7、55、35、37和39的序列的内含肽区段,和源自它们的修饰的内含肽区段。
在一个实施方案中,所述第一多肽和第二多肽能够多聚装配。在一个实施方案中,所述第一多肽和第二多肽中的至少ー种能够胞外分泌。在一个实施方案中,所述第一多肽和第二多肽中的至少ー种具有哺乳动物起源。在一个实施方案中,所述第一多肽包含免疫球蛋白重链或其功能片段,且所述第二多肽包含免疫球蛋白轻链或其功能片段,且所述第一多肽是在所述第二多肽的上游(5,侧)。在表达载体的一个实施方案中,所述载体仅包含ー个信号肽核酸序列。在一个实施方案中,表达载体另外包含编码第三多肽的第三核酸序列和编码第二蛋白切割位点的第二插入核酸序列;其中所述第二插入核酸序列和第三核酸序列以该次序可操作地位于所述第二核酸序列之后。在表达载体的一个实施方案中,所述第一多肽和所述第二多肽包含功能抗体或其它抗原识别分子;其中抗原特异性指向结合选自下述的抗原肿瘤坏死因子_a、促红细胞生成素受体、RSV、EL/选择蛋白、白介素-I、白介素-12、白介素-13、白介素-17、白介素-18、白介素-23、白介素-33、CD81、CD19、IGFU IGF2、EGFR、CXCL-13, GLP-1R、前列腺素 E2和淀粉样蛋白3。在本发明的一个实施方案中,就表达载体而言,所述第一多肽和第二多肽包含一对免疫球蛋白链,它们来自D2E7、EL246、ABT-007、ABT-325或ABT-874的抗体。在ー个实施方案中,所述第一多肽和第二多肽各自独立地选自免疫球蛋白重链或免疫球蛋白轻链区段,它们来自D2E7、EL246、ABT-007、ABT-325、ABT-874或其它抗体的类似区段。在一个实施方案中,表达载体另外包含所述插入物的启动子调控元件。在ー个实施方案中,所述启动子调控元件是诱导型或组成型。在一个实施方案中,所述启动子调控元件是组织特异性的。在一个实施方案中,所述启动子包含腺病毒主要晩期启动子。在一个实施方案中,本发明提供了ー种宿主细胞,其包含本文所述的载体。在ー个实施方案中,所述宿主细胞是原核细胞。在一个实施方案中,所述宿主细胞是大肠杆菌。在一个实施方案中,所述宿主细胞是真核细胞。在一个实施方案中,所述真核细胞选自原生生物细胞、动物细胞、植物细胞和真菌细胞。在一个实施方案中,所述真核细胞是选自下述的动物细胞哺乳动物细胞、禽细胞和昆虫细胞。在一个实施方案中,所述宿主细胞是哺乳动物细胞系。在一个实施方案中,所述宿主细胞是CHO细胞或ニ氢叶酸还原酶-缺陷型CHO细胞。在一个实施方案中,所述宿主细胞是HEK(人胚胎肾)细胞或非洲绿猴肾细胞,例如,COS细胞。在一个实施方案中,所述宿主细胞是酵母细胞。在一个实施方案中,所述酵母细胞是酿酒酵母。在一个实施方案中,所述宿主细胞是草地贪夜蛾(Spodoptera frugiperda)Sf9昆虫细胞。在一个实施方案中,本发明提供了一种用于生产重组多蛋白或多种蛋白的方法,所述方法包括在足以允许载体蛋白表达的条件下,在培养基中培养宿主细胞。在一个实施方案中,所述方法另外包括回收和/或纯化所述载体蛋白。在生产方法的一个实施方案中,所述多种蛋白能够多聚装配。在一个实施方案中,所述重组多蛋白或多种蛋白是生物学上有功能的和/或治疗性的。在一个实施方案中,本发明提供了ー种用于生产重组产物的方法,其中所述产物是免疫球蛋白蛋白质或其功能片段、装配的抗体或其它抗原识别分子,所述方法包括在足以生产所述重组产物的条件下,在培养基中培养宿主细胞。在一个实施方案中,本发明提供了根据本文所述的方法生产的蛋白质或多蛋白。在实施方案中,本发明提供了根据本文的方法生产的装配的免疫球蛋白、装配的其它抗原识别分子、或单个免疫球蛋白链或其功能片段。在一个实施方案中,关于所述免疫球蛋白、其它抗原识别分子或单个免疫球蛋白链或其功能片段,存在实现或促进特定抗原(其中抗原可以是配体或反受体等)与下述物质的结合的能力肿瘤坏死因子-a、促红细胞生成素受体、RSV、EL/选择蛋白、白介素-I、白介素-12、白介素-13、白介素17、白介素-18、白介素-23、白介素-33、CD81、CD19、IGF1、IGF2、EGFR、CXCL-13、GLP-1R、前列腺素E2或淀粉样蛋白P。在一个实施方案中,所述免疫球蛋白或其功能片段是免疫球蛋白D2E7或ABT-874,或者所述功能片段是它们各自的片段。在一个实施方案中,本发明提供了ー种药物组合物,其包含治疗有效量的蛋白和药学上可接受的载体。在一个实施方案中,本发明提供了如本文所述的表达载体,其另外包含编码标签的核酸序列。在载体构建体的一个实施方案中,所述插入核酸序列另外编码标签。
在一个实施方案中,所述第一多肽和所述第二多肽包含功能抗体或其它抗原识别分子;其中抗原特异性指向结合选自下述的抗原肿瘤坏死因子_a、促红细胞生成素受体、RSV、EL/选择蛋白、白介素-I、白介素-12、白介素-13、白介素-17、白介素-18、白介素-23、白介素-33、CD81、CD19、IGFU IGF2、EGFR、CXCL-13、GLP-1R、前列腺素 E2 和淀粉样蛋白P。在一个实施方案中,所述第一多肽和第二多肽包含ー对免疫球蛋白链,它们来自D2E7、EL246、ABT-007、ABT-325或ABT-874的抗体。在一个实施方案中,所述第一多肽和第ニ多肽各自独立地选自免疫球蛋白重链或免疫球蛋白轻链区段,它们来自D2E7、EL246、ABT-007、ABT-325、ABT-874或其它抗体的类似区段。在一个实施方案中,载体另外包含所述sORF插入物的启动子调控元件。在ー个实施方案中,所述启动子调控元件是诱导型或组成型。在一个实施方案中,所述启动子调控元件是组织特异性的。在一个实施方案中,所述启动子包含腺病毒主要晩期启动子。在一个实施方案中,载体另外包含编码蛋白酶的核酸,所述蛋白酶能够切割所述第一蛋白切割位点。在一个实施方案中,所述编码蛋白酶的核酸可操作地位于所述sORF插入物内;所述表达载体另外包含编码第二切割位点的额外核酸,其位于所述编码蛋白酶的核酸与所述第一核酸和所述第二核酸中的至少ー种之间。在一个实施方案中,本发明提供了ー种宿主细胞,其包含本文所述的载体。在ー个实施方案中,所述宿主细胞是原核细胞。在一个实施方案中,所述宿主细胞是大肠杆菌。在一个实施方案中,所述宿主细胞是真核细胞。在一个实施方案中,所述真核细胞选自原生生物细胞、动物细胞、植物细胞和真菌细胞。在一个实施方案中,所述真核细胞是选自下述的动物细胞哺乳动物细胞、禽细胞和昆虫细胞。在一个优选的实施方案中,所述宿主细胞是CHO细胞或ニ氢叶酸还原酶-缺陷型CHO细胞。在一个实施方案中,所述宿主细胞是COS细胞。在一个实施方案中,所述宿主细胞是酵母细胞。在一个实施方案中,所述酵母细胞是酿酒酵母。在一个实施方案中,所述宿主细胞是昆虫草地贪夜蛾Sf9细胞。在一个实施方案中,所述宿主细胞是人胚胎肾细胞。在一个实施方案中,本发明提供了一种用于生产重组多蛋白或多种蛋白的方法,所述方法包括在足以允许载体蛋白表达的条件下,在培养基中培养宿主细胞。在一个实施方案中,所述方法另外包括回收和/或纯化所述载体蛋白。在一个实施方案中,所述多种蛋白能够多聚装配。在一个实施方案中,所述重组多蛋白或多种蛋白是生物学上有功能的和/或治疗性的。在一个实施方案中,本发明提供了ー种用于生产免疫球蛋白蛋白质或其功能片段、装配的抗体或其它抗原识别分子的方法,所述方法包括在足以生产免疫球蛋白蛋白质或其功能片段、装配的抗体或其它抗原识别分子的条件下,在培养基中培养根据权利要求38所述的宿主细胞。在一个实施方案中,本发明提供了根据本文的方法生产的蛋白质或多蛋白。在一个实施方案中,本发明提供了根据本文的方法生产的装配的免疫球蛋白、装配的其它抗原识别分子、或单个免疫球蛋白链或其功能片段。在一个实施方案中,所述免疫球蛋白、其它抗原识别分子或单个免疫球蛋白链或其功能片段具有实现或促进特定抗原与下述物质的结合的能力肿瘤坏死因子-a、促红细胞生成素受体、白介素-18、EL/选择蛋白或白介素-12。在一个实施方案中,所述免疫球蛋白是D2E7,或者其中所述功能片段是D2E7的片段。在一个实施方案中,本发明提供了ー种表达载体、具有所述载体的宿主细胞、载体 表达产物、药物组合物和/或制备或使用前述任ー种的方法,其中所述载体是根据权利要求1-9中任ー项所述的载体,且另外包含编码轻链信号肽的区段。在一个实施方案中,所述编码的轻链信号肽是选自下述的K轻链信号肽417、418、419、ム26和1126。在ー个实施方案中,所述编码的轻链信号肽是VKII K轻链信号肽A18,SEQ ID NO :82(氨基酸序列MRLPAQLLGLLMLWIPGSSA)。在一个实施方案中,本发明的组合物是分离的或纯化的。在一个实施方案中,本发明的组合物是肽化合物。在一个实施方案中,本发明的组合物是核酸化合物。在一个实施方案中,本发明的肽化合物被装配在具有所述肽或至少ー种其它肽的多聚复合物中。在一个实施方案中,本发明提供了 ー种药物制剂,其包含本发明的组合物。在ー个实施方案中,本发明提供了ー种合成本发明的组合物或其药物制剂的方法。在一个实施方案中,药物制剂包含本领域会理解的ー种或多种赋形剂、载体和/或其它组分。在一个实施方案中,本发明的组合物的有效量可以是治疗有效量。在一个实施方案中,使用重组方法学或合成技术,制备本发明的肽组合物。在ー个实施方案中,使用重组方法学或合成技术,制备本发明的核酸组合物。在一些实施方案中,本发明提供了用于药剂生产中的方法。在技术领域的背景下,结合附图,从下面的描述中会明白本发明的实施方案的其它方面、特征和优点。一般而言,在本文中使用的术语和短语具有它们的本领域公认的含义,这些含义可以通过參考本领域技术人员已知的标准教科书、期刊參考文献和背景来找到。在本文中提供的定义意图澄清它们在本发明的实施方案的背景下的具体用途。不希望受任何具体理论的约束,在本文中可以讨论与本发明有关的根本原理或机理的信念或理解。应当认识到,不论任何解释或假设的最终正确性如何,但是本发明的实施方案可以是可操作的和有用的。


图I解释了 sORF表达构建体pTT3pab Ion HL㈠的示意图。图2解释了在D2E7抗体的表达构建体中的sORF组分的结构。图3解释了 sORF表达产物的蛋白分析的SDS-PAGE結果。通过蛋白A亲和色谱法纯化分泌的IgG分子,并在非还原(A)和还原(B)条件下通过SDS-PAGE进行分离。泳道和样品从左向右为(泳道I)分子量參照标志物;(2)对照构建体产物;(3) Pab-Ion mut Al ;
(4)Pab-Ion mut A2 ; (5) pTT3 pfu Ion YP,和(6)pTT3 pfu Ion MA。图4解释了其它sORF表达产物的蛋白分析的SDS-PAGE結果。通过蛋白A亲和色谱法纯化分泌的IgG,并在非还原(A)和还原(B)条件下通过SDS-PAGE进行分离。泳道和样品从左向右为:(泳道I)分子量标志物;⑵对照;(3)pTT3 pfu Ion HL㈠;和(4)pTT3pfu Ion MutA0图5解释了使用klbA内含肽从sORF构建生产的分泌型抗体的分析。通过蛋白A亲和色谱法纯化从Pab-klbA HL(-)和Mja-klbA HL (-)构建体分泌的IgG产物,并在还原(图A、B和C)和非还原(图D)条件下通过SDS-PAGE进行分离。图A和D显示了染色的凝胶的图像;图B是使用针对人IgGl Fe的抗体的免疫印迹;图C是使用针对人K轻链的抗体的免疫印迹。泳道和样品从左向右为(泳道I)对照;(2) Pab-klbA HL㈠;和(3)Mja-klbA HL(-)。所述对照是从2个分开的开放读码框的表达生成的相同抗体。图6解释了使用Pab klbA内含肽(其具有对在N-端剪接点处的氨基酸残基的修饰)的单个开放读码框构建体的表达結果。通过蛋白A亲和色谱法纯化分泌的IgG蛋白,并在非还原和还原条件下通过SDS-PAGE进行分离。泳道和样品从左向右为(泳道I)分子量标志物;(2)使用常规载体(对照)生产的相同抗体;(3)pTT3 Pab klba HL(-)wt ;(4)pTT3 Pab klba HL(-)GC ;和(5)pTT3 Pab klba HL(-)KC0图7解释了 sORF表达构建体pA190-Pab_lon HL(-)的示意图,所述构建体适合用作在CHO细胞系系统中的稳定表达载体。图8解释了 sORF构建体转染克隆(sORF Pab Ion构建体)的稳定表达系统达到培养物汇合的时间和频率的結果。图9解释了具有轻链接头突变的瞬时表达构建体的sORF组分的结构示意图。一系列构建体被命名为“ M1-X”(第I行)和D2-X”(第2行),其中X指示任意氨基酸。图10解释了具有轻链接头突变(基于Metl残基的变化)的一系列sORF构建体的IgG分泌結果。图11解释了具有轻链接头突变(基于Asp2残基的变化)的一系列sORF构建体的IgG分泌結果。图12解释了蛋白产物的SDS-PAGE分析结果,所述蛋白产物来自具有轻链接头突变的Metl和Asp2系列构建体中的每ー个的实施例。图13解释了能够表达ABT-874抗体的瞬时表达构建体的sORF组分的结构示意图。图14解释了在用于导入插入物(包括标签)的溶剂可接近的环的优选位置(虚线箭头指示区段H和F的接头附近,朝向DOD内切核酸酶结构域的末端)的位置的背景下,内含肽的某些结构基序。
图15解释了具有轻链信号肽A18的表达构建体的质粒图谱,所述构建体用于HEK293细胞的瞬时转染系统中。图16解释了抗体表达构建体的产物的SDS-PAGE分析的結果。图17解释了来自转染的细胞系(包括瞬时转染的HEK293细胞和稳定转染的CHO细胞)的抗体表达构建体的产物的蛋白印迹分析的結果。图18解释了具有轻链信号肽A18的表达构建体的质粒图谱,所述构建体用于CHO细胞的稳定转染系统中。
具体实施例方式通过下述的非限制性实施例,可以进一歩理解本发明。本领域的公开内容(包括根据Carson等人于2007年3月22日提交的US 20070065912的公开内容)会理解某些信息。本发明提供了系统,例如,构建体和方法,其用于表达化合物结构或生物活性蛋白诸如酶、激素(例如,胰岛素)、细胞因子、趋化因子、受体、抗体或其它分子。优选地,所述蛋白是免疫调节蛋白诸如白介素、全长免疫球蛋白、其片段、本领域理解的其它抗原识别分子或其它生物治疗分子。这样的系统的概述是在免疫球蛋白分子的具体背景下,其中重组生产是基于在单个启动子的转录控制下的重链和轻链编码序列的表达,其中単一翻译产物(多蛋白)向分离的重链和轻链的转化是由内含肽组分介导。在一个实施方案中,免疫球蛋白多蛋白分子的第一链或第二链可以是重链或轻链。编码重组免疫球蛋白区段的序列可以是全长编码序列或其片段。在ー个具体的实施方案中,第二轻链编码序列必须是编码要在本发明的实践中加工的多蛋白的序列的一部分;即,总共存在3个区段,包括任意次序的2个轻链和I个重链。在具体实施方案中,用这些组分以下述次序构建成构建体a) IgH-IgL ;b) IgL-IgH ;c) IgH-IgL-IgL ;d) IgL-IgH-IgL ;e) IgL-IgL-IgH ;f) IgH-IgH-IgL ;g) IgH-IgL-IgH ;和 / 或 h) IgL-IgH-IgH0 在一个实施方案中,所述连字符可以指示切割位点序列所在的位置。或者,免疫球蛋白重链和轻链编码序列与位于它们之间的内含肽编码序列在框架内融合,其中所述内含肽天然地能够或被修饰成缺少剪接活性,或者重链和轻链的末端被设计成,使得剪接优选地不会发生,或使得剪接以低效率发生,因而未剪接的抗体分子占优势。另外,修饰的内含肽可以进ー步被修饰,进ー步使得,不存在内切核酸酶区域(在内切核酸酶区域以前已经存在的情况下),条件是,保留位点特异性的蛋白水解性裂解活性,使得轻和重抗体多肽从初级翻译产物的插入内含肽部分中释放出。轻或重抗体多肽可以是N-外显肽,且任ー个可以是C-外显肽。所述载体可以是能够表达全长多蛋白的任意重组载体,例如,腺伴随病毒(AAV)载体、慢病毒载体、逆转录病毒载体、复制活性的腺病毒载体、复制缺陷的腺病毒载体和无肠(gutless)腺病毒载体、疱疫病毒载体或非病毒载体(质粒)或本领域已知的任意其它载体,选择适合在其中表达免疫球蛋白或其它蛋白的宿主细胞的载体。杆状病毒载体可用于在昆虫细胞中表达基因。众多载体是本领域已知的,且许多是可商业得到的,或在本领域可以其它方式容易地得到。包括启动子在内的调节序列;宿主细胞
用于重组免疫球蛋白或其它蛋白表达的载体可以包括本领域已知的许多启动子中的任ー种,其中所述启动子是组成性的、可调节的或可诱导的、细胞类型特异性的、组织特异性的或物种特异性的。其它具体的实例包括,例如,四环素响应性的启动子(Gossen M,BujardH, Proc Natl Acad Sci U S A. 1992,15 ;89 (12) :5547-51)。所述载体是适合要在其中表达嵌合基因的宿主细胞的复制子,且它合乎需要地还包括也在细菌细胞(有利地,大肠杆菌,即对于分子生物学操作而言方便的细胞)中有功能的复制子。用于基因表达的宿主细胞可以是,但不限干,动物细胞,特别是哺乳动物细胞,或它可以是微生物细胞(细菌、酵母、真菌,但是优选真核生物)或植物细胞。特别合适的宿主细胞包括昆虫培养的细胞诸如草地贪夜蛾细胞、酵母细胞诸如酿酒酵母或巴氏毕赤酵母(Pichia pastoris)、真菌诸如里氏木霉(Trichoderma reesei)、曲霉菌属、短梗霉属(Aureobasidum)和青霉属(Penicillium)种以及哺乳动物细胞诸如CHO (中国仓鼠卵巣)、BHK (幼仓鼠肾)、COS、293、3T3 (小鼠)、Vero (非洲绿猴)细 胞,也可以使用不同的转基因动物系统,包括、但不限于、猪、小鼠、大鼠、绵羊、山羊、母牛。已知鸡系统用于在卵白中表达,转基因的绵羊、山羊和母牛系统用于在乳汁中表达,以及其它。杆状病毒(特别是AcNPV)载体可以用于本发明的单个ORF抗体表达和切割,例如在多角体蛋白启动子或其它强启动子的调节控制下在昆虫细胞系中表达sORF ;这样的载体和细胞系是本领域众所周知的和可商业得到的。用于哺乳动物细胞中的启动子可以是组成型(疱疹病毒TK启动子,McKnight,Cell 31 355,1982 ;SV40 早期启动子,Benoist 等人 Nature 290 :304,1981 ;鲁斯肉瘤病毒启动子,Gorman 等人 Proc. Natl. Acad. Sci. USA 79 :6777,1982 ;巨细胞病毒启动子,Foecking等人Gene 45 :101,1980 ;小鼠乳腺肿瘤病毒启动子,一般地參见Etcheverry inProtein Engineering Principles and Practice, Cleland 等人编,第 162-181 页,Wiley& Sons, 1996)或受调节的(例如金属硫蛋白启动子,Hamer等人J. Molec. Appl. Genet. I 273,1982)。载体可以基于感染特定哺乳动物细胞的病毒,特别是逆转录病毒、牛痘和腺病毒,它们的衍生物是本领域已知的和可商业得到的。启动子包括、但不限干巨细胞病毒启动子、腺病毒晩期启动子和牛痘7. 5K启动子。酵母和真菌载体(參见,例如,Van denHandel, C.等人(1991)见Bennett, J. W.和 Lasure, L.L.(编),More Gene Manipulationsin Fungi, Academy Press, Inc. ,New York, 397-428)和启动子也是众所周知的和可广泛得到的。烯醇化酶是ー种众所周知的组成型酵母启动子,醇脱氢酶是ー种众所周知的受调节的启动子。具体的启动子、转录终止序列和其它任选的序列(诸如编码组织特异性序列的序列)的选择,在很大程度上由希望在其中进行表达的细胞的类型決定。所述细胞可以是细菌、酵母、真菌、哺乳动物、昆虫、鸡或其它动物细胞。信号序列要切割、蛋白水解地加工或自加工的蛋白的编码序列(其掺入在载体中)可以另外包含编码ー个或多个信号序列的ー个或多个序列。这些编码的信号序列可以与多蛋白内的ー个或多个成熟的区段相结合。例如,编码免疫球蛋白重链前导序列的序列可以在重链的编码序列之前,与多蛋白编码序列的剰余部分可操作地连接且在框架内。类似地,轻链前导序列肽编码序列或其它前导序列肽编码序列可以与免疫球蛋白轻链编码序列之一或ニ者在框架内结合,其中前导序列-链与自加工位点(诸如2A)被邻近链隔开,或被编码蛋白酶识别序列的序列隔开,以维持适当的读码框。免疫球蛋白重链和轻链的化学计暈学在本文的许多实施方案中,免疫球蛋白/抗体轻链(IgL)和重链(IgH)在载体水平或在表达的细胞内水平以约I : I比例(IgL IgH)存在于宿主细胞内。然而,在本文中和别处的重组方案已经依赖于重链和轻链的等摩尔表达(參见,例如,美国专利公开2005/0003482A1或国际公开W02004/113493),在其它实施方案中,本发明提供了方法和表达盒和载体,其具有2 I比例的轻链和重链编码序列,并在初级翻译产物是多蛋白时,与所述链的自加工或蛋白水解性加工共表达。在一些实施方案中,所述比例大于I : 1,诸如约2 I或大于2 I。在ー个具体实施方案中,以大于I : l(IgL IgH)的比例使用轻链编码序列。在ー个具体的实施方案中,IgL IgH的比例是2 I。因而,在一些实施方案中,sORF抗体表达技术提供的优点包括操纵重链和轻链的基因剂量比例的能力、用于 内质网(ER)中的多亚基装配的重链和轻链多肽的接近和高效率蛋白分泌的潜力。本发明另外提供了用载体转化或感染的宿主细胞或稳定的宿主细胞克隆,所述载体包含编码免疫球蛋白(即,抗体)的重链和I个或至少2个轻链的序列;编码切割位点(诸如自加工位点、蛋白酶识别位点或在它们之间的信号肽)的序列;且可能另外包含ー个或多个编码额外的蛋白水解性切割位点的序列。在本发明的范围内还包括这样的细胞或克隆在制备全长重组免疫球蛋白或其片段或包含多个亚基的其它生物活性蛋白(例如,双链或多链分子,或在自然界中生成为前蛋白并经切割或加工以释放出前体衍生的蛋白和活性部分的那些)中的用途。非限制性实例包括胰岛素、白介素-18、白介素-1、骨形态形成蛋白4、骨形态形成蛋白2、任意其它双链骨形态形成蛋白、神经生长因子、肾素、胰凝乳蛋白酶、转化生长因子P和白介素13。在一个有关的方面,本发明提供了一种重组免疫球蛋白分子或其片段或由这样的细胞或克隆生产的其它蛋白,其中所述免疫球蛋白包含源自自加工切割位点的氨基酸(诸如内含肽或刺猬结构域),切割位点或信号肽切割和方法,用于生产它们的载体和宿主细胞。在一些实施方案中,本发明提供了含有本文所述的ー种或多种构建体的宿主细胞。本发明提供了用于表达免疫球蛋白分子或其片段的单个载体构建体,以及将它们用于体外或体内用途的方法。所述载体具有自加工或其它蛋白酶识别序列,该序列在第一和第二免疫球蛋白编码序列之间以及在第二和第三免疫球蛋白编码序列之间,从而允许使用单个启动子和转录物来表达功能抗体分子。示例性的载体构建体包含编码在开放读码框之间的自加工切割位点的序列,且可能另外包含与自加工切割位点邻近的额外的蛋白水解性切割位点,用于在切割以后去除包含自加工切割位点的氨基酸。所述载体构建体可用于与全长生物活性的免疫球蛋白或其片段的增强的体外和体内生产有关的方法中。使用相同的策略,可以制备具有至少2个不同链的其它生物活性蛋白,尽管应当理解,可能不要求任一条链的编码序列相对于其它链的编码序列以大于I的比例存在。尽管在本文中例证了具体的组合物和方法,应当理解,许多替代性组合物和方法中的任ー种是可适用的,且适合用于实践本发明。还应当理解,使用本领域的标准规程,可以评价本发明的多蛋白表达盒和载体、宿主细胞和方法。除非另有说明,本发明的实践将采用细胞生物学、分子生物学(包括重组技术)、微生物学、生物化学和免疫学的常规技木,它们是在本领域技术人员的范围内。这样的技术在文献中得到了充分解释,所述文献例如,Molecular Cloning A Laboratory Manual,第 2 版(Sambrook 等人,1989);Oligonucleotide Synthesis(M. J. Gait 编,1984) ;Animal Cell Culture(R. I. Freshney编,1987) ;Methods in Enzymology(Academic Press, Inc. ) ;Handbook of ExperimentalImmunology (D. M. Weir & C. C. Blackwell 编);Vectors for Mammalian Cells (J. M. Miller& M. P. Calos 编,1987) ;Current Protocols in Molecular Biology(F. M. Ausubel 等人编,1993) ;PCR The Polymerase Chain Reaction, (Mullis 等人编,1994);和 CurrentProtocols in Immunology (J. E. Coligan等人编,1991),它们中的姆ー篇特此通过引用并入本文中。除非另有说明,在本文中使用的所有术语具有与本领域技术人员通常理解相同的含义,本发明的实践将采用微生物学和重组DNA技术的常规技术,它们是在本领域技术人员的知识内。在蛋白的背景下,在本文中一般地使用的术语“修饰的”表示这样的区段其中在提及的分子中置換、删除或添加了至少ー个氨基酸残基。类似地,在核酸的背景下,该术语 表示这样的区段其中在提及的分子中置換、删除或添加了至少ー个核酸亚基。本文使用的术语“内含肽”通常表示蛋白的内部区段,该内部区段会促进它自身的去除,并影响称作外显肽的侧接区段的连接。在多种类型的生物体中识别出了内含肽的许多实例,在有些情况下,它们具有共同的结构和/或功能特征。本发明广泛地能够采用内含肽及其变体,只要认为存在,并进一歩被识别或发现。參见,例如,Gogarten JP等人,2002, Annu Rev Microbiol. 2002 ;56 :263-87 ;Perler, F. B. (2002), InBase, theIntein Database. Nucleic Acids Res. 30, 383-384 (也通过 New England Biolabs, Inc.,Ipswich, MA 的因特网网站;http://www. neb. com/neb/inteins. html ;Amitai G 等人,Mol Microbiol. 2003,47(1) :61-73 ;Gorbalenya AE, Nucleic Acids Res. 1998 ;26 (7)1741-1748. Non-canonical inteins)。在蛋白中,含有内含肽的单元或内含肽剪接单元可以理解为包括侧接外显肽的部分,其中结构方面可以促进切割、连接等反应。该术语也可以理解为提及含有“修饰的内含肽”组分的基于内含肽的系统的范畴。本文使用的术语“修饰的内含肽”可以表示合成的内含肽或天然的内含肽,其中在内含肽剪接单元中置換、删除或添加了至少ー个氨基酸残基,使得切割的或切离的外显肽不与所述内含肽完全相连。本文使用的术语“载体”表示DNA或RNA分子,诸如质粒、病毒或其它媒介物,其含有一个或多个异源的或重组的DNA序列,且被设计成用于在不同的宿主细胞之间转移。术语“表达载体”和“基因治疗载体”表示,可以有效地在细胞中掺入和表达异源DNA片段的任意载体。克隆或表达载体可以包含额外的元件,例如,表达载体可以具有2个复制系统,因而,允许它维持在2种生物体中,例如在人细胞中进行表达和在原核宿主中进行克隆和扩增。可以采用可有效地将核酸导入细胞中使得蛋白或多肽表达发生的任意合适的载体,例如病毒载体或非病毒质粒载体。对于表达而言有效的任意细胞(例如,昆虫细胞和真核细胞诸如酵母或哺乳动物细胞)可用于实践本发明。术语“异源DNA”和“异源RNA”表示这样的核苷酸其对于细胞而言不是内源的(天然的),或不是它们存在于其中的基因组或载体的一部分。通常,通过转导、感染、转染、转化、电穿孔、基因枪转化等,将异源DNA或RNA添加给细胞。这样的核苷酸通常包括至少一个编码序列,但是所述编码序列不需要表达。术语“异源DNA”可以表示“异源编码序列”或“转基因”。本文使用的术语“蛋白”和“多肽”可以可互換地使用,并通常表示使用本发明的含有自加工切割位点的载体表达的目标“蛋白”和“多肽”。这样的“蛋白”和“多肽”可以是可用于下文进ー步描述的研究、诊断或治疗目的的任意蛋白或多肽。本文使用的多蛋白是这样的蛋白其用于加工,以生成2种或更多种多肽产物。本文使用的术语“多聚体”表示由2个或更多个多肽链(有时称作“亚基”)组成的蛋白,所述多肽链装配形成功能蛋白。多聚体可以由2个(ニ聚体)、3个(三聚体)、4个(四聚体)或更多个(例如,五聚体,诸如此类)肽链组成。多聚体可能源自自装配,或可能需要诸如催化剂等组分来辅助装配。多聚体可以仅由相同的肽链组成(同型多聚体),或由或2个或更多个不同的肽链组成(异型多聚体)。这样的多聚体可以具有结构或化学功能。许多多聚体是本领域已知的和使用的,包括、但不限于酶、激素、抗体、细胞因子、趋化因子和受体。这样,多聚体可以具有生物学(例如,药学)和エ业(例如,生物加工/生物生产)用途。
本文使用的术语“标签”表示肽,其可以掺入表达载体中,其可能起允许检测和/或纯化载体插入物的ー种或多种表达产物的功能。这样的标签是本领域众所周知,且可以包括放射性标记的氨基酸或与生物素基部分的多肽的连接,所述多肽可以通过标记的抗生物素蛋白(例如,抗生蛋白链菌素,其含有可通过光学或比色測量方法检测到的荧光标志物或酶活性)来检测。亲和标签(诸如FLAG、谷胱甘肽-S-转移酶、麦芽糖结合蛋白、纤维素-结合域、硫氧还蛋白、NusA、mistin、甲壳质-结合域、角质酶、AGT> GFP和其它亲和标签)被广泛地用于例如蛋白表达和纯化系统中。多肽标签的其它非限制性实例包括、但不限于下述的组氨酸标签、放射性同位素或放射性核素(例如,3H、14C.35S、9°Y、99Tc、mIn、125I、131I、177Lu、166Ho或153Sm);荧光标签(例如,FITC、罗丹明、镧系元素、磷光体)、酶标签(例如,辣根过氧化物酶、萤光素酶、碱性磷酸酶);化学发光的标签;生物素基基团;可被第ニ报道物识别的预定多肽表位(例如,亮氨酸拉链对序列、第二抗体的结合位点、金属结合域、表位标签);和磁性剂诸如钆螯合物。本文关于本发明的病毒基因治疗载体所用的术语“复制缺陷的”是指,所述病毒载体不能独立地进ー步复制和包装它的基因组。例如,当用rAAV病毒粒子感染受试者的细胞时,异源基因在感染的细胞中表达,但是,由于感染的细胞缺少AAV rep和cap基因及附加功能基因的事实,rAAV不能复制。本文使用的“逆转录病毒转移载体”是指这样的表达载体其包含编码转基因的核苷酸序列,且另外包含包装载体必需的核苷酸序列。优选地,逆转录病毒转移载体还包含在细胞中表达转基因必需的序列。本文使用的“包装系统”是指一系列病毒构建体,其包含编码參与包装重组病毒的病毒蛋白质的基因。通常,包装系统的构建体最后掺入包装细胞中。本文使用的“第二代”慢病毒载体系统是指缺乏功能性附加基因的慢病毒包装系统,诸如其中附加基因vif、vpr、vpu和nef已经缺失或者灭活的慢病毒包装系统。參见,例如,Zufferey 等人 1997. Nat. Biotechnol. 15 :871_875。本文使用的“第三代”慢病毒载体系统是指这样的慢病毒包装系统其具有第二代载体系统特征,并进ー步缺乏功能性tat基因,诸如其中tat基因已经缺失或者灭活的慢病毒包装系统。通常,编码rev的基因提供在単独的表达构建体上。參见,例如,Dull等人1998.J. Virol. 72 :8463-8471。本文关于病毒或病毒载体使用的“假型(pseudotyped)”是指,用异源的或者功能修饰的病毒包膜蛋白替换天然的病毒包膜蛋白。本文关于重组DNA构建体或载体使用的术语“可操作地连接的”是指,重组DNA构建体或载体的核苷酸组分通常彼此共价地连接。通常,“可操作地连接的”DNA序列是邻接的,且在分泌型前导序列的情况下,是邻接的且在相同读码框中。但是,增强子不一定与被増量调节其表达的序列邻接。该术语与“可操作地放置的”相一致。增强子序列会影响启动子依赖性的基因表达,且可能位于天然基因的5'或3'区域。“增强子”是顺式作用元件,其刺激或抑制邻近基因的转录。抑制转录的增强子也称作“沉默子”。增强子可以在离编码序列和被转录区域的下游位置多达几千碱基对(kb)的距离处在任ー个方向起作用(即,可以与编码序列相关联)。另外,隔离物或染色质打开 序列,诸如基质附着区域(Chung, Cell, 1993, Aug 13 ;74(3) :505-14, Frisch 等人,GenomeResearch, 2001,12 :349-354, Kim 等人,J. Biotechl07, 2004,95-105),可以用于增强稳定整合的基因盒的转录。
本文使用的术语“基因”或“编码序列”是指,当与适当的调节序列可操作地连接时,在体外或在体内转录(DNA)和翻译(mRNA)成多肽的核酸序列。所述基因可以包括或不包括在编码区之前和之后的区域,例如5'不翻译序列(5' UTR)或“先导”序列和3' UTR序列或“尾巴”序列以及在单个编码区段(外显子)之间的插入序列(内含子)。“启动子”是指导RNA聚合酶的结合并从而促进RNA合成的DNA序列,即,足以指导转录的最小序列。启动子和对应的蛋白或多肽表达可以是细胞类型特异性的、组织特异性的或物种特异性的。在本发明的核酸构建体或载体中也包括增强子序列,其可以与或不与启动子序列邻接。在本文中广泛使用的“转录调节序列”或表达控制序列包括启动子序列和物理地有关的序列,其调控或调节有关的编码序列的转录,经常是响应于营养或环境信号。那些有关的序列可以决定组织或细胞特异性的表达、对环境信号的应答、増加或減少转录的蛋白的结合等。“可调节的启动子”是其活性受顺式或反式作用因子影响的任意启动子(例如,被外部信号或试剂活化的可诱导的启动子)。“组成型启动子”是在大多数情况下指导许多或所有组织/细胞类型中的RNA生产的任意启动子,例如,人CMV立即早期增强子/启动子区域,其促进克隆的DNA插入物在哺乳动物细胞中的组成性表达。术语“转录调节蛋白”、“转录调节因子”和“转录因子”在本文中可互換地使用,并表示这样的核蛋白其结合DNA应答元件,并从而转录地调节有关的ー个或多个基因的表达。转录调节蛋白通常直接地结合DNA应答元件,但是在有些情况下,与DNA的结合可以是间接的,这通过与其它蛋白的结合来实现,所述其它蛋白又结合或被结合在DNA应答元件上。本文使用的术语“免疫球蛋白”和“抗体”表示完整的分子及其片段,诸如Fa、F(ab' )2和Fv,它们能够结合目标抗原决定簇。这样的“免疫球蛋白”和“抗体”由2个相同的分子量为约23,OOO道尔顿的多肽轻链和2个相同的分子量为53,000-70, 000道尔顿的重链组成。所述4个链通过ニ硫键连接成“Y”构型。重链被分类为Y (IgG)、u (IgM)、a (IgA)、6 (IgD)或e (IgE),且是免疫球蛋白的分类命名的基础,这决定了给定抗体的效应子功能。轻链被分类为K或X。当在本文中提及“免疫球蛋白或其片段”时,应该理解,这样的“其片段”是免疫学上有功能的免疫球蛋白片段,特别是以完整免疫球蛋白的至少10%的结合亲和力结合它的同源配体的片段。抗体的Fab片段是抗体分子的单价抗原结合片段。Fv片段是遗传工程化的片段,其含有表达为2个链的轻链可变区和重链可变区。术语“人源化的抗体”表示这样的抗体分子其中已经替换非抗原结合区中的ー个或多个氨基酸,以便更接近地模仿人抗体,同时仍然保留所述抗体的原始结合活性。參见,例如,美国专利号6,602,503。本文使用的术语“抗原决定簇”表示,与特定抗体接触的分子片段(即,表位)。蛋白或肽或蛋白糖肽或糖蛋白的众多区域可以诱导抗体的生成,所述抗体特异性地结合所述 蛋白上的给定区域或三维结构。这些区域或结构称作抗原决定簇或表位。抗原决定簇可以与完整抗原(即,用于引起免疫应答的免疫原)竞争与抗体的结合。当提及本发明的重组蛋白或多肽时,术语“片段”是指这样的肽或多肽它的氨基酸序列与对应的全长蛋白或多肽的氨基酸序列的一部分(但不是全部)相同,它保留对应的全长蛋白或多肽的至少ー种功能或活性。所述片段优选地包括全长蛋白或多肽的至少20-100个连续氨基酸残基。本文使用的术语“施用”或“导入”是指,通过本领域已知的任意途径,将蛋白(包括免疫球蛋白)递送给有此需要的人或动物。药用载体和制剂或组合物也是本领域众所周知的。给药途径可以包括静脉内的、肌肉内的、真皮内的、皮下的、透皮的、粘膜的、瘤内的或粘膜的。或者,这些术语可以表示,将用于重组蛋白表达的载体递送给细胞或培养的细胞和/或受试者的细胞或器官。这样的施用或导入可以在体内、在体外或先体外后体内地发生。通过下述方式,可以将用于重组蛋白或多肽表达的载体导入细胞中转染,其通常是指,通过物理方式(例如,磷酸钙转染、电穿孔、显微注射或脂转染)将异源DNA插入细胞中;感染,其通常是指,借助于传染性病原体(即病毒)的导入;或转导,其通常是指,病毒对细胞的稳定感染,或遗传物质通过病毒剂(例如,噬菌体)从ー种微生物向另ー种微生物的转移。“转化”通常用于表示,包含异源DNA的细菌,或表达癌基因且因此已经转变成连续生长模式的细胞,例如,肿瘤细胞。用于“转化”细胞的载体可以是质粒、病毒或其它媒介物。通常,根据用于将异源DNA (即,载体)施用、导入或插入细胞中的方式,将细胞称作“转导的”、“感染的”、“转染的”或“转化的”细胞。术语“转导的”、“转染的”和“转化的”可以在本文中可互换地使用,不论异源DNA的导入方法。本文使用的术语“稳定转化的”、“稳定转染的”和“转基因的”是指,具有整合到基因组中的非天然的(异源的)核酸序列的细胞。通过由含有转染的DNA(其通过整合进它们的基因组中或作为附加型元件而稳定地复制)的子代细胞群体组成的细胞系或克隆的建立,证实稳定的转染。在某些情况下,“转染”是不稳定的,即它是瞬时的。在瞬时转染的情况下,外源或异源DNA被表达,然而导入的序列没有整合到基因组中,或宿主细胞不能复制。本文使用的“先体外后体内施用”表示ー种方法,其中从受试者取出原代细胞,将载体施用给所述细胞,以产生转导的、感染的或转染的重组细胞,并将所述重组细胞重新施用给相同或不同的受试者。“多顺反子转录物”表示,含有超过ー个蛋白编码区或顺反子的mRNA分子。包含2个编码区的mRNA被称作“双顺反子转录物”。“5'-近端”编码区或顺反子是这样的编码区其翻译起始密码子(通常AUG)与多顺反子mRNA分子的5'末端最接近。“5'-远端”编码区或顺反子是这样的编码区其翻译起始密码子(通常AUG)不是与mRNA的5'末端最接近的起始密码子。术语“5'-远端”和“下游”同义地用于表示,不与mRNA分子的5'末端邻近的编 码区。本文使用的“共转录”是指,2个(或更多个)开放读码框或编码区或多核苷酸是在包含启动子的单个转录控制或调控元件的转录控制下。本文使用的术语“宿主细胞”表示,已经用载体转导、感染、转染或转化的细胞。所述载体可以是质粒、病毒颗粒、噬菌体等。诸如温度、PH等培养条件是以前与选择用于表达的宿主细胞一起使用的那些,且是本领域技术人员显而易见的。应当理解,术语“宿主细胞”表示原始的转导的、感染的、转染的或转化的细胞及其后代。本文使用的术语“生物活性”和“生物学上有活性的”表示,在培养的细胞系中或在无细胞系统(诸如在ELISA平板中的配体-受体试验)中归因于特定蛋白的活性。“免疫球蛋白”、“抗体”或其片段的“生物活性”表示,结合抗原决定簇并从而促进免疫学功能的能力。激素或白介素的“生物活性”是本领域已知的。本文使用的术语“肿瘤”和“癌症”表示,表现出对正常生长和/或发育的控制的至少部分丧失的细胞。例如,肿瘤或癌细胞通常已经丧失接触抑制,且可能是侵袭性的,和/或具有转移的能力。抗体是作为重链和轻链的异源ニ聚体的免疫球蛋白蛋白质。ー种典型的抗体是具有结合到一起的2个重链和2个轻链(或其功能片段)的多聚体。抗体可以具有其它的聚合结构级别,是ニ聚的、三聚的、四聚的、五聚的等,经常取决于同种型。已经证实,它们非常难以在哺乳动物培养表达系统中从单ー载体或从2个载体以全长形式表达。几种方法目前被用于生产抗体给动物体内免疫接种以生产“多克隆的”抗体,对B-细胞杂交瘤进行体外细胞培养以生产单克隆抗体(Kohler等人1988. Eur. J. Tmmuno1. 6 511 ;Antibodies ALaboratory Manual,Cold Spring Harbor Laboratory, 1988 ;通过引用并入本文),和重组DNA技术(例如描述在Cabilly等人,美国专利号6331415,通过引用并入本文)。众所周知,免疫球蛋白多肽的基础分子结构包括2个相同的分子量为约23,000道尔顿的轻链和2个相同的分子量为53,000-70, 000道尔顿的重链,其中所述4个链通过ニ硫键连接成“Y”构型。氨基酸序列在Y的顶部是N-端末端,在每条链的底部是C-端末端。在N-端末端是可变区(长度为约100个氨基酸),其提供抗原结合的特异性。本发明涉及改进的用于生产所有类型的免疫球蛋白的方法,所述类型包括、但不限于具有天然序列(即响应于抗原刺激而生成的序列)的全长抗体和抗体片段,在单个稳定折叠的多肽链中组合了重链和轻链的抗原结合可变区的单链抗体;单价抗体(其包含与第二重链的Fe区结合的重链/轻链ニ聚体);“Fab片段”,其包括免疫球蛋白分子的整个“Y”区域,即,“Y”的分支,単独的轻链或重链或其部分(即,I个重链和I个轻链的聚集体,通常称作Fab');“杂种免疫球蛋白”,其具有对2种或更多种不同抗原的特异性(例如,细胞杂交瘤或双特异性的抗体,其例如描述在美国专利号6,623,940中);“复合免疫球蛋白”,其中重链和轻链模仿来自不同的物种或特异性的那些;和“嵌合的抗体”,其中重链和轻链的每个氨基酸序列部分源自超过ー个物种(即,可变区源自ー个来源诸如鼠抗体,同时恒定区源自另ー个来源诸如人抗体)。本发明的组合物和方法可以用于生产免疫球蛋白或其片段,其中重链或轻链是“哺乳动物的”、“嵌合的”或以增强它的效力的方式进行了修饰。修饰的抗体包括保留未修饰形式的相同生物活性的氨基酸和核酸序列变体,和以使所述活性发生变化(即,增强补体结合、与膜的相互作用和其它效应子功能的恒定区中的变化,或增强抗原结合特征的可变区中的变化)的方式进行修饰的那些。本发明的组合物和方法可以另外包括催化免疫球蛋白或其片段。 编码“变体”免疫球蛋白的多核苷酸序列可以编码相对于參照多肽序列而言改变了一个或多个氨基酸的“变体”免疫球蛋白氨基酸序列。下面的这种相同讨论适用于其它目标生物活性蛋白序列(和它们的编码序列)。所述变体多核苷酸序列可以编码含有“保守”置换的变体氨基酸序列,其中所述置换氨基酸具有与它替换的氨基酸类似的结构或化学性质。应当理解,可以制备目标蛋白的变体,其氨基酸序列与天然存在的序列的氨基酸序列基本上相同的(至少约80-99%同一性和在它们之间的任意整数),且其形成功能上等效的三维结构,并保留天然存在的蛋白的生物活性。在生物学领域众所周知,可以在蛋白序列中做出某些氨基酸置換,而不影响蛋白的功能。通常,可耐受保守氨基酸置換或类似氨基酸置換,而不影响蛋白功能。类似的氨基酸可以是大小和/或电荷性质类似的那些,例如,天冬氨酸和谷氨酸以及异亮氨酸和缬氨酸是两对类似的氨基酸。当天然的ニ级和三级结构形成不被破坏时(除了预见到以外),允许彼此的置換。在本领域已经用多种方式评估了氨基酸对之间的相似性。例如,Dayhoff 等人,Atlas of Protein Sequence and Structure,1978.第5卷,増刊3,第22章,第345-352页(它通过引用并入本文),提供了可以用作氨基酸相似性的量度的氨基酸置换频率表。DayhofT等人的频率表是基于来自多种进化上不同来源的、具有相同功能的蛋白的氨基酸序列的对比。通过本领域众所周知的方法,可以容易地制备公开的核苷酸(和氨基酸)序列的置换突变、插入和缺失变体。这些变体可以以与具体例证的序列相同的方式使用,只要所述变体与本发明的具体例证的序列具有实质的序列同一性,并保留希望的功能性。本文使用的实质的序列同一性表示这样的同源性(或同一性)其足以使变体多核苷酸或蛋白以与所述变体的来源多核苷酸或蛋白相同的能力发挥作用。优选地,该序列同一性是大于70%或80%,更优选地,该同一性是大于85%,或该同一性是大于90%,和/或或者,该同一性是大于95%以及在70-100%之间的所有整数。制备置换突变、插入和缺失突变是在本领域经过训练的人员的技能范围内,所述突变在功能上等同于所述序列的功能或被设计成改善所述序列的功能或以其它方式提供方法学优点。在任意天然存在的蛋白上可以读出的或在定量现有技术产品中可以读出的实施方案/变体无意落入要求保护的发明范围内。本领域众所周知,可以截短和/或以其它方式突变本发明的多核苷酸序列,使得原始全长序列的某些得到的片段和/或突变体可以保留全长序列的希望的特征。适用于从更大的核酸分子产生片段的多种限制性酶是众所周知的。另外,众所周知,Bal31外切核酸酶可以方便地用于DNA的时间控制的有限消化。參见,例如,Maniatis等人1982.Molecular しloning :A Laooratory Manual, Cold bprmg Harbor Laboratory, New York,第135-139页,通过引用并入本文。也參见Wei等人1983. J. Biol. Chem. 258 :13006-13512。通过使用Bal31外切核酸酶(通常称作“ erase-a-base”规程),普通技术人员可以从主题核酸的任一端或两端去除核苷酸,以产生在功能上与主题核苷酸序列等效的宽谱片段。以此方式,本领域普通技术人员可以产生数百种具有受控的不同长度的片段,它们来自沿着原始编码序列的所有位置。普通技术人员可以常规地测试或筛选产生的片段的特征,并确定本文教导的片段的实用性。还众所周知,利用定位诱变,可以容易地生产全长序列的突变体序列或其片段。參见,例如,Larionov, 0. A.和 Nikiforov, V. G. 1982. Genetika 18 349-59 ;ShortIe 等人(1981)Annu. Rev. Genet. 15 :265-94 ;二者通过引用并入本文。技术人员可以常规地生产缺失、插入或置換型突变,并鉴定含有全长野生型序列的希望特征的那些得到的突变体或其片段,例如,保留激素、细胞因子、抗原结合或其它生物活性的那些。 额外地或替代地,所述变体多核苷酸序列可以编码含有“非保守”置換的变体氨基酸序列,其中所述置换的氨基酸具有与它替换的氨基酸不相似的结构或化学性质。编码变体免疫球蛋白的多核苷酸也可以编码含有氨基酸插入或缺失或二者的变体氨基酸序列。此夕卜,编码变体免疫球蛋白的多核苷酸可以编码与參照多核苷酸序列相同的多肽,但是由于遗传密码的简并性,所述多肽的多核苷酸序列相对于參照多核苷酸序列改变了ー个或多个喊基。当提及本发明的重组免疫球蛋白时,术语“片段”是指这样的多肽所述多肽的氨基酸序列与对应的全长免疫球蛋白蛋白质的氨基酸序列的一部分(但不是全部)相同,所述多肽要么基本上保留与对应的全长蛋白相同的生物学功能或活性,要么保留对应的全长蛋白的至少ー种功能或活性。所述片段优选地包括全长免疫球蛋白的至少20-100个连续氨基酸残基,且优选地,保留结合与全长抗体相同的抗原的能力。本文使用的术语“序列同一性”是指,当使用序列比对程序进行比对时,2个或更多个比对的序列之间的核酸或氨基酸序列同一性。术语“ %同源性”在本文中与术语“ %同一性”可互換地使用,并表示,当使用序列比对程序进行比对时,2个或更多个比对的序列之间的核酸或氨基酸序列同一性水平。例如,本文使用的80%同源性是指,通过本领域理解的确定的算法,测得与80%序列同一性相同的物质,因此,给定序列的同系物在给定序列的长度上具有大于80%序列同一‘注。通过例如下述算法,可以进行比较序列的最佳比对Smith和Waterman. 1981.Adv. AppI. Math. 2 :482 的局部同源性算法,Needleman 和 Wunsch. 1970. J Mol. Biol. 48 443 的同源性比对算法,Pearson 和 Lipman. 1988. Proc. Natl. Acad. Sci. USA 85 :2444 的相似性检索方法,这些算法的计算机化实现(在威斯康星遗传学软件包中的GAP、BESTFIT、FASTA 和 TFASTA,Genetics Computer Group, Madison,ffis.),Altschul 等人 1990. J Mol.Biol. 215 =403-410的BLAST算法,利用从国家生物技术信息中心网站(參见nlm.nih.gov/)上可公开得到的软件,或通过目检(通常參见Ausubel等人,同下文)。为了本发明的目的,最优选地通过Smith和Waterman. 1981. Adv. AppI. Math. 2 :482的局部同源性算法进行比较序列的最佳比对。也參见,Altschul等人1990和Altschul等人1997。在2个或更多个核酸或蛋白序列的背景下,术语“相同的”或“同一性百分比”表示,当对比和比对最大对应时,使用本文所述的序列对比算法之一(例如Smith-Waterman算法)、本领域已知的其它算法(例如,BLAST)或通过目检测得,2个或更多个序列或子序列是相同的,或具有相同的氨基酸残基或核苷酸的指定百分比。根据本发明,也包括这样的序列变体其编码自加工切割多肽,和其本身与天然或參照序列具有 80、85、88、89、90、91、92、93、94、95、96、97、98、99% (和在 80 至 100 之间的所有整数百分比值)或更多序列同一性的多肽。也包括所述多肽的氨基酸片段,其代表至少5个、至少10个或至少15个单元的连续段;和根据所述的同一性条件与其同源的片段;以及代表至少15个、至少30个或至少45个单元的连续段的核酸序列片段。在ー个具体实施方案中,核酸序列或氨基酸序列与一并公开的各个序列具有95%、96%、97%、98%、99%或 99. 5% 同一性。
如果两个序列在中等至高严谨性杂交和洗涤条件下彼此特异性地杂交,那么认为核酸序列与參照核酸序列“可选择性地杂交”。杂交条件是基于核酸结合复合物或探针的解链温度(Tm)。例如,“最大严谨性”典型地发生在约Tm-5°C (探针Tm以下5°C )高严谨性”则在Tm以下约5-10°C 中等严谨性”在探针Tm以下约10_20°C 低严谨性”在Tm以下约20-25°C。在功能上,最大严谨性条件可以用于鉴定与杂交探针具有严格同一性或近似严格同一性的序列;而高严谨性条件被用于鉴定与探针具有约80%或更高序列同一性的序列。中等和高严谨性杂交条件是本领域众所周知的(參见,例如,Sambrook等人,1989,第9和11章,和Ausubel,F.M.等人,1993)。高严谨性条件的一个实例包括在约42°C、在50%甲酰胺、5X SSC、5X登哈特溶液、0. 5% SDS和100 y g/ml变性载体DNA中进行杂交,然后在2X SSC和0.5% SDS中在室温洗涤两次,在42°C在0. IX SSC和0.5% SDS中洗涤另外两次。编码具有与天然存在的目标蛋白相同的生物活性的多肽、并在中等至高严谨性杂交条件下杂交的2A序列变体,被认为是在本发明的范围内。作为遗传密码的简并性的结果,可以生产许多编码序列,它们编码相同的多肽序列,包括诸如结构组分、自加工组分(例如内含肽)、调节组分(例如,信号肽酶切割序列)或其它组分。例如,三联体CGT编码氨基酸精氨酸。或者,精氨酸由三联体核苷酸序列CGA、CGC、CGG、AGA和AGG编码。因此,应当理解,编码区中的同义密码子的这种置換落入本发明所涵盖的序列变体内。另外应当理解,这样的序列变体可以在高严谨性条件下与亲本序列杂交或不杂交。例如,当序列变体包括由亲本核苷酸编码的每个氨基酸的不同密码子时,这是可能的。尽管如此,本发明具体地预见到和包括这样的变体。抗体作为治疗模态的潜力目前受到当前技术的生产能力和费用的限制。用于免疫球蛋白(或其它蛋白)生产的改进的病毒或非病毒单个表达载体会促进2个或更多个编码序列(即,来自单个载体的、具有双特异性或多特异性的免疫球蛋白或其它蛋白)的表达和递送。本发明解决了这些限制,并适用于本文进ー步详述的任意免疫球蛋白(即抗体)或其片段或其它多组分蛋白或结合蛋白对,包括工程化的抗体诸如单链抗体、全长抗体或抗体片段、双链激素、双链细胞因子、双链趋化因子、双链受体等。内含肽本文使用的内含肽是在表达的蛋白内的区段,其向初级表达产物的N-端方向结合N-外显肽,井向初级表达产物的C-端方向结合C-外显肽。天然存在的内含肽会介导内含肽的切除和N-和C-外显肽的重新连接(蛋白连接)。但是,在本发明的表达产物的背景下,内含肽或侧接外显肽氨基酸序列的基本序列使得,在没有外显肽连接存在下,或在减少的或最小量的外显肽连接下,发生蛋白骨架的切割,因而外显肽蛋白从初级翻译产物(多蛋白)释放出来,它们不会连接形成融合蛋白。初级表达产物(在任何蛋白水解性裂解之前,由mRNA合成的蛋白)的内含肽部分会介导在N-外显肽/内含肽和内含肽/C-外显肽接头处的蛋白水解性裂解。一般而言,天然存在的内含肽也介导N-外显肽和C-外显肽剪接到一起(通过肽键的形成而连接)。但是,在适用于表达2种多肽(具体地由抗体分子的重链和轻链来例证)的目标的本发明中,优选地,不会发生蛋白连接。这可以通过掺入
内含肽来实现,所述内含肽天然地或由于突变不具有连接活性。或者,通过突变可以阻止剪接,所述突变会改变在剪接位点处或之后的氨基酸,以防止释放的蛋白的连接。參见Xu和Perler, 1996,EMBO J. 15 :5146_5153。例如,Ser、Thr 或 Cys 通常存在于 C-外显肽的起点处,且可以被改变以修饰或中断剪接。在ー种具体的内含肽中,对剪接的影响会阻止或减少表达的蛋白的连接。内含肽是ー类蛋白,它们的基因仅存在于其它蛋白的基因内。与称作外显肽的侧接宿主基因一起,内含肽被转录为单个mRNA,并翻译为单个多肽。翻译后,内含肽启动自催化事件,以去除它们自身并用新的多肽键连接侧接的宿主蛋白区段。该反应仅由内含肽催化,不需要其它细胞蛋白、辅因子或ATP。内含肽存在于多种单细胞生物体中,且它们具有不同的大小。许多内含肽含有内切核酸酶结构域,该结构域造成它们在基因组内的可动性。内含肽介导的反应已经被用于生物技术中,特别是体外场合,诸如用于纯化和用于蛋白芯片构建,和用于植物品种改良(Perler,F. B。2005. IUBMB Life 57(7) :469-76)。已经将突变导入天然内含肽核苷酸序列中,据报道,这些突变体中的ー些具有改变的性质(Xu和Perler,1996. EMBO J. 15 (9),5146-5153)。除了内含肽以外,也已知细菌内含肽-样(BIL)结构域和刺猬(Hog)自加工结构域(Hog/内含肽(HINT)超家族中的另外2个成员)会通过类似的机理催化翻译后自加工(Dassa等人2004. J. Biol. Chem. 279(31)32001-32007)。内含肽作为框架内插入存在于特定宿主蛋白中。在自剪接反应中,内含肽将它们自身切离前体蛋白,同时侧接区域(即外显肽)相连以恢复宿主基因功能。这些元件也含有内切核酸酶功能,该功能造成它们在基因组内的可动性。内含肽以一定的大小范围(134-1650个氨基酸)存在,已经在真细菌、真核生物和古细菌的基因组中鉴定出它们。使用模型剪接/报告系统的实验已经证实,可以分离内切核酸酶、蛋白切割和蛋白剪接功能(Xu和Perler. 1996. EMBO J. 15 :5146-5153)。下述的实施例使用来自掘越氏火球菌PhoPol I、酿酒酵母VMA和集胞藻属的内含肽,以建立具有来自抗体重链和轻链的序列的融合蛋白。设计成删除内含肽的剪接能力的内含肽突变会产生这样的单个多肽其发生自切割,以生成正确地编码的抗体重链和轻链。该策略可以类似地用于表达其它多链蛋白、激素或细胞因子,且它也可以适用于将前体蛋白(前蛋白)加工成它们的成熟的、生物活性的形式。尽管在本文中具体地例证了掘越氏火球菌Pho Pol I、酿酒酵母VMA和集胞藻属内含肽的使用,本领域已知的其它内含肽可以用于本发明的多蛋白表达载体和方法中。除了掘越氏火球菌Pho Pol I、酿酒酵母VMA和集胞藻属内含肽以外,许多其它内含妝是本领域已知的(參见,例如,Perler, F. B. 2002, InBase, the Intein Database,Nucl. Acids Res. 30 (I) :383-384和 the Intein Database and Registry,可通过新英格兰Biolabs网站得到,例如,在http://tools. neb. com/inbase/)。已经在宽范围的生物体(诸如酵母、分枝杆菌和极端嗜热古细菌)中鉴定出内含肽。某些内含肽具有内切核酸酶活性以及位点特异性的蛋白切割和剪接活性。内切核酸酶活性不是本发明的实践所必需的;可以删除内切核酸酶编码区,条件是,維持蛋白切割活性。 已经非常详细地研究了蛋白剪接过程的机理(Chong等人1996. J. Biol.Chem. 271 :22159-22168 ;Xu 和 Perler. 1996. EMBO J 15 :5146-5153),并已经在内含肽和外显肽剪接点处发现了保守氨基酸(Xu等人1994. EMBO J 13:5517-5522)。本文描述的某些构建体含有与所述第一编码序列的3'-端融合的内含肽序列,第二编码序列在内含肽的C-端处在框架内融合。合适的内含肽序列可以选自己知含有蛋白剪接元件的任意蛋白。在环球网上可以发现含有所有已知的内含肽的数据库(Perler,F.B. 1999. Nucl. AcidsRes. 27 :346-347)。内含肽编码序列在3'末端处与第二编码序列的5'末端融合(在框架内)。为了使该蛋白靶向特定细胞器,可以使适当的肽信号与蛋白的编码序列融合。在第二外显肽编码序列以后,内含肽编码序列-外显肽编码序列可以如在相同细胞中表达多种蛋白所希望地经常重复。对于含有多个内含肽的构建体,可以有用地使用来自不同来源的内含肽元件。在要表达的最后ー个基因的序列之后,合乎需要地插入转录终止序列(并有利地包括聚腺苷酸化序列)。聚腺苷酸化序列和終止序列的次序可以是本领域所理解的。在一个实施方案中,聚腺苷酸化序列可以在终止序列前面。已经设计修饰的内含肽剪接单元,使得这样的修饰的目标内含肽可以催化外显肽从内含肽切除,但是不催化外显肽的连接(參见,例如,美国专利7026526和美国专利公开20020129400)。火球菌属物种GB-D DNA聚合酶中的C-端外显肽接头的诱变会生成改变的剪接元件,其诱导外显肽和内含肽的切割,但是阻止外显肽的随后连接(Xu和Perler. 1996. EMBO J 15 :5146-5153)。丝氨酸 538 向丙氨酸或甘氨酸(Ser 向 Ala 或 Gly)的突变会诱导切割,但是阻止连接。在这样的位置,Ser向Met或Ser向Thr的突变也被用于实现多蛋白的表达,所述多蛋白被切割成単独的区段,且至少部分地不重新连接。在其它内含肽剪接単元中的等效残基的突变也可以阻止外显肽区段的连接,这是由干与内含肽相连的C-端外显肽处的氨基酸的相对保守。在低保守/同源性的情况下,例如,系统地改变C-外显肽的前几个(例如,约5个)残基和/或内含肽区段的最后几个残基,并筛选它们的支持切割、但是不支持给定外显肽区段(尤其是本文公开的和本领域理解的外显肽区段)的剪接的能力。存在不含有内切核酸酶结构域的内含肽;这些包括集胞藻属dnaE内含肽和蟾分枝杆菌 GyrA 蛋白(Magnasco 等人,Biochemistry, 2004,43,10265-10276 ;Telenti 等人1997. J. Bacteriol. 179 :6378-6382)。其它内含肽已经在自然界中发现,或已经通过从编码含有内切核酸酶的内含肽的序列去除编码内切核酸酶的结构域来人工地产生(Chong等人1997. J. Biol. Chem. 272 :15587-15590)。在需要的情况下,最初选择内含肽,使得它由执行剪接功能所需的最小数目的氨基酸组成,诸如来自蟾分枝杆菌GyrA蛋白的内含肽(Telenti等人1997.同上)。在一个替代实施方案中,选择没有内切核酸酶活性的内含肽,诸如来自蟾分枝杆菌GyrA蛋白的内含肽,或已经被修饰以去除内切核酸酶结构域的酿酒酵母VMA内含肽(Chong等人1997.同上)。内含肽剪接単元的其它修饰可以允许改变切割反应的反应速率,允许通过简单地修饰剪接単元的基因序列来控制蛋白剂量。在一个实施方案中,将C-端外显肽的第一个残基工程化成含有甘氨酸或丙氨酸,即经证实会阻止使用火球菌属物种GB-D DNA聚合酶的外显肽连接的修饰(Xu和Perler. 1996. EMBO J 15:5146-5153)。在该实施方案中,优选的C-端外显肽蛋白天然地含有甘氨酸或丙氨酸残基,该残基在天然氨基酸序列中在N-端甲硫氨酸之后。外显肽的甘氨酸或丙氨酸与内含肽的C-端的融合,会在多蛋白的加工以后提供天然氨基酸序列。在另一个实施方案中,通过改变天然序列,或通过将额外的氨基酸残基添加在天然序列的N-端上,将人工的甘氨酸或丙氨酸放置在C-端外显肽中。在该实施方案中,在多蛋白加工以后,蛋白的天然氨基酸序列将被改变ー个氨基酸。在其它实施方案中,在本发明中有用的其它 修饰描述在US 7026526中。在一个实施方案中,内含肽是根据美国专利7,026,526。在ー个具体实施方案中,内含肽是火球菌属物种GB-D DNA聚合酶内含肽。在一个实施方案中,C-端外显肽丝氨酸向丙氨酸或甘氨酸的突变会形成修饰的内含肽剪接元件,其能够促进多蛋白的切除,但是不促进外显肽单元的连接。在一个实施方案中,内含肽是美国专利7,026,526的蟾分枝杆菌GyrA最小内含肽。在一个实施方案中,C-端外显肽苏氨酸向丙氨酸或甘氨酸的突变会形成修饰的内含肽剪接元件,其促进多蛋白的切除,但是不连接外显肽单元。应当理解,对于本文所述的某些内含肽,构建体和方法的实施方案可以产生分泌型蛋白产物(特别是对于包括抗体在内的多聚蛋白而言)的提高的表达。信号肽和信号肽酶已经知道信号假设(其中蛋白在它们的氨基酸序列内含有关于靶向膜的蛋白的信息)超过30年。Milstein和同事发现,当将内质网囊泡(微粒体)加入翻译系统中吋,来自骨髓瘤细胞的IgG的轻链以更高分子量形式合成,并转化成它的成熟形式,提出的模型是基于这些结果,其中微粒体含有蛋白酶,所述蛋白酶通过去除氨基-端延伸肽将前体蛋白形式转化成成熟形式。不久将信号假设扩展至在蛋白内包括独特的靶向序列,所述蛋白定位在不同的细胞内膜(诸如线粒体和叶绿体)上。以后发现,这些独特的靶向序列被特定信号肽酶(SPase)从输出的蛋白切棹。存在至少3种涉入细菌中的信号肽切割的独特SPase。SPase I可以加工非脂蛋白底物,所述底物由SecYEG途径或双精氨酸易位(Tat)途径输出。由Sec途径输出的脂蛋白被SPase II切割。SPase IV切割IV型前菌毛素和前菌毛素-样蛋白(它们是II型分泌器官的组分)。在真核生物中,靶向内质网(ER)膜的蛋白由信号肽介导,所述信号肽共翻译地或翻译后地将蛋白靶向Sec61易位机构。ER信号肽具有与它们的细菌对应物的那些类似的特征。ER信号肽在被信号肽酶复合物(SPC)输出到内质网腔中以后从输出的蛋白上切棹。将蛋白分类至真核细胞内的不同位置的信号肽必须是不同的,因为这些细胞含有许多不同的膜状的和水性的隔室。靶向内质网的蛋白经常含有可切割的信号序列。令人惊讶的是,许多人工肽可以起易位信号的作用。认为最重要的关键特征是高于特定阈值的疏水性。ER信号肽具有比细菌信号肽更高的亮氨酸残基含量。信号识别颗粒(SRP)在它们从核糖体出现以后结合可切割的信号肽。新生蛋白向ER膜的靶向需要SRP。在蛋白易位至内质网腔以后,输出的蛋白被SPC加工。另ー个实施方案利用在真核细胞中天然地存在的信号(先导)肽加工酶。大多数已知的ER信号肽是N-端可切割的或内部不可切割的。最近,发现许多病毒多蛋白(诸如在丙型肝炎病毒、汉坦病毒、黄病毒、风疹病毒和C型流感病毒中发现的那些)含有最可能被ER SPC切割的内部信号肽。这些对多蛋白的成熟的研究表明,SPC不仅可以切割位于氨基端的信号肽,而且在内部信号肽之后切割。预测的信号肽酶底物特异性元件的诱变因而可以阻断病毒传染性。早老素-型天冬氨酸蛋白酶信号肽肽酶(SPP)会切割在它们的跨膜区域内的信号肽。SPP是在人类中产生信号肽-衍生的HLA-E表位所必需的。信号肽酶是本领域众所周知的。參见,例如,Paetzel M. 2002. Chem. Rev. 102(12) 4549 ;Pekosz A. 1998.Proc. Natl. Acad. Sci. USA. 95 13233-13238 ;Marius K.2002.Molecular Cell 10 :735-744 ;0kamoto K.2004. J. Virol. 78 :6370-6380, Vol.78 ;Martoglio B.2003. Human Molecular Genetics 12 :R201_R206 ;和 Xia W. 2003. J. CellSci. 116 2839-2844o本发明的实施方案利用内部可切割的信号肽,用于表达在単一转录物中的多肽。单个转录的多肽随后被SPC切割,剩下单独的单个肽,或单个肽被装配成蛋白。本发明的方法适用于在单个转录的多肽中表达免疫球蛋白重链和轻链,随后切割,然后装配成成熟的免疫球蛋白。该技术适用于多肽细胞因子、生长因子或多种其它蛋白,例如,在单个转录的多肽中的IL-12P40和IL-12P35,然后装配成在单个转录的多肽中的IL-12或IL_12p40和IL-23p 19,然后装配成IL-23。信号肽酶方案适用于哺乳动物表达载体,所述载体导致来自前体或多蛋白的功能抗体或其它加工产物的表达。在抗体的情况下,它从载体生成,作为含有重链和轻链的多蛋白,其中在重链和轻链之间的插入序列是内部可切割的信号肽。该内部可切割的信号肽可以被定位于内质网的蛋白酶(主要是信号肽酶)、早老素或早老素-样蛋白酶切割,导致重链和轻链折叠和装配,以产生功能分子,并合乎需要地分泌它。除了源自丙型肝炎病毒的内部可切割的信号肽以外,可以被定位于内质网的蛋白酶切割的其它内部可切割的序列可以替代它们。类似地,本发明的实践不一定限于其中信号肽酶引起切割的宿主细胞,但是它也包括蛋白酶,包括、但不限于早老素、早老素-样蛋白酶和用于加工多肽的其它蛋白酶。那些蛋白酶已经综述在引用的文章以及其它文章中。另外,本发明不限于免疫球蛋白重链和轻链的表达,而且也包括其它多肽和多蛋白,它们在単一转录物中表达,随后进行内部信号肽切割,以释放出每种单个肽或蛋白。这些蛋白可以在成熟的产物中装配到一起或不装配到一起。在本发明的范围内也包括表达构建体,其中单个多肽以交替的次序存在,S卩,“肽
1-内部可切割的信号肽-肽2”或“肽2-内部可切割的信号肽-肽I”。本发明另外包括通过内部可切割的信号肽相连的超过2种肽的表达,诸如“肽I-内部可切割的信号肽-肽
2-内部可切割的信号肽-肽3”,诸如此类。
另外,本发明适用于I型和II型跨膜蛋白的表达,并适用干与表达构建体相关的其它蛋白酶切割位点。本发明可以进一歩利用内部可切割的信号肽,用于ー种或多种多肽的成熟,所述多肽是在单ー转录物内编码的多蛋白内。所述单个转录的多肽然后被SPC切割,剩下单独的单个肽,或单个肽装配成蛋白。本发明的实施方案包括用于在单个转录的多肽中表达免疫球蛋白重链和轻链、并最終装配成成熟的免疫球蛋白的组合物和方法。本发明适用于表达多肽细胞因子、生长因子或多种其它蛋白,例如,在单个转录的多肽中表达IL-12P40和IL-12p35,然后装配成在单个转录的多肽中的IL-12或IL-12p40和IL_23pl9,然后装配成IL-23。信号肽的修饰在sORF构建体的实施方案中,采用修饰的信号肽。例如,在重链-int-轻链的构建体中,当通过定位诱变降低轻链信号肽序列的疏水性时,抗体分泌水平増加至约10倍。可以如Carson等人于2007年3月22日提交的US 20070065912所述,采用信号肽。 标签本发明的sORF构建体设计的实施方案包括使用含有标签(优选内部标签)的经修饰的内含肽。多种标签是本领域已知的。本发明的标签包括、但不限于荧光标签和化学发光的标签。使用这样的构建体,使用在单个细胞中的荧光检测,可以监测表达的多蛋白的量。另外,使用荧光活化细胞分选(FACS),根据蛋白表达水平,可以分选这些细胞。这样的标签的使用在稳定细胞系产生中是特别有用的,因为这允许通过FACS分析来选择高产细胞或细胞系。如在本发明中所教导的,在它们从侧接抗体重链和轻链自动切割下以后,已经在细胞裂解物中观察到全长内含肽。这会提供用于检测荧光标记的内含肽的基础和它们在稳定的细胞系产生中的应用的基础。标签也可以用于蛋白的纯化中。小型内含肽(Mini-Intein)因为存在于许多内含肽(包括掘越氏火球菌Poll内含肽和酿酒酵母VMA内含肽)中的内切核酸酶区域对于基因表达系统而言不是特别有利的,可以任选地删除内切核酸酶结构域,并用小连接物替代,以建立“小型内含肽”。这些工程化的小型内含肽也可用于描述的构建体设计中,且它们具有下述优点内含肽编码区明显更小,因而允许更大的序列编码目标多肽和/或更容易地操纵重组DNA分子。在一些实施方案中,采用具有全人特征的抗体或其类似物是有利的。这些试剂会避免由源自非人物种的抗体或类似物诱发的不希望的免疫应答。为了解决对源自自加工肽的氨基酸残基的可能的宿主免疫应答,可以将蛋白水解性切割位点的编码序列插入(使用本领域已知的标准方法学)在所述第一蛋白的编码序列和所述自加工肽的编码序列之间,从而从表达的多肽(即抗体)去除自加工肽序列。该发现特别适用于在体内使用的治疗性或诊断性抗体。基因递送和包括病毒载体在内的载体本发明预见到众多载体中的任ー种用于将构建体导入细胞中的应用,所述构建体包含两种或更多种多肽或蛋白质的编码序列和自加工切割序列。基因表达载体的众多实例是本领域已知的,且可以具有病毒或非病毒起源。可用于实践本发明的非病毒基因递送方法包括、但不限干质粒、脂质体、核酸/脂质体复合物、阳离子脂质等。
病毒和其它载体可有效地转导细胞,并将它们自身的DNA导入宿主细胞中。在产生重组病毒载体中,用编码目标蛋白质或多肽的可表达序列替换非必需基因。示例性的载体包括、但不限于病毒和非病毒载体,如逆转录病毒载体(包括慢病毒载体)、腺病毒(Ad)载体(包括它们的复制活性的、复制缺陷的和无肠的形式)、腺伴随病毒(AAV)载体、猴病毒40 (SV-40)载体、牛乳头状瘤病毒载体、Epstein-Barr载体、疱疹载体、牛痘载体、莫洛尼鼠白血病病毒载体、Harvey鼠肉瘤病毒载体、鼠乳腺肿瘤病毒载体、鲁斯肉瘤病毒载体和非病毒质粒。杆状病毒载体是众所周知的,且适用于在昆虫细胞中表达。众多适用于在哺乳动物或其它真核细胞中表达的载体是本领域众所周知的,且许多是可商业得到的。商业来源"Ei括、但イヽP艮子Stratagene, La Jolla, CA ;Invitrogen, Carlsbad, CA ;Promega, Madison,WI和Sigma-Aldrich, St. Louis, MO。许多载体序列可从GenBank得到,并且关于载体的其它信息可在因特网上通过Riken BioSource Center得到。在一个实施方案中,载体通常包含复制起点,并且载体可以另外包含或者不包含“标志物”或“选择标记”功能,通过它们可以鉴别和选择所述载体。尽管可以使用任何选择标记,用于重组载体中的选择标记通常是本领域已知的,适当的选择标记的选择取决于宿 主细胞。编码赋予抗生素或其它毒素抗性的蛋白质的选择标记基因的实例包括、但不限于氨节西林、甲氨蝶呤、四环素、新霉素(Southern等人1982. J Mol Appl Genet. I :327-41)、霉酌 酸(Mulligan 等人 1980. Science209 1422-7)、嘌呤霉素、zeomycin、潮霉素(Sugden等人1985. Mol Cell Biol. 5 :410-3)、ニ氢叶酸还原酶、谷氨酰胺合成酶和G418。本领域技术人员会理解,表达载体通常包括适合被表达的编码序列的复制起点、与编码序列或要表达的序列可操作地连接的启动子以及核糖体结合位点、RNA剪接位点、聚腺苷酸化位点和转录终止子序列。将载体或其它DNA序列称作“重组的”,仅仅承认在自然状态下分离的或者发现的通常未可操作地连接的DNA序列的可操作连接。当表达和/或控制序列调节核酸序列的转录和翻译时(适当吋),该调节(表达和/或控制)序列与核酸编码序列可操作地连接。因此,表达和/或控制序列可包括启动子、增强子、转录终止子、编码序列的5’起始密码子(即ATG)、内含子的剪接信号和終止密码子。已知腺病毒基因治疗载体会表现出強烈的瞬时表达、优良的效价以及在体内转导分裂的和未分裂的细胞的能力(Hitt等人2000. Adv in Virus Res 55:479-505)。重组Ad载体可以包含使得载体掺入复制缺陷型Ad病毒粒子中的包装位点;两种或更多种目标多肽或蛋白质的编码序列,例如,目标免疫球蛋白的重链和轻链;以及编码单独的自加工切割位点或者与额外的蛋白水解性切割位点相组合的自加工切割位点的序列。对于掺入感染性病毒粒子中而言必需的或辅助的其它元件包括5'和3' Ad ITR、E2基因、E4基因的部分及任选的E3基因。通过本领域已知的标准技木,使用Ad包装细胞和包装技木,生产包囊重组Ad载体的复制缺陷型Ad病毒粒子。这些方法的实例可參见,例如,美国专利号5,872,005。两种或更多种目标多肽或蛋白质的编码序列通常插入在腺病毒的病毒基因组的缺失的E3区域中。用于实践本发明的优选的腺病毒载体不表达ー种或多种野生型Ad基因产物,例如,Ela, Elb, E2、E3和E4。优选的实施方案是这样的病毒粒子其通常与包装细胞系一起使用,所述包装细胞系补充E1、E2A、E4及任选的E3基因区域的功能。參见,例如美国专利号5,872,005,5, 994,106,6, 133,028 和 6,127,175。除了另外指出之外,本文使用的“腺病毒”和“腺病毒颗粒”表示病毒自身或其衍生物,并且覆盖所有血清型和亚型以及天然存在的和重组的形式。这种腺病毒可以是野生型,或者以本领域已知的或者本文公开的不同方式修饰。这种修饰包括对包装在颗粒中的腺病毒基因组的修饰,以便产生感染性的病毒。这种修饰包括本领域已知的缺失,如缺失Ela、£1^£2&、£213、£3或£4编码区中的ー个或多个。示例性的包装和生产细胞源自293、A549或者HeLa细胞。使用本领域已知的标准技术,纯化和配制腺病毒载体。腺伴随病毒(AAV)是ー种依赖于辅助病毒的人细小病毒,其能通过染色体整合而潜伏地感染细胞。因为它的整合进染色体中的能力和它的非病原性质,AAV作为人基因治疗载体具有重要潜力。为了用于实践本发明,可以使用本领域技术人员已知的标准方法产生rAAV病毒粒子,并构建成使得它们包括控制序列(包括转录起始和终止序列)及目标编码序列(作为在转录方向可操作地连接的组分)。更具体地,本发明的重组AAV载体包含 能使载体整合入复制缺陷AAV病毒粒子中的包装位点;两种或更多种目标多肽或蛋白质的编码序列,例如,目标免疫球蛋白的重链和轻链;编码单独的自加工切割位点或者与ー个或多个额外蛋白水解性切割位点相组合的自加工切割位点的序列。可以构建用于实践本发明的AAV载体,使得它们还包括控制序列(包括转录起始和终止序列)作为在转录方向可操作地连接的组分。这些组分在5’和3’末端上侧接功能性的AAV ITR序列。“功能性的AAVITR序列”是指,ITR序列具有预期的挽救、复制和包装AAV病毒粒子的功能。重组AAV载体的特征还在干,它们能够指导选择的重组多肽或蛋白产物在靶细胞中的表达和生产。因此,重组载体至少包含包囊化必需的所有AAV序列及重组AAV(rAAV)病毒粒子的感染必需的物理结构。因此,用于表达载体中的AAV ITR不需要具有野生型核苷酸序列(例如在Kotin. 1994. Hum. Gene Ther. 5 :793-801中所述),且可以通过核苷酸的插入、缺失或置换而改变,或者AAV ITR可以源自几种AAV血清型中的任ー种。通常,AAV载体可以是源自本领域已知的腺伴随病毒血清型的任意载体。通常,将AAV表达载体导入生产细胞中,随后导入AAV辅助构建体中,其中所述辅助构建体包括这样的AAV编码区其能在生产细胞中表达,并且补充在AAV载体中缺少的AAV辅助功能。所述辅助构建体可以设计为减量调节大R印蛋白(R印78和R印68)的表达,典型地通过将在p5之后的起始密码子从ATG突变为ACG,如在通过引用并入本文的美国专利号6,548, 286中所述。随后在生产细胞中导入辅助病毒和/或另外的载体,其中所述辅助病毒和/或另外的载体提供能支持有效的rAAV病毒生产的附属功能。然后培养生产细胞以生产rAAV。使用标准方法进行这些步骤。通过本领域已知的标准技术,使用AAV包装细胞和包装技木,制备包囊化本发明的重组AAV载体的复制缺陷型AAV病毒粒子。这些方法的实例可以參见,例如,美国专利号5,436,146,5, 753,500,6, 040,183,6, 093,570和6,548,286,它们通过引用整体并入本文。用于包装的其它组合物和方法描述在Wang等人(美国专利公开2002/0168342,也通过引用整体并入本文)中,并包括属于本领域技术人员的知识的那些技术。在实践本发明中,用于生产rAAV或其它载体表达载体病毒粒子的宿主细胞包括哺乳动物细胞、昆虫细胞、微生物和酵母。宿主细胞也可以是包装细胞,其中AAV (或其它)rep和cap基因稳定地维持在宿主细胞或生产细胞中,其中AAV载体基因组被稳定地维持和包装。示例性的包装和生产细胞源自293、A549或者HeLa细胞。使用本领域已知的标准技术,纯化和配制AAV载体。其它合适的宿主细胞(取决于载体)包括中国仓鼠卵巣(CHO)细胞、CHO ニ氢叶酸还原酶缺陷型变体诸如CHO DX Bll或CHO DG44细胞(參见,例如,Urlaub 和 Chasin. 1980. Proc. Natl. Acad. Sci. 77 :4216-4220)、PerC. 6 细胞(Jones等人 2003。Biotechnol. Prog. 19 :163-168)或 Sp/20 小鼠骨髓瘤细胞(Coney 等人 1994.Cancer Res. 54 :2448-2455)。逆转录病毒载体逆转录病毒载体可以用于基因递送(Miller. 1992. Nature 357 :455-460)。逆转录病毒载体及更更具体的慢病毒载体可用于实施本发明。因此,本文所用的术语“逆转录病毒”或者“逆转录病毒载体”是指分别包括“慢病毒”和“慢病毒载体”。已经对逆转录病毒载体进行测试,并发现是将目标基因稳定地导入广范围的靶细胞的基因组中的合适的递送媒介物。逆转录病毒载体将未重排的单拷贝转基因递送进细胞中的能力,使得逆转录病毒载体非常适合将基因转移进细胞中。另外,通过逆转录病毒包膜糖蛋白与宿主细胞上的特定细胞表面受体的结合,逆转录病毒进入宿主细胞中。结果,假型逆转录病毒载体也可以用 于实践本发明,在所述假型逆转录病毒载体中,编码的天然包膜蛋白被异源包膜蛋白替代,所述异源包膜蛋白具有与天然包膜蛋白不同的细胞特异性(例如与天然包膜蛋白相比,结合不同的细胞表面受体)。指导编码ー种或多种靶蛋白编码序列的逆转录病毒载体向特定靶细胞递送的能力,是实践本发明所需的。本发明提供了逆转录病毒载体,其包括例如包含ー个或多个转基因序列的逆转录病毒转移载体,及包含ー个或多个包装元件的逆转录病毒包装载体。具体地,本发明提供了编码异源的或者功能修饰的包膜蛋白的假型逆转录病毒载体,其用于生产假型逆转录病毒。本发明的逆转录病毒载体的核心序列可容易地源自众多的逆转录病毒,包括例如B、C和D型逆转录病毒以及泡沫病毒和慢病毒(參见RNA Tumor Viruses,第2版,ColdSpring Harbor Laboratory, 1985)。适用于本发明的组合物和方法中的逆转录病毒的实例包括、但不限于慢病毒。适用于本发明的组合物和方法中的其它逆转录病毒包括、但不限于禽类白血病病毒、牛白血病病毒、鼠白血病病毒、貂致细胞灶病毒、鼠肉瘤病毒、网状内皮组织增埴病毒和鲁斯肉瘤病毒。特别优选的鼠白血病病毒包括4070A和1504A(Hartley和 Rowe. 1976. J. Virol. 19 :19-25)、Abelson (ATCC 号 VR-999)、Friend (ATCC 号 VR-245)、Graffi、Gross (ATCC 号 VR-590)、Kirsteni Harvey 肉瘤病毒和 Rauscher (ATCC 号 VR-998)和莫洛尼鼠白血病病毒(ATCC号VR-190)。这种逆转录病毒可从诸如美国典型培养物保藏中心(ATCC ;ManaSSaS,VA)的保藏物或收集库容易地得到,或者使用常用技术从已知来源分离。其它来源是可商业获得的。在一个实施方案中,本发明的逆转录病毒载体序列可以源自慢病毒。优选的慢病毒是人免疫缺陷病毒,例如I型或者2型(即HIV-I或者HIV-2,其中HIV-I以前被称作淋巴结病相关病毒3 (HTLV-III)及获得性免疫缺陷综合征(AIDS)相关病毒(ARV)),或者与HIV-I或HIV-2相关的、已经被修饰并与AIDS或AIDS样疾病相关的另ー种病毒。其它慢病毒包括绵羊脱髓鞘性脑白质炎/梅迪病毒、猫免疫缺陷病毒(FIV)、牛慢病毒、猿猴免疫缺陷病毒(SIV)、马感染性贫血病毒(EIAV)及山羊关节炎-脑炎病毒(CAEV)。
合适的逆转录病毒属和株是本领域众所周知的(參见,例如,Fields Virology,第 3 版,B. N. Fields 等人编,1996. Lippincott-Raven Publishers,參见例如,第 58 章,Retroviridae The Viruses and Their Replication, Classification,第 1768-1771 页,包括其中的表1,通过引用并入本文)。用于制备生产逆转录病毒的生产细胞和生产细胞系的逆转录病毒包装系统以及制备这样的包装系统的方法,也是本领域已知的。典型的包装系统包含至少两个包装载体第一个包装载体,其包含第一个核苷酸序列,该序列包含gag、pol或gag和pol基因;和第二个包装载体,其包含第二个核苷酸序列,该序列包含异源的或者功能修饰的包膜基因。逆转录病毒元件可以源自慢病毒,如HIV。所述载体可以缺少功能性tat基因和/或功能性附加基因(vif、vpr、vpu、vpx、nef)。所述系统可以另外包含第三个包装载体,其具有包含rev基因的核苷酸序列。所述包装系统可以以含有所述第一个、第二个及任选的第三个核苷酸序列的包装细胞的形式提供。在一些实施方案中,可适用于多种表达系统,特别是具有真核细胞和有利的哺乳动物细胞的那些。在天然蛋白被糖基化的情况下,优选的实施方案可以包含为表达的蛋白提供天然-样糖基化的表达系统。·慢病毒具有ー些共有的结构性病毒粒子蛋白,包括包膜糖蛋白SU(gp 120)和TM(gp41),它们由env基因编码;CA (p24)、MA (pl7)和NC(p7_ll),它们由gag基因编码 '及由pol基因编码的RT、PR和IN。HIV-I和HIV-2含有參与调节病毒RNA的合成和加工及其它复制功能的辅助蛋白质和其它蛋白质。由vif、vpr、vpu/vpx和nef基因编码的辅助蛋白质可以在重组系统中省略(或者灭活)。另外,tat和rev可例如通过突变或者缺失而省略或者灭活。第一代慢病毒载体包装系统为gag/pol和env提供了単独的包装构建体,并且出于安全原因,通常采用异源的或者功能修饰的包膜蛋白。在第二代慢病毒载体系统中,附加基因Vif、Vpr、VpU和nef被缺失或者灭活。第三代慢病毒载体系统是其中tat基因已经缺失或者以其它方式灭活(例如通过突变)的那些。补偿通常由tat提供的转录调节,可以通过使用强组成型启动子而提供,如人巨细胞病毒立即早期(HCAAV-IE)增强子/启动子。基于组成型启动子活性的強度、对靶组织的特异性(例如,肝特异性的启动子)或者与希望的表达控制有关的其它因素,可以选择其它启动子/增强子,这些为本领域所已知。例如,在一些实施方案中,采用诱导型启动子如tet来实现受控表达是合乎需要的。编码rev的基因可以提供在単独的表达构建体上,所以典型的第三代慢病毒载体系统将包含四个质粒gagpol、rev、包膜和转移载体各ー个。无论采用哪一代包装系统,gag和pol均可以提供在单个构建体上或者分开的构建体上。通常,包装载体被包含在包装细胞中,并通过转染、转导或者感染而导入细胞中。进行转染、转导或者感染的方法为本领域技术人员所熟知。本发明的逆转录病毒转移载体可以通过转染、转导或者感染而导入包装细胞系中,以产生生产细胞或者细胞系。本发明的包装载体可以通过标准方法导入人细胞或者细胞系中,所述标准方法包括例如磷酸I丐转染、脂转染或电穿孔。在一些实施方案中,包装载体与显性选择标记(诸如neo、ニ氢叶酸还原酶(DHFR)、谷氨酰胺合成酶或ADA) —起导入细胞中,随后在合适药物存在下选择,井分离克隆。选择标记基因可以与由包装载体编码的基因物理连接。已知其中包装功能设计为由合适的包装细胞表达的稳定细胞系。例如,參见美国专利号 5,686,279 ;和 Ory 等人 1996. Proc. Natl. Acad. Sci. 93 :11400-11406,它们描述了包装细胞。关于稳定的细胞系生产的其它描述,可以參见Dull等人1998. J. Virol. 72(11)8463-8471 ;和 Zufferey 等人 1998. J. Virol. 72 :9873_9880。Zufferey 等人 1997. Nat. Biotechnol. 15 :871_75 教导了一种慢病毒包装质粒,其中包括HIV-I包膜基因的pol的3’序列缺失。该构建体含有tat和rev序列,并且3' LTR被聚腺苷酸序列替代。5' LTR和psi序列被另ー种启动子(诸如诱导型启动子)替换。例如,可以使用CMV启动子或其衍生物。包装载体可以含有另外的包装功能改变,以增強慢病毒蛋白表达及增加安全性。例如,可以除去在gag上游的所有HIV序列。也可以除去包膜的下游序列。另外,可以采用修饰载体以增强RNA剪接和翻译的步骤。任选地,使用条件包装系统,诸如Dull等人1998(同上)描述的包装系统。也优 选地使用自身灭活载体(SIN),其通过缺失HIV-I长末端重复序列(LTR)而提高载体的生物安全性,例如Zufferey等人1998. J. Virol. 72 :9873-9880所述。也可以使用诱导型载体,诸如通过四环素可诱导的LTR。启动子在一些实施方案中,本发明的载体通常包括异源控制序列,其包括、但不限于组成型启动子,诸如巨细胞病毒(CMV)立即早期启动子、RSV LTR、MOMLV LTR和PGK启动子;组织或细胞类型特异性的启动子,包括mTTR、TK、HBV、hAAT、可调节的或可诱导的启动子、增
强子等。某些有用的启动子包括LSP启动子(III等人1997. Blood Coagul. Fibrinolysis8S2 :23-30), EFl-a 启动子(Kim 等人 1990. Gene 91(2) :217-23)和 Guo 等人 1996. GeneTher. 3 (9) :802-10)。最优选的启动子包括延伸因子1_ a (EFla)启动子、磷酸甘油酸激酶-I(PGK)启动子、巨细胞病毒立即早期基因(CMV)启动子、嵌合的肝特异性的启动子(LSP)、巨细胞病毒增强子/鸡¢-肌动蛋白(CAG)启动子、四环素应答启动子(TRE)、转甲状腺素蛋白启动子(TTR)、猴病毒40(SV40)启动子和CK6启动子。可用于实践本发明的一种有利的启动子是腺病毒主要晚期启动子(Berkner和Sharp. 1985. Nucl. Acids Res. 13 841-857)。有关启动子的结构和功能信息是本领域已知的。相关序列可从公共数据库容易地得到,并掺入载体中,用于实践本发明的方面。在本发明的实践中ー种特别优选的启动子是腺病毒主要晩期启动子。表达盒可以包含在5’至3’方向,腺病毒主要晩期启动子、与目标蛋白或目标蛋白链的第一个编码序列可操作地连接的三联体前导序列、编码自加工序列或蛋白酶切割序列的序列、目标蛋白或蛋白链的第二个编码序列、和任选的编码自加工序列或蛋白酶切割序列的序列、随后的目标蛋白或蛋白链的第三个编码序列。所有这些编码序列共价地连接在同一个读码框中,使得在多蛋白编码序列内不终止翻译。在蛋白合成过程中或在多肽合成结束以后,自加工或蛋白水解性加工会将多蛋白切割成适当的蛋白链或蛋白。在免疫球蛋白合成的情况下,轻链的编码序列在多蛋白编码序列内出现2次。有利地,前导序列编码区可以与蛋白或蛋白链序列相结合;信号肽酶的加工可以具有下述额外益处在加工位点下游的蛋白的N-端处,去除某种残余的氨基酸残基。免疫球蛋白重链的组分是Met,蛋白起始甲硫氨酸;HC,重链;LC,轻链;SPPC,自加工或蛋白酶切割位点。免疫球蛋白合成的表达构建体可以包括下述的Met-蛋白酶-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC ;Met-蛋白酶-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC ;Met-蛋白酶-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC ;HC前导序列-HC-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC ;LC前导序列-LC-SPPC-HC前导序列-HC-SPPC—LC前导序列-LC ;LC前导序列-LC-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC ;Met-蛋白酶-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC。包括抗体在内的生物治疗分子在本发明的范围内,除了别的以外,特定表达的抗体(免疫球蛋白)可以包括特异性地结合下述因子的那些肿瘤坏死因子(与HUMIRA/D2E7相对应和/或源自它的工程化的抗体;所述HUMIRA/D2E7是百慕大哈密尔顿的Abbott Biotechnology Ltd.的阿达木单抗的商标);白介素-12 (源自ABT-874的工程化的抗体);白介素-18 ( 源自ABT-325的工程化的抗体);重组促红细胞生成素受体(源自ABT-007的工程化的抗体);或E/L选择蛋白(源自EL246-GG的工程化的抗体)。工程化的多蛋白的编码序列和氨基酸序列公开在本文中,或是本领域可得到的。适用于本发明的其它抗体包括,例如,类克(英夫利昔单抗);Rituxan/美罗华(利妥昔单杭);赫赛汀(曲妥单抗);阿瓦斯丁(贝伐单抗);Synagis (帕利珠单抗);爱必妥(西妥昔单抗);Reopro (阿昔单抗);Orthoclone 0KT3(莫罗单抗-CD3);赛尼哌(达珠单抗);舒莱(巴利昔单抗);麦罗塔(吉姆单抗);Campath(阿仑珠单抗);泽娃灵(替伊莫单抗);Xolair (奥马珠单抗);Bexxar (托西莫单抗);和Raptiva (依法珠单抗);其中在商标-品牌名称之后通常在括号中注明各自的通用名。其它合适的蛋白包括,例如,下述的ー种或多种红细胞生成素a、红细胞生成素P、依那西普、达依泊汀a、非格司亭、干扰素P la、干扰素P lb、干扰素a _2b、甘精胰岛素、生长激素、特立帕肽、促滤泡素a、脱氧核糖核酸酶(dornase)、因子VIII、因子VII、因子IX、伊米苷酶、奈西立肽、来格司亭和Von Willebrand因子;其中ー个或多个通用名可以各自对应产物的一个或多个商标-品牌名称。其它抗体和蛋白适用于本发明,如本领域所理解的。本发明也预见到两种或更多种目标多肽或蛋白或前蛋白的编码序列的受控表达。基因调节系统可用于调节特定ー个或多个基因的表达。在一个示例性的方案中,基因调节系统或开关包括嵌合的转录因子,其具有配体结合结构域、转录激活结构域和DNA结合结构域。所述结构域可从基本上任何来源得到,并且可以以许多方式中的任一种相组合,以获得新的蛋白质。可调节的基因系统还包括DNA应答元件,其与嵌合的转录因子相互作用。该转录调控元件位于要调节的基因邻近。可用于实践本发明的示例性的转录调节系统包括,例如果蝇蜕皮激素系统(Yao等人 1996. Proc. Natl. Acad. Sci. 93 :3346);蚕蜕皮激素系统(Suhr 等人 1998. Proc.Natl. Acad. Sci. 95 :7999) ;GeneSwitch (Valentis, The Woodlands, TX 的商标);合成的孕酮受体系统,其米用RU486作为诱导物(Osterwalder等人2001. Proc. Natl. Acad. Sci.USA 98(22) :12596-601) ;Tet 和 RevTet 系统(四环素调节的表达系统,BD BiosciencesClontech, Mountain View, CA的商标),其采用小分子如四环素(Tc)或类似物例如多西环素来调节(启动或关闭)革巴标的转录(Knott等人2002. Biotechnologys 32(4) :796,798,800) ;ARIAD调节技术(Ariad, Cambridge, MA),其基于使用小分子使两个细胞内分子结合在一起,每个分子均与转录活化剂或DNA结合蛋白相连。当这些组分集合在一起时,会激活目标基因的转录。Ariad具有基于同源ニ聚化的系统和基于异源ニ聚化的系统(Rivera等A 1996. Nature Med. 2(9) :1028-1032 ;Ye 等人 2000. Science 283 :88-91)。本发明的表达载体构建体的实施方案(其包含编码自加工或蛋白酶切割的重组多肽形式的抗体或其片段或其它异源蛋白或前蛋白的核酸序列)可以在体外、先体外后体内或在体内导入细胞中,用于向细胞(例如,体细胞)递送外源的治疗性基因或转基因,或用于由载体转导的细胞生产重组多肽。宿主细胞和载体的递送使用本领域已知的标准方法,可以将本发明的载体构建体在体外或者先体外后体内导入合适的细胞中。这种技术包括,例如使用磷酸钙的转染、显微注射进培养的细胞中(Capecchi 1980. Cell22 :479-488)、电穿孔(Shigekawa 等人 1988. Biotechnology 6:742-751)、脂质体介导的基因转移(Mannino 等人 1988. Biotechnology6 :682-690)、脂质介导的转导(Feigner 等人 1987. Proc. Natl. Acad. Sci. USA 84 :7413-7417)及使用高速微射 弹进行的核酸递送(Klein等人1987. Nature 327 :70-73)。 对于体外或者先体外后体内表达,可以采用有效地表达功能性蛋白产物的任何细胞。本领域已知许多用于蛋白质表达的细胞和细胞系的实例。例如,原核细胞和昆虫细胞可用于表达。另外,可以使用真核微生物,如酵母。重组蛋白质在原核、昆虫和酵母系统中的表达为本领域所通常已知的,并且可以适用于使用本发明的组合物和方法的抗体或其它蛋白表达。可用于表达的细胞的实例另外包括哺乳动物细胞诸如成纤维细胞、来自非人哺乳动物的细胞诸如羊、猪、鼠和牛细胞、昆虫细胞等。哺乳动物细胞的具体实例包括、但不限于C0S细胞、VERO细胞、HeLa细胞、中国仓鼠卵巢(CHO)细胞、CHO DX Bll细胞、CHO DG44细胞、PerC. 6细胞、Sp2/0细胞、293细胞、NSO细胞、3T3成纤维细胞、W138细胞、BHK细胞、HEPG2细胞和MDCK细胞。在经改良的常规营养培养基中培养宿主细胞,所述改良是为了适合诱导启动子、选择转化体或者扩增编码希望的序列的基因。可以在多种培养基中培养哺乳动物宿主细胞。可商业得到的培养基诸如Ham' s FlO (Sigma)、最低必需培养基(MEM) (Sigma)、RPMI1640(Sigma)、最低基础培养基(MEM) Alpha培养基和Dulbecco氏改良的伊格尔培养基(DMEM) (Sigma)通常适用于培养宿主细胞。给定的培养基通常根据需要补加激素和/或其它生长因子(如胰岛素、转铁蛋白或表皮生长因子)、盐(如氯化钠、钙、镁和磷酸盐)、缓冲液(如HEPES)、核苷(如腺苷和胸苷)、抗生素、痕量元素和葡萄糖或者等效的能量源。也可以包含适当浓度的任何其它必需补充物,这些为本领域技术人员所已知。对于特定细胞系而言合适的培养条件(如温度、PH等)通常为本领域所已知,为多种细胞系培养建议的培养条件參见例如ATCC 目录(可在因特网上在“ atcc. org/SearchCatalogs/AlICollections, cfm”得到),或按照商业供应商的指示。所述表达载体可以通过不同途径在体内施用(例如真皮内、静脉内、肿瘤内、脑内、门静脉内、腹膜内、肌肉内、膀胱内等),以递送经由自加工切割序列连接的多个基因,从而在动物模型或人受试者中表达两种或更多种蛋白或多肽。根据施用途径,治疗性蛋白质局部地(在脑或膀胱中)或者全身地(其它施用途径)发挥其作用。在开放读框的5’侧的组织特异性启动子的使用,会导致由该整个开放读码框编码的蛋白质或多肽的组织特异性表达。将携带转基因的重组表达载体在体外、先体外后体内或者在体内导入靶细胞中的多种方法,在先前已经描述并且为本领域所熟知。本发明提供了治疗方法、疫苗和癌症疗法,其中用含有2种或更多种目标蛋白或多肽的编码序列的重组载体感染靶细胞,并在靶细胞中表达所述蛋白或多肽。例如,本发明的重组载体的体内递送可以靶向多种器官类型,包括、但不限于脑、肝、血管、肌肉、心、肺和皮肤。在先体外后体内基因转移的情况下,使用本发明的重组载体和本领域熟知的方法,从宿主取出靶细胞,并在实验室中进行遗传修饰。使用常规施用模式,包括、但不限于上述模式,可以施用本发明的重组载体。本发明的重组载体可以在多种制剂中,所述制剂包括、但不限干液体溶液和悬浮液、微泡、脂质体和可注射的或可输注的溶液。优选的形式依赖于施用模式和治疗用途。 在一些实施方案中,表达载体构建体在免疫球蛋白或其它生物活性蛋白体内生产中的优点包括在患者中长期施用单个载体和持续的抗体表达;具有完整生物活性的抗体或其片段(或其它生物活性蛋白)的体内表达;和在人细胞中产生的抗体的天然的翻译后修饰。理想地,表达的蛋白与天然存在的蛋白是相同的或充分相同的,使得在将表达的蛋白施用于多个场合或在需要所述蛋白的患者中持续表达的情况下,減少或不触发免疫应答。本发明的重组载体构建体的实施方案可以另外用于在体外生产重组抗体和其它生物活性蛋白,它们用于治疗中或用于研究中。重组蛋白的生产方法是本领域众所周知的,且可以用于表达重组抗体,其中使用本文所述的含有自加工切割位点或其它蛋白酶切割位点的载体构建体。在ー个方面,本发明提供了用于生产重组免疫球蛋白或其片段的方法,其中将表达载体(诸如上述的表达载体)导入细胞中,以得到转染的细胞,其中所述载体在5'至3'方向包含与免疫球蛋白重链和2个轻链或其片段的编码序列可操作地连接的启动子,在每个所述链之间的自加工序列。应当理解,免疫球蛋白重链的编码序列或免疫球蛋白轻链的编码序列可以相对于给定的载体构建体中的自加工序列在5'侧(即,前面)。在抗体的构建体的一个实施方案中,编码抗体或免疫球蛋白或其片段的第一链或第二链的序列包括源自IgG、IgM、IgD、IgE或IgA的重链或其片段。概括地讲,编码抗体或免疫球蛋白或其片段的链的序列也包括来自IgG、IgM、IgD、IgE或IgA的轻链或其片段。本发明的实施方案涉及与整个抗体分子的蛋白以及它们的修饰的或衍生的形式相对应的基因,所述形式包括,例如,其它抗原识别分子片段如Fab、单链Fv(ScFv)和F(ab' )2。所述抗体和片段可以是动物衍生的、人-小鼠嵌合的、人源化的、通过去免疫化(Deimmunisation) (Bi O vat ion Ltd)改变的、为了改变对Fe受体的亲和カ而改变的、或全人的。配体结合分子的实施方案可以是亲和力成熟的,如本领域理解的。在优选的实施方案中,抗体或其它重组蛋白在施用它的人或动物中不会引起或最小地引起免疫应答。所述抗体可以是双特异性的,且包括、但不限干双抗体,细胞杂交瘤,小型抗体,ScBs抗体和把手在孔中(knobs-into-holes)抗体。以本领域众所周知的不同方式(Harlow等人1988.抗体,ALaboratory Manual,Cold Spring Harbor Laboratory),可以实现抗体本身的生产和回收。根据本领域众所周知的方法,收集和/或纯化和/或使用其它目标蛋白。在实践本发明的实施方案中,通过在适合宿主细胞生长和编码序列表达的培养条件下培养修饰的重组宿主细胞,可以使用重组DNA技术生产抗体或其变体(类似物)。为了监测表达的成功,使用标准技术诸如ELISA、RIA等,可以监测与抗原有关的抗体水平。使用本领域已知的标准技木,从培养物上清液中回收抗体。当然,通过标准的纯化技术,包括、但不限于经由蛋白A、蛋白G或蛋白L柱的亲和色谱法,或关于特定抗原,或甚至关于希望具有特异性的抗原的特定表位,可以容易地制备这些抗体的纯化形式。使用常规色谱法,诸如离子交換、疏水相互作用、亲和カ或尺寸排阻柱,也可以如本领域理解地纯化抗体。也參见 Rinderknecht 等人于 1997 年 6 月 24 日提交的 US 5, 641, 870,“Low pH hydrophobicinteraction cnromatograpny forantiboay purification,,ネロ Shukla 等人^■ 2008 年 9月 23 日提交的 US 7,427,659, “Process for purifying proteins in a hydrophobicinteraction chromatography flow-through fraction”,它们公开了纯化技术。纯化技术可以以不同的组合或与其它技术(诸如硫酸铵沉淀和尺寸限制的膜过滤)结合进行。在将表达系统设计成包括信号肽的情况下,得到的抗体会分泌进培养基或上清液中;但是,细胞内生产也是可能的。可以回收细胞内的内容物,并进行纯化。 可以选择细胞培养条件,所述条件会促进希望的多蛋白加工水平,例如,最完全加エ。这样的加工可以发生在细胞内,但是也可以发生在细胞外、在细胞培养过程中或以后。以前已经描述了来自用人Ig基因座工程化的小鼠的抗原特异性的全人单克隆抗体的生产和选择(Jakobovits 等人 1998. Advanced Drug Delivery Reviews 31:33-42;Mendez 等人 1997.Nature Genetics 15 :146-156 ;Jakobovits 等人 1995.Curr OpinBiotechnol 6 :561-566 ;Green 等人 1994. Nature Genetics Vol. 7 :13-21)。已经在转基因山羊的乳汁中实现治疗性单克隆抗体的高水平表达,并已经证实,抗原结合水平与使用常规细胞培养技术生产的单克隆抗体的水平等同。该方法是基于人治疗蛋白在转基因动物的乳汁中的形成,所述转基因动物携帯允许它们在它们的乳汁中表达人治疗蛋白的遗传信息。这些重组蛋白一旦生成,使用标准的技术可以从乳汁中有效地纯化它们。參见例如,Pollock 等人 1999. J. Immunol. Meth. 231 :147-157 和 Young 等人 1998.Res Immunol. 149(6) :609_610。来自转基因动物的动物乳汁、卵白、血液、尿、精浆和蚕虫茧已经表现出作为在エ业规模生产重组蛋白的来源的潜力(Houdebine L M. 2002. CurrOpin Biotechnol 13 :625-629 ;Little 等人 2000. Immunol Today, 21 (8) :364-70 ;和 GuraT. 2002. Nature,417 :584-5860)。本发明预见到转基因动物表达系统用于表达目标重组抗体或其变体(类似物)或其它蛋白的用途,其中使用本发明的编码自加工切割位点的载体和/或蛋白酶识别位点载体。还已经成功地证实重组蛋白在植物中的生产,所述植物包括、但不限于通过土壤杆菌感染、基因枪转化、原生质体转化等转化的马铃薯、番茄、烟草、稻和其它植物。已经证实重组人GM-CSF在转基因烟草植物的种子中的表达和包括单链抗体在内的抗体在植物中的表达。參见,例如,Streaffield 和 Howard. 2003. Int. J. Parasitol. 33 :479-93 ;Schillberg 等人 2003. Cell Mol Life Sci. 60433A5 ;Pogue 等人 2002. Annu. Rev.Phytopathol. 40 :45-74 ;和McCormick等人 2003. J Immunological Methods, 278 :95_104。本发明预见到转基因的植物表达系统用于表达目标重组免疫球蛋白或其片段或其它蛋白的用途,其中使用本发明的编码蛋白酶切割位点或自加工切割位点的载体。与昆虫细胞相结合的杆状病毒载体表达系统也正在成为重组蛋白生产的可行平台的基础。已经报道,杆状病毒载体表达系统会提供相对于哺乳动物细胞培养的优点,诸如容易培养和更高的表达水平。參见,例如,Ghosh等人2002. Mol Ther. 6 :5_11,和Ikonomou等人2003. Appl Microbiol Biotechnol. 62 :1-20。本发明另外预见到杆状病毒载体表达系统用于表达重组免疫球蛋白或其片段的用途,其中使用本发明的编码自加工切割位点的载体。杆状病毒载体和合适的宿主细胞是本领域众所周知的和可商业得到的。基于酵母的系统也可以用于表达目标重组免疫球蛋白或其片段或其它蛋白,包括双杂种或三杂种系统,其中使用本发明的编码自加工切割位点的载体。參见,例如,美国专利号5,643,745,它通过引用并入本文。应当理解,本发明的表达盒和载体和重组宿主细胞(其包含単独的自加工肽的编码序列,或与蛋白水解性切割位点的额外编码序列相组合的自加工肽的编码序列)可以用于在任意蛋白表达系统中表达双杂种和三杂种系统的重组免疫球蛋白或其片段、前蛋白、生物活性蛋白和蛋白组分,它们中的许多是本领域已知的,它们的实例描述在本文中。本领·域技术人员可以容易地改变本发明的载体、宿主细胞和方法的实施方案,用于任意蛋白表达系统中。实施例I. Lon蛋白酶内含肽和表达构建体在新英格兰Biolabs (NEB, Ipswich,Massachusetts, USA)内含妝数据库(InBase,ihe Intern Database and Registry ;在 http:"www. neb. com/neb/inteins. html)中报道了 3种ATP依赖性的Lon蛋白酶内含肽。參见Perler,F. B. (2002). InBase, theIntein Database. Nucleic Acids Res. 30, 383-384。这些内含妝来自生物体 Pyrococcusabyssi (Pab Lon内含肽)、激烈火球菌(Pfu Lon内含肽)和掘越氏火球菌0T3 (Pho Lon内含肽)。这些Lon内含肽具有提出的内切核酸酶结构域、赖氨酸替代组氨酸作为内含肽的倒数第二位残基、和不同的长度(分别是333、401和474个氨基酸)。在NEB数据库中,所有3种Ion内含肽被指示为理论内含肽,根据数据库指示,列出的贡献者没有指示,已经证实给定的内含肽项目的剪接产物的存在。应当指出,已经在实验中发现Pab Lon内含肽的内切核酸酶结构域不具有活性(Saves I, Morlot C, Thion L, Rolland JL, Dietrich J, MassonjM. Investigating the endonuclease activity oi four Pyrococcus aoyssiintems.Nucleic Acids Res. 2002 Oct I ;30(19) :4158-65)。我们已经发现,被包含在ATP依赖性的蛋白酶Ion家族的基因中的内含肽可以非常有效地介导在不同单个开放读码框构建体设计中的抗体重链和轻链的切割。一井提供了与这些内含肽有关的序列信息。Lon内含肽序列和载体构建体设计表I提供了 Pab Lon内含肽(在NCBI/蛋白中的登记号CAB50486. I)、PAB1313Pab Lon内含肽(包括-I和+1外显肽残基)的蛋白序列信息(SEQ ID NO :1)。表I. Pab Lon内含肽氨基酸序列(SEQ ID NO :1)。QCFSGEETVVIRENGEVKVLRLKDFVEKALEKPSGEGLDGDVKVVYHDFRNENVEVLTKDGFTKLLYANKRIGKQKLRRVVNLEKDYWFALTPDHKVYTTDGLKEAGEITEKDELISVPITVFDCEDEDLKKIGLLPLTSDDERLRKIATLMGILFNGGSIDEGLGVLTLKSERSVIEKFVITLKELFGKFEYEIIKEENTILKTRDPRI
IKFLVGLGAPIEGKDLKMPWWVKLKPSLFLAFLEGFRAHIVEQLVDDPNKNLPFFQELSWYLGLFGIKADIKVEEVGDKHKIIFDAGRLDVDKQFIETffEDVEVTYNLTTEKGNLLANGLFVKNS表2描述了已经进行密码子选择优化的Pab Lon内含肽的核苷酸序列。表2. Pab Lon内含肽核苷酸序列(SEQ ID NO :2)。tgcttcagcggcgaggaaaccgtggtgatccgggagaacggcgaggtgaaggtgctgcggctgaaggacttcgtggagaaggccctggaaaagccctccggcgagggcctggacggcgacgtgaaagtggtgtaccacgacttccggaacgagaacgtggaggtgctgaccaaggacggcttcacc
aagctgctgtacgccaacaagcggatcggcaagcagaaactgcggcgggtggtgaacctggaaaaggactactggttcgccctgacccccgaccacaaggtgtacaccaccgacggcctgaaagaggccggcgagatcaccgagaaggacgagctgatcagcgtgcccatcaccgtgttcgactgcgaggacgaggacctgaagaagatcggcctgctgcccctgaccagcgacgacgagcggctgcggaagatcgccaccctgatgggcatcctgttcaacggcggcagcatcgatgagggcctgggcgtgctgaccctgaagagcgagcggagcgtgatcgagaagttcgtgatcaccctgaaagagctgttcggcaagttcgagtacgagatcatcaaagaggaaaacaccatcctgaaaacccgggacccccggatcatcaagtttctggtgggcctgggagcccccatcgagggcaaggatctgaagatgccttggtgggtgaagctgaagcccagcctgttcctggccttcctggaaggcttccgggcccacatcgtggagcagctggtcgacgaccccaacaagaatctgcccttctttcaggaactgagctggtatctgggcctgttcggcatcaaggccgacatcaaggtggaggaagtgggcgacaagcacaagatcatcttcgacgccggcaggctggacgtggacaagcagttcatcgagacctgggaggatgtggaggtgacctacaacctgaccacagagaagggcaatctgctggccaacggcctgttcgtgaagaac表3描述了由SEQ ID NO 2编码的蛋白序列SEQ ID NO :3。表3. Pab Lon内含肽氨基酸序列(SEQ ID NO :3)。CFSGEETVVIRENGEVKVLRLKDFVEKALEKPSGEGLD⑶VKVVYHDFRNENVEVLTKDGFTKLLYANKRIGKQKLRRVVNLEKDYffFALTPDHKVYTTDGLKEAGEITEKDELISVPITVFDCEDEDLKKIGLLPLTSDDERLRKIATLMGILFNGGSIDEGLGVLTLKSERSVIEKFVITLKELFGKFEYEIIKEENTILKTRDPRIIKFLVGLGAPIEGKDLKMPWWVKLKPSLFLAFLEGFRAHIVEQLVDDPNKNLPFFQELSWYLGLFGIKADIKVEEVGDKHKIIFDAGRLDVDKQFIETWEDVEVTYNLTTEKGNLLANGLFVKN表4提供了 Pfu Lon内含肽(在NCBI/蛋白中的登记号AAL80591. 1)、PR)467(包括-I和+1外显肽残基)的蛋白序列信息(SEQ ID NO 4)。表4. Pfu Lon内含肽氨基酸序列(SEQ ID NO :4)。QCFSGEEVILIEKDGEKKVFKLREFVDGLLKEASGEGMDGSIRVVYKDLQGENIKILTKDGLVKLLYVNRREGKQKLRKIVNLEKDYffLALTPEHKVYTIKGLKEAGEITKDDEIIRVPLTILDGFDVAEKSIREELERLSLLPLNSEDSRLEKIAGIMGALFGSGGIDENLNTLSFVSSEKKTIEQFVKALSELFGEFDYKIEEKENSIIFRTCDKRIVTFFATLGAPVGDKSKVKLKLPffffVKLKPSLFLAFMDGLYSSNRNDKEILEITQLTDNVETFFEEISWYLSFFGIKAEAEEDEEKDKYRARLTLSSSIDNMLNFIEFIPISFSPAKREKFFKEIEKYLEYSIPEKTEDLKKRVKRVKKGERRNFLESWEEVEVTYNVTTETGNLLANGLFVKNS表5提供了天然Pfu Lon内含肽的核苷酸序列信息(SEQ ID NO 5)。
表5. Pfu Lon内含肽核苷酸序列(SEQ ID NO :5)。tgttttagcggtgaagaagttatcttaattgaaaaggacggagagaaaaaagtcttcaaacttagggagttcgttgacggtctccttaaggaggcgtctggagaagggatggacggaagtattagagtagtttataaagatcttcaaggggaaaacataaaaatactcacaaaagacggacttgtaaagctcctttatgtcaatagaagagaagggaagcaaaagcttagaaaaatagtaaatcttgaaaaggattattggcttgcattaacacctgaacataaagtgtacacaataaagggccttaaagaagctggagagataactaaagatgatgagataataagagtgcctctcacaattcttgacggctttgacgtagccgagaagagtataagagaggaacttgaaaggcttagcctacttccactaaa
tagtgaagacagtagactagaaaagatagcaggaatcatgggcgcactctttggtagtggaggtatcgatgagaatctcaatacccttagctttgtttctagcgagaagaaaacaattgaacagtttgttaaagcactcagcgagctcttcggggaatttgactataaaattgaagaaaaagaaaacagcattattttcagaacatgtgataaaagaatagtgaccttctttgctacacttggtgcaccagttggagacaaaagcaaagttaagcttaagcttccatggtgggtcaagcttaagccgtcacttttcctcgccttcatggatggtctctacagtagcaataggaatgacaaagaaatcctcgaaataactcaacttactgacaacgtcgaaacgttcttcgaggaaatatcttggtatctgagcttctttggaattaaggcagaagctgaagaggatgaagaaaaagataaatacagggctagacttacgctatcctcatcaatagacaacatgcttaatttcattgagttcattccaataagcttttctccagcaaagagagaaaaattctttaaggaaattgaaaaatatctggaatatagcattcccgaaaagactgaggatcttaagaaacgagttaagagagttaagaagggagagagaaggaatttcctcgaaagctgggaggaagttgaagttacttacaacgtaactacagagacaggaaatctacttgctaacggtctatttgttaagaac表6描述了由SEQ ID NO 5编码的蛋白序列SEQ ID NO :6。表6. Pfu Lon内含肽氨基酸序列。CFSGEEVILIEKDGEKKVFKLREFVDGLLKEASGEGMDGSIRVVYKDLQGENIKILTKDGLVKLLYVNRREGKQKLRKIVNLEKDYWLALTPEHKVYTIKGLKEAGEITKDDEIIRVPLTILDGFDVAEKSIREELERLSLLPLNSEDSRLEKIAGIMGALFGSGGIDENLNTLSFVSSEKKTIEQFVKALSELFGEFDYKIEEKENSIIFRTCDKRIVTFFATLGAPVGDKSKVKLKLPWWVKLKPSLFLAFMDGLYSSNRNDKEILEITQLTDNVETFFEEISWYLSFFGIKAEAEEDEEKDKYRARLTLSSSIDNMLNFIEFIPISFSPAKREKFFKEIEKYLEYSIPEKTEDLKKRVKRVKKGERRNFLESWEEVEVTYNVTTETGNLLANGLFVKN使用PCR技术,克隆Pfu Lon内含肽。通过根据哺乳动物密码子选择的设计,合成Pab Lon内含肽核苷酸序列。从Inbase得到Pyrococcus abysii Ion蛋白酶内含肽的蛋白序列,所述Inbase是由马萨诸塞州Ipswich的新英格兰Biolabs资助的公众监护的内含肽数据库(http://www. neb. com/neb/inteins. html)。得到的蛋白序列被列出为EMBL登录号CAB50486. I,gi5459000 ;但是,使用在网站上列出的蛋白序列。在表7中指示了 Pab-Ion内含肽蛋白序列。表7. Pab-Ion内含肽氨基酸序列(SEQ ID NO 7)。CFSGEETVVIRENGEVKVLRLKDFVEKALEKPSGEGLDGDVKVVYHDFRNENVEVLTKDGFTKLLYANKRIGKQKLRRVVNLEKDYWFALTPDHKVYTTDGLKEAGEITEKDELISVPITVFDCEDEDLKKIGLLPLTS
DDERLRKIATLMGILFNGGSIDEGLGVLTLKSERSVIEKFVITLKELFGKFEYEIIKEENTILKTRDPRIIKFLVGLGAPIEGKDLKMPWWVKLKPSLFLAFLEGFRAHIVEQLVDDPNKNLPFFQELSWYLGLFGIKADIKVEEVGDKHKIIFDAGRLDVDKQFIETWEDVEVTYNLTTEKGNLLANGLFVKN使用专有的方法,通过GeneArt (GeneArt AG, Regensburg,德国),将该 Pab-lon蛋白序列回译成为哺乳动物表达优化的DNA序列。在表8中指出了得到的Pab-Ion内含肽DNA序列。应当理解,DNA构建体可以任选地提供额外的侧接接头,这取决于特定克隆和表达载体的选择和使用常规技术的对应分子生物学方案。将DNA序列合成(GeneArt合成编号0611467)为999bp片段,并在GeneArt载体质粒pGA4中递送。參见在http://partsregistry. org上的生物学标准部分(包括Part BBa J70003)的登记。对接收的DNA材料重新测序,并确定与设计的序列相对应。该DNA材料直接地用作以后的含有Pab-Ion内含肽的质粒构建体的来源/模板;所述质粒不进行重新繁殖。
表8. Pab-Ion 内含肽核酸序列(SEQ ID NO :8)。TGCTTCAGCGGCGAGGAAACCGTGGTGATCCGGGAGAACGGCGAGGTGAAGGTGCTGCGGCTGAAGGACTTCGTGGAGAAGGCCCTGGAAAAGCCCTCCGGCGAGGGCCTGGACGGCGACGTGAAAGTGGTGTACCACGACTTCCGGAACGAGAACGTGGAGGTGCTGACCAAGGACGGCTTCACCAAGCTGCTGTACGCCAACAAGCGGATCGGCAAGCAGAAACTGCGGCGGGTGGTGAACCTGGAAAAGGACTACTGGTTCGCCCTGACCCCCGACCACAAGGTGTACACCACCGACGGCCTGAAAGAGGCCGGCGAGATCACCGAGAAGGACGAGCTGATCAGCGTGCCCATCACCGTGTTCGACTGCGAGGACGAGGACCTGAAGAAGATCGGCCTGCTGCCCCTGACCAGCGACGACGAGCGGCTGCGGAAGATCGCCACCCTGATGGGCATCCTGTTCAACGGCGGCAGCATCGATGAGGGCCTGGGCGTGCTGACCCTGAAGAGCGAGCGGAGCGTGATCGAGAAGTTCGTGATCACCCTGAAAGAGCTGTTCGGCAAGTTCGAGTACGAGATCATCAAAGAGGAAAACACCATCCTGAAAACCCGGGACCCCCGGATCATCAAGTTTCTGGTGGGCCTGGGAGCCCCCATCGAGGGCAAGGATCTGAAGATGCCTTGGTGGGTGAAGCTGAAGCCCAGCCTGTTCCTGGCCTTCCTGGAAGGCTTCCGGGCCCACATCGTGGAGCAGCTGGTCGACGACCCCAACAAGAATCTGCCCTTCTTTCAGGAACTGAGCTGGTATCTGGGCCTGTTCGGCATCAAGGCCGACATCAAGGTGGAGGAAGTGGGCGACAAGCACAAGATCATCTTCGACGCCGGCAGGCTGGACGTGGACAAGCAGTTCATCGAGACCTGGGAGGATGTGGAGGTGACCTACAACCTGACCACAGAGAAGGGCAATCTGCTGGCCAACGGCCTGTTCGTGAAGAAC构建下述的哺乳动物表达载体pTT3_pfuIon HL (+)、pTT3_pfu Ion HL (-) >pTT3-pfu Ion LH(+)、pTT3-pfu Ion LH(-)、pTT3_pfu Ion LKH(+)、pTT3_pfu Ion LKH(-)、pTT3-pab Ion HL(+)、pTT3 pab Ion HL (-)、pTT3_pab Ion LH(+)、pTT3_pab Ion LH (-) >pTT3-pab Ion LKH(+)、pTT3_pab Ion LKH(-) 在这里,H 和 L 组分代表命名为 D2E7 的抗体的免疫球蛋白重链和轻链。关于pTT3pab Ion HL(-)构建体的图示,參见图I。图2解释了能够表达D2E7抗体的这些瞬时表达载体的sORF组分的结构的方面。尽管pTT3载体代表ー个具体实施方案,其它实施方案可以包括关于分离的核酸的方面,所述分离的核酸编码ー种或多种本文公开的蛋白。另ー个实施方案提供了一种包含分离的核酸序列的载体,其中所述载体选自pcDNA ;pTT (Durocher等人,NucleicAcids Research2002, Vol 30,No. 2 E9) ;pTT3 ;pEFB0S(Mizushima,S.和Nagata,S. ,1990,Nucleic Acids Research Vol 18,No. 17 :5322) ;pBV ;pJV ;和 pBJ。如上面所指出的,在PTT3载体骨架上制作不同的构建体。该载体具有EBV复制起点,这允许它在悬浮培养的经转染的293E细胞(其表达爱泼斯坦-巴尔病毒核抗原I)中进行附加型扩增。參见Di^ocher等人,其描述了载体pTT。与pTT相比,pTT3具有额外的多克隆位点,如在Ghayur, Tariq等人于2005年7月7日提交的美国专利申请公开20050147610所指示。每个基于pTT3的载体具有ー个受CMV启动子调节的0RF。在ORF中,内含肽序列插入在抗体重链和轻链(分别是HC和LC,或简称H和L)之间的框架内,其次序为HC-内含肽-LC或LC-内含肽-HC。具有“HL”命名的构建体具有抗体HC编码序列,其后面是内含肽,然后是LC编码序列;具有“LH”命名的构建体具有LC编码序列,其后面是内含肽,然后是HC编码序列。具有“LKH”命名的构建体具有插入在LC和内含肽之间的赖氨酸⑷。具有“(-)”命名的构建体具有在ORF开始处的ー个信号肽和插入在内含 肽的最后一个氨基酸与跟随内含肽的成熟抗体重链或轻链的第一个氨基酸之间的甲硫氨酸。具有“ (+) ”命名的构建体具有在ORF开始处的ー个信号肽和在内含肽的下游抗体亚基的开始处的第二个信号肽。通过瞬时转染,将构建体导入293E细胞中。简而言之,使用编码ORF构建体的PTT3载体和聚こ烯亚胺(PEI),制备复合物。使用PEI-DNA复合物转染HEK293E细胞;參见Durocher等人,2002,Nucl. Acids Res. 30 :E9。在转染后4_7天,收集细胞和培养物上清液用于分析。通过构建体进行蛋白表达。在多个瞬时表达实验中,在转染后第7天或第8天,收集培养物上清液样品。通过ELISA评估样品,且所述样品含有如下所示的、来自IgG测量的分泌的抗体的水平或范围。表9. Lon内含肽免疫球蛋白sORF构建体和抗体生产。
WMW~IgG (分泌的),~
__J yg/ml
SORF构建体
_pTT3-Dfu Ion HLj+)_I= 1.4-2.1
_pTT3-Dfu Ion HL^31-40
_pTT3-Dfu Ion LHj+)<0.1
j)TT3-qfu Ion LH 上}1.6
_pTT3-Dfu Ion LKH<0.1__pTT3-Dfu Ion LKH l-J_10
_2TT3-pab Ion HL1.3
jdTT3- pab Ion HL (;}41-68
』TT3- Dab Ion LH+)< 0.1
_pTT3- pab Ion LH0.5
卫TT3- D_ab Ion LKH {+)< 0.1
jgTT3- Dab Ion LKH丨 0.9
其它构建体_ ___
对照载体_I10-60在这些实验中,包括常规的双载体系统(其表达与上述的构建体系列相同的抗体,并使用相同的调控元件)作为对照(參见表,末行)。因而,对照载体表达D2E7抗体,其使用导入来自2个分开的pTT3载体所负载的2个分开的ORF的抗体重链和轻链的常规方案。由该对照载体系统生产的抗体分泌水平的范围是10-60U g/ml,如该表所示。与使用常规对照载体生产的水平相比,由使用Lon内含肽的几种sORF构建体设计生产的IgG分泌水平是在相同的范围内或更高。这些水平显著高于使用“2A”技术生产的那些水平,后者据报道在哺乳动物细胞中是1.6ii g/ml(Fang等人,2005,NatureBiotechnology23 :584-590)。尽管Pab Lon和Pfu Lon内含妝可以用于构建体设计中以产生希望的抗体生产水平,在描述的PTT3构建体中的Pab Lon内含肽允许更高水平的抗体分泌。这些数据也提示,当使用HL构建体设计时,抗体分泌水平通常比使用LH构建体设计时更大。通过组合免疫球蛋白链的次序特征和信号序列的方面,HL(-)构建体能够产生在研究的那些中最高水平的分泌型抗体产物。表汰产物的讲ー步表征关于表达的方面(包括表达产物分析),进一步表征在表9中列出的某些sORF构建体。这些构建体包括4个实施例,它们生产相对更高水平的分泌的抗体pTT3 pfu Ion HL(-)、pTT3 pfu Ion HL(+)、pTT3 pfu Ion LKH(-)和 pTT3 pab Ion HL(_)。通过蛋白 A亲和色谱法,纯化从这些构建体生产的分泌型抗体,并在还原和非还原SDS-PAGE凝胶上进行分析,并测定它们的HL和LC的N-端氨基酸序列。使用pTT3 pfu Ion HL㈠生产的样品含有与抗体HC、抗体LC和完全装配的抗体相对应的凝胶迁移带(在非还原凝胶上),它们的迁移与使用常规载体(诸如上述的对照D2E7载体)的传统方法所生产的抗体不可区分。在还原凝胶上,除了与抗体HC和LC相对应的带以外,还出现了 2个更高分子量(MW)带,它们对应着未加工的三联体蛋白(HC-内含肽-LC)和部分地加工的HC-内含肽融合体。该评估是基于蛋白印迹分析和质谱法分析。这2个带的丰度似乎取决于培养条件,并且可以通过修改培养条件来减小。使用根据本文提供的其它描述的和/或本领域理解的方法,可以方便地从完全加工的抗体药用物质中去除这些更高分子量产物。使用pTT3 pfu Ion HL⑴生产的样品含有与抗体HC、抗体LC和完整抗体相对应的带(在非还原凝胶上),它们的迁移与传统方法所生产的抗体不可区分。另外,存在ー个与三联体多蛋白相对应的更大的分子量带。使用PTT3 pfu Ion LKH(-)生产的样品也含有与HC、LC和完整抗体相对应的带(在非还原凝胶上),它们的迁移与使用常规载体生产的抗体不可区分。在还原凝胶上,除了与HC和LC相对应的带以外,还存在2个更高分子量带。它们中的第一个对应着三联体多蛋白,如上面关于其它载体设计所述;第二个带对应着LC-内含肽融合产物,其源自在该接头处的不完全切割。关于产物的相对丰度,似乎存在与切割的LC相同量的LC-内含肽融合体。使用pTT3 pab Ion HL(-)生产的样品含有与HC、LC和完整抗体相对应的带(在非还原凝胶上),它们的迁移与通过传统方法生产的抗体不可区分。在还原凝胶上,除了与HC和LC相对应的带以外,还存在I个主要的更高分子量带,它似乎对应着未加工的三联体蛋白(基于蛋白印迹分析)。与使用PTT3 pfu Ion HL(-)生产的样品相比,在更高分子量带中存在相对更小量的该三联体。该结果提示,尽管在我们的载体设计中Pfu Ion内含肽和Pab Ion内含肽是同源的且在功能上是类似的,Pab Ion介导的N-端切割比由Pfu Ion介导的切割更完全,因为在从Pab Ion构建体表达以后,没有观察到HC-内含肽融合体。但是,应当指出,两种构建体产生完整装配的抗体产物。
在一方面,相对于其它构建体产品,诸如完全加工的和完全自我装配的抗体产物,某些蛋白产物(如未加工的和部分加工的蛋白)可以视作污染物产物。另ー方面,这样的某些蛋白产物可能是有用的,例如作为用于进ー步加工反应和/或定向装配的材料,这可以产生完整抗体产物。如果这些蛋白产物视作污染物副产物,那么如指出的,存在这样的选择和方案其便利去除,并从而富集或纯化希望的组分,诸如完整抗体。除了来自不同构建体表达系统的培养物上清液的胞外样品以外,还得到细胞内样品,并使用具有对HC和LC的特异性的检测抗体,通过蛋白印迹分析法进行分析。如关于在培养的上清液样品中的那些物质所述,观察类似的蛋白物质。測定了不同构建体的重链和轻链产物的N-端氨基酸序列(參见下表)。结果表明,内含肽-介导的蛋白切割精确地发生在2个剪接点处,即在HC和内含肽组分的接头处和在LC和内含肽组分的接头处。表10.来自sORF构建体的表达产物的主要物质的重链和轻链N-端氨基酸序列。
HCiT LC, 「_·
构建体N-端AA序列 SEQ N-端AA序列 SEQ
_ __ID NO:ID NO:
对照、成熟的He或LC—~JevqlvesgggT 9_ I-Diqmtqspss 厂 11SORF 构建体__ _ _ _
oTT3 pfu Ion HL (+}_ 「EVQLVESGGG I: 9 「DIQMTQSPSS |" 11—
_eTT3j)fu Ion HLEVQLVESGGG 9 MDIQMTQSPS__ 12 _
_eTT3_pfu Ion LKH Q MEVQLVESGG 10 DIQMTQSPS __ 11 _ _£TT3 pab IonHLf EVQLVESGGG l" 9 「MDIQMTQSPS I _ 12来自Lon内含肽构建体的IgGl抗体的功能性质还通过抗原特异性的ELISA,分析了来自表9的sORF构建体设计的分泌的D2E7抗体产物。分析结果证实,所述构建体抗体产物结合人TNF a,即D2E7抗体的配体。因而,所述基于内含肽的构建体和表达系统能够表达和产生sORF产物,其产生完全自我装配的多聚抗体,所述抗体是有功能的和抗原特异性的。通过蛋白A亲和纯化、随后的SEC、尺寸排阻色谱法,纯化使用pTT3 pfu Ion HL(-)构建体生产的抗体。使用BiaCore 系统,通过表面等离子体共振技术,分析纯化的抗体。sORF构建体产品的表征包括它与有关的配体TNF a的结合的方面。在表11中,指出了来自BiaCore分析的值的結果,关于结合速率常数(ka,单位为1/Ms)、解离速率常数(kd,单位为1/s)和平衡解离常数(KD,单位为M)的动力学參数。认为解离常数值(KD)与使用常规载体(使用2个独特的免疫球蛋白链0RF)生产的阿达木单抗(D2E7)抗体的对应值类似。表11.从sORF构建体生产的抗体的动力学參数。
构建体「ka(l/Ms)kd(l/s)「KD(M)'
pTT3 pfu Ion HL(-)I. 51E+06I. 10E-047. 29E-11实施例2.生产具有轻链序列变化的抗体的sORF构建体产生了几种sORF构建体,其轻链序列具有相对于D2E7的免疫球蛋白轻链的变化。将这些sORF构建体工程化成具有也象在D2E7中ー样的重链,并因而能够生产IgGl抗体物质。使用构建体PTT3 pfu Ion HL(-)和pTT3 pab Ion HL (-)作为骨架,我们产生和测试了这样的构建体其具有在C-端剪接点(即,在内含肽和下游免疫球蛋白轻链组分之间的接头)处的序列变化(參见表12)。通过蛋白A亲和纯化,纯化某些构建体的分泌的免疫球蛋白,并在还原和非还原SDS-PAGE凝胶上分析。还使用针对HC和LC的抗体,通过蛋白印迹分析来分析细胞内样品。參见,例如,图3和图4。图3解释了 sORF表达产物的SDS-PAGE凝胶蛋白分析的結果。通过蛋白A亲和色谱法纯化分泌的IgG分子,并在非还原(A)和还原条件(B)下在SDS-PAGE凝胶上进行分离。泳道和样品从左向右为(泳道I)分子量參照标志物;(2)对照构建体产物,即来自非-sORF 表达系统的 D2E7 抗体;(3) Pab-lon mut Al;⑷ Pab-lon mut A2 ; (5) pTT3 pfuIon YP,^P (6)pTT3 pfu Ion MA0图4解释了其它sORF表达产物的SDS-PAGE凝胶蛋白分析的結果。通过蛋白A亲和色谱法纯化分泌的IgG,并在非还原(A)和还原(B)条件下通过SDS-PAGE凝胶进行分离。泳道和样品从左向右为(泳道I)分子量标志物;(2)对照D2E7产物;(3)pTT3 pfu IonHL (-);和(4) pTT3 pfu Ion MutA0
表12. sORF构建体在内含肽-LC的C-端剪接接头处的氨基酸序列
权利要求
1.用于产生一种或多种重组蛋白产物的分离的或纯化的表达载体,所述表达载体包含单个开放读码框插入物;所述插入物包含 (a)编码信号肽的信号肽核酸序列; (b)编码第一多肽的第一核酸序列; (C)编码第一蛋白切割位点的第一插入核酸序列,其中所述第一蛋白切割位点由火球菌属的Ion蛋白酶基因的内含肽区段、或火球菌属或甲烷球菌属的klbA基因的内含肽区段、或源自它们的修饰的内含肽区段提供;和 (d)编码第二多肽的第二核酸序列; 其中所述编码所述第一蛋白切割位点的第一插入核酸序列可操作地位于所述第一核酸序列和所述第二核酸序列之间; 其中所述编码所述信号肽的信号肽核酸序列可操作地位于所述第一核酸序列之前;且 其中所述表达载体能够表达单个开放读码框多肽,所述多肽可在所述第一蛋白切割位点处被切割。
2.根据权利要求I所述的表达载体,其中所述第一蛋白切割位点由下述内含肽区段提供Pyrococcus abyssi、激烈火球菌或掘越氏火球菌0T3的Ion蛋白酶基因的内含肽区段;或Pyrococcus abyssi、激烈火球菌或詹氏甲烧球菌的klbA基因的内含肽区段;或分别源自它们的修饰的内含肽区段。
3.根据权利要求I所述的表达载体,其中所述内含肽区段或修饰的内含肽区段编码倒数第二位残基,所述残基是赖氨酸、丝氨酸或不是组氨酸。
4.根据权利要求I所述的表达载体,其中所述内含肽区段或修饰的内含肽区段能够被切割,但是不能使所述第一多肽与所述第二多肽完全相连。
5.根据权利要求I所述的表达载体,其中所述第一蛋白切割位点是由下述内含肽区段提供:包含选自SEQ ID NO :1、3、4、6、7、55、35、37和39的序列的内含肽区段,和源自它们的修饰的内含肽区段。
6.根据权利要求1-5中任一项所述的表达载体,其中所述第一多肽和第二多肽能够多聚装配。
7.根据权利要求1-6中任一项所述的表达载体,其中所述第一多肽和第二多肽中的至少一种能够胞外分泌。
8.根据权利要求1-7中任一项所述的表达载体,其中所述第一多肽和第二多肽中的至少ー种具有哺乳动物起源。
9.根据权利要求1-8中任一项所述的表达载体,其中所述第一多肽包含免疫球蛋白重链或其功能片段,且所述第二多肽包含免疫球蛋白轻链或其功能片段,且所述第一多肽是在所述第二多肽的上游。
10.根据权利要求1-9中任一项所述的表达载体,所述载体仅包含一个所述信号肽核酸序列。
11.根据权利要求1-10中任一项所述的表达载体,所述表达载体另外包含编码第三多肽的第三核酸序列和编码第二蛋白切割位点的第二插入核酸序列;其中所述第二插入核酸序列和第三核酸序列以该次序可操作地位于所述第二核酸序列之后。
12.根据权利要求1-11中任一项所述的表达载体,其中所述第一多肽和所述第二多肽包含功能抗体或其它抗原识别分子;其中抗原特异性指向结合选自下述的抗原=TNFa (肿瘤坏死因子-a )、促红细胞生成素受体、RSV > EL/选择蛋白、白介素-I、白介素-12、白介素-13、白介素-18、白介素-23、白介素-33、CD81、CD19、IGF1、IGF2、EGFR、CXCL-13、GLP-1R、前列腺素E2和淀粉样蛋白3。
13.根据权利要求1-12中任一项所述的表达载体,其中所述第一多肽和第二多肽包含ー对免疫球蛋白链,它们来自D2E7、EL246、ABT-007、ABT-325或ABT-874的抗体。
14.根据权利要求1-13中任一项所述的表达载体,其中所述第一多肽和第二多肽各自独立地选自免疫球蛋白重链或免疫球蛋白轻链区段,它们来自D2E7、EL246、ABT-007、ABT-325、ABT-874或其它抗体的类似区段。
15.根据权利要求1-14中任一项所述的表达载体,其中所述载体另外包含所述插入物的启动子调控元件。
16.根据权利要求15所述的表达载体,其中所述启动子调控元件是诱导型或组成型。
17.根据权利要求15所述的表达载体,其中所述启动子调控元件是组织特异性的。
18.根据权利要求15所述的表达载体,其中所述启动子包含腺病毒主要晩期启动子。
19.ー种宿主细胞,其包含根据权利要求1-18中任ー项所述的载体。
20.根据权利要求19所述的宿主细胞,其中所述宿主细胞是原核细胞。
21.根据权利要求20所述的宿主细胞,其中所述宿主细胞是大肠杆菌。
22.根据权利要求19所述的宿主细胞,其中所述宿主细胞是真核细胞。
23.根据权利要求22所述的宿主细胞,其中所述真核细胞选自原生生物细胞、动物细胞、植物细胞和真菌细胞。
24.根据权利要求23所述的宿主细胞,其中所述真核细胞是选自下述的动物细胞哺乳动物细胞、禽细胞和昆虫细胞。
25.根据权利要求24所述的宿主细胞,其中所述宿主细胞是哺乳动物细胞系。
26.根据权利要求24所述的宿主细胞,其中所述宿主细胞是CHO细胞或ニ氢叶酸还原酶-缺陷型CHO细胞。
27.根据权利要求24所述的宿主细胞,其中所述宿主细胞是COS细胞或HEK细胞。
28.根据权利要求23所述的宿主细胞,其中所述宿主细胞是酵母细胞。
29.根据权利要求28所述的宿主细胞,其中所述酵母细胞是酿酒酵母。
30.根据权利要求24所述的宿主细胞,其中所述宿主细胞是草地贪夜蛾Sf9昆虫细胞。
31.一种用于生产重组多蛋白或多种蛋白的方法,所述方法包括在足以允许载体蛋白表达的条件下,在培养基中培养根据权利要求19所述的宿主细胞。
32.根据权利要求31所述的方法,所述方法另外包括回收和/或纯化所述载体蛋白。
33.根据权利要求31-32中任一项所述的方法,其中所述多种蛋白能够多聚装配。
34.根据权利要求31-33中任一项所述的方法,其中所述重组多蛋白或多种蛋白是生物学上有功能的和/或治疗性的。
35.ー种用于生产重组产物的方法,其中所述产物是免疫球蛋白蛋白质或其功能片段、装配的抗体或其它抗原识别分子,所述方法包括在足以生产所述重组产物的条件下,在培养基中培养根据权利要求19所述的宿主细胞。
36.根据权利要求31-35中任一项所述的方法生产的蛋白。
37.根据权利要求31-36中任一项所述的方法生产的多蛋白。
38.根据权利要求31-37中任一项所述的方法生产的装配的免疫球蛋白、装配的其它抗原识别分子、或单个免疫球蛋白链或其功能片段。
39.根据权利要求38所述的免疫球蛋白、其它抗原识别分子或单个免疫球蛋白链或其功能片段,其中存在实现或促进特定抗原与下述物质的结合的能力肿瘤坏死因子_a、促红细胞生成素受体、RSV、EL/选择蛋白、白介素-I、白介素-12、白介素-13、白介素-18、白介素-23、白介素-33、CD81、CD19、IGFU IGF2、EGFR、前列腺素 E2、CXCL-13, GLP-IR 或淀粉样蛋白3。
40.根据权利要求39所述的免疫球蛋白或其功能片段,其中所述免疫球蛋白是D2E7或ABT-874,或者其中所述功能片段是它们各自的片段。
41.ー种药物组合物,其包含治疗有效量的根据权利要求36-40中任一项所述的蛋白和药学上可接受的载体。
42.根据权利要求1-18中任一项所述的表达载体,其另外包含编码标签的核酸序列。
43.根据权利要求1-18中任一项所述的表达载体,其中所述插入核酸序列另外编码标签。
44.ー种表达载体、具有所述载体的宿主细胞、载体表达产物、药物组合物和/或制备或使用前述任ー种的方法,其中所述载体是根据权利要求1-18中任ー项所述的载体,且另外包含编码轻链信号肽的区段。
45.根据权利要求44所述的载体、宿主细胞、载体表达产物、药物组合物和/或制备或使用方法,其中所述编码的轻链信号肽是选自下述的K轻链信号肽417318319326和H2G。
46.根据权利要求44所述的载体、宿主细胞、载体表达产物、药物组合物和/或制备或使用方法,其中所述编码的轻链信号肽是VKII K轻链信号肽A18,SEQ ID NO :82(氨基酸序列 MRLPAQLLGLLMLWIPGSSA)。
全文摘要
本发明的实施方案涉及用于表达多肽的载体构建体和方法,所述多肽包括多聚的产物,诸如治疗性抗体。特定构建体允许从单个开放读码框(sORF)制备表达产物。一个实施方案提供了用于产生一种或多种重组蛋白产物的分离的或纯化的表达载体,所述表达载体包含单个开放读码框插入物;所述插入物包含编码信号肽的信号肽核酸序列;编码第一多肽的第一核酸序列;编码第一蛋白切割位点的第一插入核酸序列,其中所述第一蛋白切割位点由火球菌属的lon蛋白酶基因的内含肽区段、或火球菌属或甲烷球菌属的klbA基因的内含肽区段、或源自它们的修饰的内含肽区段提供;和编码第二多肽的第二核酸序列。构建体和方法的某些实施方案采用Pyrococcus abyssi、激烈火球菌或掘越氏火球菌OT3的lon蛋白酶基因的内含肽区段;或Pyrococcus abyssi、激烈火球菌或詹氏甲烷球菌的klbA基因的内含肽区段;或其它内含肽区段。
文档编号C12P21/06GK102812040SQ201080061134
公开日2012年12月5日 申请日期2010年10月28日 优先权日2009年10月30日
发明者G·R·卡森, W·R·焦恩, Y·Z·库尼斯, W·F·莱斯三世, R·A·戴维斯-泰伯, E·冯 申请人:雅培制药有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1