包括sorf构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法

文档序号:432469阅读:729来源:国知局

专利名称::包括sorf构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法包括SORF构建体的多基因表达和使用多蛋白、前体蛋白和蛋白酶解的方法相关申请的交叉参考本申请要求2005年7月21日申请的U.S.临时申请No.60/701855的权益,在此以其整体引入作为参考。联邦政府资助研究或研发的声明不适用参照序列表,表格或计算机程序列表光盘附件不适用(提供了序列表,但不是作为光盘附件)。
背景技术
:本发明的领域是分子生物学,尤其总地涉及重组蛋白表达领域,特别是重组多蛋白(polyprotein)或前体蛋白(pre-protein)的表达和加工,包4舌翻i奪后加工。近些年来发现抗体作为诊断工具和治疗形态的使用日益增加。第一个FDA批准的单克隆抗体,OKT3(JohnsonandJohnson)批准用于治疗患有肾脏移植排斥的患者。在1998年批准了Herceptin(GenentechInc.的商标,SouthSanFrancisco,CA),—种人源化的单克隆抗体,用于治疗患有转移性乳癌的患者。各种基于抗体的治疗正显示出在临床研发的各个阶段中的希望。抗体技术广泛临床应用的一个限制是通常需要大量抗体用于治疗功效并且与充足生产相关的成本是相当大的。中国仓鼠卵巢(CHO)细胞和NS0黑素瘤细胞是最常用的哺乳动物细胞系,用于商业规模生产糖基化人蛋白,如抗体和其他生物治疗剂(Humphreys和Glover2001.Curr.Opln.DrugDis匿Devel.4:172-85)。哺乳动物细胞系生产通常在分批发酵罐中5-7天培养产生50-250mg/L,或在流加发酵罐中7-12天产生300-600mg/L。可以在酵母或大肠杆菌中成功地生产非糖基化的免疫球蛋白(参见,例如,HumphreysDP等,2000,ProteinExprpurify.20(2):252-64),然而,细菌表达系统中的大多数成功是抗体片段(Humphreys,D.P.2003.Curr.Opin.DrugDiscov.Devel.20036:188-96)。表达多个基因片段或基因领域中的重要发展是蛋白内含子的发现(参见,例如,Hirata,R等,1990,J.Biol.Chem.265:6726-6733;Kane,PM等,1990,Science250:651-657;Xu,M-Q和Perler,FB,1996,EMBOJournal15(19):5146-5153)。认为蛋白内含子是基因内含子的蛋白等价物并促进蛋白剪接。如SnellK的US7026526中所述的,蛋白剪接是切除前体蛋白(蛋白内含子)的内部片段并连接蛋白(蛋白外显子)的两侧片段形成成熟蛋白的过程。已经在来自原核生物和真核生物的多种蛋白质中观察到该过程(Perler,F.B.,Xu,M.Q.,Paulus,H.CurrentOpinioninChemicalBiology1997,1,292-299;Perler,F.B.NucleicAcidsResearch1999,27,346-347)。蛋白内含子单位含有催化蛋白质剪接需要的必需成分并通常含有参与蛋白内含子活动性的冲亥酸内切酶结构;或(Perler,F.B.NucleicAcidsResearch1994,22,1127-1127)。尽管基于蛋白内含子系统的主要焦点在于纯化技术的产生和来自表达基因片段的新融合蛋白,US7026526报道了具有修饰蛋白内含子的DNA构建体,用于表达作为分开蛋白质的多个基因产物来获得植物中的大量性状。然而,仍然缺乏的是那些系统可以成功地用于分开蛋白质表达的显示,所述分开的蛋白装配成功能性多亚基(multimeric)蛋白,胞外分泌的蛋白质,哺乳动物蛋白,或者真核宿主细胞中产生的蛋白。值得注意的是免疫球蛋白落入所有这些类别中。增加将US7026526的修饰蛋白内含子方法延伸至其他基因或目的的困难是与涉及的蛋白内含子系统相关的所需蛋白外显子基因片段引起的潜在重要性的认识。Paulus报道"实际上,蛋白质剪接,即使完全通过蛋白内含子来催化,可以受到蛋白质外显子序列的显著影响。这种影响通过嵌合蛋白剪接系统表达的事实显现出来,其中将蛋白内含子序列框内插入外源编码序列之间,通常导致实质性的副反应,如剪接连接的上游或下游处的裂解(XuM-Q等,1993,Cell75:1371-77;和ShingledeckerK等,1998,Gene207:187-95)。这表明了蛋白内含子呈现蛋白剪接最佳化结构的能力,而在特定蛋白外显子的范围内没有产生副反应。"参见PaulusH,2000,Proteinsplicingandrelatedformsofproteinautoprocessing(蛋白质剪接和相关形式的蛋白质自体力。工),Annu.Rev.Biochem.69:447-96。另一名评论员声称"尽管可能使用合理的设计将所需的特征和活性引入蛋白质中,使工程化的产物有效而可行需要的微妙改变通常仍是超越我们的预测能力(Shao,Z.和Arnold,F.H.1996,Curr.Opin.Struct.Biol.6,513-518)。无i仑如何,已经发现就在蛋白内含子两侧的片段影响剪接的效率(Chong,S.等,1998,NucleicAcidsRes.26,5109-5115;Southwrth,M.W.等,199,Biotechniques27,110-114)和一些蛋白宿主可能与蛋白内含子活性不相容。尽管高表达和产物纯度是重要的考虑因素,如果最终产物没有活性,那么它们是没有实际意义的。"参见,AmitaiG和Pietrokovski,1999,NatureBiotechnology17:854-855。因此,在其中优选结果是裂解而没有再连接的修饰蛋白内含子系统中,相对于给定蛋白内含子序列的外源蛋白外显子的存在影响实践上有效的精确裂解的组合,再连接的不存在和副反应的不存在。清楚修饰蛋白内含子方法适用于保留功能活性的特定蛋白质作为终产物例如免疫球蛋白和其他生物治疗剂的重组生产表示了对创新的实质性挑战。在本发明中,已经接受了该挑战,不仅用于基于蛋白内含子的系统,而且以先锋的意义研发用于关于hedgehog结构域的应用中。//Wge/zog家族中的蛋白质是脊稚动物胚胎模式化必需的胞内信号分子。参见,Mann,R.K.和Beachy,P.A.(2000)Biochim.Biophys.Acta.1529,188-202;Beachy,PA,(1997)ColdSpringHarbSympQuantBiol62:191-204。天然hedgehog前体蛋白通过与蛋白剪4妻相似的自体加工反应裂解成C-端(Hh-C)和N-端片段(Hh-N)。对于包括适于多个分开的蛋白片段表达的修饰形式的系统的创造性研发,Hedgehog系统呈现出未经试验的机会。之前使用单个载体通过重组DNA技术表达全长抗体/免疫球蛋白分子的尝试取得了有限的成功,通常导致抗体/免疫球蛋白分子的重链和轻链显著不同水平的表达,更特别地,对于第二种基因较低水平的表达。其他因素需要与另一条链相比较的一条链相对更高的表达水平,用于适当装配的多亚基抗体或其功能性片段的最佳化生产。因此,一个问题是形成全面低产量的装配的多亚基抗体的细胞内重链和轻链表达的次优化学计算法。Fang等指出为了从单个载体表达高水平的全部生物功能性抗体,需要重链和轻链的等摩尔表达(参见Fang等,2005,NatureBiotechnology23:584-590;US专利公开2004/0265955A1)。此外,依赖于独立表达多个多肽的载体系统的常规表达系统受到这些因素如启动子相互作用(例如,启动子干扰)的显著影响。这些相互作用可能损害基因的有效表达和/或所表达的链的装配,或需要使用多于一个的载体(参见,例如,US专利6331415,Cabilly等)。由于除了通常需要其他操作以外的潜在复杂化,失去一个或多个单独的载体,需要多个载体是不利的。限制从单个载体表达两个或多个编码序列能力的其他因素包括载体自身的包装能力。例如,在考虑合适的载体/编码序列中,待考虑的因素包括载体的包装能力(例如,对于腺相关病毒,AAV,大约4,500bp);重组蛋白通过载体转化的细胞或器官体外/体内表达的持续时间(例如,对于腺病毒载体的短期表达);如果使用病毒载体,支持载体有效感染的细胞类型;和所需的基因产物表达水平。两个或多个基因产物的受控表达和病毒载体如腺病毒和AAV的包装限制的需求限制了对于载体构建和用于特定基因如免疫球蛋白或其片段表达的系统的选择。从单个载体表达两个或多个蛋白质或多肽序列的更多方法中,在目标编码序列之间使用两个或多个启动子或单个启动子和内部核糖体进入位点(IRES)序列来驱动单个编码序列的表达。由于启动子干扰,单个载体内使用两个启动子导致低蛋白表达。当两个编码序列由IRES序列隔开时,第二个编码序列的翻译表达通常显著弱于第一个的(Furler等,2001,GeneTherapy8:864-873)。US专利公开2004/0241821描述了一种黄病毒,其中将异种编码序列掺入病毒多蛋白编码序列的下游,并通过IRES与其隔开。US专利公开2005/0026137中描述了用于重组基因表达的核锚定载体策略,包括其中片段通过蛋白酶识别位点隔开的融合蛋白。单个开放阅读框(sORF)中多蛋白形式的蛋白连接是在许多天然病毒包括小核糖核酸病毒科的复制中观察到的策略。翻译时,病毒编码的蛋白酶介导多蛋白的快速分子内(CIS)裂解来产生分开的成熟蛋白质产物。口蹄疫病毒(FMDV)是小核糖核酸病毒科内的一组,表达编码大约225kD多蛋白的单个长开放阅读框。全长翻译产物在衣壳蛋白前体(P1-2A)和多蛋白2BC和P3的复制结构域之间产生的2A片段的C-端处经历快速分子内(cis)裂解,并且该裂解是通过核糖体stutter机理由2A片段自身介导的(Ryan等,1991,J.Gen.Virol.72:2727-2732);Vakharia等,198887,J.Virol.61:3199-3207)。已经鉴定出通过FMDV2A片段表达裂解活性必需的氨基酸残基。还已经从aphthoviridae和小核糖核酸病毒科的cardioviridae表征了2A和相似的结构域(Donnelly等,1997,J.Gen.Virol.78:13-21)。仍然在使用蛋白酶解处理技术的其他尝试中,重组胰岛素生产的早期描述包括,例如,EP055945(Genentech);和EP037723(TheRegentsoftheUniversityofCalifornia)。然而,这是一个巨大的飞跃,能够在研发更大且更复杂的功能性蛋白如免疫球蛋白的重组表达中应用这些成果。功能性抗体分子的实例可以涉及需要四个或多个链装配的杂多聚体(例如,两个免疫球蛋白重链和两个轻链)。仍然存在需要可替换的和/或改进的表达系统,用于产生重组蛋白质。在全长免疫球蛋白及其抗原结合片段的有效和/或正确表达的领域中反映出特定的需要,其相对于目前可用的技术提供了优势。本发明通过提供单个构建体解决了这些需要,各自使用各种策略如蛋白内含子,hedgehog自体加工片段,自体催化病毒蛋白酶及其变化来提供单个构建体。独立地,通过调节亚基(例如,其片段的重链和轻链)的化学计算关系解决了有效多亚基(例如,免疫球蛋白)装配的需要。在实施方案中,sORF中的构建体编码自我加工的肽成分,用于表达工业上和生物上的功能性多肽,如酶,免疫球蛋白,细胞因子,趋化因子,受体,激素,两个杂交系统的成分,或其他目标多亚基蛋白。发明概述本发明提供了表达盒,载体,重组宿主细胞和用于重组多蛋白和前体蛋白的重组表达和加工的方法,包括翻译后加工。在一个实施方案中,本发明提供了用于产生一个或多个重组蛋白质产物的包括sORF插入片段的表达载体;所述sORF插入片段包括编码第一个多肽的第一个核酸序列,编码第一个蛋白裂解位点的干扰核酸序列和编码第二个多肽的第二个核酸序列;其中编码所述第一个蛋白裂解位点的所述干扰核酸序列可操纵地位于所述第一个核酸序列和所述第二个核酸序列之间;和其中所述表达载体能够表达在所述第一个蛋白裂解位点可裂解的sORF多肽。在一个实施方案中,第一个裂解位点包括自我加工裂解位点。在一个实施方案中,自我加工裂解位点包括蛋白内含子片段或修饰的蛋白内含子片段,其中修饰的(或未修饰的)蛋白内含子片段允许所表达的第一个多肽和所表达的第二个多肽的裂解但不允许所表达的第一个多肽和所表达的第二个多肽的完全连接。在一个实施方案,自我加工裂解位点包括hedgehog片段或修饰的hedgehog片段,其中修饰的(或未修饰的)hedgehog片段允许所表达的第一个多肽和所表达的第二个多肽的裂解。在一个实施方案中,表达多个分开的蛋白质(例如,第一个多肽,第二个多肽,第三个多肽等)。在一个实施方案中,第一个多肽和第二个多肽能够多亚基装配。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个是哺乳动物来源的。在一个实施方案中,提供了产生装配的抗体的载体和方法。在实施方案中,本发明提供了用于多个分开的蛋白质重组表达的构建体和方法。在特别的实施方案中,蛋白质能够胞外分泌。在特定的实施方案中,蛋白质是哺乳动物来源的。在特别的实施方案中,蛋白质能够多亚基装配。在特别的实施方案中,蛋白质是免疫球蛋白。在一个实施方案中,引入蛋白酶识别位点,可裂解的信号肽或自体加工多肽序列(包括来自果蝇,小鼠,人和其他物种的蛋白内含子,hedgehog的C-端自体力口工结构;或(Dassa等,TrendsinGenetics,Vol.20No.11Nov,2004,538-542;Ibrahim等,BiochimicaetBiophysicsActa1760(2006)347-355)。我们注意到在一些情况中,自体加工多肽序列可以称为与蛋白酶解处理有关的蛋白酶解位点。使用疣猪,土拨鼠的C-端自体加工结构域,和来自线虫如秀丽隐杆线虫(Caenorhabditiselegans)的其他含hog基因(SnellEA等,Proc.R.Soc.B(2006)273,401-407;Aspock等,GenomeReseach,1999,9:909-923);和来自领鞭毛虫(choanoflagellate)的Hoglet-C自体加工结构域(Aspock等,GenomeResearch,1999,9:909-923)。A-型细菌蛋白内含子样(BIL)结构域如来自细菌如热纤梭菌(Clostridiumthermocellum)的那些,和来自细菌如球形红细菌(Rhodobactersphaeroides)的B-型BIL结构域(Dassa等,JournalofBiologicalChemistry,Vol.279,No.31,My30,32001-32007),野生型,平截的,或其他修饰形式)进入重组前体蛋白序列中允许前体蛋白的有效表达和裂解,使得生物活性蛋白释放或使得多蛋白内表达的所需蛋白释放。该实施方案消除了前体蛋白的天然蛋白酶解处理酶的共表达的需要。或者,与特定识别位点同源的蛋白酶可以与前体蛋白序列共生(coextensively)表达,在蛋白酶识别位点之间,使得可以通过蛋白酶解作用释放蛋白酶,然后通过随后的蛋白酶解裂解释放前体蛋白的前体部分,使得释放前体蛋白的活性部分。再一个实施方案中,可以将2A自体蛋白酶解处理肽序列工程化至成熟(生物活性)部分和前体蛋白之间的前体蛋白中,使得表达后工程化的重组蛋白自我加工。在本发明的另一个实施方案中,本发明通过重组表达包括至少一个重链片段和至少一个轻链片段的多蛋白,提供了用于有效表达重组免疫球蛋白分子的方法,其中通过一个或多个介导多肽,hedgehog序列,其他蛋白内含子样或hedgehog样自体加工序列或其变化的裂解但不连接的蛋白酶识别位点,信号肽,蛋白内含子序列,或通过序列如在翻译过程中隔开两侧肽的2A肽隔开所述片段。再一实施方案中,可以作为多蛋白的一部分表达蛋白酶,通过蛋白酶识别位点从多蛋白的剩余物中分离出来,并且其中每个蛋白酶识别位点与伴随表达的蛋白酶同源。然后,蛋白酶解或信号肽酶作用从初级翻译产物释放蛋白酶和其他单个蛋白质。上述用于隔开多蛋白中蛋白亚基的方法也可以结合使用来获得所需的裂解和蛋白质表达结果。在免疫球蛋白表达实施方案的情况中,轻链编码片段的复制允许提高的装配和/或完整免疫球蛋白分子的表达,超过其中表达盒中存在轻链编码片段和/或表达载体与重链编码片段1:1比例的情况。在本发明的范围中,重链和轻链蛋白可以是天然产生的重链和轻链的功能性片段(功能性片段保持结合其对应抗体链的能力,并且还保持结合同源抗原的能力,如本领域公知的)。因此,本发明提供了构建体和方法,其中轻链组分与重链组分的编码片段比例为1:l或高于l:1。例如,在一个实施方案中,L:H比例是2:l或高于2:1;在其他实施方案中,比例为3:1、3:2、4:l或高于4:1。在本发明的优选方面中,轻链免疫球蛋白编码序列或其组成片段在多蛋白编码序列内复制,并且重链和轻链免疫球蛋白编码序列以约2个轻链比约一个重链的摩尔比存在,并以高于l:1轻链重链的比例表达。轻链和重链在多蛋白中通过蛋白酶裂解位点,信号(或前导)肽,蛋白内含子或自我加工位点连接。用于在多蛋白翻译产物及其识别序列内隔开生物活性蛋白组分的蛋白酶(内蛋白酶)和信号肽酶及其识别位点的氨基酸序列包括,但不限于,弗林蛋白酶(furin),RXR/K-R(SEQIDNO:1);IPNV的VP4,S/TXA-S/AG(SEQIDNO:2);烟草蚀刻病毒(Tobaccoetchvirus)(TEV)蛋白酶,EXXYXQ-G(SEQIDNO:3);鼻病毒的3C蛋白酶,LEVLFQ-GP(SEQIDNO:4);PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶,DDDDK-X(SEQIDNO:5);因子Xa蛋白酶,IE/DGR-X(SEQIDNO:6);凝血酶,LVPR画GS(SEQIDNO:7);genenaseI,PGAAH-Y(SEQIDNO:8);和MMP蛋白酶;芜菁花叶病毒(turnipmosaicpotyvirus)的核内含体蛋白a(Nla);4型登革热(DEN4)黄病毒的NS2B/NS3,黄热病毒(YFV)的NS3蛋白酶;花椰菜花叶病毒(cauliflowermosaicvirus)的ORFV;和KEX2蛋白酶,MYKR-EAD(SEQID)。另一种内部裂解位点选择是CB2。用连字符显示识别序列内发生裂解的位置。在一个实施方案中,所用的信号序列是野生型的,突变的或随机突变的并通过使用本领域已知技术的筛选来选择。上述本发明范围内还有表达盒,其中特定的多蛋白或前体蛋白(前体蛋白,多蛋白)编码序列可操纵地连接转录调控序列,表达载体和含有表达载体或表达盒的重组宿主细胞。本发明提供了用于表达全长免疫球蛋白或其片段的系统,基于在单个启动子的转录控制下重链和轻链编码序列的表达,其中通过蛋白内含子或修饰的蛋白内含子(其裂解但不连接释放的蛋白分子,或可以修饰抗体或其他侧翼蛋白序列,使得防止蛋白的连接),或通过来自果蝇,小鼠,人和其他物种的hedgehog的C-端自体加工结构域,或通过来自疣猪,土拨鼠的C-端自体加工结构域和线虫如秀丽隐杆线虫的含hog基因介导的重链和轻链的隔开。Hoglet-C自体加工结构域来自领鞭毛虫,或通过A-型细菌蛋白内含子样(BIL)结构域如来自细菌如热纤梭菌的那些,和来自细菌如球形红细菌的B-型BIL结构域。用于本发明中的蛋白内含子包括,但不限于酿酒酵母(Saccharomycescerevisiae)VMA,古菌(Pyrococcus),集月包藻(Synechocystis)牙口其他本领域已知的蛋白内含子。还可以通过自我加工裂解位点,例如,2A或2A样序列来介导重链和轻链的隔开。在一个方面中,本发明提供了用于表达重组免疫球蛋白的载体,其包括可操纵地连接用于免疫球蛋白分子第一链或其片段的编码序列,编码自我加工裂解位点的序列和用于免疫球蛋白分子第二链或其片段的编码序列的启动子,其中将编码自我加工裂解位点的序列插入用于免疫球蛋白分子第一链的编码序列和用于免疫球蛋白分子第二链的编码序列之间。免疫球蛋白分子的第一或第二链中的任一个可以是重链或轻链,并且编码重组免疫球蛋白的序列可以是全长编码序列或其片段。对应于轻链的第二个片段通过蛋白酶识别位点,信号肽或自我加工位点如2A位点与邻近的片段隔开。存在两个轻链序列的拷贝和H链序列的一个拷贝(或各自的多个拷贝),附带条件是每个抗体链成分具有合适的加工位点或与其相关的序列,只要产生正确加工的抗体链。载体可以是任何能够表达全长多肽例如免疫球蛋白分子或其片段的重组载体,例如,质粒载体,尤其是适用于哺乳动物细胞中基因表达的载体,用于在昆虫细胞中表达的杆状病毒载体,腺相关病毒(AAV)载体,慢病毒载体,逆转录病毒载体,可复制型腺病毒载体,复制缺陷型腺病毒载体和gutless腺病毒载体,肝炎病毒载体或非病毒载体(质粒)。自我加工裂解位点包括2A肽序列,例如,源自口^帝疫病毒(FMDV)的2A序列。再一优选的方面中,载体包括编码位于免疫球蛋白分子第一链或其片段的编码序列和免疫球蛋白分子第二链或其片段的编码序列之间(即,邻接自我加工裂解位点如2A裂解位点的序列)并且还邻接第二个轻链序列的其他蛋白裂解位点的序列。在一个示例性的方法中,其他的蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQIDNO:1)的弗林蛋白酶裂解位点。使用自我加工肽的重组免疫球蛋白的载体包括任一种启动子,其中启动子是组成型的,可调控或可诱导的,细胞类型特异性的,组织特异性的或物种特异性的。载体可以进一步包括编码免疫球蛋白链,前体蛋白等的一个或多个编码序列的信号序列的序列。本发明进一步提供了用载体感染的宿主细胞或宿主细胞的稳定克隆,该载体包括编码免疫球蛋白(即抗体)重链和轻链的序列;编码自我加工裂解位点的序列;并可以进一步包括编码其他蛋白酶解位点的序列,和任选通过自我加工位点或蛋白酶识别位点将蛋白酶编码片段与剩余的编码序列相似地隔开。本发明范围内还包括这样的细胞或克隆在产生全长重组免疫球蛋白或其片段的用途。合适的宿主细胞包括,但不限于,昆虫培养的细胞,如草地贪夜蛾(Spod叩terafrugiperda)细胞,微生物,包括细菌,酵母细胞,如酿酒酵母或甲醇酵母(Pichiapastoris),真菌长口里氏木霉(Trichodermareesei),曲霉属(Aspergillus),Aureobasidum和青霉属种,以及哺乳动物细胞如中国仓鼠卯巢(例如,CHO画Kl,ATCCCCL61;CHODG44;Chasin等,1986,Som.Cell.Molec.Genet.12:555),幼仓鼠肾脏(BHK-21,BHK-570,ATCCCRL8544,ATCCCRL10314),COS,小鼠胚胎(NIH-3T3,ATCCCRL1658),Vero细胞(非洲绿猴肾脏,以ATCCCRL1587获得),犬肾脏细胞(例如,MDCK,ATCCCCL34),大鼠垂体细胞(GHl,ATCCCCL34),特定的人细胞系,包括人胚胎肾脏细胞(例如,HEK293,ATCCCRL1573),也可以使用各种转基因动物系统,包括但不限于,猪,小鼠,大鼠,绵羊,奶牛。用于在蛋清中表达的小鸡系统和用于在奶中表达的转基因绵羊,山羊和奶牛系统是已知的。植物细胞也适于用作宿主细胞。在相关的方面中,本发明提供了通过这样的细胞或克隆产生的重组免疫球蛋白分子或其片段及其生产方法,其中免疫球蛋白包括源自自我加工裂解位点,信号肽,蛋白内含子,含hogC-端自体加工基因,细菌蛋白内含子样(BIL)结构域或蛋白酶识别序列的氨基酸。在使用蛋白内含子的情况中,优选修饰的蛋白内含子,使得两个抗体链没有剪接在一起形成单个多肽链或抗体多肽的末端,使得它们不能通过蛋白内含子剪接在一起。将蛋白内含子作为框内融合体置于N-蛋白外显子和C-蛋白外显子之间,例如,在免疫球蛋白重链和免疫球蛋白轻链之间,附带条件是蛋白内含子和/或多蛋白初级翻译产物的连接最接近的氨基酸序列导致裂解来释放蛋白外显子,但是没有产生这些蛋白外显子蛋白的连接。本发明进一步提供了使用位于第一个表达的蛋白部分和第二个蛋白部分之间的hedgehog蛋白加工结构域的翻译后蛋白加工策略。任选可以将hedgehog蛋白加工结构域(Hh-C)截断来删除胆固醇转移部分,使得只发生蛋白裂解。在没有发生Hh-C完全切除的情况中,在第二个蛋白部分的N-端包括信号肽结构域可以允许成熟的第二个蛋白与Hh-C/第一个蛋白部分的蛋白酶解隔开。非天然产生的重组DNA分子也包括在本发明这个方面的范围内,该分子包括编码多蛋白的序列,该多蛋白包括置于第一个表达的蛋白部分编码序列和第二个蛋白部分编码序列之间的hedgehog蛋白加工结构域,使得通过从单个信号翻译来产生多蛋白。本发明另外一个发面是修饰的弗林蛋白酶,其特征在于将靶向新合成的弗林蛋白酶蛋白的肽片段添加至内质网的内腔。还包括蛋白内含子或修饰的蛋白内含子策略,如在此所列的。本发明的另一个方面是将多蛋白/自我加工,蛋白内含子加工,信号肽裂解或蛋白酶解裂解方法应用至双杂交和三杂交(和变体)技术。第一个和第二个或第一个,第二个和第三个蛋白在合适的宿主细胞中作为多蛋白从单个转录产物表达,并且通过自我加工位点(例如,2A),蛋白内含子,信号肽或通过蛋白酶识别位点隔开这些蛋白的编码序列。该策略消除了与多于一个载体共转染或通过表达单个转录产物的每个蛋白的需要,因为可以方便地进行,使用本发明的结果是存在提高的经济,有效性和蛋白表达,以及可能的结合在相互的近端内,认为这提高了相互相关的结合伴侣的可能性。在特定的实施方案中,多蛋白包括诱斜蛋白,和自我加工,蛋白内含子,信号肽或蛋白酶识别序列和插入的cDNA片段,其表示一个或多个与目标诱何蛋白相互作用的潜在猎物蛋白。图8和9中以图解显示了这种克隆和表达策略。在一个实施方案中,本发明提供了用于在细胞中表达多个基因产物的DNA构建体,包括在构建体5'端的单个启动子,包括两个或多个编码隔开蛋白的蛋白外显子序列的含蛋白内含子单体,和一个或多个与每个蛋白外显子序列的羧基端编码部分融合的蛋白内含子序列,除了最后一个待表达的蛋白外显子序列;和3'端序列,包括最后一个蛋白外显子蛋白编码序列后的多腺苷酸化信号;其中作为前体蛋白表达含蛋白内含子的单体,该前体蛋白含有至少一个两侧为蛋白外显子编码的蛋白的蛋白内含子;其中至少一个蛋白内含子可以催化蛋白外显子的切除;并优选,含蛋白内含子单体中其中至少一个氨基酸残基得到置换,或将至少一个氨基酸残基添加至含蛋白内含子单体,使得切除的蛋白外显子没有通过蛋白内含子连接。在特定的实施方案中,构造构建体,其中至少两个蛋白外显子序列,作为蛋白质表达时,能够以多亚基装配相连。在一个实施方案中,至少两个蛋白外显子序列能够编码免疫球蛋白或其他抗原识另ii分子。在一个实施方案中,至少一个蛋白外显子序列,作为蛋白质表达时,能够胞外分泌。在一个实施方案中,至少一个蛋白外显子序列是哺乳动物基因。在实施方案中,本发明提供了使用修饰或非修饰的蛋白内含子表达免疫球蛋白的构建体和方法,其中表达的免疫球蛋白片段没有再连接/融合,因此允许从多个亚基产生装配的抗体。在特定的实施方案中,修饰的蛋白内含子包括位于c-蛋白外显子第一个位置的氨基酸残基的改变。在特定的实施方案中,在蛋白内含子片段内的第二个至最后一个氨基酸存在改变。在实施方案中,本发明提供了用于任何基因或基因组合表达的构建体和方法。在特定的实施方案中,c-蛋白外显子是修饰的。再一特定的实施方案中,c-蛋白外显子是使用信号序列修饰的。另一特定实施方案中,存在末端c-蛋白外显子组分的缺失。在实施方案中,本发明提供了用于抗体基因表达的构建体和方法,使用用于免疫球蛋白第二个链(重链或轻链)的修饰信号肽,并且如果使用第三个,将其置于蛋白内含子或hedgehog自体加工结构域后。在一个实施方案中,片段的次序如下第一个链-第一个蛋白内含子或hedgehog-第一个修饰的信号肽-第二个链-第二个修饰的信号肽-第三个链(在两个链的情况中,例如,省略第三个链或"第二个修饰的信号肽-第三个链,,片段)。在另一个实施方案中,在第二个链之后包括第二个蛋白内含子或hedgehog片段。在特定的实施方案中,使用这样的修饰信号肽产生提高的抗体分泌。在一个实施方案中,修饰所用的信号肽来降低疏水性。在一个实施方案中,信号肽是未修饰的。在实施方案中,提供sORF载体用于瞬时表达。在其他实施方案中,在稳定的表达系统中提供sORF载体。在一个实施方案中,按照本领域已知的,例如,通过转染和其他技术,生产稳定的宿主细胞。尽管在此特意公开了许多示例构建体用于肿瘤坏死因子a(alpha)特异性抗体的表达,应当理解可以使用相同的策略容易地制备构建体,使用编码其他蛋白的序列的置换。特定实施例包括其他免疫球蛋白和生物治疗分子。更多特定的实施例包括E/L选择素、白细胞介素-12、白细胞介素-18或促红细胞生成素特异性的抗体,或本领域可用氨基酸序列和/或编码序列所需特异性的任何其他抗体。在一个实施方案中,本发明提供了用于产生一个或多个重组蛋白产物的包括sORF插入片段的表达载体;所述sORF插入片段包括编码第一个多肽的第一个核酸序列,编码第一个蛋白裂解位点的第一个插入核酸序列,和编码第二个多肽的第二个核酸序列;其中将编码所述第一个蛋白裂解位点的所述插入核酸序列可操纵地置于所述第一个核酸序列和所述第一个核酸序列之间;并且其中所述表达载体能够表达在所述第一个蛋白裂解位点可裂解的sORF多肽。在一个实施方案中,所述第一个蛋白裂解位点包括自我加工裂解位点。在一个实施方案中,自我加工裂解位点包括蛋白内含子片段或修饰的蛋白内含子片段,其中修饰的蛋白内含子片段允许所述第一个多肽和所述第二个多肽的裂解但不容许所述第一个多肽和所述第二个多肽的完全连接。在一个实施方案,自我加工裂解位点包括hedgehog片段或修饰的hedgehog片段,其中修饰的hedgehog片段允许所述第一个多肽和所述第二个多肽的裂解。在一个实施方案中,第一个多肽和第二个多肽能够多亚基装配。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个能够胞外分泌。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个是哺乳动物来源的。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白重链或其功能片段。在一个实施方案中,所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白轻链及其功能片段。在一个实施方案中,所述第一个多肽包括免疫球蛋白重链或其功能片段和所述第一个多肽包括免疫球蛋白轻链或其功能片段;并且其中所述第一个和第二个多肽合在一起能够以多亚基装配结合来形成功能性抗体或其他抗原识别分子。在一个实施方案中,所述第一个多肽是所述第二个多肽的上游。在一个实施方案中,所述第二个多肽是所述第一个多肽的上游。在一个实施方案中,表达载体进一步包括编码第三个多肽的笫三个核酸序列,其中将所述第三个核酸序列可操纵地置于所述第二个核酸序列之后;并且其中所述第三个序列可以独立地与所述第一个或第二个核酸序列中的任一个相同或不同。在一个实施方案中,所述第一个,第二个和第三个多肽中的至少两个合在一起能够以多亚基装配结合。在一个实施方案中,表达载体进一步包括编码第二个蛋白裂解位点的第二个插入核酸序列,其中将所述第二个插入核酸序列可操纵地置于所述第一个和所述第二个核酸序列之后;并且其中所述第二个干预序列可以与所述第二个插入核酸序列相同或不同。在一个实施方案中,表达载体进一步包括编码第三个多肽的第三个核酸序列,和编码第二个多肽裂解位点的第二个插入核酸序列;其中将第二个插入核酸序列和第三个核酸序列以该次序可操纵地置于所述第二个核酸序列之后。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白重链,轻链或其代表性的功能片段。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白或其功能片段。在一个实施方案中,所述第三个核酸序列编码免疫球蛋白或其功能片段。在表达载体的一个实施方案中,所述编码第一个蛋白裂解位点的所述第一个插入核酸序列包括编码信号肽裂解位点或修饰的信号肽裂解位点序列的信号肽核酸。在一个实施方案中,表达载体进一步包括编码信号肽裂解位点的信号肽核酸序列,可操纵地置于所述第一个核酸序列或所述第二个核酸序列之前。在一个实施方案中,表达载体进一步包括两个信号肽核酸序列,每个独立地编码信号肽裂解位点,其中将一个信号肽核酸序列可操纵地置于编码所述第一个多肽的所述第一个核酸之前,并将连一个信号肽核酸序列可操纵地置于编码所述第二个多肽的所述第二个核酸之前。在实施方案中,两个信号肽序列是相同或不同的。在一个实施方案中,信号肽核酸序列编码免疫球蛋白轻链信号肽裂解位点或修饰的免疫球蛋白轻链信号肽裂解位点。在一个实施方案中,信号肽核酸序列编码修饰的或未修饰的免疫球蛋白轻链信号肽裂解位点,并且其中所述修饰的位点能够实现裂解并提高所述第一个多肽,所述第二个多肽和所述第一个和第二个多肽的装配分子中至少一个的分泌;并且其中在所述信号肽位点存在下的分泌水平比所述信号肽位点不存在下的分泌水平高约10%至高约ioo倍。在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括蛋白内含子或修饰的蛋白内含子序列选自极端嗜热古菌(Pyrococcushorikoshii)PhoPolI序歹'J,酉良酒酵母(saccharomycescerevisiae)VMA序列,集胞藻(Synechocystis)林PCC6803DnaE序歹'J,蟾虫余分枝杆菌(Mycobacteriumxenopi)GyrA序歹'J,古菌(Pyrococcus)种GB-DDNA聚合酶,A型细菌蛋白内含子样(BIL)结构域和B-型BIL。在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括hedgehog家族成员的C-端自体加工结构域,其中hedgehog家族成员来自果蝇,小鼠,人或其他昆虫或动物物种。在一个实施方案中,编码第一个蛋白裂解位点的插入核酸序列包括来自疣猪,土拨鼠的C-端自体加工结构域,或来自线虫的其他含hog基因,或来自领鞭毛虫的Hoglet结构域。在一个实施方案中,第一个和所述第二个多肽包括功能性抗体或其他抗原识别分子;抗原特异性指导结合选自以下的抗原肿瘤坏死因子-a,促红细胞生成素受体,RSV,EL/选择素,白细胞介素-1,白细胞介素-12,白细胞介素-13,白细胞介素-18,白细胞介素-23,CXCL-13,GLP-1R和淀粉状蛋白p。在一个实施方案中,第一个和第二个多肽包括一对来自D2E7,ABT-007,ABT-325,EL246或ABT-874抗体的免疫球蛋白链。在一个实施方案中,第一个和笫二个多肽各自独立地选自来自D2E7,ABT-007,ABT-325,EL246,ABT-874或其他抗体的类似片段的免疫球蛋白重链或免疫球蛋白轻链。在一个实施方案中,载体进一步包括用于所述sORF插入片段的启动子调控元件。在一个实施方案中,所述启动子调控元件是诱导型或组成型的。在一个实施方案中,所述启动子调控元件是组织特异性的。在一个实施方案中,所述启动子包括限病毒主要晚期启动子。在一个实施方案中,载体进一步包括编码能够裂解所述第一个蛋白裂解位点的蛋白酶的核酸。在一个实施方案中,将编码蛋白酶的所述核酸可操纵地置于所述sORF插入片段内;所述表达载体进一步包括编码位于编码蛋白酶的所述核酸与所述第一个核酸和所述第二个核酸中至少一个之间的第二个裂解位点的其他核酸。在一个实施方案中,本发明提供了包括在此所述载体的宿主细胞。在一个实施方案中,宿主细胞是原核细胞。在一个实施方案中,所述宿主细胞是大肠杆菌。在一个实施方案中,所述宿主细胞是真核细胞。在一个实施方案中,所述真核细胞选自原生动物细胞,动物细胞,植物细胞和真菌细胞。在一个实施方案中,所述真核细胞是选自哺乳动物细胞,鸟类细胞和昆虫细胞的动物细胞。在优选的实施方案中,所述宿主细胞是CHO细胞或二氬叶酸还原酶缺陷CHO细胞。在一个实施方案中,所述宿主细胞是COS细胞。在一个实施方案中,所述宿主细胞是酵母细胞。在一个实施方案中,所述酵母细胞是酿酒酵母。在一个实施方案中,所述宿主细胞是昆虫草地贪夜蛾Sf9细胞。在一个实施方案中,所述宿主细胞是人胚胎肾脏细胞。在一个实施方案中,本发明提供了用于生产重组多蛋白或多个蛋白的方法,包括在足以使载体蛋白表达的条件下在培养基中培养宿主细胞。在一个实施方案中,该方法进一步包括收集和/或纯化所述载体蛋白。在一个实施方案中,所述多个蛋白能够多亚基装配。在一个实施方案中,重组多蛋白或多个蛋白在生物上是功能性的和/或治疗性的。在一个实施方案中,本发明提供了生产免疫球蛋白或其功能片段,装配的抗体或其他抗原识别分子的方法,包括在足以产生免疫蛋白或其功能片段,装配的抗体,或其他抗原识别分子的条件下在培养基中培养根据权利要求38的宿主细胞。在一个实施方案中,本发明提供了根据在此的方法产生的蛋白或多蛋白。在一个实施方案中,本发明提供了根据在此的方法产生的装配的免疫球蛋白;装配的其他抗原识别分子;或单个免疫球蛋白链或其功能片段。在一个实施方案中,免疫球蛋白;其他抗原识别分子;或单个免疫球蛋白链或其功能片段具有实现或促进特定的抗原结合肿瘤坏死因子-a,促红细胞生成素受体,白细胞介素-18,EL/选择素或白细胞介素-12的能力。在一个实施方案中,免疫球蛋白是D2E7或其中功能片段是D2E7的片段。在一个实施方案中,本发明提供了包括蛋白质和药物学上可接受载体的药物组合物或药物。按照本领域公知的选择用于药物制剂的赋形剂和载体。在一个实施方案中,本发明提供了表达载体,其中第一个蛋白裂解位点包括细胞蛋白酶裂解位点或病毒蛋白酶裂解位点。在一个实施方案中,所述第一个蛋白裂解位点包括由以下蛋白酶识别的位点弗林蛋白酶;IPNV的VP4;烟草蚀刻病毒(TEV)蛋白酶;鼻病毒的3C蛋白酶;PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶;因子Xa蛋白酶;凝血酶;genenaseI;MMP蛋白酶;芜菁花叶病毒的核内含体蛋白a(Nla);4型登革热黄病毒的NS2B/NS3,黄热病毒的NS3蛋白酶;花椰菜花叶病毒的ORFV;KEX2蛋白酶;CB2;或2A。在一个实施方案中,所述第一个蛋白裂解位点是病毒内部可裂解信号肽裂解位点。在一个实施方案中,所述病毒内部可裂解信号肽裂解位点包括来自C型流感病毒,丙肝病毒,汉坦病毒,黄病毒或风渗病毒的位点。在一个实施方案中,本发明提供了用于双杂交系统蛋白表达的方法,其中所述双杂交系统包括诱饵蛋白和候选猎物蛋白,所述方法包括以下步骤提供其中已经引入编码多蛋白的表达载体的宿主细胞,该多蛋白包括诱辨蛋白部分和候选猎物蛋白部分,通过自我加工裂解序列,信号肽序列或蛋白酶裂解序列来隔开所述部分;在允许多肽和多肽的自我加工或蛋白酶裂解表达的条件下培养宿主细胞。在一个实施方案中,多蛋白进一步包括三杂交系统的可裂解组分。在一个实施方案中,表达载体不含有2A序列。在一个实施方案中,提供了表达载体,其中所述第一个蛋白裂解位点包括FMDV2A序列;类白JUA,小;fe^i^玄西会病毒#+.界.老病Lr刑i^;We^毒,4!体虫或;^每;f西热袍菌(thermatogamaritima)的2A样结构域。在一个实施方案中,本发明提供了用于表达重组蛋白的表达载体,包括多蛋白的编码序列,其中多蛋白包括至少第一个和第二个蛋白片段,其中通过蛋白裂解位点隔开所述蛋白片段,其中蛋白裂解位点包括自我加工肽裂解序列,信号肽裂解序列或蛋白酶裂解序列;并且其中所述编码序列在宿主细胞中是可表达的并且在宿主细胞内得到裂解。在一个实施方案中,本发明提供了表达载体,其中插入核酸序列另外编码标记物。结合附图时,将从本发明以下为公开目的而提供的描述中清楚本发明的其他方面,特征和优势。通常,在此所用的术语和短语具有本领域已知的意思,可以通过参考本领域技术人员已知的标准教科书,杂志参考和内容来找到。在此提供的定义用来明确它们在本发明范围内的特定用途。不希望受到任何特定理论的束缚,在此存在与本发明相关的基础原理或机理的看法或理解的讨论。认识到与任何解释或假设的最终正确性无关,无论如何,本发明的实施方案是可操作的和有用的。附图简述图1说明了优选的稳定sORF表达载体构建体。图2说明了优选的稳定sORF表达载体构建体,进一步包括编码第二个蛋白裂解位点(其可以是自体加工位点)的另外的(第二个)干预核酸和编码第三个多肽的第三个核酸。这样的载体能够表达多于两个多肽。图3说明了优选的瞬时sORF表达载体构建体,(例如,pTT3-HC-Ssp-GA-int-LC-0aa)。图4说明了含有用于双杂交系统的2A片段的表达载体。将表达载体结构化来作为GAL4::诱辨::2A肽融合体翻译第一个诱何蛋白,其在2A肽翻i奪后自我加工。图5是图4质粒(带有2A裂解的2-杂交系统)表达片段的扩大的线性图。图6说明了用于免疫球蛋白表达的基于蛋白内含子的sORF载体。图7说明了用于装配多亚基分子如抗体表达的具有选定点突变的几个sORF构建体。图8说明了具有改变的信号肽的sORF构建体,例如,修饰的免疫球蛋白轻链信号肽。图9说明了使用hedgehog自我加工结构域的sORF构建体。发明详述可以通过以下的描述和非限制性实施例来进一步理解本发明。本发明提供了用于表达结构或生物活性蛋白如酶,激素(例如,胰岛素),细胞因子,趋化因子,受体,抗体或其他分子的系统,例如,构建体和方法。优选,蛋白质是免疫调节蛋白,如白细胞介素,全长免疫球蛋白,其片段,其他抗原识别分子,如本领域所知的,或其他生物治疗分子。这样系统的综述是基于单个启动子转录控制下的重链和轻链编码序列的表达,其中单个翻译产物(多肽)转化成分开的重链和轻链是通过翻译过程中核糖体处的蛋白内含子,含-hog自我加工结构域,隔开侧翼肽的2A或2A-样序列来介导的或是位于成熟生物活性蛋白的两条链之间的一个或多个蛋白酶识别序列处的蛋白酶解加工的结果。干预位点(不管是与蛋白内含子片段,hog结构域,2A或2A-样相关,还是与蛋白酶识别位点相关,以及各自的变化)可以称为裂解位点。在表达三个或多个蛋白片段的情况中,这样的裂解位点可以位于多个片段的至少任意两个之间,或裂解位点可以位于每个片段之后,任选并优选不在最后一个片段之后。如果使用多个裂解位点,每一个可以与另一个相同或与另一个无关。在一个方面中,本发明提供了用于表达重组免疫球蛋白的载体,其包括启动子,该启动子可操纵地连接用于免疫球蛋白分子第一链或其片段的编码序列,编码自我加工或其他蛋白酶解裂解位点的序列和用于免疫球蛋白分子第二链或其片段的编码序列,其中将编码自我加工或其他蛋白酶解裂解位点的序列插入免疫球蛋白分子第一链的编码序列和免疫球蛋白分子第二链的编码序列之间,和第三个片段,编码免疫球蛋白轻链,也通过自我加工或其他蛋白酶解裂解位点与剩余的多蛋白隔开。在一个实施方案中,免疫球蛋白分子的第一或第二链可以是重链或轻链。编码重组免疫球蛋白片段的序列可以是全长编码序列或其片段。在特定的实施方案中,第二个轻链编码序列必须是编码本发明实践中加工的多蛋白的序列的一部分;即,合在一起存在三个片段,包括两个轻链和一个重链,以任何次序。在特定的实施方案,用这些组分并且以这种次序构造构建体a)IgH-IgL;b)IgL國IgH;c)IgH画IgL画IgL;d)IgL-IgH-IgL;e)IgL-IgL隱IgH;f)IgH-IgH-IgL;g)IgH-IgL-IgH;和/或h)IgL-IgH-IgH。在一个实施方案中,连字符表示其中安置裂解^f立^、,歹i!的4立i。或者,免疫球蛋白重链和轻链编码序列与其中存在的蛋白内含子编码序列框内融合,蛋白内含子是修饰的,使得缺乏剪接活性或设计重链和轻链的末端使得优选不发生剪接或使得发生效率差的剪接,使得主要为未剪接的抗体分子。此外,修饰的蛋白内含子可以进一步修饰,仍然进一步使得不存在核酸内切酶片段(其中之前已经将核酸内切酶片段切除),附带条件是保留位点特异性蛋白酶解裂解活性,使得轻链和重链抗体多肽与初级翻译产物的干预蛋白内含子部分分离开来。轻链或重链抗体多肽中任一个可以是N-蛋白外显子,并且任一个可以是C-蛋白外显子。载体可以是能够表达全长多蛋白的任何重组载体,例如,腺相关病毒(AAV)载体,慢病毒载体,逆转录病毒载体,可复制型腺病毒载体,复制缺陷型腺病毒载体和gutless腺病毒载体,肝炎病毒载体或非病毒载体(质粒)或任何其他本领域已知的载体,选择适用于其中表达免疫球蛋白或其他蛋白的宿主细胞的载体。杆状病毒载体可用于在昆虫细胞中表达基因。各种载体是本领域已知的,并且许多是可购得的或另外本领域易于获得的。裂解位点优选的自我加工裂解位点包括蛋白内含子序列;修饰的蛋白内含子;hedgehog序列;其他hog家族序列;2A序列,例如,源自口蹄疫病毒(FMDV)的2A序列;和各自的变化。其识别序列可以由2A序列替代的蛋白酶包括,但不限于,弗林蛋白酶,靶向内质网而不是反式Golgi网的修饰弗林蛋白酶,IPNV的VP4,TEV蛋白酶,核定位信号缺陷TEV蛋白酶(TVENls-),鼻病毒的3C蛋白酶,PC5/6蛋白酶,PACE蛋白酶,LPC/PC7蛋白酶,肠激酶,Xa蛋白酶,凝血酶,genenasel,MMP蛋白酶,如上所讨i仑的。用于本发明实践中的其他内蛋白酶是包括但不限于以下的蛋白酶,芜菁花叶病毒的核内含体蛋白a(Nla)(Kim等,1996,Virology221:245-249);4型登革热(DEN4)黄病毒的NS2B/NS3(Falgout等,1993,J.Virol.67:2034-2042;Lai等,1994,Arch.Virol.Suppl.9:359-368),黄热病毒(YFV)的NS3蛋白酶(Chambers等,1991,J.Virol.65:6042-6050);花椰菜花叶病毒的ORFV(Torruella等,1989,EMBOJournal8:2819-2825);蛋白内含子,其实例是Psp-GBDPol蛋白内含子(Xu,M.Q.1996,EMBO15:5146-5153);内部可裂解信号肽,其实例是C型流感病毒的内部可裂解信号肽(PekoszA,1992,Proc.Natl.Acad.Sci.USA95:3233-13238);和KEX2蛋白酶,MYKR-EAD(SEQIDNO:9);KEX2和耙向ER的修饰KEX2(参见,Chaudhuri等,1992,Eur.J.Biochem.210:811-822)。唯一针对ER的修饰KEX2具有各自如表7A和7B中给出的编码序列和氨基酸序列;将其称为KEX2-sol-KDEL。已经将来自酿酒酵母的KEX2初级氨基酸序列进行修饰,在蛋白的C端除去膜相关结构域和添加ER靶向序列KDEL。用于裂解含有合适裂解识别位点的多蛋白的其他人蛋白酶包括US专利公开2005/0112565中歹寸出的那些。来自黑腹果蝇(Z>o^//n7awe/a脂g"Wer)的sonichedgehog蛋白,尤其是来自其的加工结构域,也可用来从多蛋白初级翻译产物分离蛋白。在本发明范围内的是修饰的弗林蛋白酶,其瞄准内质网(ER)而不是反式Golgi网(TGN),因为这是天然产生的弗林蛋白酶。Vorhees等,1995,EMBOJournal14:4961-4975,描述了弗林蛋白酶(氨基酸775-778)的EEDE(SEQIDNO:10)部分,如涉及蛋白酶瞄准TGN(Nakayama等,1997,Biochem.Journal327:625-635)。Zerangue等,2001,Proc.Natl.Acad.Sci.USA98:2431-2436报道了ER运输信号,包括蛋白C端的KKXX。因此,研发修饰的弗林蛋白酶并用来将弗林蛋白酶裂解活性瞄准替代TGN或添加至TGN的ER间隔并在间隔之后。再一方面中,载体包括编码位于免疫球蛋白分子第一链或其片段的编码序列和免疫球蛋白第二和/或第三链(例如,第一或第二链的复本)或其片段的编码序列之间(即,邻接裂解位点序列,其可以是2A裂解位点)的序列。在一个示例性的方法中,另外的蛋白酶解裂解位点是具有一致序列RXK(R)R(SEQIDNO:1)的弗林蛋白酶裂解位点。包括启动子的调控序列;宿主细胞用于重组免疫球蛋白或其他蛋白表达的载体包括本领域已知的多种启动子中的任一种,其中启动子是组成型的,可调控或可诱导的,细胞类型特异性的,组织特异性的,或物种特异性的。更多特定的实施例包括,例如,四环素-应答性启动子(GossenM,BujardH,ProcNatlAcadSciUSA.1992,15;89(12):5547-51)。载体是适于其中表达嵌合基因的宿主细胞的复制子,并且理想地其还包括在细菌细胞中功能性的复制子,有利地,细菌细胞是大肠杆菌,这是用于分子生物学操作的常规细胞。用于基因表达的宿主细胞是,但不限于,动物细胞,尤其是哺乳动物细胞,或可以是微生物细胞(细菌,酵母,真菌,但优选真核的)或植物细胞特别合适的宿主细胞包括昆虫培养的细胞,如草地贪夜蛾细胞,酵母细胞,如酿酒酵母或曱醇酵母,真菌,如里氏木霉(Trichodermareesei),曲霉属(Aspergillus),Aureobasidum和青霉属种,以及哺乳动物细胞如CHO(中国仓鼠卵巢),BHK(幼仓鼠肾脏),COS,293,3T3(小鼠),Vero(非洲绿猴)细胞,也可以使用各种转基因动物系统,包括但不限于,猪,小鼠,大鼠,绵羊,山羊,奶牛。用于在蛋清中表达的小鸡系统和用于在奶中表达的转基因绵羊,山羊和奶牛系统是已知的。杆状病毒尤其是AcNPV载体可以用于本发明的单ORF抗体表达和裂解,例如,在昆虫细胞系中在多hedrin启动子或其他强启动子的调控控制下的表达;这样的载体和细胞系是本领域公知的并可购得。哺乳动物细胞中所用的启动子可以是组成型的(肝炎病毒TK启动子,McKnight,Cell31:355,1982;SV40早期启动子,Benoist等,Nature290:304,1981;巨细胞病毒启动子,Foeking等,Gene45:101,1980;小鼠乳癌病毒启动子,总地参见EtcheverryinProteinEngineering:PrinciplesandPractice,Cldand等编辑,pp.162-181,Wiley&Sons,1996)或调控型的(例如,亲金属蛋白启动子,Hamer等,J.Molec.A卯l.Genet.1:273,1982)。载体可以是基于感染特定哺乳动物细胞的病毒,尤其是逆转录病毒,牛痘和腺病毒及其本领域已知并可购得的衍生物。启动子包括,但不限于,巨细胞病毒,后期腺病毒和牛痘7.5K启动子。酵母和真菌载体(参见,例如,VandenHandel,C等(1991)In:Bennett,J.W.和Lasure,L.L.(编辑),MoreGeneManipulationsinFungi(真菌中的更多基因操作),AcademyPress,Inc.,NewYork,397-428)和启动子也是公知的并可广泛获得。烯醇酶是公知的组成型酵母启动子,并且乙醇脱氢酶是公知的调控型启动子。特定启动子,转录终止序列和其他任选序列如编码组织特异性序列的序列的选择,很大程度上由其中需要表达的细胞类型所决定的。可以是细菌,酵母,真菌,哺乳动物,昆虫,小鸡或其他动物细胞。信号序列将其引入载体中的待裂解的,蛋白酶解加工或自我加工的蛋白的编码序列,可以进一步包括一个或多个编码一个或多个信号序列的序列。这些编码的信号序列与多蛋白内一个或多个成熟片段相关。例如,编码免疫球蛋白重链前导序列的序列可以在重链编码序列之前,可操纵地在框内连接剩余的多蛋白编码序列。相似地,轻链前导肽编码序列或其他前导肽编码序列可以框内连接一个或两个免疫球蛋白轻链编码序列,前导序列链由来自自我加工位点(如2A)的邻接链或由编码蛋白酶识别序列的序列隔开,保持合适的阅读框。免疫球蛋白重链和轻链的化学计算在此的许多实施方案中,免疫球蛋白/抗体轻链(IgL)和重链(IgH)在宿主细胞内以约1:1比例(IgL:IgH)以载体水平或表达的胞内水平存在。而在此和别处的重组方法依赖于重链和轻链的等摩尔表达(参见,例如,US专利公开2005/0003482A1或国际公开WO2004/113493),在其他实施方案中,本发明提供了具有2:1比例轻链和重链编码序列的方法和表达盒和载体,当初级翻译产物是多蛋白时,并与链的自我加工或蛋白酶解加工共表达。在实施方案中,比例高于l:1,如约2:l或高于2:1。在特定的实施方案中,以高于l:l的比例使用轻链编码序列(IgL:IgH)。在特定的实施方案中,IgL:IgH的比例是2:1。本发明进一步提供了用载体转化或感染的宿主细胞或宿主细胞的稳定克隆,该载体包括编码免疫球蛋白(即,抗体)的重链和任一个或至少两个轻链的序列;编码其中的裂解位点,如自我加工,蛋白酶识别位点或信号肽的序列;并可以进一步包括编码其他蛋白酶解裂解位点的序列。本发明的范围内还包括该细胞或克隆在产生全长重组免疫球蛋白或其片段或其他由多个亚基构成的生物活性蛋白中的用途(例如,双链或多链分子或作为前体蛋白天然产生并裂解或加工来释放前体衍生的蛋白和活性部分的那些)。非限制实例包括胰岛素,白细胞介素-18,白细胞介素-1,骨形态发生蛋白4,骨形态发生蛋白2,任何其他双链骨形态发生蛋白,神经生长因子,肾素,凝乳蛋白酶,转化生长因子卩和白细胞介素l卩。在相关的方面中,本发明提供了通过这样的细胞或克隆产生的重组免疫球蛋白,分子或其片段或其他蛋白,其中免疫球蛋白包括源自自我加工裂解位点(如蛋白内含子或hedgehog结构域),裂解位点或信号肽裂解的氨基酸,并提供了用于生产这些的方法,载体和宿主细胞。在实施方案中,本发明提供了含有一个或多个在此所述的构建体的宿主细胞。本发明提供了用于表达免疫球蛋白分子或其片段的单个载体构建体和用于体外或体内使用的方法。载体在第一个和第二个之间以及在第二个和第三个免疫球蛋白编码序列之间具有自我加工或其他蛋白酶识别序列,允许功能性抗体分子的表达,使用单个启动子和转录产物。示例性载体构建体包括开放阅读框之间编码自我加工裂解位点的序列,并可以进一步包括与自我加工裂解位点邻接的其他蛋白酶解裂解位点,用于在裂解后除去包括自我加工裂解位点的氨基酸。载体构建体发现在一些方法中的实用性,这些方法关于全长生物活性免疫球蛋白或其片段在体外和体内提高的生产。尽管理解不需要链的编码序列相对于其他链的编码序列以高于1的比例存在,可以使用相同的策略制得具有至少两个不同链的其他生物活性蛋白。尽管在此具体举例说明了特定的组成和方法,理解许多可替换组成和方法中的任一个是合适的并且适用于实践本发明。还理解可以使用本领域中的标准方法进行本发明的多蛋白表达盒和载体,宿主细胞和方法的评价。本发明的实践将使用,除非另外指出,细胞生物学,分子生物学(包括重组技术),微生物学,生物化学和免疫学的常规技术,这些在本领域技术人员的范围内。这样的技术在文献中得到全面地解释,如,MolecularCloing:ALaboratoryManual,第二版,(Sambrook等,1989);OligonucleotideSynthesis(M.J.Gait编辑,1984);AnimalCellCulture(R.I.Freshney编辑,1987);MethodsinEnzymology(AcademicPress,Inc.);HandbookofExperimentalImmunology(D.M.Weir&C.C.Blackwell编辑);GeneTransferVectorsforMammalianCells(J.M.Miller&M.P.Calos编辑,1987);CurrentProtocolsinMolecularBiology(F.M.Ausubel等,编辑,1993);PCR:ThePolymeraseChainReaction,(Mullis等,编4辱,1994);禾口CurrentProtcolsinImmunology(J.E.Coligan等,编辑,1991),在此将每篇特意引入作为参考。除非另外指出,在此所用的所有术语具有本领域技术人员所知的技术,这些在本领域技术人员的知识范围内。在此通常所用的术语"修饰的"在蛋白质的范围内指的是其中参照分子内至少一个氨基酸残基被置换,删除或添加的片段。相似地,在核酸范围内,术语指的是其中参照分子内至少一个核酸残基被置换,删除或添加的片段。如在此所用的术语"蛋白内含子"通常指的是促进其自身去除并实现称为蛋白外显子的侧翼片段连接的蛋白质的内部片段。在多种类型的生物体中认识到蛋白内含子的许多实例,在一些情况中,具有共有的结构和/或功能特征。本发明宽泛地能够使用蛋白内含子,或其变体,如现在已知的或进一步认识或发现的。参见,例如,GogartenJP等,2002,AnnuRevMicrobiol.2002;56:263-87;Perler,F.B.(2002),InBase,theInteinDatabase.NucleicAcidsRes.30,383-384(还通过互联网在NewEnglandBiolabs,Inc.,Ipswich,MA的网址http:〃www.neb.com/neb/intein.htm1;AmitaiG等,MolMicrobiol.2003,47(1):61-73;GorbalenyaAE,NucleicAcidsRes.1998;26(7):1741-1748。非典型蛋白内含子)。在蛋白质中,含有蛋白内含子单位或蛋白内含子剪接单位可以理解为包括两翼蛋白外显子的部分,其中结构方面可以促进裂解,连接等的反应。术语还可以理解为关于基于蛋白内含子系统的一个类别,该系统具有"修饰的蛋白内含子"组分。如在此所用的术语"修饰的蛋白内含子,,可以指和成的蛋白内含子或天然蛋白内含子,其中蛋白内含子剪接单位中至少一个氨基酸残基被置换,删除,或添加,使得裂解的或切除的蛋白外显子没有通过蛋白内含子完全连接。如在此所用的术语"hedgehog"指的是基因家族(和相应的蛋白片段),成员具有影响自体蛋白酶解功能的结构。家族成员包括,例如,来自果蝇,小鼠,人和其他物种的类似物。此外,术语"hedgehog片段,,不仅用来包括这样的家族成员,而且宽泛地涉及疣猪,土拨鼠的自体加工结构域和来自线虫如秀丽隐杆线虫的其它含hog-基因,和来自领鞭毛虫的Hoglet-C自体加工结构域。参见,例如,PerlerFB.Proteinsplicingofinteinsandhedgehogautoproteolysis:structure,function,andevolution(蛋白内含子和hedgehog自体蛋白酶解的蛋白质剪接结构,功能和评价),Cell.1998,92(1):1-4;Koonin,EV等,(1995)AProteinsplice-junctionmotifinhedgehogfamilyproteins.(hedgehog家族蛋白中蛋白剪接-连接基序)TrendsBiochemSci.20(4):141-28;HallTM等,(1997)CrystalstructureofaHedgehogautoprocessingdomain:homologybetweenHedgehogandself-splicingproteins.(Hedgehog自体加工结构域的晶体结构Hedgehog和自我剪接蛋白之间的同源性)Cell91(1):85-97;SnellEA等,Proc.R.Soc.B(2006)273,401-407;Aspock等,GenomeResearch,1999,9:909-923。Hedgehog片段的特定实例是来自黑腹果蝇的somehedgehog蛋白。术语还可以理解为关于基于hedgehog系统的一个类别,该系统具有"修饰的hedgehog"组分。术语"修饰的hedgehog"片段可以指和成的hedgehog片段或天然hedgehog片段,其中hedgehog剪接单位中的至少一个氨基酸残基被置换,删除或添加,使得裂解的蛋白没有完全连接。如在此所用的术语"载体"指的是DNA或RNA分子,如质粒,病毒或其他载体,其含有一个或多个异种或重组DNA序列并设计用于不同宿主细胞之间的转移。术语"表达载体"和"基因治疗载体"指的是将异种DNA片段有效引入细胞中并表达的任何载体。克隆或表达载体可以包括其他元件,例如,表达载体可以具有两个复制系统,因此允许其在两个有机体中得到维持,例如,在用于表达的人细胞中和用于克隆和扩增的原核宿主中。可以使用任何合适的载体,该载体将核酸有效引入细胞中,使得蛋白或多肽表达,例如,病毒载体或非病毒载体。用于表达的任何有效细胞,例如,昆虫细胞和真核细胞,如酵母或哺乳动物细胞可用于本发明实践中。术语"异种DNA"和"异种RNA"指的是不是细胞内源(天然)的核酸或其中存在它们的基因组或载体的一部分。通常,通过转导,感染,转染,转化,电穿孔,基因枪转化等将异种DNA或RNA加入细胞中。这样的核普酸通常包括至少一个编码序列,但是编码序列不需要得到表达。术语"异种DNA"可以指"异种编码序列"或"转基因"。如在此所用的,术语"蛋白质,,和"多肽"可以交替使用,并通常指的是使用本发明的含自我加工裂解位点的载体表达的目标"蛋白质"和"多肽"。这样的"蛋白质"和"多肽"可以是用于研究,诊断或治疗目的的任何蛋白质或多肽,如以下进一步所述的。如在此所用的,多蛋白是设计用于加工产生两个或多个多肽产物的蛋白质。如在此所用的,术语"多聚体"指的是由两个或多个多肽链(有时候称为"亚基,,)构成的蛋白质,其装配形成功能蛋白。多聚体可以由两个(二聚体),三个(三聚体),四个(四聚体)或更多(例如,五聚体等)肽链构成。多聚体可以由自我装配而得,或者需要成分,如催化剂来帮助装配。多聚体可以只由相同的肽链构成(同型-多聚体),或两个或多个不同的肽链构成(异型多聚体)。这样的多聚体可以在结构上或化学上是功能性的。许多多聚体是本领域已知并使用的,包括但不限于酶,激素,抗体,细胞因子,趋化因子和受体。同样,多聚体可以具有生物(例如药物)和工业(例如,生物加工/生物生产)用途。如在此所用的,术语"标记物"指的是肽,可以将其引入表达载体中,其可以用来允许一个或多个载体插入片段的表达产物的删除和/或纯化。这样的标记物是本领域公知的并包括放射性标记的氨基酸或连接可以通过标记的抗生物素蛋白(例如,含有可以通过光学或比色方法检测的荧光标记或酶活性的抗生蛋白链菌素)检测的生物素部分的多肽。亲和性标记物如FLAG,谷胱甘肽-S-转移酶,麦芽糖结合蛋白,纤维素结合结构域,硫氧还蛋白,NusA,mistin,几丁质结合结构域,角质酶,AGT,GFP和广泛使用的其它标记物,如蛋白表达和纯化系统中所用的。用于多肽的更多非限制性实例包括,但不限于以下的组氨酸标记物,放射性同位素或放射性核素(利如,3H,"C,35S,90Y,"Tc,川In,125I,177Lu,166Ho或153Sm);焚光标记物(例如,FITC,若丹明,镧系磷),酶标记物(例如,辣根过氧化物酶,萤光素酶,碱性磷酸酶);化学发光标记物;生物素基团;由第二报告子识别的悬垂多肽抗原决定部位(例如,亮氨酸拉链对序列,用于二抗的结合位点,金属结合结构域,抗原决定部位标记物);和磁性试剂,如钆螯合物。如在此所用的关于本发明病毒基因治疗载体的术语"复制缺陷"意思是病毒载体不能能够独立地进一步复制和包装其基因组。例如,用rAAV病毒粒子感染患者的细胞时,在感染的细胞中表达异种基因,然而,由于感染的细胞缺乏AAVrep和cap基因以及辅助功能基因的事实,rAAV不能复制。如在此所用的,"逆转录转移载体"指的是包括编码转基因的核苷酸序列并进一步包括载体包装必需的核苷酸序列的表达载体。优选,逆转录转移载体还可以包括在细胞中表达转基因的必需序列。如在此所用的,"包装系统"指的是一套包括编码病毒蛋白的基因的构建体,该病毒蛋白涉及重组病毒的包装。通常,最终将包装系统的构建体引入包装细胞中。如在此所用的,"第二代,,慢病毒载体系统指的是缺乏功能性辅助基因的慢病毒包装系统,如已经从其删除或灭活辅助基因,vif,vpr,vpu和nef的一种。参见,例如,Zufferey等,1997,Nat.Biotechnol.15:871-875。如在此所用的,"第三代,,慢病毒载体指的是居有第二代载体系统的特征并进一步缺乏功能性tat基因的慢病毒包装系统,如已经从其删除或灭活tat基因的一种。参见,例如,Dull等,1998,J.Virol.72:8463-8471。如在此关于病毒或病毒载体所用的,"假模的"指的是天然病毒包膜蛋白由异种或功能上修饰的病毒包膜蛋白的替代。如在此关于重组DNA构建体或载体所用的术语"可操纵地连接"意思是重组构建体或载体的核普酸成分通常相互共价连接。通常,"可操纵地连接"DNA序列是邻接的,并且在分泌前导的情况中,是邻接的并且在相同阅读框内。然而,增强子不必须与表达得到上调的序列邻接。术语与可操纵地安置相一致。增强子序列影响启动子依赖性基因表达并可以位于天然基因的5,或3,片段中。"增强子"是刺激或抑制邻接基因转录的顺式作用元件。已知转录的增强子也称为"沉默子"。增强子可以以任一方向,离开编码序列和离开转录片段的下游位置高达几千碱基对(kb)的距离起作用(即,可以与编码序列相关)。此外,绝缘子和染色质开放序列,如基质连接片段(Chung,Cell,1993,Aug,13:74(3):505-14,Frisch等,GenomeResearch,2001,12:349-354,Kim等,J.Biotch107,2004,95-105)可以用来提高稳定整合的基因盒的转录。如在此所用的,术语"基因"或"编码序列"意思是可操纵地连接合适的调控序列时,在体外或体内转录(DNA)和翻译(mRNA)成多肽的核酸序列。基因可以包括或不包括编码序列之前和之后的片段,例如,5'未翻译的(5'UTR)或"前导,,序列和3,UTR或"尾巴"序列,以及单个编码片段(外显子)之间的干预序列(内含子)。"启动子"是指导RNA聚合酶的结合并因此促进RNA合成的DNA序列,即,足以指导转录的最小序列。启动子和相应的蛋白质或多肽表达可以是细胞特异性的,组织特异性的或物种特异性的。本发明的核酸构建体或载体中还包括的是增强子序列,其可以与启动子序列邻接或不邻接。如在此宽泛使用的"转录调控序列"或表达控制序列包括启动子序列和物理上相连的序列,其调节或调控相连编码序列的转录,通常应答营养或环境信号。那些相连的序列可以决定组织或细胞特异性表达,应答环境信号,提高或降低转录的蛋白的结合等。"调控型启动子"是任何其活性受顺或反作用因子(例如,诱导型启动子,其通过外部信号或试剂激活)影响的启动子。"組成型启动子"是指导许多或全部组织/细胞类型在大部分时间的RNA产生的任何启动子,例如,人CMV即时早期增强子/启动子片段,其促进哺乳动物细胞中克隆的DNA插入片段的组成型表达。术语"转录调控蛋白","转录调控因子"和"转录因子"在此可交替使用,并指的是结合DNA应答元件并因此在转录上调控相关基因表达的核蛋白。转录调控蛋白通常直接结合DNA应答元件,然而,在一些情况中,与DNA的结合可以是间接的,通过结合另一个蛋白,该蛋白随后结合或被结合DNA应答元件。如在此所用的,"内部核糖体进入位点"或"IRES"指的是促进指导内部核糖体进入顺反子(蛋白质编码片段)的启动密码子如ATG的元件,因此导致基因的cap自主翻译。参见,例如,JacksonR.J.等,1990,TrendsBiochemSci15:477-83)禾口JacksonR.J.矛口Kaminski,A.1995,RNAl:985-1000。在此所述的实施例与任何IRES元件的使用相关,IRES元件能够促进指导内部核糖体进入顺反子的启动密码子。如在此所用的"在IRES的翻译控制下"意思是翻译与IRES相关并以cap-自主方式进行。例如,可以通过隔开单个编码序列的IRES翻译重链和两个轻链编码序列,不需要蛋白酶解或自我加工来将两个链相互隔开。将"自我加工裂解位点,,或"自我加工裂解序列"在此定义为翻译后或共翻译加工裂解位点序列。如"自我加工裂解"位点或序列指的是DNA或氨基酸序列,在此通过2A位点,序列或结构域或2A样位点,序列或结构域来举例说明。如在此所用的,将"自我加工肽"在此定义为编码自我加工裂解位点或序列的DNA序列的肽表达产物,其在翻译时,介导包括自我加工裂解位点的蛋白或多肽的快速分子内(cis)裂解,来产生分开的成熟蛋白或多肽产物。如在此所用的,术语"其他的蛋白酶解裂解位点"指的是一种序列,将该序列引入本发明表达载体的邻接自我加工裂解位点,如2A或2A样序列,并且该序列提供了除去由自我加工裂解序列裂解后保留的其他氨基酸的方式。在此描述了示例性"其他的蛋白酶解裂解位点"并包括但不限于,具有一致序列RXK/R-R的弗林蛋白酶裂解位点。可以通过内源枯草杆菌蛋白酶样蛋白酶裂解这样的弗林蛋白酶裂解位点,如蛋白分泌途径内的弗林蛋白酶和其他丝氨酸蛋白酶。如在此所用的,术语"免疫球蛋白"和"抗体"指的是完整的蛋白质及其片段,如Fa,F(ab,)2和Fv,其能够结合目标抗原性决定因子。这样的"免疫球蛋白"和"抗体"由两个分子量大约23,000的相同多肽轻链和两个分子量53,000-70,000的相同重链构成。通过二碌"定以"Y"构造连接四条链。将重链分类为y(IgG),n(IgM),(x(IgA),5(IgD)或s(IgE)并且是免疫球蛋白分类命名的基础,其决定了给定抗体的效应物功能。将轻链分类为K和x。在此参照"免疫球蛋白或其片段"时,将理解这样的"其片段"是免疫上功能性的免疫球蛋白片段,尤其是结合其同源配体的一种,具有完整免疫球蛋白至少10%的结合亲和性。抗体的Fab片段是抗体分子的单价抗原结合片段。Fv片段通常是工程化的片段,含有表达为两个链的轻链可变区和重链可变区。术语"人源化抗体,,指的是其中已经替代了非抗原结合片段中一个或多个氨基酸的抗体分子,以便更接近地象人抗体,同时仍然保持抗体最初的结合活性。参见,例如,U.S.专利No.6,602,503。如在此所用的术语"抗原决定因子"指的是接触特定抗体的分子的片段(即,抗原决定部位)。蛋白或肽或蛋白或糖蛋白的糖肽的各种片段可以诱导特异性结合蛋白的给定片段或三维结构的抗体的产生。将这些片段或结构称为抗原决定因子或抗原决定部位。抗原决定因子可以与完整的抗原(即,用于引发免疫应答的免疫原)竟争与抗体的结合。当涉及本发明的重组蛋白或多肽时,术语"片段"意思是具有与相应的全长蛋白或多肽的氨基酸序列部分但不是全部相同的氨基酸序列的肽或多肽,其保留相应的全长蛋白或多肽的至少一种功能或活性。片段优选包括全长蛋白或多肽的至少20-100个邻接氨基酸残基。如在此所用的术语"给予"或"引入"意思是通过本领域已知的途径将蛋白质(包括免疫球蛋白)传送至需要的人或动物。药物载体和制剂或组合物也是本领域公知的。给予途径包括静脉内,肌内,皮内,皮下,经皮,粘膜,腔内或粘膜。或者,这些术语可以指用于重组蛋白表达的载体至细胞或至培养物中的细胞和或至患者的细胞或器官的传送。这样的给予或引入可以发生在体内,体夕卜或离体(exvivo)。可以通过转染,感染或转导将用于重组蛋白或多肽表达的载体引入细胞中,转染通常意思是通过物理方式(例如,磷酸钙转染,电穿孔,微注射或脂质转染)将异种DNA插入细胞中;感染,通常意思是通过感染剂即病毒的引入;转导,通常意思是用病毒稳定感染细胞或将来自一个微生物的基因组材料通过病毒剂(即,噬菌体)转移至另一个微生物。"转化"通常用来涉及包括异种DNA的细菌或表达致癌基因并已经转化成连续生长模式的细胞,例如,肿瘤细胞。用来"转化"细胞的载体可以是质粒,病毒或其他载体。通常,根据用于异种DNA(即,载体)的给予,引入或插入细胞中的方式,将细胞称为"转导的","感染的","转染的"或"转化的"。术语"转导的","转染的"和"转化的"在此可交替使用,与异种DNA的引入方式无关。如在此所用的,术语"稳定转化的","稳定转染的"和"转基因"指的是具有整合至基因组的非天然(异种)核酸序列的细胞。通过由子细胞群构成的细胞系或克隆的建立来证明稳定的转染,该子细胞含有通过整合至它们的基因组或作为游离序列稳定复制的转染DNA。在一些情况中,"转染"不是稳定的,即,是瞬时的。在瞬时转染的情况中,表达内源或异种DNA,然而,引入的细胞没有整合至基因组中或宿主细胞不能复制。如在此所用的,"离体(exvivo)给予"指的是其中从患者获取初级细胞,将载体给予细胞来产生转导的,感染的或转染的重组细胞并将重组细胞再次给予相同或不同患者的过程。"多顺反子转录产物"指的是含有多于一个蛋白质编码片段或顺反子的mRNA分子。包括两个编码片段的mRNA称为"双顺反子转录产物"。"5'-近端"编码片段或顺反子是其翻译启动密码子(通常是AUG)最接近多顺反子mRNA分子的5,端编码片4殳。"5,远端"编码片段或顺反子是其翻译启动密码子(通常是AUG)不是最接近mRNA5,端编码片段启动密码子的编码片段或顺反子。术语"5'-远端"和"下游"涉及不邻接mRNA分子的5'端的编码片段时可同义使用。如在此所用的,"共转染"意思是两个(或多个)开放阅读框或编码片段或多核普酸在信号转录控制或包括启动子的调控序列的转录控制下。如在此所用的术语"宿主细胞"指的是已经用载体转导,感染,转染或转化的细胞。载体可以是质粒,病毒颗粒,噬菌体等。培养条件,如温度,pH等,是之前用于选定的用于表达的宿主细胞的那些,并且是本领域技术人员清楚的。将认识到术语"宿主细胞"指的是最初转导的,感染的,转染的或转化的细胞及其子代。如在此所用的,术语"生物活性"和"生物上活性的"指的是归因于培养物中细胞系中或无细胞系统中的特定蛋白质的活性,如ELISA平板中的配体-受体测试。"免疫球蛋白","抗体"或其片段的"生物活性"指的是结合抗原决定因子并因此促进免疫功能的能力。激素或白细胞介素的"生物活性"是本领域已知的。如在此所用的,术语"肿瘤"和"癌症"指的是在正常生长和/或发育中呈现出至少部分失去控制的细胞。例如,常见的肿瘤或癌细胞通常已经失去了接触抑制并可能是入侵性的和/或具有转移的能力。抗体是免疫球蛋白,其是重链和轻链的杂二聚体。典型的抗体是具有连在一起的两个重链和两个轻链(或其功能片段)的多聚体。抗体可以具有更多的多聚结构次序,二聚体,三聚体,四聚体,五聚体等,通常取决于同型(isotype)。非常难以证明它们在哺乳动物培养物表达系统中从单个载体或从两个载体表达全长形式。几种方法目前用于生产抗体动物的体内免泉来产生"多克隆,,抗体,B细胞杂交瘤的体外细胞培养来产生单克隆抗体(Kohler等,1988,Eur.J.Immunol.6:511;Antibodies:ALaboratoryManual,ColdSpringHarborLaboratory,1988;在此引入作为参考)和重组DNA技术(例如,描述于Cabilly等,US专利No.6331415,在此引入作为参考)。公知免疫球蛋白多肽的基础分子结构包括两个分子量大约23,000道尔顿的相同轻链和两个分子量53,000-70,000的相同重链,其中四条链以"Y"构型通过二硫键连接。氨基酸序列从Y顶端的N-端至每条链底部的C-端。在N-端是可变区(大约100个氨基酸长),其提供了抗原结合的特异性。本发明涉及用于生产所有类型的免疫球蛋白的改良方法,包括但不限于,具有天然序列(即,应答抗原刺激产生的序列)的全长抗体和抗体片段,合并单个稳定折叠多肽链中重链和轻链的抗原结合可变区的单链抗体;单价抗体(其包括结合第二个重链的Fc片段的重链/轻链二聚体);"Fab片段",其包括免疫球蛋白分子的全部"Y"片段,即,"Y"的分支,单独的轻链或重链,或其部分(即,一个重链和一个轻链的组合体,通常称为Fab,);"杂交免疫球蛋白",其具有两个或多个不同抗原的特异性(例如,quadromas或双特异性抗体,如US专利No.6,623,940中所述的);"合成的免疫球蛋白",其中重链和轻链模拟来自不同物种或特征的那些;和"嵌合抗体",其中重链和轻链氨基酸序列的每个部分源自多于一个物种(即,可变区源自一个来源,如鼠抗体,而不变区源自另一个来源,如人抗体)。在免疫球蛋白或其片段的生产中发现本发明的组合物和方法的实用性,其中重链和轻链是"哺乳动物","嵌合"或修饰的方式来提高其功效。修饰的抗体包括保持未修饰形式的相同生物活性的氨基酸和核酸序列和已经修饰使得活性改变的那些,即,不变区的改变提高了补体结合,与膜的相互作用,和其他效应物功能,或可变区的改变提高了抗原结合特性。本发明的组合物和方法可以进一步包括催化免疫体"免疫球蛋白氨基酸序列,其通过参照多肽序列的一个或多个氨基酸得到改变。以下该相同的讨论适用于其他目标生物活性蛋白序列(及其编码序列)。变体多核苷酸序列可以编码变体氨基酸序列,其含有"保守性"取代,其中取代的氨基酸具有与其取代的氨基酸相似的结构或化学特征。理解目标蛋白的变体可以由天然产生的序列的氨基酸序列基本上相同的(至少约80至99%相同,以及其中所有的整数)氨基酸序列制得,并且其形成功能上等价的三维结构和保留天然产生蛋白的生物活性。生物领域公知可以在蛋白质序列中形成特定的氨基酸置换而没有影响蛋白质的功能。通常,定制保守氨基酸置换或相似氨基酸的置换而没有相应蛋白质功能。相似的氨基酸可以是大小和/或电荷特征相似的那些,例如,天冬酰胺和谷氨酰胺,异亮氨酸和缬氨酸是两对相似的氨基酸。除非故意,当没有破坏天然二级和三级结构形成时,允许相互的置换。在本领域中以各种方式测定了氨基酸对之间的相似性。例^口,Dayhoff等,在AtlasofProteinSequenceandStructure,1978,Volumn5,增补3,22章,345-352页,在此将其引入作为参考,提供了氨基端置换的频率表,其可以用作氨基酸相似性的测量。Dayhoff等的频率表是基于来自各种进化不同来源的具有相同功能的蛋白质的氨基酸序列的比较。可以通过本领域公知的方法容易地制备所公开核苷酸(和氨基酸)序列的置换突变,插入和删除变体。这些变体可以以特意举例说明的序列相同的方式使用,只要变体具有与本发明特意举例说明的序列基本的序列同一性并保持所需的功能性。如在此所用的,基本序列同一性指的是足以使变体多核苷酸或蛋白以与产生变体的多核普酸或蛋白相同的能力作用的同源性(或同一性)。优选,该序列同一性高于70%或80%,更优选,该同一性高于85%,或该同一性高于90%,和或,这高于95%,以及70和100%之间的所有整数。本领域技术人员公知制备功能等价的置换突变,插入和删除突变或设计来提高序列的功能或另外提供方法优势。确定没有可以根据任何天然产生的蛋白质或根据具有资格的现有技术条目理解的实施方案/变体在所要求的本发明范围内。本领域公知本发明的多核苷酸序列可以截断和/或另外突变,使得所得到的特定片段和/或最初的全长序列的突变体可以保留所需的全长序列的特征。适用于从较大的核酸分子产生片段的各种限制酶是公知的。此外,公知S"/31内切核酸酶可以方便地用于DNA控时的有限消化。参见,例如,Maniatis等,1982,M/ecw/arC7om力g.'爿Z^6ora旨少Maw認/,ColdSpringHarborLaboratory,NewYork,135-139页,在此引入作为参考。还可以参见Wel等,1983,丄B/o/.C/zew.258:13006-13512。通过使用Sa/31内切核酸酶(通常称为"erase-a-base"方法),本领域冲支术人员可以/人主体核酸的任一个或两个末端除去核苷酸来产生宽i普的片段,其在功能上等价于主体核苷酸序列。本领域技术人员可以以这种方式从沿着最初编码序列的所有位置产生数百个受控的不同长度的片段。本领域技术人员可以常规地测试或筛选产生的片段的特征并按照在此教导的测定片段的实用性。还公知的是可以用定点突变容易地产生全长序列或其片段的突变序列。参见,例如,La匪ov,O.A.和Nikiforov,VG.1982,G,"h18:349-59;Shortle等,(1981)爿薩.細.G,A15:265-94;在此将两篇都引入作为参考。本领域技术人员可以常规地生产删除-,那些;得到的突变体:例如,保持激素,细胞因子,;元原结合或其他生物活性的那些。此外,或可替换地,变体多核普酸序列可以编码含有"非保守"置换的变体氨基酸序列,其中置换的氨基酸具有与置换的氨基酸不同的结构或化学特征。变体免疫球蛋白编码序列还可以编码含有氨基酸插入或删除或两者的变体氨基酸序列。此外,变体免疫球蛋白编码序列可以编码与参照多肽序列相同的多肽,但是由于遗传密码的简并,具有参照多核苷酸序列一个或多个碱基改变的多核苷酸序列。当涉及本发明的重组免疫球蛋白时,术语"片段"意思是具有与相应的全长免疫球蛋白的部分但不是全部的氨基酸序列相同的氨基酸序列的多肽,其基本上保留与相应的全长蛋白相同的生物功能或活性,或保留相应全长蛋白的至少一种功能或活性。片段优选包括全长免疫球蛋白的至少20-100个邻接氨基酸残基,并优选,保留与全长抗体结合相同抗原的能力。如在此所用的,术语"序列同一性"意思是使用序列比对程序比对时,两个或多个比对的序列相同的核酸或氨基酸序列。在此的术语"%同源性"和在此的术语"%同一性"交替使用并指的是使用序列比对程序比对时,两个或多个比对序列之间的核酸或氨基酸序列同一性的水平。例如,如在此所用的,80%同源性意思是通过限定的算法测定相同的物质为80%序列同一性,并因此给定序列的同系物在给定序列的长度具有高于80%的序列同一性。可以进行用于比较的最佳序列比对,例如,通过Smith和Waterman的局部同源性算法,Adv.Appl.Math.2:482,通过Needl函n和Wunsch的同源性比对算法,1970,J.Mol.Biol.48:443,通过Pearson和Lipman的相似性方法的探寻,1988,Proc.Natl.Acad.Sci.USA85:244,通过这些算法的计算机化执行(WisconsinGenetics软件包中的GAP,BESTFIT,FASTA和TFASTA,GeneticsComputerGroup,Madison,Wis.),通过BLAST算法,Altschul等,1990,JMol.Biol.215:403-410,软件通过生物信息网址的国家中心公众可以获得(参见nlm.nih.gov/),或通过视觉观察(总地参见,Ausubel等,下文)。为了本发明的目的,最优选通过Smith和Waterman的局部同源性算法来进行用于比较的最佳序列比对,1981,Adv.Appl.Math.2:482。还可以参见Altschul等,1990和Altschul等,1997。在两个或多个核酸或蛋白序列范围内的术语"相同的"或百分比"同一性"指的是为最大相应性比较和比对时,两个或多个相同的或具有特定百分比的相同氨基酸残基或核苷酸的序列或子序列,如使用在此所述的一种序列比较算法如Smith-Waterman算法,本领域已知的其他算法,例如,BLAST,或通过视觉观察所测量的。根据本发明,还包括的是序列变体,其编码自我加工裂解多肽和多肽本身,具有与天然序列80%、85%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%(以及80和100之间的所有整数)或更多的序列同一性。还包括的是表示至少5个,至少10个或至少15个单体连续链的多肽的氨基酸片段;以及根据所述的同一性条件与其同源的片段;和表示至少15个,至少30个或至少45个单体的连续链的核酸序列的片段。如果两个序列在中等至高严谨杂交和洗涤条件下相互特异性杂交,认为核酸序列与参照核酸序列"选择性杂交"。杂交条件是基于核酸结合复合物或探针的熔化温度(Tm)。例如,"最大严谨"通常发生在Tm-5°C(比探针的Tm低5°C);"高严谨"在低于Tm约5-10。C;"中等严谨"在低于探针的Tm约10-20°C;和"低严谨"在低于Tm约20-25。C。在功能上,最大严谨条件可以用来鉴定与杂交探针具有严格同一性或接近严格同一性的序列;而高严谨条件用来鉴定与探针具有约80%或更高序列同一性的序列。中等和高严谨杂交条件是本领域公知的(参见,例如,Sambrook等,1989,第9和11章,和Ausubel,F.M.等,1993)。高严谨条件的一个实例包括在50%曱酰胺,5xSSC,5xDenhardt,s溶液,0.5%SDS和100|ug/ml变性载体DNA中在约42。C杂交,接着在2xSSC和0.5%SDS中在室温洗涤两次,在0.1xSSC和0.5%SDS中在42。C再洗涤两次。认为编码具有与天然产生的目标蛋白相同生物活性的多肽并在高严谨杂交条件下杂交的2A序列在本发明的范围内。作为遗传密码子简并性的结果,可以产生编码相同2A或2A样多肽序列或其他蛋白酶或信号肽酶裂解序列的多个编码序列。例如,三联体CGT编码氨基酸精氨酸。可替换地,通过CGA,CGC,CGG,AGA和AGG来编码精氨酸。因此,认识到编码片段中这样的同义密码子置换落入本发明涵盖的序列变体内。进一步认识到这样的序列变体在高严谨条件下与亲本序列可以杂交或不可以杂交。例如,当序列变体包括亲本核普酸编码的每个氨基酸的不同密码子时,这是可能的。无论如何,特意考虑并由本发明包括这样的变体。抗体作为治疗形式的潜能受到目前技术的生产能力和经费的普遍限制。用于免疫球蛋白(或其他蛋白)生产的改进病毒或非病毒单个表达载体促进两个或多个编码序列的表达和传送,即,具有来自单个载体的双-或多-特异性的免疫球蛋白或其他蛋白。本发明解决了这些局限并适用于任何免疫球蛋白(即,抗体)或其片段,或其他多部分蛋白或结合蛋白对,如在此进一步详述的,包括工程化的抗体,如单链抗体,全长抗体或抗体片段,双链激素,双链细胞因子,双链趋化因子,双链受体等。IRES首先在piconavirusmRNA中发现了内部核糖体进入位点(IRES)(Jackson等,1990,TrendsBiochem.Sci.15:477-83,和Jackson和Kaminski,1995,RNAh985-1000)。本领域技术人员通常使用的IRES实例包括表1中涉及的那些,以及US专利No.6,692,736中所述的那些。本领域已知的"IRES"实例包括,但不限于从小核糖核酸病毒获得的IRES(Jackson等,19卯)和从病毒或细胞mRNA来源获得的IRES,如,免疫球蛋白重链结合蛋白(BiP),血管内皮生长因子(VEGF)(Huez等,1998,Mol.Cell.Biol.18:6178-6190),成纤维细胞生长因子2(FGF-2),和胰岛素样生长因子(IGFII),翻译启动因子elF4G和酵母转录因子TFIID和HAP4,从Novagen购得的脑心肌炎病毒(EMCV)(Duke等,1992,J.Virol.66:1602-9)和VEGFIRES(Huez等,1998,Mol.Cell.Biol.18:6178-90)。已经在不同的病毒中报道了IRES,如心病毒(cardiovirus),鼻病毒,口疱病毒(aphthovirus),HCV,Friend鼠白血病病毒(FrMLV)和莫洛尼氏鼠白血病病毒(MoMLV)。如在此所用的,"IRES"包括IRES序列的功能性变化,至少变化能够促进指导内部核糖体进入顺反子的启动子密码子中。IRES可以是哺乳动物,病毒或原生动物的。IRES促进指导内部核糖体进入下游顺反子的启动密码子中,导致cap-自主翻译。因此,可以从双顺反子(或多顺反子)mRNA表达下游顺反子的产物,而不需要多蛋白的裂解或单顺反子mRNA的产生。内部核糖体进入位点大约450个核苷酸长,并且特征在于初级序列的中等保守和二级结构的强烈保守。IRES最显著的初级序列特征是富嘧咬位点,其起始点大约位于IRES3,端上游25个核苷酸。参见Jackson等(1990)。已经鉴定并表征了三个主要类别的小核糖核酸病毒IRES:心病毒和口疮病毒类别(例如,脑心肌炎病毒,Jang等,1990,GeneDev4:1560-1572);肠道病毒和鼻病毒类别(例如,脊髓灰质炎病毒,Borman等,1994,EMBOJ.13:3149-3157);和曱肝病毒(HAV)类别,Glass等,1993,Virol.193:842-852)。对于头两个类别,使用两个一般的原则。首先,大部分IRES的450-核苷酸序列用来维持有助于核糖体结合和翻译启动的特定二级和三级结构。其次,核糖体进入位点是位于IRES3'端的AUG三联体,保守寡嘧啶区域下游的大约25个核普酸。翻译启动可以发生在核糖体进入位点(心病毒)或下一个下游AUG(肠道病毒/鼻病毒类别)。在口疮病毒中,在两个位点发生启动。HCV和pestivirus如牛病毒腹泻病毒(BVDV)或传统猪痘病毒(CSFV)各自具有341nt和370nt长5,-UTR。这些5,-UTR片段形成相似的RNA二级结构并可以具有适度有效的IRES功能(Tsuklyama-Kohara等,1992,J.Virol.66:1476-1483;Frolov等,1998,RNA4:1418-1435)。最近的研究表明Friend-鼠白血病病毒(MLV)5,-UTR和大鼠逆转录转座子病毒样30S(VL30)序列含有逆转录病毒来源的IRES结构(Torrent等,1996,Hum.GeneTher7:603-612)。在真核细胞中,通常通过从加帽mRNA5'端的核糖体扫描启动翻译,在启动因子的控制下。然而,已经发现几个细胞mRNA具有IRES结构来介导cap-自主翻译(vanderVelde等,1999,IntJBiochemCellBiol.31:87-106)。IRES序列的实例包括,但不限于,免疫球蛋白重链结合蛋白(BiP)(Macejak等,1991,Nature353:90-94),果蝇的antennapediamRNA(Oh等,1992,GeneandDev6:1643-1653),成纤维细胞生长因子-2(FGF-2)(Vagner等,1995,Mol.Cell.Biol.15:35-44),血小板产生的生长因子B(PDGF-B)(Bernstein等,1997,J.Biol.Chem.272:9356-9362),胰岛素样生长因子II(Teerink等,(1995)Biochim.Biophys.Acta1264:403-408),和翻i奪启动因子elF4G(Gan等,1996,J.Biol.Chem.271:623-626)。最近,还发现血管内皮生长因子(VEGF)具有IRES序列(Stein等,1998,Mol.Cell.Biol.18:3112-3119;Huez等,1998,Mol.Cell.Biol.18:6178-6190)。IRES序列的更多实例包括小核糖核酸病毒HAV(Glass等,1993,Virology193:842-852);EMCV(Jang和Wimmer,1990,GeneDev.4:1560-1572);脊髓灰质炎病毒(Borman等,1994,EMBOJ.13:3149-3157);HCV(Tsukiyama-Kohara等,1992,J.Virol.66:1476-1483);pestivirusBVDV(Frolov等,1998,RNA.4:1418-1435);LeishmaniaLRV-1(Maga等,1995,Mol.Cell.Biol.15:4884-4889);逆转录病毒MoMLV(Torrent等,1996,Hum.GeneTher.7:603-612)。VL30,Harvey鼠肉瘤病毒,REV(Lopez-Lastra等,1997,Hum.GeneTher.8'.1855-1865)。可以使用本领域已知的标准重组和合成方法制备IRES。为了克隆方便,可以将限制位点工程化至待使用的IRES片段末端之中。个转录产物表达两个或多个蛋白,内部核糖体进入位点(IRES)序列通常用来驱动第二,第三,第四个编码序列等的表达。当通过IRES连接两个编码序列时,第二个编码序列的翻译表达水平通常显著降低(Furler等,2001,GeneTherapy8:864-873)。实际上,使用IRES来控制可操纵地连接相同启动子的两个或多个编码序列的转录导致笫二个,第三个等的编码序列相对于邻接启动子的编码序列较低的表达水平。此外,IRES序列可以足够长来影响完成载体的包装,例如,eCMVIRES具有507个碱基对长。多蛋白(作为初级翻译产物)形式的蛋白表达是适用于许多病毒复制的策略,包括但不限于,小核糖核酸病毒科。在翻译时,病毒编码的自我加工肽介导多蛋白的快速分子内(cis)裂解来产生分开的(成熟)蛋白产物。本发明提供了优于使用IRES的优势,因为提供了用于重组蛋白或多肽表达的载体,该载体包括自我加工肽序列(在此通过2A肽序列举例说明)或其它蛋白酶裂解位点,其促进了使用单个启动子的两个或多个蛋白或多肽编码序列的表达,其中两个或多个蛋白或多肽以有利的摩尔比表达。对于免疫球蛋白,通过用于一个重链的编码序列和用于一个或两个轻链的编码序列来编码多蛋白,每个其中含有编码的自我加工位点或蛋白酶识别位点。在含有蛋白内含子的构建体中,只存在各自一个重链和轻链片段,以框内容和多蛋白表达,在两个免疫球蛋白链之间具有蛋白内含子,具有合适的特征以能够在蛋白内含子-免疫球蛋白链连接处裂解但两个免疫球蛋白不再连接。在另一个含有蛋白内含子的构建体中,存在一个或多个其它的免疫球蛋白片段,任选通过裂解位点与第一个和/或第二个片段隔开。例如,使用蛋白内含子方法来表达一个重链片段和一个轻链片段或表达一个重链和两个轻链等。如上定义的"自我加工裂解位点"或"自我加工裂解序列"指的是DNA编码序列或氨基酸序列,其中翻译时,包括自我加工裂解位点的多肽发生快速分子内(cis)裂解来产生分开的成熟蛋白产物。这样的"自我加工裂解位点,,也可以称为共翻译或翻译后加工裂解位点,在此通过2A位点,序列或结构域或蛋白内含子来举例说明。2A位点,序列或结构域证明了翻译效果,通过改变核糖体促进酯键水解的能力,因此以允许分开的下游翻译产物进行合成的方式从翻译复合物中释放多肽(Donnelly,2001)。或者,2A位点或结构域证明了"自我蛋白酶解,,或"裂解",通过以cis裂解其自身的C-端来产生初级裂解产物(Furler和Palmnberg,1990,Ann.Rev.Microbiol.44:603-623)。其它蛋白酶识别序列,包括信号肽酶裂解位点可以取代自我加工位点。蛋白内含子在多蛋白中也是有用的。蛋白内含子如在此所用的,蛋白内含子是表达的蛋白内的片段,通过N-蛋白外显子结合初级表达产物的N-端,通过C-蛋白外显子结合初级表达产物的C-端。天然产生的蛋白内含子介导蛋白内含子的切除以及N-和C-蛋白外显子的再连接(蛋白连接)。然而,在本发明表达产物的范围内,蛋白内含子的初级序列或侧翼蛋白外显子氨基酸序列使得在蛋白外显子的连接不存在或降低或最小量的蛋白外显子连接下发生蛋白主链的裂解,使得蛋白外显子蛋白从初级翻译产物(多蛋白)中释放出来而没有连接形成融合蛋白。初级表达产物的蛋白内含子部分(通过mRNA合成的蛋白,在任何蛋白酶解裂解之前)介导N-蛋白外显子/蛋白内含子处的蛋白酶解裂解和蛋白内含子/C-蛋白内含子连接。通常,天然产生的蛋白内含子还介导N-蛋白外显子和C-蛋白外显子的剪接在一起(通过形成肽键的连接)。然而,在本发明中,因为应用于表达两个多肽的目标(如通过抗体分子的重链和轻链特意举例说明的),优选没有发生蛋白连接。这可以通过引入蛋白内含子来实现,该蛋白内含子天然或通过突变而不具有连接活性。或者,通过突变来改变剪接位点处或邻近的氨基酸来防止释放蛋白的连接,因此防止剪接。参见,Xu和Perler,1996,EMBOJ.15:5146-5153;通常在C-蛋白外显子的起点处产生Ser、Thr或Cys。蛋白内含子是一类蛋白质,只在其它蛋白的基因内发现它们的基因。与称为蛋白外显子的侧翼宿主基因一起,将蛋白内含子转录为单个mRNA,并作为单个多肽翻译。在翻译后,蛋白内含子启动自体催化事件来除去自身并使用新的多肽键连接侧翼宿主蛋白片段。该反应只通过蛋白内含子来催化,不需要其它细胞蛋白,辅因子或ATP。在各种单细胞生物体中发现蛋白内含子,并且它们具有不同的大小。许多蛋白内含子含有核酸内切酶结构域,其引起它们在基因组内的移动性。蛋白内含子介导的反应已经用于生物技术中,尤其用于体外情况中,如用于纯化和用于蛋白质芯片构建,和用于植抹改良中(Perler,F.B.2005,IUBMBLife57(7):469-76)。已经将突变引入天然蛋白内含子核苷酸序列中,并且报道了这些突变中的一些具有改变的特征(Xu和Perler,1996,EMBOJ.15(9),5146-5153)。除了蛋白内含子,还已知细菌蛋白内含子样(BIL)结构域和hedgehog(Hog)自体加工结构域,Hog/蛋白内含子(HINT)超家族的其它2成员催化通过相似机理的翻译后自我加工(Dassa等,2004,J.Biol.Chem.279(31):32001-32007)。蛋白内含子作为特定宿主蛋白中的框内插入产生。在自我剪接反应中,蛋白内含子从前体蛋白切除它们自身,同时侧翼片段,蛋白外显子,变成连接的来恢复宿主基因功能。这些序列还含有核酸内切酶功能,引起它们在基因组内的移动性。蛋白内含子以各种大小(134至1650个氨基酸)产生,并且已经在真细菌,真核生物和archaea中得到鉴定。使用模式剪接/报告系统的实验已经表明可以将核酸内切酶,蛋白裂解和蛋白剪接功能分开(Xu和Perler,19%,EMBOJ.15:5146-5153)。以下描述的实施例使用了来自嗜热极端古菌(Pyrococcushorikoshii)PhoPolI,酿酒酵母VMA和集胞藻的蛋白内含子,与来自抗体重链和轻链的序列形成融合蛋白。设计蛋白内含子的突变来删除蛋白内含子的剪接能力,导致单个多肽经受自我裂解来正确产生编码的抗体重链和轻链。可以将这种策略相似地用于其它多链蛋白,激素或细胞因子的表达中,并且还适用于前体蛋白(前蛋白)加工成成熟的生物活性形式。尽管在此特意举例说明使用极端嗜热古菌PhoPolI,酿酒酵母VMA和集胞藻的蛋白内含子,本领域已知的其他蛋白内含子也可用于本发明的多蛋白表达载体和方法中。除了极端嗜热古菌PhoPolI,酿酒酵母VMA和集胞藻蛋白内含子以外的许多其它蛋白内含子是本领域已知的(参见,例如,Perler,F.B.2002,InBase,theInteinDatabase,Nucl.Acids.Res.30(1):383-384和theInteinDatabaseandRegistry,通过NewEnglandBiolabs网址可获得,例如,http:〃tools.neb.com/inbase/)。已经在各种生物体如酵母,分枝杆菌和极端嗜热古细菌中鉴定出蛋白内含子。特定的蛋白内含子具割和剪接活性。核酸内切酶活性对于本发明的实践不是必需的;可以删除核酸内切酶编码片段,只要保留蛋白裂解活性。已经很详细地研究了蛋白剪接过程的机理(Chong等,1996,J.Biol.Chem.271:22159-22168;Xu和Perler,1996,EMBOJ15:5146-5153)并且已经在蛋白内含子和蛋白外显子剪接点处发现了保守的氨基酸(Xu等,1994,EMBOJ13:5517-5522)。在此所述的构建体含有与第一个编码序列的5,-端融合的蛋白内含子序列,第二个编码序列在框内融合蛋白内含子的C-端。可以从任何一种已知的蛋白选择合适的蛋白内含子序列来含有蛋白剪接序列。含有所有已知蛋白内含子的数据库可以在环球网上找到(Perler,F.B.1999,Nucl.AcadsRes.27:346-347)。将蛋白内含子编码序列在3'端融合(框内)第二个编码序列的5,端。为了将该蛋白把向特定细胞器,可以将合适的肽信号融合蛋白的编码序列。在第二个蛋白外显子编码序列后,可以重复蛋白内含子编码序列-蛋白外显子编码序列,重复数量为用于在相同细胞中多个蛋白表达所需的那样多。对于含有多个蛋白内含子构建体,可以使用来自不同来源的蛋白内含子序列。在最后一个待表达基因的序列之后,理想地插入转录终止序列,并有利地包括多腺苷酸序列。多腺普酸化序列和终止序列的次序可以按照本领域技术人员所知的。在一个实施方案中,多腺苷酸化序列可以在终止序列之前。已经设计了修饰的蛋白内含子剪接单体,使得修饰的目标蛋白内含子可以催化从蛋白内含子切除蛋白外显子但不能催化蛋白外显子的连接(例如,参见,US专利7026526和US专利公开20020129400)。Pyrococcus物种GB-DDNA聚合酶中C-端蛋白外显子连接的突变产生改变的剪接序列,该序列包括蛋白外显子和蛋白外显子的裂解但防止蛋白外显子随后的连接(Xu和Perler,1996,EMBOJ15:5146-5153)。丝氨酸538突变成丙氨酸或甘氨酸(Ser至Ala或Gly)诱导了裂解但防止了连接。在这样的位置,Ser至Met或Ser至Thr还用来获得多蛋白的表达,该多蛋白裂解成分开的片段和至少部分不再连接。由于C-端蛋白外显子连接处氨基酸与蛋白内含子的相对保守,其它蛋白内含子剪接单体中等价残基的突变还可以防止蛋白外显子片段的连接。在低保守/同源性的情况中,例如,C-端蛋白外显子的头几个,例如,约五个残基和/或蛋白内含子片段的最后几个残基有系统地改变,并筛选给定蛋白外显子片段支持裂解但不剪接的能力,特别是在此公开的和本领域已知的蛋白外显子片段。存在不含有核酸内切酶结构域的蛋白内含子;这些包括集胞藻dnaE蛋白内含子和蟾蜍分枝杆菌GyrA蛋白(Magnasco等,Biochemistry,2004,43,10265-10276;Telenti等,1997,J.Bacteriol.179:6378-6382)。其它已经在自然中发现或已经通过从编码含核酸内切酶的蛋白内含子的序列除去核酸内切酶编码结构域人工形成(Chong等,1997,J.Biol,Chem.272:15587-15590)。在理想的情况中,最初选择素内含子使得其由执行剪接功能需要的最小数量氨基酸构成,如来自蟾蜍分枝杆菌GyrA蛋白的蛋白内含子(Telenti等,1997,上文)。在可替换的实施方案中,选择没有核酸内切酶的蛋白内含子,如来自蟾蜍分枝杆菌GyrA蛋白或酿酒酵母VMA蛋白内含子的已经修饰除去核酸内切酶结构域的蛋白内含子(Chong等,1997,上文)。蛋白内含子剪接单体的进一步修饰可以改变裂解反应的反应速率,使得通过简单修饰剪接单体的基因序列来控制蛋白含量。在一个实施方案中,将C-端蛋白外显子的第一个残基工程化来含有甘氨酸或丙氨酸,显示出该修饰防止使用古菌种GB-DDNA聚合酶的蛋白外显子连接(Xu和Perler,19%,EMBOJ15:5146-5153)。在该实施方案中,优选的C-端蛋白外显子蛋白在天然氨基酸序列中的N-曱硫氨酸之后天然含有甘氨酸或丙氨酸残基。蛋白外显子的甘氨酸或丙氨酸与蛋白内含子C-端的融合在多蛋白加工后提供了天然的氨基酸序列。在另一个实施方案中,通过改变天然序列或通过将另外的氨基酸残基天价之天然序列的N-端上,将人造甘氨酸或丙氨酸置于C-端蛋白外显子中。在该实施方案中,在多蛋白加工后,蛋白的天然氨基酸序列将改变一个氨基酸。在进一步的实施方案中,用于本发明中的其它修饰描述于US7026526中。古菌种GB-DDNA聚合酶蛋白内含子的DNA序列是US专利No.7,026,526的SEQIDNO:1。N-端蛋白外显子连接点是"aac"序列(SEQIDNO:1的核苷酸1-3)并编码天冬酰胺残基。天然GB-DDNA聚合酶前体蛋白的剪接为点之后为SEQIDNO:1中的核普酸3和核苷酸1614。C-端蛋白外显子连接点是"age"序列(SEQIDNO:1的核苷酸1615-1617),其编码丝氨酸残基。C-端蛋白外显子丝氨酸突变成丙氨酸或甘氨酸形成修饰的蛋白内含子剪接序列,该序列能够促进多蛋白的切除但不促进蛋白外显子单体的连接。蟾蜍分枝杆菌GyrA最小蛋白内含子的DNA序列是US专利7,026,526的SEQIDNO:2。N-端蛋白外显子连接点是"tac"序列(SEQIDNO:2的核苷酸1-3)并编码酪氨酸残基。前体蛋白中剪接位点后为SEQIDNO:2的核苷酸3和核苷酸597。C-端蛋白内含子连接点是"acc"序列(SEQIDNO:2的核苷酸598-600)并编码苏氨酸残基。C-端蛋白内含子苏氨酸土变成丙氨酸或甘氨酸形成修饰的蛋白内含子剪接序列,该序列促进多蛋白的切除但不促进蛋白外显子单体的连接。2A系统现在转向本发明的2A蛋白酶加工实施方案,2A的活性涉及密码子之间的核糖体跳跃,其防止了肽键的形成(deFelipe等,2000,HumanGeneTherpy11:1921-1931;Donnelly等,2001,J.Gen.Virol.82:1013-1025),尽管已经认为结构域作用更象自溶酶(Ryan等,1989,Virology173:35-45)。已经建立了其中将口蹄疫病毒(FMDV)2A编码片段克隆至表达载体并转染至靶细胞中的研究,人造报告多蛋白的FMDV2A裂解在多种异种表达系统中是有效的(麦芽溶菌产物和转基因烟草植物(Halpin等,U.S.专利No.5846767(1998)和Halpin等,1999,ThePlantJournal17:453-459);Hs683人神经胶质瘤细胞系(deFelipe等,1999,GeneTherapy6:198-208;此后称为"deFelipeII");兔子网织红细胞溶菌产物和人HTK-143细胞(Ryan等,1994,EMBOJ.13:928-933);和昆虫细胞(Roosien等,1990,J,Gen.Virol.71:1703-1711)。已经表明对于生物相关分子的异种多蛋白的FMDV2A介导的裂解为IL-12(p40/p35杂二聚体;Chaplin等,1999,J.InterferonCytokineRes.19:235-241)。在转染的COS-7细胞中,FMDV2A介导了p40-2A-p35多蛋白裂解成具有IL-12相关活性的生物功能性p40和p35亚基。已经将FMDV2A序列引入表达载体中,单独或结合不同IRES序列,来构建双顺反子,三顺反子和四顺反子载体。Furler(2001)证明使用编码a-突触核蛋白和EGFP或Cu/Zn超氧化物歧化酶(SOD-l)的重组腺相关病毒(AAV)载体并通过FMDV2A序列连接EGFP。EGFP和a-突触核蛋白以相对于相应的基于IRES的载体显著更高的水平从包括2A序列的载体表达,而SOD-l以相当或略高的水平得到表达。通过源自小核糖核酸病毒的病毒序列来举例说明编码自我加工裂解位点的DNA序列,包括但不限于肠道病毒,心病毒,口痴病毒或口蹄疫病毒(FMDV)。在优选的实施方案中,自我加工裂解位点编码序列源自FMDV。自我加工裂解位点包括但不限于2A和2A样结构域(Donnelly等,2001,J.Gen.Virol.82:1027-1041,在此以其整体引入作为参考)。或者,蛋白酶识别位点可以替代自我加工位点。合适的蛋白酶和同源识别位点包括,但不限于,弗林蛋白酶,RXR/K-R(SEQIDNO:1);IPNV的VP4,S/TXA-S/AG(SEQIDNO:2);烟草蚀刻病毒(TEV)蛋白酶,EXXYXQ-G(SEQIDNO:3);鼻病毒的3C蛋白酶,LEVLFQ-GP(SEQIDNO:4);PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶,DDDDK-X(SEQIDNO:5);因子Xa蛋白酶,IE/DGR-X(SEQIDNO:6);凝血酶,LVPR-GS(SEQIDNO:7);genenaseI,PGAAH-Y(SEQIDNO:8);和MMP蛋白酶;内部可裂解信号肽,其实例是C型流感病毒的内部可裂解信号肽(PekoszA.1998,Proc.Natl.Acad.Sci.USA95:113222-13238)(MGRMAMKWLVVIICFSITSQPASA,SEQIDNO:11)。可以作为多蛋白的一部分以反式或顺式提供蛋白酶,使得在相同转录内得到编码并与剩余的初级翻译产物分离,例如,通过自我加工位点或蛋白酶识别位点。随着越来越多的抗体治疗剂批准用于临床应用,在过去20年中制造这些治疗蛋白的方法中存在稳定的提高(Wurm,FM,2004,"Productionofrecombinantproteintherapeuticsincultivatedmammaliancells"(在培养的哺乳动物中重组蛋白治疗剂的生产)Nat.Biotechnol.22(11):1393)。然而,工业上仍然希望更有效和可靠的生产方法。一些所需的特征包括更高水平的抗体分泌至培养基中,生产细胞系提高的遗传稳定性和细胞系更高的传代速度。在我们对更有效生产治疗性抗体方法的研究中,我们已经研发了从单个开放阅读框表达抗体重链和轻链的方法。在一个这样的方法中,将蛋白内含子编码序列用来隔开单个开放阅读框(SORF)内的抗体重链和轻链。通过这样的sORF抗体表达技术给予的优势包括操纵用于重链和轻链的基因用量比例的能力,用于ER中多亚基装配的重链和轻链多肽的接近性和高效蛋白分泌的潜能。其它用于在哺乳动物细胞中表达单克隆抗体的技术涉及引入两个分开的ORF中的重链和轻链基因,每个ORF具有自己的启动子和调控序列。启动子干扰是与此方法相关的关注问题。将抗体重链和轻链序列引入表达细胞系中的可替换方法是使用内部核糖体进入位点(IRES)来隔开抗体重链和轻链编码序列。由于在翻译IRES序列的编码序列下游中降低的效率,该方法还没有广泛使用。最近,已经描述了使用编码口蹄疫病毒肽(2A肽)的序列来隔开抗体重链和轻链编码序列的方法(Fang等,2005,Nat.Biotechnol.23(5):584-90)。在该方法中,抗体重链和轻链以及2A肽作为单个mRNA转录。然而,在它们进入内质网(ER)之前裂解抗体重链和轻链。此外,在重链和轻链裂解/分开后在重链的C-端留下两个非天然氨基酸。本发明的蛋白内含子表达系统在根本上是不同的。其不同于2A方法,因为翻译重链和轻链多肽并作为单个多蛋白带至ER中。有利地,不需要将非天然氨基酸包括在成熟抗体分子中。以下的描述是在抗体生产载体的所有内容中,载体包括如下的表达盒启动子-分泌信号-重链-wt蛋白内含子,如极端嗜热古菌PolI蛋白内含子-分泌信号-轻链-polyA;启动子-分泌信号-重链-修饰的蛋白内含子如极端嗜热古菌PolI蛋白内含子-轻链-polyA;启动子-分泌信号-重链-Pol修饰的蛋白内含子如极端嗜热古菌PolI蛋白内含子-分泌信号-轻链-Pol修饰的蛋白内含子如极端嗜热古菌PolI蛋白内含子-分泌信号-轻链-polyA;启动子-分泌信号-重链-wt或修饰的蛋白内含子如p.horikoshiiPolI蛋白内含子-修饰的分泌信号-轻链-polyA;启动子-分泌信号-轻链-wt或修饰的蛋白内含子如极端嗜热古菌PolI蛋白内含子-修饰的分泌信号-重链-polyA;启动子-分泌信号-重链-wt或修饰的蛋白内含子如极端嗜热古菌PolI蛋白内含子-修饰的分泌信号-轻链-polyA;启动子-分泌信号-重链-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌PolI蛋白内含子-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌PolI蛋白内含子-弗林蛋白酶裂解位点-轻链-弗林蛋白酶裂解位点-修饰的蛋白内含子如极端嗜热古菌PolI蛋白内含子-弗林蛋白酶裂解位点-轻链-polyA。在更多的构建体中,使用修饰的Psp-GBDPol蛋白内含子。在此所述的特异举例说明的多蛋白使用在框内与各自在其之前和之后的D2E7重链和轻链融合的极端嗜热古菌PolI蛋白内含子。在-l位的氨基酸是赖氨酸,在+1位的氨基酸是曱硫氨酸,轻链信号肽的第一个氨基酸。在+1位使用甲硫氨酸允许消除剪接,重链和轻链的连接,如我们在之后的部分中所证明的,理解在+1位需要亲核氨基酸残基如丝氨酸,半胱氨酸或苏氨酸来允许剪接。除了wt蛋白内含子,改变最后一个氨基酸天冬酰胺和第二个至最后一个组氨酸的突变可以用作这些通常消除剪接并防止在N-端剪接连接处裂解的突变(Mills,2004;Xu,1996,Chong,1997)。或者,还可以使用改变蛋白内含子第一个氨基酸的突变,这样的突变通常消除剪接,防止C-端剪接连接处的裂解,并且消除或防止N-端剪接连接处减弱的裂解(Nichols,2004;Evans,1999,和Xu,1996)。例如,这已经证明了"完全阻断剪接并抑制分支中间产物的形成,导致在两个剪接连接处的裂解"(Xu,M.Q.,EMBOvol.15:5146-5153)。在可替换形式的多肽中,弗林蛋白酶裂解位点的包括允许连接序列的改变,随后在分泌过程中通过弗林蛋白酶裂解切除。表9中给出了蛋白内含子的野生型序列。在古菌GB-D的DNA聚合酶中,裂解/剪接连接是RQRAIKILAN/S(SEQIDNO:138)(N-端)和HN/SYYGYYGYAK(SEQIDNO:139)(C端)。理想地,通过Hindlll裂解切除核酸内切酶编码片段。裂解,剪接和核酸内切酶功能相互分开,并且该核酸内切酶片段可以由小的连接物取代来形成仍然能够裂解和剪接的迷你-蛋白内含子(Telenti等,1997,J.Bacteriol.179:6378-6382)。还注意到至少一个酵母蛋白内含子在哺乳动物细胞中起作用(Mootz等,2003,J.Am.Chem.Soc.125:10561-10569)。参见用于D2E7(免疫球蛋白)蛋白内含子构建体的编码序列和氨基酸序列的表8A和8B;表8C提供了D2E7蛋白内含子构建体表达载体的完整核普酸序列。描述了编码D2E7(Humira-阿达木单抗(adalimumab)的注册商标)重链的融合构建,该重链融合修饰的PspPoll蛋白内含子,该内含子自身融合D2E7轻链的编码片段。可以扩增轻链序列,蛋白内含子,信号肽或蛋白酶裂解位点将其与剩余的多蛋白隔开。在该实施方案中,成熟重链之前为重链分泌信号。已经按照上述的将蛋白内含子改变,将丝氨酸l改变成苏氨酸,切除内部HindIII片段来除去核酸内切酶活性。将蛋白内含子框内融合成熟D2E7轻链片段。可替换的实施方案将包括成熟轻链的轻链分泌信号5,。参见图10和11用于D2E7蛋白内含子构建体和表达载体的图示,表8A-8C用于表达构建体和完整表达载体的核苷酸序列以及D2E7蛋白内含子构建体的氨基酸序列。信号肽和信号肽酶信号假设,其中蛋白在其氨基酸序列内含有用于蛋白靶向膜的信息,已经知道三十多年了。Milstem和同事发现来自骨髓瘤细胞的IgG的轻链以较高的分子量形式合成并将内质网泡嚢(微粒体)加入翻译系统时转化成成熟形式,并提出基于这些结果的模型,其中微粒体含有蛋白酶,该蛋白酶通过除去氨基-端延伸肽将前体蛋白形式转化成成熟形式。信号假设很快得到扩充来包括定位于不同胞内膜如线粒体和叶绿体的蛋白质内的不同靶向序列。后来发现这些不同的靶向序列通过特定的信号肽酶(SPase)从输出的蛋白得到裂解。在细菌中存在至少三种涉及裂解信号肽的不同SPase。SPaseI可以处理通过SecYEG途径或双精氨酸定位(Tat)途径输出的非脂蛋白底物。通过SPaseII裂解通过Sec途径输出的脂蛋白。SPase裂解为II型分泌装置组成部分的IV型prepilin和prepilin-样蛋白。在真核细胞中,通过将蛋白共翻译或翻译后靶向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。ER信号肽具有与细菌复本那些相似的特征。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。将蛋白分至真核细胞内不同位置的信号肽必须是不同的,因为这些细胞含有许多不同膜状和水成区隔。被靶向ER的蛋白通常含有可裂解的信号序列。令人惊讶地,许多人造肽可以用作移位信号。认为最重要的关键特征是超过特定极限的疏水性。ER信号肽比细菌信号肽具有更高含量的亮氨酸残基。从核糖体出现后,信号识别颗粒(SRP)结合可裂解信号肽。将初生的蛋白质靶向ER膜需要SRP。蛋白质移位至ER腔后,通过SPC加工输出的蛋白。另一个实施方案利用了在真核细胞中天然产生的信号(前导)肽加工酶。在真核细胞中,通过将蛋白共翻译或翻译后耙向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。大部分已知的ER信号肽是N-端可裂解的或内部不可裂解的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风渗病毒和C型流感病毒中发现的那些含有很可能通过ERSPC裂解的内部信号肽。这些关于病毒多蛋白成熟的研究表明SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。Presenilin-型天冬氨酸蛋白酶信号肽肽酶(SPP)裂解它们跨膜片段内的信号肽。SPP对于人类中信号肽产生的HLA-E抗原决定部分的产生是必需的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风渗病毒和C型流感病毒中发现的那些含有^艮可能通过ERSPC裂解的内部信号肽。因此,预测的信号肽酶底物特异性序列的突变可以阻断病毒的感染性。这些对于多蛋白成熟的研究也是非常有趣的,因为它们显示出SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。信号肽酶是本领域公知的。参见,例如,PaetzelM.2002,Chem.Rev.102(12):4549;PekoszA.1998,Proc.Natl.Acad.Sci.USA.95:13233-13238;ManusK,2002,MolecularCell10:735-744;OkamotoK,2004,J.Virol.78:6370-6380,Vol.78;MartoglioB.2003,HumanMolecularGenetics12:R201-R206;和XiaW,2003,J.Cell.Sci.116:2839-2844。通过将蛋白共翻译或翻译后靶向Sec61移位机制的信号肽来介导将蛋白质靶向内质网(ER)膜。通过信号肽酶复合物(SPC)输出至ER腔内后,ER信号肽从输出的蛋白中裂解出来。大部分已知ER信号肽是N-端可裂解的或内部不可裂解的。最近,发现多种病毒多蛋白如在丙肝病毒,汉坦病毒,黄病毒,风渗病毒和C型流感病毒中发现的那些含有很可能通过ERSPC裂解的内部信号肽。这些对于多蛋白成熟的研究也是非常有趣的,因为它们显示出SPC不仅可以裂解位于氨基端的信号肽,而且可以裂解之后的信号肽。本发明利用了内部可裂解信号肽,用于在单个转录产物中的多肽表达。然后通过SPC裂解信号转录的多肽,留下分开的单个肽或待装配成蛋白质的单个肽。本发明的方法适用于在单个转录的多肽中表达免疫球蛋白重链和轻链,接着裂解,然后装配成成熟的免疫球蛋白。该技术适用于多肽细胞因子,生长因子,或各种其他蛋白质,例如,单个转录多肽中的IL-12p40和IL-12p35,然后在单个转录多肽中装配成IL-12,或IL-12p40和IL-23pl9,然后装配成IL-23。信号肽酶方法适用于哺乳动物表达载体,其导致从前体或多蛋白表达功能性抗体或其他加工过的产物。在抗体的情况中,作为含有重链和轻链的多蛋白从载体产生,重链和轻链之间的干预序列为内部可裂解信号肽。该内部可分离信号肽可以通过ER中的蛋白酶(主要的信号肽酶),presenilin或presenilin-样蛋白酶来裂解,留下重链和轻链折叠并装配来产生功能性分子,并且理想地将其分泌。除了源自丙肝病毒的内部可裂解信号肽,可以通过ER中的蛋白酶裂解的其他内部可裂解序列是它的替代物。相似地,本发明的实践不需要限于其中信号肽酶实现裂解的宿主细胞,而且还包括蛋白酶,包括但不限于,presenilin,presenihn-样蛋白酶,和其他用于加工多肽的蛋白酶。这些蛋白酶已经在引用的文献中进行了综述。此外,本发明不限于免疫球蛋白重链和轻链的表达,而且还包括在单个转录产物中表达的其他多肽和多蛋白,接着通过内部信号肽裂解来释放每个单独的肽或蛋白质。这些蛋白质可以在成熟产物中装配在一起或不装配。还在本发明范围内的是表达构建体,其中单个肽以可替换的次序存在,即,"肽l-内部可裂解信号肽-肽2"或"肽2-内部可裂解信号肽-肽1"。本发明进一步包括通过内部可裂解信号肽连接的多于两个的肽的表达,如"肽l-内部可裂解信号肽-肽2-内部可裂解信号肽-肽3"等。此外,本发明涉及I型和II型跨膜蛋白的表达和表达构建体周围的其他蛋白酶裂解位点的添加。一个实例是在免疫球蛋白重链之后添加弗林蛋白酶或PC5/6裂解位点来促进重链肽羧基端的其他氨基酸残基的裂解,例如,"重链-弗林蛋白酶裂解位点-内部可裂解信号肽-轻链"。本发明还包括分开或串联的多于一个的内部可裂解信号肽,例如,"重链-弗林蛋白酶裂解位点-内部可裂解信号肽-内部可裂解信号肽-轻链"。再进一步,本发明包括其中存在重链和轻链自我信号肽的维持或去除的情况,如"HC信号肽-重链-弗林蛋白酶裂解位点-内部可裂解信号肽-LC信号肽-轻链"。以下的描述在抗体生产载体的范围中,其中一些在别处得到了描述。载体涉及包括但不限于以下的。载体设计表_启动子-分泌信号-重链-内部可裂解信号肽-分泌信号-轻链-ployA_启动子-分泌信号-重链-内部可裂解信号肽-轻链-polyA_启动子-分泌信号-重链-内部可裂解信号肽-分泌信号-轻链-内部可裂解信号肽-分泌信号-轻链-polyA_启动子_分泌信号_重链_弗林蛋白酶裂解位点_内部可裂解信号肽-弗林蛋白酶裂解位点-分泌信号-轻链-plyA;和_启动子-分泌信号-重链-弗林蛋白酶裂解位点-内部可裂解信号肽-弗林蛋白酶裂解位点-轻链-弗林蛋白酶裂解位点-内部可裂解信号肽-弗林蛋白酶裂解位点-轻链-polyA。融合构建体的特定实例编码与内部可裂解信号肽融合的D2E7(Humira/adalimumab)的重链,该信号肽自身与D2E7轻链的编码片段融合。在该实施方案中,成熟重链之前为重链分泌信号。该内部可裂解信号肽序列源自C型流感病毒。在重链的羧基端重包括弗林蛋白酶裂解位点。为了最小化对成熟抗体的影响,将重链的第三个至最后一个氨基酸残基从脯氨酸突变至精氨酸来形成弗林蛋白酶裂解位点。可替换的实施方案包括成熟轻链的轻链分泌信号5,。参见表9A-9C。该实施例中使用来自C型流感病毒的最小内部可裂解信号肽序列(MGRMAMKWLVVnCFSITSQPASA,SEQIDNO:11)。较大的序列还可以用来提高裂解效率。参见GenBank登录号AB126196。还可以使用编码相同氨基酸序列的各种核苷酸序列。本发明进一步使用内部可裂解信号肽,用于单个转录产物内编码的多蛋白内的一个或多个多肽的成熟。然后通过SPC裂解单个转录的多肽,留下分开的单个肽或待装配成蛋白的单个肽。本发明适用于在单个转录的多肽中表达免疫球蛋白重链和轻链,然后装配成成熟免疫球蛋白。本发明适用于表达多肽细胞因子,生长因子,或各种其他蛋白质,例如,在单个转录多肽中表达IL-12p40和IL-12p35,然后在单个转录多肽中装配成IL-12,或IL-12p40和IL-23pl9,然后装配成IL-23。用于本发明载体的两个或多个异种DNA序列之间2A序列或其他蛋白酶或信号肽酶裂解(识别)位点的位置亚克隆允许两个或多个基因通过单个表达载体的传送和表达。优选,自我加工裂解位点如FMDV2A序列或蛋白酶识别序列提供了独特的方式,从单个病毒载体表达和传送两个或多个蛋白,多肽或肽,其可以是例如抗体,杂二聚受体或杂二聚蛋白的单独部分。FMDV2A是多肽片段,其在FMDV基因组中起作用来指导在其自身C-端的单个裂解,因此以顺式起作用。通常报道FMDV2A结构域约十九个氨基酸长(LLNFDLLKLAGDVESNPGP,SEQIDNO:12;TLNFDLLKLAGDVESNPGP,SEQIDNO:13;Ryan等,1991,J.Gen.Virol.72:2727-2732),然而,少如十四个氨基酸残基的寡肽(LLKLAGDVESNPGP,SEQIDNO:14)已经显示出能以与其在天然FMDV多蛋白加工中的作用相似的方式介导2AC-端的裂解。已经研究了2A序列的变化介导多蛋白有效加工的能力(Donnelly等,2001)。2A序列的同系物和变体包括在本发明的范围内并包括但不限于以下的序列QLLNFDLLKLAGDVESNPGP'SEQIDNO:15;NFDLLKLAGDVESNPGPFF,SEQIDNO:16;LLKLAGDVESNPGP,SEQIDNO:17;NFDLLKLAGDVESNPGP,SEQIDNO:18;APVKQTLNFDLLKLAGDV芒SNPGP,3EQIDNO:19;VTELLYRMKRAETYCPRPLLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQIDNO:20;LLAIHPTEARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQIDN。:141;和EARHKQKIVAPVKQTLNFDLLKLAGDVESNPGP,SEQIDNO:142.2A序列及其变体可以用来制备表达自我加工多蛋白的载体,包括其包括通过自我加工裂解位点或其他蛋白酶裂解位点连接的蛋白或多肽的编码序列的任何载体(基于质粒或病毒的),使得在由于自我加工或其他裂解位点的存在引起的多蛋白裂解后,单个蛋白以合适的摩尔比和/或含量表达。这些蛋白对于载体自身,相互或对于自我加工裂解位点例如FMDV,可以是异种的,因此用于本发明实践中的自我加工裂解位点没有识别异种蛋白和源自相同来源的编码序列,因为自我加工裂解位点作用或介导裂解的能力。在一个实施方案中,根据本发明的载体中能够包括的FMDV2A序列编码包括LLNFDLLKLAGDVESNPGP(SEQIDNO:12)的氨基酸残基。或者,根据本发明的载体可以编码其他2A样片段的氨基酸残基,如Donnelly等中所迷的,2001,J.Gen.Virol.82:1027-1041,并包括但不限于,来自小核糖核酸病毒,昆虫病毒,C型轮状病毒,锥体虫重复序列或细菌海栖热袍菌(thermatogamaritima)的2A样结构域。本发明包括编码2A或2A样肽序列的核酸序列变体的用途,如2A或2A样多肽的核酸编码序列,其相对于亲本核苦酸具有一个或多个氨基酸的不同密码子。本发明特意考虑并包括这样的变体。2A肽和多肽的序列变体也包括在本发明的范围内。相似地,以顺势或反式提供的蛋白酶可以通过多蛋白片段之间的同源蛋白酶识别(裂解)位点介导蛋白酶解加工。在使用蛋白内含子-抗体表达构建体的实验中,我们已经证明了极端嗜热古菌PolI蛋白内含子介导的蛋白剪接反应可以在哺乳动物(293E)细胞,ER和抗体(D2E7)重链和轻链氨基酸序列范围内发生。为了在单个开放阅读框(sORF)形式的抗体表达中使用这种类型的反应,我们证明了可以使用两个构建体,pTT3-HcintLClaa-p.hori和pTT3-HcintLC3aa-p.hori,在哺乳动物(293E)细胞,ER和抗体重链和轻链氨基酸序列范围内发生这种反应。参见表IIA和12A。在PPT3载体主链上形成这些构建体。该载体具有EB病毒(EBV)复制起点,其允许游离基因在悬浮液中的转染293E细胞(表达EB病毒核抗原1的细胞)中扩增(Durocher,2002,"Highlevelandhigh-throughputrecombinantproteinproductionbytransienttransfectionofsuspension-growinghuman293-EBNA1cells"(通过悬浮生长的人293-EBNA1细胞的瞬时转染的高水平和高通量的重组蛋白生产),NucleicAcidsResearch30(2):E9)。每个载体具有一个ORF,在CMV启动子的调控控制下转录表达。在ORF中,将极端嗜热古菌PolI蛋白内含子框内插入D2E7重链和轻链之间,重链和轻链各自具有信号肽(SP)。pTT3-HcintLClaa-p.hori和pTT3-HcintLC3aa-p.hori构建体在蛋白内含子的任一侧具有1个天然蛋白外显子氨基酸或3个天然蛋白外显子氨基酸,将D2E7抗体重链和轻链序列与蛋白内含子序列隔开。通过瞬时转染将这些构建体引入293E细胞中。分析培养液和细胞沉淀样口P0在允许分离胞质和胞内膜部分的条件下裂解细胞沉淀样品。使用蛋白质印迹(WB)分析这些部分,使用抗重链或抗K-轻链抗体。在这些印迹中,我们看到对应于分成三个部分形式的4个蛋白物质的表达,如构建体的ORF(130kDa),源自剪接情况(80kDa)的H和L的融合体,抗体重链(50kDa)和抗体轻链(25kDa)。通过抗重链和抗轻链抗体检测头2个蛋白物质,只通过抗重链抗体检测重链,和只通过抗轻链抗体检测轻链。在这些构建体中通过重链和轻链抗体4企的80kDa蛋白物质的存在证明了已经发生了蛋白剪接情况。此外,所有四个蛋白物质主要存在于亚细胞膜部分中,其含有内质网(ER)。这表明重链信号肽(在ORF开始处编码的)已经将完整多肽引至ER中,其中已经发生了剪接反应。不希望受到任何特定理论的束缚,认为游离重链和轻链多肽很可能是N-端和C-端剪接连接处裂解的结果,由不完整的剪接引起。细胞沉淀样品还用于总RNA提取和RNA印迹分析,4吏用抗体重链探针和抗体轻链探针。RNA印迹分析揭示了这些sORF构建体中的三联mRNA(3.4kb),其与重链探针和轻链探针杂交,但不是分开的重链或轻链的mRNA。相反,在使用常规方法表达D2E7抗体的细胞沉淀样品中,即,引入来自两个pTT3载体中携带的两个分开ORF的抗体重链和轻链,各自使用重链和轻链探针检测重链(1.4kb)和L链(0.7kb)的mRNA。在这些对照细胞沉淀中没有冲企测到三耳关mRNA。上述数据证明了使用含有单个ORF(D2E7重链-P.horikoshi蛋白内含子-D2E7轻链)的构建体,转录了含有全部3个蛋白的单个mRNA。该分成三个部分的信使翻i奪成分成三个部分的多肽,并共翻译输入至ER中,通过三联多蛋白的N-端存在的重链信号肽指引。使用该构建体,蛋白内含子-介导的蛋白剪接反应在ER内发生。这表明蛋白内含子介导的反应可以用于表达抗体以及其他多亚基分泌的蛋白,即,需要经历分泌途径的那些蛋白质,以便得到折叠和正确的翻译后修饰。还分析了培养液。蛋白质印迹和ELISA允许#r测/人pTT3-HcintLClaa-p.hori构建体表达分泌的抗体。在下文中将更详细地讨论这些研究;通过点突变和编码轻链信号肽序列内的突变已经提高了分泌的抗体表达含量。设计突变来抑制蛋白内含子介导的连接但防止在剪接连接的N-端或C-端的裂解反应,该突变导致提高水平的抗体分泌。为了提高的抗体分泌效率的目标,设计并测试了三种类型的点突变。第一种类型的突变在C-端蛋白外显子第一个丝氨酸残基的密码子中;这些构建体具有Ser至Met(S>M)改变(构建体pTT3-HcintLC-p.hori,构建体E和构建体A)。第二种类型的突变是在蛋白内含子第一个丝氨酸残基的编码处;这样的构建体具有Ser至Thr(S〉T)改变(构建体E)。第三种类型的突变是在蛋白内含子第二个至最后一个(倒数第二个)氨基酸的组氨酸残基的密码子中;这些构建体具有His至Ala(H〉A)置换突变(构建体A和构建体B)。将这些突变单独或结合引入。根据文献中所述的反应机理,设计所有突变构建体来防止N-或C-端剪接连接处的裂解和降低释放的蛋白外显子的剪接,或两者。如下所列出的,使用各种这样的构建体获得D2E7抗体的分泌。在一个实施方案中,通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA分析来分析培养的上清液的IgG抗体滴定度。构建体pTT3-HcintLC3aa-p.hori,pTT3-HcintLClaa-p.hon,pTT3-HcintLC-p.hon,E,A和B的抗体滴定度各自为17.0+0.6,113.8+2.6,225.8+10.0,9.3+0.5,161.7+4.4和48.2+1.0ng/ml(平均+s.d.)。还在变性条件下在SDS-PAGE凝胶上分析这些上清液样品,并用抗人IgG重链抗体和抗人k轻链抗体点迹。在这些蛋白质印迹上,从构建体pTT3-HcintLC-p.hori和A产生的上清液中的抗体重链(50kDa)和抗体轻链(25kDa)清晰可见,与通过ELISA测量的IgG水平的等级次序相一致。含有所有上述构建体的细胞沉淀中看到沿着抗体重链(50kDa)和轻链(-25kDa)条带的三联多肽(130kDa)。在这些构建体中,pTT3-HcintLC-p.hori和构建体A给出最强烈的重链和轻链条带;因此,可以推断胞内游离重链和轻链水平与装配并且分泌的抗体之间的相关性。剪接的产物(80kDa),是抗体重链和轻链之间的融合体,存在于使用构建体pTT3-HcintLC3aa-p.hori产生的细胞沉淀中,并且在构建体pTT3-HcintLClaa-p.hori产生的细胞沉淀中水平较低;在构建体pTT3-HcintLC-p.hori和构建体A,B和E中不存在。这表明蛋白剪接的水平与抗体分泌效率逆相关,与抗体重链和轻链的连接将导致错折叠的预期相一致,基于关于抗体结构的一般知识,并且由于错折叠蛋白降解的细胞机理,这种misfold将因此防止分泌。这些印迹上的另一种蛋白物质是蛋白内含子-轻链融合体(80kDa,由轻链抗体但不是重链抗体识别),这由任何其他裂解不存在下的N-端剪接连接处的裂解形成。该条带存在于在此所述的构建体A,B,E,pTT3-HcintLC3aa-p.hori,pTT3-HcintLClaa-p.hori中,并且在构建体pTT3-HcintLC-p.hori和H中几乎不存在。因此,该蛋白物质的存在还与抗体分泌的含量逆相关。最后,还在这些细胞裂解物中检测到蛋白内含子条带,使用抗缀合KLH的P.horikoshii肽产生的兔子多克隆抗血清。我们证明了使用sORF构建体pTT3-HdntLC-p.hori分泌的D2E7抗体具有正确的重链和轻链N-端序列,和正确的重链和轻链分子量以及完整的分子量。通过蛋白A亲和色语纯化使用一种sORF构建体pTT3-HcintLC-p.hori分泌的D2E7抗体,并对重链和轻链的N-端序列进行分析。明确的结果表明重链的N-端肽序列是EVQLVESGGG(SEQIDNO:21)和轻链的N-端序列是DIQMTQSPSS(SEQIDNO:22)。因此,使用该构建体,信号肽DIQMTQSPSS使用的裂解位点与常规用于D2E7抗体表达的双ORF/双载体方法中使用的那些相同。这些数据给下一代构建体的设计提供了重要的科学理解哺乳动物ER肽酶将在新合成的多蛋白中识别并正确裂解信号肽,即使对其呈现存在一些明确的要求(参见下文)。通过质谱分析该纯化的抗体,连同通过常规制造方法产生的D2E7。在变性条件下,从pTT3-HcintLC-p.hori构建体产生的D2E7轻链在质谱上产生一个单个的峰,并且其分子量(MW)为23408.8,而从标准制造方法产生的D2E7轻链的分子量(MW)为23409.7,接近一致。还是在变性条件下,从pTT3-HcintLC-p.hori构建体产生的D2E7重链在质谱上产生一个主要峰和2个次要峰,并且它们的分子量(MW)各自为50640.6,50768.2和50802.4,而从标准制造方法产生的D2E7重链分子量(MW)各自为50641.7,50768.6和50804.1,再次接近一致。3个峰对应于D2E7重^T连的标准形式。还使用质谙测定了天然条件下从pTT3-HcintLC-p.hori构建体产生的该D2E7抗体的完整分子量(MW),连同从制造方法产生的D2E7抗体一起。从pTT3-HcintLC-p.hori构建体产生的D2E7抗体具有3个峰,各自具有148097.6,148246.9和148413.1的MW;从制造方法产生的D2E7抗体也具有3个峰,各自具有148096.0,148252.3和148412.8的MW。这些数据清楚地证明了从pTT3-HcintLC-p.hori构建体产生的D2E7抗体的大小在变性和天然条件下都与常规制造方法产生的D2E7抗体的相同。与常规制造方法相比较生产具有完全可靠的氨基酸序列的能力是本发明抗体表达系统的优势之一。使用例如Fang等所述的2A系统,NatureBiotechnology,2005产生的抗体在其重链的C-端具有2个额外的非天然氨基酸,并且由于裂解的性质不可能将这避免。我们还证明了使用pTT3-HcintLC-p.horisORF构建体产生的D2E7抗体对于结合TNF具有与制造方法产生的D2E7抗体相同的亲和性。使用Biacore3000仪器(PharmaciaLKBBiotchnology,Uppsala,Sweden)根据制造商的说明和标准方法测量穿过生物传感器芯片通过固定的山羊抗人IgG捕获的rhTNFa拮抗剂和可溶性rhTNFa之间的实时结合相互作用。简而言之,将rhTNFa等份试样稀释至HBS-EP(Biocore)緩冲液中,将150屮1等份试样以25ml/min的流速注射穿过固定的蛋白基质。同时将相等浓度的分析物注射在未处理的参照表面上来用作空白sensorgmm,用于减去bulk折射率背景。在循环之间用两次5-分钟注射10mM甘氨酸,25ml/min再生传感器芯片表面。然后使用BIA评价4.0.1软件评价所得到的实验结合sensorgram来测定动力学速率参数。将每个拮抗剂的数据集适合1:1Langmmr模型。对于这些研究,在通用适合分析实验方案下分析结合和解离数据,同时选择最大分析物结合能力(RU)或Rmax特征的局部适合。在这种情况中,软件计算出单个解离常数(kd),締合常数(ka)和亲合常数(Kd)。平衡解离常数是Kd二kd/ka。使用l-100nM范围内不同的TNFot浓度测定动力学on-rate,动力学offrate和整体亲合性。从构建体pTT3-HcintLC-p.hori产生的D2E7抗体的动力学on-rate,动力学offrate和整体亲合性各自为1.61E+6(M"s"),5.69E-5(s")和3.54E-11(M);通过制造方法产生的D2E7抗体的动力学on-rate,动力学offrate和整体亲合性各自为1.73E+6(NfV1),6.72E-5(s-1)和3.89E-11(M)。Biacore分析表明使用该sORF构建体产生的D2E7抗体具有与常规制造方法产生的D2E7抗体相似的TNFa亲合性。信号肽的修饰我们已经证明了在sORF构建体设计中,重链-int-轻链,当通过定点突变降低轻链信号肽序列的疏水性时,抗体分泌水平提高约10倍。我们设计了构建体H,其中在P.horikoshi蛋白内含子序列后,轻链信号肽序列从"MDMRVPAQLLGLLLLWFPGSRC"(SEQIDNO:23)改变成"MDMRVPAQLLGDEWFPGSRC"(SEQIDNO:24)。在如上所述相同类型的转染实验中,表达该构建体的细胞的上清液含有2047+116ng/ml抗体,如通过ELISA分析所测量的。该抗体分泌水平与使用2A技术所述的相似(1.6pg/ml)。该上清液的蛋白质印迹分析显示出对应于抗体重链和抗体轻链的强烈条带。在对照实验中,使用常规方法将该相同轻链信号肽突变引入用于表达该抗体的载体中(从两个分开载体中的两个分开的开放阅读框框表达抗体重链和轻链)。在该构建体中,SEQIDNO:23提供SEQIDNO:24的改变如所预期地消除了抗体分泌,因为在常规构建体设计中,疏水性片段对于靶向ER上的信号识别颗粒(SRP)复合物并指引进入translocon中是重要的。这证实了在sOR构建体设计中,轻链信号肽的靶向功能是不必要的,即使可以通过ER信号肽酶识别并裂解,与完整ORF已经通过ORF开始处的重链信号肽进入ER中的假设相一致。通过蛋白A亲合色谱纯化使用sORF构建体H分泌的D2E7抗体,并对其轻链的N-端序列进行分析。轻链的N-端肽序列是MDMRVPAQLL(SEQIDNO:26)(没有不明确),这表示了未裂解的信号肽。即使文献中表明哺乳动物信号肽的H片段主要作用在于靶向(SRP)复合物并指引通过translocon的移位,我们的数据表明信号肽的疏水性(H)片段还在信号肽酶的识别和裂解中起作用。我们已经证明了使用pTT3-HdntLC-p.hori构建体和构建体H分泌的D2E7抗体在基于细胞的测试中是生物活性的。纯化使用pTT3-HcintLC-p.hori构建体和构建体H产生的D2E7抗体并测试它们中和L929细胞中TNFa诱导的细胞毒性的能力。基本上按照US6090382中所述的进行该测试(参见在此的实施例4)。人重组TNFa引起鼠L929细胞中的细胞毒性并用于该测试中。和D2E7—样,抗-TNFa抗体可以中和这种细胞毒性,L929测试是可以用于评价特定D2E7抗体制剂的生物活性的基于细胞的测试之一。^f吏用该测试分析时,/人pTT3-HcintLC-p.hori构建体和构建体H产生的D2E7中和TNFa诱导的细胞毒性。它们的IC50值与标准制造方法产生的D2E7的相似。我们已经研究了在轻链信号肽区域中使用不同设计的其它构建体。为了鉴定允许高抗体分泌效率的最佳sORF构建体设计,我们已经设计了几种另外的构建体,改变了C-端剪接位点周围的片段和之后的信号肽。蛋白内含子的最后一个N替代H构建体的"MDMRVPAQLLGDEWFPGSRC"(SEQIDN〇24)后,构建体J决定为"MDMRVPAQWFPGSRC,,(SEQIDNO:25),将其进一步除去该信号肽内部的疏水性片段同时保留C-端片段以及信号肽酶裂解位点。构建体K指导直接在蛋白内含子最后一个N后的成熟轻链序列的表达。构建体L指导蛋白内含子的最后一个N替代"MDMRVPAQLLGLLLLWFPGSRC,,(SEQIDNO:23)后"MDMRVPAQLLGLLLLWFPGSGG"(SEQIDNO:27)的表达,如在构建体pTT3-HcintLC-p.hori中,其通过信号肽酶改变了裂解位点之前的-1和-2氨基酸。在一个实验中,通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA分析分析培养的上清液的IgG抗体滴定度。构建体H,J,K和L的抗体滴定度各自为2328.5+79.9,1289.7+129.6,139.3+4.7和625.0+20.6ng/ml(平均+s.d.)。所有构建体具有之前所述的三联多肽条带(:i30kDa),重链条带(50kDa)和轻链条带(25kDa),并且没有一个具有可才企测的剪接的产物(80kDa并通过重链和轻链抗体来识别)。在这组构建体中,构建体K产生了最不同的蛋白质印迹(WB)模式,其中只产生了非常少量的胞内轻链,代替产生了对应于蛋白内含子-轻链融合体的蛋白物质,N-端间接连接处一种裂解情况的产物。该组中的其他构建体不存在这种蛋白物质=构建体K在两个方面不同于其他构建体不具有通过信号肽酶裂解的裂解位点,和具有天冬氨酸,而不是曱硫氨酸或丝氨酸,作为C-端蛋白外显子的第一个氨基酸残基。这些特征中的任一个或两个可以防止蛋白内含子和抗体轻链之间区域的裂解,导致降低的蛋白质分泌。通过蛋白质A亲4、色i普纯化使用sORF构建体J和L分泌的D2E7抗体,并分析轻链的N-端序列。该分析表明通过构建体J产生的轻链的N-端肽序列是MDMRVPAQLL,这表示了未裂解的信号肽;而通过构建体L产生的轻链的N-端肽序列是DIQMTQSPSS,这表示了正确的信号肽裂解厚的成熟轻链。因此,构建体L表示了与构建体pTT3-HcintLC-p.hori相比较给予了提高的抗体分泌的设计(在不同的瞬时转染中为0.6-l)ng/ml),同时其轻链具有正确的N-端序列。我们探究了使用蛋白内含子和进一步提高抗体分泌水平的方法从sORF构建体表达装配抗体的机理。用大部分所述的sORF构建体转染的细胞的胞内样品含有对应于未处理和处理轻链的两个抗体轻链。用阳性对照构建体或pTT3-HcintLC-p.hori构建体转染的细胞中,只分泌加工的轻链,表明不可以装配和分泌连接野生型轻链信号肽的未加工轻链。相反,能够装配和分泌来自H和J构建体的未加工轻链;都具有突变的信号肽。如在未加工和加工形式之间的胞内轻链多肽分布中所看到的,轻链信号肽加工的程度根据构建体而改变。与构建体pTT3-HcintLC-p.hori相比较,构建体L具有提高量的加工轻链,并且这翻译成提高的抗体分泌。基于以上的实验数据,从sORF构建体提高抗体分泌的一种方式是提高轻链信号肽的加工效率。通过系统地测试疏水性片段以及裂解位点周围区域中的突变和通过测试不同长度的信号肽来进行这。还可以通过在酵母中筛选可以以这种形式有效裂解的肽序列和通过在CHO细胞中进行相似的筛选来进行这。可以用来提高sORF构建体的抗体分泌水平的另一种方法是测试不同的5,和3'未翻译片段(UTR)来提高三联mRNA的稳定性,因为这些mRNA比分开编码抗体重链和轻链的传统mRNA大。提高sORF构建体抗体分泌水平的另一种方法是产生和选择CHO或NS0细胞系并使用DHFR或GS扩增来提高重组基因拷贝数量。通过将重组基因的定位从游离(瞬时)改变至基因组(稳定)独立地提高了抗体分泌水平。还通过提高拷贝数,和/或通过操纵5,和3'UTR,启动子和增强子序列来提高。将表达二氢叶酸还原酶(dhfr)的载体转染至dhfr-缺陷细胞系中。使用氨甲蝶呤(dhfr的一种竟争性抑制剂)选择较高载体拷贝数的细胞系(Kaufman,R.J.和Sharp,P.A.JMol.Biol.(1982)159:601-621)。作为进一步的独立可替换方案,使用携带巨细胞病毒启动子增强子结合谷氨酰胺合成酶选择标记的表达载体来提高表达(Bebbington,C.R.(1991)Methods2:138-145)。除了提高重组基因拷贝数,在该方法中还选择了特别适用于从sORF构建体设计加工的细胞世系。使用修饰的含有插入片段的蛋白内含子为了追踪已经与D2E7重链和轻链多肽分离的胞内蛋白内含子蛋白的目的,我们在构建体pTT3-HcintLC-p.hori和构建体H中制备了4个在氨基酸序列位置FRKVR!RGRG(!表示插入位点,-HT1)和EGKR!IPEF(-HT2)引入组氨酸标记物的构建体。假设P.honkoshi蛋白内含子是hedgehog的,可以容纳插入片段同时保持其3维结构,因此可以起作用。在一个实验中,293E细胞转染后培养4天后,通过ELISA分析分析培养上清液的IgG滴定度。构建体pTT3-LcintHC-p.hori-HTl,pTT3画LcintHC-p.hori-HT2,构建体H-HTl,构建体H-HT2和构建体H的抗体滴定度各自为78.3+3.2,67.3+0.6,663.0+15.5,402.7+5.5,747.0+22.5ng/ml(平均+s.d.)。在2个位置含有插入片段的P.hotikoshii蛋白内含子的使用允许装配抗体的分泌。特别地,与使用没有任何插入片段的蛋白内含子相比较,在第一个位置含有内部插入标记物的蛋白内含子的使用给予相似的抗体水平。以上的数据证明了本发明的sORF构建体设计包括使用修饰的含有内部标记物的蛋白内含子。各种标记物是本领域已知的。本发明的标记物包括但不限于焚光标记物和化学发光标记物。使用这些构建体,可以使用单个细胞中的荧光检测来监控表达的多蛋白含量。此外,可以根据蛋白表达的水平使用FACS分选这些细胞。这样标记物的使用在稳定细胞系产生中特别有用,因为这允许通过FACS分析选择高产细胞或细胞系。如本发明中所教导的,已经在与侧翼抗体重链和轻链自体裂解后的细胞裂解物中观察到了全长蛋白内含子。这提供了检测焚光标记的蛋白内含子及其用于稳定细胞系产生中的基础。标记物还可以用于蛋白质的纯化中。从以上呈现的数据看,我们已经知道可以在293E细胞,ER和抗体(如通过D2E7特意举例说明的)重链和轻链的范围中发生尸/zoh^^/^'Po1I蛋白内含子介导的蛋白剪接反应。点突变如C-端蛋白外显子的第一个氨基酸的S〉M和蛋白内含子的倒数第二个氨基酸的H〉A提高了分泌抗体的水平。降低轻链信号肽H片段的疏水性,如在构建体H和J中,产生更高的抗体分泌水平。缺少轻链信号肽的构建体中的抗体分泌水平相对低,这似乎是由于C-端剪接连接处不太有效的裂解引起的。使用两种方法来提高该裂解的效率。第一种在+1位置使用不是天冬氨酸的氨基酸。在此所述的另外几种构建体在+1位置使用曱硫氨酸并在C-端剪接连接处获得有效的裂解。第二种提高该裂解效率的方法是使用连接物改变C-端裂解位点和轻链球状结构之间的剪接,任选接着不同类型的裂解位点,如本说明书中所述的那些。尽管已经描述和测试了包括极端嗜热古菌蛋白内含子和D2E7抗体的不同构建体,在本发明的sORF设计中可以使用其他蛋白内含子和蛋白内含子样蛋白(包括hedgehog和相关家族),例如,在抗体重链和轻链之间引入。还将其他多亚基蛋白(包括双亚基蛋白和具有多个两个亚基的蛋白)替代了抗体的重链和轻链蛋白。除了以上所述的极端嗜热古菌Poll蛋白内含子构建体,我们使用Sce.VMA和Ssp.dnaE迷你蛋白内含子设计了类似的构建体pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-VMAint-LC-laa,pTT3-Hc-VMAint-LC-3aa,pTT3-Hc-Ssp陽GA-int國LC國0aa,pTT3-Hc-Ssp-GA-int-LC-laa和pTT3-Hc-Ssp國GA-int-LC-3aa。将这些构建体转染至293E细胞中,并分析上清液和细胞沉淀样品。在一个实验中,293E细胞转染后培养7天后,通过ELISA分析来分析培养上清液的IgG抗体滴定度。pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-VMAint-LC6n,pTT3-Hc-VMAint誦LC-3aa,pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-laa和pTT3-Hc-Ssp-GA-int-LC-3aa的抗体滴定度各自为9.0±3.5,12.0±0.0,39.7±1.2,90.0±2.0,38.7±1.5和32±2.6ng/ml(平均士s.d.)。所有这些样品中观察到三联多肽。;此外,在构建体pTT3-Hc-VMAint-LC-0aa,pTT3-Hc-Ssp-GA-int-LC-0aa,pTT3-Hc-Ssp-GA-int-LC誦1aa和pTT3-Hc-Ssp-GA-int誦LC-3aa中观察到重链多肽;和在pTT3-Hc-Ssp-GA隱int-LC-0aa,pTT3-Hc曙Ssp-GA-int陽LC-laa和pTT3-Hc-Ssp-GA-int-LC-3aa中观察到轻链多肽。这些实验的结果表明蛋白内含子,作为一类蛋白质,可以成功地用于sORF蛋白表达策略中,如我们所述的。此外,细菌蛋白内含子-样(BIL)结构域和hedgehog(Hog)自我加工结构域,蛋白内含子以外的Hog/蛋白内含子(HINT)超家族的其他2个成员,适用于在此所述那些的相似构建体设计中。此外,因为存在于包括^l端嗜热古菌Poll蛋白内含子和Sce.VMA蛋白内含子的许多蛋白内含子中的核酸内切酶片段在本发明的基因表达策略中是没有用的,可以删除核酸内切酶结构域并用小的连接物替代来形成"迷你-蛋白内含子"。这些的迷你蛋白内含子还用于所的构建体设计中,它们呈现出蛋白内含子编码片段显著更小的优势,因此允许较大的编码多肽的序列和/或更易于操作重组DNA分子。与使用自我加工肽如2A或2A样-序列或蛋白酶识别相关的一个关注问题是一个或多个多肽链的C或N端含有源自自我加工肽的氨基酸,即2A产生的氨基酸残基,或蛋白酶识别序列,取决于初级翻译产物内裂解的位置和特定链的相对位置。这些氨基酸残基对宿主是"外来"的并当体内表达或传送时可以引发免疫应答(即,在基因治疗范围内,从病毒或非病毒载体表达,或作为体外产生的重组蛋白来给予)。此外,如果没有除去,2A产生的或蛋白酶位点产生的氨基酸残基可能影响生产细胞中的蛋白质分泌和/或改变蛋白质构象,导致低于最佳表达水平和/或降低的重组蛋白生物活性。将基因表达载体工程化,使得在多肽编码序列和自我加工裂解位点(即,2A序列)或其他蛋白酶裂解位点之间提供另外的蛋白酶解裂解位点,作为裂解后除去自我加工裂解位点产生的氨基酸残基的一种方法,该基因表达载体可以用于本发明的实践中。其他的蛋白酶解裂解位点的实例是具有一致序列RXK(R)R(SEQIDNO:1)的弗林蛋白酶裂解位点,其可以通过内源subtilisin-样蛋白酶裂解,如蛋白质分泌途径内的弗林蛋白酶和其他丝氨酸蛋白酶。US专利公开2005/0042721表明了通过在第一个多肽和2A序列之间引入弗林蛋白酶裂解位点RAKR可以有效地除去第一个蛋白质N端的2A残基。此外,表明使用含有2A序列和邻接2A裂解位点的质粒导致比单独含有2A序列的质粒更高水平的蛋白表达。这种提高提供了进一步的优势,因为从蛋白质的N-端除去2A残基时,可以使用更长的2A或2A样序列或其他自我加工序列。这样的自我加工序列如2A-或2A样序列有助于两个或多个多肽通过单个启动子更好的等摩尔表达。多蛋白中免疫球蛋白轻链编码序列存在两次和重链编码序列只存在一次时,获得免疫球蛋白表达进一步的提高。使用具有全部人类特征的抗体或其类似物是有利的。这些试剂避免了由源自非人物种的抗体或类似物诱导的不利免疫应答。为了解决对源自自我加工肽的氨基酸残基的可能宿主免疫应答,可以在第一个蛋白质的编码序列和自我加工肽之间插入蛋白酶解裂解位点的编码序列(使用本领域已知的标准方法),以便从表达的多肽即抗体除去自我本领域已知的可以使用重组DNA技术表达的任何其他蛋白酶解裂解位点可以用于实践本发明。可以插入多肽或蛋白编码序列和自我加工裂解序列(如2A序列)的实例其他蛋白酶解裂解位点包括,但不限于弗林蛋白酶裂解位点。RXK(R)R(SEQIDNO:1);因子Xa裂解位点,IE(D)GR(SEQIDNO:6);信号肽酶I裂解位点,例如,LAGFATVAQA(SEQIDNO:28);和凝血酶裂解位点,LVPRGS(SEQIDNO:7)。作为从单个开放阅读框表达多于一种成熟蛋白的ires,弗林蛋白酶,2A和蛋白内含子方法的可替换方案,本发明还提供了使用置于多肽内第一个和第二个蛋白部分之间的hedgehog蛋白结构域的蛋白加工。我们设计了用于表达抗体重链和轻链的单个开放阅读框,使用hedgehog自体加工结构域来隔开抗体重链和轻链基因。在携带这样的ORF的细胞中,转录由至少一个抗体重链,一个抗体轻链和一个hedgehog自体加工结构域构成的单个mRNA,并用来产生相应的多肽。在翻译后,hedgehog自体加工结构域介导抗体重链和轻链的分离。蛋白质的hedgehog家族含有保守的信号分子,作为不同发育系统中的成形物质,并设计各种人类疾病(Kalderon,D.2005,BiochemSocTrans.Dec;33(Pt6):1509-12)。Hedgehog蛋白具有2个结构域,在细胞信号中起作用的N-端结构域(Hh-N)和催化翻译后自我加工事件的C-端结构域(Hh-C),该自我加工裂解事件在这两个结构域之间分开,将胆固醇部分加入N-端结构域的C-端,因此激活信号分子(Trad等,1997,Cell,91,85-97)。这样的sORF抗体表达技术给予的优势包括操纵重链和轻链的基因用量比例,用于ER中多亚基装配的重链和轻链多肽的接近性和高效蛋白分泌的潜能。Hh-C蛋白结构域可以用来催化ER中的自我加工反应,导致以下所述单个开放构建体设计中抗体重链多肽和Hh-C多肽之间的翻译后裂解。蛋白质的hedgehog家族具有N-端信号结构域和C-端自我加工结构域。它们的C-端自我加工结构域将它们自身与N-端结构域裂解,并通过2-步骤反应机理将胆固醇部分添加至它们的C-端(Porter等,1996,Science,274(5285):255-9)。除了胆固醇,其他亲核试剂如DTT或谷胱甘肽也刺激自我加工(Lee等,1994,Science,266,1528-1537)。和通过C-端自体加工结构域催化的裂解反应相同,hedgehog蛋白的N-端信号结构域由抗体重链或轻链多肽替代时,发生相似的裂解反应。该反应可以用来分离单个开放阅读框编码的多蛋白内含有的抗体重链和轻链。首先在瞬时表达系统中测试抗体表达并为了该目的,在pTT3载体主链上形成构建体。该载体具有EBV复制起点,其允许游离基因在悬浮培养物中的转染293E细胞中(表达EB病毒核抗原1的细胞)扩增(Durocher等,2002)。每个载体具有单个开放阅读框,由CMV启动子驱动。在一个构建体设计中,pTT3-HC-Hh-C25-LC,将来自黑腹果蝇sonichedgehog蛋白质的完整C-端结构域框内插入D2E7重链和轻链之间,其中每个具有信号肽(SP)。通过瞬时转染将这些构建体引入293E细胞中。分析了培养的上清液和细胞沉淀样品。在允许cytosolic和胞内膜部分分离的条件下将细胞沉淀样品裂解。使用免疫印迹技术分析了这两个部分,使用抗重链或抗K-轻链抗体。在这些印迹上,观察到的蛋白物质包括多蛋白(HC-Hh-C25-LC),Hh-C25-LC,和分开的重链(HC)和轻链(LC)。后3种蛋白物质的存在证实已经发生了自我加工反应。从Hh-C蛋白结构域催化的裂解产生游离的重链;游离轻链多肽是信号肽酶裂解的结果。含有内质网(ER)的亚细胞膜部分中蛋白物质的分离表明我们ORF开始处的重链信号肽已经指导完整ORF进入ER中,其中发生裂解反应。还将这些细胞沉淀样品接受总RNA提取和Northern印迹分析,使用抗体重链特异性探针和抗体轻链特异性探针。与重链探针和轻链探针都杂交的三耳关mRNA的这些northern印迹观察证实了构建体设计的sORF性质。相反,在使用常规方法表达D2E7抗体的细胞沉淀样品中,即,引入两个pTT3载体中携带的两个分开ORF的抗体重链和轻链,各自使用重链或轻链探针检测重链(1.4kb)和L链(0.7kb)的mRNA。这些实验证明使用含有单个ORF(D2E7重链-Hh-C25-D2E7轻链)构建体,转录了含有全部3个蛋白质的单个mRNA。该三联信息翻译成三联多肽,并共翻译地输入ER中,通过ORF开始处存在的重链信号肽指引。这表明Hh-C蛋白结构域用于抗体以及其他多亚基分泌的蛋白质和/或需要经历分泌途径以便折叠和正确翻译后修饰的蛋白质的表达。对于分泌的抗体,除了细胞沉淀物,还使用蛋白质印迹和ELISA分析了培养的上清液,如在此所述的。可以测试使用删除的hh-C25的构建体来比较多蛋白加工和抗体分泌水平的效率。已经表明从Hh-C25蛋白质结构域删除C-端63个氨基酸产生了一个蛋白结构域,Hh-C17,其可以催化蛋白加工但不催化胆固醇添加。Hh-C17很好地表达为重组蛋白,并且已经测定了它的晶体结构(Traci等,1997,上文)。因此,在另一个构建体设计中,pTT3-HC-C17-LC,将该截断的蛋白结构域插入D2E7抗体重链和轻链之间。在hedgehog蛋白质和蛋白内含子的同源性比对中,我们已经在相似的构建体重测试了,如在此详述的,最后8个氨基酸延伸超出最后预测的(3-折叠二级结构,它们对自体加工的效率可能有帮助或没帮助。因此,还测试了其他的构建体,pTT3-HC-C17sc-LC。通过瞬时转染将这些构建体引入293E细胞中,并在7天后,通过ELISA测试分析培养的上清液的IgG抗体滴定度。pTT3-HC-C25-LC,pTT3誦HC-C17-LC,pTT3-HC-C17sc-LC和pTT3-HC-C17hn國LC各自为0.038,0.042,0.040和0.046ug/ml。还在SDS-PAGE凝胶(变性条件)上分析这些上清液样品,并用人IgG重链特异性抗体和人k轻链特异性抗体点迹。在这些蛋白质印迹上,可以观察到抗体重链(50kDa)和抗体轻链(25kDa)蛋白,并且与通过ELISA测量的IgG水平相一致。还通过蛋白质印迹分析分析了来自这些转染的细胞沉淀样品。可以比较不同构建体重所述四种蛋白物质的存在和相对密度,来测定每个构建体设计提供的蛋白加工效率。在另一类自我加工蛋白中,蛋白内含子,最后两个氨基酸倾向于为HisAsn。在通过蛋白内含子催化的蛋白质剪接过程中,Asn经受环化,His辅助,其导致蛋白内含子及其C-端侧翼多肽之间肽键的裂解。与蛋白内含子相反,hedgehog自我加工蛋白本质上不具有C-端侧翼多肽,并且它们在多肽的该位置不具有保守的Asn。在一个构建体设计中,pTT3陽HC-C17hn-LC,我们已经在该位置引入了His-Asn,替代Ser-Cys。不希望受到理论的束縛,在该位置的工程化裂解位点使该特定构建体设计中的hedgehog自体加工蛋白和抗体轻链之间的分离更有效。如上所述的测试抗体分泌的效率。表征了通过含有hedgehog自体加工蛋白的sORF构建体产生的抗体。通过蛋白质A亲合色语纯化使用以上sORF构建体分泌的D2E7抗体,并分析其重链和轻链的N-端序列。按照之前所述的在变性条件下通过质语分析这些纯化的抗体,和从标准制造方法产生的D2E7。在天然条件下使用质谱测定从这些构建体产生的D2E7抗体和从制造方法产生的D2E7抗体的完整分子量(MW)。按照之前所述的使用Biacore分析D2E7抗体和人TNFa之间的结合。通过使用l-100nM范围内的不同TNFa浓度测定动力学on-rate,动力学off-rate和整体亲合性。本发明包括多种载体中任一种的用途,用于将包括两个或多个多肽或蛋白质的编码序列和自我加工裂解序列引入细胞中。基因表达载体的各种实例是本领域已知的并可以是病毒或非病毒来源的。本发明实践中可以使用的非病毒基因传送方法包括但不限于质粒,脂质体,核酸/脂质体复合物,阳离子脂质等。病毒载体病毒和其他载体可以有效地转导细胞并将它们自己的DNA引入宿主细胞中。在产生重组病毒载体中,用编码目标蛋白或多肽的可表达序列替代非必需基因。示例载体包括但不限于病毒和非病毒载体,如逆转录病毒载体(包括慢病毒载体),腺病毒(Ad)载体,包括可复制型,复制缺陷型及其gutless形式,腺相关病毒(AAV)载体,猿病毒40(SV-40),牛乳头状瘤病毒,EB载体,疱渗载体,牛痘载体,莫洛尼氏鼠白血病载体,哈维鼠肉瘤病毒载体,鼠乳腺胂瘤病毒载体,劳氏肉瘤病毒载体和非病毒质粒。杆状病毒载体是公知的并适用于在昆虫细胞中的表达。许多适用于在哺乳动物或其他真核细胞中表达的载体是本领域公知的,并且许多是可购得的。商业来源包括,但不限于,Stratagene,LaJolla,CA;Invitrogen,Carlsbad,CA;Progenia,Madison,WI和Sigma-Aldrich,St丄oms,MO。许多载体序列可通过GenBank获得,涉及载体的其他信息可通过RikenBioSourceCenter在互联网上获得。载体通常包括复制起点,并且载体可以另外包括或不包括"标记"或"选择标记"功能,通过这可以鉴定和选择载体。尽管可以使用任何选择标记,用于重组载体中的选择标记通常是本领域已知的,并且正确选择标记的选择将取决于宿主细胞。编码给予抗生素或其他毒素抗性的蛋白质的选择标记基因的实例包括但不限于氨千青霉素,氨甲喋呤,四环素,新霉素(Southern等,1982,JMolApplGenet.1:327-41),霉酚酸(Mulligan等,1980,Science209:1422-7),噪呤霉素,zeomycm,潮霉素(Sugden等,1985,MolCellBiol.5:410-3),二氢叶酸还原酶,谷氨酰胺合成酶和G418。如本领域技术人员所知道的,表达载体通常包括复制起点,可操纵地连接待表达的编码序列的启动子,以及核糖体结合位点,RNA剪接位点,多腺普酸化位点和转录终止子序列,如果合适,待表达的编码序列。参照载体或其他DNA序列,"重组"只表示通常不作为分离的或天然发现的形式可操纵地连接的DNA序列的可操纵地连接。表达和/或控制序列调控转录时,将调控(表达和/或控制)序列可操纵地连接核酸编码序列,并且如果合适,调控核酸序列的翻译。因此,表达和/或控制序列可以包括启动子,增强子,转录终止子,编码序列的起始密码子(即,ATG)5,,内含子的剪接信号和终止密码子。已知腺病毒基因治疗载体在体内呈现出强烈的瞬时表达,卓越的滴定度和转导裂解和非裂解细胞的能力(Hitt等,2000,AdvinVirusRes55:479-505)。本发明的重组Ad载体包括能够将载体引入复制缺陷型Ad病毒粒子中的包装位点;两个或多个目标多肽或蛋白质的编码序列,例如,目标免疫球蛋白的重链和轻链;和编码单独的自我加工裂解位点或结合另外的蛋白酶解裂解位点的序列。?!入感染性病毒粒子需要的或有帮助的其他序列包括5,和3'AdITR,E2基因,E4基因的一部分和任选的E3基因。通过本领域已知的标准技术使用Ad包装细胞和包装技术来制备复制缺陷型Ad病毒粒子封装重组Ad载体。例如,可以在US专利No.5,872,005中找到这些方法的实例。通常将两个或多个目标多肽或蛋白质的编码序列插入腺病毒中,在病毒基因组删除的E3片段中。用于实践本发明的优选腺病毒载体不表达一个或多个野生型Ad基因产物,例如,Ela,Elb,E2,E3和E4。优选的实施方案是通常与补充El,E2A,E4功能和任选E3基因片段的包装细胞系一起使用的病毒粒子。参见,例如,US专利No.5,872,005,5,994,106,6,113,028和6,127,175。因此,如在此所用的,"腺病毒,,和"腺病毒颗粒,,指的是病毒自身或其衍生物,并涵盖所有血清型和亚型,以及天然产生的和重组形式,除了其中另外指出的情况。这样的腺病毒可以是野生型或可以是以本领域已知的或如在此所述的各种方式修饰的。这样的修饰包括包装于颗粒中的腺病毒基因组的修饰,以便制得感染性的病毒。这样的修饰包括本领域已知的删除,如Ela,Elb,E2a,E2b,E3或E4编码片段中一个或多个的删除。示例包装和生产细胞源自293,A549或Hela细胞。使用本领域已知的标准技术纯化和配制腺病毒载体。腺相关病毒(AAV)是辅助病毒依赖性人细小病毒,其能够通过染色体整合潜在地感染细胞。由于其染色体整合的能力及其非致病的性质,AAV具有作为人基因治疗载体的显著潜能。为了用于实践本发明,可以使用本领域技术人员已知的标准技术产生rAAV病毒粒子,并包括转录启动和终止序列,以及目标编码序列。更具体地,本发明的重组AAV载体包括能够使载体引入复制缺陷型AAV病毒粒子中的包装位点;两个或多个目标多肽或蛋白质的编码序列,例如,目标免疫球蛋白的重链和轻链;编码单独的自我加工裂解位点或结合一个或两个其他的蛋白酶解位点的序列。构建用于实践本发明的AAV载体,使得它们包括作为朝转录方向的可操纵地连接成分的控制序列,包括转录启动和终止序列。这些成分在5,和3,端两侧由功能性AAVITR序列连接。"功能型AAVITR序列"意思是用于AAV病毒离子的拯救,复制和包装的ITR序歹寸。重组AAV载体的特征还在于它们能够指导目标细胞中选定的重组多肽或蛋白质产物的表达和生产。因此,重组载体包括至少全部壳体化必需的AAV序列和重组AAV(rAAV)病毒离子感染的物理结构。因此,用于表达载体中的AAVITR不需要具有野生型的核苷酸序列(例如,如Kotin,1994,Hum.GeneTher.5:793-801中所述的),并可以通过核苷酸的插入,删除或置换来改变,或AAVITR可以源自几种AAV血清型中的任何一种。通常,AAV载体可以是源自本领域已知的腺相关病毒血清型中的任何一种载体。通常,将AAV表达载体引入生产细胞中,接着引入AAV辅助构建体,其中辅助构建体包括能够在生产细胞中表达的AAV编码片段,并且其补充AAV载体中不存在的AAV辅助功能。设计辅助构建体来下调大的Rep蛋白(Rep78和Rep68)的表达,通常通过将pS后的起始密码子从ATG突变至ACG,如US专利No.6,548,286中所述的。接着,将辅助病毒和/或其他载体引入生产细胞中,其中辅助病毒和/或其他的载体提供了能够支持有效rAAV病毒生产的辅助功能。然后培养生产细胞来生产rAAV。使用标准方法进行这些步骤。通过本领域已知的标准技术使用AAV包装细胞和包装技术来制备本发明的辅助缺陷型AAV病毒粒子封装重组AAV载体。在US专利No.5,436,146;5,753,500,6,040,183,6,093,570和6,548,286中可以找到这些方法的实例,在此以其整体引入作为参考。用于包装的更多组合物和方法描述于Wang等中(US专利公开2002/0168342),在此也以其整体引入作为参考,并包括那些本领域技术人员知识范围内的那些技术。在实践本发明中,用于生产rAAV或其他载体表达载体病毒粒子的宿主细胞包括哺乳动物细胞,昆虫细胞,微生物和酵母。宿主细胞还可以是包装细胞,其中在宿主细胞或生产细胞中稳定维持AAV(或其他)rep和cap基因,其中稳定维持和包装AAV载体基因组。示例包装和生产细胞源自293,A549或Hela细胞。使用本领域已知的标准4支术纯化和配制AAV载体。其他合适的宿主细胞(取决于载体)包括中国仓鼠卯巢(CHO)细胞,CHO二氢叶酸还原酶缺陷型变体如CHODXBll或CHODG44细胞(参见,例如,Urlaub和Chasin,1980,Proc.Natl.Acad.Sci.77:4216-4220),PerC.6细胞(Jones等,2003,Biotechnol.Prog.19:163-168)或Sp/20鼠骨髓瘤细胞(Coney等,1994,CancerRes.54:2448-2455)。逆转录病毒载体逆转录病毒载体也是用于基因传送的常用工具(Miller,1992,Nature357:455-460)。逆转录病毒载体,更特别地慢病毒载体,可以用于实践本发明。因此,如在此所用的术语"逆转录病毒,,或"逆转录病毒载体"各自意味着包括"慢病毒"和"慢病毒载体"。已经测试并发现逆转录病毒载体是合适的传送载体,将目标基因稳定引入多种目标细胞的基因组中。逆转录载体传送未重排的单拷贝转基因进入细胞的能力使得逆转录病毒载体非常适于将基因转染至细胞中。此外,逆转录病毒通过逆转录病毒包膜糖蛋白与宿主细胞上特定细胞表面受体的结合来进入宿主细胞。因此,还发现假型逆转录病毒载体在实践本发明中的用途,在该载体中编码的天然包膜蛋白由具有不同于天然包膜蛋白的细胞特异性(例如,与天然包膜蛋白相比较,结合不同的细胞表面受体)的异种包膜蛋白替代。指导编码一个或多个目标蛋白编码序列的逆转录病毒载体传送至特定靶细胞中的能力是本发明实践中所需的。本发明提供了逆转录病毒载体,其包括,例如,包括一个或多个转基因序列的逆转录转移载体和包括一个或多个包装序列的逆转录包装载体。特别地,本发明提供了编码异种或功能上修饰的包膜蛋白的假型逆转录病毒载体,用于生产假型逆转录病毒。本发明的逆转录病毒载体的核心序列可以容易地源自各种逆转录病毒,包括例如,B,C和D型逆转录病毒以及泡沫病毒和慢病毒(参见RNATumorViruses(RNA肺瘤病毒),第二版,ColdSpringHarborLaboratory,1985)。适用于本发明的组合物和方法中的逆转录病毒的实例包括,但不限于,慢病毒。适用于本发明的组合物和方法中的其他逆转录病毒包括,但不限于,禽白血病病毒,牛白血病病毒,鼠白血病病毒,Mink-CellFocus4秀导病毒,鼠肉瘤病毒,网一犬内皮组织增生病病毒和劳氏肉瘤病毒。特别优选的鼠白血病病毒包括4070A和1504A(Hartley和Rowe,1976,J.Virol.19:19-25),Abelson(ATCCNo.VR-999),Friend(ATCCNo.VR-245),Graffi,Gross(ATCCNo.W-590),KirsteniHarvey肉瘤病毒和Rauscher(ATCCNo.VR-998)和莫洛尼氏鼠白血病病毒(ATCCNo.VR-190)。这样的逆转录病毒可以从保藏或收集中心容易地获得,如美国典型培养物保藏中心(ATCC;Manassas,VA),或使用常用的技术从已知来源分离。其他是可购得的。本发明的逆转录病毒载体序列可以源自慢病毒。优选的慢病毒是人免疫缺陷型病毒,例如,l或2型(即,HIV-l或HIV-2,其中HIV-1之前称为淋巴结病相关病毒3(HTLV-III)和获取性免疫缺陷综合症(AIDS)相关病毒(ARV)),或另一种与HIV-1或HIV-2相关的病毒,已经鉴定并与AIDS或AIDS样疾病相关。其他慢病毒包括,绵羊Visna/maedi病毒,猫免疫缺陷型病毒(FIV),牛慢病毒,猿免疫缺陷型病毒(SIV),马传染性贫血病毒(EIAV)和公山羊关节炎-脑炎病毒(CAEV)。逆转录病毒的合适属和林是本领域公知的(参见,例如,FieldsVirology,第三版,B.N.Fields等编辑,1996,Lippincott-RavenPublishers,参见,侈'J长口,第58章,Retroviridae:TheVirusesandTheirReplication,Classification(逆转录病毒科病毒及其复制,分类),pl768-1771,包括表1,在此引入作为参考)。用于产生生产细胞和生产细胞系的逆转录病毒包装系统,和制备该包装细胞系统的方法也是本领域已知的,其中该生产细胞和生产细胞系产生逆转录病毒。典型的包装系统包括至少两个包装载体包括第一个核苷酸序列的第一个包装载体,该序列包括gag,pol或gag和pol基因;和包括第二个核苷酸序列的第二个包装载体,该序列包括异种或功能上修饰的包膜基因。逆转录病毒序列可以源自慢病毒,如HIV。载体可以缺乏功能性tat基因和/或功能性辅助基因(vlf,vpr,vpu,vpx,nef)。系统可以进一步包括第三个包装载体,具有包括rev基因的核苦酸序列。可以以含有第一个,第二个和任选第三个核苷酸序列的包装细胞形式来提供包装系统。本发明适用于各种表达系统,尤其是使用真核细胞的那些,有利地哺乳动物细胞。在天然蛋白糖基化的情况中,优选表达系统是给表达的蛋白质提供天然样糖基化的一种表达系统。慢病毒共享几个结构病毒粒子蛋白,包括包膜糖蛋白SU(gpl20)和TM(gp41),其由env基因编码;CA(p24),MA(pl7)和NC(p7-11),其由gag基因编码;和RT,PR和IN,由pol基因编码。HIV-1和HIV-2含有涉及合成调控和加工病毒RNA以及其他复制功能的辅助和其他蛋白质。可以从重组系统省略(或灭活)由vif,vpr,vpu/vpx和nef基因编码的辅助蛋白。此外,可以将tat和rev省略或灭活,例如,通过突变或删除。第一代慢病毒载体包装系统提供了用于gag/po1和env的分开的包装构建体,并出于安全原因,通常使用异种或功能上修饰的包膜蛋白。在第二代慢病毒载体系统中,删除或灭活辅助基因,vif,vpr,vpu和nef。第三代慢病毒载体系统是从其删除或另外灭活(例如,通过突变)了tat基因的那些。通过使用强组成型启动子如人巨细胞病毒立即早期(HCCAV-IE)增强子/启动子来提供通常由tat提供的转录调控的补偿。可以基于组成型启动子活性,目标组织的特异性(例如,肝脏-特异性启动子)或其他与所需表达控制相关的因素来选择其他启动子/增强子,如本领域所知的。例如,在一些实施方案中,理想的是使用诱导型启动子,如""来获得受控表达。可以在分开的表达构建体上提供编码"v的基因,使得典型的第三代慢病毒载体系统将包括四个质粒其中各自用于gagpol,rev,包膜和转移载体。与所用的包装系统的世代无关,可以在单个构建体或分开的构建体上提供gag和pol。通常,将包装载体包括于包装细胞中,并通过转染,转导或感染引入细胞中。用于转染,转导或感染的方法上本领域技术人员已知的。可以通过转染,转导或感染将本发明的逆转录病毒转移载体引入包装细胞系中,来产生生产细胞或细胞系。可以通过包括例如磷酸《丐转染,中。在一些实施方案中,将包装载体和诸如neo,二氢叶酸还原酶(DHFR),谷氨酰胺合成酶或ADA的显性选择标记一起引入细胞中,接着在合适药物的存在下选择并分离克隆。可以将选择标记基因在物理上连接由包装载体编码的基因。其中设置包装功能使其通过合适包装细胞得到表达的稳定细胞系是已知的。例如,参见US专利No.5,686,279;和Ory等,1996,Proc.Natl.Acad.Sci.93:11400-11406,其描述了包装细胞。稳定细胞系产生的更多描述可以在Dull等,1988,J.Virol.72(11):8463-8471;和Zufferey等,1998,J.Virol.72:9873-9880中找到。Zufferey等,1997,Nat.Biotechnol.15:871-75,教导了一种慢病毒包装质粒,其中删除了包括HIV-1包膜基因的pol的序列3,。构建体含有tet和rev序列并用polyA序列替代3,LTR。由另一个启动子,如诱导型的,替代5,LTR和psi序列。例如,可以使用CMV启动子及其衍生物。包装载体可以含有包装功能的其他改变,来提高慢病毒蛋白表达和提高安全性。例如,可以除去所有gag的HIV序列上游。此外,可以除去包膜的序列下游。此外,可以进行修饰载体的步骤来提高RNA的剪接和翻译。任选地,使用条件型包装系统,如Dull等,1998,上文中所述的。还优选使用自我灭活载体(SIN),其通过删除HIV-1长末端重复序列(LTR)提高了载体的生物安全性,如所述的,例如,Zufferey等,1998,丄Virol.72:9873-9880。也可以使用诱导型载体,如通过四环素诱导的LTR。启动子本发明的载体通常包括异种控制序列,其包括,但不限于,组成型启动子,如巨细胞病毒(CMV)立即早期启动子,RSVLTR,MOMLVLTR和PGK启动子;组织或细力包类型特异性启动子,包括mTTR,TK,HBV,hAAT,调控型或诱导型启动子,增强子等。有用的启动子包括LSP启动子(III等,1997,BloodCoagul.Fibrinolysis8S2:23-30),EFl-a启动子(Kim等,1990,Gene91(2):217-23)和Guo等,1996,GeneTher.3(9):802-10)。最优选的启动子包括延伸因子l-a(EFla)启动子,磷酸甘油酸盐激酶-1(PGK)启动子,巨细胞病毒立即早期基因(CMV)启动子,嵌合肝特异性启动子(LSP),巨细胞病毒增强子/鸡P-肌动蛋白(CAG)启动子,四环素应答性启动子(TRE),转曱状腺素蛋白启动子(TTR),猿病毒40(SV40)启动子和CK6启动子。用于本发明实践中有利的启动子是腺病毒主要晚期启动子(Berkner和Sharp,1985,Nucl.AcidsRes.13:841-857)。下文中提供了特意举例说明的使用腺病毒主要晚期启动子的表达载体的序列。这些和各种其他启动子的序列是本领域已知的。可以从公众本发明实践中特别优选的启动子是腺病毒主要晚期启动子。表达盒在5,至3'方向中可以包括腺病毒主要晚期启动子,可操纵地连接目标蛋白或目标蛋白链的第一个编码序列的三联前导序列,编码自我加工序列或蛋白酶裂解序列的第二个编码序列,以及任选编码自我加工序列或蛋白酶裂解序列的序列,之后为目标蛋白或蛋白链的第三个编码序列。所有这些序列共价连接并在相同的阅读框中,使得不在多蛋白编码序列内终止翻译。在蛋白质合成过程中或多肽合成完整后,自我加工或蛋白酶解加工将多蛋白裂解成合适的蛋白链或蛋白质。在免疫球蛋白合成的情况中,轻链的编码序列在多蛋白编码序列内存在两次。有利地,前导序列编码片段可以与蛋白或蛋白链序列相连;通过信号肽酶的加工具有除去加工位点蛋白下游N-端的特定残余氨基酸残基的附加益处。免疫球蛋白重链的组成部分是Met,蛋白质启动曱硫氨酸;HC,重链;LC,轻链,SPPC,自我加工或蛋白酶裂解位点。免疫球蛋白合成的表达构建体可以包括以下的Met-蛋白酶-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC;Met-蛋白酶隱SPPC-LC前导序列-LC-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC;Met-蛋白酶-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC誦SPPC-LC前导序列-LC;HC前导序列-HC-SPPC-LC前导序列-LC-SPPC-LC前导序列-LC;LC前导序列-LC-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC;LC前导序列-LC-SPPC-LC前导序列-LC-SPPC-HC前导序列-HC;Met-蛋白酶-SPPC-HC前导序列-HC-SPPC-LC前导序列-LC。图1中图示了特意举例说明的多蛋白编码序列(产物Met-HC前导序列-HC-工程化的弗林蛋白酶位点-TEV裂解位点-TEVNia蛋白酶-TEV裂解位点-LC前导序列-LC),并且图2中显示了用于该构建体表达的表达载体的图示。对于其HC和LC序列,抗-TNFa是一种示例抗体。对于治疗抗体的生产不需要LC前导序列。SPPS是TEV蛋白酶识别位点,并且存在5'编码的弗林蛋白酶位点至TEV位点。TEV裂解后的弗林蛋白酶裂解恢复了重链"正确的"C端赖氨酸残基。表l中显示了D2E7-TEV表达载体的完整DNA序列。已经设计了特意举例说明的D2E7多蛋白表达构建体/r^nmtt/"itt/"i人丄A^rJ"/丄力At;7tni厶vbtrii右iiW/土m,aVUZ£i/-LOLL-my,议4AJ疋'KF、^3^gW、J甲取主夂门f又7T'1^乂卞J资白酶序列来裂解。已经修饰D2E7轻链C端来添加弗林蛋白酶裂解位点。这导致(通常)倒数第二个氨基酸从Glu至Arg的改变和C-端赖氨酸的添加。通过将两个LC序列5,置于HC,两个LC拷贝保持相同的氨基酸序列。表6C中显示了表达载体完整的核苷酸序列,表6B和6A中各自显示了多蛋白的氨基酸序列和编码序列。还可以参见SEQIDNO:29-31。图7中显示了图示的表达载体图语。另一个特意举例说明的多蛋白(及其编码序列)是ABT-007-TEV的;各自参见表2B和2A。参见SEQIDNO:33和32。该重组抗体特异性地结合促红细胞生成素受体(EroR)。表2C(SEQIDNO:35)中显示了编码工程化ABT-007-TEV多蛋白的表达载体的完整序列。还可以参见SEQIDNO:34。图3中显示了载体的图示。另外特意举例说明的多蛋白及其编码序列是ABT-874-TEV的;各自参见表3B和3A。该抗体特异性地结合白细胞介素-12。图4中显示了表达载体的图示。还可以参见SEQIDNO:35-37。再一特意举例说明的多蛋白(及其编码序列)是EL246-GG-TEV的;参见表4B和4A。其中编码的抗体特异性地结合E/L选择素。图5中以图示的形式提供了表达载体。还可以参见SEQIDNO:38-40。ABT-325-TEV是具有白细胞介素-18结合特异性的工程化抗体。表5A和5B中各自给出了多蛋白的编码序列和氨基酸序列,并且表5C中提供了完整的表达载体序列。图6中显示了用于其合成的表达载体。还可以参见SEQIDNO:41-43。还提供了除去了核定位信号(NLS)的TEV蛋白酶(TEVNLS-)。还可以在细胞中作为分开的载体或分开的转录物的一部分来瞬时或稳定表达TEV或TEV(NLS-)。可以各自在之前的NLS部分通过引入ER锚定序列或通过融合小核糖体结合蛋白将TEV(NLS-)蛋白锚定ER或核糖体。的蛋白酶解裂解的讨论,、可以理^在体夕口卜使用合适的蛋白酶收集那些蛋白质后可以获得多蛋白和前体蛋白(前蛋白)。在本发明的范围内,特别的表达的抗体(免疫球蛋白)可以包括,特别是,特异性结合以下物质的那些肿瘤坏死因子(对应于和/或源自HUMIRA/D2E7的工程化抗体;AbbottBiotechnologyUd.的阿达木单抗(adalimumab)的商标,Hamilton,Bermuda);白细月包介素-12(源自ABT-874的工程化抗体);白细胞介素-18(源自ABT-325的工程化抗体);重组促红细胞生成素受体(源自ABT-007的工程化抗体);白细胞介素-18(源自ABT-325的工程化抗体);或E/L选择素(源自EL246-GG的工程化抗体)。表1-5中显示了工程化多蛋白的编码序列和氨基酸序列。适于本发明的更多抗体包括,例如,Remicade(英夫单抗);Rituxan/Mabthera(利妥希玛);Herceptin(司徒曼布);Avastin(bevacizumab);Synagis(paliviz謹ab);Erbitux(Cetuximab);Reopro(阿昔单抗);OrthocloneOKT3(鼠单克隆抗体-CD3);Zenapax(daclizumab);Simulect(basiliximab);Mylotarg(gemtuzumab);Campath(alemtuzumab);Zevalin(ibritumomab);Xolair(omalizumab》Bexxar(tositumomab)和Raptiva(efalizumab);其中通常是商标名接着括号内的是代表性的一般名称。其他合适的蛋白质包括,例如,epoetinalfa,epoetinbeta,etanercept,darbepoetinalfa,filgastim,干扰素pla,干扰素卩lb,干扰素a-2b,胰岛素glargine,somatropin,teriparatide,follitropina,链道酶,因子VIII,因子VII,因子IX,伊米苦酶,nesiritide,lenograstim和VonWillebrand因子中的一种或多种;其中一个或多个一般命名可以各自对应于产品的一个或多个商标名。适于本发明的其他抗体和蛋白质是本领域技术人员已知的。本发明还包括两个或多个目标多肽或蛋白或前体蛋白的编码序列的受控表达。基因调控系统在特定基因的受控表达中是有用的。在一个示例性方法中,基因调控系统或开关包括具有配体结合结构域的嵌合转录因子,转录激活结构域和DNA结合结构域。结构域实际上可以因系统还包括DNA应答元件,其与嵌合转录因子相互作用。将该转录调控序列邻接待调控的基因安置。实践本发明中可使用的示例性转录调控序列包括,例如,果蝇蜕皮激素系统(Yao等,1996,Proc.Natl.Acad.Sci.93:3346),蚕蜕皮激素系统(Suhr等,1998,Proc.Natl.Acad.Sci.95:7999),GeneSwitch(Valentis的商标名,TheWoodlands,TX)合成孕酮受体系统,其使用RU486作为诱导剂(Osterwalder等,2001,Proc.Natl.Acad.Sci.USA98(22):12596-601);Tet和RevTet系统(四环素调控的表达系统,BDBiosciencesClontech的商才示,MountainView,CA),其4吏用小分子,如四环素(Tc)或类似物,例如,强力霉素,来调节(打开或关闭)目标的转录(Knott等,2002,Biotechniques32(4):796,798,800);ARIAD调控技术(Ariad,Cambridge,MA),其是基于使用小分子来集合两个胞内分子,其中每个连接转录激活子或DNA结合蛋白。当这些成分在一起时,激活了目标基因的转录。Ariad具有基于均二聚的系统和基于杂二聚的系统(Rivera等,1996,NatureMed.2(9):1028-1032;Ye等,2000,Science283:88-91)。将本发明包括抗体或其片段或其他以自我加工或蛋白酶裂解重组多肽形式的异种蛋白或前体蛋白的核酸编码序列的表达载体构建体引入细胞中,用于体外、离体(exvivo)或体内传送外源物质,治疗剂或转基因至细胞中,例如,体细胞,或用于通过载体转导细胞的重组多肽生产中。宿主细胞和载体的传送可以使用本领域已知的标准方法将本发明的载体构建体在体外或exvivo引入合适的细胞中。这样的技术包括,例如,使用磷酸钓的转染,微注射至培养的细胞中(Capecchi,1980,Cell22:479-488),电穿孑L(Shigekawa等,1988,BioTechnology6:742-751),脂质体介导的基因转移(Mannino等,BioTechnology6:682-690),脂质介导的转导(Feigner等,1987,Proc.Natl.Acad.Sci.USA84:7413-7417),和使用高速基因枪的核酸传送(Klein等,1987,Nature327:70-73)。为了在体外或离体(exvivo)表达,可以使用有效表达功能性蛋白产物的任何细胞。用于蛋白表达的各种细胞和细胞系实例是本领域已知的。例如,原核细胞和昆虫细胞可以用于表达。此外,可以使用真核微生物,如酵母。在原核,昆虫和酵母系统中的重组蛋白表达通常是本领域已知的并适用于使用本发明的组合物和方法的抗体或其他蛋白表达。用于表达的细胞实例进一步包括哺乳动物细胞,如成纤维细胞,来自非人哺乳动物的细胞,如绵羊,猪,鼠和牛细胞,昆虫细胞等。哺乳动物细胞的特定实例包括,但不限于,COS细胞,VERO细胞,Hela细胞,中国仓鼠卵巢(CHO),CHODXBll细胞,CHODG44细胞,PerC.6细胞,Sp2/0细胞,293细胞,NSO细胞,3T3成纤维细胞,W138细胞,BHK细胞,HEPG2细胞和MDCK细胞。在常规营养培养基中培养宿主细胞,培养基按照适于引入启动子,选择转化子或扩增编码所需序列的基因而改变。可以在各种培养基中培养哺乳动物宿主细胞。可购得的培养基如Ham,sF10(Sigma),基本培养基(MEM)(Sigma),RPMI1640(Sigma)和Dulbecco,s改良Eagle's培养基(DMEM)(Sigma)通常适用于培养宿主细胞。给定的培养基通常按照需要补充激素和/或其他生长因子(如胰岛素,转铁蛋白或表皮生长因子),盐(如氯化钠,《丐,镁和磷),緩沖剂(如HEPES),核苷酸(如腺苷和胸苷嘧啶),抗生素,微量元素和葡萄糖或等价能源。还以包括适当浓度的任何其他必需补充剂,如本领域技术人员公知的。对于特定细胞系的合适培养条件,如温度,pH等,通常是本领域已知的,使用建议的培养条件用于各种细胞系的培养,例如,ATCC目录中的(在"atcc.org/SearchCatalogs/AllCollections.cfm"在互耳关网上获得或按照商业供应商的所说明的)。可以通过各种途径(例如,皮内,静脉内,胂瘤,进入脑中,门静脉内,腹膜内,机内,进入膀胱中等)在体内给予表达载体,来传送通过自我加工裂解序列连接的多个基因以在动物模型或人患者中表达两个或多个蛋白质或多肽。根据给予的途径,治疗蛋白引发局部(在脑或膀胱中)或全身(其他给予途径)效果。开放阅读框5'的组织特异性启动子的使用导致整个开放阅读框编码的蛋白质或多肽的组织特异性表达。之前已经描述了在体外,离体(exVIVO)或在体内将携带转基因的重组表达载体引入目标细胞中的各种方法,并且是本领域公知的。本发明提供了治疗方法,疫苗和癌症疗法,通过用含有两个或多个目标蛋白或多肽的编码序列的重组载体感染靶向的细胞,并在靶向的细胞中表达蛋白质或多肽。例如,本发明重组载体的体内传送可以耙向各种器官类型,包括但不限于,脑,肝脏,血管,肌肉,心脏,肺和皮肤。在离体(exvivo)基因转移的情况中,从宿主取出目标细胞并使用本发明的载体和本领域公知的方法在实验室中进行遗传修饰。可以使用常规给予模式来给予本发明的重组载体,包括但不限于上述的模式。本发明的载体可以是各种剂型,包括但不限于液体溶液和悬浮液,微泡,脂质体和可注射或可灌输的溶液。优选的形式取决于给予模式和治疗应用。本发明的重组表达构建体在免疫球蛋白或其他生物活性蛋白体内生产中的优势包括单个载体的给予,用于患者中长期而持续的抗体表达;具有全部生物活性的抗体或其片段(或其他生物活性蛋白)的体内表达;和人细胞中产生的抗体的天然翻译后修饰。理想地,表达的蛋白与天然产生的蛋白相同或基本上相同,使得在给予表达的蛋白质的情况中没有引发对多种情况的免疫应答,或在需要所述蛋白的患者中连续表达。在用于治疗或研究的重组抗体和其他生物活性蛋白的体外生产中发现了本发明的重组载体构建体的更多用途。重组蛋白生产的方法是本领域已知的并可以用于重组抗体的表达,使用在此所述的含自我加工裂解位点或其他蛋白酶裂解位点的载体构建体。在一个方面中,本发明提供了生产重组免疫球蛋白或其片段的方载体在5'至3'方向包括可操纵地连接免疫球蛋白重链和两个轻链或其片段的编码序列的启动子,每个所述链之间的自我加工序列如2A或2A-样序列或蛋白酶裂解位点。认识到任一免疫球蛋白重链的编码序列或免疫球蛋白轻链的编码序列可以是给定的载体构建体中2A序列的5'(即,第一个)。或者,可以作为多蛋白的一部分来表达与蛋白酶裂解位点同源的蛋白酶,使得与剩余的多蛋白自我加工或通过分开的(或相同的)蛋白酶蛋白酶解裂解。可以通过置换相关的编码序列以加工过的活性形式表达其他多链蛋白或其他蛋白质(如来自双杂交或三杂交系统的那些),散置自我加工位点或蛋白酶识别位点也可以产生大小正确的分开的蛋白质。双(或其他)杂交系统方法已经用于筛选cDNA文库,用于蛋白复合物的已知配体或亚基的之前未知的结合伴倡。对该系统进行合适的改变,还可以鉴定已知复合物中抑制,竟争或破坏结合的蛋白质或亚基。尽管双(和其他)杂交系统已经用于各种科学研究中,但因为相当大频率的假阳性或假阴性结果,这些系统可能是无效的。至少在一些情况中,那些假信号已经引起"诱舛"蛋白相对于候选结合伴倡蛋白或候选破坏蛋白的相对表达的不平衡。本发明策略的其他优势在于只将一个质粒转染或转化至宿主细胞中,并且对于该质粒只需要单次选择,替代了二元载体双杂交方案中的两次选择。该方法还适用于三杂交系统。对于双杂交系统的讨论,参见Toby和Golemis,2001,Methods24:201-217;Vidal和Legrain,1999,Nucl.AcidsRes.27:919-929;Drees,B,1999,Curr.Op.Chem.Biol.3:64-70;和Fields和Song,1989,Nature340:245-246。图9显示了用于诱何和猎物蛋白(或候选猎物蛋白)的多蛋白/自我加工或蛋白酶裂解表达策略的图示,图8显示了含有表达盒的载体,使用该方法用于诱斜和猎物蛋白。将载体表达盒结构化,将诱饵蛋白首先翻译成GAL4::诱何::2A肽融合体,其在2A肽翻译后自我加工。第二个开放阅读框(ORF)双NFkB::文库融合蛋白。将诱何蛋白工程化至MCS1需要框内翻译成2A自我加工肽序列。MCS2下游中表达文库的工程化是不太关H。在此提供的策略可以相似地用于作为通过蛋白酶解裂解加工成成熟活性形式的前体形式表达的蛋白质的表达,因此提供用于重组表达的组合物和方法。这样的蛋白质的实例包括但不限于白细胞介素1和18(IL-1和IL-18)胰岛素。在炎性细胞的细胞质中产生IL-1和IL-18。这些分子缺乏传统的分泌信号,并且必须通过蛋白酶来裂解,以便分泌为生物活性形式。通过白细胞介素转化酶(ICE)将IL-1加工成成熟形式。通过caspase将Pro-IL-18转化成成熟IL-18。这些重组形式分子的生产是困难的,因为通常用作宿主的细胞不表达产生这些蛋白生物活性成熟形式需要的蛋白酶。这些没有pro结构域的细胞因子的表达导致没有活性的分子和/或低水平的产生。本发明提供了初级翻译产物,其在pro结构域和成熟多肽的氨基酸之间含有工程化的自我加工位点(例如,2A序列)或插入的蛋白酶裂解位点,不需要表达与目标蛋白平行的潜在毒性蛋白酶。在相关的方面中,本发明提供了产生重组免疫球蛋白或其片段的方法,通过将如上所述的表达载体引入细胞中,其中载体在第一个和第二个免疫球蛋白编码序列之间进一步包括另外的裂解位点。优选的其他蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQIDNO:1)的弗林蛋白酶裂解位点。对于讨论,参见US专利公开2005/0003482Al。在本发明的一个示例性方面中,载体引入或给予细胞后是一个或多个以下的步骤在选择细胞和表达多蛋白或前体蛋白的条件下培养转染的细胞;测量免疫球蛋白或其片段或其他蛋白的表达;和收集免疫球蛋白或其片段或其他蛋白。本发明的另一个方面提供了用于表达重组免疫球蛋白或其片段或其他目标蛋白的细胞,其中细胞包括用于表达两个或多个免疫球蛋白链或其片段或其他前体蛋白或蛋白的表达载体,可操纵地连接免疫球蛋白或其他链或其片段的第一个编码序列的启动子,自我加工或其他裂解编码序列,如2A或2A-样序列或蛋白酶识别位点,和免疫球蛋白或其他链或其片段的第二个编码序列,其中将自我加工裂解序列或蛋白酶识别位点编码序列插入第一个和第二个编码序列之间。在相关的方面中,细胞包括如上所述的表达载体,其中表达载体在第一个和第二个免疫球蛋白或其他目标编码序列之间进一步包括另外的蛋白酶解裂解位点。优选的其他蛋白酶解裂解位点是具有一致序列RXK/R-R(SEQIDNO:1)的弗林蛋白酶裂解位点。如在此所用的,"免疫球蛋白分子或其片段的第一个链的编码序列"指的是编码蛋白质分子的核酸序列,蛋白分子包括但不限于抗体或免疫球蛋白的轻链或重链,或其片段。编码抗体或免疫球蛋白第一个或第二个链或其片段的序列包括源自IgG,IgM,IgD,IgE或IgA的重链或其片段。如宽泛地所述的,编码抗体或免疫球蛋白链或其片段的序列还包括来自lgG,IgM,IgD,IgE或IgA的轻链或其片段。完整抗体分子及其修饰或衍生形式的基因,包括,例如,其他抗原识别分子片段,如Fab,单链Fv(scFv)和F(ab,)2。抗体和片段可以是动物产生的,人-鼠嵌合的,人源化的,通过Deimmunisation(BiovationLtd)改变的,改变对Fc受体的亲和性,或全部是人的。理想地,抗体或其他重组蛋白没有在给予的人或动物中引发免疫应答。抗体可以是双特异性的,并且包括但不限于,二抗(diantibody),四源杂交瘤(quadroma),迷你抗体,ScBs抗体和knobs-into-holes抗体。可以以本领域公知的各种方式获得抗体自身的产生和收集(Harlow等,1988,Antibodies,ALaboratoryManual(抗体,实验室手册),ColdSpringHarborLaboratory。根据本领域公知的方法收集和/或纯化和/或使用其他目标蛋白。在实践本发明中,可以在适于宿主细胞生长和编码序列表达的培养条件下培养修饰的重组宿主细胞来实现使用重组DNA技术的抗体或其变体(类似物)的生产。为了监控表达的成功,可以使用标准技术如ELISA,RIA等监控相对于抗原的抗体水平。使用本领域已知的标准基数从培养物上清液收集抗体。当然,可以通过标准纯化技术容易地制得这些抗体的纯化形式,这些技术包括但不限于,通过蛋白A,蛋白G或蛋白L柱的亲和色谱,或相对于特定的抗原,或甚至相对于抗原的特定抗原决定部位,对于该抗原的特异性是所需的。还可以使用常规色谱纯化抗体,如离子交换或大小排阻柱,结合其他技术,如硫酸铵沉淀和大小限制的膜滤。将表达系统设计来包括信号肽的情况中,将所得到的抗体分泌至培养基或上清液中;然而,也可以是胞内生产。之前已经描述了从人Ig基因座工程化的小鼠生产和选择抗原特异性的全部是人的单克隆抗体(Jakobovits等,1998,AdvancedDrugDeliveryReviews31:33-42;Mendez等,1997,NatureGenetics15:146-156;Jakobovits等,1995,CurrOpinBiotechnol6:561-566;Green等,1994,NatureGeneticsVol.7:13-21)。已经在转基因山羊的奶中获得治疗性单克隆抗体的高水平表达,并已经表明抗原结合水平等于使用常规细胞培养技术产生的单克隆抗体。该方法是基于转基因动物奶中人治疗性蛋白的产生,这些转基因动物携带使它们在奶中表达人治疗性蛋白的遗传信息。一旦产生,可以使用标准技术从奶中有效地纯化这些重组蛋白。参见,例如,Pollock等,1999,丄Immunol.Meth.231:147-157和Young等,1998,ResImmunol.149(6):609-610。已经证明了来自转基因动物的动物奶,蛋清,血液,尿液,精浆和蚕茧可以作为工业规模生产重組蛋白的来源(HoudebineLM.2002,CurrOpinBiotechnol13:625-629;Little等,2000,ImmunolToday,21(8):364-70;和GumT.2002,Nature,417:584-5860。本发明包括转基因动物表达系统的用途,用于表达重组抗体或变体(类似物)或其他目标蛋白,使用本发明的自我加工裂解位点-编码和/或蛋白酶识别位点载体。也已经成功证明了植物中的重组蛋白生产,包括但不限于,通过农杆菌感染,基因枪转化,原生质体转化等转化的土豆,番茄,烟草,水稻和其他植物。已经证明了转基因烟草植物的种子中的重组人GM-CSF表达和植物中包括单链抗体的抗体表达。参见,例如,Streaffield和Howard,2003,Int.J.Parasitol.33:479-93;Schillberg等,2003,CellMolLifeSci.60:433A5;Pogue等,2002,Annu.Rev.Phytopathol.40:45-74;和McCormick等,2003,JImmunologicalMthods,278:95-104。本发明包括转基因植物表达系统的用途,用于表达重组免疫球蛋白或其片段或其他目标蛋白,使用本发明的蛋白酶裂解位点或自我加工裂解位点编码载体。杆状病毒载体表达系统结合昆虫细胞也得到了进展,作为重组蛋白生产的可行平台。已经报道了杆状病毒载体表达系统提供了相对于哺乳动物细胞培养物的优势,如易于培养和较高的表达水平。参见,例如,Ghosh等,2002,MolTher.6:5-11,和Ikonomou等,2003,ApplMicrobiolBiotechnol.62:1-20。本发明进一步包括杆状病毒载体系统的用途,用于表达重组免疫球蛋白或其片段,使用本发明的自我加工裂解位点编码载体。杆状病毒载体和合适的宿主细胞是本领域公知的并可购得。还可以使用基于酵母的系统,用于表达重组免疫球蛋白或其片段或其他目标蛋白,包括双-或三-杂交系统,使用本发明的自我加工裂解位点。参见,例如,US专利No.5,643,745,在此引入作为参考。可以理解发现本发明的包括单独的自我加工肽的编码序列或结合其他的蛋白酶解裂解位点的编码序列的表达盒和载体和重组宿主细胞在重组免疫球蛋白或其片段,前体蛋白,生物活性蛋白和双-和三-杂交系统的蛋白组成部分表达中的用途,在各种本领域已知的任何蛋白质表达系统中,并且在此描述了其实例。当要求化合物,构建体或组合物时,应当理解不包括本领域已知的化合物,构建体和组合物,包括通过在此公开的参考文献中教导的那些。在此使用马库什基团或其他基团时,确定说明书中单独包括基团的所有单个成员和基团内所有可能的组合和亚组合形式。实施例1.使用蛋白内含子介导的加工的免疫球蛋白表达抗体分子有效表达的策略是通过多蛋白表达,其中蛋白内含子位于重链和轻链之间,具有蛋白内含子序列和/或连接序列的修饰,使得存在组成蛋白的释放,而没有N-端和C-端蛋白的连接。在这样的构建体内,可以存在相关重链和轻链各自的一个拷贝,或轻链可以是双倍的,或可以存在重链和轻链的多个拷贝,只要提供功能性裂解序列来促进多蛋白内每个免疫球蛋白衍生的蛋白质的分离。可以多次使用蛋白内含子策略或可以将不同的蛋白酶解加工序列或酶置于免疫球蛋白产生的蛋白质的至少一个末端。已经如上简述的将来自极端嗜热古菌的蛋白内含子引入构建体中并已经显示出成功地产生了正确加工的和全部功能的D2E7抗体。测试的其他蛋白内含子来自酿酒酵母和集胞藻。已经通过ELISA表明菌林PCC6803产生分泌的抗体。极端嗜热古菌PhoPoll蛋白内含子的PCR扩增和亚克隆以下的寡核苷酸用于极端嗜热古菌PhoPol蛋白内含子的扩增(NCBI/蛋白质登录号#059610,完整DNA聚合酶IDNA序列的GenBank登录号#为BA00001.2:1686361..1690068,取自极端嗜热古菌的完整基因组序列),使用基因组DNA作为模板和PlatinumTaqHiFidelityDNA聚合酶Supermix(Invitrogen,Carlsbad,CA)。基因组DNA购自ATCC。极端嗜热古菌int-5,AGCATTTTACCAGATGAATGGCTCCC(SEQIDNO:52)极端嗜热古菌int-3,AACGAGGAAGTTCTCATTATCCTCAAC(SEQIDNO:53)根据以下的程序运行PCR:步骤12345678温度94'C94。C55°C72。C转到步骤2(34次)72°C4'C结束时间2minlminlmin2min5min保持将PCR产物亚克隆至pCR2.1-TOPO(Invitrogen)中,并将插入片段测序并证明正确性。当时认识到由于打印输出错误,存在从蛋白内含子3'端的序列丢失。然后在随后的连接蛋白内含子与D2E7的重链和轻链的PCR反应过程中,填补了丢失的序列。为了产生D2E7重链-蛋白内含子-D2E7轻链的融合体,设计了寡核苷酸引物。设计引物使得PCR产物可以用作随后PCR反应中的引物。<table>tableseeoriginaldocumentpage94</column></row><table>说明组成部分的序列代码:重链序列(粗体红色)-轻链序列(下划线)-极端嗜热古菌蛋白内含子序列(无格式的Arid)-极端嗜热蛋白内含子序列(粗体下划线蓝色)Srfl识别序列GCCCGGGC(双下划线)绿色—ajny丄迟别—序—列——Q—QAT—G^L(——裝—色—虛—下—划—线丄终止密码子,TCA(TimesNewRoman,Olive)KozakD2E7重链-蛋白内含子-D2E7轻链融合体的PCR扩增和装配使用如上产生的pCR2.1-TOPO-极端嗜热古菌蛋白内含子克隆作为模板,使用引物极端嗜热古菌lnt-5,和修正的P.hori-3,进行PCR,给蛋白内含子恢复正确的3,端。所用的聚合酶是PfulDNA聚合酶,以避免使用PlatinumTaq发生的A-加尾。根据以下的程序运行PCR:步骤12345678温度94°C94°C55°C72'C转到步骤2(34次)72°C4'C结束时间2minlminlmin2min5min保持使用QiaquickGel提取试剂盒(Qiagen,Valencia,CA)凝胶纯化prRi广據^膝弁卞一4曰《点M4藍拓进行三组PCR反应来产生蛋白内含子编码序列,使用不同数目的蛋白内含子编码序列的蛋白外显子残基5,和3,。蛋白外显子密码子来自极端嗜热古菌中的天然DNA聚合酶基因,该蛋白内含子是天然部分。所用的引物如下组1引入了零蛋白外显子序列(HC-蛋白内含子-5,和修正的LC-蛋白内含子-3,),组2在蛋白内含子(HC-蛋白内含子(laa)-5,和修正的LC-蛋白内含子(laa)-3,)的两端引入了一个氨基酸(3个碱基对),组3在蛋白内含子(HC-蛋白内含子(3aa)-5,和修正的LC-蛋白内含子(3aa)-3,)的两端引入了三个氨基酸(9个碱基对)。PCR程序和以上给出的相同。使用QiaquickGel提取试剂盒(Qiagen)凝胶纯化PCR扩增产物。将这些产物用作下一组反应的引物。进行三组PCR反应来产生D2E7重链与蛋白内含子的融合体,其中使用0,1或3个蛋白外显子氨基酸。用于反应的模板是D2E7重链DNA。将上述的PCR产物各自用作3'引物,将HC-Srfl-5,用作所有反应中的5'引物。使用PfulDNA聚合酶。根据以下程序运行PCR:步骤12345678温度94。C94。C50。C72°C转到步骤2(34次)72'C4'C结束时间2minlminlmin3min5min保持使用QiaquickGel提取试剂盒(Qmgen)凝胶纯化PCR扩增产物。将这些产物用作下一组反应的引物。进行三组PCR反应来产生D2E7重链-蛋白内含子与D2E7轻链的融合体,其中使用0,1或3个蛋白外显子氨基酸。用于反应的模板是D2E7轻链DNA。将以上所述的PCR产物各自用作5,引物,将LC-BamHI-3,用作所有反应中的3,引物。使用PfulDNA聚合酶。根据以下程序运行PCR步骤12345678温度94°C94'C55。C72'C转到步骤2(34次)72'C4。C结束时间2minlminlmin5min5min保持在凝胶上跑胶时,产生的PCR产物扩散并且是稀少的。将这些反应直接用作最后一轮PCR的模板,使用HC-Srfl-5,和LC-BamHI-3,作为模板。使用如上所示的相同PCR程序。使用QiaquickGel提取试剂盒(Qiagen)凝胶纯化PCR产物。将如上所述纯化的PCR产物亚克隆至pCR-Bluntll-TOPO(Invitrogen)中,使用ZeroBluntTOPOPCR克隆试剂盒(Invitrogen)。将克隆测序来证实构建体呈现出预期的核酸序列。发现每种类型产物的正确克隆。使用Srfl和Notl从pCR-Bluntll-TOPO切除D2E7重链-蛋白内含子-D2E7轻链盒,并亚克隆至使用相同的酶限制的pTT3中,并凝胶纯化。使用极端嗜热古菌蛋白内含子设计了用于D2E7重链-蛋白内含子-D2E7轻链的三个表达构建体pTT3-HcintLC-p.hori(参见图14的质粒图i普);pTT3-HcintLClaa-p.hori;和pTT3-HcintLC3aa陽p.hori。表IOA.pTT3-HcintLC-p.hori的核苷酸序列(SEQIDNO:62)5'-gcggccgctcgaggccggcaaggGcggatcccccgacctcgacctctggctaataaaggaaatttattttcattgcaatagtgtgttggaatmt^gc卿aatcccttcagttggttggtaGaacttgccaactgggccctgttccacatgtgacacggggg卿accaaacagcagactttgcagtctgtggactgcaacacaacattgcctttatgtgtaactcttggctgaagctcttacaccaatgctg卿gac3tgtacctccc柳ggcccaggaagactacgggaggct3cacc3acgtc3atcagaggggcctgtgtatggggtcagga1tccacgagggtagtgaacca他agtcacaagggcagtggctgaagatcaaggagcgggcagtgtgctatgacaccaatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctccccgaaaattaaacggggctccacgccaatggggcccataaacaaagacaagtggccactc他卿a幼ttgtggagtgg卿c3cgcgtcagcccccacacgccgccctgcgg卿gactgta幼ataagggtgtaat3acttggctgattgtaaccccgctaaccactgcggtcaaaccacttgcccacaaaaccactaatggcaccccggggaatacctgcgcgccaagc3卿ggttgttggtGCtc3tattcacgaggtcgctgagagcacggtgggctaa柳gccatgggt8gcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgct3tcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagattagggteigtateitgctatcctaattteitatct卿tagc3tatactacccaaatatctggatagcatetgctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatotatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaat:ctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctcatgataagctgtc383C8tgagaa加cttgei3g3cg83柳gcctcgtgat3cgcct3tttttat柳tt3atgtcatgsitaata3tggtttctt3gaGgtc柳tggcacttttcgggga肪tgtgcgcgg幼c;ccctatttgtttatttttct33ateiG3ttcei8iat卿eitecgctcatg3gacaataaccctgataaatgcttcaataatattgaaaaagga3gagtatgagtattcaacatttccgtgtcgcccttattccc臓gcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcac卿tgggttacatcg3actgg3tctc幼卿cggtaag8tccttg8gagttttcgccccgaag3acg加ccaatgatgagcac他aaagttctgctatgtggcgcggtattatcccgtgttgacgcc卿caagagc3actcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgGtgcGataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcscaacatgggggatcatgtasctcgccttgatcgttgggaaccggagctg站tg3agccataccaaacgacg的cgtgacaccacg鄉cctgcagca8tggca3caacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctg3t站3tctggagccggtgagcgt卿tctcgcggtatcattgcagcactggggccagatggtaagccctcccgt3tcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttGgttccactgagcgtcagaccccgtaga貼柳tcaa柳atcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaa3ccaccgctaccagcggtggtttgtttgccggatca8g3gctaccaactctttttccga3ggtaactggcttcagcagagcgcagataccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagcacGgcctaGatacctcgctctgGtaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttacc卿ttggactcei3gacgatagttaccggat3aggcgcagcggtcgggctg貼cggggggttcgtgc8cacagccGagcttggagcg朋cgacctacaccgaactgagataccta(:agcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacga卿agcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctg8cttgsigcgtcg3tt卿gmgGtcgtc柳ggggcggagcctatgga咖acgccagcaacgcggccttmacggttcctggccttttgctggcc卿ctcacatgttctttcctgcgttatccGCtgattGtgtggataaccgtatteGcgccttt卿tgagctgataccgctcgccgcagccga卿3Cccgattcattaatgcagctggcacg3caggtttcccgactgg貼agcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttac3ctttatgcttccggctcgtatgttgtgtgga8ttgtgagcgg3taaceiatttcacacaggaaacagctatgaccatgattacgccaagctctagctagaggtcgacGaattctcatgtttgacagctteitcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatctctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactcacgggg础cc朋gtetcc8ccccattgacgtcaatgggagtttg加ggcaccaaaatoaacgggactttccaaaatgt83Ccgagtccgcatcgaccggatcgga的acctctcgagaa鄉cgtetaaGC3gtc3C3gtcgcaaggtaggctgagaagc卿cattacttctgcgctaagattgtcagmccaaaaacgaggaggatttgatattcacctggcccgatctggccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-gaggtgcagctggtggagtctgggggaggcttggtacagccGggcaggtccctgagactctectgtgcggcctetggggaatagtggtcacatagactatgcggactctgtgga卯gccgattcaccatctccagagacaacgccaagaactcc卿atctgcaaatgaacagtctgeigagctgaggatacggccgtatatt3卿gcg33agtctcgtacctmgcaccgcgtcctcccttgactattggggccaaggtaccc卿caccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctcca8卿cacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaeictcaggcgccctgaccagcggcgtgcacaccttcccgg卿cctacagtectcaggactctactccctcagcagcgtggtg3ccgtgccctccagcagcttgggcacccagacctacatctgc3acgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacasaactceicacatgccGaccgtgcGcagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtgg柳tgcat8atgcc卿織鄉ccgcggg柳agcagtaca3cagc8cgtaccgtgtggtcagcgtoctcaccgtGctgGaccaggactggctg貼tggcaaggagtac8agtgcaaggtctccaacaa3gccctcccagcccccatcgagaaaaccatctccaaagccaaagggc3'gccccgagaaccac鄉tgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcGtgacGtgcGtggtcaaaggcttotatccGagcgacatcgccgtggagtggg卿gcaat卿cagccgg3gaacaactac朋gaccacgcctcccgtgctggactccgacggctccttcttcctctecagc犯gctcaccgtggacei卿gc柳tggceigca卿ga卿tcttctC3tgctccgtgatgcatgaggGtctgcac朋ccactaGacgGagaagagcctctGcctgtctccgggtaaa-agca他accagatgaatggctcccaattgttgaaaatgaaaaagttcgattcgtaaaaattggagacttcatagatagggagattgagg33aacgctgagagagtga6ig鄉gatggtgae1e1ctgaaattct3g柳tt站agatettaa3gGcctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaa加gacaccgctattcagggggaaagctagttaaggtcaggggagatgaacteaagcctggtgatctcgttgtogttccaggaaggttaaaacttccagaaagcaagcaagtgctaaatotcgttgaactactectgaaattacccgaagaggagacategaacatcgtaatgatgatcccag加a鄉tagaaagaatttcttcaaa卿atgcteaaaacattatactggatcttcgggg柳gaga幼ggGC肪g33ccgc3gggcgct3tctc33gc8tcttgaa柳ttaggatacgtt33gctc39g8g3agaggctgtg3agttotogactgggagteacttaagaggtacaggaagctttacgagaccctcattaagaacbtgaaatataacggtaatagcagggcatacatggttg3atttaactctctcagggatgtegtg3gctta3tgccaatagaag站ctta柳agtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacataagtagcggagatgtagagaaagatagggtgaagttGG'aGagtaaagatcaaaacgttctcgaggatatagcgaaacttgccgagjiagttatttgg333ggtgagg3gagg33gagg3t3tattg3ggtatc3ggg33aatt3gccatgccatatttagagttttagcggaaggtaagagaattccagagttcatcttcacatocccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatecttctoct.s.rcycscgcgajcg.55ggac.K、TnfF":wnow8>站加Bto-幼Xds.Kf一s3B站卯teSg化.5cg.sc^g绍甜卯a^加S*s、.siS01GflfSajIFRiSWWsa卯1S卯s卯gMisKSIS.TO-OSa3cgascyepkscdkthtcppcpapellggpsvflfppkpkdtlmisrtpevtc兩dvshedpevkf呵vdgvevhnaktkpreeqynstyrvvsvltvlhqclwlngkeykckvsnkalpapiektiskakgqprepqvytlppsrdeltknqvsltclvkgfydivldsvesievekyegyvydlsvednenflvgfgllyahn-mdmrvpaqllgllllwfpgsrcdiqmtqspsslsasvgdrvtitcreisqgimylawyqqkpgkapklliyaastlqsgvpsrfsgsgsgtdffltisslqpedvatyycqrynrapytfgqgtkveikrtvaapsvfifppsdeqlksgtaswcllnnfypre序列的Text/font符号代码pTT3载体-重链-蛋白内含子-轻链在以下的2个构建体中,与以上的构建体的唯一区别时包括极端嗜热古菌(下划线的)天然的蛋白外显子序列。所示的序列从D2E7重链编码片段的末端(如红色所示的最后9个碱基对)至D2D7轻链编码序列的5,端(如粉色所示的头9个碱基对,以分开的线表示)。表IIA.pTT3-HcintLClaa-p.hori部分编码序列(SEQIDNO:64)ttgag诉taatgagaacttcctcgttggcttcggactactttacgcacacaac-atggacatgcgcgtgcccgcccagctgctgggGctgctgctgctgtggttccccggctcgGgatgcgeiGatccagatgacccagtctcc8tcctcc卿ctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctsiagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggaGagatttcactctcaccateagcagcctacagcctgaagatgttgcaacttatta卿caaaggtataaccgtgcaccgtatac冊ggccaggggaccaaggtggaaatcaaacgtacggtggctgcacc3t卿cttcatcttcccgccatctgatgagcagttgaaatctgg3actgcctctgttgtgtgcctgctgaataacttctatccc3gag8ggcGaaagtacagtgg3aggtggataacgccctcca3tcgggt8actccc鄉agagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatc柳gcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt-3'表10B.pTT3-HcintLC-p.hori中开放阅读框的氨基酸序列(SEQIDNO:63)g但9wSaaScacc.£9cascaSaca卯ig咖G9c200680034979.8gggaaggtttacagcattaaactaaagtcagggagaaggateaaaataacctcaggtcatagtetgttctcagtaaatccagaaagcaagcaagtgctaaatctcgttgaactactcctgaaattacccgaagaggagacatcgaacatcgtaatgatgatcccag加aaggtagaaagaatttc加aaaggigatgctcaaaac咖tactggatc加ggggagggagaa柳ccaagaaccgcagggcgctatctcaagcatcttgaaagatt柳atacgttaagctcaagagaagaggctgtgaagttctcgsctgggsgtcscttssgsggtacsggsagctUscgsgsGGctcsttssgsdcctgdddtEtsdGactacataagtagcggagatgtagagaaagatagggtgaagttccacagtaaagatcaaaacgttctcgaggatatagcgaa3cttgccgagaagtt3tttggaaaggtgaggag鄉aag柳atatattg3ggtatc柳gaaaattagccatgccatatttagagttttagcggaaggtaagagaattocagagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatataaagattgaacatgaga站ggggtttacagagtttacataaataagaaggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaaatattaaaaataataaaaacttcctcattaacttcaaactacfflacacacacaacaat-at卿catg-3,表11B.pTT3-HcintLClaa-p.hori部分氨基酸序列,显示重链的4个氨基酸上游和蛋白内含子的四个氨基酸下游(SEQIDNO:65)ysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlwvpgrlklpeskqvlnlvelllklpeeetsnlvmmlpvkgrkessngdivldsvesievekyegyvydlsvednenflvgfgllyshn-s-mdm重链3,序列-蛋白内含子-蛋白外显子-轻链5'序列表12A.pTT3-HcintLC3aa-p.hori部分编码序列(SEQIDNO:66)5'-ccgggtaaa-ttagcaaac-ehMJS,旧AJvCDi,Vk.t2V廿si纩lmw廿Ds-a>SwiSeh付ss加sis边.rcs诅招as,朋卯OJtsta-a.Gs-isisS诉朋Ss-w加.G叩边S.JJJcs,,S>S^g幼IS8>加,cs.ra-K-atsMisB-gM购加的加加s.s的柳s柳ggtsagaag9s-3gccaggggeaiBaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctoctttgaggataatgagaacttcctcgttggcttcggactactttacgcacacaac-agttattac-atggacatg-3'表12B.pTT3-HcintLC3aa-p.hori部分氨基酸序列,显示出蛋白内含子和侧翼序列(SEQIDNO:67)Pgk-lan-shaifrvlaegkripef附spmdikvafdivldsvesievekyegyvydlsvednenflvgfgllyahn-syy-mdm重链3'序列-蛋白内含子-蛋白外显子-轻链5'序列用于构建体A、B、E、H、I、J、K和L的引物为YKF1:GGACTACTTTACGCAGCCAACATGGACATGC(SEQIDNO:68)YKR1:GCATGTCCATGTTGGCTGCGTAAAGTAGTCC(SEQIDNO:69)YKF2:GGACTACTTTACGCAGCCAACAGTATGGACATGC(SEQIDNO:70)YKR2:GCATGTCCATACTGTTGGCTGCGTAAAGTAGTCC(SEQIDNO:7"YKF3:GGTGAGGAGAGGAAGAGG(SEQII〕NO:72)YKR3:CCA(3AGGTCGAGGTCG卿IDNO:73)YKF4:CGGCGTGGAGiGT(3C(SEQIDNO:74)YKR4:CAAC)AATTGGGAGCCA丌CATCTGGTAAMTGGTTTTACCCGGAG(SEQIDNO:75)YKF5:CCGCCCAGCTGCTGGGCGACGACilNO:76》YKF6:tgagcggccgctega(SEQIDNO:78)YKR6:gttgtgtgcgtaaag(SEQIDNO:79)YKF7:agcattttaccagat(SEQIDNO:80)YKFI7:ggtggcgcccaaact(SEQIDNO:81)YKF8:ctttacgcacacaacatggacatgcgcgtg(SEQIDNO:82)YKR8:tcgagcggccgctcaacactctcccct(SEQl[)NO:83)YKF9:agtttgggcgccaccatggagtttgggctg(SEQIDNO:84)YKR9:atctggte幼atgcttttacccggagacag(SEC)IDNO:85)YKF10:agtttgggcgccaccatggacatgcgcgtg(SEQIDNO:86)YKR10:atetggtaaaatgctecactotCGCctgttg(SEQIDNO:87)YKF11:ctttacgcacacaacatggagtttgggctg(SEQIDNO:88》YKR11:tcgaigcggccgctcatttacccggagacag(SEQIDNO:89)YKF12:cgccaagctetagc(SEQIDNO:90)YKR12:ggtcgaggtcgggg(SEQIDNO:91)YKF13:acatgcgcgtgcccgcccagtggttccccggctogcgatg(SEQIDNO:92)YKRl3:catcgcgagccggggaaccactgggcgggcacgcgcatgt(SEQIDNO:93)YKF14:ctttacgcacacaacgacatccagatgacc(SEQIDNO:94)YKR14:ggtoatctggatgtcgttgtgtgcgtaaag(SEQIDNO:95)YKF15:tggttccccggctcgGgaGgcgacatccagatgacc(SEQIDNO:96)YKR15:ggteatctggatgtcgccteccgagccggggaacca(SEQIDNO:97)为了制备构建体A,将质粒pTT3-HC-int-LCp.hori用作模板2,并各自使用诱变引物YKF1和引物YKR3以及诱变引物YKR1和引物YKF3扩增重叠DNA片段。通过PCR产生连接以上2个PCR片段的DNA片段,使用以上2个PCR片段的混合物作为模板,以及引物TKF3和YKR3。然后用限制酶EcoRI和NotI切割该PCR,并克隆至用相同限制酶切割的pTT3-HC-int-LCP.hori中。以用于构建体A相似的方式产生构建体B,除了替代YKF1和YKR1使用诱变引物YKF2和YKR2,并替代质粒pTT3-HC-int-LCP.hon,将质粒pTT3隱HC-int-LC-laaP.hori用作PCR模板,并将pTT3-HC-int-LCP.hori载体用作克隆的背景。为了制备构建体E,使用作为模板的质粒pTT3-HC-int-LC-laaP.hori扩增DNA片段,以及引物YKF4和诱变引物YKR4。用SacII和MfeI切割该PCR片段,并克隆至使用相同限制酶切割的pTT3-HC-int-LCp.hori中。对于构建体H,将pTT3-HC-int-LCP.hori用作模板2,并扩增重叠片段,使用诱变引物YKF5和引物YKR3用于一个片段,以及引物F3和诱变引物R5用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoRI和NotI消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LCp.hori中。为了制备构建体J,将pTT3-HC-int-LCRhori用作模板2,并扩增重叠片段,使用诱变引物YKF13和引物YKR3用于一个片段,以及引物F3和诱变引物R13用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoRI和NotI消化该片段,并克隆至使用相同酶切割的pTT3國HC-int-LCp.hori中。对于构建体K,将pTT3-HC-int-LCP.hori用作模板2。扩增重叠片段,使用诱变引物YKF14和引物YKR3用于一个片段,以及引物F3和诱变引物R14用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoRI和NotI消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LCP.hori中。为了制备构建体L,将pTT3-HC-int-LCP.hori用作模板2,并扩增重叠片段,使用诱变引物YKF15和引物YKR3用于一个片段,以及引物F3和诱变引物R15用于另一个片段。使用以上2个片段作为模板以及引物YKF3和YKR3进行第二轮PCR扩增。用限制酶EcoRI和NotI消化该片段,并克隆至使用相同酶切割的pTT3-HC-int-LCP.hori中。证实了所有构建体的核苷酸序列。所有构建体具有与pTT3-HC-int-LCP.hori相同的序列,除了D2E7重链的最后一个密码子(编码PGK)和D2E7轻链成熟序列的第一个密码子(编码DIQ)之间的序列。如下提供了所有构建体的该片段中的序列,其包括wt或突变蛋白内含子结合wt或突变轻链信号序列。表13A.构建体A的部分编码序列(SEQIDNO:98)表13B.显示构建体A中蛋白内含子和侧翼序列的部分氨基酸序列(SEQIDNO:99)S*c投.sa.53aaato.MiS組加诏加cgs-c"c95S加gato*投_y.rcg.s诏s-tt"Saa说iS.sStoate说S招§-M-o>cacg.Kas*dS§te8*诏招ts卯8aa叩说Sy句幼s-的^tslaaQ>cia,,tt".IGQ>.t^gtsJ2-aasts.rcgacgss9>gissgsa此gjisssg.sSa.rcaa巧的改a做加卯创SJ§加s.rc^诅M招sss>ta*油的叩明a购sJ>ss柳sta>a.53.3**K3rrfm33cK、ieaatK、pcca£9caeo、丄ggca9as^a-s>ws、s>§的^的s、此s-s讽l^抑鄉8^卿站她^>§加卿|.§§.§,|wSS,柳SJ卯卯l加s抓lf柳加卿柳咖|.|>§|^^^|>18柳|鹏1鹏咖83|.,§>ss-ws叩柳s-M船to-叩s^a加s加加S刚加aaa3gnivmmlpvkgrknffkg,iov加s跳iigyy旧sgciveKarvKmsKciqriviecnaKiaeKiTgKvrrgrgyifshaifrvlaegkripefiftspmdikvaflkglngnaeeltfstkse"vnq训lnsigvsdikiehekgvyrvyinkkessngdivldsvesievekyegyvydlsvednenflvgfgllyaanmdmrvpaqllglHlwfpgsrc-diq表14A.构建体B中的部分编码序列(SEQIDNO:100)Ccgggtaaa-agcattttaccagatgaatggctcccaattgttgaaaatgaaaaagtteg3ttogtaaaaattggagacttcatagatagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctsgaggttaaagatcttaaagccctttccttcaatagaga3acaaaaaagagcgagctcaaga鄉t幼3ggccctaattagacaccgctattcaggg3aggtttacagcattaaactaaagtcagggagaaggatc朋aataaccteaggtcatagtctgttctcagtaaaaaatggaaagctagttaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaagg加aaacttccagaaagcaagc:aagtgcta8atctcgttgaactactcctg3貼ttacccgaagaggag3catcgaacatcgtaatg3tgatcccagttaaaggtagaaagaaWcttcaaagggatg(:tcaaaacattatactggatettcggggagggagaaaggccaagaaccgcagggcgctatctcaagcat卿aaagattaggatacgttaagctcaagagaagaggctgtgaagttctcg3ctggg3gtc3cttaagaggtacagg鄉cttt'acgag3ccctcatt33g33cctga33tat33cggt3atagcagggcal:acatggttgaatttaactetctcagggatgtagtgagcttaatgccaatagaagaacttaaggagtggat3attgg3ga3cct柳ggtcct3ag3t3ggt3cc加attg3tgtagatgattc3tttgc33agctcct3gg加ct3cataagtagcggagatgtag3gaaagatagggtg卿ttcc3c3gtaa3g3tcaaaacgttctcgaggatatagcg333cttgccg3g33gttatttgg3aaggtg3gg3g3gg33gagg3t3tattgaggtatc3ggga33attagccatgccatatttag3g飾gcgga柳t33g柳attccagagttcatcttcacatccccaatggatattaaggt柳cttccttaagggactcaacggtaatgctgaagaattaacgttctocactaagagtgagctattagttaaccagcttatecttctcctgaactccattggagttteggatataaagattgaacatgagaaaggggtttacagagtttacataaataagaaggaatectccaatggggatatagtacttgatagcgtcgaatetatcgs.agttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgagaacttcctcgttggcttcggactacttta,:gcagccaacagtatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctegcgatgc-gacatccag表14B.构建体B中的部分氨基酸序列(SEQIDNO:101)表15A.构建体E中的部分编码序列(SEQIDNO:102)s付sswk6g吐^sww-加w加s拍s6化k射加&VksVsk.5^州.g§gg化,iCDdtwEpk化-ekwkw3S2-付wArt:。es&K柳,&p.s&m。200680034979.8Ccgggtaaa-aaggtttacagcattaaactaaagtcagggagaaggatcaaaataacGtcsggteatagtctgttctesgtaaaaaatggaaagctag,taaggtc柳ggagatgaactcaagcctggtgatctcgttgtcg加caggaagg加aaacttccagaaagcaagcaagtgctaaatctogttgaactactcctga朋加cccgaagaggagacatcgaacatcgtaatg3tgatcccagttaaaggtagaaagaatttcttcaaagggatgctcaaaacattatactggatettcggggagggagaaaggccaagaaccgc3gggcgctatctcaagcatcttgaaaga加ggatacgtt幼gctcaagagaag柳卿gaagttctGgactgggagtcacttaagaggtac柳3agc加3cgagaccctcattaagaacctgaaatataa卿t3aataattggagaacctaggggtcctaagataggtaccttcattgatgtagatga加atttgcaaagctoctaggttactacata3gt3gcggagatgtag3g33ag3tagggtg33gttccac3gta3agatca833cgttctcg柳3t3t3gcgaCat础3gagtl加gcgg3aggtaag3ga3ttccgttcatcttcac3tcccc3atggat3tt3柳tagccttccttaagggactcaacggtaatgctgaagaattaacgttctcca(:taagagtgagctattagttaaccagcttatccttctcctgaactccattggagtttcggatata33gattga3catg3g333ggggttt3cag3gttt3cata33t33g3aggaatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgttt3tg3tctaagtgttg柳ataatgagaacttcctcgttggcttcggactactttacgcacacaacagtatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgc-gacatccag表15B.构建体E中的部分氨基酸序列(SEQIDNO:103)表16A.构建体H中的部分编码序列(SEQIDNO:104)Ccgggtaaa-ggagattgaggaa3acgctgagagagtgaag柳gatggtgaa3Ctga33ttct柳ggttaaagatctt3卿ccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcaggga柳tttacagcattaaactaaagtc鄉gaga柳atcs旧aataacctc柳tcatagtctgttctcagtaaaaaatPgk-tilpdewlpivedivldsvesievekyegyvydlsvednenflvgfgllyahnsmdmrvpaqllgllllwfpgsrc-diqsw化a3-sg.冊a>g9Q哦.25-s表17A.构建体J中的部分编码序列(SEQIDNO:106)Ccgggtaaa-3gc3tttt3cc3gatga3tggctcccaattgttg3aa3tgaaaa3gttcga加gt3333卿g3gacttcatag3tagggagattgaggaaaacgctgagagagtgaagagggatggtgaaactgaaattctagaggttaaagatcttaaagccctttccttcaatagagaaacaaaaaagagcgagctcaagaaggtaaaggccctaattagacaccgctattcagggaaggtttacag(〕attaaactaaagtcagggagaaggatc朋aataaccte柳tcatagtctg加tcagtaaaaaatggaaagctagltaaggtcaggggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccag站agcaagcaagtgctaaatctcgttgaactactcctga雄acccgaag柳agacatcgaacatcgtaatgatgatcccagttaeiaggtagaaaga础cttcaa柳gatgGtcaa站cattatactggatcttcggggagggagaaaggccaagaaccgcagggcgctatctcaagcatcttgaaaga加ggatacgttaagctcaagagaagagg卿gaag加tcgactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaaataattggagaiacctaggggtcctaagataggtaccttcattgatgt3gatgattcatttgcaaagctcctaggttactacat33gt3gcggagatgt3gag3aag3t柳gtg3agttcGacagt333g3tc3aa3cgttctGg3gg3tat3gcgaaacttgccgagaagttatttggaaaggtg柳agaggaag柳atatattgaggtatcagggaaaattagccatgccatatttagagt1加gcgga鄉taagagaattccagagttcatc加acatccccaatggatattaaggtagccttccttaagggactcaeicggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactccattggag加ggatataaagattgaacatgagaaaggggtttacagagtttacataaataaga柳aatcctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttg柳at33tgag3acttcctcgtt卿ttcgg3Ctacttt3cgcacac33C3tgg3C3tgcgcgtgcccgccca加gttccccggctcgcgatgc-gacatccagggcc站gaaccgc3gggcgctatctoaagcatcttga鄉att鄉atacgttaagctcaagagaagaggctgtgattgaggat3atgagaacttcctcgttggcttcggact3ctttacgcacacaacatgg3catgcgcgtgcccgcccagctgctgggcgacgsgtggttccccggctegcgatgc-gacatccag表16B.构建体H中的部分氨基酸序列(SEQIDNO:105)Pgk-ksgrrikitsghslfsvkngklvkvrgdelkpgdlwvpgrlklipeskqvlnlvelllklpeeetenivmmipvkgrkn行kgli,川nsigvsdil1cHvldsvesievekyegyvydlsvednenflvgfgllyahnmclmrvpaqllgciewfpgsrc'diq细—对i^附Sssjre*."np9g〇gQIs9hs表17B.构建体J中的部分氨基酸序列(SEQIDNO:107)Ccgggtaaa-3aggtttac3gc3tt3aacta3agtcaggg3g3柳3tcaa33t3acctc鄉tc3tagtctgttctc3gt3a333atggaaagctagttaaggtc柳ggagatgaactcaagcctggtgatctcgttgtcgttccaggaaggttaaaacttccagatcccagttaaaggtagaaagaa加ttcaaagggatgctcaaaacattatactggatcttcggggagggagaaaag加tegactgggagtcacttaagaggtacaggaagctttacgagaccctcattaagaacctgaaatataacggtaatagcagggcatacatggttgaatttaactctctcagggatgtagtgagcttaatgccaatagaagaacttaaggsgtggataattggagaacctaggggtcctaagataggtaccttcattgatgtagatgattcatttgcaaagctcctaggttactacaacttgccgagaagttatttggaaaggtgaggagaggaagaggatatattgaggtatcagggaaaattagccatgccatattta卿ttl:tagcgga卿taagagaattcc印agttcatettcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgctgaagaattaacgttctccactaagagtgagctattagttaaccagcttatccttctcctgaactecattggagtttcggatataaagattgaacatgagaa柳ggtttac柳gtttacataaataagaaggaatcttgagg3taatgag3acttcctcgttggcttcgg3ctactttacgc3cacaac-g3catcc3g表18B.构建体K中的部分氨基酸序列(SEQIDNO'.109)shaifrvlaegkripefr表18A.构建体K中的部分编码序列(SEQIDNO:108)Pgk-sllpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysikl)eeetsnivmmipvkgrkn付kgdivldsvesievekyegyvydlsvednenflvgfgllyahn-diq表19A.构建体L中的部分编码序列(SEQIDNO:110)kCDA.旧劲wdq.rawk。^,nwepCD#ps-Kbp9scak,p9grr&CDp^99kEPSCcgggtaaa-Cctttccttcaatag3gaa3ca3aaaag3gcgagctca3g的ggta3柳cccta3ttagac3ccgctattc卿gt3gcagggc3t3c3tggttgaattta3ctctctcagggatgtagtg3gc加3tgccaat3gaaga3ctt33gg3gtggata3gtagcggagatgtagagaa3gat柳gtgaagttccac8gt肪agatca33acgttctogaggatatagcgaaacttgccgag3agttatttgga3aggtgaggag3ggaagaggatat3ttgaggtatcaggg3a33ttagcc3tgccatatttagagttttagcgga3ggtaagagaattcc3gagttcatcttcacatccccaatggatattaaggtagccttccttaagggactcaacggtaatgGtgaagaattaacgttotocactaagagtgagctattagttaaccagcttatccttctcctctccaatggggatatagtacttgatagcgtcgaatctatcgaagttgaaaaatacgagggctacgtttatgatctaagtgttgaggataatgiagaaGttcctcgttggcttcggactactttacgcacacaacatggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgggaggc-gacatccag表19B.构建体L中的部分氨基酸序列(SEQIDNO:111)Pgk-silpdewlpivenekvrfvkigdfidreieenaervkrdgeteilevkdlkalsfnretkkselkkvkalirhrysgkvysiklksgrrikitsghslfsvkngklvkvrgdelkpgdlvvvpgrlklpeskqvlnlvelllklpeeetsnivmmipvkgrknffkgdivldsvesievekyegyvydlsvednenflvgfgllyahnmdmrvpaqllg卄llwfpgsgg-diq重链3,序列-蛋白内含子+轻链信号肽序列-轻链成熟序列将以下寡核苦酸用于酿酒酵母VMA蛋白内含子(GenBank登录号#AB093499)的扩增,使用基因组DNA作为才莫板和Pfu-IHiFidelityDNA聚合酶(Stratagene)。使用Yeast-Geno-DNA-Template试剂盒(GBiosciences,cat.#786-134)从酿酒酵母的培养物中制备基因组DNA。SeeVMA蛋白内含子5,TGCTTTGCCAAGGGTACCAATGTTTT(SEQIDNO:112)SeeVMA蛋白内含子3,ATTATGGACGACAACCTGGTTGGCAA(SEQIDNO:113)根据以下程序运行PCR:步骤12345678温度94°C94'C50'C72。C转到步骤2(39次)72'C4'C结束日于间2minlminlmin2min5min寸呆持将PCR产物用作模板,使用以下的引物对来产生用于极端嗜热古菌构建体的蛋白内含子的Oaa,laa和3aa形式。使用Pfu-IHiFidelityDNA聚合酶(Stratagene)。Sce-5'-SapCCG(〕AGAAGAGCCTCTCCCTGTCTCCGGGTAMTGCTTTGCCMGGGTACCAATGTTTT(SEQIDN0:114)Sce-5'-1aa-SapCCGCAGAAGAGCCTCTCCCTGTCTCCGGGTMAGGGTGCTTTGCCAAGGGTACCAATGTTTT(SEQIDNO:115)Sce-5'-3aa-SaRCCGCAGAAG六GCCTCTCCCTGTCTCCGGGTAAATATGTCGGGTGCTTTGCCAAGGGTACCAATGTTTT(SEQIDNO:116)Sce-3'-Van911CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATATTATGGACGACAACCTGGTTGGCAA(SEQIDNO:117)Sce-3'-1aa-Van9"CAGC;AGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCAATTATGGACGiACAACCTGG丌GGCM(SEQIDNO:118)Sce-3'-3aa-Van911CAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATTTCTCCGCAA丌ATGGACGACAACCTGGTTGGCAA(SEQIDNO:119)使用以上提供的相同程序运行PCR。将来自每个反应类型的PCR产物亚克隆至pCR-BluntII-TOPO(Invitrogen)中,将每个类型的插入片段测序并证明正确性。为了通过同源重组至大肠杆菌中的pTT3-HcintLCp.horikoshii构建体中来产生D2E7重链-蛋白内含子-D2E7轻链的融合体,设计寡核苷酸引物。通过工程化PCR产生的载体(含有pTT3载体,重链和轻链片段,但没有极端嗜热古菌蛋白内含子)和VMA蛋白内含子插入片段之间的40个碱基对悬垂物,可以混合两个DNA并转化至大肠杆菌中,没有连接的益处,导致两个片段的大肠杆菌同源重组至Oaa,laa和3aa形式的pTT3-HC-VMAint-LC中。VMA同源重组引物VMA-HR5':CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAM(SEQIDNO:120)VMA-HR3':GCAGCAGGCCCAGCAGCTGGGCG(3GCACGCGCATGTCCAT(SEQIDNO:121)pTT3-HcintLC同源重组引物pTT3lnt-HR5':ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGC(SEQIDNO:122)pTT3int-HR3,TTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGT(SEQIDNO:123)根据以下程序运行用于蛋白内含子的PCR:使用Pfu-IHiFidelityDNA聚合酶(Stmtagene)。步骤12345678温度94'C94。C60'C72°C转到步骤2(34次)72'C4°C结束时间2minlminlmin1.5min5min保持按照以下程序运行用于载体的PCR:使用PlatinumTaqHiFidelityS叩ermix(Invitrogen)。步骤12345678温度94'C94'C60°C68'C转到步骤2(24次)68°C4'C结束日于间2min30sec30secl()min5min保持为了实现VMA同源重组至pTT3-HcintLC中,使用以下的策略。使用Qiaquick凝胶提取试剂盒(Qiagen)将PCR产物凝胶纯化,并将每个稀释至50^1稀释緩冲液中。将3|til载体PCR产物在eppendorf管中混合,并加入3^1所需的VMA蛋白内含子PCR产物(将0aa,laa或3aa加入分开的管中)。将每个混合物转化至大肠杆菌中,然后将细胞置于LB+氨节青霉素平板上,并在37。C培养过夜。将克隆生长至2ml培养物,使用WizardPrep试剂盒(Promega)制备质粒DNA并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析。对于DNA序列分析产生正确限制模式的克隆。形成了三个使用酿酒酵母VMA蛋白内含子的用于D2E7重链-蛋白内含子-D2E7轻链的表达构建体pTT3-Hc-VMAint-LC-0aa;pTT3-Hc-VMAint-LC-laa;和pTT3-Hc-VMAint國LC-3aa。还可以参见图15的质粒图谱。表20.完整的质粒pTT3-D2E7重链-蛋白内含子-D2E7轻链的序列(SEQIDNO:124)5'-gcggccgctcgaggccggca柳ccggatcccccgacctcgacctctggct站taaaggaaatttattttcattgcaatagtgtgttggaa纖gtgtctctcacteggaaggacatat卿柳gcaaatcatttggtcgagatcGcteggagatctctagctag鄉atcgatccccgcccc卿cgaacta咖ctgactacgacatctctgccccttcttpgcggggcagtgcatgtaatcccttcagttggttggtacaacttgccaactgggccc柳ccac卿gacacggggggggacpaaac3caaaggggttctctga卿agttgacatccttataaatggi,tgcacatttgcca3cactgagtggctttcatcctggagcagactttgcagtctgtggactgcaacacaacattgcctttdtgtgtaactcttggctgaagctcttacaccaatgctg卿gac卿acctcccaggggcccagg3agactacgg卿gct8C3ccaacgtcaatcagaggggcctgtgtagctaccgata3gc卿ccctc3agagggcattagcaatagtgtttataaiggcccccttgttaaccct33ac卿tagcatatgcttcccgggtagtagtatatactatccagactaaccctaattcaatagcatatgttacccaacgggaagcatatgctatcgaattagggttagta3aagggtGcta柳aeicagcgatatcteccaccccatgag卿cacggttttatttacatggggtcaggattccacgagggtagtgaaccattttagtcacaagggcagtggctgaagateaaggagcgggcagtgaactctcctgaatcttogcctgc加ttcattctccttcgttt柳taat柳8taactgctgagttgtgaa卿ta柳tgtatgtgaggtgctcgaaaacaaggtttcaggtgacgcccccagaataaaatttggacg卿ggttcagtggtggcattgtgctatgaca(;caatataaccctcacaaaccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctttaaca3tagaaatcGatggggtgggg3C卿ccgta卿actggatgtccatctcacaGgaatttatggGtatgggcaacacataatcctagtgcaatatgatact卿gttattaag卿gtcccaggcagggaccaagacaggtgaaccatgttgttacactcta卿aacaaggggei3agagagtggacgccgaceigcagcggactcc3ctggttgtctctaac3ccccGg朋朋tta肪GggggctGG卿CG33tggggccGgitaaacei3agacaagtggGcactcttttttttga3attgtggagtgggggcacgcgtcagccccc3cacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgtaaccccgctaaccactgcggtc幼accacttgccc:acaa幼ccac1:aatggcaccccggggaatacctgcateagtaggtgggcgggcGaagataggggcgcgattgctgcgatctggaggeicasattacacacacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccat卿tagcatatactacccaaatatctggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatalgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagagatt柳gtagtatatgctatcctaiattteitatctgggtag(;atatactacccaaatatctggatagcatatgctgitoctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatectaatotatatctgggtagtatatgctatGctaatGtgtatCGgggtagcatatgctatcctcatgataagctgtcaaacatgagaattttcttgaagacgaaagggcctcgtgatsicgcctatttttataggtta卿catgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaaoccc,atttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaeiggaagagtstgagtsttcsacatttccgtgtcgcccttattccc觀gcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttegccccgaagaacgttttccaatgatgagcactttt3aagttctgGt3tgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagsiaaagcatcttacggatggcatg8cagtaagag節ttatgcagtgctgccateiacc8tgagtga1:aacactgcggccaacttacttctgacaacgeitcggaggaccgaaggagctsaccgcttttttgcacascatgggggatcatgtaactcgccttgatcgttgggaaccggagctg貼tgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcg3aGtacttactctagcttcccggcaacaattaatagactggatggaggcggat3站gttgcaggacc3cttctgcgctcggcccttccggctggctggtttattgctgataaatctggagc卿tgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatc^tagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcact^attaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatCGtttttgataatctcatgaccaaaatcccttaacgtgag加cgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatectt微ctgcgcgtaatct'tttttccg83tctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcg3t83gtc卿ctt3cc的cttggagGgiaacg3cctacacGg站ctge1ge1teGGt3c;agcgtgagctetg3ge1站gcgccacgcttcccga3gggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggasacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcg卿cctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccc:tgattctgtggataaccgtattaccgcctttgagtgagctgataGcgctcgccgcagccgaacgacccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcatt柳caccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgt卿cggataacaatttc3c3卿gaa3cagctatgaccatgatt3cgccaagGtctagctag3ggtcg3ccaattcteatgtttg3c3gctt8tcatcgcagatccgggcaacgttgttgccattgctgcaggcgcagaactggtaggtatggaagatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtcattagttcatagcccatatatggagttccgc;gttacataacttacggtaaat卿ccgcctggGtgaccgcccaacgacccccgccca卿cgtcaataatgacgta柳cccatagtaacgccaaiagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtocgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttacgggactttcctacttggcagtacatctacgtattagtGatcgctattacGatggtgatgcggttttgg()agtacaccaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttg卿gcaccaaa3tcaac-gggactttccaeiaatgtcgtaataaccccgccccgttgacgcaaatgggcggtagg(:gtgtacggtgggaggtctatataagcagagctcgtttagtgaaccgt卿atGctcactctcttccgcatcgctgtetgcgagggcc3gctgttgggctcgcggttgaggac6iaactcttcgcgg嫌Gcagtactcttggatcggaaacccgtcggcctccg肪cggtactGc9ccaccgagggacctgagcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtogcaaggtaggctgagcacGgtggcgggGggcagcgggtggcggtG卯ggttgtttctggcgg的gtgctgctgatgatgtaattaaagtaggcaagcgggcariacttctgcgctaagattgtcagtttccaaaaacgaggaggatttgatattcacctggcccgatctggccatacacttgagtg8caatgacatccactttgGctttctctGGa卿gtgtccactcGc3ggtcca3gttt卿cgcc3ccatggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgt-gaggtgcagctggtggagtctgggggaggcttggtacag(-ccggcaggtccctgagactctcctgtgcggcctctggattGacctttgatgattatgccatgcactgggtcGggc卿ctcG3gggaagggcctggaatgggtctGagctatceicttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgta卿Gaaatgaacagtctgagagctg卿atacg!3ccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttg3Ctattggggccaaggtaccctggtcac(:gtctc卿tgcgtcgeicca柳gccGatcggtGttccccct卿accctcctccaagagc3cctet卿ggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccag卿cgtgcacaccttcccgg卿cctacagtcctcagac33gcccagc3acacca柳tggac鄉aaagttgagcccaaatcttgtgac幼a3ctcacacatgccc3ccgtgcccagcacctgaactcctggggggaccgtcagtcttGctcttccGGcceiaaeiccc3柳3caccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttC3actggtacgtggacggcgtgg柳tgcat幼tgccaagaca卿ccgcg,ggagc的t3caacagcacgtsiccgtgtggteagcgtcctcaccgtcctgcacc柳actggctgaatggca柳agtacaagtgcaaggtctccaacaaagcGCtcccagccGccatcgagaaaaccatctGcaasgccsaagggcagccccgagaaccacaggtgtacaccctgcccccatcg3gtggg3g3gc3atgggcagccggagaac3actacaagacc3cgcctcccgtgctggactccg3cggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggsacgtcttcteatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctccgggt幼a-tgctttgccaagggtaccaatgttttaatggcggatgggtctattgaatgtattgaaaacattgaggttggtaataaggtcactgaggggcctgagagagccaacgaattagtagaatcctatagaaaggcttcaaataaagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttcgtaaagctacctaccagacttacgctccaattctttatgagaatgaccactttttcgactac3tgc3a3aaagta3gtttc3tctc8ccattgaaggtccaaaagtacttgcttatttacttggtttatggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaatatgctga幼agttgaatttgtgcgccgagtataaggacagaaaagaaccacaagttgccaaaactg加atttgtactctaaagttgtcagaggtaatggtattcgcaataatcttaatactgagaatccattatgggacgctattgttggcttaggattcttgaaggacggtgtcaaaaatattccttctttcttgtctacggacaatatcggtactcgtgaaacatttcttgctggtctaattga加tgatggctatgttactgatgagcatggt3tt3aagcaacaataaagacaa加atacttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctoggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataaaattagttatgctatttatatgtctggtggagatgttttgc加acgttctttcgaagtgtgccggctctaaaaaattcaggcGtgcteGcgccgctgc卿G3cgtgagtgcGgcggattttatttcgagttacaagaattg3agga3gacga誠Eitgggattactttatctgatgattctgatcateagtttttgcttgccaaccaggttgtcgtccataat-atggacatgcgcgtgcccgcccagctgctgggcctgctgctg卿ggttccccggctcgcgatgcgacatccagatgacccagtctcceitcctccGtgtctgcatctgt柳ggac卿gtG3ccatcacttgtcgggcaagtceigggceitcag3aattacttagcctggtatcsgcasaaeiccagggaaagccGctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttatt3卿caaaggtataaccgtgcaccgtat3cttttggcc柳ggacca柳tgg3aatca33cgtacggtggctgcaccat卿cttcatcttcccgccatctgatgagcagttga33tctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagsggccaaagtaceigtggsaggtggatojgccctccaatcgggtaactcccaggagagtgtc3c8gagcaggacagcaaggac3gcacct3cagcctc3gcagc3ccctgacgctg3gc朋3gc3g3ct3cgagaaacacaaagtctacgcctgcgaagtcacccatca.gggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgt-3'pTT3载体-重链-蛋白内含子-轻链在以下的构建体中,与以上构建体的唯一差异是包括酿酒酵母天然的蛋白外显子序列(以蓝色显示)。所示的序列从D2E7重链编码片段的末端(以红色显示的最后9个碱基对)至D2E7轻链编码片段的5'端(以粉色显示的头9个碱基对)。表21.pTT3-HC-VMAint-LC-laa的部分编码序列(SEQIDNO:125)§站的lac战Sc33SS|g咖a的《".rcgSc仇S>S*.H>aa旧SQInc59g93>Gg,,ts-aiS^g诏.rcgs-S化agcaQw"aswmS的8s、cgQ招33Q5'-ccgggtaaa-ggg-tgctttgccaagggtaccaatg加aatggcggatgggtetattgaatgtattgaaaacattgaggttggtaataaggtcaaagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgacccatgagttggttgttagaaGacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaata加gaagttattacttttgagatgggcc抑aag站3gcccccga卿tagaattgtl卿cttgtcaaggaagtttcaaagagctacccaatatctgaggggcctg3gagagccaacgaattagtagaatcctat3g站aggc加a6iataeiagc加ttttgagtggactagsccac鹏atggattggtgatggattgtctgacagggcaactttttcggttgattccagagatacttctttgatggaacgtgttactgaatgtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataggattacWatctgatgattctgatC3tcagtttttgcttgccaaccaggttgtcgtccataat-tgc-atggacatg-3'重链3'序列-蛋白内含子-蛋白外显子-轻链5'序列表22.pTT3-HC-VMAint画LC-3aa(SEQIDNO:126)gaggttggtaataaggtcatgggtaaagatggcagacctcgtg鄉t誠aaattgcccagaggaagagaaactatgtacagcgtcgtgcagaaaagtcagcacagagcccacaaaagtgactcaagtcgtgaagtgccagaattactcaagtttacgtgtaatgcgacccatgagttggttgttagaacacctcgtagtgtccgccgtttgtctcgtaccattaagggtgtcgaata卿aag誠ac卿agatgggccaaaagaaagcccccgacggtagaattgttgagcttgteaaggaagtttcaaagagctacccaatatctgaggggcctgagagagccaacgaattagtagaatcctatagaaaggc加aaataaagcttattttgagtggactattgaggccagagatctttctctgttgggttcccatgttogtaaagctacctaccagacttacgctccaattctttatgagaatgaccactttttcgactacatgcaaaaaagtaagtttcatctcaccattgaaggtccaaaagt3Cttgctt3tttacttggtttatggattggtg3tggattgtctgacagggca3Ctttttcggttg3加c3gagatacttctttg3tgg3acgtgtlactgaatatgctga3aagttga3卿gcgccgagtat3柳ace1g33aag3acc3caagttgccaaaactgttaa卿actctaaagttgtc3g3ggtaatggtattcgcaataatc加atactgagaatccattatggg3c3C3ttt卿GtggtctaattgattGtgatggct3tgttactgat卿c3tggtatta卿caacaafa卿acaattcat3cttctgtcagagatggtttggtttcccttgctcgttctttaggcttagtagtctcggttaacgcagaacctgctaaggttgacatgaatggcaccaaacataaaattagttatgctatttatatgtctggtggagatgttttgcttaacgttctttcgaagtgtgccggctctaa3aaattcaggcctgctcccgccgctgc卿cacgtgagtgccgcgg纖atttcgagttacaagaattgaaggaagacgattattatgggattactttatctgatgattctgat:catcagtttttgcttgccaaccaggttgtcgtccataattgcggag333tggac3tg重链3'序列-蛋白内含子-蛋白外显子-轻链5'序列集胞藻抹PCC6803DnaE蛋白内含子合成、PCR扩增和克隆集胞藻林PCC6803DnaE蛋白内含子是天然裂解的蛋白内含子(NCBI登录号弁sS76958和S75328)。我们已经连接该蛋白内含子的N,端和C-端对半,作为一个已经合成的开放阅读框。所需蛋白序列的编码序列是用于CHO细胞中表达的密码子最佳化的(www.geneart.com)。表23中给出了所得到的核苷酸序列。表23.Ssp-Di(在黑线仓鼠(C匿,由W题)中表达最佳化的编码序列)(还可以参见SEQIDNO:127和128)GGGCGAATTGGGTACCGAATTCTGCCTGTCCTTCGGCAC(:GAGATCCTGACCGTGGAGTACCCGCTTAACCCATGGCTTAAGACGGACAGGAAGCCGTGGCTCTAGGACTGGCACCTCATC一L一S一F一一G一TJ一I一L—T一VJJ一CGGCCCTCTGCCTATCGGCAAGATCOTGTCCGAAGAGATCAACTGCTCCGTGTACTCCGT61---------+---------+.........+----------+.........+........GCCGGGAGACGGATAGCCGTTCTAGCACAGGCTTCTCTAGTTGACGAGGCACATGAGGCA一G一P一L—PJ—G一U一V—S—E—E—I—N—C—S—VJ—S—V_AccIGGACCCTGAGGGCCGGGTGTATACTCAGGCCATCGCCCAOTGGCACGACCGGGGCGAGCA121.........+......-一十---------+.........+---------+-------CCTGGGACTCCCGGCCCACATATGAGTCCGGTAGCGGGTCACCGTC3CTGGCCCCGCTCGT一。—P—BJj一VJ—T一LHJ一Q-一W一H一D一HE一Q^GGAGGTGCTGGAGTACGAGCTGGAGGACGGCTCCGTGATCCGGGCCACCTCCGACCACCG181---------+---------+---------+---------+---------+-------CCTCCACGACCTCATGCTCGACCTCCTGCCGAGGCACTAGGCCCGGTGGAGGCTGGTGGC一B一V—1—BlJJ一Ii一BLJD一G一S一V一I—R^jejP一S—D—H—LPvuITPvuITSspWIGTTTCTGACCACCGACTATCAGCTGCTGGCCATCGAGGAGATCTTCGCCCGGCAGCTGGA241----------+......—-+---------+.........——......+.....—CAAAGACTGGTGGCTGATAGTCGACGACCGGTAGCTCCTCTAGAAGCGGGCCGTCGACCT一P一L一TJ,一DJ一Q_L—L_A_I—B_B—Z_F—HQ_I—D一CCTGCTGACCC:TGGAGAACATCAAGCAGACCGAGGAGGCCCTGGACAACCACCGGCTGCC301-一.....一+-一一......+---------+.........+.......-一+.......GGACGACTGGGACCTCTTGTAGTTCGTCTGGCTCCTCCGGGACCTGTTGGTGGCCGACGG一HT_J,—EJ—IJ—Q_T—E—Bj—L—UJ一H一R一L一P一TTTCCCTCTGCTGGACGCCGGCACCATCAAGATGGTGAAGGTGATCGGCAGGCGGTCCCT361----------+---------+---------+----------+---------+-------AAAGGGAGACGACCTGCGGCCGTGGTAGTTCTACCACTTCCACTAGCCGTCCGCCAGGGAGGGCGTGCAG(:GGATCTTCGACATCGGCCTGCCTCAGGACCACAACTTTCTGCTGGCCAA421----------+---------+---------+......----+.........+.......CCCGCACGTC(3CCTAGAAGCTGTAGCCGGACGGAGTCCTGGTGTTGAAAGACGACCGGTT一G一V一LHU一DJ一G—L—P—Q_J3—H—NJ—!—L_JL_N—胸r工KaslSaclCGGCGCCATCGCCGCCAACAAGCTTGAGCTCCAGCTTTTGTTCCC481......——+.........+.........十----......+-----GCCGCGGTAGCGGCGGTTGTTCGAACTCGAGGTCGAAAACAAGGG一G一A一I_Aj一N一1以下的寡核苷酸用于集胞藻抹PCC6803DnaE蛋白内含子的扩增,使用以上合成的DNA作为模板和PlatinumTaqHiSupermix(Invitrogen)。这些引物还引入蛋白外显子序列来产生Oaa,laa和3aa形式,以及用于PCR产物同源重组至pTT3-HcintLC载体中的序列,和使用酿酒酵母VMA蛋白内含子一样进行Ssp-geneart-5'HR:CCAGTACACGCAGMGAGCCTCTCCCTGTCTCCGGGTAAATGCCTGTCCTTCGGCACCGAG(SEQIDNO:129>Ssp-geneart-3'.HR:GCAGCAGGCCCAGCAGCTGGGCCiGGCACGCGCATGTCCATGTTGGCGGCGATGGCGCCG丌GGCC(SEQIDNO:130)Ssp-GA-1aa-5'-HR:CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAATATTGCCTGTCCTTCGGCACCGAG(SEQIDNO:13"Ssp-GA-1aa-3'-HR:GCAGCAGGCCCAGCAGCTGGGCGGGCAGGCGCATGTCCATACAGTTGGCGGCGATGGCGCCGT(SEQIDNC):132)Ssp-GA-3aa-5'-HR:CCACTACACGCAGMGAGCCTCTCCCTGTCTCCGGGTAAAGCCGAGTATTGCCTGTCCTTCGGCACCGAG(SI三QIDNO:133)Ssp-GA-3aa-3'-HR:CCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAGCCGAGTATTGCCTGTCCTTCGGCACCGAG(SI三QIDNO:134)根据以下程序运行PCR:步骤12345678温度94'C94'C60。C68。C转到步骤2(34次)68'C4'C结束时间2min30sec30seclmin5min保持为了获得密码子最佳化的集胞藻株PCC6803DnaE蛋白内含子同源克隆至pTT3-HcintLC中,使用以下的策略。将PCR产物凝胶纯化并将每个稀释至稀释緩沖液中(Qiaquick凝胶提取试剂盒(Qiagen))。将2^1载体PCR产物(和使用VMA蛋白内含子的同源重组中所用的相同)和2^1所需的集胞藻林PCC6803DnaE蛋白内含子PCR产物(0aa,laa或3aa在分开的管中)在Eppendorf管中混合。然后将核酸转化至大肠杆菌中并置于LB+氨千青霉素平板上,然后在37。C培养过夜。将克隆生长至2ml培养物,使用Wizardprep试剂盒(Promega)制备DNA,并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析。对于DNA序列分析产生正确限制模式的克隆,来证实存在所需的序列。使用集胞藻株PCC6803DnaE蛋白内含子设计了三个用于D2E7重链-蛋白内含子-D2E7轻链的表达构建体pTT3-Hc-Ssp-GA-int-LC-0aa(参见图16的质粒图谱);pTT3-Hc-Ssp-GA-int-LC-laa;和pTT3-Hc-Ssp-GA-int匿LC-3aa。表24.完整质粒pTT3-D2E7重链-Ssp-GA-蛋白内含子-D2E7轻链的序列(SEQIDNO:135)5'-geggccgetcgaggccggcaaggGcggatcccccgaccfcgacctctggctaataaaggaa鄉attttcattgcaatagtgtgttggaattttttgtgtctctcactcggaaggacateitgggagggGaaeitcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgc3tgtaatcccttcagttggttggt3C33cttgcc33ctgggccctgttcc3C卿gac3cggggggggaccaa3Cac貼柳ggttctctgactgtagttgacatccttataaatgg卿gc3catttgcc83cactg3gtggctttC3tcctggagcagactttgcagtctgtggactgGaacac幼cattgccttta卿taactcttggctgaagctcttacacc3atgctgggggacatgtacctcccaggggccc柳aagactacgg卿gcteicacceieicgtcaatcag柳ggcctgtgtagct3ccg3t33gcggaccctc33g3gggcattagc33tagtgmat3aggGccccttgtta8ccGt3a3cgggtagcatatgcttcccgggtagt3gtatat3Ctatcc柳ctaaccctaattcaat3gcatatgttacccaacgggaagcat3tgctatcgaattagggttagtaaaagggtccta卿3acagcgatatctcccaccccatgag卿cacggtmamacatggggtcaggattccacgagggtagtgaacca加agtcacaagggcagtggctgaagatcaaggagcgggcagtgaactctcctgaatcttcgcctgcttcttcattctccttcgtttagctaatagaatsiactgctgagttgtgaacagtaaggtgt卿gaggtgctcgaa33C33ggtttC3ggtgacgccccc3gaata站atttggacggggggttcagtggtggcattgtgctatgeicacca3tataaccctcacaaaccccttgggcsiataaat3ctagtgtagg38tgaaaceittctg33tatctaacacataatccteigtgcaatatg3tactggggttattaag卿gtccca卯cagggacGaageic柳tgaaccatccccgaaaattiaaacggggctccacgGGaatggggccGSit站acaaagacaagtggccactcttttttttgaa3ttgtggagtgggggcacgcgtcagcccccacacgccgccctg卿ttttggactgtaaaataagggtgtaataacttggctataagtaggtgggcgggccaag3taggggcgcg3ttgctgcgatct卿ggacaaattacacacacttgcgcctgaagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatcg3g3ttagggt3gt3t3tgct3tGct33翻3tctgggt3gcat3t3Ctaccc333tatctgg3t3gc3t3tgct3tcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatgctatcctaatctatatctgggtagtatatgctatcctaatc化gtatccgggtagcatatgctatcctcatgataagctgtc站3C3tgag3,纖cttgaagacga3agggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgttta鹏ctaaatacattcaaatatgtatcGgcccttattccc麵gcggca加gccttcctgtttttgctcacccagaaacgctggtgaaagtaa鄉atgctgaagatggtcgcGgcatacactattct卿aeitgacttggttgagtact3accagtcacaga3aagcatcttacggatggcatgagg3ccgaaggeigcta3ccgc讓gcacaacatgggggatcatgtaactcgccttg3tcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgcagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactotagcttcccggcaaGaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcact卿gccagatggtaagccctcGcgt3tcgtagttatc;tacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgteagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccEictgagcgtcagaccccgt3gaaaagatcaa柳atGttcttg3gatcc體tctgcgcgtaatGtgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctacc3actctttttccg8aggtaactggcttcagcagagcgcagataccsi33itactgttcttctagtgtagccgtagttaggGcacc3cttcaag鄉tctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtettaccgggttggactcaagacgatagttaccggataaggcgcagc:ggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctat(〗gaaaaaGgGcagcaacgcggcctttttacgg加ctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataqcgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcatt3atgcagctggcacgaca卯tttcccgactgg肪3gcgggc的tgagcgcaacgcaatta卿gagttagctcactcattaggcaccccaggctttacacttteitgcttccggctcgteitgttgtgtggaattgtgagcggatgiacaatttcacacagg幼acagctatgaccatgattacgccaagctctagctag柳tcgaccaattctcatgtttgacagcttatcatcgcag3tc卿gcaacgttgttgccattgctgcaggcgcagaaGtggtaggtatggaagatetatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatetatatcataatatgtacatttatattggctcatgtccaatatgaccgccatgttgacattgattattgactagttattaatagtaatcaattacggggtoattagttcatagcccatatatggagttCGgc;gttacataactt8cggteiaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtccgccccctattgacgtcaatgacggtaae1tggcccgcctggcattatgccG《igtacatgaccttacggg3ctttcGtacttggcagtacatctacgtattagtcatcgct3ttaccatggtgatgcggttttggcagtacaccaatgggcgtggatagcggtttgactceicggggatttccaagtctccaccccattgacgtcaatgggagtttg加ggcaccaaaatcaacgggactttccaaaatgtcgtaataaccccgccccgttg3cgcaaatgggcggtaggcgtgtacggtgggaggtGtatataagcei卿ctegtttagtgaaccgtcagatcctcactctottccgcatcgctgtctgcgagggccagctgttgggctcgcggttgaggacaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccaccg鄉gacctgagcaccgtggcgggcggcagcgggtggcggtcggggttgtttct卯cggaggtgctgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttg绍atccagctgttggggtgagtactccctctcaa^gcgggcattacttctgcgctaagattgtcagtttccaaaaacg柳柳3tttg3teittcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccacaggtgtccactcccaggtccaagtttgggcgccaccatggagtttgggctgagctggctttttcttgtcgcgattttaeiasiggtgtccsgtgt-gaggtgcagctggtggagtctgggggaggcttggtacagc;ccggcaggtccctgagactctcctgtgcggcctetggattcacctttgatgattatgccatgcactgggtc卿caagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggaGtctgtggagggccgattcaccatctcca卿acaacgcca3gaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctegtaccttagcaccgcgtcctcc卿actattggggccaaggtaccctggtcac(;gtctegagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctcc3ag3gcacctctggg卿acag卿CGct卿ctgcctggtca柳actacttccccga3ccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccgg卿cctacagtcctc3gac卿CG卿c3aGaGGa柳tggac鄉a站gttgagcccaaattcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcct卿ggg3ccgtcagtcttcctcttccccccaa幼ccca柳acaccctcatgatctcccggacccctg柳tcac8tgcgtggtggtggacgtgagccacg幼g8ccctgaggtcaagttcaactggtacgtggacggcgtgg柳tgcataatgccaagac幼agccgcgggaggagcagtacaacagcacgtaccgtgtggtc3gcgtcctc3ccgtcctgcaccagg3ctggctgaatggcaaggagtac33gtgcaaggtctccaacaaagccctcccagcccccatcgagaa朋ccatctccaaagcc咖gggcagccccgagaaccacaggtgtacaccctgcccGG3tcccgggatgagctgaccaagaaccaggtcagcctgacctgc9卿caaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaGcacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggciagcag卿aacgtcttctcatgctccgtgatgcatgaggctctgcacaeiccactEicacgGagaagagcctGtcc卿ctccgggtaaa-tgcctgtccttcggcaccgagatcctgaccgtggagtacggccctctgcctatoggcaagategtgtccgaagagateaactgctccgtgtactecgtggaccctgagggccgggtgtatactcaggccatogcccagtggcacgaccg卿cgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctecgaccaccggtttctgaccacaccgag卿gccctgg3c幼ccaccggctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatcggcsggcggtccctgggcgtgcagcggatcttcgacatcggcctgcctcaggacc3caactttctgctggccaacggcgccatcgccgccaac-atggacatgcgcgtgcccgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctcc卿ctgc8t卿卿ggac3gagtoaccatcacttgt卿gc3agtc鄉gc3tcagaaa加ctt3gcc卿atcagcaaaaaccagggaaagccccta8gctcctgatct3tgctgcatccactttgc33tcaggggtcccatct卿ttcagtggcagtggatctgggacagatttcactctcaccatcagcagcctgicagcctg朋gatgttgcaacttatta卿c幼鄉tat3accgtgcaccgtat3c,gcc柳ggacca柳tggaaatcaaacgmcggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctga3ta3Cttctetc,'Gc卿卿gcca卿tecagt卿柳t卿taacgccctecaatcgggtaactcccaggeigacg柳aacaca卿tctacgcctgcgstagtcacccatca卿cctgagctcgcccgtc8G朋agagcttcaacaggggagagtgt--3'pTT3载体-重链-蛋白内含子-轻链在以下的构建体中,与以上构建体的唯一差异是包括集胞藻林PCC6803天然的蛋白外显子序列(以蓝色显示)。所示的序列从D2E7重链编码片段的末端(以红色显示的最后9个碱基对)至D2E7轻链编码片段的5,端(以粉色显示的头9个碱基对)。表25.pTT3-HC-Ssp-GA-mt-LC-laa,编码序列的相关部分(SEQIDNO:136)Ccgggtaaa-tatt-gcgccatcgccgccaac-tgt-atggacatgpTT3载体-重链-蛋白内含子-轻链表26.pTT3-HC-Ssp-GA-int-LC-3aa—编码序列的相关部分(SEQIDNO:137)Ccgggtaaa-gccgagtatt-gcctgtccttcggcaccgagatcctgaccgtggagtacggccctetgcctatcggcaagatogtgtccgaagagatcaactgctccgtgtactocgtggaccctgagggccgggtgtatactcaggccatogcccagtggcacgaccggggcgagcaggaggtgctggagtacgagctggaggacggctccgtgatccgggccacctccgaccaccggtttctgaccaccgactatcagctgctggccatcgaggagatcttcgcccggcsigctggacctgctgaccctggagaacatcaagcag3ccgaggaggccctggacaaccac卿ctgcctttccctctgctggacgccggcaccatcaagatggtgaaggtgatgcgccatcgccgccaac-tgtttcaac-atggacatgpTT3载体-重链-蛋白内含子-轻链此外,表8A-8C提供了D2E7蛋白内含子融合蛋白,表达载体的相关序列和使用突变的(丝氨酸至苏氨酸)PyrococcusSsp.GBDPol蛋白内含子的编码序列。表8A.D2E7蛋白内含子融合蛋白的编码序列(SEQIDNO:48)ATGGAGTrTGGGCTGAGCTOGCTTTTTCTTOTCGCGATTTTMAAGQTGTCCAGTOTGAGGTGGAGCTeiGTGGAOTCTGGGGGAGGCTTGGTACAGCCCGQCAGGTCCCTGA(3ACTCTGCTQTOGGGCCTCT加ATTGAGCTTTGATGATTAT(3CCAT(3CACT(3GGTCCGGCAAGCTCCAG(3GAA(3GGCCTGGAATG(3(3T(;TCAGGTATGAGTT(3eiMTAOTG(3TCACATAGACTATGCClGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGAGAACGCGAAGAAGTCCCTGTATCTGCAAATGAACAQTCTGAGAGCTGAGGATACGGCCGTATATTACTGTGCGAAAGTCTCGTAGCTTAGCACCGC。TCCTCCCTTCIACTATrG的GCCAAQGTACCCTGGTCACCGTCTCGAGTGCGTCGAGCAAGG6CCCATG加iTCTTCCCCCTGCiCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGGTOCCTOGTCAAGGAGTACTTCCCCGAACCGGTGACGOTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGGACACGTTCCCGGGTGTCGTAGAGTCCTCAGGACTCTACTCCCTCAGCAGICGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCGAGACGTACATGTGCAACGTGAATCACAAGCCCAGCAACACCAAGGTG(3ACAAGAAAGTraAGCCCAAATCTTGTOAGAAAAGTCACACATGGGCACCGTGCCCAGCACCTGMCTCCTG加GGGACCGTCAGTCTTCCTCTTCCCCCCAMACCCAAGGACACGGTGATGATGTCCCGGACCCCT(3AGGTCACAT(3CGTG(3TGGTGGACGTGAGCCACGAAGACCCTGA(3GTCMGTTCAACT(3GTACGTGGACGGCGTGGAGQTGCATMTGCCMGACMAGCCGCGGGAGGAGCAGTACAACAGCACGTACCGTGTGGTCAGCGTGCTCACCGTCCTGICACCAGGACTGGCTGIAATGGCAAGGAGTACAAGTGCAAGGTGTCCAAGAAAGCGCTCCCAGCCCCCATCGAGAAMCCATCTCCAAAQCCAAAGGGCAGiCCCCGAGAACCACAGCiTGTACAGCCTGCCCGGATCCG的GATGAGCTOACCAAGAACCAGGTCAGCCTQACCTGCCTGGTCAAAGGCTTCTATCCGAGCGACATGGCC(3T3(3AGTGG(3A(3AGICAAT加GCAGCCGGAGAACAACTACAAGACCACGCCTCCCGTGCTGGACTCC6ACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTOGACAAGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCGeiTCaATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAACCATnTACCGGAAGAATGGGTTCCACTAATTAMMC<3GTAMGTTAAGATATTCCGCATraGG<3ACTTCGTTGAT(3(3ACTTATGAAG(3CGAACCM(3eiAAAAGTGAAGAAMCGGGGGATACAGAAOTTTTAGAAGTTGCAGGMTTCATGCGTTTTCCTTraACAGGAAGTCCAAGAAGGCCCGTGTMTGGCAGTGAAAGICCGTOATAAGACACCGTTATTC(;GGAAATG7TTATAGAATAGTCTTAAAGTCTG(3TAGMAAATAACAATAAGAGAAGGGCATAGCCTATTTOTCTATAGGMCGGGGATCTCGTrGAGGGAACTGGGGAGGATGTCAAAATraGGGATCTTCTT(3CA(3TTCCMGATCA(3TAAACCTACCAGAGMAAGGGMCGCTreAATATTGTTGAACTTCTTCTGAATCTCTCACCGGAAGAGACAGAAQATATMTACTTACGATTCGAGITAAAQGCAGAAAGAACTTCTTCAAGGGAATGTTGAGAACATTACGTTGGA-nTTTGGTGAGGAMAGAGAGTAAGGACAGGGAOCCGGTATCTAAGACACCTTGAMATCTCGGATACATAAGGTTGAGGAAAATraGATAC(3ACATCATTQATAAGGA<3GGGC.rTGAGAMTATAGMC(3TrGTACGAGAMCTTGTTGATGTTGTCCGCTATAATGGCAACAAGAGAGAGTATrTAenTGAATTTAATGCTGTCCGGGACGTTATCTCACTAATGCCAGAGGAAGAACTGAAGGAATGGCGTATTGGAACTAGAAATGQATTCAGAATGGGTACQTTCOTAGATATTGATQAAGATnTGCCAAGCTTGGATACGATAGCGGAGTCTACAGG(3TTTATGTAAAC(3A抑AACTTAAGTTTACGGMTACAGAAAGAAAAAGAATGTATATCACTCTCACATTGTTCCAAAGOATATTGTGMAOAAACTITraGTAAGGTCTTCCAGAAAAATATAAGTTACMGAAATTTA(3AGAGCTreTAGAAAATeiGAAAAGTraAGA的GA6AMCiCCAAAC(3CATraAGTG(3TTACTTAACGGAGIATATAGTCCTAGATAGAGTCGTAGA(3ATTAAGAGA(3AQTACTATGATGGTOCGrnTACGATCTMGTGTCGATGAAGATGAGAATTTGCTTGCTQGCTTTGGATrCCTCTATOGAGATAATeiACATCCAGATGiACCCAGTCTCCATCCTCCCTOTCT(3CATGTGTAG6GGACAGAGTCACCATCAGTTGTC(3GGCAAGTCAGGGCATCA(3AMTTAC7TAGCCTGGTATCAQCAAAAACCA(3GGAAA(3CCCCTAAGCTCCTGATCTATGCT(3CATCCACTTraCMTCAGGGGTCCCATCTC(3(3TTCAGTGGCAGT加ATCTG(3GACACIATTTCACTCTGACCATCAGCAGCCTACAGCCTGAAGATGTTGCMCTTATTACTGTCAAAGGTATMCCerraCACCGTATACTTTrGGCCAGGQQACCAAQQTGGAMTCAAACGTACGGTOGCTi3CACCATCTGTCTTCATCTTCCCQCCATCTGAT(3AGCAGTTGAMTCTGGMCTGCCTCTOTraTGTGCCTGCTGAATMC'rTCTATCCCAGAGAGGCCAAAQTACAGTGGAAGGTGGATAACGCCCTGCAATC咖TAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAA加ACAGCACCTACAGCCTCAGCAGCACCCTOACGCTGAGGMAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGMGTCACGCATGAGGQCCTGAGCTCGCCCGTCAGAAAGAGCTTCAACAGGGGAGAGTGTTGA表8B.D2E7蛋白内含子融合构建体的氨基酸序列(SEQIDNO:49)MEFGLSWLFLVAILKGVQCEVOlVeSGGGLVQPGRSLRLSCAASGFTFDDYAMHWVRQAPGKGLEWVSAITWNSGHIDYADSVEGRFriSRDNAKNSLYLQMNSLFlAEDTAVYYCAKVSYLSTASSU)YWGQ(3TLVTVSSASTKGPSVFPLAPSSKSTS(3GTMLGCLVKDYFPePVTV8WNSGALTSGVHTFPAVLOSS(3LYSLSSWTVPSSSU3TQTYICNVNHKPSNTKVDKKVEPKSCDKTHTCPPGPAPEIXGGPSVFUFPPKPKDTLWHSATPEVTCVWDVSHEDPEVKFNWYVDGVEVHNAKTKPBEEQYNSTYRWSVITVLHODWLNGKEYKCKV8NKALPAP尼KnSKAKGQPFIEPOVVTLPPSRDELTKNQVSLTCLVKCIFYPSDIAVEWESNGQPENNYICTTPPVLDSDGSFRLYSKLTVDKSRWQOGNVPSCSVMHEALHNHYTQKSL8LSPGKnLPEEWVPIJKNGKVWFi^GDFVDGLMKANQGKVKKTGDTEVLEVAGIHAFSFDRKSKKARVMAVKAVIFlHRYSGNVYRIVLNSGSRKmTEGHSLR/YFINGDLVEATGEDVKIGDLLAVPRSVNLPEKRERLNIVELLLNLSPEETEDIILTIPVK(SRKNFFK.<aMLRTLRWIF(3EEKRVRTASRYLRHLENLQYIRLRW(3YDIIDKEGLEKYRTLYE;KLVDWRYNGNKREYLVEFNAVRDV旧U/1P曰三ELKEWRIGTRNGFRMGTFVDIDEDFAKLGYDSGVYRVYVNEELKFTEYRKKKNVYHSHIVPKDILKETR3KVFQKNISYKKFRELVENGKLDF1EKAKRIEWLLNGDIVLDRVV日KREYYD(3YVYDLSVDEDENFLAGFGFLYAHNDIQMTQSPSSLSASVGDRVTITCRASQGIRNYUWVYQQKPGKAPKUJYAASTLQSGVPSRFSGSGSGTDFrLT旧SLQPEDVATYYCQRYNRAPYTFGQGTKV日KRWAAPSVFIFPPSDEQLKSGTASWCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQD沐DSTYSLSSTULSKADYEKHKVYACEVTHQ(3LSSPVTKSFNRGEC'表8C.用于D2E7蛋白内含子融合构建体的表达载体的完整核苷酸序列(SEQIDNO:50)GAAGTTCCTATTCCGMGTTCCTATTCTCTAGACGiTTACATAACTrAC(3GTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGGCCATTGAC(3TCAATMTGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTMACTGCCCACTTGGCAGTAGATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCMTGACGGTAAATGGCCCGCGTGGCATTATGC(:CAGTACATGACGTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCAGCCCATTGACGTCMTGGGAGTTTGTTTTGGCACCAAAATCAACG(3GACmCCAAAAT(3TCGTAACAACTCCGCCCCAAT(3ACGCMATGGGCAGGGAA丌CGAGCTCGGTACTCGAGCGGTGTTCCGCGGTCCTCCTCGTATAGAAACTCGGACCACTCTGAGACGAAGGCTCGCGTCCAGGCCAGCACGMGGAGGCTAAGTC;GGAGGGGTAGCGGTCGTTGTCCACTAGGGGGTCCACTCGCTCCAGGGTGTGMGACACATGTCGCCCTCTTCGGCATCAAGGMGGTGATTGGTTTATAGGTGTAGGCCACGTGACCGGGTGTTCCTGAAGGGGGGCTATAAAAGGGGGTGGGGGCGCGTTCGTCCTCACTGTCTTCCGGATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGGTTGAGGACAAACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTCGGCCTCCGAACGGTACTCCGCCAGCGAGGGACGTGAGCGAGTCCGCATCGACCGGATCGGAAMCCTCTCGACTGTTGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATTGTCAGTTTCCAAAAACGAGGAGGATTTGATATTCACCTGGCCCGCGGTGATGCCTTTGAGGGTGGCCGCGTCCATCTGGTCAGAAAAGACAATCTTTTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAGATCTGGCCATACACTTGAGTGACAATGACATCCACTTTGCCTTTCTCTCCACAGGTGTCCACTCCCAGGTCCAACCGGAATTGTACCCGCGGCCAGAGCTTGCCCGGGCGCCACCATGGAGTTTGGGCTGAGCTGGCTTnTCTTGTCGCGATnTAAAAGGTGTCCAGTGTGAGGTGCAGCTGGTGGAGTCTGGGGGAGGCTTGGTACAGCCCGGCAGGTCCCTGAGACTCTCCTGTGCGGCCTCTGGATTCACCTTTGATGATTATGCCATGCACTGGGTCCGGCAAGCTCCAGGGAAGGGCCTGGAATGGGTCTCAGCTATCACTTGGAATAGTGGTCACATAGACTATGCGGACTCTGTGGAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGMCTCCCTGTATCTGCMATGAACAGTCTGA(3AGGTGAGGATACGGCCGTATATTACTGTGCGAMGTCTCGTACCTTAGCACCGCGTCCTCCCTTGACTATTGGGGCCAAGGTACCCTGGTCACCGTCTCGAGTGCGTCGACCMGGGCCCATCGGTCTTCCCCCTGGCACCCTCCTCCAAGAGCACCTCTGGGGGCACAGCGGCCCTGGGCTGCCTGGTCAAGGACTACTTCCCCGMCCGGTGACGGTGTCGTGGAACTCAGGCGCCCTGACCAGCGGCGTGCACACCTTCCCGGCTGTCCTACAGTCCTCAGGACTCTACTCCCTCAGCAGCGTGGTGACCGTGCCCTCCAGCAGCTTGGGCACCCAGACCTACATCTGCAAGGTGAATCACAAGCCCAGCMCACCAAGGTGGACAAGAAAGTTGAGCCCAAATCTTGTGACAAMCTCACACATGCCCACCGTGCCCAGCACCTGAACTCCTGGGGGGACCGTCAGTCTTCCTCTTCCCCCCAAAACCCAAGGACACCCTCATGATCTGCCGGACCCCTGAGGTCACATGCGTGGTGGTGGACGTGAGCCACGAAGACCCTGAGGTCAAGTTCAACTGGTACGTGGACGGCGTGGAGGTGCATAATGCCAAGACAAAGCCGCGGGAGGAGCAGTACMCAGCACGTACCGTGTGGTCAGCGTCCTCACCGTCCTGCACGAGGACTGGCTGAATGGCAAGGAGTACAAGTGCAAGGTCTCCAACAAAGCCCTCCCAGCCCCCATCGAGAAMCCATCTCCAMGCCMAGGGCAGCCCCGAGAACCACAGGTGTACACCCTGCCCCCATCCCGGGATGAGCTGACCAAGAACCAGGTCAGCCTGACCTGCCTGGTCMAGGCTTCTATCCCAGCGACATCGCCGTGGAGTGGGAGAGCAATGGGCAGCCGGAGAACAACTACAAGACGACGCCTCCCGTGCTGGACTCCGACGGCTCCTTCTTCCTCTACAGCAAGCTCACCGTGGACMGAGCAGGTGGCAGCAGGGGAACGTCTTCTCATGCTCCGTGATGCATGAGGCTCTGCACAACCACTACACGCAGAAGAGCCTCTCCCTGTCTCCGGGTAAAACCATTTTACCGGMGAATGGGTTCCACTAATTAMAACGGTAAAGTTAAGATATTCCGCATTGGGGACTTCGTTGATGGACTTATGMGGCGAACCAAGGAAAAGTGMGAAMCGGGGGATACAGAAGTTTTAGAAGTTGCAGGAATTCATGCGTnTCCTTTGACAGGMGTCCMGAA(3GCCCGTG丁AATGGCAGTGAAAGCCGTGATAAGACACCG丌ATTCCGGMATGTTTATAGMTAGTCTTAAACTGTGGTAGAAAAATAACAATAACAGAAGGGCATAGCCTATTTGTCTATAGGAACGGG(3ATCTCGTTGAGGCAACTGGGGAGGATGTCAAAATTGGGGATCTTCTTGCAGTTCCMGATCAGTAAACCTACCAGAGiAAMGGGAACGCTTGMTATTGTTGAACTTCTTCTGAATCTCTCACCGGAAGAGACAGAAGATATAATACTTACGATTCCAGTTAAAGGCAGAAAGMC丌CTTCMGGGMTGTTGAGAACATTACGTTGGATTTTTGGTGAGGAAAAGAGAGTAAGGACAGCGAGCCGCTATCTAAGACACCTTGAAMTCTCGGATACATAAGGTTGAGGAAAATTGGATACGACATCATTGATAAGGA(3GGGCTTGAGAAATATAGAACGTTGTACGAGAAACTTGTTGATGTTGTCCGCTATAATGGCAACAAGAGAGAGTATTTAGTTGAATTTAATGCTGTCCGGGACGTTATCTCACTAATGCCAGAG(3AAGAACTGAAGGAATGGCGTATTGGMCTAGAAAT(3GATTCAGAATGGGTACGTTCGTA(3ATATTGATGAAGATnTGCCMGCTTGGATACGATAGGGGAGTCTACAGGGTrTATGTAAACGA(3GAACTTMG"nTACGlGAATACAGMAGAAAAAGAAT(3TATATCACTCTCACATTGTTCCAAAGGATATTCTCAMCiAAACTrrTGGTAAGGTCTTCCAGMAAATATAAGTTACAAGAAATTTAGAGAGCTTGTAGMAATGGMMCTTGACAGGGAGMAGCCAAACGCATTGAGTGGTTACTTMCGGAGATATAGTCCTAGATAGAGTCGTAGAGATTMGAGAGAGTACTATGATGGTTACGTTTACGATCTAAGTGTCGATGAAGATGAGAAmCCTTGCTGGCTTTGGATTCCTCTATGCACATMTGACATCCAGATGACCCA(JTCTCCATCCTCCCTGTCTGCATGTGTAGGGGACAGAGTCACCATCACTTGiTCGGGCAAGTCAGGGCATCAGAAATTACTTAGCCTGGTATCAGCMAAACCAGGGAAAGCCCCTAAGGTGCTGATCTATGCTGCATCCACTTTGCAATCAGGGGTGCCATCTCGGTTCAGTGGCAGTGGATCTGGGACAGATTTCACTCTCACCATCAGCAGCCTACAGCCTGAAGATGTTGCAACTTATTACTGTCAAAGGTATAACCGTGCACCGTATACrnTGGCCAGG(SGACCMGGTGGAAATCAAACGTAGGGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATGTGATGAGCAGTTGAMTCTGGAAGTGCCTCTGTTGTGTGCCTGCTGMTMCTTCTATCCCAGAGAGGCCMAGTACAGTGGAAGGTGGATAACGCCCTCCMTCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAMCACAAAGTCTACGCCTGCGMGTCACCCATCAGGGCCTGAGCTCGCCCGTCACMAGAGCTTCMCAGGGGAGAGTGTTGAGCGGCCGCGTTTAAACTGMTGAGCGCGTCCATCCAGACATGATAAGATACATTGATGAGTTTGGACAMCCACAACTAGAATGCAGTGAMAAAATGCTTTATTTGTGAAATTTGTGATGCTATtGCTTTATTTGTAACCATTATAAGCTGCMTAAACAAGTTAACAACMCMTTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGI11MIAAAGCAAGTMAACCTCTACAAATGTGGTATGGCTGATTATGATCCGGCTGCGTGGCGGGT7TCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTMGCGGATGCCGG(3AGGAGACAA(3CCC(3TCAGGGCGGGTCAGCGGGTGTTGGCGGGTGTCGGGGCGCAGCCATGACCGGTCGACGGCGCGCCIMINIITAATTnTATTTTATnTATTnTGACGCGCCGAAGGCGCGATCTGAGCTCGGTACAGCTTGGCTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCMTTAGTCAGCAACCAGGTGTGGMAGTCCCCAGGCTCCCCAGCAGGCAGMGTATGCMAGCATGCATCTCAATTAGTCAGCMCCATAGTCCCGCCGCTMCTCCGCCCATCCCGCCCCTAACTCCGCCGAGTTCGGGGCATTCTCCGCCGCATGGCTGACTMTTTnTTTATTTATGCAGAGGCCGAGGCCGCGTCGGCCTCTGAGCTATTGCAGAAGTAGTCSAGGAGGCTTmTGGAGGCCTAGGCTTTTGCAAAAAGCTCCTCGAGGMCTGAAAAACCAGAAAGTTAACTGGTMGTTTAGTCnTTTGTCTTTTATTTCA(3(3TCCCG(5ATGC(3GTGGTG(3TGCAAATCAAAGAACTGCTCCTCAGTGGATGTTGCCTTTACTTCTAGGCCTGTACGGAAGTGTTACTTCTGCTCTAAAAGCTGCGGMTTGTACCCGCGGCCTAATACGACTCACTATAGGGACTAGTATGGTTCGACCATTGMCTGCATCGTCGCCGTGTCCCAAAATATGGGGATTOGCMGMCGGAGACCTACCCTGGCCTCCGCTCAGGMCGAGTTCAAGTACTTCCAAAGAATGACCACAACCTCTTCAGTGGAAGGTAMCAGAATCTGGTGATTATGGGTAGGAAMCCTGGTTCTCCATTCCTGAGMGMTCGACCTTTAAAGGACAGAATTAATATAGTTCTCAGTAGAGMCTCAMGAACCACCACGAGGAGCTCATTTTCTTGiCCAAAAGTTTAGATGATGCCTTAAGACTTATTGMCAACCGGMTTGGCMGTAAAGTAGACATGGTTTGGATAGTCGGAGGCAGTTGTGTTTACCAGGAAGCCATGAATCMCCAGGCCACCTCAGACTCTTTGTGACAAGGATCATGCAGGMTTTGAAAGTGACACGTTnTCCCAGAAATTGATTTGGGGMATATAMCTTCTCCCAGAATACCCAGGCGTCCTCTCTGAGGTCCAGGAGGMMAGGCATCAAGTATAAGTTTGAAGTCTACGAGAAGMAGACTMGCGGCCGAGCGCGCGGATCTGGAMCGGGAGATGGGGGAGGCTAACTGAAGCACGGAAGGAGACAATACC(3GAAGGAACCCGCGCTATGACGGCAATAAAAAGACAGAATAAAACGCACGGGTGTTGGGTCGTnGTTCATAAACGCGGGGTTCGGTCCCAGGGCTGGCACTCTGTCGATAGCCCACCGAGACC^ATJpGGGCCMTACGCCCGCGTTTCTTCCTTTTCGCCACGGCACCGCGCMGTTGGGGTGAAGGC'GCAGGGeTCGCAGlCCAACGTCGGGGCGGCAGGCCCTGCCATAGCCACTGGCCCCGTGGGTTA(3GGACGG(3GTCCCCCATGGGGAATGGTTTATGGnTCGTGGGGGTTATTATnTGGGCGTTGCGTGGGGTCTGIGAGATCCCCCGGGCTGCAGGAATTCCGTTACATTACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCC(3CCCATTGACGTCAATMTGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATT6ACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATG(3GACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTnTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACT(〕ACG(3GGATTTCCMGTCTCCACCCCATTGACGTCAATGG(3AGTTTGTTTTGGCACCAAAATCAACGG(3AGTTTCGMAATGTGGTAACAAGTGCGCCCCATTGAC(3CMMGGGCGGGMTTC(3A(SCTC卵TAGTCGA(3GGGT(3TTCC(3CG(3TCGTCCTCGTATAGAAACTCGGACCACTCTGAQACGMGGCTCGGGTCCAGGCCAGCACGAAGGAGGCTMGTGGGAGGGGTAGCGGTC(3TTC3TCCACTA(3GGGGTCGACTCGCTCCA(3GGTGTGMGACACATGTCGCCCTCTrCQGCATCMGGAAGGTGATT(3GTTTATAG(5TGTAG(3CCACGT(3ACCGC3GTG丌CCTGAAGGGGGGCTATAMAGGGGGTGGGG(3CGCG丌CGTCCTCACTCTCTTCCGCATCGCTGTCTGCGAGGGCCAGCTGTTGGGCTCGCGenTGAGGACMACTCTTCGCGGTCTTTCCAGTACTCTTGGATCGGAAACCCGTG(3GCGTCGGMCGGrrACTCCGCCACCGAGGGACCTGAGCGAGTCCGCATCGACCGGATCGGAAAACCTGTGGAGTG7TGGGGTGAGTACTCCCTCTCAAAAGCGGGCATGACTTCTGCGCTAAGATrGTCAGrnTCCAAAAACGAGGAGGATTTGATATTCACCT(3GCCC(3CGGTGATGCCTTTGAGGGTG(3CCGCGTCCATGTGGTCAGAAAAGACAATCTnTTGTTGTCAAGCTTGAGGTGTGGCAGGCTTGAC3ATCT(3GCCATACACTT(3AGTGACMTGACATCCACTTTGCCTTrCTCTGCACAGGTGTCCACTCCCA(2GTCCMCCGGAATTGTACCC(3CGGCCAGAGCTTGCGGGCGCCACC6GGGGCGCGGGGATCCAGACATGATAAGATACATTGATGAG7TTGGACMACCACAACTAGAATGCAGTGAAAAAMTGCTTTATTT(3TGAMnT(3TGATGCTATTGCTTTATTTGTAACCATTATMGGTGCMTAAACAAGTTMCAACMCAATTGCA丌CATTTTATGTTTCA(3GTTCAGGGGGA(3GTGTGGGAGG11111ICGGATCCTCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATT6TTATGCGCTCACAATTCCACACMCATACGAGCC(;GAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGiCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTMTGMTCGGCCAACGCGCGGGGAMGGCGGTTTGCGTATrGGGCGCTCTTCCGCTrCCTCGCTCACTGACTCGCTGCGCTCGGTCGTrCGGCTGCGGCGAGCGGTATCAGCTCACTCAMGGCGGTMTACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAMAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTCTTCCATAGiGCTCC(3CCGCCGTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGT加CGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGMGCTCCGTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCnTC丁CGCTTCG(3GMGCGTG(3C(3CTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGGTCGAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCG(5TAACTATGGTCTTGAGTCCMCCCGGTAAGACACGACTTATCGCCACTGGCAGCA(3CGACT(3GTMCA(3GATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGMGTGGTGGCCTMCTACGGCTAGACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGMAAAGAGTTGGTAGCTCTTGATCCGGCAMCMACCACCGCTGGTAGCGGTGGTTTTnTGTTTGCM(3CAGCAGATTACGCGCAGMMAAAGGATCTGMGAAGA,.GCTTTGATCTTTTCTACGGGGTCTOACGCTCAGTGGAACGAAAACTCACGTTMGGGATT7TGGTCATGAGATTATCMMAGGATCTTCACCTA(3ATCCCrnTAATTAAAAATGMGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACGTATCTCAGCGATCTGTCTATTTCG丌CATCCATAGTTGCCTGAGTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCMTGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGMGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTMTTGTTGCCGGGMGCTAGAGTAAGTAGTTvwww,、w,'nn,r"iw,,,wwivrnww',w,,wwn,,wv',ivr~twww/~i,vw,ww,w'vnvww,ww,vGTTTGGTATGGCTTCA丌CAGCTCCGGTTCCCAAC(3ATCAAGGCGA(3TTACATGATCCCCCATGTTGTGCAAAAMGCGGTTAGCTCCTTCGGTCCTCGGATCGTTGTCAGAAGTMGTTG(3CCGCAGTG丌ATCACTCATGG丌ATGGCAGCACTGGATAATTCTCTTACTGTCATGCCATCCGTAAGATGC丌TTCTGTGACTGGTGAGTACTCAACCAAGTCA丌CTGAGAATAGTGTATGCGGCGACCGAGTTGCTC丌GCCCGGCGTCAATACGGGATAATACGGCGCCACATAGCAGAACTTTAMAGTGCTCATCATTGGMAACGTTCTTCGGGGCGAAAACTCTCMGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCMCTGATCTTCAGCATCmTACnTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCrrCCTTTTTCAATATTATTGMGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGMAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACG(3TGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCC3GAT(3CCGGGA(3CAGACM(3CCCGTCAGGGCGCGTCAGCGGGTG丌GGC(3GGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGA丌GTACTGAGAGTGCACCATATGCGGTGTGAMTACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCMCTGTTGGGAAGGGCGATCGGTGCGGGCCTC丌CGCTATTACGCCAGCTGGCGAMGGGGGATGTGCTGCAAGGGGATTMGTrGGGTMCGCCAGGGTTTTCCCAGTTACGACGTTGTMAACGACGGCGAGTGAATT表9.具有有限的侧翼序列信息的天然Psp-GBDPol蛋白内含子序列的氨基酸序列(NCBI登录号No.AAA67132.1)(SEQIDNO:51)N/SILPEEWVP圆GKVKIFRIGDFVDGLM隨QG隨KTGDTEVLEVAGIHAFSFDRKSKKARVMAV隨旧隨SG隨RIVLNSGRKmTEGHSLFVYRNGDLVEATGEDVKIGDLLAVPRSVNLPEKRERL隨ELLLNLSPEETEDIILTIPVKGRKNFFKGMLRTL麵FGEE隨RTASRYLRHLENLGY旧圆GYDHDKEGLEKYRTLYEKLVDWRYNGNKREYLVE隨VRDVISLMPEEELKEWRIGTRNGFRMGTFVDIDEDFAKLLGYYVSEGSARKWKNQTGGWSYTVRLYNENDEVLDDMEHLAKKFFG隨RG隨VEIPK隨YIIFESLCGTLAEN隨PEVIFTSS隨RWAFLEGYFIGDGDVHPS,RLSTKSELLVNGLVLLLNSLGVSAIKLGYDSGVYRVYVNEELKFTEYRK國VYHSHIVPKDILKETFGKVFQKN旧YKKFRELVENGKLDRE-:隨RIEWLLNGDIVLDRWEIKREYYDGYVYDLSVDEDENFLAGFGFLYAHN/SYYGYYGYA/表示剪接连接,下划线的氨基酸表示蛋白内含子序列,剩余的表示蛋白外显子序列信息。实施例2.免疫球蛋白多蛋白序列和具有黑腹果蝇Hedgehog自体加工结构域,C17和C25序列的载体的构建有效表达抗体分子的再一策略是多蛋白表达,其中Hedgehog结构域位于重链和轻链之间,具有Hedgehog结构域序列和/或连接序列的修饰,使得存在组成蛋白的释放而没有胆固醇添加至N-端蛋白质。在这样的构建体内,存在每个相关重链和轻链的一个拷贝,或轻链可以加倍来提供至少两个轻链,或存在重链和轻链的多个拷贝,只要提供功能'1"生裂解岸&1*化沐玄恭A^化恭^ii';子4M恭A庶^t7^蛮可以多次使用特定裂解位点策略(例如,Hedgehog结构域),或多个裂解位点各自可以是独立的。因此,可以相对于免疫球蛋白或免疫球蛋白衍生的蛋白质的至少一个末端来安置不同的蛋白酶解加工序列。以下寡核苷酸用于黑腹果蝇HedgehogC-端自体加工结构域(Hh-C),序列Hh-C17,Hh-C17截断(和具有突变的一个)和Hh-C25(GenBank登录号弁L02793.1)的扩增,使用基因组DNA作为^t板和PlatinumTaqHiFidelityPCRSupermix(Invitrogen)。从DrosophilaD.Mel-2细胞的冷冻管(Invitrogen,cat.#10831-014)制备基因组DNA。C17-5':TGC丌CACGCCGGAGAGCAC(SEQIDNOM41)C17-full-3'ATTATGGACGACAACCTGGTTGGCAA(SEQIDNO:142)C25-actual-3':ATCGTGGCGCCAG(丌CTGCG(SEQIDNO:143)C17-3':GCAACTGGCGGCCACCGAGT(SEQIDNO:144)C17-scya-3':CGCATAGCAACTGGCGGCCA(SEQ旧NO:145)C17-sc/hn-3':GTTGTGGGCGGCCACCGAGT(SEQIDNO:146)i^艮据以下程序运行PCR:<table>tableseeoriginaldocumentpage129</column></row><table>设计寡核香酸引物来产生D2E7重链-Hh-C-D2E7轻链的融合体,通过同源重组至大肠杆菌中的pTT3-HcintLCp.horikoshii构建体中。通过工程化PCR产生的载体(含有pTT3载体,重链和轻链片段但没有极端嗜热古菌蛋白内含子)和Hh-C结构域插入片段之间的40个碱基对悬垂物,将两个DNA片段混合并转化至大肠杆菌中,没有连接的益处,导致两个片段大肠杆菌同源重组至pTT3-HC-Hh-C-LC中(以各种形式作为最初PCR产物指示)。Hh-C结构域同源重组引物C17-HR5':CCACTACACGCAGMGAGCCTCTCCCTGTCTCCGGGTAMTGCTTCACGCCGGAGAGCAC(SEQIDNO:147)C17-iull-HR-3':GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCACTGGCTGTTGATCACCG(SEQIDNO:14B)C25'actual'HR-3':GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATATCGTGGCGCCAGCTCTGCG(SEQIDNO:149>C17-HR3':GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATGCAACTGGCGGCCACCGAGT(SEQIDNO:150)C17-scya.HR-3':GCAGCAGGCCCAGCAGCTGGGC(3GGCACGCGCATGTCCATCGCATAGCAACTGGCGGCCA(SEQIDNO:151>C17-sc/hn-HR-3':GCAGCAGGCCCAGCAGCTGGGCGGGCACGCGCATGTCCATG丌GTGGGCGGCCACCGAGT(SEQIDNO:152)pTT3-HcintLC同源重组引物pTT3int-HR5':ATGGACATGCGCGTGCCCGCCCAGCTGCTGGGCCTGCTGC(SEQIDNO:153)pTT3int-HR3':TTTACCCGGAGACAGGGAGAGGCTCTTCTGCGTGTAGTGGT(SEQIDNO:154>根据以下程序运行Hh-C结构域的PCR:使用Pfu-IHiFidelityDNA聚合酶(Stmtagene)。步骤12345678温度94'C94'C60。C72°C转到步骤2(34次)72'C4'C结束时间2minlminlmin1.5min5min保持才艮据以下程序运行载体的PCR:使用PlatinumTaqHiFidelitySupermix(Invitrogen)。步骤12345678温度94°C94。C60'C68'C转到步骤2(34次)68°C4'C结束时间2min30sec30seclOmin5min"f呆持为了获得Hh-C结构域同源克隆至pTT3-HcintLC中,使用以下的策略。将PCR产物凝胶纯化并将每个稀释至50|iil稀释緩沖液中(Qiaquick凝胶提取试剂盒,Qiagen)。将3^1载体PCR产物和3pl所需的Hint结构域PCR产物(各种形式)在Eppendorf管中混合。将PCR扩增产物转化至大肠杆菌中并置于LB+氨节青霉素平板上,在37。C培养过夜,并将克隆生长至2ml培养物,使用Wizardprep试剂盒(Promega)提取质粒DNA,并通过限制性核酸内切酶消化和琼脂糖凝胶电泳来分析DNA样品。对于DNA序列分析产生正确限制模式的克隆,来证实已经产生所需的序列。使用黑腹果蝇HedgehogC-末端自体加工结构域设计了五个用于D2E7重链-Hh-C-D2E7轻链表达的表达构建体pTT3-HC-Hh-C17-LC;pTT3-HC画Hh画C17-SC-LC;pTT3-HC-Hh-C17-NH-LC;和pTT3-HC-Hh-C25-LC。表27.完整质粒pTT3-D2E7重链-Hh-C17-D2E7轻链的序列(SEQIDNO:155)5'-tagtgtgttggaattttttgtgtctctcactcggaaggacatatgggagggcaaatcatttggtcgagatccctcggagatctctagctagaggatcgatccccgccccggacgaactaaacctgactacgacatctctgccccttcttcgcggggcagtgcatgtaatcccttcagttggttggtaGaacttgcc肪ctgggccc柳ccacatgtgeiC3cggggggggaccaaacacaa3ggggttctctgactgtagttgacatccttataa3tggatgtgcacatttgccaacactgagt卿tttcatcctggagcagactttgcagtotgtggactgcaacacaacattgcctttatgtgtaactettggctgaagctcttacaccaatgctgggggacatgtacctcccaggggcccaggaagactacgggaggctacaccaacgtcaatcagaggggcctgtgtagctaccgataagcggaccctcaagagggcattagcaatagtgtttataaggcccccttgttaaccctaaacgggteigcatatgcttcccgggtagtagtatatectatccagacta3cccl:3a加aatagcateitgttaccc3acgggaagc3tatgctategaattagggttagtasaagggtcctaaggaacagcgatatctcccsccccatgagctgtcacggttttatttacatggggtcaggattccacgagggtagtgaacc'a他agtca(;aagggcagtggctgaagatcaaggagcgggcagtgaactctcctga,atcttcgcctgcttcttcattctccttcgtttagctaatagaataactgctgagttgtgaacagtaaggtgtatgtg鄉tgctcgaaaacaaggtttca9gtgacgcccccagaataaaatttggacggggggttcagtggtggc3ttgtgctatg3cacca3tataaccctcaca助ccccttgggcaataaatactagtgtaggaatgaaacattctgaatatctaacacataatcctagtgcaatatgatactggggttattaagatgtgtccc8iggc柳gaccaagacaggtgaaccatgttgttacactetatttgtaaGaaggggaaagagagtggacgccgaGagcagcggactccactggttgtctctaacacccccgaaa她aaacggggctccacgccaatggggcccsitaaacaaagacaagtggccactcttttttttgaaattgtggagtgggggcacgcgtcagcccccacacgccgccctgcggttttggactgtaaaataagggtgtaataacttggctgattgt3accccgct3acc3ctgcggtC3aacc3cttgccc3ca8aEiccactaatggGaccccggggaatacctgGataagteiggtgggcgggccaagataggggcgcgattgctgcgatctggaggacaaattacacscacttgcgcctgagcgccaagcacagggttgttggtcctcatattcacgaggtcgctgagagcacggtgggctaatgttgccatgggtagcatatactacccaaatatetggatagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatttatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatctgggtagtatatgctatcctaatctgtatccgggtagcatatgctatcctaatagag3ttagggtagt3t3tgctatcct3a麵atctgggtagc:at3taGtacccaa3t3tctgg3teigc8t3tgctatcct3atctatatctgggtagcatatgctatcctaatctatatctgggtagcataggctatcctaatctatatctgggtagcatatgctatcctaatctatatetgggtagtatatgctatcctaatttatatctgggtagcataggctatoctaatctatatctgggtagcatatgctatcGtaatctatatGtgggtagtatatgctatGctaatGtgtatccgggtagcatatgctatcctcatgataagctgtcaaacatgagguittttcttgsagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttctt卿cgtc卿tggcacttttcggggeiaatgtgcgcggEiac;CGGtetttgtttatttttctaaat3cattcaaatatgtatcGgctcatgagacaataaccctgataaatgcttcaaitaatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagteiaaagatgctgaagatcagttgggtgceicgeigtgggttacatGg肪ctggatGtcaacagcggt卿atGctt卿agttttcgccccgaagaacgttttccaatgaitgagcacttttaaagttctgct卿ggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtac1:caccagtc3cagaaaagcatcttacggatggcatgacagtaagag3咖tgcagtgctgccatei6iccatgeigtgeit幼c8ctgcggcG肪cttaGttctgaGaacgatGggaggaccgaaggiagctaaccgcttttttgcacaacatgggggi3tcatgtaactcgccttgatcgttgggeiaccggagctgactggcg助ctaGttaGtct3gGttGGcggcaac肪ttaatageiGtggatggaggcggataaagttgc柳accacttctgcgctcggcccttccggctggctggtttattgctgataaatc!tggagccggtgagcgtgggtctcgcggtatcattgcagcaGtggggccagatggtaagccctcccgtatcgtagttatdacacgacggggagtcaggcaactatggatg台aGgaaatagacagatcgctgagataggtgcctcactgattaagc:attggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatetcatgaccaaaatcccttaacgtgagttttcgttccact卿cgtcagaccccgtagaa3aga,:c站aggeitettcttgageitcctttttttctgcgGgtaatGtgctgcttgcaaacaaaaaaaccaccgctaGcag卿tggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagc3gagcgcag3taccaaatactgttcttct6igtgtagccgtagttaggccaccacttcaag3actctgtagcaccgcctacatacctcgctctgctaatcctgttaa'agtggctgctgccagtggcgataagtcgtgtcttaccggg卿actcaagacgatagttac卿ataaggcgcag卿tcgggctgaacggggggttcgtgcacacagcccgg鄉cgcctggtatctttatagtcctgtcgggtttcgccacctctgacttg3gcgtcgatttttgtg8tgctcgtc柳ggggcggagcctat卿aaaacgccagcaacgcggccttttta卿ttcctggccttttgctggcc卿ctceicatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgstaccgctcgccgcagccgaacgacGgagcgcagcgeigtcagtgagcgagg卿cgga柳gcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagGgggcagtgagcgcaacgcaattaatgtgagttagctcactcatt柳caccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgccaagctcl:卿tagaggtcgaccaattctcatgtttgacagcttatcatcgc3g3tccgggcaacgttgttgccattgctgcaggcgcagaac卿aggt3tgga3gatctatacattgaatcaatattggcaattagccatattagtcattggttatatagcataaatcaatattggctattggccattgcatacgttgtatctatatcataatatgtacatttatattggctc卿cc3ateitg3ccg(;catgttgacattgattattgactagttatt8ategtaateaattacg卿tc卿gttcatagcccatatatgg3gttCGgcgttacata3cttacggt幼atggcccgcGtggctg3ccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtateatatgccaagtccgccccctattgacgtcaatgscggtaaatggcccgcctggcattatgcccsigtacatgaccttacgggactttcctacttggcagtecatctacg城agtcatcgctattaccatggtgatg卿卿gcagtacaccaatgggcgtggatagcggtttgactcacggggatttccaa,gtctccaccccattgacgtcaatgggagtt〖g卿gcaccaaaatca3cgggactttccaaa卿cgtaataaccccgccccgttgacgcaaatgggcggtaggc:gtgtacggtgggaggtctatataagcagagctcgtttagtg站ccgtGagatcctcactctettGcgcatcgGtgtGtgGgagggGcagctgttgggctcgcggttg柳acaaactcttcgcggtctttccagtactcttggatcggaaacccgtcggcctocgascggtactccgccaccgagggacctgsgcgagtccgcatcgaccggatcggaaaacctctcgagaaaggcgtctaaccagtcacagtcgcaaggtaggctgagcaccgtggcgggcggcagcgggtggcggtcggggttgWctggcggaggtgGtgctgatgatgtaattaaagtaggcggtcttgagacggcggatggtcgaggtgaggtgtggcaggcttgagatccagctgttggggtgagtactccctctcaa卿cgggCcttctgcgcteieigattgtcagtttcc纖aiacg柳3ggsitttgatattcacctggcccgatctggccatacacttgagtgacaatgacatccactttgcctttctctccac;aggtgtccaGtcccaggtGcaagtttgggcgGcaccatggagtttgggctgagctggc職cttgtcgcgattttaaaaggtgtccagtgt-gaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcEictgggtccggGeiagctGcaggg卿ggcctgg3atgggtGtc鄉tatcacttgg3atag卿cacatagactatgcggactctgtgga卿(:cgattcaccatctccagagacaacgccaagei8ictcGctgtatGtgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgc^tcctcccttg3ctattggggcca柳taccctggtcacc:gtctcgagtgcgtcgaccaagggccicsitcggtcttccccctggcaccctcctcc幼gagcacctctgggggcacag(:ggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactc鄉cgccGtgaGcag卿cgtgcacaccttcc柳卿cctacagtcctcagg3Ctctactccctcagcagcgtggtg3ccgtgccctccagcagcttgggcacccag8cctac3tctgcaacgtgaatcac鄉cGcagcaacacca柳tggac鄉aaagttgagcccaaatcttgtgacaaiaactcacacatgcccaiccgtgcccagcacGtgaactcctggggggaccgtcagtettcctGttGCCcccaaaacGca柳aceiccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggca柳agtacaiagtgca柳tctccaacaaeigccctccc3gcccccatcgagaaaaccatctcca鄉ccaaagggcagccccgagaaccacaggtgteicaccctgcccccatcccggg3tgag(;tgacG卿a3CC3ggtoagcctgacctgcctggtcaa柳cttctatcccagcgacatogccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagc鄉ctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaiaccactacacgceigaagagcctctccctsitctccgggtaeia-gtgttttgagcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctegagcagtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccgctgacccgcgagggcaccattgtggtcaacteggtggccgccagttgctat卿gtgateaacagccagtcg'acccagtctccatcctccctgtctgcatctgtaggggacagagtcaccatcacttgtcgggcaagtcagggcatcagagggtcccatctcggttcagt卿agt卿tctgggac3gatttcactctcaccatc3gc3gcctacagcctg33gatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatactl:ttggcc卿ggacca柳tggaaatcaaacgtacggtggctgcaccatctgtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatc(:cagag卿Gcaaagtacagtgg鄉gtggataacgccctccaatc卿t幼ctccc柳agagtgtcacagagcaggacagca柳acagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgag幼acatca鄉tctacgcctgcgaagtcacccatca卿cctgagctcgcccgtcaca鄉agcttcaacag卯gagagtgt》pTT3载体-重链-Hh-C17-轻链在以下的构建体中,与以上构建体的唯一差异是C17片段的截断,结果是除去了胆固醇转移的活性。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的笫一行)至D2E7轻链编码片段的5,端(LC编码序列的头9个碱基对,表的最后一行)。表28.质粒pTT3-HC-C17-sc-LC的部分编码序列(SEQIDNO:156)C卿gtaas-tggagacgggcgagctgaggccccagcgagtcgtca柳tgggcagtgtgcgcagtaagggcgtggtcgcgccgctg3cccgcgagggcacc8ttgtggtcaaGtcggtggccgccagttgc-atggacatg重链3,序列-Hh-Cn-轻链5,序列在以下的构建体中,与以上构建体pTT3-HC-C17-sc-LC的唯一差异是hedgehogC17片段中最后两个氨基酸的突变,从SC突变至HN(下划线的)。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的第一行)至D2E7轻链编码片段的5,端(表的最后一行)。表29.质粒pTT3-HC-C17-hn-LC的部分编码序列(SEQIDNO:157)ccgggtaaa-cagccggagagccagaagctcacg卿gtttgcggatcgcatcgaggagaagaaccaggtgctcgtacgggatgtggagacgggcgagctgaggccccagcgagtcgtcaaggtgggcagtgtgcgcagtaagggcgtggtcgcgccg重链3'序列-Hh-Cl7-突变-轻链5,序列在以下的构建体中,使用Hint结构域的全部C25片段,而不是C17。所示的序列从D2E7重链编码片段的末端(HC编码序列的最后9个碱基对,表的第一行)至D2E7轻链编码片段的5,端(LC编码序列的头9个碱基对,表的最后一行)。表29B.pTT3-HC-C25-Hint-LC的部分编码序列(SEQIDNO:158)(SEQIDNO:140)Hh-C25的氨基酸序列和相关的构建体(向下的箭头表示裂解位点;丄Hh-C17丄Hh-C17sc):ccgggtaaa-gtg卿agcatgaccgccaacggacaggccgtctacagcgaagtgatcctcttcatggaccgcaacctcgagcagctg3CccgGg柳gcaccattgtggtoa3Gt卿tggccgGC3gttgct3tgcggtgatcaacagccagtcgctggcctacgttctgccgcagagctggcgccacgat-atggacatgnTAAATCAATCTAAAOTATATATOAGTAAACTTGOTCTGACA(3TTACCAATQCTTAATCAGTGA(3GCACCTATCTCA(3CQATCTOTCTATTTCQTTCATCCATAGTTGCCTeAGTGCCCGTCerraTAGATMCTACGATAC(3(3GIAGGQCTTACCATCTGGCCCCAGrraCTGCMTGATACCGGGAGACCCACGCTCACGCKSCTCCAGATTTATCAGCAATMACCAGICCAGCCGGAAGGGCCGAGCGCAGiAAGTGGTCCTGCAACTTTATCCGCCTCCATCCACrrCTATTAATTGTTGCCGGGMGCTAGAGTAAGTAGnTCGCCAGTTAATAGTT"raCGCMCeiTTGTraCCATT(3CTACAGGCATCGTOGTOTCACGCTCQTCQTTTGGTATGGGTTCATTCAGCTGCCK3TrCCCAACGATCM的C。AGTTACATGATCGCCCATOTraTGCAAAMAGCGGTTAGCTCCTTCGGTCCTCCQATCGrraTCA(3AAGTAAQTTGGCCQGA。TQTTATCACTCATQGTTATGQCAGCACTGCATAATrCTC7TACTGTGATOCCATCC6TMGATC3CTTTTCTGTGAGT加T6AOTACTCAACCMOTCATTCTOAGMTAGTGTATGCQGCGACC(3A(3TraCTCTTGCCCG(3CQTGAATACGGGATMTACCGCGCCACATAGCAGAACmAMAGTGCTCATCATreGAAAAC(3TTCTTC(3(3(3GCGAAAACTCTCAAQQATCTTACCQCTGTTGAGATCCAGTTCGATGTMCCCACTCGTGCACCCAAGTQATGrrcAQCATCTTrTACTTTCACCAQC(3Tn"CTG<3GTGAQCAAAAACAGGAA<3GCAAAAT<3CCGCAAMAAG<3。AATAA<3QGCGACACQ<3AMTO7TG(AATACTCATACTCTTCCTTnTCAATATTATTGAAQCAnTATCAGiQGTTATr'STCTCATQAGCQQATACATATTTGAATGTATTTAGAAAMTAAACAAATAQQGGTTCCGCGCACATTTCCCCGAMAGTGCCACCTCACGTCTMGAAAGCATrATTATCATGACATTMCCTATAAAMTAGGC(3TATCACGAGGCCCTTTC(3TCTCGGQGQ"m'C(3OTeiATOACQGTeiAAAACCTCT(3ACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCT(3TMGCG(3ATGCCGGGAQCA(3ACAAGCCCGTGAGG(3CGGGTCAGC(3(3(3TGTr(a(3CGGGTGTCGGGGICTGGCTTAACTATGCGGCATCAGAGCAGATTOTAGTGAGAGTeiGACCATATGCGGTerreAAATACCGGACAGATGCGTMGGAGAAMTACCGCATCA(3GCGCCATTC(3CCATTGAG(3GTOG(3GAACTCnT(3GGAA加GGQATG(3eiTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTOCTGGAAQQCGATTWrTGGGTAACGCCAGGGTnTCCCAGTTACGACGTraTMAACGACGGCCAOTGAATT实施例4.作为具有内部可裂解信号肽构建体的多蛋白的抗体表达进一步的实施例形成了用于抗体表达的编码序列,表达载体和方法。初级表达构建体包括具有内部可裂解信号肽的多蛋白,使得表达和随后的裂解导致多链(例如,双链)抗体分子的形成。表7A.D2E7内部可裂解信号肽构建体的编码序列(SEQIDNO:45)atggagtttgggctgagctggctttttcttgtcgcgattttaaaaggtgtccagtgtgaggtgcagctggtggagtctgggggaggcttggtacagcccggcaggtccctgagactctcctgtgcggcctctggattcacctttgatgattatgccatgcactgggtccggcaagctccagggaagggcctggaatgggtctcagctatcacttggaatagtggtcacatagactatgcggactctgtggagggccgattcaccatctccagagacaacgccaagaactccctgtatctgcaaatgaacagtctgagagctgaggatacggccgtatattactgtgcgaaagtctcgtaccttagcaccgcgtcctcccttgactattggggccaaggtaccctggtcaccgtctcgagtgcgtcgaccaagggcccatcggtcttccccctggcaccctcctccaagagcacctctgggggcacagcggccctgggctgcctggtcaaggactacttccccgaaccggtgacggtgtcgtggaactcaggcgccctgaccagcggcgtgcacaccttcccggctgtcctacagtcctcaggactctactccctcagcagcgtggtgaccgtgccctccagcagcttgggcacccagacctacalxtgcaacgtgaatcacaagcccagcaacaccaaggtggacaagaaagttgagcccaaatcttgtgacaaaactcacacatgcccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggtcaagttcaactggtacgtggacggcgtggaggtgcataa.tgccaagacaaagccgcgggaggagcagtacaacagcacgtaccgtgtggtcagcgtcctcaccgtcctgcaccaggactggctgaatggcaaggagtacaagtgcaaggtctccaacaaagccctcccagcccccatogagaaaaccatctccaaagccaaagggcagccccgagaaccacaggtgtacaccctgcccccatcccgggatgagctgaccaagaaccaggtcagcctgacctgcctggtcaaaggcttctatcccagcgacatcgccgtggagtgggagagcaatgggcagccggagaacaactacaagaccacgcctcccgtgctggactccgacggctccttcttcctctacagcaagctcaccgtggacaagagcaggtggcagcaggggaacgtcttctcatgctccgtgatgcatgaggctctgcacaaccactacacgcagaagagcctctccctgtctaggggtaaacgcatgggacgaatggcaatgaaatggttagttgttataatatgtttctctataacaagtcaacctgcttctgctatggacatgcgcgtgcc;cgcccagctgctgggcctgctgctgctgtggttccccggctcgcgatgcgacatccagatgacccagtctccatcctccctgtctgcatctgtaggggaeagagtcaccatcacttgtcgggcaagtcagggcatcagaaattacttagcctggtatcagcaaaaaccagggaaagcccctaagctcctgatctatgctgcatccactttgcaatcaggggtcccatctcggttcagtggcagtggatct:gggacagatttcactctcaccatcagcagcctacagcctgaagatgttgcaacttattactgtcaaaggtataaccgtgcaccgtatacttttggccaggggaccaa.ggtggaaateaaacgtacggtggctgcaccat(:l;gtcttcatcttcccgccatctgatgagcagttgaaatctggaactgcctctgttgtgtgcctgctgaataacttctatcccagagaggccaaagtacagtggaaggtggataacgccctccaatcgggtaactcccaggagagtgtcacagagcaggacagcaaggacagcacctacagcctcagcagcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagctcgcccgtcacaaagagcttcaacaggggagagtgttga表7B.D犯7内部可裂解信号肽构建体的氨基酸序列(SEQIDNO:46)MEFGLSWLFLVAILKGVQCEVQLVESGGGLVQPGRSLRLSCAASGFTFDDYAMHWVFiQAPGKGLEWVSAITWNSGHIDYADSVEGRFTISRDNAKNSLYLQMNSLRAEDTAVYYCAKVSYLSTASSLDYWGQGTLVTVSSASTKGPSVFPLAPSSKSTSGGTAALGCLVKDYFPEPVTVSWNSGALTSGVHTFPAVLQSSGLYSLSSWTVPSSSLGTQTYIC國HKPSNTKVDKKVEPKSCDKTHTCPPCPAPELLGGPSVFLFPPKPKDTLMISRTPEVTCVWDVSHEDPEVKFNWYVDGVEVHNAKTkPREEQYNSTYRWSVLTVLHQDWLNGKEYKCKVSNKALPAPIEKT旧KAKGQPREPQVYTLPPSRDELTKNQVSLTCLVKGFYPSDIAVEWESNGQPENNYKTTPPVLDSDGSFFLYSKLTVDKSRWQQGNVFSCSVMHEALHNHYTQKSLSLSRGKRMGRMAMKWLWIICFSITSQPASAMDMRVPAQLLGLLLLWFPGSRCDIQMTQSPSSLSASVGDRVTITCRASQG旧NYLAWYQQKPGKAPKLLIYAASTLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQRYNRAPYTFGQGTKVEIKRTVMPSVFIFPPS[)EQLKSGTASWCLLNNFYPREAKVQWKVDNALQSGNSQESVTEQDSKDSTYSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGEC*表7C.完整的D2E7内部可裂解信号肽多蛋白表达载体DNA序列(SEQIDNO:47)gaagttcctattccgaagttcctattctetagacgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcgg卿actcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtegtaacaactccgccccaatgacgcaaatgggcagggaattcgagcteggtactcgagcggtgttccgcggtoctcctcgtatagaaactcggaccactctgagacgaaggctogcgtocaggccagcacgaaggaggctaagtgggaggggtagcggtcgttgtccactagggggtccactcgctccagggtgtgaagacacatgtcgGCCtcttcggcatcaaggaaggtgattggtttataggtgtaggccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactctcttccgcatcgctgtctgcgagggccagctgttgggctegcgg'ttgaggacaaactcttcgcggtcWccagtactcttggatcggaaacccgtcggcctccgaacggtactccgccacc卿ggacctgagc卿tccgcatcgaccggatcggaa助cctctegactgttggggt卿tactccctctcaaaagcgggcatgacttctgcgctaagattgtcagtttccaaaaatctttttgttgtcaagcttgaggtgtggcaggcttgagatctggccatacacttgagtgacaatgacatecacWgcctttctctccacaggtgtccactoccaggtocaaccggaattgtacccgcggcc3gagcttgccc卿cgccacc3tggagtttgggctgagctggctttttettgtcgcga他aaaaggtgtccagtgtgaggtgcagctggtggagtctgggggaggagaaagttgagcccaaatcttgtgacaaaactcacacatsicccaccgtgcccagcacctgaactcctggggggaccgtcagtcttcctcttccccccaaaacccaaggacaccctcatgatctcccggacccctgaggtcacatgcgtggtggtggacgtgagccacgaagaccctgaggteaagttcaactggtacgtggacggcgtggaggtgcataatgccaagacacaaagggcagccccgagaaccacaggtgtacaccctg(;ccccatcccgggatgagctgaccaagaaccaggtcggaaatcaaacgtacggtggctgcaccatctgtottcatcttcccgccatetgatgagcagttgaaatctggaactgcctagcaaagcagactacgagaaacacaaagtetacgcctgcgaagtcacccateagggcctgagctegcccgtcaca33g3gcttc33c3g卿agagtgttgagcggccgcgttta朋ctg3atgagcgcgtec3tcc3gac3tg3t3ag3tacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgcftt3卿a3ccatt3ta3gctgc3at3aac鄉tt幼caac3acaattgcattc3加atgttteagg加aggggg卿tgtgggaggttttttaaagc3agt3站3cctctac8aatgtggtatggctgattatgatccggctgcctegcgcgtttcggtgatgacggtgaaa加ctctgacacatgcagctcccggagacggtcacagcttgtctgtaagcggatgccgggagcagacaagcccgtcagggcgcgtcagcgggtgttggcgggtgtcggggcgcagccatgaccggtcgacggcgcgccttmttttaa馳加atttta,aggtgtggaaagtecccaggctccccagcaggcagaagtatgcaaagcatgcatctoaattagtcagcaaccatagtcccgcccctaactccgcccatcccgcccctaactocgGCcagttccgcccattctccgccccatggctgactaatttttttt础atgcag柳ccgaggccgccteggcctctgagctattec3g8agtagtgagg柳cttttttggaggcct3ggcttttgcaaaaagctcctcgaggaactgaaaaaccagaaagttaactggtaagtttagtctttttgtettttatttcaggtcccggatccggtggt:ggtgcaaatcaaagaactgctccteagtggatgtt|gcctttacttctaggcctgtacggaagtgttacttctgctctaaaagctgcggaattgtacccgcggcctaatacQiactcactatagggactagtatggttcgacpattgaactgcatogtcgccgtgtcccaaaatatggggattggcaagaacggagacctaccctggcctccgctcaggaacgagttC幼gtacttcc3a3gaatgaccaca3cctcttcagtggaaggtaaacag3atctggtgatt3tgggtaggaaaacctggttctccattectgagaagaategacctttaaaggacagaattaatatagttctcagtagagaacteaaagaaccaccacgag卿cteattttcttgcc3aa3gtttagatgatgccttiaagacttattgaacaaccggaattggc卿ta3agtacaaggatcatgc鄉3atttg幼3gtg3cacg微ccc3gaaattgatttgggg3aatataa3cttGtcccagaatacccaggcgtcctctetgaggtccaggaggaaaaaggcatcaagtataagtttgaagtetacgagaagaaagactaagcggccgagcgcgcggatctggaaacgggagatgggggaggctaactgaagcacggaaggagacaataccggaaggaacccgcgctatgacggc33taaaaagacag3ataaaacgc3cgggtgttgggtcgtttgttcat幼acg卿ccccaccccaccccccaagttcgggtgaaggcccagggctcgcagccaacgtcggggcggcaggccctgccatagccactggccccgtgggttagggacggggtcccccatggggaatggtttatggttcgtgggggttatta加gggcgttgC33cg3cccccgcccattgacgto的ta3tg3cgtatgttccc3tagt33cgcc33t3ggg3ctttcc3ttgacgtc3atgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtC助tg3卿t曰aatggcccgcctggc3tt3tgcccagtac3tg3ccttatggg3ctttcct3cttggcagt3c3tct3cgtattagtcatcgctattacc3tggtgat柳g加ggc3gtacatcaatgggcgtggatagcggtttgactoacggggeitttecaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaateaacgggactttccaaaatgtcgtaacaactocgccccattgacgcaaaagggcgggaattcgagctcggtactcgagcggtgttccgcggtcctcctcgtatagagttgtccactagggggtccactcgctccagggtgtgaagacacatgtcgccctcttcggcatcaaggaaggtgattggtttataggtgtaggccacgtgaccgggtgttcctgaaggggggctataaaagggggtgggggcgcgttcgtcctcactctcttccgcatogctgtetgcg鄉gcc3gctgttgggctcg(;ggttg3ggac83actcttcgcggtctttc卿tectottggatoggaaacccgtoggcctccgaacggtactccgccaccgagggacctgagcgagtccgcatcgaccggatcgc3.wc加S甜如9caS通c逸gaa说加GaSs,9cS辦pycHgg3-^招Es句gCocco>cyco8a.w、acsto-ra-ta^agcQ>g.J;sag>Miac9龙Saa.te貼cgc.y3anoQ>1aate卿tctctccacaggtgtcc3ctcccaggtcc33ccggaattgt30ccgcggccagagcttgcgggcgccaccgcggccgcggggatccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgcttta坩gtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggaggtgtgggaggttttttcggatoctcttggcgtaatcatggtcatagctgtttcctgtgtgaaattgttatccgctcacaattccacacaacatacgagccggaagcataaagtgtaaagcctggggtgcctaatgagtgagctaactcacattaattgcgttgcgctcactgcccgctttccagtcgggaaacctgtcgtgccagctgcattaatgaacgttcggctgcggcgagcggtateagctcactcaa鄉cggtaat3cggttatccac3gaatcaggggataacgcaggaaagaacatgtgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgctggcgttcttccataggctccgcccccctgacgagcatcacaaaaatcgacgc;tcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttcgggaagcgtggcgctttctcatagctcacg卿aggtatctcagttcggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcGcgaccgctgcgccttatccggtaactatogtcttgagtccaacccggtaagacacgacttatcgccactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagccagttaccttGggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaa卿gatotcaag卿atcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaaggga加ggtcatgagattatcaaaaaggiatettcacctagatGGcttttaattaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttaccaatgcttaatcagtgaggcacctatctcagcgatetgtctatttcgttcatccatagttgcctgactGcccgtcgtgtagataactacgatacgggagggcttaccatctggccccagtgctgcaatgataccgcgagacccacgctcaccggctcc:agatttatcagcaataaaccagccagccggaagggcGgagcgcagaagtggtectgcaactttatccgcctccatccagtctattaattgttgccgggaagctagagtaagtagttcgccagttaat,agtttgcgcaacgttgttgccattgctacag'gcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagctccggttoccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcacteatggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgc怖ctgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctcttgcccggcgtcaatacgggataataccgcgccacatagc:agaactttaaaagtgctoatcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatecagttcgatgtaacccactcgtgcacccaactgatcttcagcatc怖3ctttcaccgigcgtttctgggtg8gcaaei肪c柳3卿C333atgccgcaaa333ggga3ta3gggcgacacggaaatgttgaatactcatactcttcctttttcaatattattgaagcaWatcagggttattgtetoatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccgcgcacatttccccgaaaagtgccacctgacgtctaagaaaccattattatcatgacattaacctataaaaataggcgtatoacgaggccctttcgtctcgcgcgtttcggtgatgacgcccgtcagggcgcgtcagcgggtgttggcgggtgteggggctggcttaactatgcggcatcagagcagattgtactgagagtgcaccatatgcggtgtgaaataccgcacagatgcgtaaggagaaaataccgcatcaggcgccattcgccattc柳ctgcgcaactgttgggaagggcgatcggtgcg卯cctcttcgctattacgcG3gctggcgaaagggggatgtgctgcaaggcgattaagtt卿taacgccagggttttoccagttacgacgttgtaaaacgacggccagtgaatt材料和方法如下进行所述的构建体转染至293-6E细胞中。所用的细胞是指数生长期的HEK293-6E细胞(0.8至1.5x106细胞/ml),该细胞已经在培养物中传代少于30次;将培养物在新鲜生长培养基中培养至3乂105细胞/ml浓度,每三天或四天。生长培养基是补充25ug/mlGeneticin(G418)(GIBCOTMCatNo.l0131-027)和0.1%PluronicF-68(表面活性剂,.No.24040-032)的FreeStyleTM293表达培养基(GIBCOTMCat.No.12338-018,Invitrogen,Carlsbad,CA)。转染培养基是具有lOmMHEPES緩沖溶液ml(GIBCOTMCat.No.15630-080)终浓度的FreeStyle293表达培养基(GIBCOTMCat.No.12338-018)。为了转染,加入选择的载体DNA来获得l^ig(重链+轻链)/ml的浓度。接受基于最佳化实验的改变。PEI(聚氮丙啶),线性,25kDa,1mg/ml无菌储液,pH7.0(Polysciences,Inc.,Warrington,PA)作为转染介质加入,DNA:PEI比例为1:2。所用的Feeding培养基是胰蛋白胨Nl培养基(来自OrganotchnieFrance的TNI粉,CatNo.19554,通过TekmScienceInc.Tel#1-800-267-9799可获得)。加入FreeStyleTM293表达培养基的5。/ow/v储液至0.5。/。的终浓度。通常使用标准实验室设备。使用Cedex细胞计数系统(I腸vatis,Bielefeld,德国)。如下在125ml锥形烧瓶中进行每个小规模的转染。将等份20ml的新鲜培养基培养lxl()S细胞/ml的活细胞。(标注对于更大的体积,培养物应当是容器额定容量的20-25%,例如,500ml烧瓶中100ml培养物)。然后将培养物置于37。C培养箱中,使用5%C02的潮湿大气和130rpm的转速。通过在水浴中温热转染培养基至37°C,在室温融化冷冻的PEI储液和DNA溶液(储存在-20。C)来制备DNA-PEI复合物制剂。所用的DNA和PEI的量是基于待转染培养物的总体积。20ml培养物使用2.5mlDNA/PEI复合物,2.5mlTnl需要总的25pgDNA和50pgPEI。通过混合12.5ml转染培养基至管A中来形成DNA:PEI复合物(例如,用于十个转染),管A中已经加入了含有lOpg/ml终浓度的选择的DNA载体的溶液,并且已经将12.5ml转染培养基加入PEI中(20|ig/ml,终浓度)。在与DNA溶液混合之前,通过涡旋将PEI混合物混合约10秒钟。混合PEI和DNA混合物后,通过涡旋10秒钟来混合混合物。然后使混合物在室温静置15分钟(但不超过20分钟)。每20mlHEK-6E细胞加入2.5mlDNA:PEI复合物溶液。转染后约20至24小时,将5。/。TNl上清液加入每个烧瓶中至0.5%的终浓度。在第4天和第7天测定细胞密度和生活力。第4天时从2ml等份试样收集细胞沉淀,用于蛋白质印迹分析和Northern印迹分析。将沉淀在-80。C冷冻直至分析。转染后7天通过在1000rpm离心(10分钟)收集细胞,并使用前置过滤器滤纸和Corning0.22pmCA过滤系统将上清液过滤。也将上清液样品存储在8(TC直至分析,例如使用ELISA测试。为了进行Northern印迹分析,如下所述从瞬时转染的293-6E细胞中分离出全部RNA。将冷冻的细胞沉淀在冰水融化。使用QiagenRneasyMiniKit(Qiagen,cat.#74104),按照生产商的说明书,来纯化RNA。曱醛/琼脂糖凝胶制备如下。将2克琼脂糖(Ambion,cat.的040)在16i.3mi蒸镏水中煮沸。加入4ml1MMOPS(吗啉代丙烷磺酸)PH7.0,lmllMNaOAc,0.4ml0.5MEDTA,并将混合物冷却至60°C。然后加入33.3ml37%甲醛(J.T.Baker,cat#2106-01),并温和地混合熔化的琼脂糖溶液。倾倒凝胶且使其在通风橱中固化。通过混合30ml1MMOPS,pH7.0,7ml1MNaOAc,3ml0.5MEDTA和DEPC(焦磷酸二乙酯)处理的dH20至1.5来制备跑胶緩沖液。通过混合3部分甲醛装载染料(Ambion,cat.#8552)和1部分RNA来制备RNA样品。每个泳道跑3至5|tigRNA。使用的RNA分子量标记是0.5-10Kb梯度(Invitrogen,cat.#15623-200)。将样品在65。C加热5分钟来变性并在水上冷却。然后将0.5inl10|ag/|iil溴化乙4定(Pierce,cat.#17898)加入每个样品中。将每个样品简短离心来沉淀液体。如下进行凝胶电泳。用跑胶緩冲液覆盖甲醛/琼脂糖凝胶,装载样品,然后在通风橱中150V跑胶2小时。使用紫外线投射法观察条带并拍照用于永久记录。通过将凝胶在DEPC-处理的dH20几次改变中浸泡五分钟来除去甲醛来进行毛细管转移。然后将凝胶在50mMNaOH,10mMNaCl中室温浸泡20分钟来进一步变性任何双链RNA。将凝胶将DEPC-处理的dH20中漂洗一次,然后在20xSSC(175.3gNaCl;88.2g柠檬酸钠;用10MNaOH使pH至7.0,体积调节至1L)中室温浸泡20分钟来中和。浸泡Hybond-N+膜(AmershamBioscience,cat#RPN303B)并切割成和凝胶一样的大小,在DEPC-处理的dH20中至湿润。将3M滤纸(Whatmancat#3030917)切割成与凝胶和膜一样的大小。通过将一层3M纸置于20xSSC存储器上方的固体支持物上来装配转移系统,使得纸通过顶部装配的层通过毛细作用带走20xSSC。将凝胶置于该芯上,将Hybond-N+膜,3层3M纸切割大小,和一厚叠凝胶印迹纸(Schleicher&Schuell,cat.#10427920)。将平的支持物置于厚叠的顶部,如果需要,并加上重量(通常是1升瓶装水),来确保有效的毛细管转移。使用塑料包来覆盖任何暴露于空气的存储器来防止蒸发。使转移在室温过夜进行。然后解开转移系统并将印迹浸泡在6xSSC中来除去任何琼脂糖。使膜空气干燥并暴露于UV来交联印迹。DNA探针模板是D2E7重链和轻链的编码片段。使用AlkPhosDirectLabelingReagents试剂盒(石成性石舞酸酶标记系统,Amersham,';nT^、T。zn八人丄PT丄d4^,1、4"-^T/Z_、"rt口nCT<上L,LT"4lIEA各k丄二、-r1Ar\Biosciences,cat.仔K^丄NU08L/付p^店市j逸问日'、JT"凡"力川雄:via"平i^:血刊、iGiuung所需的模板。使用和标记相同的试剂盒(含有杂交緩沖液)来进行预杂交和杂交步骤。将膜在杂交炉中在65。C预杂交至少l小时,然后将探针煮沸并直接加入预杂交緩沖液/印迹中。杂交在杂交炉中65。C进行过夜。滗去杂交溶液,并用2xSSC简短洗涤膜来除去杂交溶液,然后用2xSSC,0.l。/。SDS在65。C洗涤两次,每次15分钟,最后用O.lxSSC,0.1%SDS在65。C洗涤两次,每次15分钟。为了观察膜上的条带,使用化学发光。用CDP-Star检测试剂(碱性磷酸酶-从1,2-dioxetane底物的photope单独生产,AmershamBiociences,cat.#RPN3682)覆盖印迹,在室温持续5分钟。从印迹排出过多的试剂,然后将它们装入塑料层保护装置中。将印迹暴露于KodakBiomaxMR膜(x射线膜,Kodak,cat.弁8952855),开始10秒钟至高达10分钟。使用KodakM35AX-OMAT处理器(x射线展开仪/处理器)将膜展开。如小制备用于蛋白质印迹的细胞沉淀样品。为了胞内抗体表达分析,将细胞在NP40裂解緩沖液(50mMTris-HCl,pH7.5,150mMNaCl,1%NP40(辛基苯酚聚(ethyleneglycolether)),5mMBME和蛋白酶抑制剂混合物III中裂解,在冰上孵育10分钟。使用离心机在16,000rpm离心30分钟来收集用于膜的部分和可溶性蛋白质。将称为可溶性胞内或细胞质部分的上清液用于凝胶分析,添加含有DTT的SDS装载緩冲液。用等体积的裂解緩冲液悬浮沉淀,并加入含有DTT的SDS凝胶装载緩沖液。如下制备用于蛋白质印迹的培养物上清液样品。使用30,000道尔顿MW截留的Cent腳nUltra(超滤装置,Millipore)将培养物上清液浓缩,或直接用于蛋白质印迹。为了免疫印迹(蛋白质印迹分析),将样品溶解于NUPAGE4-12%Bis-Tns(聚丙烯酰胺)凝胶上并使用标准方法转移至PVDF膜上。将膜在阻断溶液(含有0.05%吐温20(聚氧乙烯脱水山梨醇单月桂酸酯)和5o/。奶粉的PBS)中孵育lh,洗涤,用来自DakoCytomation(丹麦)的以1:1000稀释于PBST緩沖液中的多克隆兔子抗人IgG/HRP或多克隆兔子抗人k轻链/HRP孵育,然后在室温的PBST的三次更换中再次洗涤。将来自GE/AmershamBiosciences(Piscataway,NJ)的ECLPlus蛋白质印迹检测(化学发光和化学荧光检测)系统用于检测。使用标准方法进行ELISA测试,使用来自SouthernBiotech(Birmingham,AL)的山羊抗人IgG,UNLB和山羊抗人IgG/HRP,PBS中的2%奶粉作为阻断緩沖液,K-Blue(3,3,,5,5,-四甲基联苯胺和过氧化氬(H202,Neogen,Lansing,MI)作为底物。使用Spectramax微平板阅读器在650nM的主波长和490nm的参照波长阅读平板。使用标准方法亲和性纯化分泌的抗体,使用来自Invitrogen(Carlsbad,CA)的蛋白A琼脂糖珠,来自Pierce的免疫纯(A)IgG结合緩沖液,PBS,pH7.4作为洗涤緩沖液,和0.1M醋酸/150mMNaCl,pH3.5作为洗脱緩冲液(使用1MTrispH9.5中和的)。完整分子量的测定。通过LC-MS分析从构建体pTT3HC-int-LCP.hori产生的D2E7样品的完整分子量。具有蛋白microtrap(MichromBioresources,Inc.cat004/25109/03)的1100毛细管HPLC系统(AglientSNDE14卯0659)用来脱盐并将样品引入QStarPulsari质谱仪中(AppliedBiosystems,SNK1820202)。为了洗脱样品,用緩沖液A(HPLC水中的0.08%FA,0.02%TFA)和緩沖液B(乙腈中0.08%FA和0.02%TFA)运行梯度,以50|aL/min的流速,持续15分钟。轻链和重链分子量的测定。通过LC-MS分析从构建体pTT3HC-int-LCP.hori产生的天然D2E7样品的完整分子量。在20mMDTT中在3(TC进行连接轻链和重链的二硫键的还原30分钟。具有PLRP-S柱(MichromBioresources,Inc.8jam,4000A,1.0><150mm,P/N901-00911-00)的1100毛细管HPLC系统(AglientSNDE14900659)用来分离轻链和重链并将它们引入QStarPulsari质谱仪中(AppliedBiosystems,SNK1820202)。在60。C加热柱子。用緩冲液A(HPLC水中的0.08%FA,0.02%TFA)和緩沖液B(乙腈中0.08%FA和0.02%TFA)运行HPLC梯度,以50pL/min的流速,运行60分钟来洗脱样品。限制性核酸内切酶来自NewEnglandBiolabs(Beverly,MA)。用于克隆的Custom寡核苷酸,DNA聚合酶,DNA连接酶和大肠杆菌菌抹来自Invitrogen(Carlsbad,CA)。蛋白酶抑制剂混合物III来自Calbiochem(LaJolla,CA)。Qiagen(Valencia,CA)产物用于DNA连接和纯化。关于引入作为参考文献和变化的陈述在整个申请中提及的所有参考文献,例如,专利文件,包括颁布或授权的专利或等价物;专利申请公开;未公开的专利申请;和非专利文献文件或其他来源的材料;在此以其整体引入作为参考,如同单独引入作为参考一样。在所引用的参考文献和本申请公开内容之间任何矛盾的情况中,在此的公开内容优先。在此提供的一些参考文献引入作为参考来提供信息,例如,关于本发明的原料来源,其他原料,其他试剂,其他合成方法,其他分析方法,其它生物材料,其它细胞和其他用途的详细内容。在此提及的所有专利和出版物表示本发明所属领域技术人员的技术水平。在此所引用的参考文献表示公开或申请日时的现有技术,并且确定在此可以使用该信息,如果需要,排除具有资格的现有技术中的特定实施方案。例如,当在此要求物质的组成时,应当理解在此要求的物质组成中不打算包括已知的并按照关于申请人发明的有资格的现有技术可以获得的化合物,包括为此在此引用的参考文献中提供了授权公开内容的化合物。在此的任何附录或附加内容引入作为参考,作为说明书和/或附图的一部分。在此所用的术语"包括","包含","含有"或"是包括",将它们解释为详细说明所述特征,整体,步骤或组成部分的存在,但不排除一个或多个其他特征,整体,步骤或组成部分或其组的存在或添加。因此,如在此所用的,包含与包括、含有、具有或特征在于是同义词,并且是包括式的或开放式的。如在此所用的,"由……组成"排除权利要求描述中没有具体说明的任何要素,步骤和成分等。如在此所用的1"基本上由......组成"没有排除没有显著影响权利要求基本和新的特征的物质或步骤(例如,关于活性成分)。在在此的每个情况中,术语"包括"、"基本上由......组成"和"由……组成,,中的任何一个可以由其他两个术语中的任一个替代,因此公开了不必定是共生的分开的存在下实践在此适当地说明性描述的本发明。无论何时在此公开的范围,例如,温度范围,时间范围,组成或浓度范围,或其他数值范围等,确定公开内容中包括给定的范围中包括的所有中间范围和子范围以及所有单个数值。本发明不受公开的实施方案的限制,包括附图中所示的或说明书中举例说明的任何内容,其通过实施例或说明给出并且没有限制。将理解在此描述中包括的范围或子范围中的任何子范围或单个数值可以从在此的权利要求中排除出去。已经参照各种特定的和/或优选的实施方案和技术描述了本发明。然而,应当理解可以形成许多变化和改变,同时保持在本发明的精神和范围内。本领域技术人员将清楚在此特意公开的那些以外的组合物,方法,装置,装置部件,材料,程序和技术可以用于本发明的实践中,如在此宽泛地公开的而没有采取不适当的实验;例如,这可以延伸至特意举例说明的那些以外的原料,生物材料,试剂,合成方法,纯化方法,分析方法,测试方法和生物方法。本发明包括在此之前所述的所有本领域已知的功能性等价物(例如,组合物,方法,装置,装置部件,材料,程序和技术等)。已经使用的术语和表述可以用作说明的术语并且没有限制,不存在使用这样的术语和表述排除所示和所述特征的任何等价物或其部分的意图,而是认识到各种改变在所要求的本发明的范围内是可能的。因此,应当理解尽管已经通过实施方案,优选实施方案和任选的特征特意公开了本发明,本领域技术人员可以采取在此公开的概念的改变和变化,并且认为这样的改变和变化是在所附权利要求限定的本发明范围之内的。其他参考文献US6258562,US6090382;US6455275;EP1080206B1;WO9960135;US5912167;US5162601;WO199521249A1;US5149783;US5955072;US5532142;US20040224391;US6537806;US5846767;US20030099932;WO9958663;US20030157641;US2003048306A2;US6114146;US6060273;US5925565;US20040241821;WO2003100021A2;WO2003100022A2;US20040265955;US20050003482;US20050042721;WO2005017149;WO2004113493;US20050136035;WO2004108893;US6692736;US20050147962;US6331415;US6632637;US20040063186;US7026526;US6365377;WO2005123915;US5665567;WO9741241A1;EP0701616B1;US20060010506;WO2006048459;US6852510;WO2005072129;US5648254;US6908751;US20050221429;WO2005071088;WO2005108585;WO2005085456;US7029876;US6638762;US6544780;US5519164;WO2003031630;US6294353;WO2005047512;US7052905;US7018833;US20020034814;US20040126883;US20050002907;US20050112095;US20050214258;EP0598029.MathysS等,1999,Gene231(1-2h1-13,Characterizationofaself-splicingmini-inteinanditsconversionintoautocatalyticN-andC-terminalcleavageelements:facileproductionofproteinbuildingblocksforproteinligation。(自我剪接迷你蛋白内含子的特征及其转化成自催化的N-和C-端裂解序列用于蛋白质连接的蛋白质砌块的易化产生)。权利要求1.用于产生一个或多个重组蛋白产物的包括sORF插入片段的表达载体;所述sORF插入片段包括编码第一个多肽的第一个核酸序列,编码第一个蛋白裂解位点的第一个插入核酸序列,和编码第二个多肽的第二个核酸序列;其中将编码所述第一个蛋白裂解位点的所述插入核酸序列可操纵地置于所述第一个核酸序列和所述第二个核酸序列之间;并且其中所述表达载体能够表达在所述第一个蛋白裂解位点可裂解的sORF多肽。2.权利要求l的表达载体,其中所述第一个蛋白裂解位点包括自我加工裂解位点。3.权利要求1或2的表达载体,其中所述自我加工裂解位点包括蛋白内含子片段或修饰的蛋白内含子片段,其中修饰的蛋白内含子片段允许所述第一个多肽和所述第二个多肽的裂解但不容许所述第一个多肽和所述第二个多肽的完全连接。4.权利要求1或2的表达载体,其中所述自我加工裂解位点包括hedgehog片段或修饰的hedgehog片段,其中修饰的hedgehog片段允许所述第一个多肽与所述第二个多肽的裂解。5.权利要求l-4任一项的表达载体,其中第一个多肽和第二个多肽能够多亚基装配。6.权利要求l-5任一项的表达载体,其中所述第一个多肽和第二个多肽中的至少一个能够胞外分泌。7.权利要求l-6任一项的表达载体,其中所述第一个多肽和第二个多肽中的至少一个是哺乳动物来源的。8.权利要求l-7任一项的表达载体,其中所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白重链或其功能片段。9.权利要求l-8任一项的表达载体,其中所述第一个多肽和第二个多肽中的至少一个包括免疫球蛋白轻链或其功能片段。10.权利要求l-9任一项的表达载体,其中所述第一个多肽包括免疫球蛋白重链或其功能片段,并且所述第二个多肽包括免疫球蛋白轻链或其功能片段;并且其中所述第一个和第二个多肽是任何次序的。11.权利要求1-10任一项的表达载体,其中所述第一个多肽和第二个多肽合起来能够以多亚基装配来结合,形成功能片段或其他抗原识别分子。12.权利要求1-11任一项的表达载体,其中所述第一个多肽是所述第二个多肽的上游。13.权利要求1-12任一项的表达载体,其中所述第二个多肽是所述第一个多肽的上游。14.权利要求1-13任一项的表达载体,进一步包括编码第三个多肽的第三个核酸序列,其中将所述第三个核酸序列可操纵地置于所述第二个核酸序列之后;并且其中所述第三个序列可以独立地与所述第一个或第二个核酸序列中的任一个相同或不同。15.权利要求14的表达载体,其中所述第一个、第二个和第三个多肽中的至少两个合起来能够以多亚基装配来结合。16.权利要求1-15任一项的表达载体,进一步包括编码第二个蛋白裂解位点的第二个插入核酸序列,其中将所述第二个插入核酸序列可操纵地置于所述第一个和所述第二个核酸序列之后;并且其中所述第二个插入序列可以与所述第一个插入核酸序列相同或不同。17.权利要求1-16任一项的表达载体,进一步包括编码第三个多肽的第三个核酸序列,和编码第二个蛋白裂解位点的第二个插入核酸序列;其中第二个插入核酸序列和第三个核酸序列以该次序可操纵地置于所述第二个核酸序列之后。18.权利要求1-17任一项的表达载体,其中所述第三个核酸序列编码免疫球蛋白重链、轻链或各自的功能片段。19.权利要求14-18任一项的表达载体,其中所述第三个核酸序列编码免疫球蛋白轻链或其功能片段。20.权利要求14-18任一项的表达载体,其中所述第三个核酸序列编码免疫球蛋白重链或其功能片段。21.权利要求1-20任一项的表达载体,其中所述编码第一个蛋白裂解位点的第一个插入核酸序列包括编码信号肽裂解位点或修饰的信号肽裂解位点序列的信号肽核酸。22.权利要求1-21任一项的表达载体,进一步包括编码信号肽裂解位点的信号肽核酸序列,其可操纵地置于所述第一个核酸序列或所述第二个核酸序列之前。23.权利要求1-22任一项的表达载体,进一步包括两个信号肽核酸序列,每个信号肽核酸序列独立地编码信号肽裂解位点,其中将一个信号肽核酸序列可操纵地置于编码所述第一个多肽的所述第一个核酸之前,并将另一个信号肽核酸序列可操纵地置于编码所述第二个多肽的所述第二个核酸之前。24.权利要求21-23任一项的表达载体,其中所述信号肽核酸序列编码免疫球蛋白轻链信号肽裂解位,泉或修饰的免疫球蛋白轻链信号肽裂解位点。25.权利要求24的表达载体,其中信号肽核酸序列编码修饰的或未修饰的免疫球蛋白轻链信号肽裂解位点,并且其中所述修饰的位点能够实现裂解并提高所述第一个多肽、所述第二个多肽和所述第一个与第二个多肽装配的分子中的至少一个的分泌;并且其中在所述信号肽位点存在下的分泌水平比所述信号肽位点不存在下的分泌水平高约10%至高约100倍。26.权利要求l-3任一项的表达载体,其中所述编码第一个蛋白裂解位点的插入核酸序列包括选自以下的蛋白内含子或修饰的蛋白内含子序列极端嗜热古菌PhoPolI序列、酿酒酵母VMA序列、集胞藻抹PCC6803DnaE序列、蟾蜍分枝杆菌GyrA序列、古菌种GB-DDNA聚合酶、A-型细菌蛋白内含子样(BIL)结构域和B-型BIL。27.权利要求l-2和4任一项的表达载体,其中所述编码第一个蛋白裂解位点的插入核酸序列包括hedgehog家族成员的C-端自体加工结构域,其中hedgehog家族成员来自果蝇、小鼠、人或其他昆虫或动物物种。28.权利要求l-2和4任一项的表达载体,其中所述编码第一个蛋白裂解位点的插入核酸序列包括来自祝猪、土拨鼠的C-端自体加工结构域,或来自线虫的其他含hog基因,或来自领鞭毛虫的Hoglet结构域。29.权利要求1-28任一项的表达载体,其中所述第一个和所述第二个多肽包括功能抗体或其他抗原识别分子;抗原特异性指引结合选自以下的抗原肺瘤坏死因子-a、促红细胞生成素受体、RSV、E/L选择素、白细胞介素-1、白细胞介素-12、白细胞介素-13、白细胞介素-18、白细胞介素-23、CXCL-13、GLP-1R和淀粉状蛋白p。30.权利要求l-28任一项的载体,其中第一个和第二个多肽包括来自D2E7、ABT-007、ABT-325、EL246或ABT-874抗体的一对免疫球蛋白链。31.权利要求l-28任一项的载体,其中第一个核第二个多肽各自独立地选自来自D2E7、ABT-007、ABT-325、EL246、ABT-874或其他抗体的类似片段的免疫球蛋白重链或免疫球蛋白轻链片段。32.权利要求1-31任一项的表达载体,其中所述载体进一步包括用于所述sORF插入片段的启动子调控元件。33.根据权利要求32的表达载体,其中所述启动子调控元件是诱导型或组成型的。34.根据权利要求32的表达载体,其中所述启动子调控元件是组织特异性的。35.根据权利要求32的表达载体,其中所述启动子包括腺病毒主要晚期启动子。36.根据权利要求1-35任一项的表达载体,其中所述载体进一步包括编码能够裂解所述第一个蛋白裂解位点的蛋白酶的核酸。37.根据权利要求36的表达载体,其中将所述编码蛋白酶的核酸可操纵地置于所述sORF插入片段内;所述表达载体进一步包括编码第二个裂解位点的其他核酸,该第二个裂解位点位于所述编码蛋白酶的核酸与所述第一个核酸和所述第二个核酸中的至少一个之间。38.包括根据权利要求l-37任一项的载体的宿主细胞。39.根据权利要求38的宿主细胞,其中所述宿主细胞是原核细胞。40.根据权利要求39的宿主细胞,其中所述宿主细胞是大肠杆菌。41.根据权利要求38的宿主细胞,其中所述宿主细胞是真核细胞。42.根据权利要求41的宿主细胞,其中所述真核细胞选自原生动物细胞、动物细胞、植物细胞和真菌细胞。43.根据权利要求42的宿主细胞,其中所述真核细胞是选自哺乳动物细胞、鸟类细胞和昆虫细胞的动物细胞。44.根据权利要求43的宿主细胞,其中所述宿主细胞是CHO细胞或二氩叶酸还原酶缺陷型CHO细胞。45.根据权利要求43的宿主细胞,其中所述宿主细胞是COS细胞。46.根据权利要求42的宿主细胞,其中所述宿主细胞是酵母细胞。47.根据权利要求46的宿主细胞,其中所述酵母细胞是酿酒酵母。48.根据权利要求43的宿主细胞,其中所述宿主细胞是昆虫草地贪夜蛾Sf9细胞。49.根据权利要求43的宿主细胞,其中所述宿主细胞是人胚胎肾脏纟田月包。50.生产重组多蛋白或多个蛋白的方法,所述方法包括在足以允许载体蛋白表达的条件下在培养基中培养根据权利要求38的宿主细胞。51.权利要求50的方法,所述方法进一步包括收集和/或纯化所述载体蛋白。52.权利要求50-51任一项的方法,其中所述多个蛋白能够多亚基装配。53.权利要求50-52任一项的方法,其中重组多蛋白或多个蛋白是生物上功能性的和/或治疗性的。54.生产免疫球蛋白或其功能片段、装配的抗体或其他抗原识别分子的方法,所述方法包括在足以产生免疫球蛋白或其功能片段、装配的抗体或其他抗原识别分子的条件下在培养基中培养根据权利要求38的宿主细胞。55.根据权利要求50-54任一项的方法产生的蛋白。56.根据权利要求50-55任一项的方法产生的多蛋白。57.根据权利要求50-56任一项的方法产生的装配的免疫球蛋白;装配的其他抗原识别分子;或单独的免疫球蛋白链或其功能片段。58.根据权利要求57的免疫球蛋白;其他抗原识别分子;或单独的免疫球蛋白链或其功能片段,其中存在实现或引起与肿瘤坏死因子-a、促红细胞生成素受体、白细胞介素-18、EL/选择素或白细胞介素-12的特异性抗原结合的能力。59.根据权利要求58的免疫球蛋白或其功能片段,其中免疫球蛋白是D2E7或其中功能片段是D2E7的片段。60.包括根据权利要求55-59任一项的蛋白和药物学上可接受载体的药物组合物。61.权利要求1或2的表达载体,其中所述第一个蛋白裂解位点包括细胞蛋白酶裂解位点或病毒蛋白酶裂解位点。62.根据权利要求1或2的表达载体,其中所述第一个蛋白裂解位点包括由以下物质识别的位点弗林蛋白酶;IPNV的VP4;烟草蚀刻病毒(TEV)蛋白酶;鼻病毒的3C蛋白酶;PC5/6蛋白酶;PACE蛋白酶,LPC/PC7蛋白酶;肠激酶;因子Xa蛋白酶;凝血酶;genenaseI;MMP蛋白酶;芜菁花叶病毒的核内含体蛋白a(Nla);4型登革热黄病毒的NS2B/NS3,黄热病毒的NS3蛋白酶;花椰菜花叶病毒的ORFV;KEX2蛋白酶;CB2;或2A。63.权利要求1或2的表达载体,其中所述第一个蛋白裂解位点是病毒内部可裂解信号肽裂解位点。64.权利要求63的表达载体,其中所述病毒内部可裂解信号肽裂解位点包括来自C型流感病毒、丙肝病毒、汉坦病毒、黄病毒或风渗病毒。65.表达双杂交系统的蛋白质的方法,其中所述双杂交系统包括诱何蛋白和候选猎物蛋白,所述方法包括以下步骤提供其中已经引入了编码多蛋白的表达载体的宿主细胞,该多蛋白包括诱何蛋白部分和候选猎物蛋白部分,所述部分通过自我加工裂解序列、信号肽序列或蛋白酶裂解位点隔开;并且在允许多蛋白表达和多蛋白的自我加工或蛋白酶裂解的条件下培养宿主细胞。66.权利要求65的方法,其中多蛋白进一步包括三杂交系统的可裂解成分。67.根据权利要求1-37和61-64任一项的表达载体,其中所述载体不含有2A序列。68.根据权利要求1或2的表达载体,其中所述第一个蛋白裂解位点包括FMDV2A序列;或来自其他小核糖核酸病毒科、昆虫病毒、C型轮状病毒、锥体虫或海栖热袍菌(thermatogamaritima)的2A样结构域。69.用于表达重组蛋白的表达载体,其包括多蛋白的编码序列,其中多蛋白包括至少第一个和第二个蛋白片段,其中所述蛋白片段通过其中的蛋白裂解位点隔开,其中蛋白裂解位点包括自我加工肽裂解序列、信号肽裂解序列或蛋白酶裂解序列;并且其中所述编码序列在宿主细胞内是可表达的并且在宿主细胞内是可裂解的。70.权利要求1-37、61-64、67和68任一项的表达载体,其中所述插入核酸序列另外编码标记物。全文摘要公开的是有用的构建体和方法,用于蛋白质的表达,使用重组宿主细胞内加工的初级翻译产物。描述了包括单个开放阅读框(sORF)的构建体,用于蛋白质的表达,包括多个多肽的表达。初级翻译产物(前体蛋白或多蛋白)含有多肽,如蛋白内含子或hedgehog家族自体加工结构域,或其变体,框内插入多个目标蛋白亚基之间。初级产物还可以含有裂解序列,如其他蛋白酶解裂解或蛋白酶识别位点,或含有信号肽酶识别序列的信号肽,隔开多个蛋白亚基中的至少两个。可以操纵插入的自体加工多肽或裂解位点的序列来提高分开的多个蛋白亚基的表达效率。还公开了进行蛋白质如免疫球蛋白的有效表达,分泌和/或多亚基装配的独立方面。在多蛋白含有免疫球蛋白重链和轻链片段或能够抗原识别的片段的情况中,在一个实施方案中,可选择的化学计量比为每个重链片段至少两个轻链片段的拷贝,结果是形成了正确折叠和装配的功能抗体的产生。描述了修饰的信号肽,包括来自免疫球蛋白轻链的那些。文档编号C12N15/63GK101595228SQ200680034979公开日2009年12月2日申请日期2006年7月21日优先权日2005年7月21日发明者D·A·雷吉尔,G·R·卡森,J·G·萨尔费尔德,J·古,W·吉安,Y·库尼斯申请人:艾博特公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1