生物合成的脯氨酸/丙氨酸无规卷曲多肽及其用途的制作方法

文档序号:3586653阅读:391来源:国知局
专利名称:生物合成的脯氨酸/丙氨酸无规卷曲多肽及其用途的制作方法
生物合成的脯氨酸/丙氨酸无规卷曲多肽及其用途本发明涉及生物合成的无规卷曲多肽(random coil polypeptide)或生物合成的无规卷曲多肽区段或缀合物,所述生物合成的无规卷曲多肽或生物合成的无规卷曲多肽区段或缀合物包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少约50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。所述至少约50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基可以是异源多肽或异源多肽构建体的组成部分。还描述了这些生物合成的无规卷曲多肽、所述多肽区段或所述缀合物的用途和使用方法。所述用途可特别包括医药用途、诊断用途或食品工业用途以及在其它工业应用中的用途,例如造纸工业、采油等。本发明还涉及本文提供的生物合成的无规卷曲多肽或生物合成的无规卷曲多肽区段或缀合物的具体用途,所述生物合成的无规卷曲多肽或生物合成的无规卷曲多肽区段或缀合物包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列。本文提供的生物合成的无规卷曲多肽或生物合成的无规卷曲多肽区段的氨基酸序列由至少约50、至少 约100、至少约150、至少约200、至少约250、至少约300、至少约350或至少约400个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。所述至少约50、至少约100、至少约150、至少约200、至少约250、至少约300、至少约350或至少约400个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基优选为(a)异源多肽或异源多肽构建体的组成部分或优选为(b)缀合物的组成部分,所述缀合物例如药物缀合物、具有食品或美容用品成分或添加剂的缀合物、具有生物活性化合物的缀合物或具有光谱学活性化合物的缀合物。具体而言,本文提供异源蛋白,其中这些蛋白包含至少两个结构域,其中所述至少两个结构域中的第一结构域包含具有和/或介导诸如生物活性的活性的氨基酸序列,所述至少两个结构域中的第二结构域包含本发明的生物合成的无规卷曲脯氨酸/丙氨酸多肽或脯氨酸/丙氨酸多肽区段。本发明特别涉及药物缀合物,其包含(i)生物合成的无规卷曲多肽或多肽区段,所述多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成,和(ii)药物,所述药物选自(a)包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的生物活性蛋白或多肽,和(b)小分子药物。本发明的另一主题是药物缀合物,其包含本文提供的生物合成的无规卷曲脯氨酸/丙氨酸多肽或脯氨酸/丙氨酸多肽区段,以及药学或医学有用的分子,例如小分子、肽或生物大分子(例如蛋白、核酸、碳水化合物、脂质囊泡)等,所述药学或医学有用的分子与所述生物合成的无规卷曲脯氨酸/丙氨酸多肽或脯氨酸/丙氨酸多肽区段连接和/或偶联。此外,公开了编码生物合成的无规卷曲多肽或多肽区段和/或生物活性异源蛋白的核酸分子以及包含所述核酸分子的载体和细胞。此外,公开了产生本文所述的本发明生物合成的无规卷曲多肽或多肽区段和相应药物或食品缀合物(即,包含本文所述的生物合成的无规卷曲多肽或多肽区段和食品成分或食品添加剂的缀合物)的方法。还公开了相应的缀合物(作为一种组成部分包含本文公开的生物合成的无规卷曲多肽或多肽区段),其特别包含美容用品成分或添加剂或生物学或光谱学活性化合物。此外,本发明提供包含本发明的化合物的组合物(即,本文公开的无规卷曲多肽或无规卷曲多肽区段和编码其的核酸分子,所述无规卷曲多肽或无规卷曲多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列),以及本发明的所述无规卷曲多肽或多肽区段、包含所述无规卷曲多肽或无规卷曲多肽区段的生物活性蛋白、药物缀合物、食品缀合物或核酸分子、载体和细胞的具体用途。还提供了产生和/或获得本发明生物合成的无规卷曲多肽或多肽区段的方法,以及产生和/或获得本发明生物活性异源蛋白和/或多肽构建体或药物缀合物的方法。此外,本文提供了生物合成的无规卷曲多肽或多肽区段(或包含所述无规卷曲多肽或多肽区段的分子和缀合物)的医学用途、药学用途以及诊断用途,所述无规卷曲多肽或多肽区段包含本文所述的仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列。所述医学用途或药学用途可以包括所述生物合成的无规卷曲多肽或多肽区段作为血浆扩容剂等的用途。然而,本文提供的方式和方法不限于药学、医学和生物学用途,并且还可以用于其它工业领域,例如造纸工业、采油等。由肾过滤导致的从血液循环快速清除是小分子(包括小蛋白和肽)的通常性质。然而,通过使表观分子维度增大至超过肾小球的孔径,可以将治疗蛋白的血浆半衰期延长到医学上有用的数天的范围。实现该效果的一个策略是将生物制剂与合成聚合物 聚乙二醇(PEG)进行化学偶联。这种策略已经获得了数种获批准的药物,例如PEG-干扰素 a 2a (Pegasys )、PEG-G-CSF (Neulasta )以及近期的 PEG 化的 a TNF-Fab 片段(Cimzia )J^管如此,"peg化〃技术具有几个缺点临床级PEG衍生物很昂贵,并且它们与重组蛋白的共价偶联需要额外的下游加工和纯化步骤,从而会降低产率并提高成本。此夕卜,PEG不是生物可降解的,这能带来副作用,例如连续治疗后的肾上皮空泡形成;参见,例如,Gaberc-Porekar(2008)Curr Opin Drug Discov Devel 11:242-50 ;Knop (2010)AngewChem Int Ed Engl 49:6288-308 或Armstrong in:Veronese (Ed.), “PEGylated Proteindrugs:Basic Science and Clinical Applications,,;BirkJlMuSer Verlag, Basel 2009。为了克服PEG技术的一些缺点,本领域中已提供了某些重组多肽模拟物,其中的一些是基于天然存在的氨基酸序列或合成的氨基酸段(stretch)。大部分天然氨基酸序列在生理溶液中的表现不像理想的随机链,因为它们倾向于采取折叠的构象(二级结构),或者如果它们不折叠,它们通常是不溶的并形成聚集体。事实上,研究多肽的随机链行为的大部分经典实验是在变性条件下进行的,即,在化学变性剂例如尿素或盐酸胍的存在下(参见,例如,Cantor(1980)Biophysical Chemistry,ff. H. Freeman and Company, New York)。因此,这些技术通常依赖于,即使与折叠的治疗蛋白结构域基因融合的情况下,也能在生理缓冲液条件和温度下抵抗折叠、聚集以及非特异性吸附并从而能提供稳定的随机链的特殊氨基酸序列。在这些情况下,这类重组PEG模拟物会使尺寸的增加大大超过仅基于它们的分子量所能通常预期的尺寸,最终阻碍肾过滤并有效地延长重要因子所连接的生物制剂的血浆半衰期。然而,这些技术中的很多具有其它注意事项和缺点。例如,已经测试了天然存在的重复性氨基酸序列在医学和药学方法中的可用性。这些方法中的一种涉及克氏锥虫(Trypanosoma cruzi)的反式唾液酸酶。其含有680个氨基酸残基的催化结构域,催化结构域之后是C末端重复性结构域,被称为"流急性期抗原(shed acute phase antigen)" (SAPA),其包含数量可变的12聚体氨基酸重复。含有13个亲水性和(在生理PH下)带负电的对应氨基酸重复(具有天然序列DSSAHSTPSTPA)的反式唾液酸酶的小鼠药代动力学(PK)研究显示出血浆半衰期比缺失了 C末端重复性序列的重组酶长5倍(Buscaglia (1999) Blood 93:2025-32)。在相同的反式唾液酸酶融合之后,即,它的76kDa催化结构域与在克氏锥虫蛋白抗原13中发现的13个带电的序列EPKSA氨基酸重复,也观察到相似的半衰期延长效应。在来自SAPA的重复和来自抗原13的重复与来自日本血吸虫(Schistosoma japonicum)的异源蛋白谷胱甘肽S转移酶(GST)的两个C末端基因融合之后,两种重复都能将该同二聚化酶的血浆半衰期延长7-8倍(参见Buscaglia,同上)。然而,尽管这些来自人病原体的天然存在的重复性氨基酸序列原则上似乎很适合于优化治疗蛋白的药代动力学,但是发现它们的免疫原性很高(参见AfTranchino (1989),MolBiochem Parasitol 34:221-8 或Buscaglia(1998), J Infect Dis 1998;177:431-6)。另一方法涉及使用明胶。明胶是水解并变性了的动物胶原蛋白,其含有长段的Gly-Xaa-Yaa重复,其中Xaa和Yaa分别主要由脯氨酸和4_羟基脯氨酸构成。明胶的琥珀酰化主要是通过天然散在的赖氨酸侧链的ε -氨基,这能增加该生物聚合物的亲水性并降低其等电点(PD。据推测,经修饰的侧链的带负电的羧化物基团之间的分子内静电排斥能使分子展开为多少伸展的构象。所实现的增大的体积使琥珀酰化的明胶能作为用于人体血衆扩容剂的大分子,特别是在市场上以VolpjexW: (Beacon Pharmaceutics Ltd) 或Gebfusine (B. Braun Melsungen AG)销售。此外,粒细胞集落刺激因子(G-CSF)与人工明胶样多肽的基因融合实现了半衰期延长效应(Huang(2010)Eur J Pharm Biopharm74:435-41)。为此,天然明胶的所有疏水性侧链被亲水性残基交换,这产生了包含不同顺序的氨基酸G、P、E、Q、N、S和K的116个氨基酸的明胶样蛋白(GLK)。G-CSF在其N末端与4拷贝的该GLK序列融合,并在巴斯德毕赤酵母(Pichia pastoris)中分泌。巴斯德毕赤酵母看起来可作为GLK融合蛋白的良好的制备生物体;然而,其它生物体中是否也能产生GLK还是未知的,因为已知的是重组明胶片段在大肠杆菌中仅低量表达,如01sen(2003),AdvDrug Deliv Rev 55:1547-67 所不。弹性蛋白是很多组织中细胞外基质的组分。其由可溶性前体弹性蛋白原形成,弹性蛋白原由亲水性的富含Lys/Ala的结构域和具有重复性序列的疏水性弹性体结构域组成。亲水性结构域中赖氨酸侧链的酶学交联实现不可溶性弹性蛋白的形成。弹性蛋白样多肽(ELP)是人工设计的、源于弹性蛋白原的疏水性结构域的重复性氨基酸序列。ELP的最常见的重复序列基序是V-P-G-X-G,其中“X”可以是除Pro之外的任何氨基酸(MacEwan(2010)Biopolymers 94:60-77;Kim(2010)Adv Drug Deliv Rev62:1468-78)。合适的 ELP 可以与治疗蛋白和融合,并在大肠杆菌中产生。因此,ELP在注射后形成凝胶样贮库的能力能显著延长所连接的生物制剂的体内半衰期,但是是通过的机制不同于其它无组织的多肽。然而,ELP连接能阻碍融合伴侣的生物活性,正如在IL-I诱导的淋巴细胞增殖生物学检测中对于白介素-I 受体拮抗剂所显示的(Shamji (2007)Arthritis Rheum. 11:3650-3661)。此外,ELP易于被诸如胶原蛋白酶的内源性蛋白酶降解。同样,聚集的蛋白通常对免疫原性更敏感。其它方法涉及使用聚阴离子聚合物。例如,聚谷氨酸(PG)已与用于癌症治疗的可溶性较差的细胞毒性小分子药物化学偶联。相应的产品是Opaxio ,其是目前处于临床III期研究中的紫杉醇药物缀合物。与未修饰的化合物相比,紫杉醇PG缀合物的半衰期延长3-14 倍(Singer (2005) JControl Release 109:120-6)。其它融合蛋白,例如在 N末端与一段175个连续Glu残基融合的G-CSF,或在C末端携带84个残基PG尾部的IFN- α 2,在大肠杆菌细胞质中以可溶性状态产生(参见W02002/077036)。对于有效翻译,N末端融合需要前导肽,其随后由烟草蚀纹病毒(TEV)蛋白酶切割来去除。G-CSF和INF-a 2的聚谷氨酸融合物在细胞培养测定中表现出生物活性。然而,至今这些PG融合物的药代动力学数据还没有报道。另外,由于人为静电吸引或排斥效应,PG融合物的大量负电荷是相对于生物分子相互作用(例如,靶受体或可溶性因子的结合)而言的普遍缺点。WO 2006/081249描述了具有约2-500个重复单元的多肽序列,所述重复单元为3-6个氨基酸,其中G、N或Q代表主要组成部分,而次要组成部分可以是A、S、T、D或E。该氨基酸组成允许糖基化序列子Asn-Xaa-Ser/Thr (其中Xaa是除Pro之外的任何氨基酸)的整合,用于真核表达体系中Asn侧链的N连接糖基化。所得融合蛋白增加的大分子尺寸,包括大的溶剂化碳水化合物结构的翻译后修饰在内,能延长基因缀合蛋白的药代动力学。这些寡糖连接物(“糖工程”)通常能减小对蛋白水解的易感性并增加流体动力学体积(Sinclair (2005) J Pharm Sci 94:1626-35)。缺点是糖基化生物大分子的内在分子异质性,这使得在生物技术生产和质量控制过程中需要付出更多劳动。
WO 2010/091122(以及 WO 2007/103515)和 SchelIenberger (2009)NatBiotechnol 27:1186-90公开了无组织的非重复性氨基酸聚合物,所述聚合物包括和包含残基P、E、S、T、A和G。这组氨基酸显示的组成不是不同于上文进一步描述的PSTAD重复,这组氨基酸经过序列的系统性筛选,从而产生具有大分子尺寸的溶剂化多肽,由于避免能引起聚集和可以导致HLA/MHC-II介导的免疫应答的疏水性侧链(特别是F、I、L、M、V和W),所述溶剂化多肽适合于生物药物研发。另外,排除了可能交联的Cys残基、可以与带负电的细胞膜相互作用的阳离子氨基酸K、R和H、以及可能易于水解的N和Q的酰胺侧链(参见Schellenberger (2009)同上)。针对大肠杆菌中的可溶性表达水平,筛选编码包含PESTAG残基组的非重复性序列(其与绿色荧光蛋白(GFP)融合)的合成基因文库,以及进一步研究所得到的亚组的基因稳定性、蛋白可溶性、热稳定性、聚集倾向和杂质属性。最终,进一步测试了含有216个Ser残基(25. O摩尔%)、72个Ala残基(8. 3摩尔%)和Pro、Thr, Glu和Gly中每种144个氨基酸(16. 7摩尔%)的864个氨基酸的序列与GLP-I受体激动剂艾塞那肽-4(E-XTEN)和几种其它生物制剂的融合。在大肠杆菌细胞质中产生可溶状态的融合蛋白,并将其分离,所述融合蛋白通常携带纤维素结合结构域,该纤维素结合结构域随后被切掉。通过圆二色(⑶)光谱对E-XTEN的研究显示二级结构的缺乏,同时在尺寸排阻色(SEC)过程中,融合蛋白表明驻留明显少于预期的84kDa蛋白,从而证实增加的流体动力学体积(Schellenberg (2009)同上)。分布在XTEN序列之间的携带高的净负电荷的氨基酸之间的静电排斥,可以有利于PESTAG多肽的无序结构和流体动力学半径的相关增加(参见WO2010/091122)。然而,另一项研究即 Geething (2010) PLoSOne 2010 ;5: el0175 表明,XTEN 降低其治疗融合伴侣的效力。在细胞培养测定中,胰高血糖素XTEN融合物仅表现出未修饰的肽的生物活性的15%。人生长激素(hGH)的XTEN融合显示出受体亲和力的更大丢失(EC5tl增加 17 倍);参见 WO 2010/144502。此外,甘氨酸作为最小且结构最简单的氨基酸,在理论层面上,其已被认为是在构象上柔性最好的氨基酸;参见,例如Schulz GE, Schirmer RH。Principles ofProtein Structure. Springer, New York 1979。此外,计算机模拟已经表明,Gly 聚合物缺少二级结构,并且在溶液中易于形成无规卷曲;参见Shental-Bechor(2005)Biophys J88:2391-402。从化学的观点来看,聚甘氨酸是线性无支链的聚酰胺,其与聚醚PEG在某些方面表现出一定相似性,例如它们本质上都是一维的大分子,沿着链具有很多转动自由度,由被氢键键合且高度溶剂化的极性基团规律性中断的重复短碳氢化合物单元组成。因此,聚甘氨酸应当构成最简单的基因可编码的PEG模拟物,其预期能延长治疗蛋白的血浆半衰期。分别以“同氨基酸聚合物(HAP) ”的形式 或富含甘氨酸的序列(GRS)采用该观点;参见,Schlapschy(2007)Protein Eng Des Sel 20:273-84 ;W0 2007/103515。然而,早就已知的是,Gly的化学合成的纯聚合物在水中表现出差的可溶性;特别可参见BamfordCH et al. Synthetic PoIypeptides-Preparation, Structure, and Properties. AcademicPress, New York 1956。因此,进行了不同的尝试来增加亲水性,其中通过引入氢键键合的丝氨酸醇侧链(W0 2007/103515以及Schlapschy (2007)同上)或者另外引入带负电的谷氨酸残基(W02007/103515)。已注意到,为了以柔性方式连接融合蛋白中的结构域,具有(Gly4Ser)n组成的肽间隔物在本领域中已有描述。在分析SEC中,对于这些融合蛋白检测到显著增加的流体动力学体积。对于200个残基的HAP形式,与未融合的Fab片段相比,表观尺寸增加为120%,而真实质量仅增大29%,因此表现出流体动力学体积增加的效果,这是由于聚甘氨酸标签的溶剂化无规卷曲结构所致。此外,CD差光谱对于HAP部分的无序二级结构是特征性的。最后,携带200个残基HAP的Fab片段在小鼠中的最终血浆半衰期延长约3倍。尽管这仅是中等程度的延长,但该效果可以适合于某些(专门)诊断应用,例如体内成像;参见Schlapschy (2007);同上。不幸的是,具有较长的(Gly4Ser) 重复序列的融合蛋白的制备似乎不太可行,这是由于形成聚集体的倾向增加,从而造成对有一定纯度的甘氨酸聚合物作为PEG模拟物的应用天然限制。WO 2008/155134公开了具有Pro、Ala和Ser ( S卩,PAS)残基的合适混合的序列导致它们独特二级结构偏好的共同取消,并因此导致稳定无序的多肽。然而,WO 2008/155134还记载了,具有仅由丝氨酸和丙氨酸(SA)残基组成的结构域(即,结构域仅包含两种氨基酸)的融合蛋白不会形成无规卷曲,而是会形成β折叠结构。多肽的化学合成是公知的,并且在本领域中已有描述。Izuka公开了含有脯氨酸的多肽的化学合成(参见Izuka(1993),Bull.Chem.Soc. Jpn 66,1269-1272)。这些共聚多肽(copolypeptide)含有脯氨酸分别和甘氨酸、L-丙氨酸、L- α -氨基丁酸(Abu)、L-正缬氨酸(Nva)或L-亮氨酸的随机序列,并且通过化学共聚作用合成。Izuka公开了,这些共聚多肽通常具有限定的胶原蛋白样构象。此外,该出版物还描述了脯氨酸和丙氨酸(或脯氨酸和L-α-氨基丁酸)的共聚多肽在水中是部分可溶的,而其它共聚多肽完全不可溶。Izuka推测,脯氨酸/丙氨酸共聚多肽可以具有局部无序构象。Izuka强调,具有随机脯氨酸/丙氨酸序列的化学合成多肽主要出现在胶原蛋白样构象中,即,在有组织的构象中。因此,本发明的基本技术问题是提供具有真实无规卷曲构象的大的多肽。通过提供权利要求中描述的和本文提供的实施方案能解决该技术问题。因此,本发明涉及提供和应用生物合成的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段包含由至少约50、特别是至少约100、特别是至少约150、特别是至少约200、特别是至少约250、特别是至少约300、特别是至少约350、特别是至少约400个脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列。因此,本发明涉及提供生物合成的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段包含至少50个氨基酸残基的氨基酸序列,所述氨基酸序列仅由脯氨酸和丙氨酸氨基酸残基组成且包含至少一个脯氨酸和至少一个丙氨酸。本发明还提供了药物缀合物,其包含α)生物合成的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成,和(ii)药物,所述药物选自(a)包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的生物活性蛋白或多肽和(b)小分子药物。本文提供的具有真实无规卷曲构象的多肽和具有真实无规卷曲构象的多肽区段还可用于以下环境美容用品应用以及食品工业应用和饮料生产。本文提供的表现出真实无规卷曲构象的大的多肽仅由脯氨酸(P,Pro)和丙氨酸(A,Ala)残基组成,并且包含大于至少50个氨基酸、特别是至少约100、特别是至少约150、特别是至少约200、特别是至少约250、特别是至少约300、特别是至少约350、特别是至少约400个脯氨酸和丙氨酸氨基酸残基。两种氨基酸P和A都需要存在于本文提供的具有真实无规卷曲构象的大的多肽和具有真实无规卷曲构象的多肽区段中。本文还提供了编码本文公开的生物合成的无规卷曲多肽或多肽区段的核酸分子,以及编码药物或食品缀合物的核酸分子,所述药物或食品缀合物包含所述生物合成的无规卷曲多肽或多肽区段和(共 价连接的)感兴趣的蛋白,例如生物活性蛋白。本文所述的和可用于本文提供的药物或食品缀合物中的且包含由至少约50、至少约100、至少约150、至少约200、至少约250、至少约300、至少约350、至少约400个脯氨酸(P)和丙氨酸(A)氨基酸残基组成的氨基酸序列的生物合成的无规卷曲多肽或生物合成的无规卷曲多肽区段,特别可用于异源环境中,即,用于生物活性异源蛋白、蛋白构建体和/或药物缀合物中,所述药物缀合物包含所述生物合成的无规卷曲多肽或多肽区段和药学上或医学上有用的分子,例如小分子、肽或生物大分子,例如蛋白、核酸、碳水化合物、脂质囊泡等。如后文实施例所示,本发明人成功提供了由本文所述的真实无规卷曲多肽和生物活性蛋白或蛋白段组成的药物缀合物,以及由包含和/或连接于本文所述的无规卷曲多肽的小分子或小分子药物组成的药物缀合物,所述无规卷曲多肽仅由脯氨酸和丙氨酸氨基酸残基组成(即,由氨基酸P和A组成)。因此,本发明特别提供了生物活性异源蛋白,其包含至少两个结构域,其中(a)所述至少两个结构域的第一结构域包含具有和/或介导所述生物活性的氨基酸序列;和(b)所述至少两个结构域的第二结构域包含生物合成的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段由氨基酸序列组成,所述氨基酸序列由至少约50、至少约100、至少约150、至少约200、至少约250、至少约300、至少约350、至少约400个脯氨酸和丙氨酸氨基酸残基组成。按照本发明,所述“第一结构域和所述“第二结构域”不包含在天然(即,天然存在)蛋白或来源于天然存在的编码核酸序列(例如开放读码框等)的假定蛋白中。此外,本发明提供了药物缀合物,其由生物合成的无规卷曲多肽或多肽区段和药学上、治疗上和/或医学上有用的分子组成,所述无规卷曲多肽或多肽区段包含由至少约50、至少约100、至少约150、至少约200、至少约250、至少约300、至少约350、至少约400个脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,所述药学上、治疗上和/或医学上有用的分子例如小分子、肽或生物大分子,例如蛋白、核酸、碳水化合物、脂质囊泡等,所述药学上、治疗上和/或医学上有用的分子与所述生物合成的无规卷曲多肽或多肽区段缀合。此外,应当注意到,对于本文公开的缀合物,术语“生物活性”不限于纯生物分子,还包括具有医学活性的、治疗活性的、药学活性的分子等。对于本领域技术人员显而易见的是,本文提供的方式和方法不限于药学和医学用途,还可以用于很多技术中,包括但不限于美容用品、食品、饮料和营养学技术、石油工业、造纸工业等。相比于化学合成的共聚多肽(例如Izuka,同上),本文提供的无规卷曲多肽是通过生物合成方式产生的。本文所用的术语“生物合成”是指借助于生物技术方法合成(与化学合成不同)。这些生物技术方法是本领域公知的,并且在下文有进一步的描述。本发明的无规卷曲多肽的生物合成允许产生具有规定的脯氨酸和丙氨酸残基序列、规定的长度和/或规定的脯氨酸和丙氨酸残基比率的多肽。此外,本发明所提供的多肽是基本上纯的,即,所产生的多肽是基本上均一的,并共有以上特征(即,规定的序列、规定的长度和/或规定的氨基酸比率)。按照本发明,由至少约50、特别是至少约100、特别是至少约150、特别是至少约200、特别是至少约250、特别是至少约300、特别是至少约350、特别是至少约400个脯氨酸和丙氨酸氨基酸残基组成的无规卷曲多肽例如包含在生物活性异源多肽/多肽构建体和/或药物或食品缀合物以及在其它工业领域有用的其它缀合物中,所述其它工业领域例如,但不限于,造纸工业、石油工业等。
总体上,本发明多肽的上述特征允许形成稳定的无规卷曲多肽,并且这些无规卷曲多肽具有令人意想不到的和有利的性质。例如,本发明的多肽在水性溶液中是完全可溶的,并且具有增加的流体动力学体积。令人意想不到的是,本文所述的无规卷曲多肽还能提供增加的体内/体外稳定性。这对于医学应用是特别重要的,例如,对于包含本发明无规卷曲多肽的生物活性蛋白或药物缀合物。然而,本发明无规卷曲多肽的许多有利性质不仅允许它们可用于医学领域,而且还可用于其它领域,例如美容用品/美容治疗或营养学和食品技术领域,例如乳品业或肉品加工。可用于食品工业等的缀合物的实例,是包含本文公开的无规卷曲多肽或多肽区段和可用于这些技术的化合物(例如用作乳化剂的非离子型表面活性剂的聚氧化丙烯或聚氧化乙烯聚合物)的缀合物,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列。本文还考虑到在生物化学方法和技术过程中使用本文所述的生物合成的无规卷曲多肽,例如造纸、采油等。本文提供的仅由脯氨酸和丙氨酸残基组成的生物合成的无规卷曲多肽(以及本文公开的包含所述生物合成的真实无规卷曲多肽的缀合物和构建体,例如药物或食品缀合物/构建体)的令人意想不到的和有利的特征在下文更详细地描述。此外,下文提供了利用这些本发明生物合成的无规卷曲多肽的示例性的应用和方式和方法。本文还提供了产生所述生物合成的无规卷曲多肽以及生物活性异源多肽或多肽构建体的方式和方法,以及制备本文公开的包含所述无规卷曲多肽的缀合物和构建体例如药物构建体的方式和方法。在本发明的背景下,惊奇地发现,具有均匀组成的脯氨酸-丙氨酸聚合物/多肽形成稳定的无规卷曲构象。这在后文的实施例中也得到证明,其中通过圆二色(CD)光谱验证生物合成的脯氨酸/丙氨酸(共)聚合物/多肽的无规卷曲结构。获得和利用所述生物合成的真实无规卷曲多肽/聚合物是令人意想不到的,因为已建立的Chou-Fasman法(Chouand Fasman (1974), Biochemistry 13,223-245)预测到由脯氨酸和丙氨酸组成的聚合物/多肽(或其区段)为100%α_螺旋二级结构,如图7所示。然而,本文惊奇地发现并通过实验证实,具有均匀组成的脯氨酸-丙氨酸聚合物/多肽形成稳定的无规卷曲构象。这在后文的实施例中也得到证明,其中通过诸如圆二色(CD)光谱和尺寸排阻色谱(SEC)的实验技术验证脯氨酸/丙氨酸(共)聚合物/多肽的无规卷曲结构。 相比于本发明的多肽/聚合物,例如Izuka(1993)(同上)中所述的化学合成多肽具有任意/无规定的且随机的序列以及不同的长度。因此,化学合成多肽包含具有不同脯氨酸/丙氨酸比率、长度等的完全不同的肽的混合物。如Izuka所述,这样的混合物中的化学合成多肽不会(或仅会部分地)形成无规卷曲,并因此不会具有本文下文提供和描述的生物合成的多肽的任何有利性质。因此,本发明包括和涉及包含本文公开的本发明生物合成的无规卷曲多肽/聚合物的组合物,其中所述生物合成的无规卷曲多肽/聚合物特别由它们的仅包含脯氨酸和丙氨酸残基的序列定义。在一个具体实施方案中,本发明涉及包含作为一个组成部分的本文公开的这些无规卷曲多肽/聚合物的缀合物,例如药物或食品缀合物。在一个实施方案中,所述组合物中包含的这些本发明生物合成的无规卷曲多肽/聚合物具有均匀长度。
如上文所述,本发明的仅由脯氨酸和丙氨酸残基组成的生物合成的无规卷曲多肽(或无规卷曲多肽区段)令人意想不到地形成稳定的无规卷曲构象。本文所用的术语"无规卷曲"通常涉及包括氨基酸聚合物/氨基酸序列/多肽在内的聚合分子的任何构象,其中形成所述聚合结构的各个单体元素基本上随机地定向朝向相邻的单体元素,同时还与所述相邻的单体元素化学结合。具体而言,采取/具有形成"无规卷曲构象"的多肽、氨基酸序列或氨基酸聚合物基本上缺少规定的二级结构和三级结构。对于本发明的多肽,形成聚合结构(即,多肽/氨基酸序列)的单体元素是诸如脯氨酸和丙氨酸的单个氨基酸本身或诸如下文进一步描述和限定的“氨基酸重复”/ “氨基酸盒”/ “盒重复”/ “构成部分(buildingblock) ”/ “模块(module) ” (或其片段)的肽段。多肽无规卷曲的性质和它们的实验鉴定方法是本领域技术人员已知的,并且在科学文献中已有描述(Cantor (1980)Biophysical Chemistry, 2nd ed. , ff. H. Freemanand Company, New York;Creighton (1993)Proteins-Structures and MolecularProperties,2nd ed. , ff. H. Freeman and Company,New York;Smith (1996)Fold Des1:R95-R106)。本文所用的术语“区段”是指本文所限定的生物合成的无规卷曲多肽的一部分,其中所述的一部分可以本文所述的生物合成的无规卷曲多肽的内部一部分。所述“区段”可以是,例如,一个(或多个)氨基酸被缺失的本文所限定的生物合成的无规卷曲多肽,例如从本发明多肽的起点和/或终点缺失。此外,所述“区段”可以被用作或可以形成较大的蛋白或多肽的一部分,例如,具有生物活性蛋白的融合蛋白的一部分。所述“融合蛋白”还是本发明的异源生物活性多肽/蛋白/多肽构建体的实例。本文所用的术语“异源”在本文的下文中定义。本发明提供的和可用于本发明的无规卷曲多肽(或其无规卷曲区段)例如在水性溶液或在生理条件下采取/形成无规卷曲构象。术语〃生理条件〃是本领域已知的,并且涉及蛋白通常采取其天然的、折叠构象的条件。更具体而言,术语〃生理条件〃涉及对于高等生命形式、特别是哺乳动物、最优选人类通常很重要的生物物理参数。术语〃生理条件"可以涉及在哺乳动物并特别是人类的机体(特别是体液)中通常存在的生物化学和生物物理参数。所述〃生理条件〃可以涉及健康机体中存在的相应参数以及疾病条件下或人类患者中存在的参数。例如,当所述哺乳动物或所述人类发热时,患病哺乳动物或人类患者可以具有较高、但任然是“生理”的温度条件。对于蛋白采取其天然构象/状态的〃生理条件〃,最重要的参数是温度(对人体是37° C)、pH(对于人类血液为7. 35-7. 45)、同渗容摩(280-300mmol/kg H2O)、以及如果必要的话,蛋白含量(66_85g/l血清)。然而,本领域技术人员知道,在生理条件下,这些参数可以变化,例如在指定的体液或组织液例如血液、脑脊液、腹膜液和淋巴液中,温度、pH、同渗容摩和蛋白含量可以不同(Klinke (2005)Physiologie, 5th ed. , Georg Thieme Verlag, Stuttgart)。例如,在脑脊液中,同渗容摩可以为约290mmol/kg H2O,蛋白浓度可以为O. 15g/l至O. 45g/l,而在淋巴液中,pH可以为约7. 4,蛋白含量可以为3g/l至5g/l。当使用下文所述的方法确定多肽(或其区段)/氨基酸序列在实验条件下是否形成/采取无规卷曲构象时,诸如温度、pH、同渗容摩和蛋白含量的生物物理参数可以不同于体内通常存在的生理条件。1° C至42° C或优选4° C至25。C的温度可以被认为可用于在体外测试和/或验证蛋白在生理条件下的生物物理性质和生物活性。数种缓冲液,特别是在实验环境中(例如在确定蛋白结构,特别是在CD测量和允许本领域技术人员测定蛋白/氨基酸段的结构性质的其它方法中)或在药物组合物的缓冲齐U、溶剂和/或赋形剂中,被认为能代表体外“生理溶液”/ “生理条件”。这些缓冲液的实例是,例如磷酸缓冲盐溶液(PBS:115mM NaCl、4mM KH2PO4U6mM Na2HP04pH 7.4)、Tris 缓冲 液、乙酸盐缓冲液,柠檬酸盐缓冲液或类似缓冲液,例如后文实施例中所用的那些缓冲液。通常,代表“生理溶液条件”的缓冲液的pH应当位于6. 5至8. 5的范围内,优选位于7. O至8. O的范围内,最优选位于7. 2至7. 7的范围内,同渗容摩应当位于10至lOOOmmol/kg H2O的范围内,更优选位于50至500mmol/kg H2O的范围内,最优选位于200至350mmol/kg H2O的范围内。可选地,代表生理溶液条件的缓冲液的蛋白含量可以位于O至100g/l的范围内,忽略具有生物活性的蛋白本身,其中可以使用典型稳定化蛋白,例如人或牛血清白蛋白。本文已发现,多肽(或其区段)不仅在生理条件下形成无规卷曲构象,而且更通常在水性溶液中形成无规卷曲构象。术语“水性溶液”是本领域公知的。“水性溶液”可以是水(H2O)含量为至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%或至少约90%H20(重量/重量)的溶液。因此,本发明的多肽(或其区段)可以在可能含有其它可混溶剂的水性溶液中形成无规卷曲构象,或在具有更宽范围的温度、PH值、同渗容摩或蛋白含量的水性分散液中形成无规卷曲构象。这对于无规卷曲多肽(或其区段)在医药治疗或体内诊断之外的应用是特别相关的,例如在美容用品、营养学或食品技术中。因此,本发明中还考虑到,可以将本发明的脯氨酸/丙氨酸生物合成多肽(或其区段)的无规卷曲构象得到保持和/或利用于药物组合物例如液体药品/生物制品或冻干的药物组合物环境中。这对于本文提供的特别包含本发明无规卷曲多肽(或多肽区段)的生物活性异源蛋白或药物缀合物是特别重要的。优选地,“生理条件”会被用于相应的缓冲液体系、溶剂和/或赋形剂中。然而,例如在冻干的或干燥的组合物(例如,药物组合物/生物制品)中,考虑到本文提供的无规卷曲多肽(或多肽区段)的无规卷曲构象暂时不存在和/或不能被检测到。然而,在相应的缓冲液/溶液/赋形剂/溶剂复原后或在给予机体后,所述无规卷曲多肽(或多肽区段)会再次采取/形成其无规卷曲。确定多肽(或其区段)是否形成/采取无规卷曲构象的方法是本领域已知的(Cantor(1980)同上;Creighton(1993)同上;Smith(1996)同上)。这些方法包括本文后文所例举的圆二色(⑶)光谱。⑶光谱代表光吸收光谱方法,其中测量某种物质对右旋圆偏振光和左旋圆偏振光的吸光度的差异。可以利用波长为约190-250nm的远紫外光谱通过CD光谱确定蛋白的二级结构。在这些波长下,可以分析多肽中常见的不同二级结构,因为α螺旋、平行和反向平行β折叠以及无规卷曲构象中的每一种都能产生特征性的⑶谱形状和幅度。因此,通过使用⑶光谱法,本领域技术人员能容易地确定多肽(或其区段)在水性溶液中或在生理条件下是否形成/采取无规卷曲构象。其它建立的生物物理学方法包括核磁共振(NMR)光谱、吸收光谱法、红外线和拉曼光谱、通过尺寸排阻色谱测量流体动力学体积、分析超离心或动态/静态光散射,以及测量摩擦系数或固有粘度(Cantor(1980)同上;Creighton(1993)同上;Smith(1996)同上)。除了上述实验方法之外,还描述了预测蛋白的二级结构的理论方法。这种理论方法的一个实例是Chou-Fasman法(Chou and Fasman,同上),其是基于根据例如用X射线晶体学解析的已知的蛋白结构来分析α螺旋、β折叠和转角中每种氨基酸的相对频率。然 而,已知蛋白二级结构的理论预测是不可靠的。如下文所示例,根据Chou-Fasman法预期采取α螺旋二级结构的氨基酸序列通过实验发现形成无规卷曲。因此,诸如Chou-Fasman算法的理论方法对于指定多肽是否采取无规卷曲构象仅可以具有有限的预测价值,这在后文的实施例和图中也有证实。尽管如此,上述理论预测通常是评估给定多肽/氨基酸序列的推定二级结构中的第一方法。无规卷曲结构的理论预测还表明,通过以上实验手段验证给定多肽/氨基酸序列是否确实具有无规卷曲构象可能是非常值得的。大部分氨基酸、特别是疏水性氨基酸的同聚物在水性溶液中通常是不溶的(Bamford(1956)Synthetic Polypeptides - Preparation, Structure, and Properties, 2nded. , Academic Press, New York)。数种亲水性氨基酸的同聚物已知能形成二级结构,例如,对于 Ala 为 α 螺旋(Shental-Bechor (2005) Biophys J 88:2391-2402),对于 Ser 为 β 折叠(Quadrifoglio (1968) J Am Chem Soc 90:2760-2765),而聚脯氨酸是硬度最强的同聚寡肽(Schimmel (1967) Proc Natl Acad Sci USA 58:52 - 59),其在水性溶液中形成 II 型反式螺旋(Cowan (1955) Nature 176:501 - 503)。例如,对于聚甘氨酸,利用聚合物生物物理学的理论原理,200个氨基酸残基的
链的无规卷曲直径相当于约其计算为均方根端到端距离^^ = I^n-Ces其中
75A,,
n=200,对于每个Ca -Ca距离,长度I的可转动的键=3.8 A,对于聚(Gly)的“特征
比” C 2. O (Brant (1967) J Mol Biol 23:47-65 ;Creighton, (1993)同上)。这种关系
表明,本领域技术人员会预期到通过(a)利用较长的链长度I或通过(b)利用表现出较大
的特征比C c 的氨基酸可以增大随机链氨基酸聚合物的流体动力学体积。C c 是是分子随
机链的固有硬度的衡量标准,并且对于大多数氨基酸的一般值为9 (Brant (1967)同上)。只
有缺少侧链的Gly以及亚氨基酸Pro表现出显著较小的值。因此,Gly和Pio (在变性条件
下)预期能有助于减小无规卷曲蛋白的维度(Miller(1968)Biochemistry 7:3925-3935)。
因此,包含脯氨酸残基的氨基酸序列预期具有相对紧凑的流体动力学体积。然而,与该教导
相反,本文表明与预期的流体动力学体积相比,如通过分析凝胶渗透/尺寸排阻色谱所测
定的,包含脯氨酸和丙氨酸残基混合物的本发明氨基酸聚合物/多肽的流体动力学体积具
有明显增加的流体动力学体积。事实上,令人意想不到的是,包含这两种氨基酸(脯氨酸和
丙氨酸)的混合物的多肽在生理条件下采取无规卷曲构象,这两种氨基酸中的每一种单独倾向于形成具有规定的二级结构的同聚寡肽。这些本发明的脯氨酸/丙氨酸多肽具有的流体动力学半径大于包含相同数量的Gly残基的同聚物的半径,例如,并且它们为本发明的生物活性蛋白或构建体(即,生物活性异源蛋白或药物缀合物)提供更好的可溶性。如上文所述,本发明的生物合成的无规卷曲脯氨酸/丙氨酸多肽与化学合成多肽的不同之处在于,通过简单的方式和方法,它们能采取规定的均匀长度。然而,现有技术提供的多肽的混合物/组合物在肽的长度方面具有明显变化,而本发明能提供具有规定的长度的生物合成的无规卷曲多肽的混合物/组合物。优选地,这样的混合物/组合物中包含的基本上所有本发明的多肽具有相同的规定的长度,并因此共有相同的生物化学性质。这样的均匀组合物在可应用生物合成的无规卷曲多肽的各种医学、美容用品、营养学应用中更有优势。此外,特别是在医学或药学背景下,包含由至少约50、特别是至少约100、特别是至少约150、特别是至少约200、特别是至少约250、特别是至少约300、特别是至少约350、特别是至少约400个脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列的本文所限定的生物合成的无规卷曲多肽或多肽区段,还可用于预防、改善和/或治疗与受损的血浆状况有关和/ 或相关的病症,例如损伤、烧伤、手术后等。因此,所述生物合成的无规卷曲多肽或多肽区段的一个医学应用是用作血浆扩容剂。然而,应当注意到,按照本发明,本文所述的药物缀合物和异源多肽或异源多肽构建体可以可用于与受损的血浆量或血浆内容物相关的病症或与受损的血容量相关的病症的医学或药物干预。因此,在一个实施方案中,本发明涉及生物合成的随机多肽(或其区段),其包含仅由至少约50个脯氨酸和丙氨酸氨基酸残基、至少约100个脯氨酸和丙氨酸氨基酸残基、至少约150个脯氨酸和丙氨酸氨基酸残基或至少约200个脯氨酸和丙氨酸残基组成的氨基酸序列,特别是当所述生物合成的随机多肽(或其区段)包含在异源蛋白/多肽/多肽构建体或药物缀合物中时。本发明还涉及生物合成的无规卷曲多肽,其包含仅由至少约200个脯氨酸和丙氨酸氨基酸残基、甚至更优选至少约300个脯氨酸和丙氨酸氨基酸残基、特别优选至少约400个脯氨酸和丙氨酸氨基酸残基、更特别优选至少约500个脯氨酸和丙氨酸氨基酸残基和最优选至少约600个脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列。形成无规卷曲构象的氨基酸序列可以由最多约3000个脯氨酸和丙氨酸氨基酸残基、最多约2000个脯氨酸和丙氨酸氨基酸残基、最多约1500个脯氨酸和丙氨酸氨基酸残基、最多约1200个脯氨酸和丙氨酸氨基酸残基、最多约800个脯氨酸和丙氨酸氨基酸残基组成。因此,脯氨酸/丙氨酸氨基酸序列段可以由约50、约100、约150、约200、约250、约300、约350、约400、约500、约600、约700、约800、约900至约3000个脯氨酸和丙氨酸氨基酸残基组成。在某些实施方案中,本发明生物合成的氨基酸序列包含约200至约3000个脯氨酸和丙氨酸残基、约200至约2500个脯氨酸和丙氨酸残基、约200至约2000个脯氨酸和丙氨酸残基、约200至约1500个脯氨酸和丙氨酸残基、约200至约1000个脯氨酸和丙氨酸残基、约300至约3000个脯氨酸和丙氨酸残基、约300至约2500个脯氨酸和丙氨酸残基、约300至约2000个脯氨酸和丙氨酸残基、约300至约1500个脯氨酸和丙氨酸残基、约300至约1000个脯氨酸和丙氨酸残基、约400至约3000个脯氨酸和丙氨酸残基、约400至约2500个脯氨酸和丙氨酸残基、约400至约2000个脯氨酸和丙氨酸残基、约400至约1500个脯氨酸和丙氨酸残基、约400至约1000个脯氨酸和丙氨酸残基、约500至约3000个脯氨酸和丙氨酸残基、约500至约2500个脯氨酸和丙氨酸残基、约500至约2000个脯氨酸和丙氨酸残基、约500至约1500个脯氨酸和丙氨酸残基、约500至约1000个脯氨酸和丙氨酸残基、约600至约3000个脯氨酸和丙氨酸残基、约600至约2500个脯氨酸和丙氨酸残基、约600至约2000个脯氨酸和丙氨酸残基、约600至约1500个脯氨酸和丙氨酸残基、约600至约1000个脯氨酸和丙氨酸残基、约700至约3000个脯氨酸和丙氨酸残基、约700至约2500个脯氨酸和丙氨酸残基、约700至约2000个脯氨酸和丙氨酸残基、约700至约1500个脯氨酸和丙氨酸残基、约700至约1000个脯氨酸和丙氨酸残基、约800至约3000个脯氨酸和丙氨酸残基、约800至约2500个脯氨酸和丙氨酸残基、约800至约2000个脯氨酸和丙氨酸残基、约800至约1500个脯氨酸和丙氨酸残基、约800至约1000个脯氨酸和丙氨酸残基。从本发明的内容可以看出,较大的生物合成的氨基酸序列(基本上由脯氨酸和丙氨酸组成)也在本发明的范围内,并且能容易地用于本文所限定的生物活性蛋白或蛋白构建体,所述生物活性蛋白或蛋白构建体包含作为至少两个结构域中的一个结构域的具有和/或介导所述生物活性的氨基酸序列和作为至少两个结构域中的另一个结构域的生物合成的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段由至少约50个脯氨酸和丙氨酸氨基酸残基、至少约100个脯氨酸和 丙氨酸氨基酸残基、至少约150个脯氨酸和丙氨酸氨基酸残基、至少约200、至少约250、至少约300、至少约350、至少约400个脯氨酸和丙氨酸氨基酸残基组成。这类生物合成的无规卷曲多肽或多肽区段相当于异源蛋白/蛋白构建体的生物合成的无规卷曲部分。这些生物合成的脯氨酸/丙氨酸段由最多约3000个脯氨酸和丙氨酸氨基酸残基组成。这些氨基酸序列(脯氨酸/丙氨酸段)包含作为主要或独特残基的脯氨酸和丙氨酸,这在下文中有进一步解释。考虑到,本文所限定的生物合成的氨基酸序列仅由脯氨酸(P)和丙氨酸(A)氨基酸残基组成,其形成/采取/具有无规卷曲构象。在最简单的情况下,生物合成的多肽或多肽区段由具有本文所限定的无规卷曲构象的氨基酸序列组成。然而,除了本文所述的形成/采取/具有无规卷曲构象的氨基酸序列之外,生物合成的多肽(或其区段)还可以包含不能有助于无规卷曲构象的形成或本身不能形成/采取/具有无规卷曲构象的氨基酸序列/氨基酸残基。在不脱离本发明主旨的情况下,这样的生物合成的多肽(或其区段)也是生物合成的“无规卷曲”多肽或多肽区段。例如,其它氨基酸序列/氨基酸残基可以被用作连接子。特别是,本发明中还考虑到生物合成的无规卷曲多肽的二聚体、三聚体,即,一般多聚体,并且这些多聚体可以通过不形成无规卷曲构象的氨基酸序列/残基连接。可以包含这样的无规卷曲多肽的蛋白的实例是本文提供的生物活性蛋白,除了本文所限定的由脯氨酸和丙氨酸氨基酸残基组成的无规卷曲多肽之外,其还可以包含具有/介导生物活性的另一多肽。此外,这样的构建体可以是本文所限定的异源生物活性蛋白或多肽构建体。术语“至少约50/100/150/200/300/400/500/600/700/800/ 等个氨基酸残基”不限于所述明确数量的氨基酸残基,还包括这样的氨基酸段,所述氨基酸段包含增加约1-20%(例如10%至20%)的残基或减少约1-20%(例如约10%至20%)的残基。例如“至少约100个氨基酸残基”还可以包括约80至100和约100至120个氨基酸残基,而不脱离本发明的主旨。例如“至少约200个氨基酸残基”还可以包括约160至200和约200至240个氨基酸残基,而不脱离本发明的主旨。在必要的变通下,上文给出的定义和解释还适用于术语“最多约3000/2000/1500/1200/800个氨基酸残基”等。因此,对于较长的氨基酸序列(例如包含最多3000个氨基酸残基或由最多3000个氨基酸残基组成的氨基酸序列),术语“约”不局限于或不受限于所述明确数量的氨基酸残基。因此,术语“最多约3000/2000/1500/1200/800个氨基酸残基”还可以包括这样的氨基酸段,所述氨基酸段包含增加10%至20%或减少10%至20%的残基,这不脱离本发明。此外,生物合成的无规卷曲多肽(或其区段)的特征在于氨基酸残基、特别是主要组成部分脯氨酸和丙氨酸的规定的含量或比率。如上文所述,本发明涉及生物合成的无规卷曲多肽或多肽区段,其包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少约50、至少约100、至少约150、至少约200、至少约250、至少约300、至少约350、至少约400个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成,特别是当所述生物合成的无规卷曲多肽或多肽区段包含在异源生物活性蛋白/蛋白构建体/多肽或药物缀合物中时。本文所用的术语“仅”表示,优选至少约90%或至少约95%的氨基酸是脯氨酸和丙氨酸,其中脯氨酸和丙氨酸构成主要部分,但可以不是仅有的氨基酸残基,即,本发明的这些氨基酸序列未必是100%的脯氨酸和丙氨酸氨基酸段。因此,本发明的生物合成的多肽/氨基酸序列还可以包含作为次要组成部分的除脯氨酸和丙氨酸之外的其它氨基酸,只要氨基酸序列形成/采取/具有无规卷曲构象。通过本文提供的方式和方法能容易地确定这类 无规卷曲构象。因此,对于术语“仅”,可以包含少量(小于约10%或小于约5%)的其它氨基酸残基。所述“其它”的次要氨基酸残基在下文中有定义。因此,在一个实施方案中,本发明涉及生物合成的无规卷曲多肽(或其区段),其中氨基酸序列主要由脯氨酸和丙氨酸组成,并且其中脯氨酸残基构成大于约10%且小于75%的氨基酸序列。丙氨酸残基包含所述氨基酸序列(或无规卷曲多肽或多肽区段,如果其由氨基酸序列组成)的剩余至少25%至90%。优选地,氨基酸序列包含大于约10%、优选大于约12%、甚至更优选大于约14%、特别优选大于约18%、更特别优选大于约20%、甚至更特别优选大于约22%、23%或24%和最优选大于约25%的脯氨酸残基。氨基酸序列优选包含小于约75%、更优选小于70%、65%、60%、55%或50%的脯氨酸残基,其中较低的值是优选的。甚至更优选地,氨基酸序列包含小于约48%、46%、44%、42%的脯氨酸残基。特别优选的是,氨基酸序列包含小于约41%、40%、39%、38%,37%或36%的脯氨酸残基,其中较低的值是优选的。最优选地,氨基酸序列包含小于约35%的脯氨酸残基;还可参见下文提供的PA构建体。反之亦然,氨基酸序列优选包含小于约90%、更优选小于88%、86%、84%、82%或80%的丙氨酸残基,其中较低的值是优选的。甚至更优选地,氨基酸序列包含小于约79%、78%、77%,76%的丙氨酸残基,其中较低的值是优选的。最优选地,氨基酸序列包含小于约75%的
丙氨酸残基。本文还优选的是,氨基酸序列包含大于约25%、优选大于约30%、甚至更优选大于约35%、特别优选大于约40%、更特别优选大于约45%或50%、甚至更特别优选大于约52%、54%、56%、58%或59%的丙氨酸残基,其中较高的值是优选的。甚至更优选地,氨基酸序列包含大于约60%、61%、62%、63%或64%的丙氨酸残基,最优选大于约65%的丙氨酸残基。因此,无规卷曲多肽(或其区段)可以包含由约25%的脯氨酸残基和约75%的丙氨酸残基组成的氨基酸序列。或者,无规卷曲多肽(或其区段)可以包含由约35%的脯氨酸残基和约65%的丙氨酸残基组成的氨基酸序列。上文所用的术语“约X%”不限于所述明确数量的百分比,还包括增加10%至20%或减少10%至20%的残基的值。例如,术语10%还可以分别涉及11%或12%和9%和8%O然而,如上文所提及的和下文进一步的详细描述,所述无规卷曲多肽(或多肽区段)并且特别是氨基酸序列还可以包含不同于脯氨酸和丙氨酸的作为次要组成部分的其它氨基酸。如上文已经讨论的那样,所述次要组成部分,即,除脯氨酸或丙氨酸之外的氨基酸,可以构成本发明生物合成的无规卷曲多肽/聚合物的小于约10%、小于约9%、小于约8%、小于约7%、小于约6%、小于约5%、小于约4%、小于约4%、小于约3%或小于约2%。本领域技术人员明白,当除脯氨酸或丙氨酸之外的其他残基作为次要组成部分包含在氨基酸序列/多肽(多肽区段)中时,所述氨基酸序列/多肽(或其区段)还可以形成无规卷曲构象。本文所用的术语"次要组成部分"表示,在本发明的生物合成的无规卷曲多肽/聚合物中,最多5%或最多10%的氨基酸残基不同于脯氨酸或丙氨酸。这表示,在100个氨基酸中,最多10个可以不同于脯氨酸和丙氨酸;优选最多8%,即,在100个氨基酸中,最多8个可以不同于脯氨酸和丙氨酸;更优选最多6%,即,在100个氨基酸中,最多6个可 以不同于脯氨酸和丙氨酸;甚至更优选最多5%,即,在100个氨基酸中,最多5个可以不同于脯氨酸和丙氨酸;特别优选最多4%,即,在100个氨基酸中,最多4个可以不同于脯氨酸和丙氨酸;更特别优选最多3%,即,在100个氨基酸中,最多3个可以不同于脯氨酸和丙氨酸;甚至更特别优选最多2%,S卩,在100个氨基酸中,最多2个可以不同于脯氨酸和丙氨酸;最优选最多1%,即,在无规卷曲多肽(或其区段)包含的100个氨基酸中,最多I个可以不同于脯氨酸和丙氨酸。所述不同于脯氨酸和丙氨酸的氨基酸可以选自Arg、Asn、Asp、Cys、Gin、Glu、Gly、His、lie、Leu、Lys> Met、Phe> Thr、Trp> Tyr 和 Val,包括翻译后修饰的氨基 酸或非天然氨基酸(参见,例如,Budisa(2004)Angew Chem Int Ed Engl 43:6426-6463 或Young (2010) J Biol Chem285:11039-11044)。当生物合成的无规卷曲多肽/构建体/聚合物(或其片段)的“次要组成部分”(即,除脯氨酸或丙氨酸之外的氨基酸)包含Ser作为“其它氨基酸”/ “不同的氨基酸”时,所述Ser氨基酸优选构成这些(次要)氨基酸残基的小于50%、更优选小于40%、小于30%、小于20%或小于10%。在最优选的实施方案中,本文所述的生物合成的无规卷曲多肽/构建体/聚合物或本文所述的(例如)融合蛋白的无规卷曲多肽部分不包含丝氨酸残基。通常,本文优选的是,这些“次要”氨基酸(除脯氨酸和丙氨酸之外)不存在于本文提供的生物合成的无规卷曲多肽/构建体/聚合物或(例如)融合蛋白的无规卷曲多肽部分。按照本发明,生物合成的无规卷曲多肽(或其区段)/氨基酸序列可以特别地仅仅由脯氨酸和丙氨酸氨基酸残基构成(即,无规卷曲多肽或氨基酸序列中不存在其它氨基酸残基)。虽然上文涉及无规卷曲多肽(或其区段)中包含的氨基酸序列的总长度和脯氨酸/丙氨酸含量,但下文更详细地涉及具体的示例性氨基酸序列(或其片段)。在一个实施方案中,例如在水性溶液中或在生理条件下采取无规卷曲构象的氨基酸序列/多肽(本文所限定的无规卷曲多肽或其区段)可以包含多个“氨基酸重复”/ “氨基酸盒”/ “盒重复”,其中所述“氨基酸重复”/ “氨基酸盒”/ “盒重复”/ “构成部分”/ “模块”(这些术语在本文中可交换使用)主要或仅仅由脯氨酸(Pro,P)和丙氨酸(Ala,A)氨基酸残基组成(本文描述为“PA”或“AP”),其中不多于6个连续氨基酸残基是相同的。示例性的“构成部分”是例如“AP”,并且在后文示例性的实例中将其提供为本发明的功能性生物合成的无规卷曲结构域。该示例性的实例是序列“P1A1 ”,其也以APAPAPAPAPAPAPAPAPAP(SEQ ID N0:51)的形式提供,即,“聚PA” “氨基酸重复” / “氨基酸盒”/ “盒重复”。在优选的实施方案中,包含上文所限定的“氨基酸重复”/ “氨基酸盒”/”盒重复”等的氨基酸序列/多肽包含不多于5个相同的连续氨基酸残基。对于示例性的个体构成部分,下文提供了其它可选实施方案。在本发明的无规卷曲多肽(或其区段)中,氨基酸重复可以是相同的或不相同的。由脯氨酸和丙氨酸残基组成的“氨基酸重复”、“构成部分”、“模块”、“重复”、“氨基酸盒”等的非限制性实例在下文提供;参见,例如SEQ ID NO: K SEQ ID N0:2、SEQ ID N0:3、SEQID NO: 4、SEQ ID NO: 5、SEQ ID NO: 6和SEQ ID NO: 51 (所附的序列表还包含编码这些“重复”/ “模块”等的示例性核酸序列。与本文共同提交的所述序列表中的附加序列构成本说明书的一部分)。此外,本文考虑了这些序列(相同的和/或不相同的)片段的用 途,其中“片段”包含至少2个氨基酸并包含至少一个脯氨酸和/或丙氨酸,优选至少一个脯氨酸和一个丙氨酸。本发明中用于产生无规卷曲多肽(或其区段)的这些序列的“片段”可以由选自所述SEQ ID N0:l、2、3、4、5、6和51的氨基酸序列的至少3个、优选至少4个、更优选至少5个、甚至更优选至少6个、仍然更优选至少8个、特别优选至少10个、更特别优选至少12个、甚至更特别优选至少14个、仍然更特别优选至少16个、并且最优选至少18个连续氨基酸组成(此处应当注意到,SEQ ID No: 51由示例性“AP”或“PA”重复组成)。基于本文给出的教导,本领域技术人员能够容易地制备能例如在水性或生理条件下形成无规卷曲构象并且如本文所限定主要由脯氨酸和丙氨酸组成的其它氨基酸序列/多肽。可用作本文所限定的无规卷曲多肽(或其区段)的构成部分或模块的形成无规卷曲构象的氨基酸序列/多肽的其它实例可以特别包含上文所示的具体“构成部分”、“聚合物盒”或“聚合物重复”的组合和/或片段或环状排列形式。因此,无规卷曲多肽/氨基酸序列的示例性模块/序列单元/聚合物重复/聚合物盒还可以提供可以按照本发明重新组合而形成其它模块/序列单元/聚合物重复/聚合物盒的个体片段。术语“模块”、“序列单元”、“聚合物重复”、“聚合物盒”和“构成部分”在本文作为同义词使用,并涉及可以用于形成本文所限定的无规卷曲多肽(或其区段)/氨基酸序列的个体氨基酸段。氨基酸重复(用作本发明生物合成的无规卷曲多肽的“构成部分”等)可以由至少 3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、
30或更多个氨基酸残基组成,其中每个重复都包含脯氨酸和丙氨酸残基。然而,如后文的SEQ ID No:51所示,所述“构成部分”还可以仅由2个本文提供的氨基酸残基P和A组成,SP“PA”或“AP”的形式。在一个实施方案中,本发明的氨基酸重复不包含大于50个氨基酸残基。然而,对于本领域技术人员显而易见的是,所述“重复”可以包含甚至大于50个氨基酸残基,例如当所述本发明生物合成的无规卷曲多肽/聚合物包含大于约例如100个氨基酸、大于约150个氨基酸、大于约200个氨基酸等的情况下。因此,所述“重复”中包含的氨基酸残基的最大量以本文提供的生物合成的多肽(或其区段)/聚合物的总长度为前提条件。然而,应当注意到,包含上述重复等的生物合成的无规卷曲多肽/氨基酸序列应当优选具有上文限定和解释的总长度和/或脯氨酸/丙氨酸含量,即,由约50、约100、约150、约200、约250、约300、约350、约400至约3000个氨基酸组成和/或包含大于约10%且小于约75%的脯氨酸残基。在必要的变通下,上文中关于此方面给出的所有限定也适用于此处。正如本文详细讨论和上文所提供的那样,本发明提供了在药学、医学和/或治疗领域中特别有用的生物活性异源蛋白或蛋白构建体。这些生物活性异源蛋白/蛋白构建体包含作为所述至少两个结构域中的至少一个结构域的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸残基组成的氨基酸序列,其中所述氨基酸序列由约50、约100、约150、约200、约250、约300、约350、约400至约3000个脯氨酸(Pro)和丙氨酸(Ala)残基组成。对于本文公开的生物活性异源蛋白、多肽或蛋白构建体,术语“异源”涉及所述蛋白、多肽或蛋白构建体中的至少两个结构域,其中所述至少两个结构域的第一结构域提供、具有和/或介导规定的生物活性,并且其中所述至少两个结构域的第二结构域包含仅由脯氨酸和丙氨酸氨基酸残基组成的生物合成的无规卷曲多肽,并且其中所述至少两个结构域在自然界不是彼此有效连接的,或不是由自然界存在的单个编码核酸序列(例如开放读码框)所编码的。本文提供的和用于本发明生物活性异源蛋白/蛋白构建体的仅由脯氨酸和丙氨酸氨基酸残基组成的生物合成的无规卷曲多肽/多肽区段优选不进行其它(化学)修·饰,例如它们优选不是糖基化或羟基化的。应当注意到,某些天然存在的蛋白或从测序的天然存在核酸段推定的假定蛋白被描述为包含相对高(即,高于平均值)含量的脯氨酸和丙氨酸。例如,已对于利什曼虫(Leishmania)主要株 Friedlin 描述了同源假定蛋白(Ivens (2005) Science 309,436-442.)。所公开的包含1514个三联密码子的读码框包括一段412个三联密码子,其由240个Ala、132个Pro、34个Lys和4个Val密码子组成。Lys残基在生理缓冲液条件下是带正电的,它们几乎均匀地分布在该序列中,这提示增溶效果。然而,从本文公开内容能够明显判断出,这种源自天然存在的核酸分子或开放读码框、包含高于平均值的高脯氨酸和丙氨酸含量的同源假定蛋白不是本发明的一部分。本发明是基于下述事实提供了在医学/药物领域特别有用的相当大的无规卷曲多肽或多肽区段,其不在自然中以分离的形式存在,并且其包含仅由脯氨酸和丙氨酸残基组成的氨基酸序列,其中所述氨基酸序列由约50、约100、约150、约200、约250、约300、约350、约400至约3000个脯氨酸(Pro)和丙氨酸(Ala)残基组成。本文所述的不在自然中以分离的形式存在的分离的生物合成无规卷曲多肽或多肽区段也包含在本文公开的在药学、医学和/或医疗领域中特别有用的生物活性异源蛋白或蛋白构建体中。这些生物活性异源蛋白/蛋白构建体包含作为所述至少两个结构域中的至少一个结构域的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸残基组成的氨基酸序列,其中所述氨基酸序列由约50、约100、约150、约200、约250、约300、约350、约400至约3000个脯氨酸(Pro)和丙氨酸(Ala)残基组成。另外,阿拉伯半乳聚糖蛋白(AGP)(富含Pro蛋白)和伸展蛋白属于一大组称为富含羟基脯氨酸(Hyp)的糖蛋白(HRGPs)的糖蛋白,其在植物界广泛表达。包含Ala-PiO重复(AP) 51的一种所述AGP基序在转基因拟南芥(Arabidopsis thaliana)中被表达为具有N末端信号序列和C末端绿色荧光蛋白的合成糖模块肽,并被作为脯氨酰羟化酶和后续的羟基脯氨酸残基O-糖基化的底物得到研究(Est6vez (2006) Plant Physiol. 142,458-470)。此外,所公开的能与水分子形成氢键的羟化和/或糖基化Pro侧链看起来具有增溶效果。
应当注意到,本文所述的“包含作为(至少)一个结构域的生物合成的无规卷曲多肽或肽区段的生物活性蛋白或蛋白构建体,所述无规卷曲多肽或肽区段包含仅由脯氨酸和丙氨酸残基组成的氨基酸序列”涉及在自然界中通常不存在的并因此是“异源”的蛋白或蛋白构建体。此外,相比于植物界中所述的富含脯氨酸的序列,本文所述的生物合成的无规卷曲多肽/多肽区段优选不是化学修饰的,即,它们优选不是糖基化或羟基化的。本发明的生物合成的无规卷曲多肽或多肽区段的特别优势在于它们固有亲水、但不带电的性质。因此,作为本文所述的生物合成的无规卷曲多肽或多肽段中的"次要"氨基酸(除脯氨酸和丙氨酸之外),这些氨基酸优选不具有疏水性侧链(例如Val、Ile、Leu、Met>Phe>Tyr或Trp)和/或不具有带电侧链(例如Lys、Arg、Asp或Glu)。本发明考虑到(当这些个体氨基酸包含于本发明生物合成的无规卷曲多肽/多肽区段中时),本文所述的生物合成的无规卷曲多肽(或其区段)中具有疏水性侧链(例如Val,He, Leu, Met, Phe,Tyr或Trp)和/或具有带电侧链(例如Lys, Arg, Asp或Glu)的每种个体氨基酸的总含量不超过 8%、7%、6%、5%、4%、3%、2% 或 1%。·
本发明的生物合成的无规卷曲多肽/氨基酸序列可以包含个体构成部分的多连体,所述个体模块包含序列(Pro)x-(Ala)y的组合的脯氨酸/丙氨酸段,其中x可具有I至优选15、更优选I至10、甚至更优选I至5的整数值,y可具有I至优选15、更优选I至10、甚至更优选I至5的整数值,并且X和y在相继的构成部分之间可以不同。所述X和y也可以是以下整数:1、2、3、4、5、6、7、8、9、10、11、12、13、14 或 15。能在水性溶液中或在生理条件下形成无规卷曲构象的氨基酸序列/多肽可以具有式⑴[ProxAlayJn其中X独立选自整数I至5。此外,对于每个n, y独立选自整数I至5。最后,η是任何整数,条件是无规卷曲多肽(或其区段)/氨基酸序列优选由至少约50、至少约100、至少约150、至少约200、至少约250、至少约300、至少约350、至少约400个氨基酸残基和最高至约3000个氨基酸残基组成。在该方面还应当注意到,包含上述多连体或具有上述式(I)的多肽/氨基酸序列应当优选具有上文所限定和解释的总长度和/或脯氨酸/丙氨酸含量,即,由约50、约100、约150、约200、约250、约300、约350、约400至约3000个氨基酸组成和/或包含大于约10%且小于约75%的脯氨酸残基。此外,在必要的变通下,上文对于该方面给出的所有限定也适用于此处。本发明还涉及包含选自以下的氨基酸段的无规卷曲多肽(多肽区段)/氨基酸序列AAPAAPAPAAPAAPAPAAPA (SEQ ID NO:I) ;AAPAAAPAPAAPAAPAPAAP (SEQID NO:2) ;AAAPAAAPAAAPAAAPAAAP(SEQ ID NO:3 是[Pro1Ala3]5 的一个实例);AAPAAPAAPAAPAAPAAPAAPAAP (SEQ ID NO :4) ;APAAAPAPAAAPAPAAAPAPAAAP (SEQ ID NO :5);AAAPAAPAAPPAAAAPAAPAAPPA(SEQ ID NO:6)和 APAPAPAPAPAPAPAPAPAP(SEQ ID NO: 51是[Pro1AlaJltl的一个实例)或作为这些序列整体或这些序列的一部分的这些序列的环状排列形式或多聚体。因此,无规卷曲多肽(其多肽区段)/氨基酸序列可以包含氨基酸段 AAPAAPAPAAPAAPAPAAPA(SEQ ID NO: I), AAPAAPAPAAPAAPAPAAPA(SEQ IDNO:I) ;AAPAAAPAPAAPAAPAPAAP(SEQ ID NO:2) ;AAAPAAAPAAAPAAAPAAAP(SEQ ID NO:3);AAPAAPAAPAAPAAPAAPAAPAAP(SEQ ID NO :4) ;APAAAPAPAAAPAPAAAPAPAAAP(SEQ ID NO :5);AAAPAAPAAPPAAAAPAAPAAPPA(SEQ ID NO:6)和 APAPAPAPAPAPAPAPAPAP(SEQ ID NO:51),以及这些基序的组合或这些基序的片段和部分的组合,只要所产生的生物合成的无规卷曲多肽仅由脯氨酸和丙氨酸氨基酸残基组成,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。此外,根据本发明,可以使用上述氨基酸序列的环状排列形式。可以容易地产生例如AAPAAPAPAAPAAPAPAAPA (SEQ ID NO: I)的示例性的环状排列形式,例如通过去除第一丙氨酸并在上述序列的末端添加另一丙氨酸。SEQ ID NO: I的这样的环状排列形式会是APAAPAPAAPAAPAPAAPAA (SEQ ID NO: 7)。此外,SEQ ID NO: I的环状排列形式的非限制性实例是PAAPAPAAPAAPAPAAPAAA(SEQ ID NO:8),AAPAPAAPAAPAPAAPAAAP(SEQ ID NO:9),
APAPAAPAAPAPAAPAAAPA(SEQ ID NO:10),PAPAAPAAPAPAAPAAAPAA(SEQ ID NO:11),APAAPAAPAPAAPAAAPAAP(SEQ ID NO:12),PAAPAAPAPAAPAAAPAAPA(SEQ ID NO:13),AAPAAPAPAAPAAAPAAPAP(SEQ ID NO:14),APAAPAPAAPAAAPAAPAPA(SEQ ID NO:15),PAAPAPAAPAAAPAAPAPAA(SEQ ID NO: 16)等。基于本发明的教导,本领域技术人员能容易地制备SEQ ID NO:2,SEQ ID NO:3,SEQID NO:4、SEQ ID NO: 5、SEQ ID NO:6 和 SEQ ID NO: 51 (所述 SEQ ID No: 51 完全基于 “AP”重复,和环状排列形式可以完全基于“PA”或“AP”重复/构成部分)所示的氨基酸段的相应环状排列形式。这类环状排列形式还可以被认为是本文提供的多肽/氨基酸序列的其它“模块” /”构成部分”等的实例,因而可用于本发明。对于本领域技术人员显而易见的是,本文提供的氨基酸段的“模块”和(较短的)片段或环状排列形式可以被用作本文所限定的无规卷曲多肽(或其区段)/氨基酸序列的“模块”、“重复”和/或构成部分。按照上文,形成无规卷曲构象的无规卷曲多肽/氨基酸序列可以包含任何上述氨基酸段(或其环状排列形式或片段)的多聚体,优选SEQ ID NO: K SEQ ID NO:2, SEQ IDN0:3、SEQ ID NO:4, SEQ ID N0:5、SEQ ID N0:6 和 SEQ ID N0:51 所示的氨基酸段的多聚体。应当注意到,这些序列并非意图限制本发明。此外,包含上述氨基酸段(或其片段)、环状突变形式(或其片段)的多肽/氨基酸序列应当优选具有上文所限定和解释的总长度和/或脯氨酸/丙氨酸含量,即,由约50、约100、约150、约200、约250、约300、约350、约400至约3000个氨基酸组成和/或包含大于约10%且小于约75%的脯氨酸残基。在必要的变通下,上文对于该方面给出的所有限定也适用于此处。此外,术语“片段”在上文已有定义。如上文所述,对于本发明,意外发现本文提供的生物合成的无规卷曲多肽(或多肽区段)/聚合物的特征为相对较大的流体动力学体积。通过分析凝胶过滤(也称为尺寸排阻色谱,SEC)可以容易地测定该流体动力学体积(也称为表观尺寸)。优选地,无规卷曲多肽(或其区段)具有的表观尺寸为至少lOkDa、优选至少25kDa、更优选至少50kDa、甚至更优选至少lOOkDa、特别优选至少200kDa,最优选至少400kDa。本领域技术人员能容易地测定具体蛋白的流体动力学体积。这些方法可以包括下文所示例的动态/静态光散射、分析超离心或分析凝胶过滤。分析凝胶过滤代表本领域已知的用于测量大分子的流体动力学体积的方法。或者,球形多肽的流体动力学体积可以通过其分子量来估计(Creighton(1993)同上)。如本文所述,相对于基于分子量对于相应的折叠球形蛋白所估计出的流体动力学体积,本发明的优选由至少约50、至少约100、至少约150、至少约200、至少约250、至少约300、至少约350、至少约400至约3000个脯氨酸和丙氨酸氨基酸残基组成并具有无规卷曲构象的多肽的流体动力学体积意想不到地表现出高值。下文涉及生物活性异源蛋白或蛋白构建体,其特别包含上文描述和限定的、代表本发明优选实施方案的生物合成的无规卷曲多肽(或其区段)。在不被理论束缚的情况下,在本发明中意外地发现,本文提供的仅由脯氨酸和丙氨酸组成的生物合成的无规卷曲多肽段能提供的流体动力学体积甚至高于具有相同氨基酸残基总数、但仅由脯氨酸、丙氨酸和丝氨酸组成的相应的生物合成的无规卷曲段(如WO 2008/155134中所提供的)的流体动力学体积。
诸如血清白蛋白(HSA)和免疫球蛋白(Ig)(包括人源化抗体)的常见人血浆蛋白表现出长的半衰期,通常为2至3周,这归因于它们与新生Fe受体(FcRn)的特异性相互作用,从而导致胞内体再循环(Ghetie (2002) Immunol Res,25:97-113)。相比之下,大部分其它药学上感兴趣的蛋白,特别是重组抗体片段、激素、干扰素等,会遭受快速(血液)清除。这对于大小小于约70kDa的肾过滤的阈值的蛋白是特别明显的(Caliceti (2003)Adv DrugDeliv Rev 55:1261-1277)。在这些情况下,未修饰的药学蛋白的血衆半衰期可以显著小于I小时,因此使其基本无法用于大部分治疗应用。为了实现持续的药理学作用以及改善的患者依从性(使所需的给药间隔延长至数天或数周),为了生物药学药物开发目的之前已经建立了数种策略。第一,已经通过下述方式利用了天然血浆蛋白的再循环机制产生具有Ig的Fe部分的融合蛋白(例如Enbrel ,其是TNFa受体的细胞外结构域和人IgGi的杂合体(Goldenberg(1999)Clin Ther 21:75-87))或具有血清白蛋白的融合蛋白(例如Albuferond (albinterferon alfa_2b,ZALBIN , |QlJI..rHRON^ ),其是 IFNa 与 HAS的对应融合物(Osborn(2002) JPharmacol Exp Ther 303:540-548))。还也以间接的方式使用具有600 μ M的高血浆浓度的白蛋白,其作为配置了白蛋白结合功能的生物药物的载体,例如,通过与来自链球菌蛋白G的细菌白蛋白结合结构域(ABD)进行融合(Makrides (1996)J Pharmacol Exp Ther 277:534-542)或与从噬菌体展示文库针对HAS选择的肽进行融合(Dennis(2002)J Biol Chem,277:35035-35043 ;Nguyen(2006)Protein Eng Des Sel19:291-297)。第二,延长生物药物的血浆半衰期的本质上不同的方法是与高度溶剂化的和生理上惰性的化学聚合物缀合,从而有效增大治疗蛋白的流体动力学半径,使其超过约3 - 5nm的肾小球孔径(Caliceti (2003)同上)。在生物化学上的温和条件下与聚乙二醇(PEG)的活化衍生物的共价偶联已取得一定成功,并且目前正用于数种获批准的药物,所述共价偶联是通过Lys侧链随机地偶联(Clark (1996) J Biol Chem 271:21969-21977)或借助于特别引入的 Cys 残基(Rosendahl (2005) BioProcess International: 52-60)。已经取得了相应的优势,特别是在具有具体药学活性的小蛋白中,例如Pegasys ,其是化学peg化的重组IFNa_2a(Harris(2003)Nat Rev Drug Discov, 2:214-221 ;ffalsh(2003)Nat Biotechnol21:865-870)。然而,生物活性蛋白与合成聚合物的化学偶联在生物药物研发和生产方面具有缺点。合适的PEG衍生物是昂贵的,特别是需要高纯度时,并且它们与重组蛋白的缀合需要额外的体外加工和纯化步骤,这会降低产率并提高生产成本。事实上,PEG经常被醛类和过氧化物污染(Ray (1985) Anal Biochem 146:307-312),并且其在氧的存在下贮存时本质上易于化学降解。另外,如果治疗蛋白的生物化学活性位点附近的氨基酸侧链在PEG化过程中被修饰,则该治疗蛋白的药物功能可能受到影响。此外,与合成聚合物的化学偶联通常产生分子的异质混合物,这可能会表现出明显的体内活性变化。第三,已经提议使用生物活性蛋白的糖基化类似物来延长血浆半衰期,其中引入新的N连接糖基化共有序列;参见WO 02/02597 ;Perlman(2003) J Clin Endocrinol Metab88:2327-2335 ;或 Elliott (2003)Nat Biotechnol 21:414-420)。然而,所述糖工程化蛋白 表现出改变的体内活性,这表明新的碳水化合物侧链影响工程化蛋白的生物活性。此外,额外的碳水化合物侧链可能会增加产生的生物活性分子的抗原性,这会明显增加安全性问题。此外,据报道,包含克氏锥虫来源的人工重复性序列PSTAD的融合蛋白能诱导反式唾液酸酶的延长的血浆半衰期(Alvarez (2004) JBC 279:3375-3381)。然而,据报道,这样的克氏锥虫来源的重复会诱导体液免疫应答(Alvarez (2004)同上)。因此,需要延长生物活性蛋白的作用的备选策略。意外地发现,本文公开的和按照本发明仅由脯氨酸和丙氨酸组成的生物合成的氨基酸序列/多肽能采取无规卷曲构象,特别是在生理条件下。因此,它们是提供下文限定的生物活性蛋白/多肽的“第二结构域”的有利的分子,即,所述生物活性蛋白/多肽包含在生理条件下形成无规卷曲构象并从而能为生物活性(“功能”)蛋白或多肽介导增加的体内和/或体外稳定性,特别是增加的血浆半衰期的多肽段。与所述无规卷曲结构域融合的功能蛋白的流体动力学体积显著增加,这可以通过使用本文所述的标准方法进行估计。因为无规卷曲结构域被认为不会干扰生物活性蛋白的第一结构域的生物活性,所以与其融合的感兴趣的功能蛋白所介导的生物活性基本上能被保留。此外,形成本文公开的无规卷曲结构域的氨基酸聚合物/多肽被认为是生物学上惰性很大的,特别是在血浆中的蛋白水解、免疫原性、等电点/静电行为、与细胞表面受体的结合以及内化的方面,但是其仍是生物可降解的,这会提供超过诸如PEG的合成聚合物的清楚优势。按照上文,本发明涉及包含本文所述的生物合成的无规卷曲多肽的生物活性蛋白。包含本文所述的生物合成的无规卷曲多肽的生物活性蛋白/蛋白构建体是异源生物活性蛋白/蛋白构建体。具体而言,本文还公开了包含至少两个结构域或由至少两个结构域组成的生物活性异源蛋白,其中(a)所述至少两个结构域的第一结构域包含具有和/或介导所述生物活性的氨基酸序列或由具有和/或介导所述生物活性的氨基酸序列组成;和(b)所述至少两个结构域的第二结构域包含本文所述的和限定的无规卷曲多肽或多肽区段或由本文所述的和限定的无规卷曲多肽或多肽区段组成。应当注意到,按照本发明,所述“第一结构域”和所述“第二结构域”涉及这样的蛋白段,所述蛋白段在同一蛋白中不是天然存在的或预期不是自然界存在的编码核酸序列(例如,开放读码框)所编码的同一假定蛋白的一部分。在必要的变通下,上文对于无规卷曲多肽或其多肽区段的给出的限定和解释也适用于包含所述无规卷曲多肽(或其多肽区段)的生物活性蛋白。优选地,所述无规卷曲构象介导所述生物活性蛋白的增加的体内和/或体外稳定性,例如生物样品中或生理环境中的体内和/或体外稳定性。例如,本文中考虑到,包含本文所限定的能在水性溶液中或在生理条件下采取无规卷曲构象的其它“第二结构域”(例如,由约200或约400或约600个氨基酸残基组成并包含作为“构成部分”的 PA#1/SEQ ID N0:1、PA#2/SEQ ID N0:2、PA#3/SEQ ID N0:3、PA#4/SEQ ID NO:4, PA#5/SEQ ID NO:5、PA#6/SEQ ID NO:6 和 / 或 P1A1/SEQ ID N0:51 的聚合物)的蛋白与缺少所述无规卷曲构象的对照相比,具有有利的血清稳定性或血浆半衰期,甚至在体内,(特别是在静脉内给药时)。 在WO 2008/155134(如上文所讨论)中证实,包含具有能采取无规卷曲构象的氨基酸序列的结构域的生物活性蛋白具有增加的体内和/或体外稳定性。具体而言,WO2008/155134所公开的无规卷曲结构域由脯氨酸、丙氨酸和丝氨酸(PAS)残基组成。该现有技术文件中描述了这三种残基的存在,作为在水性溶液中形成稳定和可溶性无规卷曲的基本要求。如上文的背景部分所讨论的,WO 2007/103515描述了无组织的重组聚合物,其包含多种氨基酸作为主要组成部分,特别是甘氨酸、天冬氨酸、丙氨酸、丝氨酸、苏氨酸、谷氨酸和脯氨酸。然而,相比于术语“生物合成”和“无规卷曲”,术语“无组织的重组聚合物”没有公认的清楚含义。上文还描述了 WO 2006/081249。该文件描述了蛋白缀合物,其包含与包含2至500个氨基酸重复单元的多肽偶联的生物活性蛋白,所述氨基酸重复具有作为主要组成部分的Gly、Asn和Gln和作为次要组成部分的Ser、Thr> Asp、Gin、Glu、His和Asn。与未缀合的生物活性蛋白相比,所述蛋白缀合物被描述为具有增加的或减少的血浆半衰期。然而,WO2006/081249未提供任何教导来预测具体的氨基酸重复能减少还是增加缀合物的血浆半衰期。此外,WO 2006/081249未教导或暗示,当缀合的蛋白包含本发明所示的形成无规卷曲构象的氨基酸重复时,蛋白的血浆半衰期能增加。此外,WO 2006/081249所公开的氨基酸重复包含至少两种选自Gly、Asn和Gln的残基,这与本发明的生物合成的无规卷曲多肽明显不同,本发明的生物合成的无规卷曲多肽包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列。令人意想不到的是,本申请发现,本文提供的生物合成的无规卷曲氨基酸序列,与现有技术相比,仅包含脯氨酸和丙氨酸残基(即,其优选不包含大量的任何其它氨基酸,也不包含大量的丝氨酸或根本不包含丝氨酸),并且也形成有效的无规卷曲结构。考虑到WO2008/155134的公开内容,S卩,具有仅由丝氨酸和丙氨酸(SA)残基组成的结构域(即,缺少脯氨酸残基)的融合蛋白,本申请的发现是特别意想不到的,从而表明这样仅包含两种氨基酸的结构域不能形成无规卷曲,而是形成β折叠结构。这些丝氨酸-丙氨酸结构域也未表现出对于“PAS”所观察到的增加的流体动力学体积,或特别是未表现出对于本文提供的“Ρ/Α”序列所观察到的增加的流体动力学体积。
本文所用的术语〃生物活性〃描述了某一物质对生命体的生物效应。因此,本文所用的术语"生物活性蛋白"涉及能在暴露于所述蛋白或多肽的活的细胞/生物体中诱导生物效应的蛋白。然而,应当注意到,对于本发明,术语"生物活性蛋白"涉及包含具有和/或介导所述生物活性的氨基酸序列(所述第一结构域)和能采取/形成无规卷曲构象并仅由脯氨酸和丙氨酸组成的本发明氨基酸序列(所述第二结构域)的本发明完整蛋白。因此,本文所用的术语〃具有和/或介导生物活性的氨基酸序列〃或〃具有生物活性的氨基酸序列"涉及上文所限定的本发明的生物活性蛋白的"第一结构域〃,其介导或具有或能介导或能具有上文所限定的"生物活性〃。术语"具有和/或介导生物活性的氨基酸序列"或"具有生物活性的氨基酸序列"还包括在体内或体外半衰期需要被延长的任何感兴趣的蛋白(及其功能片段,例如抗体片段、包含膜受体的细胞外或细胞内结构域的片段、生长因子或细胞因子等的截短形式)。在本发明的一个实施方案中,本发明的具有和/或介导生物活性的氨基酸序列可以来自任何"感兴趣的蛋白〃,即,药学或生物学所关注的任何蛋白或可用作治疗剂/诊断剂的任何蛋白。因此,生物活性蛋白可以包含第一结构域,所述第一结构域包含来源于天然产生 的多肽或通过重组DNA技术产生的多肽的生物活性氨基酸序列。在优选的实施方案中,感兴趣的蛋白可以选自结合蛋白/结合分子、免疫球蛋白、抗体片段、转运蛋白、膜受体、诸如细胞因子、生长因子、激素或酶等的信号蛋白/肽。如上文所解释的,包含于生物活性蛋白的第二结构域中的无规卷曲多肽(或多肽区段)形成无规卷曲构象,特别是在生理条件下。这对于可以形成待给予个体或患者的药物组合物的一部分的生物活性蛋白是特别重要的。应当注意到,本发明的生物活性蛋白的生物合成的无规卷曲结构域(所述“第二结构域”)天然地(即,在生理条件下)采取/形成/具有无规卷曲构象,特别是在体内以及给予需要医学干预的哺乳动物或人类患者时。相比之下,本领域已知的是,具有非随机二级结构和/或三级结构作为天然构象的蛋白倾向于在非生理条件下(即,在变性条件下)采取无规卷曲构象。然而,与包含本发明的无规卷曲多肽的生物活性蛋白相比,这样的变性蛋白具有完全不同的性质。因此,本发明的主旨是,本文提供的“生物活性蛋白”和融合蛋白/融合构建体的生物活性部分,当与本发明生物合成的无规卷曲多肽(或多肽区段)结合和/或连接时,也保持它们的生物功能。此外,无规卷曲多肽(或多肽区段)在生理条件下仍然保持可溶性。因此,还考虑至IJ,本发明的蛋白构建体(包含上文所限定的“第一结构域”和“第二结构域”)可以包含暂时或暂且不处于无规卷曲构象的“第二”无规卷曲形成/采取结构域,例如,当处于诸如冻干的或干燥的组合物的某些组合物形式时。然而,重要的是,本发明蛋白构建体的这类“第二结构域”,当例如在相应的缓冲液(优选“生理”缓冲液/赋形剂和/或溶剂)中复原之后,能再次采取本文所限定的无规卷曲构象。所述“第二结构域”能(如果需要,则在相应的复原之后)介导本发明生物活性蛋白的增加的体内和/或体外稳定性。本文优选的是,本文所限定的“第二结构域”由本发明的无规卷曲多肽(或多肽区段)组成。本文所用的术语"结构域"涉及能自主采取具体结构和/或功能的任何氨基酸序列区域/部分。因此,对于本发明,"结构域"可以代表功能结构域或结构结构域。如本文所述,本发明的蛋白包含至少一个具有和/或介导生物活性的结构域/部分和至少一个形成无规卷曲构象的结构域/部分。然而,本发明的蛋白也可以由大于两个结构域组成,并且可以包含例如本文所限定的两个结构域/部分之间的额外的连接子或间隔子结构或另一结构域/部分,例如蛋白酶敏感切割位点、亲和标签(例如His6-标签或Strep标签)、信号肽、停留肽、靶向肽(例如膜转位肽)或其它效应结构域,例如用于与抗肿瘤毒素相关的肿瘤靶向的抗体片段或用于前药活化的酶等。在另一个实施方案中,通过分析凝胶过滤(也称为尺寸排阻色谱,SEC)测定,本发明的生物活性蛋白具有的流体动力学体积为至少50kDa、优选至少70kDa、更优选至少80kDa、甚至更优选至少lOOkDa、特别优选至少125kDa,最优选至少150kDa。本领域技术人员能容易地测定具体蛋白的流体动力学体积。示例性的方法在上文关于无规卷曲多肽中已有描述。本领域技术人员还能根据本发明的生物活性蛋白容易地调整这些方法。如下文所述,相比于基于氨基酸残基的分子量或分子数/组成,对相应的折叠球形蛋白所估计出的流体动力学体积,本发明的包含上文所限定的第二结构域(即,包含本文提供的无规卷曲多肽(或其区段)或由本文提供的无规卷曲多肽(或其区段)组成的结构域)的生物活性蛋白的流体动力学体积被证实具有意想不到的大流体动力学体积。 应当注意到,包含〃具有和/或介导生物活性的氨基酸序列〃的第一结构域在另一多肽或氨基酸序列的情况下或与另一多肽或氨基酸序列结合之后还可以保留其生物活性。例如,抗体的Fab片段,例如抗肿瘤抗体赫塞汀(Herceptin)的一个Fab片段(Eigenbrot (1993) J. Mol. Biol. 229:969-995),由两个不同多肽链组成,即免疫球蛋白轻链和免疫球蛋白重链的片段,它们还可以通过链间二硫键被连接起来。按照本发明,将那些链中的一个(例如通过基因融合)与无规卷曲多肽(或多肽区段)连接,同时通过与其它链结合来重建完整的生物活性蛋白就可以是足够的。例如,可以通过以下实现所述重建,如后文实施例所述的不同多肽(一方面是一条链与无规卷曲多肽的融合蛋白,另一方便是其它链)在相同宿主细胞的共表达,或体外重建,例如,作为再折叠方案的一部分。因此,这样的蛋白(包含两个单独的多肽链)也被视为本发明的生物活性蛋白。在这样的情况下,本文所限定的第一结构域可以包含仅非共价连接的两个单独的多肽链。此夕卜,生物活性蛋白/结构域的单独链可以各自都与无规卷曲多肽(或多肽区段)连接。除抗体片段之外,还有很多其它由数个相关的多肽链组成并适合于本发明的感兴趣的同寡聚蛋白或异寡聚蛋白(例如,胰岛素、血红蛋白等)。本文所用的术语"结合蛋白"涉及这样的分子,其能特异性地与可能的结合伴侣相互作用,从而能将所述可能的结合伴侣和作为所述可能结合伴侣的多个不同分子区别至这样的程度,即在所述作为可能的结合伴侣的多个不同分子的库中,仅有所述可能的结合伴侣是结合的或显著结合的。测定结合蛋白和可能的结合伴侣之间的结合的方法是本领域已知的,并且能常规地实施,例如,通过使用ELISA、等温滴定量热法、平衡透析法、拉下实验(pull down assay)、表面等离子体共振或Biacore装置。可用于本发明的示例性的结合蛋白/结合分子包括但不限于,抗体、抗体片段,例如Fab片段、F(ab' )2片段、单链可变片段(scFv)、抗体的分离的可变区(VL和/或VH区)、CDR、单结构域抗体/免疫球蛋白、CDR衍生的肽模拟物、凝集素、免疫球蛋白结构域、纤连蛋白结构域、蛋白A结构域、SH3结构域、锚蛋白重复结构域、脂质运载蛋白(Iipocalin)或各种支架衍生的结合蛋白,例如,如Skerra(2000)J Mol Recognit 13:167-187, Gebauer(2009)Curr Opin Chem Biol 13:245-255,Binz (2005)Nat Biotechnol 23:1257-1268 或 Nelson(2009)Nat Biotechnol 27:331-337中所述。可用于本发明的其它示例性的感兴趣的生物活性蛋白(特别是生物活性蛋白的第一结构域中包含的或组成/作为生物活性蛋白的第一结构域的蛋白)包括但不限于,粒细胞集落刺激因子、人生长激素、α-干扰素、β-干扰素、Y-干扰素、λ-干扰素、肿瘤坏死因子、红细胞生成素、凝血因子(例如凝血因子VIII、凝血因子Vila、凝血因子IX)、gpl20/gpl60、可溶性肿瘤坏死因子I和II受体、溶栓剂(例如瑞替普酶)、具有代谢效应的肽(例如GLP-I或艾塞那肽-4)、免疫抑制/免疫调节蛋白(例如白介素-I受体拮抗剂或阿那白滞素、白介素-2和中性粒细胞明胶酶相关脂质运载蛋白)或其它天然的或工程化的脂质运载蛋白或例如,Walsh (2003)Nat Biotechnol 21:865-870 或 Walsh (2004)Eur JPharm Biopharm 58:185-196 列出的蛋白或化合物,或诸如 http: //www.biopharma.com/approvals, html或http: Il www.drugbank.ca.的在线数据库列出的蛋白或化合物。可用于本发明的其它生物活性蛋白(特别是生物活性蛋白的第一结构域中包含的或组成/作为生物活性蛋白的第一结构域的蛋白)特别是卵泡刺激素、葡糖脑苷脂酶、胸腺素α I、胰高血糖素、生长激素抑制素、腺苷脱氨酶、白介素11、hematide、瘦素、白介素-20、白介素-22 受体α亚基(IL_22ra)、白介素-22、透明质酸酶、成纤维细胞生长因子18、成纤维细胞生长因子21、胰高血糖素样肽I、骨保护素、IL-18结合蛋白、生长激素释放因子、可溶性TACI受体、血小板反应蛋白-I、可溶性VEGF受体Flt-1、α-半乳糖苷酶A、肌骨素拮抗剂、抑胃多肽、α-I抗胰蛋白酶、IL-4突变蛋白等。从本文公开的内容可以显而易见的是,本发明还涉及包含生物合成的无规卷曲脯氨酸/丙氨酸多肽或脯氨酸/丙氨酸多肽区段和药学上或医学上有用的分子,例如小分子、肽或生物大分子,例如蛋白、核酸、碳水化合物、脂质囊泡等,特别是药学上或医学上有用的蛋白,例如(但不限于)结合蛋白/结合分子、免疫球蛋白、抗体片段、转运蛋白、膜受体、信号蛋白/肽、细胞因子、生长因子、激素或酶等,并且它们可以被包含在本文所限定的药物构建体中,但它们还可以是本文所限定的包含所限定的至少两个结构域或由所限定的至少两个结构域组成的生物活性异源蛋白的一部分。在这样的情况下,所述具体的药学上或医学上有用的蛋白(或其功能片段)可以是包含具有和/或介导所述生物活性的氨基酸序列或由具有和/或介导所述生物活性的氨基酸序列组成的所述至少两个结构域的“第一结构域”。在这样的情况下,功能片段是所述药学上或医学上有用的蛋白的片段,所述片段仍能在体内和/或体外引发所需的生物学或药学应答和/或仍具有或介导所需的生物活性。在所述第一和所述第二结构域之间插入的上述多肽连接子/间隔子优选包含多个亲水性、肽键连接的氨基酸,其与两个结构域共价连接。在另一个实施方案中,所述多肽连接子/间隔子包含血浆蛋白酶切割位点,其允许包含具有和/或介导生物活性的多肽的所述第一结构域的受控释放。可以容易地鉴定出不同类型或长度的连接子,而获得具体蛋白的的最佳生物活性。在优选的实施方案中,本发明的生物活性蛋白是融合蛋白。本文所述的融合蛋白可以在单个多结构域多肽中包含至少一个能介导生物活性的结构域和至少一个包含本文所述的生物合成的无规卷曲多肽(或多肽区段)的其它结构域。此外,应当注意到,本发明不限于其中一个结构域介导生物活性的融合蛋白。本文还提供了其它“融合蛋白” /”融合构建体”,其中一个部分/结构域是本发明的脯氨酸/丙氨酸无规卷曲多肽/聚合物或包含本发明的脯氨酸/丙氨酸无规卷曲多肽/聚合物,并且其它部分/结构域包含另一蛋白段/结构。特别是,对于融合蛋白,本发明的无规卷曲多肽(或多肽区段)不一定在其氨基或羧基末端携带Pr0或Ala残基。在可选实施方案中,本发明的生物活性蛋白可以代表蛋白缀合物,其中感兴趣的蛋白或具有和/或介导生物活性的多肽/多肽段/肽/氨基酸序列通过非肽键与形成/采取无规卷曲构象的氨基酸序列、特别是本文提供的且仅由脯氨酸和丙氨酸残基组成的无规卷曲多肽(或多肽区段)缀合。可用于将蛋白与包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列的生物合成的无规卷曲多肽或多肽区段进行交联的非肽键是本领域已知的,其中所述氨基酸序列由本文提供的至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。所述非肽键可以包括例如Cys侧链之间的二硫键、硫醚键或由化学交联子产生的非肽共价键,例如双琥珀酰亚胺辛二酸酯(DSS)或磺基琥珀酰亚胺4-[P-马来酰亚胺苯基]丁酸酯(硫代SMPB)、金属螯合/复合基团,以及非共价蛋白-蛋白相互作用。应当注意到,本发明的〃生物活性蛋白〃还可以包含多于一个〃具有和/或介导·生物活性的氨基酸序列〃。此外,生物活性蛋白还可以包含大于生物合成的无规卷曲多肽(或其区段)。在最简单的情况下,生物活性蛋白由两个结构域组成,即,包含具有和/或介导生物活性的氨基酸序列的第一结构域和包含生物合成的多肽(或其区段)的第二结构域。应当注意到,本发明不限于与本文公开的生物合成的无规卷曲多肽或多肽区段连接的“生物学上或治疗上的活性蛋白”,所述生物合成的无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。此外,在例如食品或饮料工业、美容用品工业等的其它工业中有重要作用其它感兴趣的蛋白或分子可以通过本文提供的方式和方法来制备。本领域技术人员知晓,可以将"包含具有和/或介导生物活性的氨基酸序列的结构域"和"包含在本发明的生物活性蛋白中包含的无规卷曲多肽(或其区段)的第二结构域〃以具体的顺序组织在一起。因此,在本发明中,本发明生物活性多肽的所述“第一”和“第二”结构域的顺序可以按顺序安排,由此所述“第一结构域”(即,感兴趣的蛋白;“具有和/或介导所述生物活性的氨基酸序列”)位于生物活性蛋白的氨基(N-)末端,且所述“第二结构域”(即,包含本文提供的无规卷曲多肽(或其区段)的结构域)位于生物活性蛋白的羧基(C-)末端。然而,该顺序还可以颠倒,例如所述“第一结构域”(即,感兴趣的蛋白;“具有和/或介导所述生物活性的氨基酸序列”)位于生物活性蛋白的羧基(C-)末端,所述“第二结构域”(即,包含本文提供的无规卷曲多肽(或其区段)的结构域)位于生物活性蛋白的氨基(N-)末端。如果生物活性蛋白仅由一个第一结构域和一个第二结构域组成,则结构域顺序因此可以为(从N末端至C末端)第一结构域(具有和/或介导生物活性的氨基酸序列)_第二结构域(无规卷曲多肽(或其区段))。反之亦然,结构域顺序可以为(从N末端至C末端) 第二结构域(无规卷曲多肽(或其区段))_第一结构域(具有和/或介导生物活性的氨基酸序列)。还考虑到,多于一个包含具有和/或介导所述生物活性的氨基酸序列或由具有和/或介导所述生物活性的氨基酸序列组成的结构域可用于本发明的蛋白构建体。例如,生物活性蛋白可以包含两个“第一结构域”,即,两个具有和/或介导生物活性的具体氨基酸序列,由此这种生物活性可以是相同的或不同的活性。如果生物活性蛋白由两个这样的“第一结构域”即两个具有和/或介导生物活性的具体氨基酸序列和一个“第二结构域”(包含生物合成的无规卷曲多肽(或其区段)组成,则结构域顺序可以为(从N末端至C末端)第一结构域(具有和/或介导具体生物活性的氨基酸序列)-第二结构域(无规卷曲多肽(或其区段))-第一结构域(具有和/或介导具体(任选地不同)生物活性的氨基酸序列)。相同的解释适用于生物活性蛋白包含多于一个“第二结构域”(即,生物活性蛋白包含多于一个无规卷曲多肽(或其区段)的情况。如果生物活性蛋白由两个这样的“第二结构域”即两个包含生物合成的无规卷曲多肽(或其区段)的结构域和一个“第一结构域”(包含具有和/或介导生物活性的氨基酸序列)组成,则结构域顺序可以为(从N末端至C末端)第二结构域(无规卷曲多肽(或其区段))-第一结构域(具有和/或介导具体生物活性的氨基酸序列)-第二结构域(无规卷曲多肽(或其区段))。如果生物活性蛋白包含多于一个“第二结构域”,本文考虑到,这些“第二结构域”可以是相同的或可以是不 同的。如上文所述,生物活性蛋白可以包含多于一个“第一结构域”,即,多于一个具有和/或介导生物活性的具体氨基酸序列,和多于一个“第二结构域”(生物合成的无规卷曲多肽(或其区段)),其中这些“第一结构域”可以是相同的或不同,和/或其中所述“第二结构域”可以是相同的或不同。在这些情况下,下述示例性的结构域顺序是可能的(从N末端至C末端)-第一结构域(具有和/或介导具体生物活性的氨基酸序列)_第二结构域(无规卷曲多肽(或其区段))-第一结构域(具有和/或介导具体生物活性的氨基酸序列)_第二结构域(无规卷曲多肽(或其区段));-第二结构域(无规卷曲多肽(或其区段))_第一结构域(具有和/或介导具体生物活性的氨基酸序列)-第一结构域(具有和/或介导具体生物活性的氨基酸序列)-第二结构域(无规卷曲多肽(或其区段));-第一结构域(具有和/或介导具体生物活性的氨基酸序列)_第二结构域(无规卷曲多肽(或其区段))_第二结构域(无规卷曲多肽(或其区段))_第一结构域(具有和/或介导具体生物活性的氨基酸序列);-第二结构域(无规卷曲多肽(或其区段))-第一结构域(具有和/或介导具体生物活性的氨基酸序列)-第二结构域(无规卷曲多肽(或其区段))-第一结构域(具有和/或介导具体生物活性的氨基酸序列);-第二结构域(无规卷曲多肽(或其区段))-第二结构域(无规卷曲多肽(或其区段))-第一结构域(具有和/或介导具体生物活性的氨基酸序列)-第一结构域(具有和/或介导具体生物活性的氨基酸序列);或-第一结构域(具有和/或介导具体生物活性的氨基酸序列)-第一结构域(具有和/或介导具体生物活性的氨基酸序列)-第二结构域(无规卷曲多肽(或其区段))-第二结构域(无规卷曲多肽(或其区段))。
对于本领域技术人员,其它相应的结构域顺序(特别是生物活性蛋白中包含大于两个“第一结构域”或“大于两个“第二结构域”的情况下)是容易想到的。对于本发明多肽/生物活性蛋白的所有实施方案,包含具有和/或介导所述生物活性的氨基酸序列的所述结构域,还可以是具有所需生物功能的给定蛋白的生物活性片段。因此,本文所限定的“第二结构域”(优选包含本文提供的无规卷曲多肽(或其区段))还可以位于感兴趣的蛋白的两个生物活性片段之间或两个感兴趣的蛋白的生物活性片段之间。在必要的变通下,上文对于“全长”感兴趣的蛋白/多肽(即,当氨基酸序列自身具有/介导某一生物活性时)给出的所有解释和限定适用于这样的片段。此外,上述发明不限于包含具有“生物活性功能”的“结构域”的构建体。本发明的构建体还可以包含具有其它功能的结构域,并且不限于生物活性。这些仅是本发明的实施方案,并且对于本领域技术人员显而易见的是,在不脱离本发明的主旨的情况下,能容易地制备和使用其它构建体。因此,在必要的变通下,本文关于“具有和/或介导具体生物活性的氨基酸序列”的所述适用于其它构建体,例如可用于其它技术领域的构建体,例如美容用品、食品加工、乳制品、造纸工业等。如上文所述,本发明的生物合成的多肽/聚合物也可 以用于与例如小分子等连接。此外,应当指出,术语“具有和/或介导第一生物活性的氨基酸序列”不限于具有和/或介导所述生物活性或功能的全长多肽,还包括它的生物学和/或药理学活性片段。特别是(但不仅如此),在本发明的“生物活性蛋白”中包含两个或更多个本文所限定的“第一结构域”时,还考虑到,这些“第一结构域”是或代表蛋白复合物的不同的部分或蛋白复合物的该部分的片段。如下文所例示,与缺少无规卷曲结构域的未修饰的生物活性蛋白相比,经过修饰而包含所述无规卷曲多肽的本发明的生物活性蛋白意外地表现出增加的体内和/或体外稳定性。本文所用的术语"体内稳定性"涉及被给予活体的具体物质保持生物可利用性和生物活性的能力。在体内,由于排泄、肾过滤、肝摄取、聚集、降解和/或其它代谢过程,物质可以被移除和/或失活。因此,对于本发明,具有增加的体内稳定性的生物活性蛋白通过肾(尿)或通过排泄物排泄的速度可以较慢,和/或可以更稳定对抗蛋白水解,特别是对抗生物液体(例如血液、脑脊液、腹膜液和淋巴液)中的体内蛋白水解。在一个实施方案中,生物活性蛋白的增加的体内稳定性表现为所述生物活性蛋白的延长的血浆半衰期。具体而言,与缺少第二结构域的生物活性蛋白相比,生物活性蛋白的增加的体内稳定性是包含所述第二结构域的所述生物活性蛋白的延长的血浆半衰期。测量生物活性蛋白的体内稳定性的方法是本领域已知的。如下文所例示,利用Western印迹技术或酶连接免疫吸附测定(ELISA),可以在血浆中特异性地检测生物活性蛋白。然而,本领域技术人员知晓,其它方法可以用于特异性地测定感兴趣的蛋白的血浆半衰期。这些方法包括但不限于放射性标记的感兴趣的蛋白的物理学检测。放射性标记蛋白方法(例如通过放射性碘化)是本领域已知的。本文所用的术语"增加的体外稳定性"涉及生物活性蛋白在体外环境中抵抗降解和/或聚集并保持其原始生物活性的能力。测量生物活性蛋白的生物活性的方法是本领域公知的。此外,提供了药物缀合物,其包含本文所述和限定的无规卷曲多肽或多肽区段和小分子药物,所述小分子药物与所述无规卷曲多肽或多肽区段缀合。小分子的非限制性实例是地高辛配基、荧光素、多柔比星、卡里奇霉素、喜树碱、烟曲霉素、地塞米松、格尔德霉素、紫杉醇、多西他赛、伊立替康、环孢霉素、丁丙诺啡、纳曲酮、纳洛酮、长春地辛、万古霉素、利培酮、阿立哌唑、帕洛诺司琼、格拉司琼、阿糖胞苷、NX1838、亮丙瑞林、戈舍瑞林、布舍瑞林、奥曲肽、替度鲁肽、西仑吉肽、阿巴瑞克、恩夫韦地、葛瑞林和衍生物、tubulysins、钼衍生物、α 4整合素抑制剂、反义核酸、小干扰RNAJi RNA、类固醇、DNA或RNA适体、肽、肽模拟物。通常,本发明还涉及药物构建体,所述药物构建体包含本文所限定的无规卷曲多肽或多肽区段和特别是药学上或医学上有用的分子,例如小分子、肽或生物大分子,例如蛋白、核酸、碳水化合物、脂质囊泡等。在后文的示例性实验部分(参见,例如实施例22)中,成功地制备了本发明的构建体/缀合物,在构建体中,“小化学分子”与本文公开的无规卷曲多肽缀合。因此,本发明的附图
和相应的图例中的实验信息提供了说明性的示例,其中本文公开的药物缀合物包含(i)生物合成的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成,和(ii)小分子,作为说明,所述小分子选自地高辛配基和荧光素。应当注意到,这些不是仅有的理论实例。荧光素或荧光素衍生物常 用作诊断制剂,并且医学荧光素溶液以商品名Fiuoeseite⑩、AK-FLUOR 或Fluress 销售。这些化合物显然等够受益于本文提供的方式和方法。地高辛配基形成地高辛的类固醇部分,地高辛是公知的具有心脏活性功能的植物次生代谢产物,其还含有三个洋地黄毒糖。地高辛,以及在较小的程度上说,密切相关的化合物洋地黄毒苷,被广泛用于治疗室性快速型心律失常和充血性心力衰竭(Hauptman (1999) Circulation 99:1265-1270)。所有具有心脏活性的类固醇是位于细胞质膜中的Na+/K+-ATP酶的强力且高度特异性的抑制剂,因此发挥交感神经阻滞作用或正性肌力作用。在必要的变通下,上文关于无规卷曲多肽或其多肽区段给出的限定和解释也适用于这样的药物缀合物,其包含无规卷曲多肽(或其多肽区段)和选自以下的药物(a)包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的生物活性蛋白或多肽和(b)小分子药物。本文所限定和提供的形成无规卷曲构象的氨基酸聚合物/无规卷曲多肽(或其区段)可以与小分子/小分子药物缀合。由此,小分子/小分子药物的血浆半衰期和/或可溶性可以增加,非特异性毒性可以降低,并且体内的目标细胞或结构暴露于活性药物的时间延长可以实现药效增强。无规卷曲多肽的N末端与活化的药物衍生物的位点特异性缀合,例如N-羟基琥珀酸亚胺(NHS)酯衍生物(Hermanson (1996) Bioconjugate Techniques, Academic Press, SanDiego,CA),是可能的。通常,N末端氨基可以与多种官能团化学偶联,例如醛和酮(从而形成席夫碱,例如,利用硼氢化钠或氰基硼氢化钠可以将其还原为胺)或活化的碳酸衍生物(酸酐、氯化物、酯等,从而形成酰胺)或其它反应性化学物,例如异氰酸酯、异硫氰酸酯、磺酰基氯化物等。另外,可以首先用合适的保护基修饰氨基酸聚合物/多肽的N末端,例如乙酸基、BOC 基团或 FMOC 基团(Jakubke (1996)Peptide. Spektrum AkdemischerVerlag, Heidelberg, Germany)。此外,可以用焦谷氨酰基保护氨基末端,焦谷氨酰基能形成自Pro/Ala多肽或多肽区段之前的编码的Gln氨基酸残基。在例如利用常用试剂EDC (N-(3- 二甲基氨基丙基)-N’ -乙基碳化二亚胺)和NHS使C末端羧酸基团活化后,如果药物携带例如自由氨基,则可以实现与受保护的无规卷曲多肽的C末端的位点特异性偶联。或者,可以用能提供马来酰亚胺基团的可商购的连接试剂来修饰形成无规卷曲构象的氨基酸聚合物/无规卷曲多肽的N末端或C末端,从而允许与作为药物分子的一部分的硫醇基化学偶联。按照该方式,可容易地获得均一的药物缀合物。本领域公知的的类似技术(Hermanson(1996)同上)可用于将无规卷曲多肽与肽或甚至与蛋白药物偶联。可以容易地制备携带Lys或Cys侧链的这些肽或蛋白,这允许它们通过NHS酯或马来酰亚胺活性基团与形成无规卷曲构象的氨基酸聚合物进行体外偶联。通常,用包含无规卷曲多肽(或其区段)的融合蛋白可以制备相似的药物缀合物。然而,如后文实施例和附图所示,本发明还提供了本发明的创新缀合物中包含的无规卷曲多肽或无规卷曲多肽区段的制备方式。作为单一位点特异性缀合的可选方案,可以使无规卷曲多肽在N末端或C末端或 内部装配适于化学修饰的额外的侧链,例如,具有ε -氨基的赖氨酸残基、具有硫醇基团的半胱氨酸残基或甚至是非天然氨基酸,从而允许利用例如NHS酯或马来酰亚胺活性基团实现多个小分子的缀合。除稳定的缀合之外,可以使前药与无规卷曲多肽暂时连接。可以将连接设计为能以可预见的方式在体内被切割,所述切割可以通过酶学机制或通过在生理PH下开始的缓慢水解,这与例如低可溶性抗肿瘤剂喜树碱与PEG聚合物缀合是相似的,从而实现生物分布增加、毒性减小、功效和肿瘤累积增强(Conover (1998)Cancer ChemotherPharmacol,42:407-414)。其它前药的实例是化疗剂,例如多西他赛(Liu(2008) J PharmSci. 97:3274-3290)、多柔比星(Veronese (2005)Bioconjugate Chem. 16:775-784)或紫杉醇(Greenwald(2001)J Control Release 74:159-171)。此外,小分子可以与融合蛋白偶联,所述融合蛋白包含与诸如抗体片段的靶向结构域基因融合的氨基酸聚合物/多肽,从而实现小分子药物的特异性递送。对于后一种情况,例如,如果靶向结构域是针对经历内化的细胞表面受体,可以通过与细胞毒性小分子缀合容易地制备免疫毒素。按照上文,本发明因此还涉及提供本文公开的生物合成的无规卷曲多肽或多肽区段用于与其它所选化合物进行进一步的和其它的偶联,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列。所述进一步的和其它的偶联可以是和/或可以包含所述生物合成的无规卷曲多肽或生物合成的无规卷曲多肽区段与另一化合物的首先偶联。在另一个实施方案中,本发明涉及编码本文所述的无规卷曲多肽(或其区段)或生物活性蛋白的核酸分子。因此,所述核酸分子可以包含编码具有生物活性的多肽的核酸序列和编码无规卷曲多肽(或其区段)的核酸序列。本文所用的术语"核酸分子"意图包括诸如DNA分子和RNA分子的核酸分子。所述核酸分子可以是单链的或双链的,但优选双链DNA。优选地,所述核酸分子可以被包含在载体中。因此,本发明还涉及编码本文提供的缀合物(例如本文所限定的药物缀合物)中包含的无规卷曲多肽或多肽区段的核酸分子,或编码包含上文所限定的生物活性蛋白并且还包含生物合成的无规卷曲多肽或多肽区段的蛋白缀合物的核酸分子,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。在一个实施方案中,提供了编码缀合物(例如,上文所限定的药物缀合物或食品缀合物)的核酸分子,所述核酸分子包含(i)编码翻译的氨基酸和/或前导序列的核酸序列;(ii)编码生物合成的无规卷曲多肽或多肽区段的核酸序列,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成;(iii)编码包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的所述生物活性蛋白或多肽或感兴趣的蛋白的核酸序列,所述感兴趣的蛋白例如是可用于诸如食品工业的其它工业领域的蛋白;和·
(iv)提供翻译终止密码子或是翻译终止密码子的核酸序列。例如,⑴中的上述“翻译的氨基酸和/或前导序列”可以是起始“M”,即,来自相应的起始密码子的蛋氨酸,其还可以包含mRNA的非翻译序列,例如5’序列直至起始密码子,非翻译序列例如包含核糖体结合位点。然而,这样的序列还可以包含典型前导和/或信号序列,例如用于使表达的蛋白分泌到周质或培养基中。原核信号肽例如是OmpA、MalE、PhoA、DsbA、pelB、Afa、npr、STII。真核信号肽例如是蜂素信号序列、酸性糖蛋白gp67信号序列、小鼠IgM信号序列、hGH信号序列。包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的生物活性蛋白或多肽以及其它感兴趣的蛋白(例如可用于其它工业领域的蛋白)已在上文提供。在必要的变通下,所述实施方案适用于上文所述的核酸分子(部分/区段(iii))。可用于本文提供的核酸分子中的翻译终止密码子是本领域公知的,例如是密码子UAA、UAG 或 UGA。在上文提供的核酸分子的一个实施方案中,上述核酸分子部分/区段(ii)和
(iii)在编码缀合物(例如药物缀合物或食品缀合物)的所述核酸分子中的位置互换。这样的核酸分子会包含下述顺序的部分/区段(i)编码翻译的氨基酸和/或前导序列的核酸序列;(ii)编码包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的生物活性蛋白或多肽或感兴趣的蛋白的核酸序列,所述感兴趣的蛋白例如是可用于诸如食品工业的其它工业领域的蛋白;(iii)编码生物合成的无规卷曲多肽或多肽区段的核酸序列,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成;以及(iv)代表翻译终止密码子或是翻译终止密码子的核酸序列。上文提供的核酸分子还可以任选地包含在部分/区段(i)和(ii)之间和/或在部分/区段(ii)和(iii)之间包含蛋白酶和/或化学切割位点和/或识别位点。这些化学切割位点是本领域公知的,并且包括例如特定的个体氨基酸序(参见,例如Lottspeichand Engels (Hrsg.) (2006)Bioanalytik. 2. Auflage. Spektrum Akademischer Verlag, Elsevier, Munchen, Germany)。例如,溴化氰或氯化氰切割Met残基后的肽键;轻基野芝麻碱切割天冬酰胺-甘氨酰键;甲酸切割Asp-PiO ;2-(2’ -硝基苯基亚氧硫基)-3-甲基-3-溴吲哚啉,2-氧碘苯甲酸或N-氯琥珀酰亚胺切割Trp之后的键;2_硝基-5-硫代氰酰苯甲酸切割Cys之后的键。本文还考虑到并且也可能的是,Pro/Ala多肽或多肽区段之前的残基可以通过定点诱变被取代为Met,并且然后所得的融合蛋白可以被BrCN切割。相似地,可通过定点诱变将包含切割位点的其它氨基酸序列引入重组融合蛋白或其编码核酸。其它有用的蛋白酶识别/切割位点是本领域已知的。这些包括但不限于胰蛋白酶、糜蛋白酶、肠激酶、烟草蚀纹病毒(TEV)蛋白酶、PreScission蛋白酶、HRV 3C蛋白酶、SUMO蛋白酶、分拣酶A、颗粒酶B、弗林蛋白酶、凝血酶、因子Xa或自我可切割的内含肽。因子Xa在氨基酸序列IIeGluGlyArg的C末端水解肽键,氨基酸序列IIeGluGlyArg可以被插在N末端融合伴侣和Pro/Ala多肽或多肽区段之间。实现蛋白水解切割的特别简单的方法是,通过在Pro/Ala多肽或多肽区段的N末端插入或取代Lys或Arg侧链,然后用胰蛋白酶进行消化,胰蛋白酶不会切割Pro/Ala多肽或多肽区段的内部,只要在内部避免Lys或Arg侧链。示例性的识别位点可以是,但不限于,D-D-D-D-K (肠激酶)、ENLYFQ (G/S) (TEV蛋白酶),I-(E/D) -G-R(因子 Xa)、L-E-V-L-F-Q-G-P (HRV 3C)、R-X-(K/R) -R(弗林蛋白酶)、LPXTG (分拣酶 A)、L-V-P-R-G (凝血酶)或 I-E-X-D-X-G (颗粒酶 B)。
·
从上文的公开内容可以明显看出,本发明提供了重组产生的生物合成的无规卷曲多肽和多肽区段,其可以与所选的分子缀合,所述所选的分子例如是有用的蛋白、药学活性多肽或小分子、诊断上有用的多肽或小分子,或者其它工业领域(例如食品或造纸工业或采油)的其它有用的蛋白或小分子。因此,本发明还提供了编码生物合成的无规卷曲多肽或多肽区段的核酸,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成,所述核酸分子包含(i)编码翻译的氨基酸和/或前导序列的核酸序列;(ii)编码所述生物合成的无规卷曲多肽或多肽区段的核酸序列,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列;和(iii)代表翻译终止密码子或是翻译终止密码子的核酸序列。上述核酸分子可以任选地在(i)和(ii)之间包含蛋白酶和/或化学切割位点和/或识别位点)。此外,对于上述核酸分子,上文关于前两种核酸分子(即,蛋白酶和/或化学切割位点和/或识别)提供的实施方案在必要的变通下适用于此处。可用于本发明的有用的和示例性的信号序列包括,但不限于,原核序列,例如OmpA> MalE、PhoA> DsbA、pelB、Afa、npr、STII,或真核序列,例如蜂素信号序列、酸性糖蛋白gp67信号序列、小鼠IgM信号序列、hGH信号序列具体而言,编码本发明的生物合成的无规卷曲多肽或多肽区段的核酸分子可用于下文提供的以及后文实施例和附图所示的方法,所述生物合成的无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列。这样的表达的无规卷曲多肽或无规卷曲多肽区段可以从例如表达该无规卷曲多肽或无规卷曲多肽区段的宿主细胞分离。这类宿主细胞可以是例如用本文提供的载体转染的细胞。因此,考虑到用本文所述的核酸分子或载体转染细胞。在另一实施方案中,本发明涉及这样的核酸分子,所述核酸分子在表达时能编码本发明的无规卷曲多肽(或其区段)或生物活性蛋白。然而,在另一实施方案中,本发明涉及这样的核酸分子,所述核酸分子在表达时能编码本文公开的在水性溶液中或在生理条件下完全地或部分地形成/采取无规卷曲构象的多肽。所述核酸分子可以与本领域已知的合适的表达控制序列融合,从而确保多肽以及信号序列的合适的转录和翻译,进而确保细胞分泌或靶向细胞器。这类载体还可以包含其它基因,例如允许所述载体在合适的宿主细胞中和在合适的条件下的选择的标记基因。优选地,本发明的核酸分子被包含在重组载体中,在所述重组载体中,编码本文所述的生物活性蛋白的核酸分子与允许在原核或真核细胞中表达的表达控制序列可操作地连接。所述核酸分子的表达包括核酸分子转录为可翻译的mRNA。允许原在核宿主细胞中表达的调节元件包括,例如,大肠杆菌中的λ PL、lac、trp、tac、ara、phoA、tet或T7启动子。确保在真核细胞、优选哺乳动物细胞或酵母中表达的可能的调节元件是本领域技术人员公知的。它们通常包括确保启动转录的调节序列以及任选的影响转录终止和转录物稳定化的多聚腺苷酸(PolyA)信号。其它调节元件可以包括转录增强子以及翻译增强子,和/或天然相关的启动子区或异源启动子区。允许在真核宿主细胞中表达的调节元件的实例是酵母中的AOXl或GALl启动子或CMV、SV40、RSV(劳斯氏肉瘤病毒)启动子、CMV增强子、SV40 增强子或哺乳动物和其它动物细胞中的球蛋白内含子。除了负责启动转录的元件,所述调节元件还可以包括编码区下游的转录终止信号,例如SV40多聚腺苷酸位点或tk多聚腺苷酸位点。可使用本领域技术人员公知的方法来构建重组载体(参见,例如,Sambrook(1989) , Molecular Cloning:A Laboratory Manual, Cold Spring HarborLaboratory NY 和 Ausubel(1989), Current Protocols in Molecular Biology, GreenPublishing Associates and Wiley Interscience, NY 中描述的技术)。在本发明中,合适的表达载体是本领域已知的,例如Okayama-Berg cDNA表达载体pcDV I (Pharmacia)、pCDM8、pRc/CMV、pcDNAl、pcDNA3、pPICZa A(Invitrogen)或 pSPORT UGIBCO BRL)。此外,根据所用的表达体系,可以将能将多肽引导至细胞区室或将多肽分泌到培养基中的前导序列添加到本发明的核酸分子的编码序列。本发明还涉及常规用于基因工程的载体,特别是质粒、粘粒、病毒和噬菌体,所述载体包含编码本发明的无规卷曲多肽(或其区段)或生物活性蛋白的核酸分子。优选地,所述载体是表达载体和/或基因转移或靶向载体。来自诸如逆转录病毒、痘病毒、腺相关病毒、疱疹病毒或牛乳头状瘤病毒等病毒的表达载体可以用于将本发明的多核苷酸或载体递送到靶细胞群中。通过公知的方法可以将含有本发明的核酸分子的载体转染到宿主细胞中,所述方法根据细胞类型会有不同。因此,本发明还涉及包含所述核酸分子或所述载体的细胞。这类方法,例如,包括Sambrook (1989),同上和Ausubel (1989),同上,中描述的技术。因此,氯化钙转染或电穿孔常用于原核细胞,而磷酸钙处理或电穿孔可以用于其它细胞宿主(Sambrook (1989),同上)。作为另一可选方案,可以将本发明的核酸分子和载体包装在脂质体中,用于递送至靶细胞。存在于宿主细胞中的本发明的核酸分子或载体可以被整合到宿主细胞的基因组中或可以保持在染色体外。因此,本发明还涉及包含本发明的核酸分子和/或载体的宿主细胞。用于表达多肽的宿主细胞是本领域公知的,并包括原核细胞以及真核细胞,例如大肠杆菌细胞、酵母细胞、无脊椎动物细胞、CHO细胞、CHO-Kl细胞、HEK 293细胞、Hela细胞、C0S-1猴细胞、黑素瘤细胞(例如Bowes细胞)、小鼠L-929细胞、来自瑞士、Balb-c或NIH小鼠的3T3细胞系、BHK或HaK仓鼠细胞系等。另一方面,本发明包含制备本发明的缀合物以及本文提供的生物合成的无规卷曲多肽(或其区段)或生物活性蛋白的方法,并包括培养本发明的(宿主)细胞以及从本文所述的培养物分离所述无规卷曲多肽(或其区段)或缀合物或生物活性蛋白。通常,可以通过重组DNA技术产生本发明的无规卷曲多肽(或其区段)、包含无规卷曲结构域的缀合物或生物活性蛋白,例如,通过培养包含编码本发明的生物活性蛋白或无规卷曲多肽(或其区段)的所述核酸分子或载体的细胞,以及从培养物分离所述蛋白/多肽。可以在任何合适的细胞培养体系中产生本发明的生物活性蛋白或无规卷曲多肽(或其区段),包括原核细胞,例如大肠杆菌BL21、KS272或JM83,或真核细胞,例如巴斯德毕赤酵母、酵母株X-33或CHO细胞。本领域已知的其它合适的细胞系可获自细胞系保藏单位,例如美国典型培养物保藏中心(ATCC)。
术语“原核”意图包括细菌细胞,而术语〃真核〃意图包括酵母、高等植物、昆虫和哺乳动物细胞。可以使转化的宿主在发酵罐中生长并按照本领域已知的技术进行培养,从而实现最佳的细胞生长。在另一实施方案中,本发明涉及制备上文所述的无规卷曲多肽(或其区段)或生物活性蛋白的方法,包括在适于生物活性蛋白或无规卷曲多肽(或其区段)的表达的条件下培养本发明的细胞,以及从细胞或培养基分离所述蛋白/多肽。本发明的无规卷曲多肽(或其区段)本身优选不包含任何化学反应基团,然而,也可能有一个N末端伯胺基团(或,对于脯氨酸为仲胺)和位于聚合物的C末端的一个羧酸基团。然而,对于本领域技术人员显而易见的是,本文提供的生物合成的无规卷曲多肽/聚合物可以包含化学反应基团,例如,当所述无规卷曲多肽/聚合物是“融合蛋白”/”融合构建体”的一部分时。还如上文所述,可以按照本领域技术人员公知的方法,以数种方式通过转化的细胞中的重组表达来制备生物合成的无规卷曲多肽(或其区段),例如(i)借助于N末端Met残基/起始密码子在细胞质中直接表达;(ii)通过N末端信号肽(例如 OmpA, PhoA (Montei Ihet (1993) Gene. 1993125:223-228)、蜂毒肽(Tessier (1991)Gene 98:177-183)、白介素 2 (Zhang(2005) J Gene Med 7:354365)、hGH(Pecceu (1991)Gene97(2) :253-258)等)分泌,然后是细胞内切割,从而得到成熟的N末端,例如Ala或Pro; (iii)表达为与另一可溶蛋白的融合蛋白,例如,麦芽糖结合蛋白位于N末端并具有散布的蛋白酶切割位点(Kapust and Waugh(2000)Protein Expr. Purif. 19:312-318),然后是体外或体内特异性蛋白酶切割,从而释放具有成熟N末端(例如Ala或Pro)的氨基酸聚合物/多肽。另一合适的融合伴侣是SUMO蛋白,其可以被SUMO蛋白酶切割,正如实施例20和21所述。其它融合伴侣包括在不限于,谷胱甘肽-S-转移酶、硫氧还蛋白、纤维素结合结构域、白蛋白结合结构域、荧光蛋白(例如GFP)、蛋白A、蛋白G、内含肽等(Malhotra(2009)Methods Enzymol. 463:239-258)。如上文所解释的,所述的无规卷曲多肽(或多肽区段)/聚合物主要由丙氨酸和脯氨酸残基组成,而O-糖基化或N-糖基化所需的丝氨酸、苏氨酸或天冬酰胺优选不存在。因此,产生多肽本身或产生包含无规卷曲多肽(或其多肽区段)的生物活性蛋白或通常产生包含无规卷曲多肽(或其多肽区段)的融合蛋白,令人意想不到地能够产生单分散的产物,所述产物优选在Pro-Ala序列中没有翻译后修饰。这对于真核细胞中的重组蛋白产生是特别有利的,所述真核细胞例如是常被选择用于复合蛋白的生物合成的中国仓鼠卵巢细胞(CHO)或酵母。例如,酵母已被用于产生获批准的治疗蛋白,例如胰岛素、粒细胞-巨噬细胞集落刺激因子、血小板衍生的生长因子或水蛭素(Gerngross (2004)Nat.Biotechnol. 22:1409-1414)。CHO细胞已被用于产生治疗蛋白,例如凝血因子IX、干扰素β-la、替奈普酶(Chu(2001)Curr. Opin. Biotechnol. 12:180-187)或促性腺激素,其中糖组分可以正性地影响数方面,例如功能活性、折叠、二聚化、分泌以及受体相互作用、信号转导和代谢清除(Walsh(2006)Nat. Biotechnol. 24:-1241-1252)。因此,本文还公开了本发明的构建体、无规卷曲多肽和缀合物在真核表达体系中的制备。利用本文提供的方式和方法,现已能够制备和提供本文公开的缀合物和分子,所述缀合物和分子包含(i)生物合成的无规卷曲多肽或多肽区段,所述无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列和(ii)另一感兴趣的分子,例如有用的蛋白、蛋白区段或小分子。因此,本发明还提供了制备或生产所述缀合物以及生物合成的无规卷曲多肽和/或分子或包含所述生物合成的无规卷曲多肽和/或分子的缀合 物的方法。因此,本发明还提供了制备和/或生产缀合物(例如药物缀合物、食品缀合物、诊断缀合物等)中包含的无规卷曲多肽或无规卷曲多肽区段的方法。此外,提供了制备和/或生产包含无规卷曲多肽或无规卷曲多肽区段的生物活性蛋白或缀合物的方法。此外,提供了制备和/或生产多肽的方法,所述多肽包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列并且还包含所述无规卷曲多肽或无规卷曲多肽区段。这些方法特别包括(作为一个步骤)培养上文提供的(宿主)细胞,和从培养物或所述细胞分离(作为另一个步骤)所述无规卷曲多肽或生物活性蛋白和/或所述生物活性蛋白和/或所述多肽缀合物。这种分离的无规卷曲、包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列的生物合成的无规卷曲多肽或多肽区段以及分离的缀合物可以被进一步加工。例如,所述包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列的生物合成的无规卷曲多肽或多肽区段可以与感兴趣的分子化学连接或偶联,如后文实施例所示。此外并作为备选方案,感兴趣的分子可以例如通过转谷氨酰胺酶(Besheer (2009) J Pharm Sci. 98:4420-8)或其它酶(Subul (2009)0rg. Biomol. Chem. 7:3361-3371)与所述包含由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列的生物合成的无规卷曲多肽或多肽区段酶学缀合。无规卷曲多肽(或其区段)和/或包含无规卷曲多肽(或其区段)和感兴趣的蛋白(例如,生物活性蛋白或治疗活性蛋白,或可用于例如诊断方法中的蛋白)的蛋白缀合物可以(特别是)从生长介质、细胞裂解物、周质或细胞膜组分分离。(此外,本发明不限于可用于医学或药物领域的(蛋白)缀合物。本文提供的方式和方法还可用于其它工业领域,例如但不限于食品和饮料工业、营养品工业、造纸工业、生物制剂工业、研究工具和试剂工业、需要利用酶的工业、美容用品工业、石油加工和采油等)。可以通过任何常规方式进行本发明的表达的多肽的分离和纯化(Scopes (1982) " Protein Purification^, Springer, NewYork,NY),包括硫酸铵沉淀、亲和纯化、柱层析、凝胶电泳等,并且可以涉及利用针对例如与本发明的生物活性蛋白融合的标签的单克隆或多克隆抗体。例如,可以利用链霉亲和素亲和层析、通过 Strep 标签 II 纯化蛋白(Skerra(2000)MethodsEnzymol. 326:271-304),如后文实施例所述。具有至少约90至95%同质性(在蛋白水平上)的基本纯的多肽是优选的,并且98至99%或更高的同质性是最优选的,特别是对于药物用途/应用。根据制备过程中所用的宿主细胞/生物体,本发明的多肽可以是糖基化的或可以是非糖基化的。本发明还涉及本发明的生物活性蛋白、无规卷曲多肽(或其区段)或缀合物(例如药物缀合物)、本发明的核酸分子、本发明的载体或本发明的(宿主)细胞在制备药物中的用途,其中与不包含或不连接于生物合成的无规卷曲多肽或多肽区段的对照分子相比,所述生物活性蛋白或药物(或任何其它感兴趣的小分子或蛋白)具有增加的体内和/或体外稳定性,所述生物合成的无规卷曲多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。在另一实施方案中,本发明涉及治疗能受益于所述生物活性蛋白或药物的提高的稳定性的疾病和/或病症的方法,所述方法包括将本文所述的生物活性蛋白或药物缀合物给予需要这种治疗的哺乳动物。根据本发明蛋白或药物缀合物的生物活性,本领域技术人 员能容易地确定利用本发明的具体生物活性蛋白或药物缀合物能治疗哪种疾病/病症。一些非限制性实例提供在下表中

生物话性蛋白待治疗的病症/疾病(或其生物活性组分/片段)或药物
粒细胞集落刺激因子癌症和/或化疗相关的嗜中性白血球减少症人生长激素_生长激素缺陷相关的低血糖症和/或生长不足
千扰素O_癌症、病毒感染、丙型肝炎_
千扰素β__自身免疫疾病,多发性硬化_
千扰素γ_病毒感染_
胂瘤坏死因子_癌症_
白介素-20_银屑病_
α-半乳糖苷峰A_法布瑞氏症_
fl肉抑制素拮抗剂肌肉减少症_
胃抑制多肽_O型糖尿病_
α-l抗胰蛋白酶錄替换疗法、嚢性纤维化,慢性阻塞性肺病、_急性呼吸综合征、严重哮嗔_
红细胞生成素_贫血症_凝血因子VIII_I血友病_
权利要求
1.药物缀合物,包含 (i)生物合成的无规卷曲多肽或多肽区段,所述多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成,和 ( )药物,所述药物选自(a)包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的生物活性蛋白或多肽,和(b)小分子药物。
2.如权利要求I所述的药物缀合物,其中所述无规卷曲多肽或多肽区段包含由约50至约3000个氨基酸残基组成的氨基酸序列。
3.如权利要求I或2所述的药物缀合物,其中所述脯氨酸残基构成大于约10%且小于约75%的所述氨基酸序列。
4.如权利要求1-3中任一项所述的药物缀合物,其中所述无规卷曲多肽或多肽区段包含多个氨基酸重复,其中所述重复由脯氨酸和丙氨酸残基组成,并且其中不多于6个连续氣基酸残基是相同的。
5.如权利要求1-4中任一项所述的药物缀合物,其中所述无规卷曲多肽或多肽区段包含选自以下的氨基酸序列AAPAAPAPAAPAAPAPAAPA(SEQ ID NO:I);AAPAAAPAPAAPAAPAPAAP(SEQ ID NO:2);AAAPAAAPAAAPAAAPAAAP(SEQ ID NO:3);AAPAAPAAPAAPAAPAAPAAPAAP(SEQ ID NO:4);APAAAPAPAAAPAPAAAPAPAAAP(SEQ ID NO:5);AAAPAAPAAPPAAAAPAAPAAPPA(SEQ ID NO:6);和APAPAPAPAPAPAPAPAPAP(SEQ ID NO:51) 或作为这些序列的整体或这些序列的一部分的这些序列的环状排列形式或多聚体。
6.如权利要求1-5中任一项所述的药物缀合物,其中所述具有生物活性的多肽、所述包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的生物活性蛋白或多肽选自结合蛋白、抗体片段、细胞因子、生长因子、激素或酶。
7.如权利要求6所述的药物缀合物,其中所述具有生物活性的多肽是结合蛋白,并且其中所述结合分子选自抗体、Fab片段、F(ab’)2片段、CDR衍生的肽模拟物、单链可变片段(scFv)、结构域抗体、凝集素、免疫球蛋白结构域、纤连蛋白结构域、蛋白A结构域、SH3结构域、锚蛋白重复结构域和脂质运载蛋白。
8.如权利要求1-7中任一项所述的药物缀合物,其中所述生物活性蛋白选自粒细胞集落刺激因子、人生长激素、α-干扰素、β-干扰素、Y-干扰素、肿瘤坏死因子、红细胞生成素、凝血因子VIII、gpl20/gpl60、可溶性肿瘤坏死因子I和II受体、瑞替普酶、艾塞那肽-4、阿那白滞素、白介素-2、中性粒细胞明胶酶相关脂质运载蛋白、卵泡刺激素、葡糖脑苷脂酶、胸腺素α I、胰高血糖素、生长激素抑制素、腺苷脱氨酶、白介素11、凝血因子Vila、凝血因子IX、hematide、λ -干扰素、瘦素、白介素-22受体α亚基(IL_22ra)、白介素-22、透明质酸酶、成纤维细胞生长因子18、成纤维细胞生长因子21、胰高血糖素样肽I、骨保护素、IL-18结合蛋白、生长激素释放因子、可溶性TACI受体、血小板反应蛋白-I、可溶性VEGF受体Flt-I和IL-4突变蛋白。
9.如权利要求1-8中任一项所述的药物缀合物,其中所述生物合成的无规卷曲多肽或多肽介导所述药物缀合物的增加的体内和/或体外稳定性。
10.如权利要求9所述的药物缀合物,其中所述增加的体内稳定性是与缺少所述无规卷曲多肽或多肽区段的对照多肽或对照缀合物的稳定性相比,所述药物缀合物的延长的血浆半衰期,所述药物缀合物包含所述生物合成的无规卷曲多肽或多肽区段,所述多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。
11.如权利要求ι- ο中任一项所述的药物缀合物,其中所述小分子选自地高辛配基、荧光素、多柔比星、卡里奇霉素、喜树碱、烟曲霉素、地塞米松、格尔德霉素、紫杉醇、多西他赛、伊立替康、环孢霉素、丁丙诺啡、纳曲酮、纳洛酮、长春地辛、万古霉素、利培酮、阿立哌唑、帕洛诺司琼、格拉司琼、阿糖孢苷NX1838、亮丙瑞林、戈舍瑞林、布舍瑞林、奥曲肽、替度鲁肽、西仑吉肽、阿巴瑞克、恩夫韦地、葛瑞林、α 4整合素抑制剂、反义核酸、小干扰RNA、微RNA、类固醇、DNA或RNA适体和肽和/或肽模拟物。
12.组合物,包含权利要求1-11中任一项所述的药物缀合物。
13.如权利要求12所述组合物,其是药物组合物或诊断组合物,所述药物组合物任选地还包含药学可接受的载体,所述诊断组合物任选地还包含诊断组合物中可接受的载体。
14.编码权利要求1-11中任一项所述的药物缀合物中所包含的无规卷曲多肽或多肽区段的核酸分子,或编码蛋白缀合物的核酸分子,所述蛋白缀合物包含权利要求6-8中任一项所述的生物活性蛋白并包含生物合成的无规卷曲多肽或多肽区段,所述多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。
15.编码权利要求1-10中任一项所述的药物缀合物的核酸分子,所述核酸分子包含 (i)编码翻译的氨基酸和/或前导序列的核酸序列; ( )编码生物合成的无规卷曲多肽或多肽区段的核酸序列,所述多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成; (iii)编码包含具有或介导生物和/或治疗活性的氨基酸序列或是具有或介导生物和/或治疗活性的氨基酸序列的生物活性蛋白或多肽的核酸序列;和 (iv)代表翻译终止密码子或是翻译终止密码子的核酸序列。
16.如权利要求15所述的核酸分子,其中(ii)和(iii)中所述的所述核酸分子部分或区段在所述编码药物缀合物的核酸分子上的位置互换。
17.如权利要求15或16所述的核酸分子,任选地在(i)和(ii)所述的部分或区段之间和/或(ii)和(iii)所述的部分或区段之间包含蛋白酶和/或化学切割位点和/或识别位点。
18.编码生物合成的无规卷曲多肽或多肽区段的核酸,所述多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成,所述核酸分子包含 (i)编码翻译的氨基酸和/或前导序列的核酸序列; ( )编码所述生物合成的无规卷曲多肽或多肽区段的核酸序列,所述多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列;和 (iii)代表翻译终止密码子或是翻译终止密码子的核酸序列。
19.如权利要求18所述的核酸分子,任选地在⑴和(ii)之间包含蛋白酶和/或化学切割位点和/或识别。
20.载体,包含权利要求14-19中任一项所述的核酸。
21.宿主细胞,包含权利要求14-19中任一项所述的核酸或权利要求20所述的载体。
22.如权利要求21所述的宿主细胞,其中所述宿主细胞是真核宿主细胞。
23.如权利要求22所述的宿主细胞,其中所述真核宿主细胞是真菌或动物细胞。
24.制备权利要求1-11中任一项所述的药物缀合物中包含的无规卷曲多肽或无规卷曲多肽区段、制备包含所述无规卷曲多肽或所述无规卷曲多肽区段的生物活性蛋白或药物或食品缀合物和/或制备权利要求1-8中任一项所述的包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列并且还包含所述无规卷曲多肽或无规卷曲多肽区段的多肽的方法, 所述方法包括培养权利要求21-23中任一项所述的细胞,并从培养物或所述细胞分离所述无规卷曲多肽或生物活性蛋白和/或所述生物活性蛋白或所述多肽。
25.权利要求1-11中任一项所述的药物缀合物、权利要求12或13所述的组合物、权利要求14-19中任一项所述的核酸、权利要求20所述的载体、权利要求21-23中任一项所述的细胞或通过权利要求24所述的方法制备的包含所述无规卷曲多肽或无规卷曲多肽区段的生物活性蛋白或多肽,其用于治疗激素缺陷相关病症、自身免疫疾病、增殖性病症、癌症、贫血症、新生血管性疾病、感染性/炎症性疾病、变应性病症、血栓形成、心肌梗塞、视网膜变性、糖尿病、不孕症、高球氏症、慢性乙型肝炎、丙型肝炎、低血糖症、肢端肥大症、腺苷脱氨酶缺陷、血小板减少症、血友病、贫血症、肥胖症、阿尔茨海默病、脂肪代谢障碍、银屑病、转移性黑素瘤、骨关节炎、血脂异常、风湿性关节炎、系统性红斑狼疮、多发性硬化、哮喘、骨质疏松症和再灌注损伤或其它肾病。
26.权利要求1-11中任一项所述的药物缀合物、权利要求12或13所述的组合物、权利要求14-19中任一项所述的核酸、权利要求20所述的载体、权利要求21-24中任一项所述的细胞,其用作药物,所述药物具有所述无规卷曲多肽或多肽区段、生物活性蛋白或药物缀合物的增加的体内和/或体外稳定性。
27.权利要求1-5中任一项所述的无规卷曲多肽或无规卷曲多肽区段或权利要求14-19中任一项所述的核酸分子或其部分所编码的无规卷曲多肽或无规卷曲多肽区段在美容用品、美容治疗、营养学或食品技术或造纸工业中的用途。
28.制备权利要求1-11中任一项所述的缀合物、美容用品、用于美容治疗中的化合物、食品或饮料或工业中的感兴趣的缀合物的方法, 所述方法包括培养权利要求21-23中任一项所述的细胞,以及从培养物或所述细胞分离所述无规卷曲多肽、所述生物活性蛋白和/或包含具有或介导生物活性或感兴趣的活性的氨基酸序列或是具有或介导生物活性或感兴趣的活性的氨基酸序列、并且还包含所述无规卷曲多肽或无规卷曲多肽区段的所述生物活性蛋白或所述多肽。
29.如权利要求28所述的方法,其中所述所述无规卷曲多肽、所述生物活性蛋白和/或包含具有或介导生物活性或感兴趣的活性的氨基酸序列或是具有或介导生物活性或感兴趣的活性的氨基酸序列的、并且还包含所述无规卷曲多肽或无规卷曲多肽区段的所述生物活性蛋白或所述多肽分离自所述(宿主)细胞的生长介质或培养基、细胞裂解物、细胞膜组分、周质。
30.如权利要求28或29所述的方法,其中所述无规卷曲多肽与感兴趣的分子连接和/或偶联。
31.如权利要求30所述的方法,其中所述连接或所述偶联是化学连接或偶联。
全文摘要
本发明涉及生物合成的无规卷曲多肽(random coil polypeptide)或生物合成的无规卷曲多肽区段或生物合成的缀合物,其中所述生物合成的无规卷曲多肽、所述生物合成的无规卷曲多肽区段或所述生物合成的缀合物包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少约50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成。所述至少约50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基可以是异源多肽或异源多肽构建体的组成部分。还描述了这些生物合成的无规卷曲多肽或多肽区段或所述缀合物的用途和使用方法。特别地,所述用途可以包括医药用途,诊断用途或食品工业用途以及其它工业应用中的用途,例如造纸工业、采油等。具体而言,提供了药物缀合物,其包含(i)生物合成的无规卷曲多肽或多肽区段,所述多肽或多肽区段包含仅由脯氨酸和丙氨酸氨基酸残基组成的氨基酸序列,其中所述氨基酸序列由至少50个脯氨酸(Pro)和丙氨酸(Ala)氨基酸残基组成,和(ii)药物,所述药物选自(a)包含具有或介导生物活性的氨基酸序列或是具有或介导生物活性的氨基酸序列的生物活性蛋白或多肽,和(b)小分子药物。此外,公开了编码所述生物合成的无规卷曲多肽或多肽区段和/或所述生物活性异源蛋白的核酸分子,以及包含所述核酸分子的载体和细胞。此外,本发明提供包含本发明化合物的组合物,以及本发明的无规卷曲多肽或多肽区段、生物活性蛋白、药物缀合物或核酸分子、载体和细胞的具体用途。还提供了产生和/或获得本发明生物合成的无规卷曲多肽或多肽区段的方法,以及产生和/或获得本发明的生物活性异源蛋白和/或多肽构建体或缀合物(例如药物缀合物)的方法。
文档编号C07K7/00GK102883734SQ201180022849
公开日2013年1月16日 申请日期2011年5月20日 优先权日2010年5月21日
发明者阿恩·斯科拉, 尤里·宾德尔, 马丁·斯拉珀斯其 申请人:Xl-蛋白有限责任公司, 慕尼黑科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1