基于c-型凝集素结构域的组合文库的制作方法

文档序号:393112阅读:524来源:国知局
专利名称:基于c-型凝集素结构域的组合文库的制作方法
技术领域
本发明涉及包含具有C-型凝集素结构域(CTLD)的多肽的多肽文库以及含编码此类多肽的核酸分子的核酸文库,所述C-型凝集素结构域具有随机化环区域。本发明还涉及 用于产生所述随机化多肽和所述多肽文库的方法。本发明进一步涉及基于修饰CTLD与感兴趣靶分子的特异性结合来筛选所述多肽和核酸文库的方法。本发明还涉及源自此类文库且与感兴趣靶分子结合的多肽。
背景技术
C-型凝集素样结构域(CTLD)是一种已经在许多分离自多种动物样品的蛋白质中得到鉴定的蛋白质基序(在Drickamer and Taylor (1993)以及Drickamer (1999)中予以评述)。最初,CTLD结构域被鉴定为与所谓的C-型凝集素(钙依赖性糖结合蛋白)相同的结构域并被命名为〃糖识别域〃("CRD")。最近,已经明了的是,该结构域被很多真核生物蛋白质共享,在这些蛋白质中,有若干种不与糖部分结合,因此规范结构域已被命名为〃CTLD"。已有报告称CTLD与很多种化合物结合,这包括碳水化合物、脂质、蛋白质以及甚至冰(Aspberg 等(1997),Bettler 等(1992),Ewart 等(1998),Graversen 等(1998), Mizumo等(1997) ,Sano等(1998), and Tormo等(1999))。尽管一些蛋白质含有CTLD的单拷贝,但是其他蛋白质含有该结构域的两个或多个拷贝。在生理学机能单位中,通常通过将单拷贝蛋白质前粒子装配到较大结构中而获得大量CTLD数目。CTLD含有约120个氨基酸残基,而且特有地含两个或三个链内二硫键。尽管来自不同蛋白质的CTLD的基本序列共享相对低的氨基酸序列同源性,但是许多CTLD的二级和三级结构是类似的,从而产生高度保守的三维结构,在该三维结构中结构可变性基本局限于CTLD环区域。该CTLD环区域通常含至多5个环,其在配体和钙结合中起作用。若干CTLD含一个或两个钙结合部位,而且与钙相互作用的大部分侧链位于该环区域中。基于可用的三维结构信息,规范CTLD特征在于以下述次序顺序出现的7个主要的二级结构元件(五个@ -链和两个螺旋)01;al;a2邛和¢5(图I)。在三维结构已经确定的CTLD中,所述@链以两个反平行折叠排列,一个由M和¢5构成,另一个由@2、03和¢4构成。其他¢-链¢0在序列中通常位于@ I之前,而且,当存在时,其形成与P 1,¢5折叠结合的其他链。此外,两个二硫键,一个连接a I和图i),一个连接e 3和连接e 4与e 5的多肽区段(cn-cni,图I),迄今为止始终发现于所表征的所有CTLD中。在CTLD三维结构中,保守的二级和三级结构元件为很多环形成从核心伸出的致密支架,其在本上下文中统称为“环区域”。CTLD的环区域的一级结构被组织成两个区段,环区段A(LSA)和环区段B(LSB)。LSA表示连接¢2和P 3的长多肽区段,其通常缺乏常规的二级结构并含有多达4个环。LSB表示连接¢-链¢3和¢4的多肽区段。包括环区域在内的CTLD的示意图显示于图4-6中。LSA中的残基连同P 4中的单残基已经显示出特定于若干CTLD(包括四联蛋白的CTLD)的Ca2+-和配体-结合部位。例如,诱变研究(包括单或数个残基的置换)已经显示结合特异性、Ca2+-敏感性和/或亲和力的变化可通过CTLD结构域来调节(Weis and Drickamer (1996),Chiba 等(1999),Graversen 等(2000))。四联蛋白是一种三聚糖蛋白(Holtet等(1997),Nielsen等(1997)),其已经分离自人血浆并且发现其存在于某些组织中的细胞外基质中。已知四联蛋白结合钙、复合多糖、 纤维蛋白溶酶原、纤维蛋白原/纤维蛋白和脱脂载脂蛋白(a)。与纤维蛋白溶酶原和脱脂载脂蛋白(a)的相互作用是由其中的kringle 4-蛋白结构域介导的。该相互作用已知对钙和氨基酸赖氨酸的衍生物敏感(Graversen等(1998))。人类四联蛋白基因已经被表征,而且已经分离出人和鼠四联蛋白cDNA克隆。人和鼠四联蛋白的成熟蛋白包含181个氨基酸残基。参见美国专利申请公开2007/0154901,该文献以其整体引入本文。全长人类四联蛋白的三维结构以及分离四联蛋白CTLD的三维结构已经在两个独立研究中独立地测定(Nielsen等(1997)和Kastrup等(1998))。四联蛋白是2-结构域或可能为3-结构域蛋白,S卩,多肽链的主要部分包含CTLD (氨基酸残基Gly53到VallSl),而区域Leu26至Lys52通过形成同源三聚平行卷曲螺旋编码蛋白质的a -螺旋控制三聚。多肽取代Glul至Glu25含有复合多糖结合部位(Lys6至Lysl5) (Lorentsen等(2000))并显示有助于三聚结构的稳定化(Holtet等(1997)),位于环4中的两个氨基酸残基Lysl48和Glul50以及Aspl65(位于¢4中)已经显不对纤维蛋白溶酶原kringle4结合非常重要,且残基Ilel40 (在环3中)和Lysl66及Argl67 (在P 4中)也显示很重要(Graversen等(1998))。用芳香残基置换Thrl49 (在环4中)显示出显著增加四联蛋白与kringle 4的亲和力并增加对纤维蛋白溶酶原kringle 2的亲和力,其水平可比得上野生型四联蛋白对kringle 4的亲和力(Graversen等(2000))。已经描述了四联蛋白的三聚平截。参见与2009年4月8日提交的US 2010/0028995,该文献以其整体并入作为参考。许多其他含有CTLD的蛋白是已知的,包括下述非限定性实例胰石蛋白(Iithostatin)、鼠巨卩遼细胞半乳糖凝集素、星形细胞受体(Kupffer cell receptor)、鸡神经聚糖、perlucin、唾液酸糖蛋白受体、软骨蛋白多糖核心蛋白、IgE Fe受体、胰腺炎相关蛋白、鼠巨噬细胞受体、自然杀伤细胞组(Natural Killer group)、干细胞生长因子、因子IX/X结合蛋白、甘露糖结合蛋白、牛共凝集素、牛CL43、胶原凝集素肝I、表面活性蛋白A、表面活性蛋白D、e-选择蛋白、被囊类C-型凝集素、CD94 NK受体结构域、LY49A NK受体结构域、鸡肝凝集素、鳟鱼C-型凝集素、结合HIV gp 120的C-型凝集素、树突细胞免疫受体和很多蛇毒蛋白。在很多天然出现的CTLD中结合部位构型的变化显示,其共有的核结构可适应很多基本不同的配体结合部位构型(参见例如US2007/0275393,该专利通过参考引入本文)。CTLD因此特别适于用作构建对感兴趣靶分子具有所需结合性质的新型有用的蛋白质产物。例如,CTLD (或CTLD-基蛋白质产物)相对于抗体衍生物具有优势,因为在CTLD基蛋白质产物中的每一结合部位隐匿于单一结构自主的蛋白质结构域中。此外,CTLD结构域抵抗蛋白水解,而且与配体结合部位的稳定性和接近机会由于其他蛋白质结构域与CTLD的N-端或C-端相连均不会受损。关于治疗用途,所述CTLD-基蛋白质产物与已经存在于体内的响应的天然CTLD蛋白质相同,而且其因此有望在患者体内引发最小限度的免疫应答。单CTLD大约是抗体质量的一半,而且在一些应用中可能是有利的,因为其可提供更好的组织穿透力和分布以及更短的循环半衰期。CTLD蛋白的多价形式可以提供增加的结合能力和亲和力以及更长的循环半衰期。 本发明提供组合CTLD多肽文库以及鉴定和分离CTLD的方法,以用作构建对感兴趣靶分子具有所需结合性质的新的和有用的蛋白质产物的基础。

发明内容
一方面,本发明提供组合多肽文库,其包含下述多肽成员,该多肽成员含有具有随机化环区域的C-型凝集素结构域(CTLD),其中所述随机化环区域已经从该CTLD的天然序列进行修饰。本发明提供组合多肽文库和编码所述多肽文库的核酸文库,其包含下述多肽成员,该多肽成员含有具有随机化环区域的C-型凝集素结构域(CTLD),其中该CTLD的环区域按照下述方案之一而被随机化(a)在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括在环I中至少一个氨基酸的插入以及环I内至少五个氨基酸的随机置换;(b)在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括环I内至少五个氨基酸的随机置换以及环2内至少三个氨基酸的随机置换;(c)在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括环I内至少七个氨基酸的随机置换以及在环4中的至少一个氨基酸插A ;(d)在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少一个氨基酸插入以及环3内至少三个氨基酸的随机置换;(e)在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括将两个环组合成单一环的修饰,其中两个被组合的环为环3和环4 ;(f)在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括在环4中的至少一个氨基酸插入以及环4内至少三个氨基酸的随机置换;(g)在CTLD的环区段A(LSA)和环区段B(LSB)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括环3中至少五个氨基酸残基的随机置换以及环5内至少三个氨基酸的随机置换;
(h)在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少一个氨基酸的随机置换以及至少六个氨基酸的插入;⑴在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括下述的混合(I)在环3中的至少六个氨基酸的随机置换,和(2)在环3中的至少六个氨基酸的随机置换和至少一个氨基酸插入;和(j)在CTLD的环区段A(LSA)中的四个环中的至少一个中进行氨基酸修饰,其中所述氨基酸修饰包括在CTLD的环区段A (LSA)中的四个环中的至少一个中或者环区段B (LSB)的环5中进行是至少四个或更多个氨基酸插入。一方面,所述文库的多肽的CTLD具有下述二级结构 a.以3 I、a I、a 2、3 2、3 3、3 4和3 5的次序顺序出现的五个3 _链和两个a-螺旋,所述链以两个反平行折叠排列,一个由M和P 5组成,另一个由3 2、¢3和3 4组成,b.至少两个二硫键,一个连接a I和P 5,而一个连接P 3和连接P 4与P 5的多肽区段,和c.含环区段A (LSA)和环区段B (LSB)的环区域,其中LSA连接P 2和P 3,而LSB连接¢3和M。在各种其他方面,所述文库的多肽具有在C端方向位于环2的C末端邻近的随机氨基酸置换。此外,当CTLD来自人类四联蛋白时,该CTLD还可包括随机的精氨酸-130置换。此外,当CTLD来自鼠四联蛋白时,该CTLD还可包括亮氨酸-130的随机置换。在(a) - (j)的某些修饰中,当CTLD来自人或鼠四联蛋白时,该CTLD还可包括脯氨酸144的随机置换。在各种其他实施方式中,所述文库的多肽可具有参与钙配位和/或纤维蛋白溶酶原结合的一个或更多个氨基酸的随机置换。例如,当CTLD来自四联蛋白时,该CTLD还可包含赖氨酸-148置换为丙氨酸(在环4中)。在某些实施方式中,当组合文库具有方案(a)的修饰CTLD时,所述氨基酸置换包括在环I中的两个氨基酸插入和在环I内的至少五个氨基酸是随机置换。在其他实施方式中,当组合文库具有方案(a)的修饰CTLD而且CTLD来自人类四联蛋白时,所述氨基酸修饰包括在环I中的至少一个氨基酸插入、在环I内的至少五个氨基酸的随机置换,并且包括精氨酸130的随机置换。在一个具体实施方式
中,当组合文库具有方案(a)的修饰CTLD而且CTLD来自人类四联蛋白时,所述氨基酸修饰包括在环I中的两个氨基酸插入、在环I内的五个氨基酸的随机置换和精氨酸130的随机置换。在一个具体实施方式
中,当组合文库具有方案(a)的修饰CTLD而且CTLD来自鼠四联蛋白时,所述氨基酸修饰包括在环I中的两个氨基酸插入、在环I内的五个氨基酸的随机置换和亮氨酸130的随机置换。在方案(a)的任意实施方式中,所述氨基酸修饰还可包括赖氨酸-148置换为丙氨酸。在某些实施方式中,当组合文库具有方案(b)的修饰CTLD而且CTLD来自人类四联蛋白时,所述氨基酸修饰包括在环I中的至少五个氨基酸的随机置换、在环2中的至少三个氨基酸的随机置换,并且包括精氨酸130的随机置换。在一个实施方式中,当组合文库具有方案(b)的修饰CTLD而且CTLD来自人类四联蛋白时,所述氨基酸修饰包括在环I中的五个氨基酸的随机置换、在环2中的三个氨基酸的随机置换和精氨酸130的随机置换。在某些其他实施方式中,当组合文库具有方案(b)的修饰CTLD而且CTLD来自鼠四联蛋白时,所述氨基酸修饰包括在环I中的至少五个氨基酸的随机置换、在环2中的至少三个氨基酸的随机置换,并且包括亮氨酸130的随机置换。在一个实施方式中,当组合文库具有方案(b)的修饰CTLD而且CTLD来自鼠四联蛋白时,所述氨基酸修饰包括在环I中的五个氨基酸的随机置换、在环2中的三个氨基酸的随机置换和亮氨酸130的随机置换。在方案(b)的任意实施方式中,所述氨基酸修饰还可包括赖氨酸-148置换为丙氨酸。在其他具体实施方式
中,组合文库的个体成员包括环区域,该环区域包括由下面实施例表3提供的任意或全部多肽序列。在某些实施方式中,当组合文库具有方案(C)的修饰时,所述氨基酸修饰任选还包括至少两个氨基酸的随机置换。在某些其他实施方式中,当组合文库具有方案(C)的修饰时,所述氨基酸修饰包括在环4内的三个氨基酸插入,以及任选还包括至少两个氨基酸的随机置换。在一个实施方式中,所述氨基酸修饰包括在环I内的至少七个氨基酸的随机置换、在环4中的至少三个氨基酸插入以及在环4内的至少两个氨基酸的随机置换。在一个具体实施方式
中,所述氨基酸修饰包括在环I内的七个氨基酸的随机置换、在环4中的三个氨基酸插入以及在环4内的两个氨基酸的随机置换。在其他具体实施方式
中,组合文库的个体成员包括环区域,该环区域包括由下面实施例表3提供的任意或全部多肽序列。在其他实施方式中,当组合文库具有方案(d)的修饰CTLD时,所述氨基酸修饰还可包括在环4中的至少一个氨基酸插入,并且还可包括在环4内的至少三个氨基酸的随机置换。在任意所述的方案(d)的实施方式中,所述氨基酸修饰可包括在环3中的三个氨基酸插入。在任意所述的方案(d)的实施方式中,所述氨基酸修饰可包括在环4中的三个氨基酸插入。因此,在某些实施方式中,所述氨基酸修饰包括在环3内的至少三个氨基酸的随机置换、在环4内的至少三个氨基酸的随机置换、在环3中的至少一个氨基酸插入和在环4中的至少一个氨基酸插入。在某些实施方式中,所述氨基酸修饰包括在环3内的至少三个氨基酸的随机置换、在环4内的至少三个氨基酸的随机置换、在环3中的至少三个氨基酸插入和在环4中的至少三个氨基酸插入。在一个具体实施方式
中,所述氨基酸修饰包括在环3内的三个氨基酸的随机置换、在环4内的三个氨基酸的随机置换、在环3中的三个氨基酸插入和在环4中的三个氨基酸插入。在其他具体实施方式
中,组合文库的个体成员包括环区域,该环区域包括由下面实施例表3提供的任意或全部多肽序列。在某些实施方式中,当组合文库的成员具有方案(e)的修饰CTLD时,所述氨基酸修饰包括环3内的至少六个氨基酸的随机置换和环4内的至少四个氨基酸的随机置换。在一个具体实施方式
中,所述氨基酸修饰包括环3内的六个氨基酸的随机置换和环4内的四个氨基酸的随机置换。在方案(e)的任意实施方式中,当CTLD来自人类四联蛋白时,所述氨基酸修饰还可包括脯氨酸-144的随机置换。在一个具体实施方式
中,当CTLD来自人类四联蛋白时,所述氨基酸修饰包括环3内六个氨基酸的随机置换、环4内四个氨基酸的随机置换和脯氨酸-144的随机置换,产生组合的环3和环4氨基酸序列,其包括,例如,NWEXXXXXXXXGGXXXN(SEQ ID NO:578),其中 X是任意氨基酸,且其中 SEQ ID NO:578 的氨基酸序列形成单环区域。在其他具体实施方式
中,组合文库的个体成员包括环区域,该环区域包括由下面实施例表3提供的任意或全部多肽序列。
在其他实施方式中,当组合文库具有方案(f)的修饰CTLD时,所述氨基酸修饰包括在环4中的四个氨基酸插入。在一个实施方式中,当组合文库具有方案(f)的修饰CTLD时,所述氨基酸修饰包括在环4中的至少四个氨基酸插入和在环4内的至少三个氨基酸的随机置换。在一个具体实施方式
中,所述氨基酸置换包括在环4中的四个氨基酸插入和在环4内的三个氨基酸的随机置换。在其他具体实施方式
中,组合文库的个体成员包括环区域,该环区域包括由下面实施例表3提供的任意或全部多肽序列。在其他实施方式中,当组合文库具有方案(g)的修饰CTLD且CTLD来自四联蛋白时,所述氨基酸修饰还可包括在环4中的一个或更多个氨基酸修饰,其调节CTLD的纤维蛋白溶酶原结合亲和力,例如,赖氨酸148置换为丙氨酸。因此,在某些实施方式中,当CTLD来自人或鼠四联蛋白时,所述氨基酸修饰包括在环3中的至少五个氨基酸残基的随机置换、在环5中的至少三个氨基酸残基的随机置换和在环4中的赖氨酸148置换为丙氨酸。在一个具体实施方式
中,所述氨基酸修饰包括在环3中的五个氨基酸残基的随机置换和在环5中的三个氨基酸残基的随机置换,以及,在另一具体实施方式
中,当CTLD来自人或鼠四联蛋白时,所述氨基酸修饰还包括在环4中的赖氨酸148置换为丙氨酸。在其他具体实施方式
中,组合文库的个体成员包括环区域,该环区域包括由下面实施例表3提供的任意或全 部多肽序列。 在某些实施方式中,当组合文库具有方案(h)的修饰CTLD且CTLD来自四联蛋白时,所述氨基酸修饰还可包括在环4中的一个或更多个氨基酸修饰,其调节CTLD的纤维蛋白溶酶原结合亲和力,例如,赖氨酸148置换为丙氨酸。在某些实施方式中,当CTLD来自人或鼠四联蛋白时,组合文库的成员具有在环3中的至少一个氨基酸的随机置换和至少六个氨基酸的插入和在环4中的赖氨酸148置换为丙氨酸。在一个具体实施方式
中,当组合文库具有方案(h)的修饰CTLD时,所述氨基酸修饰包括在环3中的一个氨基酸的随机置换和六个氨基酸的插入。在一个具体实施方式
中,当CTLD来自人或鼠四联蛋白时,组合文库的成员具有在环3中的一个氨基酸的随机置换和六个氨基酸的插入。和在环4中的赖氨酸148置换为丙氨酸。在任意这些实施方式中,当CTLD来自人或鼠四联蛋白时,置换之一是异亮氨酸140的置换。在其他具体实施方式
中,组合文库的个体成员包括环区域,该环区域包括由下面实施例表3提供的任意或全部多肽序列。在一个实施方式中,当组合文库具有方案(i)的修饰CTLD时,所述氨基酸修饰包括下述的混合在环3中六个氨基酸的随机置换、在环3中六个氨基酸的随机置换和一个氨基酸插入以及在环3中六个氨基酸的随机置换和两个氨基酸插入。在方案(i)的任意实施方式中,当CTLD来自四联蛋白时,所述氨基酸修饰还包括环4中赖氨酸148置换为丙氨酸。在本发明的其他方面,组合多肽文库的多肽成员在环区段A(LSA)和环区段B(LSB)中的任意2、3、4或5个组合环中具有一个或更多个氨基酸修饰。多肽成员还可包括CTLD区域,该区域在LSA和LSB外部的区域中具有氨基酸修饰。在其他具体实施方式
中,组合文库的个体成员包括环区域,该环区域包括由下面实施例表17提供的任意或全部多肽序列。在本发明的某些实施方式中,组合文库由这样的多肽成员组成,该多肽成员在来自人或鼠四联蛋白的CTLD中具有经修饰的环区域。在某些实施方式中,所述多肽成员还可具有CTLD的N-端延伸(extension)和/或C-端延伸。N-端延伸和/或C-端延伸可提供效应子功能、酶功能、进一步结合功能或多聚化功能。在一个实施方式中,N-端延伸和C-端延伸中至少一个包括天然C-型凝集素样蛋白质或C-型凝集素或缺乏功能跨膜结构域的C-型凝集素的非CTDL-部分。在一个实施方式中,所述蛋白质是包含CTLD的部分的多聚体。在本发明的其他实施方式中,多肽成员在环区域中可具有其他由肽接枝引入或通过淘选鉴定的变更,其可提供效应子功能、酶功能、进一步结合功能或多聚化功能。在其他实施方式中,组合文库由这样的多肽成员组成,该多肽成员在全长人或鼠四联蛋白的CTLD区域中具有修饰的环区域。在某些实施方式中,多肽成员可具有四联蛋白的三聚结构域的N-端延伸。所述N-端延伸可提供效应子功能、酶功能、进一步结合功能或多聚化功能。在一个实施方式中,N-端延伸是具有已知功能的肽或多肽或者是通过淘选鉴定的肽。 在另一方面,本发明涉及编码本文所述任意多肽的核酸分子文库。在一个实施方式中,本发明提供编码多肽的核酸分子的文库,该多肽具有含随机化环区域的CTLD,其中所述CTLD的环区域按照本文所述的方案(a)-(i)的任一种随机化。在其他实施方式中,本发明提供编码多肽的核酸分子的文库,所述多肽具有按照方案(a)-(i)任一种随机化的CTLD且具有本文所述的任意其他修饰或序列。核酸分子的文库可以在具有可见表型的展示系统中表达,该可见表型表现所展示的表达产物和相应的基因型的至少一种性质。合适的展示系统的实例包括噬菌体展示系统;酵母展示系统;病毒展示系统;基于细胞的展示系统;核糖体连接展示系统;或质粒连接展不系统。在另一方面,本发明涉及用于产生本文所述的任意多肽的组合文库的方法。因此,本发明提供用于产生多肽组合文库的方法,该多肽具有含随机化环区域的CTLD,其中所述CTLD的环区域按照本文所述的方案(a) - (i)的任一种随机化。在一个实施方式中,所述方法包括在CTLD的LSA区域中的四个环中的至少一个环中产生至少一种随机突变。在另一实施方式中,所述方法包括在CTLD的LSA区域中的四个环中的至少一个环中产生至少一种随机突变和在CTLD的LBA区域中环中产生至少一种随机突变。随机突变可通过寡核苷酸指导的随机化、随机断裂引起的DNA混编、环混编(loop shuffling)、环步移(loop walking)或易错聚合酶链反应诱变和本领域已知的其他方法来产生。在其他实施方式中,本发明提供用于产生多肽组合文库的方法,所述多肽具有按照方案(a) - (i)任一种随机化的CTLD且具有本文所述的任意其他修饰或序列。在另一方面,本发明涉及鉴定和分离对靶分子具有特异性结合活性的多肽的方法。在一个实施方式中,所述方法包括提供具有CTLD的多肽的组合文库,其中所述CTLD的环区域按照方案(a) - (j)的任一种随机化;使该组合多肽文库与靶分子在允许多肽与靶分子结合的条件下接触;和分离与该靶分子结合的多肽。在另一实施方式中,所述方法包括提供多肽的组合文库(所述多肽具有按照方案(a)-(i)任一种随机化的CTLD和本文所述的任意其他修饰或序列);使该组合多肽文库与靶分子在允许多肽与靶分子结合的条件下接触;和分离与该靶分子结合的多肽。所述方法还可包括编码本文所述的组合多肽文库的多肽的核酸分子的文库,其中核酸文库在展示系统中表达,其中所述展示系统包括表现所展示的表达产物和相应的基因型的至少一种性质的可见表型。本发明还涉及利用核酸分子文库鉴定和分离特异性结合靶标的多肽的方法。在一个实施方式中,本发明提供鉴定和分离能够特异性结合靶标的多肽的方法,包括下述步骤提供编码多肽的核酸文库,该多肽具有含随机化环区域的CTLD,其中所述CTLD的环区域按照方案(a) - (j)的任一种随机化;在展示系统中表达核酸文库以获得多肽集合(anensemble of polypeptides),其中,在一个或更多个序列位置上的氨基酸残基在所述多肽集合的不同成员之间是不同的;使该多肽集合与所述靶标接触;和分离能够与所述靶标特异性结合的多肽。在其他实施方式中,本发明提供编码多肽的核酸分子文库,所述多肽具有按照方案(a) - (i)任一种随机化的CTLD且具有本文所述的任意其他修饰或序列。

在另一方面,本发明提供具有C-型凝集素样结构域(CTLD)的支架结构的多肽,其中所述多肽与不同于该CTLD的天然靶标的靶标结合,而且其中该CTLD的CTLD支架结构按照方案(a) - (j)的任一种进行修饰。在一个实施方式中,所述CTLD支架结构按照方案(a) - (j)的任一种进行修饰而且还包括本文所述的任意其他修饰,例如,在CTLD环球区域外的修饰。在一个实施方式中,所述多肽具有来自人或鼠四联蛋白的CTLD的支架结构并与非纤维蛋白溶酶原的靶标结合。多肽可利用具有CTLD的多肽的组合物文库产生,其中所述CTLD的环区域按照方案(a) - (j)的任一种随机化,使该组合多肽文库与靶分子在允许多肽与靶分子结合的条件下接触;和分离与该靶分子结合的多肽,其中所述靶分子不是该CTLD的它天然靶。在该方法的一个实施方式中,CTLD是人或鼠四联蛋白。在该方法的另一实施方式中,所述CTLD的环区域按照方案(a)-(j)的任一种随机化并且包括本文所述的任意其他修饰,例如,在CTLD环区域外的修饰。附图简述图I描绘了 10个已知三维结构的CTLD的氨基酸序列的比对。在每一序列至少标示了主要二级结构元件的序列位置,而且以顺序数字次序进行标记,其中〃 a X"表示a -螺旋数X,而PY表示¢-链数Y。标出了参与CTLD的两个保守二硫键形成的四个半胱氨酸残基并将其标号为C1X11X111和Civ,其中所述二硫键通过C1-Civ和C11-Cm形成。人四联蛋白序列中的各环区域通过下划线标出。各CTLD 包括”hTNn (人四联蛋白,Nielsen 等,(1997))(甘露糖结合蛋白,Weis 等,(1991) ;Sheriff 等,(1994)) ;"SP-D"(表面活性蛋白 D, Hakansson等,(1999)) (NK 受体 LY49A,Tormo 等,(1999)) ;”H1-ASR”(脱唾液酸糖蛋白受体的Hl亚单位,Meier等,(2000)) ;"MMR-4"(巨噬细胞甘露糖受体结构域4,Feinberg等,(2000)) ;"IX-A”和"IX-B”(分别为凝血因子IX/X-结合蛋白结构域A和B,Mizuno 等,(1997) ;"Lit"(膜石蛋白(Iithostatine), Bertrand 等,(1996));和,,TU14"(被囊类C-型凝集素,Poget等,(1999)).图2描述了人与小鼠四联蛋白成熟形式的编码区的核苷酸和氨基酸序列的比对,其中标示了已知的二级结构元件。图3 描绘了分离自人(Swissprot P05452)、小鼠(Swissprot P43025)、鸡(Swissprot Q9DDD4)、牛(Swissprot Q2KIS7)、大西洋鲑鱼(Swissprot B5XCV4)、青娃(Swissprot Q5I0R9)、斑马鱼(GenBank XP_701303)的四联蛋白的数种C-型凝集素结构域,和分离自牛软骨(Swissprot U22298)和礁鲨(Swissprot p26258)的相关CTLD同系物的比对。
图4描绘了人四联蛋白的三维结构(丝带形式),其描述了该蛋白质的二级结构特征。该结构溶于Ca2+-结合形式。图5A描绘了人四联蛋白(HTN)和数种四联蛋白同系物的CTLD的三维覆盖结构,所述四联蛋白同系物包括人甘露糖结合蛋白(MBP)、大鼠甘露糖结合蛋白-C(MBP-C)、人表面活性蛋白D、大鼠甘露糖结合蛋白-A(MBP-A)和大鼠表面活性蛋白A。该CTLD覆盖结构利用Macintosh的Swiss PDB Viewer DeepView v. 4. 0. I、米用人四联蛋白的三维结构作为模板生成。图5B显示来自人四联蛋白和图5A所述四联蛋白同系物的CTLD的相应的氨基酸序列。在图B中,IHUP=人甘露糖结合蛋白,1BV4A=大鼠甘露糖结合蛋白,2GGUA=人表面活性蛋白D,IKXOA=大鼠甘露糖结合蛋白A,1R13=大鼠表面活性蛋白A。图6A描述了人四联蛋白(HTN)和数种四联蛋白同系物的CTLD的三维覆盖结构,所述四联蛋白同系物包括人胰腺炎相关蛋白、人树突细胞特异性ICAM-3-捕获性非整联蛋白2 (DC-SIGNR)、大鼠聚集蛋白聚糖、小鼠清道夫受体和人清道夫受体。该CTLD覆盖结构利用Macintosh的Swiss PDB Viewer DeepView v. 4. 0. I、米用人四联蛋白的三维结构作为模板生成。图6B显示来自人四联蛋白和图6A所述四联蛋白同系物的CTLD的相应的氨基酸序列。在图6B中,ITDQB=大鼠聚集蛋白聚糖,IUVOA=人胰腺炎相关蛋白,20X8A=人清道夫受体,20X9A=小鼠清道夫受体,和1SL6A=人DC-SIGNR。图7显示用于在CTLD中产生随机环的PCR策略。图8显示经过修饰包含克隆用限制性位点的人四联蛋白CTLD的DNA和氨基酸序列,表明Ca2+结合位点。限制性位点用实线下划线标出。环用虚线下划线行出。钙配位残基用加粗斜体表示,并包括位点I :D116五120、G147、五150、iV151;位点2: 0143、D145、五150、D165。CTLD结构域在氨基酸A45处开始,加粗表示(即ALQTVCL...)。用小写字母表示对本体四联蛋白(TNCTLD)碱基序列的改变。使用不改变天然氨基酸序列的沉默突变产生限制性位点。 图9描绘在CTLD环区域中延长和引入随机化的非限定性策略。

图10显示在下述五种DR5 ATRMER 存在下策略细胞死亡的实验结果4a8c、2ala、la7b、9b3d 和 8b6b。用 DR5 ATRMER (20 y g/mL)或 TRAIL(0. 2 y g/mL)以 IxlO4 细胞/孔温育H2122肺腺癌细胞和A2780卵巢癌细胞。数据以相当于各缓冲液对照的细胞死亡百分比表达。图11显示本发明多肽及天然IL-23与人IL-23R结合比较的实验结果。图12显示在本发明的ATRMER 复合物4G8、天然人IL-23和优特克单抗(Ustekinumab)存在下IL-23-诱导的IL-17产生比较的实验结果。图13显示在本发明的ATRMER 复合物1A4和优特克单抗存在下IL-23-诱导的IL-17产生比较的实验结果。图14显示在本发明的ATRMER 复合物4G8、天然人IL-23和优特克单抗(Ustekinumab)存在下IL-12-诱导的IFNy产生比较的实验结果。图15显示NKL细胞中响应IL-23和本发明多肽的Stat-3磷酸化比较的实验结果。图16A和16B是显示与若干本发明的ATRMER 多肽复合物相关的实验结果表。发明详述定义
遍及本申请使用的所有科学和技术术语应当理解为具有其常见的科学/技术含义,除非另外具体说明。类似地,当使用单数形式的术语或冠词时,应当理解其还包括该术语或冠词的复数形式。术语"C-型凝集素样蛋白质〃和"C-型凝集素〃用于指存在于任意真核物种的基因组中或在其中编码任何蛋白质或多肽,其中该蛋白质或多肽含一个或更多个C-型凝集素结构域(CTLD)或一个或更多个属于CTLD的任意亚组的一个或更多个结构域(例如,CRD,其能够结合碳水化合物配体)。该定义包括连接膜的C-型凝集素样蛋白质和C-型凝集素、缺乏功能跨膜结构域的"可溶性"C-型凝集素样蛋白质和C-型凝集素,及变体C-型凝集素样蛋白质和C-型凝集素(其中一个或更多个氨基酸残基通过糖基化或任何其他合成后修饰体内进行了变更),以及通过C-型凝集素样蛋白质和C-型凝集素的化学和酶修饰而得到的任何产物。在权利要求书和整个说明书中,一些变更可参照CTLD或含CTLD蛋白质的特定氨基酸残基数目来确定。参见,Essentials of Glycobiology, second edition.Edited by A. Varki, R. D. Cummings, J. D. Eskoj HH. Freeze, P. Stanley, C. R. Bertozz i, G.W. Hart, M. E. Etzler. CHS Press。所述CTLD由约120个氨基酸残基组成,而且特有地含两个或三个链内二硫键。尽管来自不同蛋白质的CTLD之间在氨基酸序列水平上的相似度相对低,但是已经发现许多CTLD的三维结构是高度保守的,其中结构可变性基本局限于环区域,通常由至多五个环限定。若干CTLD含一个或两个钙结合部位,而且与钙相互作用的大部分侧链位于该环区域中。基于其三维结构信息是可用的CTLD,已经推断出,规范CTLD的结构特征在于以下述次序顺序出现的7个主要的二级结构元件(即五个P -链和两个螺旋)P I、a I、a 2、
32、P 3、P 4和P 5。图I图解了十个C-型凝集素的已知三维结构的CTLD的比对。在三维结构已经确定的所有CTLD中,^链以两个反平行¢-折叠排列,一个由P I和¢5构成,另一个由0 2、¢3和¢4构成。其他¢-链¢0在序列中通常位于P I之前,而且,当存在时,其形成与@ I、@ 5折叠结合的其他链。此外,两个二硫键,一个连接a I和^S(C1-Civ),一个连接P 3和连接P 4与P 5的多肽区段(C11-Cm),迄今为止始终发现于所有CTLD中。保守的二级结构元件(a螺旋和P折叠)为很多环形成从核心向外伸出的致密支架,其在本上下文中统称为“环区域”。在CTLD的一级结构中,这些环被组织成两个区段,环区段A(LSA)和环区段B(LSB)。LSA表示连接¢2和P 3的长多肽区段,其通常缺乏常规的二级结构并含有多达4个环。LSB表示连接¢-链的¢3和P 4的多肽区段。LSA中的残基连同¢4中的单残基已经显示出特定于若干CTLD(包括四联蛋白的CTLD在内)的Ca2+-和配体-结合部位。例如,诱变研究(包括单或数个残基的置换)已经显示结合特异性、Ca2+-敏感性和/或亲和力的变化可通过CTLD结构域来调节。如本文所讨论的,许多含有CTLD的蛋白是已知的,包括下述非限定性实例四联蛋白、胰石蛋白(Iithostatin)、小鼠巨曬细胞半乳糖凝集素、星形细胞受体(Kupffer cellreceptor)、鸡神经聚糖、perlucin、唾液酸糖蛋白受体、软骨蛋白多糖核心蛋白、IgE Fe受体、胰腺炎相关蛋白、鼠巨噬细胞受体、自然杀伤细胞组、干细胞生长因子、因子IX/X结合蛋白、甘露糖结合蛋白、牛共凝集素、牛CL43、胶原凝集素肝I、表面活性蛋白A、表面活性蛋白D、e-选择蛋白、被囊类C-型凝集素、CD94NK受体结构域、LY49A NK受体结构域、鸡肝凝集素、鳟鱼C-型凝集素、结合HIV gp 120的C-型凝集素和树突细胞免疫受体。参见美国2007/0275393,该文献以其整体通过参考并入本文。术语〃氨基酸(amino acid, amino acids) 〃和〃氨基酸残基〃是指所有天然存在的L-氨基酸以及非天然存在的氨基酸。该定义意图包括正亮氨酸、鸟氨酸和高半胱氨酸。天然存在的L-氨基酸可按照其侧链的化学组成和性质来分类。其被广泛分为两组,带电的不带电的。这些组的每一组被分为亚组,以便更精确地为氨基酸分类A.带电氨基酸-(A. I.酸性残基)Asp,Glu; (A. 2.碱性残基)Lys,Arg,His,0rn;B.不带电氨基酸_(B. I.亲水残基):Serj Thrj Asnj Gin; (B. 2.脂族残基)Gly,Ala, Valj Leu, He, Nle; (B.
3.非极性残基)Cys,Met,Pro,Hcy; (B. 4.芳香残基)Phe,Tyr,Trp。〃非天然氨基酸〃或“非天然存在的氨基酸” 是指不属于20个普通氨基酸之一的氨基酸,其包括例如通过天然编码氨基酸(包括但不限于,20个普通氨基酸或焦赖氨酸(pyrolysine)和砸代半胱氨酸)的修饰(例如,翻译后修饰)而产生的氨基酸,但是所述氨基酸并非是通过翻译复合物(translation complex)自然引入生长多肽链中的其自身。此类非天然存在的氨基酸的实例包括但不限于N-乙酰氨基葡糖-L-丝氨酸、N-乙酰氨基葡糖-L-苏氨酸和0-磷酸酪氨酸。很多适于用在本发明中的非天然氨基酸是商业可得的,例如来自Sigma(USA)或Aldrich (Milwaukee,Wis.,USA)。非商业可得的那些非天然氨基酸任选通过如本文所提供的方法或如在各种出版物中所提供的方法或者利用本领域技术人员知晓的标准方法来合成。关于有机合成技术,参见例如Organic Chemistry by Fessendon andFessendon,(1982,Second Edition, Willard Grant Press, Boston Mass.) ;AdvancedOrganic Chemistry by March(Third Edition, 1985, Wiley and Sons, New York);和 Advanced Organic Chemistry by Carey and Sundberg (Third Edition, PartsA and B,1990,Plenum Press, New York)。描述非天然氨基酸合成的其他出版物保留例如W0 2002/085923,名称"In vivo incorporation of Unnatural AminoAcids〃 ;Matsoukas 等,(1995)J. Med. Chem.,38,4660-4669 ;King,F. E.& Kidd,D.A.A. (1949)A New Synthesis of Glutamine and of. gamma. -Dipeptides of GlutamicAcid from Phthylated Intermediates. J. Chem. Soc.,3315—3319 ;Friedman,0.M. & Chatterrji, R. (1959)Synthesis of Derivatives of Glutamine as ModelSubstrates for Anti-Tumor Agents. J. Am. Chem. Soc. 81,3750-3752 ;Craig,J.C.等(1988)Absolute Configuration of the Enantiomers of7-Chloro-4[[4-(diethylamino) - I-methylbutyl]amino]quinoline(Chloroquine).J.Org.Chem.53,1167-1170 ;Azoulay, M. , Vilmont, M. & Frappier,F. (1991) Glutamine analogues as PotentialAntimalarials,Eur. J. Med. Chem. 26,201-5 ;Koskinen,A. M. P. & Rapoport,H. (1989)Synthesis of 4—Substituted Prolines as Conformationally Constrained AminoAcid Analogues. J. Org. Chem. 54,1859-1866 ;Christie, B. D. & Rapoport, H. (1985)Synthesis of Optically Pure Pipecolates from L-Asparagine. Application to theTotal Synthesis of (+)-Apovincamine through Amino Acid Decarbonylation andIminium Ion Cyclization. J. Org. Chem. 1989:1859-1866 ;Barton 等,(1987)Synthesisof Novel a -Amino-Acids and Derivatives Using Radical Chemistry:SynthesisofL-and D- a -Amino-Adipic Acids,L- a -aminopimelic Acid and AppropriateUnsaturated Derivatives. Tetrahedron Lett. 43:4297-4308 ;和 Subasinghe 等,(1992)Quisqualic acid analogues: synthesis of beta-heterocyclic2-aminopropanoic acidderivatives and their activity at a novel quisqualate-sensitized site. J. Med.Chem. 35:4602-7。还可参见 US2004/0198637 和 US 2005/0170404,其每一篇以其整体并入本文作为参考。 术语“氨基酸修饰”和“修饰”是指氨基酸序列中相对于天然序列的氨基酸置换、缺失或插入或其任意组合。在此,置换的变体是那些在天然CTLD序列中去除至少一个氨基酸残基并在相同位置处插入不同的氨基酸的变体。置换可以是单一的,其中在分子中仅仅置换一个氨基酸,或者也可以是多重的,其中在同一分子中置换有两个或更多个氨基酸。具体提到CTLD中的一个以上氨基酸置换是指其中每个单个的氨基酸置换可以发生在CTLD中任意氨基酸位置(包括连续和不连续的氨基酸位置)处的多重置换。类似地,具体提到CTLD中的一个以上的氨基酸插入或缺失是指其中每个单个的氨基酸插入或缺失可以发生在CTLD中任意氨基酸位置(包括连续和不连续的氨基酸位置)处的多重插入或缺失。术语“核酸分子编码”、“DNA序列编码”和“DNA编码”是指沿脱氧核酸链的脱氧核苷酸的顺序或序列。这些脱氧核苷酸的顺序决定了沿着肽链的氨基酸的顺序。DNA序列由此编码氨基酸序列。任何上下文中使用的识别随机化多肽或核酸序列的术语“随机化”、“加以随机化”和“随机化的”以及任何类似的术语是指多肽或核酸序列或区段的系综(ensembles),其中在多肽或核酸系综的不同成员之间,一个或多个序列位置处的氨基酸残基或核苷酸可以不同,使得在每个这样的序列位置处出现的氨基酸残基或核苷酸可以属于一组氨基酸残基或核苷酸,其可包括所有可能的氨基酸残基或核苷酸或其任意严格亚型。该术语常用来指其中对于系综的每个成员可能的氨基酸残基或核苷酸的数目相同的系综,但是也可用来指其中系综的每个成员中可能的氨基酸残基或核苷酸的数目可以是适当整数范围内的任意整数的系综。术语“调节(modulate或modulating) ”当用于指CTLD与纤维蛋白溶酶原、金属(例如,Mg2+,Ca2+,Zn2+,Mn2+等)或任意其他靶分子的结合亲和力时,指的是修饰CTLD与纤维蛋白溶酶原或金属离子或靶分子的结合亲和力相对于天然(未经修饰的)CTLD多肽的结合亲和力的改变。因此,"调节"包括增加结合亲和力、降低结合亲和力和/或完全破坏或取消结合亲和力(尽管并非排除对术语。术语〃完全破坏〃或〃取消(abrogating) 〃纤维蛋白溶酶原、金属离子或靶分子结合活性的具体描述)。当涉及结合对时,诸如配体/受体、抗体/抗原或其他结合对,在结合反应中测量结合,所述结合反应用于测定结合对的一个成员在该结合对中另一成员的异源群体中的存在。在指定条件下,当结合对的一个成员与该结合对的另一成员在异源群体中结合而且不以显著量与样品中存在的其他蛋白质或多肽结合时,发生"特异性结合"。特异性结合可利用本文所述的方法测量,包括Biacore和ELISA。术语“ 1X-2文库”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括在该CTLD的环I中的至少两个氨基酸插入和在其环I内的至少五个氨基酸的随机置换。术语“1-2文库”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括在环I内的至少五个氨基酸的随机置换和在环2内的至少三个氨基酸的随机置换。术语“1-4文库”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括在环I内的至少七个氨基酸的随机置换、在环4中的至少三个氨基酸插入和至少两个氨基酸的随机置换。术语“3X文库”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括下述的混合至少六个氨基酸的随机置换;至少六个氨基酸的随机置换和至少一个氨基酸置换;以及在环3中的至少六个氨基酸的随机置换和至少两个氨基酸置换。术语“3-4X文库”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少三个氨基酸插入和在环3内的至少三个氨基酸的随机置换,以及包括在环4中的至少三个氨基酸插入和在环4内的至少三个氨基酸的随机置换。术语“3-4组合文库(combo library) ”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括将两个环组合成单个环的修饰,其中两个经组合的环是环3和环4。术语“4文库”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括在环4中的至少四个氨基酸插入和在环4内的至少三个氨基酸的随机置换.术语“3-5文库”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括在环3内的至少五个氨基酸的随机置换和在环5内的至少三个氨基酸的随机置换。术语“环3X环文库”是指组合多肽文库,其包括含有C-型凝集素结构域(CTLD)的多肽成员,所述C-型凝集素结构域包含在该CTLD的LSA中的四个环中至少一个环中的氨基酸修饰,其中所述氨基酸修饰包括至少一个氨基酸的随机置换和至少六个氨基酸插入。具有经修饰CTLD的组合多肽文库本发明通常涉及组合多肽文库,其包含含有C-型凝集素结构域(CTLD)的多肽成 员,所述C-型凝集素结构域具有随机化环区域,其中所述随机化环区域已经从该CTLD的天然序列进行修饰。该CTLD的随机化环区域可包含在该CTLD的环区段A(LSA)中的四个环中至少一个环中的一个或更多个氨基酸修饰,而且还可包含在环区段B(LSB)的环中(也称为环5)的一个或更多个氨基酸修饰。本发明还涉及产生及利用所述随机化组合多肽文库的方法。通过应用化学重组蛋白质和抗体领域已知的标准组合物方法,本发明的所述文库和方法使得可产生、筛选及鉴定对感兴趣靶分子展示结合特异性的蛋白质产物。在天然存在的CTLD中结合部位构型的变化显示其共同的核结构可容纳很多基本不同的配体结合部位构型(参见例如US2007/0275393)。因此,CTLD特别适于用作构建此类具有期望的结合特性的新型且有用的蛋白质产物。因此,尽管一方面本发明涉及包含对CTLD的环区域(LSA和LSB)进行修饰的组合多肽文库,但是可进行对普通CTLD核结构(SP,
链和a-螺旋)的其他修饰,而不会影响本文所述的文库的实用性。本领域技术人员可靶向CTLD核结构中将会保留CTLD功能性的的特定修饰。例如,基于包含CTLD的各种多肽的二级和三级结构,亲水性、电荷(离子)和氢键相互作用都可被考虑在内,可进行保留CTLD功能的适当置换。此类修饰包括保守氨基酸置换。在CTLD的环区域外部的区域中包 含变体诸如、缺失、插入或置换变体的实施方式中,同一性百分比可低达50%。在包含位于CTLD区域内的此类变化的实施方式中,变体与任何特定CTLD序列或CTLD共有序列具有至少80%同一性。在某些实施方式中,此类变体与任何特定CTLD序列或CTLD共有序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 的同一性。组合文库中所用的CTLD可得自任何CTLD。适当的CTLD实例是本文(S卩,图1_3)及US 2007/0275393(该专利以整体并入本文作为参考)中所述的CTLD ( S卩,图I和表I),以及本领域另外已知的CTLD。在某些实施方式中,CTLD具有下述二级结构以次序P I、a I、a 2、@ 2、@ 3、M和P 5顺序出现的五个@ -链和两个a -螺旋,所述@ -链以两个反平行¢-折叠排列,一个由¢1和¢5组成,另一个由¢2, ¢3和P 4组成;至少两个二硫键,一个连接a I和¢5,而一个连接¢3和连接¢4与¢5的多肽区段;和含环区段A (LSA)和环区段B (LSB)的环区域,其中LSA连接P 2和P 3,而LSB连接P 3和3 4。在特定实施方式中,CTLD序列是按照本发明进行修饰的人或小鼠四联蛋白CTLD序列。图2显示了人和小鼠四联蛋白CTLD的核酸和堕胎序列的比对。在其他实施方式中,所述CTLD来自多种肽,例如,在图3中所示的那些,图3显示了分离自人(SwissprotP05452)、小鼠(Swissprot P43025)、鸡(Swissprot Q9DDD4)、牛(Swissprot Q2KIS7)、大西洋鲑鱼(Swissprot B5XCV4)、青娃(Swissprot Q5I0R9)、斑马鱼(GenBank XP_701303)的四联蛋白的数种CTLD,和分离自牛软骨(Swissprot u22298)和礁鲨(Swissprot p26258)的相关CTLD同系物的比对。因此,在广义方面,本发明提供多肽文库,其包括含C-型凝集素结构域(CTLD)的多肽成员,其中所述CTLD包括在CTLD的环区段A(LSA)中的四个环中的至少一个中的和/或在环区段B(LSB)的环(环5)中的一个或更多个氨基酸修饰。本文描述了多肽文库,其包括含有C-型凝集素结构域的多肽,所述C-型凝集素结构域包括在该CTLD的环区域(LSA和LSB)中的五个环中至少一个环中的一个或更多个氨基酸修饰。在多肽文库的某些实施方式中,多肽成员含有CTLD,其中该CTLD环中的一个、两个、三个、四个或五个具有一个或更多个氨基酸修饰,其中所述一个或更多个氨基酸修饰包括使环区域延伸超出其原始长度的至少一个氨基酸插入。在这些实施方式的某一些中,所述一个或更多个氨基酸修饰包括在环区域(LSA和LSB)的任意单个环中的I至约30个氨基酸插入(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个氨基酸插入)。在这些实施方式的某一些中,所述一个或更多个修饰包括在环区域的五个环中的至少两个环中的至少一个氨基酸插入(例如,LSA中的两个、三个或四个环,或者LSA中的一个、两个或三个环和LSB中的一个环)。在某些实施方式中,多肽文库包括含C-型凝集素结构域(CTLD)的多肽成员,其中所述CTLD包括在环区域(LSA和LSB)中的五个环中的至少一个环中的一个或更多个氨基酸修饰,其中某些与环区域中的氨基酸配位的Ca2+得以保留。在其他实施方式中,多肽文库包括含C-型凝集素结构域(CTLD)的多肽成员,其中所述CTLD包括在环区域(LSA和LSB)中的五个环中的至少一个环中的一个或更多个氨基酸修饰,其中某些参与纤维蛋白溶酶原结合活性的氨基酸被消除。在该方面的某些实施方式中,多肽文库包括含C-型凝集素结构域(CTLD)的多肽成员,其中所述CTLD包括落在LSA和LSB区域外的CTLD区域中的一个或更多个氨基酸修饰。因此,此类修饰可以在任意一个或多个3链和/或a螺旋区域中设计或随机产生。该实例显示在表17中。任意CTLD的环区域,如果还未鉴定或表征,则可通过利用任意种类的基于结构或序列的分析、利用任意单个已结构表征的CTLD或已结构表征的CTLD的任意组合的基于现有序列的信息进行鉴定。通常,环区域是发现于CTLD氨基酸序列的更有序区域之间(例如,在a-螺旋或¢-链之间)的氨基酸的一段序列,且其通常具有更柔韧的构象。CTLD中的环区段A(LSA)通常落在规范CTLD基序的P 2与P 3链之间。(LSA)含有较小的环区域(环1、2、3和4),该区域通常位于小P折叠结构之间,该结构为(LSA)赋予有序程度(参见例如图4)。CTLD通常具有位于¢3与¢4之间的较小的环结构(环区段B,〃LSB〃或〃环 5")。如上所述,可基于任意单个已结构表征的CTLD或已结构表征的CTLD的任意组合的现有序列信息,利用基于结构和/或序列的分析来鉴定任意CTLD的环区域。例如,任意未表征CTLD的环区域的位置可通过比对预期的CTLD序列与图I所呈现的结构已表征CTLD组来鉴定。图I所示的序列比对根据三维结构数据进行严格解释。倘若框架的相应结构元件的多肽区段也展示很强的氨基酸序列相似性,则图I提供一组直接的序列-结构标记,其可容易地根据序列比对来推断。入在图I中所示,环区域(LSA和LSB)位于对应于^ 2-链、P 3-链和P 4-链的区段侧面(LSA的环1-4通常落在规范CTLD的P 2与P 3链之间,而LSB的环5通常位于CTLD的P 3与M之间)。P 2-链、P 3-链和P 4-链可通过鉴定其各自的共有序列来鉴定(公布于美国专利申请公开2007/0275393中)。通过将预期CTLD的序列与图I所示的序列进行比对,并如序列比对所指导来分配框架结构元件的位置(即,鉴定¢2-链、¢3-链和¢4-链,调整比对,以确保参与迄今不变地发现于所有已表征CTLD中的两个保守二硫键(图I中的C1-Civ和C11-Cm)形成的四个规范半胱氨酸残基的精确比对),可鉴定预期CTLD的环区域。此外,通过将预期CTLD的序列与图I中的任意CTLD序列进行比对,利用已知的蛋白质模拟程序鉴定诸如Macintosh的Swiss PDBViewer DeepView v. 4. 0. I,可以鉴定CTLD的环区域。可以相同习惯使用的其他蛋白质模拟程序是本领域已知的且由于公众应用而是可得的,例如,MODELLER and Selvita SPMP2.0(见 Sali A, Blundell TL. (1993)Comparative protein modelling by satisfactionof spatial restraints. J. Mol. Biol. 234,779-815 ;Marti_Renom MAj Stuart A,FiserA, Sanchez R, Melo F, Sali A. (2000)Comparative protein structure modeling of genesand genomes. Annu. Rev. Biophys. Biomol. Struct. 29, 291-325 ;Fiser A, Sali A. (2003)Modeller:generation and refinement of homology-based protein structure models.Methods Enzymol. 374:461-91)。序列-结构分子也证实,CTLD可用作构建新CTLD文库种类的框架。基于精确三维结构还未测定的CTLD来制备用于构建新CTLD文库种类原材料所涉及的其他步骤包括下述(I)将新CTLD的序列与图I中所示的序列进行比对;和⑵按照序列比对的指导分配框架结构元件的近似位置,观察是否需要对该比对进行微小调整,以确保参与两个保守二 硫键(图I中的C1-Civ和C11-C111)形成的四个规范半胱氨酸残基的精确比对。用于本发明多肽文库中的含CTLD的多肽可以是具有CTLD的全长蛋白质或部分蛋白质,例如,本文所述及另外已知的任意蛋白质的全长氨基酸序列或部分氨基酸序列。可选地,用于本发明多肽文库中的含CTLD的多肽可以是仅含CTLD序列的多肽,例如,本文所述及另外已知的任意CTLD的氨基酸序列。含CTLD序列的多肽可以具有添加的侧翼C-端和/或N-端(非-CTLD)氨基酸序列。一方面,本发明提供组合肽文库和编码该文库的多肽的核酸序列的文库,其中所述多肽的CTLD已经按照多种方案进行修饰,仅出于识别的目的,所述方案已经被标记为方案(a)-(j)。尽管每个方案在本文中进行了更具体的描述,但是所述修饰至少如下述在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环I中的至少一个氨基酸插入在环I内的至少五个氨基酸的随机置换;在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环I内的至少五个氨基酸的随机置换和在环2内的至少三个氨基酸的随机置换;在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环I内的至少七个氨基酸的随机置换和在环4中的至少一个氨基酸插入;在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少一个氨基酸插入和在环3内的至少三个氨基酸的随机置换;在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括将两个环组合成单个环的修饰,其中两个经组合的环是环3和环4 ;在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环4中的至少一个氨基酸插入和在环4内的至少三个氨基酸的随机置换;在CTLD的环区段A (LSA)和环区段B (LSB)中的五个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少五个氨基酸残基的随机置换和在环5内的至少三个氨基酸的随机置换;在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少一个氨基酸的随机置换和至少六个氨基酸的插入;⑴在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括下述的混合(I)在环3中的至少六个氨基酸的随机置换和,(2)在环3中的至少六个氨基酸的随机置换和至少一个氨基酸插入;和(j)在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在CTLD的环区段A(LSA)的四个环中的至少一个中的或在环区段B(LSB)的环5中的至少四个或更多个氨基酸插入。关于方案(a),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在该CTLD的LSA的四个环中的至少一个中的或在LSB的环中的氨基酸修饰,其中所述氨基酸修饰包括在环I中的至少一个氨基酸插入和在环I内的至少五个氨基酸的随机置换。在组合文库的该方面的某些实施方式中,当CTLD来自人类四联蛋白时,该CTLD还具有精氨酸-130的随机置换。对于非人类四联蛋白的CTLD的CTLD而言,该肽的位置紧邻C端方向的环2的C端肽。例如,在鼠四联蛋白中,该肽是Gly-130。在组合文库的该方面的某些实施方式中,当CTLD来自四联蛋白时,例如,人或鼠四联蛋白,该CTLD包括在环4中的赖氨酸-148置换为丙氨酸。在某些实施方式中,当组合文库具有方案(a)的修饰CTLD,所述氨基酸修饰包括 在环I中的两个氨基酸插入和在环I内的至少五个氨基酸的随机置换。在其他实施方式中,当组合文库具有方案(a)的修饰CTLD而且CTLD来自人类四联蛋白时,所述氨基酸修饰包括在环I中的至少一个氨基酸插入、在环I内的至少五个氨基酸的随机置换,并且包括精氨酸130的随机置换。在一个具体实施方式
中,当组合文库具有方案(a)的修饰CTLD而且CTLD来自人类四联蛋白时,所述氨基酸修饰包括在环I中的两个氨基酸插入、在环I内的五个氨基酸的随机置换和精氨酸130的随机置换。在一个具体实施方式
中,当组合文库具有方案(a)的修饰CTLD而且CTLD来自鼠四联蛋白时,所述氨基酸修饰包括在环I中的两个氨基酸插入、在环I内的五个氨基酸的随机置换和亮氨酸130的随机置换。在方案(a)的任意实施方式中,所述氨基酸修饰还可包括赖氨酸-148置换为丙氨酸。因此,在组合文库的该方面的一个具体实施方式
中,所述CTLD包括在环I中的两个氨基酸插入、在环I内的至少五个氨基酸的随机置换、精氨酸-130或位于C端方向环2外部或邻近的其他氨基酸的随机置换以及在环4中赖氨酸-148置换为丙氨酸。关于方案(b),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在该CTLD的LSA的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环I内的至少五个氨基酸的随机置换和在环2内的至少三个氨基酸的随机置换。在方案(b)的组合文库的该方面的某些实施方式中,当CTLD来自四联蛋白时,所述氨基酸修饰包括在环I内的至少五个氨基酸的随机置换、环2内至少三个氨基酸的随机置换以及精氨酸-130或位于C端方向环2外部或邻近的其他氨基酸的随机置换。在某些实施方式中,当组合文库具有方案(b)的修饰CTLD而且CTLD来自人类四联蛋白时,所述氨基酸修饰包括在环I中的至少五个氨基酸的随机置换、在环2中的至少三个氨基酸的随机置换,并且包括精氨酸130的随机置换。在一个实施方式中,当组合文库具有方案(b)的修饰CTLD而且CTLD来自人类四联蛋白时,所述氨基酸修饰包括在环I中的五个氨基酸的随机置换、在环2中的三个氨基酸的随机置换和精氨酸130的随机置换。在某些其他实施方式中,当组合文库具有方案(b)的修饰CTLD而且CTLD来自鼠四联蛋白时,所述氨基酸修饰包括在环I中的至少五个氨基酸的随机置换、在环2中的至少三个氨基酸的随机置换,并且包括亮氨酸130的随机置换。在一个实施方式中,当组合文库具有方案(b)的修饰CTLD而且CTLD来自鼠四联蛋白时,所述氨基酸修饰包括在环I中的五个氨基酸的随机置换、在环2中的三个氨基酸的随机置换和亮氨酸130的随机置换。在方案(b)的任意实施方式中,所述氨基酸修饰还可包括赖氨酸-148置换为丙氨酸。因此,在一个具体实施方式
中,所述氨基酸修饰包括在环I内的至少五个氨基酸的随机置换、环2内至少三个氨基酸的随机置换,以及精氨酸-130或位于C端方向环2外部或邻近的其他氨基酸的随机置换,以及在环4中赖氨酸-148置换为丙氨酸。关于方案(C),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在该CTLD的环区段A(LSA)的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环I内的至少七个氨基酸的随机置换和在环4中的至少一个氨基酸插入。在组合文库的该方面的某些实施方式中,所述组合文库的多肽成员还包括在环4 内的至少两个氨基酸的随机置换。在该方面的某些其他实施方式中,所述氨基酸修饰包括在环4内的三个氨基酸插入,以及任选还包括至少两个氨基酸的随机置换。在一个实施方式中,所述氨基酸修饰包括在环I内的至少七个氨基酸的随机置换、在环4中的至少三个氨基酸插入以及在环4内的至少两个氨基酸的随机置换。在一个具体实施方式
中,所述氨基酸修饰包括在环I内的七个氨基酸的随机置换、在环4中的三个氨基酸插入以及在环4内的两个氨基酸的随机置换。关于方案(d),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在该CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少一个氨基酸插入和在环3内的至少三个氨基酸的随机置换。在某些实施方式中,当组合文库具有方案(d)的修饰CTLD时,所述氨基酸修饰还可包括在环4中的至少一个氨基酸插入,并且还可包括在环4内的至少三个氨基酸的随机置换。在任意所述的方案(d)的实施方式中,所述氨基酸修饰可包括在环3中的三个氨基酸插入。在任意所述的方案(d)的实施方式中,所述氨基酸修饰可包括在环4中的三个氨基酸插入。因此,在某些实施方式中,所述氨基酸修饰包括在环3内的至少三个氨基酸的随机置换、在环4内的至少三个氨基酸的随机置换、在环3中的至少一个氨基酸插入和在环4中的至少一个氨基酸插入。在某些实施方式中,所述氨基酸修饰包括在环3内的至少三个氨基酸的随机置换、在环4内的至少三个氨基酸的随机置换、在环3中的至少三个氨基酸插入和在环4中的至少三个氨基酸插入。在一个具体实施方式
中,所述氨基酸修饰包括在环3内的三个氨基酸的随机置换、在环4内的三个氨基酸的随机置换、在环3中的三个氨基酸插入和在环4中的三个氨基酸插入。在任意上述实施方式中,当CTLD是四联蛋白时,氨基酸修饰还可包括环4中赖氨酸-148至精氨酸的随机置换。关于方案(e),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括将两个环组合成单个环的修饰,其中两个经组合的环是环3和环4。在某些实施方式中,当组合文库的成员具有方案(e)的修饰CTLD时,所述氨基酸修饰包括环3内的至少六个氨基酸的随机置换和环4内的至少四个氨基酸的随机置换。在一个具体实施方式
中,所述氨基酸修饰包括环3内的六个氨基酸的随机置换和环4内的四个氨基酸的随机置换。在方案(e)的任意实施方式中,当CTLD来自人类四联蛋白时,所述氨基酸修饰还可包括脯氨酸-144的随机置换。在一个具体实施方式
中,当CTLD来自人类四联蛋白时,所述氨基酸修饰包括环3内六个氨基酸的随机置换、环4内四个氨基酸的随机置换和脯氨酸-144的随机置换,产生组合的环3和环4氨基酸序列,其包括,例如,NWEXXXXXXX XGGXXXN(SEQ ID NO:578),其中X是任意氨基酸,且SEQID NO:578的氨基酸序列形成单个环区域。因此,在一个具体实施方式
中,组合文库的多肽成员包括序列NWEXXXXXXXXGGXXXN (SEQ ID NO: 578),其中X是任意氨基酸,且其中SEQ IDNO:578的氨基酸序列从经组合并经修饰的环3和环4形成单个环。关于方案(f),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在CTLD的环区段A(LSA)中的四个环中的
至少一个中的氨基酸修饰,其中所述氨基酸修饰包括在环4中的至少一个氨基酸插入和在环4内的至少三个氨基酸的随机置换。在某些实施方式中,所述氨基酸修饰包括在环4中的四个氨基酸插入。在一个实施方式中,所述氨基酸修饰包括在环4中的至少四个氨基酸插入和在环4内的至少三个氨基酸的随机置换。在一个具体实施方式
中,所述氨基酸置换包括在环4中的四个氨基酸插入和在环4内的三个氨基酸的随机置换。关于方案(g),组合文库的多肽成员包括经修饰的环3和经修饰的环5,其中该经修饰的环3包括五个氨基酸残基随机化,而该经修饰环5包括三个氨基酸残基随机化。在一个实施方式中,组合文库的多肽成员包括经修饰的环3、经修饰的环5和经修饰的环4,其中对环4的修饰消除了纤维蛋白溶酶原结合。例如,当组合文库具有方案(g)的修饰CTLD且CTLD来自四联蛋白时,所述氨基酸修饰还可包括在环4中的一个或更多个氨基酸修饰,其调节CTLD的纤维蛋白溶酶原结合亲和力,例如,赖氨酸148置换为丙氨酸。因此,在某些实施方式中,当CTLD来自人或鼠四联蛋白时,所述氨基酸修饰包括在环3中的至少五个氨基酸残基的随机置换、在环5中的至少三个氨基酸残基的随机置换和在环4中的赖氨酸148置换为丙氨酸。在一个具体实施方式
中,所述氨基酸修饰包括在环3中的五个氨基酸残基的随机置换和在环5中的三个氨基酸残基的随机置换,以及,在另一具体实施方式
中,当CTLD来自人或鼠四联蛋白时,所述氨基酸修饰还包括环4中的赖氨酸148置换为丙氨酸。关于方案(h),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括至少一个氨基酸的随机置换和至少六个氨基酸插入。在某些实施方式中,当CTLD来自四联蛋白时,所述氨基酸修饰还可包括在环4中的一个或更多个氨基酸修饰,其调节CTLD的纤维蛋白溶酶原结合亲和力,例如,赖氨酸148置换为丙氨酸。在某些实施方式中,当CTLD来自人或鼠四联蛋白时,组合文库的成员具有在环3中的至少一个氨基酸的随机置换和至少六个氨基酸的插入和在环4中的赖氨酸148置换为丙氨酸。在一个具体实施方式
中,所述氨基酸修饰包括在环3中的一个氨基酸的随机置换和六个氨基酸的插入。在一个具体实施方式
中,当CTLD来自人或鼠四联蛋白时,组合文库的成员具有在环3中的一个氨基酸的随机置换和六个氨基酸的插入。和在环4中的赖氨酸148置换为丙氨酸。在任意这些实施方式中,当CTLD来自人或鼠四联蛋白时,置换之一是异亮氨酸140的置换。关于方案(i),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括下述的混合在环3中的六个氨基酸的随机置换和在环3中六个氨基酸的随机置换和一个氨基酸插入。在一个实施方式中,所述混合还包括在环3中的六个氨基酸的随机置换和两个氨基酸插入。因此,在一个实施方式中,所述氨基酸修饰包括下述的混合在环3中六个氨基酸的随机置换、在环3中六个氨基酸的随机置换和一个氨基酸插入以及在环3中六个氨基酸的随机置换和两个氨基酸插入。在方案⑴的任意实施方式中,当CTLD来自四联蛋白时,所述氨基酸修饰还包括环4中赖氨酸148置换为丙氨酸。关于方案(i),本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在CTLD 的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰在CTLD的环区段A(LSA)中的四个环中的至少一个中,其中所述氨基酸修饰包括在CTLD的环区段A(LSA)的四个环中的至少一个中的或在环区段B(LSB)的环5中的至少四个或更多个氨基酸插入。在其中组合文库包括对环4区域的一个或更多个氨基酸修饰(单独修饰或与CTLD的其他区域的修饰相结合)的实施方式中,某些修饰被设计为维持、调节或消除CTLD的金属离子结合亲和性。此类修饰影响CTLD的纤维蛋白溶酶原结合亲和性(参见例如Nielbo等,Biochemistry, 2004,43 (27),pp 8636 - 8643 ;或 Graversen 1998)。文库的多肽成员可包括在CTLD的四个LSA环和LSB环(环5)中任意组合中的一个或更多个氨基酸修饰(例如,通过插入、置换、延伸或随机化)。因此,在本文所述的各种实施方式的任一种中,随机化CTLD可包括在LSB环区域的环(环5)中的一个或更多个氨基酸修饰,或者单独的修饰,或者与LSA环区域(环1-4)的任意一个环、两个环、三个环或四个环中的一个或更多个氨基酸修饰相结合。一方面,本发明提供组合多肽文库,其包括具有随机化C-型凝集素结构域(CTLD)的多肽成员,其中所述随机化CTLD包括在CTLD的环区段A(LSA)中的四个环中的至少一个中的一个或更多个氨基酸修饰和环区段B(LSB)的环(环5)中的一个或更多个氨基酸修饰,其中所述一个或更多个氨基酸修饰包括LSB氨基酸残基的随机化。根据本文所述的各种实施方式,所述组合文库的多肽成员可具有在CTLD的环区域(LSA和LSB)中的任意两个环、三个环、四个环或五个环中的一个或更多个氨基酸修饰(例如,对两个环、对三个环、对四个环或对所有五个环的随机氨基酸修饰的任意随机组合)。所述组合文库的多肽成员还可包括对环区域(LSA和LSB)外的CTLD区域的其他氨基酸修饰,诸如在a -螺旋或P -链中(参见例如图I)。在本发明其他实施方式中,所述CTLD环区域可以被延伸超出在下面非限定性实例中详述的示例性构建物之外。一方面,本发明还提供编码按照上述任一个方面和实施例所述的组合多肽文库的多肽的核酸分子的文库。在该方面的一个实施方式中,本发明提供编码所述文库的多肽的核酸序列,其中所述多肽的CTLD已经按照方案(a)-(j)进行修饰。 生成重组CTLD修饰环文库一方面,本发明提供生成多肽文库的方法,该多肽文库包括含有C-型凝集素结构域(CTLD)的多肽成员,其中所述CTLD包含在该CTLD的环区段A(LSA)的四个环中至少一个环中和/或其环区段B(LSB)(环5)的环中的一个或更多个氨基酸修饰。在该方面的实施方式中,该方法包括在CTLD的LSA区域中的四个环中的至少一个环中和/或其LSB区域中的环中产生至少一个随机突变,其中所述至少一个随机突变包括(a)在至少一个环中一个或更多个氨基酸插入;或(b)在至少一个环内或其邻近的一个或更多个氨基酸的置换;或(c)在至少一个环内或其邻近的一个或更多个氨基酸的缺失;(d)组合两个相邻环的修饰,或(e)它们的任意组合。在该方面的某些实施方式中,该方法包括按照任意方案(a)-(j)在CTLD的LSA区域中的四个环中的至少一个环中和/或其LSB区域中的环中产生随机突变。在该方面的某些实施方式中,重组CTLD文库的多肽包含修饰CTLD,在该CTLD中,在环区域中的一些Ca2+配位氨基酸被保留和/或包括纤维蛋白溶酶原结合活性被消除的修饰 CTLD。 此外,在该方面的某些实施方式中,重组CTLD文库可包括具有修饰CTLD区域的多肽,其中氨基酸修饰落在CTLD的环区域(LSA和LSB)外。因此,此类修饰可在任一种或多种@链和/或a螺旋区域中设计或随机产生。产生随机化且最优化重组CTLD文库以获得可特异性结合感兴趣靶标的蛋白质产物可通过本领域已知的任意技术来实施,所述技术例如,寡核苷酸指导的随机化、易错聚合酶链反应诱变、随机断裂引起的DNA混编、环混编、环步移(loop walking)、体细胞高变(参见例如美国专利公开2009/0075378,其被引入作为参考),以及本领域已知的可建立序列多样性以产生具有最佳结合活性的分子的其他方法。(参见例如Stemmer, ff. P. , Proc Natl Acad Sci USA, (Oct.1994)91:10747-751 ;Patrick, ff. M. &Firth,A.E. , Biomolecular Engineering, (2005)22:105-112 ;Firth, A. E. & Patrick, ff.M. , Bioinformatics, (2005)21 (15):3314-3315 ;和 Lutz S.& Patrick, ff. M. , Curr. Opin.Biotechnol.,(2004) 15:291-297)。在某些实施方式中,产生及优化方法包括用于诱变环的寡核苷酸定点随机化(NNK或NNS)策略。例如,示于图I和图4中的人四联蛋白(hTN)CTLD含五个环(LSA中的四个环和LSB中的一个环),这些环可被更改,以使CTLD与任意感兴趣靶分子结合。随机的氨基酸序列(经由随机化、置换、插入等产生)可被引入这些环的一个或多个中,以建立可以从中选出具有期望结合性能的CTLD结构域的文库。可利用如本文所述的NNK或NNS完成这些文库的构建,这些文库含有限于人四联蛋白CTLD的五个环中任一种或全部中的随机肽。这些文库还可包括被引入位于LSA或LSB区域外部的CTLD区域中的氨基酸修饰(例如,a -螺旋和/或P -链)。下述步骤描述了一种可将七个随机肽插入hTN CTLD的环I中的方法的非限定性、说明性实例。利用下述策略,PCR可用于产生第一片段(片段A,见图7)。正向OligoIXfor(5’-GG CTG GGC CTG MC GAC ATG NNK NNK NNKNNK NNK NNK NNK TGG GTG GAT ATGACT GGC GCC-3,;SEQ ID NO: 137)(其中 N=A, T, G 或 C,且 K=G 或 T)编码 CTLD 的环 I 周围的区域,但是用七个NNK密码子代替编码五个氨基酸(AAEGT;SEQ ID NO:579)的15个和核苷酸。这些编码七个随机氨基酸的NNK密码子置换编码五个天然四联蛋白氨基酸的野生型密码子。Oligo IXfor (SEQ ID NO: 137)可用反向 oligo lXrev2 (5’_GGC GGT GAT CTC AGTTTC CCAGTT CTT GTA GGC GAT GCG GGC GCC AGT CAT ATC CACCCA-3,;SEQ ID NO :580)退火。该两个在其3’端的21个核苷酸内是互补的。参考图7,利用PCR从这两个重叠的寡核苷酸(oligos)产生片段A(IOlbp)。类似地,通过利用正向oligo BstXl for(5’ -ACT GGGMACTG AGA TCA CCG CCC MC CTG ATG GCG GCG CAA CCG AGMCT GCG CGG TCC TG_3’;SEQID NO: 139)和反向引物PstBssRevC(5,-CCC TGC AGC GCT TGT CGA ACC ACT TGC CGT TGGCGGCGC CAG ACA GGA CCG CGC AGT TCT-3,;SEQ ID NO: 140)进行 PCR 以产生 105bp 片段,可建立片段B (见图7)。可利用高保真聚合酶或taq混合和标准PCR热循环调节进行PCR。片段A的3’端与片段B的5’端互补。这些片段可进行凝胶分离并随后合并以利用外引物Bglforl2(SEQ ID NO: 141)and PstRev(SEQ ID NO: 142)实现重叠延伸PCR。所产生的 195bp片段可凝胶分离,然后用限制酶Bgl II和Pst I消化,之后可凝胶分离最终的185bp片段并将其克隆到含有下面所示与基因III融合的限制修饰的CTLD的噬菌体展示载体(诸如CANTAB 5E)中,该片段类似地用Bgl II和Pst I消化以进行克隆。用随机化氨基酸置换的其他环的修饰可如本文所述类似地进行。环内确定氨基酸 被随机化氨基酸的置换并不局限于任意特定环,也不局限于环的原始大小。同样,环的总体置换不是必要的,可对任意环进行部分置换。在一些情况中,可能需要保留环内的一部分原始氨基酸诸如钙配位氨基酸。在这些情况中,利用随机化氨基酸进行的置换可对环内的任一方较少数氨基酸进行,以保留钙配位氨基酸,或者可将额外的随机化氨基酸加至环中,以增加环的总体大小但是仍然保留这些钙配位氨基酸。通过将环区域诸如环I和2或者环3和4组合成较大置换环,可容纳非常大的肽并对其进行测试。利用核酸化学合成常规方法,通过进行分步合成,以便在核酸片段化学合成的每一步添加纯核苷酸单体的预定组合或核酸单体任意组合的混合物,可获得核酸分子。以这种方式,能够产生从一个单一氨基酸序列到最复杂混合物的任意水平的序列简并,其将表示最大数目4N的单一序列的完整或不完整表现,其中N是序列中的核苷酸数。可选地,通过对高分子量核酸组合物(诸如从任意生物体提取的染色体组核酸)进行化学、物理或酶断裂而产生核酸片段的混合物,可以制备包含多个核酸片段的复杂组合物。为使此类核酸片段的混合物用于产生如本文所述的重组体文库,在初期分裂步骤中获得的粗制片段混合物通常将被按大小分离,以获得近似分子量范围的片段,然后,通常使所述片段与适宜的接头核酸对相连,该适宜的接头核酸对被设计来促进大小受限的寡核苷酸片段的接头嵌入式混合物插入接收核酸载体中。通过核酸分子克隆的任何常规方法,诸如通过化学合成核酸被拷贝编辑到接收核酸中的适当设计的PCR处理,可将核酸片段在特定位置插入接收核酸(receiving nucleicacid)中,在这种情况下,对插入而言内切核酸酶限制位点不是必需的。可选地,通过将内切核酸酶限制位点的适当组合基因工程到靶核酸中,可促进核酸片段的插入/切除,利用核酸分子克隆的标准方法可将适当设计的寡核苷酸片段插入该靶核酸中。在对特定靶标(例如,真核细胞、病毒、细菌、特定蛋白质、多糖、其他聚合物、有机化合物等)进行数轮选择之后,从特定噬菌体分离DNA,测定编码配体结合区域的区段的核苷酸序列,将其从噬菌粒DNA切除并转移到适当的衍生物表达载体,以便异源产生期望产物。在原核生物中的异源产生可用于分离期望产物。为促进组合CTLD文库的构建,可将限制位点引入CTLD中。例如,设计位于编码人和小鼠四联蛋白中32、¢3和P 4的核酸序列邻近的合适的限制位点,其对由所更改序列编码的多肽序列的干扰最小。已发现能够建立如下详述的设计策略,通过该设计策略相同的内切核酸酶限制位点可在该两个序列中的相应的位置引入这使得感兴趣的环区域变体可容易地从重组小鼠CTLD中切除并恰当地插入人四联蛋白的CTLD框架中,反之亦然。对编码人四联蛋白成熟形式的核苷酸序列的分析显示(图2),发现限制酶BglII的识别位点位于位置326至331 (AGATCT),其涉及^ 2的已编码残基Glul09、IlellO和Trplll,而且发现限制酶Kas I的识别位点位于位置382至387 (GGCGCC),其涉及已编码氨基酸残基Glyl28和Ala l29 (在环2中位于C端)。通过利用四联蛋白序列中天然存在的氨基酸的交替密码子,将限制酶位点Pst I (CTGCAG)和Mfe I (CAATTG)在位置501到506 (最初,CTGCCG)基因工程到四联蛋白编码序列中,所述位置涉及已编码的氨基酸残基Argl67、Cysl68和Argl69,以及在位置511至516(最初,0么6(^6)基因工程到四联蛋白编码序列中,所述位置涉及已编码的氨基酸残基Glnl71和Leul72,所有位置均位于¢4与P 5之间。在本发明的其他某些方面中,提供了包含本文所述至少一种核酸的质粒、载体、转录或表达盒形式的核酸构建物。可选择或构建合适的载体,其含有合适的调节序列,包括启动子序列、终止序列、聚腺苷酸化序列、增强子序列、标记基因和其他合适的序列。载体可以是质粒、病毒例如噬菌体或者合适的噬菌粒。关于其他详细情况,参见例如,MolecularCloning:a Laboratory Manual: 2nd edition, Sambrook 等,1989, Cold Spring HarborLaboratory Press0本发明还提供包含一种或更多种如本文所述的构建物的重组宿主细胞。合适的宿主细胞包括细菌、哺乳动物细胞、酵母和杆状病毒系统。本领域中用于表达异源多肽的可用哺乳动物细胞系包括中国仓鼠卵巢细胞、海拉细胞、幼仑鼠肾细胞、NSO小鼠黑素瘤细胞和很多其他细胞。在一个实施方式中,所述宿主细胞是J1EK293细胞。展示系统本文所述的所得重组CTLD文库可利用本文所述及本领域中已知的很多可选技术来展示。在展示系统中表达核酸分子文库的方法描述于美国专利申请公开2007/0275393中,该文献以其整体并入本文作为参考。在一个实施方式中,展示系统包括可观察的表型,其呈现所展示的表达产物以及相应基因型的至少一种性质。合适的展示系统的实例包括噬菌体展示系统;酵母展示系统;病毒展示系统;基于细胞的展示系统;核糖体连接展示系统;或质粒连接展示系统;它们的任意组合,或者本领域已知的任意其他合适的展示系统。因此,一方面,本发明提供展示系统,其包含按照上述方面和实施方式中任一种所述的组合多肽文库。在该方面的一个实施方式中,本发明提供展示系统,其包含根据方案(a)-(i)所述的组合多肽文库。在该方面的某些实施方式中,展示系统包括噬菌体展示系统;酵母展示系统;病毒展示系统;基于细胞的展示系统;核糖体连接展示系统;或质粒连接展示系统;它们的任意组合,或者本领域已知的任意其他合适的展示系统。就推定配体结合模数(putative ligand binding module)或具有推定酶活性的模数而言,已经描述了若干展示表型的系统。这些包括噬菌体展示(例如丝状噬菌体 fd[Dunn(1996), Griffiths 和 Duncan(1998),Marks 等(1992)),入卩遼菌体(Mikawa 等(1996)),在真核病毒上展示(例如杆状病毒(Ernst等(2000)),细胞展示(例如在细菌细胞(Benhar 等(2000))),酵母细胞(Boder 和 Wittrup (1997)),和哺乳动物细胞(Whitehorn等(1995)))上展示,核糖体连接展示(Schaffitzel等(1999)),和质粒连接展示(Gates等(1996))。一种表型展示并将其与基因型相连的常用方法是通过噬菌体展示。这通过将编码支架蛋白或感兴趣蛋白的读码框插入表明暴露的噬菌体蛋白来完成。丝状噬菌体fd(例如,M13)已经证实可用于该目的。美国专利申请公开第2007/0275393号描述了一种用于完成展示系统以产生CTLD文库的方法。一般而言,用于产生上述CTLD文库的展示系统的方法包括 (I)鉴定CTLD中环区域的位置;(2)将编码所选CTLD的核酸片段亚克隆到蛋白质展示载体系统中,之前插入或未插入接近编码CTLD中P 2、P 3和P 4的序列的核酸内切酶限制位点;和(3)用由多个核酸片段组成的组的随机选择成员取代编码所选CTLD的部分或全部环区域的核酸片段,导致CTLD的原始环区域随机化和/或延伸。每个克隆的核酸片段,其编码具有已置换环区段或全部环区域的新多肽,将在其新序列背景中测定的阅读框内解码。CTLD环区域的位置可利用本文前面所述的方法鉴定。简言之,该环区域可通过参考所选CTLD的三维结构来鉴定,如果此种信息可得的话,或者如果此种信息不可得,则通过与图I中所示序列的序列比对来鉴定@2-、¢3-和¢4-链的序列位置,来鉴定该环区域,所述序列比对通过鉴定对应于¢2和¢3共有序列元件和¢4-链特征的序列元件以及也在本文图I中公开的保守半胱氨酸残基协助进行。鉴定和分离与靶分子结合的CTLD多肽的策略一方面,本发明提供一种鉴定与分离与靶分子具有特异性结合活性的多肽的方法,其中所述方法包括(a)提供本发明的组合多肽文库;(b)使该组合多肽文库的多肽与靶分子在允许多肽与该靶分子之间进行结合的条件下接触;和(C)分离与该靶分子结合的多肽。在各种实施方式中,靶分子可包括与细胞(诸如真核细胞;肿瘤细胞、免疫细胞、细菌细胞、原生动物、真菌以及感染病毒的细胞)表面结合的任意分子;蛋白质(诸如受体蛋白、可溶蛋白、酶或抗体);多糖;聚合物;和小有机化合物。在另一方面,本发明提供一种鉴定与分离与靶分子具有特异性结合活性的多肽的方法,其中所述方法包括一种鉴定与分离与靶分子具有特异性结合活性的多肽的方法,其中所述方法还包括编码所述组合多肽文库的多肽的核酸分子文库,其中所述核酸文库在展示系统中表达。在一个实施方式中,展示系统包括可观察的表型,其呈现所展示的表达产物以及相应基因型的至少一种性质。在另一方面,本发明提供一种鉴定与分离与靶分子具有特异性结合活性的多肽的方法,包括下述步骤(a)提供编码权利要求I所述的多肽文库的核酸分子文库;(b)在展示系统中表达所述核酸分子文库,以获得多肽集合(an ensemble of polypeptides),在该集合中,一个或多个序列位置上的氨基酸残基在所述多肽集合的不同成员之间是不同的;(C)使该多肽集合的多肽与所述靶分子在允许多肽与该靶分子之间进行结合的条件下接触;和(d)分离能够与所述靶分子结合的多肽。在任意这些方面和实施方式中,本发明提供一种鉴定与分离与靶分子具有特异性结合活性的多肽的方法,其中所述多肽已经按照方案(a)-(i)中任一种进行修饰。
在一个方面,感兴趣靶分子的特异性结合成员可以通过选择特异性结合该靶分子的文库成员而由多肽随机文库获得。如本文所讨论的,已知很多用于展示具有推定配体结合位点的表型的系统。这些包括噬菌体展示(例如丝状噬菌体fd[Dunn(1996),Griffiths和Duncan (1998),Marks等(1992)],入卩遼菌体[Mikawa等(1996)]),在真核病毒上展不(例如杆状病毒[Ernst等(2000)]),细胞展示(例如在细菌细胞[Benhar等(2000)],酵母细胞[Boder和Wittrup (1997)],和哺乳动物细胞[Whitehorn等(1995)])上展示,核糖体连接展示[Schaffitzel等(1999)],和质粒连接展示[Gates等(1996)]。为选择与靶分子具有结合活性的多肽,可构建文库,并首先或者以单一单体CTLD结构域或者以噬菌体表面上展示的单独肽,作为单体元件筛选与所述靶分子的结合。通过将展示于噬菌体表面上的CTLD支架内的五个不同环中的一个或多个环中(或者环外)的氨基酸随机化,可构建文库。通过噬菌体展示淘选可选出与靶分子的结合。在噬菌体展示文库构建中可以使用数种策略。一种策略是构建和/或使用随机肽噬菌体展示文库。可单独在噬菌体颗粒表面展示构建为二硫键约束环的随机线性肽和/或随机肽,并通过噬菌体展示“淘选”而筛选与期望靶分子结合的随机线性肽和/或随机肽。在获得具有期望结合活性的肽克隆后,可将这些肽移植到人四联蛋白的三聚结构域上或移植进入CTLD结构域的环中然后移植到三聚结构域上并筛选激动剂活性。构建噬菌体展示文库和三聚结构域构建体的另一种策略包括获得CTLD来源的结合物(binder)。可以通过将噬菌体表面上展示的人四联蛋白CTLD骨架中五个不同环的一个或多个环中的氨基酸随机化而构建文库。可以通过噬菌体展示淘选而筛选与靶分子的结合。在获得包含证明具有期望结合活性的肽环的CTLD克隆后,这些CTLD克隆之后将移植到人四联蛋白的三聚结构域并筛选激动剂活性。另一种策略包括使用具有已知的结合感兴趣靶能力的肽序列,并首先通过用肽两侧的随机氨基酸或/或肽中的随机选择内部氨基酸建立新文库而提高其结合能力,然后通 过噬菌体展示筛选改进的结合。获得亲和力更好的结合物后,这些肽的结合物可与其他功能蛋白结构域诸如人四联蛋白的三聚结构域融合(在下文讨论并在PCT/US09/60271和US. 2010/0028995中详细讨论,该篇文献以其整体并入本文作为参考),并评价期望活性。在这种方法中,如下构建原始文库其可作为在噬菌体颗粒表面展示的游离肽,如在第一种策略中,或者如上面讨论的第二种策略中,其可作为CTLD支架中的受约束环(constrainedloop)。这些展示策略详细地描述于PCT/US09/60271中,该文献以其整体并入本文作为参考。下文更具体地描述了用于鉴定与分离与感兴趣靶分子具有特异性结合活性的多肽的示例性策略。尽管这些策略集中在噬菌体展示上,但是可以使用鉴别多肽的其它等同方法。策略I市场销售肽展示文库试剂盒如,但不限于,New England Biolabs Ph.D.卩遼菌体展示肽文库试剂盒,并且可以购买用于筛选具有靶分子结合活性的新肽。有三种形式的NewEngland Biolabs试剂盒可供使用包含长7个氨基酸的线性随机肽的Ph. D. _7肽文库试剂盒,文库大小为2. SxlO9个单独克隆,包含以长7个氨基酸的随机肽的二硫限定环构建的肽的Ph. D. -C7C 二硫限定肽文库试剂盒,文库大小为I. 2xl09个单独克隆,和包含长12个氨基酸的线性随机肽的Ph. D. -12肽文库试剂盒,文库大小为2. 8xl09个单独克隆。可以用包含与这些试剂盒相似的随机氨基酸的肽从头构建可替换的相似文库。使用NNK或NNS策略可产生用于重新构建的随机核苷酸,其中N代表四种核苷酸碱基A、C、G和T的等量混合物。K代表G或T的等量混合物,而S代表G或C的等量混合物。这些随机位置可以克隆到噬菌体或噬菌粒展示载体系统中的GeneIII蛋白上。NNK和NNS策略均覆盖所有20种可能的氨基酸和一个终止密码子,编码氨基酸的效率略有不同。因为细菌转化效率的限制,噬菌体展示产生的文库大小的数量级如上文所述,因此可以产生包含多达7个随机氨基酸位置的肽,并包含全部理论组合(207=1. 28xl09)。可以使用NNK或NNS策略构建更长的肽文库,但是由于细菌转化的要求,实际噬菌体展示文库的大小可能不包含与这种长度有关的所有可能的理论氨基酸组合。因此当需要更大/更长的随机肽时,核糖体展示文库是有益的。对于二硫限定文库,可使用相似的NNK或NNS随机核苷酸策略。然而,这些随机位置两侧为半胱氨酸残基,可以形成二硫桥。N端的半胱氨酸前面经常会加上另一个氨基酸如丙氨酸。此外,由(但不限于)几个甘氨酸残基组成的灵活接头可以作为肽和任何上述随机肽文库的gene III蛋白之间的间隔区。策略2图I和4中所示人四联蛋白CTLD包含五个环(LSA中的四个环和包含LSB的一个环),其能改变,使CTLD结合不同的蛋白靶标。可以在这些环的一个或多个环中放置随机氨基酸序列,产生文库,从中可以筛选具有理想结合性质的CTLD结构域。例如,可使用本文所述的任意CTLD多肽文库,即CTLD已经按照任意方案(a)-(i)进行修饰的多肽。可以使用上面策略I中所述的NNK或NNS (但不限于此)完成在人四联蛋白CTLD五个环中任何或所有环中所含随机肽的文库的构建,而且这些文库的构建页在本文中其他地方详细描述。策略3在已经鉴定出对感兴趣靶分子具有结合活性的其他肽的情况中,可以利用一种策略,其中这些肽作为游离线性肽或作为使用半胱氨酸的二硫键限制环可被直接克隆到四联蛋白三聚结构域的N或C端末端上。也可以将能够结合感兴趣靶标的单链抗体或结构域抗体克隆到三聚结构域的任一端。此外,可以将具有已知结合性质的肽直接克隆到TN CTLD的任一个环区域中。被选择作为含二硫限制环或抗体的互补确定区域的肽可以非常容易地重新安置到人四联蛋白的CTLD的环区域中。可测试所有这些构建体以单体形式的结合,以及当CTLD与三聚结构域融合时,可测试三聚形式的结合和激动剂活化。CTLD 多肽本发明的组合多肽文库可用于产生和鉴定包含与感兴趣靶分子具有所需结合特性的CTLD的多肽。一方面,本发明提供具有C-型凝集素样结构域(CTLD)支架结构的多肽,其中所述多肽与不同于该CTLD的天然靶标的靶标结合,而且其中该CTLD的CTLD支架结构按照方案(a) - (j)的任一种进行修饰。在一个实施方式中,所述CTLD支架结构按照方案(a)-(j)的任一种进行修饰而且还包括本文所述的任意其他修饰,例如,在CTLD环球区域外的修饰。 在一个实施方式中,所述多肽具有来自人或鼠四联蛋白的CTLD的支架结构并与非纤维蛋白溶酶原的靶标结合。
本发明的CTLD多肽可利用本文所述的任意方法和组合文库产生。例如,在一个实施方式中,多肽可利用具有CTLD的多肽的组合物文库产生,其中所述CTLD的环区域按照方案(a)-(j)的任一种随机化,使该组合多肽文库与靶分子在允许多肽与靶分子结合的条件下接触;和分离与该靶分子结合的多肽,其中所述靶分子不是该CTLD的天然靶。在该方法的一个实施方式中,CTLD是人或鼠四联蛋白。在该方法的另一实施方式中,所述CTLD的环区域按照方案(a) - (j)的任一种随机化并且包括本文所述的任意其他修饰,例如,在CTLD环球区域外的修饰。按照本发明的修饰CTLD的非天然靶标可以是任何游离或缀合形式(conjugatdform)的化合物,其展示免疫半抗原、激素诸如类固醇激素或任意生物聚合物或其片段的特征,例如,蛋白质或蛋白质结构域;肽;寡聚脱氧核苷酸;核酸;花生四烯酸或其代谢物、月旨质或其代谢物;脂肪酸或其代谢物;自由基;寡糖或多糖或其缀合物(conjugates);或者滥用或治疗应用的化学合成或天然药物。一方面,所述靶标是蛋白质。该蛋白质可以是任意球形可溶性蛋白或受体蛋白,例如,参与细胞信号传导的跨膜蛋白,指示特定疾病的免疫系统的成分诸如MHC分子或细胞表面受体。蛋白质可以是翻译后修饰蛋白质,其添加了生化官能团,诸如乙酸根、磷酸根和/或各种脂质及糖类,包括但不限于,糖基化和十四烷酰化。本发明的修饰CTLD还可结合蛋白质片段。例如,所述CTLD可结合细胞表面受体的结构域,·此时所述结构域是固定在细胞膜中的受体的一部分,或者如果该结构域还可作为可溶蛋白产生时,则CTLD可结合溶液中的同一结构域。该CTLD还可对低(较低)分子量配体诸如生物素、荧光素或洋地黄毒苷具有特异性结合亲和力。在各种实施方式中,结合一个或多个靶分子的CTLD多肽序列可具有结合亲和力,该结合亲和力大约等于所述一个或多个靶分子的天然存在配体的结合亲和力。实施方式中,本发明的多肽对一个或多个靶分子的结合亲和力更强于天然配体对相同靶分子的结合亲和力。此种配体是有用的,例如,在一些情况下用于阻断结合成员的活性,或者在其他情况中实现更有效地激动(agonizing),例如在修饰CTLD与受体结合并且还被选择来激动受体的情况中。在其他实施方式中,本发明的多肽对一个或多个靶分子的结合亲和力弱于天然配体对相同靶分子的结合亲和力。相比天然配体对靶分子具有较弱亲和力的CTLD多肽可具有改进的穿透肿瘤或组织的能力,和/或可用于期望目标是抑制靶活性而不是完全阻断该活性的情况中。相比天然配体具有较弱结合亲和力的CTLD在例如最佳选择活性是基于与靶结合后内部化到细胞中的情况中可能也是期望的。修饰CTLD还可结合一个或多个受体并充当激动剂。在此类实施方式中,可通过ELISA、RIA和/或BIAcore试验以及本领域已知的其他试验,测定激动剂各自的结合亲和力并使其与天然配体或其部分的结合性能相比较。在某些实施方式中,本发明的受体选择性激动剂在至少一种哺乳动物细胞(例如,癌细胞)中抑制或诱导生物活性,而且此种活性可通过已知的本领域方法测定。利用本文提供的方法鉴定的充当激动剂的CTLD实例是与TRAIL-Rl和TRAIL-R2结合的多肽。在其他实施方式中,修饰CTLD可结合一种或多种受体或者一种或多种对受体具有亲和力的配体并充当拮抗剂(受体阻断剂(receptor blockers))。在此种实施方式中,可通过ELISA、RIA和/或BIAcore试验以及本领域已知的其他试验,测定激动剂各自的结合亲和力并使其与天然配体或其部分的结合性能相比较。在某些实施方式中,本发明的拮抗剂在至少一种哺乳动物细胞(例如,癌细胞)中抑制或诱导生物活性,而且此种活性可通过已知的本领域方法测定。利用本文提供的方法鉴定的充当拮抗剂的CTLD实例是与IL-23R结合的多肽。包含特异性结合感兴趣靶分子的多肽可包括“结合成员”,其包括全部的或部分的CTLD。如本文所使用的,术语“结合成员”指彼此之间有结合特异性的分子对中的成员。结合对的成员可以天然产生或者全部或部分合成产生。分子对中的一个成员有表面区域或凹陷处,该区域或凹陷与分子对中另一个成员的特定空间和极性组织结合并因此与其互补。因此分子对成员具有彼此特异性结合的特性。在CTLD基蛋白质产物源自哺乳动物四联蛋白的实施方式中,如本文中所示例的小鼠和人四联蛋白的情况,其结构与所有其他哺乳动物四联蛋白几乎相同。这种物种保守型结构(species-conserved structure)允许定义配体结合特异性的多肽区段在直向同源物之间直接交换(straightforward swapping)(例如,小鼠和人四联蛋白衍生物)。因此,在此种实施方式中,这种平台相比小鼠抗体衍生物的“人源化”提供了特别的优势,其可参 与很多并发症。一方面,本发明提供具有多聚结构域的多肽并包括结合至少一种靶分子的CTLD多肽-结合成员。如本文所用的,术语“多聚结构域”指包含下述官能度的氨基酸序列,该官能度能够与两种或更多种其他氨基酸序列结合而形成三聚体或其他多聚复合物。在本发明的各种实施方式中,多聚结构域是二聚结构域、三聚结构域、四聚结构域、五聚结构域等。这些结构域能够形成本发明的两个、三个、四个、五个或更多个多肽的多肽复合物。在一个实例中,多肽包含氨基酸序列-“三聚结构域其与两个其它三聚结构域形成三聚复合物。三聚结构域能结合相同氨基酸序列的其它三聚结构域(形成同三聚体),或结合不同氨基酸序列的三聚结构域(形成异三聚体)。这种相互作用属于可产生三聚蛋白质或多肽的类型。这种相互作用可能是由于三聚结构域组分之间的共价键以及氢键力、疏水力、范德华力和盐桥而引起。三聚结构域的三聚效应由卷曲螺旋结构引起,所述结构与其它两个三聚结构域的卷曲螺旋结构相互作用,形成三重a螺旋卷曲螺旋三聚体,其即使在相对较高的温度仍然稳定。在各种实施方式中,例如,基于四连蛋白结构元件的三聚结构域,所述复合物在至少60°C是稳定的,例如在一些实施方式中,在至少70°C是稳定的。
在一个实施方式中,多聚多肽是三聚体,例如,四联蛋白三聚模块(见US2007/0154901)。包括CTLD的三聚复合物在本文被称为“atrimer”。“ATRMER ”多肽复合物是指也包含CTLD的三个三聚结构域的三聚复合物(Anaphore, Inc.,SanDiego, California)。根据本发明,结合成员可以连接至多聚结构域的N-或C-端氨基酸残基。此外,在某些实施方案中,可以有利地将结合成员连接至单体的多聚结构域的N-端和C-端,由此提供多聚多肽复合物。例如,当多聚肽与相似分子形成三聚体时,六个能结合感兴趣靶分子的结合成员可与单一三聚复合物结合。在本发明的另一方面,CTLD的环区域中的一个或多个环中包含特异性结合感兴趣靶分子的多肽。在这个方面,CTLD可在三聚结构域的C-端连接至任何已知的三聚结构域。此外,本发明的融合蛋白可以包括在三聚结构域的N-端融合的第二CLTD结构域。在本方面的变化中,该融合蛋白包括在三聚结构域的一端结合第一靶分子和在另一端结合CLTD的多肽。一个、两个或三个此类蛋白质可以是三聚复合物的一部分,所述复合物最多包含一个或多个靶分子的六个特异性CTLD结合成员。在另一个方面,本发明提供三个蛋白质的多聚复合物,每个蛋白质包含多聚结构域和至少一个结合至少一个感兴趣靶分子的CTLD多肽。在一个实施方案中,多聚复合物包含具有多聚结构域的融合蛋白,所述结构域选自四联蛋白三聚结构元件(四联蛋白三聚模块)、甘露糖结合蛋白(MBP)三聚结构域的其它人三聚多肽,胶原凝集素颈区和其它相似部分。多聚复合物可以包含能彼此关联而形成多聚体的多聚结构域。因此,在一些实施方案中,多聚复合物是由具有相同氨基酸序列的蛋白质组成的均多聚复合物。在其它实施方案中,多聚复合物是由具有不同氨基酸序列的蛋白质组成的异多聚复合物,比如,不同的多聚结构域,和/或不同的可结合不同靶分子的CTLD多肽。在这种实施方案中,CTLD多肽都可特异性结合一种靶分子。在其它实施方案中,CTLD多肽特异性结合不同靶分子。因此,在某些实施方案中,多聚复合物包含本发明的融合蛋白,其中每个融合蛋白包含至少一种结合一种靶分子的CTLD多肽(其中所述多肽可以相同或不同),和/或至少一种结合第二靶分子的CTLD多肽(其中所述第二靶分子结合多肽可以相同或不同)。 本发明的多肽的三聚结构域可以来自美国专利申请公开No. 2007/0154901( ‘901申请)中所述的四联蛋白,其通过引用全部并入本文。本文中以SEQ ID N0:100提供成熟人四联蛋白单链多肽序列(参见,例如,表I)。四联蛋白三聚结构域的实例包括SEQ ID NO: I的氨基酸17至49、17至50、17至51和17-52,其代表由人四联蛋白基因的外显子2编码的氨基酸,和可选地由所述基因的外显子3编码的前一个、两个或三个氨基酸。其它实例包括氨基酸I至49、I至50、I至51和I至52,其代表所有外显子I和2,和可选地由所述基因的外显子3编码的前一个、两个或三个氨基酸。可替换地,在三聚结构域中仅包括外显子I编码的部分氨基酸序列。具体地,三聚结构域的N-端可以在SEQ ID N0:1的残基1、2、3、
4、5、6、7、8、9、10、11、12、13、14、15、16和17的任何位置开始。在具体的实施方案中,N端是110或¥17,并且0端是047、了48、¥49、((5)50、151或1(52(根据5£0 ID NO: I 编号)。此夕卜,图3A-3D提供多种人四联蛋白三聚结构域的可能的截短型变体。在本发明的一个方面,三聚结构域是包含SEQ ID NO: I的氨基酸序列的四联蛋白三聚结构元件(“TTSE”),其为四联蛋白家族三聚结构元件的保守序列,US 2007/00154901中有更完整的描述,其通过引用全部并入本文。如图2所示,TTSE环抱着四联蛋白的蛋白家族天然产生成员的变体,和具体地,氨基酸序列经过修正不会对TTSE形成a螺旋卷曲螺旋三聚体的能力产生任何实质的负面影响的变体。在本发明的各个方面,根据本发明的三聚多肽包括作为三聚结构域的TTSE,其与SEQ ID NO: 10的保守序列具有至少66%的氨基酸序列同一性;例如与SEQ ID NO: I的保守序列具有至少73%,至少80%,至少86%或至少92%的序列同一性(仅计算确定(不包括X)残基)。S卩,SEQ ID NO: I中确定的氨基酸中至少一个,至少两个,至少三个,至少四个,或至少五个可以被取代。在一个具体的实施方案中,SEQ ID N0:63在位置50(C50)处的半胱氨酸可以有利地突变为丝氨酸、苏氨酸、甲硫氨酸或任何其它氨基酸残基,以避免形成不理想的链间二硫桥,其会产生不理想的多聚。其它已知的变体包括选自第6、21、22、24、25、27、28、31、32、35、39、41和42个(根据SEQ ID N0:63编号)的氨基酸残基的至少一个氨基酸残基,其可以由任何非螺旋阻断的氨基酸残基取代。这些残基已经表现出不会直接参与分子间的相互作用,所述相互作用可以稳定本体四联蛋白单体的三个TTSE之间的三聚复合物。在图2所示的一个方面,TTSE具有分子式为a-b-c-d-e-f_g(N至C)的重复的七肽重复序列,其中残基a和d(S卩,位置26、33、37、40、44、47和51)可以是任何疏水氨基酸(根据SEQ ID NO: I编号)。在进一步的实施方案中,TTSE三聚结构域可以通过掺入聚组氨酸序列和/或蛋白酶裂解位点,例如,血凝因子Xa或颗粒酶B (参见US2005/0199251,其通过弓I用并入本文),并通过包括C-端KG或KGS序列而修正。此外,为了帮助纯化,位置2的脯氨酸可以用甘氨酸取代。TTSE截短型和变体的具体的非限定性实例如图3A-3D所示。此外,已知多个与人四联蛋白的三聚结构域具有实质相似性(大于66%)的三聚结构域。表I-三聚结构域
权利要求
1.一种组合多肽文库,其包括下述多肽成员,所述多肽成员含有具有随机化环区域的C-型凝集素结构域(CTLD),其中所述CTLD的环区域包括含有环1-4的环区段A(LSA)和含有环5的环区段B (LSB),并且所述CTLD的环区域按照下述方案之一而被随机化 (a)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括在环I中至少ー个氨基酸的插入以及环I内至少五个氨基酸的随机置换; (b)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括环I内至少五个氨基酸的随机置換以及环2内至少三个氨基酸的随机置換; (c)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括环I内至少七个氨基酸的随机置换以及在环4中的至少ー个氨基酸插入; (d)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少ー个氨基酸插入以及环3内至少三个氨基酸的随机置换; (e)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括将两个环组合成单ー环的修饰,其中两个被组合的环为环3和环4 ; (f)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括在环4中的至少ー个氨基酸插入以及环4内至少三个氨基酸的随机置换; (g)在CTLD的环区段A(LSA)和环区段B(LSB)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括环3中至少五个氨基酸残基的随机置換以及环5内至少三个氨基酸的随机置换; (h)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括在环3中的至少ー个氨基酸的随机置换以及至少六个氨基酸的插入; (i)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括下述的混合(I)在环3中的至少六个氨基酸的随机置換,和(2)在环3中的至少六个氨基酸的随机置换和至少ー个氨基酸插入;和 U)在CTLD的环区段A(LSA)中的四个环中的至少ー个中进行氨基酸修饰,其中所述氨基酸修饰包括在CTLD的环区段A(LSA)中的四个环中的至少ー个中或者环区段B(LSB)的环5中进行是至少四个或更多个氨基酸插入。
2.如权利要求I所述的文库,其中所述CTLD包括下述ニ级结构 (a)以βI、α I、α 2、β 2、β 3、β 4和β 5的次序顺序出现的五个β _链和两个α -螺旋,所述链以两个反平行折叠排列,ー个由M和β 5组成,另ー个由β2、β3和β 4组成; (b)至少两个ニ硫键,一个连接αI和β 5,而ー个连接β 3和连接β 4与β 5的多肽区段;和 (c)环区段A(LSA)和环区段B (LSB),其中LSA连接β2和β 3,而LSB连接0 3和3 4。
3.如权利要求I所述的文库,还包括在C-端方向位于环2的C-末端邻近的氨基酸的随机置換。
4.如权利要求I所述的组合文库,其中所述CTLD来自人四联蛋白而且还包括精氨酸-130的随机置換。
5.如权利要求I所述的组合文库,其中所述CTLD来自人或小鼠四联蛋白而且还包括赖氨酸-148置换为丙氨酸。
6.如权利要求4所述的组合文库,其具有方案(a)的随机化CTLD,其中所述氨基酸修饰包括在环I中的两个氨基酸插入、在环I内的至少五个氨基酸的随机置换和赖氨酸-148置换为丙氨酸。
7.如权利要求I所述的组合文库,其具有方案(c)的随机化CTLD,其中所述氨基酸修饰还包括在环4内的至少两个氨基酸的随机置换。
8.如权利要求7所述的组合文库,其中所述氨基酸修饰包括在环I内的至少七个氨基酸的随机置换、在环4中的至少三个氨基酸插入以及在环4内的至少两个氨基酸的随机置换。
9.如权利要求I所述的组合文库,其具有方案(d)的随机化CTLD,其中所述氨基酸修饰还包括在环4中的至少一个氨基酸插入。
10.如权利要求9所述的组合文库,其中所述氨基酸修饰还包括在环4内的至少三个氨基酸的随机置换。
11.如权利要求10所述的组合文库,其中所述氨基酸修饰包括在环3中的三个氨基酸插入。
12.如权利要求11所述的组合文库,其中所述氨基酸修饰包括在环4中的三个氨基酸插入。
13.如权利要求I所述的组合文库,其具有方案(e)的随机化CTLD,其中所述氨基酸修饰包括在环3中的至少六个氨基酸的随机置换和在环4中的至少四个氨基酸的随机置换。
14.如权利要求13所述的组合文库,其中所述CTLD是人或小鼠四联蛋白且其中所述氨基酸修饰还包括脯氨酸-144的随机置换。
15.如权利要求14所述的组合文库,其中所述组合的环3和环4氨基酸序列包括NWEXXXXXXX XGGXXXN(SEQ ID NO: 578),其中 X 是任意氨基酸,且其中 SEQ ID NO: 578 的氨基酸序列形成单一环区域。
16.如权利要求I所述的组合文库,其具有方案(f)的随机化CTLD,其中所述氨基酸修饰包括在环4中的四个氨基酸插入和在环4内的至少三个氨基酸的随机置换.
17.如权利要求I所述的组合文库,其具有方案(g)的随机化CTLD,其还包括在环4中的、调节所述CTLD的纤维蛋白溶酶原-结合亲和力的一个或更多个氨基酸修饰。
18.如权利要求17所述的组合文库,其中所述CTLD来自人或小鼠四联蛋白而且环4的修饰包括赖氨酸148置换为丙氨酸。
19.如权利要求I所述的组合文库,其具有方案(h)的随机化CTLD,其中所述CTLD来自人或小鼠四联蛋白且其中所述氨基酸修饰包括异亮氨酸140的随机置换。
20.如权利要求19所述的组合文库,其还包括在环4区域中的、调节所述CTLD的纤维蛋白溶酶原-结合亲和力的一种或更多种氨基酸修饰。
21.如权利要求20所述的组合文库,其中所述对环4的修饰包括赖氨酸148置换为丙氨酸。
22.如权利要求I所述的组合文库,其具有方案(i)的随机化CTLD,其中所述氨基酸修饰包括在CTLD的环区段A(LSA)中的四个环中的至少一个中的氨基酸修饰,其中所述氨基酸修饰包括下述的混合(I)在环3中的至少六个氨基酸的随机置换;(2)在环3中的至少六个氨基酸的随机置换和至少一个氨基酸插入;和(3)在环3中的至少六个氨基酸的随机置换和至少两个氨基酸插入。
23.如权利要求2所述的组合多肽文库,其中所述CTLD包括环区段A(LSA)和环区段B(LSB)中的两个、三个、四个或五个环的任意组合的一个或更多个氨基酸修饰。
24.如权利要求I所述的组合文库,其中所述氨基酸修饰包括对LSA和LSB之外的CTLD氨基酸的修饰。
25.如权利要求I所述的组合文库,其中所述CTLD是人四联蛋白的CTLD。
26.如权利要求I所述的组合文库,其中所述CTLD是小鼠四联蛋白的CTLD。
27.如权利要求I所述的组合文库,其中所述多肽成员还包含CTLD的N-端延伸和C-端延伸中至少一种。
28.如权利要求27所述的组合文库,其中至少一种N-端延伸和C-端延伸包括提供效应子功能、酶功能、进一步结合功能或多聚化功能的多肽。
29.如权利要求27所述的组合文库,其中至少一种N-端延伸和C-端延伸包括天然C-型凝集素样蛋白质或C-型凝集素或缺乏功能跨膜结构域的C-型凝集素的非CTLD-部分。
30.如权利要求29所述的组合文库,其中所述蛋白质是包含CTLD的部分的多聚体。
31.一种核酸分子文库,其编码权利要求I所述的组合多肽文库的多肽。
32.如权利要求31所述的核酸分子的文库,其中所述文库的核酸分子在展示系统中表达,其中所述展示系统包括表现所展示的表达产物和相应的基因型的至少一种性质的可见表型。
33.包含权利要求31所述的核酸分子文库的展示系统,其中所示展示系统选自噬菌体展示系统;酵母展示系统;病毒展示系统;细胞基展示系统;核糖体连接展示系统和质粒连接展不系统。
34.一种生成权利要求I所述的组合文库的方法,包括通过在所述CTLD的LSA区域中的四个环中至少一个环中生成至少一个随机突变来建立方案(a)-(j)任一种。
35.如权利要求34所述的方法,其中所述至少一个随机突变通过下述产生寡核苷酸指导的随机化;随机断裂引起的DNA混编;环混编;环步移;或易错聚合酶链反应诱变。
36.一种鉴定与分离与靶分子具有特异性结合活性的多肽的方法,其中所述方法包括 (a)提供权利要求I所述组合多肽文库; (b)使所述组合多肽文库与所述靶分子在允许多肽与所述靶分子之间进行结合的条件下接触;和 (C)分离与所述靶分子结合的多肽。
37.如权利要求36所述的方法,其中所示方法还包括编码所述组合多肽文库的核酸分子文库,其中所示核酸文库在展示系统中表达,且其中所述展示系统包括表现所展示的表达产物和相应的基因型的至少一种性质的可见表型。
38.一种用于鉴定和分离能特异性结合靶分子的多肽的方法,所述方法包括下述步骤 (a)提供编码权利要求I所述的多肽文库的核酸分子文库; (b)在展示系统中表达所述核酸分子文库,以获得多肽集合,在该集合中,一个或多个序列位置上的氨基酸残基在所述多肽集合的不同成员之间是不同的; (C)使所述多肽集合的多肽与所述靶分子在允许多肽与所述靶分子之间进行结合的条件下接触;和 (d)分离能够与所述靶分子结合的多肽。
39.一种多肽,其具有C-型凝集素样结构域(CTLD)的支架结构,其中所述多肽与不同于所述CTLD的天然靶标的靶标结合,且其中所述CTLD的CTLD支架结构按照权利要求I所述的任意方案进行修饰。
40.如权利要求39所述多肽,其中所述多肽具有人四联蛋白的C-型凝集素样结构域(CTLD)的支架结构,且其中所述多肽与人四联蛋白的天然靶标之外的靶标结合。
41.一种产生权利要求39所述的多肽的方法,其包括使权利要求I所述的组合多肽文库与所述靶分子在允许所述多肽与所述靶分子之间结合的条件下接触,以及分离与所述靶分子结合的多肽,其中所示靶分子不是CTLD的天然靶标。
全文摘要
本发明涉及包含多肽(该多肽含有具有随机化环区域的C-型凝集素结构域(CTLD))的多肽文库以及含编码此类多肽的核酸分子的核酸文库。本发明还涉及用于产生所述随机化多肽和所述多肽文库的方法。本发明进一步涉及基于修饰CTLD与感兴趣靶分子的特异性结合来筛选所述多肽和核酸文库的方法。本发明还涉及源自此类文库且与感兴趣靶分子结合的多肽。
文档编号C12N15/10GK102686727SQ201080056021
公开日2012年9月19日 申请日期2010年2月10日 优先权日2009年10月9日
发明者A.克雷茨-罗梅尔, K.鲍迪施, M.伦肖, M.维尔德 申请人:阿纳福公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1