支架化肽文库以及其制备和筛选方法

文档序号:9493314阅读:216来源:国知局
支架化肽文库以及其制备和筛选方法
【专利说明】支架化肽文库以及其制备和筛选方法
[0001](相关申请的交叉引用)
[0002] 根据35U.S.C. § 119(e),本申请要求2013年3月14日提交的美国临时申请 No. 61/784, 077和2013年3月25日提交的美国临时申请No. 61/804, 982的优先权,所述申 请通过引用并入本文。
【背景技术】
[0003] 基本上所有的生物过程依赖于蛋白质介导的分子识别。操纵这种蛋白质的相互作 用的能力对于基础生物学研究以及治疗和诊断的开发均是有意义的。
[0004] 可以例如通过操纵免疫系统或者经化学合成(从其可以选择与靶分子的结合特 异性)制备多肽的文库。对于具有大量氨基酸的可能序列组合的多肽而言,可从其选择特 异性的分子多样性是很大的。此外,蛋白质可以形成大的结合表面,其具有产生高度特异且 高亲和的结合事件的与靶分子的多处接触。例如,抗体为对多种靶抗原产生高度特异和紧 密结合的配体的一类蛋白。
[0005] 由于感兴趣的靶分子的多样性,并且由于蛋白质的结合特性,肽文库以及筛选肽 文库来鉴定具有有用功能的分子的方法是有意义的。

【发明内容】

[0006] 提供了支架化肽文库以及针对与靶蛋白的特异性结合筛选所述支架化肽文库的 方法。每个文库包含不同的肽化合物,所述肽化合物包含作为基础的支架结构域和不同的 可变结构域。提供了多种文库,其中每种文库基于具有结构基序的肽支架。在一些实施方 案中,所述肽支架是具有适于蛋白质-蛋白质相互作用的表面的小蛋白。提供了编码多种 肽化合物的多核苷酸的文库。这些文库用于需要与靶分子(例如靶蛋白)特异性结合的多 种应用。还提供了制备所述文库的方法以及针对与靶标的结合筛选所述文库的方法。
【附图说明】
[0007] 图1-31示出了感兴趣的一些支架结构域(包括感兴趣的突变位置)的结构基序 和序列。对于每个支架结构域,示出了两种可替换的结构视图,其中加深的结构区域表示 基于所述支架的文库的一个实施方案的可变结构域,其对应于在下方序列中示出的突变位 置。显示了多肽序列,其可被用于制备基于所述支架肽文库的一个实施方案,其中加深的、 高亮的和灰色的残基表示可以被随机化的感兴趣的突变位置(例如,用噬菌体展示文库中 的B1 (HT)、WTK或NTT密码子)。
[0008] 图1 :SCF2,DGCR8 (DiGeorge综合征关键区域8)二聚体化结构域(SEQIDNO: 1)。
[0009]图 2:SCF3,Get5C-末端结构域(SEQIDNO: 2)。
[0010] 图 3:SCF4,H-NS结构域,来自E.coli(SEQIDN0:3)。
[0011] 图 4:SCF7,KorBc-末端二聚体化结构域(SEQIDN0:4)。
[0012] 图5:SCF8,Lsr2二聚体化结构域(SEQIDNO:5)。头6个残基可以被截短。
[0013] 图 6:SCFl5,Symfoil4P三聚体(命名为β-三叶肽)(SEQIDN0:10)。
[0014] 图 7:SCF23,EphA2SAM结构域(SEQIDNO: 12)。
[0015] 图8:SCF24-1,高尔基体蛋白245的GRIP结构域,亚文库1(SEQIDNO: 13)。
[0016] 图9:SCF24-2,高尔基体蛋白245的GRIP结构域,亚文库2(SEQIDN0:13)。
[0017] 图 10:SCF27,SpoOB-螺旋发夹结构域(SEQIDNO: 14)。
[0018] 图 11:SCF28,Ku的C-末端结构域(SEQIDNO: 15)。
[0019] 图 12:SCF29,Cue2 蛋白的CUE结构域(SEQIDNO: 16)。
[0020] 图 13:SCF32,蛋白G的GA结构域(SEQIDNO: 18)。
[0021] 图 14:SCF37,PEM-1 样蛋白(SEQIDN0:22)。
[0022] 图 15:SCF38,成束蛋白-2(Fasciculin-2)(SEQIDN0:23) 〇
[0023] 图16:SCF40,核苷酸交换因子C-末端结构域(SEQIDNO: 25)。
[0024] 图 17:SCF42,转录抗终止蛋白NusG(SEQIDN0:27)。
[0025] 图 18:SCF44,与ThiF复合的ThiS蛋白(SEQIDN0:29)。
[0026] 图 19:SCF47,CD2bp2 的GYF结构域(SEQIDNO:32)。
[0027] 图 20:SCF53,RhodninKazal抑制子(SEQIDN0:38) 〇
[0028] 图 21:SCF55,抗-TRAP(SEQIDNO:40)。
[0029] 图 22:SCF56-1,TNF受体 17(BCMA),亚文库 1(SEQIDN0:41)。
[0030] 图 23:SCF56-2,TNF受体 17(BCMA),亚文库 2(SEQIDN0:41)。
[0031] 图 24:SCF63,FynSH3 结构域(Fynomers)(SEQIDN0:46)。
[0032] 图 25:SCF64,E3 泛素蛋白连接酶UBR5(SEQIDN0:47)。
[0033] 图 26:SCF65,DNA修复核酸内切酶XPF(SEQIDN0:48)。
[0034] 图 27:SCF66,Rad23 同系物B,xpcb结构域(SEQIDN0:49)。
[0035] 图 28:SCF70,伊默菌素的LEM结构域(SEQIDNO:51)。
[0036] 图 29:SCF75,GspC(SEQIDNO:55)。
[0037] 图 30:SCF95,蛋白Z(SEQIDN0:70)。
[0038] 图31和32显示了所有感兴趣的支架1-70的表,并且显示了基于这些支架的各文 库的一个实施方案。对于每个支架化文库,突变的感兴趣的位置由残基四周的黑方框示出。 图31显示了支架1-70的第1-25位氨基酸,图32显示了之后的第26位氨基酸。
[0039] 图33和34显示了包含支架的亚组(即在图1-30中示出的那些)的表。对于每 个支架化文库,突变的感兴趣的位置由特定残基周围的黑色(例如可以用(Bl)HT密码子随 机化)或灰色方框(例如可以用WTK或NTT密码子随机化)示出。图31显示了支架1-70 的第1-25位氨基酸,图32显示了之后的第26位氨基酸。
[0040] 图35显示了包含支架的亚组(即在图1-30中示出的那些)的表,其中列除了感 兴趣的突变的位置。
【具体实施方式】
[0041]
[0042] 本文所用术语"肽"指的是由氨基酸残基构成的部分(moiety)。术语"肽"包括天 然存在氨基酸的化合物或文库,以及其中常规骨架已经被非天然存在(例如合成)的骨架 替代的化合物或文库,以及其中一个或更多个天然存在氨基酸已经被一个或更多个非天然 存在(例如合成)的氨基酸或D-氨基酸替代的肽。本文所用术语"合成的氨基酸"是指非 天然存在的氨基酸。本文出现的任何对序列的描述(例如使用单字母或三字母代码)可代 表序列的L-氨基酸版本或D-氨基酸版本(例如为了简便,在本领域中使用的大写和小写 字母代码指代L-和D-氨基酸残基的惯例不严格应用于本文中)。在一些情况下,本发明肽 文库和肽化合物为L-肽。应理解,在另一些情况下,本发明肽文库和肽化合物为D-肽,并 因而具有这样的结构基序,即,为天然的作为基础的L-肽支架结构基序的镜像结构。
[0043] 本文所用术语"多肽"和"蛋白质"可互换使用。术语"多肽"也包括翻译后修饰的 多肽或蛋白质。术语"多肽"包括其中天然存在骨架的一个或更多个残基单元已经被具有 非天然(即合成的)骨架的一个或更多个残基替代的多肽。在主题多肽中可以使用多种拟 肽骨架和侧链。在一些实例中,多肽是肽。在一些实例中,多肽可以为任何长度,例如2或 更多个氨基酸、4或更多个氨基酸、10或更多个氨基酸、20或更多个氨基酸、25或更多个氨 基酸、30或更多个氨基酸、35或更多个氨基酸、40或更多个氨基酸、45或更多个氨基酸、50 或更多个氨基酸、55或更多个氨基酸、60或更多个氨基酸、100或更多个氨基酸、300或更多 个氨基酸、500或更多个氨基酸或者1000或更多个氨基酸。
[0044] 本文所用术语"残基的不连续序列"指的是相对于肽化合物的一级序列不连续的 残基的序列。肽化合物可以折叠以形成二级或三级结构,其中残基的不连续序列的氨基酸 在空间上彼此临近,即连续。本文所用术语"残基的连续序列"指的是对于肽化合物的一级 序列连续的残基序列。
[0045] 本文所用术语"连接序列"指的是连接两个肽基序的氨基酸残基的连续序列。
[0046] 本文所用术语"噬菌体展示"指的是一种技术,通过这种技术变体肽化合物作为与 外壳蛋白的融合蛋白展示在噬菌体(例如丝状噬菌体颗粒)的表面。术语"噬菌粒"指的 是具有细菌复制起点(例如ColEl)和细菌噬菌体的基因间区域的拷贝的质粒载体。噬菌 粒可以基于任何已知细菌噬菌体,包括丝状细菌噬菌体。在一些实例中,质粒还将含有抗生 素抗性的可选择标记。克隆进这些载体的DNA区段可以作为质粒增殖。当为具有这些载体 的细胞提供所有生产噬菌体颗粒所需的基因时,质粒的复制模式改变为滚环复制以产生质 粒DNA的单链拷贝,并包装噬菌体颗粒。噬菌粒可以形成感染或非感染噬菌体颗粒。该术 语包括这样的噬菌粒,其含有作为基因融合物与异源多肽基因连接的噬菌体外壳蛋白基因 或其片段,从而所述异源蛋白被展示在噬菌体颗粒的表面上。
[0047] 本文所用术语"噬菌体载体"指的是含有异源基因并且能够复制的细菌噬菌体的 双链复制形式。噬菌体载体具有噬菌体复制起点,其允许噬菌体复制和噬菌体颗粒形成。在 一些情况下,所述噬菌体是丝状细菌噬菌体,例如M13,Π,fd,Pf3或其衍生物,λ形噬菌 体,例如λ,Phi80,phi81,82,424,434等,或其衍生物,杆状病毒或其衍生物,Τ4噬菌体或 其衍生物,T7噬菌体病毒或其衍生物。
[0048] 本文所用术语"稳定"指的是这样的化合物,其在特定温度(例如25°C或37°C)下 在生理条件下能够保持折叠状态,从而其保有至少一种其正常功能活性,例如与靶蛋白的 结合。可以使用标准方法测定所述化合物的稳定性。例如,化合物的"热稳定性"可以通过 测量热熔解("Tm")温度来测量。Tm是以摄氏度表示的未折叠或变性与结构稳定之间的 转化中间温度的温度。通常,Tm越高,化合物约稳定。
[0049] 主题文库的化合物可以含有一个或更多个不对称中心,并且可因而产生对映异构 体、非对映异构体和其他根据绝对立体化学可以定义为氨基酸和肽的(R)_或(S)_或者 (D)-或(L)-其他立体异构形式。本发明旨在包括所有这些可能的异构体以及其消旋和光 学纯形式。当本文所述的化合物含有烯双键或其他几何异构中心时,除非另有说明,意图是 所述化合物包括E和Z二种几何异构体。同样,也旨在包括所有互变异构形式。
[0050] 详细描沐
[0051] 提供了支架化肽文库和筛选所述支架化肽文库来鉴定与靶蛋白特异性结合的化 合物的方法。本文库各包含多种肽化合物,其中每种肽化合物具有相同结构基序的支架结 构域作为感兴趣的文库的基础亲本支架。所述支架化肽文库被设计为包含多种位置的突 变,例如在亲本支架结构域内位置处的变体氨基酸。突变的数目和类型限定了文库的大小 和多样性。在一些实施方案中,支架化肽文库的肽化合物包含非核心位置的突变,例如在亲 本支架结构域内的并非结构的疏水核心的一部分的位置处的变体氨基酸。感兴趣的支架结 构域的结构基序示于图1-30。感兴趣的支架的序列示于图31-34。
[0052] 提供了多种肽化合物的支架化肽文库。对于文库多样性而言,突变的位置以及支 架的不同位置中每一个的突变的性质均可以变化。在一些实例中,突变包括在非核心位置, 尽管核心位置处的突变也包括在内。突变可以对所得的肽化合物赋予不同功能,例如对靶 分子的特异性结合。突变可以被选择在感兴趣的支架结构域中暴露于溶剂的位置,从而这 些位置处的变体氨基酸可以形成潜在的靶分子结合表面的一部分,尽管也可以包括在所选 核心和/或边界位置处的突变。在一个主题文库中,突变可以集中在限定基础支架结构域 的几个不同潜在结合表面之一的可变结构域处。提供了包括集中在结构基序的潜在结合表 面处的突变的不同突变排布不同肽化合物的文库,例如如图1-30所示。在一些实施方案 中,肽支架是具有适合于蛋白质-蛋白质相互作用的表面的小蛋白。在一些情况下,支架的 蛋白质-蛋白质相互作用表面是大小约500平方埃或更大(例如约500至约1800平方埃) 的连续表面区域。主题文库可以包含通过位于基础支架结构域的潜在靶标结合位点处的可 变结构域与靶分子特异性结合的化合物。突变可以被包括在潜在的结合表面以提供与靶分 子的特异性结合而不显著干扰基础支架化肽结构。
[0053] 在本方法中,支架化肽文库与靶分子接触来筛选以高亲和力与靶标特异性结合的 文库化合物。主题方法和文库用于多种应用,包括筛选应用。
[0054] 在更详细地描述一些实施方案之前,应理解,本发明不限于所描述的某些实施方 案,因为实施方案当然可以变化。还应理解的是,本文所用的术语是仅为了描述一些实施方 案,而不旨在限制,因为本发明的范围将仅由所附权利要求限制。
[0055] 当提供数值范围时,应理解,该范围上界限和下界限之间的每个中间值(除非上 下文清楚指出相反情况,至下界限最小整数的十分之一)以及所述范围中任何其他指出的 或中间值涵盖在本发明中。这些更小范围的上界限和下界限可以独立地包括在更小范围内 并且也涵盖在本发明中,除去在所述范围中的任何特定排除的界限。当所述范围包括界限 中的一个或两个时,排除这些包括的界限中的一个或两个的范围也包括在本发明中。
[0056] 除非另外指出,否则本文所用的所有技术和科学术语具有与本发明所述领域普通 技术人员通常理解的相同的含义。尽管与本文所述的那些相似或等价的任何方法和材料可 用于实施或测试本发明,下面将描述典型的示例性方法和材料。
[0057] 在本说明书中引用的所有出版物和专利通过引用并入本文,如同指出每个单独的 出版物或专利被特别地和单独地通过引入并入一样,并且在本说明书中引用的所有出版物 和专利被通过引用并入本文以公开和描述与所引用出版物相关的方法和/或材料。对任何 出版物的引用是其在申请日前的公开,并不应当解释为承认本权利要求无权凭借着在先发 明早于这种出版物。此外,所提供的公开日期可不同于实际公开日期,其可需要独立确认。
[0058] 应注意,当在本文和所附权利要求中使用时,除非上下文明确指出相反情况,否则 不使用数量词时涵盖复数的指代物。还应注意,权利要求可撰写成排除任何任选元素。因 此,该陈述旨在作为使用与权利要求要素的引述相联系的这些排他性术语如"仅仅"、"仅" 等或使用"否定性"限制的在先基础。
[0059] 本文描述的和示例的每个单独的实施方案有分离的组成和特征,其可以容易地与 任何其它几种实施方案的特征分开或组合而不脱离本教导的范围或精神。任何记载的方法 可以以记载的事件顺序进行或逻辑上可行的任何其它顺序进行。
[0060] 在进一步描述本发明的多个方面时,首先更详细地描述多种文库的成员的结构和 序列,然后描述使用所述文库的筛选和应用方法。
[0061] 支架化肽文库
[0062] 如以上所概述的,本发明的方面包括支架化肽化合物的文库,其中每种肽化合物 具有相同结构基序的支架结构域作为感兴趣的文库的基础亲本支架。主题支架化文库的肽 化合物可以包括结构基序的不同位置的突变,例如在感兴趣的支架结构域内非核心位置处 的变体氨基酸。结构基序和感兴趣的支架结构域的序列示于图1-34中。
[0063] 本文所用术语"支架"、"支架化"和"支架结构域"可互换使用,指的是化合物文库 由其产生并且所述化合物能够针对其进行比较(例如使用序列比对和共有序列分析)的基 础肽框架(例如共有序列或基序)。当由支架内不同位置的氨基酸突变产生化合物文库时, 这些位置处的氨基酸被称为"变体氨基酸"。基础支架序列包括为"固定氨基酸"(例如,非 变体氨基酸)的那些残基。这种变体氨基酸可以赋予所得的肽化合物不同的功能,例如与 靶蛋白的特异性结合。本文所用术语"支架结构域"、"支架化"和"支架"可以用于感兴趣的 蛋白质(例如图1-34的蛋白质)来指肽文库或化合物。支架化肽文库及其化合物可以具 有与感兴趣的基础蛋白支架(例如,图1-34的蛋白质)相似的结构基序。这种结构基序可 以作为特定的二级和三级结构元件(例如α螺旋、β折叠、混合的α和β,以及单体、二 聚体、三聚体)或者作为可比较的氨基酸残基的一级序列来进行表征和结构上的比较。感 兴趣的支架结构域的结构基序示于图1-30中。可在本文中用作支架结构域的感兴趣的支 架结构域的氨基酸序列(例如图1-30的序列和图31-34的支架1-70的序列)还可以在蛋 白质数据银行数据库(ProteinDataBankdatabase(www.rcsb.org))或NCBI的蛋白质数 据库中找到。感兴趣的支架结构域序列包括在图1-34中描述的那些感兴趣的蛋白,感兴趣 的这些蛋白的相关家族成员的天然蛋白质序列,包含有限数目的(例如,10个或更少,例如 1、2、3、4、5、6、7、8、9或10个不对结构基序产生不利影响的残基修饰)预先存在的氨基酸序 列修饰(例如添加、缺失和/或替换)的这些感兴趣的蛋白的经修饰序列,或其片段,或其 类似物。支架结构域可以是L-肽、D-肽或者L-和D-氨基酸残基的混合物。
[0064] 在一些实例中,所述文库是噬菌体展示文库,其可针对与任何合适靶标(例如 L-靶蛋白和D-靶蛋白)的结合被筛选。在另一些实例中,所述文库由D-肽化合物(例如 化学合成的化合物)构成。这种D-肽化合物可以针对与任何合适靶标(例如L-蛋白质靶 标)的结合被筛选。
[0065] 在一些情况下,"支架结构域"被称为"亲本氨基酸序列"。本文所用属于"亲本氨 基酸序列"、"亲本支架"和"亲本多肽"指的是这样的多肽,其包含由其产生变体肽化合物并 将变体肽化合物针对其进行比较的氨基酸序列。在一些情况下,亲本多肽中不存在本文公 开的一种或更多种修饰,并且在于本文公开的变体肽化合物比较时在功能上有差异。亲本 多肽可以包含天然蛋白质序列或具有预先存在的氨基酸序列修饰(例如添加、缺失和/或 替换)的其他支架序列。
[0066] 支架结构域可以是包含天然存在或合成的感兴趣的亲本支架的结构基序的任何 合适多肽或其片段。感兴趣的支架结构域包括 :DiGe〇rge综合征关键区域8(DGCR8)二聚 体化结构域;Get5C-末端结构域;来自E.coli的H-NS结构域;KorBc-末端二聚体化结 构域;Lsr2二聚体化结构域;PKA-RIα二聚体化/停靠结构域(牛);p62的UBA结构域; SpoVT的N-末端结构域;胶原XI三聚体化结构域;Symfoil4P三聚体(被称为β-三叶 肽);RNA聚合酶α亚基的C-末端结构域;EphA2SAM结构域;高尔基体蛋白245的GRIP 结构域;SpoOB-螺旋发夹结构域;Ku的C-末端结构域;Cue2蛋白的CUE结构域;DNA解旋 酶RuvA结构域;蛋白G的GA结构域;Hirustasin;凝血调节蛋白(;EGF型结构域);凝集 因子Vila;PEM-1样蛋白;成束蛋白-2 ;CD46细胞外结构域;核苷酸交换因子C-末端结构 域;TDRD3的Tudor结构域;转录抗终止蛋白NusG;CCL2趋化因子;与ThiF复合的ThiS蛋 白;胰凝乳蛋白酶抑制子;羧肽酶抑制子;CD2bp2的GYF结构域;Cdk调节亚基1 ;CN2毒素; CHD4 -PHD指结构域;GATA型锌指;Leech衍生类胰蛋白酶抑制子;RhodninKazal抑制子; MHCII型p41片段;抗TRAP;TNF受体17 (BCMA) ;NZF锌指结构域;Amaranthα
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1