涉及核酸-蛋白质复合物的组合物和方法

文档序号:9793367阅读:2250来源:国知局
涉及核酸-蛋白质复合物的组合物和方法
【专利说明】溃及核酸-蛋白质复合物的组合物和方法
[0001] 相关申请
[0002] 本申请要求2013年7月10日提交的标题为乂OMPOSmONS AND MET册DS RELATING TO NUCLEIC ACID-PROTEIN COMPLEXES"的美国临时申请号61/844,818的权益,其完整内容 通过引用并入本文。
[0003] 联邦政府资助的研究
[0004] 本发明是在美国国立卫生研究院授予的DC002281下由美国政府资助进行的。美国 政府具有本发明的某些权利。
[0005] 发明背景
[0006] DNA已成为所选择的用于构建自组装纳米结构的支架。随着用于运些结构的程序 图形化的技术已取得进展,现在可能产生复杂的组装体(Linko and Dietz, Curr. Opin. Biotechnol. 24: 555-561,2013)。为了利用运些结构元件并将它们制成功能性 纳米机器,常常需要在非常特异的位点上渗入蛋白质(Niemeyer,化ends in Biotech 20: 395-401,2002)。遇到的阻碍是将目标蛋白质偶联于DNA的成功方法。常规用于将蛋白质连 接于寡核巧酸(寡聚物)的化学过程包括二硫键联和硫醇-伯胺键联(Cecconi C.等, Eur.Bio地ys.J.37(6):729-38,2008);Halvorsen等,化notechnol.22:494005-494012, 2011;Niem巧er and Sacca,化em. Soc. Rev. 40: 5910-5921,2011)。虽然运些化学过程有时 是有效的,但它们与生物学中常见的官能团反应。因此当目标蛋白质具有内源半脫氨酸时 或当想要附接于特定的伯胺(除了N末端W外,每个赖氨酸提供伯胺)时,不能使用运些技 术。为了克服许多的运些问题,研究小组已着手开发生物正交技术诸如无铜点击化学 (Gordon等,J. Am. Chem. Soc. 134:9199-9208,2012)。虽然运些技术克服了特异性和化学计 量的问题,但它们遭受面向所有巧巾技术的问题。所有运些技术需要在亚最佳的生理条件下 进行反应。由于长期处于室溫、氧化/还原条件或高/低pH条件下,当利用许多在运些条件下 不是非常热稳定的并且具有聚集和/或从溶液沉淀出来的倾向的蛋白质进行作用时运些化 学过程开始失效。除了关于运些化学过程的障碍W外,必需针对不同的蛋白质谨慎地改变 条件,并且不存在选择性纯化出所需产物的方法。
[0007] 发明概述
[000引本公开内容部分地提供用于将核酸缀合于蛋白质的新型和稳健的方法,所述方法 克服了现有技术的缺点。运些方法前置待对核酸(包括寡核巧酸)和小(通常合成的)肤进行 的化学过程。运样的核酸和肤对于可用于进行本公开内容中设及的某些化学过程的非生理 条件通常是更加耐受的。
[0009] 本公开内容提供了两步法及其变型,其包括首先将核酸(例如,DNA)缀合于短的通 常合成的肤,W形成核酸-肤缀合物,随后使用转肤酶(例如,分选酶)反应将核酸-肤缀合物 缀合于目标蛋白质。两步法的至少一个有利方面是将蛋白质与不利的反应环境分离的能 力,所述不利的反应环境可能降低所述蛋白质的活性。通过该两步法,在第一步骤中使用运 些不利的反应条件,并在第二步骤中引入所述蛋白质。
[0010] 因此,在一些情况下,本公开内容的方法包括将核酸(诸如寡核巧酸)缀合于包含 一个或多个连续的N-末端甘氨酸(G)残基的氨基酸序列。在一些实施方案中,氨基酸序列包 含3个连续的N末端甘氨酸残基。氨基酸序列通常被包含在短肤(通常为合成肤)中。N-末端 GGG基序由本公开内容的方法中使用的分选酶识别。
[0011] 氨基酸序列还可包含可用于纯化目的的额外氨基酸序列。运些氨基酸序列在本文 中可被称为纯化标签或亲和标记,并且包括但不限于化S-标签和Flag序列(或Flag标签), 其氨基酸序列在本领域中是已知的并且提供于本文中。
[0012] 寡核巧酸至肤的缀合可使用例如生物正交铜催化点击化学反应来实现。待缀合于 肤的寡核巧酸可包含叠氮化物。叠氮化物可位于3'末端或5'末端,或者它可W是内部的叠 氮化物。待被缀合的肤可包含烘控,其用作互补点击试剂。或者,所述肤可包含叠氮化物并 且所述寡核巧酸可包含烘控。应当理解,可使用其它缀合方法来实现核酸至肤的缀合。例 如,该第一步骤还可使用横基班巧酷亚胺-4-(N-马来酷亚胺甲基)环己烧-1-簇酸醋(SMCC) 将脫氨酸(肤中的)偶联于胺官能化的寡核巧酸来实现。
[0013] 该第一反应步骤的所得产物是缀合于包含一个或多个(例如3个)甘氨酸残基和任 选地纯化标签诸如(但不限于)Flag氨基酸序列的氨基酸序列(即,肤)的核酸(例如,寡核巧 酸)。偶联于肤的核酸可W被移除(例如,与其它反应物分离)和任选地通过利用纯化标签从 反应混合物中纯化。一种方法是使用珠粒诸如磁珠,或基于柱的珠浆体,其中的任一种包含 结合纯化标签的针对纯化标签的结合伴侣(例如,所述结合伴侣可W是特异于所述纯化标 签的抗体)。
[0014] 氨基酸序列还可含有额外的可切割序列。运样的序列可在酶存在的情况下或通过 另一种机制被切割。运样,将缀合的核酸与其它反应物分离后,可从缀合的核酸除去纯化标 签,只留下随后可接近第二步骤中所使用的分选酶的一个或多个(例如3个)末端甘氨酸残 基。在一些实施方案中,酶可切割的氨基酸序列可由烟草蚀纹病毒(TEV)蛋白酶切割。可由 TEV蛋白酶切割的氨基酸序列的实例是包含E化YFQ(SEQ ID N0:1)的氨基酸序列。或者,可 切割的序列可通过非酶促方法(例如,光)切割。可切割的序列通常位于纯化标签与一个或 多个(例如3个)甘氨酸残基之间。
[0015] 在方法的第二步骤中,所得的缀合于一个或多个(例如,3个)末端甘氨酸残基的核 酸随后与目标蛋白质反应。目标蛋白质可天然地含有还是分选酶或另一种转肤酶的祀序列 的氨基酸序列,或者可选择地所述蛋白质可被工程化W含有运样的氨基酸序列。运些氨基 酸序列在本文中可被称为分选酶(或转肤酶)祀序列。
[0016] 分选酶祀序列的一个实例为LPXTGX'n(SEQ ID N0:2),其中X和X'是独立选择的氨 基酸,并且η为大于0的任何数值或任何数值的范围,包括例如1-90、1-99或I-IOOdX'。从而 意欲表示所述氨基酸序列可在一个末端含有任意数目的氨基酸残基(即,η个数目的X'氨基 酸残基,其中每个X'氨基酸残基独立地选自每个其它X'氨基酸残基,其中η可W为1-100,或 1-99或1-90,或其间的任何数值)。一个运样的序列为LPETGX'n(SEQ ID ^:3),其中乂'为氨 基酸并且η为大于0的任何数值或任何数值的范围,包括例如1-90、1-99或1-100。术语"氨基 酸"和"氨基酸残基"在本文中可互换使用。还应理解,X和X'可W是本文中所述的任何实施 方案中的任何氨基酸。如本文中所述,分选酶祀序列还可包含纯化标签。
[0017] 目标蛋白质与寡核巧酸-肤缀合物之间的反应在分选酶或另一种转肤酶存在的情 况下发生。在一些实施方案中,所述分选酶为分选酶Α。在一些实施方案中,所述分选酶为分 选酶A的进化变体,诸如由化en等,PNAS 108:11399-11404,2011所描述的。术语"分选酶"和 "分选酶类"在本文中可互换使用。分选酶执行缀合于核酸(通过缀合的肤)的甘氨酸残基与 存在于目标蛋白质中或缀合于目标蛋白质的分选酶祀序列中的甘氨酸残基的换位。
[0018] 该第二反应的产物是通过氨基酸接头缀合于目标蛋白质的核酸。所述氨基酸接头 可具有LPXTGn(SEQ ID ^):17)的序列,其中11表示6残基的数目并且是大于0的任何数值或 任何数值的范围。在一些实施方案中,所述氨基酸接头可具有LPXTGGG(SEQ ID N0:9)的序 列。在一些实施方案中,所述氨基酸接头可具有LPETGn(SEQ ID N0:4)的序列,其中η表示G 残基的数目并且是大于0的任何数值或任何数值的范围。在一些实施方案中,所述接头具有 口^了666(569 10^:5)的序列。
[0019] 随后可使用例如珠粒或其它基于亲和力的方法纯化该最终的缀合产物。运样的纯 化可使得将核酸-蛋白质缀合物与其它反应组分诸如分选酶、TEV酶和/或在分选酶介导的 换位后从蛋白质释放的任何氨基酸序列分离。此情形通过在分选酶介导的作用后纯化标签 的差异使用或存在来实现。例如,可将反应组分诸如分选酶、TEV酶和/或在分选酶介导的换 位后从目标蛋白质释放的氨基酸序列缀合于纯化标签,并且该标签可用于从最终的目标缀 合产物除去运些组分。在优选实施方案中,将待例如从终产物除去的所有组分缀合于相同 的纯化标签。适合的纯化标签包括化S-标签(例如,6His残基,(SEQ ID N0:6))或包含 DYKDD孤K(SEQ ID NO: 7)或由其组成的Flag氨基酸序列。运样的纯化步骤可用于使目标核 酸-蛋白质缀合物/复合物不含任何副产物和反应物。
[0020] 因此,在一个方面,本公开内容提供了方法,所述方法包括在分选酶存在的情况 下,将(1)缀合于包含一个或多个N末端甘氨酸(G)残基的氨基酸序列的核酸(例如,DNA)与 (2)包含LPXTGX'n(其中X和X'是任意独立选择的氨基酸并且η为范围1-99内的任何数值) (SEQ ID Ν0:8)的C末端氨基酸序列的蛋白质反应,W形成包含通过具有LPXTGGG(SEQ ID N0:9)的氨基酸序列的氨基酸接头共价缀合于蛋白质的核酸的复合物,其中X为任意氨基 酸。接头和核酸可存在于缀合后的目标蛋白质的C末端上或其附近。
[0021] 在另一个方面,本公开内容提供了方法,所述方法包括在分选酶存在的情况下,将 (1)缀合于包含末端甘氨酸(G)残基的氨基酸序列的核酸(例如,DNA)与(或用)(2)包含 1口6了6乂。(其中乂是氨基酸并且11为大于0的数值或大于0的数值的范围)(56〇10^:10)的末 端氨基酸序列的蛋白质反应,^形成包含通过具有1^^了666(56〇10^:5)的氨基酸序列的 氨基酸接头共价缀合于蛋白质的核酸的复合物。在一些实施方案中,V'在长度上可W是1- 99个氨基酸。在一些实施方案中,V'为大于1的数值。
[0022] 在一些实施方案中,分选酶和包含LPETGXn(SEQ ID ^:10)的末端例如(:末端氨基 酸序列的蛋白质各自包含化S-标签。在目标蛋白质的情况下,可将化S标签提供在分选酶祀 序列的Xn(或X'n)氨基酸序列中或作为其部分。
[0023] 在一些实施方案中,通过核酸与包含一个或多个优选3个G残基的肤之间的生物正 交铜催化的点击化学反应形成缀合于包含末端甘氨酸(G)残基的氨基酸序列的核酸。在一 些实施方案中,所述生物正交铜催化的点击化学反应形成缀合物(其在本文中可被称为核 酸中间产物),其包含缀合于包含一个或多个甘氨酸(G)残基和任选纯化标签(诸如但不限 于Flag序列)W及还任选地可切割的氨基酸序列(诸如但不限于TEV祀(切割)序列,优选地 位于G残基与纯化标签之间)的氨基酸序列的核酸。
[0024] 所述方法从而还可包括从核酸中间产物切割纯化标签,W使得甘氨酸残基可接近 分选酶。例如,在一些实施方案中,所述方法还包括将核酸中间产物与TEV蛋白酶反应。在一 些实施方案中,将TEV蛋白酶缀合于化S-标签。His-标签可W是包含6个组氨酸残基或由其 组成的氨基酸序列(SEQ ID N0:6)。
[0025] 在另一个方面,本发明提供了包含通过具有LPETGGG(氨基至簇基)或GGGTEPL(簇 基至氨基KSEQ ID N0:5)的氨基酸序列的氨基酸接头共价缀合于蛋白质的核酸的复合物。 在附图中举例说明了该接头在核酸与目标蛋白质之间的放置。
[0026] 在一些实施方案中,所述蛋白质是天然存在的蛋白质并且所述分选酶祀序列或接 头序列诸如如上定义的^^了6乂'。(569 10顯:2)或1?6了666(569 10^:5)不存在于天然存 在的蛋白质中。
[0027] 在一些实施方案中,所述核酸的长度为1-100个核巧酸。在一些实施方案中,所述 核酸在缀合至肤之前包含DNA或由其组成。
[0028] 在另一个方面,本发明提供了包含分离形式的任何前述复合物或缀合物的组合 物,无论运样的复合物或缀合物是中间产物还是终产物。因此,本公开内容提供了各自包含 缀合于肤的核酸的一种或多种缀合物,其中所述肤包含一个或多个(例如,3个)甘氨酸。运 些缀合物可在它们的核酸序列上彼此相异,但可具有相同的氨基酸序列。本公开内容类似 地提供了各自包含分选酶祀序列诸如上文中定义的LPXTGX'n(SEQ ID N0:2)的一种或多种 不同的蛋白质。本公开内容类似地提供了用于制备核酸-蛋白质复合物或缀合物的多种前 述核酸-肤缀合物和蛋白质。本公开内容还提供了各自包含通过具有LPXTGGG(SEQ ID NO: 9)的氨基酸序列的氨基酸接头缀合于蛋白质的核酸的一种或多种缀合物。运些缀合物可在 它们的核酸序列和/或它们的氨基酸序列上彼此不同。因此,它们可具有相同的核酸序列, 或它们可具有相同的氨基酸序列,或它们可具有不同的核酸和氨基酸序列。因此,本公开内 容提供了各自呈分离形式的多个任何前述复合物或该群体为分离形式(任选地文库形式)。
[0029] 在另一个方面,本发明提供了包含W下的两种或更多种的任意组合的组合物:缀 合于包含末端甘氨酸(G)残基(包括3个G残基)的氨基酸序列的核酸、包含LPXTGX'n(其中X 和
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1