用于hla的修饰的方法和组合物的制作方法_2

文档序号:9528949阅读:来源:国知局
cademicPress,SanDiego;Wolffe,CHROMATINSTRUCTUREANDFUNCTION,第 3 版, AcademicPress,SanDiego,1998;METH0DSINENZYM0L0GY,第 304 卷,"Chromatin"(Ρ· M.Wassarman和A.P.Wolffe编辑),AcademicPress,SanDiego, 1999 ;和METHODSIN MOLECULARBIOLOGY,第 119 卷,"ChromatinProtocols"(P.B.Becker编辑)Humana Press,Totowa,1999。
[0042] 定义
[0043] 术语"核酸"、"多核苷酸"和"寡核苷酸"可交换使用并且指呈线性或环状构象并 且呈单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物。为了本公开的目的,这些术 语不得视为关于聚合物长度的限制。术语可涵盖天然核苷酸的已知类似物以及在碱基、糖 和/或磷酸部分(硫代磷酸骨架)中经修饰的核苷酸。一般而言,特定核苷酸的类似物具 有相同碱基配对特异性;即,A的类似物将与T碱基配对。
[0044] 术语"多肽"、"肽"和"蛋白质"可交换使用并且指氨基酸残基的聚合物。术语还 适用于其中一种或多种氨基酸为相应天然存在的氨基酸的化学类似物或经修饰衍生物的 氨基酸聚合物。
[0045] "结合"指大分子之间(例如蛋白质和核酸之间)的序列特异性、非共价相互作用。 并非结合相互作用的所有组成部分均需要有序列特异性(例如,与DNA骨架中的磷酸残基 接触),只要总体上相互作用有序列特异性。此类相互作用通常特征在于解离常数(Kd)为 106M1或更低。"亲和力"指结合强度:结合亲和力增加与较低的K,相关联。
[0046] "结合蛋白"是能够与另一分子非共价结合的蛋白质。例如,结合蛋白可与DNA分 子(DNA结合蛋白)、RNA分子(RNA结合蛋白)和/或蛋白质分子(蛋白质结合蛋白)结 合。在为蛋白质结合蛋白的情况下,其可与自身结合(形成同型二聚体、同型三聚体等)和 /或其可与不同蛋白质的一个或多个分子结合。结合蛋白可具有一种以上类型的结合活性。 例如,锌指蛋白具有DNA结合、RNA结合和蛋白质结合活性。
[0047] "锌指DNA结合蛋白"(或结合结构域)是以序列特异性方式,通过一个或多个锌 指结合DNA的蛋白质或较大蛋白质中的结构域,锌指是其结构通过锌离子配位稳定的结合 结构域中的氨基酸序列区域。术语锌指DNA结合蛋白常常缩写为锌指蛋白或ZFP。
[0048]"TALEDNA结合结构域"或"TALE"是包含一个或多个TALE重复结构域/单元的 多肽。重复结构域牵涉于TALE与其同源靶DNA序列的结合中。单个"重复单元"(也称为 "重复")通常长度为33-35个氨基酸并且与天然存在的TALE蛋白中的其它TALE重复序列 至少表现出一定的序列同源性。参见,例如,美国专利号8, 586, 526,通过引用整体并入本 文。
[0049] 例如,可通过工程化天然存在的锌指蛋白的识别螺旋区(改变一种或多种氨基 酸)或通过工程化参与DNA结合的氨基酸(重复可变的二残基或RVD区)将锌指和TALE DNA-结合结构域"工程化"为与预定核苷酸序列结合。因此,工程化锌指蛋白或TALE蛋白 是非天然存在的蛋白质。工程化锌指蛋白和TALE的方法的非限制性实例为设计和选择。设 计的蛋白是在自然界中不存在的蛋白质,其设计/组成主要由合理标准产生。设计的合理 标准包括应用取代规则和计算机算法处理保存现有ZFP或TALE设计和结合数据信息的数 据库中的信息。见,例如,美国专利第8, 586, 526、6, 140, 081、6, 453, 242和6, 534, 261号; 还见TO98/53058、TO98/53059、TO98/53060、TO02/016536 和TO03/016496。
[0050] "选定的"锌指蛋白或TALE是在自然界中未发现的蛋白质,其生成主要由经验过程 引起,例如噬菌体展示、相互作用陷阱或杂交选择。见例如US5, 789, 538、US5, 925, 523、 US6,007,988、US6,013,453、US6,200,759、W0 95/19431、TO96/06166、W0 98/53057、TO 98/54311、TO00/27878、TO01/60970、TO01/88197 和TO02/099084。
[0051] "重组"指两个多核苷酸之间交换遗传信息的过程。为了本公开的目的,"同源重组 (HR) "指例如在细胞中通过同源介导修复机制修复双链断裂期间发生的此类交换的特化形 式。这个过程需要核苷酸序列同源性,将"供体"分子用于"靶"分子(即,经历双链断裂的 分子)的模板修复,并且因为其导致遗传信息从供体转移到靶标,所以不同地称为"非交换 型基因转化(non-crossovergeneconversion) "或"短序列基因转化(shorttractgene conversion) "。不希望受任何特定理论约束,此类转移可涉及在断裂祀标和供体之间形成 的异源双链体DNA的错配校正和/或其中供体用于重新合成将成为靶标的一部分的遗传信 息的"合成依赖式链退火"和/或相关过程。此类特化HR常常导致靶分子的序列改变,以 致供体多核苷酸的部分或全部序列并入靶多核苷酸中。
[0052] 在本公开的方法中,如本文所述的一种或多种靶向核酸酶在靶序列(例如,细胞 染色质)的预定位点产生双链断裂,并且可将与断裂区内的核苷酸序列具有同源性的"供 体"多核苷酸引入细胞中。已经证实双链断裂的存在利于供体序列的整合。供体序列可物理 整合,或可选地,将供体多核苷酸用作通过同源重组修复断裂的模板,导致与供体中一样, 所有或部分核苷酸序列引入细胞染色质中。因此,细胞染色质中的第一序列可改变并且,在 某些实施方案中,可转化为供体多核苷酸中存在的序列。因此,术语"置换(replace)"或 "置换(r印lacement)"的使用可理解为表示一个核苷酸序列经另一个置换,(即,在信息意 义上置换序列),并不一定需要一个多核苷酸经另一个物理或化学置换。
[0053] 在本文所述的任何方法中,附加对的锌指蛋白可用于细胞中附加靶位点的附加双 链裂解。
[0054] 在靶向重组和/或置换和/或改变细胞染色质中目标区域内的序列的方法的某些 实施方案中,通过与外源"供体"核苷酸序列的同源重组改变染色体序列。如果存在与断裂 区域同源的序列,则细胞染色质中双链断裂的存在刺激此类同源重组。
[0055] 在本文所述任何方法中,第一核苷酸序列("供体序列")可含有与目标区域内的基 因组序列同源,但是不相同的序列,从而刺激同源重组以将不同序列插入目标区域。因此, 在某些实施方案中,与目标区域内的序列同源的供体序列的部分表现出与被置换基因组序 列约80-99% (或之间的任何整数)序列同一性。在其它实施方案中,例如如果在100个 以上连续碱基对的供体和基因组序列之间仅1个核苷酸不同,则供体和基因组序列之间的 同源性高于99%。在某些情况下,供体序列的非同源部分可含有在目标区域内不存在的序 列,以致将新序列引入目标区域。在这些情况下,非同源序列两侧通常为与目标区域内的序 列同源或相同的50-1,000个碱基对(或之间的任何整数值)或大于1,000的任何数量的 碱基对的序列。在其它实施方案中,供体序列与第一序列非同源,并且通过非同源重组机制 插入基因组中。
[0056] 本文所述任何方法均可用于通过靶向整合破坏目标基因表达的供体序列,使细胞 中的一个或多个靶序列部分或完全失活。还提供了具有部分或完全失活基因的细胞系。
[0057] 此外,如本文所述靶向整合的方法也可用于整合一个或多个外源序列。例如,外源 性核酸序列可包含一个或多个基因或cDNA分子或任何类型的编码或非编码序列以及一个 或多个控制元件(例如,启动子)。另外,外源性核酸序列可产生一种或多种RNA分子(例 如,小发夹RNA(shRNA)、抑制RNA(RNAi)、微RNA(miRNA)等)。
[0058] "裂解"指DNA分子的共价骨架的断裂。可通过多种方法,包括但不限于酶或化学 水解磷酸二酯键引发裂解。单链裂解和双链裂解均有可能,并且双链裂解可由于两个不同 单链裂解事件而发生。DNA裂解可导致产生平末端或交错末端。在某些实施方案中,融合多 肽用于靶向双链DNA裂解。
[0059] "裂解半结构域"是连同第二多肽(相同或不同)一起形成具有裂解活性(优选为 双链裂解活性)的复合物的多肽序列。术语"第一和第二裂解半结构域"、"+和-裂解半结 构域"和"右侧和左侧裂解半结构域"可交换用于指二聚化的成对裂解半结构域。
[0060] "工程化裂解半结构域"是已经修饰以便与另一裂解半结构域(例如,另一工程 化裂解半结构域)一起形成专性杂二聚体的裂解半结构域。同样见通过引用整体并入本 文的美国专利公布第7, 888, 121、7, 914, 796、8, 034, 598、8, 623, 618号和美国专利公布 2011/0201055 号。
[0061] 术语"序列"指可为DNA或RNA,可为直链、环状或支链并且可为单链或双链的任何 长度的核苷酸序列。术语"供体序列"指插入基因组中的核苷酸序列。供体序列可具有任 何长度,例如长度介于2和10, 000个核苷酸之间(或之间或以上的任何整数值),优选长度 介于约100和1,000个核苷酸之间(或之间的任何整数值),更优选长度介于约200和500 个核苷酸之间。
[0062] "染色质"是包含细胞基因组的核蛋白结构。细胞染色质包含核酸(主要为DNA) 和蛋白质,包括组蛋白和非组蛋白染色体蛋白。大部分真核细胞染色质呈核小体形式存在, 其中核小体核包含与包含组蛋白H2A、H2B、H3和H4各两个的八聚物缔合的DNA的约150个 碱基对;并且接头DNA(根据生物体而言长度可变)在核小体核之间延伸。组蛋白H1的分 子通常与接头DNA缔合。为了本公开的目的,术语"染色质"意在涵盖所有类型的原核和真 核细胞核蛋白。细胞染色质包括染色体和附加体染色质。
[0063] "染色体"是包含细胞的全部或部分基因组的染色质复合物。细胞基因组常常特征 在于其核型,这是包含细胞基因组的所有染色体的集合。细胞基因组可包含一条或多条染 色体。
[0064] "附加体"为复制核酸、核蛋白复合物或包含并非细胞染色体核型的一部分的核酸 的其它结构。附加体的实例包括质粒和某些病毒基因组。
[0065] "靶位点"或"靶序列"是限定结合分子将与之结合的核酸部分的核酸序列,条件是 存在供结合的足够条件。例如,序列5'GAATTC3'是EcoRI重组内切核酸酶的靶位点。
[0066] "外源"分子是细胞中通常不存在,但是可通过一种或多种遗传、生物化学或其它 方法引入细胞中的分子。相对于细胞的特定发育阶段和环境条件测定"细胞中正常存在"。 因此,例如,仅在肌肉胚胎发育期存在的分子相对于成人肌肉细胞为外源分子。类似地,由 热休克诱导的分子相对于非热休克细胞为外源分子。例如,外源分子可包含功能形式的功 能障碍内源分子或功能障碍形式的正常功能内源分子。
[0067] 其中,外源分子可为小分子,例如通过组合化学过程生成的小分子,或大分子例如 蛋白质、核酸、碳水化合物、脂质、糖蛋白、脂蛋白、多糖、以上分子的任何经修饰衍生物或包 含以上一种或多种分子的任何复合物。核酸包括DNA和RNA,可为单链或双链;可为直链、支 链或环状;并且可具有任何长度。核酸包括能够形成双链体的核酸以及形成三链体的核酸。 见,例如,美国专利第5, 176, 996和5, 422, 251号。蛋白质包括但不限于DNA结合蛋白、转录 因子、染色质重构因子、甲基化DNA结合蛋白、聚合酶、甲基化酶、脱甲基酶、乙酰基转移酶、 脱乙酰基酶、激酶、磷酸酶、整合酶、重组酶、连接酶、拓扑异构酶、促旋酶和解螺旋酶。
[0068] 外源分子可为与内源分子相同类型的分子,例如外源蛋白质或核酸。例如,外源 性核酸可包括感染病毒基因组、引入细胞的质粒或附加体或细胞中通常不存在的染色体。 将外源分子引入细胞的方法为本领域的技术人员已知并且包括但不限于脂质介导的转移 (即,脂质体,包括中性和阳离子性脂质)、电穿孔、直接注入、细胞融合、粒子轰击、磷酸钙 共沉淀法、DEAE-葡聚糖介导的转移和病毒载体介导的转移。外源分子也可为与内源分子 相同类型的分子,但是源自与所述细胞来源不同的物种。例如,人核酸序列可引入最初源自 小鼠或仓鼠的细胞系中。
[0069] 相反,"内源"分子是特定细胞中,在特定环境条件下的特定发育阶段通常存在的 分子。例如,内源性核酸可包括染色体、线粒体、叶绿体或其它细胞器的基因组或天然存在 的附加体核酸。另外的内源分子可包括蛋白质,例如转录因子和酶。
[0070] "融合"分子是其中两个或更多个亚基分子优选共价连接的分子。亚基分子可为相 同化学类型的分子,或可为不同化学类型的分子。第一种类型的融合分子的实例包括但不 限于融合蛋白(例如,ZFP或TALEDNA结合结构域和一个或多个激活结构域之间的融合) 和融合核酸(例如,编码如上所述融合蛋白的核酸)。第二种类型的融合分子的实例包括但 不限于形成三链体的核酸与多肽之间的融合和小沟结合物与核酸之间的融合。
[0071] 细胞中融合蛋白的表达可由向细胞递送融合蛋白引起或通过向细胞递送编码融 合蛋白的多核苷酸引起,其中转录多核苷酸并且翻译转录物以生成融合蛋白。在细胞中蛋 白质的表达中还可牵涉反式剪接、多肽裂解和多肽连接。在本公开其它地方提出了向细胞 递送多核苷酸和多肽的方法。
[0072] 为了本公开的目的,"基因"包括编码基因产物的DNA区域(见下文)以及调控基 因产物的生成的所有DNA区域,不论此类调控序列是否与编码和/或转录序列相邻。相应 地,基因包括但不一定限于启动子序列、终止子、翻译调控序列(例如核糖体结合位点和内 部核糖体进入位点)、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点和基因座 控制区。
[0073] "基因表达"指将基因内所含信息转化为基因产物。基因产物可为基因的直接转录 产物(例如,mRNA、tRNA、rRNA、反义RNA、核酶、结构RNA或任何其它类型的RNA)或通过翻 译mRNA生成的蛋白质。基因产物还包括通过例如加帽、聚腺苷酸化、甲基化和编辑的过程 修饰的RNA和(例如)通过甲基化、乙酰化、磷酸化、泛素化、ADP-核糖基化、豆蔻酰化和糖 基化修饰的蛋白质。
[0074] 基因表达的"调节"指基因活性的变化。表达的调节可包括但不限于基因激活和 基因阻遏。基因组编辑(例如,裂解、改变、失活、随机突变)可用于调节表达。基因失活指 与不包括如本文所述的ZFP的细胞相比,基因表达的任何减少。因此,基因失活可为部分或 全部。
[0075] "目标区域"为细胞染色质的任何区域,例如需要结合外源分子的基因或基因内或 相邻的非编码序列。结合可能是为了靶向DNA裂解和/或靶向重组的目的。例如,目标区 域可存在于染色体、附加体、细胞器基因组(例如,线粒体、叶绿体)或感染病毒基因组。目 标区域可在基因的编码区内、经转录的非编码区例如前导序列、尾随序列或内含子内,或在 编码区上游或下游的非转录区内。目标区域长度可小到单个核苷酸对或多达2, 000个核苷 酸对或任何整数值的核苷酸对。
[0076] "真核"细胞包括但不限于真菌细胞(例如酵母)、植物细胞、动物细胞、哺乳动物 细胞和人细胞(例如,T细胞)。
[0077] 术语"操作性连接"和"操作性地连接"(或"可操作地连接")对于两个或更多个 组成部分(例如序列元件)的并置可交换使用,其中组成部分排列成以致两个组成部分正 常作用并且允许至少一个组成部分可介导对其它组成部分中的至少一个发挥的作用的可 能性。举例而言,如果转录调控序列控制编码序列响应于一种或多种转录调控因子的存在 或缺乏而转录的水平,则转录调控序列例如启动子与编码序列操作性地连接。转录调控序 列通常与编码序列顺式操作性地连接,但不需要与之直接相邻。例如,增强子是与编码序列 操作性地连接的转录调控序列,即使它们不连续。
[0078] 对于融合多肽,术语"操作性地连接"可指每个组成部分在与其它组成部分的连 接中,执行与如果不这样连接时相同的功能。例如,对于其中DNA结合结构域(例如,ZFP、 TALE)与激活结构域融合的融合多肽,如果在融合多肽中,DNA结合结构域部分能够结合其 靶位点和/或其结合位点,而激活结构域能够上调基因表达,则DNA结合结构域和激活结构 域处于操作性连接。对于DNA结合结构域与裂解结构域融合的融合多肽,如果在融合多肽 中,DNA结合结构域部分能够结合其靶位点和/或其结合位点,而裂解结构域能够在靶位点 附近裂解DNA,则DNA结合结构域和裂解结构域处于操作性连接。类似地,对于DNA结合结 构域与激活或阻遏结构域融合的融合多肽,如果在融合多肽中,DNA结合结构域部分能够结 合其靶位点和/或其结合位点,而激活结构域能够上调基因表达或阻遏结构域能够下调基 因表达,则DNA结合结构域和激活或阻遏结构域处于操作性连接。
[0079] 蛋白质、多肽或核酸的"功能片段"是其序列与全长蛋白质、多肽或核酸不同,但是 保持了与全长蛋白质、多肽或核酸相同的功能的蛋白质、多肽或核酸。功能片段可具有比相 应天然分子更多、更少或相同数量的残基,和/或可含有一种或多种氨基酸或核苷酸取代。 测定核酸功能(例如,编码功能、与另一核酸杂交的能力)的方法在本领域中众所周知。类 似地,测定蛋白质功能的方法众所周知。例如,可通过过滤结合、电泳迀移或免疫沉淀测定 法测定多肽的DNA结合功能。可通过凝胶电泳测定DNA裂解。见Ausubel等,同上。例如, 可通过遗传和生化免疫共沉淀、双杂交测定法或互补作用测定蛋白质与另一种蛋白质相互 作用的能力。见,例如,Fields等(1989)Nature340:245-246 ;美国专利第5, 585, 245号和 PCTTO98/44350。
[0080] "载体"能够将基因序列转移到靶细胞中。通常,"载体构建体"、"表达载体"和"基 因转移载体"意指能够指导目标基因的表达并且可将基因序列转移到靶细胞中的任何核酸 构建体。因此,术语包括克隆和表达媒介物以及整合载体。
[0081] "报告基因"或"报告序列"指生成优选不一定在常规测定中易于测量的蛋白质 产物的任何序列。适合的报告基因包括但不限于编码介导抗生素抗性(例如,氨苄青霉素 (ampicillin)抗性、新霉素(neomycin)抗性、G418抗性、噪呤霉素(puromycin)抗性)的蛋 白质的序列、编码有色或荧光或发光蛋白质(例如,绿色荧光蛋白、增强型绿色荧光蛋白、 红色荧光蛋白、荧光素酶)和介导增强细胞生长和/或基因扩增的蛋白质(例如,二氢叶酸 还原酶)的序列。表位标签包括(例如)一个或多个拷贝的FLAG、His、myc、Tap、HA或任 何可检测的氨基酸序列。"表达标签"包括编码可能与所需基因序列可操作地连接以便监测 目标基因的表达的报告基因的序列。
[0082] DNA结合结构域
[0083] 本文描述了包含与包含HLA基因或HLA调节剂的任何基因中的靶位点特异性结合 的DNA结合结构域的组合物。任何DNA结合结构域均可用于本文公开的组合物和方法中。
[0084] 在某些实施方案中,DNA结合结构域包含锌指蛋白。优选地,锌指蛋白为非 天然存在,因为其经工程化为与所选靶位点结合。见,例如,Beerli等(2002)Nature Biotechnol. 20:135-141;Pabo等(2001)Αηη·Rev.Biochem. 70:313-340;Isalan等(2001)NatureBiotechnol. 19:656-660;Segal等(2001)Curr.Opin.Biotechnol. 12:632-637; Choo等(2000)Curr.Opin.Struct.Biol. 10:411-416 ;美国专利第 6, 453, 242、6, 534, 261、 6, 599, 692、6, 503, 717、6, 689, 558、7, 030, 215、6, 794, 136、7, 067, 317、7, 262, 054、 7, 070, 934、7, 361,635、7, 253, 273 号;和美国专利公布第 2005/0064474、2007/0218528、 2005/0267061号,全部通过引用整体并入本文。在某些实施方案中,DNA结合结构域包含 美国专利公布第2012/0060230号(通过引用整体并入本文)中公开的锌指蛋白(例如,表 1)〇
[0085] 与天然存在的锌指蛋白相比,工程化锌指结合结构域可具有新型的结合特异性。 工程化方法包括但不限于合理的设计和各种类型的选择。合理的设计包括(例如)使用 包含三联体(或四联体)核苷酸序列和单独锌指氨基酸序列的数据库,其中每个三联体或 四联体核苷酸序列与锌指的结合特定三联体或四联体序列的一个或多个氨基酸序列缔合。 见,例如,美国专利6, 453, 242和6, 534, 261,其通过引用整体并入本文。
[0086] 在美国专利 5,789,538、5,925,523、6,007,988、6,013,453、6,410,248、 6, 140, 466、6, 200, 759 和 6, 242, 568 以及TO98/37186、TO98/53057、TO00/27878、TO 01/88197和GB2, 338, 237中公开了示例性选择方法,包括噬菌体展示和双杂交体系。另 外,例如在美国专利号6, 794, 136中已描述了锌指结合结构域结合特异性的增强。
[0087] 另外,如这些和其它参考文献中所公开那样,锌指结构域和/或多指锌指蛋白可 使用任何适合的接头序列,包括例如长度为5个或更多个氨基酸的接头连接在一起。对 于长度为6个或更多个氨基酸的示例性接头,同样见美国专利第6, 479, 626、6, 903, 185和 7, 153, 949号。本文所述蛋白质可包括在蛋白质的单独锌指之间适合接头的任何组合。另 外,例如在美国专利号6, 794, 136中描述了对于锌指结合结构
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1