用于基因编辑的cas变体的制作方法

文档序号:10573711阅读:1188来源:国知局
用于基因编辑的cas变体的制作方法
【专利摘要】本披露的一些方面提供对核酸的靶向编辑有用的策略、系统、试剂、方法和试剂盒,该靶向编辑包括在细胞或受试者的基因组内,例如在人类基因组内,编辑单个位点。在一些实施例中,提供了Cas9和核酸编辑酶或酶结构域,例如脱氨酶结构域的融合蛋白。在一些实施例中,提供了用于靶向核酸编辑的方法。在一些实施例中,提供了产生靶向核酸编辑蛋白,例如Cas9和核酸编辑酶或结构域的融合蛋白的试剂和试剂盒。
【专利说明】用于基因编辑的CAS变体
[0001] 相关申请
[0002] 本申请要求在35U.S.C.§119(e)下于2013年12月12日提交的美国临时专利申请 U.S.S.N.61/915,386和于2014年4月16日提交的美国临时专利申请U.S.S.N.61/980,333的 优先权;并且也要求在35U.S.C. §120下全部于2014年7月8日提交的美国专利申请 U.S.S.N.14/325,815、14/326,109、14/326,140、14/326,269、14/326,290、14/326,318和 14/326,303的优先权;将其每一个通过引用结合在此。
[0003] 政府支持
[0004] 本发明是使用由国防高级研究计划局(DARPA)授予的拨款皿0011-11-2-0003、由 美国国立卫生研究院(NIH)授予的拨款GM095501、W及由空间和海战系统中屯、(SPAWAR)授 予的拨款N66001-12-C-4207下的美国政府资助进行的。政府具有本发明中的某些权利。
[0005] 发明背景
[0006] 核酸序列的祀向编辑,例如,引入特定的修饰到基因组DNA,是基因功能研究的非 常有前途的方法,并且还具有对人类遗传性疾病提供新疗法的潜力。1理想的核酸编辑技术 拥有=大特点:(1)高效插入所需的修饰;(2)最小的脱祀活性;和(3)被编程为在给定的核 酸的任何位点(例如人类基因组内的任何位点)精确编辑的能力。2当前基因组工程工具包 括设计的锋指核酸酶(ZFN),3转录激活因子如效应核酸酶(TALEN) ,4W及最近的RNA指导的 DNA核酸内切酶化s9,5在基因组中的效应序列特异性DNA切割。此可编程的切割可在切割位 点通过非同源末端连接(NHEJ)导致DNA突变或在切割位点周围通过同源定向修复化DR)导 致DNA置换。6'7
[0007] 当前技术的一个缺点是NHEJ和皿R都是典型地导致适度的基因编辑效率W及可W 与期望的改变竞争的不需要的基因改变的随机过程。8因为原则上许多遗传性疾病可W通 过在基因组中的特定位置产生特定核巧酸变化来进行处理(例如,疾病相关基因的特定密 码子中从C到T的改变),9开发可设计的方式W达到运样的精确基因编辑将代表为基于基因 编辑的人类治疗提供了强大的新研究工具W及潜在的新方法。
[000引发明概述
[0009]成簇的规律间隔短回文重复序列(CRISPR)系统是最近发现的原核适应性免疫系 统,W该原核适应性免疫系统已被修改W使强大和通用的基因组工程在各种生物体和细胞 系中成为可能。"CRISPR-Cas (CRISPR相关)系统是蛋白RNA复合体,该复合体使用RNA分子 (SgRNA)为指导将该复合体通过碱基配对定位于祀DNA序列。U在自然系统中,Cas蛋白然后 充当核酸内切酶切割祀DNA序列。U祀DNA序列必须与SgRNA互补,并且还包含"前间区序列邻 近基序(protospacer-adjacent motif,PAM)"二核巧酸在互补区的3 '端W使系统起作用 (图1)。14在已知的化S蛋白中,酿脈链球菌(S.Pyogenes))Cas9已被最广泛地用作基因组工 程的工具。IS此Cas9蛋白是含有两个不同核酸结构域的大的多结构域蛋白。可W在Cas9中引 入点突变W废止核酸酶活性,产生仍然保留其WsgRNA编程的方式结合DNA的能力的死亡 Cas9(dCas9Ki6原则上,当与另一个蛋白或结构域融合,dCas9可W简单地通过与合适的 SgRNA共表达将该蛋白祀向几乎任何DNA序列。
[0010] d化s9复合体用于基因组工程的目的的潜力是巨大的。理论上将蛋白引入被SgRNA 编程的基因组的特异位点的独特的能力被发展成超越核酸酶的各种位点特异的基因组工 程工具,包括转录激活因子、转录抑制因子、组蛋白修饰蛋白、整合酶和重组酶。11最近已经 通过dCas9与转录激活因子融合来实施运些潜在应用的一些W提供RNA指导的转录激活因 子、n'ls转录抑制因子、及染色质修饰酶。2I运些与各种SgRNA融合的简单的共表达 导致祀向基因的特异表达。运些开创性的研究为用于基因组的精准操控的可易编程序列特 异性效应子的设计和建造铺平了道路。
[0011] 很大意义上,对人类疾病负责的80%-90%的蛋白突变起源于仅仅单个核巧酸的 置换、缺失或插入。6然而,还没有开发出使W整体和直接的方式进行单核巧酸操控成为可 能的基因组工程工具。目前针对单碱基基因修正的策略包括工程化的核酸酶(其依赖于创 建双链断裂(DSB),接着是随机低效的同源性定向修复化DR))、W及DNA-RNA嵌合寡核巧酸 。22较晚的策略设及设计RNA/DNA序列从而与除了待编辑核巧酸外的基因组DNA碱基配对。通 过细胞的内源修复系统识别和修理产生的错配,导致嵌合或基因组的序列的改变。运些策 略都遭受了低基因编辑效率和不需要的基因改变的问题,因为它们受皿R随机性和皿R与非 同源末端连接(NHEJ)之间竞争的支配。23^25HDR效率根据祀基因在基因组中的位置、 26细胞 周期的状态、27和细胞/组织的类型不同。28因此,开发直接的可编程的方式W类酶的效率和 非随机的方式安置碱基修饰特异的类型在基因组DNA的精确位置将代表为基于基因编辑的 研究工具和人类治疗提供功能强大的新方法。
[0012] 本披露的一些方面提供对核酸的祀向编辑有用的策略、系统、试剂、方法和试剂 盒,该祀向编辑包括在受试者的基因组(例如人类基因组)中编辑单个位点。在一些实施例 中,提供了化s9和核酸编辑酶或酶结构域(例如脱氨酶结构域)的融合蛋白。在一些实施例 中,提供了用于祀向核酸编辑的方法。在一些实施例中,提供了产生祀向核酸编辑蛋白(例 如Cas9和核酸编辑酶或结构域的融合蛋白)的试剂和试剂盒。
[0013] 本披露的一些方面提供包括W下项的融合蛋白:(i)核酸酶非活性的化s9结构域; 和(ii)核酸编辑结构域。在一些实施例中,核酸编辑结构域是DNA编辑结构域。在一些实施 例中,核酸编辑结构域是脱氨酶结构域。在一些实施例中,脱氨酶是胞巧脱氨酶。在一些实 施例中,脱氨酶是载脂蛋白B mRNA编辑复合体(APOBEC)家族脱氨酶。在一些实施例中,脱氨 酶是APO肥Cl家族脱氨酶。在一些实施例中,脱氨酶是激活诱导的胞巧脱氨酶(AID)。在一些 实施例中,脱氨酶是ACF1/ASE脱氨酶。在一些实施例中,脱氨酶是腺巧脱氨酶。在一些实施 例中,脱氨酶是ADAT家族脱氨酶。在一些实施例中,核酸编辑结构域被融合至CAS9结构域的 N末端。在一些实施例中,核酸编辑结构域被融合至CAS9结构域的C末端。在一些实施例中, CAS9结构域与核酸编辑结构域是通过连接体融合的。在一些实施例中,该连接体包含 (GGGGS)n(SEQ ID N0:91)、(G)n、化AAAK)n(SEQ ID N0:5)、(GGS)n、SG沈TPGT沈SATPES(SEQ ID N0:93)基序(参见,例如,古灵儿JP(Guilinger 肝)、汤普森.DB^hompson DB)、刘.DR 化iu DR)。融合无催化活性的Cas9至FokI核酸酶改善基因组修饰的特异性(Fusion of catalytically inactive Cas9to FokI nuclease improves the specificity of genome modification),自然生物技术(化t .Biotechnol. )2014; 32(6): 577-82;将其全部 内容通过引用结合在此),或(XP)n基序,或任意运些的组合,其中n独立地是1至30之间的整 数。
[0014] 本披露的一些方面提供用于DNA编辑的方法。在一些实施例中,该方法包括使DNA 分子与W下项接触:(a)包含核酸酶非活性的化s9结构域和脱氨酶结构域的融合蛋白;W及 (b)将(a)的融合蛋白祀向DNA链的祀核巧酸序列的SgRNA;其中所述DNA分子与处于有效量 的和在适合于核巧酸碱基的脱氨基作用的条件下的所述融合蛋白和所述SgRNA接触。在一 些实施例中,祀DNA序列包括与疾病或失调相关的序列,并且其中核巧酸碱基的脱氨基作用 产生与疾病或失调无关的序列。在一些实施例中,该DNA序列包括与疾病或失调相关的T〉C 或A〉G点突变,并且其中该突变的C或師咸基的脱氨基作用产生与疾病或失调无关的序列。在 一些实施例中,脱氨基作用改正了与疾病或失调相关的序列中的点突变。在一些实施例中, 所述与疾病或失调相关的序列编码蛋白,并且其中脱氨基作用在与疾病或失调相关的序列 中引入终止密码子,导致编码蛋白的截短。在一些实施例中,脱氨基作用改正了PI3KCA基因 的点突变,从而修正了H1047R和/或A3140G突变。在一些实施例中,该接触是在倾向于具有、 具有或被诊断出具有疾病或失调的受试者的体内进行。在一些实施例中,该疾病或失调是 基因组中与点突变或单个碱基突变相关的疾病。在一些实施例中,该疾病是遗传性疾病、癌 症、代谢性疾病或溶酶体胆积病。
[0015] 本披露的一些方面提供用于检测化s9:DNA编辑结构域融合蛋白的核酸编辑活性 的报告构建体。在一些实施例中,该构建体包括(a)包含用于化S9DNA编辑蛋白的祀位点的 报告基因,其中祀向的DNA编辑导致报告基因表达的增加;W及(b)控制报告基因表达的启 动子序列。在一些实施例中,该构建体进一步包括(C)编码将化S9DNA编辑蛋白祀向报告基 因的祀位点的SgRNa的序列,其中SgRNA表达与报告基因的表达是独立的。在一些实施例中, 报告基因的祀位点包括未成熟的终止密码子,并且其中通过化S9DNA编辑蛋白对祀向的DNA 的模板链的编辑导致未成熟的终止密码子转变为编码氨基酸残基的密码子。在一些实施例 中,该报告基因编码巧光素酶、巧光蛋白或抗生素抗性标记。
[0016] 本披露的一些方面提供试剂盒,该试剂盒包括:核酸构建体,该构建体包含编码核 酸酶非活性的Cas9序列的序列,包括克隆位点的序列,该克隆位点被定位于允许编码与 Cas9编码序列同框的核酸编辑酶或酶结构域的序列的克隆,W及任选地编码连接体的序 列,该连接体被定位于化s9编码序列和克隆位点之间的。另外,在一些实施例中,试剂盒包 含合适的试剂、缓冲液、和/或说明书用于将编码核酸编辑酶或酶结构域框架克隆进入核酸 构建体W产生Cas9核酸编码融合蛋白。在一些实施例中,所述包括克隆位点的序列是Cas9 序列的N末端。在一些实施例中,所述包括克隆位点的序列是化s9序列的C末端。在一些实施 例中,所述编码的连接体包含(GGGGS)n(SEQ ID N0:91)、(G)n、化AAAK)n(SEQ ID N0:5)、 (GGS)n、SGSETPGT沈SATPES(SEQ ID N0:93)基序(参见,例如,古灵儿肝(Guilinger 肝)、汤 普森? DB(Thompson DB)、刘? DR化iu DR),融合无催化活性的Cas9至化kl核酸酶改善基因 组修饰的特异性(Fusion of catalytically inactive Cas9to FokI nuclease improves the specificity of genome modification),自然生物技术(化t.Biotechnol.)2014;32 (6) :577-82;将其全部内容通过引用结合在此),或(XP)n基序,或任意运些的组合,其中n独 立地是1至30之间的整数。
[0017] 本披露的一些方面提供包括W下项的试剂盒,包含核酸酶非活性的化s9结构域和 核酸编辑酶或酶结构域的融合蛋白W及任选地,定位于化s9结构域和核酸编辑酶或酶结构 域之间的连接体。另外,在一些实施例中,该试剂盒包括合适的试剂、缓冲液和/或说明书, 用于使用融合蛋白(例如,用于体外或体内DNA或RNA编辑)。在一些实施例中,该试剂盒包括 关于用于核酸序列的祀向编辑的合适的SgRNA的设计和使用的说明书。
[0018] W上概述W非限制性的方式意欲说明本文披露的技术的一些实施例、优势、特征、 和用途。本文披露的技术的其他实施例、优势、特征、和用途将由于详细说明、附图、实例和 权利要求书而是显而易见的。
[0019] 附图简要说明
[0020] 图1. Cas9/sgRNA-DNA复合体。SgRNA的3'端与Cas9核酸酶形成核糖核蛋白,而 SgRNA的20nt 5'端识别其互补的DNA片段。DNA结合要求3-nt的PAM序列5'与祀DNA结合。在 Wt化s9的情况下,双链DNA切割发生在距PAM 3nt处W产生平端(由箭头示出)。应当注意的 是,泡的大小是未知的。
[0021] 图2. AP0BEC3G(PDB ID 3E1U)的催化结构域的晶体结构。被认为在整个家族中是 保守的核屯、二级结构由两侧为六个a螺旋的五链0片层(箭头)组成。活性中屯、环(活性位点 环)被认为是负责确定脱氨基特异性。负责催化活性的化h被显示为球体。运些序列从上到 下对应于沈Q ID NO:97-98。
[0022] 图3.基于巧光素酶报告分析的设计。SgRNA将发生改变W祀向众多序列从而祀向 突变的起始密码子(W下划线标出的C残基),运些序列对应于巧光素酶基因之前和包括巧 光素酶基因的区域。将在起始密码子和巧光素酶基因之间加入"缓冲"区域W包括只有A和T (显示为(ZZZ)X)的密码子。指示了夏因-达尔加诺(SMne-Dalgarno)序列。在一些实施例 中,优选是保留所有C的配对碱基对W防止脱祀效应。
[0023] 图4.脱氨酶试验。运些序列从上到下对应于沈Q ID N0:99-105。
[0024] 图5.通过化S9-AK)邸Cl融合蛋白编辑的ssDNA的SDS PAGE凝胶。
[0025] 定义
[0026] 如在本文和权利要求中使用的单数形式"一个/种(a、an)"和"所述/该(the)"包括 单数和复数指代物,除非上下文明确地指示其他的情况。因此,例如"药剂"的提及包括单一 的药剂和多种运样的药剂。
[0027] 术语"Cas9"或"Cas9核酸酶"是指包括Cas9蛋白或其片段(例如包含Cas9的活性或 非活性DNA切割结构域和/或Cas9的曲NA结合结构域的蛋白)的RNA指导的核酸酶<Xas9核酸 酶有时也指casnl核酸酶或CRISPR(成簇的规律间隔短回文重复序列)相关核酸酶。CRISPR 是对可移动遗传元素(病毒、转位因子和接合质粒)提供保护的适应性免疫系统。CRISIS簇 包含间隔物、与先行可移动元素互补的序列和祀标侵入核酸。CRISPR簇转录并被加工成 CRISPR RNA(CrRNA)。在II型CRISPR系统中正确加工前crRNA要求反式编码的小RNA (tracrRNA)、内源核糖核酸酶3(rnc)和Cas9蛋白。tracrRNA用作前crRNA的核糖核酸酶3辅 助加工的指导。随后,Cas9/crRNA/tracrRNA核酸内切地切割与间隔物互补的线状或环状双 链DNA祀标。与crRNA不互补的祀链首先被核酸内切地切割,然后进行3'-5'核酸外切地修 剪。在自然界,DNA结合与切割典型地需要蛋白和两种RNA。然而,可W设计单指导的RNA TsgRNA"或简单地称为"gNRA" ) W便于将crRNA和tracrRNA两者的方面并入单RNA种类。参 见,例如,季憂克? M. (Jinek M.)、吉林斯基? K.(化ylinski K.)、方法拉? I. (Fonfara I.)、豪尔? M.(化Uer M.)、杜德纳? J.A. (Doudna J.A.)、卡彭特? E.(化a;rpentier E.), 科学(Science)337:816-821 (2012),将其全部内容通过引用结合在此。Cas9识别CRISPR重 复序列的短基序(PAM或前间区序列邻近基序似帮助区分自我与非自我。化s9核酸酶序列 和结构是本领域技术人员已熟知的(参见,例如,"酿脈链球菌的Ml株全基因组序列 (Complete genome sequence of an Mlstrain of Streptococcus pyogenes)",法拉帝? J.J.(Ferretti J.J.)、马克山W.M.(McShan W.M.)、阿杰迪克D.J.(Ajdic D.J.)、萨维奇* D. J. (Savic D. J.)、萨维奇? G. (Savic G.)、里昂? K.化yon K.)、普里莫斯"Primeaux C)、索扎特S(Sezate S.)、苏沃洛夫-AiNi(Suvorc)V A.N.)、肯顿 *S.化6111〇115.)、赖* H. S.(Lai H.S.)、林? S.P.(Lin S.P.)、钱? Y.(Qian Y.)、贾? H.G.(Jia H.G.)、纳加尔. F.Z.(Najar F.Z.)、任? Q.(Ren Q.)、朱? H.(Zhu H.)、宋? L.(Song L.)、怀特? J.(怖ite I. )、袁*乂.(¥11日11乂.)、克利夫顿《8.胖.((:11打〇115.胖.)、罗伊《6.4.(1?〇6 8.4.)、麦克劳 克林? R.E.(M化au曲Iin R.E.),美国国家科学院院刊(Proc.化tl.Acad.Sci.U.S.A.)98: 4658-4663(2001);"通过反式编码的小RNA和宿主因子RNA酶III进行的CRISPR RNA成熟 (CRISPR RNA maturation by trans-encoded small RNA and host factor RNase Ilir,德特车维E.化eltcheva E.)、吉林斯基? K.(化ylinski K.)、夏尔马? C.M.(Sharma (:.]\〇、冈萨雷斯.1(.(6〇的日168 1(.)、超.¥.(〇1日〇¥.)、皮尔扎达.2.4.。1^日(1曰2.4.)、 埃克特 *M.R.化ckert M.R.)、沃格尔? J.(Vogel J.)、卡彭特 *E.(Cha巧entier E.),自 然(化化re)471:602-607(2011); W及"适应性细菌免疫中可编程的双RNA指导的DNA内源核 SSIi(A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity)",季憂克? M. (Jinek M.)、吉林斯基? K. (Qi}dinski K.)、方法拉? I.化onfara I.)、豪尔? M.(化uer M.)、杜德纳? J.A. (Doudna J.A.)、卡彭特? E.(化a;rpentier E.), 科学(Science)337:816-821 (2012),将其每一个的全部内容通过引用结合在此。Cas9直系 同源已在各种物种中描述,包括但不限于酿脈链球菌(S. pyogenes)和嗜热链球菌 (S. thermo地iIus)。基于本披露另外的合适的化s9核酸酶和序列对本领域的普通技术人员 而言将是显而易见的,并且运样的化s9核酸酶和序列包括来自生物有机体的化s9序列和披 露在W下文献中的位点:吉林斯基(化^inski)、卢恩(Rhun)和卡彭特(化arpentier),"II 型CRISPR-Cas免疫系统的tracrRNA和Cas9家族(The tracrRNA and Cas9families of type II CRISPR-Cas immunity systems)" (2013)RNA生物学(RNA Biology)10:5,726- 737;将其全部内容通过引用结合在此。在一些实施例中,Cas9核酸酶具有非活性的(例如非 激活的)DNA切割结构域。
[0028]核酸酶非激活的化s9蛋白能够可互换地被称为"此as9"蛋白(针对核酸酶"死亡" 化s9)。产生具有非活性DNA切割结构域的Cas9蛋白(或其片段)的方法是已知的(参见,例 如,季憂克(Jinek)等人,科学(Science) ,337:816-821(2012);齐(Qi)等人,"将 CRISPR 再利 用为RNA指导的平台W用于基因表达的序列特异性控制(R巧U巧OSing CRISPR as an RNA- Guided Platform for Sequence-Specific Control of Gene Expression)" (2013),细胞 (Cell), 28; 152(5): 1173-83,将其每一个的全部内容通过引用结合在此)。例如,Cas9的DNA 切割结构域已知包括两个亚结构域:HNH核酸酶亚结构域和RuvCl亚结构域。HNH亚结构域切 割与gRNA互补的链,而RuvCl亚结构域切割非互补的链。在运些亚结构域中的突变可W使 化s9的核酸酶活性沉默。例如突变DlOA和H841A完全使酿脈链球菌化s9的核酸酶失去活性 (季憂克(Jinek)等人,科学(Science) ,337:816-821(2012);齐(Qi)等人,细胞(Cell), 28; 152(5): 1173-83(2013)。在一些实施例中,提供了包含化s9片段的蛋白。例如,在一些实施 例中,蛋白包含如下两个化s9结构域中的一个:(I化as9的gRNA结合结构域;或(2)Cas9的 DNA切割结构域。在一些实施例中,包含化s9或其片段的蛋白被称为乂 as9变体"。化s9变体 与Cas9或其片段享有同源性。例如,Cas9变体与野生型Cas9有至少约70%-致性,至少约 80 % -致性,至少约90 % -致性,至少约95 % -致性,至少约96 % -致性,至少约97 % -致 性,至少约98 % -致性,至少约99 % -致性,至少约99.5 % -致性,或至少约99.9 % -致性。 在一些实施例中,化s9变体包含化s9的片段(例如gRNA结合结构域或DNA切割结构域),W至 于该片段与野生型化s9的相应片段有至少约70 %-致性,至少约80 %-致性,至少约90 % 一致性,至少约95 % -致性,至少约96 % -致性,至少约97 % -致性,至少约98 % -致性,至 少约99 % -致性,至少约99.5 % -致性,或至少约99.9 % -致性。在一些实施例中,野生型 化s9对应于来自酿脈链球菌的化s9(NCBI参考序列:NC_017053.1,SEQ ID NO:l(核巧酸); 沈Q ID NO:2(氨基酸))。
[00 巧]ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGAT GATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGG GGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTC GGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGA CTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGT TGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGC GCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGAT AATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGC AAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGC TCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCA AATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGC GCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCC TAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGAC TTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAA CGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAA TGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGC TCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAA AGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATA GTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGT GCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACA TAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAAC CAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAG CAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAA TGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAG ATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATAT GCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAA ATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATC GCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAA GGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAA AATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGA CAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAG ATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAG AGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTT TCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCA AGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTT TGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTG AAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAA CTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAA AGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGA AATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCT GAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTAC ACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAG GGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACA GGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCC AAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAAT CGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATT GACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGA GTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCA AATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAA TTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTT AGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAA ATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGT AAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACG CATTGATTTGAGTCAGCTAGGAGGTGACTGA(SEQ ID NO:I)
[0030]
[0031] (单下划线:HNH结构域;双下划线:RuvC结构域)
[0032] 在一些实施例中,野生型化s9对应于或包含SEQ ID NO: 3(核巧酸)和/或SEQ ID N0:4(氨基酸):
[0033] ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGAT GAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGG TGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTC GCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGT TTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGT GGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGA GGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGAC AACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGC AAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAAT TACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCG AACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGC ACAAATTGGAGATCAGTATGCGGACTTAITTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATAC TGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGAC TTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAA CGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGA TGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGT AGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAA AGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACT CTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGT GCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCA CAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAAC CCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAG CAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAA TGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAG ATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATAC GCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAA ACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATA GGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAA GGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAA AGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATC AAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGC CAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGG AAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAAT CCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTT CCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAA GTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCG TGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGAT AAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTA TAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTA AGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAA AGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAAT CACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATA AGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAG ACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGA CCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAA AATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCC ATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTT TGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGT CTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAG CAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCAT CCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGG AAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGAT CGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAAC TCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACC ATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA(SEQ ID NO:3)
[0034]
[0035] (单下划线:HNH结构域;双下划线:RuvC结构域)
[0036] 在一些实施例中,d化s9对应于或包含部分或全部化s9氨基酸序列,该氨基酸序列 具有使Cas9核酸酶失去活性的一个或多个突变。例如,在一些实施例中,此as9结构域包含 DlOA和/或册20A突变。
[0037] dCas9(D10A 和册 40A):
[00381
[
[0040](单下划线:HNH结构域;双下划线:RuvC结构域)
[0041 ] 在其他实施例中,提供了具有除DlOA和册20A外的突变的dCas9变体,其(例如)产 生核酸酶非激活的化s9(此as9)。通过实例的方式,运样的突变包括其他在DlO和册20处的 氨基酸置换或其他在化s9核酸酶结构域内的置换(例如,在HNH核酸酶亚结构域和/或RuvCl 亚结构域中的置换)。在一些实施例中,提供了dCas9的变体或同系物(例如,SEQ ID N0:34 的变体),运些变体或同系物与沈Q ID N0:34有至少约70%-致性,至少约80%-致性,至 少约90 % -致性,至少约95 % -致性,至少约98 % -致性,至少约99 % -致性,至少约 99.5% -致性,或至少约99.9 % -致性。在一些实施例中,提供了dCas9的变体(例如,SEQ ID N0:34的变体),运些变体具有的氨基酸序列短于或长于SEQ ID N0:34大约5个氨基酸, 大约10个氨基酸,大约15个氨基酸,大约20个氨基酸,大约25个氨基酸,大约30个氨基酸,大 约40个氨基酸,大约50个氨基酸,大约75个氨基酸,大约100个氨基酸或更多。
[0042]在一些实施例中,如本文提供的Cas9融合蛋白包括化s9蛋白的全长氨基酸,例如 W上提供的序列中的一个。然而,在其他实施例中,如本文提供的融合蛋白不包括全长Cas9 序列,而仅仅是其片段。例如,在一些实施例中,本文提供的化s9融合蛋白包括化s9片段,其 中该片段结合crRNA和tracrRNA或SgRNA,但是不包括功能性核酸酶结构域,例如,因为它仅 仅包括核酸酶结构域的截短版本或根本没有核酸酶结构域。文本提供了适合的化s9结构域 和化s9片段的示例性氨基酸序列,并且另外的适合的化s9结构域和片段序列对本领域的普 通技术人员而言将是显而易见的。
[004引在一些实施例中,Cas9是指来自W下物种的Cas9:溃瘍棒状杆菌 (Corynebacterium ulcerans)(NCBI参考序列:NC_015683.1、NC_017317.1);白喉棒状杆菌 (Co 巧 nebacterium diphtheria) (NCBI 参考序列:NC_016782.1、NC_016786. 1); Spiroplasma syrphidicola(NCBI参考序列:NC_021284 . I);中间普氏菌(Prevotella intermedia) (NCBI参考序列:NC_017861.1);台湾螺原体(Spiroplasma taiwanense) (NCBI 参考序列:NC_021846.1);海豚链球菌(Streptococcus iniae) (NCBI 参考序列:NC_ 021314.1) ;Belliella baltica(NCBI参考序列:NC_018010.1) ;Psychroflexus torquisi (NCBI参考序列:NC_018721.1);嗜热链球菌(Streptococ州S thermopMlusKNCBI参考序 列:YP_820832.1);无害利斯特菌化isteria innocua) (NCBI参考序列:NP_472073.1);空肠 弯曲杆菌(Campylobacter jejuni) (NCBI参考序列:YP_002344900.1);或脑膜炎奈瑟氏菌 (Neisseria meningitidis)(NCBI参考序列:YP_002:M2100.1)。
[0044] 术语"脱氨酶"是指催化脱氨基反应的酶。在一些实施例中,该脱氨酶是胞巧脱氨 酶,催化胞巧或脱氧胞巧分别水解脱氨基为尿喀晚或脱氧尿喀晚。
[0045] 如本文使用的术语"有效量"是指足够引起期望的生物反应的生物活性剂的量。例 如,在一些实施例中,核酸酶的有效量可W是指足够引起被核酸酶特异性地结合和切割的 祀位点的切割的核酸酶的量。在一些实施例中,本文提供的融合蛋白的有效量,例如包含核 酸酶非活性化s9结构域和核酸编辑结构域(如脱氨酶结构域)的融合蛋白的有效量,可W是 指足够引起被融合蛋白特异性地结合和编辑的祀位点的编辑的融合蛋白的量。如将被熟练 的技术人员理解的,有效量的药剂,例如,融合蛋白、核酸酶、脱氨酶、重组酶、杂合蛋白、蛋 白二聚体、蛋白(或蛋白二聚体)和多核巧酸的复合体、或多核巧酸,可根据各种因素不同, 例如运些因素是,例如,对特定的待编辑的等位基因、基因组或祀位点,对祀向的细胞或组 织,W及对所使用的试剂所期望的生物反应。
[0046] 如本文使用的术语"连接体"是指化学基团或分子,连接两个分子或部分,例如融 合蛋白的两个结构域,如核酸酶非活性化s9结构域和核酸编辑结构域(如脱氨酶结构域)。 在一些实施例中,连接体连接RNA可编程的核酸酶的gRNA结合结构域,包括化s9核酸酶结构 域和核酸编辑蛋白催化结构域。在一些实施例中,连接体连接dCas9和核酸编辑蛋白。典型 地,连接体位于两个基团、分子或其他部分之间或两侧是两个基团、分子或其他部分,并且 通过共价键连接每一个,从而连接两者。在一些实施例中,连接体是一个氨基酸或多个氨基 酸(如肤或蛋白)。在一些实施例中,连接体是有机分子、基团、聚合物或化学部分。在一些实 施例中,连接体是5-100个长度的氨基酸,例如5个、6个、7个、8个、9个、10个、11个、12个、13 个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28 个、29 个、30 个、30-35 个、35-40个、40-45个、45-50个、50-60个、60-70个、70-80个、80-90 个、 90-100个、100-150个、或150-200个长度的氨基酸。还考虑了较长或较短的连接体。
[0047] 如本文使用的术语"突变"是指序列内残基的置换,例如核酸或氨基酸序列与其他 的残基,或序列内一个或多个残基的缺失或插入。典型地本文通过识别原始残基随后是该 残基在序列内的位置并且随后是新替换的残基的身份来描述突变。本文提供的进行氨基酸 置换(突变)的多种方法是本领域熟知的,并且通过,例如,如下文献提供:格林(Green)和萨 姆布鲁克(Sambrook),分子克隆实验指南(Molecular Cloning = A Laboratory Manual)(第 四版,纽约冷泉港冷泉港实验室出版社(Cold Spring化rbor LaboratoiT Press,Cold Spring Harbor,N.Y. )(2012))中。
[0048] 如本文使用的术语"核酸"和"核酸分子"是指包括核碱基和酸性部分(例如核巧、 核巧酸、或核巧酸的聚合物)的化合物。典型地,聚合核酸(例如包括=个或更多个核巧酸的 核酸分子)是线性分子,其中相邻的核巧酸是通过憐酸二醋键彼此连接。在一些实施例中, "核酸"是指单个核酸残基(例如核巧酸和/或核巧)。在一些实施例中,"核酸"是指包含=个 或更多个单独的核巧酸残基的寡核巧酸链。如本文使用的术语"寡核巧酸"和"多核巧酸"可 W互换使用,指核巧酸的聚合物(例如,一串至少=个核巧酸)。在一些实施例中,"核酸"包 含RNAW及单和/或双链DNA。核酸可W是天然地发生的,例如,在基因组、转录物、mRNA、 tRNA、rRNA、S iRNA、snRNA、质粒、粘粒、染色体、染色单体、或其他天然存在的核酸分子的背 景下。另一方面,核酸分子可W是非天然存在的分子,例如,重组DNA或RNA、人工染色体、工 程化的基因组或其片段、或合成的DNA、RNA、DNA/RNA杂合体、或包括非天然存在的核巧酸或 核巧。此外,术语"核酸"、"DNA"、"RNA"和/或类似术语包括核酸类似物,例如,具有除憐酸二 醋骨架外的类似物。核酸可W从天然来源中纯化,使用重组表达系统产生并任选地纯化,化 学合成等。在适当的地方,例如,在化学合成分子的情况下,核酸可包含核巧类似物,例如具 有经化学修饰的碱基或糖和主链修饰的类似物。除非另行说明,核酸序列是W5'至3'方向 存在的。在一些实施例中,核酸是或包括天然的核巧(例如腺巧、胸巧、鸟巧、胞巧、尿巧、脱 氧腺巧、脱氧胸巧、脱氧鸟巧和脱氧胞巧);核巧类似物(例如,2-氨基腺巧、2-硫代胸巧、肌 巧、化咯并喀晚、3-甲基腺巧、5-甲基胞巧、2-氨基腺巧、C5-漠尿巧、C5-氣尿巧、C5-舰尿巧、 C5-丙烘基-尿巧、C5-丙烘基-胞巧,C5-甲基胞巧、2-氨基腺巧、7-脱氮腺巧、7-脱氮鸟巧、8- 氧代腺巧、8-氧代鸟巧、0(6)-甲基鸟嚷岭和2-硫代胞巧);化学修饰的碱基;生物修饰的碱 基(例如,甲基化的碱基);嵌入碱基;改性糖(例如,2 氣代核糖、核糖、2 脱氧核糖、阿拉 伯糖、和己糖);和/或经修饰的憐酸基团(例如,硫代憐酸醋和5'-N-二亚憐酷胺键)。
[0049] 如本文使用的术语"增殖性疾病"是指其中由于细胞或细胞群表现出异常升高的 增殖率使细胞或组织的平衡受到干扰的任何疾病。增殖性疾病包括过度增生性疾病,如肿 瘤前期增生病状和肿瘤性疾病。肿瘤性疾病的特征在于细胞的异常增殖并包括良性和恶性 肿瘤。恶性肿瘤也被称为癌症。
[0050] 术语"蛋白"、"肤"W及"多肤"在此可互换地使用,并且是指被肤(酷胺)键连接在 一起的氨基酸残基的聚合物。该术语是指具有任何大小、结构或功能的蛋白、肤或多肤。典 型地,蛋白、肤或多肤应是至少=个氨基酸长。蛋白、肤或多肤可W是指单个蛋白或蛋白的 聚集体。蛋白、肤或多肤中的一个或多个氨基酸可W被修饰,例如,通过化学实体(如碳水化 合物基团、径基、憐酸盐基团、法呢基、异法呢基、脂肪酸基团、用于共辆、功能化或其他修饰 的连接物,等等)的加成。蛋白、肤或多肤也可W是单个分子或可W是多分子复合体。蛋白、 肤或多肤可W是天然存在的蛋白或肤的片段。蛋白、肤或多肤可W是天然存在的、重组的、 或合成的或运些的任意组合。本文使用的术语"融合蛋白"是指包括来自至少两个不同蛋白 的蛋白结构域的杂合多肤。一个蛋白可W位于融合蛋白的氨基末端(N末端)部分或位于簇 基末端(C末端)部分,从而分别形成"氨基末端融合蛋白"或"簇基末端融合蛋白"。蛋白可W 包括不同的结构域,例如,核酸结合结构域(如指导蛋白连接到祀位点的Cas9的gRNA结合结 构域)和核酸切割结构域或核酸编辑蛋白的催化结构域。在一些实施例中,蛋白包括蛋白的 部分(例如氨基酸序列构成核酸结合结构域)和有机的化合物(例如可W用作核酸切割剂的 化合物)。在一些实施例中,蛋白与核酸如RNA处于复合体形式,或与核酸如RNA相联合。本文 提供的任何蛋白可W通过本领域已知的任何方法产生。例如,本文提供的蛋白可W通过重 组蛋白表达和纯化产生,其尤其适合包含肤连接体的融合蛋白。重组蛋白表达和纯化的方 法是熟知的,并且包括被描述在如下文献中的那些:格林(Green)和萨姆布鲁克 (Sambrook),分子克隆实验指南(Molecular Cloning = A LaboratoiT ManualK第四版,纽 约冷泉港冷泉港实验室出版社(Cold Spring化rbor LaboratoiT Press,Cold Spring 化rbor,N.Y. )(2012),将该文献的全部内容通过引用方式结合在此。
[0051 ]术语"RNA可编程的核酸酶"和"RNA指导的核酸酶"在此可互换地使用,并且是指与 不是切割祀标的一种或多种RNA形成(例如结合或联合)复合体的核酸酶。在一些实施例中, RNA可编程的核酸酶当与RNA形成复合体时,可W被称为核酸酶:RNA复合体。典型地,一个或 多个结合的RNA被称为指导RNA(排NA)。排NA可W作为两个或更多RNA的复合体或作为单个 RNA分子存在。作为单个RNA分子存在的gRNA可W被称为单指导RNA(SgRNA),但是"gRNA"是 可互换地使用的,是指指导作为单个分子或作为两个或更多分子的复合体存在的RNA。典型 地,作为单RNA种类存在的gRNA包括两个结构域:(1)与祀核酸享有同源性的结构域(例如W 及指导Cas9复合体结合至祀标);和(2)结合Cas9蛋白的结构域。在一些实施例中,结构域 (2)对应于被称为化acrRNA的序列,并包括茎环结构。例如,在一些实施例中,结构域(2)与 tracrRNA是同源的,如描述在文献季憂克(Jinek)等人,科学(Science)337:816-821(2012) 的图化中,该文献的全部内容通过引用结合在此。排NA的其他实例(例如包括结构域2的那 些)可W发现于提交于2013年9月6日的美国临时专利申请U.S.S.N. 61/874,682,其标题为 "可切换的化39核酸酶及其用途(Switchable (^is9Nucleases And Uses l'hereof)",W及 提交于2013年9月6日的美国临时专利申请U.S.S.N.61/874,746,其标题为"用于功能性核 酸酶的递送系统(Delivery System F'or Functional Nucleases)",运些文献的每一个的 全部内容通过引用W其整体结合在此。在一些实施例中,gRNA包括两个或更多结构域(1)和 (2),并可W被称为"延伸的gRNA"。例如,如本文所描述的,延伸的gRNA将,例如,结合两个或 更多个化s9蛋白并且在两个或更多个不同区域结合祀核酸。gRNA包含与祀位点互补的核巧 酸序列,该核巧酸序列调节核酸酶/RNA复合体结合至所述祀位点,提供核酸酶:RNA复合体 的序列特异性。在一些实施例中,RNA可编程的核酸酶是(CRisra相关系统)Cas9内切核酸 酶,例如来自酿脈链球菌(Streptococcus pyogenes)的Cas9(Csnl)(参见,例如,"酿脈链球 菌的Ml株的全基因组序列(Complete genome sequence of an Mlstrain of Streptococ 州 S pyogenes)",法拉帝化erretti J.J.)、马克山 W.M. (Median W.M.)、 阿杰迪克D.J.(Ajdic D.J.)、萨维奇? D.J.(Savic D.J.)、萨维奇? G.(Savic G.)、里昂? K.化yon K.)、普里莫斯〔(Primeaux C)、索扎特S(Sezate S.)、苏沃洛夫.AiNi(SuvorC)V A.N.)、肯顿?S.化entonS.)、赖?H.S.化aiH.S.)、林?S.P.化inS.P.)、钱?Y.(Qian Y.)、贾? H.G. (Jia H.G.)、纳加尔? F.Z.(化jar F.Z.)、任? Q. (Ren Q.)、朱? H. (Zhu H.)、宋?L.(SongL.)、怀特?J.(怖iteJ.)、袁?X.(化anX.)、克利夫顿?S.W.(Clifton 5.胖.)、罗伊-8.4.(3〇6 8.4.)、麦克劳克林-1?.6.(1江曰11曲11111?.6.),美国国家科学院院 刊(Proc.化11. Acad. Sci . U. S. A.)98:4658-4663(2001)通过反式编码的小RNA和宿主因 子RNA酶III进行的CRISPR RNA成熟(CRISPR RNA maturation by 化ans-encoded small RNA and host factor R化Se III)",德特车维E.(Deltcheva E.)、吉林斯基《K. (化ylinski K.)、夏尔马.C.M.(Sharma C.M.)、冈萨雷斯《K.(Gonzales K.)、超《Y. (化ao Y.)、皮尔扎达? Z.A.(Pirzada Z.A.)、埃克特 *M.R.化ckert M.R.)、沃格尔? J. (Vogel J.)、卡彭特? E.(Cha巧entier E.),自然(化Uire)471:602-607(2011); W及"适应 性细菌免疫中可编程的双RNA指导的DNA内源核酸酶(A pr0grammab I e duaI -RNA-gu i ded DNA endonuclease in adaptive bacterial immunity)",季憂克? M. (Jinek M.)、吉林其if 基? K.(化ylinski K.)、方法拉? I. (F'onfara I.)、豪尔? M.(化uer M.)、杜德纳? J.A. (Doudna J.A.)、卡彭特? E.(化arpentier E.),科学(Science)337:816-821(2012),将其 每一个的全部内容通过引用结合在此。
[0052] 因为RNA可编程的核酸酶(如Cas9)使用RNA: DNA杂合来祀向DNA切割位点,原则上 运些蛋白可W祀向由指导RNA指定的任何序列。使用RNA可编程的核酸酶(例如化s9)用于位 点特异的切割(例如用于修饰基因组)的方法是本领域已知的(参见,例如,丛? L. (Cong, L.)等人,使用CRISPR/CAS系统的多元基因组工程(Multiplex genome engineering using CRISPR/Cas systems),科学(Science)339,819-823(2013);玛丽? P. (Mali, P.)等人,通过 Cas9进行RNA指导的人类基因组工程(RNA-guided human genome engineering via Cas9),科学(Science)339,823-826(2013);黄? W.Y. (Hwang,W.Y.)等人,在斑马鱼中使用 CRISPR-Cas系统进行的有效基因组编辑化fficient genome editing in zebrafish using a CRISPR-Cas system),自然生物技术(化Uire Biotech)31,227-229(2013);季憂 克*M.(Jinek M.)等人,人类细胞中的RNA编程的基因组编辑(RNA-programmed genome editing in human cells),eLife 2,e00471(2013);迪卡洛.J-E-(Dicarlo)J-E.)等人, 利用CRISPR-Cas系统在酿酒酵母中进行基因组编辑(Genome engineering in Saccharomyces cerevisiae using CRISPR-Cas systems),核酉《石开究(Nucleic acids research) (2013);蒋? W.( Jiang,W.)等人,利用CRISPR-Cas系统进行的细菌基因组的RNA 指导的编辑(RNA-guided editing of bacterial genomes using CRISPR-hs systems), 自然生物技术(化化re biotechnology)31:233-239(2013),将运些文献每一个的全部内容 通过引用结合在此)。
[0053] 如本文使用的术语"受试者"是指单个生物有机体,例如,单个哺乳动物。在一些实 施例中,该受试者是人类。在一些实施例中,该受试者是非人类哺乳动物。在一些实施例中, 该受试者是非人类灵长类动物。在一些实施例中,该受试者是晒齿类动物。在一些实施例 中,该受试者是绵羊、山羊、牛、猫、或狗。在一些实施例中,该受试者是脊椎动物、两栖动物、 爬行动物、鱼类、昆虫、苍蛹或线虫。在一些实施例中,该受试者是研究动物。在一些实施例 中,该受试者是基因工程化的,例如,基因工程化的非人类受试者。该受试者可W是雄性的 或雌性的并且可W处于任何发育阶段。
[0054] 术语"祀位点"是指核酸分子内的序列,该序列被脱氨酶或包含脱氨酶的融合蛋白 (例如,本文提供的d化s9脱氨酶融合蛋白)脱去氨基。
[0055] 如本文所述,术语"治疗(treatment、treat和heating)"是指旨在逆转、缓解、延 迟疾病或失调或其一种或多种症状的发作,或抑制疾病或失调或其一种或多种症状的进展 的临床干预。如本文所述,本文使用的术语"治疗(treatment、treat和treat ing)"是指旨在 逆转、缓解、延迟疾病或失调或其一种或多种症状的发作,或抑制疾病或失调或其一种或多 种症状的进展的临床干预。在一些实施例中,治疗可W在已经发展出一种或多种症状和/或 已经诊断出疾病后给予。在其他实施例中,可W在没有症状时给予治疗,例如,W防止或延 迟症状的发作或抑制疾病的发作或进展。例如,先于症状的发作(例如,根据症状历史和/或 根据遗传或其他易感因素)向易感个体给予治疗。症状已经解决后也可W继续治疗,例如, W防止或延迟它们复发。
[0056] 本发明的某些实施例的详细说明
[0057] 本披露的一些方面提供包含结合至指导RNA(也被称为排NA或SgRNA)的化s9结构 域的融合蛋白,该指导RNA反过来通过链杂合结合祀核酸序列;W及可W使核碱基(例如胞 巧)脱去氨基的DNA编辑结构域(例如脱氨酶结构域)。通过脱氨酶使核碱基脱去氨基可W在 各自的残基上导致点突变,其在此被称为核酸编辑。因此包含化s9变体或结构域和DNA编辑 结构域的融合蛋白可W被用于核酸序列的祀向编辑。运样的融合蛋白对于例如,用于突变 的细胞或动物的产生的DNA的体外祀向编辑;对于例如,细胞(如随后被重新引入相同或另 一个受试者的、从受试者获得的细胞)中体外修正遗传缺陷的祀向突变的引入;W及对于例 如,在受试者疾病相关基因中修正遗传缺陷或引入失活突变的祀向突变的引入是有用的。 典型地,本文描述的融合蛋白的Cas9结构域不具有任何核酸酶活性但是它是Cas9片段或 狀as9蛋白或结构域。还提供了如本文描述的化s9融合蛋白的使用的方法。
[005引在此提供了非限制性的、示例性的核酸酶非活性化s9结构域。一个示例性的、适合 的核酸酶非活性化s9结构域是DlOA/册40A化s9结构域突变体:
[0059] MD邸YSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGOTD畑SI邸MJGALL抑SGETAEATRLKRTAR RRYTRRKNRICTL犯IFSNEMAKVDDSFFHRLEESFLVEEDKK肥RHPIFG…VDEVAYHEKYPHYHLRKKLVDST DKADL化IYLALAHMIKFRGH化IEGDLNPDNSDVDKLFI化VQTYNQLF邸NPINASGVDAKAILSARLSKSRRLE NLIAQLPGE 邸NGLFGNLIAL 化化 TPNFKSN 抑 LA抓 AKL 化 S邸 TYD 孤 LDNliAQIGDQYADlJ^LAAKNLSDAI 化SDILRVNTEITKAPLSASM化RYDEH册Dliilkalvrqq…EKYKEIF抑QSKNGYAGYIDGGASQ邸FYKFIK PILEKMDGT 邸 LLVKLNR 邸化服 QRT 抑 NGSIP 册 IHLGELHAILRRQEDFYP 化邸 NREKIEKILTFRIPYYVGP LARGNSRFAWMT 服沈 EUTPWNFEEVVDKGASAQS 門 ERMTNFDKNLPNEK^HfflSLLYEYFTVYWLTKVKYVT EGM 服 PA 化 SGEQKKAIVDLLFKTN 服 VTVKQLKEDYFKKIEC 抑 SVEISGV 邸 RFNASLGTYHDLLKII 邸邸 FLD 肥E肥DILEDI化IlTLF邸REMIE邸LKTYAHL抑DKVMK化KRRRYTGWGRLS服LINGI畑KOSGKTILD化KS DGFANRNFMQLI 皿 DSLTFK 邸 IQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVV 呢 LVKVMGR 服阳 NIVIE MARENQTTQKGQKNSRERMKRI邸GI邸LGSQILKEHPVENT化Q肥KLYLYYLQNG畑MYVD犯LDINRLSDYDVD AIVPQS 化邸 DSIDNKVLTRSDKNRGKSDNVP 沈 EVVKKMKNYWR 化 LNAKUTQ 服抑化 TKAERG 化沈 U)KAGF IKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVV GTALI 邸 YPKLE 沈 FVYGDYKVYDV 服 MIAK 沈犯 IGKATAKYFFYSNIMNFFKTEITLANGEI 服 RPLIETNGETG EIVWDKG 畑 FATV 服 VLSMPQVNIVKKTEVQTGGFSKESIL 化 RNSDKLIA 服邸 WDPKKYGG 抑 SPTVAYSVLVVA KVEKGKS 邸 LKSVKELLGmMERSS 巧 KNPID 化 EAKGYKE VK邸U 化。KYSLFELENG 服 RMLASAGELQKGN ELALPSKYVN 化 YLASHYEKLKGSP 邸肥 QKQLFVEQ 服 H 化肥 IIEQIS 邸 SKRVILADANLDKVLSAYNKffi^DKP ireqaeniihlftl?lgapaafkyfdttidrkrytstkevldatlihqsitglyetridlsqlggd(seq ID N0:37;参见,例如,齐(Qi)等人,将CRISPR再利用为RNA指导的平台W用于基因表达的序列 特异性控制(Repu巧osing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene E邱ression)细胞(Cell) ,2013; 152(5) :1173-83,将其全部内容通过引 用结合在此)。
[0060] 基于本披露,另外的适合的核酸酶非活性化s9结构域对本领域的普通技术人员而 言将是显而易见的。此类另外示例的适合的核酸酶非活性化s9结构域包括但不限于D10A、 D10A/D839A/H840A、和D10A/D839A/服40A/N863A突变的结构域(参见,例如,普拉桑特 (Prashant)等人,用于祀标特异性筛选的CAS9转录激活因子与用于合作基因组工程化的配 对切日酉每(CAS9transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering),自然生物技术(Nature Biotechnology),2013; 31 (9): 833-838,将其全部内容通过引用结合在此)。
[0061] 化s9和核酸编辑酶或结构域之间的融合蛋白
[0062] 本披露的一些方面提供包括W下项的融合蛋白:(i)核酸酶非活性的Cas9酶或结 构域;和Qi)核酸编辑酶或结构域。在一些实施例中,核酸编辑酶或结构域是DNA编辑酶或 结构域。在一些实施例中,核酸编辑酶拥有脱氨酶活性。在一些实施例中,核酸编辑酶或结 构域包含或是脱氨酶结构域。在一些实施例中,脱氨酶是胞巧脱氨酶。在一些实施例中,脱 氨酶是载脂蛋白B mRNA编辑复合体(APOBEC)家族脱氨酶。在一些实施例中,脱氨酶是 AP0BEC1家族脱氨酶。在一些实施例中,脱氨酶是激活诱导的胞巧脱氨酶(AID)。在一些实施 例中,脱氨酶是ACF1/ASE脱氨酶。在一些实施例中,脱氨酶是腺巧脱氨酶。在一些实施例中, 脱氨酶是ADAT家族脱氨酶。本文详细描述了一些核酸编辑酶和结构域W及包括运样的酶或 结构域的Cas9融合蛋白。基于本披露,另外的适合的核酸编辑酶或结构域对本领域的普通 技术人员而言将是显而易见的。
[0063] 本披露提供不同构造的化s9:核酸编辑酶/结构域融合蛋白在一些实施例中,核酸 编辑酶或结构域被融合至化s9结构域的N末端。在一些实施例中,核酸编辑酶或结构域被融 合至化s9结构域的C末端。在一些实施例中,化s9结构域与核酸编辑酶或结构域是通过连接 体融合的。在一些实施例中,该连接体包含(GGGGS)n(SEQ ID ^):91)、(6)。、化4441〇。(569 ID N0:5)、(GGS)n、SGSETPGTSESATPES(SEQ ID N0:93)基序(参见,例如,古灵儿JP (Guilinger 肝)、汤普森.DlKThompson DB)、刘.DRlXiu DR),融合无催化活性的Cas9至 !^kI核酸酶改善基因组修饰的特异性化usion of catal}ftically inactive &s9to !^kI nuclease improves the specificity of genome modification),自然生物技术 (化t.Biotechnol. )2014:32(6) :577-82;将其全部内容通过引用结合在此),或(XP)n基序, 或运些的任意组合,其中n独立地是1至30之间的整数。在一些实施例中,n独立地是1、2、3、 4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、或30, 或如果存在多于一个连接体或多于一个连接体基序,n是其任意组合。另外的适合的连接体 基序和连接体构造对本领域的普通技术人员而言将是显而易见的。在一些实施例中,适合 的连接体基序和构造包括描述在W下文献中的那些,陈(Chen)等人,融合蛋白连接体:特 性、设计和功會K(Fusion protein linkers:property,desi邑n and functionality),先进 药物输送评论(Adv Drug Deliv Rev)2013;65(10) :1357-69,将其全部内容通过引用结合 在此)。基于本披露,另外的适合的连接体序列对本领域的普通技术人员而言将是显而易见 的。
[0064] 在一些实施例中,本文提供的示例性的化s9融合蛋白的总体架构包括W下结构:
[0065] [N出]-[核酸编辑酶或结构域]-[Cas9]-[C00H]或
[0066] [畑2]-[Cas9]-[核酸编辑酶或结构域]-[COOH],
[0067] 其中N出是融合蛋白的N末端,并且COOH是融合蛋白的C末端。
[0068] 可能存在另外的特征,例如,NLS与融合蛋白的剩下部分之间和/或核酸编辑酶或 结构域与Cas9之间的一个或多个连接体序列。可能存在的其他的示例性的特征是定位序 列,例如细胞核定位序列、细胞质定位序列、输出序列(例如细胞核输出序列)、或其他定位 序列、W及对于融合蛋白的溶解、纯化或检测有用的序列标签。本文提供了适合的定位信号 序列和蛋白标签序列,运些序列包括但不限于生物素簇化酶载体蛋白(BCCP)标签、myc标 签、巧调素标签、FLAG标签、血凝素化A)标签、多组氨酸标签(也被称为组氨酸标签或化S标 签)、麦芽糖结合蛋白(MBP)标签、nus标签、谷脫甘肤-S-转移酶(GST)标签、绿色巧光蛋白 (GFP)标签、硫氧还蛋白标签、S-标签、Softag (例如,Softag 1、Softag 3 )、Str邱-标签、生 物素连接酶标签、FlAsH标签、V5标签、和SBP标签。另外的适合的序列对本领域的普通技术 人员而旨将是显而易见的。
[0069] 在一些实施例中,核酸编辑酶或结构域是脱氨酶。例如,在一些实施例中,具有脱 氨酶的酶或结构域的示例性的Cas9融合蛋白的总体架构包括W下结构:
[0070] [畑2]-阳LS]-[Cas9]-[脱氨酶]-[COOH]、
[0071 ][畑2]-阳LS]-[脱氨酶]-[Cas9]-[C00H]、
[0072] [畑2]-[Cas9]-[脱氨酶]-[COOH]、或
[0073] [畑2]-[脱氨酶]-[Cas9]-[C00H]
[0074] 其中化S是细胞核定位信号,N此是融合蛋白的N末端,并且COOH是融合蛋白的C末 端。在一些实施例中,连接体被插在Cas9和脱氨酶之间。在一些实施例中,NLS位于脱氨酶 和/或化s9结构域的C末端。在一些实施例中,化S位于脱氨酶和化s9结构域之间。也可能存 在另外的特征,例如序列标签。
[0075] 核酸编辑酶和结构域的一个示例性的适合的类型是胞巧脱氨酶,例如Aro肥C家族 的。胞巧脱氨酶的载脂蛋白B mRNA编辑复合体(APOBEC)家族包含用于W受控和有益的方式 启动突变形成的11个蛋白。29-个家族成员(激活诱导的胞巧脱氨酶(AID))负责W转录依赖 的链偏好的方式通过将SSDNA中的胞喀晚转换成尿喀晚使得抗体成熟。W载脂蛋白B编辑复 合体3(AP0BEC3)酶通过对在反转录病毒ssDNA中的胞喀晚的脱氨基作用为人类细胞提供针 对某些HIV-I菌株的保护。Si运些蛋白都要求化2+调苄基序化is-X-Glu-X23-26-Pr〇-切S-X2-4- 切S)和用于催化活性的结合水分子。在脱氨基反应中,Glu残基用作激活水分子成氨氧化锋 用于亲核进攻。每一个家庭成员优选在自己特定的"热点"脱去氨基,该热点的范围从hAID 的WRC(W是A或T,R是A或G)至hAPO邸C3F的TTC。32最近,APO邸C3G的催化结构域的晶体结构 (图2)显示,二级结构由两侧为六个a螺旋的五链0片层构成,运被认为在整个家族中是保守 的。33已经显示活性中屯、环负责SSDNA结合和确定"热点"身份两者。34运些酶的过量表达与 基因组的不稳定和癌症相关,从而突出序列特异性祀向的重要性。35
[0076] 核酸编辑酶和结构域的另一个示例性的适合的类型是腺巧脱氨酶。例如,ADAT家 族腺巧脱氨酶可W融合至Cas9结构域,例如核酸酶非活性的Cas9结构域,从而产生Cas9- ADAT融合蛋白。
[0077] 本披露的一些方面提供在化s9和脱氨酶之间的融合的系统系列,脱氨酶例如是胞 喀晚脱氨酶(如APOBEC酶)或腺巧脱氨酶(如ADAT酶),该系统系列已经被产生,从而将运些 脱氨酶的酶活性引导至基因组DNA的特定位点。使用Cas9作为识别剂的优点有两重:(1) 化s9的序列特异性可W轻易地通过简单地改变S排NA序列来改变;W及(2)Cas9通过退火 dsDNA结合至它的祀序列,产生一系列单链的DNA和因而用于脱氨酶的可行的底物。已经产 生出具有人类和小鼠脱氨酶结构域如AID结构域的成功的融合蛋白。还考虑了人类和小鼠 AID的催化结构域和Cas9之间的各种其他融合蛋白。应当了解,其他催化结构域或来自其他 脱氨酶的催化结构域也可W用于产生具有化s9的融合蛋白,并且本披露不限于运个方面。
[0078] 在一些实施例中,提供了Cas9和AID的融合蛋白。在设计Cas9融合蛋白W增加 ssDNA中突变率的尝试中,小鼠和人类AID都被拴在丝状隧菌体基因V(非特异性ssDNA结合 蛋白)上。在基于细胞的试验中,相比野生型酶,产生的融合蛋白显示出增强的诱变活性。运 个工作证明,使用融合蛋白,运些蛋白的酶活性被保持在遗传序列中并可W成功地祀向遗 传序列。36
[0079] 然而,已经报道了化s9(和甚至与它的SgRNA和祀DNA-起在复合体中的化s9)的若 干晶体结构,(参见,例如,季憂克-M(Jinek M)、蒋-FQiang F)、泰勒-DW(Taylor DW)、 斯腾伯格?甜(Ste;rnbe;rg 甜)、卡亚? E化aya E)、马? E(Ma E)、安德斯? C(Anders C)、豪 尔? M化auer M)、周? K(Zk)U K)、林? S化in S)、卡普兰? M化apian M)、亚瓦罗内? AT (Iavarone AT)、卡彭特.E(畑a;rpentier E)、诺加利斯 *E(Nogales E)、杜德纳.JA (Doudna JA),Cas9内切核酸酶的结构掲示RNA介导的构象活性(Structures of Cas9endonucleases reveal RNA-mediated conformational activation),科学 (Science) ,2014;:343(6176) :1247997,PMID:24505130; W及并H(化sMmasu H)、冉? FA (Ran FA)、许《FD(Hsu PD)、科纳曼 S 化 onermann S)、施哈塔.SI (化 ehata SI)、道来 N (Dohmae)N、石谷信一 .R(IsM化ni R)、张《F(Zhang F)、濡木0(Nureki 0),与引导RNA和 IEDNA一起在复合体中的化39的晶体结构(Crys1:al st;ruc1:ure of Cas9in C omplex with guide RNA and target DNA),细胞(Cell).2014; 156(5) :935-49, PMID:24529477,将其每 一个的全部内容通过引用结合在此),在化S9-DNA复合体中的是单链的DNA的部分是未知的 (Cas9-DNA泡的大小)。然而,已经显示在具有为复合体特异地设计来干扰转录的S排NA的 此as9系统中,转录干扰仅仅发生在SgRNA结合至非模板链时。运个结果表明在DNA-Cas9复 合体中的DNA的特定部分没有被化s9防备,并且可W潜在地被融合蛋白中的脱氨酶祀向(参 见齐? LS(Qi LS)、拉尔森? MH化arson MH)、吉尔伯特? LA(GHbed LA)、杜德纳? JA (Doudna JA)、韦斯曼? JS(Weissman JS)、阿尔金.APUrkin AP)、林.WA化im WA),将 CRISPR再利用为RNA指导的平台W用于基因表达的序列特异性控制(Repu巧OSing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression)细 胞(Cell). 2013; 152(5) :1173-83,PMID: 23452860,将其全部内容W引用方式结合在此。进 一步支持运个概念,使用外切核酸酶III和核酸酶Pl(其仅仅在ssDNA作为底物时起作用)的 足迹法试验掲示在非模板链上至少26个碱基易被运些酶消化(参见季憂克-M(Jinek M)、 蒋? F(Jiang F)、泰勒? DW(Taylor DW)、斯腾伯格?細(Sternberg 細)、卡亚? E化aya E)、马? E(Ma E)、安德斯? C(Anders C)、豪尔? M化auer M)、周? K(Zhou K)、林? S化in S)、卡普兰化apian M)、亚瓦罗内.ATdavarone AT)、卡彭特.EKharpentier E)、诺 加利斯? E(Nogales E)、杜德纳? JA(Doudna JA),Cas9内切核酸酶的结构掲示RNA介导的 构象活性(Structures of C曰s9endonucle曰ses reveal RNA-medi曰ted conformational activation),科学(Science) ,2014;343(6176) :1247997,PMID: 24505130)。还已经报道,在 某些情况下,Cas9在运个易受影响的DNA段上W高达15%的频率诱导单碱基置换突变(参见 蔡? SQ(Tsai SQ)、Wyvekens N、Kha}fte;r C、福登布? JA(Foden JA)、塔帕尔? Wl^apar V)、拉永? D(Reyon D)、古德溫? MJ(Goodwin MJ)、阿里耶? MJUryee MJ)、姜戈JKQoung JK),二聚CRISPR RNA指导的化kl核酸酶,用于高度特异性的基因组编辑(Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing),自然生物技术 (化 t. Biotechnol.). 2014; 32(6) :569-76, PMID :24770325,将其全部内容 W 引用方式结合 在此。虽然引入运些突变的机制是未知的,在所有的情况下,突变的碱基是胞喀晚,运可能 指示胞喀晚脱氨酶的参与。总之,运些数据显然与单链的且易受其他酶影响的祀DNA的一部 分一致。已经显示在具有为复合体特异地设计来干扰转录的S排NA的dCas9系统中,转录干 扰仅仅发生在SgRNA结合至非模板链时。运个结果表明在DNA-化s9复合体中的DNA的特定部 分没有被化s9防备,并且可W潜在地被融合蛋白中的AID祀向。IS相应地,根据本披露的多个 方面,Cas9的N末端和C末端与脱氨酶结构域的融合是有用的。
[0080] 在一些实施例中,脱氨酶结构域和Cas9结构域是通过连接体彼此融合的。可W应 用脱氨酶结构域(如AID)和化s9结构域之间的各种连接体长度和灵活性(例如,范围从非常 灵活的连接体形式(GGGGS)n(SEQ ID N0:91)、(GGS)n、和(G)n至更严格的连接体形式 化AAAK)n(SEQ ID N0:5)、SGSETPGTSESATPES(SEQ ID N0:93)(参见,例如,古灵儿JP (Guilinger 肝)、汤普森.DlKThompson DB)、刘.DRlXiu DR),融合无催化活性的Cas9至 !^kI核酸酶改善基因组修饰的特异性化usion of catal}ftically inactive &s9to !^kI nuclease improves the specificity of genome modification),自然生物技术 (Nat.Biotechnol.). 2014:32(6) :577-82;将其全部内容通过引用结合在此)和(XP)n)37, W 便于达到用于特定应用的脱氨酶活性的最佳长度。
[0081] 根据本披露的方面,可W融合至化s9结构域的一些示例性的适合的核酸编辑酶和 结构域(例如脱氨酶和脱氨酶结构域)提供在下文。应当了解,在一些实施例中,可W利用各 自序列的活性结构域,例如,没有定位信号的结构域(细胞核定位信号、没有细胞核的输出 信号、细胞质定位信号)。
[0082] 人类 AID:
[0090] (下划线:细胞核定位信号;双下划线:细胞核输出信号)[0091] 牛AID:
[0083;
[0084;
[0085;
[0086;
[0087;
[0088;
[0089;
[0147]
[0148] 在一些实施例中,如本文提供的融合蛋白包括核酸编辑酶的全长氨基酸,例如W 上提供的序列中的一个。然而,在其他实施例中,如本文提供的融合蛋白不包括核酸编辑酶 的全长序列,仅仅是其片段。例如,在一些实施例中,如本文提供的融合蛋白包括化s9结构 域和核酸编辑酶的片段,例如,其中片段包括核酸编辑结构域。核酸编辑结构域的示例性的 氨基酸序列在W上序列中示为斜体字母,并且此类结构域的另外的适合的序列对本领域的 普通技术人员而言将是显而易见的。
[0149] 基于本披露,另外的适合的核酸编辑酶序列,例如,可W根据本发明的诸多方面来 使用的脱氨酶和结构域序列(例如可W融合至核酸酶非活性化s9结构域)对本领域的普通 技术人员而言将是显而易见的。在一些实施例中,运样的另外的酶序列包括脱氨酶或脱氨 酶结构域序列,运些序列与本文提供的序列具有至少70 %、至少75 %、至少80%、至少85 %、 至少90%、至少95%、至少96%、至少97%、至少98%或至少99%的序列相似性。另外的适合 的化s9结构域、变体、和序列对本领域的普通技术人员而言将是显而易见的。此类另外的适 合的Cas9结构域的实例包括但不限于D10A、D10A/D839A/H840A、和D10A/D839A/服40A/ N863A突变的结构域(参见,例如,普拉桑特(Prashant)等人,用于祀标特异性筛选的CAS9转 录激活因子与用于合作基因组工程化的配对切口酶(CASgtranscriptional activators for target specificity screening and paired nickases for cooperative genome engineering),自然生物技术(化 1:ure Biotechnology),2013;31(9) :833-838,将其全部内 容通过引用结合在此。
[0150] 基于本披露,结合本领域的一般知识,产生包括化s9结构域和脱氨酶结构域的融 合蛋白的另外的适合的策略对本领域的普通技术人员而言将是显而易见的。基于本披露和 本领域的知识,使用连接体和不使用连接体根据本披露的诸多方面产生融合蛋白的适合的 策略对本领域的普通技术人员而言将是显而易见的。例如,吉尔伯特(GHbed)等人,真核 生物中CRISPR介导的模块化的RNA指导的转录调节(CRISPR-mediated modular RNA- guided regulation of transcription in euk曰ryotes),细胞(Cell). 2013; 154(2):442- 51,显示使用2NLS's作为连接体(SPK邸服VEAS,SEQ ID側:29)的化39与¥?64的(:末端融合, 可W应用于转录激活。玛丽(Mali)等人,用于祀标特异性筛选的CAS9转录激活因子与用于 合作基因组工程化的配对切口酶(CASgtranscriptional activators for target specificity screening and paired nickases for cooperative genome engineering),自然生物技术(化t.Biotechnol.).2013:31 (9) :833-8,报道不使用连接体 的与VP64的C末端融合可W应用于转录激活。并且梅德(Maeder)等人,CRISPR RNA指导的内 源人类基因的激活(CRISPR RNA-guided activation of endogenous human genes),自然 方法(Nat .Methods),2013; 10:977-979,报道使用Gly4Ser(SEQ ID NO: 91)连接体的与VP64 的C末端融合可W用作转录激活因子。最近,此as9-FokI核酸酶融合已经成功地产生出并且 相比亲本Cas9酶展现了改进的酶特异性(参见古灵儿JP(Guilinge;r JP)、汤普森? DB (Thompson DB)、刘? DR化iu DR),融合无催化活性的化s9至化kl核酸酶改善基因组修饰的 特异性(Fusion of catalytically inactive Cas9to FokI nuclease improves the specificity of genome modification),自然生物技术(化t.Biotechnol.).2014;32(6): 577-82,W及参见蔡?SQ(TsaiSQ)、WyvekensN、趾aパerC、福登布?JA(FodenJA)、塔帕 尔.V(Thapar V)、拉永 *D(Reyon D)、古德溫 *MJ(Goodwin MJ)、阿里耶 *MJ(Aryee MJ)、 姜戈化(Joung JK),二聚CRISPR RNA指导的FokI核酸酶,用于高度特异性的基因组编辑 (Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing),自然生物技术(Nat. Biotechnol. ) .2014:32(6) :569-76, PMID :24770325, SG沈TPGTSESATPES(SEQ ID N0:93)或GGGGS(SEQ ID N0:91)连接体分别被用于化kI-dCas9 融合蛋白)。
[0151] 使用化S9DNA编辑融合蛋白来修正疾病相关突变
[0152] 一些实施例提供了用于使用本文提供的化S9DNA编辑融合蛋白的方法。在一些实 施例中,通过脱去祀核碱基(例如C残基)的氨基使用融合蛋白来在核酸中引入点突变。在一 些实施例中,祀核碱基的脱氨基作用导致遗传缺陷的修正,例如导致在基因产物中引起功 能丧失的点突变的修正。在一些实施例中,该遗传缺陷与疾病或失调关联,疾病或失调例如 是溶酶体胆失调或代谢性疾病,如I型糖尿病。在一些实施例中,使用本文提供的方法来在 编码与疾病或失调相关的基因产物的基因或等位基因中引入失活的点突变。例如,在一些 实施例中,本文提供的方法应用化S9DNA编辑融合蛋白在致癌基因中引入失活的点突变(例 如在增殖性疾病的治疗中)。在一些实施例中,失活的突变可W在编码序列中产生未成熟的 终止密码子,其导致截短的基因产物的表达,例如,缺乏全长蛋白的功能的截短的蛋白。
[0153] 在一些实施例中,本文提供的方法的目的是通过基因组编辑恢复机能失调基因的 功能。本文提供的化s9脱氨酶融合蛋白可W在基于基因编辑的人类体外治疗中生效,例如, 通过在人类细胞培养物中修正疾病相关突变。本领域的技术人员应当了解,本文提供的融 合蛋白,例如包含Cas9结构域和核酸脱氨酶结构域的融合蛋白,可W用于修正任何单点(T- 乂或A-〉G)突变。在第一种情况中,突变的C经脱氨基作用回到U修正了突变,并且在第二种 情况中,与突变的G碱基配对的C经脱氨基作用,紧接着经一轮复制,修正了突变。
[0154] 可W通过提供的融合蛋白在体外或体内修正的示例性的疾病相关的突变是在 PI3KCA蛋白中的化047R(A3140G)多态性。憐酸肌醇-3-激酶(催化的a亚基(PI3KCA)蛋白)的 作用是憐酸化憐脂酷肌醇的肌醇环的3-OH基团。已经发现PI3KCA基因在许多不同的癌中突 变,并且因此它被认为是强有力的致癌基因。W实际上,A3140G突变存在于若干NCI-60癌症 细胞系,例如HCTl 16、SK0V3、和T47D细胞系,运些细胞系可W容易地从美国典型培养物保藏 中屯、(ATCC)获得。51
[0155] 在一些实施例中,携带待修正的突变的细胞,例如,携带点突变(例如,导致在 PI3KCA蛋白中的化047R置换的在PI3KCA基因外显子20中的A3140G点突变)的细胞,与编码 Cas9脱氨酶融合蛋白的表达构建体和将融合蛋白祀向在编码PI3KCA基因中的各个突变位 点的适当设计的SgRNA接触。在设计SgRNA来将融合酶祀向在PI3KCA基因中的非C残基的情 况下可W进行控制实验。在人类细胞培养物中可W提取所处理的细胞的基因组DNA,并且对 PI3KCA基因的相关序列进行PCR扩增和测序来评估融合蛋白的活性。
[0156] 应当了解,提供的修正PI3KCA中的点突变的实例是出于说明的目的,并不意味着 限制本披露。本领域的技术人员将了解本披露的DNA编辑融合蛋白可W用来修正其他的点 突变W及与其他癌症和与除癌症W外的疾病(包括其他增殖性疾病)相关的突变。
[0157] 成功的修正疾病相关基因和等位基因中的点突变开启了治疗学和基础研究中使 用应用进行基因修正的新策略。位点特异性的单碱基修饰系统,如披露的Cas9和脱氨酶或 脱氨酶结构域的融合在"逆转"基因治疗中也具有用途,其中某些基因功能故意被抑制或废 止。在运些情况下,可W在体外、离体、或体内使用从T巧(TGG)、Gln(CAA和CAG)、或Arg(CGA) 残基位点特异性突变为未成熟的终止密码子(TAA、TAG、TGA)来废止蛋白功能。
[0158] 本披露提供用于治疗被诊断出具有与点突变相关或由点突变引起的疾病的受试 者的方法,所述点突变可W通过本文提供的化S9DNA编辑融合蛋白来修正。例如,在一些实 施例中,提供的方法包括对具有,例如,如W上所述的与PI3KCA点突变相关的癌症的疾病的 受试者给予有效量的Cas9脱氨酶融合蛋白,该融合蛋白修正点突变或在疾病相关基因中引 入失活的突变。在一些实施例中,该疾病是增殖性疾病。在一些实施例中,该疾病是遗传性 疾病。在一些实施例中,该疾病是肿瘤性疾病。在一些实施例中,该疾病是代谢性疾病。在一 些实施例中,该疾病是溶酶体胆积病。其他可W通过修正点突变或在疾病相关基因中引入 失活的突变进行治疗的疾病对本领域的普通技术人员而言将是已知的,并且本披露不限于 运一方面。
[0159] 本披露提供用于治疗另外的疾病或失调的方法,例如与点突变相关或由点突变导 致的疾病或失调,所述点突变可W通过脱氨酶介导的基因编辑修正。本文描述了一些运样 的疾病,并且基于本披露可W使用本文提供的策略和融合蛋白进行治疗的另外的适合的疾 病对本领域的普通技术人员而言将是显而易见的。W下列出了示例性的适合的疾病和失 调。应当了解在各自序列中的特异性的位置或残基的编号依赖于特定蛋白和使用的编号方 案。例如,成熟蛋白的前体和成熟蛋白本身的编号可能不同,并且不同物种的序列的不同可 能影响编号。本领域的技术人员能够通过本领域熟知的方法(例如通过序列比对和同源残 基的脱氨基作用)识别任何同源蛋白中和各自的编码核酸中的各自的残基。示例性的适合 的疾病和失调包括但不限于囊胞性纤维症(参见,例如,施万克(Schwank)等人,通过 CRI SPR/Cas9在囊胞性纤维化患者的肠道干细胞组织体中进行CFTR的功能修复 (Functional repair of CFTR by CRISPR/Cas9in intestinal stem cell organoids of 巧Stic fibrosis patients),细胞干细胞(Cell stem cell),2013;13:653-658;W及吴 (Wu)等人,通过使用CRISPR-Cas9修正小鼠中的遗传性疾病(Correction of a genetic disease in mouse via use of CRISPR-(^is9),细胞干细胞(Cell stem cell) ,2013; 13: 659-662,运两个文献皆没有使用脱氨酶融合蛋白来修正遗传缺陷);苯丙酬尿症-例如,在 苯丙氨酸径化酶基因的位置835(小鼠)或240(人)或同源残基处发生苯丙氨酸至丝氨酸的 突变(T〉C突变)-参见,例如,麦克唐纳(McDonald)等人,基因组学(Genomics) ,1997; 39: 402-405;巨大血小板综合征(BSS)-例如,在血小板膜糖蛋白IX中的位置55或同源残基处发 生苯丙氨酸至丝氨酸的突变,或在位置24或同源残基处发生半脫氨酸至精氨酸的突变(T 乂 突变)-参见,例如,诺里斯(Noris)等人,英国血液学杂志(British Journal of Haematology),1997;97:312-320; W 及阿里(Ali)等人,血液学化 ematol. ),2014; 93:381- 384;表皮松解性角化过度巧HK)-例如,在角蛋白1的位置160或161 (如果计数起始子甲硫氨 酸)或同源残基处发生亮氨酸至脯氨酸的突变(T〉C突变)-参见,例如,Chipev等人,细胞 (Cell ),1992; 70:821-828;也参见在 www[dot]uniprot[dot]o 巧网站的 UNIPROT 数据库中的 登录号P04264;慢性阻塞性肺病(COPD)-例如,在a广抗膜蛋白酶的加工形式的位置54或55 (如果计数起始子甲硫氨酸)或同源残基或未加工形式的残基78或同源残基处发生亮氨酸 至脯氨酸的突变(TX:突变)-参见,例如,波勒(Poller)等人,基因组学(Genomics) ,1993; 17 : 740-743,也参见UNIPROT数据库中的登录号POlOl 1;进行性神经性脾骨肌萎缩症 (Charcot-Marie-Tooth disease)4J型-例如,图4中在位置41或同源残基处发生异亮氨酸 至苏氨酸的突变(T乂突变)-参见,例如,伦克化enk)等人,PLoS遗传学(PLoS Genetics), 2011 ;7:e100 2104;神经母细胞瘤(NB)-例如,在半脫天冬酶-9的位置197或同源残基处发生 亮氨酸至脯氨酸的突变(T 乂突变)-参见,例如,昆都化undu)等人,3生物技术(3Biotech.), 2013; 3:225-234;血管性血友病(vWD)-例如,在血管性血友病因子的加工形式的位置509或 同源残基或在血管性血友病因子的未加工形式的位置1272或同源残基处发生半脫氨酸至 精氨酸的突变(T〉C突变)-参见,例如,拉韦涅化avergne )等人,英国血液学杂志 (Br. J.化ematol.),1992,也参见UNIPROT数据库中的登录号P04275; 82:66-72;先天性肌强 直-例如,在肌肉氯离子通道基因化CNl的位置277或同源残基处发生半脫氨酸至精氨酸的 突变(T〉C突变)-参见,例如,溫伯格(Weinberger)等人,生理学杂志(The Journel Of Physiology),2012:590:3449-3464;遗传性肾淀粉样变性-例如,在载脂蛋白AII加工形式 的78位或同源残基或在未加工形式的位置101或同源残基处发生终止密码子至精氨酸突变 (TX:突变)-参见,例如,矢崎(Yazaki)等人,国际肾脏化idney Int.) ,2003;64:11-16;扩张 型屯、肌病(DCM)-例如,在F0XD4基因的位置148或同源残基处发生色氨酸至精氨酸的突变(T 〉C突变)-参见,例如,米诺雷迪(Minoretti)等人,国际分子医学杂志(Int .J. Of Mol.Med. ),2007; 19:369-372;遗传性淋己水肿-例如,在VEGFR3酪氨酸激酶的位置1035或 同源残基处发生组氨酸至精氨酸的突变(A〉G突变)-参见,例如,Irrthum等人,美国人类遗 传学(Am. J.化m. Genet. ),2000 ; 67 :295-301;家族性阿尔茨海默病-例如,在早老蛋白1 (presenilinl)的位置143或同源残基处发生异亮氨酸至鄉氨酸的突变(A〉G突变)-参见,例 如,加洛(Gallo)等人,阿尔茨海默病杂志(J.Alzheimer'S disease),2011;25:425-431;航 病毒病-例如,在航蛋白的位置129或同源残基处发生甲硫氨酸至鄉氨酸的突变(A〉G突变)- 参见,例如,路易斯化ewis)等人,普通病毒学杂志(J.of General Virology),2006;87: 2443-2449;慢性小儿神经皮肤关节综合征(CINCA)-例如,在cryopyrin蛋白的位置570或同 源残基处发生酪氨酸至半脫氨酸的突变(A〉G突变)-参见,例如,藤泽(Fujisawa)等人,血液 (Blood) ,2007; 109:2903-2911; W及结蛋白相关肌病(DRM)-例如,在B晶状体蛋白的位置 120或同源残基处发生精氨酸至甘氨酸的突变(A〉G突变)-参见,例如,库马尔化umar)等人, 生物化学杂志(J.Biol.Chem. )1999;274:24137-24141。所有参考文献和数据库条目的全部 内容通过引用结合在此。
[0160]为了将如本文披露的化s9:核酸编辑酶/结构域融合蛋白祀向祀位点,例如包含待 编辑的点突变的位点,典型地有必要与指导RNA(如SgRNA)-起共表达化s9:核酸编辑酶/结 构域融合蛋白,运对本领域的普通技术人员而言将是显而易见的。如本文其他地方更详细 的解释,指导RNA典型地包括允许化s9结合的tracrRNA框架和赋予化s9:核酸编辑酶/结构 域融合蛋白序列特异性的指导序列。在一些实施例中,指导RNA包含结构5'-[指导序列]- gUUUU曰g曰gcu曰g曰曰曰imgc曰曰guu曰曰曰曰U曰曰曰ggcu曰guccguu曰UC曰曰CUUg曰曰曰曰曰guggc曰CCg曰gucggugc uuuuu-3'(SEQ ID N0:38),其中指导序列包括与祀序列互补的序列。典型地,指导序列为20 个核巧酸长。基于本披露,用于将化s9:核酸编辑酶/结构域融合蛋白祀向特异性基因组祀 位点的适合的指导RNA的序列对本领域的普通技术人员而言将是显而易见的。典型地,此类 适合的指导RNA序列包括与待编辑的祀核巧酸上或下游50个核巧酸内的核酸序列互补的指 导序列。W下提供了适合用于将化s9:核酸编辑酶/结构域融合蛋白祀向特异性祀序列的一 些示例性的指导RNA序列。
[0161] 在憐脂酷肌醇-3-激酶催化a亚基(PI3KCA或PIK3CA)中的H1047R(A3140G)多态性 (下划线是突变的核巧酸和各自的密码子的位置):
[0162]
[0163] (核巧酸序列-沈Q ID N0:39;蛋白序列-沈Q ID N0:40)。
[0164] 用于将化s9:核酸编辑酶/结构域融合蛋白祀向突变的A3140G残基的示例性的适 合的指导序列包括但不限于:5'-日11。旨旨日日11。1日11111111旨日。11。-3'(56〇10肋:41);5'- ucggaaucuauuuugacucg-3'(SEQ ID N0:42);5'-cuuagauaaaacugagcaag-3'(SEQ ID NO: 43);5'一曰UCU曰UUUU邑曰cue邑uucuc-3'(SEQ ID NO:44);5'一u曰曰曰曰cu邑曰邑c曰曰邑曰邑邑cuu-3'(SEQ ID N0:45);5'-ugguggcuggacaacaaaaa-3'(SEQ ID N0:46);5'-gcuggacaacaaaaauggau-3' (SEQ ID N0:47);5'-guguuaaumigucguacgua-3'(SEQ ID N0:48)。基于本披露,用于将 化s9:核酸编辑酶/结构域融合蛋白祀向突变的PI3KCA序列、祀向下文提供的任何另外的序 列、或祀向与疾病相关的另外的突变的序列的另外适合的指导序列对本领域的普通技术人 员而旨将是显而易见的。
[0165] 苯丙酬尿症在苯丙氨酸径化酶基因的残基240处发生苯丙氨酸至丝氨酸的突变(T 乂突变)(下划线是突变的核巧酸和各自的密码子的位置):
[0166]
[0167] (核巧酸序列-沈Q ID NO:49;蛋白序列-沈Q ID NO:50)。
[0168] 巨大血小板综合征(BSS)-在血小板膜糖蛋白IX的残基24处发生半脫氨酸至精氨 酸的突变(T 乂突变):
[01691
[
[ ? (
[
[
[ ? 之
[
[
[ I 白
[
[0179] (核巧酸序列-沈Q ID N0:89;蛋白序列-沈Q ID N0:90)。
[0180] 神经母细胞瘤(NB)-在半脫天冬酶-9的残基197处发生亮氨酸至脯氨酸的突变(T〉 C突变):
[0181]
[
[ 9
[
[
[ I
[
[
[ I 白
[
[0191] (核巧酸序列-沈Q ID NO:63;蛋白序列-沈Q ID NO:64)。
[0192] 遗传性肾淀粉样变性-在载脂蛋白An的残基111处发生终止密码子至精氨酸的突 变(T乂突变):
[0205]
[(
[( 摩
[(
[(
[( 達
[(
[(
[( 侣
[(
[0215](核巧酸序列-SEQ ID N0:79;蛋白序列-SEQ ID N0:80)。应当了解,W上提供的序 列是示例性的,并不意味着限制本披露的范围。基于本披露,疾病相关且服从Cas9:核酸编 辑酶/结构域融合蛋白W及适合的指导RNA序列修正的另外的适合的点突变的序列对本领 域的普通技术人员而言将是显而易见的。
[0216] 报告系统
[0217] 本披露的一些方面提供用于检测本文描述的融合蛋白的脱氨酶活性的报告系统。 在一些实施例中,该报告系统是基于巧光素酶的试验,其中脱氨酶活性导致巧光素酶的表 达。为了最小化脱氨酶结构域(例如,AID结构域)潜在的底物混乱的影响,可能会无意地被 祀向W用于脱氨基作用的残基数目(例如,可能潜在地驻留在报告系统内的ssDNA上的脱祀 C残基)被最小化。在一些实施例中,目的祀残基是位于不能启动翻译的巧光素酶基因的ACG 突变的起始密码子中。理想的脱氨酶活性导致ACG〉AUG的改变,因而使巧光素酶的翻译和脱 氨酶活性的检测和定量成为可能。
[0218] 在一些实施例中,为了最小化单链C残基,前导序列被插在突变的起始密码子和巧 光素酶基因的起点之间,该前导序列由一串Lys(AAA)、Asn(AAT)、Leu(TTA)、Ile(ATT、ATA)、 Tyr(TAT)、或Phe(TTT)残基组成。可W检测产生的突变体W确保前导序列不会负面地影响 巧光素酶的表达或活性。还可W使用突变的起始密码子确定背景巧光素酶活性。
[0219] 可W使用报告系统来检测许多不同的SgRNA,例如,W确定关于祀DNA序列,各自的 脱氨酶(如AID酶)将祀向哪一个或哪几个残基(图3)。因为化S9-DNA泡的大小是未知的,也 可W检测祀向非模板链的SgRNAW便于评估特异性的Cas9脱氨酶融合蛋白的脱祀效应。在 一些实施例中,设计运样的SgRNAW使得突变的起始密码子不会与SgRNA碱基配对。
[0220] 一旦已经识别了可W可编程的将位点特异性C改变为U的融合蛋白,可W进一步描 述它们活性的特征。来自巧光素酶试验的数据可W,例如,被整合进热地图,该热地图描述 了关于SgRNA祀DNA,哪些核巧酸会被特异性融合蛋白祀向W用于脱氨基作用。在一些实施 例中,对于每一个融合,在巧光素酶试验中导致最高活性的位置被考虑为"祀"位置,而所有 其他位置被考虑为脱祀位置。
[0221] 在一些实施例中,提供了具有各种AP0BEC3酶的化s9融合物或其脱氨酶结构域。在 一些实施例中,提供了具有其他核酸编辑酶或催化结构域的Cas9融合蛋白,包括,例如, ssRNA编辑酶,如胞巧脱氨酶AP0BEC1和ACF1/ASF,W及腺巧脱氨酶的ADAT家族,38运些核酸 编辑酶或催化结构域当融合至Cas9时可W被用于SSDNA编辑活性。可W使用与W上描述的 相同的报告系统和试验来检测此类融合蛋白的活性。
[0222] 在一些实施例中,本文提供了报告系统,该报告系统包括包含失活的起始密码子 (例如,在模板链上从3'-TAC-5'至3'-CAC-5'的突变)的报告基因。一旦祀标C成功脱去氨 基,相应的mRNA将被转录为5 ' -AUG-3 '而不是5 ' -GUG-3 ',使得报告基因的翻译成为可能。适 合的报告基因对本领域的普通技术人员而言将是显而易见的。
[0223] W上提供的对报告系统的示例性实施例的描述仅仅是出于说明性目的,并不意味 着限制。本披露也包括另外的报告系统,例如,W上详细描述的各种示例性系统的变体。
[0224] 实例
[0225] 实例1:融合蛋白
[0226] W下提供了示例性化s9:脱氨酶融合蛋白:
[0227] Cas9:人类AID融合物(C末端)
[022引
[0229] (下划线:细胞核定位信号;双下划线:细胞核输出信号;粗体:连接体序列)
[0230] Cas9:人类AID融合物(N末端)
[0231]
[0236] (下划线:细胞核定位信号;粗体:连接体序列;双下划线:细胞核输出信号)
[0237] Cas9:人类Aro邸C-3G融合物(N末端)
[0247]实例2:通过化s9融合蛋白修正PI3K,点突变
[024引导致PI3K蛋白的化047R氨基酸置换的在PI3KCA基因的外显子20内的A3140G点突 变通过接触编码具有Cas9:AID(SEQ ID N0:30)或Cas9:AP0邸CUSEQ ID N0:92)融合蛋白 的突变蛋白的核酸和在编码PI3KCA基因中将融合蛋白祀向突变位点的恰当地设计的SgRNA 来修正。通过各自的外显子20序列的基因组PCR来确定A3140G点突变,例如,产生核巧酸 3000-3250的PCR扩增子并且随后对PCR扩增子测序。
[0249]使表达在外显子20中包括A3140G点突变的突变的PI3K蛋白的细胞接触编码化s9: AID(SEQ ID N0:30)或Cas9:AP0BECl(SEQ ID N0:92)融合蛋白的表达构建体和在编码 P13KCA基因的反义链中将融合蛋白靴向突巧位点的恰当地设计的SgRNA。SgRNA的序列是
[0256] 化s9: AID或化s9: APO肥Cl融合蛋白的胞喀晚脱氨酶活性导致与突变的G3140碱基 配对的胞喀晚脱去氨基成为尿喀晚。一轮复制W后,恢复了野生型A3140。提取所处理的细 胞的基因组DNA并且使用适合的PCR引物扩增核巧酸3000-3250的PCR扩增子。通过对PCR扩 增子测序来确定使用融合蛋白处理细胞后的A3140G点突变的修正。
[0257] 实例3:通过化s9融合蛋白修正早老蛋白1点突变
[0258] 导致早老蛋白I(PSENl)内I143V氨基酸置换的PSENl基因的密码子143内的A-〉G点 突变通过接触编码突变的PSENl蛋白(具有Cas9:AID(SEQ ID NO: 30)或Cas9: AP0BEC1 (SEQ ID N0:92)融合蛋白)的核酸和在编码PSENl基因中将融合蛋白祀向突变位点的恰当地设计 的SgRNA来修正。参见,例如,加洛(Gal Io )等人,阿尔茨海默病杂志(J. Alzheimer'S disease) ,2011:25:425-431,对于与家族性阿尔茨海默病相关的示例性PSEN1I143V突变的 描述。通过各自的PSENl序列的基因组PCR来确定A-〉G点突变,例如,产生外显子143周围的 约100-250个核巧酸的PCR扩增子并且随后对PCR扩增子测序。
[0巧9] 使表达突变的PSENl蛋白的细胞接触编码Cas9:AID(SEQ ID ^):30)或〔曰39: APO肥CUSEQ ID N0:92)融合蛋白的表达构建体和在编码PSENl基因的反义链中将融合蛋 白祀向突变位点的恰当地设计的sgRNA。化s9:AID或化s9:AP0BECl融合蛋白的胞喀晚脱氨 酶活性导致与密码子143中的突变的G碱基配对的胞喀晚脱去氨基成为尿喀晚。一轮复制W 后,恢复了野生型A。提取所处理的细胞的基因组DNA并且使用适合的PCR引物扩增100-250 个核巧酸的PCR扩增子。通过对PCR扩增子测序来确定使用融合蛋白处理细胞后的A-〉G点突 变的修正。
[0260] 实例4:通过化s9融合蛋白修正a广抗膜蛋白酶点突变
[0261] 导致ai-抗膜蛋白酶蛋白内L55P氨基酸置换的ai-抗膜蛋白酶基因的密码子55内的 T-〉C点突变通过接触编码突变的a广抗膜蛋白酶蛋白(具有Cas9: ADATl融合蛋白(SEQ ID NO: 35或36))的核酸和在编码a广抗膜蛋白酶基因中将融合蛋白祀向突变位点的恰当地设 计的S排NA来修正。参见,例如,波勒(Poller)等人,基因组学(Genomics) ,1993 :17:740- 743,对于与慢性阻塞性肺病相关的示例性密码子55T-乂突变的更详细的描述。通过编码密 码子55的各自的a广抗膜蛋白酶序列的基因组PCR来确定T-乂点突变,例如,产生约100-250 个核巧酸的PCR扩增子并且随后对PCR扩增子测序。
[0262] 使表达突变的a广抗膜蛋白酶蛋白的细胞接触编码Cas9:AID(SEQ ID N0:30)或 化s9:AP0BECl(SEQ ID N0:92)融合蛋白的表达构建体和在编码a广抗膜蛋白酶基因的有义 链中将融合蛋白祀向密码子55内突变的核巧酸的恰当地设计的SgRNAXasg = ADATl融合蛋 白的胞喀晚脱氨酶活性导致突变的胞喀晚脱去氨基成为尿喀晚从而修正该突变。提取所处 理的细胞的基因组DNA并且使用适合的PCR引物扩增100-250个核巧酸的PCR扩增子。通过对 PCR扩增子测序来确定使用融合蛋白处理细胞后的a广抗膜蛋白酶基因的密码子55内T-乂 点突变的修正
[0263] 实例5:通过化s9融合蛋白修正血管性血友病因子点突变
[0264] 导致血管性血友病因子蛋白的巧09A氨基酸置换的血管性血友病因子基因的密码 子509内的T-乂点突变通过接触编码突变的血管性血友病因子蛋白(具有化s9:ADATl融合 蛋白(SEQ ID N0:35或36))的核酸和在编码血管性血友病因子基因的反义链中将融合蛋白 革己向突变位点的恰当地设计的SgRNA来修正。参见,例如,拉韦涅(Lavergne)等人,英国血液 学杂志(Br. J.化ematol.),1992; 82:66-7,对于与血管性血友病(VWD)相关的示例性血管性 血友病因子巧09A突变的描述。通过各自的血管性血友病因子基因组序列的基因组PCR来确 定T-乂点突变,例如,产生外显子509周围的约100-250个核巧酸的PCR扩增子并且随后对 PCR扩增子测序。
[0265] 使表达突变的血管性血友病因子蛋白的细胞接触编码化s9: ADATl融合蛋白(SEQ ID N0:35或36)的表达构建体和在编码血管性血友病因子基因的有义链中将融合蛋白祀向 突变位点的恰当地设计的SgRNA。Cas9: ADAT1融合蛋白的胞喀晚脱氨酶活性导致密码子509 内突变的胞喀晚脱去氨基成为尿喀晚从而修正突变。提取所处理的细胞的基因组DNA并且 使用适合的PCR引物扩增100-250个核巧酸的PCR扩增子。通过对PCR扩增子测序来确定使用 融合蛋白处理细胞后血管性血友病因子基因的密码子509内T-乂点突变的修正。
[0266] 实例6:通过化s9融合蛋白修正半脫天冬酶9点突变-神经母细胞瘤
[0267] 导致半脫天冬酶-9蛋白内L197P氨基酸置换的半脫天冬酶-9基因的密码子197内 的T-乂点突变通过接触编码突变的半脫天冬酶-9蛋白(具有化s9:ADATl融合蛋白(SEQ ID NO: 35或36))的核酸和在编码半脫天冬酶-9基因的有义链中将融合蛋白祀向突变位点的恰 当地设计的SgRNA来修正。参见,例如,伦克化enk)等人,PLoS遗传学(PLoS Genetics), 2011;7:e100 2104,对于与神经母细胞瘤(NB)相关的示例性半脫天冬酶-9L197P突变的描 述。通过各自的半脫天冬酶-9基因组序列的基因组PCR来确定T-乂点突变,例如,产生外显 子197周围的约100-250个核巧酸的PCR扩增子并且随后对PCR扩增子测序。
[0268] 使表达突变的半脫天冬酶-9蛋白的细胞接触编码Cas9:ADATl融合蛋白(SEQ ID N0:35或36)的表达构建体和在编码半脫天冬酶-9基因的有义链中将融合蛋白祀向突变位 点的恰当地设计的SgRNA。Cas9: ADAT1融合蛋白的胞喀晚脱氨酶活性导致密码子197内突变 的胞喀晚脱去氨基成为尿喀晚从而修正突变。提取所处理的细胞的基因组DNA并且使用适 合的PCR引物扩增100-250个核巧酸的PCR扩增子。通过对PCR扩增子测序来确定使用融合蛋 白处理细胞后的半脫天冬酶-9基因的密码子197内T-乂点突变的修正。
[0269] 实例7:两种狀as9-AP0BECl融合蛋白的脱氨酶活性
[0270] 产生了具有不同连接体的两种d化S9-AK)邸Cl融合蛋白:
[0271 ] rAP0BECl_GGS_dCas9:
[0272]
[i
[i
[i
[0276」(沈Q ID N0:95); h划线=rAPOBECl;双 h划线=dCas9。
[0277] 检查了两种融合蛋白的脱氨酶活性。脱氨酶试验改编自核酸研究(Nuc. Acids Res. )2014,42,p. 1095;生物化学杂志(J. Biol.畑 em. )2004,279,p. 53379;病毒学杂志 (J.Virology)2014,88,p.3850; W及病毒学杂志(J.Virology)2006,80,p.5992,将其每一 个的全部内容通过引用结合在此)。
[0278] 编码融合蛋白的表达构建体被插入CMV骨架质粒中(载体质粒52970;参见古灵儿 JP(Guilinger 肝)、汤普森.DlKThompson DB)、刘.DRlXiu DR),融合无催化活性的Cas9 至FokI核酸酶改善基因组修饰的特异性(Fusion of catal}ftically inactive Cas9to FokI nuclease improves the specificity of genome modification),自然生物技术 (Nat. Biotechnol. )2014; 32(6): 577-82)。使用TNT 快速禪合转录 / 翻译系统(TNT Quick Coupled Transcription/Translation System)(普洛麦格公司(Promega))来表达融合蛋 白。90分钟后,将化L溶解产物与5'-标记的ssDNA底物(切3-ATTATTATTATTCCGCGGATTTATT TATTTATTTATTTATTT,沈Q ID NO: 96)和UDG(尿喀晚DNA糖基化酶)在37 °C解育持续3小时。然 后添加IM化0H( 1化L)溶液W在脱碱基位点切割DNA。见图4。将DNA在10 %的TBE PAGE凝胶 上分辨(图5)。还包括阴性对照(其中PUC19解育在TNT系统中),W及阳性对照(其中合成了 用"U"代替祀标C的DNA)。图5说明两种融合蛋白都展现出脱氨酶活性。
[02巧]参考文献
[0280] 1.亨伯特?(KHumbert 0)、戴维斯? L(Davis L)、梅泽尔斯? N(Maizels N),革己向 基因'治疗:工具,应用、优化(Targeted gene ther 曰 pies:tools ,applications, optimization),生物化学与分子生物学重要评论(Crit Rev Biochem Mol Biol) ,2012; 47 (3):264-81,PMID:22530743。
[0281 ] 2.佩雷斯-皮涅拉? P(Perez-Pinera P)、奥斯特罗特DG(Ousterc)Ut DG)、乔斯己 奇CA(Gersbach CA),勒1 向基因组编辑的进展(Advances in targeted genome editing), 化学生物学新见(Curr Opin Chem Biol), 2012;16(3-4) :268-77 JMID:22819644。
[0282] 3.乌尔诺夫? FD(Urnov FD),雷己尔? EJ(Rebar EJ)、福尔摩斯? MC(Holmes MC)、张? HS(Zhang HS)、格雷戈瑞? PD(Grego巧PD),使用工程化的锋指核酸酶进行基因 组编辑(Genome editing with engineered zinc finger nucleases),遗传学自然评论 (Nat Rev Genet),2010;11(9):636-46,PMID:20717154〇
[0283] 4.姜戈JKQoung JK)、桑德? JD(Sander JD),TALENs:广泛应用于祀向基因组编 车茸白勺技术(TALENs:a widely applicable technology for targeted genome editing), 分子细胞生物学自然评论(Nat Rev Mol Cell Biol),2013;14(1):49-55,PMID:23169466。
[0284] 5.卡彭特? E(化a;rpentier E)、杜德纳? JA(Doudna JA),生物技术:重写基因组 (Biotechnology = Rewriting a genome),自然(Nature),2013;495,(7439) :50-1,PMID: 2:3467164。
[0285] 6.潘? Y(Pan Y)、夏? L(Xia L)、李? AS(Li AS)、张? X(Zhang X)、索罗斯 P (Sirois P)、张-J(Zhang J)、李-K(Li K),工程化核酸酶的生物学和生物医学领域的应 用(Biological and biomedical applications of engineered nucleases),分子生物技 术(Mol Biotechnol),2013;55(I):54-62,PMID:23089945。
[02化]7.德索萨.N.(De Souza N.),引物:使用工程化核酸酶进行基因组编辑(Primer: genome editing with engineered nucleases),自然方法(Nat Methods),2012;9(1) :27, PMID:22312638〇
[0287] 8.圣地亚哥?パSantiago Y)、陈? E(畑 an E)、刘? PQ 化 iu PQ)、奥兰多? S (Orlando S)、张.L(Zhang L)、乌尔诺夫?抑(Urnov 抑)、福尔摩斯 *M(XHolmes MC)、古 斯彻D(Guschin D)、韦德? A(Waite A)、米勒? JC(Miller JC)、雷己尔? EJ(Rebar EJ)、格 雷戈里.PD(Grego巧PD)、克卢格? A化lug A)、科林伍德? TN(Collingwood TN),通过使 用工程化锋指核酸酶在哺乳动物细胞中进行祀向基因敲除(Targeted gene knockout in mammalian cells by using engineered zinc-finger nucleases),美国国家科学院院干U (Proc Natl Acad Sci U S A)2008;105(15):5809-14,PMID:18359850〇 [028引 9.嘉吉? M(Cargill M)、阿特舒勒? D(Altshuler D)、爱尔兰? Jdreland J)、斯 克拉? P(Sklar P)、爱得利K(Ardlie K)、帕蒂尔? N^atil N)、莱恩? CR化ane 00、林? EP(Lim EP)、卡莱阿拉纳曼N化alyanaraman N)、奈曼什J(化mesh J)、扎瓦格拉L(Ziaugra L)、弗里德兰? URriedland L)、罗尔夫? A(Rolfe A)、沃灵顿? jXWarrington J)、利浦沙 特兹R(Lipshutz R)、戴利-GQ(Daley GQ)、兰德-ES(Lander ES),人类基因编码区域单核 巧酉《多态性的特性(Characterization of sin邑le-nucleotide polymorphisms in coding regions of human genes),自然遗传学(化t Genet),1999;22(3):231-8,PMID: 10391209。
[0289] 10.詹森R(化nsen R)、范埃姆登JD(van血bden JD)、嘉仕堡W(Gaas化a W)、索聘 德斯LM(Schouls LM),原核生物中与DNA重复序列相关的基因鉴定(Identification of genes that are associated with DNA repeats in prokaryotes),分子微生物学(Mol Microbiol),2002;43(6):1565-75,PMID:11952905〇
[0 巧 0] 11.马里? P(Mali P)、艾斯维特 KM 化 svelt KM)、丘奇? GM(化 urch GM),Cas9 作为 多功能工具用于工程生物学(化s9as a versatile tool for engineering biology),自 然方法(Nat Methods),2013; 10( 10):957-63,PMID: 24076990。
[0291] 12.捷雷? MM(Jore MM)、伦德格伦? MlXundgren M)、范杜津E(van Duijin E)、己 特玛JB(Bultema JB)、韦斯特拉?邸(Westra邸)、沃格梅尔SP(Waghmare SP)、怀德亨福特 B(Wiedenheft B)、普勒? U(Pul U)、武尔姆? R(Wurm R)、瓦格纳? R(Wagner R)、贝耶尔? MR(Beijer MR)、芭瑞恩德瑞格特 *A(Baren化egt A)、守K(化OU K)、释倪德思AP(Snijders AP)、迪克曼? MJ(Dickman MJ)、杜德纳? JA(Doudna JA)、博科玛EJ(Boekema EJ)、黑克? AJ(Heck AJ)、范德奥斯特《J(van der Oost J)、布龙斯.SJ(Brc)Uns SJ),用于CRISPR RNA指导的DNA级联识别的结构基础(Structural basis for CRISPR RNA-guided DNA reco即ition by Cascade),自然结构分子生物学(化t Shuct Mol Biol),2011;18(5): 529-36,PMID:21460843〇
[0292] 13.霍瓦特? P化orvath P)、己然勾R(Barrangou R),细菌和古细菌的免疫系统 CRISPR/Cas,科学(Science), 2010:327(5962) :167-70,PMID:20056882。
[0293] 14.怀德亨福特B(Wiedenheft B)、斯腾伯格? SH(Sternberg 細)、杜德纳? JA (Doudna JA),细菌和古细菌中RNA指导的基因沉默系统(RNA-guided genetic silencing systems in bacteria and archaea),自然(Nature),2012;482(7385):331-8,PMID: 22337052。
[0294] 15.盖斯尤纳斯G(Gasiunas G)、思科纳斯V(Siksnys V),CRISPR系统的RNA依赖性 DNA核酸内切酶化39:基因组编辑的圣杯?(RNA-dependent DNA endonuclease Cas9of 1:he CRISPR system:Holy Grail of genome editing?)趋势微生物学(Trends Microbiol), 2013;21(11):562-7,PMID:24095303 〇
[02巧]16.齐? LS(Qi LS)、拉尔森? MH化arson MH)、吉尔伯特? LA(Gnbed LA)、杜德 纳? JA(Doudna JA)、韦斯曼? JS(Weissman JS)、阿金? AP(Arkin AP)、林? WA化im WA), 将CRISPR再利用为RNA指导的平台W用于基因表达的序列特异性控制(Repurposing CRISPR as an RNA-Guided Platform for Sequence-Specific Control of Gene Expression)细胞(Cell) ,2013; 152(5): 1173-83,PMID:2:M52860。
[0296] 17.佩雷斯-皮涅拉? P(Perez-Pinera P)、高卡克?抓化ocak DD)、沃克雷CM (Vockl巧 CM)、阿德勒《AF(Adler AF)、卡己迪AM化abadi AM)、皮拉斯特LR(Polstein LR)、塔克雷PKThakore PI)、格拉斯 *KA(Glass KA)、奥斯特罗特DG(0usterout 06)、梁* KW化eong KW)、归拉科F(Guilak F)、克劳福德《GE(Crawford GE)、雷迪《TE(Reddy TE)、 乔斯己奇CA(Gersbach CA),基于CRISPR-Cas9的转录因子的RNA指导的基因激活(RNA- guided gene activation by CRISPR-Cas9-based transcription factors),自然方法 (Nat Methods),2013;10(10):973-6,PMID:23892895〇
[0巧7] 18.马里? P(Mali P)、阿赫? J(Aach J)、斯特兰杰斯PB(Stranges PB)、艾斯维特 KM巧svelt KM)、摩斯博纳M(Moost)Iirner M)、科索瑞S(Kosu;ri S)、杨 *L(Yang L)、丘奇. GM(Church GM),用于祀标特异性筛选的CAS9转录激活因子与用于合作基因组工程化的配 对切日酉每(CAS9transcriptional activators for target specificity screening and paired nickases for cooperative genome eng i ne er ing ),自然生物技术 (Nat.Biotechnol.)2013;31(9):833-8,PMID:23907171〇
[0巧引 19.吉尔伯特? LA、拉尔森? MH、莫所特(Morsut L)、刘? Z、布拉尔? GA、托雷斯? SE、施特恩-基纳萨N(Ste;rn-Ginossar N)、布拉德曼0(I3randman 0)、怀特海德《EH、杜德 纳? JA(Doudna JA)、林? WA化im WA)、韦斯曼? JS(Weissman JS)、齐? LS(Qi LS),真核生 物中CRISPR介导的模块化的RNA指导的转录调节(CRISPR-mediated modular RNA-guided regulation of transcription in e址aryotes)细胞(Cell) ,2013; 154(2) :442-51,PMID: 23849981O
[0巧9] 20.拉尔森? MH、吉尔伯特? LA、王? X(Wang X)、林? WA化im WA)、韦斯曼? JS (Weissman JS)、齐? LS(Qi LS),用于基因表达的序列特异性控制的CRISPR干扰(CRISP化) (CRISPR interference(CRISPRi)for sequence-specific control of gene expression)自然实验手册(Nat Protoc),2013; 8( 11): 2180-96,PMID: 24136:345。
[0300] 21.马里? P(Mali P)、杨? L"ang L)、艾斯维特KM化svelt KM)、阿赫? J(Aach J)、古埃尔? M(Guell M)、迪卡洛?巧(DiCarlo巧)、诺维尔?巧(Norville巧)、丘奇? GM (畑urch GM),通过Cas9进行RNA指导的人类基因组工程(RNA-guided human genome engineering via Cas9),科学(Science),2013;339(6121) :823-6,PMID:23287722。
[0301] 22.科尔-斯特劳斯? A(Cole-S化auss A)、尹? K(Yoon K)、向? YUiang Y)、伯 恩.BC(Byrne BC)、赖斯《MC(Rice MC)、戈恩J(Gryn J)、霍洛曼.WK化olloman WK)、柯麦 科EB化miec邸),通过RNA-DNA寡核巧酸修正负责镶状细胞性贫血的突变(Correction of the mutation responsible for sickle cell anemia by an RNA-DNA oligonucleotide),科学(Science),1996;273(5280): 1386-9,PMID:8703073。
[0302] 23.泰格拉克斯AD(Tagalakis AD)、欧文JS(0wen JS)、西蒙斯JP(Simons 肝),小 鼠胚胎中RM-DM寡核巧酸(嵌合修复术)诱变活性的缺乏化ack of RM-DM oligonucleotide(chimeraplast)mutagenic activity in mouse embryos),分子繁歹直与 发育(Mol R巧rod Dev),2005;71(2):140-4,PMID:15791601。
[0303] 24.雷? A(Ray A)、兰格? M化anger M),同源重组:最终作为手段化omologous recombination:ends as the means),趋势植物科学(Trends Plant Sci),2002;7(10): 435-40,PMID 12399177。
[0304] 25.布里特? AB(Britt AB)、梅? GD(May GD),重新工程化的植物基因祀向(Re? engineering plant gene targeting),趋势植物科学 (Trends Plant Sci),2003;8(2): 90-5,PMID:12597876。
[0305] 26.瓦格纳? V(化gner V)、埃利希? MD巧虹Iich SD),同源DNA重组的效率随着枯 草杆菌染色体而变化化fficiency of homologous DNA recombination varies along the Bacillus subtilis chromosome),细菌学杂志(J Bacteriol),1988; 170(9) :3978- 82,PMID:3137211。
[0306] 27.萨利赫-戈哈里? N(Saleh-Gohari N)、赫拉德T化elleday T),保守同源重组 优选地修复人类细胞中的细胞周期S期的DNA双链断裂(Conservative homologous recombination preferentially repairs DNA double-strand breaks in the S phase of the cell cycle in human cells),核酸研究(Nucleic Acids Res),2004;32(12): 3683-8,PMID:15252152〇
[0307] 28 .隆己多? A化ombardo A)、吉诺维斯? P(Genovese P)、博塞茹尔? CM (Beausejour CM)、科莱奥尼? S(Colleoni S)、李?化化ee 化)、金? KA化im KA)、安藤? D (Ando D)、马尔诺夫? FD化rnov抑)、加利? C(Galli C)、格雷戈里? PD(Grego巧PD)、福 尔摩斯-MCXHolmes MC)、纳蒂尼L(化Idini L),在人类干细胞中使用锋指核酸酶和整合酶 缺陷的慢病毒载体递送进行基因编辑(Gene editing in human stem cells using zince finger nucleases and integr曰se-defective lentivir曰I vector delivery),自然生物 技术(Nat. Biotechnol. )2007; 25( 11): 1298-306,PMID: 17965707。
[030引 29.科迪赛罗SG(Conticello SG) ,AID/APOBEC家族核酸增变基因 (The AID/ APO邸C family of nucleic acid mutators),基因组生物学(Genome Biol),2008;9(6): 229,PMID:18598372。
[0309] 30.雷诺? CA(R 巧 naud CA)、阿欧法齐 S(AoufoucM S)、法伊利? A(Faili A)、威 尔? JC(Weill JC),AID的角色是什么:增变基因或免疫球蛋白变位体的装配工?(肺at role for AID:mutator ,or assembler of the immunoglobulin mutasome?)自然实免疫 学(Nat Immunol),2003;4(7):631-8。
[0310] 31.己格瓦特? AS(化agwat AS), DNA胞喀晚脱氨酶:从抗体成熟至抗病毒防御 (DNA-cytosine deamin曰ses:from 曰ntibody maturation to antiviral defense),DNA修 复(DM Repair)(Amst),2004;3(I):85-9,PMID:14697763。
[0311] 32.纳瓦拉特曼N(化varatnam N)、萨瓦尔.lUSarwar R),胞巧脱氨酶概述(An overview of cytidine deaminases),国际血液学杂志(Int J 胎 matol),2006;83(3): 195-200,PMID:16720547〇
[0312] 33.霍顿? LG化olden LG)、普罗赫诺? C(Prochnow C)、常? YP(Chang YP)、碧然 斯德特R(化ansteitter R)、切利科L(化elico L)、森《U(Sen U)、史蒂文斯《RC(Stevens RC)、古德曼-MF(Gc)Odman MF)、陈? XS(Chen XS),抗病毒AP0BEC3G催化结构域和功能意义 的晶体结构(Oystal st;ruc1:ure of the anti-viral APO邸C3G catalytic domain and functional implications),自然(NaUire),2008;456(7218):121-4,PMID: 18849968。 [0;31;3] 34.切利科L、范.P(Pham P)、皮特斯卡J(Petruska J)、古德曼.MF(Goodman MF),通过激活诱导胞巧脱氨酶和AP0BEC3G对DNA祀向的胞喀晚脱氨作用发生应答的免疫学 的和逆转录病毒的生化基础(Biochemical basis of immunological and rehoviral responses to DNA-t曰rgeted cytosine deamination by 曰ctiv曰tion-induced cytidine deaminase and AP0BEC3G),生物化学杂志(J Biol 化em),2009;284(41):27761-5,PMID: 19684020。
[0;314] 35.范? P(Pham P)、碧然斯德特R(&ransteitter R)、古德曼? MF(Goodman MF), 奖励与风险:DNA胞喀晚脱氨酶引发免疫力和疾病(Reward versus ;risk:DNA c}ftidine deaminases triggering immunity and disease),生物化学(Biochemistry),2005;44 (8):2703-15,PMID 15723516。
[031日]36.己尔己斯? CF(Barbas CF)、金? DH化im DH),胞巧脱氨酶融合物和相关方法 (Cytidine deaminase fusions and related methods),PCT国际申请(PCT Int Appl), 2010;W0 2010132092A2 20101118。
[0316] 37.陈? X(Chen X)、扎罗?化(Zaro化)、沈? WC(aien WC),融合蛋白连接体:性 质、设计和功會K(Fusion protein linkers:property,desi邑n 曰nd function曰lity),先进 药物输送评论(Adv Drug Deliv Rev),2013;65(10):1357-69,PMID:23026637。
[0317] 38.格柏? AP(Gerber AP)、凯勒? W(Keller W),通过碱基脱氨作用进行RNA编辑: 更多的酶,更多的勒!标,新的奥秘(RNA editing by base deamination:more enz;ymes, more 1:a;rgets,new mysteries),趋势生物化学科学(Trends Biochem Sci) ,2001 ;26(6): 376-84,PMID:114064110
[0:31引 39.袁? L(化an L)、库莱克? UKurek I)、英格里斯J化nglish J)、基南? R 化eenan R),实验室定向蛋白进化(Laboratoir-directed protein evolution),微生物分 子生物学评论(Microbiol Mol Biol Rev), 2005;69(3) :373-92, PMID: 16148303。
[0319] 40.科布? RE(Col3b RE)、孙? N(Sun N)、赵? H(Zhao H),定向进化--强大的合 成生物学工具(Directed evolution as a powerful synthetic biology tool),方法 (Methods),2013;60(1):81-90,PMID:22465795〇
[0320] 41.博思坦S(Bershtein S)、陶菲克? DS(Tawfik DS),酶的实验室进化的进展 (Advances in laboratory evolution of enzymes),化学生物学亲jf见(Curr Opin Chem Biol),2008;12(2):151-8,PMID:18284924〇
[0321 ] 42.希达? K巧ida K)、哈内斯? J(化nes J)、奥斯特梅尔M(C)Stermeier M),药物 和核酉《递送的定向进化(Directed evolution for drug and nucleic acid delivery), 先进药物输送评论(Adv Drug Deliv Rev),2007;59(15):1562-78,PMID: 17933418。
[0322] 43.艾斯维特KM巧svelt KM)、卡尔森? JC(Carlson JC)、刘? DR化iu DR),生物分 子持续定向进化系统(A system for the continuous directed evolution of biomolecules),自然(NaUire) ,2011 ;472(7:M4) :499-503,PMID:21478873。
[0323] 44.胡斯米Y(Husimi Y) ,Cellstat中隧菌体的选择与进化(Selection and evolution of bacteriophages in cellstat),生物物理学进展(Adv Bio地ys),1989;25: 1-43,PMID:2696338。
[0324] 45.瑞彻曼URiechmann L)、霍利格? P化olliger P) ,TolAC-末端结构域为大肠 杆菌丝状隧菌体感染的辅助受体(The C-terminal domain of TolA is the coreceptor for filamentous phage infection of E.coli),细胞(Cell), 1997;90(2):351-60,PMID: 9244308O
[0325] 46.尼尔森FK(Nelson FK)、弗里德曼SM(Friedman SM)、史密斯GP(Smith GP),丝 状隧菌体DNA克隆载体:基因 III中具有非极性删除的非感染性突变体(Filamentous phage DNA cloning vectors:a noninfective mutant with a nonpolar deletion in gene III),病毒学(Virology) ,1981; 108(2) :338-50,PMID:6258292。
[03%] 47.拉克杰克J(Rakonjac J)、莫德尔P(Model P),pIII在丝状隧菌体组装中的作 用(Roles of pin in filamentous phage assembly),分子生物学杂志(J Mol Biol), 1998;282(1):25-41。
[0327] 48.史密斯GP(Smith GP),丝状隧菌体融合:在病毒表面上显示克隆抗原的新颖表 达载体(Filamentous fusion ph曰邑e:novel expression vectors that display cloned antigens on the virion surface),科学(Science), 1985;228(4705):1315-7,PMID: 4001944。
[03巧]49.谢里登? "aieridan C),基因治疗找到其合适的位置(Gene therapy finds its niche),自然生物技术(Nat. Biotechnol. )2011; 29(2) :121-8,PMID: 21301435。
[0329] 50.李JW化ee JW)、宋YH(Soung YH)、金SY化im SY)、李HW化ee 册)、帕克WS(Park WS)、纳姆SW(Nam SW)、金甜化im 甜)、李JY化ee JY)、柳NJ(Yoo NJ)、李甜化ee 甜),PIK3CA 基因通常在乳腺癌和肝癌中突变(PIK3CA gene is frequently mutated in breast carcinomas and hepatocellular carcinomas)13(Oncogene) ,2005;24(8): 1477- 80,PMID:15608678。
[0330] 51.伊科得彼 ONQkediobi ON)、戴维斯? H(Davies H)、比格内尔? G(Bi 即 ell 6)、艾约瑟》8化化;[]18 8)、史蒂文斯《0(516¥6]13〇、欧米拉《8(0']\16日^8)、斯坦里乌斯 T(San1:a;rius T)、阿维斯.!"(Avis T)、己瑟彼S(Ba;rtho;rpe S)、布拉肯伯里L(&rackenbury L)、己克? G(Buck G)、己特勒? A(Butler A)、克莱口茨? !(elements J)、科尔? J(Cole J) 、迪克斯? E(Dicks E)、福布斯? S(Forbes S)、格雷? K(Gray K)、哈利迪? KWalliday K) 、哈里森? R(Harrison R)、希尔斯? K化ills K)、欣顿? J化inton J)、亨特? C化unter C)、詹金森? AQenkinson A)、琼斯? DQones D)、克斯弥渡八1(〇31111(1〇11 V)、勒格? R(Lugg R)、孟席斯 *A(Menzies A)、米罗纳克T(Mironenkc) T)、帕克《A(Parker A)、佩里 (Per巧 J)、雷恩? K(Raine K)、理查森? D(Richardson D)、谢泼德? R(Shepherd R)、斯莫 尔? A(Small A)、史密斯? R(Smith R)、所罗口 ? H(Solomon H)、斯蒂芬斯? P(Stephens P)、绳阔J(Teaque J)、托夫茨-C(Tofts C)、范里安-J(Varian J)、韦伯-T(Webb T)、韦 斯特 *S(West S)、威达S(Widaa S)、耶茨 *A(Yates A)、莱因霍尔德-W(Reink)Id W)、溫 斯坦? JN(Weinstein JN)、斯特拉顿? MR(Stratton MR)、福特瑞尔PA(Futreal PA)、伍斯 特? R(Wooster R),在NCI-60细胞系组的24个已知癌症基因的突变分析(Mutation analysis of 24known cancer genes in the NCI-60cell line set),分子癌症治疗学 (Mol Cancer Ther),2006;5(ll):2606-12,PMID:17088437。
[0331] 本文,例如,在背景、概述、详细说明、实例、和/或参考文献部分提及的所有出版 物、专利、专利申请、公布物、和数据库条目(例如,序列数据库条目)W其整体通过引用结合 在此,如同每个单独的出版物、专利、专利申请、公布物和数据库条目被具体和单独地通过 引用结合在此。在冲突存在的情况下,将W本申请(包括本文的任何定义)为准。
[0332] 等效物和范围
[0333] 本领域的技术人员仅仅使用常规实验就将认识到或能够确认本文描述的实施例 的许多等效物。本披露的范围不旨在限制W上说明书,而是如在所附的权利要求书中所陈 述的。
[0334] 冠词如"一个/种(a/an)"和"该/所述(the)"可W意为一个/种或多于一个/种,除 非有相反的指明或另外从上下文明显可见。如果一组中一个、多于一个或全部成员存在,贝U 在该组的两个或多个成员之间包括"或"的权利要求书或说明被认为是得到满足,除非有相 反的指明或另外从上下文明显可见。在两个或多个组成员之间包括"或"的组的披露提供如 下实施例:其中恰好存在一个组成员的实施例,其中存在多于一个组成员的实施例,和其中 存在所有组成员的实施例。出于简洁的目的,那些实施例在本文没有单独地讲出来,但是应 当了解本文提供了运些实施例的每一个并且可W具体地要求或拒绝运些实施例中的每一 个。
[0335] 应当理解的是,本发明涵盖将一个或多个权利要求项或说明书的一个或多个相关 部分中的一个或多个限定、要素、条款、或说明性术语等引入另一权利要求项中的所有变 化、组合和排列。例如,可W对从属于另一个权利要求的一个权利要求进行修改W便包括从 属于同一基础权利要求的任何一个其他的权利要求中所发现的一个或多个限制。此外,在 权利要求叙述组合物的情况下,但应当理解的是,根据本文披露的任何制造或使用的方法 或根据本领域中已知的(如果存在)方法的制造或使用组合物的方法都包括在内,除非另有 说明或者除非对于本领域的普通技术人员而言显然会产生矛盾或不一致性。
[0336] 在将要素呈现为列表的情况下,例如W马库什组形式,应当理解的是,运些要素的 每个可能的亚组也被披露,并且任何要素或要素的亚组都可W从该组中去除。也应指出,名 词"包含"旨在是开放的并且允许囊括另外的要素或步骤。应当理解的是,通常,在一个/种 实施例、产物或方法被指包括特定元素、特征或步骤的情况下,也提供了由或基本上由运些 元素、特征或步骤组成的实施例、产物或方法。出于简洁的目的,那些实施例在本文没有单 独地讲出来,但是应当了解本文提供了运些实施例的每一个并且可W具体地要求或拒绝运 些实施例中的每一个。
[0337] 在给出范围的情况下,包括端点。此外,应当理解的是,除非另作说明或另外从上 下文和/或本领域的普通技术人员所理解的明显可见,在一些实施例中,表达为范围的值可 W呈现为所陈述的范围内的任何具体值,至该范围的下限的单位十分之一,除非上下文另 作清楚规定。出于简洁的目的,每个范围内的值在本文没有单独地讲出来,但是应当了解本 文提供运些值的每一个并且可W具体地要求或拒绝运些值中的每一个。还应当理解的是, 除非另作说明或另外从上下文和/或本领域的普通技术人员所理解的明显可见,表达为范 围的值可W呈现为给定的范围内的任何亚范围,其中亚范围的端点W相同精确度被表达为 该范围的下限单位的十分之一。
[0338] 另外,应当理解的是本发明的任何具体的实施例可W从任何一个或多个权利要求 中明确排除。在范围被给定的情况下,范围内的任何值可W从任何一个或多个权利要求中 明确排除。本发明的组合物和/或方法的任何实施例、元素、特征、应用或方面可W从任何一 个或多个权利要求中排除。出于简洁的目的,本文没有明确陈述其中一个或多个元素、特 征、目的或方面被排除的所有实施例。
【主权项】
1. 一种融合蛋白,该融合蛋白包括 (i) 核酸酶非活性Cas9结构域;和 (ii) 核酸编辑结构域。2. 如权利要求1所述的融合蛋白,其中所述核酸编辑结构域是DNA编辑结构域。3. 如权利要求1所述的融合蛋白,其中所述核酸编辑结构域是脱氨酶结构域。4. 如权利要求1所述的融合蛋白,其中所述脱氨酶是胞苷脱氨酶。5. 如权利要求1所述的融合蛋白,其中所述脱氨酶是载脂蛋白B mRNA编辑复合体 (APOBEC)家族脱氨酶。6. 如权利要求5所述的融合蛋白,其中所述脱氨酶是AP0BEC1家族脱氨酶。7. 如权利要求5所述的融合蛋白,其中所述脱氨酶是激活诱导的胞苷脱氨酶(AID)。8. 如权利要求1所述的融合蛋白,其中所述脱氨酶是ACF1/ASE脱氨酶。9. 如权利要求1所述的融合蛋白,其中所述脱氨酶是腺苷脱氨酶。10. 如权利要求9所述的融合蛋白,其中所述脱氨酶是ADAT家族脱氨酶。11. 如权利要求1所述的融合蛋白,其中所述核酸编辑结构域被融合至Cas9结构域的N 末端。12. 如权利要求1所述的融合蛋白,其中所述核酸编辑结构域被融合至Cas9结构域的C 末端。13. 如权利要求1所述的融合蛋白,其中所述Cas9结构域与所述核酸编辑结构域是通过 连接体融合的。14. 如权利要求1所述的融合蛋白,其中所述连接体包含(GGGGS)n(SEQ ID N0:91)、 (G)n、(EAAAK)n(SEQ ID N0:5)、(GGS)n、SGSETPGTSESATPES(SEQ ID N0:93)、或(XP)n基序, 或这些中任意的组合,其中n独立地是I至30之间的整数。15. -种DNA编辑的方法,该方法包括使DNA分子接触 (a) 包括核酸酶非活性的Cas9结构域和核酸编辑结构域的融合蛋白;和 (b) 将(a)的融合蛋白靶向DNA分子的靶DNA序列的SgRNA; 其中所述DNA分子与处于有效量的和在适合于该DNA分子的核苷酸碱基的脱氨基作用 的条件下的所述融合蛋白和所述sgRNA接触。16. 如权利要求15所述的方法,其中所述核酸编辑结构域是脱氨酶结构域。17. 如权利要求16所述的方法,其中所述脱氨酶是胞苷脱氨酶。18. 如权利要求16或17中任一项所述的方法,其中所述脱氨酶是载脂蛋白B mRNA编辑 复合体(APOBEC)家族脱氨酶。19. 如权利要求16所述的方法,其中所述脱氨酶是AP0BEC1家族脱氨酶。20. 如权利要求16所述的方法,其中所述脱氨酶是激活诱导的胞苷脱氨酶(AID)。21. 如权利要求16所述的方法,其中所述脱氨酶是ACF1/ASE脱氨酶。22. 如权利要求16所述的方法,其中所述脱氨酶是腺苷脱氨酶。23. 如权利要求16所述的方法,其中所述脱氨酶是ADAT家族脱氨酶。24. 如权利要求15-23中任一项所述的方法,其中所述核酸编辑结构域被融合至Cas9结 构域的N末端。25. 如权利要求15-23中任一项所述的方法,其中所述核酸编辑结构域被融合至Cas9结 构域的C末端。26. 如权利要求15-25中任一项所述的方法,其中所述Cas9结构域和所述核酸编辑结构 域是通过连接体融合的。27. 如权利要求26所述的方法,其中所述连接体包含(GGGGS)n(SEQ ID N0:91)、(G)n、 (EAAAK)n(SEQ ID N0:5)、(GGS)n、SGSETPGTSESATPES(SEQ ID N0:93)、或(XP)n基序,或这些 中任意的组合,其中n独立地是I至30之间的整数。28. 如权利要求15-27中任一项所述的方法,其中所述靶DNA序列包括与疾病或失调相 关的序列,并且其中所述核苷酸碱基的脱氨基作用产生与疾病或失调无关的序列。29. 如权利要求28所述的方法,其中所述靶DNA序列包括与疾病或失调相关的点突变, 并且其中所述脱氨基作用修正该点突变。30. 如权利要求15-28中任一项所述的方法,其中所述靶DNA序列包括与疾病或失调相 关的T-C或A-G点突变,并且其中所述突变的C或G碱基的脱氨基作用产生与疾病或失调无 关的序列。31. 如权利要求28-30中任一项所述的方法,其中所述与疾病或失调相关的序列编码蛋 白,并且其中所述脱氨基作用在所述与疾病或失调相关的序列中引入终止密码子,导致所 编码蛋白的截短。32. 如权利要求28-31中任一项所述的方法,其中所述接触是在具有或被诊断出具有疾 病或失调的受试者的体内进行的。33. 如权利要求28-32中任一项所述的方法,其中所述疾病或失调是囊胞性纤维症、苯 丙酮酸尿症、表皮松解性角化过度(EHK)、进行性神经性腓骨肌萎缩症4J型、神经母细胞瘤 (NB )、血管性血友病(vWD )、先天性肌强直、遗传性肾淀粉样变性、扩张性心肌病(DCM)、遗传 性淋巴水肿、家族性阿尔茨海默病、朊病毒疾病、慢性小儿神经皮肤关节综合征(CINCA)、结 蛋白相关肌病(DRM)、或与突变的PI3KCA蛋白相关的肿瘤性疾病。34. 如权利要求15-33中任一项所述的方法,其中所述靶DNA序列包括与野生型PI3K蛋 白相比导致PI3KCA蛋白的氨基酸序列突变的T-C和/或A-G点突变,并且其中所述方法导 致突变的C或G碱基的脱氨基作用。35. 如权利要求34所述的方法,其中所述点突变是导致H1047R置换的A3140G突变。36. 如权利要求15-33中任一项所述的方法,其中所述靶DNA序列包括与野生型PSENl蛋 白相比导致PSENl蛋白的氨基酸序列突变的T-C和/或A^G点突变,并且其中所述方法导致 突变的C或G碱基的脱氨基作用。37. 如权利要求36所述的方法,其中所述PSENl蛋白包括由PSENl基因的密码子143中A--G点突变导致的I143V置换。38. 如权利要求36或37所述的方法,其中所述PSENl点突变是与阿尔茨海默病相关的。39. 如权利要求36-38中任一项所述的方法,其中所述接触导致所述PSENl基因的密码 子143内突变的胞嘧啶残基脱去氨基,从而修正A-G点突变。40. 如权利要求15-33中任一项所述的方法,其中所述靶DNA序列包括与野生型α-抗胰 蛋白酶蛋白相比导致α_抗胰蛋白酶蛋白的氨基酸序列突变的T-C和/或A-G点突变,并且 其中所述方法导致突变的C或G碱基的脱氨基作用。41. 如权利要求40所述的方法,其中所述α-抗胰蛋白酶蛋白包括L55P置换该置换是由 α-抗胰蛋白酶基因的密码子55中的T-C点突变导致的。42. 如权利要求40或41所述的方法,其中所述α-抗胰蛋白酶点突变是与慢性阻塞性肺 病(coro)相关的。43. 如权利要求40-42中任一项所述的方法,其中所述接触导致所述α-抗胰蛋白酶基因 的密码子55内突变的胞嘧啶残基脱去氨基,从而修正T-C点突变。44. 如权利要求15-33中任一项所述的方法,其中所述靶DNA序列包括与野生型vWF蛋白 相比导致vWF蛋白的氨基酸序列突变的T-C和/或A-G点突变,并且其中所述方法导致突变 的C或G碱基的脱氨基作用。45. 如权利要求44所述的方法,其中所述vWF蛋白包括由vWF基因的密码子509中T-C点 突变导致的C509A置换。46. 如权利要求45所述的方法,其中所述vWF点突变是与血管性血友病相关的。47. 如权利要求44或45所述的方法,其中所述接触导致所述vWF基因的密码子509内突 变的胞嘧啶残基脱去氨基,从而修正T-C点突变。48. 如权利要求15-33中任一项所述的方法,其中所述靶DNA序列包括与野生型半胱天 冬酶-9蛋白相比导致半胱天冬酶-9蛋白的氨基酸序列突变的T-C和/或A-G点突变,并且 其中所述方法导致突变的C或G碱基的脱氨基作用。49. 如权利要求48所述的方法,其中所述半胱天冬酶-9蛋白包括由半胱天冬酶-9基因 的密码子197中T-C点突变导致的L197P置换。50. 如权利要求48或49所述的方法,其中所述半胱天冬酶-9点突变是与神经母细胞瘤 相关的。51. 如权利要求48-50中任一项所述的方法,其中所述接触导致所述半胱天冬酶-9基因 的密码子197内突变的胞嘧啶残基脱去氨基,从而修正T-C点突变。52. 如权利要求15-51中任一项所述的方法,其中所述方法进一步包括检测核苷酸碱基 的脱氨基作用。53. 如权利要求52所述的方法,其中所述检测是通过PCR进行的。54. 如权利要求15-53中任一项所述的方法,其中所述融合蛋白是如权利要求1-14中任 一项所述的融合蛋白。55. -种用于检测Cas9DNA编辑蛋白的DNA编辑活性的报告构建体,该构建体包括 (a) 包含用于Cas9DNA编辑蛋白的靶位点的报告基因,其中靶向的DNA编辑导致所述报 告基因表达的增加;以及 (b) 控制所述报告基因表达的启动子序列。56. 如权利要求55所述的报告构建体,其中该构建体进一步包括 (c) 编码将Cas9DNA编辑蛋白靶向所述报告基因的靶位点的SgRNA的序列,其中所述 sgRNA的表达与所述报告基因的表达是独立的。57. 如权利要求55或56所述的报告构建体,其中所述报告基因的靶位点包括未成熟的 终止密码子,并且其中通过Cas9DNA编辑蛋白对靶向的DNA的模板链的编辑导致未成熟的终 止密码子转变为编码氨基酸残基的密码子。58. 如权利要求55-57中任一项所述的报告构建体,其中所述报告基因编码焚光素酶、 荧光蛋白或抗生素抗性标记。59. -种试剂盒,包括 核酸构建体,该构建体包括 编码核酸酶非活性Cas9序列的序列; 包含克隆位点的序列,该克隆位点被定位以允许编码与Cas9编码序列同框的核酸编辑 酶或酶结构域的序列的克隆; 任选地,编码连接体的序列,该连接体被定位于Cas9编码序列和克隆位点之间;以及 合适的试剂、缓冲液、和/或说明书,用于将编码核酸编辑酶或酶结构域的序列框架克 隆进入核酸构建体以产生Cas9核酸编辑融合蛋白。60. 如权利要求59所述的试剂盒,其中所述包括克隆位点的序列是Cas9序列的N末端。61. 如权利要求59所述的试剂盒,其中所述包括克隆位点的序列是Cas9序列的C末端。62. 如权利要求59-62中任一项所述的试剂盒,其中所编码的连接体包括(GGGGS)n(SEQ ID NO:91)、(G)n、(EAAAK)n(SEQ ID NO:5)、(GGS)n、SGSETPGTSESATPES(SEQ ID NO:93)、或 (XP)n基序,或这些中任意的组合,其中η独立地是1至30之间的整数。
【文档编号】C12N9/78GK105934516SQ201480072550
【公开日】2016年9月7日
【申请日】2014年12月12日
【发明人】D.R.刘, A.C.科莫尔
【申请人】哈佛大学的校长及成员们
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1