使用截短的引导RNA(tru-gRNA)提高RNA引导的基因组编辑的特异性的制作方法

文档序号:18684804发布日期:2019-09-13 23:47阅读:247来源:国知局
本申请要求2013年3月15日提交的美国专利申请系列第61/799,647号、2013年6月21日提交的美国专利申请系列第61/838,178号、2013年6月21日提交的美国专利申请系列第61/838,148号和2013年12月26日提交的美国专利申请系列第61/921,007号的权益。前述专利申请系列号的完整内容在此通过引用并入。联邦资助的研究或开发本发明是在由美国国家卫生研究院授予的基金第DP1GM105378号下借助政府资助进行的。政府具有本发明的某些权利。
技术领域
:用于提高RNA引导的基因组编辑(例如使用CRISPR/Cas9系统,使用截短的引导RNA(tru-gRNA)编辑)的特异性的方法。背景最近的工作已显示成簇规律间隔短回文重复(CRISPR)/CRISPR-相关(Cas)系统(Wiedenheft等,Nature482,331-338(2012);Horvath等,Science327,167-170(2010);Terns等,CurrOpinMicrobiol14,321-327(2011))可用作在细菌、酵母和人细胞中以及在体内在完整生物体诸如果果蝇、斑马鱼和小鼠中进行基因组编辑的基础(Wang等,Cell153,910-918(2013);Shen等,CellRes(2013);Dicarlo等,NucleicAcidsRes(2013);Jiang等,NatBiotechnol31,233-239(2013);Jinek等,Elife2,e00471(2013);Hwang等,NatBiotechnol31,227-229(2013);Cong等,Science339,819-823(2013);Mali等,Science339,823-826(2013c);Cho等,NatBiotechnol31,230-232(2013);Gratz等,Genetics194(4):1029-35(2013))。来自化脓性链球菌(S.pyogenes)的Cas9核酸酶(在下文中简称为Cas9)可通过工程化引导RNA(gRNA)的前20个核苷酸与紧接前间区序列邻近基序(PAM)例如匹配序列NGG或NAG的PAM之后的目标靶基因组DNA序列的互补链之间的碱基对互补序列来引导(Shen等,CellRes(2013);Dicarlo等,NucleicAcidsRes(2013);Jiang等,NatBiotechnol31,233-239(2013);Jinek等,Elife2,e00471(2013);Hwang等,NatBiotechnol31,227-229(2013);Cong等,Science339,819-823(2013);Mali等,Science339,823-826(2013c);Cho等,NatBiotechnol31,230-232(2013);Jinek等,Science337,816-821(2012))。在体外(Jinek等,Science337,816-821(2012))于细菌中(Jiang等,NatBiotechnol31,233-239(2013))和人细胞中(Cong等,Science339,819-823(2013))进行的先前研究已显示Cas9-介导的裂解在一些情况下可被gRNA/靶位点交界处上,特别地位于20ntgRNA互补区的3’末端中的最后10-12个核苷酸(nt)中的单个错配消除。概述CRISPR-Cas基因组编辑使用引导RNA,其包括互补区(其通过碱基配对结合靶DNA)和Cas9-结合区,以将Cas9核酸酶导向靶DNA(参见图1)。所述核酸酶可耐受互补区中的许多错配(多达5个,如本文中显示的)并且仍然裂解;难以预测任何给定的单个错配或错配的组合对活性的影响。综上所述,这些核酸酶可显示显著的脱靶效应,但预测这些位点可具有挑战性。本文中描述了用于使用CRISPR/Cas系统,例如使用Cas9或基于Cas9的融合蛋白提高基因组编辑的特异性的方法。具体地,提供包括缩短的靶互补区(即,少于20nt,例如17-19或17-18nt的靶互补序列,例如17、18或19nt的靶互补序列)的截短的引导RNA(tru-gRNA),及其使用方法。如本文中所用,“17-18或17-19”包括17、18或19个核苷酸。在一个方面,本发明提供具有17-18或17-19个核苷酸的靶互补区的引导RNA分子(例如,单一引导RNA或crRNA),例如,靶互补区由17-18或17-19个核苷酸组成,例如,靶互补区由连续靶互补序列的17-18或17-19个核苷酸组成。在一些实施方案中,引导RNA包括与选定的靶基因组序列的互补链的17-18或17-19个连续核苷酸互补的由17-18或17-19个核苷酸组成的互补区。在一些实施方案中,靶互补区由17-18个核苷酸(靶互补序列的)组成。在一些实施方案中,互补区与选定的靶序列的互补链的17个连续核苷酸互补。在一些实施方案中,互补区与选定的靶序列的互补链的18个连续核苷酸互补。在另一个方面,本发明提供由以下序列组成的核糖核酸:(X17-18或X17-19)GUUUUAGAGCUA(SEQIDNO:2404);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUG(SEQIDNO:2407);或(X17-18或X17-19)GUUUUAGAGCUAUGCU(SEQIDNO:2408);(X17-18或X17-19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(SEQIDNO:1);(X17-18或X17-19)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(SEQIDNO:2);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(SEQIDNO:3);(X17-18)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(SEQIDNO:4)、(X17-18或X17-19)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:5);(X17-18或X17-19)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:6);或(X17-18或X17-19)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:7);其中X17-18或X17-19是与选定的靶序列,优选地紧接前间区序列邻近基序(PAM)例如NGG、NAG或NNGG的5’的靶序列的互补链互补的序列(17-18或17-19个核苷酸的)(参见,例如,图1中的构型),并且XN是不干扰核糖核酸对Cas9的结合的任意序列,其中N(在RNA中)可以是0-200,例如0-100、0-50或0-20。X17-18或X17-19与天然存在的与RNA其余部分相邻的序列绝不相同。在一些实施方案中,作为用作终止RNAPolIII转录的终止信号的一个或多个T的任选的存在的结果,所述RNA在分子的3’末端包括一个或多个U,例如1至8个或更多个U(例如,U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)。在一些实施方案中,所述RNA在RNA分子的5’末端包含一个或多个,例如多达3个,例如,1、2或3个不与靶序列互补的另外的核苷酸。在一些实施方案中,所述靶互补区由17-18核苷酸(靶互补序列的)组成。在一些实施方案中,所述互补区与选定的靶序列的互补链的17个连续核苷酸互补。在一些实施方案中,所述互补区与18个连续核苷酸互补。在另一个方面,本发明提供编码本文中描述的核糖核酸的DNA分子以及具有或表达核糖核酸或载体的宿主细胞。在其它方面,本发明用于在细胞中提高RNA引导的基因组编辑的特异性的方法,所述方法包括将细胞与引导RNA接触,所述引导RNA包括与选定的靶基因组序列的互补链的17-18或17-19个连续核苷酸互补的由17-18或17-19个核苷酸组成的互补区,如本文中所描述的。在另一个方面,本发明提供用于诱导例如细胞中的基因组序列中的双链DNA分子的靶区域中的单链或双链断裂的方法。所述方法包括在细胞中表达如下物质或将所述物质引入细胞:Cas9核酸酶或切口酶;和引导RNA,其包括与选定的靶序列,优选地紧接前间区序列邻近基序(PAM)例如NGG、NAG或NNGG的5’的靶序列的互补链互补的由17或18或19个核苷酸组成的序列,例如如本文中描述的核糖核酸。本文中还提供用于修饰细胞中的双链DNA分子的靶区域的方法。所述方法包括在细胞中表达如下物质或将所述物质引入细胞:dCas9-异源功能性结构域融合蛋白(dCas9-HFD);和引导RNA,其包括与选定的靶基因组序列的互补链的17-18或17-19个连续核苷酸互补的由17-18或17-19个核苷酸组成的互补区,如本文中描述的。在一些实施方案中,所述引导RNA为(i)单一引导RNA,其包括与选定的靶基因组序列的互补链的17-18或17-19个连续核苷酸互补的由17-18或17-19个核苷酸组成的互补区,或(ii)crRNA,其包括与选定的靶基因组序列的互补链的17-18或17-19个连续核苷酸互补的由17-18或17-19个核苷酸组成的互补区,以及tracrRNA。在一些实施方案中,所述靶互补区由17-18个核苷酸(靶互补序列的)组成。在一些实施方案中,所述互补区与选定的靶序列的互补链的17个连续核苷酸互补。在一些实施方案中,所述互补区与18个连载核苷酸互补。本文中描述的任何分子的X17-18或X17-19与天然存在的与RNA的其余部分相邻的序列绝不相同。在一些实施方案中,作为用作终止RNAPolIII转录的终止信号的一个或多个T的任选的存在的结果,所述RNA在分子的3’末端包括一个或多个U,例如1至8个或更多个U(例如,U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)。在一些实施方案中,所述RNA在RNA分子的5’末端包括不与靶序列互补的一个或多个,例如多至3个,例如1、2或3个另外的核苷酸。在一些实施方案中,RNA的一个或多个核苷酸被修饰,例如被锁定(2’-O-4’-C亚甲基桥),为5'-甲基胞苷,为2'-O-甲基-假尿苷,或其中磷酸核糖主链已被聚酰胺链替代,例如靶互补区X17-18或X17-19内或外的一个或多个核苷酸。在一些实施方案中,tracrRNA或crRNA的一些或全部,例如在X17-18或X17-19靶互补区内或外,包含脱氧核糖核苷酸(例如,全部或部分为DNA,例如DNA/RNA杂交体)。在另外的方面,本发明提供用于修饰例如细胞中的基因组序列中的双链DNA分子的靶区域的方法。所述方法包括在细胞中表达以下物质或将所述物质引入细胞:dCas9-异源功能性结构域融合蛋白(dCas9-HFD);和引导RNA,其包括与选定的靶序列,优选地紧接前间区序列邻近基序(PAM)例如NGG、NAG或NNGG的5’的靶序列的互补链互补的由17-18或17-19个核苷酸组成的序列,例如如本文中描述的核糖核酸。X17-18或X17-19与天然存在的与RNA的其余部分相邻的序列绝不相同。在一些实施方案中,所述RNA在RNA分子的5’末端包括不与靶序列互补的一个或多个,例如多至3个,例如1、2或3个另外的核苷酸。在另一个方面,本发明提供用于修饰(例如,将序列特异性断裂引入)例如细胞中的基因组序列中的双链DNA分子的靶区域的方法。所述方法包括在细胞中表达以下物质或将所述物质引入细胞:Cas9核酸酶或切口酶,或dCas9异源功能性结构域融合蛋白(dCas9-HFD);tracrRNA,例如,包含如下序列或由所述序列组成:GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:8)或其活性部分;UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2405)或其活性部分;AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2407)或其活性部分;CAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2409)或其活性部分;UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUG(SEQIDNO:2410)或其活性部分;UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA(SEQIDNO:2411)或其活性部分;或UAGCAAGUUAAAAUAAGGCUAGUCCG(SEQIDNO:2412)或其活性部分;和crRNA,其包括与选定的靶序列,优选地紧接前间区序列邻近基序(PAM)例如NGG、NAG或NNGG的5’的靶序列的互补链互补的由17-18或17-19个核苷酸组成的序列;在一些实施方案中,所述crRNA具有序列:(X17-18或X17-19)GUUUUAGAGCUA(SEQIDNO:2404);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUG(SEQIDNO:2407);或(X17-18或X17-19)GUUUUAGAGCUAUGCU(SEQIDNO:2408)。在一些实施方案中,所述crRNA为(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUG(SEQIDNO:2407)并且所述tracrRNA为GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:8);所述cRNA为(X17-18或X17-19)GUUUUAGAGCUA(SEQIDNO:2404)并且所述tracrRNA为UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2405);或所述cRNA为(X17-18或X17-19)GUUUUAGAGCUAUGCU(SEQIDNO:2408)并且所述tracrRNA为AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2406)。X17-18或X17-19与天然存在的与RNA的其余部分相邻的序列绝不不同。在一些实施方案中,作为用作终止RNAPolIII转录的终止信号的一个或多个T的任选的存在的结果,所述RNA(例如,tracrRNA或crRNA)在分子的3’末端包括一个或多个U,例如2至8个或更多个U(例如,U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)。在一些实施方案中,所述RNA(例如,tracrRNA或crRNA)在RNA分子5’末端上包含不与靶序列互补的一个或多个,例如多至3个,例如1、2或3个另外的核苷酸。在一些实施方案中,crRNA或tracrRNA的一个或多个核苷酸被修饰,例如被锁定(2’-O-4’-C亚甲基桥),为5'-甲基胞苷,为2'-O-甲基-假尿苷,或其中磷酸核糖主链已被聚酰胺链替代,例如序列X17-18或X17-19内或外的一个或多个核苷酸。在一些实施方案中,tracrRNA或crRNA的一些或全部,例如在X17-18或X17-19靶互补区内或外,包含脱氧核糖核苷酸(例如,全部或部分为DNA,例如DNA/RNA杂交体)。在一些实施方案中,所述dCas9-异源功能性结构域融合蛋白(dCas9-HFD)包含修饰基因表达、组蛋白或DNA的HFD,例如转录激活结构域、转录阻遏子(例如,沉默子诸如异染色质蛋白1(HP1),例如,HP1α或HP1β)、修饰DNA的甲基化状态的酶(例如,DNA甲基转移酶(DNMT)或TET蛋白,例如TET1)或修饰组蛋白亚单位的酶(例如,组蛋白乙酰转移酶(HAT)、组蛋白脱乙酰酶(HDAC)或组蛋白脱甲基酶)。在优选实施方案中,所述异源功能性结构域是转录激活结构域,例如,VP64或NF-κBp65转录激活结构域;催化DNA脱甲基化的酶,例如,TET蛋白家族成员或来自这些家族成员之一的催化结构域;或组蛋白修饰(例如,LSD1、组蛋白甲基转移酶、HDAC或HAT)或转录沉默结构域,例如,来自异染色质蛋白1(HP1),例如,HP1α或HP1β;或生物系链,例如MS2、CRISPR/Cas亚型Ypest蛋白4(Csy4)或λN蛋白。dCas9-HFD描述于2013年3月15日提交的美国临时专利申请USSN61/799,647、2013年6月21日提交的律师签号00786-0882P02,USSN61/838,148和PCT国际申请第PCT/US14/27335号(所述临时专利申请、PCT国际申请全部通过引用整体并入本文)中。在一些实施方案中,本文中描述的方法导致选定的靶基因组序列的插入缺失突变或序列改变。在一些实施方案中,所述细胞是真核细胞,例如哺乳动物细胞,例如人细胞。除非另有定义,否则本文所用的所有技术和/或科学术语具有与本发明所属领域的普通技术人员通常所理解的含义相同的含义。本文中描述了用于本发明的方法和材料;还可使用本领域中已知的其它合适的方法和材料。所述材料、方法和实施例仅为示例性的并非旨在限制。本文中提及的所有出版物、专利申请、专利、序列、数据库条目和其它参考资料通过引用整体并入。如发生矛盾,则以本专利说明书包括定义为准。根据以下详细说明和附图以及权利要求,本发明特征和有利将是显而易见的。附图简述图1:举例说明结合于其靶DNA位点的gRNA/Cas9核酸酶复合物的示意图。剪刀表示Cas9核酸酶在基因组DNA靶位点上的大致裂解点。注意,引导RNA上的核苷酸的编号以相反方式从5’至3’进行。图2A:举例说明截短gRNA的5’互补区的基本原理的示意图。粗的灰色线=靶DNA位点,细的深灰色线结构=gRNA,黑线显示gRNA与靶DNA位点之间的碱基配对(或其不存在)。图2B:EGFP破坏测定的示意性概述。通过错易NHEJ介导的修复进行的单一整合的EGFP-PEST报告基因的靶向Cas9介导的双链断裂的修复导致破坏编码序列并且与荧光在细胞中的丢失相关的移码突变。图2C-F:在EGFP报告基因序列中的3个不同靶位点上测定的拥有具有(C)单个错配、(D)相邻的双错配、(E)可变间隔的双错配和(F)递增数目的相邻错配的单一引导RNA(gRNA)的RNA引导的核酸酶(RGN)的活性。显示了针对优选地匹配的单一gRNA的活性标准化的平均复制活性。误差条指示平均值的标准误差。每一个单一gRNA中的错配位置在下面的网格中以灰色突出显示。3个EGFP靶位点的序列如下:EGFP位点1GGGCACGGGCAGCTTGCCGGTGG(SEQIDNO:9)EGFP位点2GATGCCGTTCTTCTGCTTGTCGG(SEQIDNO:10)EGFP位点3GGTGGTGCAGATGAACTTCAGGG(SEQIDNO:11)图2G:gRNA的5'末端上的错配产生比更多3'错配更敏感的CRISPR/Cas。除使用沃尔森-克里克颠换使其错配(即,通过将gRNA在位置18及19上改变成其沃尔森-克里克伴侣来使EGFP位点#2M18-19错配)的用“m”指示的位置外的RNA与DNA之间的gRNA沃尔森-克里克碱基配对。虽然gRNA的5’附近的位置通常被极好地耐受,但当其它残基被错配时这些位置中的匹配对于核酸酶活性是非常重要的。当使所有四个位置错配时,核酸酶活性不再是可检测的。这进一步表明这些5'位置上的匹配可帮助补偿其它更多3'位置上的错配。注意利用可显示相较于密码子最优化形式较低绝对水平的核酸酶活性的Cas9的非密码子优化形式进行这些实验。图2H:由具有范围在15至25nt内的可变长度互补区的gRNA引导性Cas9核酸酶活性在基于人细胞的U2OSEGFP破坏测定的效率。gRNA从U6启动子的表达需要5’G的存在,从而只可能评价具有某些长度的与靶DNA位点的互补性(15、17、19、20、21、23和25nt)的gRNA。图3A:EGFP报告基因中的4个靶位点的由Cas9和全长或缩短的gRNA介导的人细胞中的EGFP破坏的效率。显示了互补区和对应靶DNA位点的长度。Ctrl=缺乏互补区的对照gRNA。图3B:通过匹配的标准RGN(Cas9和标准全长gRNA)和tru-RGN(Cas9和在其5’互补区具有截短的gRNA)在7个不同的人内源基因靶上引入的靶向插入缺失突变的效率。显示了gRNA互补区和对应靶DNA位点的长度。通过T7EI测定测量的插入缺失频率。Ctrl=缺乏互补区的对照gRNA。图3C:通过使用被靶向EMX1位点的tru-gRNA或匹配的全长gRNA的RGN诱导的插入缺失突变的DNA序列。与gRNA互补区相互作用的靶DNA位点的部分以灰色突出显示,PAM序列的第一碱基以小写字母显示。缺失由以灰色突出显示的虚线指示,插入由以灰色突出显示的斜体字母指示。缺失或插入的碱基的净数目和每一个序列的次数被分离并且示于右边。图3D:通过匹配的标准和tru-RGN在家个内源人基因上引入的精确HDR/ssODN介导的改变的效率。使用BamHI限制酶切消化测定(参见实施例2的实验方法)测量%HDR。对照gRNA=空U6启动子载体。图3E:利用可变量的全长gRNA表达质粒(顶)或tru-gRNA表达质粒(底)与固定量的Cas9表达质粒一起转染U2OS.EGFP细胞,随后测定具有减少的EGFP表达的细胞的百分比。显示来自一式二份实验的平均值和所述平均值的标准误差。注意,利用tru-gRNA获得的数据与来自利用全长gRNA表达质粒而非tru-gRNA质粒针对这3个EGFP靶位点进行的实验的数据密切匹配。图3F:利用可变量的Cas9表达质粒与固定量的针对每一个靶的全长gRNA表达质粒(顶)或tru-gRNA表达质粒(底)一起转染U2OS.EGFP细胞(针对来自图3E的实验的每一个tru-gRNA测定的量)。显示来自一式二份实验的平均值和所述平均值的标准误差。注意,利用tru-gRNA获得的数据与来自利用全长gRNA表达质粒而非tru-gRNA质粒针对这3个EGFP靶位点进行的实验的数据密切匹配。这些滴定的结果确定用于在实施例1和2中进行的EGFP破坏测定的质粒的浓度。图4A:举例说明成对双切口的被gRNA靶向的VEGFA位点1和4的简图。全长gRNA的靶位点加以下划线,PAM序列中的第一碱基以小写字母显示。显示了利用ssODN供体通过HDR插入的BamHI限制性位点的位置。图4B:可将tru-gRNA与成对切口酶策略一起用于高效地诱导插入缺失突变。对于VEGFA位点1利用tru-gRNA对全长gRNA的取代不减小针对成对全长gRNA对于VEGFA位点4和Cas9-D10A切口酶观察到的插入缺失突变的效率。使用的对照gRNA是缺乏互补区的gRNA。图4C:可将tru-gRNA与成对切口酶策略一起用于高效地诱导精确的HDR/ssODN介导的序列改变。对于VEGFA位点1利用tru-gRNA对全长gRNA的取代不减小针对成对全长gRNA对于VEGFA位点4和Cas9-D10A切口酶观察到的的插入缺失突变(利用ssODN供体模板)。使用的对照gRNA是缺乏互补区的gRNA。图5A:使用在每一个位置(除在其上必须保留G以进行从U6启动子的高效表达的最5’碱基外)上具有单一错配的全长(顶)或tru-gRNA(底)的被靶向EGFP中的3个位点的RGN的活性。下面网格中的灰色框代表沃尔森-克里克颠换错配的位置。使用的空gRNA对照是缺乏互补区的gRNA。使用EGFP破坏测定测量RGN活性,并且显示的值代表相对于使用完美匹配的gRNA的RGN观察到的EGFP-阴性的百分比。以一式二份进行实验,并且显示了具有代表平均值的标准误差的平均值代表。图5B:使用在每一个位置(除在其上必须保留G以进行从U6启动子的高效表达的最5’碱基外)上具有相邻双错配的全长(顶)或tru-gRNA(底)的被靶向EGFP中的3个位点的RGN的活性。数据如5A中显示的。图6A:通过深度测序测量的由被靶向3个不同内源人基因位点的RGN诱导的中靶或脱靶插入缺失突变的绝对频率。显示了来自其中表达利用全长gRNA、tru-gRNA或缺乏互补区的对照gRNA的靶向RGN的细胞的3个靶位点的插入缺失频率。用于产生这些图表的插入缺失突变的绝对量可见于表3B中。图6B:3个tru-RGN的脱靶位点特异性的倍数提高。显示的值代表使用来自(A)和表3B的数据计算的显示的脱靶位点的tru-RGN的中靶/脱靶活性对标准RGN的中靶/脱靶活性的比率。对于星号(*)标记的位点,对于tru-RGN未观察到插入缺失,从而显示的值代表这些脱靶位点的特异性的倍数提高的保守统计估算(参见结果和实验程序)。图6C,顶图:通过被靶向VEGFA位点1的tru-RGN的T7EI测定鉴定的中靶与脱靶位点的比较(通过深度测序鉴定更多的中靶和脱靶位点)。注意,全长gRNA在靶位点的5’末端与2个核苷酸错配,并且这两个核苷酸是不存在于tru-gRNA靶位点中的两个核苷酸。脱靶位点中相对于中靶的错配用加以粗体下划线的文本来突出显示。gRNA与脱靶位点之间的错配以X显示。图6C,底图:通过具有全长或截短的gRNA的RGN在脱靶位点中诱导的插入缺失突变频率。插入缺失突变频率通过T7EI测定来测定。注意,该图中的脱靶位点是我们先前就被靶向VEGFA位点1的标准RGN诱导的插入缺失突变已检查的并且在该早期研究中被称为位点OT1-30的位点(实施例1和Fu等,NatBiotechnol.31(9):822-6(2013))。我们可能在我们的先前的实验中不鉴定该位点上的脱靶突变,因为插入缺失突变的频率似乎处于T7EI测定的可靠检测限(2–5%)。图7A-D:通过使用被靶向VEGFA位点1和3的tru-gRNA或匹配的全长gRNA的RGN诱导的插入缺失突变的DNA序列。序列描绘于图3C中。图7E。由具有错配的5’G核苷酸的tru-gRNA诱导的插入缺失突变的频率。显示了由通过具有针对VEGFA位点1和3以及EMX1位点1的17、18或20nt的互补区的tru-gRNA引导的Cas9在人U2OS.EGFP细胞中诱导的插入缺失突变频率。这些gRNA中的3个含有错配的5’G(由以粗体文本标记的位置指示的)。条表示来自使用全长gRNA(20nt)、tru-gRNA(17或18nt)和具有错配的5’G核苷酸的tru-gRNA(17或18nt,在5’末端具有粗体T)的实验的结果。(注意,针对EMX1位点1对于错配的tru-gRNA未检测到活性)图8A-C:由RGN在人U2OS.EGFP细胞中诱导的脱靶插入缺失突变的序列。被RGN识别的野生型基因组脱靶位点(包括PAM序列)以灰色突出显示并且如表1和表B中一样编号。注意,显示了一些位点的互补链。缺失的碱基在灰色背景中以虚线显示。插入的碱基以斜体字显示并且以灰色突出显示。图9A-C:由RGN在人HEK293细胞中诱导的脱靶插入缺失突变的序列。被RGN识别的野生型基因组脱靶位点(包括PAM序列)以灰色突出显示并且如表1和表B中一样编号。注意,显示了一些位点的互补链。缺失的碱基在灰色背景中以虚线显示。插入的碱基以斜体字显示并且以灰色突出显示。*产生大量的单bp插入缺失。详述CRISPRRNA引导的核酸酶(RGN)已快速形成为用于基因组编辑的轻便高效的平台。虽然Marraffini及同事(Jiang等,NatBiotechnol31,233-239(2013))最近在细菌中进行了Cas9RGN特异性的系统性研究,但RGN在人细胞中的特异性一直未被广泛地确定。如果这些核酸酶将被广泛用于研究和治疗性应用,理解RGN介导的脱靶效应在人和其它真核细胞中的范围将是非常必需的。本发明人已使用基于人细胞的报告测定来表征基于Cas9的RGN的脱靶裂解。取决于它们沿着引导RNA(gRNA)-DNA界面的位置,单和双错配被耐受至不同程度。由被靶向人细胞中的内源基因座的6个RGN中的4个诱导的脱靶改变可通过部分错配位点的检查来容易地检测。已鉴定的脱靶位点具有多至5个错配,并且许多以可与在期望的中靶位点上观察到的频率相当(或更高)的频率被诱变。因此,即使在人细胞中具有不完全匹配的RNA-DNA界面,RGN亦具有很高的活性,这是可能使它们在研究和治疗性应用中的用途受挫的发现。本文中描述的结果显示预测任何给定的RGN的特异性特征谱既不简单也不直接。EGFP报告基因测定实验显示单和双错配可对人细胞中的RGN活性具有可变的作用,所述作用不严格地取决于它们在靶位点中的位置。例如,与先前公开的报导一致,sgRNA/DNA界面的3’半部分的改变通常具有比5’半部分的改变更大的效应(Jiang等,NatBiotechnol31,233-239(2013);Cong等,Science339,819-823(2013);Jinek等,Science337,816-821(2012));然而,3’末端中的单和双突变有时也表现被良好地耐受,然而5’末端中的双突变可极大地降低活性。此外,针对在任何给定的位置上的错配的这些效应的量级似乎是位点依赖性的。通过所有可能的核苷酸取代(涵盖用于我们的EGFP报告基因实验的沃尔森-克里克颠换)的测试进行的大系列RGN的全面图谱表征可帮助提供对潜在脱靶的范围的另外见解。在这一点上,最近描述的Marraffini及同事的基于细菌细胞的方法(Jiang等,NatBiotechnol31,233-239(2013))或由Liu及同事先前用于ZFN的在体外基于组合文库的裂解位点-选择法(Pattanayak等,NatMethods8,765-770(2011))可用于产生更大组的RGN特异性特征谱。尽管这些在全面预测RGN特异性中提出了挑战,但有可能通过检查一个亚组的与中靶位点相异在于1至5个错配的基因组位点来鉴定RGN的真正脱靶。值得注意的是,这些实验的条件下,RGN在这些脱靶位点的许多位点上诱导的突变的频率与在期望的中靶位点上观察到的所述频率相似(或更高),这使得能够使用T7EI测定(所述测定,如在我们实验室中进行的,具有~2%至5%的突变频率的可靠检测限)检测这些位点上的突变。因于这些突变率非常高,因此有可能避免使用先前需要用来检测低得多的频率的ZFN-和TALEN-诱导的脱靶改变的深度测序法(Pattanayak等,NatMethods8,765-770(2011);Perez等,NatBiotechnol26,808-816(2008);Gabriel等,NatBiotechnol29,816-823(2011);Hockemeyer等,NatBiotechnol29,731-734(2011))。人细胞中的RGN脱靶诱变的分析还确认了预测RGN特异性的困难–并非所有单和双错配脱靶位点显示突变的证据,虽然具有多至5个错配的一些位点也可显示改变。此外,鉴定的真正的脱靶位点不显示任何明显的相对于期望的靶序列(表E;灰色突出显示的行)的朝向转换或颠换的偏倚性。虽然对于许多RGN看到脱靶位点,但这些位点的鉴定既非全面的也非全基因组规模的。对于6个研究的RGN,仅检查极小亚组的人基因组中的大多得的总数的潜在脱靶序列(与期望的靶位点相异3至6个核苷酸的位点;比较表E与C)。虽然通过T7EI测定检查这样大数目的基因座的脱靶突变既然不现实也不是成本效益好的策略,但在将来的研究中使用高通量测序可能使得能够质询更大数目的候选脱靶位点并且提供用于检测真正的脱支突变的更加灵敏的方法。例如,此类方法可能使得能够揭示我们对于其不能发现任何脱靶突变的两个RGN的另外的脱靶位点。另外,RGN特异性和可影响RGN在细胞中的活性的任何表观因子(例如,DNA甲基化和染色质状态)的更加深刻的理解可能也减少需要被检查的潜在位点的数目,从而使得RGN脱靶的全基因评估更可行和可承受得起。如本文中所述,许多策略可用于使基因组脱靶突变的频率减小至最小。例如,RGN靶位点的特异性选择可被优化;鉴于在多至5个位置与期望的靶位点不同的脱靶位置可被RGN高效地突变,因此选择具有最少脱靶位点数目的靶位点(如通过错配计数判断的)似乎不可能是有效的;对于被靶向人基因组的序列的任何给定的RGN,通常存在在20bpRNA:DNA互补区内相异在于4或5个位置的数千潜在的脱靶位点(参见,例如,表C)。还可能的是,gRNA互补区的核苷酸含量可能影响潜在脱靶效应的范围。例如,已显示高GC含量稳定RNA:DNA杂交体(Sugimoto等,Biochemistry34,11211-11216(1995)),从而还可能预期使gRNA/基因组DNA杂交更稳定并且对错配更加耐受。需要利用更大数目的gRNA的另外的实验来评估这两个参数(基因组中的错配位点的数目和RNA:DNA杂交体的稳定性)是否影响和如何影响RGN的全基因组特异性。然而,重要地要指出,如果此类预测参数可被确定,则执行此类指导方针的作用将进一步限制RGN的靶向范围。用于减弱RGN诱导的脱靶效应的一个可能的一般策略可能是降低细胞中表达的gRNA和Cas9核酸酶的浓度。在U2OS.EGFP细胞中使用RGN针对VEGFA靶位点2和3测试该想法;转染较少的表达sgRNA和Cas9的质粒减少中靶位点上的突变率但丝毫不改变相对脱靶突变率(表2A和2B)。与此一致,在两个其它人细胞类型(HEK293和K562细胞)中也观察到高水平的脱靶诱变率,既使绝对中靶诱变率比在U2OS.EGFP细胞中低。因此,降低细胞中的gRNA和Cas9的表达水平不可能提供减小脱靶效应的解决方法。此外,这些结果还表明在人细胞中观察到的高脱靶诱变率非由gRNA和/或Cas9的过表达引起。表2A针对被靶向VEGFA靶位点2的RGN的由不同量的表达Cas9和单一gRNA的质粒诱导的中靶和脱靶基因组位点上的插入缺失突变频率在每一栏的顶部显示了用于这些测定的转染进U2OS.EGFP细胞的表达gRNA和Cas9的质粒的量。(注意,关于250nggRNA/750ngCas9的数据与表1中显示的那些数据相同)。如方法中所述,使用T7EI测定从重复样品测定平均插入缺失频率。OT=脱靶位点,如表1和表B中一样编号。来自中靶位点(在gRNA与其杂交的20bp区域内)的错配以粗体下划线文本突出显示。N.D.=未检测到。表2B针对被靶向VEGFA靶位点3的RGN的由不同量的表达Cas9和单一gRNA的质粒诱导的中靶和脱靶基因组位点上的插入缺失突变频率在每一栏的顶部显示了用于这些测定的转染进U2OS.EGFP细胞的表达gRNA和Cas9的质粒的量。(注意,关于250nggRNA/750ngCas9的数据与表1中显示的那些数据相同)。如方法中所述,使用T7EI测定从重复样品测定平均插入缺失频率。OT=脱靶位点,如表1和表B中一样编号。N.D.=未检测到。可在3个不同的人细胞类型中通过RGN诱导显著的脱靶诱变的发现对该基因组编辑平台的更广泛用途具有重要影响。对于研究应用,特别是对于牵涉及具有缓慢的世代时间的培养细胞或生物体的实验,将需要考虑高频率脱靶突变的潜在混淆作用,对于所述细胞或生物不期望的改变的异型杂交将具有挑战性。由于脱靶效应不是随机的而是与靶位点相关的,因此控制此类效应的一个方式可能是使用被靶向不同DNA序列的多个RGN来诱导基因组改变。然而,对于治疗性应用,这些发现明确地表明,如果这些核酸酶将在更长时期中被安全地用于治疗人疾病,则需要仔细地确定和/或提高RGN的特异性。用于提高特异性的方法如本文中所示,基于化脓性链球菌Cas9蛋白的CRISPR-CasRNA引导的核酸酶可具有可与期望的中靶活性相当或比其更高的显著的脱靶诱变效应(实施例1)。此类脱靶效应对于研究,特别是对于潜在治疗性应用可以是有问题。因此,需要用于提高CRISPR-CasRNA引导的核酸酶(RGN)的特异性的方法。如实施例1中所述,Cas9RGN可在人细胞中在脱靶位点诱导高频率的插入缺失突变(也参见Cradick等,2013;Fu等,2013;Hsu等,2013;Pattanayak等,2013)。这些不期望的改变可在基因序列中发生,其与期望的中靶位点相异在于多至5个错配(参见实施例1)。另外,尽管相较于3’末端的错配,gRNA互补区的5’末端上的错配通常被更好地耐受,但这些关系不是绝对的,并且显示位点-对-位点依赖性(参见实施例1和Fu等,2013;Hsu等,2013;Pattanayak等,2013)。因此,对于鉴定真正的脱靶位点,依赖于错配的数目和/或位置的计算方法目前具有有限的预测值。因此,如果RNA引导的核酸酶将被用于研究和治疗性应用,则用于减少脱靶突变的频率的方法仍然具有重要的优先性。截短的引导RNA(tru-gRNA)实现更大的特异性引导RNA一般而言出现在两个不同的系统中:系统1,其使用一起引导Cas9进行裂解的单独的crRNA和tracrRNA,和系统2,其使用在单个系统中组合两个单独的引导RNA的嵌合crRNA-tracrRNA杂交体(被称为单一引导RNA或sgRNA,也参见Jinek等,Science2012;337:816–821)。tracrRNA可被可变地截短,并且已显示许多长度在所述单独的系统(系统1)和嵌合gRNA系统(系统2)中都具有功能。例如,在一些实施方案中,可从其3’末端将tracrRNA截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35或40nt。在一些实施方案中,可将tracrRNA分子从其5’末端截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35或40nt。或者,可以从5’和3’末端截短tracrRNA分子,例如在5’末端截短至少1、2、3、4、5、6、7、8、9、10、15或20nt并且在3’末端鞭短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35或40nt。参见,例如,Jinek等,Science2012;337:816–821;Mali等,Science.2013年2月15日;339(6121):823-6;Cong等,Science.2013年2月15日;339(6121):819-23;以及Hwang和Fu等,NatBiotechnol.2013年3月;31(3):227-9;Jinek等,Elife2,e00471(2013))。对于系统2,一般地更长长度的嵌合gRNA已显示更大的中靶活性,但不同长度的gRNA的相对特异性目有仍未确定,从而在某些情况下可能期望使用较短的gRNA。在一些实施方案中,gRNA与在转录起始位点上游约100-800bp内,例如在转录起始位点的上游约500bp内,包括转录起始位点,或在转录起始位点下游约100-800bp,例如约500bp内的区域互补。在一些实施方案中,使用编码不止一个gRNA的载体(例如,质粒),例如编码导向靶基因的相同区域内的不同位点的2、3、4、5或更多个gRNA的质粒。本申请描述了基于缩短而非延长gRNA互补区的表面上违反直觉的想法的用于提高RGN特异性的策略。这些较短的gRNA可以以可与全长gRNA相当(或者,在一些情况下,更高)的效率在单一整合的EGFP报告基因中的多个位点上和在内源人基因中诱导不同类型的Cas9介导的中靶基因组编辑事件。另外,使用这些缩短的gRNA的RGN显示提高的对gRNA-靶DNA界面上的少数错配的敏感性。最重要地,缩短的gRNA的使用显著减小人细胞中的基因组脱靶效应的比率,从而在这些位点产生高达5000倍或更高的特异性的提高。因此,该缩短的gRNA策略提供用于减小脱靶效应而不削弱中靶活性并且无需第二潜在诱变gRNA的表达的高度有效的方法。可单独执行该方法或可将其与其它策略诸如成对切口酶法结合执行以减小人细胞中的RGN的脱靶效应。因此,提高CRISPR/Cas核酸酶的特异性的一个方法缩短用于引导核酸酶特异性的引导RNA(gRNA)种类的长度。可使用引导RNA,例如在其5’末端具有与基因组DNA靶位点的互补链互补的17或18nt的单gRNA或crRNA(与tracrRNA配对的)将Cas9核酸酶导向具有另外的近端前间区序列邻近基序(PAM)(例如序列NGG的)的特定17-18nt的基因组靶(图1)。虽然可能预期增加gRNA互补区的长度可提高特异性,但本发明人(Hwang等,PLoSOne.2013年7月9日;8(7):e68708)和其它研究人员(Ran等,Cell.2013年9月12日;154(6):1380-9)先前已观察到在gRNA的5’末端延长靶位点互补区实现上使得其在中靶位点上不太有效地发挥功能。相反地,实施例1中的实验显示在标准长度的5’互补靶向区内具有多个错配的gRNA可以仍然诱导强劲的Cas9介导的它们的靶位点的裂解。因此,缺乏这些5’末端核苷酸的截短的gRNA可能可显示可与它们的全长对应物相当的活性(图2A)。进一步推测这些5’核苷酸可能通常在沿着gRNA-靶DNA界面的其它位置上补偿错配,从而预测较短的gRNA可能对错配更加敏感并从而诱导较低水平的脱靶突变(图2A)。减少被靶的DNA序列的长度可能也减小gRNA:DNA杂交体的稳定性,使得其不太耐受错配,从而使靶向更加特异。即,截短gRNA序列以识别更短的DNA靶可能实际上导致不太耐受甚至单核苷酸错配,从而更加特异并具有更少的不期望的脱靶效应的RNA引导的核酸酶。可潜在地将缩短gRNA互补区的该策略与除化脓性链球菌Cas9外的RNA引导的蛋白(包括来自细菌或古细菌(archaea)的其它Cas蛋白以及切割DNA的单链的Cas9或不具有核酸酶活性的Cas9,诸如在一个或两个核酸酶结构域上具有无催化活性的突变的dCas9)一起使用。该策略可用于利用单一gRNA的系统以及使用双重gRNA(例如,在天然存在的系统中发现的crRNA和tracrRNA)的那些系统。因此,本文中描述了包含与通常反式编码的tracrRNA融合的crRNA的单一引导RNA,例如Mali等,Science2013年2月15日;339(6121):823-6中描述的单一Cas9引导RNA,但其在5’末端具有与紧接前间区序列邻近基序(PAM)例如NGG、NAG或NNGG的5’的靶序列的互补链的少于20个核苷酸(nt)例如19、18或17nt,优选地17或18nt互补的序列。在一些实施方案中,缩短的Cas9引导RNA由下列序列组成:(X17-18或X17-19)GUUUUAGAGCUA(SEQIDNO:2404);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUG(SEQIDNO:2407);或(X17-18或X17-19)GUUUUAGAGCUAUGCU(SEQIDNO:2408);(X17-18或X17-19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(SEQIDNO:1);(X17-18或X17-19)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(SEQIDNO:2);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(SEQIDNO:3);(X17-18或X17-19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(SEQIDNO:4)、(X17-18或X17-19)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:5);(X17-18或X17-19)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:6);或(X17-18或X17-19)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:7);其中X17-18或X17-19是分别与靶序列的17-18或17-19个连续核苷酸互补的核苷酸序列。本文中还描述了先前已在文献(Jinek等,Science.337(6096):816-21(2012)和Jinek等,Elife.2:e00471(2013))中被描述的编码缩短的Cas9引导RNA的DNA。引导RNA可包括可以是不干扰核糖核酸对Cas9结合的任何序列的XN,其中N(在RNA中)可以是0-200例如0-100、0-50或0-20。在一些实施方案中,所述引导RNA在3’末端上包括一个或多个腺嘌呤(A)或尿嘧啶(U)核苷酸。在一些实施方案中,作为用作终止RNAPolIII转录的终止信号的一个或多个T的任选的存在的结果,所述RNA在分子的3’末端包括一个或多个U,例如,1至8个或更多个U(例如,U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)。经修饰的RNA寡核苷酸诸如锁核酸(LNA)已被证明通过以更有利的(稳定的)构象锁定经修饰的寡核苷酸来提高RNA-DNA杂交的特异性。例如,2’-O-甲基RNA是其中在2’氧与4’碳之间存在另外的共价键联的经修饰的碱基,当被掺入寡核苷酸中时其可提高总体热稳定性和选择性(式I)。因此,在一些实施方案中,本文中公开的tru-gRNA可包含一个或多个经修饰的RNA寡核苷酸。例如,本文中描述的截短的引导RNA分子可具有已被修饰的与靶序列互补的引导RNA的5’区的17-18或17-19nt的一个或一些或全部被修饰,例如锁定的(2’-O-4’-C亚甲基桥)、5'-甲基胞苷、2'-O-甲基-假尿苷,或其中磷酸核糖主链已被聚酰胺链(肽核酸)例如合成核糖核酸替代。在其它实施方案中,tru-gRNA序列的一个、一些或全部核苷酸可被修饰,例如锁定的(2’-O-4’-C亚甲基桥)、5'-甲基胞苷、2'-O-甲基-假尿苷,或其中磷酸核糖主链已被聚酰胺链(肽核酸)例如合成核糖核酸替代。在细胞背景中,Cas9与这些合成gRNA的复合物可用于提高CRISPR/Cas9核酸酶系统的全基因特异性。示例性经修饰或合成的tru-gRNA可包含下列序列或由下列序列组成:(X17-18或X17-19)GUUUUAGAGCUA(XN)(SEQIDNO:2404);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUG(XN)(SEQIDNO:2407);(X17-18或X17-19)GUUUUAGAGCUAUGCU(XN)(SEQIDNO:2408);(X17-18或X17-19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(SEQIDNO:1);(X17-18或X17-19)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(SEQIDNO:2);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(SEQIDNO:3);(X17-18)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(SEQIDNO:4)、(X17-18或X17-19)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:5);(X17-18或X17-19)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:6);或(X17-18或X17-19)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:7);其中X17-18或X17-19是分别与靶序列,优选地紧接前间区序列邻近基序(PAM)例如NGG、NAG或NNGG的5’的靶序列的17-18或17-19nt互补的序列,并且另外地其中核苷酸的一个或多个,例如,序列X17-18或X17-19内的一个或多个核苷酸,序列XN内的一个或多个核苷酸,或tru-gRNA的任何序列内的一个或多个核苷酸被锁定。XN是不干扰核糖核酸对Cas9的结合的任何序列,其中N(在RNA中)可以是0-200,例如,0-100、0-50或0-20。在一些实施方案中,作为用作终止RNAPolIII转录的终止信号的一个或多个T的任选的存在的结果,所述RNA在分子的3’末端包括一个或多个U,例如1至8个或更多个U(例如,U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)。虽然本文中描述的一些实例利用单一gRNA,但还也将所述方法与双重gRNA(例如在天然存在的系统中发现的crRNA和tracrRNA)一起使用。在该情况下,可将单一tracrRNA与多个不同的使用本系统表达的crRNA结合使用,例如下列序列:(X17-18或X17-19)GUUUUAGAGCUA(SEQIDNO:2404);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUG(SEQIDNO:2407);或(X17-18或X17-19)GUUUUAGAGCUAUGCU(SEQIDNO:2408);和tracrRNA序列。在该情况下,将crRNA在本文中描述的方法和分子中用作引导RNA,并且从相同或不同DNA分子表达tracrRNA。在一些实施方案中,所述方法包括将细胞与tracrRNA接触,所述tracrRNA包含如下序列或由所述序列组成:GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:8)或其活性部分(活性部分是保留与Cas9或dCas9形成复合物的能力的部分)。在一些实施方案中,可从其3’末端将tracrRNA分子截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35或40nt。在另一个实施方案中,可从其5’末端将tracrRNA截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35或40nt。或者,可从5’和3’末端将分子截短,例如,在5’末端截短至少1、2、3、4、5、6、7、8、9、10、15或20nt并且在3’末端截短至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35或40nt。除了SEQIDNO:8以外,示例性tracrRNA序列还包括下列序列:UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2405)或其活性部分;AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2407)或其活性部分;CAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2409)或其活性部分;UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUG(SEQIDNO:2410)或其活性部分;UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCA(SEQIDNO:2411)或其活性部分;或UAGCAAGUUAAAAUAAGGCUAGUCCG(SEQIDNO:2412)或其活性部分。在一些实施方案中,其中(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUG(SEQIDNO:2407)用作crRNA,使用下列tracrRNA:GGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:8)或其活性部分。在一些实施方案中,其中(X17-18或X17-19)GUUUUAGAGCUA(SEQIDNO:2404)用作crRNA,使用下列tracrRNA:UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2405)或其活性部分。在一些实施方案中,其中(X17-18或X17-19)GUUUUAGAGCUAUGCU(SEQIDNO:2408)用作crRNA,使用下列tracrRNA:AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:2406)或其活性部分。另外,在使用单独的crRNA和tracrRNA的系统中,其一种或两种可以是合成的并且包含一个或多个经修饰的(例如,锁定的)核苷酸或脱氧核糖核苷酸。在一些实施方案中,所述单一引导RNA和/或crRNA和/或tracrRNA可在3’末端上包括一个或多个腺嘌呤(A)或尿嘧啶(U)核苷酸。现有基于Cas9的RGN使用gRNA-DNA异源双链体形成来引导靶向目标基因组位点。然而,RNA-DNA异源双链体可形成比它们的DNA-DNA对应物更加混杂的范围的结构。实际上,DNA-DNA双链体对错配更加敏感,从而表明DNA引导的核酸酶可能不能容易地结合于脱靶序列,从而使得它们相较地比RNA引导的核酸酶更具特异性。因此,本文中描述的截短的引导RNA可以是杂交体,即,其中一个或多个脱氧核糖核苷酸例如短的DNA寡核苷酸替代gRNA的全部或部分,例如gRNA的互补区的全部或部分。该基于DNA的分子可替代单一gRNA系统中的gRNA的全部或部分或可选地可替代双重crRNA/tracrRNA系统中的crRNA的全部或部分。将DNA整合进互补区的此类系统应当因DNA-DNA双链体对错配的总体不耐受性而相较于RNA-DNA双链体更容易靶向期望的基因组DNA序列。用于产生此类双链体的方法在本领域中是已知的,参见,例如,Barker等,BMCGenomics.2005年4月22日;6:57;和Sugimoto等,Biochemistry.2000年9月19日;39(37):11270-81。示例性经修饰的或合成的tru-gRNA可包含下列序列或由下列序列组成:(X17-18或X17-19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCG(XN)(SEQIDNO:1);(X17-18或X17-19)GUUUUAGAGCUAUGCUGAAAAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(SEQIDNO:2);(X17-18或X17-19)GUUUUAGAGCUAUGCUGUUUUGGAAACAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUC(XN)(SEQIDNO:3);(X17-18或X17-19)GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(XN)(SEQIDNO:4)、(X17-18或X17-19)GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:5);(X17-18或X17-19)GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:6);或(X17-18或X17-19)GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQIDNO:7);其中X17-18或X17-19是分别与靶序列,优选地紧接前间区序列邻近基序(PAM)例如NGG、NAG或NNGG的5’的靶序列的17-18或17-19nt互补的序列,并且另外地其中核苷酸的一个或多个是脱氧核糖核苷酸,例如序列X17-18或X17-19内的一个或多个核苷酸,序列XN内的一个或多个核苷酸,或tru-gRNA的任何序列内的一个或多个核苷酸。XN是不干扰核糖核酸对Cas9的结合的任何序列,其中N(在RNA中)可以是0-200,例如,0-100、0-50或0-20。在一些实施方案中,作为用作终止RNAPolIII转录的终止信号的一个或多个T的任选的存在的结果,所述RNA在分子的3’末端包含一个或多个U,例如1至8个或更多个U(例如,U、UU、UUU、UUUU、UUUUU、UUUUUU、UUUUUUU、UUUUUUUU)。另外,在使用单独的crRNA和tracrRNA的系统中,其一者或两者可以是合成的并且包括一个或多个脱氧核糖核苷酸。在一些实施方案中,单一引导RNA或crRNA或tracrRNA在3’末端上包括一个或多个腺嘌呤(A)或尿嘧啶(U)核苷酸。在一些实施方案中,所述gRNA被靶向与基因组的其余部分中的任何序列相异至少3或更多个错配的位点以使脱靶效应减小至最小。所述方法可包括在细胞中表达,或将细胞与本文中所述的缩短的Cas9gRNA(tru-gRNA)(任选地经修饰的tru-gRNA或DNA/RNA杂交tru-gRNA)加可被所述缩短的Cas9gRNA例如Cas9核酸酶(例如,如在Mali等中描述的)、Cas9切口酶(如Jinek等,2012中描述的);或dCas9-异功能结构域融合物(dCas9-HFD)引导的核酸酶接触。Cas9许多细菌表达Cas9蛋白变体。来自化脓性链球菌(Streptococcuspyogenes)的Cas9是目前最常使用的;一些另外的Cas9蛋白与化脓性链球菌Cas9具有高水平的序列同一性,并且使用相同的引导RNA。其它的更加多样,使用不同的gRNA,并且同样地识别不同的PAM序列(与由RNA指定的序列相邻的由蛋白质指定的2-5个核苷酸的序列)。Chylinski等将来自一大组细菌的Cas9蛋白分类(RNABiology10:5,1–12;2013),并且许多Cas9蛋白列于补充图1和其补充表1中,所述图表通过引用并入本文。另外的Cas9蛋白描述于Esvelt等,NatMethods.2013年11月;10(11):1116-21和Fonfara等,“PhylogenyofCas9determinesfunctionalexchangeabilityofdual-RNAandCas9amongorthologoustypeIICRISPR-Cassystems.”NucleicAcidsRes.2013年11月22日中。[先于印刷的电子出版]doi:10.1093/nar/gkt1074。许多物种的Cas9分子可用于本文中描述的方法和组合物。虽然化脓性链球菌和嗜热链球菌Cas9分子是本文中的许多公开内容的主题,但同样地可使用本文中所列的其它物种的Cas9分子、来源于或基于所述物种的Cas9蛋白的Cas9分子。换句话说,虽然本文中的许多描述使用化脓性链球菌和嗜热链球菌Cas9分子,但来自其它物种的Cas9分子可替代它们。此类物种包括下表中所示的那些物种,所述表是基于Chylinski等,2013的补充图1产生的。本文中描述的构建体和方法包括任何那些Cas9蛋白以及它们对应的引导RNA或相容的其它引导RNA的使用。也已显示来自嗜热链球菌LMD-9CRISPR1系统的Cas9在Cong等(Science339,819(2013))中的人细胞中起作用。来自奈瑟氏脑膜炎球菌的Cas9直系同源物描述于Hou等,ProcNatlAcadSciUSA.2013年9月24日;110(39):15644-9和Esvelt等,NatMethods.2013年11月;10(11):1116-21中。另外,Jinek等人在体外显示来自嗜热链球菌和英诺克李斯特菌(L.innocua)(但非来自奈瑟氏脑膜炎球菌或空肠弯曲菌(C.jejuni)的Cas9直系同源物(其可使用不同的引导RNA)可被双重化脓性链球菌gRNA导向裂解靶质粒DNA,虽然效率略有降低。在一些实施方案中,本系统利用来自化脓性链球菌的Cas9蛋白(如在细菌中编码的或针对在哺乳动物细胞中的表达进行密码子最优化的),其在D10、E762、H983或D986和H840或N863上含有突变,例如D10A/D10N和H840A/H840N/H840Y,以使得蛋白的核酸酶部分催化失活;这些位置上的取代可以是丙氨酸(如它们在Nishimasu等,Cell156,935–949(2014)中一样)或它们可以是其它残基,例如谷氨酰胺、天冬酰胺、酪氨酸、丝氨酸或天冬氨酸,例如,E762Q、H983N、H983Y、D986N、N863D、N863S或N863H(图1C)。可用于本文中描述的方法和组合物的自由化来活的化脓性链球菌Cas9的序列如下;D10A和H840A的示例性突变以粗体表示并加以下划线。在一些实施方案中,本文中使用的Cas9核酸酶与化脓性链球菌Cas9的序列具有至少约50%的同一性,即与SEQIDNO:33具有至少50%的同一性。在一些实施方案中,所述核苷酸序列与SEQIDNO:33具有约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%的同一性。在一些实施方案中,与SEQIDNO:33的任何差异存在于非保守区,如通过Chylinski等,RNABiology10:5,1–12;2013(例如,在补充图1及其补充表1中);Esvelt等,NatMethods.2013年11月;10(11):1116-21和Fonfara等,Nucl.AcidsRes.(2014)42(4):2577-2590中所示的序列的序列比对鉴定的。[2013年11月22日先于印刷的电子版]doi:10.1093/nar/gkt1074。为了测定两个序列的百分比同一性,为了最佳比较目的,将所述序列比对(可根据需要在第一和第二氨基酸或核酸序列的一个或两个序列中引入缺口以进行最佳比对,并且为了比较目的可忽略非同源序列)。为了比较目的比对的参照序列的长度为至少50%(在一些实施方案中,约50%、55%、60%、65%、70%、75%、85%、90%、95%或100%的参照序列的长度被比对)。随后比较对应位置上的核苷酸或残基。当第一序列中的位置被与第二序列中的对应位置相同的核苷酸或残基占据时,则所述分子在该位置上是相同的。两个序列之间的百分比同一性是由序列序列共享的相同位置的数目的函数,该函数考虑了为一两个序列的最佳比对而需要引入的缺口数目和每一个缺口的长度。序列的比较和两个序列之间的百分比同一性的测定可使用数学算法来实现。为了本申请的目的,两个氨基酸序列之间的百分比同一性使用Needleman和Wunsch((1970)J.Mol.Biol.48:444-453)算法,使用Blossum62评分矩阵,利用为12的缺口罚分、为4的缺口延伸罚分和为5的移码缺口罚分来测定,该算法已被整合进GCG软件包中的GAP程序。Cas9-HFDCas9-HFD描述于2013年3月15日提交的美国临时专利申请USSN61/799,647、2013年6月21日提交的USSN61/838,148和PCT国际申请第PCT/US14/27335号(所述临时专利申请和PCT国际申请全部通过引用整体并入本文)中。Cas9-HFD通过将异源功能性结构域(例如,例如来自VP64或NF-κBp65的转录激活结构域)与无催化活性的Cas9蛋白(dCas9)的N末端或C末端融合来生成。在本情况下,如上所指出的,dCas9可来自任何物种,但优选来自化脓性链球菌,在一些实施方案中,Cas9在D10和H840残基中含有突变例如D10N/D10A和H840A/H840N/H840Y以使得蛋白质的核酸酶部分无催化活性,例如如上文中的SEQIDNO:33中显示的。可在Cas9的N或C末端上融合转录激活结构域。另外地,尽管本说明书举例说明转录激活结构域,但还可使用如在本领域中是已知的其它异源功能性结构域(例如,转录阻遏物(例如,KRAB、ERD、SID和其它,例如ets2阻遏因子(ERF)阻遏结构域(ERD)的氨基酸473–530、KOX1的KRAB的结构域的氨基酸1–97或MadmSIN3相互作用结构域(SID)的氨基酸1–36;参见Beerli等,PNASUSA95:14628-14633(1998))或沉默子诸如异染色质蛋白1(HP1,也称为swi6),例如HP1α或HP1β;可招募与固定的RNA结合序列诸如被MS2衣壳蛋白、内切核糖核酸酶Csy4或λN蛋白结合的那些序列融合的长的非编码RNA(lncRNA)的蛋白质或肽;修饰DNA的甲基化状态的酶(例如,DNA甲基转移酶(DNMT)或TET蛋白);或修饰组蛋白亚单位的酶(例如,组蛋白乙酰转移(HAT)、组蛋白脱乙酰酶(HDAC)、组蛋白甲基转移酶(例如,用于赖氨酸或精氨酸残基的甲基化)或组蛋白脱甲基酶(例如,用于赖氨酸或精氨酸残基的脱甲基化))。此类结构域的许多序列在本领域中是已知的,例如,催化DNA中的甲基化半胱氨酸的羟化的结构域。示例性蛋白包括10-11-易位(TET)1-3家族,将DNA中的5-甲基胞嘧啶(5-mC)转化成5-羟甲基胞嘧啶(5-hmC)的酶。人TET1-3的序列在本领域中是已知的并且示于下表中:*变体(1)代表较长的转录物并且编码较长的同种型(a)。变体(2)与变体1在5'UTR和3'UTR中以及在编码序列中不同。所得的同种型(b)是较短的并且相较于同种型a具有不同的C末端。在一些实施方案中,可包括催化结构域的全长序列的全部或部分,例如包含富含半胱氨酸的延伸和由7个高度保守的外显子编码的2OGFeDO结构域,例如包含氨基酸1580-2052的Tet1催化结构域、包含氨基酸1290-1905的Tet2和包含氨基酸966-1678的Tet3的催化模块。关于举例说明所有3个Tet蛋白中的至关重要的催化残基的比对,参见,例如,Iyer等,CellCycle.2009年6月1日;8(11):1698-710.Epub2009年6月27日的图1,并且关于全长序列(参见,例如,seq2c),参见其补充材料(可在ftp站点ftp.ncbi.nih.gov/pub/aravind/DONS/supplementary_material_DONS.html获得);在一些实施方案中,所述序列包括Tet1的氨基酸1418-2136或Tet2/3中的对应区域。其它催化分子可来自由Iyer等,2009鉴定的蛋白质。在一些实施方案中,异源性功能结构域是生物系链,并且包含MS2衣壳蛋白、内切核糖核酸酶Csy4或λN蛋白的全部或部分(例如来自其的DNA结合结构域)。这些蛋白可用于将含有特定茎环结构的RNA分子招募至由dCas9gRNA靶向序列指定的场所。例如,与MS2衣壳蛋白、内切核糖核酸酶Csy4或λN融合的dCas9可用于招募长的非编码RNA(lncRNA)诸如XIST或HOTAIR;参见,例如,Keryer-Bibens等,Biol.Cell100:125–138(2008),其连接于Csy4、MS2或λN结合序列。或者,可将Csy4、MS2或λN蛋白结合序列连接于另一种蛋白质,如Keryer-Bibens等(同上)中描述的,并且可使用本文中描述的方法和组合物将所述蛋白质靶向dCas9结合位点。在一些实施方案中,Csy4是无催化活性的。在一些实施方案中,融合蛋白包括dCas9与异源功能性结构域之间的接头。可用于这些融合蛋白中(或串联结构中的融合蛋白之间)的接头可包括不干扰融合蛋白的功能的任何序列。在优选实施方案中,所述接头是短的,例如2-20个氨基酸,并且通常是柔性的(即,包含具有高度自由的氨基酸诸如甘氨酸、丙氨酸和丝氨酸)。在一些实施方案中,所述接头包含一个或多个由GGGS(SEQIDNO:34)或GGGGS(SEQIDNO:35)组成的单位,例如,2、3、4或更多个GGGS(SEQIDNO:34)或GGGGS(SEQIDNO:35)单位的重复。还可使用其它接头序列。表达系统为了使用描述的引导RNA,可能期望从编码它们的核酸表达它们。这可以以多种方式来进行。例如,可将编码引导RNA的核酸克隆入用于转化进用于复制和/或表达的原核或真核细胞的中间载体。中间载体通常是原核载体,例如,质粒或穿梭载体或昆虫载体,其用于贮存或操纵编码引导RNA的核酸以用于引导RNA的产生。还可将编码引导RNA的核酸克隆入表达载体,例如用于向植物细胞、动物细胞,优选地哺乳动物细胞或人细胞、真菌细胞、细菌细胞或原生动物细胞施用。为了获得表达,通常将编码引导RNA的序列亚克隆入含有指导转录的启动子的表达载体。合适的细菌和真核启动子在本领域中是公在的,并且描述于例如Sambrook等,MolecularCloning,ALaboratoryManual(2001年第3版);Kriegler,GeneTransferandExpression:ALaboratoryManual(1990)和CurrentProtocolsinMolecularBiology(Ausubel等,编辑,2010)中。用于表达工程化蛋白质的细菌表达系统可在例如大肠杆菌(E.coli)、芽孢杆菌属(Bacillussp.)和沙门菌属(Salmonella)(Palva等,1983,Gene22:229-235)中获得。此类表达系统的试剂盒是商购可得的。用于哺乳动物细胞、酵母和昆虫细胞的真核表达系统在本领域中是公知的并且也是商购可得的。用于指导核酸表达的启动子取决于具体应用。例如,强组成型启动子通常用于融合蛋白的表达和纯化。相反地,当将体内施用引导RNA以进行基因调控时,可使用组成型或诱导型启动子,这取决于引导RNA的具体用途。另外,用于施用引导RNA的优选启动子可以是弱启动子,诸如HSVTK或具有类似活性的启动子。启动子还可包括响应反式激活的元件,例如,缺氧应答元件、Gal4应答元件、lac阻遏应答元件和小分子控制系统诸如四环素调节的系统和RU-486系统(参见,例如,Gossen&Bujard,1992,Proc.Natl.Acad.Sci.USA,89:5547;Oligino等,1998,GeneTher.,5:491-496;Wang等,1997,GeneTher.,4:432-441;Neering等,1996,Blood,88:1147-55和Rendahl等,1998,Nat.Biotechnol.,16:757-761)。除了启动子以外,表达载体通常还含有包含核酸在宿主细胞(原核或真核的)中表达所需的所有另外的元件的转录单位或表达盒。常见表达盒从而含有可操作地连接于例如编码gRNA的核酸序列的启动子和例如进行转录物的高效多腺苷酸化、转录终止、核糖体结合位点或翻译终止的所需的任何信号。表达盒的另外元件可包括例如增强子和异源剪接内含子信号。根据gRNA的期望用途(例如,在植物、动物、细菌、真菌、原生动物等中表达)选择用于将遗传信息转运至细胞的特定表达载体。标准细菌表达载体包括质粒诸如基于pBR322的质粒、pSKF、pET23D和商购可得的靶-融合表达系统诸如GST和LacZ。含有来自真核病毒的调控元件的表达载体通常用于真核表达载体,例如,SV40载体、乳头状瘤病毒载体和来源于爱泼斯坦-巴尔病毒的载体。其它示例性真核载体包括pMSG、pAV009/A+、pMTO10/A+、pMAMneo-5、杆状病毒pDSVE和允许在如下启动子指导下表达蛋白质的任何其它载体:SV40早期启动子、SV40晚期启动子、金属硫蛋白启动子、鼠乳腺肿瘤病毒动子、劳斯肉瘤病毒启动子、多角体蛋白启动子或经显示对于在真核细胞中的表达是有效的其它启动子。用于表达引导RNA的载体可包括驱动引导RNA表达的RNAPolIII启动子,例如H1、U6或7SK启动子。这些人启动子允许在质粒转染后在哺乳动物细胞中表达gRNA。或者,T7启动子可用于例如体外转录,并且所述RNA可被体外转录和纯化。可使用适合用于短的RNA例如siRNA、shRNA或其它小的RNA表达的载体。一些表达系统具有用于选择稳定地转染的细胞系的标志物诸如胸苷激酶、潮霉素B磷酸物转移酶和二氢叶酸还原酶。高产表达系统也是合适的,诸如在昆虫细胞中使用杆状病毒载体,利用在多角体蛋白启动子或其它强杆状病毒启动子的指导下的gRNA编码序列。通常被包括在表达载体中的元件还包括在大肠杆菌中起作用的复制子、编码抗生素抗性以允许选择具有重组质粒的细菌的基因和允许重组序列插入的质粒的非必需区中的独特限制性位点。标准转染法可用于产生表达大量蛋白质的细菌、哺乳动物、酵母或昆虫细胞系,随后使用标准技术(参见,例如,Colley等,1989,J.Biol.Chem.,264:17619-22;GuidetoProteinPurification,于MethodsinEnzymology,第182卷(Deutscher,编辑,1990)中)纯化所述蛋白质。真核和原核细胞的转化按照标准技术(参见,例如,Morrison,1977,J.Bacteriol.132:349-351;Clark-Curtiss&Curtiss,MethodsinEnzymology101:347-362(Wu等,编辑,1983)来进行。可使用用于将外来核苷酸序列引入宿主细胞的任何已知方法。这些方法包括使用磷酸钙转染、聚凝胺、原生质体融合、电穿孔、核转染、脂质体、显微注射、裸DNA、质粒载体、病毒载体(游离型和融合型)和用于将克隆的基因组DNA、cDNA、合成DNA或其它外来遗传物质引入宿主细胞的任何其它公知的方法(参见,例如,Sambrook等,同上)。唯一必需的是,使用的特定遗传工程方法能够成功地将至少一个基因引入能够表达gRNA的宿主细胞。本发明包括所述载体和包含所述载体的细胞。实施例在下列实施例中进一步描述本发明,所述实施例不限制权利要求中描述的本发明的范围。实施例1.评估RNA引导的内切核酸酶的特异性CRISPRRNA引导的核酸酶(RGN)已迅速形成为用于基因组编辑的轻便高效的平台。本实施例描述基于人细胞的报告测定用于表征基于Cas9的RGN的脱靶裂解的用途。材料和方法下列材料和方法用于实施例1中。引导RNA的构建将具有用于Cas9靶向的可变20nt序列的DNA寡核苷酸(表A)退火以产生具有与至BsmBI-消化的质粒pMLM3636中的连接相容4bp悬突的短的双链DNA片段。这些退火的寡核苷酸的克隆产生编码在U6启动子的表达下的具有20个可变5’核苷酸的嵌合+103单链引导RNA的质粒(Hwang等,NatBiotechnol31,227-229(2013);Mali等,Science339,823-826(2013))。用于本研究的pMLM3636和表达质粒pJDS246(编码Cas9的密码子最优化的形式)都可通过非营利质粒的分销服务Addgene(addgene.org/crispr-cas)获得。用于产生编码被靶向EGFP报告基因中的位点的单一gRNA/变体单一gRNA和被靶向6个内源人基因靶的单一gRNA的表达质粒的寡核苷酸的序列。#,SEQIDNO:。EGFP活性测定如先前所述(Reyon等,NatBiotech30,460-465(2012))培养具有单个整合的拷贝的EGFP-PEST融合基因的U2OS.EGFP细胞。为了进行转染,按照制造商的方案,使用SE细胞系4D-NucleofectorTMX试剂盒(Lonza),利用指定量的sgRNA表达质粒和pJDS246与30ng的Td-Tomato-编码质粒一起对200,000个细胞进行核转染。使用BDLSRII流式细胞仪在转染后2天分析细胞。以一式三份进行最优化gRNA/Cas9质粒浓度的转染,并且以一式二份进行所有其它转染。内源人基因组位点的PCR扩增和序列验证使PhusionHotStartII高保真DNA聚合酶(NEB),利用表B中所列的PCR引物和条件进行PCR反应。采用降落PCR(98℃,10秒;72–62℃;-1℃/循环,15秒;72℃,30秒]10个循环,[98℃,10秒;62℃,15秒;72℃,30秒]25个循环)成功地扩增大多数基因座。必要时,在68℃或72℃的恒定退火温度下和3%DMSO或1M甜菜碱中进行用于其余靶的PCR,进行35个循环。在QIAXCEL毛细管电泳系统上分析PCR产物以验证大小和纯度。利用ExoSap-IT(Affymetrix)处理验证的产物,并通过Sanger法(MGHDNASequencingCore)对所述产物进行测序以验证每一个靶位点。人细胞中的RGN诱导的中靶和脱靶突变频率的测定对于U2OS.EGFP和K562细胞,按照制造商的方案(Lonza),使用4DNucleofector系统,用250ng的gRNA表达质粒或空U6启动子质粒(用于阴性对照)、750ngCas9表达质粒和30ng的td-Tomato表达质粒转染2x105个细胞。对于HEK293细胞,按照制造商的方案(LifeTechnologies),使用LipofectamineLTX试剂,利用125ng的gRNA表达质粒或空U6启动子质粒(用于阴性对照)、375ng的Cas9表达质粒和30ng的td-Tomato表达质粒转染1.65x105个细胞。按照制造商的说明书,使用QIAampDNABloodMini试剂盒(QIAGEN)从转染的U2OS.EGFP、HEK293或K562细胞细胞收获基因组DNA。为了产生足够的基因组DNA以扩增脱靶候选位点,将来自3个核转染(对于U2OS.EGFP细胞)、2个核转染(对于K562细胞)或2个脂质体LTX转染的DNA混合在一起,随后进行T7EI。对于每一个测试的条件,该过程进行2次,从而产生一式两份代表总共4或6个单独的转染的基因组DNA的混合物。随后如上所述使用这些基因组DNA作为模板进行PCR,随后按照制造商的说明书使用AmpureXP珠(Agencourt)进行纯化。如先前所述(Reyon等,2012,同上)进行T7EI测定。NHEJ介导的插入缺失突变的DNA测序将用于T7EI测定的纯化的PCR产物克隆入ZeroBluntTOPO载体(LifeTechnologies),利用MGHDNAAutomationCore,使用碱裂解小量制备法分离质粒DNA。随后利用Sanger法(MGHDNASequencingCore),使用M13正向引物(5’–GTAAAACGACGGCCAG–3’(SEQIDNO:1059)对质粒进行测序。实施例1a.单核苷酸错配为了开始确定人细胞中的RGN的特异性决定簇,进行大规模测试来评估多个gRNA/靶DNA界面内的系统性错配的不同位置的效应。为了进行该测定,使用先前描述的(参见上述方法和Reyon等,2012,同上)基于人细胞的定量提高绿色荧光蛋白(EGFP)破坏测定,该测定使得能够快速定量靶向核酸酶活性(图2B)。在该测定中,被靶向单一整合的EGFP报告基因的核酸酶的活性可通过评估通过灭活移码插入/缺失(插入缺失)突变(通过核酸酶诱导的双链断裂(DSB)的易错非同源末端连接(NHEJ)修复引起的)引起的人U2OS.EGFP细胞中的荧光信号的损失来定量(图2B)。为了进行此处描述的研究,使用如下被靶向EGFP内的不同序列的三个~100nt的单一gRNA:EGFP位点1GGGCACGGGCAGCTTGCCGGTGG(SEQIDNO:9)EGFP位点2GATGCCGTTCTTCTGCTTGTCGG(SEQIDNO:10)EGFP位点3GGTGGTGCAGATGAACTTCAGGG(SEQIDNO:11)这些gRNA中的每一个可高效地引导Cas9介导的EGFP表达的破坏(参见实施例1e和2a,以及图3E(顶)和3F(顶))。在最初的实验中,测试3个EGFP-靶向gRNA的互补靶向区中的20个核苷酸中的19个核苷酸上的单核苷酸错配的效应。为进行该测定,产生针对3个在位置1至19(以3’至5’方向编号1至20;参见图1)上具有沃尔森-克里克颠换错配的靶位点的每一个的变体gRNA,并且测试这些不同的gRNA在测试的人细胞中引导Cas9介导的EGFP破坏的能力(未产生在位置20上具有取代的变体gRNA,因为该核苷酸为U6启动子序列的部分,从而必须保留鸟嘌呤来避免影响表达)。对EGFP靶位点#2,gRNA的位置1-10中的单个错配对相关Cas9活性具有显著作用(图2C,中图),与表明相较于3’末端上的错配,gRNA的5’末端上的错配被更好地被耐受的先前研究一致(Jiang等,NatBiotechnol31,233-239(2013);Cong等,Science339,819-823(2013);Jinek等,Science337,816-821(2012))。然而,对于EGFP靶位点#1和#3,gRNA中除少数位置外所有位置上的单个错配似乎被良好地耐受,即使在序列的3’末端内亦如此。此外,对错配敏感的特定位置对于两个靶是不同的(图2C,比较顶图与底图)–例如,靶位点#1对位置2上的错配特别敏感,而靶位点#3对于位置1和8上的错配是最敏感的。实施例1b.多个错配为了测试gRNA/DNA界面上的不止一个错配的效应,在相邻和分开的位置中产生一系列具有双沃尔森-克里克颠换错配的变体gRNA,并使用EGFP破坏测定在人细胞中测试这些gRNA引导Cas9核酸酶活性的能力。所有三个靶位点通常显示更大的对双改变的敏感性,在所述双改变中一个或两个错配存于gRNA靶向区域的3’半部分内。然而,这些效应的量级显示位点特异性变化,靶位点#2显示最大的对这些双错配的敏感性,并且靶位点#1通常显示最小的敏感性。为了测试可被耐受的相邻错配的数目,构建在gRNA靶向区的5’末端中具有在位置19至15的范围内的递增数目的错配位置的变体gRNA(其中单和双错配似乎被更好地耐受)。这些递增错配的gRNA的测试显示对于所有3个靶位点,3个或更多个相邻错配的引入导致RGN活性的显著丧失。当从5’末端的位置19开始,朝向3’末端添加更多错配时,对于3个不同的EGFP靶向gRNA,发生活性的突然下降。具体地,在位置19和19+18上含有错配的gRNA显示基本上完全的活性,然而在位置19+18+17、19+18+17+16和19+18+17+16+15上具有错配的那些显示相对于阴性对照基本上无差异(图2F)。(注意,我们在这些变体gRNA中在位置20上不错配,因为该位置需要保留来作为G,因为其为驱动gRNA的表达的U6启动子的部分)。在下列实验中获得缩短gRNA互补性可导致具有更大特异性的RGN的另一个证据:对于4个不同的EGFP靶向gRNA(图2H),在位置18和19上引入双错配不显著影响活性。然而,在位置10和11上引入另一个双错配然后进入这些gRNA导致活性几乎完全丧失。有趣地,仅10/11双错配的引入通常对活性没有同样巨大的影响。综上所述,人细胞中的这些结果确认了RGN的活性可对gRNA靶向序列的3’半部分中的错配更敏感。然而,所述数据还明确地显示RGN的特异性是复杂的并且是靶位点依赖性的,单和双错配通常被良好地耐受,即使当一个或多个错配存在于gRNA靶向区域的3’半部分中时。此外,这些数据还表明并非gRNA/DNA界面的5’半部分中的所有错配都一定被良好耐受。另外,这些结果强有力表明具有较短的互补性区域(具体地~17nt)的gRNA在它们的活性上具有更大的特异性。我们指出,与由PAM序列赋予的2nt的特异性组合的17nt的特异性导致19bp序列(在大的复杂基因组诸如在人细胞中发现的那些基因组中是唯一的足够长度之一)的特异性。实施例1c.脱靶突变为了确定针对被靶向内源人基因的RGN的脱靶突变是否可被鉴定,使用靶向VEGFA基因中的3个不同位点、EMX1基因中的一个位点、RNF2基因中的一个位点和FANCF基因中的一个位点的6个单一gRNA(表1和表A)。这6个gRNA在人U2OS.EGFP细胞中在它们各自的内源基因座上高效地引导Cas9介导的插入缺失,如通过T7内切核酸酶I(T7EI)测定(上述方法和表1)检测的。对这6个RGN的每一个,我们随后在U2OS.EGFP细胞中针对核酸酶诱导的NHEJ介导的插入缺失突变检查成打的潜在脱靶位点(数目在46至多至64的范围内)。被评估的基因座包括相异在于1或2个核苷酸的所有基因组位点,以及成亚组的差异在于3至6个核苷酸并且具有朝向在gRNA靶向序列的5’半部分中具有这些错配中的一个或多个的那些位点的偏向性的基因组位点(表B)。通过使用T7EI测定,容易地鉴定了针对VEGFA位点1的4个脱靶位点(所检查的53个候选位点中的)、针对VEGFA位点2的12个脱靶位点(所检查的46个中的)、针对VEGFA位点3的7个脱靶位点(所检查的64个中的)和针对EMX1位点的1个脱靶位点(所检查的46个中的)(表1和表B)。在分别针对RNF2或FANCF基因检查的43个和50个潜在位点中未检测到脱靶突变(表B)。经验证的脱靶位点上的突变率非常高,在期望的靶位点上观察到在5.6%至125%(40%的平均值)的范围内的突变率(表1)。这些真正的脱靶包括在靶位点的3’末端具有错配并且具有多至总共5个错配的序列,大多数脱靶位点存在于蛋白质编码基因内(表1)。一个亚组的脱靶位点的DNA测序提供插入缺失突变存在于预期的RGN裂解位点上的另外的分子构象(图8A-C)。表1由被针对内源人基因设计的RGN诱导的中靶和脱靶突变“OT”表示脱靶位点(位点编号如表E中一样)。来自中靶的错配(在与gRNA杂交的20bp区域内)以粗体加下划线的文本突出显示。如方法中所述测定U2OS.EGFP、HEK293和K562细胞中的平均插入缺失突变频率。显示了位点(如果有的话)所位于的基因。所列的所有位点在Cas9表达质粒和不表达功能性gRNA的对照U6启动子质粒转染的细胞中都未显示任何修饰的证据。N.D.=未检测到;---=未测试的。实施例1d.其它细胞类型中的脱靶突变在已确定RGN可在U2OS.EGFP细胞中以高频率诱导脱靶突变后,我们随后设法确定这些核酸酶是否在其它类型的人细胞中也具有这些效应。我们已选择U2OS.EGFP细胞用于我们的初始实验,因为我们先前使用这些细胞来评价TALEN15的活性,但人HEK293和K562细胞已被更广泛地用于测试靶向核酸酶的活性。因此,我们还在HEK293和K562细胞中评估被靶向VEGFA位点1、2和3以及EMX1位点的4个RGN的活性。我们发现,在这两个另外的人细胞系中,这4个RGN中的每一个在它们期望的中靶位点上高效地诱导NHEJ介导的插入缺失突变(如通过T7EI测定法测定的)(表1),虽然具有比在U2OS.EGFP细胞中观察到的突变频率稍微更低的突变频率。最初在U2OS.EGFP细胞中鉴定的这4个RGN的24个脱靶位点的评估显示许多位点在HEK293和K562细胞中再次以与在对应的中靶位点上的频率相似的频率被突变(表1)。如所预期的,一个亚组的来自HEK293细胞的这些脱靶位点的DNA测序提供改变在预期的基因组基因座上发生的另外的分子证据(图9A-C)。我们出于某种因不知道为什么在HEK293细胞中有4个在U2OS.EGFP细胞中鉴定的脱靶位点以及在K562细胞中有11个所述脱靶序列未显示可检测的突变。然而,我们要指出,这些脱靶位点中的许多位点在U2OS.EGFP细胞中也显示相对较低的突变频率。因此,我们推测这些位点在HEK293和K562细胞中的突变率可落在我们的T7EI测定的可靠检测限(~2-5%)下方,因为在我们的实验中,RGN通常似乎在HEK293和K562细胞中相较于U2OS.EGFP细胞具有较低的活性。综上所述,我们在HEK293和K562细胞中的结果提供了我们对于RGN观察到的高频脱靶突变将为在多个人细胞类型中看到的一般现象的证据。实施例1e.用于EGFP破坏测定的表达gRNA和Cas9的质粒的量的滴定产生针对位于EGFP核苷酸502上游(在其上通过非同源末端连接引入移码突变可强烈地破坏EGFP的表达的位置)的3个不同序列(上文中显示的EGFP位点1-3)的单一gRNA(Maeder,M.L.等,MolCell31,294-301(2008);Reyon,D.等,NatBiotech30,460-465(2012))。对于所述3个靶位点的每一个,最初将一系列表达gRNA的质粒的量(12.5至250ng)与750ng表达Cas9核酸酶的密码子最优化形式的质粒一起转染进我们的U2OS.EGFP报告细胞,所述细胞具有单拷贝的组成型表达的EGFP-PEST报告基因。所有3个RGN在编码gRNA的质粒的最高浓度(250ng)上高效地破坏EGFP表达(图3E(顶))。然而,当转染较少量的表达gRNA的质粒时,针对靶位点#1和#3的RGN显示等同水平的破坏,而当降低转染的表达gRNA的质粒的量时,RGN在靶位点#2上的活性立即下降(图3E(顶))。滴定在转染进我们的U2OS.EGFP报告细胞的编码Cas9的质粒的量(在50ng至750ng的范围内),并测定EGFP破坏。如图3F(顶)中显示的,靶位点#1耐受转染的表达Cas9的质粒的量的3倍降低而无EGFP破坏活性的显著丧失。然而,RGN靶向靶位点#2和#3的活性随着转染的Cas9质粒的量的3倍降低而立即降低(图3F(顶))。基于这些结果,分别将25ng/250ng、250ng/750ng和200ng/750ng的表达gRNA的质粒/表达Cas9的质粒用于EGFP靶位点#1、#2和#3,以进行实施例1a-1d中描述的实验。一些gRNA/Cas9组合在破坏EGFP表达中表现比其它组合好的原因还不清楚,这些组合中的一些组合对用于转染的质粒的量更敏感或不太敏感的原因也不清楚。虽然对于这3个gRNA,存在于基因组中的脱靶位点的范围有可能影响它们的每一个的活性,但对于这些特定的靶位点的每一个,在相异在于1至6bp的基因组位点的数目上未看到差异(表C),所述差异可解释3个gRNA的差异行为。表C针对被靶向内源人基因的6个RGN和被靶向EGFP报告基因的3个RGN的人基因组中的脱靶位点的数目在人基因组序列构建GRCh37中鉴定了被靶向VEGFA、RNF2、FANCF和EMX1基因的6个RGN和被靶向EGFP靶位点#1、#2和#3的3个RGN的每一个的脱靶位点。仅允许在与gRNA退火的20nt区域中但不允许在PAM序列中存在错配。实施例2:缩短gRNA互补长度以提高RGN裂解特异性假设RGN的脱靶效应可只通过缩短gRNA-DNA界面的长度(起初可能似乎违反直觉的方法)减小至最小而不削弱中靶活性。较长的gRNA实际上在中靶位点上的功能可不太有效(参见下文和Hwang等,2013a;Ran等,2013)。相反地,如在上文实施例1中显示的,在它们的5’末端具有多个错配的gRNA仍然可诱导它们的靶位点的强劲裂解(图2A和2C-2F),这表明这些核苷酸可能不是完全中靶活性所需的。因此,假设缺乏这些5’核苷酸的截短的gRNA可能显示可与全长gRNA相当的活性(图2A)。据推测,如果全长gRNA的5’核苷酸不是中靶活性所需的,则它们的存在可能也补偿沿着gRNA-靶DNA界面的其它位置上的错配。如果这是真的,假设gRNA可能具有更大的对错配的敏感性,从而可能也诱导显著较低水平的Cas9介导的脱靶突变(图2A)。实验程序将下列实验程序用于实施例2。质粒构建通过设计、合成具有互补区的寡核苷酸(IDT),使其退火并将成对的所述寡核苷酸克隆入上述(实施例1)质粒pMLM3636(可从Addgene获得)中来装配所有gRNA表达质粒。所得的gRNA表达载体编码其表达由人U6启动子驱动的~100ntgRNA。用于构建gRNA表达载体的所有寡核苷酸的序列示于表D中。通过使用QuikChange试剂盒(AgilentTechnologies)利用下列引物突变质粒pJDS246来产生在RuvC内切核酸酶结构域中具有突变的Cas9D10A切口酶表达质粒(pJDS271):Cas9D10A有义引物5’-tggataaaaagtattctattggtttagccatcggcactaattccg-3’(SEQIDNO:1089);Cas9D10A反义引物5’-cggaattagtgccgatggctaaaccaatagaatactttttatcca-3’(SEQIDNO:1090)。用于本研究的所有靶向gRNA质粒和Cas9切口酶质粒可通过非营利质粒的分销服务Addgene(addgene.org/crispr-cas)获得。基于人细胞的EGFP破坏测定先前(Reyon等,2012)已描述了具有单拷贝整合的EGFP-PEST报告基因的U2OS.EGFP细胞。将这些细胞维持在补充有10%FBS、2mMGlutaMax(LifeTechnologies)、青霉素/链霉素和400μg/mlG418的高级DMEM(LifeTechnologies)中。为了测定EGFP表达的破坏,按照制造商的说明书,使用LONZA4D-NucleofectorTM,利用SE溶液和DN100程序,用gRNA表达质粒或空U6启动子质粒(作为阴性对照)、Cas9表达质粒(pJDS246)(实施例1和Fu等,2013)和10ng的td-Tomato表达质粒(以控制转染效率)以一式两份转染2x105个U2OS.EGFP细胞。我们将25ng/250ng、250ng/750ng、200ng/750ng和250ng/750ng的gRNA表达质粒/Cas9表达质粒分别用于利用EGFP位点#1、#2、#3和#4的实验。转染后2天,用胰蛋白酶处理细胞,随后将细胞重悬浮于补充有10%(体积/体积)胎牛血清(FBS)的Dulbecco改良的Eagle培养基(DMEM,Invitrogen)中,并在BDLSRII流式细胞仪上分析所述细胞。对于每一个样品,以一式二份进行转染和流式细胞术测量。人细胞的转染和基因组DNA的分离为了评估由被靶向内源人基因的RGN诱导的中靶和脱靶插入缺失突变,使用下列条件将质粒转染进U2OS.EGFP或HEK293细胞:使用与针对上述EGFP破坏测定的条件相同的条件转染U2OS.EGFP细胞。通过在37℃下于CO2培养箱中,在补充有10%FBS和2mMGlutaMax(LifeTechnologies)的高级DMEM(LifeTechnologies)中将它们以1.65×105个细胞/孔的密度接种在24孔板中来转染HEK293细胞。在22-24小时的孵育后,按照制造商的说明书(LifeTechnologies)使用脂质体LTX试剂,用125nggRNA表达质粒或空U6启动子质粒(作为阴性对照)、375ngCas9表达质粒(pJDS246)(实施例1和Fu等,2013)和10ngtd-Tomato表达质粒转染细胞。转染后16小时更换培养基。对于两种类型的细胞,按照制造商的说明书,使用AgencourtDNAdvance基因组DNA分离试剂盒(Beckman)在转染后2天收获基因组DNA。对于待测定的每一个RGN样品,进行12个单独的4D转染重复,对于这12个转染的每一个分离基因组在DNA,随后将这些样品组合以产生两个“一式二份”混合物,每一个混合物由6个混合的基因组DNA样品组成。随后通过T7EI测定、Sanger测序和/或如下所述的深度测序评估来自这些一式二份样品的中靶和脱靶位点上的插入缺失突变。为了评估利用ssODN供体模板通过HDR引入的精确改变的频率,用250nggRNA表达质粒或空U6启动子质粒(作为阴性对照)、750ngCas9表达质粒(pJDS246)、50pmolssODN供体(或对于对照,无ssODN)和10ngtd-Tomato表达质粒(作为转染对照)转染2x105个U2OS.EGFP细胞。转染后3天使用AgencourtDNAdvance纯化基因组DNA,随后测定其在如下所述的目标基因座上的BamHI位点的引入。以一式二份进行所有这些转染。对于牵涉Cas9切口酶的实验,用125ng的每一种gRNA表达质粒(如果使用成对的gRNA)或250ng的gRNA表达质粒(如果使用单一gRNA)、750ngCas9-D10A切口酶表达质粒(pJDS271)、10ngtd-Tomato质粒和(如果进行HDR)50pmol的ssODN供体模板(编码BamHI位点)转染2x105个U2OS.EGFP细胞。以一式二份进行所有转染。在转染后2天(如果测定插入缺失突变)或转染后3天(如果测定HDR/ssODN介导的改变)使用AgencourtDNAdvance基因组DNA分离试剂盒(Beckman)收获基因组DNA。用于定量插入缺失突变的频率的T7EI测定如先前所述(实施例1和Fu等,2013)进行T7EI测定。简言之,使用两个下列程序之一,利用Phusion高保真DNA聚合酶(NewEnglandBiolabs)进行扩增特异性中靶或脱靶位点的PCR反应:(1)降落PCR程序[(98℃,10秒;72–62℃;-1℃/循环,15秒;72℃,30秒)x10个循环,(98℃,10秒;62℃,15秒;72℃,30秒)x25个循环)]或(2)恒定TmPCR程序[(98℃,10秒;68℃或72℃,15秒;72℃,30秒)x35个循环],必要时利用3%DMSO或1M甜菜碱。用于这些扩增的所有引物列于表E中。所得PCR产物的大小在300至800bp的范围内,并且按照制造商的说明书通过AmpureXP珠(Agencourt)纯化。将200ng纯化的PCR产物在19μl的总体积中于1xNEB缓冲液2中杂交,随后使用下列条件变性以以形成异源双链:95℃,5分钟;95至85℃,-2℃/秒;85至25℃,-0.1℃/秒;在4℃保持。将1μl的T7内切核酸酶I(NewEnglandBiolabs,10个单位/μl)添加至杂交的PCR产物,随后于37℃孵育15分钟。通过添加2μl的0.25MEDTA溶液终止T7EI反应,随后使用AMPureXP珠(Agencourt),通过在20μl0.1xEB缓冲液(QIAgen)中洗脱来纯化珠。随后在QIAXCEL毛细管电泳系统上分析反应产物,使用与先前所述(Reyon等,2012)相同的公式计算插入缺失突变的频率。用于定量插入缺失突变的频率的Sanger测序将用于T7EI测定的纯化的PCR产物连接进ZeroBluntTOPO载体(LifeTechnologies),并将其化学地转染进感受态Top10细菌细胞。分离质粒DNA,并使用M13正向引物(5’–GTAAAACGACGGCCAG–3’)(SEQIDNO:1059)通过马萨诸塞州总医院(MGH)DNAAutomationCore对其进行测序。用于定量利用ssODN通过HDR诱导的特异性改变的限制酶切消化测定使用Phusion高保真DNA聚合酶(NewEnglandBiolabs)进行特异性中靶位点的PCR反应。使用降落PCR程序((98℃,10秒;72-62℃,-1℃/循环,15秒;72℃,30秒)x10个循环,(98℃,10秒;62℃,15秒;72℃,30秒)x25个循环),利用3%DMSO扩增VEGF和EMX1基因座。用于这些PCR反应的引物列于表E中。按照制造商的说明书,利用AmpureXP珠(Agencourt)纯化PCR产物。对于由ssODN供体模板编码的BamHI限制性位点的检测,利用BamHI在37℃消化200ng的纯化的PCR产物,进行45分钟。通过AmpureXP珠(Agencourt)纯化消化产物,将其在20ul0.1xEB缓冲液中进行洗脱,使用QIAXCEL毛细管电泳系统对其进行分析和定量。TruSeq文库生成和测序数据分析基因座特异性引物被设计来侧翼连接中靶位点以及潜在的和经验证的脱靶位点以产生长度为~300bp至400bp的PCR产物。将来自上述混合的一式二份的样品的基因组DNA用作PCR的模板。按照制造商的说明书,利用AmpureXP珠(Agencourt)纯化所有PCR产物。在QIAXCEL毛细管电泳系统上定量纯化的PCR产物。从每一个混合的一式二份样品(上述的)扩增每一个基因座的PCR产物,纯化、定量所述PCR产物,随后将其以相等量混合在一起以用于深度测序。用如先前所述(Fisher等,2011)的双指数IlluminaTruSeq衔接头连接混合的扩增子。纯化所述文库,随后将其在QIAXCEL毛细管电泳系统上运行以验证衔接头连接后大小的变化。通过qPCR定量衔接头连接的文库,随后使用由Dana-FarberCancerInstituteMolecularBiologyCoreFacilities进行的IlluminaMiSeq250bp成对-末端读数对其进行测序。我们对每一个样品分析75,000至1,270,000个(平均~422,000个)读灵敏。如先前所述(Sander等,2013)就插入缺失诱变率分析TruSeq读数。将特异性比计算为观察到的中靶基因座上的诱变对特定脱靶基因座的诱变的比率,如通过深度测序测定的。将针对tru-RGN的单独的靶位点的特异性的倍数提高计算为对于tru-gRNA观察到的特异性比对比针对匹配的全长gRNA的该相同靶的特异性比。如原文中提及的,对于一些脱靶位点,对于tru-gRNA未检测到插入缺失突变。在这些情况下,我们使用泊松计算器以95%的置信度测定突变序列的实际数目的上限在数目上为3。我们随后使用该上限来估计针对这些脱靶位点的的特异性的最小倍数提高。实施例2a.截短的gRNA可在人细胞中高效地引导Cas9介导的基因组编辑为了测试在它们的5’末端上截短的gRNA可与它们的全长对应物一样高效地起作用的假说,如上文中针对EGFP报告基因中的单个靶位点所描述的,最初利用下列序列构建一系列逐渐缩短的gRNA:5’-CAGGCGATGCCACCTAcGG-3’(SEQIDNO:2241)。选择该特定的EGFP位点,因为这可能使gRNA与其具有15、17、19和20nt的各自在它们的5’末端具有G(从用于这些实验的U6启动子高效表达所需的)的互补性。通过使用其中RGN诱导的插入缺失的频率可通过评估单个整合的并且组成型表达的提高绿色荧光蛋白(EGFP)基因的破坏来定量的基于人细胞的报告测定(实施例1和Fu等,2013;Reyon等,2012)(图2B),测量这些可变长度的gRNA引导Cas9诱导的插入缺失的能力。如上所指出的,具有较长互补长度(21、23和25nt)的gRNA显示相对于含有20nt的互补序列的标准全长gRNA降低的活性(图2H),一个与由其它研究人员最近报导的结果(Ran等,Cell2013)匹配的结果。然而,具有17或19nt的靶互补性的gRNA显示可与全长gRNA相当或高于其的活性,然而,仅具有15nt的互补性的较短的gRNA未显示显著的活性(图2H)。为了测试这些初步发现的一般性,测定与4个另外的EGFP报告基因位点(EGFP位点#1、#2、#3和#4;图3A)具有18、17和/或16nt的互补性的全长gRNA和匹配的gRNA。在所有4个靶位点上,具有17和/或18nt的互补性的gRNA与它们的全长gRNA一样高效地(或,在一个情况下,比其更高效地)诱导Cas9介导的EGFP表达的破坏(图3A)。然而,仅具有16nt的互补性的gRNA对可针对其产生它们的两个位点显示显著降低的或不可检测的活性(图3A)。对于每一个测试的不同位点,我们转染相同量的全长或缩短的gRNA表达质粒和Cas9表达质粒。其中我们改变用于针对EGFP位点#1、#2和#3转染的Cas9和截短的gRNA表达质粒的量的对照实验表明,缩短的gRNA与它们的全长对应物功能等同(图3E(底)和3F(底)),从而当在任何给定的靶位点进行比较时,我们可使用相同量的质粒。综上所述,这些结果提供了具有17或18nt的互补性的缩短的gRNA通常可与全长gRNA一样高效地起作用的证据,并且在下文中具有这些互补长度的截短的gRNA称为“tru-gRNA”以及使用这些tru-gRNA的RGN被称为“tru-RGN”。随后测试tru-RGN是否可高效地在染色质化的内源基因靶上诱导插入缺失。针对3个内源人基因(VEGFA、EMX1和CLTA)中的7个位点(包括先前已被在3个内源人基因中的标准全长gRNA靶向的4个位点:VEGFA位点1、VEGFA位点3、EMX1和CTLA(实施例1和Fu等,2013;Hsu等,2013;Pattanayak等,2013))构建Tru-gRNA(图3B)。(不可能针对来自实施例1的VEGFA位点2测试tru-gRNA,因为该靶序列在互补区的位置17或18上不具有gRNA从U6启动子表达所需的G)。通过使用如上所述的良好建立的T7内切核酸酶I(T7EI)基因分型测定(Reyon等,2012),在人U2OS.EGFP细胞中定量由这些不同的gRNA的每一个在它们各自的靶位点上诱导的Cas9介导的插入缺失突变频率。对于七四个位点中的所有5个位点,tru-RGN以与匹配的标准RGN介导的效率相当的效率强劲的诱导插入缺失突变(图3B)。对于tru-RGN对于其显示比它们的全长对应物低的活性的两个位点,我们注意到,绝对诱变率在水平上仍然很高(13.3%和16.6%的平均值),所述诱变率可用于大多数应用。这些靶位点的3个位点(VEGFA位点1和3以及EMX1)的Sanger测序确认由tru-RGN诱导的插入缺失源于预期的裂解位点,并且这些突变与利用标准RGN诱导的那些突变基本上没有差别(图3C和图7A-D)。我们还发现具有错配的5’G和18nt互补区的tru-gRNA可高效地引导Cas9诱导的插入缺失,然而具有错配的5’G和17nt互补区的那些显示相较于匹配的全长gRNA更低的或不可检测的活性(图7E),与最小17nt的互补性是高效RGN活性所需的我们的发现一致。为了进一步评估tru-RGN的基因组编辑能力,测试它们通过HDR利用ssODN供体模板诱导精确的序列改变的能力。先前的研究已显示Cas9诱导的断裂可在人细胞中刺激来自同源ssODN供体的序列至内源基因座的引入(Cong等,2013;Mali等,2013c;Ran等,2013;Yang等,2013)。因此,比较被靶向VEGFA位点1和EMX1位点的匹配的全长与tru-gRNA将在同源ssODN上编码的BamHI限制性位点引入这些内源基因的能力。在两个位点上,tru-RGN都以与对于具有它们的全长gRNA对应物的标准RGN看到的效率相当的效率介导BamHI位点的引入(图3D)。综上所述,该数据表明tru-RGN可与标准RGN一样高效地用于在人细胞中引导插入缺失和精确的HDR介导的基因组编辑事件。实施例2b.tru-RGN显示提高的对gRNA/DNA界面错配的敏感性在已确定tru-RGN可高效地用于诱导中靶基因组编辑改变后,测试这些核酸酶是否可显示更大的对gRNA/DNA界面上的错配的敏感性。为了评估该敏感性,构建先前已针对EGFP位点#1、#2和#3进行了测试的tru-gRNA的一系列系统的变体(上述图3A)。所述变体gRNA在互补区的每一个位置(除从U6启动子表达所需的5’G外)上具有单沃尔森-克里克取代(图5A)。将基于人细胞的EGFP破坏测定用于评估这些变体tru-gRNA和一个类似组的如实施例1中所述的针对相同的3个位点产生的匹配的变体全长gRNA引导Cas9介导的插入缺失的相对能力。结果显示对于所有3个EGFP靶位点,tru-RGN通常显示比具有匹配的全长gRNA的标准RGN更大的对单个错配的敏感性(比较图5A的底图与顶图)。敏感性的量级根据位点而变化,对于其tru-gRNA具有17nt的互补性的位点#2和#3观察到最大的差异。受提高的tru-RGN对单核苷酸错配的敏感性激励,我们随后设法检查gRNA-DNA界面上的系统性错配的两个相邻位置的效应。我们因此产生被靶向EGFP靶位点#1、#2和#3的tru-gRNA的变体,每一个变体在两个相邻核苷酸位置上具有沃尔森-克里克颠换取代(图5B)。如通过EGFP破坏测定判断的,相较于对于实施例1中产生的被靶向所有这3个EGFP靶位点的匹配的全长gRNA的类似变体,对于tru-gRNA,相邻双错配对RGN活性的影响再次地显著更大(比较图5B中的底图与顶图)。这些影响似乎是位点依赖性的,对于EGFP位点#2和#3几乎所有双错配的tru-gRNA未能显示相对于不存在互补区的对照gRNA的EGFP破坏活性的提高,并且对于EGFP位点#1只有3个错配的tru-gRNA变体显示任何残留活性(图5B)。另外,尽管对于全长gRNA双突变通常显示更大的对5’末端的影响,但对于tru-gRNA未观察到该影响。综上所述,我们的数据表明tru-gRNA显示比全长gRNA更大的对gRNA-DNA界面上的单和双沃尔森-克里克颠换错配的敏感性。实施例2c.被靶向内源基因的tru-RGN在人细胞中显示提高的特异性进行接下来的实验以确定tru-RGN是否可在人细胞中显示相对于具有全长gRNA对应物的标准RGN的减小的基因组脱靶效应。我们检查被靶向VEGFA位点1、VEGFA位点3和EMX1位点1的匹配的全长和tru-gRNA(上文图3B中描述的),因为先前的研究(参见实施例1和Fu等,2013;Hsu等,2013)已确定被靶向这些位点的全长gRNA的13个真正的脱靶位点。(我们不能针对来自我们的原始研究6的VEGFA位点2测试tru-gRNA,因为该靶序列在互补区的位置17或18上不具有从U6启动子进行高效gRNA表达所需的G)。令人惊讶地,我们发现tru-RGN在人U2OS.EGFP细胞中在所有13个这些真正的脱靶位点上显示相对于匹配的标准RGN显著降低的诱变活性,如通过T7EI测定判断的(表3A);对于13个脱靶位点中的11个脱靶位点,对于tru-RGN的突变频率降至低于T7EI测定的可靠检测限(2-5%)(表3A)。当在另一个人细胞系(FT-HEK293细胞)中在相同的13个脱靶位点上测试这些匹配的成对标准和tru-RGN时,我们观察到相似的结果(表3A)。为了定量对于tru-RGN观察到的特异性提高的量级,我们使用高通量测序测量脱靶突变频率,所述高通量测序提供比T7EI测定更灵敏的用于检测和定量低频突变的方法。我们评估一个亚组的13个真正的脱靶位点中的12个位点,对于所述位点,我们已通过T7EI测定针对tru-gRNA看到减小的突变率(由于技术原因,我们不能扩增所述位点之一的所需的较短的扩增子),并且还检查了已被另一个组7鉴定的EMX1位点1的另外的脱靶位点(图6A)。对于我们测试的13个脱靶位点,tru-RGN显示相对于匹配的标准RGN显著降低的绝对诱变频率(图6A和表3B)并且产生相对于它们的标准RGN对应物多至~5000倍或更多的特异性的提高(图6B)。对于两个脱靶位点(OT1-4和OT1-11),难以定量针对tru-RGN的中靶对脱靶比率,因为由tru-RGN诱导的插入缺失突变的绝对数和频率降至本底水平或接近本底水平。因此,中靶对脱靶的比率可在这些情况下计算为无穷的。为了解决该问题,我们相反地以95%的置信水平鉴定针对这些位点的可能地最大的插入缺失频率,随后使用该保守估计来计算tru-RGN相对于标准RGN对于这些脱靶的特异性提高的可能地最低量级。这些计算表明tru-RGN在这些位点上产生~10,000倍或更多倍的提高(图6B)。为了进一步探测tru-RGN的特异性,我们检查它们在人基因组中的另外的密切相关的位点上诱导脱靶突变的能力。对于针对VEGFA位点1和EMX1的tru-gRNA(其各自具有18nt的靶位点互补性),我们通过计算鉴定人基因组中在互补区内的一个或两个位置上错配的所有另外的位点(上述表3A中未检查的)和一个亚组的在3个位置上错配的所有位点,在所述错配中我们偏爱如实施例1中描述的位点的5’末端中的错配。对于针对VEGFA位点3的tru-gRNA(其具有17nt的靶位点互补性),我们鉴定所有在一个位置上错配的位点,和一个亚组的在两个位置上错配的所有位点,在所述错配中5’末端中的错配获得偏爱(再次地在表3A中未被检查的)。该计算分析对于被靶向VEGFA位点1、VEFGA位点3和EMX1位点的tru-RGN分别产生总共30、30和34个另外的潜在脱靶位点,我们随后使用T7EI测定在其中已表达RGN的人U2OS.EGFP和HEK293细胞中评估所述脱靶位点。令人惊讶地,针对VEGFA位点1、VEFGA位点3和EMX1的3个tru-RGN在人U2OS.EGFP细胞中检查的94个潜在脱靶位点中的93个位点上,或在人HEK293细胞中的94个潜在脱靶位点中的任何脱靶位点上不诱导可检测的Cas9介导的插入缺失突变(表3C)。对于在其上看到脱靶突变的一个位点,检查具有被靶向VEGFA位点1的全长gRNA的标准RGN是否还可诱变该相同的脱靶位点;其诱导可检测的突变,虽然以略低频率诱导(图6C)。对于gRNA的缩短在该脱靶位点上观察到的提高的不存在可通过比较全长与tru-gRNA的20和18nt序列来理解,所述比较显示全长20nt的靶中的两个另外的碱基都是错配的(图6C)。总之,基于该94个另外的潜在脱靶位点的观察,gRNA的缩短似乎不诱导新的高频脱靶突变。一个亚组的来自该组94个位点(即—具有一个或多个错配的那些位点)的30个最密切匹配的潜在脱靶位点的深度测序显示不可检测的插入缺失突变率,或可与我们在其它先前鉴定的脱靶位点(表3B)上所观察到的插入缺失突变率相当的极低插入缺失突变率(表3D)。我们得出tru-RGN通常似乎在与中靶位点相异在于一个或两个错配的位点上诱导极低水平或不可检测的水平的突变。这与标准RGN相反,对于标准RGN,在相异在于多至5个错配的位点上相对容易地发现高频脱靶突变(参见实施例1)。频率=插入缺失突变的频率=插入缺失序列的数目/野生型序列的数目。对照gRNA=缺乏互补区的gRNAS#:SEQIDNO:实施例2d.可将tru-gRNA与双重Cas9切口酶一起用于在人细胞中高效地诱导基因组编辑利用最近描述的诱导插入缺失突变的双重Cas9切口酶法测试tru-gRNA。为了进行该测试,将Cas9-D10A切口酶与被靶向人VEGFA基因中的位点(VEGFA位点1和我们称为VEGFA位点4的另外的序列)的两个全长gRNA一起在U2OS.EGFP细胞中共表达(图4A)。如先前所描述的(Ran等,2013),该对切口酶协同地在VEGFA靶基因座上诱导高比率的插入缺失突变(图4B)。有趣地,与单独的被靶向VEGFA位点4的gRNA共表达的Cas9-D10A切口酶也以高频率诱导插入缺失突变,虽然以比对于成对全长gRNA观察到的频率稍低的频率诱导(图4B)。重要的是,使用针对VEGFA位点1的tru-gRNA替代全长gRNA不影响双重切口酶法诱导插入缺失突变的效率(图4B)。双重切口酶策略也已被用于刺激使用ssODN进行的特定序列改变的引入(Mali等,2013a;Ran等,2013),因此也测试tru-gRNA是否可用于该类型的改变。如所预期的,针对VEGFA位点1和4的成对的全长gRNA与Cas9-D10A切口酶一起协同地提高来自ssODN供体的短的插入(图3A)至人U2OS.EGFP细胞中的VEGFA基因座中的高效引入(图3C)。再次地,对于使用tru-gRNA替代被靶向VEGFA位点1的全长gRNA,通过双重切割进行的ssODN介导的序列改变的效率仍然同样高(图3C)。综上所述,这些结果表明tru-gRNA可用作双重Cas9切口酶策略的部分来诱导插入缺失突变和ssODN介导的序列改变,而不削弱通过该方法进行的基因组编辑的效率。在确定tru-gRNA的使用不减小成对切口酶的中靶基因组编辑活性后,我们随后使用深度测序来检查先前鉴定的VEGFA位点1gRNA的4个真正的脱靶位点上的突变频率。该分析显示当使用具有tru-gRNA的成对切口酶时,突变率在所有这4个脱靶位点上降至基本上不可检测的水平(表4)。相反地,tru-RGN(表3B)和具有全长gRNA的成对切口酶(表4)都不能完全消除这4个脱靶位置(OT1-3)之一上的脱靶突变。这些结果表明tru-gRNA的使用还可减小成对Cas9切口酶的脱靶效应(并且反之亦然)而不削弱中靶基因组编辑的效率。参考文献Cheng,A.W.,Wang,H.,Yang,H.,Shi,L.,Katz,Y.,Theunissen,T.W.,Rangarajan,S.,Shivalila,C.S.,Dadon,D.B.,andJaenisch,R.MultiplexedactivationofendogenousgenesbyCRISPR-on,anRNA-guidedtranscriptionalactivatorsystem.CellRes23,1163-1171.(2013).Cho,S.W.,Kim,S.,Kim,J.M.&Kim,J.S.TargetedgenomeengineeringinhumancellswiththeCas9RNA-guidedendonuclease.NatBiotechnol31,230-232(2013).Cong,L.etal.MultiplexgenomeengineeringusingCRISPR/Cassystems.Science339,819-823(2013).Cradick,T.J.,Fine,E.J.,Antico,C.J.,andBao,G.CRISPR/Cas9systemstargetingbeta-globinandCCR5geneshavesubstantialoff-targetactivity.NucleicAcidsRes.(2013).Dicarlo,J.E.etal.GenomeengineeringinSaccharomycescerevisiaeusingCRISPR-Cassystems.NucleicAcidsRes(2013).Ding,Q.,Regan,S.N.,Xia,Y.,Oostrom,L.A.,Cowan,C.A.,andMusunuru,K.EnhancedefficiencyofhumanpluripotentstemcellgenomeeditingthroughreplacingTALENswithCRISPRs.CellStemCell12,393-394.(2013).Fisher,S.,Barry,A.,Abreu,J.,Minie,B.,Nolan,J.,Delorey,T.M.,Young,G.,Fennell,T.J.,Allen,A.,Ambrogio,L.,etal.Ascalable,fullyautomatedprocessforconstructionofsequence-readyhumanexometargetedcapturelibraries.GenomeBiol12,R1.(2011).Friedland,A.E.,Tzur,Y.B.,Esvelt,K.M.,Colaiacovo,M.P.,Church,G.M.,andCalarco,J.A.HeritablegenomeeditinginC.elegansviaaCRISPR-Cas9system.NatMethods10,741-743.(2013).Fu,Y.,Foden,J.A.,Khayter,C.,Maeder,M.L.,Reyon,D.,Joung,J.K.,andSander,J.D.High-frequencyoff-targetmutagenesisinducedbyCRISPR-Casnucleasesinhumancells.NatBiotechnol31,822-826.(2013).Gabriel,R.etal.Anunbiasedgenome-wideanalysisofzinc-fingernucleasespecificity.NatBiotechnol29,816-823(2011).Gilbert,L.A.,Larson,M.H.,Morsut,L.,Liu,Z.,Brar,G.A.,Torres,S.E.,Stern-Ginossar,N.,Brandman,O.,Whitehead,E.H.,Doudna,J.A.,etal.(2013).CRISPR-MediatedModularRNA-GuidedRegulationofTranscriptioninEukaryotes.Cell154,442-451.Gratz,S.J.etal.GenomeengineeringofDrosophilawiththeCRISPRRNA-guidedCas9nuclease.Genetics(2013).Hockemeyer,D.etal.GeneticengineeringofhumanpluripotentcellsusingTALEnucleases.NatBiotechnol29,731-734(2011).Horvath,P.&Barrangou,R.CRISPR/Cas,theimmunesystemofbacteriaandarchaea.Science327,167-170(2010).Hsu,P.D.,Scott,D.A.,Weinstein,J.A.,Ran,F.A.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.J.,Wu,X.,Shalem,O.,etal.DNAtargetingspecificityofRNA-guidedCas9nucleases.NatBiotechnol31,827-832.(2013).Hwang,W.Y.etal.EfficientgenomeeditinginzebrafishusingaCRISPR-Cassystem.NatBiotechnol31,227-229(2013).Hwang,W.Y.,Fu,Y.,Reyon,D.,Maeder,M.L.,Kaini,P.,Sander,J.D.,Joung,J.K.,Peterson,R.T.,andYeh,J.R.HeritableandPreciseZebrafishGenomeEditingUsingaCRISPR-CasSystem.PLoSOne8,e68708.(2013a).Jiang,W.,Bikard,D.,Cox,D.,Zhang,F.&Marraffini,L.A.RNA-guidededitingofbacterialgenomesusingCRISPR-Cassystems.NatBiotechnol31,233-239(2013).Jinek,M.etal.Aprogrammabledual-RNA-guidedDNAendonucleaseinadaptivebacterialimmunity.Science337,816-821(2012).Jinek,M.etal.RNA-programmedgenomeeditinginhumancells.Elife2,e00471(2013).Li,D.,Qiu,Z.,Shao,Y.,Chen,Y.,Guan,Y.,Liu,M.,Li,Y.,Gao,N.,Wang,L.,Lu,X.,etal.HeritablegenetargetinginthemouseandratusingaCRISPR-Cassystem.NatBiotechnol31,681-683.(2013a).Li,W.,Teng,F.,Li,T.,andZhou,Q.SimultaneousgenerationandgermlinetransmissionofmultiplegenemutationsinratusingCRISPR-Cassystems.NatBiotechnol31,684-686.(2013b).Maeder,M.L.,Linder,S.J.,Cascio,V.M.,Fu,Y.,Ho,Q.H.,andJoung,J.K.CRISPRRNA-guidedactivationofendogenoushumangenes.NatMethods10,977-979.(2013).Mali,P.,Aach,J.,Stranges,P.B.,Esvelt,K.M.,Moosburner,M.,Kosuri,S.,Yang,L.,andChurch,G.M.CAS9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.NatBiotechnol31,833-838.(2013a).Mali,P.,Esvelt,K.M.,andChurch,G.M.Cas9asaversatiletoolforengineeringbiology.NatMethods10,957-963.(2013b).Mali,P.etal.RNA-guidedhumangenomeengineeringviaCas9.Science339,823-826(2013c).Pattanayak,V.,Lin,S.,Guilinger,J.P.,Ma,E.,Doudna,J.A.,andLiu,D.R.High-throughputprofilingofoff-targetDNAcleavagerevealsRNA-programmedCas9nucleasespecificity.NatBiotechnol31,839-843.(2013).Pattanayak,V.,Ramirez,C.L.,Joung,J.K.&Liu,D.R.Revealingoff-targetcleavagespecificitiesofzinc-fingernucleasesbyinvitroselection.NatMethods8,765-770(2011).Perez,E.E.etal.EstablishmentofHIV-1resistanceinCD4+Tcellsbygenomeeditingusingzinc-fingernucleases.NatBiotechnol26,808-816(2008).Perez-Pinera,P.,Kocak,D.D.,Vockley,C.M.,Adler,A.F.,Kabadi,A.M.,Polstein,L.R.,Thakore,P.I.,Glass,K.A.,Ousterout,D.G.,Leong,K.W.,etal.RNA-guidedgeneactivationbyCRISPR-Cas9-basedtranscriptionfactors.NatMethods10,973-976.(2013).Qi,L.S.,Larson,M.H.,Gilbert,L.A.,Doudna,J.A.,Weissman,J.S.,Arkin,A.P.,andLim,W.A.RepurposingCRISPRasanRNA-guidedplatformforsequence-specificcontrolofgeneexpression.Cell152,1173-1183.(2013).Ran,F.A.,Hsu,P.D.,Lin,C.Y.,Gootenberg,J.S.,Konermann,S.,Trevino,A.E.,Scott,D.A.,Inoue,A.,Matoba,S.,Zhang,Y.,etal.DoublenickingbyRNA-guidedCRISPRCas9forenhancedgenomeeditingspecificity.Cell154,1380-1389.(2013).Reyon,D.etal.FLASHassemblyofTALENsforhigh-throughputgenomeediting.NatBiotech30,460-465(2012).Sander,J.D.,Maeder,M.L.,Reyon,D.,Voytas,D.F.,Joung,J.K.,andDobbs,D.ZiFiT(ZincFingerTargeter):anupdatedzincfingerengineeringtool.NucleicAcidsRes38,W462-468.(2010).Sander,J.D.,Ramirez,C.L.,Linder,S.J.,Pattanayak,V.,Shoresh,N.,Ku,M.,Foden,J.A.,Reyon,D.,Bernstein,B.E.,Liu,D.R.,etal.Insilicoabstractionofzincfingernucleasecleavageprofilesrevealsanexpandedlandscapeofoff-targetsites.NucleicAcidsRes.(2013).Sander,J.D.,Zaback,P.,Joung,J.K.,Voytas,D.F.,andDobbs,D.ZincFingerTargeter(ZiFiT):anengineeredzincfinger/targetsitedesigntool.NucleicAcidsRes35,W599-605.(2007).Shen,B.etal.Generationofgene-modifiedmiceviaCas9/RNA-mediatedgenetargeting.CellRes(2013).Sugimoto,N.etal.ThermodynamicparameterstopredictstabilityofRNA/DNAhybridduplexes.Biochemistry34,11211-11216(1995).Terns,M.P.&Terns,R.M.CRISPR-basedadaptiveimmunesystems.CurrOpinMicrobiol14,321-327(2011).Wang,H.etal.One-StepGenerationofMiceCarryingMutationsinMultipleGenesbyCRISPR/Cas-MediatedGenomeEngineering.Cell153,910-918(2013).Wiedenheft,B.,Sternberg,S.H.&Doudna,J.A.RNA-guidedgeneticsilencingsystemsinbacteriaandarchaea.Nature482,331-338(2012).Yang,L.,Guell,M.,Byrne,S.,Yang,J.L.,DeLosAngeles,A.,Mali,P.,Aach,J.,Kim-Kiselak,C.,Briggs,A.W.,Rios,X.,etal.(2013).Optimizationofscarlesshumanstemcellgenomeediting.NucleicAcidsRes41,9049-9061.其它实施方案应理解,虽然已结合其详细描述说明了本发明,但前述说明指在举例说明而不是限制本发明的范围,本发明的范围由所述权利要求的范围来界定。其它方面、有利方面和修改在下列权利要求的范围内。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1