用于基因编辑的演化的CAS9蛋白的制作方法

文档序号:15733688发布日期:2018-10-23 21:06阅读:610来源:国知局
根据35U.S.C.§119(e),本申请要求以下美国临时专利申请的优先权:2015年10月23日提交的U.S.S.N.62/245,828,2016年1月15日提交的U.S.S.N.62/279,346,2016年3月22日提交的U.S.S.N.62/311,763,2016年4月13日提交的U.S.S.N.62/322,178,2016年6月30日提交的U.S.S.N.62/357,352,2016年8月3日提交的U.S.S.N.62/370,700,2016年9月22日提交的U.S.S.N.62/398,490,2016年10月4日提交的U.S.S.N.62/408,686,和2016年6月30日提交的U.S.S.N.62/357,332;其各自通过引用并入本文。发明背景核酸序列的靶向编辑,例如靶向切割或将特定修饰靶向导入基因组DNA是用于研究基因功能的非常有前景的方法,并且还具有为人类遗传病提供新疗法的潜力。1理想的核酸编辑技术具有三个特点:(1)插入所需修饰的效率高;(2)最小的脱靶活性;(3)编程以在给定核酸中的任意位点例如人基因组中的任意位点精确编辑的能力。2目前的基因组工程化工具,包括工程化锌指核酸酶(ZFN),3转录活化子例如效应核酸酶TALEN,4和最近的RNA引导的DNA内切核酸酶Cas9,作用于基因组中的序列特异性DNA切割。这种可编程的切割可以通过非同源末端连接(NHEJ)导致裂解位点处DNA的突变或通过同源性定向修复(HDR)置换切割位点周围的DNA。6,7现有技术的一个缺点是NHEJ和HDR都是随机过程,其通常导致中等的基因编辑效率以及可以与期望的改变竞争的不想要的基因改变。8因为原则上许多遗传疾病可以通过影响基因组中特定位置的特定核苷酸改变(例如,与疾病相关基因的特定密码子中的C到T改变),9开发可编程方式以实现这种经精确编辑将代表一种强大的新的研究工具,以及基于基因编辑的人类治疗学的潜在新方法。现有基因组工程化工具的另一个缺点是它们受到可以靶向的DNA序列的限制。当使用ZNF或TALEN时,必须为每个单独的靶序列产生新的蛋白质。尽管通过提供适合的引导RNA,Cas9可以靶向几乎任何靶序列,但是Cas9技术通过对前间隔区相邻基序(protospacer-adjacentmotif,PAM)的严格要求仍然受限于可以靶向的序列,所述PAM典型地是核苷酸序列5'-NGG-3',其必须紧邻靶DNA序列的3’端存在,以便Cas9蛋白结合并作用于靶序列。因此PAM要求限制了可以被Cas9蛋白有效靶向的序列。发明概述重要的是,80-90%的导致人类疾病的蛋白质突变来源于仅单个核苷酸的取代,缺失或插入。6大多数用于单碱基基因校正的目前的策略包括工程化的核酸酶(其依赖于双链断裂,DSB,随后是随机的,抵消的同源定向修复,HDR),和DNA-RNA嵌合寡核苷酸。22后一策略涉及设计RNA/DNA序列以与基因组DNA中除了待编辑的核苷酸之外的特定序列碱基配对。由此产生的错配被细胞的内源性修复系统所识别并修理,导致嵌合体或基因组序列的改变。这两种策略都经受低基因编辑效率和不需要的基因改变,因为它们经受HDR的随机性和HDR与非同源性末端连接NHEJ之间的竞争。23-25HDR效率根据基因组中的靶基因的位置,26细胞周期的状态,27和细胞/组织的类型而不同。开发直接的,可编程的方式以酶样效率且没有随机性地将特定类型的碱基修饰安装到基因组DNA的精确位置,因此代表了基于基因编辑的研究工具和人类疗法的强大新方法。聚簇规则间隔短回文重复序列(clusteredregularlyinterspacedshortpalindromicrepeat,CRISPR)系统是最近发现的原核可适应性免疫系统10,其已经经过修饰以在各种生物体和细胞系中实现稳健的和普遍的基因组工程化。11CRISPR-Cas(CRISPR-相关的)系统是使用RNA分子(sgRNA)作为引导通过碱基配对将复合物定位到靶DNA序列的蛋白-RNA复合物。12在天然系统中,Cas蛋白然后作为内切核酸酶来切割靶DNA序列。13靶DNA序列必须既与sgRNA互补,又在互补区的3'端含有“前间隔区相邻基序”(PAM),以使系统发挥功能。14PAM序列的要求限制了Cas9技术的使用,因为并非所有期望的靶向序列都在3'末端包含PAM序列,因此不能有效地被野生型Cas9蛋白靶向。本文提供了新的Cas9变体,其对在3'端不包含规范PAM序列(5'-NGG-3',其中N是任何核苷酸)的靶序列显示活性。此类Cas9变体不受限于在3'端包括规范PAM序列的靶序列。在已知的Cas蛋白质中,酿脓链球菌(Streptococcuspyogenes)Cas9已经被广泛用作基因组工程化的工具。15该Cas9蛋白是含有两个不同核酸酶结构域的大的多结构域蛋白质。可以将点突变引入Cas9以消除核酸酶活性,从而导致死的Cas9(dCas9),其仍然保留以sgRNA编程的方式结合DNA的能力。16原则上,此类Cas9变体当与另一蛋白质或结构域融合时,能够简单地通过与适合的sgRNA共表达,将该蛋白靶向至几乎任何DNA序列。因此,本公开还包括融合蛋白,其包含此类Cas9变体和DNA修饰结构域(如脱氨酶,核酸酶,切口酶,重组酶,甲基转移酶,甲基化酶,乙酰化酶,乙酰基转移酶,转录活化子或转录阻遏物结构域),以及此类融合蛋白在校正与疾病相关的基因组(例如人受试者的基因组)中的突变,或在基因组(例如人基因组)中生成突变以降低或防止基因的表达中的用途。在一些实施方案中,本文提供的任何Cas9蛋白可以与具有酶活性的蛋白质融合。在一些实施方案中,酶活性修饰靶DNA。在一些实施方案中,酶活性是核酸酶活性,甲基转移酶活性,脱甲基酶活性,DNA修复活性,DNA损伤活性,脱氨活性,歧化酶活性,烷基化活性,脱嘌呤活性,氧化活性,嘧啶二聚体形成活性,整合酶活性,转座酶活性,重组酶活性,聚合酶活性,连接酶活性,解旋酶活性,光解酶活性或糖基化酶活性。在一些情况下,酶活性是核酸酶活性。在一些情况下,核酸酶活性在靶DNA中引入双链断裂。在一些情况下,酶活性修饰与靶DNA相关的靶多肽。在一些情况下,酶活性是甲基转移酶活性,脱甲基酶活性,乙酰转移酶活性,脱乙酰基酶活性,激酶活性,磷酸酶活性,泛素连接酶活性,去泛素化活性,腺苷酸化活性,去腺苷酸化活性,SUMO化活性,去SUMO化活性,核糖基化活性,去糖基化活性,肉豆蔻酰化活性或去肉豆蔻酰化活性。在一些情况下,靶多肽是组蛋白并且酶活性是甲基转移酶活性,脱甲基化酶活性,乙酰转移酶活性,脱乙酰基酶活性,激酶活性,磷酸酶活性,泛素连接酶活性或去泛素化活性。在一些实施方案中,本文提供的任何Cas9蛋白可以与具有酶活性的蛋白质融合。在一些实施方案中,酶活性修饰与DNA相关的多肽(例如组蛋白)。在一些实施方案中,酶活性为甲基转移酶活性,脱甲基酶活性,乙酰转移酶活性,脱乙酰基酶活性,激酶活性,磷酸酶活性,泛素连接酶活性(即泛素化活性),去泛素化活性,腺苷酸化活性,去腺苷酸化活性,SUMO化活性,去SUMO化活性,核糖基化活性,去核糖基化活性,肉豆蔻酰化活性,去肉豆蔻酰化活性糖基化活性(例如来自O-GlcNAc转移酶)或去糖基化活性。本文列出的酶活性催化对蛋白质的共价修饰。本领域已知此类修饰可以改变靶蛋白的稳定性或活性(例如,由激酶活性引起的磷酸化可根据靶蛋白刺激或沉默蛋白活性)。特别感兴趣的蛋白质靶标是组蛋白。本领域已知组蛋白蛋白结合DNA并形成称为核小体的复合物。可以修饰组蛋白(例如通过甲基化,乙酰化,泛素化,磷酸化)以引起周围DNA的结构变化,从而控制潜在的大部分DNA对相互作用因子例如转录因子,聚合酶等的可接近性。单个组蛋白可以以许多不同方式和以许多不同组合进行修饰(例如,组蛋白3的赖氨酸27的三甲基化H3K27与阻抑转录的DNA区域相关联,而组蛋白3的赖氨酸4的三甲基化H3K4与活化转录的DNA区域相关联)。因此,具有组蛋白修饰活性的定点修饰多肽可用于DNA结构的位点特异性控制,并可用于改变靶DNA的选定区域中的组蛋白修饰模式。此类方法可用于研究和临床应用。在一些实施方案中,脱氨酶结构域催化从分子去除胺基团。在进一步的实施方案中,胞苷脱氨酶结构域使胞嘧啶脱氨以产生尿嘧啶。在其它实施方案中,核酸酶结构域具有酶活性并且可以切割核酸的核苷酸亚基之间的磷酸二酯键。在一些实施方案中,可以使用重组DNA的特定序列的重组酶结构域来操纵基因组的结构和控制基因表达。在进一步的实施方案中,甲基化酶结构域可用于甲基化它们各自的底物,而乙酰基酶结构域可用于乙酰化它们各自的底物。在其它实施方案中,乙酰基转移酶结构域可以用于转移乙酰基。乙酰基转移酶分子的实例包括但不限于组蛋白乙酰基转移酶(例如CBP组蛋白乙酰基转移酶),胆碱乙酰基转移酶,氯霉素乙酰基转移酶,血清素N-乙酰基转移酶,NatA乙酰基转移酶和NatB乙酰基转移酶。本公开还涵盖转录活化子和转录阻遏物结构域。转录活化子结构域是转录因子的区域,其可以通过与DNA结合结构域,一般转录因子和RNA聚合酶的相互作用或多重相互作用来激活启动子的转录。转录阻遏物结构域是转录因子的区域,其可以通过与DNA结合结构域,一般转录因子和RNA聚合酶的相互作用或多重相互作用来抑制从启动子的转录。用于基因组工程化的Cas9系统的潜力是巨大的。其将蛋白质带到由sgRNA编程的基因组中的特定位点的独特能力可以开发成除核酸酶以外的各种位点特异性基因组工程化工具,包括转录活化子,转录阻遏物,组蛋白修饰蛋白,整合酶,脱氨酶和重组酶。11这些潜在的应用中的一些最近已通与转录活化子的dCas9融合以提供RNA引导的转录激活化子,17,18转录阻遏物,16,19,20和染色质修饰酶实现。21这些融合蛋白与多种sgRNA的简单共表达导致靶基因的特异性表达。这些开创性的研究为设计和构建易于编程的序列特异性效应器以精确操作基因组铺平了道路。本公开的一些方面提供策略,系统,蛋白质,核酸,组合物,细胞,试剂,方法和试剂盒,其有用于核酸的靶向结合,编辑和切割,包括编码受试者的基因组例如人受试者的基因组中的单个位点。在一些实施方案中,提供了重组Cas9蛋白,其包含相比于天然存在的蛋白的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,至少七个,至少八个,至少九个或至少十个改变,并且对3'端不包含规范PAM(5'-NGG-3',其中N是任意核苷酸)的靶序列表现出活性。此类Cas9蛋白突变的实例在表3、5、8和9中给出。在一些实施方案中,提供了Cas9和核酸编辑酶或酶促结构域的融合蛋白,例如脱氨酶结构域。在一些实施方案中,提供了用于靶向核酸结合,编辑和/或切割的方法。在一些实施方案中,提供了用于产生靶向核酸结合,编辑和/或切割蛋白例如Cas9变体和核酸编辑酶或结构域的融合蛋白的试剂和试剂盒。本公开的一些方面提供重组Cas9蛋白质,其包含与SEQIDNO:9-262中列出的序列的任一项提供的Cas9的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同的氨基酸序列,其中所述Cas蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变:具有SEQIDNO:9中提供的氨基酸序列的酿脓链球菌的氨基酸残基262、267、294、405、409、480、543、694、1219、1224、1256和1362,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应氨基酸残基。在一些实施方案中,重组Cas9蛋白包含RuvC和HNH域。在一些实施方案中,重组Cas9蛋白的氨基酸序列与天然存在的Cas9蛋白的氨基酸序列不同。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变:SEQIDNO:9中提供的氨基酸序列的X262T,X294R,X409I,X480K,X543D,X694I和X1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变:SEQIDNO:9中提供的氨基酸序列的A262T,K294R,S409I,E480K,E543D,M694I和E1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。本公开的其它方面提供了重组Cas9蛋白,其包含与SEQIDNO:10-262中列出的序列的任一项提供的Cas9的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同的氨基酸序列,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基262,267,294,405,409,480,543,694,1219,1224,1256和1362,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应氨基酸残基;并且其中所述重组Cas9蛋白的氨基酸序列与天然存在的Cas9蛋白的氨基酸序列不同。在一些实施方案中,重组Cas9蛋白包含RuvC和HNH域。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变:SEQIDNO:9中提供的氨基酸序列的X262T,X267G,X294R,X405I,X409I,X480K,X543D,X694I,X1219V,X1224K和X1256K,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变:SEQIDNO:9中提供的氨基酸序列的A262T,S267G,K294R,F405I,S409I,E480K,E543D,M694I,E1219V,N1224K和Q1256K,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。应该理解,本文所述的从第一个氨基酸残基(例如A)到第二个氨基酸残基(例如T)的任何氨基酸突变(例如,A262T)也可以包括从第一个氨基酸残基到与第二个氨基酸残基相似(例如保守)的氨基酸残基。例如,丙氨酸到苏氨酸的突变(例如A262T突变)也可以是从丙氨酸到与苏氨酸在大小和化学性质上相似的氨基酸(例如丝氨酸)。另外的类似的氨基酸对包括但不限于以下:苯丙氨酸和酪氨酸;天冬酰胺和谷氨酰胺;甲硫氨酸和半胱氨酸;天冬氨酸和谷氨酸;以及精氨酸和赖氨酸。本领域技术人员将认识到,此类保守的氨基酸取代可能对蛋白质结构具有较小的影响,并且可能在不损害功能的情况下良好耐受。在一些实施方案中,本文提供的从一种氨基酸到苏氨酸的氨基酸突变的任何氨基酸可以是到苏氨酸的氨基酸突变。在一些实施方案中,本文提供的从一种氨基酸到精氨酸的氨基酸突变的任何氨基酸可以到赖氨酸的氨基酸突变。在一些实施方案中,本文提供的从一种氨基酸到异亮氨酸的氨基酸突变的任何氨基酸可以是到丙氨酸,缬氨酸,甲硫氨酸或亮氨酸的氨基酸突变。在一些实施方案中,本文提供的从一种氨基酸到赖氨酸的氨基酸突变的任何氨基酸可以是到精氨酸的氨基酸突变。在一些实施方案中,本文提供的从一种氨基酸到天冬氨酸的氨基酸突变的任何氨基酸可以是到谷氨酸或天冬酰胺的氨基酸突变。在一些实施方案中,本文提供的从一种氨基酸到缬氨酸的氨基酸突变的任何氨基酸可以是到丙氨酸,异亮氨酸,甲硫氨酸或亮氨酸的氨基酸突变。在一些实施方案中,本文提供的从一种氨基酸到甘氨酸的氨基酸突变的任何氨基酸可以是到丙氨酸的氨基酸突变。然而,应该理解的是,本领域技术人员将认识到另外的保守氨基酸残基,且到其它保守氨基酸残基的任何氨基酸突变也在本公开的范围内。在一些实施方案中,Cas9蛋白是融合蛋白的Cas9结构域。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,突变是X1219A,X1219I,X1219M或X1219L。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的E1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,突变是E1219A,E1219I,E1219M或E1219L。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X480K突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,突变是X480R。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的E480K突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突。在一些实施方案中,突变是E480R。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X543D突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,突变是X543N。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的E543D突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突。在一些实施方案中,突变是E543N。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X480K,X543D和X1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X262T,X409I,X480K,X543D,X694I和X1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X294R,X480K,X543D,X1219V,X1256K和X1362P突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X294R,X480K,X543D,X1219V和X1256K突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X267G,X294R,X480K,X543D,X1219V,X1224K和X1256K突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X262T,X405I,X409I,X480K,X543D,X694I和X1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的E480K,E543D和E1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的A262T,S409I,E480K,E543D,M694I和E1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的K294R,E480K,E543D,E1219V,Q1256K和L1362P突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的K294R,E480K,E543D,E1219V和Q1256K突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的S267G,K294R,E480K,E543D,E1219V,N1224K,和Q1256突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的A262T,F405I,S409I,E480K,E543D,M694I和E1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突。Cas9的HNH核酸酶结构域用于切割与引导RNA(gRNA)互补的DNA链。其活性位点由ββα-金属折叠组成,且其组氨酸840活化水分子攻击易裂的磷酸,其由于与镁离子配位而更易亲电,导致3'-5'磷酸键的切割。在一些实施方案中,HNH结构域的氨基酸序列与SEQIDNO:9-262中任一项的HNH结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,HNH结构域的氨基酸序列与SEQIDNO:9-262中任一项的HNH结构域的氨基酸序列相同。Cas9的RuvC结构域切割非靶DNA链。其由顺序上分散的位点编码,其在三级结构中相互作用以形成RuvC切割结构域并由RNaseH折叠结构组成。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:9-262中任一项的RuvC结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:9-262中任一项的RuvC结构域的氨基酸序列相同。在一些实施方案中,Cas9蛋白包含影响(例如抑制)Cas9切割DNA双链体的一条或两条链的能力的一个或多个突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和/或H840A突变或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10X1和/或H840X2突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X1是除D外的任何氨基酸,且X2是除H外的任意氨基酸。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的氨基酸残基840处的H,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应残基。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的氨基酸残基10处的D,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应残基。在一些实施方案中,相比于SEQIDNO:9提供的酿脓链球菌Cas9,本公开的Cas9蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出活性,例如增加的结合。本公开的一些方面提供了重组Cas9蛋白,其包含与SEQIDNO:9提供的酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,其中Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基262,267,294,405,409,480,543,694,1219,1224,1256和1362,其中所述重组Cas9蛋白的氨基酸序列与天然存在的Cas9蛋白的氨基酸序列不同,且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas9蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出增加的活性。在一些实施方案中,酿脓链球菌Cas9包含RuvC和HNH结构域。在其它实施方案中,Cas9蛋白包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329。作为一个实例,Cas9蛋白可以展现对靶序列的增加的结合,可以在靶序列处展现增加的核酸酶活性,或者可以展现其它活性的增加,这取决于Cas9蛋白是否与另外的结构域例如具有酶活性的酶融合。在一些实施方案中,酶活性修饰靶DNA。在一些实施方案中,酶活性是核酸酶活性,甲基转移酶活性,脱甲基酶活性,DNA修复活性,DNA损伤活性,脱氨活性,歧化酶活性,烷基化活性,脱嘌呤活性,氧化活性,嘧啶二聚体形成活性,整合酶活性,转座酶活性,重组酶活性,聚合酶活性,连接酶活性,解旋酶活性,光解酶活性或糖基化酶活性。在一些情况下,酶活性是核酸酶活性。在一些情况下,核酸酶活性在靶DNA中引入双链断裂。在一些情况下,酶活性修饰与靶DNA相关的靶多肽。在一些情况下,酶活性是甲基转移酶活性,脱甲基酶活性,乙酰转移酶活性,脱乙酰基酶活性,激酶活性,磷酸酶活性,泛素连接酶活性,去泛素化活性,腺苷酸化活性,去腺苷酸化活性,SUMO化活性,去SUMO化活性,核糖基化活性,去糖基化活性,肉豆蔻酰化活性或去肉豆蔻酰化活性。在一些情况下,靶多肽是组蛋白并且酶活性是甲基转移酶活性,脱甲基酶活性,乙酰转移酶活性,脱乙酰基酶活性,激酶活性,磷酸酶活性,泛素连接酶活性或去泛素化活性。在一些实施方案中,任何Cas9蛋白可以与具有酶活性的蛋白质融合。在一些实施方案中,酶活性修饰与DNA相关的多肽(例如组蛋白)。在一些实施方案中,酶活性为甲基转移酶活性,脱甲基酶活性,乙酰转移酶活性,脱乙酰基酶活性,激酶活性,磷酸酶活性,泛素连接酶活性(即泛素化活性),去泛素化活性,腺苷酸化活性,去腺苷酸化活性,SUMO化活性,去SUMO化活性,核糖基化活性,去核糖基化活性,肉豆蔻酰化活性,去肉豆蔻酰化活性糖基化活性(例如来自O-GlcNAc转移酶)或去糖基化活性。本文列出的酶活性催化对蛋白质的共价修饰。本领域已知此类修饰可以改变靶蛋白的稳定性或活性(例如,由激酶活性引起的磷酸化可根据靶蛋白刺激或沉默蛋白活性)。特别感兴趣的蛋白质靶标是组蛋白。本领域已知组蛋白蛋白结合DNA并形成称为核小体的复合物。可以修饰组蛋白(例如通过甲基化,乙酰化,泛素化,磷酸化)以引起周围DNA的结构变化,从而控制潜在的大部分DNA对相互作用因子例如转录因子,聚合酶等的可接近性。单个组蛋白可以以许多不同方式和以许多不同组合进行修饰(例如,组蛋白3的赖氨酸27的三甲基化H3K27与阻抑转录的DNA区域相关联,而组蛋白3的赖氨酸4的三甲基化H3K4与活化转录的DNA区域相关联)。因此,具有组蛋白修饰活性的定点修饰多肽可用于DNA结构的位点特异性控制,并可用于改变靶DNA的选定区域中的组蛋白修饰模式。此类方法可用于研究和临床应用。在一些实施方案中,Cas9蛋白对具有不直接邻接规范PAM序列(5′-NGG-3′)的3’端或不具有规范PAM序列的靶序列展现出活性,所述活性为相比于SEQIDNO:9提供的酿脓链球菌Cas9对相同靶序列的活性增加至少5倍,至少10倍,至少50倍,至少100倍,至少500倍,至少1000倍,至少5000倍,至少10000倍,至少50000倍,至少100000倍,至少500000倍,或至少1000000倍。在一些实施方案中,靶序列的3’端直接邻接AGC,GAG,TTT,GTG,CAACAC,GAT,TAA,ACG,CGA或CGT序列。在一些实施方案中,Cas9蛋白活性通过核酸酶测定法或核酸结合测定法测量,其是本领域中已知的并将对于本领域技术人员显而易见。如本文所提供的,Cas9蛋白可以与一个或多个结构域融合,其赋予蛋白活性,例如核酸编辑活性(例如脱氨酶活性或转录活化活性),其可以测量(例如通过脱氨酶测定法或转录活化测定法)。在一些实施方案中,Cas9蛋白与脱氨酶结构域融合,且其活性可以使用脱氨酶测定法测量。在一些实施方案中,Cas9蛋白与转录活化结构域融合且其活性可以使用转录活化测定法测量,其中报告物例如GFP或萤光素酶等相应Cas9对靶序列的结合而表达。在一些实施方案中,Cas9蛋白的氨基酸序列包含本文提供的任何突变。例如,在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的X262T,X267G,X294R,X405I,X409I,X480K,X543D,X694I,X1219V,X1224K,X1256K和X1362P,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在其它实施方案中,突变可以是SEQIDNO:9中提供的氨基酸序列的A262T,S267G,K294R,F405I,S409I,E480K,E543D,M694I,E1219V,N1224K,Q1256K和L1362P,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含本文提供的任何突变。例如,在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的X262T,X294R,X409I,X480K,X543D,X694I和X1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在其它实施方案中,突变可以是SEQIDNO:9中提供的氨基酸序列的A262T,K294R,S409I,E480K,E543D,M694I或E1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X1219V突变或E1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X480K突变或E480K突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X543D突变或E543D突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的突变X480K,X543D和X1219V;或突变E480K,E543D和E1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的突变X262T,X409I,X480K,X543D,X694I和X1219V;或突变A262T,S409I,E480K,E543D,M694I和E1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的突变X294R,X480K,X543D,X1219V,X1256K和X1362P;或突变K294R,E480K,E543D,E1219V,Q1256K和L1362P,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的突变X294R,X480K,X543D,X1219V和X1256K;或突变K294R,E480K,E543D,E1219V和Q1256K,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的突变X267G,X294R,X480K,X543D,X1219V,X1224K和X1256K;或突变S267G,K294R,E480K,E543DE1219V,N1224K和Q1256K,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的突变X262T,X405I,X409I,X480K,X543D,X694I和X1219V;或突变A262T,F405I,S409I,E480K,E543D,M694I和E1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示任意氨基酸。在一些实施方案中,HNH结构域的氨基酸序列与SEQIDNO:9-262中任一项的HNH结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,HNH结构域的氨基酸序列与SEQIDNO:9-262中任一项的HNH结构域的氨基酸序列相同。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:9-262中任一项的RuvC结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:9-262中任一项的RuvC结构域的氨基酸序列相同。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和/或H840A突变或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10X1和/或H840X2突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X1是除D外的任何氨基酸,且X2是除H外的任意氨基酸。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的氨基酸残基840处的H,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应残基。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的氨基酸残基10处的D,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应残基。本公开的一些方面提供了融合蛋白,其包含与第二蛋白融合的本文提供的Cas9蛋白,从而形成融合蛋白。在一些实施方案中,第二蛋白与Cas9蛋白质的N端融合。在一些实施方案中,第二蛋白与Cas9蛋白质的C端融合。在一些实施方案中,Cas9结构域和效应结构域通过接头融合。接头可以像共价键一样简单,或者其可以是许多原子长度的聚合物接头。在某些实施方案中,接头是多肽或基于氨基酸。在其它实施方案中,接头不是肽样的。在某些实施方案中,接头是共价键(例如,碳-碳键,二硫键,碳-杂原子键等)。在某些实施方案中,接头是酰胺连接的碳-氮键。在某些实施方案中,接头是环状或无环的,取代或未取代的,支链或无支链的脂族或杂脂族接头。在某些实施方案中,接头是聚合物(例如聚乙烯,聚乙二醇,聚酰胺,聚酯等)。在某些实施方案中,接头包含氨基链烷酸的单体,二聚体或聚合物。在某些实施方案中,接头包含氨基链烷酸(例如甘氨酸,乙酸,丙氨酸,β-丙氨酸,3-氨基丙酸,4-氨基丁酸,5-戊酸等)。在某些实施方案中,接头包含氨基己酸(Ahx)的单体,二聚体或聚合物。在某些实施方案中,接头基于碳环部分(例如环戊烷,环己烷)。在其它实施方案中,接头包含聚乙二醇部分(PEG)。在其它实施方案中,接头包含氨基酸。在某些实施方案中,接头包含肽。在某些实施方案中,接头包含芳基或杂芳基部分。在某些实施方案中,接头基于苯环。接头可以包含官能化部分以促进来自肽的亲核体(例如硫醇,氨基)与接头的连接。任何亲电体可以用作接头的一部分。示例性亲电体包括但不限于活化酯,活化酰胺,Michael受体,烷基卤化物,芳基卤化物,酰基卤化物和异硫氰酸酯。在一些实施方案中,接头包含连接两个分子或部分例如融合蛋白的两个结构域,例如核酸酶失活的Cas9结构域和效应结构域(例如脱氨酶结构域)的化学基团或分子。在一些实施方案中,接头包含一个或多个氨基酸残基。例如,接头可以包含至少1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,25,30,35,40,45,50个或更多个氨基酸残基。在一些实施方案中,接头的长度为3,9,16或21个氨基酸。在一些实施方案中,接头包含(GGGGS)n(SEQIDNO:5),(G)n,(EAAAK)n(SEQIDNO:6),(GGS)n,SGSETPGTSESATPES(SEQIDNO:7)(也称为XTEN),或(XP)n基序或任何这些的组合,其中n独立地是1至30的整数。在一些实施方案中,其中接头包含(GGS)3基序或SGSETPGTSESATPES(SEQIDNO:7)(XTEN)基序。本公开的一些方面提供了融合蛋白,其包含与第二蛋白融合的本文提供的Cas9蛋白,从而形成融合蛋白。在一些实施方案中,第二蛋白与Cas9蛋白质的N端融合。在一些实施方案中,第二蛋白与Cas9蛋白质的C端融合。在一些实施方案中,Cas9结构域和效应结构域通过核酸定位序列(NLS)融合,例如包含氨基酸序列PKKKRKV(SEQIDNO:299),MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(SEQIDNO:300)或SPKKKRKVEAS(SEQIDNO:284)的NLS。在一些实施方案中,NLS可以与上文列出的任何接头组合。在一些实施方案中,效应结构域包含酶结构域。在一些实施方案中,效应结构域包含分别可以具有核酸酶活性,切口酶活性,重组酶活性,脱氨酶活性,甲基转移酶活性,甲基化酶活性,乙酰化酶活性,乙酰转移酶活性,转录活化活性或转录阻遏活性的核酸酶,切口酶,重组酶,脱氨酶,甲基转移酶,甲基化酶,乙酰化酶,乙酰转移酶,转录活化子或转录阻遏物结构域。在一些实施方案中,效应结构域是效应结构域。在一些实施方案中,效应结构域是脱氨酶结构域。在一些实施方案中,脱氨酶是胞嘧啶脱氨酶或胞苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白BmRNA编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,脱氨酶是APOBEC1脱氨酶。在一些实施方案中,脱氨酶是APOBEC2脱氨酶。在一些实施方案中,脱氨酶是APOBEC3脱氨酶。在一些实施方案中,脱氨酶是APOBEC3A脱氨酶。在一些实施方案中,脱氨酶是APOBEC3D脱氨酶。在一些实施方案中,脱氨酶是APOBEC3E脱氨酶。在一些实施方案中,脱氨酶是APOBEC3F脱氨酶。在一些实施方案中,脱氨酶是APOBEC3G脱氨酶。在一些实施方案中,脱氨酶是APOBEC3H脱氨酶。在一些实施方案中,脱氨酶是APOBEC4脱氨酶。在一些实施方案中,脱氨酶是活化诱导的脱氨酶(AID)。在一些实施方案中,效应结构域与SEQIDNO:263-291中任一项的脱氨酶结构域至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白BmRNA编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,脱氨酶是APOBEC1家族脱氨酶。在一些实施方案中,脱氨酶是活化诱导的胞苷脱氨酶(AID)。在一些实施方案中,脱氨酶是ACF1/ASE脱氨酶。在一些实施方案中,脱氨酶是腺苷脱氨酶。在一些实施方案中,脱氨酶是ADAT家族脱氨酶。本公开的一些方面提供了融合蛋白,其包含与效应结构域例如脱氨酶和尿嘧啶糖基化酶抑制剂(UGI)融合的Cas9蛋白。本公开的一些方面基于以下认识,即与不包含UGI结构域的融合蛋白相比,此类融合蛋白可以表现出增加的核酸编辑效率。已经描述了结构域例如脱氨酶结构域和UGI结构域,并在本公开的范围内。例如,已经在以下临时申请号中描述了结构域例如脱氨酶结构域和UGI结构域:2015年10月23日提交的62/245,828,2016年1月15日提交的62/279,346,2016年3月22日提交的临时申请62/311,763,2016年4月13日提交的62/322,178,2016年6月30日提交的62/357,352,2016年8月3日提交的62/370,700,2016年9月22日提交的62/398,490,和2016年10月14日提交的62/408,686;其每一个的全部内容通过引用并入本文。应该理解,前述参考文献中描述的脱氨酶结构域和UGI结构域在本公开的范围内,并且可以与本文提供的任何Cas9蛋白融合。在一些实施方案中,融合蛋白的效应结构域是核酸酶结构域。在一些实施方案中,核酸酶结构域是FokIDNA切割结构域。在一些实施方案中,融合蛋白二聚化。在某些实施方案中,融合蛋白的二聚体是有活性的。例如,两个Fok1DNA切割结构域可以二聚化以切割核酸。在一些实施方案中,Cas9蛋白与第二Cas9蛋白融合。在一些实施方案中,第二Cas9蛋白是权利要求1-345中任一项的Cas9蛋白。在一些实施方案中,第二Cas9蛋白与融合蛋白的N端融合。在一些实施方案中,第二Cas9蛋白与融合蛋白的C端融合。在一些实施方案中,Cas9蛋白和第二Cas9蛋白通过第二接头融合。在一些实施方案中,实施方案中,第二接头包含(GGGGS)n(SEQIDNO:5),a(G)n,(EAAAK)n(SEQIDNO:6),(GGS)n,SGSETPGTSESATPES(SEQIDNO:7)(也称为XTEN),或(XP)n基序或任何这些的组合,其中n独立地是1至30的整数。在一些实施方案中,第二接头包含(GGS)3基序。本公开的一些方面提供了包含本文提供的Cas9蛋白或Cas9融合蛋白和与Cas9蛋白或Cas9融合蛋白结合的引导RNA的复合物。在一些实施方案中,靶序列是DNA序列。在一些实施方案中,靶序列是哺乳动物基因组中的序列。在一些实施方案中,靶序列是人基因组中的序列。在一些实施方案中,靶序列的3'端不直接邻接规范PAM序列(5'-NGG-3')。本公开的一些方面提供了使用本文提供的Cas9蛋白,融合蛋白或复合物的方法。例如,本公开的一些方面方法,其包括使DNA分子与以下接触:(a)本文提供的Cas9蛋白或融合蛋白和引导RNA,其中所述指导RNA为约15-100个核苷酸长并且包含与靶序列互补的至少10个连续的核苷酸;或(b)本文提供的Cas9蛋白,Cas9融合蛋白,或与gRNA复合的Cas9蛋白,Cas9融合蛋白。在一些实施方案中,靶序列的3'端不直接邻接规范PAM序列(5'-NGG-3')。在一些实施方案中,靶序列的3'端紧邻AGC、GAG、TTT、GTG或CAA序列。在一些实施方案中,靶序列包含与疾病或病症相关的序列。在一些实施方案中,靶序列包含与疾病或病症相关的点突变。在一些实施方案中,Cas9蛋白,所述Cas9融合蛋白,或所述复合物导致点突变的修正。在一些实施方案中,接触的步骤在受试者体内进行。本公开的一些方面提供了试剂盒,其包含核酸构建体,所述核酸构建体包含:(a)编码本文提供的Cas9蛋白或Cas9融合蛋白的核苷酸序列;和(b)驱动(a)的序列的表达的异源启动子。在一些实施方案中,试剂盒还包含编码引导RNA骨架的表达构建体,其中所述表达构建体包含置于允许将于靶序列相同或互补的核酸序列克隆到所述引导RNA骨架中的克隆位点。本公开的一些方面提供编码本文提供的任何Cas9蛋白,Cas9融合蛋白,或与Cas9蛋白或Cas9融合蛋白结合的引导RNA的多核苷酸。本公开的一些方面提供包含此类多核苷酸的载体。在一些实施方案中,载体包含驱动多核苷酸的表达的异源启动子。本公开的一些方面提供了细胞,其包含本文提供的任何Cas9蛋白,融合蛋白,核酸分子和/或载体。以上概述意在以非限制方式说明本文公开的技术的一些实施方案,优点,特征和用途。本文公开的技术的其它实施方案,优点,特征和用途将从发明详述,附图,实施例和权利要求中显而易见。附图简述图1显示了野生型酿脓链球菌Cas9对规范PAM文库和非规范PAM文库的活性。图2显示了定向演化后示例性演化的Cas9克隆对PAM文库的活性。图3显示了哺乳动物GFP活化测定法中,野生型Cas9和演化的Cas9的比较。图4A至4B显示了使用GFP作为读出,Cas9(pJH306)和演化的Cas9蛋白与5'-NGG-3'PAM序列的结合活性。基于GFP荧光信号的增加,对于5'-NGG-3'PAM,许多演化的Cas9蛋白显示相对于野生型Cas9增加的Cas9结合活性。图4A是显示作为高于背景荧光的%细胞的函数的Cas9结合活性的图。图4B是显示作为平均荧光的函数的Cas9结合活性的图。在这些实验中使用的Cas9蛋白是与VPR转录活化子融合的dCas9蛋白。图5A至5B显示了使用GFP作为读出,野生型dCas9-VPR(pJH306)和演化的dCas9-VPR蛋白与NNNPAM序列的结合活性。基于GFP荧光信号的增加,对于NNNPAM文库,许多演化的Cas9蛋白显示相对于野生型Cas9增加的Cas9结合活性。图5A是显示作为高于背景荧光的%细胞的函数的Cas9结合活性的图。图5B是显示作为平均荧光的函数的Cas9结合活性的图。这些实验中使用的Cas9蛋白是与VPR融合的dCas9蛋白。图6显示了所有64个PAM序列上的dCas9-VPR,如通过由iRFP荧光门控的转染细胞上的平均荧光所证明的。WTdCas9-VPR是pJH306。图7显示了体外切割测定。在凝胶上,WT是野生型Cas9(SEQIDNO:9),并且1是具有E1219V突变的Cas9(SEQIDNO:9)。图8显示了可以用于调节PAM特异性的Cas9融合蛋白。显示了可用于增加对非规范PAM的Cas9靶向的连接的Cas9-dCas9系统的一种可能的配置。dCas9对5'-NGG-3'或另一PAM的结合可以将Cas9定位于接近靶2的区域。这种定位可以帮助Cas9切割先前无法接近的PAM。图9A至9B显示了dCas9-VPR对NNNNNPAM文库的结合活性。图9A是显示作为高于背景荧光的%细胞的函数的dCas9-VPR对NNNNNPAM文库的结合活性的图。图9B是显示作为平均荧光的函数的dCas9-VPR对NNNNNPAM文库的结合活性的图。图10显示了使用具有GFP损失的细胞的百分比作为读出的Cas9切割活性。使用两种sgRNA测试Cas9蛋白质,所述sgRNA靶向GFP基因内的规范5'-NGG-3'PAM或GATPAM。图11显示了由Cas9:DNA编辑酶:sgRNA复合物结合的双链DNA底物。DNA编辑酶可以是但不限于核酸酶,切口酶,重组酶,脱氨酶,甲基转移酶,甲基化酶,乙酰化酶或乙酰转移酶。图12A至12D显示了PAM耗竭(depletion)测定法的结果。对四种新靶标在PAM耗竭测定法中测试pJH760:re2(图12A),VEGF(图12B),CLTA(图12C)和CCR5D(图12D)。图13显示了哺乳动物细胞中的GFP切割。图14显示了测试pJH760(xCas9v1.0)对re2靶标的PAM耗竭测定法的结果。图15显示了测试pJH760(xCas9v1.0)对VEGF靶标的PAM耗竭测定法的结果。图16显示了测试pJH760(xCas9v1.0)对CLTA靶标的PAM耗竭测定法的结果。图17显示了测试pJH760(xCas9v1.0)对CCR5D靶标的PAM耗竭测定法的结果。图18显示了测试四种xCas9v3突变体对re2靶标的PAM耗竭测定法的结果。图19显示了测试四种xCas9v3突变体对VEGF靶标的PAM耗竭测定法的结果。图20显示了测试四种xCas9v3突变体对CLTA靶标的PAM耗竭测定法的结果。发明详述定义如本文所用和在权利要求中,除非上下文另有明确指示单数和复数形式单数形式“一个”,“一种”和“该”包括单数和复数引用。因此,例如对“试剂”的引用包括单个试剂和复数个此类试剂。术语“Cas9”或“Cas9核酸酶”是指包含Cas9蛋白或其片段的RNA引导的核酸酶(例如,包含Cas9的活性或失活DNA切割结构域,和/或Cas9的gRNA结合结构域的蛋白)。Cas9核酸酶有时也被称为casn1核酸酶或CRISPR(聚簇规则间隔短回文重复)相关核酸酶。CRISPR是一种适应性免疫系统,其提供针对移动遗传元件(病毒、转座元件和接合质粒)的保护。CRISPR簇含有间隔区,与先前的移动元件互补的序列,并靶向侵入核酸。CRISPR簇被转录并加工成CRISPRRNA(crRNA)。在II型CRISPR系统中,对pre-crRNA的正确加工需要反式编码的小RNA(tracrRNA),内源性核糖核酸酶3(rnc)和Cas9蛋白。tracrRNA可作为pre-crRNA的核糖核酸酶3辅助加工的引导。随后,Cas9/crRNA/tracrRNA内切地切割与间隔区互补的线性或环状dsDNA靶标。首先切割不与crRNA互补的靶链,然后以3'-5'外切核酸地切割。在自然界中,DNA结合和切割通常需要蛋白质和两种RNA。然而,单一引导RNA(“sgRNA”或简称“gNRA”)可以经工程化以将crRNA和tracrRNA两者的方面并入单一RNA种类中。参见例如JinekM.,ChylinskiK.,FonfaraI.,HauerM.,DoudnaJ.A.,CharpentierE.Science337:816-821(2012),其全部内容通过引用并入本文。Cas9识别CRISPR重复序列中的短基序(PAM或前间隔区相邻基序),以帮助区分自我与非自我。Cas9核酸酶序列和结构是本领域技术人员熟知的(参见例如“CompletegenomesequenceofanM1strainofStreptococcuspyogenes.”Ferrettietal.,J.J.,McShanW.M.,AjdicD.J.,SavicD.J.,SavicG.,LyonK.,PrimeauxC.,SezateS.,SuvorovA.N.,KentonS.,LaiH.S.,LinS.P.,QianY.,JiaH.G.,NajarF.Z.,RenQ.,ZhuH.,SongL.,WhiteJ.,YuanX.,CliftonS.W.,RoeB.A.,McLaughlinR.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPRRNAmaturationbytrans-encodedsmallRNAandhostfactorRNaseIII.”DeltchevaE.,ChylinskiK.,SharmaC.M.,GonzalesK.,ChaoY.,PirzadaZ.A.,EckertM.R.,VogelJ.,CharpentierE.,Nature471:602-607(2011);and“Aprogrammabledual-RNA-guidedDNAendonucleaseinadaptivebacterialimmunity.”JinekM.,ChylinskiK.,FonfaraI.,HauerM.,DoudnaJ.A.,CharpentierE.Science337:816-821(2012),其各自的全部内容通过引用并入本文)。已经在多种物种中描述了Cas9直系同源物,包括但不限于酿脓链球菌和嗜热链球菌。基于本公开,其它适合的Cas9核酸酶和序列对于本领域技术人员将是显而易见的,并且此类Cas9核酸酶和序列包括来自Chylinski,Rhun,andCharpentier,“ThetracrRNAandCas9familiesoftypeIICRISPR-Casimmunitysystems”(2013)RNABiology10:5,726-737中公开的物种和基因座的Cas9序列;其全部内容通过引用并入本文。在一些实施方案中,Cas9核酸酶具有无活性的(例如失活的)DNA切割结构域。核酸酶失活的Cas9蛋白可以互换地称为“dCas9”蛋白(对于核酸酶-“死的”Cas9)。生成具有无活性DNA切割结构域的Cas9的方法是已知的(参见例如Jineketal.,Science.337:816-821(2012);Qietal.,“RepurposingCRISPRasanRNA-GuidedPlatformforSequence-SpecificControlofGeneExpression”(2013)Cell.28;152(5):1173-83,其各自的全部内容通过引用并入本文)。例如,已知Cas9的DNA切割结构域包括两个亚结构域,即HNH核酸酶亚结构域和RuvC1亚结构域。HNH亚结构域切割与gRNA互补的链,而RuvC1亚结构域切割非互补链。这些亚结构域内的突变可以沉默Cas9的核酸酶活性。例如,突变D10A和H840A完全失活酿脓链球菌Cas9的核酸酶活性(Jineketal.,Science.337:816-821(2012);Qietal.,Cell.28;152(5):1173-83(2013)。在一些实施方案中,提供了包含Cas9的片段的蛋白质。例如,在一些实施方案中,蛋白质包含两个Cas9结构域的一个:(1)Cas9的gRNA结合结构域;或(2)Cas9的DNA切割结构域。在一些实施方案中,包含Cas9或其片段的蛋白质称为“Cas9变体”。Cas9变体与Cas9具有同源性。例如,Cas9变体与野生型Cas9至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同或至少约99.9%。在一些实施方案中,Cas9变体包含Cas9的片段(例如,gRNA结合结构域或DNA切割结构域),使得该片段与野生型Cas9的对应片段至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同或至少约99.9%。在一些实施方案中,野生型Cas9对应来自酿脓链球菌的Cas9(NCBI参考序列:NC_017053.1,SEQIDNO:1(核苷酸);SEQIDNO:2(氨基酸))。ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGATTATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGGCAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGCAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAATCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTAGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAGAAATGGCTTGTTTGGGAATCTCATTGCTTTGTCATTGGGATTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATAGTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAGCGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAGGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGCGCCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGGGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGATATTCAAAAAGCACAGGTGTCTGGACAAGGCCATAGTTTACATGAACAGATTGCTAACTTAGCTGGCAGTCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAATTGTTGATGAACTGGTCAAAGTAATGGGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTACAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCATTAAAGACGATTCAATAGACAATAAGGTACTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA(SEQIDNO:1)(单下划线:HNH结构域;双下划线:RuvC结构域)在一些实施方案中,野生型Cas9对应或包含SEQIDNO:3(核苷酸)和/或SEQIDNO:4(氨基酸):ATGGATAAAAAGTATTCTATTGGTTTAGACATCGGCACTAATTCCGTTGGATGGGCTGTCATAACCGATGAATACAAAGTACCTTCAAAGAAATTTAAGGTGTTGGGGAACACAGACCGTCATTCGATTAAAAAGAATCTTATCGGTGCCCTCCTATTCGATAGTGGCGAAACGGCAGAGGCGACTCGCCTGAAACGAACCGCTCGGAGAAGGTATACACGTCGCAAGAACCGAATATGTTACTTACAAGAAATTTTTAGCAATGAGATGGCCAAAGTTGACGATTCTTTCTTTCACCGTTTGGAAGAGTCCTTCCTTGTCGAAGAGGACAAGAAACATGAACGGCACCCCATCTTTGGAAACATAGTAGATGAGGTGGCATATCATGAAAAGTACCCAACGATTTATCACCTCAGAAAAAAGCTAGTTGACTCAACTGATAAAGCGGACCTGAGGTTAATCTACTTGGCTCTTGCCCATATGATAAAGTTCCGTGGGCACTTTCTCATTGAGGGTGATCTAAATCCGGACAACTCGGATGTCGACAAACTGTTCATCCAGTTAGTACAAACCTATAATCAGTTGTTTGAAGAGAACCCTATAAATGCAAGTGGCGTGGATGCGAAGGCTATTCTTAGCGCCCGCCTCTCTAAATCCCGACGGCTAGAAAACCTGATCGCACAATTACCCGGAGAGAAGAAAAATGGGTTGTTCGGTAACCTTATAGCGCTCTCACTAGGCCTGACACCAAATTTTAAGTCGAACTTCGACTTAGCTGAAGATGCCAAATTGCAGCTTAGTAAGGACACGTACGATGACGATCTCGACAATCTACTGGCACAAATTGGAGATCAGTATGCGGACTTATTTTTGGCTGCCAAAAACCTTAGCGATGCAATCCTCCTATCTGACATACTGAGAGTTAATACTGAGATTACCAAGGCGCCGTTATCCGCTTCAATGATCAAAAGGTACGATGAACATCACCAAGACTTGACACTTCTCAAGGCCCTAGTCCGTCAGCAACTGCCTGAGAAATATAAGGAAATATTCTTTGATCAGTCGAAAAACGGGTACGCAGGTTATATTGACGGCGGAGCGAGTCAAGAGGAATTCTACAAGTTTATCAAACCCATATTAGAGAAGATGGATGGGACGGAAGAGTTGCTTGTAAAACTCAATCGCGAAGATCTACTGCGAAAGCAGCGGACTTTCGACAACGGTAGCATTCCACATCAAATCCACTTAGGCGAATTGCATGCTATACTTAGAAGGCAGGAGGATTTTTATCCGTTCCTCAAAGACAATCGTGAAAAGATTGAGAAAATCCTAACCTTTCGCATACCTTACTATGTGGGACCCCTGGCCCGAGGGAACTCTCGGTTCGCATGGATGACAAGAAAGTCCGAAGAAACGATTACTCCATGGAATTTTGAGGAAGTTGTCGATAAAGGTGCGTCAGCTCAATCGTTCATCGAGAGGATGACCAACTTTGACAAGAATTTACCGAACGAAAAAGTATTGCCTAAGCACAGTTTACTTTACGAGTATTTCACAGTGTACAATGAACTCACGAAAGTTAAGTATGTCACTGAGGGCATGCGTAAACCCGCCTTTCTAAGCGGAGAACAGAAGAAAGCAATAGTAGATCTGTTATTCAAGACCAACCGCAAAGTGACAGTTAAGCAATTGAAAGAGGACTACTTTAAGAAAATTGAATGCTTCGATTCTGTCGAGATCTCCGGGGTAGAAGATCGATTTAATGCGTCACTTGGTACGTATCATGACCTCCTAAAGATAATTAAAGATAAGGACTTCCTGGATAACGAAGAGAATGAAGATATCTTAGAAGATATAGTGTTGACTCTTACCCTCTTTGAAGATCGGGAAATGATTGAGGAAAGACTAAAAACATACGCTCACCTGTTCGACGATAAGGTTATGAAACAGTTAAAGAGGCGTCGCTATACGGGCTGGGGACGATTGTCGCGGAAACTTATCAACGGGATAAGAGACAAGCAAAGTGGTAAAACTATTCTCGATTTTCTAAAGAGCGACGGCTTCGCCAATAGGAACTTTATGCAGCTGATCCATGATGACTCTTTAACCTTCAAAGAGGATATACAAAAGGCACAGGTTTCCGGACAAGGGGACTCATTGCACGAACATATTGCGAATCTTGCTGGTTCGCCAGCCATCAAAAAGGGCATACTCCAGACAGTCAAAGTAGTGGATGAGCTAGTTAAGGTCATGGGACGTCACAAACCGGAAAACATTGTAATCGAGATGGCACGCGAAAATCAAACGACTCAGAAGGGGCAAAAAAACAGTCGAGAGCGGATGAAGAGAATAGAAGAGGGTATTAAAGAACTGGGCAGCCAGATCTTAAAGGAGCATCCTGTGGAAAATACCCAATTGCAGAACGAGAAACTTTACCTCTATTACCTACAAAATGGAAGGGACATGTATGTTGATCAGGAACTGGACATAAACCGTTTATCTGATTACGACGTCGATCACATTGTACCCCAATCCTTTTTGAAGGACGATTCAATCGACAATAAAGTGCTTACACGCTCGGATAAGAACCGAGGGAAAAGTGACAATGTTCCAAGCGAGGAAGTCGTAAAGAAAATGAAGAACTATTGGCGGCAGCTCCTAAATGCGAAACTGATAACGCAAAGAAAGTTCGATAACTTAACTAAAGCTGAGAGGGGTGGCTTGTCTGAACTTGACAAGGCCGGATTTATTAAACGTCAGCTCGTGGAAACCCGCCAAATCACAAAGCATGTTGCACAGATACTAGATTCCCGAATGAATACGAAATACGACGAGAACGATAAGCTGATTCGGGAAGTCAAAGTAATCACTTTAAAGTCAAAATTGGTGTCGGACTTCAGAAAGGATTTTCAATTCTATAAAGTTAGGGAGATAAATAACTACCACCATGCGCACGACGCTTATCTTAATGCCGTCGTAGGGACCGCACTCATTAAGAAATACCCGAAGCTAGAAAGTGAGTTTGTGTATGGTGATTACAAAGTTTATGACGTCCGTAAGATGATCGCGAAAAGCGAACAGGAGATAGGCAAGGCTACAGCCAAATACTTCTTTTATTCTAACATTATGAATTTCTTTAAGACGGAAATCACTCTGGCAAACGGAGAGATACGCAAACGACCTTTAATTGAAACCAATGGGGAGACAGGTGAAATCGTATGGGATAAGGGCCGGGACTTCGCGACGGTGAGAAAAGTTTTGTCCATGCCCCAAGTCAACATAGTAAAGAAAACTGAGGTGCAGACCGGAGGGTTTTCAAAGGAATCGATTCTTCCAAAAAGGAATAGTGATAAGCTCATCGCTCGTAAAAAGGACTGGGACCCGAAAAAGTACGGTGGCTTCGATAGCCCTACAGTTGCCTATTCTGTCCTAGTAGTGGCAAAAGTTGAGAAGGGAAAATCCAAGAAACTGAAGTCAGTCAAAGAATTATTGGGGATAACGATTATGGAGCGCTCGTCTTTTGAAAAGAACCCCATCGACTTCCTTGAGGCGAAAGGTTACAAGGAAGTAAAAAAGGATCTCATAATTAAACTACCAAAGTATAGTCTGTTTGAGTTAGAAAATGGCCGAAAACGGATGTTGGCTAGCGCCGGAGAGCTTCAAAAGGGGAACGAACTCGCACTACCGTCTAAATACGTGAATTTCCTGTATTTAGCGTCCCATTACGAGAAGTTGAAAGGTTCACCTGAAGATAACGAACAGAAGCAACTTTTTGTTGAGCAGCACAAACATTATCTCGACGAAATCATAGAGCAAATTTCGGAATTCAGTAAGAGAGTCATCCTAGCTGATGCCAATCTGGACAAAGTATTAAGCGCATACAACAAGCACAGGGATAAACCCATACGTGAGCAGGCGGAAAATATTATCCATTTGTTTACTCTTACCAACCTCGGCGCTCCAGCCGCATTCAAGTATTTTGACACAACGATAGATCGCAAACGATACACTTCTACCAAGGAGGTGCTAGACGCGACACTGATTCACCAATCCATCACGGGATTATATGAAACTCGGATAGATTTGTCACAGCTTGGGGGTGACGGATCCCCCAAGAAGAAGAGGAAAGTCTCGAGCGACTACAAAGACCATGACGGTGATTATAAAGATCATGACATCGATTACAAGGATGACGATGACAAGGCTGCAGGA(SEQIDNO:3)(单下划线:HNH结构域;双下划线:RuvC结构域)在一些实施方案中,野生型Cas9对应酿脓链球菌的Cas9(NCBI参考序列:NC_002737.2,SEQIDNO:282(核苷酸);和Uniport参考序列:Q99ZW2,SEQIDNO:9(氨基酸)。ATGGATAAGAAATACTCAATAGGCTTAGATATCGGCACAAATAGCGTCGGATGGGCGGTGATCACTGATGAATATAAGGTTCCGTCTAAAAAGTTCAAGGTTCTGGGAAATACAGACCGCCACAGTATCAAAAAAAATCTTATAGGGGCTCTTTTATTTGACAGTGGAGAGACAGCGGAAGCGACTCGTCTCAAACGGACAGCTCGTAGAAGGTATACACGTCGGAAGAATCGTATTTGTTATCTACAGGAGATTTTTTCAAATGAGATGGCGAAAGTAGATGATAGTTTCTTTCATCGACTTGAAGAGTCTTTTTTGGTGGAAGAAGACAAGAAGCATGAACGTCATCCTATTTTTGGAAATATAGTAGATGAAGTTGCTTATCATGAGAAATATCCAACTATCTATCATCTGCGAAAAAAATTGGTAGATTCTACTGATAAAGCGGATTTGCGCTTAATCTATTTGGCCTTAGCGCATATGATTAAGTTTCGTGGTCATTTTTTGATTGAGGGAGATTTAAATCCTGATAATAGTGATGTGGACAAACTATTTATCCAGTTGGTACAAACCTACAATCAATTATTTGAAGAAAACCCTATTAACGCAAGTGGAGTAGATGCTAAAGCGATTCTTTCTGCACGATTGAGTAAATCAAGACGATTAGAAAATCTCATTGCTCAGCTCCCCGGTGAGAAGAAAAATGGCTTATTTGGGAATCTCATTGCTTTGTCATTGGGTTTGACCCCTAATTTTAAATCAAATTTTGATTTGGCAGAAGATGCTAAATTACAGCTTTCAAAAGATACTTACGATGATGATTTAGATAATTTATTGGCGCAAATTGGAGATCAATATGCTGATTTGTTTTTGGCAGCTAAGAATTTATCAGATGCTATTTTACTTTCAGATATCCTAAGAGTAAATACTGAAATAACTAAGGCTCCCCTATCAGCTTCAATGATTAAACGCTACGATGAACATCATCAAGACTTGACTCTTTTAAAAGCTTTAGTTCGACAACAACTTCCAGAAAAGTATAAAGAAATCTTTTTTGATCAATCAAAAAACGGATATGCAGGTTATATTGATGGGGGAGCTAGCCAAGAAGAATTTTATAAATTTATCAAACCAATTTTAGAAAAAATGGATGGTACTGAGGAATTATTGGTGAAACTAAATCGTGAAGATTTGCTGCGCAAGCAACGGACCTTTGACAACGGCTCTATTCCCCATCAAATTCACTTGGGTGAGCTGCATGCTATTTTGAGAAGACAAGAAGACTTTTATCCATTTTTAAAAGACAATCGTGAGAAGATTGAAAAAATCTTGACTTTTCGAATTCCTTATTATGTTGGTCCATTGGCGCGTGGCAATAGTCGTTTTGCATGGATGACTCGGAAGTCTGAAGAAACAATTACCCCATGGAATTTTGAAGAAGTTGTCGATAAAGGTGCTTCAGCTCAATCATTTATTGAACGCATGACAAACTTTGATAAAAATCTTCCAAATGAAAAAGTACTACCAAAACATAGTTTGCTTTATGAGTATTTTACGGTTTATAACGAATTGACAAAGGTCAAATATGTTACTGAAGGAATGCGAAAACCAGCATTTCTTTCAGGTGAACAGAAGAAAGCCATTGTTGATTTACTCTTCAAAACAAATCGAAAAGTAACCGTTAAGCAATTAAAAGAAGATTATTTCAAAAAAATAGAATGTTTTGATAGTGTTGAAATTTCAGGAGTTGAAGATAGATTTAATGCTTCATTAGGTACCTACCATGATTTGCTAAAAATTATTAAAGATAAAGATTTTTTGGATAATGAAGAAAATGAAGATATCTTAGAGGATATTGTTTTAACATTGACCTTATTTGAAGATAGGGAGATGATTGAGGAAAGACTTAAAACATATGCTCACCTCTTTGATGATAAGGTGATGAAACAGCTTAAACGTCGCCGTTATACTGGTTGGGGACGTTTGTCTCGAAAATTGATTAATGGTATTAGGGATAAGCAATCTGGCAAAACAATATTAGATTTTTTGAAATCAGATGGTTTTGCCAATCGCAATTTTATGCAGCTGATCCATGATGATAGTTTGACATTTAAAGAAGACATTCAAAAAGCACAAGTGTCTGGACAAGGCGATAGTTTACATGAACATATTGCAAATTTAGCTGGTAGCCCTGCTATTAAAAAAGGTATTTTACAGACTGTAAAAGTTGTTGATGAATTGGTCAAAGTAATGGGGCGGCATAAGCCAGAAAATATCGTTATTGAAATGGCACGTGAAAATCAGACAACTCAAAAGGGCCAGAAAAATTCGCGAGAGCGTATGAAACGAATCGAAGAAGGTATCAAAGAATTAGGAAGTCAGATTCTTAAAGAGCATCCTGTTGAAAATACTCAATTGCAAAATGAAAAGCTCTATCTCTATTATCTCCAAAATGGAAGAGACATGTATGTGGACCAAGAATTAGATATTAATCGTTTAAGTGATTATGATGTCGATCACATTGTTCCACAAAGTTTCCTTAAAGACGATTCAATAGACAATAAGGTCTTAACGCGTTCTGATAAAAATCGTGGTAAATCGGATAACGTTCCAAGTGAAGAAGTAGTCAAAAAGATGAAAAACTATTGGAGACAACTTCTAAACGCCAAGTTAATCACTCAACGTAAGTTTGATAATTTAACGAAAGCTGAACGTGGAGGTTTGAGTGAACTTGATAAAGCTGGTTTTATCAAACGCCAATTGGTTGAAACTCGCCAAATCACTAAGCATGTGGCACAAATTTTGGATAGTCGCATGAATACTAAATACGATGAAAATGATAAACTTATTCGAGAGGTTAAAGTGATTACCTTAAAATCTAAATTAGTTTCTGACTTCCGAAAAGATTTCCAATTCTATAAAGTACGTGAGATTAACAATTACCATCATGCCCATGATGCGTATCTAAATGCCGTCGTTGGAACTGCTTTGATTAAGAAATATCCAAAACTTGAATCGGAGTTTGTCTATGGTGATTATAAAGTTTATGATGTTCGTAAAATGATTGCTAAGTCTGAGCAAGAAATAGGCAAAGCAACCGCAAAATATTTCTTTTACTCTAATATCATGAACTTCTTCAAAACAGAAATTACACTTGCAAATGGAGAGATTCGCAAACGCCCTCTAATCGAAACTAATGGGGAAACTGGAGAAATTGTCTGGGATAAAGGGCGAGATTTTGCCACAGTGCGCAAAGTATTGTCCATGCCCCAAGTCAATATTGTCAAGAAAACAGAAGTACAGACAGGCGGATTCTCCAAGGAGTCAATTTTACCAAAAAGAAATTCGGACAAGCTTATTGCTCGTAAAAAAGACTGGGATCCAAAAAAATATGGTGGTTTTGATAGTCCAACGGTAGCTTATTCAGTCCTAGTGGTTGCTAAGGTGGAAAAAGGGAAATCGAAGAAGTTAAAATCCGTTAAAGAGTTACTAGGGATCACAATTATGGAAAGAAGTTCCTTTGAAAAAAATCCGATTGACTTTTTAGAAGCTAAAGGATATAAGGAAGTTAAAAAAGACTTAATCATTAAACTACCTAAATATAGTCTTTTTGAGTTAGAAAACGGTCGTAAACGGATGCTGGCTAGTGCCGGAGAATTACAAAAAGGAAATGAGCTGGCTCTGCCAAGCAAATATGTGAATTTTTTATATTTAGCTAGTCATTATGAAAAGTTGAAGGGTAGTCCAGAAGATAACGAACAAAAACAATTGTTTGTGGAGCAGCATAAGCATTATTTAGATGAGATTATTGAGCAAATCAGTGAATTTTCTAAGCGTGTTATTTTAGCAGATGCCAATTTAGATAAAGTTCTTAGTGCATATAACAAACATAGAGACAAACCAATACGTGAACAAGCAGAAAATATTATTCATTTATTTACGTTGACGAATCTTGGAGCTCCCGCTGCTTTTAAATATTTTGATACAACAATTGATCGTAAACGATATACGTCTACAAAAGAAGTTTTAGATGCCACTCTTATCCATCAATCCATCACTGGTCTTTATGAAACACGCATTGATTTGAGTCAGCTAGGAGGTGACTGA(SEQIDNO:282)(单下划线:HNH结构域;双下划线:RuvC结构域)在一些实施方案中,Cas9是指来自以下的Cas9:溃疡棒状杆菌(Corynebacteriumulcerans)(NCBIRefs:NC_015683.1,NC_017317.1);白喉棒状杆菌(NCBIRefs:NC_016782.1,NC_016786.1);Spiroplasmasyrphidicola(NCBIRef:NC_021284.1);中间普雷沃菌(NCBIRef:NC_017861.1);Spiroplasmataiwanense(NCBIRef:NC_021846.1);海豚链球菌(NCBIRef:NC_021314.1);Belliellabaltica(NCBIRef:NC_018010.1);PsychroflexustorquisI(NCBIRef:NC_018721.1);嗜热链球菌(NCBIRef:YP_820832.1);无害利斯特菌(NCBIRef:NP_472073.1);空肠弯曲杆菌(NCBIRef:YP_002344900.1);或Neisseria.meningitidis(NCBIRef:YP_002342100.1),或来自实施例3中列出的任何生物体的Cas9。在一些实施方案中,dCas9对应于或包含部分或全部的Cas9氨基酸序列,所述氨Cas9氨基酸序列具有一个或多个使Cas9核酸酶活性失活的突变。例如,在一些实施方案中,dCas9结构域包含D10A和/或H840A突变。dCas9(D10A和H840A):(单下划线:HNH结构域;双下划线:RuvC结构域)在一些实施方案中,Cas9对应于或包含部分或全部的Cas9氨基酸序列,所述Cas9氨基酸序列具有改变Cas9核酸酶活性的一个或多个突变。在一些实施方案中,Cas9可以是Cas9切口酶,其是基于共表达的gRNA限定的靶序列在特定位置生成单链DNA断裂的而不是双链DNA断裂的Cas9形式。例如,在一些实施方案中,Cas9结构域包含D10A突变(例如SEQIDNO:301)和/或H840A突变(例如SEQIDNO:302)。示例性的Cas9切口酶如下所示。然而,应该理解,产生DNA双链体的单链DNA断裂的另外的Cas9切口酶对于本领域技术人员是显而易见的并且在本公开的范围内。Cas9D10A切口酶:(单下划线:HNH结构域;双下划线:RuvC结构域)Cas9H840A切口酶:(单下划线:HNH结构域;双下划线:RuvC结构域)在其它实施方案中,提供了具有不同于D10A和H840A的突变的dCas9变体,其例如导致核酸酶失活的Cas9(dCas9)。举例来说,此类突变包括D10和H820处的其它氨基酸取代,或Cas9的核酸酶结构域内的其它取代(例如,HNH核酸酶亚结构域和/或RuvC1亚结构域中的取代)。在一些实施方案中,提供dCas9的变体或同系物(例如SEQIDNO:9的变体),其与SEQIDNO:9少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同或至少约99.9%相同。在一些实施方案中,提供dCas9的变体(例如SEQIDNO:9的变体),其具有比SEQIDNO:9短或长约5个氨基酸,约10个氨基酸,约15个氨基酸,约20个氨基酸,约约25个氨基酸,约30个氨基酸,约40个氨基酸,约50个氨基酸,约75个氨基酸,约100个氨基酸或更多的氨基酸序列。在一些实施方案中,本文提供的Cas9融合蛋白包含Cas9蛋白的全长氨基酸序列,例如上文提供的序列之一。然而,在其它实施方案中,本文提供的融合蛋白不包含全长Cas9序列,而仅包含其片段。例如,在一些实施方案中,本文提供的Cas9融合蛋白包含Cas9片段,其中所述片段结合crRNA和tracrRNA或sgRNA,但不包含功能性核酸酶结构域,例如其仅包含截短形式的核酸酶结构域或根本没有核酸酶结构域。本文提供了适合的Cas9结构域和Cas9片段的示例性氨基酸序列,并且对于本领域技术人员来说,Cas9结构域和Cas9片段的另外适合的序列将是显而易见的。在一些实施方案中,Cas9片段是相应野生型Cas9蛋白的氨基酸长度的至少30%,至少35%,至少40%,至少45%,至少50%,至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少99.5%。在一些实施方案中,Cas9片段包含至少100个氨基酸长度。在一些实施方案中,Cas9片段是相应野生型Cas9蛋白的至少100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550或至少1600个氨基酸。在一些实施方案中,Cas9片段包含氨基酸序列,其具有至少10个,至少15个,至少20个,至少30个,至少40个,至少50个,至少60个,至少70个,至少80个,至少90个,至少100个,至少150个,至少200个,至少250个,至少300个,至少350个,至少400个,至少500个,至少600个,至少700个,至少800个,至少900个,至少1000个,至少1100个或至少1200个相应野生型Cas9蛋白的相同的连续氨基酸残基。Cas9。在一些实施方案中,Cas9是指来自以下的Cas9:溃疡棒状杆菌(Corynebacteriumulcerans)(NCBIRefs:NC_015683.1,NC_017317.1);白喉棒状杆菌(NCBIRefs:NC_016782.1,NC_016786.1);Spiroplasmasyrphidicola(NCBIRef:NC_021284.1);中间普雷沃菌(NCBIRef:NC_017861.1);Spiroplasmataiwanense(NCBIRef:NC_021846.1);海豚链球菌(NCBIRef:NC_021314.1);Belliellabaltica(NCBIRef:NC_018010.1);PsychroflexustorquisI(NCBIRef:NC_018721.1);嗜热链球菌(NCBIRef:YP_820832.1);无害利斯特菌(NCBIRef:NP_472073.1);空肠弯曲杆菌(NCBIRef:YP_002344900.1);或Neisseria.meningitidis(NCBIRef:YP_002342100.1)。如本文所用,术语“脱氨酶”或者“脱氨酶结构域”是指催化脱氨反应的蛋白质或酶。在一些实施方案中,脱氨酶或脱氨酶结构域是胞苷脱氨酶,催化胞苷或脱氧胞苷分别水解脱氨基为尿苷或脱氧尿苷。在一些实施方案中,脱氨酶或脱氨酶结构域是胞嘧啶脱氨酶,催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,脱氨基酶或脱氨酶结构域是来自生物体例如人,黑猩猩,大猩猩,猴,牛,狗,大鼠或小鼠的天然存在的脱氨酶。在一些实施方案中,脱氨酶或脱氨酶结构域是来自生物体的天然存在的脱氨酶的变体,其在自然界中不存在。例如,在一些实施方案中,脱氨酶或脱氨酶结构域与来自生物体的天然存在的脱氨酶至少50%,至少55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。如本文所用,术语“有效量”是指足以引起期望的生物学反应的生物活性剂的量。例如,在一些实施方案中,有效量的核酸酶可以指足以诱导核酸酶特异性结合和切割的靶位点的切割的核酸酶的量。在一些实施方案中,本文提供的有效量的融合蛋白,例如包含核酸酶失活的Cas9结构域和效应结构域(例如脱氨酶结构域)的融合蛋白可以指融合蛋白的量足以诱导所述融合蛋白特异性结合和编辑的靶位点的编辑。正如本领域技术人员将理解的,有效量的试剂,例如融合蛋白,核酸酶,脱氨酶,重组酶,杂合蛋白,蛋白质二聚体,蛋白质(或蛋白质二聚体)和多核苷酸的复合物,或多核苷酸可以根据各种因素而变化,例如根据期望的生物学反应,例如待编辑的特定等位基因,基因组或靶位点;靶向的细胞或组织;和使用的试剂。在两个核酸序列的语境中使用的术语“紧邻(immediatelyadjacent)”是指两个序列彼此直接连接作为同一核酸分子的一部分且不被一个或多个核苷酸分开。因此,当序列之一的3'端的核苷酸通过磷酸二酯键直接连接到另一序列的5'端的核苷酸时,序列紧邻。如本文所用的术语“接头”是指连接两个分子或部分例如融合蛋白的两个结构域,例如核酸酶失活的Cas9结构域和效应结构域(例如脱氨酶结构域)的化学基团或分子。在一些实施方案中,接头连接RNA可编程核酸酶的gRNA结合结构域(包括Cas9核酸酶结构域)和核酸编辑蛋白的催化结构域。在一些实施方案中,接头连接包括Cas9核酸酶结构域的RNA可编程核酸酶的gRNA结合结构域,和核酸编辑蛋白的催化结构域。在一些实施方案中,接头连接dCas9和核酸编辑蛋白。典型地,接头位于两个基团,分子或其它部分之间或两侧,并且通过共价键与每个基团连接,从而连接两个基团。在一些实施方案中,接头是氨基酸或多个氨基酸(例如肽或蛋白质)。在一些实施方案中,接头是有机分子,基团,聚合物或化学部分。在一些实施方案中,所述接头的长度为5-100个氨基酸,例如长度为5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,30-35,35-40,40-45,45-50,50-60,60-70,70-80,80-90,90-100,100-150或150-200个氨基酸。也考虑更长或更短的接头。如本文所使用的术语“突变”是指序列(例如核酸或氨基酸序列)内的残基被另一个残基取代,或序列内的一个或多个残基的缺失或插入。本文通常通过鉴定原始残基,随后是序列内残基的位置和新取代的残基的身份来描述突变。用于制备本文提供的氨基酸取代(突变)的各种方法在本领域中是公知的,并且由例如GreenandSambrook,MolecularCloning:ALaboratoryManual(4thed.,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(2012))提供。如本文所用的术语“核酸”和“核酸分子”是指包含核碱基和酸性部分(例如核苷,核苷酸或核苷酸的聚合物)的化合物。典型地,聚合核酸,例如包含三个或更多个核苷酸的核酸分子是线性分子,其中相邻的核苷酸通过磷酸二酯键彼此连接。在一些实施方案中,“核酸”是指单个核酸残基(例如核苷酸和/或核苷)。在一些实施方案中,“核酸”是指包含三个或更多个单独核苷酸残基的寡核苷酸链。如本文所用,术语“寡核苷酸”和“多核苷酸”可互换使用以指核苷酸的聚合物(例如,至少3个核苷酸的链)。在一些实施方案中,“核酸”涵盖RNA以及单链和/或双链DNA。核酸可以是天然存在的,例如在基因组,转录物,mRNA,tRNA,rRNA,siRNA,snRNA,质粒,粘粒,染色体,染色单体或其它天然存在的核酸分子的背景下。另一方面,核酸分子可以是非天然存在的分子,例如重组DNA或RNA,人工染色体,工程化基因组或其片段,或合成DNA,RNA,DNA/RNA杂交体,或包括非天然存在的核苷酸或核苷。此外,术语“核酸”,“DNA”,“RNA”和/或类似术语包括核酸类似物,例如具有除磷酸二酯主链以外的类似物。核酸可以从天然来源纯化,使用重组表达系统产生并任选纯化,化学合成等。在适合的情况下,例如在化学合成分子的情况下,核酸可以包含核苷类似物,例如具有化学修饰的碱基或糖,和骨架修饰的类似物。除非另有说明,核酸序列以5'至3'方向呈现。在一些实施方案中,核酸是或包含天然核苷(例如腺苷,胸苷,鸟苷,胞苷,尿苷,脱氧腺苷,脱氧胸苷,脱氧鸟苷和脱氧胞苷);核苷类似物(例如2-氨基腺苷,2-硫代胸苷,肌苷,吡咯并嘧啶,3-甲基腺苷,5-甲基胞苷,2-氨基腺苷,C5-溴尿苷,C5-氟尿苷,C5-碘尿苷,C5-丙炔基-尿苷,C5-丙炔基-胞苷,C5-甲基胞苷,2-氨基腺苷,7-脱氮腺苷,7-脱氮鸟苷,8-氧代腺苷,8-氧代鸟苷,O(6)-甲基鸟嘌呤和2-硫代胞苷);化学修饰的碱基;生物修饰的碱基(例如甲基化碱基);插入的碱基;修饰的糖(例如2'-氟核糖,核糖,2'-脱氧核糖,阿拉伯糖和己糖);和/或修饰的磷酸基团(例如硫代磷酸酯和5'-N-亚磷酰胺连接)。在一些实施方案中,RNA是与Cas9系统相关的RNA。例如,RNA可以是CRISPRRNA(crRNA),反式编码的小RNA(tracrRNA),单引导RNA(sgRNA)或引导RNA(gRNA)。如本文所用,术语“增殖性疾病”是指其中细胞或组织稳态受到干扰的任何疾病,因为细胞或细胞群表现出异常升高的增殖速率。增殖性疾病包括过度增殖性疾病,如肿瘤前期增生性状况和肿瘤性疾病。肿瘤性疾病的特征是细胞的异常增殖,并包括良性和恶性肿瘤。恶性肿瘤也称为癌症。术语“蛋白质”,“肽”和“多肽”在本文中可互换使用,并且指通过肽(酰胺)键连接在一起的氨基酸残基的聚合物。该术语指具有任何大小,结构或功能的蛋白质,肽或多肽。通常,蛋白质,肽或多肽将是至少三个氨基酸长。蛋白质,肽或多肽可以指单个蛋白质或蛋白质集合。蛋白质,肽或多肽中的一个或多个氨基酸可以被修饰,例如通过添加化学实体如碳水化合物基团,羟基,磷酸基团,法呢基,异法呢基,脂肪酸基团,用于偶联,官能化或其它修饰的接头等。蛋白质,肽或多肽也可以是单个分子或可以是多分子复合物。蛋白质,肽或多肽可以仅仅是天然存在的蛋白质或肽的片段。蛋白质,肽或多肽可以是天然存在的,重组的或合成的,或其任何组合。如本文所用的术语“融合蛋白”是指包含来自至少两种不同蛋白质的蛋白质结构域的杂合多肽。一种蛋白质可以位于融合蛋白的氨基末端(N-末端)或羧基末端(C-末端),从而分别形成“氨基末端融合蛋白”或“羧基末端融合蛋白”。蛋白质可以包含不同的结构域,例如核酸结合结构域(例如指导蛋白质与靶位点结合的Cas9的gRNA结合结构域)和核酸编辑蛋白的核酸切割结构域或催化结构域。在一些实施方案中,蛋白质包含蛋白质部分,例如构成核酸结合结构域的氨基酸序列,和有机化合物,例如可以作为核酸切割试剂的化合物。在一些实施方案中,蛋白质与核酸例如RNA复合或相关联。本文提供的任何蛋白质可以通过本领域已知的任何方法产生。例如,本文提供的蛋白质可以通过重组蛋白质表达和纯化产生,其特别适用于包含肽接头的融合蛋白。用于重组蛋白质表达和纯化的方法是公知的,并且包括GreenandSambrook,MolecularCloning:ALaboratoryManual(4thed.,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.(2012))描述的那些,其全部内容通过引用并入本文。术语“RNA可编程核酸酶”和“RNA引导的核酸酶”在本文中可互换使用,并且是指与一个或多个不是切割靶标的RNA形成复合物(例如,结合或相关联)的核酸酶。在一些实施方案中,当与RNA形成复合物时,RNA可编程核酸酶可以称为核酸酶:RNA复合物。通常,结合的RNA称为引导RNA(gRNA)。gRNA可以作为两种或更多种RNA的复合物或者作为单个RNA分子存在。作为单个RNA分子存在的gRNA可以称为单引导RNA(sgRNA),尽管“gRNA”可互换使用以指作为单分子或作为两个或更多个分子的复合物存在的引导RNA。典型地,作为单一RNA种类存在的gRNA包含两个结构域:(1)与靶核酸共享同源性的结构域(例如,并指导Cas9复合物对靶物的结合);和(2)结合Cas9蛋白的结构域。在一些实施方案中,结构域(2)对应称为tracrRNA的序列,并且包含茎-环结构。例如,在一些实施方案中,结构域(2)与Jineketal.,Science337:816-821(2012)中提供的tracrRNA相同或同源,其全部内容通过引用并入本文。gRNA的其它实例(例如包括结构域2的那些)可以在2013年9月6日提交的题为“SwitchableCas9NucleasesandUsesThereof”的美国临时专利申请U.S.S.N.61/874,682和2013年9月6号提交的题为“DeliverySystemForFunctionalNucleases”的美国临时专利申请U.S.S.N.61/874,746中找到,其全部内容通过引用以其整体并入本文。在一些实施方案中,gRNA包含两个或更多个结构域(1)和(2),并且可以称为“延伸的gRNA”。例如,延伸的gRNA将例如结合两个或更多个Cas9蛋白并结合如本文所述,在两个或更多个不同区域处的靶核酸。gRNA包含互补靶位点的核苷酸序列,其介导核酸酶/RNA复合物与所述靶位点的结合,提供核酸酶:RNA复合物的序列特异性。在一些实施方案中,RNA可编程核酸酶是(CRISPR相关系统)Cas9内切核酸酶,例如来自酿脓链球菌的Cas9(Csn1)(参见例如CompletegenomesequenceofanM1strainofStreptococcuspyogenes.”FerrettiJ.J.,McShanW.M.,AjdicD.J.,SavicD.J.,SavicG.,LyonK.,PrimeauxC.,SezateS.,SuvorovA.N.,KentonS.,LaiH.S.,LinS.P.,QianY.,JiaH.G.,NajarF.Z.,RenQ.,ZhuH.,SongL.,WhiteJ.,YuanX.,CliftonS.W.,RoeB.A.,McLaughlinR.E.,Proc.Natl.Acad.Sci.U.S.A.98:4658-4663(2001);“CRISPRRNAmaturationbytrans-encodedsmallRNAandhostfactorRNaseIII.”DeltchevaE.,ChylinskiK.,SharmaC.M.,GonzalesK.,ChaoY.,PirzadaZ.A.,EckertM.R.,VogelJ.,CharpentierE.,Nature471:602-607(2011);and“Aprogrammabledual-RNA-guidedDNAendonucleaseinadaptivebacterialimmunity.”JinekM.,ChylinskiK.,FonfaraI.,HauerM.,DoudnaJ.A.,CharpentierE.Science337:816-821(2012),其每一个的全部内容通过引用并入本文。因为RNA可编程核酸酶(例如Cas9)使用RNA:DNA杂交来靶向DNA切割位点,这些蛋白质原则上能够靶向由引导RNA指定的任何序列。使用RNA可编程核酸酶例如Cas9进行位点特异性切割(例如,修饰基因组)的方法是本领域已知的(参见例如Cong,L.etal.MultiplexgenomeengineeringusingCRISPR/Cassystems.Science339,819-823(2013);Mali,P.etal.RNA-guidedhumangenomeengineeringviaCas9.Science339,823-826(2013);Hwang,W.Y.etal.EfficientgenomeeditinginzebrafishusingaCRISPR-Cassystem.Naturebiotechnology31,227-229(2013);Jinek,M.etal.RNA-programmedgenomeeditinginhumancells.eLife2,e00471(2013);Dicarlo,J.E.etal.GenomeengineeringinSaccharomycescerevisiaeusingCRISPR-Cassystems.Nucleicacidsresearch(2013);Jiang,W.etal.RNA-guidededitingofbacterialgenomesusingCRISPR-Cassystems.Naturebiotechnology31,233-239(2013);其每一个的全部内容通过引用并入本文)。如本文所用,术语“受试者”是指个体生物体,例如个体哺乳动物。在一些实施方案中,受试者是人。在一些实施方案中,受试者是非人哺乳动物。在一些实施方案中,受试者是非人灵长类动物。在一些实施方案中,受试者是啮齿动物。在一些实施方案中,受试者是绵羊,山羊,牛,猫或狗。在一些实施方案中,受试者是脊椎动物,两栖动物,爬行动物,鱼,昆虫,苍蝇或线虫。在一些实施方案中,受试者是研究动物。在一些实施方案中,受试者是基因工程的,例如基因工程化的非人受试者。受试者可以是任何一个性别,任何年龄,和处于任何发展阶段。术语“靶位点”是指被脱氨酶或包含脱氨酶的融合蛋白(例如本文提供的dCas9-脱氨酶融合蛋白)脱氨基的核酸分子内的序列。术语“治疗”是指如本文所述旨在逆转,缓解,延迟疾病或病症或其一种或多种症状的发作或抑制其进展的临床干预措施。如本文所用,术语“治疗”是指如本文所述旨在逆转,缓解,延缓疾病或病症或其一种或多种症状的发作或抑制其进展的临床干预措施。在一些实施方案中,可以在一种或多种症状已经形成之后和/或疾病已经诊断之后施用治疗。在其它实施方案中,可以在没有症状的情况下施用治疗,例如用于预防或延迟症状的发作或抑制疾病的发作或进展。例如,可以在症状发作之前(例如,根据症状的历史和/或遗传学或其它易感性因素)施用于易感个体。治疗也可以在症状消失后继续进行,例如预防或延迟其复发。如本文中在蛋白质或核酸的语境中使用的术语“重组”是指自然界中不存在但是人类工程产物的蛋白质或核酸。例如,在一些实施方案中,重组蛋白或核酸分子包含氨基酸或核苷酸序列,其相比于任何天然存在的序列包含至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变。如本文所用的术语“核酸编辑酶”是指能够修饰核酸或核酸的一个或多个核苷酸碱基的蛋白质。例如,在一些实施方案中,核酸编辑酶是脱氨酶,其可以催化C至T或G至交换。根据本公开可以使用的其它适合的核酸编辑酶包括但不限于核酸酶,切口酶,重组酶,脱氨酶,甲基转移酶,甲基化酶,乙酰化酶或乙酰转移酶。具体实施方式本公开的一些方面提供了重组Cas9蛋白,其有效地靶向在其3'端不包含规范PAM序列(5'-NGG-3',其中N是任何核苷酸,例如A,T,G或C)的DNA序列。在一些实施方案中,本文提供的Cas9蛋白包含使用包含一个或多个突变,所述突变使用包含随机化PAM的靶序列文库在定向演化实验中鉴定。本文提供的重组非PAM限制的Cas9蛋白可用于靶向在其3'端不包含规范PAM序列的DNA序列,因此极大地延伸了Cas9技术用于基因编辑的有用性。本公开的一些方面提供了包含Cas9蛋白和效应结构域的融合蛋白,例如DNA编辑结构域,例如脱氨酶结构域。脱氨酶对核碱基的脱氨基可以引起特定残基处的点突变,其在本文中称为核酸编辑。包含Cas9蛋白或其变体和DNA编辑结构域的融合蛋白因此可以用于核酸序列的靶向编辑。此类融合蛋白可用于体外靶向编辑DNA,例如用于产生突变体细胞或动物;用于引入靶向突变,例如用于离体修复细胞中的遗传缺陷,例如在从受试者获得的细胞中,所述细胞随后被重新引入同一或另一受试者;以及引入靶向突变,例如在体内受试者中的疾病相关基因中遗传缺陷的矫正或引入失活突变。通常,本文所述的融合蛋白的Cas9蛋白不具有任何核酸酶活性,而是Cas9片段或dCas9蛋白。还提供了使用如本文所述的Cas9融合蛋白的方法。本文提供了非限制性的示例性无核酸酶活性Cas9蛋白。一种示例性的适合的无核酸酶活性Cas9蛋白是D10A/H840ACas9蛋白突变体:MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQIDNO:262;参见例如Qietal.,RepurposingCRISPRasanRNA-guidedplatformforsequence-specificcontrolofgeneexpression.Cell.2013;152(5):1173-83,其全部内容通过引用并入本文)。基于本公开,其它适合的无核酸酶活性Cas9蛋白对于本领域技术人员将是显而易见的。此类另外的示例性适合的无核酸酶活性Cas9蛋白包括但不限于D10A,D839A,H840A,N863A,D10A/D839A,D10A/H840A,D10A/N863A,D839A/H840A,D839A/N863A,D10A/D839A/H840A,和D10A/D839A/H840A/N863A突变体蛋白(参见例如Prashantetal.,CAS9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.NatureBiotechnology.2013;31(9):833-838,其全部内容通过引用并入本文)。重组Cas9蛋白本公开的一些方面提供了重组Cas9蛋白,其包含与SEQIDNO:10-262中提供的Cas9的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同的氨基酸序列,其中所述Cas9蛋白包含RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基处的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应氨基酸残基,且其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的X262T,X294R,X409I,X480K,X543D,X694I和X1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示对应位置处的任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的A262T,K294R,S409I,E480K,E543D,M694I或E1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的E1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,HNH结构域的氨基酸序列与SEQIDNO:9的HNH结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:10-262中任一项的RuvC结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:9的RuvC结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和/或H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。对非规范PAM具有活性的重组Cas9蛋白本公开的一些方面提供了重组Cas9蛋白,其包含与SEQIDNO:9中提供的酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,包含SEQIDNO:9的RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329,其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同,且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas蛋白对在在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出活性(例如增加的活性)。在一些实施方案中,所述Cas9蛋白对具有不直接邻接规范PAM序列(5′-NGG-3′)的3’端的靶序列展现出活性,所述活性为相比于SEQIDNO:9提供的酿脓链球菌Cas9对相同靶序列的活性增加至少5倍,至少10倍,至少50倍,至少100倍,至少500倍,至少1000倍,至少5000倍,至少10000倍,至少50000倍,至少100000倍,至少500000倍,或至少1000000倍。在一些实施方案中,所述靶序列的3’端直接邻接AGC、GAG、TTT、GTG或CAA序列。在一些实施方案中,通过核酸酶测定法,脱氨基测定法,或转录活化测定法测量Cas9蛋白活性。在一些实施方案中,所述转录活化测定法是报告物活化测定法,例如GFP活化测定法。使用转录活化测定法来测量结合活性(例如Cas9的结合活性)的示例性方法是本领域已知的,并且对于本领域技术人员而言是显而易见的。例如,在ChavezA.,etal.,“HighlyefficientCas9-mediatedtranscriptionalprogramming.”NatureMethods12,326–328(2015)中描述了使用三联活化子VPR测量Cas9活性的方法;其全部内容通过引用并入本文。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的X262T,X294R,X409I,X480K,X543D,X694I和X1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示对应位置处的任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的A262T,K294R,S409I,E480K,E543D,M694I或E1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X1219V,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,HNH结构域的氨基酸序列与SEQIDNO:2、4或9的任一项的HNH结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:10-262中任一项的RuvC结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和/或H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。本公开的一些方面提供了重组Cas9蛋白,其包含与SEQIDNO:9中提供的酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,包含SEQIDNO:9的RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329,其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同,且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出增加的活性。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:2、4或9的任一项的HNH结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和/或H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。本公开的一些方面提供了重组Cas9蛋白,其包含与SEQIDNO:9中提供的酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,包含SEQIDNO:9的RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329,其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同,且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出增加的活性。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:2、4或9的任一项的HNH结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9进一步在SEQIDNO:9中提供的位置840处包含组氨酸,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应组氨酸。不希望受到任何具体理论的束缚,催化残基H840的存在允许Cas9切割非靶向链,即由sgRNA结合的链。在一些实施方案中,在SEQIDNO:9中提供的氨基酸序列的位置840具有除组氨酸以外的氨基酸残基,或SEQIDNO:10-262中提供的氨基酸序列的中的对应氨基酸的Cas9可以经改变或转化使得SEQIDNO:9中提供的氨基酸序列或SEQIDNO:10-262中提供的对应氨基酸序列的位置840是组氨酸。本公开的一些方面提供了重组Cas9蛋白,其包含与SEQIDNO:9中提供的酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,包含SEQIDNO:9的RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基262,267,294,405,409,480,543,694,1219,1224和1256;其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同;且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出活性(例如增加的活性)。在一些实施方案中,Cas9蛋白对具有不直接邻接规范PAM序列(5′-NGG-3′)的3’端的靶序列展现出活性,所述活性为相比于SEQIDNO:9提供的酿脓链球菌Cas9对相同靶序列的活性增加至少5倍,至少10倍,至少50倍,至少100倍,至少500倍,至少1000倍,至少5000倍,至少10000倍,至少50000倍,至少100000倍,至少500000倍,或至少1000000倍。在一些实施方案中,靶序列的3’端直接邻接AAA,AAC,AAG,AAT,CAA,CAC,CAG,CAT,GAA,GAC,GAG,GAT,TAA,TAC,TAG,TAT,ACA,ACC,ACG,ACT,CCA,CCC,CCG,CCT,GCA,GCC,GCG,GCT,TCA,TCC,TCG,TCT,AGA,AGC,AGT,CGA,CGC,CGT,GGA,GGC,GGT,TGA,TGC,TGT,ATA,ATC,ATG,ATT,CTA,CTC,CTG,CTT,GTA,GTC,GTG,GTT,TTA,TTC,TTG或TTTPAM序列。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的X262T,X267G,X294R,X405I,X409I,X480K,X543D,X694I,X1219V,X1224K,X1256K和X1362P,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X表示对应位置的任意氨基酸。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的A262T,S267G,K294R,F405I,S409I,E480K,E543D,M694I,E1219V,N1224K,Q1256K和L1362P,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的E1219V突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X480K突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的E480K突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的X543D突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含SEQIDNO:9中提供的氨基酸序列的E543D突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的突变组合:SEQIDNO:9中提供的氨基酸序列的(X480K,X543D和X1219V);(X262T,X409I,X480K,X543D,X694I和X1219V);(X294R,X480K,X543D,X1219V,X1256K和X1362P);(X294R,X480K,X543D,X1219V和X1256K);(X267G,X294R,X480K,X543D,X1219V,X1224K和X1256K);以及(X262T,X405I,X409I,X480K,X543D,X694I和X1219V),或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白的氨基酸序列包含选自下组的突变组合:SEQIDNO:9中提供的氨基酸序列的(E480K,E543D和E1219V);(A262T,S409I,E480K,E543D,M694I和E1219V);(K294R,E480K,E543D,E1219V,Q1256K和L1362P);(K294R,E480K,E543D,E1219V,和Q1256K);(S267G,K294R,E480K,E543DE1219V,N1224K和Q1256K);以及(A262T,F405I,S409I,E480K,E543D,M694I和E1219V),或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,HNH结构域的氨基酸序列与SEQIDNO:2、4或9的任一项的HNH结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:2、4或9的中任一项的RuvC结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和/或H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。本公开的一些方面提供了重组Cas9蛋白,其包含与SEQIDNO:9中提供的酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,包含SEQIDNO:9的RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基262,267,294,405,409,480,543,694,1219,1224,1256和1362;其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同;且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出增加的活性。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:2、4或9的中任一项的RuvC结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A和H840A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。本公开的一些方面提供了重组Cas9蛋白,其包含与SEQIDNO:9中提供的酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,包含SEQIDNO:9的RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基262,267,294,405,409,480,543,694,1219,1224,1256和1362;其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同;且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出增加的活性。在一些实施方案中,RuvC结构域的氨基酸序列与SEQIDNO:2、4或9的中任一项的RuvC结构域的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白进一步在EQIDNO:9中提供的位置840处包含组氨酸残基,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应组氨酸残基。不希望受到任何具体理论的束缚,催化残基H840的存在允许Cas9切割非靶向链,即由sgRNA结合的链。在一些实施方案中,在SEQIDNO:9中提供的氨基酸序列的位置840具有除组氨酸以外的氨基酸残基,或SEQIDNO:10-262中提供的氨基酸序列的中的对应氨基酸的Cas9可以经改变或转化使得SEQIDNO:9中提供的氨基酸序列或SEQIDNO:10-262中提供的对应氨基酸序列的位置840是组氨酸。Cas9融合蛋白本公开内容的一些方面提供了融合蛋白,其包含融合与第二蛋白或“融合伴侣”例如效应结构域从而形成融合蛋白的本文提供的Cas9蛋白。在一些实施方案中,效应子结构域与Cas9蛋白质的N端融合。在一些实施方案中,效应结构域与Cas9蛋白质的C端融合。在一些实施方案中,Cas9蛋白和效应结构域经由接头彼此融合。使用接头或不使用接头生成根据本公开的方面的融合蛋白的适合的策略对于本领域技术人员而言根据本公开和本领域的知识将是显而易见的。例如,Gilbertetal.,CRISPR-mediatedmodularRNA-guidedregulationoftranscriptionineukaryotes.Cell.2013;154(2):442-51显示了使用2NLS’s(SPKKKRKVEAS,SEQIDNO:284)作为接头Cas9与VP64的C端融合可以用于转录活化。Malietal.,CAS9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.NatBiotechnol.2013;31(9):833-8报道了不含接头的与VP64的C端融合可以用于转录活化。且Maederetal.,CRISPRRNA-guidedactivationofendogenoushumangenes.NatMethods.2013;10:977-979报道了使用Gly4Ser(SEQIDNO:5)接头的与VP64的C端融合可以用做转录活化子。最近,成功地生成了dCas9-FokI核酸酶融合物并表现出与亲本Cas9酶相比改善的酶特异性(GuilingerJP,ThompsonDB,LiuDR.FusionofcatalyticallyinactiveCas9toFokInucleaseimprovesthespecificityofgenomemodification.Nat.Biotechnol.2014;32(6):577-82和TsaiSQ,WyvekensN,KhayterC,FodenJA,ThaparV,ReyonD,GoodwinMJ,AryeeMJ,JoungJK.DimericCRISPRRNA-guidedFokInucleasesforhighlyspecificgenomeediting.NatBiotechnol.2014;32(6):569-76。PMID:24770325SGSETPGTSESATPES(SEQIDNO:7)或GGGGSn(SEQIDNO:5)接头分别用于FokI-dCas9融合蛋白)。在一些实施方案中,接头包含(GGGGS)n(SEQIDNO:5),(G)n,(EAAAK)n(SEQIDNO:6),(GGS)n,SGSETPGTSESATPES(SEQIDNO:7),或(XP)n基序,或任何这些的组合,其中n独立地是1和30之间的整数。在一些实施方案中,效应结构域包含酶结构域。适合的酶结构域包括但不限于核酸酶,切口酶,重组酶,脱氨酶,甲基转移酶,甲基化酶,乙酰化酶,乙酰转移酶,转录激活因子和转录阻遏物。接头可以像共价键一样简单,或者其可以是许多原子长度的聚合物接头。在某些实施方案中,接头是多肽或基于氨基酸。在其它实施方案中,接头不是肽样的。在某些实施方案中,接头是共价键(例如,碳-碳键,二硫键,碳-杂原子键等)。在某些实施方案中,接头是酰胺连接的碳-氮键。在某些实施方案中,接头是环状或无环的,取代或未取代的,支链或无支链的脂族或杂脂族接头。在某些实施方案中,接头是聚合物(例如聚乙烯,聚乙二醇,聚酰胺,聚酯等)。在某些实施方案中,接头包含氨基链烷酸的单体,二聚体或聚合物。在某些实施方案中,接头包含氨基链烷酸(例如甘氨酸,乙酸,丙氨酸,β-丙氨酸,3-氨基丙酸,4-氨基丁酸,5-戊酸等)。在某些实施方案中,接头包含氨基己酸(Ahx)的单体,二聚体或聚合物。在某些实施方案中,接头基于碳环部分(例如环戊烷,环己烷)。在其它实施方案中,接头包含聚乙二醇部分(PEG)。在其它实施方案中,接头包含氨基酸。在某些实施方案中,接头包含肽。在某些实施方案中,接头包含芳基或杂芳基部分。在某些实施方案中,接头基于苯环。接头可以包含官能化部分以促进来自肽的亲核体(例如硫醇,氨基)与接头的连接。任何亲电体可以用作接头的一部分。示例性亲电体包括但不限于活化酯,活化酰胺,Michael受体,烷基卤化物,芳基卤化物,酰基卤化物和异硫氰酸酯。在一些实施方案中,效应结构域包含效应酶。根据本公开可以使用的适合的效应酶包括切口酶,重组酶和脱氨酶。然而另外的效应酶对于本领域技术人员来说是显而易见的并且在本公开的范围内。在其它实施方案中,效应结构域包含调节转录活性的结构域。此类转录调节结构域可以是但不限于转录活化子或转录阻遏物结构域。在一些实施方案中,效应结构域是效应结构域。在一些实施方案中,效应结构域是脱氨酶结构域。在一些实施方案中,脱氨酶是胞嘧啶脱氨酶或胞苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白BmRNA编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,脱氨酶是APOBEC1脱氨酶。在一些实施方案中,脱氨酶是APOBEC2脱氨酶。在一些实施方案中,脱氨酶是APOBEC3脱氨酶。在一些实施方案中,脱氨酶是APOBEC3A脱氨酶。在一些实施方案中,脱氨酶是APOBEC3D脱氨酶。在一些实施方案中,脱氨酶是APOBEC3E脱氨酶。在一些实施方案中,脱氨酶是APOBEC3F脱氨酶。在一些实施方案中,脱氨酶是APOBEC3G脱氨酶。在一些实施方案中,脱氨酶是APOBEC3H脱氨酶。在一些实施方案中,脱氨酶是APOBEC4脱氨酶。在一些实施方案中,脱氨酶是活化诱导的脱氨酶(AID)。在一些实施方案中,效应结构域与SEQIDNO:263-281中任一项的脱氨酶结构域至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同。在一些实施方案中,效应结构域是核酸酶结构域。在一些实施方案中,核酸酶结构域是FokIDNA切割结构域。在一些实施方案中,本公开提供本文提供的融合蛋白的二聚体,例如融合蛋白的二聚体可以包含二聚化核酸酶结构域。在一些实施方案中,Cas9蛋白包含与SEQIDNO:10-262中提供的氨基酸序列的任一项提供的Cas9的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同的氨基酸序列,其中所述Cas9蛋白包含RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应氨基酸残基,且其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同。在一些实施方案中,Cas9蛋白包含与酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,包含SEQIDNO:9的RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329;其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同;且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出活性。在一些实施方案中,Cas9蛋白包含与SEQIDNO:10-262中提供的氨基酸序列的任一项提供的Cas9的氨基酸序列至少80%,至少85%,至少90%,至少92%,至少95%,至少96%,至少97%,至少98%,至少99%或至少99.5%相同的氨基酸序列,其中所述Cas9蛋白包含RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基262,267,294,405,409,480,543,694,1219,1224,1256和1362,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应氨基酸残基,且其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同。在一些实施方案中,Cas9蛋白包含与酿脓链球菌Cas9的氨基酸序列至少90%相同的氨基酸序列,包含SEQIDNO:9的RuvC和HNH结构域,其中所述Cas9蛋白的氨基酸序列包含选自下组的氨基酸残基中的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个突变:SEQIDNO:9中提供的氨基酸序列的氨基酸残基262,267,294,405,409,480,543,694,1219,1224和1256;其中所述重组Cas9蛋白的氨基酸序列不与天然存在的Cas9蛋白的氨基酸序列相同;且其中相比于SEQIDNO:9提供的酿脓链球菌Cas9,所述重组Cas蛋白对在其3’端不包含规范PAM(5′-NGG-3′)的靶序列展现出增加的活性。本公开的一些方面提供融合蛋白,其包含(i)无核酸酶活性的Cas9蛋白;和(ii)效应结构域。在一些实施方案中,效应结构域是DNA编辑结构域。在一些实施方案中,效果结构域具有脱氨酶活性。在一些实施方案中,效应结构域包含或是脱氨酶结构域。在一些实施方案中,脱氨酶是胞苷脱氨酶。在一些实施方案中,脱氨酶是载脂蛋白BmRNA编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,脱氨酶是APOBEC1家族脱氨酶。在一些实施方案中,脱氨酶是活化诱导的胞苷脱氨酶(AID)。本文详细描述了一些核酸编辑结构域以及包含此类结构域的Cas9融合蛋白。基于本公开,其它适合的效应结构域对于本领域技术人员将是显而易见的。在一些实施方案中,核酸编辑结构域是FokI核酸酶结构域。本公开提供了各种构型的Cas9:效应结构域融合蛋白。在一些实施方案中,效应结构域与Cas9蛋白的N端融合。在一些实施方案中,效应结构域与Cas9蛋白的C端融合。在一些实施方案中,Cas9蛋白和效应结构域通过接头融合。在一些实施方案中,接头包含接头包含(GGGGS)n(SEQIDNO:5),(G)n,(EAAAK)n(SEQIDNO:6),(GGS)n,SGSETPGTSESATPES(SEQIDNO:7)基序(参见例如GuilingerJP,ThompsonDB,LiuDR.FusionofcatalyticallyinactiveCas9toFokInucleaseimprovesthespecificityofgenomemodification.Nat.Biotechnol.2014;32(6):577-82;其全部内容通过引用并入本文),或(XP)n基序,或任何这些的组合,其中n独立地是1和30之间的整数。在一些实施方案中,n独立地是1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29或30,或者如果存在多于一个接头或多于一个接头基序,其任意组合。另外的适合的接头基序和接头构型对于本领域技术人员而言将是显而易见的。在一些实施方案中,适合的接头基序和构型包括Chenetal.,Fusionproteinlinkers:property,designandfunctionality.AdvDrugDelivRev.2013;65(10):1357-69中描述的那些,其全部内容通过引用并入本文。基于本公开和本领域的知识,其它适合的接头序列对于本领域技术人员将是显而易见的。在一些实施方案中,本文提供的示例性Cas9融合蛋白的一般架构包含以下结构:[NH2]-[效应结构域]-[Cas9]-[COOH]或[NH2]-[Cas9]-[效应结构域]-[COOH],其中NH2是融合蛋白的N端,COOH是融合蛋白的C端。图11提供了与sgRNA复合并与靶核酸序列结合的与效应结构域(例如rAPOBEC1)融合的Cas9蛋白的示意性表示。在一些实施方案中,本文提供的任何融合蛋白可包含一个或多个核定位序列(NLS)。如本文所用,核定位序列是指促进蛋白质(例如具有NLS的本文提供的任何融合蛋白)进入细胞核(例如经由核运输)的氨基酸序列。通常,NLS包含暴露于蛋白质表面的带正电的赖氨酸或精氨酸的一个或多个短氨基酸序列。核定位序列是本领域已知的并且对于本领域技术人员而言是显而易见的。例如,KalderonD.,etal.,"Ashortaminoacidsequenceabletospecifynuclearlocation".Cell(1984)39(3Pt2):499–509;DingwallC.,etal.,“ThenucleoplasminnuclearlocationsequenceislargerandmorecomplexthanthatofSV-40largeTantigen”.JCellBiol.(1988)107(3):841–9;MakkerhJ.P.,etal.,“Comparativemutagenesisofnuclearlocalizationsignalsrevealstheimportanceofneutralandacidicaminoacids”.CurrBiol.(1996)6(8):1025–7;andRayM.,etal.,"Quantitativetrackingofproteintraffickingtothenucleususingcytosolicproteindeliverybynanoparticle-stabilizednanocapsules".Bioconjug.Chem.(2015)26(6):1004–7中描述了核定位序列;其每一个的全部内容通过引用并入本文。在例如Planketal.,PCT/EP2000/011690中描述了另外的核定位序列,其全部内容通过引用并入本文。在一些实施方案中,NLS包含氨基酸序列PKKKRKV(SEQIDNO:299)或MDSLLMNRRKFLYQFKNVRWAKGRRETYLC(SEQIDNO:300)。可以存在的示例性特征是定位序列,如核定位序列,细胞质定位序列,输出序列如核输出序列或其它定位序列,以及可用于融合蛋白的增溶,纯化,或检测的序列标签。本文提供了适合的定位信号序列和蛋白质标签序列,且包括但不限于生物素羧化酶载体蛋白(BCCP)标签,myc-标签,钙调蛋白-标签,FLAG-标签,血凝素(HA)-标签,多组氨酸标签,也称为组氨酸标签或His标签,麦芽糖结合蛋白(MBP)-标签,nus-标签,谷胱甘肽-S-转移酶(GST)-标签,绿色荧光蛋白(GFP)-标签,硫氧还蛋白-标签,S-标签,Softag(例如Softag1,Softag3),strep标签,生物素连接酶标签,FlAsH标签,V5标签和SBP-标签。另外的适合的序列对于本领域技术人员而言将是显而易见的并且在本公开的范围内。本文提供的任何核定位序列可以以任何合适的定位与融合蛋白融合。例如,为了促进融合蛋白向细胞核的易位而不损害融合蛋白的功能。在一些实施方案中,NLS与融合蛋白的Cas9蛋白N端融合。在一些实施方案中,NLS与融合蛋白的Cas9蛋白C端融合。在一些实施方案中,NLS与融合蛋白的效应结构域的N端融合。在一些实施方案中,NLS与融合蛋白的效应结构域C端融合。在一些实施方案中,效应结构域是脱氨酶。例如,在一些实施方案中,具有脱氨酶结构域的示例性Cas9融合蛋白的一般架构包含以下结构:[NH2]-[NLS]-[Cas9]-[脱氨酶]-[COOH],[NH2]-[NLS]-[脱氨酶]-[Cas9]-[COOH],[NH2]-[Cas9]-[NLS]-[脱氨酶]-[COOH],[NH2]-[脱氨酶]-[NLS]-[Cas9]-[COOH],[NH2]-[脱氨酶]-[Cas9]-[NLS]-[COOH],或[NH2]-[Cas9]-[脱氨酶]-[NLS]-[COOH],其中NLS是核定位信号,NH2是融合蛋白的N端,COOH是融合蛋白的C端。在一些实施方案中,在Cas9蛋白和脱氨酶结构域之间插入接头。在一些实施方案中,任何“]-[”可以是一个或多个接头。在一些实施方案中,NLS位于脱氨酶和/或Cas9结构域的C端。在一些实施方案中,NLS位于脱氨酶和Cas9结构域之间。也可以存在另外的特征,如序列标签。效应结构域的一个示例性合适类型包括胞嘧啶脱氨酶,例如APOBEC家族。载脂蛋白BmRNA编辑复合物(APOBEC)胞嘧啶脱氨酶家族包括十一种蛋白质,其作用于以受控和有益的方式启动诱变。29一个家族成员,活化诱导胞嘧啶脱氨酶(AID)通过以转录依赖的,链偏倚的方式将ssDNA中的胞嘧啶转化为尿嘧啶负责抗体的成熟。30载脂蛋白B编辑复合物3(APOBEC3)通过病毒ssDNA的逆转录中的胞嘧啶的脱氨作用提供针对某种HIV-1毒株的保护。这些蛋白质都需要Zn2+-协调基序(His-X-Glu-X23-26-Pro-Cys-X2-4-Cys;SEQIDNO:283)和结合的水分子以用于催化活性。Glu残基作用于活化水分子成氢氧化锌用于脱氨反应中的亲核攻击。每个家庭成员优选在其自己特定的“热点”脱氨,从hAID的WRC(W是A或T,R是A或G),到hAPOBEC3F的TTC。32最近APOBEC3G的催化结构域的晶体结构揭示了二级结构包含侧接六个α-螺旋的五链β-折叠核心,其认为在整个家族中是保守的。33活性中心环已被证明负责ssDNA结合和确定“热点“身份。34这些酶的过表达与基因组不稳定性和癌症有关,因此强调了序列特异性靶向的重要性。35本公开的一些方面提供了Cas9和脱氨酶结构域(例如胞嘧啶脱氨酶例如APOBEC酶,或腺苷脱氨酶例如ADAT酶)之间的系统性系列融合,其已经生成以将这些脱氨酶的酶活性引导至基因组DNA中的特定位点。使用Cas9作为识别剂的优点是双重的:(1)通过简单地改变sgRNA序列可容易地改变Cas9的序列特异性;(2)Cas9通过使dsDNA变性而与其靶序列结合,产生一段单链DNA,因此是脱氨酶的活性底物。应该理解,其它催化结构域或来自其它脱氨酶的催化结构域也可以用于与Cas9产生融合蛋白,并且本公开在这方面不受限制。本公开的一些方面基于以下认识,即根据图11中的编号方案,cas9:脱氨酶融合蛋白可以有效地使3-11位的核苷酸脱氨基。应当理解,本领域技术人员将能够设计适合的引导RNA以将融合蛋白靶向至包含待脱氨基的核苷酸的靶序列。可以使用PAM依赖性Cas9蛋白或本文提供的能够靶向无PAM的靶序列的Cas9蛋白两者用于靶序列的脱氨基。下文提供了根据本公开的方面可以与Cas9结构域融合的一些示例性适合的核酸编辑结构域,例如脱氨酶结构域。通常,脱氨酶需要这些蛋白质都需要Zn2+-协调基序(His-X-Glu-X23-26-Pro-Cys-X2-4-Cys;SEQIDNO:283)和结合的水分子以用于催化活性。Glu残基作用于活化水分子成氢氧化锌用于脱氨反应中的亲核攻击。应该理解的是,在一些实施方案中,可以使用相应序列的活性结构域,例如没有定位信号的结构域(核定位信号,无核输出信号,细胞质定位信号)。人AID:(下划线:核定位信号;双下划线:核输出信号)小鼠AID:(下划线:核定位信号;双下划线:核输出信号)狗AID:(下划线:核定位信号;双下划线:核输出信号)牛AID:(下划线:核定位信号;双下划线:核输出信号)小鼠APOBEC-3:(斜体:核酸编辑结构域)大鼠APOBEC-3:(斜体:核酸编辑结构域)恒河猴APOBEC-3G:(斜体:核酸编辑结构域;下划线:细胞质定位信号)黑猩猩APOBEC-3G:(斜体:核酸编辑结构域;下划线:细胞质定位信号)绿猴(Greenmonkey)APOBEC-3G:(斜体:核酸编辑结构域;下划线:细胞质定位信号)人APOBEC-3G:(斜体:核酸编辑结构域;下划线:细胞质定位信号)人APOBEC-3F:(斜体:核酸编辑结构域)人APOBEC-3B:(斜体:核酸编辑结构域)人APOBEC-3C:(斜体:核酸编辑结构域)人APOBEC-3A:(斜体:核酸编辑结构域)人APOBEC-3H:(斜体:核酸编辑结构域)人APOBEC-3D:(斜体:核酸编辑结构域)人APOBEC-1:MTSEKGPSTGDPTLRRRIEPWEFDVFYDPRELRKEACLLYEIKWGMSRKIWRSSGKNTTNHVEVNFIKKFTSERDFHPSMSCSITWFLSWSPCWECSQAIREFLSRHPGVTLVIYVARLFWHMDQQNRQGLRDLVNSGVTIQIMRASEYYHCWRNFVNYPPGDEAHWPQYPPLWMMLYALELHCIILSLPPCLKISRRWQNHLTFFRLHLQNCHYQTIPPHILLATGLIHPSVAWR(SEQIDNO:279)小鼠APOBEC-1:MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSVWRHTSQNTSNHVEVNFLEKFTTERYFRPNTRCSITWFLSWSPCGECSRAITEFLSRHPYVTLFIYIARLYHHTDQRNRQGLRDLISSGVTIQIMTEQEYCYCWRNFVNYPPSNEAYWPRYPHLWVKLYVLELYCIILGLPPCLKILRRKQPQLTFFTITLQTCHYQRIPPHLLWATGLK(SEQIDNO:280)大鼠APOBEC-1:MSSETGPVAVDPTLRRRIEPHEFEVFFDPRELRKETCLLYEINWGGRHSIWRHTSQNTNKHVEVNFIEKFTTERYFCPNTRCSITWFLSWSPCGECSRAITEFLSRYPHVTLFIYIARLYHHADPRNRQGLRDLISSGVTIQIMTEQESGYCWRNFVNYSPSNEAHWPRYPHLWVRLYVLELYCIILGLPPCLNILRRKQPQLTFFTIALQSCHYQRLPPHILWATGLK(SEQIDNO:281)在一些实施方案中,本文提供的融合蛋白包含效应结构域的全长氨基酸,例如上文提供的序列之一。然而,在其它实施方案中,本文提供的融合蛋白不包含效应结构域的全长序列,而仅包含其片段。例如,在一些实施方案中,本文提供的融合蛋白包含Cas9蛋白和效应结构域的片段,例如,其中所述片段包含效应结构域。效应结构域的示例性氨基酸序列在上面的序列中以斜体字母显示,并且对于本领域技术人员而言,此类结构域的另外适合的序列将是显而易见的。根据本公开内容的方面可以使用的另外适合的核酸编辑结构域,例如脱氨酶结构域序列,例如可以与无核酸酶活性的Cas9蛋白融合的那些,对于本领域技术人员来说基于本公开将是显而易见的。在一些实施方案中,此类另外的结构域序列包括与本文提供的序列至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%或至少99%相似的脱氨酶结构域序列。另外适合的Cas9蛋白,变体和序列对于本领域技术人员也是显而易见的。此类另外适合的Cas9蛋白的例实例包括但不限于具有以下突变的Cas9蛋白:D10A,D10A/D839A/H840A和D10A/D839A/H840A/N863A(参见例如Prashantetal.,CAS9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.NatureBiotechnology.2013;31(9):833-838,其全部内容通过引用并入本文)。基于本公开并结合本领域的一般知识,用于生成包含Cas9蛋白和效应结构域(例如DNA编辑结构域)的融合蛋白的另外适合的策略对于本领域技术人员将是显而易见的。考虑本公开和本领域的知识,根据本公开的方面使用接头或不使用接头来产生融合蛋白的适合策略对于本领域技术人员也是显而易见的。例如,Gilbertetal.,CRISPR-mediatedmodularRNA-guidedregulationoftranscriptionineukaryotes.Cell.2013;154(2):442-51显示了使用2NLS’s作为接头(SPKKKRKVEAS,SEQIDNO:284)Cas9与VP64的C端融合可以用于转录活化。Malietal.,CAS9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.NatBiotechnol.2013;31(9):833-8报道了不含接头的与VP64的C端融合可以用于转录活化。且Maederetal.,CRISPRRNA-guidedactivationofendogenoushumangenes.NatMethods.2013;10:977-979报道了使用Gly4Ser(SEQIDNO:5)接头的与VP64的C端融合可以用做转录活化子。最近,成功地生成了dCas9-FokI核酸酶融合物并表现出与亲本Cas9酶相比改善的酶特异性(GuilingerJP,ThompsonDB,LiuDR.FusionofcatalyticallyinactiveCas9toFokInucleaseimprovesthespecificityofgenomemodification.Nat.Biotechnol.2014;32(6):577-82和TsaiSQ,WyvekensN,KhayterC,FodenJA,ThaparV,ReyonD,GoodwinMJ,AryeeMJ,JoungJK.DimericCRISPRRNA-guidedFokInucleasesforhighlyspecificgenomeediting.NatBiotechnol.2014;32(6):569-76。PMID:24770325SGSETPGTSESATPES(SEQIDNO:7)或GGGGSn(SEQIDNO:5)接头分别用于FokI-dCas9融合蛋白)。在一些实施方案中,Cas9融合蛋白包含:(i)Cas9蛋白;和(ii)转录活化子结构域。在一些实施方案中,转录活化子结构域包含VPR。VPR是VP64-SV40-P65-RTA三联活化子。在一些实施方案中,VPR包含由SEQIDNO:292的核酸序列编码的VP64氨基酸序列:GAGGCCAGCGGTTCCGGACGGGCTGACGCATTGGACGATTTTGATCTGGATATGCTGGGAAGTGACGCCCTCGATGATTTTGACCTTGACATGCTTGGTTCGGATGCCCTTGATGACTTTGACCTCGACATGCTCGGCAGTGACGCCCTTGATGATTTCGACCTGGACATGCTGATTAACTCTAGATAG(SEQIDNO:292)在一些实施方案中,VPR包含如SEQIDNO:293所示的VP64氨基酸序列:EASGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLINSR(SEQIDNO:293)在一些实施方案中,VPR包含由SEQIDNO:294的核酸序列编码的VP64-SV40-P65-RTA氨基酸序列:TCGCCAGGGATCCGTCGACTTGACGCGTTGATATCAACAAGTTTGTACAAAAAAGCAGGCTACAAAGAGGCCAGCGGTTCCGGACGGGCTGACGCATTGGACGATTTTGATCTGGATATGCTGGGAAGTGACGCCCTCGATGATTTTGACCTTGACATGCTTGGTTCGGATGCCCTTGATGACTTTGACCTCGACATGCTCGGCAGTGACGCCCTTGATGATTTCGACCTGGACATGCTGATTAACTCTAGAAGTTCCGGATCTCCGAAAAAGAAACGCAAAGTTGGTAGCCAGTACCTGCCCGACACCGACGACCGGCACCGGATCGAGGAAAAGCGGAAGCGGACCTACGAGACATTCAAGAGCATCATGAAGAAGTCCCCCTTCAGCGGCCCCACCGACCCTAGACCTCCACCTAGAAGAATCGCCGTGCCCAGCAGATCCAGCGCCAGCGTGCCAAAACCTGCCCCCCAGCCTTACCCCTTCACCAGCAGCCTGAGCACCATCAACTACGACGAGTTCCCTACCATGGTGTTCCCCAGCGGCCAGATCTCTCAGGCCTCTGCTCTGGCTCCAGCCCCTCCTCAGGTGCTGCCTCAGGCTCCTGCTCCTGCACCAGCTCCAGCCATGGTGTCTGCACTGGCTCAGGCACCAGCACCCGTGCCTGTGCTGGCTCCTGGACCTCCACAGGCTGTGGCTCCACCAGCCCCTAAACCTACACAGGCCGGCGAGGGCACACTGTCTGAAGCTCTGCTGCAGCTGCAGTTCGACGACGAGGATCTGGGAGCCCTGCTGGGAAACAGCACCGATCCTGCCGTGTTCACCGACCTGGCCAGCGTGGACAACAGCGAGTTCCAGCAGCTGCTGAACCAGGGCATCCCTGTGGCCCCTCACACCACCGAGCCCATGCTGATGGAATACCCCGAGGCCATCACCCGGCTCGTGACAGGCGCTCAGAGGCCTCCTGATCCAGCTCCTGCCCCTCTGGGAGCACCAGGCCTGCCTAATGGACTGCTGTCTGGCGACGAGGACTTCAGCTCTATCGCCGATATGGATTTCTCAGCCTTGCTGGGCTCTGGCAGCGGCAGCCGGGATTCCAGGGAAGGGATGTTTTTGCCGAAGCCTGAGGCCGGCTCCGCTATTAGTGACGTGTTTGAGGGCCGCGAGGTGTGCCAGCCAAAACGAATCCGGCCATTTCATCCTCCAGGAAGTCCATGGGCCAACCGCCCACTCCCCGCCAGCCTCGCACCAACACCAACCGGTCCAGTACATGAGCCAGTCGGGTCACTGACCCCGGCACCAGTCCCTCAGCCACTGGATCCAGCGCCCGCAGTGACTCCCGAGGCCAGTCACCTGTTGGAGGATCCCGATGAAGAGACGAGCCAGGCTGTCAAAGCCCTTCGGGAGATGGCCGATACTGTGATTCCCCAGAAGGAAGAGGCTGCAATCTGTGGCCAAATGGACCTTTCCCATCCGCCCCCAAGGGGCCATCTGGATGAGCTGACAACCACACTTGAGTCCATGACCGAGGATCTGAACCTGGACTCACCCCTGACCCCGGAATTGAACGAGATTCTGGATACCTTCCTGAACGACGAGTGCCTCTTGCATGCCATGCATATCAGCACAGGACTGTCCATCTTCGACACATCTCTGTTTTGA(SEQIDNO:294)在一些实施方案中,VPR包含如SEQIDNO:295所示的VP64-SV40-P65-RTA氨基酸序列:SPGIRRLDALISTSLYKKAGYKEASGSGRADALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLINSRSSGSPKKKRKVGSQYLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLGSGSGSRDSREGMFLPKPEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALREMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF(SEQIDNO:295)本公开的一些方面提供了包含转录活化子的融合蛋白。在一些实施方案中,转录活化子是VPR。在一些实施方案中,VPR包含野生型VPR或如SEQIDNO:293所示的VPR。在一些实施方案中,本文提供的VPR蛋白包括VPR的片段和与VPR或VPR片段同源的蛋白质。例如,在一些实施方案中,VPR包含SEQIDNO:293所示的氨基酸序列的片段。在一些实施方案中,VPR包含与SEQIDNO:293所示的氨基酸序列同源的氨基酸序列,或与SEQIDNO:293所示的氨基酸序列的片段同源的氨基酸序列。在一些实施方案中,包含VPR或VPR的片段,或者VPR或VPR片段同源物的蛋白质称为“VPR变体”。VPR变体与VPR或其片段具有同源性。例如,VPR变体与野生型VPR或如SEQIDNO:293所示的VPR至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,VPR变体包含VPR的片段,使得所述片段与野生型VPR或如SEQIDNO:293所示的VPR的片段至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,VPR包含SEQIDNO:293所示的VPR。在一些实施方案中,VPR包含由SEQIDNO:292所示的核苷酸序列编码的氨基酸序列。在一些实施方案中,VPR是VP64-SV40-P65-RTA三联活化子。在一些实施方案中,VP64-SV40-P65-RTA包含如SEQIDNO:295所示的VP64-SV40-P65-RTA。在一些实施方案中,本文提供的VP64-SV40-P65-RTA蛋白包括VP64-SV40-P65-RTA的片段和与VP64-SV40-P65-RTA或VP64-SV40-P65-RTA片段同源的蛋白质。例如,在一些实施方案中,VP64-SV40-P65-RTA包含SEQIDNO:295所示的的氨基酸序列的片段。在一些实施方案中,VP64-SV40-P65-RTA包含与SEQIDNO:295所示的氨基酸序列同源的氨基酸序列,或与SEQIDNO:295所示的氨基酸序列的片段同源的氨基酸序列。在一些实施方案中,包含VP64-SV40-P65-RTA或VP64-SV40-P65-RTA的片段,或者VP64-SV40-P65-RTA或VP64-SV40-P65-RTA片段的同系物的蛋白质称为“VP64-SV40-P65-RTA变体”。VP64-SV40-RTA变体与VP64-SV40-P65-RTA或其片段具有同源性。例如,VP64-SV40-P65-RTA变体与SEQIDNO:295所示的VP64-SV40-P65-RTA至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,VP64-SV40-P65-RTA变体包含VP64-SV40-P65-RTA的片段,使得所述片段与SEQIDNO:295所示的VP64-SV40-P65-RTA的对应片段至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,VP64-SV40-P65-RTA包含SEQIDNO:295所示的氨基酸序列。在一些实施方案中,VP64-SV40-P65-RTA包含由SEQIDNO:294所示的核苷酸序列编码的氨基酸序列。本公开的一些方面提供了融合蛋白,其包含(i)Cas9蛋白;和(ii)效应结构域。在一些方面,本文提供的融合蛋白进一步包括(iii)DNA结合蛋白,例如锌指结构域,TALE或第二Cas9蛋白。不希望受任何特定理论的束缚,将DNA结合蛋白(例如第二Cas9蛋白)融合至融合蛋白,所述融合蛋白包含(i)蛋白质;和(ii)效应结构域可用于提高融合蛋白对靶核酸序列的特异性,或用于提高融合蛋白对不包含规范PAM(5′-NGG-3′)的靶核酸序列的特异性或结合亲和力。在一些实施方案中,第二Cas9蛋白是本文提供的任何Cas9蛋白。在一些实施方案中,第二Cas9蛋白与融合蛋白融合至Cas9蛋白的N端。在一些实施方案中,第二Cas9蛋白与融合蛋白融合至Cas9蛋白的C端。在一些实施方案中,Cas9蛋白和第二Cas9蛋白通过接头融合。本文进一步提供了复合物,所述复合物包含本文提供的任何融合蛋,与融合蛋白的Cas9蛋白结合的第一引导RNA,和与融合蛋白的第二Cas9蛋白结合的第二引导RNA。在一些实施方案中,第一引导RNA为约15-100个核苷酸行并包含与第一靶序列互补的至少10个连续核苷酸的序列,并且第二引导RNA为约15-100个核苷酸长并包含与第二靶序列互补的至少10个连续核苷酸的序列。在一些实施方案中,第一引导RNA/或第二引导RNA为15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49或50个核苷酸长。在一些实施方案中,第一引导RNA和第二引导RNA是不同的。在一些实施方案中,第一引导RNA包含与第一靶序列互补的15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39或40个连续核苷酸的序列,且其中第二引导RNA包含与第二靶序列互补的15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39或40个连续核苷酸的序列。在一些实施方案中,第一靶序列和第二靶序列是不同的。在一些实施方案中,第一靶序列和第二靶序列是DNA序列。在一些实施方案中,第一靶序列和第二靶序列在哺乳动物的基因组中。在一些实施方案中,第一靶序列和第二靶序列在人的基因组中。在一些实施方案中,第一靶序列在第二靶序列的30个核苷酸内。在一些实施方案中,第一靶序列的3'端不直接邻接规范PAM序列(5′-NGG-3′)。在一些实施方案中,第二靶序列的3'端不直接邻接规范PAM序列(5′-NGG-3′)。在一些实施方案中,本文提供的示例性Cas9融合蛋白的一般架构具有以下结构:[NH2]-[效应结构域]-[Cas9]-[第二Cas9蛋白]-[COOH];[NH2]-[第二Cas9蛋白]-[Cas9]-[效应结构域]-[COOH];[NH2]-[Cas9]-[效应结构域]-[第二Cas9蛋白]-[COOH];[NH2]-[第二Cas9蛋白]-[效应结构域]-[Cas9]-[COOH];[NH2]-[UGI]-[效应结构域]-[Cas9]-[第二Cas9蛋白]-[COOH];[NH2]-[UGI]-[第二Cas9蛋白]-[Cas9]-[效应结构域]-[COOH];[NH2]-[UGI]-[Cas9]-[效应结构域]-[第二Cas9蛋白]-[COOH];[NH2]-[UGI]-[第二Cas9蛋白]-[效应结构域]-[Cas9]-[COOH];[NH2]-[效应结构域]-[Cas9]-[第二Cas9蛋白]-[UGI]-[COOH];[NH2]-[第二Cas9蛋白]-[Cas9]-[效应结构域]-[UGI]-[COOH];[NH2]-[Cas9]-[效应结构域]-[第二Cas9蛋白]-[UGI]-[COOH];或者[NH2]-[第二Cas9蛋白]-[效应结构域]-[Cas9]-[UGI]-[COOH];其中NH2是融合蛋白的N端,COOH是融合蛋白的C端。在一些实施方案中,上述一般架构中使用的“]-[”表示存在任选的接头序列。在其它实例中,本文提供的示例性Cas9融合蛋白的一般架构具有以下结构:[NH2]-[效应结构域]-[Cas9]-[第二Cas9蛋白]-[COOH];[NH2]-[第二Cas9蛋白]-[Cas9]-[效应结构域]-[COOH];[NH2]-[Cas9]-[效应结构域]-[第二Cas9蛋白]-[COOH];[NH2]-[第二Cas9蛋白]-[效应结构域]-[Cas9]-[COOH];[NH2]-[UGI]-[效应结构域]-[Cas9]-[第二Cas9蛋白]-[COOH],[NH2]-[UGI]-[第二Cas9蛋白]-[Cas9]-[效应结构域]-[COOH];[NH2]-[UGI]-[Cas9]-[效应结构域]-[第二Cas9蛋白]-[COOH];[NH2]-[UGI]-[第二Cas9蛋白]-[效应结构域]-[Cas9]-[COOH];[NH2]-[效应结构域]-[Cas9]-[第二Cas9蛋白]-[UGI]-[COOH];[NH2]-[第二Cas9蛋白]-[Cas9]-[效应结构域]-[UGI]-[COOH];[NH2]-[Cas9]-[效应结构域]-[第二Cas9蛋白]-[UGI]-[COOH];或者[NH2]-[第二Cas9蛋白]-[效应结构域]-[Cas9]-[UGI]-[COOH];其中NH2是融合蛋白的N端,COOH是融合蛋白的C端。在一些实施方案中,上述一般架构中使用的“-”表示存在任选的接头序列。在一些实施方案中,第二Cas9是dCas9蛋白。在一些实例中,本文提供的示例性Cas9融合蛋白的一般架构包含如图8所示的结构。应该理解,示例性Cas9融合蛋白的任何一般结构中提供的任何蛋白可以通过一个或多个本文提供的接头连接。在一些实施方案中,接头是相同的。在一些实施方案中,接头是不同的。在一些实施方案中,示例性Cas9融合蛋白的任何一般架构中提供的一种或多种蛋白质不通过接头融合。在一些实施方案中,融合蛋白进一步包含核靶向序列,例如核定位序列。在一些实施方案中,本文提供的融合蛋白进一步包含核定位序列(NLS)。在一些实施方案中,NLS与融合蛋白的N端融合。在一些实施方案中,NLS与融合蛋白的C端融合。在一些实施方案中,NLS与第二Cas9蛋白的N端融合。在一些实施方案中,NLS与第二Cas9蛋白的C端融合。在一些实施方案中,NLS与Cas9蛋白的N端融合。在一些实施方案中,NLS与Cas9蛋白的C端融合。在一些实施方案中,NLS与效应结构域的N端融合。在一些实施方案中,NLS与效应结构域的C端融合。在一些实施方案中,NLS与UGI蛋白的N端融合。在一些实施方案中,NLS与UGI蛋白的C端融合。在一些实施方案中,NLS通过一个或多个接头与融合蛋白融合。在一些实施方案中,NLS在没有接头的情况下与融合蛋白融合。尿嘧啶糖基化酶抑制剂融合蛋白本公开的一些方面提供了融合蛋白,其包含与效应结构域(例如脱氨酶)和尿嘧啶糖基化酶抑制剂(UGI)融合的Cas9蛋白。在一些实施方案中,融合蛋白包含以下结构:[脱氨酶]-[任选的接头序列]-[Cas9]-[任选的接头序列]-[UGI];[脱氨酶]-[任选的接头序列]-[UGI]-[任选的接头序列]-[Cas9];[UGI]-[任选的接头序列]-[脱氨酶]-[任选的接头序列]-[Cas9];[UGI]-[任选的接头序列]-[Cas9]-[任选的接头序列]-[脱氨酶];[Cas9]-[任选的接头序列]-[脱氨酶]-[任选的接头序列]-[UGI];或者[Cas9]-[可选接头序列]-[UGI]-[可选接头序列]-[脱氨酶]。在一些实施方案中,融合蛋白不包含接头序列。在一些实施方案中,存在一个或两个任选的接头序列。在一些实施方案中,融合蛋白进一步包含第二Cas9蛋白。例如,第二Cas9蛋白可以是本文提供的任何Cas9蛋白。在一些实施方案中,融合蛋白包含以下结构:[脱氨酶]-[Cas9]-[UGI];[脱氨酶]-[UGI]-[Cas9];[UGI]-[脱氨酶]-[Cas9];[UGI]-[Cas9]-[脱氨酶];[Cas9]-[脱氨酶]-[UGI];[Cas9]-[UGI]-[脱氨酶];[第二Cas9]-[脱氨酶]-[Cas9]-[UGI];[第二Cas9]-[脱氨酶]-[UGI]-[Cas9];[第二Cas9]-[UGI]-[脱氨酶]-[Cas9];[第二Cas9]-[UGI]-[Cas9]-[脱氨酶];[第二Cas9]-[Cas9]-[脱氨酶]-[UGI];[第二Cas9]-[Cas9]-[UGI]-[脱氨酶];[脱氨酶]-[第二Cas9]-[Cas9]-[UGI];[脱氨酶]-[第二Cas9]-[UGI]-[Cas9];[UGI]-[第二Cas9]-[脱氨酶]-[Cas9];[UGI]-[第二Cas9]-[Cas9]-[脱氨酶];[Cas9]-[第二Cas9]-[脱氨酶]-[UGI];[Cas9]-[第二Cas9]-[UGI]-[脱氨酶][脱氨酶]-[Cas9]-[第二Cas9]-[UGI];[脱氨酶]-[UGI]-[第二Cas9]-[Cas9];[UGI]-[脱氨酶]-[第二Cas9]-[Cas9];[UGI]-[Cas9]-[第二Cas9]-[脱氨酶];[Cas9]-[脱氨酶]-[第二Cas9]-[UGI];[Cas9]-[UGI]-[第二Cas9]-[脱氨酶];[脱氨酶]-[Cas9]-[UGI]-[第二Cas9];[脱氨酶]-[UGI]-[Cas9]-[第二Cas9];[UGI]-[脱氨酶]-[Cas9]-[第二Cas9];[UGI]-[Cas9]-[脱氨酶]-[第二Cas9];[Cas9]-[脱氨酶]-[UGI]-[第二Cas9];或者[Cas9]-[UGI]-[脱氨酶]-[第二个Cas9]。在一些实施方案中,上述一般架构中使用的“-”表示存在任选的接头序列。在一些实施方案中,包含UGI的融合蛋白进一步包含核靶向序列,例如核定位序列。在一些实施方案中,本文提供的融合蛋白进一步包含核定位序列(NLS)。在一些实施方案中,NLS与融合蛋白的N端融合。在一些实施方案中,NLS与融合蛋白的C端融合。在一些实施方案中,NLS与UGI蛋白的N端融合。在一些实施方案中,NLS与UGI蛋白的C端融合。在一些实施方案中,NLS与Cas9蛋白的N端融合。在一些实施方案中,NLS与Cas9蛋白的C端融合。在一些实施方案中,NLS与脱氨酶的N端融合。在一些实施方案中,NLS与脱氨酶的C端融合。在一些实施方案中,NLS与第二Cas9蛋白的N端融合。在一些实施方案中,NLS与第二Cas9蛋白的C端融合。在一些实施方案中,NLS通过一个或多个接头与融合蛋白融合。在一些实施方案中,NLS在没有接头的情况下与融合蛋白融合。在一些实施方案中,UGI包含野生型UGI或如SEQIDNO:553所示的UGI。在一些实施方案中,本文提供的UGI蛋白包括UGI的片段和与UGI或UGI片段同源的蛋白质。例如,在一些实施方案中,UGI包含SEQIDNO:553所示的氨基酸序列的片段。在一些实施方案中,UGI包含与SEQIDNO:553所示的氨基酸序列同源的氨基酸序列,或与SEQIDNO:553所示的氨基酸序列的片段同源的氨基酸序列。在一些实施方案中,包含UGI或UGI的片段,或者UGI或UGI片段同源物的蛋白质称为“UGI变体”。UGI变体与UGI或其片段具有同源性。例如,UGI变体与野生型UGI或如SEQIDNO:553所示的UGI至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,UGI变体包含UGI的片段,使得所述片段与野生型UGI或如SEQIDNO:553所示的UGI的片段至少约70%相同,至少约80%相同,至少约90%相同,至少约95%相同,至少约96%相同,至少约97%相同,至少约98%相同,至少约99%相同,至少约99.5%相同,或至少约99.9%相同。在一些实施方案中,UGI包含以下氨基酸序列:>sp|P14739|UNGI_BPPB2尿嘧啶-DNA糖基化酶抑制剂MTNLSDIIEKETGKQLVIQESILMLPEEVEEVIGNKPESDILVHTAYDESTDENVMLLTSDAPEYKPWALVIQDSNGENKIKML(SEQIDNO:553)本文提供了合适的UGI蛋白质和核苷酸序列,并且其它合适的UGI序列是本领域技术人员已知的,并且包括例如在Wangetal.,Uracil-DNAglycosylaseinhibitorgeneofbacteriophagePBS2encodesabindingproteinspecificforuracil-DNAglycosylase.J.Biol.Chem.264:1163-1171(1989);Lundquistetal.,Site-directedmutagenesisandcharacterizationofuracil-DNAglycosylaseinhibitorprotein.RoleofspecificcarboxylicaminoacidsincomplexformationwithEscherichiacoliuracil-DNAglycosylase.J.Biol.Chem.272:21408-21419(1997);Ravishankaretal.,X-rayanalysisofacomplexofEscherichiacoliuracilDNAglycosylase(EcUDG)withaproteinaceousinhibitor.ThestructureelucidationofaprokaryoticUDG.NucleicAcidsRes.26:4880-4887(1998);和Putnametal.,ProteinmimicryofDNAfromcrystalstructuresoftheuracil-DNAglycosylaseinhibitorproteinanditscomplexwithEscherichiacoliuracil-DNAglycosylase.J.Mol.Biol.287:331-346(1999)中公开的那些,其各自的全部内容通过引用并入本文。应该理解,另外的蛋白质可以是尿嘧啶糖基化酶抑制剂。例如,能够抑制(例如空间阻断)尿嘧啶-DNA糖基化酶碱基切除修复酶的其它蛋白质在本公开的范围内。在一些实施方案中,尿嘧啶糖基化酶抑制剂是结合DNA的蛋白质。在一些实施方案中,尿嘧啶糖基化酶抑制剂是结合单链DNA的蛋白质。例如,尿嘧啶糖基化酶抑制剂可以是欧文氏塔斯马尼亚菌(Erwiniatasmaniensis)单链结合蛋白。在一些实施方案中,单链结合蛋白包含氨基酸序列(SEQIDNO:303)。在一些实施方案中,尿嘧啶糖基化酶抑制剂是结合尿嘧啶的蛋白质。在一些实施方案中,尿嘧啶糖基化酶抑制剂是结合DNA中的尿嘧啶的蛋白质。在一些实施方案中,尿嘧啶糖基化酶抑制剂是催化失活的尿嘧啶DNA-糖基化酶蛋白。在一些实施方案中,尿嘧啶糖基化酶抑制剂是不从尿中切除尿嘧啶的催化失活的尿嘧啶DNA-糖基化酶蛋白。例如,尿嘧啶糖基化酶抑制剂是UdgX。在一些实施方案中,UdgX包含氨基酸序列(SEQIDNO:304)。作为另一个实例,尿嘧啶糖基化酶抑制剂是催化失活的UDG。在一些实施方案中,催化失活的UDG包含氨基酸序列(SEQIDNO:305)。应该理解的是,其它尿嘧啶糖基化酶抑制剂对于本领域技术人员来说是显而易见的并且在本公开的范围内。ErwiniatasmaniensisSSB(热稳定性单链DNA结合蛋白)MASRGVNKVILVGNLGQDPEVRYMPNGGAVANITLATSESWRDKQTGETKEKTEWHRVVLFGKLAEVAGEYLRKGSQVYIEGALQTRKWTDQAGVEKYTTEVVVNVGGTMQMLGGRSQGGGASAGGQNGGSNNGWGQPQQPQGGNQFSGGAQQQARPQQQPQQNNAPANNEPPIDFDDDIP(SEQIDNO:303)UdgX(与DNA中的尿嘧啶结合但不切除)MAGAQDFVPHTADLAELAAAAGECRGCGLYRDATQAVFGAGGRSARIMMIGEQPGDKEDLAGLPFVGPAGRLLDRALEAADIDRDALYVTNAVKHFKFTRAAGGKRRIHKTPSRTEVVACRPWLIAEMTSVEPDVVVLLGATAAKALLGNDFRVTQHRGEVLHVDDVPGDPALVATVHPSSLLRGPKEERESAFAGLVDDLRVAADVRP(SEQIDNO:304)UDG(无催化活性的人UDG,与DNA中的尿嘧啶结合但不切除)MIGQKTLYSFFSPSPARKRHAPSPEPAVQGTGVAGVPEESGDAAAIPAKKAPAGQEEPGTPPSSPLSAEQLDRIQRNKAAALLRLAARNVPVGFGESWKKHLSGEFGKPYFIKLMGFVAEERKHYTVYPPPHQVFTWTQMCDIKDVKVVILGQEPYHGPNQAHGLCFSVQRPVPPPPSLENIYKELSTDIEDFVHPGHGDLSGWAKQGVLLLNAVLTVRAHQANSHKERGWEQFTDAVVSWLNQNSNGLVFLLWGSYAQKKGSAIDRKRHHVLQTAHPSPLSVYRGFFGCRHFSKTNELLQKSGKKPIDWKEL(SEQIDNO:305)高保真度Cas9本公开的一些方面提供了高保真度Cas9蛋白。在一些实施方案中,与野生型Cas9结构域相比,高保真度Cas9蛋白具有降低的Cas9蛋白与DNA的糖-磷酸骨架之间的静电相互作用。在一些实施方案中,本文提供的任何Cas9蛋白包含减少Cas9蛋白与DNA的糖-磷酸骨架之间的结合的一个或多个突变。在一些实施方案中,本文提供的任何Cas9蛋白包含一个或多个突变,其将Cas9蛋白和DNA的糖-磷酸骨架之间的结合减少至少5%,至少10%,至少15%,至少20%,至少25%,至少30%,至少35%,至少40%,至少45%,至少50%,至少60%,至少70%,至少80%至少90%或至少95%。在一些实施方案中,本文提供的任何Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的N497X,R661X,Q695X和/或Q926X突变中的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X是任意氨基酸。在一些实施方案中,本文提供的任何Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的N497A,R661A,Q695A和/或Q926A突变中的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含SEQIDNO:9中提供的氨基酸序列的D10A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,Cas9蛋白包含如SEQIDNO:306所示的氨基酸序列。本领域已经描述了高保真度Cas9蛋白,并且对于本领域技术人员是显而易见的。例如,已经在Kleinstiver,B.P.,etal.“High-fidelityCRISPR-Cas9nucleaseswithnodetectablegenome-wideoff-targeteffects.”Nature529,490-495(2016);和Slaymaker,I.M.,etal.“RationallyengineeredCas9nucleaseswithimprovedspecificity.”Science351,84-88(2015)中描述了高保真Cas9蛋白;其各自的全部内容通过引用并入本文。应当理解,基于本公开和本领域的知识,可以在任何Cas9蛋白中生成突变以制备高保真度的Cas9蛋白质,其相比于野生型Cas9结构域具有降低的Cas9蛋白和DNA的糖-磷酸酯骨架之间的静电相互作用。Cas9结构域,其中相对于SEQIDNO:9的Cas9的突变以粗体和下划线示出。具有降低的PAM排他性的Cas9蛋白本公开的一些方面提供了具有不同的PAM特异性的Cas9蛋白。通常,Cas9蛋白例如来自酿脓链球菌的Cas9(spCas9),需要规范的NGGPAM序列来结合特定的核酸区域。这可以限制Cas9蛋白与基因组内特定核苷酸序列结合的能力。因此,在一些实施方案中,本文提供的任何Cas蛋白可以能够结合不含规范(例如NGG)PAM序列的核苷酸序列。例如,结合非规范PAM序列的Cas9蛋白已经在Kleinstiver,B.P.,etal.,“EngineeredCRISPR-Cas9nucleaseswithalteredPAMspecificities”Nature523,481-485(2015);andKleinstiver,B.P.,etal.,“BroadeningthetargetingrangeofStaphylococcusaureusCRISPR-Cas9bymodifyingPAMrecognition”NatureBiotechnology33,1293-1298(2015)中描述;其各自的全部内容通过引用并入本文。在一些实施方案中,Cas9蛋白是来自金黄色葡萄球菌(Staphylococcusaureus)的Cas9蛋白(SaCas9)。在一些实施方案中,SaCas9蛋白是核酸酶活性的SaCas9,无核酸酶活性的SaCas9(SaCas9d)或SaCas9切口酶(SaCas9n)。在一些实施方案中,SaCas9包含氨基酸序列SEQIDNO:307。在一些实施方案中,SaCas9包含SEQIDNO:307的N579X突变,或SEQIDNO:9-262中提供的氨基酸序列的任一项中的对应突变,其中X是除N之外的任意氨基酸。在一些实施方案中,SaCas9包含SEQIDNO:307的N579A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,SaCas9蛋白,SaCas9d蛋白或SaCas9n蛋白能够结合具有非规范PAM的核酸序列。在一些实施方案中,SaCas9蛋白,SaCas9d蛋白或SaCas9n蛋白能够结合具有NNGRRTPAM序列的核酸序列。在一些实施方案中,SaCas9蛋白包含SEQIDNO:307的E781X,N967X或R1014X突变的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X是任意氨基酸。在一些实施方案中,SaCas9蛋白包含SEQIDNO:307的E781K,N967K或R1014H突变的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,SaCas9蛋白包含SEQIDNO:307的E781K,N967K和R1014H突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。应该理解,这些突变可以与本文提供的任何其它突变组合在一些实施方案中,本文提供的任何融合蛋白的Cas9蛋白包含与SEQIDNO:307-309中任一项至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少99.5%相同的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9蛋白包含SEQIDNO:307-309中任一项的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9蛋白由SEQIDNO:307-309中任一项的氨基酸序列组成。示例性SaCas9序列以下划线和粗体显示的SEQIDNO:307的残基N579可以被突变(例如突变为A579)以产生SaCas9切口酶。示例性SaCas9n序列SEQIDNO:308的残基A579(其可以从SEQIDNO:307的N579突变以产生SaCas9切口酶)加下划线和粗体显示。示例性的SaKKHCas9SEQIDNO:309的残基A579(其可以从SEQIDNO:307的N579突变以产生SaCas9切口酶)以下划线和粗体表示。SEQIDNO:309的残基K781,K967和H1014(其可以从SEQIDNO:307的E781,N967和R1014突变以产生SaKKHCas9)以下划线和斜体表示。在一些实施方案中,Cas9蛋白是来自酿脓链球菌的Cas9蛋白(SpCas9)。在一些实施方案中,SpCas9蛋白是核酸酶活性的SpCas9,无核酸酶活性的SpCas9(SpCas9d)或SpCas9切口酶(SpCas9n)。在一些实施方案中,SpCas9包含氨基酸序列SEQIDNO:9。在一些实施方案中,SpCas9包含SEQIDNO:9的D10X突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X是除D之外的任意氨基酸。在一些实施方案中,SpCas9包含SEQIDNO:9的D10A突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,SpCas9蛋白,SpCas9d蛋白或SpCas9n蛋白能够结合具有非规范PAM的核酸序列。在一些实施方案中,SpCas9蛋白,SpCas9d蛋白或SpCas9n蛋白能够结合具有NGG,NGA或NGCGPAM序列的核酸序列。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135X,R1335X和T1337X突变中的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X是任意氨基酸。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135E,R1335Q和T1337R突变中的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135E,R1335Q和T1335R突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135X,R1335X和T1337X突变中的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X是任意氨基酸。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135V,R1335Q和T1337R突变中一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135V,R1335Q和T1337R突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135X,G1218X,R1335X和T1337X突变中的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变,其中X是任意氨基酸。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135V,G1218R,R1335Q和T1337R突变中的一个或多个,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。在一些实施方案中,SpCas9蛋白包含SEQIDNO:9的D1135V,G1218R,R1335Q和T1337R突变,或SEQIDNO:10-262中提供的氨基酸序列的任一项中的对应突变。应该理解,这些突变可以与本文提供的任何其它突变组合在一些实施方案中,本文提供的任何融合蛋白的Cas9蛋白包含与SEQIDNO:310-313中任一项至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%,或至少99.5%相同的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9蛋白包含SEQIDNO:310-313中任一项的氨基酸序列。在一些实施方案中,本文提供的任何融合蛋白的Cas9蛋白由SEQIDNO:310-313中任一项的氨基酸序列组成。示例性的SpCas9MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQIDNO:9)示例性的SpCas9nDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDHIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD(SEQIDNO:310)示例性SpEQRCas9SEQIDNO:311的残基E1134,Q1334和R1336(其可以从SEQIDNO:9的D1134,R1334和T1336突变以产生SpEQRCas9)以下划线和粗体表示。示例性的SpVQRCas9SEQIDNO:312的残基V1134,Q1334和R1336(其可以从SEQIDNO:9的D1134,R1334和T1336突变以产生SpVQRCas9)以下划线和粗体显示。示例性的SpVRERCas9SEQIDNO:313的残基V1134,R1217,Q1334和R1336(其可以从SEQIDNO:9的D1134,G1217,R1334和T1336突变以产生SpVRERCas9)以下划线和粗体表示。与引导RNA的Cas9复合物本发明的一些方面提供复合物,其包含本文提供的Cas9蛋白或Cas9融合蛋白,和与Cas9蛋白或Cas9融合蛋白结合的引导RNA。在一些实施方案中,引导RNA为约15-100核苷酸长并包含与靶序列互补的至少10个连续的核苷酸的序列。在一些实施方案中,引导RNA为15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49或50长。在一些实施方案中,引导RNA包含与靶序列互补的15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39或40个连续核苷酸的序列。在一些实施方案中,靶序列是DNA序列。在一些实施方案中,靶序列是哺乳动物基因组中的序列。在一些实施方案中,靶序列是人基因组中的序列。在一些实施方案中,靶序列的3'端不直接邻接规范PAM序列(5'-NGG-3')。本公开的一些方面提供了复合物,其包含与融合蛋白的Cas9蛋白结合的第一引导RNA,和与融合蛋白的第二Cas9蛋白结合的第二引导RNA。在一些实施方案中,第一引导RNA为约15-100核苷酸长并包含与第一靶序列互补的至少10个连续的核苷酸的序列,并且第二引导RNA为约15-100核苷酸长并包含与第二靶序列互补的至少10个连续的核苷酸的序列。在一些实施方案中,第一引导RNA和/或第二引导RNA为15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49或50长。在一些实施方案中,第一引导RNA和第二引导RNA不同。在一些实施方案中,第一引导RNA包含与第一靶序列互补的15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39或40个连续核苷酸的序列,且其中第二引导RNA包含与第二靶序列互补的15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39或40个连续核苷酸的序列。在一些实施例中,第一靶序列和第二靶序列不同。在一些实施方案中,第一靶序列和第二靶序列是DNA序列。在一些实施方案中,第一靶序列和第二靶序列在哺乳动物的基因组中。在一些实施方案中,第一靶序列和第二靶序列在人的基因组中。在一些实施方案中,第一靶序列在第二靶序列的至少5,10,15,20,25,30,35,40,45,50,60,70,80,90,100,150,或200个核苷酸内。在一些实施方案中,第一靶序列的3'端不直接邻接规范PAM序列(5'-NGG-3')。在一些实施方案中,第二靶序列的3'端不直接邻接规范PAM序列(5'-NGG-3')。使用Cas9融合蛋白的方法本公开的一些方面提供了使用本文提供的Cas9蛋白,融合蛋白或复合物的方法。例如,本公开的一些方面提供了方法,其包括将DNA分子与(a)本文提供的任何Cas9蛋白或融合蛋白以及与至少一种引导RNA接触,其中引导RNA为约15-100个核苷酸长,并且包含与靶序列互补的至少10个连续核苷酸的序列;或与(b)如本文提供的Cas9蛋白或Cas9融合蛋白,或者与至少一种gRNA复合的Cas9蛋白或融合蛋白。在一些实施方案中,靶序列的3'端不直接邻接规范PAM序列(5'-NGG-3')。在一些实施方案中,靶序列的3'端紧邻AGC,GAG,TTT,GTG或CAA序列。在一些实施方案中,靶DNA序列包含与疾病或病症相关的序列。在一些实施方案中,靶DNA序列包含与疾病或病症相关的点突变。在一些实施方案中,Cas9蛋白,Cas9融合蛋白或复合物的活性导致对点突变的校正。在一些实施方案中靶DNA序列包含与疾病或病症相关的T→C点突变,并且其中突变体C碱基的脱氨基导致不与疾病或病症相关的序列。在一些实施方案中,靶DNA序列编码蛋白质,且其中所述点突变位于密码子中并导致突变体密码子编码的氨基酸与野生型密码子相比改变。在一些实施方案中,突变体C的脱氨基导致由突变体密码子编码的氨基酸的改变。在一些实施方案中,突变体C的脱氨基导致编码野生型氨基酸的密码子。在一些实施方案中,接触在受试者体内。在一些实施方案中,受试者患有或已经被诊断患有疾病或病症。在一些实施方案中,所述疾病或病症是囊性纤维化,苯丙酮尿症,表皮松解性角化过度症(EHK),Charchar-Marie-Toot疾病4J型,神经母细胞瘤(NB),vonWillebrand病(vWD),先天性肌强直,遗传性肾淀粉样变性,扩张型心肌病(DCM),遗传性淋巴水肿,家族性阿尔茨海默病,HIV,朊病毒病,慢性婴儿神经皮肤关节综合征(CINCA),结蛋白相关性肌病(DRM),与突变体PI3KCA蛋白,突变体CTNNB1蛋白,突变体HRAS蛋白或突变体p53蛋白相关的肿瘤性疾病。一些实施方案提供了使用本文提供的Cas9DNA编辑融合蛋白的方法。在一些实施方案中,融合蛋白用于通过使靶核碱基例如C残基脱氨基将点突变引入核酸。在一些实施方案中,靶核碱基的脱氨基导致遗传缺陷的校正,例如校正导致基因产物中功能缺失的点突变。在一些实施方案中,遗传缺陷与疾病或病症相关,例如溶酶体贮积症或代谢疾病,例如I型糖尿病。在一些实施方案中,本文提供的方法用于将失活点突变引入编码与疾病或病症相关的基因产物的基因或等位基因。例如,在一些实施方案中,本文提供了使用Cas9DNA编辑融合蛋白将失活点突变引入致癌基因(例如,在增殖性疾病的治疗中)的方法。在一些实施方案中,失活突变可以在编码序列中产生提前终止密码子,其导致截短的基因产物(例如缺乏全长蛋白的功能的截短蛋白)的表达。在一些实施方案中,本文提供的方法的目的是通过基因组编辑来恢复功能失调的基因的功能。本文提供的Cas9脱氨酶融合蛋白可以体外用于基于基因编辑的人类治疗剂,例如通过校正人细胞培养物中的疾病相关突变。本领域技术人员将会理解,本文提供的融合蛋白(例如包含Cas9结构域和核酸脱氨酶结构域的融合蛋白)可用于校正任何单个点T→C或A→G突变。在第一种情况下,将突变体C脱氨基为U可以校正突变,在后一种情况下,与突变体G碱基配对的C脱氨基,接着进行一轮复制,校正突变。可以通过体外或体内提供融合蛋白校正的示例性疾病相关突变是PI3KCA蛋白中的H1047R(A3140G)多态性。磷酸肌醇-3-激酶,催化α亚基(PI3KCA)蛋白作用于磷酸化磷脂酰肌醇的肌醇环的3-OH基团。已经发现PI3KCA基因在许多不同的癌中是突变的,因此它被认为是一种强力的致癌基因。50事实上,A3140G突变存在于几种NCI-60癌细胞系中,例如HCT116,SKOV3和T47D细胞系,这些细胞系可从美国典型培养物保藏中心(ATCC)容易地获得。51在一些实施方案中,携带待校正的突变的细胞,例如携带点突变例如PI3KCA基因的外显子20中的A3140G点突变(其导致PI3KCA蛋白中的H1047R取代)的细胞,与编码Cas9脱氨酶融合蛋白和适当设计的sgRNA接触,所述sgRNA将融合蛋白靶向编码PI3KCA基因中的相应突变位点。可以进行对照实验,其中将sgRNA设计为将融合酶靶向至PI3KCA基因内的非C残基。可以提取经处理的细胞的基因组DNA,并且将PI3KCA基因的相关序列进行PCR扩增和测序以评估融合蛋白在人细胞培养物中的活性。应该理解的是,校正PI3KCA中的点突变的实例是为了说明的目的而提供,并且不意味着限制本公开。本领域技术人员将理解,本文公开的DNA编辑融合蛋白可用于校正与其它癌症以及除癌症以外的疾病(包括其它增生性疾病)相关的其它点突变和突变。疾病相关基因和等位基因中的点突变的成功校正为基因校正开辟了新的策略,其具有在治疗学和基础研究中的用途。如所公开的Cas9融合蛋白和脱氨酶或结构域的位点特异性单碱基修饰系统也可用于“反向”基因治疗,其中某些基因功能被有意抑制或消除。在这些情况下,可以使用位点特异性突变Trp(TGG),Gln(CAA和CAG)或Arg(CGA)残基为提前终止密码子(TAA,TAG,TGA)来消除体外,离体,或体内的蛋白质功能。本公开提供了用于治疗被诊断患有与点突变相关或由点突变导致的疾病的受试者的方法,所述点突变可以通过本文提供的Cas9DNA编辑融合蛋白校正。例如,在一些实施方案中,提供了方法,其包括向患有此类疾病(例如与如上所述的PI3KCA点突变相关的癌症)的受试者施用有效量的校正点突变或在疾病相关基因中引入失活突变的Cas9脱氨酶融合蛋白。在一些实施方案中,疾病是增殖性疾病。在一些实施方案中,疾病是遗传疾病。在一些实施方案中,疾病是肿瘤性疾病。在一些实施方案中,疾病是代谢疾病。在一些实施方案中,该疾病是溶酶体贮积病。可以通过校正点突变或将失活突变引入疾病相关基因来治疗的其它疾病对于本领域技术人员而言是已知的,并且本公开在这方面不受限制。本公开内容提供了用于治疗由与点突变相关或由点突变导致的另外的疾病或病症的方法,所述点突变能够通过脱氨酶介导的基因编辑校正。本文描述了一些此类疾病,并且基于本公开,可以使用本文提供的策略和融合蛋白治疗的其它适合的疾病对于本领域技术人员将是显而易见的。下面列出了示例性适合的疾病和病症。应该理解,相应序列中特定位置或残基的编号取决于所用的具体蛋白质和编号方案。编号可以不同,例如在成熟蛋白质的前体和成熟蛋白质本身中,并且从物种到物种的序列差异可以影响编号。本领域技术人员将能够通过本领域公知的方法,例如通过序列比对和确定同源残基,鉴定任何同源蛋白质和相应编码核酸中的相应残基。示例性的适合的疾病和病症包括但不限于囊性纤维化(参见例如Schwanketal.,FunctionalrepairofCFTRbyCRISPR/Cas9inintestinalstemcellorganoidsofcysticfibrosispatients.Cellstemcell.2013;13:653-658;和Wuet.al.,CorrectionofageneticdiseaseinmouseviauseofCRISPR-Cas9.Cellstemcell.2013;13:659-662,两者均未使用脱氨酶融合蛋白来校正遗传缺陷);苯丙酮尿症-例如在苯丙氨酸羟化酶基因的位置835(小鼠)或240(人)或同源残基的苯丙氨酸到丝氨酸突变(T>C突变)-参见例如McDonaldetal.,Genomics.1997;39:402-405;巨血小板综合症(Bernard-Souliersyndrome,BSS)-例如血小板膜糖蛋白IX中残基55或同源残基处苯丙氨酸到丝氨酸突变,或残基24或同源残基处半胱氨酸到精氨酸突变-参见例如Norisetal.,BritishJournalofHaematology.1997;97:312-320,和Alietal.,Hematol.2014;93:381-384;表皮松解性角化过度症(EHK)-例如角蛋白1中位置160或161(如果计算起始甲硫氨酸)处的亮氨酸到脯氨酸突变(T>C突变)-参见例如Chipevetal.,Cell.1992;70:821-828,还参见www[dot]uniprot[dot]org的UNIPROT数据库中的登录号P04264;慢性阻塞性肺病(COPD)-例如α1-抗胰蛋白酶的加工形式中的位置54或55(如果计算初始甲硫氨酸)或同源残基,或未加工形式中的残基78或同源残基处的亮氨酸到脯氨酸突变(T>C突变)-参见例如Polleretal.,Genomics.1993;17:740-743,还参见UNIPROT数据库中的登录号P01011;Charcot-Marie-Toot病4J型-例如FIG4中的位置41或同源残基处的异亮氨酸到苏氨酸突变(T>C突变)-参见例如Lenketal.,PLoSGenetics.2011;7:e1002104;神经母细胞瘤(NB)-例如半胱天冬酶-9中的位置197或同源残基处的亮氨酸到脯氨酸突变(T>C突变)-参见例如Kunduetal.,3Biotech.2013,3:225-234;vonWillebrand病(vWD)-例如vonWillebrand因子的加工形式中的位置509或同源残基处,或vonWillebrand因子的未加工形式中的位置1282或同源残基处的半胱氨酸到精氨酸突变(T>C突变)-参见例如Lavergneetal.,Br.J.Haematol.1992,还参见UNIPROT数据库中的登录号P04275;82:66-72;先天性肌强直-例如肌氯通道基因CLCN1中位置277或同源残基处的半胱氨酸到精氨酸突变(T>C突变)-参见例如Weinbergeretal.,TheJ.ofPhysiology.2012;590:3449-3464;遗传性肾淀粉样变性-例如载脂蛋白AII的加工形式中位置78或同源残基或者未加工形式的位置101或同源残基处的终止密码子到精氨酸突变(T>C突变)-参见例如Yazakietal.,KidneyInt.2003;64:11-16;扩张性心肌病(DCM)-例如FOXD4基因中位置148或同源残基处的色氨酸到精氨酸突变(T>C突变)-参见例如Minorettiet.al.,Int.J.ofMol.Med.2007;19:369-372;遗传性淋巴水肿-例如VEGFR3酪氨酸激酶中的位置1035或同源残基处的组氨酸到精氨酸突变(A>G突变);参见例如Irrthumetal.,Am.J.Hum.Genet.2000;67:295-301;家族性阿尔茨海默氏病-例如早老素1中的位置143或同源残基处的异亮氨酸到缬氨酸突变(A>G突变),参见例如Galloet.al.,J.Alzheimer’sdisease.2011;25:425-431;阮病毒病-例如阮病毒蛋白中位置129或同源残基处的甲硫氨酸到缬氨酸突变(A>G突变)-参见例如Lewiset.al.,J.ofGeneralVirology.2006;87:2443-2449;慢性婴儿神经性皮肤关节综合征(CINCA)-例如cryopyrin中位置570或同源残基处的酪氨酸到半胱氨酸突变(A>G突变)-参见例如Fujisawaet.al.Blood.2007;109:2903-2911;和肌间线蛋白相关肌病(desmin-relatedmyopathy,DRM)-例如αB晶状体蛋白中位置120或同源残基处的精氨酸到甘氨酸突变(A>G突变)-参见例如Kumaretal.,J.Biol.Chem.1999;274:24137-24141。所有参开文献和数据库条目的全部内容通过引用并入本文。本公开提供了包含致病性T>C或A>G突变的基因的列表,其可以使用本文提供的任何Cas9融合蛋白进行校正。本文提供了这些基因的名称,它们各自的SEQIDNO,它们的基因ID以及突变位点侧翼的序列。参见表4和5。不希望受任何特定理论的束缚,可以使用本文提供的Cas9融合物校正表4和5中提供的突变,所述Cas9融合体能够结合缺乏规范PAM序列的靶序列。在一些实施方案中,Cas9-脱氨酶融合蛋白对非规范PAM展现出活性,并因此可以校正表4和表5中分别列出的所有致病性T>C或A>G突变(SEQIDNO:674-2539和3144-5083)。在一些实施方案中,Cas9-脱氨酶融合蛋白识别规范PAM,因此可以校正具有规范PAM例如5′-NGG-3′的致病性T>C或A>G突变。应该理解,本领域技术人员将理解如何设计RNA(例如,gRNA)以将本文提供的任何Cas9蛋白或融合蛋白靶向至任何靶序列以校正本文提供的任何突变,例如,表4和5中提供的突变。对于本领域技术人员显而易见的是,为了将本文所公开的Cas9:效应结构域融合蛋白靶向至靶位点,例如包含待编辑的点突变的位点,通常需要共同表达Cas9:效应结构域融合蛋白以及引导RNA,例如sgRNA。如本文别处更详细解释的,引导RNA通常包含允许Cas9结合的tracrRNA框架,和赋予Cas9:效应结构域融合蛋白序列特异性的引导序列。在一些实施方案中,引导RNA包含结构5'-[引导序列]-guuuuagagcuagaaauagcaaguuaaaauaaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugcuuuuu-3'(SEQIDNO:285),其中引导序列包含与靶序列互补的序列。引导序列通常为20个核苷酸长。基于本公开,用于将Cas9:效应结构域融合蛋白靶向至特定基因组靶位点的适合的引导RNA序列对于本领域技术人员将是显而易见的。此类适合的引导RNA序列通常包含与待编辑的靶核苷酸上游或下游50个核苷酸内的核酸序列互补的引导序列。试剂盒、载体、细胞本公开的一些方面提供了包含核酸构建体的试剂盒,所述核酸构建体包含(a)编码本文提供的Cas9蛋白或Cas9融合蛋白的核苷酸序列;和(b)驱动(a)的序列表达的异源启动子。在一些实施方案中,所述试剂盒进一步包含编码引导RNA骨架的表达构建体,其中所述构建体包含克隆位点,其定位允许将与靶序列相同或互补的核酸序列克隆到引导RNA骨架中。本公开的一些方面提供了编码本文提供的融合蛋白的Cas9蛋白的多核苷酸。本公开的一些方面提供了包含此类多核苷酸的载体。在一些实施方案中,载体包含驱动多核苷酸表达的异源启动子。本公开的一些方面提供了包含本文提供的Ca9蛋白,融合蛋白,核酸分子和/或载体的细胞。本文提供的报告系统的示例性实施方案的描述仅用于说明的目的,而不意味着限制。另外的报告系统,例如上面详细描述的示例性系统的变体,也包括在本公开内容中。实施例实施例1:没有PAM序列限制的Cas9的PACE演化建立PAM文库。合成了四种不同的前间隔区(protospacer)靶序列:Doench1–5′-AAGAGAGACAGTACATGCCC-3′(SEQIDNO:286);Doench2–5′-GGAGCCCACCGAGTACCTGG-3′(SEQIDNO:287);G7’–5′-AGTCTCCTCAGCAAAACGAA-3′(SEQIDNO:288);和VEGF靶2–5′-GACCCCCTCCACCCCGCCTC-3′(SEQIDNO:289)。对于每个前间隔区靶序列,建立了3’-NNNPAM文库。虽然规范PAM序列是5'-NGG-3',(例如,示例性[Doench1]-[规范PAM]靶序列可以是5'-[AAGAGAGACAGTACATGCCC]-[NGG]-3'(SEQIDNO:291)),每个前间隔区靶序列的3'NNNPAM文库含有完全随机的PAM序列,例如,对于Doench15′-AAGAGAGACAGTACATGCCCNNN-3′(SEQIDNO:290),其中N代表任何核苷酸。因此,NNNPAM文库在相应的前间隔区靶序列的3'端包括PAM序列的每种可能的组合。在ω-dCas9萤光素酶测定法中测试Cas9对PAM文库的活性。使用细菌萤光素酶活化测定法测试Cas9活性,其中大肠杆菌RNA聚合酶的ω亚基(rpoZ)与dCas9的融合蛋白(参见例如Bikardetal.,NucleicAcidsRes.2013Aug;41(15):7429–7437)驱动由核酸编码的萤光素酶的产生,所述核酸在包含sgNNA靶向的序列的弱启动子的控制下。将每个PAM文库克隆到包含这种弱启动子的质粒中,其中[靶序列]-[PAM文库]核酸序列用作sgRNA靶向的序列。将PAM文库克隆到启动子中。在规范PAM和随机PAM文库的全部四个前间隔区靶标上进行ω-dCas9测定。图1显示野生型酿脓链球菌对PAM文库的活性。Cas9对PAM文库的演化。酿脓链球菌Caas9与RNA聚合酶的ω单元融合。将所得的ω-dCas9融合蛋白克隆到基于M13噬菌体的选择噬菌粒(SP)中,所述噬菌粒包含除编码pIII的基因的功能性版本以外的完整M13噬菌体基因组,所述编码pIII的基因是生成感染性噬菌体颗粒所必需的基因。在由ω-dCas9转录活化的启动子的控制下,在单独的质粒(辅助质粒,AP)上提供编码pIII的噬菌体基因。将PAM文库克隆到辅助质粒的启动子区。提供了用于没有PAM限制的Cas9蛋白的定向演化的宿主细胞,其含有辅助质粒。在用选择噬菌体感染后,由给定宿主细胞产生的感染性噬菌体颗粒的量因此取决于由选择性噬菌体编码的ω-dCas9融合蛋白对辅助质粒的启动子的活性,所述辅助质粒是产生pIII蛋白所需的。因此,辅助质粒赋予编码ω-dCas9融合蛋白变体的那些选择性噬菌体的选择性优势,所述ω-dCas9融合蛋白变体对不同的非规范PAM序列具有增加的活性。提供了泻湖(lagoon),并通过泻湖生成了包含辅助质粒的宿主细胞流。使宿主细胞与选择噬菌粒接触,导致在泻湖中的宿主细胞流中繁殖的选择噬菌体群体。将噬菌体感染的宿主细胞从泻湖中移出并将新鲜的未感染的宿主细胞以一定速率供给到泻湖中,所述速率导致宿主细胞保留在泻湖中的平均时间短于宿主细胞的细胞分裂之间的平均时间,但比平均M13噬菌体生命周期时间长。为了在定向演化实验期间生成Cas9变体,将泻湖中的宿主细胞在导致增加的突变率的条件下温育。宿主细胞携带诱变质粒(MP),其增加诱变率,因此在噬菌体生命周期期间在由选择噬菌粒编码的ω-dCas9融合蛋白中引入突变。因为宿主细胞通过泻湖的流速导致宿主细胞在泻湖中保留的平均时间短于宿主细胞分裂之间的平均时间,所以泻湖中的宿主细胞不能在它们的基因组中或在辅助质粒上积累由诱变质粒赋予的增加的突变率导致的突变。然而,选择噬菌体在宿主细胞流中在泻湖中复制,因此随时间积累突变,导致产生新的,演化的ω-dCas9融合蛋白变体。如果任何这些演化的ω-dCas9融合蛋白变体包括赋予对包含PAM文库的辅助质粒增加的活性的突变,则这将直接转化为被编码相应的ω-dCas9融合蛋白变体的选择噬菌体感染的宿主细胞产生更多的pIII编码。更多的pIII产生将继而导致产生更多的感染性选择噬菌体颗粒,其随着时间的推移,导致携带此类有益突变的突变选择噬菌体对不包含此类突变的选择性噬菌体的竞争优势。一段时间后,由辅助质粒施加的选择性压力将因此导致获得了有益突变的选择噬菌体成为宿主细胞流中复制的优势种类,而没有突变或具有有害突变的选择噬菌体将被从泻湖洗出。因为在实验开始时ω-dCas9融合蛋白对PAM文库的活性非常低,因此选择噬菌粒在携带含有PAM文库的辅助质粒的宿主细胞中进行多轮过夜繁殖以演化对非规范PAM序列显示增加的活性的Cas9变体。在定向演化实验结束时,从泻湖分离演化的选择噬菌体群体,并分析代表性数目的克隆以测试具有有益突变的Cas9变体。尽管观察到的所有突变都提供了有益的表型,但是由多于一个克隆或所有克隆共享的突变特别令人感兴趣。来自Cas9PACE的突变。如上文所述从使用PAM文库辅助质粒的定向演化实验分离一些选择噬菌体克隆。表1中提供了在一些示例性克隆的Cas9氨基酸序列中鉴定的突变(根据SEQIDNO:9进行残基编号):表1-PACE中鉴定的Cas9突变(根据SEQIDNO:9进行残基编号)。在上述ω-dCas9萤光素酶活性测定法中测试克隆1-4。当作为整体在PAM文库上测试时,不同克隆显示萤光素酶表达的改善(图2-定向演化后示例性演化的克隆对PAM文库的Cas9活性)。对非规范PAM序列的Cas9活性的改进。更详细地评估了Cas9蛋白对具有非规范PAM的靶序列的活性。在ω-dCas9萤光素酶测试法中测试了携带I122,D182和E1219V突变的克隆4对各种[Doench2(5′-GGAGCCCACCGAGTACCTGG-3′(SEQIDNO:287))]-[PAM]靶序列的活性并与野生型dCas9的活性比较。对非规范PAM序列的Cas9活性的改进。更详细地评估了Cas9蛋白对具有非规范PAM的靶序列的活性。在ω-dCas9萤光素酶活化测试法中测试了携带I122,D182和E1219V突变的克隆4对各种[Doench2(5′-GGAGCCCACCGAGTACCTGG-3′(SEQIDNO:287))]-[PAM]靶序列的活性并与野生型dCas9的活性比较。表2中显示了数据。表2-克隆4对各种PAM序列的相对活性实施例2-没有任何PAM序列限制的Cas9的PACE演化因为ω-dCas9融合蛋白对NNN-PAM文库的活性非常低,进行了第二轮PACE实验,其中通过提供不依赖于ω-dCas9融合蛋白活性的pIII来源在没有选择压力的情况下进行ω-dCas9融合蛋白群体的多样化的最初阶段。最初的多样化阶段允许在整个实验中施加选择性压力的PACE实验中不能获得的突变得以形成。将携带具有SEQIDNO:8提供且具有D10A和H840A突变的dCas9序列的ω-dCas9融合蛋白的选择噬菌体在1030宿主细胞中与MP6诱变质粒一起在阿拉伯糖存在下繁殖过夜以创建突变的选择噬菌体的文库,其编码ω-dCas9融合蛋白变体的文库。在此初始多样化阶段期间PIII从宿主细胞中的单独质粒表达。在过夜(12h)多样化之后,将携带包含NNNPAM文库的辅助质粒和诱变质粒的1030宿主细胞生长至对数期,并且用作宿主细胞的来源以创建通过泻湖的宿主细胞流,所述NNNPAM文库克隆到弱启动子中作为引导RNA靶序列。使用来自过夜温育的多样化的选择噬菌体感染泻湖中的细胞。使泻湖中的宿主细胞与阿拉伯糖接触,以保持诱变质粒中诱变基因的高水平表达。初始噬菌体滴度为约108pfu/mL。对四个NNN-PAM文库([Doench1]-[NNN-PAM],[Doench2]-[NNN-PAM],[G7]-[NNN-PAM]和[VEGF靶标]-[NNN-PAM],其克隆到从弱启动子驱动pIII表达的辅助质粒中,如上文所述)的每一个进行PACE实验。在PACE实验期间监测噬菌体滴度。观察到噬菌体滴度缓慢下降到104pfu/mL。在该时间点将噬菌体群体从泻湖分离,并在含有单独的pIII来源(psp驱动的pIII)的2208宿主细胞上生长。在该低严格繁殖期之后,将上清液的1:100稀释液加入新的泻湖中的新鲜宿主细胞,其携带辅助质粒作为pIII的唯一来源,并继续进行PACE实验。在2208细胞中进行这种低严格温育后没有观察到噬菌体滴度下降。一个示例性PACE实验运行72小时。在这段时间之后,从泻湖中分离出24个存活的克隆,测序并表征。鉴定的突变包括A262T,K294R,S409I,M694I,E480K,E543D和E1219V(根据SEQIDNO:9进行氨基酸编号)。在另一个示例性实验中,在温育15天后分离存活的克隆。在ω-dCas9萤光素酶测定中表征鉴定的dVas9突变体的活性。对非规范PAM靶序列具有最佳ω-dCas9融合蛋白活性的克隆具有以下突变:E480K,E543D,E1219V和T1329。Cas9哺乳动物GFP活化。在Hek293T细胞的dCas9-GFP测定中测试野生型dCas9(SEQIDNO:9)和演化的Cas9克隆。将细胞与报告构建体接触,其中GFP编码序列由包括[gRNA靶序列]-[PAM]序列的弱启动子驱动。生成与转录活化子VP64-p65-Rta(VPR)附接的dCas9(野生型和PACE变体)的融合蛋白,并对各种dCas9-VPR变体测试它们在HEK293细胞中活化GFP报告物的能力。用四种单独的质粒转染Hek293T:dCas9-VPR表达质粒;表达靶向GFP报告质粒的gRNA靶序列的sgRNA的质粒;GFP报告质粒;和iRFP转染对照。在一个实验中,将HEK293细胞与包含TAAPAM的GFP报告物接触,并且在另一个实验中,将HEK293细胞与含有NNNPAM文库的报告质粒群体接触。转染后48小时收获细胞,并使用BDLSR-FORTESSA细胞分析仪定量表达GFP的细胞。图3-Cas9哺乳动物GFP活化。与WTCas9相比,演化的Cas9对TAAPAM(21.08%vs.0.60%的细胞高于阴性对照)和NNNPAM文库(22.76%vs.3.38%的细胞高于阴性对照)表现出更高的活性。演化的Cas9对具有非规范PAM的靶序列的切割活性。为了证明PACE突变在PAM限制的情况下普遍赋予Cas9活性,基于提供的序列产生核酸酶活性Cas9蛋白,即没有D10A和H840A突变,但具有各种PACE突变。在Cas9GFP测定中测试了演化的Cas9变体,使用靶向具有非规范PAM的序列的引导RNA评估了演化的Cas9蛋白变体靶向和失活整合到HEK293细胞基因组中的emGFP基因的能力。观察到当接触野生型核酸酶活性Cas9(SEQIDNO:9)时,6.45%的细胞显示GFP表达的缺失,而与演化的Cas9(E480K,E543D,E1219V和T1329)接触的细胞的54.55%显示GFP表达的缺失。实施例3:没有PAM限制的Cas9变体将赋予对非规范PAM序列的Cas9活性的有益突变作图到酿脓链球菌野生型序列。以下是示例性Cas9序列(具有D10和H840残基的酿脓链球菌Cas9,其在相应氨基酸残基之后使用星号标记,SEQIDNO:9)。可以突变SEQIDNO:9的D10和H840残基以产生无核酸酶活性的Cas9(例如突变为D10A和H840A)或产生切口酶Cas9(例如在H840的情况下突变为D10A;或在H840A的情况下突变为D10)。鉴定了HNH结构域(粗体和下划线)和RuvC结构域(方框)。使用相应氨基酸残基之后的星号标记了从多个PACE实验中分离的克隆中发现突变的残基,氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329。将赋予对非规范PAM序列的Cas9活性的有益突变作图到另外的示例性野生型序列。鉴定了HNH结构域(粗体和下划线)和RuvC结构域(方框)。使用相应氨基酸残基之后的星号标记了与SEQIDNO:9中发现突变的残基,氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329同源的残基。另外,也通过星号鉴定了在dCas9蛋白变体中突变的氨基酸残基10和840。本公开提供了Cas9变体,其中如本文所述对由星号鉴定的一个或多个氨基酸残基进行了突变。在一些实施方案中,D10和H840残基突变成例如丙氨酸残基,并且所提供的Cas9变体包括如本文提供的星号标识的氨基酸残基的一个或多个另外的突变。在一些实施方案中,D10残基突变成例如丙氨酸残基,并且所提供的Cas9变体包括如本文提供的星号标识的氨基酸残基的一个或多个另外的突变。将来自不同物种的许多Cas9序列进行比对以确定是否可以在其他Cas9蛋白中鉴定相应的同源氨基酸残基,从而允许产生具有同源氨基酸残基的相应突变的Cas9变体。使用NCBIConstraint-basedMultipleAlignmentTool(COBALT,可在st-va.ncbi.nlm.nih.gov/tools/cobalt获得)进行比对,使用以下参数。比对参数:间隙罚分-11,-1;末端间隙罚分-5,-1。CDD参数:使用RPSBLAST开;BlastE-值0.003;查找保守列并重新计算开。查询聚类参数:使用查询聚类开;字大小4;最大聚类距离0.8;AlphabetRegular。以下提供了四个Cas9序列的示例性比对。比对中的Cas9序列是:序列1(S1):SEQIDNO:10|WP_010922251|gi499224711|II型CRISPRRNA引导的核酸内切酶Cas9[酿脓链球菌];序列2(S2):SEQIDNO:11|WP_039695303|gi746743737|II型CRISPRRNA引导的核酸内切酶Cas9[Streptococcusgallolyticus];序列3(S3):SEQIDNO:12|WP_045635197|gi782887988|II型CRISPRRNA引导的内切核酸酶Cas9[慢性链球菌];序列4(S4):SEQIDNO:13|5AXW_A|gi924443546|金黄色酿脓链球菌Cas9。对四个序列中的每一个鉴定HNH结构域(粗体和下划线)和RuvC结构域(方框)。使用相应氨基酸残基之后的星号鉴定S1中的氨基酸残基10,122,137,182,262,294,409,480,543,660,694,840,1219和1329以及比对序列中的同源氨基酸。比对表明可以在Cas9序列变体间鉴定与参考Cas9氨基酸序列或氨基酸残基同源的氨基酸序列和氨基酸残基,所述Cas9序列变体包括但不限于来自不同物种的Cas9序列,其通过使用本领域已知的比对程序和算法鉴定与参考序列或参考残基比对的氨基酸序列或残基。本公开提供了Cas9变体,其中如本文所述对由SEQIDNO:9中的星号标识的一个或多个氨基酸残基进行了突变。除SEQIDNO:9之外的Cas9序列中与SEQIDNO:9中通过星号鉴定的残基对应的残基在本文中被称为“同源”或“对应”残基。此类同源残基可以通过序列比对例如如上文所述和通过鉴定与参考序列或残基比对的序列或残基来鉴定。类似地,除SEQIDNO:9之外的Cas9序列中与本文在SEQIDNO:9中鉴定的突变例如SEQIDNO:9中的残基10,122,137,182,262,294,409,480,543,660,694,840,1219和1329的突变称为“同源”或“对应”突变。例如,以上四个比对序列中与S1中的D10A突变对应的突变是S2的D10A,S3的D9A和S4的D13A;S1中H840A的对应突变是S2的H850A,S3的H842A和S4的H560;与S1中的X1219V对应的突变是S2的X1228V,S3的X1226,和S4的X903V等。使用上述相同的算法和比对参数比对了来自不同物种的总共250个Cas9序列(SEQIDNO:10-262)。以上述相同的方式鉴定了与残基10,122,137,182,262,294,409,480,543,660,694,840,1219和1329同源的残基。以下提供了比对。对于四个序列的每一个鉴定了HNH结构域(粗体和下划线)和RuvC结构域(方框)。在比对中,与SEQIDNO:9中的氨基酸残基10,122,137,182,262,294,409,480,543,660,694,840,1219和1329对应的残基在比对比中在SEQIDNO:10中方框示出,允许在比对的序列中鉴定对应的氨基酸残基。本文提供了在与SEQIDNO:9的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329同源的氨基酸残基中具有一个或多个突变的Cas9变体。在一些实施方案中,本文提供的Cas9变体包含与SEQIDNO:9中的D10A和H840A突变对应的突变,其导致无核酸酶活性的dCas9,以及与SEQIDNO:9中的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329的氨基酸残基的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变。本文提供了在与SEQIDNO:9的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329同源的氨基酸残基中具有一个或多个突变的Cas9变体。在一些实施方案中,本文提供的的Cas9变体包含与SEQIDNO:9中的D10A对应的突变,其导致部分核酸酶无活性的dCas9,其中dCas9可以对非靶标链而不是靶标链产生切口,以及与SEQIDNO:9中的氨基酸残基122,137,182,262,294,409,480,543,660,694,1219和1329的氨基酸残基同源的至少一个,至少两个,至少三个,至少四个,至少五个,至少六个,或至少七个突变。本领域技术人员已知另外的适合的Cas9序列,其中能够鉴定与SEQIDNO:9的残基10,122,137,182,262,294,409,480,543,660,694,840,1219和/或1329同源的氨基酸残基。参见例如Fonfaraetal.,PhylogenyofCas9determinesfunctionalexchangeabilityofdual-RNAandCas9amongorthologoustypeIICRISPR-Cassystems,Nucl.AcidsRes.2013,doi:10.1093/nar/gkt1074的补充表S2和补充图S2,其全部内容通过引用并入本文。本公开提供了本文提供的或本领域已知的序列的Cas9变体,其包含本文提供的一个或多个突变(例如至少一个,至少两个,至少三个,至少四个,至少五个,至少六个或至少七个),例如与SEQIDNO:9中的氨基酸残基10,122,137,182,262,294,409,480,543,660,694,840,1219和/或1329同源的一个或多个氨基酸残基,例如包含A262T,K294R,S409I,E480K,E543D,M694I和/或E1219V突变的Cas9变体。实施例4:具有扩宽的PAM特异性的Cas9的演化通过使用PACE在NNNPAM文库上演化酿脓链球菌Cas9,演化了具有扩宽的PAM特异性的Cas9,其对许多非规范PAM具有更高的活性。此类Cas9仍然保留了其天然的DNA结合和切割活性,并且可以与所有的现有工具一起使用。据推测,通过调节Cas9与DNA的相互作用,可以修饰和扩展Cas9的PAM特异性。其他Cas9例如金黄色葡萄球菌也可以通过此类方法工程化改造以改变和扩展它们的PAM特异性。调节DNA结合的方法例如Cas9蛋白的靶向诱变,与DNA结合蛋白的融合以及使用彼此连接的多个Cas9蛋白也可以扩展可以靶向的PAM。Cas9演化。在使用诱变质粒(MP)的情况下噬菌体的过夜繁殖来演化后,使用在PACE中含有上述突变的所得噬菌体。对来自PACE运行的24个单独的噬菌体测序。在Cas9基因中发现的突变记录在以下表3中。将含有这些突变的Cas9基因从噬菌体中克隆出来并导入质粒中以测试DNA结合和切割活性。表3:Cas9突变人细胞培养物中的GFP活化。在使用dCas9-VPR活化的GFP报告物的情况下对报告物进行测试。首先在5'-NGG-3'PAM上进行测试(图4A和4B),然后使用全部含有相同Cas9靶位点,但在PAM位置具有NNN的GFP报告物文库进行测试(图5A和5B)。在该测试中,发现dCas9-VPR活化GFP信号。测试了没有突变的野生型Cas9(pJH306),从过夜繁殖演化的Cas9(pJH562)和从PACE演化的Cas9(pJH599-pJH605)。以上表3中记载了各个Cas9的突变。所有64个PAM序列上的dCas9-VPR。在所有64个PAM序列上测试pJH306(WTdCas9-VPR)和pJH599(具有突变A262T,S409I,E480K,E543D,M694I和E1219V的WTdCas9-VPR)(图6)。如前所述使用dCas9-VPR活化GFP,并且对于每个孔使用不同的报告质粒以确定对于所有64种不同PAM序列的活化效率。如通过iRFP信号门控,测量所有转染细胞的平均GFP荧光。对于所有的PAM序列,pJH599显示出相比于pJH306改善的或相似的活化水平。体外切割测试。测试表达和纯化的WTCas9(WT)和具有E1219V突变(1)的Cas9切割具有不同PAM的DNA的能力(图7)。将Cas9与含有靶位点的dsDNA一起温育。通过在凝胶上运行DNA以将未切割产物的量与切割产物的量进行比较来测量切割,所述切割产物由于其较小的尺寸而运行更快。发现E1219V突变增加了Cas9对非规范PAM的切割活性,同时保持对5'-NGG-3'PAM的活性。演化不同的系统。除了酿脓链球菌Cas9演化之外,还可以演化其它的Cas9系统,例如金黄色葡萄球菌,嗜热链球菌,脑膜炎双球菌和T.denticola等,以修饰和扩展它们的PAM特异性。数据表明,通过使用与酿脓链球菌Cas9演化相似的系统,也可以演化含有金黄色葡萄球菌Cas9的噬菌体以扩展其PAM特异性。调整PAM特异性。通过将中性和带负电荷的氨基酸突变为带正电荷的氨基酸,可以修饰Cas9以扩展可以靶向的PAM。通常,将产生正电荷净增加的突变整合到Cas9蛋白中可以增加Cas9结合DNA的亲和力。结合本文提供的Cas9突变,可以突变以增加酿脓链球菌Cas9中的PAM靶向的其他残基进一步包括已经鉴定为改变PAM特异性的那些(D1135,G1218,R1333,R1335,T1337)38和可以增加Cas9活性的残基(S845和L847)37。先前鉴定的增加Cas9特异性的残基例如精氨酸,组氨酸和赖氨酸突变为丙氨酸37,以及先前鉴定的天冬酰胺,精氨酸和谷氨酰胺突变为丙氨酸39可以导致降低非规范PAM的耐受性,因为这些突变可能会降低Cas9和DNA之间的相互作用。调整PAM特异性的融合体。可编程DNA结合蛋白例如锌指结构域,TALE和其它Cas9蛋白可以与Cas9融合以改善靶向具有规范或非规范PAM的核苷酸序列的能力,例如增加活性,特异性或效率。核酸酶-无效的dCas9可以与核酸酶活性Cas9融合以增加核酸酶活性Cas9靶向不同PAM序列的能力。与核酸酶活性Cas9融合的核酸酶-无效的dCas9的一个实例显示于图8中。此类融合可用于改善靶向具有规范或非规范PAM的核苷酸序列的能力。Cas9可以来自相同物种或不同物种。此外,这两种Cas9可以是核酸酶无效的dCas9,并且可以进一步与效应物蛋白例如VP64,VP64-p65-Rta,FokI,GFP和其他荧光蛋白,脱氨酶或本文提供的任何效应蛋白融合。使用Cas9来定位其它核酸酶和其它DNA结合蛋白。Cas9也可以用于克服其它蛋白质的天然结合特异性,其通过将它们定位到它们的DNA靶标进行。DNA核酸酶,重组酶,脱氨酶和其它效应物通常具有天然的DNA特异性。Cas9可以与这些蛋白质融合以克服和扩展它们的天然DNA特异性。gRNA将Cas9靶向到DNA效应物靶位点附近并将帮助将它们定位到它们的靶位点。NNNNNPAM文库上的dCas9-VPR。为了测试演化的Cas9在第4和第5个PAM位置尚未获得特异性,在NNNNNPAM文库上测试了dCas9-VPR。如使用NNN文库看到的,大多数的构建体(例如pJH562,pJ559,pJH600,pJH601,pJH602,pJH603和pJH605)显示出改善的活性。pJH599在显示GFP活化的细胞的百分比(图9A)和显示GFP活化的那些细胞的平均荧光(图9B)两者中一致地显示出改善。Cas9GFP切割。将WTCas9,pJH407与核酸酶阳性的演化的Cas9,pJH760比较(图10)。pJH760含有与pJH599相同的突变,但没有D10A和H480A核酸酶失活突变,且没有VPR融合。Cas9切割基因组整合的GFP基因,并通过细胞中GFP信号的丧失来测量活性。在具有5'-NGG-3'PAM的位点上,pJH407和pJH760表现出相当的活性。在具有GATPAM的位点上,pJH760显示出相比于pJH407的显著的活性增加。实施例5:Cas9:DNA编辑酶融合蛋白本公开还提供了与DNA编辑酶融合的Cas9,用于DNA序列的靶向编辑。图11显示了DNA编辑酶-dCas9:sgRNA复合物的双链DNA底物结合。显示的DNA编辑酶是脱氨酶。在这些序列中鉴定了根据图11的结构(36bp:下划线,sgRNA靶序列:粗体;PAM:方框;21bp:斜体)。实施例6:PAM耗竭测定在大肠杆菌中,PAM序列文库由也含有抗生素基因的质粒编码。如果Cas9能够切割质粒上的PAM序列,则质粒不复制并丢失;仅未切割的质粒保留群体。可以通过高通量测序对最初的质粒群体和最终的质粒群体进行测序来确定被Cas9切割的质粒。通过将含有PAM序列的读出数目除以总读出数目来获得由每个PAM序列组成的文库的比例。然后通过将选择前含有PAM部分的文库的比例除以选择后含有PAM序列的文库的比例来计算耗竭分数。较高的耗竭分数表示该特定PAM序列的Cas9的较高的切割活性。图12显示了PAM耗竭测定的结果。用野生型Cas9没有切割的一些PAM序列被演化的Cas9(xCas9v1.0,pJH760)切割。值得注意的是,NGN和NNG形式的所有PAM序列,以及GAA和GAT都显示使用xCas9的大于10倍的耗竭。在第二或第三个PAM位置的单个G能够足以用于新演化的Cas9切割,从而为使用Cas9靶向能够靶向的靶位点显著打开序列空间。表4给出了PAM耗竭分数。表4:PAM耗竭分数实施例7:GFP切割哺乳动物细胞将野生型或演化的Cas9和gRNA转染到含有基因组整合的GFP基因的哺乳动物细胞中。不同的gRNA靶向具有不同的PAM序列的不同位点,使得通过Cas9切割GFP将导致GFP信号的丢失。用流式细胞术在5天后定量GFP信号。如图13所示,演化的Cas9在哺乳动物中切割GFP,其与GFP活化测定和PAM耗竭测定中的结果一致。切割位点周围的高通量测序验证了流式细胞仪所见的结果;插入缺失(indel)与流式细胞仪所见的切割百分比成正比。实施例8:HHH文库的进一步演化由于SpCas9对第二和第三个碱基处的G残基具有偏好,因此使用来自HHH(H=A,C或T)PAM文库的最后演化的终点继续演化。演化后,对13个集落进行测序并鉴定了许多新的突变。在所有克隆中都发现了三个突变E1219V,E480K和E543D突变。许多克隆都具有S267G/K294R/Q1256K突变或A262T/S409I突变,但那些突变从未一起看到,表明克隆沿着演化全景采取了两条不同的路径。表5给出了新的突变。表5:新的突变实施例9:用于基因编辑的进一步演化的Cas9蛋白在PAM耗竭测定中在许多新的靶标上测试实施例6中描述的pJH760。选择了四个新的靶标:re2(GGGGCCACTAGGGACAGGAT(SEQIDNO:314)),之前用于哺乳动物细胞中GFP活化的合成靶标;VEGF(GGGTGGGGGGAGTTTGCTCC(SEQIDNO:315)),VEGF基因内的靶标,CLTA(GCAGATGTAGTGTTTCCACA(SEQIDNO:316)),CLTA基因内的靶标;和CCR5D(TCACTATGCTGCCGCCCAGT(SEQIDNO:317)),CCR5D基因内的靶标。PAM耗竭测定的结果在图14至17中给出。发现除了规范的NGG序列之外,PAM耗竭也显示了对大多数NGN和一些NNG序列的切割。使用来自HHH(H=A,C或T)PAM文库上的最后演化的终点进一步演化HHHPAM文库。演化后,对13个集落进行测序并鉴定了许多新的突变。在所有克隆中发现了三个突变E1219V,E480K和E543D突变。许多克隆都具有K294R/Q1256K突变或A262T/S409I突变,但那些突变从未一起看到,表明克隆沿着演化全景采取了两条不同的路径。以下表8和表9给出了新的突变。如所预期的,使用不同的靶标看到了活性的变化。表10中给出了PAM耗竭测定分数。NGN一致地显示了一些靶标的切割活性。在哪个突变体具有最佳活性方面,xCas93.x突变体中看到变化。值得注意的是,xCas93.3含有K294R/Q1256K系列突变,而其他三种突变(3.6,3.7和3.8)含有A262T/S409I系列突变。xCas93.6和3.7表现优于3.8。尽管在大多数情况下3.3似乎具有最高的活性,但3.6和3.7在某些PAM序列上表现更好。图18至20给出了对于上述三种新的靶标的PAM耗竭测定的结果。构建了NNNNNPAM耗竭文库。进行测定以检查任何第四或第五碱基特异性。PAM耗竭测定的最初结果显示如预期的,对第四和第五碱基没有偏好。总之,发现E1219V是在演化中固定的最早突变之一。在晶体结构中它接近PAM序列。E480K和E543D也在演化早期的所有克隆中都可见,并且可以是重要的。K294R/Q1256K和A262T/S409I似乎是两条不同的路径,并且可以是重要的。它们的PAM序列概况似乎略有不同,这意味着它们相对于PAM活性确定的重要性。表6含有T到C变化的疾病/病症。该表包括可通过将胞嘧啶(C)改变为胸腺嘧啶(T)来校正的人类基因突变。标示了基因名称,基因符号和基因ID。表7含有A至G改变的疾病/病症。该表包括可以通过将鸟嘌呤(G)改改变为腺嘌呤(A)来校正的人类基因突变。指示了基因名称,基因符号和基因ID。表8:xCas9v3突变(K294R/Q1256K系列)表9:xCas9v3突变(A262T/S409I系列)表10.PAM耗竭分数(xCas9v3.0-3.6突变)表10续.PAM耗竭分数(xCas9v3.7-3.12突变)参考文献1.HumbertO,DavisL,MaizelsN.Targetedgenetherapies:tools,applications,optimization.CritRevBiochemMol.2012;47(3):264-81.PMID:22530743.2.Perez-PineraP,OusteroutDG,GersbachCA.Advancesintargetedgenomeediting.CurrOpinChemBiol.2012;16(3-4):268-77.PMID:22819644.3.UrnovFD,RebarEJ,HolmesMC,ZhangHS,GregoryPD.Genomeeditingwithengineeredzincfingernucleases.NatRevGenet.2010;11(9):636-46.PMID:20717154.4.JoungJK,SanderJD.TALENs:awidelyapplicabletechnologyfortargetedgenomeediting.NatRevMolCellBiol.2013;14(1):49-55.PMID:23169466.5.CharpentierE,DoudnaJA.Biotechnology:Rewritingagenome.Nature.2013;495,(7439):50-1.PMID:23467164.6.PanY,XiaL,LiAS,ZhangX,SiroisP,ZhangJ,LiK.Biologicalandbiomedicalapplicationsofengineerednucleases.MolBiotechnol.2013;55(1):54-62.PMID:23089945.7.DeSouza,N.Primer:genomeeditingwithengineerednucleases.NatMethods.2012;9(1):27.PMID:22312638.8.SantiagoY,ChanE,LiuPQ,OrlandoS,ZhangL,UrnovFD,HolmesMC,GuschinD,WaiteA,MillerJC,RebarEJ,GregoryPD,KlugA,CollingwoodTN.Targetedgeneknockoutinmammaliancellsbyusingengineeredzinc-fingernucleases.ProcNatlAcadSciUSA.2008;105(15):5809-14.PMID:18359850.9.CargillM,AltshulerD,IrelandJ,SklarP,ArdlieK,PatilN,LaneCR,LimEP,KalyanaramanN,NemeshJ,ZiaugraL,FriedlandL,RolfeA,WarringtonJ,LipshutzR,DaleyGQ,LanderES.Characterizationofsingle-nucleotidepolymorphismsincodingregionsofhumangenes.NatGenet.1999;22(3):231-8.PMID:10391209.10.JansenR,vanEmbdenJD,GaastraW,SchoulsLM.IdentificationofgenesthatareassociatedwithDNArepeatsinprokaryotes.MolMicrobiol.2002;43(6):1565-75.PMID:11952905.11.MaliP,EsveltKM,ChurchGM.Cas9asaversatiletoolforengineeringbiology.NatMethods.2013;10(10):957-63.PMID:24076990.12.JoreMM,LundgrenM,vanDuijinE,BultemaJB,WestraER,WaghmareSP,WiedenheftB,PulU,WurmR,WagnerR,BeijerMR,BarendregtA,ShouK,SnijdersAP,DickmanMJ,DoudnaJA,BoekemaEJ,HeckAJ,vanderOostJ,BrounsSJ.StructuralbasisforCRISPRRNA-guidedDNArecognitionbyCascade.NatStructMolBiol.2011;18(5):529-36.PMID:21460843.13.HorvathP,BarrangouR.CRISPR/Cas,theimmunesystemofbacteriaandarchaea.Science.2010;327(5962):167-70.PMID:20056882.14.WiedenheftB,SternbergSH,DoudnaJA.RNA-guidedgeneticsilencingsystemsinbacteriaandarchaea.Nature.2012;482(7385):331-8.PMID:22337052.15.GasiunasG,SiksnysV.RNA-dependentDNAendonucleaseCas9oftheCRISPRsystem:HolyGrailofgenomeediting?TrendsMicrobiol.2013;21(11):562-7.PMID:24095303.16.QiLS,LarsonMH,GilbertLA,DoudnaJA,WeissmanJS,ArkinAP,LimWA.RepurposingCRISPRasanRNA-guidedplatformforsequence-specificcontrolofgeneexpression.Cell.2013;152(5):1173-83.PMID:23452860.17.Perez-PineraP,KocakDD,VockleyCM,AdlerAF,KabadiAM,PolsteinLR,ThakorePI,GlassKA,OusteroutDG,LeongKW,GuilakF,CrawfordGE,ReddyTE,GersbachCA.RNA-guidedgeneactivationbyCRISPR-Cas9-basedtranscriptionfactors.NatMethods.2013;10(10):973-6.PMID:23892895.18.MaliP,AachJ,StrangesPB,EsveltKM,MoosburnerM,KosuriS,YangL,ChurchGM.CAS9transcriptionalactivatorsfortargetspecificityscreeningandpairednickasesforcooperativegenomeengineering.NatBiotechnol.2013;31(9):833-8.PMID:23907171.19.GilbertLA,LarsonMH,MorsutL,LiuZ,BrarGA,TorresSE,Stern-GinossarN,BrandmanO,WhiteheadEH,DoudnaJA,LimWA,WeissmanJS,QiLS.CRISPR-mediatedmodularRNA-guidedregulationoftranscriptionineukaryotes.Cell.2013;154(2):442-51.PMID:23849981.20.LarsonMH,GilbertLA,WangX,LimWA,WeissmanJS,QiLS.CRISPRinterference(CRISPRi)forsequence-specificcontrolofgeneexpression.NatProtoc.2013;8(11):2180-96.PMID:24136345.21.MaliP,YangL,EsveltKM,AachJ,GuellM,DiCarloJE,NorvilleJE,ChurchGM.RNA-guidedhumangenomeengineeringviaCas9.Science.2013;339(6121):823-6.PMID:23287722.22.Cole-StraussA,YoonK,XiangY,ByrneBC,RiceMC,GrynJ,HollomanWK,KmiecEB.CorrectionofthemutationresponsibleforsicklecellanemiabyanRNA-DNAoligonucleotide.Science.1996;273(5280):1386-9.PMID:8703073.23.TagalakisAD,OwenJS,SimonsJP.LackofRNA-DNAoligonucleotide(chimeraplast)mutagenicactivityinmouseembryos.MolReprodDev.2005;71(2):140-4.PMID:15791601.24.RayA,LangerM.Homologousrecombination:endsasthemeans.TrendsPlantSci.2002;7(10):435-40.PMID12399177.25.BrittAB,MayGD.Re-engineeringplantgenetargeting.TrendsPlantSci.2003;8(2):90-5.PMID:12597876.26.VagnerV,EhrlichSD.EfficiencyofhomologousDNArecombinationvariesalongtheBacillussubtilischromosome.JBacteriol.1988;170(9):3978-82.PMID:3137211.27.Saleh-GohariN,HelledayT.ConservativehomologousrecombinationpreferentiallyrepairsDNAdouble-strandbreaksintheSphaseofthecellcycleinhumancells.NucleicAcidsRes.2004;32(12):3683-8.PMID:15252152.28.LombardoA,GenoveseP,BeausejourCM,ColleoniS,LeeYL,KimKA,AndoD,UrnovFD,GalliC,GregoryPD,HolmesMC,NaldiniL.Geneeditinginhumanstemcellsusingzincfingernucleasesandintegrase-defectivelentiviralvectordelivery.NatBiotechnol.2007;25(11):1298-306.PMID:17965707.29.ConticelloSG.TheAID/APOBECfamilyofnucleicacidmutators.GenomeBiol.2008;9(6):229.PMID:18598372.30.ReynaudCA,AoufouchiS,FailiA,WeillJC.WhatroleforAID:mutator,orassembleroftheimmunoglobulinmutasome?NatImmunol.2003;4(7):631-8.31.BhagwatAS.DNA-cytosinedeaminases:fromantibodymaturationtoantiviraldefense.DNARepair(Amst).2004;3(1):85-9.PMID:14697763.32.NavaratnamN,SarwarR.Anoverviewofcytidinedeaminases.IntJHematol.2006;83(3):195-200.PMID:16720547.33.HoldenLG,ProchnowC,ChangYP,BransteitterR,ChelicoL,SenU,StevensRC,GoodmanMF,ChenXS.Crystalstructureoftheanti-viralAPOBEC3Gcatalyticdomainandfunctionalimplications.Nature.2008;456(7218):121-4.PMID:18849968.34.ChelicoL,PhamP,PetruskaJ,GoodmanMF.BiochemicalbasisofimmunologicalandretroviralresponsestoDNA-targetedcytosinedeaminationbyactivation-inducedcytidinedeaminaseandAPOBEC3G.JBiolChem.2009;284(41).27761-5.PMID:19684020.35.PhamP,BransteitterR,GoodmanMF.Rewardversusrisk:DNAcytidinedeaminasestriggeringimmunityanddisease.Biochemistry.2005;44(8):2703-15.PMID15723516.36.ChenX,ZaroJL,ShenWC.Fusionproteinlinkers:property,designandfunctionality.AdvDrugDelivRev.2013;65(10):1357-69.PMID:23026637.37.Slaymaker,I.M.etal.RationallyengineeredCas9nucleaseswithimprovedspecificity.Science,doi:10.1126/science.aad5227(2015).38.Kleinstiver,B.P.etal.EngineeredCRISPR-Cas9nucleaseswithalteredPAMspecificities.Nature523,481-485,doi:10.1038/nature14592(2015).39.Pattanayak,V.etal.High-throughputprofilingofoff-targetDNAcleavagerevealsRNA-programmedCas9nucleasespecificity.NatureBiotechnology31,839-843,doi:10.1038/nbt.2673(2013).40.Shcherbakova,D.M.&Verkhusha,V.V.Near-infraredfluorescentproteinsformulticolorinvivoimaging.NatureMethods10,751-754,doi:10.1038/nmeth.2521(2013).41.Kleinstiver,etal.,High-fidelityCRISPR–Cas9nucleaseswithnodetectablegenome-wideoff-targeteffects.Nature529,490-495doi:10.1038/nature16526(2016).本文提及的所有出版物,专利,专利申请,出版物和数据库条目(例如,序列数据库条目),例如在背景,概述,详细描述,实施例和/或参考文献部分中的那些,通过引用以其整体并入本文,就像每个单独的出版物,专利,专利申请,出版物和数据库条目被具体地并且单独地通过引用并入本文一样。在冲突的情况下,以本申请(包括本文中的任何定义)为准。等同实施方案和范围本领域技术人员将认识到,或仅仅使用常规实验就能够确定本文所述实施例的许多等同实施方案。本公开的范围不旨在限于以上描述,而是如在所附权利要求中阐述的那样。例如“一个”,“一种”和“该”的冠词可以表示一个或多于一个,除非存在相反指示或者从上下文中明显。如果一个,多于一个或所有的组成员都存在,则认为满足在两个或多个组成员之间包括“或”的权利要求或描述,除非存在相反指示或者从上下文中明显。包括两个或更多个组成员之间的“或”的组的公开提供了其中存在该组的一个成员的实施方案,其中存在该组的多于一个成员的实施例,以及其中存在所有成员的实施例。为了简洁的目的,这些实施方案在本文中没有被单独阐述,但是应该理解的是,本文提供了这些实施方案的每一个,并且可以具体要求保护或者放弃。应该理解的是,本发明涵盖所有变化,组合和排列,其中将来自一个或多个权利要求或来自说明书的一个或多个相关部分的一个或多个限制,元件,条款或描述性术语引入另一权利要求中。例如,可以修改依赖于另一权利要求的权利要求以包括依赖于相同基础权利要求的任何其他权利要求中存在的一个或多个限制。此外,在权利要求描述组合物的情况下,应当理解除非另有说明或者除非对于本领域的普通技术人员而言明显的是会出现矛盾或不一致,包括根据本文公开的任何制备或使用方法或根据本领域已知的方法(如果有的话)的制备和使用组合物的方法。在元件以例如马库什组格式呈现为列表的情况下,应该理解的是,还公开了元件的每种可能的亚组,并且可以从该组中去除任何元件或元件的亚组。还应注意的是,术语“包含”意图是开放的并且允许包含另外的元件或步骤。应该理解的是,一般来说,在实施方案,产品或方法称为包含具体元件,特征或步骤的情况下,还提供了由此类元件,特征或步骤组成,或基本由此类元件,特征或步骤组成的实施方案,产品或方法。为了简洁起见,这些实施方案在本文中没有被单独阐述,但是应该理解这些实施方案中的每一个都在本文中提供并且可以具体要求保护或放弃。在给出范围的情况下,包括端点。此外,应该理解的是,除非另有说明或者从上下文和/或本领域普通技术人员的理解中显而易见,在一些实施方案中,作为范围表达的值可以采用在所述范围内的任何具体值。在一些实施方案中,除非上下文另有明确规定,到范围下限单位的十分之一。为了简洁起见,本文未单独阐述每个范围中的值,但是应当理解,这些值中的每一个值均在本文中提供并且可以具体要求保护或放弃。还应该理解的是,除非另外说明或者从上下文和/或本领域普通技术人员的理解中显而易见,作为范围表达的值可以假定给定范围内的任何子范围,其中子范围的端点表示为精确度与范围下限单位的十分之一相同。另外,应该理解,本发明的任何特定实施方案可以明确地从任何一个或多个权利要求中排除。在给出范围的情况下,范围内的任何值可以明确地从任何一个或多个权利要求中排除。可以从任何一个或多个权利要求中排除本发明的组合物和/或方法的任何实施方案,元件,特征,应用或方面。为了简洁起见,其中排除了一个或多个元件,特征,目的或方面的所有实施方案在本文中没有明确阐述。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1