抗体介导的CAS9向哺乳动物细胞的递送的制作方法

文档序号:20955466发布日期:2020-06-02 20:23阅读:219来源:国知局
抗体介导的CAS9向哺乳动物细胞的递送的制作方法
相关申请的交叉引用本申请要求2017年9月11日提交的ussn62/557,021的权益和优先权,出于所有目的通过引用以其整体并入本文。政府支持声明[不适用]
背景技术
:已经致力于开发用于将生物活性剂递送到特定组织、细胞和/或亚细胞位置的试剂和方法。例如,大分子(诸如反义或rnai分子或蛋白质)的递送是很困难的,因为此类化合物通常无法穿透细胞膜;在它们能穿透时,它们可能通常对目标组织缺乏选择性,因此会增加脱靶药理学的风险,并带来严重的安全隐患。此外,选择性地将药物递送至靶向递送位点通常是一个挑战,因为细胞可渗透的分子通常不具选择性。在基因治疗的背景下,大多数基因编辑剂通常是通过包封在病毒衍生载体(如腺病毒和腺相关病毒)中的质粒dna来递送的。不幸的是,这种方法给患者带来了严重的问题,主要是:i)插入诱变的风险增加,ii)病毒载体与枯否细胞(kupffercell)相互作用后肝毒性的风险增加,以及iii)对治疗细胞的免疫原性应答仅能为患者带来短暂的药理作用。试图找到更有效和更安全的方式来递送基因编辑剂迄今还很渺茫。技术实现要素:在各种实施方式中,提供了将cas效应子rnp递送至细胞而无需电穿孔的方法和组合物。特别是,出人意料地发现,相对于具有低水平的抗体受体(靶标)的细胞,与导向rna复合的cas效应子的经抗体介导的摄取可以特异性地编辑表达高水平的该抗体受体的细胞。尽管使用抗体作为靶向部分来展示了cas效应子被靶向细胞,但据信也可以使用其他靶向部分(参见例如,图5)。这样的靶向部分尤其包括dna适体、rna适体、肽适体、anticalin、凝集素、darpin和抗体等。本文考虑的各种实施方式可以包括但不限于以下的一个或多个:实施方式1:一种用于在哺乳动物细胞中进行基因编辑的构建体,所述构建体包括:结合细胞表面标志物的靶向部分,其中所述靶向部分连接到核糖核蛋白复合体,所述复合体包含与相应的crispr/cas导向rna结合的2类crispr/cas核酸内切酶,所述导向rna与细胞的基因组dna中的靶向序列杂交。实施方式2:实施方式1的构建体,其中,所述靶向部分选自由抗体、dna/rna适体或肽适体、anticalin、凝集素和darpin组成的组。实施方式3:实施方式1至2中任一项所述的构建体,其中,所述2类crispr/cas核酸内切酶是ii型crispr/cas核酸内切酶。实施方式4:实施方式1至3中任一项所述的构建体,其中,2类crispr/cas核酸内切酶是cas9多肽并且相应的crispr/cas导向rna是cas9导向rna。实施方式5:实施方式4的构建体,其中,所述cas9蛋白选自以下组成的组:酿脓链球菌(streptococcuspyogenes)cas9蛋白(spcas9)或其功能部分、金黄色葡萄球菌(staphylococcusaureus)cas9蛋白(sacas9)或其功能部分、嗜热链球菌(streptococcusthermophilus)cas9蛋白(stcas9)或其功能部分、脑膜炎奈瑟菌(neisseriameningitides)cas9蛋白(nmcas9)或其功能部分和齿垢密螺旋体(treponemadenticola)cas9蛋白(tdcas9)或其功能部分。实施方式6:实施方式5的构建体,其中,所述cas9蛋白包括酿脓链球菌cas9蛋白(spcas9)。实施方式7:实施方式5的构建体,其中,所述cas9蛋白包括金黄色葡萄球菌cas9蛋白(sacas9)。实施方式8:实施方式5的构建体,其中,所述cas9蛋白包括嗜热链球菌cas9蛋白。实施方式9:实施方式5的构建体,其中,所述cas9蛋白包括脑膜炎奈瑟菌cas9蛋白(nmcas9)。实施方式10:实施方式5的构建体,其中,所述cas9蛋白包括齿垢密螺旋体cas9蛋白(tdcas9)。实施方式11:实施方式1至3中任一项所述的构建体,其中,2类crispr/cas核酸内切酶是2类crispr/cas核酸内切酶,其是高保真(hifi)突变体cas9多肽,相应的crispr/cas导向rna是cas9导向rna。实施方式12:实施方式11的构建体,其中,所述突变体cas9包括crispr-cas9。实施方式13:实施方式11的构建体,其中,所述突变体cas9包括r691acas9突变体。实施方式14:实施方式11至13中任一项所述的构建体,其中,所述突变体cas9包含被一个、两个或三个核定位信号(nls)增强的cas9。实施方式15:实施方式14的构建体,其中,所述nls包含选自由以下组成的组的nls:sv40t抗原(pkkkrkv(seqidno:32))、sv40vp3(kkkrk(seqidno:33))、腺病毒ela(krprp(seqidno:34))、人c-myc(paakrvkld(seqidno:35),rqrrnelkrsp(seqidno:36))、核质蛋白(krpaatkkagqakkkk(seqidno:37))、非洲爪蟾(xenopus)n1(vrkkrkteeesplkdkdakkskqe(seqidno:38))、小鼠fgf3(rlrrdaggrggvyehlggaprrrk(seqidno:39));parp(krkgdevdgvdecakkskk(seqidno:40))、m9肽、nqssnfgpmkggnfggrssgpyggggqyfakprnqggy(seqidno:41)及其衍生物。实施方式16:实施方式1至3中任一项所述的构建体,其中,2类crispr/cas核酸内切酶是v型或vi型crispr/cas核酸内切酶。实施方式17:实施方式16的构建体,其中,2类crispr/cas多肽选自以下组成的组:cpf1多肽或其功能部分、c2c1多肽或其功能部分、c2c3多肽或其功能部分以及c2c2多肽或其功能部分。实施方式18:实施方式17的构建体,其中,2类crispr/cas多肽包括cpf1多肽。实施方式19:实施方式1至18中任一项所述的构建体,其中,所述导向rna包含一种或多种桥接核酸。实施方式20:实施方式19的构建体,其中,所述桥接核酸包含一个或多个n-甲基取代的bna(2′,4′-bnanc[n-me])。实施方式21:实施方式19的构建体,其中,所述导向rna包含一种或多种锁核酸(lna)。实施方式22:实施方式1至21中任一项所述的构建,其中,所述靶向部分结合至内化受体。实施方式23:实施方式1至22中任一项所述的构建体,其中,所述靶向部分结合至选自由以下组成的组的受体:cd45、cd3、erbb2、her2、cd22、cd74、cd19、cd20、cd33、cd40、muc1、il-15r、hla-dr、egp-1、egp-2、g250、前列腺特异性膜抗原(psma)、前列腺特异性抗原(psa)、前列腺酸性磷酸酶(pap)、和胎盘碱性磷酸酶。实施方式24:实施方式23的构建体,其中,所述靶向部分结合至cd45。实施方式25:实施方式23的构建体,其中,所述靶向部分结合至cd33。实施方式26:实施方式23的构建体,其中,所述靶向部分结合至cd3。实施方式27:实施方式1至23中任一项所述的构建体,其中,所述靶向部分包含抗体。实施方式28:实施方式27的构建体,其中,所述靶向部分包含内化抗体。实施方式29:实施方式27的构建体,其中,所述靶向部分包含抗cd3抗体。实施方式30:实施方式29的构建体,其中,所述抗体包含抗体选自由okt3、m291、弗拉单抗(foralumab)和ca-3组成的组。实施方式31:实施方式29的构建体,其中,所述抗体包含okt3。实施方式32:实施方式27的构建体,其中,所述靶向部分包含抗cd45抗体。实施方式33:实施方式27的构建体,其中,所述靶向部分包含抗cd33抗体。实施方式34:实施方式27至33中任一项所述的构建体,其中,所述抗体是全长免疫球蛋白。实施方式35:实施方式27至33中任一项所述的构建体,其中,所述抗体选自由以下组成的组:fv、fab、(fab')2、(fab')3、iggδch2、单抗体和微抗体。实施方式36:实施方式27至33中任一项所述的构建体,其中,所述抗体是单链抗体。实施方式37:实施方式36的构建体,其中,所述抗体是scfv。实施方式38:实施方式27至37中任一项所述的构建体,其中,所述抗体是人抗体。实施方式39:实施方式1至38中任一项所述的构建体,其中,所述靶向部分通过非共价相互作用连接至所述cas核酸内切酶。实施方式40:实施方式39的构建体,其中,所述非共价相互作用包括生物素/抗生物素蛋白相互作用。实施方式41:实施方式39的构建体,其中,所述非共价相互作用包括抗体结合肽与所述靶向部分之间的相互作用。实施方式42:实施方式39或41中任一项所述的构建体,其中,所述非共价相互作用包括所述靶向部分与抗体结合蛋白之间的相互作用,所述抗体结合蛋白选自由以下组成的组:蛋白a、蛋白g、蛋白l、蛋白z、蛋白lg、蛋白la和蛋白ag。实施方式43:实施方式39或41中任一项所述的构建体,其中,所述非共价相互作用包括所述靶向部分与结合部分之间的相互作用,所述结合部分选自由以下组成的组:pam、d-pam、d-pam-θ、twktsrisif(seqidno:4)、fgrlvssiry(seqidno:5、fc-iii、epihrstltall、hwrgwv(seqidno:7)、hyfkfd(seqidno:8)、hfrrhl(seqidno:9)、nkfrgkyk(seqidno:10)、narkfykg(seqidno:11)、khrfnkd(seqidno:12)。实施方式44:实施方式39或41中任一项所述的构建体,其中,所述非共价相互作用包括所述靶向部分与fcb6.1肽之间的相互作用。实施方式45:实施方式41至44中任一项所述的构建体,其中,所述抗体结合肽或所述结合部分通过可切割接头化学偶联至所述cas核酸内切酶。实施方式46:实施方式45的构建体,其中,所述接头包括可切割的接头。实施方式47:实施方式53的构建体,其中,所述可切割的接头包括二硫键接头或酸不稳定接头(acid-labilelinker)。实施方式48:实施方式47的构建体,其中,所述接头包含酸不稳定接头,其包含选自以下的部分:腙、缩醛、顺乌头酸样酰胺、甲硅烷基醚。实施方式49:实施方式47的构建体,其中,所述接头包括phe-lys或val-cit。实施方式50:实施方式1至38中任一项所述的构建体,其中,所述靶向部分化学偶联至所述cas核酸内切酶。实施方式51:实施方式50的构建体,其中,所述靶向部分通过不可切割的接头化学偶联至所述cas核酸内切酶。实施方式52:实施方式50的构建体,其中,所述靶向部分通过可切割接头化学偶联至所述cas核酸内切酶。实施方式53:实施方式50的构建体,其中,所述靶向部分通过可切割接头化学偶联至所述cas核酸内切酶,所述可切割接头包括二硫键接头或酸不稳定接头。实施方式54:实施方式50的构建体,其中,所述靶向部分通过酸不稳定接头化学偶联至所述cas核酸内切酶,所述酸不稳定的接头包含选自以下的部分:腙、缩醛、顺乌头酸样酰胺、甲硅烷基醚。实施方式55:实施方式50的构建体,其中,所述靶向部分通过表2中所示的非氨基酸、非肽接头化学偶联至所述cas核酸内切酶。实施方式56:实施方式1至38中任一项所述的构建体,其中,所述靶向部分包含多肽,并且所述靶向部分和cas核酸内切酶包含融合蛋白。实施方式57:实施方式56的构建体,其中,所述融合蛋白包含直接连接至所述cas核酸内切酶的所述靶向部分。实施方式58:实施方式56的构建体,其中,所述融合蛋白包含通过氨基酸连接至所述cas核酸内切酶的所述靶向部分。实施方式59:实施方式56的构建体,其中,所述融合蛋白包含通过肽接头连接至所述cas核酸内切酶的所述靶向部分。实施方式60:实施方式59的构建体,其中,所述接头包含可被蛋白酶切割的氨基酸序列。实施方式61:实施方式60的构建体,其中,所述接头包含可被组织蛋白酶切割的氨基酸序列。实施方式62:实施方式59至61中任一项所述的构建体,其中,所述肽接头包含二肽缬氨酸-瓜氨酸(val-cit)或phe-lys。实施方式63:实施方式56的构建体,其中,所述融合蛋白包含通过表2所示的氨基酸或肽接头连接至所述cas核酸内切酶的所述靶向部分。实施方式64:一种药物制剂,所述制剂包含实施方式1至63中任一项所述的构建体和药学上可接受的载剂。实施方式65:实施方式64的制剂,其中,所述制剂用于通过选自由以下组成的组的方式施用:腹腔施用、局部施用、口服施用、吸入施用、透皮施用、皮下贮库施用和直肠施用。实施方式66:实施方式64至65中任一项所述的制剂,其中,所述制剂是单位剂量制剂。实施方式67:一种在细胞上进行基因编辑的方法,所述方法包括使所述细胞与实施方式1至63中任一项所述的构建体接触,其中,所述导向rna将cas核酸内切酶引导至所述细胞的基因组中的特定位置。实施方式68:实施方式67的方法,其中,所述细胞是离体细胞。实施方式69:实施方式68的方法,其中,所述细胞是源自待治疗受试者的细胞。实施方式70:实施方式68至69中任一项所述的方法,其中,所述细胞包括选自下组的细胞:成纤维细胞、血细胞(例如,红细胞、白细胞)、肝细胞、肾细胞、神经细胞、和干细胞(例如,胚胎干细胞、成体干细胞(例如,造血干细胞、神经元干细胞和间充质干细胞)、t-细胞、和诱导多能干细胞(ipsc)。实施方式71:实施方式67的方法,其中,所述细胞在受试者体内,并且所述接触包括将所述组合物施用于所述受试者。实施方式72:实施方式71的方法,其中,所述方法包括通过选自由以下组成的组的途径施用所述构建体:腹腔施用、局部施用、口服施用、吸入施用、透皮施用、皮下贮库施用和直肠施用。实施方式73:实施方式71至72中任一项所述的方法,其中,所述方法包括施用实施方式64至66中任一项所述的药物制剂。实施方式74:实施方式69至73中任一项所述的方法,其中,所述受试者是人类。实施方式75:实施方式69至73中任一项所述的方法,其中,所述受试者非人哺乳动物。实施方式76:实施方式67至75中任一项所述的方法,其中,所述方法还包括将供体模板核酸引入所述细胞。实施方式77:实施方式67至76中任一项所述的方法,其中,所述方法包括选自下组的疾病的治疗:软骨发育不全、全色盲、酸性麦芽糖酶缺乏症、腺苷脱氨酶缺乏症、肾上腺脑白质营养不良、艾卡尔迪综合征、α-1抗胰蛋白酶缺乏症、α-地中海贫血、雄激素不敏感综合征、阿佩尔综合征、致心律失常性右室心肌病、发育异常、共济失调毛细血管扩张、巴斯综合征、β-地中海贫血、蓝色硬血管痣综合征、海绵状脑白质营养不良症、慢性肉芽肿性疾病(cgd)、猫叫综合征、crigler-najjer综合征、囊性纤维化、德尔肯氏病、外胚层发育不良、范可尼贫血、进行性骨化性纤维发育不良、脆性x染色体综合征、半乳糖血症、高雪氏病、全身性神经节苷脂沉积症(例如,gm1)、iv型糖原贮积症、血色沉着病、β-珠蛋白第六密码子的血红蛋白c突变(hbc)、血友病、亨廷顿氏舞蹈病、贺勒氏症、磷酸酶过少症、克氏综合征、克拉贝病、langer-giedion综合征、白血球粘着缺乏症(lad,omim116920号)、脑白质营养不良、长qt综合征、马凡综合征、莫比斯综合征、粘多糖贮积症(mps)、指甲髌骨综合征、肾性尿崩症、神经纤维瘤病、尼曼-皮克病、成骨不全症、卟啉症、普拉德-威利综合征、儿童早衰症、普罗蒂斯综合征、视网膜母细胞瘤、雷特氏综合征、鲁宾斯坦-泰比综合征、沙费利波综合征、重症综合性免疫缺陷(scid)、舒瓦曼综合征、镰状细胞疾病(镰形细胞贫血)、史密斯-马吉利综合征、史蒂克勒氏综合征、戴萨克斯症、血小板减少-桡骨缺失(tar)综合征、特-柯二氏综合征、三体综合征、结节性硬化症、特纳综合征、尿素循环障碍、希普尔病、瓦登伯革氏综合征、威廉斯综合征、威尔逊氏病、威-奥二氏综合征和x连锁淋巴组织增生综合征。其他这样的疾病包括,例如,获得性免疫缺陷、溶酶体贮积症(例如,高雪氏病、gm1、法布里病和戴萨克斯症)、粘多糖贮积症(例如,亨特氏病、赫尔勒氏症)、血红蛋白病(例如,镰状细胞疾病、hbc、α-地中海贫血、β-地中海贫血)和血友病。实施方式78:实施方式67至76中任一项所述的方法,其中,所述方法包括癌症的治疗。实施方式79:实施方式78的方法,其中:所述癌症包括实体瘤;和/或所述癌症包括癌干细胞;和/或所述癌症包括选自由以下组成的组的癌症:乳腺癌、前列腺癌、结肠癌、子宫颈癌、卵巢癌、胰腺癌、肾细胞(肾)癌、成胶质细胞瘤、急性淋巴细胞白血病(all)、急性髓细胞性白血病(aml)、肾上腺皮质癌、aids相关的癌症(例如,卡波西肉瘤、淋巴瘤)、肛门癌、阑尾癌、星形细胞瘤、非典型畸胎样/横纹肌样瘤、胆管癌、肝外癌、膀胱癌、骨癌(例如,尤因肉瘤、骨肉瘤、恶性纤维组织细胞瘤)、脑干神经胶质瘤、脑瘤(例如,星形细胞瘤、脑和脊髓肿瘤、脑干神经胶质瘤、中枢神经系统非典型畸胎样/横纹肌样瘤、中枢神经系统胚胎肿瘤、中枢神经系统生殖细胞肿瘤、颅咽管瘤、室管膜瘤、支气管肿瘤、伯基特淋巴瘤、类癌瘤(例如,儿童、胃肠道)、心脏肿瘤、脊索瘤、慢性淋巴细胞性白血病(cll)、慢性骨髓性白血病(cml)、慢性骨髓增生性疾病、结直肠癌、颅咽管瘤、皮肤t-细胞淋巴瘤、导管癌(例如,胆汁、肝外)、原位导管癌(dcis)、胚胎肿瘤、子宫内膜癌、室管膜瘤、食道癌、嗅神经母细胞瘤、颅外生殖细胞瘤、性腺外生殖细胞瘤、肝外胆管癌、眼癌(例如,眼内黑色素瘤、视网膜母细胞瘤)、恶性骨纤维组织细胞瘤和骨肉瘤、胆囊癌、胃(胃)癌、胃肠道类癌肿瘤、胃肠道间质瘤(gist)、生殖细胞肿瘤(例如,卵巢癌、睾丸癌、颅外癌、性腺外癌、中枢神经系统)、妊娠滋养细胞肿瘤、脑干癌、毛细胞白血病、头颈癌、心脏癌症、肝细胞(肝)癌、组织细胞增多病、朗格汉斯细胞癌、霍奇金淋巴瘤、下咽癌、眼内黑色素瘤、胰岛细胞瘤、胰腺神经内分泌肿瘤、卡波西肉瘤、肾癌(例如,肾细胞、威尔姆氏肿瘤和其他肾肿瘤)、朗格汉斯细胞组织细胞增多病、喉癌、白血病、急性淋巴细胞性(all)、急性髓细胞性(aml)、慢性淋巴细胞性(cll)、慢性骨髓性(cml)、毛细胞、唇和口腔癌、肝癌(原发性)、小叶原位癌(lcis)、肺癌(例如,儿童、非小细胞、小细胞)、淋巴瘤(例如,aids相关的、伯基特(例如,非霍奇金淋巴瘤)、皮肤t-细胞(例如,蕈样肉芽肿、塞泽里综合征)、霍奇金、非霍奇金、原发中枢神经系统(cns))、巨球蛋白血症、华氏巨球蛋白血症、男性乳腺癌、恶性骨纤维组织细胞瘤和骨肉瘤、黑色素瘤(例如,儿童、眼内(眼))、默克尔细胞癌、间皮瘤、转移性鳞状颈部癌、中线癌、口癌、多发性内分泌肿瘤综合征、多发性骨髓瘤/浆细胞瘤、蕈样肉芽肿、骨髓增生异常综合征、骨髓性白血病、慢性(cml)、多发性骨髓瘤、鼻腔和鼻旁窦癌、鼻咽癌、神经母细胞瘤、口腔癌、唇和口咽癌、骨肉瘤、胰腺神经内分泌肿瘤(胰岛细胞瘤)、乳头状瘤病、副神经节瘤、鼻旁窦和鼻腔癌、甲状旁腺癌、阴茎癌、咽癌、嗜铬细胞瘤、垂体瘤、浆细胞瘤、胸膜肺母细胞瘤、原发性中枢神经系统(cns)淋巴瘤、前列腺癌、直肠癌、肾盂和输尿管移行细胞癌、横纹肌肉瘤、唾液腺癌、肉瘤(例如,尤因、卡波西、骨肉瘤、平滑肌肉瘤、软组织、子宫)、塞泽里综合征、皮肤癌(例如,黑色素瘤、默克尔细胞癌、基底细胞癌、非黑色素瘤)、小肠癌、鳞状细胞癌、隐匿性原发性鳞状颈癌、胃(胃)癌、睾丸癌、喉癌、胸腺瘤和胸腺癌、甲状腺癌、滋养细胞肿瘤、输尿管和肾盂癌、尿道癌、子宫癌、子宫内膜癌、子宫肉瘤、阴道癌、外阴癌、华氏巨球蛋白血症和威尔姆氏肿瘤。实施方式80:实施方式78的方法,其中,所述癌症包括液体癌(例如,白血病)。实施方式81:实施方式78的方法,其中,所述癌症包括实体瘤(例如黑色素瘤)。实施方式82:实施方式78至81中任一项所述的方法,其中,所述细胞包含t-细胞。实施方式83:实施方式82的方法,其中,所述方法重新激活所述t细胞。实施方式84:实施方式78至81中任一项所述的方法,其中,所述细胞包含基质细胞。定义术语“受试者”、“个体”和“患者”可以互换使用,是指人类以及非人类哺乳动物(例如,非人类灵长类动物、犬、马、猫科动物、猪、牛、有蹄类动物、兔等)。在各种实施方式中,受试者可以是在医院中、作为门诊病人或在其他临床情况下处于医生或其他卫生工作者的照料下的人(例如,成年男性、成年女性、青春期男性、青春期女性、男童、女童)。在某些实施方式中,受试者可能未处于医生或其他卫生工作者的照料或处方下。当涉及治疗例如病理学或疾病而使用时,术语“治疗”是指减轻和/或消除该病理或疾病的一种或多种症状,和/或延迟该病理或疾病的一种或多种症状进展和/或减轻其发作速率或严重程度,和/或对该病理或疾病的预防。术语治疗可以指预防性治疗,其包括延迟或预防病理或疾病的发作。如本文所用,术语“选择性靶向”或“特异性结合”是指包含本文所述构建体的靶向配体的用途。在某些实施方式中,靶向配体连接至与导向rna复合的cas核酸内切酶。通常,配体与在靶标(例如,感兴趣的细胞表面)上表达的受体或其他生物分子组分特异性/选择性地相互作用。靶向配体可以包括诸如肽、抗体、适体、靶向肽和多糖等分子和/或材料。术语“多肽”、“肽”和“蛋白质”在本文可互换使用,是指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应天然氨基酸的人工化学类似物的氨基酸聚合物,也适用于天然氨基酸聚合物。“抗生物素蛋白/生物素”相互作用是指生物素与抗生物素蛋白或抗生物素蛋白变体包括但不限于链霉抗生物素蛋白、中性抗生物素蛋白等之间的结合反应。如本文所用,“药学上可接受的载剂”包括但不限于任何标准药学上可接受的载剂。可以根据用于制备药学上有用的组合物的已知方法来配制本文考虑的药物组合物。药学上可接受的载剂可以包括稀释剂、佐剂和负载剂(vehicle)及载剂(carrier),以及惰性、无毒的固体或液体填充剂、稀释剂或包封材料,其不与本发明的活性成分反应。实例包括但不限于:磷酸盐缓冲盐水、生理盐水、水和乳剂,如油/水乳剂。载体可以是溶剂或分散介质,其包含例如乙醇、多元醇(例如,甘油、丙二醇、液态聚乙二醇等)、它们的合适的混合物以及植物油。在许多本领域技术人员公知且容易获得的来源中描述了制剂。例如,remington'spharmaceuticalsciences(martinew[1995]eastonpa.,mackpublishingcompany,第19版)描述了可与本文所述的药物递送纳米载剂(例如,lb包被的纳米颗粒)结合使用的制剂。如本文所用,“抗体”是指由基本上由免疫球蛋白基因或免疫球蛋白基因的片段编码或由其衍生的一种或多种多肽组成的蛋白质,其能够结合(例如,特异性结合)至靶标(例如,结合至靶多肽)。公认的免疫球蛋白基因包括κ、λ、α、γ、δ、ε和μ恒定区基因,以及众多免疫球蛋白可变区基因。轻链分为κ或λ。重链分为γ、μ、α、δ或ε,它们按顺序定义了免疫球蛋白类别,分别为igg、igm、iga、igd和ige。已知典型的免疫球蛋白(抗体)结构单元包含四聚体。每个四聚体由相同的两对多肽链组成,每对具有一条“轻”链(约25kd)和一条“重”链(约50至70kd)。每条链的n末端定义了约100至110个以上的氨基酸的可变区,主要负责抗原识别。术语可变轻链(vl)和可变重链(vh)分别是指这些轻链和重链。抗体以完整的免疫球蛋白形式存在,或以各种肽酶消化产生的许多特征明确的片段形式存在。因此,例如,胃蛋白酶在铰链区中的二硫键下方消化抗体以产生f(ab)'2,其为本身是通过二硫键与vh-ch1连接的轻链的fab的二聚体。f(ab)'2可以在温和的条件下还原以破坏铰链区中的二硫键,从而将(fab')2二聚体转化为fab'单体。fab'单体本质上是具有铰链区的一部分的fab(关于其它抗体片段的更详细描述参见fundamentalimmunology,w.e.paul编,ravenpress,n.y.(1993))。尽管就完整抗体的消化而言定义了各种抗体片段,但是本领域技术人员将理解,可以通过化学或利用重组dna方法从头合成此类fab'片段。因此,如本文所用,术语抗体还包括通过修饰完整抗体而产生或使用重组dna方法从头合成的抗体片段。某些优选的抗体包括单链抗体(以单条多肽链形式存在的抗体),更优选单链fv抗体(sfv或scfv),其中可变重链和可变轻链(直接或通过肽接头)连接在一起形成连续的多肽。单链fv抗体是共价连接的vh-vl异二聚体,其可以由包含直接连接或通过肽编码接头连接的vh-和vl-编码序列的核酸表达。huston等(1988)proc.nat.acad.sci.usa,85:5879-5883。尽管vh和vl作为一条多肽链相互连接,但vh和vl结构域非共价结合。首先要在丝状噬菌体表面表达的功能性抗体分子是单链fv(scfv),然而,其他表达策略也已成功。例如,如果链(重链或轻链)中的一条与g3衣壳蛋白融合且互补链以可溶性分子的形式输出至周质,则fab分子可在噬菌体上展示。两条链可以在相同或不同的复制子上编码;重要的一点是,每个fab分子中的两条抗体链都在翻译后组装,并且二聚体通过一条链与例如g3p的连接而被结合到噬菌体颗粒中(参见,例如美国专利号5733743)。本领域技术人员已知可将天然聚集的但经化学分离的来自抗体v区的轻和重多肽链转化为折叠成三维结构(与抗原结合位点的结构基本相似)的分子的scfv抗体和许多其他结构(参见例如,美国专利号5,091,513、5,132,405和4,956,778)。在某些实施方式中,抗体应包括已经在噬菌体上展示的全部(例如,scfv、fv、fab和二硫键连接的fv(参见,例如,reiter等(1995)proteineng.8:1323-1331)以及亲和体(affibody)、纳米抗体(nanobody)和单抗体(unibody)等。如本文所用,当涉及生物分子(例如蛋白质、核酸、抗体等)时,术语“特异性结合”是指一种结合反应,该反应决定了生物分子在不同分子种群中的存在(例如,蛋白质和其他生物制剂)。因此,在指定的条件下(例如,在抗体的情况下为免疫测定条件或在核酸的情况下为严格杂交条件),指定的配体或抗体结合至其特定的“靶”分子,并且不会与样品中存在的其他分子以显著的量结合。在2类crispr系统中,效应子复合体的功能(例如,切割靶dna)通过单个核酸内切酶来进行(例如,参见zetsche等(2015)cell,163(3):759-771;makarova等(2015)nat.rev.microbiol.13(11):722-736;和shmakov等(2015)mol.cell.60(3):385-397)。因此,术语“2类crispr/cas蛋白”在本文中用于涵盖来自2类crispr系统的核酸内切酶(靶核酸切割蛋白)。因此,如本文所用,术语“2类crispr/cas核酸内切酶”涵盖ii型crispr/cas蛋白(例如,cas9)、v型crispr/cas蛋白(例如,cpf1、c2c1、c2c3)和vi型crispr/cas蛋白(例如c2c2)。迄今为止,2类crispr/cas蛋白涵盖ii型、v型和vi型crispr/cas蛋白,但该术语也意在涵盖适于结合至相应的导向rna并形成rnp复合体的任何2类crispr/cas蛋白。附图说明图1显示酿脓链球菌cas9的氨基酸序列(seqidno:1)。图2显示土拉热弗朗西斯菌(francisellatularensis)cpf1的氨基酸序列(seqidno:2)。图3示意性地说明了通过生物素/链霉抗生物素蛋白连接缀合至cas9的抗体。图4说明了使用化学缀合的抗体结合蛋白将抗体连接至crispr/cas核酸内切酶核糖核蛋白复合体。图5示意性地说明了通过接头(例如,可切割或不可切割的接头)连接至cas效应子(例如,包含2类crispr/cas核酸内切酶和导向rna的复合体)的细胞靶向部分(例如,dna适体、rna适体、肽适体、anticalin、凝集素、darpin、抗体等)。图6显示cas9-ab缀合物是稳定的。多个缀合物=通过四聚链霉抗生物素蛋白缀合的多个cas9/ab。未针对1:1化学计量优化。图7显示通过沉默bfp进行的分析编辑与ddpcr和ngs非常相关。图8显示cas9-抗cd45选择性地编辑cd45高细胞。图9(图a和b)示出lna(2',4'-bna)(图9,图a)和bnanc(2',4'-bnanc[nme])(图9,图b)的结构。图10(图a-c)示出针对细胞靶向和内体逃逸的工程cas9。图a:用于t细胞特异性基因组编辑的ab-cas9rnp复合体。cas9蛋白(青色)与蛋白a片段(黄色)融合,后者紧密结合okt3抗体(蓝色),其诱导t细胞特异性结合和内化。rnp包含导向rna(灰色)。图b:cas9pra融合蛋白(左)的核转染产生与未修饰的cas9rnp(右)相似的cd4ko水平。3天观察到的细胞;技术重复。图c:保留体积的明显变化表明cas9pra和抗cd3abokt3之间的复合体形成。尺寸排阻色谱是使用superose6increase10/300gl柱进行的。图11(图a-c)示出cas9rnp的ab定向靶向t细胞。图a:30分钟后,cas9pra(用alexafluor488标记)和t细胞共定位。与单独的cas9pra或与非特异性igg形成复合体相比,与okt3形成的复合体可促进共定位。图b:在pbmc背景下荧光标记的cas9pra:okt3与t细胞的优先结合。在30分钟时观察到b细胞的低背景结合。图c:与cas9pra:igg相比,30分钟后,cas9pra:okt3诱导t细胞受体和cd3的内化。单独使用okt3可以观察到类似的内化作用(未显示)。具体实施方式crispr/cas9是一种rna引导的靶向基因组编辑工具,可进行以前无法实现的精确的基因“编辑”。crispr/cas9尤其有助于细胞系和动物中的基因敲除、敲入snp、插入和缺失。crispr/cas9基因组编辑系统通常利用两个组件:cas9,核酸内切酶和导向rna(sgrna)。导向rna将cas核酸内切酶引导至靶基因组中的特定位置。在3'末端存在一个与原间隔子相邻的基序(pam,例如序列ngg),cas9核酸内切酶解开靶dna的双链体,并在被导向rna识别靶向序列后切割两条链,从而允许靶基因组的修饰。cas效应子(核酸内切酶)往往通过电穿孔以核糖核蛋白(蛋白质+导向rna)的形式递送到细胞中。这种离体方法需要从体内去除细胞,使其震荡,然后在基因编辑后重新植入。作为另一种选择,将crispr/cas系统作为载体(例如,aav)引入细胞中,所述载体包含编码case核酸内切酶和导向rna的核酸构建体。然而,使用此类构建体转染细胞通常效率很低。在各种实施方式中,提供了无需电穿孔而将cas效应子rnp递送至细胞的方法和组合物。特别是,出人意料地发现,相对于具有低水平的抗体受体(靶标)的细胞,与导向rna复合的抗体介导的cas效应子的摄取可以特异性地编辑表达高水平的该抗体受体的细胞。这是通过使用包含连接至与导向rna复合的cas核酸内切酶的抗体的构建体来完成的(参见例如,图3)。此外,据信除抗体(如本文所述)之外,许多其他靶向部分可有效地将case效应子(例如,与导向rna复合的cas9)递送至靶细胞。如图6所示,抗体-cas核酸内切酶复合体非常稳定。而且,证明了抗体引导的cas核酸内切酶可有效地对靶细胞进行基因编辑(参见例如,图7)。另外,基因编辑对于以高水平表达抗体靶标的细胞而言是优选的(参见例如,图8)。这种方法对于体内编辑可能是变革性的。特别是,根据本文提供的教导,认为抗体导向的cas效应子(例如,与导向rna复合的)可以原位递送并靶向目标特定组织或细胞类型。可以使用试剂进一步增强此方法,以改善细胞渗透或增加内体逃逸。通过将cas-导向rna复合体偶联至不同的抗体或其他(例如,合成的)细胞表面靶向分子,可以靶向多种多样的细胞。原位递送基因编辑试剂并使它们归巢到特定组织的能力是治疗遗传疾病的一项革命性进展。即使在可以使用离体编辑的情况下(例如,镰状细胞病),进行原位编辑也将是更好的选择。另外,由于不能去除靶细胞或组织(例如,肺、脑等),一些遗传疾病只能通过原位编辑来治愈。基因编辑试剂的原位归巢对非遗传疾病也可能是非常有用的。例如,t细胞的原位编辑可能是免疫肿瘤学的巨大进步。因此,在某些实施方式中,提供了用于在哺乳动物细胞中进行基因编辑的构建体,其中该构建体包含结合细胞表面标志物(例如受体)的靶向部分,其中所述靶向部分(例如抗体、适体、anticalin、凝集素、darpin等)连接至包含2类crispr/cas核酸内切酶的复合体,该核酸内切酶与相应的crispr/cas导向rna形成复合体,该rna与细胞基因组dna内的靶向序列杂交(参见例如,图3)。在某些实施方式中,靶向部分可通过抗生物素蛋白/链霉抗生物素蛋白连接而连接至cas核酸内切酶。在某些实施方式中,在靶向部分包含蛋白质(例如,靶向部分包含抗体或其部分)的情况下,靶向部分可以作为与cas核酸内切酶的融合蛋白提供,其中靶向部分直接地、或通过氨基酸、或通过肽接头与cas核酸内切酶连接。在某些实施方式中,靶向部分化学偶联至case核酸内切酶(例如,通过可切割或不可切割的接头)。还提供了包含本文所述的构建体和药学上可接受的载剂或赋形剂的药物制剂。另外,提供了使用所述构建体或药物制剂的方法,其中所述方法利用所述构建体原位或离体编辑细胞中的靶基因组。下文描述了各种示例性的靶向部分和cas核酸内切酶以及将两者连接以提供构建体的方法。靶向部分本文所述的构建体包含结合细胞表面标志物的靶向部分(targetingmoiety),其中所述靶向部分连接至包含2类crispr/cas核酸内切酶的复合体,该核酸内切酶与相应的crispr/cas导向rna形成复合体,该rna与细胞基因组dna内的靶向序列杂交。在各种实施方式中,靶向部分可包括能够结合细胞表面标志物的任何部分。示例性的细胞表面标志物包括但不限于细胞表面受体。示例性的细胞表面标志物包括但不限于cd45、cd3、erbb2、her2、cd22、cd74、cd19、cd20、cd33、cd40、muc1、il-15r、hla-dr、egp-1、egp-2、g250、前列腺特异性膜抗原(psma)、前列腺特异性抗原(psa)、前列腺酸性磷酸酶(pap)和胎盘碱性磷酸酶等。在某些实施方式中,所述标志物包含cd4。在某些实施方式中,所述标志物包含cd3。在某些实施方式中,靶向部分包含与细胞表面标志物特异性结合的部分。示例性的结合部分包括但不限于dna适体、rna适体、肽适体、anticalin、凝集素、darpin、抗体等。核酸适体是通过重复几轮体外选择或等效地通过selex(通过指数富集进行配体的系统进化)以与各种分子靶标(如小分子、蛋白质、核酸、甚至细胞、组织和生物体)结合的核酸物质。适体提供的分子识别特性可与抗体媲美。除了可识别性外,适体还提供了优于抗体的优势,因为它们可以在试管中完全工程化,易于通过化学合成制备,具有所需的存储特性,并且在治疗应用中没有或几乎没有免疫原性。适体选择/制备的方法是本领域技术人员公知的。此外,体外选择过程已经实现自动化(参见,例如,cox和ellington(2001)bioorganic&med.chem.9(10):2525-2531;cox等(2002)comb.chem.highthroughputscreen.5(4):289-299;cox等(2002)nucl.acidsres.30(20):e108),从而将选择实验的持续时间从六周减少到三天。dna和rna适体均显示出对各种靶标的强结合亲和力(参见例如,neves等(2010)biophys.chem.153(1):9-16;baugh等(2000)j.mol.biol.301(1):117-128;dieckmann等(1995)j.cell.biol.59:56-56)。已为同一靶标选择了dna和rna适体。最近,引入了一般性的智能适体和智能配体的概念,其中以预定的平衡(kd)速率(koff/kon)和适体-靶相互作用的热力学(δh,δs)参数选择适体。动力学毛细管电泳是用于选择智能适体的技术。它在若干轮选择中获得了适体。肽适体(colas等(1996)nature,380:548-550)是人工蛋白质,其经选择或经工程改造以结合特定的靶分子。这些蛋白质通常由一个或多个由蛋白质支架展示的可变序列的肽环组成。它们通常是从组合文库中分离出来的,并通常随后通过定向突变或多轮可变区诱变和选择而得到改进。在体内,肽适体可以结合细胞蛋白靶标。在某些实施方式中,形成适体可变区的肽被合成为与支架相同的多肽链的一部分,并通过与其连接而在其n和c末端被限制。这种双重结构限制降低了可变区可以采用的构象的多样性(spolar等(1994)science,263:777-784),当与靶标相互作用导致可变区采用单一构象时,这种构象多样性的降低降低了分子结合的熵成本。结果是,肽适体可以紧密结合它们的靶标,其结合亲和力与抗体所显示的亲和力相当(纳摩尔范围)。肽适体支架通常是小的、有序的可溶性蛋白。仍然广泛使用的第一个支架是大肠杆菌硫氧还蛋白,其为trxa基因产物(trxa)(参见例如,colas等(1996)nature,380:548-550;reverdatto等(2015)curr.top.med.chem.15:1082-1101)。在这些分子中,展示了可变序列的单个肽而不是trxa-cys-gly-pro-cys-(seqidno:3)活性位点环中的gly-pro基序。trxa的改进包括将丝氨酸替换为侧半胱氨酸从而防止在环的底部可能形成二硫键,引入d26a替代以减少寡聚化,以及优化密码子以在特定细胞中进行表达。可以使用不同的系统进行肽适体的选择,但目前使用最多的是酵母双杂交系统。肽适体还可以选自通过噬菌体展示和其他表面展示技术(如mrna展示、核糖体展示、细菌展示和酵母展示)构建的组合肽文库。这些实验程序也称为生物淘选。在从生物淘选获得的肽中,模拟表位可被认为是一种肽适体。从组合肽文库淘选的所有肽都已存储在名为mimodb的特殊数据库中(参见例如,huang等(2011)nucl.acidsres.40(1):d271-277)。affimer蛋白是肽适体的进化,是一种小的、高度稳定的蛋白,其经工程改造以展示肽环,从而为特定的靶蛋白提供高亲和力的结合表面。它是一种低分子量的蛋白,分子量为12kda至14kda,[36],来自胱抑素的半胱氨酸蛋白酶抑制剂家族(参见,例如,woodman等(2005)j.molbiol.352:1118-1133;hoffmann等(2010)peds,23(5):403-413;stadler等(2011)peds,24(9):751-763;tiede等(2014)peds,27(5):145-155)。affimer支架是基于胱抑素蛋白折叠的稳定蛋白质。它展示了将它们随机化的两个肽环和一个n端序列,其以类似于抗体的高亲和力和特异性结合不同的靶蛋白。肽在蛋白质支架上的稳定作用限制了该肽可能采取的构象,因此与游离肽文库相比增加了结合亲和力和特异性。其他蛋白支架包括但不限于设计的锚蛋白重复蛋白(darpin),其是一类非免疫球蛋白蛋白,可以提供优于靶标结合抗体的优势(参见,例如,stumpp和amstutz(2007)curr.opin.drugdiscov.devel.10(2):153-159)。例如,darpins已成功用于抑制激酶,蛋白酶和药物输出膜蛋白。还产生了专门针对细胞表面标志物(例如,her2)的darpin,并被证明在体外诊断和体内肿瘤靶向中均起作用。darpin是有用的,因为它们具有良好的分子特性,包括小尺寸和高稳定性。darpin在细菌中低成本生产以及许多靶标特异性darpin快速生成,使其非常适合于作为针对任何所需靶标的靶向部分。另外,darpin可以很容易地以多种形式生成,从而有可能将效应子darpin靶向特定器官,或者用一个由几种darpin组成的分子靶向多种受体。anticalin是另一类基于脂质运载蛋白支架的工程化的配体结合蛋白(参见例如,schlehuber和skerra(2005)expert.opin.biol.ther.5(11):1453-1462)。脂质运载蛋白结构的特点是紧凑的刚性β-桶,其支持四个结构上的高变环。这些环形成用于不同靶分子的特异性复合的口袋。天然脂质运载蛋白存在于人体血浆和体液中,通常在维生素、类固醇或代谢化合物的运输中发挥作用。使用环区域的靶向诱变和生化选择技术,可以产生具有新型配体特异性的变体,无论是针对低分子量物质还是针对大分子蛋白质靶标。由于它们的尺寸小,通常在160至180个残基之间,具有坚固的三级结构和单个多肽链的组成,因此这种“anticalin”相对于抗体可以提供在生产经济性、储存期间的稳定性、更快的药代动力学和更好的组织渗透性方面的多种优势。在某些实施方式中,连接至cas核酸内切酶/导向rna复合体的靶向部分包含抗体。在某些实施方式中,抗体是单克隆抗体。此类抗体包括全长免疫球蛋白(例如,igg、iga、igm等)以及抗体片段,其包括但不限于fab、fab'、fab'-sh、f(ab')2、fv、fv’、fd、fd’、scfv、hsfv片段、单链抗体、骆驼状抗体、双抗体(diabody)等。产生此类抗体的方法是本领域技术人员公知的。这类抗体可商购(参见例如,来自pacificimmunology,ramonaca,abclonal,woburn,ma等)。在某些实施方式中,抗体靶向部分可以被构建为单抗体。单抗体技术是一种可以产生稳定的、相比某些小抗体形式更小并具有更长的治疗窗口的抗体形式的抗体技术。在某些实施方式中,通过去除抗体的铰链区由igg4抗体产生单抗体。与全长igg4抗体不同,该半分子片段非常稳定,被称为单抗体(unibody)。将igg4分子减半可在单抗体上仅留下一个可以与靶标结合的区域。产生单抗体的方法在pct公开wo2007/059782中有详细描述,以其整体通过引用并入本文(也参见,kolfschoten等(2007)science317:1554-1557)。在某些实施方式中,可以将抗体靶向部分构建为亲合体分子。亲合体(affibody)分子是一类基于58个氨基酸残基的蛋白结构域的亲和蛋白,其衍生自葡萄球菌蛋白a的igg结合结构域之一。该三螺旋束结构域已被用作构建组合噬菌粒文库的支架,可以使用噬菌体展示技术从中选择靶向所需分子的亲和体变体(例如参见,nord等(1997)nat.biotechnol.15:772-777;ronmark等(2002)eur.j.biochem.,269:2647-2655.)。亲合体的细节和生产方法是本领域技术人员已知的(参见例如,美国专利号5,831,012,以其整体通过引用并入本文)。在某些实施方式中,用于靶向部分的抗体是内化抗体。产生内化抗体(例如从噬菌体展示文库产生)的方法是本领域技术人员公知的(参见例如,nielsen等(2000)pharmaceut.sci.technol.today,3(8):282-291)zhou和marks(2012)meth.enzym.502:43-66;等)。将抗体连接至cas多肽将cas效应子(例如,包含2类crispr/cas核酸内切酶和导向rna的复合体)与靶向部分偶联的方法是本领域技术人员公知的。实例包括但不限于:使用生物素和抗生物素蛋白或链霉抗生物素蛋白(参见,例如,美国专利号us4,885,172a),典型的生物素/抗生物素蛋白替代品(例如,fitc/抗fitc(参见例如,harmer和samuel(1989)j.immunol.meth.122(1):115-221)以及dioxigenin/抗dioxigenin等),使用例如双官能偶联剂(例如戊二醛、二酰亚胺酯、芳族和脂族二异氰酸酯、二羧酸的双-对硝基苯基酯、芳族二磺酰氯)和双官能芳基卤化物(如1,5-二氟-24-二硝基苯;p,p′-二氟m,m′-二硝基二苯砜、巯基反应性马来酰亚胺)的传统的化学偶联等。在某些实施方式中,当靶向部分包含多肽时,cas核酸内切酶(cas效应子)可以表达为与靶向部分的融合蛋白。在这种情况下,融合可以直接在cas核酸内切酶之间、或者通过中间氨基酸、或者通过肽接头进行。在某些实施方式中,当存在肽接头时,其可以是可经酶促切割的肽接头。如上所述,在某些实施方式中,靶向部分(例如,抗体、凝集素、适体、anticaline、凝集素、darpin)通过接头(连接剂)连接至cas效应子(例如,cas核酸内切酶)。如本文所用,“接头(linker)”或“连接剂(linkingagent)”是用于连接两个以上分子的分子。在某些实施方式中,接头通常能够与两个分子形成共价键(例如,靶向部分和cas核酸内切酶)。合适的接头是本领域技术人员公知的,其包括但不限于直链或支链碳接头、杂环碳接头或肽接头。在某些实施方式中,接头可如上所述通过其侧基连接至组分氨基酸(例如,通过二硫键与半胱氨酸连接),而在其他实施方式中,如果存在的话,接头将连接至末端氨基酸的α碳氨基和羧基。通常,接头包含与靶向部分和/或cas核酸内切酶上的相应官能团反应的官能团。双官能团接头具有一个与靶向部分(例如,抗体)上的基团反应的官能团和另一个与cas核酸内切酶反应的官能团,并且可以用于形成所需的缀合物。异双官能接头通常包含两个以上不同的反应性基团,其分别与靶向部分和cas核酸内切酶上的位点反应。例如,异双官能交联剂(如半胱氨酸)可以包含胺反应性基团而硫醇反应性基团可以与衍生肽上的醛基相互作用。适用于异双官能交联剂的反应性基团的其他组合包括,例如,胺基-和巯基反应性基团;羰基和巯基反应性基团;胺和光反应性基团;巯基和光反应性基团;羰基和光反应性基团;羧酸根和光反应性基团;精氨酸和光反应性基团。这些反应和官能团是说明性而非限制性的。其他说明性的合适的反应性基团包括但不限于硫醇(-sh)、羧酸根(cooh)、羧基(-cooh)、羰基、胺(nh2)、羟基(-oh)、醛(-cho)、醇(roh)、酮(r2co)、活性氢、酯、巯基(sh)、磷酸根(-po3)或光反应性部分。胺反应性基团包括但不限于,例如异硫氰酸酯、异氰酸酯、酰基叠氮化物、nhs酯、磺酰氯、醛和乙二醛、环氧化物和环氧乙烷、碳酸酯、芳基化剂、酰亚胺酯、碳二亚胺和酸酐。硫醇反应性基团包括但不限于,例如卤代乙酰基和烷基卤化物衍生物、马来酰亚胺、氮丙啶、丙烯酰氧基衍生物、芳基化剂和硫醇-二硫化物交换试剂。羧酸根反应性基团包括但不限于,例如重氮烷和重氮乙酰基化合物,如羰基二咪唑和碳二亚胺。羟基反应性基团包括但不限于,例如环氧化物和环氧乙烷、羰基二咪唑、高碘酸盐氧化、n,n'-二琥珀酰亚氨基碳酸酯或n-羟基琥珀酰亚氨基氯甲酸酯、酶促氧化、烷基卤素和异氰酸酯。醛和酮反应性基团包括但不限于,例如用于席夫碱形成或还原胺化的肼衍生物。活性氢反应性基团包括但不限于,例如用于曼尼希缩合和碘化反应的重氮鎓衍生物。光反应性基团包括但不限于,例如芳基叠氮化物和卤代芳基叠氮化物、二苯甲酮、重氮化合物和重氮嗪衍生物。化学偶联在某些实施方式中,靶向部分(例如,抗cd3抗体、抗cd45抗体等)化学偶联至cas效应子(例如,cas核酸内切酶)。化学偶联分子的手段是本领域技术人员公知的。偶联两个分子的过程根据要连接的部分的化学结构而变化。多肽通常包含各种官能团;例如,羧酸(cooh)或游离胺(-nh2)基团可与另一肽或接头上的合适官能团反应以将分子与其连接。例如,偶联抗体(或其他多肽靶向部分)的常用方法可涉及使用可用的赖氨酸或还原的半胱氨酸二硫化物形成偶联物。赖氨酸和半胱氨酸是天然氨基酸,常存在于抗体中,易于反应。例如,可以直接利用由胱氨酸还原产生的硫醇基和赖氨酸的伯氨基。在某些说明性但非限制性的实施方式中,赖氨酸中的伯胺容易与n-羟基琥珀酰亚胺(nhs)酯接头反应形成稳定的酰胺键,并且许多商业接头依赖于该方法。在某些实施方式中,赖氨酸的胺也可用于制备具有侧基硫醇的脒,以通过2-亚胺硫烷(traut试剂)连接至接头或净负荷。在另一个说明性但非限制性实例中,半胱氨酸作为靶向部分(例如,抗体)中的天然氨基酸可以通过二硫键被束缚。在适当的条件下,该二硫键可以被dl-二硫苏糖醇(dtt)或三(2-羧乙基)膦(tcep)选择性还原,并提供反应性硫醇基团。抗体上的附着位点的游离硫醇基团可以通过不同的化学反应与小的接头分子偶联,如迈克尔加成反应、α-卤代羰基烷基化和二硫键形成。水解的琥珀酰亚胺-硫醚接头是常用的连接基。在某些实施方式中,抗体可以包括遗传编码的非天然氨基酸以提供连接位点。靶向部分中常用的非天然氨基酸可包括特别是对乙酰基phe、对叠氮基phe和丙炔基-tyr等。在某些实施方式中,接头包含可切割接头。可切割接头包括化学可切割接头和酶可切割接头。本领域技术人员已知许多不同的化学可切割接头(参见,例如,美国专利号4,618,492;4,542,225,和4,625,014)。示例性的化学可切割接头包括但不限于酸不稳定接头和二硫键接头等。酸不稳定接头被设计为在血液中所遇到的ph值水平上稳定,但在遭遇溶酶体的低ph环境时变得不稳定并降解。酸敏感性接头包括但不限于,腙、缩醛、顺乌头酸样酰胺和甲硅烷基醚(参见例如,perez等(2013)drugdiscov.today,1–13)。腙很容易合成,在ph7时血浆半衰期为183小时,在ph5时血浆半衰期为4.4小时,表明它们在酸性条件下(如见于溶酶体中的条件下)可以被选择性切割(参见例如,doronina等)nat.biotechnol.21(7):778-784)。二硫键是利用细胞还原环境的可切割接头((参见,例如,saito等(2013)adv.drugdeliv.rev.55(2):199-215)。在内化和降解后,二硫键可以在溶酶体中释放药物。酶可切割接头被选择用于经酶(例如,蛋白酶)切割。蛋白酶可切割接头通常被设计成在血液/血浆中稳定,但是在被溶酶体酶切割后在靶细胞中的溶酶体内迅速释放游离药物。在各种实施方式中,它们可以利用溶酶体内的高水平的蛋白酶活性。最受欢迎的酶促切割序列是二肽缬氨酸-瓜氨酸,其结合有自消灭性接头对氨基苯甲醇(pab)。酰胺连接的pab的切割会引发二氧化碳的1,6-消除并伴随释放母体胺形式的游离药物(参见例如,burke等(2009)bioconjug.chem.20(6):1242-1250)。debowchik等筛选了二肽接头的文库,以测量通过酶促水解释放的阿霉素的速率(参见例如,dubowchik等(2002)bioconjug.chem.13(4):855-869;dubowchik等(2002)bioorg.med.chem.lett.12(11):1529-1532)。他们发现phe-lys的切割速度最快,半衰期为8分钟,其次是val-lys,其半衰期为9分钟。与之形成鲜明对比的是,val-cit的半衰期为240分钟。他们还发现,移除pab基团会降低切割速率,可能是由于空间干扰了酶结合。另一项研究比较了由二肽接头phe-lys和val-cit和类似腙接头连接的澳瑞他汀衍生物mmae的效力。事实证明,人血浆中val-cit接头的稳定性是腙接头的100倍以上。最重要的是,phe-lys接头在人血浆中的稳定性远不如val-cit,这解释了其目前的流行性(参见例如,doronina等(2003)nat.biotechnol.21(7):778-784)。非肽酶促可切割接头也是本领域技术人员已知的。葡萄糖醛酸苷接头包含亲水糖基,该糖基被溶酶体酶β-葡糖醛酸糖苷酶切割。一旦该糖从酚主链上切割下来,pab基团的自消灭就会释放出偶联的部分(参见例如,jeffrey等(3006)bioconjug.chem.17(3):831-840)。在某些实施方式中,用于将抗体连接至cas效应子(例如,包含2类crispr/cas核酸内切酶和导向rna的复合体)的接头包含与抗体(例如,与抗体的fc区)结合(例如,非共价结合)的蛋白质。已知许多细菌蛋白可与哺乳动物免疫球蛋白结合,其包括但不限于蛋白a、g、l、z及其重组(融合蛋白)衍生物(参见例如,表1;rodrigo等(2015)antibodies,4:259-277;konrad等(2011)bioconjug.chem.22:2395-2403;kihlberg等(1996)eur.j.biochem.240:556-563;nilsson等(1987)proteineng.des.sel.1:107-113;ghitescu等(1991)j.histochem.cytochem.39:1057-1065;akerstrom和bjorck(1986)j.biol.chem.261:10240-10247;svensson等(1998)eur.j.biochem.258:890-896)。表1.可引入接头以结合细胞靶向部分的示例性蛋白质(例如,细胞靶向抗体)已知许多环状肽会结合抗体恒定区并且可用于将抗体连接至cas效应子。此类肽的实例包括但不限于pam(fassina等(2006)j.mol.recognit.9:564-569)、d-pam(verdoliva等(2002)j.immunol.meth.271:77-88)、d-pam-θ(dinon等(2011)j.mol.recognit.24:1087-1094)、twktsrisif(seqidno:4)和fgrlvssiry(seqidno:5,krook等(1998)j.immunol.meth.221:151-157)、fc-iii(delano等(2000)science,287:1279-1283)、epihrstltall(seqidno:6,ehrlich等(2001)j.biochem.biophys.meth.49:443-454)、hwrgwv(seqidno:7,yang等(2006)j.peptideres.66:110-137)、hyfkfd(seqidno:8,yang等(2009)j.chromatogr.a,1216:910-918)、hfrrhl(seqidno:9,menegatti等(2016)j.chromatogr.a,1445:93-104)、nkfrgkyk(seqidno:10)和narkfykg(seqidno:11,sugita等(2013)biochem.eng.j.79:33-40)、khrfnkd(seqidno:12,yoo和choi(2015)biochipj.10:88-94)等等(参见例如,choe等(2016)materials,9:994)。在某些实施方式中,抗体-结合蛋白(肽)通过接头连接至cas核酸内切酶(参见例如,图4)。在某些实施方式中,将抗体结合蛋白连接至cas核酸内切酶的接头包括本文所述的可切割接头或不可切割的接头。在某些实施方式中,cas效应子通过包含在高ph下与抗体(例如,与抗体的fc区)结合但在较低ph下释放抗体的肽的接头连接至靶向部分。在某些实施方式中,该肽包含fcb6.1肽(参见例如,strauch等(2014)proc.natl.acad.sci.usa,111(2):675-680)。用于将各种分子连接至肽或蛋白质的许多方法和接头分子是已知的(参见例如,欧洲专利申请号188,256;美国专利号4,671,958、4,659,839、4,414,148、4,699,784、4,680,338;4,569,789和4,589,071;以及borlinghaus等(1987)cancerres.47:4071-4075)。表2列出了适用于化学偶联的示例性非肽接头。融合蛋白在靶向部分包含多肽(例如,抗体或其他结合蛋白)的某些实施方式中,可以将肽与cas核酸内切酶直接融合、通过氨基酸融合、或通过肽接头融合。在某些实施方式中,使用化学肽合成方法直接简单地合成与cas核酸内切酶连接的靶向部分。在某些实施方式中,与cas核酸内切酶连接的靶向部分可以重组表达为融合蛋白(例如,直接融合、通过氨基酸连接或通过接头连接)。通常,这涉及创建编码融合蛋白的dna序列,将dna置于特定启动子控制下的表达盒中,在宿主中表达该蛋白,分离表达的蛋白,并且必要时使该蛋白复性。编码融合蛋白的dna可以通过任何合适的方法制备,包括例如克隆和限制合适的序列,或者通过诸如以下方法直接化学合成:磷酸三酯法(narang等(1979)meth.enzymol.68:90-99);磷酸二酯法(brown等(1979)meth.enzymol.68:109-151);二乙基亚磷酰胺法(beaucage等(1981)tetra.lett.,22:1859-1862);以及固相法(美国专利号4,458,066)。化学合成产生单链寡核苷酸。通过与互补序列杂交或通过使用单链作为模板的dna聚合酶聚合,可以将其转化为双链dna。本领域技术人员将理解,尽管dna的化学合成仅限于约100个碱基的序列,但可以通过连接较短的序列来获得较长的序列。作为另一种选择,可以克隆子序列,并使用适当的限制酶切割适当的子序列。然后可以将片段连接以产生所需的dna序列。在某些实施方式中,可以使用dna扩增方法(如聚合酶链反应(pcr))来克隆编码本发明的融合蛋白的dna。因此,例如,可以使用含有ndei的限制性位点的正义引物和含有hindiii的限制性位点的反义引物,对治疗部分“d”进行pcr扩增。这产生了编码靶向部分并具有末端限制位点的核酸。类似地,可以提供具有互补限制位点的cas核酸内切酶和/或casp-l(其中l是氨基酸或肽接头)。连接序列并插入载体产生了编码融合蛋白的载体。如上所述,尽管靶向部分和cas核酸内切酶可以直接连接在一起,但是本领域技术人员将理解,它们可以被由一个或多个氨基酸组成的接头分开。通常,除了连接蛋白质或保持蛋白质之间的最小距离或其他空间关系之外,间隔子将没有特定的生物学活性。但是,可以选择间隔子的组成氨基酸以影响分子的某些性质,诸如折叠、净电荷或疏水性。在某些实施方式中,接头可以包含酶促切割位点。编码融合蛋白的核酸序列可以在多种宿主细胞中表达,包括大肠杆菌、其他细菌宿主、酵母菌以及各种高级真核细胞如cos、cho和hela细胞系和骨髓瘤细胞系。重组蛋白基因将与每个宿主的适当表达控制序列可操作地连接。对于大肠杆菌,其包括启动子(如t7、trp或λ启动子),核糖体结合位点,和优选的转录终止信号。对于真核细胞,控制序列将包括衍生自免疫球蛋白基因、sv40、巨细胞病毒等的启动子、优选增强子以及聚腺苷酸化序列,并且可包括剪接供体和受体序列。可以通过公知的方法将质粒转染到选择的宿主细胞中,诸如用于大肠杆菌的氯化钙转化和用于哺乳动物细胞的磷酸钙处理或电穿孔。可以通过对质粒所含基因(如amp、gpt、neo和hyg基因)赋予的抗生素的抗性来选择由质粒转化的细胞。一旦表达,重组融合蛋白可以根据本领域的标准程序进行纯化,包括硫酸铵沉淀、亲和柱、柱色谱和凝胶电泳等(通常参见r.scopes(1982)proteinpurification,springer--verlag,n.y.;deutscher(1990)methodsinenzymologyvol.182:guidetoproteinpurification.,academicpress,inc.n.y.)。对于药物用途,优选均质性至少约90%至95%的基本上纯的组合物,最优选均质性98%至99%以上的组合物。一旦经部分纯化或纯化至所期望的均质性,则多肽可随后用于治疗。本领域技术人员将认识到,在化学合成、生物学表达或纯化之后,融合蛋白可具有与组成多肽的天然构象显著不同的构象。在这种情况下,可能有必要将多肽变性和还原,然后使多肽重新折叠成优选的构象。将蛋白质还原和变性并诱导重新折叠的方法是本领域技术人员公知的(参见,debinski等(1993)j.biol.chem.,268:14065-14070;kreitman和pastan(1993)bioconjug.chem.,4:581-585;及buchner等(1992)anal.biochem.,205:263-270)。本领域技术人员将认识到,可以对融合蛋白进行修饰而不降低其生物学活性。可以进行某些修饰以促进靶向分子的克隆、表达或掺入融合蛋白。这样的修饰是本领域技术人员公知的,并且包括例如在氨基末端添加的甲硫氨酸以提供起始位点,或位于任一末端的其他氨基酸以产生方便定位的限制性位点或终止密码子。如上所述,在各种实施方式中,氨基酸或肽接头用于将靶向部分连接至cas核酸内切酶。在各种实施方式中,肽接头相对较短,通常为约20个氨基酸以下或约15个氨基酸以下或约10个氨基酸以下或约8个氨基酸以下或约5个氨基酸以下或约3个氨基酸以下,或为单个氨基酸。合适的示例性接头包括但不限于表2中所示的氨基酸或肽接头。表2.示例性的肽和非肽接头crispr/cas系统最近出现了令人信服的证据,证明古细菌中存在rna介导的基因组防御途径,许多细菌被认为与真核rnai途径平行(综述参见godde和bickerton(2006)j.mol.evol.62:718-729;lillestol等(2006)archaea2:59-72;makarova等(2006)biol.direct1:7.;sorek等(2008)nat.rev.microbiol.6:181-186)。这种途径被称为crispr-cas系统或原核rnai(prnai),据信是由两个在进化上且通常在物理上相关的基因座产生的:编码系统的rna成分的crispr(聚簇的规则间隔的短回文重复序列)基因座,和编码蛋白质的cas(crispr相关)基因座(参见例如,jansen等(2002)mol.microbiol.43:1565-1575;makarova等,(2002)nucl.acidsres.30:482-496;makarova等(2006)biol.direct1:7;haft等(2005)ploscomput.biol.1:e60)。微生物宿主中的crispr基因座包含crispr相关(cas)基因以及能够编程crispr介导的核酸切割特异性的非编码rna元件的组合。单个cas蛋白与真核rnai机制的蛋白成分没有显着的序列相似性,但是具有类似的预测功能(例如,rna结合、核酸酶、解旋酶等)(参见例如,makarova等(2006)biol.direct1:7)。crispr相关(cas)基因通常与crispr重复间隔子阵列相关。已经描述了四十多个不同的cas蛋白家族。在这些蛋白家族中,cas1在不同的crispr/cas系统中似乎普遍存在。cas基因和重复结构的特定组合已被用于定义8种crispr亚型(ecoli、ypest、nmeni、dvulg、tneap、hmari、apern和mtube),其中某些与编码重复相关神秘蛋白(ramp)的其他基因模块相关。单个基因组中可能存在不止一种crispr亚型。crispr/cas亚型的零星分布表明该系统在微生物进化过程中受到水平基因转移的影响。ii型crispr/cas核酸内切酶(例如cas9)在天然ii型crispr/cas系统中,cas9充当rna引导的核酸内切酶,该酶使用具有crrna和反式激活crrna(tracrrna)的双导向rna进行靶标识别和切割,其通过涉及cas9中两个核酸酶活性位点的机制共同产生双链dna断裂(dsb),或可以单独产生单链dna断裂(ssb)。ii型crispr核酸内切酶cas9和经过工程改造的双导向rna(dgrna)或单导向rna(sgrna)形成了可以靶向所需dna序列的核糖核蛋白(rnp)复合体。在双rna复合体或嵌合单导向rna的引导下,cas9在双链dna(dsdna)靶核酸内生成位点特异性dsb或ssb,其可通过非同源末端连接(nhej)或同源性定向重组(hdr)进行修复。如上所述,在各种实施方式中,提供了包含连接至ii型crispr/cas核酸内切酶的抗体(例如,内化抗体)的构建体。ii型crispr/cas核酸内切酶是2类crispr/cas核酸内切酶。在某些情况下,ii型crispr/cas核酸内切酶是cas9蛋白。cas9蛋白与cas9导向rna形成复合体。导向rna通过具有与靶核酸的序列(靶位点)互补的核苷酸序列(导向序列)而对cas9-导向rna复合体提供靶特异性(如本文其他部分所述)。该复合体的cas9蛋白提供了位点特异性活性。换句话说,借助于cas9蛋白与cas9导向rna的蛋白质结合区段的结合,cas9蛋白被引导到靶核酸序列(例如,染色体序列或染色体外序列,例如,附加型序列、小环序列、线粒体序列、叶绿体序列等)内的靶部位(例如,在靶部位稳定化)。最初在化脓性链球菌中描述的ii型crispr是特征最丰富的系统之一,可在四个连续步骤中进行靶向dna双链断裂。首先,从crispr基因座转录两个非编码rna,即pre-crrna阵列和tracrrna。第二,tracrrna与pre-crrna的重复区域杂交,并将pre-crrna的加工介导为含有单个间隔子序列的成熟crrna,其中在cas9蛋白存在下由双链特异性rnaseiii进行加工。第三,成熟的crrna:tracrrna复合体通过crrna间隔子和靶dna上与原间隔子相邻基序(pam)相邻的原间隔子之间的watson-crick碱基配对将cas9引导至靶dna,这是靶标识别的附加要求。另外,tracrrna还必须存在,因为它在其3'端与crrna碱基配对,并且这种结合会触发cas9活性。最后,cas9介导靶dna的切割,从而在原间隔子内产生双链断裂。crispr/cas系统的活动通常通过以下方式发生:(i)在称为“适应”的过程中,将外源dna序列插入crispr阵列中,以防止将来的攻击;(ii)相关蛋白质的表达以及阵列的表达和加工,继以(iii)rna介导的对外来核酸的干扰。因此,在细菌细胞中,一些所谓的“cas”蛋白参与了crispr/cas系统的天然功能。cas9蛋白可以结合和/或修饰(例如切割、切口、甲基化、去甲基化等)靶标核酸和/或与靶标核酸相关的多肽(例如,组蛋白尾巴的甲基化或乙酰化)(例如,当cas9蛋白包含具有活性的融合伴侣时)。在某些情况下,cas9蛋白是天然存在的蛋白(例如,天然存在于细菌和/或古细菌细胞中)。在其他情况下,cas9蛋白不是天然存在的多肽(例如,cas9蛋白是cas9蛋白的变体和嵌合蛋白等)。在许多不同的细菌中都发现了ii型crispr系统。通过blast搜索可用基因组,fonfara等((2013)nucacidres42(4):2377-2590)在347种细菌中发现了cas9直系同源物。此外,该小组利用化脓性链球菌、变形链球菌、嗜热链球菌、空肠弯曲杆菌、脑膜炎奈瑟氏菌、多杀性巴氏杆菌和新凶手弗朗西斯菌的cas9直系同源物证明了dna靶标的体外crispr/cas裂解。因此,术语“cas9”是指包含dna结合结构域和两个核酸酶结构域的rna引导的dna核酸酶,其中编码cas9的基因可以源自任何合适的细菌。典型的cas9蛋白具有至少两个核酸酶结构域:一个核酸酶结构域与hnh核酸内切酶相似,而另一个类似于ruv核酸内切酶结构域。hnh型结构域可能负责切割与crrna互补的dna链,而ruv结构域则切割非互补链。在某些实施方式中,可以对cas9核酸酶进行工程改造,使得只有一个核酸酶结构域起作用,从而产生cas切口酶(参见,例如,jinek等(2012)science337:816)。可以通过酶的催化结构域中氨基酸的特定突变或通过截断一部分或全部的结构域使其不再起作用来产生切口酶(nickase)。由于cas9包含两个核酸酶结构域,因此可以在任一结构域上采用此方法。通过使用两个这样的cas9切口酶可以在靶dna中实现双链断裂。切口酶各自切割dna的一条链,而使用两条酶将产生双链断裂。crispr基因座的主要产物可能是含有入侵者靶向序列的短rna,根据其在途径中的假定作用,被称为导向rna或原核沉默rna(psirna)(参见例如,makarova等(2006)biol.direct1:7;hale等(2008)rna,14:2572-2579)。rna分析表明crispr基因座转录物在重复序列内被切割以释放约60至70nt的rna中间体,该中间体包含单个入侵者靶向序列和侧翼重复片段(参见例如,tang等(2002)proc.natl.acad.sci.usa,99:7536-7541;tang等(2005)mol.microbiol.55:469-481;lillestol等(2006)archaea2:59-72;brouns等(2008)science321:960-964;hale等(2008)rna,14:2572-2579)。在古生强烈火球菌(pyrococcusfuriosus)中,这些中间rna被进一步加工成大量稳定的约35至45nt的成熟psirna(hale等2008.rna,14:2572-2579)。可以通过使用工程化的“单导向rna”(sgrna)来避免对crrna-tracrrna复合体的需求,所述“单导向rna”包含通常由crrna和tracrrna退火形成的发夹(参见jinek等(2012)science337:816;cong等(2013)sciencexpress/10.1126/science.1231143)。在酿脓螺旋体中,工程化的tracrrna:crrna融合体或sgrna会在cas关联的rna与靶dna之间形成双链rna:dna异二聚体时,指导cas9裂解靶dna。该包含cas9蛋白和包含pam序列的工程化sgrna的系统已用于rna引导的基因组编辑,并在体内的斑马鱼胚胎基因组编辑是有用的(参见hwang等(2013)nat.biotechnol.,31(3):227),其编辑效率类似于zfn和talen。因此,在某些实施方式中,本文构建体中使用的crispr/cas核酸内切酶复合体(例如,连接至内化抗体)包含cas蛋白和能够将cas蛋白引导至靶多核苷酸序列的靶基序并与其杂交的至少一种至两种核糖核酸(例如,grna)。在某些实施方式中,在本文所述的构建体中使用的crispr/cas核酸内切酶复合体包含cas蛋白和能够将cas蛋白引导至靶多核苷酸序列的靶基序并与其杂交的一种核糖核酸(例如grna)。如本文所用,“蛋白质”和“多肽”可互换使用,是指通过肽键连接的一系列氨基酸残基(即氨基酸的聚合物),并且包括修饰的氨基酸(例如磷酸化的、糖化的、糖基化的等)和氨基酸类似物。示例性的多肽或蛋白质包括基因产物、天然存在的蛋白质、同系物、旁系同源物、片段和上述的其他等同物、变体和类似物。在某些实施方式中,cas蛋白包含核心cas蛋白。示例性的cas核心蛋白包括但不限于,cas1、cas2、cas3、cas4、cas5、cas6、cas7、cas8和cas9。在某些实施方式中,cas蛋白包含大肠杆菌亚型cas蛋白(也称为cass2)。示例性的大肠杆菌亚型cas蛋白包括但不限于cse1、cse2、cse3、cse4和cas5e。在某些实施方式中,cas蛋白包含ypest亚型cas蛋白(也称为cass3)。示例性的ypest亚型cas蛋白包括但不限于csy1、csy2、csy3和csy4。在某些实施方式中,cas蛋白包含nmeni亚型cas蛋白(也称为cass4)。示例性的nmeni亚型cas蛋白包括但不限于csn1和csn2。在某些实施方式中,cas蛋白包含dvulg亚型cas蛋白(也称为cass1)。示例性的dvulg亚型cas蛋白包括csd1、csd2和cas5d。在某些实施方式中,cas蛋白包含tneap亚型cas蛋白(也称为cass7)。示例性的tneap亚型cas蛋白包括但不限于,cst1、cst2、cas5t。在某些实施方式中,cas蛋白包含hmari亚型cas蛋白。示例性的hmari亚型cas蛋白包括但不限于csh1、csh2和cas5h。在某些实施方式中,cas蛋白包含apern亚型cas蛋白(也称为cass5)。示例性的apern亚型cas蛋白包括但不限于csa1、csa2、csa3、csa4、csa5和cas5a。在某些实施方式中,cas蛋白包含mtube亚型cas蛋白(也称为cass6)。示例性的mtube亚型cas蛋白包括但不限于csm1、csm2、csm3、csm4和csm5。在某些实施方式中,cas蛋白包含ramp型cas蛋白。示例性的ramp型cas蛋白包括但不限于,cmr1、cmr2、cmr3、cmr4、cmr5和cmr6。在某些实施方式中,cas蛋白是酿脓链球菌cas9蛋白(spcas9)或其功能部分(参见,例如,图1,uniprotkb-q99zw2(cas9_strp1))。在某些实施方式中,cas蛋白是金黄色葡萄球菌cas9蛋白(sacas9)或其功能部分。在某些实施方式中,cas蛋白是嗜热链球菌cas9蛋白(stcas9)或其功能部分。在某些实施方式中,cas蛋白是脑膜炎奈瑟菌cas9蛋白(nmcas9)或其功能部分。在某些实施方式中,cas蛋白是齿垢密螺旋体cas9蛋白(tdcas9)或其功能部分。在某些实施方式中,cas蛋白是来自任何其他细菌种类或其功能部分的cas9蛋白。v型和vi型crispr/cas核酸内切酶在某些实施方式中,本文考虑的组合物包括但不限于连接至v型或vi型crispr/cas核酸内切酶(例如,基因组编辑核酸内切酶是v型或vi型crispr/cas)(例如,cpf1,c2c1,c2c2,c2c3)的抗体(例如内化抗体)。v型和vi型crispr/cas核酸内切酶是2类crispr/cas核酸内切酶的类型。v型crispr/cas核酸内切酶的实例包括但不限于:cpf1,c2c1和c2c3。vi型crispr/cas核酸内切酶的实例是c2c2。在某些情况下,主题基因组靶向组合物包括v型crispr/cas核酸内切酶(例如,cpf1、c2c1、c2c3)。在某些情况下,v型crispr/cas核酸内切酶是cpf1蛋白。在某些情况下,主题基因组靶向组合物包括vi型crispr/cas核酸内切酶(例如,c2c2)。与ii型crispr/cas核酸内切酶类似,v型和vi型crispr/cas核酸内切酶与相应的导向rna形成复合体。导向rna通过具有与靶核酸的序列(靶位点)互补的核苷酸序列(导向序列)而提供对核酸内切酶-导向rnarnp复合体的靶特异性(如本文其他部分所述)。复合体的核酸内切酶提供位点特异性活性。换句话说,借助于其与导向rna的蛋白质结合区段的结合,核酸内切酶被引导至靶核酸序列(例如,染色体序列或染色体外序列,例如附加型序列、小环序列、线粒体序列、叶绿体序列等)内的靶位点(例如,稳定在靶位点上)。与v型和vi型crispr/cas蛋白(例如,cpf1、c2c1、c2c2和c2c3导向rna)有关的实例和指南可在本领域找到,例如参见zetsche等(2015)cell,163(3):759-771;makarova等(2015)nat.rev.microbiol.13(11):722-736;shmakov等(2015)mol.cell,60(3):385-397;等)。在某些情况下,v型或vi型crispr/cas核酸内切酶(例如,cpf1、c2c1、c2c2、c2c3)具有酶活性,例如,当与导向rna结合时,v型或vi型crispr/cas多肽切割靶核酸。在某些情况下,相对于相应的野生型v型或vi型crispr/cas核酸内切酶(例如,cpf1、c2c1、c2c2、c2c3),v型或vi型crispr/cas核酸内切酶(例如,cpf1、c2c1、c2c2、c2c3)表现出降低的酶活性,并保留dna结合活性。在某些情况下,v型crispr/cas核酸内切酶是cpf1蛋白或其功能部分(参见,例如,图2,uniprotkb-a0q7q2(cpf1_fratn))。cpf1蛋白是v型crispr系统的成员,并且是包含约1300个氨基酸的多肽。cpf1包含ruvc样核酸内切酶结构域。与cas9不同,cpf1使用单个核糖核酸酶结构域以交错模式切割靶dna。交错的dna双链断裂导致4或5nt5'突出端。在弗朗西斯氏菌属中鉴定到的crispr-cpf1系统是2类crispr-cas系统,其可在人细胞中介导强大的dna干扰。尽管功能上保守,但是cpf1和cas9在许多方面有所不同,包括其导向rna和底物特异性(参见fagerlund等(2015)genom.bio.16:251)。cas9和cpf1蛋白之间的主要区别是cpf1不利用tracrrna,因此仅需要crrna。fncpf1crrna的长度为42-44个核苷酸(19个核苷酸的重复序列和23-25个核苷酸的间隔子),并包含单个茎环,该茎环可耐受保留二级结构的序列变化。此外,cpf1crrna比cas9所需的约100个核苷酸的工程化sgrna短得多,fncpf1的pam要求是置换链上的5'-ttn-3'和5'-cta-3'。尽管cas9和cpf1均在靶dna中产生双链断裂,但cas9使用其ruvc和hnh样结构域在导向rna的种子序列内进行平末端切割,而cpf1使用ruvc样结构域产生在种子外面交错切割。由于cpf1从关键种子区域进行交错切割,因此nhej不会破坏目标位点,因此确保cpf1可以继续切割同一位点,直到发生所需的hdr重组事件为止。因此,在本文所述的方法和组合物中,应当理解的是,术语“cas”包括cas9和cfp1蛋白。因此,如本文所用,“crispr/cas系统”是指crispr/cas和/或crispr/cfp1系统,包括核酸酶和/或转录因子系统。因此,在某些实施方式中,本文所述的构建体(例如,连接至cas蛋白的抗体)cas蛋白是来自任何细菌物种或其功能部分的cpf1。在某些方面,cpf1是新凶手弗朗西丝菌u112蛋白或其功能部分。在某些方面,cpf1是氨基酸球菌属bv3l6蛋白或其功能部分。在某些方面,cpf1是毛螺菌科细菌nd2006蛋白或其功能部分。在某些实施方式中,cas蛋白可以是天然cas蛋白或修饰的cas蛋白的“功能部分”或“功能衍生物”。天然序列多肽的“功能衍生物”是具有与天然序列多肽相同的定性生物学特性的化合物。“功能衍生物”包括但不限于天然序列的片段和天然序列多肽的衍生物及其片段,只要它们具有与相应的天然序列多肽相同的生物学活性(例如,核酸内切酶活性)即可。如本文所用,“功能部分”是指cas多肽的一部分,其保留了其与至少一种核糖核酸(例如,导向rna(grna))复合并切割靶多核苷酸序列的能力。在某些实施方式中,功能部分包含选自由以下组成的组的可操作连接的cas9蛋白功能域的组合:dna结合结构域、至少一种rna结合结构域、解旋酶结构域和核酸内切酶结构域。在某些实施方式中,功能部分包括选自由以下组成的组的可操作连接的cpf1蛋白功能域的组合:dna结合结构域、至少一种rna结合结构域、解旋酶结构域和核酸内切酶结构域。在某些实施方式中,功能域形成复合体。在某些实施方式中,cas9蛋白的功能部分包含ruvc样结构域的功能部分。在某些实施方式中,cas9蛋白的功能部分包含hnh核酸酶结构域的功能部分。在某些实施方式中,cpf1蛋白的功能部分包含ruvc样结构域的功能部分。在某些实施方式中,本文考虑的生物学活性是功能性衍生物将dna底物水解成片段的能力。术语“衍生物”涵盖多肽的氨基酸序列变体、共价修饰物及其融合体。在某些方面,功能性衍生物可包含天然存在的cas蛋白的单一生物学特性。在其他方面,功能性衍生物可以包含天然存在的cas蛋白的生物学特性的子集。考虑到前述,本文所用的术语“cas多肽”涵盖全长cas多肽、cas多肽的酶活性片段、以及cas多肽的酶活性衍生物或其片段。cas多肽或其片段的合适衍生物包括但不限于cas蛋白或其片段的突变体、融合体、共价修饰物。包括cas蛋白或其片段以及cas蛋白或其片段的衍生物的cas蛋白可以从细胞获得或化学合成、重组表达或通过这些程序的组合而获得。所述细胞可以是天然产生cas蛋白的细胞,或者是天然产生cas蛋白并经基因工程改造以产生较高表达水平的内源cas蛋白或由外源导入的核酸产生cas蛋白的细胞,所述核酸编码与内源cas相同或不同的cas。在某些情况下,细胞不会自然产生cas蛋白,而是经过基因工程改造以产生cas蛋白。在某些实施方式中,cas蛋白包含一个或多个氨基酸取代或修饰。在某些实施方式中,一个或多个氨基酸取代包括保守氨基酸取代。在某些情况下,取代和/或修饰可以防止或减少蛋白水解降解和/或延长多肽在细胞中的半衰期。在某些实施方式中,cas蛋白可包含肽键替代(例如,尿素、硫脲、氨基甲酸酯、磺酰脲等)。在某些实施方式中,cas蛋白可包含天然存在的氨基酸。在某些实施方式中,cas蛋白可包含替代氨基酸(例如,d-氨基酸、β-氨基酸、高半胱氨酸、磷酸丝氨酸等)。在某些实施方式中,cas蛋白可包含修饰以包括部分(例如,聚乙二醇化、糖基化、脂化、乙酰化、封端等)。在某些实施方式中,本文所述的构建体中使用的cas蛋白可以被突变以改变功能。在美国专利号5,789,538;5,925,523;6,007,988;6,013,453;6,410,248;6,140,466;6,200,759;和6,242,568;及wo98/37186;wo98/53057;wo00/27878;wo01/88197和gb2,338,237中公开了示例性选择方法,其包括噬菌体展示和双杂交系统。另外,例如在wo02/077227中描述了对锌指结合域的结合特异性的增强。在某些实施方式中,例如,cas9蛋白在hnh结构域中突变,使其不能切割与crrna互补的dna链。在其他示例性但非限制性的实施方式中,cas9在rvu结构域中突变,使其不能切割非互补dna链。这些突变可以导致cas9切口酶的产生。在某些实施方式中,两个cas切口酶与两个单独的crrna一起使用以靶向dna,这导致靶dna中以指定距离相隔两个切口。在其他示例性但非限制性的实施方式中,hnh和rvu核酸内切酶结构域均被改变以提供不能切割靶dna的cas9蛋白。在某些实施方式中,cas蛋白(例如,cas9蛋白)包含截短的cas蛋白。在一个示例性但非限制性的实施方式中,cas9仅包含负责与crrna或sgrna和靶dna相互作用的结构域。在某些实施方式中,包含本文所述的构建体的cas蛋白包含与不同功能结构域融合的cas蛋白或其截短物。在某些方面,功能结构域是激活或抑制结构域。在其他方面,功能结构域是核酸酶结构域。在某些实施方式中,核酸酶结构域是foki核酸内切酶结构域(参见例如,tsai(2014)nat.biotechnol.doi:10.1038/nbt.2908)。在某些实施方式中,foki结构域包含二聚化结构域中的突变。crispr/cas系统也可用于抑制基因表达。例如,lei等(参见,(2013)细胞,152(5):1173-1183)已显示,缺少核酸内切酶活性的催化死亡的cas9在与导向rna共表达时,会产生dna识别复合体,该复合体可特异性干扰转录延伸、rna聚合酶结合或转录因子结合。这个系统称为crispr干扰(crispri),其可以有效地抑制靶基因的表达。在某些实施方式中,本文所述的构建体包含连接至crispri复合体的抗体(例如,内化抗体)。突变体crispr/cas核酸内切酶已经创建了许多突变体核酸内切酶,它们改善了编辑特异性和/或提高了编辑效率。这样的突变体核酸内切酶包括但不限于高保真度(hifi)cas9等。一个示例性的但非限制性实施方式,突变体核酸内切酶包含cas9,该cas9包含单点突变p.r691a(参见例如,vakulskas等(2018)nat.med.,24:1216-1224)。另一个示例性的但非限制性突变体核酸内切酶包含来自integrateddnatechnologies(skokie,illinois)的s.p.hificas9。在某些实施方式中,通过添加1、2、3或4个以上核定位信号来修饰crispr/cas核酸内切酶或hifi核酸内切酶,以增强核酸内切酶向细胞核酸酶的转运。核定位信号或序列(nls)是“标记”蛋白质以通过核转运进入细胞核的氨基酸序列。通常,该信号由暴露于蛋白质表面的一个或多个带正电荷的赖氨酸或精氨酸的短序列组成。在某些实施方式中,nls可以进一步分类为单组分(monopartite)或双组分(bipartite)。两者之间的主要结构差异是单组分nls中的两个碱性氨基酸簇被相对较短的间隔序列隔开(因此是双组分——2个部分),而单组分nls则没有。首先发现的nls是sv40大t抗原中的序列pkkkrkv(seqidno:29)(单组分nls)(kalderon等(1984)cell,39(3pt2):499-509)。核纤溶酶的nls,kr[paatkkagqa]kkkk(seqidno:30)是普遍存在的双组分信号的原型:两个碱性氨基酸簇,由大约10个氨基酸的间隔子隔开(dingwall等(1988)j.cellbiol.107(3):841-84)。这两个信号都被输入蛋白α识别。输入蛋白α本身包含双组分nls,这由输入蛋白β明确识别。后者可以视为实际的输入媒介。单组分nls的一个示例性共有序列是k-k/r-x-k/r(seqidno:31),其中x是任何氨基酸(dingwal等,同上)。其他nls包括但不限于hnrnpa1的酸性m9结构域,酵母转录阻遏物matα2中的序列kipik和usnrnps的复合信号。这些nls中的大多数似乎直接被输入蛋白β家族的特定受体识别,而不需要输入蛋白α-样蛋白的干预(参见,例如,mattaj&englmeier(1998)annu.rev.biochem.67(1):265-306)。已经提出了一类称为py-nls的nls(参见,lee等(2006)cell,126(3):543–558)。该py-nls基序因其中的脯氨酸-酪氨酸氨基酸配对而得名,使蛋白质与输入蛋白β2(也称为运输蛋白或核蛋白β2)结合,然后将货物蛋白转运到细胞核中。在某些实施方式中,nls包含单组分nls,其包括但不限于sv40t抗原(pkkkrkv(seqidno:32))、sv40vp3(kkkrk(seqidno:33))、腺病毒ela(krprp(seqidno:34))、人c-myc(paakrvkld(seqidno:35)、rqrrnelkrsp(seqidno:36)),及其衍生物。在某些实施方式中,肽包含双组分nls,其包括但不限于核纤溶酶(krpaatkkagqakkkk(seqidno:37))、非洲爪蟾n1(vrkkrkteeesplkdkdakkskqe(seqidno:38))、小鼠fgf3(rlrrdaggrggvyehlggaprrrk(seqidno:39))、parp(krkgdevdgvdecakkskk(seqidno:40)),及其衍生物。在某些实施方式中,nls包括非经典的nls诸如m9肽,nqssnfgpmkggnfggrssgpyggggqyfakprnqggy(seqidno:41)。导向rna(用于crispr/cas核酸内切酶)在各种实施方式中,本文所述的构建体包含连接至复合体的抗体(例如,内化抗体),所述复合体包含cas蛋白和一个或两个rna(导向rna)。在某些实施方式中,复合体包含连接至单个导向rna的cas蛋白。结合至2类crispr/cas核酸内切酶的核酸分子(例如,cas9蛋白;v型或vi型crispr/cas蛋白;cpf1蛋白等),并将复合体靶向靶核酸内特定位置的核酸分子在本文中称为“导向rna(guiderna)”或“crispr/cas导向核酸”或“crispr/cas导向rna”。在各种实施方式中,导向rna通过包括靶向区段来提供对复合体(rnp复合体)的靶特异性,所述靶向区段包括导向序列(本文也称为靶向序列),所述导向序列通常包含与靶核酸的序列互补的核苷酸序列。导向rna可以由其对应的蛋白质指代。例如,当2类crispr/cas核酸内切酶是cas9蛋白时,相应的导向rna可以称为“cas9导向rna”。同样,作为另一个实例,当2类crispr/cas核酸内切酶是cpf1蛋白时,相应的导向rna可以称为“cpf1导向rna”。在某些实施方式中,导向rna包括两个分开的核酸分子(或在一个分子内的两个序列):“活化子(activator)”和“靶向物(targeter)”,在本文中称为“双导向rna”、“双分子导向rna”、“两分子导向rna”或“dgrna”。在某些实施方式中,导向rna是一个分子(例如,对于某些2类crispr/cas蛋白,相应的导向rna是单个分子;并且在某些情况下,活化子和靶向物彼此共价连接,例如通过插入核苷酸),并且将导向rna称为“单导向rna”、“单分子导向rna”、“一分子导向rna”或简称为“sgrna”。cas9导向rna结合cas9蛋白并将复合体靶向靶核酸内特定位置的核酸分子在本文中称为“cas9导向rna”。在某些实施方式中,cas9导向rna(可以说包括两个区段,第一区段(本文称为“靶向区段”)和第二区段(本文称为“蛋白质结合区段”)。“区段”是指分子的区段/部分/区域,例如核酸分子中核苷酸的连续延伸。区段也可以指复合体的区域/部分,使得区段可以包含多于一个分子的区域。在各种实施方式中,cas9导向rna的第一区段(靶向区段)通常包括与靶核酸(例如,靶ssrna,靶ssdna,双链目标dna的互补链等)中的特定序列(靶位点)互补(并因此与之杂交)的核苷酸序列(导向序列)。蛋白质结合区段(或“蛋白质结合序列”)与cas9多肽相互作用(结合)。主题cas9导向rna的蛋白质结合区段通常包括核苷酸的两个互补延伸,其彼此杂交以形成双链rna双链体(dsrna双链体)。靶核酸(例如,基因组dna)的位点特异性结合和/或切割可发生在cas9导向rna(导向rna的导向序列)和靶核酸之间的碱基配对互补性确定的位置(例如,靶基因座的靶序列)。cas9导向rna和cas9蛋形成复合体(例如,通过非共价相互作用结合)。cas9导向rna通过包括靶向区段来提供对复合体的靶特异性,所述靶向区段包括导向序列(与靶核酸的序列互补的核苷酸序列)。复合体的cas9蛋白提供位点特异性活性(例如,裂解活性或当cas9蛋白是cas9融合多肽,即具有融合伴侣时,由cas9蛋白提供的活性)。换句话说,借助于其与cas9导向rna的结合,cas9蛋白被引导至靶核酸序列(例如,染色体核酸例如染色体中的靶序列;染色体外核酸例如游离核酸、小圆环、ssrna、,ssdna等中的靶序列;线粒体核酸中的靶序列;叶绿体核酸中的靶向序列;质粒中的靶序列;病毒核酸中的靶序列等)。cas9导向rna的“导向序列”也称为“靶向序列”,其可经修饰以使cas9导向rna可以将cas9蛋白靶向任何所需靶核酸的任何所需序列,例外是可以考虑原间隔子相邻基序(pam)序列。因此,例如,cas9导向rna可以具有靶向区段,该靶向区段具有与真核细胞中的核酸例如病毒核酸和真核核酸(例如,真核染色体、染色体序列、真核rna等)等的序列互补(例如可以杂交)的序列(导向序列)。在某些实施方式中,cas9导向rna包括两个单独的核酸分子:“活化子”和“靶标”,在本文中称为“双cas9导向rna”、“双分子cas9导向rna”或“两分子cas9导向rna”、“双导向rna”或“dgrna”。在某些实施方式中,活化子和靶向物彼此共价连接(例如,通过插入核苷酸),并且导向rna被称为“单导向rna”、“cas9单导向rna”、“单分子cas9导向rna”或“一分子cas9导向rna”,或简称为“sgrna”。在各种实施方式中,cas9导向rna包含crrna样(“crisprrna”/“靶向物”/“crrna”/“crrna重复”)分子和相应的tracrrna样(“反式crisprrna”/“活化子”/“tracrrna”)分子。crrna样分子(靶向物)通常既包含cas9导向rna的靶向片段(单链),又包含形成cas9导向rna的蛋白质结合区段dsrna双链体一半的核苷酸延伸(“双链体形成片段”)。相应的tracrrna样分子(活化子/tracrrna)通常包含一段核苷酸(双链体形成片段),其形成了导向核酸的蛋白质结合区段的dsrna双链体的另一半。换句话说,crrna样分子的一段核苷酸与tracrrna样分子的一段核苷酸互补并杂交,以形成cas9导向rna的蛋白质结合结构域的dsrna双链体。这样,可以说每个靶标分子具有相应的活化分子(其具有与靶标杂交的区域)。在各种实施方式中,靶标分子另外提供靶片段。因此,在各种实施方式中,靶向物和活化分子(作为对应对)可以杂交以形成cas9导向rna。给定的crrna或tracrrna分子的确切序列是rna分子所存在的物种的特征。主题双cas9导向rna可以包括任何相应的活化子和靶向物对。本文使用的术语“活化子”或“活化子rna”是指cas9双导向rna(因此,当“活化子”和“靶标”通过例如插入核苷酸连接在一起时,是cas9单导向rna)的tracrrna样分子(tracrrna:“反式crisprrna”)。因此,例如,cas9导向rna(dgrna或sgrna)通常包含活化子序列(例如tracrrna序列)。tracr分子(tracrrna)是与crisprrna分子(crrna)杂交形成cas9双导向rna的天然存在的分子。术语“活化子”在本文中用于涵盖天然存在的tracrrna,但也包括具有修饰(例如,截短、序列变异、碱基修饰、主链修饰、键合修饰等)的tracrrna,其中活化子保留tracrrna的至少一种功能(例如,促成cas9蛋白结合的dsrna双链体)。在某些情况下,活化子提供了一个或多个可以与cas9蛋白相互作用的茎环。活化子可以被称为具有tracr序列(tracrrna序列),在某些情况下是tracrrna,但是术语“活化子”不限于天然存在的tracrrna。本文使用的术语“靶向物”或“靶向物rna”是指cas9双导向rna(因此,当“活化子”和“靶向物”例如通过插入核苷酸连接在一起时,是cas9单导向rna)的crrna样分子(crrna:“crisprrna”)。因此,例如,cas9导向rna(dgrna或sgrna)通常包含靶向区段(其包括与靶核酸杂交(互补)的核苷酸)和双链形成区段(例如crrna的双链体形成区段,也可以称为crrna重复序列)。由于靶向物的靶向区段(与靶核酸的靶向序列杂交的区段)的序列被用户修饰以与所需靶核酸杂交,因此,靶向序列通常不是天然存在的序列。然而,在各种实施方式中,与活化子的双链体形成区段杂交的靶向物的双链体形成区段(下文更详细描述)可以包括天然存在的序列(例如,可以包括天然存在的crrna的双链体形成区段的序列,也可以称为crrna重复序列)。因此,尽管靶向物的一部分(例如,双链体形成区段)通常包括来自crrna的天然存在的序列,但本文使用的术语靶向物用于区别于天然存在的crrna。然而,术语“靶向物”涵盖天然存在的crrna。在各种实施方式中,cas9导向rna也可以说包括3个部分:(i)靶向序列(与靶核酸的序列杂交的核苷酸序列);(ii)活化子序列(如上所述)(在某些情况下,称为tracr序列);(iii)与活化子序列的至少一部分杂交以形成双链双链体的序列。靶向物具有(i)和(iii);而活化子具有(ii)。cas9导向rna(例如,双导向rna或单导向rna)可以由任何相应的活化子和靶向物对组成。在某些情况下,双链体形成区段可在活化子和靶向物之间交换。换句话说,在某些情况下,靶向物包括来自tracrrna的双链体形成区段的核苷酸序列(该序列通常是活化子的一部分),而活化子包括来自crrna的双链体形成区段的核苷酸序列(该序列通常是靶向物的一部分)。如上所述,靶向物通常既包括cas9导向rna的靶向区段(单链),又包括形成所cas9导向rna的蛋白质结合区段的dsrna双链体的一半的核苷酸延伸(“双链体形成区段”)。相应的tracrrna样分子(活化子)通常包含一段核苷酸(形成双链体的片段),形成了cas9指导rna的蛋白质结合区段的dsrna双链体的另一半。换句话说,靶向物的一段核苷酸与活化子的一段核苷酸互补并杂交,以形成cas9导向rna的蛋白质结合区段的dsrna双链体。这样,可以说每个靶向物具有相应的活化子(其具有与靶向物杂交的区域)。靶向物分子另外提供靶向区段。因此,靶向物和活化子(作为对应对)杂交以形成cas9导向rna。给定的天然存在的crrna或tracrrna分子的特定序列是rna分子所存在的物种的特征。合适的活化子和靶向物的实例是本领域公知的。在各种实施方式中,cas9导向rna(例如,双导向rna或单导向rna)可以由任何对应的活化子和靶向物对组成。cas9导向rna的靶向区段主题导向核酸的第一区段通常包括导向序列(例如,靶向序列)(与靶核酸中的序列(靶位点)互补的核苷酸序列)。换句话说,主题导向核酸的靶向区段可以通过杂交(即碱基配对)以序列特异性方式与靶核酸(例如,双链dna(dsdna))相互作用。这样,靶向区段的核苷酸序列可以变化(取决于靶标),并且可以确定cas9导向rna和靶核酸将发生相互作用的靶核酸内的位置。可以修饰(例如,通过基因工程)/设计cas9导向rna的靶向区段来与靶核酸(例如,真核靶核酸,如基因组dna)内的任何期望序列(靶位点)杂交。在某些实施方式中,靶向区段的长度可以是7个以上核苷酸(nt)(例如,8个以上、9个以上、10个以上、12个以上、15个以上、20个以上、25个以上、30个以上、或40个以上核苷酸)。在某些情况下,靶向区段的长度可以是7至100个核苷酸(nt)(例如,7至80nt、7至60nt、7至40nt、7至30nt、7至25nt、7至22nt、7至20nt、7至18nt、8至80nt、8至60nt、8至40nt、8至30nt、8至25nt、8至22nt、8至20nt、8至18nt、10至100nt、10至80nt、10至60nt、10至40nt、10至30nt、10至25nt、10至22nt、10至20nt、10至18nt、12至100nt、12至80nt、12至60nt、12至40nt、12至30nt、12至25nt、12至22nt、12至20nt、12至18nt、14至100nt、14至80nt、14至60nt、14至40nt、14至30nt、14至25nt、14至22nt、14至20nt、14至18nt、16至100nt、16至80nt、16至60nt、16至40nt、16至30nt、16至25nt、16至22nt、16至20nt、16至18nt、18至100nt、18至80nt、18至60nt、18至40nt、18至30nt、18至25nt、18至22nt、或18至20nt)。与靶核酸的核苷酸序列(靶位点)互补的靶向区段的核苷酸序列(靶向序列)的长度可以为10nt以上。例如,与靶核酸的靶位点互补的靶向区段的靶向序列的长度可以为12nt以上、15nt以上、18nt以上、19nt以上或20nt以上。在某些情况下,与靶核酸的核苷酸序列(靶位点)互补的靶向区段的核苷酸序列(靶向序列)的长度为12nt以上。在某些情况下,与靶核酸的核苷酸序列(靶位点)互补的靶向区段的核苷酸序列(靶向序列)的长度为18nt以上。例如,在某些实施方式中,与靶核酸的靶向序列互补的靶向区段的靶向序列的长度为10至100个核苷酸(nt)(例如,10至90nt、10至75nt、10至60nt、10至50nt、10至35nt、10至30nt、10至25nt、10至22nt、10至20nt、12至100nt、12至90nt、12至75nt、12至60nt、12至50nt、12至35nt、12至30nt、12至25nt、12至22nt、12至20nt、15至100nt、15至90nt、15至75nt、15至60nt、15至50nt、15至35nt、15至30nt、15至25nt、15至22nt、15至20nt、17至100nt、17至90nt、17至75nt、17至60nt、17至50nt、17至35nt、17至30nt、17至25nt、17至22nt、17至20nt、18至100nt、18至90nt、18至75nt、18至60nt、18至50nt、18至35nt、18至30nt、18至25nt、18至22nt或18至20nt)。在某些情况下,与靶核酸的靶向序列互补的靶向区段的靶向序列的长度为15nt至30nt。在某些情况下,与靶核酸的靶向序列互补的靶向区段的靶向序列的长度为15nt至25nt。在某些情况下,与靶核酸的靶向序列互补的靶向区段的靶向序列的长度为18nt至30nt。在某些情况下,与靶核酸的靶向序列互补的靶向区段的靶向序列的长度为18nt至25nt。在某些情况下,与靶核酸的靶向序列互补的靶向区段的靶向序列的长度为18nt至22nt。在某些情况下,与靶核酸的靶位点互补的靶向区段的靶向序列的长度为20个核苷酸。在某些情况下,与靶核酸的靶位点互补的靶向区段的靶向序列的长度为19个核苷酸。在某些实施方式中,靶向区段的靶向序列(导向序列)与靶核酸的靶位点之间的互补百分比可以为60%以上(例如,65%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、或100%)。在某些情况下,在靶核酸的靶位点的7个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补性百分比为100%。在某些情况下,在约20个连续核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补性百分比为60%以上。在某些情况下,在靶核酸的靶位点的14个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补性百分比为100%。在这种情况下,靶向序列可以被认为是14个核苷酸的长度。在某些情况下,在靶核酸的靶位点的7个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补性百分比为100%,其余的最低为0%以上。在这种情况下,可以认为靶向序列的长度为20个核苷酸。在某些情况下,在靶核酸的靶位点的7个连续的5'-最末端核苷酸(其可以与cas9导向rna靶向序列的3'-最末端核苷酸互补)上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%。在某些情况下,在靶核酸的靶位点的8个连续的5'-最末端核苷酸(其可以与cas9导向rna靶向序列的3'-最末端核苷酸互补)上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%。在某些情况下,在靶核酸的靶位点的9个连续的5'-最末端核苷酸(其可以与cas9导向rna靶向序列的3'-最末端核苷酸互补)上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%。在某些情况下,在靶核酸的靶位点的10个连续的5'-最末端核苷酸(其可以与cas9导向rna靶向序列的3'-最末端核苷酸互补)上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%。在某些情况下,在靶核酸的靶位点的17个连续的5'-最末端核苷酸(其可以与cas9导向rna靶向序列的3'-最末端核苷酸互补)上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%。在某些情况下,在靶核酸的靶位点的18个连续的5'-最末端核苷酸(其可以与cas9导向rna靶向序列的3'-最末端核苷酸互补)上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%。在某些情况下,在约20个连续核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为60%以上(例如,65%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、97%以上、98%以上、99%以上、或100%)。在某些情况下,在靶核酸的靶位点的7个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是7个核苷酸的长度。在某些情况下,在靶核酸的靶位点的8个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是8个核苷酸的长度。在某些情况下,在靶核酸的靶位点的9个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是9个核苷酸的长度。在某些情况下,在靶核酸的靶位点的10个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是10个核苷酸的长度。在某些情况下,在靶核酸的靶位点的11个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是11个核苷酸的长度。在某些情况下,在靶核酸的靶位点的12个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是12个核苷酸的长度。在某些情况下,在靶核酸的靶位点的13个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是13个核苷酸的长度。在某些情况下,在靶核酸的靶位点的14个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是14个核苷酸的长度。在某些情况下,在靶核酸的靶位点的17个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是17个核苷酸的长度。在某些情况下,在靶核酸的靶位点的18个连续的5'-最末端核苷酸上,靶向区段的靶向序列与靶核酸的靶位点之间的互补百分比为100%,其余的最低为0%以上。在这种情况下,靶向序列可以被认为是18个核苷酸的长度。cas9导向rna的蛋白质结合区段主题cas9导向rna的蛋白质结合区段通常与cas9蛋白相互作用。cas9导向rna通过上述靶向区段将结合的cas9蛋白引导至靶核酸内的特定核苷酸序列。cas9导向rna的蛋白质结合区段通常包含两个核苷酸片段,它们彼此互补并杂交形成双链rna双链体(dsrna双链体)。因此,蛋白质结合区段可以包括dsrna双链体。在某些情况下,蛋白质结合区段还包括cas9导向rna的茎环1(“接合部(nexus)”)。例如,在某些情况下,cas9导向rna(dgrna或sgrna)的活化子包括(i)双链体形成区段,其有助于蛋白质结合区段的dsrna双链体;和(ii)双链体形成区段的核苷酸3’,例如其形成茎环1(“接合部”)。例如,在某些情况下,蛋白质结合区段包括cas9导向rna的茎环1(“接合部”)。在某些情况下,蛋白质结合区段包括dsrna双链体3'(其中3'是相对于活化子序列的双链体形成区段)的5个以上核苷酸(nt)(例如,6个以上、7个以上、8个以上、9个以上、10个以上、11个以上、12个以上、15个以上、20个以上、30个以上、40个以上、50个以上、60个以上、70个以上、75个以上、或80个以上nt)。在活化子和靶向物之间形成的导向rna(sgrna或dgrna)的dsrna双链体有时在本文中称为“茎环(stemloop)”。另外,许多天然存在的cas9导向rna(例如,酿脓链球菌导向rna)的活化子(活化子rna,tracrrna)具有3个茎环(3个发夹),它们是活化子双链形成区段的3'。最接近活化子的双链形成区段(双链形成区段的3′)的茎环被称为“茎环1”(在本文中也被称为“接合部”);下一个茎环称为“茎环2”(在本文中也称为“发夹1”);下一个茎环称为“茎环3”(在本文中也称为“发夹2”)。在某些情况下,cas9导向rna(sgrna或dgrna)(例如,全长cas9导向rna)具有茎环1、2和3。在某些情况下,活化子(cas9导向rna的活化子)具有茎环1,但没有茎环2且没有茎环3。在某些情况下,活化子(cas9导向rna的活化子)具有茎环1和茎环2,但没有茎环3。在某些情况下,活化子(cas9导向rna的活化子)具有茎环1、2和3。在某些情况下,cas9导向rna(dgrna或sgrna)的活化子(例如,tracr序列)包括(i)有助于蛋白质结合区段的dsrna双链体的双链体形成区段;和(ii)双链体形成区段的3'的一段核苷酸(例如,在本文中称为3'尾)。在某些情况下,双链体形成区段的额外核苷酸3'形成茎环1。在某些情况下,cas9导向rna(dgrna或sgrna)的活化子(例如,tracr序列)包括(i)有助于蛋白质结合区段的dsrna双链体的双链体形成区段;和(ii)双链体形成区段的3’的5个以上核苷酸(例如,6个以上、7个以上、8个以上、9个以上、10个以上、11个以上、12个以上、13个以上、14个以上、15个以上、20个以上、25个以上、30个以上、35个以上、40个以上、45个以上、50个以上、60个以上、70个以上、或75个以上核苷酸)。在某些情况下,cas9导向rna(dgrna或sgrna)的活化子(活化子rna)包括(i)有助于蛋白质结合区段的dsrna双链体的双链体形成区段;和(ii)双链体形成区段的3’的5个以上核苷酸(例如,6个以上、7个以上、8个以上、9个以上、10个以上、11个以上、12个以上、13个以上、14个以上、15个以上、20个以上、25个以上、30个以上、35个以上、40个以上、45个以上、50个以上、60个以上、70个以上、或75个以上核苷酸)。在某些情况下,cas9导向rna(dgrna或sgrna)的活化子(例如,tracr序列)包括(i)有助于蛋白质结合区段的dsrna双链体的双链体形成区段;和(ii)双链体形成区段的3'的一段核苷酸(例如,在本文中称为3'尾)。在某些情况下,双链体形成区段的3'的一段核苷酸的长度范围为5至200个核苷酸(nt)(例如,5至150nt、5至130nt、5至120nt、5至100nt、5至80nt、10至200nt、10至150nt、10至130nt、10至120nt、10至100nt、10至80nt、12至200nt、12至150nt、12至130nt、12至120nt、12至100nt、12至80nt、15至200nt、15至150nt、15至130nt、15至120nt、15至100nt、15至80nt、20至200nt、20至150nt、20至130nt、20至120nt、20至100nt、20至80nt、30至200nt、30至150nt、30至130nt、30至120nt、30至100nt、或30至80nt)。在某些情况下,活化子rna的3'尾的核苷酸是野生型序列。将认识到可以使用许多不同的替代序列。可以在本领域中找到各种cas9蛋白和cas9导向rna的实例(以及与靶核酸中存在的与原间隔子相邻基序(pam)序列有关的要求有关的信息)(参见例如,jinek等(2012)science,337(6096):816-821;chylinski等(2013)rnabiol.10(5):726-737;ma等,(2013)biomed.res.int.2013:270805;hou等(2013)proc.natl.acad.sci.usa,110(39):15644-15649;pattanayak等(2013)nat.biotechnol.31(9):839-843;qi等(2013)cell,152(5):1173-1183;wang等(2013)cell,153(4):910-918;chen等(2013)nucl.acidsres.41(20):e19;cheng等(2012)cellres.23(10):1163-1171;cho等(2013)genetics,195(3):1177-1180;dicarlo等(2013)nucl.acidsres.41(7):4336-4343;dickinson等(2013)nat.meth.10(10):1028-1034;ebina等(2013)sci.rep.3:2510;fujii等(2013)nucl.acidsres.41(20):e187;hu等(2013)cellres.23(11):1322-1325;jiang等(2013)nucl.acidsres.41(20):e188;larson等(2013)nat.protoc.8(11):2180-2196;mali等(2013)nat.meth.10(10):957-963;nakayama等(2013)genesis,51(12):835-843;ran等(2013)nat.protoc.8(11):2281-2308;ran等(2013)cell154(6):1380-1389;walsh等(2013)proc.natl.acad.sci.usa,110(39):15514-15515;yang等(2013)cell,154(6):1370-1379;briner等(2014)mol.cell,56(2):333-339;以及美国专利和专利申请:8,906,616;8,895,308;8,889,418;8,889,356;8,871,445;8,865,406;8,795,965;8,771,945;8,697,359;2014/0068797;2014/0170753;2014/0179006;2014/0179770;2014/0186843;2014/0186919;2014/0186958;2014/0189896;2014/0227787;2014/0234972;2014/0242664;2014/0242699;2014/0242700;2014/0242702;2014/0248702;2014/0256046;2014/0273037;2014/0273226;2014/0273230;2014/0273231;2014/0273232;2014/0273233;2014/0273234;2014/0273235;2014/0287938;2014/0295556;2014/0295557;2014/0298547;2014/0304853;2014/0309487;2014/0310828;2014/0310830;2014/0315985;2014/0335063;2014/0335620;2014/0342456;2014/0342457;2014/0342458;2014/0349400;2014/0349405;2014/0356867;2014/0356956;2014/0356958;2014/0356959;2014/0357523;2014/0357530;2014/0364333;和2014/0377868;全部以其整体通过引用并入本文。在某些实施方式中,还可以利用替代的pam序列,其中使用化酿脓链球菌cas9,pam序列可以是nag,以作为ngg的替代(hsu(2014)同上)。额外的pam序列也可能包括缺少初始g的序列(参见例如sander和joung(2014)naturebiotech32(4):347)。除了酿脓链球菌编码的cas9pam序列之外,还可以使用对来自其他细菌来源的cas9蛋白具有特异性的其他pam序列。例如,下表3中显示的pam序列(来自sander和joung(同上)及esvelt等(2013)nat.meth.10(11):1116,经编辑)对这些cas9蛋白具有特异性:表3.来自各种物种示例性pam序列。物种pamseqidno酿脓链球菌ngg酿脓链球菌nag变异链球菌ngg嗜热链球菌nggng42嗜热链球菌nnaaaw43嗜热链球菌nnagaa44嗜热链球菌nnngatt45空肠弯曲菌nnnnaca46脑膜炎奈瑟菌nnnngatt47多杀性巴氏杆菌gnnncnna48新凶手弗朗西丝菌ng因此,在某些实施方式中,可以根据以下指南选择适合酿脓链球菌crispr/cas系统使用的靶序列:[n17,n18,n19或n20](g/a)g(seqidno:49)。作为另一种选择,在某些实施方式中,pam序列可以遵循指南g[n17,n18,n19,n20](g/a)g(seqidno:50)。对于来自非酿脓链球菌细菌的cas9蛋白,如果替代pam取代酿脓链球菌pam序列,则可以使用相同的指导原则。对应于v型和vi型crispr/cas核酸内切酶的导向rna(例如,cpf1导向rna)结合至v型或vi型crispr/cas蛋白(例如,cpf1、c2c1、c2c2、c2c3)并且将复合体靶向靶核酸内的特定位置的导向rna在本文中通常称为“v型或vi型crispr/cas导向rna”。一个更具体的术语的实例是“cpf1导向rna”。在各种实施方式中,v型或vi型crispr/cas导向rna(例如,cpf1导向rna)的总长度可以为30个核苷酸(nt)至200nt,例如,30nt至180nt、30nt至160nt、30nt至150nt、30nt至125nt、30nt至100nt、30nt至90nt、30nt至80nt、30nt至70nt、30nt至60nt、30nt至50nt、50nt至200nt、50nt至180nt、50nt至160nt、50nt至150nt、50nt至125nt、50nt至100nt、50nt至90nt、50nt至80nt、50nt至70nt、50nt至60nt、70nt至200nt、70nt至180nt、70nt至160nt、70nt至150nt、70nt至125nt、70nt至100nt、70nt至90nt或70nt至80nt)。在某些情况下,v型或vi型crispr/cas导向rna(例如,cpf1导向rna)的总长度为至少30nt(例如,至少40nt、至少50nt、至少60nt、至少70nt、至少80nt、至少90nt、至少100nt、或至少120nt)。在某些情况下,cpf1导向rna的总长度为35nt、36nt、37nt、38nt、39nt、40nt、41nt、42nt、43nt、44nt、45nt、46nt、47nt、48nt、49nt、或50nt。与cas9导向rna类似,v型或vi型crispr/cas导向rna(例如,cpf1导向rna)可以包含靶核酸结合区段和双链体形成区域(例如,在某些情况下是由两个双链体形成区段形成的,即两个相互杂交形成双链体的核苷酸片段)。在各种实施方式中,v型或vi型crispr/cas导向rna(例如,cpf1导向rna)的靶核酸结合区段的长度可以为15nt至30nt,例如,15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt或30nt。在某些情况下,靶核酸结合区段的长度为23nt。在某些情况下,靶核酸结合区段的长度为24nt。在某些情况下,靶核酸结合区段的长度为25nt。在某些实施方式中,v型或vi型crispr/cas导向rna(例如,cpf1导向rna)的导向序列的长度可以为15nt至30nt(例如,15至25nt、15至24nt、15至23nt、15至22nt、15至21nt、15至20nt、15至19nt、15至18nt,17至30nt、17至25nt、17至24nt、17至23nt、17至22nt、17至21nt、17至20nt、17至19nt、17至18nt、18至30nt、18至25nt、18至24nt、18至23nt、18至22nt、18至21nt、18至20nt、18至19nt、19至30nt、19至25nt、19至24nt、19至23nt、19至22nt、19至21nt、19至20nt、20至30nt、20至25nt、20至24nt、20至23nt、20至22nt、20至21nt、15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt、25nt、26nt、27nt、28nt、29nt、或30nt)。在某些情况下,导向序列的长度为17nt。在某些情况下,导向序列的长度为18nt。在某些情况下,导向序列的长度为19nt。在某些情况下,导向序列的长度为20nt。在某些情况下,导向序列的长度为21nt。在某些情况下,导向序列的长度为22nt。在某些情况下,导向序列的长度为23nt。在某些情况下,导向序列的长度为24nt。在某些实施方式中,v型或vi型crispr/cas导向rna(例如,cpf1导向rna)的导向序列可以与靶核酸序列的相应长度具有100%的互补性。导向序列与靶核酸序列的相应长度可以具有小于100%的互补性。例如,v型或vi型crispr/cas导向rna的导向序列(例如,cpf1导向rna)可以具有1、2、3、4或5个与靶核酸序列不互补的核苷酸。例如,在某些情况下,其中导向序列的长度为25个核苷酸,而靶核酸序列的长度为25个核苷酸,在某些情况下,靶核酸结合区段与靶核酸序列具有100%的互补性。作为另一实例,在某些情况下,其中导向序列的长度为25个核苷酸,而靶核酸序列的长度为25个核苷酸,在某些情况下,靶核酸结合区段具有靶核酸序列的1个非互补核苷酸,和24个互补核苷酸。作为另一个实例,在某些情况下,其中导向序列的长度为25个核苷酸,而靶核酸序列的长度为25个核苷酸,在某些情况下,靶核酸结合区段具有靶核酸序列的2个非互补核苷酸,和23个互补核苷酸。在某些实施方式中,v型或vi型crispr/cas导向rna(例如,cpf1导向rna)的双链体形成区段(例如,靶标rna或活化子rna的)长度可以为15nt至25nt(例如,15nt、16nt、17nt、18nt、19nt、20nt、21nt、22nt、23nt、24nt或25nt)。v型或vi型crispr/cas导向rna(例如,cpf1导向rna)的rna双链体的长度可以为5个碱基对(bp)至40bp(例如,5至35bp、5至30bp、5至25bp、5至20bp、5至15bp、5至12bp、5至10bp、5至8bp、6至40bp、6至35bp、6至30bp、6至25bp、6至20bp、6至15bp、6至12bp、6至10bp、6至8bp、7至40bp、7至35bp、7至30bp、7至25bp、7至20bp、7至15bp、7至12bp、7至10bp、8至40bp、8至35bp、8至30bp、8至25bp、8至20bp、8至15bp、8至12bp、8至10bp、9至40bp、9至35bp、9至30bp、9至25bp、9至20bp、9至15bp、9至12bp、9至10bp、10至40bp、10至35bp、10至30bp、10至25bp、10至20bp、10至15bp或10至12bp)。作为示例性但非限制性的实例,cpf1导向rna的双链体形成区段可以包含选自以下的核苷酸序列(5’至3’):aauuucuacuguuguagau(seqidno:51),aauuucugcuguugcagau(seqidno:52),aauuuccacuguuguggau(seqidno:53),aauuccuacuguuguaggu(seqidno:54),aauuucuacuauuguagau(seqidno:55),aauuucuacugcuguagau(seqidno:56),aauuucuacuuuguagau(seqidno:57),aauuucuacuuguagau(seqidno:58)等。然后导向序列可以延续自(5’至3’)双链体形成区段。c2c1导向rna(双导向或单导向)的活化子rna(例如,tracrrna)的示例性但非限制性的实例是包括以下核苷酸序列的rna:gaauuuuucaacgggugugccaauggccacuuuccagguggcaaagcccguugagcuucucaaaaag(seqidno:59)。在某些示例性但非限制性的情况下,c2c1导向rna(双导向或单导向)是包括以下核苷酸序列的rna:gucuagaggacagaauuuuucaacgggugugccaauggccacuuuccagguggcaaagcccguugagcuucucaaaaag(seqidno:60)。在某些示例性但非限制性的情况下,c2c1导向rna(双导向或单导向)是包括以下核苷酸序列的rna:ucuagaggacagaauuuuucaacgggugugccaauggccacuuuccagguggcaaagcccguugagcuucucaaaaag(seqidno:61)。c2c1导向rna(双导向或单导向)的活化子rna(例如,tracrrna)的非限制性的实例是包括以下核苷酸序列的rna:acuuuccaggcaaagcccguugagcuucucaaaaag(seqidno:62)。在某些示例性但非限制性的情况下,活化子rna(例如,tracrrna)的c2c1导向rna(双导向或单导向)的双链体形成区段包括核苷酸序列agcuucuca(seqidno:63)或核苷酸序列gcuucuca(seqidno:64)(来自天然存在的tracrrna的双链体形成区段)。c2c1导向rna(双导向或单导向)的靶向物rna(例如,crrna)的一个示例性但非限制性的实例是具有核苷酸序列cugagaaguggcacnnnnnnnnnnnnnnnnnnnn(seqidno:65)的rna,其中,n表示导向序列,其将根据靶序列而变化,尽管描绘了20个n,但不同长度的范围也是可以接受的。在某些情况下,靶向物rna(例如,crrna)的c2c1导向rna(双导向或单导向)的双链体形成区段包括核苷酸序列cugagaaguggcac(seqidno:66)或包括核苷酸序列cugagaagu(seqidno:67)或包括核苷酸序列ugagaaguggcac(seqidno:68)或包括核苷酸序列ugagaagu(seqidno:69)等。可以在本领域中找到与v型或vi型crispr/cas核酸内切酶和导向rna相关的实例和指南(以及涉及靶向核酸中存在的与原间隔子相邻基序(pam)序列的要求有关的信息)(参见例如,zetsche等(2015)cell,163(3):759-771;makarova等(2015)nat.rev.microbiol.13(11):722-736;shmakov等(2015)mol.cell,60(3):385-397;等)。修饰的导向rna已经发现,在crisprrna(crrna)中的位置掺入桥接核酸(bna)和锁核酸(lna)可以广泛地减少crispr核酸内切酶(例如,cas9)的脱靶切割。因此,在某些实施方式中,引入本文所述的构建体或与本文所述的构建体一起使用的导向rna包含一种或多种bna和/或lna。锁核酸在某些实施方式中,导向rna包含一个或多个锁定核酸(lna)(参见,例如,图9,图a)。lna是构象受限的rna核苷酸,其中核糖中的2'氧与4'碳形成共价键,诱导n型(c3'-endo)糖皱褶,并优选a型螺旋(参见例如,you等(2006)nucleicacidsres.34:e60)。与rna相比,lna显示出更好的碱基堆积和热稳定性,从而导致与互补核酸的高效结合以及错配歧视的改善(参见例如,you等(2006)nucleicacidsres.34:e60).34:e60;vester&wengel(2004)biochem.43:13233-1324)。它们还显示出增强的核酸酶抗性(参见例如,vester&wengel(2004)biochem.43:13233-132429)。因此,本文所述的各种导向rna可以包含一个或多个lna。在某些实施方式中,导向rna包含1、2、3、4个以上lna。桥接核酸(bna)桥接核酸(bna)是修饰的rna核苷酸。它们有时也称为受约束的或不可接近的rna分子。bna单体可以包含五元、六元或甚至七元的桥联结构,并带有“固定的”c3'-内糖皱褶。所述桥通过合成引入在核糖的2',4'-位,以产生2',4'-bna单体。可以使用标准亚磷酰胺化学将所述单体引入寡核苷酸聚合物结构中。bna是具有增加的结合亲和力和稳定性的结构刚性寡核苷酸。已经发现,将桥连核酸(bna)引入crsipr导向rna中可以显着改善crispr特异性。特别地,已经证明当被引入crisprcrrna时,n-甲基取代的bna(2′,4′-bnanc[n-me])(参见例如,图9,小图b)可以提高crispr准确性多达10000倍(参见例如,cromwell等(2018)nat.comm.9:1448),显示出显着改善cas9核酸内切酶特异性。因此,本文所述的各种导向rna可以包含一个或多个bna。在某些实施方式中,导向rna包含1、2、3、4个以上bnanc。靶基因组dna本文所述的构建体可有效地在靶基因组dna中进行基因编辑。在某些实施方式中,靶基因组dna是真核细胞(例如,植物、动物、真菌等的细胞)中的dna。在某些实施方式中,靶dna是哺乳动物(例如人或非人哺乳动物)中的基因组dna。靶基因组dna可以是其中序列要被修饰的任何基因组dna,例如,通过取代和/或插入和/或缺失靶基因组dna中存在的一个或多个核苷酸。靶基因(靶基因组dna)包括但不限于涉及各种疾病或病症的那些基因。在某些情况下,靶基因组dna被突变,使得其编码非功能性多肽,或者不以任何可检测的量合成由靶基因组dna编码的多肽,或者使得以低于正常量的量合成由靶基因组dna编码的多肽,使得具有突变的个体患有疾病。此类疾病包括但不限于,软骨发育不全、全色盲、酸性麦芽糖酶缺乏症、腺苷脱氨酶缺乏症、肾上腺脑白质营养不良、艾卡尔迪综合征、α-1抗胰蛋白酶缺乏症、α-地中海贫血、雄激素不敏感综合征、阿佩尔综合征、致心律失常性右室心肌病、发育异常、共济失调毛细血管扩张、巴斯综合征、β-地中海贫血、蓝色硬血管痣综合征、海绵状脑白质营养不良症、慢性肉芽肿性疾病(cgd)、猫叫综合征、crigler-najjer综合征、囊性纤维化、德尔肯氏病、外胚层发育不良、范可尼贫血、进行性骨化性纤维发育不良、脆性x染色体综合征、半乳糖血症、高雪氏病、全身性神经节苷脂沉积症(例如,gm1)、iv型糖原贮积症、血色沉着病、β-珠蛋白第六密码子的血红蛋白c突变(hbc)、血友病、亨廷顿氏舞蹈病、贺勒氏症、磷酸酶过少症、克氏综合征、克拉贝病、langer-giedion综合征、白血球粘着缺乏症(lad、omim116920号)、脑白质营养不良、长qt综合征、马凡综合征、莫比斯综合征、粘多糖贮积症(mps)、指甲髌骨综合征、肾性尿崩症、神经纤维瘤病、尼曼-皮克病、成骨不全症、卟啉症、普拉德-威利综合征、儿童早衰症、普罗蒂斯综合征、视网膜母细胞瘤、雷特氏综合征、鲁宾斯坦-泰比综合征、沙费利波综合征、重症综合性免疫缺陷(scid)、舒瓦曼综合征、镰状细胞疾病(镰形细胞贫血)、史密斯-马吉利综合征、史蒂克勒氏综合征、戴萨克斯症、血小板减少-桡骨缺失(tar)综合征、特-柯二氏综合征、三体综合征、结节性硬化症、特纳综合征、尿素循环障碍、希普尔病、瓦登伯革氏综合征、威廉斯综合征、威尔逊氏病、威-奥二氏综合征和x连锁淋巴组织增生综合征。其他此类疾病包括,例如,获得性免疫缺陷、溶酶体贮积症(例如、高雪氏病、gm1、法布里病和戴萨克斯症)、粘多糖贮积病(例如、亨特氏病、赫尔勒氏症)、血红蛋白病(例如、镰状细胞疾病、hbc、α-地中海贫血、β-地中海贫血)和血友病。例如,在某些情况下,靶基因组dna包含引起三核苷酸重复疾病的突变。示例性的三核苷酸重复疾病和涉及三核苷酸重复疾病的靶基因,三核苷酸重复疾病基因drpla(齿状核红核苍白球路易体萎缩症)atn1或drplahd(亨廷顿氏舞蹈病)htt(亨廷顿蛋白)sbma(虹膜肌萎缩症或肯尼迪疾病的雄激素受体)x染色体。sca1(1型脊髓小脑性共济失调)atxn1sca2(2型脊髓小脑性共济失调)atxn2sca3(3型脊髓小脑性共济失调或atxn3machado-joseph病)sca6(6型脊髓小脑性共济失调)cacna1asca7(7型脊髓小脑性共济失调)atxn7sca17(17型脊髓小脑性共济失调)tbpfraxa(脆性x染色体综合征)fmr1,在x染色体fxtas上(脆性x相关震颤/fmr1,x共济失调综合征上)染色体fraxe(脆性xe智力低下)aff2或fmr2,在x-染色体上frda(弗里德希氏共济失调)fxn或x25,(共济蛋白减少表达)dm(肌强直性营养不良)dmpksca8(8型脊髓小脑性共济失调)osca或sca8sca12(12型脊髓小脑性共济失调)ppp2r2b或sca12。例如,在某些情况下,合适的靶基因组dna是β-球蛋白基因,例如具有镰状细胞突变的β-球蛋白基因。作为另一个实例,合适的靶基因组dna是亨廷顿氏基因座,例如htt基因,其中htt基因包含引起亨廷顿氏病的突变(例如,包含超过35个cag重复序列的cag重复序列扩展)。作为另一个实例,合适的靶基因组dna是腺苷脱氨酶基因,其包含引起严重的联合免疫缺陷的突变。作为另一个实例,合适的靶基因组dna是bcl11a基因,其包含与控制γ-珠蛋白基因相关的突变。作为另一个实例,合适的靶基因组dna是bcl11a增强子。因此,在各种实施方式中,本文所述的方法涉及本文所述的构建体和/或药物制剂在治疗一种或多种上述疾病中的用途。供体多核苷酸在某些情况下,本文所述的组合物和方法进一步包括供体模板核酸(“供体多核苷酸”)。在某些情况下,本文所述的方法进一步包括使靶dna与供体多核苷酸接触,其中供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分被整合到靶dna中(例如,通过同源性导向修复)。在某些情况下,该方法不包括使细胞与供体多核苷酸接触(例如,导致非同源末端连接)。可以使用将核酸引入细胞的任何方便的技术将供体多核苷酸引入靶细胞。当期望将多核苷酸序列插入靶dna序列中时,将包含待插入的供体序列的多核苷酸提供给细胞(例如,除了基因组靶向组合物外,靶dna还与供体多核苷酸接触(例如,基因组编辑核酸内切酶;或基因组编辑核酸内切酶和导向rna)。“供体序列”或“供体多核苷酸”是指插入基因组编辑核酸内切酶诱导的切割位点的核酸序列。合适的供体多核苷酸可以是单链或双链的,例如,在某些情况下,供体多核苷酸是单链的(例如,在某些情况下可以称为寡核苷酸),在某些情况下,供体多核苷酸是双链的(例如,在某些情况下可以包括经杂交的两个单独的寡核苷酸)。供体多核苷酸将与切割位点的基因组序列具有足够的同源性,例如,与在切割位点侧翼的核苷酸序列具有70%、80%、85%、90%、95%或100%的同源性,例如在100个碱基以下之内(例如,切割位点的50个碱基以下,例如,在30个碱基内,在15个碱基内,在10个碱基内,在5个碱基内,或紧接在裂解位点旁),以支持其与具有同源性的基因组序列之间的同源性定向修复。供体和基因组序列之间大约25个核苷酸(nt)个以上(例如,30nt以上、40nt以上、50nt以上、60nt以上、70nt以上、80nt以上、90nt以上、100nt以上、150nt以上、200nt以上等)的序列同源性(或10至200个核苷酸以上之间的任何整数值)可以支持同源性导向的修复。例如,在某些情况下,供体多核苷酸的5'和/或3'侧翼同源臂(例如,在某些情况下,两个侧翼同源臂)的长度可以是30个核苷酸(nt)以上(例如,40nt以上、50nt以上、60nt以上、70nt以上、80nt以上、90nt以上、100nt以上等)。例如,在某些情况下,供体多核苷酸的5'和/或3'侧翼同源臂(例如,在某些情况下,两个侧翼同源臂)的长度可以为30nt至500nt(例如,30nt至400nt、30nt至350nt、30nt至300nt、30nt至250nt、30nt至200nt、30nt至150nt、30nt至100nt、30nt至90nt、30nt至80nt、50nt至400nt、50nt至350nt、50nt至300nt、50nt至250nt、50nt至200nt、50nt至150nt、50nt至100nt、50nt至90nt、50nt至80nt、60nt至400nt、60nt至350nt、60nt至300nt、60nt至250nt、60nt至200nt、60nt至150nt、60nt至100nt、60nt至90nt、60nt至80nt)。供体序列可以具有任何长度,例如,10个核苷酸以上,50个核苷酸以上,100个核苷酸以上,250个核苷酸以上,500个核苷酸以上,1000个核苷酸以上,5000个核苷酸以上等。供体序列通常与其替换的基因组序列不同。而是,供体序列可以包含相对于基因组序列的至少一个或多个单碱基改变、插入、缺失、倒置或重排,只要存在足够的同源性以支持同源性指导的修复即可。在某些实施方式中,供体序列包含侧翼为两个同源区域的非同源序列,使得靶dna区域和两个侧翼序列之间的同源性定向修复导致非同源序列在靶区域的插入。供体序列也可以包含载体主链,该载体主链包含与目的dna区域不同源并且不打算插入目的dna区域的序列。通常,供体序列的同源区域与需要重组的基因组序列具有至少50%的序列同一性。在某些实施方式中,存在60%、70%、80%、90%、95%、98%、99%或99.9%的序列同一性。根据供体多核苷酸的长度,可以存在1%至100%序列同一性之间的任何值。在某些情况下,供体多核苷酸作为病毒载体(例如,腺相关病毒(aav)载体;慢病毒载体等)的一部分递送至细胞(引入细胞)。例如,病毒dna(例如,aavdna)可以包括供体多核苷酸序列(供体序列)(例如,病毒,例如aav,可以包括包含供体多核苷酸序列的dna分子)。在某些情况下,供体多核苷酸作为病毒(例如,aav,例如,供体多核苷酸序列作为病毒dna例如aavdna的一部分存在)被引入细胞中,并且基因组编辑核酸内切酶(例如,zfn;cas9蛋白等)和(如果适用)导向rna通过不同的途径递送。例如,在某些情况下,供体多核苷酸作为病毒(例如,aav,例如,供体多核苷酸序列作为病毒dna(例如,aavdna)的一部分存在)被引入细胞中,并且cas9蛋白和cas9导向rna作为单独的表达载体的一部分递送。在某些情况下,将供体多核苷酸作为病毒(例如,aav,例如,供体多核苷酸序列作为病毒dna(例如,aavdna)的一部分存在)被引入细胞,并且cas9蛋白和cas9导向rna是作为核糖核蛋白复合体(rnp)的一部分提供。在某些情况下:(i)将供体多核苷酸作为病毒引入细胞中(例如,aav,例如,供体多核苷酸序列作为病毒dna(例如,aavdna)的一部分存在),(ii)cas9导向rna以rna或编码rna的dna的形式递送,并且(iii)cas9蛋白以蛋白质或编码该蛋白的核酸(例如,rna或dna)的形式递送。在某些情况下,在将cas9导向rnarnp引入细胞之前,将包含供体多核苷酸的重组病毒载体(例如,重组aav载体)引入细胞。例如,在某些情况下,将包含供体多核苷酸的重组病毒载体(例如,重组aav载体)引入细胞2小时至72小时(例如,2小时至4小时、4小时至8小时、8小时到12小时、12小时到24小时、24小时到48小时或48小时到72小时),然后将cas9导向rnarnp引入细胞。使用方法在某些实施方式中,提供了在细胞上进行基因编辑的方法,其中该方法包括使细胞与构建体(例如,靶向部分引导的cas核酸内切酶/导向rna复合体)接触。靶向部分(例如,抗体)将构建体引导至靶细胞和/或介导细胞对构建体的摄取。复合体中的导向rna通常将cas核酸内切酶引导至所述细胞的基因组中的特定位置。在某些实施方式中,该方法在离体细胞上进行。在某些实施方式中,该方法涉及自体细胞转移。因此,例如,所述细胞源自待治疗的受试者,使用本文所述的构建体修饰所述细胞的基因组,并将所述细胞转移回所述受试者中。在各种示例性但非限制性的方法中,细胞可以是任何真核细胞,例如植物细胞或哺乳动物细胞或细胞系,其包括但不限于cos、cho(例如,cho-s、cho-k1、cho-dg44、cho-duxb11、cho-dukx、chok1sv)、vero、mdck、wi38、v79、b14af28-g3、bhk、hak、ns0、sp2/0-ag14、hela、hek293(例如、hek293-f、hek293-h、hek293-t)、和perc6细胞以及昆虫细胞(如草地夜蛾(sf)或真菌细胞(如酿酒酵母、毕赤酵母和裂殖酵母)。在某些实施方式中,细胞系是cho、mdck或hek293细胞系。原代细胞也可以如本文所述进行编辑。这样的细胞包括但不限于成纤维细胞、血细胞(例如,红细胞、白细胞)、肝细胞、肾细胞、神经细胞等。合适的细胞还包括干细胞,例如,胚胎干细胞、诱导多能干细胞(ipsc)、造血干细胞、神经元干细胞和间充质干细胞。然而,如上所述,本文所述的构建体可有效地在原位进行基因编辑,例如直接在待治疗的受试者中进行。因此,在某些实施方式中,待编辑的细胞是受试者体内的细胞,并且接触包括向受试者施用构建体(或包含该构建体的药物制剂)。在某些实施方式中,所述方法包括通过选自由以下组成的组的途径施用所述构建体:腹腔施用、局部施用、口服施用、吸入施用、透皮施用、皮下贮库(subdermaldepot)施用和直肠施用。在某些实施方式中,受试者是人类,而在其他实施方式中,受试者是非人类哺乳动物。在某些实施方式中,所述方法包括治疗需要这种治疗的受试者。在某些实施方式中,所述受试者是具有选自由以下组成的组的病理的受试者:软骨发育不全、全色盲、酸性麦芽糖酶缺乏症、腺苷脱氨酶缺乏症、肾上腺脑白质营养不良、艾卡尔迪综合征、α-1抗胰蛋白酶缺乏症、α-地中海贫血、雄激素不敏感综合征、阿佩尔综合征、致心律失常性右室心肌病、发育异常、共济失调毛细血管扩张、巴斯综合征、β-地中海贫血、蓝色硬血管痣综合征、海绵状脑白质营养不良症、慢性肉芽肿性疾病(cgd)、猫叫综合征、crigler-najjer综合征、囊性纤维化、德尔肯氏病、外胚层发育不良、范可尼贫血、进行性骨化性纤维发育不良、脆性x染色体综合征、半乳糖血症s、高雪氏病、全身性神经节苷脂沉积症(例如,gm1)、iv型糖原贮积症、血色沉着病、β-珠蛋白第六密码子的血红蛋白c突变(hbc)、血友病、亨廷顿氏舞蹈病、贺勒氏症、磷酸酶过少症、克氏综合征、克拉贝病、langer-giedion综合征、白血球粘着缺乏症(lad、omim116920号)、脑白质营养不良、长qt综合征、马凡综合征、莫比斯综合征、粘多糖贮积症(mps)、指甲髌骨综合征、肾性尿崩症、神经纤维瘤病、尼曼-皮克病、成骨不全症、卟啉症、普拉德-威利综合征、儿童早衰症、普罗蒂斯综合征、视网膜母细胞瘤、雷特氏综合征、鲁宾斯坦-泰比综合征、沙费利波综合征、重症综合性免疫缺陷(scid)、舒瓦曼综合征、镰状细胞疾病(镰形细胞贫血)、史密斯-马吉利综合征、史蒂克勒氏综合征、戴萨克斯症、血小板减少-桡骨缺失(tar)综合征、特-柯二氏综合征、三体综合征、结节性硬化症、特纳综合征、尿素循环障碍、希普尔病、瓦登伯革氏综合征、威廉斯综合征、威尔逊氏病、威-奥二氏综合征和x连锁淋巴组织增生综合征。其他此类疾病包括,例如,获得性免疫缺陷、溶酶体贮积症(例如,高雪氏病、gm1、法布里病和戴萨克斯症)、粘多糖贮积病(例如,亨特氏病、赫尔勒氏症)、血红蛋白病(例如,镰状细胞疾病、hbc、α-地中海贫血、β-地中海贫血)和血友病。药物制剂在某些实施方式中,将本文所述的靶向-cas核酸内切酶/导向rna复合体施用于哺乳动物以编辑一种或多种细胞或组织中基因组的一个或多个区域。在某些实施方式中,构建体用于治疗可以通过基因组的这种编辑来治疗/纠正的病理。本文所述的靶向-cas核酸内切酶/导向rna复合体可以以“天然”形式或如果需要的话以盐、酯、酰胺、衍生物等的形式施用,条件是盐、酯、酰胺或衍生物在药理学上是合适的,例如在本方法中有效。本文所述的靶向-cas核酸内切酶/导向rna复合体的盐、酯、酰胺和其他衍生物可以使用合成有机化学领域的技术人员已知的并且例如通过以下描述的标准方法来制备:march(1992)advancedorganicchemistry;reactions,mechanismsandstructure,第4版,n.y.wiley-interscience。配制此类衍生物的方法是本领域技术人员已知的。例如,可以为本文所述的任何化合物制备药学上可接受的盐,所述化合物具有能够形成盐的官能度(例如,本文所述的化合物的羧酸官能度)。药学上可接受的盐是保留母体化合物的活性并且对所施用的受试者以及在其施用的环境中不赋予任何有害或不利作用的任何盐。将本文所述的靶向-cas核酸内切酶/导向rna复合体药学上配制为盐、酯、酰胺等的方法是本领域技术人员公知的。例如,可以使用常规方法从游离碱制备盐,所述常规方法通常包括与合适的酸反应。通常,将药物的碱形式溶于极性有机溶剂(如甲醇或乙醇)中,并向其中加入酸。所得盐沉淀或可通过添加极性较小的溶剂从溶液中带出。用于制备酸加成盐的合适的酸包括但不限于有机酸(例如,乙酸、丙酸、乙醇酸、丙酮酸、草酸、苹果酸、丙二酸、琥珀酸、马来酸、富马酸、酒石酸、柠檬酸、苯甲酸、肉桂酸、扁桃酸、甲磺酸、乙磺酸、对甲苯磺酸、水杨酸等)及无机酸(例如,盐酸、氢溴酸、硫酸、硝酸、磷酸等)。酸加成盐可以通过用合适的碱处理而转化为游离碱。本文所述化合物的某些特别优选的酸加成盐可包括卤化物盐,如可使用盐酸或氢溴酸制备的卤化物盐。相反,可以使用药学上可接受的碱,如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙、三甲胺等,以类似的方式制备本文所述的靶向-cas核酸内切酶/导向rna复合体的碱性盐。在某些实施方式中,碱性盐包括碱金属盐如钠盐和铜盐。为了制备盐形式的碱性药物,抗衡离子的pka优选比药物的pka低至少约2个ph单位。类似地,为了制备盐形式的酸性药物,抗衡离子的pka优选比药物的pka高至少约2个ph单位。这使抗衡离子能将溶液的ph值降至低于phmax的水平以达到盐平台,在该盐平台时盐的溶解度高于游离酸或碱的溶解度。活性药物成分(api)和酸或碱中可电离基团的pka单元之差的一般化规则是为了使质子转移在能量上有利。当api和抗衡离子的pka值没有显着差异时,可能会在水性环境中形成固体复合物,但可能迅速不成比例(例如分解为药物和抗衡离子的单个实体)。在各种实施方式中,抗衡离子是药学上可接受的抗衡离子。合适的阴离子盐形式包括但不限于乙酸盐、苯甲酸盐、苄基酸盐、酒石酸氢盐、溴化物、碳酸盐、氯化物、柠檬酸盐、乙二酸盐、乙二磺酸盐、依托盐(estolate)、甲酸盐、富马酸盐、葡糖酸盐、葡萄糖酸盐、氢溴酸盐、盐酸盐、碘化物、乳酸盐、乳糖醛酸盐、苹果酸盐、马来酸盐、扁桃酸盐、甲磺酸盐、甲基溴、甲基硫酸盐、粘酸盐、萘磺酸盐、硝酸盐、巴莫酸盐(栓酸盐)、磷酸盐和二磷酸盐、水杨酸盐和二水杨酸盐、硬脂酸盐、琥珀酸盐、硫酸盐、酒石酸盐、甲苯磺酸盐、三乙基碘、戊酸盐等,而合适的阳离子盐形式包括但不限于铝、苄星青霉素、钙、乙二胺、赖氨酸、镁、葡甲胺、钾、普鲁卡因、钠、三甲胺、锌等。酯的制备通常涉及在活性剂(例如,本文所述的靶向-cas核酸内切酶/引导向rna复合体)的分子结构内存在的羟基和/或羧基的官能化。在某些实施方式中,酯通常是游离醇基的酰基取代的衍生物,例如衍生自式rcooh的羧酸的部分,其中r是烷基,优选是低级烷基。如果需要,可以通过使用常规的氢解或水解方法将酯转化为游离酸。酰胺也可以使用本领域技术人员已知的技术或在相关文献中描述的技术来制备。例如,酰胺可以使用合适的胺反应物由酯制备,或者它们可以通过与氨或低级烷基胺反应由酸酐或酰氯制备。在各种实施方式中,本文所确定的化合物可用于胃肠外、局部、口服、经鼻(或吸入)、经直肠或局部施用,例如通过气雾剂或经皮施用,用于本文所述的一种或多种病理/适应症的预防和/或治疗(例如,淀粉样变性病)。本文所述的一种或多种活性剂(例如,靶向的cas-内切核酸酶/导向rna复合体)也可以与药学上可接受的载剂(赋形剂)组合以形成药理学组合物。药学上可接受的载剂可以包含一种或多种生理上可接受的化合物,例如起稳定组合物或增加或减少靶向-cas核酸内切酶/导向rna复合体的吸收的作用。生理上可接受的化合物可以包括例如碳水化合物(如葡萄糖、蔗糖或葡聚糖)、抗氧化剂(如抗坏血酸或谷胱甘肽)、螯合剂、低分子量蛋白、保护和摄取增强剂(如脂质)、减少靶向-cas内切核酸酶/导向rna复合体的清除或水解的组合物或者赋形剂或其他稳定剂和/或缓冲剂。其他生理上可接受的化合物,特别是用于制备片剂、胶囊剂、凝胶帽等的其他生理上可接受的化合物包括但不限于粘合剂、稀释剂/填充剂、解分散剂、润滑剂、助悬剂等。在某些实施方式中,为了制备口服剂型(例如,片剂),将例如赋形剂(例如,乳糖、蔗糖、淀粉、甘露醇等)、可选的崩解剂(例如,碳酸钙、羧甲基纤维素钙、羟羟基乙酸淀粉钠、交聚维酮等)、粘合剂(例如,α-淀粉、阿拉伯胶、微晶纤维素、羧甲基纤维素、聚乙烯吡咯烷酮、羟丙基纤维素、环糊精等)以及可选的润滑剂(例如,滑石粉、硬脂酸镁、聚乙二醇6000等)添加到一种或多种活性组分(例如,靶向-cas核酸内切酶/导向rna复合体)中,并压缩所得的组合物。必要时,将压缩产品包衣,例如,用已知的方法掩盖味道或肠溶或缓释。合适的包衣材料包括但不限于乙基纤维素、羟甲基纤维素、聚氧乙二醇、邻苯二甲酸乙酸纤维素、邻苯二甲酸羟丙基甲基纤维素和eudragit(rohm&haas,德国;甲基丙烯酸-丙烯酸共聚物)。其他生理上可接受的化合物包括湿润剂、乳化剂、分散剂或防腐剂,它们对于防止微生物的生长或作用特别有用。各种防腐剂是公知的,包括例如苯酚和抗坏血酸。本领域技术人员将理解,包括生理上可接受的化合物在内的药学上可接受的载剂的选择取决于例如本文所述的靶向-cas核酸内切酶/导向rna复合体的施用途径以及靶向-cas核酸内切酶/导向rna复合体的特定理化特性。在某些实施方式中,赋形剂是无菌的并且通常不含不希望的物质。这些组合物可以通过常规的公知灭菌技术进行灭菌。对于各种口服剂型,不需要片剂和胶囊剂的无菌性。usp/nf标准通常足够。可以根据施用方法以各种单位剂型施用药物组合物。合适的单位剂型包括但不限于粉剂、片剂、丸剂、胶囊剂、锭剂、栓剂、贴剂、鼻喷雾剂、可注射、可植入的缓释制剂、粘膜粘附膜、局部清漆、脂质复合物等。包含本文所述的靶向-cas核酸内切酶/导向rna复合体的药物组合物可以通过常规的混合、溶解、制粒、糖衣锭制作、浸提、乳化、包囊、包埋或冻干方法来制备。可以使用一种或多种生理上可接受的载剂、稀释剂、赋形剂或助剂以常规方式配制药物组合物,其可将本文所述的靶向-cas核酸内切酶/导向rna复合体加工成可药用的制剂。正确的制剂取决于所选的施用途径。全身性制剂包括但不限于设计用于通过注射施用的那些制剂,例如皮下、静脉内、肌内、鞘内或腹腔内注射,以及设计用于经皮、透粘膜口服或肺部施用的那些。对于注射,可以在水溶液中,优选在生理相容的缓冲液(如汉克斯溶液、林格氏溶液或生理盐水缓冲液)中和/或某些乳剂中配制本文所述的靶向-cas核酸内切酶/导向rna复合体。该溶液可以包含配制剂,如悬浮剂、稳定剂和/或分散剂。在某些实施方式中,本文所述的靶向-cas核酸内切酶/导向rna复合体可以以粉末形式提供,以在使用前与合适的载体(例如无菌的无热原水)一起重构。对于透粘膜施用,在制剂中可以使用适合于渗透屏障的渗透剂。这种渗透剂是本领域公知的。对于口服施用,可以通过将靶向-cas核酸内切酶/导向rna复合体与本领域公知的药学上可接受的载剂组合来容易地配制化合物。这类载剂使本文所述的化合物能够配制成片剂、丸剂、糖衣丸、胶囊、液体、凝胶、糖浆、浆液、悬浮液等,以供待治疗的患者口服。对于口服固体制剂,例如粉末剂、胶囊剂和片剂,合适的赋形剂包括:填充剂,诸如糖,如乳糖、蔗糖、甘露醇和山梨糖醇;纤维素制剂,诸如玉米淀粉、小麦淀粉、大米淀粉、马铃薯淀粉、明胶、黄芪胶、甲基纤维素、羟丙基甲基纤维素、羧甲基纤维素钠和/或聚乙烯吡咯烷酮(pvp);制粒剂;和粘合剂。如果需要,可以加入崩解剂,诸如交联的聚乙烯吡咯烷酮、琼脂或者藻酸或其盐如藻酸钠。如果需要,可以使用标准技术将固体剂型包糖衣或肠溶衣。对于口服液体制剂如混悬剂、酏剂和溶液等,合适的载体、赋形剂或稀释剂包括水、乙二醇、油、醇等。此外,可以添加调味剂、防腐剂、着色剂等。对于口腔施用,组合物可以采取以常规方式配制的片剂、锭剂等形式。对于通过吸入施用,使用合适的推进剂,例如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其他合适的气体,可以方便地以加压喷雾器或喷雾器的气溶胶喷雾形式递送本文所述的靶向-cas核酸内切酶/导向rna复合体。在加压气雾剂的情况下,剂量单位可以通过提供阀门以递送计量的量来确定。可以配制用于吸入器或吹入器中的例如明胶的胶囊和药筒,其中含有化合物和合适的粉末基质(如乳糖或淀粉)的粉末混合物。在各种实施方式中,本文所述的靶向-cas核酸内切酶/导向rna复合体可以配制在直肠或阴道组合物中,诸如栓剂或保留灌肠剂,例如含有常规栓剂基质如可可脂或其他甘油酯。除了先前描述的制剂之外,本文所述的靶向-cas核酸内切酶/导向rna复合体也可以被配制成贮库制剂。这样的长效制剂可以通过植入(例如皮下或肌内)或通过肌内注射来施用。因此,例如,化合物可以与合适的聚合或疏水材料(例如,作为在可接受的油中的乳液)或离子交换树脂一起配制,或作为微溶的衍生物例如作为微溶的盐配制。作为另一种选择,可以采用其他药物递送系统。脂质体和乳剂是可用于保护和递送药物活性化合物的递送载体的公知的实例。也可以使用某些有机溶剂,例如二甲基亚砜,但通常代价是更大的毒性。另外,可以使用缓释系统,诸如含有治疗剂的固体聚合物的半透性基质来递送化合物。缓释材料的各种应用已确立并且是本领域技术人员公知的。根据其化学性质,缓释胶囊可能会释放化合物数周,直至100天以上。根据治疗剂的化学性质和生物学稳定性,可以采用其他蛋白质稳定化策略。在某些实施方式中,本文所述的靶向-cas核酸内切酶/导向rna复合体和/或制剂是口服施用的。这可以通过使用片剂、囊片、锭剂、液体等容易地实现。在某些实施方式中,根据本领域技术人员公知的标准方法全身性地(例如口服或以注射剂)施用本文所述的靶向-cas核酸内切酶/导向rna复合体。在其他实施方式中,还可以使用常规的透皮药物递送系统,例如透皮“贴剂”通过皮肤递送试剂,其中,本文所述的化合物和/或制剂通常包含在层压结构中,该层压结构用作药物递送装置以固定在皮肤上。在这种结构中,药物组合物通常包含在上背衬层下方的层或“储库”中。应当理解,在本文中,术语“储库(reservoir)”是指最终可用于递送至皮肤表面的一定量的“活性成分”。因此,例如,“储库”可以在贴剂的背衬层上的粘合剂中或在本领域技术人员已知的多种不同基质制剂中包括活性成分。贴剂可以包含一个容器,也可以包含多个容器。在一个示例性实施方式中,储库包括药学上可接受的接触粘合剂材料的聚合物基质,该聚合物基质用于在药物递送期间将系统固定至皮肤。合适的皮肤接触粘合剂材料的实例包括但不限于聚乙烯、聚硅氧烷、聚异丁烯、聚丙烯酸酯、聚氨酯等。作为另一种选择,含药物的储库和皮肤接触粘合剂以分开且不同的层存在,粘合剂在储库下方,在这种情况下,可以是上述的聚合物基质,也可以是液体或水凝胶储库,也可以采用其他形式。这些用作装置的上表面的层压材料中的背衬层优选充当“贴剂”的主要结构元件,并为装置提供了很大的柔韧性。选择用于背衬层的材料优选基本不渗透至靶向-cas核酸内切酶/导向rna复合体和存在的任何其他材料。在某些实施方式中,本文所述的一种或多种靶向-cas核酸内切酶/导向rna复合体可以以“浓缩物”的形式提供,例如在易于稀释的储存容器中(例如,以预先测量的体积),或在易溶的胶囊中以添加至一定量的水、乙醇、过氧化氢或其他稀释剂。在某些实施方式中,本文所述的靶向-cas核酸内切酶/导向rna复合体适合于口服施用。在各种实施方式中,口服组合物中的化合物可以是包衣的或非包衣的。肠溶衣颗粒的制备例如在美国专利第4,786,505号和第4,853,230号中公开。在各种实施方式中,本文考虑的组合物通常包含有效量的本文所述的各种靶向-cas核酸内切酶/导向rna复合体中的一种或多种,以实现药理作用或治疗上的改善而没有过度的不良副作用。示例性的药理作用或治疗改善包括但不限于减少或停止所治疗病理的一种或多种症状。在各种实施方式中,本文所述的靶向-cas核酸内切酶/导向rna复合体的典型剂量有所不同,并且将取决于各种因素,诸如患者的个体需求以及待诊断和/或治疗的疾病。通常,化合物的日剂量可以在1至1000mg或1至800mg、或1至600mg、或1至500mg或1-400mg的范围内。在一个示例性实施方式中,组合物中存在的上述靶向-cas核酸内切酶/导向rna复合体的标准近似量通常可以为约1至1000mg,更优选为约5至500mg,最优选为约10至100mg。在某些实施方式中,本文所述的靶向-cas核酸内切酶/导向rna复合体仅施用一次,或根据需要追加。在某些实施方式中,本文所述的靶向-cas核酸内切酶/导向rna复合体在一定时期内每天一次,在某些实施方式中,每天施用两次,在某些实施方式中,每天施用3次,在某些实施方式中,每天施用4次、或6或6或7或8次。在某些实施方式中,将活性成分(本文所述的靶向-cas核酸内切酶/导向rna复合体)配制成含有所有活性成分的单一口服剂型。这样的口服制剂包括固体和液体形式。注意,与液体制剂相比,固体制剂通常提供改善的稳定性,并且通常可以提供更好的患者依从性。在一个示例性实施方式中,将本文所述的一种或多种靶向-cas核酸内切酶/导向rna复合体配制成单一固体剂型,诸如单层或多层片剂、悬浮液片剂、泡腾片、粉末剂、小丸、颗粒或包含多个小珠的胶囊以及胶囊或双室胶囊中的胶囊。在另一个实施方式中,本文所述的靶向-cas核酸内切酶/导向rna复合体可以配制成单一液体剂型,诸如含有所有活性成分的悬浮液或在使用前需重构的干悬浮液。在某些实施方式中,为了避免与胃液接触,本文所述的靶向-cas核酸内切酶/导向rna复合体被配制成肠溶衣的缓释颗粒或被非肠溶性时间依赖性释放聚合物包衣的颗粒。合适的ph依赖性肠溶衣聚合物的非限制性实例是:乙酸邻苯二甲酸纤维素、邻苯二甲酸羟丙基甲基纤维素、邻苯二甲酸聚乙酸乙烯酯、甲基丙烯酸共聚物、虫胶、琥珀酸羟丙基甲基纤维素、偏苯三乙醋酸纤维素和任何前述的混合物。例如,合适的可商购肠溶材料以商标eudragitl出售。可以将该涂层喷涂到基材上。示例性的非肠溶包衣的时间依赖性释放聚合物包括,例如,一种或多种通过从胃液吸收水而在胃中溶胀的聚合物,从而增加了颗粒的尺寸以形成厚的包衣层。时间依赖性释放包衣通常具有与外部水性介质的ph无关的侵蚀和/或扩散性能。因此,活性成分通过扩散或在胃中缓慢侵蚀颗粒而从颗粒中缓慢释放。示例性的非肠溶时间依赖性释放包衣例如是:成膜化合物,诸如纤维素衍生物,如甲基纤维素、羟丙基甲基纤维素(hpmc)、羟乙基纤维素和/或丙烯酸类聚合物,其包括品牌聚合物的非肠溶形式。其他成膜材料可单独使用或彼此组合使用或与以上所列材料组合使用。这些其他成膜材料通常包括例如聚(乙烯基吡咯烷酮)、玉米蛋白、聚(乙二醇)、聚(环氧乙烷)、聚(乙烯醇)、聚(乙酸乙烯酯)和乙基纤维素,以及其他药学上可接受的亲水性和疏水性成膜材料。这些成膜材料可使用水作为媒介物或溶剂体系施加到基底芯上。水-醇体系也可以用作成膜的载体。适合于制成本文所述化合物的时间依赖性释放包衣的其他材料包括,例如但不限于,水溶性多糖胶,如角叉菜胶、岩藻依聚糖、哥地胶、黄蓍胶、阿拉伯半乳聚糖、果胶和黄原胶;多糖胶的水溶性盐,诸如海藻酸钠、黄蓍质钠和哥地胶钠;水溶性羟烷基纤维素,其中烷基成员是直链或支链的1至7个碳原子,诸如羟甲基纤维素、羟乙基纤维素和羟丙基纤维素;合成的水溶性纤维素基薄层形成剂,诸如甲基纤维素及其羟烷基甲基纤维素纤维素衍生物如选自由以下组成的组的成员:羟乙基甲基纤维素、羟丙基甲基纤维素和羟丁基甲基纤维素;其他纤维素聚合物,如羧甲基纤维素钠;以及本领域普通技术人员已知的其他材料。可用于此目的的其他薄层形成材料包括但不限于聚(乙烯基吡咯烷酮)、聚乙烯醇、聚环氧乙烷、明胶和聚乙烯吡咯烷酮的混合物、明胶、葡萄糖、糖、聚维酮、共聚维酮、聚(乙烯基吡咯烷酮)-聚(乙酸乙烯酯)共聚物。尽管本文针对人中的用途描述了靶向-cas核酸内切酶/导向rna复合体及其使用方法,但它们也适用于动物,例如兽医用途。因此,某些示例性生物包括但不限于人类、非人灵长类、犬、马、猫、猪、有蹄类、兔等。前述制剂和施用方法旨在是示例性的而非限制性的。应当理解的是,使用本文提供的教导,可以容易地设计其他合适的制剂和给药方式。试剂盒在各种实施方式中,可以在试剂盒中提供本文所述的试剂(本文所述的靶向-cas核酸内切酶/导向rna复合体)。在某些实施方式中,试剂盒包含封闭在多剂量或单剂量容器中的本文所述的靶向-cas核酸内切酶/导向rna复合体。在某些实施方式中,试剂盒可包含可组装使用的组成部分。例如,冻干形式的靶向-cas核酸内切酶/导向rna复合体和合适的稀释剂可以作为分离的组分提供,以在使用前组合。在某些实施方式中,试剂盒可包括本文所述的靶向-cas核酸内切酶/导向rna复合体和用于共同施用的第二治疗剂。活性剂和第二治疗剂可以作为单独的组成部分提供。试剂盒可包括多个容器,每个容器容纳一个或多个单位剂量的靶向-cas核酸内切酶/导向rna复合体。容器优选适于所需的施用方式,包括但不限于例如本文所述的用于口服施用的片剂、凝胶胶囊、缓释胶囊等;用于肠胃外施用的储库产品、预装注射器、安瓿、小瓶等;以及用于局部施用的贴剂、药物垫、乳膏等。在某些实施方式中,试剂盒可进一步包含指导/信息材料。在某些实施方式中,信息材料指示组合物的施用可导致不良反应,其包括但不限于过敏反应,诸如过敏症。信息材料可表明过敏反应可能仅表现为轻度瘙痒性皮疹或可能很严重,包括红皮病、血管炎、过敏反应、史蒂芬-约翰逊综合征等。在某些实施方式中,信息材料可以指示过敏症可能致命,并且可以在将任何异物引入体内时发生。在某些实施方式中,信息材料可以指示这些过敏反应可以表现为荨麻疹或皮疹,并发展为致命的全身反应,并且可以在暴露后不久(例如在10分钟之内)发生。信息材料可以进一步表明过敏反应可以导致受试者出现感觉异常、低血压、喉头水肿、精神状态改变、面部或咽部血管性水肿、气道阻塞、支气管痉挛、荨麻疹和瘙痒、血清病、关节炎、过敏性肾炎、肾小球肾炎、颞关节炎、嗜酸性粒细胞增多症或它们的组合。尽管指导材料通常包括书面或印刷材料,但它们不限于此。本文考虑了能够存储此类指令并将其传达给最终用户的任何介质。此类介质包括但不限于电子存储介质(例如磁盘、磁带、盒带、芯片)、光学介质(例如cdrom)等。此类媒体可以包括提供此类指导材料的互联网站点的地址。在某些实施方式中,试剂盒可包含一种或多种包装材料,例如盒、瓶、管、小瓶、容器、喷雾器、吹入器、静脉内(iv)袋、信封等,以及至少一种包含本文所述的活性剂和包装材料的试剂的单位剂型。在某些实施方式中,试剂盒还包括使用该组合物作为所关注疾病的预防、治疗或改善治疗的说明书。在某些实施方式中,制品可以包含一种或多种包装材料,诸如盒、瓶、管、小瓶、容器、喷雾器、吹入器、静脉内(i.v.)袋、信封等;和包含至少一种单位剂型的试剂的第一组合物,其包含处于包装材料内的一种或多种本文所述的变构bace抑制剂。实施例提供以下实施例以举例说明,但不限制要求保护的发明。实施例1体内相容的细胞特异性靶向和t细胞编辑的发展在该实施例中,我们证明了通过cas9rnp对t细胞的细胞特异性靶向,该cas9rnp与抗cd3的抗体(一种t细胞特异性标志物)相连(参见例如,图10,小图a)。这种靶向将诱导cas9rnp的内吞作用,该cas9rnp可以特异性结合并被t细胞摄取,并随后进行有效的基因组编辑。初步研究t细胞的分子靶向抗体(ab)代表了选择性靶向给定细胞类型的可靠且特征明确的手段。为了允许将ab募集到cas9,我们纯化了融合构建体cas9-pra,其带有可以高亲和力结合ab恒定区(fc)的蛋白a片段(sjodahl(1977)eur.j.biochem.73(2):343-351;choe等(2016)materials9(12):994)。在这个示例性但非限制性的实施方式中,我们选择这种方法以确保cas9:ab之间的1:1关联以使复合体尽可能小。观察到通过核转染(例如,电穿孔)进入原代t细胞的cas9-pra是完全活性的(图10,小图b)。为了辅助流式细胞术实验,如先前所述,用alexafluor488化学标记cas9和cas9pra(rouet等(2018)j.am.chem.soc.140(21):6596-6603)。通过尺寸排阻色谱确认cas9pra和异源igg群体之间形成复合物后,用作为完善表征的抗cd3ab的okt3(作为莫罗单抗治疗性使用)进行了相同的验证(图10,小图c)(kung等(1979)science,206(4416):347-349;kuhn&weiner(2016)immunotherapy,8(8):889-906)。因此,我们建立了两个荧光复合体cas9pra:okt3和cas9pra:igg,以测试okt3将cas9rnp分子靶向t细胞的能力。与异源igg复合的cas9prarnp(阴性对照)相比,对于结合了导向rna(grna)以形成rnp的cas9pra:okt3复合体,测试了其与t细胞特异性结合(例如结合和/或被其摄取)的能力。okt3指导荧光标记的cas9pra结合t细胞的频率要比单独使用cas9pra或结合异源igg的频率高得多(图11,小图a)。在外周血单核细胞(pbmc)中进行了类似的实验,观察到cas9pra:okt3rnp在30分钟后优先与t细胞结合,而与b细胞的结合只有背景水平(图11,小图b)。发现与cas9pra:okt3共定位的t细胞(通过荧光检测)在30分钟时表面tcr的水平大大降低,表明cas9pra:okt3复合体可能被内化(图11,小图c)。这并不意外,因为okt3可以在与cd3结合后引发tcr的内化(kuhn&weiner(2016)immunotherapy,8(8):889-906)。据我们所知,这是分子靶向可用于将基因组编辑酶与混合细胞群中的特定细胞类型优先关联的首个证明。我们选择的cas9pra与ab之间的非共价但亲和力高的结合意味着仅通过混合两种成分即可形成复合体,并在优化平台后提供出色的多功能性。应当理解的是,本文所述的实例和实施方式仅用于示例性目的,并且鉴于其的各种修改或改变对于本领域技术人员是有启示的,并且应包括在本申请的主旨和范围以及所附权利要求的范围之内。本文引用的所有出版物、专利和专利申请出于所有目的通过引用以其整体并入本文。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1