用于CRISPR/CAS介导的基因调控的化学修饰的引导RNA的制作方法

文档序号:13890098阅读:2849来源:国知局

对相关申请的交叉引用

本申请要求2015年4月6日提交的美国临时申请no.62/143,729和2015年5月12日提交的美国临时申请no.62/160,545的优先权,将其全部公开内容通过引用并入本文中用于所有目的。

联邦政府赞助的研究和开发中作出的发明的权利声明

本发明是在美国国立卫生研究院基于合同ey018244和ai097320的政府支持下完成的。政府对本发明有一定的权利。

发明背景

用工程化的核酸酶编辑基因组是一项可用于修饰几乎任何感兴趣的基因组序列的突破性技术(porteus,m.h.&carroll,d.,naturebiotechnology23,967-973(2005))。该技术利用工程化核酸酶产生位点特异性双链断裂(dsb),然后通过内源性细胞修复机制解决dsb。结果可能是特定位点通过诱变性非同源末端连接(nhej)而被突变,从而在突变位点产生插入或缺失(in/del),或者也可能是在外源导入的供体模板的情况下,基因组序列通过同源重组(hr)而被精确改变(hendel等,trendsinbiotechnology33,132-140(2015))。此平台近来增加的一个重要成员是成簇规则间隔的回文重复(crispr)/cas系统,该系统由rna引导的核酸酶(cas)和短引导rna(sgrna)组成jinek,m.etal.,science337,816-821(2012),mali,p.etal.,science339,823-826(2013),cong,l.etal.,science339,819-823(2013),hsuetal.,cell157,1262-1278(2014))。引导rna由两条rna组成,分别称为crisprrna(crrna)和反式激活crrna(tracrrna),二者通常融合在嵌合的单引导rna(sgrna)中。

用于基因组编辑的sgrna可由100个核苷酸(nt)组成,其中5'末端的20nt通过watson-crick碱基配对与靶dna序列杂交,并引导cas内切核酸酶切割靶基因组dna。

crispr/cas系统也已被适用于序列特异性的基因表达控制,例如抑制或激活基因表达。使用缺乏内切核酸酶活性的特定cas9多肽变体,可以阻遏或激活靶基因(qietal.,cell,2013,152(5):1173-7783,perez-pineraetal.,natmethods,2013,10(10):973-976,maederetal.,natmethods,2013,10(10):977-979,gilbertetal.,cell,2014,159:647-661,o’connelletal.,nature,2014,516:263-266)。

不幸的是,使用crispr/cas系统进行基因组编辑和调节基因表达仍然是低效的,尤其是在原代细胞中。因此,本领域仍需要更好的基于crispr/cas系统的组合物和方法,其可用于基因调控,例如基因组编辑,抑制基因表达和激活基因表达。本发明满足了这种需要,并提供了更多的优点。



技术实现要素:

本发明提供用于诱导(例如启动、调变、增强等)细胞中靶核酸的基因调控的方法。本发明包括使用这样的单引导rna(sgrna):它们可在原代细胞中(例如在体外培养用于离体疗法的)或受试者(例如人)体内的细胞中(例如用于体内疗法的)增强靶核酸的基因编辑和/或抑制或激活靶核酸的基因表达。本发明还提供了通过增强精确的基因组编辑以纠正与疾病相关的靶基因中的突变来预防或治疗受试者的疾病的方法。本发明可以与任何细胞类型以及任何适合于核酸酶介导的基因组编辑技术的基因座位一起使用。

在第一方面,本发明提供了用于诱导原代细胞中靶核酸的基因调节的方法,所述方法包括:

向原代细胞中导入:

(a)修饰的单引导rna(sgrna),其包含与靶核酸互补的第一核苷酸序列和与crispr相关蛋白(cas)多肽相互作用的第二核苷酸序列,其中第一核苷酸序列和/或第二核苷酸序列中的一个或多个核苷酸是修饰的核苷酸;和

(b)cas多肽,编码cas多肽的mrna、和/或包含编码cas多肽的核苷酸序列的重组表达载体,

其中修饰的sgrna将cas多肽引导至靶核酸,

其中修饰的sgrna以相对于相应的未修饰的sgrna增强的活性诱导靶核酸的基因调节。

在一个相关的方面,本发明提供了用于增强原代细胞中靶dna的基因组编辑的方法,所述方法包括:

向原代细胞中导入:

(a)修饰的单引导rna(sgrna),其包含与靶核酸互补的第一核苷酸序列和与crispr相关蛋白(cas)多肽相互作用的第二核苷酸序列,其中第一核苷酸序列和/或第二核苷酸序列中的一个或多个核苷酸是修饰的核苷酸;和

(b)cas多肽、编码cas多肽的mrna、和/或包含编码cas多肽的核苷酸序列的重组表达载体,

其中修饰的sgrna将cas多肽引导至靶dna,

其中修饰的sgrna相对于相应的未修饰的sgrna增强靶dna的基因组编辑(例如,藉由修饰的sgrna的增加的稳定性和/或修饰的sgrna对于靶dna的增加的特异性)。

在第二方面中,本发明提供预防或治疗受试者的遗传疾病的方法,所述方法包括:

向受试者施用足够量的修饰的单引导rna(sgrna)以纠正靶基因中与遗传疾病相关的突变,其中修饰的sgrna包含与靶基因互补的第一核苷酸序列和与crispr相关蛋白(cas)多肽相互作用的第二核苷酸序列,并且其中第一核苷酸序列和/或第二核苷酸序列中的一个或多个核苷酸是修饰的核苷酸。

根据下面的详细描述和附图,本发明的其它目的、特征和优点对于本领域技术人员会是明显的。

附图说明

图1a-g显示合成的和化学修饰的sgrna有助于在体外高水平的dna切割和在人类细胞系(k562)中高频率的in/del。图1a显示装载入cas9并结合到其基因组靶位点的il2rgsgrna的二级结构的序列和示意图。具有化学修饰的核苷酸用白旗标记。图1b描绘了在sgrna的化学合成期间掺入的化学修饰的结构(序列见表1)。当存在时,包括:2'-o-甲基(m)、2'-o-甲基、3'硫代磷酸酯(ms)或2'-o-甲基、3'硫代pace(msp)(灰色显示)的化学修饰分别掺入在5'和3'末端的三个末端核苷酸处。图1c显示通过对pcr扩增子的深度测序而测量的诱变性nhej所致的基因破坏。图1d显示了由cas9与合成sgrna的组合诱导的k562细胞中三个基因座il2rg、hbb和ccr5上的hr基因添加。每100万个细胞递送1μg(浅色)或20μg(深色)的合成sgrna。cas9是从质粒(2μg)表达的,对于hr实验,加入了5μg编码gfp的供体质粒。作为阳性对照,使用2μg编码sgrna和cas9蛋白二者的sgrna质粒(灰色条形)。各条形代表平均值+sem,n=3。图1e显示了合成的sgrna介导的靶向切割的特异性,20μgsgrna,如图1c中所示地进行。通过靶定的基因组基因座、以及每个基因的三个生物信息学预测的脱靶基因座的pcr扩增子进行深度测序来测量in/del频率。各条形代表平均值+sem,n=3。图1f显示使用电穿孔将15μgcas9mrna和10μgil2rg合成sgrna时差递送(staggereddelivery)到100万个k562细胞中。条形代表平均in/del频率+sem,n=3,通过对跨越sgrna靶位点的pcr扩增子的tide分析来测量,使用模拟物处理样品作为参考对照。在图1g中,将cas9蛋白与2.5倍摩尔过量的标示的合成il2rgsgrna预先复合,并以标示的量核转染(nucleofect)至1百万个k562细胞中。通过如上的tide分析测量in/del频率,各条形代表平均in/del频率+sem,n=3。

图2a-2c显示化学修饰的sgrna促进原代人t细胞和cd34+造血干细胞和祖细胞(hspc)中的高速率的基因破坏。将100万个原代人t细胞用10μg所标示的合成sgrna、以及15μgcas9mrna或1μgcas9编码质粒(图2a)进行核转染。加入1μg编码sgrna和cas9蛋白二者的质粒用于比较。条形表示三个不同供体的平均in/del频率+sem,n=6,通过对跨越sgrna靶位点的pcr扩增子的tide分析来测量,使用模拟物处理样品作为参考对照。在图2b中,如上所述地对经刺激的t细胞进行核转染,但是用2.5倍摩尔过量的所标示的合成ccr5sgrna与15μgcas9蛋白预复合。in/del频率由上面的tide分析测量。条形代表三个不同的供体的平均in/del频率+sem,n=6。在图2c中,用10μg标示的靶向il2rg或hbb的合成sgrna、以及15μgcas9mrna或1μgcas9质粒核转染500,000个动员的人外周血cd34+hspc。纳入1μg编码sgrna和cas9蛋白二者的sgrna质粒用于比较。条形表示平均in/del频率+sem,n=3,通过t7核酸内切酶切割测定法测量。在图2d中,用15μgcas9mrna和10μg标示的合成ccr5sgrna核转染100万个经刺激的t细胞或动员的人外周血cd34+hspc。当组合使用时,每种sgrna的量是5μg。单sgrna的样品的in/del频率通过如上所述的tide分析测量,两个sgrna的样品的in/del频率通过对克隆的pcr产物测序(参见图18a-b)测量。条形代表平均in/del频率+sem,n=3。

图3显示在体外由化学修饰的sgrna所指导的cas9对dsdna靶标的切割。条形表示用cas9蛋白和sgrna处理的靶dna片段(参见图4)的切割产物的百分比产量。显示了每个sgrna的三次独立合成的平均值±sem。

图4显示在体外由化学修饰的sgrna所指导的cas9对dsdna靶标的切割。在bioanalyzer2200上使用dna7500labchips测定来自dsdna靶标的生物化学切割的切割产物。示出了每个靶标的代表性凝胶,更多的重复包括在图3中绘制的结果中。各样品如下:(l):分子量标准;(1):未修饰的sgrna+靶dna(-cas9模拟物处理),(2):靶dna+cas9蛋白(-sgrna模拟物处理),(3):未修饰的sgrna+靶dna+cas9蛋白,(4):msgrna+靶dna+cas9蛋白,(5):mssgrna+靶dna+cas9蛋白,(6):mspsgrna+靶dna+cas9蛋白。

图5显示了由合成的sgrna介导的靶向切割的特异性。靶标特异性如图1e中那样使用illumina深度测序进行评估,但使用来自图1的样品,用1μgsgrna核转染。通过对来自每个sgrna的三个生物信息学预测的脱靶基因座的pcr扩增子进行深度测序来测量in/del频率。条形代表平均值+sem,n=3,以对数尺度显示。in/del百分比参见表5。

图6显示了在k562细胞中靶向il2rg和cas9mrna的mspsgrna的滴定。测量的in/del频率是三次重复的平均值,值在热图中标示。为了清楚起见,没有标示重复样品(n=3)的sem,但sem都小于测量的标示值的4%。in/del频率是通过对跨越sgrna靶位点的pcr扩增子的tide分析测量的,使用模拟物处理的样品作为参考对照。

图7提供了时差递送sgrna和cas9mrna的示意性实验流程。得出图1g的数据的实验的示意性概述。在标示的时间点用cas9mrna和/或靶向il2rg的sgrna对k562细胞进行核转染。在最后一个组分核转染后72小时提取基因组dna,并通过tide测量in/del频率,使用模拟处理的样品作为参考对照。

图8比较来自不同供应商的cas9蛋白。用与2.5倍摩尔过量的mssgrna预复合过的15μgcas9蛋白质核转染一百万个k562细胞,三天后提取基因组dna,通过tide测量in/del频率,使用模拟处理的样品作为参考对照。条形代表平均值+sem,n=3。

图9a-9b显示靶向切割的特异性由合成的il2rgsgrna和cas9质粒、mrna或蛋白介导。靶标特异性如图1e和图5所示进行评估,使用illumina深度测序并以线性标度(图9a)和对数标度(图9b)显示。用(i)2μgcas9质粒+20μgsgrna,(ii)15μgcas9mrna+10μgsgrna,或(iii)与7.6μgsgrna预先复合的15μgcas9蛋白质(蛋白质:sgrna摩尔比=1:2.5)核转染100万个k562细胞。cas9质粒结果与图1e所示相同。条形代表平均in/del频率+sem,n=3。

图10显示了原代人t细胞中的高rna核转染效率。在刺激后三天,将来自三个不同供体的受刺激的t细胞用gfpmrna核转染。通过流式细胞术在核转染三天后测量gfp的表达。显示核转染细胞(灰色)中的gfp表达相对于模拟转染的细胞(黑色)。

图11显示在t细胞核转染中增加ccr5sgrna和cas9mrna量产生了类似的in/del频率。将受刺激的t细胞用标示量的mspccr5sgrna和cas9mrna进行核转染。通过对跨越sgrna靶位点的pcr扩增子的tide分析来测量in/del频率,并使用模拟处理的样品作为参考对照。显示了平均in/del频率+sem,n=6。

图12显示了cd4+、cd8+和总t细胞群体中的相似的in/del频率。将受刺激的t细胞用ccr5mspsgrna和cas9mrna核转染,随后分选成cd4+和cd8+亚群。in/del频率通过tide测量,并与大群体中的in/del频率进行比较。条形代表一个t细胞供体的平均in/del频率+sem,n=8。

图13显示:原代人t细胞中的in/del频率随时间稳定。将受刺激的t细胞用ccr5mspsgrna和cas9mrna核转染。在标示的时间点从一部分细胞中提取gdna,并通过跨越sgrna靶位点的pcr扩增子的tide分析来测量in/del频率,使用模拟处理的样品作为参考对照。显示了三个不同t细胞供体的平均in/del频率+/-sem,n=6。

图14显示了与cas9质粒相比,用合成的sgrna和cas9mrna核转染的t细胞中较低的细胞死亡频率。将100万个受刺激的t细胞用10μg的标示的合成sgrna和15μgcas9mrna核转染,或用1μgcas9编码质粒核转染。纳入1μg编码ccr5sgrna和cas9蛋白质的质粒用于比较(sgrna质粒)。核转染三天后,细胞用活/死(live/dead)细胞染色进行染色。条形代表三个不同t细胞供体的死细胞的平均百分比+sem,n=6。

图15显示了将合成的sgrna核转染入t细胞后的增殖测定的结果。在第0天将来自两个不同供体的受刺激的t细胞核转染,并且使用celltiterglo测定来监测细胞增殖。为了清楚,没有标出重复实验的sem,但是所有sem均小于所示值的15%。

图16显示未刺激的t细胞中的ccr5破坏。来自三个不同供体的未受刺激的人t细胞在分离当天用mssgrna和cas9mrna进行核转染。核转染后3天提取gdna,并通过tide测量in/del频率,使用模拟处理的样品作为参考对照。条形代表平均值±sem,n=2。

图17显示了动员的pbcd34+hspc中il2rg和hbb的in/del频率。在cd34+hspc核转染后三天,提取基因组dna,并通过t7测定法测量in/del频率。分别显示了il2rg和hbb的三个生物学重复的一个代表性凝胶。+sem,n=2。

图18a-b显示使用两种sgrna在原代人t细胞和cd34+hspc中ccr5基因的高修饰频率。对于来自三个不同供体的受刺激的t细胞及pb动员的cd34+hspc,用'd'和'q'sgrna与cas9mrna一式三份共同核转染。在核转染后三天提取gdna,并使用一对引物pcr扩增ccr5的修饰区,该对引物对未修饰的等位基因可产生2.1kb的扩增子(图18a)。将pcr扩增子亚克隆到用于转化的质粒中,对代表单个等位基因的单个菌落进行测序,与预期的基因组序列参比,并根据等位基因型进行分类(图18b)。

图19显示,在cd34+hspc中,ms修饰的sgrna比未修饰的sgrna表现更好。对于cd34+hspc,用30μgcas9蛋白与2.5倍摩尔过量的标示的合成hbbsgrna的复合物进行核转染。核转染后4天通过tide分析测量indel频率。条形代表三个不同的供体的平均indel频率+sem,n=3。**p<0.01,student'st检验。

图20显示,修饰的sgrna可以用于有效的多重化基因组编辑。将100万个k562细胞用15μgcas9mrna以及5μgccr5、hbb或il2rgms修饰的sgrna,或全部三种sgrna(多重化的)(3x5μg)核转染。在核转染三天后,通过tide分析测量三个基因座中每一个上的indel频率。条形代表平均indel频率+sem,n=3。***p<0.001,n.s.=p≥0.05,student'st检验。

图21显示了使用化学修饰的ccr5sgrna、cas9mrna和ccr5ssodn进行同源重组后跨越ccr5靶位点的pcr产物。

具体实施方式

i.简介

本文提供了用于在体外细胞(例如用于离体疗法的原代细胞)或体内细胞(例如受试者诸如人的器官或组织中的细胞)中基于crispr/cas的基因组编辑和/或基因表达调变的方法。具体而言,本文提供的方法利用化学修饰的单引导rna(sgrna),这些化学修饰的sgrna与相应的未修饰的sgrna相比,在基因调控(例如,基因组编辑、基因表达的抑制、基因表达的激活)过程中具有增强的活性。在某些方面,本发明提供对细胞中的靶核酸进行基因调控的方法,其手段是导入与靶核酸杂交的化学修饰的sgrna及:cas核酸酶(例如cas9多肽)或其变体或片段;或编码cas核酸酶(例如cas9多肽)或其变体或片段的mrna;抑或包含编码cas核酸酶(例如cas9多肽)或其变体或片段的核苷酸序列的重组表达载体。在某些其他方面,本发明提供了预防或治疗受试者的遗传疾病的方法,其手段是施用足够量的化学修饰的sgrna以纠正与疾病相关的基因突变。

ii.一般说明

除非另有说明,否则本发明的实施使用在本领域技术范围内的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组dna的常规技术。参见sambrook,fritschandmaniatis,molecularcloning:alaboratorymanual,2ndedition(1989),currentprotocolsinmolecularbiology(f.m.ausubel,etal.eds.,(1987)),theseriesmethodsinenzymology(academicpress,inc.):pcr2:apracticalapproach(m.j.macpherson,b.d.hamesandg.r.tayloreds.(1995)),harlowandlane,eds.(1988)antibodies,alaboratorymanual,andanimalcellculture(r.i.freshney,ed.(1987))。

不可商购的寡核苷酸可以化学合成,例如,根据由beaucageandcaruthers,tetrahedronlett.22:1859-1862(1981)首次描述的固相亚磷酰胺三酯方法。使用自动合成仪,如vandevanteret.al.,nucleicacidsres.12:6159-6168(1984)中所述。寡核苷酸的纯化使用任何本领域公认的策略进行,例如pearsonandreanier,j.chrom.255:137-149(1983)。

iii.定义

除非特别指出,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。另外,在本发明的实施中可以使用与本文所述的方法或材料相似或等效的任何方法或材料。为了本发明的目的,定义下列术语。

如本文所使用的术语“一”或“该”不仅包括具有一个成员的方面,而且还包括具有多于一个成员的方面。例如,单数形式“一”和“该”包括复数指称,除非上下文另有明确说明。因此,例如,提述“一个细胞”包括多个这样的细胞,并且对“作用剂”的提述包括对本领域技术人员已知的一种或多种作用剂的提述,等等。

术语“原代细胞”是指直接从多细胞生物体分离的细胞。与连续的(肿瘤或人工永生的)细胞系相比,原代细胞通常经历过极少的群体倍增,因此更加能够代表它们所来源的组织的主要功能成分。在一些情况下,原代细胞是已经被分离并立即使用的细胞。在其他情况下,原代细胞不能无限分裂,因此不能在体外长时间培养。

术语“基因组编辑”是指使用一种或多种核酸酶和/或切口酶将dna插入靶dna(例如细胞的基因组)、从靶dna置换、或从靶dna移除的基因工程类型。核酸酶在基因组的期望位置产生特定的双链断裂(dsb),并利用细胞的内源机制,通过同源性指导修复(hdr)(例如同源重组)或通过非同源末端连接(nhej)来修复诱导的断裂。切口酶在基因组中的期望位置产生特定的单链断裂。在一个非限制性实例中,可使用两个切口酶在靶dna的两条相对链上产生两个单链断裂,由此产生平末端或粘性末端。可以将任何合适的核酸酶导入细胞以诱导靶dna序列的基因组编辑,这样的核酸酶包括但不限于crispr相关蛋白(cas)核酸酶、锌指核酸酶(zfn)、转录激活物样效应物核酸酶(talen)、大范围核酸酶、其他内切或外切核酸酶、它们的变体、它们的片段、及上述者的组合。在具体的实施方案中,可以利用本文所述的修饰的单引导rna(sgrna)与cas核酸酶(例如cas9多肽或cas9mrna)组合来“诱导”或“调变”(例如增强)核酸酶介导的靶核酸序列的基因组编辑,例如通过同源性指导修复(hdr)来提高精确基因组编辑的效率。

术语“同源性指导修复”或“hdr”是指细胞中一种准确、精密地修复双链dna断裂的机制,其使用同源模板来引导修复。hdr最常见的形式是同源重组(hr),这是一种基因重组,其中在两个相似或相同的dna分子之间交换核苷酸序列。

术语“非同源末端连接”或“nhej”是指修复双链dna断裂的途径,其中断裂末端直接连接而不需要同源模板。

术语“核酸”、“核苷酸”或“多核苷酸”是指单链、双链或多链形式的脱氧核糖核酸(dna)、核糖核酸(rna)及其聚合物。该术语包括但不限于单链、双链或多链dna或rna、基因组dna、cdna、dna-rna杂合体、或包含嘌呤和/或嘧啶碱基或其他天然的、化学修饰的、生物化学修饰的、非天然的、合成的、或衍生化的核苷酸碱基的聚合物。在一些实施方案中,核酸可以包含dna、rna及其类似物的混合物。除非特别限定,否则该术语涵盖这样的核酸:它们含有天然核苷酸的已知类似物,具有与参照核酸相似的结合特性,并以类似于天然存在的核苷酸的方式被代谢。除非另外指出,否则具体的核酸序列也隐含地涵盖其保守修饰的变体(例如简并密码子取代),等位基因、直向同源物、单核苷酸多态性(snp)和互补序列以及明确指出的序列。具体而言,简并密码子取代可以这样实现:产生这样的序列,其中一个或多个选定(或全部)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代(batzeretal.,nucleicacidres.19:5081(1991);ohtsukaetal.,j.biol.chem.260:2605-2608(1985);和rossolinietal.,mol.cell.probes8:91-98(1994))。术语“核酸”可以与由基因编码的基因、cdna和mrna互换使用。

术语“核苷酸类似物”或“修饰的核苷酸”是指这样的核苷酸,其在核苷的含氮碱基中(例如胞嘧啶(c),胸腺嘧啶(t)或尿嘧啶(u)、腺嘌呤(a)、或鸟嘌呤(g))、核苷的糖部分中(例如,核糖、脱氧核糖、修饰的核糖、修饰的脱氧核糖、六元糖类似物、或开链糖类似物)、或磷酸上具有一个或多个化学修饰(例如取代)。

术语“基因”或“编码多肽的核苷酸序列”意指涉及多肽链的产生的dna区段。dna片段可以包括位于编码区之前和之后、涉及基因产物的转录/翻译和转录/翻译的调控的区域(前导区和尾随区),以及各个编码区段(外显子)之间的间插序列(内含子))。

术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,是指氨基酸残基的聚合物。这些术语适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人造化学模拟物的氨基酸聚合物,以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。如本文所用的,这些术语涵盖任何长度的氨基酸链,包括全长蛋白质,其中氨基酸残基通过共价肽键连接。

术语“变体”是指生物体、菌株、基因、多核苷酸、多肽或特征的与自然界中出现的形式不同的形式。

术语“互补性”是指核酸与另一核酸序列通过传统的watson-crick型或其他非传统类型形成氢键的能力。百分比互补性表示某一核酸分子中可与第二个核酸序列形成氢键(例如watson-crick碱基配对)的残基数的百分比(例如、10个中有5、6、7、8、9、10个分别为50%、60%、70%、80%、90%、100%互补)。“完全互补”是指某一核酸序列的所有连续残基将与第二个核酸序列中相同数目的连续残基氢键键合。如本文所用,“基本上互补”是指在8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、35个、40个、45个、50个或更多个核苷酸的区域上至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者指在严格条件下杂交的两个核酸。

用于杂交的术语“严格条件”是指这样的条件,在该条件下与靶序列具有互补性的核酸绝大部分与靶序列杂交,并且基本上不与非靶序列杂交。严格的条件通常是依赖于序列的,并且取决于许多因素而变化。通常,序列越长,序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例详细描述于tijssen(1993),laboratorytechniquesinbiochemistryandmolecularbiology-hybridizationwithnucleicacidprobes,第一部分第二章“overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassay”,elsevier,ny

术语“杂交”是指其中一个或多个多核苷酸反应形成通过核苷酸残基碱基之间的氢键稳定化的复合物的反应。氢键键合可以通过watsoncrick碱基配对,hoogstein结合、或任何其它序列特异性方式发生。所述复合物可以包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、自我杂交的单链、或它们的任何组合。

“重组表达载体”是重组产生或合成产生的核酸构建体,其具有允许特定多核苷酸序列在宿主细胞中转录的一系列特定的核酸元件。表达载体可以是质粒、病毒基因组、或核酸片段的一部分。通常,表达载体包括待转录的多核苷酸及与之可操作地连接的启动子。“可操作地连接”在本文中是指两个或更多个遗传元件,如多核苷酸编码序列和启动子,被放置在一定的相对位置,从而允许所述元件正常地发挥生物功能,例如启动子引导编码序列的转录。术语“启动子”在本文中用于指引导核酸转录的一组核酸控制序列。如本文所用的,启动子包括转录起始位点附近的必要核酸序列,例如就聚合酶ii型启动子而言是tata元件。启动子还任选地包含远处的增强子或阻遏子元件,它们可以位于距转录起始位点多达几千个碱基对处。其它可以存在于表达载体中的元件包括可增强转录的元件(例如,增强子)和可终止转录的元件(例如,终止子),以及可赋予从该表达载体产生的重组蛋白一定的结合亲和力或抗原性的元件。

“重组(的)”是指遗传修饰的多核苷酸、多肽、细胞、组织或生物体。例如,重组多核苷酸(或重组多核苷酸的拷贝或互补物)是使用众所周知的方法操作过的重组多核苷酸。包含与第二多核苷酸(例如,编码序列)可操作连接的启动子的重组表达盒可以包括作为人为操作的结果相对于第二多核苷酸为异源的启动子(例如,通过sambrook等,molecularcloning-alaboratorymanual,coldspringharborlaboratory,coldspringharbor,newyork,(1989)或currentprotocolsinmolecularbiologyvolume1-3,johnwiley&sons,inc。(1994-1998))。重组表达盒(或表达载体)通常包含天然不存在的多核苷酸组合。例如,人工操纵的限制性位点或质粒载体序列可以侧翼于启动子或者将启动子与其他序列分开。重组蛋白质是由重组多核苷酸表达的蛋白质;重组细胞、重组组织和重组生物体是包含重组序列(多核苷酸和/或多肽)的细胞、组织和生物体。

术语“单核苷酸多态性”或“snp”是指多核苷酸内(包括等位基因内)单个核苷酸的改变。这可以包括一个核苷酸取代另一个核苷酸,以及单个核苷酸的缺失或插入。最典型的是,snp是双等位标记(biallelicmarkers),尽管三等位和四等位标记也可以存在。举一非限制性实例,包含snpa\c的核酸分子在多态性位置上可以包含c或a。

当提到细胞培养物本身或者细胞培养过程时,术语“培养”,“培育”、“维持”,“扩增”等可以互换使用,以表示将细胞(例如,原代细胞)维持在其正常环境之外的受控条件下,例如在适于存活的条件下。培养的细胞被允许存活,且培养可导致细胞生长、停滞、分化或分裂。该术语并不暗示着培养中的所有细胞都存活、成长或分裂,因为有些细胞会自然死亡或衰老。通常将细胞培养在培养基中,培养基在培养过程中可以更换。

术语“受试者”、“患者”、和“个体”在本文中可互换地使用,包括人或动物。例如,动物受试者可以是哺乳动物、灵长类动物(例如猴),家畜(例如马,牛,绵羊,猪或山羊),伴侣动物(例如狗,猫),实验室试验动物(例如小鼠,大鼠,豚鼠,鸟),具有兽医意义的动物或具有经济意义的动物。

如本文所用,术语“施用”包括口服施用、局部接触、作为栓剂施用、静脉内施用、腹膜内施用、肌内施用、病灶内施用、鞘内施用、鼻内施用或皮下施用给受试者。施用可通过任何途径,包括肠胃外和透粘膜(例如,口腔含服、舌下、腭、齿龈、鼻、阴道、直肠或透皮)。肠胃外施用包括例如静脉内、肌内、小动脉内、皮内、皮下、腹膜内、心室内和颅内。其他递送模式包括但不限于使用脂质体制剂、静脉内输注、透皮贴剂等

术语“治疗”是指获得有益的或期望的结果,包括但不限于治疗效益和/或预防效益的方法。治疗效益是指被治疗一种或多种疾病、病症或状况的任何治疗相关的改善或影响。为了获得预防效益,可将组合物施用给有发生特定疾病、病症或状况的风险的受试者,或施用给报告有疾病的一种或多种生理症状的受试者,即使疾病、病症或状况可能还没有表现出来。

术语“有效量”或“足够量”是指作用剂(例如,cas核酸酶,修饰的单引导rna等)的足以实现有益的或期望的结果的量。治疗有效量可根据以下一项或多项而变化:正在治疗的受试者和疾病状况、受试者的体重和年龄、疾病状况的严重程度、施用方式等,这些可容易地由本领域的普通技术人员确定。具体的量可以随以下的一种或多种因素而变化:所选择的具体药剂、靶细胞类型、受试者中靶细胞的位置、所遵循的给药方案、是否与其它作用剂联合施用、施用时机、以及运载它的物理投递系统。

术语“药学上可接受的载体”是指有助于向细胞、生物体或受试者施用作用剂(例如,cas核酸酶,修饰的单引导rna等)的物质。“药学上可接受的载体”指可包含在组合物或制剂中并且不会对患者造成显著的不利毒理学作用的载体或赋形剂。药学上可接受的载体的非限制性实例包括水、nacl、生理盐水溶液、乳酸林格氏液、生理蔗糖(normalsucrose)、生理葡萄糖(normalglucose)、粘合剂、填充剂、崩解剂、润滑剂、包衣、甜味剂、香味剂和着色剂等。本领域技术人员将认识到,其他药物载体可用于本发明。

就crispr系统的组分而言,术语“增加稳定性”是指稳定crispr系统的任何分子组分的结构的修饰。该术语包括减少、抑制、减小、或降低crispr系统的任何分子组分的降解的修饰。

就crispr系统的组分而言,术语“增加特异性”是指增加crispr系统的任何分子组分的特异性活性(例如,中靶(on-target)活性)的修饰。该术语包括减少、抑制、减小、或降低crispr系统的任何分子组分的非特异性活性(例如,脱靶(off-target)活性)的修饰。

就crispr系统的组分而言,术语“降低毒性”是指减少、抑制、减小、或降低crispr系统的任何分子组分对细胞、生物体、受试者等的毒性作用的修饰。

就crispr系统的组分而言,同时在基因调控的语境下,术语“增强的活性”是指诱导、调变、调控或控制基因组编辑和/或基因表达的效率和/或频率的增加或改善。

与参考数值相关的术语“约”可以包括从该值加上或减去10%的值的范围。例如、“约10”的量包括从9到11的量、包括参考数字9、10和11在内。与参考数值相关的术语“约”还可以包括从该值加上或减去10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的值的范围。

iv.实施方案的说明

本发明提供诱导细胞中靶核酸的基因调控的方法。本发明包括使用这样的修饰的单引导rna(sgrna):其可增强原代细胞中(例如体外培养用于离体疗法)、或者受试者诸如人体中的细胞中(例如用于体内治疗)靶核酸的基因组编辑和/或抑制或激活靶核酸的基因表达。本发明还提供了通过增强精确的基因组编辑以纠正与疾病相关的靶基因中的突变来预防或治疗受试者的疾病的方法。本发明可以用于任何细胞类型以及任何适合于核酸酶介导的基因组编辑技术的基因座位。

在第一方面,本发明提供用于诱导(例如启动、调变、增强等)原代细胞中靶核酸的基因调控的方法,所述方法包括:

向原代细胞中导入:

(a)修饰的单引导rna(sgrna),其包含与靶核酸互补的第一核苷酸序列和与crispr相关蛋白(cas)多肽相互作用的第二核苷酸序列,其中第一核苷酸序列和/或第二核苷酸序列的一个或多个核苷酸是修饰的核苷酸;和

(b)cas多肽、编码cas多肽的mrna、和/或包含编码cas多肽的核苷酸序列的重组表达载体,

其中修饰的sgrna将cas多肽引导至靶核酸,

其中修饰的sgrna以相对于相应的未修饰sgrna增强的活性诱导靶核酸的基因调控。

在一些实施方案中,所述增强的活性包括修饰的sgrna的稳定性增加,和/或修饰的sgrna对靶核酸的特异性增加。

在一些实施方案中,靶核酸包括靶dna或靶rna。靶核酸的基因调控涵盖任何被细胞用来增加或减少靶核酸的特定基因产物(例如蛋白质或rna)的产生的机制,包括靶核酸的基因组编辑或靶核酸的基因表达的调变(例如,抑制或活化)。在一些情况下,基因调控包括靶dna的基因组编辑。基因组编辑可以是目标dna的同源性指导修复(hdr)或非同源末端连接(nhej)。在其他情况下,基因调控包括使用核酸内切酶缺陷型cas多肽调变(例如抑制或激活)靶dna或靶rna的基因表达。

在一些实施方案中,该方法进一步包括将重组供体修复模板导入到原代细胞中。在某些情况下,重组供体修复模板包括两个核苷酸序列,它们包含靶dna的两个非重叠的同源部分,其中这些核苷酸序列位于对应于要进行基因组编辑的靶dna的核苷酸序列的5'和3'端。在其它情况下,重组供体修复模板包含合成单链寡聚脱氧核苷酸(ssodn)模板,所述模板包含编码修饰单核苷酸多态性(snp)的突变的核苷酸序列和包含两个非重叠的同源部分的两个核苷酸序列靶dna,其中核苷酸序列位于编码突变的核苷酸序列的5'和3'端。

在一些实施方案中,在将修饰的sgrna和cas多肽导入原代细胞之前,从多细胞生物中分离原代细胞。多细胞生物可以是植物、多细胞原生生物、多细胞真菌或动物如哺乳动物(例如人)。在某些情况下,原代细胞选自干细胞、免疫细胞及其组合。干细胞的非限制性实例包括造血干细胞和祖细胞(hspc),如cd34+hspc、间充质干细胞、神经干细胞、器官干细胞及其组合。免疫细胞的非限制性实例包括t细胞(例如cd3+t细胞,cd4+t细胞,cd8+t细胞,肿瘤浸润细胞(til),记忆t细胞,记忆干t细胞,效应t细胞)、天然杀伤细胞、单核细胞、外周血单个核细胞(pbmc)、外周血淋巴细胞(pbl)及其组合。在其他实施方案中,在将修饰的sgrna和cas多肽导入原代细胞后,将原代细胞或其后代(例如衍生自原代细胞的细胞)返回(例如通过任何可接受的递送系统和递送途径施用给)多细胞生物体(例如人)。

在一些实施方案中,原代细胞包含原代细胞群体。在一些情况下,修饰的sgrna在原代细胞群体的至少约5%,10%,15%,20%,25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%或95%中诱导出靶核酸的基因调控。在其他情况下,原代细胞群体包含至少约10、102、103、104、105、106、107、108或109个原代细胞。在某些情况下,基因调控包括原代细胞群体中靶dna的基因组编辑(例如hdr或nhej)。在某些其他情况下,基因调控包括使用核酸内切酶缺陷型cas多肽调变(例如抑制或激活)原代细胞群体中靶dna或靶rna的基因表达。作为非限制性实例,在将修饰的sgrna与cas多肽(例如,作为核糖核蛋白(rnp)复合物)或编码cas多肽的mrna一道导入原代t细胞后,修饰的sgrna可以原代t细胞群体的至少约30%、35%、40%、45%、50%、55%或60%中诱导hdr(例如in/del频率)。作为另一个非限制性实例,在将修饰的sgrna与cas多肽(例如,作为rnp复合物)或编码cas多肽的mrna一道导入原代造血干细胞和祖细胞(hspc)之后,修饰的sgrna可以在原代hspc群体的至少约10%、15%、20%、25%、30%、35%、40%、45%、50%、55%或60%中诱导hdr(例如in/del频率)。

在一些实施方案中,修饰的sgrna的第一核苷酸序列和/或第二核苷酸序列中的一个或多个修饰的核苷酸在核糖基团、磷酸基团、核碱基或其组合中包含修饰。核糖基团中的修饰可以是在核糖基团的2'位处的修饰。在一些情况下,核糖基的2'位的修饰下组:2'-o-甲基、2'-氟、2'-脱氧、2'-o-(2-甲氧基乙基)。磷酸基团中的修饰可以是硫代磷酸酯修饰。

在具体的实施方案中,修饰的sgrna的第一核苷酸序列和/或第二核苷酸序列中的一个或多个修饰的核苷酸包括:2'-o-甲基(m)核苷酸、2'-o-甲基3'-硫代磷酸酯(ms)核苷酸、2'-o-甲基3'-硫代pace(msp)核苷酸、或其组合。在一些情况下,修饰的sgrna在第一核苷酸序列和/或第二核苷酸序列中包含一个或多个ms核苷酸。在一些情况下,修饰的sgrna在第一核苷酸序列和/或第二核苷酸序列中包含一个或多个msp核苷酸。在一些情况下,修饰的sgrna在第一核苷酸序列和/或第二核苷酸序列中包含一个或多个ms核苷酸和一个或多个msp核苷酸。在一些情况下,修饰的sgrna在第一核苷酸序列和/或第二核苷酸序列中不包含m核苷酸。在一些情况下,修饰的sgrna仅包含ms核苷酸和/或msp核苷酸作为第一核苷酸序列和/或第二核苷酸序列中的修饰的核苷酸。在其他情况下,修饰的sgrna在第一核苷酸序列和/或第二核苷酸序列中包含一个或多个ms核苷酸和/或一个或多个msp核苷酸,并且可以在第一核苷酸序列和/或第二核苷酸序列中进一步包含一个或多个m个核苷酸。

在一些实施方案中,修饰的sgrna的第一核苷酸序列长约20个核苷酸。在一些情况下,第一核苷酸序列中的至少2、3、4、5、6、7、8、9、10个或更多个核苷酸是修饰的核苷酸。在某些情况下,第一核苷酸序列(例如,约20个核苷酸长的第一核苷酸序列)中约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸是修饰的核苷酸。在其他情况下,第一核苷酸序列(例如,约20个核苷酸长的第一核苷酸序列)中的所有核苷酸均是修饰的核苷酸。在一些情况下,修饰的核苷酸位于第一核苷酸序列的5'末端(例如5'末端的末端核苷酸)或5'末端附近(例如距5'末端1、2、3、4或5个核苷酸以内的核苷酸)和/或第一核苷酸序列内的内部位置。在其他情况下,第一核苷酸序列中约10%至约30%的核苷酸是修饰的核苷酸。

在一些实施方案中,修饰的sgrna的第二核苷酸序列的长度为约80个核苷酸。在一些情况下,第二核苷酸序列中的至少2、3、4、5、6、7、8、9、10个或更多个核苷酸是修饰的核苷酸。在某些情况下,第二核苷酸序列(例如,约80个核苷酸长的第二核苷酸序列)中的大约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79或80个核苷酸是修饰的核苷酸。在其它情况下,第二核苷酸序列(例如约80个核苷酸长的第二核苷酸序列)中的所有核苷酸均是修饰的核苷酸。在一些情况下,修饰的核苷酸位于第二核苷酸序列的3'末端(例如,3'末端的末端核苷酸)或3'末端附近(例如距3'末端1、2、3、4或5个核苷酸以内)和/或第二核苷酸序列内的内部位置。在其他情况下,第二核苷酸序列中约1%至约10%的核苷酸是修饰的核苷酸。

在某些实施方案中,修饰的sgrna自第一核苷酸序列的5'端(例如5'末端的末端核苷酸)或5'端附近(例如,距5'-末端的末端核苷酸1、2、3、4或5个核苷酸内)开始包含一个,两个或三个连续或非连续的修饰核苷酸,并且自第二核苷酸序列的3'末端(例如3'末端的末端核苷酸)或3'末端附近(例如距3'末端1、2、3、4或5个核苷酸内)开始包含一个,两个或三个连续或非连续的修饰的核苷酸。

在一些情况下,修饰的sgrna在第一核苷酸序列的5'末端(例如5'末端的末端核苷酸)或5'末端附近(例如距5'末端1、2、3、4或5个核苷酸内)包含一个修饰的核苷酸,并在第二核苷酸序列的3'末端(例如3'末端的末端核苷酸)或3'末端附近(例如距3'末端1、2、3、4或5个核苷酸内)包含一个修饰的核苷酸。

在其它情况下,在其它情况下,修饰的sgrna在第一核苷酸序列的5'末端(例如5'末端的末端核苷酸)或5'末端附近(例如距5'末端1、2、3、4或5个核苷酸内)包含两个连续的或非连续的修饰的核苷酸,并在第二核苷酸序列的3'末端(例如3'末端的末端核苷酸)或3'末端附近(例如距3'末端1、2、3、4或5个核苷酸内)包含两个连续的或非连续的修饰的核苷酸。。

在又一些情况下,在其它情况下,修饰的sgrna在第一核苷酸序列的5'末端(例如5'末端的末端核苷酸)或5'末端附近(例如距5'末端1、2、3、4或5个核苷酸内)包含三个连续的或非连续的修饰的核苷酸,并在第二核苷酸序列的3'末端(例如3'末端的末端核苷酸)或3'末端附近(例如距3'末端1、2、3、4或5个核苷酸内)包含三个连续的或非连续的修饰的核苷酸。

在具体的实施方案中,修饰的sgrna在第一核苷酸序列的5'-末端包含三个连续的修饰的核苷酸,在第二核苷酸序列的3'-末端包含三个连续的修饰的核苷酸。

在一些实施方案中,修饰的sgrna是化学合成的。在其他实施方案中,用于诱导基因调控的方法包括使用多个修饰的sgrna对单个靶核酸序列或不同靶核酸序列进行多重化基因调控(例如,基因组编辑或调变基因表达)。在具体的实施方案中,相对于使用相应的未修饰的sgrna,多重化基因调控更有效和/或一致。在某些情况下,所述多个修饰的sgrna包含至少2、3、4、5、10、15、20个,或更多个不同的修饰的sgrna,其中每个修饰的sgrna针对不同的靶核酸。在其它情况下,所述多个修饰的sgrna包含至少2、3、4、5、10、15、20个,或更多个不同的修饰的sgrna,其中每个修饰的sgrna针对相同的靶核酸。

在某些实施方案中,cas多肽是cas多肽变体或cas多肽片段。在具体的实施方案中,cas多肽是cas9多肽、其变体或其片段。在其他实施方案中,导入原代细胞的步骤包括电穿孔(例如,通过核转染)原代细胞。

在第二方面,本发明提供了用于预防或治疗受试者中的遗传疾病的方法,所述方法包括:

向受试者施用足够量的修饰的单引导rna(sgrna)以纠正与遗传疾病相关的靶基因中的突变,其中修饰的sgrna包含与靶基因互补的第一核苷酸序列和与crispr相关蛋白(cas)多肽相互作用的第二核苷酸序列,并且其中第一核苷酸序列和/或第二核苷酸序列中的一个或多个核苷酸是修饰的核苷酸。

在一些实施方案中、所述遗传疾病选自下组:x连锁严重联合免疫缺陷、镰状细胞性贫血、地中海贫血、血友病、瘤形成、癌症、年龄相关性黄斑变性、精神分裂症、三核苷酸重复疾病、x染色体易裂症、朊病毒相关病症、肌萎缩性侧索硬化、药物成瘾、自闭症、阿尔茨海默病、帕金森病、囊性纤维化、血液和凝血疾病或病症、炎症、免疫相关疾病或病症、代谢疾病、肝脏疾病和病症、肾脏疾病和病症、肌肉/骨骼疾病和病症、神经和神经元疾病和病症、心血管疾病和病症、肺部疾病和病症、眼部疾病和病症以及病毒感染(例如hiv感染)。

在一些实施方案中,所述方法进一步包括向受试者施用cas多肽、编码cas多肽的mrna、和/或包含编码cas多肽的核苷酸序列的重组表达载体。

在一些实施方案中,该方法进一步包括向受试者施用重组供体修复模板。在某些情况下,重组供体修复模板包含两个核苷酸序列,所述核苷酸序列包含靶基因的两个非重叠的同源部分,其中所述核苷酸序列位于对应于要进行基因组编辑的靶基因的核苷酸序列的5'和3'端。在其他情况下,重组供体修复模板包含合成的单链寡聚脱氧核苷酸(ssodn)模板,所述模板包含:编码用于矫正靶基因中的单核苷酸多态性(snp)的突变的核苷酸序列,以及包含靶基因的两个非重叠同源部分的两个核苷酸序列,其中这两个核苷酸序列位于前述编码突变的核苷酸序列的5'和3'端。

在某些实施方案中,与施用相应的未修饰的sgrna相比,施用修饰的sgrna增强cas多肽矫正靶基因中的突变的作用。上文描述了与用于在受试者中预防或治疗遗传疾病的方法中使用的修饰的sgrna有关的非限制性实施方案。

在一些实施方案中,将修饰的sgrna、cas多肽和/或重组供体修复模板与药学上可接受的载体一起施用给受试者。

在一些实施方案中,通过选自下组的递送系统将修饰的sgrna、cas多肽和/或重组供体修复模板给予受试者:纳米颗粒、脂质体、胶束、病毒微体(virosome)、核酸复合物、以及它们的组合。在某些情况下,核酸复合物包含与cas多肽复合的修饰的sgrna。

在一些实施方案中、通过选自下组的递送途径将修饰的sgrna、cas多肽和/或重组供体修复模板给予受试者:口服、静脉内、腹膜内、肌肉内、皮内、皮下、肌内、皮内、肌内、皮下、肌肉内、小动脉、脑室内、颅内、病灶内、鞘内、局部、经粘膜、鼻内及其组合。

预期本文所述的化学修饰的sgrna可与任何crispr相关技术一起使用,这些技术包括但不限于:用于抑制基因表达的crispri、用于激活基因表达的crispra、用于基因组座位动态可视化的crispr成像工具、以及crispr介导的rna识别和切割。在一些情况下,sgrna可用于将小分子或蛋白质成像和/或递送到体外细胞或体内细胞中。因此,sgrna可以用于研究和治疗应用。

a.crispr/cas系统

基因组修饰的crispr/cas系统包括:cas核酸酶(例如,cas9核酸酶)或其变体或片段;靶向dna的rna(例如修饰的sgrna),其含有将cas9核酸酶靶向到靶基因组dna的引导序列;以及与cas核酸酶相互作用的支架序列(例如tracrrna),以及任选的供体修复模板。在一些情况下,可以使用包含一个或多个以下突变的cas核酸酶变体,例如cas9突变体:d10a、h840a、d839a和h863a;或者可以使用cas9切口酶。在其他情况下,可以使用具有期望特性(例如,能够产生单链或双链断裂和/或调变基因表达)的cas核酸酶或其变体的片段。供体修复模板可以包括编码报道多肽(例如荧光蛋白或抗生素抗性标记)的核苷酸序列,以及与靶dna同源且位于基因修饰位点侧翼的同源臂。或者,供体修复模板可以是单链寡聚脱氧核苷酸(ssodn)。

1.cas核酸酶及其变体

crispr(成簇规则间隔短回文重复)/cas(crispr相关蛋白)核酸酶系统是一种基于细菌系统的工程化核酸酶系统,可用于基因组工程。它是以许多细菌和古菌的适应性免疫应答一部分为基础的。当病毒或质粒侵入细菌时,侵入者的dna的区段被“免疫”应答转化为crisprrna(crrna)。然后,crrna通过具有部分互补性的区域与另一种类型的称为tracrrna的rna缔合,以将cas(例如cas9)核酸酶引导至靶dna中与crrna同源的区域(称为“原型间隔子”(protospacer))。cas(例如cas9)核酸酶切割dna以在双链断裂处产生平端,切割的部位由crrna转录物内包含的20个核苷酸的引导序列所规定。cas(例如cas9)核酸酶的位点特异性dna识别和切割需要crrna和tracrrna二者。这个系统现在已经被改造,使得crrna和tracrrna可以组合成一个分子(“单引导rna”或“sgrna”),并且单引导rna的crrna等价部分可以被改造,从而可以引导cas(例如cas9)核酸酶靶向任何期望的序列(参见例如jineketal.(2012)science,337:816-821;jineketal.(2013)elife,2:e00471;segal(2013)elife,2:e00563))。因此,crispr/cas系统可以被改造成在细胞基因组中的期望靶标处产生双链断裂,并利用细胞的内源性机制通过同源性指导修复(hdr)或非同源末端连接(nhej)来修复诱导的断裂。

在一些实施方案中,所述cas核酸酶具有dna切割活性。cas核酸酶可以指导在靶dna序列中的某个位置的切割一条或两条链。例如,cas核酸酶可以是具有一个或多个失活的催化结构域的切口酶,其切割靶dna序列的单链。

cas核酸酶的非限制性实例包括cas1、cas1b、cas2、cas3、cas4、cas5、cas6、cas7、cas8、cas9(又称为csn1和csx12)、cas10、csy1、csy2、csy3、cse1、cse2、csc1、csc2、csa5、csn2、csm2、csm3、csm4、csm5、csm6、cmr1、cmr3、cmr4、cmr5、cmr6、csb1、csb2、csb3、csx17、csx14、csx10、csx16、csax、csx3、csx1、csx15、csf1、csf2、csf3、csf4、其同源物,其变体,其片段,其突变体、及其衍生物。有三种主要类型的cas核酸酶(i型、ii型、iii型)和10种亚型,包括5种i型蛋白、3种ii型蛋白、和2种iii型蛋白(参见例如hochstrasseranddoudna,trendsbiochemsci,2015:40(1):58-66)。ii型cas核酸酶包括cas1、cas2、csn2和cas9。这些cas核酸酶是本领域技术人员已知的。例如,酿脓链球菌野生型cas9多肽的氨基酸序列在例如nbciref.seq.no.np_269215中列出,而嗜热链球菌野生型cas9多肽的氨基酸序列在例如nbciref.seq.no.wp_011681470中列出。可用于本发明的crispr相关核酸内切酶在例如美国申请公开号2014/0068797、2014/0302563和2014/0356959中公开。

cas核酸酶,例如,cas9多肽,可以衍生自多种细菌物种,包括但不限于:非典型韦荣氏球菌(veillonellaatypical),具核梭杆菌(fusobacteriumnucleatum),龈沟产线菌(filifactoralocis),solobacteriummoorei,灵巧粪球菌(coprococcuscatus),齿垢密螺旋体(treponemadenticola),peptoniphilusduerdenii,catenibacteriummitsuokai,变异链球菌(streptococcusmutans),无毒李斯特菌(listeriainnocua),伪中间葡萄球菌(staphylococcuspseudintermedius),肠氨基酸球菌(acidaminococcusintestine),树胶欧尔森氏菌(olsenellauli),北原氏酒球菌(oenococcuskitaharae),双歧双歧杆菌(bifidobacteriumbifidum),鼠李糖乳杆菌(lactobacillusrhamnosus),格氏乳杆菌(lactobacillusgasseri),大芬戈尔德菌(finegoldiamagna),运动支原体(mycoplasmamobile),鸡毒支原体(mycoplasmagallisepticum),绵羊肺炎支原体(mycoplasmaovipneumoniae),犬支原体(mycoplasmacanis),滑液支原体(mycoplasmasynoviae),直肠真杆菌(eubacteriumrectale),嗜热链球菌(streptococcusthermophilus),细长真杆菌(eubacteriumdolichum),棒状乳杆菌扭曲亚种(lactobacilluscoryniformissubsp.torquens),多养型泥杆菌(ilyobacterpolytropus),白色瘤胃球菌(ruminococcusalbus),akkermansiamuciniphila,解纤维热酸菌(acidothermuscellulolyticus),长双歧杆菌(bifidobacteriumlongum),齿双歧杆菌(bifidobacteriumdentium),白喉棒状杆菌(corynebacteriumdiphtheria),elusimicrobiumminutum,卤水硝酸盐裂解菌(nitratifractorsalsuginis),sphaerochaetaglobus,产琥珀酸丝状杆菌产琥珀酸亚种(fibrobactersuccinogenessubsp.succinogenes),脆弱拟杆菌(bacteroidesfragilis),黄褐二氧化碳嗜纤维菌(capnocytophagaochracea),沼泽红假单胞菌(rhodopseudomonaspalustris),彩虹普雷沃菌(prevotellamicans),栖瘤胃普雷沃菌(prevotellaruminicola),柱状黄杆菌(flavobacteriumcolumnare),少食氨基单胞菌(aminomonaspaucivorans),深红红螺菌(rhodospirillumrubrum),candidatuspuniceispirillummarinum,verminephrobactereiseniae,蒲桃雷尔氏菌(ralstoniasyzygii),恒雄芝氏沟鞭藻玫瑰杆菌(dinoroseobactershibae),固氮螺菌属(azospirillum),汉堡硝化杆菌(nitrobacterhamburgensis),慢生根瘤菌属(bradyrhizobium),产琥珀酸沃林氏菌(wolinellasuccinogenes),空肠弯曲杆菌空肠亚种(campylobacterjejunisubsp.jejuni),伶鼬鼠螺杆菌(helicobactermustelae),蜡样芽孢杆菌(bacilluscereus),acidovoraxebreus,产气荚膜梭菌(clostridiumperfringens),食清洁剂细小棒菌(parvibaculumlavamentivorans),肠道罗斯拜瑞氏菌(roseburiaintestinalis),脑膜炎奈瑟氏菌(neisseriameningitidis),多杀巴斯德菌多杀亚种(pasteurellamultocidasubsp.multocida),华德萨特菌(sutterellawadsworthensis),变形菌(proteobacterium),嗜肺军团菌(legionellapneumophila),parasutterellaexcrementihominis,产琥珀酸沃廉氏菌(wolinellasuccinogenes),和新泽西弗朗西斯菌(francisellanovicida)。

“cas9”是指rna引导的、结合双链dna的核酸酶蛋白或切口酶蛋白。野生型cas9核酸酶具有切割不同dna链的两个功能结构域,例如ruvc和hnh。当两个功能域都有活性时,cas9可以诱导基因组dna(靶dna)中的双链断裂。所述cas9酶可包含来自属于下组的细菌的cas9蛋白的一个或多个催化结构域:棒状杆菌属(corynebacter),萨特菌属(sutterella),军团菌属(legionella),密螺旋体属(treponema),产线菌属(filifactor),真杆菌属(eubacterium),链球菌属(streptococcus),乳杆菌属(lactobacillus),支原体属(mycoplasma),拟杆菌属(bacteroides),flaviivola属,黄杆菌属(flavobacterium),sphaerochaeta属,固氮螺菌属(azospirillum),葡糖醋杆菌属(gluconacetobacter),奈瑟氏菌属(neisseria),罗斯拜瑞氏菌属(roseburia),细小棒菌属(parvibaculum),葡萄球菌属(staphylococcus),硝酸盐裂解菌属(nitratifractor)、和弯曲杆菌属(campylobacter)。在一些实施方案中,两个催化结构域来源于不同的细菌物种。

cas9核酸酶的有用变体可以包括单个失活的催化结构域,如ruvc-或hnh-酶或切口酶。cas9切口酶仅具有一个活性功能结构域,仅能够切割靶dna的一条链,由此产生单链断裂或缺口(nick)。在一些实施方案中,具有至少d10a突变的突变cas9核酸酶是cas9切口酶。在其他实施方案中,具有至少h840a突变的突变cas9核酸酶是cas9切口酶。其他存在于cas9切口酶中的突变的例子包括但不限于n854a和n863a。如果使用至少两个靶向dna的rna,这些rna靶向相反的dna链,则可以使用cas9切口酶导入双链断裂。双切口诱导的双链断裂(double-nickedinduceddouble-strandbreak)可以通过nhej或hdr被修复(ran等,2013,cell,154:1380-1389)。这种基因编辑策略有利于hdr,并降低脱靶dna位点上的indel突变的频率。cas9核酸酶或切口酶的非限制性实例描述于例如美国专利8,895,308、8889418、8,865,406,以及美国申请公开号2014/0356959、2014/0273226、2014/0186919。cas9核酸酶或切口酶可针对靶细胞或靶生物体进行密码子优化。

在一些实施方案中,所述cas核酸酶可以是这样的cas9多肽,其包含ruvc1和hnh核酸酶结构域的两个沉默突变(d10a和h840a),该多肽被称为dcas9(jineketal,science,2012,337:816-821;qietal,cell,152(5):1173-1183)。在一个实施方案中,来自酿脓链球菌的dcas9多肽在位置d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986、a987或上述位置的任何组合上包含至少一个突变。这种dcas9多肽及其变体在例如在国际专利公开号wo2013/176772中有描述。dcas9酶可以在d10,e762,h983或d986处含有突变,以及在h840或n863处有突变。在一些情况下,dcas9酶含有d10a或d10n突变。而且,dcas9酶可以包括h840a、h840y或h840n。在一些实施方案中,本发明的dcas9酶包含下述取代:d10a和h840a;d10a和h840y;d10a和h840n;d10n和h840a;d10n和h840y;或d10n和h840n。取代可以是使得cas9多肽无催化活性并能够与靶dna结合的保守取代或非保守取代。

在某些实施方案中,dcas9多肽是无催化活性的,例如是核酸酶活性缺陷的。在一些情况下,dcas9酶或其变体或片段可以阻断靶序列的转录,并且在一些情况下阻断rna聚合酶。在其他情况下,dcas9酶或其变体或片段可以激活靶序列的转录。

对于基因组编辑方法,cas核酸酶可以是cas9融合蛋白,例如这样的多肽:其包含iis型限制酶的催化结构域foki及与之连接的dcas9。foki-dcas9融合蛋白(fcas9)可以使用两个结合到靶dna的一条单链的引导rna,以产生双链断裂。

对于基因调控(例如,调变靶dna的转录),核酸酶缺陷型cas蛋白(例如但不限于dcas9)可用于转录激活或转录抑制。使用无核酸酶的cas蛋白使基因表达失活的方法描述于例如larsonetal.nat.protoc.,2013,8(11):2180-2196。

在一些实施方案中,编码cas核酸酶的核苷酸序列存在于重组表达载体中。在某些情况下、重组表达载体是病毒构建体、例如重组腺伴随病毒构建体、重组腺病毒构建体、重组慢病毒构建体等。例如,病毒载体可以基于痘苗病毒、脊髓灰质炎病毒、腺病毒、腺伴随病毒、sv40、单纯疱疹病毒、人免疫缺陷病毒等。逆转录病毒载体可以基于鼠白血病病毒、脾脏坏死病毒、以及来自逆转录病毒的载体,例如劳氏肉瘤病毒、哈维肉瘤病毒、禽白血病病毒、慢病毒、人免疫缺陷病毒、骨髓增殖性肉瘤病毒、乳腺肿瘤病毒,等等。有用的表达载体是本领域技术人员已知的,并且许多是可商购的。作为示例提供了以下用于真核宿主细胞的载体:pxt1、psg5、psvk3、pbpv、pmsg和psvlsv40。但是,任何其他载体如果与宿主细胞兼容均可以使用。例如,含有编码cas9酶的核苷酸序列的有用表达载体可从例如addgene、lifetechnologies、sigma-aldrich和origene商购获得。

取决于使用的靶细胞/表达系统,可以在表达载体中使用许多转录和翻译控制元件中的任何一种,包括启动子、转录增强子、转录终止子等。有用的启动子可以来自病毒或任何生物体,例如原核生物体或真核生物体。合适的启动子包括但不限于:sv40早期启动子;小鼠乳房肿瘤病毒长末端重复序列(ltr)启动子;腺病毒主要晚期启动子(admlp);单纯疱疹病毒(hsv)启动子;巨细胞病毒(cmv)启动子如cmv立即早期启动子区(cmvie);劳斯肉瘤病毒(rsv)启动子;人u6小核启动子(u6);增强型u6启动子;人h1启动子(h1)等等。

可以将cas核酸酶及其变体或片段以下述形式导入细胞(例如体外细胞,例如用于离体疗法的原代细胞;或体内细胞,例如患者体内的细胞):cas多肽或其变体或片段、编码cas多肽或其变体或片段的mrna、或包含编码cas多肽或其变体或片段的核苷酸序列的重组表达载体。

2.修饰的单引导rna(sgrna)

供crispr/cas基因组修饰系统中使用的修饰的sgrna通常包括:与靶核酸序列互补的引导序列(例如crrna),以及与cas核酸酶(例如cas9多肽)或其变体或片段序列相互作用的支架序列(例如tracrrna)。本发明人已经发现,包含一种或多种化学修饰的修饰的sgrna当在原代细胞(例如t细胞或造血干细胞和祖细胞)中用于基于crispr的基因调控(例如基因组编辑或调变基因表达)时,与相应的未修饰的sgrna相比,可以增加修饰的sgrna的活性、稳定性和特异性,和/或减少修饰的sgrna的毒性。与现有技术相比,修饰的sgrna的优点包括但不限于:更容易递送到靶细胞例如原代细胞中、以及稳定性增加、活性持续时间增加、和靶细胞的毒性减少。在某些情况下,与其他系统相比,作为crispr/cas系统的一部分的修饰的sgrna提供更高的中靶(on-target)基因调控频率。在其他情况下,与其未修饰的序列等同物相比,修饰的sgrna提供改善的活性和/或特异性。

在某些情况下,修饰的sgrna与cas核酸酶(例如cas9多肽)或其变体或片段复合以形成基于核糖核蛋白(rnp)的递送系统,用于导入细胞(例如体外细胞诸如用于体外治疗的原代细胞或诸如患者体内细胞)。在其他情况下,将修饰的sgrna与编码cas核酸酶的mrna(例如,编码一种或多种核酸酶的mrna)一起导入细胞(例如体外细胞,例如离体疗法的原代细胞,或体内细胞,例如患者体内)cas9多肽)或其变体或片段。在其它情况下,将修饰的sgrna用包含核苷酸序列的重组表达载体导入细胞(例如体外细胞,例如离体疗法的原代细胞,或体内细胞,例如患者体内)编码cas核酸酶(例如cas9多肽)或其变体或片段。

在一些情况下,可以使用多个修饰的sgrna以实现靶细胞(例如原代细胞)中的多重化的基于crispr的基因调控(例如,基因组编辑或调控基因表达)。所述多个修饰的sgrna可以包括至少约2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50个或更多个修饰的sgrna,它们可与相同的靶核酸序列或不同的靶核酸序列杂交。所述多个修饰的sgrna可以作为与cas核酸酶(例如cas9)或其变体或片段的复合物、或者作为编码cas核酸酶(例如cas9多肽)或其变体或片段的核苷酸序列(例如,mrna或重组表达载体)导入细胞(例如体外细胞,例如离体疗法的原代细胞;或体内细胞,例如患者体内的细胞)。

修饰的sgrna的核酸序列可以是任何这样的多核苷酸序列:其与靶多核苷酸序列(例如靶dna序列)具有足够互补性,从而与靶序列杂交并指导crispr复合物与靶序列序列特异性地结合。在一些实施方案中,修饰的sgrna的引导序列及其相应的靶序列之间的互补程度,当任选地将二者使用合适的比对算法实现最佳比对时,约为或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更多。最佳比对可通过使用任何合适的序列比对算法来确定,其非限制性的例子包括:smith-waterman算法、needleman-wunsch算法、基于burrows-wheeler变换的算法(例如burrowswheeler比对器)、clustalw、clustalx、blat、novoalign(novocrafttechnologies,eland(illumina,sandiego,calif.)、soap(可在soap.genomics.org.cn访问)、以及maq(可在maq.sourceforge.net访问)。在一些实施例中,引导序列的长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75或更多个核苷酸。在一些情况下,引导序列的长度为约20个核苷酸。在其它情况下,引导序列的长度为约15个核苷酸。在其它情况下,引导序列的长度为约25个核苷酸。可以通过任何合适的测定法来评估一个引导序列指导crispr复合物序列特异性地结合靶序列的能力。例如,可以将足以形成crispr复合物的crispr系统组分,包括要测试的引导序列在内,提供给具有相应的靶序列的宿主细胞(例如通过用编码crispr序列的组分的载体进行转染),随后评估靶序列内的优先切割。类似地,可以如下所述在试管中评估靶多核苷酸序列的切割:提供靶序列、crispr复合物的组分(包括要测试的引导序列和与测试引导序列不同的对照引导序列),并比较测试引导序列和对照引导序列反应在靶序列处的结合或切割速率。

可以使用上述任何基于网络的软件来选择修饰的sgrna的核苷酸序列。选择dna靶向性rna的考虑因素包括:要使用的cas核酸酶(例如cas9多肽)的pam序列,以及最小化脱靶性修饰的策略。工具,如crispr设计工具,可提供用于制备修饰的sgrna的序列、用于评估靶修饰效率序列、和/或用于评估脱靶位点处的切割的序列。选择修饰的sgrna的序列的另一个考虑因素包括降低引导序列内的二级结构的程度。二级结构可以通过任何合适的多核苷酸折叠算法确定。一些程序是基于计算最小吉布斯自由能。合适的算法的例子包括mfold(zukerandstiegler,nucleicacidsres,9(1981),133-148)、unafold工具包(markhametal.,methodsmolbiol,2008,453:3-31)、和viennarna工具包中的rnafold。

修饰的sgrna的引导序列中的一个或多个核苷酸和/或支架序列中的一个或多个核苷酸可以是修饰的核苷酸。例如,长度为约20个核苷酸的引导序列可以具有1个或多个,例如1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20个或更多个修饰的核苷酸。在一些情况下,引导序列包括至少2,3,4,5,6,7,8,9,10或更多个修饰的核苷酸。在其他情况下,引导序列包括至少2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,19,20,或更多个修饰的核苷酸。修饰的核苷酸可以位于引导序列的任何核酸位置。换句话说,修饰的核苷酸可以在引导序列的第一个和/或最后一个核苷酸处或附近,和/或二者之间的任何位置。例如,对于长度为20个核苷酸的引导序列,该一个或多个经修饰的核苷酸可以位于核酸第1位,第2位,第3位,第4位,第5位,第6位,第7位,第8位,第9位,第10位,第11位,第12位,第13位,第14位,第15位,第16位,第17位,第18位,第19位和/或引导序列的第20位。在某些情况下,引导序列的约10%至约30%,例如,约10%至约25%,约10%至约20%,约10%至约15%,约15%至约30%,约20%至约30%,或约25%至约30%可以包含修饰的核苷酸。在其他情况下,引导序列的约10%至约30%,例如约10%,约11%,约12%,约13%,约14%,约15%,约16%,约17%,约18%,约19%,约20%,约21%,约22%,约23%,约24%,约25%,约26%,约27%,约28%,约29%,或约30%可以包含修饰的核苷酸。

在一些实施方案中,修饰的sgrna的支架序列含有一个或多个修饰的核苷酸。例如,长度为约80个核苷酸的支架序列可以具有1个或多个,例如1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65,70,75,76,77,78,79,80个或更多个修饰的核苷酸。在一些情况下,支架序列包括至少2,3,4,5,6,7,8,9,10个或更多个修饰的核苷酸。在其它情况下,所述支架序列包括至少2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,19,20个或更多个修饰的核苷酸。修饰的核苷酸可以位于支架序列的任何核酸位置。例如,修饰的核苷酸可以在支架序列的第一个和/或最后一个核苷酸处或附近,和/或二者之间的任何位置。例如,对于长度为约80个核苷酸的支架序列,一个或多个修饰的核苷酸可位于所述序列的核酸位置第1位,第2位,第3位,第4位,第5位,第6位,第7位,第8位,第9位,第10位,第11位,第12位,第13位,第14位,第15位,第16位,第17位,第18位,第19位,第20位,第21位,第22位,第23位,第24位,第25位,第26位,第27位,第28位,第29位,第30位,第31位,第32位,第33位,第34位,第35位,第36位,第37位,第38位,第39位,第40位,第41位,第42位,第43位,第44位,第45位,第46位,第47位,第48位,第49位,第50位,第51位,第52位,第53位,第54位,第55位,第56位,第57位,第58位,第59位,第60位,第61位,第62位,第63位,第64位,第65位,第66位,第67位,第68位,第69位,第70位,第71位,第72位,第73位,第74位,第75位,第76位,第77位,第78位,第79位和/或第80位。在一些情况下,支架序列的约1%至约10%,例如约1%至约8%,约1%至约5%,约5%至约10%,或约3%至约7%可以包含修饰的核苷酸。在其它实例中,支架序列的约1%至约10%,例如,约1%,约2%,约3%,约4%,约5%,约6%,约7%,约8%,约9%,或约10%可包含修饰的核苷酸。

sgrna的修饰核苷酸可以包括核糖(例如糖)基团、磷酸基团、核碱基或其任何组合中的修饰。在一些实施方案中,核糖基团中的修饰包括核糖的2'位的修饰。

在一些实施方案中,修饰的核苷酸包括2'-氟-阿拉伯糖核酸、三环-dna(tc-dna)、肽核酸、环己烯核酸(cena)、锁核酸(lna)、乙烯桥核酸(ethylene-bridgednucleicacid,ena)、磷酸二酰胺吗啉代(phosphodiamidatemorpholino)、或其组合。

修饰的核苷酸或核苷酸类似物可以包括糖修饰和/或骨架修饰的核糖核苷酸(即,包括对磷酸-糖骨架的修饰)。例如,天然或自然rna的磷酸二酯键可以被修饰以包括氮或硫杂原子中的至少一个。在一些骨架修饰的核糖核苷酸中,连接到相邻核糖核苷酸的磷酸酯基团可以被替换为修饰的基团,例如硫代磷酸酯基团。在优选的糖修饰的核糖核苷酸中,2'部分是选自h、or、r、卤素、sh、sr、nh2、nhr、nr2或on的基团,其中r是c1-c6烷基、烯基或炔基,f,cl,br或i。

在一些实施方案中,修饰的核苷酸含有糖修饰。糖修饰的非限制性实例包括2'-脱氧-2'-氟-寡核糖核苷酸(2'-氟-2'-脱氧胞苷-5'-三磷酸,2'-氟-2'-脱氧尿苷-5'-三磷酸),2'-脱氧-2'-脱氨基寡核糖核苷酸(2'-氨基-2'-脱氧胞苷-5'-三磷酸,2'-氨基-2'-脱氧尿苷-5'-三磷酸),2'-o-烷基寡核糖核苷酸,2'-脱氧-2'-c-烷基寡核糖核苷酸(2'-o-甲基胞苷-5'-三磷酸,2'-甲基尿苷-5'-三磷酸),2'-c-烷基寡核糖核苷酸,及其异构体(2'-阿糖胞苷-5'-三磷酸,2'-阿糖尿苷-5'-三磷酸),叠氮三磷酸(2'-叠氮-2'-脱氧胞苷-5'-三磷酸,2'-叠氮-2'-脱氧尿苷-5'-三磷酸)及其组合。

在一些实施方案中,修饰的sgrna含有一个或多个2'-氟、2'-氨基和/或2'-硫修饰。在一些情况下,修饰是2'-氟-胞苷,2'-氟-尿苷,2'-氟-腺苷,2'-氟-鸟苷,2'-氨基-胞苷,2'-氨基-尿苷,2'-氨基-腺苷,2'-氨基-鸟苷,2,6-二氨基嘌呤,4-硫代-尿苷,5-氨基-烯丙基-尿苷,5-溴-尿苷,5-碘-尿苷,5-甲基-胞苷,核糖-胸苷,2-氨基嘌呤,2'-氨基-丁酰基-芘-尿苷,5-氟-胞苷和/或5-氟-尿苷。

在哺乳动物rna上发现超过96个天然存在的核苷修饰。参见例如limbach等,nucleicacidsresearch,22(12):2183-2196(1994)。核苷酸和修饰的核苷酸和核苷的制备在本领域中是公知的,并在例如美国专利号4,373,071、4,458,066、4,500,707、4,668,777、4,973,679、5,047,524、5,132,418、5,153,319、5,262,530和5,700,642中有所描述。适用于本文所述的许多修饰的核苷和修饰的核苷酸是可商购的。核苷可以是天然存在的核苷的类似物。在一些情况下,类似物是二氢尿苷,甲基腺苷,甲基胞苷,甲基尿苷,甲基假尿苷,硫尿苷,脱氧胞嘧啶和脱氧尿苷。

在一些情况下,本文描述的修饰的sgrna包括核碱基修饰的核糖核苷酸,即包含至少一个非天然存在的核碱基而不是天然存在的核碱基的核糖核苷酸。可以掺入修饰的核苷和修饰的核苷酸的修饰的核碱基的非限制性实例包括:m5c(5-甲基胞苷),m5u(5-甲基尿苷),m6a(n6-甲基腺苷),s2u(2-硫尿苷),um(2'-o-甲基尿苷),m1a(1-甲基腺苷)(2-1-o-甲基腺苷),ms2m6a(2-甲硫基-n6-甲基腺苷),i6a(n6-异戊烯基腺苷),ms216a(2-甲硫基-n6异戊烯基腺苷),io6a(n6-(顺式-羟基异戊烯基)腺苷),ms2io6a(2-甲硫基-n6-(顺式-羟基异戊烯基)腺苷),g6a(n6-甘氨酰氨基甲酰基腺苷),t6a(n6-苏氨酰氨基甲酰腺苷),ms2t6a(2-甲硫基-n6-苏氨酰氨基甲酰腺苷),m6t6a(n6-甲基-n6-苏氨酰氨基甲酰基腺苷),hn6a(n6-羟基神经氨酰基氨基甲酰基腺苷),ms2hn6a(2-甲硫基-n6-羟基香叶基氨甲酰腺苷),ar(p)(2'-o-核糖腺苷(磷酸)),i(肌苷),m11(1-甲基肌苷),m′im(1,2′-o-二甲基肌苷),m3c(3-甲基胞苷),cm(2t-o-甲基胞苷),s2c(2-硫代胞苷),ac4c(n4-乙酰胞苷),f5c(5-甲酰化胞苷),m5cm(5,2-o-二甲基肌苷),ac4cm(n4乙酰基2to甲基胞苷),k2c(甲咪唑啉),m1g(1-甲基鸟苷),m2g(n2-甲基鸟苷),m7g(7-甲基鸟苷),gm(2′-o-甲基鸟苷),m22g(n2,n2-二甲基鸟苷),m2gm(n2,2′-o-二甲基鸟苷),m22gm(n2,n2,2′-o-三甲基鸟苷),gr(p)(2′-o-核糖基鸟苷(磷酸)),yw(怀丁苷),o2yw(过氧怀丁苷),ohyw(羟基怀丁苷),ohyw*(修饰不足的羟基怀丁苷),img(怀俄苷),mimg(甲基鸟苷),q(q核苷),oq(环氧q核苷),galq(半乳糖基-q核苷),manq(甘露糖基-q核苷),preqo(7-氰基-7-脱氮鸟苷),preqi(7-氨基甲基-7-脱氮鸟苷),g(古嘌苷),d(二羟尿苷),m5um(5,2′-o-二甲基尿苷),s4u(4-硫代尿苷),m5s2u(5-甲基-2-硫代尿苷),s2um(2-硫-2′-o-甲基尿苷),acp3u(3-(3-氨基-3-羧基丙基)尿苷),ho5u(5-羟基尿苷),mo5u(5-甲氧基尿苷),cmo5u(尿苷5-羟乙酸),mcmo5u(尿苷5-羟乙酸甲酯),chm5u(5-(羧基羟基甲基)尿苷)),mchm5u(5-(羧基羟基甲基)尿苷甲酯),mcm5u(5-甲氧基羰基甲基尿苷),mcm5um(s-甲氧基羰基甲基-2-o-甲基尿苷),mcm5s2u(5-甲氧基羰基甲基-2-硫代尿苷),nm5s2u(5-氨基甲基-2-硫代尿苷),mnm5u(5-甲基氨基甲基尿苷),mnm5s2u(5-甲基氨基甲基-2-硫代尿苷),mnm5se2u(5-甲基氨基甲基-2-硒代尿苷),ncm5u(5-氨甲酰基甲基尿苷),ncm5um(5-氨甲酰基甲基-2′-o-甲基尿苷),cmnm5u(5-羧基甲基氨基甲基尿苷),cnmm5um(5-羧基甲基氨基甲基-2-l-o甲基尿苷),cmnm5s2u(5-羧基甲基氨基甲基-2-硫代尿苷),m62a(n6,n6-二甲基腺苷),tm(2′-o-甲基肌苷),m4c(n4-甲基胞苷),m4cm(n4,2-o-二甲基胞苷),hm5c(5-羟基甲基胞苷),m3u(3-甲基尿苷),cm5u(5-羧基甲基尿苷),m6am(n6,t-o-二甲基腺苷),rn62am(n6,n6,o-2-三甲基腺苷),m2′7g(n2,7-二甲基鸟苷),m2′2′7g(n2,n2,7-三甲基鸟苷),m3um(3,2t-o-二甲基尿苷),m5d(5-甲基二羟尿苷),f5cm(5-甲酰基-2′-o-甲基胞苷),m1gm(1,2′-o-二甲基鸟苷),m'am(1,2-o-二甲基腺苷)亚氨基甲基尿苷),tm5s2u(s-牛磺胆酸甲基-2-硫代尿苷)),img-14(4-脱甲基鸟苷),img2(异鸟苷),或ac6a(n6-乙酰腺苷),次黄嘌呤,肌苷,8-氧代-腺嘌呤,其7-取代的衍生物,2-尿嘧啶,假尿嘧啶,2-硫尿嘧啶,4-硫尿嘧啶,5-氨基尿嘧啶,5-(c1-c6)-烷基尿嘧啶,5-甲基尿嘧啶,5-(c2-c6)-烯基尿嘧啶,5-(c2-c6)-炔基尿嘧啶,5-(羟基甲基)尿嘧啶,5-氯尿嘧啶,5-氟尿嘧啶,5-溴尿嘧啶,5-羟基胞嘧啶,5-(c1-c6)-烷基胞嘧啶,5-甲基胞嘧啶,5-(c2-c6)-烯基胞嘧啶,5-(c2-c6)-炔基胞嘧啶,5-氯胞嘧啶,5-氟胞嘧啶,5-溴胞嘧啶,n2-二甲基鸟嘌呤,7-脱氮鸟嘌呤,8-氮鸟嘌呤,7-脱氮-7-取代鸟嘌呤,7-脱氮-7-(c2-c6)炔基鸟嘌呤,7-脱氮-8-取代鸟嘌呤,8-羟基鸟嘌呤,6-硫鸟嘌呤,8-羟基鸟嘌呤,2-氨基嘌呤,2-氨基-6-氯嘌呤,2,4-二氨基嘌呤,2,6-二氨基嘌呤,8-氮杂嘌呤,取代的7-脱氮嘌呤,7-脱氮-7-取代的嘌呤,7-脱氮-8-取代的嘌呤,及其组合。

在一些实施方案中,修饰的sgrna的磷酸骨架被改变。修饰的sgrna可包括一个或多个硫代磷酸酯、氨基磷酸酯(例如n3'-p5'-氨基磷酸酯(np))、2'-o-甲氧基-乙基(2'moe)、2'-o-甲基-乙基(2me)和/或甲基膦酸酯联接。

在具体的实施方案中,修饰的sgrna的引导序列的一个或多个修饰的核苷酸和/或修饰的sgrna的支架序列的一个或多个修饰的核苷酸包括2'-o-甲基(m)核苷酸,2'-o-甲基3'-硫代磷酸酯(ms)核苷酸,2'-o-甲基3'硫代pace(msp)核苷酸,或其组合。在一些情况下,修饰的sgrna包含一个或多个ms核苷酸。在其他情况下,修饰的sgrna包含一个或多个msp核苷酸。在其他情况下,修饰的sgrna包含一个或多个ms核苷酸和一个或多个msp核苷酸。在进一步的例子中,修饰的sgrna不包含m个核苷酸。在某些情况下,修饰的sgrna包含一个或多个ms核苷酸和/或一个或多个msp核苷酸,还包括一个或多个m个核苷酸。在某些其他情况下,ms核苷酸和/或msp核苷酸是修饰的sgrna中存在的唯一修饰的核苷酸。

应该注意的是,在修饰的sgrna的引导序列和/或支架序列中可以组合和纳入任何本文所述的修饰。

在一些情况下,修饰的sgrna还包括结构修饰,例如茎环,例如m2茎环或四环。

修饰的sgrna可以通过本领域普通技术人员已知的任何方法合成。在一些实施方案中,修饰的sgrna是化学合成的。修饰的sgrna可以使用2'-o-硫代氨基甲酸酯保护的核苷亚磷酰胺来合成。方法在例如dellingeretal.,j.americanchemicalsociety133,11540-11556(2011);threlfalletal.,organic&biomolecularchemistry10,746-754(2012);anddellingeretal.,j.americanchemicalsociety125,940-950(2003)中有记载。

化学修饰的sgrna可以与任何crispr相关技术(例如rna引导技术)一起使用。如本文所述,修饰的sgrna可以用作任何cas核酸酶或其变体或片段(包括任何工程化或人造cas9多肽)的引导。修饰的sgrna可以靶向分离的原代细胞中的dna和/或rna分子用于体外治疗或体内(例如在动物中)。本文公开的方法可以应用于基因组编辑,基因调控,成像以及任何其他基于crispr的应用。

3.供体修复模板

在一些实施方案中,本发明提供重组供体修复模板,其包含两条同源臂,所述同源臂与靶dna序列(例如靶基因或基因座)上位于cas核酸酶(例如cas9核酸酶)切割位点任一侧的部分同源。在某些情况下,重组供体修复模板包含报道盒,所述报告盒包含:编码报道多肽(例如,可检测多肽,荧光多肽或选择标记)的核苷酸序列,和位于报道盒两侧、且与靶dna上位于cas核酸酶切割位点任一侧的部分同源的两条同源臂。报告盒可以进一步包含编码自切割肽、一个或多个核定位信号、和/或荧光多肽,例如superfoldergfp(sfgfp)的序列。

在一些实施方案中,同源臂具有相同的长度。在其他实施方案中,同源臂是不同的长度。同源臂可以是至少约10个碱基对(bp),例如至少约10bp、15bp、20bp、25bp、30bp、35bp、45bp、55bp、65bp、75bp、85bp、95bp、100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、950bp、1000bp、1.1千碱基(kb)、1.2kb、1.3kb、1.4kb、1.5kb、1.6kb、1.7kb、1.8kb、1.9kb、2.0kb、2.1kb、2.2kb、2.3kb、2.4kb、2.5kb、2.6kb、2.7kb、2.8kb、2.9kb、3.0kb、3.1kb、3.2kb、3.3kb、3.4kb、3.5kb、3.6kb、3.7kb、3.8kb、3.9kb、4.0kb,或更长。同源臂可为约10bp至约4kb,例如约10bp至约20bp、约10bp至约50bp、约10bp至约100bp、约10bp至约200bp、约10bp至约500bp、约10bp至约1kb、约10bp至约2kb、约10bp至约4kb、约100bp至约200bp、约100bp至约500bp、约100bp至约1kb、约100bp至约2kb、约100bp至约4kb、约500bp至约1kb、约500bp至约2kb、约500bp至约4kb、约1kb至约2kb、约1kb至约2kb、约1kb至约4kb、或约2kb至约4kb。

供体修复模板可被克隆到表达载体中。可以使用本领域普通技术人员已知的常规的基于病毒和非病毒的表达载体。

单链寡聚脱氧核苷酸(ssodn)供体模板可以代替重组供体修复模板用于同源重组介导的修复。ssodn可用于在靶dna中导入短的修饰。例如,ssodn适用于精确纠正snp等基因突变。ssodns可以在cas核酸酶切割的靶位点的每一侧包含两个侧翼的同源序列,并且可以相对于靶dna呈有义或反义取向。每个侧翼序列可以是至少约10个碱基对(bp),例如至少约10bp、15bp、20bp、25bp、30bp、35bp、40bp、45bp、50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp、100bp、150bp、200bp、250bp、300bp、350bp、400bp、450bp、500bp、550bp、600bp、650bp、700bp、750bp、800bp、850bp、900bp、950bp、1kb、2kb、4kb,或更长。在一些实施方案中,每条同源臂为约10bp至约4kb,例如,约10bp至约20bp、约10bp至约50bp、约10bp至约100bp、约10bp至约200bp、约10bp至约500bp、约10bp至约1kb、约10bp至约2kb、约10bp至约4kb、约100bp至约200bp、约100bp至约500bp、约100bp至约1kb、约100bp至约2kb、约100bp至约4kb、约500bp至约1kb、约500bp至约2kb、约500bp至约4kb、约1kb至约2kb、约1kb至约2kb、约1kb至约4kb,或约2kb至约4kb。ssodn的长度可为至少约25个核苷酸(nt),例如至少约25nt、30nt、35nt、40nt、45nt、50nt、55nt、60nt、65nt、70nt、75nt、80nt、85nt、90nt、95nt、100nt、150nt、200nt、250nt、300nt,或更长。在一些实施方案中,ssodn的长度为约25至约50;约50至约100;约100至约150;约150至约200;约200至约250;约250至约300;或约25nt至约300nt。

在一些实施方案中,所述ssodn模板包含至少一个,例如1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500个或更多个本文所描述的修饰的核苷酸。在一些情况下,ssodn的序列的至少1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%或99%包括修饰核苷酸。在一些实施方案中,修饰的核苷酸位于ssodn的一个或两个末端。修饰的核苷酸可以是自末端起的第一,第二,第三,第四,第五,第六,第七,第八,第九或第十个核苷酸,或其任何组合。例如,修饰的核苷酸可以位于ssodn模板两端的三个末端核苷酸处。另外,修饰的核苷酸可以位于末端的内部。

4.靶dna

在crispr/cas系统中,靶dna序列可以与靶向dna的rna(例如,修饰的sgrna)的片段互补,并且其后面可以紧跟着原型间隔子邻接基序(pam)序列。靶dna位点可能直接位于pam序列的5'处,此pam序列对于所使用的cas9的细菌种类是特异性的。例如,来自酿脓链球菌的cas9的pam序列是ngg;来自脑膜炎奈瑟氏球菌的cas9的pam序列是nnnngatt;来自嗜热链球菌的cas9的pam序列是nnagaa;而来自密螺旋体的cas9的pam序列是naaaac。在一些实施方案中,pam序列可以是5'-ngg,其中n是任何核苷酸;5'-nrg,其中n是任何核苷酸,r是嘌呤;或5'-nngrr,其中n是任何核苷酸,r是嘌呤。对于酿脓链球菌系统,选择的靶dna序列应该紧接在5'nggpam之前(例如位于5'),其中n是任何核苷酸,使得靶向dna的rna的引导序列(例如,修饰的sgrna)与相对链碱基配对,以介导pam序列上游约3个碱基对处的切割。

在一些实施方案中,当将靶向dna的rna(例如,修饰的sgrna)的引导序列与其相应的靶dna序列使用合适的比对算法最佳比对时,二者之间的互补性程度为大约,或多于大约50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多。可以使用用于比对序列的任何合适算法来确定最佳比对,此类算法的非限制性实例包括smith-waterman算法、needleman-wunsch算法、基于burrows-wheeler变换的算法(例如burrowswheeleraligner)、clustalw、clustalx、blat、novoalign(novocrafttechnologies,selangor,malaysia)和eland(illumina,sandiego,ca)。

可以使用基于网络的软件在预定的基因组序列(基因)中选择靶dna位点,此类软件例如zifittargeter软件(sanderetal.,2007,nucleicacidsres,35:599-605;sanderetal.,2010,nucleicacidsres,38:462-468)、e-crisp(heigweretal.,2014,natmethods,11:122-123)、rgentools(baeetal.,2014,bioinformatics,30(10):1473-1475)、casfinder(aachetal.,2014,biorxiv)、dna2.0gnradesigntool(dna2.0,menlopark,ca)以及crisprdesigntool(broadinstitute,cambridge,ma)。这样的工具分析基因组序列(例如感兴趣的基因或基因座)并鉴定用于基因编辑的合适靶位点。为了评估每种靶向dna的rna(例如,修饰的sgrna)的脱靶基因修饰,基于对碱基配对错配同一性、位置和分布的定量特异性分析,进行脱靶位点的计算预测。

5.调变基因表达

调控基因表达(诸如抑制基因表达或激活基因表达)的crispr/cas系统可包括野生型或天然cas核酸酶(例如cas9多肽变体或片段)的变体或片段,以及和dna靶向性sgrna或rna靶向性sgrna。作为一个非限制性实例,包含cas9变体或片段与sgrna的复合物,其中sgrna能够结合与sgrna的一部分互补的靶dna序列,可以阻断或阻碍rna聚合酶的转录起始和/或延伸。这进而可以抑制或阻遏靶dna的基因表达。或者,包含另一种不同cas9变体或片段与sgrna的复合物,其中sgrna能够结合与sgrna的一部分互补的靶dna序列,可以诱导或激活靶dna的基因表达。

关于进行crispr干扰(crispri)以灭活或减少基因表达的方法的详细描述见于例如larsonetal.,natureprotocols,2013,8(11):2180-2196,和qietal.,cell,152,2013,1173-1183。在crispri中,sgrna-cas9变体复合物可以结合蛋白质编码区域的非模板dna链,并阻断转录延伸。在一些情况下,当sgrna-cas9变体复合物结合基因的启动子区域时,复合物阻止或阻碍转录起始。

关于进行crispr激活以增加基因表达的方法的详细描述可见,例如:chengetal.,cellresearch,2013,23:1163-1171,konermanetal.,nature,2015,517:583-588,以及美国专利8,697,359。

关于以调变基因表达为目的的基于crispr的rna结合和/或切割的详细描述可见,例如,o’connelletal.,nature,2014,516:263-266,和美国专利申请公布号2014/0302563。

对于基于crispr的基因表达控制,可以使用cas核酸酶(例如cas9多肽)的缺乏核酸内切酶活性的催化失活变体。在一些实施方案中,cas核酸酶是在ruvc样和hnh核酸酶结构域中含有至少两个点突变的cas9变体。在一些实施方案中,cas9变体具有d10a和h840a氨基酸取代,其被称为dcas9(jineketal.,science,2012,337:816-821;qietal.,cell,152(5):1173-1183)。在一些情况下,来自酿脓链球菌的dcas9多肽在位置d10、g12、g17、e762、h840、n854、n863、h982、h983、a984、d986、a987或它们的任何组合上包含至少一个突变。关于此类dcas9多肽及其变体的描述可见例如在国际专利公开号wo2013/176772。dcas9酶可以在d10、e762、h983或d986处含有突变,以及在h840或n863处有突变。在某些情况下,dcas9酶含有d10a或d10n突变。而且,dcas9酶可以包括h840a、h840y或h840n。在一些情况下,dcas9酶包含d10a和h840a;d10a和h840y;d10a和h840n;d10n和h840a;d10n和h840y;或d10n和h840n替换。取代可以是保守取代或非保守取代,以使得cas9多肽催化失活并能够与靶dna结合。

在某些实施方案中,dcas9多肽是催化失活的,例如核酸酶活性缺陷。在一些情况下,dcas9酶或其变体或片段可以阻断靶序列的转录,并且在一些情况下,可以阻断rna聚合酶。在其他情况下,dcas9酶或其变体或片段可以激活靶序列的转录。

在某些实施方案中,缺乏核酸内切酶活性的cas9变体(例如,dcas9)可以与转录阻遏结构域[例如kruppel关联盒(krab)结构域]或转录激活结构域(例如vp16反式激活结构域)融合。在一些实施方案中,cas9变体是包含dcas9和转录因子(例如rna聚合酶ω因子、休克因子1、或其片段)的融合多肽。在其他实施方案中,cas9变体是包含dcas9和dna甲基化酶、组蛋白乙酰化酶、或其片段的融合多肽。

对于通过rna结合和/或rna切割介导的基于crispr的基因表达控制,可以使用合适的cas核酸酶(例如cas9多肽)的具有内切核糖核酸酶活性的变体,例如o’connelletal.,nature,2014,516:263-266中描述的。其他有用的cas核酸酶(例如cas9)变体描述于例如美国专利申请公开号2014/0302563中。其它能够切割rna的crispr相关酶包括csy4内切核糖核酸酶、crispr相关的cas6酶、cas5家族成员酶、cas6家族成员酶、i型crispr系统内切核糖核酸酶、ii型crispr系统内切核糖核酸酶、iii型crispr系统内切核糖核酸酶及其变体。

在基于crispr的rna切割的一些实施方案中,与本文所述的修饰的sgrna和cas核酸酶(例如cas9)变体一并使用含有pam序列的dna寡核苷酸(例如,pammer)并切割单链rna转录物。合适的pammer序列的详细描述参见例如o’connelletal.,nature,2014,516:263-266。

cas核酸酶(例如cas9多肽)或其变体或片段可以以多肽、编码多肽的mrna、或包含编码多肽的核苷酸序列的重组表达载体的形式提供。其他细节可见前文。

在一些实施方案中,使用多个修饰的sgrna来靶向靶基因的不同区域以调控该靶基因的基因表达。与每个修饰的sgrna单独相比,多个修饰的sgrna可以提供对单一靶基因的基因表达的协同调变(例如抑制或活化)。在其他实施方案中,使用多个修饰的sgrna来调控至少两种靶基因的基因表达。

b.原代细胞

本发明可用于诱导任何感兴趣的原代细胞中靶核酸的基因调控。原代细胞可以是从任何多细胞生物体分离的细胞,例如植物细胞(例如稻细胞、小麦细胞、番茄细胞、拟南芥细胞、玉米细胞等)、来自多细胞原生生物的细胞、来自多细胞真菌的细胞、动物细胞如来自无脊椎动物(例如果蝇、海胆、棘皮动物、线虫等)的细胞或来自脊椎动物(例如鱼、两栖动物、爬行动物、鸟类、哺乳动物等)的细胞、来自人的细胞、来自健康人的细胞、来自人患者的细胞、来自癌症患者的细胞等。在一些情况下,具有被诱导的基因调控的原代细胞可以移植到受试者(例如患者)。例如,原代细胞可以来自待治疗的受试者(例如,患者)。

任何类型的原代细胞可能是感兴趣的,诸如干细胞,例如胚胎干细胞、诱导的多能干细胞、成体干细胞(例如间充质干细胞、神经干细胞、造血干细胞、器官干细胞)、祖细胞、体细胞(例如成纤维细胞、肝细胞、心脏细胞、肝细胞、胰细胞、肌细胞、皮肤细胞、血细胞、神经细胞、免疫细胞)和身体(例如人体)的任何其它细胞。细胞可以是源自受试者(例如动物受试者或人受试者)的原代细胞或原代细胞培养物,并允许在体外生长有限的传代数。在一些实施方案中,细胞是疾病细胞或来源于患有疾病的受试者。例如,细胞可以是癌症或肿瘤细胞。

原代细胞可以通过任何标准方法从受试者中收获。例如,来自组织如皮肤、肌肉、骨髓、脾、肝、肾、胰腺、肺、肠、胃等的细胞可通过组织活检或细针抽吸收集。血细胞和/或免疫细胞可以从全血、血浆或血清中分离。在一些情况下,合适的原代细胞包括外周血单个核细胞(pbmc),外周血淋巴细胞(pbl)和其它血细胞亚群,例如但不限于t细胞、天然杀伤细胞、单核细胞、天然杀伤细胞t细胞、单核细胞前体细胞、造血干细胞和祖细胞(hspc)如cd34+hspc或非多能干细胞。在一些情况下,细胞可以是任何免疫细胞,包括但不限于任何t细胞,例如肿瘤浸润细胞(til)、cd3+t细胞、cd4+t细胞、cd8+t细胞或任何其他类型的t细胞。t细胞还可以包括记忆t细胞、记忆干细胞t细胞或效应t细胞。t细胞也可以向特定的群体和表型漂移(skew)。例如,t细胞可以漂移为包括cd45ro(-)、ccr7(+)、cd45ra(+)、cd62l(+)、cd27(+)、cd28(+)和/或il-7rα(+)表型。可以选择合适的细胞,它们包含选自下组的一种或多种标志物:cd45ro(-)、ccr7(+)、cd45ra(+)、cd62l(+)、cd27(+)、cd28(+)和/或il-7rα(+)。诱导的多能干细胞可以根据例如美国专利号7,682,828、8,058,065、8,530,238、8,871,504、8,900,871和8,791,248中所述的标准方案由分化的细胞产生。

在一些实施方案中,原代细胞是体外的。在其他实施方案中,原代细胞是离体的。

c.离体疗法

本文所述的方法可用于离体疗法。离体疗法可以包括给受试者(例如患者)施用在生物体外部产生或修饰的组合物(例如细胞)。在一些实施方案中,组合物(例如细胞)可以通过本文公开的方法产生或修饰。例如,离体疗法可以包括将生物体外部产生或修饰的原代细胞给予受试者(例如患者),其中所述原代细胞已经根据本发明的方法体外培养,所述方法包括使原代细胞中的靶核酸接触一种或多种本文中所述的修饰的sirna,以及cas核酸酶(例如cas9多肽)或其变体或片段,或编码cas核酸酶(例如cas9多肽)或其变体或片段的mrna,或包含编码cas核酸酶(例如cas9多肽)或其变体或片段的核苷酸序列的重组表达载体。

在一些实施方案中,组合物(例如细胞)可以源自要通过离体疗法治疗的受试者(例如患者)。在一些实施方案中,离体疗法可以包括基于细胞的疗法,例如过继免疫疗法。

在一些实施方案中,体外治疗中使用的组合物可以是细胞。细胞可以是原代细胞,包括但不限于外周血单个核细胞(pbmc)、外周血淋巴细胞(pbl)和其他血细胞亚群。原代细胞可以是免疫细胞。原代细胞可以是t细胞(例如cd3+t细胞、cd4+t细胞和/或cd8+t细胞)、天然杀伤细胞、单核细胞、天然杀伤t细胞、单核细胞前体细胞、造血干细胞细胞或非多能干细胞、干细胞、或祖细胞。原代细胞可以是造血干细胞或祖细胞(hspc),例如cd34+hspc。原代细胞可以是人类细胞。原代细胞可以被分离、选择和/或培养。原代细胞可以离体扩增。原代细胞可以在体内扩增。原代细胞可以是cd45ro(-),ccr7(+),cd45ra(+),cd62l(+),cd27(+),cd28(+)和/或il-7rα(+)。原代细胞对于需要的受试者可以是自体的。原代细胞对于需要的受试者可以是非自体的。原代细胞可以是符合良好生产规范(gmp)的试剂。原发性细胞可以是在需要的受试者中治疗疾病(包括癌症、感染、自身免疫性疾病或移植物抗宿主病(gvhd))的组合疗法的一部分。

作为离体疗法的非限制性实例,可以在使原代细胞内的靶核酸与cas核酸酶和修饰的sgrna接触之前从多细胞生物体(例如,植物、多细胞原生生物、多细胞真菌、无脊椎动物、脊椎动物等)分离原代细胞。在将靶核酸与cas核酸酶和修饰的sgrna接触之后,可以将原代细胞或其后代(例如来源于原代细胞的细胞)返回到多细胞生物体中。

d.将核酸导入靶细胞的方法

用于将多肽和核酸导入靶细胞(宿主细胞)的方法是本领域已知的,并且可以使用任何已知的方法将核酸酶或核酸[例如,编码核酸酶的核苷酸序列、靶向dna的rna(例如修饰的单引导rna),用于同源性指导修复(hdr)的供体修复模板等]导入细胞,例如原代细胞如干细胞、祖细胞或分化的细胞。合适方法的非限制性实例包括电穿孔、病毒或噬菌体感染、转染、接合、原生质体融合、脂质体转染、磷酸钙沉淀、聚乙烯亚胺(pei)介导的转染、deae-葡聚糖介导的转染、脂质体介导的转染、粒子枪技术、磷酸钙沉淀、直接显微注射、纳米颗粒介导的核酸递送等。

在一些实施方案中,可以使用递送系统将crispr/cas介导的基因调控的组分导入细胞中。在某些情况下,递送系统包含纳米颗粒、微粒(例如聚合物微聚合物)、脂质体、胶束、病毒微体、病毒颗粒、核酸复合物、转染剂、电穿孔剂(例如使用neon转染系统)、核转染试剂、脂质转染试剂和/或包括下述组分的缓冲系统:核酸酶组分(作为多肽或由表达构建体编码)和一种或多种核酸组分[如靶向dna的rna(例如修饰的单引导rna)]和/或供体修复模板。例如,可以将各组分与脂质转染剂混合,使得它们被包封或包装成阳离子亚微米水包油乳液。或者,可以在没有递送系统的情况下递送组分,例如作为水溶液。

制备脂质体和在脂质体中包封多肽和核酸的方法在例如methodsandprotocols,volume1:pharmaceuticalnanocarriers:methodsandprotocols.(ed.weissig).humanapress,2009,和heyesetal.(2005)jcontrolledrelease107:276-87中有描述。制备微粒和包封多肽和核酸的方法描述于例如functionalpolymercolloidsandmicroparticlesvolume4(microspheres,microcapsules&liposomes).(eds.arshady&guyot).citusbooks,2002,以及microparticulatesystemsforthedeliveryofproteinsandvaccines.(eds.cohen&bernstein).crcpress,1996。

e.评估基因组编辑效率的方法

为了功能性地测试正确的基因组编辑修饰的存在,可以通过本领域技术人员已知的标准方法分析靶dna。例如,可以使用突变检测试剂盒(integrateddnatechnologies,coralville,ia)或guide-ittmindel鉴定试剂盒(clontech,mountainview,ca)进行测序来鉴定indel突变。同源性指导修复(hdr)可以通过基于pcr的方法,并结合测序或rflp分析来加以检测。基于pcr的试剂盒的非限制性实例包括guide-it突变检测试剂盒(clontech)和基因组切割检测试剂盒(lifetechnologies,carlsbad,ca)。也可以使用深度测序,特别是对于大量样品或潜在的靶/脱靶位点而言。

在某些实施方案中,基因组编辑的效率(例如特异性)对应于:中靶(on-target)的基因组切割事件的数目或百分比相对于所有基因组切割事件(包括中靶的事件和脱靶的事件)的数量或百分比。

在一些实施方案中,相对于相应的未修饰的sgrna,本文描述的修饰的sgrna能够增强细胞(例如原代细胞)中靶dna序列的基因组编辑。基因组编辑可包括同源性指导修复(hdr)(例如,插入,缺失或点突变)或非同源末端连接(nhej)。

在某些实施方案中,与相应的未修饰的sgrna序列相比,在存在本文描述的修饰的sgrna的情况下,细胞中靶dna序列的核酸酶介导的基因组编辑效率增加至少约0.5倍,0.6倍,0.7倍,0.8倍,0.9倍,1倍,1.1倍,1.2倍,1.3倍,1.4倍,1.5倍,2倍,2.5倍,3倍,3.5倍,4倍,4.5倍,5倍,5.5倍,6倍,6.5倍,7倍,7.5倍,8倍,8.5倍,9倍,9.5倍,10倍,15倍,20倍,25倍,30倍,35倍,40倍,45倍,50倍或更大。

f.用于细胞中靶核酸的基因调控的方法

本文提供了用于诱导基因调控,例如基因组编辑和/或调变(例如抑制或激活)细胞中靶核酸的基因表达的方法。细胞可以是体外的(例如,用于离体疗法的原代细胞)或体内的(例如人类器官或组织中的细胞)。

诱导基因组编辑的方法包括向细胞中导入本文所述的修饰的sgrna和cas核酸酶(例如cas9多肽)或其变体或片段、编码cas核酸酶(例如cas9多肽)或变体或其片段的mrna,或包含编码cas核酸酶(例如cas9多肽)或其变体或片段的核苷酸序列的重组表达载体。修饰的sgrna将cas核酸酶(例如cas9多肽)或其变体或片段引导至靶核酸(例如靶dna)。与相应的未修饰的sgrna序列相比,修饰的sgrna具有增强的活性、稳定性和/或对靶dna的特异性。在某些情况下,基因组编辑是靶dna的非同源末端连接(nhej)。在其他情况下,基因组编辑是靶dna的同源性指导修复(hdr)。在hdr的一些实施方案中,将重组供体修复模板添加到细胞中。重组供体修复模板可以包括两个核苷酸序列,它们包含靶dna的两个非重叠的同源部分,其中所述核苷酸序列位于对应于靶dna的核苷酸序列的5'和3'端。在一些实施方案中,重组供体修复模板包含合成的单链寡聚脱氧核苷酸(ssodn)模板,该模板包含:编码修饰单核苷酸多态性(snp)的突变的核苷酸序列、以及包含靶的两个非重叠同源部分的两个核苷酸序列dna,其中核苷酸序列位于编码突变的核苷酸序列的5'和3'端。使用任何合适的方法,例如通过电穿孔,将修饰的sgrna和/或cas核酸酶(例如cas9多肽)或其变体或片段、编码cas核酸酶(例如cas9多肽)或其变体或片段的mrna、或包含编码cas核酸酶(例如cas9多肽)或其变体或片段的核苷酸序列的重组表达载体导入细胞中。

用于调变(例如抑制或激活)细胞中的靶核酸(例如靶dna)的基因表达的方法包括向细胞中导入(例如,电穿孔)本文所述的经修饰的sgrna和cas核酸酶(例如cas9多肽)或其变体或片段、编码cas核酸酶(例如cas9多肽)或其变体或片段的mrna、或包含编码cas核酸酶(例如cas9多肽)或变体或片段的核苷酸序列的重组表达载体。在一些实施方案中,cas核酸酶(例如cas9)变体是内切核酸酶缺陷型cas(例如dcas9)多肽。在一些情况下,与野生型cas9多肽相比,cas9变体可以具有两个或更多个氨基酸取代。在其他情况下,cas9变体不能切割双链dna。cas核酸酶变体可以是cas(例如dcas9)融合多肽。在一些实施方案中,融合多肽包括转录阻抑结构域、转录激活结构域、转录因子、组蛋白修饰酶(例如组蛋白脱乙酰酶、组蛋白甲基转移酶、组蛋白乙酰转移酶),dna修饰酶(例如dna甲基转移酶)等等。

用于调变(例如抑制或激活)细胞中靶核酸(例如靶rna)的基因表达的方法包括向细胞中导入(例如,电穿孔)本文所述的修饰的sgrna以及cas核酸酶(例如cas9多肽)或其变体或片段、编码cas核酸酶(例如cas9多肽)或其变体或片段的mrna、或包含编码cas核酸酶(例如cas9多肽)的核苷酸序列或其变体或片段的重组表达载体。在一些实施方案中,cas核酸酶(例如cas9)变体已经降低或缺乏内切核酸酶活性。cas核酸酶变体可以含有两个或更多个氨基酸取代,使得多肽不能切割双链dna。cas核酸酶(例如cas9)变体可具有内切核糖核酸酶活性并可切割靶rna。

g.预防或治疗受试者的遗传疾病的方法

本文描述的修饰的sgrna可用于调控基因调控的效率。例如,相对于相应的未修饰的sgrna,修饰的sgrna可以以增强的活性诱导基因调控。在一些情况下,增强的活性包括修饰的sgrna的增加的稳定性和/或修饰的sgrna对于靶核酸的增加的特异性。作为另一个实例,相对于相应的未修饰的sgrna,修饰的sgrna可以以降低的细胞毒性诱导基因调控。

修饰的sgrna可以应用于遗传疾病的基于靶向核酸酶的治疗剂。目前用于精确纠正原代患者细胞基因组中的基因突变的方法效率非常低(可以被精确编辑的细胞少于1%)。本文提供的经修饰的sgrna可增强基因组编辑的活性、并增加基于基因组编辑的疗法的功效。在具体的实施方案中,修饰的sgrna可以用于具有遗传疾病的受试者中的基因的体内基因编辑。修饰的sgrna可经由任何合适的施用途径、以足以增强基于核酸酶的疗法的效果(例如,提高基因组编辑效率)的剂量或量施用于受试者。

本文提供了通过纠正与疾病相关的基因突变来预防或治疗有需要的受试者的遗传疾病的方法。该方法包括以足以纠正突变的量向受试者施用本文所述的修饰的sgrna。本文还提供了本文所述的修饰的sgrna在制备用于通过纠正与疾病相关的基因突变来预防或治疗有需要的受试者的遗传疾病的药物中的用途。修饰的sgrna可以包含组合物中,所述组合物还包含cas核酸酶(例如cas9多肽)或其变体或片段、编码cas核酸酶(例如cas9多肽)或其变体或片段的mrna、或包含编码cas核酸酶(例如cas9多肽)或其变体或片段的核苷酸序列的重组表达载体。在一些情况下,修饰的sgrna被包括在上述递送系统中。

可通过该方法纠正的遗传疾病包括但不限于x连锁严重联合免疫缺陷、镰状细胞性贫血、地中海贫血、血友病、瘤形成、癌症、年龄相关性黄斑变性、精神分裂症、三核苷酸重复疾病、x染色体易裂症、朊病毒相关病症、肌萎缩性侧索硬化、药物成瘾、自闭症、阿尔茨海默病、帕金森病、囊性纤维化、血液和凝血疾病或病症、炎症、免疫相关疾病或病症、代谢疾病、肝疾病和病症、肾脏疾病和病症、肌肉/骨骼疾病和病症(例如肌营养不良、杜兴肌营养不良)、神经和神经元疾病和病症、心血管疾病和病症、肺部疾病和病症、眼部疾病和病症、病毒感染(例如、hiv感染)等。

v.实施例

提供以下实施例来说明而不是限制要求保护的发明。

实施例1.化学修饰的引导rna增强人原代细胞中的crispr/cas基因组编辑。

crispr/cas介导的基因组编辑依赖于引导rna,引导rna在cas内切核酸酶的促进下指导位点特异性dna切割。在这里,我们报告了化学合成的单引导rna(sgrna)的应用,并显示,通过化学改变修饰sgrna,显著增强了人原代t细胞和cd34+造血干细胞和祖细胞的基因组编辑。这种方法为基因组编辑的流线化提供了一种简便、高效的途径,并且为加速crispr/cas技术在生物技术和治疗上的广泛应用提供了可能。

利用工程化核酸酶编辑基因组是一项基本上可以修饰任何感兴趣的基因组序列的突破性技术(porteus,m.h.&carroll,d.,naturebiotechnology23,967-973(2005))。该技术利用工程核酸酶产生位点特异性双链断裂(dsb),然后通过内源性细胞修复机制解决dsb。其结果或是特定位点通过诱变性非同源末端连接(nhej)而被突变,在突变位点产生插入或缺失(in/dels),或是基因组序列通过同源重组(hr)使用外源导入的供体模板而被精确改变(hendel等,trendsinbiotechnology33,132-140(2015))。该项技术最近增加的一个主要成员是成簇规则间隔的回文重复(crispr)/cas系统,该系统由rna引导的核酸酶(cas)和短引导rna(sgrna)组成jinek,m.etal.,science337,816-821(2012),mali,p.etal.,science339,823-826(2013),cong,l.etal.,science339,819-823(2013),hsuetal.,cell157,1262-1278(2014))。引导rna由两种rna组成,它们称为crisprrna(crrna)和反式激活crrna(tracrrna),为了基因编辑目的,二者通常融合成嵌合的单引导rna(sgrna)。sgrna由100个核苷酸(nt)组成,其5'末端20nt可通过watson-crick碱基配对与靶dna序列杂交,并引导cas内切核酸酶切割靶基因组dna(图1a)。sgrna可以以rna的形式递送到细胞中,例如,通过体外转录制备,或通过使用具有由rna聚合酶iii启动子表达的sgrna的dna载体制备。尽管使用crispr/cas系统的基因组编辑在人细胞系中效率高,但是在原代人细胞中的crispr/cas基因组编辑通常更有难度。这种活性降低的原因仍然难以确定,但是转染率、启动子活性、核酸外切酶活性、递送核酸时的天然干扰素免疫应答以及dna修复保真度等方面的差异可能是相关的促成因素。在这里,我们证明了化学合成的sgrna可以诱导高水平的基因组编辑,并进一步显示,化学改变的sgrna可以显著增强人类原代t细胞和cd34+造血干细胞和祖细胞(hspc)中的基因组编辑。在化学修饰的sgrna在这些细胞类型中导致基因组编辑增加的基础上,通过以mrna或蛋白质、而不是dna表达质粒的形式递送cas9,进一步提高了该增加的效果,从而为crispr/cas系统生成了一个简单而完整的基于rna或核糖核蛋白(rnp)的递送系统。

结果

rna合成技术的最新进展使得化学合成长度超过100nt的rna变得可行(dellinger,d.j.etal.,journaloftheamericanchemicalsociety133,11540-11556(2011))。为了测试化学合成的sgrna用于基因组编辑的效用,我们根据先前述的程序(dellinger,d.j.etal.,journaloftheamericanchemicalsociety133,11540-11556(2011)),使用abi394合成仪和2'-o-硫代氨基甲酸酯保护的核苷亚磷酰胺合成了100nt的全长sgrna。我们还合成了在两个末端具有各种化学修饰的sgrna,以评估它们对功效的影响(图1a和1b以及表1)。当存在时,包含2'-o-甲基(m)、2'-o-甲基3'硫代磷酸酯(ms)、或2'-o-甲基3'硫代pace(msp)的化学修饰物被纳入5'末端和3'末端的三个末端核苷酸中。选择这三种修饰用于评估是因为它们先前被报道对血清和蛇毒磷酸二酯酶稳定,而且据报道它们对核酸的免疫刺激性质有多种多样的影响(deleavey,g.f.&damha,m.j.,journaloftheamericanchemicalsociety125,940-950(2003),hendeletal.,cellreports7,293-305(2014))。我们选择了先前报道的在细胞系中对以下各种人基因产生高基因编辑率的三种sgrna(hendeletal.,cellreports7,293-305(2014),cradicketal.,nucleicacidsresearch41,9584-9592(2013)):(i)il2rg,该基因中的突变是造成先天性原发性免疫缺陷scid-x1的原因,(ii)hbb,该基因中的突变导致镰状细胞性贫血和地中海贫血,和(iii)ccr5,该基因编码hiv的一种共受体,目前正在研究其作为抗hiv临床试验中治疗性基因编辑的靶标(tebas,p.etal.,thenewenglandjournalofmedicine370,901-910(2014))。我们首先测试了在纯化的重组cas9蛋白和每种合成sgrna的存在下的体外靶dna切割。所有化学合成的和修饰的sgrna都在cas9蛋白的存在下有效地切割了它们的dna靶标(图3和4)。

我们接下来检查了合成的sgrna是否能够在人类细胞系中诱导生成可指示诱变性nhej和基因破坏的目标in/del。我们通过核转染将每个sgrna与编码cas9的dna质粒一起递送到k562细胞中,并分析in/del频率。投递1μg合成的未修饰的靶向il2rg基因座的sgrna后,产生了2.4%的in/del频率,证明了其是有功能的(图1c,浅阴影条)。对于m修饰的sgrna,我们观察到in/del频率略微增加到13.5%,这表明稳定性比未修饰的sgrna略有提高。引人注目的是,相同数量的化学修饰的sgrna使in/del频率分别增加到68.0%(ms修饰的sgrna)和75.7%(msp修饰的sgrna)。将修饰的sgrna的量增加到20倍后,所有in/del频率均进一步增加,使ms和mspsgrna分别达到75.3%和83.3%(图1c,深色阴影条形),这与通过质粒表达crispr/cas系统获得的频率可以比较。对于hbb和ccr5靶标获得了非常相似的结果(图1c),这证明了化学修饰的sgrna具有一般性的在人类细胞中指导高水平的靶向基因突变的能力。我们接下来确定这些合成的sgrna是否可以通过hr刺激基因靶向。我们为3个基因座一一设计了靶向载体,其中crispr切割位点的5'和3'有约0.8kb的同源臂。在同源臂之间,我们加入了一个gfp表达盒,在hr成功时,其可以在稳定地整合在靶基因座上(lombard.etal.,naturemethods,8,861-869(2011);voitetal.,nucleicacidsresearch42,1365-1378(2014))。在所有三个靶基因座上,ms和mspsgrna刺激的hr水平显著高于未修饰的sgrna及m修饰的sgrna(图1d)。在更高的sgrna水平(20μg)下,我们测得il2rg,hbb和ccr5处mspsgrna的hr率分别为20.6%,25.5%和50.0%。这些频率与完全由质粒表达crispr/cas系统获得的频率相当或更高。

为了研究化学修饰的sgrna是否影响脱靶活性,我们使用深度测序来测量每个sgrna的三个不同位点的脱靶突变频率。通过计算机预测工具(hsuetal.,naturebiotechnology31,827-832(2013),cradicketal.,moleculartherapy.nucleicacids,3,e214(2014))预测了这些脱靶位点中的八个,而对于hbbsgrna,我们纳入了一个脱靶位点,先前显示sgrna对该脱靶位点具有高水平脱靶活性(cradicketal.,nucleicacidresearch,42,9584-9592,(2013))。对于八个预测位点中的四个,我们发现所有化学合成的sgrna脱靶活性均接近背景,即使检测到修饰的sgrna的高水平的中靶活性(图1e和5,表5)。对于其他四个预测位点,sgrna的化学修饰倾向于导致更高的脱靶活性,但是活性水平变化不定。在某些情况下,修饰的sgrnas的中靶与脱靶的in/del频率之比改善,提示相对特异性改善。这些结论的细节总结如下。对于未修饰的sgrna我们只检测到两个脱靶位点(il2rg‘脱靶2’和hbb‘脱靶1’,先前已证明hbbsgrna对其显示出显著的脱靶活性)处的活性,这使我们能够比较未修饰和修饰的sgrna之间的中靶:脱靶比率。在il2rg位点,未修饰的sgrna的中靶:脱靶比率与mspsgrna相比好5.8倍(图1e和表5),而对于hbb位点,mspsgrna的中靶:脱靶比率与未修饰的sgrna相比好2.6倍和1.5倍(分别对于1μg和20μg)(图1e和5,表5)。将修饰的sgrna的中靶:脱靶比率与sgrna质粒的中靶:脱靶比率相比较,在ccr5‘脱靶2’和il2rg‘脱靶2’处sgrna质粒的比率更好,而对于hbb‘脱靶1’,mspsgrna的中靶:脱靶比率更好(图1e和表5)。除了hbb脱靶1位点之外,测得的最高脱靶频率是使用il2rgsgrna在“脱靶2”处,当使用1μg和20μgmssgrna时,产生的in/del频率分别为1.0%和7.8%。有趣的是,与mssgrna相比,相同位点的il2rgmspsgrna尽管具有更高的中靶活性,但脱靶活性分别低2.7倍和2.8倍。同样,mspsgrna在hbb脱靶-1位点处——先前hbbsgrna在该位点显示显著的脱靶活性——的脱靶活性相比mssgrna较好。在ccr5'脱靶2'处观察到相反的情况,与mssgrna相比,mspsgrna具有更高的脱靶活性。总的看来,这些结果提示,通常情况下化学修饰的sgrna保持高特异性。观察到的中靶:脱靶比率的差异表明对sgrna的化学改变可能具有调变中靶:脱靶靶活性的潜能,然而,特定的化学改变的影响似乎是序列依赖性的,并且还可能取决于在其他因素,如细胞类型和递送条件。这些观察结果是否可推广到针对不同物种中不同基因座的其他sgrnas,将需要进一步的研究。

为了进一步探索化学修饰的sgrna在人类细胞系中的性能,我们转向了一种“全rna”递送平台,其共同递送sgrna和编码cas9的mrna。我们使用不同量的cas9mrna(1-15μg)以及不同量的mspsgrna(1-20μg)(图6),测量了il2rg基因座上的in/del频率。我们观察到,所有测试的浓度下均类似地具有81-90%的高in/del比率,例外是当使用1μg的cas9mrna和mspsgrna时,比率稍微降低至70%,这显示这种“全rna”方法的高效率。为了探索化学修饰是否对sgrna活性的半衰期有影响,我们进行了一个实验,其中我们通过核转染共同递送或顺序递送cas9mrna和各种合成的靶向il2rg的sgrna(图7)。cas9mrna与ms或mspsgrna的共同递送分别导致87%和84%的in/dels的高编辑频率(图1f)。msgrna产生66%in/del,而未修饰的sgrna仅产生7.0%,这清楚地表明当与cas9mrna共递送时sgrna修饰的重要性。有趣的是,对于所有四种sgrna,先递送cas9mrna,4或8小时后再递送sgrna,产生了可比较的高水平in/del(83.1%-92.4%),效率在未修饰和化学修饰的sgrna之间没有差异(图1f)。相比之下,当先递送sgrna,4、8、12或24小时后再递送cas9mrna时,到4小时的时间点时用未修饰的sgrna获得的in/del频率已经下降到接近背景水平。对于msgrna,我们也观察到in/del频率降低到接近背景水平,但是这个下降有稍微延迟,表明稳定性比未修饰的sgrna略有改善。对于mssgrna,直到24小时的时间点我们才观察到in/del频率下降,此时in/del频率下降到53%。引人注目的是,对于mspsgrna,即使在sgrna和cas9递送之间的24小时延迟之后,我们也没有检测到活性显著下降。这些结果符合我们的模型:sgrna末端修饰提高细胞内稳定性,因此可增加当cas9mrna和sgrna共同递送到人类细胞中时基因组编辑的功效。当先递送cas9时未修饰的sgrna指导的in/del频率未降低这一事实提示cas9蛋白可保护sgrna免于降解。为了研究这个假设,我们将未修饰的il2rgsgrna或msil2rgsgrna与重组cas9蛋白复合,然后以两种不同的量将这种活性rnp电穿孔到k562细胞中(图1g和8)。在此低rnp含量下,当使用mssgrna时,我们观察到与未修饰的sgrna相比3.8倍高的in/del频率(35.7%比9.5%),而在高rnp量下,这种增加是2.3倍(81.0%比35.9%)。然而,ms和未修饰的sgrna之间的这个比例显著小于当用sgrna与cas9mrna共同递送时观察到的比例(与图1f'共递送'比较),表明cas9蛋白确实可部分地保护未修饰的sgrna免于降解。尽管如此,当递送与cas9蛋白预先复合的sgrna时,对sgrna进行修饰仍能提高基因编辑效率。接下来,我们比较了未修饰的il2rgsgrna和msil2rgsgrna在和cas9质粒、cas9mrna一起递送或与cas9蛋白预先复合递送时,在三个先前研究的脱靶位点上的脱靶活性。当使用未修饰的sgrna时,我们在所有三个cas9来源和全部三个脱靶位点上均检测到低水平的in/del(<0.37%)(图9a-b)。对于mssgrna,我们观察到,当递送cas9质粒时,与递送cas9mrna相比,在所有三个脱靶位点处的中靶:脱靶比均有改善(2.6-3.0倍)。值得注意的是,在递送与mssgrna形成的cas9rnp时,与cas9质粒和mrna相比,我们在所有三个位点上均检测到显著更好的中靶-脱靶比,其中在两个位点处的脱靶活性接近背景。总之,当与cas9mrna共递送或作为rnp递送时,化学修饰的sgrna与未修饰的sgrna相比在人细胞系中显示出显著的基因编辑优势。

接下来我们在原代细胞中测试了化学修饰的sgrna。目前正在临床试验中探索使用锌指核酸酶(zfn)破坏cd4+t细胞中的ccr5基因作为抗hiv治疗方法(tebasetal.newengjourofmed,370,901-910(2014))。然而,最近的一项研究发现,人类原代t细胞的基因组固有地难以使用单sgrna的crispr/cas9质粒系统来编辑,而且能在细胞系中引起高频率等位基因修饰的sgrna在t细胞中的效力大大降低,即使对转染细胞加以富集也是如此(mandaletal.,cellstemcell,15,643-652(2014))。我们在受刺激的人原代t细胞中将经化学修饰的ccr5sgrna与编码cas9的mrna共递送来测试该sgrna。值得注意的是,在使用gfpmrna时,通过流式细胞术测量,我们始终观察到t细胞中超过98%的核转染效率(图10),因此无需富集转染细胞。用编码sgrna和cas9二者的sgrna质粒进行核转染并未导致高于背景的等位基因修饰率(图2a)。然而,将mspsgrna与cas9的dna表达质粒共转染能够将活性挽救到9.3%的in/del频率。用cas9mrna与未修饰的sgrna或msgrna进行核转染未导致高于背景的等位基因修饰率。相反,用ms或mspsgrna与cas9mrna一起核转染分别产生了引人注目的48.7%和47.9%的in/del频率。增加sgrna或cas9mrna的量未产生更高的in/del频率(图11)。对于用cas9mrna和mspsgrna核转染的细胞,我们在cd4+、cd8+及总t细胞群中发现了相近的等位基因修饰频率(图12)。重要的是,对于mspsgrna,观察到的高修饰频率在历时21天的时间测量时是稳定的(图13),而且我们用修饰的sgrna进行核转染后对仅观察到对细胞生存力和增殖的微小影响,与之形成对照的是,质粒核转染导致显著的细胞死亡和增殖潜力下降(图14和15)。我们还在未受刺激的t细胞中测试了mssgrna,已经证明未刺激的t细胞比受刺激的t细胞更难编辑(yietal.,moleculartherapynucleicacids,3,e198(2014))。与受刺激的t细胞形成对照的是,未受刺激的t细胞中的in/del频率范围为6.6%至22.2%,显示更高的供体变异性(图16)。未受刺激的t细胞中的这些编辑频率虽然低于受刺激的t细胞,但仍然可能有用处,特别是在t细胞的工程化中,因为t细胞工程化中的活化和延长培养可能影响细胞的后续生物功能。我们接下来使用未修饰的sgrna和mssgrna在受刺激的原代t细胞中测试了rnp递送(图2b)。与在k562细胞中获得的结果类似,我们观察到mssgrna的in/del频率比未修饰的sgrna提高了2.4倍(30.7%对12.8%),这进一步支持了化学修饰的sgrna以与cas9蛋白预复合的形式递送时的用处。

人们对hspc中的基因疗法用于治疗遗传性或获得性造血系统疾病已经进行了大量探索。我们测试了靶向il2rg和hbb的化学修饰sgrna在从经动员的外周血分离的cd34+hspc中是否有功能。同样,表达sgrna与cas9二者的sgrna质粒未产生可检测的in/del频率,而用mspsgrna与cas9dna表达质粒共转染将对il2rg和hbb的in/del频率分别挽救至3.2%和5.2%(图2c和17)。与我们在t细胞中的观察结果相似,当使用未修饰的sgrna或msgrna与cas9mrna共转染时,我们未在任一基因座处检测到in/dels,但ms和mspsgrna各自产生了高的in/del频率:对于il2rg,mssgrna和mspsgrna的in/del频率分别为17.5%和17.7%;而对于hbb的频率更高,分别为23.4%和22.0%。进一步的研究可以阐明化学修饰的sgrna对hspc的遗传修饰是否影响其多能性能力,或者长期再增殖干细胞(long-termrepopulatingstemcells)和谱系定型的祖细胞(lineage-committedprogenitorcells)之间编辑效率是否有所不同。

最近的一项研究显示同时使用两种sgrna可改善人原代t细胞和cd34+hspc中的基因破坏(mandaletal.,cellstemcell,15,643-652(2014))。我们化学合成了ms和mspccr5sgrna,它们具有在该研究中报道的序列(称为“d”和“q”),而二者切割位置相隔205bp。我们将它们与cas9mrna共递送,在t细胞和cd34+hspc中测试了它们。当两个sgrna单独使用时,我们使用tide分析定量了等位基因修饰频率。当使用两者时,我们通过对克隆的pcr产物进行测序来定量等位基因修饰频率,这也使得我们能够定量全部的编辑事件,包括之前报道的两个sgrna靶位点之间序列缺失的高发生率。当在原代t细胞中单独使用时,“d”sgrna分别对ms和mspsgrna产生56.0%和56.3%的in/del,“q”sgrna分别产生62.6%和69.6%的in/del(图2d和18a)。当组合使用时,等位基因修饰的频率增加,因为我们分别观察到ms和mspsgrna分别为73.9%和93.1%,其中大部分修饰事件是两个sgrna靶位点之间的缺失(图18b)。在cd34+hspc中,我们的观察结果相似,尽管总体频率较低。因此,对于'd'sgrna,我们观察到ms和mspsgrna分别有9.8%和11.2%的等位基因修饰频率,'q'sgrna分别有17.8%和19.2%(图2d和18b)。当组合使用时,频率对于ms和mspsgrna而言分别增加到37.8%和43.0%。我们得出结论:使用两种化学修饰的sgrna是一种高度有效的促进原代人t细胞和cd34+hspc中的基因破坏的方法。

图19提供了另外的实验数据,其显示ms修饰的sgrna在cd34+hspc中比相应的未修饰的sgrna表现更好。图20显示修饰的sgrna可以用于高效的多重化基因组编辑。

在该研究中,我们显示化学合成的sgrna可以有效地用于靶向基因组编辑,并证明化学修饰的sgrna显著增强人原代t细胞和cd34+hspc中的基因组编辑效率。化学合成的sgrna和修饰的sgrna提供相比于表达的或体外转录的sgrnas提供了优势,包括:(1)功效增加;(2)稳健、可规模放大地生产供生物技术和治疗应用的高纯度sgrna;(3)sgrna设计的灵活度更大,这与通常用于质粒表达或体外转录sgrna的u6或t7启动子对第一转录核苷酸施加的约束形成了对照;(4)能够采用高活性的“仅rna”或rnpcrispr平台,它们在原代细胞中具有比基于dna质粒的系统更低的细胞毒性。将crispr/cas系统简化为纯rna或rnpcrispr系统,使其适合于配制在不同的纳米颗粒载体中供体内递送,使得核酸酶不会像其作为病毒载体的一部分递送时那样连续表达。此外,我们预计化学修饰的sgrna将增强多重基因组编辑以及高通量多孔实验。我们也预计修饰的sgrna将会完善多种crispr相关技术,例如用于抑制和激活基因表达的crispri/crispra系统(gilbert,l.a.etal.,cell159,647-661(2014));用于基因组座位动态可视化的crispr成像工具(chen,b.etal.,cell155,1479-1491(2013));和crispr介导的rna识别和切割(o'connell,m.r.etal.,nature516,263-266(2014))。可进一步发展该技术以改善对目标细胞或组织的细胞内递送,并为与各种分子缀合用于成像和生化研究提供可能。未来的研究可以研究更多种类的化学修饰,探索用于合理设计优化的sgrna的不同位置的修饰,以及修饰sgrna活性增强的机制。总之,我们相信化学修饰的sgrna,如本文中提供的这些,将会显著改善多种crispr/cas生物技术和治疗应用。

材料和方法

1.sgrna合成

所有rna寡聚物均使用2'-o-硫羰氨基甲酸酯保护的核苷亚磷酰胺(sigma-aldrich,st.louis,mo,usa或thermofisher,usa)在abi394合成仪(lifetechnologies,carlsbad,ca,usa)上根据前人描述的程序(dellingeretal.,journaloftheamericanchemicalsociety133,11540-11556(2011))合成。2'-o-甲基亚磷酰胺购自thermoscientific,grandisland,ny,并在与2'-o-硫代氨基甲酸酯保护的亚磷酰胺相同的条件下掺入rna寡聚物中。基本上根据公开的方法(threlfalletal.,organic&biomolecularchemistry,10,746-754(2012);dellingeretal.,journaloftheamericanchemicalsociety,125,940-950(2003))合成用于合成硫代膦酰基乙酸酯(thiopace)修饰的rna的2'-o-甲基-3'-o-(二异丙基氨基)膦基乙酸-1,1-二甲基氰乙基酯-5'-o-二甲氧基三苯甲基核苷。对于含硫代磷酸酯的寡聚物,将偶联反应后的碘氧化步骤用硫化步骤代替,使用3-((n,n-二甲基氨基甲叉基)氨基)-3h-1,2,4-二噻唑-5-酮在吡啶-乙腈(3:2)混合物中的0.05m溶液反应6分钟。除非另有说明,用于固相rna合成的试剂购自glenresearch(sterling,va,usa)。

使用反相hplc纯化所有寡核苷酸,并使用与agilent6520q-tof质谱仪(agilenttechnologies,santaclara,ca,usa)偶联的agilent1290infinity系列lc系统通过lc-ms进行分析。表1显示了使用的所有sgrna的序列以及从所发现的峰的电荷状态系列解卷积获得的质量。解卷积使用masshunter定性分析(版本b.06.00)软件(agilent)完成。

表1用于本研究的所有sgrna的总览

标出了sgrna序列以及计算和观察到的分子量。具有2'-o-甲基修饰的核苷酸标有下划线。磷酸盐骨架的修改用●(ms)和◆(msp)表示。

2.体外切割测定

通过对质粒携带的人序列进行制备性pcr扩增来制备4kb的pam可寻址靶物。在20μl反应体积中,在50nmsgrna,39nm重组纯化的cas9蛋白(agilent)和10mmmgcl2,ph7.6存在下,将50fmoles的线性化dna靶物在37℃温育30分钟。完成后,加入0.5μl的rnaceit(agilent),并在37℃下继续温育5分钟,然后在70℃下温育15分钟。随后加入0.5μl的蛋白酶k(分子生物学级,neb)并在37℃温育15分钟。将等分试样加载到dna7500labchip中,并在bioanalyzer2200上分析。通过下式计算切割频率:(a/b)×100,其中'a'是两种切割产物的条带强度的总和,b是切割的和未切割的dna的条带强度的总和。

3.质粒

通过将20bp寡核苷酸靶序列克隆到含有人密码子优化的spcas9表达盒和驱动嵌合sgrna表达的人u6启动子的px330(addgene质粒#42230)中来构建sgrna表达载体(参见表1的sgrna序列)。

所有三种质粒靶向载体携带约2×800bp的同源臂,同源臂是利用从k562细胞分离的基因组dnapcr扩增相应基因座而产生的。然后使用标准克隆方法将同源臂克隆到一个基于pbluescriptsk+的约2900个碱基对的载体中。hbb和ccr5供体在两条同源臂之间均含有驱动gfp表达的ef1α启动子。il2rg供体缺乏启动子,依赖于il2rg基因的内源活性来驱动gfp表达。il2rg靶向载体的核酸序列如seqidno:1所示。hbb靶向载体的核酸序列如seqidno:2所示。ccr5靶向载体的核酸序列如seqidno:3所示。

4.细胞培养和核转染

在37℃,5%co2和环境氧水平下培养k562和t细胞。在37℃,5%co2和5%o2下培养cd34+造血干/祖细胞(hspc)。将k562细胞维持在补充有10%牛生长血清、100mg/ml链霉素、100单位/ml青霉素和2mml-谷氨酰胺的rpmi1640(hyclone)中。使用lonzanucleofector2b(程序t-016)和含有100mmkh2po4、15mmnahco3、12mmmgcl2×6h2o、8mmatp、2mm葡萄糖(ph7.4)的核转染缓冲液核转染k562细胞。核转染条件:将100μl核转染溶液,106个细胞,1至20μg化学修饰的sgrna,1至15μgcas9mrna(cas9mrna,5mec,ψ,产品编号:l-6125,trilinkbiotechnologies,sandiego,ca,usa),2μgsgrna/cas9编码质粒或5μghr供体质粒。使用人泛t细胞分离试剂盒(miltenyibiotec,sandiego,ca,usa)从自斯坦福医学院血液中心获得的血沉棕黄层分离cd3+t细胞。将cd3+细胞维持在补充有5%人血清(sigma-aldrich,st.louis,mo,usa)、100iu/ml人重组il-2(peprotech,rockyhill,nj,usa)、和10ng/ml人重组il-7(bdbiosciences,sanjose,ca,usa)的x-vivo15(lonza,walkersville,md,usa)中。在核转染之前,用固定的抗cd3抗体(克隆:okt3,ebioscience,sandiego,ca,usa)和可溶性抗cd28抗体(克隆:cd28.2,ebioscience)活化t细胞三天。对于未激活的cd3+t细胞,分离后立即核转染细胞。使用lonzanucleofector2b(程序u-014)和人t细胞nucleofector试剂盒(vpa-1002,lonza)对t细胞进行核转染。核转染条件:将100μl核转染溶液、106个细胞、10-20μg化学修饰的sgrna、15-30μgcas9(或15μgegfpmrna,trilinkbiotechnologies,sandiego,ca,usa),1μgsgrna/cas9编码质粒。经动员的人外周血cd34+hspcs购自allcells并根据制造商的说明解冻。在补充有scf(100ng/ml)、tpo(100ng/ml)、flt3-配体(100ng/ml)、il-6(100ng/ml)、和stemregenin1(0.75mm)的x-vivo15(lonza)中维持cd34+hspc。使用lonza4d-nucleofector(程序eo-100)和p3原代细胞4d-核转染试剂盒(v4xp-3024)对cd34+hspc进行核转染。核转染条件:100μl核转染溶液,5×105个细胞,10μg化学修饰的sgrna,15μgcas9mrna,1μg质粒。对于cas9rnp实验,cas9蛋白购自pnabio(thousandoaks,ca,usa)或lifetechnologies(carlsbad,ca,usa)。对于除了图8之外的所有rnp实验,使用来自pnabio的cas9蛋白。将cas9蛋白与sgrna以cas9:sgrna摩尔比1:2.5在25℃复合10分钟。如上所述用含有106个细胞的100μl的相应核转染溶液将rnp核转染入k562细胞或t细胞中。对于双sgrna实验,总sgrna量为10μg(单独使用时为10μg,一起使用时为2x5μg)。对于t细胞和cd34+hspc二者,均将sgrna与15μgcas9mrna核转染至106个细胞中。t细胞核转染如上所述进行,而cd34+hspcs的核转染与t细胞核转染相似,使用lonzanucleofector2b(程序u-014)和人t细胞nucleofector试剂盒(vpa-1002,lonza)进行。核转染后直接将cd34+hspc在30℃温育24小时,然后将其转移至37℃直至收获基因组dna。

5.流式细胞术和荧光激活细胞分选(facs)

对于hr实验,取决于细胞类型,在核转染后2-3周,当没有剩余的来自附加型质粒的egfp表达时对细胞进行分析。在accuric6流式细胞仪(bdbiosciences,sanjose,ca,usa)上测量egfp表达。使用live/deadfixablereddeadcellstainkit(lifetechnologies,carlsbad,ca,usa)根据制造商的说明测量细胞死亡,并在accuric6流式细胞仪上分析细胞。为了将cd3+t细胞分选成cd4+和cd8+细胞群,用pe-cy7抗人cd4(克隆:rpa-t4,tonbobiosciences,sandiego,ca,usa)和apc抗人cd8a(克隆:rpa-t8,tonbobiosciences)的混合物染色细胞,并在facsariaiisorp上分选这两个群体。

6.使用tide和t7测定法测量等位基因修饰频率

对于tide和t7测定,在核转染三天后(如果未另外指出的话)使用quickextractdna提取溶液(epicentre,madison,wi,usa)按照制造商的说明从细胞中提取gdna。使用iproof高保真母预混物(bio-rad,hercules,ca,usa)和以下引物对产生跨越sgrna基因组靶位点的pcr扩增子:

il2rg_fw(seqidno:84):

5’-tcacacagcacatatttgccacaccctctg-3’,

il2rg_rv(seqidno:85):

5’-tgcccacatgattgtaatggccagtgg-3’,

hbb_fw(seqidno:86):5’-ccaactcctaagccagtgccagaagag-3’,

hbb_rv(seqidno:87)5’-agtcagtgcctatcagaaacccaagag-3’,

ccr5_fw(seqidno:88):5’-gcacagggtggaacaagatgg-3’,

ccr5_rv(seqidno:89):5’-caccaccccaaaggtgaccgt-3’。

对于t7测定,纯化pcr扩增子,取200ng变性并在热循环仪中重新退火,并根据制造商的方案用t7核酸内切酶i(newenglandbiolabs,waltham,ma,usa)消化。将经过消化的dna在4-20%tbe聚丙烯酰胺凝胶上电泳,用diamondnucleicaciddye(promega,madison,wi,usa)染色,并在chemidocxrs+(bio-rad)上可视化。使用imagelabsoftware(bio-rad)分析条带强度,并使用以下公式计算等位基因修饰频率:100×(1-(1-切割的分数)^0.5)。为了使用tide(trackingbyin/delsbydecomposition,brinkmanetal,nucleicacidsresearch42,e168(2014))分析等位基因修饰频率,使用两种引物对纯化的pcr产物进行sanger测序,并且在线tide软件(可在网站tide.nki.nl.访问)分析每个序列的色谱图。分析使用来自模拟转染的样品的参考序列进行。参数被设置为:最大in/del大小为10个核苷酸,并且分解窗口覆盖具有高质量迹线的最大可能窗口。所有低于3.5%的检测灵敏度的tide分析被设定为0%。对于topo克隆的pcr片段的测序,使用iproof高保真母预混物和引物5’-ggctgttgtcatctatgaccttccc-3’(seqidno:90)和5’-tgtaaactgagcttgctcgctcg-3’(seqidno:91)产生跨越切割位点的2.1kb扩增子进行25个循环,每个循环包括72℃退火温度和2分钟延伸时间。使用zeroblunttopopcr克隆试剂盒(lifetechnologies)根据制造商的方案将pcr反应产物直接亚克隆到质粒中。将topo反应物转化到xl-1blue感受态细胞中,用卡那霉素涂布在琼脂平板上,由mclab(southsanfrancisco,ca,usa)直接从平板测序单个菌落,方法是滚环扩增后使用引物5'-gcacagggtggaacaagatgg-3'(seqidno:92)测序。

7.增殖测定

为了测量核转染后t细胞的增殖,使用celltiter-glo2.0测定法(promega,madison,wi,usa)。在核转染之后即时,将t细胞以3×104个细胞/孔转移至多个96孔u底96孔板。在核转染之后即时,以及每隔24小时,将100μl培养基中的细胞转移至白色96孔板中的,并且按照制造商的指导添加100μlcelltiter-glo2.0。在tecaninfinite200pro(tecan,switzerland)上使用1秒的积分时间读取荧光。

8.深度测序以定量基因组修饰的效率和特异性

对于每个基因靶向实验,在转染48小时后从各种crispr处理k562细胞和对照k562细胞中提取基因组dna。通过两轮pcr扩增crispr靶标和三个脱靶(表2)的两侧的基因组区域,以附接(处理特异性的)条形码和illumina测序衔接子(表3)。将加有条形码的pcr扩增子等摩尔汇集,通过旋转柱纯化并在illuminamiseqdna测序仪平台上测序。更多的细节参见下文的“9.生成crispr中靶和预测的脱靶扩增子供深度测序”一节。

表2提供了通过pcr扩增子的深度测序询问的中靶和脱靶的基因座的列表。对于靶向ccr5、hbb和il2rg的crispr实验,提供了预期的基因组靶序列(“on”)和三个计算预测的off-靶序列(“off1-3”),以及它们的基因组位置(人类基因组构建组装体hg38)。所选择的脱靶序列是由cosmid(cradicketal.,moleculartherapy.nucleicacids3,e214(2014))和optimizedcrisprdesign(hsuetal.,naturebiotechnology,31,827-832(2013))网上工具(mit设计)共同预测的得分最高者,例外是hbb-off3,它只被cosmid预测为具有显著活性。预测的目标活性随着cosmid得分值的增加和“mit设计”得分值的降低而增加,脱靶序列中的pam位点和错配分别用红色和粗体文本表示。

表2.通过pcr扩增子的深度测序询问的中靶及脱靶基因座的列表。

表3提供了用于产生中靶与脱靶扩增子以通过深度测序定量in/del频率的寡核苷酸引物的列表。分别用下划线和粗体显示了基因特异性扩增子引物的基因特异性杂交序列和illumina条形码引物的条形码。

表3.用于产生中靶与脱靶扩增子以通过深度测序定量in/del频率的寡核苷酸引物的列表。

分别用下划线和粗体显示了基因特异性扩增子引物的基因特异性杂交序列,以及illumina条形码引物的条形码。

为了分析测序数据,将来自不同处理的读段按照其相应的处理条形码进行分拣,并使用bwa-mem(lietal.,bioinformatics26,589-595(2010))(bwa-0.7.10)以默认参数将它们映射至基因组。从分析中过滤掉不一致配对的末端映射(间隔>1kbp)以及由bwa-mem中的默认参数定义的低质量映射读段和二次比对读段。对于每个中靶和脱靶区域,我们计算了在预测的切割位点周围具有in/del的读段的%,其中预测的切割位点估计位于pam位点上游的第3个和第4个位置之间。通过使用in/del[i]=(i[i]+d[i])/c[i]来计算基因组中每个位置的in/del%,其中d[i]和i[i]分别表示在位置i具有任意大小的删除或插入的读段的数目,并且c[i]指示映射到任何包含位置i的基因组区间的读段的数目。然后通过in/del[c]计算每个靶的in/del%,其中c是预测的剪切位点,位于pam位点上游第四个位置。在第4位置具有同型核苷酸序列,在il2rg中为“aa”,ccr5中为“ccc”,以及插入事件的情况下,bwa_mem比对器无法解析插入的核苷酸的位置。这是通过用比对报告中的相关位置取代第4位来加以纠正,具体而言,针对il2rg和ccr5分别采取位置3和位置6作为脱靶位置。

9.生成crispr中靶和预测的脱靶扩增子供深度测序

对于每个靶基因座,用1μg或20μg合成的引导rna(未修饰的、m、ms、或msp),以及2μg的cas9表达质粒(px330)、2μg的编码sgrna与cas9蛋白二者的sgrna质粒(阳性对照)、或仅2μg的px330(仅cas9,阴性对照)转染106个k562细胞。此外,对于靶向il2rg基因座的实验,用15μgcas9mrna和10μg合成的引导rna(未修饰的或ms)、与7.6μg合成引导rna(未修饰的或ms)预先复合的15μgcas9蛋白质转染106个k562细胞。在转染后72小时,使用quickextracttmdna提取溶液(epicentre,madison,wi)根据制造商的说明提取来自这些样品和模拟转染样品(第二阴性对照)的基因组dna。使用40ng基因组dna作为模板来pcr扩增中靶的基因座和三个计算机预测的脱靶基因座(表2),pcr扩增使用pfuultraiihs2x母预混物(agilenttechnologies,santaclara,ca)和基因特异性引物,这些引物让扩增子的末端带上miseq(illumina,sandiego,ca)平台深度测序中使用的测序引物(表3)。对中靶和脱靶扩增子(表4)进行第二次pcr反应以附接上额外的illumina测序衔接子(例如p5、p7)和定制的双8-bp条形码,从而唯一地标识相应的转染处理。在第二次pcr之后,对带条形码的扩增子用agilentd1000tapestation进行定量,以等摩尔浓度汇集,然后用qiaquickpcr纯化试剂盒(qiagen,valencia,ca)根据制造商的说明纯化。将经纯化的文库在illuminamiseqdna测序仪上进行测序,2×201个循环,通过ngsdna测序服务(seqmatic,fremont,ca)进行双重索引。

表4提供了为了对in/del频率进行深度测序分析而产生的ccr5,hbb和il2rg中靶及脱靶扩增子的列表。扩增子(未经编辑的基因组dna的)大小的范围是183-220bp,从靶位点到基因特异性引物的杂交序列的距离最小为50bp。下划线和粗体文本分别表示用于从基因组dna产生扩增子的杂交序列和推定的crispr-靶位点。

表4.为进行in/del频率的深度测序分析而产生的ccr5、hbb和il2rg中靶及脱靶扩增子列表。

扩增子大小(未经编辑的基因组dna的)的范围从183-220bp,从靶位点到基因特异性引物的杂交序列的距离最小为50bp。下划线和粗体文本分别表示用于从基因组dna产生扩增子的杂交序列和推定的crispr靶位点。

10.化学修饰的sgrnas的中靶和脱靶活性

表5示出图1c、图1e和图5所依据的数字。如图1c中所进行的由合成sgrna介导的靶向切割的特异性,使用2μgcas9质粒和1μgsgrna(上图)或20μgsgrna(下图)sgrna。通过对来自靶向基因组基因座的pcr扩增子以及每个基因的三个生物信息学预测的脱靶基因座进行深度测序来测量in/del频率。显示了平均值+/-sem,n=3。

表5

实施例2.使用化学修饰的引导rna和合成的单链寡聚脱氧核苷酸(ssodn)模板的基于crispr/cas9的同源重组。

将来自三个不同供体的受刺激的人原代t细胞用10μgccr5sgrna(未修饰的或ms),15μgcas9mrna和2.81μg的183ntccr5ssodn(两端的三个末端核苷酸之间有或者没有硫代磷酸酯(“ps”)联接)核转染。ssodn含有一个不存在于wtccr5序列中的中央hindiii限制性位点。在核转染三天后提取基因组dna(gdna),产生跨越靶位点(在与ssodn同源的序列的外部)的pcr产物,并用hindiii消化。在2%tbe琼脂糖凝胶上分析限制片段并计算hdr频率。

图21示出了来自hdr实验的琼脂糖凝胶。当使用修饰的sgrna时,hdr频率有所增加。另外,当ssodn两端的三个末端核苷酸之间包含硫代磷酸酯联接时,hdr频率进一步增加。

尽管为了清楚理解的目的,已经通过举例说明和实施例的方式较详细地描述了前述发明,但是本领域技术人员将会理解,在所附权利要求的范围内可以实施某些改变和修改。此外,本文提供的每篇参考文献通过引用整体并入,如同每篇参考文献单独导入作为参考一样。

非正式序列表

seqidno:1

靶向il2rg的载体序列

il2rg同源臂以加粗及斜体表示。嵌合内含子加下划线。gfp序列以大写字母及斜体表示。bgh多聚(a)序列加双下划线。

seqidno:2

靶向hbb的载体序列

hbb同源臂加粗并以斜体表示。ef1α启动子加下划线。gfp序列大写并以斜体表示。bgh多聚(a)序列加双下划线。

seqidno:3

靶向ccr5的载体序列

hbb同源臂加粗并以斜体表示。ef1α启动子加下划线。gfp序列大写并以斜体表示。wpre序列加下划短线。bgh多聚(a)序列加双下划线。

seqidnos:4-19

见表1

seqidnos:20-31

见表2

seqidnos:32-71

见表3

seqidnos:72-83

见表4

seqidno:84

il2rg_fw:5’-tcacacagcacatatttgccacaccctctg-3’,

seqidno:85

il2rg_rv:5’-tgcccacatgattgtaatggccagtgg-3’

seqidno:86

hbb_fw:5’-ccaactcctaagccagtgccagaagag-3’

seqidno:87

hbb_rv:5’-agtcagtgcctatcagaaacccaagag-3’

seqidno:88

ccr5_fw:5’-gcacagggtggaacaagatgg-3’

seqidno:89

ccr5_rv:5’-caccaccccaaaggtgaccgt-3’

seqidno:90

5’-ggctgttgtcatctatgaccttccc-3’

seqidno:91

5’-tgtaaactgagcttgctcgctcg-3’

seqidno:92

5’-gcacagggtggaacaagatgg-3’。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1