新的前间区序列邻近基序序列以及利用其修饰细胞基因组中靶核酸的方法

文档序号:30238028发布日期:2022-06-01 23:19阅读:237来源:国知局
1.涉及一种利用新的前间区序列邻近基序序列编辑细胞基因组的方法。
背景技术
::2.crispr-cas9系统是在细菌和古细菌中发现的适应性免疫系统,其用于包括各种生物和人类细胞在内的各种细胞的基因组编辑。但是,由于在靶dna区域中不存在可用的前间区序列邻近基序(protospaceradjacentmotif:pam),或者靶向(on-target)活性不足或脱靶(off-target)效应等,crispr-cas9的应用通常受到限制。作为最常用crispr核酸酶的化脓性链球菌cas9(streptococcuspyogenescas9:spcas9)的pam序列为5'-ngg-3'。除ngg以外,在哺乳动物细胞中表现出有效活性的其它crispr核酸酶还识别其它pam。尽管已经研发出crispr核酸酶变体以靶向不存在pam序列的序列,但仍存在未被靶向的序列。3.近期,spcas9、xcas9以及spcas9-ng的新的pam序列得到确认(韩国公开号10-2020-0026164a1(2020.03.10))。但是,尚未对其它cas9核酸酶变体的靶序列进行广泛的研究。4.因此,为了扩大crispr-cas9系统的应用范围,有必要调查对cas9核酸酶变体靶序列的活性,从而挖掘ngg以外的pam序列。技术实现要素:5.技术问题6.提供一种利用新的pam序列修饰细胞基因组中靶核酸的方法。7.提供一种细胞,其基因组的靶核酸由利用新的pam序列修饰细胞基因组中靶核酸的方法而被修饰。8.技术方案9.一方面提供一种修饰细胞基因组中靶核酸的方法,其包括,孵育靶核酸、cas(clusteredregularlyinterspacedpalindromicrepeats-associated:crisprassociated)核酸酶或其变体以及向导rna。10.所述细胞可以是体内细胞或分离的细胞。当所述细胞为体内细胞时,所述方法可以在体内(invivo)执行。当所述细胞为分离的细胞时,所述方法可以在离体(exvivo)或体外(invitro)执行。11.所述细胞可以是体细胞、生殖细胞、干细胞、癌细胞或细胞株。所述细胞可以选自由癌细胞、干细胞、血管内皮细胞、白细胞、免疫细胞、上皮细胞、生殖细胞、成纤维细胞、肌肉细胞、骨髓细胞、表皮细胞、成骨细胞以及神经细胞所组成的组中。所述细胞可以是包括人在内的动物、植物、细菌或菌类的细胞。12.所述基因组(genome)是指生命体或细胞所具有的所有遗传信息。13.所述靶核酸是指欲修饰的核酸。14.修饰细胞基因组中靶核酸的方法也可以称作基因编辑或基因组编辑(genomeediting)。15.所述方法包括,孵育包括靶核酸的细胞,编码cas(clusteredregularlyinterspacedpalindromicrepeats-associated或crisprassociated:cas)核酸酶或其变体的多核苷酸,以及向导rna。16.所述靶核酸可以包括前间区序列邻近基序(protospaceradjacentmotif:pam)以及与所述向导rna互补的靶序列。17.所述前间区序列邻近基序(pam)可以是靶核酸中的cas核酸酶识别的核苷酸序列。所述pam可以由核苷酸序列所组成,所述核苷酸序列选自由5'-nagn-3'、5'-acgg-3'、5'-agas-3'、5'-wggn-3'、5'-sgrn-3'、5'-tgad-3'、5'-gtgc-3'、5'-ragn-3'、5'-cagh-3'、5'-tagb-3'、5'-vgag-3'、5'-nggn-3'、5'-aagh-3'、5'-cagy-3'、5'-gagn-3'、5'-vaag-3'、5'-wgrn-3'、5'-rgyg-3'、5'-sgad-3'、5'-sggn-3'、5'-tgtg-3'、5'-ygcg-3'、5'-nygg-3'、5'-ngrn-3'、5'-sgcc-3'、5'-mtgc-3'、5'-gtgh-3'、5'-rcag-3'、5'-vtag-3'、5'-wgcc-3'、5'-sacg-3'、5'-ngcd-3'、5'-narg-3'、5'-waga-3'、5'-gagt-3'、5'-ngtk-3'、5'-ngcn-3'、5'-nacg-3'、5'-aggy-3'、5'-ngdg-3'、5'-gagg-3'、5'-gggt-3'、5'-vyag-3'、5'-gaat-3'、5'-ngvn-3'、5'-vacg-3'、5'-ayga-3'、5'-gagh-3'、5'-tgtn-3'、5'-agtb-3'、5'-sgtk-3'、5'-gatg-3'、5'-ngan-3'、5'-naag-3'、5'-ngcg-3'、5'-nggr-3'、5'-dggc-3'、5'-nggt-3'、5'-ngtg-3'以及5'-ggag-3'所组成的组中。在所述核苷酸序列中,“a”指腺嘌呤(adenine:a),“g”指鸟嘌呤(guanine:g),“c”指胞嘧啶(cytosine:c),“t”指胸腺嘧啶(thymine:t)。“n”指腺嘌呤(a)、鸟嘌呤(g)、胞嘧啶(c)、胸腺嘧啶(t)、尿嘧啶(uracil:u)、未知,或其它核酸。“r”指嘌呤(purine),可以是腺嘌呤(a)或鸟嘌呤(g)。“y”指嘧啶(pyrimidine),可以是胞嘧啶(c)、胸腺嘧啶(t),或尿嘧啶(u)。“m”可以是腺嘌呤(a)或胞嘧啶(c)。“k”可以是鸟嘌呤(g)、胸腺嘧啶(t)或尿嘧啶(u)。“s”可以是鸟嘌呤(g)或胞嘧啶(c)。“w”可以是腺嘌呤(a)、胸腺嘧啶(t)或尿嘧啶(u)。“b”指除腺嘌呤(a)以外的碱基,可以是鸟嘌呤(g)、胞嘧啶(c)、胸腺嘧啶(t)或尿嘧啶(u)。“d”指除胞嘧啶(c)以外的碱基,可以是(a)、鸟嘌呤(g)、胸腺嘧啶(t)或尿嘧啶(u)。“h”指除鸟嘌呤(g)以外的碱基,可以是(a)、胞嘧啶(c)、胸腺嘧啶(t)或尿嘧啶(u)。“v”指除胸腺嘧啶(t)和尿嘧啶(u)以外的碱基,可以是腺嘌呤(a)、鸟嘌呤(g)或胞嘧啶(c)。所述pam可以紧邻或连接于靶序列的3'-末端或5'末端。18.所述cas核酸酶可以是切割核酸双链的内切核酸酶(endonuclease)。所述cas核酸酶可以是rna-引导的dna内切核酸酶(rnaguideddnaendonuclease)。所述cas核酸酶可以是来源于细菌的核酸酶,所述细菌选自由链球菌属(streptococcussp.)、弯曲杆菌属(campylobactersp.)、军团菌属(legionellasp.)、奈瑟菌屬(neisseriasp.)、巴斯德氏菌属(pasteurellasp.)、弗朗西斯氏菌属(francisellasp.),以及普雷沃菌属(prevotellasp.)所组成的组中。所述cas核酸酶可以是来源于细菌的核酸酶,所述细菌选自由化脓性链球菌(streptococcuspyogenes)、嗜热链球菌(streptococcusthermophilus)、金黄色葡萄球菌(streptococcusaureus)、空肠弯曲杆菌(campylobacterjejuni)、嗜肺军团菌(legionellapneumophila)、脑膜炎奈瑟氏球菌(neisseriameningitidis)、多杀巴斯德氏菌(pasteurellamultocida)、新凶手弗朗西斯菌(francisellanovicida)以及解糖胨普雷沃氏菌(prevotelladisiens)所组成的组中。所述cas核酸酶可以是cas9、cpf1、c2c1、c2c2、c2c3、cas3、cas5、cas7、cas8或cas10。所述cas9是例如酿脓链球菌cas9(streptococcuspyogenescas9:spcas9)。19.所述cas核酸酶的变体是具有核酸酶作用的变体。所述cas核酸酶的变体可以选自由espcas9(1.1)、spcas9-hf1、hypacas9、evocas9、sniper-cas9、spcas9vqr变体、spcas9vrer变体、spcas9vrqr变体、spcas9vrqr-hf1变体以及spcas9qqr1变体所组成的组中。20.所述espcas9(1.1)是经突变以增强特异性的spcas9,其也可以被称作espcas91.1或espcas9。对于野生型spcas9,espcas9(1.1)可以具有k848a、k1003a以及r1060a突变(slaymaker,i.m.etal.,science.2016jan1;351(6268):84-88)。21.所述spcas9-hf1可以是经突变以使其具有高保真度的spcas9。对于野生型spcas9,spcas9-hf1可以具有n497a、r661a、q695a以及q926a突变(kleinstiver,b.p.etal.nature.2016jan28;529(7587):490-495)。22.所述hypacas9可以是经突变以使其具有高准确度的spcas9。对于野生型spcas9,所述hypacas9可以具有n692a、m694a、q695a以及h698a突变(janices.chenetal.,nature.2017oct19;550(7676):407-410)。23.所述evocas9可以是经突变以使其具有高保真度的spcas9。对于野生型spcas9,所述evocas9可以具有m495v、y515n、k526e以及r661q(vneq)突变(antoniocasinietal.,naturebiotechnology,2018mar;36(3):265-271)。24.所述sniper-cas9可以是经突变以提高碱基编辑器(baseeditor)特异性(specificity)的spcas9。对于野生型spcas9,所述sniper-cas9可以具有f539s、m763i以及k890n突变(jungjoonk.leeetal.,naturecommunicationsvolume9,articlenumber:3048(2018))。25.所述spcas9vqr变体可以是经突变的spcas9,以使其具有不同于nggpam序列的pam序列特异性。对于野生型spcas9,所述spcas9vqr变体可以具有d1135v、r1335q以及t1337r突变(benjaminp.kleinstiveretal.,nature.2015jul23;523(7561):481-485)。26.所述spcas9vrer变体可以是经突变的spcas9,以使其具有不同于nggpam序列的pam序列特异性。对于野生型spcas9,所述spcas9vrer变体可以具有d1135v、g1218r、r1335e以及t1337r突变(benjaminp.kleinstiveretal.,nature.2015jul23;523(7561):481-485)。27.所述spcas9vrqr变体可以是经突变以使其具有高保真度的spcas9。对于野生型spcas9,所述spcas9vrqr变体可以具有d1135v、g1218r、r1335q以及t1337r突变(kleinstiver,b.p.etal.nature.2016jan28;529(7587):490-495)。28.所述spcas9vrqr-hf1可以是经突变的spcas9,以使其具有不同于nggpam序列的pam序列特异性。对于野生型spcas9,所述spcas9vrqr-hf1可以具有n497a、r661a、q695a、q926a、d1135v、g1218r、r1335q以及t1337r突变(leinstiver,b.p.etal.nature.2016jan28;529(7587):490-495)。29.所述spcas9qqr1可以是经突变的spcas9,以使其具有不同于nggpam序列的pam序列特异性。对于野生型spcas9,所述spcas9qqr1可以具有g1218r、n1286q、i1331f、d1332k、r1333q、r1335q以及t1337r突变(carolinandersetal.,molcell.2016mar17;rna:sgrna)。所述sgrna可以包括对靶核酸序列特异的crrna(crisprrna)和/或与cas核酸酶形成复合物的tracrrna。所述向导rna可以包括在质粒载体或病毒载体中。42.所述孵育可以是将编码cas核酸酶或其变体的多核苷酸以及向导rna引入包括靶核酸的细胞中。所述引入包括整合(integration)、转化(transformation)、转导(transduction)、转染(transfection),或它们的组合。所述引入可以是短暂(transient)的或稳定(stable)的引入。43.所述靶核酸可以被所述cas核酸酶或其变体、所述向导rna的复合物所识别。44.所述cas核酸酶或其变体、向导rna的复合物可以序列特异性修饰靶核酸。所述修饰可以是插入、切割、连接、脱氨基,或它们的组合。所述切割可以是切割基因组dna的双链。所述切割可以是平齐末端(bluntend)或粘性末端(stickyend)。所述修饰可以是切割靶核酸以及将外源多核苷酸插入至切割位点。可以通过同源性依赖性方法将外源多核苷酸插入至切割位点。所述同源性依赖性方法可以是同源重组(homologousrecombination)或同源性介导修复(homology-directedrepair:hdr)。45.所述方法可以在体外(invitro)、离体(exvivo),或体内(invivo)执行。46.另一方面提供一种细胞,其基因组的靶核酸由根据一方面的修饰细胞基因组中靶核酸的方法而被修饰。47.所述细胞、基因组、靶核酸以及修饰如上所述。48.有益效果49.根据利用新的pam序列修饰细胞基因组中靶核酸的方法以及基因组中的靶核酸由此被修饰的细胞,可以通过靶向原先无法作为基因组编辑的靶位点来执行基因组编辑,由此能够扩大基因组编辑的应用范围。附图说明50.图1是示出利用固定的前间区以确定pam序列的实验过程的示意图。51.图2a至图2c是实施例中使用的spcas9核酸酶和其变体的示意性视图(箭头:与野生型spcas9相比具有突变的位置,arg:arginine-richbridgehelix,pi:pam-interactingdomain)。52.图3至图15是示出由实施例中使用的spcas9核酸酶和其变体在4-nt候选pam序列中诱导的平均插缺频率的热图。具体实施方式53.下面,通过实施例进一步详细描述。但是,这些实施例仅用于示例性描述一个或多个具体实施方式,本发明的范围并不受限于此。54.实施例1.确认spcas9变体的pam序列55.1.准备向导rna、pam序列以及包含靶序列的质粒文库56.为了确定除作为spcas9pam序列的ngg之外的其它pam序列,委托twistbioscienceco.制作了寡核苷酸文库(参照图1)。57.每个寡核苷酸被设计为包括30-nt靶序列,所述30-nt靶序列包含从5'末端19-nt的sgrna、bsmbi限制性酶位点、条形码1(20-nt序列)、第二bsmbi限制性酶位点、条形码2(15-nt序列)以及具有无序序列的8-nt的pam序列。58.首先,制作了具有8130个(271×30)靶序列的文库,其包含与30种前间区配对的271种相异的6-ntpam序列(256个nnnnta+16个aggtnn-1个重叠agggta)。对于38%至42%范围的spcas9诱导插缺频率,选择了完美匹配的gn19前间区。在将spcas9引入慢病毒3天后,通过在具有nggpam序列的状态下引入慢病毒的7314个靶序列来决定了插缺频率,范围在0%至99%。从7314个sgrna中随机选择具有38%至42%范围插缺频率的30种。59.然后,设计2940个sgrna以验证错配靶序列中的核酸酶活性:具有nggpam的2940=30sgrnas×98个靶[没有错配的1个靶(5个相异的条形码)+分别具有1碱基错配的60个靶+分别具有2碱基错配的19个靶+分别具有3碱基错配的18个靶],以及732=4sgrnas×61个靶[没有错配的1个靶(5个相异的条形码)+分别具有1碱基错配的60个靶]×3个pam(ngag、naag以及ngcg)。[0060]包含sgrna和靶序列的质粒文库通过使用两步克隆方法,在寡核苷酸库的pcr扩增过程中,防止向导rna与靶序列间的解偶联(uncoupling)。[0061]第一步是制作包括向导rna和靶序列的初始质粒文库。使用bsmbi限制酶(neb)对lenti-grna-puro质粒(addgene,#84752)进行线性化,并将pcr-扩增的寡核苷酸库(靶序列)连接至线性化的载体中。将反应物转化到大肠杆菌中,从选出的菌落中分离出质粒。用于寡核苷酸库扩增的引物如下。[0062]正向引物:[0063]5'-ttgaaagtatttcgatttcttggctttatatatcttgtggaaaggacgaaacacc-3'(序列号1)[0064]反向引物:[0065]5'-gagtaagctgaccgctgaagtacaagtggtagagtagagatctagttacgccaagct-3'(序列号2)[0066]第二步是插入sgrna支架。用bsmbi限制酶(neb)切割通过第一步制作的质粒文库,并进行琼脂糖电泳后在凝胶中纯化了核酸片段。合成包含sgrna支架的插入物片段,并克隆到topo载体(t-双链(blunt)载体,solgent)中。插入物片段的序列如下所示,包括多聚t序列的sgrna用粗体表示,bsmbi限制酶位点用下划线表示。[0067]5'-cgtctctgttttagagctagaaatagcaagttaaaataaggctagtccgttatcaacttgaaaaag[0068]tggcaccgagtcggtgcttttttgggagacg-3'(序列号3)[0069]用bsmbi限制酶(enzynomics)切割包含插入物片段的topo载体,从而分离出83-nt插入物片段。将插入物片段结扎到被切割的质粒文库并转化到大肠杆菌中后,从选出的菌落中分离出质粒文库。[0070]2.准备细胞文库[0071]首先,为了生产慢病毒文库,准备了人胚胎肾细胞hek293t细胞(atcc)。混合通过实施例1.1准备的质粒、pspax2以及pmd2.g,并使用脂质体2000(invitrogen)转染到hek293t细胞中。转染12小时后向细胞中加入新鲜的培养基,转染36小时后获得包含病毒的上清液。用millex-hv0.45μm低-蛋白结合膜(millipore)过滤获得的上清液,并在-80℃储存等分试样直至使用。用lenti-xp24rapidtiterkit(clontech)测量病毒收率并进行验证。为了计算病毒滴度,在8μg/ml的聚凝胺(polybrene)存在的情况下,将依次稀释的病毒等分试样转导到hek293t细胞中,在2μg/ml嘌呤霉素或20μg/ml杀稻瘟素(blasticidin)s(invivogen)存在的情况下进行培养和计算。[0072]为了准备的慢病毒文库的转到,在培养皿中过夜培养hek293t细胞。在8μg/ml聚凝胺存在的情况下,将感染复数(multiplicityofinfection:moi)为0.3的慢病毒文库转导到hek293t细胞中,并过夜培养了细胞。在2μg/ml嘌呤霉素存在的情况下进行培养,去除未转导的细胞,并以1.2×107的细胞量维持了细胞文库。[0073]3.将cas9传递到细胞库[0074]准备细胞量为1.2×107的细胞文库,并在8μg/ml的聚凝胺存在的情况下,将spcas9、espcas9(1.1)、spcas9-hf1、hypacas9、evocas9、sniper-cas9、xcas9、spcas9vqr变体、spcas9vrer变体、spcas9vrqr变体、spcas9vrqr-hf1变体、spcas9qqr1变体以及编码spcas9-ng的病毒转导到细胞中(图2a至图2c)。以moi5进行转导,并在20μg/ml杀稻瘟素s存在的情况下选出细胞。[0075]4.测量插缺频率[0076]为了从实施例1.3中准备的细胞中检测基因组中的插缺(插入/缺失,insertion/deletion:indel)频率,进行了深度测序和插缺频率分析。[0077]为了深度测序,使用wizardgenomicdnapurificationkit(promega)从细胞从分离基因组dna。为了高性能实验,使用2xtaqpcrsmartmix(solgent)对插入的靶序列进行了pcr扩增。在第一次pcr中,针对每个细胞文库利用共240μg的基因组dna,以实现针对文库1000x或更高的覆盖率吧(每106个细胞约10μg的基因组dna)。每个反应对2.5μg基因组dna进行第一次pcr,合并(pooling)所有反应产物后进行了纯化。使用包含illumina接头和条形码序列的引物,对50ng纯化产物中的样品进行了第二次pcr扩增。电泳后纯化扩增产物,并利用hiseq或miniseq(illumina)进行分析。[0078]实验中使用的引物如下。[0079]用于第一次pcr反应的引物[0080]正向引物:[0081]5'-acactctttccctacacgacgctcttccgatctcttgaaaaagtggcaccgagtcg-3'(正向引物,序列号4)[0082]5'-acactctttccctacacgacgctcttccgatcttcttgaaaaagtggcaccgagtcg-3'(序列号5)[0083]5'-acactctttccctacacgacgctcttccgatctcgcttgaaaaagtggcaccgagtcg-3'(序列号6)[0084]反向引物:[0085]5'-gtgactggagttcagacgtgtgctcttccgatctttaagtcgagtaagctgaccgctgaag-3'(序列号7)[0086]5'-gtgactggagttcagacgtgtgctcttccgatctattaagtcgagtaagctgaccgctgaag-3'(序列号8)[0087]5'-gtgactggagttcagacgtgtgctcttccgatcttattaagtcgagtaagctgaccgctgaag-3'(序列号9)[0088]用于第二次pcr反应的引物[0089]正向引物:[0090]5'-aatgatacggcgaccaccgagatctacac(index)acactctttccctacacgac-3'(序列号10)[0091]反向引物:[0092]5'-caagcagaagacggcatacgagat(index)gtgactggagttcagacgtgt-3'(序列号11)[0093]为了分析插缺频率,通过修改pythonscripts程序分析了深度测序数据。使用15-nt条形码和位于其上游的4-nt组成的共19-nt序列,识别了每个向导rna和靶序列对。当插缺位于预期的切割位点(即,位于该位点中心的8-nt区域)时,则认为插缺是cas9-诱导的突变。为了去除阵列合成和pcr扩增所产生的背景插缺频率,计算了总读段(read)、插缺读段以及未引入cas9时的插缺频率,并根据下式计算了插缺频率(%)。[0094][0095](数学式1)[0096]深度测序数据以accessionno.srr10215483上传至ncbisequencereadarchive(sra:www.ncbi.nlm.nih.gov/sra/)。[0097]5.确定pam序列[0098]在根据实施例1.4获得的深度测序数据中,选出在xcas9、spcas9-ng或spcas9核酸酶中具有高插缺频率的pam序列。[0099]选出转入人类细胞后直到第6天具有5%或更高平均插缺频率的pam序列,并分析了根据cas9核酸酶和其变体、pam序列的插缺频率。[0100]显示由spcas9(野生型)、espcas9(1.1)、spcas9-hf1、hypacas9、evocas9、sniper-cas9、xcas9、spcas9vqr变体、spcas9vrer变体、spcas9vrqr变体、spcas9vrqr-hf1变体、spcas9qqr1变体以及spcas9-ng在4-nt候选pam序列中诱导的平均插入缺失频率的热图,分别示于图3至图15。用阴影示出在4-nt候选pam序列(共256(=44)个候选序列)中具有5%或更高平均插缺频率的pam序列,用白色示出平均插缺频率小于5%的序列。用粗体实线框示出具有较高平均插缺频率的pam序列。对5'-nnnn-3'所有可能的4-ntpam序列进行了实验,并使用每个pam序列的22至30个靶序列进行了分析。[0101]分析图3至图15后确认的4-ntpam序列示于下表1。[0102]【表1】[0103][0104][0105]因此,通过利用新的pam序列挖掘人类基因组中可靶向的位点,并预测根据pam序列的核酸酶的插缺诱导活性,能够提高基因组编辑的可应用性。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1