背景技术:
1、基因组编辑是一种基因工程的新形式,其使用工程核酸酶(分子剪刀)在活生物体的基因组中插入、缺失或替换dna。利用基因组编辑工具对细胞和活生物体的基因组进行基因操作在生命科学研究、生物技术、农业技术以及最重要的疾病治疗中具有广泛的兴趣。例如,基因组编辑可用于校正导致遗传疾病的驱动突变,从而治愈活生物体中的这些疾病;基因组编辑也可应用于改造作物的基因组,从而增加作物产量并赋予作物对环境污染或病原体感染的抗性;同样地,通过精确的基因组编辑进行微生物基因组转化在可再生生物能源的开发中具有重要意义。
2、crispr/cas(成簇规律间隔短回文重复序列/crispr相关蛋白)系统因其高编辑效率、便利性和在活生物体中的潜在应用而成为最强大的基因组编辑工具。在向导rna(grna)的引导下,cas核酸酶可以在各种细胞(细胞系和来自活生物体的原代细胞)的靶基因组位点产生dna双链断裂(dsbs)。这些dsbs随后被内源性dna修复系统修复,该修复系统可用于进行所需的基因组编辑。
3、一般而言,dsbs可激活两种主要的dna修复途径,非同源末端连接(nhej)和同源定向修复(hdr)。nhej可以在dsbs周围的基因组dna区域引入随机的插入/缺失(indels),从而导致开放阅读框(orf)移位并最终导致基因失活。相反,当hdr被触发时,靶位点的基因组dna序列可以通过同源重组机制被外源供体dna模板的序列替换,这可以导致基因突变的校正。然而,hdr介导的基因校正的实际效率很低(通常低于5%),因为同源重组的发生是细胞类型特异性的和细胞周期依赖性的,并且nhej比hdr更频繁地被触发。因此,hdr相对较低的效率限制了crispr/cas基因组编辑工具在涉及基因校正的治疗领域的转化。
4、整合了crispr/cas系统和逆转录酶(rtase)家族的先导编辑(prime editor,pe)最近被发明并用于基因校正。通过与cas9切口酶(ncas9,h840a)融合,rtase可以通过使用先导编辑grna(pegrna)中编码的遗传信息在靶基因组基因座来介导逆转录,然后触发互补dna(cdna)整合入基因组dna,从而最终导致预期的编辑。
5、然而,与其他基因组编辑器相比,pe的编辑效率相对较低,尤其是在产生单个碱基变化时。因此,开发具有高编辑效率的新的先导编辑系统是需要的。这种先导编辑系统将使我们能够在各种活生物体中进行高水平的编辑。重要的是,这些新的先导编辑系统的高效率将促进潜在的临床转化,特别是在那些涉及校正疾病相关的单点突变的临床转化中。
6、发明概述
7、本文发现,通过将一个或多个沉默突变(编码序列中不引起氨基酸改变的突变或仅影响非编码dna的突变)引入先导编辑grna(pegrna),可大大增强先导编辑的编辑效率。先导编辑系统采用的内源性错配修复(mmr)系统在修复单碱基错配方面效率不高。据推测,在pegrnas中引入的沉默突变可以导致更多的错配和更大的dna结构扭曲,导致增强的mmr激活和先导编辑。
8、因此,根据本公开的一个实施方案,提供了一种用于在细胞中的蛋白中产生靶突变的方法。在一些实施方案中,所述方法包括向细胞引入先导编辑系统,其中所述先导编辑系统包括融合蛋白和先导编辑向导rna(pegrna),所述融合蛋白包括切口酶和逆转录酶,所述先导编辑向导rna编码所述靶突变和距靶突变20个核苷酸内的一个或多个沉默或保守突变。
9、在另一个实施方案中,提供了一种向细胞中的蛋白引入突变的方法,其包括向细胞引入先导编辑系统,其中所述先导编辑系统包括融合蛋白和先导编辑向导rna(pegrna),所述融合蛋白包括切口酶和逆转录酶,所述先导编辑向导rna编码所述蛋白的编码序列内的两个或多个突变,其中至少一个突变为沉默或保守突变,并且距另一个突变20个核苷酸以内。
10、在一个实施方案中,还提供了一种先导编辑向导rna(pegrna),其包含一个片段,所述片段(a)能够与人ace2(血管紧张素转换酶2)的基因组序列杂交,(b)编码选自由s19、q24、d30、k31或k353组成的组的一个或多个残基处的靶突变,所述残基的位点基于seq idno:1。本发明还提供了该突变蛋白、编码突变蛋白的多核苷酸、含有突变蛋白的细胞和特异性识别突变蛋白的抗体。
11、本发明还提供了一种先导编辑系统,其包括本公开的pegrna以及包括切口酶和逆转录酶的融合蛋白。
12、本发明还提供了用于治疗或预防冠状病毒感染的方法。在一些实施方案中,所述方法包括向受试者施用编码本公开的先导编辑系统的一种或多种多核苷酸。在一些实施方案中,冠状病毒为sars-cov-2(严重急性呼吸综合征冠状病毒2)或sars-cov。
13、在一些实施方案中,还提供了一种用于进行基因编辑的“分离pe(split pe)”系统。在一个实施方案中,提供了一种在细胞中的靶位点进行基因编辑的方法,其包括向细胞中引入第一构建体,其可被包封在第一病毒颗粒中,编码切口酶,和一个或多个第二构建体,其可被包封在第二病毒颗粒中,编码(a)能够识别靶位点并包含用于编辑靶位点的遗传信息的先导编辑向导rna(pegrna),(b)能够引导切口酶在靶位点的非编辑dna链上切刻的单向导rna(sgrna),其中所述pegrna或所述sgrna包含标签序列,和(c)与能够结合标签序列的rna识别肽融合的逆转录酶。
14、 sequence listing
15、<110> 上海科技大学
16、<120> 提高效率和准确性的基因组编辑
17、<130> p23112984cp
18、<150> pct/cn2020/128417
19、<151> 2020-11-12
20、<150> pct/cn2021/091939
21、<151> 2021-05-06
22、<160> 8
23、<170> patentin version 3.5
24、<210> 1
25、<211> 805
26、<212> prt
27、<213> 人工序列
28、<220>
29、<223> 合成的
30、<400> 1
31、met ser ser ser ser trp leu leu leu ser leu val ala val thr ala
32、1 5 10 15
33、ala gln ser thr ile glu glu gln ala lys thr phe leu asp lys phe
34、 20 25 30
35、asn his glu ala glu asp leu phe tyr gln ser ser leu ala ser trp
36、 35 40 45
37、asn tyr asn thr asn ile thr glu glu asn val gln asn met asn asn
38、 50 55 60
39、ala gly asp lys trp ser ala phe leu lys glu gln ser thr leu ala
40、65 70 75 80
41、gln met tyr pro leu gln glu ile gln asn leu thr val lys leu gln
42、 85 90 95
43、leu gln ala leu gln gln asn gly ser ser val leu ser glu asp lys
44、 100 105 110
45、ser lys arg leu asn thr ile leu asn thr met ser thr ile tyr ser
46、 115 120 125
47、thr gly lys val cys asn pro asp asn pro gln glu cys leu leu leu
48、 130 135 140
49、glu pro gly leu asn glu ile met ala asn ser leu asp tyr asn glu
50、145 150 155 160
51、arg leu trp ala trp glu ser trp arg ser glu val gly lys gln leu
52、 165 170 175
53、arg pro leu tyr glu glu tyr val val leu lys asn glu met ala arg
54、 180 185 190
55、ala asn his tyr glu asp tyr gly asp tyr trp arg gly asp tyr glu
56、 195 200 205
57、val asn gly val asp gly tyr asp tyr ser arg gly gln leu ile glu
58、 210 215 220
59、asp val glu his thr phe glu glu ile lys pro leu tyr glu his leu
60、225 230 235 240
61、his ala tyr val arg ala lys leu met asn ala tyr pro ser tyr ile
62、 245 250 255
63、ser pro ile gly cys leu pro ala his leu leu gly asp met trp gly
64、 260 265 270
65、arg phe trp thr asn leu tyr ser leu thr val pro phe gly gln lys
66、 275 280 285
67、pro asn ile asp val thr asp ala met val asp gln ala trp asp ala
68、 290 295 300
69、gln arg ile phe lys glu ala glu lys phe phe val ser val gly leu
70、305 310 315 320
71、pro asn met thr gln gly phe trp glu asn ser met leu thr asp pro
72、 325 330 335
73、gly asn val gln lys ala val cys his pro thr ala trp asp leu gly
74、 340 345 350
75、lys gly asp phe arg ile leu met cys thr lys val thr met asp asp
76、 355 360 365
77、phe leu thr ala his his glu met gly his ile gln tyr asp met ala
78、 370 375 380
79、tyr ala ala gln pro phe leu leu arg asn gly ala asn glu gly phe
80、385 390 395 400
81、his glu ala val gly glu ile met ser leu ser ala ala thr pro lys
82、 405 410 415
83、his leu lys ser ile gly leu leu ser pro asp phe gln glu asp asn
84、 420 425 430
85、glu thr glu ile asn phe leu leu lys gln ala leu thr ile val gly
86、 435 440 445
87、thr leu pro phe thr tyr met leu glu lys trp arg trp met val phe
88、 450 455 460
89、lys gly glu ile pro lys asp gln trp met lys lys trp trp glu met
90、465 470 475 480
91、lys arg glu ile val gly val val glu pro val pro his asp glu thr
92、 485 490 495
93、tyr cys asp pro ala ser leu phe his val ser asn asp tyr ser phe
94、 500 505 510
95、ile arg tyr tyr thr arg thr leu tyr gln phe gln phe gln glu ala
96、 515 520 525
97、leu cys gln ala ala lys his glu gly pro leu his lys cys asp ile
98、 530 535 540
99、ser asn ser thr glu ala gly gln lys leu phe asn met leu arg leu
100、545 550 555 560
101、gly lys ser glu pro trp thr leu ala leu glu asn val val gly ala
102、 565 570 575
103、lys asn met asn val arg pro leu leu asn tyr phe glu pro leu phe
104、 580 585 590
105、thr trp leu lys asp gln asn lys asn ser phe val gly trp ser thr
106、 595 600 605
107、asp trp ser pro tyr ala asp gln ser ile lys val arg ile ser leu
108、 610 615 620
109、lys ser ala leu gly asp lys ala tyr glu trp asn asp asn glu met
110、625 630 635 640
111、tyr leu phe arg ser ser val ala tyr ala met arg gln tyr phe leu
112、 645 650 655
113、lys val lys asn gln met ile leu phe gly glu glu asp val arg val
114、 660 665 670
115、ala asn leu lys pro arg ile ser phe asn phe phe val thr ala pro
116、 675 680 685
117、lys asn val ser asp ile ile pro arg thr glu val glu lys ala ile
118、 690 695 700
119、arg met ser arg ser arg ile asn asp ala phe arg leu asn asp asn
120、705 710 715 720
121、ser leu glu phe leu gly ile gln pro thr leu gly pro pro asn gln
122、 725 730 735
123、pro pro val ser ile trp leu ile val phe gly val val met gly val
124、 740 745 750
125、ile val val gly ile val ile leu ile phe thr gly ile arg asp arg
126、 755 760 765
127、lys lys lys asn lys ala arg ser gly glu asn pro tyr ala ser ile
128、 770 775 780
129、asp ile ser lys gly glu asn asn pro gly phe gln asn thr asp asp
130、785 790 795 800
131、val gln thr ser phe
132、 805
133、<210> 2
134、<211> 2415
135、<212> dna
136、<213> 人工序列
137、<220>
138、<223> 合成的
139、<400> 2
140、atgtcaagct cttcctggct ccttctcagc cttgttgctg taactgctgc tcagtccacc 60
141、attgaggaac aggccaagac atttttggac aagtttaacc acgaagccga agacctgttc 120
142、tatcaaagtt cacttgcttc ttggaattat aacaccaata ttactgaaga gaatgtccaa 180
143、aacatgaata atgctgggga caaatggtct gcctttttaa aggaacagtc cacacttgcc 240
144、caaatgtatc cactacaaga aattcagaat ctcacagtca agcttcagct gcaggctctt 300
145、cagcaaaatg ggtcttcagt gctctcagaa gacaagagca aacggttgaa cacaattcta 360
146、aatacaatga gcaccatcta cagtactgga aaagtttgta acccagataa tccacaagaa 420
147、tgcttattac ttgaaccagg tttgaatgaa ataatggcaa acagtttaga ctacaatgag 480
148、aggctctggg cttgggaaag ctggagatct gaggtcggca agcagctgag gccattatat 540
149、gaagagtatg tggtcttgaa aaatgagatg gcaagagcaa atcattatga ggactatggg 600
150、gattattgga gaggagacta tgaagtaaat ggggtagatg gctatgacta cagccgcggc 660
151、cagttgattg aagatgtgga acataccttt gaagagatta aaccattata tgaacatctt 720
152、catgcctatg tgagggcaaa gttgatgaat gcctatcctt cctatatcag tccaattgga 780
153、tgcctccctg ctcatttgct tggtgatatg tggggtagat tttggacaaa tctgtactct 840
154、ttgacagttc cctttggaca gaaaccaaac atagatgtta ctgatgcaat ggtggaccag 900
155、gcctgggatg cacagagaat attcaaggag gccgagaagt tctttgtatc tgttggtctt 960
156、cctaatatga ctcaaggatt ctgggaaaat tccatgctaa cggacccagg aaatgttcag 1020
157、aaagcagtct gccatcccac agcttgggac ctggggaagg gcgacttcag gatccttatg 1080
158、tgcacaaagg tgacaatgga cgacttcctg acagctcatc atgagatggg gcatatccag 1140
159、tatgatatgg catatgctgc acaacctttt ctgctaagaa atggagctaa tgaaggattc 1200
160、catgaagctg ttggggaaat catgtcactt tctgcagcca cacctaagca tttaaaatcc 1260
161、attggtcttc tgtcacccga ttttcaagaa gacaatgaaa cagaaataaa cttcctgctc 1320
162、aaacaagcac tcacgattgt tgggactctg ccatttactt acatgttaga gaagtggagg 1380
163、tggatggtct ttaaagggga aattcccaaa gaccagtgga tgaaaaagtg gtgggagatg 1440
164、aagcgagaga tagttggggt ggtggaacct gtgccccatg atgaaacata ctgtgacccc 1500
165、gcatctctgt tccatgtttc taatgattac tcattcattc gatattacac aaggaccctt 1560
166、taccaattcc agtttcaaga agcactttgt caagcagcta aacatgaagg ccctctgcac 1620
167、aaatgtgaca tctcaaactc tacagaagct ggacagaaac tgttcaatat gctgaggctt 1680
168、ggaaaatcag aaccctggac cctagcattg gaaaatgttg taggagcaaa gaacatgaat 1740
169、gtaaggccac tgctcaacta ctttgagccc ttatttacct ggctgaaaga ccagaacaag 1800
170、aattcttttg tgggatggag taccgactgg agtccatatg cagaccaaag catcaaagtg 1860
171、aggataagcc taaaatcagc tcttggagat aaagcatatg aatggaacga caatgaaatg 1920
172、tacctgttcc gatcatctgt tgcatatgct atgaggcagt actttttaaa agtaaaaaat 1980
173、cagatgattc tttttgggga ggaggatgtg cgagtggcta atttgaaacc aagaatctcc 2040
174、tttaatttct ttgtcactgc acctaaaaat gtgtctgata tcattcctag aactgaagtt 2100
175、gaaaaggcca tcaggatgtc ccggagccgt atcaatgatg ctttccgtct gaatgacaac 2160
176、agcctagagt ttctggggat acagccaaca cttggacctc ctaaccagcc ccctgtttcc 2220
177、atatggctga ttgtttttgg agttgtgatg ggagtgatag tggttggcat tgtcatcctg 2280
178、atcttcactg ggatcagaga tcggaagaag aaaaataaag caagaagtgg agaaaatcct 2340
179、tatgcctcca tcgatattag caaaggagaa aataatccag gattccaaaa cactgatgat 2400
180、gttcagacct ccttt 2415
181、<210> 3
182、<211> 19
183、<212> rna
184、<213> 人工序列
185、<220>
186、<223> 合成的
187、<400> 3
188、acaugaggau cacccaugu 19
189、<210> 4
190、<211> 117
191、<212> prt
192、<213> 人工序列
193、<220>
194、<223> 合成的
195、<400> 4
196、met ala ser asn phe thr gln phe val leu val asp asn gly gly thr
197、1 5 10 15
198、gly asp val thr val ala pro ser asn phe ala asn gly ile ala glu
199、 20 25 30
200、trp ile ser ser asn ser arg ser gln ala tyr lys val thr cys ser
201、 35 40 45
202、val arg gln ser ser ala gln asn arg lys tyr thr ile lys val glu
203、 50 55 60
204、val pro lys gly ala trp arg ser tyr leu asn met glu leu thr ile
205、65 70 75 80
206、pro ile phe ala thr asn ser asp cys glu leu ile val lys ala met
207、 85 90 95
208、gln gly leu leu lys asp gly asn pro ile pro ser ala ile ala ala
209、 100 105 110
210、asn ser gly ile tyr
211、 115
212、<210> 5
213、<211> 25
214、<212> rna
215、<213> 人工序列
216、<220>
217、<223> 合成的
218、<400> 5
219、ggagcagacg auauggcguc gcucc 25
220、<210> 6
221、<211> 123
222、<212> prt
223、<213> 人工序列
224、<220>
225、<223> 合成的
226、<400> 6
227、met gly ser lys thr ile val leu ser val gly glu ala thr arg thr
228、1 5 10 15
229、leu thr glu ile gln ser thr ala asp arg gln ile phe glu glu lys
230、 20 25 30
231、val gly pro leu val gly arg leu arg leu thr ala ser leu arg gln
232、 35 40 45
233、asn gly ala lys thr ala tyr arg val asn leu lys leu asp gln ala
234、 50 55 60
235、asp val val asp ser gly leu pro lys val arg tyr thr gln val trp
236、65 70 75 80
237、ser his asp val thr ile val ala asn ser thr glu ala ser arg lys
238、 85 90 95
239、ser leu tyr asp leu thr lys ser leu val ala thr ser gln val glu
240、 100 105 110
241、asp leu val val asn leu val pro leu gly arg
242、 115 120
243、<210> 7
244、<211> 15
245、<212> rna
246、<213> 人工序列
247、<220>
248、<223> 合成的
249、<400> 7
250、gcccugaaga agggc 15
251、<210> 8
252、<211> 23
253、<212> prt
254、<213> 人工序列
255、<220>
256、<223> 合成的
257、<400> 8
258、met gly asn ala arg thr arg arg arg glu arg arg ala glu lys gln
259、1 5 10 15
260、ala gln trp lys ala ala asn
261、 20
技术实现思路