一种融合蛋白质及其在水稻单基因及多基因编辑中的应用

文档序号:41459964发布日期:2025-03-28 17:54阅读:130来源:国知局

本发明属于生物,具体涉及一种融合蛋白质及其在水稻单基因及多基因编辑中的应用。


背景技术:

1、crispr/cas系统,尤其是ii类系统,具有操作简单、效率高等优势,已被开发为基因编辑的重要工具,包括crispr/cas9 (bortesi et al. 2016, liu et al. 2023, shanet al. 2013)、crispr/cas12a (xu et al. 2017, zheng et al. 2023, tang et al.2017)、crispr/cas12b (ming et al. 2020)、crispr/cas12i3 (lv et al. 2024, zhanget al. 2023)等,上述工具的开发极大地加速了作物基因功能研究和农作物育种的进程。基于crispr/cas系统的多基因编辑技术能够同时对多个基因进行定点编辑,可快速、高效地实现一代多个优异等位基因的聚合。近年来,基于crispr/cas的多基因编辑体系的建立为水稻、小麦、玉米等农作物的遗传改良提供了新的机遇 (li et al. 2024, li et al.2019, wang et al. 2017, lorenzo et al. 2023, luo et al. 2021, li et al. 2021,pan et al. 2024)。

2、在crispr/cas12类系统中,cas蛋白在crrna的引导下通常以交错切割的方式对基因组特定位点进行切割,切割完成后产生5’-端凸出的粘性末端 (zetsche et al.,2015)。其中i类v型的crispr/cas12i3识别5’-ttn-3’的pam序列,可对富含“at”的非编码区进行编辑。lv等利用crispr/cas12i3系统成功在水稻中实现了4个内源基因的敲除,但编辑效率总体较低 (lv et al. 2024)。随后,duan等人通过理性设计开发了cas12i3-5m (s7r/d233r/d267r/n369r/s433r) 变体,其显著提高了cas12i3在水稻、大豆和辣椒中的编辑效率,其中cas12i3-5m在3个水稻内源基因靶点的编辑效率均为75%左右(duan et al.,2024),cas12i3-5m变体的研发为crispr/cas12i3在农作物中进一步广泛利用提供重要技术支撑。然而,目前尚未有利用cas12i3-5m进行多个基因或多个靶点同时编辑的相关报道。

3、有研究表明将核酸外切酶与cas蛋白融合,可以提高编辑效率,扩大基因组缺失片段的长度 (liang et al. 2023, wu et al. 2020)。核酸外切酶可水解双链断裂的突出末端,基于cas12i3的切割特点,将5’—3’核酸外切酶与cas12i3融合有望进一步提高编辑效率。目前,常用的5’至3’方向对单链或双链dna进行消化的外切酶有噬菌体的t5核酸外切酶(t5 exonuclease,t5e)(liang et al. 2023)、t7核酸外切酶 (t7e) (zhang et al.2024),以及单纯疱疹病毒1(hsv1)的ul12外切酶(ul12)(schreiber et al. 2024)、来自papiinealpha疱疹病毒ii的ul12类核酸外切酶(pape)、来自噬菌体ime15的t7e类核酸外切酶(me15)(schreiber et al. 2024)、三原修复核酸外切酶2 (trex2)(pan et al. 2024)等。然而,在he等人的研究中,通过将trex2外切酶与frcas9融合,其在水稻稳定植株中可以产生更大片段的基因组删除但编辑效率没有进一步提升 (he et al. 2024)。


技术实现思路

1、本发明所要解决的技术问题是如何提高水稻基因组的编辑效率,以及如何对多个基因进行编辑。

2、为解决上述技术问题,本发明首先提供了一种融合蛋白质,所述融合蛋白质含有核酸外切酶与cas12i3-5m,所述核酸外切酶为ul12、t5e、me15或pape。

3、上述融合蛋白质中,所述ul12可为如下a1)、a2)或a3):

4、a1)氨基酸是seq id no.6的第20-344位的蛋白质;

5、a2)将seq id no.6的第20-344位经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

6、a3)在a1)或a2)的n端或/和c端连接标签得到的融合蛋白质;

7、所述t5e可为如下b1)、b2)或b3):

8、b1)氨基酸是seq id no.8的第20-309位的蛋白质;

9、b2)将seq id no.8的第20-309位经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

10、b3)在b1)或b2)的n端或/和c端连接标签得到的融合蛋白质;

11、所述pape可为如下c1)、c2)或c3):

12、c1)氨基酸是seq id no.10的第20-625位的蛋白质;

13、c2)将seq id no.10的第20-625位经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

14、c3)在c1)或c2)的n端或/和c端连接标签得到的融合蛋白质;

15、所述me15可为如下d1)、d2)或d3):

16、d1)氨基酸是seq id no.12的第20-322位的蛋白质;

17、d2)将seq id no.12的第20-322位经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

18、d3)在d1)或d2)的n端或/和c端连接标签得到的融合蛋白质;

19、所述cas12i3-5m可为如下e1)、e2)或e3):

20、e1)氨基酸是seq id no.4的第42-1089位的蛋白质;

21、e2)将seq id no.4的第42-1089位经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有相同功能的蛋白质;

22、e3)在e1)或e2)的n端或/和c端连接标签得到的融合蛋白质。

23、上述a2)中的蛋白质,为与a2)的蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。上述b2)中的蛋白质,为与b2)的蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。上述c2)中的蛋白质,为与c2)的蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。上述d2)中的蛋白质,为与d2)的蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。上述e2)中的蛋白质,为与e2)的蛋白质的氨基酸序列具有75%或75%以上同一性且具有相同功能的蛋白质。同一性是指氨基酸序列的同一性。可使用国际互联网上的同源性检索站点测定氨基酸序列的同一性,如ncbi主页网站的blast网页。例如,可在高级blast2.1中,通过使用blastp作为程序,将expect值设置为10,将所有filter设置为off,使用blosum62作为matrix,将gapexistence cost,per residue gap cost和lambda ratio分别设置为11,1和0.85(缺省值)并进行检索一对氨基酸序列的同一性进行计算,然后即可获得同一性的值(%)。所述具有75%或75%以上同一性为具有75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的同一性。

24、上述a2)、b2)、c2)、d2)、e2)中的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。

25、a3)、b3)、c3)、d3)、e3)中所述标签可为利用dna体外重组技术,与目的蛋白一起融合表达的一种多肽或者蛋白,以便于目的蛋白的表达、检测、示踪和/或纯化。所述标签可为poly-arg、poly-his、flag、strep-tag ii、c-myc、mbp标签、ha标签、gst标签和/或sumo标签等。

26、上述融合蛋白质还可含有核定位信号和/或连接肽。

27、所述核酸外切酶、所述cas12i3-5m和所述核定位信号的连接可直接连接,也可通过常见的连接肽连接,只要不影响所述碱基编辑器的功能即可。其中,所述连接是指蛋白质或多肽间通过一个蛋白质或多肽的c端的氨基酸残基与另一个蛋白质或多肽的n端的氨基酸残基形成的肽键相连。

28、在本发明的实施例中,所述连接肽为seq id no.6的第345-406位所示的多肽。

29、所述核定位信号的序列可为seq id no.6的第2-19位和/或seq id no.6的第1478-1521位。

30、上述融合蛋白质可为ul12-cas12i3-5m融合蛋白质、t5e-cas12i3-5m融合蛋白质、pape-cas12i3-5m融合蛋白质或me15-cas12i3-5m融合蛋白质;

31、所述ul12-cas12i3-5m融合蛋白质为氨基酸是seq id no.6的蛋白质;

32、所述t5e-cas12i3-5m融合蛋白质为氨基酸是seq id no.8的蛋白质;

33、pape-cas12i3-5m融合蛋白质为氨基酸是seq id no.10的蛋白质;

34、me15-cas12i3-5m融合蛋白质为氨基酸是seq id no.12的蛋白质。

35、本发明还提供与所述融合蛋白质相关的生物材料,所述生物材料为下述h1)-h4)中的至少一种:

36、h1)编码所述融合蛋白质的核酸分子;

37、h2)含有h1)所述核酸分子的表达盒;

38、h3)含有h1)所述核酸分子的重组载体或含有h2)所述表达盒的重组载体;

39、h4)含有h1)所述核酸分子的重组微生物、含有h2)所述表达盒的重组微生物或含有h3)所述重组载体的重组微生物。

40、其中,所述核酸分子可以是dna,如cdna、基因组dna或重组dna;所述核酸分子也可以是rna,如mrna或hnrna等。

41、h1)所述核酸分子中,编码所述ul12的核酸分子可为编码序列是序列表中seq idno.5的第58-1032位的dna分子;

42、编码所述t5e的核酸分子可为编码序列是序列表中seq id no.7的第58-927位的dna分子;

43、编码所述pape的核酸分子可为编码序列是序列表中seq id no.9的第58-1875位的dna分子;

44、编码所述me15的核酸分子可为编码序列是序列表中seq id no.11的第58-966位的dna分子;

45、编码所述cas12i3-5m的核酸分子可为编码序列是序列表中seq id no.3的第124-3267位的dna分子。

46、具体的,编码所述ul12-cas12i3-5m融合蛋白质的核酸分子可为编码链的核苷酸序列是seq id no.5所示的dna分子;

47、编码所述t5e-cas12i3-5m融合蛋白质的核酸分子可为编码链的核苷酸序列是seqid no.7所示的dna分子;

48、编码所述pape-cas12i3-5m融合蛋白质的核酸分子可为编码链的核苷酸序列是seq id no.9所示的dna分子;

49、编码所述me15-cas12i3-5m的核酸分子可为编码链的核苷酸序列是seq id no.11所示的dna分子。

50、上述生物材料中,所述表达盒,是指能够在宿主细胞(如植物细胞)中表达所述融合蛋白质的dna,该dna不但可包括启动所述融合蛋白质编码基因转录的启动子,还可包括终止所述融合蛋白质编码基因转录的终止子。进一步,所述表达盒还可包括增强子序列。可用于本发明的启动子包括但不限于:组成型启动子,组织、器官和发育特异的启动子,和诱导型启动子。启动子的例子包括但不限于:玉米的ubiquitin启动子、花椰菜花叶病毒的组成型启动子 35s; 来自西红柿的创伤诱导型启动子,亮氨酸氨基肽酶 ("lap");来自烟草的化学诱导型启动子,病程相关蛋白 1 (pr1) (由水杨酸和 bth (苯并噻二唑 -7-硫代羟酸 s-甲酯)诱导);西红柿蛋白酶抑制剂 ii启动子 (pin2)或 lap启动子 (均可用茉莉酮酸甲酯诱导); 热休克启动子 (美国专利 5,187,267);四环素诱导型启动子 (美国专利5,057,422);种子特异性启动子,如谷子种子特异性启动子pf128(cn101063139b(中国专利2007 1 0099169.7)),种子贮存蛋白质特异的启动子 (例如,菜豆球蛋白、napin, oleosin和 大豆 beta conglycin 的启动子。它们可单独使用或与其它的植物启动子结合使用。此处引用的所有参考文献均全文引用。合适的转录终止子包括但不限于:农杆菌胭脂碱合成酶终止子(nos终止子)、花椰菜花叶病毒camv 35s终止子、tml终止子、 豌豆rbcs e9终止子和胭脂氨酸和章鱼氨酸合酶终止子。

51、在本发明的一个实施例中,h2)所述表达盒中的启动子为泛素启动子,终止子为e9终止子。

52、上述生物材料中,所述载体可为质粒、黏粒、噬菌体或病毒载体。

53、上述生物材料中,h3)所述重组载体还可含有crrna表达盒,所述crrna表达盒可转录靶向目的基因的crrna。

54、所述crrna表达盒中含有seq id no.13的第1327-1403位所示的trna的dna片段、第1404-1439位或第1417-1439位所示的cas12i3 crrna的dr序列、第1448-1515位所示为hdv的dna片段。

55、所述crrna表达盒中,启动子可为seq id no.13的第1-1326位所示的35s复合启动子。和/或,终止子为seq id no.13的第1516-1765位所示的th4终止子。

56、所述crrna表达盒可如seq id no.13所示。

57、h3)所述重组载体还含有还含有hpt基因表达盒。

58、上述生物材料中,所述微生物可为酵母、细菌、藻或真菌。其中,细菌可为农杆菌。

59、所述融合蛋白质在水稻基因编辑中的应用,也属于本发明的保护范围。

60、所述生物材料在水稻基因编辑中的应用,也属于本发明的保护范围。

61、上述应用中,所述基因可为单个基因或多个基因。

62、所述多个基因可为2、3、4、5、6、7、8、9个等多个等基因。

63、在进行多个基因编辑时,靶序列可利用trna的dna序列和/或核酸酶hdv的dna序列间隔。

64、本发明的融合蛋白质均可提高编辑效率,其中ul12-cas12i3-5m策略的单基因敲除效率最高,与cas12i3和cas12i3-5m相比,编辑效率分别最高提高了12.46倍和1.25倍,平均编辑效率最高可达98.61%±2.41%;进一步,本利用cas12i3-5m、t5e-cas12i3-5m、ul12-cas12i3-5m、pape-cas12i3-5m、me15-cas12i3-5m对水稻多个基因进行编辑,结果表明,本发明的融合蛋白质均可提高多基因编辑效率,其中ul12-cas12i3-5m在各个基因串联的组合中均保持最高的编辑效率,其介导的三个基因、四个基因、五个基因以及六个基因同时编辑的效率分别为82.76%、61.36%、52.94%和51.07%。上述水稻高效多基因编辑体系的建立为利用crispr/cas12i3进行农作物基因功能研究和一代聚合多个优异等位基因创制农作物新种质提供了重要工具和技术支撑。

65、下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。

当前第1页1 2 
当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1