一种I-B型CRISPR-Cascade-Cas3基因编辑系统及应用

文档序号:33648464发布日期:2023-03-29 06:04阅读:165来源:国知局
一种I-B型CRISPR-Cascade-Cas3基因编辑系统及应用
一种i-b型crispr-cascade-cas3基因编辑系统及应用
技术领域
1.本发明涉及一种i-b型crispr-cascade-cas3基因编辑系统及应用,属于生物医药技术领域。


背景技术:

2.crispr-cas(clustered regularly interspaced short palindromic repeats and crispr-associated proteins)系统是在细菌和古细菌基因组中发现的一种由rna介导、抵挡外源核酸入侵的“适应性免疫系统”1.。crispr-cas基因簇包含储存外源核酸序列信息的crispr基因座以及编码不同功能蛋白的cas基因。crispr基因座包括先导序列leader、重复序列repeat以及间隔序列spacer
2.。
3.crispr-cas系统发挥作用主要分为三个阶段(如图1所示):1、适应阶段(adaptation):细菌通过cas蛋白识别并捕获外来入侵核酸片段,将其作为新的spacer序列整合入crispr基因座中;2、crispr rna(crrna)成熟阶段(maturation):储存外来核酸信息的crispr基因座转录成前体crispr rna(pre-crrna),在cas蛋白和一些核酸酶的作用下加工成成熟的crispr rna(crrna),而后与cas蛋白形成crrna/cas蛋白复合物;3、干扰阶段(interference):crrna/cas蛋白复合物通过crrna与目标序列上pam(protospacer adjacent motif)序列附近的靶核酸互作配对结合,具有切割活性的cas蛋白在目标位点上对靶基因进行特异性切割
3.。
4.crispr-cas系统分为两类:class 1和class 2(图2)。class 2系统包括三种类型(type ii、typev和vi),利用单个多结构域蛋白如cas9或cas12来干扰靶标核酸。class 1系统占整个crispr-cas系统的90%,也分为type i、type iii和typeⅳ三种类型,进一步分为七个亚型(i-a至f和i-u),使用多cas蛋白以及crrna组成的效应复合物cascade(crispr-associated complex for antiviral defense)来执行相应功能
4.。class 1系统包括cas3(有时融合cas2)、cas5、cas6、cas7、cas8、cas10、cas11,在不同亚型中有不同的组合
5.。cas5与cas7形成cascade的骨架,cas7蛋白形成6-7个多拷贝数亚基,结合和支撑crrna 并影响crrna与dna的互补形式;cas6负责加工处理pre-crrna;cas5分子量较小,与底物核酸结合有关;cas8和cas10等负责在底物dna 结合过程中识别pam序列;具有解旋酶和核酸酶活性的cas3蛋白负责最后剪切靶标核酸,并进一步降解dna
6.。
5.目前基于class 2系统中的crispr-cas9的基因编辑技术已十分成熟且应用广泛,并已被开发成为高效的基因编辑工具与基因检测工具,在基础和应用生物学研究中发挥重要的作用。该系统利用向导rna(single guide rna,sgrna)识别并结合到靶标dna上,引导cas9蛋白在目标位点进行切割形成dna双链断裂(dna double-strand break,dsb)
7.。然后细胞通过非同源末端连接(non-homologous end joining,nhej)和同源重组修复(homology-directed repair,hdr)在目标位点上造成碱基的插入或缺失(indel),以此对基因组进行编辑
8.。
6.class 1中type i crispr-cas系统的作用机制与cas9不同。其工作原理如下:
7.1、cascade识别pam序列附近的靶标双链dna(dsdna),促使crispr rna(crrna)与靶标单链(与crrna互补的链)形成异源双链核酸分子,置换出非靶标链,形成r-loop结构;
8.2、具有解旋酶与核酸酶活性的cas3被特异性地招募到cascade/r-loop复合物中,切割其中的非靶标链(pam序列在非靶标链上),优先在距离pam序列7或9个核苷酸位置处产生缺口,产生缺口的dna链可能会穿过cas3的解旋酶结构域,从而启动后续的dna解链以及降解过程
9.。
9.尽管crispr-cas9系统简单易操作,但仍然存在脱靶等问题。另外虽然crispr-cas9切割了靶标dna,但由于外显子跳跃或翻译再起始机制,仍有一些靶标蛋白可以部分表达,产生活性发挥其功能,进而影响基因编辑的效率
10.。同时crispr-cas9产生长片段缺失的能力相对有限,也限制了其应用
11.。
10.相比于crispr-cas9系统来说,class 1系统中效应复合物的组成更为复杂和精密,且cascade中crrna的长度一般为30nt以上,这相比20nt左右靶向配对的cas9具有更高的特异性,发生脱靶的几率会更小。cascade复合物必须与靶标dna形成完整的r-loop结构,才能招募cas3
12.。这一特性可以防止cas3过早地结合到dna上,引起非特异性切割。最重要的是,cas3切割靶标dna会造成目标位点上长片段缺失(几百bp到100kb),这种能力是目前crispr-cas9系统不具备的。因此,class 1crispr-cas系统有望成为效果更好、功能更强大的基因编辑工具。
11.由于class 1系统的效应复合物组成复杂,直到2019年i型crispr-cas系统才首次被报道应用于哺乳动物细胞基因编辑。该研究利用来源于thermobifida fusca的i-e型crispr-cas系统在人胚胎干细胞(hesc)以及人类近单倍体细胞系(hap1)中,达到了13%以及60%的敲除效率,并且发现了由特定的crrna可以产生大量不同长度的基因组缺失(图3的左图),证明了i型基因编辑工具有优秀的造成长片段缺失的能力
9.。另外一个研究利用一种type i-c型crispr-cas系统在人胚胎干细胞(hesc)以及人类近单倍体细胞系(hap1)也达到了很好的敲除效率
13.(图3的右图)。这两项研究均表明,开发i型基因编辑工具有极大的前景。
12.目前,对于class 1类crispr-cas系统中的i-e和i-f型的研究已经较为完整透彻,但对其他亚型的结构、功能特点及作用机制研究尚不足,导致我们不能全面了解和掌握class 1类crispr-cas系统,也阻碍了该类系统在基因编辑等领域的开发应用。有研究表明,i型crispr-cas系统中cas蛋白的排列方式被保留在i-b型中,其他亚型都有不同程度的基因缺失或重新排列,该类型可能在进化上更为原始。因此,如能开发与利用i-b型crispr-cas系统基因编辑工具,则有利于人们更广泛全面地了解与掌握class 1类crispr-cas系统,为以后的广泛应用奠定基础。
13.集胞藻synechocystis sp.pcc 6714菌株是单细胞蓝细菌,与广泛研究的模式生物synechocystissp.pcc 6803密切相关。这两株菌都是r.kunisawa从加利福尼亚奥克兰的同一个淡水池塘中分离出,其中16s rrna的同源性高达99.4%,基因含量和预测的蛋白质组非常保守,在进化上具有相同的起源
14.。同时在较早的研究中,synechocystis sp.pcc 6714和synechocystis sp.pcc6803都可用于染色体dna的制备
15.,适合于在实验室中进行基因操作。
14.上文涉及的参考文献如下:
systems.mol cell.2022jan 13:s1097-2765(21)01137-0.
28.[14]kopf m,s,pade n,et al.comparative genome analysis of the closely related synechocystis strains pcc 6714and pcc 6803.dna res,2014,21(3):255-266.
[0029]
[15]joset f.transformation in synechocystis pcc 6714and 6803:preparation of chromosomal dna.methods enzymol,1988,167:712-714.


技术实现要素:

[0030]
本发明的主要目的是:克服现有技术存在的问题,提出一种i-b型crispr-cascade-cas3基因编辑系统及其应用,以此形成的基因编辑技术手段能够使单个crispr靶向位点形成不同程度的长片段缺失,从而弥补目前crispr-cas9产生长片段缺失的能力相对有限的空白,并可以丰富基因编辑工具箱。
[0031]
本发明解决其技术问题的技术方案如下:
[0032]
一种i-b型crispr-cascade-cas3基因编辑系统,其特征是,由cascade复合物以及cas3蛋白组成;所述cascade复合物由cmx8蛋白、cas8蛋白、cas5蛋白、cas6蛋白、cas11蛋白以及crrna复合而成;所述cmx8蛋白的氨基酸序列为seq id no.2;所述cas8蛋白的氨基酸序列为seq id no.4;所述cas5蛋白的氨基酸序列为seq id no.6;所述cas6蛋白的氨基酸序列为seq id no.8;所述cas11蛋白的氨基酸序列为seq id no.10;所述cas3蛋白的氨基酸序列为seq id no.12;表达crrna的dna片段序列由彼此相同的repeat序列、彼此相同或不同的spacer序列间隔布置而成,且该dna片段序列的首尾均为repeat序列,所述repeat序列为5
’‑
gtgtccaaaccattgatgccgtaaggcgttgagcac-3’,所述spacer序列根据靶标基因设计而成。
[0033]
该i-b型crispr-cascade-cas3基因编辑系统通过cascade复合物与cas3蛋白进行识别与切割,更加严谨,能够使单个crispr靶向位点形成不同程度的长片段缺失,从而弥补目前crispr-cas9产生长片段缺失的能力相对有限的空白,并可以丰富基因编辑工具箱。
[0034]
优选地,cas8蛋白的氨基酸序列的3’端连有核定位信号nls;cas3蛋白的氨基酸序列的5’端连有核定位信号nls;所述核定位信号nls的氨基酸序列为seq id no.14;表达crrna的dna片段序列的结构为:5
’‑
repeat序列-spacer序列-repeat序列-spacer序列-repeat序列-3’。
[0035]
更优选地,所述cmx8蛋白的编码基因序列为seq id no.1;所述cas8蛋白的编码基因序列为seq id no.3;所述cas5蛋白的编码基因序列为seq id no.5;所述cas6蛋白的编码基因序列为seq id no.7;所述cas11蛋白的编码基因序列为seq id no.9;所述cas3蛋白的编码基因序列为seq id no.11;所述核定位信号nls的编码基因序列为seq id no.13;所述i-b型crispr-cascade-cas3基因编辑系统最偏好的pam-dna序列为5
’‑
atg-3’。
[0036]
采用以上优选方案,可进一步优化具体细节特征,获得更好的基因编辑效果。
[0037]
本发明还提出:
[0038]
前文所述i-b型crispr-cascade-cas3基因编辑系统的制备方法,其特征是,包括以下步骤:
[0039]
第一步、构建cascade复合物的质粒,并构建cas3蛋白的质粒;
[0040]
第二步、将cascade复合物的质粒共转入e.coli原核表达细胞,将cas3蛋白的质粒单独转入e.coli原核表达细胞;然后分别进行诱导表达,并经纯化获得纯化的cascade复合物和cas3蛋白;
[0041]
即得i-b型crispr-cascade-cas3基因编辑系统。
[0042]
优选地,第一步中,在cascade复合物的质粒中,cas8蛋白的编码基因序列的3’端连有核定位信号nls的编码基因序列;在cas3蛋白的质粒中,cas3蛋白的编码基因序列的5’端连有核定位信号nls的编码基因序列;所述核定位信号nls的编码基因序列为seq id no.13;
[0043]
第二步中,所述e.coli原核表达细胞为e.coli bl21(de3);纯化时先将表达产物经亲和层析处理得到粗提蛋白,再将粗提蛋白经分子筛层析得到纯化的目的蛋白。
[0044]
更优选地,第一步的具体过程如下:
[0045]
将cmx8蛋白、核定位信号nls、cas8蛋白、cas5蛋白的编码基因序列构建入第一质粒,将cas6蛋白、cas11蛋白的编码基因序列构建入第二质粒,将表达crrna的dna片段序列构建入第三质粒;所述第一质粒、第二质粒以及第三质粒均属于cascade复合物的质粒;将核定位信号nls、cas3蛋白的编码基因序列构建入第四质粒,所述第四质粒即cas3蛋白的质粒;
[0046]
所述第一质粒的载体为pcdf-duet-1,所述第二质粒的载体为prsf-duet-1,所述第三质粒的载体为puc19,所述第四质粒的载体为pet-28a。
[0047]
上述制备方法能快速、高效、高产的产生高纯度与活性的cascade复合物与cas蛋白,使用e.coli原核表达系统,亲和柱与分子筛纯化可以在两天之内得到大量蛋白,效率高。
[0048]
本发明还提出:
[0049]
前文所述i-b型crispr-cascade-cas3基因编辑系统用于识别、结合及编辑原核生物基因或真核生物基因的应用。
[0050]
本发明还提出:
[0051]
一种细胞基因敲除方法,其特征是,采用前文所述i-b型crispr-cascade-cas3基因编辑系统,所述方法包括以下步骤:
[0052]
s1、将cascade复合物以及cas3蛋白电转入目标细胞对其靶标基因进行敲除;
[0053]
s2、检测分析确定靶标基因的敲除效果。
[0054]
优选地,s1中,采用neon细胞核转染系统进行电转;
[0055]
s2中,采用流式分析法进行检测分析,或者采用long range pcr法及ngs测序法进行检测分析。
[0056]
上述细胞基因敲除方法能在目标细胞中对靶标基因进行敲除,且基因敲除效率高。
[0057]
本发明还提出:
[0058]
一种含有前文所述i-b型crispr-cascade-cas3基因编辑系统的细胞系或细胞株。
[0059]
与现有技术相比,本发明的i-b型crispr-cascade-cas3基因编辑系统能够使单个crispr靶向位点形成不同程度的长片段缺失,从而弥补目前crispr-cas9产生长片段缺失的能力相对有限的空白;本发明制备方法能快速、高效、高产的产生高纯度与活性的
cascade复合物与cas蛋白,使用e.coli原核表达系统,亲和柱与分子筛纯化可以在两天之内得到大量蛋白,效率高;本发明细胞基因敲除方法能在目标细胞中对靶标基因进行敲除,且基因敲除效率高。
附图说明
[0060]
图1为本发明背景技术中crispr-cas系统免疫机制简图。
[0061]
图2为本发明背景技术中crispr-cas系统class1与class2分类图。
[0062]
图3为本发明背景技术中利用crispr-cas系统在人类细胞中进行基因敲除实验的示意图,其中左图为i-e型crispr-cas系统,右图为i-c型crispr-cas系统。
[0063]
图4至图7依次为本发明实施例1中构建得到pcdf-duet-1-cmx8-nls-cas8-cas5、puc19-crispr array、prsf-duet-1-cas6-cas11、pet-28a-cas3质粒图谱。
[0064]
图8为本发明实施例1中以tdtomato基因作为靶标基因设计crrna序列的示意图。
[0065]
图9为本发明实施例2中cascade复合物的分子筛色谱图以及sds-page电泳图。
[0066]
图10为本发明实施例2中cas3蛋白的分子筛色谱图以及sds-page电泳图。
[0067]
图11、图12为本发明实施例3中含单一pam序列的dna与cascade复合物的emsa反应结果图。
[0068]
图13为本发明实施例4中通过分子筛体外重组得到的cascade-dna-cas3三元复合物的分子筛色谱图以及sds-page电泳图。
[0069]
图14为本发明实施例5在hesc细胞系中基因敲除效率结果图。
具体实施方式
[0070]
下面参照附图并结合实施例对本发明作进一步详细描述。但是本发明不限于所给出的例子。
[0071]
实施例1
[0072]
本实施例为构建质粒,这些质粒用于后续制备本发明基因编辑系统的各组分。
[0073]
利用pcr扩增cmx8蛋白、cas8蛋白、cas5蛋白、cas6蛋白、cas11蛋白、cas3蛋白、核定位信号nls的编码基因序列(序列依次为seq id no.1、3、5、7、9、11、13)以及crispr-array,酶切酶连重组质粒后用化学转化法将重组质粒转入dh5α感受态;再使用plasmid extraction kit提取质粒经sanger测序后获得正确的重组质粒。
[0074]
通过上述方法构建得到pcdf-duet-1-cmx8-nls-cas8-cas5、puc19-crispr array、prsf-duet-1-cas6-cas11、pet-28a-cas3质粒结构如图4至图7所示。
[0075]
本实施例设计了表达crispr array的dna片段序列(本实施例以tdtomato基因作为靶标基因)(seq id no.15),构建在puc19载体上。表达crrna的dna片段序列的结构为:5
’‑
repeat序列-spacer序列-repeat序列-spacer序列-repeat序列-3’,其中,repeat序列来源于synechocystis sp.pcc 6714的原始type i-b基因簇,spacer序列来源于tdtomato基因(如图8所示)。
[0076]
以上各序列如下:
[0077]
cmx8蛋白的编码基因序列:seq id no.1:
[0078]
atgggcagcagccatcaccatcatcaccaccaccacagccagtggagccatccgcagtttgaaaaagg
tggtggtagcggtggtggttcaggtggtagtgcatggtcacaccctcagtttgagaaactggaagtgctgttccagggtccgggatccatgccgaaaacccaagcggagatcctgaccctggacttcaacctggcggaactgccgagcgcgcaacaccgtgcgggtctggcgggtctgatcctgatgattcgtgagctgaagaaatggccgtggtttaagatccgtcaaaaggagaaagacgtgctgctgagcattgaaaacctggatcagtacggtgcgagcatccaactgaacctggaaggcctgattgcgctgttcgatctggcgtatctgagctttaccgaggagcgtaagagcaaaagcaagatcaaagacttcaaacgtgttgatgagatcgaaattgaggaaaacggcaagaacaagatccagaagtactacttctacgacgtgattaccccgcaaggtggctttctggcgggttgggacaaaagcgatggccagatctggctgcgtatttggcgtgatatgttctggagcatcattaagggcgttccggcgacccgtaacccgtttaacaaccgttgcggtctgaacctgaacgcgggcgacagcttcagcaaggatgttgagagcgtgtggaaaagcctgcagaacgcggaaaagaccaccggtcaaagcggcgcgttttacctgggtgcgatggcggttaacgcggaaaacgtgagcaccgacgatctgatcaaatggcagttcctgctgcacttctgggcgtttgttgcgcaagtgtactgcccgtatattctggacaaggatggtaaacgtaactttaacggctatgtgatcgttattccggacatcgcgaacctggaggacttctgcgatattctgccggatgtgctgagcaaccgtaacagcaaagcgttcggttttcgtccgcaggaaagcgttatcgacgtgccggagcaaggcgcgctggaactgctgaacctgatcaagcagcgtattgcgaagaaagcgggtagcggcctgctgagcgatctgatcgtgggtgttgaggtgatccacgcggaaaagcagggcaacagcatcaaactgcacagcgttagctacctgcaaccgaacgaggaaagcgtggacgattataacgcgattaagaacagctactattgcccgtggttccgtcgtcagctgctgctgaacctggttaacccgaaatttgacctggcgagccaaagctggctgaagcgtcacccgtggtacggttttggcgatctgctgagccgtatcccgcagcgttggctgaaagagaacaacagctatttcagccacgacgcgcgtcagctgttcacccaaaagggtgactttgatatgaccgtggcgaccaccaaaacccgtgagtacgcggaaatcgtttataagattgcgcagggtttcgtgctgagcaagctgagcagcaaacacgacctgcaatggagcaagtgcaaaggcaacccgaaactggagcgtgaatacaacgataagaaagagaaggtggttaacgaagcgtttctggcgatccgtagccgtaccgaaaaacaggcgttcattgactactttgttagcaccctgtatccgcacgttcgtcaagacgagttcgtggattttgcgcagaaactgttccaagacaccgatgaaatccgtagcctgaccctgctggcgctgagcagccagtatccgattaagcgtcaaggcgagaccgaataa
[0079]
cmx8蛋白的氨基酸序列:seq id no.2:
[0080]
mpktqaeiltldfnlaelpsaqhraglaglilmirelkkwpwfkirqkekdvllsienldqygasiqlnleglialfdlaylsfteerkskskikdfkrvdeieieengknkiqkyyfydvitpqggflagwdksdgqiwlriwrdmfwsiikgvpatrnpfnnrcglnlnagdsfskdvesvwkslqnaekttgqsgafylgamavnaenvstddlikwqfllhfwafvaqvycpyildkdgkrnfngyvivipdianledfcdilpdvlsnrnskafgfrpqesvidvpeqgalellnlikqriakkagsgllsdlivgvevihaekqgnsiklhsvsylqpneesvddynaiknsyycpwfrrqlllnlvnpkfdlasqswlkrhpwygfgdllsripqrwlkennsyfshdarqlftqkgdfdmtvattktreyaeivykiaqgfvlsklsskhdlqwskckgnpklereyndkkekvvneaflairsrtekqafidyfvstlyphvrqdefvdfaqklfqdtdeirsltllalssqypikrqgete
[0081]
cas8蛋白的编码基因序列:seq id no.3:
[0082]
atgagcaacctgaacctgttcgcgaccatcctgacctatccggcgccggcgagcaactatcgtggcgagagcgaggaaaaccgtagcgtgatccagaagattctgaaagacggtcaaaaatacgcgatcattagcccggaaagcatgcgtaacgcgctgcgtgagatgctgattgaactgggccagccgaacaaccgtacccgtctgcacagcgaggaccaactggcggtggagttcaaagaatacccgaacccggataagtttgcggacgatttcctgtttggttatatggttgcgcagaccaacgacgcgaaagaaatgaagaaactgaaccgtccggcgaagcgtgatagcatcttccgttgcaacatggcggtggcggttaacccgtacaaatatgacaccgtgttttaccaaagcccgctgaacgcgggtgatagcgcgtgga
agaacagcaccagcagcgcgctgctgcaccgtgaggttacccacaccgcgttccagtatccgttcgcgctggcgggcaaggactgcgcggcgaaaccggagtgggtgaaggcgctgctgcaagcgattgcggaactgaacggtgttgcgggtggccatgcgcgtgcgtactatgaatttgcgccgcgtagcgtggttgcgcgtctgaccccgaaactggtggcgggttaccagacctatggctttgatgcggagggtaactggctggaactgagccgtctgaccgcgaccgacagcgataacctggacctgccggcgaacgagttttggctgggtggcgaactggttcgtaaaatggatcaggagcaaaaggcgcaactggaagcgatgggtgcgcacctgtatgcgaacccggagaagttgtttgccgacttagcagatagttttctgggggtaccgaagaagaagcgtaaggtgtaa
[0083]
cas8蛋白的氨基酸序列:seq id no.4:
[0084]
msnlnlfatiltypapasnyrgeseenrsviqkilkdgqkyaiispesmrnalremlielgqpnnrtrlhsedqlavefkeypnpdkfaddflfgymvaqtndakemkklnrpakrdsifrcnmavavnpykydtvfyqsplnagdsawknstssallhrevthtafqypfalagkdcaakpewvkallqaiaelngvaggharayyefaprsvvarltpklvagyqtygfdaegnwlelsrltatdsdnldlpanefwlggelvrkmdqeqkaqleamgahlyanpeklfadladsflgv
[0085]
cas5蛋白的编码基因序列:seq id no.5:
[0086]
atggcgcagctggcgctggcgctggacaccgtgacccgttacctgcgtctgaaggcgccgttcgcggcgtttcgtccgttccaaagcggtagctttcgtagcaccaccccggtgccgagcttcagcgcggtttatggtctgctgctgaacctggcgggcatcgagcagcgtcaagaggtggagggtaaagttaccctgattaagccgaaagcggaactgccgaagctggcgatcgcgattggccaggtgaaaccgagcagcaccagcctgatcaaccagcaactgcacaactacccggttggtaacagcggcaaggagtttgcgagccgtaccttcggtagcaaatattggattgcgccggtgcgtcgtgaagtgctggttaacctggacctgatcattggcctgcaaagcccggtggagttttggcagaagctggatcaaggtctgaaaggcgaaaccgttatcaaccgttacggtctgccgttcgcgggcgacaacaacttcctgtttgatgagatctacccgattgaaaagccggacctggcgagctggtattgcccgctggagccggatacccgtccgaaccagggtgcgtgccgtctgaccctgtggatcgaccgtgagaacaacacccaaaccaccattaaggtttttagcccgagcgatttccgtctggaaccgccggcgaaagcgtggcagcaactgccgggctaa
[0087]
cas5蛋白的氨基酸序列:seq id no.6:
[0088]
maqlalaldtvtrylrlkapfaafrpfqsgsfrsttpvpsfsavyglllnlagieqrqevegkvtlikpkaelpklaiaigqvkpsstslinqqlhnypvgnsgkefasrtfgskywiapvrrevlvnldliiglqspvefwqkldqglkgetvinryglpfagdnnflfdeiypiekpdlaswycplepdtrpnqgacrltlwidrenntqttikvfspsdfrleppakawqqlpg
[0089]
cas6蛋白的编码基因序列:seq id no.7:
[0090]
atgaacttcatcgacctggcgtttccggtgaagggcaccgttctgaacgcggatcacaactactatctgtacagcgcgattgcgaaagagtttccgatcctgcacgacctgccggatctggcggtgaacaccatcagcggcaagccggaccgtgaaggcaaaattctgctggttccgggcagcaagctgtggatgcgtctgccgatcgataacattacccacatctaccagctggcgggtaagaaactgcgtattggccaatatagcatcgaactgggtaacccgagcctgcacccgctggagccggttgaaagcctgaaggcgcgtatcattaccattaaaggtcacaccgagccgatcagcttcctggaagcggtgaagcgtcagctgtttgcgctggagattaccgaaggtgacgttggcatcccggcgaaccacgagggtattccgaaacgtctgaccctgcaaatcaagaaaccggaacgtacctacagcattgtgggctatagcgttctgctgagcaacctgagcgcggaggatagcctgaagattcagcaagtgggtatcggtggcaaacgtcgtctgggttgcggcgtgttctatccggcggttaagaaaagcaccaacagcggtaacaagaaaaacgttgaagcgaccctgggctaa
[0091]
cas6蛋白的氨基酸序列:seq id no.8:
[0092]
mnfidlafpvkgtvlnadhnyylysaiakefpilhdlpdlavntisgkpdregkillvpgsklwmrlpidnithiyqlagkklrigqysielgnpslhplepveslkariitikghtepisfleavkrqlfaleitegdvgipanhegipkrltlqikkpertysivgysvllsnlsaedslkiqqvgiggkrrlgcgvfypavkkstnsgnkknveatlg
[0093]
cas11蛋白的编码基因序列:seq id no.9:
[0094]
atgaccgtggcgaccaccaaaacccgtgagtacgcggaaatcgtttataagattgcgcagggtttcgtgctgagcaagctgagcagcaaacacgacctgcaatggagcaagtgcaaaggcaacccgaaactggagcgtgaatacaacgataagaaagagaaggtggttaacgaagcgtttctggcgatccgtagccgtaccgaaaaacaggcgttcattgactactttgttagcaccctgtatccgcacgttcgtcaagacgagttcgtggattttgcgcagaaactgttccaagacaccgatgaaatccgtagcctgaccctgctggcgctgagcagccagtatccgattaagcgtcaaggcgagaccgaataa
[0095]
cas11蛋白的氨基酸序列:seq id no.10:
[0096]
mtvattktreyaeivykiaqgfvlsklsskhdlqwskckgnpklereyndkkekvvneaflairsrtekqafidyfvstlyphvrqdefvdfaqklfqdtdeirsltllalssqypikrqgete
[0097]
cas3蛋白的编码基因序列:seq id no.11:
[0098]
atgctgaaacaactgctggcgaagagcctgccgaccgacccgcagaagaaaccgctgagcctggaacaacacctgctggataccgagaccgcggcgctggtgatctttaagggtcgtatgctggacaactggtgccgtttctttaaggttaaagacccggatgaattcctgctgcacctgcgtgtggcggcgctgtttcacgatctgggcaaagcgaaccacgagttcattgaagcggttaccgcgaaaggttttgtgccgcagaccctgcgtcacgaatggatcagcgcgctggttctgcacctgccggaagtgcgtcaatggctgggcaaaagcaacctgaacctggaagtggttaccgcggcggttctgagccatcacctgaaagcgagcccggatggtgattacaagtgggacgaaccgcagaagagcggtgataaagttgagaccaagctgtatttcaaccacgaggaagtggaccgtatcctgaacaaaattgcgaacctgctggacgtggatagcaagctgccggaactgccgaagaaatggatcaaaggcgacattttcctggagaacatctacaaagatgcgaaccagattggtcgtaagtttacccgtcaagcgaagaaagacgatagcctgaaaggcctgctgctggcggttaaagcgggtctgattgcgagcgacagcgtggcgagcggtatttaccgtacccaggatagcgaagcgatcgcgaactgggttaaccaaaccctgcacaccaacagcattaccccggaggaaatcgaggaaaagattctgcacccgcgttatcgtcaggtggagaaaagcatcaacgaaccgttccagctgaaacgttttcaagagaaggcggaaaccctgagcagccgtctgctgctgatgagcggttgcggcagcggtaaaaccattttcgcgtacaagtggatgcagggcgttctgaacaagcaccaagcgggtcgtgcgatcttcctgtatccgacccgtggcaccgcgaccgaaggttttaaagactatgtgagctggtgcccggaggcggatgcgagcctgctgaccggtaccgcgacctacgagctgcaggcgattgcgaaaaacccgaccgaggcgaacgaaggcaaggactatcaagcggatgaacgtctgtacgcgctgggctattggggcaagcgtttctttagcgcgaccgttgaccagttcctgagctttctgacccacaactacaaaagcatctgcctgctgccggtgctggcggacagcgtggttgtgatcgatgaaattcacagcttcagcccggagatgtttgacagcctggtttgcttcctgaagacctttgatgttccggtgctgtgcatgaccgcgaccctgccgcagacccgtattgaggacctgaccattcaactggacaaggataaagacggcctgggtctggaagttttcccgaccagcgatcgtagcgagctggcggagctggaaaaagcggagggcatggaacgttacctgattgcgcacaccaacgaggaagcggcgctggacctggcggtgaaagcgtatcaggatagcaagcgtgttctgtgggttgtgaacaccgtggaccgttgccgtgagaaggcgcgtaaactggaatgcctgctgaagaccgaggttctgacctaccacagccgtttcaaactggcggatcgtcaaaaccgtcaccgtgagaccgtggaagcgtttgcgctgcaccaggcgcaaggtgaaaagaaagcggcgatcgcggttaccacccaggtgtgcgagatgagcctggatctggacgcgg
tag的蛋白可以与strep柱结合,用20mm tris-hcl ph 7.5,500mm nacl溶液洗去杂蛋白,用20mm tris-hcl ph 7.5,500mm nacl,5mm d-desthiobiotin溶液洗脱得到粗提蛋白;用分子筛superdex 200 10/300排阻层析得到均一的蛋白,洗脱液为:20mm hepes ph 7.5,150mm nacl。
[0113]
至此即获得纯化的cascade复合物,相应的分子筛色谱图以及电泳图见图9。
[0114]
(2)cas3纯化
[0115]
将pet-28a-cas3质粒单独转化到e.coli bl21(de3)中,在只含50μg/ml kan抗生素的1l lb中18℃诱导表达20h。菌体重悬于20mm hepes ph 7.5,500mm nacl,20mm imidazole,5%甘油的缓冲液中,超声裂解。用ni-nta结合带有his-tag的cas3,用咪唑终浓度为50mm、100mm、200mm和500mm的20mm hepes ph 7.5,500mm nacl,20mm imidazole,5%甘油的缓冲液梯度洗脱目的蛋白,最终得到粗提蛋白,用分子筛superdex 200 10/300排阻层析得到均一的蛋白,洗脱液为:20mm hepes ph 7.5,150mm nacl。
[0116]
至此即获得纯化的cas3蛋白,相应的分子筛色谱图以及电泳图见图10。
[0117]
实施例3
[0118]
本实施例以实施例2为基础。本实施例为筛选i-b型系统pam序列。
[0119]
本实施例通过构建pam library,筛选出synechocystis sp.pcc 6714细菌i-b型系统最偏好的pam序列。
[0120]
设计两条包含protospacer序列和随机pam序列的引物mix pam-f和mix pam-r。根据crrna的序列设计protospacer序列为“tttatcaccgtgtccccaatctggatattttgtgt”,在其5’端设计三个位置的随机碱基“nnn”作为pam library。使用酶切酶连方法将pam library与将pet-28a载体连接,构建pam library质粒。
[0121]
注:crrna序列为:guguccaaaccauugaugccguaaggcguugagcac。
[0122]
用pam library质粒作为模板,以pcr扩增出161bp pam library的双链dna,其中上游引物中带有t7启动子序列;将此pcr 产物作为模板,用5’端6-fam荧光标记的t7启动子引物再次进行pcr,使得产物带上fam荧光标记。通过两轮pcr反应,得到3’端带有cy5荧光标记的97bp双链dna,包含单一pam序列,分别命名为synpam 1-30。
[0123]
建立上述pam library所用的引物序列如下表所示,加框处为pam序列。
[0124]
[0125]
[0126][0127]
将实施例2纯化好的cascade复合物与pam library dna在25℃孵育1h,然后通过非变性电泳对反应后的产物进行分离,与cascade形成复合物后可以直观地发现荧光条带在emsa胶中的迁移速率变慢。在荧光下切下与cascade复合物结合的dna条带,进行测序,测序引物为通用t7启动子和t7终止子序列。测序结果与pet-28a-pam library质粒序列进行分析比对。
[0128]
注:上文中用到的t7启动子序列为:6-fam t7 promoter:taatacgactcactatagg(5’带荧光标记);t7终止子序列为:cy5-t7 terminator:gctagttattgctcagcgg(3’带荧光标记)。
[0129]
首先进行ann的pam筛选。根据分子相互作用中解离常数的概念,结合一半dna底物时的蛋白浓度即为解离常数,因此降低dna的反应浓度到10nm,并设置cascade复合物的梯度从0nm到200nm,观察dna与cascade复合物的结合情况。
[0130]
如图11所示,1-8号pam序列为aan和agn,在cascade复合物浓度达到100nm和200nm时,依然有较多的dna游离,而9-16号含有acn和atn两种pam序列的dna在高浓度蛋白时全部被结合。该结果表明,在pam序列的第二位,cascade复合物更偏好结合胞嘧啶c或胸腺嘧啶t。
[0131]
在pam序列中,相比第二位,第三位的偏好性更为明显。aan序列的表现都比较差,
agn中g的结合更好,acn中aca和acg的结合力相当,而atn中的atg结合力明显优于其他三个,因此,在总体上,pam序列的第三位偏好为g。
[0132]
接着固定pam序列的第二位和第三位碱基序列,改变第一位的碱基来观察其规律。如图12所示,对比ncg和ntg两组,在蛋白浓度为50nm时,ncg中acg结合得最好,而ntg中也是atg的结合效率更高一些,这表明pam序列的第一位确实是偏好于碱基a。将ntg和ncg相互比较,发现ntg的结合率总要比ncg大一些。由此得出结论,pam序列的第二位偏好为t。
[0133]
注:图11、图12显示了典型的部分结果图,其余序列的结果图虽未示出但其结果均符合以上结论。
[0134]
至此可得本发明i-b型系统的最优pam序列为5
’‑
atg-3’。
[0135]
实施例4
[0136]
本实施例基于实施例3。本实施例为体外组装cascade-dna-cas3三元复合物。
[0137]
将实施例2纯化好的cascade复合物与实施例3确定的pam-dna按照摩尔比1:3在25℃孵育1h,之后15000rpm离心10min,通过分子筛层析获得cascade-dna复合物。将该cascade-dna复合物与实施例2的cas3蛋白按照摩尔比1:3在25℃孵育1h,15000rpm离心10min后,通过分子筛层析得到cascade-dna-cas3复合物,并通过sds-page对得到的复合物进行验证(相关结果如图13所示)。
[0138]
通过以上方法得到的cascade-dna-cas3三元复合物证实了本发明中得到的cascade复合物与cas3蛋白是具有结合活性的。
[0139]
实施例5
[0140]
本实施例基于实施例4。本实施例为检测本发明i-b型crispr-cas系统在hesc细胞系中的基因敲除效率。
[0141]
构建hesc-egfp-tdtomato双报告细胞系的具体过程如下:
[0142]
首先构建hesc-egfr报告细胞系。野生型hesc细胞用tryple express(gibco)进行消化后,用optimem重悬,调整细胞密度为5
×
106cells/ml。将500μl细胞悬液与30μg线性化dnmt3b-egfp质粒混合后,加入到0.4cm电转杯中进行电穿孔,之后将其置于10cm培养皿中,培养皿中预先加入含有10μm y-27632的e8培养基。在培养3天后,加入0.5μg/ml的嘌呤霉素进行筛选,期间每日更换培养基,若长满则正常传代。培养7天后,使用荧光显微镜鉴定出表达egfp的耐药单克隆,经过单克隆扩增后得到hesc-egfp细胞系。
[0143]
之后,用上述相同的方法在hesc-egfp细胞系的基础上,构建hesc-egfr-tdtomato报告细胞系。选用质粒为:线性化dnmt3b-tdtomato质粒。对egfp+/tdtm+双阳性细胞进行筛选与单克隆扩增,进而得到hesc-egfp-tdtomato双重报告细胞系。
[0144]
采用上述hesc-egfp-tdtomato双报告细胞系;以tdtomato为靶标基因设计crrna,序列为seq id no.15(同实施例1);以egfr为靶标基因设计crrna,序列为:
[0145]
gtgtccaaaccattgatgccgtaaggcgttgagcacgtccaaaccattgatgccgtaaggcgttgagcacgtgtccaaaccattgatgccgtaaggcgttgagcac,
[0146]
其中,加框为spacer序列,其余为repeat序列。之后,先按照实施例1方法构建质粒,再按照实施例2方法制得cascade复合物以及cas3蛋白,之后采用neon细胞核转染系统
(thermofisher)电转入hesc-egfp-tdtomato双报告细胞系中,最终用facs计算编辑效率。
[0147]
电转后约4-5天,细胞用tryple express(gibco)消化,用添加10%fbs的imdm重悬hap1细胞。用lsr fortessa(bd)488nm激光对hesc-egfp-tdtomato双报告细胞系进行流式分析。facs数据用flowjo v10.4.1进行分析。
[0148]
本实施例采用上述方法探究了来自synechocystis sp.pcc 6714菌株的type
ⅰ‑
b系统即本发明的基因编辑系统的基因编辑效率。编辑效率用tdtomato-或者egfp-细胞的数量比例来表示。
[0149]
注:除此之外,还可采用long range pcr法及ngs测序法进行检测分析。
[0150]
结果如图14所示,该结果表明本发明的
ⅰ‑
b型基因编辑系统的效率较文献报道的各基因编辑系统(如来自n.lactamica atcc 23970的type
ⅰ‑
c系统)更高,可达39%的tdtomato靶向效率以及55%的egfp靶向效率;如此即证实本发明
ⅰ‑
b型基因编辑系统的优越性。注:此处提到的文献是指:tan r,krueger rk,gramelspacher mj,zhou x,xiao y,ke a,hou z,zhang y.cas11enables genome engineering in human cells with compact crispr-cas3 systems.mol cell.2022jan 13:s1097-2765(21)01137-0。
[0151]
综合以上各实施例,本发明的制备方法能快速、高效、高产的产生高纯度与活性的cascade复合物与cas蛋白,使用e.coli原核表达系统,亲和柱与分子筛纯化可以在两天之内得到大量蛋白,效率高。
[0152]
本发明的基因编辑系统源于synechocystis sp.pcc 6714,经生物学信息分析归属于i-b型。本发明的基因编辑系统对不同基因的敲除效率均高于其他ⅰ型系统,表明该系统具有优越性,具有优良的研究与开发潜力。
[0153]
除上述实施例外,本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案,均落在本发明要求的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1