一种I-B型CRISPR-Cascade-Cas3基因编辑系统及应用

文档序号：33648464发布日期：2023-03-29 06:04阅读：165来源：国知局

一种i-b型crispr-cascade-cas3基因编辑系统及应用
技术领域
1.本发明涉及一种i-b型crispr-cascade-cas3基因编辑系统及应用，属于生物医药技术领域。

背景技术：

2.crispr-cas(clustered regularly interspaced short palindromic repeats and crispr-associated proteins)系统是在细菌和古细菌基因组中发现的一种由rna介导、抵挡外源核酸入侵的“适应性免疫系统”1.。crispr-cas基因簇包含储存外源核酸序列信息的crispr基因座以及编码不同功能蛋白的cas基因。crispr基因座包括先导序列leader、重复序列repeat以及间隔序列spacer
2.。
3.crispr-cas系统发挥作用主要分为三个阶段(如图1所示)：1、适应阶段(adaptation)：细菌通过cas蛋白识别并捕获外来入侵核酸片段，将其作为新的spacer序列整合入crispr基因座中；2、crispr rna(crrna)成熟阶段(maturation)：储存外来核酸信息的crispr基因座转录成前体crispr rna(pre-crrna)，在cas蛋白和一些核酸酶的作用下加工成成熟的crispr rna(crrna)，而后与cas蛋白形成crrna/cas蛋白复合物；3、干扰阶段(interference)：crrna/cas蛋白复合物通过crrna与目标序列上pam(protospacer adjacent motif)序列附近的靶核酸互作配对结合，具有切割活性的cas蛋白在目标位点上对靶基因进行特异性切割
3.。
4.crispr-cas系统分为两类：class 1和class 2(图2)。class 2系统包括三种类型(type ii、typev和vi)，利用单个多结构域蛋白如cas9或cas12来干扰靶标核酸。class 1系统占整个crispr-cas系统的90％，也分为type i、type iii和typeⅳ三种类型，进一步分为七个亚型(i-a至f和i-u)，使用多cas蛋白以及crrna组成的效应复合物cascade(crispr-associated complex for antiviral defense)来执行相应功能
4.。class 1系统包括cas3(有时融合cas2)、cas5、cas6、cas7、cas8、cas10、cas11，在不同亚型中有不同的组合
5.。cas5与cas7形成cascade的骨架，cas7蛋白形成6-7个多拷贝数亚基，结合和支撑crrna 并影响crrna与dna的互补形式；cas6负责加工处理pre-crrna；cas5分子量较小，与底物核酸结合有关；cas8和cas10等负责在底物dna 结合过程中识别pam序列；具有解旋酶和核酸酶活性的cas3蛋白负责最后剪切靶标核酸，并进一步降解dna
6.。
5.目前基于class 2系统中的crispr-cas9的基因编辑技术已十分成熟且应用广泛，并已被开发成为高效的基因编辑工具与基因检测工具，在基础和应用生物学研究中发挥重要的作用。该系统利用向导rna(single guide rna，sgrna)识别并结合到靶标dna上，引导cas9蛋白在目标位点进行切割形成dna双链断裂(dna double-strand break，dsb)
7.。然后细胞通过非同源末端连接(non-homologous end joining，nhej)和同源重组修复(homology-directed repair，hdr)在目标位点上造成碱基的插入或缺失(indel)，以此对基因组进行编辑
8.。
6.class 1中type i crispr-cas系统的作用机制与cas9不同。其工作原理如下：
7.1、cascade识别pam序列附近的靶标双链dna(dsdna)，促使crispr rna(crrna)与靶标单链(与crrna互补的链)形成异源双链核酸分子，置换出非靶标链，形成r-loop结构；
8.2、具有解旋酶与核酸酶活性的cas3被特异性地招募到cascade/r-loop复合物中，切割其中的非靶标链(pam序列在非靶标链上)，优先在距离pam序列7或9个核苷酸位置处产生缺口，产生缺口的dna链可能会穿过cas3的解旋酶结构域，从而启动后续的dna解链以及降解过程
9.。
9.尽管crispr-cas9系统简单易操作，但仍然存在脱靶等问题。另外虽然crispr-cas9切割了靶标dna，但由于外显子跳跃或翻译再起始机制，仍有一些靶标蛋白可以部分表达，产生活性发挥其功能，进而影响基因编辑的效率
10.。同时crispr-cas9产生长片段缺失的能力相对有限，也限制了其应用
11.。
10.相比于crispr-cas9系统来说，class 1系统中效应复合物的组成更为复杂和精密，且cascade中crrna的长度一般为30nt以上，这相比20nt左右靶向配对的cas9具有更高的特异性，发生脱靶的几率会更小。cascade复合物必须与靶标dna形成完整的r-loop结构，才能招募cas3
12.。这一特性可以防止cas3过早地结合到dna上，引起非特异性切割。最重要的是，cas3切割靶标dna会造成目标位点上长片段缺失(几百bp到100kb)，这种能力是目前crispr-cas9系统不具备的。因此，class 1crispr-cas系统有望成为效果更好、功能更强大的基因编辑工具。
11.由于class 1系统的效应复合物组成复杂，直到2019年i型crispr-cas系统才首次被报道应用于哺乳动物细胞基因编辑。该研究利用来源于thermobifida fusca的i-e型crispr-cas系统在人胚胎干细胞(hesc)以及人类近单倍体细胞系(hap1)中，达到了13％以及60％的敲除效率，并且发现了由特定的crrna可以产生大量不同长度的基因组缺失(图3的左图)，证明了i型基因编辑工具有优秀的造成长片段缺失的能力
9.。另外一个研究利用一种type i-c型crispr-cas系统在人胚胎干细胞(hesc)以及人类近单倍体细胞系(hap1)也达到了很好的敲除效率
13.(图3的右图)。这两项研究均表明，开发i型基因编辑工具有极大的前景。
12.目前，对于class 1类crispr-cas系统中的i-e和i-f型的研究已经较为完整透彻，但对其他亚型的结构、功能特点及作用机制研究尚不足，导致我们不能全面了解和掌握class 1类crispr-cas系统，也阻碍了该类系统在基因编辑等领域的开发应用。有研究表明，i型crispr-cas系统中cas蛋白的排列方式被保留在i-b型中，其他亚型都有不同程度的基因缺失或重新排列，该类型可能在进化上更为原始。因此，如能开发与利用i-b型crispr-cas系统基因编辑工具，则有利于人们更广泛全面地了解与掌握class 1类crispr-cas系统，为以后的广泛应用奠定基础。
13.集胞藻synechocystis sp.pcc 6714菌株是单细胞蓝细菌，与广泛研究的模式生物synechocystissp.pcc 6803密切相关。这两株菌都是r.kunisawa从加利福尼亚奥克兰的同一个淡水池塘中分离出，其中16s rrna的同源性高达99.4％，基因含量和预测的蛋白质组非常保守，在进化上具有相同的起源
14.。同时在较早的研究中，synechocystis sp.pcc 6714和synechocystis sp.pcc6803都可用于染色体dna的制备
15.，适合于在实验室中进行基因操作。
14.上文涉及的参考文献如下：
systems.mol cell.2022jan 13:s1097-2765(21)01137-0.
28.[14]kopf m,s,pade n,et al.comparative genome analysis of the closely related synechocystis strains pcc 6714and pcc 6803.dna res,2014,21(3):255-266.
[0029]
[15]joset f.transformation in synechocystis pcc 6714and 6803:preparation of chromosomal dna.methods enzymol,1988,167:712-714.

技术实现要素：

[0030]
本发明的主要目的是：克服现有技术存在的问题，提出一种i-b型crispr-cascade-cas3基因编辑系统及其应用，以此形成的基因编辑技术手段能够使单个crispr靶向位点形成不同程度的长片段缺失，从而弥补目前crispr-cas9产生长片段缺失的能力相对有限的空白，并可以丰富基因编辑工具箱。
[0031]
本发明解决其技术问题的技术方案如下：
[0032]
一种i-b型crispr-cascade-cas3基因编辑系统，其特征是，由cascade复合物以及cas3蛋白组成；所述cascade复合物由cmx8蛋白、cas8蛋白、cas5蛋白、cas6蛋白、cas11蛋白以及crrna复合而成；所述cmx8蛋白的氨基酸序列为seq id no.2；所述cas8蛋白的氨基酸序列为seq id no.4；所述cas5蛋白的氨基酸序列为seq id no.6；所述cas6蛋白的氨基酸序列为seq id no.8；所述cas11蛋白的氨基酸序列为seq id no.10；所述cas3蛋白的氨基酸序列为seq id no.12；表达crrna的dna片段序列由彼此相同的repeat序列、彼此相同或不同的spacer序列间隔布置而成，且该dna片段序列的首尾均为repeat序列，所述repeat序列为5
’‑
gtgtccaaaccattgatgccgtaaggcgttgagcac-3’，所述spacer序列根据靶标基因设计而成。
[0033]
该i-b型crispr-cascade-cas3基因编辑系统通过cascade复合物与cas3蛋白进行识别与切割，更加严谨，能够使单个crispr靶向位点形成不同程度的长片段缺失，从而弥补目前crispr-cas9产生长片段缺失的能力相对有限的空白，并可以丰富基因编辑工具箱。
[0034]
优选地，cas8蛋白的氨基酸序列的3’端连有核定位信号nls；cas3蛋白的氨基酸序列的5’端连有核定位信号nls；所述核定位信号nls的氨基酸序列为seq id no.14；表达crrna的dna片段序列的结构为：5
’‑
repeat序列-spacer序列-repeat序列-spacer序列-repeat序列-3’。
[0035]
更优选地，所述cmx8蛋白的编码基因序列为seq id no.1；所述cas8蛋白的编码基因序列为seq id no.3；所述cas5蛋白的编码基因序列为seq id no.5；所述cas6蛋白的编码基因序列为seq id no.7；所述cas11蛋白的编码基因序列为seq id no.9；所述cas3蛋白的编码基因序列为seq id no.11；所述核定位信号nls的编码基因序列为seq id no.13；所述i-b型crispr-cascade-cas3基因编辑系统最偏好的pam-dna序列为5
’‑
atg-3’。
[0036]
采用以上优选方案，可进一步优化具体细节特征，获得更好的基因编辑效果。
[0037]
本发明还提出：
[0038]
前文所述i-b型crispr-cascade-cas3基因编辑系统的制备方法，其特征是，包括以下步骤：
[0039]
第一步、构建cascade复合物的质粒，并构建cas3蛋白的质粒；
[0040]
第二步、将cascade复合物的质粒共转入e.coli原核表达细胞，将cas3蛋白的质粒单独转入e.coli原核表达细胞；然后分别进行诱导表达，并经纯化获得纯化的cascade复合物和cas3蛋白；
[0041]
即得i-b型crispr-cascade-cas3基因编辑系统。
[0042]
优选地，第一步中，在cascade复合物的质粒中，cas8蛋白的编码基因序列的3’端连有核定位信号nls的编码基因序列；在cas3蛋白的质粒中，cas3蛋白的编码基因序列的5’端连有核定位信号nls的编码基因序列；所述核定位信号nls的编码基因序列为seq id no.13；
[0043]
第二步中，所述e.coli原核表达细胞为e.coli bl21(de3)；纯化时先将表达产物经亲和层析处理得到粗提蛋白，再将粗提蛋白经分子筛层析得到纯化的目的蛋白。
[0044]
更优选地，第一步的具体过程如下：
[0045]
将cmx8蛋白、核定位信号nls、cas8蛋白、cas5蛋白的编码基因序列构建入第一质粒，将cas6蛋白、cas11蛋白的编码基因序列构建入第二质粒，将表达crrna的dna片段序列构建入第三质粒；所述第一质粒、第二质粒以及第三质粒均属于cascade复合物的质粒；将核定位信号nls、cas3蛋白的编码基因序列构建入第四质粒，所述第四质粒即cas3蛋白的质粒；
[0046]
所述第一质粒的载体为pcdf-duet-1，所述第二质粒的载体为prsf-duet-1，所述第三质粒的载体为puc19，所述第四质粒的载体为pet-28a。
[0047]
上述制备方法能快速、高效、高产的产生高纯度与活性的cascade复合物与cas蛋白，使用e.coli原核表达系统，亲和柱与分子筛纯化可以在两天之内得到大量蛋白，效率高。
[0048]
本发明还提出：
[0049]
前文所述i-b型crispr-cascade-cas3基因编辑系统用于识别、结合及编辑原核生物基因或真核生物基因的应用。
[0050]
本发明还提出：
[0051]
一种细胞基因敲除方法，其特征是，采用前文所述i-b型crispr-cascade-cas3基因编辑系统，所述方法包括以下步骤：
[0052]
s1、将cascade复合物以及cas3蛋白电转入目标细胞对其靶标基因进行敲除；
[0053]
s2、检测分析确定靶标基因的敲除效果。
[0054]
优选地，s1中，采用neon细胞核转染系统进行电转；
[0055]
s2中，采用流式分析法进行检测分析，或者采用long range pcr法及ngs测序法进行检测分析。
[0056]
上述细胞基因敲除方法能在目标细胞中对靶标基因进行敲除，且基因敲除效率高。
[0057]
本发明还提出：
[0058]
一种含有前文所述i-b型crispr-cascade-cas3基因编辑系统的细胞系或细胞株。
[0059]
与现有技术相比，本发明的i-b型crispr-cascade-cas3基因编辑系统能够使单个crispr靶向位点形成不同程度的长片段缺失，从而弥补目前crispr-cas9产生长片段缺失的能力相对有限的空白；本发明制备方法能快速、高效、高产的产生高纯度与活性的
cascade复合物与cas蛋白，使用e.coli原核表达系统，亲和柱与分子筛纯化可以在两天之内得到大量蛋白，效率高；本发明细胞基因敲除方法能在目标细胞中对靶标基因进行敲除，且基因敲除效率高。
附图说明
[0060]
图1为本发明背景技术中crispr-cas系统免疫机制简图。
[0061]
图2为本发明背景技术中crispr-cas系统class1与class2分类图。
[0062]
图3为本发明背景技术中利用crispr-cas系统在人类细胞中进行基因敲除实验的示意图，其中左图为i-e型crispr-cas系统，右图为i-c型crispr-cas系统。
[0063]
图4至图7依次为本发明实施例1中构建得到pcdf-duet-1-cmx8-nls-cas8-cas5、puc19-crispr array、prsf-duet-1-cas6-cas11、pet-28a-cas3质粒图谱。
[0064]
图8为本发明实施例1中以tdtomato基因作为靶标基因设计crrna序列的示意图。
[0065]
图9为本发明实施例2中cascade复合物的分子筛色谱图以及sds-page电泳图。
[0066]
图10为本发明实施例2中cas3蛋白的分子筛色谱图以及sds-page电泳图。
[0067]
图11、图12为本发明实施例3中含单一pam序列的dna与cascade复合物的emsa反应结果图。
[0068]
图13为本发明实施例4中通过分子筛体外重组得到的cascade-dna-cas3三元复合物的分子筛色谱图以及sds-page电泳图。
[0069]
图14为本发明实施例5在hesc细胞系中基因敲除效率结果图。
具体实施方式
[0070]
下面参照附图并结合实施例对本发明作进一步详细描述。但是本发明不限于所给出的例子。
[0071]
实施例1
[0072]
本实施例为构建质粒，这些质粒用于后续制备本发明基因编辑系统的各组分。
[0073]
利用pcr扩增cmx8蛋白、cas8蛋白、cas5蛋白、cas6蛋白、cas11蛋白、cas3蛋白、核定位信号nls的编码基因序列(序列依次为seq id no.1、3、5、7、9、11、13)以及crispr-array，酶切酶连重组质粒后用化学转化法将重组质粒转入dh5α感受态；再使用plasmid extraction kit提取质粒经sanger测序后获得正确的重组质粒。
[0074]
通过上述方法构建得到pcdf-duet-1-cmx8-nls-cas8-cas5、puc19-crispr array、prsf-duet-1-cas6-cas11、pet-28a-cas3质粒结构如图4至图7所示。
[0075]
本实施例设计了表达crispr array的dna片段序列(本实施例以tdtomato基因作为靶标基因)(seq id no.15)，构建在puc19载体上。表达crrna的dna片段序列的结构为：5
’‑
repeat序列-spacer序列-repeat序列-spacer序列-repeat序列-3’，其中，repeat序列来源于synechocystis sp.pcc 6714的原始type i-b基因簇，spacer序列来源于tdtomato基因(如图8所示)。
[0076]
以上各序列如下：
[0077]
cmx8蛋白的编码基因序列：seq id no.1：
[0078]
atgggcagcagccatcaccatcatcaccaccaccacagccagtggagccatccgcagtttgaaaaagg
tggtggtagcggtggtggttcaggtggtagtgcatggtcacaccctcagtttgagaaactggaagtgctgttccagggtccgggatccatgccgaaaacccaagcggagatcctgaccctggacttcaacctggcggaactgccgagcgcgcaacaccgtgcgggtctggcgggtctgatcctgatgattcgtgagctgaagaaatggccgtggtttaagatccgtcaaaaggagaaagacgtgctgctgagcattgaaaacctggatcagtacggtgcgagcatccaactgaacctggaaggcctgattgcgctgttcgatctggcgtatctgagctttaccgaggagcgtaagagcaaaagcaagatcaaagacttcaaacgtgttgatgagatcgaaattgaggaaaacggcaagaacaagatccagaagtactacttctacgacgtgattaccccgcaaggtggctttctggcgggttgggacaaaagcgatggccagatctggctgcgtatttggcgtgatatgttctggagcatcattaagggcgttccggcgacccgtaacccgtttaacaaccgttgcggtctgaacctgaacgcgggcgacagcttcagcaaggatgttgagagcgtgtggaaaagcctgcagaacgcggaaaagaccaccggtcaaagcggcgcgttttacctgggtgcgatggcggttaacgcggaaaacgtgagcaccgacgatctgatcaaatggcagttcctgctgcacttctgggcgtttgttgcgcaagtgtactgcccgtatattctggacaaggatggtaaacgtaactttaacggctatgtgatcgttattccggacatcgcgaacctggaggacttctgcgatattctgccggatgtgctgagcaaccgtaacagcaaagcgttcggttttcgtccgcaggaaagcgttatcgacgtgccggagcaaggcgcgctggaactgctgaacctgatcaagcagcgtattgcgaagaaagcgggtagcggcctgctgagcgatctgatcgtgggtgttgaggtgatccacgcggaaaagcagggcaacagcatcaaactgcacagcgttagctacctgcaaccgaacgaggaaagcgtggacgattataacgcgattaagaacagctactattgcccgtggttccgtcgtcagctgctgctgaacctggttaacccgaaatttgacctggcgagccaaagctggctgaagcgtcacccgtggtacggttttggcgatctgctgagccgtatcccgcagcgttggctgaaagagaacaacagctatttcagccacgacgcgcgtcagctgttcacccaaaagggtgactttgatatgaccgtggcgaccaccaaaacccgtgagtacgcggaaatcgtttataagattgcgcagggtttcgtgctgagcaagctgagcagcaaacacgacctgcaatggagcaagtgcaaaggcaacccgaaactggagcgtgaatacaacgataagaaagagaaggtggttaacgaagcgtttctggcgatccgtagccgtaccgaaaaacaggcgttcattgactactttgttagcaccctgtatccgcacgttcgtcaagacgagttcgtggattttgcgcagaaactgttccaagacaccgatgaaatccgtagcctgaccctgctggcgctgagcagccagtatccgattaagcgtcaaggcgagaccgaataa
[0079]
cmx8蛋白的氨基酸序列：seq id no.2：
[0080]
mpktqaeiltldfnlaelpsaqhraglaglilmirelkkwpwfkirqkekdvllsienldqygasiqlnleglialfdlaylsfteerkskskikdfkrvdeieieengknkiqkyyfydvitpqggflagwdksdgqiwlriwrdmfwsiikgvpatrnpfnnrcglnlnagdsfskdvesvwkslqnaekttgqsgafylgamavnaenvstddlikwqfllhfwafvaqvycpyildkdgkrnfngyvivipdianledfcdilpdvlsnrnskafgfrpqesvidvpeqgalellnlikqriakkagsgllsdlivgvevihaekqgnsiklhsvsylqpneesvddynaiknsyycpwfrrqlllnlvnpkfdlasqswlkrhpwygfgdllsripqrwlkennsyfshdarqlftqkgdfdmtvattktreyaeivykiaqgfvlsklsskhdlqwskckgnpklereyndkkekvvneaflairsrtekqafidyfvstlyphvrqdefvdfaqklfqdtdeirsltllalssqypikrqgete
[0081]
cas8蛋白的编码基因序列：seq id no.3：
[0082]
atgagcaacctgaacctgttcgcgaccatcctgacctatccggcgccggcgagcaactatcgtggcgagagcgaggaaaaccgtagcgtgatccagaagattctgaaagacggtcaaaaatacgcgatcattagcccggaaagcatgcgtaacgcgctgcgtgagatgctgattgaactgggccagccgaacaaccgtacccgtctgcacagcgaggaccaactggcggtggagttcaaagaatacccgaacccggataagtttgcggacgatttcctgtttggttatatggttgcgcagaccaacgacgcgaaagaaatgaagaaactgaaccgtccggcgaagcgtgatagcatcttccgttgcaacatggcggtggcggttaacccgtacaaatatgacaccgtgttttaccaaagcccgctgaacgcgggtgatagcgcgtgga
agaacagcaccagcagcgcgctgctgcaccgtgaggttacccacaccgcgttccagtatccgttcgcgctggcgggcaaggactgcgcggcgaaaccggagtgggtgaaggcgctgctgcaagcgattgcggaactgaacggtgttgcgggtggccatgcgcgtgcgtactatgaatttgcgccgcgtagcgtggttgcgcgtctgaccccgaaactggtggcgggttaccagacctatggctttgatgcggagggtaactggctggaactgagccgtctgaccgcgaccgacagcgataacctggacctgccggcgaacgagttttggctgggtggcgaactggttcgtaaaatggatcaggagcaaaaggcgcaactggaagcgatgggtgcgcacctgtatgcgaacccggagaagttgtttgccgacttagcagatagttttctgggggtaccgaagaagaagcgtaaggtgtaa
[0083]
cas8蛋白的氨基酸序列：seq id no.4：
[0084]
msnlnlfatiltypapasnyrgeseenrsviqkilkdgqkyaiispesmrnalremlielgqpnnrtrlhsedqlavefkeypnpdkfaddflfgymvaqtndakemkklnrpakrdsifrcnmavavnpykydtvfyqsplnagdsawknstssallhrevthtafqypfalagkdcaakpewvkallqaiaelngvaggharayyefaprsvvarltpklvagyqtygfdaegnwlelsrltatdsdnldlpanefwlggelvrkmdqeqkaqleamgahlyanpeklfadladsflgv
[0085]
cas5蛋白的编码基因序列：seq id no.5：
[0086]
atggcgcagctggcgctggcgctggacaccgtgacccgttacctgcgtctgaaggcgccgttcgcggcgtttcgtccgttccaaagcggtagctttcgtagcaccaccccggtgccgagcttcagcgcggtttatggtctgctgctgaacctggcgggcatcgagcagcgtcaagaggtggagggtaaagttaccctgattaagccgaaagcggaactgccgaagctggcgatcgcgattggccaggtgaaaccgagcagcaccagcctgatcaaccagcaactgcacaactacccggttggtaacagcggcaaggagtttgcgagccgtaccttcggtagcaaatattggattgcgccggtgcgtcgtgaagtgctggttaacctggacctgatcattggcctgcaaagcccggtggagttttggcagaagctggatcaaggtctgaaaggcgaaaccgttatcaaccgttacggtctgccgttcgcgggcgacaacaacttcctgtttgatgagatctacccgattgaaaagccggacctggcgagctggtattgcccgctggagccggatacccgtccgaaccagggtgcgtgccgtctgaccctgtggatcgaccgtgagaacaacacccaaaccaccattaaggtttttagcccgagcgatttccgtctggaaccgccggcgaaagcgtggcagcaactgccgggctaa
[0087]
cas5蛋白的氨基酸序列：seq id no.6：
[0088]
maqlalaldtvtrylrlkapfaafrpfqsgsfrsttpvpsfsavyglllnlagieqrqevegkvtlikpkaelpklaiaigqvkpsstslinqqlhnypvgnsgkefasrtfgskywiapvrrevlvnldliiglqspvefwqkldqglkgetvinryglpfagdnnflfdeiypiekpdlaswycplepdtrpnqgacrltlwidrenntqttikvfspsdfrleppakawqqlpg
[0089]
cas6蛋白的编码基因序列：seq id no.7：
[0090]
atgaacttcatcgacctggcgtttccggtgaagggcaccgttctgaacgcggatcacaactactatctgtacagcgcgattgcgaaagagtttccgatcctgcacgacctgccggatctggcggtgaacaccatcagcggcaagccggaccgtgaaggcaaaattctgctggttccgggcagcaagctgtggatgcgtctgccgatcgataacattacccacatctaccagctggcgggtaagaaactgcgtattggccaatatagcatcgaactgggtaacccgagcctgcacccgctggagccggttgaaagcctgaaggcgcgtatcattaccattaaaggtcacaccgagccgatcagcttcctggaagcggtgaagcgtcagctgtttgcgctggagattaccgaaggtgacgttggcatcccggcgaaccacgagggtattccgaaacgtctgaccctgcaaatcaagaaaccggaacgtacctacagcattgtgggctatagcgttctgctgagcaacctgagcgcggaggatagcctgaagattcagcaagtgggtatcggtggcaaacgtcgtctgggttgcggcgtgttctatccggcggttaagaaaagcaccaacagcggtaacaagaaaaacgttgaagcgaccctgggctaa
[0091]
cas6蛋白的氨基酸序列：seq id no.8：
[0092]
mnfidlafpvkgtvlnadhnyylysaiakefpilhdlpdlavntisgkpdregkillvpgsklwmrlpidnithiyqlagkklrigqysielgnpslhplepveslkariitikghtepisfleavkrqlfaleitegdvgipanhegipkrltlqikkpertysivgysvllsnlsaedslkiqqvgiggkrrlgcgvfypavkkstnsgnkknveatlg
[0093]
cas11蛋白的编码基因序列：seq id no.9：
[0094]
atgaccgtggcgaccaccaaaacccgtgagtacgcggaaatcgtttataagattgcgcagggtttcgtgctgagcaagctgagcagcaaacacgacctgcaatggagcaagtgcaaaggcaacccgaaactggagcgtgaatacaacgataagaaagagaaggtggttaacgaagcgtttctggcgatccgtagccgtaccgaaaaacaggcgttcattgactactttgttagcaccctgtatccgcacgttcgtcaagacgagttcgtggattttgcgcagaaactgttccaagacaccgatgaaatccgtagcctgaccctgctggcgctgagcagccagtatccgattaagcgtcaaggcgagaccgaataa
[0095]
cas11蛋白的氨基酸序列：seq id no.10：
[0096]
mtvattktreyaeivykiaqgfvlsklsskhdlqwskckgnpklereyndkkekvvneaflairsrtekqafidyfvstlyphvrqdefvdfaqklfqdtdeirsltllalssqypikrqgete
[0097]
cas3蛋白的编码基因序列：seq id no.11：
[0098]
atgctgaaacaactgctggcgaagagcctgccgaccgacccgcagaagaaaccgctgagcctggaacaacacctgctggataccgagaccgcggcgctggtgatctttaagggtcgtatgctggacaactggtgccgtttctttaaggttaaagacccggatgaattcctgctgcacctgcgtgtggcggcgctgtttcacgatctgggcaaagcgaaccacgagttcattgaagcggttaccgcgaaaggttttgtgccgcagaccctgcgtcacgaatggatcagcgcgctggttctgcacctgccggaagtgcgtcaatggctgggcaaaagcaacctgaacctggaagtggttaccgcggcggttctgagccatcacctgaaagcgagcccggatggtgattacaagtgggacgaaccgcagaagagcggtgataaagttgagaccaagctgtatttcaaccacgaggaagtggaccgtatcctgaacaaaattgcgaacctgctggacgtggatagcaagctgccggaactgccgaagaaatggatcaaaggcgacattttcctggagaacatctacaaagatgcgaaccagattggtcgtaagtttacccgtcaagcgaagaaagacgatagcctgaaaggcctgctgctggcggttaaagcgggtctgattgcgagcgacagcgtggcgagcggtatttaccgtacccaggatagcgaagcgatcgcgaactgggttaaccaaaccctgcacaccaacagcattaccccggaggaaatcgaggaaaagattctgcacccgcgttatcgtcaggtggagaaaagcatcaacgaaccgttccagctgaaacgttttcaagagaaggcggaaaccctgagcagccgtctgctgctgatgagcggttgcggcagcggtaaaaccattttcgcgtacaagtggatgcagggcgttctgaacaagcaccaagcgggtcgtgcgatcttcctgtatccgacccgtggcaccgcgaccgaaggttttaaagactatgtgagctggtgcccggaggcggatgcgagcctgctgaccggtaccgcgacctacgagctgcaggcgattgcgaaaaacccgaccgaggcgaacgaaggcaaggactatcaagcggatgaacgtctgtacgcgctgggctattggggcaagcgtttctttagcgcgaccgttgaccagttcctgagctttctgacccacaactacaaaagcatctgcctgctgccggtgctggcggacagcgtggttgtgatcgatgaaattcacagcttcagcccggagatgtttgacagcctggtttgcttcctgaagacctttgatgttccggtgctgtgcatgaccgcgaccctgccgcagacccgtattgaggacctgaccattcaactggacaaggataaagacggcctgggtctggaagttttcccgaccagcgatcgtagcgagctggcggagctggaaaaagcggagggcatggaacgttacctgattgcgcacaccaacgaggaagcggcgctggacctggcggtgaaagcgtatcaggatagcaagcgtgttctgtgggttgtgaacaccgtggaccgttgccgtgagaaggcgcgtaaactggaatgcctgctgaagaccgaggttctgacctaccacagccgtttcaaactggcggatcgtcaaaaccgtcaccgtgagaccgtggaagcgtttgcgctgcaccaggcgcaaggtgaaaagaaagcggcgatcgcggttaccacccaggtgtgcgagatgagcctggatctggacgcgg
tag的蛋白可以与strep柱结合，用20mm tris-hcl ph 7.5，500mm nacl溶液洗去杂蛋白，用20mm tris-hcl ph 7.5，500mm nacl，5mm d-desthiobiotin溶液洗脱得到粗提蛋白；用分子筛superdex 200 10/300排阻层析得到均一的蛋白，洗脱液为：20mm hepes ph 7.5，150mm nacl。
[0113]
至此即获得纯化的cascade复合物，相应的分子筛色谱图以及电泳图见图9。
[0114]
(2)cas3纯化
[0115]
将pet-28a-cas3质粒单独转化到e.coli bl21(de3)中，在只含50μg/ml kan抗生素的1l lb中18℃诱导表达20h。菌体重悬于20mm hepes ph 7.5，500mm nacl，20mm imidazole，5％甘油的缓冲液中，超声裂解。用ni-nta结合带有his-tag的cas3，用咪唑终浓度为50mm、100mm、200mm和500mm的20mm hepes ph 7.5，500mm nacl，20mm imidazole，5％甘油的缓冲液梯度洗脱目的蛋白，最终得到粗提蛋白，用分子筛superdex 200 10/300排阻层析得到均一的蛋白，洗脱液为：20mm hepes ph 7.5，150mm nacl。
[0116]
至此即获得纯化的cas3蛋白，相应的分子筛色谱图以及电泳图见图10。
[0117]
实施例3
[0118]
本实施例以实施例2为基础。本实施例为筛选i-b型系统pam序列。
[0119]
本实施例通过构建pam library，筛选出synechocystis sp.pcc 6714细菌i-b型系统最偏好的pam序列。
[0120]
设计两条包含protospacer序列和随机pam序列的引物mix pam-f和mix pam-r。根据crrna的序列设计protospacer序列为“tttatcaccgtgtccccaatctggatattttgtgt”，在其5’端设计三个位置的随机碱基“nnn”作为pam library。使用酶切酶连方法将pam library与将pet-28a载体连接，构建pam library质粒。
[0121]
注：crrna序列为：guguccaaaccauugaugccguaaggcguugagcac。
[0122]
用pam library质粒作为模板，以pcr扩增出161bp pam library的双链dna，其中上游引物中带有t7启动子序列；将此pcr 产物作为模板，用5’端6-fam荧光标记的t7启动子引物再次进行pcr，使得产物带上fam荧光标记。通过两轮pcr反应，得到3’端带有cy5荧光标记的97bp双链dna，包含单一pam序列，分别命名为synpam 1-30。
[0123]
建立上述pam library所用的引物序列如下表所示，加框处为pam序列。
[0124]
[0125]
[0126][0127]
将实施例2纯化好的cascade复合物与pam library dna在25℃孵育1h，然后通过非变性电泳对反应后的产物进行分离，与cascade形成复合物后可以直观地发现荧光条带在emsa胶中的迁移速率变慢。在荧光下切下与cascade复合物结合的dna条带，进行测序，测序引物为通用t7启动子和t7终止子序列。测序结果与pet-28a-pam library质粒序列进行分析比对。
[0128]
注：上文中用到的t7启动子序列为：6-fam t7 promoter：taatacgactcactatagg(5’带荧光标记)；t7终止子序列为：cy5-t7 terminator：gctagttattgctcagcgg(3’带荧光标记)。
[0129]
首先进行ann的pam筛选。根据分子相互作用中解离常数的概念，结合一半dna底物时的蛋白浓度即为解离常数，因此降低dna的反应浓度到10nm，并设置cascade复合物的梯度从0nm到200nm，观察dna与cascade复合物的结合情况。
[0130]
如图11所示，1-8号pam序列为aan和agn，在cascade复合物浓度达到100nm和200nm时，依然有较多的dna游离，而9-16号含有acn和atn两种pam序列的dna在高浓度蛋白时全部被结合。该结果表明，在pam序列的第二位，cascade复合物更偏好结合胞嘧啶c或胸腺嘧啶t。
[0131]
在pam序列中，相比第二位，第三位的偏好性更为明显。aan序列的表现都比较差，
agn中g的结合更好，acn中aca和acg的结合力相当，而atn中的atg结合力明显优于其他三个，因此，在总体上，pam序列的第三位偏好为g。
[0132]
接着固定pam序列的第二位和第三位碱基序列，改变第一位的碱基来观察其规律。如图12所示，对比ncg和ntg两组，在蛋白浓度为50nm时，ncg中acg结合得最好，而ntg中也是atg的结合效率更高一些，这表明pam序列的第一位确实是偏好于碱基a。将ntg和ncg相互比较，发现ntg的结合率总要比ncg大一些。由此得出结论，pam序列的第二位偏好为t。
[0133]
注：图11、图12显示了典型的部分结果图，其余序列的结果图虽未示出但其结果均符合以上结论。
[0134]
至此可得本发明i-b型系统的最优pam序列为5
’‑
atg-3’。
[0135]
实施例4
[0136]
本实施例基于实施例3。本实施例为体外组装cascade-dna-cas3三元复合物。
[0137]
将实施例2纯化好的cascade复合物与实施例3确定的pam-dna按照摩尔比1：3在25℃孵育1h，之后15000rpm离心10min，通过分子筛层析获得cascade-dna复合物。将该cascade-dna复合物与实施例2的cas3蛋白按照摩尔比1：3在25℃孵育1h，15000rpm离心10min后，通过分子筛层析得到cascade-dna-cas3复合物，并通过sds-page对得到的复合物进行验证(相关结果如图13所示)。
[0138]
通过以上方法得到的cascade-dna-cas3三元复合物证实了本发明中得到的cascade复合物与cas3蛋白是具有结合活性的。
[0139]
实施例5
[0140]
本实施例基于实施例4。本实施例为检测本发明i-b型crispr-cas系统在hesc细胞系中的基因敲除效率。
[0141]
构建hesc-egfp-tdtomato双报告细胞系的具体过程如下：
[0142]
首先构建hesc-egfr报告细胞系。野生型hesc细胞用tryple express(gibco)进行消化后，用optimem重悬，调整细胞密度为5
×
106cells/ml。将500μl细胞悬液与30μg线性化dnmt3b-egfp质粒混合后，加入到0.4cm电转杯中进行电穿孔，之后将其置于10cm培养皿中，培养皿中预先加入含有10μm y-27632的e8培养基。在培养3天后，加入0.5μg/ml的嘌呤霉素进行筛选，期间每日更换培养基，若长满则正常传代。培养7天后，使用荧光显微镜鉴定出表达egfp的耐药单克隆，经过单克隆扩增后得到hesc-egfp细胞系。
[0143]
之后，用上述相同的方法在hesc-egfp细胞系的基础上，构建hesc-egfr-tdtomato报告细胞系。选用质粒为：线性化dnmt3b-tdtomato质粒。对egfp+/tdtm+双阳性细胞进行筛选与单克隆扩增，进而得到hesc-egfp-tdtomato双重报告细胞系。
[0144]
采用上述hesc-egfp-tdtomato双报告细胞系；以tdtomato为靶标基因设计crrna，序列为seq id no.15(同实施例1)；以egfr为靶标基因设计crrna，序列为：
[0145]
gtgtccaaaccattgatgccgtaaggcgttgagcacgtccaaaccattgatgccgtaaggcgttgagcacgtgtccaaaccattgatgccgtaaggcgttgagcac，
[0146]
其中，加框为spacer序列，其余为repeat序列。之后，先按照实施例1方法构建质粒，再按照实施例2方法制得cascade复合物以及cas3蛋白，之后采用neon细胞核转染系统
(thermofisher)电转入hesc-egfp-tdtomato双报告细胞系中，最终用facs计算编辑效率。
[0147]
电转后约4-5天，细胞用tryple express(gibco)消化，用添加10％fbs的imdm重悬hap1细胞。用lsr fortessa(bd)488nm激光对hesc-egfp-tdtomato双报告细胞系进行流式分析。facs数据用flowjo v10.4.1进行分析。
[0148]
本实施例采用上述方法探究了来自synechocystis sp.pcc 6714菌株的type
ⅰ‑
b系统即本发明的基因编辑系统的基因编辑效率。编辑效率用tdtomato-或者egfp-细胞的数量比例来表示。
[0149]
注：除此之外，还可采用long range pcr法及ngs测序法进行检测分析。
[0150]
结果如图14所示，该结果表明本发明的
ⅰ‑
b型基因编辑系统的效率较文献报道的各基因编辑系统(如来自n.lactamica atcc 23970的type
ⅰ‑
c系统)更高，可达39％的tdtomato靶向效率以及55％的egfp靶向效率；如此即证实本发明
ⅰ‑
b型基因编辑系统的优越性。注：此处提到的文献是指：tan r,krueger rk,gramelspacher mj,zhou x,xiao y,ke a,hou z,zhang y.cas11enables genome engineering in human cells with compact crispr-cas3 systems.mol cell.2022jan 13:s1097-2765(21)01137-0。
[0151]
综合以上各实施例，本发明的制备方法能快速、高效、高产的产生高纯度与活性的cascade复合物与cas蛋白，使用e.coli原核表达系统，亲和柱与分子筛纯化可以在两天之内得到大量蛋白，效率高。
[0152]
本发明的基因编辑系统源于synechocystis sp.pcc 6714，经生物学信息分析归属于i-b型。本发明的基因编辑系统对不同基因的敲除效率均高于其他ⅰ型系统，表明该系统具有优越性，具有优良的研究与开发潜力。
[0153]
除上述实施例外，本发明还可以有其他实施方式。凡采用等同替换或等效变换形成的技术方案，均落在本发明要求的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：肖易倍陆美玲俞晨霖张钰雯
技术所有人：中国药科大学
我是此专利的发明人

上一篇：一种城市流入人员多维挖掘的方法和系统与流程
上一篇：一种软看门狗、设备及存储介质的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
2、张老师：1.探索新型氧化还原酶结构-功能关系，电催化反应机制 2.酶电催化导向的酶分子改造 3.纳米材料、生物功能多肽对酶-电极体系的影响4. 生物电化学传感和生物电合成体系的设计与应用。
3、豆老师：1.环境纳米材料及挥发性有机化合物（VOCs） 2.CO污染物的催化氧化 3.低温等离子体 4.吸脱附等控制技术
4、赵老师：1.高分子材料改性及加工技术 2.微孔及过滤材料 3.环境友好高分子材料
5、邬老师：1.高分子材料的共混与复合 2.涉及材料功能化及结构与性能的研究；高分子热稳定剂的研发
如您是高校老师，可以点此联系我们加入专家库。