Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用

文档序号:26587478发布日期:2021-09-10 19:47阅读:来源:国知局

技术特征:
1.一种缀合物,所述缀合物包含:a)cas12蛋白,所述cas12蛋白为:1)具有seq id no:1所示氨基酸序列的cas12j

8蛋白,具有seq id no:2所示氨基酸序列的mb4cas12a蛋白,具有seq id no:3所示氨基酸序列的mlcas12a蛋白,具有seq id no:4所示氨基酸序列的mocas12a蛋白,具有seq id no:5所示氨基酸序列的bgcas12a蛋白,或具有seq id no:6所示氨基酸序列的chcas12b蛋白,或者为2)具有seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5和seq id no:6中任一个所示的氨基酸序列至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%、至少99.95%、至少99.99%、至少99.999%、至少100%、或者80%

100%中任一百分比的序列同一性并且保留其生物学活性的氨基酸序列的同源物;b)修饰部分;例如,所述修饰部分选自另外的蛋白或多肽、可检测标记或其组合;例如,所述另外的蛋白或多肽选自表位标签、报告蛋白或核定位信号(nls)序列、胞嘧啶脱氨酶(cbe)、腺嘌呤脱氨酶(abe)、胞嘧啶甲基化酶dnmt3a和mq1、胞嘧啶去甲基化酶tet1、转录激活蛋白vp64、p65和rta、转录抑制蛋白krab、组蛋白乙酰化酶p300、组蛋白去乙酰化酶lsd1、和内切酶foki中的一种或者多种;以及c)任选的用于连接所述cas12蛋白与所述修饰部分的接头。2.一种融合蛋白,所述融合蛋白包含:a)cas12蛋白,所述cas12蛋白为:1)具有seq id no:1所示氨基酸序列的cas12j

8蛋白,具有seq id no:2所示氨基酸序列的mb4cas12a蛋白,具有seq id no:3所示氨基酸序列的mlcas12a蛋白,具有seq id no:4所示氨基酸序列的mocas12a蛋白,具有seq id no:5所示氨基酸序列的bgcas12a蛋白,或具有seq id no:6所示氨基酸序列的chcas12b蛋白,或者为2)具有与seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5和seq id no:6中任一个所示的氨基酸序列至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少
99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%、至少99.95%、至少99.99%、至少99.999%、至少100%、或者80%

100%中任一百分比的序列同一性并且保留其生物学活性的氨基酸序列的同源物;b)另外的蛋白或多肽;例如,所述另外的蛋白或多肽选自表位标签、报告蛋白或核定位信号(nls)序列、胞嘧啶脱氨酶(cbe)、腺嘌呤脱氨酶(abe)、胞嘧啶甲基化酶dnmt3a和mq1、胞嘧啶去甲基化酶tet1、转录激活蛋白vp64、p65和rta、转录抑制蛋白krab、组蛋白乙酰化酶p300、组蛋白去乙酰化酶lsd1、和内切酶foki中的一种或者多种;以及c)任选的用于连接所述cas12蛋白与所述另外的蛋白或多肽的接头;例如,所述接头为长度为1

50个氨基酸的接头;优选地,所述融合蛋白包含:具有seq id no:1所示氨基酸序列的cas12j

8蛋白、腺嘌呤脱氨酶(abe)、以及任选的连接所述cas12j

8蛋白和所述腺嘌呤脱氨酶(abe)的接头;优选地,所述融合蛋白从其n端到c端依次为所述腺嘌呤脱氨酶(abe)、所述接头、以及所述cas12j

8蛋白;更优选地,所述融合蛋白的氨基酸序列为seq id no:7所示。3.一种单链向导rna,其包含crispr重复序列,所述crispr重复序列具有:a)针对cas12j

8蛋白、其同源物、缀合物或融合蛋白的seq id no:15所示的核酸序列,针对mb4cas12a蛋白、mlcas12a蛋白和mocas12a蛋白、其同源物、缀合物或融合蛋白的seq id no:16所示的核酸序列,针对bgcas12a蛋白、其同源物、缀合物或融合蛋白的seq id no:17所示的核酸序列,或针对chcas12b蛋白、其同源物、缀合物或融合蛋白的seq id no:18所示的核酸序列;或者b)与seq id no:15至seq id no:18中任一个所示的核酸序列至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.9%或者至少100%的序列同一性且保留其生物学活性的核酸序列;或者c)基于seq id no:15至seq id no:18中任一个所述的核酸序列改造得到的且保留其生物学活性的核酸序列,例如,所述改造为碱基磷酸化、碱基硫化、碱基甲基化、碱基羟基化、序列的缩短和序列的加长中的一种或者多种,例如,所述序列的缩短和所述序列加长包括相对于基础序列存在一个、两个、三个、四个、五个、六个、七个、八个、九个或者十个碱基的缺失或者添加。4.根据权利要求3所述的单链向导rna,其中,所述单链向导rna在所述crispr重复序列的3’端进一步包括crispr间隔序列,所述crispr间隔序列为长度为20、21、22、23、24、25、26、27、28、29、30个核苷酸(优选24个核苷酸)且能够与靶序列互补配对的序列。5.一种分离的核酸分子,所述分离的核酸分子包含编码以下的核酸序列:a)cas12蛋白,所述cas12蛋白为:1)具有seq id no:1所示氨基酸序列的cas12j

8蛋白,具有seq id no:2所示氨基酸序列的mb4cas12a蛋白,
具有seq id no:3所示氨基酸序列的mlcas12a蛋白,具有seq id no:4所示氨基酸序列的mocas12a蛋白,具有seq id no:5所示氨基酸序列的bgcas12a蛋白,或具有seq id no:6所示氨基酸序列的chcas12b蛋白,或者为2)具有与seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5和seq id no:6中任一个所示的氨基酸序列至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%、至少99.95%、至少99.99%、至少99.999%、至少100%、或者80%

100%中任一百分比的序列同一性并且保留其生物学活性的氨基酸序列的同源物;b)权利要求1所述的缀合物;或者c)权利要求2所述的融合蛋白;例如,所述分离的核酸分子包含seq id no:8、seq id no:9、seq id no:10、seq id no:11、seq id no:12、seq id no:13中任一个所示的核酸序列或其简并序列;例如,所述分离的核酸分子包含编码seq id no:7所示融合蛋白的核酸序列;优选地,所述分离的核酸分子包含seq id no:14所示的核酸序列或其简并序列。6.根据权利要求5所述的分离的核酸分子,其中所述分离的核酸分子还包含编码权利要求3至4中任一项所述的与所述cas12蛋白对应的单链向导rna的核酸序列;例如,所述分离的核酸分子包含编码具有seq id no:1所示氨基酸序列的cas12j

8蛋白、其同源物、缀合物或融合蛋白(例如seq id no:7所示的融合蛋白)的核酸序列,例如seq id no:8、或seq id no:14所示的核酸序列,并且包含编码针对该cas12j

8蛋白、其同源物、缀合物或融合蛋白的包含seq id no:15所示crispr重复序列、包含与seq id no:15具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:15改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列,例如seq id no:19所示的核酸序列;例如,所述分离的核酸分子包含编码具有seq id no:2、seq id no:3或seq id no:4所示氨基酸序列的cas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列,例如seq id no:9、seq id no:10或seq id no:11所示的核酸序列,并且包含编码针对该cas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:16所示crispr重复序列、包含与seq id no:16具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:16改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列,例如seq id no:20所示的核酸序列;例如,所述分离的核酸分子包含编码具有seq id no:5所示氨基酸序列的bgcas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列,例如seq id no:12所示的核酸序列,并且包含编码针对该bgcas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:17所示crispr重复序列、包含与seq id no:17具有至少90%序列同一性且保留其生物学活性的同
源序列、或包含基于seq id no:17改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列,例如seq id no:21所示的核酸序列;例如,所述分离的核酸分子包含编码具有seq id no:6所示氨基酸序列的chcas12b蛋白、其同源物、缀合物或融合蛋白的核酸序列,例如seq id no:13所示的核酸序列,并且包含编码针对该chcas12b蛋白、其同源物、缀合物或融合蛋白的包含seq id no:18所示crispr重复序列、包含与seq id no:18具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:18改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列,例如seq id no:22所示的核酸序列。7.一种分离的核酸分子,所述分离的核酸分子包含编码权利要求3至4中任一项所述的单链向导rna的核酸序列;例如,所述分离的核酸分子包含seq id no:19、seq id no:20、seq id no:21、和seq id no:22中任一个所示的核酸序列或其简并序列,并且优选地还包含编码crispr间隔序列的核酸序列。8.一种载体,所述载体包含编码以下的核酸序列:a)cas12蛋白,所述cas12蛋白为:1)具有seq id no:1所示氨基酸序列的cas12j

8蛋白,具有seq id no:2所示氨基酸序列的mb4cas12a蛋白,具有seq id no:3所示氨基酸序列的mlcas12a蛋白,具有seq id no:4所示氨基酸序列的mocas12a蛋白,具有seq id no:5所示氨基酸序列的bgcas12a蛋白,或具有seq id no:6所示氨基酸序列的chcas12b蛋白,或者为2)具有与seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5和seq id no:6中任一个所示的氨基酸序列至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%、至少99.95%、至少99.99%、至少99.999%、至少100%、或者80%

100%中任一百分比的序列同一性并且保留其生物学活性的氨基酸序列的同源物;b)权利要求1所述的缀合物;或者c)权利要求2所述的融合蛋白;例如,所述载体包含seq id no:8、seq id no:9、seq id no:10、seq id no:11、seq id no:12、seq id no:13中任一个所示的核酸序列或其简并序列;例如,所述载体包含编码seq id no:7所示融合蛋白的核酸序列;优选地,所述载体包含seq id no:14所示的核酸序列或其简并序列;例如,所述载体为质粒载体例如puc19载体、附着体载体、paav2_itr载体、逆转录病毒载体、慢病毒载体、腺病毒载体或腺相关病毒载体。9.根据权利要求8所述的载体,其中,所述载体进一步包含编码权利要求3至4中任一项
所述的与所述cas12蛋白对应的单链向导rna的核酸序列;例如,所述载体包含编码具有seq id no:1所示氨基酸序列的cas12j

8蛋白、其同源物、缀合物或融合蛋白(例如seq id no:7所示的融合蛋白)的核酸序列,例如seq id no:8或seq id no:14所示的核酸序列,并且包含编码针对该cas12j

8蛋白、其同源物、缀合物或融合蛋白的包含seq id no:15所示crispr重复序列、包含与seq id no:15具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:15改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列,例如seq id no:19所示的核酸序列;例如,所述载体包含编码具有seq id no:2、seq id no:3或seq id no:4所示氨基酸序列的cas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列,例如seq id no:9、seq id no:10或seq id no:11所示的核酸序列,并且包含编码针对该cas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:16所示crispr重复序列、包含与seq id no:16具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:16改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列,例如seq id no:20所示的核酸序列;例如,所述载体包含编码具有seq id no:5所示氨基酸序列的bgcas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列,例如seq id no:12所示的核酸序列,并且包含编码针对该bgcas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:17所示crispr重复序列、包含与seq id no:17具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:17改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列,例如seq id no:21所示的核酸序列;例如,所述载体包含编码具有seq id no:6所示氨基酸序列的chcas12b蛋白、其同源物、缀合物或融合蛋白的核酸序列,例如seq id no:13所示的核酸序列,并且包含编码针对该chcas12b蛋白、其同源物、缀合物或融合蛋白的包含seq id no:18所示crispr重复序列、包含与seq id no:18具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:18改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列,例如seq id no:22所示的核酸序列。10.一种载体,所述载体包含编码权利要求3至4中任一项所述的单链向导rna的核酸序列;例如,所述载体包含seq id no:19、seq id no:20、seq id no:21和seq id no:22中任一个所示的核酸序列或其简并序列,并且优选地还包含编码crispr间隔序列的核酸序列。11.一种crispr/cas12基因编辑系统,其包含:a)蛋白组分,其包含:1)cas12蛋白,所述cas12蛋白为:1.1)具有seq id no:1所示氨基酸序列的cas12j

8蛋白,具有seq id no:2所示氨基酸序列的mb4cas12a蛋白,具有seq id no:3所示氨基酸序列的mlcas12a蛋白,具有seq id no:4所示氨基酸序列的mocas12a蛋白,具有seq id no:5所示氨基酸序列的bgcas12a蛋白,或具有seq id no:6所示氨基酸序列的chcas12b蛋白,或者为
1.2)具有与seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5和seq id no:6中任一个所示的氨基酸序列至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%、至少99.95%、至少99.99%、至少99.999%、至少100%、或者80%

100%中任一百分比的序列同一性并且保留其生物学活性的氨基酸序列的同源物;2)权利要求1所述的缀合物,或者3)权利要求2所述的融合蛋白;以及b)核酸组分,其包含:权利要求3至4中任一项所述的与a)中的蛋白组分对应的单链向导rna;并且,所述蛋白组分和所述核酸组分相互结合形成复合物;例如,所述蛋白组分包含具有seq id no:1所示氨基酸序列的cas12j

8蛋白、其同源物、缀合物或融合蛋白,所述核酸组分包含单链向导rna,所述单链向导rna为包含seq id no:15所示crispr重复序列的单链向导rna、包含与seq id no:15具有至少90%序列同一性且保留其生物学活性的同源序列的单链向导rna、或者包含基于seq id no:15改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,所述蛋白组分包含具有seq id no:2、seq id no:3或seq id no:4所示氨基酸序列的cas12a蛋白、其同源物、缀合物或融合蛋白,所述核酸组分包含单链向导rna,所述单链向导rna为包含seq id no:16所示crispr重复序列的单链向导rna、包含与seq id no:16具有至少90%序列同一性且保留其生物学活性的同源序列的单链向导rna、或者包含基于seq id no:16改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,所述蛋白组分包含具有seq id no:5所示氨基酸序列的bgcas12a蛋白、其同源物、缀合物或融合蛋白,所述核酸组分包含单链向导rna,所述单链向导rna为包含seq id no:17所示crispr重复序列的单链向导rna、包含与seq id no:17具有至少90%序列同一性且保留其生物学活性的同源序列的单链向导rna、或者包含基于seq id no:17改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,所述蛋白组分包含具有seq id no:6所示氨基酸序列的chcas12b蛋白、其同源物、缀合物或融合蛋白,所述核酸组分包含单链向导rna,所述单链向导rna为包含seq id no:18所示crispr重复序列的单链向导rna、包含与seq id no:18具有至少90%序列同一性且保留其生物学活性的同源序列的单链向导rna、或者包含基于seq id no:18改造得到的且保留其生物学活性的改造序列的单链向导rna。12.一种细胞,所述细胞包含:权利要求5至7中任一项所述的分离的核酸分子、或者权利要求8至10中任一项所述的载体;例如,所述细胞为原核细胞或者真核细胞,所述真核细胞为例如植物细胞或动物细胞,所述动物细胞为例如哺乳动物细胞如人类细胞。13.一种对细胞内或体外环境中的靶序列进行基因编辑的方法,所述方法包括:使以下(1)至(4)中任一项与细胞内或体外环境中的靶序列相接触:(1)cas12蛋白、根据权利要求1所述的缀合物或者根据权利要求2所述的融合蛋白,和
根据权利要求3至4中任一项所述的与所述cas12蛋白对应的单链向导rna,其中,所述cas12蛋白为:1)具有seq id no:1所示氨基酸序列的cas12j

8蛋白,具有seq id no:2所示氨基酸序列的mb4cas12a蛋白,具有seq id no:3所示氨基酸序列的mlcas12a蛋白,具有seq id no:4所示氨基酸序列的mocas12a蛋白,具有seq id no:5所示氨基酸序列的bgcas12a蛋白,或具有seq id no:6所示氨基酸序列的chcas12b蛋白,或者为2)具有与seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5和seq id no:6中任一个所示的氨基酸序列至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%、至少99.95%、至少99.99%、至少99.999%、至少100%、或者80%

100%中任一百分比的序列同一性并且保留其生物学活性的氨基酸序列的同源物;例如,具有seq id no:1所示氨基酸序列的cas12j

8蛋白、其同源物、缀合物或融合蛋白,以及包含seq id no:15所示crispr重复序列、包含与seq id no:15具有至少90%序列同一性的同源序列、或包含基于seq id no:15改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,具有seq id no:2、seq id no:3或seq id no:4所示氨基酸序列的cas12a蛋白、其同源物、缀合物或融合蛋白,以及包含seq id no:16所示crispr重复序列、包含与seq id no:16具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:16改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,具有seq id no:5所示氨基酸序列的bgcas12a蛋白、其同源物、它们的缀合物或融合蛋白的核酸序列,以及包含seq id no:17所示crispr重复序列、包含与seq id no:17具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:17改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,具有seq id no:6所示氨基酸序列的chcas12b蛋白、其同源物、缀合物或融合蛋白,以及包含seq id no:18所示crispr重复序列、包含与seq id no:18具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:18改造得到的且保留其生物学活性的改造序列的单链向导rna;(2)根据权利要求8所述的载体和根据权利要求10所述的载体;例如,包含编码具有seq id no:1所示氨基酸序列的cas12j

8蛋白、其同源物、缀合物或融合蛋白(例如seq id no:7所示的融合蛋白)的核酸序列(例如seq id no:8或seq id no:14所示的核酸序列)的载体,以及包含编码针对该cas12j

8蛋白、其同源物、缀合物或融合蛋白的包含seq id no:15所示crispr重复序列、包含与seq id no:15具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:15改造得到的且保留其生
物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:19所示的核酸序列)的载体;例如,包含编码具有seq id no:2、seq id no:3或seq id no:4所示氨基酸序列的cas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列(例如seq id no:9、seq id no:10或seq id no:11所示的核酸序列)的载体,以及包含编码针对该mb4cas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:16所示crispr重复序列、包含与seq id no:16具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:16改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:20所示的核酸序列)的载体;例如,包含编码具有seq id no:5所示氨基酸序列的bgcas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列(例如seq id no:12所示的核酸序列)的载体,以及包含编码针对该bgcas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:17所示crispr重复序列、包含与seq id no:17具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:17改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:21所示的核酸序列)的载体;例如,包含编码具有seq id no:6所示氨基酸序列的chcas12b蛋白、其同源物、缀合物或融合蛋白的核酸序列(例如seq id no:13所示的核酸序列)的载体,以及包含编码针对该chcas12b蛋白、其同源物、缀合物或融合蛋白的包含seq id no:18所示crispr重复序列、包含与seq id no:18具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:18改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:22所示的核酸序列)的载体;(3)根据权利要求9所述的载体;以及(4)根据权利要求11所述的crispr/cas12基因编辑系统;其中,在与靶序列接触后,所述cas12蛋白、其同源物、缀合物或融合蛋白识别各自的原间隔邻近序列(pam),所述pam位于靶序列的5’端,并且,对于所述cas12j

8蛋白、所述mb4cas12a蛋白、所述mlcas12a蛋白、所述mocas12a蛋白、所述bgcas12a蛋白、和所述chcas12b蛋白、或它们各自的同源物、缀合物或融合蛋白,所述pam分别为5
’‑
ttn、5
’‑
yyn、5
’‑
yyn、5
’‑
yyn、5
’‑
yyn和5
’‑
ttn;例如,所述细胞为原核细胞或者真核细胞,所述真核细胞为例如植物细胞或动物细胞,所述动物细胞为例如哺乳动物细胞如人类细胞;例如,所述基因编辑包括对靶序列的基因敲除、定点碱基的改变、定点插入、基因转录水平的调控、dna甲基化调控、dna乙酰化修饰、组蛋白乙酰化修饰、单碱基转换以及染色质成像追踪中的一种或者多种,例如,所述单碱基转换包括碱基腺嘌呤到鸟嘌呤的转换、胞嘧啶到胸腺嘧啶的转换或胞嘧啶到尿嘧啶的转换。14.根据权利要求13所述的方法,其中,所述单链向导rna的crispr间隔序列与所述靶序列形成完全碱基互补配对结构,而与非靶序列形成不完全碱基互补配对的结构;例如,所述不完全碱基互补配对结构包括一个或者多个例如两个或者更多个碱基错配的结构。15.一种试剂盒,所述试剂盒用于对细胞内或者体外环境中的靶序列进行基因编辑,包
括:a)选自以下1)至6)中的任一项:1)cas12蛋白、根据权利要求1所述的缀合物、或者根据权利要求2所述的融合蛋白,和根据权利要求3至4中任一项所述的与所述cas12蛋白对应的单链向导rna,其中,所述cas12蛋白为:a)具有seq id no:1所示氨基酸序列的cas12j

8蛋白,具有seq id no:2所示氨基酸序列的mb4cas12a蛋白,具有seq id no:3所示氨基酸序列的mlcas12a蛋白,具有seq id no:4所示氨基酸序列的mocas12a蛋白,具有seq id no:5所示氨基酸序列的bgcas12a蛋白,或具有seq id no:6所示氨基酸序列的chcas12b蛋白,或者为b)具有与seq id no:1、seq id no:2、seq id no:3、seq id no:4、seq id no:5和seq id no:6中任一个所示的氨基酸序列至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%、至少99.95%、至少99.99%、至少99.999%、至少100%、或者80%

100%中任一百分比的序列同一性并且保留其生物学活性的氨基酸序列的同源物;例如,具有seq id no:1所示氨基酸序列的cas12j

8蛋白、其同源物、缀合物或融合蛋白,以及包含seq id no:15所示crispr重复序列的单链向导rna、包含与seq id no:15具有至少90%序列同一性且保留其生物学活性的同源序列的单链向导rna、或者包含基于seq id no:15改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,具有seq id no:2、seq id no:3或seq id no:4所示氨基酸序列的cas12a蛋白、其具有与seq id no:2、seq id no:3或seq id no:4具有至少80%序列同一性的氨基酸序列的同源物、它们的缀合物或融合蛋白,以及包含seq id no:16所示crispr重复序列的单链向导rna、包含与seq id no:16具有至少90%序列同一性且保留其生物学活性的同源序列的单链向导rna、或者包含基于seq id no:16改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,具有seq id no:5所示氨基酸序列的bgcas12a蛋白、其具有与seq id no:5具有至少80%序列同一性的氨基酸序列的同源物、它们的缀合物或融合蛋白,以及包含seq id no:17所示crispr重复序列的单链向导rna、包含与seq id no:17具有至少90%序列同一性且保留其生物学活性的同源序列的单链向导rna、或者包含基于seq id no:17改造得到的且保留其生物学活性的改造序列的单链向导rna;例如,具有seq id no:6所示氨基酸序列的chcas12b蛋白、其具有与seq id no:6具有至少80%序列同一性的氨基酸序列的同源物、它们的缀合物或融合蛋白,以及包含seq id no:18所示crispr重复序列的单链向导rna、包含与seq id no:18具有至少90%序列同一性且保留其生物学活性的同源序列的单链向导rna、或者包含基于seq id no:18改造得到的
且保留其生物学活性的改造序列的单链向导rna;2)根据权利要求5所述的分离的核酸分子和根据权利要求7所述的分离的核酸分子;例如,包含编码具有seq id no:1所示氨基酸序列的cas12j

8蛋白、其同源物、缀合物或融合蛋白(例如seq id no:7所示的融合蛋白)核酸序列(例如seq id no:8或seq id no:14所示的核酸序列)的分离的核酸分子,以及包含编码针对该cas12j

8蛋白、其同源物、缀合物或融合蛋白的包含seq id no:15所示crispr重复序列、包含与seq id no:15具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:15改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:19所示的核酸序列)的分离的核酸分子;例如,包含编码具有seq id no:2、seq id no:3或seq id no:4所示氨基酸序列的cas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列(seq id no:9、seq id no:10或seq id no:11所示的核酸序列)的分离的核酸分子,以及包含包含编码针对该cas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:16所示crispr重复序列、包含与seq id no:16具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:16改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:20所示的核酸序列)的分离的核酸分子;例如,包含编码具有seq id no:5所示氨基酸序列的bgcas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列(例如seq id no:12所示的核酸序列)的分离的核酸分子,以及包含编码针对该bgcas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:17所示crispr重复序列、包含与seq id no:17具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:17改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:21所示的核酸序列)的分离的核酸分子;例如,包含编码具有seq id no:6所示氨基酸序列的chcas12b蛋白、其同源物、缀合物或融合蛋白的核酸序列(例如seq id no:13所示的核酸序列)的分离的核酸分子,以及包含编码针对该chcas12b蛋白、其同源物、缀合物或融合蛋白的包含seq id no:18所示crispr重复序列、包含与seq id no:18具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:18改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:22所示的核酸序列)的分离的核酸分子;3)根据权利要求6所述的分离的核酸分子;4)根据权利要求8所述的载体和根据权利要求10所述的载体;例如,包含编码具有seq id no:1所示氨基酸序列的cas12j

8蛋白、其同源物、缀合物或融合蛋白(例如seq id no:7所示的融合蛋白)的核酸序列(例如seq id no:8或seq id no:14所示的核酸序列)的载体,以及包含编码针对该cas12j

8蛋白、其同源物、缀合物或融合蛋白的包含seq id no:15所示crispr重复序列、包含与seq id no:15具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:15改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:19所示的核酸序列)的载体;例如,包含编码具有seq id no:2、seq id no:3或seq id no:4所示氨基酸序列的cas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列(例如seq id no:9、seq id no:10或
seq id no:11所示的核酸序列)的载体,以及包含编码针对该cas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:16所示crispr重复序列、包含与seq id no:16具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:16改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:20所示的核酸序列)的载体;例如,包含编码具有seq id no:5所示氨基酸序列的bgcas12a蛋白、其同源物、缀合物或融合蛋白的核酸序列(例如seq id no:12所示的核酸序列)的载体,以及包含编码针对该bgcas12a蛋白、其同源物、缀合物或融合蛋白的包含seq id no:17所示crispr重复序列、包含与seq id no:17具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:17改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:21所示的核酸序列)的载体;例如,包含编码具有seq id no:6所示氨基酸序列的chcas12b蛋白、其同源物、缀合物或融合蛋白的核酸序列(例如seq id no:13所示的核酸序列)的载体,以及包含编码针对该chcas12b蛋白、其同源物、缀合物或融合蛋白的包含seq id no:18所示crispr重复序列、包含与seq id no:18具有至少90%序列同一性且保留其生物学活性的同源序列、或包含基于seq id no:18改造得到的且保留其生物学活性的改造序列的单链向导rna的核酸序列(例如seq id no:22所示的核酸序列)的载体;5)根据权利要求9所述的载体;或者6)根据权利要求11所述的crispr/cas12基因编辑系统;以及a.如何对细胞内或体外环境中的靶序列进行基因编辑的说明书。

技术总结
本发明属于基因编辑技术领域,具体涉及一种CRISPR/Cas12基因编辑系统以及其应用。本发明基因编辑系统为特定Cas12蛋白与sgRNA形成的复合体,能精确定位靶向DNA序列并产生切割,使所述靶序列发生双链断裂损伤;所述基因编辑为在细胞中或体外进行基因编辑。所述特定Cas12J


技术研发人员:王永明 王帅 高思琪 王瑶
受保护的技术使用者:复旦大学
技术研发日:2021.05.31
技术公布日:2021/9/9
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1