一种融合HNH结构域的V型Cas酶及其应用的制作方法

文档序号:35575584发布日期:2023-09-24 14:57阅读:63来源:国知局
本发明涉及基因编辑领域,特别是规律成簇的间隔短回文重复(crispr)。具体而言,本发明涉及一种融合hnh结构域的v型cas蛋白及其应用。
背景技术
::1、crispr/cas技术是一种被广泛使用的基因编辑技术,它通过rna引导对基因组上的靶序列进行特异性结合并切割dna产生双链断裂,利用生物非同源末端连接或同源重组进行定点基因编辑。2、ii型crispr核酸内切酶,如cas9,其包括两个核酸酶结构域,hnh结构域和ruvc结构域。与ii型crispr内切核酸酶不同,v型crispr内切核酸酶,如cas12a(或者,称之为cpf1)仅具有ruvc结构域,而缺少了hnh结构域;如中国专利cn109207477b中记载,cpf1缺乏cas9蛋白中存在的hnh核酸酶结构域。3、本技术提供了一种工程化的v型cas酶,本技术在v型cas酶中融合了hnh结构域,并在一定程度上提高了v型cas酶的编辑活性,具有广泛的应用前景。技术实现思路1、发明人通过在v型cas酶中融合hnh结构域,提高了其编辑活性,扩展了其应用范围。2、工程化的v型cas蛋白3、一方面,本发明提供了一种融合hnh结构域的v型cas蛋白,也可以称之为,一种工程化的v型cas蛋白,所述工程化的v型cas蛋白包括亲本v型cas蛋白和hnh结构域,所述hnh结构域置于亲本v型cas蛋白的两个连续或不连续的氨基酸之间。4、“所述hnh结构域置于亲本v型cas蛋白的两个连续或不连续的氨基酸之间”也可以理解为hnh结构域融合在亲本v型cas蛋白的两个连续或不连续的氨基酸之间,或者hnh结构域连接至亲本v型cas蛋白的两个连续或不连续的氨基酸之间。比如,亲本v型cas蛋白的两个连续或不连续的氨基酸为第一氨基酸和第二氨基酸,所述hnh结构域的一端与第一氨基酸连接,所述hnh结构域的另一端与第二氨基酸连接;所述连接可以为直接连接,也可以为通过接头连接。5、术语“接头”在涉及多肽连接时是本领域公知的,指化学基团,或连接两个分子或部分的分子。接头可以由单个连接分子(例如,单个氨基酸)组成,或者可以包括多于一个的连接分子。 在一些实施方案中,接头可以是有机分子,基团,聚合物或化学部分,例如二价有机部分。在一些实施方案中,接头可以是氨基酸或肽。6、上述接头是本领域熟知的,包括但不限于包含一个或多个(例如,1个,2个,3个,4个或5个)氨基酸(如,glu或ser)或氨基酸衍生物(如,ahx、β-ala、gaba或ava)的接头,或peg等。7、在一些实施方案中,接头可以是gs接头。在一些实施方案中,接头可包含的氨基酸序列(ggs)n,gs,sg,gssg(seq id no.3)或(ggggs)n(seq id no.4),其中n是1-20的整数(例如1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19或20)。在一些实施方案中,接头可包含氨基酸序列:sggsggsggs(seq id no.5)。在一些实施方案中,接头可包含氨基酸序列:sgsetpgtsesatpes(seq id no.6),也称作xten接头。在一些实施方案中,接头可包含氨基酸序列:sggssggssgsetpgtsesatpessggssggs(seq id no.7),也称作gs-xten-gs接头。8、在一个实施方式中,所述亲本v型cas蛋白的两个连续或不连续的氨基酸为第一氨基酸和第二氨基酸,所述hnh结构域置于第一氨基酸和第二氨基酸之间。在一个实施方式中,所述第一氨基酸和第二氨基酸为两个连续的氨基酸;在其他的实施方式中,所述第一氨基酸和第二氨基酸为两个不连续的氨基酸。9、本发明中,hnh结构域是具有核酸酶切割活性的结构域;其可以是源自于cas9的hnh结构域,也可以是其他物种来源的hnh结构域;本领域技术人员可以通过常规技术手段获得具有核酸酶切割活性的hnh结构域,比如,通过生物信息学分析获得具有核酸酶切割活性的hnh结构域。10、在一个实施方式中,所述hnh结构域为源自于cas9的hnh结构域;在一个实施方式中,所述源自于cas9的hnh结构域的氨基酸序列与seq id no.1相比具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、或至少99.9%的序列同一性,并且具有hnh结构域的生物学功能;在一个实施方式中,所述源自于cas9的hnh结构域的氨基酸序列与seq id no.1相比具有一个或多个氨基酸的置换、缺失或添加,例如,1-20个氨基酸的置换、缺失或添加,又如,1个,2个,3个,4个,5个,6个,7个,8个,9个,10个,11个,12个,13个,14个,15个,16个,17个,18个,19个或20个氨基酸的置换、缺失或添加,并且具有hnh结构域的生物学功能;优选的,所述源自于cas9的hnh结构域的氨基酸序列如seq id no.1所示。11、seq id no.1:cas912、liekiklhdmqegkclysleaipledllnnpfnyevdhiiprsvsfdnsfnnkvlvkqeenskkgnrtpfqylsssdskisyetfkkhilnlakgkgrisktkkeylle。13、上述“具有hnh结构域的生物学功能”是指具有hnh结构域所表现的核酸酶切割活性。14、在一个实施方式中,所述亲本v型cas蛋白选自cas12i、cas12j、cas12a、cas12b、cas12d、cas12e、cas12f、cas12g、cas12h中的一种或任意几种。15、在一个实施方式中,所述亲本v型cas蛋白为cas12i家族的cas蛋白,例如cas12i1、cas12i2、cas12i3或cas12i12。16、在一些实施方案中,所述亲本v型cas蛋白为天然野生型cas蛋白;在其他的实施方式中,所述亲本v型cas蛋白为经过工程化改造后的cas蛋白,例如,通过氨基酸定点突变得到的cas蛋白。17、在优选的实施方式中,所述亲本v型cas蛋白为cas12i3,野生型的cas12i3(cn111757889b中的cas12f.4,本发明中,将其称之为cas12i3)氨基酸序列如seq id no.2所示。18、seq id no.2:cas12i319、mkkvevsrpyqslllpnhrkfkyldetwnayksvksllhrflvcaygavpfnkfvevvekvdndqlvlafavrlfrlvpvestsfakvdkanlakslanhlpvgtaipanvqsyfdsnfdpkkymwidcaweadrlaremglsasqfseyattmlwedwlplnkddvngwgsvsglfgegkkedrqqkvkmlnnllngikknppkdytqylkillnafdakshkeavknykgdstgrtasylseksgeitelmleqlmsniqrdigdkqkeislpkkdvvkkylesesgvpydqnlwsqayrnaassikktdtrnfnstlekfknevelrgllsegddveilrskffssefhktpdkfvikpehigfnnkynvvaelyklkaeatdfesafatvkdefeekgikhpiknileyiwnnevpvekwgrvarfnqseekllrikanptvecnqgmtfgnsamvgevlrsnyvskkgalvsgehggrligqnnmiwlemrllnkgkwethhvpthnmkffeevhaynpsladsvnvrnrlyrsedytqlpssitdglkgnpkakllkrqhcalnnmtanvlnpklsftinkknddytviivhsvevskprrevlvgdylvgmdqnqtasntyavmqvvkpkstdaipfrnmwvrfvesgsiesrtlnsrgeyvdqlnhdgvdlfeigdtewvdsarkffnklgvkhkdgtlvdlstaprkayafnnfyfktmlnhlrsnevdltllrneilrvangrfspmrlgslswttlkalgsfkslvlsyfdrlgakemvdkeakdkslfdllvainnkrsnkreertsriasslmtvaqkykvdnavvhvvvegnlsstdrsaskahnrntmdwcsravvkkledmcnlygfnikgvpafytshqdplvhradyddpkpalrcryssysradfskwgqnalaavvrwasnkksntcykvgaveflkqhglfadkkltveqflskvkdeeiliprrggrvfltthrllaestfvylngvkyhscnadevaavniclndwvipckkkmkeessasg。20、在一个实施方式中,所述亲本v型cas蛋白的氨基酸序列与seq id no.2相比具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、或至少99.9%的序列同一性。21、在一个实施方式中,所述亲本v型cas蛋白的氨基酸序列与seq id no.2相比,具有一个或多个氨基酸的置换、缺失或添加,例如,1-20个氨基酸的置换、缺失或添加,又如,1个,2个,3个,4个,5个,6个,7个,8个,9个,10个,11个,12个,13个,14个,15个,16个,17个,18个,19个或20个氨基酸的置换、缺失或添加。22、通过对cas12i3进行氨基酸定点突变得到的突变的cas12i3也可以作为本发明的亲本v型cas蛋白,例如,申请号为2022103148077、2022102697541、2022106036073、2022109432359、2023100884374、2023100667809、2023104503761的中国专利申请中记载的通过氨基酸突变得到的cas12i3。23、在一个实施方式中,所述突变的cas12i3在seq id no.2所示氨基酸序列的以下任一或任意几个氨基酸位点处存在突变:第7位、第233位、第267位、第369位、第433位、第165位、第166位、第854位、第266位、第235位、第328位、第599位;优选的,上述第7位、第233位、第267位、第369位、第433位、第165位、第166位、第854位、第266位、第235位、第328位或第599位氨基酸均突变为r。24、在一个实施方式中,所述突变的cas12i3在seq id no.2所示氨基酸序列的以下氨基酸位点处存在突变:第7位。25、在一个实施方式中,所述突变的cas12i3在seq id no.2所示氨基酸序列的以下氨基酸位点处存在突变:第7位、第233位、第267位、第369位和第433位。26、在一个实施方式中,所述突变的cas12i3在seq id no.2所示氨基酸序列的以下氨基酸位点处存在突变:第165位、第166位、第267位和第854位。27、在一个实施方式中,所述突变的cas12i3在seq id no.2所示氨基酸序列的以下氨基酸位点处存在突变:第266位、第235位、第328位和第599位。28、在优选的实施方式中,上述突变的cas12i3在seq id no.2所示氨基酸序列的第7位、第233位、第267位、第369位、第433位、第165位、第166位、第854位、第266位、第235位、第328位或第599位氨基酸均突变为r。29、在一个实施方式中,所述突变的cas12i3在seq id no.2所示氨基酸序列的以下任一或任意几个氨基酸位点处存在突变:第619位、第844位;优选的,第619位或第844位氨基酸突变为a。30、在一个实施方式中,所述亲本v型cas蛋白为上述野生型cas12i3或上述突变的cas12i3。31、在一个实施方式中,所述亲本v型cas蛋白的两个连续或不连续的氨基酸为第一氨基酸和第二氨基酸,所述hnh结构域置于第一氨基酸和第二氨基酸之间。32、在一个实施方式中,所述第一氨基酸和第二氨基酸为两个连续的氨基酸;所述第一氨基酸和第二氨基酸为对应于seq id no.2所示氨基酸序列的以下氨基酸位点:第794位氨基酸和第795位氨基酸。33、在一个实施方式中,所述第一氨基酸和第二氨基酸为对应于seq id no.2所示氨基酸序列的第794位氨基酸位点和第795位氨基酸位点;在这种实施方式中,hnh结构域置于亲本v型cas蛋白与seq id no.2第794位氨基酸位点和第795位氨基酸位点所对应的氨基酸位点之间。34、本发明中的氨基酸位点是指氨基酸序列的n端起的位点;例如,seq id no.2所示氨基酸序列的第794位氨基酸是指seq id no.2自n端起第794位氨基酸位点。35、在一个实施方式中,本发明的工程化的v型cas蛋白选自以下i-iii任意一组:36、i、所述工程化的v型cas蛋白包括亲本v型cas蛋白和hnh结构域,所述hnh结构域置于亲本v型cas蛋白的两个连续的第一氨基酸和第二氨基酸之间;37、所述亲本v型cas蛋白的氨基酸序列如seq id no.2所示,或者,所述亲本v型cas蛋白的氨基酸序列与seq id no.2相比具有至少80%的序列同一性,或者,所述亲本v型cas蛋白的氨基酸序列与seq id no.2相比,具有一个或多个氨基酸的置换、缺失或添加,或者,所述亲本v型cas蛋白在seq id no.2所示氨基酸序列的以下任一或任意几个氨基酸位点处存在突变:第7位、第233位、第267位、第369位、第433位、第165位、第166位、第854位、第266位、第235位、第328位、第599位,所述第7位、第233位、第267位、第369位、第433位、第165位、第166位、第854位、第266位、第235位、第328位或第599位氨基酸均突变为r;38、所述hnh结构域为源自于cas9的hnh结构域;39、所述第一氨基酸和第二氨基酸选自对应于seq id no.2所示氨基酸序列的以下氨基酸位点:第794位氨基酸和第795位氨基酸;40、ii、与i所述的工程化的v型cas蛋白相比,具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性,并且,基本保留了i中所述的工程化的v型cas蛋白的生物学功能;41、iii、与i所述的工程化的v型cas蛋白相比,具有一个或多个氨基酸的置换、缺失或添加,例如,1-20个氨基酸的置换、缺失或添加,又如,1个,2个,3个,4个,5个,6个,7个,8个,9个,10个,11个,12个,13个,14个,15个,16个,17个,18个,19个或20个氨基酸的置换、缺失或添加;并且,基本保留了i中所述的工程化的v型cas蛋白的生物学功能。42、所述工程化的v型cas蛋白的生物学功能包括亲本v型cas蛋白的生物学功能,例如,与指导rna结合的活性、核酸内切酶活性、或者在指导rna引导下与靶序列特定位点结合并切割的活性(包括但不限于cis切割活性和trans切割活性);所述工程化的v型cas蛋白的生物学功能还包括融合了hnh结构域后所带来的额外的核酸酶切割活性。43、本领域技术人员清楚,可以改变蛋白质的结构而不对其活性和功能性产生不利影响,例如,可以在蛋白质氨基酸序列中引入一个或多个保守性氨基酸取代,而不会对蛋白质分子的活性和/或三维结构产生不利影响。本领域技术人员清楚保守性氨基酸取代的实例以及实施方式。具体的说,可以用与待取代位点属于相同组的另一氨基酸残基取代该氨基酸残基,即用非极性氨基酸残基取代另一非极性氨基酸残基,用极性不带电荷的氨基酸残基取代另一极性不带电荷的氨基酸残基,用碱性氨基酸残基取代另一碱性氨基酸残基,和用酸性氨基酸残基取代另一酸性氨基酸残基。这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的。只要取代不导致蛋白质生物活性的失活,则一种氨基酸被属于同组的其他氨基酸替换的保守取代落在本发明的范围内。因此,本发明工程化的v型cas蛋白可以在氨基酸序列中包含一个或多个保守性取代, 这些保守性取代最好根据表1进行替换而产生。另外,本发明也涵盖还包含一个或多个其他非保守取代的蛋白,只要该非保守取代不显著影响本发明的蛋白质的所需功能和生物活性即可。44、保守氨基酸置换可以在一个或多个预测的非必需氨基酸残基处进行。“非必需”氨基酸残基是可以发生改变(缺失、取代或置换)而不改变生物活性的氨基酸残基,而“必需”氨基酸残基是生物活性所需的。“保守氨基酸置换”是其中氨基酸残基被具有类似侧链的氨基酸残基替代的置换。氨基酸置换可以在上述工程化的v型cas蛋白的非保守区域中进行。一般而言,此类置换不对保守的氨基酸残基,或者不对位于保守基序内的氨基酸残基进行,其中此类残基是蛋白质活性所需的。然而,本领域技术人员应当理解,功能变体可以具有较少的在保守区域中的保守或非保守改变。45、表146、47、本领域熟知,可以从蛋白质的n和/或c末端改变(置换、删除、截短或插入)一或多个氨基酸残基而仍保留其功能活性。因此,从cas蛋白的n和/或c末端改变了一或多个氨基酸残基、同时保留了其所需功能活性的蛋白,也在本发明的范围内。这些改变可以包括通过现代分子方法例如pcr而引入的改变,所述方法包括借助于在pcr扩增中使用的寡核苷酸之中包含氨基酸编码序列而改变或延长蛋白质编码序列的pcr扩增。48、应认识到,蛋白质可以以各种方式进行改变,包括氨基酸置换、删除、截短和插入,用于此类操作的方法是本领域通常已知的。例如,可以通过对dna的突变来制备上述蛋白的氨基酸序列变体。还可以通过其他诱变形式和/或通过定向进化来完成,例如,使用已知的诱变、重组和/或改组(shuffling)方法,结合相关的筛选方法,来进行单个或多个氨基酸取代、缺失和/或插入。49、领域技术人员能够理解,本发明cas蛋白中的这些微小氨基酸变化可以出现(例如天然存在的突变)或者产生(例如使用r-dna技术)而不损失蛋白质功能或活性。如果这些突变出现在蛋白的催化结构域、活性位点或其它功能结构域中,则多肽的性质可改变,但多肽可保持其活性。如果存在的突变不接近催化结构域、活性位点或其它功能结构域中,则可预期较小影响。50、本领域技术人员可以根据本领域已知的方法,例如定位诱变或蛋白进化或生物信息系的分析,来鉴定本发明工程化的v型cas蛋白的必需氨基酸。蛋白的催化结构域、活性位点或其它功能结构域也能够通过结构的物理分析而确定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,结合推定的关键位点氨基酸的突变来确定。51、本发明中,氨基酸残基可以用单字母表示,也可以用三字母表示,例如:丙氨酸(ala,a),缬氨酸(val,v),甘氨酸(gly,g),亮氨酸(leu,l),谷酰胺酸(gln,q),苯丙氨酸(phe,f),色氨酸(trp,w),酪氨酸(tyr,y),天冬氨酸(asp,d),天冬酰胺(asn,n),谷氨酸(glu,e),赖氨酸(lys,k),甲硫氨酸(met,m),丝氨酸(ser,s),苏氨酸(thr,t),半胱氨酸(cys,c),脯氨酸(pro,p),异亮氨酸(ile,i),组氨酸(his,h),精氨酸(arg,r)。52、术语“axxb”表示第xx位的氨基酸a变为氨基酸b,例如e5r表示第5位的e突变为r。多个氨基酸位点同时存在突变时,可以采用e5r-v4r类似的形式进行表述,例如,e5r-v4r代表第5位e突变为r同时第4位v突变为r。53、本发明所述蛋白质内的特定氨基酸位置(编号)是利用标准序列比对工具通过将目标蛋白质的氨基酸序列与参考氨基酸序列(例如,seq id no.2)进行比对而确定的,譬如用smith-waterman运算法则或用clustalw2运算法则比对两个序列,其中当比对得分最高时认为所述序列是对准的。比对得分可依照wilbur ,w .j .and lipman ,d .j .(1983)rapid similarity searches ofnucleic acid and protein data banks .proc .natl.acad .sci .usa ,80:726-730中所述的方法进行计算。在clustalw2(1 .82)运算法则中优选使用默认参数:蛋白质缺口开放罚分=10.0;蛋白质缺口延伸罚分=0.2;蛋白质矩阵=gonnet;蛋白质/dna端隙=-1;蛋白质/dnagapdist=4。优选采用alignx程序(vectornti组中的一部分),以适于多重比对的默认参数(缺口开放罚分:10.0缺口延伸罚分0.05)通过将蛋白质的氨基酸序列与seq id no.2进行比来确定本发明所述蛋白质内特定氨基酸的位置。54、本发明还提供了一种融合蛋白,所述融合蛋白包括如上所述的工程化的v型cas蛋白和其他的修饰部分。55、在一个实施方式中,所述修饰部分选自另外的蛋白或多肽、可检测的标记或其任意组合。56、在一个实施方式中,所述修饰部分选自表位标签、报告基因序列、核定位信号(nls)序列、靶向部分、转录激活结构域(例如,vp64)、转录抑制结构域(例如,krab结构域或sid结构域)、核酸酶结构域(例如,fok1),以及具有选自下列的活性的结构域:核苷酸脱氨酶(例如,腺苷脱氨酶或胞苷脱氨酶),甲基化酶活性, 去甲基化酶, 转录激活活性, 转录抑制活性, 转录释放因子活性, 组蛋白修饰活性, 核酸酶活性, 单链rna切割活性, 双链rna切割活性, 单链dna切割活性, 双链dna切割活性和核酸结合活性;以及其任意组合。所述nls序列是本领域技术人员熟知的,其实例包括但不限于所述,sv40大t抗原,egl-13,c-myc以及tus蛋白。57、在一个实施方式中,所述nls序列位于、靠近或接近本发明的cas蛋白的末端(例如,n端、c端或两端)。58、所述表位标签(epitope tag)是本领域技术人员熟知的,包括但不限于his、v5、flag、ha、myc、vsv-g、trx等,并且本领域技术人员可以选择其他合适的表位标签(例如,纯化、检测或示踪)。59、所述报告基因序列是本领域技术人员熟知的,其实例包括但不限于gst、hrp、cat、gfp、hcred、dsred、cfp、yfp、bfp等。60、在一个实施方式中,本发明的融合蛋白包含能够与dna分子或细胞内分子结合的结构域,例如麦芽糖结合蛋白(mbp)、lex a的dna结合结构域(dbd)、gal4的dbd等。61、在一个实施方式中,本发明的融合蛋白包含可检测的标记,例如荧光染料,例如fitc或dapi。62、在一个实施方式中,本发明的工程化的v型cas蛋白任选地通过接头与所述修饰部分偶联、缀合或融合。63、在一个实施方式中,所述修饰部分直接连接至本发明的工程化的v型cas蛋白的n端或c端。64、在一个实施方式中,所述修饰部分通过接头连接至本发明的工程化的v型cas蛋白的n端或c端。这类接头是本领域熟知的,其实例包括但不限于包含一个或多个(例如,1个,2个,3个,4个或5个)氨基酸(如,glu或ser)或氨基酸衍生物(如,ahx、β-ala、gaba或ava)的接头,或peg等。65、本发明的工程化的v型cas蛋白、蛋白衍生物或融合蛋白不受其产生方式的限定,例如,其可以通过基因工程方法(重组技术)产生,也可以通过化学合成方法产生。66、工程化的v型cas蛋白的核酸67、另一方面,本发明提供了一种分离的多核苷酸,其包含:68、(a)编码本发明的工程化的v型cas蛋白或融合蛋白的多核苷酸序列;69、或者,与(a)所述的多核苷酸互补的多核苷酸。70、在一个实施方式中,所述的核苷酸序列经密码子优化用于在原核细胞中进行表达。在一个实施方式中,所述的核苷酸序列经密码子优化用于在真核细胞中进行表达。71、在一个实施方式中,所述细胞是动物细胞,例如,哺乳动物细胞。72、在一个实施方式中,所述细胞是人类细胞。73、在一个实施方式中,所述细胞是植物细胞,例如栽培植物(如木薯、玉米、高粱、小麦或水稻)、藻类、树或蔬菜具有的细胞。74、在一个实施方式中,所述的多核苷酸优选是单链的或双链的。75、指导rna(grna)76、另一方面,本发明提供了一种grna,所述grna包括第一区段和第二区段;所述第一区段又称为“骨架区”、“蛋白质结合区段”、“蛋白质结合序列”、或者“同向重复(directrepeat)序列”;所述第二区段又称为“靶向核酸的靶向序列”或者“靶向核酸的靶向区段”,或者“靶向靶序列的引导序列”。77、所述grna的第一区段能够与本发明的cas蛋白相互作用,从而使cas蛋白和grna形成复合物。78、在优选的实施方式中,所述第一区段为如上所述的同向重复序列。79、本发明靶向核酸的靶向序列或靶向核酸的靶向区段包含与靶核酸中的序列互补的核苷酸序列。换言之,本发明靶向核酸的靶向序列或靶向核酸的靶向区段经过杂交(即,碱基配对)以序列特异性方式与靶核酸相互作用。因此,靶向核酸的靶向序列或靶向核酸的靶向区段可改变,或可被修饰以杂交靶核酸内的任何希望的序列。所述核酸选自dna或rna。80、靶向核酸的靶向序列或靶向核酸的靶向区段与靶核酸的靶序列之间的互补百分比可为至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。81、本发明grna的“骨架区”、“蛋白质结合区段”、“蛋白质结合序列”、或者“同向重复序列”可以与crispr蛋白(或者,cas蛋白)相互作用。本发明grna经过靶向核酸的靶向序列的作用将其相互作用的cas蛋白引导至靶核酸内的特异性核苷酸序列。82、优选的,所述指导rna从5’至3’方向包含第一区段和第二区段。83、本发明中,所述第二区段还可以理解为与靶序列杂交的引导序列。84、本发明的grna能够与所述cas蛋白形成复合物。85、载体86、本发明还提供了一种载体,其包含如上述的工程化的v型cas蛋白、分离的核酸分子或多核苷酸;优选的,其还包括与之可操作连接的调控元件。87、在一个实施方式中,所述的调控元件选自下组中的一种或多种:增强子、转座子、启动子、终止子、前导序列、多腺苷酸序列、标记基因。88、在一个实施方式中,所述的载体包括克隆载体、表达载体、穿梭载体、整合载体。89、在一些实施方案中,所述系统中包括的载体是病毒载体(例如逆转录病毒载体,慢病毒载体,腺病毒载体,腺相关载体和单纯疱疹载体),还可以是质粒、病毒、粘粒、噬菌体等类型,它们是本领域技术人员所熟知的。90、crispr系统91、本发明提供了一种工程化的非天然存在的载体系统,或者是crispr-cas系统,该系统包括工程化的v型cas蛋白或编码所述工程化的v型cas蛋白的核酸序列以及编码一种或多种指导rna的核酸。92、在一种实施方式中,所述编码所述工程化的v型cas蛋白的核酸序列和编码一种或多种指导rna的核酸是人工合成的。93、在一种实施方式中,所述编码所述工程化的v型cas蛋白的核酸序列和编码一种或多种指导rna的核酸并不共同天然存在。94、该一种或多种指导rna在细胞中靶向一个或多个靶序列。所述一个或多个靶序列与编码一种或多种基因产物的dna分子的基因组座位杂交,并且引导该cas蛋白到达所述一种或多种基因产物的dna分子的基因组座位部位,cas蛋白到达靶序列位置后对靶序列进行修饰、编辑或切割,由此该一种或多种基因产物的表达被改变或修饰。95、本发明的细胞包括动物、植物或微生物中的一种或多种。96、在一些实施例中,该cas蛋白是密码子优化的,用于在细胞中进行表达。97、在一些实施例中,该cas蛋白指导切割在该靶序列位置处的一条或两条链。98、本发明还提供了一种工程化的非天然存在的载体系统,该载体系统可以包括一种或多种载体,该一种或多种载体包括:99、a)第一调控元件,该第一调控元件可操作地与grna连接,100、b)第二调控元件,该第二调控元件可操作地与所述cas蛋白连接;101、其中组分(a)和(b)位于该系统的相同或不同载体上。102、所述第一和第二调控元件包括启动子(例如,组成型启动子或诱导型启动子)、增强子(例如35s promoter或35s enhanced promoter)、内部核糖体进入位点(ires)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚u序列)。103、在一些实施方案中,所述系统中的载体是病毒载体(例如逆转录病毒载体,慢病毒载体,腺病毒载体,腺相关载体和单纯疱疹载体),还可以是质粒、病毒、粘粒、噬菌体等类型,它们是本领域技术人员所熟知的。104、在一些实施例中,本文提供的系统处于递送系统中。在一些实施方案中,递送系统是纳米颗粒,脂质体,外体,微泡和基因枪。105、在一个实施方式中,所述靶序列是来自原核细胞或真核细胞的dna或rna序列。在一个实施方式中,所述靶序列是非天然存在的dna或rna序列。106、在一个实施方式中,所述靶序列存在于细胞内。在一个实施方式中,所述靶序列存在于细胞核内或细胞质(例如,细胞器)内。在一个实施方式中,所述细胞是真核细胞。在其他实施方式中,所述细胞是原核细胞。107、在一个实施方式中,所述cas蛋白连接有一个或多个nls序列。在一个实施方式中,所述融合蛋白包含一个或多个nls序列。在一个实施方式中,所述nls序列连接至所述蛋白的n端或c端。在一个实施方式中,所述nls序列融合至所述蛋白的n端或c端。108、另一方面, 本发明涉及一种工程化的crispr系统,所述系统包含上述cas蛋白以及一种或多种指导rna,其中,所述指导rna包括同向重复序列和能够与靶核酸杂交的间隔序列,所述cas蛋白能够结合所述指导rna并靶向与间隔序列互补的靶核酸序列。109、蛋白-核酸复合物/组合物110、另一方面,本发明提供了一种复合物或者组合物,其包含:111、(i) 蛋白组分,其选自:上述工程化的v型cas蛋白、衍生化蛋白或融合蛋白,及其任意组合;和112、(ii) 核酸组分,其包含(a)能够与靶序列杂交的引导序列;以及(b)能够与本发明的工程化的v型cas蛋白结合的同向重复序列。113、所述蛋白组分与核酸组分相互结合形成复合物。114、在一个实施方式中,所述核酸组分是crispr-cas系统中的指导rna。115、在一个实施方式中,所述复合物或组合物是非天然存在的或经修饰的。在一个实施方式中,所述复合物或组合物中的至少一个组分是非天然存在的或经修饰的。在一个实施方式中,所述第一组分是非天然存在的或经修饰的;和/或,所述第二组分是非天然存在的或经修饰的。116、活化的crispr复合物117、另一方面,本发明还提供了一种活化的crispr复合物,所述活化的crispr复合物包含:(1)蛋白组分,其选自:本发明的工程化的v型cas蛋白、衍生化蛋白或融合蛋白,及其任意组合;(2)grna,其包含(a)能够与靶序列杂交的引导序列;以及(b)能够与本发明的cas蛋白结合的同向重复序列;以及(3)结合在grna上的靶序列。优选的,所述结合为通过grna上的靶向核酸的靶向序列与靶核酸进行的结合。118、本文所用术语“活化的crispr复合物”,“活化复合物”或“三元复合物”是指crispr系统中cas蛋白、grna与靶核酸结合或修饰后的复合物。119、本发明的cas蛋白和grna可以形成二元复合物,该二元复合物在与核酸底物结合时被活化,形成活化的crispr复合物该核酸底物与grna中的间隔序列(或者称之为,与靶核酸杂交的引导序列)互补。在一些实施方案中,grna的间隔序列与靶底物完全匹配。 在其它实施方案中,grna的间隔序列与靶底物的部分(连续或不连续)匹配。120、在优选的实施方式中,所述活化的crispr复合物可以表现出侧枝核酸酶切活性,所述侧枝核酸酶切活性是指活化的crispr复合物表现的对单链核酸的非特异切割活性或乱切活性,在本领域又称之为trans切割活性。121、递送及递送组合物122、本发明的工程化的v型cas蛋白、grna、融合蛋白、核酸分子、载体、系统、复合物和组合物,可以通过本领域已知的任何方法进行递送。此类方法包括但不限于,电穿孔、脂转染、核转染、显微注射、声孔效应、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状转染、热激转染、核转染、磁转染、脂转染、穿刺转染、光学转染、试剂增强性核酸摄取、以及经由脂质体、免疫脂质体、病毒颗粒、人工病毒体等的递送。123、因此,在另一个方面,本发明提供了一种递送组合物,其包含递送载体,以及选自下列的一种或任意几种:本发明的工程化的v型cas蛋白、融合蛋白、核酸分子、载体、系统、复合物和组合物。124、在一个实施方式中,所述递送载体是粒子。125、在一个实施方式中,所述递送载体选自脂质颗粒、糖颗粒、金属颗粒、蛋白颗粒、脂质体、外泌体、微泡、基因枪或病毒载体(例如,复制缺陷型逆转录病毒、慢病毒、腺病毒或腺相关病毒)。126、宿主细胞127、本发明还涉及一种体外的、离体的或体内的细胞或细胞系或它们的子代,所述细胞或细胞系或它们的子代包含:本发明所述的工程化的v型cas蛋白、融合蛋白、核酸分子、蛋白-核酸复合物、活化的crispr复合物、载体、本发明递送组合物。128、在某些实施方案中,所述细胞是原核细胞。129、在某些实施方案中,所述细胞是真核细胞。在某些实施方案中,所述细胞是哺乳动物细胞。在某些实施方案中,所述细胞是人类细胞。某些实施方案中,所述细胞是非人哺乳动物细胞,例如非人灵长类动物、牛、羊、猪、犬、猴、兔、啮齿类(如大鼠或小鼠)的细胞。在某些实施方案中,所述细胞是非哺乳动物真核细胞,例如家禽鸟类(如鸡)、鱼类或甲壳动物(如蛤蜊、虾)的细胞。在某些实施方案中,所述细胞是植物细胞,例如单子叶植物或双子叶植物具有的细胞或栽培植物或粮食作物如木薯、玉米、高粱、大豆、小麦、燕麦或水稻具有的细胞,例如藻类、树或生产植物、果实或蔬菜(例如,树类如柑橘树、坚果树;茄属植物、棉花、烟草、番茄、葡萄、咖啡、可可等)。130、在某些实施方案中,所述细胞是干细胞或干细胞系。131、在某些情况下,本发明的宿主细胞包含基因或基因组的修饰,该修饰是在其野生型中不存在的修饰。132、基因编辑方法和应用133、本发明的工程化的v型cas蛋白、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物或上述活化的crispr复合物或者上述宿主细胞可用于以下任一或任意几个用途:靶向和/或编辑靶核酸;切割双链dna、单链dna或单链rna;非特异性切割和/或降解侧枝核酸;非特异性切割单链核酸;核酸检测;检测目标样品中的核酸;特异性地编辑双链核酸;碱基编辑双链核酸;碱基编辑单链核酸。在其他的实施方式中,还可以用于制备用于上述任一或任意几个用途的试剂或试剂盒。134、本发明还提供了上述工程化的v型cas蛋白、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物或上述活化的crispr复合物在基因编辑、基因靶向或基因切割中的应用;或者,在制备用于基因编辑、基因靶向或基因切割的试剂或试剂盒中的用途。135、在一个实施方式中,所述基因编辑、基因靶向或基因切割为在细胞内和/或细胞外进行基因编辑、基因靶向或基因切割。136、本发明还提供了一种编辑靶核酸、靶向靶核酸或切割靶核酸的方法,所述方法包括将靶核酸与上述工程化的v型cas蛋白、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物或上述活化的crispr复合物进行接触。在一个实施方式中,所述方法为在细胞内或细胞外编辑靶核酸、靶向靶核酸或切割靶核酸。137、所述基因编辑或编辑靶核酸包括修饰基因、敲除基因、改变基因产物的表达、修复突变、和/或插入多核苷酸、基因突变。138、所述编辑可以在原核细胞和/或真核细胞中进行编辑。139、另一方面,本发明还提供了上述工程化的v型cas蛋白、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物或上述活化的crispr复合物在核酸检测中的应用,或在制备用于核酸检测的试剂或试剂盒中的用途。140、另一方面,本发明还提供了一种切割单链核酸的方法,所述方法包括,使核酸群体与上述工程化的v型cas蛋白和grna接触,其中所述核酸群体包含靶核酸和多个非靶单链核酸,所述工程化的v型cas蛋白切割所述多个非靶单链核酸。141、所述grna能够结合所述cas蛋白。142、所述grna能够靶向所述靶核酸。143、所述接触可以是在体外、离体或体内的细胞内部。144、优选的,所述切割单链核酸为非特异性的切割。145、另一方面,本发明还提供了上述工程化的v型cas蛋白、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物或上述活化的crispr复合物在非特异性的切割单链核酸中的应用,或在制备用于非特异性的切割单链核酸的试剂或试剂盒中的用途。146、另一方面,本发明还提供了一种用于基因编辑、基因靶向或基因切割的试剂盒,所述试剂盒包括上述工程化的v型cas蛋白、grna、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物、上述活化的crispr复合物或上述宿主细胞。147、另一方面,本发明还提供了一种用于检测样品中的靶核酸的试剂盒,所述试剂盒包含:(a) 工程化的v型cas蛋白,或编码所述cas蛋白的核酸;(b) 指导rna,或编码所述指导rna的核酸,或包含所述指导rna的前体rna,或编码所述前体rna的核酸;和(c)为单链的且不与所述指导rna杂交的单链核酸检测器。148、本领域知晓,前体rna可被切割或加工成为上述成熟的指导rna。149、另一方面,发明提供了上述工程化的v型cas蛋白、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物、上述活化的crispr复合物或上述宿主细胞在制备制剂或试剂盒中的用途,所述制剂或试剂盒用于:150、(i) 基因或基因组编辑;151、(ii) 靶核酸检测和/或诊断;152、(iii) 编辑靶基因座中的靶序列来修饰生物或非人类生物;153、(iv) 疾病的治疗;154、(iv) 靶向靶基因。155、优选的,上述基因或基因组编辑为在细胞内或细胞外进行基因或基因组编辑。156、优选的,所述靶核酸检测和/或诊断为在体外进行靶核酸检测和/或诊断。157、优选的,所述疾病的治疗为治疗由靶基因座中的靶序列的缺陷引起的病症。158、另一个方面,本发明提供了一种检测样品中靶核酸的方法,所述方法包括将样品与所述工程化的v型cas蛋白、grna(指导rna)和单链核酸检测器接触,所述grna包括与所述cas蛋白结合的区域和与靶核酸杂交的指导序列;检测由所述cas蛋白切割单链核酸检测器产生的可检测信号,从而检测靶核酸;所述单链核酸检测器不与所述grna杂交。159、特异性修饰靶核酸的方法160、另一方面,本发明还提供了一种特异性修饰靶核酸的方法,方法包括:使靶核酸与上述工程化的v型cas蛋白、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物或上述活化的crispr复合物接触。161、该特异性修饰可以发生在体内或者体外。162、该特异性修饰可以发生在细胞内或者细胞外。163、在一些情况下,细胞选自原核细胞或真核细胞,例如,动物细胞、植物细胞或微生物细胞。164、在一个实施方式中,所述修饰是指所述靶序列的断裂,如,dna的单链/双链断裂,或者rna的单链断裂。165、在一些情况下,所述方法还包括使靶核酸与供体多核苷酸接触,其中将供体多核苷酸、供体多核苷酸的部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的部分整合到靶核酸中。166、在一个实施方式中,所述修饰还包括将编辑模板(例如外源核酸)插入所述断裂中。167、在一个实施方式中,所述方法还包括:将编辑模板与所述靶核酸接触,或者递送至包含所述靶核酸的细胞中。在此实施方式中,所述方法通过与外源模板多核苷酸同源重组修复所述断裂的靶基因;在一些实施方式中,所述修复导致一种突变,包括所述靶基因的一个或多个核苷酸的插入、缺失、或取代,在其他的实施方式中,所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。168、检测(非特异切割)169、另一方面,本发明提供了一种检测样品中靶核酸的方法,所述方法包括将样品与上述工程化的v型cas蛋白、核酸、上述组合物、上述cirspr/cas系统、上述载体系统、上述递送组合物或上述活化的crispr复合物和单链核酸检测器接触;检测由所述cas蛋白切割单链核酸检测器产生的可检测信号,从而检测靶核酸。170、本发明中,所述靶核酸包括核糖核苷酸或脱氧核糖核苷酸;包括单链核酸、双链核酸,例如单链dna、双链dna、单链rna、双链rna。171、在一个实施方式中,所述靶核酸来源于病毒、细菌、微生物、土壤、水源、人体、动物、植物等样品。优选的,所述靶核酸为pcr、nasba、rpa、sda、lamp、had、near、mda、rca、lcr、ram等方法富集或扩增的产物。172、在一个实施方式中,所述靶核酸为病毒核酸、细菌核酸、与疾病相关的特异核酸,如特定的突变位点或snp位点或与对照有差异的核酸;优选地,所述病毒为植物病毒或动物病毒,例如,乳头瘤病毒,肝dna病毒,疱疹病毒,腺病毒,痘病毒,细小病毒,冠状病毒;优选地,所述病毒为冠状病毒,优选地,sars、sars-cov2(covid-19)、hcov-229e、hcov-oc43、hcov-nl63、hcov-hku1、mers-cov。173、本发明中,所述grna 与靶核酸上的靶序列至少有50%的匹配度,优选至少60%,优选至少70%,优选至少80%,优选至少90%。174、在一个实施方式中,当所述的靶序列含有一个或多个特征位点(如特定的突变位点或snp)时,所述的特征位点与grna完全匹配。175、在一个实施方式中,所述检测方法中可以包含一种或多种导向序列互不相同的grna,其靶向不同的靶序列。176、本发明中,所述单链核酸检测器包括但不限于单链dna、单链rna、dna-rna杂交体、核酸类似物、碱基修饰物、以及含有无碱基间隔物的单链核酸检测器等;“核酸类似物”包括但不限于:锁核酸、桥核酸、吗啉核酸、乙二醇核酸、己糖醇核酸、苏糖核酸、阿拉伯糖核酸、2’氧甲基rna、2’甲氧基乙酰基rna、2’氟rna、2’氨基rna、4’硫rna及其组合,包括任选的核糖核苷酸或脱氧核糖核苷酸残基。177、本发明中,所述可检测信号通过以下方式实现:基于视觉的检测,基于传感器的检测,颜色检测,基于荧光信号的检测,基于金纳米颗粒的检测,荧光偏振,胶体相变/分散,电化学检测和基于半导体的检测。178、本发明中,优选的,所述单链核酸检测器的两端分别设置荧光基团和淬灭基团,当所述单链核酸检测器被切割后,可以表现出可检测的荧光信号。所述荧光基团选自fam、fitc、vic、joe、tet、cy3、cy5、rox、texas red或lc red460中的一种或任意几种;所述淬灭基团选自bhq1、bhq2、bhq3、dabcy1或tamra中的一种或任意几种。179、在其他的实施方式中,所述单链核酸检测器的5’端和3’端分别设置不同的标记分子,通过胶体金检测的方式,检测所述单链核酸检测器被cas蛋白切割前和被cas蛋白切割后的胶体金测试结果;所述单链核酸检测器被cas蛋白切割前和被cas蛋白切割后在胶体金的检测线和质控线上将表现出不同的显色结果。180、在一些实施方案中,检测靶核酸的方法还可以包括将可检测信号的电平与参考信号电平进行比较,以及基于可检测信号的电平确定样品中靶核酸的量。181、在一些实施方案中,检测靶核酸的方法还可以包括在不同的通道上使用rna报告核酸和dna报告核酸(例如,荧光颜色),并通过测量rna和dna报告分子的信号电平,以及通过测量rna和dna报告分子中靶核酸的量来确定可检测信号的电平,基于组合(例如,使用最小或乘积)可检测信号的电平来采样。182、在一个实施方式中,所述靶基因存在于细胞内。183、在一个实施方式中,所述细胞是原核细胞。184、在一个实施方式中,所述细胞是真核细胞。185、在一个实施方式中,所述细胞是动物细胞。186、在一个实施方式中,所述细胞是人类细胞。187、在一个实施方式中,所述细胞是植物细胞,例如栽培植物(如木薯、玉米、高粱、小麦或水稻)、藻类、树或蔬菜具有的细胞。188、在一个实施方式中,所述靶基因存在于体外的核酸分子(例如,质粒)中。189、在一个实施方式中,所述靶基因存在于质粒中。190、hnh结构域及其应用191、另一方面,本发明还提供了一种hnh结构域。192、在一个实施方式中,所述hnh结构域为源自于cas9的hnh结构域;在一个实施方式中,所述源自于cas9的hnh结构域的氨基酸序列与seq id no.1相比具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、或至少99.9%的序列同一性,并且具有hnh结构域的生物学功能;在一个实施方式中,所述源自于cas9的hnh结构域的氨基酸序列与seq id no.1相比具有一个或多个氨基酸的置换、缺失或添加,例如,1-20个氨基酸的置换、缺失或添加,又如,1个,2个,3个,4个,5个,6个,7个,8个,9个,10个,11个,12个,13个,14个,15个,16个,17个,18个,19个或20个氨基酸的置换、缺失或添加,并且具有hnh结构域的生物学功能;优选的,所述源自于cas9的hnh结构域的氨基酸序列如seq id no.1所示。193、本发明还提供了上述hnh结构域在提高cas蛋白编辑效率中的应用。194、本发明还提供了上述hnh结构域在制备编辑效率提高的cas蛋白中的应用。195、在一个实施方式中,所述cas蛋白为v型cas蛋白;优选的,所述v型cas蛋白选自cas12i、cas12j、cas12a、cas12b、cas12d、cas12e、cas12f、cas12g、cas12h中的一种或任意几种;更优选的,所述v型cas蛋白为cas12i家族的cas蛋白,例如cas12i1、cas12i2、cas12i3或cas12i12。196、在一个实施方式中,上述hnh结构域置于cas蛋白的两个连续或不连续的氨基酸之间,从而能够提高所述cas蛋白的编辑效率。197、在一个实施方式中,所述cas蛋白的氨基酸序列与seq id no.2相比具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、或至少99.9%的序列同一性。198、在一个实施方式中,所述cas蛋白的氨基酸序列与seq id no.2相比,具有一个或多个氨基酸的置换、缺失或添加,例如,1-20个氨基酸的置换、缺失或添加,又如,1个,2个,3个,4个,5个,6个,7个,8个,9个,10个,11个,12个,13个,14个,15个,16个,17个,18个,19个或20个氨基酸的置换、缺失或添加。199、在一个实施方式中,所述cas蛋白的两个连续或不连续的氨基酸为第一氨基酸和第二氨基酸,所述hnh结构域置于第一氨基酸和第二氨基酸之间。200、在一个实施方式中,所述第一氨基酸和第二氨基酸选自对应于seq id no.2所示氨基酸序列的以下氨基酸位点:第794位氨基酸和第795位氨基酸。201、术语定义202、在本发明中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的分子遗传学、核酸化学、化学、分子生物学、生物化学、细胞培养、微生物学、细胞生物学、基因组学和重组dna等操作步骤均为相应领域内广泛使用的常规步骤。同时,为了更好地理解本发明,下面提供相关术语的定义和解释。203、本文中的核酸切割或切割核酸包括:由本文所述工程化的v型cas蛋白产生的靶核酸中的dna或rna断裂(cis切割)、dna或rna在侧枝核酸底物(单链核酸底物)中的断裂(即非特异性或非靶向性,trans切割)。在一些实施方式中,所述切割是双链dna断裂。在一些实施方案中,切割是单链dna断裂或单链rna断裂。204、crispr系统205、如本文中所使用的,术语“规律成簇的间隔短回文重复(crispr)-crispr-相关(cas) (crispr-cas)系统”或“crispr系统”可互换地使用并且具有本领域技术人员通常理解的含义,其通常包含与crispr相关(“cas”)基因的表达有关的转录产物或其他元件,或者能够指导所述cas基因活性的转录产物或其他元件。206、crispr/cas复合物207、如本文中所使用的,术语“crispr/cas复合物”是指,指导rna(guide rna)或成熟crrna与cas蛋白结合所形成的复合体,其包含杂交到靶序列的引导序列上并且与cas蛋白结合的同向重复序列,该复合体能够识别并切割能与该指导rna或成熟crrna杂交的多核苷酸。208、指导rna(guide rna,grna)209、如本文中所使用的,术语“指导rna(guide rna,grna)”、“成熟crrna” 、“指导序列”可互换地使用并且具有本领域技术人员通常理解的含义。一般而言,指导rna可以包含同向重复序列(direct repeat)和引导序列,或者基本上由或由同向重复序列和引导序列组成。210、在某些情况下,指导序列是与靶序列具有足够互补性从而与所述靶序列杂交并引导crispr/cas复合物与所述靶序列的特异性结合的任何多核苷酸序列。在一个实施方式中,当最佳比对时,指导序列与其相应靶序列之间的互补程度为至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少99%。确定最佳比对在本领域的普通技术人员的能力范围内。例如,存在公开和可商购的比对算法和程序,诸如但不限于clustalw、matlab中的史密斯-沃特曼算法(smith-waterman)、bowtie、geneious、biopython以及seqman。211、靶序列212、“靶序列”是指被grna中的引导序列所靶向的多核苷酸,例如与该引导序列具有互补性的序列,其中靶序列与引导序列之间的杂交将促进crispr/cas复合物(包括cas蛋白和grna)的形成。完全互补性不是必需的,只要存在足够互补性以引起杂交并且促进一种crispr/cas复合物的形成即可。213、靶序列可以包含任何多核苷酸,如dna或rna。在某些情况下,所述靶序列位于细胞内或细胞外。在某些情况下,所述靶序列位于细胞的细胞核或细胞质中。在某些情况下,该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包含该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在一个实施方式中,所述编辑模板为外源核酸。在一个实施方式中,该重组是同源重组。214、在本发明中,“靶序列”或“靶多核苷酸”或“靶核酸”可以是对细胞(例如,真核细胞)而言任何内源或外源的多核苷酸。例如,该靶多核苷酸可以是一种存在于真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如,蛋白质)的序列或一个非编码序列(例如,调节多核苷酸或无用dna)。在某些情况下,该靶序列应该与原间隔序列临近基序(pam)相关。215、单链核酸检测器216、本发明所述的单链核酸检测器是指含有2-200个核苷酸的序列,优选,具有2-150个核苷酸,优选,3-100个核苷酸,优选,3-30个核苷酸,优选,4-20个核苷酸,更优选,5-15个核苷酸。优选为单链dna分子、单链rna分子或单链dna-rna杂交体。217、所述的单链核酸检测器两端包括不同的报告基团或标记分子,当其处于初始状态(即未被切割状态时)不呈现报告信号,当该单链核酸检测器被切割后,呈现出可检测的信号,即切割后与切割前表现出可检测的区别。218、在一个实施方式中,所述的报告基团或标记分子包括荧光基团和淬灭基团, 所述荧光基团选自fam、fitc、vic、joe、tet、cy3、cy5、rox、texas red或lc red460中的一种或任意几种;所述淬灭基团选自bhq1、bhq2、bhq3、dabcy1或tamra中的一种或任意几种。219、在一个实施方式中,所述的单链核酸检测器具有连接至5’端第一分子(如fam或fitc)和连接至3’端的第二分子(如生物素)。所述的含有单链核酸检测器的反应体系与流动条配合用以检测靶核酸(优选,胶体金检测方式)。所述的流动条被设计为具有两条捕获线,在样品接触端(胶体金)设有结合第一分子的抗体(即第一分子抗体),在第一线(control line)处含有结合第一分子抗体的抗体,在第二线(test line)处含有与第二分子结合的第二分子的抗体(即第二分子抗体,如亲和素)。当反应沿着条带流动时,第一分子抗体与第一分子结合携带切割或未切割的寡核苷酸至捕获线,切割的报告子将在第一个捕获线处结合第一分子抗体的抗体,而未切割的报告子将在第二捕获线处结合第二分子抗体。报告基团在各条线的结合将导致强读出/信号(例如颜色)。随着更多的报告子被切割,更多的信号将在第一捕获线处累积,并且在第二线处将出现更少的信号。在某些方面,本发明涉及如本文所述的流动条用于检测核酸的用途。在某些方面,本发明涉及用本文定义的流动条检测核酸的方法,例如(侧)流测试或(侧)流免疫色谱测定。在某些方面,所述单链核酸检测器中的分子可相互替换,或改变分子的位置,只要其报告原理与本发明相同或相近,所改进的方式也均包含在本发明中。220、本发明所述的检测方法,可用于待检测靶核酸的定量检测。所述的定量检测指标可以根据报告基团的信号强弱进行定量,如根据荧光基团的发光强度,或根据显色条带的宽度等。221、野生型222、如本文中所使用的,术语“野生型”具有本领域技术人员通常理解的含义,其表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征,其可从自然中的来源分离并且没有被人为有意地修饰。223、衍生化224、如本文中所使用的,术语“衍生化”是指,对氨基酸、多肽或蛋白的化学修饰,其中一个或多个取代基已与所述氨基酸、多肽或蛋白共价连接。取代基也可称为侧链。225、衍生化的蛋白是该蛋白的衍生物,通常,蛋白的衍生化不会不利影响该蛋白的期望活性(例如,与指导rna结合的活性、核酸内切酶活性、在指导rna引导下与靶序列特定位点结合并切割的活性),也就是说蛋白的衍生物与蛋白有相同的活性。226、衍生化蛋白227、又称“蛋白衍生物”,是指蛋白的经修饰形式,例如其中所述蛋白的一个或多个氨基酸可以被缺失、插入、修饰和/或取代。228、非天然存在的229、如本文中所使用的,术语“非天然存在的”或“工程化的”可互换地使用并且表示人工的参与。当这些术语用于描述核酸分子或多肽时,其表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。230、直系同源物(orthologue, ortholog)231、如本文中所使用的,术语“直系同源物(orthologue, ortholog)”具有本领域技术人员通常理解的含义。作为进一步指导,如本文中所述的蛋白质的“直系同源物”是指属于不同物种的蛋白质,该蛋白质执行与作为其直系同源物的蛋白相同或相似的功能。232、同一性233、如本文中所使用的,术语“同一性”用于指两个多肽之间或两个核酸之间序列的匹配情况。当两个进行比较的序列中的某个位置都被相同的碱基或氨基酸单体亚单元占据时(例如,两个dna分子的每一个中的某个位置都被腺嘌呤占据,或两个多肽的每一个中的某个位置都被赖氨酸占据),那么各分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目×100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,dna序列ctgact和caggtt共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,可通过计算机程序例如align程序(dnastar, inc.)方便地进行的needleman等人(1970)j. mol. biol. 48:443-453的方法来实现。还可使用已整合入align程序(版本2.0)的e. meyers和w. miller(comput. appl biosci.,4:11-17 (1988))的算法,使用pam120权重残基表(weightresidue table)、12的缺口长度罚分和4的缺口罚分来测定两个氨基酸序列之间的百分数同一性。此外,可使用已整合入gcg软件包(可在www.gcg.com上获得)的gap程序中的needleman和wunsch (j moi biol. 48:444-453 (1970))算法,使用blossum 62矩阵或pam250矩阵以及16、14、12、10、8、6或4的缺口权重(gap weight)和1、2、3、4、5或6的长度权重来测定两个氨基酸序列之间的百分数同一性。234、载体235、术语“载体”是指一种核酸分子,它能够运送与其连接的另一种核酸分子。载体包括但不限于,单链、双链、或部分双链的核酸分子;包括一个或多个自由端、无自由端(例如环状的)的核酸分子;包括dna、rna、或两者的核酸分子;以及本领域已知的其他多种多样的多核苷酸。载体可以通过转化,转导或者转染导入宿主细胞,使其携带的遗传物质元件在宿主细胞中获得表达。一种载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽,包括由如本文所述的蛋白、融合蛋白、分离的核酸分子等(例如,crispr转录物,如核酸转录物、蛋白质、或酶)。一种载体可以含有多种控制表达的元件,包括但不限于,启动子序列、转录起始序列、增强子序列、选择元件及报告基因。另外,载体还可含有复制起始位点。236、一种类型的载体是“质粒”,其是指其中可以例如通过标准分子克隆技术插入另外的dna片段的环状双链dna环。237、另一种类型的载体是病毒载体,其中病毒衍生的dna或rna序列存在于用于包装病毒(例如,逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到一种宿主细胞中的病毒携带的多核苷酸。某些载体(例如,具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。238、其他载体(例如,非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中,并且由此与该宿主基因组一起复制。而且,某些载体能够指导它们可操作连接的基因的表达。这样的载体在此被称为“表达载体”。239、宿主细胞240、如本文中所使用的,术语“宿主细胞”是指,可用于导入载体的细胞,其包括但不限于,如大肠杆菌或枯草菌等的原核细胞,如微生物细胞、真菌细胞、动物细胞和植物细胞的真核细胞。241、本领域技术人员将理解,表达载体的设计可取决于诸如待转化的宿主细胞的选择、所希望的表达水平等因素。242、调控元件243、如本文中所使用的,术语“调控元件”旨在包括启动子、增强子、内部核糖体进入位点(ires)、和其他表达控制元件(例如转录终止信号,如多聚腺苷酸化信号和多聚u序列),其详细描述可参考戈德尔(goeddel),《基因表达技术:酶学方法》(gene expressiontechnology:methods in enzymology)185,学术出版社(academic press),圣地亚哥(sandiego),加利福尼亚州(1990)。在某些情况下,调控元件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如,组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达,所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。在某些情况下,调控元件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达,该方式可以是或者可以不是组织或细胞类型特异性的。在某些情况下,术语“调控元件”涵盖的是增强子元件,如wpre;cmv增强子;在htlv-i的ltr中的r-u5’片段( (mol.cell.biol.,第8(1)卷,第466-472页,1988);sv40增强子;以及在兔β-珠蛋白的外显子2与3之间的内含子序列(proc.natl.acad.sci.usa.,第78(3)卷,第1527-31页,1981)。244、启动子245、如本文中所使用的,术语“启动子”具有本领域技术人员公知的含义,其是指一段位于基因的上游能启动下游基因表达的非编码核苷酸序列。组成型(constitutive)启动子是这样的核苷酸序列:当其与编码或者限定基因产物的多核苷酸可操作地相连时,在细胞的大多数或者所有生理条件下,其导致细胞中基因产物的产生。诱导型启动子是这样的核苷酸序列,当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当对应于所述启动子的诱导物在细胞中存在时,其导致所述基因产物在细胞内产生。组织特异性启动子是这样的核苷酸序列:当可操作地与编码或者限定基因产物的多核苷酸相连时,基本上只有当细胞是该启动子对应的组织类型的细胞时,其才导致在细胞中产生基因产物。246、nls247、“核定位信号”或“核定位序列”(nls)是对蛋白质“加标签”以通过核转运导入细胞核的氨基酸序列,即,具有nls的蛋白质被转运至细胞核。典型地,nls包含暴露在蛋白质表面的带正电荷的lys或arg残基。示例性核定位序列包括但不限于来自以下的nls:sv40大t抗原,egl-13,c-myc以及tus蛋白。在一些实施例中,该nls包含pkkkrkv(seq id no.8)序列。在一些实施例中,该nls包含avkrpaatkkagqakkkkld(seq id no.9)序列。在一些实施例中,该nls包含paakrvkld(seq id no.10)序列。在一些实施例中,该nls包含msrrrkanptklsenakklakeven(seq id no.11)序列。在一些实施例中,该nls包含klkikrpvk(seq id no.12)序列。其他核定位序列包括但不限于hnrnp a1的酸性m9结构域、酵母转录抑制子matα2中的序列kipik和py-nls。248、可操作地连接249、如本文中所使用的,术语“可操作地连接”旨在表示感兴趣的核苷酸序列以一种允许该核苷酸序列的表达的方式被连接至该一种或多种调控元件(例如,处于一种体外转录/翻译系统中或当该载体被引入到宿主细胞中时,处于该宿主细胞中)。250、互补性251、如本文中所使用的,术语“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如,沃森-克里克碱基配对)的残基的百分比(例如,10个之中有5、6、7、8、9、10个即为50%、60%、70%、80%、90%、和100%互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、或100%的互补程度,或者是指在严格条件下杂交的两个核酸。252、严格条件253、如本文中所使用的,对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的,并且取决于许多因素而变化。一般而言,该序列越长,则该序列特异性地杂交到其靶序列上的温度就越高。254、杂交255、术语“杂交”或“互补的”或“基本上互补的”是指核酸(例如rna、dna)包含使其能够非共价结合的核苷酸序列,即以序列特异性,反平行的方式(即核酸特异性结合互补核酸)与另一核酸形成碱基对和/或g/u碱基对,“退火”或“杂交”。256、杂交需要两个核酸含有互补序列,尽管碱基之间可能存在错配。两个核酸之间杂交的合适条件取决于核酸的长度和互补程度,这是本领域公知的变量。典型地,可杂交核酸的长度为8个核苷酸或更多(例如,10个核苷酸或更多,12个核苷酸或更多,15个核苷酸或更多,20个核苷酸或更多,22个核苷酸或更多,25个核苷酸或更多,或30个核苷酸或更多)。257、应当理解,多核苷酸的序列不需要与其靶核酸的序列100%互补以特异性杂交。多核苷酸可包含60%或更高,65%或更高,70%或更高,75%或更高,80%或更高,85%或更高,90%或更高,95%或更高,98%或更高,99%或更高,99.5%或更高,或与其杂交的靶核酸序列中的靶区域的序列互补性为100%。258、靶序列与grna的杂交代表靶序列和grna的核酸序列至少60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或100%的可以杂交,形成复合物;或者代表靶序列和grna的核酸序列至少有12个、15个、16个、17个、18个、19个、20个、21个、22个或更多个碱基可以互补配对,杂交形成复合物。259、表达260、如本文中所使用的,术语“表达”是指,藉此从dna模板转录成多核苷酸(如转录成mrna或其他rna转录物)的过程和/或转录的mrna随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组dna,表达可以包括真核细胞中mrna的剪接。261、接头262、如本文中所使用的,术语“接头”是指,由多个氨基酸残基通过肽键连接形成的线性多肽。本发明的接头可以为人工合成的氨基酸序列,或天然存在的多肽序列,例如具有铰链区功能的多肽。此类接头多肽是本领域众所周知的(参见例如,holliger, p.等人(1993)proc. natl. acad. sci. usa 90 :6444-6448 ;poljak, r. j.等人(1994) structure2:1121-1123)。263、治疗264、如本文中所使用的,术语“治疗”是指,治疗或治愈病症,延缓病症的症状的发作,和/或延缓病症的发展。265、受试者266、如本文中所使用的,术语“受试者”包括但不限于各种动物、植物和微生物。267、动物268、例如哺乳动物,例如牛科动物、马科动物、羊科动物、猪科动物、犬科动物、猫科动物、兔科动物、啮齿类动物(例如,小鼠或大鼠)、非人灵长类动物(例如,猕猴或食蟹猴)或人。在某些实施方式中,所述受试者(例如人)患有病症(例如,疾病相关基因缺陷所导致的病症)。269、植物270、术语“植物”应理解为能够进行光合作用的任何分化的多细胞生物,在包括处于任何成熟或发育阶段的作物植物,特别是单子叶或双子叶植物,蔬菜作物,包括洋蓟、球茎甘蓝、芝麻菜、韭葱、芦笋、莴苣(例如,结球莴苣、叶莴苣、长叶莴苣)、小白菜(bok choy)、黄肉芋、瓜类(例如,甜瓜、西瓜、克伦肖瓜(crenshaw)、白兰瓜、罗马甜瓜)、油菜作物(例如,球芽甘蓝、卷心菜、花椰菜、西兰花、羽衣甘蓝、无头甘蓝、大白菜、小白菜)、刺菜蓟、胡萝卜、洋白菜(napa)、秋葵、洋葱、芹菜、欧芹、鹰嘴豆、欧洲防风草、菊苣、胡椒、马铃薯、葫芦(例如,西葫芦、黄瓜、小西葫芦、倭瓜、南瓜)、萝卜、干球洋葱、芜菁甘蓝、紫茄子(也称为茄子)、婆罗门参、苣菜、青葱、苦苣、大蒜、菠菜、绿洋葱、倭瓜、绿叶菜类(greens)、甜菜(糖甜菜和饲料甜菜)、甘薯、唐莴苣、山葵、西红柿、芜菁、以及香辛料;水果和/或蔓生作物,如苹果、杏、樱桃、油桃、桃、梨、李子、西梅、樱桃、榅桲、杏仁、栗子、榛子、山核桃、开心果、胡桃、柑橘、蓝莓、博伊增莓(boysenberry)、小红莓、穗醋栗、罗甘莓、树莓、草莓、黑莓、葡萄、鳄梨、香蕉、猕猴桃、柿子、石榴、菠萝、热带水果、梨果、瓜、芒果、木瓜、以及荔枝;大田作物,如三叶草、苜蓿、月见草、白芒花、玉米/玉蜀黍(饲料玉米、甜玉米、爆米花)、啤酒花、荷荷芭、花生、稻、红花、小粒谷类作物(大麦、燕麦、黑麦、小麦等)、高粱、烟草、木棉、豆科植物(豆类、小扁豆、豌豆、大豆)、含油植物(油菜、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆、落花生)、拟南芥属、纤维植物(棉花、亚麻、黄麻)、樟科(肉桂、莰酮)、或一种植物如咖啡、甘蔗、茶、以及天然橡胶植物;和/或花坛植物,如开花植物、仙人掌、肉质植物和/或观赏植物,以及树如森林(阔叶树和常绿树,如针叶树)、果树、观赏树、以及结坚果的树(nut-bearingtree)、以及灌木和其他苗木。271、发明的有益效果272、本发明通过工程化改造,在v型cas蛋白中融合hnh结构域,提高了v型cas蛋白的活性,具有广泛的应用前景。273、下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1