利用CRISPR/Cas基因靶向控制生物体表型的制作方法

文档序号:21937623发布日期:2020-08-21 15:12阅读:613来源:国知局
利用CRISPR/Cas基因靶向控制生物体表型的制作方法

相关申请的交叉引用

本申请要求2017年12月22日提交的美国临时专利申请号62/610,040的优先权,其完整内容通过引用方式纳入本文。



背景技术:

基因组编辑技术可用于以序列特异性方式在核酸序列中引入修饰。一种这样的技术利用规律成簇的间隔短回文重复序列(crispr)(其为包含短重复核苷酸序列的原核dna的区段)和crispr相关(cas)核酸酶,其在核酸中诱导双链断裂(dsb)。通过利用靶向基因组基因座的指导核酸,cas核酸酶能在靶基因组基因座处特异性地诱导dsb。在核酸中诱导dsb之后,可以通过非同源末端连接(nhej)、替代末端连接(a-ej)和/或同源性定向修复(hdr)进行dsb的修复。crispr/cas系统可用于引入破坏核酸表达的修饰和/或修复核酸序列中现有的突变以恢复核酸的表达。



技术实现要素:

一方面,提供了经工程改造的细胞和微生物。在一些实施方式中,经工程改造的细胞包含:

待被靶向以用于基因改变的内源基因或基因组区域,或含有操作性地连接至启动子的表型编码序列的一个或多个异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;和

(a)含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列和含有靶向所述内源基因、基因组区域或表型编码序列的指导rna(grna)的异源多核苷酸序列,和/或(b)含有操作性连接至λ红(lambdared)编码多核苷酸的启动子的异源多核苷酸序列。

在一些实施方式中,包含待被靶向以用于基因改变的内源基因或基因组区域,或含有操作性地连接至启动子的表型编码序列的一个或多个异源多核苷酸序列的经工程改造的细胞包含含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列和含有靶向所述内源基因、基因组区域或表型编码序列的grna的异源多核苷酸序列。在一些实施方式中,包含待被靶向以用于基因改变的内源基因或基因组区域,或含有操作性地连接至启动子的表型编码序列的一个或多个异源多核苷酸序列的经工程改造的细胞包含含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列。在一些实施方式中,包含待被靶向以用于基因改变的内源基因或基因组区域,或含有操作性地连接至启动子的表型编码序列的一个或多个异源多核苷酸序列的经工程改造的细胞包含含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列、含有靶向所述内源基因、基因组区域或表型编码序列的grna的异源多核苷酸序列和含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列。在一些实施方式中,经工程改造的细胞还包含供体dna序列。

在一些实施方式中,经工程改造的细胞包含待被靶向以用于基因改变的内源基因或基因组区域。在一些实施方式中,待被靶向以用于基因改变的内源基因或基因组区域是功能基因或基因组区域(例如,能产生可检测表型),且供体dna序列是破坏功能基因或基因组区域的序列。在一些实施方式中,待被靶向以用于基因改变的内源基因或基因组区域是功能基因或基因组区域(例如,能产生可检测表型),且供体dna序列是用不同的功能基因或不同的功能基因组区域替代所述功能基因或基因组区域的序列。在一些实施方式中,待被靶向的内源基因或基因组区域是被破坏的基因或基因组区域(例如,阻止可检测表型表达的破坏),并且其中,供体dna序列是使所述基因或基因组区域功能恢复的序列。

在一些实施方式中,经工程改造的细胞包含含有操作性连接至启动子的表型编码序列的一个或多个异源多核苷酸序列。在一些实施方式中,经工程改造的细胞包含:

含有操作性连接至启动子的表型编码序列的一个或多个异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达。

在一些实施方式中,经工程改造的细胞包含编码功能性蛋白质的表型编码序列,所述功能性蛋白质具有可检测表型(例如,编码功能性发色蛋白的发色编码序列)。在一些实施方式中,经工程改造的细胞包含表型编码序列,所述表型编码序列在蛋白质编码序列或启动子区域中包含工程性破坏,其阻止可检测表型的表达(例如,阻止发色蛋白表达的发色基因断裂)。

在一些实施方式中,经工程改造的细胞包含:

含有操作性连接至启动子的表型编码序列的一个或多个异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;

含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列;

含有靶向表型编码序列的指导rna(grna)的异源多核苷酸序列。

在一些实施方式中,所述细胞包含:

包含表型编码序列的异源多核苷酸序列,所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;

含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列;

含有靶向发色编码序列的grna的异源多核苷酸序列;和

含有同源供体dna序列的异源多核苷酸序列。

在一些实施方式中,表型编码序列编码具有可检测表型的功能性蛋白质(例如功能发色或荧光蛋白,例如珊瑚荧光蛋白)。在一些实施方式中,表型编码序列在蛋白质编码序列或启动子区域中包含工程性破坏,其阻止可检测表型的表达(例如,断裂的基因,例如断裂的发色基因或断裂的荧光蛋白(例如珊瑚荧光蛋白))。在一些实施方式中,细胞包含异源多核苷酸序列,所述异源多核苷酸序列含有同源供体dna序列(例如,用于修复断裂基因)。

在一些实施方式中,经工程改造的细胞包含:

含有操作性连接至第一启动子的第一表型编码序列的第一异源多核苷酸序列,其中所述第一表型编码序列(i)编码具有第一可检测表型的功能性第一蛋白质,或(ii)在第一蛋白质的编码序列中包含工程性破坏,其阻止第一可检测表型的表达;

含有操作性连接至第二启动子的第二表型编码序列的第二异源多核苷酸序列,其中所述第二表型编码序列(i)编码具有第二可检测表型的功能性第二蛋白质,或(ii)在第二蛋白质的编码序列中包含工程性破坏,其阻止第二可检测表型的表达;

含有操作性连接至cas核酸酶(例如,cas9)编码多核苷酸的第三启动子的第三异源多核苷酸序列;

含有靶向第一表型编码序列的第一grna的第四异源多核苷酸序列;和

含有靶向第二表型编码序列的第二grna的第五异源多核苷酸序列。

在一些实施方式中,可检测表型(例如,第一可检测表型和第二可检测表型各自)是可检测的颜色、荧光、气味、酶活性或形态。在一些实施方式中,可检测表型(例如,第一可检测表型和第二可检测表型各自)是致死性的。在一些实施方式中,可检测表型(例如,第一可检测表型和第二可检测表型各自)是抗生素抗性的获得或丧失。

在一些实施方式中,可检测表型是可检测荧光,并且其中,表型编码序列(i)编码功能性荧光蛋白,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止荧光蛋白的表达。在一些实施方式中,荧光蛋白是珊瑚荧光蛋白。

在一些实施方式中,第一可检测表型和第二可检测表型是可检测颜色和/或荧光,和;

第一发色编码序列(i)编码功能性第一发色蛋白,或(ii)在第一发色蛋白的编码序列中包含工程性破坏,其阻止第一发色蛋白的表达;和

第二发色编码序列(i)编码功能性第二发色蛋白,或(ii)在第二发色蛋白的编码序列中包含工程性破坏,其阻止第二发色蛋白的表达。

在一些实施方式中,本文公开的一个或多个多核苷酸序列(例如,含有表型编码序列的多核苷酸序列,含有操作性连接至cas核酸酶编码多核苷酸的启动子的多核苷酸序列,或含有靶向表型编码序列的grna的多核苷酸序列)还包含营养缺陷型、抗生素或其它选择性标志物。在一些实施方式中,第一多核苷酸序列,第二多核苷酸序列,第三多核苷酸序列,第四多核苷酸序列或第五多核苷酸序列中的一个或多个还包含营养缺陷型、抗生素或其它选择性标志物。在其中第四异源多核苷酸序列包含靶向第一表型编码序列的第一grna且第五多核苷酸序列包含靶向第二表型编码序列的第二grna的一些实施方式中,第四多核苷酸序列还包含第一营养缺陷型、抗生素或其它选择性标志物,并且第五多核苷酸序列还包含第二营养缺陷型、抗生素或其它选择性标志物,其中第一营养缺陷型、抗生素或其它选择性标志物与第二营养缺陷型、抗生素或其它选择性标志物是不同的标志物。在一些实施方式中,第一营养缺陷型、抗生素或其它选择性标志物和第二营养缺陷型、抗生素或其它选择性标志物是相同的标志物。

在一些实施方式中,细胞包含异源多核苷酸,所述异源多核苷酸包含同源供体多核苷酸序列,其用作修复cas切割位点的模板。在一些实施方式中,同源供体多核苷酸序列是双链dna(dsdna)或单链dna(ssdna)。在一些实施方式中,包含同源供体dna序列的异源多核苷酸序列包含阻止发色蛋白表达的突变。在一些实施方式中,包含同源供体dna序列的异源多核苷酸序列包含将发色蛋白的表达从第一颜色改变为第二颜色的突变。在一些实施方式中,包含同源供体dna序列的异源多核苷酸序列包含修复含工程性破坏(例如,断裂的基因)的多核苷酸序列并恢复功能性发色蛋白的表达的突变。在一些实施方式中,本文公开的一个或多个多核苷酸序列(例如,含有表型编码序列的多核苷酸序列,含有操作性连接至cas核酸酶编码多核苷酸的启动子的多核苷酸序列,或含有靶向表型编码序列的grna的多核苷酸序列)还包含同源供体多核苷酸序列,例如双链dna(dsdna)或单链dna(ssdna)供体序列。在一些实施方式中,第四多核苷酸序列和/或第五多核苷酸序列还包含同源供体多核苷酸序列。在其中第四异源多核苷酸序列含有靶向第一表型编码序列的第一grna且第五多核苷酸序列含有靶向第二表型编码序列的第二grna的一些实施方式中,第四多核苷酸序列和/或第五多核苷酸序列还包含同源供体多核苷酸序列。

在一些实施方式中,含有靶向内源基因、基因组区域或表型编码序列(例如发色编码序列)的grna的多核苷酸序列操作性地连接至含有操作性连接至cas核酸酶编码多核苷酸的启动子的多核苷酸序列。在一些实施方式中,含有靶向内源基因、基因组区域或表型编码序列(例如发色编码序列)的grna的多核苷酸序列和含有同源供体dna序列的多核苷酸序列操作性地连接至含有操作性连接至cas核酸酶编码多核苷酸的启动子的多核苷酸序列。

在一些实施方式中,启动子是组成型活性启动子。在一些实施方式中,第一启动子、第二启动子和第三启动子中的一个或多个是组成型活性启动子。在一些实施方式中,第一启动子和第二启动子均为组成型活性启动子。

在一些实施方式中,启动子是诱导型启动子。在一些实施方式中,第一启动子、第二启动子和第三启动子中的一个或多个是诱导型启动子。在一些实施方式中,第一启动子和第二启动子均为诱导型启动子。在一些实施方式中,所述诱导型启动子是半乳糖诱导型启动子。在一些实施方式中,所述诱导型启动子是阿拉伯糖诱导型启动子。在一些实施方式中,所述诱导型启动子是鼠李糖诱导型启动子。

在一些实施方式中,cas核酸酶是cas9核酸酶。在一些实施方式中,cas核酸酶是来自酿脓链球菌(streptococcuspyogenes)的cas9核酸酶(spcas9核酸酶)。在一些实施方式中,cas核酸酶的编码多核苷酸经优化以在细胞(例如,真核或原核细胞)中表达。在一些实施方式中,cas核酸酶是经密码子优化以在酵母细胞中表达的cas9核酸酶。在一些实施方式中,cas核酸酶是经密码子优化以在大肠杆菌细胞中表达的cas9核酸酶。在一些实施方式中,cas核酸酶是cas9的去稳定化变体。

在一些实施方式中,细胞包含含有编码功能性发色蛋白(例如,gfp蛋白)的发色编码序列的异源多核苷酸序列,并且cas核酸酶的表达和cas切割的修复产生具有阻止发色蛋白表达(例如,阻止gfp表达)的突变的异源多核苷酸序列。在一些实施方式中,细胞包含含有编码功能性发色蛋白(例如,gfp蛋白)的发色编码序列的异源多核苷酸序列,并且cas核酸酶的表达和cas切割的修复产生具有导致第二发色蛋白(例如,yfp或bfp而不是gfp)的表达的一个或多个突变的异源多核苷酸序列。

在一些实施方式中,第一发色编码序列编码功能性第一发色蛋白和/或第二发色编码序列编码功能性第二发色蛋白。在一些实施方式中,第一编码序列在第一发色蛋白编码序列中包含工程性破坏,其阻止第一发色蛋白或其启动子的表达,和/或,第二编码序列在第二发色蛋白编码序列中包含工程性破坏,其阻止第二发色蛋白或其启动子的表达。在一些实施方式中,第一发色编码序列编码功能性第一发色蛋白,且第二编码序列在第二发色蛋白的编码序列中包含工程性破坏,其阻止第二发色蛋白或其启动子的表达。在一些实施方式中,第一编码序列在第一发色蛋白的编码序列中包含工程性破坏,其阻止第一发色蛋白或其启动子的表达,且第二发色编码序列编码功能性第二发色蛋白。

在一些实施方式中,一个或多个多核苷酸序列在相同的表达盒或质粒中。在一些实施方式中,至少两个多核苷酸序列在分开的表达盒或质粒中。在一些实施方式中,第一多核苷酸序列和第二多核苷酸在相同的表达盒或质粒中。在一些实施方式中,第一多核苷酸序列和第二多核苷酸在分开的表达盒或质粒中。在一些实施方式中,第一多核苷酸序列、第二多核苷酸序列、第三多核苷酸序列、第四多核苷酸序列和第五多核苷酸序列中的两个或更多个(例如,两个、三个、四个或五个)在相同的表达盒或质粒中。在一些实施方式中,第一多核苷酸序列、第二多核苷酸序列、第三多核苷酸序列、第四多核苷酸序列和第五多核苷酸序列各自在分开的表达盒或质粒中。

在一些实施方式中,细胞是微生物细胞。在一些实施方式中,细胞是原核细胞。在一些实施方式中,细胞是选自下组的原核细胞:细菌和古细菌。在一些实施方式中,细胞是原生细胞。在一些实施方式中,细胞是真核细胞。在一些实施方式中,真核细胞是酵母细胞,真菌细胞,哺乳动物细胞,昆虫细胞,线虫细胞或植物细胞。在一些实施方式中,细胞是细菌细胞,例如大肠杆菌(ecoli)细胞。在一些实施方式中,细胞是线虫细胞,例如秀丽隐杆线虫(c.elegans)。

在一些实施方式中,第三多核苷酸序列包含编码cas9核酸酶的多核苷酸,其来自酿脓链球菌或经密码子优化以在表达它的特定细胞或生物体中表达。在一些实施方式中,细胞是酵母细胞,并且第三多核苷酸序列包含编码cas9核酸酶的多核苷酸,其经密码子优化以在酵母中表达。

在另一方面,提供了包含本文所述的经工程改造的细胞的经工程改造的微生物。在一些实施方式中,经工程改造的生物体是真核的(例如,经工程改造的酵母或经工程改造的植物)。在一些实施方式中,经工程改造的生物体是原核的(例如,经工程改造的细菌)。在一些实施方式中,经工程改造的生物体为冻干形式。

在另一方面,提供了试剂盒。在一些实施方式中,试剂盒包含本文所述的经工程改造的细胞或经工程改造的微生物,并且还包含一种或多种试剂,所述试剂包括培养基,选择性培养基,培养基补充剂,固体平板培养基,板,管,环或其它塑料制品。在一些实施方式中,试剂盒还包含一个或多个异源多核苷酸序列,其包含同源供体dna(例如,双链dna或单链dna)。在一些实施方式中,试剂盒还包含用于诱导型启动子的诱导表达的诱导剂(例如,对于半乳糖诱导型启动子,半乳糖,对于阿拉伯糖诱导型启动子,阿拉伯糖,对于鼠李糖诱导型启动子,鼠李糖)。在一些实施方式中,试剂盒还包含用于检测经工程改造的细胞或经工程改造的微生物的基因型的一种或多种试剂,其中所述一种或多种试剂包括dna聚合酶,引物,dntp,限制酶或缓冲液。在一些实施方式中,试剂盒还包含用于营养缺陷型、抗生素或本文所述的其它选择性标志物的一种或多种反选择剂或选择剂。

在一些实施方式中,试剂盒包含经工程改造的细胞或生物体,其包含一个或多个异源多核苷酸序列,所述异源多核苷酸序列包含可操作性连接至启动子的表型编码序列,其中,所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;并且还包含以下一种或多种:含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列、含有靶向表型编码序列的grna的异源多核苷酸序列,和含有同源供体dna序列的异源多核苷酸序列。

在另一方面,提供了改变细胞中基因表达的方法。在一些实施方式中,该方法包括:

培养本文所述的经工程改造的细胞或经工程改造的微生物,以形成经工程改造的细胞或经工程改造的微生物的群体,其中所述培养在导致cas核酸酶在至少一种经工程改造的细胞或一种经工程改造的微生物中表达的条件下进行,其中cas核酸酶切割表型编码序列;

由此改变至少一种经工程改造的细胞或一种经工程改造的微生物中的基因表达。

在一些实施方式中,启动子操作性连接至cas核酸酶的编码多核苷酸,是诱导型启动子,并且所述培养在诱导剂的存在下进行,以诱导cas核酸酶在至少一种经工程改造的细胞中的表达。在一些实施方式中,启动子是半乳糖诱导型启动子,且诱导剂是半乳糖。在一些实施方式中,启动子是阿拉伯糖诱导型启动子,且诱导剂是阿拉伯糖。在一些实施方式中,启动子是鼠李糖诱导型启动子,而诱导剂是鼠李糖。

在一些实施方式中,改变基因表达的方法包括:

培养本文所述的经工程改造的细胞或经工程改造的微生物,以形成经工程改造的细胞的群,其中所述培养在致使λ红在至少一种经工程改造的细胞中表达的条件下进行,其中λ红催化供体dna序列在该经工程改造的细胞中的内源基因、基因组区域或表型编码序列处的同源重组;

由此改变至少一种经工程改造的细胞中的基因表达。

在一些实施方式中,λ红在诱导型启动子的控制下,并且其中,培养在至少一种经工程改造的细胞中于诱导剂的存在下进行以诱导λ红表达。在一些实施方式中,启动子是半乳糖诱导型启动子,且诱导剂是半乳糖。在一些实施方式中,启动子是阿拉伯糖诱导型启动子,且诱导剂是阿拉伯糖。在一些实施方式中,启动子是鼠李糖诱导型启动子,而诱导剂是鼠李糖。

在一些实施方式中,改变基因表达的方法包括,在至少一种经工程改造的细胞中表达cas核酸酶和λ红系统。在一些实施方式中,cas核酸酶和λ红系统均在诱导型启动子的控制下。在一些实施方式中,cas核酸酶和λ红系统的表达均由相同的诱导剂诱导。在一些实施方式中,cas核酸酶和λ红系统的表达由不同的诱导剂诱导。

在一些实施方式中,在培养步骤之前,所述方法包括用本文公开的一种或多种异源多核苷酸序列转化或转染细胞以产生经工程改造的细胞。在一些实施方式中,转化包括化学转化,电穿孔转化或碳化硅晶须转化。

在一些实施方式中,该方法还包括筛选经工程改造的细胞的群,以鉴定与培养步骤之前该经工程改造的细胞的表型相比表现出表型变化的至少一种经工程改造的细胞。

在一些实施方式中,经工程改造的细胞或微生物包含含有编码功能性发色蛋白的发色编码序列的异源性多核苷酸序列、编码cas核酸酶的异源多核苷酸、含有靶向发色编码序列的grna的异源性多核苷酸序列,和含有同源供体dna序列的异源性多核苷酸序列,其含阻止发色蛋白表达的突变,并且,所述方法包括:在致使grna在至少一个经工程改造的细胞中表达的条件下培养经工程改造的细胞的群;和,筛选经工程改造的细胞的群,以鉴定不表达发色蛋白的至少一种经工程改造的细胞。

在一些实施方式中,经工程改造的细胞或微生物包含含有编码功能性发色蛋白的发色编码序列的异源性多核苷酸序列、编码cas核酸酶的异源多核苷酸、含有靶向发色编码序列的grna的异源性多核苷酸序列,和含有同源供体dna序列的异源性多核苷酸序列,其含将发色蛋白的表达从第一颜色改为第二颜色的突变,并且,所述方法包括:在致使grna在至少一种经工程改造的细胞中表达的条件下培养经工程改造的细胞的群;和,筛选经工程改造的细胞的群,以鉴定表达第二颜色的至少一种经工程改造的细胞。

在一些实施方式中,经工程改造的细胞或微生物包含含有发色编码序列的异源多核苷酸序列,所述发色编码序列在发色蛋白的编码序列中包含工程性破坏,其阻止功能性发色蛋白的表达、编码cas核酸酶的异源性多核苷酸、含有靶向发色编码序列的grna的异源性多核苷酸序列,和含有用于修复所述工程性破坏的同源供体dna序列的异源性多核苷酸序列,并且,所述方法还包括:在致使grna在至少一个经工程改造的细胞中表达的条件下培养经工程改造的细胞的群;和,筛选经工程改造的细胞的群,以鉴定表达所述功能性发色蛋白的至少一种经工程改造的细胞。

在一些实施方式中,经工程改造的细胞或微生物包含:还包含第一营养缺陷型、抗生素或其它选择性标志物的第四多核苷酸序列,和还包含第二营养缺陷型、抗生素或其它选择性标志物的第五多核苷酸序列,其中第一营养缺陷型、抗生素或其它选择性标志物和第二营养缺陷型、抗生素或其它选择性标志物是不同的标志物,并且所述方法还包括:

在针对第一营养缺陷型、抗生素或其它选择性标志物的反选择剂或选择剂的存在下培养经工程改造的细胞或经工程改造的微生物的群;和

选择不表达第四多核苷酸序列的经工程改造的细胞或经工程改造的微生物;

由此阻止第一grna的表达并阻止第一表型编码序列的改变。

在一些实施方式中,经工程改造的细胞或微生物包含:还包含第一营养缺陷型、抗生素或其它选择性标志物的第四多核苷酸序列,和还包含第二营养缺陷型、抗生素或其它选择性标志物的第五多核苷酸序列,其中第一营养缺陷型、抗生素或其它选择性标志物和第二营养缺陷型、抗生素或其它选择性标志物是不同的标志物,并且所述方法还包括:

在针对第二营养缺陷型、抗生素或其它选择性标志物的反选择剂或选择剂的存在下培养经工程改造的细胞或经工程改造的微生物的群;和

选择不表达第五多核苷酸序列的经工程改造的细胞或经工程改造的微生物;

由此阻止第一grna的表达并阻止第二表型编码序列的改变。

在一些实施方式中,(i)第一表型编码序列编码具有第一可检测表型的功能性第一蛋白质,并且cas9核酸酶切割第一表型编码序列并破坏第一蛋白质的表达;和/或(ii)第二表型编码序列编码具有第二可检测表型的功能性第二蛋白质,并且cas9核酸酶切割第二表型编码序列并破坏第二蛋白质的表达。

在一些实施方式中,(i)第一表型序列在编码第一蛋白的序列中包含工程性破坏,其防止第一可检测表型的表达,并且所述方法包括用cas9核酸酶在工程性破坏处切割第一编码序列和修复第一编码序列以允许第一蛋白质的表达;和/或(ii)第二表型序列在编码第二蛋白质的序列中包含工程性破坏,其防止第二可检测表型的表达,并且所述方法包括用cas9核酸酶在工程性破坏处切割第二编码序列和修复第二编码序列以允许第二蛋白质的表达。在这两种情况下,工程性改变由同源修复供体序列中的序列确定。

在一些实施方式中,(i)第一表型编码序列编码具有第一可检测表型的功能性第一蛋白质,并且cas9核酸酶切割第一表型编码序列并破坏第一蛋白质的表达;并且,第二表型序列在编码第二蛋白质的序列中包含工程性破坏,其阻止第二可检测表型的表达,并且所述方法包括,用cas9核酸酶在工程性破坏处切割第二编码序列和修复第二编码序列以允许第二蛋白质的表达;或(ii)第一表型序列在编码第一蛋白质的序列中包含工程性破坏,其阻止第一可检测表型的表达,并且所述方法包括,用cas9核酸酶在工程性破坏处切割第一编码序列和修复第一编码序列以允许第一蛋白质的表达;并且第二表型编码序列编码具有第二可检测表型的功能性第二蛋白质,并且cas9核酸酶切割第二表型编码序列并破坏第二蛋白质的表达。在这两种情况下,工程性破坏由同源修复供体序列中的序列确定。

在一些实施方式中,经工程改造的细胞是选自下组的真核细胞:酵母细胞、哺乳动物细胞、昆虫细胞或植物细胞。在一些实施方式中,经工程改造的细胞是酵母细胞,并且所述细胞包含多核苷酸序列,所述多核苷酸序列包含编码cas9核酸酶的多核苷酸,其经密码子优化以在酵母中表达。

在一些实施方式中,经工程改造的细胞是原核细胞,例如,来自细菌。在一些实施方式中,经工程改造的细胞是细菌细胞(例如,大肠杆菌),并且所述细胞包含多核苷酸序列,所述多核苷酸序列包含编码cas9核酸酶的多核苷酸,其经密码子优化以在细菌中表达。在一些实施方式中,细胞包含多核苷酸序列,所述多核苷酸序列包含编码酿脓链球菌cas9核酸酶的多核苷酸。

在一些实施方式中,经工程改造的生物体是微生物,例如细菌。在一些实施方式中,经工程改造的生物体是真核生物,例如酵母、线虫或植物。

在另一方面,提供了用于在实验室操作中训练个体的模块化系统和方法,和实验室器具用于基因表达和基因编辑的应用。在一些实施方式中,模块化系统包括:

(a)用于在细胞或生物体中表达可检测表型和/或表达断裂基因的模块,其包含本文公开的经工程改造的细胞或经工程改造的微生物,还包含用于培养、转染和/或转化细胞或生物体的一种或多种试剂;

(b)用于改变细胞或生物体中可检测表型的表达和/或修复断裂基因的模块,其包含用于在细胞或生物体中表达cas核酸酶、表达grna或防止grna表达的一种或多种试剂;

(c)用于分析细胞或生物体的模块,其包含用于检测细胞或生物体中基因表达的改变和/或断裂基因的修复的一种或多种试剂;和

(d)说明手册,其包含各模块的使用说明。

在一些实施方式中,说明手册包括数字材料,视频,电子介质,电子存储介质和/或光学介质。

在一些实施方式中,模块化系统还包括评估模块,其包括用于评估用户在利用模块(a)、(b)和(c)以及说明手册(d)中的表现或技能的材料。

在一些实施方式中,模块化系统包括:

(a)用于改变细胞或生物体中的内源基因或基因组区域的表达(例如破坏或恢复细胞或生物体的基因组中的内源基因或基因组区域的功能)的模块,其包含如本文所公开的经工程改造的细胞或经工程改造的微生物,用于表达cas核酸酶的一种或多种试剂,和用于靶向内源基因或基因组区域的一种或多种试剂,并且还包含用于培养、转染和/或转化细胞或生物体的一种或多种试剂;

(b)用于分析细胞或生物体的模块,其包含用于检测基因表达改变(例如,内源基因或基因组区域功能的破坏或内源基因或基因组区域功能的恢复)的一种或多种试剂;和

(c)说明手册,其包含各模块的使用说明。

在一些实施方式中,模块化系统还包括评估模块,其包括用于评估用户在利用模块(a)和(b)以及说明手册(c)中的表现或技能的材料。

附图说明

图1的示意图描述了一种生物体,其包含多种颜色基因(a、b和c)和靶向敲除各颜色基因所需的基因(grnaa、b和c,分别靶向颜色基因a、b和c,和cas9核酸酶)。

图2.酵母形式1。该酵母菌株包含组成型启动子控制下编码发色蛋白a的基因,组成型启动子控制下编码发色蛋白b的基因,半乳糖诱导型启动子控制下编码cas9的酵母优化基因,包含用于靶向发色蛋白a的grnaa和营养缺陷型标志物ura3的质粒,和包含用于靶向发色蛋白b的grnab和营养缺陷型标志物lys2的质粒。

图3.酵母形式2。该酵母菌株包含组成型启动子控制下编码发色蛋白a的基因,天然启动子控制下编码ade2基因的基因,半乳糖诱导型启动子控制下编码cas9的酵母优化基因,包含用于靶向发色蛋白a的grnaa和营养缺陷型标志物ura3的质粒,和包含用于靶向ade2的grnab和营养型标志lys2的质粒。

图4.酵母形式3。该酵母菌株包含组成型启动子控制下编码发色蛋白yemrfp的基因,天然启动子控制下编码ade2基因的基因,半乳糖诱导型启动子控制下编码cas9的酵母优化基因,包含用于靶向yemrfp的grnaa和营养缺陷型标志物ura3的质粒,和包含用于靶向ade2的grnab和营养型标志物lys2的质粒。

图5.酵母形式4。该酵母菌株包含组成型启动子控制下编码发色蛋白yemrfp的基因,天然启动子控制下编码具有造成移码且阻止ade2表达的工程性破坏的ade2基因的基因,半乳糖诱导型启动子控制下编码cas9的酵母优化基因,包含用于靶向yemrfp的grnaa和营养缺陷型标志物ura3的质粒,和包含用于靶向具有工程性破坏的ade2的grnab和营养缺陷型标志物lys2的质粒。

图6.细菌形式1。细菌在组成型或诱导型启动子的控制下表达发色或荧光蛋白(gfp)。可将在诱导型启动子控制下表达针对gfp的grna且表达cas9的附加型质粒转化进入该细菌。注意,如果gfp和cas9表达均依赖于诱导型启动子,则它们可能不会使用相同的诱导方法。在不存在针对cas9启动子的诱导剂的情况下,不会发生基因编辑事件,并且细菌是发色蛋白(gfp)表达所产生的颜色(在存在诱导剂的情况下,如果将诱导型启动子用于gfp的话)。在存在cas9启动子特异性诱导剂的情况下,诱导cas9表达,并将grna纳入cas9中,由此靶向gfp。cas9切割的修复由转化质粒中所含的hr供体dna指导,允许阻止gfp表达的特定突变的整合,从而使细菌不再表达gfp,并且细菌菌落呈白色。

图7.细菌形式2。细菌在组成型或诱导型启动子的控制下表达发色或荧光蛋白(gfp)。可将在诱导型启动子控制下表达针对gfp的grna且表达cas9的附加型质粒转化进入该细菌。注意,如果gfp和cas9表达均依赖于诱导型启动子,则它们可能不会使用相同的诱导方法。在不存在针对cas9启动子的诱导剂的情况下,不会发生基因编辑事件,并且细菌是发色蛋白(gfp)表达所产生的颜色(在存在诱导剂的情况下,如果将诱导型启动子用于gfp的话)。在存在cas9启动子特异性诱导剂的情况下,诱导cas9表达,并将grna纳入cas9中,由此靶向gfp。cas9切割的修复由转化质粒中所含的hr供体dna指导,允许将gfp转化为bfp或yfp的特定突变的整合,从而使细菌表达bfp或yfp,且细菌菌落的颜色分别呈蓝色或黄色。

图8.细菌形式3。细菌在组成型或诱导型启动子的控制下表达发色或荧光蛋白(gfp)。可将在诱导型启动子控制下表达针对gfp的grna且表达cas9的附加型质粒转化进入该细菌。注意,如果gfp和cas9表达均依赖于诱导型启动子,则它们可能不会使用相同的诱导方法。在不存在针对cas9启动子的诱导剂的情况下,不会发生基因编辑事件,并且细菌是发色蛋白(gfp)表达所产生的颜色(在存在诱导剂的情况下,如果将诱导型启动子用于gfp的话)。在存在cas9启动子特异性诱导剂的情况下,诱导cas9表达,并将grna纳入cas9中,由此靶向gfp。cas9切割的修复由与质粒共同转化的ssdnahr供体指导,允许阻止gfp表达的特定突变的整合,从而使细菌不再表达gfp,并且细菌菌落呈白色。

图9.细菌形式4。细菌在组成型或诱导型启动子的控制下表达发色或荧光蛋白(gfp)。可将在诱导型启动子(例如阿拉伯糖诱导型启动子或鼠李糖诱导型启动子)控制下表达cas9且表达针对gfp的grna的附加型质粒转化到细菌中。注意,如果gfp和cas9表达均依赖于诱导型启动子,则它们可能不会使用相同的诱导方法。在不存在针对cas9启动子的诱导剂的情况下,不会发生基因编辑事件,并且细菌是发色蛋白(gfp)表达所产生的颜色(在存在诱导剂的情况下,如果将诱导型启动子用于gfp的话)。在存在cas9启动子特异性诱导剂的情况下,诱导cas9表达,并将grna纳入cas9中,由此靶向gfp。cas9切割的修复由与质粒共同转化的ssdnahr供体指导,允许将gfp转化为bfp或yfp的特定突变的整合,从而使细菌表达bfp或yfp,且细菌菌落的颜色分别呈蓝色或黄色。

图10.细菌形式5。细菌在组成型或诱导型启动子的控制下表达非功能性发色或荧光蛋白(gfp)。可将在诱导型启动子控制下表达grna且表达cas9的附加型质粒转化进入该细菌。注意,如果gfp和cas9表达均依赖于诱导型启动子,则它们可能不会使用相同的诱导方法。在不存在针对cas9启动子的诱导剂的情况下,不会发生基因编辑事件,并且细菌是白色,即便在诱导剂存在下也是如此(如果采用对于gfp的诱导型启动子的话)。在存在cas9启动子特异性诱导剂的情况下,诱导cas9表达,并将grna纳入cas9中,由此靶向gfp。cas9切割的修复由转化质粒中所含的hr供体dna指导,允许恢复gfp表达的特定突变的纳入,从而细菌将表达功能性gfp,且细菌菌落呈绿色。

图11.细菌形式6。细菌在组成型或诱导型启动子的控制下表达非功能性发色或荧光蛋白(gfp)。可将在诱导型启动子控制下表达grna且表达cas9的附加型质粒转化进入该细菌。注意,如果gfp和cas9表达均依赖于诱导型启动子,则它们可能不会使用相同的诱导方法。在不存在针对cas9启动子的诱导剂的情况下,不会发生基因编辑事件,并且细菌是白色,即便在诱导剂存在下也是如此(如果采用对于gfp的诱导型启动子的话)。在存在cas9启动子特异性诱导剂的情况下,诱导cas9表达,并将grna纳入cas9中,由此靶向gfp。cas9切割的修复由与质粒共同转化的ssdnahr供体指导,允许恢复gfp表达的特定突变的纳入,从而细菌将表达功能性gfp,且细菌菌落呈绿色。

图12.细菌形式7。对细菌进行遗传改变,使其具有插入细菌基因组的诱导型cas9和诱导型λ红表达盒。这两个诱导型启动子都具有loxp或loxp变体序列,其在启动子之后直接侧接转录终止子序列,其阻断转录并阻止诱导的蛋白质的表达。经遗传改变的细菌用单个质粒转化,所述质粒包含缺乏自身启动子的抗生素抗性盒(arc),其5'和3'端侧接带有内源性靶基因(lacz)的短部分,识别被靶向基因的sgrna(“sgrna-lz”),组成型表达的cre重组酶盒和靶向质粒内自身区域的“自毁”sgrna,称为不可修复的dsb位点(“sgrna-质粒1”)。cre重组酶表达后,两个转录终止序列都将被切除,留下单个loxp或loxp变体“疤痕(scar)”,而转录和翻译将不会受阻。组成型活性cas9盒将起始cas9表达。质粒被破坏;只有整合了arc的细菌才能在该抗生素的选择下存活。在crispr-cas和λ红的诱导之后,重组修复将允许细胞表达抗生素抗性蛋白并失去正常的靶向基因表达(lacz);这些细菌将在存在抗生素的情况下存活,并会失去正常靶向基因的功能(例如,lacz表达的丧失)。

图13.细菌形式8。细菌经过遗传改变以具有诱导型cas9和ku和ligd表达盒。另外,将内源基因替换为感兴趣的特定表型(例如发色蛋白orf)的开放阅读框(orf)。这些改变的细菌将在内源基因激活后表达发色蛋白。经遗传改变的细菌用单个质粒转化,所述单个质粒具有驱动sgrna表达的盒,所述sgrna识别发色蛋白。诱导后,dsb发生在发色蛋白内。与未改变的大肠杆菌不同,改变的细菌能够进行基于非同源末端连接(nhej)的dsb断裂修复。ku和ligd蛋白将识别dsb,并重连两个断裂末端。

图14.细菌形式9。细菌经过遗传改变以具有诱导型crispr活性和诱导型λ红表达盒。在诱导crispr和λ红重组后,缺乏其自身的启动子的orf(例如,编码抗生素抗性盒(arc))(其5'和3'端侧接带有源自内源靶基因(lacz)的同源臂)将替代内源基因的部分。这导致内源基因的功能丧失,换而是天然的或改变的内源启动子驱动新型orf的表达,使细菌具有与内源基因功能丧失同时发生的功能获得。将对存活的细菌进行筛选,并根据显示表型丧失和获得的菌落比例进行分类。

图15a-15c.cas9介导的细菌中氯霉素(cam)抗性的整合。(a)用grna/供体dna或水(对照)电穿孔的cam+菌落数量。(b)用于检测野生型lacz和cas9指导的cam抗性盒向lacz中整合的pcr方案。(c)从筛选的13个菌落中得到的pcr结果。箭头指示cam抗性盒已成功整合。

图16a-16d.进行蓝/白筛选,以检测插入lacz阅读框的crispr和λ红依赖性终止密码子。(a-c)用于蓝/白筛选的代表性细菌板。用含有以下表达盒的质粒转化细菌:cas9盒但无grna表达盒(a,对照转化1),grna表达盒但无cas9表达盒(b,对照转化2)或grna表达盒和cas9表达盒(c,crispr转化)。在没有crispr活性的情况中,100%的细胞是蓝色的,显示正常β-半乳糖苷酶活性。当crispr活化时,约350个菌落中只有43个是蓝色的,而350个菌落中约88%是白色的,显示缺乏β-半乳糖苷酶活性。(d)结果表格。

图.17a-17d。进行pcr筛选和测序,以检测插入lacz阅读框中的crispr和λ红依赖性终止密码子。(a)pcr基因分型策略。野生型和突变型大肠杆菌(fwt1和fwt2)产生了686个碱基对的扩增子。lacz突变型大肠杆菌(fwt1和rmut1)产生550个碱基对的扩增子。(b)来自基因分型pcr的dna凝胶图像。泳道1-20来自对照转化2。泳道21-39来自crispr转化。野生型条带是白色箭头。仅突变条带是黑色箭头。(c)pcr基因分型的结果表格。(d)代表性桑格(sanger)测序,其采用野生型lacz基因座序列和来自野生型大肠杆菌和插入了提早终止密码子的大肠杆菌的痕量。

具体实施方式

i.导言

本文提供了用于使用crispr/cas系统改变细胞和/或生物体(例如微生物)中的基因表达的组合物、试剂盒和方法。如本文所述,在一些实施方式中,可以使用包含用于在细胞或生物体中产生可检测表型的蛋白质的编码序列的多核苷酸来观察由crispr/cas活性导致的细胞或生物体(例如,微生物,例如酵母)中基因表达的控制,所述蛋白质例如是发色和/或荧光蛋白、调节气味的蛋白质、调节形态的蛋白质、对抗生素具有抗性的蛋白质或产生可检测的酶加工产物的酶。在一些实施方式中,使用包含发色和/或荧光蛋白的编码序列的多核苷酸来观察细胞或生物体中基因表达的控制。在一些实施方式中,使用crispr/cas系统靶向内源基因或基因组靶标以进行改变。通过使用诱导型启动子控制crispr/cas系统的表达,可容易地检测归因于基因破坏和修复的细胞或生物体的表型(例如颜色)变化。一方面,本公开内容提供了用于有或没有λ红重组的crispr/cas系统的组合物、试剂盒和方法。

本文还提供了用于使用λ红重组,有或没有crispr/cas系统,以改变细胞和/或生物体(例如微生物)中的基因表达的组合物、试剂盒和方法。如本文所述,λ红可单独用于靶向和替代基因组dna内的区域,尽管λ红重组在没有来自cas9-sgrna功能性单元的定向核酸酶活性的情况下效率较低。因此,当与crispr/cas结合使用时,λ红重组的成功率可量化地更高。因此,一方面,当使用crispr/cas系统(对比其不存在的情况)时,本文提供的组合物、试剂盒和方法可用于基因靶向的比较分析。

ii.定义

除非另有说明,本文所用的所有科技术语具有本发明所属领域普通技术人员通常所理解的含义。通常,本文所用的命名和下述细胞培养、分子遗传学、有机化学和核酸化学以及杂交中的实验室步骤均为本领域熟知和常用的。核酸合成采用标准技术。按照本领域和各种通用参考文献所述的常规方法进行这些技术和步骤(通常参见,sambrook等,《分子克隆:实验室手册》(molecularcloning:alaboratorymanual),第2版(1989)冷泉港实验室出版社(coldspringharborlaboratorypress),纽约冷泉港(coldspringharbor,n.y.),其通过引用纳入本文),全文中提供这些参考文献。

如本文所用,术语“cas核酸酶”或“cas”是指crispr相关蛋白,一种在核酸中引入双链断裂的rna指导的核酸酶。在一些实施方式中,cas核酸酶是crispr相关蛋白9(“cas9核酸酶”或“cas9”)。

本文所用的术语“指导rna”或“grna”是指将核酸酶(例如,cas核酸酶)引导至待切割的靶核酸位点的核酸序列。通常,grna包含用于将核酸酶与“靶向”序列相结合的“支架”序列,所述靶向序列限定待切割的靶核酸位点(例如,基因组dna位点)。在一些实施方式中,grna包含具有约20个核苷酸的长度的靶向序列。

如本文所用,术语“λ红”或“λ红系统”是指衍生自λ红噬菌体的λ红重组系统。λ红重组系统具有三个组分:λ核酸外切酶(“exo”),β蛋白(“beta”)和γ蛋白(“gam”)。在一些实施方式中,“编码λ红的多核苷酸”是指编码λ红系统的exo、β和gam组分的多核苷酸。

如本文所用,术语“核酸”和“多核苷酸”可互换地指单链、双链或多链形式的dna、rna及其聚合物。该术语包括但不限于单链、双链或多链dna或rna,基因组dna,cdna,dna-rna杂合体或包含嘌呤和/或嘧啶碱基或其它天然化学修饰、生化修饰的、非天然的、合成的或衍生的核苷酸碱基的聚合物。在一些实施方式中,核酸可包含dna、rna及其类似物的混合物。除非特别限定,否则该术语涵盖含有天然核苷酸的已知类似物的核酸,其具有与参比核酸相似的结合特性,并以与天然存在的核苷酸相似的方式代谢。除非另外说明,一特定核酸序列还隐含包括其保守性修饰变体(例如简并密码子取代)、等位基因、直向同源物、单核苷酸多态性(snp)和互补序列,以及明示序列。具体而言,可通过产生一个或多个选定(或所有)密码子的第三个位置被混合碱基和/或脱氧肌苷残基取代的序列来获得简并密码子取代形式(batzer等,nucleicacidres.19:5081(1991);ohtsuka等,j.biol.chem.260:2605-2608(1985);和rossolini等,mol.cell.probes8:91-98(1994))。术语核酸可与基因、cdna和基因编码的mrna互换使用。

如果采用以下序列比较算法之一或通过手工比对和目测检查测量时,当就比较窗口或指定区域上的最大对应性而言,这些序列有特定百分数的核苷酸相同(例如在特定区域上至少60%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同),则序列彼此间“基本相同”。

为了序列比较,一般将一个序列用作与测试序列比较的参比序列。当使用序列比较算法时,将测试和参比序列输入计算机,如果需要,指定子序列坐标,并指定序列算法程序参数。可使用默认的程序参数,或者可指定另外的参数。然后,序列比较算法基于程序参数计算测试序列相对于参比序列的序列相同性百分比。

如本文所用,“比较窗口”包括对于选自20至600,通常约50至约200,更通常约100至约150个的多个邻接位置中的任何一个的区段的参考,其中,在两个序列最佳比对后,可以将序列与连续位置的相同数目的参比序列进行比较。比对序列的比较方法是本领域熟知的。可进行最优序列比对以作比较,例如,通过smith和waterman的局部同源性算法,adv.appl.math.2:482(1981);通过needleman和wunsch的同源性比对算法,j.mol.biol.48:443(1970);通过pearson和lipman的相似性搜索法,proc.nat’l.acad.sci.usa85:2444(1988);通过计算机执行这些算法(阿克赛勒里公司(accelrys)的威斯康星遗传学软件包(wisconsingeneticssoftwarepackage)中的gap、bestfit、fasta和tfasta),或通过手工比对和目测。

适合确定序列相同性和序列相似性百分数的算法分别是blast和blast2.0算法,分别描述于altschul等(nuc.acidsres.25:3389-402,1977)和altschul等(j.mol.biol.215:403-10,1990)。进行blast分析的软件可从国家生物技术信息中心(nationalcenterforbiotechnologyinformation)公开获得(http://ncbi.nlm.nih.gov/)。此算法包括:首先通过鉴定查询序列中长度为w的短字来鉴定高评分序列对(hsp),与数据库序列中长度相同的字比对时它们能匹配或满足一些正值的阈值评分t。t称为相邻字评分阈值(altschul等,同上)。这些初始相邻字命中(wordhit)用作启动搜索的种子,以便找到含有它们的较长hsp。只要可提高累积比对评分,该字命中在两个方向上沿各序列延伸。出现以下情况时中止字命中在各个方向上的延伸:累积比对评分比其最大获得值降低x;由于一个或多个负评分残基比对的累积,累积评分变为零或零以下;或者达到任一序列的末端。blast算法参数w、t和x确定该比对的灵敏度和速度。blast程序使用的默认值为:字长(w)11,blosum62评分矩阵(参见henikoff和henikoff,proc.natl.acad.sci.usa89:10915(1989))比对(b)50,期望值(e)10,m=5,n=-4,以及比较两条链。

blast算法也对两条序列间的相似性进行统计学分析(参见例如,karlin和altschul,proc.nat’l.acad.sci.usa90:5873-5787(1993))。blast算法提供的一种相似性度量是最小概率和(p(n)),它表明两条核苷酸或氨基酸序列之间偶尔发生匹配的概率。例如,如果测试核酸与参比核酸比较时的最小概率和小于约0.2,更优选小于约0.01,最优选小于约0.001,那么认为该核酸与参比序列相似。

术语“启动子”指定位于转录起始上游和/或下游且涉及识别和结合rna聚合酶和其它蛋白质以起始转录的区域或序列。

如果多核苷酸序列起源于外来物种,或者,如果来自相同物种但在其原始形式上具有修饰,则其相对于生物体或第二多核苷酸序列而言是“异源”的。例如,当述及启动子操作性连接至异源编码序列时,是指该编码序列衍生自一种物种,而启动子序列衍生自另一种不同物种;或者,如果两者均衍生自同一物种,则编码序列与启动子不天然相关联(例如,是同一物种中的不同基因)。

术语“操作性连接”指核酸表达控制序列(如启动子,或转录因子结合位点阵列)和第二核酸序列之间的功能连接,其中所述表达控制序列指导所述核酸响应所述第二序列的转录。

术语“表达盒”是指当导入宿主细胞时,分别导致rna或多肽的转录和/或翻译的核酸构建体。

“载体”指多核苷酸,其独立于宿主染色体时能够在宿主生物体中复制。优选的载体包括质粒且通常具有复制起始点。载体可包括,例如,转录和翻译终止子、转录和翻译起始序列和用于调控特定核酸表达的启动子。

iii.经工程改造的细胞和生物体

一方面,提供了经工程改造的生物体和经工程改造的细胞,其包含一种或多种表型编码序列,cas核酸酶和对应于表型编码序列的指导rna(grna)。在一些实施方式中,生物体和经工程改造的细胞包含两种或更多种表型编码序列,并且还包含分别对应于这两种或更多种表型编码序列各自的单独的grna。当提及多核苷酸序列,启动子和营养缺陷型、抗生素或其它选择性标志物时,术语“第一”,“第二”,“第三”,“第四”和“第五”仅仅是为了更清楚地区分这些多核苷酸序列,启动子和营养缺陷型、抗生素或其它选择性标志物,无意指示顺序。

在一些实施方式中,经工程改造的生物体(例如经工程改造的微生物或经工程改造的真核生物)或经工程改造的细胞(例如经工程改造的微生物细胞或经工程改造的真核细胞)包含:

待被靶向以用于基因改变的内源基因或基因组区域,其中所述内源基因或基因组区域是具有可检测表型的功能性内源基因或基因组区域或包含阻止可检测表型表达的破坏;或包含操作性地连接至启动子的表型编码序列的一个或多个异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;

含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列;和

含有靶向内源基因、基因组区域或表型编码序列的指导rna(grna)的异源多核苷酸序列。

在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含:

待被靶向以用于基因改变的内源基因或基因组区域,其中所述内源基因或基因组区域是具有可检测表型的功能性内源基因或基因组区域或包含阻止可检测表型表达的破坏;或包含操作性地连接至启动子的表型编码序列的异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;

含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列;和

含有同源供体dna序列的异源多核苷酸序列。

在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含:

待被靶向以用于基因改变的内源基因或基因组区域,其中所述内源基因或基因组区域是具有可检测表型的功能性内源基因或基因组区域或包含阻止可检测表型表达的破坏;或包含操作性地连接至启动子的表型编码序列的异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;

含有操作性连接至cas核酸酶(例如,cas9核酸酶)编码多核苷酸的启动子的异源多核苷酸序列;

含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列;

含有靶向内源基因、基因组区域或发色编码序列的grna的异源多核苷酸序列;和

含有同源供体dna序列的异源多核苷酸序列。

在其中经工程改造的细胞既包含编码cas核酸酶的多核苷酸又包含编码λ红的多核苷酸的一些实施方式中,cas核酸酶多核苷酸序列和λ红多核苷酸序列操作性地连接。

在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含:

含有编码功能性发色蛋白的发色编码序列的异源多核苷酸序列;

含有操作性连接至cas核酸酶(例如,cas9核酸酶)编码多核苷酸的启动子的异源多核苷酸序列;

含有靶向内源基因、基因组区域或发色编码序列的grna的异源多核苷酸序列;和

含有同源供体dna序列的异源多核苷酸序列。

在一些实施方式中,表型是发色表型,例如颜色或荧光。在一些实施方式中,发色编码序列编码非荧光颜色蛋白。在一些实施方式中,发色编码序列编码荧光蛋白,例如绿色荧光蛋白(gfp),蓝色荧光蛋白(bfp),红色荧光蛋白(rfp),橙色荧光蛋白(ofp),黄色荧光蛋白(yfp),青色荧光蛋白(cfp),珊瑚荧光蛋白,及其衍生物或变体。在一些实施方式中,发色编码序列编码荧光蛋白,并且同源供体dna包含阻止该荧光蛋白表达的突变。在一些实施方式中,发色编码序列编码荧光蛋白,并且同源供体dna包含将该荧光蛋白的表达从第一颜色改变为第二颜色(例如,从gfp到bfp或yfp)的突变。在一些实施方式中,发色编码序列包含工程性破坏,其阻止可检测蛋白质(例如,“被破坏的”荧光蛋白)的表达,并且同源供体dna包含使该荧光蛋白表达恢复的突变。

在一些实施方式中,经工程改造的生物体(例如经工程改造的微生物或经工程改造的真核生物)或经工程改造的细胞(例如经工程改造的微生物细胞或经工程改造的真核细胞)包含:

含有操作性连接至第一启动子的第一表型编码序列的第一异源多核苷酸序列,其中所述第一表型编码序列(i)编码具有第一可检测表型的功能性第一蛋白质,或(ii)在第一蛋白质的编码序列中包含功能性破坏,其阻止第一可检测表型的表达;

含有操作性连接至第二启动子的第二表型编码序列的第二异源多核苷酸序列,其中所述第二表型编码序列(i)编码具有第二可检测表型的功能性第二蛋白质,或(ii)在第二蛋白质的编码序列中包含功能性破坏,其阻止第二可检测表型的表达;

含有操作性连接至cas核酸酶(例如,cas9核酸酶)编码多核苷酸的第三启动子的第三异源多核苷酸序列;

含有靶向第一发色编码序列的第一grna的第四异源多核苷酸序列;和

含有靶向第二发色编码序列的第二grna的第五异源多核苷酸序列。

在一些实施方式中,所述可检测表型或一个或多个可检测表型各自(例如,第一可检测表型和第二可检测表型各自)是可检测的颜色,荧光,气味,酶活性,抗生素抗性(获得或丧失),形态或致死性。在一些实施方式中,第一可检测表型和第二可检测表型都是同一类别的表型(例如,两者都是可检测的颜色和/或荧光;两者都是可检测的气味;两者都是可检测的酶活性;两者都是抗生素抗性(获得或丧失);或两者都是可检测的形态)。在一些实施方式中,第一可检测表型是与第二可检测表型不同的表型类别(例如,一个是可检测的颜色和/或荧光,而一个是可检测的气味)。

在一些实施方式中,第一可检测表型和第二可检测表型是可检测的颜色和/或荧光,并且经工程改造的生物体(例如经工程改造的微生物或经工程改造的真核生物)或经工程改造的细胞(例如经工程改造的微生物细胞或经工程改造的真核细胞)包含:

含有操作性连接至第一启动子的第一发色编码序列的第一异源多核苷酸序列,其中所述第一发色编码序列(i)编码功能性第一发色蛋白质或(ii)在第一发色蛋白质的编码序列中包含工程性破坏,其阻止第一发色蛋白质的表达;

含有操作性连接至第二启动子的第二发色编码序列的第二异源多核苷酸序列,其中所述第二发色编码序列(i)编码功能性第二发色蛋白质或(ii)在第二发色蛋白质的编码序列中包含工程性破坏,其阻止第二发色蛋白质的表达;

含有操作性连接至cas9核酸酶编码多核苷酸的第三启动子的第三异源多核苷酸序列;

含有靶向第一发色编码序列的第一指导rna(grna)的第四异源多核苷酸序列;和

含有靶向第二发色编码序列的第二grna的第五异源多核苷酸序列。

在一些实施方式中,经工程改造的生物体是微生物。在一些实施方式中,经工程改造的生物体是真核生物。在一些实施方式中,经工程改造的生物体是经工程改造的植物。

在一些实施方式中,经工程改造的细胞是获自本文所述的微生物,原核生物或真核生物的细胞。在一些实施方式中,经工程改造的细胞是微生物细胞,例如来自细菌,植原体,病毒,类病毒,原生动物,立克次体或真菌的细胞。在一些实施方式中,经工程改造的细胞是原核细胞,例如,来自细菌。在一些实施方式中,经工程改造的细胞是真核细胞,例如酵母细胞,植物细胞,昆虫细胞或哺乳动物细胞。

细胞与生物体

在一些实施方式中,经工程改造的细胞是来自微生物,例如细菌,植原体,病毒,类病毒,原生动物,立克次体或真菌的细胞。在一些实施方式中,经工程改造的细胞是真核细胞。在一些实施方式中,经工程改造的细胞是原核细胞。

在一些实施方式中,经工程改造的细胞是真菌的,例如来自酵母,霉菌或丝状真菌的物种。在一些实施方式中,所述细胞是来自丝状真菌的真核细胞,例如,绵霉属(achlya)、支顶孢属(acremonium)、曲霉属(aspergillus)、短梗霉属(aureobasidium)、烟管霉属(bjerkandera)、拟蜡菌属(ceriporiopsis)、头孢霉属(cephalosporium)、金孢属(chrysosporium)、旋孢腔菌属(cochliobolus)、棒囊壳属(corynascus)、丛赤壳属(cryphonectria)、隐球菌属(cryptococcus)、鬼伞属(coprinus)、革盖菌属(coriolus)、色二孢属(diplodia)、恩多蒂斯属(endothis),镰胞菌(fusarium)、赤霉菌属(gibberella)、粘帚霉属(gliocladium)、腐质霉属(humicola)、肉座菌属(hypocrea)、毁丝霉属(myceliophthora)、毛霉菌属(mucor)、脉孢菌属(neurospora)、青霉菌属(penicillium)、柄孢壳菌属(podospora)、射脉菌属(phlebia)、瘤胃壶菌属(piromyces)、梨孢属(pyricularia)、根毛霉属(rhizomucor)、根霉属菌(rhizopus)、裂褶菌属(schizophyllum)、柱顶孢霉属(scytalidium)、孢子丝菌属(sporotrichum)、踝节菌属(talaromyces)、热子囊菌属(thermoascus)、梭孢壳属(thielavia)、栓菌属(trametes)、弯颈霉属(tolypocladium)、木霉属(trichoderma)、轮枝孢属(verticillium)或草菇属(volvariella)的物种。在一些实施方式中,所述细胞是来自酵母的真核细胞,例如,假丝酵母属(candida)、汉逊酵母属(hansenula)、酵母属(saccharomyces)、裂殖酵母属(schizosaccharomyces)、毕赤酵母属(pichia)、克鲁维酵母属(kluyveromyces),或耶氏酵母属(yarrowia)的物种。在一些实施方式中,所述细胞是来自酵母属物种的真核细胞,例如,酿酒酵母(s.cerevisiae)。在一些实施方式中,所述细胞是来自裂殖酵母属物种的真核细胞,例如,粟酒裂殖酵母(s.pombe)。

在一些实施方式中,所述细胞是来自细菌的原核细胞,例如,埃希氏杆菌属(escherichia)、链霉菌属(streptomyces)、发酵单胞菌属(zymonasi)、醋杆菌属(acetobacter)、柠檬酸杆菌属(citrobacter)、集胞藻属(synechocystis)、根瘤菌属(rhizobium)、梭菌属(clostridium)、棒状杆菌属(corynebacterium)、链球菌属(streptococcus)、黄单胞菌属(xanthomonas)、乳杆菌属(lactobacillus)、乳球菌属(lactococcus)、芽孢杆菌属(bacillus)、产碱杆菌属(alcaligenes)、假单胞菌属(pseudomonas)、气单胞菌属(aeromonas)、固氮菌属(azotobacter)、丛毛单胞菌属(comamonas)、分支杆菌属(mycobacterium)、红球菌属(rhodococcus)、葡糖杆菌属(gluconobacter)、罗尔斯通菌属(ralstonia)、硫杆菌属(acidithiobacillus)、小月菌属(microlunatus)、地杆菌属(geobacter)、地芽孢杆菌属(geobacillus)、节细菌属(arthrobacter)、黄杆菌属(flavobacterium)、沙雷氏菌属(serratia)、刺糖多孢菌属(saccharopolyspora)、栖热菌属(thermus)、寡养单胞菌属(stenotrophomonas)、色素细菌属(chromobacterium)、中华根瘤菌属(sinorhizobium)、糖多孢菌属(saccharopolyspora)、土壤杆菌属(agrobacterium)、副球菌属(paracoccus),或泛菌属(pantoea)的物种。在一些实施方式中,所述细胞是来自埃希氏杆菌属物种的原核细胞,例如,大肠杆菌(e.coli)。

在一些实施方式中,所述细胞是原生生物细胞,例如,盘基网柄菌属(dictyostelium)的物种。

在一些实施方式中,所述细胞是来自植物的真核细胞,例如来自烟草(nicotiana),拟南芥(arabidopsis),开花植物或农作物(例如水果或蔬菜植物)的细胞。在一些实施方式中,细胞是来自线虫的真核细胞,例如来自秀丽隐杆线虫(c.elegans)。在一些实施方式中,细胞是来自昆虫的真核细胞,例如细胞系如s2,sf9或sf21。在一些实施方式中,细胞是来自哺乳动物的真核细胞,例如来自小鼠,大鼠,人,中国仓鼠或犬的原代细胞或细胞系的真核细胞,包括但不限于hela,cho和mdck。

在一些实施方式中,经工程改造的生物体是微生物生物体,例如细菌,植原体,病毒,类病毒,原生动物,立克次体或真菌。在一些实施方式中,经工程改造的生物体是真核的。在一些实施方式中,经工程改造的生物体是原核的。

在一些实施方式中,经工程改造的生物体是真菌生物体,即真菌界内的真核生物体。真菌可包括酵母,霉菌和丝状真菌。在一些实施方式中,真核生物体是丝状真菌,例如,绵霉属(achlya)、支顶孢属(acremonium)、曲霉属(aspergillus)、短梗霉属(aureobasidium)、烟管霉属(bjerkandera)、拟蜡菌属(ceriporiopsis)、头孢霉属(cephalosporium)、金孢属(chrysosporium)、旋孢腔菌属(cochliobolus)、棒囊壳属(corynascus)、丛赤壳属(cryphonectria)、隐球菌属(cryptococcus)、鬼伞属(coprinus)、革盖菌属(coriolus)、色二孢属(diplodia)、恩多蒂斯属(endothis),镰胞菌(fusarium)、赤霉菌属(gibberella)、粘帚霉属(gliocladium)、腐质霉属(humicola)、肉座菌属(hypocrea)、毁丝霉属(myceliophthora)、毛霉菌属(mucor)、脉孢菌属(neurospora)、青霉菌属(penicillium)、柄孢壳菌属(podospora)、射脉菌属(phlebia)、瘤胃壶菌属(piromyces)、梨孢属(pyricularia)、根毛霉属(rhizomucor)、根霉属菌(rhizopus)、裂褶菌属(schizophyllum)、柱顶孢霉属(scytalidium)、孢子丝菌属(sporotrichum)、踝节菌属(talaromyces)、热子囊菌属(thermoascus)、梭孢壳属(thielavia)、栓菌属(trametes)、弯颈霉属(tolypocladium)、木霉属(trichoderma)、轮枝孢属(verticillium)或草菇属(volvariella)的物种。在一些实施方式中,真核生物体是酵母,例如,假丝酵母属(candida)、汉逊酵母属(hansenula)、酵母属(saccharomyces)、裂殖酵母属(schizosaccharomyces)、毕赤酵母属(pichia)、克鲁维酵母属(kluyveromyces),或耶氏酵母属(yarrowia)的物种。在一些实施方式中,真核生物体是酵母(saccharomyces)的物种,例如,酿酒酵母(s.cerevisiae)。在一些实施方式中,真核生物体是裂殖酵母(saccharomyces)的物种,例如,粟酒裂殖酵母(s.pombe)。

在一些实施方式中,经工程改造的生物体是细菌,例如,埃希氏杆菌属(escherichia)、链霉菌属(streptomyces)、发酵单胞菌属(zymonasi)、醋杆菌属(acetobacter)、柠檬酸杆菌属(citrobacter)、集胞藻属(synechocystis)、根瘤菌属(rhizobium)、梭菌属(clostridium)、棒状杆菌属(corynebacterium)、链球菌属(streptococcus)、黄单胞菌属(xanthomonas)、乳杆菌属(lactobacillus)、乳球菌属(lactococcus)、芽孢杆菌属(bacillus)、产碱杆菌属(alcaligenes)、假单胞菌属(pseudomonas)、气单胞菌属(aeromonas)、固氮菌属(azotobacter)、丛毛单胞菌属(comamonas)、分支杆菌属(mycobacterium)、红球菌属(rhodococcus)、葡糖杆菌属(gluconobacter)、罗尔斯通菌属(ralstonia)、硫杆菌属(acidithiobacillus)、小月菌属(microlunatus)、地杆菌属(geobacter)、地芽孢杆菌属(geobacillus)、节细菌属(arthrobacter)、黄杆菌属(flavobacterium)、沙雷氏菌属(serratia)、刺糖多孢菌属(saccharopolyspora)、栖热菌属(thermus)、寡养单胞菌属(stenotrophomonas)、色素细菌属(chromobacterium)、中华根瘤菌属(sinorhizobium)、糖多孢菌属(saccharopolyspora)、土壤杆菌属(agrobacterium)、副球菌属(paracoccus),或泛菌属(pantoea)的物种。在一些实施方式中,经工程改造的生物体是埃希氏杆菌属物种,例如,大肠杆菌。

在一些实施方式中,经工程改造的生物体是原生生物,例如,盘基网柄菌属(dictyostelium)的物种。

在一些实施方式中,经工程改造的生物体是线虫,例如秀丽隐杆线虫(c.elegans)。

在一些实施方式中,经工程改造的生物体是植物,例如单子叶植物或双子叶植物。在一些实施方式中,植物是烟草(nicotiana),拟南芥(arabidopsis),开花植物或农作物植物(例如,水果植物或蔬菜植物)。

表型编码序列

在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含一个或多个表型编码序列。在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含一个表型编码序列。在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含多个表型编码序列,例如2、3、4、5、6或更多个表型编码序列。在一些实施方式中,表型编码序列是发色编码序列。如本文所用,术语“发色(的)”涵盖颜色和荧光两者作为可检测表型。在一些实施方式中,表型编码序列是气味编码序列。在一些实施方式中,表型编码序列是酶活性编码序列。在一些实施方式中,表型编码序列是形态编码序列。在一些实施方式中,表型编码序列是致死性编码序列。在一些实施方式中,表型编码序列是编码获得或丧失抗生素抗性的序列。例如,在一些实施方式中,抗生素抗性表型编码序列可用于将生物体或细胞中的一种抗生素抗性替换为另一种抗生素抗性(即,同时获得和丧失功能)。

在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含多个发色编码序列,例如2、3、4、5、6或更多个发色编码序列。在一些实施方式中,发色编码序列编码荧光蛋白,例如绿色荧光蛋白(gfp),蓝色荧光蛋白(bfp),红色荧光蛋白(rfp),橙色荧光蛋白(ofp),黄色荧光蛋白(yfp),青色荧光蛋白(cfp),珊瑚荧光蛋白,萤光素酶,及其衍生物或变体。在一些实施方式中,发色编码序列编码珊瑚荧光蛋白。在一些实施方式中,发色编码序列编码发色(非荧光)蛋白。发色编码序列是市售可得的,例如荧光和发色蛋白(atum,加利福尼亚州纽瓦克市)。

在一些实施方式中,一种或多种表型编码序列编码代谢途径的一种或多种组分,其中提供酶促反应的底物导致气味的产生。作为非限制性实例,可将醇乙酰基转移酶基因atf1引入细胞(例如细菌细胞)中,并且在异戊醇的存在下,细胞代谢异戊醇以发出香蕉的味道。

在一些实施方式中,一个或多个表型编码序列编码抗生素抗性的获得或丧失。作为非限制性实例,编码第一抗生素(例如,卡那霉素)抗性的第一表型编码序列可被破坏或用编码第二抗生素(例如,壮观霉素)抗性的第二表型编码序列替代。

在一些实施方式中,一种或多种表型编码序列被优化或增强以在其中待表达该编码序列的生物体或细胞(例如本文所述的细胞或生物体)中表达。在一些实施方式中,发色编码序列在生物体中表达经优化或增强,例如,经工程改造的生物体是酵母,并且发色编码序列是酵母增强型的。经增强或优化的发色序列在本领域中有描述。参见例如,keppler-ross等,genetics,2008,179:705-710。

在一些实施方式中,一个或多个表型编码序列(例如,发色编码序列)是框内序列,并且编码功能性蛋白质(例如,功能发色蛋白)。在一些实施方式中,一个或多个表型编码序列(例如,发色编码序列)在多核苷酸序列中包含工程性破坏,其能阻止具有可检测表型的蛋白质(例如,发色蛋白)的表达。在一些实施方式中,工程性破坏是将整个开放阅读框(orf)插入现有的orf。在一些实施方式中,工程性破坏是相对于编码功能性蛋白质的序列的例如约1-约20个核苷酸的插入,例如,相对于编码功能性蛋白质的序列而言,约1-20、1-15、1-10、2-20、2-15、3-20、3-10、4-20、4-10、5-20或5-10个核苷酸。在一些实施方式中,工程性破坏是相对于编码功能性蛋白质的序列的不超过约20个核苷酸的插入,例如,相对于编码功能性蛋白质的序列而言,不超过约15个核苷酸,不超过约10个核苷酸或不超过约5个核苷酸。在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含至少一个第一表型编码序列(例如,发色编码序列),其编码功能性第一蛋白质(例如,第一发色蛋白),并且还包含至少第二表型编码序列(例如,发色编码序列),其在多核苷酸序列中包含工程性破坏,该破坏阻止第二蛋白质(例如,第二发色蛋白)的表达。

在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含一个或多个表型编码序列(例如,发色编码序列),并且还包含用于代谢途径基因的编码序列,其取决于该基因是被表达还是基因表达被阻止,导致生物体颜色改变。作为非限制性实例,在一些实施方式中,经工程改造的生物体或细胞可表达腺嘌呤生物合成途径中的基因(例如ade2或ade5)或类胡萝卜素合成途径中的基因(例如八氢番茄红素合成酶或番茄红素β环化酶)的编码序列。在一些实施方式中,腺嘌呤生物合成途径基因(例如,ade2或ade5)或类胡萝卜素合成途径的编码序列在序列中包含工程性破坏,其阻止蛋白质的表达,这进而导致生物体具有粉红色或红色。

在一些实施方式中,经工程改造的生物体或经工程改造的细胞包含一个或多个表型编码序列(例如,发色编码序列),并且还包含用于代谢途径基因的编码序列,其取决于该基因是被表达还是基因表达被阻止,导致营养需求。作为非限制性实例,在一些实施方式中,经工程改造的生物体或细胞可表达亮氨酸生物合成途径(例如leub)中的基因的编码序列。在一些实施方式中,亮氨酸生物合成途径基因(例如,leub)的编码序列在序列中包含工程性破坏,其阻止蛋白质表达,进而造成该生物体具有亮氨酸营养需求。

在一些实施方式中,改变生物体颜色的代谢途径基因(例如ade2)编码序列和/或表型编码序列(例如,发色编码序列)各自操作性地连接至启动子。在一些实施方式中,改变生物体颜色的代谢途径基因(例如,ade2)的编码序列是包含阻止该代谢途径基因的表达的工程性破坏的序列,其操作性地连接至其天然启动子。在一些实施方式中,表型编码序列(例如发色编码序列)操作性地连接至组成型(组成型活性)启动子或诱导型启动子。在一些实施方式中,启动子是组成型活性启动子。合适的组成型活性启动子包括但不限于,tyrtrna,σ70共有序列,tef1,rpl18b,rnr2,tdh3,rev1,pgk和adh1。

在一些实施方式中,包含如本文所述的表型编码序列(例如,发色编码序列)的各多核苷酸(例如,包含与诱导型启动子或组成型活性启动子操作性地连接的发色编码序列的多核苷酸)与本文公开的其它多核苷酸序列(例如,包含其它表型编码序列的多核苷酸、编码cas核酸酶的多核苷酸或编码指导rna的多核苷酸)处在不同的表达盒,表达载体或质粒中。在一些实施方式中,包含如本文所述的第一表型编码序列的第一多核苷酸与包含如本文所述的第二表型编码序列的第二多核苷酸处在相同的表达盒,载体或质粒中。在一些实施方式中,包含两个,三个,四个或更多个表型序列的两个,三个,四个或更多个多核苷酸处于同一表达盒,载体或质粒中。在一些实施方式中,包含本文所述的一个或多个表型编码序列的一个或多个多核苷酸稳定地整合在本文所述的细胞或生物体的基因组物质(例如染色体)中。

在一些实施方式中,本文所述的表达载体或质粒,经工程改造的细胞或经工程改造的生物体包含多个相同拷贝(例如,至少2、3、4、5、10、20、30、40、50、60、70,80、90、100或更多个拷贝)的表型编码序列。在一些实施方式中,本文所述的表达载体或质粒,经工程改造的细胞或经工程改造的生物体包含多个相同拷贝(例如,至少2、3、4、5、10、20、30、40、50、60、70、80、90、100或更多个拷贝)的第一表型编码序列,和多个相同拷贝(例如,至少2、3、4、5、10、20、30、40、50、60、70、80、90,100或更多个拷贝)的第二表型编码序列。

cas核酸酶

在一些实施方式中,利用cas9核酸酶在一个或多个表型编码序列(例如发色编码序列和/或代谢途径基因的编码序列)中产生双链断裂(dsb),如本文所述。在一些实施方式中,cas核酸酶是cas9核酸酶。crispr/cas系统和cas活性描述于,例如,jinek等,science,2012,337:816-821;和jinek等,elife,2013,2:e00471。简言之,cas切割dna以在由指导rna序列限定的位点生成钝dsb。然后可通过同源直接修复(hdr),非同源末端连接(nhej)或替代末端连接(a-ej)在细胞或生物体中修复dsb。在一些实施方式中,被cas(例如,cas9)靶向的编码序列编码功能性发色蛋白或功能性代谢途径蛋白,并且发色性编码序列或代谢性途径基因的编码序列的切割和修复破坏所述发色蛋白或代谢途径蛋白的表达。在一些实施方式中,被cas(例如,cas9)靶向的编码序列在序列中包含工程性破坏,其阻止功能发色蛋白或功能代谢途径蛋白的表达,并且发色编码序列或代谢途径基因的编码序列的切割和修复导致功能发色蛋白或代谢途径蛋白的表达。在一些实施方式中,被cas9靶向的编码序列编码功能性发色蛋白或功能性代谢途径蛋白,并且发色编码序列或代谢性途径基因的编码序列的切割和修复将发色蛋白的表达改变为不同的发色基因,或将代谢途径蛋白改变为不同代谢途径。

cas核酸酶,例如cas9核酸酶,可衍生自多种细菌物种中的任一种,包括但不限于:酿脓链球菌(streptococcuspyogenes)、嗜热链球菌(streptococcusthermophilus)、非典型韦荣球菌(veillonellaatypical)、具核梭杆菌(fusobacteriumnucleatum)、龈沟产线菌(filifactoralocis)、莫瑞单细菌(solobacteriummoorei)、凯氏粪球菌(coprococcuscatus)、齿垢密螺旋体(treponemadenticola)、杜氏嗜胨菌(peptoniphilusduerdenii)、米氏链型杆菌(catenibacteriummitsuokai)、变形链球菌(streptococcusmutans)、无害利斯特菌(listeriainnocua)、假中间葡萄球菌(staphylococcuspseudintermedius)、肠氨基酸球菌(acidaminococcusintestine)、齿龈欧氏菌(olsenellauli)、北原酒球菌(oenococcuskitaharae)、比菲德氏菌(bifidobacteriumbifidum)、鼠李糖乳杆菌(lactobacillusrhamnosus)、加氏乳杆菌(lactobacillusgasseri)、大芬戈尔德菌(finegoldiamagna)、运动支原体(mycoplasmamobile)、鸡败血支原体(mycoplasmagallisepticum)、绵羊肺炎支原体(mycoplasmaovipneumoniae)、犬支原体(mycoplasmacanis)、滑液囊支原体(mycoplasmasynoviae)、直肠真杆菌(eubacteriumrectale)、细长真杆菌(eubacteriumdolichum)、棒状乳杆菌亚种扭曲乳杆菌(lactobacilluscoryniformissubsp.torquens)、营养泥杆菌(ilyobacterpolytropus)、白色瘤胃球菌(ruminococcusalbus)、嗜粘蛋白艾克曼菌(akkermansiamuciniphila)、解纤维热酸菌(acidothermuscellulolyticus)、长双歧杆菌(bifidobacteriumlongum)、齿双歧杆菌(bifidobacteriumdentium)、白喉棒状杆菌(corynebacteriumdiphtheria)、小迷踪菌(elusimicrobiumminutum)、硝化裂化器菌(nitratifractorsalsuginis)、螺旋体球菌(sphaerochaetaglobus)、琥珀酸纤维杆菌亚种产琥珀酸拟杆菌(fibrobactersuccinogenessubsp.succinogenes)、脆弱拟杆菌(bacteroidesfragilis)、黄褐二氧化碳嗜纤维菌(capnocytophagaochracea)、沼泽红假单胞菌(rhodopseudomonaspalustris)、彩虹普雷沃菌(prevotellamicans)、瘤胃普雷沃氏菌(prevotellaruminicola)、柱状黄杆菌(flavobacteriumcolumnare)、少食氨基单胞菌(aminomonaspaucivorans)、深红红螺菌(rhodospirillumrubrum)、候选海洋谱尼螺杆菌(candidatuspuniceispirillummarinum)、蚯蚓蚯蚓肾杆菌(verminephrobactereiseniae)、蒲桃雷尔氏菌(ralstoniasyzygii)、芝氏沟鞭藻玫瑰杆菌(dinoroseobactershibae)、固氮螺菌(azospirillum)、汉氏硝化细菌(nitrobacterhamburgensis)、慢生根瘤菌(bradyrhizobium)、产琥珀酸沃廉菌(wolinellasuccinogenes)、雪貂螺旋杆菌(helicobactermustelae)、蜡样芽胞杆菌(bacilluscereus)、食酸铁氧化菌(acidovoraxebreus)、出血败血性巴斯德氏菌亚种多杀性巴斯德氏菌(pasteurellamultocidasubsp.multocida)、华德萨特菌(sutterellawadsworthensis)、变形杆菌(proteobacterium)、埃氏毛螺旋菌(parasutterellaexcrementihominis)、产琥珀酸沃廉氏菌(wolinellasuccinogenes)和新凶手弗朗西斯菌(francisellanovicida)。

cas9多肽序列和编码cas多肽的多核苷酸序列是本领域已知的。例如,酿脓链球菌野生型cas9多肽的氨基酸序列示于,例如,nbci序列编号np_269215,并且嗜热链球菌野生型cas9多肽的氨基酸序列示于,例如,nbci序列编号wp_011681470。在一些实施方式中,cas9核酸酶是变体,例如,具有增强的特异性的变体(例如,cas9-切口酶或dcas9-fok1)。cas9变体和工程改造与筛选cas9变体的方法在本领域中有描述。参见例如,murovec等,plantbiotechnologyjournal,2017,15:917-926;sadhu等,biorxiv,2017,doi:https://doi.org/10.1101/147637;和casini等,naturebiotechnology,2018,36:265-271。

在一些实施方式中,cas9多核苷酸序列经密码子优化以在特定细胞或生物体中表达。例如,在一些实施方式中,cas9多核苷酸序列经密码子优化以在人细胞中表达。参见,dicarlo等,nucleicacidsres,2013,41:4336-4343。在一些实施方式中,cas9多核苷酸序列经密码子优化以用于如本文所述在微生物细胞或生物体中表达,例如用于在酵母或细菌中表达。在一些实施方式中,酵母密码子优化的cas9多核苷酸序列以seqidno:1提供。在一些实施方式中,大肠杆菌密码子优化的cas9多核苷酸以seqidno:2提供。在一些实施方式中,酿脓链球菌(s.pyogenes)cas9核酸酶以seqidno:3提供。

在一些实施方式中,cas核酸酶是cas9的变体或衍生物。例如,在一些实施方式中,cas核酸酶是与本文公开的cas9核酸酶基本相同(例如,至少70、75、80、85、90或95%相同)的核酸酶。在一些实施方式中,cas核酸酶是与酿脓链球菌cas9核酸酶(例如,nbci序列编号np_269215所示的酿脓链球菌cas9核酸酶)基本相同(例如,至少70、75、80、85、90或95%相同)的核酸酶。

在一些实施方式中,cas核酸酶是cas9的去稳定化变体。去稳定化cas9核酸酶是本领域已知的。参见例如,senturk等,natcommun,2017,8:14370。

在一些实施方式中,cas核酸酶是cas-12a核酸酶(也称为cpf1)。cas-12a核酸酶是本领域已知的。参见例如,yan等,applenvironmicrobiol,2017,83(17);doi:10.1128/aem.00947-17。在一些实施方式中,cas核酸酶是cas样核酸酶。

在一些实施方式中,cas9核酸酶的编码多核苷酸操作性地连接至诱导型启动子。在一些实施方式中,诱导型启动子是可通过添加或去除诱导剂来开启和关闭的启动子。在一些实施方式中,诱导剂是分子,例如强力霉素,四环素,半乳糖,阿拉伯糖,鼠李糖,金属离子,醇或类固醇化合物。在一些实施方式中,诱导型启动子是由环境条件(例如光或温度)激活的启动子。在一些实施方式中,启动子是半乳糖诱导型启动子。在一些实施方式中,启动子是阿拉伯糖诱导型启动子。在一些实施方式中,启动子是鼠李糖诱导型启动子。在一些实施方式中,启动子是强力霉素诱导型启动子。诱导型启动子在本领域中有描述。参见例如,mumberg等,nucleicacidsres.,1994,22:5767-5768;cao等,nucleicacidsres,2016,44:e149。在一些实施方式中,cas9核酸酶的编码多核苷酸操作性地连接至组成型活性启动子,例如本文所述的组成型活性启动子。

在一些实施方式中,提供了表达盒,表达载体或质粒,其包含酵母或细菌密码子优化的cas9核酸酶多核苷酸序列。在一些实施方式中,酵母密码子优化的cas9核酸酶多核苷酸序列具有seqidno:1的序列或与seqidno:1基本相同(例如,与seqidno:1具有至少70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%同一性)的序列。在一些实施方式中,大肠杆菌密码子优化的cas9核酸酶多核苷酸序列具有seqidno:2的序列或与seqidno:2基本相同(例如,与seqidno:2具有至少70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%同一性)的序列。在一些实施方式中,提供了包含酿脓链球菌cas9核酸酶多核苷酸序列的表达盒,表达载体或质粒。在一些实施方式中,酿脓链球菌cas9核酸酶多核苷酸序列具有seqidno:3的序列或与seqidno:3基本相同(例如,与seqidno:3具有至少70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%同一性)的序列。在一些实施方式中,cas9核酸酶多核苷酸序列还包含标签(例如,flag标签,ha标签,his标签或gst标签)。在一些实施方式中,包含酵母密码子优化的cas9核酸酶多核苷酸序列的表达盒,表达载体或质粒还包含本文所述的诱导型启动子(例如,半乳糖诱导型启动子)。

在一些实施方式中,包含cas核酸酶的编码多核苷酸的多核苷酸序列还包含选择性标志物的序列,所述选择性标志物例如但不限于营养缺陷型标志物,抗生素抗性标志物或其它选择性标志物。在一些实施方式中,选择性标志物适合于细菌细胞的选择。

在一些实施方式中,包含cas核酸酶的编码多核苷酸的多核苷酸序列还包含营养缺陷型标志物的序列。在一些实施方式中,营养缺陷标志物是酵母营养缺陷标志物。营养缺陷型标志物的实例包括但不限于leu2,ura3,lys2his3,met17和trp1。

在一些实施方式中,包含cas核酸酶的编码多核苷酸的多核苷酸序列还包含抗生素抗性标志物的序列。抗生素抗性标志物的实例包括但不限于氨苄青霉素,氯霉素,卡那霉素,链霉素,四环素,大观霉素,庆大霉素和博来霉素。

在一些实施方式中,本文所述的cas9核酸酶的编码多核苷酸(例如,操作性地连接至诱导型或组成型启动子的cas9核酸酶的编码多核苷酸)与本文公开的其它多核苷酸序列(例如,包含表型编码序列的多核苷酸或编码指导rna的多核苷酸)处于不同的表达盒,表达载体或质粒中。在一些实施方式中,编码如本文所述的cas9核酸酶的多核苷酸与包含如本文所述的表型编码序列的多核苷酸处于同一表达盒,载体或质粒中。在一些实施方式中,将如本文所述的cas9核酸酶的编码多核苷酸稳定整合到本文所述的细胞或生物体的基因组物质(例如染色体)中。

λ红

在一些实施方式中,λ红重组酶系统用于进行如本文公开的靶向改变。λ红是一种基因工程工具,可实现细菌中的同源重组(“重组”)。源自λ细菌噬菌体的λ红系统具有三个组分:(1)λ核酸外切酶(exo),其消化dsdna的5'端链;(2)β蛋白(beta),其结合至ssdna并允许链退火;和(3)γ蛋白(gam),其结合至细菌recbcd酶并抑制它消化引入大肠杆菌的线性dna。λ红系统在本领域中有描述。参见例如如,pyne等,appliedandenvironmentalmicrobiology,2015,81:5103-5114。

在一些实施方式中,λ红系统(例如,λ红组分exo、beta和gam)被整合进入经工程改造的细菌细胞或生物体的基因组中。在一些实施方式中,λ红系统(例如,λ红组分exo、beta和gam)在质粒上提供。在一些实施方式中,λ红系统(例如,λ红组分exo、beta和gam)在细菌人工染色体上提供。

在一些实施方式中,λ红系统(例如λ红组分exo,beta和gam)处于组成型表达下,例如,λ红(例如λ红组分exo,beta和gam)的编码多核苷酸操作性地连接至组成型活性启动子。在一些实施方式中,λ红系统(例如λ红组分exo,beta和gam)处于诱导型表达下,例如,λ红(例如λ红组分exo,beta和gam)的编码多核苷酸操作性地连接至诱导型启动子。在一些实施方式中,诱导型启动子是可通过添加或去除诱导剂来开启和关闭的启动子。在一些实施方式中,诱导剂是分子,例如强力霉素,四环素,半乳糖,阿拉伯糖,鼠李糖,金属离子,醇或类固醇化合物。在一些实施方式中,诱导型启动子是由环境条件激活的启动子,例如光或温度。在一些实施方式中,启动子是半乳糖诱导型启动子。在一些实施方式中,启动子是阿拉伯糖诱导型启动子。在一些实施方式中,启动子是鼠李糖诱导型启动子。在一些实施方式中,启动子是强力霉素诱导型启动子。在一些实施方式中,用于λ红系统表达的诱导物与经工程改造的细胞的另一种组分的诱导物相同(例如,用于λ红系统表达的诱导物与用于诱导cas核酸酶表达的诱导物相同)。在一些实施方式中,用于λ红系统表达的诱导物与经工程改造的细胞的另一种组分的诱导物不同(例如,用于λ红系统表达的诱导物与用于诱导cas核酸酶表达的诱导物不同)。

在一些实施方式中,在有或没有crispr/cas系统的情况下使用λ红重组,来靶向和替换基因组dna内的区域。在一些实施方式中,在有或没有λ红重组的情况下使用crispr/cas系统,来靶向和替换基因组dna内的区域。在一些实施方式中,本文公开的组合物,试剂盒和方法包含cas9/crispr组分和λ红重组组分,用于与cas9/crispr联合的λ红重组,以改变细胞和/或生物体中的基因表达。在一些实施方式中,λ红系统提供于与其它基因编辑组分分开的质粒或bac上(例如,与cas9/crispr组分分开的质粒或bac上)。在一些实施方式中,λ红系统提供于与其它基因编辑组分相同的质粒或bac上(例如,与cas9/crispr组分相同的质粒或bac上)。

遗传调控元件

在一些实施方式中,cas9和/或λ红蛋白表达由遗传调控元件调控。因此,在一些实施方式中,本文公开的经工程改造的细胞和/或生物体包含含有一个或多个遗传调节元件的组分。例如,诱导型启动子通常具有一定水平的“渗漏”,即使没有诱导元件也可能使蛋白质的严格调节难以精确地调节。为了更精确地调节cas9核酸酶和λ红蛋白的表达,在一些实施方式中,诱导型启动子(例如与cas9和λ红操作性地连接的诱导型启动子)将具有紧接启动子之后侧接转录终止子序列的loxp或loxp变体序列。与诱导型启动子联合,通过紧邻启动子序列之后插入转录终止子序列来阻断cas9和λ红orf的转录。在一些实施方式中,这些终止序列侧接loxp位点或loxp变体(例如lox2722)。在一些实施方式中,这些终止子序列侧接frt位点或frt变体(例如,f5)。在一些实施方式中,cre重组酶或flp重组酶表达盒被引入经工程改造的细胞和/或生物体(例如细菌,真菌,植物或动物细胞)中,引起阻遏物元件的切除并能诱导多核苷酸序列的转录。

指导rna

在一些实施方式中,提供靶向表型编码序列或待修饰的内源基因或基因组区域的指导rna(“grna”)。一般而言,grna是与靶多核苷酸序列有足够互补性以与靶序列杂交并引导crispr复合物与靶序列的序列特异性结合的rna序列。在一些实施方式中,当使用合适的比对算法进行最佳比对时,grna序列与其相应靶序列之间的互补程度为约或超过约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更高。在一些实施方式中,为每个待修饰的表型编码序列和/或内源基因或基因组区域提供不同的grna。因此,在一些实施方式中,包含第一表型编码序列和第二表型编码序列的经工程改造的生物体或经工程改造的细胞还包含含有靶向第一表型编码序列的第一grna的多核苷酸序列和含有靶向第二表型编码序列的第二grna的多核苷酸序列。

在一些实施方式中,grna包含与表型编码序列的部分互补的、长度为至少约15、16、17、18、19、20、21、22、23、24或25个核苷酸的序列(例如,长度为约18-22个核苷酸或长度为约18-20个核苷酸),并且还包含与cas9核酸酶结合的序列。在一些实施方式中,grna包含与前间隔序列邻近基序(pam)序列相邻的表型编码序列的部分互补的核苷酸序列。在一些实施方式中,grna还包含同源供体多核苷酸序列。在一些实施方式中,同源供体多核苷酸序列包含限制性酶识别位点。在一些实施方式中,同源供体多核苷酸序列的长度为至少8个核苷酸,至少10、15、20、25、50、100、200、300、400、500、600、700、800、900或1000个核苷酸或更多。在一些实施方式中,同源供体多核苷酸序列具有两个臂,其具有与grna靶位点相邻的相同或基本相同的序列,且在两个臂之间具有特定突变。臂可以是20-1000个核苷酸或更多,并且突变可以是1-1000个核苷酸或更多。

设计靶向感兴趣序列的grna的方法和优化grna结构以提高基因组编辑效率的方法是本领域已知的。参见例如,dang等,genomebiology,2015,16:280;lee等,expphysiol,2017,doi:10.1113/ep08604。在一些实施方式中,grna可经选择以降低grna内的二级结构的程度。可通过任意合适的多核苷酸折叠算法来确定二级结构。一些方案基于计算最低吉布斯自由能。一个此类算法的示例是mfold,如zuker和stiegler所述(nucleicacidsres.9(1981),133-148)。另一示例性折叠算法是线上网站服务器rnafold,由维也纳大学的理论化学学院(institutefortheoreticalchemistryattheuniversityofvienna)开发,采用心结构预测算法(参见例如a.r.gruber等,2008,cell106(1):23-24;和pacarr和gmchurch,2009,naturebiotechnology27(12):1151-62)。

在一些实施方式中,含有靶向表型编码序列的grna的多核苷酸序列还包含异源启动子。在一些实施方式中,启动子是组成型活性启动子。合适的组成型活性启动子包括但不限于,酪氨酸rna,σ70共有序列,tef1,rpl18b,rnr2,tdh3,rev1,pgk和adh1。

在一些实施方式中,含有靶向表型编码序列的grna的多核苷酸序列还包含异源启动子。在一些实施方式中,所述启动子是诱导型的。合适的诱导型启动子包括但不限于,阿拉伯糖诱导型(pbad),半乳糖诱导型(gal1)或鼠李糖诱导型(prha)。

在一些实施方式中,含有靶向表型编码序列的grna的多核苷酸序列还包含营养缺陷型标志物的序列。在一些实施方式中,含有grna的各多核苷酸序列还包含营养缺陷型标志物的序列,其中每个grna具有不同的营养缺陷型标志物。在一些实施方式中,营养缺陷标志物是酵母营养缺陷标志物。营养缺陷型标志物的实例包括但不限于leu2,ura3,lys2his3,met17和trp1。

在一些实施方式中,含有靶向表型编码序列的grna的多核苷酸序列还包含抗生素抗性标志物的序列。在一些实施方式中,含有grna的各多核苷酸序列还包含抗生素抗性标志物的序列,其中每个grna具有不同的抗生素抗性标志物。抗生素抗性标志物的实例包括但不限于氨苄青霉素,氯霉素,卡那霉素,链霉素,四环素,大观霉素,庆大霉素和博来霉素。

在一些实施方式中,本文所述的含有grna的多核苷酸(例如,含有grna并且还含有启动子和/或营养缺陷型或抗生素标志物的多核苷酸)各自与本文公开的其它多核苷酸(例如,含有其它grna的多核苷酸,含有表型编码序列的多核苷酸或编码指导rna的多核苷酸)处于分开的表达盒,表达载体或质粒中。

用于替代性末端连接和/或非同源末端连接的组分和修饰

在一些实施方式中,细胞或生物体(例如细菌)被工程改造以表达作为非同源末端连接(nhej)系统的组分的蛋白质。例如,在一些实施方式中,细菌经遗传工程改造以表达结核分枝杆菌ku和连接酶d(ligd)蛋白。这些蛋白质允许细菌进行nhej,如malyarchuk等,dnarepair,2007,6:1413–1424所述。

例如,在一些实施方式中,表达发色蛋白或抗生素抗性标志物的野生型或遗传改变的(例如,表达ku和ligd的)细菌将具有被cas9靶向和切割的这些编码序列中的一个或多个。dsb可通过nhej被修复,这很容易出错,并且会导致被靶向的编码序列功能的丧失。在一些实施方式中,可以例如根据本文公开的方法,系统或试剂盒确定野生型与遗传改变的细菌中一种或多种编码序列的功能丧失频率的变化。

在一些实施方式中,细胞或生物体(例如细菌)被工程改造以表达或过表达作为替代性末端连接(a-ej)系统的组分的蛋白质。例如,在一些实施方式中,对细菌进行遗传工程改造以表达或以更高水平表达组分recbcd和liga。recbcd是一种核酸酶/解旋酶复合物,可解开并降解dna末端,由三种多肽组成:recb,recc和recd。liga是负责替代性末端连接的dna连接酶。替代性末端连接修复机制和组分的概述描述于,例如,chayot等,pnas,2010,1017:2141-2146。

iv.改变基因表达的方法

在另一方面,提供了改变基因表达的方法。在一些实施方式中,所述方法包括培养如本文所述的经工程改造的细胞或生物体(例如,经工程改造的细胞例如酵母细胞或经工程改造的生物体例如酵母)以形成经工程改造的细胞或生物体的群,其中培养在导致cas核酸酶在至少一种经工程改造的细胞或生物体中表达的条件下进行,其中cas核酸酶切割内源基因、基因组区域或表型编码序列;从而改变至少一种经工程改造的细胞或生物体中的基因表达。

在一些实施方式中,改变基因表达的方法包括:

提供本文所述的细胞或生物体(例如,原核或真核细胞,例如酵母细胞,哺乳动物细胞,昆虫细胞或植物细胞,或本文所述的微生物或真核生物);

用本文所述的一种或多种多核苷酸序列(例如,含有与第一启动子操作性地连接的第一表型编码序列的第一异源多核苷酸序列,含有与第二启动子操作性地连接的第二表型编码序列的第二异源多核苷酸序列,含有与cas核酸酶的编码多核苷酸操作性地连接的第三启动子的第三异源多核苷酸序列,含有靶向第一表型编码序列的第一grna的第四异源多核苷酸序列,和含有靶向第二表型编码序列的第二grna的第五异源多核苷酸序列)转化所述细胞或生物体,以表达所述多核苷酸序列;和

培养转化的细胞或生物体以形成细胞或生物体的群,其中所述培养在导致cas核酸酶在至少一种细胞或生物体中表达的条件下进行,其中cas核酸酶切割表型编码序列(例如,第一表型编码序列和第二表型编码序列中的一个或多个);由此改变至少一种细胞或生物体中的基因表达。

在其中与cas核酸酶(例如,cas9核酸酶)的编码多核苷酸操作性连接的启动子是诱导型启动子的一些实施方式中,所述培养在诱导剂的存在下进行,以诱导cas核酸酶在至少一种经工程改造的细胞或生物体中的表达。在一些实施方式中,cas核酸酶的编码多核苷酸操作性地连接至半乳糖诱导型启动子,并且所述方法包括在半乳糖存在下培养经工程改造的细胞或生物体以诱导cas的表达。在一些实施方式中,cas核酸酶的编码多核苷酸操作性地连接至阿拉伯糖诱导型启动子,并且所述方法包括在阿拉伯存在下培养经工程改造的细胞或生物体以诱导cas的表达。在一些实施方式中,cas核酸酶的编码多核苷酸操作性地连接至鼠李糖诱导型启动子,并且所述方法包括在鼠李糖存在下培养经工程改造的细胞或生物体以诱导cas的表达。

在其中含有grna的多核苷酸操作性地连接至是诱导型启动子的启动子的一些实施方式中,所述培养在诱导剂的存在下进行以诱导grna在至少一种经工程改造的细胞或生物体中表达。在一些实施方式中,含有grna的多核苷酸操作性地连接至半乳糖诱导型启动子,并且所述方法包括在半乳糖存在下培养经工程改造的细胞或生物体以诱导所述grna的表达。在一些实施方式中,含有grna的多核苷酸操作性地连接至阿拉伯糖诱导型启动子,并且所述方法包括在阿拉伯糖存在下培养经工程改造的细胞或生物体以诱导所述grna的表达。在一些实施方式中,含有grna的多核苷酸操作性地连接至鼠李糖诱导型启动子,并且所述方法包括在鼠李糖存在下培养经工程改造的细胞或生物体以诱导所述grna的表达。在一些实施方式中,含有grna的多核苷酸操作性地连接至组成型活性启动子,并且grna组成型表达。

转化细胞和生物体的手段是本领域已知的。在一些实施方式中,用本文所述的多核苷酸序列(例如,供体dna,grna,表型编码序列多核苷酸,cas核酸酶多核苷酸或表达盒,或λ红多核苷酸或表达盒)转化细胞或生物体包括通过质粒的化学转化或电穿孔法递送多核苷酸序列。在一些实施方式中,用本文所述的多核苷酸序列(例如,供体dna,grna,表型编码序列多核苷酸,cas核酸酶多核苷酸或表达盒,或λ红多核苷酸或表达盒)转化细胞或生物体包括通过碳化硅晶须进行的转化法递送多核苷酸序列。

在一些实施方式中,该方法还包括筛选经工程改造的细胞或生物体的群,以鉴定与培养步骤之前该经工程改造的细胞或生物体的表型相比表现出表型变化的至少一种经工程改造的细胞。在一些实施方式中,所述方法还包括筛选经工程改造的细胞或生物体(例如,经工程改造的微生物)的群,以鉴定与培养步骤之前的经工程改造的细胞或生物体的颜色相比显示颜色变化的至少一种经工程改造的细胞或生物体。例如,如以下实施例1中详述的,在一些实施方式中,经工程改造的细胞或生物体包含蓝色,红色和黄色基因的发色编码序列。在没有cas(例如cas9)核酸酶表达的情况下,这些发色蛋白均表达,导致细胞或生物体具有棕色表型。在存在诱导剂(例如半乳糖)的情况下,一个或多个发色编码序列因cas活性而被破坏,从而导致一种或多种发色蛋白表达的丧失,并改变了所述细胞或生物体的颜色表型。

在一些实施方式中,改变基因表达的方法包括破坏本文所述的可检测表型的表达(例如破坏发色蛋白的表达)。在一些实施方式中,改变基因表达的方法包括通过修复表型编码表达来恢复可检测表型的表达,从而允许具有可检测表型的功能性蛋白质表达。在一些实施方式中,改变基因表达的方法包括破坏一种可检测表型的表达和恢复另一种可检测表型的表达的组合。

在一些实施方式中,第一表型编码序列编码具有第一可检测表型的功能性第一蛋白质,并且cas(例如,cas9)核酸酶切割第一表型编码序列并破坏第一蛋白质的表达。在一些实施方式中,第一表型序列在第一蛋白质的编码序列中包含工程性破坏,其阻止第一可检测表型的表达,并且所述方法包括用cas(例如,cas9)核酸酶在所述工程性破坏处切割第一编码序列和修复第一编码序列以允许第一蛋白质的表达。

在一些实施方式中,第二表型编码序列编码具有第二可检测表型的功能性第二蛋白质,并且cas(例如,cas9)核酸酶切割第二表型编码序列并破坏第二蛋白质的表达。在一些实施方式中,第二表型序列在第二蛋白质的编码序列中包含工程性破坏,其阻止第二可检测表型的表达,并且所述方法包括用cas(例如,cas9)核酸酶在所述工程性破坏处切割第二编码序列和修复第二编码序列以允许第二蛋白质的表达。

在一些实施方式中,第一表型编码序列编码具有第一可检测表型的功能性第一蛋白质,并且所述方法包括用cas(例如,cas9)核酸酶切割第一表型编码序列和破坏第一蛋白质的表达;并且,第二表型序列在第二蛋白质的编码序列中包含工程性破坏,其阻止第二可检测表型的表达,并且所述方法包括用cas(例如,cas9)核酸酶在所述工程性破坏处切割第二编码序列和修复第二编码序列以允许第二蛋白质的表达。

在一些实施方式中,第一表型序列在第一蛋白质的编码序列中包含工程性破坏,其阻止第一可检测表型的表达,并且所述方法包括用cas(例如,cas9)核酸酶在工程性破坏处切割第一编码序列和修复第一编码序列以允许第一蛋白质的表达;和,第二表型编码序列编码具有第二可检测表型的功能性第二蛋白质,并且所述方法包括用cas(例如,cas9)核酸酶切割第二表型编码序列和破坏第二蛋白质的表达。

在一些实施方式中,例如,如下文实施例7或实施例9中所示,经工程改造的细胞或生物体包含编码具有可检测表型的功能性第一蛋白质(例如gfp蛋白)的表型编码序列,并且所述方法包括用cas(例如,cas9)核酸酶切割所述编码序列,由此破坏第一蛋白质的表达。工程性破坏由同源修复供体序列中的序列限定。

在一些实施方式中,例如,如实施例8或实施例10中所示,经工程改造的细胞或生物体包含编码具有可检测表型的功能性第一蛋白质(例如gfp蛋白)的表型编码序列,并且所述方法包括用cas(例如,cas9)核酸酶切割所述编码序列,和修饰第一蛋白质的表达,例如,以换而表达第二表型(例如yfp或bfp)。工程性变化由同源修复供体序列中的序列限定。

采用营养缺陷标志物的反选择

在一些实施方式中,细胞或生物体包含含有营养缺陷型标志物的一种或多种多核苷酸序列,并且所述方法还包括:在营养缺陷型标志物的一种或多种反选择剂的存在下培养经工程改造的细胞或生物体的群;和,选择不表达所述多核苷酸序列的一种或多种经工程改造的细胞或生物体,其与被反选择的营养缺陷型标志物相关联;由此阻止与被反选择的营养缺陷型标志物相关联的grna的表达,并阻止与被反选择的营养缺陷型标志物相关联的grna靶向的发色编码序列的改变。

作为非限制性实例,可通过在5-foa存在下培养生物体(例如,通过使该生物体在含5-foa的介质上生长)来反选择包含含有靶向第一发色编码序列的第一grna和ura3营养缺陷型标志物的质粒的生物体。结果是,第一grna将不被表达,并且第一发色编码序列将不被靶向用于基因编辑。可以通过在α-己二酸存在下培养生物体(例如,使生物体在含有α-己二酸的介质上生长)来反选择包含含有靶向第二发色编码序列的第二grna和lys2营养缺陷型标志物的质粒的生物体。结果是,第二grna将不被表达,并且第二发色编码序列将不被靶向用于基因编辑。

采用抗生素抗性标志物的选择

在一些实施方式中,细胞或生物体包含含有抗生素抗性标志物的一种或多种多核苷酸序列,并且所述方法还包括在用于抗生素抗性标志物的一种或多种选择剂的存在下培养经工程改造的细胞或生物体的群。

λ红重组

在一些实施方式中,改变基因表达的方法包括使用λ红系统来靶向和替代基因或基因组区域(例如,如本文所述的引入细胞或生物体的表型编码区域,或位于所述细胞或生物体的基因组内的内源基因或区域)。λ红是一种基因工程工具,可实现细菌中的同源重组(“重组”)。源自λ细菌噬菌体的λ红系统具有三个组分:(1)λ核酸外切酶(exo),其消化dsdna的5'端链;(2)β蛋白(beta),其结合至ssdna并允许链退火;和(3)γ蛋白(gam),其结合至细菌recbcd酶并抑制它消化引入大肠杆菌的线性dna。λ红系统在本领域中有描述。参见例如如,pyne等,appliedandenvironmentalmicrobiology,2015,81:5103-5114。

在一些实施方式中,改变基因表达的方法包括:

提供本文所述的细胞或生物体(例如,原核或真核细胞,例如酵母细胞,哺乳动物细胞,昆虫细胞或植物细胞,或本文所述的微生物或真核生物);

用本文所述的一种或多种多核苷酸序列(例如,含有操作性地连接至启动子的表型编码序列的异源多核苷酸序列,含有操作性地连接至λ红的编码多核苷酸的启动子的异源多核苷酸序列,和含有同源供体dna序列的异源多核苷酸序列);和

培养转化的细胞或生物体以形成细胞或生物体的群,其中所述培养在导致λ红在至少一个细胞或生物体中表达的条件下进行,其中λ红催化供体dna序列在经工程改造的细胞中的内源基因、基因组区域或表型编码序列处的同源重组;由此改变至少一种细胞或生物体中的基因表达。

在其中与λ红的编码多核苷酸操作性连接的启动子是诱导型启动子的一些实施方式中,所述培养在诱导剂的存在下进行,以诱导λ红在至少一种经工程改造的细胞或生物体中的表达。在一些实施方式中,λ红的编码多核苷酸操作性地连接至半乳糖诱导型启动子,并且所述方法包括在半乳糖存在下培养经工程改造的细胞或生物体以诱导λ红的表达。在一些实施方式中,λ红的编码多核苷酸操作性地连接至阿拉伯糖诱导型启动子,并且所述方法包括在阿拉伯糖存在下培养经工程改造的细胞或生物体以诱导λ红的表达。在一些实施方式中,λ红核酸酶的编码多核苷酸操作性地连接至鼠李糖诱导型启动子,并且所述方法包括在鼠李糖存在下培养经工程改造的细胞或生物体以诱导λ红的表达。

在一些实施方式中,本文公开的方法包括在采用或不采用crispr/cas系统的情况下使用λ红重组。在一些实施方式中,本文公开的方法包括在采用或不采用λ红重组的情况下使用crispr/cas系统。不受特定理论的限制,期望包括λ红的同源重组将增加细菌细胞中crispr/cas9介导的基因编辑的效率。因此,在一些实施方式中,用于改变基因表达的方法或模块包括在crispr/cas系统(例如,如本文中公开的cas9核酸酶和grna组分)不存在和存在的情况下使用λ红重组,并比较cas9核酸酶与grna不存在时的基因靶向速率和cas9核酸酶与grna存在时的基因靶向速率。

靶向内源或基因组靶标

在一些实施方式中,改变基因表达的方法包括靶向内源表型或基因组基因座(例如,细胞或生物体的基因或基因组区域)。例如,在一些实施方式中,将crispr/cas系统和/或λ红重组系统用于本文公开的经工程改造的细胞或生物体中,以靶向细胞或生物体的基因组中的内源基因或基因组区域。在一些实施方式中,靶向包括破坏细胞或生物体的基因组中的内源基因或基因组区域的功能,例如,通过引入包含终止密码子或阻止功能性蛋白质表达的其它序列的多核苷酸序列,或者通过引入包含用于不同基因的开放阅读框的多核苷酸序列以改变内源基因的功能。在一些实施方式中,靶向包括恢复细胞或生物体的基因组中被破坏的内源基因或基因组区域的功能,例如通过引入修复断裂的基因或基因组区域(例如启动子)或过早终止基因或基因组区域的多核苷酸序列,以恢复基因或基因组区域的天然功能。

在一些实施方式中,改变基因表达的方法包括:

提供本文所述的细胞或生物体(例如,原核或真核细胞,例如酵母细胞,哺乳动物细胞,昆虫细胞或植物细胞,或本文所述的微生物或真核生物);

用本文所述的一个或多个多核苷酸序列(例如,含有与cas核酸酶的编码多核苷酸操作性地连接的启动子的异源多核苷酸序列,含有与λ红的编码多核苷酸操作性地连接的启动子的异源多核苷酸序列,含有靶向内源基因或基因组区域的grna的一种或多种异源多核苷酸序列,和/或一个或多个供体dna),以表达所述多核苷酸序列;和

培养转化的细胞或生物体以形成细胞或生物体的群,其中所述培养在导致cas核酸酶在至少一种细胞或生物体中表达的条件下进行,其中cas核酸酶在内源基因或基因组区域处切割;由此改变至少一种细胞或生物体中的基因表达。

在一些实施方式中,改变基因表达的方法包括靶向功能性(例如,显示可检测表型,例如可检测的颜色,荧光,气味,酶活性,抗生素抗性或形态)的内源基因或基因组区域,和用供体dna序列转化所述细胞或生物体,所述供体dna序列破坏内源基因或基因组区域(例如,导致过早终止密码子的序列),由此改变细胞或生物体中的基因表达。

在一些实施方式中,改变基因表达的方法包括靶向功能性(例如,显示可检测表型,例如可检测的颜色,荧光,气味,酶活性,抗生素抗性或形态)的内源基因或基因组区域,和用供体dna序列转化所述细胞或生物体,所述供体dna序列编码不同功能(例如,包含用于不同基因的orf的序列,例如抗生素抗性盒),以用新功能替代靶向的基因或基因组区域的内源功能,由此改变细胞或生物体中的基因表达。

在一些实施方式中,改变基因表达的方法包括靶向非功能性的内源基因或基因组区域(例如,因存在导致过早终止密码子的多核苷酸序列所致),并用供体dna序列转化细胞或生物体,所述供体dna序列恢复基因或基因组区域的功能,由此改变细胞或生物体中的基因表达。

v.试剂盒

在另一方面,提供了包含本文所述的多核苷酸,表达盒,表达载体,质粒和/或细胞的试剂盒。在一些实施方式中,所述试剂盒包含:

含有操作性连接至启动子的表型编码序列的一个或多个多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;

含有操作性连接至cas核酸酶编码多核苷酸的启动子的多核苷酸序列;和

含有靶向表型编码序列的指导rna(grna)的多核苷酸序列。

在一些实施方式中,试剂盒还包含含有同源供体dna序列(例如,dsdna或ssdna供体序列)的一个或多个多核苷酸序列。

在一些实施方式中,所述试剂盒包含:

含有操作性连接至第一启动子的第一发色编码序列的第一多核苷酸序列,其中所述第一发色编码序列(i)编码功能性第一发色蛋白质或(ii)在第一发色蛋白质的编码序列中包含工程性破坏,其阻止第一发色蛋白质的表达;

含有操作性连接至第二启动子的第二发色编码序列的第二多核苷酸序列,其中所述第二发色编码序列(i)编码功能性第二发色蛋白质或(ii)在第二发色蛋白质的编码序列中包含工程性破坏,其阻止第二发色蛋白质的表达;

含有操作性连接至cas核酸酶编码多核苷酸的诱导型启动子的第三多核苷酸序列;

含有靶向第一发色编码序列的第一指导rna(grna)的第四多核苷酸序列;和

含有靶向第二发色编码序列的第二grna的第五多核苷酸序列。

在一些实施方式中,所述试剂盒包含:

一种经工程改造的细胞或生物体,其包含待被靶向以用于基因改变的内源基因或基因组区域,或包含操作性地连接至启动子的表型编码序列的一种或多种异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;和(a)含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列,和,含有靶向所述内源基因、基因组区域或表型编码序列的指导rna(grna)的异源多核苷酸序列;和/或(b)含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列。

在一些实施方式中,试剂盒包含经工程改造的细胞或生物体,其包含待被靶向以用于基因改变的内源基因或基因组区域,或含有操作性地连接至启动子的表型编码序列的一种或多种异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)在蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达,并且还包含整合进入经工程改造的细胞或生物体的基因组中的cas核酸酶和λ红系统中的一或两者。在一些实施方式中,经工程改造的细胞或生物体包含整合进入经工程改造的细胞或生物体的基因组中的cas核酸酶或λ红系统之一,并且试剂盒还包含编码cas核酸酶或λ红系统中另一个的异源多核苷酸序列。在一些实施方式中,试剂盒还包含含有同源供体dna序列(例如,dsdna或ssdna供体序列)的一个或多个多核苷酸序列。

在一些实施方式中,所述试剂盒包含:

一种经工程改造的细胞或生物体,其包含操作性连接至启动子的表型编码序列的一个或多个异源多核苷酸序列,其中所述表型编码序列(i)编码具有可检测表型的功能性蛋白质,或(ii)蛋白质编码序列中包含工程性破坏,其阻止可检测表型的表达;和

含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列,含有靶向表型编码序列的grna的异源多核苷酸序列,和含有同源供体dna序列的异源多核苷酸序列中的一种或多种。

在一些实施方式中,试剂盒用于靶向经工程改造的细胞或生物体的内源表型或基因组基因座,并且包含:

经工程改造的细胞或生物体(例如,如本文所述的原核或真核细胞,例如酵母细胞,哺乳动物细胞,昆虫细胞或植物细胞,或微生物或真核生物),其包含待被靶向的内源基因或基因组区域;

含有操作性连接至cas核酸酶编码多核苷酸的启动子的多核苷酸序列;

含有靶向所述经工程改造的细胞或生物体的内源基因或基因组区域的grna的多核苷酸序列;和

含有同源供体dna序列(例如,dsdna或ssdna供体序列)的一个或多个多核苷酸序列。

在本文公开的试剂盒的一些实施方式中,试剂盒还包含异源多核苷酸序列,其含有与λ红的编码多核苷酸操作性连接的启动子。

在一些实施方式中,用于靶向经工程改造的细胞或生物体的内源表型或基因组基因座的试剂盒包含经工程改造的细胞或生物体,所述经工程改造的细胞或生物体包含待被靶向的内源基因或基因组区域,和整合进入经工程改造的细胞或生物体的基因组中的cas核酸酶与λ红系统之一或两者。在一些实施方式中,经工程改造的细胞或生物体包含整合进入经工程改造的细胞或生物体的基因组中的cas核酸酶或λ红系统之一,并且试剂盒还包含编码cas核酸酶或λ红系统中另一个的异源多核苷酸序列。在一些实施方式中,试剂盒还包含含有同源供体dna序列(例如,dsdna或ssdna供体序列)的一个或多个多核苷酸序列。

在一些实施方式中,试剂盒还包含一种或多种试剂,用于将一种或多种异源多核苷酸序列转化进入经工程改造的细胞或生物体。在一些实施方式中,试剂盒还包含一种或多种试剂,用于诱导cas核酸酶的表达,诱导grna的表达或阻止grna的表达。

在一些实施方式中,多核苷酸序列(例如,如上文第三节所述)在一个或多个表达盒,表达载体和/或质粒中。在一些实施方式中,试剂盒还包含一种或多种细胞或生物体(例如,如上文第三节所述的微生物,原核,原生质或真核细胞或生物体)。在一些实施方式中,试剂盒包含原核细胞。在一些实施方式中,试剂盒包含原生质细胞。在一些实施方式中,试剂盒包含真核细胞。

在一些实施方式中,多核苷酸序列,表达盒,表达载体和/或质粒在本文所述的细胞或生物体中。因此,另一方面,提供了试剂盒,其包含本文所述的经工程改造的细胞或经工程改造的生物体(例如,经工程改造的微生物)。在一些实施方式中,经工程改造的微生物是真菌(例如酵母)。在一些实施方式中,经工程改造的微生物为原核生物(例如细菌)。在一些实施方式中,经工程改造的微生物是真核的(例如酵母,线虫或植物)。

在一些实施方式中,试剂盒中提供的微生物,多核苷酸序列,表达盒,表达载体和/或质粒为冻干形式。在一些实施方式中,冻干的微生物,多核苷酸序列,表达盒,表达载体和/或质粒由试剂盒的使用者重建。因此,在一些实施方式中,试剂盒还包含用于重建冻干的生物体,多核苷酸序列,表达盒,表达载体和/或质粒的说明书。

在一些实施方式中,试剂盒中分开提供微生物和多核苷酸序列,表达盒,表达载体和/或质粒。在一些实施方式中,试剂盒中分开提供冻干形式的微生物和多核苷酸序列,表达盒,表达载体和/或质粒。

在一些实施方式中,试剂盒还包含一种或多种培养试剂。在一些实施方式中,试剂盒还包含一种或多种转染试剂。在一些实施方式中,试剂盒还包含一种或多种转化试剂。在一些实施方式中,试剂盒还包含一种或多种试剂,所述试剂包括培养基(例如,液体培养基),选择性培养基,固体平板培养基,培养基补充剂,板,管,环或其它塑料制品。在一些实施方式中,试剂盒还包含用于诱导型启动子的诱导剂。在一些实施方式中,试剂盒包含半乳糖。在一些实施方式中,试剂盒包含阿拉伯糖。在一些实施方式中,试剂盒包含鼠李糖。在一些实施方式中,试剂盒包含用于本文所述营养缺陷型标志物的反选择剂(例如5-氟乳清酸或α-己二酸)。在一些实施方式中,试剂盒包含用于本文所述的抗生素抗性标志物的选择剂(例如氨苄青霉素,卡那霉素,壮观霉素,庆大霉素或博来霉素)。

在一些实施方式中,试剂盒还包含用于检测经工程改造的细胞或经工程改造的微生物生物体的基因型的一种或多种试剂,其中所述一种或多种试剂包括dna聚合酶,引物,dntp,限制酶或缓冲液。在一些实施方式中,试剂盒还包括用于转化,培养,检测表型或对细胞或生物体进行基因分型的设备。例如,在一些实施方式中,试剂盒包含抗体,蛋白质印迹检测试剂,蛋白质转移设备,移液管,移液器,培养箱,培养箱摇床,热循环仪,dna电泳设备,电源,水浴,测序材料或生物信息学软件。

在一些实施方式中,试剂盒还包含使用说明材料,该使用说明材料包含用于实施本文所述方法(例如,用于改变本文所述细胞或生物体中的基因表达)的说明(即方案)。在一些实施方式中,试剂盒包含用于分析本文所述的细胞或生物体的使用说明书(例如,用于诱导cas9活性,检测可检测表型的一个或多个改变和/或分析本文所述的细胞或生物体的基因型)。在一些实施方式中,试剂盒包含用于设计如本文所述的grna和其它crispr/cas组分的说明。在一些实施方式中,试剂盒包含用于使用本文公开的细胞,组合物,试剂盒和/或方法来教导基因编辑中的基本原理的课程(例如,用于教育者的课程)。

尽管说明材料通常包括书面或印刷材料,但它们不限于此。本公开内容考虑了能够存储这样的使用说明并将其传达给使用者的任何介质。此类介质包括但不限于电子存储介质(例如磁盘,磁带,芯片等),光学介质(例如cd-rom)等。此类介质还可以包括提供此类说明材料的互联网站点的地址。

vi.教育与培训系统和方法

在另一方面,提供了用于在基因表达和基因编辑的核心过程中进行教育和培训的系统和方法。在一些实施方式中,本文公开的多核苷酸序列,表达盒,表达载体,质粒,细胞,生物体和试剂作为模块化系统提供。可以将所述系统配置为一系列模块,这些模块共同代表细胞或生物体中基因表达和基因表达改变的各个阶段,各阶段或模块都包含全套试剂,培养基和其它一次性组件,以及具有用于在各阶段进行标准程序的使用说明的指导手册,在某些实施方式中,还包括评估模块,用于评估用户对所教过程的理解。某些模块可独立于系统整体进行出售或购买,例如用于补充特定阶段的供应,在使用时为指导者或受训者提供选择或使系统适应更大或更小受训人数的目的。

例如,在一些实施方式中,系统可包括以下模块中的一个或多个。

用于在细胞或生物体中表达可检测表型的模块:在一些实施方式中,提供用于在细胞或生物体中表达一种或多种可检测表型(例如,可检测的颜色和/或荧光;可检测的气味;可检测的酶活性;对抗生素的抗性;或可检测的形态)的模块。在一些实施方式中,模块包括一组试剂和材料,用于提供,生产或培养表达可检测表型的细胞或生物体。在一些实施方式中,模块包含一种或多种细胞或生物体(例如原核或真核细胞或生物体),含有操作性连接至启动子的表型编码序列的一种或多种异源多核苷酸,含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列,含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列,含有靶向发色编码序列的grna的异源多核苷酸序列,和含有同源供体dna序列的异源多核苷酸序列,如本文所述。在一些实施方式中,模块包含细胞或生物体,所述细胞或生物体包含:含有操作性地连接至启动子的表型编码序列的一种或多种异源多核苷酸,并且还包含用于转化进入细胞或生物体的一种或多种异源多核苷酸(例如,含有操作性地连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列,含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列,含有靶向发色编码序列的grna的异源多核苷酸序列,和含有异源供体dna序列的异源多核苷酸序列)。在一些实施方式中,模块包含一种或多种培养试剂,转染试剂和/或转化试剂。

用于在细胞或生物体中表达断裂基因的模块:在一些实施方式中,提供用于表达一个或多个表型编码序列的模块,其在蛋白质编码序列或启动子区域包含工程性破坏,其阻止细胞或生物体中可检测表型的表达(例如,断裂基因,例如断裂的发色基因)。在一些实施方式中,模块包括用于提供、产生或培养具有断裂基因的细胞或生物体的一组试剂和材料。在一些实施方式中,模块以下的一种或多种:细胞或生物体(例如原核或真核细胞或生物体),操作性连接至启动子的一种或多种异源多核苷酸,其中所述多核苷酸在蛋白质的编码序列中包含工程性破坏,其阻止可检测表型的表达,含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列,含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列,含有靶向发色编码序列的grna的异源多核苷酸序列,和含有同源供体dna序列的异源多核苷酸序列,如本文所述。在一些实施方式中,模块包含细胞或生物体,所述细胞或生物体包含在蛋白质的编码序列或启动子区域含有工程性破坏的一种或多种异源多核苷酸,所述工程性破坏阻止可检测表型的表达(例如,断裂的基因,例如断裂的发色基因),并且还包含用于转化进入细胞或生物体的一种或多种异源多核苷酸(例如,含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列,含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列,含有靶向发色编码序列的grna的异源多核苷酸序列,和含有同源供体dna序列的异源多核苷酸序列)。在一些实施方式中,模块包含一种或多种培养试剂,转染试剂和/或转化试剂。

用于基因编辑的模块:在一些实施方式中,提供用于改变可检测表型的表达(例如,将可检测表型改变为第二可检测表型或破坏可检测表型的表达)或用于修复断裂基因(例如,修复断裂基因从而表达可检测表型)的模块。在一些实施方式中,模块包括用于改变和/或修复基因表达的一组试剂和材料。在一些实施方式中,模块包含含有操作性连接至cas核酸酶编码多核苷酸的启动子(例如,诱导型启动子)的异源多核苷酸序列,含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列,含有靶向发色编码序列的grna的异源多核苷酸序列,和/或含有同源供体dna序列的异源多核苷酸序列。在一些实施方式中,模块包含用于诱导cas核酸酶和/或λ红系统表达或用于诱导或阻止grna表达的一种或多种试剂,例如,用于诱导型启动子的诱导剂或用于抗生素或营养缺陷型标志物的选择剂或反选择剂。在一些实施方式中,模块包含一种或多种培养试剂,转染试剂和/或转化试剂。

用于内源或基因组靶向的模块:在一些实施方式中,提供用于靶向细胞或生物体中的内源基因或基因组区域的模块(例如,破坏内源基因或基因组区域的功能,用新功能替换内源基因或基因组区域的功能,或恢复内源基因或基因组区域的功能)。在一些实施方式中,模块包括一组试剂和材料,用于提供,产生或培养表达待被靶向的内源基因或基因组区域的细胞或生物体。在一些实施方式中,模块包含以下的一种或多种:包含待被靶向的内源基因或基因组区域的细胞或生物体(例如原核或真核细胞或生物体),含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列,含有操作性连接至λ红的编码多核苷酸的启动子的异源多核苷酸序列,含有靶向内源基因或基因组区域的grna的异源多核苷酸序列,和,含有同源供体dna序列的异源多核苷酸序列,如本文所述。在一些实施方式中,所述模块包含细胞或生物体,所述细胞或生物体包含待被靶向的内源基因或基因组区域,并且还包含用于转化进入细胞或生物体的一种或多种异源多核苷酸(例如,含有操作性连接至cas核酸酶编码多核苷酸的启动子的异源多核苷酸序列,含有操作性连接至λ红编码多核苷酸的启动子的异源多核苷酸序列,含有靶向内源基因或基因组区域的grna的异源多核苷酸序列,和含有同源供体dna序列的异源多核苷酸序列)。在一些实施方式中,模块包含一种或多种培养试剂,转染试剂和/或转化试剂。

用于分析细胞或生物体的模块:在一些实施方式中,提供用于在基因编辑事件之后检测细胞或生物体的表型,表型变化和/或基因型的模块。在一些实施方式中,模块包括用于检测或分析表型或基因型的一组试剂和材料。例如,在一些实施方式中,模块包含用于检测经工程改造的细胞或经工程改造的微生物的基因型的一种或多种试剂,例如dna聚合酶,引物,dntp,限制酶或缓冲液。在一些实施方式中,模块包括用于对经工程改造的细胞或生物体进行转化,培养,检测表型或基因分型的器具。

评估模块:在一些实施方式中,还可包括评估模块或令其以其它方式可得,所述评估模块包含供教育者或培训者使用的材料。评估模块的目的可以是帮助教育者或培训者评估受训者对材料和程序的目的和用途的理解,以及确定受训者需要改进或需要特别注意细节(例如时机,操作条件,设备的正确使用或操作的其它方面)的特定方面。

在一些实施方式中,该系统包括使用说明手册,所述使用说明手册包含整个操作,包括各模块要遵循的所有步骤,和用于使用各设备部分和各模块中的各试剂的操作,以及在正确进行操作时的各操作的预期结果。

vii.实施例

提供以下实施例,以说明而不限制所要求保护的发明。

实施例1:包含多个颜色基因的万花筒(kaleidoscope)生物体

该生物体可包含并表达多种颜色基因。取决于敲除这些基因中的哪一个,生物体的表型会改变颜色。如图1所示,生物体(例如,大肠杆菌或酵母)包含多个颜色基因,和用于靶向敲除这些基因中的各基因所必需的基因(例如,具有颜色基因特异性指导rna的cas9系统)。这些遗传元件可以是染色体遗传元件或在质粒上。对于三个颜色基因(例如红色,蓝色和黄色)的情况,当所有三个基因都表达时,生物体将变成褐色。如果表达了cas9系统和一种或多种grna,那么归因于一种或多种颜色基因的敲除,生物体的颜色将发生变化。例如:

颜色基因a+b+c表达=棕色表型(表达蓝色,红色和黄色基因)

颜色基因a+b+c表达+cas9表达+grnaa表达→绿色表型(蓝色和黄色基因表达)

颜色基因a+b+c表达+cas9表达+grnab表达→橙色表型(红色和黄色基因表达)

颜色基因a+b+c表达+cas9表达+grnac表达→紫色表型(蓝色和红色基因表达)

颜色基因a+b+c表达+cas9表达+grnaa和grnab表达→黄色表型(黄色基因表达)

颜色基因a+b+c表达+cas9表达+grnaa和grnac表达→蓝色表型(蓝色基因表达)

颜色基因a+b+c表达+cas9表达+grnac和grnab表达→红色表型(红色基因表达)

颜色基因a+b+c表达+cas9表达+grnaa、grnab和grnac表达→白色或米色表型(无颜色基因表达)

实施例2:酵母形式1

在图2中显示描述酵母形式1的示意图。酵母菌株组成型表达两种不同的蛋白质(a和b)。这些蛋白质是发色的或发荧光的(在本文中称为发色蛋白a或b),但都具有当在酵母中表达时它们是肉眼可见的特征。该菌株还将携带附加型质粒,其组成型表达针对发色蛋白a或b的grna(grnaa或grnab)。表达grnaa的质粒将携带ura3营养缺陷型标志物,而表达grnab的质粒将携带lys2营养缺陷型标志物。第三质粒或整合的表达盒将在半乳糖诱导型启动子的控制下表达cas9。在没有半乳糖的情况下,将不会发生基因编辑事件,并且酵母将呈由发色蛋白a和b共表达产生的颜色。在有半乳糖的情况下,会诱导cas9表达,并且grnaa或b将被纳入cas9中,导致对于发色基因a或b的靶向。如果同时靶向发色基因a和b,则酵母将不再表达发色蛋白a或b,酵母菌落将呈白色。

将酵母铺板于半乳糖和5-氟乳清酸(5-foa)上,将既可以诱导cas9表达,又可对表达grnaa的质粒的酵母进行反选择,其带有ura3营养缺陷型标志物。结果是,仅grnab将被表达并整合到cas9中,导致发色基因b被靶向。如果发色基因b被靶向并被破坏,那么酵母将不再表达发色蛋白b,并且酵母将呈现发色蛋白a的颜色。将酵母铺板于半乳糖和α-己二酸(αaa)上将诱导cas9表达,并反选择带有表达grnab的质粒的酵母,该质粒带有lys2营养缺陷型标志物。结果是,仅grnaa会被表达并整合到cas9中,导致发色基因a被靶向。如果发色基因a被靶向并被破坏,那么酵母将不再表达发色蛋白a,并且酵母将呈现发色蛋白b的颜色。

实施例3:酵母形式2

在图3中显示描述酵母形式2的示意图。酵母菌株组成型表达发色蛋白(a)。该菌株还将携带附加型质粒,其组成型表达针对发色蛋白a的grna(grnaa)或针对ade2基因的grna(grnab)。表达grnaa的质粒将携带ura3营养缺陷型标志物,而表达grnab的质粒将携带lys2营养缺陷型标志物。第三质粒或整合的表达盒将在半乳糖诱导型启动子的控制下表达cas9。

在没有半乳糖的情况下,将不会发生基因编辑事件,并且酵母将呈由发色蛋白a表达产生的颜色。在有半乳糖的情况下,会诱导cas9表达,并且grnaa或b将被纳入cas9中,导致对于发色基因a或ade2基因的靶向。如果发色基因a和ade2基因均被靶向,则酵母将不再表达发色蛋白a或ade2,并且该酵母菌落将呈现红色。将酵母铺板于半乳糖和5-氟乳清酸(5-foa)上,将既可以诱导cas9表达,又可对表达grnaa的质粒的酵母进行反选择,其带有ura3营养缺陷型标志物。结果是,仅grnab将被表达并整合到cas9中,导致ade2基因被靶向。如果ade2基因被靶向并被破坏,那么酵母将不再表达ade2,并且酵母将呈现发色蛋白a和ade2酵母(发色蛋白a+红色)的颜色组合。将酵母铺板于半乳糖和α-己二酸(αaa)上将诱导cas9表达,并反选择带有表达grnab的质粒的酵母,该质粒带有lys2营养缺陷型标志物。结果是,仅grnaa会被表达并整合到cas9中,导致发色基因a被靶向。如果发色基因a被靶向并被破坏,那么酵母将不再表达发色蛋白a,并且酵母将呈白色。

实施例4:酵母形式3

在图4中显示描述酵母形式3的示意图。酵母菌株组成型表达酵母增强的红色荧光蛋白(yemrfp,keppler-ross等2008genetics)。该菌株还将携带附加型质粒,其组成型表达yemrfp或ade2基因的grna(分别为grnaa或grnab)。表达grnaa的质粒将携带ura3营养缺陷型标志物,而表达grnab的质粒将携带lys2营养缺陷型标志物。第三质粒或整合的表达盒将在半乳糖诱导型启动子的控制下表达cas9。

在没有半乳糖的情况下,将不会发生基因编辑事件,并且酵母将呈由yemrfp表达产生的颜色(紫色,参见keppler-ross等,2008)。在半乳糖的存在下,cas9的表达被诱导,并且grnaa或b将被整合入cas9,导致靶向yemrfp或ade2基因。如果yemrfp和ade2基因同时被靶向,则酵母将不再表达yemrfp或ade2,并且酵母菌落将呈红色。将酵母铺板于半乳糖和5-氟乳清酸(5-foa)上,将既可以诱导cas9表达,又可对表达grnaa的质粒的酵母进行反选择,其带有ura3营养缺陷型标志物。结果是,仅grnab将被表达并整合到cas9中,导致ade2基因被靶向。

实施例5:酵母形式4

在图5中显示描述酵母形式4的示意图。酵母菌株组成型表达酵母增强的红色荧光蛋白(yemrfp,keppler-ross等2008genetics)。该酵母菌株将具有ade2基因,该基因包含工程性破坏,类似于一个内含子,其会引起移码并阻止ade2的表达。该菌株还将携带附加型质粒,其组成型表达针对yemrfp的grna或对ade2基因中的工程性破坏的5'和3'端具有特异性的两个grna(分别为grnaa或grnab/c)。表达grnaa的质粒将携带ura3营养缺陷型标志物,而表达grnab/c的质粒将携带lys2营养缺陷型标志物。第三质粒或整合的表达盒将在半乳糖诱导型启动子的控制下表达cas9。

在没有半乳糖的情况下,不会发生基因编辑事件,并且酵母将呈由yemrfp表达且缺少ade2产生所致的颜色(浅紫色,参见keppler-ross等,2008,图1a)。在半乳糖的存在下,cas9的表达被诱导,并且grnaa或b将被整合入cas9,导致靶向yemrfp或ade2基因。如果yemrfp和ade2基因同时被靶向,则酵母将不再表达yemrfp或ade2,并且酵母菌落将呈白色。将酵母铺板于半乳糖和5-氟乳清酸(5-foa)上,将既可以诱导cas9表达,又可对带有表达grnaa的质粒的酵母进行反选择,其带有ura3营养缺陷型标志物。结果是,仅grnab/c将被表达并整合到cas9中,导致靶向破坏的ade2基因。如果破坏的ade2基因被靶向并被纠正,则酵母将表达ade2,并且该酵母将呈yemrfp和ade2酵母的颜色组合(紫色)。将酵母铺板于半乳糖和α-己二酸(αaa)上将诱导cas9表达,并反选择带有表达grnab/c的质粒的酵母,该质粒带有lys2营养缺陷型标志物。结果是,仅grnaa将被表达并被纳入cas9,导致靶向yemrfp。如果yemrfp被靶向并被破坏,则酵母将不再表达yemrfp,并且酵母将呈红色。

实施例6:细菌形式1

图6显示描述细菌形式1的示例性示意图。细菌(组成型或诱导性)表达蛋白质。该蛋白质是发色的或发荧光的(例如gfp,如图6所示),并且当在细菌中表达时可以是肉眼可见的。表达针对所述蛋白质(例如,gfp)的grna的附加型质粒可以被转化到细菌中。表达grna的质粒带有卡那霉素抗生素抗性标志物,并且还在诱导型启动子的控制下表达cas9。在没有诱导剂的情况下,不发生基因编辑事件,并且细菌将呈由发色蛋白(例如gfp)表达产生的颜色。在存在诱导剂的情况下,cas9表达被诱导,并且grna将被纳入cas9,导致靶向gfp。cas9切割的修复是由转化质粒中包含的hr供体dna指导的,从而允许纳入阻止gfp表达的特定突变。如果gfp被靶向,则细菌将不再表达gfp,并且细菌菌落将呈白色或米色。

实施例7:细菌形式2

图7显示描述细菌形式2的示例性示意图。细菌(组成型或诱导性)表达蛋白质。该蛋白质是发色的或发荧光的(例如gfp,如图7所示),并且当在细菌中表达时可以是肉眼可见的。可将表达针对gfp的grna的附加型质粒转化进入细菌中。表达grna的质粒带有抗生素抗性标志物,并且还在诱导型启动子的控制下表达cas9。在没有诱导剂的情况下,不发生基因编辑事件,并且细菌将呈由发色蛋白(例如gfp)表达产生的颜色。在存在诱导剂的情况下,cas9表达被诱导,并且grna将被纳入cas9,导致靶向gfp。cas9切割的修复是由转化质粒中包含的hr供体dna指导的,从而允许纳入阻止gfp表达的特定突变。在gfp被靶向的情况下,细菌将表达bfp或yfp,并且细菌菌落将分别呈现蓝色或黄色。

实施例8:细菌形式3

图8显示描述细菌形式3的示例性示意图。细菌(组成型或诱导性)表达蛋白质。该蛋白质是发色的或发荧光的(例如gfp,如图8所示),并且当在细菌中表达时可以是肉眼可见的。可将表达针对gfp的grna的附加型质粒转化进入细菌中。表达grna的质粒带有抗生素抗性标志物,并且还在诱导型启动子的控制下表达cas9。在没有诱导剂的情况下,应不会发生基因编辑事件,并且细菌将呈由发色蛋白(例如gfp)表达产生的颜色。在存在诱导剂的情况下,cas9表达被诱导,并且grna将被纳入cas9,导致靶向gfp。cas9切割的修复由与质粒共转化的ssdnahr供体指导,允许纳入gfp向bfp或yfp的特定突变。如果gfp被靶向,则细菌将不再表达gfp,并且细菌菌落将呈白色或米色。

实施例9:细菌形式4

图9显示描述细菌形式4的示例性示意图。细菌(组成型或诱导性)表达蛋白质。该蛋白质是发色的或发荧光的(例如gfp,如图9所示),并且当在细菌中表达时可以是肉眼可见的。可将表达针对gfp的grna的附加型质粒转化进入细菌中。表达grna的质粒带有抗生素抗性标志物,并且还在诱导型启动子的控制下表达cas9。在没有诱导剂的情况下,应不会发生基因编辑事件,并且细菌将呈由发色蛋白(例如gfp)表达产生的颜色。在存在诱导剂的情况下,cas9表达被诱导,并且grna将被纳入cas9,导致靶向gfp。cas9切割的修复由与质粒共转化的ssdnahr供体指导,允许纳入将gfp向bfp或yfp转化的特定突变。在gfp被靶向的情况下,细菌将表达bfp或yfp,并且细菌菌落将分别呈现蓝色或黄色。

实施例10:细菌形式5

图10显示描述细菌形式5的示例性示意图。细菌在组成型或诱导型启动子的控制下表达非功能性发色或荧光(gfp)蛋白。可将表达针对gfp的grna的附加型质粒转化进入细菌中。表达grna的质粒还在诱导型启动子的控制下表达cas9,如果gfp蛋白在诱导型启动子的控制下,则gfp的诱导型启动子和cas9的诱导型启动子不依赖于相同的诱导方法(例如,不使用相同的诱导剂)。在没有cas9启动子的诱导剂的情况下,不会发生基因编辑事件,并且细菌为白色。在存在cas9启动子的诱导剂的情况下,cas9表达被诱导,并且grna被纳入cas9中,从而靶向gfp。cas9切割的修复由转化质粒中所含的hr供体指导,从而允许恢复gfp表达的特定突变的纳入。如果gfp被靶向,则细菌将表达功能性gfp,并且细菌菌落将呈现绿色。

实施例11:细菌形式6

图11显示描述细菌形式6的示例性示意图。细菌在组成型或诱导型启动子的控制下表达非功能性发色或荧光(如gfp)蛋白。可将表达针对gfp的grna的附加型质粒转化进入细菌中。表达grna的质粒还在诱导型启动子的控制下表达cas9,如果gfp蛋白在诱导型启动子的控制下,则gfp的诱导型启动子和cas9的诱导型启动子不依赖于相同的诱导方法(例如,不使用相同的诱导剂)。在没有cas9启动子的诱导剂的情况下,不会发生基因编辑事件,并且细菌为白色。在存在cas9启动子的诱导剂的情况下,cas9表达被诱导,并且grna被纳入cas9中,从而靶向gfp。cas9切割的修复由与质粒共转化的ssdnahr供体指导,从而允许恢复gfp表达的特定突变的纳入。如果gfp被靶向,则细菌将表达功能性gfp,并且细菌菌落将呈现绿色。

实施例12:细菌形式7

图12显示描述细菌形式7的示例性示意图。对细菌进行了遗传改变,使其具有插入细菌基因组的诱导型cas9和诱导型λ红表达盒。这两个诱导型启动子都具有loxp或loxp变体序列,其紧接启动子之后侧接转录终止子序列。这些基因调节元件将阻止转录,阻止诱导蛋白质的表达。

这些经遗传改变的细菌用单一质粒转化,所述质粒包含缺乏其自身启动子的抗生素抗性盒(arc),其5’和3’端侧接内源靶基因的短部分(图12中的lacz),识别靶向的基因的grna(图12中的“grna-lz”),组成型表达的cre重组酶盒,和靶向质粒中自身区域的“自毁”grna,称为不可修复的dsb位点(图12中的“grna-质粒1”)。cre重组酶表达后,两个转录终止序列都将被切除,留下单个loxp或loxp变体“疤痕(scar)”,而转录和翻译将不会受阻。组成型活性cas9盒将起始cas9表达。质粒将被破坏;并且只有整合了arc的细菌才能在该抗生素的选择下幸存下来。通过设计,靶向的基因以外的细菌基因组内脱靶插入的风险增加。诱导crispr-cas和λ红后,重组修复将允许细胞表达抗生素抗性蛋白并失去正常的靶向的基因表达(图12中的lacz)。就是否丧失正常靶向的基因的功能以及在存在抗生素的情况下存活的能力来筛选细菌。

实施例13:细菌形式8

图13显示描述细菌形式8的示例性示意图。细菌已经过遗传改变,以具有诱导型cas9和ku和ligd表达盒。另外,将内源基因替换为发色蛋白orf。这些改变的细菌将在内源基因激活后表达发色蛋白。

经遗传改变的细菌用单个质粒转化,所述单个质粒具有驱动sgrna表达的盒,所述sgrna识别发色蛋白。诱导后,dsb将在发色蛋白内发生。与未改变的大肠杆菌不同,改变的细菌能够进行基于非同源末端连接(nhej)的dsb断裂修复。ku和ligd蛋白将识别dsb,并重连两个断裂末端。由于这种dsb修复方法容易出错,因此很大比例的大肠杆菌将失去表达发色蛋白的能力。用户可以量化失去发色蛋白表达的细菌的百分比,相较于保留表达的百分比。

实施例14:细菌形式9

图14显示示例性示意图,其描述细菌形式9,一种用于同时丧失和获得功能的双质粒系统。细菌经过遗传改变以具有诱导型crispr活性和诱导型λ红表达盒。例如,未改变的hb101菌株或hme63菌株大肠杆菌在天然或修饰的lacz启动子的控制下表达β-半乳糖苷酶,其因异丙基β-d-1-硫代吡喃半乳糖苷(iptg)的存在而被诱导。在hme63菌株细菌中,阿拉伯糖诱导型λ红盒位于细菌的染色体内。对于hb101菌株细菌,阿拉伯糖诱导型λ红盒位于细菌中已经存在的其它质粒中。细菌(例如hme63或hb101细菌菌株之一)用两个独特的质粒转化。第一质粒包含识别lacz基因的组成型表达的grna和缺乏其自身启动子的抗生素抗性盒(arc),其5'和3'端侧接lacz基因的短部分。arc与β-半乳糖苷酶处于同一阅读框中。第二质粒包含驱动cas9核酸酶的鼠李糖诱导型启动子。在所有上述四个要素的存在下,crispr-cas介导的双链断裂(dsb)将在基因组中的lacz基因处发生。λ红蛋白将识别dsb,并利用lacz侧接的arc启动基于同源重组的修复。就x-gal染色丧失蓝色和在新抗生素存在下存活的能力来筛选大肠杆菌。只有在成功进行crispr-cas起始的重组修复后,修饰的大肠杆菌才能表达抗生素抗性蛋白同时丧失正常的β-半乳糖苷酶表达。

实施例15:cas9介导的基因组基因座靶向

用含有cas9核酸内切酶的质粒和含有λ红重组酶基因的质粒转化大肠杆菌hb101细菌。随后,细胞用靶向基因组靶标(lacz)的单链grna和含有侧接lacz同源臂的氯霉素(cam)基因的双链供体dna转化。细胞被铺板在cam平板和氨苄青霉素/卡那霉素平板上。经历同源重组的细胞获得了对cam的抗性,能够在cam平板上生长。通过pcr筛选抗cam的菌落。野生型lacz的pcr产物为450bp,而cas9介导的供体dna重组后的lacz的pcr产物为1300bp。在产生pcr结果的10个菌落中,有8个呈cas9介导的供体dna重组阳性。

实施例16:cas9介导的基因组基因座修复

建立了laczdna供体质粒,以将终止密码子插入β-半乳糖苷酶阅读框中,由此建立了163个氨基酸的截短的无功能酶。用含有以下表达盒的质粒转化含有λ红表达质粒和lacz供体质粒的hb101细菌:cas9盒但无grna表达盒(图16a,对照转化1),grna表达盒但无cas9表达盒(图16b,对照转化2),或grna表达盒和cas9表达盒(图16c,crispr转化)。所有细菌均在氨苄西林,卡那霉素,链霉素,鼠李糖,阿拉伯糖,x-gal底物和iptg存在下生长。iptg诱导lacz启动子驱动β-半乳糖苷酶的表达,将无色的x-gal底物转化为蓝色产物。仅具有完整β-半乳糖苷酶的细菌才会变成蓝色,而缺少功能性β-半乳糖苷酶的细胞将保持白色。没有crispr活性的细胞中100%显示正常的β-半乳糖苷酶。当crispr被活化时,350个菌落中约88%是白色的,表现出缺乏β-半乳糖苷酶的活性,而所观察到的约350个菌落中有43个是蓝色的,表明存在功能性β-半乳糖苷酶(图16d)。

为了进一步验证lacz基因座的基因组靶向性,进行了基于聚合酶链式反应的基因分型。两个寡核苷酸(fwt1和fwt2)在野生型和靶向的细菌中产生686个碱基对的扩增子。正确靶向的lacz突变大肠杆菌由fwt1和rmut1寡核苷酸产生550个碱基对的扩增子(图17a)。来自对照转化2的20个菌落中的0个显示550个碱基对的突变体pcr产物。来自crispr转化的19个菌落中的18个产生了野生型条带和突变体条带(分别为白色和黑色箭头,图17b-c)。对几种阳性突变体的pcr产物进行桑格(sanger)测序,以确认预期的过早终止密码子的插入。全部显示与供体质粒匹配的相同序列(代表性序列图,图17d)。

应理解,本文所述的实施例和实施方式仅用于说明目的,本领域技术人员应了解据此作出的各种修饰或改变,且它们包括在本申请的主旨和权益以及所附权利要求书的范围内。本文引用的所有发表物、专利和专利申请通过引用全文纳入本文以用于所有目的。

非正式序列表

seqidno:1–酵母密码子优化的cas9

atgtatccatatgatgttccagattacgctccacctaagaagaaacgtaaggttgacaaaaagtactccatcggtttagatattggtaccaactctgtcggttgggccgttattactgatgaatacaaggttccatctaagaagttcaaagttttaggtaacactgatagacactccattaagaagaatttgatcggtgctttgttgttcgattccggtgaaaccgccgaagctaccagattaaagagaaccgctagaagaagatataccagaagaaagaacagaatttgttacttgcaagaaattttctccaacgaaatggccaaggttgatgattctttctttcacagattggaagaatcctttttagtcgaagaagataagaaacacgaaagacacccaatcttcggtaacattgtcgacgaagtcgcttatcacgaaaaatatccaactatttaccacttgagaaagaagttagtcgactccacctacaaagctgacttgagattgatttatttggctttggctcacatgattaagttcagaggtcacttcttaatcgaaggtgacttgaaccctgacaattccgatgttgacaagttgttcatccaattggtccaaacctataatcaattgttcgaagaaaatccaatcaacgcttccggtgttgacgctaaagccatcttgtctgccagattgtccaagtcccgtcgtttagaaaacttgattgctcaattgccaggtgaaaagaagaacggtttgtttggtaacttgattgctttgtccttgggtttaaccccaaacttcaagtctaacttcgatttggccgaagatgctaagttgcaattgtccaaggatacttacgatgacgatttggataacttattggcccaaatcggtgaccaatacgctgacttgttcttggccgctaagaacttatccgacgccatcttgttgtccgacattttaagagttaacactgaaattaccaaggccccattgtccgcctccatgatcaagagatacgacgaacaccaccaagacttgaccttattgaaggctttagttcgtcaacaattaccagaaaagtataaagaaatcttctttgatcaatctaaaaacggttacgctggttatattgatggtggtgcctctcaagaagaattctacaaatttatcaagcctatcttagaaaaaatggacggtaccgaagaattattggtcaagttaaacagagaagatttgttgcgtaagcaacgtactttcgacaacggttccatcacccatcaaatccacttgggtgaattgcacgctatcttaagaagacaagaagatttctacccattcttgaaagataatagagaaaaaattgaaaaaattttgactttcagaattccttactacgttggtccattagccagaggtaactctagatttgcttggatgactagaaagtccgaagaaactattaccccatggaacttcgaagaagtcgttgacaagggtgcttccgctcaatccttcattgaaagaatgaccaatttcgataaaaacttaccaaacgaaaaggttttgccaaagcactctttgttatatgaatacttcaccgtttacaacgaattgactaaagtcaagtacgttaccgaaggtatgagaaagccagctttcttgtctggtgagcaaaagaaggctattgttgacttattattcaaaactaacagaaaggtcactgtcaagcaattgaaggaagattatttcaaaaagatcgaatgcttcgactctgttgaaatctctggtgttgaagatagattcaacgcttccttgggtacctatcacgatttgttgaaaatcatcaaggacaaggactttttggataacgaggaaaacgaagacattttagaagatattgttttgactttgaccttgttcgaagacagagaaatgatcgaagaaagattgaagacctacgctcatttgttcgacgataaagtcatgaaacaattgaagagaagaagatataccggttggggtagattatctagaaagttaattaatggtattagagacaagcaatccggtaagaccatcttggatttcttaaaatctgacggtttcgctaaccgtaacttcatgcaattgattcatgatgactctttgaccttcaaagaagatattcaaaaggctcaagtctctggtcaaggtgattctttgcacgaacatattgctaacttggctggttcccctgccattaagaagggtattttgcaaactgttaaggtcgttgacgaattggtcaaggttatgggtagacacaaaccagaaaacatcgtcattgaaatggccagagaaaaccaaaccacccaaaaaggtcaaaagaactcccgtgaaagaatgaagagaatcgaagaaggtatcaaggagttgggttctcaaattttaaaggaacatccagtcgagaacactcaattgcaaaacgaaaagttgtacttgtactacttacaaaacggtagagatatgtacgtcgatcaagaattagacattaatagattgtctgactacgacgtcgaccatattgtcccacaatctttcttaaaggacgattccattgacaacaaagttttaactagatccgacaaaaacagaggtaagtctgataacgttccttctgaagaagtcgtcaagaagatgaagaactactggagacaattgttgaacgccaaattgatcacccaaagaaagttcgacaacttaaccaaggctgaaagaggtggtttgtctgaattggataaggctggttttattaagagacaattggtcgaaaccagacaaattactaaacatgttgctcaaatcttggattctcgtatgaataccaaatacgacgaaaacgataaattgattagagaagtcaaggttattactttgaagtccaagttggtttctgatttccgtaaggacttccaattctacaaagttagagaaattaacaattaccaccacgctcatgacgcttacttgaacgctgtcgttggtactgccttgattaagaagtacccaaaattggaatccgaattcgtttatggtgactacaaagtttacgatgtcagaaaaatgattgctaagtctgaacaagagattggtaaagctactgccaaatatttcttttactctaacatcatgaacttctttaagaccgaaatcactttagctaacggtgaaattcgtaagagaccattaatcgaaactaacggtgaaactggtgaaattgtctgggataagggtagagatttcgccaccgttcgtaaggttttgtctatgcctcaagttaatatcgtcaagaagaccgaagtccaaaccggtggtttttctaaggaatctatcttgccaaagagaaattctgacaagttgattgctagaaagaaagactgggatccaaagaagtacggtggttttgactccccaactgttgcttactccgttttggttgttgctaaggttgaaaagggtaagtctaagaagttaaagtctgttaaggaattgttgggtattaccattatggaaagatcttcttttgagaaaaacccaattgactttttagaggctaagggttacaaggaagttaagaaggacttgatcattaaattgccaaagtattctttgttcgaattggaaaacggtcgtaagcgtatgttggcctctgctggtgaattacaaaagggtaacgaattagctttgccttctaaatacgttaactttttatacttggcttcccattacgaaaagttaaaaggttctccagaagacaatgaacaaaaacaattgttcgttgaacaacacaagcattacttggacgaaattattgaacaaatttctgaattttccaagagagttatcttagccgacgctaacttggacaaggtcttgtctgcttacaataagcatagagacaagccaatccgtgaacaagccgaaaacatcattcacttgttcactttgactaacttgggtgctccagctgccttcaagtacttcgacaccactatcgacagaaagagatacacttctactaaggaggttttagatgccaccttgattcaccaatctattactggtttgtacgagactagaattgatttgtcccaattaggtggtgatccacctaagaagaagagaaaggtttaa

seqidno:2–大肠杆菌密码子优化的cas9

atgtatccatacgacgtgcctgactatgcggacaaaaagtactccatcggtttggacatcgggacgaatagcgttgggtg

ggcggtgattacagatgaatataaggtgcctagtaaaaaattcaaagtattaggcaataccgatcgtcatagcattaaga

agaacctgattggagcattgctttttgattcgggtgaaaccgcagaagcaacgcgtttgaagcgcacagcacgtcgtcgc

tacacacgccgcaaaaatcgtatttgttatcttcaagaaattttttcaaatgagatggcaaaggtcgacgattctttttt

ccatcgtttagaggaatcttttcttgtggaggaagataagaagcacgagcgtcacccaatctttggtaatattgtcgacg

aagttgcgtaccatgaaaagtacccaacgatctaccacctgcgtaagaaattggtggactcgacatacaaggcggatctt

cgcttgatctatcttgctttggcccacatgattaagttccgcgggcatttcttaattgaaggagacttaaacccggataa

ctcagatgttgacaagctttttattcagcttgtgcaaacttacaatcaacttttcgaagaaaaccctatcaacgcctctg

gtgtggatgcgaaggcgatcctttcggcgcgcctgtcaaagagtcgtcgcttggagaatttgattgcgcagttgccgggg

gagaagaaaaatggcctgtttggaaacctgattgcgctttctcttggattaactcccaactttaagtcaaacttcgactt

ggctgaggatgccaagttacagctgtccaaagatacctacgatgatgatcttgataacttgctggctcaaatcggtgacc

aatacgcggatcttttcttggccgcgaagaacttgtctgacgcaatccttttatcggacatcctgcgcgttaacacagag

atcactaaagcccctctgtctgcatcaatgattaaacgctacgacgaacaccatcaggatttgacattactgaaagccct

tgtacgtcaacaacttccggaaaagtacaaagaaatcttcttcgatcagtctaaaaacgggtacgccgggtatattgatg

gtggcgcttcacaggaggagttttacaaattcattaaacctattctggagaaaatggatggaacggaagagttgttggtg

aagcttaatcgtgaagaccttttgcgcaagcagcgtacgttcgataacgggtcaatcacacaccaaatccacttgggcga

gttacatgcaattcttcgccgtcaggaagatttctaccctttcttgaaagataaccgcgagaagattgaaaagattttga

cttttcgtatcccctactacgtgggtcctttagcccgtggaaacagtcgcttcgcctggatgacccgcaagtcagaagaa

acgatcaccccctggaattttgaggaggttgtggataagggggcgtcagcgcaaagcttcatcgaacgcatgacgaactt

cgataagaacttacctaatgagaaagtgctgccaaaacatagtcttctttatgagtacttcactgtttacaatgagttaa

ctaaggtaaagtatgttacagaagggatgcgtaaacccgcatttttatccggtgagcaaaagaaagctatcgtggatttg

ttatttaagactaaccgcaaagtaacagtcaaacaattaaaagaagactactttaagaaaattgagtgctttgactcagt

ggagatctctggtgtcgaggaccgctttaatgcctcattgggaacttatcacgacttactgaagattattaaagataaag

actttcttgacaacgaagagaacgaagatattctggaggacatcgtcttaacactgactctgttcgaggatcgcgagatg

attgaggaacgcttgaaaacttatgcccacttatttgatgacaaagtgatgaaacaacttaaacgtcgtcgctacaccgg

atggggtcgtttatcacgtaaattaatcaacggcattcgcgataagcagtccggcaaaacaatccttgattttctgaagt

ccgacggattcgcgaatcgcaactttatgcagctgatccacgatgatagtcttaccttcaaggaggatattcaaaaagcc

caggtatcggggcaaggtgactccctgcacgaacatattgcgaatttggccgggtctccggcaatcaagaaaggtatttt

acagaccgttaaagtcgtggatgaattggttaaggtaatgggccgtcataaaccggagaatatcgtaattgaaatggcgc

gtgagaatcagacaactcagaaaggacaaaagaatagccgcgaacgtatgaaacgtattgaagagggaatcaaagaatta

gggagtcagatcttaaaagaacatccagttgaaaacacccaattgcaaaacgaaaagttatacttatactaccttcagaa

cggccgcgatatgtacgtagatcaggaattagacattaaccgcctgtcagattacgatgtcgaccatattgttcctcagt

ctttcttaaaggacgatagcatcgataataaagttttaactcgttcggataaaaaccgtggaaaatccgacaacgtccca

tctgaggaggtagtcaagaagatgaagaactactggcgtcagttactgaacgcgaaattgatcactcagcgcaaatttga

taatttgactaaagccgaacgcggtggtttgtcggagttagacaaagccggcttcatcaaacgccagcttgtagagaccc

gccagattacgaagcacgttgcccagattcttgacagccgtatgaacaccaagtacgatgagaatgataaactgattcgc

gaggtgaaggtaatcacgttaaagagcaaactggtaagtgattttcgtaaggactttcaattttacaaagtgcgcgagat

caacaactatcaccatgcgcatgatgcctatttgaatgccgtagtcggtacagctttgattaagaagtatcctaagttgg

agtcagaatttgtctacggcgactacaaggtgtatgacgtacgcaagatgattgcgaagtccgagcaggaaattggcaag

gccactgctaagtacttcttttattctaacattatgaacttcttcaaaaccgaaatcacccttgcgaacggggaaattcg

taagcgcccgttgatcgaaacaaatggcgagactggtgaaattgtttgggacaaaggtcgcgattttgcaacggtgcgta

aagtattaagtatgccccaggtaaatattgtcaagaagacggaagtgcaaaccggtgggttttctaaagaatcaattttg

ccgaagcgtaattctgataaattaattgcgcgcaaaaaggactgggaccctaagaaatacggcgggttcgactcacccac

ggtcgcctattccgtgttagttgttgcgaaagtcgagaaaggtaaaagcaagaaacttaagtctgttaaggaattgttag

gaatcacgattatggaacgtagctcatttgagaaaaaccccattgactttttggaggcgaaaggttacaaggaagttaaa

aaagacctgattattaaacttcccaagtacagccttttcgaactggaaaatggtcgtaagcgcatgctggcgtcggccgg

tgaactgcaaaaggggaatgagttggccctgccatcgaagtatgtgaatttcttatacctggcgtcccattacgaaaaat

taaaaggctcaccggaagataatgagcaaaagcagctgtttgtggagcaacacaaacattacttagatgaaattatcgaa

cagatttcggagttcagcaagcgcgtgattcttgcggacgcgaatcttgataaggttttatctgcttacaacaagcaccg

cgacaagccgatccgtgagcaagctgagaacattattcatttattcacactgactaatcttggggcgccagctgccttta

aatactttgacaccaccattgaccgcaaacgctacacaagtacaaaagaagtcttagacgcgacactgattcatcaatcc

atcactggtttatatgaaacacgcatcgatctttcgcaactgggaggtgattaa

seqidno:3–酿脓链球菌cas9

atggataagaaatactcaataggcttagatatcggcacaaatagcgtcggatgggcggtgatcactgatgaatataaggttccgtctaaaaagttcaaggttctgggaaatacagaccgccacagtatcaaaaaaaatcttataggggctcttttatttgacagtggagagacagcggaagcgactcgtctcaaacggacagctcgtagaaggtatacacgtcggaagaatcgtatttgttatctacaggagattttttcaaatgagatggcgaaagtagatgatagtttctttcatcgacttgaagagtcttttttggtggaagaagacaagaagcatgaacgtcatcctatttttggaaatatagtagatgaagttgcttatcatgagaaatatccaactatctatcatctgcgaaaaaaattggtagattctactgataaagcggatttgcgcttaatctatttggccttagcgcatatgattaagtttcgtggtcattttttgattgagggagatttaaatcctgataatagtgatgtggacaaactatttatccagttggtacaaacctacaatcaattatttgaagaaaaccctattaacgcaagtggagtagatgctaaagcgattctttctgcacgattgagtaaatcaagacgattagaaaatctcattgctcagctccccggtgagaagaaaaatggcttatttgggaatctcattgctttgtcattgggtttgacccctaattttaaatcaaattttgatttggcagaagatgctaaattacagctttcaaaagatacttacgatgatgatttagataatttattggcgcaaattggagatcaatatgctgatttgtttttggcagctaagaatttatcagatgctattttactttcagatatcctaagagtaaatactgaaataactaaggctcccctatcagcttcaatgattaaacgctacgatgaacatcatcaagacttgactcttttaaaagctttagttcgacaacaacttccagaaaagtataaagaaatcttttttgatcaatcaaaaaacggatatgcaggttatattgatgggggagctagccaagaagaattttataaatttatcaaaccaattttagaaaaaatggatggtactgaggaattattggtgaaactaaatcgtgaagatttgctgcgcaagcaacggacctttgacaacggctctattccccatcaaattcacttgggtgagctgcatgctattttgagaagacaagaagacttttatccatttttaaaagacaatcgtgagaagattgaaaaaatcttgacttttcgaattccttattatgttggtccattggcgcgtggcaatagtcgttttgcatggatgactcggaagtctgaagaaacaattaccccatggaattttgaagaagttgtcgataaaggtgcttcagctcaatcatttattgaacgcatgacaaactttgataaaaatcttccaaatgaaaaagtactaccaaaacatagtttgctttatgagtattttacggtttataacgaattgacaaaggtcaaatatgttactgaaggaatgcgaaaaccagcatttctttcaggtgaacagaagaaagccattgttgatttactcttcaaaacaaatcgaaaagtaaccgttaagcaattaaaagaagattatttcaaaaaaatagaatgttttgatagtgttgaaatttcaggagttgaagatagatttaatgcttcattaggtacctaccatgatttgctaaaaattattaaagataaagattttttggataatgaagaaaatgaagatatcttagaggatattgttttaacattgaccttatttgaagatagggagatgattgaggaaagacttaaaacatatgctcacctctttgatgataaggtgatgaaacagcttaaacgtcgccgttatactggttggggacgtttgtctcgaaaattgattaatggtattagggataagcaatctggcaaaacaatattagattttttgaaatcagatggttttgccaatcgcaattttatgcagctgatccatgatgatagtttgacatttaaagaagacattcaaaaagcacaagtgtctggacaaggcgatagtttacatgaacatattgcaaatttagctggtagccctgctattaaaaaaggtattttacagactgtaaaagttgttgatgaattggtcaaagtaatggggcggcataagccagaaaatatcgttattgaaatggcacgtgaaaatcagacaactcaaaagggccagaaaaattcgcgagagcgtatgaaacgaatcgaagaaggtatcaaagaattaggaagtcagattcttaaagagcatcctgttgaaaatactcaattgcaaaatgaaaagctctatctctattatctccaaaatggaagagacatgtatgtggaccaagaattagatattaatcgtttaagtgattatgatgtcgatcacattgttccacaaagtttccttaaagacgattcaatagacaataaggtcttaacgcgttctgataaaaatcgtggtaaatcggataacgttccaagtgaagaagtagtcaaaaagatgaaaaactattggagacaacttctaaacgccaagttaatcactcaacgtaagtttgataatttaacgaaagctgaacgtggaggtttgagtgaacttgataaagctggttttatcaaacgccaattggttgaaactcgccaaatcactaagcatgtggcacaaattttggatagtcgcatgaatactaaatacgatgaaaatgataaacttattcgagaggttaaagtgattaccttaaaatctaaattagtttctgacttccgaaaagatttccaattctataaagtacgtgagattaacaattaccatcatgcccatgatgcgtatctaaatgccgtcgttggaactgctttgattaagaaatatccaaaacttgaatcggagtttgtctatggtgattataaagtttatgatgttcgtaaaatgattgctaagtctgagcaagaaataggcaaagcaaccgcaaaatatttcttttactctaatatcatgaacttcttcaaaacagaaattacacttgcaaatggagagattcgcaaacgccctctaatcgaaactaatggggaaactggagaaattgtctgggataaagggcgagattttgccacagtgcgcaaagtattgtccatgccccaagtcaatattgtcaagaaaacagaagtacagacaggcggattctccaaggagtcaattttaccaaaaagaaattcggacaagcttattgctcgtaaaaaagactgggatccaaaaaaatatggtggttttgatagtccaacggtagcttattcagtcctagtggttgctaaggtggaaaaagggaaatcgaagaagttaaaatccgttaaagagttactagggatcacaattatggaaagaagttcctttgaaaaaaatccgattgactttttagaagctaaaggatataaggaagttaaaaaagacttaatcattaaactacctaaatatagtctttttgagttagaaaacggtcgtaaacggatgctggctagtgccggagaattacaaaaaggaaatgagctggctctgccaagcaaatatgtgaattttttatatttagctagtcattatgaaaagttgaagggtagtccagaagataacgaacaaaaacaattgtttgtggagcagcataagcattatttagatgagattattgagcaaatcagtgaattttctaagcgtgttattttagcagatgccaatttagataaagttcttagtgcatataacaaacatagagacaaaccaatacgtgaacaagcagaaaatattattcatttatttacgttgacgaatcttggagctcccgctgcttttaaatattttgatacaacaattgatcgtaaacgatatacgtctacaaaagaagttttagatgccactcttatccatcaatccatcactggtctttatgaaacacgcattgatttgagtcagctaggaggtgac

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1