核酸酶融合蛋白及其用途

文档序号:510658阅读:641来源:国知局
核酸酶融合蛋白及其用途
【专利摘要】提供了嵌合的核酸酶。具体而言,编码多肽的多核苷酸包含(i)至少包含源自归巢内切核酸酶的第一DNA结合结构域的第一模块,(ii)接头,和(iii)至少包含源自限制性内切核酸酶的第二DNA结合结构域和切割结构域的第二模块,其中嵌合的核酸酶仅与包含第一DNA结合结构域的DNA识别位点和第二DNA结合结构域的DNA识别位点的DNA在功能上相互作用,且其中所述切割结构域在嵌合的核酸酶结合后,切割特异性DNA切割位点内的DNA。还提供了包含多核苷酸的载体以及非人转基因生物。也提供了用于向非人生物的基因组中导入多核苷酸的方法。
【专利说明】核酸酶融合蛋白及其用途
[0001] 本发明涉及核酸酶融合蛋白及其多种用途。具体而言,涉及编码多肽的多核苷酸,所述多肽包含α)第一模块,所述第一模块至少包含源自归巢内切核酸酶的第一 DNA结合结构域,(?)接头,和(iii)第二模块,所述第二模块至少包含源自限制性内切核酸酶的第二 DNA结合结构域和切割结构域,其中所述多肽仅与包含第一 DNA结合结构域的DNA识别位点和第二 DNA结合结构域的DNA识别位点的DNA在功能上相互作用,且其中在多肽结合后,所述切割结构域在特异性DNA切割位点内切割DNA。本发明还考虑了包含所述多核苷酸的载体以及非人转基因生物,和由本发明的多核苷酸编码的多肽。最后,本发明涉及用于将目标核酸导入非人生物的基因组中的方法,其中应用本发明的多肽。
[0002]限制性内切核酸酶是DNA分子克隆的重要工具。这些酶是在特异性的识别和切割位点切割DNA必需的,从而允许可重复地生成确定的DNA片段。此外,可以组合由限制性内切核酸酶生成的所述确定的片段与其他DNA分子,特别是出于分子克隆的目的在连接反应中与载体组合。限制性内切核酸酶可如何用于分子克隆的原则是多年已知的。
[0003]过去已经表征了许多不同的原核生物中的许多限制性内切核酸酶。需要极少切割基因组DNA的限制性内切核酸酶,即,基因组中仅存在于有限数量的所述限制性内切核酸酶的DNA识别和切割位点。本领域已知存在极少切割的、天然存在的内切核酸酶。然而,在统计学上,绝大多数所述限制性内切核酸酶在基因组中切割超过I次。最近,生成了统计学上更少切割基因组,有时甚至只切割I次的人工酶。
[0004]现有技术中已经报道了这样的人工融合蛋白,所述融合蛋白包含用于DNA结合的锌指结构域和限制性内切核酸酶FokI的非特异性DNA切割结构域(Wahl998,Proc.Natl.Acad.Sc1.USA95:10564-10569 ;W02003/080809 ;W02007/139898 ;W02002/057294 ;W02000/27878 ;W01999/45132 ;W02003/062455 ;W02002/057293)。报道了转录激活子样效应子(TALE)而不是锌指结构域作为与Fokd的非特异性DNA切割结构域融合时的非常高特异性的核酸酶的合适的基础(Christian2010,Geneticsl86(2):757_U476)。
[0005]用于生成人工的、切点罕见大范围核酸酶(meganuclease)的其他方法基于归巢内切核酸酶,如LAGLIDADG归巢内切核酸酶,特别是1-CreI或1-SceI的(TO2009/076292 ;W02007/047859 ;W02008/152524 ;W02008/102198 ;W02008/093249 ;W02007/034262 ;W02003/078619 ;Doyon2006,J Am Chem Socl28:2477-2484)。还已经报道了包含归巢内切核酸酶(如1-SceI)和FokI的非特异性DNA切割结构域的人工融合蛋白(LippOW2009,核酸 Res37(9):3061-3073)。
[0006]此外,已经报道了在体内促进同源重组和DNA片段其他整合进入基因组的切点罕见内切核酸酶(W02003/080809 ;W02000/46386 ;W02009/006297 ;W02006/074956 ;W02006/134496 ;W02007/148964 ;W02009/130695)。相应的,可以使用这些酶生成多种类型
的转基因生物。
[0007]因此,需要其他的切点罕见内切核酸酶,特别是在确定的DNA切割位点进行切割并生产可以被生物的内源性DNA修复系统识别和使用的合适的切割产物使得促进目标DNA整合到所述生物的基因组中的那些切点罕见内切核酸酶。[0008]因此,本发明潜在的技术问题可被视为提供符合上述需求的工具和方法。通过权利要求和下文表征的实施方案解决了上述技术问题。
[0009]因此,本发明涉及编码多肽的多核苷酸,所述多肽包含:
[0010](i)第一模块,所述第一模块至少包含源自归巢内切核酸酶的第一 DNA结合结构域;
[0011](ii)接头;和
[0012](iii)第二模块,所述第而模块至少包含源自限制性内切核酸酶的第二 DNA结合结构域和切割结构域;
[0013]其中所述多肽仅与包含第一 DNA结合结构域的DNA识别位点和第二 DNA结合结构域的DNA识别位点的DNA在功能上相互作用,且
[0014]其中在多肽结合后,所述切割结构域在特异性DNA切割位点内切割DNA。
[0015]术语“多核苷酸”在本文中用于指单链或双链DNA分子和RNA分子。所述术语涵盖了基因组DNA、cDNA.hnRNA.mRNA和这类分子的所有的天然存在的或人工修饰的衍生物。多核苷酸优选可以为线性或环状的分子。此外,除了编码上述多肽的核酸序列外,本发明的多核苷酸可包含正确的转录和/或翻译所需要的额外序列,如5’ -或3’ -UTR序列。
[0016]术语“第一模块”在本文中用于指由本发明的多核苷酸编码的多肽的第一结构和/或功能部分。所述第一模块优选至少包含第一 DNA结合结构域,或至少基本上由第一 DNA结合结构域组成。DNA结合在本文中用于指多肽或其结构域与DNA物理结合的能力。这样的多肽或其结构域是DNA结合结构域,或包含DNA结合结构域。DNA结合发生DNA分子内的确定的核苷酸序列处,在本文也称为DNA结合结构域的DNA识别位点。除第一 DNA结合结构域外,第一模块还可以包含另外的结构域。这类另外的结构域优选可以是DNA结合结构域,或介导与调控蛋白或运输蛋白相互作用的其他结构域,例如,用于核运输调控蛋白的相互作用结构域。可理解,所述第一 DNA结合结构域优选还可以包含在第一模块中作为完整的DNA结合蛋白,如天然存在的归巢内切核酸酶、遗传修饰的归巢内切核酸酶或这类归巢内切核酸酶与另一种DNA结合蛋白(例如锌指DNA结合蛋白或DNA结合转录因子)的人工融合蛋白。本文的其他地方描述了可根据本发明应用的优选的DNA结合结构域的细节。
[0017]优选地,所述第一模块表现出关于DNA切割的降低的催化活性或未表现出催化活性。优选地,可以通过测量由本发明的多核苷酸编码的多肽的第一模块和包含第一 DNA结合结构域的相应的野生型归巢内切核酸酶引发的D NA切割,即,关于得到第一模块中的至少第一 DNA结合结构域的归巢内切核酸酶的DNA切割活性的比较,确定根据本发明所述的降低的催化活性。在本发明上下文中使用的降低意指统计学显著程度的降低,优选降低至少70 %、至少80 %、至少90 %、至少99 %、至少99.9%、至少99.99 %、至少99.999 %或至少99.9999%。通过标准的统计学技术,本领域技术人员可以在不进行额外工作的条件下确定降低是否是统计学显著的。
[0018] 术语“归巢内切核酸酶”在本文中用于指通常由内含子或内含肽编码的内切核酸酶。与转座子相似,天然存在的归巢内切核酸酶允许编码它们的遗传元件持续存在,因为它们通常切割受体生物的较少内含子或较少内含肽的等位基因DNA。归巢内切核酸酶的DNA识别位点足够长使得仅以非常低的可能性随机出现,优选大约每107bp —次至每109bp —次,或者甚至更低的可能性。优选地,与其他的内切核酸酶相反,归巢内切核酸酶的DNA结合结构域所识别的DNA识别位点由至少10、至少12、至少14、至少16、至少18、至少20、至少30或至少40个连续的核苷酸组成。优选地,所述识别位点是不对称的。切割较少内含子或较少等位基因的DNA后,活化细胞DNA修复系统,由此以反式供给含有内含子或内含肽的基因,即所谓的“归巢”过程。
[0019]存在5个不同的归巢内切核酸酶家族。归巢内切核酸酶LAGLIDADG家族的成员每者具有I个或2个LAGLIDADG基序每条多肽链。LAGLIDADG氨基酸序列是直接参与结构域-结构域和亚基-亚基相互作用和DNA切割过程的保守的序列。仅具有I个基序每条多肽链的那些酶充当同源二聚体,而具有2个基序的那些酶充当单体。归巢内切核酸酶的GIY-YIG家族的成员具有I个GIY-YIG基序作为与DNA结合基序相关的催化基序。该家族的蛋白水解酶是1-TevI。归巢内切核酸酶的His-Cys盒家族的成员含有30个氨基酸的序列段,包括2个保守的组氨酸和3个保守的半胱氨酸。1-PpoI是所述家族的成员,并且充当单体。归巢内切核酸酶的H-N-H家族的成员的特征是约30个氨基酸的共有序列,具有2对保守的组氨酸和I个天冬酰胺。所述保守的氨基酸形成α-β-β-α(αββα)金属指基序。归巢内切核酸酶的H)...D/Ε?(家族的特征是由侧翼为α螺旋的4链β片层组成的结构核心,所述α螺旋具有特征性的H)...D/EXK活性位点基序(参见例如Pingoud2005,Cell Mol Life Sci62(6):685-707)。
[0020]如上所述,根据本发明的第一 DNA结合结构域是归巢内切核酸酶的DNA结合结构域。这类第一 DNA结合结构域可源自的优选的归巢内切核酸酶选自:LAGLIDADG家族的归巢内切核酸酶、GIY-YIG家族归巢核酸酶、His-Cvs盒家族归巢内切核酸酶、H-N-H家族归巢内切核酸酶和PD...D/EXK家族归巢内切核酸酶。可用于得到待包括在由本发明的多核苷酸编码的多肽中的DNA结合结构域的所述归巢内切核酸酶家族的优选成员是F-Cph1、F-EcoT51、F-EcoT5I1、F-EcoT5IV、F-PhiU51、F-Sce1、F-SceI1、F-Tev1、F-TevI1、F-TevII1、F-TevIV、H-Dre1、1-Ani 1、1-ApeK1、1-Ban1、1-Bas1、1-Bmo1、1-BthI1、1-BthORFAP、1-Ceu1、1-Chu1、1-Cmoe1、1-Cpa1、1-CpaI1、1-Cre1、1-CreI1、1-Csm1、1-CVu1、1-Ddi1、1-Dmo1、1-HmnI, 1-HmuII, 1-LIal、1-LtrI, 1-LtrffI, 1-MsoI, 1-NanI, 1-NitI, 1-NjaI, 1-OnuI,1-PakI, 1-PogI, 1-PorI, 1-PpoI, 1-ScaI, 1-Scel、Ι-SceI1、1-SceII1、1-SceIV、1-SceV、1-SceV1、1-SceVI1、1-Spom1、1-Ssp6`8031、1-Tev1、1-TcvI1、1-TevII1、1-Tsp0611、1-Two1、1-Vdil411、P1-Mga1、P1-MleS1、P1-Mtu1、P1-Pab1、P1-PabI1、P1-Pfu1、P1-PfuI1、P1-Pko1、P1-PkoI1、P1-Psp1、P1-Sca1、P1-Sce1、P1-Tful、P1-TfuI1、P1-Thyl、P1-TIil、ΡΙ-Τ1ΠΙ、P1-Tma1、Pl-TmaKU Pl-Zbal。
[0021]更优选地,所述包含在第一模块中的第一 DNA结合结构域源自LAGLIDADG家族的归巢内切核酸酶。甚至更优选地,所述包含在第一模块中的第一 DNA结合结构域源自1-Scel。最优选的,所述DNA结合结构域源自1-SceI或其变体,并包含至少一个下列修饰:单独的替换D44S,或其与D145A的组合,或替换D44N与D145A的组合。上述修饰的位置是针对野生型1-SeeI蛋白提出的。这些修饰使DNA切割所需的1-SceI的催化结构域失活,使得经修饰的1-SceI缺少切割DNA的能力或至少具有降低的DNA切割活性,而基本维持了 DNA结合特性。可以理解,如果使用1-SceI蛋白的经修饰的变体,则上述氨基酸位置是可以改变的。但不论如何,可以设想来自这类变体的DNA结合结构域优选也在其氨基酸序列中的相应位置处包含至少I个修饰,这优选还导致DNA切割活性的缺失或降低。本领域技术人员可以在不付出额外劳动的条件下确定经修饰的变体的DNA切割活性,例如,通过使用后续实施例描述的测定法。1-SceI的氨基酸序列是本领域普遍已知的,并描述在例如Pingoud2005,见引文。此外,还描述了编码所述1-SceI氨基酸序列的核酸序列,并且考虑遗传密码的简并性,本领域技术人员可以在不付出额外劳动的条件下从氨基酸序列得出所述核酸序列。
[0022]在特别优选的实施方案中,所述1-SceI野生型序列具有如SEQ ID NO:1所示氨基酸序列或者是其变体,所述变体具有以至少I个氨基酸替换、缺失和/或添加不同于SEQ IDNO:1的氨基酸序列。
[0023]优选地,1-Scel的这类变体具有与SEQ ID NO:1至少70%、至少80%、至少90%、至少95%、至少98%或至少99%相同的氨基酸序列,并且优选地,包含与SEQ ID NO:1中所示1-SceI的DNA结合结构域具有基本相同的DNA结合活性的DNA结合结构域。优选地,通过分别比对氨基酸或核酸序列的全长或连续的氨基酸或核苷酸的序列段,确定本文使用的序列同一性。所述序列段是应比较的给定序列的参照序列的至少50%的长度。用于确定序列同一性百分比的优选的算法是已经整合到EMBOSS软件包(EMBOSS:The EuropeanMolecular Biology Open Software Suite.Rice 2000, Trends in Geneticsl6(6),276-277)的 needle 程序中的 Needleman 和 Wunsch 算法(Needlemanl970, J.Μ01.BiOl.(,48) =444-453),使用BL0SUM45或PAM250评分矩阵用于关系较远的蛋白质,或者使用BL0SUM62或PAM160评分矩阵用于更紧密相关的蛋白质,以及空位开放罚分为16、14、12、
10、8、6或4,和空位延伸罚分为0.5、1、2、3、4、5或6。本地安装EMBOSS软件包的指导和与其网络服务器的连接可见于http://emboss.sourceforge.net。使用needle程序用于比对两条氨基酸序列的优选参 数是默认参数,包括EBL0SUM62评分矩阵,空位开放罚分10,
[0024]空位延伸罚分0.5。还优选地,使用EMBOSS软件包的中的needle程序,确定两条核苷酸序列之间的百分比同一性,使用EDNAFULL评分矩阵,空位开放罚分为16、14、12、10、
8、6或4,空位延伸罚分为0.5、1、2、3、4、5或6。与使用Needle程序比对两条核酸序列结合的待使用的另外的优选的参数是默认参数,包括EDNAFULL评分矩阵,空位开放罚分10,空位延伸罚分0.5。本发明的核酸和蛋白质序列还可用作“查询序列”,用于对公共数据库实施检索,以例如鉴别其他家族成员或相关序列。可使用Altschul等人(Altschull990,J.M01.BiOl.215:403-10)的BLAST系列程序(2.2版),实施这类检索。
[0025]优选地,本文所述的1-Scel变体包括由这样的核酸编码的变体,所述核酸特异性地,并且优选在严谨条件下,与编码SEQ ID NO:1中所示氨基酸序列的核酸杂交。这些严谨条件是本领域技术人员已知的,可见于Current Protocols in Molecular Biology, Johnffiley&Sons, N.Y.(1989),6.3.1-6.3.6。优选的严谨杂交条件是在约45。。的6 X氯化钠/柠檬酸钠( = SSC)中的杂交条件,随后在50至65°C的0.2 X SSC,0.1% SDS中进行一次或两次洗涤步骤。本领域技术人员已知关于温度和缓冲液浓度这些杂交条件依赖于核酸类型和例如存在有机溶剂而不同。例如,在“标准杂交条件下”,浓度为0.1至5XSSC(pH7.2)的水性缓冲液的温度依赖于核酸类型在42°C至58°C之间改变。如果上述缓冲液中存在有机溶剂,例如50 %甲酰胺,则标准条件的温度是约42°C。DNA =DNA杂交物的杂交条件优选是0.1父55(:和201:至451:,优选在301:至451:之间。DNA:RNA杂交物的杂交条件优选是0.1XSSC和30°C至55°C,优选在45°C至55°C之间。上述杂交温度是针对例如在缺乏甲酰胺的条件下,长度约IOObp (=碱基对)的核酸和50%的G+C含量确定的。本领域技术人员通过查询教科书,如上述教科书或下列教科书:Sambrook等人,"Molecular Cloning”,Cold Spring Harbor Laboratory, 1989 ;Hames 和 Higgins (编著)1985,,,Nucleic AcidsHybridization:A Practical Approach,,,IRL Press at Oxford University Press,Oxford ;Brown (编著)1991, " Essential Molecular Biology:A Practical Approach,,,IRL Press atOxford University Press, Oxford知晓如何确定需要的杂交条件。备选地,多核苷酸变体可通过基于PCR的技术获得,如基于混合的寡核苷酸引物的DNA扩增,即,使用针对本发明的多肽的保守结构域的简并引物。可以通过多核苷酸的核酸序列或本发明的多肽的氨基酸序列的序列比较,鉴别本发明的多肽的保守的结构域。所附实施例中描述了适合作为PCR引物的寡核苷酸以及合适的PCR条件。可使用来自酵母的DNA,优选来自酿酒酵母的DNA作为模板。
[0026]优选地,本发明也设想了缩短的1-SceI多肽,其不同于SEQ ID NO:1的或其上述变体,不同在于缺失了 5至9个C-末端氨基酸,优选缺失了至少5、6、7、8或多达全部9个C-末端氨基酸。
[0027]术语“第二模块”在本文中用于指由本发明的多核苷酸编码的多肽的第二结构和/或功能部分。优选地,所述第二模块至少包含源自限制性内切核酸酶的第二 DNA结合结构域和切割结构域,或至少基本上由源自限制性内切核酸酶的第二 DNA结合结构域和切割结构域组成。本文所述的切割结构域能够在特异性DNA切割位点处切割DNA分子。根据本发明所述的特异性DNA切割位点指被切割结构域识别并在预先确定的核苷酸之间切割的位点。相反,一些内切核酸酶具有这样的切割结构域,所述切割结构域在某位置处切割DNA而不论该位置处存在的核苷酸。表现出这类非特异性切割的原型内切核酸酶是FokI。除第二DNA结合结构域和切割结构域外,第二模块还可以包含另外的结构域。这类另外的结构域优选可以是DNA结合结构域,以及介导两个第二模块之间的相互作用的结构域,或介导与调控蛋白或运输蛋白的相互作用的其他结构域,例如核运输调控蛋白的相互作用结构域。可理解,优选地,所述第二 DNA结合结构域和/或切割结构域也可以包含在第二模块中作为完整的内切核酸酶蛋白,例如天然存在的限制性内切核酸酶或经遗传修饰的内切核酸酶。此外,已知限制性内切核酸酶,并且特别是所述II型限制性内切核酸酶作为同源二聚体结合DNA,只有非常少的例外。因此,本文所述的DNA结合结构域和切割结构域可以是两个限制性内切核酸酶亚基的同源二聚化的结果。优选地,特异性的DNA切割位点和所述限制性内切核酸酶的第二 DNA结合结构域的DNA识别位点是相同的。还优选地,包含在第二模块中的所述第二 DNA结合结构域和切割结构域源自这样的限制性内切核酸酶,所述限制性内切核酸酶当与野生型限制性内切核酸酶相比较时,表现出降低的DNA结合和/或降低的催化活性。本文其他地方描述了根据本发明应用的优选的DNA结合结构域的细节。还优选地,根据本发明设想的是在缺乏DNA识别位点的条件下,具有降低的形成同源二聚体的能力的第二模块。特别的是,在特别优选的实施方案中设想了仅当两个多肽单体被募集到相应的DNA识别位点时形成如上文所述多肽的功能性同源二聚体。由此,可以阻止由于形成同源二聚体产生的非特异性DNA结合 ,而同源二聚体的形成是I个单体与其相应的识别位点结合以及随后的单体之间的蛋白质-蛋白质相互作用而非特异性DNA结合导致的第二单体的二聚化的结果。[0028]优选的内切核酸酶是IIp型限制性内切核酸酶(参见Pingoud2005,见上述引文处),从所述内切核酸酶可以得到包含在第二模块中的第二 DNA结合结构域和DNA切割结构域。与前述归巢内切核酸酶相反,这类内切核酸酶的DNA结合结构域识别的DNA分子中的识别位点由至少4个,至少6或多至8个连续核苷酸组成。优选地,所述识别位点是回文的。此外,优选地,IIp型酶切割DNA识别位点中的DNA或与其直接相邻的DNA。所述DNA识别位点在基因组中是相当常见的。本文所述优选的IIp型限制性内切核酸酶选自PvuI1、EcoRV、BamH1、Bcn1、BfaS0RF1835P、Bfi1、Bgl1、BglI1、BpuJl、Bse6341、BsoB1、BspD61、BstY1、CfrlO1、Ecll8kl、Eco01091、EcoRl、EcoRI1、EcoRV、EcoR1241、EcoR12411、HinPl1、HincII, Hindlll、Hpy991、Hpyl881、MspI, Mun1、MvaI, Nael、NgoMIV、NotI, OkrAI, PabI,Pac1、PspG1、PvuI1、Sau3A1、Sda1、SfiI,SgrA1、Tha1、VvuY0RF266P、DdeI,Eco571、HaeIII,HhaILHindII和Ndel。更优选地,所述IIp型限制性内切核酸酶或源自其的DNA结合和切割结构域经修饰,表现出没有或至少降低的星活性、关于其DNA识别位点的降低的DNA结合(Kffl)和/或切割结构域的降低的DNA切割活性(kMt)。更优选地,在一个实施方案中设想了II型限制性内切核酸酶或源自其的结构域在缺乏DNA识别位点的条件下,具有降低的形成同源二聚体的能力。可以通过例如随机突变和之后在存在和缺乏DNA识别位点条件下测试二聚化作用,获得用于该目的的合适的限制性内切核酸酶或其结构域。可以鉴别出仅在存在DNA识别位点时二聚化,而不在缺乏DNA识别位点时二聚化的那些变体并将所述变体用于由本发明多核苷酸编码的多肽。
[0029]最优选地,根据本发明设想的内切核酸酶是PvuII或其经遗传修饰的变体,因此,包含在第二模块中的所述第二 DNA结合结构域和切割结构域源自PvuII。更优选地,包含在第二模块中的所述第二 DNA结合结构域和切割结构域源自PvuII或其变体,并包含至少一个下列修饰:替换T46G、替换H83A、替换Y94F、替换T46G与H83A的组合、替换T46G与Y94F的组合,或替换T46G与H83A和Y94F的组合。上文所述修饰的位置是对于野生型PvuII蛋白标注的。然而可理解,如果使用PvuII蛋白的经修饰的变体,则这些位置将发生改变。不论如何,设想了来自这类变体的DNA结合结构域在其氨基酸序列中的相应位置处优选也包含至少一个修饰。PvuII的氨基酸序列是本领域普遍已知的,并描述在例如Athanasiadisl990, Nucleic acid Resl8 (21):6434 中。此外,也已经描述了编码所述PvuII氨基酸序列的核酸序列,并且在考虑遗传密码的简并性时,本领域技术人员不付出额外劳动就可以从氨基酸序列得到所述核酸序列。
[0030]在特别优选的实施方案中,根据本发明所述的PvuII野生型序列具有如SEQ IDNO:2中所示氨基酸序列或其变体,所述变体具有以至少一个氨基酸替换、缺失和/或添加而不同于SEQ ID NO:2的氨基酸序列。
[0031]优选地,PvuII的这类变体具有与SEQ ID NO:2至少70%、至少80%、至少90%、至少95%、至少98%或至少99%相同的氨基酸序列,并且优选包含与具有SEQ ID NO:2的PvuII的DNA结合和切割结构域基本相同的DNA结合和切割特性的DNA结合结构域。本文其他地方详细描述了如何确定所述序列同一性。
[0032]优选地,本文所述的PvuII变体包括由这样的核酸编码的那些变体,所述核酸特异性地并且,优选在严谨条件下,与编码SEQ ID NO:2中所示氨基酸序列的核酸杂交。本文其他地方详细描述了优选的严谨杂交条件。可选的,多核苷酸变体可通过基于PCR的技术获得,如基于混合的寡核苷酸引物的DNA扩增,即,使用针对本发明的多肽的保守结构域的简并引物。可以通过本发明的多核苷酸的核酸序列或多肽的氨基酸序列的序列比较,鉴别本发明的多肽的保守结构域。所附实施例中描述了适合作为PCR引物的寡核苷酸以及合适的PCR条件。可使用来自细菌的DNA,并且优选普通变形杆菌(Proteus vulgaris)的DNA作为模板。
[0033]在由本发明的多核苷酸编码的多肽中,通过接头分隔第一模块和第二模块。所述接头优选是这样的灵活结构,所述结构具有的长度足以允许包含在模块中的DNA结合结构域与其DNA结合位点相互作用,并允许DNA切割结构域切割DNA。待用于由本发明的多核苷酸编码的多肽中的灵活的接头结构优选由5至20个,更优选6至10个或更多个氨基酸组成,即,至少6、至少7、至少8、至少9或10或更多个氨基酸组成。优选地,所述接头具有如SEQ ID NO:3 (ASRTTG)或SEO ID NO:4(ASTKQLVKSG)中所示氨基酸序列。可选地,接头可具有如 SEQ ID NO:5(ASGGSGSGSG)或 SEQ ID NO:6 中(ASGDSGSDSG)的氨基酸序列。[0034]由本发明的多核苷酸编码的多肽应该仅与包含第一 DNA结合结构域的DNA识别位点和第二 DNA结合结构域的DNA识别位点的DNA在功能上相互作用。因此,第一 DNA结合结构域或第二 DNA结合结构域优选都不应该足以允许由本发明的多核苷酸编码的多肽与DNA在功能上相互作用。在功能上相互作用在本文中用于指与DNA结合位点的特异性DNA结合,使切割结构域可以在结合后在其特异性的DNA切割位点处切割。为了有功能,根据本发明的多肽将形成包含两条多肽的同源二聚体,具有本发明的多肽的结构。两条多肽的第二模块在物理上彼此相互作用。然后,第二模块能够结合二聚体化形式中的第二 DNA识别位点。因此,处于其二聚体化的功能性形式的本发明的多肽识别三重DNA识别位点,所述三重DNA识别位点包含第二 DNA结合结构域的识别位点,在所述第二 DNA结合结构域的识别位点的5’和3’端的侧翼为第一 DNA结合结构域的识别位点。在与所述三重DNA识别位点特异结合后,多肽应该通过其DNA切割结构域在所述特异性切割位点内或与其相邻处切割DNA。优选地,所述切割位点和第二 DNA结合位点是相同的。因此,根据本发明的多肽在切割位点内或与其相邻的定义的核苷酸处切割DNA。
[0035]本发明的多核苷酸优选编码这样的多肽,所述多肽包含(i)至少包含DNA结合结构域的第一模块,所述DNA结合结构域源自1-Scel,并且优选地,源自上述1-SceI的失活变体的(ii)具有SEQ ID NO:3或4的接头;和(iii)至少包含第二 DNA结合结构域和切割结构域的第二模块,所述第二 DNA结合结构域和切割结构域源自PvuII,并且优选地,源自上述PvuII变体,其中DNA结合和切割结构域经修饰以表现出没有或至少降低的星活性、具有关于其DNA识别位点的降低的DNA结合和/或表现出切割结构域的降低的DNA切割。由这类多核苷酸编码的多肽应该仅与包含1-SceI的第一 DNA结合结构域的DNA识别位点和源自PvuII的第二 DNA结合结构域的DNA识别位点的DNA在功能上相互作用。由于为了形成活性酶,PvuII将形成同源二聚体,因此可理解多肽识别的DNA结合位点是包含PvuII DNA结合位点的三重DNA结合位点,在所述PvuII DNA结合位点的5’和3’端侧翼是1-SceI DNA结合位点(1-Scel DNA识别位点-PvuII DNA识别位点-1-SceI DNA识别位点)。此外,多肽在结合后将在特异性DNA切割位点内,即,在PvuII结合位点的确定的位置和核苷酸处切割 DNA。
[0036]更优选地,编码这类多肽的本发明的多核苷酸包含如SEQ ID NO:7或8中任一项所示的核酸序列,或编码包含如SEQ ID NO:9或10中任一项所示氨基酸序列的多肽的核酸序列。本发明也涵盖了这样的变体多核苷酸,所述变体具有不同于SEQ ID NO:7或8的核酸序列,或编码以至少I个核苷酸或氨基酸的替换、缺失和/或添加不同于SEQ ID NO:9或10的氨基酸序列。优选地,这类变体具有与SEQ ID NO:7或8至少70%、至少80%、至少90%、至少95%、至少98%或至少99%相同的核酸序列,或与SEQ ID NO:9或10至少70%、至少80 %、至少90 %、至少95 %、至少98 %或至少99 %相同的氨基酸序列。这类变体优选包含上述第一和第二模块以及接头。本文其他地方详细描述了如何确定所述序列同一性。还优选地,本文所述的变体包括由核酸编码的那些变体,所述核酸特异性地,并且优选在严谨条件下,与编码SEQ ID NO:7或8所示氨基酸序列的核酸或与编码如SEQ ID NO:9或10中所示氨基酸序列的核酸杂交。再次,这类变体优选地包含上述第一和第二模块以及接头的结构特征。
[0037]有利地,本发明提供了编码这样的多肽的多核苷酸,所述多肽能够特异性识别人工组成的三重DNA识别序列,并能够在特异性DNA切割位点内,即,在预先确定的核苷酸之间的确定的位置处切割包含这类三重DNA识别序列的DNA。由于三重DNA识别序列是相当大的序列,因此假设在天然存在的基因组中仅罕见的出现。优选地,所述三重DNA识别位点在统计学上出现少于I次每个基因组。其结果是,根据本发明的多肽应该仅罕见地切割基因组,并且优选地,切割I次,即,在三重DNA识别位点处。因而,多肽可以协助异源DNA (如转基因)整合在基因组DNA内的某个基因座处,其在发生整合后可以轻易地鉴另O。此外,也可以协助同源重组事件。由于本发明的缘故,将显著改善了转基因生物,如转基因微生物、转基因植物或转基因动物的生成。然而,本发明的多肽还可用作单纯的DNA切割工具,即,作为特异性针对上述人工三重DNA识别位点的切点罕见内切核酸酶。这类切点罕见内切核酸酶理所当然可用于所有的常规克隆方法。本发明的多核苷酸编码这样的多肽,所述多肽相比锌指核酸酶或TALe核酸酶、以及所谓的人工大范围核酸酶具有改良的特异性,因其识别上述延伸的三重DNA识别位点。此外,还发现平末端切割物(如PvuII)可用于生成本发明的多肽。这多少是令人惊讶的,因为之前报道过通过平末端切割内切核酸酶(如PvuII)向基因组DNA中导入的平末端对于一些生物的修复系统可能是较差底物(ffestmoreland2010, DNA Repair9:617-626)。
[0038]关于上述术语的解释和定义经必要修正后适用于本发明的下列实施方案。
[0039]本发明还涉及包含本发明的多核苷酸的载体。
[0040]在本文中使用的术语“载体”涵盖了噬菌体、质粒、病毒或逆转录病毒载体,以及人工染色体,如细菌或酵母人工染色体。涵盖了本发明的多核苷酸的载体优选还包含用于在宿主中增殖和/或选择的可选择标志物。可以通过常规转化或转染技术将载体导入到原核和真核细胞中。术语“转化”和“转染”、接合和转导在本上下文中意在包括现有技术已知的多种用于将外源核酸(例如DNA)导入宿主细胞中的方法,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质体转染、天然感受态、化学介导的转移、电穿孔或颗粒轰击。用于宿主细胞(包括植物细胞)的转化或转染的合适方法可见于Sambrook等人(Molecular Cloning:A Laboratory Manual.,第 2 版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY, 1989)和其他实验室教科书,如Methods in Molecular Biology, 1995,第44卷,Agrobacterium protocols,编著:Gartland 和 Davey, Humana Press, Totowa, New Jersey。可选地,可以通过热休克或电穿孔技术导入质粒载体。如果载体是病毒,其可以在应用于宿主细胞之前,使用恰当的包装细胞系在体外包装。逆转录载体可以是复制感受态或复制缺陷型。在后一情况下,病毒增殖一般仅发生在感受态宿主细胞中。
[0041]合适的克隆载体一般是熟练的技术人员已知的。特别地,其包括可以在微生物系统中复制的载体。这些载体优选确保在细菌、酵母或真菌中的有效克隆。
[0042]优选地,在本发明的载体中,多核苷酸与允许在原核或真核宿主细胞或其分离的级分中表达的表达控制序列有效连接。因此,本发明的载体优选是表达载体。多核苷酸的表达包含多核苷酸转录为可翻译的mRNA。确保在宿主细胞中表达的调控元件是本领域普遍已知的。优选地其包含确保转录起始的调控序列和/或确保转录终止和稳定转录物的多聚A信号。额外的调控元件可包括转录和翻译增强子。允许在原核宿主细胞中表达的可能的调控元件包含,例如大肠杆菌中的lac-、trp-或tac-启动子,并且允许在真核宿主细胞中表达的调控元件的例子是酵母中的AOXl-或GALl-启动子或哺乳动物和其他动物细胞中的CMV-、SV40-、RSV-启动子(劳斯氏肉瘤病毒)、CMV-增强子、SV40-增强子或球蛋白内含子。此外,可诱导的表达控制序列可用于本发明涵盖的表达载体中。这类可诱导的载体可包含tet或Iac操纵子序列或受热激或其他环境因素可诱导的序列。合适的表达控制序列是本领域普遍已知的。除了负责转录起始的元件外,此类调控元件还可包含在多核苷酸的下游的转录终止信号,如SV40-多聚A位点或tk-多聚A位点。
[0043]优选地,原核生物中的蛋白质表达优选涉及使用包含组成型或诱导型启动子的载体,所述启动子控制融合蛋白或非融合蛋白的表达。典型的融合表达载体尤其是pGEX (GE Healthcare, Piscataway, NJ ;Smithl988, Gene67:31-40)、pMAL(New EnglandBiolabs, Ipswich, MA)和 pRIT5(GE Healthcare, Piscataway, NJ),其中谷胱甘妝 S 转移酶(GST)、麦芽糖-E -结合蛋白和蛋白分别与重组靶蛋白融合。合适的诱导型非融合大肠杆菌表达载体的例子尤其是 pTrc (Amannl988, Gene69:301-315)和 pETlId(Studier 等人,Gene Expression Technology:Methods in Enzymologyl85, Academic Press, SanDiego, California(1990)60-89)。pTrc载体的靶基因表达是基于宿主RNA聚合酶对杂交体trp-lac融合启动子的转录的。载体pETlld的靶基因表达是基于由共表达的病毒RNA聚合酶(T7gnl)介导的T7-gnl0-lac融合启动子的转录的。由宿主菌株BL21 (DE3)或HMS174(DE3)从常驻的λ -原噬菌体提供此病毒聚合酶,所述λ-原噬菌体具有处于lacUV5启动子的转录控制下的T7gnl基因。适用于原核生物的其他载体是本领域技术人员已知的,这些载体是例如在大肠杆菌中pLG338、pACYC184、pBR系例如pBR322、pUC系歹如PUC18 或 pUC19、M113mp 系歹、pKC30、pR印4、pHSl、pHS2、pPLc236、pMBL24、pLG200、pUR290、piN-1I1113-Bl、λ gtll 或 pBdCI ;在链霉菌中 piJlOl、piJ364、pIJ702 或 pIJ361 ;在芽孢杆菌中pUBllO、pC194或pBD214 ;棒状杆菌中的pSA77或pAJ667。
[0044]本文还优选涵盖了酵母表达载体。用于在酿酒酵母中表达的载体例子包含pYeDesaturasecl(Baldari1987,EMBO J6:229-234)、pMFa(Kurjanl982,Cell30:933-943)、pJRY88(Schultzl987, Gene54:113-123)和 pYES2(Invitrogen Corporation, San Diego,CA)。载体和用于构建适用于其他真菌(如丝状真菌)的载体的方法包括详细描述在:van den Hondel, C.A.M.J.J., &Punt, P.J.(1991) “Gene transfer systems and vectordevelopment for filamentous fungi, in:Applied Molecular Genetics of fungi,J.F.Peberdy 等人编著,第 1-28 页,Cambridge University Press:Cambridge,或在:MoreGene Manipulations in Fungi [J.W.Bennet&L.L.Lasure,编著,第 396-428 页:AcademicPress:San Diegol中的那些。另外的合适的酵母载体是例如pAG_l、YEp6、YEpl3或pEMBLYe23。
[0045]作为备选,还可以使用杆状病毒表达载体,在昆虫细胞中表达根据本发明的多核苷酸。可用于在培养的昆虫细胞(例如Sf9细胞)中表达蛋白质的杆状病毒载体包含pAc系列(Smithl983,Mol.Cell Biol..3:2156-2165)和pVL系列(Lucldowl989, Virologyl70:31-39)。 [0046]优选也被本发明涵盖的用于真核细胞的合适的表达载体是本领域已知的,如Okayama-Berg cl) NA 表达载体 pcDVl (Pharmacia)、pBluescript (Stratagene)、pCDM8、pRc/CMV、pcDNAl、pcDNA3 (Invitrogen)或 pSPORTl (Invitrogen)。表达载体还可以源自病毒,如逆转录病毒、痘病毒、腺相关病毒、肝炎病毒或牛乳头瘤病毒,可用于将本发明的多核苷酸或载体递送到靶细胞群中。可使用本领域技术人员普遍已知的方法构建重组病毒载体;参见例如 Sambrook, Molecular Cloning A Laboratory Manual Cold Spring HarborLaboratory(1989)N.Y.和 AusubeI, Current Protocols in Molecular Biology.GreenPublishing Associates and Wiley Interscience, N.Y.(1994)中描述的技术。
[0047]优选的植物表达载体包含详细描述在:Beckerl992,Plant Mol.Biol.20:1195-1197 ;和 Bevanl984, Nucl.Acids Res.12:8711-8721 ;Vectors for Gene Transferin Higher Plants ;在:Transgenic Plants,第 I 卷,Engineering and Utilization,编著:Kung和R.Wu, Academic Press, 1993,第15-38页中。植物表达盒优选包含表达控制序列,所述表达控制序列能够控制植物细胞中的基因表达且有效连接使得每条序列都可以实现它的功能,如转录终止,例如,多聚腺苷酸信号。优选的多聚腺苷酸信号是那些源自根癌农杆菌(Agrobacterium tumefaciens) T-DNA,如已知是章鱼喊合酶的Ti质粒pTiACH5的基因3(Gielenl984,EMBO J.3:835ff)的那些多聚腺苷酸信号,或其功能等价物,但在植物中有功能活性的所有其他终止子也是合适的。由于植物基因表达非常经常不受限于转录水平,植物表达盒优选包含有效连接的其他序列,如翻译增强子,例如超驱动序列,所述超驱动序列包含烟草花叶病毒5’-非翻译前导序列,增加蛋白质/RNA比例(Galliel987,Nucl.Acids Researchl5:8693-8711)。如上所述,植物基因表达必须与合适的启动子有效连接,所述启动子以正确的定时或以细胞-或组织-特异性的方式触发基因表达。可利用的启动子是组成型启动子(Benfeyl989,EMBO J.8:2195-2202),如源自植物病毒的启动子,如35SCAMV (Franck1980, Cel 121:285-294) U9S CaMV (还参见 US5352605 和 TO84/02913),或植物启动子,如描述在US4,962,028中的二磷酸核酮糖羧化酶小亚基的启动子。在植物基因表达盒中用于有效连接的其他优选的序列是将基因产物引导至其相应的细胞区室中所需要的革巴向序列(参见综述Kermodel996, Crit.Rev.Plant Sc1.15,4:285-423及其中引用的参考文献),例如引导到液泡、细胞核、所有类型的质体(如淀粉粒、叶绿体、有色体)、胞外空间、线粒体、内质网、油体、过氧化物酶体和植物细胞的其他区室中所需要的。
[0048]还可以通过化学诱导型启动子协助基因表达(参见Gatzl997, Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108中的综述)。当需要基因表达以时间特异性的方式发生时,化学诱导型启动子是特别合适的。这类启动子的例子是水杨酸诱导型启动子(W095/19443)、四环素诱导型启动子(Gatzl992,Plant J.2,397-404)和乙醇诱导型启动子。
[0049]本发明考虑了包含本发明的多核苷酸或载体的非人生物。 [0050]术语“非人生物”在本文中涉及除人以外的任何生物。因此,非人生物优选是微生物、植物、植物部分或其分离的细胞,或动物、动物组织或其分离的细胞。此外,真核或细菌宿主细胞也被涵盖在非人生物中。非人生物可包含本发明的多核苷酸或本发明的载体,用于DNA增殖的目的以及表达根据本发明的多肽的目的以及上述两种目的。多核苷酸或载体可以以整合到宿主基因组中的形式存在,或以附加体的形式存在。下文描述了根据本发明的另外的优选的非人生物。
[0051]优选的微生物是原核和真核微生物,并且特别地选自细菌、真菌、酵母或来自任一种下述非人动物或植物的细胞培养物细胞。
[0052]优选的非人动物包括哺乳动物、鸟类、爬行类、鱼类、线虫和昆虫。更优选地,非人动物是哺乳动物,并且特别是大鼠、小鼠、兔、狗、猫或农场动物,如猪、马、羊或奶牛。
[0053]优选的植物选自以下植物科:Adelotheciaceae、漆树科(Anacardiaceae)、菊科(Asteraceae)、伞形科(Apiaceae)、禅木科(Betulaceae)、紫草科(Boraginaceae)、十字花科(Brassicacae)、凤梨科(Bromeliaceae)、番木瓜科(Caricaceae)、大麻科(Cannabaceae)、旋花科(Convolvulaceae)、黎科(Chenopodiaceae)、隐甲藻科(Crypthecodiniaceae)、葫芦科(Cucurbitaceae)、牛毛藓科(Ditrichaceae)、胡颓子科(Elaeagnaceae)、杜鹽花科(Ericaceae)、大戟科(Euphorbiaceae)、显科(Fabaceae)、猶牛儿科(Geraniaceae)、禾本科(Gramineae)、胡桃科(Juglandaceae)、棒科(Lauraceae)、豆科(Leguminosae)、亚麻科(Linaceae)、真绿藻纲(Prasinophyceae)或蔬菜植物、或观赏植物,如万寿菊(Tagetes)。可提及的例子是下列植物,选自:Adelotheciaceae,例如剑叶藓属(,Physcomitrella);漆树科(Anacardiaceae),例如黄连木属(Pistacia)、芒果属(Mangifera)、腰果属(Anacardium);菊科(Asteraceae),例如金盖花属(Calendula)、红花属(Carthamus)、矢车菊属(Centaurea)、菊苣属(Cichorium)、菜蓟属(Cynara)、向日葵属(Helianthus)、萬苣属(Lactuca)、Locusta、万寿菊属(Tagetes)、纟顿草属(Valeriana);伞形科(Apiaceae),例如胡萝卜属(Daucus);禅木科(Betulaceae),例如榛属(Corylus);紫草科(Boraginaceae),例如琉璃苣属(Borago);十字花科(Brassicaceae),例如芸薹属(Brassica)、MelanosinapiS、白芥属(Sinapis)、拟南芥属(Arabadopsis);凤梨科(Bromeliaceae),例如凤梨属(Ananas)、凤梨科植物(Bromelia);番木瓜科(Caricaceae),例如番木瓜属(Carica);大麻科(Cannabaceae),例如大麻属(Cannabis);旋花科(Convolvulaceae),例如甘薯属(Ipomea)、旋花属(Convolvulus);藜科(Chenopodiaceae),例如甜菜属(Beta);隐甲藻科(Crypthecodiniaceae),例如隐甲藻属(Crypthecodinium);葫芦科(Cucurbitaceae),例如南瓜属(Cucurbita);桥弯藻科(Cymbellaceae),例如双眉藻属(Amphora)、桥弯藻属(Cymbella)、Okedenia、褐指藻属(Phaeodactylum)、瑞氏藻属(Reimeria);牛毛藓科(Ditrichaceae),如牛毛藓科(Ditrichaceae)、高地藓属(Astomiopsis)、角齿藓属(Ceratodon)、Chrysoblastella、牛毛藓属(Ditrichum)、对叶藓属(Distichium)、Eccremidium、Lophidion、Philibertiella、丛毛藓属(Pleuridium)、石缝藓属(Saelania)、毛齿藓属(Trichodon)、Skottsbergia ;胡颓子科(Elaeagnaceae),如胡颓子属(Elaeagnus);杜胃I花科(Ericaceae),如山月桂属(Kalmia);大戟科(Euphorbiaceae),如木薯属(Manihot)、Janipha、麻风树属(Jatropha)、菌麻属(Ricinus);豆科(Fabaceae),如豌豆属(Pisum)、合欢属(Albizia)、Cathormion、Feuillea、音加属(Inga)、围诞树属(Pithecolobium)、金合欢属(Acacia)、含羞草属(Mimosa)、苜猜属(Medicago)、大豆属(Glycine)、扁豆属(Dolichos)、菜豆属(Phaseolus)、大豆属(Soja);葫芦藓林 Funariaceae),如 Aphanorrhegma,Entosthodon,葫芦藓属(Funaria),剑叶藓属(Physcomitrella),立碗藓属(Physcomitrium);猶牛儿科(Geraniaceae),如天竺葵属(Pelargonium)、椰子属(Cocos)、01eum ;禾本科(Gramineae),如甘鹿属(Saccharum);胡桃科(Juglandaceae),如胡桃属(Juglans)、Wallia ;樟科(Lauraceae),如鳄梨属(Persea)、月桂属(Laurus);豆科(Leguminosae),如落花生属(Arachis);亚麻科(Linaceae),如亚麻属(Linum)、Adenolinum ;Lythrarieae,如石植属(Punica);锦葵科(Malvaceae),如棉属(Gossypium);地钱科(Marchantiaceae),如地钱属(Marchantia);色蕉科(Musaceae),如色蕉属(Musa);柳叶菜科(Onagraceae),如 Camissonia、月见草属(Oenothera);掠榈科(Palmae),如 Elacis ; S 粟科(Papaveraceae),如S粟属(Papaver);胡麻科(Pedaliaceae),如胡麻属(Sesamum);胡椒科(Piperaceae),如胡椒属(Piper)、Artanthe、草胡椒属(Peperomia)、Steffensia ;禾本科(Poaceae),如大麦属(Hordeum)、黑麦属(Secale)、燕麦属(Avena)、高梁属(Sorghum)、须芒草属(Andropogon)、域毛草属(Holcus)、黍属(Panicum)、稻属(Oryza)、玉蜀黍属(Zea(玉米))、小麦属(Triticum);紫球藻科(Porphyridiaceae),如 Chroothece、Flintiella、Petrovanella、紫球藻属(Porphyridium)、红球藻属(Rhodella)、Rhodosorus、Vanhoeffenia ;山龙眼科(Proteaceae),如澳洲坚果属(Macadamia);真绿藻纲(Prasinophyceae),如肾藻属(Nephroselmis)、Prasinococcus、Scherffelia、扁藻属(Tetraselmis)、Mantoniella、Ostreococcus ;菌草科(Rubiaceae),如咖啡属(Coffea);玄参科(Scrophulariaceae),如毛蕊花属(Verbascum);煎科(Solanaceae),如辣椒属(Capsicum)、烟草 属(Nicotiana)、煎属(Solanum)、番煎属(Lycopersicon);梧桐科(Sterculiaceae),如可可属(Theobroma);或山茶科(Theaceae),如山茶属(Camellia)。
[0054]更优选地,植物选自植物科:菊科、十字花科、藜科、大戟科、禾本科、豆科和锦葵科。
[0055]尤其优选的是例如以下属和种:欧洲油菜(Brassica napus)、芜菁亚种(Brassicarapa ssp.)、野欧白芥(Sinapis arvensis)、芥菜(Brassica j uncea)、芥菜芥菜变种(Brassica juncea vaF.juncea)、芥菜皱叶变种(Brassica juncea var.crispifolia)、芥菜大叶变种(Brassica juncea var.foliosa)、黑芥(Brassica nigra)、Brassicasinapioides、芥菜(Melanosinapis communis)、野甘蓝(Brassica oleracea)、拟南芥(Arabidopsis thaliana)、舌甘菜(Beta vulgaris)、Beta vulgaris var.altissima、舌甘菜普通变种(Beta vulgaris var.Vulgaris)、Beta maritima、甜菜宿根变种(Beta vulgarisvar.perennis)、Beta vulgaris var.conditiva 或 Beta vulgaris var.esculenta、三角褐指藻(Phaeodactylum tricornutum)、豌豆(Pisum sativum)、饲料豌豆(Pisumarvense)、Pisum humile、Albizia berteriana、合欢(Albizia iulibrissin)、阔荚合欢(Albizia lebbeck)、Acacia berteriana、Acacia littoralis、Albizia berteriana、Albizzia berteriana、Cathormion berteriana、Feuillea berteriana、Inga fragrans、Pithecellobium berterianum、Pithecellobium fragrans、Pithecolobium berterianum、Pseudalbizzia berteriana、Acacia julibrissinΛAcacia nemu、Albizia nemu、Feuilleeaj ulibrissin、Mimosa julibrissinΛMimosa speciosa、Sericanrda julibrissin、阔荚金合欢(Acacia lebbeck)、Acacia macrophylla,大叶合欢(Albizia lebbeck)、Feuilleealebbeck、大叶含羞草(Mimosa lcbbeck)、木棉树(Mimosa speciosa)、紫花首猜(Medicagosativa)、野苜猜(Medicago falcata)、杂交苜猜(Medicago varia)、大豆(Glycine max)、德扁豆(Dolichos soja)、宽叶蔓豆(Glycine gracilis)、大豆(Glycine hispida)、大菜豆(Phaseolus max)、So j a hispida 或大豆(Soja max)、大麦(Hordeum vulgare)、芒颖大麦草(Hordeum jubatum)、鼠大麦草(Hordeum mu rinum)、短芒大麦草(Hordeumsecalinum)、栽培二棱大麦(Hordeum distichon)、Hordeum aegiceras、六列大麦(Hordeumhcxastichon)、六棱大麦(Hordeum hexastichum)、不规则大麦(Hordeum irregulare)、大麦(Hordeum sativum)、短芒大麦草(Hordeum secalinum)、黑麦(Secale cereale)、燕麦(Avena sativa)、野燕麦(Avena fatua)、地中海红燕麦(Avena byzantina)、Avena fatuavar.sativa、杂种燕麦(Avena hybrida)、二色高梁(Sorghum bicolor)、石茅高梁(Sorghumhalepense)、舌甘高梁(Sorghum saccharatum)、高梁(Sorghum vulgare)、Andropogondrummondi1、二色域毛草(HoIcus bicolor)、Holcus sorghum、Sorghum aethiopicum、Sorghum arundinaceum、Sorghum caffrorum、垂穗高梁草(Sorghum cernuum)、工艺高梁(Sorghum dochna)、Sorghum drummondi1、硬高梁草(Sorghum durra)、Sorghumguineense、Sorghum lanceolatum、多脉高梁草(Sorghum nervosum)、舌甘高梁(Sorghumsaccharatum)、Sorghum subglabrescens、垂叶高梁草(Sorghum verticillif lorum)、高梁(Sorghum vulgate)、石茅高梁(HoIcus halepensis)、Sorghum miliaceum、黍粟(Panicum militaceum )、稻(Oryza sativa)、Oryza latifolia、玉蜀黍(Zea mays)、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦(Triticum sativum)或小麦(Triticum vulgare)、辣椒(Capsicum annuum)'Capsicum annuum var.glabriusculum、五色椒(Capsicum frutescens)、辣椒(Capsicum annuum)、烟草(Nicotiana tabacum)、花烟草(Nicotiana alata)、长头烟草(Nicotiana attenuata)、光烟草(Nicotiana glauca),郎氏烟草(Nicotiana langsdorff ii),Nicotiana obtusifolia,裂叶烟草(Nicotianaquadrivalvis),浅波烟草(Nicotiana repanda)、黄花烟草(Nicotiana rustica)、美花烟草(Nicotiana sylvestris),马铃薯(Solanum tuberosum)、煎子(Solanum melongena)、番煎(Lycopersicon esculentum)、Lycopersicon lycopersicu m、梨形番煎(Lycopersiconpyriforme)、红煎(Solanum integrifolium)或番煎(Solanum Iycopersicum)。
[0056]最优选的植物物种是欧洲油菜(Brassica napus)、芜菁(Brassica rapa)、野甘蓝(Brassica oleracea)、甜菜(Beta vulgaris)、紫花苜猜(Medicago sativa)、大S.(Glycine max)、德扁显(Dolichos soia)、大麦(Hordeum vulgate)、黑麦(Secalecereale)、燕麦(Avena sativa)、二色高梁(Sorghum bicolor)、石茅高梁(Sorghumhalepense)、舌甘高梁(Sorghum saccharatum)、高梁(Sorghum vulgare)、Panicummilitaceum、稻(Oryza sativa)、玉蜀黍(Zea mays)、小麦(Triticum aestivum)、硬粒小麦(Triticum durum)、马铃薯(Solanum tuberosum)、番爺(Lycopersicon esculentum)和陆地棉(Gossypium hirsutum)。
[0057]可以通过本说明书的其他地方的转化技术获得转基因植物。优选地,可以通过TDNA-介导的转化获得转基因植物。作为规律,这类载体系统的特征在于其至少含有农杆菌介导的转化所需的vir基因,和划定T-DNA界限(T-DNA边界)的序列。本说明书的其他地方详细的描述了合适的载体。
[0058]用作根据本发明的非人转基因生物的优选的藓类是剑叶藓属(Physcomitrella)或角齿藓属(Ceratodon)。用作根据本发明的非人转基因生物的优选的藻类是等鞭金藻属(Isochrysis)、Mantoniella、Ostreococcus或隐甲藻属、藻类/娃藻类如褐指藻属(Phaeodactylum)或破囊壶菌属(Thraustochytrium)。
[0059]本发明涉及由本发明的多核苷酸编码的多肽。
[0060]本文使用的术语“多肽”涵盖了分离的或基本纯化的多肽,所述多肽基本不合其它组分。然而,术语还涵盖了包含本发明多肽或此外其他蛋白质的多肽制品。本文使用的多肽可以是化学修饰的多肽。所述修饰可以是人工修饰或天然存在的修饰。本发明的多肽应该具有上述活性。可以通过本领域技术人员普遍已知的化学合成或重组分子生物学技术生产。优选地,这类生产本发明的多肽的方法包括(a)培养本文其他地方更加详细描述的本发明的宿主细胞,(b)从所述宿主细胞获得本发明的多肽。在该方法的方面,可以通过常规的纯化技术,从宿主细胞的裂解液中获得多肽,所述纯化技术包括亲和层析、离子交换层析、大小排阻层析、疏水性相互作用层析和/或制备性的凝胶电泳。关于生产和测试所需活性的细节也可见于下文所附实施例中。
[0061]如本文其他地方所示,本发明的多肽可用于多种遗传改造方法中。因此,本发明尤其考虑了本发明的多肽在非人生物中,并且优选`在微生物或植物中用于将目标异源核酸整合到靶核酸分子中,优选整合到基因组靶DNA(例如染色体)中的用途。还考虑了本发明的多肽在非人生物,优选微生物或植物中用于促进目标异源核酸整合到靶核酸分子中,优选整合到基因组靶DNA(例如染色体)中的用途。优选地,目标核酸的整合将发生在靶核酸分子中的三重DNA识别位点的位点处。因此,本发明的多肽优选可用于靶向的转基因(基因插入)、基因敲除方法(基因失活)、或同源替代、或敲入方法(基因替代)。特别的是,本发明的多肽还可用于从基因组中去除或失活目标核酸,例如用于在进行所述选择后去除用于选择转基因非人生物的标志物基因。此外,本发明的多肽通过允许在预先确定的基因座处的靶向的转基因,允许控制待整合的转基因的整合位点和拷贝数。
[0062]本发明涵盖了用于向非人生物的基因组中导入目标核酸的方法,包括:
[0063]a)将待导入到所述生物的基因组中的目标核酸导入到非人生物中;
[0064]b)在所述生物中表达本发明的多肽;和
[0065]c)在允许所述多肽切割基因组和允许目标核酸导入到基因组中的条件下培养所述生物。
[0066]在本发明的方法中,将如本文其他地方所述应该整合到非人生物的基因组中的目标核酸导入到所述生物中。可以通过多种本文其他地方更详细所述的多种转染或转化技术,实现目标核酸的导入。本文所述的目标核酸涵盖了应该被非人生物表达的核酸,如编码蛋白质或RNA的核酸,并设想了所述核酸的生产,或应该用于破裂基因组中的基因的核酸,或应该出于任何其他原因整合到生物基因组中的核酸。
[0067]根据本发明方法的非人生物应该表达本发明的多肽。这优选可以通过生成转基因非人生物来实现,所述转基因非人生物包含了稳定或瞬时整合的可表达形式的本发明多核苷酸的转基因。为此,优选可以将多核苷酸包含在表达载体中,优选是上述本发明的表达载体中而转化或转染到生物中。此外,待应用于本发明方法的转基因非人生物选自微生物、植物、植物部分或其分离的细胞、或动物组织、或其分离的细胞,并且最优选地,是本文其他地方明确指出的本发明的非人转基因生物之一。
[0068]可理解在待在本发明的方法中使用的非人转基因生物中,本发明的多肽以生物学活性的形式存在,即,能够结合三重DNA识别位点并能够在其DNA切割位点内结合之后切割DNA。可以通过在允许所述DNA结合和切割的条件下,培养非人转基因生物一段时间,来实现本发明的多核苷酸对DNA的结合和切割。此外,应该在允许将目标核酸整合到切割过的基因组DNA中的条件下,培养非人生物。本领域技术人员可以在不付出额外劳动的条件下应用合适的条件,并且在绝大多数情况下,目标核酸的整合是内源DNA修复过程的结果或受内源DNA修复过程的促进,该过程是由非人生物的基因组中的本发明多肽引起的DNA切割触发的。允许DNA结合和切割的优选条件更详细地描述在下文所附实施例中,或可以源自 W02003/080809、W02000/46386, W02009/006297, W02006/074956, TO2006/134496、W02007/148964 和 / 或 W02009/130695 的任一篇。
[0069]最后,本发明涉及包含本发明多肽的三重DNA识别位点的核酸分子。
[0070]优选地,所述核酸分子是例如由载体包含的用于整合到基因组中的目标核酸。可选地,所述核酸分子可以包含在上述目标核酸将要整合进的基因组中。包含在上述核酸分子中的三重DNA识别位点优选是这样的DNA识别位点,其包含第一 DNA结合结构域的识别位点连接的第二 DNA结 合结构域的识别位点连接的第一 DNA结合结构域的识别位点。
[0071]在优选的实施方案中,包含本发明多肽的三重DNA识别位点的核酸分子按5,至3,的方向包含:
[0072]1.归巢内切核酸酶的DNA识别位点,
[0073]i1.第一核酸接头,
[0074]ii1.限制性内切核酸酶的DNA识别位点,
[0075]iv.第二核酸接头,和
[0076]V.归巢内切核酸酶的DNA识别位点的反向互补序列。
[0077]本文其他地方描述了优选的归巢内切核酸酶以及优选的限制性内切核酸酶。优选地,⑴和(V)中的归巢内切核酸酶是LAGLIDADG家族的归巢内切核酸酶或其变体。更优选是1-SceI归巢内切核酸酶或其变体。优选地,(V)中的限制性内切核酸酶是IIp型限制性内切核酸酶。最优选是PvuII。
[0078]因此,在另外的优选的实施方案中,包含三重DNA识别位点的核酸分子按5’至3’的方向包括:
[0079]1.1-SceI 的 DNA 识别位点,
[0080]i1.第一核酸接头,
[0081 ] ii1.PvuII 的 DNA 识别位点,[0082]iv.第二核酸接头,和
[0083]v1.1-SceI的DNA识别位点的反向互补序列。
[0084]SEQ ID NO: 11的第I至18位碱基代表了优选的Ι-Scel的DNA识别位点。SEQ IDNO=Il的第37至54位碱基代表了优选的1-SceI的DNA识别位点的反向互补序列。SEQ IDNO:11的第25至30位碱基代表了 PvuII的DNA识别位点(cagctg)。 [0085]已知归巢内切核酸酶(包括1-SceI)可以耐受其识别位点的核苷酸序列的小偏差(简并),然而所述小偏差能够被特定的归巢内切核酸酶识别和切割。因此,本文也包括了在一个或两个归巢内切核酸酶识别位点中包含1、2、3或4个核苷酸改变的三重DNA识别位点。
[0086]所述识别位点应该通过包含多个核苷酸的核酸接头序列(如i1.和iv.中所示出)连接,所述接头序列的长度足以允许本发明多肽的同源二聚体的特异性结合。核酸接头的长度取决于本发明多肽的大小,特别是本发明多肽中的接头长度。优选地,核酸接头涵盖了 I至20个核苷酸的长度,更优选4至8个核苷酸,甚至更优选5至7个核苷酸,并且最优选6个核苷酸的长度。接头核酸的核苷酸可以彼此相同或不同。但是优选地,接头核酸不干扰或影响同源二聚体的DNA结合。可以通过普遍已知的技术确定核酸接头是否影响或干扰DNA结合。
[0087]在一个实施方案中,三重DNA识别位点包含以下核酸序列:
[0088]a) SEQ ID NO:11、12 或 13 所述核酸序列,
[0089]b)与SEQ ID NO:11、12或13所述核酸序列相差1、2、3或4个碱基的核酸序列,这些差异位于SEQ ID NO: 11、12或13所述序列的第I至18位碱基,
[0090]c)与SEQ ID NO:11、12或13所述核酸序列相差1、2、3或4个碱基的核酸序列,这些差异位于SEQ ID NO: 11、12或13所述序列的第37至54位碱基,
[0091]d)与SEQ ID NO:11、12或13所述核酸序列相差2、3、4、5、6、7或8个碱基的核酸序列,这些差异位于SEQ ID NO: 11、12或13所述序列的第37至54位碱基,但在第I至18位具有不多于4个有差异的碱基,且在第37至54位具有不多于4个有差异的碱基。
[0092]优选地,三重DNA识别位点包含如SEQ ID NO: 11、12或13中所述核酸序列。
[0093]有利地,本发明提供了不应在基因组中内源性存在的人工三重DNA识别位点。因此,在由于DNA重组技术(例如同源重组)而在某些理想位置携带所述三重DNA识别位点的非人生物中,可以更精确地控制异源DNA的整合。
[0094]因此,根据本发明尤其考虑了包含本发明的多肽的三重DNA识别位点的核酸分子在非人生物,并且优选微生物或植物中用于整合到靶核酸分子中,优选整合到基因组靶DNA(如染色体)中的用途。因此,本发明还涉及包含核酸分子的非人生物,所述核酸分子包含三重DNA识别位点。优选地,核酸分子还将控制核酸分子在靶核酸分子中的整合。因此,本发明的所述核酸分子可优选地用于靶向的转基因(基因插入)、基因敲除方法(基因失活)或同源替代或敲入(knock-1n)方法(基因替代)。特别地,核酸分子还可用于从基因组中移除或失活目标核酸,如用于在已进行所述选择后去除用于选择转基因非人生物的标志物基因。此外,核酸分子允许在包含所述核酸分子的预先确定的基因座处的靶向的转基因,因而控制待整合的转基因的整合位点和拷贝数。
[0095]可理解,本发明因此还考虑了包含上述核酸分子的载体,以及包含所述核酸分子的非人生物。
[0096]此外,所述核酸分子优选应用于本发明的方法中,且除三重DNA识别位点外,还包含待整合到基因组中的目标核酸。
[0097]对上述载体、非人生物和方法作出的定义和解释是经过必要修正后适用的。
[0098]本发明还涉及包含核酸分子的非人生物,所述核酸分子包含上述三重DNA识别位点和编码本发明多肽的多核苷酸。优选地,所述生物是微生物、植物或动物。优选地,用所述核酸分子和/或编码本发明多肽的所述多核苷酸转化植物。
[0099]说明书全文引用的所有参考文献都通过关于上述特定的公开内容和关于全文公开内容以引用的方式整合到本文中。
[0100]附图
[0101]图1显示了在开始孵育后的不同时间点,确定本发明多肽的L(6) (SEQID NO:9)变体的切割产物的琼脂糖凝胶分析。动力学分析揭示了即使在消化21小时后,在非特异性位点也没有切割。
[0102]图2显示了用于确定多种不同浓度的本发明多肽的L(6) (SEQ ID NO:9)和L(+)(SEQll)NO: 10)变体的切割产物的琼脂糖凝胶分析。酶滴度揭示了对于L(6)变体仅在酶比DNA过量8-32x摩尔的浓度,才出现非特异性切割。
[0103]图3显示了在存在或缺乏噬茵体入竞争DNA的条件下,用于确定本发明多肽的L (6) (SEQ ID NO:9)和L(+)(SEQ ID NO: 10)变体的切割产物的琼脂糖凝胶分析。切割的发生独立于噬菌体入DNA的 存在。
[0104]图4显示了电泳迁移率移动分析(EMSA)。(A)融合蛋白L(6)结合三重DNA识别位点 1-Scel-PvuI1-1-SceI ; (b)和(C)仅在 1-SceI DNA 识别位点(B)或 PvuII DNA 识别位点(C)处,不发生结合。
[0105]图5显示了融合蛋白活性的体内分析。用编码PvuII的同伴甲基转移酶的质粒转化大肠杆菌细胞。共转化编码野生型PvuI1、L(6)融合蛋白或L(+)融合蛋白的质粒。在缺乏甲基转移酶的条件下,融合蛋白显示了存活的克隆,证实融合蛋白不攻击未甲基化的(即,未保护的)PvuII位点。
[0106]图6显示了用于确定L (6) (SEQ ID NO:9)和L (+) (SEQ ID NO: 10)融合蛋白的缩短的变体的活性的琼脂糖凝胶分析。未观察到任何差异。
[0107]所附序列表中显示了此处所述的下列序列:
[0108]SEQ ID NO:1 J-SceI 的氨基酸序列;
[0109]SEQ ID NO:2 =PvuII 的氨基酸序列;
[0110]SEQ ID NO:3:接头 ASRTTG
[0111]SEQ ID NO:4:接头 ASTKQLVKSG
[0112]SEQ ID NO:5:接头 ASGGSGSGSG
[0113]SEQ ID NO:6:接头 AS⑶SGSDSG
[0114]SEQ ID NO:7:编码融合蛋白 P(T46e,Y94F)-L(6)-Ss * 的核酸序列;
[0115]SEQ ID NO:8:编码融合蛋白 P(T46e,Y94F)-L(+)-Ss * 的核酸序列;
[0116]SEQ ID No:9:融合蛋白 P(T46e,Y94F)-L(6)-Ss * 的氨基酸序列;
[0117]SEQ ID NO:10:融合蛋白 P(T46e,Y94F)-L(+)-Ss * 的氨基酸序列;[0118]SEQ ID NO:1\:上述融合蛋白的三重DNA识别位点的核酸序列:
[0119]TAGGGATAACAGGGTAATGGTACTCAGCTGATTCATATTACCCTGTTATCCCTA。
[0120]SEQ ID NO: 12:上述融合蛋白的三重DNA识别位点的核酸序列:
[0121]TAGGGATAACAGGGTAATATGAATCAGCTGAGTACCATTACCCTGTTATCCCTA
[0122]SEQ ID No:13:上述融合蛋白的三重DNA识别位点的核酸序列:
[0123]TAGGGATAACAGGGTAATNNNNNNCAGCTGNNNNNNATTACCCTGTTATCCCTA,
[0124]其中η可以是A、T、C或G
实施例
[0125]下列实施例示例了本发明,但无论如何不应被视为对发明范围的限制。
[0126]实施例1 =1-SceI和PvuII的不同的融合蛋白的克隆
[0127]通过经PvuII的C-末端将PvuII与1-SceI的催化失活变体的N-末端融合,生成 PvuI1-1-SceI 融合酶(Gruen2002, Nucleic Acids Res ;30(7):e29.),所述 1-SceI 的催化失活变体在C-末端截短(与共结晶结构对应,Moure2003, J.Mol.BiOl.334(4)685-95)。为此,将编码PvuII的基因通过其C-末端His6-标签与编码1-SceI(D44s) Λ C9的基因相连接,并克隆到编码C-末端Str印-标签的载体pASK-1BA63b-plus(IBA)中。为了进一步改良,根据 Lippow2009,Nucleic Acids Res37(9):3061_3073,通过基于 PCR 的定向诱变(Kirschl998, Nucleic Acids Res.26 (7) 1848-50),突变 1-SceI 的 2 个活性位点残基(D44和 D145)。获得的变体之后被称为 S * (1-SceI_D44N, D145A)和 Ss * (I_SceIAC9_D44N,D145A)。以与对于融合酶相同的方式,对PvuII的某些残基实施诱变。为了在PvuII和1-SceI的基因之间具有类似接头区结构的构件,在这两个基因之间导入3个限制性酶位点(Nhe1、BsiW1、AgeI)而非 His6_tag (Lao),获得 L(6) (SEQ ID No:3)。通过用 NheI 和 AgeI 切割获得的载体,可以将具有互补末端的接头L(n) (SEQ ID NO:5)、L(+) (SEQ ID NO:4)和L(_)(SEQ ID NO:6)克隆到这些位点中。
[0128]实施例2:不同融合蛋白的功能表征
[0129]在优化的KG缓冲液(IOOmM谷氨酸钾、25mM Tris-醋酸、0.8mM Mg-醋酸、IOOmMKC1、500DM2-巯基乙醇、10ytg/ml BSA)中,用 8nM 融合酶(SEQ ID NO:9)的 L(6)变体孵育8nM含有三重位点(S6P6S)和额外的无地址的(unaddressed)PvuII位点的线性化的质粒DNA。该缓冲液也用于所有其他实验。在某时间点后,取出切割反应的样品,通过添加装载缓冲液终止反应,并在琼脂糖凝胶上分析。结果显示在图1中。
[0130]在优化的KG缓冲液中,用范围从4-256nM的融合酶孵育8nM含有定址(addressed)位点和额外的无地址PvuII位点(S6P6S_P ;A)的线性化的质粒DNA,或仅含有PvuII位点(B)的超螺旋的质粒DNA过夜(~16h)。在0.8%琼脂糖凝胶上分析反应。结果显不在图2中。
[0131]在优化的KG缓冲液中,在存在或缺乏含有15PvuII位点的940ρΜλ -DNA的条件下,用8ηΜ融合酶37°C孵育8nM线性化质粒DNA (S6P6S_P) 3h。在0.8%琼脂糖凝胶上分析反应。结果显示在图3
[0132]为了确定融合酶的结合常数,用放射性标记的PCR片段进行EMSA。使用[α 32p]dATP,通过PCR生成迁移片段。一个片段含有定址位点(S6P6S;A)、仅1-SceI位点(S ;B)或仅PvuII位点(P ;C)。在不含镁的优化的KG缓冲液中,用浓度范围从1_150ηΜ的融合酶室温孵育2nM放射标记的底物30min。在添加I μ 187%甘油后,将样品装载到6%聚丙烯酰胺 Tris-醋酸(ρΗ8.5)凝胶上,并在 10V/cm 运行 2h。使用 InstantImager 系统(Packard)将条带可视化。结果显示在图4中。
[0133] 用50ng编码PvuIIjt或融合酶之一的质粒转化具有或不具有编码M.PvuII的质粒的电感受态大肠杆菌细胞。将50 μ I转化混合物散布在含有相应抗生素的琼脂平板上,并在37°C孵育过夜。结果显示在图5中。
[0134]在优化的KG缓冲液中,用8nM具有Λ C9I_SceI (SEQ ID9&10)的融合酶或具有全长1-SceI的融合酶在37°C孵育8nM线性化的质粒DNA(S6P6S_P) Ih。在0.8%琼脂糖凝胶上分析反应。结果显示在图6中。
【权利要求】
1.编码多肽的多核苷酸,所述多肽包含: (i)第一模块,所述第一模块至少包含源自归巢内切核酸酶的第一DNA结合结构域; (ii)接头;和 (iii)第二模块,所述第二模块至少包含源自限制性内切核酸酶的第二DNA结合结构域和切割结构域; 其中所述多肽仅与这样的DNA在功能上相互作用,所述DNA包含第一 DNA结合结构域的DNA识别位点和第二 DNA结合结构域的DNA识别位点,且 其中在多肽结合后,所述切割结构域在特异性DNA切割位点内切割DNA。
2.权利要求1的多核苷酸,其中所述特异性DNA切割位点和所述限制性内切核酸酶的第二 DNA结合结构域的DNA识别位点是相同的。
3.权利要求1或2的多核苷酸,其中包含在第二模块中的所述第二DNA结合结构域和切割结构域源自IIP型限制性内切核酸酶。
4.权利要求1至3中任一项的多核苷酸,其中包含在第二模块中的所述第二DNA结合结构域和切割结构域源自这样的限制性内切核酸酶,所述限制性内切核酸酶当与野生型限制性内切核酸酶相比较时,表现出降低的DNA结合和/或降低的催化活性。
5.权利要求1至4中任一项的多核苷酸,其中包含在第二模块中的所述第二DNA结合结构域和切割结构域源自PvuII。
6.权利要求5的多核苷酸,其中包含在第二模块中的所述第二DNA结合结构域和切割结构域至少包含下列修饰中的一个:替换T46G、替换H83A、替换Y94F、替换T46G与H83A的组合、替换T46G与Y94F的组合,或替换T46G与H83A和Y94F的组合。
7.权利要求1至6中任一项的多核苷酸,其中所述第一模块表现出降低的催化活性,或不表现出催化活性。
8.权利要求1至7中任一项的多核苷酸,其中包含在第一模块中的所述第一DNA结合结构域源自LAGLIDADG-家族归巢内切核酸酶。
9.权利要求8的多核苷酸,其中包含在第一模块中的所述第一DNA结合结构域源自1-SceI。
10.权利要求9的多核苷酸,其中包含在第一模块中的所述第一DNA结合结构域至少包含下列修饰中的一个:单独的替换D44S,或其与D145A的组合,或替换D44N与D145A的组八口 ο
11.权利要求1至10中任一项的多核苷酸,其中所述接头基本由6至10个氨基酸组成,特别地,其中所述接头具有如SEQ ID NO:3 (ASRTTG)或SEQ ID NO:4 (ASTKQLVKSG)中所示的氢基酸序列。
12.核酸分子,其按5’至3,方向包含: 1.1-SceI的DNA识别位点, i1.第一核酸接头, ii1.PvuII的DNA识别位点, iv.第二核酸接头,和 V.1-SceI的DNA识别位点的反向互补序列。
13.载体,其包含权利要求1至12中任一项的多核苷酸。
14.非人生物,其包含权利要求1至12中任一项的多核苷酸或权利要求14的载体。
15.非人生物,其包含权利要求9的多核苷酸和权利要求12的多核苷酸。
16.由权利要求1至12中任一项的多核苷酸编码的多肽。
17.用于将目标核酸导入到非人生物基因组中的方法,所述方法包括: a)将待导入到所述生物的基因组中的目标核酸导入到非人生物中, b)在所述生物中表达权利要求16的多肽;和 c)在允许所述多肽切割基因组和允许目标核酸导入到基因组中的条件下培养所述生物。
18.权利要求14或15的非人生物,或权利要求17的方法,其中所述非人转基因生物选自由微生物、植物、植物部分或其分离`的细胞、或动物组织或其分离的细胞组成的组。
【文档编号】C12N15/52GK103620027SQ201280028627
【公开日】2014年3月5日 申请日期:2012年6月8日 优先权日:2011年6月10日
【发明者】I·丰法拉, W·文德, A·平戈德 申请人:巴斯夫植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1