利用ppr基序的dna结合性蛋白质及其应用

文档序号:9634756阅读:638来源:国知局
利用ppr基序的dna结合性蛋白质及其应用
【专利说明】利用PPR基序的DNA结合性蛋白质及其应用 【技术领域】
[0001] 本发明涉及能够与目标DNA碱基或DNA序列选择性或特异性结合的蛋白质。本发 明中利用了三角状五肽重复序列(pentatricopeptide repeat,PPR)基序。本发明可用于 DNA结合性蛋白质的鉴定、设计、具有PPR基序的蛋白质的靶标DNA的鉴定、DNA的功能调 控。本发明在医疗领域、农学领域等中有用。另外,本发明涉及利用了含有PPR基序的蛋白 质与规定功能性区域的蛋白质的复合体的新的DNA切割酶。 【【背景技术】】
[0002] 近年来,使用通过各种分析得以明确的核酸结合性蛋白质因子与目标序列结合的 技术已被确立并得到了应用。通过利用该序列特异性的结合,能够进行作为靶标的核酸 (DNA或RNA)的细胞内定位分析、作为靶标的DNA序列的去除、或其下游存在的蛋白质编码 基因的表达调控(活化或失活)。
[0003] 已经进行了将作为作用于DNA的蛋白质性因子的锌指蛋白(非专利文献1、非专利 文献2)、TAL效应因子(TALE、非专利文献3、专利文献I) XRISPR(非专利文献4、非专利文 献5)作为蛋白质工程材料的研究和开发,但这样的蛋白质性因子的种类仍然非常有限。
[0004] 例如,作为人工DNA切割酶而已知的人工锌指核酸酶(ZFN)为一种嵌合蛋白质,其 通过在使特异性识别并结合3~4个碱基的DNA的锌指3~6个连结而构成的、利用3~4 个碱基的序列单元对碱基序列进行识别的部分上连结细菌DNA切割酶(例如FokI)的1个 DNA切割结构域而形成(非专利文献2)。这样的嵌合蛋白质中,锌指结构域是已知与DNA 结合的蛋白质结构域,其根据在于,已知多种转录调控因子具有该结构域,与特异的DNA序 列结合并进行基因的表达调控。通过使用2个具有3个锌指的该ZFN,理论上能够在大约每 700亿个碱基中诱导1处切断。
[0005] 但是,由于使用该ZFN的方法在制作中耗费费用等,因而并未达到广泛应用的程 度。另外,功能性ZFN的筛选效率差,暗示其在这方面也存在问题。此外,由η个锌指构成 的锌指结构域具有识别(GNN)n这样的序列的倾向,因而还具有靶标基因序列的自由度低 这样的问题。
[0006] 另一方面,已开发出了将由能够识别每1个碱基的组件部分的组合序列构成的蛋 白质、TAL效应因子(TALE)与细菌DNA切割酶(例如FokI)的DNA切割结构域结合而得到 的酶(TALEN),正在将其作为替代ZFN的人工酶来进行研究(非专利文献3)。该TALEN是 将植物病原细菌黄单胞菌(Xanthomonas)所具有的转录因子的DNA结合结构域与DNA限制 酶FokI的DNA切割结构域融合而成的酶,已知其与邻近的DNA序列结合,形成二聚物并将 双链DNA切断。该分子中,从感染植物的细菌中发现的TALE的DNA结合结构域利用由34 个氨基酸构成的TALE基序中的2处氨基酸的组合识别1个碱基,因此,具有能够通过TALE 组件的重复结构的选择来选择与靶标DNA的结合性这样的特征。利用了具有这样的特征的 DNA结合结构域的TALEN具有与ZFN同样地能够向靶标基因中导入突变的特征,但与ZFN相 比,具有很大优越性的是,其靶标基因(碱基序列)的自由度大幅提高,而且能够编码结合 喊基。
[0007] 但是,TALEN的完整的立体结构并不明确,因而现状是无法鉴定TALEN的DNA的切 割部位。因此,与ZFN相比,TALEN存在切割部位不准确、不固定、会在类似序列处进行切割 的问题。因此,存在无法利用DNA切割酶准确地对靶标碱基序列进行切割的问题。基于这 样的情况,希望开发、提供不具有上述问题的新的人工DNA切割酶。
[0008] 基于基因组序列信息,仅在植物中就鉴定了形成500个成员的大家族的蛋白质、 即PPR蛋白质(具有三角状五肽重复序列(pentatricopeptide repeat,PPR)基序的蛋白 质)(非专利文献6)。PPR蛋白质为核编码蛋白,已知其是专门对细胞器官(叶绿体和线粒 体)的RNA水平的调控、切割、翻译、剪接、RNA编辑、RNA稳定性发挥基因特异性作用的蛋白 质。典型地,PPR蛋白质具有约10个保守性低的35氨基酸基序、即PPR基序连续而成的结 构,认为PPR基序的组合承担了与RNA的序列选择性结合的作用。绝大部分PPR蛋白质仅 由约10个PPR基序的重复构成,多数情况下,未发现发挥催化作用所需要的结构域。因此, 认为该PPR蛋白质实质上为RNA衔接子(7夂7"夕一)(非专利文献7)。
[0009] 通常,蛋白质与DNA之间的结合同蛋白质与RNA之间的结合是基于不同的分子机 制来进行的,DNA结合型蛋白质通常不与RNA结合,反过来,RNA结合型蛋白质通常不与DNA 结合。例如,在作为RNA结合因子而已知的、能够对识别RNA进行编码的Pumilio蛋白质的 情况下,并无其与DNA结合的报道(非专利文献8和9)。
[0010] 但是,在对各种PPR蛋白质的性质进行研究的过程中,已经明确提示了几种类型 的PPR蛋白质作为DNA结合性因子发挥作用。
[0011] 小麦的P63为具有9个PPR基序的PPR蛋白质,通过凝胶迀移分析提示其与DNA 进行序列特异性结合(非专利文献10)。
[0012] 拟南芥(Arabidopsis thaliana)的GUNl蛋白质具有11个PPR基序,通过拉下分 析提示其与DNA结合(非专利文献11)。
[0013] 通过连缀(Run-On)分析显示,拟南芥的pTac2(具有15个PPR基序的蛋白质、非 专利文献12)和拟南芥的DGl (具有10个PPR基序的蛋白质、非专利文献13)直接参与以 DNA作为模板来生成RNA的转录,认为它们与DNA结合。
[0014] 拟南芥的GRP23(具有11个PPR基序的蛋白质、非专利文献14)的基因缺陷株表 现出胚致死的表现型,显示出该蛋白质与作为DNA依赖型RNA转录酶的真核生物型RNA转 录聚合酶2的主要亚基发生物理性相互作用,因此认为GRP23也发挥DNA结合的作用。
[0015] 但是,关于这些PPR蛋白质,只不过间接地暗示了其与DNA的结合,并未充分证明 实际上进行了序列特异性结合。另外,即使这些蛋白质与DNA进行了序列特异性结合,由于 通常认为蛋白质与DNA之间的结合同蛋白质与RNA之间的结合是基于不同的分子机制来进 行的,因此关于具体是通过怎样的序列规则来进行结合等,甚至连预测也完全没有。
[0016]【现有技术文献】
[0017] 【专利文献】
[0018] 专利文献 I :W02011/072246
[0019] 专利文献 2 :TO2011/111829
[0020] 【非专利文献】
[0021] 非专利文献 I :Maeder, M. L.,et al. (2008) · Rapid "open-source"engineeringof customized zinc-fingernucleases for highly efficient gene modification. Mol. Cell 31,294-301.
[0022] 非专利文献 2 :Urnov,F. D.,et al.,(2010)Genome editing with engineered zinc finger nucleases, Nature Review Genetics, 11, 636-646
[0023] 非专利文献3 :Miller,J. C.,et al. (2011) · A TALE nuclease architecture for efficient genome editing. Nature biotech.29,143-148.
[0024] 非专利文献4 :Mali P,et al. (2013) RNA-guided human genome engineering via Cas9. Science. 339, 823-826.
[0025] 非专利文献 5 :Cong L,et al. (2013)Multiplex genome engineering using CRISPR/Cas systems. Science. 339, 819-823
[0026] 非专利文献 6 :Small,I. D.,and Peeters,N. (2000) · The PPR motif-a TPR-related motif prevalent in plant organellar proteins. Trends Biochem. Sci. 25, 46-47.
[0027] 非专利文献 7 :Woodson,J. D.,and Chory,J. (2008) · Coordination of gene expression between organellar and nuclear genomes. Nature Rev. Genet. 9, 383-395.
[0028] 非专利文献8 :Wang,X.,et al. (2002) · Modular recognition of RNA by a human pumiIio-homology domain. Cell HO, 501-512.
[0029] 非专利文献 9 :Cheong,C. G.,and Hall,T. M. (2006) · Engineering RNA sequence specificity of Pumilio repeats. Proc. Natl. Acad. Sci. USA 103, 13635-13639.
[0030] 非专利文献 10 :Ikeda T. M. and Gray M. W. (1999) Characterization of a DNA-binding protein implicated in transcription in wheat mitochondria. Mol Cell Bioll9(12) :8113-8122
[0031] 非专利文献 11 :Koussevitzky S,et al. (2007) Signals from chloroplasts converge to regulate nuclear gene expression.Science 316 :715-719.
[0032] 非专利文献 12 :Pfalz J,et al. (2006) pTAC2,-6, and_12are components of the transcriptionally active plastid chromosome that are required for plastid gene expression. Plant Cell 18 :176-197.
[0033] 非专利文献 13 :Chi W,et al. (2008)The pentratricopeptide repeat proteinDELAYED GREENINGlis involved in the regulation of early chloroplast development and chloroplast gene expression in Arabidopsis. Plant Physiol.147 : 573-584.
[0034] 非专利文献 14 :Ding YH,et al. (2006)Arabidopsis GLUTAMINE-RICH PR0TEIN23is essential for early embryogenesis and encodes a novel nuclear PPR motif protein that interacts with RNA polymerase II subunit III. Plant Cell 18: 815-830. 【
【发明内容】

[0035] 【发明所要解决的课题】
[0036] 本发明人预测,PPR蛋白质(具有PPR基序的蛋白质)作为RNA衔接子的性质是 由构成PPR蛋白质的各PPR基序的性质以及多个PPR基序的组合决定的,并提出了利用该 PPR基序的RNA结合性蛋白质的改造方法(专利文献2)。并且明确了,PPR基序与RNA是一 对一地对应结合的,通过连续的PPR基序来识别RNA序列中的连续的RNA碱基,并且是利用 构成PPR基序的35个氨基酸中特定的3处氨基酸的组合来决定RNA识别的;对于利用PPR 基序的RNA识别密码的定制RNA结合蛋白质的设计方法及其应用进行了专利申请(PCT/ JP2012/077274;Yagi,Y.,et al. (2013) PLoS One, 8, e57286;以及Barkan, A.,etal. (2012) PLoS Genet.,8, e100 2910.)。
[0037] 通常认为,蛋白质与DNA之间的结合同蛋白质与RNA之间的结合基于不同的分子 机制。与此相对,此次,基于PPR基序所具有的RNA识别规则也能够用于DNA识别的预测, 设定了如下课题:对于在DNA结合中起作用的PPR蛋白质进行分析,探寻具有这种特征的 PPR蛋白质。另外还设定了如下课题:使用如此得到的可与DNA特异性结合的PPR蛋白质, 进行与所期望的序列结合的定制DNA结合蛋白质的制备,同时,通过与规定功能性区域的 蛋白质一起使用来提供新的人工酶;并且,通过与作为功能性区域的DNA切割活性区域一 起使用来提供新的人工DNA切割酶。
[0038]【用于解决课题的手段】
[0039] 在PPR蛋白质的情况下,在各种结构域检索程序(Pfam、Prosite、Interpro等) 中,已知通常的RNA结合型的PPR蛋白质所含有的PPR基序与上述几种DNA结合型的PPR 蛋白质所含有的PPR基序并未进行特别区分。因此认为,在PPR蛋白质中,除了核酸识别所 需要的氨基酸以外,可能还含有决定与DNA的结合性或与RNA的结合性的氨基酸(氨基酸 组)。
[0040] 本发明人在PCT/JP2012/077274中明确了,RNA结合型PPR基序与RNA -对一地 对应结合,通过连续的PPR基序识别RNA序列中的连续的RNA碱基;此时,利用构成PPR基 序的35个氨基酸之中特定的3处氨基酸(即,构成基序的2个α螺旋结构中的最初的螺 旋(螺旋Α)的1位和4位的氨基酸(第1氨基酸和第4氨基酸)以及从C末端侧起的第 2位氨基酸(第"ii"(_2)氨基酸))这3处RNA识别氨基酸的组合来决定与碱基选择性的 RNA的结合,对于利用PPR基序的RNA识别密码的定制RNA结合蛋白质的设计方法及其应用 进行了专利申请。
[0041] 因此,在PPR蛋白质中被提示为与DNA结合的上述小麦的p63(非专利文献11、拟 南芥的同源蛋白质的氨基酸序列为SEQ ID NO :1)、拟南芥的GUNl蛋白质(非专利文献12、 氨基酸序列为SEQ ID NO :2)、拟南芥的pTac2(非专利文献13、氨基酸序列为SEQ ID NO: 3)、DGl (非专利文献14、氨基酸序列为SEQ ID NO :4)、拟南芥的GRP23 (非专利文献15、氨 基酸序列为SEQ ID NO :5)中,将在以RNA为靶标的情况下被认为重要的PPR基序中承担核 酸识别密码作用的3处氨基酸(第1氨基酸、第4氨基酸和第"ii"(-2)氨基酸)的氨基酸 出现频率与RNA结合型基序进行了比较,结果可知,这些被暗示为DNA结合性的PPR蛋白质 的PPR基序与RNA结合型基序之间的氨基酸出现频率的倾向基本一致。
[0042] 由此暗示,RNA结合型PPR基序的核酸识别密码也能够应用于DNA结合型PPR基 序。胸腺嘧啶(T)也被称为5-甲基尿嘧啶,其为具有将尿嘧啶(U)的5位碳进行了甲基化 的结构的尿嘧啶(U)衍生物。根据这样的构成核酸的碱基的性质,暗示出RNA结合型PPR 基序的识别尿嘧啶(U)的氨基酸的组合可用于DNA情况下的胸腺嘧啶(T)
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1