生产多肽的方法

文档序号:439899阅读:483来源:国知局
专利名称:生产多肽的方法
技术领域
本发明涉及在低温条件下通过表达具有被整合的编码目的蛋白的基因的载体和具有被整合的陪伴分子基因的载体来生产目的蛋白的方法。
背景领域最近,各种生物的基因组的分析正趋于完成,且认为这些分析在将来将转向作为基因的表达产物的蛋白的全面的功能分析。通过阐明单个蛋白的性质和详细分析蛋白之间的相互作用来帮助解释说明生物学现象的研究正不断地快速地增加。另一方面,在确定细胞内受体蛋白的三维结构中有极大的兴趣,所述蛋白特异性地结合各种生理学活性的物质以传递作用。这是因为结合受体蛋白的活性物质可以是新药的候选物质。因此,关注投向了筛选新药。为确定这样的蛋白的特性,一般方法包括将对应的基因整合入载体基因,转化宿主例如细菌、酵母或昆虫细胞,和检查通过表达获得的重组蛋白的特性。
当估计蛋白的准确性质时,所述蛋白是否折叠成正确的三级结构是非常重要的。然而,如果按照蛋白质的表达方法使用上述宿主表达系统来制备来源于异源生物的蛋白,则人们可能会经常遇到这样的情况,在该况中,由于所述蛋白的异常折叠只获得具有不同三级结构的异常蛋白。这样的蛋白在宿主中形成了称为内含体的聚集体。内含体的形成是有利的,因为表达的蛋白受到保护而免受宿主细胞中的蛋白水解酶降解,并且所述蛋白可通过离心容易地从细胞中分离。然而,为了获得生物学活性的目的蛋白,必须通过变性来溶解内含体,然后将其再生(重折叠)。当对各蛋白重复试错法时,溶解/再生的方法主要依靠经验进行。在许多情况下不能获得满意的产量,且另外,再生并不总是可能的。此外,对相当多异源蛋白来说,不能获得高表达水平,因为所述蛋白被大肠杆菌(Escherichia coli)中的蛋白酶降解了。绝不能说,已经充分确立了解决这样的表达产物的不溶性或降解的问题的方法。目前,使用上述宿主表达系统大量生产生物学活性的蛋白不必定成功。为解决该问题,已尝试和陪伴分子共表达等方法,并且已进行了一些报道(例如,参见专利文献1至3)。
DnaK、DnaJ和GrpE是在蛋白的折叠中协同发挥作用的陪伴分子。这如下进行考虑。首先,当DnaJ结合作为底物的未折叠的蛋白时,DnaK上的ATP被水解,以形成未折叠的蛋白/DnaJ/DnaK复合物(ADP结合类型)。然后,GrpE使ADP/ATP发生交换,以从复合物中释放底物蛋白(例如,参见非专利文献1)。触发因子是参与蛋白折叠的分子陪伴之一,且具有这样的催化活性,即在细胞中折叠期间催化靶蛋白氨基酸中的脯氨酸残基的N-末端侧的肽键的顺反异构化反应(肽基脯氨酰顺反异构酶(PPIase)活性)。
在许多情况下已知在大肠杆菌中不溶解的外源蛋白和GroEL和GroES的共表达导致该外源蛋白的成功溶解。所述外源蛋白的实例包括酪氨酸激酶(例如,参见非专利文献2和3)、谷氨酸消旋酶(例如,参见非专利文献4)和二氢叶酸还原酶(例如,参见非专利文献5)。此外,知道由于和DnaK的共表达导致的人生长激素的增加的溶解性(例如,非专利文献6)、由于和DnaJ的共表达导致的转谷氨酰胺酶(transglutaminase)的增加的溶解性(例如,非专利文献4)和由于和DnaK、DnaJ和GrpE的共表达导致的酪氨酸激酶的增加的溶解性(例如,参见非专利文献2)。
已进行了通过将在大肠杆菌中不溶的蛋白作为和陪伴分子等的融合蛋白进行表达来使其溶解的尝试。例如,已知通过将小鼠抗鸡溶菌酶Fab抗体片段作为和TcFKBP18(来自古细菌的陪伴分子)的融合蛋白进行表达来使其溶解获得了成功(参见专利文献7)。
然而,通过上述方法还未解决有关所有蛋白的表达或折叠的问题。因此,一直以来强烈地需要确立用于有效地生产蛋白的方法。
如果将处于对数生长期的大肠杆菌的培养温度从37℃下降至10-20℃,那么大肠杆菌细胞的生长临时停滞,在此期间诱导了一组称为冷激蛋白的蛋白的表达。根据诱导水平将所述蛋白分成两组第I组(10倍或更多)和第II组(低于10倍)。第I组中的蛋白包括CspA、CspB、CspG和CsdA(例如,参见非专利文献7和8)。这些蛋白中,CspA的表达水平(例如,参见专利文献5)在温度从37℃转变至10℃后1.5小时,达到总细胞蛋白的13%(例如,参见非专利文献9)。于是,已进行了使用cspA基因的启动子在低温下生产重组蛋白的尝试。
对于在低温条件下使用cspA基因表达重组蛋白的系统,除了在低温下通过该基因的启动子产生的上述高效转录起始外,还显示了下述效力。
(1)如果从cspA基因转录的并且能够被翻译的mRNA不编码功能性CspA蛋白(具体地说,如果其只编码CspA蛋白的N-末端序列的部分),那么该mRNA长时间段地抑制其他大肠杆菌蛋白包括冷激蛋白的表达。在该时间段内,优选地翻译所述mRNA(例如,参见非专利文献7和专利文献6)。该现象称为LACE(截短的cspA表达的低温依赖性抗生素效应)效应。
(2)由15个核苷酸组成的称为下游框的序列位于cspA基因的起始密码子的下游12个核苷酸之后的位置。该序列使得能够在低温条件下产生高翻译效率。
(3)由159个核苷酸组成的5’-非翻译区位于cspA基因的mRNA的转录起始位点和起始密码子之间。该区域对37℃下CspA的表达具有负效应和在底温下条件下具有正效应。
具体地,上面(1)中所述的现象暗示着使用cspA基因进行的只有目的蛋白的特异性表达的可行性。因此,预期可将该系统用于高纯度重组蛋白的生产或同位素标记的蛋白的制备以进行结构分析。
然而,上述低温条件下的重组蛋白表达系统仍不能用于所有重组蛋白。各蛋白具有内在(intrinsic)分子量、等电点和氨基酸组成,并且需要形成独特的高级有序的结构以发挥功能。即使是使用上述表达系统,还存在这样的蛋白,对于所述蛋白,不能获得足够表达水平或不能获得活性的蛋白。
专利文献1JP-A 11-9274专利文献2JP-A 2000-255702专利文献3JP-A 2000-189163专利文献4JP-A 8-308564专利文献5WO 90/09447专利文献6WO 98/27220专利文献7WO 2004/001041
非专利文献1Proc.Natl.Acad.Sci.USA,9110345-10349(1994)非专利文献2Cell Mol.Biol.,40635-644(1994)非专利文献3Proc.Natl.Acad.Sci.USA,921048-1052(1995)非专利文献4J.Biochem.,117495-498(1995)非专利文献5Protein.Eng.,7925-931(1994)非专利文献6Biotechnol.,10301-304(1992)非专利文献7J.Bacteriol.,1784919-4925(1996)非专利文献8J.Bacteriol.,1782994-2997(1996)非专利文献9Proc.Natl.Acad.Sci.USA,87283-287(1990)发明内容通过本发明解决的问题考虑到上述的现有技术,本发明的主要目的是提供有效地生产保持其活性的目的多肽的方法。
解决问题的方法作为深入研究的结果,本发明人已发现在低温条件下使用重组蛋白表达系统使编码目的多肽或蛋白的基因表达后,通过在所用宿主内增加陪伴分子基因的表达,可将按照常规方法难以作为可溶性蛋白表达的蛋白作为活性的可溶性蛋白表达。
此外,本发明人已发现按照上述方法将目的多肽或蛋白作为和陪伴分子的融合蛋白来表达在目的蛋白的增溶中特别有效。和将蛋白作为和陪伴分子的融合蛋白来表达的常规方法或使用重组蛋白表达系统在低温条件下表达目的蛋白的方法的效果相比,这样的方法在目的蛋白的增溶中的效果是令人吃惊的和出乎意料的。
例如,本发明提供了用于有效地表达目的多肽的方法,该方法通过将具有被整合的目的基因的载体和具有被整合的陪伴分子基因的载体转入相同的宿主并诱导两个基因的表达来实现。
本发明的第一方面涉及生产多肽的方法,该方法包括将这样的宿主暴露于低温条件下以诱导多肽的表达,所述宿主具有被转入该宿主的编码想要的多肽的基因,其中在该宿主中,编码陪伴分子的基因的表达被增强。
根据该第一方面,可通过例如这样的方法增强编码陪伴分子的基因的表达,所述方法是诱导宿主中的陪伴分子基因的表达;修饰宿主的染色体上的陪伴分子基因;将陪伴分子基因转入宿主;或使用这样的宿主,在该宿主中,陪伴分子基因的表达被增强。
根据该第一方面,可优选地使用编码选自DnaK、DnaJ、GrpE、GroEL、GroES和触发因子的陪伴分子的基因。
根据该第一方面,可将被转入宿主的编码想要的多肽的基因连接至这样的DNA的下游,所述DNA编码来源于冷激蛋白基因的mRNA的5’-非翻译区。以大肠杆菌cspA基因为例来说明所述冷激蛋白基因。
根据该第一方面,可使用载体将编码想要的多肽的DNA和编码陪伴分子的基因转入宿主。可将编码想要的多肽的DNA和编码陪伴分子的基因相互连接,从而就可编码该想要的多肽和该陪伴分子的融合蛋白。以劳斯相关病毒2(RAV-2)逆转录酶α亚基、RAV-2β亚基、DNA酶或人Dicer PAZ结构域多肽为例说明想要的多肽。
以大肠杆菌为例说明按照该第一方面使用的宿主。
本发明的第二方面涉及用于生产想要的多肽的一套质粒载体,其包括(1)第一载体,其在启动子的下游具有(a)编码来源于冷激蛋白基因的mRNA的5’-非翻译区的DNA;和(b)可用于插入编码想要的多肽的基因且位于(a)的DNA的下游的限制性内切酶识别序列;和(2)具有编码陪伴分子的基因的第二载体,其中选择(1)和(2)的载体的复制起点从而使得不产生不相容性。
例如,根据该第二方面,第一载体可包含这样的DNA,该DNA编码来源于大肠杆菌cspA基因的mRNA的5’-非翻译区,且第二载体可包含编码选自DnaK、DnaJ、GrpE、GroEL、GroES和触发因子的陪伴分子的基因。能够在大肠杆菌中复制的质粒可用作所述载体。
本发明的第三方面涉及这样的表达载体,该载体在启动子的下游具有(a)编码来源于冷激蛋白的基因的mRNA的5’-非翻译区的DNA;和(b)具有可用于插入编码想要的多肽的基因且位于(a)的DNA的下游的限制性内切酶识别序列的DNA;和(c)编码陪伴分子的基因。
以这样的载体为例说明该第三方面的表达载体,所述这样的载体含有编码来自大肠杆菌cspA基因的mRNA的5’-非翻译区的DNA,或所述这样的载体含有编码选自DnaK、DnaJ、GrpE、GroEL、GroES和触发因子的陪伴分子的基因。
根据该第三方面,可用于插入编码想要的多肽的基因的限制性内切酶识别序列可位于这样的位置,在该位置可插入所述编码想要的多肽的基因,从而使想要的多肽作为和陪伴分子的融合蛋白表达。
所述表达载体可以是能够在大肠杆菌中复制的质粒。
发明效果按照本发明的方法,可能获得相当大量的通过常规方法难以表达、同时保持其活性的多肽。
附图简述

图1显示通过共表达进行的hDi-ASI的表达的检查结果。“A”和“B”分别显示CBB染色和抗体染色的结果。在图中,“T”表示细胞提取物级分而“S”表示可溶性组分。
图2显示逆转录酶(RTase)α或逆转录酶β和触发因子的融合蛋白的表达的检查结果。“A”和“B”分别显示单独表达和共表达的结果,且“C”和“D”分别显示T7启动子表达系统中的融合表达的结果和冷激表达系统中融合表达的结果。在图中,“α”表示RAV-2逆转录酶α,“β”表示RAV-2逆转录酶β,“T”表示细胞提取物级分,“S”表示可溶性级分,且“P”表示不溶性级分。
图3显示DNA酶和触发因子的融合蛋白的表达的检查结果。“A”、“B”和“C”分别显示单一表达系统、共表达系统和融合表达系统的结果。在图中,“S”表示可溶性级分,且“P”表示不溶性级分。
图4显示DNA酶活性测量的结果。在图中,“M”表示单独的底物,“1”表示使用作为对照的超声处理的可溶性级分进行的DNA酶活性测量的结果,且“2”表示使用融合表达系统的超声处理的可溶性级分进行的DNA酶活性测量的结果。
实施本发明的最优模式在下文中,将描述本发明。
(1)冷激载体根据本发明使用的含有编码想要的多肽的基因的载体是这样的一种载体,在该载体中,通过将宿主的培养温度转换至比正常的生长温度更低的温度(即,通过冷激)来诱导所述多肽的表达。其用作根据本发明的表达载体。如此处所用的,术语“低温”是指低于宿主的正常生长温度的温度。在下文中,上述载体可称作冷激载体。用于使用这样的载体表达想要的多肽的系统可称作冷激表达系统。具有这样的DNA和连接至所述DNA下游的编码想要的多肽的基因的载体可用作这样的载体,所述DNA编码来源于冷激蛋白基因的mRNA的5’-非翻译区。如此处所用的,术语“下游”是指相对于转录方向的下游位置。
尽管不想限定本发明,但在优选的实施方案中,包含编码想要的多肽的基因的载体包含下列元件(A)在所使用的宿主中起作用的启动子;(B)调节(A)的启动子的作用的调控区;和(C)编码来源于冷激蛋白基因的mRNA的5’-非翻译区的部分或编码这样的区域的部分,在该区域中,在所述非翻译区进行了至少一个核苷酸的替代、缺失、插入或添加。
下面进行详细描述。
关于(A)的启动子没有具体的限定,只要其在所用的宿主中具有起始RNA转录的活性。具体地,其是可通过将其和这样的部分组合使用来用作冷反应性启动子的任意启动子,所述部分编码来源于(C)的冷激蛋白基因的mRNA的5’-非翻译区。
关于(B)的调控基因没有具体的限定,只要其可用于调节位于(A)的启动子下游的基因的表达。例如,可通过将这样的区域整合入载体来抑制从启动子下游的基因翻译目的蛋白,与从启动子转录的mRNA互补的RNA(反义RNA)从该区域转录。通过在不同于(A)的启动子的合适的启动子的控制下转录所述反义RNA可调控目的多肽的表达。可使用存在于各种基因的表达调控区中的操纵基因。例如,根据本发明可使用来源于大肠杆菌乳糖操纵子的lac操纵基因。可通过使用合适的诱导物例如乳糖或其结构类似物(优选地,异丙基-β-D-硫代半乳糖苷(IPTG))取消lac操纵基因的功能来使启动子发挥作用。通常将这样的操纵基因序列置于启动子的下游和转录起始位点的附近。
编码来源于(C)的冷激蛋白的mRNA的5’-非翻译区的部分是编码起始密码子5’的mRNA区域的部分。已在大肠杆菌冷激蛋白基因(cspA、cspB、cspG和csdA)(J.Bacteriol.,1784919-4925(1996);J.Bacteriol.,1782994-2997(1996))中表示特性地发现了所述部分。来自从这样的基因转录的mRNA中的5’末端的100个核苷酸或更多核苷酸的部分不被翻译成蛋白。该部分对于基因表达的冷反应非常重要。如果将该5’-非翻译区附着至任意蛋白的mRNA(在其5’末端附着),那么在低温条件下发生从mRNA至蛋白的翻译。只要保持功能,可在来源于冷激蛋白的mRNA的5’-非翻译区的核苷酸序列中替代、缺失、插入或添加一个或多个核苷酸。
如此处所用的,“区域”是指核酸(DNA或RNA)的范围。如此处所用的,“mRNA的5’-非翻译区”是指不编码蛋白并且位于作为从DNA转录的结果合成的mRNA的5’侧的区域。在下文中,所述区域称作“5’-UTR(5’-非翻译区)”。除非另外指出,5’-UTR是指大肠杆菌cspA基因的mRNA的5’-非翻译区或其修饰物。
编码来源于上面所列的冷激蛋白基因的5’-UTR的部分可用于本发明的载体。具体地,优选地可使用来源于大肠杆菌cspA基因的部分。此外,可使用这样的部分,只要其对多肽的冷特异性表达有贡献,在该部分中,对核苷酸序列进行了部分修饰。例如,可使用这样的部分,在该部分中,通过整合上面有关(B)所述的操纵基因来修饰所述区域的核苷酸序列。可选择地,可将编码冷激蛋白基因的5’-UTR的部分置于(A)的启动子和编码待表达的多肽的基因的起始密码子之间。可将操纵基因整合入该部分。
除了上述元件外,通过在5’-非翻译区的下游包含与所用的宿主的核糖体RNA中的反下游框序列(anti-downstream box sequence)互补的核苷酸序列,可能增加表达效率。例如,在大肠杆菌的情况下,反下游框序列存在于16S核糖体RNA中的位置1467至位置1481。可能使用编码冷激蛋白的N-末端肽的区域,该区域含有和该序列高度互补的核苷酸序列。其中转录终止序列(终止子)被置于目的蛋白的基因下游的载体有利于目的蛋白的高表达,这是因为所述载体的稳定性得到了增加。
本发明的载体可以是常用载体(例如,质粒、噬菌体或病毒载体)中的任一种载体,只要其可用于达到作为载体的目的。对于除了上述元件外所含的区域,本发明的载体可具有例如复制起点、用作选择标记的药物抗性基因或操纵基因(例如,lac操纵子的lacIq基因)的功能所必需的调控基因。如果本发明的载体在其被转入宿主后被整合入该宿主的基因组DNA中,则不会产生不便。
下面具体地描述质粒载体的构建。除非另外指出,大肠杆菌CspA蛋白、参与所述蛋白表达的基因的区域和该基因中的启动子区域在此处分别称为“CspA”、“cspA基因”和“cspA启动子”。在天然的cspA基因的核苷酸序列(SEQ ID NO1)中,分别地,主要转录起始位点(+1)位于核苷酸426,SD序列(核糖体结合序列)位于核苷酸609至核苷酸611,CspA的起始密码子位于核苷酸621至核苷酸623,且CspA的终止密码子位于核苷酸832至核苷酸834,在GeneBank基因数据库中在目录号M30139下登记了所述天然的CspA基因,且该基因是可公开获得的。另外,序列中的从核苷酸462至核苷620的部分编码5′UTR。以WO 99/27117中描述的一个例子来例示部分修饰的5′UTR。用于实施例中的载体pCold08NC2包含的5′-UTR区是其实例。该核苷酸序列示于SEQ ID NO2。
可将和存在于16S核糖体RNA中的反下游框序列高度互补的核苷酸序列(下游框序列)整合入载体以增加目的基因的表达效率。存在于编码大肠杆菌CspA的N-末端部分的区域的下游框序列和上述反下游框序列只有67%的互补性。使用具有比上面核苷酸序列更高(优选地80%或更高,更优选地100%(理想地DB序列))的互补性的核苷酸序列可使连接在下游的基因的表达具有更高的效率。
此外,可将编码标记序列的核苷酸序列或编码蛋白酶识别氨基酸序列的核苷酸序列整合入载体,所述标记序列是用于促进表达的目的基因产物的纯化的肽,而所述蛋白酶识别氨基酸序列被用以除去目的基因产物中的额外肽(例如,标记序列)。
可将由几个组氨酸残基组成的组氨酸标记(His标记)、麦芽糖结合蛋白、谷胱甘肽-S-转移酶等用作用于纯化的标记序列。使用螯合柱可容易地纯化附着有组氨酸标记的多肽。对于其他标记序列,也可通过使用具有特异性亲和力的配体方便地进行纯化。因子Xa、凝血酶、肠激酶等可用作被用于除去额外肽的蛋白酶。可将编码用这些蛋白酶特异性切割的氨基酸序列的核苷酸序列整合入载体。
(2)陪伴分子表达的增强用于生产本发明的多肽的方法的特征在于在编码目的多肽的基因表达后,增强编码陪伴分子的基因的表达。
根据本发明,可将任何蛋白用作陪伴分子,只要其是参与蛋白的折叠的蛋白。其实例包括来源于大肠杆菌的DnaK、DnaJ、GrpE、GroEL、GroES和触发因子。
尽管不想限定本发明,但为使用冷激载体来进行多肽的表达,优选地使用在多肽中的脯氨酸上参与异构化的蛋白,例如触发因子(也称为肽基脯氨酰顺反异构酶(PPI酶))。陪伴分子不限定于来源于大肠杆菌的陪伴分子。例如,可使用来源于古细菌、酵母、微生物或嗜冷生物的陪伴分子。
可通过诱导染色体上的编码陪伴分子的基因表达,或通过已知技术,例如染色体上陪伴分子基因的修饰(拷贝数的增加或启动子的插入),通过将陪伴分子基因转入宿主,或通过宿主的诱变获得高度表达陪伴分子基因的品系来实现陪伴分子基因表达的增强。
例如,如果已知宿主中诱导陪伴分子表达的条件,那么可使用所述条件诱导染色体上的陪伴分子基因的表达。可使用利用同源重组的定点诱变或基因插入技术对宿主染色体进行染色体上的陪伴分子基因的修饰。例如,可使用这样的诱导型启动子来诱导表达,所述启动子已被插入至在宿主染色体上被诱导的编码陪伴分子的基因的上游。
在另一个实施方案中,获得这样的用于表达多肽的宿主的突变品系并将其用作宿主,在所述突变品系中,陪伴分子基因的表达得到增强。根据已知的方法,例如通过用诱变剂例如试剂或紫外光处理宿主微生物,然后选择其中陪伴分子基因的表达被增强的品系来获得突变品系。
编码陪伴分子的基因的表达的增强是指和正常量相比,宿主中的陪伴分子蛋白的量增加。证实按照上述方法是否增强了陪伴分子基因的表达是可能的,例如,通过使用识别陪伴分子的抗体测量陪伴分子蛋白,或通过使用已知的方法(例如,RT-PCR方法、Northern杂交或使用DNA阵列的杂交法)来测量从编码陪伴分子的基因转录的mRNA的量。
可独立地控制陪伴分子的表达和目的蛋白的表达是有利的,从而可最优化陪伴分子表达的量和表达的时间选择而不降低目的蛋白的表达水平。为实现该目的,优选地将陪伴分子基因置于可控制的启动子的下游。此外,优选地用于陪伴分子表达的可控启动子和用于目的蛋白表达的启动子不同。
可通过将陪伴分子基因插入载体并将其转入宿主来增强陪伴分子基因的表达。所述载体可以是常用载体(例如,质粒、噬菌体或病毒载体)中的任一种,只要其可用于达到作为载体的目的。
通常,两种紧密相关的质粒不能稳定地共存于单个宿主中。该现象称为不相容性。根据本发明,如果将质粒用作包含陪伴分子基因的载体(在下文中也称作陪伴分子质粒),那么优选地使用具有这样的复制子的载体,该载体未表现出和用于目的蛋白的表达载体的不相容性。例如,如果将一个具有ColE1复制子(例如,WO 99/27117中描述的pCold07)的载体用作目的蛋白的表达载体,那么可将载体pACYC中的p15A复制子等用于陪伴分子质粒。
根据本发明,可进一步任选地包含选择标记基因,从而可在用含有陪伴分子基因的载体转化后,容易地进行选择。这些选择标记基因包括氨苄青霉素抗性(Ampr)基因、卡那霉素抗性(Kmr)基因和氯霉素抗性(Cmr)基因。和外源蛋白的表达载体中包含的选择标记基因不同是想要的。
根据本发明使用的陪伴分子质粒的具体实例包括表达DnaK/DnaJ/GrpE和GroEL/GroES的质粒pG-KJE8、表达GroEL/GroES的质粒Gro7、表达DnaK/DnaJ/GrpE的质粒pKJE7、表达GroEL/GroES和触发因子的质粒pG-Tf2,以及表达触发因子的质粒pTf16(所有质粒都来自Takara Bio)。
可使用上述载体将编码陪伴分子的基因转入宿主,或可将其整合入宿主染色体上来使用。
根据本发明,要表达的外源蛋白可以是任何蛋白,只要其在宿主中是不稳定的和/或不溶的。这些外源蛋白包括干扰素、白细胞介素、白细胞介素受体、白细胞介素受体的拮抗剂、粒细胞集落刺激因子、粒细胞巨噬细胞集落刺激因子、巨噬细胞集落刺激因子、促红细胞生成素、血小板生成素、白血病抑制因子、干细胞生长因子、肿瘤坏死因子、生长激素、胰岛素原、胰岛素样生长因子、成纤维细胞生长因子、血小板衍生生长因子、转化生长因子、肝细胞生长因子、骨形态发生因子、神经生长因子、睫状神经营养因子、脑源神经营养因子、神经胶质细胞衍生神经营养因子、神经营养蛋白、尿激酶原、组织纤溶酶原激活物、凝血因子、C蛋白、葡糖脑苷脂酶、超氧物歧化酶、肾素、溶菌酶、P450、凝乳酶原、胰蛋白酶抑制剂、弹性蛋白酶抑制剂、脂皮质蛋白、苗条蛋白、免疫球蛋白、单链抗体、补体成分、血液清蛋白、雪松花粉抗原、低氧诱导的应激蛋白、蛋白激酶、原癌基因产物、转录调节因子和构成病毒的蛋白。
将本发明的表达载体转入宿主并进行目的蛋白的表达。宿主的实例包括,但不限于,原核生物(例如,细菌)、酵母、真菌、植物、昆虫细胞和哺乳动物细胞。表达载体的特征必需与所用的宿主相匹配。例如,如果在哺乳动物细胞系统中表达蛋白,则表达载体优选地使用从哺乳动物基因组中分离的启动子(例如,小鼠金属硫蛋白启动子)或分离自在例如细胞中繁殖的病毒的启动子(例如,杆状病毒启动子、痘苗病毒7.5K启动子)。
除其他以外,优选地使用原核生物例如大肠杆菌作为宿主。如果将革兰氏阴性细菌用作宿主,那么可在细胞质或壁膜间隙表达蛋白。
对于根据本发明将陪伴分子载体和表达载体转入宿主的方法,没有具体的限定,且可使用各种已知的方法。其实例包括按照磷酸钙沉淀法的转染、电穿孔、脂质体融合、核注射、用病毒或噬菌体感染。本发明也包括含有本发明的表达载体的宿主。转入宿主的方法可为一步形式,其中同时转移陪伴分子载体和表达载体,或为二步形式,其中在转入陪伴分子载体后再转入表达载体,或在转入表达载体后再转入陪伴分子载体。使用对应于选择标记基因的药物可筛选共转化的品系。可通过例如蛋白印迹等证实外源基因的表达。
在一个方面,本发明涉及一套用于表达多肽的载体,其包含上述冷激载体和含有陪伴分子基因的载体的组合。在该方面,优选地使用可插入编码多肽的基因的载体作为冷激载体,该基因的表达对于目的的实现是想要的。其实例包括具有(a)这样的DNA和(b)这样的限制性内切酶识别序列的载体,所述DNA编码来源于冷激蛋白基因的mRNA的5’-非翻译区,而所述识别序列可用于插入编码想要的多肽的基因且位于(a)的DNA的下游。
在另一个方面,本发明涉及这样的载体,在该载体中,编码陪伴分子的基因被插入至冷激载体。在该情况下,可通过用单个载体转化宿主来制备可用于表达目的多肽的转化体。
在该方面,可在这样的位置上安排可用于插入编码目的多肽的基因的限制性内切酶识别序列,在所述位置,将编码陪伴分子的基因框内地连接至编码目的多肽的基因,从而就可表达陪伴分子和目的多肽的融合蛋白。在陪伴分子和目的多肽的融合蛋白中,可将陪伴分子连接在目的多肽的N-末端侧或C-末端侧或两侧。融合蛋白可具有在陪伴分子和目的多肽之间的作为接头的氨基酸或肽。接头的链长度优选地为1至50个氨基酸,更优选地3至40个氨基酸,最优选地5至30个氨基酸。接头的氨基酸序列可以是蛋白酶识别序列或这样的序列,在该序列中插入了安排的多个蛋白酶识别序列。这些蛋白酶识别序列的实例包括各种蛋白酶例如因子Xa、凝血酶、肠激酶(所有酶都可从Takara Bio获得)和PreScission蛋白酶(Amersham Biosciences)的识别序列。例如,蛋白酶识别序列优选地是由4至8个氨基酸组成的序列。
可通过将编码目的多肽的基因插入上述载体并将其转入合适的宿主来获得目的多肽和陪伴分子的融合多肽。如果融合多肽具有包含蛋白酶的识别序列的接头,那么通过用蛋白酶消化所述多肽可能获得已和陪伴分子分离的目的多肽。
(3)生产多肽的方法按照例如下列步骤进行生产本发明的多肽的方法。
将编码目的多肽的基因插入这样的DNA的下游,所述DNA编码来源于冷激载体中的冷激蛋白基因的mRNA的5’-非翻译区。将如上所述构建的重组表达载体转入合适的宿主以制备转化体。
如果以组合的方式使用包含上述编码陪伴分子的基因的载体,那么再将所述载体转入转化体。如果冷激载体具有编码陪伴分子的基因,那么可单独地用载体转化宿主。
在正常条件下培养转化体。例如,在大肠杆菌的情况下,可在大约37℃下进行培养。可在所有培养步骤中在宿主中表达陪伴分子,或可在目的多肽表达的时候诱导表达。依赖于宿主中陪伴分子基因存在的状态,可诱导陪伴分子基因的表达。例如,如果要诱导宿主内固有的陪伴分子基因的表达,则可将宿主置于合适的条件下。如果编码陪伴分子的基因在异源启动子的控制下(例如,在将被插入载体的陪位分子基因转入宿主的情况下),则使用适合于控制转录的启动子的方法进行表达诱导。如果使用这样的宿主,那么上述诱导方法是不必需的,在所述宿主中,陪伴分子基因的表达被恒定地增强。
通常在上述的一般培养温度下增加细胞数目后诱导目的多肽的表达。通过从上述状态降低培养温度来在宿主中诱导冷激反应,从而导致目的多肽的优选的表达。尽管不想限定本发明,但通过将培养温度下调至低于一般培养温度的温度,例如下调5℃或更多,优选地10℃或更多,来诱导冷激反应。如果使用具有置于启动子的下游的操纵基因的冷激载体,那么可通过使用合适的方法消除操纵基因的功能来诱导启动子。
在冷激后,继续在低温下进一步培养转化体以表达多肽。目的多肽可通过从所获得的培养物中收集所述多肽来进行生产。可从转化体细胞纯化培养物中的多肽,所述转化体细胞是从培养物或培养物上清液或两者中收集的。可使用已知的蛋白纯化技术(例如硫酸铵分级分离、超滤和各种层析)的组合进行多肽的纯化。
可通过设计以这样的形式存在的表达多肽来促进纯化,该形式的多肽通过合适的配体结合至载体。例如,这样设计载体,从而使大约6个组氨酸残基的标记附着在多肽的N-末端侧。然后,可将所得的融合多肽通过组氨酸残基结合至金属(例如,镍)螯合物载体。使用这样的载体可容易地将表达的多肽和来源于宿主的蛋白分离。可通过用蛋白酶在接头处切割结合至载体的表达的多肽而容易地只将目的多肽从载体上释放出来。当使用咪唑洗脱而不用切割时,很自然地可能从载体释放表达的多肽。除了上述的组氨酸标记外,可能应用这样的方法,在所述方法中使用谷胱甘肽-S-转移酶或其部分作为标记和使用谷胱甘肽树脂(glutathione resin)来进行亲和层析,可能应用这样的方法,在该方法中使用麦芽糖结合蛋白或其部分作为标记和使用麦芽糖树脂来进行纯化等。
此外,可使用对抗体的亲和力。可设计用于纯化的标记,以使之位于表达的蛋白的N-末端侧或C-末端侧。本领域技术人员一般认可基因工程技术和亲和纯化法。
因为除了目的多肽外的多肽的表达在这样的系统(在该系统中,使用上述冷激载体表达多肽)中受到抑制,所以本发明的方法对于生产高纯度的多肽是有利的。
实施例下列实施例更详细地举例说明本发明,但并不被解释为限定其范围。
在上述方法中,如J.Sambrook等人(编著.),Molecular CloningA Laboratory Manual第3版,Cold Spring Harbor Laboratory(2001)中所述进行包括质粒的制备和限制性内切酶消化的基本方法。
实施例1通过和陪伴分子共表达的hDi-ASI的表达的检查(1)表达载体的构建为表达由人Dicer的PAZ+RNA酶III结构域(来自人Dicer的氨基酸序列的N末端的第679至第1924)组成的多肽,如下构建表达载体。
首先,使用DNA合成仪基于可公开获得的Genbank目录号AB028449下的核苷酸序列合成合成的引物5和6(SEQ ID NOS4和5),并按照常规方法进行纯化。合成的引物5是这样的合成的DNA,该DNA在核苷酸9至核苷酸14上具有限制性内切酶KpnI的识别序列,且在核苷酸16至核苷酸36上具有对应于人Dicer的氨基酸序列(SEQ ID NO3)中的氨基酸679至氨基酸685的核苷酸序列。合成的引物6在核苷酸9至核苷酸14上具有限制性内切酶HindIII的识别序列,且在核苷酸18至核苷酸35上具有对应于人Dicer的氨基酸序列(SEQ ID NO3)中的氨基酸1919至氨基酸1924的核苷酸序列。
使用合成的引物进行PCR。PCR的反应条件如下。
简而言之,通过加入2μl模板DNA(人cDNA文库、人胰腺,Takara Bio)、5μl 10×LA PCR缓冲液(Takara Bio)、5μldNTP混合物(Takara Bio)、10pmol合成的引物5、10pmol合成的引物6、0.5U Takara LA Taq(Takara Bio)和无菌水制备50μl总体积的反应混合物。将反应混合物置于TaKaRa PCR热循环仪(Thermal Cycler)SP(Takara Bio)中并进行如下的反应30个循环94℃进行1分钟,55℃进行1分钟和72℃进行3分钟。
反应后,将5μl反应混合物在1.0%琼脂糖凝胶上进行电泳。并从电泳凝胶中回收和纯化观察到的大约2.7-kbp的目的DNA片段,并将该片段进行乙醇沉淀。在乙醇沉淀后,将回收的DNA重悬浮于5μl无菌水中,并用限制性内切酶KpnI(Takara Bio)和限制性内切酶HindIII(Takara Bio)对其进行双重消化。在1.0%琼脂糖凝胶上电泳后提取和纯化KpnI-HindIII消化物以获得KpnI-HindIII消化的DNA片段。
然后,按照WO99/27117的描述,使用大肠杆菌JM109/pMM047(FERM BP-6523)(于1997年10月31日(原始保藏日期)保藏于独立行政法人产业技术综合研究所特许生物寄托中心(International PatentOrganism Depositary,National Institute of Advanced Science andTechnology),AIST Tsukuba Central 6,1-1,Higashi 1-chome,Tsukuba-shi,Ibaraki 305-8566,日本)携带的质粒pMM047作为原材料构建pCold08NC2。质粒pCold08NC2以从上游至下游的顺序具有下列cspA启动子、lac操纵基因、经修饰的来源于大肠杆菌cspA基因的5′-UTR和多克隆位点。此外,所述质粒具有lacI基因、与大肠杆菌16S核糖体RNA中的反下游框序列完全互补的下游框序列、由6个组氨酸残基组成的组氨酸标记和编码由因子Xa识别的氨基酸序列的核苷酸序列。载体pCold08NC2中的5′-UTR区的核苷酸序列示于SEQ ID NO2。
用与在制备KpnI-HindIII消化的DNA片段时使用的限制性内切酶相同的限制性内切酶切割载体pCold08NC2,并对末端去磷酸化。将所制备的载体和KpnI-HindIII消化的DNA片段混合在一起并使用DNA连接试剂盒(Takara Bio)将其相互连接。使用20μl连接混合物转化大肠杆菌JM109。使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为50μg/ml的氨苄青霉素的LB培养基上生长。
通过测序证实具有插入的目的DNA片段的质粒。该重组质粒称为pCold08 hDi-ASI。该质粒被称为和表示为质粒pCold08 hDi-ASI,且自2003年9月26日(原始保藏日期)以来,其一直以保藏号FERMBP-10076保藏在独立行政法人产业技术综合研究所特许生物寄托中心,AIST Tsukuba Central 6,1-1,Higashi 1-chome,Tsukuba-shi,Ibaraki 305-8566,日本。pCold08 hDi-ASI是包含这样的核苷酸序列的质粒,该序列编码人Dicer的氨基酸序列(SEQ ID NO3)中的氨基酸679至氨基酸1924的氨基酸序列(SEQ ID NO6的核苷酸序列,SEQ ID NO7的氨基酸序列)。从质粒表达的蛋白具有完美的(Perfect)DB序列、His标记序列和因子Xa序列。所述蛋白的氨基酸序列示于SEQ ID NO8,且核苷酸序列示于SEQ ID NO9。
(2)共转化体(co-transformant)的制备按照氯化钙法用1ng上述质粒pCold08/hDi-ASI和1ng陪伴分子质粒pGro7(其表达GroEL和GroES)、pKJE7(其表达DnaK、DnaJ和GrpE)、pG-Tf2(其表达GroEL、GroES和触发因子)或pTF16(其表达触发因子)(全部来自Takara Bio)转化大肠杆菌BL21。
通过使用含有浓度分别为20μg/ml和100μg/ml的氯霉素和氨苄青霉素的平板进行筛选以获得含有pCold08/hDi-ASI和pGro7、pKJE7、pG-Tf2或pTF16的共转化体。所获得的共表达hDi-ASI和其中一种陪伴分子的克隆被称为T1、T2、T3和T4。
通过用pCold08/hDi-ASI单独转化大肠杆菌BL21(Novagen)和使用含有浓度为100ug/ml的氨苄青霉素的平板进行筛选来制备作为对照的转化体。把无陪伴分子转移的常规表达系统的克隆称为C1。
(3)hDi-ASI的表达使用(1)中获得的各自转化体检查hDi-ASI的表达。使用5ml LB液体培养基(包含1%细菌用胰蛋白胨、0.5%酵母提取物、0.5%NaCl、20μg/ml氯霉素、50μg/ml氨苄青霉素)进行培养。使用无氯霉素的培养基培养作为对照的C1。
在37℃下培养各自转化体。在培养开始后,通过向培养基以0.5mg/ml(对于T1、T2或T4)的终浓度添加L-阿拉伯糖或以5ng/ml(对于T3)的终浓度添加四环素来诱导陪伴分子的表达。当浊度(OD600)达到大约0.4时,在15℃下培养15分钟,以0.5mM的终浓度向培养物中加入IPTG,并在15℃下进一步培养24小时以诱导hDi-ASI的表达。
在诱导hDi-ASI的表达24小时后,收集细胞。通过超声处理破裂细胞以制备细胞提取物级分。然后,通过在15,000×g下离心将可溶性级分与不溶性级分分离。将各对应于大约3.75×106个细胞的各自级分的部分进行SDS-PAGE。通过CBB染色(A)和使用抗-His标记抗体的蛋白印迹(Qiagen)(B)分析的结果显示于图1中。
如图1中所示,在作为常规表达系统对照的C1的细胞提取物级分中观察到具有144000的分子量的目的蛋白,但在可溶性级分中几乎没有观察到该蛋白。另一方面,如在T4中所见到的,在hDi-ASI和触发因子共表达的情况下,当和对照比较时,观察到细胞提取物级分中hDi-ASI的增加。所述蛋白主要在可溶性级分中被检测到。在T1、T2或T3的情况下(其中hDi-ASI和另一种陪伴分子共表达)在可溶性级分中几乎没有观察到该蛋白。
如上所述,表明和无陪伴分子转移的常规表达系统,或者和表达GroEL和GroES;Dnak、DnaJ和GrpE;或GroEL、GroES和触发因子的陪伴分子的共表达相比,和触发因子的共表达在增加hDi-ASI的表达水平和溶解性上是有效的。
(4)表达和纯化用上面(2)中制备的pTf16和pCold08 hDi-ASI转化大肠杆菌BL21,并使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为50μg/ml的氨苄青霉素的LB培养基中生长。将生长的菌落接种至两个备含有500ml TB液体培养基(6g细菌用胰蛋白胨、12g细菌用酵母提取物、2ml甘油、17mM KH2PO4、72mM K2HPO4、25mg氨苄青霉素)的容器中。接种后,以0.5mg/ml的终浓度向其中加入阿拉伯糖。将细胞在37℃、130rpm下进行培养直至对数生长期,然后冷却至15℃。冷却后,以1.0mM的终浓度向其中加入IPTG,并在15℃、130rpm下培养细胞24小时以进行表达诱导。然后通过离心收集细胞,以获得3.3g湿细胞。将3.3g湿细胞重悬浮于13.16ml结合缓冲液(50mMTris盐酸缓冲液(pH8.5)、100mM氯化钠、1mM氯化镁、蛋白酶抑制剂(完全的,不含EDTA的,Boehringer Mannheim))中。将通过超声处理破裂的细胞进行离心(12,000rpm,20分钟)以将上清液提取物和沉淀分离。
如下使用镍柱进一步纯化大约13ml上清液提取物。
简而言之,将对应于10ml树脂体积的Ni-NTA琼脂(Qiagen)注入50-mm的柱中并用30ml蒸馏水洗涤。然后用100ml结合缓冲液洗涤树脂并进行收集。向其中加入大约13ml从细胞破裂溶液制备的上清液并使用旋转摇荡器在4℃下轻轻混合大约1小时。将其中已吸附目的蛋白的树脂注入50-mm的柱子中并用50ml结合缓冲液洗涤2次。然后用50ml的缓冲液A(20mM tris-盐酸缓冲液(pH8.5)、100mM氯化钠、1mM氯化镁、10%甘油、20mM咪唑)、50ml缓冲液B(20mM tris-盐酸缓冲液(pH8.5)、800mM氯化钠、1mM氯化镁、10%甘油、20mM咪唑)和50ml缓冲液A洗涤树脂以除去除了目的蛋白外的不必要的蛋白。
洗涤后,用30ml缓冲液C(20mM tris-盐酸缓冲液(pH8.5)、100mM氯化钠、1mM氯化镁、10%甘油、100mM咪唑)进行洗脱。使用Centricon YM-10(Amicon)浓缩洗脱的样品,向其中加入10ml缓冲液D(50mM tris-盐酸缓冲液(pH8.5)、250mM氯化钠、1mM氯化镁、0.1mM DTT、0.1%Triton X-100、10%甘油),并浓缩该混合物。重复该程序两次。将浓缩物对500ml缓冲液E(50mM tris-盐酸缓冲液(pH8.5)、250mM氯化钠、1mM氯化镁、0.1mM DTT、0.1%Triton X-100、50%甘油)进行透析以获得大约220μl蛋白样品。当将其部分在10%SDS聚丙烯酰胺上进行电泳时,在对应于分子量大约为144,000的位置上观察到目的蛋白的条带。将该样品用于下面的活性确定。
(5)dsRNA降解活性的测量如下测量上述(4)中制备的蛋白样品的dsRNA降解活性。
首先,使用TurboScript T7转录试剂盒(GTS)按照附带的方案合成作为用于活性测量的底物的dsRNA。
具体地,通过将来自质粒pQBI1125(Wako Pure ChemicalIndustries)的编码红移绿色荧光蛋白(在下文中称为GFP)的基因(SEQ ID NO10)插入质粒pDON-AI(Takara Bio)来构建pDON-rsGFP。使用pDON-rsGFP作为模板和使用合成的引物3(SEQ IDNO11)(其具有T7启动子序列)和合成的引物4(SEQ ID NO12)进行PCR以获得获得扩增产物。使用所得的双链DNA作为模板和使用T7RNA聚合酶通过RNA合成反应制备大约700bp的dsRNA。通过加入1μg上面制备的dsRNA、1μl上面(3)中制备的蛋白样品、2μl 5x反应缓冲液(100mM tris盐酸缓冲液(pH8.5)、750mM氯化钠、12.5mM氯化镁)和不含核酸酶的水制备总体积10μl的反应混合物。在37℃下反应混合物反应18小时后,将10μl所述反应混合物在15%的聚丙烯酰胺凝胶上进行电泳。电泳后,用溴化乙锭对凝胶染色以观察切割的产物。结果,观察到大约21个碱基对的降解产物,从而表明其dsRNA降解活性。
如上所述,表明具有dsRNA降解活性的蛋白按照本发明的方法进行表达。
实施例2逆转录酶α和逆转录酶β的表达的检查如下相互比较单独的目的蛋白的表达、目的蛋白和触发因子的共表达以及目的蛋白和触发因子的融合蛋白的表达。使用两种表达系统(即,其中使用冷激载体的系统(冷激表达系统)和其中使用T7启动子和T7RNA聚合酶的组合的表达系统(T7启动子表达系统))来进行融合蛋白的表达。
(1)质粒载体的构建使用DNA合成仪基于大肠杆菌触发因子的基因序列(Genbank目录号NC_000913,位置454357至位置455655)合成合成的引物TFN和TFCP(SEQ ID NOS13和14),并按照常规方法对其进行纯化。
合成的引物TFN是这样的合成的DNA,该DNA具有编码来自大肠杆菌触发因子的氨基酸序列的N末端的第1至第9个氨基酸的核苷酸序列和在核苷酸4至核苷酸9上的限制性内切酶NdeI的识别序列。合成的引物TFCP是这样的合成的DNA,该DNA具有和编码来自大肠杆菌触发因子的氨基酸序列的C末端的第1至第9个氨基酸的核苷酸序列互补的核苷酸序列、和编码蛋白酶因子Xa的识别序列的核苷酸序列互补的核苷酸序列、限制性内切酶EcoRI的识别序列、限制性内切酶BamHI的识别序列和限制性内切酶HindIII的识别序列。从大肠杆菌HB101(Takara Bio)提取作为PCR的模板的基因组DNA。
使用合成的引物和基因组DNA进行PCR。PCR的反应条件如下。简而言之,通过加入1μl如上所述制备的模板DNA、10μl 10xPyrobest缓冲液II(Takara Bio)、8μl dNTP混合物(Takara Bio)、100pmol合成的引物TFN、100pmol合成的引物TFCP、2.5U PyrobestDNA聚合酶(Takara Bio)和无菌水来制备总体积为100μl的反应混合物。将反应混合物置于PCR热循环仪SP(Takara Bio)中并进行如下的反应30个循环94℃下进行30秒,59℃下进行30秒和72℃下进行2分钟。
反应后,将100μl的反应混合物在1%的琼脂糖凝胶上进行电泳。从电泳凝胶上回收和纯化观察到的大约1.5kbp的目的DNA片段,将其进行乙醇沉淀。乙醇沉淀后,将回收的DNA悬浮于15μl无菌水中,并用限制性内切酶NdeI(Takara Bio)和限制性内切酶HindIII(Takara Bio)进行双重消化。在1%琼脂糖凝胶上进行电泳后提取和纯化NdeI-HindIII消化物以获得NdeI-HindIII消化的DNA片段。
然后,用限制性内切酶NdeI和HindIII双重消化质粒载体pColdII(Takara Bio),并对末端去磷酸化。将所制备的载体和NdeI-HindIII消化的DNA片段混合在一起并使用DNA连接试剂盒(Takara Bio)将其相互连接。使用10μl的连接混合物转化大肠杆菌JM109。使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为100μg/ml的氨苄青霉素的LB培养基上生长。通过测序证实具有插入的目的DNA片段的质粒。随后,引入沉默突变以消除质粒中的触发因子基因序列中的限制性内切酶EcoRI的识别序列(Genbank目录号NC_000913,位置455107至位置455112)。将所获得的具有冷激表达系统和含有大肠杆菌触发因子基因序列的重组质粒称为pColdTF。
如下构建使用T7启动子表达系统表达目的蛋白和大肠杆菌触发因子的融合蛋白的质粒载体。
首先,用限制性内切酶EcoRI(Takara Bio)和限制性内切酶EcoO109I(Takara Bio)双重消化pColdTF,并对末端去磷酸化以获得EcoRI-EcoO109I消化的DNA片段。然后,用限制性内切酶EcoRI和限制性内切酶EcoO109I双重消化pCold08NC2,并将其在1%琼脂糖凝胶上进行电泳。提取和纯化EcoRI-EcoO109I消化物,并将其和EcoRI-EcoO109I消化的DNA片段混合并使用DNA连接试剂盒(Takara Bio)进行连接。使用10μl连接混合物转化大肠杆菌JM109。使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为100μg/ml的氨苄青霉素的LB培养基上生长。将所获得的重组质粒(其中已对pColdTF中的多克隆位点进行了修饰)称为pColdTF-II。
用限制性内切酶XbaI(Takara Bio)消化pColdTF-II,用T4DNA聚合酶(Takara Bio)使其成为平末端,然后用限制性内切酶NdeI进行降解以获得含有大肠杆菌触发因子的基因的NdeI平末端片段。
用限制性内切酶BamHI(Takara Bio)降解质粒载体pET16b(Novagen),用T4DNA聚合酶使其成为平末端,然后用限制性内切酶NdeI消化,并对末端去磷酸化。将所制备的载体和含有大肠杆菌触发因子基因的NdeI平末端DNA片段混合在一起并用DNA连接试剂盒将其相互连接。使用10μl连接混合物转化大肠杆菌JM109。使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为100μg/ml的氨苄青霉素的LB培养基上生长。将所获得的具有T7启动子表达系统和含有大肠杆菌触发因子基因序列的重组质粒称为pETTF。
(2)表达逆转录酶α和逆转录酶β的载体的构建基于劳斯相关病毒2(RAV-2)逆转录酶α亚基(在下文中称为RAV-2逆转录酶α)的氨基酸序列(Genbank目录号BAA22090,从N末端开始的第1至第572个氨基酸)合成具有SEQ ID NO15的序列的双链DNA。按照大肠杆菌的密码子选择修饰核苷酸序列而不改变编码的氨基酸序列,并设计该序列以使之在两端具有限制性内切酶EcoRI的识别序列和限制性内切酶XbaI的识别序列。
基于劳斯相关病毒2(RAV-2)逆转录酶β亚基(在下文中称为RAV-2逆转录酶β)的氨基酸序列(Genbank目录号BAA22090)合成具有SEQ ID NO16的序列的双链DNA。按照大肠杆菌的密码子选择修饰该核苷酸序列而不改变编码的氨基酸序列,并设计该序列以使之在两端具有限制性内切酶EcoRI的识别序列和限制性内切酶XbaI的识别序列。
用限制性内切酶EcoRI(Takara Bio)和XbaI(Takara Bio)双重消化两个合成的双链DNA,并将其在1%琼脂糖凝胶上进行电泳。从电泳凝胶上回收和纯化观察到的目的大小的DNA片段以获得含有编码RAV-2逆转录酶α的基因的经EcoRI-XbaI消化的DNA片段和含有编码RAV-2逆转录酶β的基因的经EcoRI-XbaI消化的DNA片段。
用限制性内切酶EcoRI和XbaI双重消化(1)中制备的pColdTF,并对末端去磷酸化。将所制备的载体和两种EcoRI-XbaI消化的DNA片段中的一种混合在一起并使用DNA连接试剂盒(Takara Bio)将其相互连接。使用10μl连接混合物转化大肠杆菌JM109。使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为100μg/ml的氨苄青霉素的LB培养基上生长。把在冷激表达系统中表达触发因子和RAV-2逆转录酶α的融合蛋白和触发因子和RAV-2逆转录酶β的融合蛋白的质粒分别称为pColdTF-α和pColdTF-β。
此外,按照所述用于pColdTF-α和pColdTF-β的方法(除了使用实施例1中构建的pCold08Nc2取代pColdTF外)制备单独表达RAV-2逆转录酶α和单独表达RAV-2逆转录酶β的质粒。所制备的质粒分别称为pCold08-α和pCold08-β。
如下构建在T7启动子表达系统中表达触发因子和RAV-2逆转录酶α的融合蛋白以及触发因子和RAV-2逆转录酶β的融合蛋白的质粒。
用限制性内切酶XbaI(Takara Bio)消化pColdTF-α和pColdTF-β,用T4 DNA聚合酶(Takara Bio)使其成为平末端,然后用限制性内切酶EcoRI进行消化,并将其在1%琼脂糖凝胶上进行电泳。从电泳凝胶上回收和纯化观察到的目的大小的DNA片段,以获得含有编码RAV-2逆转录酶α的基因的EcoRI平末端DNA片段和含有编码RAV-2逆转录酶β的基因的EcoRI平末端DNA片段。
用限制性内切酶SalI(Takara Bio)消化(1)中制备的pETTF,用T4DNA聚合酶使其成为平末端,然后用限制性内切酶EcoRI进行消化,并对末端去磷酸化。将所制备的载体和两种EcoRI平末端DNA片段中的一种混合在一起,并使用DNA连接试剂盒将其相互连接。使用10μl连接混合物转化大肠杆菌JM109。使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为100μg/ml的氨苄青霉素的LB培养基上生长。用于在T7启动子表达系统中表达触发因子和RAV-2逆转录酶α的融合蛋白和触发因子和RAV-2逆转录酶β的融合蛋白的质粒分别称为pETTF-α和pETTF-β。
(3)转化体的制备按照氯化钙法使用在冷激表达系统中表达触发因子和RAV-2逆转录酶α的融合蛋白的pColdTF-α转化大肠杆菌BL21。通过使用含有浓度为100μg/ml的氨苄青霉素的平板进行筛选来获得转化体。
也以相似的方式制备用pColdTF-β转化的大肠杆菌BL21的转化体,所述pColdTF-β用于在冷激表达系统中表达触发因子和RAV-2逆转录酶β的融合蛋白。
也制备用于和上述融合表达系统进行比较的下列转化体在单一表达系统中表达RAV-2逆转录酶α或RAV-2逆转录酶β的转化体;在共表达系统中表达RAV-2逆转录酶α和触发因子的转化体;在共表达系统中表达RAV-2逆转录酶β和触发因子的转化体;在T7启动子表达系统中表达触发因子和RAV-2逆转录酶α的融合蛋白的转化体;和在T7启动子表达系统中表达触发因子和RAV-2逆转录酶β的融合蛋白的转化体。
按照这样的制备方法获得用于在单一表达系统中表达的转化体,该方法除了用质粒pCold08-α或pCold08-β转化BL21外,和上述的关于制备用于在冷激表达系统中表达融合蛋白的转化体的方法相似。
如下制备用于在共表达系统中表达的转化体。首先,按照氯化钙方法使用质粒pTf16和质粒pCold08-α或pCold08-β转化大肠杆菌BL21。通过使用含有浓度分别为100μg/ml和20μg/ml的氯霉素和氨苄青霉素的平板进行筛选来获得含有质粒pTf16和pCold08-α或pCold08-β的共转化体。
按照这样的制备方法获得用于在T7启动子表达系统中表达融合蛋白的转化体,该方法除了使用质粒pETTF-α或pETTF-β,和将BL21(DE3)(Novagen)进行转化外,和上述有关制备用于在冷激表达系统中表达融合蛋白的转化体的方法相似。
(4)逆转录酶α和逆转录酶β的表达使用(3)中获得的转化体检查逆转录酶α和逆转录酶β的表达。使用5ml含有浓度为50μg/ml的氨苄青霉素的LB液体培养基培养用于在冷激表达系统中表达融合蛋白的转化体和用于单一表达系统的转化体。使用5ml含有浓度分别为50μg/ml、20μg/ml和0.5mg/ml的氨苄青霉素、氯霉素和阿拉伯糖的LB液体培养基培养用于共表达系统的转化体。在37℃下培养各自的转化体。当浊度(OD600)达到大约0.4时,在15℃下进行培养15分钟,以1mM的终浓度向培养物中加入IPTG,并在15℃培养24小时以进行表达诱导。在表达诱导24小时后,收集细胞。
使用5ml含有浓度为50μg/ml的氨苄青霉素的LB液体培养基培养用于在T7启动子表达系统中表达融合蛋白的转化体。在37℃下培养转化体。当浊度(OD600)达到大约0.4时,以1mM的终浓度向培养物中加入IPTG,并在37℃培养3小时以进行表达诱导。在表达诱导3小时后,收集细胞。
在PBS中悬浮细胞,并通过超声处理破裂细胞以制备细胞提取物级分。然后,通过在15,000×g下离心将可溶性级分和不溶性级分分开。将各对应于大约3.75×106个细胞的各自级分的部分进行SDS-PAGE。通过CBB染色分析的结果显示于图2。
如图2中所示,在使用pCold08-α或pCold08-β的目的蛋白的单一表达情况(A)和使用pCold08-α和pTf16、或pCold08-β和pTf16的目的蛋白和触发因子的共表达的情况(B)下,在细胞提取物级分中观察到分别对应于RAV-2逆转录酶α和RAV-2逆转录酶β的分子量63,000Da和98,000Da的表达产物,但在可溶性级分中几乎未观察到该表达产物。在使用pETTF-α或pETTF-β的目的蛋白和触发因子的融合蛋白在T7启动子表达系统中表达的情况(C)下,在不溶性级分中检测到大部分在细胞提取物级分中检测到的目的蛋白。另一方面,在使用pColdTF-α或pColdTF-β的目的蛋白和触发因子的融合表达的情况(D)下,在可溶性级分中检测到大部分在细胞提取物级分中检测到的目的蛋白。
实施例3DNA酶的表达(1)表达DNA酶的载体的构建使用pCold08-End1(FERM BP-10313)(2005年2月16日(原始保藏日期)保藏于独立行政法人产业技术综合研究所特许生物寄托中心,AIST Tsukuba Central 6,1-1,Higashi 1-chome,Tsukuba-shi,Ibaraki305-8566,日本)作为单独表达DNA酶的质粒。该质粒包含编码由254个氨基酸残基组成的DNA酶的核苷酸序列,且这样构建所述质粒,从而使其表达这样的271个氨基酸残基的融合蛋白,在该融合蛋白中,给DNA酶加上了His标记、因子Xa的识别序列和接头序列。
如下构建用于表达触发因子和DNA酶的融合蛋白的质粒。
首先,使用DNA合成仪基于pCold08-End1的核苷酸序列合成合成的引物NUCN和NUCC(SEQ ID NOS17和18),并按照常规方法纯化所述引物。合成的引物NUCN是这样的合成的DNA,该DNA具有编码来自DNA酶N末端的第1至第7个氨基酸的核苷酸序列和在核苷酸4至核苷酸9上的限制性内切酶EcoRI的识别序列。合成的引物NUCC是这样的合成的DNA,该DNA具有和编码来自DNA酶的N末端的第247至第254个氨基酸的核苷酸序列互补的核苷酸序列以及在核苷酸4至核苷酸9上的限制性内切酶BamHI的识别序列。
使用合成的引物进行PCR。PCR的反应条件如下。简而言之,通过加入1μl模板DNA(pCold08-End1)、10μl 10x Pyrobest缓冲液II(Takara Bio)、8μl dNTP混合物(Takara Bio)、100pmol合成的引物NUCN、100pmol合成的引物NUCC、2.5U Pyrobest DNA聚合酶(Takara Bio)和无菌水来制备总体积100μl的反应混合物。将反应混合物置于PCR热循环仪SP(Takara Bio)中并如下进行反应30个循环94℃进行30秒,58℃进行30秒和72℃进行1分钟。
反应后,将100μl反应混合物在1%琼脂糖凝胶上进行电泳。从电泳凝胶上回收和纯化观察到的大约0.8kbp的目的DNA片段并将其进行乙醇沉淀。在乙醇沉淀后,将回收的DNA悬浮于15μl无菌水中,并用限制性内切酶EcoRI(Takara Bio)和限制性内切酶BamHI(Takara Bio)进行双重消化。在1%的琼脂糖凝胶上进行电泳后,提取和纯化EcoRI-BamHI消化物以获得EcoRI-BamHI消化的DNA片段。
然后,用限制性内切酶EcoRI和BamHI双重消化实施例2(2)中制备的pColdTF,并对末端去磷酸化。将所制备的载体和两种EcoRI-BamHI消化的DNA片段中的一种混合在一起并使用DNA连接试剂盒(Takara Bio)将其相互连接。使用10μl连接混合物转化大肠杆菌JM109。使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为100μg/ml的氨苄青霉素的LB培养基上生长。制备具有插入的目的DNA片段的质粒。将用于表达触发因子和DNA酶的融合蛋白的质粒称作pColdTF-End1。
(2)转化体的制备按照氯化钙法使用表达触发因子和DNA酶的融合蛋白的pColdTF-End1转化大肠杆菌BL21。通过使用含有浓度为100μg/ml的氨苄青霉素的平板进行筛选来获得转化体。
也制备用于和融合表达系统进行比较的用于在单一表达系统中表达DNA酶的转化体和用于在共表达系统中表达DNA酶和触发因子的转化体。
按照这样的制备方法获得在单一表达系统中表达的转化体,该方法除了用质粒pCold08-End1转化BL21外,和上述转化体的制备方法相似。
如下制备在共表达系统中表达的转化体。首先,按照氯化钙法,使用质粒pCold08-End1和质粒pTf16转化大肠杆菌BL21。通过使用含有浓度分别为100μg/ml和20μg/ml的氯霉素和氨苄青霉素的平板进行筛选来获得含有质粒pCold08-End1和pTf16的共转化体。
(3)DNA酶的表达使用(2)中获得的转化体检查DNA酶的表达。使用5ml含有浓度为50μg/ml的氨苄青霉素的LB液体培养基来培养用于融合表达系统的转化体和用于单一表达系统的转化体。使用5ml含有浓度分别为50μg/ml、20μg/ml和0.5mg/ml的氨苄青霉素、氯霉素和阿拉伯糖的LB液体培养基来培养用于共表达系统的转化体。在37℃下培养各自的转化体。当浊度(OD600)达到大约0.8时,在15℃下培养15分钟,以1mM的终浓度向培养物中加入IPTG,并在15℃下培养24小时以进行表达诱导。在进行表达诱导24小时后,收集细胞。将细胞悬浮于PBS,并通过超声处理破裂细胞以制备细胞提取物级分。然后,通过在15,000×g下离心将可溶性级分和不溶性级分分离。将各对应于0.05OD(OD600)的各自级分的部分进行SDS-PAGE(5-20%的凝胶)。通过CBB染色的分析结果显示于图3中。
如图3中所示,在使用pCold08-End1的目的蛋白的单一表达的情况(A)和使用pCold08-End1和pTf16的目的蛋白和触发因子的共表达的情况(B)下,在对可溶性级分或不溶性级分进行CBB染色后,未观察到对应于DNA酶的分子量31,000Da的表达产物的明显条带。在使用pColdTF-End1的DNA酶和触发因子的融合表达的情况(C)下,对于可溶性级分,检测到对应于目的蛋白的条带。
(4)DNA酶活性的测量测量(3)中制备的融合表达系统的超声处理的可溶性级分的DNA酶活性。也获得作为对照的来自单独用载体pColdTF(无整合的插入片段)转化的大肠杆菌的超声处理的可溶性部分,并在相同的时间测量活性。以和上面(2)和(3)中的方式相似的方式获得作为对照的超声处理的可溶性级分,只是除了使用pColdTF外。
使用λ-HindIII消化物(Takara Bio)作为活性测量的底物。通过加入1μgλ-HindIII消化物、对应于0.025OD(OD600)的超声处理的可溶性级分、5μl 10x反应缓冲液(400mM tris-盐酸缓冲液(pH7.5)、100mM氯化钠、60mM氯化镁、10mM氯化钙)和不含核酸酶的水来制备总体积50μl的反应混合物。将反应混合物在20℃下反应2小时。将10μl的反应混合物在1%的琼脂糖凝胶上进行电泳以分析切割的产物。结果显示于图4中。
如图4所示,当使用超声处理的可溶性级分作为对照(泳道1)时,几乎没有观察到底物的降解。另一方面,当使用DNA酶和触发因子的融合表达系统的超声处理的可溶性级分(泳道2)时,底物被降解并观察到DNA酶的活性。
实施例4hDi-PAZ的表达的检查(1)表达载体的构建为表达包含人Dicer的PAZ结构域(来自人Dicer的氨基酸序列的N末端的第895至第1064个氨基酸)的多肽(来自人Dicer的氨基酸序列的N末端的第892至第1064个氨基酸;也称作PAZ),如下构建表达载体。
首先,使用DNA合成仪基于可公开获得的在Genbank目录号AB028449下的核苷酸序列合成合成的引物1和2(SEQ ID NOS19和20),并按照常规的方法纯化所述引物。合成的引物1是这样的合成的DNA,该DNA具有在核苷酸9至核苷酸14上的限制性内切酶KpnI的识别序列和在核苷酸16至核苷酸36上对应于人Dicer的氨基酸序列(SEQ ID NO3)中的氨基酸892至氨基酸898的核苷酸序列。合成的引物2具有在核苷酸9至核苷酸14上的限制性内切酶HindIII的识别序列和在核苷酸15至核苷酸36上对应于人Dicer的氨基酸序列(SEQ ID NO3)中的氨基酸1058至氨基酸1064的核苷酸序列。
使用所述合成的引物进行PCR。使用实施例1-(2)中制备的pCold08/hDi-ASI作为模板DNA。PCR的反应条件如下。
简而言之,通过加入1ng模板DNA、10μl 10x LA PCR缓冲液(Takara Bio)、8μl dNTP混合物(Takara Bio)、10pmol合成的引物5、10pmol合成的引物6、0.5U的Takara Ex Taq(Takara Bio)和无菌水来制备总体积100μl的反应混合物。将反应混合物置于TaKaRa PCR热循环仪MP(Takara Bio)中并进行如下的反应30个循环94℃进行30秒、55℃进行30秒和72℃进行2分钟。
反应后,将95μl反应混合物在1.0%琼脂糖凝胶上进行电泳。从电泳凝胶上回收和纯化观察到的大约530bp的目的DNA片段,并将其进行乙醇沉淀。乙醇沉淀后,将回收的DNA悬浮于5μl无菌水中,并用限制性内切酶KpnI(Takara Bio)和限制性内切酶HindIII(Takara Bio)进行双重消化。在1.0%琼脂糖凝胶上电泳后,提取和纯化KpnI-HindIII消化物以获得经KpnI-HindIII消化的DNA片段。
用与在制备KpnI-HindIII消化的DNA片段时所用的酶相同的限制性内切酶切割载体pCold08NC2,并对末端去磷酸化。将所制备的载体和KpnI-HindIII消化的DNA片段混合在一起并用DNA连接试剂盒(Takara Bio)将其相互连接。使用6μl连接混合物转化大肠杆菌JM109。使转化体在含有浓度为1.5%(w/v)的琼脂和浓度为100μg/ml的氨苄青霉素的LB培养基上生长。
具有插入的目的DNA片段的质粒称作pCold08/hDi-PAZ。pCold08/hDi-PAZ是含有这样的核苷酸序列的质粒,该核苷酸序列编码来自人Dicer的氨基酸序列(SEQ ID NO3)中的氨基酸892至氨基酸1064的氨基酸序列。从所述质粒表达的蛋白具有完美的DB序列、His标记序列和因子Xa序列。
按照这样的方法制备用于表达触发因子和PAZ的融合蛋白的质粒,该方法除了将实施例2-(1)中制备的pColdTF-II用作载体外,和上述有关pCold08/hDi-PAZ的制备的方法相似。将所述质粒称为pColdTF/hDi-PAZ。
(2)转化体的制备按照氯化钙法使用用于表达触发因子和hDi-PAZ的融合蛋白的pColdTF/hDi-PAZ转化大肠杆菌BL21。通过使用含有浓度为100μg/ml的氨苄青霉素的平板进行筛选来获得转化体。
也制备用于和融合表达系统进行比较的用于在单一表达系统中表达hDi-PAZ的转化体和用于在共表达系统中表达hDi-PAZ和触发因子的转化体。
按照这样的制备方法获得在单一表达系统中表达的转化体,该制备方法除了用质粒pCold08/hDi-PAZ转化BL21外,和用于在融合表达系统中表达的转化体的制备方法相似。如下制备用于在共表达系统中表达的转化体。首先,按照氯化钙法使用质粒pCold08/hDi-PAZ和质粒pTf16转化大肠杆菌A19。通过使用含有浓度分别为50μg/ml和100μg/ml的氯霉素和氨苄青霉素的平板进行筛选来获得含有质粒pCold08/hDi-PAZ和pTf16的共转化体。
(3)hDi-PAZ的表达使用(2)中获得的转化体检查hDi-PAZ的表达。使用3ml含有浓度为50μg/ml的氨苄青霉素的LB液体培养基培养用于融合表达系统的转化体和用于单一表达系统的转化体。使用3ml含有浓度分别为50μg/ml、20μg/ml和0.5mg/ml的氨苄青霉素、氯霉素和阿拉伯糖的LB液体培养基培养用于共表达系统的转化体。在37℃下培养各自的转化体。当浊度(OD600)达到大约0.4时,在15℃下进行培养15分钟,以0.5mM的终浓度向培养物中加入IPTG,并在15℃下进行培养24小时以进行表达诱导。在进行表达诱导24小时后,收集细胞。将细胞悬浮于细胞破裂溶液(50mM tris-HCl(pH8.5)、100mM NaCl、1mMMgCl2、蛋白酶抑制剂(完全不含EDTA))中并通过超声处理进行破裂以制备细胞提取物级分。然后,通过在15,000×g下离心将可溶性级分和不溶性级分分离。将各对应于大约2.5×106个细胞的各自级分的部分进行SDS-PAGE。通过CBB染色进行分析。
结果,在使用pCold08/hDi-PAZ的目的蛋白的单一表达和使用pCold08/hDi-PAZ和pTf16的目的蛋白和触发因子的共表达的情况下,在细胞提取物级分中观察到对应于目的蛋白的分子量24,000Da的表达产物,但在可溶性级分中几乎未检测到该表达产物。在使用pColdTF/hDi-PAZ进行的目的蛋白和触发因子的融合表达的情况下,和对照相比,细胞提取物级分中的目的蛋白的量增加。大部分在可溶性级分中检测到。
工业适用性根据本发明的方法,可能产生相当大量的具有高纯度同时保持其活性的目的多肽。
序列表独立文字SEQ ID NO2;编码大肠杆菌cspA基因的突变的5′-UTR的基因SEQ ID NO4;扩增编码人dicer突变体的基因的合成的引物5SEQ ID NO5;扩增编码人dicer突变体的基因的合成的引物6
SEQ ID NO6;编码人dicer突变体的基因SEQ ID NO7;人dicer突变体的氨基酸序列SEQ ID NO8;人dicer突变体的氨基酸序列SEQ ID NO9;编码人dicer突变体的基因SEQ ID NO10;编码红移绿色荧光蛋白的基因SEQ ID NO11;扩增编码红移绿色荧光蛋白的基因的合成的引物3SEQ ID NO12;扩增编码红移绿色荧光蛋白的基因的合成的引物4SEQ ID NO13;扩增编码触发因子的基因的合成的引物TFNSEQ ID NO14;扩增编码触发因子的基因的合成的引物TFCPSEQ ID NO15;编码RAV-2逆转录酶α亚基的基因SEQ ID NO16;编码RAV-2逆转录酶β亚基的基因SEQ ID NO17;扩增编码DNA酶的基因的合成的引物NUCNSEQ ID NO18;扩增编码DNA酶的基因的合成的引物NUCCSEQ ID NO19;扩增编码人dicer PAZ结构域的基因的合成的引物1SEQ ID NO20;扩增编码人dicer PAZ结构域的基因的合成的引物2
序列表<110>TAKARA BIO INC.
<120>生产多肽的方法<130>665240<150>JP 2004-152598<151>2004-05-21<150>JP 2005-067984<151>2005-03-14<160>20<170>PatentIn version 3.3<210>1<211>1209<212>DNA<213>大肠杆菌(Escherichia coli)<400>1aagcttcgat gcaattcacg atcccgcagt gtgatttgag gagttttcaa tggaatataa60agatccaatg catgagctgt tgagcagcct ggaacagatt gtttttaaag atgaaacgca120gaaaattacc ctgacgcaca gaacaacgtc ctgtaccgaa attgagcagt tacgaaaagg180gacaggatta aaaatcgatg atttcgcccg ggttttgggc gtatcagtcg ccatggtaaa240ggaatgggaa tccagacgcg tgaagccttc aagtgccgaa ctaaaattga tgcgtttgat300tcaagccaac ccggcattaa gtaagcagtt gatggaatag acttttatcc actttattgc360tgtttacggt cctgatgaca ggaccgtttt ccaaccgatt aatcataaat atgaaaaata420attgttgcat cacccgccaa tgcgtggctt aatgcacatc aacggtttga cgtacagacc480attaaagcag tgtagtaagg caagtccctt caagagttat cgttgatacc cctcgtagtg540cacattcctt taacgcttca aaatctgtaa agcacgccat atcgccgaaa ggcacactta600
attattaaag gtaatacact atgtccggta aaatgactgg tatcgtaaaa tggttcaacg660ctgacaaagg cttcggcttc atcactcctg acgatggctc taaagatgtg ttcgtacact720tctctgctat ccagaacgat ggttacaaat ctctggacga aggtcagaaa gtgtccttca780ccatcgaaag cggcgctaaa ggcccggcag ctggtaacgt aaccagcctg taatctctgc840ttaaaagcac agaatctaag atccctgcca tttggcgggg atttttttat ttgttttcag900gaaataaata atcgatcgcg taataaaatc tattattatt tttgtgaaga ataaatttgg960gtgcaatgag aatgcgcaac gccgtaagta aggcgggaat aatttcccgc cgaagactct1020tactctttca atttgcaggc taaaaacgcc gccagctcat aactctcctg tttaatatgc1080aattcacaca gtgaatctct tatcatccag gtgaaaaata aaagcgtgaa acaaatcact1140attaaagaaa gtaatctata tttctgcgca ttccagctct gtgttgattt cacgagtatg1200tactgcacc1209<210>2<211>143<212>RNA<213>人工序列<220>
<223>编码大肠杆菌(Escherichia coli)cspA基因的突变的5’-UTR的基因<400>2aauugugagc ggauaacaau uugaugugcu agcgcauauc caguguagua aggcaagucc60cuucaagagc cuuuaacgcu ucaaaaucug uaaagcacgc cauaucgccg aaaggcacac120uuaauuauua aagguaauac acu143<210>3<211>1924<212>PRT<213>智人(Homo sapiens)
<400>3Met Lys Ser Pro Ala Leu Gln Pro Leu Ser Met Ala Gly Leu Gln Leu1 5 10 15Met Thr Pro Ala Ser Ser Pro Met Gly Pro Phe Phe Gly Leu Pro Trp20 25 30Gln Gln Glu Ala Ile His Asp Asn Ile Tyr Thr Pro Arg Lys Tyr Gln35 40 45Val Glu Leu Leu Glu Ala Ala Leu Asp His Asn Thr Ile Val Cys Leu50 55 60Asn Thr Gly Ser Gly Lys Thr Phe Ile Ala Ser Thr Thr Leu Leu Lys65 70 75 80Ser Cys Leu Tyr Leu Asp Leu Gly Glu Thr Ser Ala Arg Asn Gly Lys85 90 95Arg Thr Val Phe Leu Val Asn Ser Ala Asn Gln Val Ala Gln Gln Val100 105 110Ser Ala Val Arg Thr His Ser Asp Leu Lys Val Gly Glu Tyr Ser Asn115 120 125Leu Glu Val Asn Ala Ser Trp Thr Lys Glu Arg Trp Asn Gln Glu Phe130 135 140Thr Lys His Gln Val Leu Ile Met Thr Cys Tyr Val Ala Leu Asn Val145 150 155 160Leu Lys Asn Gly Tyr Leu Ser Leu Ser Asp Ile Asn Leu Leu Val Phe165 170 175
Asp Glu Cys His Leu Ala Ile Leu Asp His Pro Tyr Arg Glu Phe Met180 185 190Lys Leu Cys Glu Ile Cys Pro Ser Cys Pro Arg Ile Leu Gly Leu Thr195 200 205Ala Ser Ile Leu Asn Gly Lys Trp Asp Pro Glu Asp Leu Glu Glu Lys210 215 220Phe Gln Lys Leu Glu Lys Ile Leu Lys Ser Asn Ala Glu Thr Ala Thr225 230 235 240Asp Leu Val Val Leu Asp Arg Tyr Thr Ser Gln Pro Cys Glu Ile Val245 250 255Val Asp Cys Gly Pro Phe Thr Asp Arg Ser Gly Leu Tyr Glu Arg Leu260 265 270Leu Met Glu Leu Glu Glu Ala Leu Asn Phe Ile Asn Asp Cys Asn Ile275 280 285Ser Val His Ser Lys Glu Arg Asp Ser Thr Leu Ile Ser Lys Gln Ile290 295 300Leu Ser Asp Cys Arg Ala Val Leu Val Val Leu Gly Pro Trp Cys Ala305 310 315 320Asp Lys Val Ala Gly Met Met Val Arg Glu Leu Gln Lys Tyr Ile Lys325 330 335His Glu Gln Glu Glu Leu His Arg Lys Phe Leu Leu Phe Thr Asp Thr340 345 350
Phe Leu Arg Lys Ile His Ala Leu Cys Glu Glu His Phe Ser Pro Ala355 360 365Ser Leu Asp Leu Lys Phe Val Thr Pro Lys Val Ile Lys Leu Leu Glu370 375 380Ile Leu Arg Lys Tyr Lys Pro Tyr Glu Arg His Ser Phe Glu Ser Val385 390 395 400Glu Trp Tyr Asn Asn Arg Asn Gln Asp Asn Tyr Val Ser Trp Ser Asp405 410 415Ser Glu Asp Asp Asp Glu Asp Glu Glu Ile Glu Glu Lys Glu Lys Pro420 425 430Glu Thr Asn Phe Pro Ser Pro Phe Thr Asn Ile Leu Cys Gly Ile Ile435 440 445Phe Val Glu Arg Arg Tyr Thr Ala Val Val Leu Asn Arg Leu Ile Lys450 455 460Glu Ala Gly Lys Gln Asp Pro Glu Leu Ala Tyr Ile Ser Ser Asn Phe465 470 475 480Ile Thr Gly His Gly Ile Gly Lys Asn Gln Pro Arg Asn Asn Thr Met485 490 495Glu Ala Glu Phe Arg Lys Gln Glu Glu Val Leu Arg Lys Phe Arg Ala500 505 510His Glu Thr Asn Leu Leu Ile Ala Thr Ser Ile Val Glu Glu Gly Val515 520 525
Asp Ile Pro Lys Cys Asn Leu Val Val Arg Phe Asp Leu Pro Thr Glu530 535 540Tyr Arg Ser Tyr Val Gln Ser Lys Gly Arg Ala Arg Ala Pro Ile Ser545 550 555 560Asn Tyr Ile Met Leu Ala Asp Thr Asp Lys Ile Lys Ser Phe Glu Glu565 570 575Asp Leu Lys Thr Tyr Lys Ala Ile Glu Lys Ile Leu Arg Asn Lys Cys580 585 590Ser Lys Ser Val Asp Thr Gly Glu Thr Asp Ile Asp Pro Val Met Asp595 600 605Asp Asp His Val Phe Pro Pro Tyr Val Leu Arg Pro Asp Asp Gly Gly610 615 620Pro Arg Val Thr Ile Asn Thr Ala Ile Gly His Ile Asn Arg Tyr Cys625 630 635 640Ala Arg Leu Pro Ser Asp Pro Phe Thr His Leu Ala Pro Lys Cys Arg645 650 655Thr Arg Glu Leu Pro Asp Gly Thr Phe Tyr Ser Thr Leu Tyr Leu Pro660 665 670Ile Asn Ser Pro Leu Arg Ala Ser Ile Val Gly Pro Pro Met Ser Cys675 680 685Val Arg Leu Ala Glu Arg Val Val Ala Leu Ile Cys Cys Glu Lys Leu690 695 700
His Lys Ile Gly Glu Leu Asp Asp His Leu Met Pro Val Gly Lys Glu705 710 715 720Thr Val Lys Tyr Glu Glu Glu Leu Asp Leu His Asp Glu Glu Glu Thr725 730 735Ser Val Pro Gly Arg Pro Gly Ser Thr Lys Arg Arg Gln Cys Tyr Pro740 745 750Lys Ala Ile Pro Glu Cys Leu Arg Asp Ser Tyr Pro Arg Pro Asp Gln755 760 765Pro Cys Tyr Leu Tyr Val Ile Gly Met Val Leu Thr Thr Pro Leu Pro770 775 780Asp Glu Leu Asn Phe Arg Arg Arg Lys Leu Tyr Pro Pro Glu Asp Thr785 790 795 800Thr Arg Cys Phe Gly Ile Leu Thr Ala Lys Pro Ile Pro Gln Ile Pro805 810 815His Phe Pro Val Tyr Thr Arg Ser Gly Glu Val Thr Ile Ser Ile Glu820 825 830Leu Lys Lys Ser Gly Phe Met Leu Ser Leu Gln Met Leu Glu Leu Ile835 840 845Thr Arg Leu His Gln Tyr Ile Phe Ser His Ile Leu Arg Leu Glu Lys850 855 860Pro Ala Leu Glu Phe Lys Pro Thr Asp Ala Asp Ser Ala Tyr Cys Val865 870 875 880
Leu Pro Leu Asn Val Val Asn Asp Ser Ser Thr Leu Asp Ile Asp Phe885 890 895Lys Phe Met Glu Asp Ile Glu Lys Ser Glu Ala Arg Ile Gly Ile Pro900 905 910Ser Thr Lys Tyr Thr Lys Glu Thr Pro Phe Val Phe Lys Leu Glu Asp915 920 925Tyr Gln Asp Ala Val Ile Ile Pro Arg Tyr Arg Asn Phe Asp Gln Pro930 935 940His Arg Phe Tyr Val Ala Asp Val Tyr Thr Asp Leu Thr Pro Leu Ser945 950 955 960Lys Phe Pro Ser Pro Glu Tyr Glu Thr Phe Ala Glu Tyr Tyr Lys Thr965 970 975Lys Tyr Asn Leu Asp Leu Thr Asn Leu Asn Gln Pro Leu Leu Asp Val980 985 990Asp His Thr Ser Ser Arg Leu Asn Leu Leu Thr Pro Arg His Leu Asn995 10001005Gln Lys Gly Lys Ala Leu Pro Leu Ser Ser Ala Glu Lys Arg Lys101010151020Ala Lys Trp Glu Ser Leu Gln Asn Lys Gln Ile Leu Val Pro Glu102510301035Leu Cys Ala Ile His Pro Ile Pro Ala Ser Leu Trp Arg Lys Ala104010451050
Val Cys Leu Pro Ser Ile Leu Tyr Arg Leu His Cys Leu Leu Thr105510601065Ala Glu Glu Leu Arg Ala Gln Thr Ala Ser Asp Ala Gly Val Gly107010751080Val Arg Ser Leu Pro Ala Asp Phe Arg Tyr Pro Asn Leu Asp Phe108510901095Gly Trp Lys Lys Ser Ile Asp Ser Lys Ser Phe Ile Ser Ile Ser110011051110Asn Ser Ser Ser Ala Glu Asn Asp Asn Tyr Cys Lys His Ser Thr111511201125Ile Val Pro Glu Asn Ala Ala His Gln Gly Ala Asn Arg Thr Ser113011351140Ser Leu Glu Asn His Asp Gln Met Ser Val Asn Cys Arg Thr Leu114511501155Leu Ser Glu Ser Pro Gly Lys Leu His Val Glu Val Ser Ala Asp116011651170Leu Thr Ala Ile Asn Gly Leu Ser Tyr Asn Gln Asn Leu Ala Asn117511801185Gly Ser Tyr Asp Leu Ala Asn Arg Asp Phe Cys Gln Gly Asn Gln119011951200Leu Asn Tyr Tyr Lys Gln Glu Ile Pro Val Gln Pro Thr Thr Ser120512101215
Tyr Ser Ile Gln Asn Leu Tyr Ser Tyr Glu Asn Gln Pro Gln Pro122012251230Ser Asp Glu Cys Thr Leu Leu Ser Asn Lys Tyr Leu Asp Gly Asn123512401245Ala Asn Lys Ser Thr Ser Asp Gly Ser Pro Val Met Ala Val Met125012551260Pro Gly Thr Thr Asp Thr Ile Gln Val Leu Lys Gly Arg Met Asp126512701275Ser Glu Gln Ser Pro Ser Ile Gly Tyr Ser Ser Arg Thr Leu Gly128012851290Pro Asn Pro Gly Leu Ile Leu Gln Ala Leu Thr Leu Ser Asn Ala129513001305Ser Asp Gly Phe Asn Leu Glu Arg Leu Glu Met Leu Gly Asp Ser131013151320Phe Leu Lys His Ala Ile Thr Thr Tyr Leu Phe Cys Thr Tyr Pro132513301335Asp Ala His Glu Gly Arg Leu Ser Tyr Met Arg Ser Lys Lys Val134013451350Ser Asn Cys Asn Leu Tyr Arg Leu Gly Lys Lys Lys Gly Leu Pro135513601365Ser Arg Met Val Val Ser Ile Phe Asp Pro Pro Val Asn Trp Leu137013751380
Pro Pro Gly Tyr Val Val Asn Gln Asp Lys Ser Asn Thr Asp Lys138513901395Trp Glu Lys Asp Glu Met Thr Lys Asp Cys Met Leu Ala Asn Gly140014051410Lys Leu Asp Glu Asp Tyr Glu Glu Glu Asp Glu Glu Glu Glu Ser141514201425Leu Met Trp Arg Ala Pro Lys Glu Glu Ala Asp Tyr Glu Asp Asp143014351440Phe Leu Glu Tyr Asp Gln Glu His Ile Arg Phe Ile Asp Asn Met144514501455Leu Met Gly Ser Gly Ala Phe Val Lys Lys Ile Ser Leu Ser Pro146014651470Phe Ser Thr Thr Asp Ser Ala Tyr Glu Trp Lys Met Pro Lys Lys147514801485Ser Ser Leu Gly Ser Met Pro Phe Ser Ser Asp Phe Glu Asp Phe149014951500Asp Tyr Ser Ser Trp Asp Ala Met Cys Tyr Leu Asp Pro Ser Lys150515101515Ala Val Glu Glu Asp Asp Phe Val Val Gly Phe Trp Asn Pro Ser152015251530Glu Glu Asn Cys Gly Val Asp Thr Gly Lys Gln Ser Ile Ser Tyr153515401545
Asp Leu His Thr Glu Gln Cys Ile Ala Asp Lys Ser Ile Ala Asp155015551560Cys Val Glu Ala Leu Leu Gly Cys Tyr Leu Thr Ser Cys Gly Glu156515701575Arg Ala Ala Gln Leu Phe Leu Cys Ser Leu Gly Leu Lys Val Leu158015851590Pro Val Ile Lys Arg Thr Asp Arg Glu Lys Ala Leu Cys Pro Thr159516001605Arg Glu Asn Phe Asn Ser Gln Gln Lys Asn Leu Ser Val Ser Cys161016151620Ala Ala Ala Ser Val Ala Ser Ser Arg Ser Ser Val Leu Lys Asp162516301635Ser Glu Tyr Gly Cys Leu Lys Ile Pro Pro Arg Cys Met Phe Asp164016451650His Pro Asp Ala Asp Lys Thr Leu Asn His Leu Ile Ser Gly Phe165516601665Glu Asn Phe Glu Lys Lys Ile Asn Tyr Arg Phe Lys Asn Lys Ala167016751680Tyr Leu Leu Gln Ala Phe Thr His Ala Ser Tyr His Tyr Asn Thr168516901695Ile Thr Asp Cys Tyr Gln Arg Leu Glu Phe Leu Gly Asp Ala Ile170017051710
Leu Asp Tyr Leu Ile Thr Lys His Leu Tyr Glu Asp Pro Arg Gln171517201725His Ser Pro Gly Val Leu Thr Asp Leu Arg Ser Ala Leu Val Asn173017351740Asn Thr Ile Phe Ala Ser Leu Ala Val Lys Tyr Asp Tyr His Lys174517501755Tyr Phe Lys Ala Val Ser Pro Glu Leu Phe His Val Ile Asp Asp176017651770Phe Val Gln Phe Gln Leu Glu Lys Asn Glu Met Gln Gly Met Asp177517801785Ser Glu Leu Arg Arg Ser Glu Glu Asp Glu Glu Lys Glu Glu Asp179017951800Ile Glu Val Pro Lys Ala Met Gly Asp Ile Phe Glu Ser Leu Ala180518101815Gly Ala Ile Tyr Met Asp Ser Gly Met Ser Leu Glu Thr Val Trp182018251830Gln Val Tyr Tyr Pro Met Met Arg Pro Leu Ile Glu Lys Phe Ser183518401845Ala Asn Val Pro Arg Ser Pro Val Arg Glu Leu Leu Glu Met Glu185018551860Pro Glu Thr Ala Lys Phe Ser Pro Ala Glu Arg Thr Tyr Asp Gly186518701875
Lys Val Arg Val Thr Val Glu Val Val Gly Lys Gly Lys Phe Lys188018851890Gly Val Gly Arg Ser Tyr Arg Ile Ala Lys Ser Ala Ala Ala Arg189519001905Arg Ala Leu Arg Ser Leu Lys Ala Asn Gln Pro Gln Val Pro Asn191019151920Ser<210>4<211>36<212>DNA<213>人工序列<220>
<223>扩增编码人dicer突变体的基因的合成的引物5<400>4tcgagctcgg tacccgcctc cattgttggt ccacca36<210>5<211>36<212>DNA<213>人工序列<220>
<223>扩增编码人dicer突变体的基因的合成的引物6<400>5tatctagaaa gcttttagct attgggaacc tgaggt 36<210>6<211>3741
<212>DNA<213>人工序列<220>
<223>编码人dicer突变体的基因<400>6gcctccattg ttggtccacc aatgagctgt gtacgattgg ctgaaagagt tgtcgctctc60atttgctgtg agaaactgca caaaattggc gaactggatg accatttgat gccagttggg120aaagagactg ttaaatatga agaggagctt gatttgcatg atgaagaaga gaccagtgtt180ccaggaagac caggttccac gaaacgaagg cagtgctacc caaaagcaat tccagagtgt240ttgagggata gttatcccag acctgatcag ccctgttacc tgtatgtgat aggaatggtt300ttaactacac ctttacctga tgaactcaac tttagaaggc ggaagctcta tcctcctgaa360gataccacaa gatgctttgg aatactgacg gccaaaccca tacctcagat tccacacttt420cctgtgtaca cacgctctgg agaggttacc atatccattg agttgaagaa gtctggtttc480atgttgtctc tacaaatgct tgagttgatt acaagacttc accagtatat attctcacat540attcttcggc ttgaaaaacc tgcactagaa tttaaaccta cagacgctga ttcagcatac600tgtgttctac ctcttaatgt tgttaatgac tccagcactt tggatattga ctttaaattc660atggaagata ttgagaagtc tgaagctcgc ataggcattc ccagtacaaa gtatacaaaa720gaaacaccct ttgtttttaa attagaagat taccaagatg ccgttatcat tccaagatat780cgcaattttg atcagcctca tcgattttat gtagctgatg tgtacactga tcttacccca840ctcagtaaat ttccttcccc tgagtatgaa acttttgcag aatattataa aacaaagtac900aaccttgacc taaccaatct caaccagcca ctgctggatg tggaccacac atcttcaaga960cttaatcttt tgacacctcg acatttgaat cagaagggga aagcgcttcc tttaagcagt1020gctgagaaga ggaaagccaa atgggaaagt ctgcagaata aacagatact ggttccagaa1080ctctgtgcta tacatccaat tccagcatca ctgtggagaa aagctgtttg tctccccagc1140
atactttatc gccttcactg ccttttgact gcagaggagc taagagccca gactgccagc1200gatgctggcg tgggagtcag atcacttcct gcggatttta gataccctaa cttagacttc1260gggtggaaaa aatctattga cagcaaatct ttcatctcaa tttctaactc ctcttcagct1320gaaaatgata attactgtaa gcacagcaca attgtccctg aaaatgctgc acatcaaggt1380gctaatagaa cctcctctct agaaaatcat gaccaaatgt ctgtgaactg cagaacgttg1440ctcagcgagt cccctggtaa gctccacgtt gaagtttcag cagatcttac agcaattaat1500ggtctttctt acaatcaaaa tctcgccaat ggcagttatg atttagctaa cagagacttt1560tgccaaggaa atcagctaaa ttactacaag caggaaatac ccgtgcaacc aactacctca1620tattccattc agaatttata cagttacgag aaccagcccc agcccagcga tgaatgtact1680ctcctgagta ataaatacct tgatggaaat gctaacaaat ctacctcaga tggaagtcct1740gtgatggccg taatgcctgg tacgacagac actattcaag tgctcaaggg caggatggat1800tctgagcaga gcccttctat tgggtactcc tcaaggactc ttggccccaa tcctggactt1860attcttcagg ctttgactct gtcaaacgct agtgatggat ttaacctgga gcggcttgaa1920atgcttggcg actccttttt aaagcatgcc atcaccacat atctattttg cacttaccct1980gatgcgcatg agggccgcct ttcatatatg agaagcaaaa aggtcagcaa ctgtaatctg2040tatcgccttg gaaaaaagaa gggactaccc agccgcatgg tggtgtcaat atttgatccc2100cctgtgaatt ggcttcctcc tggttatgta gtaaatcaag acaaaagcaa cacagataaa2160tgggaaaaag atgaaatgac aaaagactgc atgctggcga atggcaaact ggatgaggat2220tacgaggagg aggatgagga ggaggagagc ctgatgtgga gggctccgaa ggaagaggct2280gactatgaag atgatttcct ggagtatgat caggaacata tcagatttat agataatatg2340ttaatggggt caggagcttt tgtaaagaaa atctctcttt ctcctttttc aaccactgat2400tctgcatatg aatggaaaat gcccaaaaaa tcctccttag gtagtatgcc attttcatca2460
gattttgagg attttgacta cagctcttgg gatgcaatgt gctatctgga tcctagcaaa2520gctgttgaag aagatgactt tgtggtgggg ttctggaatc catcagaaga aaactgtggt2580gttgacacgg gaaagcagtc catttcttac gacttgcaca ctgagcagtg tattgctgac2640aaaagcatag cggactgtgt ggaagccctg ctgggctgct atttaaccag ctgtggggag2700agggctgctc agcttttcct ctgttcactg gggctgaagg tgctcccggt aattaaaagg2760actgatcggg aaaaggccct gtgccctact cgggagaatt tcaacagcca acaaaagaac2820ctttcagtga gctgtgctgc tgcttctgtg gccagttcac gctcttctgt attgaaagac2880tcggaatatg gttgtttgaa gattccacca agatgtatgt ttgatcatcc agatgcagat2940aaaacactga atcaccttat atcggggttt gaaaattttg aaaagaaaat caactacaga3000ttcaagaata aggcttacct tctccaggct tttacacatg cctcctacca ctacaatact3060atcactgatt gttaccagcg cttagaattc ctgggagatg cgattttgga ctacctcata3120accaagcacc tttatgaaga cccgcggcag cactccccgg gggtcctgac agacctgcgg3180tctgccctgg tcaacaacac catctttgca tcgctggctg taaagtacga ctaccacaag3240tacttcaaag ctgtctctcc tgagctcttc catgtcattg atgactttgt gcagtttcag3300cttgagaaga atgaaatgca aggaatggat tctgagctta ggagatctga ggaggatgaa3360gagaaagaag aggatattga agttccaaag gccatggggg atatttttga gtcgcttgct3420ggtgccattt acatggatag tgggatgtca ctggagacag tctggcaggt gtactatccc3480atgatgcggc cactaataga aaagttttct gcaaatgtac cccgttcccc tgtgcgagaa3540ttgcttgaaa tggaaccaga aactgccaaa tttagcccgg ctgagagaac ttacgacggg3600aaggtcagag tcactgtgga agtagtagga aaggggaaat ttaaaggtgt tggtcgaagt3660tacaggattg ccaaatctgc agcagcaaga agagccctcc gaagcctcaa agctaatcaa3720cctcaggttc ccaatagcta a 3741
<210>7<211>1246<212>PRT<213>人工序列<220>
<223>人dicer突变体的氨基酸序列<400>7Ala Ser Ile Val Gly Pro Pro Met Ser Cys Val Arg Leu Ala Glu Arg1 5 10 15Val Val Ala Leu Ile Cys Cys Glu Lys Leu His Lys Ile Gly Glu Leu20 25 30Asp Asp His Leu Met Pro Val Gly Lys Glu Thr Val Lys Tyr Glu Glu35 40 45Glu Leu Asp Leu His Asp Glu Glu Glu Thr Ser Val Pro Gly Arg Pro50 55 60Gly Ser Thr Lys Arg Arg Gln Cys Tyr Pro Lys Ala Ile Pro Glu Cys65 70 75 80Leu Arg Asp Ser Tyr Pro Arg Pro Asp Gln Pro Cys Tyr Leu Tyr Val85 90 95Ile Gly Met Val Leu Thr Thr Pro Leu Pro Asp Glu Leu Asn Phe Arg100 105 110Arg Arg Lys Leu Tyr Pro Pro Glu Asp Thr Thr Arg Cys Phe Gly Ile115 120 125
Leu Thr Ala Lys Pro Ile Pro Gln Ile Pro His The Pro Val Tyr Thr130 135 140Arg Ser Gly Glu Val Thr Ile Ser Ile Glu Leu Lys Lys Ser Gly Phe145 150 155 160Met Leu Ser Leu Gln Met Leu Glu Leu Ile Thr Arg Leu His Gln Tyr165 170 175Ile Phe Ser His Ile Leu Arg Leu Glu Lys Pro Ala Leu Glu Phe Lys180 185 190Pro Thr Asp Ala Asp Ser Ala Tyr Cys Val Leu Pro Leu Asn Val Val195 200 205Asn Asp Ser Ser Thr Leu Asp Ile Asp Phe Lys Phe Met Glu Asp Ile210 215 220Glu Lys Ser Glu Ala Arg Ile Gly Ile Pro Ser Thr Lys Tyr Thr Lys225 230 235 240Glu Thr Pro Phe Val Phe Lys Leu Glu Asp Tyr Gln Asp Ala Val Ile245 250 255Ile Pro Arg Tyr Arg Asn Phe Asp Gln Pro His Arg Phe Tyr Val Ala260 265 270Asp Val Tyr Thr Asp Leu Thr Pro Leu Ser Lys Phe Pro Ser Pro Glu275 280 285Tyr Glu Thr Phe Ala Glu Tyr Tyr Lys Thr Lys Tyr Asn Leu Asp Leu290 295 300
Thr Asn Leu Asn Gln Pro Leu Leu Asp Val Asp His Thr Ser Ser Arg305 310 315 320Leu Asn Leu Leu Thr Pro Arg His Leu Asn Gln Lys Gly Lys Ala Leu325 330 335Pro Leu Ser Ser Ala Glu Lys Arg Lys Ala Lys Trp Glu Ser Leu Gln340 345 350Asn Lys Gln Ile Leu Val Pro Glu Leu Cys Ala Ile His Pro Ile Pro355 360 365Ala Ser Leu Trp Arg Lys Ala Val Cys Leu Pro Ser Ile Leu Tyr Arg370 375 380Leu His Cys Leu Leu Thr Ala Glu Glu Leu Arg Ala Gln Thr Ala Ser385 390 395 400Asp Ala Gly Val Gly Val Arg Ser Leu Pro Ala Asp Phe Arg Tyr Pro405 410 415Asn Leu Asp Phe Gly Trp Lys Lys Ser Ile Asp Ser Lys Ser Phe Ile420 425 430Ser Ile Ser Asn Ser Ser Ser Ala Glu Asn Asp Asn Tyr Cys Lys His435 440 445Ser Thr Ile Val Pro Glu Asn Ala Ala His Gln Gly Ala Asn Arg Thr450 455 460Ser Ser Leu Glu Asn His Asp Gln Met Ser Val Asn Cys Arg Thr Leu465 470 475 480
Leu Ser Glu Ser Pro Gly Lys Leu His Val Glu Val Ser Ala Asp Leu485 490 495Thr Ala Ile Asn Gly Leu Ser Tyr Asn Gln Asn Leu Ala Asn Gly Ser500 505 510Tyr Asp Leu Ala Asn Arg Asp Phe Cys Gln Gly Asn Gln Leu Asn Tyr515 520 525Tyr Lys Gln Glu Ile Pro Val Gln Pro Thr Thr Ser Tyr Ser Ile Gln530 535 540Asn Leu Tyr Ser Tyr Glu Asn Gln Pro Gln Pro Ser Asp Glu Cys Thr545 550 555 560Leu Leu Ser Asn Lys Tyr Leu Asp Gly Asn Ala Asn Lys Ser Thr Ser565 570 575Asp Gly Ser Pro Val Met Ala Val Met Pro Gly Thr Thr Asp Thr Ile580 585 590Gln Val Leu Lys Gly Arg Met Asp Ser Glu Gln Ser Pro Ser Ile Gly595 600 605Tyr Ser Ser Arg Thr Leu Gly Pro Asn Pro Gly Leu Ile Leu Gln Ala610 615 620Leu Thr Leu Ser Asn Ala Ser Asp Gly Phe Asn Leu Glu Arg Leu Glu625 630 635 640Met Leu Gly Asp Ser Phe Leu Lys His Ala Ile Thr Thr Tyr Leu Phe645 650 655
Cys Thr Tyr Pro Asp Ala His Glu Gly Arg Leu Ser Tyr Met Arg Ser660 665 670Lys Lys Val Ser Asn Cys Asn Leu Tyr Arg Leu Gly Lys Lys Lys Gly675 680 685Leu Pro Ser Arg Met Val Val Ser Ile Phe Asp Pro Pro Val Asn Trp690 695 700Leu Pro Pro Gly Tyr Val Val Asn Gln Asp Lys Ser Asn Thr Asp Lys705 710 715 720Trp Glu Lys Asp Glu Met Thr Lys Asp Cys Met Leu Ala Asn Gly Lys725 730 735Leu Asp Glu Asp Tyr Glu Glu Glu Asp Glu Glu Glu Glu Ser Leu Met740 745 750Trp Arg Ala Pro Lys Glu Glu Ala Asp Tyr Glu Asp Asp Phe Leu Glu755 760 765Tyr Asp Gln Glu His Ile Arg Phe Ile Asp Asn Met Leu Met Gly Ser770 775 780Gly Ala Phe Val Lys Lys Ile Ser Leu Ser Pro Phe Ser Thr Thr Asp785 790 795 800Ser Ala Tyr Glu Trp Lys Met Pro Lys Lys Ser Ser Leu Gly Ser Met805 810 815Pro Phe Ser Ser Asp Phe Glu Asp Phe Asp Tyr Ser Ser Trp Asp Ala820 825 830
Met Cys Tyr Leu Asp Pro Ser Lys Ala Val Glu Glu Asp Asp Phe Val835 840 845Val Gly Phe Trp Asn Pro Ser Glu Glu Asn Cys Gly Val Asp Thr Gly850 855 860Lys Gln Ser Ile Ser Tyr Asp Leu His Thr Glu Gln Cys Ile Ala Asp865 870 875 880Lys Ser Ile Ala Asp Cys Val Glu Ala Leu Leu Gly Cys Tyr Leu Thr885 890 895Ser Cys Gly Glu Arg Ala Ala Gln Leu Phe Leu Cys Ser Leu Gly Leu900 905 910Lys Val Leu Pro Val Ile Lys Arg Thr Asp Arg Glu Lys Ala Leu Cys915 920 925Pro Thr Arg Glu Asn Phe Asn Ser Gln Gln Lys Asn Leu Ser Val Ser930 935 940Cys Ala Ala Ala Ser Val Ala Ser Ser Arg Ser Ser Val Leu Lys Asp945 950 955 960Ser Glu Tyr Gly Cys Leu Lys Ile Pro Pro Arg Cys Met Phe Asp His965 970 975Pro Asp Ala Asp Lys Thr Leu Asn His Leu Ile Ser Gly Phe Glu Asn980 985 990Phe Glu Lys Lys Ile Asn Tyr Arg Phe Lys Asn Lys Ala Tyr Leu Leu995 10001005
Gln Ala Phe Thr His Ala Ser Tyr His Tyr Asn Thr Ile Thr Asp101010151020Cys Tyr Gln Arg Leu Glu Phe Leu Gly Asp Ala Ile Leu Asp Tyr102510301035Leu Ile Thr Lys His Leu Tyr Glu Asp Pro Arg Gln His Ser Pro104010451050Gly Val Leu Thr Asp Leu Arg Ser Ala Leu Val Asn Asn Thr Ile105510601065Phe Ala Ser Leu Ala Val Lys Tyr Asp Tyr His Lys Tyr Phe Lys107010751080Ala Val Ser Pro Glu Leu Phe His Val Ile Asp Asp Phe Val Gln108510901095Phe Gln Leu Glu Lys Asn Glu Met Gln Gly Met Asp Ser Glu Leu110011051110Arg Arg Ser Glu Glu Asp Glu Glu Lys Glu Glu Asp Ile Glu Val111511201125Pro Lys Ala Met Gly Asp Ile Phe Glu Ser Leu Ala Gly Ala Ile113011351140Tyr Met Asp Ser Gly Met Ser Leu Glu Thr Val Trp Gln Val Tyr114511501155Tyr Pro Met Met Arg Pro Leu Ile Glu Lys Phe Ser Ala Asn Val116011651170
Pro Arg Ser Pro Val Arg Glu Leu Leu Glu Met Glu Pro Glu Thr117511801185Ala Lys Phe Ser Pro Ala Glu Arg Thr Tyr Asp Gly Lys Val Arg119011951200Val Thr Val Glu Val Val Gly Lys Gly Lys Phe Lys Gly Val Gly120512101215Arg Ser Tyr Arg Ile Ala Lys Ser Ala Ala Ala Arg Arg Ala Leu122012251230Arg Ser Leu Lys Ala Asn Gln Pro Gln Val Pro Asn Ser123512401245<210>8<211>1267<212>PRT<213>人工序列<220>
<223>人dicer突变体的氨基酸序列<400>8Met Asn His Lys Val His His His His His His Ile Glu Gly Arg Asn1 5 10 15Ser Ser Ser Val Pro Ala Ser Ile Val Gly Pro Pro Met Ser Cys Val20 25 30Arg Leu Ala Glu Arg Val Val Ala Leu Ile Cys Cys Glu Lys Leu His35 40 45Lys Ile Gly Glu Leu Asp Asp His Leu Met Pro Val Gly Lys Glu Thr50 55 60
Val Lys Tyr Glu Glu Glu Leu Asp Leu His Asp Glu Glu Glu Thr Ser65 70 75 80Val Pro Gly Arg Pro Gly Ser Thr Lys Arg Arg Gln Cys Tyr Pro Lys85 90 95Ala Ile Pro Glu Cys Leu Arg Asp Ser Tyr Pro Arg Pro Asp Gln Pro100 105 110Cys Tyr Leu Tyr Val Ile Gly Met Val Leu Thr Thr Pro Leu Pro Asp115 120 125Glu Leu Asn Phe Arg Arg Arg Lys Leu Tyr Pro Pro Glu Asp Thr Thr130 135 140Arg Cys Phe Gly Ile Leu Thr Ala Lys Pro Ile Pro Gln Ile Pro His145 150 155 160Phe Pro Val Tyr Thr Arg Ser Gly Glu Val Thr Ile Ser Ile Glu Leu165 170 175Lys Lys Ser Gly Phe Met Leu Ser Leu Gln Met Leu Glu Leu Ile Thr180 185 190Arg Leu His Gln Tyr Ile Phe Ser His Ile Leu Arg Leu Glu Lys Pro195 200 205Ala Leu Glu Phe Lys Pro Thr Asp Ala Asp Ser Ala Tyr Cys Val Leu210 215 220Pro Leu Asn Val Val Asn Asp Ser Ser Thr Leu Asp Ile Asp Phe Lys225 230 235 240
Phe Met Glu Asp Ile Glu Lys Ser Glu Ala Arg Ile Gly Ile Pro Ser245 250 255Thr Lys Tyr Thr Lys Glu Thr Pro Phe Val Phe Lys Leu Glu Asp Tyr260 265 270Gln Asp Ala Val Ile Ile Pro Arg Tyr Arg Asn Phe Asp Gln Pro His275 280 285Arg Phe Tyr Val Ala Asp Val Tyr Thr Asp Leu Thr Pro Leu Ser Lys290 295 300Phe Pro Ser Pro Glu Tyr Glu Thr Phe Ala Glu Tyr Tyr Lys Thr Lys305 310 315 320Tyr Asn Leu Asp Leu Thr Asn Leu Asn Gln Pro Leu Leu Asp Val Asp325 330 335His Thr Ser Ser Arg Leu Asn Leu Leu Thr Pro Arg His Leu Asn Gln340 345 350Lys Gly Lys Ala Leu Pro Leu Ser Ser Ala Glu Lys Arg Lys Ala Lys355 360 365Trp Glu Ser Leu Gln Asn Lys Gln Ile Leu Val Pro Glu Leu Cys Ala370 375 380Ile His Pro Ile Pro Ala Ser Leu Trp Arg Lys Ala Val Cys Leu Pro385 390 395 400Ser Ile Leu Tyr Arg Leu His Cys Leu Leu Thr Ala Glu Glu Leu Arg405 410 415
Ala Gln Thr Ala Ser Asp Ala Gly Val Gly Val Arg Ser Leu Pro Ala420 425 430Asp Phe Arg Tyr Pro Asn Leu Asp Phe Gly Trp Lys Lys Ser Ile Asp435 440 445Ser Lys Ser Phe Ile Ser Ile Ser Asn Ser Ser Ser Ala Glu Asn Asp450 455 460Asn Tyr Cys Lys His Ser Thr Ile Val Pro Glu Asn Ala Ala His Gln465 470 475 480Gly Ala Asn Arg Thr Ser Ser Leu Glu Asn His Asp Gln Met Ser Val485 490 495Asn Cys Arg Thr Leu Leu Ser Glu Ser Pro Gly Lys Leu His Val Glu500 505 510Val Ser Ala Asp Leu Thr Ala Ile Asn Gly Leu Ser Tyr Asn Gln Asn515 520 525Leu Ala Asn Gly Ser Tyr Asp Leu Ala Asn Arg Asp Phe Cys Gln Gly530 535 540Asn Gln Leu Asn Tyr Tyr Lys Gln Glu Ile Pro Val Gln Pro Thr Thr545 550 555 560Ser Tyr Ser Ile Gln Asn Leu Tyr Ser Tyr Glu Asn Gln Pro Gln Pro565 570 575Ser Asp Glu Cys Thr Leu Leu Ser Asn Lys Tyr Leu Asp Gly Asn Ala580 585 590
Asn Lys Ser Thr Ser Asp Gly Ser Pro Val Met Ala Val Met Pro Gly595 600 605Thr Thr Asp Thr Ile Gln Val Leu Lys Gly Arg Met Asp Ser Glu Gln610 615 620Ser Pro Ser Ile Gly Tyr Ser Ser Arg Thr Leu Gly Pro Asn Pro Gly625 630 635 640Leu Ile Leu Gln Ala Leu Thr Leu Ser Asn Ala Ser Asp Gly Phe Asn645 650 655Leu Glu Arg Leu Glu Met Leu Gly Asp Ser Phe Leu Lys His Ala Ile660 665 670Thr Thr Tyr Leu Phe Cys Thr Tyr Pro Asp Ala His Glu Gly Arg Leu675 680 685Ser Tyr Met Arg Ser Lys Lys Val Ser Asn Cys Asn Leu Tyr Arg Leu690 695 700Gly Lys Lys Lys Gly Leu Pro Ser Arg Met Val Val Ser Ile Phe Asp705 710 715 720Pro Pro Val Asn Trp Leu Pro Pro Gly Tyr Val Val Asn Gln Asp Lys725 730 735Ser Asn Thr Asp Lys Trp Glu Lys Asp Glu Met Thr Lys Asp Cys Met740 745 750Leu Ala Asn Gly Lys Leu Asp Glu Asp Tyr Glu Glu Glu Asp Glu Glu755 760 765
Glu Glu Ser Leu Met Trp Arg Ala Pro Lys Glu Glu Ala Asp Tyr Glu770 775 780Asp Asp Phe Leu Glu Tyr Asp Gln Glu His Ile Arg Phe Ile Asp Asn785 790 795 800Met Leu Met Gly Ser Gly Ala Phe Val Lys Lys Ile Ser Leu Ser Pro805 810 815Phe Ser Thr Thr Asp Ser Ala Tyr Glu Trp Lys Met Pro Lys Lys Ser820 825 830Ser Leu Gly Ser Met Pro Phe Ser Ser Asp Phe Glu Asp Phe Asp Tyr835 840 845Ser Ser Trp Asp Ala Met Cys Tyr Leu Asp Pro Ser Lys Ala Val Glu850 855 860Glu Asp Asp Phe Val Val Gly Phe Trp Asn Pro Ser Glu Glu Asn Cys865 870 875 880Gly Val Asp Thr Gly Lys Gln Ser Ile Ser Tyr Asp Leu His Thr Glu885 890 895Gln Cys Ile Ala Asp Lys Ser Ile Ala Asp Cys Val Glu Ala Leu Leu900 905 910Gly Cys Tyr Leu Thr Ser Cys Gly Glu Arg Ala Ala Gln Leu Phe Leu915 920 925Cys Ser Leu Gly Leu Lys Val Leu Pro Val Ile Lys Arg Thr Asp Arg930 935 940
Glu Lys Ala Leu Cys Pro Thr Arg Glu Asn Phe Asn Ser Gln Gln Lys945 950 955 960Asn Leu Ser Val Ser Cys Ala Ala Ala Ser Val Ala Ser Ser Arg Ser965 970 975Ser Val Leu Lys Asp Ser Glu Tyr Gly Cys Leu Lys Ile Pro Pro Arg980 985 990Cys Met Phe Asp His Pro Asp Ala Asp Lys Thr Leu Asn His Leu Ile995 10001005Ser Gly Phe Glu Asn Phe Glu Lys Lys Ile Asn Tyr Arg Phe Lys101010151020Asn Lys Ala Tyr Leu Leu Gln Ala Phe Thr His Ala Ser Tyr His102510301035Tyr Asn Thr Ile Thr Asp Cys Tyr Gln Arg Leu Glu Phe Leu Gly104010451050Asp Ala Ile Leu Asp Tyr Leu Ile Thr Lys His Leu Tyr Glu Asp105510601065Pro Arg Gln His Ser Pro Gly Val Leu Thr Asp Leu Arg Ser Ala107010751080Leu Val Asn Asn Thr Ile Phe Ala Ser Leu Ala Val Lys Tyr Asp108510901095Tyr His Lys Tyr Phe Lys Ala Val Ser Pro Glu Leu Phe His Val110011051110
Ile Asp Asp Phe Val Gln Phe Gln Leu Glu Lys Asn Glu Met Gln111511201125Gly Met Asp Ser Glu Leu Arg Arg Ser Glu Glu Asp Glu Glu Lys113011351140Glu Glu Asp Ile Glu Val Pro Lys Ala Met Gly Asp Ile Phe Glu114511501155Ser Leu Ala Gly Ala Ile Tyr Met Asp Ser Gly Met Ser Leu Glu116011651170Thr Val Trp Gln Val Tyr Tyr Pro Met Met Arg Pro Leu Ile Glu117511801185Lys Phe Ser Ala Asn Val Pro Arg Ser Pro Val Arg Glu Leu Leu119011951200Glu Met Glu Pro Glu Thr Ala Lys Phe Ser Pro Ala Glu Arg Thr120512101215Tyr Asp Gly Lys Val Arg Val Thr Val Glu Val Val Gly Lys Gly122012251230Lys Phe Lys Gly Val Gly Arg Ser Tyr Arg Ile Ala Lys Ser Ala123512401245Ala Ala Arg Arg Ala Leu Arg Ser Leu Lys Ala Asn Gln Pro Gln125012551260Val Pro Asn Ser1265
<210>9<211>3804<212>DNA<213>人工序列<220>
<223>编码人dicer突变体的基因<400>9atgaatcaca aagtgcatca tcatcatcat catatcgaag gtaggaattc gagctcggta60cccgcctcca ttgttggtcc accaatgagc tgtgtacgat tggctgaaag agttgtcgct120ctcatttgct gtgagaaact gcacaaaatt ggcgaactgg atgaccattt gatgccagtt180gggaaagaga ctgttaaata tgaagaggag cttgatttgc atgatgaaga agagaccagt240gttccaggaa gaccaggttc cacgaaacga aggcagtgct acccaaaagc aattccagag300tgtttgaggg atagttatcc cagacctgat cagccctgtt acctgtatgt gataggaatg360gttttaacta cacctttacc tgatgaactc aactttagaa ggcggaagct ctatcctcct420gaagatacca caagatgctt tggaatactg acggccaaac ccatacctca gattccacac480tttcctgtgt acacacgctc tggagaggtt accatatcca ttgagttgaa gaagtctggt540ttcatgttgt ctctacaaat gcttgagttg attacaagac ttcaccagta tatattctca600catattcttc ggcttgaaaa acctgcacta gaatttaaac ctacagacgc tgattcagca660tactgtgttc tacctcttaa tgttgttaat gactccagca ctttggatat tgactttaaa720ttcatggaag atattgagaa gtctgaagct cgcataggca ttcccagtac aaagtataca780aaagaaacac cctttgtttt taaattagaa gattaccaag atgccgttat cattccaaga840tatcgcaatt ttgatcagcc tcatcgattt tatgtagctg atgtgtacac tgatcttacc900ccactcagta aatttccttc ccctgagtat gaaacttttg cagaatatta taaaacaaag960tacaaccttg acctaaccaa tctcaaccag ccactgctgg atgtggacca cacatcttca1020
agacttaatc ttttgacacc tcgacatttg aatcagaagg ggaaagcgct tcctttaagc1080agtgctgaga agaggaaagc caaatgggaa agtctgcaga ataaacagat actggttcca1140gaactctgtg ctatacatcc aattccagca tcactgtgga gaaaagctgt ttgtctcccc1200agcatacttt atcgccttca ctgccttttg actgcagagg agctaagagc ccagactgcc1260agcgatgctg gcgtgggagt cagatcactt cctgcggatt ttagataccc taacttagac1320ttcgggtgga aaaaatctat tgacagcaaa tctttcatct caatttctaa ctcctcttca1380gctgaaaatg ataattactg taagcacagc acaattgtcc ctgaaaatgc tgcacatcaa1440ggtgctaata gaacctcctc tctagaaaat catgaccaaa tgtctgtgaa ctgcagaacg1500ttgctcagcg agtcccctgg taagctccac gttgaagttt cagcagatct tacagcaatt1560aatggtcttt cttacaatca aaatctcgcc aatggcagtt atgatttagc taacagagac1620ttttgccaag gaaatcagct aaattactac aagcaggaaa tacccgtgca accaactacc1680tcatattcca ttcagaattt atacagttac gagaaccagc cccagcccag cgatgaatgt1740actctcctga gtaataaata ccttgatgga aatgctaaca aatctacctc agatggaagt1800cctgtgatgg ccgtaatgcc tggtacgaca gacactattc aagtgctcaa gggcaggatg1860gattctgagc agagcccttc tattgggtac tcctcaagga ctcttggccc caatcctgga1920cttattcttc aggctttgac tctgtcaaac gctagtgatg gatttaacct ggagcggctt1980gaaatgcttg gcgactcctt tttaaagcat gccatcacca catatctatt ttgcacttac2040cctgatgcgc atgagggccg cctttcatat atgagaagca aaaaggtcag caactgtaat2100ctgtatcgcc ttggaaaaaa gaagggacta cccagccgca tggtggtgtc aatatttgat2160ccccctgtga attggcttcc tcctggttat gtagtaaatc aagacaaaag caacacagat2220aaatgggaaa aagatgaaat gacaaaagac tgcatgctgg cgaatggcaa actggatgag2280gattacgagg aggaggatga ggaggaggag agcctgatgt ggagggctcc gaaggaagag2340
gctgactatg aagatgattt cctggagtat gatcaggaac atatcagatt tatagataat2400atgttaatgg ggtcaggagc ttttgtaaag aaaatctctc tttctccttt ttcaaccact2460gattctgcat atgaatggaa aatgcccaaa aaatcctcct taggtagtat gccattttca2520tcagattttg aggattttga ctacagctct tgggatgcaa tgtgctatct ggatcctagc2580aaagctgttg aagaagatga ctttgtggtg gggttctgga atccatcaga agaaaactgt2640ggtgttgaca cgggaaagca gtccatttct tacgacttgc acactgagca gtgtattgct2700gacaaaagca tagcggactg tgtggaagcc ctgctgggct gctatttaac cagctgtggg2760gagagggctg ctcagctttt cctctgttca ctggggctga aggtgctccc ggtaattaaa2820aggactgatc gggaaaaggc cctgtgccct actcgggaga atttcaacag ccaacaaaag2880aacctttcag tgagctgtgc tgctgcttct gtggccagtt cacgctcttc tgtattgaaa2940gactcggaat atggttgttt gaagattcca ccaagatgta tgtttgatca tccagatgca3000gataaaacac tgaatcacct tatatcgggg tttgaaaatt ttgaaaagaa aatcaactac3060agattcaaga ataaggctta ccttctccag gcttttacac atgcctccta ccactacaat3120actatcactg attgttacca gcgcttagaa ttcctgggag atgcgatttt ggactacctc3180ataaccaagc acctttatga agacccgcgg cagcactccc cgggggtcct gacagacctg3240cggtctgccc tggtcaacaa caccatcttt gcatcgctgg ctgtaaagta cgactaccac3300aagtacttca aagctgtctc tcctgagctc ttccatgtca ttgatgactt tgtgcagttt3360cagcttgaga agaatgaaat gcaaggaatg gattctgagc ttaggagatc tgaggaggat3420gaagagaaag aagaggatat tgaagttcca aaggccatgg gggatatttt tgagtcgctt3480gctggtgcca tttacatgga tagtgggatg tcactggaga cagtctggca ggtgtactat3540cccatgatgc ggccactaat agaaaagttt tctgcaaatg taccccgttc ccctgtgcga3600gaattgcttg aaatggaacc agaaactgcc aaatttagcc cggctgagag aacttacgac3660
gggaaggtca gagtcactgt ggaagtagta ggaaagggga aatttaaagg tgttggtcga3720agttacagga ttgccaaatc tgcagcagca agaagagccc tccgaagcct caaagctaat3780caacctcagg ttcccaatag ctaa 3804<210>10<211>720<212>DNA<213>人工序列<220>
<223>编码红移绿色荧光蛋白的基因<400>10atggctagca aaggagaaga actcttcact ggagttgtcc caattcttgt tgaattagat60ggtgatgtta acggccacaa gttctctgtc agtggagagg gtgaaggtga tgcaacatac120ggaaaactta ccctgaagtt catctgcact actggcaaac tgcctgttcc atggccaaca180ctagtcacta ctctgtgcta tggtgttcaa tgcttttcaa gatacccgga tcatatgaaa240cggcatgact ttttcaagag tgccatgccc gaaggttatg tacaggaaag gaccatcttc300ttcaaagatg acggcaacta caagacacgt gctgaagtca agtttgaagg tgataccctt360gttaatagaa tcgagttaaa aggtattgac ttcaaggaag atggaaacat tctgggacac420aaattggaat acaactataa ctcacacaat gtatacatca tggcagacaa acaaaagaat480ggaatcaaag tgaacttcaa gacccgccac aacattgaag atggaagcgt tcaactagca540gaccattatc aacaaaatac tccaattggc gatggccctg tccttttacc agacaaccat600tacctgtcca cacaatctgc cctttcgaaa gatcccaacg aaaagagaga ccacatggtc660cttcttgagt ttgtaacagc tgctgggatt acacatggca tggatgaact gtacaactga720<210>11<211>42
<212>DNA<213>人工序列<220>
<223>扩增编码红移绿色荧光蛋白的基因的合成的引物3<400>11gggtaatacg actcactata gggagaatgg ctagcaaagg ag 42<210>12<211>42<212>DNA<213>人工序列<220>
<223>扩增编码红移绿色荧光蛋白的基因的合成的引物4<400>12gggtaatacg actcactata gggagatcag ttgtacagtt ca 42<210>13<211>31<212>DNA<213>人工序列<220>
<223>扩增编码触发因子的基因的合成的引物TFN<400>13ggccatatgc aagtttcagt tgaaaccact c 31<210>14<211>60<212>DNA<213>人工序列<220>
<223>扩增编码触发因子的基因的合成的引物TFCP<400>14gcaagcttgg atccgaattc tccctacctt cgatcgcctg ctggttcatc agctcgttga60
<210>15<211>1732<212>DNA<213>人工序列<220>
<223>编码RAV-2逆转录酶a亚基的基因<400>15gaattcgacc gttgctctgc acctggctat cccgctgaaa tggaaaccgg accacacccc60ggtttggatc gaccagtggc cgctgccgga aggtaaactg gttgctgtta cccagctggt120tgaaaaagaa ctgcagctgg gtcacatcga accgtctctg tcttgctgga acaccccggt180gttcgttatc cgtaaagctt ctggttctta ccgtctgctg cacgacctgc gtgctgttaa240cgctaaactg gttccgttcg gtgctgttca gcagggtgct ccggttctgt ctgctctgcc300gcgtggttgg ccgctgatgg ttctggacct gaaagactgc ttcttctcta tcccgctggc360tgaacaggac cgtgaagctt tcgctttcac cctgccgtct gttaacaacc aggctccggc420tcgtcgtttc cagtggaaag ttctgccgca gggtatgacc tgctctccga ccatctgcca480gctggttgtt ggtcaggttc tggaaccgct gcgtctgaaa cacccggctc tgcgtatgct540gcactacatg gacgacctgc tgctggctgc ttcttctcac gacggtctgg aagctgctgg600taaagaagtt atcggtaccc tggaacgtgc tggtttcacc atctctccgg acaaaatcca660gcgtgaaccg ggtgttcagt acctgggtta caaactgggt tctacctacg ttgctccggt720tggtctggtt gctgaaccgc gtatcgctac cctgtgggac gttcagaaac tggttggttc780tctgcagtgg ctgcgtccgg ctctgggtat cccgccgcgt ctgatgggtc cgttctacga840acagctgcgt ggttctgacc cgaacgaagc tcgtgaatgg aacctggaca tgaaaatggc900ttggcgtgaa atcgttcagc tgtctaccac cgctgctctg gaacgttggg acccggctca960gccgctggaa ggtgctgttg ctcgttgcga acagggtgct atcggtgttc tgggtcaggg1020
tctgtctacc cacccgcgtc cgtgcctgtg gctgttctct acccagccga ccaaggcttt1080caccgcttgg ctggaagttc tgaccctgct gatcaccaaa ctgcgtgctt ctgctgttcg1140taccttcggt aaagaagttg acatcctgct gctgccggct tgcttccgtg aagacctgcc1200gctgccggaa ggtatcctgc tggctctgcg tggtttcgct ggtaaaatcc gttcttctga1260caccccgtct atcttcgaca tcgctcgtcc gctgcacgtt tctctgaaag ttcgtgttac1320cgaccacccg gttccgggtc cgaccgtttt caccgacgct tcttcttcta cccacaaagg1380tgttgttgtt tggcgtgaag gtccgcgttg ggaaatcaaa gaaatcgttg acctgggtgc1440ttctgttcag cagctagaag ctcgtgctgt tgctatggct ctgctgctgt ggccgaccac1500cccgaccaac gttgttaccg actctgcttt cgttgctaaa atgctgctga aaatgggtca1560ggaaggtgtt ccgtctaccg ctgctgcttt catcctggaa gacgctctgt ctcagcgttc1620tgctatggct gctgttctgc acgttcgttc tcactctgaa gttccgggtt tcttcaccga1680aggtaacgac gttgctgact ctcaggctac cttccaggct tactaatcta ga1732<210>16<211>2709<212>DNA<213>人工序列<220>
<223>编码RAV-2逆转录酶β亚基的基因<400>16gaattcgacc gttgctctgc acctggctat cccgctgaaa tggaaaccgg accacacccc60ggtttggatc gaccagtggc cgctgccgga aggtaaactg gttgctgtta cccagctggt120tgaaaaagaa ctgcagctgg gtcacatcga accgtctctg tcttgctgga acaccccggt180gttcgttatc cgtaaagctt ctggttctta ccgtctgctg cacgacctgc gtgctgttaa240cgctaaactg gttccgttcg gtgctgttca gcagggtgct ccggttctgt ctgctctgcc300
gcgtggttgg ccgctgatgg ttctggacct gaaagactgc ttcttctcta tcccgctggc360tgaacaggac cgtgaagctt tcgctttcac cctgccgtct gttaacaacc aggctccggc420tcgtcgtttc cagtggaaag ttctgccgca gggtatgacc tgctctccga ccatctgcca480gctggttgtt ggtcaggttc tggaaccgct gcgtctgaaa cacccggctc tgcgtatgct540gcactacatg gacgacctgc tgctggctgc ttcttctcac gacggtctgg aagctgctgg600taaagaagtt atcggtaccc tggaacgtgc tggtttcacc atctctccgg acaaaatcca660gcgtgaaccg ggtgttcagt acctgggtta caaactgggt tctacctacg ttgctccggt720tggtctggtt gctgaaccgc gtatcgctac cctgtgggac gttcagaaac tggttggttc780tctgcagtgg ctgcgtccgg ctctgggtat cccgccgcgt ctgatgggtc cgttctacga840acagctgcgt ggttctgacc cgaacgaagc tcgtgaatgg aacctggaca tgaaaatggc900ttggcgtgaa atcgttcagc tgtctaccac cgctgctctg gaacgttggg acccggctca960gccgctggaa ggtgctgttg ctcgttgcga acagggtgct atcggtgttc tgggtcaggg1020tctgtctacc cacccgcgtc cgtgcctgtg gctgttctct acccagccga ccaaggcttt1080caccgcttgg ctggaagttc tgaccctgct gatcaccaaa ctgcgtgctt ctgctgttcg1140taccttcggt aaagaagttg acatcctgct gctgccggct tgcttccgtg aagacctgcc1200gctgccggaa ggtatcctgc tggctctgcg tggtttcgct ggtaaaatcc gttcttctga1260caccccgtct atcttcgaca tcgctcgtcc gctgcacgtt tctctgaaag ttcgtgttac1320cgaccacccg gttccgggtc cgaccgtttt caccgacgct tcttcttcta cccacaaagg1380tgttgttgtt tggcgtgaag gtccgcgttg ggaaatcaaa gaaatcgttg acctgggtgc1440ttctgttcag cagctagaag ctcgtgctgt tgctatggct ctgctgctgt ggccgaccac1500cccgaccaac gttgttaccg actctgcttt cgttgctaaa atgctgctga aaatgggtca1560ggaaggtgtt ccgtctaccg ctgctgcttt catcctggaa gacgctctgt ctcagcgttc1620
tgctatggct gctgttctgc acgttcgttc tcactctgaa gttccgggtt tcttcaccga1680aggtaacgac gttgctgact ctcaggctac cttccaggct tacccgctgc gtgaagctaa1740agacctgcac accgctctgc acatcggtcc gcgtgctctg tctaaagctt gcaacatctc1800tatgcagcag gctcgtgaag ttgttcagac ctgcccgcac tgcaactctg ctccggctct1860ggaagctggt gttaacccgc gtggtctggg tccgctgcag atctggcaga ccgacttcac1920cctggaaccg cgtatggctc cgcgttcttg gctggctgtt accgttgaca ccgcttcttc1980tgctatcgtt gttacccagc acggtcgtgt tacctctgtt gctgctcagc accactgggc2040taccgctatc gctgttctgg gtcgtccgaa agctatcaaa accgacaacg gttcttgctt2100cacctctaaa tctacccgtg aatggctggc tcgttggggt atcgctcaca ccaccggtat2160cccgggtaac tctcagggtc aggctatggt tgaacgtgct aaccgtctgc tgaaagacaa2220aatccgtgtt ctggctgaag gtgacggttt catgaaacgt atcccggctt ctaaacaggg2280tgaactgctg gctaaagcta tgtacgctct gaaccacttc gaacgtggtg aaaacaccaa2340aaccccggtt cagaaacact ggcgtccgac cgttctgacc gaaggtccgc cggttaaaat2400ccgtatcgaa accggtgaat gggaaaaagg ttggaacgtt ctggtttggg gtcgtggtta2460cgctgctgtt aaaaaccgtg acaccgacaa agttatctgg gttccgtctc gtaaagttaa2520accggacatc acccagaaag acgaagttac caaaaaagac gaagcttctc cgctgttcgc2580tggttcttct gactggatcc cgtggggtga cgaacaggaa ggtctgcagg aagaagctgc2640ttctaacaaa caggaaggtc cgggtgaaga caccctggct gctaacgaat cttgaattag2700ctttctaga2709<210>17<211>31<212>DNA<213>人工序列
<220>
<223>扩增编码DNA酶的基因的合成的引物NUCN<400>17ggcgaattcg atgtttttgt taattttagg g 31<210>18<211>35<212>DNA<213>人工序列<220>
<223>扩增编码DNA酶的基因的合成的引物NUCC<400>18gcgggatcct taacgaacta agccgttatt ttggc 35<210>19<211>36<212>DNA<213>人工序列<220>
<223>扩增编码人dicer PAZ结构域的基因的合成的引物1<400>19tcgagctcgg tacccattga ctttaaattc atggaa 36<210>20<211>36<212>DNA<213>人工序列<220>
<223>扩增编码人dicer PAZ结构域的基因的合成的引物2<400>20tatctagaaa gcttaaaggc agtgaaggcg ataaag 3权利要求
1.用于生产多肽的方法,该方法包括将这样的宿主暴露于低温条件下以诱导所述多肽的表达,该宿主具有被转入该宿主的编码想要的多肽的基因,其中在该宿主中,编码陪伴分子的基因的表达被增强。
2.权利要求1的方法,其中通过选自这样的方法中的一种方法增强编码陪伴分子的基因的表达,所述方法是诱导宿主中的陪伴分子基因表达;修饰宿主染色体上的陪伴分子基因;将陪伴分子基因转入宿主;和使用这样的宿主,在该宿主中,陪伴分子基因的表达被增强。
3.权利要求1的方法,其中所述陪伴分子选自DnaK、DnaJ、GrpE、GroEL、GroES和触发因子。
4.权利要求1的方法,其中将被转入宿主的编码想要的多肽的基因连接至这样的DNA的下游,该DNA编码来源于冷激蛋白基因的mRNA的5’-非翻译区。
5.权利要求4的方法,其中将被转入宿主的编码想要的多肽的基因连接至这样的DNA的下游,该DNA编码来源于大肠杆菌cspA基因的mRNA的5’-非翻译区。
6.权利要求1的方法,其中使用载体将编码想要的多肽的基因和编码陪伴分子的基因转入宿主。
7.权利要求6的方法,其中将编码想要的多肽的基因和编码陪伴分子的基因相互连接,从而可编码想要的多肽和陪伴分子的融合蛋白。
8.权利要求7的方法,其中所述想要的多肽选自RAV-2逆转录酶α亚基、RAV-2逆转录酶β亚基、DNA酶和Dicer PAZ结构域多肽。
9.权利要求1的方法,其中所述宿主是大肠杆菌。
10.用于产生想要的多肽的一套质粒载体,其包括(1)第一载体,其在启动子的下游具有(a)编码来源于冷激蛋白基因的mRNA的5’-非翻译区的DNA;和(b)可用于插入编码想要的多肽的基因且位于(a)的DNA的下游的限制性内切酶识别序列;和(2)具有编码陪伴分子的基因的第二载体,其中这样选择(1)和(2)的载体的复制起点,从而使得不产生不相容性。
11.权利要求10的一套载体,其中所述第一载体包含这样的DNA,该DNA编码来源于大肠杆菌cspA基因的mRNA的5’-非翻译区。
12.权利要求10的一套载体,其中所述第二载体包含编码选自DnaK、DnaJ、GrpE、GroEL、GroES和触发因子的陪伴分子的基因。
13.权利要求10的一套载体,其由能够在大肠杆菌中复制的质粒组成。
14.一种表达载体,其在起动子的下游具有(a)编码来源于冷激蛋白基因的mRNA的5’-非翻译区的DNA;(b)具有可用于插入编码想要的多肽的基因且位于(a)的DNA的下游的限制性内切酶识别序列的DNA;和(c)编码陪伴分子的基因。
15.权利要求14的表达载体,其包含编码来源于大肠杆菌cspA基因的5’-非翻译区的DNA。
16.权利要求14的表达载体,其是包含编码选自DnaK、DnaJ、GrpE、GroEL、GroES和触发因子的陪伴分子的基因的质粒。
17.权利要求14的表达载体,其中可用于插入编码想要的多肽的基因的限制性内切酶识别序列位于这样的位置,在该位置可插入编码想要的多肽的基因,从而可将想要的多肽作为和陪伴分子的融合蛋白来表达。
18.权利要求14的表达载体,其是能够在大肠杆菌中复制的质粒。
全文摘要
用于在低温下生产靶蛋白的方法,其包括不仅诱导具有被导入其中的编码所述靶蛋白的基因的载体的表达而且诱导具有被导入其中的陪伴分子基因的载体的表达。
文档编号C12P21/02GK1950505SQ200580014919
公开日2007年4月18日 申请日期2005年5月19日 优先权日2004年5月21日
发明者小代俊浩, 小堀博史, 相良武宏, 远藤博, 高藏晃, 友野润, 佐川裕章, 向井博之, 加藤郁之进 申请人:宝生物工程株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1