在毕赤酵母细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法

文档序号:3476625阅读:405来源:国知局
专利名称:在毕赤酵母细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法
技术领域
本发明涉及基因工程和蛋白质分离纯化领域,特别涉及一种在毕赤酵母(Pichia pastoris)细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法。
背景技术
酪氨酸激酶(Tyrosine kinase)是一种能选择性地使不同底物的酪氨酸残基磷酸化的酶,可大致分为受体型酪氨酸激酶和非受体型酪氨酸激酶。受体型酪氨酸激酶代表如表皮生长因子受体(EGFR)、血小板衍生生长因子受体(PDGFR)、成纤维细胞生长因子受体(FGFR)、人激酶插入区受体(Homo sapiens kinase insert domain receptor,简称KDR)等。其中,KDR也称为人血管内皮细胞生长因子受体2(简称vEGFR2),其是一种受体型酪氨酸激酶,它在Genebank蛋白数据库中的登陆号为NP_002244,KDR具有血管内皮细胞生长因子受体活性,在血管发育、血管增生和调节血管渗透性等方面具有重要功能。而非受体型酪氨酸激酶代表如Src、ABL、FAK等。
虽然磷酸化的酪氨酸仅占体内磷酸化氨基酸的0.5%,但是一系列证据表明,酪氨酸磷酸化在许多细胞调节过程中起着重要作用。这些作用体现在T细胞和B细胞的活化、对外来刺激的反应、有丝分裂、细胞分化和形成、血管增生、神经递质的转导、细胞周期的生长控制、转录调节、葡萄糖的摄取、肿瘤的产生以及细胞凋亡等过程。因此,酪氨酸激酶功能的紊乱可以导致许多疾病。正常情况下,细胞的酪氨酸激酶磷酸化作用是由酪氨酸激酶和酪氨酸磷酸酶拮抗调节来维持平衡的。但是,如基因突变、基因融合、自分泌和旁分泌循环等病理机制,会导致酪氨酸激酶的持续活化,从而阻断了其对细胞分化、生长和凋亡等的调节功能,诱发肿瘤。鉴于酪氨酸激酶在肿瘤分子病原学上的重要作用,强效的酪氨酸激酶抑制剂可能在肿瘤的治疗中有着重要意义。近年来,蛋白酪氨酸激酶广泛地被作为抗肿瘤药物筛选的靶标蛋白。
目前酪氨酸激酶的获取方法有限,成本昂贵,一般采用下列方法1)从肿瘤细胞或组织中分离纯化Wolfgang Webe等(The Journal of Biological Chemistry,1984,259(23)14631~14636)用免疫亲和层析的方法,从大量表达EGFR的A431细胞(人阴道上皮癌细胞)中分离纯化得到了内皮细胞生长因子(EGF)受体。但这种方法成本极高、产量少。
2)采用昆虫表达体系进行表达Greenfield等(The EMBO Journal,1988,7(1)139~146)将编码EGFR的cDNA克隆入杆状病毒载体pAc373,转染SF9昆虫细胞,表达出具有活性的EGFR。但是昆虫表达系统表达存在成本高、产量低等缺点。
3)采用原核表达系统进行表达李林等(第二军医大学学报,2004,25(12)1353~1356)将EGFR-RTK的cDNA片段插入pQE30质粒,转染大肠杆菌M15,IPTG诱导表达融合蛋白,表达的包涵体蛋白经复性后亲和层析法纯化,ELISA方法测定蛋白具有生物学活性。虽然此法较传统的昆虫细胞表达系统简便与经济,但是EGFR-RTK在大肠杆菌中绝大多数是以包涵体形式存在,后续的蛋白复性工艺收率较低。

发明内容
本发明最主要的目的在于克服现有技术的缺陷,提供一种低成本、表达量高的重组酪氨酸激酶及其制备方法。
为此,本发明人首先筛选生长繁殖迅速、成本低的表达系统,其中毕赤酵母(Pichia pastoris)是一种优良的表达系统,具有表达量高、稳定性好、分泌量高、能进行多种翻译后加工修饰、遗传背景清楚、生长繁殖迅速、工艺简单、生产成本低等优点。
然而由于酪氨酸激酶介导细胞信号转导途径,并调节细胞的生长、凋亡等多种功能。一般基因工程菌胞内的表达重组蛋白积累在细胞质中。如果按常规方法直接在毕赤酵母细胞质中表达酪氨酸激酶,该激酶会影响酵母细胞的正常功能,对酵母细胞产生毒性甚至导致细胞死亡。故而目前尚未有在毕赤酵母中成功表达酪氨酸激酶的报道。为了避免对细胞产生毒害且免受蛋白酶降解,本发明人通过诸多试验研究发现,将酪氨酸激酶定位至毕赤酵母的细胞器,如过氧化物酶体中进行表达可解决此问题。
为了使酪氨酸激酶定位在细胞器中表达,本发明在现有酪氨酸激酶蛋白的C端或N端加上可使蛋白定向输送到毕赤酵母细胞器过氧化物酶体的定位信号(Peroxisomal Targeting Signal,PTS)。其中,所说的过氧化物酶体定位信号PTS可以是现有文献报道的任何具有上述功能的肽,其通常是由若干个氨基酸组成的短肽,如加在C端的PTS1具有下列结构通式丝氨酸/丙氨酸/半胱氨酸-赖氨酸/组氨酸/精氨酸-亮氨酸/甲硫氨酸(S/A/C-K/H/R-L/M)(见文献Ann Rev Cell Biol,1993,9445-478);加在N端的PTS2具有下列结构通式精氨酸/赖氨酸-亮氨酸/异亮氨酸/缬氨酸-X5-组氨酸/谷氨酰胺-亮氨酸/丙氨酸R/K-L/I/V-X5-H/Q-L/A(见文献J Biol Chem,1994,2697558-7563),X5代表任意五个氨基酸。其中,上述符号“/”代表“或”的意思。
因此,本发明在毕赤酵母细胞器中表达的重组酪氨酸激酶,其具有下列结构通式PTS2-酪氨酸激酶,或酪氨酸激酶-PTS1,其中,PTS1和PTS2代表可使激酶蛋白定向输送到毕赤酵母过氧化物酶体的定位信号,PTS1是具有下列结构式S/A/C-K/H/R-L/M的氨基酸序列的三肽;PTS2是具有下列结构式R/K-L/I/V-X5-H/Q-L/A的氨基酸序列的九肽,其中X5代表任意五个氨基酸。
本发明所说的酪氨酸激酶可以是任何能使不同底物的酪氨酸残基磷酸化的酶,包括受体型酪氨酸激酶EGFR、PDGFR、FGFR和KDR等,以及非受体型酪氨酸激酶Src、ABL及FAK等。
在本发明一较佳例中,所述酪氨酸激酶为KDR(氨基酸序列如序列表中SEQ ID No.2所示),所述PTS1的氨基酸序列为SKL(丝氨酸-赖氨酸-亮氨酸),构成的该重组酪氨酸激酶的氨基酸序列即为SEQ ID No.2所示的KDR的氨基酸序列末端再加上SKL,具体参见序列表中SEQ ID No.7所示氨基酸序列中的第261-629位氨基酸序列。
本发明的另一较佳例中,所述酪氨酸激酶为非受体型酪氨酸激酶Src(氨基酸序列如序列表中SEQ ID No.16所示),所述PTS2的氨基酸序列为RLNNLATQL(精氨酸-亮氨酸-天冬酰胺-天冬酰胺-亮氨酸-丙氨酸-苏氨酸-谷氨酰胺-亮氨酸),构成的该重组酪氨酸激酶的氨基酸序列即为SEQ IDNo.16所示的Src的氨基酸序列前面再加上RLNNLATQL,具体参见序列表中SEQ ID No.19所示氨基酸序列中全部或第3-547位氨基酸序列,其中,第1-2位是优选pPIC3.5K质粒作为表达载体时,为了保证正确地开始翻译目的基因,而添加的包含有起始密码子ATG的Kozak序列ATGGCT对应的氨基酸序列。
因此,显然上述两较佳例的重组酪氨酸激酶还可以是将所述氨基酸序列经过一个或多个氨基酸残基的取代、缺失或添加且具有相同酶活性的,由这些序列如序列表中SEQ ID No.7所示的第261-629位氨基酸序列或SEQ IDNo.19所示的第3-547位氨基酸序列衍生的蛋白质,比如在C末端和/或N末端添加一个或数个氨基酸,如与载体编码的氨基酸融合、不影响序列的修饰形式上的差异等情况。
本发明的另一目的是提供上述在毕赤酵母细胞器中表达的重组酪氨酸激酶的cDNA。
显然,该cDNA是由一种编码酪氨酸激酶的任何核苷酸序列加上编码上述过氧化物酶体定位信号PTS的核苷酸序列构成。
已公开的编码一种酪氨酸激酶KDR的核苷酸序列如序列表中SEQ IDNo.1所示。然而,所述酪氨酸激酶为人源的,而毕赤酵母翻译系统与动物细胞翻译系统存在着差异,其氨基酸密码子的使用频率不同。当毕赤酵母表达外源蛋白质时,如果外源基因转录的mRNA中密码子的分配情况与毕赤酵母相似,则细胞能正常进行蛋白质翻译,蛋白在翻译过程中出现错误的频率较少。反之如果mRNA带有较多的稀有密码子,毕赤酵母内识别稀有密码子的tRNA量不能满足翻译过程中的需要,会使外源蛋白在翻译水平上出现移码突变、翻译水平下降等障碍,从而影响基因的表达。因此为提高表达水平,更佳地,本发明优选针对毕赤酵母密码子偏爱性的酪氨酸激酶蛋白的基因序列,如序列表中SEQ ID No.3所示的核苷酸序列。
以过氧化物酶体定位信号PTS1的氨基酸序列为SKL时为例,编码SKL的碱基序列为TCCAAGTTG,故上述重组酪氨酸激酶一较佳例——重组KDR的cDNA可以是SEQ ID No.1所示的核苷酸序列末端加上TCCAAGTTG,即为序列表中SEQ ID No.5所示的核苷酸序列;或者是SEQ ID No.3所示的核苷酸序列末端加上TCCAAGTTG,即为序列表中SEQ ID No.4所示的核苷酸序列;也可以是其它任何能编码由序列表中SEQ ID No.2所示的氨基酸序列组成的蛋白质所对应的碱基序列的末端加上TCCAAGTTG。
而已公开的编码另一种酪氨酸激酶Src的核苷酸序列如序列表中SEQID No.15所示(GeneBank登陆号为NM_005417)。
以过氧化物酶体定位信号PTS2的氨基酸序列为RLNNLATQL时为例,编码RLNNLATQL的碱基序列为AGATTGAACAACTTGGCTACTCAATTG,故上述另一较佳例——重组Src的cDNA可以是SEQ ID No.15所示的核苷酸序列前端加上AGATTGAACAACTTGGCTACTCAATTG,即为序列表中SEQID No.17所示的核苷酸序列中的7-1641位核苷酸序列,SEQ ID No.17所示的核苷酸序列中第1-6位碱基是使用pPIC3.5K质粒作为表达载体时,为保证正确地开始翻译目的基因而加入的包含有起始密码子ATG的Kozak序列ATGGCT;本发明重组Src的cDNA也可以是其它任何能编码由序列表中SEQ ID No.16所示的氨基酸序列组成的蛋白质所对应的碱基序列的前端加上AGATTGAACAACTTGGCTACTCAATTG。
更佳地,本发明将酪氨酸激酶和标记蛋白融合表达,这样做的技术优势在于可以通过对标记蛋白的测定来间接检测激酶的表达量,便于在菌种筛选、发酵和纯化过程中实时监测酪氨酸激酶的活性和产量。
因此,本发明的再一目的是提供一种上述重组酪氨酸激酶的衍生融合蛋白,其为标记蛋白与酪氨酸激酶的融合蛋白。
本发明优选的标记蛋白为荧光蛋白。因为荧光蛋白无论在原核或真核细胞中表达,当用一定波长激发时,都能产生一种很亮的荧光(生理科学进展,2002,33(4),364~366)。此外,荧光蛋白还具有低毒性、不干扰正常的细胞活动等优点。
将酪氨酸激酶和荧光蛋白融合表达,可以通过荧光显微镜、荧光酶标仪或流式细胞仪等快速检测荧光强度来间接检测激酶的表达量,并可在菌种筛选、发酵和纯化过程中通过荧光强度检测实时监测酪氨酸激酶的活性和产量。
本领域的技术人员知晓,荧光蛋白包括绿色、黄色、红色荧光蛋白等,这些不同颜色的荧光蛋白均可用于本发明。
为了便于从纯化的融合蛋白中得到重组酪氨酸激酶单体,本发明在荧光蛋白和酪氨酸激酶之间引入了凝血酶(thrombin)酶切位点(氨基酸序列LVPRGS),这样可以用凝血酶从融合蛋白中酶切得到酪氨酸激酶。
本领域的技术人员知晓,为了便于从纯化的融合蛋白中得到重组酪氨酸激酶单体,除了在荧光蛋白和酪氨酸激酶之间引入了凝血酶酶切位点外,其他酶切位点还有肠激酶位点(氨基酸序列DDDDK),Xa因子位点(氨基酸序列IEGR),HRV 3C位点(氨基酸序列LEVLFQGP)等,这些酶切位点均可用于本发明。
在本发明一较佳实施例中,所述的衍生融合蛋白中含有的标记蛋白选用绿色荧光蛋白(GFP),GFP是来源于水母(Aequorea victoria)的一条由238个氨基酸组成的多肽链(其氨基酸序列如序列表中SEQ ID No.10所示,核苷酸序列如SEQ ID No.9所示);所述酶切位点选用凝血酶酶切位点;该衍生融合蛋白具有序列表中SEQ ID No.7所示的第15-629位氨基酸序列,其中第15~252位为GFP的氨基酸序列,第253-254位为核酸酶EcoRI位点,第255-260位为凝血酶酶切位点的氨基酸序列,第261-629位为重组酪氨酸激酶KDR的氨基酸序列;编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.6所示的第43-1887位核苷酸序列。
更佳地,为了简化纯化工艺,降低生产成本,本发明在荧光蛋白和酪氨酸激酶融合蛋白的N端加了便于亲和纯化的纯化标记蛋白或肽,如多聚组氨酸(His-tag)序列(6-10个组氨酸),这样可以通过镍离子亲和层析或其它方法纯化激酶。当然,除了多聚组氨酸序列,其他现有便于纯化的纯化标记蛋白或肽均可用于本发明,例如GST Tag、S Tag、T7 Tag、CBD Tag等(见pET system manual,www.novagen.com)。
上述包括多聚组氨酸序列的衍生融合蛋白具有序列表中SEQ ID No.7所示的全部或第3-629位氨基酸序列,其中,第1-2位为包含有起始密码子ATG的Kozak序列ATGGCT编码的2个氨基酸,第3-12位为His-tag(10个组氨酸组成);编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ IDNo.6的全部或第7-1887位碱基序列所示,相应地,SEQ ID No.6中的第1-6位为包含有起始密码子ATG的Kozak序列ATGGCT。
本发明所说的“Kozak序列”是指在使用pPIC3.5K质粒作为表达载体时,为了保证正确地开始翻译目的基因,通常需要在目的基因前端加入一段包含有ATG的Kozak序列(Multi-Copy Pichia Expression Kit,Version E,Invitrogen)。其中ATG相当于随后目的基因的起始密码子,ATG后面的三个核苷酸可以是G开头的任何三个核苷酸。在本发明的两个较佳实施例中添加的ATGGCT即为一段合适的Kozak序列,当然如本领域的技术人员所知晓,ATG后面的三个核苷酸可以不仅限于GCT。
当然,本发明也可以将酪氨酸激酶单和上述纯化标记蛋白或肽融合表达。在本发明的一较佳例中,采用GST-tag作为纯化标记(其氨基酸序列如序列表中SEQ ID No.21所示,核苷酸序列如SEQ ID No.20所示),并在酪氨酸激酶Src和纯化标记之间引入了肠激酶(EK)酶切位点(氨基酸序列DDDDK),这样可以用肠激酶从融合蛋白中酶切得到酪氨酸激酶。本例中的衍生融合蛋白具有序列表中SEQ ID No.19所示的全部或第3-777位氨基酸序列,其中,第1-547或3-547位为重组酪氨酸激酶Src的氨基酸序列,第548-552位为EK酶切位点的氨基酸序列,第553-554位为EcoRI位点,第555-777位为GST-tag;编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.18的全部或第7-2331位碱基序列所示。
本发明的再一目的是提供一种含有上述目的蛋白基因序列的重组表达载体。
该重组表达载体可以包括下列核苷酸序列之一1)上述重组酪氨酸激酶,如重组KDR的cDNA核苷酸序列,例如序列表中SEQ ID No.4、SEQ ID No.5所示的碱基序列以及其他编码由序列表SEQID No.7所示的氨基酸序列中第261-629位氨基酸组成的蛋白质所对应的碱基序列;或是重组Src的cDNA核苷酸序列,例如序列表中SEQ ID No.17所示的全部或第7-1641位碱基序列以及其他编码由序列表SEQ ID No.19所示的全部或第3-547位氨基酸组成的蛋白质所对应的碱基序列;2)上述荧光蛋白和酪氨酸激酶的融合蛋白(如GFP-KDR)的cDNA核苷酸序列,如序列表中SEQ ID No.6所示的第43-1887位碱基序列;3)上述含有多聚组氨酸的衍生融合蛋白的cDNA核苷酸序列,如序列表中SEQ ID No.6所示的全部或7-1887位碱基序列;或是含有GST-tag的衍生融合蛋白的cDNA核苷酸序列,如序列表中SEQ ID No.18所示的全部或第7-2331位碱基序列。
本领域技术人员知晓,重组表达载体可以是能方便地进行重组DNA操作并能导致目的蛋白序列表达的任何载体。载体的选择一般取决于载体与待引入载体的宿主细胞之间的相容性。载体可以是自主复制性载体,即作为一种染色体外实体存在的载体,其复制不依赖于染色体的复制。载体可含有保证自主复制的任何元件。另外,载体也可以是这样一种载体,当引入宿主细胞后,可以整合到基因组中并与所整合的染色体一起复制。
本发明的表达载体优选的含有一种或多种使转化细胞能得到方便筛选的选择性标记。选择性标记是一种基因,其产物提供抗生素抗性、杀生物剂或病毒抗性、重金属抗性等。如提供抗生素抗性的氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。适当的表达载体的选择取决于待表达的目的蛋白及所选表达宿主细胞。本发明的表达宿主细胞为毕赤酵母,故选用的表达载体为适用于毕赤酵母的现有任何载体,包括但不限于pPIC衍生质粒pPIC3.5K、pPIC9K,或它们的衍生物。
本发明的又一目的是提供含有本发明的目的基因和重组表达载体的宿主细胞,其用于目标酪氨酸激酶的重组生产。将含有本发明的目的基因的重组表达载体引入宿主细胞中,使载体作为染色体整合体保持于其中。术语“宿主细胞”还包括由于复制期间发生突变而与亲代细胞不同的亲代细胞的任何子代。
本发明中所用的宿主细胞是真核表达宿主——毕赤酵母细胞,所述的毕赤酵母包括但不限于现有的GS115、KM71菌株等。
本发明的另一目的是提供上述重组酪氨酸激酶的制备方法。
本发明制备方法的关键在于将酪氨酸激酶定位至毕赤酵母细胞器过氧化物酶体中进行表达,其包括在编码酪氨酸激酶的任何基因序列上连接使蛋白定向输送到毕赤酵母细胞器过氧化物酶体的定位信号PTS(如PTS1或PTS2)的基因序列,从而构成在毕赤酵母细胞器中表达的重组酪氨酸激酶的cDNA核苷酸序列,接着制备含有该cDNA核苷酸序列的重组表达载体,将所述重组表达载体转化真核表达宿主毕赤酵母,培养转化体,将培养物分离纯化的步骤。
所述的表达载体如上述的pPIC衍生质粒,真核表达宿主为毕赤酵母GS115、KM71菌株等。制备重组表达载体和转化体可采用现有基因工程技术。如制备上述含有多聚组氨酸、表达GFP-KDR衍生融合蛋白(His-GFP-KDR)的重组载体时,可分别在KDR基因的两端引入EcoRI和NotI酶切位点,GFP基因两端引入PstI和EcoRI酶切位点,His-tag基因两端引入XbaI-SnaBI和PstI酶切位点;分别将His-tag与GFP以PstI酶切位点相连,将均经EcoRI/NotI酶切处理后的pPIC3.5K与KDR连接,再将上述两者经SnaBI/EcoRI酶切处理后连接,得到最终表达载体pPIC3.5K-plus。又如制备上述含有GST-tag、表达Src衍生融合蛋白(GST-Src)的重组表达载体时,可分别在Src基因的两端引入SnaBI和EcoRI酶切位点,GST-tag基因两端引入EcoRI和AvrII酶切位点;将均经SnaBI/EcoRI酶切处理后的pPIC3.5K与Src连接得质粒Src-pPIC3.5K,再将均经EcoRI/AvrII酶切处理后的Src-pPIC3.5K与GST-tag连接,得到最终表达载体Src-GST-pPIC3.5K。而向毕赤酵母细胞中引入重组表达载体的方法可以是原生质体转化、电穿孔法、PEG法以及LiCl法等。培养转化体及将培养物分离纯化的方法也均可采用现有技术(参见J.萨母布鲁克等编的《分子克隆实验指南》)。
本发明的效果在于本发明将酪氨酸激酶定位在过氧化物酶体这一毕赤酵母的细胞器中,减少了激酶对宿主毕赤酵母菌株的毒害,首次实现了酪氨酸激酶在酵母中的大量表达制备。本发明还通过优化酪氨酸激酶cDNA的密码子,使其适合在毕赤酵母中表达。同时将酪氨酸激酶基因和荧光蛋白融合表达,以便于激酶的监测。最后本发明在融合蛋白的N端或C端加了便于亲和纯化的氨基酸序列,可以简化纯化工艺,减少纯化的成本。同时毕赤酵母表达的酪氨酸激酶不会形成包涵体,要比大肠杆菌表达具有更好的优势。通过以上技术的应用,本发明实现了高生物活性的酪氨酸激酶在毕赤酵母中低成本、大量制备。


图1为现有酪氨酸激酶KDR基因序列(上行)、本发明针对毕赤酵母密码子偏爱性而优化的KDR基因序列(中行,其中与原基因序列相同的碱基未列出)以及它们编码的KDR氨基酸序列(下行)。
图2为带有His-tag、GFP和KDR基因的重组表达载体构建示意图。
图3为PCR扩增GFP和KDR图谱,其中control为对照。
图4为PCR验证重组表达载体质粒pPIC3.5K-plus的图谱。
图5为Ni柱亲和纯化本发明衍生融合蛋白His-GFP-KDR结果。
图6为带有Src和GST-tag基因的重组表达载体构建示意图。
图7为GST-Agarose亲和层析柱亲和纯化本发明衍生融合蛋白GST-Src结果。
具体实施例方式
下面用实施例来进一步说明本发明,但本发明并不受其限制。
下列实施例中的材料与方法为所采用的分子克隆技术参见J.萨母布鲁克等编的《分子克隆实验指南》。
所使用的工具酶均购自TaKaRa生物公司(大连,中国),具体的反应条件和使用的方法均参考商品说明书。
下面的商品化质粒和大肠杆菌株用于基因克隆pBlueScript(+)和pUC19购自天根生化科技(北京)有限公司;pDEST15购自Invitrogen公司;pPIC3.5K、大肠杆菌Top10、毕赤酵母GS115、KM71菌株购自Invitrogen。
λ-DNA HindIII Marker(Takala,大连宝生物公司),Ni亲和层析柱(Ni Sepharose 6 Fast Flow,GE公司),GST-Agarose亲和层析柱(Amersham Pharmacia Biotech公司)。
实施例1 重组酪氨酸激酶KDR的制备及活性试验实施例1.1 带有His-tag序列的重组质粒的制备His-tag基因序列由63个碱基组成,见序列表SEQ ID NO8,该序列由商业化合成[生工生物工程(上海)有限公司]。该序列的5’端含XbaI-SnaBI酶切位点(5’端第4-15位碱基)以及包含有起始密码子的Kozak序列ATGGCT(5’端第19-24位碱基),3’端含PstI酶切位点(3’端第4-9位碱基)。
该序列经限制性内切酶XbaI和PstI酶切,用T4连接酶连接,克隆入经XbaI和PstI酶切的商用pBlueScript(+)的XbaI和PstI位点处,获得带有His-tag序列的重组质粒His-pBlueScript(+)。
实施例1.2 带有His-tag序列和绿色荧光蛋白GFP基因序列的重组质粒的制备GFP基因序列由717个碱基(序列表SEQ ID NO9)组成,设计合成了PCR引物P1和P2,其中P1引入了DNA酶切位点PstI,P2引入了DNA酶切位点EcoRI。
P15’-AAACTGCAGATGTCTAAAGGTGAAGAATTATTC-3’PstI (SEQ ID NO11)P25’-CCGGAATTCTTTGTACAATTCATCCATAC-3’EcoRI (SEQ ID NO12)利用上述引物对P1和P2,以含有该GFP基因的pUC19重组质粒为模板(参考Microbiology,1997,143303-311),通过如下PCR反应扩增得到一个732bp的DNA片段以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,46℃退火1分钟,72℃延伸1.5分钟循环反应5次,然后再94℃变性1分钟,52℃退火1分钟,72℃延伸1.5分钟循环反应25次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段(见图3所示),经限制性内切酶PstI和EcoRI酶切,用T4连接酶连接,克隆入经PstI和EcoRI酶切的实施例1.1的His-pBlueScript(+)的PstI和EcoRI位点处,获得带有His-tag序列和GFP序列的重组质粒His-GFP-pBlueScript(+)。
实施例1.3 KDR基因序列的优化制备及过氧化物酶体的定位信号的引入KDR基因序列由1098个碱基组成,在不改变氨基酸的前提下,对KDR基因的密码子进行优化。KDR氨基酸序列如SEQ ID NO2所示;原核苷酸序列如SEQ ID NO1所示、优化后的序列如SEQ ID NO3所示,两组核苷酸序列对比参见图1。优化后的序列由公司[生工生物工程(上海)有限公司]商业化全合成,并克隆在商用pBlueScript(+)载体上。
以pBlueScript(+)载体上优化的KDR基因为模板,设计合成了PCR引物P3和P4,其中P3引入了DNA酶切位点EcoRI以及凝血酶酶切位点(双波浪线表示,对应的氨基酸序列为LVPRGS),P4引入了DNA酶切位点AvrII-NotI及过氧化物酶体的定位信号SKL(双下划线标记)。
P35’-CCGGAATTCCTGGTCCCCAGAGGCTCTATGGACCCTGATGAGTTG-3’EcoRI(SEQ ID NO13)P45’-CATTAGCGGCCGCCCTAGGCTACTA GTCCTGCTGAGCGTT-3’ AvrII-NotI(SEQ ID NO14)利用上述引物对P3和P4,以含有该KDR基因的pBlueScript(+)载体为模板,通过如下PCR反应扩增得到一个1159bp的DNA片段以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,60℃退火1分钟,72℃延伸1.5分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段(见图3)。
实施例1.4 带有KDR序列的重组质粒的构建将实施例1.3所得PCR反应片段经限制性内切酶EcoRI和NotI酶切,用T4连接酶连接,克隆入经EcoRI和NotI酶切的商用pPIC3.5K的EcoRI和NotI位点处,获得带有KDR序列的重组质粒KDR-pPIC3.5K。
实施例1.5 含有His-tag片段以及GFP-KDR片段的表达载体的构建用限制性内切酶XbaI和EcoRI酶切实施例1.2中所得的重组质粒His-GFP-pBlueScript(+),以及琼脂糖凝胶电泳回收His-GFP片段,用T4连接酶连接,克隆入经XbaI和EcoRI酶切的实施例1.4所得的KDR-pPIC3.5K的XbaI和EcoRI位点处,获得最终目的表达载体pPIC3.5K-plus(如图2)。转化大肠杆菌Top10后筛选重组子,用引物对P1和P4进行PCR,鉴定重组质粒中插入片段的大小和方向。阳性克隆的PCR验证大小应为2kb左右,得到6个阳性克隆(见图4中的3-4、6-9泳道),取8号菌经DNA测序仪(仪器型号3730)测定该片段序列,其核苷酸序列如SEQ ID NO6所示,氨基酸序列如SEQ ID NO7所示,表明扩增序列与既定目标序列完全相符。其中,除去His-tag后的GFP-KDR融合蛋白(含凝血酶酶切位点)的cDNA核苷酸序列如SEQ ID NO6所示序列的第43-1887位,氨基酸序列如SEQID NO7所示序列的第15-629位;而除去GFP及凝血酶酶切位点的本发明重组酪氨酸激酶KDR的cDNA核苷酸序列如SEQ ID NO4所示,即SEQ IDNO6所示序列的第781-1887位,氨基酸序列如SEQ ID NO7所示序列的第261-629位。
实施例1.6 含有KDR序列的重组宿主菌的构建用限制性内切酶SacI将实施例1.5中所得的重组质粒pPIC3.5K-plus线性化,电转化入毕赤酵母宿主菌GS115感受态细胞,用组氨酸缺陷型MGY平板(Invitrogen公司)筛选阳性克隆,将阳性克隆转涂不同浓度的G418平板,浓度分别为1、2、3、4mg/ml,筛选高拷贝重组菌株。将平板上长出的菌株进行摇瓶表达,每隔24小时取样,用流式细胞仪检测荧光强度以判断各菌株的表达情况,结果表明1号菌(命名为Pichia KDR No.1)在24小时时荧光强度几何平均值为1618.31,是各菌株中表达量最高的。
实施例1.7 产生GFP-KDR的基因工程菌的发酵培养及GFP-KDR的分离纯化1.基因工程菌(毕赤酵母)的发酵培养将实施例1.6中所得的基因工程菌Pichia KDR No.1菌株接种于BSM培养基中(参考Sreekrishna K,Kropp KE(1996)Pichia pastoris.InWolf K,eds.,Non-Conventional Yeast in BiotechnologyA Handbook.BerlinSpringer-Verlag,pp.203-253),28℃振荡培养30小时,再以10%的接种量接种于新鲜的同种培养基中,于28℃继续培养60小时左右。
2.GFP-KDR的分离、纯化按上述条件培养工程菌过程中,每隔6小时取样用流式细胞仪检测荧光强度。当荧光强度出现下降时,停止发酵培养。经测定,酪氨酸激酶融合蛋白的最大表达量为260mg/L。
将发酵液3000g离心30分钟,弃上清保留菌体。用玻璃珠破壁,Ni亲和层析柱分离纯化,以50mM磷酸盐溶液(含250mM咪唑)进行洗脱。洗脱曲线见图5。样品上样至Ni柱之后,先用含20mM咪唑的平衡,再用250mM咪唑洗脱,250mM咪唑洗脱峰即为目标蛋白峰,之后再用1M的咪唑洗脱则没有蛋白洗下。
将纯化的GFP-KDR激酶用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性,结果如下

其中的阳性及阴性对照均为试剂盒提供。以上结果说明纯化后的酪氨酸激酶KDR具有高的活性。
为了进一步评价纯化的重组KDR的生物活性,采用商用KDR特异性抑制剂进行KDR抑制实验。结果表明当抑制剂PTK789、SU11248、SU5416的浓度为10-5mol/L时,三者对KDR的抑制率分别为78.6%、60.4%、77.2%,均高于50%,这进一步说明本发明纯化的重组酪氨酸激酶KDR具有良好的生物活性。
实施例2 重组酪氨酸激酶Src的制备及活性测定实施例2.1 Src基因序列的制备及过氧化物酶体的定位信号的引入Src基因序列由1608个碱基(序列表SEQ ID NO15)组成,设计合成了PCR引物P5和P6,其中P5引入了DNA酶切位点SnaBI以及过氧化物酶体的定位信号RLNNLATQL(双下划线标记),SnaBI酶切位点与定位信号之间引入包含有起始密码子的Kozak序列ATGGCT,在P6引入了DNA酶切位点EcoRI以及肠激酶酶切位点(双波浪线表示,对应的氨基酸序列为DDDDK)。
P55’-CTGTACGTAATGGCT SnaBIATGGGTAGCAACAAGAGC-3’ (SEQ ID NO22)P65’-CGAGAATTCCTTGTCGTCGTCATCGAGGTTCTCCCCGGGCTGGTA-3’ EcoRI(SEQ ID NO23)利用上述引物对P5和P6,以含有该Src基因的质粒pBA3CS(BMCBiochemistry,2002,332)为模板,通过如下PCR反应扩增得到一个1674bp的DNA片段以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,65℃退火1分钟,72℃延伸2分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段。
实施例2.2 带有GST-tag序列的重组质粒的制备GST-tag基因序列由669个碱基组成,见序列表SEQ ID NO20,设计合成了PCR引物P7和P8,从商业化质粒pDEST15(Invitrogen公司)上扩增得到GST-tag基因序列,其中P7引入了DNA酶切位点EcoRI,P8引入了DNA酶切位点AvrII。
P75’-CCGGAATTCTCCCCTATACTAGGTTATTGG-3’EcoRI (SEQ ID NO24)P85’-CAACCTAGGCTACTAACGCGGAACCAGATCCGATTT-3’AvrII (SEQ ID NO25)利用上述引物对P7和P8,以含有该GST-tag基因的pDEST15载体为模板,通过如下PCR反应扩增得到一个693bp的DNA片段以总体积50ul进行PCR反应,95℃变性7分钟,按94℃变性1分钟,54℃退火1分钟,72℃延伸1分钟循环反应30次,最后再72℃延伸10分钟。琼脂糖凝胶电泳回收所得PCR反应片段,经限制性内切酶EcoRI和AvrII酶切,用T4连接酶连接,克隆入经EcoRI和AvrII酶切的商用pPIC3.5K的EcoRI和AvrII位点处,获得带有GST-tag序列的重组质粒GST-pPIC3.5K。
实施例2.3 含有GST-tag片段以及Src片段的表达载体的构建将实施例2.1所得PCR反应片段经限制性内切酶SnaBI和EcoRI酶切,用T4连接酶连接,克隆入经SnaBI和EcoRI酶切的实施例2.2的GST-pPIC3.5K的SnaBI和EcoRI位点处,获得带有Src序列的最终目的表达载体Src-GST-pPIC3.5K。转化大肠杆菌Top10后筛选重组子,用引物对P5和P8进行PCR,鉴定重组质粒中插入片段的大小和方向。阳性克隆的PCR验证大小应为2355bp,得到8个阳性克隆,取1号菌经DNA测序仪(仪器型号3730)测定该片段序列,其10-2346位核苷酸序列如SEQ ID NO18所示,氨基酸序列如SEQ ID NO19所示,表明扩增序列与既定目标序列完全相符。其中,除去GST-tag及肠激酶酶切位点后的Src重组蛋白单体的cDNA核苷酸序列如SEQ ID NO18所示序列的第1-1641位(第1-6位为包含启动密码子的Kozak序列),氨基酸序列如SEQ ID NO19所示序列的第1-547位(相应地第1-2位为Kozak序列编码的两个氨基酸)。
实施例2.4 含有Src序列的重组宿主菌的构建用限制性内切酶SacI将实施例2.3中所得的重组质粒Src-GST-pPIC3.5K线性化,电转化入毕赤酵母宿主菌KM71感受态细胞,用组氨酸缺陷型MGY平板(Invitrogen公司)筛选阳性克隆,将阳性克隆转涂不同浓度的G418平板,浓度分别为1、2、3、4mg/ml,筛选高拷贝重组菌株。将平板上长出的菌株进行摇瓶表达,每隔24小时取样,玻璃珠破壁之后,用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性以判断各菌株的表达情况,结果表明5号菌(命名为Pichia Src No.5)在24小时时酶活是各菌株中最高的。
实施例2.5 产生Src的基因工程菌的发酵培养及Src的分离纯化1.基因工程菌(毕赤酵母)的发酵培养将实施例2.4中所得的基因工程菌Pichia Src No.5菌株接种于BSM培养基中(方法参考实施例1.7),28℃振荡培养30小时,再以10%的接种量接种于新鲜的同种培养基中,于28℃继续培养60小时左右。
2.Src的分离、纯化按上述条件培养工程菌过程中,每隔6小时取样用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性。当活性出现下降时,停止发酵培养。
将发酵液3000g离心30分钟,弃上清保留菌体。用玻璃珠破壁,GST-Agarose亲和层析柱(Amersham Pharmacia Biotech)分离纯化,以50mM磷酸盐溶液(含50mmol/L Tris,0.15mol/L NaCl,2.5mmol/L CaCl2,pH7.5)进行洗脱,收集目的蛋白。洗脱曲线见图7。
将纯化的Src激酶用酪氨酸激酶分析试剂盒(NO.PTK101,Sigma公司)测定活性,结果如下

其中的阳性及阴性对照均为试剂盒提供。以上结果说明纯化后的酪氨酸激酶Src具有高的活性。
序列表<110>华东理工大学;中国科学院上海药物研究所<120>在毕赤酵母细胞器中表达的重组酪氨酸激酶及其基因、衍生融合蛋白和制备方法<130>061709C<160>25<170>PatentIn version 3.3<210>1<211>1098<212>DNA<213>人(human)<220>
<221>CDS<222>(1)..(1098)<400>1atg gat cca gat gaa ctc cca ttg gat gaa cat tgt gaa cga ctg cct 48Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys Glu Arg Leu Pro1 5 10 15tat gat gcc agc aaa tgg gaa ttc ccc aga gac cgg ctg aag cta ggt 96Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg Leu Lys Leu Gly20 25 30aag cct ctt ggc cgt ggt gcc ttt ggc caa gtg att gaa gca gat gcc144Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile Glu Ala Asp Ala35 40 45ttt gga att gac aag aca gca act tgc agg aca gta gca gtc aaa atg192Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val Ala Val Lys Met50 55 60ttg aaa gaa gga gca aca cac agt gag cat cga gct ctc atg tct gaa240Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala Leu Met Ser Glu65 70 75 80ctc aag atc ctc att cat att ggt cac cat ctc aat gtg gtc aac ctt288Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn Val Val Asn Leu85 90 95cta ggt gcc tgt acc aag cca gga ggg cca ctc atg gtg att gtg gaa336Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met Val Ile Val Glu100 105 110
ttc tgc aaa ttt gga aac ctg tcc act tac ctg agg agc aag aga aat384Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg Ser Lys Arg Asn115 120 125gaa ttt gtc ccc tac aag acc aaa ggg gca cga ttc cgt caa ggg aaa432Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe Arg Gln Gly Lys130 135 140gac tac gtt gga gca atc cct gtg gat ctg aaa cgg cgc ttg gac agc480Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg Arg Leu Asp Ser145 150 155 160atc acc agt agc cag agc tca gcc agc tct gga ttt gtg gag gag aag528Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe Val Glu Glu Lys165 170 175tcc ctc agt gat gta gaa gaa gag gaa gct cct gaa gat ctg tat aag576Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu Asp Leu Tyr Lys180 185 190gac ttc ctg acc ttg gag cat ctc atc tgt tac agc ttc caa gtg gct624Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser Phe Gln Val Ala195 200 205aag ggc atg gag ttc ttg gca tcg cga aag tgt atc cac agg gac ctg672Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile His Arg Asp Leu210 215 220gcg gca cga aat atc ctc tta tcg gag aag aac gtg gtt aaa atc tgt720Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val Val Lys Ile Cys225 230 235 240gac ttt ggc ttg gcc cgg gat att tat aaa gat cca gat tat gtc aga768Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro Asp Tyr Val Arg245 250 255aaa gga gat gct cgc ctc cct ttg aaa tgg atg gcc cca gaa aca att816Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala Pro Glu Thr Ile260 265 270ttt gac aga gtg tac aca atc cag agt gac gtc tgg tct ttt ggt gtt864Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp Ser Phe Gly Val275 280 285ttg ctg tgg gaa ata ttt tcc tta ggt gct tct cca tat cct ggg gta912Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro Tyr Pro Gly Val290 295 300aag att gat gaa gaa ttt tgt agg cga ttg aaa gaa gga act aga atg960Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu Gly Thr Arg Met305 310 315 320agg gcc cct gat tat act aca cca gaa atg tac cag acc atg ctg gac 1008Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln Thr Met Leu Asp325 330 335tgc tgg cac ggg gag ccc agt cag aga ccc acg ttt tca gag ttg gtg 1056
Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe Ser Glu Leu Val340 345 350gaa cat ttg gga aat ctc ttg caa gct aat gct cag cag gat1098Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln Gln Asp355 360 365<210>2<211>366<212>PRT<213>人(human)<400>2Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys Glu Arg Leu Pro1 5 10 15Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg Leu Lys Leu Gly20 25 30Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile Glu Ala Asp Ala35 40 45Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val Ala Val Lys Met50 55 60Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala Leu Met Ser Glu65 70 75 80Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn Val Val Asn Leu85 90 95Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met Val Ile Val Glu100 105 110Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg Ser Lys Arg Asn115 120 125Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe Arg Gln Gly Lys130 135 140Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg Arg Leu Asp Ser145 150 155 160Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe Val Glu Glu Lys165 170 175Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu Asp Leu Tyr Lys180 185 190Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser Phe Gln Val Ala195 200 205Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile His Arg Asp Leu210 215 220Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val Val Lys Ile Cys225 230 235 240
Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro Asp Tyr Val Arg245 250 255Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala Pro Glu Thr Ile260 265 270Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp Ser Phe Gly Val275 280 285Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro Tyr Pro Gly Val290 295 300Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu Gly Thr Arg Met305 310 315 320Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln Thr Met Leu Asp325 330 335Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe Ser Glu Leu Val340 345 350Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln Gln Asp355 360 365<210>3<211>1098<212>DNA<213>人工序列(Artificial)<220>
<223>针对毕赤酵母密码子偏爱性优化的酪氨酸激酶KDR的核苷酸序列<400>3atggaccctg atgagttgcc attggatgaa cactgcgagc gtttgcctta cgacgcctct 60aagtgggagt tccctagaga tagattgaag ttgggaaagc cacttggtag aggagccttt120ggtcaagtca ttgaggctga cgccttcgga atcgacaaga ccgctacctg ccgtaccgtt180gctgtcaaaa tgttgaaaga gggagctacc cactctgaac atagagcctt gatgtccgag240ttgaagatcc ttatccacat tggtcatcac ttgaatgttg tcaacttgtt gggtgcttgt300actaagccag gtggaccatt gatggtcatt gtcgagtttt gcaagtttgg taacctttcc360acctacctta gatccaagcg taacgagttc gtcccataca agactaaggg tgctagattc420cgtcaaggaa aggactatgt tggtgctatc ccagttgatt tgaagcgtag attggattct480atcacttctt ctcaatcctc cgcttcttcc ggattcgttg aggagaagtc tctttctgat540gtcgaggaag aggaagcccc agaggacctt tacaaagact ttcttacttt ggaacacttg600atctgttact ccttccaggt cgccaaaggt atggagtttc ttgcctctag aaagtgcatc660catcgtgacc ttgctgctcg taacatcttg ttgtctgaaa agaatgtcgt caagatctgc720gacttcggac ttgctcgtga catctacaag gacccagact acgttagaaa gggagacgcc780agattgcctt tgaagtggat ggctccagaa actatcttcg atagagtcta caccatccag840tccgatgtct ggtcctttgg agttcttttg tgggagatct tctctcttgg agcctctcct900taccctggag ttaagattga tgaagagttc tgtagacgtt tgaaggaagg aactagaatg960
cgtgctcctg actacactac tcctgagatg tatcagacca tgcttgactg ttggcatgga1020gaaccatctc aacgtccaac tttctccgag cttgttgagc accttggaaa ccttcttcaa1080gctaacgctc agcaggac 1098<210>4<211>1107<212>DNA<213>人工序列(Artificial)<220>
<223>含毕赤酵母过氧化物酶体定位信号SKL且密码子优化的酪氨酸激酶KDR的核苷酸序列<220>
<221>transit_peptide<222>(1099)..(1107)<400>4atggaccctg atgagttgcc attggatgaa cactgcgagc gtttgcctta cgacgcctct 60aagtgggagt tccctagaga tagattgaag ttgggaaagc cacttggtag aggagccttt120ggtcaagtca ttgaggctga cgccttcgga atcgacaaga ccgctacctg ccgtaccgtt180gctgtcaaaa tgttgaaaga gggagctacc cactctgaac atagagcctt gatgtccgag240ttgaagatcc ttatccacat tggtcatcac ttgaatgttg tcaacttgtt gggtgcttgt300actaagccag gtggaccatt gatggtcatt gtcgagtttt gcaagtttgg taacctttcc360acctacctta gatccaagcg taacgagttc gtcccataca agactaaggg tgctagattc420cgtcaaggaa aggactatgt tggtgctatc ccagttgatt tgaagcgtag attggattct480atcacttctt ctcaatcctc cgcttcttcc ggattcgttg aggagaagtc tctttctgat540gtcgaggaag aggaagcccc agaggacctt tacaaagact ttcttacttt ggaacacttg600atctgttact ccttccaggt cgccaaaggt atggagtttc ttgcctctag aaagtgcatc660catcgtgacc ttgctgctcg taacatcttg ttgtctgaaa agaatgtcgt caagatctgc720gacttcggac ttgctcgtga catctacaag gacccagact acgttagaaa gggagacgcc780agattgcctt tgaagtggat ggctccagaa actatcttcg atagagtcta caccatccag840tccgatgtct ggtcctttgg agttcttttg tgggagatct tctctcttgg agcctctcct900taccctggag ttaagattga tgaagagttc tgtagacgtt tgaaggaagg aactagaatg960cgtgctcctg actacactac tcctgagatg tatcagacca tgcttgactg ttggcatgga 1020gaaccatctc aacgtccaac tttctccgag cttgttgagc accttggaaa ccttcttcaa 1080gctaacgctc agcaggactc caagttg 1107<210>5<211>1107<212>DNA
<213>人工序列(Artificial)<220>
<223>含毕赤酵母过氧化物酶体定位信号SKL的酪氨酸激酶KDR的核苷酸序列<220>
<221>transit_peptide<222>(1099)..(1107)<400>5atggatccag atgaactccc attggatgaa cattgtgaac gactgcctta tgatgccagc 60aaatgggaat tccccagaga ccggctgaag ctaggtaagc ctcttggccg tggtgccttt120ggccaagtga ttgaagcaga tgcctttgga attgacaaga cagcaacttg caggacagta180gcagtcaaaa tgttgaaaga aggagcaaca cacagtgagc atcgagctct catgtctgaa240ctcaagatcc tcattcatat tggtcaccat ctcaatgtgg tcaaccttct aggtgcctgt300accaagccag gagggccact catggtgatt gtggaattct gcaaatttgg aaacctgtcc360acttacctga ggagcaagag aaatgaattt gtcccctaca agaccaaagg ggcacgattc420cgtcaaggga aagactacgt tggagcaatc cctgtggatc tgaaacggcg cttggacagc480atcaccagta gccagagctc agccagctct ggatttgtgg aggagaagtc cctcagtgat540gtagaagaag aggaagctcc tgaagatctg tataaggact tcctgacctt ggagcatctc600atctgttaca gcttccaagt ggctaagggc atggagttct tggcatcgcg aaagtgtatc660cacagggacc tggcggcacg aaatatcctc ttatcggaga agaacgtggt taaaatctgt720gactttggct tggcccggga tatttataaa gatccagatt atgtcagaaa aggagatgct780cgcctccctt tgaaatggat ggccccagaa acaatttttg acagagtgta cacaatccag840agtgacgtct ggtcttttgg tgttttgctg tgggaaatat tttccttagg tgcttctcca900tatcctgggg taaagattga tgaagaattt tgtaggcgat tgaaagaagg aactagaatg960agggcccctg attatactac accagaaatg taccagacca tgctggactg ctggcacggg 1020gagcccagtc agagacccac gttttcagag ttggtggaac atttgggaaa tctcttgcaa 1080gctaatgctc agcaggattc caagttg 1107<210>6<211>1887<212>DNA<213>人工序列(Artificial)<220>
<223>含His-tag、GFP、凝血酶酶切位点、KDR、SKL的融合蛋白的核苷酸序列<220>
<221>CDS<222>(1)..(1887)
<400>6atg gct cat cac cac cat cat cat cat cat cat cat ctg cag atg tct48Met Ala His His His His His His His His His His Leu Gln Met Ser1 5 10 15aaa ggt gaa gaa tta ttc act ggt gtt gtc cca att ttg gtt gaa tta96Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu20 25 30gat ggt gat gtt aat ggt cac aaa ttt tct gtc tcc ggt gaa ggt gaa144Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu35 40 45ggt gat gct act tac ggt aaa ttg acc tta aaa ttt att tgt act act192Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr50 55 60ggt aaa ttg cca gtt cca tgg cca acc tta gtc act act ttc ggt tat240Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr65 70 75 80ggt gtt caa tgt ttt gct aga tac cca gat cat atg aaa caa cat gac288Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp85 90 95ttt ttc aag tct gcc atg cca gaa ggt tat gtt caa gaa aga act att336Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile100 105 110ttt ttc aaa gat gac ggt aac tac aag acc aga gct gaa gtc aag ttt384Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe115 120 125gaa ggt gat acc tta gtt aat aga atc gaa tta aaa ggt att gat ttt432Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe130 135 140aaa gaa gat ggt aac att tta ggt cac aaa ttg gaa tac aac tat aac480Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn145 150 155 160tct cac aat gtt tac atc atg gct gac aaa caa aag aat ggt atc aaa528Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys165 170 175gtt aac ttc aaa att aga cac aac att gaa gat ggt tct gtt caa tta576Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu180 185 190gct gac cat tat caa caa aat act cca att ggt gat ggt cca gtc ttg624Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu195 200 205tta cca gac aac cat tac tta tcc act caa tct gcc tta tcc aaa gat672Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp210 215 220
cca aac gaa aag aga gac cac atg gtc ttg tta gaa ttt gtt act gct720Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala225 230 235 240gct ggt att acc cat ggt atg gat gaa ttg tac aaa gaa ttc ctg gtc768Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Glu Phe Leu Val245 250 255ccc aga ggc tct atg gac cct gat gag ttg cca ttg gat gaa cac tgc816Pro Arg Gly Ser Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys260 265 270gag cgt ttg cct tac gac gcc tct aag tgg gag ttc cct aga gat aga864Glu Arg Leu Pro Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg275 280 285ttg aag ttg gga aag cca ctt ggt aga gga gcc ttt ggt caa gtc att912Leu Lys Leu Gly Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile290 295 300gag gct gac gcc ttc gga atc gac aag acc gct acc tgc cgt acc gtt960Glu Ala Asp Ala Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val305 310 315 320gct gtc aaa atg ttg aaa gag gga gct acc cac tct gaa cat aga gcc 1008Ala Val Lys Met Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala325 330 335ttg atg tcc gag ttg aag atc ctt atc cac att ggt cat cac ttg aat 1056Leu Met Ser Glu Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn340 345 350gtt gtc aac ttg ttg ggt gct tgt act aag cca ggt gga cca ttg atg 1104Val Val Asn Leu Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met355 360 365gtc att gtc gag ttt tgc aag ttt ggt aac ctt tcc acc tac ctt aga 1152Val Ile Val Glu Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg370 375 380tcc aag cgt aac gag ttc gtc cca tac aag act aag ggt gct aga ttc 1200Ser Lys Arg Asn Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe385 390 395 400cgt caa gga aag gac tat gtt ggt gct atc cca gtt gat ttg aag cgt 1248Arg Gln Gly Lys Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg405 410 415aga ttg gat tct atc act tct tct caa tcc tcc gct tct tcc gga ttc 1296Arg Leu Asp Ser Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe420 425 430gtt gag gag aag tct ctt tct gat gtc gag gaa gag gaa gcc cca gag 1344Val Glu Glu Lys Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu435 440 445
gac ctt tac aaa gac ttt ctt act ttg gaa cac ttg atc tgt tac tcc1392Asp Leu Tyr Lys Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser450 455 460ttc cag gtc gcc aaa ggt atg gag ttt ctt gcc tct aga aag tgc atc1440Phe Gln Val Ala Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile465 470 475 480cat cgt gac ctt gct gct cgt aac atc ttg ttg tct gaa aag aat gtc1488His Arg Asp Leu Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val485 490 495gtc aag atc tgc gac ttc gga ctt gct cgt gac atc tac aag gac cca1536Val Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro500 505 510gac tac gtt aga aag gga gac gcc aga ttg cct ttg aag tgg atg gct1584Asp Tyr Val Arg Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala515 520 525cca gaa act atc ttc gat aga gtc tac acc atc cag tcc gat gtc tgg1632Pro Glu Thr Ile Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp530 535 540tcc ttt gga gtt ctt ttg tgg gag agc ttc tct ctt gga gcc tct cct1680Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro545 550 555 560tac cct gga gtt aag att gat gaa gag ttc tgt aga cgt ttg aag gaa1728Tyr Pro Gly Val Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu565 570 575gga act aga atg cgt gct cct gac tac act act cct gag atg tat cag1776Gly Thr Arg Met Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln580 585 590acc atg ctt gac tgt tgg cat gga gaa cca tct caa cgt cca act ttc1824Thr Met Leu Asp Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe595 600 605tcc gag ctt gtt gag cac ctt gga aac ctt ctt caa gct aac gct cag1872Ser Glu Leu Val Glu His Leu Gly Asn Leu Leu Gln Ala Asr Ala Gln610 615 620cag gac tcc aag ttg1887Gln Asp Ser Lys Leu625<210>7<211>629<212>PRT<213>人工序列(Artificial)
<220>
<223>Synthetic Construct<400>7Met Ala His His His His His His His His His His Leu Gln Met Ser1 5 10 15Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu20 25 30Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu35 40 45Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr50 55 60Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe Gly Tyr65 70 75 80Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln His Asp85 90 95Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile100 105 110Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe115 120 125Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe130 135 140Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn145 150 155 160Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys165 170 175Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu180 185 190Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu195 200 205Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp210 215 220Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala225 230 235 240Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Glu Phe Leu Val245 250 255Pro Arg Gly Ser Met Asp Pro Asp Glu Leu Pro Leu Asp Glu His Cys260 265 270Glu Arg Leu Pro Tyr Asp Ala Ser Lys Trp Glu Phe Pro Arg Asp Arg275 280 285Leu Lys Leu Gly Lys Pro Leu Gly Arg Gly Ala Phe Gly Gln Val Ile290 295 300
Glu Ala Asp Ala Phe Gly Ile Asp Lys Thr Ala Thr Cys Arg Thr Val305 310 315 320Ala Val Lys Met Leu Lys Glu Gly Ala Thr His Ser Glu His Arg Ala325 330 335Leu Met Ser Glu Leu Lys Ile Leu Ile His Ile Gly His His Leu Asn340 345 350Val Val Asn Leu Leu Gly Ala Cys Thr Lys Pro Gly Gly Pro Leu Met355 360 365Val Ile Val Glu Phe Cys Lys Phe Gly Asn Leu Ser Thr Tyr Leu Arg370 375 380Ser Lys Arg Asn Glu Phe Val Pro Tyr Lys Thr Lys Gly Ala Arg Phe385 390 395 400Arg Gln Gly Lys Asp Tyr Val Gly Ala Ile Pro Val Asp Leu Lys Arg405 410 415Arg Leu Asp Ser Ile Thr Ser Ser Gln Ser Ser Ala Ser Ser Gly Phe420 425 430Val Glu Glu Lys Ser Leu Ser Asp Val Glu Glu Glu Glu Ala Pro Glu435 440 445Asp Leu Tyr Lys Asp Phe Leu Thr Leu Glu His Leu Ile Cys Tyr Ser450 455 460Phe Gln Val Ala Lys Gly Met Glu Phe Leu Ala Ser Arg Lys Cys Ile465 470 475 480His Arg Asp Leu Ala Ala Arg Asn Ile Leu Leu Ser Glu Lys Asn Val485 490 495Val Lys Ile Cys Asp Phe Gly Leu Ala Arg Asp Ile Tyr Lys Asp Pro500 505 510Asp Tyr Val Arg Lys Gly Asp Ala Arg Leu Pro Leu Lys Trp Met Ala515 520 525Pro Glu Thr Ile Phe Asp Arg Val Tyr Thr Ile Gln Ser Asp Val Trp530 535 540Ser Phe Gly Val Leu Leu Trp Glu Ile Phe Ser Leu Gly Ala Ser Pro545 550 555 560Tyr Pro Gly Val Lys Ile Asp Glu Glu Phe Cys Arg Arg Leu Lys Glu565 570 575Gly Thr Arg Met Arg Ala Pro Asp Tyr Thr Thr Pro Glu Met Tyr Gln580 585 590Thr Met Leu Asp Cys Trp His Gly Glu Pro Ser Gln Arg Pro Thr Phe595 600 605Ser Glu Leu Val Glu His Leu Gly Asn Leu Leu Gln Ala Asn Ala Gln610 615 620Gln Asp Ser Lys Leu625
<210>8<211>63<212>DNA<213>人工序列(Artificial)<220>
<223>编码His-tag的核苷酸序列<400>8gactctagat acgtaaccat ggctcatcac caccatcatc atcatcatca tcatctgcag60tag 63<210>9<211>717<212>DNA<213>水母(Aequorea victoria)<220>
<221>CDS<222>(1)..(717)<400>9atg tct aaa ggt gaa gaa tta ttc act ggt gtt gtc cca att ttg gtt 48Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val1 5 10 15gaa tta gat ggt gat gtt aat ggt cac aaa ttt tct gtc tcc ggt gaa 96Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu20 25 30ggt gaa ggt gat gct act tac ggt aaa ttg acc tta aaa ttt att tgt144Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys35 40 45act act ggt aaa ttg cca gtt cca tgg cca acc tta gtc act act ttc192Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe50 55 60ggt tat ggt gtt caa tgt ttt gct aga tac cea gat cat atg aaa caa240Gly Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln65 70 75 80cat gac ttt ttc aag tct gcc atg cca gaa ggt tat gtt caa gaa aga288His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg85 90 95act att ttt ttc aaa gat gac ggt aac tac aag acc aga gct gaa gtc336Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val
100 105 110aag ttt gaa ggt gat acc tta gtt aat aga atc gaa tta aaa ggt att384Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile115 120 125gat ttt aaa gaa gat ggt aac att tta ggt cac aaa ttg gaa tac aac432Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn130 135 140tat aac tct cac aat gtt tac atc atg gct gac aaa caa aag aat ggt480Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly145 150 155 160atc aaa gtt aac ttc aaa att aga cac aac att gaa gat ggt tct gtt528Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val165 170 175caa tta gct gac cat tat caa caa aat act cca att ggt gat ggt cca576Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro180 185 190gtc ttg tta cca gac aac cat tac tta tcc act caa tct gcc tta tcc624Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser195 200 205aaa gat cca aac gaa aag aga gac cac atg gtc ttg tta gaa ttt gtt672Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val210 215 220act gct gct ggt att acc cat ggt atg gat gaa ttg tac aaa taa717Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys225 230 235<210>10<211>238<212>PRT<213>水母(Aequorea victoria)<400>10Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val1 5 10 15Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu20 25 30Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys35 40 45Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Phe50 55 60Gly Tyr Gly Val Gln Cys Phe Ala Arg Tyr Pro Asp His Met Lys Gln65 70 75 80
His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg85 90 95Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val100 105 110Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile115 120 125Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn130 135 140Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly145 150 155 160Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val165 170 175Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro180 185 190Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser195 200 205Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val210 215 220Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys225 230 235<210>11<211>33<212>DNA<213>人工序列(Artificial)<220>
<223>引物P1<400>11aaactgcaga tgtctaaagg tgaagaatta ttc 33<210>12<211>29<212>DNA<213>人工序列(Artificial)<220>
<223>引物P2<400>12
ccggaattct ttgtacaatt catccatac 29<210>13<211>45<212>DNA<213>人工序列(Artificial)<220>
<223>引物P3<400>13ccggaattcc tggtccccag aggctctatg gaccctgatg agttg 45<210>14<211>49<212>DNA<213>人工序列(Artificial)<220>
<223>引物P4<400>14cattagcggc cgccctaggc tactacaact tggagtcctg ctgagcgtt 49<210>15<211>1608<212>DNA<213>人(human)<220>
<221>CDS<222>(1)..(1608)<400>15atg ggt agc aac aag agc aag ccc aag gat gcc agc cag cgg cgc cgc48Met Gly Ser Asn Lys Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg1 5 10 15agc ctg gag ccc gcc gag aac gtg cac ggc gct ggc ggg ggc gct ttc96Ser Leu Glu Pro Ala Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe20 25 30
ccc gcc tcg cag acc ccc agc aag cca gcc tcg gcc gac ggc cac cgc144Pro Ala Ser Gln Thr Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg35 40 45ggc ccc agc gcg gcc ttc gcc ccc gcg gcc gcc gag ccc aag ctg ttc192Gly Pro Ser Ala Ala Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe50 55 60gga ggc ttc aac tcc tcg gac acc gtc acc tcc ccg cag agg gcg ggc240Gly Gly Phe Asn Ser Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly65 70 75 80ccg ctg gcc ggt gga gtg acc acc ttt gtg gcc ctc tat gac tat gag288Pro Leu Ala Gly Gly Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu85 90 95tct agg acg gag aca gac ctg tcc ttc aag aaa ggc gag cgg ctc cag336Ser Arg Thr Glu Thr Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln100 105 110att gtc aac aac aca gag gga gac tgg tgg ctg gcc cac tcg ctc agc384Ile Val Asn Asn Thr Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser115 120 125aca gga cag aca ggc tac atc ccc agc aac tac gtg gcg ccc tcc gac432Thr Gly Gln Thr Gly Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp130 135 140tcc atc cag gct gag gag tgg tat ttt ggc aag atc acc aga cgg gag480Ser Ile Gln Ala Glu Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu145 150 155 160tca gag cgg tta ctg ctc aat gca gag aac ccg aga ggg acc ttc ctc528Ser Glu Arg Leu Leu Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu165 170 175gtg cga gaa agt gag acc acg aaa ggt gcc tac tgc ctc tca gtg tct576Val Arg Glu Ser Glu Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser180 185 190gac ttc gac aac gcc aag ggc ctc aac gtg aag cac tac aag atc cgc624Asp Phe Asp Asn Ala Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg195 200 205aag ctg gac agc ggc ggc ttc tac atc acc tcc cgc acc cag ttc aac672Lys Leu Asp Ser Gly Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn210 215 220agc ctg cag cag ctg gtg gcc tac tac tcc aaa cac gcc gat ggc ctg720Ser Leu Gln Gln Leu Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu225 230 235 240tgc cac cgc ctc acc acc gtg tgc ccc acg tcc aag ccg cag act cag768Cys His Arg Leu Thr Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln245 250 255
ggc ctg gcc aag gat gcc tgg gag atc cct cgg gag tcg ctg cgg ctg 816Gly Leu Ala Lys Asp Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu260 265 270gag gtc aag ctg ggc cag ggc tgc ttt ggc gag gtg tgg atg ggg acc 864Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr275 280 285tgg aac ggt acc acc agg gtg gcc atc aaa acc ctg aag cct ggc acg 912Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr290 295 300atg tct cca gag gcc ttc ctg cag gag gcc cag gtc atg aag aag ctg 960Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu305 310 315 320agg cat gag aag ctg gtg cag ttg tat gct gtg gtt tca gag gag ccc1008Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro325 330 335att tac atc gtc acg gag tac atg agc aag ggg agt ttg ctg gac ttt1056Ile Tyr Ile Val Thr Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe340 345 350ctc aag ggg gag aca ggc aag tac ctg cgg ctg cct cag ctg gtg gac1104Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp355 360 365atg gct gct cag atc gcc tca ggc atg gcg tac gtg gag cgg atg aac1152Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn370 375 380tac gtc cac cgg gac ctt cgt gca gcc aac atc ctg gtg gga gag aac1200Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn385 390 395 400ctg gtg tgc aaa gtg gcc gac ttt ggg ctg gct cgg ctc att gaa gac1248Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp405 410 415aat gag tac acg gcg cgg caa ggt gcc aaa ttc ccc atc aag tgg acg1296Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr420 425 430gct cca gaa gct gcc ctc tat ggc cgc ttc acc atc aag tcg gac gtg1344Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val435 440 445tgg tcc ttc ggg atc ctg ctg act gag ctc acc aca aag gga cgg gtg1392Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val450 455 460ccc tac cct ggg atg gtg aac cgc gag gtg ctg gac cag gtg gag cgg1440Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg465 470 475 480
ggc tac cgg atg ccc tgc ccg ccg gag tgt ccc gag tcc ctg cac gac1488Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp485 490 495ctc atg tgc cag tgc tgg cgg aag gag cct gag gag cgg ccc acc ttc1536Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe500 505 510gag tac ctg cag gcc ttc ctg gag gac tac ttc acg tcc acc gag ccc1584Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro515 520 525cag tac cag ccc ggg gag aac ctc1608Gln Tyr Gln Pro Gly Glu Asn Leu530 535<210>16<211>536<212>PRT<213>人(human)<400>16Met Gly Ser Asn Lys Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg1 5 10 15Ser Leu Glu Pro Ala Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe20 25 30Pro Ala Ser Gln Thr Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg35 40 45Gly Pro Ser Ala Ala Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe50 55 60Gly Gly Phe Asn Ser Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly65 70 75 80Pro Leu Ala Gly Gly Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu85 90 95Ser Arg Thr Glu Thr Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln100 105 110Ile Val Asn Asn Thr Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser115 120 125Thr Gly Gln Thr Gly Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp130 135 140Ser Ile Gln Ala Glu Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu145 150 155 160Ser Glu Arg Leu Leu Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu165 170 175
Val Arg Glu Ser Glu Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser180 185 190Asp Phe Asp Asn Ala Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg195 200 205Lys Leu Asp Ser Gly Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn210 215 220Ser Leu Gln Gln Leu Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu225 230 235 240Cys His Arg Leu Thr Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln245 250 255Gly Leu Ala Lys Asp Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu260 265 270Glu Val Lys Leu Gly Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr275 280 285Trp Asn Gly Thr Thr Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr290 295 300Met Ser Pro Glu Ala Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu305 310 315 320Arg His Glu Lys Leu Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro325 330 335Ile Tyr Ile Val Thr Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe340 345 350Leu Lys Gly Glu Thr Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp355 360 365Met Ala Ala Gln Ile Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn370 375 380Tyr Val His Arg Asp Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn385 390 395 400Leu Val Cys Lys Val Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp405 410 415Asn Glu Tyr Thr Ala Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr420 425 430Ala Pro Glu Ala Ala Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val435 440 445Trp Ser Phe Gly Ile Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val450 455 460Pro Tyr Pro Gly Met Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg465 470 475 480Gly Tyr Arg Met Pro Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp485 490 495Leu Met Cys Gln Cys Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe500 505 510
Glu Tyr Leu Gln Ala Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro515 520 525Gln Tyr Gln Pro Gly Glu Asn Leu530 535<210>17<211>1641<212>DNA<213>人工序列(Artificial)<220>
<223>含毕赤酵母过氧化物酶体定位信号RLNNLATQL的酪氨酸激酶Src的核苷酸序列<220>
<221>transit_peptide<222>(7)..(33)<400>17atggctagat tgaacaactt ggctactcaa ttgatgggta gcaacaagag caagcccaag 60gatgccagcc agcggcgccg cagcctggag cccgccgaga acgtgcacgg cgctggcggg120ggcgctttcc ccgcctcgca gacccccagc aagccagcct cggccgacgg ccaccgcggc180cccagcgcgg ccttcgcccc cgcggccgcc gagcccaagc tgttcggagg cttcaactcc240tcggacaccg tcacctcccc gcagagggcg ggcccgctgg ccggtggagt gaccaccttt300gtggccctct atgactatga gtctaggacg gagacagacc tgtccttcaa gaaaggcgag360cggctccaga ttgtcaacaa cacagaggga gactggtggc tggcccactc gctcagcaca420ggacagacag gctacatccc cagcaactac gtggcgccct ccgactccat ccaggctgag480gagtggtatt ttggcaagat caccagacgg gagtcagagc ggttactgct caatgcagag540aacccgagag ggaccttcct cgtgcgagaa agtgagacca cgaaaggtgc ctactgcctc600tcagtgtctg acttcgacaa cgccaagggc ctcaacgtga agcactacaa gatccgcaag660ctggacagcg gcggcttcta catcacctcc cgcacccagt tcaacagcct gcagcagctg720gtggcctact actccaaaca cgccgatggc ctgtgccacc gcctcaccac cgtgtgcccc780acgtccaagc cgcagactca gggcctggcc aaggatgcct gggagatccc tcgggagtcg840ctgcggctgg aggtcaagct gggccagggc tgctttggcg aggtgtggat ggggacctgg900aacggtacca ccagggtggc catcaaaacc ctgaagcctg gcacgatgtc tccagaggcc960ttcctgcagg aggcccaggt catgaagaag ctgaggcatg agaagctggt gcagttgtat 1020gctgtggttt cagaggagcc catttacatc gtcacggagt acatgagcaa ggggagtttg 1080ctggactttc tcaaggggga gacaggcaag tacctgcggc tgcctcagct ggtggacatg 1140gctgctcaga tcgcctcagg catggcgtac gtggagcgga tgaactacgt ccaccgggac 1200cttcgtgcag ccaacatcct ggtgggagag aacctggtgt gcaaagtggc cgactttggg 1260ctggctcggc tcattgaaga caatgagtac acggcgcggc aaggtgccaa attccccatc 1320aagtggacgg ctccagaagc tgccctctat ggccgcttca ccatcaagtc ggacgtgtgg 1380
tccttcggga tcctgctgac tgagctcacc acaaagggac gggtgcccta ccctgggatg1440gtgaaccgcg aggtgctgga ccaggtggag cggggctacc ggatgccctg cccgccggag1500tgtcccgagt ccctgcacga cctcatgtgc cagtgctggc ggaaggagcc tgaggagcgg1560cccaccttcg agtacctgca ggccttcctg gaggactact tcacgtccac cgagccccag1620taccagcccg gggagaacct c 1641<210>18<211>2337<212>DNA<213>人工序列(Artificial)<220>
<223>含RLNNLATQL、Src、肠激酶酶切位点、GST-tag的融合蛋白的核苷酸序列<220>
<221>CDS<222>(1)..(2337)<400>18atg gct aga ttg aac aac ttg gct act caa ttg atg ggt agc aac aag 48Met Ala Arg Leu Asn Asn Leu Ala Thr Gln Leu Met Gly Ser Asn Lys1 5 10 15agc aag ccc aag gat gcc agc cag cgg cgc cgc agc ctg gag ccc gcc 96Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg Ser Leu Glu Pro Ala20 25 30gag aac gtg cac ggc gct ggc ggg ggc gct ttc ccc gcc tcg cag acc144Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe Pro Ala Ser Gln Thr35 40 45ccc agc aag cca gcc tcg gcc gac ggc cac cgc ggc ccc agc gcg gcc192Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg Gly Pro Ser Ala Ala50 55 60ttc gcc ccc gcg gcc gcc gag ccc aag ctg ttc gga ggc ttc aac tcc240Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe Gly Gly Phe Asn Ser65 70 75 80tcg gac acc gtc acc tcc ccg cag agg gcg ggc ccg ctg gcc ggt gga288Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly Pro Leu Ala Gly Gly85 90 95gtg acc acc ttt gtg gcc ctc tat gac tat gag tct agg acg gag aca336Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu Ser Arg Thr Glu Thr100 105 110gac ctg tcc ttc aag aaa ggc gag cgg ctc cag att gtc aac aac aca384Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln Ile Val Asn Asn Thr115 120 125
gag gga gac tgg tgg ctg gcc cac tcg ctc agc aca gga cag aca ggc432Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser Thr Gly Gln Thr Gly130 135 140tac atc ccc agc aac tac gtg gcg ccc tcc gac tcc atc cag gct gag480Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp Ser Ile Gln Ala Glu145 150 155 160gag tgg tat ttt ggc aag atc acc aga cgg gag tca gag cgg tta ctg528Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu Ser Glu Arg Leu Leu165 170 175ctc aat gca gag aac ccg aga ggg acc ttc ctc gtg cga gaa agt gag576Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu Val Arg Glu Ser Glu180 185 190acc acg aaa ggt gcc tac tgc ctc tca gtg tct gac ttc gac aac gcc624Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser Asp Phe Asp Asn Ala195 200 205aag ggc ctc aac gtg aag cac tac aag atc cgc aag ctg gac agc ggc672Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg Lys Leu Asp Ser Gly210 215 220ggc ttc tac atc acc tcc cgc acc cag ttc aac agc ctg cag cag ctg720Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn Ser Leu Gln Gln Leu225 230 235 240gtg gcc tac tac tcc aaa cac gcc gat ggc ctg tgc cac cgc ctc acc768Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu Cys His Arg Leu Thr245 250 255acc gtg tgc ccc acg tcc aag ccg cag act cag ggc ctg gcc aag gat816Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln Gly Leu Ala Lys Asp260 265 270gcc tgg gag atc cct cgg gag tcg ctg cgg ctg gag gtc aag ctg ggc864Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu Glu Val Lys Leu Gly275 280 285cag ggc tgc ttt ggc gag gtg tgg atg ggg acc tgg aac ggt acc acc912Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr Trp Asn Gly Thr Thr290 295 300agg gtg gcc atc aaa acc ctg aag cct ggc acg atg tct cca gag gcc960Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr Met Ser Pro Glu Ala305 310 315 320ttc ctg cag gag gcc cag gtc atg aag aag ctg agg cat gag aag ctg 1008Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu Arg His Glu Lys Leu325 330 335gtg cag ttg tat gct gtg gtt tca gag gag ccc att tac atc gtc acg 1056Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro Ile Tyr Ile Val Thr340 345 350
gag tac atg agc aag ggg agt ttg ctg gac ttt ctc aag ggg gag aca1104Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe Leu Lys Gly Glu Thr355 360 365ggc aag tac ctg cgg ctg cct cag ctg gtg gac atg gct gct cag atc1152Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp Met Ala Ala Gln Ile370 375 380gcc tca ggc atg gcg tac gtg gag cgg atg aac tac gtc cac cgg gac1200Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn Tyr Val His Arg Asp385 390 395 400ctt cgt gca gcc aac atc ctg gtg gga gag aac ctg gtg tgc aaa gtg1248Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn Leu Val Cys Lys Val405 410 415gcc gac ttt ggg ctg gct cgg ctc att gaa gac aat gag tac acg gcg1296Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp Asn Glu Tyr Thr Ala420 425 430cgg caa ggt gcc aaa ttc ccc atc aag tgg acg gct cca gaa gct gcc1344Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr Ala Pro Glu Ala Ala435 440 445ctc tat ggc cgc ttc acc atc aag tcg gac gtg tgg tcc ttc ggg atc1392Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val Trp Ser Phe Gly Ile450 455 460ctg ctg act gag ctc acc aca aag gga cgg gtg ccc tac cct ggg atg1440Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val Pro Tyr Pro Gly Met465 470 475 480gtg aac cgc gag gtg ctg gac cag gtg gag cgg ggc tac cgg atg ccc1488Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg Gly Tyr Arg Met Pro485 490 495tgc ccg ccg gag tgt ccc gag tcc ctg cac gac ctc atg tgc cag tgc1536Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp Leu Met Cys Gln Cys500 505 510tgg cgg aag gag cct gag gag cgg ccc acc ttc gag tac ctg cag gcc1584Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe Glu Tyr Leu Gln Ala515 520 525ttc ctg gag gac tac ttc acg tcc acc gag ccc cag tac cag ccc ggg1632Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro Gln Tyr Gln Pro Gly530 535 540gag aac ctc gat gac gac gac aag gaa ttc tcc cct ata cta ggt tat1680Glu Asn Leu Asp Asp Asp Asp Lys Glu Phe Ser Pro Ile Leu Gly Tyr545 550 555 560tgg aaa att aag ggc ctt gtg caa ccc act cga ctt ctt ttg gaa tat1728Trp Lys Ile Lys Gly Leu Val Gln Pro Thr Arg Leu Leu Leu Glu Tyr565 570 575
ctt gaa gaa aaa tat gaa gag cat ttg tat gag cgc gat gaa ggt gat1776Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr Glu Arg Asp Glu Gly Asp580 585 590aaa tgg cga aac aaa aag ttt gaa ttg ggt ttg gag ttt ccc aat ctt1824Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly Leu Glu Phe Pro Asn Leu595 600 605cct tat tat att gat ggt gat gtt aaa tta aca cag tct atg gcc atc1872Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu Thr Gln Ser Met Ala Ile610 615 620ata cgt tat ata gct gac aag cac aac atg ttg ggt ggt tgt cca aaa1920Ile Arg Tyr Ile Ala Asp Lys His Asn Met Leu Gly Gly Cys Pro Lys625 630 635 640gag cgt gca gag att tca atg ctt gaa gga gcg gtt ttg gat att aga1968Glu Arg Ala Glu Ile Ser Met Leu Glu Gly Ala Val Leu Asp Ile Arg645 650 655tac ggt gtt tcg aga att gca tat agt aaa gac ttt gaa act ctc aaa2016Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys Asp Phe Glu Thr Leu Lys660 665 670gtt gat ttt ctt agc aag cta cct gaa atg ctg aaa atg ttc gaa gat2064Val Asp Phe Leu Ser Lys Leu Pro Glu Met Leu Lys Met Phe Glu Asp675 680 685cgt tta tgt cat aaa aca tat tta aat ggt gat cat gta acc cat cct2112Arg Leu Cys His Lys Thr Tyr Leu Asn Gly Asp His Val Thr His Pro690 695 700gac ttc atg ttg tat gac gct ctt gat gtt gtt tta tac atg gac cca2160Asp Phe Met Leu Tyr Asp Ala Leu Asp Val Val Leu Tyr Met Asp Pro705 710 715 720atg tgc ctg gat gcg ttc cca aaa tta gtt tgt ttt aaa aaa cgt att2208Met Cys Leu Asp Ala Phe Pro Lys Leu Val Cys Phe Lys Lys Arg Ile725 730 735gaa gct atc cca caa att gat aag tac ttg aaa tcc agc aag tat ata2256Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu Lys Ser Ser Lys Tyr Ile740 745 750gca tgg cct ttg cag ggc tgg caa gcc acg ttt ggt ggt ggc gac cat2304Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr Phe Gly Gly Gly Asp His755 760 765cct cca aaa tcg gat ctg gtt ccg cgt tag tag2337Pro Pro Lys Ser Asp Leu Val Pro Arg770 775<210>19<211>777
<212>PRT<213>人工序列(Artificial)<220>
<223>Synthetic Construct<400>19Met Ala Arg Leu Asn Asn Leu Ala Thr Gln Leu Met Gly Ser Asn Lys1 5 10 15Ser Lys Pro Lys Asp Ala Ser Gln Arg Arg Arg Ser Leu Glu Pro Ala20 25 30Glu Asn Val His Gly Ala Gly Gly Gly Ala Phe Pro Ala Ser Gln Thr35 40 45Pro Ser Lys Pro Ala Ser Ala Asp Gly His Arg Gly Pro Ser Ala Ala50 55 60Phe Ala Pro Ala Ala Ala Glu Pro Lys Leu Phe Gly Gly Phe Asn Ser65 70 75 80Ser Asp Thr Val Thr Ser Pro Gln Arg Ala Gly Pro Leu Ala Gly Gly85 90 95Val Thr Thr Phe Val Ala Leu Tyr Asp Tyr Glu Ser Arg Thr Glu Thr100 105 110Asp Leu Ser Phe Lys Lys Gly Glu Arg Leu Gln Ile Val Asn Asn Thr115 120 125Glu Gly Asp Trp Trp Leu Ala His Ser Leu Ser Thr Gly Gln Thr Gly130 135 140Tyr Ile Pro Ser Asn Tyr Val Ala Pro Ser Asp Ser Ile Gln Ala Glu145 150 155 160Glu Trp Tyr Phe Gly Lys Ile Thr Arg Arg Glu Ser Glu Arg Leu Leu165 170 175Leu Asn Ala Glu Asn Pro Arg Gly Thr Phe Leu Val Arg Glu Ser Glu180 185 190Thr Thr Lys Gly Ala Tyr Cys Leu Ser Val Ser Asp Phe Asp Asn Ala195 200 205Lys Gly Leu Asn Val Lys His Tyr Lys Ile Arg Lys Leu Asp Ser Gly210 215 220Gly Phe Tyr Ile Thr Ser Arg Thr Gln Phe Asn Ser Leu Gln Gln Leu225 230 235 240Val Ala Tyr Tyr Ser Lys His Ala Asp Gly Leu Cys His Arg Leu Thr245 250 255Thr Val Cys Pro Thr Ser Lys Pro Gln Thr Gln Gly Leu Ala Lys Asp260 265 270Ala Trp Glu Ile Pro Arg Glu Ser Leu Arg Leu Glu Val Lys Leu Gly275 280 285
Gln Gly Cys Phe Gly Glu Val Trp Met Gly Thr Trp Asn Gly Thr Thr290 295 300Arg Val Ala Ile Lys Thr Leu Lys Pro Gly Thr Met Ser Pro Glu Ala305 310 315 320Phe Leu Gln Glu Ala Gln Val Met Lys Lys Leu Arg His Glu Lys Leu325 330 335Val Gln Leu Tyr Ala Val Val Ser Glu Glu Pro Ile Tyr Ile Val Thr340 345 350Glu Tyr Met Ser Lys Gly Ser Leu Leu Asp Phe Leu Lys Gly Glu Thr355 360 365Gly Lys Tyr Leu Arg Leu Pro Gln Leu Val Asp Met Ala Ala Gln Ile370 375 380Ala Ser Gly Met Ala Tyr Val Glu Arg Met Asn Tyr Val His Arg Asp385 390 395 400Leu Arg Ala Ala Asn Ile Leu Val Gly Glu Asn Leu Val Cys Lys Val405 410 415Ala Asp Phe Gly Leu Ala Arg Leu Ile Glu Asp Asn Glu Tyr Thr Ala420 425 430Arg Gln Gly Ala Lys Phe Pro Ile Lys Trp Thr Ala Pro Glu Ala Ala435 440 445Leu Tyr Gly Arg Phe Thr Ile Lys Ser Asp Val Trp Ser Phe Gly Ile450 455 460Leu Leu Thr Glu Leu Thr Thr Lys Gly Arg Val Pro Tyr Pro Gly Met465 470 475 480Val Asn Arg Glu Val Leu Asp Gln Val Glu Arg Gly Tyr Arg Met Pro485 490 495Cys Pro Pro Glu Cys Pro Glu Ser Leu His Asp Leu Met Cys Gln Cys500 505 510Trp Arg Lys Glu Pro Glu Glu Arg Pro Thr Phe Glu Tyr Leu Gln Ala515 520 525Phe Leu Glu Asp Tyr Phe Thr Ser Thr Glu Pro Gln Tyr Gln Pro Gly530 535 540Glu Asn Leu Asp Asp Asp Asp Lys Glu Phe Ser Pro Ile Leu Gly Tyr545 550 555 560Trp Lys Ile Lys Gly Leu Val Gln Pro Thr Arg Leu Leu Leu Glu Tyr565 570 575Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr Glu Arg Asp Glu Gly Asp580 585 590Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly Leu Glu Phe Pro Asn Leu595 600 605Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu Thr Gln Ser Met Ala Ile610 615 620
Ile Arg Tyr Ile Ala Asp Lys His Asn Met Leu Gly Gly Cys Pro Lys625 630 635 640Glu Arg Ala Glu Ile Ser Met Leu Glu Gly Ala Val Leu Asp Ile Arg645 650 655Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys Asp Phe Glu Thr Leu Lys660 665 670Val Asp Phe Leu Ser Lys Leu Pro Glu Met Leu Lys Met Phe Glu Asp675 680 685Arg Leu Cys His Lys Thr Tyr Leu Asn Gly Asp His Val Thr His Pro690 695 700Asp Phe Met Leu Tyr Asp Ala Leu Asp Val Val Leu Tyr Met Asp Pro705 710 715 720Met Cys Leu Asp Ala Phe Pro Lys Leu Val Cys Phe Lys Lys Arg Ile725 730 735Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu Lys Ser Ser Lys Tyr Ile740 745 750Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr Phe Gly Gly Gly Asp His755 760 765Pro Pro Lys Ser Asp Leu Val Pro Arg770 775<210>20<211>669<212>DNA<213>人(human)<220>
<221>CDS<222>(1)..(669)<400>20tcc cct ata cta ggt tat tgg aaa att aag ggc ctt gtg caa ccc act48Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro Thr1 5 10 15cga ctt ctt ttg gaa tat ctt gaa gaa aaa tat gaa gag cat ttg tat96Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr20 25 30gag cgc gat gaa ggt gat aaa tgg cga aac aaa aag ttt gaa ttg ggt144Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly35 40 45ttg gag ttt ccc aat ctt cct tat tat att gat ggt gat gtt aaa tta192Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu50 55 60
aca cag tct atg gcc atc ata cgt tat ata gct gac aag cac aac atg240Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn Met65 70 75 80ttg ggt ggt tgt cca aaa gag cgt gca gag att tca atg ctt gaa gga288Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu Gly85 90 95gcg gtt ttg gat att aga tac ggt gtt tcg aga att gca tat agt aaa336Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys100 105 110gac ttt gaa act ctc aaa gtt gat ttt ctt agc aag cta cct gaa atg384Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu Met115 120 125ctg aaa atg ttc gaa gat cgt tta tgt cat aaa aca tat tta aat ggt432Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn Gly130 135 140gat cat gta acc cat cct gac ttc atg ttg tat gac gct ctt gat gtt480Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp Val145 150 155 160gtt tta tac atg gac cca atg tgc ctg gat gcg ttc cca aaa tta gtt528Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu Val165 170 175tgt ttt aaa aaa cgt att gaa gct atc cca caa att gat aag tac ttg576Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu180 185 190aaa tcc agc aag tat ata gca tgg cct ttg cag ggc tgg caa gcc acg624Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr195 200 205ttt ggt ggt ggc gac cat cct cca aaa tcg gat ctg gtt ccg cgt669Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg210 215 220<210>21<211>223<212>PRT<213>人(human)<400>21Ser Pro Ile Leu Gly Tyr Trp Lys Ile Lys Gly Leu Val Gln Pro Thr1 5 10 15Arg Leu Leu Leu Glu Tyr Leu Glu Glu Lys Tyr Glu Glu His Leu Tyr20 25 30
Glu Arg Asp Glu Gly Asp Lys Trp Arg Asn Lys Lys Phe Glu Leu Gly35 40 45Leu Glu Phe Pro Asn Leu Pro Tyr Tyr Ile Asp Gly Asp Val Lys Leu50 55 60Thr Gln Ser Met Ala Ile Ile Arg Tyr Ile Ala Asp Lys His Asn Met65 70 75 80Leu Gly Gly Cys Pro Lys Glu Arg Ala Glu Ile Ser Met Leu Glu Gly85 90 95Ala Val Leu Asp Ile Arg Tyr Gly Val Ser Arg Ile Ala Tyr Ser Lys100 105 110Asp Phe Glu Thr Leu Lys Val Asp Phe Leu Ser Lys Leu Pro Glu Met115 120 125Leu Lys Met Phe Glu Asp Arg Leu Cys His Lys Thr Tyr Leu Asn Gly130 135 140Asp His Val Thr His Pro Asp Phe Met Leu Tyr Asp Ala Leu Asp Val145 150 155 160Val Leu Tyr Met Asp Pro Met Cys Leu Asp Ala Phe Pro Lys Leu Val165 170 175Cys Phe Lys Lys Arg Ile Glu Ala Ile Pro Gln Ile Asp Lys Tyr Leu180 185 190Lys Ser Ser Lys Tyr Ile Ala Trp Pro Leu Gln Gly Trp Gln Ala Thr195 200 205Phe Gly Gly Gly Asp His Pro Pro Lys Ser Asp Leu Val Pro Arg210 215 220<210>22<211>60<212>DNA<213>人工序列(Artificial)<220>
<223>引物P5<400>22ctgtacgtaa tggctagatt gaacaacttg gctactcaat tgatgggtag caacaagagc60<210>23<211>45<212>DNA<213>人工序列(Artificial)
<220>
<223>引物P6<400>23cgagaattcc ttgtcgtcgt catcgaggtt ctccccgggc tggta 45<210>24<211>30<212>DNA<213>人工序列(Artificial)<220>
<223>引物P7<400>24ccggaattct cccctatact aggttattgg 30<210>25<211>36<212>DNA<213>人工序列(Artificial)<220>
<223>引物P8<400>25caacctaggc tactaacgcg gaaccagatc cgattt3权利要求
1.一种在毕赤酵母(Pichia pastoris)细胞器中表达的重组酪氨酸激酶,其具有下列结构通式PTS2-酪氨酸激酶,或酪氨酸激酶-PTS1,其中,PTS1和PTS2代表可使激酶蛋白定向输送到毕赤酵母过氧化物酶体的定位信号,PTS1具有下列结构式S/A/C-K/H/R-L/M的氨基酸序列的三肽;PTS2是具有下列结构式R/K-L/I/V-X5-H/Q-L/A的氨基酸序列的九肽,其中X5代表任意5个氨基酸。
2.如权利要求1所述的重组酪氨酸激酶,其特征在于所述酪氨酸激酶选自受体型酪氨酸激酶EGFR、PDGFR、FGFR和KDR,以及非受体型酪氨酸激酶Src、ABL和FAK。
3.如权利要求2所述的重组酪氨酸激酶,其特征在于PTS1的氨基酸序列为SKL,该酪氨酸激酶为KDR,该重组酪氨酸激酶的氨基酸序列如序列表中SEQ ID No.7中第261-629位氨基酸序列所示。
4.如权利要求3所述的重组酪氨酸激酶的cDNA,其是下列核苷酸序列之一1)其具有序列表中SEQ ID No.4所示的碱基序列;2)其具有序列表中SEQ ID No.5所示的碱基序列;3)编码由序列表中SEQ ID No.7所示的氨基酸序列中第261-629位氨基酸组成的蛋白质。
5.如权利要求2所述的重组酪氨酸激酶,其特征在于PTS2的氨基酸序列为RLNNLATQL,该酪氨酸激酶为非受体型酪氨酸激酶Src,该重组酪氨酸激酶的氨基酸序列如序列表中SEQ ID No.19的全部或第3-547位氨基酸序列所示。
6.如权利要求5所述的重组酪氨酸激酶的cDNA,其是下列核苷酸序列之一1)其具有序列表中SEQ ID No.17所示的全部或第7-1641位的碱基序列;2)编码由序列表中SEQ ID No.19所示的全部或第3-547位氨基酸组成的蛋白质。
7.一种如权利要求1~3和5任一项所述的重组酪氨酸激酶的衍生融合蛋白,其为标记蛋白与酪氨酸激酶的融合蛋白。
8.如权利要求7所述的衍生融合蛋白,其特征在于所述的标记蛋白选自绿色、黄色和红色荧光蛋白。
9.如权利要求7所述的衍生融合蛋白,其特征在于标记蛋白与酪氨酸激酶之间含有蛋白酶酶切位点,所述蛋白酶酶切位点选自凝血酶位点、肠激酶位点、Xa因子位点和HRV 3C位点。
10.如权利要求9所述的衍生融合蛋白,其特征在于该标记蛋白为绿色荧光蛋白、该酶切位点为凝血酶位点,该衍生融合蛋白具有序列表中SEQ IDNo.7所示的第15-629位氨基酸序列,编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.6中的第43-1887位核苷酸序列所示。
11.如权利要求7所述的衍生融合蛋白,其特征在于该融合蛋白还包括纯化标签蛋白或肽,该纯化标签蛋白或肽选自His-tag、GST Tag、S Tag、T7Tag和CBD Tag。
12.如权利要求11所述的衍生融合蛋白,其特征在于该纯化标签蛋白或肽为His-tag,所述的衍生融合蛋白具有序列表中SEQ ID No.7所示的全部或第3-629位氨基酸序列,编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.6的全部或第7-1887位碱基序列所示。
13.一种如权利要求1~2和5所述的重组酪氨酸激酶的衍生融合蛋白,其为纯化标签蛋白或肽与酪氨酸激酶的融合蛋白。
14.如权利要求13所述的衍生融合蛋白,其特征在于所述的纯化标签蛋白或肽选自His-tag、GST Tag、S Tag、T7 Tag和CBD Tag。
15.如权利要求13所述的衍生融合蛋白,其特征在于纯化标签蛋白或肽与酪氨酸激酶之间含有蛋白酶酶切位点,所述蛋白酶酶切位点选自凝血酶位点、肠激酶位点、Xa因子位点和HRV 3C位点。
16.如权利要求15所述的衍生融合蛋白,其特征在于该纯化标签蛋白或肽为GST-tag、该酶切位点为肠激酶位点,该衍生融合蛋白具有序列表中SEQ ID No.19所示的全部或第3-777位氨基酸序列,编码该衍生融合蛋白的cDNA核苷酸序列如序列表中SEQ ID No.18的全部或第7-2331位碱基序列所示。
17.一种重组表达载体,其包括下列核苷酸序列之一1)如权利要求4所述的重组酪氨酸激酶的cDNA核苷酸序列;2)如权利要求6所述的重组酪氨酸激酶的cDNA核苷酸序列;3)如权利要求10所述的衍生融合蛋白的cDNA核苷酸序列;4)如权利要求12所述的衍生融合蛋白的cDNA核苷酸序列;5)如权利要求16所述的衍生融合蛋白的cDNA核苷酸序列。
18.如权利要求17所述的重组表达载体,其特征在于该重组表达载体中的表达载体选用适于毕赤酵母的pPIC衍生质粒pPIC3.5K、pPIC9K,或它们的衍生物。
19.一种含有权利要求17或18所述的重组表达载体的真核表达宿主,其为毕赤酵母(Pichia pastoris)。
20.如权利要求19所述的真核表达宿主,其特征在于所述的毕赤酵母为毕赤酵母(Pichia pastoris)GS115或KM71菌株。
21.一种如权利要求1~3及5任一项所述的重组酪氨酸激酶的制备方法,其包括下列步骤在酪氨酸激酶基因的C端或N端连接上可使激酶蛋白定向输送到毕赤酵母过氧化物酶体的定位信号PTS1或PTS2的核苷酸序列,构成编码在毕赤酵母细胞器过氧化物酶体中表达的重组酪氨酸激酶的cDNA,将该cDNA克隆至表达载体构建重组表达载体,再将所述重组表达载体转化宿主细胞毕赤酵母(Pichia pastoris),培养转化体,然后将培养物分离纯化。
22.如权利要求21所述的制备方法,其特征在于所述表达载体选用适于毕赤酵母的pPIC衍生质粒pPIC3.5K、pPIC9K,或它们的衍生物;构成的重组表达载体如权利要求18所述。
23.如权利要求23所述的制备方法,其特征在于所述转化体如权利要求20所述。
全文摘要
本发明公开了一种在毕赤酵母细胞器中表达制备酪氨酸激酶的方法及制备的重组酪氨酸激酶,其具有下列结构通式PTS2-酪氨酸激酶,或酪氨酸激酶-PTS1,其中,PTS1和PTS2代表可使激酶蛋白定向输送到毕赤酵母过氧化物酶体的定位信号,PTS1是具有下列结构式S/A/C-K/H/R-L/M的氨基酸序列;PTS2是具有下列结构式R/K-L/I/V-X
文档编号C07K19/00GK1920015SQ200610030908
公开日2007年2月28日 申请日期2006年9月7日 优先权日2006年9月7日
发明者周祥山, 张元兴, 王雅, 倪振华, 丁健, 林莉萍 申请人:华东理工大学, 中国科学院上海药物研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1