含有富含亮氨酸重复序列的融合蛋白及其制法和应用的制作方法

文档序号:513016阅读:381来源:国知局
含有富含亮氨酸重复序列的融合蛋白及其制法和应用的制作方法
【专利摘要】本发明公开了一种含有富含亮氨酸重复序列的融合蛋白及其制法和应用。具体的,本发明涉及一种融合蛋白,所述的融合蛋白自N端至C端具有以下结构:A—X—E—Y1—Y2式Ia;A—Y2—Y1—E—X式Ib;其中,A为任选的分泌信号肽;X为Slit3蛋白(神经导向因子3)富含亮氨酸的重复序列2(LRRs2)元件;E为酶切位点;Y1为第一标签多肽元件;Y2为第二标签短肽元件,所述第二标签短肽元件为His标签元件;“—”表示连接上述元件的肽键或肽接头。本发明融合蛋白有助于LRR正确折叠,形成有活性的功能多肽,而且可以简便地通过一次酶切就将两种标签元件清除,从而制得高纯度、高活性的LRR序列。
【专利说明】含有富含亮氨酸重复序列的融合蛋白及其制法和应用

【技术领域】
[0001] 本发明涉及生物分子领域,尤其涉及含有富含亮氨酸重复序列的融合蛋白及其制 法和应用。

【背景技术】
[0002] 神经导向因子Slit是一种在进化上高度保守的分泌型细胞外基质糖蛋白,其 基因在1988年发现在中枢神经系统的形成中发挥作用。Slit是一组相对分子质量为 170-190kDa的细胞外分泌蛋白,对轴突生长和神经元迁移起导向作用的轴突定向分子族成 员之一。
[0003] Slit蛋白是作为Roundabout (Robo)的配体发挥多功能的导向分子,它不仅具有 调节神经轴突生长方向、引导神经细胞迁移、影响神经细胞形态分化的功能。近年来的研究 发现,Slit在血管生成、心脏形态发生、肿瘤细胞迁移等多种生理过程中也发挥作用。
[0004] 在脊椎动物中存在3种Slit基因,即Slitl、Slit2、Slit3,并在各种生物组织中 广泛表达。
[0005] S1 i t蛋白的主要结构包括N端的胞外分泌信号肽,4个连续的富含亮氨酸 的重复序列(leucine-rich repeat,LRRs),也被命名为D1-D4结构域,串联的6-9个 EGF (epidermal growth factor)样功能区,一个laminin G样结构域和一个富含半光氨酸 的C末端结构域。
[0006] 为了研究和应用,有必要对Slit蛋白或其片段进行表达和分离纯化。然而,由于 天然蛋白的含量有限,分离困难,因此需要开发高效的重组生产工艺。
[0007] 在重组生产工艺中,高效地生产出构象正确且便于分离和纯化的目的蛋白,常常 是较为困难的。常用的大肠杆菌表达系统虽然可以较高效地表达目的蛋白,但却常常需要 复杂的复性工艺,且复性后的目标蛋白的活性往往难以令人满意。
[0008] 当采用真核表达系统进行表达时,虽然避免了复性工艺,但目标蛋白的正确折叠、 如何实现高表达水平以及如何有效分离目标蛋白仍然是难点,尤其是对于某些短肽或含重 复序列的多肽而言。
[0009] 获得了含目标蛋白的培养液(或发酵产物)后,可采用各种不同的纯化手段进行 分离纯化。目前,一种常用的分离纯化重组蛋白的方法为亲和层析技术。
[0010] 以采用的His标签为例,6XHis是专门设计用于重组蛋白质纯化工作的标签蛋 白,是目前最常见的表达方式,其表达纯化技术都很成熟,而且相对比便宜,它的优点是表 达方便而且基本不影响蛋白的活性。通常带组氨酸蛋白都可以在天然情况下被镍琼脂糖凝 胶或镍NTA琼脂糖凝胶吸附,但是因为His标签非常小,如果在融合蛋白折叠过程中被折叠 到蛋白内部而导致His标签不容易暴露的话,则很难开展蛋白纯化工作;同时His标签确实 还存在特异性不够的问题。
[0011] 通常,使用His标签技术分离所得的蛋白质纯度约为90%左右,而现有技术中,使 蛋白进一步纯化的工艺和步骤都相对较为繁琐,且添加的蛋白或肽段常会对目标蛋白的活 性造成干扰,导致目标蛋白的表达不准确或杂质过多。
[0012] 综上所述,为了简便高效地制备高纯度、高活性的重组蛋白,本领域迫切需要开发 高效简便的生产工艺。


【发明内容】

[0013] 本发明的目的就是提供一种高效简便的生产外源蛋白的方法,从而简便高效地制 备高纯度、高活性的重组蛋白。
[0014] 本发明提供了一种融合蛋白,所述的融合蛋白自N端至C端具有式la或lb所述 的结构:
[0015] A-X-E-Y1-Y2 式 la ;
[0016] A-Y2-Yl-E-X 式 lb ;
[0017] 其中,
[0018] A为任选的分泌信号肽;
[0019] X为Slit3蛋白的富含亮氨酸的重复序列2 (leucine-rich repeat2,LRR2)元件;
[0020] E为酶切位点;
[0021] Y1为第一标签多肽元件;
[0022] Y2为第二标签短肽元件,所述第二标签短肽元件为His标签元件;
[0023] "一,,表示连接上述元件的肽键或肽接头。
[0024] 在另一优选例中,所述的融合蛋白具有位于N端的分泌信号肽。
[0025] 在另一优选例中,所述的分泌信号肽是来自于Slit3的分泌信号肽、或来自于其 他蛋白的分泌信号肽。
[0026] 在另一优选例中,所述的分泌信号肽在其N端具有或不具有起始氨基酸Met。
[0027] 在另一优选例中,所述的第一标签多肽元件的46aa。
[0028] 在另一优选例中,在X和E之间的"一"为肽键。
[0029] 在另一优选例中,在Y1和Y2之间无蛋白酶切位点。
[0030] 在另一优选例中,在Y1和Y2之间的"一"为肽键。
[0031] 在另一优选例中,所述的酶切位点是TEV蛋白酶的酶切位点。
[0032] (LeuGluValLeuPheGlnGlyPro, SEQ ID NO. :3)
[0033] 在另一优选例中,所述的肽接头长度为3-15个氨基酸;较佳地5-10个氨基酸。
[0034] 在另一优选例中,所述的Slit3蛋白来源于哺乳动物。
[0035] 在另一优选例中,所述的Slit3蛋白来源于人、大鼠、小鼠;更佳地,来源于人。
[0036] 在另一优选例中,所述的Y1包括SEQ ID N0. : 2所示的改良型亲和素标签(Strap II标签)、链亲和素(Strepavidin)标签。
[0037] 在另一优选例中,所述的His标签元件包括8 XHis标签元件和6 XHis标签元件。
[0038] 在另一优选例中,所述的Y1为Strap II标签,而Y2为8XHis标签元件。
[0039] 在另一优选例中,所述的S1U3LRR2的氨基酸序列如SEQ ID N0. :5所示。
[0040] 本发明第二方面,提供了一种分离的多核苷酸,所述的多核苷酸编码本发明第一 方面所述的融合蛋白。
[0041] 在另一优选例中,所述的多核苷酸序列如SEQ ID N0. :6所示。
[0042] 本发明第三方面,提供了一种表达载体,所述的表达载体含有本发明第二方面所 述的多核苷酸。
[0043] 在另一优选例中,所述的表达载体包括真核表达载体、原核表达载体。
[0044] 本发明第四方面,提供了一种宿主细胞,所述的宿主细胞含有本发明第三方面所 述的表达载体或转染了本发明第二方面所述的多核苷酸。
[0045] 在另一优选例中,所述的宿主细胞包括哺乳动物细胞;较佳地包括CH0细胞、293 细胞。
[0046] 本发明第五方面,提供了一种制备S1U3LRR2蛋白的方法,所述的方法包括步骤:
[0047] (i)在合适的表达条件下,培养如本发明第四方面所述的宿主细胞,从而表达本发 明第一方面所述的融合蛋白;
[0048] (ii)从培养体系中分离纯化出本发明第一方面所述的融合蛋白;
[0049] (iii)对所述的融合蛋白,用针对元件E的蛋白酶进行酶解,从而制得S1U3LRR2。
[0050] 在另一优选例中,在步骤(ii)中,先用针对Y1元件的亲和层析进行第一次分离; 然后用针对Y2元件的亲和层析进行第二次分离。
[0051] 在另一优选例中,在步骤(iii)中,还包括将S1U3LRR2与多肽E-Y1-Y2或Y2- Y1-E分开,从而制得纯化的S1U3LRR2。
[0052] 本发明第六方面,提供了一种制备S1U3LRR2蛋白的方法,所述的方法包括步骤:
[0053] 对本发明第一方面所述的融合蛋白,用针对元件E的蛋白酶进行酶解,从而制得 Slit3LRR2。
[0054] 本发明第七方面,提供了一种纯化的S1U3LRR2蛋白,是通过本发明第五或第六 方面所述的方法生产制备的。
[0055] 应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具 体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在 此不再一一累述。

【专利附图】

【附图说明】
[0056] 图1为原始的pcDNA3. 1 (_)质粒的图谱;
[0057] 图2显示了实施例1中的真核表达Slit3蛋白的LRR2结构域部分序列的表达质 粒的构建方法的流程图;
[0058] 图3为SI it3蛋白的LRR2结构域部分序列的RT-PCR扩增电泳图;
[0059] 图4为Strap II蛋白标签、His蛋白标签以及TEV酶切位点序列的PCR扩增电泳 图;
[0060] 图5为构建好的pcDNA3. 1 (_)/Slit3LRR2质粒的图谱;
[0061] 图6为Western Blot方法检测构建质粒的蛋白表达图。

【具体实施方式】
[0062] 本发明人经过广泛而深入的研究,首次意外地发现,在LRR序列的一端(尤其是C 端)添加第一标签多肽元件和第二标签短肽元件,不仅有助于LRR正确折叠,形成有活性的 功能多肽,而且可以极其简便地通过一次酶切就将两种标签元件清除,从而制得高纯度、高 活性的LRR序列。在此基础上完成了本发明。
[0063] 术语
[0064] 如本文所用,"本发明蛋白"、"本发明融合蛋白"、"具有式la或lb的融合蛋白"可 互换使用,均指具有式la或lb的融合蛋白,其N端至C端分别含有任选的分泌信号肽、目 标基因、酶切位点、第一标签多肽元件以及第二标签短肽元件;或任选的分泌信号肽、第二 标签短肽元件、第一标签多肽元件、酶切位点以及目标基因。本发明融合蛋白的一个显著特 点是在C端或N端具有可通过酶切去除的连续串联标签元件。此外,应理解,所述术语还包 括重组融合蛋白的活性片段和衍生物。
[0065] 如本文所用,"分离的"是指物质从其原始环境中分离出来(如果是天然的物质, 原始环境即是天然环境)。如活体细胞内的天然状态下的多核苷酸和多肽是没有分离纯化 的,但同样的多核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。 [0066] 如本文所用,术语"标签蛋白"、"标签"、"标签蛋白元件"、"标签元件"可互换使用, 均指可用于分离纯化具有本发明式la或lb的融合蛋白的标签多肽。
[0067] Slit3 蛋白及其 LRR
[0068] Slit3蛋白的全长序列如SEQ ID N0. :15所示,编码其蛋白的核苷酸序列如SEQ ID N0. :14所示。本发明S1U3LRR2蛋白的序列如SEQ ID N0. :5所示,编码其蛋白的核苷 酸序列如SEQ ID N0. :4所示。
[0069] 本发明Slit3蛋白来源于哺乳动物,优选地,来源于人、大鼠、小鼠。
[0070] 如本文所用,"S1U3LRR2蛋白"是指Slit3蛋白的LRR2结构域。
[0071] 如本文所用,"纯化的S1U3LRR2蛋白"是指S1U3LRR2蛋白基本上不含天然与其 相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯 化S1U3LRR2蛋白。基本上纯的蛋白在非还原聚丙烯酰胺凝胶上能产生单一的主带。
[0072] 肽键或肽接头
[0073] 本发明的具有式la或lb的融合蛋白各元件之间可以直接以肽键相连接,或者通 过肽接头连接。作为本发明的一种优选的方式,所述的具有式la或lb的融合蛋白各元件 之间通过肽键之间连接,从而形成融合蛋白。
[0074] 通常,过短的肽接头可在融合蛋白内部造成空间位阻,影响蛋白的正确折叠,过长 的肽接头可能增加融合蛋白的免疫原性,还可能影响融合蛋白的活性和功能。因此,可用于 本发明的肽接头一般包括3-15个氨基酸;较佳地为5-10个氨基酸。
[0075] 具有连续串联标签元件的融合蛋白
[0076] 本发明融合蛋白的氨基端(或羧基端)连续地含有两个标签元件(如式la或lb 所示)。
[0077] A-X-E-Y1-Y2 式 la
[0078] A-Y2-Yl-E-X 式 lb
[0079] 其中,A、X、E、Y1、Y2的定义如上所述。
[0080] 对于第一标签多肽元件Y1而言,优选的Y1选自下组:改良型亲和素标签(Strap II标签)(长度为46aa)、链亲和素(Str印II标签)(长度为9aa)。
[0081] 改良型亲和素标签(Strap II标签)是在链亲和素(Str印II标签)的基础上改 良过的一种标签蛋白,其多肽序列如SEQ ID N0. :2所示,编码其多肽的核苷酸序列如SEQ ID NO. :1 所示。
[0082] 本发明Strap II标签与Str印II标签的纯化方式可以是相同或基本相同,即通 过与生物素的亲和力进行层析。与Str印II标签相比,Strap II标签(SEQ ID NO. :2)增 加了标签的亲和性,其优点在于纯化过程在生理条件下进行,使用的脱硫生物素温和程度 的洗脱保护了靶蛋白的活性。而且,避免了常规Strep II标签的纯化技术需要进行封闭处 理步骤。
[0083] Y2为第二标签短肽元件,且为His标签元件。可用于本发明的His标签元件包括 6XHis或8XHis短肽,优选的,为8XHis标签元件。
[0084] 此外,Y1和Y2之间无蛋白酶切位点,并以肽键直接连接。
[0085] 连续串联标签的蛋白表达方案,一方面是结合两种载体的优点,避免存在的问题, 另一方面可以优化蛋白纯化步骤,提高纯化后蛋白的纯度,尽量减少来自动物源性的污染 和纯化过程中的离子性污染。
[0086] 在本发明融合蛋白中,在元件Y1和X之间为蛋白酶酶切位点,可以包括本领域常 用的用于分离纯化蛋白的酶切位点,如TEV蛋白酶、Hrv3C蛋白酶。附加条件是,在本发明 融合蛋白的其他元件序列中,不含有该酶切位点。
[0087] TEV蛋白酶是来源于烟草蚀纹病毒(TEV)的Nla蛋白酶经改进后的50kDa的蛋白 酶,经过设计后与天然TEV蛋白酶相比其稳定性更好。此蛋白酶被用来切除纯化后融合蛋 白的亲和标签;并且该酶是经由6 XHis标签纯化而得(含组氨酸标签),纯度达99%,剪切 反应完毕后可通过Ni亲和层析去除。在PH7. 0, 30°C时可达到最佳活性,但在PH5. 5-8. 5和 4-30°C的广泛范围内TEV蛋白酶皆有活性,使得反应条件的选择可根据目的蛋白的情况而 修改。
[0088] 一种可用于本发明的蛋白酶酶切位点为TEV蛋白酶,如SEQ ID N0. : 3所示。
[0089] 此外,在本发明的融合蛋白的N端,可具有或不具有分泌信号肽。当具有分泌信号 肽时,有助于实现融合蛋白的分泌表达,以便提高纯化效率。在本发明中,适用的分泌信号 肽包括来自于Slit3的分泌信号肽、或来外源导入的自于其他蛋白的分泌信号肽。其中,来 源于Slit3的分泌信号肽的核苷酸序列如SEQ ID N0. :16所不,其编码的信号肽序列如SEQ ID N0. : 17 所示。
[0090] 编码序列和重组生产
[0091] 对于本发明的融合蛋白而言,本发明的多核苷酸可以是DNA形式或RNA形式。DNA 形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是 编码链或非编码链。
[0092] 本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的蛋 白质片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然 发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域 所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失 或插入,但不会从实质上改变其编码多肽的功能。
[0093] 如本文所用,术语"引物"指的是在与模板配对,在DNA聚合酶的作用下能以其为 起点进行合成与模板互补的DNA链的寡居核苷酸的总称。引物可以是天然的RNA、DNA,也可 以是任何形式的天然核苷酸。引物甚至可以是非天然的核苷酸如LNA或ZNA等。引物"大 致上"(或"基本上")与模板上一条链上的一个特殊的序列互补。引物必须与模板上的一 条链充分互补才能开始延伸,但引物的序列不必与模板的序列完全互补。比如,在一个3' 端与模板互补的引物的5'端加上一段与模板不互补的序列,这样的引物仍大致上与模板 互补。只要有足够长的引物能与模板充分的结合,非完全互补的引物也可以与模板形成引 物-模板复合物,从而进行扩增。
[0094] 本发明融合蛋白的各元件的核苷酸全长序列或其片段通常可以用PCR扩增法、重 组法或人工合成的方法获得。对于PCR扩增法,可根据已公开的有关核苷酸序列,尤其是开 放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制 备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR 扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
[0095] 一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将 其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。 [0096] 此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通 过先合成多个小片段,然后再进行连接可获得序列很长的片段。
[0097] 应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。用于PCR的引 物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方 法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
[0098] 本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或融合蛋白编 码序列经基因工程产生的宿主细胞,以及制备本发明所述融合蛋白的方法。
[0099] 通过常规的重组DNA技术,可利用本发明的多核苷酸序列可用来表达或生产重组 蛋白。一般来说有以下步骤:
[0100] (1).用本发明的编码本发明蛋白的多核苷酸(或变异体),或用含有该多核苷酸 的重组表达载体转化或转导合适的宿主细胞;
[0101] (2).在合适的培养基中培养的宿主细胞;
[0102] (3).从培养基或细胞中分离、纯化蛋白质。
[0103] 本领域的技术人员熟知的方法能用于构建含本发明蛋白的编码DNA序列和合适 的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内 重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。 表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
[0104] 包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适 当的宿主细胞,以使其能够表达蛋白质。
[0105] 宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高 等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属的细菌细胞;真菌细胞 如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、C0S、或293细胞的动物细胞等。
[0106] 用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原 核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl 2法处理, 所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的 方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方 法如显微注射、电穿孔、脂质体包装等。
[0107] 获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用 的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下 进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导) 诱导选择的启动子,将细胞再培养一段时间。
[0108] 在上面的方法中的蛋白质可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果 需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化蛋白。这些方法是 本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀 剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、 离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
[0109] 表达载体
[0110] 在获得了编码本发明融合蛋白的DNA序列之后,将其连入合适的表达载体,再转 入合适的宿主细胞。最后通过培养转化后的宿主细胞,通过分离纯化得到本发明的融合蛋 白。
[0111] 因此,本发明还提供了包含编码所述融合蛋白的核酸分子的载体。所述的载体还 可包含与所述核酸分子的序列操作性相连的表达调控序列,以便于所述融合蛋白的表达。
[0112] 如本文所用,"操作性相连"或"可操作地连于"指这样一种状况,即线性DNA序列 的某些部分能够影响同一线性DNA序列其它部分的活性。例如,如果信号肽DNA作为前体 表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA ;如 果启动子控制序列的转录,那么它就是可操作地连于编码序列;如果核糖体结合位点被置 于能使其翻译的位置时,那么它是可操作地连于编码序列。一般"可操作地连于"意味着相 邻近,而对于分泌前导序列则意味着在阅读框中相邻。
[0113] 在本发明中,任何合适的载体都可以使用,比如一些用于细菌、真菌、酵母和哺乳 动物细胞的克隆和表达的载体,如Pouwels等,克隆载体:实验室手册(Elsevier最新版) 中所描述的。可选用本领域已知的各种载体如市售的载体。比如,选用市售的载体,然后将 编码本发明新融合蛋白的核苷酸序列可操作地连于表达调控序列,形成蛋白表达载体。
[0114] 可用于本发明的一种优选的真核表达载体可以为pcDNA3. 1 (_)(购自Invitrogen 公司)。
[0115] 表达载体包括连接有合适的转录和翻译调控序列的融合蛋白DNA序列,如来源于 哺乳动物、微生物、病毒或昆虫的基因。调控序列可包括转录启动子、操纵子、增强子、核糖 体结合位点或控制转录和翻译起始和终止的合适序列。在融合蛋白序列需要调节序列功能 的时候,则连接合适的调控序列。这样,启动子序列被连接在编码融合蛋白DNA序列前端。 在宿主细胞内的复制的能力通常由复制起始点控制。用于转化株识别的筛选基因也可加入 表达载体。
[0116] 另外,非天然的Slit3蛋白的信号肽的编码序列可以引入表达载体。例如:信号肽 (分泌引导物)序列可以和与融合蛋白编码序列融合,从而使翻译的融合蛋白可分泌到细 胞外。信号肽可增强宿主细胞向胞外分泌嵌合多肽。信号肽在多肽从细胞内分泌出来的过 程中可被切去。
[0117] 生产S1U3LRR2蛋白的方法
[0118] 本发明还包括生产融合蛋白以及纯化的S1U3LRR2蛋白的方法,所述方法包括培 养含有融合蛋白编码核酸的宿主细胞,从而培养本发明融合蛋白,从培养体系中分离纯化 出权利要求1所述的融合蛋白;以及对所述的融合蛋白,用针对元件E的蛋白酶进行酶解, 从而制得纯化的S1U3LRR2蛋白。
[0119] 在分离本发明融合蛋白的标签元件时,可以使用分别针对不同标签元件的亲和 层析进行两次分离后,再使用针对酶切位点的蛋白酶进行酶解,从而分离出纯度更高的 Slit3LRR2 蛋白。
[0120] 所述的融合蛋白包括S1U3LRR2或其活性片段。所述方法可包括让细胞表达编码 的融合蛋白,以及使表达的融合蛋白的复性。此外所述方法还可包括复性的融合蛋白的分 离和/或纯化。
[0121] 可将上述制备获得的融合蛋白纯化为基本均一的性质,例如在SDS-PAGE电泳上 呈单一条带。例如,当重组蛋白为分泌表达时,可以采用商品化的超滤膜来分离所述蛋白, 例如Millipore、Pellicon等公司产品,首先将表达上清浓缩。浓缩液可采用凝胶层析的方 法进一步加以纯化,或采用离子交换层析的方法纯化。例如阴离子交换层析(DEAE等)或 阳离子交换层析。凝胶基质可为琼脂糖、葡聚糖、聚酰胺等常用于蛋白纯化的基质。Q-或 SP-基团是较为理想的离子交换基团。最后,还可用羟基磷灰石吸附层析,金属螯合层析,疏 水相互作用层析和反相高效液相色谱(RP-HPLC)等方法对上述纯化产物进一步精制纯化。
[0122] 可利用含有Slit3LRR2结构域的特异性抗体、受体或配体的亲和层析柱对表达的 融合性多肽进行纯化。根据所使用的亲和柱的特性,可利用常规的方法,如高盐缓冲液、改 变pH等方法洗脱结合在亲和柱上的融合性多肽。
[0123] 重组蛋白以及编码该重组蛋白的核酸可利用适当的方法制备,例如,化学合成、重 组表达,或其合并应用。参见John Wiley & Sons, Inc2000年出版的《Current Protocols in Molecular Biology》,以及 Cold Spring Harbor Laboratory Pressl989 年出版的 ((Molecular Coning:A Laboratory Manual〉〉。
[0124] 本发明的有益效果
[0125] 1.本发明融合蛋白独特的连续串联标签元件设计,尤其是经改良的Strap II标 签,其长度合适,使表达的蛋白在宿主细胞中能够得到各种修饰,能在不影响蛋白质折叠的 情况下,最大程度的还原其天然构象,使S1U3LRR2蛋白能于宿主细胞中表达,其表达量 高,且表达完整、准确。
[0126] 2.本发明融合蛋白的连续串联标签元件设计使目标蛋白更易纯化,且标签元件能 通过一次酶切完整切除,制备工艺简单,制得的S1U3LRR2蛋白纯度高,活性强。
[0127] 下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本 发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照 常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press, 1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否 则百分比和份数是重量百分比和重量份数。
[0128] 实施例 1 构建 pcDNA3. 1 (_) /Slit3LRR2 载体
[0129] 方法:采用外切酶法构建质粒。构建质粒的过程,共PCR扩增3段片段(信号肽序 列、目标序列、酶切位点+标签蛋白序列),进行3次片段连接插入。所使用的引物分别是 Primerl、Primer2 和 Primer3〇
[0130] 外切酶法具体步骤:
[0131] 1、配制反应体系:载体片段(BamHI酶切后胶回收并测定浓度)和PCR片段(PCR 后胶回收并测定浓度)各50ng,lullOx外切酶buffer,补充ddH20至10ul ;
[0132] 2、冰上放置5min,加入lul稀释至20U/ul的外切酶III(Takara公司),混匀后冰 上放置60min ;
[0133] 3、加入lulO. 5M EDTA(pH8. 0)溶液终止反应,之后65°C水浴5min ;
[0134] 4、水浴后冰上放置5min ;
[0135] 5、转化连接产物。
[0136] 引物:
[0137] Primerl-F :CCACACTGGACTAGTTGCCCCACCAAGTGTACCTG SEQ ID NO. :8
[0138] Primerl-R :ACCGAGCTCGGATCCTTAGGCGACGGCTGGAGGCCCA SEQ ID NO. :9
[0139] Primer2-F :CCTCCAGCCGTCGCCATCTCCTGCCCTTCGCCCT SEQ ID NO. : 10
[0140] Primer2-R :ACCGAGCTCGGATCCTTAGAAGCACTCGCTGCTGAACC SEQ ID NO. :11
[0141] Primer3-F :AGCAGCGAGTGCTTC CTGGAAGTGCTGTTCCAG SEQ ID NO. : 12
[0142] Primer3-R :ACCGAGCTCGGATCCTTAGTGGTGGTGGTGGTGGTG SEQ ID NO. : 13
[0143] 结果:目标序列、酶切位点+标签蛋白序列的扩增结果图3和4所示,图中可见,目 标序列、酶切位点+标签蛋白序列扩增成功。
[0144] 实施例 2pcDNA3. 1 (_) /Slit3LRR2 的成功表达
[0145] 方法:为了检测构建的质粒是否成功表达,通过把质粒转染到AD293细胞中,之后 经标签蛋白8XHis来做Western Blot,检测融合蛋白是否成功表达。
[0146] 材料:High glucose DMEM培养基、胎牛血清均购自HyClone公司;转染试剂 Magetran购自Origene公司;AD293细胞用含10%胎牛血清的High glucose DMEM培养液 培养。倒置显微镜为Olympus产品,突光倒置显微镜为Nikon公司产品。
[0147] 步骤:
[0148] 2. 1.将冻存的细胞复苏培养,传代3至4次使细胞达到良好的生长状态,进行铺 板检测。Magetran试剂转染贴壁细胞。
[0149] 2. 2.接种AD293细胞至6孔板,用含10%胎牛血清的High glucose DMEM培养基培 养至密度约为70%-80%时可用于转染。将Magetran试剂及质粒pcDNA3. 1 (_)/Slit3LRR2溶 液平衡至室温,在离心管内准备下列混合液:200 μ lopti_DMEM、2 μ g质粒、6 μ 1 Magetran 转染试剂,震荡混匀后静置室温孵育l〇min。给细胞更换新的培养基后将混合液加入培养盘 中,摇匀。置于37°C、5%C02培养箱中培养,培养12小时候移除培养基,更换为新鲜的含10% 胎牛血清的High glucose DMEM培养基继续培养,转染48h后,收蛋白用于Western Blot 检测质粒的蛋白表达情况。
[0150] 2. 3去除培养基后加入4°C PBS将细胞用细胞刮刮下来放入1. 5ml离心管中,2000 转5min离心,去除上清。接着开始裂解细胞,将RIPA强裂解液与蛋白酶抑制剂,100:1的比 例混合后加到细胞沉淀中,4°C摇晃裂解lh后,4°C,14000g离心30min,取上清即样品。最 后测样品蛋白浓度,并加入Loading buffer煮沸8min,再调平上样量用SDS-聚丙烯凝胶电 泳跑胶。电泳3小时,转膜2小时,之后抗体孵育,一抗2小时,显色曝光。
[0151] 结果:Western Blot检测结果如图6所示。转染质粒组蛋白表达正常,而转染空 载组没有检测到蛋白表达,说明所构建的真核表达质粒能正常的在真核细胞中表达,质粒 构建成功。
[0152] 实施例3表达量的测试
[0153] 将一个纯化得到的已知浓度(20 μ g/ml)的HisGFP蛋白作为对照,用Western Blot的方法进行蛋白表达量的测定。
[0154] 具体方法同实施例2,先转染细胞,之后做Western Blot检测。区别在于,跑 SDS-PAGE电泳时,加入一定已知量的HisGFP蛋白作为阳性对照。
[0155] 曝光得到结果后,通过对条带进行灰度分析,计算得到蛋白的表达量。
[0156] 实施例4S1U3LRR2蛋白的纯化
[0157] 方法及材料:由于采用的蛋白表达系统是哺乳动物高效表达系统,选择的细胞是 广泛用于蛋白表达的经过优化的中国仓鼠卵巢细胞CH0-S,而表达载体中有加入胞外分泌 信号肽,因此采用悬浮培养的方法,使细胞在高密度情况下分泌尽可能多的蛋白到培养液 中,收集培养液用于后续蛋白纯化。
[0158] 纯化方法:
[0159] 4. 1先用针对第一标签多肽元件的生物素亲和柱进行层析,再用针对第二标签短 肽元件的Ni亲和柱进行层析;或
[0160] 4. 2先用针对第二标签短肽元件的Ni亲和柱进行层析,再用针对第一标签多肽元 件的生物素亲和柱进行层析。
[0161] 首先,对纯化得到的蛋白片段进行定量,按比例的加入TEV蛋白酶进行酶切,去除 蛋白标签。
[0162] 酶切缓冲液:50mMTris7. 5,500mM NaCl,5%Glycerol 的反应体系,于 4°C过夜酶 切。
[0163] 酶切过后体系内的标签蛋白片段和TEV蛋白酶均可通过Ni亲和层析去除。
[0164] 实施例5纯化的S1U3LRR2的测定
[0165] 方法:纯化得到S1U3LRR2蛋白之后,将采用细胞生物学实验进行功能检测。其 中,细胞划痕实验和Transwell细胞迁移实验进行蛋白功能的初步判断。
[0166] 划痕实验借鉴了体外细胞致伤愈合实验模型,在体外培养的单层细胞上,划痕致 伤,然后加入药物观察其抑制肿瘤细胞迁移的能力。
[0167] 胰酶消化对数生长期细胞,计数调整细胞浓度为2-10X 105个/ml,24孔板每孔加 入500ul细胞悬液,37°C细胞培养箱中培养24h,使细胞贴壁。用10uL移液枪枪头(或者无 菌牙签)在单层细胞上呈"一"字划痕,用PBS清洗3次,然后加入用2%FBS培养基配好的 不同的S1U3LRR2蛋白片段(可设置浓度梯度)溶液,取3-4个平行样本,依据肿瘤细胞的 侵袭能力不同,37°C培养12-24h。镜下拍照测量细胞迁移的面积。
[0168] Transwell细胞迁移实验主要采用24孔板小室。用胶原(collagen)包被 Transwell小室(Millipore公司)底部膜。消化细胞,PBS洗1-2遍,用含0. 2%BSA的无血 清培养基重悬细胞,计数后调整细胞密度至1-10X105,取细胞悬液200 μ 1加入Transwell 小室,24孔板下室加入500μ 1含血清的培养基,其中加入不同的S1U3LRR2蛋白片段。依 据肿瘤细胞的侵袭能力不同,37°C培养12-48h。采用结晶紫染色细胞,镜下拍照计数穿过的 细胞数,评价S1U3LRR2蛋白片段对肿瘤细胞侵袭能力的影响。
[0169] 在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独 引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可 以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范 围。
[0001] 序列表 <110>李华顺 <120>含有富含亮Μ酸=?复序列的Λ合蛋白及其制法和炖出 <130> Ρ2013-0430 <160> 17 <170> PatentTj] version 3.5 <210> 1 <211> 138 <212> DNA <213>寡核苷酸 <220> <221〉 CDS <222〉 (1)., (138) <400> 1 ctg tcc B.cc, ggt ggc age gat gag aag acc a,ct ggt tgg aga ggt ggc 48 Leu Ser Thr Gly Glv Ser Asp Glu Lvs Thr Thr Gly Trp Arg Glv Gly 1 5 10 15 cat gtt gtg gaa sgc ttg set ggt gaa ttg gaa caa ttg aga gcc cgt 96 His Val Val Glu Gly Leu Ala Gly Glu Leu Glu Gin Leu Arg Ala Arg 20 25 30 ctg gag cat cac cca caa ggc caa aga gaa cca ggc age ggc 138 Leu Glu His His Pro Gin Gly Glri Arg Glu Pro Gly Ser Gly 35 40 45 <210> 2 <211> 46 <212> PRT 人丁序列 <400> 2 Leu Ser Thr Gly Gly Ser Asp Glu Lys Thr Thr Gly Trp Arg Gly Gly 1 ' 5 10 15 His Val Val Glu Gly Leu Ala Gly Glu Leu Glu Gin Leu Arg Ala Arg 20 25 30 Leu GIo Ills ilis Pro Gin Gly GJ_n Arg Giu Pro Giy Ser Giy 35 40 45 ' <210:> 3 <211> S <212:> PRT <2i3>人丨:序列 <220> <221> MISC FEATURE <223> 人工序列 <400> 3 Leu Glu Yal Leu Phe Gin Gly Pro 1 5 <210> 4 <211> 669 <212> DNA <213〉智人(Homo sapiens) <220> <221> CDS
[0002] <222> (1)..(669) <400> 4 ate tee tgc cct teg ccc tgc aeg tgc age aat. aac ate gtg gac tgt 48 lie Ser C-ys Pro Ser Pro Cys Thr Cvs Ser Asn Asri i丄e Val Asp Cvs 1 '5 ^ 10 15 ega gga aag ggc tig atg gtig all ccl gee aac tig ccg gag ggc ate 96 Arg G1 v I.ys G1 y Leu Met Glu Tie Pro A1 a Asn Leu Prn Gin G1 v Tie 20 25 30 ' gtc gaa ata ege eta gaa. cag aac tee atx aaa gee ate cct gca gga 144 Val Glu lie Arg Leu Clu Cln Asn Ser lie Lys Ala lie Pro Ala Gly 35 40 45 gee ttc acc nag far, aag aaa ct.g a.ag ega ata gac ate age aag a.at 192 Ala Phe Thr Gin Tyr Lys Lys Leu Lys Arg lie Asp lie Ser Lvs Asn 50 55 60 cag rtii teg gat att get cca gat gee ttc cag ggc ctg aaa tea etc 240 Gin lie Ser Asp lie Ala Pro Asp Aia Phe G丄ii Gi\ r Leu Lys Ser Leu 65 TO 75 ~ 80 aca teg ctg gtc ctg tat ggg aac aag ate acc gag att gee aag gga 288 Thr Ser Leu Val Leu Tyr Gly Asn Lys lie Thr Glu lie Ala Lvs Gly 85 ' ' 90 95 ctg --τ. gat figg ctg gtg tee eta cag ctg etc etc etc aat gee aac 336 Leu Phe Asp Glv Leu Val Ser Leu Gin Leu Leu Leu Leu Asn Ala Asn 100 105 110 aag a,tc aac tgc cig egg gig aac aeg Lit cag gac ctg cag aac etc 381 Lys lie Asn Cys Leu Arg Val Asn Thr Phe Gin Asp Leu Cln Asn Leu 115 120 125 aac ttg etc tee ctg tat gac aac aag ctg cag acc ate age aag ggg 432 Asn Leu Leu Ser Leu Tyr Asp Asn Lvs Leu Gin Thr lie Ser Lys Glr 130 135 140 etc ttc gee cct ctg cag too ate cag aca. etc cac 1:1:a, gee caa a,a.c 480 Leu Phe Ala Pro Leu Gin Ser lie Gin Thr Leu His Leu Ala Gin Asn 145 150 155 160 _ cca ttt gtg tgc gac tgc cac ttg aag tgg ctg gee gac. tac etc cag 528 Pro Phe Val Cvs Asp Cys His Leu Lys Trp Leu Ala Asp Tvr Leu Gin '165 170 ' 17E gac aac ccc ate gag aca age ggg gee ege tgc age age ccg ege ega 576 Asp Asn Pro lie G丄u Thr Ser (Uy Aia Airg Os Ser Ser Pro Arg Arg 180 185 " 190 etc gee aac aag ege ate age cag ate aag age aag aag tie ege tgc 624 Leu Ala Asn Lvs Arg lie Ser Gin lie LyvS Ser Lys Lys Phe Arg Cys 195 200 ' 205 ' tea ggc tee gag gat tac ege age agg ttc age age gag tgc ttc 669 Ser Gly Ser Glu Asp Tyr Arg Ser Arg Phe Ser Ser Glu Cvs Phe 210 215 220 <210> 5 <211> 223 <212> PRT <213> 智人(Homo sapiens) <400> 5 lie Ser Cys Pro Ser Pro Cys Thr Cys Ser Asn Asn lie Yal Asp Cys 15 10 15 Arg Gly Lys Gly Leu Met Giu JJe Fro Ala Asn Leu Fro Glu Gly lie 20 25 30 Val Glu lie Arg Leu Glu Gin Asn Ser lie Lys Ala. lie Pro Ala Gly 3E 40 ^ 45 Ala Phe Tlu' Gin Tyr Lys Lys Leu Lys Arg 11^ Asp He Ser Lys Asn 50 55 60 Gin lie Ser Asp lie Ala Pro Asp Ala Phe Gin Glv Leu Lys Ser Leu 65 70 75 80 Thr Rer T;eo VbI Leu Tyr Gly Asn Lys Tie Thr Gin Tie Me. I.ys Gly 85 ' ' *90 95 Leu Phe Asp Gly Leu Yal Ser Leu Gin Leu Leu Leu Leu Asn Ala Asn 100 105 110 Lys lie Asn Cys Leu Ai'g Yal Asn Thr Phe Gin Asp Leu Gin Asn Leu
[0003] 115 120 125 Asn Leu Leu Ser Leu Tyr Asp Asn Lvs Leu Gin Thr lie Ser Lvs Glv 130 135 140 Leu Phe Ala Pro Leu Gin Ser He Gin Thr Leu His Leu Ala Gin Asn 145 150 155 160 Pro Phe Yal Cys Asp Cvs His Leu Lys Trp Leu Ala Asp Tyr Leu Gin 165 170 ' 175 Asp Asn Pro lie Glu Thr Scr Gly Ala Arg Cys Scr Ser Pro Arg Arg 180 185 190 Lou Ala Asn Lys Arg lie Scr Gin lie Lys Sor Lys Lys Phe Arg Cys 195 200 205 Ser Gly Ser Glu Asp Tyr Arg Ser Arg Phe Ser Ser Glu Cys Phe 210 215 220 <210> 6 <211> 957 <212> DNA <213>人丄序列 <220> <221> CDS <222> (1).. (957) <400> 6 at.g gcc ccr ggg tgg gca ggg gt.r ggc gcc gcc gtg ege gcc ege ctg 48 Met Ala Pro Gly Trp Ala Gly Val Gly Ala Ala Val Arg Ala Arg Leu 丄 5 丄0 i5 geg ctg gcc ttg geg cig geg age gtc ctg agt ggg cct cca gcc gtc 96 Ala Leu Ala Leu Ala Leu Ala Ser Val Leu Ser Glv Pro Pro Ala Val 20 25 30 gcc ate tcc tgc cct teg ccc tgc aeg tgc age aat aac ate gtg gac 111 Ala lie Ser Cys Pro Ser Pro Cys Thr Cys Ser Asn Asn lie Val Asp 35 ' 40 45 t^t ega gga aag ggc tig a,lg gay all cct. gcc aac Llg ccg gag ggc 192 Cys Arg Gly Lys Gly Leu Met Glu lie Pro Ala Asn Leu Pro Glu Gly 50 55 60 ate gtc gaa ata ege eta gaa cag aac tee ate aaa gcc ate cct gca 240 lie Val Glu lie Arg Leu Glu Gin Asn Ser He Lys Ala lie Pro Ala 65 70 75 ' 80 gga gcc ttc acc cag t.ac. aag aaa ctg aag ega ata gac ate age aag 288 Gly Ala Phe Thr Gin Tyr Lys Lys Leu Lys krg lie Asp lie Sor Lys 85 90 95 ' aat cag ata teg gat att get cca gat gcc ttc cag ggc ctg aaa tea 336 Asn Gin He Ser Asp lie Ala Pro Asp Ala Phe Gin Glv Leu Lys Ser 100 105 110 etc ar.a Teg ctg gtc ctg tat ggg aar aag ate acc gng att gcc aag 384 Leu Thr Ser Leu Vai Leu Tyr Gly Asn Lys lie Thr Glu 丄ie Ala Lys 115 120 125 gga ctg ttt gat ggg ctg gtg tee eta cag ctg etc etc etc aat gcc 432 Gly Leu Phe Asp Gly Leu Val Ser Leu Gin Leu Leu Leu Leu Asn Ala 130 ~ 135 140 aac aag ate aac tgc ctg egg gtg aac aeg ttt cag gac ctg cag aac 480 Asn Lys lie Asn Cys Leu Arg Val Asn Thr Phe Gin Asp Leu Gin Asn 145 ' 1B0 155 160 etc aac tig etc tec ctg tat gac aac aag ctg cag acc ate age aag 528 Leu Asn Leu Leu Ser Leu Tyr Asp Asn i,ys Leu Gin Thr Tie Ser Lvs 165 170 175 ggg etc ttc gcc cct ctg cag tec ate cag aca etc cac tta gcc caa 576 Gly Leu Phe Ala Pro Leu Gin Ser lie Gin Thr Leu His Leu Ala Gin 。 180 185 190 aac cca xtt gtg tgc gac tgc cac ttg aag tgg ctg gcc gac tac etc 621 Asn Pro Phe Val Cys Asp Cys His Leu Lys Trp Leu Ala Asp Tyr Leu 195 200 205 cag gac aac ccc ate gag aca age ggg gcc ege tgc age age ccg ege 672 Gin Asp Asn Pro lie Glu Thr Ser Glv Ala Aig Cys Ser Ser Pro krg 210 215 ' 22-0 ega etc gcc aac aag ege y.tc age cag ate aag age stig t tc ege 720 Arg Leu Ala Asn Lys Arg lie Ser Gin lie Lys Ser Lys Lys Phe Arg
[0004] 225 230 235 240 tgc tea ggc tee gag gat tac ege age agg ttc age age gag tgc ttc 768 Cys Ser Gly Ser Glu Asp Tyr Arg Ser Arg Phe Ser Ser Glu Cys Phe ^ ' 245 ' 250 255 ctg gaa gtg ctg ttc cag ggc cct ctg tee acc ggt ggc age gat gag 816 Leu Glu Yal Leu Phe Gin Gly Pro Leu Ser Thr Gly Gly Ser Asp Glu 260 265 ' 270 aag acc act ggi tgg aga ggt ggc cat gtt gtg gaa ggc ttg get ggt 864 Lys Thr Thr Gly Trp Arg Gly Gly His ¥al Val Glu Gly Leu Ala Gly t 275 ' 280 285 ' gaa ttg gaa caa ttg aga gee cgt ctg gag cat cac cca caa ggc caa 912 Glu Leu Glu Gin Leu Arg Ala Arg Leu Glu His His Pro Gin Gly Gin 290 295 300 aga gaa cca ggc age ggc cac cac cac cac cac cac cac cac taa 957 Arg Glu Pro Gly Ser Gly Ilis ISis Ilis His His llis llis His 305 310 315 <210> 7 <211> 318 <212> PRT <213> 人工序列 <400> 7 Met Ala Pro Gly Trp Ala Glv Va.1 Gly Ala Ala Val Arg Ala Arg i.eti 1 5 10 15 Ala Leu Ala Leu Ala Leu Ala Ser Yal Leu Ser Gly Pro Pro Ala Val 20 25 30 Ala lie Ser Cys Pro Ser Pro Cys 丁hr Cys Ser Asn Asn lie Val Asp 35 40 45 Cys Arg Gly Lvs Civ Leu Met Glu lie Pro Ala Asn Leu Pro Glu Glv 50 55 60 lie Val Glu lie Arg Leu Glu Gin Asn Ser lie Lys Ala lie Pro Ala 65 70 75 80 Gly Ala Phe Thr Gin Tvr Lys Lys Leu Lys Arg He Asp lie Ser Lys 85 90 95 Asn Gin He Ser Asp lie Ala Pro Asp Ala Phe Gin Gly Leu Lys Ser 100 105 110 Leu Thr Ser Leu Val Leu Tyr Gly Asn Lys He Thr Glu lie Ala Lys 115 120 125 Gly Lou Phe Asp Glv Leu Val Sor Leu Gin Leu Leu Leu Leu Asn Ala 130 135 140 Asn Lvs He Asn Os Lou Arg Val Asn Thr Phe Gin Asp Leu Gin Asn 145 150 155 160 Leu Asn Leu Leu Ser Leu Tyr Asp Asn Lys Leu Gin Thr lie Ser Lys 165 170 175 Gly Leu Phe Ala Pro Leu Gin Ser lie Gin Thr Leu His Leu Ala Gin 180 185 190 Asn Pro Phe Val Cys Asp Cys His Leu Lys Trp Leu Ala Asp Tyr Leu 195 200 205 Gin Asp Asn Pro lie Glu Thr Ser Gly Ala Arg Cys Ser Ser Pro firg 210 215 220 Arg Leu Ala Asn Lys Arg lie Ser Gin lie Lys Ser Lys Lys Phe Arg 225 230 235 ' 240 Cys Ser Gly Ser Glu Asp Tyr Arg Ser Arg Phe Ser Ser Glu Cys Phe ' ' 245 ' 250 25H Leu Glu Val Leu Phe Gin Glv Pro Leu Ser Thr Glv Gly Ser Asp Glu 260 265 270 Lys Thr Thr Gly Ti'p Arg Gly Gly His Val Val Glu Gly Leu Ala Gly 275 280 285 Glu Leu Glu Gin Leu Arg Ala Arg Leu Glu His His Pro Gin Gly Gin 290 295 300 ' Arg Glu Pro Glv Ser Gly His His His His His His His Ilis 305 310 315 <210> 8 <211> 35 <212> DNA
[0005] <213>寡核苷酸 <220> <221> miscfoaturc χ223> 人工序列 <棚> 8 ccacactgga ctagttgccc caccaagtgt acctg 35 <210> 9 <211> 37 <212> DM <213>寡核舒酸 <220> <221> raise feature <223> 人工序列 <400> 9 accgagctcg gatcctlcigg cgacggclgg aggccca 37 <210> 10 <211> 34 <212> DNA <213〉ft核苻酸 <220> <221 ^ misc_reiilure <223;人 TJV:列 <400> 10 rctccagccg tcgccatctr ctgcccttcg ccct 34 <210> 11 <211> 38 <212> DM <213> S核苷酸 <220> <221> misc_feature <223、人工厗列 <備〉11 accgagctcg gat.eett.a.ga agcactcgct. gct.gaa.cc 38 <210> 12 <211:, 33 <212、 DNA <213:>寡核苷酸 <220/ mi sc_fea.ture <223> 人-T:m 列 <400> 12 ageagegagt gcttcctgga agtgctgttc cag 33 <210> 13 <211> 36 <212> DNA <213>寡核苷酸 <220> <221> miscfcaturc <223、人T序列 <400> 13
[0006] iiccgagcU-g galccLtagL ggtggtggt.g gLgglg 36 <210> 14 <211> 4572 <212> DNA <213> 智人(Homo sapiens) <220> <221> CDS <222> (1).. (4572) <!00> 14 atg gcc ccc ggg tgg gc.a ggg gtc ggc gcc gcc gtg cgc gcc c.gc ctg 48 Met Ala Pro Glv Trp Ma Giy Val Gly Ala Ala Val Arg Ala Arg Leu 15 10 15 gcg ctg gcc ttg gcg ctg gcg age gtc ctg agt ggg cct cca gcc gtc 96 Ala Leu Ala Leu Ala Leu Ala Ser Val Leu Ser Gly Pro Pro Ala Val 20 25 ' 30 gcc tgc. c.c.c acr. aa.g t.gt. acc tgc tcc get gcc age gtg gac tgc cac. 144 Ala Cys Pro Thr Lys Cys Thr Cys Ser Ala Ala Ser Val Asp Cys His 35 40 4B ggg ctg ggc etc cgc gcg gtt cct egg ggc ate ccc cgc aac get gag 192 Gly Leii Gly Leo Arg Ala Val Pro Arg Gly Tie Pro Arg Asn Ala G1 n 50 55 60 cgc ett, ga.c ctg ga.c aga aat aa.t ate acc agg ate acc a.ag a.tg gac 240 Arg Leu Asp Leu Asp Arg Asn Asn lie Thr Ar^ lie Thr Lys Met Asp 65 70 75 ' 80 ttc get ggg etc aag aac etc ega gtc ttg cat ctg gaa gac aac cag 288 Phe Ala Gly Leu Lys Asn Leo Arg Val Leu His Leu Glu Asp Asn Gin 85 90 95 gtc age gtc ate gag aga ggc gcc ttc cag gac ctg aag cag eta gag 336 Val Ser Val lie Glu Arg Gly Ala Phe Gin Asp Leu Lvs Gin Leu Glu 100 ' 105 ' 110 ega clg cgc ctg aac aag a,al aag ctg caa gtc ct l cca gaa ttg clt 384 Arg Leu Arg Leu Asn Lvs Asn Lys Leu Gin Val Leu Pro Glu Leu Leu 115 120 125 ttc cag age aeg ccg aag etc acc aga eta gat ttg agt gaa aac cag 432 Phe Gin Ser Ihr Pro Lvs Leu Thr Arg Leu Asp Leu Ser Glu Asn Gin 130 ' 135 140 ate cag ggg ate ccg agg aag gcg ttc cgc ggc ate acc gat gtg aag 480 lie Gin Gly lie Pro Arg Lys Ala Phe Arg Glv Ilo Thr Asp Val Lys 145 150 155 160 aac ctg caa ctg gac aac aac cac ate age tgc att gaa gat gga geo 528 Asn Leu Gin Leu Asp Asn Asn His lie Ser Cys Tie Glu Asp Glv Ala 165 170 175 ttc ega gcg ctg cgc gat ttg gag ate ett acc etc aac aac aac aar 576 Phe Arg Ala Leu Arg Asp Leu Glu lie Leu Thr Leu Asn Asn Asn Asn 180 185 190 ate agt cgc ate ctg gtc acc age ttc aac cac atg ccg aag ate ega 624 lie Ser Arg lie Leu Val Thr Ser Phe Asn His Met Pro Lys lie Arg 195 200 205 act ctg cgc etc cac tec aac cac ctg tac tgc gac tgc cac ctg gcc 872 Thr Leu Arg Leu His Ser Asn His Leu Tyr Cys Asp Cys His Leu Ala 210 215 220 tgg etc teg gat tgg ctg ega cag ega egg aca gtt ggc cag ttc aca 720 Trp I.eu Ser Asp Trp Leu Arg Gin Arg Arg Thr Yal Gly Gin Phe Thr 225 230 235 ' 240 etc tgc atg get cct gtg cat ttg agg ggc ttc aac gtg gcg gat gtg 768 Leu Cys Met Ala Pro Val His Leu Arg Gly Phe Asn Val Ala Asp Val ' 245 250 255 cag aag aag gag tac gtg tgc cca gcc ccc cac teg gag ccc cca tee 816 Gin Lys Lys Glu ?ντ Val Cys Pro Ala Pro His Ser Glu Pro Pro Ser 260 265 270 tgc aat gee aac tec ate tee tgc cct teg ccc tgc aeg tgc ngc 864 Cys Asn hla Asn Ser lie Ser Cys Pro Ser Pro Cys Thr Cvs Sei· Asn ' 275 280 ' 285 aac tile gig gac tgt ega gga aag ggc llg alg gag all cct gcc aac 912 Asn lie Val Asp Cys Arg Gly Lys Gly Leu Met Glu lie Pro Ala Asn
[0007] 290 295 300 ttg ccg gag ggc ate gtc gaa ata ege eta gaa cag aac tee ate aaa b60 Leu Pro Glu Gly lie Val Glu lie Arg Leu Glu Gin Asn Ser lie Lvs 305 ' 310 315 320 gee ate cct gca gga gee ttc acc cag tac aag aaa ctg aag ega ata 1008 Ala lie Pro Ala Gly Ala Phe Thr Gin Tyr Lys Lys Leu Lys Arg lie 325 330 ' 335 gac ate age aag aat cag ata teg gat att get cca gat gee ttc cag 1056 Asp lie Ser Lvs Asn Gin lie Ser Asp lie Ala Pro Asp Ala Phe Gin 340 345 350 ggc ctg aaa tea etc aca teg ctg gtc ctg tat ggg aac aag ate acc 1104 Gly Leu Lvs Ser Leu Thr Ser Leu Val Leu Tvr Gly Asn Lys lie Thr 355 360 365 gag att gee aag gga ctg ttt gat ggg ctg gtg tee eta cag ctg etc 1152 Gin 丄丄e Ala Lys Gly Leu Phe Asp Giy Leti Vai Ser Leu Gin Leu Leu 370 ' ' 375 ' 380 etc etc aat gee aac aag ate aac tgc ctg egg gtg aac aeg ttt cag 1200 Leu Leu Asn Ala Asn Lys lie Asn Cys Leu Arg Val Asn Thr Phe Gin 385 390 395 400 gac ctg cag aac etc aac ttg etc tee ctg tat gac aac aag ctg cag 1248 Asp i.eu Gin A.sn l eu Asn I.ru i.eu Sei' i.eu Tyr Asp Asn 1 .ys l.en Gin 405 410 ' 415 acc ate age aag ggg etc ttc gee cct ctg ca.g tee ate cag aca etc 1296 Thr lie Ser Lys Gly Leu Phe Ala Fro Leu Gin Ser lie Gin Thr Leu 420 425 430 cac tta gee caa aac cca ttt gtg tgc gac tgc cac ttg aag tgg ctg 1344 His Leu Ala Gin Asn Pro Phe Val Cys Asp Cys His Leu Lys Trp Leu 435 440 445 gee gac tac etc cag gac aac ccc ate gag aca age ggg gee ege tgc 13y2 Ala Asp T\rr Leu Gin Asp Asn Pro lie Glu Thr Ser Gly Ala Arg Cys 450 455 460 ' ' age age ccg ege ega etc gee aac aag ege ate a_gc cag ale aag age 1440 Ser Ser Pro Arg Arg Leu Ala Asn Lys Arg lie Ser Gin lie Lys Ser 465 470 475 4B0 aag aag ttc ege tgc tea ggc tee gag gat tac ege age agg ttc age 1488 Lys Lys Phe Arg Os Ser Gly Ser Glu Asp Tyr Arg Ser Arg Phe Ser ' 485 ^ 490 495 age gag tgc ttc atg gac etc gtg tgc ccc gag aag tgt ege tgt gag 153G Ser Glu Cys Phe Met Asp Leu Val Cys Pro Glu Lys Os Arg 〇s Glu 500 505 510 ggc aeg att gtg gac tgc tee aac cag aag ctg gtc ege at.c cca age 1584 Gly Thr lie Val Asp Cys Ser Asn Gin Lys Leu Val Arg lie Pro Ser ' 515 520 525 cac etc cct gaa tat gtc acc gac ctg ega ctg aai gac aat gag gta 1632 His Leu Pro Glu Tvr Val Thr Asp Leu Arg Leu Asn Asp Asn Glu Val 530 535 540 tet gtt ctg gag gee act ggc ate ttc aag aag ttg ccc aac ctg egg 1680 Ser Va丄 Leu Gin A丄a rhr G丄y i丄e Phe Lys i^s Leu Pro Asn Leu Arg 545 550 ' 55a 560 aaa ata aat ctg agt aac aat aag ate aag gag gtg ega gag gga get 1728 Lys lie Asn Leu Ser Asn Asn Lys lie Lys Glu Yal Arg Glu Glv Ala 565 570 575 ttc Rat gga gca gee age gtg cag gag ctg atR ctg aca ggg aac cag 1776 Phe Asp G1Y Ala Ser Val Gin Glu i.eu Met i烈i 丁hr Gly /Lsn filn 580 585 590 ctg gag acc gtg cac ggg ege gtg ttc cgt ggc etc agt ggc etc aaa 1824 Leu Glu Thr Val His Gly Arg Val Phe Arg Gly Leu Ser Gly Leu Lvs 595 600 605 acc ttg atg ctg agg agt aac ttg ate ggc tgt gtg agt aat gac acc 1872 Thr Leu Met Leu Arg Ser Asn Leu lie Gly Cys Val Ser Asn Asp Thr 610 615 ' 620 ttt gee ggc ctg agt teg gtg aga ctg ctg tee etc tat gac aat egg 1920 Phe Ala Gly Leu Ser Ser Val Arg Leu Leu Ser Leu Tvr Asp Asn Arg 625 ^ 630 635 ~ 640 ale acc acc ate acc eel ggg gee lie acc aeg ell gtc lee ctg lee 1968 lie Thr Thr lie Thr Pro Gly Ala Phe Thr Thr Leu Val Ser Leu Ser 645 650 655 acc ata aac etc ctg tee aac ccc ttc aac tgc aac tgc cac ctg gee 2016
[0008] Thr lie Asn Leu Leu Ser Asn Pro Phe Asn Cys Asn €ys His Leu Ala 660 665 * " 670 Lgg etc ggc aag Igg tAg agg Hag agg egg aLc gic agt ggg aac ccl 2064 Trp Leu Gly Lys Trp Leu Arg Lys Arg Arg He Val Ser Gly Asn Pro 675 680 685 agg tgc cag aag cca ttt ttc etc aag gag att ccc ate cag gat gtg 2112 Arg Cys Gin Lys Pro Phe Phe Leu Lys Glu lie Pro lie Gin Asp Val 690 ' 695 ' 700 gcc ate cag gac ttc acc tgt. gat ggc aac gag gag agt age tgc cag 2160 Ala lie Gin Asp Phe Thr Cys Asp Glv Asn Glu Glu Ser Ser Cys Gin 705 710 715 720 ctg age ccg ege tgc ccg gag cag tgc acc tgt atg gag aca gtg gtg 2208 Leu Ser Pro Arg Cys Pro Glu Gin Cys Thr Cys Met Glu Thr Val Val 725 * 730 735 ega tgc age aac aag ggg etc ege gcc etc ccc aga ggc atg ccc aag 2256 Arg Cys Ser Asn Lys Gly Leu Arg Ala Leu Pro Arg Gly Met Pro Lys 740 745 750 gat gtg acc gag ctg tac ctg gaa gga aac cac eta aca gcc gtg ccc 2304 Asp Vai Thr Giu Leu IVr Leu G_Ui G_Ly Asn ilis Leu Thr Aia Vai Pro 755 ~ 760 765 aga gag ctg tee gee etc ega cac ctg aeg ett att gac ctg age aac 2352 Arg Glu Leu Ser Ala Leu Arg His Leu Thr Leu lie Asp Leu Ser Asn 770 775 780 aac age ate age atg ctg acc aat tac acc ttc agt aac atg tet cac 2400 Asn Ser lie Ser Met Leu Thr Asn Tvr Thr Phe Ser Asn Met Ser His 785 790 t 795 800 etc tee act ctg ate ctg age tac aac egg ctg agg tgc ate ccc gto 21 Leu Ser Thr Leu lie Leu Ser Tyr Asn Arg Leu Arg Cys lie Pro Val 805 810 815 cac gcc ttc aac ggg ctg egg tee ctg ega gtg eta acc etc cat ggc 2496 His Ala Phe Asn Gly Leu Arg Ser Leu Arg Yal Leu Thr Leu His Gly 820 825 830 aat gac att tee age gtt cct gaa ggc tee ttc aac gac etc aca tet 2544 Asn Asp lie Ser Ser Val Pro Glu Glv Ser Phe Asn Asp Leu Thr Ser 835 840 ' 845 cit lee cal clg geg clg gga acc aac cca etc cac Igl gac tgc agl 2592 Leu Ser His Leu Ala Leu Gly Thr Asn Pro Leu His Cvs Asp Cys Ser 850 855 860 ct.t egg tgg ctg teg gag igg gtg aag geg ggg tac aag gag cct ggc 2640 Leu Arg Trp Leu Ser Glu Trp Val Lys Ala Gly Tyr Lys Glu Pro Gly 865 870 " 875 ^ 880 ate gcc ege tgc agt age cct gag ccc atg get gac agg etc ctg etc 2688 lie Ala Arg Cys Ser Ser Pro Glu Pro Met Ala Asp Arg Leu Leu Leu 885 890 895 acc acc cca acc cac ege ttc cag tgc aaa ggg cca gtg gac ate aac 2736 Thr Thr Pro Thr His Arg Phe Gin Cys Lys Gly Pro Val Asp He Asn 900 905 910 att gtg gcc aaa tgc aat gcc tgc etc tee age ccg tgc aag aat aac 2784 lie Val Ala Lys Cys Asn Ala Cys Leu Ser Ser Pro Cvs Lys Asn Asn 915 920 925 ggg aca tgc acc cag gac cct gtg gag ctg tac ege tgt gcc tgc ccc 2832 Gly Thr Cys Thr Gin Asp Fro Val Giu Leu Tyr Arg Cys Aia Cys Pro 930 935 940 tac age tac aag ggc aag gac tgc act gtg ccc ate aac acc tgc ate 2880 Tyr Ser Tvr Lys Gly Lvs Asp Cys Thr Val Pro lie Asn Thr Cys He 945 950 955 960 cag aac ccc tgt cag cat gga ggc acc tgc cac ctg agt gac age cac 2928 Gin Asn Pro Cys Gin His Gly Gly Thr Cys His Leu Ser Asp Ser His '965 ' 970 975 aag gat ggg ttc age tgc tee tgc cct ctg ggc ttt gag ggg cag egg 2976 Lys Asp Gly Phe Ser Cvs Ser Cys Pro Leu Gly Phe Glu Gly Gin Arg 980 985 990 tgt gag ate aac cca gat gac tgt gag gac aac gac tgc gaa aac aat 3024 Cys Glu lie Asn Pro Asp Asp Cys Glu Asp Asn Asp Cys Glu Asn Asn 995 1000 1005 gcc acc tgc gtg gac ggg ate aac aac tac gtg tgt ate tgt ccg 3069 Ala Thr Cvs Val Aso Glv lie Asn Asn Tvr Val Cys lie Cys Pro 1010 1015 ' 1020 '
[0009] ccl aac lac aca ggt gag cta tgc gac gag gig all gac cac igi 3114 Pro Asn Tyr Tlir Gly Glu Leu Cys Asp Glu Val lie Asp His Cys 1025 1030 1035 gtg cct gag ctg aac etc tgt cag cat gag gcc aag tgc ate ccc 3159 Val Pro Glu Leu Asn Leu Cys Gin His Glu Ala Lts Cts lie Pro 1040 1045 1050 ctg gac aaa gga ttc age tgc gag tgt gtc cct ggc tac age ggg 3204 Lou Asp Lye Gly Phe Scr Cys Glu Cys Val Pro Glv Τυγ Scr Gly 1055 1060 1065 aag etc tgt gag aca gac aat gat gac tgt gtg gcc cac aag tgc 3249 Lys Leu Cys Glu Thr Asp Asn Asp Asp Cvs Val Ala His Lvs Cys ' 1070 1075 ' 1080 ^ ' ege cac ggg gcc cag tgc gtg gac aca. ate aat ggc tac aca tgc 3294 Arg His Gly Ala Gin Cys Val Asp Thr lie Asn Glv Tyr Thr Cys 1085 1090 1095 acc tgc ccc cag ggc ttc agt gga ccc t.tc tgt gaa cac ccc cca 3λΗ9 Thr Cys Pro Gin Gly Phe Ser Gly Pro Phe Cys Glu His Pro Pro 1100 。 1105 ' 1110 ccc a.tg gtc eta ctg cag acc age cca. tgc gac cag tac gag tgc 3384 Pro Met Vai Leu Leu Gin Thr Ser Pro Cys Asp Gin Tyr Glu Cys Π15 1120 Π25 cag aac ggg gcc cag tgc ate gtg gtg cag cag gag ccc acc tgc 3429 Gin Asn Gly Ala Gin Cys Tie VbI Val Gin Gin Glu Pro Thr Cys 1130 ' _ 1135 1140 ' ege tgc cca cca ggc ttc gcc ggc ccc aga. tgc gag aag etc ate 3474 Arg Cys Pro Pro Gl? Phe Ala Gly Pro Arg Cys Glu Lys Leu lie 1145 ' 1150 ' ' 1155 act gtc aac ttc gtg ggc aaa gac tee tac gtg gaa ctg gcc tee 3519 Thr Val Asn Phe Val Gly Lys Asp Ser Tyr Val Glu Leu Ala Ser 1160 1165 1170 gcc aag gtc ega ccc cag gcc aac ate tee ctg cag gtg gcc act 3561 Ala Lys ¥al Arg Pro Gin Ala Asa He Ser Leu Gla Val Ala Thr 1175 1180 1185 gac aag gac aac ggc ale cli cLc lac aaa gga gac ttal gac ccc 3609 Asp Lys Asp Asn Glv He Leu Leu Tyr Lvs G1y Asp Asn Asp Pro 1190 1195 1200 ctg gca ctg gag ctg tac cag ggc cac gtg egg ctg gtc tat gac 3654 Leu Ala Leu Glu Leu Tyr Gin GIt His Val krg Leu Val Tyr Asp 1205 ' 1210 ' 1215 ' age ctg agt tee cct cca acc aca gtg tac agt gtg gag aca gtg 3699 Scr Lou Scr Scr Pro Pro Thr Thr Val Tyr Scr Val Glu Thr Val 1220 1225 1230 aat gat ggg cag 111 cac agt gtg gag ctg gtg aeg eta aac cag 37 H Asn Asp Gly Gin Phe His Ser Val Glu Leu Val Thr Leu Asn Gin 1235 ' 1210 1245 acc ctg aac eta gta gtg gac aaa gga act cca aag age ctg ggg 3789 Thr Leu Asn Leu Val Vai Asp Lvs Glv Thr Pro Lys Ser Leu Gly 1250 1255 1280 aag etc cag aag cag cca gca gtg ggc ate aac age ccc etc tac 3834 Lys Leu Gin Lys Gin Pro Ala Val Gly lie Asn Ser Pro Leu Tyr ' 1265 ' 1270 ^ 1275 ' ett gga ggc ate ccc acc tee acc ggc etc tet gcc ttg ege cag 3879 Leu Gly Gly lie Pro Thr Ser Thr Gly Leu Ser Ala Leu Arg Gin T2BD ^ 1285 1290 _ ggc aeg gac egg cct eta ggc 职c ttc cac Rga tgc ate cat gag 3924 Gly Thr Asp Arg Pro i,eo Gly Gly Phe His Gly Cys Tie His Glu 1295 1300 1305 gtg ege ate aac aac gag ctg rag gar. ttc eag gcc cca cca 3969 Val Arg lie Asn Asn Glu Leu Gin Asp Phe Lys Ala Leu Pro Pro 1310 1315 1320 cag tee ctg ggg gtg tea cca ggc tgc aag tee tgc acc gtg tgc 4014 Gin Ser Leu Gly Val Ser Pro Gly Cys Lvs Ser Cys Thr Yal Cys 1325 1330 1335 aag cac ggc ctg tgc ege tee gtg gag aag gac age gtg gtg tgc 4059 Lys His Glv Lea Cys Arg Ser Val Glu Lvs Asp Ser Val Yal Cys 1340 1345 1350 gag Lgc ege cca ggc Igg acc ggc cca etc tgc gal cag gag gcc 1104 Glu Cys Arg Pro Gly Trp Thr Gly Pio Leu Cys Asp Gin Glu Ala
[0010] 1355 1360 1365 egg gac ccc tgc etc ggc cac aga tgc cac cat gga aaa tgt gtg 1149 Arg Asp Pro Cys Leu Gly His Arg Cys His His Gly Lvs Cvs ¥al 1370 ' 1375 ' 1380 ^ gca act ggg acc tea tac atg tgc aag tgt gee gag ggc tat gga 4194 Ala Thr Gly Thr Ser Tyr Met Cys Lys Cvs Ala Glu Gly Tyr Gly 1385 1390 1395 ' ggg gac ttg tgt gac aac aag aat gac tet- gee aat gee tgc tea 4239 Gly Asp Leu Cvs Asd Asn Lys Asn Asp Ser Ala Asn Ala Cys Ser 1400 ' * 1405 1410 gee ttc aag tgt cac cat ggg cag tgc cac ate tea gac caa ggg 4284 Ala Phe Lys Cys His His Gly Gin Cys His lie Ser Asp Gin Gly 1415 1420 1425 gag ccc tac tgc ctg tgc cag ccc ggc ttt age ggc gag cac tgc 1329 Glu Pro Tyr Cys Leu Cys Gin Fro Gly Fhe Ser Gly Glu His Cys 1430 1435 1440 caa caa gag aat ccg tgc ctg gga caa gta gtc ega gag gtg ate 4374 Gin Gin Glu Asn Pro Cys Leu Gly Gin Val Val Arg Glu Val lie 1445 1450 1455 ege ege cag aaa ggt tat gca tea tgt gee aca gee tee aag gtg 4419 Arg Arg Gin I,ys G1 v Tyr Ale Ser Cys Ala. Thr Ala Ser i.ys Val" 1460 ' ' ' 1465 ' 1470 ' ccc ate atg gaa tgt cgt ggg ggc tgt ggg ccc cag tgc tgc cag 4464 Pro lie Met Glu Cys Arg Gly Gly Cys Gly Pro Gin Cys Cys Gin 1475 1480 1485 ccc acc ege age aag egg egg aaa tac gtc ttc cag tgc aeg gac 4509 Pro Thr Arg Ser Lys Arg Arg Lvs Tyr Val Phe Gin Cys Thr Asp 1490 1495 1500 ggc tee teg ttt gta gaa gag gtg gag aga cac tta gag tgc ggc 4554 Glv Ser Ser Phe Val Glu Glu Val Glu Arg His Leu Glu Cvs Gly 1505 1510 1515 " · tgc cIc geg igi tee laa 4572 Cys Leu Ala Cys Ser 1520 <210> 15 <211> 1523 <212> PRT <2i3> 智人(Homo sapiens) <400> 15 Mot Ala Pro Gly Trp Ala Gly Val Gly Ala Ala Val Arg Ala Arg Leu 1 5 10 15 Ala Leu Ala Leu Ala Leu Ala Ser Val Leu Ser Gly Pro Pro Ala Val 20 25 30 Ala Cys Pro Thr Lys Cvs Thr Cys Ser Ala Ala Ser Val Asp Cys His 35 40 45 Gly Leu Gly Leu Arg Ala Val Pro Arg Gly lie Pro Arg Asn Ala Glu 50 55 60 Arg L^u Asp Leu Asp Arg Asn Asn lie Thr Arg lie Thr Lys Met Asp 65 70 75 80 Phe Ala Gly Leu Lys Asn Leu Arg Yal Leu His Leu Glu Asp Asn Gin 85 90 95 Val Ser Val lie Glu Arg Gly Ala Phe Gin Asp Leu Lys Gin Leu Glu 100 . 105 110 Arg Leu Arg Leu Asn Lvs Asn Lys Leu Gin Val Leu Pro Glu Leu Leu 115 120 125 Phe Gin Ser Thr Pro Lvs L冊 Thr Arg Leu Asp Leu Ser Glu Asn Glsi 130 135 140 lie Gin Gly lie Pro Arg Lys Ala Phe Arg Gly lie Thr Asp Val Lvs 145 150 15o 160 Asn Leu Gin Leu Asp Asn Asn His lie Ser Cys He Glu Asp Gly Ala 165 170 175 Phe Arg Ala Leu Arg Asp Leu Glu lie Leu Thr Leu Asn Asn Asn Asn 180 185 190 lie Ser Arg lie Leu Val Thr Ser Phe Asn His Mel Pro Lys lie Arg 195 200 205
[0011] Tlxr Leu Arg Leu His Ser Asn His Leu Tyr Cys Asp Cys His Leu Ala 210 215 220 Trp Leu Ser Asp Trp Leu Arg Gin Arg Arg Thr Val Gly Gin Plie Thr 22b 230 235 240 Leu Cys Mel Ala Pro Val His Leu Arg Gly Phe Asn Val Ala Asp Val ' 245 250 255 Gin Lys Lys Glu Tyr Val Cys Pro Ala Pro His Ser Glu Pro Pro Ser ' 260 ' 265 270 Cys Asn Ala Asn Ser lie Ser Cys Pro Ser Pro Cys Thr Cvs Ser Asn ' 275 280 ' 285 Asn lie Val Asp Cys Arg Gly Lys Gly Leu Met Glu He Pro Ala Asn 290 ' 295 300 Leu Pi'o Glu Gly lie Val Glu lie Arg Leu Glu Gin Asn Ser lie Lys 305 310 315 320 Ala lie Pro Ala Gly Ala Phe Thr Gin Tyr Lys Lys Leu Lys Arg lie 325 330 335 Asp ile Ser Lys Asn Gin lie Ser Asp lie Ala Fro Asp Ala Phe Gin 340 345 350 Gly Leu Lys Ser Leo Thr Ser Leu Val Leu Tyr Giy Asn Lws lie Thr ' 355 360 ' 365 Glu Ile Ala Lys Glv Leu Phe Asp G1y Leu Yal Ser Leu Gin Leu Len 370 375 ~ 380 Leu Leu Asn Ala Asn Lys Ile Asn Cys Leu Arg Val Asn Thr Phe Gin 385 390 395 100 Asp Leu Gin Asn Leu Asn Leu Len Ser Leu Tyr Asp Asn Lys Len Gin 405 410 415 Thr Tie Ser Lys Gly Leu Phe Ala Pro Leu Gin Ser Tie Gin Thr Leu 420 ' 425 430 His Leu Ala Gin Asn Pro Phe Val Cys Asd Cys His Leu Lvs Trp Len 4.35 440 * 445 Ala Asp Tyr Leu Gin Asp Asn Pro lie Glu Thr Ser Gly Ala Arg Cys 450 455 460 Ser Ser Pro Arg Arg Leu Ala Asn Lys Arg Ile Ser Gin Ile Lvs Ser 465 470 475 480 Lys Lys Phe Arg Cys Ser Glv Ser Glu Asp Tyr Arg Ser i\rg Phe Ser 485 490 495 Ser Glu Cys Phe Met Asp Leu Val Cys Pro Glu Lys Cys Arg Cys Glu 500 505 510 Glv Thr Ile Val Asp Cys Ser Asn Gin Lvs Leu Val Arg Ile Pro Ser 515 520 525 His Leu Pro Glu Tvr Val Thr Asp Leu Arg Leu Asn Asp Asn Glu Yal 530 535 540 Ser Yal Leu Glu Ala Thr Gly Ile Phe Lys Lvs Leu Pro Asn Leu Arg 545 550 555 560 Lys lie Asn Leu Ser Asn Asn Lys lie Lys Glu Val Arg Glu Glv Ala 565 570 575 Phe Asp Gly Ala Ala Scr Val Gin Glu Lou Met Leu Thr Glv Asn Gin 580 585 590 Leu Glu Thr Val His Gly Ai'g Yal Phe Arg Gly Leu Ser Gly Leu Lys 595 600 605 Thr Leu Met Leu Arg Ser Asn Leu lie Glv Cys Val Ser Asn Asp Thr 610 til5 620 Phe Ala Gly Leu Ser Ser Val Arg Leu Leu Ser Leu Tyr Asp Asn Arg 625 630 635 640 Ile Thr Thr Ile Thr Pro Gly Ala Phe Thr Thr Leu Val Ser Leu Ser 645 650 655 Thr Ile Asn Leu Leu Ser Asn Pro Phe Asn Cys Asn Cys His Leu Ala 660 665 670 Trp Leu Gly Lys Trp Leu Arg Lys Arg Arg Ile Val Ser Gly Asn Pro 675 680 685 Arg Cys Gin Lys Pro Phe Phe Leu L?s Glu Ile Pro lie Gin Asp Val 690 695 700 Ala Ile Gin Asp Phe Thr Cys Asp Gly Asn Glu Glu Ser Ser Cvs Gin 705 710 ' 715 ' 720 Leu Ser Pro Arg Cys Pro Glu Gin Cys Thr Cys Met Glu Thr Val Val 725 730 735 Arg Cys Ser Asn Lvs Glv Leu Arg Ala Leu Pro Arg Glv Met Pro Lvs 740 ' ' 745 750 "
[0012] Asp ¥al Thr Glu Leu Tyr Leu Glu Gly Asn His Leu Thr Ala Yal Pro 755 · 760 · 765 Arg Glu Leu Ser Ala Leu Arg His Leu Thr Leu lie Asp Leu Ser Asn 770 775 780 Asn. Ser lie Ser Met Leu Thr Asn Ivr Thr Phe Ser Asn Met Ser His 785 790 ~ 795 800 Leu Ser Thr Leu lie Leu Ser Tyr Asn Arg Leu Arg Cys lie Pro Val 805 ' 810 815 His Ala Phe Asn Gly Leu Arg Ser Leu Arg Val Leu Thr Leu His Gly 820 ' 、 825 830 ' Asn Asp lie Ser Ser Val Pro Glu Gly Ser Phe Asn Asp Leu Thr Ser 835 840 t 845 Leu Ser His Leu Ala Leu Gly Thr Asn Pro Leu His Cys Asp Cys Ser 850 855 860 ^ Leu Ai'g Trp Leu Ser Glu Trp Val Lts Ala GIt Tyr Lys Glu Pro G1t 865 870 ' 875 880 lie Ala Arg Cys Ser Ser Pro Glu Fro Met Ala Asp Arg Leu Leu Leu ^ 885 890 B95 Thr Thr Pro Thr Ills Arg Phe Gin Cvs Lys Gly Pro Val Asp lie Asn 900 905 910 lie Val Ala Lys Cys Asn Ala Cys Leu Ser Ser Pro Cvs Lys Asn Asn 915 ^ 920 925 Glv Thr Cys Thr Gin Asp Pro Val Glu Leu Tvr Arg Cvs Ala Cys Pro 930 935 940 ' T^rr Ser Tvr Lys Gly Lys Asp Cys Thr Val Pro lie Asn Thr Cys lie 945 ^ 950 ^ 955 960 Gin Asn Pro Cys Gin His Gly Glv Thr Cys His T,eu Ser Asp Ser His 965 ^ ' 970 975 Asp Γτ〗γ H Ser 〇s Ser Os Pro Len GW Phe ftlu GW Gin Arg ' 980 ' ' 985 ' 990 Cys Glu lie Asn Pro Asp Asp Cvs Glu Asp Asn Asp Cys Glu Asn Asn 995 1000 1005 Ala Thr Cys Val Asp Gly lie Asn Asn Tyr Val Cvs lie Cvs Pro 1010 1015 1020 Pro Asn Tyr Thr Gly Glu Leu Cys Asp Glu Yal lie Asp His Cys 1025 1030 1035 Val Pro Glu Leu Asn Leu Cvs Gin His Glu Ala Lvs Cvs lie Pro 1040 1045 1050 Leu Asp Lys Gly Phe Ser Cys Glu Cys Val Pro Cly Tyr Ser €ly 1055 1060 1065 Lys Leu Cys Glu Thr Asp Asn Asp Asp Cvs Yal Ala His Lvs Cys 1070 1075 1080 Arg His Gly Ala Gin Cvs Val Asp Thr lie Asn Gly Tyr Thr Cys 1085 1090 1095 Till' Cvs Pro Gin Gly Pho Ser Gly Pro Phe Cys Glu His Pro Pro 1100 1105 1110 Pro Met. Val Leu Lou Gin Thr Scr Pro Cys Asp Gin Tyr Glu Cys 1115 1120 1125 Gin Asn Gly Ala Gin Cys lie Val Val Gin Gin Glu Pro Thr Cys 1130 1135 1140 Arg Cys Pro Pro Gly Phe Ala Gly Pro Arg Cys Glu Lys Leu lie 1145 1150 1155 Thr Yal Asn Phe Val Gly Lys Asp Ser Tvr Yal Glu Leu Ala Ser 1160 1165 1170 Ala Lys Val Arg Pro Gin Ala Asn lie Ser Leu Gin Val Ala Thr 1175 1180 1185 Asp Lys Asp Asn Gly lie Leu Leu Tyr Lys Gly Asp Asn Asp Pro 1190 1195 1200 Leu Ala Leu Glu Leu Tyr Gin Glv His Val Arg Leu Val Tyr Asp 1205 ' 1210 1215 Ser Leu Ser Ser Pro Pro Thr Thr Val Tyr Ser Val Glu Thr Yal 1220 1225 1230 Asn Asp Gly Gin Phe His Ser Val Glu Leu Yal Thr Leu Asn Gin 1235 ' 1240 1245 Thr Leu Asn Leu Val Val Asp Lys Gly Thr Pro Lys Ser Leu Gly 1250 1255 1260 ' Lvs I.eu Gin Lys Gin Pro Ala. Val Glv lie Asn Ser Pro Leu Tyr 1265 1270 1275
[0013] Leu Glv Gly lie Pro Thr Ser Thr Glv Leu Ser Ala Leu Arg Gin 1280 1285 1290 Glv Thr Asp Arg Pro Leu Glv Gly Phe His Gly Cys lie His Glu 1295 1300 1305 ¥al Arg lie Asn Asn Glu Leu Gin Asp Phe Lys Ala Leu Pro Pro 1310 1315 1320 Gin Ser Leu Gly Val Ser Pro Gly Cys Lys Ser Cys Thr Val Cys 1325 ' 1330 t ^ 1335 ' Lys His Gly Leu Cys Arg Ser Val Glu Lys Asp Ser Val ¥al Cys 1340 1345 1350 Glu Cys Arg Pro Gly Trp Thr Gly Pro Leu Cys Asp Gin Glu Ala 1355 ' 1360 ' - 1365 Arg Asp Pro Cys Leu Gly His Arg Cys His His Gly Lys Cys Val 1370 1375 t 1380^ Ala Thr Gly Thr Ser Tyr Met Cys Lys Cys Ala Glu Glv Tyr Glv 1385 1390 1395 Gly Asp Leu Cys Asp Asn Lys Asn Asp Ser Ala Asn Ala Cys Ser MOO 1405 1410 ' Ala Phe Lys Cys His His Gly Gin Cys His lie Ser Asd Gin Gly 1415 1420 ~ 1425 ^ Glu Pro Tyr Cys Leu Cys Gin Pro Gly Phe .Ser Glv Glu His Cys 1430 ' ' 1435 ' 1440 ^ Gin Gin G丄u Asn Pro Ofs Leu Giy Gin Vai Val Arg Giu Val lie 1445 1450 1455 Arg Arg Gin Lys Gly Tyr Ala Ser Cys Ala Thr Ala Ser Lys Val 1460 ^ ' ' 1465 ^ 1470 Pro He Met Glu Cys Arg Glv Gly Cvs Glv Pro Gin Cvs Cys Gin 1475 1480 1485 Pro Thr Arg Ser Lys Arg Arg Lys Tyr Val Phe Gin Cvs Thr Asp 1490 1495 1500 Glv Ser Ser Phe Val Glu Glu Val Glu Arg His Leu Gl'i Cys Gly 1505 1510 1515 Cys Leu Ala Cvs Ser ' 1520 - <210> 16 <211> 99 <212> DNA <213> 智人(Homo sap iens) <220> <22?> CDS <222> (1).. (99) <400> 16 aig gcc ccc ggg tgg gca ggg gtc ggc gcc gcc gtg cgc gcc cgc ctg 48 Met Ala Pro Gly Trp Ala Gly Val Gly Ala Ala Val Arg Ala Arg Leu 1 5 ^ ^ 10 15 gcg ctg gcc ttg gcg ctg gcg age gtc ctg agt ggg ect cca gr.r. gtc 96 Ala Leu Ala Leu Ala Leu Ala Ser Val Leu Ser Glv Pro Ρ-- Ala Val 20 25 3Q gcc 99 Ala <210> 17 <211> 33 FKT <213> 智人(Homo sapiens) <400> 17 Met Ala Pro Gly Trp Ala Glv Val GW Ala Ala Val Arg Ala Arg Leu 1 5 ~ ~ 10 15 A.【a Leu Aia Leu A丄a Leu Aia Ser Vai Leu Ser Gly Fro Pro Ala Vai 20 25 30 Ala
【权利要求】
1. 一种融合蛋白,其特征在于,所述的融合蛋白自N端至C端具有式la或lb所述的结 构: A-X-E-Y1-Y2 式 la ; A-Y2-Υ1-Ε-X 式 lb ; 其中, A为任选的分泌信号肽; X为Slit3蛋白的富含亮氨酸的重复序列2 (leucine-rich repeat2, LRR2)元件; E为酶切位点; Y1为第一标签多肽元件; Y2为第二标签短肽元件,所述第二标签短肽元件为His标签元件; "一"表示连接上述元件的肽键或肽接头。
2. 如权利要求1所述的融合蛋白,其特征在于,所述的Y1包括SEQ ID NO. : 2所示的改 良型亲和素标签(Strap II标签)、链亲和素(Strepavidin)标签。
3. 如权利要求1所述的融合蛋白,其特征在于,所述的Y1为Strap II标签,而Y2为 8XHis标签元件。
4. 如权利要求1所述的融合蛋白,其特征在于,所述的S1U3LRR2的氨基酸序列如SEQ ID NO. : 5 所示。
5. -种分离的多核苷酸,其特征在于,所述的多核苷酸编码权利要求1所述的融合蛋 白。
6. -种表达载体,其特征在于,所述的表达载体含有权利要求5所述的多核苷酸。
7. -种宿主细胞,其特征在于,所述的宿主细胞含有权利要求6所述的表达载体或转 染了权利要求5所述的多核苷酸。
8. 如权利要求7所述的宿主细胞,其特征在于,所述的宿主细胞包括哺乳动物细胞;较 佳地包括CH0细胞、293细胞。
9. 一种制备S1U3LRR2蛋白的方法,其特征在于,所述的方法包括步骤: (i) 在合适的表达条件下,培养如权利要求8所述的宿主细胞,从而表达权利要求1所 述的融合蛋白; (ii) 从培养体系中分离纯化出权利要求1所述的融合蛋白; (iii) 对所述的融合蛋白,用针对元件E的蛋白酶进行酶解,从而制得S1U3LRR2。
10. -种制备S1U3LRR2蛋白的方法,其特征在于,所述的方法包括步骤: 对权利要求1所述的融合蛋白,用针对元件E的蛋白酶进行酶解,从而制得S1U3LRR2。
11. 一种纯化的S1U3LRR2蛋白,其特征在于,是通过权利要求9或10所述的方法生产 制备的。
【文档编号】C12P21/02GK104119448SQ201310151609
【公开日】2014年10月29日 申请日期:2013年4月26日 优先权日:2013年4月26日
【发明者】李华顺 申请人:李华顺
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1