在转基因哺乳动物奶中生产融合蛋白的方法

文档序号:3556009阅读:351来源:国知局
专利名称:在转基因哺乳动物奶中生产融合蛋白的方法
技术领域
本发明涉及具有生物活性并可以用于药物学的双功能融合蛋白的生产。特别地,本发明提供在转基因哺乳动物奶中尤其是非人胎盘哺乳动物奶中生产与重组人α-甲胎蛋白序列相连的β-干扰素和α-甲胎蛋白融合蛋白序列,并提供了该融合蛋白在治疗应用或病症中的用途。
背景技术
如上所述,本发明总地涉及在转基因动物奶中转基因生产融合蛋白的领域。具体地,涉及产生能够生产各种目标融合蛋白的各种物种的转基因非人哺乳动物的改良方法。
目前,存在许多药物学上未能开发的具有一个或多个潜在治疗活性的多肽、大分子和/或蛋白质(“感兴趣的蛋白质”)。对于该无能存在各种原因,如体内的低稳定性、非-真核细胞蛋白质中发现的改变的糖基化模式、不适当的翻译加工、三级结构、脆性结构、免疫原性、工业可接受规模生产的困难性等等。此外,由于与其纯化方法、给药或药物动力学相关的问题,一些治疗上感兴趣的蛋白质在体内没有给出所期望的结果。
本发明使得克服这些缺陷成为可能。本发明提供了新的融合分子,其可以开发感兴趣蛋白质的生理特性或效应。特别地本发明起因于以下的证明可以将源自生物活性蛋白质的生理活性序列与由保留人α-甲胎蛋白生理活性的蛋白质序列组成的另一重组蛋白质结构融合来获得双功能融合蛋白,而没有削弱α-甲胎蛋白或其第二个蛋白部分的生物特性。还起因于发明者的证明本发明的重组人α-甲胎蛋白蛋白序列(“AFP”)可以提高本发明融合蛋白的半衰期,以及还增加了协同的治疗效能。
现有技术中已经显示了AFP的生理效应包括对各种细胞类型的刺激和抑制效果。这些效果大部分由靶细胞类型、AFP的相对浓度以及其它细胞因子和生长因子的存在来决定。例如,AFP可以抑制多种肿瘤细胞的生长,尤其是,抑制雌激素刺激的或雌激素敏感的细胞的生长。相反地,AFP刺激正常胚胎成纤维细胞的生长。AFP还已经显示了具有免疫抑制和免疫增生效果。因此可以这样利用AFP融合蛋白的治疗效用来最大化各种病况的治疗药理有效性,尤其是使用双功能分子。
根据本发明的融合蛋白可以在动物体内维持所需的生物活性延长的时间段。还可以通过重组生物体在允许商业开发的水平上分泌表达根据本发明的目标蛋白质,如在细胞培养生产设备或转基因哺乳动物中。沿着这条线,转基因哺乳动物对于本发明的融合蛋白是优选的生产和表达载体。
长期需要具有特定所需特性或特征的哺乳动物,如提高的体重、奶含量、奶生产体积、哺乳间隔的长度和疾病抗性。传统育种方法能够产生具有一些特定所需特性的动物,但是这些特性通常伴随多种非所需的特征,且通常太费时、成本高和发展不可靠。此外,这些方法完全不能够使特定动物系产生基因产物,如所述物种的遗传互补另外完全缺失的所需蛋白治疗剂(即,人或人源化血浆蛋白或有蹄类奶中的其它分子)。能够产生转基因动物的技术发展在生产工程化携带特定特性或设计成表达特定蛋白或其它新的治疗、科学或商业价值的分子化合物的动物中提供了特别精确的方法。即,转基因动物是携带已经在发育早期有意引入现有体细胞和/或种系细胞的目标基因的动物。随着动物的发育和生长,工程化进入动物中的蛋白产物或特定的发育改变得到表达,而且在这一点上存在于该动物及其后代的遗传互补中。
本发明的优选实施方案中提供了在转基因哺乳动物奶中批量生产目标双功能融合蛋白。在奶中生产目标融合蛋白作为批量生产方法是理想的,因为使用已知的奶场技术可以生产、收集和纯化非常大体积的奶。使用转基因哺乳动物生产方法的第二个优势在于对于人体内生物活性必需的一些反应,例如羧基端酰胺化,通过现有化学方法或在细菌中或其它体外情况中是难以以良好产量来进行的。例如,通过识别并修饰目标融合蛋白或羧基端具有甘氨酸残基的蛋白的特定酶来催化羧基端酰胺化。因此,本发明合适设计的融合蛋白可以在分泌进入转基因动物的奶之前得到特异性的酰胺化。这只是可以通过乳腺中的生物合成途径进行并可能用于特定融合蛋白合成的一系列翻译后修饰的一个实例。所需翻译后修饰的其它实例包括二硫桥形成、谷氨酸残基的γ-羧化作用以及O-和N-连接糖基化的加入。
关于AFP的生理活性片段,还必须注意重组AFP的非糖基化形式呈现与正常糖基化形式相似的生物特性并由于缺少糖基化的可变性提供了标准化的均一产品。还可以更容易地在体外或转基因系统中生产。因此,非糖基化AFP对于商业生产是优选的形式。
根据现有技术,能够生产目标重组蛋白的动物的产生是已知的。然而,在本发明之前仍然未知的是本发明所需的遗传操纵水平、各种可获得融合蛋白成分的修饰序列、本发明双功能分子的协同作用及其在病状或病理学中的用途。
因此,存在对治疗组合物改良生产方法的需要。在核移植范围内,本发明的方法通常应用于初级体细胞,来产生可用于在它们的奶中生产目标重组融合双功能蛋白的转基因动物。

发明内容
简要地说,本发明提供了生产所关心的双功能融合蛋白的方法,优选通过使用转基因动物。该方法包括用给定的转基因构建体转染非人哺乳动物细胞系,该构建体含有至少一个编码所需的第一个所需肽片段和第二个所需肽片段的重组DNA编码序列,其中每个片段保留目标单个蛋白的生物活性。该方法包括产生DNA构建体;选择其中所需重组序列已经插入细胞或细胞系基因组中的细胞系;进行核移植程序来产生与所需融合蛋白杂合的转基因动物。此后,可以从转基因动物的奶或其它体液中收集表达双功能融合蛋白的融合蛋白并纯化用作治疗剂。
根据本发明可以进行的另一步骤是将杂合转基因动物活体切片检查。此后,根据本发明,用从杂合动物获得的活体切片检查过的细胞系来体外扩大细胞系,在较短的时间段内产生多个转基因动物。
可替换地或另外地,可以进行核移植程序来产生转基因细胞团,用于研究、连续克隆或其它的体外用途。本发明的优选实施方案中,通过几种已知的分子生物学方法中的一种来表征存活细胞,这些方法包括但不限于FISH、DNA印迹法或PCR。以上提供的方法可以加速生产与所需转基因纯合的转基因动物畜群并因此更有效地生产所需的生物药物。这样,本发明可以生产遗传上所需的自身表达目标双功能融合蛋白的牲畜或非人哺乳动物。
此外,本发明的方法还可以产生一个或多个携带特别有益或有价值融合蛋白的纯合动物,潜在地提高所需蛋白质的畜群产量,比现有方法更快。同样,本发明的方法还提供了替代由于疾病或其自身死亡失去的特定转基因动物。它们还将有助于和促进用各种DNA构建体构建的转基因动物的生产以致最佳化所需生物药物组合物的生产并降低生产成本。
因此,根据本发明的实施方案,可以用于制造与目标融合蛋白纯合的转基因动物。该实施方案中,优选表征目标转基因和杂合转基因动物的遗传组成。此后,通过使用标记物质来选择与所需转基因纯合的细胞;使用已知的分子生物学方法来表征存活细胞;挑选存活细胞或细胞集落细胞用于第二轮核移植或胚胎移植;和生产与所需融合蛋白纯合的动物。
因此本发明的一个主题涉及双功能融合蛋白,该融合蛋白含有源自具有治疗活性肽片段的活性部分,该活性部分与人α-甲胎蛋白或人α-甲胎蛋白变体偶联,这两部分具有分开的效果,且在一些情况中具有协同效果。
本发明的另一主题涉及上述嵌合分子的制备方法。更具体地,该方法包括促使真核或原核细胞宿主表达编码所需融合蛋白的核苷酸序列,且然后收集融合蛋白产物。
因此,本发明的目的是提供能够治疗重症肌无力的药物。
本发明的另一目的是提供抑制癌细胞增生的药物和/或对可以发展成能够供养肿瘤的血管的内皮细胞是抗血管生成的药物。
本发明的再一目的是提供治疗类风湿性关节炎患者的方法。
本发明的另一目的是提供使用在此所述的药物来治疗癌症的方法。
本发明的另一目的是提供使用根据本发明的双功能蛋白质来治疗皮肤病或受损皮肤的方法。
通过本发明可以达到阅读以下公开内容时更显而易见的这些和其它目的。


图1显示了实施本发明所涉及方法的流程图。
图2显示了通过核移植形成克隆动物方法的概图。
图3显示了β-干扰素氨基酸序列的图。
图4显示了所关心的融合蛋白。
详述以下的缩写在说明书中具有指定的含意缩写的解释体细胞核移植(SCNT)囊性纤维化跨膜传导调节蛋白 (CFTR)核移植 (NT)合成输卵管流体 (SOF)胎牛血清(FBS)聚合酶链式反应 (PCR)牛血清白蛋白(BSA)术语解释
AFP分泌信号或“AFP信号肽”或“AFP前导序列”或“AFP信号序列”——具有与基因库登记号No.V01514所列氨基酸1-18基本上相同氨基酸序列的肽(通过核苷酸45-98编码)。蛋白质分泌信号是在加工或成熟处理过程中从AFP切割得到的。
牛——属于各种物种的奶牛或与各种物种的奶牛相关。
生物活性/生理活性——指的是广义地解释。在干扰素样蛋白质的情况中,包括所有已知(或待发现的)特性,包括对人IFN-α或对人IFN-β具有特异性的或两者所共有的特性,如它们的抗病毒活性及其调节主要组织相容性复合体(MHC)的抗原的能力。
生物流体——生物体如哺乳动物、鸟、两栖动物或爬行动物产生的水溶液,其含有浸于水溶液中的细胞分泌的蛋白质。实例包括奶、尿液、唾液、精液、阴道流体、滑液、淋巴液、羊水、血液、汗水和眼泪;以及植物产生的水溶液,例如,包括渗出液、叶尖吐水、木质部、韧皮部、树脂和花蜜。
生物流体产生细胞——生物流体浸泡的并将蛋白质分泌至生物流体的细胞。
生物药物——意思是其来源、合成或制造涉及使用微生物、重组动物(包括,无限制,嵌合或转基因动物)、核转移、微量注射或细胞培养技术的任何药物、治疗剂、疫苗或任何药物上有用的组合物。
公山羊——属于各种物种的山羊或与各种物种的山羊相关。
编码——通常指的是以可翻译形式存在的序列信息,通常可操作地连接于启动子(例如,β-酪蛋白或β-乳球蛋白启动子)。当功能启动子提高该序列的转录或表达时,将序列可操作地连接于启动子。认为反义链也编码序列,因为相同信息内容以容易获得的形式存在,尤其是当连接于促进有义链表达的序列时。使用标准的或修饰的遗传密码,信息是可转变的。
表达载体——遗传上工程化的质粒或病毒,源自例如噬菌体、腺病毒、逆转录病毒、痘病毒、疱疹病毒或人工染色体,用于将可操作地连接于启动子的AFP融合蛋白编码序列转移至宿主细胞中,使得编码的重组AFP融合蛋白在宿主细胞中得到表达。
功能蛋白——具有生物活性或其它活性或用途的蛋白质,与内源产生时看到的相似。
融合载玻片——以固定距离分开放置的平行电极的载玻片。将细胞偶联体放置于电极之间来接受用于融合和激活的电流。
同源序列——指的是当比较时呈现相似性的遗传序列。核酸同源性的标准是通常本领域所用的同源性量度或杂交条件。核酸的基本上同源性意思是区段或其互补链当比较时,当最佳序列比对时,至少约60%的残基,通常至少约70%,更通常至少约80%,优选至少约90%,且更优选至少约95%至98%的核苷酸是相同的,具有适当的核苷酸插入或缺失。或者,在选择性杂交条件下,当区段与一条链或其互补链杂交时呈现基本上同源性。当比特异性全部缺失更有选择性发生杂交时呈现杂交的选择性。通常,当在至少约14个核苷酸的一段序列上存在至少约55%同源性,优选至少约65%,更优选至少约75%,且最优选至少约90%时,将发生选择性杂交。
人α-甲胎蛋白或“AFP”或“rAFP”——具有与基因库登记号No.V01514(SEQ ID NO4)所列的成熟α-甲胎蛋白(氨基酸19-609)基本上相同的氨基酸序列并通过基因库登记号No.V01514(SEQ IDNO3)所列cDNA序列的核苷酸99-1874编码的并报道于Morinaga等(PROC.NATL.ACAD.SCI.USA 804604-4608,(1983))中的肽。
人α-甲胎蛋白前体——具有与基因库登记号No.V01514(SEQ IDNO2)所列的氨基酸1-609基本上相同的氨基酸序列并通过基因库登记号No.V01514(SEQ ID NO1)所列的cDNA序列的核苷酸45-1874编码的肽。
前导序列或“信号序列”——编码蛋白质的分泌信号且当可操作连接于编码AFP融合蛋白的下游核酸分子时指导AFP分泌的核酸序列。前导序列可以是天然的人AFP前导序列、人工衍生的前导序列,或可以从与用于指导AFP编码序列转录的启动子相同的基因获得,或来自细胞正常分泌的另一种蛋白质。
产奶细胞——将蛋白质分泌至奶中的细胞(例如,乳房上皮细胞)。
奶特异性启动子——天然指导将蛋白质分泌至奶中的细胞(例如,乳房上皮细胞)中基因表达的启动子,并包括,例如,酪蛋白启动子,例如,α酪蛋白启动子(例如,αS-1酪蛋白启动子和αS2酪蛋白启动子)、β酪蛋白启动子(例如,山羊β酪蛋白基因启动子)(DiTullio,BIOTECHNOLOGY 1074-77,1992)、γ酪蛋白启动子和κ酪蛋白启动子;乳清酸性蛋白(WAP)启动子(Gorton等,BIOTECHNOLOGY51183-1187,1987);β乳球蛋白启动子(Clark等,BIOTECHNOLOGY7487-492,1989);和α-乳清蛋白启动子(Soulier等,FEBS LETTS.29713,1992)。还包括在乳房组织中特异性激活的启动子并因此根据本发明是有用的,例如,鼠乳房肿瘤病毒(MMTV)的长末端重复(LTR)启动子。
非糖基化人AFP——具有与上述成熟人α-甲胎蛋白基本上相同的氨基酸序列的肽,除了包括SEQ ID NO4的氨基酸位置233的天冬酰胺残基至谷氨酰胺残基的突变(如列于SEQ ID NO6),因此消除单个糖基化位点。前体非糖基化人α-甲胎蛋白的核酸序列包括SEQ IDNO5所列序列的核苷酸45至1874。
核移植——指的是克隆方法,其中将核从供体细胞移植入去核的卵母细胞中。
可操作地连接——当合适的分子(例如,转录激活蛋白)结合调控序列时,以允许基因表达的方式将基因与一个或多个调控序列连接。
绵羊——属于绵羊、与绵羊相关或类似绵羊。
单性生殖——胚胎从卵母细胞发育而没有精子的穿透。
药物学纯度——指的是适于明确的生物测试以及用于合适给药来实现人患者治疗的融合蛋白。基本上的药物学纯度意思是至少约90%纯。
猪——属于或类似猪。
启动子——足以指导转录的最小序列。本发明中还包括那些足以使启动子依赖性基因表达变得对于细胞类型特异性、组织特异性、暂时特异性可控制的或通过外部信号或试剂可诱导的启动子元件;这样的元件可以位于天然基因的5’或3’或内含子序列区域中。
蛋白质——如在此所用的包括糖蛋白,以及具有其它附加物的蛋白质。这还包括保留生理功能的断裂的或截短的多肽。
重组——指的是不是天然产生的或是通过人工组合两个另外分开的序列区段制得的核酸序列。通常通过化学合成方法或通过人工操纵核酸的分离区段,例如,通过基因工程技术来实现该人工组合。通常用编码相同或保守氨基酸的多余密码子替代密码子来进行,同时通常引入或除去序列识别位点。或者,将所需功能多肽序列的核酸区段连接在一起来产生包括通常天然形式中没有发现的所需结合功能的单个基因实体。限制酶识别位点通常是这样人工操纵的目标,但是可以通过设计掺入其它位点特异性目标,例如,启动子、DNA复制位点、调节序列、控制序列或其它有用特征。相似的概念用于重组,例如,根据本发明的双功能融合蛋白。
治疗有效量——当给药于患者时,治疗分子或其片段抑制或刺激该分子调节的生物活性的量。
转化、“转染”或“转导”——用于将外源分子引入细胞中的任何方法。脂质转染、DEAE-葡聚糖-介导的转染、微量注射、核移植(参见,例如,Campbell等,BIOL.REPROD.49933-942,1993;Campbell等,NATURE 385810-813,1996)、原生质体融合、磷酸钙沉淀、转导(例如,噬菌体、腺病毒、逆转录病毒或其它病毒传送)、电穿孔和生物弹道转化只是本领域技术人员已知的可以使用的几种方法。
转化细胞或转染细胞——通过重组DNA技术已经引入编码AFP的核酸分子的细胞(或细胞的后代)。核酸分子可以稳定地掺入宿主染色体中,或可以游离基因地维持。
转基因——通过方法插入细胞或其祖先的任何片段的核酸分子,且该核酸分子变成从该细胞发育而来的动物的基因组的一部分。这样的转基因可以包括对转基因动物部分或全部外源(即,外来的)的基因,或可以表示具有与动物的内源基因相同性的基因。
转基因的——包括已经通过方法插入细胞或其祖先的核酸分子的任何细胞,且该核酸分子变成从该细胞发育而来的动物的基因组的一部分。
转基因生物——已经实验上转移进另一生物体的遗传材料的生物,使得该宿主除了其遗传互补中已经具有的,在其染色体中还获得了转移基因的遗传信息。
有蹄类——属于或涉及有蹄的通常食草的四脚哺乳动物,包括,无限制,绵羊、猪、山羊、牛和马。
载体——如在此所用的意思是质粒、噬菌体DNA或其它DNA序列,这些序列(1)能够在宿主细胞中复制,(2)能够转化宿主细胞和(3)含有适于鉴定转化细胞的标记。
根据本发明,提供了生产所关心融合蛋白的方法,该方法包括在转基因非人胎盘哺乳动物的奶中表达融合蛋白,该融合蛋白包括连接于第二个目标多肽的第一个目标多肽,两个多肽具有独立的生理效应。
用于本发明的双功能分子中的一个目标蛋白质家族是蛋白质的干扰素家族。干扰素(“IFN”)构成一组天然生成的蛋白质,已知其呈现抗病毒、抗肿瘤和免疫调节性能。这类细胞因子具有免疫刺激/调节活性。干扰素是一族小蛋白和糖蛋白,具有约15,000至28,000道尔顿(15-28kDa)分子量,主要通过细胞响应病毒感染以及响应合成或生物诱导剂在体内产生和分泌。用于描述和命名干扰素的命名法约定是复杂的。这大部分是由于发展中的知识和技术,其已经显示通过相同类型细胞产生的多种干扰素,干扰素不同种类和形式的发现,以及与之前报道的其它相同的相同形式的发现。因为人天然干扰素长期以来提取是昂贵的,因此已经发展技术来制备重组形式的人干扰素。
干扰素通过结合细胞表面的特定膜受体来发挥它们的细胞活性。一旦结合细胞膜,干扰素启动一连串复杂的胞内事件,包括某些其它细胞因子的上调、某些酶的诱导、细胞增殖的抑制、免疫调节活性如巨噬细胞吞噬细胞活性的提高和淋巴细胞对靶细胞特定细胞毒性的增大(例如,细胞免疫性),和病毒感染细胞中病毒复制的抑制。
多种生物活性与IFN相关,包括抗病毒、抗增生和免疫调节活性。治疗用途包括治疗多毛细胞白血病、慢性骨髓性白血病、低级非霍奇金淋巴瘤、皮肤T细胞淋巴瘤类癌瘤、肾细胞癌、头和颈的鳞状上皮肿瘤、多发性骨髓瘤和恶性黑素瘤。对于病毒疾病,已经发现IFN-α有助于治疗由乙型肝炎或丙型肝炎病毒引起的慢性活动性肝炎。
1993年,美国食品和药品管理局(FDA)批准β干扰素(IFN-β)作为多发性硬化(MS)的治疗剂。β干扰素的给药减慢了这种慢性的且通常损坏神经的在美国影响了约350,000人群的疾病的进展。药物的可获得性对于MS患者是里程碑,这些患者通常从皮质类固醇和其它治疗剂获得不足的益处。
MS是自体免疫疾病,其中身体防御系统攻击髓鞘,髓鞘是保护脑和脊髓神经纤维的脂肪物质,和覆盖电线的绝缘体非常象。因为MS损伤在髓鞘中形成了破损,传导至脑或从脑传导出来的电脉冲受到了破坏。结果,患有MS的患者经历包括虚弱、疲劳、失禁、视觉缺陷、语言不清或有时候瘫痪的症状。现有技术中已经显示β干扰素正面影响了多发性硬化的治疗。服用高剂量β干扰素的复发-减轻MS的不卧床患者具有约低30%的发作,且严重程度是服用安慰剂患者的一半。因此,通过本发明方法制得的所关心分子是AFP-IFN-β双功能融合蛋白,当治疗上用于对抗MS时,具有有益的协同效果。即,通过功能α-甲胎蛋白部分的存在来协同性提高β-IFN的治疗效果,功能α-甲胎蛋白部分自身具有对抗MS的有益效果。
用于可能的体外生产的原核或真核的合适宿主生物体包括大肠杆菌(E.coli)、假单胞菌(Pseudomonas)、枯草芽孢杆菌(Bacillussubtilis)、苏云金芽孢杆菌(Bacillus thringiensis)、各种酵母菌株、嗜热芽孢杆菌(Bacillus thermophilus),动物细胞如小鼠、大鼠或中国仓鼠卵巢(CHO)细胞,植物细胞,动物和植物宿主等等。必须认识到当用载体转化选择的宿主时,为了使蛋白质序列得到表达,还将合适的启动子-操纵基因序列引入。宿主可以是原核的或真核的,对于体外系统,大肠杆菌和CHO细胞是优选的宿主。依据用于生产本发明的蛋白质和遗传工程化序列的DNA序列的宿主生物体中发生的糖基化作用,根据本发明表达的融合蛋白可以是糖基化的或非糖基化的。如果需要,当大肠杆菌或芽孢杆菌是宿主生物体时,获得的所表达的非糖基化蛋白质可以在体外任选地糖基化,通过化学、酶或本领域已知的其它类型修饰。
根据本发明用于转基因动物的方法,适于体细胞核移植的转基因初级细胞系(来自公山羊、牛、绵羊、猪或任何其它非人脊椎动物)是通过所关心的融合蛋白核酸构建体(例如,靶向人α甲胎蛋白-β干扰素融合蛋白乳腺表达的乳腺特异性转基因)转染形成的。转基因构建体可以含有选择标记(如新霉素、卡那霉素、四环素、嘌呤霉素、zeocin、潮霉素或任何其它选择标记)或用能够在细胞培养物中表达选择标记的盒共转染。
本发明提供了含有在此所述核酸序列的表达载体,该核酸序列可操作地连接于至少一个调节序列。许多这样的载体是可购得的,且通过本领域技术人员可以容易地制得其它合适的载体。“可操作地连接”或“操作地连接”指的是以允许通过宿主生物体表达核酸序列的方式将核酸分子与调节序列连接。调节序列是本领域已知的并可以选择来生产编码的多肽或蛋白质。因此,术语“调节序列”包括启动子、增强子和其它表达控制元件,其描述于Goeddel,GENE EXPRESSIONTECHNOLOGYMETHODS IN ENZYMOLOGY 185,(Academic Press,SanDiego,Calif.(1990))。例如,可以使用天然调节序列或对转化的宿主细胞天然的调节序列。
应当理解可以根据这些因素来设计表达载体,如待转化宿主细胞的选择和/或期望得到表达的蛋白类型。例如,可以通过将克隆的基因或其部分连接到适于在原核细胞、真核细胞或两者中表达的载体中来生产本发明的多肽。(A LABORATORY MANUAL,第2版,Sambrook等编辑(Cold Spring Harbor Laboratory Press,1989)第16和17章)。
选择用于所需核酸构建体而重组的集落后,分离并扩大细胞,并根据本领域已知的方法等份冰冻用于长期保存。可以使用标准的生物分子学方法(PCR、DNA印迹法、FISH)来表征所选择的转基因细胞系。携带所关心的双功能融合蛋白的合适拷贝数量的核酸构建体且通常具有单个整合位点(尽管相同技术可以用于多个整合位点)的细胞系,然后可以用作本领域已知的体细胞核移植实验方案中的细胞核供体。核移植和胚胎移植至受体动物并怀孕后,获得活的转基因后代。通常该转基因后代在特定染色体上只携带一个转基因整合,另一条同源染色体在相同的位点不携带整合。因此转基因后代对于转基因是杂合体,维持了目前至少两个连续繁殖周期来产生纯合的转基因动物的需要。
具体实施例方式
实施例1AFP-β干扰素本发明的另一方面是需要本发明双功能融合蛋白患者的治疗方法,通过将治疗有效量的生物流体(例如,奶,尿液,唾液,精液或阴道流体,滑液,淋巴液,羊水,蛋卵黄囊、卵壳或尿囊中的流体,血液,汗水和眼泪;或植物产生的水溶液,包括,例如,渗出液或叶尖吐水,木质部,韧皮部,树脂和花蜜),或其提取物,给药于患者,该生物流体或其提取物包括从转基因非人生物体(例如,哺乳动物(例如,小鼠、山羊、绵羊、骆驼、奶牛、猪、兔子、马、牛或美洲驼)、鸟、爬行动物、两栖动物或植物)获得的本发明的双功能融合蛋白。理想的实施方案中,本发明的双功能融合蛋白具有SEQ ID NO4、10和24组合所列的序列。另一实施方案中,生物流体是奶。仍然另一实施方案中,从转基因非人生物体的生物流体来纯化本发明的双功能融合蛋白(例如,从哺乳动物的奶、尿液、血液或淋巴液纯化本发明的双功能融合蛋白)。各种理想的实施方案中,本发明的方法可以用于抑制或治疗免疫性疾病,例如,人免疫缺陷病毒(HIV)的感染、癌细胞生长,用于诱导骨髓细胞增殖(例如,骨髓移植后或骨髓毒性治疗如化疗或放疗后),或用作免疫抑制剂(例如,抑制自体反应性免疫细胞增殖、抑制移植器官的排异(例如,移植物抗宿主疾病),或抑制或治疗自体免疫疾病,例如类风湿性关节炎、肌肉萎缩、系统性红斑狼疮、重症肌无力、多发性硬化、胰岛素依赖性糖尿病或牛皮癣)。人AFP基因(基因库登记号#M16110)。
实施例2所关心的融合蛋白的序列A.α甲胎蛋白Seq.Id.1列于基因库登记号No.V01514的完整cDNA序列。
Seq.Id.2基因库登记号No.V01514(氨基酸1-609)。
Seq.Id.3基因库登记号No.V01514(核酸99-1874)来自Seq.Id.1的cDNA。
Seq.Id.4基因库登记号No.V01514(氨基酸19-609)。
Seq.Id.5基因库登记号No.V01514(前体非糖基化人α甲胎蛋白的核酸序列,核酸45-1874)。
Seq.Id.6基因库登记号No.V01514(氨基酸19-609)除了包括SEQ ID NO4在氨基酸位置233的突变,从天冬酰胺残基突变成谷氨酰胺残基来除去AFP中的单个糖基化位点。
Seq.Id.7基因库登记号No.V01514(氨基酸1-18)AFP分泌信号。
Seq.Id.8基因库登记号No.V01514(AFP分泌信号的核苷酸45-98,DNA序列)。
Seq.Id.9人AFP基因(基因库登记号#M16110)。
B.所关心的配偶体蛋白的序列Seq.Id.10基因厍/EMBL/DDBJ登记号No.AAC41702,来自国家生物技术信息中心(National Center for BiotechnologyInformation)——人β干扰素变体1(1-187氨基酸残基)。
Seq.Id.11基因库/EMBL/DDBJ登记号No.CAA00839,来自国家生物技术信息中心——人α干扰素变体2A(1-212氨基酸残基)。
Seq.Id.12基因库/EMBL/DDBJ登记号No.AAP20099,来自国家生物技术信息中心——人α干扰素变体2B(1-166氨基酸残基)。
Seq.Id.13蛋白质序列记录基因库登记号No.NP_795372,来自国家生物技术信息中心——人τ干扰素(1-189氨基酸残基)。
Seq.Id.14蛋白质序列记录基因库登记号No.NP_76918,来自国家生物技术信息中心——人α干扰素变体1(1-189氨基酸残基)。
Seq.Id.15蛋白质序列记录基因库登记号No.NP_000610,来自国家生物技术信息中心——人γ干扰素(1-166氨基酸残基)。
Seq.Id.16基因库/EMBL/DDBJ登记号No.AAH18990,来自国家生物技术信息中心——轻链人铁蛋白(1-175氨基酸残基)。
Seq.Id.17基因库/EMBL/DDBJ登记号No.AAH16857,来自国家生物技术信息中心——重链人铁蛋白(1-183氨基酸残基)。
Seq.Id.18基因库/EMBL/DDBJ登记号No.AAH05322,来自国家生物技术信息中心——人核心蛋白聚糖(1-359氨基酸残基)。
Seq.Id.19基因库登记号No.113936——人抗凝血酶(1-464氨基酸残基)。
Seq.Id.20基因库登记号No.113936——通过在精氨酸残基393和丝氨酸残基394之间抗凝血酶的酶切割产生的“切割的”人抗凝血酶(1-464氨基酸残基)。
Seq.Id.21蛋白质序列记录基因库登记号No.NP_002611,来自国家生物技术信息中心——人血小板因子4(1-104氨基酸残基)。
Seq.Id.22蛋白质序列记录基因库登记号No.NP_000939,来自国家生物技术信息中心——人促乳素(1-227氨基酸残基)。
Seq.Id.23基因库/EMBL DDBJ登记号No.CAA26189,来自国家生物技术信息中心——人降钙素(1-93氨基酸残基)。
Seq.Id.24基因库/EMBL DDBJ登记号No.AAE57231,来自国家生物技术信息中心——IRES衔接物序列变体1(1-236氨基酸残基)。
Seq.Id.25基因库/EMBL DDBJ登记号No.AAH08915,来自国家生物技术信息中心——α-1抗胰蛋白酶(1-406氨基酸残基)。
C.最佳化密码子蛋白质在宿主生物体中的表达,最特别地在转基因生物体中的表达,部分取决于DNA构建体的起始密码子与宿主生物体的最适(或共有)起始位点相配的程度、mRNA密码子使用与宿主生物体的“密码子偏倚性”相配的程度、隐含的内含子剪接位点的存在(可能形成截短的或无义蛋白质),以及所关心的蛋白质中稳定或去稳定信号(即,PEST降解信号)的存在。
源自具有与宿主生物体高度分歧核酸特征的生物体的所关心蛋白质可以从cDNA序列的再次工程化获益,以致最佳化关键氨基酸的密码子,使得它们与给定氨基酸的“优选”或普通核酸密码子更精密地相配对。例如,来自高A-T含量生物体(例如盘基网柄菌(Dictyosteliumdiscoideum)或恶性疟原虫(Plasmodium falciparum))的所关心蛋白质可以更容易地表达,通过将密码子最佳化朝向G-C重密码子,而使氨基酸序列未改变。
在转基因动物生产系统中,使用最佳化的表达系统用于生产大量所关心的蛋白质可能必需制备足够可获得的化合物来使其在治疗上是可行的。为此,对于根据本发明提供的所有双功能融合蛋白,可以使用最佳化密码子再次工程化合成基因。
材料和方法转基因山羊&牛将用作该研究的细胞和细胞系供体的无瘙痒病的纯种和混杂种的阿尔卑斯(Alpine)、萨嫩(Sassen)和吐根堡(Toggenburg)奶场的山羊畜群根据良好农业实践(Good Agricultural Practice,GAP)指导来饲养。相似地,根据GAP指导来饲养所用的牛并保证来源于无瘙痒病和牛脑炎的畜群。
公山羊胎体细胞系的分离用作细胞核供体的初级公山羊胎成纤维细胞系源自35-和40-天的胎。外科手术取出胎并放入平衡的磷酸盐缓冲盐水(PBS,无Ca++/Mg++)中。通过将胎组织切碎暴露于0.025%的胰蛋白酶、0.5mM的EDTA 38℃10分钟来制得单个细胞悬浮液。用胎细胞培养基[平衡的培养基-199(M199,Gibco)含有10%胎牛血清(FBS),补充核苷,0.1mM 2-巯基乙醇,2mM的L-谷氨酰胺和1%的青霉素/链霉素(10,000I.U.每种/ml)]洗涤细胞,并在25cm2的烧瓶中培养。孵育4天后通过胰蛋白酶消化收集初级胎细胞的连生单层,然后维持于培养物中或冷藏。
同质融合蛋白如在此所用的,术语基本上纯的和同质的用来描述已经从天然伴随其的成分中分离出来的蛋白质或多肽。通常,当至少约60至75%的样品呈现单一的多肽主链时,单体蛋白质是基本上纯的。少量变体或化学修饰通常具有相同的多肽序列。基本上纯的蛋白质通常包括超过约85至90%的蛋白质样品,更通常包括至少约95%,优选将超过约99%纯。通常,在聚丙烯酰胺凝胶上测量纯度,使用通过染色测定的同质性。对于某些目的,使用高的分辨率并且利用HPLC或相似的方法来进行纯化。对于大多数目的,将使用简单的色谱柱或聚丙烯酰胺凝胶来测定纯度。
当使蛋白质与其天然状态下伴随其的天然污染物分离时,蛋白质是基本上无天然伴随成分的。因此,化学合成的或在与其天然来源的细胞不同的细胞系统中合成的蛋白质基本上无天然伴随成分。该术语用于描述在异种哺乳动物细胞或植物细胞、大肠杆菌和其它原核生物中合成的多肽和核酸。本发明提供了用于治疗用途的基本上纯的制剂。可以设计各种从生物材料中分离它们的方法,部分基于在此包含的结构和功能描述。
“AFP-配偶体多肽”融合蛋白的构建根据本发明,术语“融合蛋白”用来描述包括两种所关心多肽的融合蛋白,通过衔接物序列氨基酸序列来融合。根据本发明,双功能融合蛋白的产生在提供特定病症改进的治疗选项中是有用的工具。因此,所需融合技术的发展已经变得日益重要。结构生物学中,重组融合蛋白的构建通常用作提高可溶性蛋白的表达和帮助蛋白质纯化的方法。已经将该技术用于研究体外测定中的蛋白质功能活性和用于体内生产。近些年来,在生物技术领域中报道了基因融合技术的广泛应用。这些应用包括抗体的选择和生产以及双功能酶的工程化。
融合蛋白的构建包括通过衔接物序列连接两个大分子。根据本发明,所关心的大分子包括蛋白质或蛋白质的球状结构域。在功能融合蛋白的构建中,衔接物序列的选择特别重要。除了合适氨基酸组成的必要性,必需考虑衔接物序列的总体折叠。实际上,通常不利的是含有具有形成螺旋或链结构高倾向的衔接物序列,因为这些将限制融合蛋白的柔性并因而影响其功能活性。因此,为了避免这样的二级结构元件,通常需要仔细考虑衔接物序列的设计。以下提供了一套已知采用了通过X-射线结晶学和NMR测定的延伸构象的样品衔接物序列样本衔接物序列SEQ.NO. 残基1 ALAGLUASPGLYGLUARGVALLEUPROGLYSERGLY0.25 -0.62 -0.72 -0.18 -0.62 -1.80 0.54 0.53 -0.07 -0.18 -0.26 -0.182 ALAPROGLULYSGLYLYSASNTHRLEUGLYSERGLY0.25 -0.07 -0.62 -1.10 -0.18 -1.10 -0.64 0.16 0.53 -0.18 -0.26 -0.183 ALAPROSERSERLYSSERTHRSERGLYGLYSERGLY0.25 -0.07 -0.26 -0.26 -1.10 -0.26 0.16 -0.26 -0.18 -0.18 -0.26 -0.184 ALALYSPROGLYLEUVALASPASNGLNGLYSERGLY0.25 -1.10 -0.07 -0.18 0.53 0.54 -0.72 -0.64 -0.69 -0.18 -0.26 -0.185 ALAPHEGLYASNALAASNSERALAARGGLYSERGLY0.25 0.61 -0.18 -0.64 0.25 -0.64 -0.26 0.25 -1.80 -0.18 -0.26 -0.186 ALAPR0SERASPLYSGLUGLYTYRSERGLYSERGLY0.25 -0.07 -0.26 -0.72 -1.10 -0.62 -0.18 0.02 -0.26 -0.18 -0.26 -0.187 ALALYSPR0ASNPR0THRGLYTHRVALGLYSERGLY0.25 -1.10 -0.07 -0.64 -0.07 0.16 -0.18 0.16 0.54 -0.18 -0.26 -0.188 ALAILEHISGLUTYRPHEARGGLYGLYGLYSERGLY0.25 0.73 -0.46 -0.62 0.02 0.61 -1.80 -0.18 -0.18 -0.18 -0.26 -0.189 ALALEUHISGLYARGGLYGLYGLUASPGLYSERGLY0.25 0.53 -0.46 -0.18 -1.80 -0.18 -0.18 -0.62 -0.72 -0.18 -0.26 -0.1810 ALASERSERPROASPVALALALYSGLYGLYSERGLY0.25 -0.26 -0.26 -0.07 -0.72 0.54 0.25 -1.10 -0.18 -0.18 -0.26 -0.18
这些是氨基酸序列和残基的疏水性。
用于本发明的衔接物序列包括至少一个氨基酸残基或多个,上述提供的那些是12个氨基酸残基长。所关心的第一个和第二个多肽(例如,各自为AFP和β干扰素片段)的取向,可以根据待融合至衔接物的AFP的N端序列和第二个所关心多肽的C端的方便性来改变,反之亦然。融合两个生物活性分子来提供提高的治疗功能以及来提高分子的半衰期。载体蛋白质的选择通常通过所构建融合蛋白的应用来控制。本发明中,AFP作为载体蛋白多肽,同时保留其自身的治疗效用并呈现出活性的协同提高。
根据常规技术进行编码转基因的各种基因组或cDNA片段的连接,使用平端或交错端用于连接、限制酶消化来提供合适的末端、适当填充粘性末端、碱和磷酸酶处理来避免不理想的连接,以及使用合适的连接酶来连接。基因构建体可以任选地编码前导序列来使得融合蛋白有效表达。
将人AFP的DNA构建体与衔接物序列和第二个所关心的多核苷酸序列融合。总的核苷酸序列可以具有其最佳密码子来提高表达和/或与所选的表达平台(例如转基因哺乳动物、原核细胞培养物、哺乳动物细胞培养物等)更相容。由于所关心融合蛋白的糖基化作用是真核系统的特征,因此优选在真核细胞或转基因哺乳动物中生产用于治疗应用的双功能重组蛋白序列。这些生产平台中,可以将所选的用于所关心融合蛋白扩增并为了所关心双功能蛋白的cDNA构建体形成转基因的质粒亚克隆进所选择的基因扩增系统中。此后,将DNA构建体切除并转染进靶核的基因组中。
为了确保生物功能蛋白的生产,因为这些因素如确保成功分泌蛋白的天然前导序列的存在,合适折叠因子的存在和翻译后修饰的能力,根据本发明优选在哺乳动物细胞中表达所需的融合蛋白。此外,双功能融合蛋白在哺乳动物细胞中的表达对用于生物药物的生产中是必要的。
本发明涉及具有特定所需序列多肽的生产方法,和涉及实施该方法必需的蛋白质和核酸中间产物。待生产的双功能融合蛋白序列可以与所需的最终产物(所关心的肽)相同或可以含有所关心肽的一个或多个串连的拷贝和/或可以含有与选择性可断裂键相关的序列。更优选,本发明的方法包括步骤a)提供cDNA或基因组DNA构建体,其编码含有第一个所关心多肽、肽衔接物序列和第二个所关心多肽的融合蛋白,该基因可操作地连接于第一个基因座控制区和第一个启动子。
b)制得具有整合至其染色体中的可操作连接的融合基因的转基因动物,借此融合蛋白得到表达并在哺乳期或激素诱导的哺乳中掺入转基因动物的奶中;和c)从转基因动物的奶中分离融合蛋白。
转基因的细胞培养物生产中,连同宿主使用合有源自与宿主细胞相容物种的复制子和控制序列的载体。载体通常携带复制子位点,以及能够提供转化细胞中表型选择的特定基因。融合蛋白的表达还可以放置于可能与未转化状态生物体同源的其它调节序列的控制下。例如,转基因山羊中,可以使用山羊β酪蛋白启动子,其在哺乳期开始时将激活所关心转基因的表达。还可以使用其它启动子/操纵基因系统或其部分。例如,可以使用乳清酸性启动子、β-乳球蛋白、碱性磷酸酶等等。
对于哺乳动物宿主,几个可能的载体系统可用于初始表达。一类载体利用源自动物病毒的DNA元件,如牛乳头状瘤病毒、多形瘤病毒、腺病毒、牛痘病毒、杆状病毒、逆转录病毒(RSV、MMTV或MOMLV),或SV40病毒。可以通过引入一个或多个可以选择转染宿主细胞的标记来选择已将DNA稳定整合到其染色体中的细胞。标记可以给营养缺陷的宿主提供质子转移、抗生素抗性或对重金属如铜的抗性等等。可以将选择标记基因直接连接于待表达的DNA序列,或通过共转化引入相同的细胞中。对于mRNA的最佳合成,还可能需要另外的元件。这些元件可以包括剪接信号以及转录启动子、增强子和终止信号。
用于胚胎重建的供体细胞的制备将转染的胎体细胞接种于含有胎细胞培养基的4-孔平板中并维持培养(5%CO2,39℃)。48小时后,用新鲜的低血清(0.5%FBS)胎细胞培养基替换培养基。在接下来的2-7天中每48至72小时用低血清胎细胞培养基替换培养基,低血清培养基后,通过胰蛋白酶消化收集体细胞(用作细胞核供体)。在与去核的卵母细胞融合之前,将细胞重悬浮于平衡的M199中至少6小时,M199含有10%FBS,补充2mM L-谷氨酰胺,1%青霉素/链霉素(10,000I.U.每种/ml)。用于产生所需转基因动物的本实验优选用山羊细胞或小鼠细胞进行来传代或各自用山羊或小鼠来进行,但是根据本发明,可以使用任何所需的哺乳动物细胞系来进行。
卵母细胞收集使卵母细胞供体同步和超数排卵,如之前所述(Ongeri等,2001),并以48小时的间隔与切除输精管的雄性交配。收集后,将卵母细胞在含有10%FBS,补充2mM L-谷氨酰胺和1%青霉素/链霉素(10,000I.U.每种/ml)的M199中培养。
胞质体制备和去核在去核之前,用细胞松弛素-B(Sigma,SOF中5μg/ml,含有10%FBS)处理所有的卵母细胞15至30分钟。用25至30μm的玻璃移液管将中期-II阶段的卵母细胞去核,通过吸出第一个极体和围绕极体附近的细胞质(~30%细胞质)来除去中期板。去核后,将所有卵母细胞立即重建。
核移植和重建在用于卵母细胞去核的相同培养基中进行供体细胞注射。使用玻璃吸管将一个供体细胞放置于透明带和卵质体膜之间。在电融合和激活程序之前,将细胞-卵母细胞偶联体在SOF中孵育30至60分钟。将重建的卵母细胞在融合缓冲液(300mM甘露醇,0.05mM CaCl2,0.1mMMgSO4,1mM K2HPO4,0.1mM谷胱甘肽,0.1mg/ml BSA)中平衡2分钟。在室温下,在具有2个形成“融合载玻片”的不锈钢电极(500μm间隙;BTX-Genetronics,San Diego,CA)并充满融合培养基的融合室中进行电融合和激活。
使用融合载玻片进行融合。将融合载玻片放入融合盘中,然后用足够量的融合缓冲液将盘淹没来覆盖融合载玻片的电极。从培养箱中取出偶联体并用融合缓冲液洗涤。使用立体显微镜,将偶联体等距放置于电极间,使细胞核/胞质体连接与电极平行。应该注意用于偶联体来促进激活和融合的电压范围为1.0kV/cm至10.0kV/cm。然而优选,最初的单个同时融合和激活电脉冲具有2.0至3.0kV/cm的电压,最优选2.5kV/cm,优选至少20μsec的持续时间。使用BTX ECM 2001Electrocell Manipulator将这种电脉冲应用于细胞偶联体。微脉冲的持续时间为10至80μsec。处理后,通常将处理过的偶联体转移至新鲜融合缓冲液的液滴中。用平衡的SOF/FBS洗涤融合处理过的偶联体,然后转移至含有或不含细胞松弛素-B的平衡SOF/FBS中。如果使用细胞松弛素-B,其浓度为1至15μg/ml,最优选为5μg/ml。将偶联体在潮湿气体室中37-39℃孵育,空气中含有约5%CO2。应该注意本公开中所提供的任一实验方案的整个过程中可以使用甘露醇替代细胞松弛素-B(基于HEPES-缓冲的甘露醇(0.3mm)的培养基,含有Ca+2和BSA)。
核移植胚胎培养并移植至受体自从在绵羊中利用体细胞的成功报道开始(Wilmut等,1997),核移植已经发生了重要的进展。许多其它物种也已经从体细胞得到克隆(Baguisi等,1999和Cibelli等,1998),取得不同程度的成功。还报道了多种其它胎和成熟体细胞组织类型(Zou等,2001和Wells等,1999),以及胚胎(Meng等,1997)。还已经在不同的实验室方法中证明了细胞核处于重建时的细胞周期的阶段是关键的(Kasinathan等,BIOL.REPROD.2001;Yong等,1998;和Kasinathan等,NATURE BIOTECH.2001)。
本发明的所有核移植胚胎在50μl含有10%FBS的SOF的液滴中培养,其上覆盖着矿物油。在将胚胎移植给受体之前,将胚胎培养物在湿润的含有5%CO2的39℃培养箱中保持48小时。如之前所述(Baguisi等,1999),进行受体胚胎移植。
对任何核移植程序成功首要的是细胞核与去核的胞质体具有合适的融合。然而,同等重要的是重建的胚胎(细胞核和胞质体)起正常胚胎的作用并分裂和发育成活胎且最终成为活的后代。以上详述的该实验室的结果表明分开的或结合的融合和分裂两者都具有以统计学上显著性的方式预测哪些细胞系适于核移植程序的能力。尽管每个单独的参数可以帮助预先选择所利用的细胞系,但是参数的结合巩固了细胞系选择的结果。
怀孕和产期护理对于山羊,处于动情期头天后第25天开始通过超声波扫描确定怀孕。每周进行评价直至怀孕第75天,此后每月一次来评价胎儿的生存力。对于怀孕持续超过152天的,用5mg的PGF2μ(Lutalyse,Upjohn)诱导分娩。在处理后24小时内分娩。出生后立即从母畜中取出小山羊,并在分娩后1小时内接受热处理的初乳。对于怀孕和产期护理,适于其它有蹄类(例如,牛)的时间范围是本领域已知的。
克隆动物的基因分型出生后不久,从克隆的动物(例如,山羊或牛)和代孕母畜获得血样和耳朵皮肤活体切片用于基因组DNA分离。根据本发明,首先通过PCR分析每个样品,使用用于特定转基因靶蛋白的引物,然后接受DNA印迹分析,使用用于特定靶蛋白的cDNA。对于每个样品,按照本领域已知的标准程序,用EcoRI(New England Biolabs,Beverly,MA)消化5μg的基因组DNA,在0.7%的琼脂糖凝胶(SeaKem,ME)上电泳并通过毛细管转移固定于尼龙膜(MagnaGraph,MSI,Westboro,MA)上。使用Prime-It试剂盒(Stratagene,La Jolla,CA),用被32PudCTP标记的1.5kb Xho I-Sal I hAT cDNA片段探查膜。在65℃进行杂交过夜。用0.2XSSC,0.1%SDS洗涤印迹并曝光于X-OMATTMAR胶片48小时。
本发明还包括克隆遗传上工程化或转基因哺乳动物的方法,通过该方法在分化的哺乳动物细胞或细胞核中将所需的基因插入、除去或修饰,然后将分化的哺乳动物细胞或细胞核插入去核的卵母细胞。
本发明还提供了根据上述方法获得的哺乳动物,以及那些哺乳动物的后代。本发明优选用于克隆公山羊或牛,但可以用于任何哺乳动物物种。本发明进一步提供了核移植胎儿以及核移植和嵌合后代在细胞、组织和器官移植领域中的用途。
卵母细胞的合适哺乳动物来源包括山羊、绵羊、牛、猪、兔子、豚鼠、小鼠、仓鼠、大鼠、灵长类等。优选,从有蹄类获得卵母细胞,最优选是山羊或牛。分离卵母细胞的方法是本领域公知的。实质上,这包括从哺乳动物例如山羊的卵巢或生殖道分离卵母细胞。有蹄类卵母细胞容易获得的来源是来自激素诱导的雌性动物。
为了成功使用技术如遗传工程、核移植和克隆,在这些细胞用作核移植受体细胞之前,以及它们通过精细胞受精发育成胚胎之前,可以优选使卵母细胞在体内成熟。中期II阶段的卵母细胞,其已经在体内成熟,已经成功用于核移植技术中。实质上,在动情期发作后或注射人绒膜促性腺激素(hCG)或类似激素后几小时,外科手术从非超排卵或超排卵动物收集成熟的中期II卵母细胞。
此外,应该注意通过转基因技术来修饰动物基因组的能力提供了生产重组蛋白的新的可替换方案。转基因农场动物奶中生产人重组药物解决了许多与微生物的生物反应器相关的问题(例如,翻译后修饰的缺乏、不合适的蛋白折叠、高纯化成本)或与动物细胞生物反应器相关的问题(例如,高成本、昂贵的培养基、低产量)。本发明能够在与所需基因纯合的转基因动物奶中或其它体液(即,尿液或血液)中使用转基因生产生物药物、融合蛋白、血浆蛋白和其它所关心的分子。通过本发明的方法能够生产的融合蛋白包括含有α-甲胎蛋白多肽和融合蛋白配偶体的那些,融合蛋白配偶体包括抗凝血酶III、截短的ATIII、乳铁蛋白、尿激酶、血小板因子4(“PF4”)、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制剂、核心蛋白聚糖、α干扰素、β干扰素、铁蛋白、促乳素、CFTR、血液因子X、血液因子VIII以及促红细胞生成素。
根据本发明的实施方案,当使用多轮或连续轮的转基因选择来产生多于一个特征纯合的细胞或细胞系时,可以用组合物处理这样的细胞或细胞系来延长给定细胞系在体外培养物中可以经受的传代数。端粒酶就属于可以如此利用的这样的化合物。
使用活的生物体用作生产方法意味着所有产生的材料在化学上与天然产物相同。就基本的氨基酸结构而言,这意味着只有L-光学异构体,具有天然构型,将存在于产物中。由于与化学合成途径相比较,生物合成的高保真度,还将忽略错误序列的数量,化学途径中偶联反应的相对无效总是产生失败的序列。对于进一步的修饰反应如羧基端酰胺化,副反应的不存在也是重要考虑因素。此外,体内起作用的酶给予了高程度的保真度和立体特异性,其通过化学方法不能配对。最后在生物流体中生产所关心的融合蛋白意味着残留在终产物中的低水平污染物可能比来源于化学反应器的那些毒性更低。
本发明实施中最重要的考虑因素之一是选择形成融合蛋白的融合配偶体。该融合配偶体,可以是且优选通常是,天然蛋白或其生理活性片段,但是不必须是。其自身可在奶中高产量产生的蛋白质,如α-1-抗胰蛋白酶,可能是本发明中有用的融合配偶体。理想蛋白的名单包括抗凝血酶III、截短的ATIII、乳铁蛋白、尿激酶、血小板因子4(“PF4”)、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制剂、核心蛋白聚糖、α干扰素、β干扰素、铁蛋白、促乳素、CFTR、血液因子X、血液因子VIII以及促红细胞生成素。尽管,为了优选,融合配偶体可以另外是奶中天然产生的蛋白质,因为这对于以下的设想是合理的正常分泌至奶中且可以高水平产生的蛋白质,在另一功能多肽与其羧基端融合后,将持续这样的分泌和产生。用于在奶中生产所关心的融合蛋白的特别优选的融合配偶体是人α-甲胎蛋白。
根据本发明可能存在融合配偶体蛋白的序列从天然序列的一些变异。尽管人α-甲胎蛋白或其它融合配偶体的天然、野生型序列(和在等位基因变体的情况下共有序列)通常是优选的,但是可以接纳或者,至少在某些情况下期望从天然序列的一些变异,条件是融合配偶体的特性不被损害到不可接受的程度。至少90或95%的氨基酸同源性通常是适当的,并且一般不多于一个或两个氨基酸改变将是优选的。
如之前所述的,每升牛奶三克的表达水平在现有转基因动物技术范围内是令人满意的。这样的水平对于人α-甲胎蛋白融合蛋白也应该是可以达到的,人α-甲胎蛋白融合蛋白是非毒性的内源蛋白质。此外,没有理由认为这样的水平在其它物种奶中不应该是可行的。所需的衔接物序列可以含有多于使两个功能部分分离所需要的绝对最小序列1)例如,IRES衔接物序列变体1,SEQ ID 24。
2)至第一个融合配偶体的任何C-末端延伸,如上述的人α-甲胎蛋白延伸,也可以认为是衔接物的一部分。
本发明的实施中,在转基因动物的奶中生产双功能融合蛋白。可以通过源自所选动物(如牛或小鼠)的基因组材料或反向翻译的信使RNA的筛选文库来获得编码人α-甲胎蛋白的序列。然后将这些序列与所需的融合偶联体蛋白多肽序列一起克隆进合适的质粒载体中并在合适的宿主生物体,通常是大肠杆菌中扩增。然后可以构建编码所选肽的DNA序列,例如,通过聚合酶链式反应扩增重叠退火的寡核苷酸混合物。
载体扩增后,切除带有合适5’和3’控制序列的DNA构建体,从载体的剩余物中纯化出来并用于生产已将所需双功能融合蛋白整合到其基因组中的转基因动物。相反,对于一些载体,如酵母人造染色体(YAC),不需要从载体除去装配的构建体;在这种情况中,扩增的载体可以直接用于制造转基因动物。这种情况中,双功能涉及通过足够保留其生物活性的蛋白序列核酸序列编码的第一个多肽的存在,然后将这第一个多肽连接于也含有足够保留其生理活性的蛋白质多肽序列的第二个多肽的编码序列。将编码序列可操作地连接于控制序列,该控制序列能够使编码序列在转基因非人胎盘哺乳动物的奶中得到表达。
适于指导转基因动物奶中产生的DNA序列携带源自天然衍生奶蛋白的5’启动子区并因而在激素和组织特异性因子的控制下。因此,这样的启动子在哺乳期的哺乳动物组织中应该是最活跃的。根据本发明,这样所用的启动子后面可以接着指导蛋白前导序列产生的DNA序列,该蛋白前导序列指导融合蛋白穿过哺乳动物上皮进入奶中的分泌。在融合蛋白构建体另一端,合适3’-序列,优选也源自天然分泌的奶蛋白,并可以加入来提高mRNA的稳定性。用于在转基因动物奶中生产蛋白质的合适控制序列的实例是来自公山羊β酪蛋白启动子的那些。
现在可以使用各种方法来进行转基因动物的生产。本发明优选的方法是核移植。
融合蛋白序列将通过以下的实施例来说明本发明优选的融合蛋白。本发明优选的实施方案是由人α-甲胎蛋白多肽在其羧基端通过单个蛋氨酸残基连接于β干扰素多肽(IFN-β)制得的融合蛋白。本发明该融合蛋白的可替换实施方案中,IFN-β多肽在其羧基端将携带额外的甘氨酸来作为α-酰胺化酶的底物。以下提供本发明该优选实施方案的序列本发明优选的实施方案中,编码该构建体的DNA序列将携带5’-β-酪蛋白启动子区、带有全部编码外显子的完整人α-甲胎蛋白编码序列、衔接物和然后人IFN-β编码序列。融合蛋白具有与上述提供的相同的融合配偶体,但是使用不同的衔接物序列。这需要融合蛋白在人α-甲胎蛋白的羧基端和IFN-β之间携带氨基酸衔接物序列。
这必须通过在DNA编码区域进行合适的改变来产生。如上所述可以制得融合蛋白,但是在来自β-乳球蛋白或来自参与控制奶蛋白表达的任何其它合适的启动子的人或牛5’-和3’-控制序列的控制下。
呈现并鉴定了大量对应于各种所关心的各种融合蛋白的DNA序列。本发明的融合蛋白提供了生理活性α-甲胎蛋白多肽作为连接于各种第二个多肽融合配偶体的第一个结构域的用途。本发明考虑并包括所有干扰素的天然、自然、修饰和重组DNA干扰素样蛋白质,作为α-甲胎蛋白结构域的潜在融合配偶体。所有这些干扰素和其它已知的蛋白质在本领域中是已知的或在本发明的考虑范围内。本发明主要涉及与α-甲胎蛋白结构域融合的α和β干扰素的各种修饰的融合蛋白或多肽。已经报道通过在动物细胞或酵母中表达蛋白质来获得糖基化的干扰素。
最适于修饰的分子位置的选择取决于特定的蛋白质。因此,根据本发明,保留其天然生理活性的理想序列的识别可以在任何位点引入天然生成的蛋白序列中,条件是这样引入的序列对生物活性没有不利影响,其中这样的活性是所需的。根据本发明只需要引入含有或是所需生物活性位点的大量氨基酸共有序列。
以下描述了说明性的而非限制性的特定实施方案。
优选的人双功能AFP融合蛋白AFP-β干扰素AFP-α干扰素AFP-τ干扰素AFP-抗凝血酶IIIAFP-核心蛋白聚糖AFP-促乳素AFP-γ干扰素AFP-PF4AFP-降钙素AFP-α-1-抗胰蛋白酶抗凝血酶III-α-甲胎蛋白融合蛋白的构建抗凝血酶或抗凝血酶III(ATIII)是凝血过程中涉及的单链糖蛋白。主要在肝脏合成,具有其通过内质网的胞内运输所需要的32个氨基酸的信号肽;然后在分泌之前将肽裂解。Mourey等,BIOCHIMIE72599-608(1990)。
ATIII是蛋白质的丝氨酸蛋白酶抑制剂家族的成员并作为凝固级联中涉及的凝血酶和其它酶的抑制剂。如在此所用的,将活性天然完整形式的ATIII命名为S(受应力的)形式(S-ATIII)。S-ATIII与凝血酶(通过肝素的存在显著提高)和其它酶(不是所有的丝氨酸蛋白酶抑制剂都具有肝素亲和性)形成紧密结合复合物。
通过各种酶,包括凝血酶,可以将S-ATIII裂解成松弛的(R)-构象(R-ATIII)。ATIII可以源自其本质上产生蛋白质的任何生物体。特定实施方案中,生物体是牛或人。在基因库登记号No.1168462下可获得牛ATIII的氨基酸序列,在基因库登记号No.113936下可获得人ATIII的氨基酸序列。
ATIII或其生物等价物的特定部分和构象,其是本发明的主题,还可以通过体内使用酶(例如弹性蛋白酶)来生产。例如,可以体内使用酶来产生抑制内皮细胞增生、血管生成和/或肿瘤生长的ATIII片段、构象、生物等价物或衍生物,用或不用血浆或天然ATIII来作为另外的底物。已经测定ATIII的特定构象降低血管生成、内皮细胞增生和肿瘤生长。(如在此所用的,内皮细胞增生还包括内皮细胞迁移和管形成)。如在此所述的,可以通过本领域已知的各种方法来制得或分离ATIII和/或片段、构象、生物等价物或衍生物,包括但不限于,纯化、转基因和重组方法。
然而,优选在编码IFN-β的核苷酸序列中的位点进行核苷酸序列的插入,使得最小化对所得到重组蛋白生物活性的不利影响,当这样的生物活性是关键的时候。
奶特异性启动子本发明实施中有用的转录启动子是优选在哺乳动物上皮细胞中激活的那些启动子,包括控制编码奶蛋白基因的启动子,这些奶蛋白如酪蛋白、β-乳球蛋白(Clark等,(1989)BIO/TECHNOLOGY 7487-492)、乳清酸性蛋白(Gorton等(1987)BIO/TECHNOLOGY 51183-1187)和乳清蛋白(Soulier等,(1992),FEBS LETTS.29713)。酪蛋白启动子可以源自任何哺乳动物物种的α、β、γ或κ酪蛋白基因;优选的启动子是源自山羊β酪蛋白基因(DiTullio,(1992)BIO/TECHNOLOGY 1074-77)。奶特异性蛋白启动子或在乳房组织中特异性激活的启动子可以源自cDNA或基因组序列。优选,它们是基因组来源的。
对于至少一种且通常是几种生物体中的所有上述的乳腺特异性基因,DNA序列信息是可获得的。参见,例如,Richards等,J.BIOL.CHEM.256,526-532(1981)(α-乳清蛋白大鼠);Campbell等,NUCLEIC ACIDS RES.12,8685-8697(1984)(大鼠WAP);Jones等,J.BIOL.CHEM.260,7042-7050(1985)(大鼠β-酪蛋白);Yu-Lee&Rosen,J.BIOL.CHEM.258,10794-10804(1983)(大鼠γ-酪蛋白);Hall,BIOCHEM.J.242,735-742(1987)(人α-乳清蛋白);Stewart,NUCLEIC ACIDS RES.12,389(1984)(牛αs1和κ酪蛋白cDNA);Gorodetsky等,GENE 66,87-96(1988)(牛β酪蛋白);Alexander等,EUR.J.BIOCHEM.178,395-401(1988)(牛κ酪蛋白);Brignon等,FEBS LETT.188,48-55(1977)(牛αs2酪蛋白);Jamieson等,GENE 61,85-90(1987),Ivanov等,Biol.Chem.Hoppe-Seyler369,425-429(1988),Alexander等,NUCLEIC ACIDS RES.17,6739(1989)(牛β乳球蛋白);Vilotte等,BIOCHIMIE 69,609-620(1987)(牛α-乳清蛋白)。各种奶蛋白基因的结构和功能综述于Mercier & Vilotte,J.DAIRY SCI.76,3079-3098(1993)(在此以其整体引入作为参考用于所有目的)。一定程度上可能需要另外的序列数据,使用现有序列作为探针可以容易地克隆已经获得的区域侧翼的序列。通过来自这样生物体的筛选文库使用已知的同源核苷酸序列或同源蛋白的抗体作为探针同样获得来自不同生物体的乳腺特异性调节序列。
信号序列根据本发明有用的信号序列是奶特异性信号序列或其它的信号序列,其导致真核或原核蛋白的分泌。优选,信号序列选自奶特异性信号序列,即,来自编码分泌至奶中的产物的基因。最优选,奶特异性信号序列与本发明表达系统中所用的奶特异性启动子相关。对于本发明,信号序列的大小不是关键。需要的只是序列具有足够大小来实现所需重组蛋白例如在乳房组织中的分泌。例如,来自编码酪蛋白,例如,α、β、γ或κ酪蛋白,β乳球蛋白,乳清酸性蛋白和乳清蛋白基因的信号序列在本发明中是有用的。优选的信号序列是山羊β-酪蛋白信号序列。
也可以使用来自其它分泌蛋白质的信号序列,例如通过肝细胞、肾脏细胞和胰腺细胞分泌的蛋白质。
所分泌蛋白质的氨基端区域可以通过在待分泌的蛋白质中包含正常分泌的蛋白质的全部或部分编码序列来提高分泌非分泌蛋白的功效。优选在蛋白质序列中不包括正常分泌的蛋白质的全部序列,而是只有正常分泌蛋白质氨基端的一部分。例如,将不是正常分泌的蛋白质(通常在其氨基端)与正常分泌蛋白质的氨基端部分融合。
优选,正常分泌的蛋白质是通常在奶中分泌的蛋白质。这样的蛋白质包括乳房上皮细胞分泌的蛋白质,奶蛋白如酪蛋白,β乳球蛋白,乳清酸性蛋白和乳清蛋白。酪蛋白包括任何哺乳动物物种的α、β、γ或κ酪蛋白基因。优选的蛋白质是β酪蛋白,例如,山羊β酪蛋白。编码所分泌蛋白质的序列可以源自cDNA或基因组序列。优选,它们是基因组来源的,并包括一个或多个内含子。
DNA构建体在此所述的表达系统或构建体,还可以包括编码非分泌蛋白质的DNA序列的3’未翻译区下游。该区域显然稳定了表达系统的RNA转录物并因此提高来自表达系统的所需蛋白质的产量。在3’未翻译区中提供poly A信号的序列在本发明构建体中是有用的。这样的序列可以源自例如SV40小t抗原,酪蛋白3’未翻译区或本领域公知的其它3’未翻译序列。优选,3’未翻译区源自奶特异性蛋白。3’未翻译区的长度不是关键,但是poly A转录物的稳定效果似乎在稳定表达序列的RNA中是重要的。
任选地,表达系统或构建体在启动子和编码信号序列的DNA序列之间包括5’未翻译区。这样的未翻译区可以来自获得启动子的相同控制区或可以来自不同的基因,例如,它们可以源自其它合成的、半合成的或天然来源。同样,它们的具体长度不是关键,然而,它们似乎在提高表达水平中是有用的。
构建体还可以包括优先在乳房上皮细胞中表达的基因N-端编码区的约10%、20%、30%或更多。例如,N-端编码区还可以对应于所用的启动子,例如,山羊β-酪蛋白N-端编码区。
可以使用本领域公知的方法制得上述的表达系统。例如,可以使用运用常规衔接物、限制位点等的各种连接技术来取得良好的效果。优选,作为较大质粒的一部分制得本发明的表达系统。这样的制备使得以本领域公知的有效方式来克隆和选择正确的构建。更优选,本发明的表达系统位于质粒上的合适限制位点之间,使得它们可以容易地从剩余的质粒序列分离用于掺入所需的哺乳动物。
现有技术方法通常包括制造构建体并在将构建体放入转基因动物中之前测试其在培养细胞中产生产物的能力。令人惊讶地,本发明者发现在测定例如在转基因动物奶中正常非分泌蛋白是否可以分泌中,这样的实验方案不可能有预测价值。因此,理想的是在转基因动物例如转基因小鼠中直接测试构建体,因为一些在CHO细胞中不能分泌的构建体分泌至转基因动物的奶中。
转基因哺乳动物优选,将本发明的DNA构建体引入哺乳动物的种系中。例如,通过本领域已知的标准转基因技术,可以将构建体的一个或几个拷贝引入哺乳动物胚胎的基因组中。
任何非人哺乳动物可以有益地用于本发明中。在此以具有乳腺并产奶的所有动物来限定哺乳动物,人除外。优选产生大体积的奶并具有长哺乳期的哺乳动物。优选的哺乳动物是奶牛、绵羊、山羊、小鼠、牛、骆驼和猪。当然,对于本发明任何给定的表达序列,这些哺乳动物中的每种相互之间可能不是同样有效的。例如,特定的奶特异性启动子或信号序列在一种哺乳动物中比在其它的哺乳动物中更有效。然而,本领域技术人员按照本发明的教导可以容易地进行这样的选择。
在出生后可以测定转基因哺乳动物幼仔的构建体进入后代基因组的引入。优选,通过与对应于后代染色体材料上编码所需重组蛋白产物或其区段的DNA序列的探针杂交来实现该测定。发现在其基因组中含有至少一个构建体拷贝的那些哺乳动物后代生长至成熟。这些后代的雌性物种在它们的奶中或随着它们的奶一起将产生所需的蛋白。或者,可以繁殖转基因哺乳动物来产生在它们的奶中产生所需蛋白的其它转基因后代。
对于蛋白质分泌至奶中,可以使用本领域中标准的任何测定技术(例如,蛋白质印迹或酶测定)来测试转基因雌性。
其它表达系统虽然已经说明了本发明优选的方法来表达修饰的干扰素-α-甲胎蛋白组合,形成各种核苷酸序列,并转化特定的宿主,清楚的是本发明不以任何方式受这些说明的限制。真核和原核宿主细胞两者都可以使用。用于分离基因以及在细菌细胞和异种细胞中表达干扰素的几种方法非常适于生产本发明的修饰干扰素。
同样,可以从脊椎动物细胞培养物生产修饰的干扰素,例如,猴子肾成纤维细胞的COS-7系可以用作宿主使用合适的表达载体来生产修饰的干扰素。已经描述了真核表达载体的许多其它实例且是本领域已知的。
用于本发明在转化宿主细胞中复制的载体具有含有功能性复制起点的DNA区段(复制子)。质粒和噬菌体DNA根据其本性含有有助于在宿主细胞中复制的复制子。载体含有DNA区段,其将用于从非转化细胞中选择转化细胞的特性传送至可转化的宿主细胞。为了选择目的,可以使用多种特性中的任一种。最常用的特性之一是抗生素抗性,例如,新霉素抗性和四环素抗性。
从生物流体中纯化AFP-融合蛋白使用标准蛋白纯化技术从转基因生物体的生物流体中纯化本发明的AFP融合蛋白,如亲和色谱(参见,例如,Ausubel等,CURRENTPROTOCOLS IN MOLECULAR BIOLOGY,John Wiley&Sons,New York,NY,1988;还参见Lubon等,美国专利5,831,141)或其它的本领域技术人员已知的蛋白纯化方法。一旦得到分离,如果需要,可以将AFP-融合蛋白进一步纯化,例如通过高效液相色谱(HPLC;例如,参见,Fisher,LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY,编辑,Work和Burdon,Elsevier,1980),和/或切向流过滤。纯化后,AFP融合蛋白至少为80%纯,优选90%纯,更优选95%纯,和最优选99%纯。
动物启动子在乳房组织中表达AFP有用的启动子包括天然驱动乳房特异性多肽如奶蛋白表达的启动子,尽管可以使用允许AFP分泌至奶中的任何启动子。这些包括,例如,天然指导乳清酸性蛋白(WAP),αS1-酪蛋白、αS2-酪蛋白、β-酪蛋白、κ-酪蛋白、β-乳球蛋白、α-乳清蛋白的表达的启动子(参见,例如Drohan等,U.S.专利No.5,589,604;Meade等,U.S.专利No.4,873,316;和Karatzas等,U.S.专利No.5,780,009),以及描述于U.S.专利No.5,750,172中的其它启动子。乳清酸性蛋白(WAP;基因库登记号No.X01153),啮齿动物中的主要的乳清蛋白,在怀孕后期和哺乳期专门在乳腺中高水平表达(Hobbs等,J.BIOL.CHEM.2573598-3605,1982)。对于所需乳腺特异性启动子的其它信息,参见,例如,Richards等,J.BIOL.CHEM.256526-532,1981(α-乳清蛋白大鼠);Campbell等,NUCLEIC ACIDSRES.128685-8697,1984(大鼠WAP);Jones等,J.BIOL.CHEM.2607042-7050,1985(大鼠β-酪蛋白);Yu-Lee & Rosen,J.BIOL.CHEM.25810794-10804,1983(大鼠γ-酪蛋白);Hall,BIOCHEM.J.242735-742,1987(人α-乳清蛋白);Stewart,NUCLEICACIDS RES.123895-3907,1984(牛α-s1和κ-酪蛋白cDNA);Gorodetsky等,GENE 6687-96,1988(牛β-酪蛋白);Alexander等,EUR.J.BIOCHEM.178395-401,1988(牛κ-酪蛋白);Brignon等,FEBS LETT.18848-55,1977(牛α-s2酪蛋白);Jamieson等,GENE 6185-90,1987,Ivanov等,BIOL.CHEM.Hoppe-Seyler369425-429,1988,和Alexander等,NUCLEIC ACIDS RES.176739,1989(牛β-乳球蛋白);和Vilotte等,BIOCHIMIE 69609-620,1987(牛α-乳清蛋白)。各种奶蛋白基因的结构和功能综述于Mercier &Vilotte,J.DAIRY SCI.763079-3098,1993。如果另外的侧翼序列可用于最佳化表达,可以使用现有的序列作为探针来克隆这样的序列。通过这样生物体的筛选文库使用已知的同源核苷酸序列或同源蛋白的抗体作为探针来获得不同生物体的乳腺特异性调节序列。
用于表达并将AFP分泌至奶中的有用的信号序列是奶特异性信号序列。理想地,信号序列选自奶特异性信号序列,即,来自编码分泌至奶中的产物的基因。最理想地,奶特异性信号序列与上述的奶特异性启动子相关。信号序列的大小对于本发明不是关键。只需要序列具有足够大小来实现例如在乳房组织中AFP的分泌。例如,来自编码酪蛋白,例如,中α、β、γ或κ酪蛋白,β乳球蛋白,乳清酸性蛋白和乳清蛋白的基因的信号序列在本发明中是有用的。也可以使用来自其它分泌蛋白的信号序列,例如,由肝细胞、肾脏细胞或胰细胞分泌的蛋白质。
用于在泌尿组织中表达重组多肽转基因的有用启动子是尿血小板溶素(uroplakin)和尿调节素启动子(Kerr等,NAT.BIOTECHNOL.1675-79,1998;Zbikowska等,BIOCHEM.J.3657-11,2002),尽管可以使用允许转基因产物分泌至尿中的任何启动子。
通过产血和产血清细胞(例如,肝上皮细胞)表达并将AFP分泌至血液中的有用启动子是清蛋白启动子(参见,例如,Shen等,DNA8101-108,1989;Tan等,DEV.BIOL.14624-37,1991;McGrane等,TIBS 1740-44,1992;Jones等,J.BIOL.CHEM.26514684-14690,1990;和Shimada等,FEBS LETTERS 279198-200,1991),尽管可以使用允许转基因产物分泌至血液中的任何启动子。还可以使用天然α-甲胎蛋白启动子(参见,例如基因库登记号No.AB053574;AB053573;AB053572;AB053571;AB053570;和AB053569)。用于在精液中表达AFP的有用启动子描述于U.S.专利No.6,201,167中。有用的鸟-特异性启动子是卵清蛋白启动子和apo-B启动子。其它鸟特异性启动子是本领域已知的。卵清蛋白启动子可以用于指导随后在蛋的蛋白中沉积的AFP的表达。apo-B启动子还可以用于指导重组多肽在肝中的表达,最终它将沉积至蛋黄中。鸟卵是用于表达大量重组多肽的最佳载体,由于以下原因(1)每个卵中包裹大量的蛋白质,(2)容易非入侵地收集蛋并可以保存延长的时间段,和(3)卵是无菌的,且与奶不一样,不含有细菌污染物。具体地,对于每个卵,鸟在输卵管中可以产生三克清蛋白,其中超过50%是卵清蛋白。另外三克在肝脏中产生(血清脂蛋白)并沉积在卵黄中。此外,由于它们与哺乳动物的进化距离,鸟通常在免疫上不能识别哺乳动物蛋白,因此在鸟中表达AFP对鸟的存活力和健康不太可能具有任何的有害影响。
本发明方法中有用的其它启动子包括可诱导的启动子。一般而言,重组蛋白在大多数真核表达系统中以组成型方式表达。可诱导的启动子或增强子元件的增加提供对AFP表达的时间控制或空间控制,且提供表达的可替换机理。可诱导的启动子包括热激蛋白、金属硫蛋白和MMTV-LTR,而可诱导的增强子元件包括用于蜕皮激素、muristerone A和四环素/强力霉素的那些。
Tet-On和Tet-Off基因表达系统(Clontech)是用于本发明方法中的可诱导系统的一个实例。该系统使用四环素(Tc)效应元件来维持AFP在开(组成型关,用Tc诱导)或关(组成型开,用Tc或强力霉素阻抑)模式下的表达。还可以将选择标记掺入AFP转基因中用于已经转化细胞的容易鉴别。选择标记通常分成两个功能种类隐性或显性。隐性标记通常是编码在宿主细胞(缺乏“标记”产物或功能的细胞)中不产生的产物的基因。用于胸苷激酶(TK)、二氢叶酸还原酶(DHFR)、腺嘌呤转磷酸核糖基酶(APRT)和次黄嘌呤-鸟嘌呤转磷酸核糖基酶(HGPRT)的标记基因属于这类。显性标记包括编码赋予生长抑制化合物(抗生素、药物)抗性和/或允许宿主细胞在代谢限制环境中生长的产物的基因。这类中通常使用的标记包括赋予氨甲蝶呤抗性的突变DHFR基因;用于黄嘌呤-鸟嘌呤转磷酸核糖基酶的gpt基因,其允许宿主细胞在含有霉酚酸/黄嘌呤的培养基中生长;和用于氨基糖苷3’-磷酸转移酶的neo基因,其可以赋予对G418、庆大霉素、卡那霉素和新霉素的抗性。
核酸载体本发明的某些实施方案中,涉及载体,或重组表达载体,这些载体包括在此所述的任一核酸分子。使用在此的载体来扩增编码融合蛋白的DNA或RNA和/或表达编码SSTR-融合蛋白的DNA。载体包括但不限于质粒、噬菌体、粘粒、游离基因、病毒颗粒或病毒,以及可整合的DNA片段(即,通过同源重组可整合至宿主基因组的片段)。病毒颗粒包括但不限于腺病毒、杆状病毒、细小病毒、疱疹病毒、痘病毒、腺伴随病毒、Semliki Forest病毒、牛痘病毒、逆转录病毒、微粒和裸DNA。不同的实施方案中,表达可以通过靶向配体瞄准特定细胞类型或细胞群。表达载体包括,但不限于,pcDNA3(Invitrogen)和pSVL(Pharmacia Biotech)。其它表达载体包括但不限于,pSPORTTM载体,pGEMTM载体(Promega),pPROEX载体TM(LTI,Bethesda,Md.),BluescriptTM载体(Stratagene),pQE.TM载体(Qiagen),pSE420TM(Invitrogen)和pYES2TM(Invitrogen)。表达构建体可以包括融合蛋白编码多核苷酸,该多核苷酸可操作地连接于内源或外源表达控制DNA序列和转录终止子。由于许多载体中核酸插入的有限间隔,理想的是插入较小的报道基因或报道融合构建体。例如,可以使用全部或部分促生长素抑制素报道羧基端的缺失。表达控制DNA序列通常包括启动子、增强子、操纵基因和调节元件结合位点,并通常基于其中将要使用表达构建体的表达系统来选择。
通常出于提高基因表达的能力来选择启动子和增强子序列,而通常出于调节基因表达的能力来选择操纵序列。本发明的表达构建体还可以包括编码一个或多个可以鉴定带有构建体的宿主细胞的选择标记的序列。表达构建体还可以包括有助于宿主细胞中同源重组的序列。不同的实施方案中,构建体还可以包括在宿主细胞中复制所需要的序列。
在此列出了各种实例性的组织特异性启动子(Pearse和Takor,1979;Nylen和Becker,1995)。尽管不是完全的列举,这些启动子是可以用于本发明某些实施方案中的启动子和增强子类型的实例。可用于本发明中的其它启动子是本领域技术人员容易获知的。
可诱导的启动子包括但不限于MT II,MMTV(小鼠乳房肿瘤病毒)、c-jun、胶原酶、溶基质素、鼠MX基因、GRP78基因、α-2-巨球蛋白、波形蛋白、MHC I型基因H-2kB、HSP70、增殖蛋白、肿瘤坏死因子和甲状腺刺激激素-α。可以使用细胞特异性增强子和/或启动子来获得细胞或组织特异性表达(总地参见,Huber等,ADV.DRUG.DELIVERYREVIEWS 17279-292,1995)。
表达载体可以用于生产编码蛋白,还可以简单用于扩增SSTR-融合蛋白编码多核苷酸序列。一些实施方案中,载体是其中多核苷酸可操作地连接于包括表达控制序列的多核苷酸的表达载体。某些实施方案中,自主复制重组表达构建体如质粒和病毒DNA载体掺入多核苷酸。表达载体还可以是可复制的DNA构建体,其中编码SSTR-融合蛋白的DNA序列可操作地连结或连接于能够实现SSTR-融合蛋白在合适宿主中表达的合适控制序列。当它们功能上彼此相关时,将DNA区可操作地连结或连接。例如,将启动子可操作地连结或连接于编码序列,如果它控制序列的转录。扩增载体不需要表达控制结构域,而只需要在宿主中复制的能力,通常通过复制起点来给予,和帮助转化体的识别的选择基因。表达载体中对控制序列的需要将根据所选的宿主和所选的转化方法而改变。通常,控制序列包括转录启动子、控制转录的任选的操纵基因序列、编码合适mRNA核糖体结合的序列以及控制转录和翻译终止的序列。
不同的实施方案中,载体可以含有宿主生物体所识别的启动子。启动子序列可以是原核的、真核的、合成的或病毒的。合适原核序列的实例包括噬菌体λ启动子(THE BACTERIOPHAGE LAMBDA,Hershey,A.D.,编辑,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.(1973);LAMBDA II,Hendrix,R.W.编辑,Cold Spring Harbor Press,Cold Spring Harbor,N.Y.(1980);以及Benoist等,The trp,recA,heat shock,and lacZpromoters of E.coli and SV40 early promote,NATURE,290304-310,(1981))。另外的启动子包括但不限于鼠乳房肿瘤病毒、人免疫缺陷病毒的长末端重复、maloney病毒、细胞肥大病毒立即早期启动子、EB病毒、劳斯肉瘤病毒、人肌动蛋白、人肌球蛋白、人血红蛋白、人肌肉肌酸和人金属硫蛋白。
载体中还可以包括另外的调节序列。通过噬菌体MS-2的复制酶基因和噬菌体λ的基因cII的SD序列来表示合适调节序列的实例。SD序列可以直接后面接着编码SSTR-融合蛋白的DNA并导致成熟SSTR-融合蛋白的表达。
此外,合适的表达载体可以包括合适的可以筛选转化宿主细胞的标记。使用本领域技术人员公知的和描述于Sambrook等(上文)中的各种技术中的任一种技术来进行所选宿主的转化。
还可以通过构建载体包括外部源起点或通过宿主细胞染色体复制机理来提供复制起点。如果将载体整合至宿主细胞染色体,后者就足够了。或者,除了使用含有病毒复制起点的载体外,本领域技术人员可以通过使用选择标记和SSTR-融合蛋白编码DNA共转化的方法来转化哺乳动物细胞。合适标记的实例是二氢叶酸还原酶或胸苷激酶(参见,US专利No.4,399,216)。
编码报道蛋白质融合如SSTR2-融合蛋白的核苷酸序列,可以根据常规技术与载体DNA重组,包括用于连接的平端或交叉端,限制酶消化来提供合适的末端,如果需要填补粘性末端,碱性磷酸酶处理来避免不良的连接并用合适的连接酶来连接。Sambrook等的上文公开了这样的操作技术,且是本领域公知的。构建哺乳动物表达载体的方法公开于,例如,Okayama等,MOL.CELL.BIOL.3280,(1983);Cosman等,MOL.IMMUNOL,23935(1986);和Cosman等,NATURE,312768,(1984)。
转基因构建体优选包括启动子下游的前导序列。前导序列是编码蛋白质分泌信号的核酸序列,且当可操作地连接于编码本发明AFP-融合蛋白的下游核酸分子时,指导AFP-融合蛋白分泌。可以从用于指导编码AFP的核酸分子转录的启动子相同的基因获得前导序列(例如,编码奶特异性蛋白的基因)。或者,可以使用编码天然人AFP蛋白分泌信号的前导序列(基因库登记号No.V01514的氨基酸1-19)。
治疗用途在处理这些组织培养物中,优选将在此的组合在体外使用。然而,该组合对于体内应用也是有效的。根据预期的体内给药模式,可以以固体、半固体或液体的剂型来使用组合物,如,片剂、丸剂、粉剂、胶囊、凝胶、膏剂、液体、悬浮液等等。优选以适于确定剂量单次给药的单位剂型来施用组合物。根据所需的制剂,组合物还可以包括药物学上可接受的载体或稀释剂,将其限定为通常用于配制动物或人给药的药物组合物的基于水溶液的赋形剂。选择稀释剂以致不会影响人α-甲胎蛋白的生物活性。这样稀释剂的实例是蒸馏水、生理盐水、林格溶液、葡萄糖溶液和Hank’s溶液。相同的稀释剂可以用于重建冻干的人α-甲胎蛋白。此外,药物组合物还可以包括其它的医学试剂,药剂,载体,助剂,非毒性、非治疗性、非免疫性的稳定剂等。就成分的溶解性、生物活性等而言,这样的稀释剂或载体的有效量是有效获得药物学上可接受制剂的量。
在此的组合物可以通过口服、非肠道或局部给药以及全身形式给药于人患者来用于抗黑素瘤和抗乳癌治疗。
融合蛋白多功能结构域根据本发明,涉及的双功能融合蛋白对重症肌无力、类风湿性关节炎、骨质疏松、癌症、局部施用和多发性硬化具有独特的双重治疗效果。其它方面的有效性包括抗病毒活性、免疫调节活性和抗血管生成活性(断裂的ATIII融合-AFP蛋白)。
根据本发明的保守变体通常保留蛋白质结构域的整个分子结构。根据构成公开蛋白产物的各个氨基酸的特性,一些合理的置换是显而易见的。可以进行氨基酸置换,即,“保守置换”,例如,以所涉及残基的极性、电荷、溶解度、疏水性、亲水性和/或两性性质为基础。
例如,(a)非极性(疏水性)氨基酸包括丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和蛋氨酸;(b)极性中性氨基酸包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;(c)正电荷(碱性)氨基酸包括精氨酸、赖氨酸和组氨酸;和(d)负电荷(酸性)氨基酸包括天冬氨酸和谷氨酸。置换通常在基团(a)-(d)中进行。此外,甘氨酸和脯氨酸基于它们破坏α螺旋的能力可以相互置换。同样地,某些氨基酸,如,丙氨酸、半胱氨酸、亮氨酸、蛋氨酸、甘氨酸、谷氨酰胺、组氨酸和赖氨酸多在α螺旋中发现,而缬氨酸、异亮氨酸、苯丙氨酸、酪氨酸、色氨酸和苏氨酸多在β-折叠中发现。甘氨酸、丝氨酸、天冬氨酸、天冬酰胺和脯氨酸多在转角中发现。可以在以下的基团中进行一些优选的置换(i)S和T;(ii)P和G;和(iii)A、V、L和I。根据已知的遗传密码,以及重组和合成DNA技术,本领域技术人员可以容易地构建编码保守氨基酸变体的DNA。
制备双功能分子本发明考虑的双功能蛋白是含有每种之前所述结构域的蛋白,其中在这样融合时,两个结构域基本上保留其相关的特征并在某些治疗应用如重症肌无力或类风湿性关节炎中具有协同效果。尽管通常产生融合蛋白,也可以通过常规化学方法来融合结构域,例如使用多功能交联衔接物。当形成融合蛋白时,可以将任一个结构域放置于另一个结构域的C-端或N-端。用于形成融合蛋白的合适方法应当是基本上不改变所需融合蛋白两个多肽中任一个的生物活性的方法。
本发明不受限于生产在此考虑的所需融合蛋白的任何特定方法。然而,根据所考虑的重组生产方法,本发明提供了包含一个或多个本发明所述结构域的核苷酸序列的重组DNA构建体。本发明的重组构建体包括载体,如质粒或病毒载体,其中以任何方向插入DNA或DNA片段,通常带有可读框。本发明进一步涉及含有这些载体的细胞。
细菌表达通过将编码所需蛋白的结构DNA序列以及合适的翻译起始和终止信号插入具有功能启动子的可操作阅读相中来构建用于细菌使用的有用表达载体。载体将包含一个或多个表型选择标记和复制起点来确保载体的维持,如果理想的,来提供在宿主中的扩增。合适的用于转化的原核宿主包括大肠杆菌、枯草芽孢杆菌、鼠伤寒沙门氏菌以及假单胞菌、链霉菌和葡萄球菌属中的各种物种,尽管其它的也可以使用作为选择的物质。优选实施方案中,原核宿主是大肠杆菌。
细菌载体可以是例如基于噬菌体、质粒、或粘粒的。这些载体可以包括选择标记和源自可购得的通常含有公知克隆载体pBR322(ATCC37017)元件的质粒的细菌复制起点。这些可购得的载体包括,例如,GEM1(Promega Biotec,Madison,Wis.,USA),pBs、phagescript、PsiX174、pBluescript SK、pBs KS、pNH8a、pNH16a、pNH18a、pNH46a(Stratagene);pTrc99A、pKK223-3、pKK233-3、pKK232-8、pDR540和pRIT5(Pharmacia)。根据本发明,优选的载体是THE Pt7I表达载体。
这些“主链”部分与合适的启动子和待表达的结构序列结合。细菌启动子包括lac、T3、T7、λPR或PL、trp和ara。T7是优选的细菌启动子。
合适宿主菌株的转化和宿主菌株生长至合适的细胞密度后,通过合适的方式(例如,温度变动或化学诱导)将所选的启动子去阻抑/诱导并将细胞培养另外的时间段。通常通过离心收集细胞,通过物理或化学方法来破碎细胞,并将所得到的粗制提取物保留用于进一步的纯化。
真核表达还可以使用各种哺乳动物细胞培养系统来表达重组蛋白。哺乳动物表达系统的实例包括所选的鼠L细胞,如胸苷激酶-阴性(TK)和腺嘌呤转磷酸核糖基酶(APRT)细胞。其它实例包括猴子肾成纤维细胞的COS-7系,由Gluzman描述,Cell 23175(1981),和其它能够表达相容载体的细胞系,例如,C127、3T3、CHO、HeLa和BHK细胞系。特别地,关于酵母,可以提及的有酵母属(Saccharomyces)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、许旺氏酵母属(Schwanniomyces)或汉逊酵母属(Hansenula)中所述的酵母。能够用于本发明中的真菌中,更特别地可以提及的有曲霉属(Aspergillus)或木霉属(Trichoderma)。
哺乳动物表达载体将包括复制起点、合适的启动子和增强子、以及任何必要的核糖体结合位点、多腺苷酸化位点、剪接供体和受体位点、转录终止序列和5’侧翼非转录序列。可以使用源自SV40病毒基因组,例如,SV40起点、早期启动子、增强子、剪接和多腺苷酸化位点的DNA序列来提供所需的非转录遗传因子。
哺乳动物启动子包括β酪蛋白、β乳球蛋白、乳清酸性蛋白启动子,其它包括HSV胸苷激酶,早期和晚期SV40,来自逆转录病毒的LTRs以及鼠金属硫蛋白-1。实例哺乳动物载体包括pWLneo、pSV2cat、pOG44、pXT1、pSG(Stratagene)、pSVK3、pBPV、pMSG和pSVL(Pharmacia)。优选实施方案中,哺乳动物表达载体是pUCIG-MET。选择标记包括CAT(氯霉素转移酶)。
可以以各种方式制得可用于本发明构架中的核苷酸序列。通常,通过在阅读相,装配编码多肽每个功能部分的序列来获得它们。后者可以通过本领域技术人员的技术来分离,例如直接从细胞信使RNA(mRNA)中分离,或通过从互补DNA(cDNA)文库再克隆,或者它们可以是完全合成的核苷酸序列。此外,可以理解,为了获得所述序列的衍生物或变体,随后还可以将核苷酸序列修饰,例如,通过遗传工程技术。
原位杂交荧光(FISH)分析使用标准培养和制备方法从培养的源自携带所需转基因动物的细胞中获得中期和间期的核。将核沉积在载玻片上并与洋地黄毒苷标记的探针杂交,该探针源自含有8kb用于所关心双功能蛋白的基因组序列的构建体。使用辣根过氧化物酶缀合的抗体扩增结合的探针并用酪胺缀合的异硫氰酸荧光素(FITC,绿色荧光染料)检测。用4’,6-二脒基-2-苯基吲哚(DAPI,蓝色染料)将核复染色。使用MetaMorph软件获得FISH图象。
治疗组合物根据制备药物上有用组合物的已知方法来配制本发明的蛋白质,借此将本发明的分子或其功能衍生物与药物学上可接受的载体或赋形剂混合而组合。例如,为了形成适于有效给药的药物学上可接受的组合物,描述了合适的赋形剂及其剂型,包括其它的人蛋白,例如,人血清清蛋白,这样的组合物将含有有效量的一种或多种本发明的蛋白质,和合适量的载体或赋形剂。
可以使用一种或多种生理学上可接受的载体或赋形剂以常规方式来配制根据本发明使用的药物组合物。因此,可以将双功能分子及其生理学上可接受的盐和溶剂化物配制成用于吸入或吹入(通过嘴或鼻子)给药或口服、口腔合化、非肠道或直肠给药。
对于口服,药物组合物可以采用例如片剂或胶囊的形式,通过常规方式制得,使用药物学上可接受的赋形剂如粘合剂(例如,预糊化的玉米淀粉,聚丙烯吡咯烷酮或羟丙基甲基纤维素);填料(例如,乳糖、微晶纤维素或磷酸氢钙);润滑剂(例如,硬脂酸镁、滑石或硅石);崩解剂(例如,土豆淀粉或淀粉羟乙酸钠);或湿润剂(例如,十二磺基硫酸钠)。可以通过本领域公知的方法将片剂包衣。用于口服的液体制剂可以采用例如溶液、糖浆或悬浮液的形式,或可以将它们制成在使用前用水或其它合适赋形剂构建的干产品。可以通过常规方式制得这样的液体制剂,使用药物学上可接受的添加剂,如悬浮剂(例如,山梨醇糖浆,纤维素衍生物或氢化食用脂肪);乳化剂(例如,卵磷脂或阿拉伯胶);非水性赋形剂(例如,杏仁油、油酯、乙醇或分馏的植物油);和防腐剂(例如,甲基或丙基对羟基苯甲酸酯或山梨酸)。如果需要,制剂还可以含有缓冲盐、调味剂、着色剂和甜味剂。
可以适当配制用于口服的制剂来给予活性化合物的受控释放。对于口腔含化给药,组合物可以采用以常规方式配制的片剂或锭剂形式。
对于通过吸入的给药,以加压包装或喷雾器中呈现的气溶胶喷雾形式来方便地递送根据本发明使用的双功能分子,使用合适的推进剂,例如二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其它合适的气体。在加压气溶胶的情况中,可以通过提供递送计量用量的阀来决定剂量单位。可以配制用于吸入器或吹入器中的例如明胶的胶囊和药筒来含有化合物和合适粉末基料如乳糖或淀粉的粉末混合物。
可以配制本发明的双功能融合蛋白用于通过注射的非肠道给药,例如,通过快速浓注或连续灌输。用于注射的制剂可以以单位剂型呈现,例如,在安瓿中或在多剂量容器中,含有加入的防腐剂。组合物可以采用这样的形式如油或水性赋形剂中的悬浮液、溶液或乳液,并可以含有配制剂如悬浮剂、稳定剂和/或分解剂。或者,活性成分可以是在使用前用合适赋形剂例如无菌无热原水构建的粉末形式。
还可以将化合物配制于直肠组合物中如栓剂或滞留灌肠剂,例如,含有常规栓剂基料如可可脂或其它甘油酯。
除了之前所述的制剂,双功能分子还可以配制成长效制剂。这样的长效制剂可以通过植入(例如,皮下或肌内)或通过肌内注射来给药。因此,例如,化合物可以与合适的聚合或疏水材料(例如,作为可接受油中的乳液)或离子交换树脂一起配制,或配制成微溶衍生物,例如,作为微溶盐。
如果需要,组合物可以存在于包装或分配装置中,其可以含有一个或多个含有活性成分的单位剂量形式。例如包装可以包括金属或塑料薄片,如泡罩包装。包装或分配装置可以附随给药的说明。
本发明的一些融合蛋白组合物可以治疗上用于癌症治疗中。因此,可以将它们与常规化疗剂结合配制。常规化疗剂包括烷基化剂、抗代谢物、各种天然产物(例如,长春花属生物碱、表鬼臼毒素、抗生素和消耗氨基酸的酶)、激素和激素拮抗剂。特定种类的药剂包括氮芥、烷基磺酸盐、亚硝基脲、三氮烯、叶酸类似物、嘧啶类似物、嘌呤类似物、铂复合物、肾上腺皮质抑制剂、肾上腺类固醇、孕酮、雌激素、抗雌激素和雄激素。一些实例化合物包括环磷酰胺、苯丁酸氮芥、氨甲蝶呤、氟尿嘧啶、阿糖胞苷、硫鸟嘌呤、长春碱、长春新碱、阿霉素、柔红霉素、丝裂霉素、顺铂、羟基脲、强的松、羟孕酮己酸盐、甲羟孕酮、醋酸甲地孕酮、己烯雌酚、炔雌醇、他莫西芬、丙酸睾酮和氟甲睾酮。例如,治疗乳癌中,优选他莫西芬。
治疗方法根据本发明的创造性治疗方法通常使用上述鉴定的双功能蛋白。融合蛋白的结构域具有特异性靶向特定组织和/或增加对靶组织免疫应答的能力。因此,典型的方法包括将靶细胞的受体与融合蛋白的受体-拮抗结构域结合和/或刺激T-细胞依赖性免疫应答。
治疗方法包括将治疗有效量的融合蛋白给予需要治疗的患者。在此使用的“治疗上有效的”指的是融合蛋白的量是足以抑制或逆转病况(例如,降低或抑制癌生长)的量。一些方法考虑了与已知癌症药物或治疗例如化疗(优选使用上述种类的化合物)或放疗的联合治疗。患者可以是人或非人动物。当患有以促进癌症维持或增生的受体的提高水平为特征的癌症时,患者通常需要治疗。
在体内治疗过程中的给药可以通过任何途径,包括非肠道和口服,但优选非肠道。可以使用囊内、静脉内、鞘内和腹膜内给药途径,通常优选静脉内。本领域技术人员将认识到根据待治疗的病症来改变给药的途径。
确定治疗有效量具体地取决于这些因素,如药物的毒性和功效。可以使用本领域公知的和前述参考文献中可找到的方法来测定毒性。可以利用相同的指导结合以下实施例中所述的方法来测定功效。因此,药物学上的有效量,是临床医师认为毒理学上可耐受的而仍然有效验的量。例如,可以通过靶组织T淋巴细胞细胞毒性的诱导或基本上的诱导或靶组织块的减小来测量功效。合适的剂量约为1mg/kg至10mg/kg。
测定融合蛋白生物活性的筛选测定本发明还提供了基于细胞的测定系统,可以用于比较本发明给定融合蛋白的每个多肽结构域的生物活性。为此,使用细胞增殖测定法来确保融合蛋白的融合结构域各自保留了与未融合时的天然蛋白(即,不是融合蛋白的一部分)相似的生物学功能。
一实施方案中,通过在体外将蛋白引入两种分开类型的细胞系来测定融合蛋白的生物活性每个细胞系测定特定结构域的生物活性。例如,为第一个多肽结构域生物活性的可靠指示物的细胞系应该用于测试该结构域的效应,而能够表明第二个多肽结构域生物效应的细胞系应该用于监控另一结构域的活性。这还将帮助测定两个功能融合蛋白结构域的协同效应和附加效应。以下实施例是说明性的并不应该认为是限制性的。可以在环状质粒、粘粒载体或其它载体如源自病毒的载体中携带AFP-融合转基因构建体。载体可以含有另外的有助于它在原核和真核细胞中增殖的序列,例如,药物选择标记(例如,大肠杆菌中的氨苄青霉素抗性,或哺乳动物细胞细胞中的的G-418抗性)和复制起点(例如,用于在原核细胞中复制的colE1,和用于在哺乳动物细胞中复制的oriP)。
实施例3纯化融合蛋白为了获得融合蛋白提高的产量,需要根据本领域公知的方法首先纯化它们。这些步骤包括从转基因动物收集奶或通过离心从培养物除去细胞,接着沉淀、切向流过滤,和色谱方法,如低压SEC和制备性RP-HPLC色谱。接着这些步骤的是缓冲液交换、去除热原和冻干。
之前所述的不是用来确定本发明已经鉴定的所有方面或实施方案,也不是以任何方式来限制本发明。附图,将其引入并构成说明书的一部分,说明了本发明的实施方案,并与说明一起,用来解释本发明的原理。
该说明书中提及的所有出版物和专利申请在此引入作为参考,与具体表明每个单独的出版物或专利申请引入作为参考的程度相同。
尽管已经结合具体实施方案描述了本发明,可以理解能够进一步改变且该申请涵盖大体上按照本发明原理的对本发明的任何改变、使用或调整并包括在本发明所属领域中已知或惯例范围内的与本公开的偏离,并可以应用于上文所列的基本特征中。
所引用的文献并引入作为参考1.Baguisi A,(1999)等,Production of Goats by Somatic CellNuclear Transfer(通过体细胞核移植来生产山羊)NATURE BIOTECH;17456-461。
2.Cibelli JB,(1998)等,Cloned Transgenic Calves ProducedFrom Nonquiescent Fetal Fibroblasts(从非静止的胎成纤维细胞产生的克隆转基因小牛)SCIENCE;2801256-1258。
3.Eipper BA等,Peptidylglycine alpha-Amidating MonooxygenaseA Multifunctional Protein with Catalytic,Processing andRouting Domains(1993)(肽甘氨酸α-酰胺化单加氧酶具有催化、加工和传递结构域的多功能蛋白)PROTEIN SCIENCE 2,489-497。
4.Eppstein等,BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS,12066-73(1984)。
5.Hwang,H.-Y等(1996)Creation of Homozygous Mutants ofLeishmania Donovani With Single Targeting Constructs(具有单个靶向构建体的Leishmania Donovani纯合突变体的形成)J.BIOL.CHEM.27130840-30846。
6.Jain,M等(2001)Targeted Inactivation of GaI Does Not AlterCardiac Function or β-Adrenergic Sensitivity(GaI的靶向灭活没有改变心脏功能或β-肾上腺素敏感性)AM.J.PHYSIOL.280569H-575。
7.Kanehisa(1984)NUC.ACIDS RES.12203-213。
8.Kasinathan P,(2001)等,Effect of Fibroblast Donor CellAge and Cell Cycle on Development of Bovine Nuclear TransferEmbryos In Vitro(成纤维细胞供体细胞年龄和细胞周期对体外牛核移植胚胎发育的影响)BIOL REPROD.;64(5)1487-1493。
9.Kasinathan P,(2001)等,Production of Calves from G1Fibroblasts(从G1成纤维细胞生产小牛)NATURE BIOTECH;191176-1178。
10.Kerr等,NAT.BIOTECHNOL.1675-79,1998。
11.Lim,S等(1997)A Shortened Life Span of EKLF-/-AdultErythrocytes,Due to a Deficiency of Beta-Globin Chains,isAmeliorated by Human Gamma-Globin Chains(由于β-球蛋白链的缺陷,通过人γ-球蛋白链来改善EKLF-/-成熟红细胞缩短的生命期限)BLOOD 90291-1299。
12.Meng L等(1997)Rhesus Monkeys Produced by Nuclear Transfer(通过核移植产生的恒河猴)BIOL REPROD.Aug;57(2)454-9。
13.Mortensen,R等(1992)Production of Homozygous Mutant ESCells with a Single Targeting Construct(用单个靶向构建体生产纯合突变体ES细胞)MOL.CELL.BIOL.12,2391-2395。
14.Nagy,A等(1996)Targeted MutagenesisAnalysis of PhenotypeWithout Germ-Line Transmission(靶向突变无种系传送的表型分析)J.CLIN.INVEST.971360-1365。
15.Ongeri EM等(2001)Development of Goat Embryos After In vitroFertilization and Parthenogenetic Activation by DifferentMethods(通过不同方法体外受精和单性生殖激活后山羊胚胎的发育)THERIOGENOLOGY Jun 1;55(9)1933-45。
16.Paris等,BIOTECHNOL.APPL.BIOCHEM.12436-449(1990)。
17.REMINGTON′S PHARMACEUTICAL SCIENCES(第16版,Osol,A编辑,Mack,Easton Press.(1980))。
18.Sakai,E等(1999)Recombination And Transcription of TheEndogenous Ig Heavy Chain Locus Is Effected by the Ig Heavy ChainIntronic Enhancer Core Region In the Absence of the MatrixAttachment Regions(内源Ig重链基因座的重组和转录在基质附着区不存在下受到Ig重链内含子增强子核心区的影响)PROC.NATL.ACAD.SCI.U.S.A.961526-1531。
19.Sambrook等,MOLECULAR CLONING--A LABORATORY MANUAL,ColdSpring Harbor Laboratory Press,(第2版)1989。
20.Watson等,(1987)THE MOLECULAR BIOLOGY OF THE GENE(第4版),第1&2卷,Benjamin,Menlo Park,Calif。
21.Wilmut I等,(2002)Somatic Cell Nuclear Transfer(体细胞核移植)NATURE Oct 10;419(6907)583-6。
22.Wilmut I等,(1997)Viable Offspring Derived From Fetal andAdult Mammalian Cells(源自胎和成熟哺乳动物细胞的有生活力的后代)NATURE Feb 27;385(6619)10-3。
23.Wold F等,In vivo Chemical Modification of Proteins(蛋白质的体内化学修饰)ANN.REV.BIOCHEM.50 783-814(1981)。
24.Wright等,High Level Expression of Active Humanalpha-l-Antitrypsin in the Milk of Transgenic Sheep(活性的人α-1-抗胰蛋白酶在转基因绵羊奶中的高水平表达)(1991)BIO/TECHNOLOGY,977-84。
25.Yong Z和L Yuqiang,(1998)Nuclear-Cytoplasmic In teractionand Development of Goat Embryos Reconstructed by NuclearTransplantationProduction of Goats by Serially CloningEmbryos(核-细胞质的相互作用和通过核移植重建的山羊胚胎的发育通过连续克隆胚胎生产山羊)BIOL REPROD.;58266-269。
26.Zou X等,(2002)Generation of Cloned Goats(Capra Hircus)From Transfected Foetal Fibroblast Cells,The Effect of DonorCell Cycle(从转染的胎成纤维细胞产生克隆的山羊(Capra Hircus),供体细胞周期的影响)MOL REPROD DEV.;61164-172。
所引用的专利并引入作为参考1.Meade等,TRANSGENIC NON HUMAN MAMMAL MILK(转基因非人哺乳动物奶)美国专利5,750,172;授权公告日1998年5月12日。
2,Meade等,ISOLATION OF EXOGENOUS RECOMBINANT PROTEINSFROM THE MILK OF TRANSGENIC MAMMALS(从转基因哺乳动物奶中分离外源重组蛋白)美国专利4,873,316;授权公告日1989年10月10日。
3.Stice等,CLONING USING DONOR NUCLEI FROM PROLIFERATINGSOMATIC CELLS(使用增殖体细胞的供体核来克隆)美国专利5,945,577;授权公告日1999年8月31日。
4.Hurwitz等,美国专利5,648,2435.Meade等,美国专利5,827,6906.DiTullio等,美国专利5,843,7057.Clark等,美国专利5,322,7758.Garner等,美国专利5,639,9409.Deboer等,美国专利5,633,07610.Drohan等,美国专利5,589,604
序列表<110>GTC Biotherapeutics,Inc.
Meade,HarryCox,Geoffrey F.
<120>在转基因哺乳动物奶中生产融合蛋白的方法<130>GTC-220 PCT<150>60/500,910<151>2003-09-05<160>35<170>PatentIn version 3.2<210>1<211>2029<212>DNA<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白CDNA<300>
<308>基因库登记号No.V01514<309>2002-01-11<313>(1)..(2029)<400>1atattgtgct tccaccactg ccaataacaa aataactagc aaccatgaag tgggtggaat 60caattttttt aattttccta ctaaatttta ctgaatccag aacactgcat agaaatgaat120atggaatagc ttccatattg gattcttacc aatgtactgc agagataagt ttagctgacc180tggctaccat attttttgcc cagtttgttc aagaagccac ttacaaggaa gtaagcaaaa240tggtgaaaga tgcattgact gcaattgaga aacccactgg agatgaacag tcttcagggt300gtttagaaaa ccagctacct gcctttctgg aagaactttg ccatgagaaa gaaattttgg360
agaagtacgg acattcagac tgctgcagcc aaagtgaaga gggaagacat aactgttttc 420ttgcacacaa aaagcccact ccagcatcga tcccactttt ccaagttcca gaacctgtca 480caagctgtga agcatatgaa gaagacaggg agacattcat gaacaaattc atttatgaga 540tagcaagaag gcatcccttc ctgtatgcac ctacaattct tctttgggct gctcgctatg 600acaaaataat tccatcttgc tgcaaagctg aaaatgcagt tgaatgcttc caaacaaagg 660cagcaacagt tacaaaagaa ttaagagaaa gcagcttgtt aaatcaacat gcatgtgcag 720taatgaaaaa ttttgggacc cgaactttcc aagccataac tgttactaaa ctgagtcaga 780agtttaccaa agttaatttt actgaaatcc agaaactagt cctggatgtg gcccatgtac 840atgagcactg ttgcagagga gatgtgctgg attgtctgca ggatggggaa aaaatcatgt 900cctacatatg ttctcaacaa gacactetgt caaacaaaat aacagaatgc tgcaaactga 960ccacgctgga acgtggtcaa tgtataattc atgcagaaaa tgatgaaaaa cctgaaggtc1020tatctccaaa tctaaacagg tttttaggag atagagattt taaccaattt tcttcagggg1080aaaaaaatat cttcttggca agttttgttc atgaatattc aagaagacat cctcagcttg1140ctgtctcagt aattctaaga gttgctaaag gataccagga gttattggag aagtgtttcc1200agactgaaaa ccctcttgaa tgccaagata aaggagaaga agaattacag aaatacatcc1260aggagagcca agcattggca aagcgaagct gcggcctctt ccagaaacta ggagaatatt1320acttacaaaa tgcgtttctc gttgcttaca caaagaaagc cccccagctg acctcgtcgg1380agctgatggc catcaccaga aaaatggcag ccacagcagc cacttgttgc caactcagtg1440aggacaaact attggcctgt ggcgagggag cggctgacat tattatcgga cacttatgta1500tcagacatga aatgactcca gtaaaccctg gtgttggcca gtgctgcact tcttcatatg1560ccaacaggag gccatgcttc agcagcttgg tggtggatga aacatatgtc cctcctgcat1620tctctgatga caagttcatt ttccataagg atctgtgcca agctcagggt gtagcgctgc1680
aaacgatgaa gcaagagttt ctcattaacc ttgtgaagca aaagccacaa ataacagagg 1740aacaacttga ggctgtcatt gcagatttct caggcctgtt ggagaaatgc tgccaaggcc 1800aggaacagga agtctgcttt gctgaagagg gacaaaaact gatttcaaaa actcgtgctg 1860ctttgggagt ttaaattact tcaggggaag agaagacaaa acgagtcttt cattcggtgt 1920gaacttttct ctttaatttt aactgattta acactttttg tgaattaatg aaatgataaa 1980gacttttatg tgagatttcc ttatcacaga aataaaatat ctccaaatg 2029<210>2<211>609<212>PRT<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白<300>
<308>基因库登记号No.V01514<309>1995-03-30<313>(1)..(609)<400>2Met Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr1 5 10 15Glu Ser Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu20 25 30Asp Ser Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr35 40 45Ile Phe Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser
50 55 60Lys Met Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp65 70 75 80Glu Gln Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu85 90 95Glu Leu Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp100 105 110Cys Cys Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His115 120 125Lys Lys Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Glu Pro130 135 140Val Thr Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn145 150 155 160Lys Phe Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro165 170 175Thr Ile Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys180 185 190Cys Lys Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr195 200 205Val Thr Lys Glu Leu Arg Glu Ser Ser Leu Leu Asn Gln His Ala Cys210 215 220Ala Val Met Lys Asn Phe Gly Thr Arg Thr Phe Gln Ala Ile Thr Val
225 230 235 240Thr Lys Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln245 250 255Lys Leu Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly260 265 270Asp Val Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile275 280 285Cys Ser Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys290 295 300Leu Thr Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp305 310 315 320Glu Lys Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp325 330 335Arg Asp Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala340 345 350Ser Phe Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser355 360 365Val Ile Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys370 375 380Phe Gln Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu385 390 395 400Leu Gln Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys
405 410 415Gly Leu Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu420 425 430Val Ala Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met435 440 445Ala Ile Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu450 455 460Ser Glu Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile465 470 475 480Ile Gly His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly485 490 495Val Gly Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe500 505 510Ser Ser Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp515 520 525Asp Lys Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala530 535 540Leu Gln Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys545 550 555 560Pro Gln Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser565 570 575Gly Leu Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe
580 585 590Ala Glu Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly595 600 605Val<210>3<211>1776<212>PRT<213>智人<300>
<308>基因库登记号No.V01514<309>2002-01-11<313>(99)..(1874)<400>3Ala Gly Ala Ala Cys Ala Cys Thr Gly Cys Ala Thr Ala Gly Ala Ala1 5 10 15Ala Thr Gly Ala Ala Thr Ala Thr Gly Gly Ala Ala Thr Ala Gly Cys20 25 30Thr Thr Cys Cys Ala Thr Ala Thr Thr Gly Gly Ala Thr Thr Cys Thr35 40 45Thr Ala Cys Cys Ala Ala Thr Gly Thr Ala Cys Thr Gly Cys Ala Gly50 55 60Ala Gly Ala Thr Ala Ala Gly Thr Thr Thr Ala Gly Cys Thr Gly Ala65 70 75 80Cys Cys Thr Gly Gly Cys Thr Ala Cys Cys Ala Thr Ala Thr Thr Thr
85 90 95Thr Thr Thr Gly Cys Cys Cys Ala Gly Thr Thr Thr Gly Thr Thr Cys100 105 110Ala Ala Gly Ala Ala Gly Cys Cys Ala Cys Thr Thr Ala Cys Ala Ala115 120 125Gly Gly Ala Ala Gly Thr Ala Ala Gly Cys Ala Ala Ala Ala Thr Gly130 135 140Gly Thr Gly Ala Ala Ala Gly Ala Thr Gly Cys Ala Thr Thr Gly Ala145 150 155 160Cys Thr Gly Cys Ala Ala Thr Thr Gly Ala Gly Ala Ala Ala Cys Cys165 170 175Cys Ala Cys Thr Gly Gly Ala Gly Ala Thr Gly Ala Ala Cys Ala Gly180 185 190Thr Cys Thr Thr Cys Ala Gly Gly Gly Thr Gly Thr Thr Thr Ala Gly195 200 205Ala Ala Ala Ala Cys Cys Ala Gly Cys Thr Ala Cys Cys Thr Gly Cys210 215 220Cys Thr Thr Thr Cys Thr Gly Gly Ala Ala Gly Ala Ala Cys Thr Thr225 230 235 240Thr Gly Cys Cys Ala Thr Gly Ala Gly Ala Ala Ala Gly Ala Ala Ala245 250 255Thr Thr Thr Thr Gly Gly Ala Gly Ala Ala Gly Thr Ala Cys Gly Gly
260 265 270Ala Cys Ala Thr Thr Cys Ala Gly Ala Cys Thr Gly Cys Thr Gly Cys275 280 285Ala Gly Cys Cys Ala Ala Ala Gly Thr Gly Ala Ala Gly Ala Gly Gly290 295 300Gly Ala Ala Gly Ala Cys Ala Thr Ala Ala Cys Thr Gly Thr Thr Thr305 310 315 320Thr Cys Thr Thr Gly Cys Ala Cys Ala Cys Ala Ala Ala Ala Ala Gly325 330 335Cys Cys Cys Ala Cys Thr Cys Cys Ala Gly Cys Ala Thr Cys Gly Ala340 345 350Thr Cys Cys Cys Ala Cys Thr Thr Thr Thr Cys Cys Ala Ala Gly Thr355 360 365Thr Cys Cys Ala Gly Ala Ala Cys Cys Thr Gly Thr Cys Ala Cys Ala370 375 380Ala Gly Cys Thr Gly Thr Gly Ala Ala Gly Cys Ala Thr Ala Thr Gly385 390 395 400Ala Ala Gly Ala Ala Gly Ala Cys Ala Gly Gly Gly Ala Gly Ala Cys405 410 415Ala Thr Thr Cys Ala Thr Gly Ala Ala Cys Ala Ala Ala Thr Thr Cys420 425 430Ala Thr Thr Thr Ala Thr Gly Ala Gly Ala Thr Ala Gly Cys Ala Ala
435 440 445Gly Ala Ala Gly Gly Cys Ala Thr Cys Cys Cys Thr Thr Cys Cys Thr450 455 460Gly Thr Ala Thr Gly Cys Ala Cys Cys Thr Ala Cys Ala Ala Thr Thr465 470 475 480Cys Thr Thr Cys Thr Thr Thr Gly Gly Gly Cys Thr Gly Cys Thr Cys485 490 495Gly Cys Thr Ala Thr Gly Ala Cys Ala Ala Ala Ala Thr Ala Ala Thr500 505 5l0Thr Cys Cys Ala Thr Cys Thr Thr Gly Cys Thr Gly Cys Ala Ala Ala515 520 525Gly Cys Thr Gly Ala Ala Ala Ala Thr Gly Cys Ala Gly Thr Thr Gly530 535 540Ala Ala Thr Gly Cys Thr Thr Cys Cys Ala Ala Ala Cys Ala Ala Ala545 550 555 560Gly Gly Cys Ala Gly Cys Ala Ala Cys Ala Gly Thr Thr Ala Cys Ala565 570 575Ala Ala Ala Gly Ala Ala Thr Thr Ala Ala Gly Ala Gly Ala Ala Ala580 585 590Gly Cys Ala Gly Cys Thr Thr Gly Thr Thr Ala Ala Ala Thr Cys Ala595 600 605Ala Cys Ala Thr Gly Cys Ala Thr Gly Thr Gly Cys Ala Gly Thr Ala
610 615 620Ala Thr Gly Ala Ala Ala Ala Ala Thr Thr Thr Thr Gly Gly Gly Ala625 630 635 640Cys Cys Cys Gly Ala Ala Cys Thr Thr Thr Cys Cys Ala Ala Gly Cys645 650 655Cys Ala Thr Ala Ala Cys Thr Gly Thr Thr Ala Cys Thr Ala Ala Ala660 665 670Cys Thr Gly Ala Gly Thr Cys Ala Gly Ala Ala Gly Thr Thr Thr Ala675 680 685Cys Cys Ala Ala Ala Gly Thr Thr Ala Ala Thr Thr Thr Thr Ala Cys690 695 700Thr Gly Ala Ala Ala Thr Cys Cys Ala Gly Ala Ala Ala Cys Thr Ala705 710 715 720Gly Thr Cys Cys Thr Gly Gly Ala Thr Gly Thr Gly Gly Cys Cys Cys725 730 735Ala Thr Gly Thr Ala Cys Ala Thr Gly Ala Gly Cys Ala Cys Thr Gly740 745 750Thr Thr Gly Cys Ala Gly Ala Gly Gly Ala Gly Ala Thr Gly Thr Gly755 760 765Cys Thr Gly Gly Ala Thr Thr Gly Thr Cys Thr Gly Cys Ala Gly Gly770 775 780Ala Thr Gly Gly Gly Gly Ala Ala Ala Ala Ala Ala Thr Cys Ala Thr
785 790 795 800Gly Thr Cys Cys Thr Ala Cys Ala Thr Ala Thr Gly Thr Thr Cys Thr805 810 815Cys Ala Ala Cys Ala Ala Gly Ala Cys Ala Cys Thr Cys Thr Gly Thr820 825 830Cys Ala Ala Ala Cys Ala Ala Ala Ala Thr Ala Ala Cys Ala Gly Ala835 840 845Ala Thr Gly Cys Thr Gly Cys Ala Ala Ala Cys Thr Gly Ala Cys Cys850 855 860Ala Cys Gly Cys Thr Gly Gly Ala Ala Cys Gly Thr Gly Gly Thr Cys865 870 875 880Ala Ala Thr Gly Thr Ala Thr Ala Ala Thr Thr Cys Ala Thr Gly Cys885 890 895Ala Gly Ala Ala Ala Ala Thr Gly Ala Thr Gly Ala Ala Ala Ala Ala900 905 9l0Cys Cys Thr Gly Ala Ala Gly Gly Thr Cys Thr Ala Thr Cys Thr Cys915 920 925Cys Ala Ala Ala Thr Cys Thr Ala Ala Ala Cys Ala Gly Gly Thr Thr930 935 940Thr Thr Thr Ala Gly Gly Ala Gly Ala Thr Ala Gly Ala Gly Ala Thr945 950 955 960Thr Thr Thr Ala Ala Cys Cys Ala Ala Thr Thr Thr Thr Cys Thr Thr
965 970 975Cys Ala Gly Gly Gly Gly Ala Ala Ala Ala Ala Ala Ala Thr Ala Thr980 985 990Cys Thr Thr Cys Thr Thr Gly Gly Cys Ala Ala Gly Thr Thr Thr Thr995 10001005Gly Thr Thr Cys Ala Thr Gly Ala Ala Thr Ala Thr Thr Cys Ala101010151020Ala Gly Ala Ala Gly Ala Cys Ala Thr Cys Cys Thr Cys Ala Gly102510301035Cys Thr Thr Gly Cys Thr Gly Thr Cys Thr Cys Ala Gly Thr Ala104010451050Ala Thr Thr Cys Thr Ala Ala Gly Ala Gly Thr Thr Gly Cys Thrl05510601065Ala Ala Ala Gly Gly Ala Thr Ala Cys Cys Ala Gly Gly Ala Gly107010751080Thr Thr Ala Thr Thr Gly Gly Ala Gly Ala Ala Gly Thr Gly Thr108510901095Thr Thr Cys Cys Ala Gly Ala Cys Thr Gly Ala Ala Ala Ala Cys110011051110Cys Cys Thr Cys Thr Thr Gly Ala Ala Thr Gly Cys Cys Ala Ala111511201125Gly Ala Thr Ala Ala Ala Gly Gly Ala Gly Ala Ala Gly Ala Ala
113011351140Gly Ala Ala Thr Thr Ala Cys Ala Gly Ala Ala Ala Thr Ala Cys114511501155Ala Thr Cys Cys Ala Gly Gly Ala Gly Ala Gly Cys Cys Ala Ala116011651170Gly Cys Ala Thr Thr Gly Gly Cys Ala Ala Ala Gly Cys Gly Ala117511801185Ala Gly Cys Thr Gly Cys Gly Gly Cys Cys Thr Cys Thr Thr Cys119011951200Cys Ala Gly Ala Ala Ala Cys Thr Ala Gly Gly Ala Gly Ala Ala120512101215Thr Ala Thr Thr Ala Cys Thr Thr Ala Cys Ala Ala Ala Ala Thr122012251230Gly Cys Gly Thr Thr Thr Cys Thr Cys Gly Thr Thr Gly Cys Thr123512401245Thr Ala Cys Ala Cys Ala Ala Ala Gly Ala Ala Ala Gly Cys Cys125012551260Cys Cys Cys Cys Ala Gly Cys Thr Gly Ala Cys Cys Thr Cys Gly126512701275Thr Cys Gly Gly Ala Gly Cys Thr Gly Ala Thr Gly Gly Cys Cys128012851290Ala Thr Cys Ala Cys Cys Ala Gly Ala Ala Ala Ala Ala Thr Gly
129513001305Gly Cys Ala Gly Cys Cys Ala Cys Ala Gly Cys Ala Gly Cys Cys131013151320Ala Cys Thr Thr Gly Thr Thr Gly Cys Cys Ala Ala Cys Thr Cys132513301335Ala Gly Thr Gly Ala Gly Gly Ala Cys Ala Ala Ala Cys Thr Ala134013451350Thr Thr Gly Gly Cys Cys Thr Gly Thr Gly Gly Cys Gly Ala Gly135513601365Gly Gly Ala Gly Cys Gly Gly Cys Thr Gly Ala Cys Ala Thr Thr137013751380Ala Thr Thr Ala Thr Cys Gly Gly Ala Cys Ala Cys Thr Thr Ala138513901395Thr Gly Thr Ala Thr Cys Ala Gly Ala Cys Ala Thr Gly Ala Ala140014051410Ala Thr Gly Ala Cys Thr Cys Cys Ala Gly Thr Ala Ala Ala Cys141514201425Cys Cys Thr Gly Gly Thr Gly Thr Thr Gly Gly Cys Cys Ala Gly143014351440Thr Gly Cys Thr Gly Cys Ala Cys Thr Thr Cys Thr Thr Cys Ala144514501455Thr Ala Thr Gly Cys Cys Ala Ala Cys Ala Gly Gly Ala Gly Gly
146014651470Cys Cys Ala Thr Gly Cys Thr Thr Cys Ala Gly Cys Ala Gly Cys147514801485Thr Thr Gly Gly Thr Gly Gly Thr Gly Gly Ala Thr Gly Ala Ala149014951500Ala Cys Ala Thr Ala Thr Gly Thr Cys Cys Cys Thr Cys Cys Thr150515101515Gly Cys Ala Thr Thr Cys Thr Cys Thr Gly Ala Thr Gly Ala Cys152015251530Ala Ala Gly Thr Thr Cys Ala Thr Thr Thr Thr Cys Cys Ala Thr153515401545Ala Ala Gly Gly Ala Thr Cys Thr Gly Thr Gly Cys Cys Ala Ala155015551560Gly Cys Thr Cys Ala Gly Gly Gly Thr Gly Thr Ala Gly Cys Gly156515701575Cys Thr Gly Cys Ala Ala Ala Cys Gly Ala Thr Gly Ala Ala Gly158015851590Cys Ala Ala Gly Ala Gly Thr Thr Thr Cys Thr Cys Ala Thr Thr159516001605Ala Ala Cys Cys Thr Thr Gly Thr Gly Ala Ala Gly Cys Ala Ala161016151620Ala Ala Gly Cys Cys Ala Cys Ala Ala Ala Thr Ala Ala Cys Ala
162516301635Gly Ala Gly Gly Ala Ala Cys Ala Ala Cys Thr Thr Gly Ala Gly164016451650Gly Cys Thr Gly Thr Cys Ala Thr Thr Gly Cys Ala Gly Ala Thr165516601665Thr Thr Cys Thr Cys Ala Gly Gly Cys Cys Thr Gly Thr Thr Gly167016751680Gly Ala Gly Ala Ala Ala Thr Gly Cys Thr Gly Cys Cys Ala Ala168516901695Gly Gly Cys Cys Ala Gly Gly Ala Ala Cys Ala Gly Gly Ala Ala170017051710Gly Thr Cys Thr Gly Cys Thr Thr Thr Gly Cys Thr Gly Ala Ala171517201725Gly Ala Gly Gly Gly Ala Cys Ala Ala Ala Ala Ala Cys Thr Gly173017351740Ala Thr Thr Thr Cys Ala Ala Ala Ala Ala Cys Thr Cys Gly Thr174517501755Gly Cys Thr Gly Cys Thr Thr Thr Gly Gly Gly Ala Gly Thr Thr176017651770Thr Ala Ala1775<210>4
<211>591<212>PRT<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白<300>
<308>基因库登记号No.V01514<309>1995-03-30<313>(19)..(609)<400>4Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu Asp Ser1 5 10 15Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr Ile Phe20 25 30Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser Lys Met35 40 45Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp Glu Gln50 55 60Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu Glu Leu65 70 75 80Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp Cys Cys85 90 95Ser Gln Ser Glu Glu Gly Arg His Ash Cys Phe Leu Ala His Lys Lys100 105 110
Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Glu Pro Val Thr115 120 125Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn Lys Phe130 135 140Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro Thr Ile145 150 155 160Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys Cys Lys165 170 175Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr Val Thr180 185 190Lys Glu Leu Arg Glu Ser Ser Leu Leu Asn Gln His Ala Cys Ala Val195 200 205Met Lys Asn Phe Gly Thr Arg Thr Phe Gln Ala Ile Thr Val Thr Lys210 215 220Leu Ser Gln Lys Phe Thr Lys Val Asn Phe Thr Glu Ile Gln Lys Leu225 230 235 240Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly Asp Val245 250 255Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile Cys Ser260 265 270Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys Leu Thr275 280 285
Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp Glu Lys290 295 300Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp Arg Asp305 310 315 320Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala Ser Phe325 330 335Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser Val Ile340 345 350Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys Phe Gln355 360 365Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu Leu Gln370 375 380Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys Gly Leu385 390 395 400Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu Val Ala405 410 415Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met Ala Ile420 425 430Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu Ser Glu435 440 445Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile Ile Gly450 455 460
His Leu Cys Ile Arg His Glu Met Thr Pro Val Ash Pro Gly Val Gly465 470 475 480Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe Ser Ser485 490 495Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp Asp Lys500 505 510Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala Leu Gln515 520 525Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys Pro Gln530 535 540Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser Gly Leu545 550 555 560Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe Ala Glu565 570 575Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly Val580 585 590<210>5<211>1830<212>DNA<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白片段<300>
<308>基因库登记号No.V01514
<309>2002-01-11<313>(45)..(1874)<400>5atgaagtggg tggaatcaat ttttttaatt ttcctactaa attttactga atccagaaca 60ctgcatagaa atgaatatgg aatagcttcc atattggatt cttaccaatg tactgcagag120ataagtttag ctgacctggc taccatattt tttgcccagt ttgttcaaga agccacttac180aaggaagtaa gcaaaatggt gaaagatgca ttgactgcaa ttgagaaacc cactggagat240gaacagtctt cagggtgttt agaaaaccag ctacctgcct ttctggaaga actttgccat300gagaaagaaa ttttggagaa gtacggacat tcagactgct gcagccaaag tgaagaggga360agacataact gttttcttgc acacaaaaag cccactccag catcgatccc acttttccaa420gttccagaac ctgtcacaag ctgtgaagca tatgaagaag acagggagac attcatgaac480aaattcattt atgagatagc aagaaggcat cccttcctgt atgcacctac aattcttctt540tgggctgctc gctatgacaa aataattcca tcttgctgca aagctgaaaa tgcagttgaa600tgcttccaaa caaaggcagc aacagttaca aaagaattaa gagaaagcag cttgttaaat660caacatgcat gtgcagtaat gaaaaatttt gggacccgaa ctttccaagc cataactgtt720actaaactga gtcagaagtt taccaaagtt aattttactg aaatccagaa actagtcctg780gatgtggccc atgtacatga gcaetgttgc agaggagatg tgctggattg tctgcaggat840ggggaaaaaa tcatgtccta catatgttct caacaagaca ctctgtcaaa caaaataaca900gaatgctgca aactgaccac gctggaacgt ggtcaatgta taattcatgc agaaaatgat960gaaaaacctg aaggtctatc tccaaatcta aacaggtttt taggagatag agattttaac 1020caattttctt caggggaaaa aaatatcttc ttggcaagtt ttgttcatga atattcaaga 1080agacatcctc agcttgctgt ctcagtaatt ctaagagttg ctaaaggata ccaggagtta 1140ttggagaagt gtttccagac tgaaaaccct cttgaatgcc aagataaagg agaagaagaa 1200
ttacagaaat acatccagga gagccaagca ttggcaaagc gaagctgcgg cctcttccag 1260aaactaggag aatattactt acaaaatgcg tttctcgttg cttacacaaa gaaagccccc 1320cagctgacct cgtcggagct gatggccatc accagaaaaa tggcagccac agcagccact 1380tgttgccaac tcagtgagga caaactattg gcctgtggcg agggagcggc tgacattatt 1440atcggacact tatgtatcag acatgaaatg actccagtaa accctggtgt tggccagtgc 1500tgcacttctt catatgccaa caggaggcca tgcttcagca gcttggtggt ggatgaaaca 1560tatgtccctc ctgcattctc tgatgacaag ttcattttcc ataaggatct gtgccaagct 1620cagggtgtag cgctgcaaac gatgaagcaa gagtttctca ttaaccttgt gaagcaaaag 1680ccacaaataa cagaggaaca acttgaggct gtcattgcag atttctcagg cctgttggag 1740aaatgctgcc aaggccagga acaggaagtc tgctttgctg aagagggaca aaaactgatt 1800tcaaaaactc gtgctgcttt gggagtttaa 1830<210>6<211>591<212>PRT<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白<300>
<308>基因库登记号No.V01514<309>1995-03-30<313>(19)..(609)<400>6Arg Thr Leu His Arg Asn Glu Tyr Gly Ile Ala Ser Ile Leu Asp Ser15 10 15
Tyr Gln Cys Thr Ala Glu Ile Ser Leu Ala Asp Leu Ala Thr Ile Phe20 25 30Phe Ala Gln Phe Val Gln Glu Ala Thr Tyr Lys Glu Val Ser Lys Met35 40 45Val Lys Asp Ala Leu Thr Ala Ile Glu Lys Pro Thr Gly Asp Glu Gln50 55 60Ser Ser Gly Cys Leu Glu Asn Gln Leu Pro Ala Phe Leu Glu Glu Leu65 70 75 80Cys His Glu Lys Glu Ile Leu Glu Lys Tyr Gly His Ser Asp Cys Cys85 90 95Ser Gln Ser Glu Glu Gly Arg His Asn Cys Phe Leu Ala His Lys Lys100 105 110Pro Thr Pro Ala Ser Ile Pro Leu Phe Gln Val Pro Glu Pro Val Thr115 120 125Ser Cys Glu Ala Tyr Glu Glu Asp Arg Glu Thr Phe Met Asn Lys Phe130 135 140Ile Tyr Glu Ile Ala Arg Arg His Pro Phe Leu Tyr Ala Pro Thr Ile145 150 155 160Leu Leu Trp Ala Ala Arg Tyr Asp Lys Ile Ile Pro Ser Cys Cys Lys165 170 175Ala Glu Asn Ala Val Glu Cys Phe Gln Thr Lys Ala Ala Thr Val Thr180 185 190
Lys Glu Leu Arg Glu Ser Ser Leu Leu Asn Gln His Ala Cys Ala Val195 200 205Met Lys Asn Phe Gly Thr Arg Thr Phe Gln Ala Ile Thr Val Thr Lys210 215 220Leu Ser Gln Lys Phe Thr Lys Val Gln Phe Thr Glu Ile Gln Lys Leu225 230 235 240Val Leu Asp Val Ala His Val His Glu His Cys Cys Arg Gly Asp Val245 250 255Leu Asp Cys Leu Gln Asp Gly Glu Lys Ile Met Ser Tyr Ile Cys Ser260 265 270Gln Gln Asp Thr Leu Ser Asn Lys Ile Thr Glu Cys Cys Lys Leu Thr275 280 285Thr Leu Glu Arg Gly Gln Cys Ile Ile His Ala Glu Asn Asp Glu Lys290 295 300Pro Glu Gly Leu Ser Pro Asn Leu Asn Arg Phe Leu Gly Asp Arg Asp305 310 315 320Phe Asn Gln Phe Ser Ser Gly Glu Lys Asn Ile Phe Leu Ala Ser Phe325 330 335Val His Glu Tyr Ser Arg Arg His Pro Gln Leu Ala Val Ser Val Ile340 345 350Leu Arg Val Ala Lys Gly Tyr Gln Glu Leu Leu Glu Lys Cys Phe Gln355 360 365
Thr Glu Asn Pro Leu Glu Cys Gln Asp Lys Gly Glu Glu Glu Leu Gln370 375 380Lys Tyr Ile Gln Glu Ser Gln Ala Leu Ala Lys Arg Ser Cys Gly Leu385 390 395 400Phe Gln Lys Leu Gly Glu Tyr Tyr Leu Gln Asn Ala Phe Leu Val Ala405 410 415Tyr Thr Lys Lys Ala Pro Gln Leu Thr Ser Ser Glu Leu Met Ala Ile420 425 430Thr Arg Lys Met Ala Ala Thr Ala Ala Thr Cys Cys Gln Leu Ser Glu435 440 445Asp Lys Leu Leu Ala Cys Gly Glu Gly Ala Ala Asp Ile Ile Ile Gly450 455 460His Leu Cys Ile Arg His Glu Met Thr Pro Val Asn Pro Gly Val Gly465 470 475 480Gln Cys Cys Thr Ser Ser Tyr Ala Asn Arg Arg Pro Cys Phe Ser Ser485 490 495Leu Val Val Asp Glu Thr Tyr Val Pro Pro Ala Phe Ser Asp Asp Lys500 505 510Phe Ile Phe His Lys Asp Leu Cys Gln Ala Gln Gly Val Ala Leu Gln515 520 525Thr Met Lys Gln Glu Phe Leu Ile Asn Leu Val Lys Gln Lys Pro Gln530 535 540
Ile Thr Glu Glu Gln Leu Glu Ala Val Ile Ala Asp Phe Ser Gly Leu545 550 555 560Leu Glu Lys Cys Cys Gln Gly Gln Glu Gln Glu Val Cys Phe Ala Glu565 570 575Glu Gly Gln Lys Leu Ile Ser Lys Thr Arg Ala Ala Leu Gly Val580 585 590<210>7<211>18<212>PRT<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白<300>
<308>基因库登记号No.V01514<309>1995-03-30<313>(1)..(18)<400>7Met Lys Trp Val Glu Ser Ile Phe Leu Ile Phe Leu Leu Asn Phe Thr1 5 10 15Glu Ser<210>8<211>54<212>DNA<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白片段<300>
<308>基因库登记号No.V01514<309>2002-01-11<313>(45)..(98)<400>8atgaagtggg tggaatcaat ttttttaatt ttcctactaa attttactga atcc 54<210>9<211>27553<212>DNA<213>智人<220>
<221>misc_特征<223>人α-甲胎蛋白基因组DNA序列<300>
<308>基因库登录号No.M16110<309>1997-06-03<313>(1)..(27553)<400>9gaattcccaa tatctagtat tttctactat taaactttgt gcctcttcaa aactgcattt 60tctctcattc cctaagtgtg cattgttttc ccttaccggt tggtttttcc accacctttt120acattttcct ggaacactat accctccctc ttcatttggc ccacctctaa ttttctttca180gatctccatg aagatgttac ttcctccagg aagccttatc tgacccctcc aaagatgtca240tgagttcctc ttttcattct actaatcaca gcatccatca caccatgttg tgattactga300tactattgtc tgtttctctg attaggcagt aagctcaaca agagctacat ggtgcctgtc360tcttgttgct gattattccc atccaaaaac agtgcctgga atgcagactt aacattttat420tgaatgaata aataaaaccc catctatcga gtgctacttt gtgcaagacc cggttctgag480
gcatttatat ttattgattt atttaattct catttaacca tgaaggaggt actatcacta540tccttatttt atagttgata aagataaagc ccagagaaat gaattaactc acccaaagtc600atgtagctaa gtgacagggc aaaaattcaa accagttccc caactttacg tgattaatac660tgtgctatac tgcctctctg atcatatggc atggaatgca gacatctgct ccgtaaggca720gaatatggaa ggagattgga ggatgacaca aaaccagcat aatatcagag gaaaagtcca780aacaggacct gaactgatag aaaagttgtt actcctggtg tagtcgcatc gacatcttga840tgaactggtg gctgacacaa catacattgg cttgatgtgt acatattatt tgtagttgtg900tgtgtatttt tatatatata tttgtaatat tgaaatagtc ataatttact aaaggcctac960catttgccag gcatttttac atttgtcccc tctaatcttt tgatgagatg atcagattgg 1020attacttggc cttgaagatg atatatctac atctatatct atatctatat ctatatctat 1080atctatatct atatctatat ctatatatgt atatcagaaa agctgaaata tgttttgtaa 1140agttataaag atttcagact ttatagaatc tgggatttgc caaatgtaac ccctttctct 1200acattaaacc catgttggaa caaatacatt tattattcat tcatcaaatg ttgctgagtc 1260ctggctatga accagacact gtgaaagcct ttgggatatt ttgcccatgc ttgggcaagc 1320ttatatagtt tgcttcataa aactctattt cagttcttca taactaatac ttcatgacta 1380ttgcttttca ggtattcctt cataacaaat actttggctt tcatatattt gagtaaagtc 1440ccccttgagg aagagtagaa gaactgcact ttgtaaatac tatcctggaa tccaaacgga 1500tagacaagga tggtgctacc tctttctgga gagtacgtga gcaaggcctg ttttgttaac 1560atgttcctta ggagacaaaa cttaggagag acacgcatag cagaaaatgg acaaaaacta 1620acaaatgaat gggaattgta cttgattagc attgaagacc ttgtttatac tatgataaat 1680gtttgtattt gctggaagtg ctactgacgg taaacccttt ttgtttaaat gtgtgcccta 1740gtagcttgca gtatgatcta ttttttaagt actgtactta gcttatttaa aaattttatg 1800
tttaaaattg catagtgctc tttcattgaa gaagttttga gagagagata gaattaaatt1860cacttatctt accatctaga gaaacccaat gttaaaactt tgttgtccat tatttctgtc1920ttttattcaa catttttttt agagggtggg aggaatacag aggaggtaca atgatacaca1980aatgagagca ctctccatgt attgttttgt cctgtttttc agttaacaat atattatgag2040catatttcca tttcattaaa tattcttcca caaagttatt ttgatggctg tatatcaccc2100tactttatga atgtaccata ttaatttatt tcctggtgtg ggttatttga ttttataatc2160ttacctttag aataatgaaa cacctgtgaa gctttagaaa atactggtgc ctgggtctca2220actccacaga ttctgattta actggtctgg gttacagact aggcattggg aattcaaaaa2280gttcccccag tgattctaat gtgtagccaa gatcgggaac ccttgtagac agggatgata2340ggaggtgagc cactcttagc atccatcatt tagtattaac atcatcatct tgagttgcta2400agtgaatgat gcacctgacc cactttataa agacacatgt gcaaataaaa ttattatagg2460acttggttta ttagggcttg tgctctaagt tttctatgtt aagccataca tcgcatacta2520aatactttaa aatgtacctt attgacatac atattaagtg aaaagtgttt ctgagctaaa2580caatgacagc ataattatca agcaatgata atttgaaatg aatttattat tctgcaactt2640agggacaagt catctctctg aattttttgt actttgagag tatttgttat atttgcaaga2700tgaagagtct gaattggtca gacaatgtct tgtgtgcctg gcatatgata ggcatttaat2760agttttaaag aattaatgta tttagatgaa ttgcatacca aatctgctgt cttttcttta2820tggcttcatt aacttaattt gagagaaatt aattattctg caacttaggg acaagtcatg2880tctttgaata ttctgtagtt tgaggagaat atttgttata tttgcaaaat aaaataagtt2940tgcaagtttt ttttttctgc cccaaagagc tctgtgtcct tgaacataaa atacaaataa3000ccgctatgct gttaattatt ggcaaatgtc ccattttcaa cctaaggaaa taccataaag3060taacagatat accaacaaaa ggttactagt taacaggcat tgcctgaaaa gagtataaaa3120
gaatttcagc atgattttcc atattgtgct tccaccactg ccaataacaa aataactagc3180aaccatgaag tgggtggaat caattttttt aattttccta ctaaatttta ctgaatccag3240aacactgcat agaaatgaat atggaatagg tgagatattt tgtgtttttc ttgtcttttc3300tctatatcaa aattttttaa attataaaat ttgcattaat ttgtcttgat ttattattca3360tatttattat tccacatgga gaaaaaatat ttaactgatg gatatattta aatgaaagaa3420aaacttgtaa ctttacaaga ggtttacaaa gttatagcag tgtttaatgg atgaatggtt3480tgtatgtttc atgttgaatt aatttttaca cttcaatggt atgcatatta actttgaaaa3540attatatata tacacatata tgtacatata tatgaatata aataaaattt tatatgtgaa3600gaagccagaa ttatgctcct tcacataact ccctcagact agtaaaatag ataaaatctt3660tgtttttaat acagaaaaat gggtcattat ttgatggtct gaagaagaaa tattgtgact3720gggatatgaa tggcaaaccg tagtacaact atgttcaaaa gaatgcctga aatatatttt3780taaccatttg actttcagga cagttacagc actacagtac agggaaaaac caaacaactg3840gaagacaaaa tctggatttt agtgataggt ctactataaa ttatgcttgt taacttcatt3900ccttagtttc ctagttttct tttcctcaag tataaaatta agatgcttag gttatcccta3960atgttctttt aattctgaaa ctgtacagtt ctaactgaaa cacaaacatt catatgtaac4020aatgattact ttcttggttg cagttgaaaa cacgtttcat gaagtttatt ttgccttcca4080gcttccatat tggattctta ccaatgtact gcagagataa gtttagctga cctgtaagtt4140ttgcttatat aaatgtactt taaatgtgta aagcaaggat aagtaaatac ttaaataaaa4200ttgggtaccc ctgtgagctc ttaaaagcac aaaagcaatt tggacaattt caagaaaagt4260tactcatact gaatatcaac ttgatgttga agaggttaaa ctgttgacta atgtcttcga4320cattgacctt ttgattcctt gaaatctcat gagtcaaacc aaatcagatt ttagaaactg4380aagattagtg tctgatcagt gacaaccata tactaattca ggaatttttc tcatcagtac4440
caacagggtg atattataat gttttctttt ctgtatacta tttaaatctt agcagcaaac4500cataggtgat aaaatattct atttgctgtt atttgtggag agtatgttag tctcttggat4560gtctttccat tccacatttt aaaaatttct aacaaagaat ttaaagtagt gtgttgctgt4620tactccttgc acatccaaac ctgcataagg attgctttga gtcaatccat gagcactgta4680gtcttgggtt ttagaccttg atcatactgg gaatagacac tgttagaggt ctgtctaatt4740accaattttt ttttgcttaa atttaaaagt aaccataaag aatatagata ccctcaatta4800tgggtacatt acagtagatg gatggtcaca gaaggagaaa ccactcttat gggaaatcca4860cttattttag cctttaacat ctatatgtat atttatggca aaagaaaaca agaaaaagac4920taaagtttct tctcagatga cctggaagct aattttacat aattttacaa atcaaatgtc4980taaacagatt acaacataaa tagaaaacaa aacaaacaaa tgaaaaacta tacttgagaa5040aaataagctt gctgcaggtc tgttccttaa ggattcacac gtatttttgt ttcagggcta5100ccatattttt tgcccagttt gttcaagaag ccacttacaa ggaagtaagc aaaatggtga5160aagatgcatt gactgcaatt gagaaaccca ctggagatga acagtcttca gggtgtttag5220aaaaccaggt gagtgaataa ttttaaaaaa gcattgtgat atttgacaaa aatttagcat5280gctgaagaga agatacaaaa atagcagtga aaaatgcatt taaatatttg aagagctatt5340gtatgaaaga gggattagat tcattctgaa ttgctaaaga gggcagaaga gaacaatagg5400tagttattat aaagagacca tataaatatg atgaactaag gttctgaaat aagattatct5460tgatgactat gggcatatta acttttttga gcttcagttt tcttatctgt aaaataaggg5520atgataatag ctcccatttc atagttagca tggaaattga tataacagca atagtagcta5580acttttatta tacacacaat gtgactggca ttattctagg gagcataatg tgtatattga5640taataaaaat attttatgac ataggggata gatagcactg atgaatcaga atggttgtcc5700agtgagtcaa gagatgctgg ctcgggcttc tgggcaggat atcagctttg cttacctata5760
tttatttatt aaacatttaa aataatcctt gaagatagat gctaatcttc caactgagga5820agctgaggct cagagaattt aagtaacttt cttatgggaa ccaccaaatg gcagagccag5880gatttgaact agaccatctg gcttaaaatt gacagtctta gtagcttcat tacactataa5940ctatagtgaa tgtaagatgc atagcacatc gttagggttg ccaggtttag caaacaacaa6000caaaacataa tacccagttc aatctgaatt ttagataaac actaaatact tttcttagta6060taaggatatt tcattgtaga agctcaacaa ataatattta ttatttattt tatctcaaca6120tagaaacaaa cttgataatg attagaactc tccaattata aaacaacatg cccagagaat6180actctgttat ggtggggtta attaggtggc tgaaagacaa tgtacctgga atatcataga6240agagatgctc ctttaaggat atagtttaag ttctttccaa ctttgaaatt tatgaattga6300caaaaatttc tgttttgcat ctctattttt gtcttgttct gataatcttt tcaaaatgtg6360tataaaaaaa caagaataca ttatctattg caactttaca accaattaga ggttcaaggt6420aatgttacag atcgctgatt tattcttgta aattcaaagg tatgtctttt aaatgaggat6480tgggaattag aaatcttacg taagccttcc aggattctct aaatattact gtagcagcta6540taaaagctac ataaaagttc cctcagatac atgaaacaca tgtattcctc agatgctttc6600tgtggaatat tgatgctgtc atctgagttt ggtaagggta agtcacagag gaggaaacac6660atacatttta aaacatttta gctaaatatg taattgtggc caagaaaagt gtttttttaa6720aaaataatta tttcatttca aaatcatttt tatttataat tgaaaataat atgcagtttt6780ttattgtctt gtaaggatgg catgtaaaat gagcatttat gtctgaaatg tggtatgtct6840gtgtgtgtgt gtgtatatgt atatatgtat gtatatacca taatatatac atatgtattt6900gcaattccaa aagttacatc tttaatgaga atcatgaaaa tattattttg ctcagtttct6960ttttttattt aaatttaaat ttaaagttct ggtgtacacg ggcaggatga gcaggtctgt7020tacataggta aacacgtggc atggtggttt gctgcaccta ccaacctgtt gcctgggtat7080
taagcccagc gtgcattacc tatttttcct aatgctctcc ctccctgcac tccactccct7140gacaggcccc agtgtgtgct gtttccctcc ctgtgtccat gaaacatggt ttatatattt7200ataaaagttt atatatccta gtccaaattt ttgataacac aaaaaggaaa aataaaataa7260ttcaaaattg ggaaagagaa acaaaagatt gcatggcttt tttcctttta ttgtttggac7320attaaagtct cattttccat aaggcagcaa agaaatctat ttcatcaggc tgaaacaaaa7380tacattagaa tttgtatgga aaatttttca gaatctatag ttctgatttt agacattaga7440aaatgtttca tgtgtcttat agatttttaa agcaaagtta gttgtctttc tccaaacata7500aaatatttct tatagctacc tgcctttctg gaagaacttt gccatgagaa agaaattttg7560gagaagtacg gacattcaga ctgctgcagc caaagtgaag agggaagaca taactgtttt7620cttgcacaca aaaagcccac tccagcatcg atcccacttt tccaagttcc agaacctgtc7680acaagctgtg aagcatatga agaagacagg gagacattca tgaacaagta aggatccagt7740ttaaaggtag atgcaaacct cagaaacaca gcaatggcaa gcctaattta gtatttttgc7800aatgtactca tgtactccca gtaagaggta taatgtttct ttggtgttgt gtctgctgag7860gtcccaggca aggtaattag gagagcaaca ttcaatgtaa cttggtttcc atagcacgct7920agatgtagta caaaccacag gacaaaccta ccagaggttc cattagtccc ttgagagata7980tacacctttt ttttttcttt ttacccattc tactctcaat tttaccttgt tcaagaatat8040attagtattg caccaaattg atgctttcca gagccatata ttggtgtttt gtgttcacct8100aattgcctag aaataaaagt tagagatcca agcatggtca agcatggtca agatacacag8160acatggcaaa ggtttactga acacttagga tgttgtgggg ccgggcgcgg tggctcacgc8220ttgtaatccc agcactttgg gaggccgagg cgggcggatc acgaggtcag gagatcgaga8280ccatcctggc taacatggtg aaaccccgtc tctactaaaa atacaaaaaa aattagccgg8340gcgtgatggt gggcgcctgt agtcccagct actcgggagg ctgaggcagg agaatggcgt8400
gaaccctgga ggcggagctt gcagtgagcc gagattgcgc cactgcactc ccgcctgggc8460cacagagcga gactccgtct caaaaaaaaa aaaaaaaaaa aaggatgttg tggaaacatg8520tctgcttgca cagaggatca gattaacact cacaaacaaa ctttgaagcc tccttctcct8580cttcctcttc attcttcttc tttcccccat tttgttgata ggaaattgaa ggttggaagg8640ctaaaacaac tggctaaggg cacacagcta gtacatttga ccccaggttc ttctgttgga8700gaagcctgta cgtaactctt caatcacttc tgccttccat gttacttcct aaaccagata8760aatagagaga ttgcccttag aacatctctg ctatggcgac tatccaggtg cataacccca8820ttctgcactg acaagggata aaatgtccat ctttctgttg cacttagcag aagtctggct8880ttgctgatcc ctgaaacata tctgagtagg cttattgaaa aagacctttt aataagaatc8940atggttagca tgtctgccta ttttcttctc ataatagaat ctggtaccat ctgtcagata9000tttttccccc caggatcttt agtgaggaaa attttgacaa catgtggaaa aaatatgatg9060attttcccct taggaacaca gtaaagacaa agtcaaatgc attttgttgt tgttgttttt9120gaatctttaa ataaatccca gtgtccagtt ccaagcagta gtagtcctat ttttaggtgt9180ttataaatct tctagctcta ttttatttca cagattcatt tatgagatag caagaaggca9240tcccttcctg tatgcaccta caattcttct ttgggctgct cgctatgaca aaataattcc9300atcttgctgc aaagctgaaa atgcagttga atgcttccaa acaaaggtat catatttgcg9360tggatatctg aaccagtact gtagtctatg actcattaaa acaaaacaaa gttaaaaatg9420aaaacgtgct taattgtgga gagtatcgtt tttggaatag agaaatagtt cagcagtctg9480atattcttcg agtgaacaaa actggatttg ctggttttta ttatctattc attaagtcaa9540caataatttt attattaagg aagtgagttt gatgggataa agaaggaaag acagacagac9600agaaagagag aaagagaggg tgctataaat gggaaggagt aagtgaaaga aaacggagaa9660aaggaggagc agaggagaga gaaaaaatga agaactatga taaatgcttt atacttactg9720
tttttttaaa ccttagaaca aatttgaggt gtaagtattt ttgtccttta acaaactagg9780aaagaggttt agagaagaaa atttttttta ggtttagaga ggtagaataa tatccaccat9840taactacttg ctaccagcag tcctataaca aaaatttcct gagaactgac tactctcagt9900gtcaagccgt gatacaatcg tattttttgt aactgagaag acacttaaga aattagcagg9960cttcaatttg tctttaagct gtttaaaggt acagttgttc atttatgatc cccagtataa 10020aagttatgtt tttgtttcaa ggtactttga gtaaatttgt ctggcacaga tgcatataaa 10080ctaacccaaa agaataaatg agtcaataat attctgcgat aatgtatgac atttataatt 10140tttagtaaaa aacatatttt atggaatttc attttaccta tacttgttgt ttttctaaat 10200attagagctt gtaaagaaaa tgttagtata tgctttcatg acattttgtt tcctctacat 10260ctaggcagca acagttacaa aagaattaag agaaagcagc ttgttaaatc aacatgcatg 10320tgcagtaatg aaaaattttg ggacccgaac tttccaagcc atgtaagttc aagttctatc 10380tagggaagag ggtgagagct acagaactac cattttgcaa tttgggttcg tttttttaat 10440tgttgctgtt ttagagaatg aagacccctt tgtgacctct ttgatgaggg ctaatgggat 10500tagaaccatg aactcttagg atcagaagga agctaacgga taagtcagtt taacacttac 10560taaagcctag ctgagataat acatagaaaa gacttttaaa gtttatgtta tttacctgtt 10620ctttaagaca cttaagttct ggcctgccat caaattatac ctcatcacta gaccatattt 10680ttctagctct tctacaaaat aagtcagcct tcactgagtg tcatttaaaa cttttgcctt 10740aacaagaaat tctttatatt aattgtgttt cttaatcttc tataaggctc tttatagcat 10800ttattgcttc ccataaaaat attcctttga ggcaataata ttagaatcta gtgtcaggag 10860aaaagaacat tttaaattat ataacttctt taaagtactc atcaactctt ttatgataaa 10920acatttctag tatatgaaaa tatctgagct gctaatcgaa tagtagtaag tatatatatt 10980cagagtttat ttgattgctg tttggttaaa taacacgtta aagcatattg tagacaatgg 11040
aaatctagaa tgaagttttt agtaatagaa ttagttctaa agactgaaat ttcttcttgt11100aagaagtcag atttatgcct taactaccct ccaactcaat tagaaattga aagattaatt11160tatgacctac tttaaaaaaa tttatcttag taataaaata gaaattgaga tagtattata11220atacccttat catttgctat ccataagtga aagctaagtg gtctaaattt atagagaaga11280tccatcttta tcagaagcag gagtaacact attttctcta ggagcaatgg ttttacaaag11340acaactctta aaatttaatg aaatatgcag aggaaaccag aatttttatt tcttacttct11400tttttggcca cattactctc ttggcacact ggtatgcctg aaatgtttaa tctgctccac11460tttcttgtcc catttcattg atttgcacat acgcctcctt tcctggattc tcagaagtat11520tttttacccc agtaaaaaat ggttctcatt ttcatggaat tttccatttc ttaattgttt11580atccttttaa agttttatgt ccactcaata caaatgctca gcataagggt tgaatggcaa11640aaataattta ccttaattct taagacatgt tttaggaaaa gataaattat ttctaaacca11700tttgtggggc cagctcacag tttacagagt taccaccttg aaagatatgg ctggaatcaa11760gccttaaaac atgtttcctt ttctttttaa acaacaaggg aatttcagtc atttctcttt11820gaaacttcta ctgtagtaat actctataaa ttctatttta ttttgacaga taaccaagaa11880attaatttct aatttctttt ttttccctag aactgttact aaactgagtc agaagtttac11940caaagttaat tttactgaaa tccagaaact agtcctggat gtggcccatg tacatgagca12000ctgttgcaga ggagatgtgc tggattgtct gcaggatggg gtgaggagtc ttgcttctta12060aaatagaaga ttttcactcc cttttctttc tttttgtctc attctaaaag ggagaaggtt12120gtttgacttg aattggttac agagtatgta aactaggtga ctccttaaat ttgcagaatt12180ctcggtagta aaacttaaac catcttttgt tgatcctggc tttcacttta gctatacccc12240tttttgtgaa accaaggctc atctatttct tacttctaaa aaaaccgtgg gaacttctca12300gaaggcttct ccatagttac ttggaggacg ggaggaaact aaggtttaat gtatttattt12360
tttcattcat ttattctttc atttgacaaa taaatatata ttaaatactt tctatctgct12420agccactatg acagacactt gttttaaaag cacaggctga cctcaaggaa ttcacagtct12480gataggagag ataagacagt gacctccttg gagttaggga ctgccttggt ttactgttat12540ctccatagca caatgcctgg cacatggaag gcattctata atagtttgtt aaatgaacga12600atgcaataaa aattgcacaa gtaactgtcc taccaggtaa aaagctagcc ttgccaaaga12660caagtgtgaa taaagtggtc tcggagaatt agaaaacaaa atttaaaaaa cccagcaaca12720gtttcttgag tgtgctctag tcagtggtgg tttaagcagt gtggcattgg cttattttgg12780ctaaccctag acttcctaga ttttacaaga gaggactgtt gaccctcaga ttactctgtc12840tctgtgggct ccatgacaca ccaaagagat taaaatccaa ggagcttaaa aattactgct12900cttaggtact caaatggctt gataaccagc actggactat ggtttccaga aggctgaaag12960tgaagataaa atgctcattt cagcccatcc gatggcaatt cagtgagatg cttgaagtaa13020gcaagaagcc gaggctgcag aggaggcctg agagtgacag tccctgagga gctggggaag13080aagtgggagg aggcagcctg gcaggcgact gtactacttt acttgttttt cttctagaaa13140tatggcatac taggaaaacc aacaagaagt attttgtttt tctttgagct cagttttccc13200attttgaacg gacaatttta ctgtttctcg ttgtcatttt taaaaagtta attttttcaa13260tttttggagc tcataaccac ccttttcctt taaagtggaa acattaattt cagcatgata13320tgtaagttgg attttgatag ctgaataatg ggttctaatt atctttgctg agaatgtaca13380gaattttcag tcccatgaca ggtatatatg taagctctgc ctctctctgg ccacttaggt13440gcattgccat tttattatct atagactgcc ctctgaaggt catagtcagt cactgcagta13500tgttctgata aagatgatta tcattcttac ggaatttctc gtggagcaga aagtttgctc13560tccatgttat gataccagtt gcaagtgttg tttaggggca aatttgaatg ctaatagaaa13620tacatatagc aacatgcatc ctattttatt tgagcacatt tccctcttat ttgtaaaggt13680
tttcaattga aataacatag gatttagctt acaactatgg aaagaagaat tgaacaaaca13740ggtaagtgga aaggaatgag aaaaggcaaa agtggggaga aagcactaaa acgggagaca13800agttaaaatt tctttttaat tgataggtca cgttctcact ctatttgcct ttaagggaag13860aaagcaatca agttaatatg ttttccttca ttgtatagta tgtaactacg gacactatta13920gaggagggat ttgtgtagca cttaggacat tatacttgat aatttccaag ggtctttcta13980gatttaaaag tctgattcta acgtagtaat aaaaataaag gcccaatttt ctctttaata14040ttgcctgaag atattactct attattgcat taaaattaaa cattcacaca ttgtttgcac14100tgctaaataa aattatgtaa tttcttcttc tttccttcct ccttccccca tccctctcta14160tttccctttc cccttccttc tttcctggcc ttttttcctt ctttctttgt tcccttctcc14220ctccctcccc tttcttcctt tttctaaagc tggctttgag atcctttatt aaagaataaa14280tctttaaaac ttatacttta ttttccctgt tgcaggaaaa aatcatgtcc tacatatgtt14340ctcaacaaga cactctgtca aacaaaataa cagaatgctg caaactgacc acgctggaac14400gtggtcaatg tataattcat gcagaaaatg atgaaaaacc tgaaggtcta tctccaaatc14460taaacaggtt tttaggagat agagatttta accaattttc ttcaggggaa aaaaatatct14520tcttggcaag gtaacacact ctgtaaatgc atgttcatgc aagtaaaaat gattatgtgg14580ctgacagatt tgcgttgttg aaatggagag tgatgattat ggtttttgag ttcaatatgt14640gaggatattt ggctagaatg ttctgagcca aaatagattt cagtagataa ccagggaata14700agtaatggga tttggtgttt aacggtgaag cgttcaccac tgtgactcat taactgcttt14760gctatgaagc tgaattttat ttcacatcaa tttctctgga atcagaagca ttgtcatcct14820gtaaagatta ctcatatcaa ggccaccatt gaactctcaa ataggatatg gatatttttg14880taataagaag agttcatgat taagaatgaa ctcttgctac gcatgttaaa aaaaaaactt14940ttctccaaaa gataacacaa gagataatgc taggtagaag aacttttata ggaacagctt15000
attggctatg tattaaatac atgttttgta ttttttaaga aaatcaaaac atgtttagag15060acatttgcag tacagtagtt tgttttaata caactgatag gtcacgttct cactctattt15120gcctttaagg gaagaaagca atcaagttaa tacgttttcc ttcattgtat agtatgtaac15180tatggacact attagaggag ggatttgtgt agcacttagg acattatact tgataatttc15240caagggtctt tctagattta aaagtctgat tctaacgtag taataaaaat aaaggcccaa15300ttttctcttt aatattgcct gaagatatta ctctattatt gcattaaaat taaacattca15360cacattgttt gcactgctaa ataaaattat gtaagctaga ataaagttca gatttaggag15420acacatagtg acaactgatt ggtgacagaa ctaatcctat aatctgggaa tacggttagt15480aaagtcaaga attaccttta agtttacaca tccatgcaca tctaaatcta attgtttaat15540agaagcagtt cttcagttgc aaaggttctt tgcagtagaa ttttctcagc caggaatgat15600tttcccccag atatttgcat ggcttctttc acttagctga tctctgttct gatatcagct15660gcctagagag aattttcttg accacattca aagttagtgg cctctccacc ttgggtatca15720tccttttttc tctttttcat ctttatttat tttcattgat ttatcgctaa ctgaaatgag15780atggcctatt tcttgtttat ttgttctgcc tccctataat gtgtgctttt cagagggcag15840gtatttatct tagacatcat tgagtccgtt ctgcttaaag caatgctagc aaagagtgga15900cactggaaaa atatttgttg aataaatgaa tataaagtcc gtaattgaaa agtcaaattg15960agagatgcag gagaaaacaa aaagccattt tacaggacaa tttgaaggat cacagtctgt16020attaacagtt ttgccattca tataattcaa atcatatttg attttcaggt ttatttattt16080gaatttaact tccacatgcc atattatata ggaataactg gagaagtgat ggctcctttt16140gtctcttagt tccaataact tgaaatattt ttctccacat atttcagttt tgttcatgaa16200tattcaagaa gacatcctca gcttgctgtc tcagtaattc taagagttgc taaaggatac16260caggagttat tggagaagtg tttccagact gaaaaccctc ttgaatgcca agataaagga16320
gtaagttgct ctagaatttt aggggagtat gaaaaactgg attgatatca tctgttaaaa16380atgctgtttg tttgaaagcc tctagttttc aactagttgt tagccagtta tatctatttg16440tctagatatt aagctgttat taactagcag tcagcagcta gtggcttgct ttagaaacaa16500aaatgttaat tgcttctcag ccttttggct aagatcaagt gtagaaataa aaatgttaac16560caaaagtcct ttgatccaca aataaaggta gtattcatta ttcatttttg gataacttca16620gaaaggcaag aatttggtac agaaagaact gtaaccattt atccaaagat tgagttttgc16680cattaaatga ttttgtgatt tataaaatgt taaacttaat ctccccaaaa tccattttct16740gtaattatca aaatttacac tttaccatat ttaatattta aacatctctg attggtttta16800taatagtata taatattgat caattttata tacaaagtta tgcatccaag aaaagaaaaa16860tgtatatgta ataattcttc attttcagga agaagaatta cagaaataca tccaggagag16920ccaagcattg gcaaagcgaa gctgcggcct cttccagaaa ctaggagaat attacttaca16980aaatgcgtat gtttttgtaa acagtatttt tagtgaatta aaattattaa agagaatgta17040gccttcccca attctcctcc tttggaagca acaagaatga cctgtgaggt ctgatctgtg17100gtattgactt taagttcccc atactgtgca aatttttgca gtaaagatat ccattctgtc17160atagtctgtc cgagttaaag caccaaaaga tcacagttaa aatcaatgaa gctccgaggt17220tgagaataca agtcaggctt cctcctggag tttgcttttt cattgtgata tgcttctata17280ataggagtac agggagtggt tgttagagta aatgcatctc aaaagttggt tcaaatacca17340tgtagatgaa acaaacgagc tgacctcatg tcttctggca tgagagtaga gagtctgtga17400gaagaagcaa ggcggctaaa aactcatgaa tgactcagca ggacttagtt aaaaaatgct17460tctttcaggt ttctcgttgc ttacacaaag aaagcccccc agctgacctc gtcggagctg17520atggccatca ccagaaaaat ggcagccaca gcagccactt gttgccaact cagtgaggac17580aaactattgg cctgtggcga gggagcggtg agtgtctgct tggtttggtc ccatctcatt17640
tctgccctgt ttgacttgaa atagcctcat aattcccctc tagggaagac ggtaaaaaccl7700aatgtagaga tggccttagg aggcttgttt gattagtcac ggttggaggg gtgtgagaac17760ccagctctgg atggctggca tgtggccatg cttcctattc ctccagggtg gctggtggaa17820gttcagccag tttagtcaac aatatctgag ccaactttat atatcagaaa gacagaacga17880ccaacatgta actcataatt cataacaatt cataattcat aacttcaaat cataatttct17940gctttttgtt catatactta ctttgatgtt ttaaaaaagc tttatctttg attgattaaa18000attagtcatg ctattttagc catatttata ttttcacctt ttgtaacatg atattattat18O60tatgacatca ggaataattg gttccctttc gcagggtata gggtacagca caggataagt18120attatgttct gaatagtaaa atgactttcg agtcagtaat gccaatattc tttacttcct18180aatgtcacta gtatcataca taagattaca ggatgaatta aaaatatttt tcctataaag18240tcataattgc aaacaaaatt gtctatttta tcctttttcc tctttttcat aatggggagt18300tatttgctgt tagtcttcat gtcatacatt ttttccccaa aggttaagag taaaaggaga18360gttcttgtga ttaaatgtca cctcaattgt ttgttgaatt tcccatgctg ggaggctgca18420gggatgcagg atggtgtaat ggttcaggag tgtatgttcc ggaggccacc agccaacaac18480cgcattctac tttcactatt ctttagttgt atcacagtgg gaaagcaact tatgtcatta18540agcttgagtt ttttcatctg acatttgaga atacaaatta taccaccctc atacgacagc18600tgttttaaac aagataatct gcataactca cacagcacta gtctgacaga taaagtgcac18660acaaaacata ttatttctta ttacaagtta ttactaggtg attaagaaat atctcctaag18720taggcaaggt agcaagattc tacattagga aagtcttaaa aacccacaaa attgctctta18780cttcttttca attaggatga tatattagct gcaagtgtat acatgtgtat atgtatgtga18840ataaaagggg taagtttgtg ctattcttac cttcagatag tgattatcaa aagaaaaatg18900gaaagttcaa ctaaatacac atgggaaaca taaaggcaga gacatttttg tcctttagaa18960
gtgtgtatgt aactggaagc atgtttcaaa tagctgacac aaatagctaa atgactatcc19020tcaacatcac atatggacca tctgctacta cttgctaagg cttagcccaa acaaatgggt19080aaatcctgga atttacaata taatgtcaca tgatcctaca tagcaaattt tcctgtaata19140ttaattataa attgctgggc attagaaatt attgcagcag ttttctgaaa aactgaacca19200actttgtgac taatgcccaa tctccttact tttttttctc attctcctaa ccaggctgac19260attattatcg gacacttatg tatcagacat gaaatgactc cagtaaaccc tggtgttggc19320cagtgctgca cttcttcata tgccaacagg aggccatgct tcagcagctt ggtggtggat19380gaaacatatg tccctcctgc attctctgat gacaagttca ttttccataa ggatctgtgc19440caagctcagg gtgtagcgct gcaaacgatg aagcaagagt aagaaactgt tacttgctag19500catggaaaag aatgacaacc ccaaagagta actgagactt ctacctcgct cacctaacac19560tattgggctc actaacagag cgttactccc aaaacactta aaatgccttt gaaaatagtt19620ttgtctcagt gtcttcacag tctcattggg gaagcaggtc tagaaaaatc gacgagggtg19680gacaatttcc tgtttgtaaa aataatctct gttgtaactg ttattgtgat atgtatttgg19740gggttgagga aaagtgggca atctattctg aggaattaga gtgtatcttt gcagcaaattL9800tgggtacttc cattccaagc acaggaaaca catcattgaa tcttttttta cactatttac19860actttgaaga gaataaccat cttatttaat tcaaccatgc agtttgggtg ttaagaaatg19920acatgtacat ttcagttcat tgtgggagct cttttgtaat ggtgatggtc atgcaagtca19980atggagctta tgttcttcaa actcccatgc attttaatcc tcacttgttt tgtaaatagt20040cttccttcat tggaaaaccc attcttctct tttttcctct atcacagtct gaggtatgtt20100tcacagtatg ataagaatgt tgcctgttct ggcaagcttt ttctattgct ctggtctact20160ttctattgct ctggtctaag tccaacatga aaggcttgct aagtgagcag tgcaggcaat20220tagtgctgcc agtgcccaga taaggggtgt gataactgga tgggcaggat tcggagatct20280
gggtctttga gtgtagataa gacacagtta agaagagcgg acaggaaagg atattcctgg20340gggatgaggg gagattgcct tccactacac ataagtatgg tcaagtatga aatagtgttt20400tatccacaac ctgcacaact ccaggctggt ggaacacttg gcatgttttc agcctcaatc20460tttctactga aagtactaga caaggtgtgt gtggtcagtc tggtgatagg ttgatggagt20520aagggtttag gctctgaaaa ttctctacta ggaaggctgt agaaaaatag cattgcataa20580cagacttctc ttgtattttg ttttgtttta aatcacaggt ttctcattaa ccttgtgaag20640caaaagccac aaataacaga ggaacaactt gaggctgtca ttgcagattt ctcaggcctg20700ttggagaaat gctgccaagg ccaggaacag gaagtctgct ttgctgaaga ggtacatgca20760gctcatttca tactcaaaat acttgctatg gaattttctg tagtggataa tgaaaggaag20820accctacaaa tttataactt taaaatattt tcagagagat ttaaatttca ttgagaagca20880gattgaggga ttctataaga tttaaaaaat aatcacattt tcttgcttaa tattaggaaa20940atttataata ttaaaatata ttaatagaat tagtaatttt aatttatttc ctagtagaga21000aacccataaa gtgaatgtgt aaataattga tggtaattta gatagtttct ggcctaaaat21060tgatcaattc agctaaatgg attaaaggat ttaatagcaa attaattgtg caaacagagt21120attaggagtc tatttgtaga aaatgttttt gaactcattt agaagcttgc ttttgtacat21180caacagagta gtatttagga gttattttaa ttacatagta attttagctg gataattagc21240cagattttct ttaaccaggg gattctacct aacatttaaa aaaattacct tttttcagct21300ttattgaggc atgattgaca aatacaaatt atatatgttt agggtgaaca tgtgatgttt21360caatatattt atacattgtg aaatgattat cacaatcaag ataattggct aaattttaca21420aatctttagt ttgtattgct acatatattt gaatatagca acactatact ttaaaaagat21480attctataac ttagcgtttt tgtcaatttt acctttctca ccatgtaaaa tccaaagaca21540gatatattta gaaatgtaga gtttttctat aaataatata attagatgca tttgagtgtg21600
tgcacttacc agtatatgtg tgtgtttttg gtgggatcag gtagggtggg acatagataa21660ccaaattaga taaaactggt gaaacagatt tgatgtgaag catttctgaa aaacatgaca21720caagaagatt aatgttctct aatctgagaa gacatttatt tagatataga gaacatgaac21780aaatagtagc agtgctttat ctgcaaacct tttaatttct aataacttgt aatttgtaga21840ggaaggggaa agattgagaa tacgcattga tttggagatt gttatagaag aaaactgttg21900atgtgaaaga atattgtttt ctccctggct tttactatcc caggttgttg gcatcagaga21960tgtgtttctt catttttaac ttagttaatc tacaaaccta tgaattcacc ccggattgta22020gagtgttaac tgtatgattg gtataataat ccatttcttt atctgattat gtttattctt22080aattttcagg gacaaaaact gatttcaaaa actcgtgctg ctttgggagt ttaaattact22140tcaggtaaca aaacattcag acaagcctga atacaatgtt gtttctccag aaatatcaat22200ccataatgag atagatcatg aggagtgcca ttaattctct taaaaataca tggaattcaa22260aaaaaagttt attttaaaaa cacttgaaca aaattacgca cacaatgtta aattagtggc22320tcaactatgc aaaatccttt ttggttattt aaaagacttc aacaaatgct atcagaagac22380tttcctacgt atccaatatt tctctgatat aaaataatag aaccagttac ttactgcacc22440tattagttta attagtattt aatatatttt tgctcatatt gcaggggaag agaagacaaa22500acgagtcttt cattcggtgt gaacttttct ctttaatttt aactgattta acactttttg22560tgaattaatg aaatgataaa gacttttatg tgagatttcc ttatcacaga aataaaatat22620ctccaaatgt ttccttttcc aagtttgctt atttatgaaa agttatcgat aatttcttta22680gttttgtata ccattgtctg aagcagattc tgttaaaata gcattaagtg ttggttgtta22740taggagatta aagctatcca aggatggatt tacagcacta gatcacttgg tgaactgaaa22800aatgttccca agttaaacac tatttgatgc taccagggca ttttgtttat taaatgacca22860tcactgaagt attctaacag ataatctgga gatgagaaaa gaaattatta ttcttctatg22920
ggatctaaga aaatttaaca tctacttttt ttctcaatct tgttcagttc tctattcaca22980gacattttaa aacataagaa tattacagtt ttgattgaat ataattaatg ttttcatcaa23040ttaaattttt attccacaaa tgtttattaa gccttcactg agttccaggc cttgggctgg23100gtacagtcac tgttctccag tcgcttcagt agagaaggaa gcaacacaat aatgatgcct23160cagattatga ccacaaggag ttgacaacaa attgttgagg gaacgaaagg gtgggtgaca23220tcagttctga ctggaaaagg tgccataaat gtttaagaag agtcttagaa aatgaatgag23280cattcatcag ttcaagtaaa agagaaggcc attttatgaa agaggaaaca tggtcagagg23340tactgggtat gacaaagtat gatgaatagt tttagaggag tacagggtag gtaggaaggg23400tagagatgta gaatgttagg caggatgtgg aagctatgaa gggctaatcc agactctcag23460ggctctattc taaagaggtt ggacaatatc ttatgagtaa cagaggacca cagtgatagc23520taagcagagg tgtgctatta ataattagct ttgaggaaga taatctatga gatacggagc23580atgggcaatg gggcagggaa aagggtagag ggggcaaagt cagcaagagg tgacaaaaag23640accattcccc cagtagggaa gctgtttatc ttattagctt tgaatagaaa tctgaaaatt23700acatgcatac tttggcctgg gctctgggag aagacaatgg ctttagagca ataaaatgtg23760ctttcggttc ttcttctctt tttttttgaa ttggaatctg ctatgttgcc cagctggtct23820caaaatcctg ggctcaaaag atcctcctac cttggcctcc tgagtagctg ggactagagc23880catgaaccac tacacctagc ccttttagtt ctaactagat tgctttctac ttgacatttt23940tctttccatt gtactgcaac atctatgaac tttgtctgat tttggtgtaa ttctaaaagg24000tattaattta aagatcacaa taaaataaaa tcacgttcaa tataaaagca ttaagctgga24060aaatgcttta tttttttaag ggaaaagcac aatgaaggta aaactgttag ggaaatttgt24120gagtcaaata atattttgtt gaaatatata aagaaaaaat gattggaggc agaaggataa24180attgacgtaa gtacaattgt aaattgggga tttttaaaaa tttattttat ttatttattt24240
atttttttga gacagagtct cgctgtgtcg tcaggctgga gtgcagtggt acaatctcgg24300ctcactgcaa gctctgactc cctggttcaa gcgattctcc tacctcagcc tcctgagtag24360ctgggattac aggcacgcgc catgacaccc agctaatttt tgtattttta gtagagacgg24420ggtttcacca tgttggccag gctgacctcg aactcctggc ctcatgatct gcctgtctcg24480gcctcccaaa gtgttgggat tataggcatg agccactgca cccagccaaa ttggagattt24540taaaacatct ctacctcatt aacagaacaa gttaggcaaa taacaaataa agactcaggg24600tattaaactg ctgtagtcag gattaccaac aactttcaca ctgcaaaatc caatagtgga24660ttcttagtct ttagcttatc tgagttctct cagcagcatt tgacacaatt gatcactctc24720ttttccttga aacgttttcc tcacttggtg ttcggacttt cttccaacct cattggctgt24780ttcacctcaa tcttctttgc tgtgtcctcc taactctttg acctctaaat gttggagtgt24840cccagaacag ttcttccttg accgaaattc actcatccag actcagtgca ttaaatgcca24900tctagatgtt gacaacacat gtttatagct ccagcctgga tttcttcctt gacttacagg24960ctcttacgtc agcttcctcc ttaacatctc catgctgata atgtatagac aacacaaact25020tagcacatta caaattgaat gtgaatctac tccttgtccc aaatttgtac ctccatcttg25080tctatctgtc tgtttttatg agtcagacat tttggattta ttgatgaccc ctctcttgca25140tatcacccac acattcaatc tatgagcaaa gcttgtcggc tctaccttta aaaagtatcc25200agaatttgac tatttctcaa tactttggta ccagtcacaa tcatatgcct cactggggtt25260attgcaatag attcctaatt ggtcttttta caagtgacct tgctccaccc tcaaccctat25320tctcaaaagt gaacattatg tcacttttcc actcagaatc ctctagtggc ttcccacttc25380tctcagagta aaatgcaaag tctgtccaat gaccctacat gataatatct ttctgacctt25440ttttgttact cctctgatca ggtacagagg tctccctgct gctcttcaag ttaccaatca25500atgtcctgct cagggttttg ccctcatgac ccttctggct tagaagaccc tcagctatgt 25560
gtgaggctca cttcatcacc aacttcaagc ttctactcgt agttatctgc taaatgatga25620tgttttcctc aactacctta ttttaattca gaaatgccat tcccagtccc cacaacactt25680atcaccatct gacaaacact agattttact tgtttatttt ctgtctacct cactagagtg25740taagctccat gagaacagta acttttgtct cctttgttta cttcggctat cttcagcata25800tagaacagtg cctgaaacat aataggcatt ctagaaatat ttatttgagt atgtggagga25860atactacacg ccatgggcta tatatatttt cttataaggt ggtgaaacta gaggggttgt25920tagcttcctc taataaaatt tttttctaga gaaaaaaaaa aagcacaggc ctaagaaatt25980aacataaaaa ccataagata ccactgagga tgttaaagac gtgtgtgtgt gtgtgtgtgt26040gtgtgtgtgt atgcatgtgt gtgtgtgtgt gtatgcatgt gtatgtgtgt gtaggcatgt26100gtgtgtgtgt atcgtgtaga atgagaatta ggaagtggtg gcattctaga atagctggct26160tgaaagaggg tgggtaggtt tgggggatag atttttaact tgtgcttttg tctatacact26220aaattacaac gaagtctgcc acttgcttca ctgccactgt gaagcataaa tcagaaggag26280tagctcaaat tgcttggtga ccacaggata atattgggat aaggctaaac tccagctggg26340gcaaaagact ggtgaaaaca gctgggtgca gaacagctac tgttaaaaat taagtcttcc26400aatctcttta ttttatttta ttttatttat ttatttattt atttatttat ttttttgtat26460tatactttaa gttttagggt acctgtgccc agcaatccca ttactgggta tatacccaaa26520ggattataaa tcatgctgct ataaagacac atgcacatgt atgtttattg cggcactatt26580cacaatagca aagacttgga accaacccaa atgtccaaca atgatagact ggattaagaa26640aatgtggcac atatacacca tggaatacta ggcagccata aaaaaggatg agttcatgtc26700ctttgtaggt acatggatga agttggaaac catcattgca atctctttca tgcctacttt26760cccaggactt gtggattacc gtataaggaa tttgtctcct ccaatgatgc tgctttcaaa26820gagttaagga agggtccaga gaattgctcc atagcatgga attaaattaa taatcaataa26880
cagtaagatc tctagaaagt ccccaaacat ccattaacta agtaacatgc ttgtaaacat26940tcatgaatca aaaaagaaat cagaagcata tttaaaaaat atttttgcct gaatgaaaat27000gaaaaatgtg tcagaattta tagaatgtca ctaaaacagt gacatttaaa ttaaaggaaa27060tttataacgc taaaggccta tgtgttatag aaaagaagga agatctcaaa tcaatgacat27120cagcttcttc cttaataatc tagagatgaa agagcaaatt aaaaaactag tcatgagaaa27180gaagataata aagatcaaag gagaatcaat aaaatagaaa acagaagaaa tcaatagata27240taatcactgc aaccaaatgc ggttctttaa gatcaatact attaataaac ctctaaccag27300atttctcact accaatgttt ggaatgagag aggtgatagt attacaagta ttaaaataat27360gagaagaaaa tgttgtgaaa aaaatatgtc agtaaattca atgacatatg aaaaggacag27420attccttgaa agacacactt acaaaagctc atgcaagaac aagtagttaa cgtggttatt27480tatgtattaa ggaaattgaa gttgtaatta agatcattcc cacaaagaaa actccaggct27540tcacgatgaa ttc 27553<210>10<211>187<212>PRT<213>智人<220>
<221>misc_特征<223>人β-干扰素<300>
<308>基因库/EMBL/DDBJ登记号No.AAC41702<309>1995-01-01<313>(1)..(187)<400>10Met Thr Asn Lys Cys Leu Leu Gln Ile Ala Leu Leu Leu Cys Phe Ser1 5 10 15
Thr Thr Ala Leu Ser Met Ser Tyr Asn Leu Leu Gly Phe Leu Gln Arg20 25 30Ser Ser Asn Cys Gln Cys Gln Lys Leu Leu Trp Gln Leu Asn Gly Arg35 40 45Leu Glu Tyr Cys Leu Lys Asp Arg Arg Asn Phe Asp Ile Pro Glu Glu50 55 60Ile Lys Gln Leu Gln Gln Phe Gln Lys Glu Asp Ala Ala Val Thr Ile65 70 75 80Tyr Glu Met Leu Gln Asn Ile Phe Ala Ile Phe Arg Gln Asp Ser Ser85 90 95Ser Thr Gly Trp Asn Glu Thr Ile Val Glu Asn Leu Leu Ala Asn Val100 105 110Tyr His Gln Arg Asn His Leu Lys Thr Val Leu Glu Glu Lys Leu Glu115 120 125Lys Glu Asp Phe Thr Arg Gly Lys Arg Met Ser Ser Leu His Leu Lys130 135 140Arg Tyr Tyr Gly Arg Ile Leu His Tyr Leu Lys Ala Lys Glu Asp Ser145 150 155 160His Cys Ala Trp Thr Ile Val Arg Val Glu Ile Leu Arg Asn Phe Tyr165 170 175Val Ile Asn Arg Leu Thr Gly Tyr Leu Arg Asn180 185
<210>11<211>212<212>PRT<213>智人<220>
<221>misc_特征<223>人干扰素变体2A<300>
<308>基因库/EMBL/DDBJ登录号No.CAA00839<309>1993-12-03<313>(1)..(212)<400>11Met Asn Ser Phe Ser Thr Ser Ala Phe Gly Pro Val Ala Phe Ser Leu1 5 10 15Gly Leu Leu Leu Val Leu Pro Ala Ala Phe Pro Ala Pro Val Pro Pro20 25 30Gly Glu Asp Ser Lys Asp Val Ala Ala Pro His Arg Gln Pro Leu Thr35 40 45Ser Ser Glu Arg Ile Asp Lys Gln Ile Arg Tyr Ile Leu Asp Gly Ile50 55 60Ser Ala Leu Arg Lys Glu Thr Cys Asn Lys Ser Asn Met Cys Glu Ser65 70 75 80Ser Lys Glu Ala Leu Ala Glu Asn Asn Leu Asn Leu Pro Lys Met Ala85 90 95Glu Lys Asp Gly Cys Phe Gln Ser Gly Phe Asn Glu Glu Thr Cys Leu
100 105 110Val Lys Ile Ile Thr Gly Leu Leu Glu Phe Glu Val Tyr Leu Glu Tyr115 120 125Leu Gln Asn Arg Phe Glu Ser Ser Glu Glu Gln Ala Arg Ala Val Gln130 135 140Met Ser Thr Lys Val Leu Ile Gln Phe Leu Gln Lys Lys Ala Lys Asn145 150 155 160Leu Asp Ala Ile Thr Thr Pro Asp Pro Thr Thr Asn Ala Ser Leu Leu165 170 175Thr Lys Leu Gln Ala Gln Asn Gln Trp Leu Gln Asp Met Thr Thr His180 185 190Leu Ile Leu Arg Ser Phe Lys Glu Phe Leu Gln Ser Ser Leu Arg Ala195 200 205Leu Arg Gln Met210<210>12<211>166<212>PRT<213>智人<220>
<221>misc_特征<223>人干扰素变体2b<300>
<308>基因库/EMBL/DDBJ登记号No.AAP20099<309>2003-04-30
<313>(1)..(166)<400>12Met Cys Asp Leu Pro Gln Thr His Ser Leu Gly Ser Arg Arg Thr Leu1 5 10 15Met Leu Leu Ala Gln Met Arg Arg Ile Ser Leu Phe Ser Cys Leu Lys20 25 30Asp Arg His Asp Phe Gly Phe Pro Gln Glu Glu Phe Gly Asn Gln Phe35 40 45Gln Lys Ala Glu Thr Ile Pro Val Leu His Glu Met Ile Gln Gln Ile50 55 60Phe Asn Leu Phe Ser Thr Lys Asp Ser Ser Ala Ala Trp Asp Glu Thr65 70 75 80Leu Leu Asp Lys Phe Tyr Thr Glu Leu Tyr Gln Gln Leu Asn Asp Leu85 90 95Glu Ala Cys Val Ile Gln Gly Val Gly Val Thr Glu Thr Pro Leu Met100 105 110Lys Glu Asp Ser Ile Leu Ala Val Arg Lys Tyr Phe Gln Arg Ile Thr115 120 125Leu Tyr Leu Lys Glu Lys Lys Tyr Ser Pro Cys Ala Trp Glu Val Val130 135 140Arg Ala Glu Ile Met Arg Ser Phe Ser Leu Ser Thr Asn Leu Gln Glu145 150 155 160
Ser Leu Arg Ser Lys Glu165<210>13<211>208<212>PRT<213>智人<220>
<221>misc_特征<223>人τ干扰素<300>
<308>蛋白质序列记录基因库登记号No.NP-795372<309>2004-07-02<313>(1)..(208)<400>13Met Ile Ile Lys His Phe Phe Gly Thr Val Leu Val Leu Leu Ala Ser1 5 10 15Thr Thr Ile Phe Ser Leu Asp Leu Lys Leu Ile Ile Phe Gln Gln Arg20 25 30Gln Val Asn Gln Glu Ser Leu Lys Leu Leu Asn Lys Leu Gln Thr Leu35 40 45Ser Ile Gln Gln Cys Leu Pro His Arg Lys Asn Phe Leu Leu Pro Gln50 55 60Lys Ser Leu Ser Pro Gln Gln Tyr Gln Lys Gly His Thr Leu Ala Ile65 70 75 80Leu His Glu Met Leu Gln Gln Ile Phe Ser Leu Phe Arg Ala Asn Ile85 90 95
Ser Leu Asp Gly Trp Glu Glu Asn His Thr Glu Lys Phe Leu Ile Gln100 105 110Leu His Gln Gln Leu Glu Tyr Leu Glu Ala Leu Met Gly Leu Glu Ala115 120 125Glu Lys Leu Ser Gly Thr Leu Gly Ser Asp Asn Leu Arg Leu Gln Val130 135 140Lys Met Tyr Phe Arg Arg Ile His Asp Tyr Leu Glu Asn Gln Asp Tyr145 150 155 160Ser Thr Cys Ala Trp Ala Ile Val Gln Val Glu Ile Ser Arg Cys Leu165 170 175Phe Phe Val Phe Ser Leu Thr Glu Lys Leu Ser Lys Gln Gly Arg Pro180 185 190Leu Asn Asp Met Lys Gln Glu Leu Thr Thr Glu Phe Arg Ser Pro Arg195 200 205<210>14<211>189<212>PRT<213>智人<220>
<221>misc_特征<223>人α-干扰素变体16<300>
<308>蛋白质序列记录基因库登记号No.NP_002164<309>1993-06-11<313>(1)..(189)
<400>14Met Ala Leu Ser Phe Ser Leu Leu Met Ala Val Leu Val Leu Ser Tyr1 5 10 15Lys Ser Ile Cys Ser Leu Gly Cys Asp Leu Pro Gln Thr His Ser Leu20 25 30Gly Asn Arg Arg Ala Leu Ile Leu Leu Ala Gln Met Gly Arg Ile Ser35 40 45His Phe Ser Cys Leu Lys Asp Arg Tyr Asp Phe Gly Phe Pro Gln Glu50 55 60Val Phe Asp Gly Asn Gln Phe Gln Lys Ala Gln Ala Ile Ser Ala Phe65 70 75 80His Glu Met Ile Gln Gln Thr Phe Asn Leu Phe Ser Thr Lys Asp Ser85 90 95Ser Ala Ala Trp Asp Glu Thr Leu Leu Asp Lys Phe Tyr Ile Glu Leu100 105 110Phe Gln Gln Leu Asn Asp Leu Glu Ala Cys Val Thr Gln Glu Val Gly115 l20 125Val G1u Glu Ile Ala Leu Met Asn Glu Asp Ser Ile Leu Ala Val Arg130 135 140Lys Tyr Phe Gln Arg Ile Thr Leu Tyr Leu Met Gly Lys Lys Tyr Ser145 150 155 160Pro Cys Ala Trp Glu Val Val Arg Ala Glu Ile Met Arg Ser Phe Ser165 170 175
Phe Ser Thr Asn Leu Gln Lys Gly Leu Arg Arg Lys Asp180 185<210>15<211>166<212>PRT<213>智人<220>
<221>misc_特征<223>人y-干扰素<300>
<308>蛋白质序列记录基因库登记号No.NP_000610<309>1994-11-15<313>(1)..(166)<400>15Met Lys Tyr Thr Ser Tyr Ile Leu Ala Phe Gln Leu Cys Ile Val Leu1 5 10 15Gly Ser Leu Gly Cys Tyr Cys Gln Asp Pro Tyr Val Lys Glu Ala Glu20 25 30Asn Leu Lys Lys Tyr Phe Asn Ala Gly His Ser Asp Val Ala Asp Asn35 40 45Gly Thr Leu Phe Leu Gly Ile Leu Lys Asn Trp Lys Glu Glu Ser Asp50 55 60Arg Lys Ile Met Gln Ser Gln Ile Val Ser Phe Tyr Phe Lys Leu Phe65 70 75 80Lys Asn Phe Lys Asp Asp Gln Ser Ile Gln Lys Ser Val Glu Thr Ile
85 90 95Lys Glu Asp Met Asn Val Lys Phe Phe Asn Ser Asn Lys Lys Lys Arg100 105 110Asp Asp Phe Glu Lys Leu Thr Asn Tyr Ser Val Thr Asp LeuAsn Val115 120 125Gln Arg Lys Ala Ile His Glu Leu Ile Gln Val Met Ala Glu Leu Ser130 135 140Pro Ala Ala Lys Thr Gly Lys Arg Lys Arg Ser Gln Met Leu Phe Gln145 150 155 160Gly Arg Arg Ala Ser Gln165<210>16<211>175<212>PRT<213>智人<220>
<221>misc_特征<223>轻链人铁蛋白<300>
<308>基因库/EMBL/DDBJ登记号No.AAH18990<309>2001-12-07<313>(1)..(175)<400>16Met Ser Ser Gln Ile Arg Gln Asn Tyr Ser Thr Asp Val Glu Ala Ala1 5 10 15
Val Asn Ser Leu Val Asn Leu Tyr Leu Gln Ala Ser Tyr Thr Tyr Leu20 25 30Ser Leu Gly Phe Tyr Phe Asp Arg Asp Asp Val Ala Leu Glu Gly Val35 40 45Ser His Phe Phe Arg Glu Leu Ala Glu Glu Lys Arg Glu Gly Tyr Glu50 55 60Arg Leu Leu Lys Met Gln Asn Gln Arg Gly Gly Arg Ala Leu Phe Gln65 70 75 80Asp Ile Lys Lys Pro Ala Glu Asp Glu Trp Gly Lys Thr Pro Asp Ala85 90 95Met Lys Ala Ala Met Ala Leu Glu Lys Lys Leu Asn Gln Ala Leu Leu100 105 110Asp Leu His Ala Leu Gly Ser Ala Arg Thr Asp Pro His Leu Cys Asp115 120 125Phe Leu Glu Thr His Phe Leu Asp Glu Glu Val Lys Leu Ile Lys Lys130 135 140Met Gly Asp His Leu Thr Asn Leu His Arg Leu Gly Gly Pro Glu Ala145 150 155 160Gly Leu Gly Glu Tyr Leu Phe Glu Arg Leu Thr Leu Lys His Asp165 170 175<210>17<211>183<212>PRT<213>智人
<220>
<221>misc_特征<223>重链人铁蛋白<300>
<308>基因库/EMBL/DDBJ登记号No.AAH16857<309>2001-11-05<313>(1)..(183)<400>17Met Thr Thr Ala Ser Thr Ser Gln Val Arg Gln Asn Tyr His Gln Asp1 5 10 15Ser Glu Ala Ala Ile Asn Arg Gln Ile Asn Leu Glu Leu Tyr Ala Ser20 25 30Tyr Val Tyr Leu Ser Met Ser Tyr Tyr Phe Asp Arg Asp Asp Val Ala35 40 45Leu Lys Asn Phe Ala Lys Tyr Phe Leu His Gln Ser His Glu Glu Arg50 55 60Glu His Ala Glu Lys Leu Met Lys Leu Gln Asn Gln Arg Gly Gly Arg65 70 75 80Ile Phe Leu Gln Asp Ile Lys Lys Pro Asp Cys Asp Asp Trp Glu Ser85 90 95Gly Leu Asn Ala Met Glu Cys Ala Leu His Leu Glu Lys Asn Val Asn100 105 110Gln Ser Leu Leu Glu Leu His Lys Leu Ala Thr Asp Lys Asn Asp Pro115 120 125
His Leu Cys Asp Phe Ile Glu Thr His Tyr Leu Asn Glu Gln Val Lys130 135 140Ala Ile Lys Glu Leu Gly Asp His Val Thr Asn Leu Arg Lys Met Gly145 150 155 160Ala Pro Glu Ser Gly Leu Ala Glu Tyr Leu Phe Asp Lys His Thr Leu165 170 175Gly Asp Ser Asp Asn Glu Ser180<210>18<211>359<212>PRT<213>智人<220>
<221>misc_特征<223>人核心蛋白聚糖<300>
<308>基因库/EMBL DDBJ登记号No.AAH05322<309>2001-03-27<313>(1)..(359)<400>18Met Lys Ala Thr Ile Ile Leu Leu Leu Leu Ala Gln Val Ser Trp Ala1 5 10 15Gly Pro Phe Gln Gln Arg Gly Leu Phe Asp Phe Met Leu Glu Asp Glu20 25 30Ala Ser Gly Ile Gly Pro Glu Val Pro Asp Asp Arg Asp Phe Glu Pro35 40 45
Ser Leu Gly Pro Val Cys Pro Phe Arg Cys Gln Cys His Leu Arg Val50 55 60Val Gln Cys Ser Asp Leu Gly Leu Asp Lys Val Pro Lys Asp Leu Pro65 70 75 80Pro Asp Thr Thr Leu Leu Asp Leu Gln Asn Asn Lys Ile Thr Glu Ile85 90 95Lys Asp Gly Asp Phe Lys Asn Leu Lys Asn Leu His Ala Leu Ile Leu100 105 110Val Asn Asn Lys Ile Ser Lys Val Ser Pro Gly Ala Phe Thr Pro Leu115 120 125Val Lys Leu Glu Arg Leu Tyr Leu Ser Lys Asn Gln Leu Lys Glu Leu130 135 140Pro Glu Lys Met Pro Lys Thr Leu Gln Glu Leu Arg Ala His Glu Asn145 150 155 160Glu Ile Thr Lys Val Arg Lys Val Thr Phe Asn Gly Leu Asn Gln Met165 170 175Ile Val Ile Glu Leu Gly Thr Asn Pro Leu Lys Ser Ser Gly Ile Glu180 185 190Asn Gly Ala Phe Gln Gly Met Lys Lys Leu Ser Tyr Ile Arg Ile Ala195 200 205Asp Thr Asn Ile Thr Ser Ile Pro Gln Gly Leu Pro Pro Ser Leu Thr210 215 220
Glu Leu His Leu Asp Gly Asn Lys Ile Ser Arg Val Asp Ala Ala Ser225 230 235 240Leu Lys Gly Leu Asn Asn Leu Ala Lys Leu Gly Leu Ser Phe Asn Ser245 250 255Ile Ser Ala Val Asp Asn Gly Ser Leu Ala Asn Thr Pro His Leu Arg260 265 270Glu Leu His Leu Asp Asn Asn Lys Leu Thr Arg Val Pro Gly Gly Leu275 280 285Ala Glu His Lys Tyr Ile Gln Val Val Tyr Leu His Asn Asn Asn Ile290 295 300Ser Val Val Gly Ser Ser Asp Phe Cys Pro Pro Gly His Asn Thr Lys305 310 315 320Lys Ala Ser Tyr Ser Gly Val Ser Leu Phe Ser Asn Pro Val Gln Tyr325 330 335Trp Glu Ile Gln Pro Ser Thr Phe Arg Cys Val Tyr Val Arg Ser Ala340 345 350Ile Gln Leu Gly Asn Tyr Lys355<210>19<211>464<212>PRT<213>智人
<220>
<221>misc_特征<223>人抗凝血酶<300>
<308>基因库登录号No.113936<309>1986-07-21<313>(1)..(464)<400>19Met Tyr Ser Asn Val Ile Gly Thr Val Thr Ser Gly Lys Arg Lys Val1 5 10 15Tyr Leu Leu Ser Leu Leu Leu Ile Gly Phe Trp Asp Cys Val Thr Cys20 25 30His Gly Ser Pro Val Asp Ile Cys Thr Ala Lys Pro Arg Asp Ile Pro35 40 45Met Asn Pro Met Cys Ile Tyr Arg Ser Pro Glu Lys Lys Ala Thr Glu50 55 60Asp Glu Gly Ser Glu Gln Lys Ile Pro Glu Ala Thr Asn Arg Arg Val65 70 75 80Trp Glu Leu Ser Lys Ala Asn Ser Arg Phe Ala Thr Thr Phe Tyr Gln85 90 95His Leu Ala Asp Ser Lys Asn Asp Asn Asp Asn Ile Phe Leu Ser Pro100 105 110Leu Ser Ile Ser Thr Ala Phe Ala Met Thr Lys Leu Gly Ala Cys Asn115 120 125Asp Thr Leu Gln Gln Leu Met Glu Val Phe Lys Phe Asp Thr Ile Ser
130 135 140Glu Lys Thr Ser Asp Gln Ile His Phe Phe Phe Ala Lys Leu Asn Cys145 150 155 160Arg Leu Tyr Arg Lys Ala Asn Lys Ser Ser Lys Leu Val Ser Ala Asn165 170 175Arg Leu Phe Gly Asp Lys Ser Leu Thr Phe Asn Glu Thr Tyr Gln Asp180 185 190Ile Ser Glu Leu Val Tyr Gly Ala Lys Leu Gln Pro Leu Asp Phe Lys195 200 205Glu Asn Ala Glu Gln Ser Arg Ala Ala Ile Asn Lys Trp Val Ser Asn210 215 220Lys Thr Glu Gly Arg Ile Thr Asp Val Ile Pro Ser Glu Ala Ile Asn225 230 235 240Glu Leu Thr Val Leu Val Leu Val Asn Thr Ile Tyr Phe Lys Gly Leu245 250 255Trp Lys Ser Lys Phe Ser Pro Glu Asn Thr Arg Lys Glu Leu Phe Tyr260 265 270Lys Ala Asp Gly Glu Ser Cys Ser Ala Ser Met Met Tyr Gln Glu Gly275 280 285Lys Phe Arg Tyr Arg Arg Val Ala Glu Gly Thr Gln Val Leu Glu Leu290 295 300Pro Phe Lys Gly Asp Asp Ile Thr Met Val Leu Ile Leu Pro Lys Pro
305 310 315 320Glu Lys Ser Leu Ala Lys Val Glu Lys Glu Leu Thr Pro Glu Val Leu325 330 335Gln Glu Trp Leu Asp Glu Leu Glu Glu Met Met Leu Val Val His Met340 345 350Pro Arg Phe Arg Ile Glu Asp Gly Phe Ser Leu Lys Glu Gln Leu Gln355 360 365Asp Met Gly Leu Val Asp Leu Phe Ser Pro Glu Lys Ser Lys Leu Pro370 375 380Gly Ile Val Ala Glu Gly Arg Asp Asp Leu Tyr Val Ser Asp Ala Phe385 390 395 400His Lys Ala Phe Leu Glu Val Asn Glu Glu Gly Ser Glu Ala Ala Ala405 410 415Ser Thr Ala Val Val Ile Ala Gly Arg Ser Leu Asn Pro Asn Arg Val420 425 430Thr Phe Lys Ala Asn Arg Pro Phe Leu Val Phe Ile Arg Glu Val Pro435 440 445Leu Asn Thr Ile Ile Phe Met Gly Arg Val Ala Asn Pro Cys Val Lys450 455 460<210>20<211>393<212>PRT<213>智人
<220>
<221>misc_特征<223>人抗凝血酶片段<300>
<308>基因库登录号No.113935<309>1986-07-21<313>(1)..(393)<400>20Met Tyr Ser Asn Val Ile Gly Thr Val Thr Ser Gly Lys Arg Lys Val1 5 10 15Tyr Leu Leu Ser Leu Leu Leu Ile Gly Phe Trp Asp Cys Val Thr Cys20 25 30His Gly Ser Pro Val Asp Ile Cys Thr Ala Lys Pro Arg Asp Ile Pro35 40 45Met Asn Pro Met Cys Ile Tyr Arg Ser Pro Glu Lys Lys Ala Thr Glu50 55 60Asp Glu Gly Ser Glu Gln Lys Ile Pro Glu Ala Thr Asn Arg Arg Val65 70 75 80Trp Glu Leu Ser Lys Ala Asn Ser Arg Phe Ala Thr Thr Phe Tyr Gln85 90 95His Leu Ala Asp Ser Lys Asn Asp Asn Asp Asn Ile Phe Leu Ser Pro100 105 110Leu Ser Ile Ser Thr Ala Phe Ala Met Thr Lys Leu Gly Ala Cys Asn115 120 125
Asp Thr Leu Gln Gln Leu Met Glu Val Phe Lys Phe Asp Thr Ile Ser130 135 140Glu Lys Thr Ser Asp Gln Ile His Phe Phe Phe Ala Lys Leu Asn Cys145 150 155 160Arg Leu Tyr Arg Lys Ala Asn Lys Ser Ser Lys Leu Val Ser Ala Asn165 170 175Arg Leu Phe Gly Asp Lys Ser Leu Thr Phe Asn Glu Thr Tyr Gln Asp180 185 190Ile Ser Glu Leu Val Tyr Gly Ala Lys Leu Gln Pro Leu Asp Phe Lys195 200 205Glu Asn Ala Glu Gln Ser Arg Ala Ala Ile Asn Lys Trp Val Ser Asn210 215 220Lys Thr Glu Gly Arg Ile Thr Asp Val Ile Pro Ser Glu Ala Ile Asn225 230 235 240Glu Leu Thr Val Leu Val Leu Val Asn Thr Ile Tyr Phe Lys Gly Leu245 250 255Trp Lys Ser Lys Phe Ser Pro Glu Asn Thr Arg Lys Glu Leu Phe Tyr260 265 270Lys Ala Asp Gly Glu Ser Cys Ser Ala Ser Met Met Tyr Gln Glu Gly275 280 285Lys Phe Arg Tyr Arg Arg Val Ala Glu Gly Thr Gln Val Leu Glu Leu290 295 300
Pro Phe Lys Gly Asp Asp Ile Thr Met Val Leu Ile Leu Pro Lys Pro305 310 315 320Glu Lys Ser Leu Ala Lys Val Glu Lys Glu Leu Thr Pro Glu Val Leu325 330 335Gln Glu Trp Leu Asp Glu Leu Glu Glu Met Met Leu Val Val His Met340 345 350Pro Arg Phe Arg Ile Glu Asp Gly Phe Ser Leu Lys Glu Gln Leu Gln355 360 365Asp Met Gly Leu Val Asp Leu Phe Ser Pro Glu Lys Ser Lys Leu Pro370 375 380Gly Ile Val Ala Glu Gly Arg Asp Asp385 390<210>21<211>104<212>PRT<213>智人<220>
<221>misc_特征<223>人血小板因子<300>
<308>蛋白质序列记录基因库登记号No.NP_002611<309>1995-01-07<313>(1)..(104)<400>21Met Ser Ser Ala Ala Arg Ser Arg Leu Thr Arg Ala Thr Arg Gln Glu1 5 10 15
Met Leu Phe Leu Ala Leu Leu Leu Leu Pro Val Val Val Ala Phe Ala20 25 30Arg Ala Glu Ala Glu Glu Asp Gly Asp Leu Gln Cys Leu Cys Val Lys35 40 45Thr Thr Ser Gln Val Arg Pro Arg His Ile Thr Ser Leu Glu Val Ile50 55 60Lys Ala Gly Pro His Cys Pro Thr Ala Gln Leu Ile Ala Thr Leu Lys65 70 75 80Asn Gly Arg Lys Ile Cys Leu Asp Leu Gln Ala Leu Leu Tyr Lys Lys85 90 95Ile Ile Lys Glu His Leu Glu Ser100<210>22<211>227<212>PRT<213>智人<220>
<221>misc_特征<223>人促乳素<300>
<308>蛋白质序列记录基因库登记号No.NP_000939<309>2001-10-15<313>(1)..(227)<400>22Met Asn Ile Lys Gly Ser Pro Trp Lys Gly Ser Leu Leu Leu Leu Leu1 5 l0 15
Val Ser Asn Leu Leu Leu Cys Gln Ser Val Ala Pro Leu Pro Ile Cys20 25 30Pro Gly Gly Ala Ala Arg Cys Gln Val Thr Leu Arg Asp Leu Phe Asp35 40 45Arg Ala Val Val Leu Ser His Tyr Ile His Asn Leu Ser Ser Glu Met50 55 60Phe Ser Glu Phe Asp Lys Arg Tyr Thr His Gly Arg Gly Phe Ile Thr65 70 75 80Lys Ala Ile Asn Ser Cys His Thr Ser Ser Leu Ala Thr Pro Glu Asp85 90 95Lys Glu Gln Ala Gln Gln Met Asn Gln Lys Asp Phe Leu Ser Leu Ile100 105 110Val Ser Ile Leu Arg Ser Trp Asn Glu Pro Leu Tyr His Leu Val Thr115 120 125Glu Val Arg Gly Met Gln Glu Ala Pro Glu Ala Ile Leu Ser Lys Ala130 135 140Val Glu Ile Glu Glu Gln Thr Lys Arg Leu Leu Glu Gly Met Glu Leu145 150 155 160Ile Val Ser Gln Val His Pro Glu Thr Lys Glu Asn Glu Ile Tyr Pro165 170 175Val Trp Ser Gly Leu Pro Ser Leu Gln Met Ala Asp Glu Glu Ser Arg180 185 190
Leu Ser Ala Tyr Tyr Asn Leu Leu His Cys Leu Arg Arg Asp Ser His195 200 205Lys Ile Asp Asn Tyr Leu Lys Leu Leu Lys Cys Arg Ile Ile His Asn210 215 220Asn Asn Cys225<210>23<211>93<212>PRT<213>智人<220>
<221>misc_特征<223>人降钙素<300>
<308>基因库/EMBL DDBJ登记号No.CAA26189<309>1989-03-15<313>(1)..(93)<400>23Val Leu Leu Ala Ala Leu Val Gln Asp Tyr Val Gln Met Lys Ala Ser1 5 10 15Glu Leu Glu Gln Glu Gln Glu Arg Glu Gly Ser Ser Leu Asp Ser Pro20 25 30Arg Ser Lys Arg Cys Gly Asn Leu Ser Thr Cys Met Leu Gly Thr Tyr35 40 45Thr Gln Asp Phe Asn Lys Phe His Thr Phe Pro Gln Thr Ala Ile Gly
50 55 60Val Gly Ala Pro Gly Lys Lys Arg Asp Met Ser Ser Asp Leu Glu Arg65 70 75 80Asp His Arg Pro His Val Ser Met Pro Gln Asn Ala Asn85 90<210>24<211>236<212>PRT<213>智人<300>
<308>基因库/EMBL DDBJ登记号No.AAE57231<309>2001-05-16<313>(1)..(236)<400>24Met Thr Gly Tyr Glu Ala Arg Leu Ile Thr Phe Gly Thr Trp Met Tyr1 5 10 15Ser Val Asn Lys Glu Gln Leu Ala Arg Ala Gly Phe Tyr Ala Ile Gly20 25 30Gln Glu Asp Lys Val Gln Cys Phe His Cys Gly Gly Gly Leu Ala Asn35 40 45Trp Lys Pro Lys Glu Asp Pro Trp Glu Gln His Ala Lys Trp Tyr Pro50 55 60Gly Cys Lys Tyr Leu Leu Glu Glu Lys Gly His Glu Tyr Ile Asn Asn65 70 75 80Ile His Leu Thr Arg Ser Leu Glu Gly Ala Leu Val Gln Thr Thr Lys
85 90 95Lys Thr Pro Ser Leu Thr Lys Arg Ile Ser Asp Thr Ile Phe Pro Asn100 105 110Pro Met Leu Gln Glu Ala IIe Arg Met Gly Phe Asp Phe Lys Asp Val115 120 125Lys Lys Ile Met Glu Glu Arg Ile Gln Thr Ser Gly Ser Asn Tyr Lys130 135 140Thr Leu Glu Val Leu Val Ala Asp Leu Val Ser Ala Gln Lys Asp Thr145 150 155 160Thr Glu Asn Glu Leu Asn Gln Thr Ser Leu Gln Arg Glu Ile Ser Pro165 170 175Glu Glu Pro Leu Arg Arg Leu Gln Glu Glu Lys Leu Cys Lys Ile Cys180 185 190Met Asp Arg Tyr Ile Ala Val Val Phe Ile Pro Cys Gly His Leu Val195 200 205Thr Cys Lys Gln Cys Ala Glu Ala Val Asp Arg Cys Pro Met Cys Ser210 215 220Ala Val Ile Asp Phe Lys Gln Arg Val Phe Met Ser225 230 235<210>25<211>406<212>PRT<213>智人
<220>
<221>misc_特征<223>人α-1-抗胰蛋白酶<300>
<308>基因库/EMBL DDBJ登记号No.AAH08915<309>2001-05-29<313>(1)..(406)<400>25Met Gln Leu Phe Leu Leu Leu Cys Leu Val Leu Leu Ser Pro Gln Gly1 5 10 15Ala Ser Leu His Arg His His Pro Arg Glu Met Lys Lys Arg Val Glu20 25 30Asp Leu His Val Gly Ala Thr Val Ala Pro Ser Ser Arg Arg Asp Phe35 40 45Thr Phe Asp Leu Tyr Arg Ala Leu Ala Ser Ala Ala Pro Ser Gln Asn50 55 60Ile Phe Phe Ser Pro Val Ser Ile Ser Met Ser Leu Ala Met Leu Ser65 70 75 80Leu Gly Ala Gly Ser Ser Thr Lys Met Gln Ile Leu Glu Gly Leu Gly85 90 95Leu Asn Leu Gln Lys Ser Ser Glu Lys Glu Leu His Arg Gly Phe Gln100 105 110Gln Leu Leu Gln Glu Leu Asn Gln Pro Arg Asp Gly Phe Gln Leu Ser115 120 125
Leu Gly Asn Ala Leu Phe Thr Asp Leu Val Val Asp Leu Gln Asp Thr130 l35 140Phe Val Ser Ala Met Lys Thr Leu Tyr Leu Ala Asp Thr Phe Pro Thr145 150 155 160Asn Phe Arg Asp Ser Ala Gly Ala Met Lys Gln Ile Asn Asp Tyr Val165 170 175Ala Lys Gln Thr Lys Gly Lys Ile Val Asp Leu Leu Lys Asn Leu Asp180 185 190Ser Asn Ala Val Val Ile Met Val Asn Tyr Ile Phe Phe Lys Ala Lys195 200 205Trp Glu Thr Ser Phe Asn His Lys Gly Thr Gln Glu Gln Asp Phe Tyr210 215 220Val Thr Ser Glu Thr Val Val Arg Val Pro Met Met Ser Arg Glu Asp225 230 235 240Gln Tyr His Tyr Leu Leu Asp Arg Asn Leu Ser Cys Arg Val Val Gly245 250 255Val Pro Tyr Gln Gly Asn Ala Thr Ala Leu Phe Ile Leu Pro Ser Glu260 265 270Gly Lys Met Gln Gln Val Glu Asn Gly Leu Ser Glu Lys Thr Leu Arg275 280 285Lys Trp Leu Lys Met Phe Lys Lys Arg Gln Leu Glu Leu Tyr Leu Pro290 295 300
Lys Phe Ser Ile Glu Gly Ser Tyr Gln Leu Glu Lys Val Leu Pro Ser305 310 315 320Leu Gly Ile Ser Asn Val Phe Thr Ser His Ala Asp Leu Ser Gly Ile325 330 335Ser Asn His Ser Asn Ile Gln Val Ser Glu Met Val His Lys Ala Val340 345 350Val Glu Val Asp Glu Ser Gly Thr Arg Ala Ala Ala Ala Thr Gly Thr355 360 365Ile Phe Thr Phe Arg Ser Ala Arg Leu Asn Ser Gln Arg Leu Val Phe370 375 380Asn Arg Pro Phe Leu Met Phe Ile Val Asp Asn Asn Ile Leu Phe Leu385 390 395 400Gly Lys Val Asn Arg Pro405<210>26<211>32<212>PRT<213>合成<400>26Ala Leu Ala Gly Leu Ala Ser Pro Gly Leu Tyr Gly Leu Ala Arg Gly1 5 10 15Val Ala Leu Leu Glu Pro Arg Gly Leu Tyr Ser Glu Arg Gly Leu Tyr20 25 30<210>27
<211>33<212>PRT<213>合成<400>27Ala Leu Ala Pro Arg Gly Leu Leu Tyr Ser Gly Leu Tyr Leu Tyr Ser1 5 10 15Ala Ser Asn Thr His Arg Leu Glu Gly Leu Tyr Ser Glu Arg Gly Leu20 25 30Tyr<210>28<211>35<212>PRT<213>合成<400>28Ala Leu Ala Pro Arg Ser Glu Arg Ser Glu Arg Leu Tyr Ser Ser Glu1 5 10 15Arg Thr His Arg Ser Glu Arg Gly Leu Tyr Gly Leu Tyr Ser Glu Arg20 25 30Gly Leu Tyr35<210>29<211>34<212>PRT<213>合成<400>29
Ala Leu Ala Leu Tyr Ser Pro Arg Gly Leu Tyr Leu Glu Val Ala Leu1 5 10 15Ala Ser Pro Ala Ser Asn Gly Leu Asn Gly Leu Tyr Ser Glu Arg Gly20 25 30Leu Tyr<210>30<211>36<212>PRT<213>合成<400>30Ala Leu Ala Pro His Glu Gly Leu Tyr Ala Ser Asn Ala Leu Ala Ala1 5 10 15Ser Asn Ser Glu Arg Ala Leu Ala Ala Arg Gly Gly Leu Tyr Ser Glu20 25 30Arg Gly Leu Tyr35<210>31<211>34<212>PRT<213>合成<400>31Ala Leu Ala Pro Arg Ser Glu Arg Ala Ser Pro Leu Tyr Ser Gly Leu1 5 10 15Gly Leu Tyr Thr Tyr Arg Ser Glu Arg Gly Leu Tyr Ser Glu Arg Gly20 25 30
Leu Tyr<210>32<211>34<212>PRT<213>合成<400>32Ala Leu Ala Leu Tyr Ser Pro Arg Ala Ser Asn Pro Arg Thr His Arg1 5 10 15Gly Leu Tyr Thr His Arg Val Ala Leu Gly Leu Tyr Ser Glu Arg Gly20 25 30Leu Tyr<210>33<211>35<212>PRT<213>合成<400>33Ala Leu Ala Ile Leu Glu Hi s Ile Ser Gly Leu Thr Tyr Arg Pro His1 510 15Glu Ala Arg Gly Gly Leu Tyr Gly Leu Tyr Gly Leu Tyr Ser Glu Arg20 25 30Gly Leu Tyr35
<210>34<211>34<212>PRT<213>合成<400>34Ala Leu Ala Leu Glu His Ile Ser Gly Leu Tyr Ala Arg Gly Gly Leu1 5 10 15Tyr Gly Leu Tyr Gly Leu Ala Ser Pro Gly Leu Tyr Ser Glu Arg Gly20 25 30Leu Tyr<210>35<211>35<212>PRT<213>合成<400>35Ala Leu Ala Ser Glu Arg Ser Glu Arg Pro Arg Ala Ser Pro Val Ala1 5 10 15Leu Ala Leu Ala Leu Tyr Ser Gly Leu Tyr Gly Leu Tyr Ser Glu Arg20 25 30Gly Leu Tyr3权利要求
1.通过转基因DNA构建体编码的双功能融合蛋白,该构建体包括第一个具有所需生物活性的多肽结构域,和第二个具有所需生物活性的多肽结构域,共同组成所述的融合蛋白,其中所述的第一个和所述的第二个多肽结构域各自保留其所需的生物活性,其中所述第一个多肽结构域编码的多肽是人α-甲胎蛋白或其具有人α-甲胎蛋白生物活性的片段。
2.权利要求1的融合蛋白,其中所述的融合蛋白是DNA连续编码序列的产物。
3.权利要求1的融合蛋白,其中所述第二个多肽结构域编码的哺乳动物多肽是人IFN-β或其具有IFN-β生物活性的片段。
4.权利要求2的融合蛋白,其中所述的第二个多肽结构域选自抗凝血酶III、乳铁蛋白、铁蛋白、降钙素、尿激酶、血小板因子4、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制剂、核心蛋白聚糖、催乳素、τ干扰素、α干扰素、铁蛋白、促乳素、CFTR、Muellerian抑制物质、血液因子X、血液因子VIII、截短的ATIII和促红细胞生成素。
5.权利要求1的融合蛋白,进一步包括谷胱甘肽S-转移酶多肽序列。
6.编码连接于SEQ.ID NO10的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
7.编码连接于SEQ.ID NO11的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
8.编码连接于SEQ.ID NO12的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
9.编码连接于SEQ.ID NO13的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
10.编码连接于SEQ.ID NO14的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
11.编码连接于SEQ.ID NO15的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
12.编码连接于SEQ.ID NO16的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
13.编码连接于SEQ.ID NO17的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
14.编码连接于SEQ.ID NO18的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
15.编码连接于SEQ.ID NO19的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
16.编码连接于SEQ.ID NO20的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
17.编码连接于SEQ.ID NO21的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
18.编码连接于SEQ.ID NO22的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
19.编码连接于SEQ.ID NO23的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
20.编码连接于SEQ.ID NO24的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
21.编码连接于SEQ.ID NO25的SEQ.ID NO4所示氨基酸序列的分离多核苷酸。
22.重组DNA载体,包括权利要求1的融合蛋白的核酸序列。
23.用权利要求22所述的重组DNA载体转化的宿主细胞。
24.重组DNA载体,包括权利要求1的融合蛋白的核酸序列,其中所述的载体是表达载体,该载体包括可操作连接于权利要求1融合蛋白的启动子。
25.权利要求1的方法,其中通过至少一种β酪蛋白启动子来启动所述的编码所需融合蛋白的DNA构建体。
26.融合蛋白,通过以下方法制得,该方法包括(a)通过细胞表达权利要求1的融合蛋白;和(b)收集蛋白。
27.权利要求26的融合蛋白,其中所述的融合蛋白进一步包括N-端蛋氨酸。
28.治疗病症的方法,包括施用有效量的融合蛋白,通过转基因DNA构建体编码所述的融合蛋白,该构建体包括第一个具有所需生物活性的多肽结构域,和第二个具有所需生物活性的多肽结构域,一起构成所述的融合蛋白,其中所述的第一个和所述的第二个多肽结构域各自保留其所需的生物活性,其中所述第一个多肽结构域编码的多肽是人α-甲胎蛋白或其具有人α-甲胎蛋白生物活性的片段。
29.权利要求28的方法,其中所述的病症是病毒感染。
30.权利要求29的方法,其中所述的病毒感染是由人免疫缺陷病毒引起的。
31.权利要求28的方法,其中所述第二个多肽结构域编码的多肽是人IFN-β或其具有人IFN-β生物活性的片段。
32.权利要求28的方法,其中所述的病症是癌症。
33.权利要求28的方法,其中所述的病症是类风湿性关节炎。
34.权利要求28的方法,其中所述的病症是多发性硬化。
35.权利要求28的方法,其中所述的病症是骨质疏松。
36.权利要求28的方法,其中所述的病症是牛皮癣。
37.权利要求28的方法,其中所述的病症是重症肌无力。
38.权利要求32的方法,其中所述的病症是癌症,且所述病症的治疗进一步包括用有效量的第二种组合物来治疗,所述的第二种组合物选自阿霉素;氨甲蝶呤;他莫西芬;顺铂;长春碱;或长春新碱。
39.权利要求26的融合蛋白,其中通过原核细胞来表达所述融合蛋白。
40.权利要求26的融合蛋白,其中通过细菌来表达所述融合蛋白。
41.权利要求26的融合蛋白,其中通过真核细胞来表达所述融合蛋白。
42.权利要求26的融合蛋白,其中通过动物细胞来表达所述融合蛋白。
43.权利要求26的融合蛋白,其中所述动物细胞是CHO细胞。
44.权利要求26的融合蛋白,其中所述动物细胞是COS细胞。
45.权利要求26的融合蛋白,其中通过酵母来表达所述融合蛋白。
46.权利要求26的融合蛋白,其中所述酵母是酵母属(Saccharomyces)。
47.通过以下方法制得的融合蛋白,该方法包括(a)通过转基因动物表达权利要求1的融合蛋白;和(b)收集蛋白。
48.生产能够产生所关心融合蛋白的转基因动物的方法,包括用编码第一个蛋白多肽结构域和第二个蛋白多肽结构域的转基因DNA构建体转染非人哺乳动物细胞系;选择其中所述转基因DNA构建体已经插入该细胞或细胞系基因组中的细胞系;和进行第一个核移植程序来产生与所需基因杂合的第一个转基因动物。
49.权利要求48的方法,进一步包括表征所述的第一个杂合转基因动物的遗传组成,通过使用选择剂来选择与所述的所需转基因DNA构建体纯合的细胞;使用已知的分子生物学方法来表征存活的细胞;并挑选存活的细胞或细胞集落细胞用于第二轮的核移植或胚胎移植;并产生与所述的所需转基因DNA构建体纯合的第二个转基因动物。
50.权利要求49的方法,其中通过几种已知的分子生物学方法之一来表征所述的存活细胞,这些方法包括但不限于FISH、DNA印迹、PCR。
51.权利要求48的方法,其中所述的用作供体核或供体细胞核来源的非人哺乳动物细胞系来自有蹄类。
52.权利要求48或51的方法,其中所述的用作供体细胞或供体细胞核的非人哺乳动物细胞系来自选自牛、羊、猪、马、公山羊和水牛的有蹄类。
53.权利要求48的方法,其中所述的用作供体核或供体细胞核来源的非人哺乳动物细胞素是来自成体非人哺乳动物体细胞的分化的哺乳动物细胞。
54.权利要求48的方法,其中所述的第一个转基因动物是啮齿动物。
55.权利要求48的方法,其中所述的第一个转基因动物是有蹄类。
56.权利要求48的方法,其中所述的第一个转基因动物来自选自牛、羊、猪、马、公山羊和水牛的有蹄类。
57.权利要求48或49的方法所得到的后代。
58.权利要求48的方法,其中在所述的核移植方案中使用了细胞松弛素-B。
59.权利要求48的方法,其中在所述的核移植方案中未使用细胞松弛素-B。
60.权利要求48或49的方法,其中使用的技术产生了纯合细胞系。
61.权利要求48或49的方法,其中所述的第一个和第二个蛋白多肽结构域核酸序列是连接的并作为单个氨基酸序列来翻译。
62.权利要求48的方法,其中将所述的转基因DNA构建体可操作地连接于乳房组织特异性启动子,该启动子使在转基因非人胎盘哺乳动物的奶中产生所述转基因DNA构建体的双功能融合蛋白产物成为可能。
63.权利要求49的方法,其中将所述的转基因DNA构建体可操作地连接于乳房组织特异性启动子,该启动子使在转基因非人胎盘哺乳动物的奶中产生所述转基因DNA构建体的双功能融合蛋白产物成为可能。
64.权利要求62或63的转基因哺乳动物,其中所述启动子是β-乳球蛋白启动子。
65.权利要求62或63的转基因哺乳动物,其中所述启动子是β-酪蛋白启动子。
66.权利要求48的方法,其中所述的第一个蛋白多肽结构域编码人α-甲胎蛋白而其中所述的第二个蛋白多肽结构域编码用于生物药物蛋白产物的所需基因密码,这些生物药物蛋白产物选自抗凝血酶III、乳铁蛋白、尿激酶、血小板因子4、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制剂、核心蛋白聚糖、β干扰素、α干扰素、铁蛋白、促乳素、CFTR、Muellerian抑制物质、催乳素、血液因子X、血液因子VIII、截短的ATIII和促红细胞生成素。
67.权利要求48和49方法的后代所产生的奶。
68.使用含有融合蛋白物质的组合物治疗人癌症或肿瘤细胞的方法,通过转基因DNA构建体来编码所述融合蛋白,该构建体包括第一个具有所需生物活性的多肽结构域,和第二个具有所需生物活性的多肽结构域,一起构成所述的融合蛋白,其中所述的第一个和所述的第二个多肽结构域各自保留其所需的生物活性,且其中所述的第一个多肽结构域具有人α-甲胎蛋白的活性,改进包括用基本上药物学纯的所述融合蛋白和有效量5-氟尿嘧啶的组合物来治疗患者。
69.权利要求3的融合蛋白,其中所述的人α-甲胎蛋白或人α-甲胎蛋白变体具有高的血浆半衰期。
70.权利要求69的融合蛋白,其中所述的人α-甲胎蛋白变体具有一个或多个残基的突变。
71.权利要求69的融合蛋白,其中所述的人α-甲胎蛋白变体具有一个或多个残基的缺失。
72.权利要求69的融合蛋白,其中所述的人α-甲胎蛋白变体具有一个或多个残基的突变和缺失。
73.权利要求69的融合蛋白,其中所述人α-甲胎蛋白变体具有一个或多个残基的添加。
74.权利要求69的融合蛋白,其中所述融合蛋白进一步包括肽衔接物。
75.权利要求69的融合蛋白,其中所述融合蛋白包括分泌信号序列。
76.权利要求69的融合蛋白,其中所述的人IFN-β与所述的人α-甲胎蛋白或人α-甲胎蛋白变体的N-端融合。
77.权利要求69的融合蛋白,其中所述的人IFN-β与所述的人α-甲胎蛋白或人α-甲胎蛋白变体的C-端融合。
78.如SEQ.ID NO1所示的分离的核酸序列。
79.如权利要求6-21所示的分离的核酸序列,进一步包括氨基酸连接序列。
80.治疗人癌症或肿瘤细胞的方法,使用含有融合蛋白物质的组合物,所述融合蛋白包括第一个蛋白多肽结构域和共价连接的第二个蛋白多肽结构域,所述的第一个蛋白多肽结构域编码人α-甲胎蛋白氨基酸序列,且其中所述的第二个蛋白多肽结构域编码具有所需蛋白生理活性的生物药物蛋白产物,所需蛋白选自抗凝血酶III、乳铁蛋白、尿激酶、血小板因子4、α-甲胎蛋白、α-1-抗胰蛋白酶、C-1酯酶抑制剂、核心蛋白聚糖、β干扰素、α干扰素、铁蛋白、促乳素、CFTR、Muellerian抑制物质、促乳素、血液因子X、血液因子VIII、截短的ATIII和促红细胞生成素,且其中所述的第二个蛋白多肽与所述的所需蛋白的天然序列超过85%同源。
81.治疗人皮肤病或损伤的方法,使用含有融合蛋白物质的组合物,所述融合蛋白包括第一个蛋白多肽结构域和共价连接的第二个蛋白多肽结构域,所述的第一个蛋白多肽结构域编码人α-甲胎蛋白氨基酸序列,且其中所述第二个蛋白多肽结构域编码具有所需蛋白生理活性的生物药物蛋白产物,所需蛋白选自抗凝血酶III、α-1-抗胰蛋白酶和核心蛋白聚糖,且其中所述第二个蛋白多肽与所述的所需蛋白的天然序列超过85%同源。
82.权利要求81的方法,其中所述的人皮肤病或损伤选自光老化损伤、鼻炎、晒斑、皮炎和烧伤。
83.权利要求28的方法,其中所述的病症是肌肉萎缩。
84.权利要求28的方法,其中所述的病症是胰岛素依赖性糖尿病。
85.权利要求28的方法,其中所述的病症是牛皮癣。
86.权利要求28的方法,其中所述的病症是系统性红斑狼疮。
87.权利要求28的方法,其中所述的病症是多毛细胞白血病。
88.权利要求28的方法,其中所述的病症是慢性骨髓性自血病。
89.权利要求28的方法,其中所述的病症是皮肤T细胞淋巴瘤类癌瘤。
90.权利要求28的方法,其中所述的病症是肾细胞癌。
91.权利要求28的方法,其中所述的病症是头和颈的鳞状上皮肿瘤。
92.权利要求28的方法,其中所述的病症是多发性骨髓瘤。
93.权利要求28的方法,其中所述的病症是恶性黑素瘤。
94.权利要求28的方法,其中所述的病症是乙型肝炎。
95.权利要求28的方法,其中所述的病症是丙型肝炎。
96.权利要求28的方法,其中所述的病症是低级非霍奇金淋巴瘤。
全文摘要
从转基因动物的奶中生产和纯化所需的融合蛋白。作为融合蛋白制得肽具有合适的融合配偶体如人α-甲胎蛋白。融合配偶体蛋白促进和提高了整个分子的半衰期以及其自身具有治疗效用。通常通过使用转基因动物来产生融合蛋白且目前可以通过亲和纯化方法从这样动物的奶中或其它体液中纯化出来。通过该途径生产肽的特定优势,除了高产量和生物相容性的明显优势外,是特定的翻译后修饰,如羧基端酰胺化,可以在乳腺中进行。包括与人α-甲胎蛋白片段或其变体融合的治疗活性多肽的生物活性多肽,及其制备方法,编码这样融合多肽的核苷酸序列,包括这样核苷酸序列的表达盒,含有这样表达盒的自我复制的质粒,以及含有所述融合多肽的药物组合物。
文档编号C07H21/04GK1871252SQ200480030708
公开日2006年11月29日 申请日期2004年9月3日 优先权日2003年9月5日
发明者H·米德, G·F·考克斯 申请人:Gtc生物治疗学公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1