T细胞受体展示的制作方法

文档序号:3553870阅读:588来源:国知局

专利名称::T细胞受体展示的制作方法
技术领域
:本发明涉及展示T细胞受体(TCR)的蛋白质性质的颗粒,例如噬菌体或核糖体颗粒,及其不同的文库。
背景技术
:天然T细胞受体(TCR)如在例如WO99/60120中所述的,TCR介导T细胞对特异性主要组织相容性复合物(MHC)-肽复合体的识别,这是免疫系统细胞免疫发挥功能的基础。抗体和TCR是仅有的两种以特异方式识别抗原的分子,并且TCR因而是针对MHC提呈的特定抗原肽的唯一受体,异物肽经常是细胞内异常的唯一标志。当T细胞与抗原提呈细胞(APC)之间发生直接物理接触时,发生T细胞识别,并由抗原特异性TCR与pMHC复合物连接启动。天然TCR是一种免疫球蛋白超家族的异源二聚细胞表面蛋白,它与参与介导信号转导的CD3复合体的固定蛋白相连。TCR以αβ和γδ形式存在,两者结构上相似但具有完全不同的解剖学定位以及或许不同的功能。I类和II类MHC配体也是免疫球蛋白超家族蛋白质但具有使其能够提呈大量不同APC细胞表面短肽片段的高度多样性的肽结合位点,专门用以抗原提呈。已知两种进一步类型的蛋白质能够如TCR配体发挥作用。(1)CD1抗原是MHCI类相关分子,其基因位于不同于经典MHCI类和II类抗原的染色体上。CD1分子能以类似于常规I类和II类MHC-肽复合物的形式向T细胞提呈肽和非肽(例如脂、糖脂)部分。参见,例如Barclay等所著《白细胞抗原概述》(TheLeucocyteAntigenFactsbook),第2版,(1997)以及Bauer(1997)EurJImmunol27(6)1366-1373。(2)细菌超抗原是能够结合II类MHC分子和一部分TCR的可溶性毒素(Fraser(1989)Nature339221-223)。许多超抗原显示出对一种或两种Vβ片段的特异性,而其他表现出更随意的结合。任何情况下,超抗原能依靠其以多克隆方式激活一部分T细胞的能力引起增强的免疫反应。异源二聚的αβ和γδTCR的胞外部分包括两条多肽,其中每条具有一个近膜的恒定结构域和一个远膜的可变结构域。每个恒定结构域和可变结构域包含一个链内二硫键。可变结构域包含类似于抗体互补决定区(CDR)的高多态性环。αβTCR的CDR3与MHC提呈的肽相互作用,并且αβTCR的CDR1和CDR2与肽和MHC相互作用。TCR序列的多态性通过连锁的可变结构域(V)、多样性(D)、连接区(J)和恒定基因的体细胞重排产生。功能性α和γ链多肽由重排的V-J-C区形成,而β和δ链多肽包含V-D-J-C区。胞外恒定结构域具有近膜区和免疫球蛋白区。存在单一的α和δ链恒定结构域,分别称为TRAC和TRDC。β链恒定结构域由两种称为TRBC1和TRBC2(IMGT命名法)的不同β恒定结构域中的一种构成。在这些β恒定结构域之间存在4个氨基酸的改变,其中3个位于用于产生展示在本发明的噬菌体颗粒上的单链TCR的结构域内部。这些改变都位于TRBC1和TRBC2的外显子1内部N4K5->K4N5和F37->Y(IMTG编号,TRBC1->TRBC2差异),最后一个两种TCRβ链之间的氨基酸改变在TRBC1和TRBC2的外显子3中Vi->E。恒定的γ结构域由TRGC1、TRGC2(2X)或TGRC2(3X)之一构成。这两种TGRC2恒定结构域只是在所述基因外显子2所编码的氨基酸拷贝数上有所不同。每种TCR胞外结构域的范围有些变化。然而,精通本领域的人员可以使用诸如《T细胞受体概述》(TheTCellReceptorFactsBook,Lefranc&Lefranc,Publ.AcademicPress2001)等参考方便地确定结构域边界的位置。重组TCR生产重组TCR是有好处的,因为它们提供了适用于以下目的的可溶性TCR类似物研究TCR/配体相互作用(例如pMHC与αβTCR)筛选TCR相关相互作用的抑制剂为潜在的治疗方法提供基础目前已经设计出了多种构件以生产重组TCR。这些构件分成单链TCR和二聚TCR两大类,下面总结了与这两种构件相关的文献。单链TCR(scTCR)是由单一氨基酸链构成的人工构件,它类似于天然异源二聚TCR与MHC-肽复合物结合。不幸地,通过简单地连接α和β链从而使两者在单一的开放读框中表达而生产功能性α/β类似物scTCR的尝试还没有获得成功,大概是由于α-β可溶性结构域对的天然不稳定性。相应地,使用α链和β链之一或两者的各种截短序列的专门技术对于生产scTCR是必需的。这些方式似乎只可用于非常有限的scTCR序列。SooHoo等在(1992)PNAS.89(10)4759-63中报道了通过使用用一种25个氨基酸的连接物连接的截短的α和β链与细菌周质表达的2CT细胞克隆中单链形式的小鼠TCR的表达(也可参见Schodin等,(1996)Mol.Immunol.33(9)819-29)。这一设计也形成了Holler等在(2000)PNAS.97(10)5387-92中报道的源自2CscTCR的并与相同的H2-Ld-限制性异构表位(alloepitope)结合的m6单链TCR的基础。Shusta等在(2000)NatureBiotechnology18754-759中以及美国专利6,423,538中报道了在产生突变TCR的酵母展示实验中使用小鼠单链2CTCR构件提高热稳定性和可溶性。这一报道也说明了这些展示的2CTCR选择性结合表达其同类pMHC细胞的能力。Khandekar等在(1997)J.Biol.Chem.272(51)32190-7中报道了针对小鼠D10TCR的类似的设计,虽然这一scTCR与MBP融合并在细菌胞质中表达(可见Hare等,(1999)Nat.Struct.Biol.6(6)574-81)。Hilyard等在(1994)PNAS.91(19)9057-61中报道了通过使用Vα-连接物-Vβ设计并在细菌周质表达的一种感冒病毒基质蛋白HLA-A2特异性的人scTCR。Chung等在(1994)PNAS.91(26)12654-8中报道了使用Vα-连接物-Vβ-Vβ设计并在哺乳动物细胞系表面表达的人scTCR的生产。该报道不涉及scTCR的任何肽-HLA特异性结合。Plaksin等在(1997)J.Immunol.158(5)2218-27中报道了一种类似的Vα-连接物-Vβ-Vβ设计以生产针对HIVgp120-H-2Dd表位的小鼠特异性scTCR。该scTCR以细菌包含体形式表达并在体外复性。许多文献描述了包含连接相应亚基的天然二硫键的TCR异源二聚体的生产(Garboczi等,(1996),Nature384(6605)134-41;Garboczi等,(1996),JImmunol157(12)5403-10;Chang等,(1994),PNASUSA9111408-11412;Davodeau等,(1993),J.BiolChem.268(21)15455-15460;Golden等,(1997),J.Imm.Meth.206163-169;美国专利No.6080840)。然而,虽然这样的TCR能被TCR特异抗体识别,它们是不稳定的并且不能识别其天然配体,除非这些配体达到相对高浓度。在WO99/60120中描述了一种正确折叠的可溶性TCR,因此它能够识别其天然配体,在一段时加内稳定的,并能够以合理的数量生产。这种TCR包括通过一对C末端二聚化肽(诸如亮氨酸拉链)与一个相应的TCRβ或δ链胞外结构域二聚的一个TCRα或γ链胞外结构域。这一生产TCR的策略通常适用于所有TCR。Reiter等在Immunity,1995,2281-287中详细描述了包括由二硫键稳定的TCRα和β可变结构域,其中之一与假单胞菌(Pseudomonas)外毒素(PE38)相连的可溶性分子的构建。生产这一分子的理由之一是克服单链TCR固有的不稳定性。这种TCR可变结构域中新的二硫键的位置通过与抗体可变结构域(这些二硫键先前曾被导入过,参见例如Brinkmann等(1993),Proc.Natl.Acad.Sci.USA907538-7542,以及Reiter等(1994)Biochemistry335451-5459)的同源性进行鉴别。然而,由于在抗体和TCR的恒定结构域之间没有这样的同源性,这样的技术不能用于鉴别TCR恒定结构域之间新的链间二硫键的合适位点。如以上提到的,Shusta等在(2000)NatureBiotechnology18754-759中报道了在酵母展示实验中使用单链2CTCR构件。以前对于在噬菌体颗粒上展示scTCR已进行过讨论。例如,WO99/19129详细描述了scTCR的生产,并且总结了用于展示Vα-连接物-VβCβ形式的scTCR的噬菌体颗粒的生产的潜在方法。然而,该申请没有包含说明所述展示TCR的噬菌体颗粒的生产的例证。该申请仍然参考了一份未决申请“在所述的未决美国专利申请08/813,781中已经描述了包含与噬菌体外被蛋白(基因II或基因VIII)融合的编码scTCR分子的DNA片段的DNA载体的构建。”而且,该申请依赖于抗TCR抗体或超抗原MHC复合物识别产生的可溶的、非噬菌体展示的scTCR的能力以证实其正确构象。因此,scTCR的真正的肽-MHC结合特异性没有以任何形式进行确定地说明。最后,进一步的研究(Onda等,(1995)MolecularImmunology32(17-18)1387-1397)公开了在不存在其相应β链的情况下两条小鼠TCRα链的噬菌体展示。这一研究说明,展示所述TCRα链(源自A1.1小鼠杂交瘤)之一的噬菌体颗粒优先与固定在微量滴定孔中的、与由小鼠I类MHCI-Ad提呈时完整TCR会正常反应的相同的肽结合。筛选应用包括TCR介导的免疫突触在内的多种重要的细胞相互作用和细胞反应是由细胞表面受体和呈现在其他细胞表面的配体之间的接触控制的。这些特异的分子接触类型对于人体内正确的生化调节具有重要意义,因而是研究热点。在许多情况下,这样研究的目标是设计调节细胞反应的方法以防止或治疗疾病。因此,用于鉴别具有一定特异性的与人类受体或配体结合的化合物的方法是重要的,因为这会引导新的疾病治疗方法的发现和发展。尤其是干扰某些受体-配体相互作用的化合物具有立即作为治疗物质或载体的能力。组合化学的进展能较简便和有效地产生非常庞大的化合物文库,这已经提高了大规模化合物检测的范围。现在,筛选程序的限制最常见存在于能够使用的检测法的性质、适当的受体与配体分子的生产以及这些检测法适于高通量筛选方法的程度。展示方法经常需要在蛋白质性质的颗粒表面呈现一种给定的肽或多肽。这样的颗粒可以作为肽或多肽纯化的辅助方式(因为这些携带肽或多肽的颗粒可以通过沉淀或其他方法与不需要的杂质分离)。它们也可以用作微粒疫苗,针对表面展示的肽或多肽的免疫应答通过微粒提呈得以激活。酵母反转位子蛋白质p24和肝炎B表面外被蛋白是自装配成颗粒的蛋白质的例子。感兴趣的肽或多肽与这些颗粒形成蛋白的融合是在生成的颗粒表面提呈所述肽或多肽的一种认可的方式。然而,颗粒展示方法主要已用于鉴别具有诸如增强的表达量、结合和/或稳定特性等所需性质的蛋白质。这些方法包括创建在蛋白质性质的颗粒表面表达蛋白或多肽的多样库或“文库”。这些颗粒具有两个关键特征,第一,每个颗粒提呈单一的蛋白质或多肽,以及第二,编码所表达的蛋白或多肽的遗传材料与所述颗粒的遗传材料相连。随后所述文库进行一轮或多轮筛选。例如,这可以包括将一种配体与一种突变受体的颗粒展示文库接触并鉴别哪种突变受体以最高亲和性结合所述配体。一旦筛选过程完成,具有所需性质的受体可以进行分离,并且其遗传材料可以扩增以对所述受体进行测序。这些展示方法分为两大类,体外展示和体内展示。所有体内展示方法依赖于以下步骤,其中通常将由诸如质粒或噬菌体复制子的可复制颗粒的遗传核酸转化细胞以表达蛋白或多肽(Pliickthun(2001)AdvProteinChem55367-403)。存在多种已证实适于蛋白或多肽体内展示的复制子/宿主系统。这些系统包括噬菌体/细菌细胞质粒/CHO细胞基于酵母2μm质粒的载体/酵母细胞杆状病毒/昆虫细胞质粒/细菌细胞体内展示方法包括细胞表面展示方法,其中将编码由感兴趣的蛋白质或多肽与一种细胞表面蛋白或多肽构成的融合蛋白的质粒导入宿主细胞。这一融合蛋白的表达导致感兴趣的蛋白或多肽展示在细胞表面。展示这些感兴趣的蛋白或多肽的细胞随后可以用于如FACS等筛选过程,并且从选出的细胞中得到的质粒可以进行分离和测序。对哺乳动物细胞(Higuschi(1997)JImmunol.Methods202193-204)、酵母细胞(Shusta(1999)JMolBiol292949-956)和细菌细胞(Sameulson(2002)J.Biotechnol96(2)129-154)已经设计了细胞表面展示系统。已经公开了多种体内展示技术的大量综述,例如Hudson(2002)ExpertOpinBiolTher(2001)1(5)845-55以及Schmitz(2000)21(SuppA)S106-S112。体外展示方法建立在核糖体基础上以将mRNA文库翻译成为蛋白质或多肽的多样阵列。形成的蛋白质或多肽与编码这些分子的mRNA之间的连接是通过两种方法之一维持的。常规的核糖体展示采用编码短的连接序列(通常40-100个氨基酸)和需要展示的蛋白质或多肽的mRNA序列。连接序列为展示的蛋白或多肽提供足够的空间以重折叠而不会被核糖体产生空间位阻。所述mRNA序列缺乏“终止”密码子,这确保表达的蛋白或多肽及RNA与核糖体颗粒保持连接。相关的mRNA展示方法建立在制备编码感兴趣的蛋白或多肽与携带嘌呤霉素部分的DNA连接物的mRNA基础上。一旦核糖体到达mRNA/DNA接头处,翻译就停止,并且嘌呤霉素与核糖体形成共价连接。关于这两种相关的体外展示方法的近期的综述参见Amstutz(2001)CurrOpinBiotechnol12400-405。尤其优选地是基于噬菌体颗粒表达与其表面蛋白融合的异源肽或多肽能力的噬菌体展示技术(Smith(1985)Science2171315-1317)。对于多肽单体展示的过程是相当通用的,并且是本领域内熟知的。然而,当天然形式结合为二聚体的多肽的情况下,似乎只有抗体的噬菌体展示已经得到了彻底研究。对于单体多肽展示而言,存在两种主要过程第一种(方法A)是通过将编码与编码噬菌体外被蛋白的DNA融合的异源肽或多肽的DNA插入载体(噬菌粒)。随后通过用噬菌粒转染细菌细胞、并随后用“辅助噬菌体”感染转化的细胞,进行展示异源肽或多肽的噬菌体颗粒的表达。辅助噬菌体作为所述噬菌粒未编码的、产生功能性噬菌体颗粒所需的噬菌体蛋白的来源。第二种(方法B),通过将编码异源肽或多肽的DNA插入与编码噬菌体外被蛋白DNA融合的完整噬菌体基因组。随后通过用噬菌体基因组感染细菌细胞进行展示异源肽或多肽的噬菌体颗粒的表达。该方法比第一种方法具有“单一步骤”过程的优势。然而,降低了能成功包装入最终噬菌体颗粒的异源DNA序列的大小。适用于这一方法的噬菌体的例子有M13、T7和λ噬菌体。方法B的一种变形包括向噬菌体基因组中编码需展示的异源肽的DNA添加编码核苷酸结合结构域的DNA序列,以及进一步向噬菌体基因组添加相应的核苷酸结合位点。这使得所述异源肽直接与噬菌体基因组相连。这一肽/基因组复合物随后装入展示异源肽的噬菌体颗粒中。WO99/11785中完整描述了这一方法。随后可以重新获得噬菌体颗粒并用于研究所述异源肽或多肽的结合特征。一旦分离,噬菌粒或噬菌体DNA可以从展示肽或多肽的噬菌体颗粒中重新获得,并且该DNA可以通过PCR复制。PCR产物可以用于对由特定噬菌体颗粒展示的异源肽或多肽进行测序。单链抗体及其片段的噬菌体展示已成为研究这些多肽结合特征的常规方法。有多种书籍对噬菌体展示技术与噬菌体生物学作了综述(例如,参见Barbas等所著的《噬菌体展示一实验室手册》(PhageDisplay-ALaboratoryManual,2001,ColdSpringHarbourLaboratoryPress)。第三种噬菌体展示方法(方法C)建立在在需要位置具有半胱氨酸残基的异源多肽可以以可溶形式被噬菌粒或噬菌体基因组表达,并且引起与在表面暴露位置也具有半胱氨酸残基的改进的噬菌体表面蛋白通过所述两个半胱氨酸之间形成二硫键连接这一事实。WO01/05950详细描述了针对单链抗体衍生肽的这种另外的连接方法的使用。发明概述天然TCR是具有维持作为功能性二聚体的稳定性所需的长的跨膜结构域的异源二聚体。如上所述,对于研究和治疗目的而言有用的是可溶形式的TCR,因此很少采用不溶的天然形式的展示。另一方面,可溶的稳定形式的TCR已被证明难以设计,并且由于大部分展示方法似乎仅对单体肽和多肽进行了描述,适于可溶二聚体TCR的展示技术还没有进行研究。而且,由于展示的TCR的功能取决于TCR二聚体可变结构域的正确连接,功能性二聚体TCR的成功展示并非微不足道的。WO99/18129包含这样的陈述“按照1997年3月7日提交的未决美国申请No.08/813.781,其公开通过参考结合在本申请书中,编码scTCR融合蛋白的DNA构件可用于制备噬菌体展示文库”,但在该申请中没有包含这样的展示的实际描述。然而,该申请的发明人发表了一篇论文(Weidanz(1998)JImmunolMethods22159-76),说明了两种小鼠scTCR在噬菌体颗粒上的展示。WO01/62908共开了用于scTCR和scTCR/Ig融合蛋白噬菌体展示的方法。然而,没有对公开的构件的功能(特异性pMHC结合)进行评估。最后,针对小鼠TCR示范了逆转录病毒介导的用于多样的TCR文库在不成熟T细胞表面展示的方法。展示在未成熟T细胞表面的突变的TCR文库使用pMHC四聚体通过流式细胞仪进行筛选,并且这导致鉴别对同类pMHC特异的或其变体的TCR形式(Helmut等,(2000)PNAS97(26)14578-14583)。本发明部分建立在单链和二聚体TCR可以以与蛋白质性质的颗粒表面融合的形式表达,并可以利用展示α/β类似物和γ/δ类似物scTCR和dTCR构件的蛋白质颗粒的发现基础上。在这之上展示TCR的蛋白质性质的颗粒包括自聚合颗粒形成蛋白、噬菌体、病毒来源蛋白、核糖体颗粒以及具有TCR共价连接的细胞表面蛋白或多肽分子的细胞。这样的蛋白质颗粒展示的TCR对于纯化和筛选目的来说是有用的,尤其是作为颗粒展示的TCR的多样性文库用于生物淘选以鉴别具有诸如针对靶MHC-肽复合物高亲和性等需要特征的TCR。就后面这一点来说,颗粒展示的scTCR可以用于所需TCR的鉴别,但所述信息可能更好应用于最终用于治疗的类似物二聚体TCR的构件。本发明也包括可通过这些方法确定的高亲和性TCR。发明详述在一个主要的方面,本发明提供了一种在其表面展示T细胞受体(TCR)的蛋白质颗粒,其中(i)所述蛋白质颗粒是核糖体并且所述TCR是单链TCR(scTCR)多肽、或二聚体TCR(dTCR)多肽对,或(ii)所述蛋白质颗粒是噬菌体颗粒,或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞,以及所述TCR是人scTCR或人dTCR多肽对,或(iii)所述蛋白质颗粒是噬菌体颗粒,或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞,以及所述TCR是非人dTCR多肽对,或(iv)所述蛋白质颗粒是噬菌体颗粒,或是具有能与TCR共价连接的细胞表面蛋白或多肽分子的细胞,且所述TCR是scTCR多肽,该多肽包含与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列,连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列的连接序列,以及连接恒定结构域序列的残基、在天然T细胞受体中不存在等价物的二硫键。在一种优选的实施方案中,本发明提供了一种在表面展示一种二聚体T细胞受体(dTCR)多肽对、或一种单链T细胞受体(scTCR)多肽的蛋白质颗粒,其中所述dTCR多肽对由与存在于天然TCR链中的胞外恒定和可变结构域序列相对应的TCR氨基酸序列组成,所述scTCR由与天然TCR链的胞外恒定和可变结构域序列相对应的氨基酸序列和连接序列组成,所述连接序列连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列;其中dTCR多肽对或scTCR多肽的可变结构域序列的相互定位与天然TCR中的定位基本一致,并且在所述scTCR多肽的情况下,天然TCR中不存在等价物的二硫键连接所述多肽的残基。在按照本发明展示αβscTCR或dTCR的情况下,对α和β片段的可变结构域序列的相互定位与天然αβTCR中的定位基本一致的要求只是TCR功能性的另一种说法,并且这可以通过证实所述分子与相关的TCR配体(pMHC复合物、CD-1抗原复合物、超抗原或超抗原/pMHC复合物)结合进行检测—如果结合,则该要求得到满足。与pMHC复合物的相互作用可以使用Biacore3000TM或Biacore2000TM工具进行测量。WO99/6120提供了分析TCR与MHC-肽复合物结合所需的方法的详细描述。这些方法可以相同地应用于TCR/CD1和TCR/超抗原相互作用的研究。为了将这些方法应用于TCR/CD1相互作用的研究,需要可溶形式的CD1,在Bauer(1997)EurJImmunol27(6)1366-1373中描述了其生产过程。在本发明的γδTCR的情况下,这些分子的同类配体是未知的,因而可以使用诸如抗体识别等验证其构象的二级方法。δ链可变结构域特异的单克隆抗体MCA991T(得自Serotec)是适于该任务的抗体的例子。本发明的scTCR或dTCR可以通过例如以下两种方式被展示在蛋白质颗粒上,例如噬菌体颗粒上,优选地是丝状噬菌体颗粒上(i)dTCR多肽对的一个成员的C末端,或scTCR多肽的C末端,或与任一上述C末端相连的短肽连接物的C末端可以通过肽键与蛋白质颗粒的表面暴露残基直接相连。例如,所述表面暴露残基优选地位于噬菌体基因III或基因VIII的基因产物的N末端;以及(ii)dTCR多肽对的一个成员的C末端,或scTCR多肽的C末端,或与任一上述C末端相连的短肽连接物的C末端经导入的半胱氨酸残基通过二硫键与蛋白质颗粒表面暴露的半胱氨酸相连。例如,所述表面暴露残基也是优选地位于噬菌体基因III或基因VIII的基因产物的N末端。优选的是以上方法(i)。在scTCR的情况下,编码TCR的核酸可以与编码如噬菌体或细胞等可复制颗粒的颗粒形成蛋白或表面蛋白的核酸融合。另外,代表mRNA但没有终止密码子的核酸、或与嘌呤霉素RNA融合的核酸可以由核糖体翻译,从而所述TCR保持与核糖体颗粒的融合。在dTCR的情况下,编码TCR一条链的核酸可以与编码诸如噬菌体或细胞等可复制颗粒的颗粒形成蛋白或细胞表面蛋白的核酸融合,并且TCR多肽对的第二条链可以与展示第一条链的最终表达的颗粒相连。两条链的正确功能性连接可以如以下更全面地讨论的,由两条链的恒定结构域中存在的能形成链间二硫键的半胱氨酸辅助。展示的scTCR展示的scTCR多肽可以是例如具有以下组分的分子由与对应于TCRα链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRα或δ链可变结构域序列的氨基酸序列组成的第一片段,由与对应于TCRβ链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRβ或γ链可变结构域序列的氨基酸序列组成的第二片段,连接第一片段C末端和第二片段N末端的连接序列,或反之亦然,以及第一和第二条链之间的二硫键,所述二硫键在天然αβ或γδT细胞受体中不存在等价物,连接序列的长度和二硫键的位置使得第一和第二片段的可变结构域序列的相互定位与天然αβ或γδT细胞受体中的定位基本一致。另外,展示的scTCR可以是具有以下组分的分子由对应于TCRα或δ链可变结构域的氨基酸序列组成的第一片段,由与对应于TCRβ链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRβ或γ链可变结构域序列的氨基酸序列组成的第二片段,以及连接第一片段C末端和第二片段N末端的连接序列,条件是其中所述蛋白质颗粒是噬菌体,所述scTCR对应于人TCR;或是有以下组分的分子由对应于TCRβ或γ链可变结构域的氨基酸序列组成的第一片段,由与对应于TCRα链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRα或δ链可变结构域序列的氨基酸序列组成的第二片段,以及连接第一片段C末端和第二片段N末端的连接序列条件是其中所述蛋白质颗粒是噬菌体,所述scTCR对应于人TCR。展示的dTCR展示在蛋白质颗粒上的dTCR可以是由以下组分组成的分子对应于TCRα或δ链可变结构域序列的序列与对应于TCRα链恒定结构域胞外序列的序列的N末端融合的第一多肽,以及对应于TCRβ或γ链可变结构域序列的序列与对应于TCRβ链恒定结构域胞外序列的序列的N末端融合的第二多肽,第一和第二多肽通过在天然αβ或γδT细胞受体中不存在等价物的二硫键连接。优选地,所述dTCR展示在丝状噬菌体上并且是由以下组分组成的分子对应于TCRα链可变结构域序列的序列与对应于TCRα链恒定结构域胞外序列的序列的N末端融合的第一多肽,以及对应于TCRβ链可变结构域序列的序列与对应于TCRβ链恒定结构域胞外序列的序列的N末端融合的第二多肽,第一和第二多肽通过取代TRAC*01外显子1的Thr48和TRBC1*01或TRBC2*01或其非人类等价物的外显子1的Ser57的半胱氨酸残基之间的二硫键连接,所述dTCR多肽对一个成员的C末端通过肽键与噬菌体的外被蛋白相连。dTCR多肽对和scTCR多肽存在于scTCR或dTCR中的恒定结构域胞外序列优选地对应于人TCR的这些部分,对于可变结构域序列也是这样。然而,这样的序列之间的对应并不需要氨基酸水平上一一对应。相对于对应的人TCR序列的N-或C-截短、和/或氨基酸缺失和/或取代是允许的。尤其因为存在于第一和第二片段中的恒定结构域胞外序列并不直接参与与scTCR或dTCR结合的配体的接触,相对于天然TCR的胞外恒定结构域序列,它们可以更短一些,或可以包含取代或缺失。存在于dTCR多肽对之一或scTCR多肽第一片段中的恒定结构域胞外序列可以包括对应于TCRα链的胞外恒定Ig结构域的序列,并且/或存在于dTCR多肽对另一个成员或scTCR多肽第二片段中的恒定结构域胞外序列可以包括对应于TCRβ链的胞外恒定Ig结构域的序列。在本发明的一种实施方案中,dTCR多肽对的一个成员,或scTCR多肽的第一片段,对应于与TCRα链恒定结构域的充分完整的胞外结构域的N末端融合的TCRα链充分完整的可变结构域;和/或多肽对的另一个成员或第二片段对应于与TCRβ链恒定结构域的充分完整的胞外结构域的N末端融合的TCRβ链充分完整的可变结构域。在另一种实施方案中,存在于dTCR多肽对或scTCR多肽第一和第二片段中的恒定结构域胞外序列对应于C末端截短的天然TCR的α和β链的恒定结构域,从而排除了形成TCR的天然链间二硫键的半胱氨酸残基。另外,这些半胱氨酸残基可以被其他诸如丝氨酸或丙氨酸等氨基酸残基取代,从而删除了天然二硫键。此外,天然TCRβ链包含一个不成对的半胱氨酸残基,在本发明scTCR的β序列中,该残基可以删除或由非半胱氨酸残基取代。在本发明的特定实施方案中,存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCRα和β链可变结构域序列可以共同对应于第一个TCR的功能性可变结构域,并且存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCRα和β链恒定结构域胞外序列可以对应于第二个TCR的恒定结构域胞外序列,第一和第二个TCR来自相同的物种。因而,存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCRα和β链可变结构域序列可以对应于第一种人TCR可变结构域序列,并且α和β链恒定结构域胞外序列可以对应于第二种人TCR的恒定结构域胞外序列。例如,A6TaxsTCR恒定结构域胞外序列可用作骨架,在这之上可以融合异源α和β可变结构域。在本发明的另一种实施方案中,分别存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCRδ和γ链可变结构域序列可以共同对应于第一个TCR的功能性可变结构域,并且分别存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCRα和β链恒定结构域胞外序列可以对应于第二个TCR的恒定结构域胞外序列,第一和第二个TCR来自相同的物种。因而,存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCRδ和γ链可变结构域序列可以对应于第一种人TCR可变结构域序列,并且α和β链恒定结构域胞外序列可以对应于第二种人TCR的恒定结构域胞外序列。例如,A6TaxsTCR恒定结构域胞外序列可用作骨架,在这之上可以融合异源γ和δ可变结构域。在本发明的一种特定实施方案中,存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCRα和β、或δ和γ链可变结构域序列可以共同对应于第一种人TCR的功能性可变结构域,并且存在于dTCR多肽对或scTCR多肽第一和第二片段中的TCRα和β链恒定结构域胞外序列可以对应于第二种非人TCR的恒定结构域胞外序列。因而,存在于dTCR或scTCR多肽的第一和第二片段中的TCRα和β、或δ和γ链可变结构域序列可以对应于第一种人TCR可变结构域序列,并且α和β链恒定结构域胞外序列可以对应于第二种非人TCR的恒定结构域胞外序列。例如,小鼠TCR恒定结构域胞外序列可以用作骨架,在这之上可以融合异源人α和βTCR可变结构域。scTCR多肽中的连接物对于本发明的展示scTCR的蛋白质颗粒而言,连接序列连接第一和第二个TCR片段以形成单一的多肽链。所述连接序列可以,例如,具有式-P-AA-P-,其中P是脯氨酸,并且AA代表其中氨基酸是甘氨酸和丝氨酸的氨基酸序列。对于由本发明的蛋白质颗粒展示的scTCR与配体(在αβTCR的情况下是MHC-肽复合物)结合而言,第一和第二片段配对从而其可变结构域序列的定位适于这样的结合。因此,连接序列应具有足够长度以跨越第一片段C末端与第二片段N末端之间或反之亦然的距离。另一方面,在可变结构域序列N末端的连接序列末端阻碍或减弱scTCR与靶配体结合的情况下,优选地应避免连接序列的过度长度。例如,在其中存在于第一和第二片段中的恒定结构域胞外序列对应于C末端截短以去除形成天然链间二硫键的半胱氨酸残基的天然TCR的α和β链的恒定结构域,并且连接序列连接第一片段的C末端与第二个序列的N末端的情况下。连接序列可以包括例如26-41个氨基酸,优选地29、30、31或32个氨基酸,或33、34、35、或36个氨基酸。特定的连接物具有式-PGGG-(SGGGG)5-P-和-PGGG-(SGGGG)6-P-,其中P是脯氨酸,G是甘氨酸,以及S是丝氨酸。链间二硫键由本发明的蛋白质颗粒所展示的优选的dTCR和scTCR的一个特征要素是dTCR多肽对之间或scTCR第一和第二片段之间的二硫键。二硫键可以对应于存在于天然二聚体αβTCR中的天然链间二硫键,或可以在天然TCR中不存在对应物,存在于特异结合入dTCR多肽对或scTCR多肽第一个或第二片段的恒定结构域胞外序列的半胱氨酸之间。在有些情况下,天然和非天然二硫键都可能是需要的。二硫键的位置满足dTCR多肽对或scTCR多肽第一和第二片段的可变结构域序列充分类似天然αβ或γδT细胞受体中相互定位的要求。二硫键可以通过第一和第二片段上非半胱氨酸残基突变为半胱氨酸,并引发突变残基之间的键形成得以形成。天然TCR中其各自β碳原子分开约为6(0.6nm)或更小,并且优选地位于3.5(0.35nm)到5.9(0.59nm)的区间内的残基是优选的,这样可以在天然残基的位置上导入的半胱氨酸残基之间形成二硫键。虽然可以位于近膜结构域的残基之间,优选地是如果二硫键位于恒定免疫球蛋白结构域中的残基之间。可以导入半胱氨酸以形成二硫键的优选位置是TCRα链的TRAC*01的和TCRβ链的TRBC1*01或TRBC2*01的外显子1中的以下残基各自相应的人TCR链中的以下基序可以用于鉴别进行突变的残基(阴影部分残基是突变成半胱氨酸的残基)。α链Thr48DSDVYITDKTVLDMRSMDFK(TRAC*01基因的外显子1的39-58位氨基酸)(SEQID1)α链Thr45QSKDSDVYITDKTVLDMRSM(TRAC*01基因的外显子1的36-55位氨基酸)(SEQID2)α链Tyr10DIQNPDPAVYQLRDSKSSDK(TRAC*01基因的外显子1的1-20位氨基酸)(SEQID3)α链Ser15DPAVYQLRDSKSSDKSVCLF(TRAC*01基因的外显子1的6-25位氨基酸)(SEQID4)β链Ser57NGKEVHSGVSTDPQPLKEQP(TRBC1*01径TRBC2*01基因的外显子1的48-67位氨基酸)(SEQID5)β链Ser77ALNDSRYALSSRLRVSATFW(TRBC1*01&TRBC2*01基因的外显子1的68-87位氨基酸)(SEQID6)β链Ser17PPEVAVFEPSEAEISHTQKA(TRBC1*01&TRBC2*01基因的外显子1的8-27位氨基酸)(SEQID7)β链Asp59KEVHSGVSTDPQPLKEQPAL(TRBC1*01&TRBC2*01基因的外显子1的50-69位氨基酸)(SEQID8)β链Glu15VFPPEVAVFEPSEAEISHTQ(TRBC1*01&TRBC2*01基因的外显子1的6-25位氨基酸)(SEQID9)在其他物种中,TCR链可能不具有与以上基序100%相同的区域。然而,精通本领域的人员能够使用以上基序鉴别TCRα或β链的等价部分并由此鉴别突变成半胱氨酸的残基。在这一方面可以使用对齐排列技术。例如,欧洲生物信息学研究所网站(http//www.ebi.ac.uk/index.html)上提供的ClustalW可以用于将特定TCR链序列与以上基序比较以对需要突变的TCR序列相关部分进行定位。本发明在其范围内包括蛋白质颗粒展示的αβ和γδ类似物scTCR,以及其他哺乳动物的αβ和γδ类似物scTCR,这些哺乳动物包括但不限于小鼠、大鼠、猪、山羊和绵羊。如以上所提到的,精通本领域的人员应能够确定等价于上述人的能导入半胱氨酸残基以形成链间二硫键的位置的位置。例如,以下说明了小鼠Cα和Cβ可溶结构域的氨基酸序列,以及显示等价于上述人的能突变成半胱氨酸以形成TCR链间二硫键的残基的小鼠残基的基序(其中相关残基用阴影表示)小鼠Cα可溶结构域PYIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKSNGAIAWSNQTSFTCQDIFKETNATYPSSDVP(SEQID10)小鼠Cβ可溶结构域EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGREVHSGVSTDPQAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAEAWGRAD(SEQID11)人α链Thr48的小鼠等价物ESGTFITDKTVLDMKAMDSK(SEQID12)人α链Thr45的小鼠等价物KTMESGTFITDKTVLDMKAM(SEQID13)人α链Tyr10的小鼠等价物YIQNPEPAVYQLKDPRSQDS(SEQID14)人α链Ser15的小鼠等价物AVYQLKDPRSQDSTLCLFTD(SEQID15)人β链Ser57的小鼠等价物NGREVHSGVSTDPQAYKESN(SEQID16)人β链Ser77的小鼠等价物KESNYSYCLSSRLRVSATFW(SEQID17)人β链Ser17的小鼠等价物PPKVSLFEPSKAEIANKQKA(SEQID18)人β链Asp59的小鼠等价物REVHSGVSTDPQAYKESNYS(SEQID19)人β链Glu59的小鼠等价物VTPPKVSLFEPSKAEIANKQ(SEQID20)如上所述,A6TaxscTCR胞外恒定结构域可以用作骨架,在这之上可以融合异源可变结构域。优选地,异源可变结构域序列在二硫键和恒定结构域序列的N末端之间的任何位置与恒定结构域序列连接。在A6TaxTCR和β恒定结构域序列的情况下,可以在氨基酸残基158和172处分别导入的半胱氨酸之间形成二硫键。因此,优选地是如果异源的α和β链可变结构域序列连接位置分别位于159或173位残基和α或β恒定结构域序列的N末端之间。TCR展示用于生物淘选以鉴别具有如针对靶肽-MHC复合物高亲和性等所需性质的优选的体内TCR展示方法是噬菌体展示。首先,构建编码了突变的scTCR或dTCR的多样性阵列的DNA文库。该文库通过使用编码作为扩增模板的天然TCR的DNA进行构建。针对将所需突变体导入TCRDNA并从而最终表达TCR蛋白,存在多种对于精通本领域的人员而言已知的合适的方法。例如易错PCR(EP-PCR)、DNA重排技术以及如XL-1-Red等细菌增变菌株的使用是向TCR序列中导入突变的常规方法。尤其优选地是,如果这些突变体导入到TCR的明确的结构域中。例如,可变结构域中的突变,尤其互补决定区(CDR)和/或骨架区或许是导入导致生成TCR多样文库以产生具有提高的配体结合性质的TCR突变的最适当的位置。EP-PCR是通过这种方法可以将这样的“区域特异性”突变导入TCR的一个例子。使用与需要突变的区域邻接的DNA序列互补的EP-PCR引物以扩增这一包含可控水平随机突变的TCRDNA区域的多拷贝。通过连接或重叠PCR,这些编码突变区域的DNA序列插入编码TCR未突变部分的DNA序列。编码含突变区域TCR的DNA然后可以与编码异源多肽的DNA连接以产生适合展示的融合蛋白。在噬菌体展示的情况下,采用的表达载体是噬菌粒或噬菌体基因组载体,其中TCRDNA可以与编码表面蛋白的,优选地是gIII或gVIII表面蛋白的DNA连接。在scTCR的情况下,这样的连接如对于任何单体的肽或多肽的噬菌体展示那样进行。在dTCR的情况下,只有一条TCR链如前述的进行连接。另一条链编码在与噬菌粒和辅助噬菌体核酸共表达的核酸中,这样表达的第二条链与具有表面展示的第一条链的表达的噬菌体相连。如以上更详细地描述的,在这两种情况下,恒定结构域中正确定位的半胱氨酸通过由这些残基形成二硫键,在引起TCR的可变结构域采用其功能性定位中是有帮助的。至于表达,包括(a)编码dTCR多肽对的一条链的核酸,以及(b)与编码颗粒形成蛋白、或细胞表面蛋白的核酸序列融合的TCR多肽对的另一条链;或与编码颗粒形成蛋白或细胞表面蛋白的核酸序列融合的编码scTCR多肽的核酸,dTCR对,或包括由核酸(a)构成的第一载体和由核酸(b)构成的第二载体的组合物的表达载体与能引起编码的遗传物质在适于所述细胞转化的条件下表达的宿主细胞接触。这样的表达载体、表达系统包括编码dTCR和scTCR的噬菌粒或噬菌体基因组载体,以及携带它们的宿主细胞形成本发明的附加方面。在本发明的优选的实施方案中,噬菌粒或噬菌体基因组载体源自丝状噬菌体。转化的细胞随后进行孵育以允许TCR展示的蛋白质颗粒的表达。这些颗粒随后可以用于筛选或测试以鉴别具有特定增强特性的TCR形式。随后可以分离任何研究中具有增强特性的颗粒。编码这些TCR的DNA随后可以通过PCR扩增并且确定其序列。已知外源多肽的高表达水平对于宿主细胞可能是有毒的。在这样的情况下,必须发现对外源多肽更耐受的宿主株,或宿主细胞中表达水平必须限制在能够耐受的水平。例如,Beekwilder等在(1999)Gene228(1-2)23-31中报道了只有含缺失或琥珀终止密码子的突变形式的土豆蛋白酶抑制剂(PI2)能够成功地从噬菌体展示文库中得到选择。在所述情况下,这里的实施例中报道的工作过程中的观察结果说明,至少在大肠杆菌的一些菌株中,限制本发明的蛋白颗粒展示的TCR的表达水平可能是需要的。这样,在重复几轮培养后实施例4中选择的A6TCR是源自其中的噬菌粒相对于最初导入的已经发生突变的细胞。该突变在TCRβ链中已创建了一个“乳白”终止密码子。该密码子是由所采用的大肠杆菌菌株的核糖体以低频率“读通”导致在这一位点上插入色氨酸残基以及全长β链表达的明显降低的整体水平。存在多种在可能适于限制scTCR或dTCR的一条或两条TCR链表达水平的宿主中限制特定表达系统外源多肽表达水平的策略。例如使用弱启动子序列—获得的诸如TCRα或β链的特定基因产物的表达水平,可以通过使用不同强度的启动子序列进行定制。λ噬菌体PRM是弱启动子的例子。突变的核糖体结合位点(RBS’s)-与诸如TCRα或β链等基因产物相连的RBS中的单一核酸进行突变,这可以导致降低的表达水平。例如,将野生型AGGA序列突变成AGGG。突变的“起始密码子”—将与诸如TCRα或β链等基因产物相连的单一核酸的起始密码子进行突变也可以导致降低的表达水平。例如,将野生型AUG起始子突变为GUG。错义抑制突变—这些突变插入TCRβ链编码区内部。实例包括“乳白”终止子(UGA),这一“不严密”的终止子导致色氨酸的低频插入以及编码序列其余部分的读通。代谢物介导的启动子强度调节—处于某些启动子控制下的诸如TCRα或β链等基因产物的表达水平可以通过向含该启动子的细胞添加相关代谢物进行下调。例如,可以使用添加葡萄糖下调处于Lac启动子控制下的基因产物的表达。密码子使用—细菌细胞和例如哺乳动物细胞相对其用于编码某个氨基酸的密码子具有“偏好”。例如,细菌细胞最常见使用CGU密码子编码精氨酸,而真核细胞最常见使用AGA。通过采用包含所采用的表达载体的多个较低偏好性的密码子的DNA序列可以降低诸如TCRα或β链等基因产物的表达水平.与上述下调基因产物表达相关的详细描述可以参见Glass1982年所著的《基因功能—大肠杆菌及其遗传元素》(GeneFunction-E.colianditsheritableelements,CroomHelm)以及Rezinoff1980年所著《操纵子》第2版(TheOperon2ndEdition,ColdSpringHarborLaboratory)。同样已知,为细菌培养物提供相对高浓度的糖(诸如蔗糖)可以提高可溶蛋白的周质表达水平(参见例如Sawyer等,(1994)ProteinEngineering7(11)1401-1406)。表达以后,scTCR多肽可变结构域序列的正确配对优选地由scTCR的胞外恒定结构域中二硫键的导入进行辅助。不受理论限制,相信在折叠过程中新的二硫键为scTCR提供额外的稳定性,从而有助于第一和第二片段的正确配对。同样如上面提到的,对于dTCR噬菌体展示而言,dTCR多肽对之一最终如单体多肽展示在噬菌体一样表达,并且dTCR多肽对的另一条链在相同的宿主细胞中共表达。随着噬菌体颗粒自聚合,所述两条多肽自我连接如二聚体展示在噬菌体上。此外,在本发明这一方面的优选实施方案中,多肽对连接过程中的正确折叠如上所述由恒定序列之间的二硫键进行辅助。具有链间二硫键的dTCR的噬菌体展示过程的进一步细节在这里的实施例部分说明。另外,噬菌体展示的dTCR的第一条链可以首先表达,以及第二条链多肽可以在随后的步骤中与表达的噬菌体接触,从而在噬菌体表面连接为功能性dTCR。核糖体展示是用于生物淘选以鉴别具有如针对目标肽-MHC复合物高特异性等需要性质的TCR的优选的体外TCR展示方法。首先,使用上述技术构建了编码突变的scTCR或dTCR多肽的多样性阵列的DNA文库。DNA文库随后与RNA聚合酶接触以产生互补的mRNA文库。可选择地,对于mRNA展示技术来说,mRNA序列随后可以与包括嘌呤霉素结合位点的DNA序列连接。这些遗传构件随后在允许所述scTCR多肽或dTCR对的第一多肽翻译的条件下与核糖体体外接触。在dTCR的情况下,多肽对的第二多肽独立表达并与核糖体展示的第一多肽接触,为了两条链的结合,优选地由恒定结构域之间二硫键的形成进行辅助。另外,编码TCR两条链的mRNA可以在允许TCR链翻译的条件下与核糖体体外接触,由此形成了展示dTCR的核糖体。这些展示scTCR或dTCR的核糖体随后可以用于筛选或测试以鉴别具有特异性增强特性的TCR变体。随后可以分离任何具有增强特性的颗粒。编码这些TCR的mRNA随后可以使用逆转录酶转换成互补的DNA序列。该DNA随后可以通过PCR进行扩增并确定其序列。其它方面本发明的展示一种scTCR或一种dTCR(优选地由对应于人的序列的恒定和可变序列组成)的蛋白质颗粒可以以充分纯净的形式或以纯化的或分离的制剂的形式提供。例如,可以以与其他蛋白质充分分离的形式提供。本发明的展示多种scTCR或多种dTCR的噬菌体颗粒可以以多价复合物的形式提供。因而,本发明在一个方面提供了多价T细胞受体(TCR)复合物,该复合物包括如这里所述的展示多种scTCR或dTCR的噬菌体颗粒。所述多种scTCR或dTCR的每一种优选地是相同的。本发明的进一步方面提供了检测TCR配体复合物的方法,该方法包括a.提供了本发明的一种展示TCR的蛋白质颗粒;b.将展示TCR的噬菌体与假定的配体复合物接触;以及检测展示TCR的蛋白质颗粒与假定的配体复合物的结合。适于由以上方法鉴别的TCR配体包括但不限于肽-MHC复合物。具有增强特性的TCR变体的分离本发明的进一步的方面是鉴别具有特定特性的TCR的方法,所述方法包括展示在蛋白质颗粒上的TCR的多样性文库经受选出所述特性的选择过程,以及分离展示具有所述特性的TCR的蛋白质颗粒,以及可选择地进行扩增过程以增加分离的颗粒,和/或测量所述特性的筛选过程,鉴别那些展示具有所需特性的TCR的蛋白质颗粒并且分离这些蛋白质颗粒,以及可选择地进行扩增过程以增加分离的颗粒。随后可以获得编码变体TCR的DNA序列并通过PCR进行扩增以测定序列。可以增强的特性包括但不限于配体结合亲和力和构件稳定性。筛选用途本发明的展示TCR的蛋白质颗粒能在为鉴别包括TCR介导的细胞免疫突触的抑制剂在内的调节剂而设计的筛选方法中采用。如精通本领域的人员所知,存在多种为此类蛋白质之间相互作用筛选提供适当基础的测试形式。如AlphaScreenTM的增强型发光亲近匀相测定系统(AmplifiedLuminescentProximityHomogeneousAssaysystems),依赖于用一层能结合受体与配体蛋白的水凝胶包被的“供体”和“受体”小珠的使用。这些受体与配体分子之间的相互作用将这些小珠拉近。当这些小珠遭受激光时,“供体”小珠中的光敏剂将周围的氧转变成更激化的单线状态。单线态的氧分子扩散以与“受体”小珠中的化学发光剂反应,这进一步激活包含在该小珠中的荧光团。荧光团随后发射520-620nm的光,这是受体-配体已发生相互作用的信号。受体-配体相互作用的抑制剂的存在导致这一信号减弱。表面等离子体谐振(SurfacePlasmonResonance,SPR)是一种临界面光学测定法,其中一种结合伴侣(通常是受体)固定在“芯片”(传感器表面)并检测另一种可溶的并流经芯片表面的结合伴侣(通常是配体)的结合。配体的结合导致芯片表面附近蛋白浓度的提高,这引起该区域中折射系数的改变。芯片表面的构成使折射系数的改变可以通过表面等离子体谐振检测,表面等离子体谐振是一种光学现象,由此以一定入射角照射在金属薄层上的光由于振荡的表面电荷密度(表面等离子体)波的谐振激励产生强度降低的反射光束。谐振对金属膜远侧的折射系数改变极其敏感,并且这是用于检测固定的和可溶的蛋白之间结合的信号。允许方便使用分子相互作用的SPR检测和数据分析的系统有商业现货。实例是IasysTM装置(Fisons)和BiacoreTM装置。其他的临界面光学测定法包括Woodbury和Venton在J.Chromatog.B.725113-137(1999)中更详细描述的全内反射荧光(TIRF)、共振镜(RM)和光栅耦合传感器(GCS)。亲近闪烁检测(SPA)已被用于为CD28和B7之间低亲和力相互作用的抑制剂(Kd约为4μM(VanderMerwe等,J.Exp.Med.185393-403(1997),Jenh等,AnalBiochem165(2)287-93(1998))而筛选化合物库。SPA是一种利用来自某些放射性同位素的β射线将能量传输给固定在指示器表面的闪烁体的放射性测定法。溶液中β粒子的短传输距离保证了只有当β粒子在极其接近的范围内发射给闪烁体才会发生闪烁。当用于蛋白质之间相互作用时,一种相互作用伴侣用放射性同位素标记,而另一种或与包含闪烁体的小珠结合,或与闪烁体共同包被在表面。如果该测定法可以最优设置,放射性同位素应与闪烁体足够接近以使只有当两种蛋白质之间发生结合时光子发射才被激活。本发明的进一步的一个方面是鉴别本发明的展示TCR的蛋白质颗粒与TCR结合配体之间相互作用的抑制剂的方法,该方法包括在待测化合物存在或不存在的条件下将展示TCR的蛋白质颗粒与TCR结合配体接触,以及确定待测化合物的存在是否降低展示TCR的蛋白质颗粒与TCR结合配体的结合,这样的降低认为鉴别了一种抑制剂。本发明的进一步的一个方面是鉴别本发明的展示TCR的蛋白质颗粒与TCR结合配体(例如MHC-肽复合物)之间相互作用的潜在抑制剂的方法,该方法包括将展示TCR的蛋白质颗粒或TCR结合配体伴侣与待测化合物接触,以及确定待测化合物是否结合展示TCR的蛋白质颗粒和/或TCR结合配体,这样的结合认为鉴别了一种潜在抑制剂。本发明的这一方面可以在诸如使用BiacoreTM系统进行的那些临界面光学测定法中得到特定的应用。高亲和性TCR本发明也提供了具有针对特定TCR配体比野生型TCR更高亲和性的突变的TCR。预计这些高亲和性TCR对于疾病的诊断和治疗具有特殊用途。如这里所使用的术语“高亲和性TCR”是指与具体TCR配体相互作用并且如通过表面等离子体谐振测量的具有针对所述TCR配体的Kd值小于相应的天然TCR的Kd值、或如通过表面等离子体谐振测量的具有针对所述TCR配体的消耗速率(off-rate,Koff)小于相应的天然TCR的消耗速率的突变的scTCR和dTCR。本发明的高亲和性scTCR或dTCR优选地是相对于天然TCR在至少一个互补决定区和/或骨架区发生突变。在本发明的一个方面,一种特定高亲和性TCR对其具有特异性的TCR配体是肽-MHC复合物(pMHC)。本发明的另一个方面,一种特定高亲和性TCR对其具有特异性的TCR配体是MHC类别。本发明的进一步的一个方面,一种特定高亲和性TCR对其具有特异性的TCR配体是HLA-A2tax肽(LLFGYPVYV)(SEQID21)复合物。本发明的进一步的一个方面,一种特定高亲和性TCR对其具有特异性的TCR配体是HLA-A2NY-ESO肽(SLLMITQC)(SEQID22)复合物。高亲和性scTCR或高亲和性dTCR链的一条或两条链可以用造影化合物(例如适于诊断目的的标记物)标记。这样的经标记的高亲和性TCR在用于检测选自CD-1抗原复合物、细菌超抗原以及MHC-肽/超抗原复合物的TCR配体的方法中是有用的,该方法包括将TCR配体与该配体特异的高亲和性TCR(或多体高亲和性TCR复合物)接触;以及检测与所述TCR配体的结合。在四聚高亲和性TCR复合物中(例如使用生物素化的异源二聚体形成)可以使用荧光链亲和素(商业现货)来提供可检测的标记。荧光标记的四聚体适于在FACS分析中使用,例如用以检测携带高亲和性TCR对其具有特异性的肽的抗原提呈细胞。可以对本发明的可溶性高亲和性TCR进行检测的另一种方式是通过TCR特异性抗体,尤其是单克隆抗体的使用。存在多种商业提供的抗TCR抗体,如αF1和βF1,它们分别识别α和β链的恒定结构域。另外或此外,本发明的高亲和性TCR(或其多价复合物)可以与一种治疗性物质(例如,用于杀伤细胞的毒性部分,或如白介素或细胞因子的免疫激活物质)相连(例如共价或其他方式连接)。本发明的多价高亲和性TCR复合物与非多体的野生型或高亲和性的TCR异源二聚体相比,可以具有增强的与TCR配体结合的能力。因而,按照本发明的多价高亲和性TCR复合物对于提呈特定抗原细胞的体内或体外跟踪或靶向特别有用,并且可用作产生进一步具有这样用途的多价高亲和性TCR复合物的中间体。因此,高亲和性TCR或多价高亲和性TCR复合物可以作为体内使用的制药上允许的配方提供。本发明也提供了一种向靶细胞递送治疗性物质的方法,该方法包括在允许所述高亲和性TCR或多价高亲和性TCR复合物与所述靶细胞结合的条件下,将潜在的靶细胞与按照本发明的高亲和性TCR或多价高亲和性TCR复合物接触,所述高亲和性TCR或多价高亲和性TCR复合物是TCR配体特异的并且具有与其相连的治疗性物质。尤其,可溶的高亲和性TCR或多价高亲和性TCR复合物可以用于向提呈特定抗原细胞的位置递送治疗性物质。这在多种情况下,尤其在对抗肿瘤时,可能是有用的。治疗性物质可以这样进行递送以使其局部行使其作用而不是仅作用于其结合的细胞。这样,设想了一种与肿瘤特异性高亲和性TCR或多价高亲和性TCR复合物相连的抗肿瘤分子的特殊策略。许多治疗性物质可以用于这一用途,例如放射性化合物、酶(例如穿孔素)或化疗物质(例如顺铂)。为确保在所需位置发挥毒性作用,毒素可以位于与链亲和素相连的脂质体内部,这样该化合物被缓慢释放。这能防止体内运输过程中的破坏作用并确保在TCR与相关抗原提呈细胞结合之后毒素具有最大作用。其他适当的治疗性物质包括·小分子细胞毒物质,即分子量小于700Da的具有杀伤哺乳动物细胞能力的化合物。这样的化合物也可以包括具有细胞毒作用的有毒金属。此外,需要理解,这些小分子细胞毒物质也包括前药,即在生理条件下分解或转化以释放细胞毒物质的化合物。这样的物质的例子包括顺铂、美登素衍生物、雷可霉素(rachelmycin)、刺孢霉素(calicheamicin)、多西他赛、依托泊苷、吉西他滨、异环磷酰胺、依立替康、美法仑、米托葸醌、卟非姆钠光敏素II(porfimersodiumphotofrinII)、替莫唑胺(temozolmide)、托泊替康、三甲曲沙葡糖醛酸脂(trimetrexateglucuronate)、auristatinE长春新碱(auristatinEvincristine)以及阿霉素;·细胞毒素肽,即具有杀伤哺乳动物细胞能力的蛋白质或其片段。例子包括蓖麻毒素、白喉毒素、假单胞菌细菌外毒素A、DNA酶和RNA酶;·放射性核素,即衰变并同时发射一个或多个α或β粒子或γ射线的元素的不稳定同位素。例子包括碘131、铼186、铟111、钇90、铋210和213、锕225以及砹213;螯合剂可以用于促进这些放射性核素与高亲和性TCR或其多聚体的结合;·前药,如抗体引导的酶前药;·免疫刺激剂,即刺激免疫反应的部分。例子包括如IL-2、如IL-8、血小板因子4、黑素瘤生长刺激蛋白的趋化因子等等的细胞因子,抗体或其片段,补体激活因子,异种蛋白结构域,异源蛋白结构域,病毒/细菌蛋白结构域以及病毒/细菌肽。本发明的可溶高亲和性TCR或多价高亲和性TCR复合物可以与能将前药转变为药物的酶连接。这使得该前药只在需要的位置转变为药物(即由sTCR靶向的)。多数疾病的治疗可以通过经可溶高亲和性TCR特异性的药物局部化得到潜在地增强。例如,预计这里所公开的高亲和性HLA-A2-tax(LLFGYPVYV)(SEQID21)特异的A6TCR可以在HTLV-1的诊断和治疗方法中运用,并且这里所公开的高亲和性HLA-A2-NY-ESO(SLLMITQC)(SEQID22)特异的NY-ESOTCR可以在癌症的诊断和治疗方法中运用。存在药物的病毒性疾病(例如HIV、SIV、EBV、CMV)可能得益于在感染细胞附近释放或激活的药物。对于癌症来说,肿瘤或肿瘤转移附近的定位能增强毒素或免疫刺激剂的作用。在自身免疫病中,免疫抑制药物可以缓慢释放,这样具有在更长的时间跨度上更加局部性的作用而对主体的整体免疫能力影响最小。在防止移植排斥的情况下,免疫抑制药物的作用能以同样方式进行优化。对于疫苗递送而言,疫苗抗原可以局限在抗原提呈细胞附近,从而增强抗原的功效。该方法也可以应用于造影目的。本发明的可溶高亲和性TCR可以通过与特异TCR配体结合并从而抑制T细胞活化用于调节T细胞活化。涉及T细胞介导的炎症和/或组织损伤的自身免疫病(例如I型糖尿病)可能可以按照这一方法处理。为了这一应用,需要由相关pMHC提呈的特异肽表位的知识。按照本发明的治疗性或造影的高亲和性TCR通常作为通常应包括制药上允许的载体的无菌的药物组合物的一部分提供。该药物组合物可以是任何适当的形式的(取决于对患者给药所需要的方法)。它可以以单位剂量的形式(通常应在密封容器中提供)和作为试剂盒的一部分提供。这样的试剂盒通常会(虽然不是必须地)包括使用指南。它可以包括多个所述的单位剂量形式。所述药物组合物可以适合于通过任何适宜的途径给药,例如注射、透皮或通过吸入,优选地是注射(包括皮下注射、肌肉注射或最优选地静脉内注射)途径。这样的组合物可以通过任何药剂学领域内已知的方法进行制备,例如通过在无菌条件下将活性组分与载体或赋形剂混合。依赖于需要治疗的疾病或机能紊乱、需要治疗的个体的年龄和健康状况等等因素,本发明的物质的剂量可以在广阔的范围内变化,并且医生应该最终决定使用的适当剂量。本发明也提供了获得高亲和性TCR链的方法,该方法包括在引起高亲和性TCR链表达的条件下孵育这样的宿主细胞并随后分离多肽。本发明的每个方面的优选的特征正如对每个其他方面作必要改动。这里提到的在先技术文献结合在法律许可的最完整的范围内。实施例在以下实施例中进一步描述了本发明,这些实施例未以任何方式限制本发明的范围。下面对附图进行了说明,其中图1a和1b分别表示突变以引入半胱氨酸密码子的可溶的A6TCRα链和β链的核酸序列。阴影表示引入的半胱氨酸密码子。图2a表示包含用于产生新的链间二硫键的T48→C突变(加下划线的)的A6TCRα链胞外氨基酸序列,图2b表示包含用于产生新的链间二硫键的S57→C突变(加下划线的)的A6TCRβ链胞外氨基酸序列。图3描述了将TCRα和β链克隆进噬菌粒载体。图表描述了噬菌体展示载体。RSB是核糖体结合位点。S1或S2是用于将蛋白质分泌到大肠杆菌周质中的信号肽。星号*表示翻译终止密码子。TCRα链或β链的任何一条链可以与噬菌体外被蛋白融合,虽然所述图表中只有TCRβ链与噬菌体外被蛋白融合。图4详述了噬菌粒pEX746A6的DNA序列。图5细菌外被蛋白与异源二聚A6TCR的噬菌体颗粒融合蛋白在大肠杆菌中的表达。异源二聚A6TCRgIII的融合蛋白使用免疫印迹检测。噬菌体颗粒由大肠杆菌XL-1-Blue制备并用PEG/NaCl浓缩。样品加载在还原或非还原加样缓冲液中。泳道1是含正确序列克隆7的样品,泳道2是在α链编码基因中含缺失的克隆14的样品。异源二聚A6TCRgIII融合蛋白在125kDa处检得。图6说明了展示在噬菌体上的异源二聚A6TCR的pMHC肽复合物结合活性的ELISA检测。克隆7特异性结合HLAA2-Tax复合物。克隆14不能结合任何pMHC,因为没有TCR与该噬菌体颗粒结合。图7a单链A6TCR-C-κDNA核糖体展示构件的示意性图解。图7b和7c分别详述了pUC19中编码的单链A6TCR-C-κDNA核糖体展示构件的完整的DNA编码链和氨基酸序列。图8详述了pUC19-T7的DNA序列。图9详述了克隆到pUC19-T7中的单链A6TCR-C-κDNA核糖体展示构件的DNA序列。图10显示通过使用Ambion兔网状细胞溶解产物的体外翻译的单链A6TCR-C-κ检测的免疫印迹。图11得自核糖体展示反应的小珠上的单链A6TCR-C-κmRNA的RT-PCR。图12a详述了A6TCR克隆9突变的β链的DNA序列;突变的核酸用粗体表示。图12b详述了A6TCR克隆9突变的β链的氨基酸序列,对应于引入的乳白终止密码子的位置用星号*表示。图13详述了A6TCR克隆49突变的β链的DNA序列;突变的核酸用粗体表示。由于这是一种“沉默”突变,最终的氨基酸序列中没有由这一突变引入变化。图14a详述了A6TCR克隆134突变的A6TCRβ链的DNA序列;突变的核酸用粗体表示。图14b详述了通过BIAcore测定法检测的A6TCR克隆134突变的A6TCRβ链的氨基酸序列;突变的氨基酸用粗体表示。图14c详述了通过噬菌体ELISA测定法检测的A6TCR克隆134突变的A6TCRβ链的氨基酸;突变的氨基酸用粗体表示。图15A6TCR克隆134与HLA-A2Tax和HLA-A2NY-ESO结合的BIAcore数据。图16用于测定A6TCR克隆134与HLA-A2Tax结合的Toff的BIAcore数据。图17a和17b分别表示NY-ESOTCR的突变的α和β链的DNA序列。图18a和18b分别表示NY-ESOTCR的突变的α和β链的氨基酸序列。图19a和19b分别详述了组合在pEX746NY-ESO噬菌粒中的NY-ESOTCRβ链的DNA和氨基酸序列。图20表示在噬菌体ELISA测定法中展示NY-ESOTCR的噬菌体颗粒与HLA-A2-NY-ESO的特异结合。图21表示并入编码与DRA0101序列3’端相连的Fos二聚化肽的密码子的DR1α链的DNA序列。阴影表示Fos密码子并且生物素化标签密码子用粗体表示。图22表示Sf9昆虫细胞中用于II类HLA-肽复合物表达的pAcAB3双顺反子载体的DNA序列。用于插入HLAα链的BglII限制性位点(AGATCT)和用于插入HLAβ链的BamHI限制性位点(GGATCC)用阴影表示。图23表示并入编码与DRB0401序列3’端相连的Jun二聚化肽的密码子和编码与DRB0401序列5’端相连的HLA-荷肽密码子的DR1β链的DNA序列。阴影表示Jun密码子,HLA-荷载的FluHA肽密码子用下划线表示。图24表示高亲和性A6TCR克隆134与如以下包被的流动池结合的BIAcore示踪流动池1(FC1)-空白流动池2(FC2)-HLA-A2(LLGRNSFEV)(SEQID23)流动池3(FC3)-HLA-A2(KLVALGINAV)(SEQID24)流动池4(FC4)-HLA-A2(LLGDLFGV)(SEQID25)图25表示高亲和性A6TCR克隆134与如以下包被的流动池结合的BIAcore示踪流动池1(FC1)-空白流动池2(FC2)-HLA-B8(FLRGRAYGL)(SEQID26)流动池3(FC3)-HLA-B27(HRCQAIRKK)(SEQID27)流动池4(FC4)-HLA-Cw6(YRSGIIAVV)(SEQID28)图26表示高亲和性A6TCR克隆134与如以下包被的流动池结合的BIAcore示踪流动池1(FC1)-空白流动池2(FC2)-HLA-A24(VYGFVRACL)(SEQID29)流动池3(FC3)-HLA-A2(ILAKFLHWL)(SEQID30)流动池4(FC4)-HLA-A2(LTLGEFLKL)(SEQID31)图27表示高亲和性A6TCR克隆134与如以下包被的流动池结合的BIAcore示踪流动池1(FC1)-空白流动池2(FC2)-HLA-DR1(PKYVKQNTLKLA)(SEQID32)流动池3(FC3)-HLA-A2(GILGFVFTL)(SEQID33)流动池4(FC4)-HLA-A2(SLYNTVATL)(SEQID34)图28表示高亲和性A6TCR克隆134与如以下包被的流动池结合的BIAcore示踪流动池1(FC1)-空白流动池4(FC4)-HLA-A2(LLFGYPVYV)(SEQID21)图29a和29b表示可溶高亲和性NY-ESOTCR和HLA-A2NY-ESO之间相互作用的Biacore图。图30a和30b表示可溶“野生型”NY-ESOTCR和HLA-A2NY-ESO之间相互作用的Biacore图。图31a和31b表示突变体可溶A6TCR(克隆1)与HLA-A2Tax之间相互作用的Biacore图。图32a和32b表示突变体可溶A6TCR(克隆111)与HLA-A2Tax之间相互作用的Biacore图。图33a和33b表示突变体可溶A6TCR(克隆89)与HLA-A2Tax之间相互作用的Biacore图。图34表示突变体可溶A6TCR(包括克隆71和克隆134突变)与HLA-A2Tax之间相互作用的Biacore图。图35表示突变体可溶A6TCR(包括克隆1和βG102→A突变)与HLA-A2Tax之间相互作用的Biacore图。图36a到36c表示突变体可溶A6TCR(包括克隆89和克隆134突变)与HLA-A2Tax之间相互作用的Biacore图。图37a和37b表示突变体可溶A6TCR(包括克隆71和克隆89突变)与HLA-A2Tax之间相互作用的Biacore图。图38详述了以下A6TCR克隆的β链可变结构域氨基酸序列38a-野生型,38b-克隆134,38c-克隆89,38d-克隆1以及38e-克隆111突变的残基用粗体表示,等同的残基是可以存在于特定位置的另外残基。图39A和39BI实施例1-A6TaxTCRα和β链的引物设计和诱变以引入形成新的链间二硫键所需的半胱氨酸残基为了将TRAC*01中外显子1的A6Tax苏氨酸48突变成半胱氨酸,设计了以下引物(突变用小写字母表示)5’-CACAGACAAAtgTGTGCTAGACAT(SEQID35)5’-ATGTCTAGCACAcaTTTGTCTGTG(SEQID36)为了将TRBC1*01和TRBC2*01中外显子1的A6Tax丝氨酸57突变成半胱氨酸,设计了以下引物(突变用小写字母表示)5’-CAGTGGGGTCtGCACAGACCC(SEQID37)5’-GGGTCTGTGcaGACCCCACTG(SEQID38)PCR诱变分别使用α链引物或β链引物,如以下所述对含A6TaxTCRα或β链基因的表达质粒进行突变。将100纳克质粒与5微升10mMdNTP、25微升10xPfu缓冲液(Stratagene)、10单位Pfu聚合酶(Stratagene)混合并用H2O将终体积调节到240微升。将48微升该混合物中添加终浓度稀释为0.2μM的引物使最终反应体积达到50微升。最初95℃30秒的变性步骤之后,反应混合物在HybaidPCRexpressPCR仪上进行15个变性(95℃,30秒)、退火(55℃,60秒)与延伸(73℃,8分钟)循环。随后产物用10单位DpnI限制性酶(NewEnglandBiolabs)在37℃消化5小时。10微升消化的反应物转化感受态XL-1-Blue菌株并37℃生长18小时。挑取单菌落并在5毫升TYP+氨苄青霉素(16克/升胰蛋白胨,16克/升酵母提取物,5克/升NaCl,2.5克/升K2HPO4,100毫克/升氨苄青霉素)中生长过夜。按照生厂商的说明书在Qiagenmini-prep柱上纯化质粒DNA并在牛津大学生物化学系的测序设备上通过自动化测序检验其序列。图1a和2a分别表示α链的突变核酸和氨基酸序列,图1b和2b分别表示β链的突变核酸和氨基酸序列。实施例2-噬菌体展示载体的构建以及将A6TCRα和β链克隆进该噬菌粒载体为了在丝状噬菌体颗粒上展示含非天然链间二硫键的异源二聚A6TCR,构建了噬菌粒载体以表达由含非天然链间二硫键的异源二聚A6TCR和噬菌体外被蛋白构成的融合蛋白。这些载体包含一个pUC19起始点、一个M13起始点、一个bla(氨苄青霉素抗性)基因、Lac启动子/操纵子和一个CAP结合位点。图3中概述了这些载体的设计,该图除了可溶的A6TCRα链之外,描述了编码A6TCRβ链-g3或A6TCRβ链-g8融合蛋白的载体。实施例1中制备的并如图1a和1b中所示的含并入形成新的链间二硫键所需的附加半胱氨酸残基突变的A6TCRα和β链用作产生编码该TCR的噬菌粒的A6TCRα和β链的来源。图4中表示了所采用的噬菌粒结构(pEX746)的完整DNA序列。J.Sambrook和D.W.Russell所著的《分子克隆实验室手册》(MolecularcloningAlaboratorymanual)中描述了构建载体的分子克隆方法。表1中列举的引物被用于所述载体的构建。PCR程序的一个例子是94℃2分钟1个循环,随后94℃5秒、53℃5秒和72℃90秒25个循环,随后72℃10分钟1个循环,以及随后4℃保温。ExpandHighFidelityTaqDNA聚合酶购自Roche。表1用于构建A6TCR噬菌体展示载体的引物实施例3-细菌外被蛋白和异源二聚A6TCR的融合蛋白在大肠杆菌中的表达为了验证实施例2中产生的构件,使用先前所述用于产生展示抗体scFv的噬菌体(Li等,2000,JournalofImmunologicalMethods236133-146)及后续改进制备展示含非天然链间二硫键的A6TCR噬菌体颗粒。含pEX746A6噬菌粒(即编码可溶A6TCRα链和按实施例2中所述产生的与噬菌体gIII蛋白融合的A6TCRβ链的噬菌粒)的大肠杆菌XL-1-Blue细胞用于接种5毫升Lbatg(含100微克/毫升氨苄青霉素,12.5微克/毫升四环素和2%葡萄糖的LennoxL培养基),随后培养物37℃振荡培养过夜(16小时)。50微升过夜培养物用于接种5毫升TYPatg(TYP是16克/升蛋白胨、16克/升酵母提取物、5克/升NaCl和2.5克/升K2HPO4),随后培养物37℃振荡培养直到OD600nm=0.8。向培养物添加辅助噬菌体M13K07至终浓度5×109cfu/ml。然后培养物37℃静置孵育30分钟并随后200rpm振荡另外30分钟。随后将上述培养物的培养基换成TYPak(含100微克/毫升氨苄青霉素和25微克/毫升卡那霉素的TYP),随后培养物25℃250rpm振荡培养36到48小时。随后培养物4℃4000rpm离心30分钟。上清经0.45微米针筒过滤器过滤并4℃保存用于进一步的浓缩或分析。上清液中丝状外被蛋白和含非天然链间二硫键的异源二聚A6TCR的融合蛋白通过免疫印迹进行检测。还原和非还原加样缓冲液中约1011cfu噬菌体颗粒加载于SDS-PAGE凝胶的每个泳道上。分离的蛋白用抗M13gIII单克隆抗体进行一抗标记,随后用与辣根过氧化物酶(HRP)偶联的二抗标记。随后用Bio-Rad的Opti-4CN底物试剂盒检测HRP活性(图5)。这些数据表明二硫键连接的A6TCR克隆1是与丝状噬菌体外被蛋白(gIII蛋白)融合的。实施例4-丝状噬菌体颗粒上含非天然链间二硫键的功能性异源二聚A6TCR的检测使用噬菌体ELISA方法检测展示在噬菌体颗粒上的功能性(HLA-A2-tax结合的)A6TCR的存在。TCR-噬菌体ELISAELISA中展示A6TCR的噬菌体颗粒与固定的肽-MHC的结合用初级兔抗fd抗血清(Sigma)随后用与抗兔单克隆抗体偶联的碱性磷酸酶(AP)(Sigma)检测。平板上非特异蛋白结合位点可以用2%MPBS或3%BSA-PBS封闭。材料与试剂1.包被缓冲液,PBS2.PBS138mMNaCl,2.7mMKCl,10mMNa2HPO4,2mMKH2PO43.MPBS,3%marvel-PBS4.PBS-TweenPBS,0.1%Tween-205.底物溶液,SigmaFASTpNPP,目录号N2770方法1.NeutrAvidin亲和素包被的反应池用PBS清洗两次。2.添加25微升浓度为10微升/毫升的生物素-HLA-A2Tax或生物素-HLA-A2NYESO,并在室温下孵育30到60分钟。3.反应池用PBS清洗两次。4.添加300微升3%MPBS,并室温孵育1小时。将TCR-噬菌体悬液与等体积的3%MPBS混合并室温孵育。5.反应池用PBS清洗两次。6.添加25微升噬菌体-A6TCR/MPBS混合物,冰浴1小时。7.反应池用冰冷的PBS-Tween清洗3次,并用冰冷的PBS清洗3次。8.添加25微升冰冷的1∶1000稀释于MPBS的兔抗fd抗体,并且冰浴1小时。9.反应池用冰冷的PBS-Tween清洗3次,并用冰冷的PBS清洗3次。10.添加25微升冰冷的1∶50,000稀释于MPBS的抗兔单克隆抗体-碱性磷酸酶偶合物,并且冰浴1小时。11.反应池用冰冷的PBS-Tween清洗3次,并用冰冷的PBS清洗3次。12.向每个反应池添加150微升碱性磷酸酶黄并在405纳米处读取信号。图6中展示的结果说明,克隆1产生了展示能特异性结合其同类pMHC(HLA-A2Tax)的A6TCR的噬菌体颗粒。对该展示的A6TCR的DNA序列分析显示在TCRβ链中存在在相应的实施例2的表达载体构件序列中不存在的“乳白”终止密码子。该密码子能被所采用的大肠杆菌菌株的核糖体以低频率“读通”,导致在这一位置上插入色氨酸残基以及全长β链表达水平的显著降低。由这一现象推断,只有表达这一突变的A6TCR序列的细胞在实施例3的培养循环中得以存活,并且因此预计由原始表达载体表达的A6TCR的高水平对宿主细胞来说是有毒的。实施例5-单链TCR(scTCR)核糖体展示用以产生核糖体展示PCR模板的核糖体展示scTCR载体的构建为产生没有错误并稳定的DNAPCR模板以由此进行随后的核糖体展示实验,将核糖体展示构件克隆到易于获得的DNA质粒pUC19中。载体构建分两步进行以避免使用大的寡核苷酸引物(及与其相关的错误问题)。图7a中显示了示意形式的最终的A6scTCR-C-κDNA核糖体展示构件并且图7b中显示了其DNA和蛋白序列。这一构件可以作为PstI/EcoRI双酶切消化产物从pUC19上切离。J.Sambrook和D.W.Russell所著《分子克隆实验室手册》中描述了构建载体的分子克隆方法。表2中列举的引物用于所述载体的构建。所采用的PCR程序如下94℃2分钟1个循环,随后94℃30秒、55℃20秒以及72℃120秒25个循环,随后72℃5分钟1个循环,以及随后4℃保温。PfuDNA聚合酶购自Strategene。表2中描述了使用的寡核苷酸引物。构建pUC19-T7-步骤1下面描述了pUC19-T7的构建,这导致形成含有跟随有短的间隔区域和最适的真核Kozak序列的一个T7启动子区的pUC19载体。由于这对于兔网状细胞溶解物中任何附着序列的转录启动来说是必需的,这成为核糖体展示构件的基础部分。用于核糖体展示的序列(如A6scTCR-C-κ)可以连接在pUC19-T7载体的NcoI和EcoRI限制性位点之间。通过将反应物加热到94℃10分钟并缓慢冷却到室温,对等摩尔量的反向连接(Rev-Link)和正向连接(For-Link)进行退火。这导致形成如下所示的双链DNA复合物。5’AGCTGCAGCTAATACGACTCACTATAGGAACAGGCCACCATGGCGTCGATTATGCTGAGTGATATCCTTGTCCGGTGGTACCCTAG3’(SEQID51)5’区包含突出的与HindIII限制性位点互补的粘末端,而3’区包含与BamHI互补的粘末端。退火的寡核苷酸连接到HindIII/BamHI双酶切的pUC19中,该质粒已经通过琼脂糖凝胶电泳纯化、切离以及用Qiagen胶提取试剂盒进一步纯化。连接产物转化大肠杆菌XL-1-Blue。单独的pUC19-T7克隆进行测序以证实正确序列的存在。图8中显示了该序列。构建A6scTCR-C-κ载体-步骤2单链A6scTCR-C-κDNA序列的构建要求产生必须随后组合成一个A6scTCR-C-κ片段的3个PCR片段。这些片段包括(a.)5’区与NcoI位点邻接的A6TCRα链可变结构域和3’区与BamHI限制性位点邻接的甘氨酸丝氨酸连接物部分。该产物用引物45和50(见表2)通过载体pEX202的常规PCR产生。片段(b.)5’区与BamHI限制性位点邻接的A6TCRβ可变结构域和恒定结构域,其后跟随着甘氨酸丝氨酸连接物部分。该产物用引物72和73(见表2)通过载体pEX207的常规PCR产生。片段(c.)用引物61-60(见表2)通过p147载体的常规PCR产生的人C-κ区的一部分。所有PCR产物在1.6%TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。片段(b.)和(c.)通过其引物序列73和61(见表2)中的互补性通过常规的重叠PCR进行融合。PCR通过引物72和60(见表2)进行。PCR产物在1.6%TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。这一片段命名为(d.).片段(a.)用NcoI和BamHI双酶切,而片段(d.)用BamHI和EcoRI双酶切。pUC19-T7用NcoI和EcoRI双酶切。所有酶切的DNA产物在1.2%TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。连接酶切的pUC19-T7、片段(a.)和(d.)并转化大肠杆菌XL-1-Blue。转化子测序以证实正确的序列。图9中显示了与PstI和EcoRI位点邻接的克隆到pUC19中的A6scTCR-C-κ核糖体展示构件的序列。表2使用的寡核苷酸(购自MWG)通过体外转录翻译的scA6TCR-C-κ生产的说明用于体外转录翻译的scA6TCR-C-κPCR产物的制备这里我们描述了在生物素化的赖氨酸存在的条件下通过体外转录翻译的scA6TCR-C-κ的合成以及随后对其通过免疫印迹和用碱性磷酸酶标记的链亲和素检测的检测。使用作为模板的scA6TCR-C-κ载体和引物71和60,在常规PCR反应中制备scA6TCR-C-κPCR产物。引物60包含终止密码子以使scTCR从核糖体上释放。Pfu聚合酶(Strategene)用于提高PCR合成过程中的保真性。PCR产物在1.6%TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。使用目录号1280-1287的与AmbionPROTEINscriptII连接的转录翻译试剂盒及300纳克上述PCR产物进行转录翻译反应。按照制造商的方案进行3个转录翻译反应。所作的改动是添加来自TranscendTM非放射性翻译检测系统的生物素化的赖氨酸。反应1存在2微升生物素化的赖氨酸的情况下,300纳克scA6TCR-C-κ的反应反应2不存在2微升生物素化的赖氨酸的情况下,300纳克scA6TCR-C-κ的反应反应3存在2微升生物素化的赖氨酸的情况下,无DNA的对照反应2微升的每种反应物在4-20%的Novex梯度SDS-PAGE凝胶(Invitrogen)上分离。此外也分离了多种稀释度的对照生物素化TCR。将凝胶转印迹并用链亲和素碱性磷酸酶检测蛋白并按照TranscendTM非放射性翻译检测系统方案所述用针对碱性磷酸酶的WesternBlue稳定型底物随后进行比色法显色。图10中显示了免疫印迹结果。在无DNA对照和无生物素化赖氨酸的A6scTCR-C-κ的反应物中,如所预期的没有发现接近正确大小的条带,而在存在生物素化赖氨酸的A6scTCR-C-κ的反应物中,可以观察到近似正确大小的条带。这说明通过体外转录翻译的scA6TCR-C-κTCR的合成。scA6TCR-C-κ核糖体展示PCR产物的制备使用作为模板的A6scTCR-C-κ载体和PCR引物71和75(见表2)在常规PCR反应中制备了scA6TCR-C-κPCR产物。引物75不包含终止密码子。Pfu聚合酶(Strategene)用于提高PCR合成过程中的保真性。PCR产物在1.6%TBE琼脂糖凝胶上分离,切离正确大小的DNA条带并用Qiagen凝胶提取试剂盒纯化。核糖体展示过程scA6TCR-C-κ的转录和翻译使用与AmbionPROTEINscriptII连接的转录翻译试剂盒(目录号1280-1287)进行转录/翻译反应。转录反应物将下列转录反应物放置在0.5毫升的Ambion非粘性试管(目录号12350)中。内容物试管1(正常A6)试管2(对照)所述试管在热盖关闭的PCR模块上30℃孵育60分钟。翻译反应物将下列翻译反应物放置在0.5毫升的Ambion非粘性试管中。内容物试管1(正常A6)试管2(对照)每个试管包含足够3次50微升挑选的体积。试管混合后在热盖关闭的PCR模块上30℃孵育60分钟。30分钟之后添加3单位不含RNA酶的RQ1DNA酶(Promega)以降解试管1中最初的DNA模板,并在试管2中添加3单位不含RNA酶的RQ1DNA酶(Promega)。60分钟之后向翻译反应物2添加18微升肝素溶液并向翻译反应物1添加18微升肝素溶液。冰浴保存样品以便于针对HLA包被的小珠进行选择。磁珠的包被20微升重悬的链亲和素磁珠(Roche目录号1641778)转移到无菌的不含RNA酶的1.5毫升eppendorf试管中。小珠用磁性颗粒分离器(Roche目录号1641794)固定并去除上清液。小珠随后用100微升不含RNA酶的1×PBS(10×PBSAmbion目录号9624,AmbionH2O目录号9930)清洗。总共进行了3次PBS清洗。小珠在20微升PBS中重悬并将其平分到两个试管(每个10微升)。一个试管将用于产生对照封闭的小珠,另一个试管用于产生HLA-A2-Tax包被的小珠。向对照小珠试管添加80微升BSA/生物素溶液并混合。BSA/生物素溶液配制如下。向990微升含0.1%BSA(Ambion超纯,目录号2616)的PBS添加10微升0.2MTris碱0.1M生物素溶液。还添加了20微升肝素溶液(1×PBS中含138mg/ml肝素(Sigma))并混合溶液。小珠间歇混合室温孵育1小时。随后3次用100微升PBS清洗并在10微升含0.1%BSA的PBS中重悬。HLA-TAX包被的小珠制备如下。向10微升小珠添加40微升HLA-A2-Tax(如WO99/60120中所述制备的1.15mg/ml)并混合。小珠室温孵育15分钟并随后添加20微升BSA(50mg/ml,Ambion目录号2616)和20微升肝素溶液(见上述)并混合。小珠孵育另外45分钟,随后添加20微升BSA/生物素溶液。随后小珠3次用100微升PBS清洗并在10微升含0.1%BSA的PBS中重悬。使用磁珠的淘选将scA6TCR翻译反应物分成3份50微升体积的试样量并且每份试样量获得2微升任何一种下列小珠对照(无HLA)HLA-A2-TaxHLA-A2-Tax加10微克可溶的scA6TCR对照翻译反应物也分成3份50微升体积的试样量并且每份试样量获得2微升任何一种下列小珠对照(无HLA)HLA-A2-TaxHLA-A2-Tax加10微克可溶的scA6TCR这产生了总共6个试管。试管在PCR模块上伴随间歇的混合5℃孵育60分钟。随后3次用100微升冰冷的缓冲液(PBS,5mM醋酸镁和0.2%Tween(Sigma,不含RNA酶))清洗小珠。每份试样量小珠随后在50微升含1微升(40单位)Superasin和1微升(1单位)RQ1DNA酶的1×RQ1DNA酶消化缓冲液中重悬。小珠在PCR模块上30℃孵育30分钟。随后小珠用100微升冰冷的缓冲液(PBS,5mM醋酸镁和0.2%Tween)清洗3次并用冰冷的H2O清洗1次。小珠重悬于10微升不含RNA酶的H2O。小珠随后进行冷藏以准备进行RT-PCR。核糖体展示反应中获得的磁珠上的scA6TCR-C-κmRNA的RT-PCR如制造商方案中所述,使用Titan单试管RT-PCR试剂盒(目录号1855476)进行磁珠上的RT-PCR反应。连同引物45和7以及0.3微升SuperasinRNA酶抑制剂,每个RT-PCR反应中添加2微升磁珠。为每个RT-PCR反应设置第二个单PCR反应,该反应的差别在于除了Roche高保真聚合酶不含逆转录酶。所述第二个反应作为对DNA污染的对照。此外使用scA6TCR-C-κ载体的Ing设置了RT-PCR的阳性对照。反应物循环如下。通过样品50℃孵育30分钟,随后通过在PCR模块上94℃孵育3分钟以灭活逆转录酶进行RT-PCR步骤。反应物如下共进行38个PCR循环94℃30秒55℃20秒68℃130秒PCR反应72℃孵育4分钟结束。在所有的核糖体展示步骤过程中非常注意以避免RNA酶污染。RT-PCR和PCR反应物在1.6%的TBE琼脂糖凝胶上分离,这可以参见图11。对凝胶的分析显示,不存在DNA污染并且所有PCR产物源自mRNA。泳道2中正确大小的DNA条带说明,通过HLA-A2-Tax包被的小珠选出了核糖体展示的scA6TCR-C-κ。泳道3显示,我们可以通过添加可溶的scA6TCR来抑制这一核糖体展示的scA6TCR-C-κ的特异性选择。相对于泳道2中未抑制的样品,泳道3中条带亮度的明显降低说明了这一点。对于对照的无HLA包被的小珠,没有发现核糖体展示的scA6TCR-C-κ的结合。实施例6展示在噬菌体颗粒上的A6TCR的序列分析和提高展示特性的方法通过PCR和分子克隆构建了在噬菌体上展示A6TCR的载体之后,对能产生展示A6TCR的噬菌体的细菌克隆如实施例4所述通过噬菌体ELISA进行筛选。在ELISA结合测定法中鉴定了3个与HLA-A2-tax结合的不同的克隆。这些克隆都包含了“野生型”A6TCRDNA的或与调节序列相联的突变,下表中描述了这些突变得自对噬菌体展示的TCRA6筛选的功能性克隆这些克隆都包含了似乎引起A6TCRβ链表达水平降低的突变。我们推测,作为由TCR高表达水平引起的细胞毒性的结果,低表达克隆优于高表达克隆被选择。实施例7-A6TCRCDR3区域的诱变A6TCR的CDR3区域是引入突变以研究产生高亲和性突变体的可能性的靶标。使用了重叠PCR对α和βCDR3的序列进行改进以用寡核苷酸YOL54,5′CAGCTGGGGGAAGCTTCAGTTTGGAGCAG3′(SEQID64)和YOL55,5′CTGCTCCAAACTGAAGCTTCCCCCAGCTG3′(SEQID65)对α链引入唯一的限制性位点HindIII,并用YOL565′GTACTTCTGTGCCTCGAGGCCGGGACTAG3′(SEQID66)和YOL575′CTAGTCCCGGCCTCGAGGCACAGAAGTAC3′(SEQID67)对β链引入唯一的限制性位点XhoI。使用了PCR以引入亲和力成熟的突变。A6TCR克隆9(在β链CDR3序列中并入一个引入的乳白密码子)用作模板DNA的一个来源,并且TCR链用突变引物(在以下的表中进行了详述)和YOL225’CATTTTCAGGGATAGCAAGC3’(SEQID68)(β链)或YOL135’TCACACAGGAAACAGCTATG3’(SEQID69)(α链)进行扩增。用于在A6α和β链的CDR3中引入突变的引物α链片段用NcoI和HindIII消化并用Qiagen试剂盒重新纯化,并且载体通过用NcoI和HindIII消化克隆9,随后用Qiagen试剂盒凝胶纯化进行制备。β链片段用XhoI和NotI消化并用Qiagen试剂盒重新纯化,并且载体通过用XhoI和NotI消化克隆9,随后用Qiagen试剂盒凝胶纯化进行制备。纯化的插入片段和载体以3∶1的摩尔比与T4连接酶缓冲液、T4连接酶和不含核酶的水混合。连接反应16℃水浴过夜。对于每个突变文库,按照制造商提供的方案,总共0.5到1微升的纯化的连接产物以每40微升电转化感受态细胞(Stratagen)0.2微克DNA的比例电转化大肠杆菌TG1。电转化后,细胞立即用960微升SOC培养基37℃重悬并平铺于含补充了100微克/毫升氨苄青霉素和2%葡萄糖的YTE(1升中含15克琼脂、18克NaCl、10克胰蛋白胨和5克酵母提取物)的244mm×244mm组织培养皿。平皿30℃孵育过夜。随后,用5毫升补充了15%甘油的DYT(1升中含16克胰蛋白胨、10克酵母提取物和5克NaCl,125℃高压灭菌15分钟)从平皿上刮取细胞。为了制备展示A6TCR的噬菌体颗粒,将500到1000微升的文库储存液接种于500毫升DYTag(含100微克/毫升氨苄青霉素和2%葡萄糖的DYT)。培养物生长到OD(600nm)达到0.5。100毫升培养物用辅助噬菌体(M13K07(Invitrogen)或HYPERPHAGE(ProgenBiotechnik,GmbH69123Heidelberg))感染并37℃水浴孵育30分钟。用100毫升DYTak(含100微克/毫升氨苄青霉素和25微克/卡那霉素的DYT)替换培养基。随后培养物25℃振荡(300rpm)孵育20到36小时。实施例8高亲和性A6TCR突变体的分离使用两种不同的方法进行高亲和性A6TCR突变体的分离。第一种方法包括使用Maxisorp免疫试管(Invitrogen)选择能与HLA-A2Tax复合物结合的展示突变A6TCR的噬菌体颗粒。免疫试管通过1到2毫升含10微克/毫升链亲和素的PBS室温过夜进行包被。试管用PBS清洗两次,并随后添加1毫升含5微克/毫升生物素化HLA-A2Tax复合物的PBS并室温孵育30分钟。除了以下改动之外,高亲和性结合物选择的剩余方案如先前所述(Li等.(2000)JournalofImmunologicalMethods236133-146)。进行3轮或4轮选择。对于第一轮选择的生物素化HLA-A2Tax复合物的浓度是5微克/毫升,对于第二轮的浓度是0.5微克/毫升,第三轮的浓度是0.05微克/毫升,第四轮是0.005微克/毫升。对于选择而言,在第一轮和第二轮选择中使用了M13K07辅助噬菌体,在随后的选择中使用了超噬菌体。采用的第二种方法是在溶液中选择能与HLA-A2Tax复合物结合的展示突变A6TCR的噬菌体颗粒。按照制造商的方案预洗了链亲和素包被的顺磁小珠(DynalM280)。对于第1轮、第2轮、第3轮和第4轮选择,以1012到1013cfu的浓度展示突变A6TCR的噬菌体颗粒分别与浓度为2×10-8M,2×10-9M,2×10-10M和2×10-11M的生物素化HLA-A2Tax复合物预混。展示A6TCR的噬菌体颗粒与HLA-A2Tax复合物的混合物轻轻旋转室温孵育1小时,用200微升(第1轮)或50微升(第2、3、4轮)链亲和素包被的M280磁珠捕获与生物素化HLA-A2Tax复合物结合的展示A6TCR的噬菌体颗粒。噬菌体颗粒捕获后,使用Dynal磁颗粒浓缩器频繁洗涤磁珠(3次用PBSTween20,2次用含2%无脂奶粉的PBSTween20,2次用PBS,2次用含2%无脂奶粉的PBS,以及2次用PBS)。最后的清洗以后,磁珠在1毫升新制备的pH11.5的100mM乙三胺中重悬并伴随着轻轻旋转室温孵育5到10分钟。从磁珠上洗脱的噬菌体颗粒立即用300微升pH7.0的1MTris-HCl中和。按照先前描述的方法,一半洗脱液用于感染10毫升新制备的OD(600nm)值0.5的大肠杆菌TG1以扩增选出的噬菌体颗粒(Li等,(2000)JournalofImmunologicalMethods236133-146)。在第3轮和第4轮筛选后,从平皿上挑取95个单菌落并用于接种于96孔板上100微升DYTag中。培养物37℃振荡孵育过夜。随后用2到5微升的过夜培养物亚接种于100微升DYTag中,并37℃振荡孵育2到3小时或直至培养物变混浊。为了用辅助噬菌体感染细胞,用25微升含5×109cfu辅助噬菌体的DYTag感染培养物并37℃孵育30分钟。用DYTak替换培养基。平板在300rpm振荡条件下25℃孵育20到36小时。通过4℃3000g离心10分钟沉淀细胞。上清液通过如下所述的竞争性噬菌体ELISA用于筛选高亲和性A6TCR突变体。链亲和素包被的Nunc-ImmunoMaxisorp反应池用PBS清洗两次。每个反应池添加25微升5微克/毫升生物素化的HLA-A2-Tax复合物并室温孵育30到60分钟,随后用PBS清洗两次。通过添加300微升含3%无脂奶粉的PBS并随后室温孵育2小时封闭了反应池中的非特异性蛋白结合位点。为了制备展示异源二聚A6TCR的噬菌体颗粒,噬菌体颗粒与含0、20和200nMHLA-A6-Tax的含3%无脂奶粉的PBS混合并室温孵育1小时。向HLA-A2-Tax包被的反应池添加该噬菌体并室温孵育1小时,接着用含0.1%Tween20的PBS清洗3次并随后用PBS清洗3次。结合的展示TCR的噬菌体颗粒如实施例4所述的用抗fd抗体(Sigma)进行检测。鉴别了多个假定的高亲和性A6TCR突变体,并且在以下两张表中列举了其CDR3序列及相应的野生型序列。在所有β链突变体和一个α链突变体中发现了琥珀终止密码子(X)。A6TCRβ链突变体A6TCRα链突变体实施例9含CDR3突变的具有恒定结构域之间非天然二硫键的可溶异源二聚A6TCR的产生使用Mini-Prep试剂盒(Quiagen,UK)从相关的大肠杆菌细胞中分离了实施例8中所鉴别的编码高亲和性A6TCR突变体。使用噬菌粒DNA作为模板并使用以下引物的PCR扩增用于扩增可溶TCRα和β链DNA序列。A6TCRα链正向引物ggaattcatcgatgcagaaggaagtggagcag(SEQID129)(ClaI限制性位点用下划线表示)通用TCRα链反向引物gtacacggccgggtcagggttctggatatac(SEQID130)(EagI限制性位点用下划线表示)A6β链正向引物Tctctcattaatgaatgctggtgtcactcagacccc(SEQID131)(AseI限制性位点用下划线表示)通用β链反向引物Tagaaaccggtggccaggcacaccagtgtggc(SEQID132)(AgeI限制性位点用下划线表示)在TCRβ链的情况下,进行了进一步的PCR拼接以用编码谷氨酸的密码子取代CDR3区中的琥珀终止密码子。当大肠杆菌中琥珀终止密码子被抑制时,谷酰胺残基被正常引入而不是翻译终止。因此,当在噬菌体表面展示含琥珀密码子的TCR时,该位置包含谷酰胺残基。然而,当该TCRβ链基因转移到表达质粒时,谷氨酸残基用作谷酰胺的另一种选择。用于这一PCR拼接的引物如下。YOL124CTGCTCTGGTTCCGCACTC(SEQID133)YOL125GAGTGCGGAACCAGAGCAG(SEQID134)通过自动测序验证了突变的可溶A6TCRβ链的DNA序列(见针对突变的A6TCRβ链DNA序列的图14a和针对突变的A6TCRβ链氨基酸序列的图14b)。图14c显示了不含谷酰胺到谷氨酸替代的突变的A6TCRβ链的氨基酸序列,即如通过噬菌体ELISA分离的克隆134中的序列。这些A6TCRα和β链DNA序列随后用以产生如WO03/020763中所述的可溶A6TCR。简而言之,这两条链以包含体的形式在不同的大肠杆菌培养物中表达。随后体外分离包含体、变性并共同复性。实施例10与HLA-A2Tax结合的高亲和性A6TCR的BIAcore表面等离子体谐振特征描述使用了表面等离子体谐振生物感应器(BIAcore3000TM)来分析高亲和性克隆134A6TCR(见分别针对突变的TCRβ链的完整DNA和氨基酸序列的图15a和15b)与HLA-A2Tax配体的结合。产生的pMHC复合物(见以下描述)有助于这一过程,该复合物以半定向方式固定在包被链亲和素的结合表面上,这允许同时有效检测可溶TCR与4种以内不同pMHC(固定在不同的流动池中)的结合。手工注入HLA复合物允许对固定的I类分子的精确水平进行简单操作。从细菌表达的含组成的亚基蛋白质及合成肽的包含体体外复性,随后进行纯化和体外酶的生物素化成生物素化的I类HLA-A2Tax复合物(O’Callaghan等,(1999)Anal.Biochem.2669-15)。表达含以适当结构取代蛋白跨膜和胞质结构域的C末端生物素化标签的HLA重链。获得了约75毫克/升包含体表达水平的细菌培养物。HLA轻链或β2微球蛋白也以包含体形式从适当的构件在大肠杆菌中表达,表达水平约为500毫克/升细菌培养物。溶解大肠杆菌细胞并将包含体纯化至约80%的纯度。包含体蛋白质在6M盐酸胍、50mMTris(pH8.1)、100mMNaCl、10mMDTT和10mMEDTA中变性,并通过在5℃以下以单一脉冲将变性蛋白质加入重折叠缓冲液的方式,对浓度为30毫克/升重链、30毫克/升β2m在0.4ML-精氨酸-HCl、100mMTris(pH8.1)、3.7mM胱胺、mM巯基乙胺、4毫克/毫升肽(例如tax11-19)中重折叠。使重折叠在4℃时至少1小时完成。通过在10倍体积pH8.1的Tris缓冲液中透析交换缓冲液。需要换两次缓冲液以充分降低溶液的离子强度。随后蛋白溶液通过1.5微米的醋酸纤维素滤器过滤并加载于POROS50HQ阴离子交换柱(床体积8毫升)。用线性的0-500mMNaCl梯度洗脱蛋白质。HLA-A2-肽复合物在约250mMNaCl处洗脱,收集峰值处的组分,添加蛋白酶抑制剂混合剂(Calbiochem)并在冰上冷藏组分。使用在相同缓冲液中平衡的Pharmacia快速脱盐柱将生物素化标记的HLA-A2复合物的缓冲液换成10mMTrispH8.1、5mMNaCl。洗脱后,含蛋白质的组分立即在冰上冷却并添加蛋白酶抑制剂混合剂(Calbiochem)。随后添加生物素化试剂1mM生物素、5mMATP(pH缓冲到8)、7.5mMMgCl2和5微克/毫升BirA酶(按照0’Callaghan等,(1999)Anal.Biochem.2669-15所述方法纯化的)。随后使混合物室温孵育过夜。使用凝胶过滤层析纯化生物素化的HLA-A2复合物。PharmaciaSuperdex75HR10/30层析柱用过滤的PBS预平衡并加载1毫升生物素化反应混合物并用0.5毫升/分钟流速的PBS进行层析。生物素化的HLA-A2复合物在约15毫升处以单个峰的形式被洗脱。合并含蛋白质的组分、在冰上冷却并添加蛋白酶抑制剂混合剂。使用考马斯结合测定法(PerBio)确定了蛋白质浓度并在-20℃冻存试样量的生物素化HLA-A2复合物。通过常规的胺耦合方法固定链亲和素。含新的链间键的高亲和性A6TaxTCR和HLA-A2Tax或无关的HLA-A2NY-ESO组合(其产生如上所述)之间的相互作用在BIAcore3000TM表面等离子体谐振(SPR)生物感应器上进行分析。SPR测量用反应单位(RU)表示的小流动池内感应器附近折射系数的变化,这是能用于检测受体配体相互作用并分析其亲和力和动力学参数的原理。通过经与β2m交联的生物素和已经与流动池活化表面化学交联的链亲和素之间的结合将单独的HLA-A2肽复合物固定在不同流动池中,制备了探针流动池。随后通过sTCR以恒定流速流经不同流动池的表面进行检测,以此测量了SPR反应。最初,相互作用的特异性通过可溶A6TCR以5微升/分钟的恒定流速流经4个不同表面进行验证一个用约1000RU的HLA-A2Tax复合物包被,第2个用约1000RU的HLA-A2NY-ESO复合物包被,以及2个只用链亲和素包被的空白流动池(见图15)。突变的A6TCR的提高的亲和力使得对其与HLA-A2Tax复合物相互作用的Kd值的计算变得困难。然而,计算的该相互作用的半衰期(t1/2)与野生型相互作用的t1/27.2秒相比是51.6分钟(见图16)。实施例11编码含新的二硫键的可溶NY-ESOTCR的载体的产生实施例1中制备的可溶A6TCR的β链在天然序列中包含适于用作连接位点的BglII限制性位点(AAGCTT)。如下详述进行PCR诱变以在可溶A6TCR的α链中新的半胱氨酸密码子的5’端引入BamHI限制性位点(GGATCC)。图2a中描述的序列用作这一诱变的模板。使用了以下引物|BamHI|5’-ATATCCAGAACCCgGAtCCTGCCGTGTA-3’(SEQID135)5’-TACACGGCAGGAaTCcGGGTTCTGGATAT-3’(SEQID136)100纳克质粒与5微升10mMdNTP、25微升10xPfu缓冲液(Stratagene)、10单位Pfu聚合酶(Stratagene)混合并用H2O将终体积调节为240微升。在48微升的这一混合物中添加引物使其在50微升最终反应体积中的终浓度稀释为0.2μM。最初的95℃30秒的变性步骤之后,反应物在HybaidPCRexpressPCR仪上进行了15轮的变性(95℃,30秒)、退火(55℃,60秒)和延伸(73℃,8分钟)。随后产物用10单位DpnI限制性酶(NewEnglandBiolabs)37℃消化5小时。10微升消化反应物转化感受态XL-1-Blue菌株并37℃生长18小时。挑取单菌落并在5毫升TYP+氨苄青霉素(16克/升胰蛋白胨、16克/升酵母提取物、5克/升NaCl、2.5克/升K2HPO4、100毫克/升氨苄青霉素)中生长过夜。按照制造商说明书在Qiagenmini-prep柱上纯化了质粒DNA并通过在牛津大学生物化学系的测序设备上的自动化测序验证了该序列。按照已知的技术从T细胞中分离了编码NY-ESOTCR的cDNA。通过用逆转录酶处理mRNA生成了编码NY-ESOTCR的cDNA。为了产生编码合并了新的二硫键的可溶NY-ESOTCR,将含α链BamHI和β链BglII限制性位点的A6TCR用作模板。使用了以下引物|NdeI|5’-GGAGATATACATATGCAGGAGGTGACACAG-3’(SEQID137)5’-TACACGGCAGGATCCGGGTTCTGGATATT-3’(SEQID138)|BamHI||NdeI|5’-GGAGATATACATATGGGTGTCACTCAGACC-3’(SEQID139)5’-CCCAAGCTTAGTCTGCTCTACCCCAGGCCTCGGC-3’(SEQID140)|BglII|通过如下的PCR克隆获得了NY-ESOTCRα和β链构件。使用上述引物和含天然NY-ESOTCR链的模板进行了PCR反应。PCR产物用相应的限制性酶进行了限制性消化,并克隆到pGMT7以获得表达质粒。质粒插入序列通过自动化DNA测序进行证实。图17a和17b分别显示突变的NY-ESOTCRα和β链的DNA序列,图18a和18b显示最终的氨基酸序列。实施例12噬菌体展示载体的构建和将编码NY-ESOTCRα和β链的DNA克隆进该噬菌粒载体按照实施例11中所述产生的合并了新的半胱氨酸密码子以促进形成非天然链间二硫键的编码可溶NY-ESOTCRα和β链的DNA如下并入噬菌粒载体pEX746。使用以下引物分别对编码两条NY-ESOTCR链的DNA进行了PCR以引入与pEX746噬菌粒载体(含编码A6TCR克隆7的DNA)相容的克隆位点针对NY-ESOTCRα链的引物TRAV21GCCGGCCATGGCCAAACAGGAGGTGACGCAGATTCCT(SEQID141)YOL6CTTCTTAAAGAATTCTTAATTAACCTAGGTTATTAGGAACTTTCTGGGCTGGGGAAG(SEQID142)针对NY-ESOTCRβ链的引物TRBV6-1/2/3/5/6/7/8/9TCACAGCGCGCAGGCTGGTGTCACTCAGACCCCAAA(SEQID143)RT1CGAGAGCCCGTAGAACTGGACTTG(SEQID144)J.Sambrook和D.W.Russell的《分子克隆实验室手册》中描述了用以构建载体的分子克隆方法。表1中列举的引物用于所述载体的构建。PCR程序的一个例子是94℃2分钟1个循环,随后94℃5秒、53℃5秒和72℃90秒25个循环,接着72℃10分钟1个循环,以及随后的4℃保温。高保真TaqDNA聚合酶购自Roche。通过用限制性酶BssHII和BglII的消化从pEX746中去除编码克隆7A6TCRβ链的DNA。随后通过连接将相应消化的编码NY-ESOβ链的PCRDNA取代入该噬菌粒。克隆产物的序列通过自动测序进行验证。类似地,通过用限制性酶NcoI和AvrII的消化从pEX746中去除编码克隆7A6TCRα链的DNA。随后通过连接将相应消化的编码NY-ESOα链的PCRDNA取代入已经包含编码NY-ESOTCRβ链的DNA的噬菌粒。克隆产物的序列通过自动测序进行验证。图19a和19b分别详述了NY-ESOTCRα和β链的DNA和氨基酸序列以及并入噬菌体(pEX746NY-ESO)的其周围相关序列。NcoI位点之前的序列与pEX746相同。实施例13细菌外被蛋白和异源二聚NY-ESOTCR的融合蛋白在大肠杆菌中的表达使用对先前所述用于产生噬菌体颗粒展示的抗体scFv做以下改进的方法(Li等,2000,JournalofImmunologicalMethods236133-146)制备了展示含非天然链间二硫键的异源二聚NY-ESOTCR。将含pEX746NY-ESO噬菌粒(即编码可溶NY-ESOTCRα链和如实施例12中所述方法产生的与噬菌体gIII蛋白融合的NT-ESOTCRβ链的噬菌粒)的大肠杆菌TG1细胞接种到10毫升2xTY(含100微克/毫升氨苄青霉素和2%葡萄糖),随后培养物37℃振荡孵育过夜(16小时)。将50微升过夜培养物接种于10毫升2xTY(含100微克/毫升氨苄青霉素和2%葡萄糖),随后培养物37℃振荡孵育直至OD(600nm)达到0.8。在培养物中添加终浓度为5×109pfu/ml的HYPERPHAGE辅助噬菌体。随后培养物37℃静置孵育30分钟并以200rpm进一步振荡孵育30分钟。随后用2xTY(含100微克/毫升氨苄青霉素和25微克/毫升卡那霉素)将上述培养物的培养基体积调整为50毫升,随后25℃250rpm振荡孵育36到48小时。随后培养物4℃4000rpm离心30分钟。上清液经0.45微米针筒过滤器过滤并4℃保存以进一步浓缩。随后上清液通过PEG沉淀和用10%原始保存体积的PBS重悬进行浓缩。实施例14丝状噬菌体颗粒上含非天然链间二硫键的功能性异源二聚NY-ESOTCR的检测使用实施例4中所述的噬菌体ELISA方法对实施例13中所制备的浓缩悬液中的噬菌体颗粒上展示的功能性(HLA-A2-NY-ESO结合的)NY-ESOTCR进行了检测。图20说明在噬菌体ELISA测定法中噬菌体颗粒展示的NY-ESOTCR与HLA-A2-NY-ESO的特异性结合。实施例15用以HLA-DRA基因细胞表达的质粒的构建使用聚合酶链式反应(PCR)和设计成包括BglII限制性位点的合成的DNA引物对,从分离自健康人血液的cDNA扩增了编码HLA-DRA链胞外部分的DNA序列。随后使用PCR诱变在该扩增序列的3’末端添加编码Fos亮氨酸拉链的DNA。上述的DNA操作和克隆按照Sambrook,J等所著《分子克隆—实验室手册》第2版(MolecularCloning-ALaboratoryManual.SecondEdition.ColdSpringHarborLaboratoryPress,USA)中所述进行。图21提供了适于插入双顺反子表达载体的HLA-DRβ链的DNA序列。该图指出了编码Fos亮氨酸拉链肽和生物素标签的密码子的位置。氨基酸编号建立在小鼠序列的基础上(Kabat,1991,《免疫学上感兴趣的蛋白的序列》第5版(SequencesofProteinsofImmunologicalInterest,5thedition,USDeptofHealth&HumanServices,PublicHealthService,NIH,Bethesda,MD1-1137)。随后将这一DNA序列连同编码相应II类HLAβ链的DNA插入杆状病毒载体pAcAB3(见图22所示该载体的序列)以在Sf9昆虫细胞中表达。该载体可用于在昆虫细胞中表达任何II类HLA-肽复合物。实施例16用以HLA-DRB野生型和突变体基因细胞表达的质粒的构建使用聚合酶链式反应(PCR)和设计成包括BamHI限制性位点的合成的DNA引物对,从分离自健康人血液的cDNA扩增了编码HLA-DRA链胞外部分的DNA序列。随后使用PCR诱变在该扩增序列的3’末端添加编码Jun亮氨酸拉链的DNA并在该序列的5’末端添加编码由HLA-DR1分子荷载的FluHA肽的DNA。上述的DNA操作和克隆按照Sambrook,J等所著《分子克隆—实验室手册》第2版(MolecularCloning-ALaboratoryManual.SecondEdition.ColdSpringHarborLaboratoryPress,USA,1999)中所述进行。图23提供了适于插入双顺反子表达载体的HLA-DRβ链的DNA序列。该图指出了编码Jun亮氨酸拉链肽和FluHA肽的密码子的位置。氨基酸编号建立在小鼠序列的基础上(Kabat,1991,《免疫学上感兴趣的蛋白的序列》第5版(SequencesofProteinsofImmunologicalInterest,5thedition,USDeptofHealth&HumanServices,PublicHealthService,NIH,Bethesda,MD1-1137)。随后将这一DNA序列连同编码相应II类HLAβ链的DNA插入杆状病毒载体pAcAB3(见图22所示该载体的序列)以在Sf9昆虫细胞中表达。该载体可用于在昆虫细胞中表达任何II类HLA-肽复合物。实施例17II类HLA-DR1-FluHA复合物的表达和复性使用如实施例15和16所述的方法产生的含II类HLA-DR1α和β链和FluHA肽的双顺反子表达载体实现了II类MHC表达。使用的表达和纯化方法如Gauthier(1998)PNASUSA9511828-11833中所述。简而言之,通过用来自转录因子Fos和Jun的亮氨酸拉链二聚化结构域替换DRα和β链的疏水性跨膜结构域和胞质片段,在杆状病毒系统中表达了可溶的HLA-DR1。在表达构件中,需要的II类MHC荷载的FluHA肽序列与成熟DRβ链的N末端共价连接并且CRα链包含生物素化标签以促进利用生物素/链亲和素多聚化方法的双功能配体的形成。用重组杆状病毒感染的Sf9细胞分泌重组蛋白,并通过亲和层析对重组蛋白进行纯化。该蛋白进一步通过阴离子交换HPLC进行纯化。实施例18-I类可溶肽-HLA分子的构建为了进一步研究高亲和性A6TCR克隆134的特异性,生成了以下可溶I类肽-HLA分子HLA-A2-肽(LLGRNSFEV)(SEQID23)HLA-A2-肽(KLVALGINAV)(SEQID24)HLA-A2-肽(LLGDLFGV)(SEQID25)HLA-B8-肽(FLRGRAYGL)(SEQID26)HLA-B27-肽(HRCQAIRKK)(SEQID27)HLA-Cw6-肽(YRSGIIAVV)(SEQID28)HLA-A24-肽(VYGFVRACL)(SEQID29)HLA-A2-肽(ILAKFLHWL)(SEQID30)HLA-A2-肽(LTLGEFLKL)(SEQID31)HLA-A2-肽(GILGFVFTL)(SEQID33)HLA-A2-肽(SLYNTVATL)(SEQID34)这些可溶肽-HLA使用实施10中所述的方法产生。实施例19-克隆134高亲和性A6TCR与肽-HLA结合特异性的BIAcore表面等离子体谐振测量使用了表面等离子体谐振生物感应器(BIAcore3000TM)来分析高亲和性克隆134A6TCR(见图15a和15b分别表示的突变TCRβ链的完整DNA和氨基酸序列)的结合特异性。这通过使用如实施例15-17所述产生的II类HLA-DR1-肽和使用实施例10中详述的方法产生的列举在实施18中的I类肽-HLA复合物得以实现。下表列举了采用的肽-HLA复合物1.HLA-A2-肽(LLGRNSFEV)(SEQID23)2.HLA-A2-肽(KLVALGINAV)(SEQID24)3.HLA-A2-肽(LLGDLFGV)(SEQID25)4.HLA-B8-肽(FLRGRAYGL)(SEQID26)5.HLA-B27-肽(HRCQAIRKK)(SEQID27)6.HLA-Cw6-肽(YRSGIIAVV)(SEQID28)7.HLA-A24-肽(VYGFVRACL)(SEQID29)8.HLA-A2-肽(ILAKFLHWL)(SEQID30)9.HLA-A2-肽(LTLGEFLKL)(SEQID31)10.HLA-DR1-肽(PKYVKQNTLKLA)(SEQID32)11.HLA-A2-肽(GILGFVFTL)(SEQID33)12.HLA-A2-肽(SLYNTVATL)(SEQID34)以上的肽-HLA以半定向方式固定在BIAcore3000TM流动池中的链亲和素包被的结合表面上。BIAcore3000TM允许同时对可溶T细胞受体与4种以内不同的pMHC(固定在不同的流动池内)的结合进行检测。实验中在流动池2-4中固定了3种不同的HLA-肽并且流动池1留作空白对照。手工注入HLA-肽复合物允许对固定分子的精确水平进行操纵。在对高亲和性A6TCR克隆134与以上列表中前3种HLA-肽复合物的结合能力进行评估以后,接下来的3种复合物直接固定在这些流动池中前一批复合物之上。持续这一过程直至高亲和性A6TCR克隆134与所有12种HLA-肽复合物的结合进行了评估。注入的5微升高亲和性A6TCR克隆134以介于4.1纳克/毫升到2.1毫克/毫升的浓度和5微升/分钟的流速通过每个流动池(见图24-28)。作为最后的对照,高亲和性A6TCR克隆134通过含固定的HLA-A2Tax(LLFGYPVYV)(SEQID21)(该TCR的同类配体)的流动池。只发现了高亲合力A6TCR克隆134与其同类配体(HLA-A2Tax(LLFGYPVYV)(SEQID21))的特异性结合。这些数据进一步说明高亲和性A6TCR克隆134的特异性(见图24-28)。实施例20-NY-ESOTCRCDR3区的诱变NY-ESOTCR的CDR3区作为引入突变以研究产生高亲和性突变体可能性的靶标。这通过组合使用NY-ESOTCR特异性PCR引物和与实施例7中详述的方法充分相同的方法得以实现。实施例21-高亲和性A6TCR突变体的分离使用实施例8所述两种方法中的第一种方法实现了高亲和性NY-ESOTCR突变体的分离。鉴别了单一的高亲和性NY-ESOTCR。实施例22具有恒定结构域之间非天然二硫键的含可变结构域突变的可溶高亲和性异源二聚NY-ESOTCR的产生使用Mini-Prep试剂盒(Quiagen,UK)从相应的大肠杆菌细胞中分离了编码实施例20中所鉴别的高亲和性NY-ESOTCR突变体的噬菌体DNA。使用将噬菌粒DNA作为模板和以下引物的PCR扩增用于扩增突变的可溶NY-ESOTCRβ链可变结构域DNA序列NY-ESOβ链正向引物Tctctcattaatgaatgctggtgtcactcagacccc(SEQID145)(AseI限制性位点用下划线表示)通用β链反向引物Tagaaaccggtggccaggcacaccagtgtgg(SEQID146)(AgeI限制性位点用下划线表示)随后PCR产物用AgeI/AseI消化并克隆进用NdeI/AgeI切割的pEX821(如实施例11所述产生)。如上所述扩增的突变NY-ESOTCRβ链DNA序列和如实施例11所述生成的NY-ESOTCRα链随后用于产生如WO03/020763所述的可溶高亲和性NY-ESOTCR。简而言之,这两条链以包含体的形式在不同的大肠杆菌培养物中表达。随后对包含体进行纯化、变性和共同体外复性。实施例23-与HLA-A2NY-ESO结合的高亲和性NY-ESOTCR的BIAcore表面等离子体谐振特征描述使用了表面等离子体谐振生物感应器(Biacore3000TM)来分析高亲和性NY-ES0TCR与HLA-A2NY-ESO配体的结合。这由生成的以半定向方式固定在链亲和素包被的结合表面上从而允许同时有效检测可溶TCR与4种以内不同pMHC(固定在不同流动池中)结合的pMHC复合物(如实施例10所述)促进。手工注入HLA复合物使得对固定的I类分子的精确水平进行简便操纵。也如实施例10中所述,在Biacore3000TM表面等离子体谐振(SPR)生物感应器上分析了含新的链间键的高亲和性NY-ESOTCR和HLA-A2NY-ESO复合物或无关的HLA-A2Tax组合物(实施例10中描述了其产生)之间的相互作用。可溶高亲和性NY-ESO与HLA-A2NY-ESO的相互作用的Kd值计算为4.1μM(见图29a和29b),这与野生型相互作用Kd值为15.7μM(见图30a和30b)形成对比。实施例24-更多高亲和性A6TCR的产生和检测使用实施例9中所详述的方法,产生了含以下对应于克隆89、1、111和71(见实施例8)中所鉴别的突变的可溶TCR。随后使用实施例10中详述的Biacore测定法对这些可溶TCR与HLA-A2Tax结合进行了评估。A6TCRβ链突变体A6TCRα链突变体组合的突变用作产生突变的可溶A6TCR克隆89突变+克隆134突变克隆71突变+克隆134突变克隆71突变+克隆89突变克隆1突变+βG102→A突变结果以下的表格比较了以上可溶的突变A6TCR与使用含非突变可变结构域获得的亲和力。注意,用相互作用的半寿期(T1/2)表示最高亲和性突变体的亲和力。如由其相互作用更低的Kd值或更长的T1/2所证明的,这些可溶突变A6TCR对HLA-A2Tax具有比非突变可溶A6TCR更高的亲和力。图31-37显示了用于计算这些可溶突变TCR对HLA-A2Tax亲和力的Biacore记录。图38a-e显示了突变A6TCR链的氨基酸序列。实施例25-使用高亲和性A6TCR四聚物和单体的细胞染色T2抗原提呈细胞与β2m(3微克/毫升)37℃孵育90分钟,同时以脉冲方式输送浓度介于10-5M-10-9M的Tax肽。对于也使用与β2m(3微克/毫升)孵育的T2细胞的对照,以脉冲方式输送10-5的Flu肽或不与肽共同孵育(无脉冲的)。脉冲输送后,细胞用无血清RPMI清洗并且2×105细胞与用藻红蛋白(PE)(Molecularprobes,TheNetherlands)(10微克/毫升)标记的链亲和素相连的高亲和性克隆134A6TCR四聚体或用Alexa488(Molecularprobes,TheNetherlands)标记的高亲和性克隆134A6TCR单体室温孵育10分钟。细胞清洗以后,使用FACSVantageSE(BectonDickinson)通过流式细胞仪检验了标记的TCR四聚体和单体的结合。结果如图39a所示,当Tax肽浓度低于10-9M时,可以观察到T2细胞通过高亲和性A6TCR四聚体的特异性染色。如图39b所示,当Tax肽浓度低于10-8M时,可以观察到T2细胞通过高亲和性A6TCR单体的特异性染色。序列表公司申请人街道密尔顿公园57C城市阿宾顿州牛津郡国家英国邮政编码OX144RX电话号码+441235438600传真号码+441235438601电子邮件地址martin.green@avidex.com<110>公司名称阿维德克斯有限公司个人申请人街道密尔顿公园57C,阿维德克斯有限公司城市阿宾顿州牛津郡国家英国邮政编码OX144RX电话号码+441235438600传真号码+441235438601电子邮件地址bent.jakobsen@avidex.com<110>姓雅各布森<110>名本特<110>中间名K<110>注释博士个人申请人街道密尔顿公园57C,阿维德克斯有限公司城市阿宾顿州牛津郡国家英国邮政编码OX144RX电话号码+441235438600传真号码+441235438601电子邮件地址torben.andersen@avidex.com<110>姓安德森<110>名托本<110>中间名B<110>注释博士个人申请人街道密尔顿公园57C,阿维德克斯有限公司城市阿宾顿州牛津郡国家英国邮政编码OX144RX电话号码+441235438600传真号码+441235438601电子邮件地址peter.molloy@avidex.com<110>姓莫洛伊<110>名彼特<110>中间名E<110>注释博士个人申请人街道密尔顿公园57C,阿维德克斯有限公司城市阿宾顿州牛津郡国家英国邮政编码OX144RX电话号码+441235438600传真号码+441235438601电子邮件地址jonathan.boulter@avidex.com<110>姓伯尔特<110>名乔纳森<110>中间名M<110>注释博士个人申请人街道密尔顿公园57C,阿维德克斯有限公司城市阿宾顿州牛津郡国家英国邮政编码OX144RX电话号码+441235438600传真号码+441235438601电子邮件地址yi.li@avidex.com<110>姓李<110>名懿<110>中间名<110>注释博士申请方案<120>发明名称物质<130>申请文件编号CaseNo19<140>当前申请号GB0226227.7<141>当前申请日2002-11-09在先申请<150>在先申请号GB0226227.7<151>在先申请日2002-11-09在先申请<150>在先申请号GB0301814.0<151>在先申请日2003-01-25在先申请<150>在先申请号GB0304067.2<151>在先申请日2003-02-22在先申请<150>在先申请号GB0311397.4<151>在先申请日2003-05-16在先申请<150>在先申请号GB0316356.5<151>在先申请日2003-07-11在先申请<150>在先申请号us60/463,323<151>在先申请日2003-04-16序列<213>生物体名称人工序列<400>前序列串DSDVYITDKTVLDMRSMDFK20<212>类型PRT<211>长度20序列名称SEQID1序列描述序列<213>生物体名称人工序列<400>前序列串QSKDSDVYITDKTVLDMRSM20<212>类型PRT<211>长度20序列名称SEQID2序列描述序列<213>生物体名称人工序列<400>前序列串DIQNPDPAVYQLRDSKSSDK20<212>类型PRT<211>长度20序列名称SEQID3序列描述序列<213>生物体名称人工序列<400>前序列串DPAVYQLRDSKSSDKSVCLF20<212>类型PRT<211>长度20序列名称SEQID4序列描述序列<213>生物体名称人工序列<400>前序列串NGKEVHSGVSTDPQPLKEQP20<212>类型PRT<211>长度20序列名称SEQID5序列描述序列<213>生物体名称人工序列<400>前序列串NGKEVHSGVSTDPQPLKEQP20<212>类型PRT<211>长度20序列名称SEQID5序列描述序列<213>生物体名称人工序列<400>前序列串ALNDSRYALSSRLRVSATFW20<212>类型PRT<211>长度20序列名称SEQID6序列描述序列<213>生物体名称人工序列<400>前序列串PPEVAVFEPSEAEISHTQKA20<212>类型PRT<211>长度20序列名称SEQID7序列描述序列<213>生物体名称人工序列<400>前序列串KEVHSGVSTDPQPLKEQPAL20<212>类型PRT<211>长度20序列名称SEQID8序列描述序列<213>生物体名称人工序列<400>前序列串VFPPEVAVFEPSEAEISHTQ20<212>类型PRT<211>长度20序列名称SEQID9序列描述序列<213>生物体名称人工序列<400>前序列串PYIQNPEPAVYQLKDPRSQDSTLCLFTDFDSQINVPKTMESGTFITDKTVLDMKAMDSKS60NGAIAWSNQTSFTCQDIFKETNATYPSSDVP91<212>类型PRT<211>长度91序列名称SEQID10序列描述序列<213>生物体名称人工序列<400>前序列串EDLRNVTPPKVSLFEPSKAEIANKQKATLVCLARGFFPDHVELSWWVNGREVHSGVSTDP60QAYKESNYSYCLSSRLRVSATFWHNPRNHFRCQVQFHGLSEEDKWPEGSPKPVTQNISAE120AWGRAD126<212>类型PRT<211>长度126序列名称SEQID11序列描述序列<213>生物体名称人工序列<400>前序列串ESGTFITDKTVLDMKAMDSK20<212>类型PRT<211>长度20序列名称SEQID12序列描述序列<213>生物体名称人工序列<400>前序列串KTMESGTFITDKTVLDMKAM20<212>类型PRT<211>长度20序列名称SEQID13序列描述序列<213>生物体名称人工序列<400>前序列串YIQNPEPAVYQLKDPRSQDS20<212>类型PRT<211>长度20序列名称SEQID14序列描述序列<213>生物体名称人工序列<400>前序列串AVYQLKDPRSQDSTLCLFTD20<212>类型PRT<211>长度20序列名称SEQID15序列描述序列<213>生物体名称人工序列<400>前序列串NGREVHSGVSTDPQAYKESN20<212>类型PRT<211>长度20序列名称SEQID16序列描述序列<213>生物体名称人工序列<400>前序列串KESNYSYCLSSRLRVSATFW20<212>类型PRT<211>长度20序列名称SEQID17序列描述序列<213>生物体名称人工序列<400>前序列串PPKVSLFEPSKAEIANKQKA20<212>类型PRT<211>长度20序列名称SEQID18序列描述序列<213>生物体名称人工序列<400>前序列串REVHSGVSTDPQAYKESNYS20<212>类型PRT<211>长度20序列名称SEQID19序列描述序列<213>生物体名称人工序列<400>前序列串VTPPKVSLFEPSKAEIANKQ20<212>类型PRT<211>长度20序列名称SEQID20序列描述序列<213>生物体名称人工序列<400>前序列串LLFGYPVYV9<212>类型PRT<211>长度9序列名称SEQID21序列描述序列<213>生物体名称人工序列<400>前序列串SLLMITQC8<212>类型PRT<211>长度8序列名称SEQID22序列描述序列<213>生物体名称人工序列<400>前序列串LLGRNSFEV9<212>类型PRT<211>长度9序列名称SEQID23序列描述序列<213>生物体名称人工序列<400>前序列串KLVALGINAV10<212>类型PRT<211>长度10序列名称SEQID24序列描述序列<213>生物体名称人工序列<400>前序列串LLGDLFGV8<212>类型PRT<211>长度8序列名称SEQID25序列描述序列<213>生物体名称人工序列<400>前序列串FLRGRAYGL9<212>类型PRT<211>长度9序列名称SEQID26序列描述序列<213>生物体名称人工序列<400>前序列串HRCQAIRKK9<212>类型PRT<211>长度9序列名称SEQID27序列描述序列<213>生物体名称人工序列<400>前序列串YRSGIIAVV9<212>类型PRT<211>长度9序列名称SEQID28序列描述序列<213>生物体名称人工序列<400>前序列串VYGFVRACL9<212>类型PRT<211>长度9序列名称SEQID29序列描述序列<213>生物体名称人工序列<400>前序列串ILAKFLHWL9<212>类型PRT<211>长度9序列名称SEQID30序列描述序列<213>生物体名称人工序列<400>前序列串LTLGEFLKL9<212>类型PRT<211>长度9序列名称SEQID31序列描述序列<213>生物体名称人工序列<400>前序列串PKYVKQNTLKLA12<212>类型PRT<211>长度12序列名称SEQID32序列描述序列<213>生物体名称人工序列<400>前序列串GILGFVFTL9<212>类型PRT<211>长度9序列名称SEQID33序列描述序列<213>生物体名称人工序列<400>前序列串SLYNTVATL9<212>类型PRT<211>长度9序列名称SEQID34序列描述序列<213>生物体名称人工序列<400>前序列串cacagacaaatgtgtgctagacat24<212>类型DNA<211>长度24序列名称SEQID35序列描述惯用密码子序列名称SEQID35序列<213>生物体名称人工序列<400>前序列串atgtctagcacacatttgtctgtg24<212>类型DNA<211>长度24序列名称SEQID36序列描述惯用密码子序列名称SEQID36序列<213>生物体名称人工序列<400>前序列串cagtggggtctgcacagaccc21<212>类型DNA<211>长度21序列名称SEQID37序列描述惯用密码子序列名称SEQID37序列<213>生物体名称人工序列<400>前序列串gggtctgtgcagaccccactg21<212>类型DNA<211>长度21序列名称SEQID38序列描述惯用密码子序列名称SEQID38序列<213>生物体名称人工序列<400>前序列串taataatacgtataataatattctatttcaaggagacagtc41<212>类型DNA<211>长度41序列名称SEQID39序列描述惯用密码子序列名称SEQID39序列<213>生物体名称人工序列<400>前序列串caatccagcggctgccgtaggcaataggtatttcattatgactgtctccttgaaatag58<212>类型DNA<211>长度58序列名称SEQID40序列描述惯用密码子序列名称SEQID40序列<213>生物体名称人工序列<400>前序列串ctacggcagccgctggattgttattactcgcggcccagccggccatggcccag53<212>类型DNA<211>长度53序列名称SEQID41序列描述惯用密码子序列名称SEQID41序列<213>生物体名称人工序列<400>前序列串gttctgctccacttccttctgggccatggccggctgggccg41<212>类型DNA<211>长度41序列名称SEQID42序列描述惯用密码子序列名称SEQID42序列<213>生物体名称人工序列<400>前序列串cagaaggaagtggagcagaac21<212>类型DNA<211>长度21序列名称SEQID43序列描述惯用密码子序列名称SEQID43序列<213>生物体名称人工序列<400>前序列串cttcttaaagaattcttaattaacctaggttattaggaactttctgggctggggaag57<212>类型DNA<211>长度57序列名称SEQID44序列描述惯用密码子序列名称SEQID44序列<213>生物体名称人工序列<400>前序列串gttaattaagaattctttaagaaggagatatacatatgaaaaaattattattcgcaattC60<212>类型DNA<211>长度60序列名称SEQID45序列描述惯用密码子序列名称SEQID45序列<213>生物体名称人工序列<400>前序列串cgcgctgtgagaatagaaaggaacaactaaaggaattgcgaataataattttttcatatG60<212>类型DNA<211>长度60序列名称SEQID46序列描述惯用密码子序列名称SEQID46序列<213>生物体名称人工序列<400>前序列串ctttctattctcacagcgcgcaggctggtgtcactcagac40<212>类型DNA<211>长度40序列名称SEQID47序列描述惯用密码子序列名称SEQID47序列<213>生物体名称人工序列<400>前序列串atgatgtctagatgcggccgcgtctgctctaccccaggcctc42<212>类型DNA<211>长度42序列名称SEQID48序列描述惯用密码子序列名称SEQID48序列<213>生物体名称人工序列<400>前序列串gcatctagacatcatcaccatcatcactagactgttgaaagttgtttagcaaaac55<212>类型DNA<211>长度55序列名称SEQID49序列描述惯用密码子序列名称SEQID49序列<213>生物体名称人工序列<400>前序列串ctagagggtaccttattaagactccttattacgcagtatg40<212>类型DNA<211>长度40序列名称SEQID50序列描述惯用密码子序列名称SEQID50序列<213>生物体名称人工序列<400>前序列串agctgcagctaatacgactcactataggaacaggccaccatggcgtcgattatgctgagt60gatatccttgtccggtggtaccctag86<212>类型DNA<211>长度86序列名称SEQID51序列描述惯用密码子序列名称SEQID51序列<213>生物体名称人工序列<400>前序列串agctgcagctaatacgactcactataggaacaggccaccatgg43<212>类型DNA<211>长度43序列名称SEQID52序列描述惯用密码子序列名称SEQID52序列<213>生物体名称人工序列<400>前序列串gatcccatggtggcctgttcctatagtgagtcgtattagctgc43<212>类型DNA<211>长度43序列名称SEQID53序列描述惯用密码子序列名称SEQID53序列<213>生物体名称人工序列<400>前序列串ccaccatgggccagaaggaagtggagcagaactc34<212>类型DNA<211>长度34序列名称SEQID54序列描述惯用密码子序列名称SEQID54序列<213>生物体名称人工序列<400>前序列串cgagagcccgtagaactggacttg24<212>类型DNA<211>长度24序列名称SEQID55序列描述惯用密码子序列名称SEQID55序列<213>生物体名称人工序列<400>前序列串gtggatccggcggtggcgggtcgaacgctggtgtcactcagacccc46<212>类型DNA<211>长度46序列名称SEQID56序列描述惯用密码子序列名称SEQID56序列<213>生物体名称人工序列<400>前序列串ccggatccacctccgcctgaaccgcctccaccggtgaccacaacctgggtccctg55<212>类型DNA<211>长度55序列名称SEQID57序列描述惯用密码子序列名称SEQID57序列<213>生物体名称人工序列<400>前序列串ctgagaattcttatgactctccgcggttgaagctc35<212>类型DNA<211>长度35序列名称SEQID58序列描述惯用密码子序列名称SEQID58序列<213>生物体名称人工序列<400>前序列串tgacgaattctgactctccgcggttgaagctc32<212>类型DNA<211>长度32序列名称SEQID59序列描述惯用密码子序列名称SEQID59序列<213>生物体名称人工序列<400>前序列串agctgcagctaatacgactcactatagg28<212>类型DNA<211>长度28序列名称SEQID60序列描述惯用密码子序列名称SEQID60序列<213>生物体名称人工序列<400>前序列串ggccaccatgggcaacgctggtgtcactcagacccc36<212>类型DNA<211>长度36序列名称SEQID61序列描述惯用密码子序列名称SEQID61序列<213>生物体名称人工序列<400>前序列串tgaaccgcctccaccgtctgctctaccccaggcctcggcg40<212>类型DNA<211>长度40序列名称SEQID62序列描述惯用密码子序列名称SEQID62序列<213>生物体名称人工序列<400>前序列串tgactctccgcggttgaagctc22<212>类型DNA<211>长度22序列名称SEQID63序列描述惯用密码子序列名称SEQID63序列<213>生物体名称人工序列<400>前序列串cagctgggggaagcttcagtttggagcag29<212>类型DNA<211>长度29序列名称SEQID64序列描述惯用密码子序列名称SEQID64序列<213>生物体名称人工序列<400>前序列串ctgctccaaactgaagcttcccccagctg29<212>类型DNA<211>长度29序列名称SEQID65序列描述惯用密码子序列名称SEQID65序列<213>生物体名称人工序列<400>前序列串gtacttctgtgcctcgaggccgggactag29<212>类型DNA<211>长度29序列名称SEQID66序列描述惯用密码子序列名称SEQID66序列<213>生物体名称人工序列<400>前序列串ctagtcccggcctcgaggcacagaagtac29<212>类型DNA<211>长度29序列名称SEQID67序列描述惯用密码子序列名称SEQID67序列<213>生物体名称人工序列<400>前序列串cattttcagggatagcaagc20<212>类型DNA<211>长度20序列名称SEQID68序列描述惯用密码子序列名称SEQID68序列<213>生物体名称人工序列<400>前序列串tcacacaggaaacagctatgtcacacaggaaacagctatg40<212>类型DNA<211>长度40序列名称SEQID69序列描述惯用密码子序列名称SEQID69序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggnnknnknnknnknnknnkcgaccagagcagtacttcg49<212>类型DNA<211>长度49序列名称SEQID70序列描述特征序列SEQID70<221>特征关键词misc_feature<222>起始位置1<222>终止位置49其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID70序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggccgnnknnknnknnknnknnkccagagcagtacttcgggc52<212>类型DNA<211>长度52序列名称SEQID71序列描述特征序列SEQID71<221>特征关键词misc_feature<222>起始位置<222>终止位置其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无特征序列SEQID71<221>特征关键词misc_feature<222>起始位置1<222>终止位置52其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID71序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggccgnnknnknnknnknnknnkcgaccagagcagtacttcg52<212>类型DNA<211>长度52序列名称SEQID72序列描述特征序列SEQID72<221>特征关键词misc_feature<222>起始位置1<222>终止位置52其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID72序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggccgnnknnknnknnknnknnkggagggcgaccagagcag51<212>类型DNA<211>长度51序列名称SEQID73序列描述特征序列SEQID73<221>特征关键词misc_feature<222>起始位置1<222>终止位置51其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID73序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggccgggannknnknnknnknnknnkgggcgaccagagcagtac54<212>类型DNA<211>长度54序列名称SEQID74序列描述特征序列SEQID74<221>特征关键词misc_feature<222>起始位置<222>终止位置其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无特征序列SEQID74<221>特征关键词misc_feature<222>起始位置1<222>终止位置54其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID74序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggnnknnknnknnknnknnkccagagcagtacttcgggc49<212>类型DNA<211>长度49序列名称SEQID75序列描述特征序列SEQID75<221>特征关键词misc_feature<222>起始位置<222>终止位置其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无特征序列SEQID75<221>特征关键词misc_feature<222>起始位置1<222>终止位置49其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID75序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggnnknnknnknnknnknnkgagcagtacttcgggccg48<212>类型DNA<211>长度48序列名称SEQID76序列描述特征序列SEQID76<221>特征关键词misc_feature<222>起始位置1<222>终止位置48其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID76序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggnnknnknnknnknnknnkcagtacttcgggccgggc48<212>类型DNA<211>长度48序列名称SEQID76序列描述特征序列SEQID77<221>特征关键词misc_feature<222>起始位置1<222>终止位置48其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID77序列<213>生物体名称人工序列<400>前序列串tgtgcctcgaggccgnnknnknnknnkgggcgaccagagcagtacttcg49<212>类型DNA<211>长度49序列名称SEQID78序列描述特征序列SEQID78<221>特征关键词misc_feature<222>起始位置<222>终止位置其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无特征序列SEQID78<221>特征关键词misc_feature<222>起始位置1<222>终止位置49其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID78序列<213>生物体名称人工序列<400>前序列串aaactgaagcttmnnmnnmnnmnnmnntgtaacggcacagaggtag46<212>类型DNA<211>长度46序列名称SEQID79序列描述特征序列SEQID79<221>特征关键词misc_feature<222>起始位置1<222>终止位置46其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID79序列<213>生物体名称人工序列<400>前序列串aaactgaagcttmnnmnngctgtcmnntgtaacggcacagaggtag46<212>类型DNA<211>长度46序列名称SEQID80序列描述特征序列SEQID80<221>特征关键词misc_feature<222>起始位置1<222>终止位置46其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID80序列<213>生物体名称人工序列<400>前序列串aaactgaagcttmnnmnnmnngctgtcmnntgtaacggcacagaggtag49<212>类型DNA<211>长度49序列名称SEQID81序列描述特征序列SEQID81<221>特征关键词misc_feature<222>起始位置<222>终止位置其它信息m是a或cn是a或t或g或c;k是g或tCDS连接无特征序列SEQID81<221>特征关键词misc_feature<222>起始位置1<222>终止位置49其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID8I序列<213>生物体名称人工序列<400>前序列串aaactgaagcttmnnmnngctgtcmnnaacggcacagaggtag43<212>类型DNA<211>长度43序列名称SEQID82序列描述特征序列SEQID82<221>特征关键词misc_feature<222>起始位置1<222>终止位置43其它信息m是a或c;n是a或t或g或c;k是g或tCDS连接无惯用密码子序列名称SEQID82序列<213>生物体名称人工序列<400>前序列串gcctcgaggccgggactagcgggagggcgaccagagcagtag42<212>类型DNA<211>长度42序列名称SEQID83序列描述惯用密码子序列名称SEQID83序列<213>生物体名称人工序列<400>前序列串ASRPGLAGGRPEQY14<212>类型PRT<211>长度14序列名称SEQID84序列描述序列<213>生物体名称人工序列<400>前序列串gcctcgaggccggggctgatgagtgcgtagccagagcagtac42<212>类型DNA<211>长度42序列名称SEQID85序列描述惯用密码子序列名称SEQID85序列<213>生物体名称人工序列<400>前序列串ASRPGLMSAXPEQY14<212>类型PRT<211>长度14序列名称SEQID86序列描述特征序列SEQID86<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccggggctgaggtcggcgtagccagagcagtac42<212>类型DNA<211>长度42序列名称SEQID87序列描述惯用密码子序列名称SEQID87序列<213>生物体名称人工序列<400>前序列串ASRPGLRSAXPEQY14<212>类型PRT<211>长度14序列名称SEQID88序列描述特征序列SEQID88<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccgggactagcgggagggcgaccagaggcgtag42<212>类型DNA<211>长度42序列名称SEQID89序列描述惯用密码子序列名称SEQID89序列<213>生物体名称人工序列<400>前序列串ASRPGLAGGRPEAX14<212>类型PRT<211>长度14序列名称SEQID90序列描述特征序列SEQID90<221>特征关键词MISC_FEATURE<222>起始位置<222>终止位置其它信息其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无特征序列SEQID90<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccgggactagcgggagggcgaccagaggattag42<212>类型DNA<211>长度42序列名称SEQID91序列描述惯用密码子序列名称SEQID91序列<213>生物体名称人工序列<400>前序列串ASRPGLAGGRPEDX14<212>类型PRT<211>长度14序列名称SEQID92序列描述特征序列SEQID92<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccgggactagcgggagggcgaccagatcagtag42<212>类型DNA<211>长度42序列名称SEQID93序列描述惯用密码子序列名称SEQID93序列<213>生物体名称人工序列<400>前序列串ASRPGLAGGRPDQX14<212>类型PRT<211>长度14序列名称SEQID94序列描述特征序列SEQID94<221>特征关键词MISC_FEATURE<222>起始位置<222>终止位置其它信息其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无特征序列SEQID94<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccgggtctgtaggctgggcgaccagagcagtac42<212>类型DNA<211>长度42序列名称SEQID95序列描述惯用密码子序列名称SEQID95序列<213>生物体名称人工序列<400>前序列串ASRPGLXAGRPEQY14<212>类型PRT<211>长度14序列名称SEQID96序列描述特征序列SEQID96<221>特征关键词MISC_FEATURE<222>起始位置<222>终止位置其它信息其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无特征序列SEQID96<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccggggctggttccggggcgaccagagcagtag42<212>类型DNA<211>长度42序列名称SEQID97序列描述惯用密码子序列名称SEQID97序列<213>生物体名称人工序列<400>前序列串ASRPGLVPGRPEQX14<212>类型PRT<211>长度14序列名称SEQID98序列描述特征序列SEQID98<221>特征关键词MISC_FEATURE<222>起始位置<222>终止位置其它信息其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无特征序列SEQID98<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccggggcttgtgtctgcttagccagagcagtac42<212>类型DNA<211>长度42序列名称SEQID99序列描述惯用密码子序列名称SEQID99序列<213>生物体名称人工序列<400>前序列串ASRPGLVSAXPEQY14<212>类型PRT<211>长度14序列名称SEQID100序列描述特征序列SEQID100<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccgggactagcgggagggcgaccacatccgtag42<212>类型DNA<211>长度42序列名称SEQID101序列描述惯用密码子序列名称SEQID101序列<213>生物体名称人工序列<400>前序列串ASRPGLAGGRPHPX14<212>类型PRT<211>长度14序列名称SEQID101序列描述特征序列SEQID102<221>特征关键词MISC_FEATURE<222>起始位置<222>终止位置其它信息其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无特征序列SEQID102<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccgggactagcgggagggcgaccagatgcgtag42<212>类型DNA<211>长度42序列名称SEQID103序列描述惯用密码子序列名称SEQID103序列<213>生物体名称人工序列<400>前序列串ASRPGLAGGRPDAX14<212>类型PRT<211>长度14序列名称SEQID104序列描述特征序列SEQID104<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gcctcgaggccgggtctgattagtgcttagccagagcagtac42<212>类型DNA<211>长度42序列名称SEQID105序列描述惯用密码子序列名称SEQID105序列<213>生物体名称人工序列<400>前序列串ASRPGLISAXPEQY14<212>类型PRT<211>长度14序列名称SEQID106序列描述特征序列SEQID106<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置14<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggaagcttcag33<212>类型DNA<211>长度33序列名称SEQID107序列描述惯用密码子序列名称SEQID107序列<213>生物体名称人工序列<400>前序列串AVTTDSWGKLQ11<212>类型PRT<211>长度11序列名称SEQID108序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggccgcttcag33<212>类型DNA<211>长度33序列名称SEQID109序列描述惯用密码子序列名称SEQID109序列<213>生物体名称人工序列<400>前序列串AVTTDSWGPLQ11<212>类型PRT<211>长度11序列名称SEQID110序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggaagatgcag33<212>类型DNA<211>长度33序列名称SEQID111序列描述惯用密码子序列名称SEQID111序列<213>生物体名称人工序列<400>前序列串AVTTDSWGKMQ11<212>类型PRT<211>长度11序列名称SEQID112序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggaagttgcat33<212>类型DNA<211>长度33序列名称SEQID113序列描述惯用密码子序列名称SEQID113序列<213>生物体名称人工序列<400>前序列串AVTTDSWGKLH11<212>类型PRT<211>长度11序列名称SEQID114序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggtagcttcat33<212>类型DNA<211>长度33序列名称SEQID115序列描述惯用密码子序列名称SEQID115序列<213>生物体名称人工序列<400>前序列串AVTTDSWGXLH11<212>类型PRT<211>长度11序列名称SEQID116序列描述特征序列SEQID116<221>特征关键词MISC_FEATURE<222>起始位置<222>终止位置其它信息其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无特征序列SEQID116<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置11<223>其它信息x代表琥珀密码子编码的氨基酸残基CDS连接无序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctggggggagcttcat33<212>类型DNA<211>长度33序列名称SEQID117序列描述惯用密码子序列名称SEQID117序列<213>生物体名称人工序列<400>前序列串AVTTDSWGELH11<212>类型PRT<211>长度11序列名称SEQID118序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggaggctgcat33<212>类型DNA<211>长度33序列名称SEQID119序列描述惯用密码子序列名称SEQID119序列<213>生物体名称人工序列<400>前序列串AVTTDSWGRLH11<212>类型PRT<211>长度11序列名称SEQID120序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggcagcttcat33<212>类型DNA<211>长度33序列名称SEQID121序列描述惯用密码子序列名称SEQID121序列<213>生物体名称人工序列<400>前序列串AVTTDSWGQLH11<212>类型PRT<211>长度11序列名称SEQID122序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggaaggttcat33<212>类型DNA<211>长度33序列名称SEQID123序列描述惯用密码子序列名称SEQID123序列<213>生物体名称人工序列<400>前序列串AVTTDSWGKVH11<212>类型PRT<211>长度11序列名称SEQID124序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggaaggtgaat33<212>类型DNA<211>长度33序列名称SEQID125序列描述惯用密码子序列名称SEQID125序列<213>生物体名称人工序列<400>前序列串AVTTDSWGKVN11<212>类型PRT<211>长度11序列名称SEQID126序列描述序列<213>生物体名称人工序列<400>前序列串gccgttacaactgacagctgggggaagcttctg33<212>类型DNA<211>长度33序列名称SEQID127序列描述惯用密码子序列名称SEQID127序列<213>生物体名称人工序列<400>前序列串AVTTDSWGKLL11<212>类型PRT<211>长度11序列名称SEQID128序列描述序列<213>生物体名称人工序列<400>前序列串ggaattcatcgatgcagaaggaagtggagcag32<212>类型DNA<211>长度32序列名称SEQID129序列描述惯用密码子序列名称SEQID129序列<213>生物体名称人工序列<400>前序列串gtacacggccgggtcagggttctggatatac31<212>类型DNA<211>长度31序列名称SEQID130序列描述惯用密码子序列名称SEQID130序列<213>生物体名称人工序列<400>前序列串tctctcattaatgaatgctggtgtcactcagacccc36<212>类型DNA<211>长度36序列名称SEQID131序列描述惯用密码子序列名称SEQID131序列<213>生物体名称人工序列<400>前序列串tagaaaccggtggccaggcacaccagtgtggc32<212>类型DNA<211>长度32序列名称SEQID132序列描述惯用密码子序列名称SEQID132序列<213>生物体名称人工序列<400>前序列串ctgctctggttccgcactc19<212>类型DNA<211>长度19序列名称SEQID133序列描述惯用密码子序列名称SEQID133序列<213>生物体名称人工序列<400>前序列串gagtgcggaaccagagcag19<212>类型DNA<211>长度19序列名称SEQID134序列描述惯用密码子序列名称SEQID134序列<213>生物体名称人工序列<400>前序列串atatccagaacccggatcctgccgtgta28<212>类型DNA<211>长度28序列名称SEQID135序列描述惯用密码子序列名称SEQID135序列<213>生物体名称人工序列<400>前序列串tacacggcaggaatccgggttctggatat29<212>类型DNA<211>长度29序列名称SEQID136序列描述惯用密码子序列名称SEQID136序列<213>生物体名称人工序列<400>前序列串ggagatatacatatgcaggaggtgacacag30<212>类型DNA<211>长度30序列名称SEQID137序列描述惯用密码子序列名称SEQID137序列<213>生物体名称人工序列<400>前序列串tacacggcaggatccgggttctggatatt29<212>类型DNA<211>长度29序列名称SEQID138序列描述惯用密码子序列名称SEQID138序列<213>生物体名称人工序列<400>前序列串ggagatatacatatgggtgtcactcagacc30<212>类型DNA<211>长度30序列名称SEQID139序列描述惯用密码子序列名称SEQID139序列<213>生物体名称人工序列<400>前序列串cccaagcttagtctgctctaccccaggcctcggc34<212>类型DNA<211>长度34序列名称SEQID140序列描述惯用密码子序列名称SEQID140序列<213>生物体名称人工序列<400>前序列串gccggccatggccaaacaggaggtgacgcagattcct37<212>类型DNA<211>长度37序列名称SEQID141序列描述惯用密码子序列名称SEQID141序列<213>生物体名称人工序列<400>前序列串cttcttaaagaattcttaattaacctaggttattaggaactttctgggctggggaag57<212>类型DNA<211>长度57序列名称SEQID142序列描述惯用密码子序列名称SEQID142序列<213>生物体名称人工序列<400>前序列串tcacagcgcgcaggctggtgtcactcagaccccaaa36<212>类型DNA<211>长度36序列名称SEQID143序列描述惯用密码子序列名称SEQID143序列<213>生物体名称人工序列<400>前序列串cgagagcccgtagaactggacttg24<212>类型DNA<211>长度24序列名称SEQID144序列描述惯用密码子序列名称SEQID144序列<213>生物体名称人工序列<400>前序列串tctctcattaatgaatgctggtgtcactcagacccc36<212>类型DNA<211>长度36序列名称SEQID145序列描述惯用密码子序列名称SEQID145序列<213>生物体名称人工序列<400>前序列串tagaaaccggtggccaggcacaccagtgtgg31<212>类型DNA<211>长度31序列名称SEQID146序列描述惯用密码子序列名称SEQID146序列<213>生物体名称人工序列<400>前序列串atgcagaaggaagtggagcagaactctggacccctcagtgttccagagggagccattgcc60tctctcaactgcacttacagtgaccgaggttcccagtccttcttctggtacagacaatat120tctgggaaaagccctgagttgataatgtccatatactccaatggtgacaaagaagatgga180aggtttacagcacagctcaataaagccagccagtatgtttctctgctcatcagagactcc240cagcccagtgattcagccacctacctctgtgccgttacaactgacagctgggggaaattg300cagtttggagcagggacccaggttgtggtcaccccagatatccagaaccctgaccctgcc360gtgtaccagctgagagactctaaatccagtgacaagtctgtctgcctattcaccgatttt420gattctcaaacaaatgtgtcacaaagtaaggattctgatgtgtatatcacagacaaatgt480gtgctagacatgaggtctatggacttcaagagcaacagtgctgtggcctggagcaacaaa540tctgactttgcatgtgcaaacgccttcaacaacagcattattccagaagacaccttcttc600cccagcccagaaagttcctaa621<212>类型DNA<211>长度621序列名称SEQID147序列描述惯用密码子序列名称SEQID147序列<213>生物体名称人工序列<400>前序列串atgaacgctggtgtcactcagaccccaaaattccaggtcctgaagacaggacagagcatg60acactgcagtgtgcccaggatatgaaccatgaatacatgtcctggtatcgacaagaccca120ggcatggggctgaggctgattcattactcagttggtgctggtatcactgaccaaggagaa180gtccccaatggctacaatgtctccagatcaaccacagaggatttcccgctcaggctgctg240tcggctgctccctcccagacatctgtgtacttctgtgccagcaggccgggactagcggga300gggcgaccagagcagtacttcgggccgggcaccaggctcacggtcacagaggacctgaaa360aacgtgttcccacccgaggtcgctgtgtttgagccatcagaagcagagatctcccacacc420caaaaggccacactggtgtgcctggccacaggcttctaccccgaccacgtggagctgagc480tggtgggtgaatgggaaggaggtgcacagtggggtctgcacagacccgcagcccctcaag540gagcagcccgccctcaatgactccagatacgctctgagcagccgcctgagggtctcggcc600accttctggcaggacccccgcaaccacttccgctgtcaagtccagttctacgggctctcg660gagaatgacgagtggacccaggatagggccaaacccgtcacccagatcgtcagcgccgag720gcctggggtagagcagactaa741<212>类型DNA<211>长度741序列名称SEQID148序列描述惯用密码子序列名称SEQID148序列<213>生物体名称人工序列<400>前序列串MQKEVEQNSGPLSVPEGAIASLNCTYSDRGSQSFFWYRQYSGKSPELIMSIYSNGDKEDG60RFTAQLNKASQYVSLLIRDSQPSDSATYLCAVTTDSWGKLQFGAGTQVVVTPDIQNPDPA120VYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWSNK180SDFACANAFNNSIIPEDTFFPSPESS206<212>类型PRT<211>长度206序列名称SEQID149序列描述序列<213>生物体名称人工序列<400>前序列串MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE60VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTVTEDLK120NVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLK180EQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAE240AWGRAD246<212>类型PRT<211>长度246序列名称SEQID150序列描述序列<213>生物体名称人工序列<400>前序列串gttaactacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatt60tttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttca120ataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattccctt180ttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaaga240tgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaa300gatccttgagagttttcgccccgaagaacgttctccaatgatgagcacttttaaagttct360gctatgtggcgcggtattatcccgtgttgacgccgggcaagagcaactcggtcgccgcat420acactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacgga480tggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggc540caacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacat600gggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaa660cgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaac720tggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataa780agttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatc840tggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagcc900ctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatag960acagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagttta1020ctcatatatactttagattgatttaccccggttgataatcagaaaagccccaaaaacagg1080aagattgtataagcaaatatttaaattgtaaacgttaatattttgttaaaattcgcgtta1140aatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaaatcccttat1200aaatcaaaagaatagcccgagatagggttgagtgttgttccagtttggaacaagagtcca1260ctattaaagaacgtggactccaacgtcaaagggcgaaaaaccgtctatcagggcgatggc1320ccactacgtgaaccatcacccaaatcaagttttttggggtcgaggtgccgtaaagcacta1380aatcggaaccctaaagggagcccccgatttagagcttgacggggaaagcgaacgtggcga1440gaaaggaagggaagaaagcgaaaggagcgggcgctagggcgctggcaagtgtagcggtca1500cgctgcgcgtaaccaccacacccgccgcgcttaatgcgccgctacagggcgcgtaaaagg1560atctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcg1620ttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatccttttttt1680ctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttg1740ccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagata1800ccaaatactgttcttctagtgtagccgtagttaggccaccacttcaagaactctgtagca1860ccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataag1920tcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggc1980tgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgaga2040tacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacagg2100tatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaac2160gcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttg2220tgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacgg2280ttcctggccttttgctggccttttgctcacatgtaatgtgagttagctcactcattaggc2340accccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggata2400acaatttcacacaggaaacagctatgaccatgattacgccaagctacgtataataatatt2460ctatttcaaggagacagtcataatgaaatacctattgcctacggcagccgctggattgtt2520attactcgcggcccagccggccatggcccagaaggaagtggagcagaactctggacccct2580cagtgttccagagggagccattgcctctctcaactgcacttacagtgaccgaggttccca2640gtccttcttctggtacagacaatattctgggaaaagccctgagttgataatgtccatata2700ctccaatggtgacaaagaagatggaaggtttacagcacagctcaataaagccagccagta2760tgtttctctgctcatcagagactcccagcccagtgattcagccacctacctctgtgccgt2820tacaactgacagctgggggaaattgcagtttggagcagggacccaggttgtggtcacccc2880agatatccagaaccctgaccctgccgtgtaccagctgagagactctaaatccagtgacaa2940gtctgtctgcctattcaccgattttgattctcaaacaaatgtgtcacaaagtaaggattc3000tgatgtgtatatcacagacaaatgtgtgctagacatgaggtctatggacttcaagagcaa3060cagtgctgtggcctggagcaacaaatctgactttgcatgtgcaaacgccttcaacaacag3120cattattccagaagacaccttcttccccagcccagaaagttcctaataacctaggttaat3180taagaattctttaagaaggagatatacatatgaaaaaattattattcgcaattcctttag3240ttgttcctttctattctcacagcgcgcaggctggtgtcactcagaccccaaaattccagg3300tcctgaagacaggacagagcatgacactgcagtgtgcccaggatatgaaccatgaataca3360tgtcctggtatcgacaagacccaggcatggggctgaggctgattcattactcagttggtg3420ctggtatcactgaccaaggagaagtccccaatggctacaatgtctccagatcaaccacag3480aggatttcccgctcaggctgctgtcggctgctccctcccagacatctgtgtacttctgtg3540ccagcaggccgggactagcgggagggcgaccagagcagtacttcgggccgggcaccaggc3600tcacggtcacagaggacctgaaaaacgtgttcccacccgaggtcgctgtgtttgagccat3660cagaagcagagatctcccacacccaaaaggccacactggtgtgcctggccacaggcttct3720accccgaccacgtggagctgagctggtgggtgaatgggaaggaggtgcacagtggggtct3780gcacagacccgcagcccctcaaggagcagcccgccctcaatgactccagatacgctctga3840gcagccgcctgagggtctcggccaccttctggcaggacccccgcaaccacttccgctgtc3900aagtccagttctacgggctctcggagaatgacgagtggacccaggatagggccaaacccg3960tcacccagatcgtcagcgccgaggcctggggtagagcagacgcggccgcatctagacatc4020atcaccatcatcactagactgttgaaagttgtttagcaaaaccccatacagaaaattcat4080ttactaacgtctggaaagacgacaaaactttagatcgttacgctaactatgagggttgtc4140tgtggaatgctacaggcgttgtagtttgtactggtgacgaaactcagtgttacggtacat4200gggttcctattgggcttgctatccctgaaaatgagggtggtggctctgagggtggcggtt4260ctgagggtggcggttctgagggtggcggtactaaacctcctgagtacggtgatacaccta4320ttccgggctatacttatatcaaccctctcgacggcacttatccgcctggtactgagcaaa4380accccgctaatcctaatccttctcttgaggagtctcagcctcttaatactttcatgtttc4440agaataataggttccgaaataggcagggggcattaactgtttatacgggcactgttactc4500aaggcactgaccccgttaaaacttattaccagtacactcctgtatcatcaaaagccatgt4560atgacgcttactggaacggtaaattcagagactgcgctttccattctggctttaatgagg4620atccattcgtttgtgaatatcaaggccaatcgtctgacctgcctcaacctcctgtcaatg4680ctggcggcggctctggtggtggttctggtggcggctctgagggtggtggctctgagggtg4740gcggttctgagggtggcggctctgagggaggcggttccggtggtggctctggttccggtg4800attttgattatgaaaagatggcaaacgctaataagggggctatgaccgaaaatgccgatg4860aaaacgcgctacagtctgacgctaaaggcaaacttgattctgtcgctactgattacggtg4920ctgctatcgatggtttcattggtgacgtttccggccttgctaatggtaatggtgctactg4980gtgattttgctggctctaattcccaaatggctcaagtcggtgacggtgataattcacctt5040taatgaataatttccgtcaatatttaccttccctccctcaatcggttgaatgtcgccctt5100ttgtctttagcgctggtaaaccatatgaattttctattgattgtgacaaaataaacttat5160tccgtggtgtctttgcgtttcttttatatgttgccacctttatgtatgtattttctacgt5220ttgctaacatactgcgtaataaggagtcttaataaggtaccctctagtcaaggcctatag5280tgagtcgtattacggactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgt5340tacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaaga5400ggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcttcgc5460ttggtaataaagcccgcttcggcgggctttttttt5495<212>类型DNA<211>长度5495序列名称SEQID151序列描述惯用密码子序列名称SEQID151序列<213>生物体名称人工序列<400>前序列串agctgcagctaatacgactcactataggaacaggccaccatgggccagaaggaagtggag60cagaactctggacccctcagtgttccagagggagccattgcctctctcaactgcacttac120agtgaccgaggttcccagtccttcttctggtacagacaatattctgggaaaagccctgag180ttgataatgtccatatactccaatggtgacaaagaagatggaaggtttacagcacagctc240aataaagccagccagtatgtttctctgctcatcagagactcccagcccagtgattcagcc300acctacctctgtgccgttacaactgacagctgggggaaattgcagtttggagcagggacc360caggttgtggtcaccggtggaggcggttcaggcggaggtggatccggcggtggcgggtcg420aacgctggtgtcactcagaccccaaaattccaggtcctgaagacaggacagagcatgaca480ctgcagtgtgcccaggatatgaaccatgaatacatgtcctggtatcgacaagacccaggc540atggggctgaggctgattcattactcagttggtgctggtatcactgaccaaggagaagtc600cccaatggctacaatgtctccagatcaaccacagaggatttcccgctcaggctgctgtcg660gctgctccctcccagacatctgtgtacttctgtgccagcaggccgggactagcgggaggg720cgaccagagcagtacttcgggccgggcaccaggctcacggtcacagaggacctgaaaaac780gtgttcccacccgaggtcgctgtgtttgagccatcagaagcagagatctcccacacccaa840aaggccacactggtgtgcctggccacaggcttctaccccgaccacgtggagctgagctgg900tgggtgaatgggaaggaggtgcacagtggggtcagcacagacccgcagcccctcaaggag960cagcccgccctcaatgactccagatacgctctgagcagccgcctgagggtctcggccacc1020ttctggcaggacccccgcaaccacttccgctgtcaagtccagttctacgggctctcggag1080aatgacgagtggacccaggatagggccaaacccgtcacccagatcgtcagcgccgaggcc1140tggggtagagcagacggtggaggcggttcactcagcagcaccctgacgctgagcaaagca1200gactacgagaaacacaaagtctacgcctgcgaagtcacccatcagggcctgagttcgccc1260gtcacaaagagcttcaaccgcggagagtcataagaattctcag1303<212>类型DNA<211>长度1303序列名称SEQID152序列描述惯用密码子序列名称SEQID152序列<213>生物体名称人工序列<400>前序列串MGQKEVEQNSGPLSVPEGAIASLNCTYSDRGSQSFFWYRQYSGKSPELIMSIYSNGDKED60GRFTAQLNKASQYVSLLIRDSPSDSATYLCAVTTDSWGKLQFGAGTQVVVTGGGGSGGGG120SGGGGSNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGI180TDQGEVPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTV240TEDLKNVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVSTD300PQPLKEQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQ360IVSAEAWGRADGGGGSLSSTLTLSKADYEKHKVYACEVTHQGLSSPVTKSFNRGES416<212>类型PRT<211>长度416序列名称SEQID153序列描述序列<213>生物体名称人工序列<400>前序列串ctgctttcccggagcactatgcggataaaaatatccaattacagtactattattaccaaa60gaatctgcagtccaccgtgaaaagcccctttacacgcgccttggggataaacaaataaaa120agatttatgtaagtttatacataggcgagtactctgttattgggactatttacgaagtta180ttataactttttccttctcatactcataagttgtaaaggcacagcgggaataagggaaaa240aacgccgtaaaacggaaggacaaaaacgagtgggtctttgcgaccactttcattttctac300gacttctagtcaacccacgtgctcacccaatgtagcttgacctagagttgtcgccattct360aggaactctcaaaagcggggcttcttgcaaaaggttactactcgtgaaaatttcaagacg420atacaccgcgccataatagggcataactgcggcccgttctcgttgagccagcggcgtatg480tgataagagtcttactgaaccaactcatgagtggtcagtgtcttttcgtagaatgcctac540cgtactgtcattctcttaatacgtcacgacggtattggtactcactattgtgacgccggt600tgaatgaagactgttgctagcctcctggcttcctcgattggcgaaaaaacgtgttgtacc660ccctagtacattgagcggaactagcaacccttggcctcgacttacttcggtatggtttgc720tgctcgcactgtggtgctacggacatcgttaccgttgttgcaacgcgtttgataattgac780cgcttgatgaatgagatcgaagggccgttgttaattatctgacctacctccgcctatttc840aacgtcctggtgaagacgcgagccgggaaggccgaccgaccaaataacgactatttagac900ctcggccactcgcacccagagcgccatagtaacgtcgtgaccccggtctaccattcggga960gggcatagcatcaatagatgtgctgcccctcagtccgttgatacctacttgctttatctg1020tctagcgactctatccacggagtgactaattcgtaaccattgacagtctggttcaaatga1080gtatatatgaaatctaactaaattttgaagtaaaaattaaattttcctagatccacttct1140aggaaaaactattagagtactggttttagggaattgcactcaaaagcaaggtgactcgca1200gtctggggcatcttttctagtttcctagaagaactctaggaaaaaaagacgcgcattaga1260cgacgaacgtttgtttttttggtggcgatggtcgccaccaaacaaacggcctagttctcg1320atggttgagaaaaaggcttccattgaccgaagtcgtctcgcgtctatggtttatgacagg1380aagatcacatcggcatcaatccggtggtgaagttcttgagacatcgtggcggatgtatgg1440agcgagacgattaggacaatggtcaccgacgacggtcaccgctattcagcacagaatggc1500ccaacctgagttctgctatcaatggcctattccgcgtcgccagcccgacttgccccccaa1560gcacgtgtgtcgggtcgaacctcgcttgctggatgtggcttgactctatggatgtcgcac1620tcgatactctttcgcggtgcgaagggcttccctctttccgcctgtccataggccattcgc1680cgtcccagccttgtcctctcgcgtgctccctcgaaggtccccctttgcggaccatagaaa1740tatcaggacagcccaaagcggtggagactgaactcgcagctaaaaacactacgagcagtc1800cccccgcctcggatacctttttgcggtcgttgcgccggaaaaatgccaaggaccggaaaa1860cgaccggaaaacgagtgtacaagaaaggacgcaataggggactaagacacctattggcat1920aatggcggaaactcactcgactatggcgagcggcgtcggcttgctggctcgcgtcgctca1980gtcactcgctccttcgccttctcgcgggttatgcgtttggcggagaggggcgcgcaaccg2040gctaagtaattacgtcgaccgtgctgtccaaagggctgacctttcgcccgtcactcgcgt2100tgcgttaattacactcaatcgagtgagtaatccgtggggtccgaaatgtgaaatacgaag2160gccgagcatacaacacaccttaacactcgcctattgttaaagtgtgtcctttgtcgatac2220tggtactaatgcggttcgacgtcgattatgctgagtgatatccttgtccggtggtaccct2280aggggcccatggctcgagcttaagtgaccggcagcaaaatgttgcagcactgaccctttt2340gggaccgcaatgggttgaattagcggaacgtcgtgtagggggaaagcggtcgaccgcatt2400atcgcttctccgggcgtggctagcgggaagggttgtcaacgcgtcggacttaccgcttac2460cgcggactacgccataaaagaggaatgcgtagacacgccataaagtgtggcgtataccac2520gtgagagtcatgttagacgagactacggcgtatcaattcggtcggggctgtgggcggttg2580tgggcgactgcgcgggactgcccgaacagacgagggccgtaggcgaatgtctgttcgaca2640ctggcagaggccctcgacgtacacagtctccaaaagtggcagtagtggctttgcgcgct2699<212>类型DNA<211>长度2699序列名称SEQID154序列描述惯用密码子序列名称SEQID154序列<213>生物体名称人工序列<400>前序列串ccatgggccagaaggaagtggagcagaactctggacccctcagtgttccagagggagcca60ttgcctctctcaactgcacttacagtgaccgaggttcccagtccttcttctggtacagac120aatattctgggaaaagccctgagttgataatgtccatatactccaatggtgacaaagaag180atggaaggtttacagcacagctcaataaagccagccagtatgtttctctgctcatcagag240actcccagcccagtgattcagccacctacctctgtgccgttacaactgacagctggggga300aattgcagtttggagcagggacccaggttgtggtcaccggtggaggcggttcaggcggag360gtggatccggcggtggcgggtcgaacgctggtgtcactcagaccccaaaattccaggtcc420tgaagacaggacagagcatgacactgcagtgtgcccaggatatgaaccatgaatacatgt480cctggtatcgacaagacccaggcatggggctgaggctgattcattactcagttggtgctg540gtatcactgaccaaggagaagtccccaatggctacaatgtctccagatcaaccacagagg600atttcccgctcaggctgctgtcggctgctccctcccagacatctgtgtacttctgtgcca660gcaggccgggactagcgggagggcgaccagagcagtacttcgggccgggcaccaggctca720cggtcacagaggacctgaaaaacgtgttcccacccgaggtcgctgtgtttgagccatcag780aagcagagatctcccacacccaaaaggccacactggtgtgcctggccacaggcttctacc840ccgaccacgtggagctgagctggtgggtgaatgggaaggaggtgcacagtggggtcagca900cagacccgcagcccctcaaggagcagcccgccctcaatgactccagatacgctctgagca960gccgcctgagggtctcggccaccttctggcaggacccccgcaaccacttccgctgtcaag1020tccagttctacgggctctcggagaatgacgagtggacccaggatagggccaaacccgtca1080cccagatcgtcagcgccgaggcctggggtagagcagacggtggaggcggttcactcagca1140gcaccctgacgctgagcaaagcagactacgagaaacacaaagtctacgcctgcgaagtca1200cccatcagggcctgagttcgcccgtcacaaagagcttcaaccgcggagagtcataagaat1260tc1262<212>类型DNA<211>长度1262序列名称SEQID155序列描述惯用密码子序列名称SEQID155序列<213>生物体名称人工序列<400>前序列串gctggtgtcactcagaccccaaaattccaggtcctgaagacaggacagagcatgacactg60cagtgtgcccaggatatgaaccatgaatacatgtcctggtatcgacaagacccaggcatg120gggctgaggctgattcattactcagttggtgctggtatcactgaccaaggagaagtcccc180aatggctacaatgtctccagatcaaccacagaggatttcccgctcaggctgctgtcggct240gctccctcccagacatctgtgtacttctgtgccagcaggccgggactagcgggagggtga300ccagagcagtacttcgggccgggcaccaggctcacggtcacagaggacctgaaaaacgtg360ttcccacccgaggtcgctgtgtttgagccatcagaagcagagatctcccacacccaaaag420gccacactggtgtgcctggccacaggcttctaccccgaccacgtggagctgagctggtgg480gtgaatgggaaggaggtgcacagtggggtctgcacagacccgcagcccctcaaggagcag540cccgccctcaatgactccagatacgctctgagcagccgcctgagggtctcggccaccttc600tggcaggacccccgcaaccacttccgctgtcaagtccagttctacgggctctcggagaat660gacgagtggacccaggatagggccaaacccgtcacccagatcgtcagcgccgaggcctgg720ggtagagcagac732<212>类型DNA<211>长度732序列名称SEQID156序列描述惯用密码子序列名称SEQID156序列<213>生物体名称人工序列<400>前序列串AGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP60NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGXPEQYFGPGTRLTVTEDLKNV120FPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQ180PALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAW240GRAD244<212>类型PRT<211>长度244序列名称SEQID157序列描述特征序列SEQID157<221>特征关键词MISC_EATURE<222>起始位置1<222>终止位置244其它信息X代表乳白密码子编码的氨基酸残基,这通常被翻译成色氨酸CDS连接无序列<213>生物体名称人工序列<400>前序列串gctggtgtcactcagaccccaaaattccaggtcctgaagacaggacagagcatgacactg60tagtgtgcccaggatatgaaccatgaatacatgtcctggtatcgacaagacccaggcatg120gggctgaggctgattcattactcagttggtgctggtatcactgaccaaggagaagtcccc180aatggctacaatgtctccagatcaaccacagaggatttcccgctcaggctgctgtcggct240gctccctcccagacatctgtgtacttctgtgccagcaggccgggactagcgggagggcga300ccagagcagtacttcgggccgggcaccaggctcacggtcacagaggacctgaaaaacgtg360ttcccacccgaggtcgctgtgtttgagccatcagaagcagagatctcccacacccaaaag420gccacactggtgtgcctggccacaggcttctaccccgaccacgtggagctgagctggtgg480gtgaatgggaaggaggtgcacagtggggtctgcacagacccgcagcccctcaaggagcag540cccgccctcaatgactccagatacgctctgagcagccgcctgagggtctcggccaccttc600tggcaggacccccgcaaccacttccgctgtcaagtccagttctacgggctctcggagaat660gacgagtggacccaggatagggccaaacccgtcacccagatcgtcagcgccgaggcctgg720ggtagagcagac732<212>类型DNA<211>长度732序列名称SEQID158序列描述惯用密码子序列名称SEQID158序列<213>生物体名称人工序列<400>前序列串gctggtgtcactcagaccccaaaattccaggtcctgaagacaggacagagcatgacactg60cagtgtgcccaggatatgaaccatgaatacatgtcctggtatcgacaagacccaggcatg120gggctgaggctgattcattactcagttggtgctggtatcactgaccaaggagaagtcccc180aatggctacaatgtctccagatcaaccacagaggatttcccgctcaggctgctgtcggct240gctccctcccagacatctgtgtacttctgtgcctcgaggccggggctgatgagtgcggaa300ccagagcagtacttcgggccgggcaccaggctcacggtcacagaggacctgaaaaacgtg360ttcccacccgaggtcgctgtgtttgagccatcagaagcagagatctcccacacccaaaag420gccacactggtgtgcctggccaccggtttctaccccgaccacgtggagctgagctggtgg480gtgaatgggaaggaggtgcacagtggggtctgcacagacccgcagcccctcaaggagcag540cccgccctcaatgactccagatacgctctgagcagccgcctgagggtctcggccaccttc600tggcaggacccccgcaaccacttccgctgtcaagtccagttctacgggctctcggagaat660gacgagtggacccaggatagggccaaacccgtcacccagatcgtcagcgccgaggcctgg720ggtagagcagactaagcttgaattc745<212>类型DNA<211>长度745序列名称SEQID159序列描述惯用密码子序列名称SEQID159序列<213>生物体名称人工序列<400>前序列串MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE60VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAEPEQYFGPGTRLTVTEDLK120NVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWWNGKEVHSGVCTDPQPLK180EQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAE240AWGRAD246<212>类型PRT<211>长度246序列名称SEQID160序列描述序列<213>生物体名称人工序列<400>前序列串AGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP60NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAQPEQYFGPGTRLTVTEDLKNV120FPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQ180PALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAW240GRAD244<212>类型PRT<211>长度244序列名称SEQID161序列描述序列<213>生物体名称人工序列<400>前序列串atgcaggaggtgacacagattcctgcagctctgagtgtcccagaaggagaaaacttggtt60ctcaactgcagtttcactgatagcgctatttacaacctccagtggtttaggcaggaccct120gggaaaggtctcacatctctgttgcttattcagtcaagtcagagagagcaaacaagtgga180agacttaatgcctcgctggataaatcatcaggacgtagtactttatacattgcagcttct240cagcctggtgactcagccacctacctctgtgctgtgaggcccacatcaggaggaagctac300atacctacatttggaagaggaaccagccttattgttcatccgtatatccagaaccctgac360cctgccgtgtaccagctgagagactctaaatccagtgacaagtctgtctgcctattcacc420gattttgattctcaaacaaatgtgtcacaaagtaaggattctgatgtgtatatcacagac480aaatgtgtgctagacatgaggtctatggacttcaagagcaacagtgctgtggcctggagc540aacaaatctgactttgcatgtgcaaacgccttcaacaacagcattattccagaagacacc600ttcttccccagcccagaaagttcctaa627<212>类型DNA<211>长度627序列名称SEQID162序列描述惯用密码子序列名称SEQID162序列<213>生物体名称人工序列<400>前序列串atgggtgtcactcagaccccaaaattccaggtcctgaagacaggacagagcatgacactg60cagtgtgcccaggatatgaaccatgaatacatgtcctggtatcgacaagacccaggcatg120gggctgaggctgattcattactcagttggtgctggtatcactgaccaaggagaagtcccc180aatggctacaatgtctccagatcaaccacagaggatttcccgctcaggctgctgtcggct240gctccctcccagacatctgtgtacttctgtgccagcagttacgtcgggaacaccggggag300ctgttttttggagaaggctctaggctgaccgtactggaggacctgaaaaacgtgttccca360cccgaggtcgctgtgtttgagccatcagaagcagagatctcccacacccaaaaggccaca420ctggtgtgcctggccacaggcttctaccccgaccacgtggagctgagctggtgggtgaat480gggaaggaggtgcacagtggggtctgcacagacccgcagcccctcaaggagcagcccgcc540ctcaatgactccagatacgctctgagcagccgcctgagggtctcggccaccttctggcag600gacccccgcaaccacttccgctgtcaagtccagttctacgggctctcggagaatgacgag660tggacccaggatagggccaaacccgtcacccagatcgtcagcgccgaggcctggggtaga720gcagactaa729<212>类型DNA<211>长度729序列名称SEQID163序列描述惯用密码子序列名称SEQID163序列<213>生物体名称人工序列<400>前序列串MQEVTQIPAALSVPEGENLVLNCSFTDSAIYNLQWFRQDPGKGLTSLLLIQSSQREQTSG60RLNASLDKSSGRSTLYIAASQPGDSATYLCAVRPTSGGSYIPTFGRGTSLIVHPYIQNPD120PAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYITDKCVLDMRSMDFKSNSAVAWS180NKSDFACANAFNNSIIPEDTFFPSPESS208<212>类型PRT<211>长度208序列名称SEQID164序列描述序列<213>生物体名称人工序列<400>前序列串MGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGEVP60NGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASSYVGNTGELFFGEGSRLTVLEDLKNVFP120PEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTDPQPLKEQPa180LNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQIVSAEAWGR240AD242<212>类型PRT<211>长度242序列名称SEQID165序列描述序列<213>生物体名称人工序列<400>前序列串ttcctggccttttgctggccttttgctcacatgtaatgtgagttagctcaaaggaccgga60aaacgaccggaaaacgagtgtacattacactcaatcgagtctcattaggcaccccaggct120ttacactttatgcttccggctcgtatgttggagtaatccgtggggtccgaaatgtgaaat180acgaaggccgagcatacaactgtggaattgtgagcggataacaatttcacacaggaaaca240gctatgaccaacaccttaacactcgcctattgttaaagtgtgtcctttgtcgatactggt300tgattacgccaagctacgtacttaagtattctatttcaaggagacagtcaactaatgcgg360ttcgatgcatgaattcataagataaagttcctctgtcagttaatgaaatacctattgcct420acggcagccgctggattgttattactcgcgattactttatggataacggatgccgtcggc480gacctaacaataatgagcgcgcccagccggccatggccaaacaggaggtgacgcagattc540ctgcagctctcgggtcggccggtaccggtttgtcctccactgcgtctaaggacgtcgaga600gagtgtcccagaaggagaaaacttggttctcaactgcagtttcactgatactcacagggt660cttcctcttttgaaccaagagttgacgtcaaagtgactatgcgctatttacaacctccag720tggtttaggcaggaccctgggaaaggtctccgcgataaatgttggaggtcaccaaatccg780tcctgggaccctttccagagacatctctgttgcttattcagtcaagtcagagagagcaaa840caagtggaagtgtagagacaacgaataagtcagttcagtctctctcgtttgttcaccttc900acttaatgcctcgctggataaatcatcaggacgtagtactttatacattgtgaattacgg960agcgacctatttagtagtcctgcatcatgaaatatgtaaccagcttctcagcctggtgac1020tcagccacctacctctgtgctgtgaggcccgtcgaagagtcggaccactgagtcggtgga1080tggagacacgacactccgggacatcaggaggaagctacatacctacatttggaagaggaa1140ccagccttattgtagtcctccttcgatgtatggatgtaaaccttctccttggtcggaata1200tgttcatccgtatatccagaacccggatcctgccgtgtaccagctgagagacaagtaggc1260atataggtcttgggcctaggacggcacatggtcgactctcactctaaatccagtgacaag1320tctgtctgcctattcaccgattttgattcttgagatttaggtcactgttcagacagacgg1380ataagtggctaaaactaagacaaacaaatgtgtcacaaagtaaggattctgatgtgtata1440tcacagacaagtttgtttacacagtgtttcattcctaagactacacatatagtgtctgtt1500atgtgtgctagacatgaggtctatggacttcaagagcaacagtgctgtggtacacacgat1560ctgtactccagatacctgaagttctcgttgtcacgacacccctggagcaacaaatctgac1620tttgcatgtgcaaacgccttcaacaacagcggacctcgttgtttagactgaaacgtacac1680gtttgcggaagttgttgtcgattattccagaagacaccttcttccccagcccagaaagtt1740cctaataacctaataaggtcttctgtggaagaaggggtcgggtctttcaaggattattgg1800taggttaattaagaattctttaagaaggggatatacatatgaaaaaattaatccaattaa1860ttcttaagaaattcttcccctatatgtatacttttttaatttattcgcaattcctttagt1920tgttcctttctattctcacagcgcgcaggcaataagcgttaaggaaatcaacaaggaaag1980ataagagtgtcgcgcgtccgtggtgtcactcagaccccaaaattccaggtcctgaagaca2040ggacagagcaaccacagtgagtctggggttttaaggtccaggacttctgtcctgtctcgt2100tgacactgcagtgtgcccaggatatgaaccatgaatacatgtcctggtatactgtgacgt2160cacacgggtcctatacttggtacttatgtacaggaccatacgacaagacccaggcatggg2220gctgaggctgattcattactcagttggtgcgctgttctgggtccgtaccccgactccgac2280taagtaatgagtcaaccacgtggtatcactgaccaaggagaagtccccaatggctacaat2340gtctccagataccatagtgactggttcctcttcaggggttaccgatgttacagaggtcta2400caaccacagaggatttcccgctcaggctgctgtcggctgctccctcccaggttggtgtct2460cctaaagggcgagtccgacgacagccgacgagggagggtcacatctgtgtacttctgtgc2520cagcagttacgtcgggaacaccggggagcttgtagacacatgaagacacggtcgtcaatg2580cagcccttgtggcccctcgagttttttggagaaggctctaggctgaccgtactggaggac2640ctgaaaaacgcaaaaaacctcttccgagatccgactggcatgacctcctggactttttgc2700tgttcccacccgaggtcgctgtgtttgagccatcagaagcagagatctccacaagggtgg2760gctccagcgacacaaactcggtagtcttcgtctctagaggcacacccaaaaggccacact2820ggtgtgcctggccacaggcttctaccccgagtgtgggttttccggtgtgaccacacggac2880cggtgtccgaagatggggctccacgtggagctgagctggtgggtgaatgggaaggaggtg2940cacagtggggggtgcacctcgactcgaccacccacttacccttcctccacgtgtcacccc3000tctgcacagacccgcagcccctcaaggagcagcccgccctcaatgactccagacgtgtct3060gggcgtcggggagttcctcgtcgggcgggagttactgaggagatacgctctgagcagccg3120cctgagggtctcggccaccttctggcaggatctatgcgagactcgtcggcggactcccag3180agccggtggaagaccgtcctcccccgcaaccacttccgctgtcaagtccagttctacggg3240ctctcggagagggggcgttggtgaaggcgacagttcaggtcaagatgcccgagagcctct3300atgacgagtggacccaggatagggccaaacccgtcacccagatcgtcagctactgctcac3360ctgggtcctatcccggtttgggcagtgggtctagcagtcggccgaggcctggggtagagc3420agacgcggccgcacggctccggaccccatctcgtctgcgccggcgt3466<212>类型DNA<211>长度3466序列名称SEQID166序列描述惯用密码子序列名称SEQID166序列<213>生物体名称人工序列<400>前序列串KYLLPTAAAGLLLLAAQPAMAKQEVTQIPAALSVPEGENLVLNCSFTDSAIYNLQWFRQD60PGKGLTSLLLIQSSQREQTSGRLNASLDKSSGRSTLYIAASQPGDSATYLCAVRPTSGGS120YIPTFGRGTSLIVHPYIQNPDPAVYQLRDSKSSDKSVCLFTDFDSQTNVSQSKDSDVYIT180DKCVLDMRSMDFKSNSAVAWSNKSDFACANAFNNSIIPEDTFFPSPESSMKKLLFAIPLV240VPFYSHSAQAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGa300GITDQGEVPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASSYVGNTGELFFGEGSRLTV260LEDLKNVFPPEVAVFEPSEAEISHTQKATLVCLATGFYPDHVELSWWVNGKEVHSGVCTD420PQPLKEQPALNDSRYALSSRLRVSATFWQDPRNHFRCQVQFYGLSENDEWTQDRAKPVTQ480IVSAEAWGRADAAa494<212>类型PRT<211>长度494序列名称SEQID167序列描述序列<213>生物体名称人工序列<400>前序列串ggatccatggccataagtggagtccctgtgctaggatttttcatcatagctgtgctgatg60agcgctcaggaatcatgggctatcaaagaagaacatgtgatcatccaggccgagttctat120ctgaatcctgaccaatcaggcgagtttatgtttgactttgatggtgatgagattttccat180gtggatatggcaaagaaggagacggtctggcggcttgaagaatttggacgatttgccagc240tttgaggctcaaggtgcattggccaacatagctgtggacaaagccaacctggaaatcatg300acaaagcgctccaactatactccgatcaccaatgtacctccagaggtaactgtgctcacg360aacagccctgtggaactgagagagcccaacgtcctcatctgtttcatcgacaagttcacc420ccaccagtggtcaatgtcacgtggcttcgaaatggaaaacctgtcaccacaggagtgtca480gagacagtcttcctgcccagggaagaccaccttttccgcaagttccactatctccccttc540ctgccctcaactgaggacgtttacgactgcagggtggagcactggggcttggatgagcct600cttctcaagcactgggagtttgatgctccaagccctctcccagagactacagagaacgtg660gatgggggtctgactgatacactccaagcggagacagatcaacttgaagacaagaagtct720gcgttgcagaccgagattgccaatctactgaaagagaaggaaaaactagagttcatcctg780gcagcttacggatctggtggtggtctgaacgatatttttgaagctcagaaaatcgaatgg840catgagtaggatcc854<212>类型DNA<211>长度854序列名称SEQID168序列描述惯用密码子序列名称SEQID168序列<213>生物体名称人工序列<400>前序列串aattctactcgtaaagcgagttgaaggatcatatttagttgcgtttatgagataagattg60aaagcacgtgtaaaatgtttcccgcgcgttggcacaactatttacaatgcggccaagtta120taaaagattctaatctgatatgttttaaaacacctttgcggcccgagttgtttgcgtacg180tgactagcgaagaagatgtgtggaccgcagaacagatagtaaaacaaaaccctagtattg240gagcaataatcgatttaaccaacacgtctaaatattatgatggtgtgcattttttgcggg300cgggcctgttatacaaaaaaattcaagtacctggccagactttgccgcctgaaagcatag360ttcaagaatttattgacacggtaaaagaatttacagaaaagtgtcccggcatgttggtgg420gcgtgcactgcacacacggtattaatcgcaccggttacatggtgtgcagatatttaatgc480acaccctgggtattgcgccgcaggaagccatagatagattcgaaaaagccagaggtcaca540aaattgaaagacaaaattacgttcaagatttattaatttaattaatattatttgcattct600ttaacaaatactttatcctattttcaaattgttgcgcttcttccagcgaaccaaaactat660gcttcgcttgctccgtttagcttgtagccgatcagtggcgttgttccaatcgacggtagg720attaggccggatattctccaccacaatgttggcaacgttgatgttacgtttatgcttttg780gttttccacgtacgtcttttggccggtaatagccgtaaacgtagtgccgtcgcgcgtcac840gcacaacaccggatgtttgcgcttgtccgcggggtattgaaccgcgcgatccgacaaatc900caccactttggcaactaaatcggtgacctgcgcgtcttttttctgcattatttcgtcttt960cttttgcatggtttcctggaagccggtgtacatgcggtttagatcagtcatgacgcgcgt1020gacctgcaaatctttggcctcgatctgcttgtccttgatggcaacgatgcgttcaataaa1080ctcttgttttttaacaagttcctcggttttttgcgccaccaccgcttgcagcgcgtttgt1140gtgctcggtgaatgtcgcaatcagcttagtcaccaactgtttgctctcctcctcccgttg1200tttgatcgcgggatcgtacttgccggtgcagagcacttgaggaattacttcttctaaaag1260ccattcttgtaattctatggcgtaaggcaatttggacttcataatcagctgaatcacgcc1320ggatttagtaatgagcactgtatgcggctgcaaatacagcgggtcgccccttttcacgac1380gctgttagaggtagggcccccattttggatggtctgctcaaataacgatttgtatttatt1440gtctacatgaacacgtatagctttatcacaaactgtatattttaaactgttagcgacgtc1500cttggccacgaaccggacctgttggtcgcgctctagcacgtaccgcaggttgaacgtatc1560ttctccaaatttaaattctccaattttaacgcgagccattttgatacacgtgtgtcgatt1620ttgcaacaactattgttttttaacgcaaactaaacttattgtggtaagcaataattaaat1680atgggggaacatgcgccgctacaacactcgtcgttatgaacgcagacggcgccggtctcg1740gcgcaagcggctaaaacgtgttgcgcgttcaacgcggcaaacatcgcaaaagccaatagt1800acagttttgatttgcatattaacggcgattttttaaattatcttatttaataaatagtta1860tgacgcctacaactccccgcccgcgttgactcgctgcacctcgagcagttcgttgacgcc1920ttcctccgtgtggccgaacacgtcgagcgggtggtcgatgaccagcggcgtgccgcacgc1980gacgcacaagtatctgtacaccgaatgatcgtcgggcgaaggcacgtcggcctccaagtg2040gcaatattggcaaattcgaaaatatatacagttgggttgtttgcgcatatctatcgtggc2100gttgggcatgtacgtccgaacgttgatttgcatgcaagccgaaattaaatcattgcgatt2160agtgcgattaaaacgttgtacatcctcgcttttaatcatgccgtcgattaaatcgcgcaa2220tcgagtcaagtgatcaaagtgtggaataatgttttctttgtattcccgagtcaagcgcag2280cgcgtattttaacaaactagccatcttgtaagttagtttcatttaatgcaactttatcca2340ataatatattatgtatcgcacgtcaagaattaacaatgcgcccgttgtcgcatctcaaca2400cgactatgatagagatcaaataaagcgcgaattaaatagcttgcgacgcaacgtgcacga2460tctgtgcacgcgttccggcacgagctttgattgtaataagtttttacgaagcgatgacat2520gacccccgtagtgacaacgatcacgcccaaaagaactgccgactacaaaattaccgagta2580tgtcggtgacgttaaaactattaagccatccaatcgaccgttagtcgaatcaggaccgct2640ggtgcgagaagccgcgaagtatggcgaatgcatcgtataacgtgtggagtccgctcatta2700gagcgtcatgtttagacaagaaagctacatatttaattgatcccgatgattttattgata2760aattgaccctaactccatacacggtattctacaatggcggggttttggtcaaaatttccg2820gactgcgattgtacatgctgttaacggctccgcccactattaatgaaattaaaaattcca2880attttaaaaaacgcagcaagagaaacatttgtatgaaagaatgcgtagaaggaaagaaaa2940atgtcgtcgacatgctgaacaacaagattaatatgcctccgtgtataaaaaaaatattga3000acgatttgaaagaaaacaatgtaccgcgcggcggtatgtacaggaagaggtttatactaa3060actgttacattgcaaacgtggtttcgtgtgccaagtgtgaaaaccgatgtttaatcaagg3120ctctgacgcatttctacaaccacgactccaagtgtgtgggtgaagtcatgcatcttttaa3180tcaaatcccaagatgtgtataaaccaccaaactgccaaaaaatgaaaactgtcgacaagc3240tctgtccgtttgctggcaactgcaagggtctcaatcctatttgtaattattgaataataa3300aacaattataaatgctaaatttgttttttattaacgatacaaaccaaacgcaacaagaac3360atttgtagtattatctataattgaaaacgcgtagttataatcgctgaggtaatatttaaa3420atcattttcaaatgattcacagttaatttgcgacaatataattttattttcacataaact3480agacgccttgtcgtcttcttcttcgtattccttctctttttcatttttctcctcataaaa3540attaacatagttattatcgtatccatatatgtatctatcgtatagagtaaattttttgtt3600gtcataaatatatatgtcttttttaatggggtgtatagtaccgctgcgcatagtttttct3660gtaatttacaacagtgctattttctggtagttcttcggagtgtgttgctttaattattaa3720atttatataatcaatgaatttgggatcgtcggttttgtacaatatgttgccggcatagta3780cgcagcttcttctagttcaattacaccattttttagcagcaccggattaacataactttc3840caaaatgttgtacgaaccgttaaacaaaaacagttcacctcccttttctatactattgtc3900tgcgagcagttgtttgttgttaaaaataacagccattgtaatgagacgcacaaactaata3960tcacaaactggaaatgtctatcaatatatagttgctgatgatccagcatgataagataca4020ttgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaa4080tttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttccgagtt4140tgtcagaaagcagaccaaacagcggttggaataatagcgagaacagagaaatagcggcaa4200aaataatacccgtatcacttttgctgatatggttgatgtcatgtagccaaatcgggaaaa4260acgggaagtaggctcccatgataaaaaagtaaaagaaaaagaataaaccgaacatccaaa4320agtttgtgttttttaaatagtacataatggatttccttacgcgaaatacgggcagacatg4380gcctgcccggttattattatttttgacaccagaccaactggtaatggtagcgaccggcgc4440tcagctggaattcagatctgtgattgtaaataaaatgtaatttacagtatagtattttaa4500ttaatatacaaatgatttgataataattcttatttaactataatatattgtgttgggttg4560aattaaaggtcccggcatcctcaaatgcataatttcatagtcccccttgttgtaagtgat4620gcgtatttctgaatctttgtaaaatagcacacaagactccaacgcgtttggcgttttatt4680ttcttgctcgactctagtttattaggcctctagagatccgtatttataggtttttttatt4740acaaaactgttacgaaaacagtaaaatacttatttatttgcgagatggttatcattttaa4800ttatctccatgatccaataaacctagaataaagggcccgacctttaattcaacccaacac4860aatatattatagttaaataagaattattatcaaatcatttgtatattaattaaaatacta4920tactgtaaattacattttatttacaatcacagatcccggggatccggttattagtacatt4980tattaagcgctagattctgtgcgttgttgatttacagacaattgttgtacgtattttaat5040aattcattaaatttataatctttagggtggtatgttagagcgaaaatcaaatgattttca5100gcgtctttatatctgaatttaaatattaaatcctcaatagatttgtaaaataggtttcga5160ttagtttcaaacaagggttgtttttccgaaccgatggctggactatctaatggattttcg5220ctcaacgccacaaaacttgccaaatcttgtagcagcaatctagctttgtcgatattcgtt5280tgtgttttgttttgtaataaaggttcgacgtcgttcaaaatattatgcgcttttgtattt5340ctttcatcactgtcgttagtgtacaattgactcgacgtaaacacgttaaataaagcttgg5400acatatttaacatcgggcgtgttagctttattaggccgattatcgtcgtcgtcccaaccc5460tcgtcgttagaagttgcttccgaagacgattttgccatagccacacgacgcctattaatt5520gtgtcggctaacacgtccgcgatcaaatttgtagttgagctttttggaattatttctgat5580tgcgggcgtttttgggcgggtttcaatctaactgtgcccgattttaattcagacaacacg5640ttagaaagcgatggtgcaggcggtggtaacatttcagacggcaaatctactaatggcggc5700ggtggtggagctgatgataaatctaccatcggtggaggcgcaggcggggctggcggcgga5760ggcggaggcggaggtggtggcggtgatgcagacggcggtttaggctcaaatgtctcttta5820ggcaacacagtcggcacctcaactattgtactggtttcgggcgccgtttttggtttgacc5880ggtctgagacgagtgcgatttttttcgtttctaatagcttccaacaattgttgtctgtcg5940tctaaaggtgcagcgggttgaggttccgtcggcattggtggagcgggcggcaattcagac6000atcgatggtggtggtggtggtggaggcgctggaatgttaggcacgggagaaggtggtggc6060ggcggtgccgccggtataatttgttctggtttagtttgttcgcgcacgattgtgggcacc6120ggcgcaggcgccgctggctgcacaacggaaggtcgtctgcttcgaggcagcgcttggggt6180ggtggcaattcaatattataattggaatacaaatcgtaaaaatctgctataagcattgta6240atttcgctatcgtttaccgtgccgatatttaacaaccgctcaatgtaagcaattgtattg6300taaagagattgtctcaagctcggatcgatcccgcacgccgataacaagccttttcatttt6360tactacagcattgtagtggcgagacacttcgctgtcgtcgacgtacatgtatgctttgtt6420gtcaaaaacgtcgttggcaagctttaaaatatttaaaagaacatctctgttcagcaccac6480tgtgttgtcgtaaatgttgtttttgataatttgcgcttccgcagtatcgacacgttcaaa6540aaattgatgcgcatcaattttgttgttcctattattgaataaataagattgtacagattc6600atatctacgattcgtcatggccaccacaaatgctacgctgcaaacgctggtacaatttta6660cgaaaactgcaaaaacgtcaaaactcggtataaaataatcaacgggcgctttggcaaaat6720atctattttatcgcacaagcccactagcaaattgtatttgcagaaaacaatttcggcgca6780caattttaacgctgacgaaataaaagttcaccagttaatgagcgaccacccaaattttat6840aaaaatctattttaatcacggttccatcaacaaccaagtgatcgtgatggactacattga6900ctgtcccgatttatttgaaacactacaaattaaaggcgagctttcgtaccaacttgttag6960caatattattagacagctgtgtgaagcgctcaacgatttgcacaagcacaatttcataca7020caacgacataaaactcgaaaatgtcttatatttcgaagcacttgatcgcgtgtatgtttg7080cgattacggattgtgcaaacacgaaaactcacttagcgtgcacgacggcacgttggagta7140ttttagtccggaaaaaattcgacacacaactatgcacgtttcgtttgactggtacgcggc7200gtgttaacatacaagttgctaaccggcggccgacacccatttgaaaaaagcgaagacgaa7260atgttggacttgaatagcatgaagcgtcgtcagcaatacaatgacattggcgttttaaaa7320cacgttcgtaacgttaacgctcgtgactttgtgtactgcctaacaagatacaacatagat7380tgtagactcacaaattacaaacaaattataaaacatgagtttttgtcgtaaaaatgccac7440ttgttttacgagtagaattcccagcttggcactggccgtcgttttacaacgtcgtgactg7500ggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctg7560gcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatgg7620cgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcat7680atggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacaccc7740gccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagaca7800agctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacg7860cgcggacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatg7920gtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgttta7980tttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgctt8040caataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattccc8100ttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaa8160gatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggt8220aagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagtt8280ctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgc8340atacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacg8400gatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcg8460gccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaac8520atgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccatacca8580aacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactatta8640actggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggat8700aaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaa8760tctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaag8820ccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaat8880agacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtt8940tactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtg9000aagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactga9060gcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgta9120atctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaa9180gagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatact9240gtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctaca9300tacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtctt9360accgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacgggg9420ggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacag9480cgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggta9540agcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtat9600ctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcg9660tcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggcc9720ttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataac9780cgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagc9840gagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgt9900tggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgag9960cgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatg10020cttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagc10080tatgaccatgattacg10096<212>类型DNA<211>长度10096序列名称SEQID169序列描述惯用密码子序列名称SEQID169序列<213>生物体名称人工序列<400>前序列串ggtaccggatccagcatggtgtgtctgaagctccctggaggctcctgcatgacagcgctg60acagtgacactgatggtgctgagctccccactggctttgtccggagacaccggacctaag120tacgtcaagcagaacacactgaaactggcttccggtggcggatctctagttccacgcggt180agtggaggcggtggttccggagacacgcgtccacgtttcttgtggcagcttaagtttgaa240tgtcatttcttcaatgggacggagcgggtgcggttgctggaaagatgcatctataaccaa300gaggagtccgtgcgcttcgacagcgacgtgggggagtaccgggcggtgacggagctgggg360cggcctgatgccgagtactggaacagccagaaggacctcctggagcagaggcgggccgcg420gtggacacctactgcagacacaactacggggttggtgagagcttcacagtgcagcggcga480gttgagcctaaggtgactgtgtatccttcaaagacccagcccctgcagcaccacaacctc540ctggtctgctctgtgagtggtttctatccaggcagcattgaagtcaggtggttccggaac600ggccaggaagagaaggctggggtggtgtccacaggcctgatccagaatggagattggacc660ttccagaccctggtgatgctggaaacagttcctcggagtggagaggtttacacctgccaa720gtggagcacccaagtgtgacgagccctctcacagtggaatggagagcacggtctgaatct780gcacagagcaaggtcgacggaggcggtgggggtagaatcgcccggctggaggaaaaagtg840aaaaccttgaaagctcagaactcggagctggcgtccacggccaacatgctcagggaacag900gtggcacagcttaaacagaaagtcatgaactactaggatcc941<212>类型DNA<211>长度941序列名称SEQID170序列描述惯用密码子序列名称SEQID170序列<213>生物体名称人工序列<400>前序列串MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE60VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEQYFGPGTRLTVT116<212>类型PRT<211>长度116序列名称SEQID171序列描述序列<213>生物体名称人工序列<400>前序列串MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE60VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLMSAXPEQYFGPGTRLTVT116<212>类型PRT<211>长度116序列名称SEQID172序列描述特征序列SEQID172<221>特征关键词MISC_FEATURE<222>起始位置1<222>终止位置116其它信息其中x是e,q或rCDS连接无序列<213>生物体名称人工序列<400>前序列串MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE60VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPEDQYFGPGTRLTVT117<212>类型PRT<211>长度117序列名称SEQID173序列描述序列<213>生物体名称人工序列<400>前序列串MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE60VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLVPGRPEQQFGPGTRLTVT116<212>类型PRT<211>长度116序列名称SEQID174序列描述序列<213>生物体名称人工序列<400>前序列串MNAGVTQTPKFQVLKTGQSMTLQCAQDMNHEYMSWYRQDPGMGLRLIHYSVGAGITDQGE60VPNGYNVSRSTTEDFPLRLLSAAPSQTSVYFCASRPGLAGGRPHPQFGPGTRLTVT116<212>类型PRT<211>长度116序列名称SEQID175序列描述权利要求1.一种在其表面展示一种T细胞受体(TCR)的蛋白质颗粒,其特征在于,(i)所述蛋白质颗粒是一种核糖体并且所述TCR是一种单链TCR(scTCR)多肽或二聚TCR(dTCR)多肽对,或(ii)所述蛋白质颗粒是一种噬菌体颗粒,或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞,并且所述TCR是一种人scTCR或人dTCR多肽对,或(iii)所述蛋白质颗粒是一种噬菌体颗粒,或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞,并且所述TCR是一种非人dTCR多肽对,或(iv)所述蛋白质颗粒是一种噬菌体颗粒,或一种具有与TCR共价相连的细胞表面蛋白或多肽分子的细胞,且所述TCR是scTCR多肽,该多肽包含与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列,连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列的连接序列,以及连接恒定结构域序列的残基、在天然T细胞受体中不存在等价物的二硫键。2.一种在其表面展示一种二聚体T细胞受体(dTCR)多肽对或单链T细胞受体(scTCR)多肽的蛋白质颗粒,其特征在于所述dTCR多肽对由对应于天然TCR链的胞外恒定和可变结构域序列的TCR氨基酸序列构成,所述scTCR由与天然TCR链的胞外恒定和可变结构域序列相应的TCR氨基酸序列和连接序列构成,该连接序列连接与天然TCR一条链的可变结构域序列相对应的可变结构域序列和与另一条天然TCR链的恒定结构域序列相对应的恒定结构域序列;其中所述dTCR多肽对或scTCR多肽的可变结构域序列的相互定位与天然TCR中的定位基本一致,以及在scTCR多肽的情况下,在天然T细胞受体中不存在等价物的二硫键连接该多肽的残基。3.如权利要求1或2所述的蛋白质颗粒,其特征在于,所述蛋白质颗粒是丝状噬菌体颗粒。4.如权利要求1或2所述的蛋白质颗粒,其特征在于,所述蛋白质颗粒是具有与TCR共价连接的细胞表面蛋白或多肽分子的细胞。5.如权利要求1或2所述的蛋白质颗粒,其特征在于,所述蛋白质颗粒是核糖体。6.如权利要求1-5中任一项所述的蛋白质颗粒,其特征在于,所述dTCR多肽对中一个成员的C末端,或所述scTCR多肽的C末端通过肽键与所述蛋白质颗粒表面暴露的残基相连。7.如权利要求1-4中任一项所述的蛋白质颗粒,其特征在于,所述dTCR多肽对中一个成员的C末端,或所述scTCR多肽的C末端通过二硫键与所述蛋白质颗粒表面暴露的半胱氨酸残基相连。8.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,展示的scTCR多肽包括由对应于TCRα或δ链可变结构域的氨基酸序列构成的第一片段由与对应于TCRβ链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRβ或γ链可变结构域序列的氨基酸序列构成的第二片段,以及连接第一片段C末端与第二片段N末端的连接序列条件是其中蛋白质颗粒是噬菌体,所述scTCR对应于人TCR。9.如权利要求1-7中任一项所述的蛋白质颗粒,其特征在于,展示的scTCR多肽包括由对应于TCRβ或γ链可变结构域的氨基酸序列构成的第一片段由与对应于TCRα链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRα或δ链可变结构域序列的氨基酸序列构成的第二片段,以及连接第一片段C末端与第二片段N末端的连接序列条件是其中蛋白质颗粒是丝状噬菌体,所述scTCR对应于人TCR。10.如权利要求1-7中任一项所述的蛋白质颗粒,其特征在于,展示的scTCR多肽包括由与对应于TCRα链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRα或δ链可变结构域序列的氨基酸序列构成的第一片段,由与对应于TCRβ链恒定结构域胞外序列的氨基酸序列的N末端融合的对应于TCRβ或γ链可变结构域序列的氨基酸序列构成的第二片段,连接第一片段C末端与第二片段N末端或反之亦然的连接序列,以及第一链和第二链之间的二硫键,所述二硫键在αβ或γδT细胞受体中不存在其等价物,连接序列的长度和二硫键的位置使得第一和第二片段的可变结构域序列的相互定位与天然αβ或γδT细胞受体中的定位基本一致。11.如权利要求10所述的蛋白质颗粒,其特征在于,所述连接序列具有式-P-AA-P-,其中P是脯氨酸,且AA代表其中氨基酸是甘氨酸和丝氨酸的氨基酸序列。12.如权利要求10或11所述的蛋白质颗粒,其特征在于,所述连接序列连接第一片段的C末端和第二片段的N末端。13.如权利要求12所述的蛋白质颗粒,其特征在于,所述连接序列由26到41个氨基酸构成。14.如权利要求13所述的蛋白质颗粒,其特征在于,所述连接序列由29、30、31或32个氨基酸构成。15.如权利要求13所述的蛋白质颗粒,其特征在于,所述连接序列由33、34、35或36个氨基酸构成。16.如权利要求13所述的蛋白质颗粒,其特征在于,所述连接序列具有式-PGGG-(SGGGG)5-P-,其中P是脯氨酸,G是甘氨酸,S是丝氨酸。17.如权利要求13所述的蛋白质颗粒,其特征在于,所述连接序列具有式-PGGG-(SGGGG)6-P-,其中P是脯氨酸,G是甘氨酸,S是丝氨酸。18.如权利要求1-7中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对由以下组分构成其中对应于TCRα或δ链可变结构域序列的序列与对应于TCRα链恒定结构域胞外序列的序列的N末端融合的第一多肽,以及其中对应于TCRβ或γ链可变结构域序列的序列与对应于TCRβ链恒定结构域胞外序列的序列的N末端融合的第二多肽,第一和第二多肽通过在天然αβ或γδT细胞受体中不存在等价物的二硫键相连。19.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对或scTCR多肽具有对应于αβTCR胞外恒定和可变结构域序列的氨基酸序列。20.如权利要求1-19中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对或scTCR多肽具有对应于胞外αβTCR恒定结构域序列和γδTCR可变结构域序列的氨基酸序列。21.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对或scTCR多肽具有对应于非人的胞外αβTCR恒定结构域序列和人TCR可变结构域序列的氨基酸序列。22.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对的一个成员的氨基酸序列,或展示的scTCR的氨基酸序列对应于天然TCR胞外恒定链Ig结构域序列。23.如权利要求1-22中任一项所述的蛋白质颗粒,其特征在于,展示的dTCR多肽对或展示的scTCR包括对应于天然TCR胞外恒定链Ig结构域序列的序列。24.如权利要求23所述的蛋白质颗粒,其特征在于,所述恒定链Ig结构域序列的氨基酸残基由二硫键连接,该二硫键在天然TCR中不存在等价物。25.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于对应于天然TCR中其β碳原子相距小于0.6纳米的氨基酸残基的半胱氨酸残基之间。26.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Thr48和TRBC1*01或TRBC2*01外显子1的Ser57或其非人等价物的半胱氨酸残基之间。27.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Thr45和TRBC1*01或TRBC2*01外显子1的Ser77或其非人等价物的半胱氨酸残基之间。28.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Tyr10和TRBC1*01或TRBC2*01外显子1的Ser17或其非人等价物的半胱氨酸残基之间。29.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Thr45和TRBC1*01或TRBC2*01外显子1的Asp59或其非人等价物的半胱氨酸残基之间。30.如权利要求24所述的蛋白质颗粒,其特征在于,所述二硫键位于取代TRAC*01外显子1的Ser15和TRBC1*01或TRBC2*01外显子1的Glu15或其非人等价物的半胱氨酸残基之间。31.如权利要求23-30中任一项所述的蛋白质颗粒,其特征在于,相对于所述天然序列,对应于天然TCR胞外恒定链Ig结构域序列的序列是C末端截短的,这样排除了形成天然链间二硫键的半胱氨酸残基。32.如权利要求23-30中任一项所述的蛋白质颗粒,其特征在于,在对应于天然TCR胞外恒定链Ig结构域序列的序列中的形成天然链间二硫键的半胱氨酸残基被非半胱氨酸残基所取代。33.如权利要求32所述的蛋白质颗粒,其特征在于,形成天然链间二硫键的半胱氨酸残基被丝氨酸或丙氨酸取代。34.如上述权利要求中任一项所述的蛋白质颗粒,其特征在于,在展示的dTCR或scTCR中不存在对应于天然TCR中不配对半胱氨酸残基的不配对半胱氨酸残基。35.如权利要求23-34中任一项所述的蛋白质颗粒,其特征在于,相对那些与形成非天然链间二硫键的残基相对应的残基,与天然TCR胞外恒定链Ig结构域序列相对应的序列在N末端被截短。36.如权利要求1所述的蛋白质颗粒,其特征在于,所述蛋白质颗粒是在其表面展示二聚体T细胞受体(dTCR)多肽对的丝状细菌体颗粒,所述多肽对由以下组分构成其中对应于TCRα链可变结构域序列的序列与对应于TCRα链恒定结构域胞外序列的序列的N末端融合的第一多肽,以及其中对应于TCRβ链可变结构域序列的序列与对应于TCRβ链恒定结构域胞外序列的序列的N末端融合的第二多肽,第一和第二多肽由取代TRAC*01外显子1的Thr48和TRBC1*01或TRBC2*01外显子的Ser57或其非人等价物的半胱氨酸残基之间的二硫键连接,dTCR多肽对的一个成员的C末端通过肽键与噬菌体的一种外被蛋白相连。37.一种展示在蛋白质颗粒上的dTCR多肽对或scTCR多肽的多样性文库,其特征在于,所述dTCR多肽对或scTCR多肽具有权利要求8-36中任一项所定义的结构特征。38.如权利要求37所述的多样性文库,其特征在于,所述多样性存在于dTCR或scTCR多肽的可变结构域中。39.如权利要求37-39中任一项所述的多样性文库,其特征在于,所述蛋白质颗粒是丝状噬菌体颗粒。40.如权利要求35所述的丝状噬菌体颗粒的多样性文库,其特征在于,所述多样性存在于dTCR或scTCR多肽可变结构域的一个或多个互补决定区中,和/或存在于所展示的dTCR或scTCR多肽互补决定区的一个或多个骨架区中。41.一种核酸,其特征在于,所述核酸编码(a)dTCR多肽对的一条链以及(b)与编码能形成蛋白质颗粒表面的一部分的蛋白质的核酸序列融合的dTCR多肽对的另一条链;或所述核酸编码与编码能形成蛋白质颗粒表面的一部分的蛋白质的核酸序列融合的scTCR多肽,所述dTCR对或scTCR具有权利要求8-36中任一项所定义的结构特征。42.一种包含如权利要求41所述的核酸的表达载体,或包含含如权利要求42所定义的核酸(a)的第一载体和含如权利要求42所定义的核酸(b)的第二载体的组合物。43.一种表达系统,其特征在于,所述表达系统包含表达如权利要求41所述核酸的噬菌粒或噬菌体基因组载体。44.如权利要求43所述的表达系统,其特征在于,所述噬菌粒或噬菌体基因组载体源丝状噬菌体。45.如权利要求44所述的表达系统,其特征在于,所述噬菌粒或噬菌体基因组载体编码噬菌体gIII或gVIII外被蛋白。46.如权利要求43-45中任一项所述的表达系统,其特征在于,所述载体包含将由该载体表达的组成型或诱导型TCR多肽数量限制在所需水平的一个或多个序列。47.如权利要求46所述的表达系统,其特征在于,所述序列是弱启动子序列。48.如权利要求46所述的表达系统,其特征在于,所述序列是突变的核糖体结合位点。49.如权利要求46所述的表达系统,其特征在于,所述序列是错义抑制子终止密码子。50.如权利要求46所述的表达系统,其特征在于,所述序列是突变的起始密码子。51.如权利要求46所述的表达系统,其特征在于,所述序列是受代谢物介导的启动子强度调节控制的启动子序列。52.如权利要求46所述的表达系统,其特征在于,所述序列含有多个所采用的表达系统偏爱程度更低的密码子。53.一种包含如权利要求41所述的核酸的宿主细胞,一种如权利要求42所述的表达载体或一种如权利要求43-52中任一项所述的表达系统。54.一种携带如权利要求43-52中任一项所述噬菌粒表达系统的宿主细胞以及辅助噬菌体。55.一种鉴别具有特殊特征的TCR的方法,其特征在于,所述方法包括使展示在如权利要求37-40中任一项所述蛋白质颗粒上的TCR多样性文库经受对所述特征进行挑选的选择过程,并且分离展示具有所述特征TCR的蛋白质颗粒,以及可选择地进行扩增过程以增加分离的颗粒和/或测量所述特征的筛选过程,鉴别那些展示具有所需特征的TCR的蛋白质颗粒并将其分离,以及可选择地进行扩增过程以增加分离的颗粒。56.如权利要求55所述的方法,其特征在于,所述特殊特征是对TCR配体增强的亲和力。57.一种检测TCR配体复合物的方法,其特征在于,所述方法包括(i)提供如权利要求1-41中任一项所述的展示TCR的蛋白质颗粒;(ii)将所述展示TCR的蛋白质颗粒与假定的配体复合物接触;以及(iii)检测所述展示TCR的蛋白质颗粒与假定的配体复合物的结合。58.如权利要求57所述的方法,其特征在于,所述假定的配体复合物是肽-MHC复合物。59.一种鉴别如权利要求1-41中任一项所述的展示TCR的蛋白质颗粒与TCR结合配体之间相互作用抑制剂的方法,其特征在于,所述方法包括在待测化合物存在和不存在的条件下将展示TCR的蛋白质颗粒与一种TCR结合配体接触,并测定待测化合物的存在是否降低展示TCR的蛋白质颗粒与TCR结合配体的结合,这样的降低作为对抑制剂的鉴别。60.一种对特定TCR配体具有特异性的TCR,其特征在于,所述TCR(i)具有权利要求8-36中任一项所定义的结构特征,(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生发生了突变,以及(iii)对所述TCR配体具有比天然TCR小的Kd值。61.一种对特定TCR配体具有特异性的TCR,其特征在于,所述TCR(i)具有权利要求8-36中任一项所定义的结构特征,(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变,以及(iii)如通过表面等离子体谐振测得的,对所述TCR配体具有比天然TCR小的Kd值。62.一种对特定TCR配体具有特异性的TCR,其特征在于,所述TCR(i)具有权利要求8-36中任一项所定义的结构特征,(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变,以及(iii)对所述TCR配体具有比天然TCR低的消耗速率(koff)。63.一种对特定TCR配体具有特异性的TCR,其特征在于,所述TCR(i)具有权利要求8-36中任一项所定义的结构特征,(ii)相对于所述TCR配体的特异性天然TCR在可变结构域中发生了突变,以及(iii)如通过表面等离子体谐振测得的,对所述TCR配体具有比天然TCR低的消耗速率(koff)。64.一种如权利要求60-63中任一项所述的二聚体TCR,其特征在于,所述dTCR具有权利要求18-36中任一项所定义的αβ异源二聚TCR的结构特征。65.一种如权利要求60-64中任一项所述的TCR,其特征在于,所述TCR相对于天然TCR在至少一个互补决定区和/或其骨架区中发生突变。66.一种如权利要求60-65中任一项所述的TCR,其特征在于,所述TCR对特定的MHC类型具有特异性。67.一种如权利要求60-65中任一项所述的TCR,其特征在于,所述TCR对特定的pMHC具有特异性。68.一种如权利要求60-65或67中任一项所述的TCR,其特征在于,所述TCR对HLA-A2Tax肽(LLFGYPVYV)(SEQID21)具有特异性。69.如权利要求68所述的TCR,其特征在于,所述TCR包含SEQID172、173、174或175中所示的β链可变结构域氨基酸。70.如权利要求68所述的TCR,其特征在于,使用SEQID171中所示的编号,所述TCR包含β链可变结构域氨基酸99M、99V、100S、100P、101A、102E、102Q、104H、105P、105D和106Q中的一个或多个。71.如权利要求68所述的TCR,其特征在于,使用SEQID171中所示的编号,所述TCR包含β链可变结构域氨基酸99M、100S和101A。72.如权利要求68所述的TCR,其特征在于,使用SEQID171中所示的编号,所述TCR包含β链可变结构域氨基酸105D。73.如权利要求68所述的TCR,其特征在于,使用SEQID171中所示的编号,所述TCR包含β链可变结构域氨基酸99V和100P。74.如权利要求68所述的TCR,其特征在于,使用SEQID171中所示的编号,所述TCR包含β链可变结构域氨基酸104H和105P。75.如权利要求60-65或67中任一项所述的TCR,其特征在于,所述TCR对HLA-A2NY-ESO肽(SLLMITQC)(SEQID22)复合物具有特异性。76.一种核酸,其特征在于,所述核酸编码如权利要求60-78中任一项所述的TCR。77.如权利要求60-75中任一项所述的TCR,其特征在于,所述TCR与治疗化合物相连。78.如权利要求60-75中任一项所述的TCR,其特征在于,所述TCR与造影化合物相连。79.如权利要求60-75中任一项所述的TCR,其特征在于,所述TCR与细胞毒化合物相连。80.如权利要求77或79所述的TCR,其特征在于,所述TCR对HLA-A2Tax肽(LLFGYPVYV)(SEQID21)复合物具有特异性。81.如权利要求77或79所述的TCR,其特征在于,所述TCR对HLA-A2NY-ESO肽(SLLMITQC)(SEQID22)复合物具有特异性。82.一种治疗HTLV-1感染的方法,其特征在于,所述方法包括给予遭受这种感染的个体有效量的如权利要求68-74或79中任一项所述的TCR。83.如权利要求68-74或79中任一项所述的TCR在制备用于治疗HTLV-1感染的组合物中的应用。84.一种治疗癌症的方法,其特征在于,所述方法包括给予遭受癌症的个体有效量的如权利要求75或81所述的TCR。85.如权利要求75或81所述的TCR在制备用于治疗癌症的组合物中的应用。全文摘要一种例如噬菌体、核糖体或细胞的蛋白质性质的颗粒,在其表面展示了一种T细胞受体(TCR)。展示的TCR优选地是在恒定结构域残基之间具有非天然二硫键的异源二聚体。这样的展示颗粒可以用于建立多样性的TCR文库以鉴别高亲和性TCR。公开了几种高亲和性TCR。文档编号C07K14/435GK1714102SQ200380102928公开日2005年12月28日申请日期2003年10月30日优先权日2002年11月9日发明者B·K·雅各布森,T·B·安德森,P·E·莫洛伊,李懿,J·M·伯尔特申请人:阿维德克斯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1