用于在细胞表面上表达多肽的组合物和方法与流程

文档序号:11528773阅读:1081来源:国知局
用于在细胞表面上表达多肽的组合物和方法与流程

交叉参考

本申请要求2014年11月10日申请的美国临时专利申请第62/077,756号的权益,所述申请案以全文引用的方式并入本文中。



背景技术:

在真核细胞(例如,酵母细胞)表面上表达蛋白质,即称为表面呈现的技术可以用于各种各样的目的。举例来说,因为酵母是真核的,所以将酵母用于表面呈现对(例如,经由定向演化)改造和修饰哺乳动物蛋白来说非常适合,所述改造和修饰需要翻译后修饰以用于有效折叠和活性(例如,细胞表面和分泌蛋白,如抗体、受体、细胞因子等)。在表面呈现的一个实例中,目标蛋白与aga2p蛋白融合,在配对期间,酵母自然地使用所述aga2p蛋白调节细胞-细胞接触。目前的表面呈现方法需要表达多种基因,且在所呈现目标蛋白的空间可及性方面受到限制。在本领域中,需要以例如实现可调节的(“可调式”)可及性水平的方式实现目标蛋白的单顺反子表达和表面呈现的组合物和方法。

公开案

博德(boder)等人,《自然·生物技术(natbiotechnol)》.1997年6月;15(6):553-7;美国专利申请号:20110076752



技术实现要素:

提供通过使目标蛋白(poi)与呈现部分(例如,具有信号多肽、茎多肽以及表面锚定多肽的部分)融合产生表面可及融合蛋白而在真核细胞(例如,哺乳动物细胞、真菌细胞、酵母细胞等)表面上呈现poi的方法和组合物。在一些情况下,将表面可及融合蛋白作为核酸的一部分(例如,重组表达载体)引入真核细胞中。提供包括对呈现部分(例如,具有信号多肽、茎多肽以及表面锚定多肽的部分)进行编码的核苷酸序列的核酸。在一些情况下,本发明的核酸包括插入poi的插入位点。在一些情况下,本发明的核酸包括对poi进行编码的核苷酸序列。在一些情况下,茎多肽是合成茎多肽,且本文中披露各种例示性合成茎多肽。在一些情况下,表面锚定多肽是糖基磷脂酰肌醇(gpi)锚定域。在一些情况下,gpi锚定域是合成gpi锚定域。在一些情况下,表面锚定多肽是跨膜域。

提供用于测量试剂与poi的结合的方法(例如,确定试剂是否可以与poi结合)。还提供用于识别与poi结合的试剂的方法(例如,筛检与给定poi结合的试剂的测试化合物);用于识别与给定试剂结合的多肽的方法(例如,当试剂以特定浓度存在时与试剂结合的多肽,例如识别以大于或等于预定值的亲和力与试剂结合的多肽);以及用于产生与试剂结合的变体多肽的方法,所述变体多肽的亲和力不同于(例如,大于)衍生出所述变体的多肽的亲和力。

还提供包括本发明组合物的各种组分的试剂盒,且所述试剂盒可以用于实践本发明的方法。

附图说明

图1a-1c.使用长度可变的gpi锚定“茎”控制肽可及性。(图1a)肽与酵母细胞表面连接的一个实施例的示意图:分泌目标蛋白(poi)(此处是改造的sirpa变体cv1)作为表面可及融合蛋白,其中poi与以下融合:(i)信号多肽(其将蛋白质引向分泌路径,但其可以经由翻译后加工与蛋白质割裂)、(ii)茎多肽(合成序列,其长度可以在广泛长度范围内改变)、(iii)gpi锚定物(例如,合成gpi锚定物)以及任选地(iv)表位标记(所示为ha表位标记)。(图1b)实验结果,其显示茎长度(以氨基酸计)与以下3种标记探针的表面染色之间的关系:抗ha抗体(约150kd)、cd47-链霉亲和素四聚体(约100kd)以及cd47-生物素单体(约15kda)。(图1c)呈现与不同长度茎连接的cv-1的酵母的代表性流式细胞测量图,所述不同长度茎同时染有抗ha抗体(alexa488)和cd47-生物素单体(alexa647)。测试茎序列的长度(以氨基酸的数目计)在各图上方列出。

图2a-2b.本发明的组合物和方法与其它酵母菌株相容。(图2a)肽与酵母细胞表面连接的示意图。分泌改造的sirpa变体cv1作为与ha表位标记和长度为649个氨基酸的合成茎以及合成gpi锚定物的融合物(即,cv1是表达为表面可及融合多肽的目标蛋白(poi))。相比于图1a-1c中所用的bj5465,用于这些实验的酵母菌株是yvh10。yvh10酵母过度表达酵母蛋白质二硫键异构酶(pdi),使得所分泌含有二硫键的蛋白质能够具有更大折叠能力。(图2b)呈现与茎(649个氨基酸)连接的cv-1的yvh10酵母的代表性流式细胞测量图,所述茎同时染有抗ha抗体(alexa488)和cd47-生物素单体(alexa647)。

具体实施方式

提供通过使目标蛋白(poi)与信号多肽、茎多肽以及表面锚定多肽融合产生表面可及融合蛋白而在真核细胞(例如,哺乳动物细胞、真菌细胞、酵母细胞等)表面上呈现poi的方法和组合物。在一些情况下,将表面可及融合蛋白作为核酸的一部分(例如,重组表达载体)引入真核细胞中。提供包括对信号多肽、茎多肽以及表面锚定多肽进行编码的核苷酸序列的核酸。在一些情况下,本发明的核酸包括和插入poi的插入位点。在一些情况下,本发明的核酸包括对poi进行编码的核苷酸序列。在一些情况下,茎多肽是合成茎多肽,且本文中披露各种例示性合成茎多肽。在一些情况下,表面锚定多肽是糖基磷脂酰肌醇(gpi)锚定域。在一些情况下,gpi锚定域是合成gpi锚定域。

提供用于测量试剂与poi的结合的方法(例如,确定试剂是否可以与poi结合)。还提供用于识别与poi结合的试剂的方法(例如,筛检与给定poi结合的试剂的测试化合物);用于识别与给定试剂结合的多肽的方法(例如,当试剂以特定浓度存在时与试剂结合的多肽,例如识别以大于或等于预定值的亲和力与试剂结合的多肽);以及用于产生与试剂结合的变体多肽的方法,所述变体多肽的亲和力不同于(例如,大于)衍生出所述变体的多肽的亲和力。

还提供包括本发明组合物的各种组分的试剂盒,且所述试剂盒可以用于实践本发明的方法。

在描述本方法和组合物之前,应理解本发明不限于所述特定方法或组合物,因此可理所当然地发生变化。还应理解,本文所用的术语只出于描述特定实施例的目的,而不希望具有限制性,因为本发明的范围将仅由所附权利要求书限定。

在提供数值范围的情况下,应理解还专门披露所述范围的上限与下限之间的每个中间值,直到下限单位的十分之一(除非上下文另外明确规定)。所述范围内的任何所述值或中间值与那个所述范围内的任何其它所述或中间值之间的每个更小范围涵盖于本发明中。这些更小范围的上限和下限可以独立地包括或不包括于所述范围内,且本发明中还涵盖其中任一限值包括于更小范围内、两个限值均不包括于更小范围内或两个限值均包括于更小范围内的每个范围(除了所述范围内专门排除的任何限值之外)。在所述范围包括限值中的一个或两个的情况下,排除所包括的那些限值中的任一个或两个的范围也包括于本发明中。

除非另外定义,否则本文所用的所有技术和科学术语均具有与本发明所属领域的一般技术人员通常所理解相同的含义。虽然与本文所描述的类似或等效的任何方法和材料均可以用于本发明的实践或测试,但现在描述一些潜在且优选的方法和材料。本文提及的所有公开案均以引入的方式并入本文中,以披露且描述与所列公开案相关的方法和/或材料。应理解,在存在抵触的范围内,本发明取代了所并入公开案的任何披露内容。

如所属领域的技术人员在阅读本发明后将明白,本文所描述和说明的个别实施例中的每一个均具有各别组分和特征,所述特征可以在不脱离本发明的范围或精神的情况下轻易地与其它若干实施例中的任一个的特征分离或与其组合。任何所述方法均可以所述事件的顺序或以逻辑上可能的任何其它顺序来进行。

必须指出,除非上下文另外明确规定,否则如本文和所附权利要求书中所用,单数形式“一(a/an)”和“所述(the)”包括复数个提及物。因此,举例来说,对“细胞”的提及包括多个所述细胞,且对“所述肽”的提及包括提及所属领域的技术人员已知的一或多个肽和其等效物,例如多肽等。

提供本文所论述的公开案仅用于在本申请的申请日之前对其进行披露。不应将本文中的任何内容理解为承认本发明无权凭借先前发明而先于所述公开案。此外,所提供的公开日期可以不同于可能需要独立确认的实际公开日期。

定义

在下文描述中,使用所属领域中惯常使用的多个术语。为了清楚且连贯地理解本说明书与权利要求书和针对所述术语所给定的范围,提供以下定义。

术语“多肽”、“肽”和“蛋白质”在本文中可互换使用以指代氨基酸残基的聚合物。所述术语也适用于氨基酸聚合物,其中一或多个氨基酸残基是天然存在的相应氨基酸的人工化学模拟物,且适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。

术语“氨基酸”是指天然存在和合成的氨基酸,以及以与天然存在的氨基酸类似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基酸,以及后续被修饰的那些氨基酸,例如羟基脯氨酸、γ-羧基谷氨酸以及o-磷酸丝氨酸。氨基酸类似物是指基本化学结构与天然存在的氨基酸相同(即,α碳与氢、羧基、氨基以及r基团结合)的化合物,例如高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。所述类似物具有被修饰的r基团(例如,正亮氨酸)或被修饰的肽主链,但基本化学结构保持与天然存在的氨基酸相同。氨基酸模拟物是指结构不同于氨基酸的一般化学结构但以与天然存在的氨基酸类似的方式起作用的化合物。

如当指代本发明组合物的组分(例如,合成茎多肽、合成表面锚定多肽、合成信号多肽等)时所用,术语“合成”意指非天然存在的组分。举例来说,合成茎多肽按照定义包含非天然存在的氨基酸序列,合成表面锚定多肽按照定义包含非天然存在的氨基酸序列,且合成信号多肽按照定义包含非天然存在的氨基酸序列。

在最广泛的意义上使用术语“抗体”且具体地说,其涵盖单克隆抗体(包括全长单克隆抗体)、多克隆抗体、多特异性抗体(例如,双特异性抗体)以及抗体片段(例如,fab片段),只要其展现所要生物活性即可。“抗体(ab)”和“免疫球蛋白(ig)”是具有相同结构特征的糖蛋白。抗体对特定抗原展现结合特异性,而免疫球蛋白则包括缺乏抗原特异性的抗体和其它抗体类分子。后一种多肽例如是由淋巴系统在低水平上产生且由骨髓瘤在提高的水平上产生。

“天然抗体和免疫球蛋白”通常是约150,000道尔顿的杂四聚体糖蛋白,由两条相同的轻(l)链和两条相同的重(h)链构成。每条轻链通过一个共价二硫键与重链连接,而在不同免疫球蛋白同型的重链之间二硫键的数目不同。每条重链和轻链还具有规则间隔的链内二硫桥键。每条重链在一端处具有可变域(vh),接着是多个恒定域。每条轻链在一端处具有可变域(vl)且在其另一端处具有恒定域;轻链的恒定域与重链的第一恒定域对齐,且轻链可变域与重链的可变域对齐。人们认为是特定氨基酸残基形成了轻链与重链可变域之间的介面(科西亚(clothia)等人,《分子生物学杂志(j.mol.biol.)》186:651(1985);诺瓦特尼(novotny)和哈伯(haber),《美国国家科学院院刊(proc.natl.acad.sci.u.s.a.)》82:4592(1985))。

术语“可变”是指如下事实:在抗体之间,可变域的某些部分在序列上广泛不同,且用于每种特定抗体对其特定抗原的结合和特异性。然而,可变性并非均匀分布于整个抗体可变域中。其集中在三个称为互补决定区(cdr)或高变区的区段,所述区段位于轻链和重链可变域中。可变域的更高度保守部分称为框架(fr)。天然重链和轻链的可变域各自包含四个fr区,其基本上采用b薄片构型,通过三个cdr连接,形成连接b薄片结构的环,且在一些情况下形成b薄片结构的一部分。每条链中的cdr均通过fr区紧邻在一起且与来自另一链的cdr促成抗体的抗原结合位点的形成(参见卡巴特(kabat)等人,《具有免疫学重要性的蛋白质序列(sequencesofproteinsofimmunologicalinterest)》,第五版,美国国立卫生研究院(nationalinstituteofhealth),马里兰州贝塞斯达(bethesda,md.)(1991))。恒定域不直接参与抗体与抗原的结合,但展现各种效应子功能,如抗体参与抗体依赖性细胞毒性。

抗体的消化(例如,使用如木瓜蛋白酶、无花果蛋白酶等酶)产生:两个相同的抗原结合片段,称为“fab”片段,每个片段均具有单个抗原结合位点;和残余“fc”片段,其名称反映其能够轻易地结晶。胃蛋白酶处理产生f(ab')2片段,所述片段具有两个抗原组合位点且仍然能够交联抗原。

“fv”是含有完整的抗原识别和结合位点的最小抗体片段。在双链fv物质中,这种区域是由一个重链可变域与一个轻链可变域经由非共价紧密结合而成的二聚体组成。在单链fv物质(scfv)中,一个重链可变域与一个轻链可变域可以通过柔性肽连接子共价连接,因此轻链和重链可以类似于双链fv物质的“二聚”结构结合。在这种构型中,每个可变域的三个cdr均相互作用以界定vh-vl二聚体表面上的抗原结合位点。六个cdr共同赋予抗体抗原结合特异性。然而,即使单个可变域(或包含仅三个对抗原具有特异性的cdr的fv的一半)也具有识别且结合抗原的能力,虽然亲和力低于完整结合位点。关于scfv的综述,参见普鲁克通(pluckthun),《单克隆抗体的药理学(thepharmacologyofmonoclonalantibodies)》,第113卷,罗森堡(rosenburg)和穆尔(moore)编,施普林格出版社(springer-verlag),纽约(newyork),第269-315页(1994)。

fab片段还含有轻链的恒定域和重链的第一恒定域(ch1)。fab'片段与fab片段的不同之处在于,重链ch1域的羧基末端增加了几个残基,包括一或多个来自抗体铰链区的半胱氨酸。fab'-sh是本文关于fab'的名称,其中恒定域的半胱氨酸残基具有游离硫醇基。f(ab')2抗体片段最初产生为在其之间具有铰链半胱氨酸的fab'片段对。还已知抗体片段的其它化学偶联。

如本文中所用,“抗体片段”和其所有语法变化形式定义为完整抗体的一部分,所述部分包含完整抗体的抗原结合位点或可变区,其中所述部分不含完整抗体fc区的重链恒定域(即,ch2、ch3和ch4,这视抗体同型而定)。抗体片段的实例包括:fab、fab'、fab'-sh、f(ab')2以及fv片段;双功能抗体;任何抗体片段,即主要结构由一个不间杂的邻接氨基酸残基序列组成的多肽(在本文中称为“单链抗体片段”或“单链多肽”),包括(但不限于)(1)单链fv(scfv)分子,(2)含有仅一个轻链可变域的单链多肽或其含有轻链可变域的三个cdr的片段而无相关重链部分,(3)含有仅一个重链可变区的单链多肽或其含有重链可变区的三个cdr的片段而无相关轻链部分,以及(4)包含来自非人类物种的单个ig域或其它特定单域结合模块的纳米抗体;和由抗体片段形成的多特异性或多价结构。在包含一或多条重链的抗体片段中,重链可以含有完整抗体非fc区中存在的任何恒定域序列(例如,igg同型中的ch1),和/或可以含有完整抗体中存在的任何铰链区序列,和/或可以含有与重链的铰链区序列或恒定域序列融合或位于重链的铰链区序列或恒定域序列中的亮氨酸拉链序列。

如在本发明中所用,术语“表位”意指抗体互补位所结合的抗原上的任何抗原决定子。表位决定子通常由根据表面化学活性分组的分子(如氨基酸或糖侧链)组成,且通常具有特定的三维结构特征以及特定的电荷特征。

当在本文中使用时,术语“标记”是指直接或间接与分子共轭的可检测化合物或组合物。举例来说,试剂可以称为“可检测标记的”或可以称为包括可检测标记。标记本身可能是可检测的(直接可检测标记)(例如,放射性同位素标记、如荧光化学加合物的荧光标记等),或者标记可以是间接可检测的,例如就酶促标记来说,酶可以催化底物化合物或组合物的化学改变,且反应产物是可检测的。间接标记的一个实例是生物素,其可以使用链霉亲和素检测。任何适宜的直接或间接标记均可以用于本文所描述的组合物和方法。

如本文中所用,术语“重组”意指特定核酸(dna或rna)是克隆、限制、聚合酶链反应(pcr)和/或接合步骤的各种组合的产物,所述步骤产生结构编码序列或非编码序列可区别于天然系统中存在的内源性核酸的构筑体。对多肽进行编码的dna序列可以由cdna片段或由一连串合成寡核苷酸拼接以提供合成核酸,所述合成核酸能够由细胞或无细胞转录与翻译系统中所含有的重组转录单元表达。包含相关序列的基因组dna也可以用于形成重组基因或转录单元。在距离开放阅读框5'或3'处可以存在未翻译的dna序列,其中所述序列不干扰编码区的控制或表达,且实际上可以通过各种机制用于调节所要产物的生产。对未翻译的rna进行编码的dna序列也可以视为重组的。因此,举例来说,术语“重组”核酸是指非天然存在的核酸,例如,是通过人类干预使两个以其它方式分离的序列区段人工组合而制得的核酸。这种人工组合往往通过化学合成手段或通过对分离的核酸区段进行人工控制(例如,通过基因工程技术)来实现。通常进行所述组合以用对同一氨基酸、保守氨基酸或非保守氨基酸进行编码的密码子代替密码子。或者,进行所述组合以将具有所要功能的核酸区段连接在一起,从而产生所要功能组合。这种人工组合往往通过化学合成手段或通过对分离的核酸区段进行人工控制(例如,通过基因工程技术)来实现。当重组核酸对多肽进行编码时,所编码多肽的序列可以是天然存在的(“野生型”)或可以是天然存在的序列的变体(例如,突变体)。

“载体”是另一dna区段(例如,“插入序列”)可以连接的复制子,如质体、噬菌体、病毒或粘质体,以使所连接的区段在细胞中复制和/或表达。“表达载体”是具有表达盒的载体(例如,具有作为表达盒的插入序列)。“表达盒”包括可操作地连接于启动子的dna序列(编码或非编码)。“可操作地连接”是指一种并接,其中如此描述的组分处于允许其按预定方式发挥作用的关系。举例来说,如果启动子影响核苷酸序列的转录(例如,核苷酸序列的表达),那么启动子可操作地连接于核苷酸序列。因此,术语“重组表达载体”或“dna构筑体”在本文中可互换使用以指代具有插入序列的表达载体,其中表达载体是重组的(即,包括非天然存在的序列)。重组表达载体通常出于表达和/或扩增插入序列的目的或用于构筑其它重组核苷酸序列而产生。

组合物

本发明提供通过将目标蛋白(poi)表达为表面可及融合蛋白而在细胞表面上表达poi(即,表面呈现)的组合物和方法。术语“表面可及融合蛋白”在本文中用于描述具有信号多肽、目标蛋白(poi)、茎多肽以及表面锚定多肽的多肽。

信号多肽

术语“信号多肽”与“信号序列”在本文中可互换使用以指代存在于或接近分泌路径蛋白质(例如,分泌蛋白、gpi锚定蛋白等)的n端的氨基酸序列,所述序列靶向蛋白质以将其传送到内质网(er)的内腔中。如所属领域中已知,信号序列在其长度和其氨基酸组成上极其可变。然而,信号序列的长度往往是约15-30个氨基酸,且通常包括5-10个疏水性氨基酸的嵌段。

分泌路径的许多蛋白质(例如,分泌蛋白)在翻译(共翻译)期间易位到er(例如,进入er内腔)。然而,一些小分泌蛋白(如酵母配对因子α(约70个氨基酸))在翻译后转移到er内腔中。来自不同蛋白质的信号序列可以互换地起作用。在一些情况下,信号序列在加工蛋白质期间断裂(例如,不再存在于成熟蛋白质上)。因此,在一些情况下,本发明的信号多肽在加工表面可及融合蛋白期间断裂(例如,不再存在于成熟蛋白质上,所述成熟蛋白质呈现在细胞表面上)。在一些情况下,信号多肽在加工蛋白质期间不发生断裂(即,存在于成熟蛋白质中)。

本发明的信号多肽可以天然存在于其受到表达的宿主细胞中,或可以是宿主细胞的异源多肽,只要其可操作以将表面可及融合蛋白转移到分泌路径中即可。本发明的信号多肽可以是具有良好特征的信号序列,或可以是衍生自分泌路径的任何蛋白质的任何信号多肽。在一些情况下,本发明的信号多肽是合成信号多肽,即序列不以天然存在的蛋白质形式存在(相对于天然存在的蛋白质而修饰)。

在一些实施例中,本发明的表面可及融合蛋白包括来自经由翻译后途径进入er的蛋白质(或衍生自蛋白质)的信号多肽(在本文中称为翻译后信号多肽)。在一些实施例中,本发明的表面可及融合蛋白包括来自经由预翻译途径进入er的蛋白质(或衍生自蛋白质)的信号多肽(在本文中称为预翻译信号多肽)。

所属领域的一般技术人员已知适用于本发明组合物、试剂盒以及方法的许多信号序列,且可以使用任何适宜的信号多肽。举例来说,所属领域的一般技术人员将能够轻易地识别适用于本发明组合物、试剂盒以及方法的信号多肽。可以使用在目标宿主细胞(例如,真核细胞、哺乳动物细胞、真菌细胞、酵母细胞等)中起作用的任何适宜的信号多肽。信号序列的选择可以考虑例如蛋白质呈现在细胞(例如,酵母细胞)表面的所要含量。举例来说,当需要呈现高含量的蛋白质时,来自α配对因子的信号序列可以适用,但在一些情况下,在细胞表面需要较少蛋白质,且在所述情况下,可以使用其它信号多肽(例如,来自pho5p、suc2p等的信号肽)。

在一些情况下,相对于表面可及融合蛋白将表达于其上的细胞类型,信号多肽是异源多肽。举例来说,如果,将在酵母细胞中表达表面可及融合蛋白,那么信号多肽可以来自(例如,可以衍生自)除酵母细胞之外的细胞类型(例如,哺乳动物细胞、脊椎动物细胞、无脊椎动物细胞等),或来自不同种属的酵母细胞,所述种属不同于将在其中表达表面可及融合蛋白的种属。

在一些情况下,信号多肽来自(例如,衍生自)将表达表面可及融合蛋白的相同细胞类型(例如,在一些情况下来自相同种属)。举例来说,如果将在酵母细胞中表达表面可及融合蛋白,那么信号多肽可以来自酵母蛋白(例如,在一些情况下来自相同种属的酵母)。例示性信号多肽包括(但不限于)来自(或衍生自)以下酵母蛋白的信号多肽:配对因子α、aga2p、pho5p以及suc2p。

适合信号多肽的实例包括(但不限于)以下物质:

来自配对因子α的信号多肽:

mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkrea(seqidno:11)

来自配对因子α的信号多肽(更短):

mrfpsiftavlfaassalaa(seqidno:12)

来自aga2p的信号多肽

mqllrcfsifsviasvlaq(seqidno:13)

来自pho5p的信号多肽

mfksvvysilaaslanag(seqidno:14)

来自suc2p的信号多肽

mllqaflfllagfaakisas(seqidno:15)

来自天蚕抗菌肽-a的信号多肽(来自刻克罗普斯蚕蛾/天蚕蛾(hyalophoracecropia/cecropiamoth)):

mnfsrifffvfacltalamvna(seqidno:16)

来自基因银行(genbank)aio03624.1的信号多肽

mraflalifltfvmnvess(seqidno:17)

在一些情况下,信号多肽所包括的氨基酸序列与seqidno:11-17中任一种所阐述的氨基酸序列的氨基酸序列一致性为60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。

如下文更详细地描述,在一些情况下,表面锚定多肽包括tm域(例如,ii型tm域),其位置使表面可及融合蛋白为ii型膜蛋白(即,表面锚定多肽的位置将接近表面可及融合蛋白的n端而非c端)。如所属领域的一般技术人员将轻易地理解,在所述情况下,表面可及融合蛋白可以包括适于ii型膜蛋白的信号多肽。

目标蛋白

如本文中所用,术语“目标蛋白”、“poi”或“目标多肽”是指任何目标氨基酸序列。在一些情况下,poi是完整蛋白质(例如,天然存在的完整蛋白质、完整蛋白质的修饰形式等)。在一些情况下,poi是蛋白质的片段,且可以是任何目标片段。举例来说,如果希望研究蛋白质特定部分(例如,域、胞外域、蛋白质结合域、酶促域、表位、无已知功能或疑似功能的蛋白质的一部分等)的结合或功能,那么目标特定部分可以称为poi。衍生poi的蛋白质可以是任何蛋白质(例如,抗体、配位体、和受体、膜蛋白、分泌蛋白、胞内蛋白、定位于特定细胞器的蛋白质、胞质蛋白、酶等)。poi可以是天然存在的序列或非天然存在的序列(例如,合成氨基酸序列、天然存在的序列的突变/修饰形式等)。

在一些情况下,在本发明的方法中使用多种poi(例如,两种或更多种不同的poi)。在一些情况下,两种或更多种不同poi中的至少两种彼此相似。举例来说,在一些情况下,本发明的方法是可以用于识别以较强或较弱亲和力与特定化合物结合的变体的筛检方法。因此,可以使用作为彼此变体(例如,通过诱变而产生)的多种poi。在一些情况下,两种或更多种poi中的至少两种在氨基酸序列中相差1到20个氨基酸(例如,1到19个氨基酸、1到18个氨基酸、1到17个氨基酸、1到16个氨基酸、1到15个氨基酸、1到14个氨基酸、1到13个氨基酸、1到12个氨基酸、1到11个氨基酸、1到10个氨基酸、1到9个氨基酸、1到8个氨基酸、1到7个氨基酸、1到6个氨基酸、1到5个氨基酸、1到4个氨基酸、1到3个氨基酸、1到2个氨基酸、或1个氨基酸)。

茎多肽

在本文中也称为“合成茎多肽”的“茎多肽”是被设计成从细胞表面清除poi的合成序列(非天然存在的序列),且其具有惰性,因此poi与茎多肽不会相互作用。茎多肽打算提供poi与细胞表面的连接,同时允许poi在不受表面影响的情况下折叠(且在一些情况下起作用)。此外,使用合成茎多肽(例如,在一些情况下,外加合成表面锚定多肽,如合成gpi多肽)可以确保非所要重组不会在酵母基因组中出现,所述基因组介于酵母基因组序列与对合成茎(和/或合成表面锚定多肽)进行编码的核苷酸序列之间。

可以用于设计茎多肽的设计特征包括:氨基酸序列中的低复杂性、多肽的整体酸性特征、多肽的高亲水性、多肽中缺少规定的二级或三级结构特征、高密度的o连接的糖基化位点以及对茎多肽进行编码的核苷酸序列中的低自身相似性。在一些情况下,将所有这些特征考虑在内,因此茎多肽的特征在于:低氨基酸序列复杂性、整体酸性特征、高亲水性、缺少规定的二级或三级结构特征、高密度的o连接的糖基化位点,且对茎多肽进行编码的核苷酸序列的特征在于低自身相似性。在一些情况下,茎多肽包含在表达于真核细胞(例如,酵母细胞)中后很大程度上o-糖基化的氨基酸序列。在一些情况下,本发明的茎多肽(和对茎多肽进行编码的核苷酸序列)可以考虑(即,包括)上述特征中的任一种或全部(例如,以任何组合形式)。

如上所述,在一些情况下,茎多肽包含在表达于真核细胞(例如,酵母细胞)中后很大程度上o-糖基化的氨基酸序列。在一些情况下,茎多肽(例如,合成茎多肽)在5个氨基酸跨度内所包含的氨基酸序列具有1或更多个区(例如,2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、或7或更多个区),具有2到5个o连接的糖基化位点(例如,2到4个、2到3个、3到5个、3到4个、4到5个、2、3、4或5个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)在10个氨基酸跨度内所包含的氨基酸序列具有1或更多个区(例如,2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、或7或更多个区),具有2到5个o连接的糖基化位点(例如,2到4个、2到3个、3到5个、3到4个、4到5个、2、3、4或5个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)在20个氨基酸跨度内所包含的氨基酸序列具有1或更多个区(例如,2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、或7或更多个区),具有2到5个o连接的糖基化位点(例如,2到4个、2到3个、3到5个、3到4个、4到5个、2、3、4或5个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)在50个氨基酸跨度内所包含的氨基酸序列具有1或更多个区(例如,2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、或7或更多个区),具有2到5个o连接的糖基化位点(例如,2到4个、2到3个、3到5个、3到4个、4到5个、2、3、4或5个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)在100个氨基酸跨度内所包含的氨基酸序列具有1或更多个区(例如,2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、或7或更多个区),具有2到5个o连接的糖基化位点(例如,2到4个、2到3个、3到5个、3到4个、4到5个、2、3、4或5个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)在200个氨基酸跨度内所包含的氨基酸序列具有1或更多个区(例如,2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、或7或更多个区),具有2到5个o连接的糖基化位点(例如,2到4个、2到3个、3到5个、3到4个、4到5个、2、3、4或5个o连接的糖基化位点)。

在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列具有一或多个o连接的糖基化位点(例如,2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、7或更多个、8或更多个、9或更多个、或10或更多个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列具有1到10个o连接的糖基化位点(例如,1到9个、1到8个、1到7个、2到10个、2到9个、2到8个、或2到7个o连接的糖基化位点)。

在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列每20个氨基酸具有1或更多个o连接的糖基化位点(例如,1.2或更多个、1.4或更多个、1.6或更多个、1.8或更多个、2或更多个、2.2或更多个、2.4或更多个、2.6或更多个、2.8或更多个、或3或更多个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列每40个氨基酸具有1或更多个o连接的糖基化位点(例如,1.2或更多个、1.4或更多个、1.6或更多个、1.8或更多个、2或更多个、2.2或更多个、2.4或更多个、2.6或更多个、2.8或更多个、或3或更多个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列每50个氨基酸具有1或更多个o连接的糖基化位点(例如,1.2或更多个、1.4或更多个、1.6或更多个、1.8或更多个、2或更多个、2.2或更多个、2.4或更多个、2.6或更多个、2.8或更多个、或3或更多个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列每100个氨基酸具有0.5或更多个o连接的糖基化位点(例如,0.6或更多个、0.7或更多个、0.8或更多个、0.9或更多个、1或更多个、1.1或更多个、1.2或更多个、1.3或更多个、1.5或更多个、或2或更多个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列每100个氨基酸具有1或更多个o连接的糖基化位点(例如,1.2或更多个、1.4或更多个、1.6或更多个、1.7或更多个、1.8或更多个、2或更多个、2.2或更多个、2.4或更多个、2.6或更多个、2.8或更多个、或3或更多个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列每200个氨基酸具有0.5或更多个o连接的糖基化位点(例如,0.6或更多个、0.7或更多个、0.8或更多个、0.9或更多个、1或更多个、1.1或更多个、1.2或更多个、1.3或更多个、1.5或更多个、或2或更多个o连接的糖基化位点)。在一些情况下,茎多肽(例如,合成茎多肽)所包含的氨基酸序列每200个氨基酸具有1或更多个o连接的糖基化位点(例如,1.2或更多个、1.4或更多个、1.6或更多个、1.7或更多个、1.8或更多个、2或更多个、2.2或更多个、2.4或更多个、2.6或更多个、2.8或更多个、或3或更多个o连接的糖基化位点)。

茎多肽可以具有任何所要长度。举例来说,在一些情况下,茎多肽包含长度在10到2000个氨基酸范围内的多肽序列(例如,20到2000个氨基酸、50到2000个氨基酸、20到1500个氨基酸、50到1500个氨基酸、20到1000个氨基酸、50到1000个氨基酸、20到800个氨基酸、50到800个氨基酸、100到2000个氨基酸、100到1500个氨基酸、100到1000个氨基酸、100到800个氨基酸、10到100个氨基酸、20到100个氨基酸、40个氨基酸到100个氨基酸、101到200个氨基酸、201到300个氨基酸、301到400个氨基酸、401到500个氨基酸、501到600个氨基酸、601到700个氨基酸、701到800个氨基酸、801到900个氨基酸、901到1000个氨基酸、1001到1500个氨基酸、或1501到2000个氨基酸)。在一些情况下,茎多肽包含长度为10或更多个氨基酸的多肽序列(例如,20或更多个、30或更多个、40或更多个、50或更多个、60或更多个、70或更多个、80或更多个、90或更多个、100或更多个、125或更多个、150或更多个、200或更多个、250或更多个、300或更多个、350或更多个、400或更多个、450或更多个、或500或更多个氨基酸)。

在一些情况下,茎多肽的长度可以用于使表面可及融合蛋白接近具有限定分子量的试剂。举例来说,如果茎多肽较短(例如,100个氨基酸或更少),那么较大试剂则因为空间位阻而无法接近表面可及融合蛋白的poi。因此,可以“调节”茎多肽的长度来与所要试剂相匹配。举例来说,如果将要筛检化合物库来与给定poi结合,但又仅关注低于一定分子量(阈值分子量)的化合物,那么则可以选择一定长度的茎多肽以向高于所述阈值分子量的化合物提供空间位阻。换句话说,可以通过选择适当长度的茎多肽以将针对给定poi的空间可及性“调节”到所要分子量截断值。茎多肽的长度越大,空间位阻越小,且可及性越大(即,当茎多肽的长度增加,可以用于与表面可及融合蛋白的poi结合的试剂的尺寸也增加)。关于说明性实例,参见下文工作实例(图1a-1c和图2a-2b)。

适合茎多肽包括(但不限于)此处提供的实例:

s19(19个氨基酸)(seqidno:31)

ggggsggggsgstgggggs

s41(41个氨基酸)(seqidno:32)

qtsspsreasvstsstsssasqssdptttssstvstpatga

s232(232个氨基酸)(seqidno:33)

qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttss

s465(465个氨基酸)(seqidno:34

qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpat

s649(649个氨基酸)(seqidno:35)

qtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstk

在一些情况下,本发明合成茎多肽所包括的氨基酸序列与seqidno:31-35中任一种(例如,32-35、33-35、34-35)所阐述的氨基酸序列的氨基酸序列一致性为60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。在一些情况下,本发明合成茎多肽所包括的氨基酸序列与seqidno:32-35中任一种所阐述的氨基酸序列的氨基酸序列一致性为60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。在一些情况下,本发明合成茎多肽所包括的氨基酸序列与seqidno:33-35中任一种所阐述的氨基酸序列的氨基酸序列一致性为60%或更高(70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、95%或更高、98%或更高、99%或更高、99.5%或更高、99.8%或更高、99.9%或更高、或100%氨基酸序列一致性)。

表面锚定多肽

表面可及融合蛋白的本发明表面锚定多肽将融合蛋白锚定在细胞表面。在一些情况下,表面锚定多肽是(或衍生自)糖基磷脂酰肌醇(gpi)锚定域。各种细胞表面蛋白(包括酶、外壳蛋白、表面抗原以及粘附分子)经由gpi锚定物与质膜连接(布里科夫(burikofer)等人.2002《美国实验生物科学家联合会杂志(fasebj)》15:545)。gpi是翻译后添加的脂质锚定物;因此,与具有不同跨膜域且与特定细胞质延伸部分连接的常规多肽锚定物不同,gpi锚定物使用常见脂质结构来与膜连接,所述结构无关于与其连接的蛋白质(英格伦(englund)等人,阿努尔(annul)修订.《生物化学(biochem)》.62:121(1993))。

合成gpi锚定蛋白作为前体,其在n端或接近n端处具有可断裂的疏水性信号序列,所述序列使蛋白质靶向内质网(er)的内腔,且在c端或接近c端处具有引导gpi锚定的可断裂的信号序列(gpi锚定域)。在将gpi锚定物添加到具有gpi锚定域的蛋白质时,gpi锚定域的全部或一部分从蛋白质上断裂开,且gpi锚定物与蛋白质连接。gpi锚定域包括通过亲水性间隔区与gpi连接位点(ω位点)分离的疏水性区域。

已在整个广泛范围的真核生物物种(从人类到昆虫、酵母、细菌以及真菌)内识别gpi锚定蛋白。已识别许多蛋白质的gpi锚定域(例如,参见凯尔斯(cares)等人,《科学(science)》243:1196(1989))。已成功地将gpi锚定信号改造到其它蛋白质的c端上,并且将这些gpi锚定蛋白质覆盖在细胞表面上且其具有功能性。(安德森(anderson)等人,p.n.a.s.93:5894(1996);不伦瑞克(brunschwig)等人,《免疫治疗期刊(j.immunother)》.22:390(1999))。

适合gpi锚定域的实例包括(但不限于)以下参考文献中所披露的gpi锚定域:杜林,t.l.(doering,t.l.)等人.(1990)《生物化学杂志(j.biol.chem.)》265:611-614;麦康维尔,m.j.(mcconville,m.j.)等人.(1993)《生物化学杂志(biochem.j.)》294:305-324;以及pct公开案wo2003017944;所有文献均以全文引用的方式并入本文中。

任何适宜的gpi锚定域均可以用作表面锚定多肽。适用于本发明方法和组合物的gpi表面锚定多肽(例如,酿酒酵母(s.cerevisiae)蛋白中存在的gpi序列)的实例包括(但不限于):

iqqnftstslmistyegkasiffsaelgsiiflllsyllf(seqidno:51)

ekstnssssatsknagaamdmgffsagvgaaiagaaamll(seqidno:52)

sllksaasatsssqssskskgaagiieiplifralaelynlvl(seqidno:53)

ssgasssssksskgnaaimapigqttplvglltaiimsim(seqidno:54)

aqanvsasassssssskkskgaapelvpatsfmgvvaavgvall(seqidno:55)

gpgekarknnaapgpsnfnsiklfgvtagsaavagallll(seqidno:56)

sstgmlsptsssstrkengghnlnppffarfitaifhhi(seqidno:57)

ssfsssggssesttkkqnagykyrssfsfsllsfisyfll(seqidno:58)

ykstvngkvasvmsnstngatagthiaygagafavgalll(seqidno:59)

sgnlttstasatstsskrnvgdhivpslpltlisllfafi(seqidno:60)

gkngaksqgsskkmensapknifidafkmsvyavftvlfsiif(seqidno:61)

tgsssasssskskgvgnivnvsfsqsgylalfaglisall(seqidno:62)

asgssthkknagnalvnysnlntntfigvlsvisavfgli(seqidno:63)

edadedkddlkrkhrnsasisgpllplglcllfftfslff(seqidno:64)

gpi表面锚定多肽可以来自(例如,衍生自)以下蛋白质,其包括(但不限于):配对型蛋白凝集素-a-1(aga1)、凝结蛋白(例如,flo1)、sed1、cwp1、cwp2、tip1、tir1/srp1、ccw14、cis3、cwp1、pir1以及pir3。在一些情况下,本发明表面锚定多肽所包含的氨基序列与seqidno:51-64中任一种所阐述的氨基酸序列的氨基酸序列一致性为60%或更高(60%或更高、70%或更高、80%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情况下,本发明表面锚定多肽所包含的氨基序列与seqidno:51中所阐述的氨基酸序列的氨基酸序列一致性为60%或更高(60%或更高、70%或更高、80%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。

在一些情况下,表面锚定多肽是异源的(例如,相对于将在其中表达表面可及融合蛋白的宿主细胞,来自不同种属或来自不同有机体的gpi锚定域)。使用异源表面锚定多肽(例如,在一些情况下,外加合成茎多肽)可以降低非所要重组将在酵母基因组中出现的概率,所述基因组介于酵母基因组序列与对异源表面锚定多肽(和/或合成茎多肽)进行编码的核苷酸序列之间。

在一些情况下,表面锚定多肽是合成多肽(即,包含非天然存在的氨基酸序列的表面锚定多肽)。使用合成表面锚定多肽(例如,合成gpi锚定域)(在一些情况下,外加合成茎多肽)可以降低非所要重组将在酵母基因组中出现的概率,所述基因组介于酵母基因组序列与对合成表面锚定多肽(和/或合成茎多肽)进行编码的核苷酸序列之间。

适合合成(例如,杂交)gpi表面锚定多肽的实例是:qiqssmveistyagsansvnagagagalflllslaii(seqidno:71)。

在一些情况下,本发明表面锚定多肽(例如,gpi锚定域)所包含的氨基序列与seqidno:51-64和71中任一种所阐述的氨基酸序列(gpi锚定域氨基酸序列)的氨基酸序列一致性为60%或更高(60%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情况下,本发明合成表面锚定多肽所包含的氨基序列与seqidno:71中所阐述的氨基酸序列的氨基酸序列一致性为60%或更高(60%或更高、70%或更高、75%或更高、80%或更高、85%或更高、90%或更高、92%或更高、95%或更高、或100%氨基酸序列一致性)。在一些情况下,本发明的合成表面锚定多肽包含seqidno:71中所阐述的氨基酸序列。

因此,在一些情况下,表面可及融合蛋白包括gpi锚定域作为表面锚定多肽。因此,gpi锚定域可以位于信号多肽和茎多肽的c端。在所述情况下,poi将位于茎多肽的n端和信号多肽的c端(例如,介于信号多肽与茎多肽之间)。因此,在一些情况下(例如,当表面可及融合蛋白包括gpi锚定域作为表面锚定多肽时),从n端到c端,表面可及融合蛋白的组分包括信号多肽、poi、茎多肽(例如,合成茎多肽)以及表面锚定多肽(例如,gpi锚定域)。因此,在一些情况下,呈现部分(如下文所论述)和/或表面可及融合蛋白包括gpi锚定域作为表面锚定多肽。在一些情况下,表面可及融合蛋白还可以包括一或多个标记,如下文更加详细地论述。

在一些实施例中,表面锚定多肽包含插入细胞质膜中的跨膜(tm)域(例如,跨膜螺旋)。

在一些情况下,表面可及融合蛋白是i型膜蛋白(例如,具有i型tm域作为表面锚定多肽)。因此,tm域可以位于信号多肽和茎多肽的c端。在所述情况下,poi将位于茎多肽的n端和信号多肽的c端(例如,介于信号多肽与茎多肽之间)。换句话说,在所述情况下,tm域的位置将接近表面可及融合蛋白的c端,且poi和茎多肽都将位于tm域的n端。因此,在一些情况下(例如,当表面可及融合蛋白是i型膜蛋白且包括tm域作为表面锚定多肽时),从n端到c端,表面可及融合蛋白的组分包括信号多肽、poi、茎多肽(例如,合成茎多肽)以及表面锚定多肽(例如,tm域、i型tm域)。因此,在一些情况下,呈现部分(如下文所论述)和/或表面可及融合蛋白包括i型tm域作为表面锚定多肽。在一些情况下,表面可及融合蛋白还可以包括一或多个标记,如下文更加详细地论述。

在一些情况下,表面可及融合蛋白是ii型膜蛋白(例如,具有ii型tm域作为表面锚定多肽)。因此,tm域可以位于信号多肽的c端和茎多肽的n端。在所述情况下,poi将位于茎多肽的c端。换句话说,在所述情况下,tm域的位置将接近表面可及融合蛋白的n端,且茎多肽和poi都将位于tm域的c端。因此,在一些情况下(例如,当表面可及融合蛋白是ii型膜蛋白且包括tm域作为表面锚定多肽时),从n端到c端,表面可及融合蛋白的组分包括信号多肽、表面锚定多肽(例如,tm域、ii型tm域)、茎多肽(例如,合成茎多肽)以及poi。因此,在一些情况下,呈现部分(如下文所论述)和/或表面可及融合蛋白包括ii型tm域作为表面锚定多肽。在一些情况下,表面可及融合蛋白还可以包括一或多个标记,如下文更加详细地论述。

标记

在一些情况下,本发明的表面可及融合蛋白包括标记。如本文中所用,术语“标记”是包含可(直接和/或间接)检测且提供轻易追踪和/或纯化的氨基酸序列的多肽。所属领域的一般技术人员将已知适合标记的实例,且可以使用任何适宜的标记。适合标记的实例包括(但不限于)可直接检测的标记(例如,荧光多肽,如绿色荧光蛋白(gfp)、yfp、rfp、cfp、mcherry、tdtomato等);和亲和力标记(例如,组氨酸标记,如6xhis标记;血球凝集素(ha)标记;flag标记;myc标记等)。在一些情况下,表面可及融合蛋白包括多于一个标记。因此,在一些情况下,本发明的表面可及融合蛋白包括一或多个标记(2或更多个、3或更多个、或4或更多个标记,或1、2、3或4个标记)。

标记可以位于表面可及融合蛋白内的任何位置。举例来说,标记可以位于:(i)信号多肽的c端和poi的n端;和/或(ii)poi的c端和合成茎多肽的n端。在表面可及融合蛋白具有多于一个标记的情况下,标记可以位于poi的任一端(例如,一或多个标记位于信号多肽的c端和poi的n端,且一或多个标记位于poi的c端和合成茎多肽的n端)。在一些情况下,标记依次定位(即,彼此紧接)。

表面可及融合蛋白

本发明的表面可及融合蛋白是包括多种组分的单一蛋白质(例如,由多肽组分构成的蛋白质,所述多肽组分是模块化的且通过肽键连接在一起,以使其构成单一蛋白质)。本发明表面可及融合蛋白的各种组分(例如,信号多肽、poi、标记、茎多肽、表面锚定多肽)可以直接相继连接(无介入氨基酸),或者可以由连接子氨基酸(例如,任何数目的连接子氨基酸)隔开。举例来说,在一些情况下,不存在将本发明表面可及融合蛋白的两种给定组分隔开的氨基酸。在一些情况下,存在一或多个将本发明表面可及融合蛋白的两种给定组分隔开的氨基酸(例如,2或更多个、3或更多个、4或更多个、5或更多个、6或更多个、7或更多个、8或更多个、9或更多个、10或更多个、15或更多个、20或更多个、25或更多个、30或更多个、或40或更多个氨基酸)。在一些情况下,存在20或更少个将本发明表面可及融合蛋白的两种给定组分隔开的氨基酸(例如,15或更少个、10或更少个、9或更少个、8或更少个、7或更少个、6或更少个、5或更少个、4或更少个、3或更少个、或2或更少个氨基酸)。

在一些情况下,本发明的表面可及融合蛋白由信号多肽、poi、茎多肽以及表面锚定多肽组成。在一些情况下,本发明的表面可及融合物由信号多肽、poi、茎多肽、表面锚定多肽以及一或多个标记组成。在一些情况下,本发明的表面可及融合蛋白基本上由信号多肽、poi、茎多肽以及表面锚定多肽组成。在一些情况下,本发明的表面可及融合物基本上由信号多肽、poi、茎多肽、表面锚定多肽以及一或多个标记组成。

适合表面可及融合蛋白的两个说明性实例描述于下文中。在所述两个实例中,cv1是待呈现的poi。前述改造的蛋白质以高亲和力与cd47结合。在以下两个实例中,cv1在酵母细胞上呈现为表面可及融合蛋白,其系栓于茎(649个氨基酸)和两个不同gpi锚定物中的一个上:

“cv1pyds649hm”

信号序列:配对因子α前导子(氨基酸1-87)(seqidno:11)

目标蛋白:cv1(氨基酸90-208)(seqidno:7)

ha表位标记(氨基酸211-219)(seqidno:8)

茎:含649个氨基酸的茎(氨基酸220-868)(seqidno:35)

表面锚定物:杂交gpi锚定域(氨基酸871-907)(seqidno:71)

mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkreasaeeelqiiqpdksvlvaagetatlrctitslfpvgpiqwfrgagpgrvliynqrqgpfprvttvsdttkrnnmdfsirignitpadagtyycikfrkgspddvefksgagtelsvrakpsgsypydvpdyaqtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstkgaqiqssmveistyagsansvnagagagalflllslaii(seqidno:9)

“cv1pyds649αm”

信号序列:配对因子α前导子(氨基酸1-87)(seqidno:11)

目标蛋白:cv1(氨基酸90-208)(seqidno:7)

ha表位标记(氨基酸211-219)(seqidno:8)

茎:含649个氨基酸的茎(氨基酸220-868)(seqidno:35)

表面锚定物:agg1pgpi锚定域:(氨基酸871-910)(seqidno:51)

mrfpsiftavlfaassalaapantttedetaqipaeavidysdlegdfdaaalplsnstnnglsstnttiasiaakeegvqldkreasaeeelqiiqpdksvlvaagetatlrctitslfpvgpiqwfrgagpgrvliynqrqgpfprvttvsdttkrnnmdfsirignitpadagtyycikfrkgspddvefksgagtelsvrakpsgsypydvpdyaqtsspsteasvstsstsssasqssdptttsssssssspssqseeisssptvsttpstssssssmtsttttksiststtssapvtdvtvssspskststststetsktptsmteytsstsiistpvshsqtglsassssssttsgssstksessttsgssqsvestsshatvlansaemvttsssssstsemsltstatsvpvsssssttystsastqavtttssstvsttsssttltsafthssttssdqppsdttspstthephvttqtssetssskssstsssstsqtsesatpsdsvspgsststsssstststsissgetttssssssatttsnsatlsvsttqtsieasssttstssstittssssahissksqssitypssstssstsssissesesfestsaedapstapsssvssksststtsststssstpspspssvsssstsslttsavstpatshsqstvvttttittstgpvmstttaysssstsssessevqsvmsstpsststttssestsssstastspstsqtfetsptiggvpsttsfvstpttklshttstmtaqsdsksthssststedksstasavdestttststesttsvtsgtshsakesssnskvyssqtahssisvasspstkgaiqqnftstslmistyegkasiffsaelgsiiflllsyllf(seqidno:10)

核酸

本发明的方面包括:用于表达表面可及融合蛋白的核酸、对表面可及融合蛋白进行编码的核酸以及使用所述核酸的方法(例如,用以在细胞表面上表达表面可及融合蛋白、用于筛检与表面可及融合蛋白结合的化合物、用于筛检与目标化合物结合的多肽等)。在一些情况下,本发明的核酸是重组表达载体(例如,用于表达本发明的表面可及融合蛋白)。

在一些情况下,用于表达表面可及融合蛋白的本发明核酸不包括对目标蛋白(poi)进行编码的核苷酸序列。举例来说,核酸可以是包括poi的前体(例如,介于对信号多肽和茎多肽进行编码的核苷酸序列之间)。举例来说,核酸可以包括对信号多肽、茎多肽以及表面锚定多肽(且在一些情况下,对标记)进行编码的核苷酸序列,上述所有均可操作地连接于相同启动子,其中启动子在目标真核宿主细胞(例如,真核细胞、哺乳动物细胞、真菌细胞、酵母细胞、酿酒酵母细胞等)中具有功能性,但核酸可能不包括对poi进行编码的核苷酸。在一些情况下,所述核酸是重组表达载体。

在一些情况下,核酸(例如,重组表达载体)包括插入poi的插入位点。举例来说,插入对poi进行编码的核苷酸的插入位点可以存在于对以下进行编码的核苷酸之间:信号多肽与茎多肽(信号:茎接合点)、信号多肽与标记(信号:标记接合点)、标记与茎多肽(标记:茎接合点)和/或第一标记与第二标记(标记:标记接合点)。在一些情况下,插入对poi进行编码的核苷酸的插入位点与对茎多肽进行编码的核苷酸相邻定位。

所属领域的一般技术人员已知用于各种技术的插入位点,且可以使用任何适宜的插入位点。换句话说,插入位点可以用于任何控制核酸序列的方法。举例来说,在一些情况下,插入位点可以是多克隆位点(例如,包括一或多个限制酶位点的位点)、用于接合独立克隆的位点、用于基于重组的克隆的位点(例如,基于att位点的重组)、由基于crispr(例如,cas9)的技术所识别的核苷酸序列等。在一些情况下,插入位点可以由对本发明表面可及融合蛋白的一种组分进行编码的核苷酸与对本发明表面可及融合蛋白的另一种组分进行编码的核苷酸的接合点来限定(例如,信号:茎接合点、标记:茎接合点和/或标记:标记接合点),因此不存在介入核苷酸。插入位点可以具有任何所要长度,且不必与3'组分(例如,对茎多肽和表面锚定多肽进行编码的核苷酸)同框,因为插入位点打算受到修饰(例如,在一些情况下被替换)以包括对目标蛋白进行编码的核苷酸序列。所属领域的一般技术人员将了解,在插入位点插入对poi进行编码的核苷酸后,其需要与上游序列(例如,对信号多肽进行编码的序列)和下游序列(例如,对茎多肽和表面锚定多肽进行编码的序列)同框。

因此,在一些情况下,(用于在细胞表面上表达目标多肽的)本发明核酸包括对呈现部分进行编码的核苷酸序列。如本文所用,“呈现部分”是指除poi之外,本发明表面可及融合蛋白的组分的组合。举例来说,呈现部分可以包括信号多肽、茎多肽(例如,合成茎多肽)以及表面锚定多肽(未必按所述顺序)。在一些情况下,按从n端到c端的顺序,呈现部分包括信号多肽、茎多肽(例如,合成茎多肽)以及表面锚定多肽(例如,gpi锚定域、i型tm域等)。在一些情况下,按从n端到c端的顺序,呈现部分包括信号多肽、表面锚定多肽(例如,ii型tm域、来自ii型膜蛋白的tm域等)以及茎多肽(例如,合成茎多肽)。当本发明的核酸不包括poi时(例如,当核酸包括poi的插入位点时、当核酸打算用于插入对poi进行编码的核苷酸序列时等),在插入对po进行编码的核苷酸序列之前,对呈现部分的组分进行编码的核苷酸不必彼此同框。举例来说,其可以在插入对poi进行编码的核苷酸序列之后彼此同框,因此所编码的表面可及融合蛋白包括呈现部分的组分(即,信号多肽、茎多肽以及表面锚定多肽;其顺序可以视上述表面锚定多肽的性质而变化)。在所述情况下,核酸仍然可以称为包括对呈现部分进行编码的核苷酸序列。

在一些情况下,本发明的呈现部分包括信号多肽、茎多肽以及表面锚定多肽。在一些情况下,本发明的呈现部分包括信号多肽、茎多肽、表面锚定多肽以及一或多个标记。在一些情况下,本发明的呈现部分由信号多肽、茎多肽以及表面锚定多肽组成。在一些情况下,本发明的呈现部分由信号多肽、茎多肽、表面锚定多肽以及一或多个标记组成。在一些情况下,本发明的呈现部分基本上由信号多肽、茎多肽以及表面锚定多肽组成。在一些情况下,本发明的呈现部分基本上由信号多肽、茎多肽、表面锚定多肽以及一或多个标记组成。

举例来说,在一些情况下,(用于在细胞表面上表达目标多肽的)本发明核酸包括对以下进行编码的核苷酸序列:(i)对信号多肽进行编码的第一核苷酸序列;(ii)对合成茎多肽进行编码的第二核苷酸序列;以及(iii)对表面锚定多肽进行编码的第三核苷酸序列。在一些情况下,(i)、(ii)以及(iii)沿5'到3'方向相对于彼此定位并且可操作地连接于相同启动子,其中启动子在宿主细胞(例如,真核细胞、脊椎动物细胞、无脊椎动物细胞、哺乳动物细胞、真菌细胞、酵母细胞等)中具有功能性。在一些所述情况下,核酸包括插入对目标蛋白(poi)进行编码的核苷酸序列的(上述)插入位点,其中插入位点位于(i)的3'处和(ii)的5'处。在一些情况下,核酸还包括对标记进行编码的核苷酸序列(例如,其位置使其与对其它组分[(i)、(ii)以及(iii)]进行编码的核苷酸序列中的至少一种同框)。

在一些情况下(例如,当本发明的核酸包括对呈现部分进行编码的核苷酸序列时),上文(i)、(ii)以及(iii)沿5'到3'方向相对于彼此定位,其顺序为:(i)、(iii)以及(ii)(例如,当表面锚定多肽是tm域且表面可及融合蛋白将为ii型膜蛋白时),且可操作地连接于相同启动子,其中启动子在宿主细胞(例如,真核细胞、脊椎动物细胞、无脊椎动物细胞、哺乳动物细胞、真菌细胞、酵母细胞等)中具有功能性。在一些所述情况下,核酸包括插入对目标蛋白(poi)进行编码的核苷酸序列的(上述)插入位点,其中插入位点位于(ii)的3'处。在一些情况下,核酸还包括对标记进行编码的核苷酸序列(例如,其位置使其与对其它组分[(i)、(ii)以及(iii)]进行编码的核苷酸序列中的至少一种同框)。

对表面可及融合蛋白进行编码的核酸包括对表面可及融合蛋白(具有信号多肽、目标蛋白(poi)、茎多肽以及表面锚定多肽的融合蛋白)(且在一些情况下,具有标记)进行编码的核苷酸序列。在一些情况下,对表面可及融合蛋白进行编码的核苷酸序列可操作地连接于启动子,所述启动子在目标真核宿主细胞(例如,真核细胞、哺乳动物细胞、真菌细胞、酵母细胞、酿酒酵母细胞等)中具有功能性。

因此,在一些情况下,(例如,对表面可及融合蛋白进行编码的)本发明核酸包括:(i)对信号多肽进行编码的第一核苷酸序列;(ii)对目标蛋白(poi)进行编码的第二核苷酸序列;(iii)对合成茎多肽进行编码的第三核苷酸序列;以及(iv)对表面锚定多肽进行编码的第四核苷酸序列。在一些所述情况下,(i)、(ii)、(iii)以及(iv)从5'到3'按[(i)、(ii)、(iii)以及(iv)]的顺序定位,且彼此同框以使其共同对包括信号多肽、poi、茎多肽以及表面锚定多肽(例如,在一些情况下,按所述顺序)的表面可及融合蛋白进行编码。在一些情况下,所编码的表面可及融合蛋白还包括标记,因此核酸包括对所述标记进行编码的核苷酸序列。在一些情况下,对表面可及融合蛋白进行编码的核苷酸序列可操作地连接于启动子,所述启动子在目标真核宿主细胞(例如,真核细胞、哺乳动物细胞、真菌细胞、酵母细胞、酿酒酵母细胞等)中具有功能性。

在一些情况下,(例如,对表面可及融合蛋白进行编码的)本发明核酸包括:(i)对信号多肽进行编码的第一核苷酸序列;(ii)对表面锚定多肽(例如,当表面可及融合蛋白是ii型膜蛋白时,其为tm域)进行编码的第二核苷酸序列;(iii)对合成茎多肽进行编码的第三核苷酸序列;以及(iv)对目标蛋白(poi)进行编码的第四核苷酸序列。在一些所述情况下,(i)、(ii)、(iii)以及(iv)从5'到3'按[(i)、(ii)、(iii)以及(iv)]的顺序定位,且彼此同框以使其共同对包括信号多肽、表面锚定多肽、茎多肽以及poi(例如,在一些情况下,按所述顺序)的表面可及融合蛋白进行编码。在一些情况下,所编码的表面可及融合蛋白还包括标记,因此核酸包括对所述标记进行编码的核苷酸序列。在一些情况下,对表面可及融合蛋白进行编码的核苷酸序列可操作地连接于启动子,所述启动子在目标真核宿主细胞(例如,真核细胞、哺乳动物细胞、真菌细胞、酵母细胞、酿酒酵母细胞等)中具有功能性。

如本文所用,“启动子序列”或“启动子”是能够结合rna聚合酶且引发下游(3'方向)编码或非编码序列的转录的dna调节区。出于本发明的目的,启动子序列由转录引发位点在其3'端处定界,且向上游(5'方向)延伸,以包括以在背景上可检测的水平引发转录所必需的至少最小数目的碱基或要素。启动子序列内将存在引起rna聚合酶结合的蛋白质结合域。真核启动子往往(而非始终)将含有“tata”框和“cat”框。包括诱导型启动子的各种启动子可以用于驱动本发明的各种载体。启动子可以是构成性活性启动子(即,在构成上处于活性/”启用”状态的启动子)。启动子可以是诱导型启动子(即,状态为活性/”启用”或非活性/“停用”的启动子由外部刺激控制,例如存在特定温度、化合物或蛋白质)。

可以使用任何适宜的启动子,且所属领域的一般技术人员可轻易地获得许多启动子。应了解,启动子必须在表达表面可及融合蛋白的细胞(例如,真核细胞、真菌细胞、酵母细胞、脊椎动物细胞、哺乳动物细胞、无脊椎动物细胞等)中具有功能性。适用于酵母表达载体的启动子的实例包括(但不限于):aox1启动子、半乳糖诱导型启动子(例如,pgal1、pgal1-10、pgal4、pgal10等)、磷酸甘油酸激酶(ppgk)启动子、细胞色素c(pcyc1)启动子、醇脱氢酶i(padh1)启动子等。

其它例示性启动子包括(但不限于):sv40早期启动子、鼠标乳腺肿瘤病毒长末端重复(ltr)启动子;腺病毒主要晚期启动子(admlp);单纯性疱疹病毒(hsv)启动子、巨细胞病毒(cmv)启动子(如cmv即刻早期启动子区域(cmvie))、劳斯氏肉瘤病毒(roussarcomavirus,rsv)启动子、人类u6小核启动子(u6)(宫岸(miyagishi)等人,《自然·生物技术(naturebiotechnology)》20,497-500(2002))、增强型u6启动子(例如,夏(xia)等人,《核酸研究(nucleicacidsres.)》2003年9月1日;31(17))、人类h1启动子(h1)等。

诱导型启动子的实例包括(但不限于):t7rna聚合酶启动子、t3rna聚合酶启动子、异丙基-β-d-硫代吡喃半乳糖苷(iptg)调节型启动子、乳糖诱导型启动子、热休克启动子、四环素调节型启动子、类固醇调节型启动子、金属调节型启动子、雌激素受体调节型启动子等。因此,诱导型启动子可以由包括(但不限于)以下的分子调节:多西环素(doxycycline);rna聚合酶,例如t7rna聚合酶;雌激素受体;雌激素受体融合物等。

上述核酸中的任一种均可以是重组表达载体(其可以包括用于表达本发明表面可及融合蛋白的任何适宜的启动子,包括(但不限于)上述启动子中的任一种)。在一些实施例中,本发明的重组表达载体在宿主细胞中是可操作的,以直接表达且呈现表面可及融合蛋白。在一些实施例中,本发明的重组表达载体在酵母细胞中是可操作的,以引导表面可及融合蛋白的表达和呈现。

各种重组表达载体是所属领域中所已知的且可购得,其满足酵母中重组基因表达的各种要求。大部分酵母载体是穿梭载体,其含有允许对其进行选择且在细菌(例如,大肠杆菌(e.coli))中扩增的序列,因此允许适宜的扩增和随后的活体外变异。许多常见酵母穿梭载体来源于pbr322。其含有在大肠杆菌中促进保持高拷贝数的复制起点(例如,cole1复制起点)和可选择性抗生素标记物(例如,β-内酰胺酶基因、四环素抗性基因,其分别赋予针对安比西林(ampicillin)和四环素的抗性)。特定酵母穿梭载体包括(但不限于)美国专利第5,866,404号和第6,897,353号中所描述的酵母穿梭载体。适用于实践本文所描述方法(例如(但不限于)在如巴斯德毕赤酵母(pichiapastoris)(即,巴斯德毕赤酵母宿主细胞)的种属中表达本发明的表面可及融合蛋白)的其它酵母载体描述于美国专利第5,707,828号、第6,730,499号、美国专利公开案第20060270041号以及pct公开案第wo2005040395号和第wo200231178号中。

酵母载体可以含有标记物基因,所述标记物基因允许选择含有所要质体的转化子。最常使用的酵母标记物基因的实例包括(但不限于)ura3、his3、leu2、trp1以及lys2,其与宿主细胞中的特定营养缺陷型突变体互补。因为ura3和lys2酵母标记物基因允许使用正选择和负选择方案,所以其具有额外优点。也可以使用向酵母宿主细胞赋予显性抗药表现型的可选标记物基因,如分别赋予对潮霉素b和诺尔丝菌素的抗性的hph和nat基因(参见佐藤(sato)等人,《酵母(yeast)》22:583-591(2005))。大部分当前使用的酵母穿梭载体属于以下三种广泛类别中的一种:(i)整合型载体、(ii)自主复制的高拷贝数载体或(iii)自主复制的低拷贝数载体。

许多适合的表达载体是所属领域的技术人员所已知的,且许多表达载体是市售的。通过举例提供以下载体;针对真核宿主细胞:pxt1、psg5(斯塔津(stratagene))、psvk3、pbpv、pmsg以及psvlsv40(法玛西亚(pharmacia))。然而,可以使用任何其它载体,只要其与宿主细胞相容即可。

在一些实施例中,重组表达载体是病毒构筑体,例如,重组腺相关病毒构筑体(参见例如,美国专利第7,078,387号)、重组腺病毒构筑体、重组慢病毒构筑体、重组逆转录病毒构筑体等。适合表达载体包括(但不限于):病毒载体(例如,基于以下的病毒载体:牛痘病毒;脊髓灰质炎病毒;腺病毒(参见例如,李(li)等人,《眼科研究与视力学(investopthalmolvissci)》35:25432549,1994;波纳斯(borras)等人,《基因疗法(genether)》6:515524,1999;李(li)和戴维森(davidson),《美国国家科学院院刊(pnas)》92:77007704,1995;坂本(sakamoto)等人,《人类基因疗法(hgenether)》5:10881097,1999;wo94/12649、wo93/03769;wo93/19191;wo94/28938;wo95/11984以及wo95/00655);腺相关病毒(参见例如,阿里(ali)等人,《人类基因疗法(humgenether)》9:8186,1998;弗兰纳里(flannery)等人,《美国国家科学院院刊》94:69166921,1997;班尼特(bennett)等人,《眼科研究与视力学》38:28572863,1997;久玛丽(jomary)等人,《基因疗法》4:683690,1997;罗玲(rolling)等人,《人类基因疗法》10:641648,1999;阿里等人,《人类分子遗传学(hummolgenet)》5:591594,1996;斯瑞瓦斯特娃(srivastava),wo93/09239;萨姆斯基(samulski)等人,《病毒学杂志(j.vir.)》(1989)63:3822-3828;蒙德尔森(mendelson)等人,《病毒学(virol.)》(1988)166:154-165;以及弗洛狄(flotte)等人,《美国国家科学院院刊》(1993)90:10613-10617);sv40;单纯性疱疹病毒;人类免疫缺陷病毒(参见例如,三好(miyoshi)等人,《美国国家科学院院刊》94:1031923,1997;高桥(takahashi)等人,《病毒学杂志(jvirol)》73:78127816,1999);逆转录病毒载体(例如,鼠类白血病病毒、脾坏死病毒,以及衍生自逆转录病毒的载体,如劳斯氏肉瘤病毒(roussarcomavirus)、哈维肉瘤病毒(harveysarcomavirus)、禽白血病病毒、慢病毒、人类免疫缺陷病毒、骨髓增生性肉瘤病毒以及乳腺肿瘤病毒)等。

视所用的宿主/载体系统而定,表达载体中可使用多种适合转录与翻译控制要素(包括构成性和诱导型启动子、转录增强子要素、转录终止子等)中的任一种(参见例如,比特(bitter)等人(1987)《酶学方法(methodsinenzymology)》,153:516-544)。

在一些情况下,对本发明表面可及融合蛋白的组分进行编码的核苷酸操作地连接到转录终止序列(例如,以促进适当的mrna加工)。因此,在一些情况下,本发明的重组表达载体包括终止序列。转录终止要素(终止序列)的实例包括(但不限于)若干酵母基因的终止序列,如cyc1、adh1、aro4、trp1、act1以及ypt1。可以使用任何适宜的终止序列。

具有对本发明表面可及融合蛋白进行编码的核苷酸序列的本发明dna核酸的一个说明性实例是seqidno:6中所阐述的8584核苷酸(nt)载体。在此实例中,信号多肽是由核苷酸856-1113(seqidno:1)编码的配对因子α前导子;目标蛋白(poi)是由核苷酸1123-1479(seqidno:2)编码的cv1;合成茎多肽(649个氨基酸)由核苷酸1513-3459(seqidno:4)编码;并且表面锚定多肽是由核苷酸3466-3576(seqidno:5)编码的合成杂交gpi序列。此例示性核酸还具有对ha表位标记进行编码的核苷酸(核苷酸1486-1512)(seqidno:3)。

宿主细胞

本发明的方面包括:包括上述表面可及融合蛋白和/或核酸(例如,用于表达表面可及融合蛋白的核酸和/或对表面可及融合蛋白进行编码的核酸)的细胞(即,宿主细胞)。术语“宿主细胞”在本文中用于指代本发明的表面可及融合蛋白将在其中表达并呈现的细胞;或指代核酸在其中扩增的细胞。宿主细胞可以用于表达来自本发明核酸(如重组表达载体(例如,真核宿主细胞))的本发明表面可及融合蛋白,和/或使本发明的重组表达载体(例如,真核宿主细胞或原核宿主细胞)增殖。

在一些情况下,本发明的宿主细胞是原核细胞。举例来说,在一些情况下,出于增殖和/或纯化重组表达载体的目的,(具有对表面可及融合蛋白进行编码的核苷酸的)本发明重组表达载体处于原核细胞的内部。因此,在一些情况下,原核细胞(例如,细菌细胞,如大肠杆菌细胞)包括上述核酸(例如,重组表达载体)。

在一些情况下,适合的宿主细胞是单细胞真核有机体的细胞、真菌细胞、酵母细胞、动物细胞、无脊椎动物(例如,果蝇、刺胞动物、棘皮动物、线虫等)细胞、脊椎动物(例如,鱼、两栖动物、爬行动物、鸟、哺乳动物)细胞、哺乳动物(例如,猪、奶牛、山羊、绵羊、啮齿动物、大鼠、小鼠、非人类灵长类动物、人类等)细胞等。

在一些情况下,适合的宿主细胞是真菌细胞。任何真菌细胞(例如,任何适宜的真菌种属)均为适合的。在一些情况下,适合的宿主细胞是酵母细胞。可以使用任何适宜的酵母细胞种属。适合酵母种属(即,适合酵母细胞的种属)的说明性实例包括(但不限于):酿酒酵母(saccharomycescerevisiae)、粟酒裂殖酵母(schizosaccharomycespombe)、啤酒酵母(saccharomycesuvaruium)、巴斯德毕赤酵母(合成巴斯德驹形氏酵母(komagataellapastoris))、多形汉逊酵母(hansenulapolymorpha)(合成拟多形绪方氏酵母(ogataeaparapolymorpha))、解脂耶罗威亚酵母(yarrowialipolytica)、树干毕赤酵母(pichiastipitis)(合成木糖发酵酵母(scheffersomycesstipitis))、马克斯克鲁维酵母(kluyveromycesmarxianus)、嗜鞣管囊酵母(pachysolentannophilus)、博伊丁假丝酵母(candidaboidinii)、白假丝酵母(candidaalbicans)以及索诺拉沙漠假丝酵母(candidasorenensi)。

引入核酸(例如,重组表达载体)的适合方法(也称为“转化”和/或“转染”)包括(例如):病毒感染、转染、脂质体转染、核转染、电穿孔、磷酸钙沉淀、聚乙烯亚胺(pei)介导转染、deae葡聚糖介导转染、脂质体介导转染、粒子枪技术、磷酸钙沉淀、直接显微注射、纳米粒子介导核酸传送(参见例如,帕尼亚姆(panyam)等人《先进药物传递评论(advdrugdelivrev.)》2012年9月13日.pii:s0169-409x(12)00283-9.doi:10.1016/j.addr.2012.09.023)等。可以使用任何适宜的方法。

对引入核酸方法的选择通常视转化的细胞类型和发生转化的环境而定。举例来说,当转化真菌细胞(如酵母)时,可以使用如使用乙酸锂、单股载体dna、和/或peg(在一些情况下,伴随热休克)的方案。所属领域的一般技术人员将能够轻易地确定将本发明的核酸引入所要宿主细胞中的适当方案。各种转化方法的一般论述可以在奥斯贝(ausubel)等人,《精编分子生物学实验指南(shortprotocolsinmolecularbiology)》,第3版,威利父子(wiley&sons),1995中找到。

举例来说,使细胞与包含本发明核酸的病毒粒子接触以用于病毒载体传送。逆转录病毒(例如,慢病毒)尤其适合。常用的逆转录病毒载体是“有缺陷的”,即无法产生增殖性感染所需的病毒蛋白。相反,载体的复制需要包装细胞系中的生长。为了产生包含目标核酸的病毒粒子,通过包装细胞系将包含所述核酸的逆转录病毒核酸包装到病毒衣壳中。不同包装细胞系提供并入衣壳中的不同包膜蛋白(单嗜性、双嗜性或异嗜性),这种包膜蛋白决定病毒粒子针对细胞的特异性(对鼠类和大鼠具有单嗜性;对大部分哺乳动物(包括人类、狗和小鼠)细胞类型具有双嗜性;并且对大部分哺乳动物细胞类型(除了鼠类细胞之外)具有异嗜性。适当包装细胞系可以用于确保包装的病毒粒子靶向细胞。将具有目标核酸的逆转录病毒载体引入包装细胞系中的方法和收集由包装系产生的病毒粒子的方法是所属领域中已知的。

方法

本发明的方面包括使用上述表面可及融合蛋白和核酸的方法。所提供的方法用于:(i)在真核细胞中表达目标蛋白(poi)(例如,在真核细胞表面上呈现poi);(ii)测量试剂与poi的结合(例如,在一些情况下,确定试剂是否可以与poi结合);(iii)识别与poi结合的试剂(化合物)(例如,筛检与poi结合的试剂的测试化合物);(iv)识别与试剂结合的多肽(例如,当试剂以特定浓度存在时与试剂结合的多肽,例如识别以大于或等于预定值的亲和力与试剂结合的多肽);(v)产生与试剂结合的变体多肽,所述变体多肽的亲和力不同于(例如,大于)衍生出所述变体的多肽的亲和力等。

(i)表达方法

在一些实施例中,本发明的方法是在真核细胞中表达目标蛋白(poi)(例如,在真核细胞表面上呈现poi)的方法。所述方法包括:将包括poi的本发明表面可及融合蛋白引入细胞(例如,任何所要宿主细胞)中。举例来说,所述方法可以包括:将具有对表面可及融合蛋白进行编码的核苷酸序列的核酸引入真核细胞(例如,上述宿主细胞,如真菌细胞、酵母细胞、哺乳动物细胞等)中,其中表面可及融合蛋白包括信号多肽、poi、茎多肽以及表面锚定多肽(且在一些情况下,包括标记)。包括poi的表面可及融合蛋白可以通过以下方式引入细胞中:(i)直接作为蛋白质(例如,在一些情况下,使用蛋白质转导域);(ii)作为对蛋白质进行编码的rna;(iii)或作为对蛋白质进行编码的dna。在一些情况下(例如,当表面可及融合蛋白作为dna引入细胞中时),对表面可及融合蛋白进行编码的核苷酸可操作地连接于可在细胞中操作的启动子。

在一些情况下,在真核细胞中表达目标蛋白(poi)(例如,在真核细胞表面上呈现poi)的方法进一步包括下文所述方法步骤的任何组合。

(ii)测量结合的方法

在一些实施例中,本发明的方法是测量试剂与poi的结合(例如,在一些情况下,确定试剂是否可以与poi结合)的方法。测量试剂与poi的结合的方法可以包括在真核细胞(例如,任何目标真核宿主细胞,如哺乳动物细胞、真菌细胞、酵母细胞等)表面上呈现poi(例如,参见上文“表达方法”)。

测量试剂与poi的结合的方法包括使真核细胞(通过在细胞表面上将poi呈现为表面可及融合蛋白来表达poi的细胞)与试剂接触。试剂(在本文中也称为“测试化合物”)可以是任何能与poi结合的试剂。举例来说,适合试剂包括任何化学实体、药剂、药物、肽、抗体、抗体结合片段、小分子化合物,包括可以测试(例如,筛检)其与一或多个poi的潜在结合的已知和潜在的治疗化合物。举例来说,在一些情况下,poi包括抗体的抗原结合域,且试剂(例如,测试试剂)是肽(在一些情况下是已知与抗体结合的肽变体)。在一些情况下,poi是针对抗体的表位(或已知表位的变体),且试剂是抗体或抗体的抗原结合域。在一些情况下,poi是配位体/受体对的配位体或受体结合区(或其变体)。

在一些情况下,试剂包括可检测标记(例如,可以直接或间接地检测试剂)。在一些情况下,直接标记试剂(例如,试剂可以包括可直接检测的加合物,如荧光加合物)。在一些情况下,间接标记试剂(例如,试剂可以包括可间接检测的加合物,如生物素)。

在一些情况下,测量与poi结合(即,与表面可及融合蛋白结合)的试剂量可以通过(例如,如下所述定量地或定性地)测量与表达表面可及融合蛋白的细胞结合的试剂量来实现。

如本文中所用,“测量量”可以提供定性或定量结果,且因此,如本文中所用的短语涵盖定量以及定性测量值。举例来说,在一些情况下,当定性地测量量时,测量与poi结合的试剂量包括确定试剂是否与poi结合(例如,是否与表达包括poi的表面可及融合蛋白的细胞结合;在方案结束时是否存在等)。在一些情况下,测量与poi结合的试剂量包括确定试剂与poi的结合是否超过特定结合阈值。因此,在一些情况下,测量量的步骤包括确定试剂是否与poi结合的步骤(例如,与表面可及融合蛋白结合,与表达表面可及融合蛋白的细胞结合等)。在一些情况下,对量进行测量为是否存在试剂提供了单纯的“是”或“否”测定结果。

同样地,在一些实施例中,测量量包括确定与表面可及融合蛋白结合的试剂量的定量测定值(例如,使用流式细胞测量术、elisa或任何其它可以定量地测量给定方案结束时所存在的(例如,最终洗涤步骤后所存在的)试剂量的方法。所结合试剂的量(含量)可以表示为与特定检定相关的任意单位(例如,萤光单位,如平均荧光强度(mfi)),或者可以表示为具有规定单位的绝对值(例如,分子的数目(例如,mol)、蛋白质分子的数目、试剂的浓度等)。此外,可以比较定量测量的量(含量)与参考值的量,以导出表示标准化测量量的标准化值。因此,测量量的步骤可以是以定性方式(“存在”与“不存在”;“是,超过预定阈值”与“否,不超过预定阈值”;等)或以定量方式进行检测。

如流式细胞测量术和elisa的技术可以用于定性和定量测量步骤。举例来说,两种技术均可以用于(例如,以荧光单位,如平均荧光强度(mfi))测定所存在试剂的定量的量,还可以用于单纯地确定存在量是否超过特定阈值。

(iii)识别试剂的方法

在一些实施例中,本发明的方法是识别与poi结合的试剂(化合物)(例如,筛检与poi结合的试剂的测试化合物)的方法。识别与poi结合的试剂的方法包括:在真核细胞(例如,任何目标真核宿主细胞,如哺乳动物细胞、真菌细胞、酵母细胞等)表面上呈现poi,使细胞与试剂接触,以及(定量地和/或定性地)测量与细胞结合的试剂量。

在一些情况下,给定表面可及融合蛋白可以呈现于两种或更多种细胞的表面上(例如,呈现于两种或更多种单独种群细胞的细胞表面上),且每种细胞(例如,每一单独种群的细胞)均与不同试剂接触。因此,可以筛检两种或更多种试剂(例如,试剂库)以识别哪些(如果存在的话)试剂会与将poi表达为表面可及融合蛋白的细胞结合。

如上所述,在一些情况下,poi包括抗体的抗原结合域,且试剂(例如,测试试剂)是肽(在一些情况下是已知与抗体结合的肽变体);在一些情况下,poi是针对抗体的表位(或已知表位的变体),且试剂是抗体或抗体的抗原结合域;并且在一些情况下,poi是配位体/受体对的配位体或受体结合区(或其变体)。在一些所述情况下,方法可以包括诱变步骤(例如,使用任何适宜的方法,如随机或定点pcr方案)。举例来说,可以产生两种或更多种测试试剂(例如,测试试剂库)(例如,作为彼此变体的两种或更多种试剂),且试剂可以用于接触表达本发明表面可及融合蛋白的细胞,且可以识别与细胞结合的那些试剂。

在一些情况下,可以控制试剂的浓度,因此将仅识别出那些以特定(或更佳)亲和力结合的试剂。在一些情况下,可以使用不同浓度的给定试剂来接触每种细胞(例如,单独种群的细胞)。因此,所述方法可以用于确定在不同的试剂浓度下,试剂与给定poi的结合是否得以维持(其例如可以用于估测试剂针对poi的亲和力)。举例来说,可以在10nm、100nm以及1000nm下使用试剂来接触三种不同的细胞种群,每一细胞种群均表达相同的表面可及融合蛋白。可以在每种浓度下确定试剂是否结合,且可以估测结合亲和力。举例来说,相比于在1000nm下结合但在100nm或10nm下不结合的试剂,可以说在全部三种浓度下均结合的试剂以更高亲和力与给定poi结合。

在一些情况下,表达表面可及融合蛋白的细胞可以在同一时间(同时)与两种或更多种试剂接触,其中试剂彼此有区别(例如,其中每种试剂具有不同的可检测标记)。作为说明性实例,给定细胞或给定种群的细胞可以与10种不同的试剂接触,其中每种试剂包括不同的可检测标记(例如,不同的荧光标记)。在适当洗涤后,可以(定量地和/或定性地)测量每种可检测标记的量。举例来说,可以使用所述方法来汇集多种不同的试剂,以从不与表面可及融合蛋白结合的试剂中识别与表面可及融合蛋白结合的试剂。

(iv)识别多肽的方法

在一些实施例中,本发明的方法是识别与试剂结合的多肽(例如,当试剂以特定浓度存在时与试剂结合的多肽,例如识别以大于或等于预定值的亲和力与试剂结合的多肽)的方法。识别与试剂结合的多肽的方法包括在真核细胞(例如,任何目标真核宿主细胞,如哺乳动物细胞、真菌细胞、酵母细胞等)表面上呈现poi。所述方法可以与上文用于识别试剂的方法相同,而这时所使用的可以保持不变(或以特定浓度使用),但试剂用于接触以下两种或更多种细胞,其中两种或更多种细胞中的至少两种表达(正在呈现)呈不同表面可及融合蛋白形式的不同poi。可以(定性地或定量地)测量试剂与每种细胞(或每一种群的细胞)的结合,且可以由此确定两种或更多种poi中的哪些可以与给定试剂结合(或与给定浓度的给定试剂结合)。

(v)产生变体多肽的方法

在一些实施例中,本发明的方法是产生与试剂结合的变体多肽的方法,所述变体多肽的亲和力不同于(例如,大于)衍生出所述变体的多肽的亲和力。所述方法包括产生一或多种变体多肽的步骤(例如,使用任何适宜的方法来产生变体,如基于pcr的诱变)。举例来说,除了将在表面可及融合蛋白的poi部分相差一或多个氨基酸之外,变体多肽将与初始表面可及融合蛋白相同。随后,测量试剂与所产生变体中的一或多个的结合量将用于识别哪些变体会与试剂结合。

如上所述,在一些情况下,poi包括抗体的抗原结合域,且试剂(例如,测试试剂)是肽(在一些情况下是已知与抗体结合的肽变体);在一些情况下,poi是针对抗体的表位(或已知表位的变体),且试剂是抗体或抗体的抗原结合域;并且在一些情况下,poi是配位体/受体对的配位体或受体结合区(或其变体)。在一些所述情况下,方法可以包括诱变步骤(例如,使用任何适宜的方法,如随机或定点pcr方案)。举例来说,可以产生两种或更多种poi(两种或更多种表面可及融合蛋白)(例如,从而产生表面可及融合蛋白库)(例如,其中poi是彼此的变体和/或初始poi的变体)。随后,试剂可以用于接触表达两种或更多种表面可及融合蛋白(变体)的细胞(例如,不同种群的细胞),且随后可以识别与试剂结合的那些poi。

与上文类似,在一些情况下,可以控制试剂的浓度,因此将仅识别出那些以特定(或更佳)亲和力与试剂结合的poi。在一些情况下,可以使用不同浓度的给定试剂来接触每种细胞(例如,单独种群的细胞、细胞库的多种复本等)。因此,所述方法可以用于仅识别当试剂以给定浓度存在时可以与给定试剂结合的那些poi。作为说明性实例,可以(经由表达表面可及融合蛋白的接触细胞)使两种或更多种不同的poi与给定浓度(例如,100nm)的试剂接触,且可以识别大量与试剂结合的poi。随后,可以使用较低浓度的试剂(例如,10nm)重新筛检poi,以限制所识别poi的数目。

针对上文方法中的任一种或全部,可以使用各种对照。举例来说,具有对照poi(或无poi)的表面可及融合蛋白可以用于向在不存在结合的情况下所预期的信号量提供对照。所属领域的一般技术人员将轻易地设想所述各种对照,且可以使用任何适宜的对照。

试剂盒

还提供所述方法中使用的试剂盒。本发明的试剂盒可以包括上述表面可及融合蛋白和/或核酸中的任一种。举例来说,在一些情况下,适合的试剂盒包括上述用于表达表面可及融合蛋白的核酸(例如,重组表达载体),或对表面可及融合蛋白进行编码的核酸(例如,重组表达载体)。在一些情况下,试剂盒包括两种或更多种dna核酸(例如,重组表达载体)。

在一些情况下,试剂盒包括用于表达表面可及融合蛋白的两种或更多种本发明的dna核酸(例如,重组表达载体)。试剂盒可以包括:包括对poi进行编码的核苷酸的核酸、不包括对poi进行编码的核苷酸的核酸、包括插入对poi进行编码的核苷酸的插入位点的核酸等。在一些情况下,两种或更多种dna核酸中的至少两种包括插入poi的插入位点。

在一些情况下,由两种或更多种dna核酸中的至少两种编码的合成茎多肽具有不同长度。举例来说,在一些情况下,由两种或更多种dna核酸中的至少两种编码的茎多肽(例如,合成茎多肽)具有介于以下范围内的长度:20到100个氨基酸、40个氨基酸到100个氨基酸、101到200个氨基酸、201到300个氨基酸、301到400个氨基酸、401到500个氨基酸、501到600个氨基酸、601到700个氨基酸、701到800个氨基酸、801到900个氨基酸、901到1000个氨基酸、或1001到1500个氨基酸。在一些情况下,由两种或更多种dna核酸中的至少两种编码的合成茎多肽具有不同长度,且各具有介于以下范围内的长度:20到100个氨基酸、40个氨基酸到100个氨基酸、101到200个氨基酸、201到300个氨基酸、301到400个氨基酸、401到500个氨基酸、501到600个氨基酸、601到700个氨基酸、701到800个氨基酸、801到900个氨基酸、901到1000个氨基酸、或1001到1500个氨基酸。因此,在一些情况下,试剂盒可以包括多种dna核酸(例如,用于表达本发明的表面可及融合蛋白),其中由多种dna核酸编码的茎多肽涵盖一定长度范围。

在一些情况下,由两种或更多种dna核酸中的至少两种编码的合成茎多肽具有不同序列(例如,即使其长度相同)。

作为说明性实例,试剂盒的一种核酸(例如,重组表达)可能对长度介于20到100个氨基酸范围内的茎多肽进行编码,且另一种可能对长度介于101到200个氨基酸范围内的茎多肽进行编码。换句话说,试剂盒可以具有对多种不同茎多肽(例如,长度和/或序列不同)进行编码的多种核酸(例如,重组表达载体)。所述试剂盒将允许使用多种不同的表面可及融合蛋白来进行本发明的方法,即使在一些情况下不同融合蛋白的poi相同。同样地,在一些情况下,两种或更多种dna核酸中的至少两种对以下进行编码:不同信号多肽、不同标记(和/或标记的不同布置,即对标记进行编码的核苷酸相对于另一编码组分的不同定位)和/或不同表面锚定多肽(例如,不同gpi锚定物)。在一些情况下,两种或更多种dna核酸中的至少两种具有不同的插入位点。设想上文的任何或所有组合。

上述试剂盒中的任一种可以进一步包括一或多种额外试剂,其中所述额外试剂可以选自:稀释缓冲液;复原溶液;洗涤缓冲液;对照试剂;对照表达载体;试剂;具有本发明核酸的宿主细胞;不具有本发明核酸的宿主细胞(例如,用于表达表面可及融合蛋白的核酸、对表面可及融合蛋白进行编码的核酸等)等。本发明试剂盒的组分可以处于单独容器中(例如,不同试管、多孔板的不同孔等),且在一些情况下可以组合于单一容器中。

除了上文组分之外,(在某些实施例中)本发明的试剂盒还可以进一步包括用于实践本发明方法的说明。这些说明可以各种形式存在于本发明的试剂盒中,所述形式中的一或多种可以存在于试剂盒中。可以呈现这些说明的一种形式为适合媒介或基板(例如,上面印刷有信息的纸片)上的印刷信息,其处于试剂盒的包装中,处于药品说明书中等。这些说明的另一形式为上面已记录有信息的计算机可读媒介,例如磁盘、光盘(cd)、闪存驱动器等。可以呈现这些说明到另一形式为网址,可以经由因特网使用所述网址在删除的网站上获得信息。

效用

本文所描述的组合物和方法可以用于研发新型真菌细胞(例如,新型酵母菌株)以用于各种目的,包括(但不限于)化学品和多肽的发酵生产。此外,本文所描述的组合物和方法可以用于各种研究目的,包括在酵母上表达诱变的蛋白质或其它组合库。相比于其它方法,本文所描述的组合物和方法使用单顺反子载体,使其能够用于广泛多种酵母菌株和种属。此外,本文所描述的组合物和方法(例如,通过改变茎多肽的长度)来实现目标蛋白的选择性(“可调式”)可及性,可以对其进行控制以限制底物或结合配偶体的分子量。在真核细胞(例如,真菌细胞、酵母细胞等)表面上表达蛋白质出于各种不同的目的而在业界得到广泛使用。本文所描述的组合物和方法允许直接且简单地表达任何与合成茎多肽融合的所要蛋白质(目标蛋白)。因为可以使用单顺反子载体将poi呈现为表面可及融合蛋白的一部分,所以能将系统轻易地移植到各种酵母菌株和种属中。

现已充分地描述本发明,所属领域的一般技术人员将明白,可以在不脱离本发明的精神或范围的情况下作出各种改变和修改。

实验

提出以下实例以便向所属领域的一般技术人员完整地披露且描述如何制备和使用本发明,且并不打算限制本发明人视为其发明的范围,也不打算表示下文实验是所进行的全部或唯一实验。已努力确保关于所用数值(例如,量、温度等)的准确性,但应说明一些实验误差和偏差的原因。除非另外指示,否则份数是重量份,分子量是重量平均分子量,温度是以摄氏度计,且压力是大气压或接近大气压。

本说明书中所引用的所有公开案和专利申请均以引用的方式并入本文中,就如同各个别公开案或专利申请专门且单独地指出以引用的方式并入一般。

本发明已根据特定实施例来描述,所述特定实施例由本发明人发现或提出以包含实践本发明的优选方式。所属领域的技术人员应了解,根据本发明,在不脱离本发明的预定范围的情况下,可以对举例说明的特定实施例作出多种修改和改变。举例来说,由于密码子冗余,因此可以在不影响蛋白质序列的情况下,对潜在dna序列作出改变。此外,出于生物学功能等效性考量,可以不在种类或量上影响生物学作用的情况下,对蛋白质结构作出改变。希望所有所述修改包括于所附权利要求书的范围内。

实例

实例1

图1a-1c描绘了使用长度可变的gpi-锚定“茎多肽”确定是否可以“调节”可及性而进行的实验。用于这些实验的酵母菌株是bj5465。图1a描绘了肽与酵母细胞表面连接的一个实施例的示意图:分泌目标蛋白(poi)(此处是改造的sirpa变体cv1)作为表面可及融合蛋白,其中poi与以下融合:(i)信号多肽(其将蛋白质引向分泌路径,但其可以经由翻译后加工与蛋白质割裂)、(ii)茎多肽(合成序列,其长度可以在广泛长度范围内改变)、(iii)gpi锚定物(例如,合成gpi锚定物)以及任选地(iv)表位标记(所示为ha表位标记)。

图1b描绘了实验结果,其显示茎长度(以氨基酸计)与以下3种不同尺寸(不同分子量)的标记探针的表面染色之间的关系:抗ha抗体(约150kd)、cd47-链霉亲和素四聚体(约100kd)(其与cv1,即用于这些实验的poi结合)以及cd47-生物素单体(约15kda)(其同样与cv1结合)。图1c描绘了呈现与不同长度茎连接的cv-1的酵母的代表性流式细胞测量图,所述不同长度茎同时染有抗ha抗体(alexa488)和cd47-生物素单体(alexa647)。测试茎序列的长度(以氨基酸的数目计)在各图上方列出。数据显示茎长度可以用于“选择”特定分子量的化合物。举例来说,y轴上所描绘的是150kd抗ha抗体的结合,当茎多肽长度为19或41个氨基酸时,其并未很好地结合于表面可及融合多肽,而当茎多肽长度为232、465或649个氨基酸时,发生结合。相反,即使当茎多肽长度为19个氨基酸时,cd47-生物素(x轴)仍与表面可及融合多肽结合,而当茎多肽长度为41、232、465或649个氨基酸时,结合更牢固。

图2a-2b描绘了用于确定本发明的组合物和方法是否与其它酵母菌株相容而进行的实验。a)肽与酵母细胞表面连接的示意图。分泌改造的sirpa变体cv1作为与ha表位标记和长度为649个氨基酸的合成茎以及合成gpi锚定物的融合物(即,cv1是表达为表面可及融合多肽的目标蛋白(poi))。相比于图1a-1c中所用的bj5465,用于这些实验的酵母菌株是yvh10。yvh10酵母过度表达酵母蛋白质二硫键异构酶(pdi),使得所分泌含有二硫键的蛋白质能够具有更大折叠能力。b)呈现与茎(649个氨基酸)连接的cv-1的yvh10酵母的代表性流式细胞测量图,所述茎同时染有抗ha抗体(alexa488)和cd47-生物素单体(alexa647)。因此,数据显示,本发明的组合物和方法实际上与其它酵母菌株相容。

实例2:针对高亲和力pd-1结合的人类pd-l1蛋白的定向演化

目标:识别以高亲和力和特异性与t细胞表达的pd-1结合的pd-l1突变体,由此竞争性地抑制与pd-l1的互动,所述pd-l1表达于肿瘤细胞或肿瘤浸润免疫细胞的表面上。

方法:从与pd-1蛋白互动的区域中选择人类pd-l1蛋白的稳定子单元;选择可能对这种互动至关重要的氨基酸残基,且通过pcr和吉布森克隆(gibsoncloning)产生质体库,所述质体对与连接gpi的锚定物连接的pd-l1突变体进行编码(根据本专利中所描述的主要技术);用电穿孔将质体库导入酵母或真菌菌株中;诱发突变体蛋白的表面呈现;通过评估与标记的可溶性重组pd-1蛋白的互动来选择高亲和力结合子;在分离一片高亲和力pd-1结合子后,从所得酵母种群中提取dna,且测定所存在变体的序列;分析序列的结合亲和力,且组装一致的变体序列以使结合亲和力达到最大。

实例3:针对高亲和力il-2结合的人类il2rβ可溶性片段的定向演化

目标:识别以高亲和力和特异性与内源性il-2结合的细胞因子受体子单元il2rβ突变体,由此充当阻止il-2与内源性il-2受体复合物互动的竞争性储集器。

方法:从与il-2蛋白互动的区域中选择人类il2rβ蛋白的稳定子单元;选择可能对这种互动至关重要的氨基酸残基,且通过pcr和吉布森克隆产生质体库,所述质体对与连接gpi的锚定物连接的il2rβ突变体进行编码(根据本专利中所描述的主要技术);用电穿孔将质体库导入酵母或真菌菌株中;诱发突变体蛋白的表面呈现;通过评估与标记的可溶性重组子il-2蛋白的互动来选择高亲和力结合子;在分离一片高亲和力il-2结合子后,从所得酵母种群中提取dna,且测定所存在变体的序列;分析序列的结合亲和力,且组装一致的变体序列以使结合亲和力达到最大。

实例4:人类抗体库的酵母表面呈现

目标:出于产生针对任何已知的细胞表面或分泌蛋白的高亲和力、高特异性治疗性人类单克隆抗体的目的,在酵母表面上将人类抗体结合域表达为抗原结合片段(fab)或单链可变片段(scfv)。

方法:通过基因合成产生质体库,所述质体对与连接gpi的锚定物融合的人类抗体结合区变体(呈fab或scfv形式)进行编码(根据本专利中所描述的主要技术);用电穿孔将质体库导入酵母或真菌菌株中;诱发抗体片段的表面呈现;通过评估与标记的可溶性重组蛋白(其相当于蛋白质结合的所要区域)的互动来选择高亲和力结合子(例如,为了产生将与pd-1结合并阻止其与pd-l1互动的治疗性抗体,将使用包括与pd-l1的互动区域的pd-1标记片段来淘选库);在分离一片高亲和力结合子后,从所得酵母种群中提取dna,且测定所存在抗体变体的序列;分析作为重组抗体的个别序列的结合亲和力。

实例5:替代性架构库的酵母表面呈现

目标:出于产生针对任何已知的细胞表面或分泌蛋白的高亲和力、高特异性治疗性人类单克隆抗体的目的,在酵母表面上表达替代性架构库,其包括(但不限于)纤连蛋白、免疫球蛋白、打结素、达尔潘蛋白(darpin)、抗运载蛋白。

方法:通过基因合成产生质体库,所述质体对与连接gpi的锚定物融合的人类抗体结合区变体(呈fab或scfv形式)进行编码(根据本专利中所描述的主要技术);用电穿孔将质体库导入酵母或真菌菌株中;诱发替代性架构蛋白的表面呈现;通过评估与标记的可溶性重组蛋白(其相当于蛋白质结合的所要区域)的互动来选择高亲和力结合子(例如,为了产生将与pd-1结合并阻止其与pd-l1互动的治疗性替代架构蛋白质,将使用包括与pd-l1的互动区域的pd-1标记片段来淘选库);在分离一片高亲和力结合子后,从所得酵母种群中提取dna,且测定所存在替代性架构的序列;分析作为重组蛋白的个别序列的结合亲和力。

实例6:对翻译的cdna进行酵母表面呈现从而以无偏性方式识别目标标靶的互动蛋白质

目标:出于淘选目标蛋白以基于与目标蛋白的结合来识别新的互动配偶体的目的,在酵母表面上表达由cdna集合编码的蛋白质,例如来自肿瘤衍生的细胞系或正常细胞类型。

方法:通过基因合成产生质体库,所述质体对与连接gpi的锚定物融合的目标细胞类型所衍生的cdna进行编码(根据本专利中所描述的主要技术);用电穿孔将质体库导入酵母或真菌菌株中;诱发替代性架构蛋白的表面呈现;通过评估与标记的可溶性目标重组蛋白的互动来选择高亲和力结合子;在分离一片对与目标蛋白互动的蛋白质进行表达的酵母后,从所得酵母种群中提取dna,且测定所存在替代性架构的序列以识别负责cdna。

序列表

<110>阿龙·m·林

安德鲁·c·克鲁瑟

阿施施·曼格里克

<120>用于在细胞表面上表达多肽的组合物和方法

<130>stan-1154wo

<150>us62/077,756

<151>2014-11-10

<160>71

<170>patentinversion3.5

<210>1

<211>258

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>1

atgagattcccatctatcttcaccgctgttttgttcgctgcttcttctgctttggctgct60

ccagctaacaccaccaccgaagacgaaaccgctcaaatcccagctgaagctgttatcgac120

tactctgacttggaaggtgacttcgacgctgctgctttgccattgtctaactctaccaac180

aacggtttgtcttctaccaacaccaccatcgcttctatcgctgctaaggaagaaggtgtt240

caattggacaagagagaa258

<210>2

<211>357

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>2

gaggaggagctgcagattattcagcctgacaagtccgtgttggttgcagctggagagaca60

gccactctgcgctgcactattacctctctgtttcctgtggggcccatccagtggttcaga120

ggagctggaccaggccgggtattaatctacaatcaaaggcagggccccttcccccgggta180

acaactgtttcagacactacaaagagaaacaacatggacttttccatccgcatcggtaac240

atcaccccagcagatgccggcacctactactgtattaagttccggaaagggagccccgat300

gacgtggagtttaagtctggagcaggcactgagctgtctgtgcgcgccaaaccctct357

<210>3

<211>27

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>3

tacccatacgatgttccagattacgct27

<210>4

<211>1947

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>4

caaacatcctcaccctctacagaagcatcagtatcaacctctagtacctcttcctctgct60

tcacaatcatctgacccaactacaacatcttcgtccagttcatcgtcttccccatcttcc120

caatctgaggaaatttcatcatcaccgacggtctcaactacaccatcaacttcttcatca180

tcttcctcaatgacttcaaccaccacaacaaagtcaatctcaacttccactacaagttca240

gctccagttacagatgtgacagtttcctcatcgcctagtaaatctacctctacttcgaca300

agtacagaaacatctaaaacacctacttcaatgacagagtatacatctagtacatcgata360

atttcgactccagttagtcactcgcagacaggtttgtcggcttcatcaagttcatcatct420

acaacatccggttcttcgtccactaaatcagaaagttcgacaacatctggctcttcccag480

tccgtggaatcaacctccagccacgccactgttcttgctaattccgcagaaatggtcaca540

acatcctctagttcatcctcaacatccgaaatgtcattaactagtactgctaccagtgta600

ccagtctcatctagtagcagtacgacatattctactagcgcatctacacaagccgtcact660

acaacatcttcttccactgtatctacaacttcttctagtacaacgttaacaagcgcattc720

acacattcttcaaccacatcgtccgaccagccacccagcgacactacaagtccatctacg780

acacacgaacctcatgtaaccactcagacgtcatcagaaacatcttcttctaagtcatct840

tctacttcttcttcaagtacatctcaaacctctgagtctgcaacaccatccgattccgta900

tcacctggaagttctacatcaacatcttctagtagcacttctacttccacttctatttcc960

agtggagaaacgacaacttcttcttcttcatcatctgccacgaccacttctaacagcgca1020

accttgtcagtctctaccacacaaacttcgattgaagccagttcatctactacatctaca1080

tctagttcaacaattacaacttcaagtagtagcgctcacatatcgtcgaaatctcaatct1140

agtattacctatccctcttcctcgacatcttcatctacatcgtcctcaatttctagcgaa1200

tctgaaagttttgaatcgacatcagcagaagatgctccatcaacagcaccttcatcaagt1260

gtctcttctaagagttctacctctacaacatcaagcacatcgacatcttcaagcactcca1320

tctccatcaccatcttccgtgagttcttcctccaccagctcattgacaacttctgctgta1380

tcaacaccagctacctctcattctcaaagtactgtagtaaccaccactactattactaca1440

tcaacaggtccagtgatgtctacgacaacagcttattcttctagttctactagcagctcg1500

gaatcttctgaggttcagtctgtcatgtcatctacgcctagttcaacatcaacaacaacc1560

agttcggaatctacttcatctagctccacagcttctacctcaccatcaacctcgcaaact1620

ttcgaaacttctcctactataggaggtgtcccctcaaccacttcatttgtctctacgcca1680

acaacgaaattgtcgcacactacttccactatgacagcacagtccgatagtaagtctacc1740

cactcctcaagcacatcgacagaagataaatcatccactgcttctgcagttgacgaaagc1800

actacaacatccacttccacggagtctactacatcagtaacatcaggcacctcccattcc1860

gctaaagaatcttcgtcaaattctaaggtgtatagttcacagacagcacactcatccata1920

agtgttgcatcatcacctagtacaaag1947

<210>5

<211>111

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>5

caaatccaatcttctatggttgaaatctctacctacgctggttctgctaactctgttaac60

gctggtgctggtgctggtgctttgttcttgttgttgtctttggctatcatc111

<210>6

<211>8584

<212>dna

<213>人工序列

<220>

<223>合成序列

<400>6

ggtacccgacaggttatcagcaacaacacagtcatatccattctcaattagctctaccac60

agtgtgtgaaccaatgtatccagcaccacctgtaaccaaaacaattttagaagtactttc120

actttgtaactgagctgtcatttatattgaattttcaaaaattcttactttttttttgga180

tggacgcaaagaagtttaataatcatattacatggcattaccaccatatacatatccata240

tacatatccatatctaatcttacttatatgttgtggaaatgtaaagagccccattatctt300

agcctaaaaaaaccttctctttggaactttcagtaatacgcttaactgctcattgctata360

ttgaagtacggattagaagccgccgagcgggtgacagccctccgaaggaagactctcctc420

cgtgcgtcctcgtcttcaccggtcgcgttcctgaaacgcagatgtgcctcgcgccgcact480

gctccgaacaataaagattctacaatactagcttttatggttatgaagaggaaaaattgg540

cagtaacctggccccacaaaccttcaaatgaacgaatcaaattaacaaccataggatgat600

aatgcgattagttttttagccttatttctggggtaattaatcagcgaagcgatgattttt660

gatctattaacagatatataaatgcaaaaactgcataaccactttaactaatactttcaa720

cattttcggtttgtattacttcttattcaaatgtaataaaagtatcaacaaaaaattgtt780

aatatacctctatactttaacgtcaaggagaaaaaaccccggatcgaattcaaccctcac840

taaagggcggccgccatgagattcccatctatcttcaccgctgttttgttcgctgcttct900

tctgctttggctgctccagctaacaccaccaccgaagacgaaaccgctcaaatcccagct960

gaagctgttatcgactactctgacttggaaggtgacttcgacgctgctgctttgccattg1020

tctaactctaccaacaacggtttgtcttctaccaacaccaccatcgcttctatcgctgct1080

aaggaagaaggtgttcaattggacaagagagaagctagcgcagaggaggagctgcagatt1140

attcagcctgacaagtccgtgttggttgcagctggagagacagccactctgcgctgcact1200

attacctctctgtttcctgtggggcccatccagtggttcagaggagctggaccaggccgg1260

gtattaatctacaatcaaaggcagggccccttcccccgggtaacaactgtttcagacact1320

acaaagagaaacaacatggacttttccatccgcatcggtaacatcaccccagcagatgcc1380

ggcacctactactgtattaagttccggaaagggagccccgatgacgtggagtttaagtct1440

ggagcaggcactgagctgtctgtgcgcgccaaaccctctggatcctacccatacgatgtt1500

ccagattacgctcaaacatcctcaccctctacagaagcatcagtatcaacctctagtacc1560

tcttcctctgcttcacaatcatctgacccaactacaacatcttcgtccagttcatcgtct1620

tccccatcttcccaatctgaggaaatttcatcatcaccgacggtctcaactacaccatca1680

acttcttcatcatcttcctcaatgacttcaaccaccacaacaaagtcaatctcaacttcc1740

actacaagttcagctccagttacagatgtgacagtttcctcatcgcctagtaaatctacc1800

tctacttcgacaagtacagaaacatctaaaacacctacttcaatgacagagtatacatct1860

agtacatcgataatttcgactccagttagtcactcgcagacaggtttgtcggcttcatca1920

agttcatcatctacaacatccggttcttcgtccactaaatcagaaagttcgacaacatct1980

ggctcttcccagtccgtggaatcaacctccagccacgccactgttcttgctaattccgca2040

gaaatggtcacaacatcctctagttcatcctcaacatccgaaatgtcattaactagtact2100

gctaccagtgtaccagtctcatctagtagcagtacgacatattctactagcgcatctaca2160

caagccgtcactacaacatcttcttccactgtatctacaacttcttctagtacaacgtta2220

acaagcgcattcacacattcttcaaccacatcgtccgaccagccacccagcgacactaca2280

agtccatctacgacacacgaacctcatgtaaccactcagacgtcatcagaaacatcttct2340

tctaagtcatcttctacttcttcttcaagtacatctcaaacctctgagtctgcaacacca2400

tccgattccgtatcacctggaagttctacatcaacatcttctagtagcacttctacttcc2460

acttctatttccagtggagaaacgacaacttcttcttcttcatcatctgccacgaccact2520

tctaacagcgcaaccttgtcagtctctaccacacaaacttcgattgaagccagttcatct2580

actacatctacatctagttcaacaattacaacttcaagtagtagcgctcacatatcgtcg2640

aaatctcaatctagtattacctatccctcttcctcgacatcttcatctacatcgtcctca2700

atttctagcgaatctgaaagttttgaatcgacatcagcagaagatgctccatcaacagca2760

ccttcatcaagtgtctcttctaagagttctacctctacaacatcaagcacatcgacatct2820

tcaagcactccatctccatcaccatcttccgtgagttcttcctccaccagctcattgaca2880

acttctgctgtatcaacaccagctacctctcattctcaaagtactgtagtaaccaccact2940

actattactacatcaacaggtccagtgatgtctacgacaacagcttattcttctagttct3000

actagcagctcggaatcttctgaggttcagtctgtcatgtcatctacgcctagttcaaca3060

tcaacaacaaccagttcggaatctacttcatctagctccacagcttctacctcaccatca3120

acctcgcaaactttcgaaacttctcctactataggaggtgtcccctcaaccacttcattt3180

gtctctacgccaacaacgaaattgtcgcacactacttccactatgacagcacagtccgat3240

agtaagtctacccactcctcaagcacatcgacagaagataaatcatccactgcttctgca3300

gttgacgaaagcactacaacatccacttccacggagtctactacatcagtaacatcaggc3360

acctcccattccgctaaagaatcttcgtcaaattctaaggtgtatagttcacagacagca3420

cactcatccataagtgttgcatcatcacctagtacaaagggcgcccaaatccaatcttct3480

atggttgaaatctctacctacgctggttctgctaactctgttaacgctggtgctggtgct3540

ggtgctttgttcttgttgttgtctttggctatcatctaatgattaattaactcgagatct3600

gataacaacagtgtagatgtaacaaaatcgactttgttcccactgtacttttagctcgta3660

caaaatacaatatacttttcatttctccgtaaacaacatgttttcccatgtaatatcctt3720

ttctatttttcgttccgttaccaactttacacatactttatatagctattcacttctata3780

cactaaaaaactaagacaattttaattttgctgcctgccatatttcaatttgttataaat3840

tcctataatttatcctattagtagctaaaaaaagatgaatgtgaatcgaatcctaagaga3900

attgagctccaattcgccctatagtgagtcgtattacaattcactggccgtcgttttaca3960

acgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccc4020

cttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcg4080

cagcctgaatggcgaatggcgcgacgcgccctgtagcggcgcattaagcgcggcgggtgt4140

ggtggttacgcgcagcgtgaccgctacacttgccagcgccctagcgcccgctcctttcgc4200

tttcttcccttcctttctcgccacgttcgccggctttccccgtcaagctctaaatcgggg4260

gctccctttagggttccgatttagtgctttacggcacctcgaccccaaaaaacttgatta4320

gggtgatggttcacgtagtgggccatcgccctgatagacggtttttcgccctttgacgtt4380

ggagtccacgttctttaatagtggactcttgttccaaactggaacaacactcaaccctat4440

ctcggtctattcttttgatttataagggattttgccgatttcggcctattggttaaaaaa4500

tgagctgatttaacaaaaatttaacgcgaattttaacaaaatattaacgtttacaatttc4560

ctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcaggcaagtgcac4620

aaacaatacttaaataaatactactcagtaataacctatttcttagcatttttgacgaaa4680

tttgctattttgttagagtcttttacaccatttgtctccacacctccgcttacatcaaca4740

ccaataacgccatttaatctaagcgcatcaccaacattttctggcgtcagtccaccagct4800

aacataaaatgtaagctttcggggctctcttgccttccaacccagtcagaaatcgagttc4860

caatccaaaagttcacctgtcccacctgcttctgaatcaaacaagggaataaacgaatga4920

ggtttctgtgaagctgcactgagtagtatgttgcagtcttttggaaatacgagtctttta4980

ataactggcaaaccgaggaactcttggtattcttgccacgactcatctccatgcagttgg5040

acgatatcaatgccgtaatcattgaccagagccaaaacatcctccttaggttgattacga5100

aacacgccaaccaagtatttcggagtgcctgaactatttttatatgcttttacaagactt5160

gaaattttccttgcaataaccgggtcaattgttctctttctattgggcacacatataata5220

cccagcaagtcagcatcggaatctagagcacattctgcggcctctgtgctctgcaagccg5280

caaactttcaccaatggaccagaactacctgtgaaattaataacagacatactccaagct5340

gcctttgtgtgcttaatcacgtatactcacgtgctcaatagtcaccaatgccctccctct5400

tggccctctccttttcttttttcgaccgaattaattcttaatcggcaaaaaaagaaaagc5460

tccggatcaagattgtacgtaaggtgacaagctatttttcaataaagaatatcttccact5520

actgccatctggcgtcataactgcaaagtacacatatattacgatgctgtctattaaatg5580

cttcctatattatatatatagtaatgtcgtttatggtgcactctcagtacaatctgctct5640

gatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgg5700

gcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatg5760

tgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgc5820

ctatttttataggttaatgtcatgataataatggtttcttaggacggatcgcttgcctgt5880

aacttacacgcgcctcgtatcttttaatgatggaataatttgggaatttactctgtgttt5940

atttatttttatgttttgtatttggattttagaaagtaaataaagaaggtagaagagtta6000

cggaatgaagaaaaaaaaataaacaaaggtttaaaaaatttcaacaaaaagcgtacttta6060

catatatatttattagacaagaaaagcagattaaatagatatacattcgattaacgataa6120

gtaaaatgtaaaatcacaggattttcgtgtgtggtcttctacacagacaagatgaaacaa6180

ttcggcattaatacctgagagcaggaagagcaagataaaaggtagtatttgttggcgatc6240

cccctagagtcttttacatcttcggaaaacaaaaactattttttctttaatttctttttt6300

tactttctatttttaatttatatatttatattaaaaaatttaaattataattatttttat6360

agcacgtgatgaaaaggacccaggtggcacttttcggggaaatgtgcgcggaacccctat6420

ttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgata6480

aatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgccct6540

tattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaa6600

agtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaa6660

cagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttt6720

taaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcgg6780

tcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagca6840

tcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataa6900

cactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgctttttt6960

tcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagc7020

cataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaa7080

actattaactggcgaactacttactctagcttcccggcaacaattaatagactggatgga7140

ggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgc7200

tgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccaga7260

tggtaagccctcccgtatcgtagttatctacacgacgggcagtcaggcaactatggatga7320

acgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcaga7380

ccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggat7440

ctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgtt7500

ccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttct7560

gcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgcc7620

ggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagatacc7680

aaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcacc7740

gcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtc7800

gtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctg7860

aacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagata7920

cctacagcgtgagcattgagaaagcgccacgcttcccgaagggagaaaggcggacaggta7980

tccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccaggggggaacgc8040

ctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtg8100

atgctcgtcaggggggccgagcctatggaaaaacgccagcaacgcggcctttttacggtt8160

cctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgt8220

ggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccga8280

gcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccc8340

cgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcggg8400

cagtgagcgcaacgcaattaatgtgagttacctcactcattaggcaccccaggctttaca8460

ctttatgcttccggctcctatgttgtgtggaattgtgagcggataacaatttcacacagg8520

aaacagctatgaccatgattacgccaagctcggaattaaccctcactaaagggaacaaaa8580

gctg8584

<210>7

<211>119

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>7

gluglugluleuglnileileglnproasplysservalleuvalala

151015

alaglygluthralathrleuargcysthrilethrserleuphepro

202530

valglyproileglntrppheargglyalaglyproglyargvalleu

354045

iletyrasnglnargglnglypropheproargvalthrthrvalser

505560

aspthrthrlysargasnasnmetasppheserileargileglyasn

65707580

ilethrproalaaspalaglythrtyrtyrcysilelysphearglys

859095

glyserproaspaspvalgluphelysserglyalaglythrgluleu

100105110

servalargalalysproser

115

<210>8

<211>9

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>8

tyrprotyraspvalproasptyrala

15

<210>9

<211>907

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>9

metargpheproserilephethralavalleuphealaalaserser

151015

alaleualaalaproalaasnthrthrthrgluaspgluthralagln

202530

ileproalaglualavalileasptyrseraspleugluglyaspphe

354045

aspalaalaalaleuproleuserasnserthrasnasnglyleuser

505560

serthrasnthrthrilealaserilealaalalysglugluglyval

65707580

glnleuasplysargglualaseralagluglugluleuglnileile

859095

glnproasplysservalleuvalalaalaglygluthralathrleu

100105110

argcysthrilethrserleupheprovalglyproileglntrpphe

115120125

argglyalaglyproglyargvalleuiletyrasnglnargglngly

130135140

propheproargvalthrthrvalseraspthrthrlysargasnasn

145150155160

metasppheserileargileglyasnilethrproalaaspalagly

165170175

thrtyrtyrcysilelysphearglysglyserproaspaspvalglu

180185190

phelysserglyalaglythrgluleuservalargalalysproser

195200205

glysertyrprotyraspvalproasptyralaglnthrserserpro

210215220

serthrglualaservalserthrserserthrserserseralaser

225230235240

glnserseraspprothrthrthrserserserserserserserser

245250255

proserserglnserglugluileserserserprothrvalserthr

260265270

thrproserthrsersersersersersermetthrserthrthrthr

275280285

thrlysserileserthrserthrthrserseralaprovalthrasp

290295300

valthrvalserserserproserlysserthrserthrserthrser

305310315320

thrgluthrserlysthrprothrsermetthrglutyrthrserser

325330335

thrserileileserthrprovalserhisserglnthrglyleuser

340345350

alaserserserserserserthrthrserglyserserserthrlys

355360365

sergluserserthrthrserglyserserglnservalgluserthr

370375380

serserhisalathrvalleualaasnseralaglumetvalthrthr

385390395400

serserserserserserthrserglumetserleuthrserthrala

405410415

thrservalprovalserserserserserthrthrtyrserthrser

420425430

alaserthrglnalavalthrthrthrserserserthrvalserthr

435440445

thrserserserthrthrleuthrseralaphethrhisserserthr

450455460

thrserseraspglnproproseraspthrthrserproserthrthr

465470475480

hisgluprohisvalthrthrglnthrsersergluthrserserser

485490495

lysserserserthrserserserserthrserglnthrsergluser

500505510

alathrproseraspservalserproglyserserthrserthrser

515520525

serserserthrserthrserthrserileserserglygluthrthr

530535540

thrserserserserserseralathrthrthrserasnseralathr

545550555560

leuservalserthrthrglnthrserileglualaserserserthr

565570575

thrserthrserserserthrilethrthrserserserseralahis

580585590

ileserserlysserglnserserilethrtyrproserserserthr

595600605

serserserthrserserserileserserglusergluserpheglu

610615620

serthrseralagluaspalaproserthralaproserserserval

625630635640

serserlysserserthrserthrthrserserthrserthrserser

645650655

serthrproserproserproserservalserserserserthrser

660665670

serleuthrthrseralavalserthrproalathrserhissergln

675680685

serthrvalvalthrthrthrthrilethrthrserthrglyproval

690695700

metserthrthrthralatyrserserserserthrserserserglu

705710715720

sersergluvalglnservalmetserserthrproserserthrser

725730735

thrthrthrsersergluserthrserserserserthralaserthr

740745750

serproserthrserglnthrphegluthrserprothrileglygly

755760765

valproserthrthrserphevalserthrprothrthrlysleuser

770775780

histhrthrserthrmetthralaglnseraspserlysserthrhis

785790795800

serserserthrserthrgluasplysserserthralaseralaval

805810815

aspgluserthrthrthrserthrserthrgluserthrthrserval

820825830

thrserglythrserhisseralalysgluserserserasnserlys

835840845

valtyrserserglnthralahisserserileservalalaserser

850855860

proserthrlysglyalaglnileglnsersermetvalgluileser

865870875880

thrtyralaglyseralaasnservalasnalaglyalaglyalagly

885890895

alaleupheleuleuleuserleualaileile

900905

<210>10

<211>910

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>10

metargpheproserilephethralavalleuphealaalaserser

151015

alaleualaalaproalaasnthrthrthrgluaspgluthralagln

202530

ileproalaglualavalileasptyrseraspleugluglyaspphe

354045

aspalaalaalaleuproleuserasnserthrasnasnglyleuser

505560

serthrasnthrthrilealaserilealaalalysglugluglyval

65707580

glnleuasplysargglualaseralagluglugluleuglnileile

859095

glnproasplysservalleuvalalaalaglygluthralathrleu

100105110

argcysthrilethrserleupheprovalglyproileglntrpphe

115120125

argglyalaglyproglyargvalleuiletyrasnglnargglngly

130135140

propheproargvalthrthrvalseraspthrthrlysargasnasn

145150155160

metasppheserileargileglyasnilethrproalaaspalagly

165170175

thrtyrtyrcysilelysphearglysglyserproaspaspvalglu

180185190

phelysserglyalaglythrgluleuservalargalalysproser

195200205

glysertyrprotyraspvalproasptyralaglnthrserserpro

210215220

serthrglualaservalserthrserserthrserserseralaser

225230235240

glnserseraspprothrthrthrserserserserserserserser

245250255

proserserglnserglugluileserserserprothrvalserthr

260265270

thrproserthrsersersersersersermetthrserthrthrthr

275280285

thrlysserileserthrserthrthrserseralaprovalthrasp

290295300

valthrvalserserserproserlysserthrserthrserthrser

305310315320

thrgluthrserlysthrprothrsermetthrglutyrthrserser

325330335

thrserileileserthrprovalserhisserglnthrglyleuser

340345350

alaserserserserserserthrthrserglyserserserthrlys

355360365

sergluserserthrthrserglyserserglnservalgluserthr

370375380

serserhisalathrvalleualaasnseralaglumetvalthrthr

385390395400

serserserserserserthrserglumetserleuthrserthrala

405410415

thrservalprovalserserserserserthrthrtyrserthrser

420425430

alaserthrglnalavalthrthrthrserserserthrvalserthr

435440445

thrserserserthrthrleuthrseralaphethrhisserserthr

450455460

thrserseraspglnproproseraspthrthrserproserthrthr

465470475480

hisgluprohisvalthrthrglnthrsersergluthrserserser

485490495

lysserserserthrserserserserthrserglnthrsergluser

500505510

alathrproseraspservalserproglyserserthrserthrser

515520525

serserserthrserthrserthrserileserserglygluthrthr

530535540

thrserserserserserseralathrthrthrserasnseralathr

545550555560

leuservalserthrthrglnthrserileglualaserserserthr

565570575

thrserthrserserserthrilethrthrserserserseralahis

580585590

ileserserlysserglnserserilethrtyrproserserserthr

595600605

serserserthrserserserileserserglusergluserpheglu

610615620

serthrseralagluaspalaproserthralaproserserserval

625630635640

serserlysserserthrserthrthrserserthrserthrserser

645650655

serthrproserproserproserservalserserserserthrser

660665670

serleuthrthrseralavalserthrproalathrserhissergln

675680685

serthrvalvalthrthrthrthrilethrthrserthrglyproval

690695700

metserthrthrthralatyrserserserserthrserserserglu

705710715720

sersergluvalglnservalmetserserthrproserserthrser

725730735

thrthrthrsersergluserthrserserserserthralaserthr

740745750

serproserthrserglnthrphegluthrserprothrileglygly

755760765

valproserthrthrserphevalserthrprothrthrlysleuser

770775780

histhrthrserthrmetthralaglnseraspserlysserthrhis

785790795800

serserserthrserthrgluasplysserserthralaseralaval

805810815

aspgluserthrthrthrserthrserthrgluserthrthrserval

820825830

thrserglythrserhisseralalysgluserserserasnserlys

835840845

valtyrserserglnthralahisserserileservalalaserser

850855860

proserthrlysglyalaileglnglnasnphethrserthrserleu

865870875880

metileserthrtyrgluglylysalaserilephepheseralaglu

885890895

leuglyserileilepheleuleuleusertyrleuleuphe

900905910

<210>11

<211>87

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>11

metargpheproserilephethralavalleuphealaalaserser

151015

alaleualaalaproalaasnthrthrthrgluaspgluthralagln

202530

ileproalaglualavalileasptyrseraspleugluglyaspphe

354045

aspalaalaalaleuproleuserasnserthrasnasnglyleuser

505560

serthrasnthrthrilealaserilealaalalysglugluglyval

65707580

glnleuasplysarggluala

85

<210>12

<211>20

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>12

metargpheproserilephethralavalleuphealaalaserser

151015

alaleualaala

20

<210>13

<211>19

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>13

metglnleuleuargcyspheserilepheservalilealaserval

151015

leualagln

<210>14

<211>18

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>14

metphelysservalvaltyrserileleualaalaserleualaasn

151015

alagly

<210>15

<211>20

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>15

metleuleuglnalapheleupheleuleualaglyphealaalalys

151015

ileseralaser

20

<210>16

<211>22

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>16

metasnpheserargilephephephevalphealacysleuthrala

151015

leualametvalasnala

20

<210>17

<211>19

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>17

metargalapheleualaleuilepheleuthrphevalmetasnval

151015

gluserser

<210>18

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>18

000

<210>19

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>19

000

<210>20

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>20

000

<210>21

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>21

000

<210>22

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>22

000

<210>23

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>23

000

<210>24

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>24

000

<210>25

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>25

000

<210>26

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>26

000

<210>27

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>27

000

<210>28

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>28

000

<210>29

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>29

000

<210>30

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>30

000

<210>31

<211>19

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>31

glyglyglyglyserglyglyglyglyserglyserthrglyglygly

151015

glyglyser

<210>32

<211>41

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>32

glnthrserserproserargglualaservalserthrserserthr

151015

serserseralaserglnserseraspprothrthrthrserserser

202530

thrvalserthrproalathrglyala

3540

<210>33

<211>232

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>33

glnthrserserproserthrglualaservalserthrserserthr

151015

serserseralaserglnserseraspprothrthrthrserserser

202530

serserserserserproserserglnserglugluileserserser

354045

prothrvalserthrthrproserthrsersersersersersermet

505560

thrserthrthrthrthrlysserileserthrserthrthrserser

65707580

alaprovalthraspvalthrvalserserserproserlysserthr

859095

serthrserthrserthrgluthrserlysthrprothrsermetthr

100105110

glutyrthrserserthrserileileserthrprovalserhisser

115120125

glnthrglyleuseralaserserserserserserthrthrsergly

130135140

serserserthrlyssergluserserthrthrserglysersergln

145150155160

servalgluserthrserserhisalathrvalleualaasnserala

165170175

glumetvalthrthrserserserserserserthrserglumetser

180185190

leuthrserthralathrservalprovalserserserserserthr

195200205

thrtyrserthrseralaserthrglnalavalthrthrthrserser

210215220

serthrvalserthrthrserser

225230

<210>34

<211>465

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>34

glnthrserserproserthrglualaservalserthrserserthr

151015

serserseralaserglnserseraspprothrthrthrserserser

202530

serserserserserproserserglnserglugluileserserser

354045

prothrvalserthrthrproserthrsersersersersersermet

505560

thrserthrthrthrthrlysserileserthrserthrthrserser

65707580

alaprovalthraspvalthrvalserserserproserlysserthr

859095

serthrserthrserthrgluthrserlysthrprothrsermetthr

100105110

glutyrthrserserthrserileileserthrprovalserhisser

115120125

glnthrglyleuseralaserserserserserserthrthrsergly

130135140

serserserthrlyssergluserserthrthrserglysersergln

145150155160

servalgluserthrserserhisalathrvalleualaasnserala

165170175

glumetvalthrthrserserserserserserthrserglumetser

180185190

leuthrserthralathrservalprovalserserserserserthr

195200205

thrtyrserthrseralaserthrglnalavalthrthrthrserser

210215220

serthrvalserthrthrserserserthrthrleuthrseralaphe

225230235240

thrhisserserthrthrserseraspglnproproseraspthrthr

245250255

serproserthrthrhisgluprohisvalthrthrglnthrserser

260265270

gluthrserserserlysserserserthrserserserserthrser

275280285

glnthrsergluseralathrproseraspservalserproglyser

290295300

serthrserthrserserserserthrserthrserthrserileser

305310315320

serglygluthrthrthrserserserserserseralathrthrthr

325330335

serasnseralathrleuservalserthrthrglnthrserileglu

340345350

alaserserserthrthrserthrserserserthrilethrthrser

355360365

serserseralahisileserserlysserglnserserilethrtyr

370375380

proserserserthrserserserthrserserserileserserglu

385390395400

sergluserphegluserthrseralagluaspalaproserthrala

405410415

proserserservalserserlysserserthrserthrthrserser

420425430

thrserthrserserserthrproserproserproserservalser

435440445

serserserthrserserleuthrthrseralavalserthrproala

450455460

thr

465

<210>35

<211>649

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>35

glnthrserserproserthrglualaservalserthrserserthr

151015

serserseralaserglnserseraspprothrthrthrserserser

202530

serserserserserproserserglnserglugluileserserser

354045

prothrvalserthrthrproserthrsersersersersersermet

505560

thrserthrthrthrthrlysserileserthrserthrthrserser

65707580

alaprovalthraspvalthrvalserserserproserlysserthr

859095

serthrserthrserthrgluthrserlysthrprothrsermetthr

100105110

glutyrthrserserthrserileileserthrprovalserhisser

115120125

glnthrglyleuseralaserserserserserserthrthrsergly

130135140

serserserthrlyssergluserserthrthrserglysersergln

145150155160

servalgluserthrserserhisalathrvalleualaasnserala

165170175

glumetvalthrthrserserserserserserthrserglumetser

180185190

leuthrserthralathrservalprovalserserserserserthr

195200205

thrtyrserthrseralaserthrglnalavalthrthrthrserser

210215220

serthrvalserthrthrserserserthrthrleuthrseralaphe

225230235240

thrhisserserthrthrserseraspglnproproseraspthrthr

245250255

serproserthrthrhisgluprohisvalthrthrglnthrserser

260265270

gluthrserserserlysserserserthrserserserserthrser

275280285

glnthrsergluseralathrproseraspservalserproglyser

290295300

serthrserthrserserserserthrserthrserthrserileser

305310315320

serglygluthrthrthrserserserserserseralathrthrthr

325330335

serasnseralathrleuservalserthrthrglnthrserileglu

340345350

alaserserserthrthrserthrserserserthrilethrthrser

355360365

serserseralahisileserserlysserglnserserilethrtyr

370375380

proserserserthrserserserthrserserserileserserglu

385390395400

sergluserphegluserthrseralagluaspalaproserthrala

405410415

proserserservalserserlysserserthrserthrthrserser

420425430

thrserthrserserserthrproserproserproserservalser

435440445

serserserthrserserleuthrthrseralavalserthrproala

450455460

thrserhisserglnserthrvalvalthrthrthrthrilethrthr

465470475480

serthrglyprovalmetserthrthrthralatyrserserserser

485490495

thrserserserglusersergluvalglnservalmetserserthr

500505510

proserserthrserthrthrthrsersergluserthrserserser

515520525

serthralaserthrserproserthrserglnthrphegluthrser

530535540

prothrileglyglyvalproserthrthrserphevalserthrpro

545550555560

thrthrlysleuserhisthrthrserthrmetthralaglnserasp

565570575

serlysserthrhisserserserthrserthrgluasplysserser

580585590

thralaseralavalaspgluserthrthrthrserthrserthrglu

595600605

serthrthrservalthrserglythrserhisseralalysgluser

610615620

serserasnserlysvaltyrserserglnthralahisserserile

625630635640

servalalaserserproserthrlys

645

<210>36

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>36

000

<210>37

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>37

000

<210>38

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>38

000

<210>39

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>39

000

<210>40

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>40

000

<210>41

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>41

000

<210>42

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>42

000

<210>43

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>43

000

<210>44

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>44

000

<210>45

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>45

000

<210>46

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>46

000

<210>47

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>47

000

<210>48

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>48

000

<210>49

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>49

000

<210>50

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>50

000

<210>51

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>51

ileglnglnasnphethrserthrserleumetileserthrtyrglu

151015

glylysalaserilephepheseralagluleuglyserileilephe

202530

leuleuleusertyrleuleuphe

3540

<210>52

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>52

glulysserthrasnserserserseralathrserlysasnalagly

151015

alaalametaspmetglyphepheseralaglyvalglyalaalaile

202530

alaglyalaalaalametleuleu

3540

<210>53

<211>43

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>53

serleuleulysseralaalaseralathrserserserglnserser

151015

serlysserlysglyalaalaglyileilegluileproleuilephe

202530

argalaleualagluleutyrasnleuvalleu

3540

<210>54

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>54

serserglyalaserserserserserlysserserlysglyasnala

151015

alailemetalaproileglyglnthrthrproleuvalglyleuleu

202530

thralaileilemetserilemet

3540

<210>55

<211>44

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>55

alaglnalaasnvalseralaseralaserserserserserserser

151015

lyslysserlysglyalaalaprogluleuvalproalathrserphe

202530

metglyvalvalalaalavalglyvalalaleuleu

3540

<210>56

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>56

glyproglyglulysalaarglysasnasnalaalaproglyproser

151015

asnpheasnserilelysleupheglyvalthralaglyseralaala

202530

valalaglyalaleuleuleuleu

3540

<210>57

<211>39

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>57

serserthrglymetleuserprothrserserserserthrarglys

151015

gluasnglyglyhisasnleuasnproprophephealaargpheile

202530

thralailephehishisile

35

<210>58

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>58

serserpheserserserglyglysersergluserthrthrlyslys

151015

glnasnalaglytyrlystyrargserserpheserpheserleuleu

202530

serpheilesertyrpheleuleu

3540

<210>59

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>59

tyrlysserthrvalasnglylysvalalaservalmetserasnser

151015

thrasnglyalathralaglythrhisilealatyrglyalaglyala

202530

phealavalglyalaleuleuleu

3540

<210>60

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>60

serglyasnleuthrthrserthralaseralathrserthrserser

151015

lysargasnvalglyasphisilevalproserleuproleuthrleu

202530

ileserleuleuphealapheile

3540

<210>61

<211>43

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>61

glylysasnglyalalysserglnglyserserlyslysmetgluasn

151015

seralaprolysasnilepheileaspalaphelysmetservaltyr

202530

alavalphethrvalleupheserileilephe

3540

<210>62

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>62

thrglyserserseralaserserserserlysserlysglyvalgly

151015

asnilevalasnvalserpheserglnserglytyrleualaleuphe

202530

alaglyleuileseralaleuleu

3540

<210>63

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>63

alaserglyserserthrhislyslysasnalaglyasnalaleuval

151015

asntyrserasnleuasnthrasnthrpheileglyvalleuserval

202530

ileseralavalpheglyleuile

3540

<210>64

<211>40

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>64

gluaspalaaspgluasplysaspaspleulysarglyshisargasn

151015

seralaserileserglyproleuleuproleuglyleucysleuleu

202530

phephethrpheserleuphephe

3540

<210>65

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>65

000

<210>66

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>66

000

<210>67

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>67

000

<210>68

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>68

000

<210>69

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>69

000

<210>70

<211>0

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>70

000

<210>71

<211>37

<212>prt

<213>人工序列

<220>

<223>合成序列

<400>71

glnileglnsersermetvalgluileserthrtyralaglyserala

151015

asnservalasnalaglyalaglyalaglyalaleupheleuleuleu

202530

serleualaileile

35

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1