分离树突状细胞膜蛋白基因的制作方法

文档序号:3525648阅读:551来源:国知局
专利名称:分离树突状细胞膜蛋白基因的制作方法
技术领域
本发明提供了与在淋巴细胞,例如在免疫系统发挥作用的细胞中发现的基因有关的组合物。这些基因是有用的标志,可能在控制哺乳动物免疫系统的发育、分化和/或生理方面发挥着作用。特别地,本发明提供了核酸、蛋白质、抗体以及它们的使用方法。
背景技术
哺乳动物循环系统中循环着的成分包括各种类型的细胞,包括红细胞系和髓细胞系中的红细胞及白细胞。见,例如,Rapaport(1987)血液学概论(第2版)Lippincott,Philadelphia,PA;Jandl(1987)BloodTextbook of Hematology,Little,Brown andCo.,波士顿,MA.;以及paul(编著)基础免疫学(第3版)Raven Press,纽约。
树突状细胞(DC)是抗原-处理或提呈细胞,发现于机体的所有组织中。见Steinman(1991)Annual Review of Immunology 9271~296;以及Banchereau和Schmitt(编著,1994)基础和临床免疫学中的树突状细胞Plenum Press,纽约。这些DC可以被分为不同的种类,包括心脏、肾脏、消化道以及肺间质树突状细胞,皮肤和黏膜中的朗罕氏细胞,胸腺髓质和次级淋巴组织中的交叉(interdigitating)树突状细胞,以及血液和淋巴液树突状细胞。尽管上述所有区域中的树突状细胞都是CD45+淋巴细胞,显然是来源于骨髓,但是它们在成熟状态和微环境方面表现出了不同。
这些树突状细胞有效地把抗原处理和提呈到例如T细胞。它们增强来自原初T细胞和记忆T细胞的反应。
初级和次级B-细胞滤泡包括能够捕获并长期保留抗原作为免疫复合物的滤泡样树突状细胞。这些树突状细胞把天然抗原提呈给B细胞,并且可能参与抗体亲和力的成熟、免疫记忆生成以及体液免疫反应的维持。
单核细胞是属于单核吞噬细胞系统的吞噬细胞,驻留在循环系统中。见Roitt(编著)Encvclopedia of Immunology Academic press,圣地亚哥。这些细胞起源于骨髓中,一旦分化就只在骨髓中保留很短的一段时间。然后它们进入循环系统,并能够在那儿保留相当长的一段时间,例如几天。通常称之为血细胞渗出过程,单核细胞能够进入组织和体腔中,在那儿它们分化为巨嗜细胞以及可能分化为树突状细胞。在炎性反应中,单核细胞的数目会成倍增加,并且这些增加了的单核细胞中的许多会渗出到炎症部位。
抗原提呈是指这样一种细胞中事件,即蛋白质抗原被抗原提呈细胞(APC)吸收,处理,然后被识别,启动免疫反应。最有活性的抗原提呈细胞的代表为巨嗜细胞、树突状细胞和某些B细胞,巨嗜细胞是单核细胞的直接发育产物。
巨嗜细胞发现于大多数的组织中,在使很多种蛋白抗原以及微生物内化方面具有很高的活性。它们具有高度发育的胞吞活性,并能够分泌多种在启动免疫反应中发挥重要作用的产物。因此,可以相信被单核细胞表达的或者受单核细胞活性诱导的许多基因,可能在抗原吸收、处理、提呈,或者随后引发的免疫反应的调节中发挥着重要的作用。
然而,在以下这两方面对树突状细胞和单核细胞却知之甚少它们所表达的蛋白,以及它们的大部分功能与包括活化状态在内的活化机制。特别是,与启动免疫反应有关的过程和机制,包括抗原的处理和提呈,还不清楚。对这些细胞的结构、生物学以及生理学特性了解的缺乏限制了对它们的理解。因此,对由于抗原提呈细胞的调节、发育或生理上失常引发的疾病目前还无法处理。
发明概述本发明部分上基于发现各种哺乳动物树突状细胞膜蛋白(DCMP)基因的基础之上,并以特定的DCMP1和DCMP2这两个具体实例举例说明。分布资料表明细胞分布较为广泛,而结构资料显示出了某些功能。DCMP1表现出与凝集素及脱唾液酸糖蛋白受体这一类物质的相似性。描述的DCMP2具体实例表现出与巨嗜细胞脱唾液酸糖蛋白受体之间明显的序列相似性。本发明包括所述基因产物的激动剂和拮抗剂,例如天然结构的突变体(突变型蛋白)、融合蛋白、化学模拟物、抗体以及其他结构或功能上的类似物。本发明还指导了分离编码本发明蛋白的基因。本发明还提供了这些不同蛋白或核酸组合物的各种用途。
在特定的实施例中,本发明提供了一种结合化合物,该化合物中包括一个能够与DCMP1蛋白特异性结合的抗体位点;或者包括选自下列序列的一种多肽Gly Val Ser Glu Leu Gln Glu His Thr Thr GlnLys Ala His Leu Gly His Cys Pro His Cys Pro Ser Val Cys ValPro(SEQ ID NO4的118~144位残基);Gln Val Ala Thr Leu AsnAsn Asn Ala Ser Thr Glu Gly Thr Cys Cys(SEQ ID NO4的166~181位残基);或Trp Lys Pro Gly Gln Pro Asp Asn Trp Gln Gly HisGly Leu Gly(SEQ ID NO4的263~277位残基)。在优选实施例中,这种结合化合物中的抗体结合位点与SEQ ID NO2或8蛋白之间发生特异性的免疫反应,与SEQ ID NO4的118~144位残基的人源蛋白发生特异性的免疫反应,是用纯化或重组产生的DCMP1蛋白制备而成的,是用纯化或重组产生的包含SEQ ID NO4的118~144位残基序列的人源蛋白制备而成的,位于一种单克隆抗体、Fab或F(ab)2中;或者这种结合化合物是用可检测方式标记过的,或存在于含缓冲液的组合物中。
本发明包括这些结合化合物的使用方法,包括让所述的结合化合物与含有抗原的生物样品接触从而形成一种结合化合物抗原复合物。在某些实施方案中,生物样品是人,结合化合物是抗体。本发明还提供了一种检测试剂盒,该试剂盒包括这种结合化合物以及关于这种结合化合物如何用于检测的指导性材料;或用于隔离这种结合化合物的隔室。
本发明还提供了一种基本上纯化或分离的多肽,该多肽特异性地结合这种结合化合物。在各种实施方案中,这种多肽包括至少一种由至少14个来自灵长类DCMP1蛋白的氨基酸残基组成的片段;包括SEQ ID NO4的118~144位残基中的至少14个氨基酸;是一种可溶性多肽;以可检测方式标记的;存在于一种无菌组合物中;存在于一种含缓冲液的组合物中;能够结合唾液酸残基;可重组生产,或有一段天然生成的多肽序列。
提供了核酸的具体实例,包括编码上述多肽的核酸,在纯化了的情况下。通常,该核酸包括至少30个SEQ ID NO1或7编码部分中的核苷酸;包括至少30个来自SEQ ID NO3的608~688位中的核苷酸;包括至少30个来自SEQ ID NO3的752~799位中的核苷酸,或者它包括一个选择性地能够与编码上述多肽的核酸杂交的插入片段。本发明还提供了用这样的核酸转化后的细胞,例如该核酸由SEQID NO1、7中的蛋白编码部分或者SEQ ID NO3中的适当部分组成。
本发明提供了用这些核酸的至少1条链生成一种双链核酸的方法,该方法包括以下步骤所述的链与能够特异性杂交的互补链样品接触。在优选实施方案方案中,该方法能确保这种双链产物的检测;或能实现这种双链产物的组织学定位。
替代地,本发明提供了上述结合化合物的使用方法,该方法包括以下步骤让结合组合物与样品接触从而形成一种结合组合物抗原复合物。在优选实施方案中,所述样品是生物样品,包括体液;所述抗原位于细胞表面;或者所述抗原进一步被纯化。
本发明进一步包括这些多肽的使用方法,该方法包括让多肽与样品接触从而形成一种结合组合物多肽复合物。优选实施方案中,所述多肽进一步被纯化。
提供了另一种用于调节树突状细胞生理或功能的方法,该方法包括让所述细胞与下列物质接触的步骤上述结合组合物、上述DCMP1蛋白或上述多肽。所述功能还可以引发免疫反应的启动或发展。典型地,所述的接触是与抗原结合,包括细胞表面抗原、MHC I抗原或MHCII抗原。
发明详述本发明引述的所有参考文献在此引入参考的范围与每个出版物或专利申请各自特别要求的范围相同,引入只是为了作为参考。I.总论本发明提供了编码表达在哺乳动物树突状细胞(DC)表面的蛋白的DNA序列。关于树突状细胞的综述参见Steinman(1991)AnnualReview of Immunology 9271-296;以及Banchereau和Schmitt(编著,1994)基础和临床免疫学中的树突状细胞Plenum Press,纽约。因为它们发现于树突状细胞上并且在它们的表达中表现出了一些特殊性,所以这些蛋白被命名为树突状细胞蛋白。
下面提供了这些蛋白的特定灵长类对应物,例如人的具体实例。啮齿类,例如小鼠的对应物也存在。下面的描述用于指导人DC基因起示范作用,但是同样也适用于来自其他来源或多形态或单个突变体等哺乳动物的结构上相关的具体实例,例如序列上相关的具体实例。这些具体实例还包括,例如,表现出很小序列变化的蛋白,例如小于5%的序列变化,以及在残基数目上变化很小的蛋白,例如残基取代数目小于20,典型地小于15,优选小于10,以及更优选小于5,包括4、3、2或1。如本发明所述,这些具体实例还包括从全长序列截取下的型式,以及包括这些序列的基本节段的融合蛋白。II.定义“结合组合物”一词是指能够与这些DC蛋白特异性结合的分子,例如以抗体-抗原反应的方式结合。其他化合物,例如蛋白质,也能与相应的这类蛋白特异性地连接。典型地,这种特异性连接是生理上相关的蛋白-蛋白相互作用的形式,可以是共价键或非共价键的形式;并且可以包括多蛋白复合物的成分,包括载体化合物或二聚化配对者。这种分子可以是一种聚合物或化学反应试剂。所述功能类似物可以是一种结构经过修饰的蛋白,或者是一种根本无关的分子,例如,该分子具有能与合适的反应决定簇反应的分子形状。所述突变体可以是这种蛋白的激动剂或拮抗剂,参见,例如,Goodman & Gilman’s thePharmacological Bases of Therapeutics(第8版)Pergamon Press,Tarrytown,纽约。
本发明中使用的“结合因子DC蛋白复合物”是指一种由结合因子与DC蛋白形成的复合物。结合因子的特定结合活性是指这种因子具有一种能够识别相应DC蛋白位点的特定结合位点。例如,用DC蛋白制备的抗体,以及能够识别DC蛋白上的表位的抗体,这两者都可以通过特定的结合形成抗体DC蛋白复合物。典型地,结合因子DC蛋白的形成能够确保处于其他蛋白及生物产物混合物中的DC蛋白能够被测量。“抗体DC蛋白复合物”是指一种其中结合因子是抗体的结合因子DC蛋白复合物。所述抗体可以是单克隆抗体、多克隆抗体或者甚至可以是抗体中的抗原结合片段,例如包括Fv、Fab或Fab2片段。
“同源性”核酸序列,在与其他序列比较时表现出显著的相似性。核酸中的同源性标准是测量本领域进行序列比较时通用的同源性以及/或者系统发育的亲缘关系,或者以杂交反应为基础。下面详细地描述了在序列比较和杂交反应二者中使用的算法。
“分离的”核酸是指基本上与其他天然状态下的核酸伴随成分分离开来的核酸,例如来自起源物种的蛋白质或旁翼基因组序列分离开来的核酸,例如RNA、DNA或一种混合聚合物。这种术语中包括一种从天然生成环境中移取出来的核酸,还包括重组或克隆的DNA分离体以及化学合成的类似物或通过异源系统生物合成的类似物。基本上纯化的分子包括该分子的分离体。一种分离的核酸通常是这种分子的同源组合物,但是在一些实施方案中也可以包括少量的异源体。典型地,这种异源体存在于该聚合物的末端或者对所期望的生物功能或活性无关紧要的部分。
当在蛋白质范围内使用时,本发明中使用的“DCMP1”应该包括一种具有SEQ ID NO2或8所示的氨基酸序列的蛋白质或者是这种蛋白质中的重要片段。它可以是能与相应DCMP1蛋白特定结合成分相互作用的多肽。这些结合成分,例如抗体,典型地能够以高度亲和力与DCMP1蛋白结合,例如至少约100nM,通常为强于约30nM,优选强于约10nM,更优选强于约3nM。
“DCMP2”是指SEQ ID NO4和10提供的序列。灵长类的DCMP2,例如人的被命名为DCMP2的凝集素/脱唾液酸糖蛋白家族成员相关蛋白的核苷酸序列以及相应的氨基酸序列是从SEQ ID NO3和4提供的树突状细胞文库中分离到的。长的形式的序列如所给出的那样,短的形式不含118~144位残基对应的序列。这种短的形式也可以在第1064位核苷酸改变。这与脱唾液酸糖蛋白受体(ASGPR)的单核细胞形式相关,通过第173位和第174位残基之间的插入片段以及第270位残基来变化,见表1,以及位于第775位和第776位残基之间的编码GEE的序列的插入片段。SEQ ID NO9和10描述了另一种变异体。
本发明使用的“多肽”或“蛋白质”包括所述蛋白质的重要片段或节段,以及包含一连串氨基酸残基,该氨基酸残基串含有至少约8个氨基酸,一般至少10个氨基酸,更一般至少12氨基酸,经常至少14个氨基酸,更经常至少16个氨基酸,典型地至少18个氨基酸,更典型地至少20个氨基酸,通常至少22个氨基酸,更通常至少24个氨基酸,优选至少26个氨基酸,更优选至少28个氨基酸,以及在特别优选的实施方案中,至少约30个或更多个氨基酸,例如,35个、40个、45个、50个、60个、70个等。
优选的实施方案给出了多个特定长度的独特性节段,例如非重叠节段。典型地,所述的多个为至少2个,更通常为至少3个,优选5、7或更多个。当长度的下限给定时,比其长的各种长度都是合适的,例如的长度为7的节段有1个,长度为12的节段有2个。节段可以是肽或寡核苷酸。
典型地,“重组”核酸是从结构上定义的。它可以是通过将两个天然状态下互不相连的片段融合在一起生成一段序列制备而成的核酸,这意味着排除了天然产物,例如天然生成的突变体形式。
某些形式是用制备方法来定义的。关于这类形式,例如通过一种操作手段制备而成的产物,该操作手段使用重组核酸技术,例如包括核苷酸序列中的人工插入,典型地为筛选或制备。
因此,本发明包括,例如,含有使用合成寡核苷酸方法得到的序列的核酸,以及通过用编码这些蛋白的非天然生成载体转化细胞制备而成的产物。这类产物通常是这样制备而成的用编码同一个氨基酸或保守氨基酸的冗余密码子取代一个密码子,同时典型地导入或除去一个序列识别位点,例如限制性酶切位点。替代地,也可以这样操作将多个带有期望功能的核酸节段连接在一起生成一个独立的遗传整体,其中包括一种期望的功能结合,而该功能组合是普通天然形式所不具有的。通常限制性酶识别位点是这类人工操作的目标,但是其他位点特异性目标,例如启动子、DNA复制位点、调节序列、调控序列,或引物节段等其他特征性序列,都可以在设计中引入。一种类似的概念趋近于重组体,例如融合体、多肽。特定情况下包括通过遗传密码冗余编码与这些抗原片段相似的多肽的合成核酸,以及编码各种不同种突变体的序列的融合。
“可溶性”是通过用Sverdberg单位[S]测量出的沉淀来反映的,Sverdberg单位用于测量一种分子在特定情况下的沉降速度。测定沉降速度的经典方法是采用分析超高速离心,而现在典型地是使用标准超高速离心。见,Freifelder(1982)Physical Biochemistry(第2版)W.H.Freeman & Co.旧金山,CA;以及Cantor和Schimmel(1980)Physical Biochemistry第1~3部分,W.H.Freeman & Co.旧金山,CA。作为初步测定,将一种含有推定的可溶性多肽的样品放入标准实际大小的超高速离心机中,50Krpm离心10分钟,可溶性分子保留在上清液中。可溶性颗粒或多肽的沉降速度典型地小于约30S,更典型地小于约15S,通常小于约10S,更通常小于约6S,在特定的实施方案中优选小于约4S,更优选小于约3S。多肽或片段的溶解度取决于环境和多肽本身。许多因素能影响多肽的溶解度,包括温度、电解环境、多肽的大小和分子特性以及溶剂的特性。典型地,使用多肽的温度范围为约4~65℃。通常使用温度为高于约18℃,更通常高于22℃。用于诊断时,该温度通常约为室温或更高一些,但低于分析中所使用的各种成分的变性温度。用于治疗时,尽管在特定情况下原位或体外的温度可能会有所升降,但该温度通常为体温,典型地为约37℃的人体温度。多肽的大小及结构通常应该处于一种基本上稳定的生理活性状态,一般不处于变性状态。该多肽可以与其他多肽联合形成一种四级结构,例如为了赋予可溶性,或者以一种类似于天然脂双层相互作用的方式与类脂或去污剂相连。
所述溶剂通常是一种生物相容的缓冲液,用于保持生物活性的一类缓冲液。通常,该溶剂具有中性pH值,典型地为约5~10,优选约7.5。在一些情况下,加入去污剂,典型地为一种温和的非变性去污剂,例如CHS(半琥珀酸胆甾醇酯)(cholesteryl hemisuccinate)或CHAPS(3-([3-胆酰胺丙基]-二甲铵)-1-丙磺酸),或以一种低的充足去污剂浓度提供以便避免蛋白质结构或生理特性被破坏。
“基本上纯化的”典型地是指把所述的蛋白质同其他来源于初始来源有机体的污染蛋白、核酸或其他生物产物分离开来。纯化或“分离”可以用标准方法分析,典型地通过重量分析,一般为至少约50%的纯度,更一般为至少约60%的纯度,通常为至少约70%的纯度,更通常为至少约80%的纯度,普遍为至少约85%的纯度,更普遍为至少约90%的纯度,优选为至少约95%的纯度,更优选为至少约98%的纯度,最优选的实施方案中,为至少99%的纯度。通常加入载体或赋形剂,或者制剂可以被灭菌或包括缓冲成分。
核酸序列比较范围中的“基本上相似”是指当进行序列比较时在完全对准的情况下,这些节段或它们的互补链是相同的,具有合适核苷酸插入或缺失,在至少约50%的核苷酸中,一般为至少56%,更一般为至少59%,经常为至少62%,更经常为至少65%,通常为至少68%,更通常为至少71%,典型地至少74%,更典型地至少77%,普遍为至少80%,更普遍为至少约85%,优选至少90%,更优选至少约95~98%或更高,以及在特别优选的实施方案中高约99%或更多个核苷酸。替代地,当所述节段在选择性的杂交条件下会与一条链或其互补链杂交时,典型地使用来自SEQ ID NO1或7序列或3和9的适当部分,那么就说明存在基本上相似。典型地,当在一串至少约30个核苷酸中有至少约55%的相似性时就会发生选择性杂交,优选在一串至少约25个核苷酸中有至少约65%的相似性,更优选至少约75%,最优选在一串至少约20个核苷酸中有至少约90%的相似性。见,Kanehisa(1984)Nuc.Aicds Res.12203-213。本发明描述的相似性比较的长度可以在更长的范围内进行,在某些实施方案中在一串至少约17个核苷酸范围内比较,通常为至少约20个核苷酸,更通常为至少约24个核苷酸,典型地至少约28个核苷酸,更典型地为至少约40个核苷酸,优选至少约50个核苷酸,更优选至少约75~100个或更多个核苷酸。比较DCMP1时的测量结果并不能反映比较DCMP2具体实例的测量结果。
与杂交领域中的同源或基本相似有关的“严紧性条件”,是指涉及盐类、温度、有机溶剂以及其他参数的严格性组合条件,典型地是指杂交反应中控制的那些条件。参数间的组合比单一参数的量度更重要。见,例如,Wetmur和Davidson(1968)分子生物学杂志31349-370。能够在严紧性条件下与目标核酸结合的核酸探针对于该目标核酸是特异性的。典型地这种核酸探针的长度大于11个核苷酸,并且该探针与目标核酸中的探针指定区域之间充分相同或互补从而在严紧性条件下能与目标核酸结合。
通过紧密相关物种的种间杂交,能够克隆并分离到其他哺乳动物的相应的DCMP蛋白。实例参见以下描述。远缘相关的物种之间的相似性相当低,因此,建议应当在非常紧密相关的物种间进行杂交。替代地,也可以制备一种表现出很低的种间特异性的抗体制剂用于克隆表达方法中。
在涉及蛋白质或肽链时,短语“特异性地结合抗体”或“发生特异性的免疫反应”意味着,存在着一定数目异源的蛋白及其他生物产物情况下,一种反应的发生取决于特定蛋白是否存在。因此,在设定的免疫测定条件下,特定的抗体结合到一种具体的蛋白质上,并且不与样品中存在的其他蛋白发生明显的结合。在这类条件下特异性结合抗体要求根据抗体针对某种具体蛋白的特异性来筛选抗体。例如,使用针对带有SEQ ID NO2或8描述的氨基酸序列的人DCMP1蛋白的抗体,可以筛选获得能够与DCMP蛋白而不与其他蛋白发生特异性免疫反应的抗体。这些抗体识别与同源性人DCMP1蛋白高度相似的蛋白质。III.核酸这些DCMP选择性地表达在树突状细胞上。如本发明公开的那样,优选实施方案中使用的标准方法能够用来分离其他物种的基因,例如鸟、哺乳动物等温血动物。交叉杂交使得能从个体、品系或种分离到相关蛋白。根据本发明提供的信息,可以成功地获得大量分离合适核酸克隆的方法。在合适的杂交条件下,Southern印迹杂交实验能够鉴定出其他物种中的同源基因。
如下所述,通过标准方法,可以用纯化蛋白或特定肽链生产抗体。合成肽链或纯化蛋白也能被提呈免疫系统生产多克隆或单克隆抗体。见,例如,Coligan(1991)Current Protocol in ImmunologyWiley/Greene,NY;以及Harlow和Lane(1989)抗体实验指南ColdSpring Harbor Press,NY,在此引入作为参考。替代地,DCMP抗原结合组合物能够用作特定的结合反应试剂,可以利用其特异性结合的优势,用于例如DCMP的纯化。
特定的结合组合物能够用于筛选一种表达文库,该文库是从表达相应DCMP蛋白的细胞系中制备得到的。现有许多种筛选方法,例如表面表达配体的标准染色或者淘选。胞内表达的筛选也能够通过染色或免疫荧光方法实现。结合组合物能够亲和纯化或挑选出表达有抗原的细胞。表1灵长类的,例如人的凝集素/脱唾液酸糖蛋白受体家族成员的序列对比。ASGPRh1和ASGPRh2是肝脱唾液酸糖蛋白受体(见SEQ ID N05和6);ASGPRm是巨嗜细胞衍生ASGPR;DCMP2有短、长以及突变体的形式,SEQ ID NO4和10;DCMP1出现于SEQ ID NO2和8。ASGPRh1 MTKE..YQDLQHLDNEESDHHQLRKGPPPPQPLLQRLCSGP...............RLLLLSLGASGPRh2 MAKD..FQDIQQLSSEENDHP.FHQGPPPAQPLAQRLCSMV...............CFSLLALSASGPRm MTRT..YENFQYLENKVKVQG.FKNGPLPLQSLLQRLRSGP...............CHLLLSLGDCMP2s MTRT..YENFQYLRNKVKVQG.FKNGPLPLQSLLQRLRSGP...............CHLLLSLGDCMP2l MTRT..YENFQYLENKVKVQG.FKNGPLPLQSLLQRLRSGP...............CHLLLSLGDCMP2v MTRT..YENFQYLENKVKVQG.FKNGPLPLQS................................DCMF1 MTSEITYAEVR...........FKNEFKSSGINTASSAASKERTAPHKSNTGFPKLLCASLLIFF特征**** +++++ASGPRh1 LSLLLLVVVCVIGS.QNSQLQEELRGLRETFSNFTASTEAQVKGLSTQGGNVGRKMKSLESQLE.ASGPRh2 FNILLLVVICVTGS.QSAQLQAELRSLKEAFSNFSSSTLTEVQAISTHGGSVGDKITSLGAKLE.ASGPRm LGLLLLVIICVVG.FQNSKFQRDLVTLRTDFSNFTSNTVAEIQALTSQGSSLEETIASLKAEVEGDCMP2s LGLLLLVIICVVG.FQNSKFQRDLVTLRTDFSNFTSNTVAEIQALTSQGSSLEETIASLKAEVEGDCMP2l LGLLLLVIICVVG.FQNSKFQRDLVTLRTDFSNFTSNTVAEIQALTSQGSSLEETIASLKAEVEGDCMP2v ..LLLLVIICVVG.FQNSKFQRDLVTLRTDFSNFTSNTVAEIQALTSQGSSLEETIASLKAEVEGDCMP1 LLLAISFFIAFVIFFQKYS.Q..LLEKKTT.KELVHTTLE....CVKKNMPVEETAWS.......特征 ++++++++ASGPRh1 .KQQK.........................DLSEDHSSLLLHVKQFVSDLRSLSCQMAALQGNGSASGPRh2 .KQQQ.........................DLKADHDALLFHLKHFPVDLRFVACQMELLHSNGSASGPRm FKQERQA...........................VHSEMLLRVQQLVQDLKKLTCQVATLNNNGEDCMP2s FKQERQA...........................VHSEMLLRVQQLVQDLKKLTCQVATLNNN..DCMP2l FKQERQAGVSELQEHTTQKAHLGHCPHCPSVCVPVHSEMLLRVQQLVQDLKKLTCQVATLNNN..DCMP2v FKQERQA...........................VHSEMLLRVQQLVQDLKKLTCQVATLNNNGEDCMP1 .................................................................特征ASGPRh1 ER....TCCPVNWVEHERSCYWFSRSGKAWADADNYCRLEDAHLVVVTSWEEQKFVQHHIGPVNTASGPRh2 QR....TCCPVNWVEHQGSCYWFSHSGKAWAEAEKYCQLENAHLVVINSWEEQKFIVQHTNPFNTASGPRm EASTEGTCCPVNWVEHQDSCYWFSHSGMSWAEAEKYCQLKNAHLVVINSREEQNFVQKYLGSAYTDCMP2s .ASTEGTCCPVNWVEHQDSCYWFSHSGMSWAEAEKYCQLKNAHLVVINSREEQNFVQKYLGSAYTDCMP2l .ASTEGTCCPVNWVEHQDSCYWFSHSGMSWAEAEKYCQLKNAHLVVINSREEQNFVQKYLGSAYTDCMP2v EASTEGTCCPVNWVEHQDSCYWFSHSGMSWAEAEKYCQLKNAHLVVINSREEQNFVQKYLGSAYTDCMP1 .......CCPKNWKSFSSNCYFISTESASWQDSEKDCARMEAHLLVINTQEEQDFIFQNLQEESA特征 ..........................................................ASGPRh1 W.MGLHDQNGP..WKWVDGTDYETGFKNWRPEQPDDWYGHGLGGGEDCA..HFTDDGR...WNDDASGPRh2 W.IGLTDSDGS..WKWVDGTDYRHNYKNWAVTQPDNWHGHELGGSEDCV..EVQPDGR...WNDDASGPRm W.MGLSDPEGA..WKWVDGTDYATGFQNWKPGQPDDWQGHGLGGGEDCA..HFHPDGR...WNDDDCMP2s W.MGLSDPEGA..WKWVDGTDYATGFQNWKPGQPDNWQGHGLGGGEDCA..HFHPDGR...WNDDDCMP2l W.MGLSDPEGA..WKWVDGTDYATGFQNWKPGQPDDWQGHGLGGGEDCA..HFHPDGR...WNDDDCMP2v W.MGLSDPEGA..WKWVDGTDYATGFQNWKPGQPDDWQGHGLGGGEDCA..HFHPDGR...WNDDDCMP1 YFVGLSDPEGQRHWQWVDQTPYNESSTFWHPREPSD.......PNERCVVLNFRKSPKRWGWNDV特征 ................................XXX..............................ASGPRh1 VCQRPYRWVCETELDKASQEPPLLASGPRh2 FCLQVYRWVCEKRRNATGE...VAASGPRm VCQRPYHWVCEAGLGQTSQESHDCMP2s VCQRPYHWVcEAGLGQTSQESHDCMP2l VCQRPYHWVCEAGLGQTSQESHDCMP2v VCQRPYHWVCEAGLGQTSQESHDCMP1 NCLGPQRSVCEMMKIH.......L特征 ......................特征***内化结构域(一种延伸结构域出现在NK受体NKA中);+++跨膜结构域;...C型凝集素结构域;XXX蔗糖特异性结构域。在同源性方面,DCMP1受体与凝集素结构域中的巨嗜细胞凝集素最接近。
序列分析表明这些DCMPs是凝集素/脱唾液酸糖蛋白受体超家族的成员。使用这些肽段也可以设计并生产出合适的寡核苷酸,用于筛选文库确定其中是否存在类似基因,例如相同或多形态突变体,或者用于鉴定DC。可以使用遗传密码选定合适的寡核苷酸,作为探针用于筛选。与聚合酶链反应(PCR)技术结合,合成寡核苷酸能用于从文库中筛选出期望的克隆。
也可以使用互补序列作为探针或引物。在鉴定了可能的氨基酸末端的基础上,也可以具体地使用其他肽链,例如与锚定载体偶联的或用多聚A互补PCR技术偶联的肽链或者与其他肽链的互补DNA偶联的肽链。
对编码这些DC蛋白的基因进行核酸操作的技术,例如把编码多肽的核酸序列亚克隆到表达载体中、探针的标记、DNA杂交等,在下列文献中普遍都有描述Sambrook,et al.(1989)分子克隆-实验指南(第2版)vol.1-3,Cold Spring Harbor Laboratory,Cold SpringHarbor Press,纽约,该文献在此引入作为参考,下文中简称为“Sambrook,et al.”,以及参见Coligan,et al.(1987并且定期增补)Current Protocols In Molecular Biology Greene/Wiley,纽约,NY,简称为“Coligan,et al.”。
分离编码这些DC蛋白的DNA序列的方法有许多种。例如,使用序列与本发明公开的序列相同或互补的标记寡核苷酸探针,把DNA从基因组或cDNA文库中分离出来。可以使用全长探针,或者通过与把公开的序列与其他蛋白进行比较以及选择特定引物,可以生产寡核苷酸探针。此类探针可直接用于杂交分析以分离编码DC蛋白的DNA,或者可设计用于扩增技术如PCR的探针以分离编码DC蛋白的DNA。
为了制备cDNA文库,从表达DC蛋白的细胞中分离出mRNA。用mRNA制备cDNA,并将cDNA连接到重组载体中。把该载体转化到重组宿主中进行增殖、筛选及克隆。制备和筛选cDNA文库的方法是众所周知的。见Gubler和Hoffman(1983)Gene 25263-269;Sambrooket al;或Coligan et al。
就基因组文库而言,可以从组织中提取出DNA,用机械剪切或酶促消化的方法进行消化产生长约10~12kb的片段。然后用梯度离心法分离这些片段,并将其克隆到λ噬菌体载体中。这些载体和噬菌体进行体外包装,如文献中所述,例如Sambrook, et al.或Coligan,etal.。利用benton和Davis(1977)Science 196180-182中描述的噬斑杂交,对重组噬菌体进行分析。按照例如Grunstein et al.(1975)Proc.Natl.Acad.Sci.USA 723961-3965一文中一般描述的方法,进行克隆杂交。
通过它能与本发明描述的核酸探针杂交的性能,例如在克隆杂交或噬斑杂交实验中,能够从cDNA文库或基因组文库中鉴定出编码DC蛋白的DNA。使用本领域技术人员熟悉的一般方法就能分离出相应的DNA区域。见Sambrook et al。
也可以采用各种扩增目标序列的方法来制备编码DC蛋白的DNA,例如采用聚合酶链反应。聚合酶链反应(PCR)技术可以用于扩增这类直接来自mRNA、来自cDNA以及来自基因组文库或cDNA文库的核酸序列。这些编码DC蛋白的分离序列也可以作为PCR扩增的模板。
在PCR技术中,合成寡核苷酸引物,该引物与要扩增的DNA区域的两个5’端互补。然后用这两个引物进行聚合酶链反应。见Innis,etal.(编著)(1990)PCR ProtocolA Guide to Methods andApplications Academic Press,圣地亚哥,CA。可以选择引物,扩增编码选定的全长DC蛋白的整个区域,或者扩增需要的较小片段。一旦这些区域用PCR扩增后,那么就可以对它们进行测序,以及可以使用一般方法从这些序列中制备出寡核苷酸探针。然后,用这些探针分离其他形式DC蛋白的编码DNAs。
可以采用下列方法化学合成用作探针的寡核苷酸Beaucage和Carruthers(1983)Tetrahedron Lett.22(20)1859-1962中首次描述的固相亚磷酰胺三酯法以及Needham-VanDevanter et al.(1984)Nucleic Acids Res.126159-6168。例如,采用非变性丙烯酰胺凝胶电泳或采用Pearson和Regnier(1983)J.Chrom.255137-149中描述的阴离子交换HPLC,进行寡核苷酸的纯化。合成寡核苷酸的序列的验证可以采用Maxam和Gilbert的化学降解法,该方法见Grossman和Moldave(1980编著)Methods in Enzymology 65499-560 Academic Press,纽约。
如文中所述,本发明提供了编码DC蛋白的分离DNA或片段。此外,本发明还提供了编码一种生物活性蛋白质或多肽的分离或重组DNA,该DNA在合适的条件下,例如在高度严紧性条件下能够与本发明描述的DNA序列杂交。所述的生物活性蛋白质或多肽可以是天然形式或者是重组的蛋白或片段,并具有如SEQ ID NO2、4、8或10所描述的序列。优选的实施方案是全长的天然分离体,例如来自灵长类的全长的天然分离体。在糖基化形式中,该蛋白应该表现的更大。进一步,本发明包括这些分离或重组DNA或其片段的用途,这些DNA或其片段编码的蛋白质与每一种对应的DC蛋白具有同源性。这些分离DNA在5’和3’两侧具有各自的调节序列,例如启动子、增强子、聚腺苷酸化(poly-A)信号以及其他序列。IV.制备DC基因产物编码这些DC蛋白或其片段的DNAs可以从以下来源获得化学合成、cDNA文库的筛选或者对从很多种细胞系或组织样品中制备的基因组文库进行筛选。
这些DNAs能够在很多种宿主细胞中表达,用于合成例如用来生产多克隆或单克隆抗体的全长蛋白质或其片段;用于结合实验;用于构建和表达修饰后的分子;以及用于结构/功能研究。所有这些蛋白及其片段都能在用合适表达载体转化或转染过的宿主细胞中表达。这些分子能够基本上被纯化,不含除重组宿主衍生蛋白以外的蛋白质或细胞污染物,因此基本上能够与药学上可接受载体和/或稀释剂结合用于药物组合物。这些抗原或其部分可以与其他蛋白一起以融合体的形式表达。
典型地,表达载体为含有期望的DC基因或其片段的自身-复制DNA或RNA构建体,通常任选地连接有合适的基因调控单元,在适当宿主中这些调控单元能够影响表达。影响表达所需要的调控单元的特定类型取决于最终使用的宿主细胞。通常,基因调控单元可以包括一个原核启动系统或一个真核启动表达调控系统,典型地包括一个转录启动子、一个任选的控制转录发生的操纵子、提高mRNA表达水平的转录增强子、编码一个合适的核糖体结合位点的一段核酸以及终止转录和翻译的序列。通常表达载体还含有一个复制起始位点使得载体能够不依赖宿主细胞而独立复制。
本发明的载体包含编码各种DC蛋白或其片段,典型地为编码一种生物活性多肽或蛋白的DNAs。这些可以处于病毒启动子的调控之下并且能够编码一种选择标记。本发明进一步还提供了这类表达载体的用途,这些表达载体能够在原核或真核宿主中表达编码DC蛋白的真核cDNA,这种情况下载体与宿主相容,编码所述蛋白的真核cDNA插入到载体中从而实现随着含有这种载体的宿主的生长所述的cDNA得到表达。通常,把表达载体设计为,在宿主细胞中适当复制或扩增大大增加每个细胞中期望基因的拷贝总数。一般不需要表达载体在宿主细胞中复制,例如,使用不含能够被宿主细胞识别的复制起始位点的载体,能够实现上述蛋白或其片段在各种宿主中的瞬时表达。也可以使用这样的载体能够通过重组引发DC基因或其片段整合到宿主DNA中的载体,或者整合了一个能够调控内源基因表达启动子的载体。
本发明使用的载体包括质粒、病毒、噬菌体、可整合的DNA片段以及其他能够把DNA片段整合到宿主基因组中的载体。表达载体是含有基因调控单元的特定化的载体,这些调控单元能够影响任选连接的基因。质粒是最常用的载体但是能完成等效功能的其他形式的载体也都适合用于本发明。见,例如,Pouwels,et al.(1985及增补)CloningVectorA Laboratory Manual Elsevier,N.Y.;以及Rodriquez,et al.(编著)(1988)VectorA Survey of Molecular Cloning Vectorand Their Uses Buttersworth,波士顿,MA。
合适的宿主细胞包括原核细胞、低等真核细胞以及高等真核细胞。原核细胞包括格兰氏阴性菌和格兰氏阳性菌。例如大肠杆菌和枯草芽孢杆菌(B.subtilis)。低等真核细胞包括酵母,例如啤酒糖酵母和毕赤氏酵母属以及Dictyostelium属中的种。高等真核细胞包括现有的来自动物细胞的组织培养细胞系,这些动物细胞既包括昆虫细胞和鸟等非哺乳动物起源,还包括人、灵长类以及啮齿类等哺乳动物起源。
原核宿主-载体载体系统包括很多种用于许多不同物种的载体。如本发明所述,通常使用的大肠杆菌及其载体包括可用于其他原核细胞的等效载体。一种用于扩增DNA的代表性载体是pBR322或其衍生物。能够用于表达DC蛋白的载体包括,但不限于,这些载体含lac启动子(pUC-系列)的载体、含trp启动子的载体(pBR322-trp)、含Ipp启动子的载体(pIN-系列);含λ-pP或pR启动子的载体(pOTS)或含ptac等杂合启动子的载体(pDR540)。见,Rodriguez和Denhardt(编著)VectorA Survey of Molecular Cloning Vectorand Their Uses 10205-236 Buttersworth,波士顿,MA中的Brosius,et al.(1988)“使用λ-、trp-、lac-以及Ipp-衍生启动子的表达载体”,一文。
低等真核细胞,例如酵母和Dictyostelium,可以用来接受含DC基因序列的载体的转化。为了实现本发明,最常用的低等真核细胞是面包酵母、啤酒糖酵母。尽管还有大量其他品系和种可以使用,但一般常用代表性的低等真核细胞。典型地,酵母载体由一个复制起始位点(整合型除外)、一个选择基因、一个启动子、编码期望蛋白或其片段的DNA以及用于翻译终止、聚腺苷酸化、转录终止的序列。用于酵母的合适表达载体包括3-磷酸甘油酸激酶及各种其他糖基化酶基因启动子等组成型启动子,或乙醇脱氢酶2启动子等可诱导启动子,或金属硫蛋白(metallothionine)启动子。合适的载体包括下列类型载体的衍生物自身-复制低拷贝数(例如YRp-系列)、自身-复制高拷贝数(例如YEp-系列)、整合型(例如YIp-系列)或微-染色体(例如YCp-系列)。
高等真核组织培养细胞用于表达DC蛋白的优选宿主细胞。理论上,大多数的任意一种高等组织培养细胞系都可以使用,例如昆虫杆状病毒表达系统,无论其来自无脊椎动物或脊椎动物。然而,优选哺乳动物细胞,因为它能够在共翻译和翻译后两方面都能实现恰当处理。这些细胞的转化或转染以及增殖都采用常规方法。有用的细胞系包括Hela细胞、中国仓鼠卵巢(CHO)细胞系、乳鼠肾(BRK)细胞系、昆虫细胞系、鸟类细胞系、猴(COS)细胞系。用于这些细胞系的表达载体通常包括一个复制起始位点、一个启动子、一个翻译起始位点、RNA剪接位点(例如如果使用的是基因组DNA)、一个聚腺苷酸化位点以及一个转录终止位点。这些载体还可能包括选择基因或扩增基因。合适的表达载体可以是质粒、病毒或带有衍生启动子的反转录病毒,例如从下列来源衍生出来的启动子腺病毒、SV40、细小病毒、痘苗病毒或巨细胞病毒。合适的表达载体的代表性实例包括pCDNA1、pCD,见Okayama,et al.(1985)Mol.Cell Biol.51136-1142;pMClneoPoly-A,见Thomasm,et al.(1987)Cell 51503-512;以及pAC373或pAC610等杆状病毒载体。
在某些情况下,这些DC蛋白不必糖基化就能引发特定分析中的生物反应。然而,往往希望在一种能够提供一种特殊或特定糖基化形式的系统中表达DC多肽。在这种情况下,通常形式就是表达系统天然提供的形式。然而,通过把多肽例如以非糖基化形式暴露于引入到异源表达系统中的合适的糖基化蛋白,可以对这种上述形式进行修饰。例如,DC基因可以与一个或多个编码哺乳动物或其他糖基化酶的基因共转化。进一步还能理解到,过度的糖基化可能对DC蛋白的生物活性有害,本领域技术人员可以利用常规实验优化糖基化的程度以赋予最佳生物活性。可以把DC蛋白构建成与细胞膜连接的磷酯酰肌醇(PI),但是用磷酯酰肌醇切割酶处理能够将其从膜上除去,例如用磷酯酰肌醇磷脂酶-C。这样就能以生物活性形式释放出抗原,并且确保用蛋白质化学的一般方法就能完成纯化。见,例如,Low(1989)Biochem.Biophys.Acta 988427-454;Tse,et al.(1985)Science 2301003-1008;Brunner,et al.(1991)J.Cell Biol.1141275-1283;以及Coligan,et al.(编著)(1996并定期增补)CurrentProtocols in Protein Science,John Wiley & Sons,纽约,NY。
既然这些DC蛋白已经被特征描述,因此通过合成肽链用的常规方法就能制备出DC蛋白的片段或衍生物。这些常规方法包括下列文献中描述的方法Stewart和Young(1984)固相肽链合成PierceChemical Co.,Rockford,IL;Bodanszky和Bodanszky(1984)ThePractice of Peptide Synthesis Springer-Verlag,纽约,NY;以及bodanszky(1984)肽链合成原理Springer-Verlag,纽约,NY。还参见Merrified(1986)Science 232341-347;以及Dawson,et al.(1994)Science 266776-779。例如,叠氮法、酰基氯法、酸酐法、混合酸酐法、活性酯法(例如对硝基苯酯、N-羟基琥珀酰亚胺酯或氰甲基酯)、碳化二咪唑(carbodiimidazole)法、氧化-还原法或二环己基碳二亚胺(DCCD)/添加剂法,这些方法都可以使用。固相合成和液相合成二者都可以应用于上述方法。
利用肽链分离,例如通过抽提、沉淀、电泳以及各种形式的层析等,能够把上述制备到的蛋白质及其片段从反应混合物中分离和纯化出来。根据预期用途,以不同纯度制备本发明的DC蛋白。利用已知的蛋白质纯化技术或利用抗体或本发明中描述的结合伴随成分,能够完成纯化,例如利用免疫吸附亲和层析。这种免疫吸附亲和层析具体操作如下首先把抗体连接到一种固相载体上,让被连接的抗体与下列物质接触来源适当的细胞的溶解裂解液、表达蛋白质的其他细胞的裂解液或者生产蛋白质作为DNA技术结果的细胞的裂解物或上清液,见下文。
众多细胞系都可以用于筛选与其他细胞相比高水平表达所述蛋白的细胞。各种细胞系,例如小鼠胸腺基质细胞系TA4,因其良好的处理特性可以用于筛选及选择。天然DC细胞蛋白可以从天然来源分离获得,或者使用适当的表达载体从转化细胞中表达获得。实现表达蛋白的纯化可以使用一般方法,或者可以与能从细胞裂解物或上清液中高效地有效纯化的遗传工程手段结合使用。FLAG或His6节段可以用来作为这类纯化特性。V.抗体能够制备针对以下各种DC蛋白的抗体,包括单个的、多形态的、等位基因的、品系或种突变体及其片段,以天然生成(全长)形式和重组形式两种形式存在。此外,也可以制备到针对活性形式或非活性形式的DC蛋白的抗体。抗独特型抗体也可以使用。
a.制备抗体大量的免疫原可以用于生产与DC蛋白特异性反应的抗体。重组蛋白是用于生产单克隆或多克隆抗体的优选免疫原。也可以纯化或非纯化的形式使用天然生成蛋白。也可以利用本发明描述的人DC蛋白序列制备合成多肽,用这些多肽作为免疫原制备抗DC蛋白的抗体。如本发明所述,重组蛋白可以在原核细胞或真核细胞中表达。然后把产物注射到能够产生抗体的动物中。可以将生产出的单克隆抗体或多克隆抗体随后用于免疫测定中测量蛋白质。
生产多克隆或单克隆抗体的方法对于本领域技术人员来说是已知的。简而言之,将免疫原优选纯化蛋白质与佐剂混合,然后用该混合物免疫动物。取血样监测该动物对于上述免疫原制剂的免疫反应,测定与关注的DC蛋白间的反应滴度。当得到适当高滴度的抗免疫原抗体时,从动物中收取血,制备抗血清。如果需要的话,可以对抗血清进行分级分离,富集对上述蛋白质具有活性的抗体。见,例如,Harlow和Lane。
单克隆抗体可以用本领域技术人员熟悉的各种技术获得。简而言之,从用目的抗原免疫过的动物中取出脾细胞,使脾细胞无限增殖化,往往通过与骨髓瘤细胞融合。见,例如,Kohler和Milstein(1976)Eur.J.Immunol.6511-519,在此引入作为参考。无限增殖的替代方法包括用EB病毒转化、癌基因、或反转录病毒、或其他本领域已知的方法。从来自单个无限增殖细胞的克隆中筛选出能生产具有期望抗原特异性及亲和力的抗体,通过各种技术可以提高这些细胞生产的单克隆抗体的产量,包括注射到脊椎动物宿主的腹膜腔中。替代地,利用Huse,et al.(1989)Science 2461275-1281中概述的一般方法对来自人B细胞的DNA文库进行筛选,可以分离得到编码单克隆抗体或其结合片段的DNA序列。
用上述载体与这些片段的共轭物免疫动物制备抗这些DC蛋白预定片段的抗体,包括结合片段及单链型式。从分泌期望抗体的细胞中制备单克隆抗体。从这些抗体中筛选出能与正常或缺陷型DC蛋白结合的抗体,或者筛选出具有激动或拮抗活性的抗体。这些单克隆抗体结合1KD通常至少约1mM,更通常为至少约300μM,典型地至少约100μM,更典型地至少约30μM,优选至少约10μM,更优选至少约3μM或更优。
在一些情况下,希望从各种哺乳动物宿主中制备出单克隆抗体,例如从小鼠、啮齿类动物、灵长类、人等。制备这些单克隆抗体的技术的描述见,例如,Stites et al.(编著)基础和临床免疫学(第4版)Lange Medical Publications Los Altos,CA,以及其中引述的文献;Harlow和Lane(1988)抗体实验指南CSH pressGoding(1986)单克隆抗体原理及实践(第2版)academic press,纽约,NY;以及特别是Kohler和Milstein(1975)Nature 256495-497,其中讨论了一种生产单克隆抗体的方法。简单地概述,这种方法包括用一种免疫原注射动物引发体液免疫反应。然后宰杀该动物,从脾中取细胞,然后将脾细胞与骨髓瘤细胞融合。结果得到一种能够体外增殖的杂交细胞或“杂交瘤”。然后从这些杂交瘤中筛选分离出单个的克隆,其中的每一个克隆分泌单一种类的抗免疫原抗体。这样,得到的单一种类的抗体就是来自免疫动物的无限增殖并克隆的B细胞的产物,这些产物响应于该免疫原物质上的一个特异性识别位点产生的。
其他可以使用的技术包括噬菌体或类似载体中抗体文库的筛选。见,Huse,et al.(1989)“generation of a large combinationlibrary of immunoglubin repertoire in phage lambda,”Science2461275-1281;以及Ward,et al.(1989)Nature 341544-546。本发明的多肽或抗体可以经过或不经修饰使用,包括嵌合或人源化抗体。通常,通过共价键或非共价键的形式连接一种能提供可检测信号的物质,对上述多肽和抗体进行标记。现在已知有很多种标记物及共轭技术,它们广泛地报道于科技和专利文献中。合适的标记物包括放射性核素、酶、底物、辅因子、抑制剂、荧光组分、化学发光组分、磁性颗粒等。有关这些标记物的教导的专利,包括美国专利US3817837、US3850752、US3939350、US3996345、US4277437、US4275149以及US4366241。另外,还可以生产重组免疫球蛋白。见,Cabilly的美国专利US4816567以及Queen,et al.(1989)Proc.Natl.Acad.USA 8610029-10033。
本发明的抗体也可以用于亲和层析分离各种DC蛋白。制备层析柱,把抗体连接到固相载体上,例如连接琼脂糖、葡聚糖凝胶等颗粒上。让细胞裂解液通过层析柱,洗涤柱体,接着增加温和变性剂的浓度,从而释放出纯化的DC蛋白。
这些抗体也可以用于从表达文库筛选特定的表达产物。通常,这种方法中使用的抗体都用一种组分做了标记,该组分能够使得抗原的检测因抗体的结合而变得容易。
抗DC蛋白的抗体可以用于分析或鉴定表达有相应蛋白的特定细胞群体成分。通过分析表达DC蛋白的细胞的表达产物,能够诊断疾病,例如免疫损伤、DC缺失或DC的过量表达。
抗各种DC的抗体也可以用于制备抗独特型抗体。这些抗体可以用于检测和诊断各种与相应抗原有关的免疫疾病。
b.免疫分析特定的蛋白质能够通过多种免疫测定方法来测量。关于免疫学或免疫分析方法的总体上的综述参见,Stites和Terr(编著)1991基础和临床免疫学(第7版)。而且,利用下列文献中全面综述的几种方法中的任意一种,都能够实现本发明的免疫测定Maggio(编著)EnzymeImmunoassav CRC Press,Boca Raton,佛罗里达;生物化学和分子生物学中的实验技术.Elsevier Science Publishers B.V.,阿姆斯特丹一书中的Tijan(1985)“酶免疫测定的理论及实践,”;以及Harlow和Lane(1989)抗体实验指南,上述文献在此引入作为参考。参见Chan(编著)(1987)免疫测定操作指南Academic Press,0rlando,FL;Price和Newman(编著)(1991)免疫测定的理论和实践Stockton Press,NY;以及Ngo(编著)(1988)非同伉素免疫分析Plenum Press,NY。
用于测量这些DC蛋白的免疫测定,可以通过多种本领域技术人员已知的方法实现。简而言之,测量这些蛋白的免疫测定可以是竞争性或非竞争性结合测定。在竞争性结合测定中,待分析的样品与标记的分析样对结合到固体表面的捕获试剂上的特异性结合位点展开竞争。优选地该捕获试剂是上述制备的能与DC蛋白特异性反应的抗体。结合到捕获试剂上的标记分析物浓度与样品中出现的游离分析物成反比。
在竞争性结合免疫测定中,样品中出现的DC蛋白与标记蛋白对竞争性地与特异性结合试剂结合,例如,抗体特异性地与DC蛋白反应。可以把结合试剂结合到固体表面以实现被结合标记蛋白与未被结合标记蛋白的分离。替代地,竞争性结合测定可以在液相中进行,大量本领域已知技术中的任意一种都可以用于被结合标记蛋白与未被结合标记蛋白的分离。分离之后,测定被结合标记蛋白的量。样品中出现的蛋白的量与标记的蛋白结合量成反比。
替代地,可以进行一种同源性免疫测定,其中不需分离的步骤。在这些免疫测定中,由于蛋白质与其特异性结合试剂的结合,该蛋白上的标记物发生变化。标记蛋白中的这种变化导致标记物发出信号的增强或减弱,从而在免疫测定结束时能够通过测量标记物来检测或定量蛋白质。
也可以使用多种非竞争性免疫测定方法对这些DC蛋白进行定量测定。例如,可以使用一种双位点、固相夹心免疫测定。在这种类型的测定方法中,把一种针对蛋白质的结合试剂,例如把抗体结合吸附到固体载体上。第二蛋白结合试剂也可以是抗体,能够结合到该蛋白质的另一个位点上,它也被标记。当所述蛋白的两个位点都被结合后,除去那些未被结合的标记结合试剂,测定结合到固体载体上的标记结合试剂的量。被结合的标记结合试剂的量与样品中的蛋白含量成正比。
也可以用Western印迹分析测定样品中DC蛋白的存在。进行电泳,例如,对怀疑含有该蛋白的样品。电泳分离蛋白质以后,把蛋白质转印到一种合适的固体载体上例如硝酸纤维素滤膜,用能与变性后的蛋白反应的抗体温育该固体载体。这种抗体可以被标记,或者替代地通过随后用经过标记的、能与这种第一抗体结合的第二抗体温育来实现检测。
上述免疫测定模式使用标记测定成分。这种标记可以是多种形式的。可以根据本领域已知的方法,把标记物直接或间接偶联到测定的期望成分上。很多种的标记物都可以使用。可以从几种方法中选用一种来标记该组分。传统上使用的是包括3H、125I、35S、14C或32P的放射性标记物。非放射性标记物包括能够与标记抗体结合的配体、荧光物、化学发光试剂、酶以及以及能够作为标记蛋白的特异性结合配对成员的抗体。标记物的选择取决于以下因素所需的灵敏度、易与化合物连接、对稳定性的需求以及现有的仪器。关于可以使用的各种标记物或信号产生系统的综述,见美国专利US4391904,在此引入作为参考。
能与特定蛋白反应的抗体也能通过多种免疫测定方法来测量。用免疫测定技术测量抗体中使用的免疫或免疫测定方法,这方面的综述,见,例如,上述的Stites和terr(编著)基础和临床免疫学(第7版);上述的Maggio(编著)酶免疫分析;以及上述的Harlow和Lane(1989)抗体实验指南。
与上述内容类似,多种不同的免疫测定模式、分离技术以及标记物也能够用于特定蛋白的测量。VI.纯化的DC蛋白SEQ ID NO1和2提供的是灵长类,例如人,DCMP1的核苷酸序列及氨基酸序列。SEQ ID NO7和8提供的是啮齿类,例如小鼠,DCMP1的核苷酸序列及氨基酸序列。SEQ ID NO3和4提供的是灵长类,例如人,DCMP2的核苷酸序列及氨基酸序列。SEQ ID NO9和10描述的是另外一个突变体。SEQ ID NO5和6提供的是类似的灵长类肝脱唾液酸糖蛋白序列。这些肽链序列使得能够制备出用于生产识别这些节段的抗体的肽链,使得能够制备出编码这些序列的寡核苷酸。VII.物理突变体本发明还包括具有以下序列的蛋白质或多肽,即基本上与SEQ IDNO2或8的氨基酸序列或SEQ ID NO4或10的部分序列相似的氨基酸序列。还可以获得表现出如下数目残基被取代的突变体,例如,20或更少,优选10或更少,更优选5个或更少。当取代是保守性的取代时,这些突变体会具有相似的免疫原性或抗原性,或者能与相应的天然序列蛋白交叉反应。天然突变体包括包括单个的、多形态的、等位基因的、品系或种突变体。
通过优化残基配对,如果需要按需求导入间隙,测定氨基酸序列的相似性或序列的一致性。当把保守性取代看作配对时这就会发生变化。典型地,保守性取代包括在下列基团中的取代甘氨酸、丙氨酸,缬氨酸、异亮氨酸、亮氨酸,天冬氨酸、谷氨酸,天冬酰胺、谷氨酰胺,丝氨酸、苏氨酸,赖氨酸、精氨酸,以及苯丙氨酸、酪氨酸。同源氨基酸序列包括每个相应蛋白序列中的天然等位突变和种间突变。典型的同源蛋白或多肽与相关DC蛋白的氨基酸序列具有从50~100%的相似性(如果导入间隙),到75~100%的相似性(如果把保守性取代也包括在内)。一致性测量至少为约50%,通常至少60%,更通常至少65%,普遍至少70%,更普遍至少75%,优选至少80%,以及更优选至少,在特别优选的实施方案中,至少85%或更高。见,Needleham,etal.(1970)分子生物学杂志48443-453;Sankoff,et al.(1983)Time Warps,String Edits,and MacromoleculesThe Theoryand Practice of Sequence Comparison第一章,Assison-Wesley,Reading,MA;以及出自IntelliGenetics的软件包,Mountain View,CA;以及the University of Wisconin Genetics Computer Group(GCG),Madison,WI。
为了进行序列比较,典型地把一个序列作为参考序列,而用测试序列与它比较。当使用序列比较算法时,把测试序列和参考序列输入到电脑中,指定序列整理,如果需要,设定序列算法的程序参数。然后,根据设定的程序参数,用序列比较算法计算出测试序列相对于参考序列一致性的百分比。
利用下列方法可以在序列比较中进行视觉调准,例如,利用Smith和Waterman(1981)Adv.Appl.Math.2482中的局部同源性对比,利用Needlman和Wunsch(1970)分子生物学杂志48443中的同源性对比算法,利用Pearson和Lipman(1988)Proc.Natl.Acad.Sci.USA 852444中相似性方法的研究,用计算机执行这些算法(Wisconsin Genetics Software Package中的GAP,BESTFIT,FASTA和TFASTA,Genetics Computer Group,575 Science Dr.Madison,WI),或者利用目测检查(一般性的描述见上述Ausubel et al.)。
有用算法的一个实例是PILEUP,PILEUP能从一组相关序列中创建一种多序列对比,用连续、配对算法表明相互关系以及序列一致性的百分比。它也可以绘制成一种树或树形图,显示用于创建该算法的簇的相互关系。PILEUP使用的是Feng和Doolittle(1987)J.Mol.Evol.35351-360中的连续对比方法的简化形式。所使用的这种方法与Higgins和Sharp(1989)CABIOS 5151-153中描述的方法类似。这种程序能够对比多达300个序列,其中每个序列的最大长度可达5000核苷酸或氨基酸。多个序列对比方法从两个最相似的序列的配对对比开始,产生一个由两对比序列组成的簇。然后,把这个簇与下一个最相关的序列或由对比序列生成的簇进行对比。利用两个单个序列配对对比的简单延伸,就可以对两簇序列进行对比。通过一系列连续、配对对比实现最终序列对比。通过指定特定序列以及它们的氨基酸或核苷酸在在序列比较区域的配对以及通过指定程序参数,可以运行该程序。例如,可以用一个参考序列与其他测试序列进行比较用下列参数来测定序列一致性的百分比默认的间隙权重(3.00),默认的间隙长度权重(0.10)和加权的末端间隙。
适合于测定序列一致性百分比及序列相似性的算法的另一个实例是BLAST算法,该算法描述见Altschul,et al.(1990)分子生物学杂志215403-410。用于运行BLAST分析的软件可以从国家生物技术信息中心公开获得(httpwww.ncbi.nih.gov/)。这种算法包括首先通过查出查询序列中长度W的短序列单元来鉴定高分值序列对(HSPs),这些序列单元在与数据库序列中的等长序列单元对比时应符合或满足阳性价值的阈分值T。T被认为是相邻序列单元分值阈(上面已引述的Altschul,et al.)。把这些起始相邻序列单元样作为种序列启动发现含有它们的较长HSPs。只要积累的配对分值能够不同增大,就可以将序列单元样沿每个序列向两个方向扩展。当发生下列情况时这些序列单元样的扩展会终止配对的积累分值从从所能实现的最大分值降为定量X后;由于一个或多个阴性-分值的残基对比的积累,所述积累分值达到0或0以下;其中一个序列的末端已经到达。BLAST算法的参数W、T和X决定对齐的敏感度和速度。BLAST程序把序列单元长11作为默认值,BLOSUM分值矩阵(见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 8910915)校准值(B)50,期望值10,M=5,N=4以及双链比较。
除计算序列一致性的百分比外,BLAST算法还进行了两序列之间相似性的统计学分析(见,例如,Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 905873-5787)。BLAST算法提供的一个相似性测量值为最小加和概率(sum probability)(P(N)),这个值指示两个核苷酸或氨基酸序列之间偶然发生配对的概率。例如,如果当测试核酸与参考核酸比较时最小加和概率的值小于约0.1,就认为该核酸序列与参考序列相似,更优选最小加和概率的值小于约0.01,最优选小于0.001。
如下所述,两个多肽的核酸序列基本相似的进一步的指示是,第一个核酸编码的多肽与第二个核酸编码的多肽之间能发生免疫学交叉反应。因此,例如,如果这两个多肽的区别仅在于保守性取代上,那么典型地一个多肽与另一个多肽基本相同。如下所述,两个核酸序列基本相同的另一个指示是这两个分子在严紧性条件能够相互杂交。
典型地,编码相应哺乳动物DC蛋白的核酸能在严紧性的条件下与SEQ ID NO1或7或者SEQ ID NO3的适当部分杂交。例如,典型地编码相应DC蛋白的核酸在严紧性条件下能与SEQ ID NO1、7、3或9杂交,只要很少有假阳性杂交信号。通常,严紧性条件为在特定离子强度和pH下选择比被杂交序列的解链温度(Tm)低10℃的温度。所述的Tm是当目标序列的50%与优选匹配的探针杂交时的温度。典型地,严紧性条件是这样的pH7的情况下洗涤液中的盐离子浓度为约0.02摩尔,温度至少约50℃。其他显著影响杂交严紧程度的因素包括,尤其为,碱基组成及互补链的大小,是否加入甲酰胺等有机溶剂,以及碱基错配程度。一个优选实施方案要包括能与公开序列在42℃以及含有50%甲酰胺和20~50mM NaCl的条件下杂交的核酸。严紧性条件下的杂交应该给定一种至少是普通背景两倍的背景,优选至少3~5倍或更高。
通过核苷酸取代、核苷酸缺失、核苷酸插入以及核苷酸延伸倒位,可以容易地对分离DC基因DNA进行修饰。这些修饰会导致新的DNA序列,这些新的序列编码这些DC抗原、它们的衍生物或具有高度相似物理学、免疫学或抗原活性的蛋白质。
经过修饰的序列能够用于生产突变体抗原或提高表达。提高后的表达包括基因扩增、增强转录、增强翻译以及其他机制。这些突变的DC蛋白衍生物包括相应蛋白或其片段的预定突变体或点特异性突变体。“突变的DC蛋白”包括符合以下条件的多肽除由于缺失、取代或插入导致其具有与天然发现DC蛋白不同的氨基酸序列外,其他方面都落入上述建立的DC蛋白同源性定义之内。特别是,通常“点特异性突变DC蛋白”包括具有与SEQ ID NO2或8所示蛋白明显类似的序列的蛋白质。通常,突变体具有许多与那些原来的序列相同的理化特性和生物学特性,例如抗原性或免疫原性,优选实施方案中包括了公开序列中的大部分或全部。类似的概念可以应用于这些不同的DC蛋白,尤其是在各种温血动物中发现的那些概念,例如灵长类和哺乳类动物。
尽管位点特异性突变位点是预定的,突变体不需要是位点特异性的。通过制备氨基酸插入或缺失进行DC蛋白诱变。可以制造取代、缺失、插入或其任意组合达到最终结构。插入包括氨基末端或羧基末端融合。在目标密码子上进行随机诱变,然后从表达突变体中筛选期望活性。在序列已知的DNA中的预定位点上制备取代突变的方法是本领域技术人员众所周知的,例如,通过M13引物诱变或聚合酶链反应(PCR)技术。参见,Sambrook,et al.(1989)以及Ausubel,et al.(1987及增补)。正常情况下,DNA中的突变不应该把编码序列置于阅读框之外,优选不会制造出能够杂交生成环或发夹等次级mRNA结构的互补性区域。
本发明还提供了重组蛋白,例如用来自这些蛋白的节段制备的异源融合蛋白。一种异源融合蛋白是天然状态下正常情况不会以同样方式融合的蛋白或节段的融合体。因此,免疫球蛋白与相应DC多肽形成的融合产物是一种连续蛋白分子,该分子具有融合到典型肽链接头中的序列,典型地制备成一种单个的翻译产物,该产物表现出来自每个肽链来源的特性。一种类似的概念可以应用于异源核酸序列。
此外,也可以把来自其他蛋白质的类似的功能性结构域结合起来制备出新的结构。例如,可以在不同的新的融合多肽或片段之间,“交换”结构域或其他节段,典型地在相关蛋白之间,例如在凝集素或脱唾液酸糖蛋白家族内。优选地,使用完成的结构性结构域,例如完整的Ig部分。见,例如,Cuuningham,et al.(1989)Science 2431330-1336;以及O’Dowd,et al.(1988)J.Biol.Chem.26315985-15992。因此,表现出新的特异性组合的新型嵌合多肽会因蛋白结合特性与其他功能性结构域之间的功能性连接而产生。另外,还可以使用丙氨酸筛选诱变,优选对不参与形成二级结构的残基进行诱变,以避免大部分通常会破坏三级结构的关键残基。
这些DC蛋白的“衍生物”包括氨基酸序列突变体、糖基化突变体以及与其他化学单元形成的共价或聚集共轭物。利用本领域众所周知的方法,把这些DC蛋白氨基酸侧链或者N-或C-末端发现的基团功能性连接起来制备共价衍生物。这些衍生物可以包括,但不限于,羧基末端的脂肪族酯或酰胺,或含有羧基侧链的残基,含羟基基团残基的O-酰基衍生物,例如赖氨酸或精氨酸。酰基基团选自包括C3~C18正常烷基的烷基-单元的基团,从而形成烷酰基芳酰基种类。当免疫原性单元是半抗原时,与载体蛋白的共价连接可能是重要的。
特别是,把糖基化变化包括在内,例如在多肽的合成及处理的过程中,或在进一步的处理步骤中通过改变多肽的糖基化形式来制备。完成该过程特别优选的方法是把多肽暴露于糖基化酶,该糖基化酶来自正常情况能提供这种处理的细胞,例如哺乳动物糖基化酶。还提供了去糖基化酶。另外还包括与同一初始氨基酸序列之间只有其他较小变化的型式,包括磷酸化氨基酸残基,例如磷酸酪氨酸、磷酸丝氨酸或磷酸苏氨酸,或其他单元,包括核糖基基团或交叉-连接试剂。另外,还包括含有取代的蛋白质,该蛋白应该保留有基本的免疫原性,能够生产出识别SEQ ID NO2、4、8或8的蛋白的抗体。典型地,相对于公开序列这些蛋白含有少于20个残基的取代,更典型地少于10个残基的取代,优选少于5个,更优选少于3个。替代地,蛋白以结构性的结构域开始和结尾,通常保留了抗原性和交叉免疫原性。
一组主要的衍生物是DC蛋白或其片段与其他蛋白或多肽的共价其轭物。这些衍生物可以用N-或C-末端融合等重组培养的方法合成,或利用本领域已知的试剂通过反应性的侧链基团把蛋白质交叉连接。优选使用交叉-连接的蛋白衍生物位点是游离氨基、糖单元以及半胱氨酸残基。
还提供了这些DC蛋白与其他同源或异源蛋白之间融合而成的多肽。异源多肽可以是不同的表面标记之间的融合,导致例如一种杂合蛋白。同样,也可以构建异源融合,使其表现出衍生蛋白特性或活性的结合。典型的实例是荧光素酶等报道多肽与蛋白质的节段或结构域,例如与受体结合节段之间的融合,从而使得能够容易地测定出融合蛋白的存在或位置。见,例如,Dull等人的美国专利US4859609。其他的基因融合伴侣包括细菌的β-半乳糖苷酶、trpE、蛋白A、β-内酰胺酶、α淀粉酶、乙醇脱氢酶以及酵母α交配因子。见,例如,Godowski,et al.(1988)Science 241812-816。
这些多肽还可以具有经过了下列化学修饰的氨基酸残基磷酸化、磺化、生物素化,或者添加或除去其他单元,尤其是那些分子形状与磷酸基团类似的单元。在一些实施方案中,所述的修饰是有用的标记试剂,或能够作为纯化的目标,例如亲和配体。
本发明还提供了除氨基酸序列或糖基化突变体之外的DC蛋白衍生物的用途。这些衍生物可以包括与化学单元的共价或聚集连接。这些衍生物通常分为以下3类(1)盐,(2)侧链或末端残基的共价修饰,以及(3)吸附复合物,例如与细胞膜。这些共价或聚集衍生物可以作为免疫原,免疫测定中的试剂或者用于纯化方法例如作为亲和纯化的配体或其他结合配体。例如,通过本领域众所周知的方法,可以共价形式将DC蛋白固定连接到溴化氰活化后的琼脂糖凝胶(Sepharose)上,或吸附到用或不用戊二醛交叉连接的聚烯烃表面,用于抗DC蛋白抗体的测定或纯化。也可以用可检测基团对所述DC进行标记,例如通过氯胺T方法用放射性碘标记,以共价形式结合到稀土螯合物上,或共轭连接到另一种荧光单元用于诊断实验。这些DC蛋白的纯化会受到固定化了的抗体的影响。
分离的DC蛋白基因使得可以对那些不表达相应DC蛋白的细胞进行转化,例如对不同种类或不含相应DC蛋白并表现阴性背景活性的细胞进行转化。转化基因的表达使得能够进行抗原纯化细胞系的分离,用特定的或单一种类突变体。这种方法能提供更敏感的检测,而且可以消除这些DC蛋白的生理学影响。亚细胞组分,例如细胞质或胞膜组分,也能够被分离和使用。VIII.结合因子DC蛋白复合物用免疫测定实验对一种DC蛋白进行测定,该DC蛋白能与一种用特定免疫原制备的抗体之间特异性地结合或发生特异性的免疫反应,例如具有SEQ ID NO2、4、8或10的氨基酸序列的免疫原。所述的免疫测定实验使用一种用SEQ ID NO2、4、8或10蛋白制备的多克隆抗血清。这种抗血清选择与相关家族其他成员具有低的交叉反应性,并且任意这样一种交叉反应性能够通过在用于免疫测定之前的免疫吸附除去。
为了生产用于免疫测定的抗血清,按照本发明的描述分离SEQ IDNO2、4、8或10的蛋白。例如,用哺乳动物细胞系生产重组蛋白。使用弗氏完全佐剂等一般佐剂以及标准的小鼠免疫方法(见上述的Harlow和Lane)。替代地,可以用一种从本发明公开的序列衍生而来并偶联于载体蛋白上的合成多肽作为免疫原。收集多克隆血清,并用免疫测定实验测定其抗免疫原的滴度,例如,一种将免疫原被固定在固相载体上的固相免疫测定。利用竞争性结合免疫测定,例如上述文献Harlow和Lane第570-573页描述的方法,选取滴度为104或以上的多克隆抗血清,测定其与其他相关蛋白的交叉反应性。优选将两种不同的相关蛋白用到这种测定中同给定的DC蛋白偶联。例如,同凝集素蛋白,至少习惯上将两个其他的家族成员吸附除去相同的表位。在同DCMP1家族成员偶联时,使用该家族的两个其他成员。可以重组蛋白的形式生产这些其他的家族成员,并按照本发明描述用普通的分子生物学及蛋白质化学技术对其进行分离。
竞争性结合模式的免疫测定可以用于交叉反应测定。例如,可以将SEQ ID NO2或8的蛋白固定在固相载体上。添加到测定中的蛋白与固定抗原之间展开了结合抗体的竞争。将上述蛋白的与固定抗原竞争结合抗体的能力同SEQ ID NO2或8的蛋白进行比较。用一般计算方法计算上述蛋白交叉反应的百分比。选取并合并符合下列条件的抗血清,即与上面列出的每个蛋白之间交叉反应的百分比低于10%。然后,利用上面列出的蛋白通过免疫吸附从合并的抗血清中除去交叉反应抗体。
然后按照上述方法,将经过免疫吸附且合并后的抗血清用于竞争性结合免疫测定中比较第二种蛋白同免疫原蛋白(例如,SEQ ID NO2或8的蛋白)。为了实现这种比较,将这两种蛋白都在宽的浓度范围内单独测定,测定出每种蛋白在抑制抗血清与固定化蛋白之间50%的结合时所需的量。如果第二种蛋白的这个量比SEQ ID NO2或8蛋白小2倍,那么就认为所述的第二种蛋白同用免疫原生产的抗体之间是特异性的结合。
可以理解到的是DC蛋白可能是一个同源蛋白家族,其中包括2个或更多个基因。对于一种特定的基因产物,例如人Ig家族成员蛋白,本发明不仅包括了如本发明公开的氨基酸序列,而且还提供了等位突变体、多形态突变体、非等位突变体或种突变体蛋白。还可以理解到的是“人DC蛋白”一词包括利用下列手段导入的非天然突变利用单一位点突变等传统重组技术进行的精确突变,或者切除编码这些蛋白的DNA的一小部分或来自该基因的剪接突变体,或者取代或添加少量新的氨基酸。这些小改变必须是在基本保留原始分子的免疫一致性和/或其生物活性的前提下进行。因此,这些改变包括与指定的天然生成的相应DC蛋白之间发生特异性免疫反应的蛋白,例如,具有SEQID NO4序列的人DC蛋白。如上所述就每个蛋白家族的整体而言,被认为是小改变的特定蛋白修饰要包括具有类似化学特性的氨基酸保守性取代。通过将一种蛋白与SEQ ID NO2或8的蛋白进行最优对比,并且利用本发明描述的传统免疫测定法,能够测定出本发明的蛋白组合物。IX.用途本发明提供了能够用于本发明其他部分描述的诊断用途的试剂,例如,关于发育异常的概述中,或者下面的关于用于诊断的试剂盒的描述中。特别地,所述基因能够用作标记区分细胞类型,包括细胞的基因组方面,以及mRNA及蛋白质的表达模式。
DC基因,例如DNA或RNA可以用作法医化验中的组分。例如,提供的核苷酸序列可以用32P或生物素等标记,并能够作为探针用于一般的限制性片段多肽性印迹实验中,只要可测量的特性有助于个体间的区分。这些探针可以用于基因指纹图谱等众所周知的法医技术中。此外,从DC序列制备成的核苷酸探针还可以用于原位杂交实验探测染色体异常。
针对DC蛋白的抗体或其他结合因子可以用于纯化相应的DC蛋白分子。如下面实施例中所述,DC蛋白的抗体纯化是可能而且是可行的。抗体或其他结合因子也可以用于诊断方式,用本发明描述的众所周知的技术测定是否有DC成分出现在组织样品或细胞群体中。把结合因子连接到DC蛋白上的性能为诊断与表达错误调节有关的紊乱。抗体和其他DC蛋白结合因子还可以用作组织学或法医学标记。
如下面实施例中所述,所有这些蛋白的表达都限于特定组织类型。通过控制一种探针,例如针对相应DC蛋白的抗体或核酸,能够用该探针在原位或体外区分组织及细胞的类型。
本发明还提供了具有重要治疗价值的药物。DC蛋白(天然生成或重组)、其片段、其所对应的抗体、连同被鉴定为对DC蛋白具有结合亲和力的蛋白,它们都可以用于治疗与异常生理或异常发育有关的疾病,包括异常增殖,例如癌症或退行性疾病。异常增殖、再生、退化以及萎缩都可以通过本发明提供的组合物医治而得到调节。例如,与DC蛋白的异常表达或异常信号有关的疾病或紊乱就是所述蛋白的激动剂或接抗剂的目标,例如抗原提呈细胞出现疾病或紊乱的情况。所述蛋白可能在淋巴细胞等造血细胞的调节和发育过程中发挥作用,这些造血细胞影响免疫反应,例如抗原提呈以及因此产生的效应器功能。
利用Northern印迹分析可以得知被证明能够处理DC蛋白mRNA的细胞类型中的其他异常发育病症。见Berkow(编著)The MerckManual of Diagnosis and Therapy,Merck & Co.,Rahway,NJ;以及Thorn,et al.Harrison’s Principles of Internal Medicine,McGraw-hill,NY。发育或功能异常,例如免疫系统的发育或功能异常导致严重的医学异常及疾病,这些异常及疾病利用本发明提供的组合物能够得到有效的预防和治疗。
重组DC蛋白或抗体可以纯化后施用给患者。可以将这些药物与另外的活性或惰性成分联合用于治疗,例如,与常规的药学可接受载体或稀释剂,例如免疫佐剂,连同生理上无毒的稳定剂及赋形剂。特别地,这些药物可以用于疫苗领域,所述抗原与这些治疗型式的激动剂或拮抗剂中的一种结合在一起。这些结合物经过过滤除菌,按单位剂量分装,置于单位剂量管瓶中冻干保存或以稳定化了的水溶液制剂的形式保存。本发明还提供了抗体或其结合片段,包括非互补结合的形式。
使用抗体或受体或其片段进行筛选能够鉴定出对这些DC蛋白具有结合亲和力的化合物,包括相关化合物的分离。然后利用随后的生物学分析测定该化合物是否具有内在的刺激活性,并因其能阻断所述蛋白的活性而可以作为一种阻断剂或拮抗剂。同样,具有内在刺激活性的化合物可以通过所述蛋白活化细胞,并因其能刺激细胞而可作为一种激动剂。本发明进一步还提供了作为所述蛋白的拮抗剂的抗体的用途。
有效治疗所需的药物量取决于许多不同的因素,包括给药方法、目标位点、患者的生理状态以及服用的其他药物。因此,应当精确地滴定治疗剂量,使安全性和有效性都达到最佳。典型地,体外使用剂量能够为原位使用这些药物时的用量提供有用的指导。治疗特定疾病有效剂量的动物实验为确定人用剂量提供了进一步的预见性指导。各种考虑在文献中已有描述,例如,Gilman,et al.(编著)(1990)Goodman and Gilman’sThe Pharmacological Bases ofTherapeutics(第8版)Pergamon Press;以及(1990)Remington’S Pharmaceutical Science(第17版)Mack Publishing Co.,Easton,PA。其中讨论的给药方法如下,例如口服、静脉注射、腹膜内注射或肌内注射,经皮扩散以及其他方式。药学上可接受的载体包括水、盐水、缓冲液,以及例如the Merck Index,Merck & Co.,Rahway,NJ中描述的其他化合物,。剂量范围一般期望低于1mM的浓度,典型地低于约10μM,通常低于约100nM,优选低于约10pM(皮摩尔),以及最优选低于约1fM(飞摩尔),与适当载体结合。常常将缓释制剂或缓释装置用于持续给药。
DC蛋白、DC蛋白片段、抗DC蛋白和DC蛋白片段的抗体、拮抗剂以及激动剂都可以直接施用给被治疗的宿主,或者依据这些化合物的大小,可以按照需要在施用之前将它们偶联到卵白蛋白或血清白蛋白等载体蛋白上。治疗用制剂可以采用多种传统剂型给药。尽管所述的活性组分可以单独给药,但是优选将其制备成药用制剂。制剂典型地包括至少一种如上所述的活性成分,连同一种或多种能够为活性组分接受的载体。每种载体都应该是在制药学和生理学两方面均可接受的,也就是说能与其他成分相容并且不会伤害患者。制剂包括那些适于口服、直肠用、滴鼻或胃肠道外(包括皮下、肌内、静脉内以及皮内)给药的形式。该制剂可方便地以单位剂量的形式提供,可以采用任意一种制药领域中熟知的方法制备。见,例如,Gilman,et al.(编著)(1990)Goodman and Gilman’sthe Pharmacological Bases ofTherapeutics(第8版)Pergamon Press;以及(1990)Remington’S Pharmaceutical Science(第17版)Mack Publishing Co.,Easton,PA;avis,et al.(编著)(1993)药物的制剂形式胃肠道外药物Dekker,NY;Lieberman,et al.(编著)(1990)药物的制剂形式片剂Dekker,NY;以及Lieberman,et al.(编著)(1990)药物的制剂形式分散系统Dekker,NY。可以将本发明的治疗方法与其他化疗药物或化学预防药物联合或者结合使用。
本发明的DC蛋白的天然生成形式和重组形式都可以具体地应用于试剂盒及测定方法中,而用这些试剂盒及测定方法能够筛选出对所述蛋白具有亲和活性的化合物。近年来发展的几种自动测定方法使得能够在短时间内对几万个化合物进行筛选。见,例如,Fodor,et al.(1991)Science 251767-773,以及其他有关化学多样性文库(chemical diversity libraries)的文献,这些文献中描述了用于测试大量化合物结合亲和力的方法。本发明所提供的纯化DC蛋白,例如可溶型式,可以大量地获得,这极大地促进了合适的测定方法的发展。
例如,一旦所述蛋白的结构决定了,那么就能够发现拮抗剂。由于高度自动化方法的发展,使得利用一种纯化蛋白就能对潜在的蛋白类似物进行测试。特别地,利用本发明描述的方法会发现新的激动剂和拮抗剂。发现的这类化合物是特别重要的,它们对相关细胞表面抗原具有联合的结合亲和力,例如,能够作为DC蛋白种突变体的拮抗剂的化合物。
特别地,通过将重组DC蛋白用于多种筛选技术,本发明可以用于筛选化合物。利用重组蛋白筛选特定配体具有以下优点(a)增加了来自特定来源的蛋白的可更新来源;(b)由于测定中信噪比更优,因而潜在地增加了每个细胞中的抗原数目;(c)种突变体特异性(理论上给出了更强的生物及疾病特异性)。
一种药物筛选方法可以使用具有如下特性的真核或原核宿主细胞,即能够稳定地接受重组DNA分子的转化表达DC蛋白。将所述蛋白脱离其他蛋白单独表达的细胞可以被分离。这类细胞以活细胞或固定化的形式存在,能够用于一般的表面蛋白测定。参见,Parce,et al.(1989)Science 246243-247;以及Owicki,et al.(1990)Proc.Natl.Acad.Sci.USA 874007-4011,这些文献中描述了用于检测细胞效应的敏感方法。当所述细胞(DC蛋白的来源)与一种针对所述抗原具有已知结合亲和力的抗体接触,或该抗体转化的情况下,例如125I-抗体,要测量一种试样针对该结合组合物的结合亲和力时,一种竞争性测定实验特别有效。然后分离结合态及游离态的标记结合组合物,测定蛋白的结合程度。试样的结合量与标记抗体对已知来源的结合量成反比。许多技术能够用来把结合态的试剂同游离态试剂分开,测定结合程度。典型地,这种分离步骤包括以下方法中的一种吸附到滤器上然后洗涤,吸附到塑料上然后洗涤,或者离心细胞膜。也可以将活细胞用于筛选药物对DC蛋白间接功能的影响,例如抗原提呈或辅助功能。
如同DC蛋白来源,另一种方法使用了来自转化后的真核或原核细胞的细胞膜。这些细胞可以稳定地被DNA载体转化,指导适当蛋白的表达,例如,一种构建的膜结合形式。基本上,这种膜是从所述细胞制备而来的,可以用于结合测定,例如上述竞争性测定。
还有一种方法使用的是来自转化后的真核或原核宿主细胞的溶解的、未纯化蛋白或溶解的、已纯化蛋白。特异性的增强、自动化的实现以及药物测试中处理量的变大,这些优势使得能够进行一种“分子”结合测定。
用于药物筛选的另一种技术包括一种能够为以下过程提供高处理量的方法筛选针对相应DC蛋白具有合适结合亲和力的化合物,有关这种方法的详细描述见,1984年9月13日公开的geysen的欧洲专利申请84/03564。首先,在固相底物上合成大量的不同小肽测试化合物,例如在塑料插脚(pins)或其他一些合适表面上,见,上述文献Fodor et al。然后让所有上述插脚与溶解的、未纯化或溶解的、已纯化DC蛋白反应,并洗涤。下一步骤包括检测结合后的反应试剂,例如抗体。
用于测定哪些位点对特定的其他蛋白有影响的一种方法是物理结构分析法,例如,X-射线晶体学或2维核磁共振技术。这些技术为确定哪些氨基酸残基参与形成分子接触区域提供了指导。关于蛋白结构分析的详细描述见,例如,Blundell和Johnson(1976)ProteinCrystallography Academic Press,NY。X.试剂盒本发明还提供了把这些DC蛋白、其片段、肽链以及它们的融合产物用于多种诊断试剂盒和检测DC蛋白或信号是否存在的方法中的用途。典型地,所述试剂盒中具有一个小室,其中装有一种特定DC肽链或基因节段或能够识别这二者之一的试剂,例如抗体。
用于测定一种测试化合物对于相应DC蛋白的结合亲和力的试剂盒,典型地包括一种测试化合物、一种标记化合物(例如对于所述蛋白的结合亲和力已知的抗体)、一种来源的DC蛋白(天然生成或重组的)以及一种将标记化合物的结合态同游离态分开的方法(例如一种用于固定DC蛋白的固相方法)。一旦化合物筛选完毕,那么就可以用本领域熟知的合适的生物测定方法对那些对于所述蛋白具有合适结合亲和力的化合物进行评估,测定这些化合物是否能够作为调节DC蛋白功能的激动剂或拮抗剂。重组DC多肽的获得也为这些测定方法的标准化很好地提供了特定的标准。
用于测定试样中DC蛋白浓度的优选试剂盒,典型地包括一种对于所述DC蛋白的结合亲和力已知的标记化合物(例如抗体)、一种来源的DC蛋白(天然生成或重组)以及一种将标记化合物的结合态同游离态分开的方法(例如一种用于固定DC蛋白的固相方法)。通常还会提供内装时试剂和说明书的小室。
对于相应DC蛋白或其片段具有特异性的抗体(包括抗原结合片段)可以用于诊断,检测所述蛋白和/或其片段水平是否升高。这类诊断测定可以使用溶胞产物、活细胞、固定化了的细胞、免疫荧光物质、细胞培养物、体液,以及进一步还可以涉及血清中抗原的检测等。诊断测定可以是同源性的(在游离试剂和抗原-DC蛋白复合物之间无分离步骤),或者也可以是异源性的(有分离步骤)。各种商品化测定方法的出现,例如放射免疫测定(RIA)、酶联免疫吸附测定(ELISA)、酶免疫测定(EIA)、多酶(enzyme-multiplied)免疫测定技术(EMIT)、底物标记荧光免疫测定(SLFIA)等。例如,当使用一种第二抗体,并且它能够识别抗DC蛋白或其特定片段的抗体,这种情况下就可以使用未标记的第一抗体。类似测定也已在文献中做了广泛的讨论。见,例如,Harlow和Lane(1989)抗体实验指南CSH press,NY;Chan(编著)(1987)免疫测定操作指南Academic Press,Orlando,FL;Price和Newman(编著)(1991)免疫测定的理论及实践Stockton Press,NY;以及Ngo(编著)(1988)Non-Isotopic Immunoassays Plenum Press,NY。特别地,这些试剂可以用于诊断生物样品中的DC群体,检测样品中DC蛋白的过量或不足。这些测定可以用于指导活组织的组织学分析或血样或组织样品中DC数目的评估。
抗独特型抗体可以类似地用于诊断抗DC蛋白抗体的存在,同样地可以诊断各种异常状态。例如,DC蛋白的过量可能导致各种免疫反应,这些免疫反应可能是异常生理状态的症状,特别是癌症或异常分化等细胞增殖的疾病的症状。
通常,用于诊断的试剂是以试剂盒的形式提供的,这样可以使测定的灵敏度达到最佳。对于本发明来说,根据测定实验、操作方法以及标记物实质的不同,提供了标记或未标记的抗体或受体,或提供了标记的DC蛋白。上述所提供的物质通常结合有其他附加物,例如缓冲液、稳定剂、产生信号所需的物质(例如就酶而言所需的底物)等。优选地,该试剂盒还包括介绍如何正确使用及各成分使用后的处理的说明书。理想地,这些试剂以冻干粉末装形式提供,这种情况下,只要试剂的浓度适合测定实验的使用,所述试剂可以重新配制到含水介质中。上述的药物筛选及诊断测定中的许多组分可以不经修饰直接使用,也可以用多种方法修饰后使用。例如,将一种可直接或间接提供一种可检测信号的单元以共价或非共价形式连接上去,标记就可告完成。能够用于直接标记的基团包括125I等放射性标记物,过氧化物酶和碱性磷酸酶等酶(见美国专利US3645090)以及能够监测荧光强度变化、波长偏移、或荧光偏振的荧光标记物。用于间接标记的方法包括把一种成分生物素化,然后让其与偶联到上述一种标记基团上的抗生物素蛋白结合。
能够将蛋白质的结合态同游离态分开或者替代地将测试化合物结合态同游离态分开的方法还有许多种。可以将所述DC蛋白固定于各种基质上,然后洗涤。合适的基质包括,ELISA板等塑料、滤纸以及玻璃珠等。把DC蛋白固定到基质上的方法包括,但不限于,直接吸附到塑料上,使用捕获抗体,化学偶联以及生物素-抗生物素蛋白。这种方法中的最后一步涉及用以下方法中的一种沉淀蛋白/抗体复合物,这些方法包括例如利用聚乙二醇等有机溶剂或硫酸铵等盐。其他合适的分离技术包括,但不限于,Rattle,et al.(1984)Clin.Chem.301457-1461中描述的荧光抗体可磁化颗粒法,以及美国专利US4659678中描述的双抗体磁化颗粒分离法。
将蛋白质或其片段与各种标记物连接的方法在文献中已有广泛的描述,此处无需再做详细讨论。许多技术涉及使用通过碳化二亚胺或活性酯活化后的羧基来形成肽键,或者通过让巯基与氯乙酰等活化半抗原或与马来酰亚胺等活化烯烃进行连接反应生成硫醚,或者其他方法。融合蛋白也可以用于这些技术中。
本发明的另一个诊断方面包括使用来自相应DC蛋白的寡核苷酸或聚核苷酸序列。可以用这些序列作为探针检测来自怀疑患有癌症或免疫系统出现问题等病症的患者的样品中的信号水平。RNA或DNA核苷酸序列的制备、该序列的标记以及该序列的优选大小,这几方面在本发明中已做了充分描述和讨论。正常情况下,寡核苷酸探针应该包括至少约14个核苷酸,通常为至少18个核苷酸,聚核苷酸探针可以达到几千个核苷酸。各种标记物都可以使用,最常用的是放射性核素,尤其是32P。然而,也可以使用其他技术,例如将生物素修饰的核苷酸导入聚核苷酸中。然后,该生物素作为位点结合抗生物素蛋白或抗体,而这些抗生物素蛋白或抗体可以很多种标记物标记,例如放射性核素、荧光团、酶等。替代地,可以使用能够识别下列双链结构的抗体DNA双链、RNA双链、DNA-RNA杂合双链或DNA-蛋白双链。反过来,也可以标记抗体,进行测定时把双链结构结合到表面上,以便当双链在表面上形成时,结合到双链结构上的抗体能够得以检测。使用任意一种常规技术都可以把探针用于新的反义RNA上,例如核酸杂交、加法及减法筛选、重组探针、杂合体释放翻译(HRT)、以及杂合体锁定(arrested)翻译(HART)。这还包括聚合酶链反应(PCR)等扩增技术。
本发明还提供了也可用于定性或定量检测其它标记的诊断试剂盒。依靠作为标记的多种指标的组合可以进行诊断和预后。因此,试剂盒可以检测多个标记的组合。参见例如Viallet等(1989)Progressin Growth Factor Res.189-97。XI.结合配偶体的分离由于已经分离到了特定相互作用结合物的一个成员,所以用现有方法就可以分离出相对的另一成员。参见,Gearing等(1989)EMB0 J.83667-3676。例如,不干扰其与受体的结合而标记DC表面蛋白方法。例如,可以把亲和标记物融入配体的氨基或羧基端。可以从表达文库筛选出同DC蛋白特异结合的克隆,例如用细胞分捡或其它筛选方法来检测表达这样结合成分的亚群。参见,例如,Ho等(1993)Proc.Natl.Acad.Sci.USA 9011267-11271。替代地,可以使用淘选方法。参见例如Seed和Aruffo等(1987)Proc.Natl.Acad.Sci.USA843365-3369。也可以使用双杂交筛选体系制备出具有已知DC蛋白序列的合适构建体。参见,例如,Fields和Song(1989)Nature 340254-246。
标记的蛋白交联技术可用于分离DC蛋白的结合配偶物。这样可以鉴定出同合适DC蛋白相互特异作用的蛋白。
参见下列实施例可以对本发明的广泛的范围有最好的理解,这些实施例并非是要把本发明限定到特定的实施方案。
实施例I.一般方法下述的许多标准方法描述在或引自,例如Maniatis等(1982)(编著)分子克隆实验手册,Cold Spring Harbor Laboratory,Cold SpringHarbor Press,纽约;Sambrook等1989年所著分子克隆实验手册(第二版)1-3卷,CSH出版社,纽约;Ausubel,生物学,Greene出版协会,Brooklyn,纽约;或Ausubel等(1987年及增补)(编著)CurrentProtocols In Molecular Biology,Wiley/Greene,纽约;Innis等(1990)(编著)PCR ProtocolsA Guide to Methods andApplications,Academic出版社,纽约。
蛋白纯化的方法包括如硫酸胺沉淀、柱层析、电泳、离心和结晶以及其它方法,参见,例如,Ausubel等(1987年和定期增补);Deutscher(1990)酶学方法182卷“蛋白纯化指南”及该系列中的其他章节;Coligan等(1996年和定期增补)Current Protocols inProtein Sciences Wiley/Greene,纽约;以及厂商关于蛋白纯化产品的使用说明,例如,Pharmacia、Piscataway、NJ或Bio-Rad、Richmond、CA。和重组技术的结合可以使之同合适的片段融合,例如同FLAG序列或可以经蛋白酶去除的等同序列。参见如Hochuli(1989)Chemische Industrie 1269-70;Hochuli(1990)在Setlow(编著)的遗传工程和原理和方法中1287-98的“用金属螯合吸附纯化重组蛋白”,Plenum出版社,纽约;和Crowe等1992年QIAexpress高水平表达及蛋白纯化系统QUIAGEN,Inc.,Chatsworth,CA。
测定免疫学功能的方法的描述见,如Coligan等(1992年和定期增补)现代免疫学方法Wiley/Greene,纽约;也可参见如Paul(ed)(1993)基础免疫学(第三版)Raven出版社,纽约。FACS分析法的描述参见Melamed等(1990)流式细胞术和分迭Wiley-Liss,Inc.,纽约;Shapiro(1998)空中践流式细胞术Liss,纽约;和Robinson等(1993)流式细胞术手册Wiley-Liss,纽约。II.树突状细胞的获得人CD34+细胞的获得按以下方法。参见,例如,Caux等(1995)在Banchereau和Schmitt基础和临床免疫学中的树突状细胞1-5页,Plenum出版社,纽约。外周或脐带血细胞,有时选用CD34+细胞,培养在含有干细胞因子(SCF)、GM-CSF和TNF-α的无内毒素RPMI 1640培养基(Gibco,Grand Island,纽约),该培养基补充有10%(v/v)热灭活的胎牛血清(FBS;Flow Laboratories,Irvine,CA),10mMHEPES,2mM L-谷氨酰胺,5×105M 2-巯基乙醇和青霉素(100mg/ml)。该培养基称为完全培养基。
在25×75平方厘米的培养瓶(Corning,NY)中按2×104细胞/毫升接种CD34+细胞,用于扩增。在培养的第5和10天用含有新鲜GM-CSF和TNF-α的培养基平分培养细胞(细胞浓度为1×103细胞/毫升)来维持细胞合适的生长条件。在某些情况下,在大约第6天用FACS分拣表达CD1a的细胞。
在某些情况下,按常规在培养的第12天收集细胞,贴壁的细胞用5mM EDTA溶液处理回收。在另外的情形下,将细胞以5×106细胞/毫升悬浮在完全培养基中,并用1mg/ml 12-豆蔻酰13-乙酸佛波酯(PMA,Sigma)和100ng/ml离子霉素(Calbiochem,Lajolla,CA)处理合适的时间(如1或6小时)来激活CD1a+细胞。这些细胞继续扩增6天,提取RNA用于构建cDNA文库。III.RNA分离和文库构建总RNA的分离采用Chirgwin等(1987)在Biochem.185294-5299中所描述的异硫氰酸胍/氯化铯梯度离心法进行。
可替代地,用OLIGOTEX mRNA纯化试剂盒(QIAGEN)分离mRNA。双链cDNA的合成使用,例如用于cDNA合成和质粒克隆的SUPERSCRIPT质粒系统(Gibco BRL,Gaithersburg,MD)。将得到的双链cDNA单向克隆入载体,如pSport1,然后用电穿孔方法转染入ELECTROMAXDH10BTM细胞(Gibco BRL,Gaithersburg,MD)。IV.测序用随机挑选的克隆或经过与未激活细胞减法杂交的克隆提取DNA,用标准的方法进行核苷酸序列分析。可以使用Taq DiDeoxyTerminator cycle测序试剂盒(Applied Biosystem,Foster City,CA)进行。标记的DNA片段在合适的自动测序仪上的DNA测序凝胶进行分离。可替代地,分离克隆的测序可按照下述参考文献中的方法进行例如,Maniatis等1982年所著分子克隆实验手册,Cold SpringHarbor Laboratory,Cold Spring Harbor Press,纽约;Sambrook等1989年所著分子克隆实验手册(第二版)1-3卷,CSH出版社,纽约;Ausubel等所著生物学,Greene出版协会,Brooklyn,纽约;或Ausubel等(1987年和增补)所著Current Protocols In MolecularBiology,Wiley/Greene,纽约。也可使用化学测序的方法,例如使用Maxam和Gilbert测序方法。V.重组DC基因构建体从合适的细胞类群中分离Poly(A)+RNA,例如使用FastTrackmRNA试剂盒(Invitrogen,San Diego,CA)。对样品进行电泳,例如在含甲醛的1%琼脂糖凝胶上,转移到GeneScreen膜(NEN ResearchProducts,Boston,MA)上。杂交在例如含0.5M Na2HPO4、pH7.2、7%SDS、1mM EDTA和1%BSA(组分V)及比活为107cpm/ml的32P-dCTP标记的DC基因cDNA的65℃条件下进行。杂交膜用含0.2×SSC和0.1%SDS的溶液洗三次,胶片曝光24小时。
重组基因构建体可用于生产检测信使RNA的探针。插入片段可切割下来用于上述方法的检测。VI.DC基因蛋白在大肠杆菌中的表达用PCR构建包含有开放阅读框架的构建体,优选该阅读框可操作地与合适启动子、选择标记,以及调控序列相连。得到的表达质粒转化入合适的大肠杆菌菌株(Stratagene,La Jolla,CA),例如Topp5。氨苄青霉素抗性(50μg/ml)的转化子在LB(Gibco)中37℃培养至550nm处的光密度为0.7。重组蛋白用0.4mM异丙基βD-硫代半乳-吡喃糖苷(Sigma,St.Louis,MO)诱导并在20℃继续培养18小时。离心收集1升培养物中的细胞并重悬,例如在200ml冰冷的含30%蔗糖、50mM Tris-HCl和1mM EDTA酸中。在冰上放置10分钟后,加冰冷的水到总体积2升。放置冰上20分钟后,离心去除细胞并用5μMMillipak 60(Millipore Corp.,Bedford,MA)过滤上清。
重组蛋白的纯化用标准的纯化方法,例如各种离子交换层析方法。下述的用抗体免疫亲和的方法也可使用。当在表达构建体中构建入表位标记物时,就可以使用亲和方法。VII.人DC基因作图DNA分离、限制酶消化、凝胶电泳、Southern印迹转移以及杂交均按照标准方法进行。参见,Jenkins等(1982) J.Virol.4326-36。转膜可用Hybond-N尼龙膜(Amerham)。探针用32P-dCTP标记;洗膜用最严紧条件,如0.1×SSC,0.1%SDS,65℃。
可替代地,BIOS Laboratories(New Haven,CT)的鼠体细胞杂交板可以同PCR方法结合起来。参见Fan等(1996)Immunogenetics4497-103。
用Stanford G3板做染色体定位可给出最近的标记SHGC-12041,优势对数(lod)值为7.7。该标记为编码M130抗原的基因,定位在染色体12p13。该位置含许多编码C型凝集素家族受体的基因,如典型的CD69和NK受体家族。VIII.个体变异分析根据分布数据,大量的容易得到的细胞类型选作个体样品。利用PCR技术,大群的个体被用于分析该基因.cDNA或其他PCR方法用于测定相应基因在不同个体中的序列并进行比较。该结果可用于表明种群间的差异程度,并且可以确定那些是可变并对功能没有很大影响的残基。IX.抗体制备重组DC蛋白通过用上述在大肠杆菌中的表达来产生,测定生物学活性。可替代地,用纯化方法获得的天然蛋白也可使用。抗体试剂可用于免疫沉淀和示踪分离方法。可以用活性或变性蛋白免疫合适哺乳动物来生产多克隆血清或单克隆抗体。X.灵长类和啮齿类的相应DC基因的分离可用编码这些基因的人cDNA作探针或者用其来设计PCR引物,去分离大猩猩等各种灵长类动物中的对应物。
用推定的DCMP1(tblastn算法)多肽序列对EST数据库(GenBankdbEST)进行生物信息学搜索发现了,编码一种与灵长类DCMP1同源的蛋白的小鼠克隆。发现了4个对应于该序列的克隆AA387662 Ko小鼠胚胎115dpc、AA170532小鼠脾、AA475012小鼠乳腺、以及AA423158小鼠乳腺。通过序列分析估计其中的AA170532为全长的序列,所以选择其进行DNA测序。该克隆含有和DCMP1相似的特征。去除Poly-A序列,该克隆全长1418bp,包含5’端278bp的UTR.至于hDCMP1,推测的起始密码子并不包含在一致的Kozak区,但在该密码子上游有终止密码子。5’端UTR含有同快速降解信号相似的序列,包括三个一致的ATTTA位点。具有潜在的多聚腺苷信号。推定的多肽长约238个残基,编码含有一个ITIM和一个C型凝集素结构域的II型膜蛋白。具有三个潜在的N-糖基化位点。同人的蛋白全序列的比较显示有54%的一致性和65%的同源性。值得注意的是,ITIM结构域高度保守(15个残基中有13个一致)。让人感兴趣的是保守的近膜端谷氨酰胺单元(FQKYSQLLE)、半胱氨酸残基可能参与了二硫键的形成。C型凝集素结构域同样也表现为模块保守,包括EPS基元。在hDCMP1和人肝细胞凝集素观察到的差异在小鼠也存在,较明显的是119和163位色氨酸的取代;177位谷氨酰胺的取代及288位的色氨酸被丝氨酸取代。由此看来,该克隆似乎是hDCMP1的小鼠同源物。XI.利用试剂分析细胞类群样品中树突状细胞水平高低的检测对于异常疾病状态的检测很重要。例如,树突状细胞在组织或淋巴系统中的增加可能表明DC增生或组织移植排斥的存在。较低的DC群可能表明对,例如细菌或病毒感染,的异常反应,需要进行合适的治疗使DC应答正常化。
使用对细胞表面DC蛋白特异的标记结合因子,参见如,Melamed等(1990)流式细胞术和分迭Wiley-Liss,Inc.,纽约;Shapiro(1998)实践流式细胞术Liss,纽约;和Robinson等(1993)流式细胞术手册Wiley-Liss,纽约,用FACS分析法测定DCs在细胞混合物中出现的数目,例如在外周血单核细胞(PBMCs)、粘连细胞等。结合因子也可用于对新鲜或固定的组织样品进行组织学分析,分析DC的浸润。可对多种细胞类群进行评价,无论是需要破坏细胞或某些分析中需要保持细胞活性。
可以对可溶性细胞内分子的出现进行分析,例如用Openshaw等(1995)在J.Exp.Med.1821357-1367中描述的用DC特异的荧光结合因子。替代地,可使用组织或细胞固定方法。
DC转录本水平可以定量,例如用Murphy等(1993)在J.Immunol.Methods 162211-223中描述的半定量PCR方法。设计的引物要保证基因组DNA不能被检出。XII.表达分布在序列数据库中对DCMP1 cDNA全序列进行分析,发现其表达谱仅限于一定数量的文库。在树突状细胞文库中发现数量最多的序列(10),破骨瘤细胞文库中则发现4个序列,而在体外用单核细胞、LPS激活的嗜中性粒细胞、软骨瘤、结肠癌、T淋巴细胞、皮肤瘤和慢性滑膜炎制备的巨噬细胞文库中仅发现1个序列。在GenBank dbEST中,检测到了4个克隆AA418441、差减文库,AA446401、完整胎儿,AA677149、胎儿肝脾,C01555、人基因特征(Human Gene SigNature),AA380065、皮肤肿瘤。
用RT-PCR对大量不同的细胞系和新分离的细胞进行DCMP1表达的分析表明DCMP1在TF1(骨髓细胞前体)、Jurkat(一T细胞系)、CHA(肾癌)、MRC5(胎儿肺成纤维细胞)、JY(B细胞系)、U937(骨髓-单核细胞淋巴瘤细胞系)中未检测到,而仅限于生血细胞。就新鲜分离的细胞而言,在未激活或激活的DC细胞、激活的粒细胞、未激活以及激活的外周血淋巴细胞(PBL)中可检测到表达,在激活的单核细胞和激活的B细胞中也可检测到低水平的表达。所有激活样品都是用PMA/离子霉素处理1和6小时的细胞。
另外分析发现DCMP1的表达随细胞的激活状态而变化。用RT-PCR对不同激活状态细胞DCMP1的表达进行了检测。从扁桃体组织分离的B细胞用PMA/离子霉素处理1或6小时或者与表达CD40L的L细胞共培养3,12或24小时。在未激活的细胞中可检测到mRNA。但这种表达在用PMA/离子霉素处理1小时内或CD40L处理3小时后不存在。形成对比的是,在T细胞检测不到表达,即使在用抗CD3/抗CD28温育后。
在CD34+来源的细胞中,来源于CD34+前体细胞的巨噬细胞在M-CSF存在情况下有很强的表达。这种表达似乎不随PMA/离子霉素处理而改变。在来源于CD34+前体细胞的DC细胞,在M-CSF和TNFα存在情况下,mRNA水平随培养过程的时间而变化,其中在培养的第12天达到很高量的表达。在同产生CD40L的L细胞共培养48小时后,DCMP1的表达丢失。在体外用FACS在第6天分拣的具有CD1a/CD14标记的DC细胞在继续培养6天后,在CD14亚群检出的mRNA水平要高于CD1a。这种表达受PMA/离子霉素处理的下游调控。
从血液中分离的单核细胞在未激活细胞中检测不到mRNA。但是,用PMA/离子霉素处理6小时后可检测到表达。在来源于单核细胞的DC细胞用GM-CSF和IL-4处理后发现DCMP1的表达受上游调控。这种表达不随PMA/离子霉素处理而改变,但受同表达CD40L的L细胞共培养的下游调控。在此情况下,DCMP1 mRNA的表达在共培养24小时后完全丢失。进一步用抗体检测的方法来证实人蛋白的表达。
离体分离的DC亚类表达DCMP1。从血液或淋巴组织分离的DC亚类以整合蛋白CD11c的有无为特征。Larson和Springer(1990)Immunol.Rev.114181-217。分离自血液的CD11c+的DC亚类(也称为GCDC)表达DCMP1。但在用抗CD40L和PMA/离子霉素处理激活后则检测不到mRNA。形成对比的是,分离自淋巴组织的相同亚类细胞则不表达DCMP1。在从血液分离的CD11c的DC亚类仅观察到少量的表达。但在来自淋巴组织的细胞却有较高表达,但也受抗CD40L和PMA/离子霉素处理激活的下游调控。从皮肤分离的郎罕氏细胞表达DCMP1,而环绕的基底膜细胞则没有表达。XIII.灵长类DCMP1序列分析表明这些DCMPs是凝集素/脱唾液酸糖蛋白受体超家族成员。特别地,肝细胞和巨噬细胞中的凝集素与蛋白和肽的内化有关,内化例如在树突状细胞吸收和提呈抗原的中发挥着重要的作用。DCMP1含有一个内化基元(YxxV)和一个类-ITIM基元(IxYxxV;SEQ ID NO2的5-10残基;更扩展的基元为1-24残基)。这表明该蛋白可能是抑制性受体家族(KIR;LIR,等)的树突状细胞成员,该家族成员可发出阴性信号来抑制细胞的功能。
可能的开放阅读框架从大约第242个核苷酸开始。潜在的起始密码子并不包含在一致的Kozak区,但在该密码子上游没有可替代的起始密码子,而且在其上游200处有终止密码子,因此推测其为编码蛋白的起始。根据序列预测的多肽大约长237个残基。未检测到信号肽,但在386~443处有一推定的跨膜序列。该克隆编码一种含有一个C型凝集素结构域的II型膜蛋白。3’端UTR含有潜在的快速降解信号,包括三个一致的ATTTA位点。未检测到信号肽,但在45-62,可替代的为386-443处有一推定的跨膜序列。该克隆编码一种含有一个C型凝集素结构域的II型膜蛋白。
根据序列分析预测的多肽具有一含49个氨基酸的细胞内结构域,其中包括一个以第7位残基为中心的基于酪氨酸的基元。具有此种性质的YXX(L/V)基元在肝凝集素和CD23(Fce RIIa)中作为内化基元。这种类型的结构域在Ly49、NKG2A等分子以及类免疫球蛋白分子的KIR家族中可作为激活(ITAM)和抑制(ITIM)基元。抑制作用是由SHP2/SHIP磷酸酶向共有结构域(I/V)XYXX(L/V)的聚集来介导的。DCMP1的开始15个氨基酸同扩展的ITIM结构域具有保守性,因此DCMP1可能参与对细胞的抑制。单一的潜在糖基化位点出现在约第185位。
将DCMP1的C型凝集素结构域的氨基酸序列同其它含此结构域的蛋白序列比较发现DCMP1同肝细胞和巨噬细胞的凝集素(见表1)具有最高的同源性。尽管可观察到一些其它不同的特征,但C型凝集素折叠中的保守半胱氨酸残基在整个家族成员中都是保守的。同肝细胞凝集素一样,DCMP1在凝集素结构域起始处有一双半胱氨酸基元。该增补的半胱氨酸的功能尚不可知,因为在凝集素结构域中没有明显的其它半胱氨酸与之形成二硫键。尽管DCMP1中第91位的另一半胱氨酸可能有此功能,但是该残基可能参与形成分子间二硫键。DCMP1凝集素结构域的N末端同肝细胞和巨噬细胞的凝集素(见表1)具有最高的同源性。DCMP1中的钙结合结构域也是保守的,并且同CD23有最高的同源性,包括EPS基元(195-197残基),201位的谷氨酸(E)和218~219位的天冬酰胺和天冬氨酸。值得注意的是NK受体(此处显示NKGE)和CD94中不含这些基元。
DCMP1为一II型膜蛋白,预测的跨膜节段为约45-62残基。它同包括脱唾液酸糖蛋白受体、肝细胞凝集素、CD69、CD72、CD23和NK受体在内的蛋白有关。此蛋白在C端(104-237残基)含有钙依赖性的C型凝集素胞外结构域,因此表现出糖残基特异的基元特征。见表1。这些蛋白典型地同糖蛋白上的糖残基结合,可能参与基本的免疫应答。该家族的一些成员,典型地是CD69、NK受体和CD72,在增殖和诱导特定基因表达的细胞激活事件中传递信号。
同小鼠C型凝集素KIR受体Ly49类似,DCMP1含有一内化基元,该基元同抑制性受体(ITIM结构域,参见Vivier和Daeron(1997)Immuology Today 18286-291和Katz和Austen(1997)免疫学杂志1585065-5070的最近综述)的基团有扩展的同源性。这些受体,要么是免疫球蛋白超家族成员要么是C型凝集素,可以经含SH2结构域的磷酸酶如SHIP、SHP-1和SHP-2传递阴性信号。有证据表明为了阻断激活信号,这些受体与其它的一些活化受体联合在一起。还有证据暗示此类分子的配体是一IgSF分子。这种分子的实例有MHCI类分子(被CD94/NK受体和Ly-49识别)和FcgR(CD23;识别IgG)。
91位的半胱氨酸残基可能参与同另一多肽形成二硫键,可以是同源或异源二聚体。
PCR分析表明该基因在活化或非活化的树突状细胞都有表达。在TF1(生血细胞系)、Jurkat(T细胞系)、MRC5(胎儿肺成纤维细胞系)、JY(B细胞系)、U937(前单核细胞系)或CHA(癌细胞系)这些细胞中都未发现可检测信号。新鲜分离的未激活或激活的PBL和粒细胞中则检测到了阳性信号,但是在新鲜分离的T细胞、B细胞和NK细胞或单核细胞却仅检测到弱信号。
序列分析表明基因在树突状细胞、激活的嗜中性粒细胞、巨噬细胞(用GM-CSF激活)、破骨瘤、皮肤瘤、T淋巴细胞、结肠癌、慢性滑膜炎以及软骨瘤细胞中都有表达。XIV.DCMP1啮齿类对应物表2显示了DCMP1啮齿类对应物的序列。表2序列显示了与小鼠的两个EST之间的同源性,即W33446(见SEQID NO11)和AA170532(见SEQ ID NO8),它们是DCMP1小鼠对应物的密码(见SEQ ID NO8)。hDCMP1 MTSEITYAEVRFKNEFKSSGINTASSAASKERTAPLKSNTGFPKLLCASLW33446 --------------------------------------------------170532 MASEITYAEVKFKNESNSLHTYSESPAAPREKPIRDLRKPGSPSLLLTSLmDCMP1 MASEITYAEVKFKNESNSLHTYSESPAAPREKPIRDLRKPGSPSLLLTSLhDCMP1 LIFFLLLAISFFIAFVIFFQKYSQLLE-KKTTKELVHTTLECVKKNMPVEW33446 --------------------------E-KMIIKELNYTELECTKWASLLE170532 MLLLLLLAITFLVAFIIYFQKYSQLLEEKKAAKNIMmDCMP1 MLLLLLLAITFLVAFIIYFQKYSQLLEEKKAAKNIMHNELNCTKSVSPMEhDCMP1 ETAWSCCPKNWKSFSSNCYFISTE--SASWQDSEKDCARMEAHLLVINTQW33446 DKVWSCCPKDWKPFGSYCYFTSTD-LVASWNESKENCFHMGAHLVVIHSQmDCMP1 DKVWSCCPKDWRLFGSHCYLVPTVSSSASWNKSEENCSRMGAHLVVIQSQhDCMP1 EEQDFIFQNLQEESAYFVGLSDPEGQRHWQWVDQTRYNESSTFWHPREPSW33446 EEQmDCMP1 EEQDFITGILDTHAAYFIGLWD-TGHRQWQWVDQTPYEESITFWHNGEPShDCMP1 DPNERCVVLNFR-KSPKRWGWNDVNCLGPQRSVCEMMKIHLmDCMP1 SGNEKCATIIYRWKT--GWGWNDISCSLKQKSVCPMKKINLXV.灵长类DCMP2DCMP2是一种假定的脱唾液酸糖蛋白受体,为一II型跨膜蛋白。在它的胞外区,DCMP2特征性地含有一个单糖识别结构域(CRD),该结构域是凝集素C型(钙离子依赖性的)家族的特征(参见Drickamer和Taylor(1993)Ann.Rev。Cell Biol.9237-264。DCMP2同编码人肝细胞唾液酸糖蛋白受体亚单位的两个基因(H1和H2)有很高的同源性。Stockert(1995)Physiol.Revs.75591-609。这些肝细胞受体代表了II型C型凝集素家族成员的原始型。肝ASGPR对末端表现为半乳糖残基的脱唾液酸化的糖蛋白有特异的结合,经笼形蛋白包裹的凹陷途径介导它们内吞进入肝细胞。显著地,同这些功能相关的特征在ASGPR和DCMP2都是保守的。因而,DCMP2所包含的一细胞内基元在第5位含一酪氨酸残基,同配体内吞能力有关。参见Fuhrer等(1991)J.Cell Biol.114423-431。此外,DCMP2在其糖识别结构域中含有一个QPD(Gln-Pro-Asp)半乳糖识别序列(Drickamer(1992)Nature 360183-186)。
还分离到了编码DCMP2的几个突变的cDNA克隆,这很可能是选择性剪接的结果。下面描述三个突变体一短的形式,一长的形式和一命名为DCMP2v的突变体。参见SEQ ID NO4和10以及表1。短的形式和长的形式的不同之处在于前者的胞外区域有一27个氨基酸的插入片段。DCMP2短的形式同最近从人巨噬细胞(M-ASGPR)克隆的ASGPR在胞外结构域有4个氨基酸的差异。Suzuki等(1996)J.Immunol.156128-135。
同DCMP21相比,ASGPRm缺乏对应于GVSELQEHTTQKAHLGHCPHCPSVCVP(SEQ ID NO4的118-144位残基)的节段,但包含一GEE(SEQ ID NO4的173和174位残基)插入片段。DCMP2s和DCMP21一致,除了缺乏GVSELQEHTTQKAHLGHCPHCPSVCVP(SEQ ID NO4的118-144位残基),第1064位核苷酸由A取代了G,因此编码的是天冬酰胺而非天冬氨酸。DCMPv和DCMPs类似,但缺乏LLQRLRSGPCHLLLSLGLG(SEQ ID NO4的30-48位残基)序列,该序列对应于跨膜节段中的一重要部分;同ASGPRm一样包含一GEE(SEQ IDNO4的173和174位残基)插入。这些差异的周围区域,例如在一个表位长度的范围内,例如12~17个氨基酸内,是令人感兴趣的。
重组的DCMP2长的形式已经得到,并且也得到了mABs。此外已经得到用长的形式和短的形式转染的稳定表达鼠细胞系。
基因最初是从70%纯化的CD1a+DC中分离而来,这种DC是培养在GM-CSF和TNFa中的CD34+生血原始细胞的(Caux等(1992)Nature360258-261)衍生细胞。该克隆已插入pSport1载体(NotI/SalI酶切位点)。
PCR分析表明,DCMP2基因在树突状细胞有表达,并且可能在TF1(生血细胞系)细胞也有很弱的表达。Jurkat(T细胞系),CHA(癌细胞系),MRC5(胎儿肺成纤维细胞系)或JY(B细胞系)中都未发现可检测信号,但在新鲜分离的未激活或激活(PMA和离子霉素)的树突状细胞、粒细胞和未激活或激活的PBL中检测到了阳性信号。而在单核细胞、未激活或激活的T细胞或B细胞中未检测到信号。
DC-ASPGR同对应于人单核细胞的鼠ASGPR(M-ASGPR)具有很高的同源性。糖识别结构域的同源性非常显著(~60%),该结构域赋予鼠单核细胞ASGPR对半乳糖和N-乙酰半乳糖苷(GalNAc)的特异性。Sato等(1992)J.Biochem.111331-336。这也包括在肝细胞ASGPR的H1和H2亚单位中发现的QPD基元。此外,在鼠单核细胞ASGPR的胞质部分有一YENL的内化信号。
鼠ASGPR作为受体在半乳糖基化糖蛋白内吞中起作用(Ozaki等(1992)I.Biol.Chem.2679229-9235),允许肿瘤杀伤性巨噬细胞识别肿瘤细胞(Kawakami等(1994)Jpn.J.Cancer Res.85744-749).在此情况下发现,在带有OV2944-HM-1转移性卵巢肿瘤细胞的小鼠的肺转移结节中有鼠M-ASGPR的表达。(Imai等(1995)Immunol.86591-598)。让人感兴趣的,人M-ASGPR表现出对Tn抗原的显著特异性(Suzuki等(1996)J.Immunol.156128-135),该抗原带有一串同人肿瘤有关的末端连接丝氨酸或酪氨酸的GalNAc(Springer(1989)Mol.Immunol.261-5;Φrntoft等(1990)Int.J.Cancer 45666-672)。
根据序列的同源性,可以预测DCMPs也可作为半乳糖基化糖蛋白的内吞受体。此外,通过另一C型跨膜内吞凝集素即甘露糖受体的配体内化作用,引发DC经MHCII途径对抗原的高效提呈。Cella等(1997)Current Opinion Immunol.910-16。依此类推,DCMPs可能在将配体内化入抗原提呈途径中起作用。
因此,在基于免疫的佐剂治疗中,DCMP2是将抗原运入DC以加强对T细胞提呈这一过程的潜在的高效靶目标。这可以通过体外用半乳糖基化形式的抗原或抗DCMP2单抗偶连的抗原脉冲(pulse)DC来探讨。体外提呈效率用抗原特异性T细胞的激活来测定。本发明集中讨论肿瘤相关抗原(TAA)的提呈,因为这一方法具有内在的治疗前景。尤为感兴趣的是TAA相关的恶性黑色素瘤。
此外,由于人M-ASGPR对Tn抗原的特异性,使得这种癌TAA成为一种选择性靶向DCMP2的候选者。
最近表明外源抗原可以经MHCI途径处理和提呈。参见Porgador和Gilboa(1995)J.Exp.Med.182255-260;Paglia等(1996)J.Exp.Med.183317-322。特化的受体可能在DC中行使这一功能。
DC中的这些受体可以被靶向至帮助生成TAA特异性的细胞毒性T细胞(CTL),这种T细胞有重大的潜在治疗价值,因为CTL可能在诱导抗肿瘤中发挥作用。XVI.DCMP内化从培养在GM-CSF和TNFα中的CD34+原始细胞中获取DC,4℃用抗DCMP2单抗或抗CD13染色作为对照。37℃继续培养大约20分钟后,分析细胞表面结合的单抗。通过细胞表面荧光的减少来观察内化。
DCMP21在37℃下迅速内化,而在4℃则不。大约60%的表面标记在15分钟内消失。这表明DCMP2可作为内吞受体,这同其胞质内结构域出现一内化基元(YENF)相一致。XVII.结合相对成分的分离DC蛋白可以用作特异性结合试剂,利用其特异性结合的优势,这一点与抗体的使用极其相似。结合试剂要么如上述标记,例如荧光或其它标记物,要么固定于一底物用于淘选方法。
DC蛋白用于筛选那些能表现结合特性的细胞系。可用普通的染色方法来检测或分拣细胞内或表面表达的配体,或用淘选方法筛选表面表达的转化细胞。细胞内表达的筛选用各种染色或免疫荧光的程序来进行。参见McMahan等(1991)EMBO J.102821-2832。
例如,在第0天,用溶解在PBS中的10ng/ml纤粘蛋白对带有两个小槽的permanox载玻片在室温下预包被30分钟,每小槽加包被液1ml。用PBS洗涤一次。然后每槽中加入含2-3×105COS细胞的生长培养基1.5ml。在37℃温育过夜。
在第一天,每一样品均制备0.5ml溶液,该溶液是将66mg/mlDEAE-葡聚糖、66mM氯喹以及4mg DNA溶解到无血清DME中制备而成的。对每一组,设立一阳性对照,例如1倍或1/200稀释的人受体FLAGcDNA,和一阴性对照。用无血清DME洗涤细胞。加入DNA溶液并在37℃温育5小时。去掉培养基并加入0.5ml溶有10%DMSO的DME,放置2.5分钟。弃去并用DME洗一次。加入1.5ml生长培养基温育过夜。
在第2天,换培养基。在第3或4天,固定并染色细胞。用Hank’s平衡盐溶液(HBSS)洗涤细胞并用4%多聚甲醛(PFA)/葡萄糖固定5分钟。用HBSS洗3次。去除所有液体后将载玻片贮存在-80℃。对每一小槽,按下述进行体积为0.5ml的温育。加含32ml/ml 1M NaN3的HBSS/皂角苷,放置20分钟。用HBSS/1×皂角苷洗涤细胞。加入蛋白或蛋白/抗体复合物并温育30分钟。用HBSS/皂角苷洗涤细胞两次。如果合适,加入一抗,30分钟。加二抗,例如1/200稀释的Vector抗鼠抗体,温育30分钟。制备ELISA溶液,例如Vector Elite ABC辣根过氧化物酶溶液,预先温育30分钟。例如每2.5ml HBSS/皂角苷使用1滴溶液A(抗生物素蛋白)和1滴溶液B(生物素)。用HBSS/皂角苷洗涤细胞两次。加入ABC辣根过氧化物酶(HRP)溶液并温育30分钟。用HBSS洗涤细胞两次,第二次2分钟以封闭细胞。然后加入Vector二氨基联苯胺(DAB),5-10分钟。每5ml用玻璃仪器蒸馏的水加2滴缓冲液,4滴DAB和2滴双氧水。小心除去小槽中的内容物并用水洗涤载玻片。空气中干燥几分钟,加1滴检波头(Crystal Mount)和盖上盖玻片。在85-90℃烤5分钟。
替代地,可以用另外一些单核细胞蛋白特异性结合试剂亲和纯化或分拣出表达受体的细胞。参见,例如Sambrook等或Ausubel等。
另外一个策略是用淘选方法筛选膜结合受体。按照上述方法构建受体cDNA。可以将配体固定从而固定表达受体的细胞。这种固定化可通过使用能识别如单核细胞蛋白融合构建体的FLAG序列的合适抗体或抗第一抗体的抗体来实现。通过反复选择和扩增就可以富集合适的克隆并最后分离到表达配体的克隆。
可以用单核细胞蛋白筛选噬菌体表达文库。合适的标记技术可以保证合适的克隆得到特异性的标记,例如使用抗FLAG抗体。
不脱离本发明的实质和范围可以做出许多修饰和变化,这一点对于本领域的技术人员来说是显而易见的。本发明中的特定实施方案仅仅是为了举例说明而提供的,本发明只受所附的权利要求以及权利要求所能授权的全部等同范围的限制。
序列提交SEQ ID NO1是灵长类DCMP1 C-凝集素家族基因的核苷酸序列。SEQ ID NO2是灵长类DCMP1 C-凝集素家族基因的多肽序列。SEQ ID NO3是灵长类DCMP2 C-凝集素家族基因的核苷酸序列。SEQ ID NO4是灵长类DCMP2 C-凝集素家族基因的多肽序列。SEQ ID NO5是灵长类肝ASGPRh1多肽序列。SEQ ID NO6是灵长类肝ASGPRh2多肽序列。SEQ ID NO7是啮齿类DCMP1 C-凝集素家族基因的核苷酸序列。SEQ ID NO8是啮齿类DCMP1 C-凝集素家族基因的多肽序列。SEQ ID NO9是突变的DCMP2核苷酸序列。SEQ ID NO10是突变的DCMP2多肽序列。SEQ ID NO11是来自W33446啮齿类EST的肽链序列。
序列表(1)一般资料(i)申请人(A)姓名Schering Corporation(B)街道2000 Galloping Hill Road(C)城市Kenilworth(D)州New Jersey(E)国家美国(F)邮政编码07033(G)电话(908)298-5056(H)传真(908)298-5388(ii)发明题目哺乳动物膜蛋白基因,相关反应试剂(iii)序列数11(iv)计算机可读形式(A)介质类型软盘(B)计算机Power Macintosh(C)操作系统8.1.0(D)软件Microsoft Word 6.0.1(v)目前的申请资料(A)申请号
(B)申请日(vi)在先申请资料(A)申请号US60/053,080(B)申请日1997-6-9(2)SEQ ID NO1的资料(i)序列特征(A)长度1104个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置242..952(xi)序列描述SEQ ID NO1TTCTCACTAT ACTGGTCCTG AGGAAAGGGC TTCTGTGAAC TGCGGTTTTT AGTTTTTATT 60GTGGTTCTTA GTTCTCATGA GACCCCTCTT GAGGATATGT GCCTATCTGG TGCCTCTGCT120CTCCACTAGT TGAGTGAAAG GAAGGAGGTA ATTTACCACC ATGTTTGGTT CCTGTTTATA180AGATGTTTTA AGAAAGATTT GAAACAGATT TTCTGAAGAA AGCAGAAGCT CTCTTCCCAT240T ATG ACT TCG GAA ATC ACT TAT GCT GAA GTG AGG TTC AAA AAT GAA286Met Thr Ser Glu Ile Thr Tyr Ala Glu Val Arg Phe Lys Asn Glu1 5 10 15TTC AAG TCC TCA GGC ATC AAC ACA GCC TCT TCT GCA GCT TCC AAG GAG 334Phe Lys Ser Ser Gly Ile Asn Thr Ala Ser Ser Ala Ala Ser Lys Glu20 25 30AGG ACT GCC CCT CTC AAA AGT AAT ACC GGA TTC CCC AAG CTG CTT TGT 382Arg Thr Ala Pro Leu Lys Ser Asn Thr Gly Phe Pro Lys Leu Leu Cys35 40 45GCC TCA CTG TTG ATA TTT TTC CTG CTA TTG GCA ATC TCA TTC TTT ATT 430Ala Ser Leu Leu Ile Phe Phe Leu Leu Leu Ala Ile Ser Phe Phe Ile50 55 60GCT TTT GTC ATT TTC TTT CAA AAA TAT TCT CAG CTT CTT GAA AAA AAG 478Ala Phe Val Ile Phe Phe Gln Lys Tyr Ser Gln Leu Leu Glu Lys Lys65 70 75ACT ACA AAA GAG CTG GTT CAT ACA ACA TTG GAG TGT GTG AAA AAA AAT 526Thr Thr Lys Glu Leu Val His Thr Thr Leu Glu Cys Val Lys Lys Asn80 85 90 95ATG CCC GTG GAA GAG ACA GCC TGG AGC TGT TGC CCA AAG AAT TGG AAG 574Met Pro Val Glu Glu Thr Ala Trp Ser Cys Cys Pro Lys Asn Trp Lys100 105 110TCA TTT AGT TCC AAC TGC TAC TTT ATT TCT ACT GAA TCA GCA TCT TGG 622Ser Phe Ser Ser Asn Cys Tyr Phe Ile Ser Thr Glu Ser Ala Ser Trp115 120 125CAA GAC AGT GAG AAG GAC TGT GCT AGA ATG GAG GCT CAC CTG CTG GTG 670Gln Asp Ser Glu Lys Asp Cys Ala Arg Met Glu Ala His Leu Leu Val130 135 140ATA AAC ACT CAA GAA GAG CAG GAT TTC ATC TTC CAG AAT CTG CAA GAA 718Ile Asn Thr Gln Glu Glu Gln Asp Phe Ile Phe Gln Asn Leu Gln Glu145 150 155GAA TCT GCT TAT TTT GTG GGG CTC TCA GAT CCA GAA GGT CAG CGA CAT 766G1u Ser Ala Tyr Phe Val Gly Leu Ser Asp Pro Glu Gly Gln Arg His160 165 170 175TGG CAA TGG GTT GAT CAG ACA CCA TAC AAT GAA AGT TCC ACA TTC TGG 814Trp Gln Trp Val Asp Gln Thr Pro Tyr Asn Glu Ser Ser Thr Phe Trp180 185 190CAT CCA CGT GAG CCC AGT GAT CCC AAT GAG CGC TGC GTT GTG CTA AAT 862His Pro Arg Glu Pro Ser Asp Pro Asn Glu Arg Cys Val Val Leu Asn195 200 205TTT CGT AAA TCA CCC AAA AGA TGG GGC TGG AAT GAT GTT AAT TGT CTT 910Phe Arg Lys Ser Pro Lys Arg Trp Gly Trp Asn Asp Val Asn Cys Leu210 215 220GGT CCT CAA AGG TCA GTT TGT GAG ATG ATG AAG ATC CAC TTA 9S2Gly Pro Gln Arg Ser Val Cys Glu Met Met Lys Ile His Leu225 230 235TGAACTGAAC ATTCTCCATG AACAGGTGGT TGGATTGGTA TCTGTCATTG TAGGGATAGA1012TAATAAGCTC TTCTTATTCA TGTGTAAGGG AGGTCCATAG AATTTAGGTG GTCTGTCAAC1072TATTCTACTT ATGAGAGAAT TGGTCTGTAC AT 1104(2)SEQ ID NO2的资料(i)序列特征(A)长度237个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Met Thr Ser Glu Ile Thr Tyr Ala Glu Val Arg Phe Lys Asn Glu Phe1 5 10 15Lys Ser Ser Gly Tle Asn Thr Ala Ser Ser Ala Ala Ser Lys Glu Arg20 25 30Thr Ala Pro Leu Lys Ser Asn Thr Gly Phe Pro Lys Leu Leu Cys Ala35 40 45Ser Leu Leu Ile Phe Phe Leu Leu Leu Ala Ile Ser Phe Phe Ile Ala50 55 60Phe Val Ile Phe Phe Gln Lys Tyr Ser Gln Leu Leu Glu Lys Lys Thr65 70 75 80Thr Lys Glu Leu Val His Thr Thr Leu Glu Cys Val Lys Lys Asn Met85 90 95Pro Val Glu Glu Thr Ala Trp Ser Cys Cys Pro Lys Asn Trp Lys Ser100 105 110Phe Ser Ser Asn Cys Tyr Phe Ile Ser Thr Glu Ser Ala Ser Trp Gln115 120 125Asp Ser Glu Lys Asp Cys Ala Arg Met Glu Ala His Leu Leu Val Ile130 135 140Asn Thr Gln Glu Glu Gln Asp Phe Ile Phe Gln Asn Leu Gln Glu Glu145 150 155 160Ser Ala Tyr Phe Val Gly Leu Ser Asp Pro Glu Gly Gln Arg His Trp165 170 175Gln Trp Val Asp Gln Thr Pro Tyr Asn Glu Ser Ser Thr Phe Trp His180 185 190Pro Arg Glu Pro Ser Asp Pro Asn Glu Arg Cys Val Val Leu Asn Phe195 200 205Arg Lys Ser Pro Lys Arg Trp Gly Trp Asn Asp Val Asn Cys Leu Gly210 215 220Pro Gln Arg Ser Val Cys Glu Met Met Lys Ile His Leu225 230 235(2)SEQ ID NO3的资料(i)序列特征(A)长度1458个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA
(ix)特征(A)名称/关键词CDS(B)位置257..1204(ix)特征(A)名称/关键词misc-feature(B)位置608(D)其它资料/注释=“不含608~673位核苷酸的短的形式”(ix)特征(A)名称/关键词misc-feature(B)位置775(D)其它资料/注释=“ASGPRm(表2)具有编码位于775~776位之间的GEE的序列插入片段”(ix)特征(A)名称/关键词misc-feature(B)位置1064(D)其它资料/注释=“DCMP2s第1064位核苷酸可以是A,这就使得第270位编码的氨基酸残基由原来的asp变为asn”(xi)序列描述SEQ ID NO3GTTGAGGAGA TGGGATGTCC CAGATGATAG GGCTCCTGGG ATTTCAGACC CAAGACCAGC 60AGGACTCCAG TCACCTCTAC CCCAGCTCTC CAGGACACAG CGCTCCCAAC TCTGAGTGAC120GTCCCACCTC TGGTCCTTGC AGCACAACCA ACGTGGGAAT CACACCCTCC AGACCTCCCA180CAGCTCCACC CCAGACTGGG CGCCGGCCCT GCCTCCATTT CAGCTGTGAC AACCTCAGAG240CCGTGTTGGC CCAAGC ATG ACA AGG ACG TAT GAA AAC TTC CAG TAC TTG289Met Thr Arg Thr Tyr Glu Asn Phe Gln Tyr Leu1 5 10GAG AAT AAG GTG AAA GTC CAG GGG TTT AAA AAT GGG CCA CTT CCT CTC 337Glu Asn Lys Val Lys Val Gln Gly Phe Lys Asn Gly Pro Leu Pro Leu15 20 25CAG TCC CTC CTG CAG CGT CTC CGC TCT GGG CCC TGC CAT CTC CTG CTG 385Gln Ser Leu Leu Gln Arg Leu Arg Ser Gly Pro Cys His Leu Leu Leu30 35 40TCC CTG GGC CTC GGC CTG CTG CTG CTG GTC ATC ATC TGT GTG GTT GGA 433Ser Leu Gly Leu Gly Leu Leu Leu Leu Val Ile Ile Cys Val Val Gly45 50 55TTC CAA AAT TCC AAA TTT CAG AGG GAC CTG GTG ACC CTG AGA ACA GAT 481Phe Gln Asn Ser Lys Phe Gln Arg Asp Leu Val Thr Leu Arg Thr Asp60 65 70 75TTT AGC AAC TTC ACC TCA AAC ACT GTG GCG GAG ATC CAG GCA CTG ACT 529Phe Ser Asn Phe Thr Ser Asn Thr Val Ala Glu Ile Gln Ala Leu Thr80 85 90TCC CAG GGC AGC AGC TTG GAA GAA ACG ATA GCA TCT CTG AAA GCT GAG 577Ser Gln Gly Ser Ser Leu Glu Glu Thr Ile Ala Ser Leu Lys Ala Glu95 100 105GTG GAG GGT TTC AAG CAG GAA CGG CAG GCA GGG GTA TCT GAG CTC CAG 625Val Glu Gly Phe Lys Gln Glu Arg Gln Ala Gly Val Ser Glu Leu Gln110 115 120GAA CAC ACT ACG CAG AAG GCA CAC CTA GGC CAC TGT CCC CAC TGC CCA 673Glu His Thr Thr Gln Lys Ala His Leu Gly His Cys Pro His Cys Pro125 130 135TCT GTG TGT GTC CCA GTT CAT TCT GAA ATG CTC CTG CGA GTC CAG CAG 721Ser Val Cys Val Pro Val His Ser Glu Met Leu Leu Arg Val Gln Gln140 145 150 155CTG GTG CAA GAC CTG AAG AAA CTG ACC TGC CAG GTG GCT ACT CTC AAC 769Leu Val Gln Asp Leu Lys Lys Leu Thr Cys Gln Val Ala Thr Leu Asn160 165 170AAC AAT GCC TCC ACT GAA GGG ACC TGC TGC CCC GTC AAC TGG GTG GAG 817Asn Asn Ala Ser Thr Glu Gly Thr Cys Cys Pro Val Asn Trp Val Glu175 180 185CAC CAA GAC AGC TGC TAC TGG TTC TCT CAC TCT GGG ATG TCC TGG GCC 865His Gln Asp Ser Cys Tyr Trp Phe Ser His Ser Gly Met Ser Trp Ala190 195 200GAG GCT GAG AAG TAC TGC CAG CTG AAG AAC GCC CAC CTG GTG GTC ATC 913Glu Ala Glu Lys Tyr Cys Gln Leu Lys Asn Ala His Leu Val Val Ile205 210 215AAC TCC AGG GAG GAG CAG AAT TTT GTC CAG AAA TAT CTA GGC TCC GCA 961Asn Ser Arg Glu Glu Gln Asn Phe Val Gln Lys Tyr Leu Gly Ser Ala220 225 230 235TAC ACC TGG ATG GGC CTC AGT GAC CCT GAA GGA GCC TGG AAG TGG GTG 1009Tyr Thr Trp Met Gly Leu Ser Asp Pro Glu Gly Ala Trp Lys Trp Val240 245 250GAT GGA ACA GAC TAT GCG ACC GGC TTC CAG AAC TGG AAG CCA GGC CAG 1057Asp Gly Thr Asp Tyr Ala Thr Gly Phe Gln Asn Trp Lys Pro Gly Gln255 260 265CCA GAC GAC TGG CAG GGG CAC GGG CTG GGT GGA GGC GAG GAC TGT GCT 1105Pro Asp Asp Trp Gln Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala270 275 280CAC TTC CAT CCA GAC GGC AGG TGG AAT GAC GAC GTC TGC CAG AGG CCC 1153His Phe His Pro Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro285 290 295TAC CAC TGG GTC TGC GAG GCT GGC CTG GGT CAG ACC AGC CAG GAG AGT 1201Tyr His Trp Val Cys Glu Ala Gly Leu Gly Gln Thr Ser Gln Glu Ser300 305 310 315CAC TGAGCTGCCT TTGGTGGGAC CACCCGGCCA CAGAAATGGC GGTGGGAGGA 1254HisGGACTCTTCT CACGACCTCC TCGCAAGACC GCTCTGGGAG AGAAATAAGC ACTGGGAGAT 1314TGGAAGCACT GCTAACATTT TGAATTTTTT TCTCTTTAAT TTTAAAAAGA TGGTATAGTG 1374TTCTTAAGCT TTTATTTTTT TTCCAACTTT TGAAAGTCAA CTTCATGAAG GTATAATTTT 1434TACATAATAA AAATGCACTC ATTT 1458(2)SEQ ID NO4的资料(i)序列特征(A)长度316个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Met Thr Arg Thr Tyr Glu Asn Phe Gln Tyr Leu Glu Asn Lys Val Lys1 5 10 15Val Gln Gly Phe Lys Asn Gly Pro Leu Pro Leu Gln Ser Leu Leu Gln20 25 30Arg Leu Arg Ser Gly Pro Cys His Leu Leu Leu Ser Leu Gly Leu Gly35 40 45Leu Leu Leu Leu Val Ile Ile Cys Val Val Gly Phe Gln Asn Ser Lys50 55 60Phe Gln Arg Asp Leu Val Thr Leu Arg Thr Asp Phe Ser Asn Phe Thr65 70 75 80Ser Asn Thr Val Ala Glu Ile Gln Ala Leu Thr Ser Gln Gly Ser Ser85 90 95Leu Glu Glu Thr Ile Ala Ser Leu Lys Ala Glu Val Glu Gly Phe Lys100 105 110Gln Glu Arg Gln Ala Gly Val Ser Glu Leu Gln Glu His Thr Thr Gln115 120 125Lys Ala His Leu Gly His Cys Pro His Cys Pro Ser Val Cys Val Pro130 135 140Val His Ser Glu Met Leu Leu Arg Val Gln Gln Leu Val Gln Asp Leu145 150 155 160Lys Lys Leu Thr Cys Gln Val Ala Thr Leu Asn Asn Asn Ala Ser Thr165 170 175Glu Gly Thr Cys Cys Pro Val Asn Trp Val Glu His Gln Asp Ser Cys180 185 190Tyr Trp Phe Ser His Ser Gly Met Ser Trp Ala Glu Ala Glu Lys Tyr195 200 205Cys Gln Leu Lys Asn Ala His Leu Val Val Ile Asn Ser Arg Glu Glu210 215 220Gln Asn Phe Val Gln Lys Tyr Leu Gly Ser Ala Tyr Thr Trp Met Gly225 230 235 240Leu Ser Asp Pro Glu Gly Ala Trp Lys Trp Val Asp Gly Thr Asp Tyr245 250 255Ala Thr Gly Phe Gln Asn Trp Lys Pro Gly Gln Pro Asp Asp Trp Gln260 265 270Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala His Phe His Pro Asp275 280 285Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro Tyr His Trp Val Cys290 295 300Glu Ala Gly Leu Gly Gln Thr Ser Gln Glu Ser His305 310 315(2)SEQ ID NO5的资料(i)序列特征(A)长度291个氨基酸(B)类型氨基酸(C)链型无关(D)拓扑结构线性(ii)分子类型肽链(xi)序列描述SEQ ID NO5Met Thr Lys Glu Tyr Gln Asp Leu Gln His Leu Asp Asn Glu Glu Ser1 5 10 15Asp His His Gln Leu Arg Lys Gly Pro Pro Pro Pro Gln Pro Leu Leu20 25 30Gln Arg Leu Cys Ser Gly Pro Arg Leu Leu Leu Leu Ser Leu Gly Leu35 40 45Ser Leu Leu Leu Leu Val Val Val Cys Val Ile Gly Ser Gln Asn Ser50 55 60Gln Leu Gln Glu Glu Leu Arg Gly Leu Arg Glu Thr Phe Ser Asn Phe65 70 75 80Thr Ala Ser Thr Glu Ala Gln Val Lys Gly Leu Ser Thr Gln Gly Gly85 90 95Asn Val Gly Arg Lys Met Lys Ser Leu Glu Ser Gln Leu Glu Lys Gln100 105 110Gln Lys Asp Leu Ser Glu Asp His Ser Ser Leu Leu Leu His Val Lys115 120 125Gln Phe Val Ser Asp Leu Arg Ser Leu Ser Cys Gln Met Ala Ala Leu130 135 140Gln Gly Asn Gly Ser Glu Arg Thr Cys Cys Pro Val Asn Trp Val Glu145 150 155 160His Glu Arg Ser Cys Tyr Trp Phe Ser Arg Ser Gly Lys Ala Trp Ala165 170 175Asp Ala Asp Asn Tyr Cys Arg Leu Glu Asp Ala His Leu Val Val Val180 185 190Thr Ser Trp Glu Glu Gln Lys Phe Val Gln His His Ile Gly Pro Val195 200 205Asn Thr Trp Met Gly Leu His Asp Gln Asn Gly Pro Trp Lys Trp Val210 215 220Asp Gly Thr Asp Tyr Glu Thr Gly Phe Lys Asn Trp Arg Pro Glu Gln225 230 235 240Pro Asp Asp Trp Tyr Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala245 250 255His Phe Thr Asp Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro260 265 270Tyr Arg Trp Val Cys Glu Thr Glu Leu Asp Lys Ala Ser Gln Glu Pro275 280 285Pro Leu Leu290(2)SEQ ID NO6的资料(i)序列特征(A)长度287个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型肽链(xi)序列描述SEQ ID NO6Met Ala Lys Asp Phe Gln Asp Ile Gln Gln Leu Ser Ser Glu Glu Asnl 5 10 15Asp His Pro Phe His Gln Gly Pro Pro Pro Ala Gln Pro Leu Ala Gln20 25 30Arg Leu Cys Ser Met Val Cys Phe Ser Leu Leu Ala Leu Ser Phe Asn35 40 45Ile Leu Leu Leu Val Val Ile Cys Val Thr Gly Ser Gln Ser Ala Gln50 55 60Leu Gln Ala Glu Leu Arg Ser Leu Lys Glu Ala Phe Ser Asn Phe Ser65 70 75 80Ser Ser Thr Leu Thr Glu Val Gln Ala Ile Ser Thr His Gly Gly Ser85 90 95Val Gly Asp Lys Ile Thr Ser Leu Gly Ala Lys Leu Glu Lys Gln Gln100 105 110Gln Asp Leu Lys Ala Asp His Asp Ala Leu Leu Phe His Leu Lys His115 120 125Phe Pro Val Asp Leu Arg Phe Val Ala Cys Gln Met Glu Leu Leu His130 135 140Ser Asn Gly Ser Gln Arg Thr Cys Cys Pro Val Asn Trp Val Glu His145 150 155 160Gln Gly Ser Cys Tyr Trp Phe Ser His Ser Gly Lys Ala Trp Ala Glu165 170 175Ala Glu Lys Tyr Cys Gln Leu Glu Asn Ala His Leu Val Val Ile Asn180 185 190Ser Trp Glu Glu Gln Lys Phe Ile Val Gln His Thr Asn Pro Phe Asn195 200 205Thr Trp Ile Gly Leu Thr Asp Ser Asp Gly Ser Trp Lys Trp Val Asp210 215 220Gly Thr Asp Tyr Arg His Asn Tyr Lys Asn Trp Ala Val Thr Gln Pro225 230 235 240Asp Asn Trp His Gly His Glu Leu Gly Gly Ser Glu Asp Cys Val Glu245 250 255Val Gln Pro Asp Gly Arg Trp Asn Asp Asp Phe Cys Leu Gln Val Tyr260 265 270Arg Trp Val Cys Glu Lys Arg Arg Asn Ala Thr Gly Glu Val Ala275 280 285(2)SEQ ID NO7的资料(i)序列特征(A)长度1418个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置279..992(ix)特征(A)名称/关键词misc-feature(B)位置1348(D)其它资料/注释=“聚A附加基元”(xi)序列描述SEQ ID NO7CTATCCCCCA CTTTGCAGTA CTTGCATATC TTGCTGAGTG GGTTTGAGGG CTACAATTCT 60TATTTTCTTA TGTTAAGAGG TTGCATTTCC CTTATCTCGC CCTGGTGATT CTATGCTGTG120GTTTCTTGTT CTCATCTCGT TTATCCTAGT GAGACATGTC TCTTCTTTCA TACAACTGTG180CAATATGACA ACTTATCACA GTGATTGGTT CTCATATACT ATAGAGCCTT AGAGAAGGAA240CAAGGCTCTC TTCTGACGGA GGAAGATTTT TTCTTGAT ATG GCT TCA GAA ATC293
Met Ala Ser Glu Ile1 5ACT TAT GCA GAA GTG AAG TTC AAG AAT GAA TCC AAC TCC TTG CAC ACC 341Thr Tyr Ala Glu Val Lys Phe Lys Asn Glu Ser Asn Ser Leu His Thr10 15 20TAC TCA GAA TCT CCT GCA GCT CCC AGA GAG AAA CCT ATC CGT GAT CTA 389Tyr Ser Glu Ser Pro Ala Ala Pro Arg Glu Lys Pro Ile Arg Asp Leu25 30 35AGA AAG CCT GGT TCC CCC TCA CTG CTT CTT ACA TCC CTG ATG CTA CTT 437Arg Lys Pro Gly Ser Pro Ser Leu Leu Leu Thr Ser Leu Met Leu Leu40 45 50CTC CTG CTG CTG GCA ATC ACA TTC TTA GTT GCT TTT ATC ATT TAT TTT 485Leu Leu Leu Leu Ala Ile Thr Phe Leu Val Ala Phe Ile Ile Tyr Phe55 60 65CAA AAG TAC TCT CAA CTT CTT GAA GAA AAA AAA GCT GCA AAA AAT ATA 533Gln Lys Tyr Ser Gln Leu Leu Glu Glu Lys Lys Ala Ala Lys Asn Ile70 75 80 85ATG CAC AAT GAA TTG AAC TGC ACA AAA AGT GTT TCA CCC ATG GAA GAC 581Met His Asn Glu Leu Asn Cys Thr Lys Ser Val Ser Pro Met Glu Asp90 95 100AAA GTC TGG AGC TGT TGC CCA AAG GAT TGG AGG CTA TTT GGT TCC CAC 629Lys Val Trp Ser Cys Cys Pro Lys Asp Trp ArG Leu Phe Gly Ser His105 110 115TGC TAC TTG GTT CCC ACA GTT TCT TCA TCA GCA TCT TGG AAC AAG AGT 677Cys Tyr Leu Val Pro Thr Val Ser Ser Ser Ala Ser Trp Asn Lys Ser120 125 130GAG GAG AAC TGC TCC CGC ATG GGT GCT CAT CTA GTG GTG ATC CAA AGC 725Glu Glu Asn Cys Ser Arg Met Gly Ala His Leu Val Val Ile Gln Ser135 140 145CAG GAA GAG CAG GAT TTC ATC ACT GGG ATC TTG GAC ACT CAT GCT GCT 773Gln Glu Glu Gln Asp Phe Ile Thr Gly Ile Leu Asp Thr His Ala Ala150 155 160 165TAT TTT ATA GGG TTG TGG GAT ACA GGC CAT CGG CAA TGG CAA TGG GTT 821Tyr Phe Ile Gly Leu Trp Asp Thr Gly His Arg Gln Trp Gln Trp Val170 175 180GAT CAG ACA CCA TAT GAA GAA AGT ATC ACA TTC TGG CAC AAT GGT GAG 869Asp Gln Thr Pro Tyr Glu Glu Ser Ile Thr Phe Trp His Asn Gly Glu185 190 195CCC AGC AGT GGC AAT GAA AAA TGT GCT ACA ATA ATT TAC CGT TGG AAG 917Pro Ser Ser Gly Asn Glu Lys Cys Ala Thr Ile Ile Tyr Arg Trp Lys200 205 210ACT GGA TGG GGC TGG AAC GAT ATC TCT TGC AGT CTT AAA CAG AAG TCA 965Thr Gly Trp Gly Trp Asn Asp Ile Ser Cys Ser Leu Lys Gln Lys Ser215 220 225GTT TGT CAG ATG AAG AAA ATA AAC TTA TGAATCACTC ATTCTTCATG1012Val Cys Gln Met Lys Lys Ile Asn Leu230 235GGCATTCGAT TCATTGTTAT CCAACCATTA CACAGACACC TGGGAAATTC TACAGGTTCA1072CAGAATTTAA GTGGGCAGCA AATGGTTATG CATACACTGG CCCACATATA TCCTTGTGCA1132TTTACCCACC TACTCTGTCA TAAAATGAAC TTTCATTGAG AATTTTCTAT ATACCACAGA1192GTATACAGAG TCCCTTATGG ACACACATGG AACTTTTTGC CATCTTGTTT ACTCATGCCA1252TTGTATGATA GGTTCTCTTG ACCTATCTGT TTCTGTTTCT CTGTTGTTTT TTTAATGTCT1312TTGGATTTAT TGACATTAAA TTGAGAAGTA AAATTATAAA TATTTAAGTG TCTGGATTGA1372TACACACAGA TATGTACTAT GAAATATAAT TAAATATTTA CTGTCC 1418(2)SEQ ID NO8的资料(i)序列特征(A)长度238个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO8Met Ala Ser Glu Ile Thr Tyr Ala Glu Val Lys Phe Lys Asn Glu Ser1 5 10 15Asn Ser Leu His Thr Tyr Ser Glu Ser Pro Ala Ala Pro Arg Glu Lys20 25 30Pro Ile Arg Asp Leu Arg Lys Pro Gly Ser Pro Ser Leu Leu Leu Thr35 40 45Ser Leu Met Leu Leu Leu Leu Leu Leu Ala Ile Thr Phe Leu Val Ala50 55 60Phe Ile Ile Tyr Phe Gln Lys Tyr Ser Gln Leu Leu Glu Glu Lys Lys65 70 75 80Ala Ala Lys Asn Ile Met His Asn Glu Leu Asn Cys Thr Lys Ser Val85 90 95Ser Pro Met Glu Asp Lys Val Trp Ser Cys Cys Pro Lys Asp Trp Arg100 105 110Leu Phe Gly Ser His Cys Tyr Leu Val Pro Thr Val Ser Ser Ser Ala115 120 125Ser Trp Asn Lys Ser Glu Glu Asn Cys Ser Arg Met Gly Ala His Leu130 135 140Val Val Ile Gln Ser Gln Glu Glu Gln Asp Phe Ile Tnr Gly Ile Leu145 150 155 160Asp Thr His Ala Ala Tyr Phe Ile Gly Leu Trp Asp Thr Gly His Arg165 170 175Gln Trp Gln Trp Val Asp Gln Thr Pro Tyr Glu Glu Ser Ile Thr Phe180 185 190Trp His Asn Gly Glu Pro Ser Ser Gly Asn Glu Lys Cys Ala Thr Ile195 200 205Ile Tyr Arg Trp Lys Thr Gly Trp Gly Trp Asn Asp Ile Ser Cys Ser210 215 220Leu Lys Gln Lys Ser Val Cys Gln Met Lys Lys Ile Asn Leu225 230 235(2)SEQ ID NO9的资料(i)序列特征(A)长度1370个碱基对(B)类型核酸(C)链型单链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键词CDS(B)位置273..1091(xi)序列描述SEQ ID NO9AAAGCATGGT CTCTGTGTGT TCTAATCCCT GTTCATTCTC ATTTACTGTC CCTGGGATTT 60CAGATCCAAG ACCAGCAGGA CTCCAGTCAC CTCTACCCCA GCTCTCCAGG ACACAGCGCT120CCCAACTCTG AGTGACGTCC CACCTCTGGT CCTTGCAGCA CAACCAACGT GGGAATCACA180CCCTCCAGAC CTCCCACAGC TCCACCCCAG ACTGGGCGCC GGCCCTGCCT CCATTTCAGC240TGTGACAACC TCAGAGCCGT GTTGGCCCAA GC ATG ACA AGG ACG TAT GAA AAC 293Met Thr Arg Thr Tyr Glu Asn1 5TTC CAG TAC TTG GAG AAT AAG GTG AAA GTC CAG GGG TTT AAA AAT GGG 341Phe Gln Tyr Leu Glu Asn Lys Val Lys Val Gln Gly Phe Lys Asn Gly10 15 20CCA CTT CCT CTC CAG TCC CTC CTG CTG CTG GTC ATC ATC TGT GTG GTT 389Pro Leu Pro Leu Gln Ser Leu Leu Leu Leu Val Ile Ile Cys Val Val25 30 35GGA TTC CAA AAT TCC AAA TTT CAG AGG GAC CTG GTG ACC CTG AGA ACA 437Gly Phe Gln Asn Ser Lys Phe Gln Arg Asp Leu Val Thr Leu Arg Thr40 45 50 55GAT TTT AGC AAC TTC ACC TCA AAC ACT GTG GCG GAG ATC CAG GCA CTG 485Asp Phe Ser Asn Phe Thr Ser Asn Thr Val Ala Glu Ile Gln Ala Leu60 65 70ACT TCC CAG GGC AGC AGC TTG GAA GAA ACG ATA GCA TCT CTG AAA GCT 533Thr Ser Gln Gly Ser Ser Leu Glu Glu Thr Ile Ala Ser Leu Lys Ala75 80 85GAG GTG GAG GGT TTC AAG CAG GAA CGG CAG GCA GTT CAT TCT GAA ATG 581Glu Val Glu Gly Phe Lys Gln Glu Arg Gln Ala Val His Ser Glu Met90 95 100CTC CTG CGA GTC CAG CAG CTG GTG CAA GAC CTG AAG AAA CTG ACC TGC 629Leu Leu Arg Val Gln Gln Leu Val Gln Asp Leu Lys Lys Leu Thr Cys105 110 115CAG GTG GCT ACT CTC AAC AAC AAT GGT GAG GAA GCC TCC ACT GAA GGG 677Gln Val Ala Thr Leu Asn Asn Asn Gly Glu Glu Ala Ser Thr Glu Gly120 125 130 135ACC TGC TGC CCC GTC AAC TGG GTG GAG CAC CAA GAC AGC TGC TAC TGG 725Thr Cys Cys Pro Val Asn Trp Val Glu His Gln Asp Ser Cys Tyr Trp140 145 150TTC TCT CAC TCT GGG ATG TCC TGG GCC GAG GCT GAG AAG TAC TGC CAG 773Phe Ser His Ser Gly Met Ser Trp Ala Glu Ala Glu Lys Tyr Cys Gln155 160 165CTG AAG AAC GCC CAC CTG GTG GTC ATC AAC TCC AGG GAG GAG CAG AAT 821Leu Lys Asn Ala His Leu Val Val Ile Asn Ser Arg Glu Glu Gln Asn170 175 180TTT GTC CAG AAA TAT CTA GGC TCC GCA TAC ACC TGG ATG GGC CTC AGT 869Phe Val Gln Lys Tyr Leu Gly Ser Ala Tyr Thr Trp Met Gly Leu Ser185 190 195GAC CCT GAA GGA GCC TGG AAG TGG GTG GAT GGA ACA GAC TAT GCG ACC 917Asp Pro Glu Gly Ala Trp Lys Trp Val Asp Gly Thr Asp Tyr Ala Thr200 205 210 215GGC TTC CAG AAC TGG AAG CCA GGC CAG CCA GAC GAC TGG CAG GGG CAC 965Gly Phe Gln Asn Trp Lys Pro Gly Gln Pro Asp Asp Trp Gln Gly His220 225 230GGG CTG GGT GGA GGC GAG GAC TGT GCT CAC TTC CAT CCA GAC GGC AGG 1013Gly Leu Gly Gly Gly Glu Asp Cys Ala His Phe His Pro Asp Gly Arg235 240 245TGG AAT GAC GAC GTC TGC CAG AGG CCC TAC CAC TGG GTC TGC GAG GCT 1061Trp Asn Asp Asp Val Cys Gln Arg Pro Tyr His Trp Val Cys Glu Ala250 255 260GGC CTG GGT CAG ACC AGC CAG GAG AGT CAC TGAGCTGCCT TTGGTGGGAC1111Gly Leu Gly Gln Thr Ser Gln Glu Ser His265 270CACCCGGCCA CAGAAATGGC GGTGGGAGGA GGACTCTTCT CACGACCTCC TCGCAAGACC1171GCTCTGGGAG AGAAATAAGC ACTGGGAGAT TGGAAGCACT GCTAACATTT TGAATTTTTT1231TCTCTTTAAT TTTAAAAAGA TGGTATAGTG TTCTTAAGCT TTTATTTTTT TTCCAACTTT1291TGAAAGTCAA CTTCATGAAG GTATAATTTT TACATAATAA AAATGCACTC ATTTAAAGAG1351TAAAAAAAAA AAAAAAAAA 1370(2)SEQ ID NO10的资料(i)序列特征(A)长度273个氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO10Met Thr Arg Thr Tyr Glu Asn Phe Gln Tyr Leu Glu Asn Lys Val Lys1 5 10 15Val Gln Gly Phe Lys Asn Gly Pro Leu Pro Leu Gln Ser Leu Leu Leu20 25 30Leu Val Ile Ile Cys Val Val Gly Phe Gln Asn Ser Lys Phe Gln Arg35 40 45Asp Leu Val Thr Leu Arg Thr Asp Phe Ser Asn Phe Thr Ser Asn Thr50 55 60Val Ala Glu Ile Gln Ala Leu Thr Ser Gln Gly Ser Ser Leu Glu Glu65 70 75 80Thr Ile Ala Ser Leu Lys Ala Glu Val Glu Gly Phe Lys Gln Glu Arg85 90 95Gln Ala Val His Ser Glu Met Leu Leu Arg Val Gln Gln Leu Val Gln100 105 110Asp Leu Lys Lys Leu Thr Cys Gln Val Ala Thr Leu Asn Asn Asn Gly115 120 125Glu Glu Ala Ser Thr Glu Gly Thr Cys Cys Pro Val Asn Trp Val Glu130 135 140His Gln Asp Ser Cys Tyr Trp Phe Ser His Ser Gly Met Ser Trp Ala145 150 155 160Glu Ala Glu Lys Tyr Cys Gln Leu Lys Asn Ala His Leu Val Val Ile165 170 175Asn Ser Arg Glu Glu Gln Asn Phe Val Gln Lys Tyr Leu Gly Ser Ala180 185 190Tyr Thr Trp Met Gly Leu Ser Asp Pro Glu Gly Ala Trp Lys Trp Val195 200 205Asp Gly Thr Asp Tyr Ala Thr Gly Phe Gln Asn Trp Lys Pro Gly Gln210 215 220Pro Asp Asp Trp Gln Gly His Gly Leu Gly Gly Gly Glu Asp Cys Ala225 230 235 240His Phe His Pro Asp Gly Arg Trp Asn Asp Asp Val Cys Gln Arg Pro245 250 255Tyr His Trp Val Cys Glu Ala Gly Leu Gly Gln Thr Ser Gln Glu Ser260 265 270His(2)SEQ ID NO11的资料(i)序列特征(A)长度75个氨基酸(B)类型氨基酸(C)链型无关(D)拓扑结构线性(ii)分子类型肽链(xi)序列描述SEQ ID NO11Glu Lys Met Ile Ile Lys Glu Leu Asn Tyr Thr Glu Leu Glu Cys Thr1 5 10 15Lys Trp Ala Ser Leu Leu Glu Asp Lys Val Trp Ser Cys Cys Pro Lys20 25 30Asp Trp Lys Pro Phe Gly Ser Tyr Cys Tyr Phe Thr ser Thr Asp Leu35 40 45Val Ala Ser Trp Asn Glu Ser Lys Glu Asn Cys Phe His Met Gly Ala50 55 60His Leu Val Val Ile His Ser Gln Glu Glu Gln65 70 7权利要求
1.一种基本纯化或重组的DCMP1多肽,该多肽表现出与SEQ ID NO2或8至少约85%的序列一致性。
2.一种基本纯化或重组的DCMP2多肽,该多肽包括a)选自下列序列的一段多肽1)Gly Val Ser Glu Leu Gln Glu His Thr Thr Gln LysAla His Leu Gly His Cys Pro His Cys Pro Ser Val CysVal Pro(SEQ ID NO4的118~144位残基);2)Gln Val Ala Thr Leu Asn Asn Asn Ala Ser Thr GluGly Thr Cys Cys(SEQ ID NO4的166~181位残基);或3)Trp Lys Pro Gly Gln Pro Asp Asn Trp Gln Gly HisGly Leu Gly(SEQ ID NO4的263~277位残基);或b)具有下列两种特征的序列1)包含来自SEQ ID NO10中描述的DCMP2v中的至少17个连续氨基酸;以及2)缺少一个至少含12个连续氨基酸的节段,这些氨基酸来自FKNGPLPLQS LLQRLRWGPC HLLLWLGLGL LLLVIIC(SEQ IDNO4的20~56位残基)。
3.一种包括权利要求1或2中多肽的融合蛋白。
4.一种结合化合物,它能够特异性地与权利要求1或2中的多肽结合。
5.权利要求4中的结合化合物,它是一种抗体或抗体片段。
6.一种编码权利要求1或2中多肽的核酸。
7.一种表达载体,其中含有权利要求6中所述的核酸。
8.一种宿主细胞,其中含有权利要求7中所述的载体。
9.一种用重组手段生产多肽的方法,其中包括在所述多肽能够表达的条件下培养权利要求8中所述的宿主细胞。
全文摘要
本发明描述了编码哺乳动物各种淋巴细胞蛋白的核酸及其相关试剂,其中的哺乳动物包括灵长类,相关试剂包括特异性的抗体以及纯化蛋白。本发明还提供了所述试剂的使用方法及相关试剂盒。所述的蛋白质是树突状细胞膜蛋白(DCMP),该蛋白与凝集素及脱唾液酸糖蛋白受体具有相似性。
文档编号C07K19/00GK1262689SQ9880696
公开日2000年8月9日 申请日期1998年7月8日 优先权日1997年7月9日
发明者J·瓦拉德奥, O·拉维尔, E·E·M·巴特斯, J·福德, S·塞兰德, S·J·E·勒贝奎 申请人:先灵公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1