具有改善的可制备性的FAPα特异性抗体的制作方法

文档序号：1077713阅读：763来源：国知局

专利名称：具有改善的可制备性的FAPα特异性抗体的制作方法
技术领域：
本发明涉及特异性结合成纤维细胞活化蛋白α(FAPα)的抗体蛋白。本发明还涉及上述抗体用于诊断和治疗目的的应用以及生产上述抗体的方法。
背景技术：
上皮癌的侵入性生长是同支持基质中很多特征性的细胞和分子改变相关的。很多类型上皮癌的反应性基质的高度一致的分子特征是成纤维细胞活化蛋白α(此后称为FAP)的诱导，FAPα是最初由单克隆抗体F19鉴定出来的反应性基质成纤维细胞的一种细胞表面分子(Garin-Chesa P.,Old L.J.和Rettig W.J.(1990)反应性基质成纤维细胞的细胞表面糖蛋白作为人上皮癌中一个潜在的抗体的靶。美国国家科学院进展(Proc.Natl.Acad.Sci.)87:7235)。由于FAP抗原选择性地表达于一系列上皮癌的基质中而不依赖于位置和组织学类型，所以发展了一种FAP靶向构想来显象、诊断和治疗上皮癌以及某些其它情况。为了此目的，研制出一种被称为F19的特异性结合FAP的单克隆抗体，并描述于美国专利5,059,523和WO93/05804中，此处它们被完整引入作为参考。
在非人抗体用于人体内应用时产生的一个严重问题是它们迅速引起一种人抗非人的反应，其在患者体内降低抗体的效果并影响继续给药。非人抗体的人源化通常按照两种方法之一来实现(1)通过构建非人/人嵌合抗体，其中将非人的可变区连接至人的恒定区(Boulianne G.L.,Hozumi N.和ShulmanM.J.(1984)功能性小鼠/人嵌合抗体的产生，自然(Nature)312:643)或者(2)通过将互补决定区(CDR)从非人的可变区移植至人的可变区，然后将这些“重构的”人的可变区连接至人的恒定区(Riechmann L., Clark M., Waldmann H.和Winter G.(1988)重构人的抗体用于治疗，自然332:323)。嵌合抗体虽然明显优于小鼠的抗体，但仍在人体内引发一种抗小鼠的反应(LoBuglio A.F.,Wheeler R.H.,Trang J.,Haynes A.,Rogers K.,Harvey E.B.,Sun L.,Ghrayeb J.和Khazaeli M.B.(1989)在人体内的小鼠/人嵌合单克隆抗体动力学和免疫应答，美国国家科学院进展86:4220)。CDR移植的或重构的人抗体含有很少或者没有可以被鉴定为源自小鼠抗体的蛋白质序列。虽然一种通过CDR移植进行人源化的抗体可能仍能引发一些免疫反应，例如即使利用天然的人的抗体也可见到的抗同种异型或抗独特型反应，但CDR移植的抗体的免疫原性将明显低于小鼠的抗体，因此能够对患者进行更长期的治疗。
同抗体用于诊断、显象和治疗的商业用途相关的另一个严重的限制是它们大量生产的可能性。很多情况下，天然的、嵌合的和/或CDR移植的抗体在细胞培养系统中的重组表达很差。对较差的可制备性起作用的因素可能包括先导序列的选择和用于生产的宿主细胞的选择，以及不适当的折叠和分泌的减少。不适当的折叠可以导致重链和轻链难以组装或者产生妨碍一条或两条链分泌的不适于转运的构象。通常认为L-链提供组装蛋白分泌的能力。在一些情况下，多个或者甚至单个替换可以引起抗体的可制备性增加。
由于在人类中特定疾病相关抗原的体外和体内特异性免疫学靶向对于诊断和治疗的临床重要性，所以对于联合抗原特异性、低免疫原性以及高可制备性特征的抗体的需要不断增加。
因此，本发明要解决的问题是提供抗体蛋白，其联合了特异性结合FAP、在人体内低免疫原性以及在重组系统中高可制备性的性质。
发明的公开通过在权利要求中说明特征的实施方案解决了技术问题。
本发明提供具有单克隆抗体F19(ATCC入藏登记号HB8269)的互补决定区的新型抗体蛋白，所述的新型抗体蛋白特异性结合成纤维细胞活化蛋白(FAP)，并以其具有框架修饰为特征，这些框架修饰导致同带有F19的可变区和外源的恒定区的嵌合抗体相比在宿主细胞中的可制备性提高。
如本文所用的，“抗体蛋白”是具有单克隆抗体的抗原结合特异性的蛋白。
根据Kabat(Kabat E.A.,Wu T.T.,Perry H.M.,Gottesman K.S.和Foeller C.(1991)有免疫学意义的蛋白质的序列(第5版),NIH出版号91-3242,U.S.Department of Health and Human Services,Public Health Service,National Institute of Health,Bethesda,MD.)连同Chothia和Lesk(Chothia和Lesk(1987)分子生物学杂志(J.Mol.Biol.)196:901-917)，“单克隆抗体的互补决定区”被理解为参与特异性抗原结合的那些氨基酸序列。
如本文所用的，术语“框架修饰”指在可变区中围绕各互补性性决定区的一个或多个氨基酸的交换、缺失或添加。框架修饰可能对抗体蛋白的免疫原性、可制备性或结合特异性有影响。
“成纤维细胞活化蛋白(FAP)”，也称成纤维细胞活化蛋白α(FAPα)，是属于丝氨酸蛋白酶基因家族的一种膜结合糖蛋白(WO 97/34927)。尚不了解脱落或分泌形式的FAP。FAP可以通过其结合单克隆抗体F19来鉴定(F19可获自保藏于ATCC的入藏登记号HB 8269的杂交瘤细胞系)。
术语抗体蛋白的“成纤维细胞活化蛋白特异性结合”本文是指其特异性识别和结合表达FAP的人类细胞的能力。本发明蛋白质的结合特异性可以通过如在实施例6、8和实施例12中举例描述的用于评价结合特异性的标准方法来确定。
术语“嵌合抗体”指具有如在

图17和18中所描述的轻链和重链可变区以及外源恒定区的抗体蛋白。本文所定义的“外源恒定区”为不同于F19的恒定区的恒定区。为了将本发明的抗体蛋白同一种嵌合抗体进行比较，这样的嵌合抗体必需含有与所述抗体蛋白相同的的恒定区。单纯为了说明和比较，在图19至22中所描述的人的重链恒定区和轻链恒定区被用来作为一种示范。
为了提供本发明的抗体蛋白，从提取自F19的杂交瘤细胞(ATCC入藏登记号HB 8269)的RNA中确定了被称为F19的小鼠抗体的重链和轻链基因核酸序列。
在一个实施方案中本发明涉及具有F19单克隆抗体(ATCC入藏登记号HB 8269)的互补性决定区的抗体蛋白，所述的新型抗体蛋白特异性结合成纤维细胞活化蛋白(FAP)，并以其具有框架修饰为特征，这些框架修饰导致同具有F19的可变区和外源恒定区的嵌合抗体相比在宿主细胞中可制备性提高，其中所述的抗体蛋白源自被称为F19的小鼠抗体(ATCC入藏登记号HB8269)。
为了产生人源化的FAP特异性抗体蛋白，构建了一种嵌合抗体，其分别具有F19的轻链和重链可变区以及人的轻链和重链恒定区。小鼠/人嵌合抗体的构建和制备是众所周知的(Boulianne等(1984)，上面所参考的)，而且在实施例1和2中以一种示范的方式进行说明。
本发明抗体蛋白的可变区通常连接至免疫球蛋白恒定区(Fc)的至少一部分，通常为人免疫球蛋白的部分。对于人恒定区的DNA序列可以按照所周知的方法分离自多种人类细胞，但优选永生化的B细胞(见Kabat等，同上，以及WO 87/02671)。因此，本发明的抗体蛋白可能含有全部或者仅仅一部分的恒定区，只要它们表现出对FAP抗原的特异性结合。恒定区的类型和范围的选择依赖于是否需要像补体固定或者抗体依赖的细胞毒这样的效应物功能，以及抗体蛋白的预期药理学特性。本发明的抗体蛋白通常为一种由2个轻链/重链对组成的四聚体，但也可能为二聚体，即由一个轻链/重链对组成，例如Fab或Fv片段。
因此，在另一个实施方案中，本发明涉及根据本发明的抗体蛋白，其以具有均连接至人的恒定区的轻链可变区和重链可变区为特征。特别是，轻链可变区连接至人K恒定区，而重链可变区连接至人γ1恒定区。其它用于人源化轻链和重链的人的恒定区对于专家也是可利用的。
因此，在一个特定的实施方案中，本发明的抗体蛋白包括一个人K恒定区。
此外，在另一个特定的实施方案中，本发明的抗体蛋白包括一个人γ1恒定区。
一个特定的“F19嵌合抗体”蛋白(cF19)由在图17至22中所描述的轻链和重链可变区以及恒定区组成。cF19显示出对FAP抗原的特异性结合和高度的亲和力。如在实施例2中所显示的，cF19在COS细胞(源自一种非洲绿猴肾脏的细胞)中的表达很差，从大约10到60ng/ml，其比大多数抗体低至少10倍。
为了增加cF19的表达水平，通过在-9位处将脯氨酸替换为亮氨酸来改变F19 VL区的先导序列。这种在先导序列中氨基酸的单个改变导致在COS细胞中所制备的嵌合抗体的量至少翻一番。对于这种特定的嵌合抗体在COS细胞中的表达，利用了下面突变的轻链先导序列MDSQAQVLMLLLLWVSGTCG，以及下面的重链先导序列MGWSWVFLFLLSGTAGVLS。
根据本发明，术语在宿主细胞中“改善的可制备性”指在同未进行框架修饰的嵌合抗体的表达水平和/或抗体产量相比时，表达水平和/或纯化抗体的产量显著改善。说明改善的可制备性的两个特定但非限制性的实例以COS细胞表达系统(在实施例2和5中)和CHO细胞表达系统(在实施例10和11中)为例。
虽然先导序列的突变仅仅导致F19嵌合抗体表达产量翻一番，但本文所限定的显著改善指表达水平和/或纯化产量至少10倍的改善。
在一优选的实施方案中，本发明涉及抗体蛋白，它们以其在原始培养基样品中通过ELISA测定的表达水平和/或纯化抗体的产量超过无框架修饰的嵌合抗体的表达水平和/或纯化产量至少10倍为特征。
在一更优选的实施方案中，本发明涉及抗体蛋白，它们以其在原始培养基样品中通过ELISA测定的表达水平和/或纯化抗体的产量超过无框架修饰的嵌合抗体的表达水平和/或纯化产量至少20倍为特征。
在一最优选的实施方案中，抗体蛋白，它们以其在原始培养样品中通过ELISA测定的表达水平和/或纯化抗体的产量超过无框架修饰的嵌合抗体的表达水平和/或纯化产量至少100倍为特征。
如对于COS和CHO(中国仓鼠卵巢来源的细胞)真核细胞(见实施例5和11)所示的，可以证实通常真核细胞中本发明重组抗体蛋白的可制备性改善。在另一实施方案中，本发明涉及以在真核细胞中表现出改善的可制备性为特征的重组抗体蛋白。
在一优选的实施方案中，本发明涉及抗体蛋白，其中所述的真核细胞为中国仓鼠卵巢细胞(CHO细胞)。
意外发现，轻链可变区的某些框架修饰决定了本发明抗体蛋白的改善的可制备性。制备了3型重构的轻链可变区，被指定为A型、B型和C型，其被描述于图1至6中。
A型、B型和C型轻链可变区显示出在CHO细胞中显著改善的可制备性(见实施例11)。虽然A型和C型轻链可变区比B型轻链可变区仅有两个常见氨基酸残基不同，但它们在可制备性上表现出更显著的改善。在人重构的F19轻链B型和A或C型之间抗体分泌水平存在至少10倍的差别。重构的人F19轻链A型和B型其氨基酸序列中的差异仅在36位(Tyr到Phe突变)和87位(Tyr到Asp突变)处(根据Kabat命名)。如果Tyr到Asp和Tyr到Phe突变分别或联合仅仅引起蛋白质不适当的折叠，那么这种对于含有轻链可变区B型的抗体的分泌能力的负效应可能是间接的。但这不可能是事实，因为抗原结合检测表明带有F19轻链B型的免疫球蛋白与带有F19轻链A或C型的免疫球蛋白具有相似的亲合力，提示它们大概并未错误折叠。
重构的人F19轻链B型与A和C型相比，其87位残基似乎格外是分泌减少的原因。
在一优选的实施方案中，本发明涉及根据本发明的抗体蛋白，其中在轻链区的Kabat 87位上的氨基酸不是天冬酰胺。
在一更优选的实施方案中，本发明涉及根据本发明的抗体蛋白，其中在轻链区的Kabat 87位上的氨基酸选自芳香族或脂肪族氨基酸。
在一最优选的实施方案中，本发明涉及根据本发明的抗体蛋白，其中在轻链区的Kabat 87位上的芳香族氨基酸为酪氨酸或苯丙氨酸。
在另一实施方案中，本发明还涉及根据本发明的抗体蛋白，其中在轻链区的Kabat 36位上的氨基酸选自芳香族氨基酸。
在一特定的实施方案中，本发明涉及特异的抗体蛋白，其可以由单个公开的轻链和重链的重构可变区来制备。
特别是轻链可变区A和C型因为其在保留全部FAP结合特异性和实现低的免疫原性的同时具有格外高的可制备性而非常适于实施本发明。这在同具有F19可变区和相同恒定区的嵌合抗体相比以及同轻链B型相比时是成立的。
因此，在一个实施方案中，本发明涉及抗体蛋白，其含有在SEQ ID NO:2中所示的轻链可变区。
在另一实施方案中，本发明还涉及抗体蛋白，其以轻链可变区由在SEQID NO:1中所示的核苷酸序列编码为特征。
在一个实施方案中，本发明涉及抗体蛋白，其含有在SEQ ID NO:6中所示的轻链可变区。
在另一实施方案中，本发明还涉及抗体蛋白，其以轻链可变区由在SEQID NO:5中所示的核苷酸序列编码为特征。
本发明还公开了几种不同的重链可变区，它们与轻链可变区A和C型联合可很好地改善可制备性。
在一个实施方案中，本发明涉及抗体蛋白，其含有在SEQ ID NO:8、10、12、14中所示的重链可变区。
在另一实施方案中，本发明涉及抗体蛋白，其以重链可变区是由在SEQID NO:7、9、11、13的任何一个中所示的核苷酸序列所编码为特征。
在一个非常特定的实施方案中，本发明涉及抗体蛋白，其含有在SEQ IDNO:2中所示的轻链可变区以及在SEQ ID NO:12中所示的重链可变区。最优选该抗体蛋白额外含有在SEQ ID NO:20中所示的轻链恒定区以及在SEQ IDNO:22中所示的重链恒定区。
因此，本发明的另一个方面为一种抗体蛋白，其含有SEQ ID NO:2所示的氨基酸序列。更优选这种抗体蛋白进一步含有SEQ ID NO:12所示的氨基酸序列。更优选所述抗体蛋白进一步含有SEQ ID NO:20所示的氨基酸序列以及SEQ ID NO:22所示的氨基酸序列。本发明的另一个方面为一种抗体蛋白，如在此段中所描述的，其偶联一种放射性同位素，优选131I、125I、186Re、188Re或90Y。本发明的另一方面为一种DNA分子，其编码在此段中所描述的抗体蛋白。本发明的另一个方面为携带这样一种DNA分子的宿主细胞。相应地，本发明的另一个方面为制备此段中所描述的抗体蛋白的方法，所述的方法包括在所述抗体蛋白由所述的宿主细胞表达的条件下培养该宿主细胞以及分离该蛋白。本发明的另一个方面为一种药物组合物，其包括本发明的抗体蛋白以及一种可药用的载体。在另一特定的实施方案中，本发明涉及抗体蛋白，其特征是轻链可变区由SEQ ID NO:1所示核苷酸序列所编码而重链可变区由SEQ ID NO:11所示核苷酸序列所编码。
在另一特定的实施方案中，本发明涉及抗体蛋白，其含有在SEQ ID NO:2中所示的轻链可变区和在SEQ ID NO:8中所示的重链可变区。
在另一特定的实施方案中，本发明涉及抗体蛋白，其特征是轻链可变区由SEQ ID NO:1所示核苷酸序列所编码而重链可变区由SEQ ID NO:7所示核苷酸序列所编码。
小鼠抗体可变区的人源化可以通过利用本领域已知的方法来实现。EP0239400公布了将小鼠可变区的CDR移植至人可变区的框架中。WO90/07861公布了通过引入另外的框架修饰来对一个CDR移植的可变区重构的方法。WO 92/11018公布了联合供者CDR和一个与供者框架高度同源的受者框架来制备人源化Ig的方法。WO 90/05274公布了从一小鼠抗体开始的框架突变抗体的制备。其它同小鼠单克隆抗体的人源化相关的现有技术的参考有EP 0368684；EP 0438310；WO 92/07075或WO 92/22653。因此，专家可以从公开提供的小鼠单克隆抗体F19开始并利用本领域已知的技术，例如WO 92/05274来制备本发明的抗体。编码本发明抗体蛋白的DNA分子当然也可以通过现有技术中的合成方法来获得，例如通过相应寡核苷酸的化学合成以及随后的连接和扩增步骤(见例如Frank等(1987)酶学方法(MethodsEnzymol.)154:221-249)。
在另一个方面，本发明涉及核酸分子，其含有如上面所公布的根据本发明的抗体蛋白的编码信息。优选根据本发明的核酸分子为含有选自SEQ IDNO:1、3、5、7、9、11、13或15的一个核苷酸序列的核酸分子。
本发明的另一个方面为一种重组DNA载体，其含有上述核酸中任何一个的核苷酸序列，特别是在所述的核苷酸序列可操作连接至表达载体中的表达控制序列时。优选重组DNA载体，所述的载体为表达载体。
本发明的另一个方面为一种宿主细胞，其携带所述载体，特别是表达载体。这样一种宿主细胞可以是原核或真核细胞。优选这样一种宿主细胞为真核细胞、酵母细胞或者哺乳动物细胞。更优选，所述的宿主细胞为CHO(中国仓鼠卵巢)细胞或COS细胞。
相应地，本发明还有另一个方面为制备根据本发明的抗体蛋白的方法。这样一种方法包括以下步骤(a)在所述抗体蛋白由上述宿主细胞表达的条件下培养所述的宿主细胞，并且(b)分离所述的抗体蛋白。
哺乳动物宿主细胞，特别CHO或COS，是优选的。用于制备本发明抗体蛋白的宿主细胞可以由同时包含轻链和重链表达单位的单个载体来转染(见，例如WO 94/11523)。在一个特定的实施方案中，制备根据本发明的抗体蛋白的方法涉及宿主细胞，其中所述的宿主细胞由分别携带轻链和重链表达单位的两个质粒共转染(见，例如EP 0481790)。
本发明的抗体蛋白提供了用于将治疗试剂靶向至FAP抗原的高度特异性的工具。因此，在另一个方面，本发明涉及根据本发明的抗体蛋白，其中所述的抗体蛋白结合至一种治疗试剂。在本领域已知的多种治疗试剂中，优选选自放射性同位素、毒素、类毒素、致炎介质、酶、反义分子、肽、细胞因子以及化疗试剂的治疗试剂。在放射性同位素中，发射γ、β和α射线的放射性同位素可以用作治疗试剂。优选发射β射线的放射性同位素作为用于治疗的放射性同位素。已经证实186铼、188铼、131碘和90钇是实现局部照射和破坏恶性肿瘤细胞的特别有效的发射γ-射线的放射性同位素。因此，特别优选选自186铼、188铼、131碘和90钇的放射性同位索作为结合本发明抗体蛋白的治疗试剂。例如，可以利用在WO 93/05804中所公布的方法对本发明的抗体进行放射性碘标记。
本发明的另一个方面涉及根据本发明的抗体蛋白，其以被标记为特征。这样一种标记的FAP特异性抗体使得可以进行FAP抗原的体外和/或体内定位和/或检测。标记定义为可以直接或间接检测的标志物。间接标志物定义为一种标志物，其本身不能被检测到，还需要特异性针对该间接标志物的另一种直接可检测的标志物。用于实施本发明的优选的标记为可检测的标志物。在大量可检测的标志物中，最优选选自酶、染料、放射性同位素、地高辛配基和生物素的可检测的标志物。
本发明的另一个方面涉及根据本发明的抗体蛋白，其以结合一种可显象试剂为特征。各种各样的可显象试剂，特别是放射性同位素，是现有技术中可提供的。对于实施本发明更优选发射γ-射线的放射性同位素。最优选的是125碘。
本发明的一个方面涉及药物组合物，其含有一种如上所述的根据本发明的抗体蛋白以及一种可药用的载体。此类药物组合物对于治疗肿瘤是有效的，其中所述的肿瘤同活化的基质成纤维细胞相关。抗肿瘤基质免疫疗法有两个可能的效应物原则，它们可以协同作用(a)根据本发明的一种未修饰(非结合的，“裸露的”)的抗体可以在肿瘤基质中诱导免疫破坏或者炎症反应，而(b)一种结合了治疗试剂例如放射性同位素或其它毒性物质的抗体，可以实现对恶性肿瘤细胞的局部照射和破坏。相应地，本发明的另一个方面为所描述的抗体蛋白对于制备药物组合物，特别是制备用于肿瘤治疗的药物组合物的应用。
另一个实施方案为药物组合物，其包括结合有如上所述的治疗试剂的根据本发明的抗体蛋白以及对于治疗肿瘤有效的可药用的载体，其中所述的肿瘤同活化的基质成纤维细胞相关。另一实施方案涉及药物组合物，其包括结合有如上所述的可显象试剂的根据本发明的抗体蛋白以及对于使患者体内正在愈合的伤口、发炎的皮肤或肿瘤中存在的活化基质成纤维细胞显象有效的可药用的载体。一个最优选的实施方案涉及上面提到的药物组合物，其中所述的肿瘤选自结直肠癌、非小细胞肺癌、乳腺癌、头颈部癌、卵巢癌、肺癌、侵入性膀胱癌、胰腺癌和脑转移癌。
在动物或人体内，可以证实根据疾病或所治疗异常情况例如肿瘤的类型和起源，通过静脉内或其它途径，例如系统地、局部地或外用地向目的组织或器官应用上述药物组合物是便利的。例如，当不同的器官或器官系统需要治疗，如在例如系统性自身免疫病，或者过敏，或者外源器官或组织的移植，或者播散的或难以定位的肿瘤中时，需要一种系统的作用方式。在预期只有肿瘤或免疫学作用的局部表现，例如局部的肿瘤时，将考虑一种局部的作用方式。
本发明的抗体蛋白可以通过专家已知的不同用药途径用药，特别是静脉注射或直接注射至靶组织中。对于系统性用药，静脉内、血管内、肌肉内、动脉内、腹膜内、口服或鞘内途径都是优选的。更局部的用药可以经皮下、皮内、贲门内、叶内、髓内、肺内或直接进入或者临近待治疗组织(结缔组织、骨组织、肌肉组织、神经组织、上皮组织)而发挥作用。根据治疗的预期持续时间和效果，药物抗体组合物可以被一次或数次施予，也可以间断施予，例如每日用药持续数天、数周或数月并以不同的剂量。
对于制备用于上述用途的适当抗体制剂，专家可以使用已知的可注射的、生理可接受的无菌溶液。制备肠胃外注射或输注的随时可用的溶液时，可方便地选用等渗的水溶液，例如盐水，或者相应的血浆蛋白溶液。药物组合物可以呈现为冻干剂或干燥制剂，其在使用前可以在无菌条件下直接用已知的可注射溶液，例如作为部分的一个试剂盒进行复原。通过将纯化的根据本发明的抗体同无菌的生理可接受溶液相混合来制备本发明抗体组合物的最终制剂用于注射、输注或灌注，其中可以补加已知的载体物质或/和添加剂(例如血清白蛋白、葡萄糖、亚硫酸氢钠、EDTA)。
所用抗体的量有赖于疾病的性质。在癌症患者中，“裸露”抗体的用药剂量可以在每次用药0.1到100mg/m2之间，优选在5到50mg/m2之间。对于如用碘-131标记的放射性标记抗体，必需确定在治疗中一定不能超过的最大耐受量(MTD)。因而放射性标记的抗体在癌症患者体内的应用可以通过(每月或每周地)重复静脉内输注低于MTD的剂量来进行(见，例如Welt等(1994)临床肿瘤学杂志(J.Clin.Oncol.)12:1193-1203)。
此外，本发明的一个方面涉及根据本发明的抗体蛋白用于癌症治疗的应用。在一优选的实施方案中，本发明涉及结合上述用于癌症治疗的治疗试剂的本发明抗体蛋白的应用。在另一优选的实施方案中，本发明涉及结合用于显象活化的基质成纤维细胞的一种可显象试剂的本发明抗体蛋白的应用。在另一个优选的实施方案中，本发明涉及根据本发明的标记抗体蛋白用于检测样品中活化的基质成纤维细胞存在的应用。
本发明的一个方面涉及一种治疗肿瘤的方法，其中该肿瘤与能够同根据本发明的抗体蛋白特异性形成复合物的活化基质成纤维细胞相关，其中的抗体蛋白表现为裸露/未修饰的抗体、修饰的抗体蛋白，例如融合蛋白、或者结合治疗试剂的抗体蛋白，该方法包括使肿瘤同有效量的上述抗体相接触。在一优选的实施方案中，本发明涉及治疗如上所述肿瘤的方法，其中该肿瘤为具有选自结直肠癌、非小细胞肺癌、乳腺癌、头颈部癌、卵巢癌、肺癌、侵入性膀胱癌、胰腺癌和脑转移癌的癌细胞的肿瘤。治疗如上所述的肿瘤的方法可以在体外或体内发挥作用。
本发明的另外一个方面涉及检测正在愈合的伤口、炎症或肿瘤中是否有活化的基质成纤维细胞的一种方法，其特征是(a)在适于所述抗体和抗原形成复合物的条件下，将一种可能含有活化的基质成纤维细胞的样品同根据本发明的一种抗体蛋白相接触，(b)检测所述复合物的存在，由此检测正在愈合的伤口、炎症或肿瘤中活化的基质成纤维细胞的存在。
在一优选的实施方案中，本发明涉及检测肿瘤中活化的基质成纤维细胞存在的方法，其中肿瘤为具有选自结直肠癌、非小细胞肺癌、乳腺癌、头颈部癌、卵巢癌、肺癌、侵入性膀胱癌、胰腺癌和脑转移癌的癌细胞的肿瘤。本发明最优选的抗体蛋白是以如上所述被标记为特征的那些。
本发明的另一个方面还涉及使人类患者体内正愈合的伤口、发炎的组织(类风湿性关节炎和肝硬变均为阳性)或肿瘤中存在的活化的基质成纤维细胞显象的一种方法，其特征是(a)在适于形成抗体-抗原复合物的条件下，将结合显象试剂的根据本发明的抗体蛋白施予患者，(b)显象以该方式所形成的任何复合物，(c)由此显象患者中活化的基质成纤维细胞的存在在一优选的实施方案中，本发明涉及在肿瘤中显象如上所述活化的基质成纤维细胞存在的方法，其中肿瘤为具有选自结直肠癌、非小细胞肺癌、乳腺癌、头颈部癌、卵巢癌、肺癌、膀胱癌、胰腺癌和脑转移癌的癌细胞的肿瘤。
在另一个方面，本发明还涉及一种检测肿瘤-基质的方法，其特征是(a)在适于形成抗体-抗原复合物的条件下，将一适当的样品同根据本发明的抗体蛋白相接触，(b)检测因此所形成的任何复合物的存在，(c)将所述复合物的存在和肿瘤-基质的存在相联系用于实施本发明的抗体蛋白优选用可检测的标志物标记。
在另一个方面，本发明还涉及在患者中显象肿瘤-基质的方法，其包括(a)在适于形成抗体-抗原复合物的条件下，施予患者如上所述结合可显象试剂的根据本发明的抗体蛋白，(b)显象因此所形成的任何复合物，并由此在患者中显象肿瘤-基质的存在。
图的说明图1．重构的人F19轻链可变区A型(hF19LA)的DNA序列，SEQ IDNO:1。
图2．重构的人F19轻链可变区A型(hF19LA)的氨基酸序列，SEQ IDNO:2。
图3．重构的人F19轻链可变区B型(hF19LB)的DNA序列，SEQ IDNO:3。与A型不同的核苷酸标有下划线并为粗体。
图4．重构的人F19轻链可变区B型(hF19LB)的氨基酸序列，SEQ IDNO:4。与A型不同的氨基酸标有下划线并为粗体。
图5．重构的人F19轻链可变区C型(hE19LC)的DNA序列，SEQ IDNO:5。与A型不同的核苷酸标有下划线并为粗体。
图6．重构的人F19轻链可变区C型(hF19LC)的氨基酸序列，SEQ IDNO:6。与A型不同的氨基酸标有下划线并为粗体。
图7．重构的人F19重链可变区A型(hF19HA)的DNA序列，SEQ IDNO:7。
图8．重构的人F19重链可变区A型(hF19HA)的氨基酸序列，SEQ IDNO):8。
图9．重构的人F19重链可变区B型(hF19HB)的DNA序列，SEQ IDNO:9。与A型不同的核苷酸标有下划线并为粗体。
图10．重构的人F19重链可变区B型(hF19HB)的氨基酸序列，SEQ IDNO:10。与A型不同的氨基酸标有下划线并为粗体。
图11．重构的人F19重链可变区C型(hF19HC)的DNA序列，SEQ IDNO:11。与A型不同的核苷酸标有下划线并为粗体。
图12．重构的人F19重链可变区C型(hF19HC)的氨基酸序列，SEQ IDNO:12。与A型不同的氨基酸标有下划线并为粗体。
图13．重构的人F19重链可变区D型(hF19HD)的DNA序列，SEQ IDNO:13。与A型不同的核苷酸标有下划线并为粗体。
图14．重构的人F19重链可变区D型(hF19HD)的氨基酸序列，SEQ IDNO:14。与A型不同的氨基酸标有下划线并为粗体。
图15．重构的人F19重链可变区E型(hF19HE)的DNA序列，SEQ IDNO:15。与A型不同的核苷酸标有下划线并为粗体。
图16．重构的人F19重链可变区E型(hF19HE)的氨基酸序列，SEQ IDNO:16。与A型不同的氨基酸标有下划线并为粗体。
图17．F19嵌合轻链可变区(chF19LC)的氨基酸序列，SEQ IDNO:17。
图18．F19嵌合重链可变区(chF19HC)的氨基酸序列，SEQ IDNO:18。
图19．人κ轻链恒定区的DNA序列，SEQ ID NO:19。
图20．人轻链恒定区的氨基酸序列，SEQ ID NO:20。
图21．人重链恒定区的DNA序列，SEQ ID NO:21。
图22．人重链恒定区的氨基酸序列，SEQ ID NO:22。
图23．哺乳动物细胞表达载体，其用于制备具有人K轻链和人γ-1重链的嵌合人抗体和重构的人抗体。
(a)轻链表达载体pKN100(b)重链表达载体pG1D105图24．修饰来用于构建嵌合的F19轻链的小鼠F19轻链可变区的DNA和氨基酸序列。限制性酶切位点用粗体字母标出。Kozak序列、CDR 1至3和剪接供体位点标有下划线。
图25．修饰来用于构建嵌合的F19重链的小鼠F19重链可变区的DNA和氨基酸序列。限制性酶切位点用粗体字母标出。Kozak序列和剪接供体位点标有下划线。
图26．克隆到pKN100哺乳动物表达载体中的F19嵌合抗体的DNA序列。限制性酶切位点由粗体字母和下划线标出。CDR1至3和剪接供体位点标有下划线。这是在pKN100真核表达载体内的小鼠F19轻链的DNA序列。该载体具有人x恒定区基因(同种异型Km(3))的-种cDNA，其被一个强的人工终止序列所终止。此外，Neo筛选基因也被该人工序列所终止，而且也处于同x轻链表达盒相同的方向。
pKN100真核表达载体的基本组分为1-6=EcoRⅠ位点7-1571 =HCMVi启动子/增强子583-587=TATAA盒610=转录起点728-736=剪接供体位点731=内含子起点1557 =内含子终点1544-1558 =剪接受体位点1590-1598 =Kozak序列1599-1658 =肽先导序列1659-1997 =小鼠F19轻链1996-2004 =剪接供体位点2011-2657 =人x恒定区(Km(3))基因的cDNA拷贝2664-2880 =人工的spaC2终止序列2887-7845 =其为包括Amp抗性基因(处于相反的方向)、ColEⅠ和SV40复制起点以及Neo抗性基因(处于同HCMVi-KCT表达盒相同的方向)的pSV2neo载体DNA片段7852-8068 =人工spaC2终止信号该序列在紧靠序列起点处的EcoRⅠ位点(位点1-6)的上游终止。作为一种载体，该DNA序列将是环形的。
图27．克隆到pgld105哺乳动物表达载体中的F19嵌合抗体的DNA序列。限制性酶切位点由粗体字母和下划线标出。CDR1至3和剪接供体位点标有下划线。这是含有小鼠F19重链可变区的真核表达载体pG1D105的DNA序列。该载体含有人γ-1恒定区(同种异型Glm(non-a,z,-x)，也称为Gml(17)同种异型)的一种cDNA。
该构建体的基本组分为1-2501 =基于pBR322并包括氨苄青霉素抗性基因和ColEⅠ起点加上SV40起点以及残缺的SV40早期启动子的序列2502-3226 =dhfr基因3233-4073 =SV40多聚A序列等4074-4079 =连接的BamHⅠ和BglⅡ位点(BstYⅠ)4080-4302 =SPA位点加上C2终止信号4303-5867 =HCMVi启动子5879-5885 =用于克隆免疫球蛋白可变区基因的唯一Hind Ⅲ限制性位点5886-5894 =Kozak序列5895-5951 =信号肽5952-6323 =小鼠F19重链6323-6330 =剪接供体位点6331-6336 =用于克隆免疫球蛋白可变区基因的唯一BamHⅠ限制性位点6337-7388 =人γ-1恒定区的cDNA拷贝，其前面有一62bp的内含子7389-7709 =Amie终止序列在该构建体中所用的人γ-l恒定区具有一个Glm(non-a,z,-x)，也称为Gml(17)的同种异型，其被限定为356位(根据Eu编号)的谷氨酸残基(E)、358位(根据Eu编号)的蛋氨酸残基(M)以及214位(根据Eu编号)的赖氨酸残基(K)。这3个氨基酸在上面的序列中均标有下划线。
图28．基于PCR的用于构建人重构的F19轻链的方法。该图提供了构建策略的简要示意图。虚线表示在引物间一段至少21个碱基的互补序列。
图29．重构的人F19轻链可变区A型、B型和C型的核苷酸和推导的氨基酸序列。将核苷酸和推导的氨基酸序列对齐排列并同A型的相比较，短划线表示同该序列核苷酸的相同性，点表示同该序列氨基酸的相同性。氨基酸根据Kabat等(1991)来编号。CDR的位置用框标出。
图30．克隆到pKN100哺乳动物表达载体中的F19LA(人重构的轻链A型)的DNA序列。限制性酶切位点由粗体字母和下划线标出。CDR1至3和剪接供体位点标有下划线。这是克隆至pKN100真核表达载体中的重构F19轻链A型的DNA序列。该载体具有人χ恒定区基因(同种异型Km(3))的一种cDNA，其被一个强的人工终止序列所终止。此外，Neo筛选基因也被该人工序列所终止，而且也处于同χ轻链表达盒相同的方向。
该载体的基本组分为7-1571=HCMVi启动子/增强子583-587 =TATAA盒610 =转录起点728-736 =剪接供体位点731 =内含子起点1557 =内含子终点1544-1558 =剪接受体位点1590-1598 =Kozak序列1599-1658 =肽先导序列1659-1997 =重构的F19轻链A型1996-2004 =剪接供体位点2011-2657 =人x恒定区(Km(3))基因的cDNA拷贝2664-2880 =人工的spaC2终止序列2887-7845 =其为包括Amp抗性基因(处于相反的方向)、ColEⅠ和SV40复制起点以及Neo抗性基因(处于同HCMVi-KCT表达盒相同的方向)的pSV2neo载体DNA片段7852-8068 =人工spaC2终止信号该序列终止于紧靠以下序列起点处的EcoRⅠ位点(位点1-6)的上游。作为一种载体，该DNA序列是环形的。
图31．基于PCR的用于构建人重构的F19重链的方法。该图提供了构建策略的简要示意图。虚线表示在引物间一段至少21个碱基的互补序列。
图32．重构的人F19重链可变区A型至E型的核苷酸和推导的氨基酸序列。将核苷酸和推导的氨基酸序列对齐排列并同A型的相比较，短划线表示同该序列核苷酸的相同性，点表示同该序列氨基酸的相同性。氨基酸根据Kabat等(1991)来编号。CDR的位置用框标出。
图33．克隆到pg1d105哺乳动物表达载体中的F19Ha(人重构的重链A型)的DNA序列。限制性酶切位点由粗体字母和下划线标出。CDR 1至3和剪接供体位点标有下划线。这是含有重构的F19重链可变区A型的真核表达载体pG1D105的DNA序列。该载体含有人γ-1恒定区(同种异型Glm(non-a,z,-x)，也称为Gml(17)同种异型)的一种cDNA。
该构建体的基本组分为1-2501 =基于pBR322并包括氨苄青霉素抗性基因和ColEⅠ起点加上SV40起点以及残缺的SV40早期启动子的序列2502-3226 =dhfr基因3233-4073 =SV40多聚A序列等4080-4302 =SPA位点加上C2终止信号4303-5867 =HCMVi启动子/增强子5879-5885 =用于克隆免疫球蛋白可变区基因的唯一Hind Ⅲ限制性位点5886-5894 =Kozak序列5895-5951 =信号肽5952-6323 =重构的F19重链A型6323-6330 =剪接供体位点6331-6336 =用于克隆免疫球蛋白可变区基因的唯一BanHⅠ限制性位点6337-7388 =人γ-1恒定区的cDNA拷贝，其前面有一62bp的内含子7389-7709 =Arnie终止序列在该构建体中所用的人γ-1恒定区具有一个Glm(non-a,z,,-x)，也称为Gml(17)的同种异型，其被限定为356位(根据Eu编号)的谷氨酸残基(E)、358位(根据Eu编号)的蛋氨酸残基(M)以及214位(根据Eu编号)的赖氨酸残基(K)。这3个氨基酸在上面的序列中均标有下划线。
图34．在哺乳动物细胞中表达抗体F19期间发生的重链(图A)和轻链(图B)RNA剪接事件——简要示意图。
(a)重链RNA剪接(b)x轻链RNA剪接图35．LAHC上清结合CD8-FAP的浓度依赖性。
图36．生物素化LAHC结合人FAP。
图37．CD8-FAP携带用cF19检测到的F19表位。
实施例实施例1小鼠-人嵌合基因的构建嵌合F19(cF19)抗体被设计为具有分别连接至人x和γ1恒定区的小鼠F19 VL和VH区。将PCR引物用于修饰在编码小鼠F19VL和VH区的cDNA序列两侧的5’和3’序列(表1)。设计了特异性针对F19轻链V区的PCR引物。将这些修改的小鼠F19可变区亚克隆至已含有人χ(pKN100载体)或γ1(pG1D105)恒定区的哺乳动物细胞表达载体中(图23)。这些载体利用人巨细胞病毒(HCMV)启动子/增强子来有效转录轻链和重链。载体还含有SV40复制起点使得可以在COS细胞中进行有效的DNA复制和随后的蛋白质表达。将表达载体设计成具有作为Hind Ⅲ-BamHⅠ片段插入的可变区。设计PCR引物用来在编码V区的cDNA的5’(HindⅢ)和3’(BamHⅠ)末端引入这些限制性位点。此外，设计PCR引物用来在轻链和重链cDNA的5’末端处引入Kozak序列(GCCGCCACC)使得可以进行有效的翻译(KozakM.在AUG启始密码子前的至少6个核苷酸增强在哺乳动物细胞中的翻译。(1987)分子生物学杂志196:947)，并在轻链和重链cDNA的3’末端处引入剪接供体位点以将可变区剪接至恒定区。在嵌合F19轻链和重链的构建中所用的PCR引物示于表1中。修改来在嵌合F19轻链和重链的构建中使用的小鼠F19 VL和VH区的DNA和氨基酸序列示于图24和25中。分别克隆至真核表达载体pKN100和pG1D105中的小鼠F19轻链和重链的DNA序列示于图26和27中。表1用于嵌合F19抗体构建的PCR引物A．轻链可变区1．用于5’末端构建的引物(37聚体)5′CAGA AAGCTT GCCGCCACC ATG GAT TCA CAG GCC CAG 3′HindⅢ Kozak序列 M D S Q A Q2．用于3’末端构建的引物(35聚体)5′CCGA GGATCC ACTCACG TTT CAG CTC CAG CTT GGT 3′BamHI 剪接供体位点B．重链可变区1．用于5’末端构建的引物(37聚体)5′CAGA AAGCTT GCCGCCACC ATG GGA TGG AGC TGG GTC 3′HindⅢ Kozak序列 M G W S W V2．用于3’末端构建的引物(35聚体)5′ CCGA GGATCC ACTCACC TGA GGA GAC GGT GAC TGA 3′BamHⅠ 剪接供体位点实施例2嵌合F19抗体的表达和结合活性将编码嵌合F19轻链和重链的2种质粒DNA(见实施例1)共转染至COS细胞中来观察如下所述嵌合F19抗体的瞬时表达。温育72小时后，收集培养液，离心去除细胞碎片，并通过ELISA分析人IgG1样抗体的产生。分析含有嵌合F19抗体的COS细胞上清结合表面表达有FAP抗原的HT 1080细胞的能力(见实施例13)。
利用电穿孔法转染COS细胞在COS细胞中测试分别含有嵌合或重构的人重链和轻链型的哺乳动物表达载体pg1d105和pKN100来观察F19抗体的瞬时表达。将COS细胞在含有青霉素(50IU/ml)、链霉素(50μg/ml)、L-谷氨酰胺和10％热灭活的无γ球球蛋白的胎牛血清(FCS,Harlan Sera-Lab cat.#D0001)的DMEM(Gibco BRLcat.#41966)中常规传代。利用Gene Pulsar apparatus(BioRad)通过电穿孔将DNA引入COS细胞中。将DNA(每种载体10μg)加入到在磷酸盐缓冲液(PBS，无Ca2+和Mg2+)中1×107细胞/ml的一份0.8ml液中。以1,900伏特，25μF电容发送一个脉冲。于环境温度下的10分钟恢复期后，将电穿孔的细胞加入到8ml含有5％FCS的DMEM中。于37℃温育72小时后，收集培养液，离心去除细胞碎片并在无菌条件下于4℃短期保存或者于-20℃长期保存。
ELISA方法检测在COS细胞上清中组装的IgG1/x抗体的浓度通过ELISA对在转染的COS细胞中产生的抗体样品进行检测以确定产生了多少嵌合的或重构的人抗体。对于抗体的检测，利用山羊抗人IgG(Fcγ片段特异性)抗体(Jackson ImmunoResearch Laboratories Inc.#109-005-098)包被酶标板。将来自COS细胞的样品进行连续稀释，并加到每个孔中。于37℃温育1小时以及洗板后，加入辣根过氧化物酶结合的山羊抗人x轻链(Sigma,A-7164)。37℃温育30分钟以及洗板后，室温下加入K-蓝色底物(一种3,3’,5,5’，四甲基联苯胺和过氧化氢的混合物，Bionostics Limited,#KB175)30分钟。利用红色终止液(Bionostics Limited,#RS20)终止反应，并在一酶标仪上读取650nm处的光密度。将已知浓度的纯化的人IgGl/x抗体(Sigma,I-3889)用作标准品。
嵌合F19抗体在COS细胞中的表达是很差的(表2)，介于10到60ng/ml之间，起比大多数抗体低至少10倍。
为了增加嵌合F19抗体的表达水平，通过将-9位的亮氨酸替换为脯氨酸来改变F19 VL区的先导序列。这种在先导序列中的单个氨基酸改变引起在COS细胞中产生的嵌合抗体的量至少翻一番。
细胞结合结果显示嵌合F19特异性结合FAP靶，并具有预期的亲和力。
表2在COS细胞上清中嵌合F19抗体的浓度(这些为3个独立转染的结果)
实施例3重构的人F19轻链A型至C型(LA-LB)的构建重构人F19 VL区中所述第一型(LA)的构建利用重叠PCR片段进行，方法类似于Daugherty B.L.,DeMartino J.A.,Law M.F.,Kawka D.W.,SingerⅠ.Ⅰ.和Mark G.E.(1991)聚合酶链式反应(PCR)使针对白细胞整合素CD18组分的小鼠单克隆抗体的克隆、CDR移植以及快速表达更简化。核酸研究(Nucl.Acids Res.)19:2471所述。合成了10个寡核苷酸，组成5对引物对，APCRl-vla1、vla2-vla3、vla4-vla5、vla6-vla7和vla8-APCR4(表3和图28)。在邻近的引物对之间存在至少21个碱基的重叠序列(图28)。APCR1和APCR4同pUC19载体序列侧翼杂交。设计诱变引物以便它们的5’末端紧随一个密码子的摆动位点之后。该策略用于阻止PCR过程中由DNA聚合酶在诱变引物互补链的3’末端无故加入一个核苷酸(Sharrocks A.D.和ShawP.E.(1992)改进的引物设计用于基于PCR的定点诱变。核酸研究20:1147)。在50μl含有10mM Tris-HCl(pH8.3)、50mM KCl、200μM dNTPs以及1.5mM MgCl2的PCR缓冲液中将适当的引物对(各0.2μM)同10ng的重构的人L25 VL区B型的cDNA以及1单位的AmpliTaq(Perkin ElmerCetus)DNA聚合酶混合。将其用矿物油覆盖并将PCR进行25个循环，每个循环由一个94℃1分钟的变性步骤、一个55℃1分钟的引物退火步骤以及一个72℃2分钟的延伸步骤组成。随后进行一个由一72℃10分钟的更进一步延伸步骤所组成的单个循环，随后降温至4℃。在引物退火和延伸步骤之间的间隔时间为2.5分钟。然后通过凝胶电泳对5个反应的PCR产物(A、B、C、D和E)进行纯化，随后利用WizardPCRpreps(Promega)进行DNA洗脱。将PCR产物A、B、C、D和E通过它们彼此间的互补性进行组装。在第二组PCR反应中，将PCR产物B和C以及D和E，(各50ng)加入到各含有1单位的AmpliTaq(Perkin Elmer Cetus)DNA聚合酶的50μlPCR反应液(如上所述)中。按照上面所描述地将反应进行20个循环，但将退火温度升至60℃。在第三组PCR反应中，分别用每种1μl前面的PCR反应液以及适当的PCR引物对(vla2-vla5或者vla6-APCR4)对PCR产物F和G进行扩增。PCR反应在50μl PCR反应液(如上所述)中含有1单位的AmpliTaq DNA聚合酶，并在第一个阶段扩增25个循环。在第四组PCR反应中，利用每种1μl前面的PCR反应液以及vla2-APCR4 PCR引物对对PCR产物H进行PCR扩增。最后利用RSP和UP作为末端引物在一个同上面所描述的相似的两步PCR反应中通过其自身的互补性对PCR产物A和H进行组装。对包括一个先导序列的代表整个重构的人F19VL区的完整组装片段用HindⅢ和BamHⅠ消化并克隆到pUC19中用于测序。一个具有正确DNA序列的克隆被指定为reshF19La(图29)，然后将其亚克隆至真核表达载体DKN100中。克隆至pKN100中的reshF19La的DNA序列示于图30中。
用所述La的方案的相同方案构建了重构的人F19VL区的第二型(LB)，但其中的vla4和vla7引物分别被vlb4和vlb7所取代(表3)。LB的DNA序列示于图29中。
利用来自Stratagene的QuikChangeTM定点诱变试剂盒构建了重构的人F19VL区的第三型(LC)。按照制造商的说明利用pKN100中的reshF19La作为双链DNA模板实施QuikChange定点诱变方法。按照制造商的说明设计在该方法中所用的F19LC-正义和F19LC-反义诱变寡核苷酸引物(表3)。简言之，两种诱变引物都含有预期的点突变(在49位Kabat残基(Phe)处的密码子TTT改变为编码Tyr的TAT)，而且都退火为pKN100载体中LA的相对链上的相同序列。通过对整个VL区的DNA测序证实点突变。LC的DNA序列示于图29中。为了消除在PCR反应过程中于pKN100中发生随机突变的可能性，将VL区作为一个Hind Ⅲ/BamHⅠ片段从pKN100载体中切下，并重新亚克隆至一个用前述相同的两种限制性内切酶切割的未修饰的pKN100载体中。
表3用于构建重构的人F19轻链可变区的PCR引物1．用于合成“A”型的引物F19vla1(36聚体)5′GTCATCACAATGTCTCCGGAGGAACCTGGAACCCAG 3′F19vla2(29聚体)5′CTCCGGAGACATTGTGATGACCCAATCTC 3′F19vla3(45聚体)5′GAATATAAAAGGCTCTGACTGGACTTGCAGTTGATGGTGGCCCTC 3′F19vla4(72聚体)5′CAGTCAGAGCCTTTTATATTCTAGAAATCAAAAGAACTACTTGGCCTGGTATCAGCAGAAACCAGGACAGCC 3′F19vla5(44聚体)5′ACCCCAGATTCCCTAGTGCTAGCCCAAAAGATGAGGAGTTTGGG 3′F19vla6(67聚体)5′TAGCACTAGGGAATCTGGGGTACCTGATAGGTTCAGTGGCAGTGGGTTTGGGACAGACTTCACCCTC 3′F19vla7(53聚体)5′GTCCCTTGTCCGAACGTGAGCGGATAGCTAAAATATTGCTGACAGTAATAAAC 3′F19vla8(33 聚体)5′GCTCACGTTCGGACAAGGGACCAAGGTGGAAAT 3′2．用于合成 “B” 型的引物F19vlb4(72聚体)5′CAGTCAGAGCCTTTTATATTCTAGAAATCAAAAGAACTACTTGGCCTGGTTCCAGCAGAAACCAGGACAGCC 3′F19vlb7(57聚体)5′GTCCCTTGTCCGAACGTGAGCGGATAGCTAAAATATTGCTGACAGTCATAAACTGCC 3′3．用于合成 “C ” 型的引物F19Lc-正-义(34聚体)5′CCCAAACTCCTCATCTATTGGGCTAGCACTAGGG 3′F19Lc-反义(34聚体)5′CCCTAGTGCTAGCCCAATAGATGAGGAGTTTGGG 3′4．同pUC19载体侧翼序列杂交的引物APCR1(17聚体，正义引物)5′TACGCAAACCGCCTCTC 3′APCR4(18聚体，反义引物)5′GAGTGCACCATATGCGGT 3′RSP(-24)(16聚体，正义引物)5′AACAGCTATGACCATG 3′UP(-40)(17聚体，反义引物)5′GTTTTCCCAGTCACGAC 3′实施例4重构的人F19重链A型至E型(HA-HE)的构建利用为构建重构的人F19 VL区“A”型(LA)所用的相同PCR方法构建重构的人F19 VH区“A”型(HA)(图31)。模板DNA为重构人226VH“A”型(Leger O.J.R,Yednock T.A.,Tanner L.,Homer H.C.,Hines D.K.,Keen S.,Saldanha J.,Jones T.,Fritz L.C.和Bendig M.M.(1997)。抗人α-4整合素的小鼠抗体的人源化用于多发性硬化症治疗的一种潜在的疗法。人源抗体(Hum.Antibod.)8:3)。设计并合成了6个PCR引物用于重构的人F19 VH区“A”型的构建(表4)。分别利用APCR-Vha1、Vha2-Vha3、Vha4-Vha5和Vha6-APCR4作为PCR引物对获得了PCR产物A、B、C和D。PCR条件基本上与所描述用于重构的人F19 VL区的构建的相同。一个具有正确DNA序列的克隆被指定为reshF19Ha(图32)，并将其亚克隆至真核表达载体pG1D105中。克隆至pG1D105中的reshF19Ha的DNA序列示于图33中。
利用与所描述的对于HA的相同方案构建了重构的人F19VH区的第三型(HC)，但其中的Vha4引物被Vhc4所取代(表4)。HC的DNA序列示于图32中。根据Kamman等的PCR诱变方法(Kamman M.,Laufs J.,Schel]J.和Gronenborn B.(1989)通过聚合酶链式反应(PCR)的DNA快速插入诱变。核酸研究17:5404)构建重构的人F19 VH区的第二型(HB)和第四型(HD)。对于HB和HD，在分别以HA和HC为模板DNA的PCR反应中，利用诱变引物F19VHbd6(Tyr-91到Phe-91，表4)同APCR4配对。对PCR产物VHb和VHd利用PstⅠ和BamHⅠ进行限制性酶消化，并分别亚克隆至预先用相同的两种限制性酶消化的reshF19Ha和reshF19Hc中。HB和HD的DNA序列示于图32中。
根据上面已经提到的Kamman等的PCR诱变方法(1989)构建重构的人F19VH区“E”型(HE)。
对于reshF19He在PCR反应中以克隆到Pg1d105哺乳动物表达载体中的HC为模板DNA，用诱变引物F19MsclHe(表5)同引物F19VHHindⅢ配对。在100μl含有10mM KCl、10mM(NH4)2SO4、20mM Tris-HCl(pH8.8)、2mM MgSO4、0.1％Triton X-100以及200μMdNTPs的PCR缓冲液中将适当的引物对(各0.2μM)同10ng重构的人226 VH区A型的cDNA混合。将反应混合物用矿物油覆盖并在94℃放置5分钟。然后加入1单位的DeepVent DNA聚合酶(New England Biolabs)(“热启动”PCR；Chou Q,RussellM.,BirchD.,Raymond J.和Bloch W.(1992)对PCR前的错误启动和引物二聚化的预防改善了低拷贝数的扩增。核酸研究20:1717)，并在TRIO-Thermoblock热循环仪(Biometra,G_ttingen,Germany)进行25个PCR循环。每个循环由一个94℃1分钟的变性步骤、一个70℃1分钟的引物退火步骤以及一个72℃2分钟的延伸步骤组成。随后进行一个由一72℃10分钟的更进一步延伸步骤所组成的单个循环，随后降温至4℃。然后利用QIAquickTM凝胶抽提试剂盒按照制造商(QIAGEN Ltd.,UK)提供的方法从TAE1.4％标准琼脂糖凝胶中抽提和纯化PCR产物。随后对PCR产物VHe用MscⅠ和HindⅢ进行限制性酶消化，并连接到预先用相同的两个限制性酶消化的克隆至Pg1d105中的reshF19Hc中。MscⅠ限制性识别位点对于所有重构的人F19VH区型都是唯一的，而且在Pgld105表达载体中不存在。HindⅢ限制性识别位点在pgld105中是用于克隆VH免疫球蛋白基因的单一位点。经电穿孔而成为感受态的大肠杆菌XL-1Blue细胞用1μl连接DNA转化，并涂布于含有氨苄青霉素的琼脂糖平板上。然后利用同Pgld105载体侧翼序列杂交的引物HCMi和Hucγ1(表5)通过对菌落的直接PCR筛选插入片段的存在和正确大小(GüssoW D.和Clackson T.(1989)通过聚合酶链式反应从噬斑和菌落进行直接克隆鉴定。核酸研究17:4000)筛选存在而且正确大小的插入片段的菌落。利用Plasmid Midi试剂盒按照制造商(QIAGEN Ltd.,UK)提供的方法制备阳性克隆的DNA。利用传统的热变性(Andersen A.,Pettersson A.和Kieldsen T.(1992)一种用测序酶经热变性测序质粒DNA的快速而简单的技术。生物技术(Biotechniques)13:678)和测序酶2.0(USB,Cleveland,OH)通过双脱氧链终止法(Sanger F.,Nicklen S.和Coulson A.(1977)利用链终止抑制物的DNA测序。美国国家科学院进展74:5463)直接从环状载体DNA进行DNA测序。reshF19He的DNA序列示于图32中。
表4用于构建重构的人F19重链可变区A型至D型的PCR引物1．用于“A”型合成的引物F19vha1(47聚体)5′GTGTATTCAGTGAAGGTGTATCTACTAGTTTTACAGCTGACTTTCAC 3′F19vha2(53聚体)5′TAGTAGATACACCTTCACTGAATACACCATACACTGGGTTAGACAGGCCCCTG 3′F19vha3(71聚体)5′CCCTTGAACTTCTGGTTGTAGTTAGGAATACCATTGTTAGGATTAATACCTCCTATCCACTCCAGCCTTTG 3′F19vha4(71聚体)5′TAACTACAACCAGAAGTTCAAGGGCCGGGCCACCTTGACCGTAGGCAAGTCTGCCAGCACCGCCTACATGG 3′F19vha5(63聚体)5′GCATGGCCCTCGTCGTAACCATAGGCGATTCTTCTTCTGGCGCAGTAGTAGACTGCAGTGTCC 3′
F19vha6(48聚体)5＇ CTATGGTTACGACGAGGGCCATGCTATGGACTACTGGGGTCAAGGAAC 3＇2．用于“C”型合成的引物F19vhc4(71聚体)5＇TAACTACAACCAGAAGTTCAAGGGCCGGGTCACCATCACCGTAGACACCTCTGCCAGCACCGCCTACATGG 3＇3．用于“B”型和“D”型合成的引物F19vhbd6(27聚体)5＇GGAGACTGCAGTCTACTTCTGCGCCAG 3＇4．同pUC19载体侧翼序列杂交的引物APCR1(17聚体，正义引物)5＇TACGCAAACCGCCTCTC 3＇APCR4(18聚体，反义引物)5＇GAGTGCACCATATGCGGT 3＇表5用于构建重构的人F19重链可变区E型的PCR引物1．用于“E”型合成的引物F19MscIHe(65聚体，反义):
5＇CCTTTGGCCAGGGGCCTGTCTAACCGAGTGTATGGTGTA'I-FCAGTGAAGGTGMsclTATCCACTAGTTTCCACTAGTTT 3＇2．同pgld105哺乳动物表达载体侧翼序列杂交的引物HCMi(28聚体，正义)5＇GTCACCGTCCTTGACACGCGTCTCGGGA 3＇Hucγ(17聚体，反义)5＇TTGGAGGAGGGTGCCAG 3＇实施例5在COS细胞上清中重构的人F19抗体的浓度用一系列重构的人F19抗体构建体中的一对转染COS细胞并利用如在实施例2中所描述的IgG1/x ELISA检测人抗体的浓度。表6在COS细胞上清中重构的人F19抗体的浓度
表7在COS细胞上清中重构的人F19抗体的浓度
免疫球蛋白基因在哺乳动物细胞中表达所需RNA剪接事件哺乳动物表达载体pKN100和pgld105在可变区和恒定区之间都具有一个内含子，在基因表达的过程中其被去除以产生一个信使RNA。由一个在重链或轻链剪接供体位点和免疫球蛋白剪接受体位点间的DNA重组所组成的剪接过程描述于图34中。
实施例6cF19和LAHC结合表达FAP的人类细胞的流式细胞术分析测试了LAHC结合细胞表面重组的和内源性表达的FAP的能力。
用实施例确定LAHC对细胞FAP的结合。天然表达FAP的MF-SH人肿瘤细胞(Shirasuma K.等，癌症(Cancer)1985,55:2521-32)和FAP转染的人肿瘤细胞系都被用作细胞靶。通过在细胞荧光测定术中评价对靶细胞的直接结合以及通过对结合小鼠F19或嵌合cF19抗FAP抗体的抑制效应而研究了LAHC。
所用的抗体和细胞系为F19(小鼠抗人FAP单克隆抗体，IgG1亚类)、mIgG(小鼠免疫球蛋白，IgG类)、cF19(嵌合抗人FAP单克隆抗体，IgG1亚类)、LAHC(重构的抗人FAP单克隆抗体，IgGl亚类)、hIgGl(人免疫球蛋白，IgG1亚类)、MF-SH(人恶性纤维组织细胞瘤细胞系)、HET-1080(人纤维肉瘤细胞系)、HT-1080FAP克隆33(用编码人FAP的cDNA转染的HT-1080细胞系)。如在实施例8和12中所描述的将抗体生物素化。
LAHC对人肿瘤细胞系表面的FAP的直接结合在总体积0.2ml的补充有1％牛血清白蛋白(BSA)的磷酸盐缓冲液(PBS)中将需研究的肿瘤细胞系的5×105个细胞同指定浓度的测试抗体或对照抗体在冰上温育30分钟。随后，细胞用2ml PBS洗涤2次，重悬于0.2ml补充有1％BSA的PBS中，加入1∶20稀释的FITC标记的小鼠抗人IgG[Dianova]作为次级试剂，并在冰上继续温育30分钟。
或者，在总体积0.2ml的补充有1％BSA的磷酸盐缓冲液(PBS)中将需研究的肿瘤细胞系的5×105个细胞同指定浓度的生物素标记的cF19在冰上温育30分钟。随后，细胞用2ml PBS洗涤2次，重悬于0.2ml补充有1％BSA的PBS中，并在冰上同作为次级试剂的1∶40稀释的链亲和素-FITC(Dianova)一起继续温育30分钟。
细胞用2ml PBS再次洗涤2次，重悬于总体积0.5ml的补充有1％低聚甲醛(PFA)的PBS中，并放置冰上。利用细胞荧光测定术在EPICS XL(Coulter)荧光激发的细胞分析仪上通过分析在488nm处的细胞绿色荧光来确定单细胞荧光。
LAHC对于生物素化cF19结合表达FAP的人类细胞系上的细胞表面FAP的竞争将需研究的肿瘤细胞系的5×105个细胞同与1μg/ml生物素标记的cF19抗体一起加入的指定数量的未标记的测试抗体或对照抗体进行温育。随后，细胞用2ml PBS洗涤2次，重悬于0.2ml补充有1％BSA的PBS中，加入1∶40稀释的链亲和素-FITC(Dianova)作为次级试剂，并在冰上继续温育30分钟。
然后细胞用2ml PBS再次洗涤2次，重悬于总体积0.5ml的补充有1％低聚甲醛(PFA)的PBS中，并放置冰上。利用细胞荧光测定术在EPICSXL(Coulter)荧光激发的细胞分析仪上通过分析在488nm处的细胞绿色荧光来确定单细胞荧光。
cF19和LAHC都以一种浓度依赖的方式特异性地结合于FAP转染的HT-1080FAP克隆33人类肿瘤细胞(表8)。未检测到对FAP阴性HT-1080细胞的结合(表9)。cF19和LAHC都以一种浓度依赖的方式结合于内源性表达FAP的人MF-SH细胞(表10)。
生物素化的cF19以一种浓度依赖的方式结合于人HT-1080FAP克隆33(表11)。未检测到对FAP阴性HT-1080细胞的结合(表12)。
生物素化的cF19对HT-1080FAP克隆33细胞的结合被未标记的cF19和未标记的LAHC所抑制。
嵌合抗人FAP单克隆抗体cF19以及重构的人抗人FAP单克隆抗体LAHC(实施例10)被证明直接结合于在内源性表达该蛋白的或者用编码它的cDNA所转染的人类细胞系上所表达的FAP。这种结合被表明为浓度依赖的。生物素化cF19的结合可以被未标记的cF19和未标记的LAHC所抑制。
利用细胞荧光测定技术，对特异性结合试剂的直接结合以及抑制表明嵌合cF19和重构的LAHC人单克隆抗体对表达FAP的细胞表面的特异性。表8抗FAP抗体对HT-1080FAP克隆33细胞的结合
表9抗FAP抗体对非转染的HT-1080细胞的结合
表10抗FAP抗体对MF-SH细胞的结合
n.d.未做表11生物素化的cF19抗体对HT-1080FAP克隆33细胞的结合
表12生物素化的cF19抗体对非转染的HT-1080细胞的结合
表13抗FAP抗体同生物素化cF19对HT-1080FAP克隆33细胞结合的竞争
在表13中所示的所有测试中，生物素化cF19的浓度为1μg/ml。
实施例7单克隆抗体LAHC的体外免疫效应物作用进行该实验来确定特异性针对成纤维细胞活化蛋白(FAP)的单克隆抗体(mAb)LAHC分别在人补体或人单个核白细胞存在下裂解表达FAP的靶细胞的潜能。
特别是，研究了LAHC介导针对表面表达人FAP的HT-1080FAP克隆33细胞的细胞毒效应的能力。利用下述的方法体外确定细胞毒性将51Cr标记的靶细胞在LAHC存在下同作为补体来源的人血清或作为效应物的人MNC(外周血单个核细胞)一起温育。测定51Cr的释放作为靶细胞裂解的度量。
所用的抗体和细胞系为LAHC(重构的人抗人FAP IgGl抗体)、hIgGl(人IgGl同种型对照)、3S193(小鼠抗LewisyIgG3单克隆抗体)、mI[gG(小鼠IgG对照)、HT-1080(人纤维肉瘤)、HT-1080FAP克隆33(用编码人FAP的cDNA转染的HT-1080)、MCF-7(人乳腺癌细胞系)。
补体介导的LAHC对靶细胞的裂解通过在RPMI 1640培养基中同100μCi51Cr(NEN)于37℃温育1小时来对肿瘤细胞进行放射性标记。随后，在无51Cr的培养基中洗涤细胞2次，并以每毫升2×105个细胞的浓度重悬。
作为补体来源的人血清是从不同自愿者的血液中新鲜制备的。通过上臂静脉穿刺取血，并在室温放置1小时使其发生凝结，然后4℃放置过夜。通过离心分离血清并将其从沉淀中移走。
将所研究的抗体在RPMI 1640细胞培养基中从储存液稀释至适当的浓度。
在不同浓度的测试或对照抗体以及作为人补体来源的25％(v/v)人血清存在下，将1×105个放射性标记的指定细胞系的肿瘤细胞在孵箱(95％空气和5％CO2)中于37℃温育2h。在U形96孔培养板中于总体积200μl的RPMI1640中进行温育，并重复3次。温育阶段后，将培养板离心，移走100μl的上清，并在γ计数仪中计数放射活性。通过检测104个靶细胞来确定所掺入放射活性的总量。自发释放被定义为在所述温育过程中在无抗体和补体存在下从靶细胞释放的活性。
按照如下公式计算特异性裂解 LAHC的抗体依赖性细胞介导的细胞毒(ADCC)通过在RPMI 1640培养基中同100μCi51Cr于37℃温育1小时来对肿瘤细胞进行放射性标记。随后，在无51Cr的培养基中洗涤细胞2次，并以每毫升2×105个细胞的浓度重悬。
从通过健康自愿者上臂静脉穿刺所采的外周血中制备MNC(外周血单个核细胞)。通过加入20％柠檬酸盐缓冲液来抗凝。通过在3ml淋巴细胞分离液(Boehringer Mannheim，德国)上离心(400G室温30分钟)来纯化4ml这种血液标本中的MNC。将MNC(外周血单个核细胞)从梯度中取出，洗涤3次，并用RPMI 1640稀释至适当的浓度。将MNC(外周血单个核细胞)通过以每毫升1.3×106个细胞的启始浓度在100U重组人白细胞介素-2(IL-2)存在下，在-95％空气和5％CO2的孵箱中于37℃温育5天来获得淋巴细胞活化的杀伤(LAK)细胞。将所研究的抗体在RPMI 1640细胞培养基中从储存液稀释至适当的浓度。
在不同浓度的测试或对照抗体以及MNC存在下，将1×104个放射性标记的指定细胞系的肿瘤细胞在37℃和5％CO2中温育5h。MNC以达到指定的效应靶细胞比的数量加入。在U形96孔培养板中于总体积200μl的RPMI 1640中进行温育，并重复2次。
温育阶段后，将培养板离心，移走100μl的上清，并在γ计数仪中测定放射活性。通过检测104个靶细胞来确定所掺入放射活性的总量。自发释放被定义为在所述温育过程中在无抗体和补体存在下从靶细胞释放的活性。
按照如下公式计算特异性裂解抗体介导的对肿瘤细胞的补体裂解在以高达50μg/ml的浓度的LAHC处理的HT-1080FAP克隆33细胞中未观察到LAHC特异性补体介导的裂解(高于用同种型对照需研究的到的)(表14、表15a)。
通过在12.5μg/ml 3S193(一种具有已知的补体激活能力的小鼠抗Lewisy单克隆抗体)存在下MCF-7人乳腺癌细胞的裂解显示了用作补体来源的人血清的裂解活性(表15b)。
抗体介导的对肿瘤细胞的细胞裂解在高达10μg/ml的浓度的LAHC存在下，未检测到通过裂解测定的LAHC介导人MNC(表16)或人LAK细胞(淋巴因子激活的杀伤细胞，表17)对HT-1080FAP克隆33细胞的ADCC(抗体依赖的细胞介导细胞毒性)高于用一种同型种对照以50∶1的效应靶细胞比所观察到的。
在适当的以人补体或人MNC作为效应物的体外测试中，人抗FAP单克隆抗体LAHC显示对于表达FAP的肿瘤细胞系HT-1080FAP克隆33没有可检测到的超过同种型对照的细胞毒效应。
表14LAHC介导对HT-1080FAP克隆33肿瘤细胞靶的特异性补体裂解(％)
温育于37℃2小时，分别来自自愿者A或B的25％血清作为补体的来源。
表15a由人抗FAP单克隆抗体LAHC介导的HT-1080FAP克隆33肿癌细胞靶的特异性补体裂解(％)
温育于37℃2小时，分别来自自愿者A、B或C的25％血清作为补体的来源。
表15b由小鼠抗Lewisy单克隆抗体3S193介导的MCF-7肿瘤细胞靶的特异性补体裂解(％)
温育于37℃2小时，分别来自自愿者A、B或C的25％血清作为补体的来源。
表16由LAHC介导的通过人MNC(外周血单个核细胞)对HT-1080FAP克隆33靶细胞的ADCC(抗体依赖的细胞介导的细胞毒)(特异性裂解以％表示)HT-1080FAP克隆33
温育于37℃5小时，104靶细胞以及50∶1的效应靶细胞比。
表17由LAHC介导的通过LAK细胞(淋巴因子活化的杀伤细胞)对HT-1080FAP克隆33靶细胞的ADCC(抗体依赖的细胞介导的细胞毒，特异性裂解以％表示)
温育于37℃5小时，104靶细胞以及50∶1的效应靶细胞比。
实施例8单克隆抗体LAHC结合正常和恶性人类组织的免疫组织化学分析进行该实验来确定人源化mAb LAHC对正常和恶性人类组织的结合特性。
利用了下面的抗体按照现有技术的方法将LAHC、cF19和阴性对照hIgG1直接进行生物素化，并以在2％BSA/PBS(在磷酸盐缓冲液中的牛血清白蛋白)中的2.5到0.25mg/ml的浓度来使用。所用小鼠mAbF19为F19杂交瘤的组织培养上清并在2％BSA/PBS中1∶5到1∶10的稀释。
下面的试剂用于免疫化学检测链亲和素过氧化物酶复合物(VectorLabs,Burlingame,CA,USA)、亲和素-生物素过氧化物酶复合物(VectorLabs.)、生物素化的马抗小鼠(Vector Labs.)、DAB(二氨基联苯胺，SigmaChemical Co.St.Louis,MO,USA)、Harris’苏木素。
所检测的新鲜的冰冻组织标本包括正常结肠、乳腺、肺、胃、胰腺、皮肤、喉、膀胱、平滑肌和骨骼肌。在肿瘤中所检测的为来自乳腺、结肠、肺、食管、子宫、卵巢、胰腺、胃以及头和颈的癌。
按照现有技术在5微米厚的新鲜冰冻切片上实施间接免疫过氧化物酶方法(Garin-ChesaP,OldLJ,ReMigWJ反应性基质成纤维细胞的细胞表面糖蛋白作为人上皮癌的一个潜在的抗体靶。美国国家科学院进展(1990)87:7235-7239)。DAB用作最终反应产物的底物。将切片用Harrs’苏木素进行复染，并检测抗原表达。
在正常人组织中LAHC的表达除了正常胰腺中用LAHC、cF19和F19鉴定出在Langerhans岛中的一个内分泌细胞亚群(A细胞)为阳性以外，所检测的正常组织LAHC表达是阴性的(表18)。用hIgGl(人免疫球蛋白IgGl亚类)作为阴性对照未观察到免疫反应性。
在肿瘤中LAHC的表达在肿瘤标本中，LAHC、cF19和F19在肿瘤基质成纤维细胞中显示出无法区分的表达模式。在所检测的大多数病例中观察到一种强而且均一的表达，特别是在来自乳腺、结肠、肺、胰腺的癌症标本中以及在所检测的头颈部鳞状细胞癌(SQCC)中(表19)。用hIgGl作为阴性对照未观察到免疫反应性。
在所检测的上皮癌标本中LAHC、cF19和F19显示出对肿瘤基质成纤维细胞的免疫反应性。未观察到LAHC或F19对正常器官间质的纤维细胞或者正常成人器官的实质细胞的免疫反应性。仅仅在胰岛中一个内分泌细胞亚群(可能为分泌胰高血糖素的A细胞)以及在所检测的9个子宫标本中的4个(代表这些组织中的基质成纤维细胞亚群)中观察到抗FAP免疫反应性。
对正常人体组织和表达FAP的人类癌症中LAHC的免疫组织化学分析表明对LAHC、cF19和小鼠mAbF19具有无法区分的结合模式。
表18mAbLAHC、cF19和F19对正常人体组织的免疫反应性
通过生物素-亲和素复合免疫过氧化物酶方法检测丙酮固定的冰冻切片。
No，来自不同受试个体的组织标本数*根据形态学和在胰岛内的定位鉴定A细胞#在所检测的9个标本的4个的基质中为阳性免疫反应性。阳性标本代表早期(×2)和中期(×2)增殖性子宫内膜。
实施例9在组织切片中LAHC结合的物种特异性进行本实验通过免疫组织化学方法来评价LAHC对来自小鼠、大鼠、兔和短尾猴的组织的反应性。
在这些实验中还利用cF19和人IgGl(hIgGl)作为阴性对照。用于免疫组织化学的试剂为链亲和素过氧化物酶复合物(Vector Labs.,Burlingame,CA,USA)、DAB(Sigma Chemical Co.,St Louis,MO,USA)以及Harris’苏木素。
对来自小鼠、大鼠、兔和短尾猴的下述新鲜冰冻组织标本进行了检测脑、肝脏、肺、肾脏、胃、胰腺、肠、胸腺、皮肤、肌肉、心脏、脾脏、卵巢、子宫和睾丸。在每个检测中都包括来自正常人胰腺和一个乳腺癌标本的切片作为阳性对照。
免疫组织化学按照现有技术所描述的在5微米厚的新鲜冰冻切片上实施间接免疫过氧化物酶方法(Garin-Chesa P,Old LJ,Rettig WJ反应性基质成纤维细胞的细胞表面糖蛋白作为人上皮癌的一个潜在的抗体靶。美国国家科学院进展(1990)87:7235-7239)。按照现有技术将抗体LAHC、cF19和hIgGl(为1μg/ml)进行生物素化，并用链亲和素过氧化物酶复合物进行检测。DAB用作最终反应产物的底物。将切片用Harris’苏木素进行复染，并检测抗原表达。
在实验中，所检测的正常组织不与LAHC或cF19反应(表1)。
用作阳性对照的正常人胰腺显示，如同预先对F19所描述的，在Langerhans岛的一个内分泌细胞亚群中有LAHC和cF19的结合。另外，在乳腺癌标本的肿瘤基质成纤维细胞中观察到LAHC和cF19的结合。
在所进行的实验中，来自小鼠、大鼠、兔和短尾猴的正常组织的免疫组织化学分析未检测到任何LAHC或cF19的结合。
表20通过免疫组织化学所确定的LAHC对非人物种组织切片的结合
nt，未检测实施例10产生嵌合的以及重构的抗FAP单克隆抗体的细胞系的构建本实验的目的是证实根据本发明在CHO DG44细胞中表达LAHC、LAHA、LBHB、LBHD和cF19的稳定的细胞系。制备人源化的或嵌合的F19抗体转染的稳定细胞系，并通过用来自每个转染子的基因组DNA作为模板经PCR扩增重链和轻链可变区来对其进行证实。
将CHO DG44细胞培养于无血清的SFM-Ⅱ培养基中。Lipofectin(脂质转染试剂)和SFM-Ⅱ无血清培养基获自Gibco/BRL。遗传霉素以及所有的限制性酶获自Boehringer Mannheim。Pfu聚合酶获自Stratagene。
利用QiaFilter Maxi Cartridges(Qiagen)按照制造商的说明从大肠杆菌细胞中纯化用于转染的DNA。所有DNA制剂均通过限制性酶消化检验。在每个载体中的LAHC可变区序列均利用ABI PRISM 310测序仪(Perkin-Elmer)来证实。
所用载体和DNA序列的其它信息在前面的实施例中提供。
CHO DG44细胞的转染将处于对数生长期的细胞接种于含有1ml新鲜SFM-Ⅱ培养基的6孔培养板中。利用脂质体转染将编码人源化或嵌合F19的重链和轻链的质粒共转染到CHO DG44细胞中。除了利用SFM-Ⅱ培养基来稀释所有试剂外，按照对LipofectAMINE转染的描述，利用6μl Lipofectin试剂(脂质转染试剂)和0.5μg的各种载体(一种为预期重链的，一种为轻链的)制备脂质体。24小时后，将细胞按1∶10稀释至含有300μg/ml遗传霉素的SFM-Ⅱ培养基中。在细胞杀伤的启始阶段(10-14天)过去后，将遗传霉素的浓度降至200μg/ml，并加入氨甲蝶呤至终浓度5nM。在10-14天后，将氨甲蝶呤的浓度增加至终浓度20nM。
转染子DNA的PCR扩增在Eppendorf微量离心管中将107CHO DG44细胞全速瞬时离心，用PBS洗涤一次，然后再沉淀一次。在对细胞沉淀进行SDS裂解以及蛋白酶K处理后，通过乙醇沉淀制备基因组DNA。
利用含有下列引物对之一、dNTPs、缓冲液以及Pfu聚合酶的混合物，以基因组DNA作为模板，扩增重链或轻链可变区。以适当的限制性酶对所获的PCR产物进行消化，并通过琼脂糖凝胶电泳分析来对其进行证实。
轻链引物组5′-GAG ACA TTG TGA CCC AAT CTC C - 3′PKN 16905′-GAC AGT CAT AAA CTG CCA CAT CTT C - 3′ PKN.1930.R重链引物组5′- TTG ACA CGC GTC TCG GGA AGC T T - 3′ PG 58635′-GGC GCA GAG GAT CCA CTC ACC T - 3′ PG 6332.R未消化的重链PCR产物预期大小为469bp，而轻链PCR产物的预期大小为286bp。通过用BstEⅡ(重链)或NlaⅣ(轻链)进行限制性酶消化来确定它们的特性。
对CHO细胞系用LAHC、LAHA、LBHB、LBHD以及cF19进行转染。获得了遗传霉素抗性细胞，并进一步筛选这些细胞对氨甲蝶呤的抗性。轻链和重链DNA的PCR扩增和随后进行的限制性酶切产生了预期的条带并证实了LAHC、LBHB、LAHA、LBHD转染子的特性。
将所描述的细胞始终培养于无血清的条件下，而且不用动物来源的产品，如胰蛋白酶来处理。
制备了用表达LAHC、LAHA、LBHB、LBHD以及cF19单克隆抗体所转染的制备细胞系。利用对它们的重链和轻链可变区进行PCR扩增并对所获PCR产物经限制性酶切来证实它们的特性。
实施例11抗体蛋白在中国仓鼠卵巢DG44细胞中的表达及其纯化本实验的目的是表达和纯化LAHC、LAHA、LBHB和LBHDmAb以便能对其进行鉴定。其它目的包括建立一种定量ELISA以便能够检测在原始培养样品和纯化的Ig样品中抗体的浓度以及利用这种检测方法确定各种人源化F19构建体的相对表达水平。
无血清CHO DG44细胞和USP级氨甲蝶呤获自Karl Thomae GmbH博士的Biotechnical Production Unit,Biberach，德国；这两种均为商品化的产品。将细胞始终培养于无血清条件下。SFM-Ⅱ无血清培养基获自Gibco/BRL。蛋白A琼脂糖来自Pierce Chemical(Indianapolis,IN,USA)。人IgGl标准品(Cat.No.13889)、对硝基苯磷酸盐片(N 2640)、牛血清白蛋白(BSA)(A7906)以及山羊抗人χ链特异性碱性磷酸酶结合的抗体(A 3813)获自Sigma Chemical(St.Louis,MO,USA)。山羊抗人γ链特异性碱性磷酸酶结合的抗体获自Jackson Immunoresearch Laboratories(通过StratechScientfic)。Tris缓冲盐溶液(TBS)由150mM NaCl、50mM Tris,pH7.5组成。
用于抗体表达的细胞培养条件在T-175培养瓶中将细胞非搅拌地培养于SFM-Ⅱ无血清培养基中。培养基含有200μg/ml遗传霉素以及20nM氨甲蝶呤，无抗生素。通过稀释将细胞传代，不贴壁，并呈小簇状生长。当细胞达到生长稳定期时，收集培养液，离心去除细胞，并于-20℃冻存直至使用。
LAHC的纯化所用的纯化步骤均在4℃进行。用蛋白A琼脂糖(3ml柱床体积)填充C10/10柱(Pharmacia Fine Chemicals)。用TBS洗涤该柱子并用pH3.0的0.1M柠檬酸钠预洗脱一次以保证在柱子中不残留疏松结合的材料。然后立即用TBS重平衡柱子，并于4℃保存。将余下的(spent)培养上清融化，在蛋白A层析前以10,000×g离心30分钟以去除碎片，并用等体积的TBS稀释。用P-1蠕动泵(Pharmacia)将该材料以0.5ml/min的速度上样于蛋白A柱上，并用TBS洗涤直至在280nm处的吸光度无法检测到。用pH3.0的0.1M柠檬酸钠以大约0.2ml/min的速度开始抗体的洗脱。在280nm处对洗脱进行监控并将洗脱材料按每份1ml收集在含有足够的Tris碱pH9来中和柠檬酸盐缓冲液的试管中。将含有蛋白的级分汇集起来，利用带有YM-30滤膜的Amicon过滤装置浓缩，并对PBS透析。将柱子立即用TBS再生。用BioRad(Hercules,Califomia)蛋白质测定试剂盒，按照制造商的说明，用牛血清白蛋白作为标准品进行蛋白质染料结合测试。
人IgG(γ免疫球蛋白)ELISA将ELISA板用100μl山羊抗人γ链特异性碱性磷酸酶结合的抗体以在包被缓冲液中0.4mg/ml的浓度4℃包被过夜。取出包被抗体，平板用2％BSA-PBS封闭2小时。随后所有的步骤均在37℃进行。封闭缓冲液用以稀释缓冲液连续稀释的抗体标本或人IgG1标准品200μl代替，并温育1小时。阴性对照包括稀释缓冲液和/或非转染细胞的培养液。洗涤反应孔，加入100μl以1∶5000稀释的山羊抗人x链特异性碱性磷酸酶结合的抗体，并温育1小时。洗涤反应孔，加入100μl反应缓冲液，并温育30分钟。通过加入1MNaOH来终止反应，并在一ELISA读板仪上读取405nm处的吸光度。通过四参数重复曲线拟合法来分析结果。
按照现有技术中可用的方法来进行氨基酸分析。
制备单充隆抗体LAHC并利用蛋白A亲和层析纯化至均一。利用人IgGl作为标准品的ELISA检测表明LAHC的回收超过70％。通过SDS-聚丙烯酰胺凝胶电泳估计该材料的纯度大于90％。代表性的表达资料和典型的纯化产量示于表21中。
表21FAP抗体蛋白在CHO细胞中的表达资料和纯化产量
显示了在该研究中制备的每种抗FAP抗体的代表性表达资料。蛋白A琼脂糖亲和层析后的回收是基于以BSA为标准品对纯化Ig的蛋白质染料结合测量法。
实施例12单克隆抗体LAHC对分离的重组人FAP的结合。
本研究的目的是鉴定LAHC对分离的重组人FAP的结合。
CD8-FAP ELISA将ELISA板用100μl在包被缓冲液中1∶2000稀释的小鼠抗大鼠抗体(Sigma Chemical R0761)4℃包被过夜。取出包被抗体，平板用2％BSA-PBS封闭1小时。随后所有的步骤均在室温下进行。用100μl的1μg/ml大鼠抗CD8抗体(Pharmingen 01041D)替换封闭缓冲液，并温育1小时。洗涤酶标板，加入100μl CD8-FAP培养上清(见实施例14)(以1∶2稀释于PBS中)，并允许结合1小时。洗涤酶标板，加入100μl体积的抗体样品(2倍连续稀释)，并温育1小时。阴性对照包括人IgG和/或非转染细胞的培养液。洗涤反应孔，加入100μl在稀释缓冲液中1∶500稀释的辣根过氧化物酶(HRP)结合的小鼠抗人IgGl抗体(Zymed 05-3320)，并温育1小时。洗涤反应孔，加入100μl HRP底物(连氮基-双-(3-乙基苯噻唑啉6-磺)酸，Sigma Chemical A9941)并温育60分钟。通过加入1M NaOH来终止反应，并在一ELISA读板仪上读取405/490nm处的吸光度。通过四参数曲线重复曲线拟合法来分析结果。
或者，直接用cF19包被酶标板。如上使FAP(重组人FAP，见实施例13)能够结合这些酶标板，然后加入生物素化的LAHC(～1μg/ml)。如上用HRP-链亲和素结合物检测抗体的结合。
膜结合型人FAP的可溶化用PBS洗涤表达FAP的293FAP I/2细胞或对照的293细胞，并用在Tris缓冲盐溶液中的1％Triton X-114裂解。通过在10,000×g离心去除核以及碎片。将上清进行相分配(Estreicher A,Wohlend A,Belin D,ScheuningWD,Vasalli JD。尿激酶型纤溶酶原激活物的细胞结合位点的鉴定。(1989)生物化学杂志(J Biol Chem)264:1180-1189)来富集膜蛋白。收集去污剂相并在含有1％Empigen BB(Calbiochem)的缓冲液中稀释以防止Triton X-114的再凝集。将该材料用于进行伴刀豆球蛋白A琼脂糖层析(Rettig WJ,Garin-Chesa P,Healey JH,Su SL,Ozer HL,Schwab M,Albino AP,OldLJ。间充质和神经外胚层来源的正常和转化细胞中成纤维细胞活化蛋白的调节以及异聚体结构。(1993)癌症研究(Cancer Res)53:3327-3335)。
LAHC的生物索化LAHC(1-2mg)对50mM的碳酸氢盐缓冲液透析，并在室温下用10倍摩尔过剩的磺基琥珀酰亚胺-6-生物素酰胺己酸盐(NHS-LC生物素，PierceChemical,Rockford,Illinois,USA)生物素化2小时。通过在一微量浓缩器中反复微量透析来去除未反应的产物。
瞬时转染通过电穿孔用编码LAHC重链和轻链的载体共转染COS-7细胞(美国典型培养物保藏中心，提交号(reference number)CRL 1651)。
将抗CD8单克隆抗体固定于微量滴定板上。使被CD8-FAP杆状病毒感染的昆虫细胞培养液中的CD8-FAP能够结合这些板。将分别用编码LAHC的2个载体瞬时转染的COS-7细胞培养液余下的培养液连续稀释并加入到含有固相CD8-FAP的孔中。LAHC结合所分离的固相CD8-FAP蛋白(图35)。来自假转染的COS-7细胞的培养上清未检测到结合。
将来自293FAP I/2细胞的去污剂抽提物或对照抽提物的重组膜结合型FAP连续稀释，并通过结合微量滴定板上的嵌合F19单克隆抗体来固定。生物素化的LAHC以一种浓度依赖的方式结合由cF19所固定的重组人FAP(图36)。
LAHC识别所分离的固相重组人FAP，其携带有针对小鼠F19的表位。LAHC结合在昆虫细胞中所产生的CD8-FAP以及在293FAP I/2细胞中所产生的FAP蛋白。
转染的3天后收集来自用编码LAHC重链和轻链的载体转染的或者无DNA(对照)转染的COS7细胞培养上清。如在文本中所描述的，通过一种抗CD8抗体固定CD8-FAP。使COS7上清的连续稀释液结合固相CD8-FAP，随后用HRP-结合的抗人IgGl抗体来检测。
将表达FAP的293FAP I/2细胞或对照293细胞的去污剂抽提物连续稀释，并加入到cF19包被的微量滴定板中。加入生物素化的LAHC并用HRP-结合的链亲和素来检测生物素化LAHC的结合。
实施例13对人FAP的cDNA所转染的HT-1080纤维肉瘤细胞和293人胚肾细胞的鉴定成纤维细胞活化蛋白(FAP)是一种携带F19表位的细胞表面膜结合蛋白，并且表达于肿瘤基质成纤维细胞上。制备了表达重组FAP蛋白的细胞系和相应的不表达FAP的对照用于抗FAP单克隆抗体的鉴定。
所用的细胞为HT-1080细胞(提交号CCL 121)和293人胚肾细胞(提交号CRL 1573)，它们均获自美国典型培养物保藏中心(Maryland,USA)。Transfectam获自Promega(Madison,WI)。遗传霉素和所有的限制性酶获自Boehringer Mannheim。利用QiaFilter Maxi Cartridges(Qiagen)按照制造商的说明从大肠杆菌细胞中纯化用于转染的DNA。所有DNA制剂均通过限制性酶消化检验。利用ABI PRISM 310测序仪证实载体序列。
关于所用载体和DNA序列的其它信息已描述于Scanlan MJ,Raj BK,Calvo B,Garin-Chesa P,Sanz-Moncasi MP,Healey JH,Old LJ,RettigWJ.选择性表达于上皮性癌的基质成纤维细胞中的丝氨酸蛋白酶家族成员，成纤维细胞活化蛋白α的分子克隆。(1992)美国国家科学院进展89:10832-10836中。FAP cDNA序列已经保藏于Genbank(登记号HS09287)。
细胞培养和免疫检测利用Transfectam按照制造商的说明以1mg DNA转染HT-1080细胞。通过磷酸钙转染法用10mgDNA转染人胚肾293细胞(BrannMR；BuckleyNJ；Jones SVP；Bonner TI.克隆的毒蕈碱受体在A9L细胞中的表达。(1987)分子药理学(Mol Pharmacol)32:450-455)。24小时后，将细胞1∶10稀释至含有200μg/ml遗传霉素的新鲜培养基中。挑取菌落并如在RettigWJ；Garin-ChesaP；Beresford HR；Oettgen HF；Melamed MR；Old LJ.人肿瘤的细胞表面糖蛋白在正常和恶性组织以及培养细胞中的分化表达。(1988)美国国家科学院进展85:3110-3114中所描述的通过免疫荧光检测FAP的表达。
如在Rettig WJ,Garin-Chesa P,Healey JH,Su SL,Ozer HL,Schwab M,Albino AP,Old LJ.在间充质和神经外胚层来源的正常和转化细胞中成纤维细胞活化蛋白的调节以及异聚体结构。(1993)癌症研究(CancerRes)53:3327-3335中所描述的，用代谢性标记的细胞进行同cF19的免疫沉淀。
HT-1080和293细胞的FAP抗原表达在免疫荧光检测中用抗FAP抗体检测，并发现为抗原阴性。这些细胞用FAP.38载体转染导致产生遗传霉素抗性菌落。挑取独立的菌落，并通过免疫荧光分析FAP的表达。鉴定了两个细胞克隆并指定为HT-1080FAP克隆33和293FAPI/2，它们表达由cF19抗体所识别的细胞表面结合型FAP蛋白。用cF19抗体对非透化的HT-1080FAP充隆33和293FAP I/2染色证实了FAP蛋白的细胞表面定位。
将35S-蛋氨酸标记的HT-1080FAP克隆33细胞或293FAP I/2细胞的抽提物中放射标记的FAP蛋白同cF19免疫沉淀导致在放射自显影后出现一条93千道尔顿的条带。在亲代HT-1080或293细胞提取物的免疫沉淀中检测不到该条带。
如在免疫学检测中用抗FAP抗体所确定的，2个稳定转染的细胞系，HT-1080FAP克隆33和293FAP I/2在其细胞表面表达FAP。亲代HT-1080或亲代293细胞不表达可检测水平的FAP。
买施例14:CD8-FAP融合蛋白的产生和鉴定在昆虫细胞中生成以CD8-FAP融合蛋白形式存在的可溶性人FAP(成纤维细胞活化蛋白)用于鉴定含有抗FAP mAb结合位点的LAHC。选择小鼠CD8以使蛋白可以分泌，并提供一个额外的表位标签。
用标准的PCR方法将小鼠CD8α(GenbankM12825)中前189个氨基酸所组成的CD8胞外区的编码cDNA连接至FAP胞外区(27至760位氨基酸)的编码cDNA，基本上按照由Lane等(Lane P,Brocker T,Hubele S,PadovanE,Lazavecchia A,McConnell.可溶性CD40配体在T细胞依赖的活化中可以取代正常T细胞来源的CD40配体向B细胞传递信号。(1993)实验医学杂志(J Exp Med)177:1209-1213)所述。通过DNA测序确证所有克隆的可靠性。将所获的DNA插入到pVL1393载体(Invitrogen)中，并按照所描述的(杆状病毒表达载体。实验室手册。O'Reilly DR,Miller LK,LuckowVA，(编)牛津大学出版社纽约，1994)用该载体转染Sf9细胞(Invitrogen)和扩增所获的重组杆状病毒。收集用重组CD8-FAP杆状病毒感染4天的HighFiveTM细胞(Invitrogen)的余下培养液并通过超速离心使之澄清。
上面已经描述了CD8-FAP ELISA(酶联免疫吸附试验)(实施例12)。
用CD8-FAP病毒感染的昆虫培养物向培养基中分泌一种融合蛋白，其携带有F19表位而且被抗FAP抗体识别(图1)。单纯细胞培养液或用CD8-CD40L融合蛋白感染的昆虫细胞的培养液都不结合抗FAP抗体。
携带F19表位的可溶性CD8-FAP蛋白被分泌至被感染的昆虫细胞培养液中。对照构建体所感染细胞的培养上清不含有携带F19表位的抗原。
在昆虫细胞中生成可溶形式的FAP,CD8-FAP，而且CD8-FAP被证明携带有被cF19所识别的表位。
在感染的4天后收集来自用编码CD8-FAP或CD8-CD40L融合蛋白的重组杆状病毒感染的昆虫细胞的上清。将无细胞的细胞培养基用作一种额外的对照(培养基)。将这些材料的连续稀释物加入到抗CD8抗体包被的微量滴定板中并使其能够结合。随后加入cF19(1mg/ml)并使其可以结合。用辣根过氧化物酶结合的抗人抗体来检测所结合的cF19。
序列表(1)一般资料(ⅰ)申请人(A)姓名Boehringer Ingelheim Intemational GmbH(B)街名Rheinstrasse(C)城市Ingelheim am Rhein(E)国家德国(F)邮编55216(G)电话++49-6132-772770(H)电传++49-6132-774377(ⅱ)发明标题具备改善的可制备性的FAPα-特异性抗体(ⅲ)序列数101(ⅳ)计算机可读形式(A)介质类型软盘(B)计算机IBM PC兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release#1.0,Version#1.30(EPO)(2)SEQ ID N0: 1的资料(ⅰ)序列特征(A)长度339个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:1GACATTGTGA TGACCCAATC TCCAGACTCT TTGGCTGTGT CTCTAGGGGA GAGGGCCACC60ATCAACTGCA AGTCCAGTCA GAGCCTTTTA TATTCTAGAA ATCAAAAGAA CTACTTGGCC 120TGGTATCAGC AGAAACCAGG ACAGCCACCC AAACTCCTCA TCTTTTGGGC TAGCACTAGG 180GAATCTGGGG TACCTGATAG GTTCAGTGGC AGTGGGTTTG GGACAGACTT CACCCTCACC 240ATTAGCAGCC TGCAGGCTGA AGATGTGGCA GTTTATTACT GTCAGCAATA TTTTAGCTAT 300CCGCTCACGT TCGGACAAGG GACCAAGGTG GAAATAAAA 339(2)SEQ ID NO:2的资料(ⅰ)序列特征(A)长度113个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:2Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala val Ser Leu Gly1 5 10 15Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser20 25 30Arg Asn Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln35 40 45Pro Pro Lys Leu Leu Ile Phe Trp Ala Ser Thr Arg Glu Ser Gly Val50 55 60Pro Asp Arg Phe Ser Gly Ser Gly Phe Gly Thr Asp Phe Thr Leu Thr65 70 75 80Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Val Tyr Tyr Cys Gln Gln85 90 95Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Gln Gly Thr Lys Val Glu Ile100 105 110Lys(2)SEQ ID NO:3的资料(ⅰ)序列特征(A)长度339个碱基对(B)类型核酸(C)链型双链
(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO: 3GACATTGTGA TGACCCAATC TCCAGACTCT TTGGCTGTGT CTCTAGGGGA GAGGGCCACC 60ATCAACTGCA AGTCCAGTCA GAGCCTTTTA TATTCTAGAA ATCAAAAGAA CTACTTGGCC120TGGTTCCAGC AGAAACCAGG ACAGCCACCC AAACTCCTCA TCTTTTGGGC TAGCACTAGG180GAATCTGGGG TACCTGATAG GTTCAGTGGC AGTGGGTTTG GGACAGACTT CACCCTCACC240ATTAGCAGCC TGCAGGCTGA AGATGTGGCA GTTTATGACT GTCAACAATA TTTTAGCTAT300CCGCTCACGT TCGGACAAGG GACCAAGGTG GAAATAAAA 339(2)SEQ ID NO:4的资料(ⅰ)序列特征(A)长度113个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:4Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly1 5 10 15Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser20 25 30Arg Asn Gln Lys Asn Tyr Leu Ala Trp Phe Gln Gln Lys Pro Gly Gln35 40 45Pro Pro Lys Leu Leu Ile Phe Trp Ala Ser Thr Arg Glu Ser Gly Val50 55 60Pro Asp Arg Phe Ser Gly Ser Gly Phe Gly Thr Asp Phe Thr Leu Thr65 70 7580Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Val Tyr Asp Cys Gln Gln85 90 95Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Gln Gly Thr Lys Val Glu Ile100 105 110Lys(2)SEQ ID NO:5的资料(ⅰ)序列特征(A)长度339个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:5GACATTGTGA TGACCCAATC TCCAGACTCT TTGGCTGTGT CTCTAGGGGA GAGGGCCACC 60ATCAACTGCA AGTCCAGTCA GAGCCTTTTA TATTCTAGAA ATCAAAAGAA CTACTTGGCC120TGGTATCAGC AGAAACCAGG ACAGCCACCC AAACTCCTCA TCTATTGGGC TAGCACTAGG180GAATCTGGGG TACCTGATAG GTTCAGTGGC AGTGGGTTTG GGACAGACTT CACCCTCACC240ATTAGCAGCC TGCAGGCTGA AGATGTGGCA GTTTATTACT GTCAGCAATA TTTTAGCTAT300(2)SEQ ID NO:6的资料(ⅰ)序列特征(A)长度113个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:6Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly1 510 15Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser20 25 30Arg Asn Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln35 40 45Pro Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val50 55 60pro Asp Arg Phe Ser Gly Ser Gly Phe Gly Thr Asp Phe Thr Leu Thr65 70 75 80Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Val Tyr Tyr Cys Gln Gln85 90 95Tyr phe Ser Tyr pro Leu Thr phe Gly Gln Gly Thr Lys Val Glu Ile100 105 110Lys(2)SEQ ID NO:7的资料(ⅰ)序列特征(A)长度372个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEO ID NO:7CAGGTGCAAC TAGTGCAGTC CGGCGCCGAA GTGAAGAAAC CCGGTGCTTC CGTGAAAGTC60AGCTGTAAAA CTAGTAGATA CACCTTCACT GAATACACCA TACACTGGGT TAGACAGGCC 120CCTGGCCAAA GGCTGGAGTG GATAGGAGGT ATTAATCCTA ACAATGGTAT TCCTAACTAC 180AACCAGAAGT TCAAGGGCCG GGCCACCTTG ACCGTAGGCA AGTCTGCCAG CACCGCCTAC 240ATGGAACTGT CCAGCCTGCG CTCCGAGGAC ACTGCAGTCT ACTACTGCGC CAGAAGAAGA 300ATCGCCTATG GTTACGACGA GGGCCATGCT ATGGACTACT GGGGTCAAGG AACCCTTGTC 360ACCGTCTCCT CA 372(2)SEQ ID NO:8的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列述:SEQ ID NO:8Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala1 5 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Arg Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Ile35 40 45Gly Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe50 55 60Lys Gly Arg Ala Thr Leu Thr Val Gly Lys Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105 110Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:9的资料(ⅰ)序列特征(A)长度372个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:9CAGGTGCAAC TAGTGCAGTC CGGCGCCGAA GTGAAGAAAC CCGGTGCTTC CGTGAAAGTC 60AGCTGTAAAA CTAGTAGATA CACCTTCACT GAATACACCA TACACTGGGT TAGACAGGCC 120CCTGGCCAAA GGCTGGAGTG GATAGGAGGT ATTAATCCTA ACAATGGTAT TCCTAACTAC 180AACCAGAAGT TCAAGGGCCG GGCCACCTTG ACCGTAGGCA AGTCTGCCAG CACCGCCTAC 240ATGGAACTGT CCAGCCTGCG CTCCGAGGAC ACTGCAGTCT ACTTCTGCGC CAGAAGAAGA 300ATCGCCTATG GTTACGACGA GGGCCATGCT ATGGACTACT GGGGTCAAGG AACCCTTGTC 360ACCGTCTCCT CA372(2)SEQ ID NO:10的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:10Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala1 5 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Arg Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Ile35 40 45Gly Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Ash Gln Lys Phe50 55 60Lys Gly Arg Ala Thr Leu Thr Val Gly Lys Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Phe Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105 110Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:11的资料(ⅰ)序列特征(A)长度372个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述 SEQ ID NO:11CAGGTGCAAC TAGTGCAGTC CGGCGCCGAA GTGAAGAAAC CCGGTGCTTC CGTGAAAGTC 60AGCTGTAAAA CTAGTAGATA CACCTTCACT GAATACACCA TACACTGGGT TAGACAGGCC120CCTGGCCAAA GGCTGGAGTG GATAGGAGGT ATTAATCCTA ACAATGGTAT TCCTAACTAC180AACCAGAAGT TCAAGGGCCG GGTCACCATC ACCGTAGACA CCTCTGCCAG CACCGCCTAC 240ATGGAACTGT CCAGCCTGCG CTCCGAGGAC ACTGCAGTCT ACTACTGCGC CAGAAGAAGA 300ATCGCCTATG GTTACGACGA GGGCCATGCT ATGGACTACT GGGGTCAAGG AACCCTTGTC 360ACCGTCTCCT CA372(2)SEQ ID NO:12的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:12Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala15 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Arg Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Ile35 40 45Gly Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe50 55 60Lys Gly Arg Val Thr Ile Thr Val Asp Thr Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala val Tyr Tyr Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105110Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:13的资料(ⅰ)序列特征(A)长度372个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:13CAGGTGCAAC TAGTGCAGTC CGGCGCCGAA GTGAAGAAAC CCGGTGCTTC CGTGAAAGTC 60AGCTGTAAAA CTAGTAGATA CACCTTCACT GAATACACCA TACACTGGGT TAGACAGGCC120CCTGGCCAAA GGCTGGAGTG GATAGGAGGT ATTAATCCTA ACAATGGTAT TCCTAACTAC180AACCAGAAGT TCAAGGGCCG GGTCACCATC ACCGTAGACA CCTCTGCCAG CACCGCCTAC240ATGGAACTGT CCAGCCTGCG CTCCGAGGAC ACTGCAGTCT ACTTCTGCGC CAGAAGAAGA300ATCGCCTATG GTTACGACGA GGGCCATGCT ATGGACTACT GGGGTCAAGG AACCCTTGTC360ACCGTCTCCT CA372(2)SEQ ID NO:14的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:14Gin Val Gin Leu Val Gin Ser Gly Ala Glu Val Lys Lys Pro Gly Ala15 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Arg Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Ile35 40 45Gly Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe50 55 60Lys Gly Arg Val Thr Ile Thr Val Asp Thr Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Phe Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105 110Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:15的资料(ⅰ)序列特征(A)长度372个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:15CAGGTGCAAC TAGTGCAGTC CGGCGCCGAA GTGAAGAAAC CCGGTGCTTC CGTGAAAGTC 60AGCTGTAAAA CTAGTGGATA CACCTTCACT GAATACACCA TACACTGGGT TAGACAGGCC120CCTGGCCAAA GGCTGGAGTG GATAGGAGGT ATTAATCCTA ACAATGGTAT TCCTAACTAC180AACCAGAAGT TCAAGGGCCG GGTCACCATC ACCGTAGACA CCTCTGCCAG CACCGCCTAC240ATGGAACTGT CCAGCCTGCG CTCCGAGGAC ACTGCAGTCT ACTACTGCGC CAGAAGAAGA300ATCGCCTATG GTTACGACGA GGGCCATGCT ATGGACTACT GGGGTCAAGG AACCCTTGTC360ACCGTCTCCT CA372(2)SEQ ID NO:16的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:16Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala1 5 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Ile35 40 45Gly Gly Ile Ash Pro Asn Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe50 55 60Lys Gly Arg Val Thr Ile Thr Val Asp Thr Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105 110Tyr Trp GIy Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:17的资料(ⅰ)序列特征(A)长度220个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQIDNO:17Asp Ile Val Met Ser Gln Ser Pro Ser Ser Leu Ala Val Ser Val Gly1 5 10 15Glu Lys Val Thr Met Ser Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser20 25 30Arg Asn Gln Lys Asn Tyr Leu Ala Trp Phe Gln Gln Lys Pro Gly Gln35 40 45Ser Pro Lys Leu Leu Ile Phe Trp Ala Ser Thr Arg Glu Ser Gly Val50 55 60Pro Asp Arg Phe Thr Gly Ser Gly Phe Gly Thr Asp Phe Asn Leu Thr65 70 75 80Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Val Tyr Asp Cys Gln Gln85 90 95Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu100 105 110Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp115 120 125Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Ash130 135 140Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu145 150 155 160Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp165 170 175Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr180 185 190Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser195 200 205Ser Pro Val Thr Lys Ser Phe Ash Arg Gly Glu Cys210 215 220(2)SEQ ID NO:18的资料(ⅰ)序列特征(A)长度453个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:18Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Val Lys Pro Gly Ala Ser1 5 10 15Val Lys Met Ser Cys Lys Thr Ser Arg Tyr Thr Phe Thr Glu Tyr Thr20 25 30Ile His Trp Val Arg Gln Ser His Gly Lys Ser Leu Glu Trp Ile Gly35 40 45Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe Lys50 55 60Gly Arg Ala Thr Leu Thr Val Gly Lys Ser Ser Ser Thr Ala Tyr Met65 70 75 80Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys Ala85 90 95Arg Arg Arg Ile Ala Tyr GIy Tyr Asp Glu Gly His Ala Met Asp Tyr100 105 110Trp GIy Gln Gly Thr Ser Val Thr Val Ser Ser Ala Ser Thr Lys Gly115 120 125Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly130 135 140Thr Ala Ala Leu GIy Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val145 150 155 160Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe165 170 175Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val180 185 190Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val195 200 205Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys210 215 220Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu225 230 235 240Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr245 250 255Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp val260 265 270Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val275 280 285Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser290 295 300Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu305 310 315 320Asn Gly Lys Glu Tyr Lys Cys Lys val Ser Asn Lys Ala Leu Pro Ala325 330 335Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro340 345 350Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Ash Gln355 360 365Val Ser Leu Thr Cys Leu val Lys Gly Phe Tyr Pro Ser Asp Ile Ala370 375 380Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr385 390 395 400Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu405 410 415Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser420 425 430Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser435 440 445Leu Ser Pro Gly Lys450(2)SEQ ID NO:19的资料(ⅰ)序列特征(A)长度321个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:19CGTACTGTGG CTGCACCATC TGTCTTCATC TTCCCGCCAT CTGATGAGCA GTTGAAATCT 60GGAACTGCCT CTGTTGTGTG CCTGCTGAAT AACTTCTATC CCAGAGAGGC CAAAGTACAG120TGGAAGGTGG ATAACGCCCT CCAATCGGGT AACTCCCAGG AGAGTGTCAC AGAGCAGGAC180AGCAAGGACA GCACCTACAG CCTCAGCAGC ACCCTGACGC TGAGCAAAGC AGACTACGAG240AAACACAAAG TCTACGCCTG CGAAGTCACC CATCAGGGCC TGAGCTCGCC CGTCACAAAG300AGCTTCAACA GGGGAGAGTG T 321(2)SEQ ID NO:20的资料(ⅰ)序列特征(A)长度107个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:20Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu1 5 10 15Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Ash Phe20 25 30Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln35 40 45Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser50 55 60Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu65 70 75 80Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser85 90 95Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys100 105(2)SEQ IDNO:21的资料(ⅰ)序列特征(A)长度990个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:21GCCTCCACCA AGGGCCCATC GGTCTTCCCC CTGGCACCCT CCTCCAAGAG CACCTCTGGG 60GGCACAGCGG CCCTGGGCTG CCTGGTCAAG GACTACTTCC CCGAACCGGT GACGGTGTCG120TGGAACTCAG GCGCCCTGAC CAGCGGCGTG CACACCTTCC CGGCTGTCCT ACAGTCCTCA180GGACTCTACT CCCTCAGCAG CGTGGTGACC GTGCCCTCCA GCAGCTTGGG CACCCAGACC240TACATCTGCA ACGTGAATCA CAAGCCCAGC AACACCAAGG TGGACAAGAA AGTTGAGCCC300AAATCTTGTG ACAAAACTCA CACATGCCCA CCGTGCCCAG CACCTGAACT CCTGGGGGGA360CCGTCAGTCT TCCTCTTCCC CCCAAAACCC AAGGACACCC TCATGATCTC CCGGACCCCT420GAGGTCACAT GCGTGGTGGT GGACGTGAGC CACGAAGACC CTGAGGTCAA GTTCAACTGG480TACGTGGACG GCGTGGAGGT GCATAATGCC AAGACAAAGC CGCGGGAGGA GCAGTACAAC540AGCACGTACC GGGTGGTCAG CGTCCTCACC GTCCTGCACC AGGACTGGCT GAATGGCAAG600GAGTACAAGT GCAAGGTCTC CAACAAAGCC CTCCCAGCCC CCATCGAGAA AACCATCTCC660AAAGCCAAAG GGCAGCCCCG AGAACCACAG GTGTACACCC TGCCCCCATC CCGGGAGGAG720ATGACCAAGA ACCAGGTCAG CCTGACCTGC CTGGTCAAAG GCTTCTATCC CAGCGACATC780GCCGTGGAGT GGGAGAGCAA TGGGCAGCCG GAGAACAACT ACAAGACCAC GCCTCCCGTG840CTGGACTCCG ACGGCTCCTT CTTCCTCTAC AGCAAGCTCA CCGTGGACAA GAGCAGGTGG 900CAGCAGGGGA ACGTCTTCTC ATGCTCCGTG ATGCATGAGG CTCTGCACAA CCACTACACG 960CAGAAGAGCC TCTCCCTGTC TCCGGGTAAA990(2)SEQ ID NO:22的资料(ⅰ)序列特征(A)长度330个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:22Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys1 5 10 15Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr20 25 30Phe Pro Glu Pro Val Thr Val Ser Trp ASh Ser Gly Ala Leu Thr Ser35 40 45Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser50 55 60Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr65 70 75 80Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys85 90 95Lys Val Glu Pro Lys Ser Cys Asp Lys Thr Mis Thr Cys Pro Pro Cys100 105 110Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro115 120 125Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys30 135 140Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp145 150 155 160Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu165 170 175Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu180 185 190His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn195 200 205Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly210 215 220Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu225 230 235 240Met Thr Lys Ash Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr245 250 255Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn260 265 270Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe275 280 285Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn290 295300Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr305 310 315 320Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys325 330(2)SEQ ID NO:23的资料(ⅰ)序列特征(A)长度427个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:23AAGCTTGCCG CCACCATGGA TTCACAGGCC CAGGTTCTTA TGTTACTGCC GCTATGGGTA 60TCTGGTACCT GTGGGGACAT TGTGATGTCA CAGTCTCCAT CCTCCCTAGC TGTGTCAGTT 120GGAGAGAAGG TTACTATGAG CTGCAAGTCC AGTCAGAGCC TTTTATATAG TCGTAATCAA 180AAGAACTACT TGGCCTGGTT CCAGCAGAAG CCAGGGCAGT CTCCTAAACT GCTGATTTTC 240TGGGCATCCA CTAGGGAATC TGGGGTCCCT GATCGCTTCA CAGGCAGTGG ATTTGGGACG 300GATTTCAATC TCACCATCAG CAGTGTGCAG GCTGAGGACC TGGCAGTTTA TGACTGTCAG 360CAATATTTTA GCTATCCGCT CACGTTCGGT GCTGGGACCA AGCTGGAGCT GAAACGTGAG 420TGGATCC 427(2)SEQ ID NO:24的资料(ⅰ)序列特征(A)长度133个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:24Met Asp Ser Gln Ala Gln Val Leu Met Leu Leu Pro Leu Trp Val Ser1 5 10 15Gly Thr Cys Gly Asp Ile Val Met Ser Gln Ser Pro Ser Ser Leu Ala20 25 30Val Ser Val Gly Glu Lys Val Thr Met Ser Cys Lys Ser Ser Gln Ser35 40 45Leu Leu Tyr Ser Arg Asn Gln Lys Asn Tyr Leu Ala Trp Phe Gln Gln50 55 60Lys Pro Gly Gln Ser Pro Lys Leu Leu Ile Phe Trp Ala Ser Thr Arg65 70 75 80Glu Ser Gly Val Pro Asp Arg Phe Thr Gly Ser Gly Phe Gly Thr Asp85 90 95Phe Asn Leu Thr Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Val Tyr100 105 110Asp Cys Gln Gln Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Ala Gly Thr115 120 125Lys Leu Glu Leu Lys130(2)SEQ ID NO:25的资料(ⅰ)序列特征(A)长度457个碱基对(B)类型核酸(C)链型双链
(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:25AAGCTTGCCG CCACCATGGG ATGGAGCTGG GTCTTTCTCT TTCTCCTGTC AGGAACTGCA 60GGTGTCCTCT CTGAGGTCCA GCTGCAACAG TCTGGACCTG AGCTGGTGAA GCCTGGGCT 120TCAGTAAAGA TGTCCTGCAA GACTTCTAGA TACACATTCA CTGAATACAC CATACACTGG 180GTGAGACAGA GCCATGGAAA GAGCCTTGAG TGGATTGGAG GTATTAATCC TAACAATGGT 240ATTCCTAACT ACAACCAGAA GTTCAAGGGC AGGGCCACAT TGACTGTAGG CAAGTCCTCC 300AGCACCGCCT ACATGGAGCT CCGCAGCCTG ACATCTGAGG ATTCTGCGGT CTATTTCTGT 360GCAAGAAGAA GAATCGCCTA TGGTTACGAC GAGGGCCATG CTATGGACTA CTGGGGTCAA 420GGAACCTCAG TCACCGTCTC CTCAGGTGAG TGGATCC 457(2)SEQ ID NO:26的资料(ⅰ)序列特征(A)长度143个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:26Met Gly Trp Ser Trp Val Phe Leu Phe Leu Leu Ser Gly Thr Ala Gly1 5 10 15Val Leu Ser Glu Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Val Lys20 25 30Pro Gly Ala Ser Val Lys Met Ser Cys Lys Thr Ser Arg Tyr Thr Phe35 40 45Thr Glu Tyr Thr Ile His Trp Val Arg Gln Ser His Gly Lys Ser Leu50 55 60Glu Trp Ile Gly Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Asn65 70 75 80Gln Lys Phe Lys Gly Arg Ala Thr Leu Thr Val Gly Lys Ser Ser Ser85 90 95Thr Ala Tyr Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val100 105 110Tyr Phe Cys Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His115 120 125Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser130 135 140(2)SEQ ID NO:27的资料(ⅰ)序列特征(A)长度8068个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEO IDNO:27GAATTCCAGC ACACTGGCGG CCGTTACTAG TTATTAATAG TAATCAATTA CGGGGTCATT 60AGTTCATAGC CCATATATGG AGTTCCGCGT TACATAACTT ACGGTAAATG GCCCGCCTGG120CTGACCGCCC AACGACCCCC GCCCATTGAC GTCAATAATG ACGTATGTTC CCATAGTAAC180GCCAATAGGG ACTTTCCATT GACGTCAATG GGTGGAGTAT TTACGGTAAA CTGCCCACTT240GGCAGTACAT CAAGTGTATC ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA300ATGGCCCGCC TGGCATTATG CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA360CATCTACGTA TTAGTCATCG CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG420GCGTGGATAG CGGTTTGACT CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG480GAGTTTGTTT TGGCACCAAA ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC540ATTGACGCAA ATGGGCGGTA GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTCGTTT600AGTGAACCGT CAGATCGCCT GGAGACGCCA TCCACGCTGT TTTGACCTCC ATAGAAGACA660CCGGGACCGA TCCAGCCTCC GCGGCCGGGA ACGGTGCATT GGAACGCGGA TTCCCCGTGC720CAAGAGTGAC GTAAGTACCG CCTATAGAGT CTATAGGCCC ACCCCCTTGG CTTCTTATGC780ATGCTATACT GTTTTTGGCT TGGGGTCTAT ACACCCCCGC TTCCTCATGT TATAGGTGAT840GGTATAGCTT AGCCTATAGG TGTGGGTTAT TGACCATTAT TGACCACTCC CCTATTGGTG900ACGATACTTT CCATTACTAA TCCATAACAT GGCTCTTTGC CACAACTCTC TTTATTGGCT960ATATGCCAAT ACACTGTCCT TCAGAGACTG ACACGGACTC TGTATTTTTA CAGGATGGGG 1020TCTCATTTAT TATTTACAAA TTCACATATA CAACACCACC GTCCCCAGTG CCCGCAGTTT 1080TTATTAAACA TAACGTGGGA TCTCCACGCG AATCTCGGGT ACGTGTTCCG GACATGGGCT 1140CTTCTCCGGT AGCGGCGGAG CTTCTACATC CGAGCCCTGC TCCCATGCCT CCAGCGACTC1200ATGGTCGCTC GGCAGCTCCT TGCTCCTAAC AGTGGAGGCC AGACTTAGGC ACAGCACGAT1260GCCCACCACC ACCAGTGTGC CGCACAAGGC CGTGGCGGTA GGGTATGTGT CTGAAAATGA1320GCTCGGGGAG CGGGCTTGCA CCGCTGACGC ATTTGGAAGA CTTAAGGCAG CGGCAGAAGA1380AGATGCAGGC AGCTGAGTTG TTGTGTTCTG ATAAGAGTCA GAGGTAACTC CCGTTGCGGT1440GCTGTTAACG GTGGAGGGCA GTGTAGTCTG AGCAGTACTC GTTGCTGCCG CGCGCGCCAC1500CAGACATAAT AGCTGACAGA CTAACAGACT GTTCCTTTCC ATGGGTCTTT TCTGCAGTCA1560CCGTCCTTGA CACGCGTCTC GGGAAGCTTG CCGCCACCAT GGATTCACAG GCCCAGGTTC1620TTATGTTACT GCCGCTATGG GTATCTGGTA CCTGTGGGGA CATTGTGATG TCACAGTCTC1680CATCCTCCCT AGCTGTGTCA GTTGGAGAGA AGGTTACTAT GAGCTGCAAG TCCAGTCAGA1740GCCTTTTATA TTCTAGAAAT CAAAAGAACT ACTTGGCCTG GTTCCAGCAG AAGCCAGGGC1800AGTCTCCTAA ACTGCTGATT TTCTGGGCAT CCACTAGGGA ATCTGGGGTC CCTGATCGCT1860TCACAGGCAG TGGATTTGGG ACGGATTTCA ATCTCACCAT CAGCAGTGTG CAGGCTGAGG1920ACCTGGCAGT TTATGACTGT CAGCAATATT TTAGCTATCC GCTCACGTTC GGTGCTGGGA1980CCAAGCTGGA GCTGAAACGT GAGTGGATCC ATCTGGGATA AGCATGCTGT TTTCTGTCTG2040TCCCTAACAT GCCCTGTGAT TATGCGCAAA CAACACACCC AAGGGCAGAA CTTTGTTACT2100TAAACACCAT CCTGTTTGCT TCTTTCCTCA GGAACTGTGG CTGCACCATC TGTCTTCATC2160TTCCCGCCAT CTGATGAGCA GTTGAAATCT GGAACTGCCT CTGTTGTGTG CCTGCTGAAT2220AACTTCTATC CCAGAGAGGC CAAAGTACAG TGGAAGGTGG ATAACGCCCT CCAATCGGGT2280AACTCCCAGG AGAGTGTCAC AGAGCAGGAC AGCAAGGACA GCACCTACAG CCTCAGCAGC2340ACCCTGACGC TGAGCAAAGC AGACTACGAG AAACACAAAG TCTACGCCTG CGAAGTCACC2400CATCAGGGCC TGAGCTCGCC CGTCACAAAG AGCTTCAACA GGGGAGAGTG TTAGAGGGAG2460AAGTGCCCCC ACCTGCTCCT CAGTTCCAGC CTGACCCCCT CCCATCCTTT GGCCTCTGAC2520CCTTTTTCCA CAGGGGACCT ACCCCTATTG CGGTCCTCCA GCTCATCTTT CACCTCACCC2580CCCTCCTCCT CCTTGGCTTT AATTATGCTA ATGTTGGAGG AGAATGAATA AATAAAGTGA2640ATCTTTGCAC CTGTGGTGGA TCTAATAAAA GATATTTATT TTCATTAGAT ATGTGTGTTG2700GTTTTTTGTG TGCAGTGCCT CTATCTGGAG GCCAGGTAGG GCTGGCCTTG GGGGAGGGGG2760AGGCCAGAAT GACTCCAAGA GCTACAGGAA GGCAGGTCAG AGACCCCACT GGACAAACAG2820TGGCTGGACT CTGCACCATA ACACACAATC AACAGGGGAG TGAGCTGGAA ATTTGCTAGC2880GAATTCTTGA AGACGAAAGG GCCTCGTGAT ACGCCTATTT TTATAGGTTA ATGTCATGAT2940AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA AATGTGCGCG GAACCCCTAT3000TTGTTTATTT TTCTAAATAC ATTCAAATAT GTATCCGCTC ATGAGACAAT AACCCTGATA3060AATGCTTCAA TAATATTGAA AAAGGAAGAG TATGAGTATT CAACATTTCC GTGTCGCCCT3120TATTCCCTTT TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT CACCCAGAAA CGCTGGTGAA3180AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT TACATCGAAC TGGATCTCAA3240CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT TTTCCAATGA TGAGCACTTT3300TAAAGTTCTG CTATGTGGCG CGGTATTATC CCGTGTTGAC GCCGGGCAAG AGCAACTCGG3360TCGCCGCATA CACTATTCTC AGAATGACTT GGTTGAGTAC TCACCAGTCA CAGAAAAGCA3420TCTTACGGAT GGCATGACAG TAAGAGAATT ATGCAGTGCT GCCATAACCA TGAGTGATAA3480CACTGCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG AAGGAGCTAA CCGCTTTTTT3540GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG GAACCGGAGC TGAATGAAGC3600CATACCAAAC GACGAGCGTG ACACCACGAT GCCTGCAGCA ATGGCAACAA CGTTGCGCAA3660ACTATTAACT GGCGAACTAC TTACTCTAGC TTCCCGGCAA CAATTAATAG ACTGGATGGA3720GGCGGATAAA GTTGCAGGAC CACTTCTGCG CTCGGCCCTT CCGGCTGGCT GGTTTATTGC3780TGATAAATCT GGAGCCGGTG AGCGTGGGTC TCGCGGTATC ATTGCAGCAC TGGGGCCAGA3840TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG AGTCAGGCAA CTATGGATGA3900ACGAAATAGA CAGATCGCTG AGATAGGTGC CTCACTGATT AAGCATTGGT AACTGTCACA3960CCAAGTTTAC TCATATATAC TTTAGATTGA TTTAAAACTT CATTTTTAAT TTAAAAGGAT4020CTAGGTGAAG ATCCTTTTTG ATAATCTCAT GACCAAAATC CCTTAACGTG AGTTTTCGTT4080CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT TCTTGAGATC CTTTTTTTCT4140GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA CCAGCGGTGG TTTGTTTGCC4200GGATCAAGAG CTACCAACTC TTTTTCCGAA GGTAACTGGC TTCAGCAGAG CGCAGATACC4260AAATACTGTC CTTCTAGTGT AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC4320GCCTACATAC CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC4380GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC GGTCGGGCTG4440AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG ACCTACACCG AACTGAGATA4500CCTACAGCGT GAGCTATGAG AAAGCGCCAC GCTTCCCGAA GGGAGAAAGG CGGACAGGTA4560TCCGGTAAGC GGCAGGGTCG GAACAGGAGA GCGCACGAGG GAGCTTCCAG GGGGAAACGC4620CTGGTATCTT TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG4680ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT TTTTACGGTT4740CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT GCGTTATCCC CTGATTCTGT4800GGATAACCGT ATTACCGCCT TTGAGTGAGC TGATACCGCT CGCCGCAGCC GAACGACCGA4860GCGCAGCGAG TCAGTGAGCG AGGAAGCGGA AGAGCGCCTG ATGCGGTATT TTCTCCTTAC4920GCATCTGTGC GGTATTTCAC ACCGCATATG GTGCACTCTC AGTACAATCT GCTCTGATGC4980CGCATAGTTA AGCCAGTATA CACTCCGCTA TCGCTACGTG ACTGGGTCAT GGCTGCGCCC5040CGACACCCGC CAACACCCGC TGACGCGCCC TGACGGGCTT GTCTGCTCCC GGCATCCGCT5100TACAGACAAG CTGTGACCGT CTCCGGGAGC TGCATGTGTC AGAGGTTTTC ACCGTCATCA5160CCGAAACGCG CGAGGCAGCT GTGGAATGTG TGTCAGTTAG GGTGTGGAAA GTCCCCAGGC5220TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAATT AGTCAGCAAC CAGGCTCCCC5280AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA GCAACCATAG TCCCGCCCCT5340AACTCCGCCC ATCCCGCCCC TAACTCCGCC CAGTTCCGCC CATTCTCCGC CCCATGGCTG5400ACTAATTTTT TTTATTTATG CAGAGGCCGA GGCCGCCTCG GCCTCTGAGC TATTCCAGAA5460GTAGTGAGGA GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTAGCTT CACGCTGCCG5520CAAGCACTCA GGGCGCAAGG GCTGCTAAAG GAAGCGGAAC ACGTAGAAAG CCAGTCCGCA5580GAAACGGTGC TGACCCCGGA TGAATGTCAG CTACTGGGCT ATCTGGACAA GGGAAAACGC5640AAGCGCAAAG AGAAAGCAGG TAGCTTGCAG TGGGCTTACA TGGCGATAGC TAGACTGGGC5700GGTTTTATGG ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG5760GAAGCCCTGC AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG5820ATCAAGATCT GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATGATTGAAC AAGATGGATT5880GCACGCAGGT TCTCCGGCCG CTTGGGTGGA GAGGCTATTC GGCTATGACT GGGCACAACA5940GACAATCGGC TGCTCTGATG CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC GCCCGGTTCT6000TTTTGTCAAG ACCGACCTGT CCGGTGCCCT GAATGAACTG CAGGACGAGG CAGCGCGGCT6060ATCGTGGCTG GCCACGACGG GCGTTCCTTG CGCAGCTGTG CTCGACGTTG TCACTGAAGC6120GGGAAGGGAC TGGCTGCTAT TGGGCGAAGT GCCGGGGCAG GATCTCCTGT CATCTCACCT6180TGCTCCTGCC GAGAAAGTAT CCATCATGGC TGATGCAATG CGGCGGCTGC ATACGCTTGA6240TCCGGCTACC TGCCCATTCG ACCACCAAGC GAAACATCGC ATCGAGCGAG CACGTACTCG6300GATGGAAGCC GGTCTTGTCG ATCAGGATGA TCTGGACGAA GAGCATCAGG GGCTCGCGCC6360AGCCGAACTG TTCGCCAGGC TCAAGGCGCG CATGCCCGAC GGCGAGGATC TCGTCGTGAC6420CCATGGCGAT GCCTGCTTGC CGAATATCAT GGTGGAAAAT GGCCGCTTTT CTGGATTCAT6480CGACTGTGGC CGGCTGGGTG TGGCGGACCG CTATCAGGAC ATAGCGTTGG CTACCCGTGA6540TATTGCTGAA GAGCTTGGCG GCGAATGGGC TGACCGCTTC CTCGTGCTTT ACGGTATCGC6600CGCTCCCGAT TCGCAGCGCA TCGCCTTCTA TCGCCTTCTT GACGAGTTCT TCTGAGCGGG6660ACTCTGGGGT TCGAAATGAC CGACCAAGCG ACGCCCAACC TGCCATCACG AGATTTCGAT6720TCCACCGCCG CCTTCTATGA AAGGTTGGGC TTCGGAATCG TTTTCCGGGA CGCCGGCTGG6780ATGATCCTCC AGCGCGGGGA TCTCATGCTG GAGTTCTTCG CCCACCCCGG GCTCGATCCC6840CTCGCGAGTT GGTTCAGCTG CTGCCTGAGG CTGGACGACC TCGCGGAGTT CTACCGGCAG6900TGCAAATCCG TCGGCATCCA GGAAACCAGC AGCGGCTATC CGCGCATCCA TGCCCCCGAA6960CTGCAGGAGT GGGGAGGCAC GATGGCCGCT TTGGTCCCGG ATCTTTGTGA AGGAACCTTA7020CTTCTGTGGT GTGACATAAT TGGACAAACT ACCTACAGAG ATTTAAAGCT CTAAGGTAAA7080TATAAAATTT TTAAGTGTAT AATGTGTTAA ACTACTGATT CTAATTGTTT GTGTATTTTA7140GATTCCAACC TATGGAACTG ATGAATGGGA GCAGTGGTGG AATGCCTTTA ATGAGGAAAA7200CCTGTTTTGC TCAGAAGAAA TGCCATCTAG TGATGATGAG GCTACTGCTG ACTCTCAACA7260TTCTACTCCT CCAAAAAAGA AGAGAAAGGT AGAAGACCCC AAGGACTTTC CTTCAGAATT7320GCTAAGTTTT TTGAGTCATG CTGTGTTTAG TAATAGAACT CTTGCTTGCT TTGCTATTTA7380CACCACAAAG GAAAAAGCTG CACTGCTATA CAAGAAAATT ATGGAAAAAT ATTCTGTAAC7440CTTTATAAGT AGGCATAACA GTTATAATCA TAACATACTG TTTTTTCTTA CTCCACACAG7500GCATAGAGTG TCTGCTATTA ATAACTATGC TCAAAAATTG TGTACCTTTA GCTTTTTAAT7560TTGTAAAGGG GTTAATAAGG AATATTTGAT GTATAGTGCC TTGACTAGAG ATCATAATCA7620GCCATACCAC ATTTGTAGAG GTTTTACTTG CTTTAAAAAA CCTCCCACAC CTCCCCCTGA7680ACCTGAAACA TAAAATGAAT GCAATTGTTG TTGTTAACTT GTTTATTGCA GCTTATAATG7740GTTACAAATA AAGCAATAGC ATCACAAATT TCACAAATAA AGCATTTTTT TCACTGCATT7800CTAGTTGTGG TTTGTCCAAA CTCATCAATG TATCTTATCA TGTCTGGATC TAATAAAAGA7860TATTTATTTT CATTAGATAT GTGTGTTGGT TTTTTGTGTG CAGTGCCTCT ATCTGGAGGC7920CAGGTAGGGC TGGCCTTGGG GGAGGGGGAG GCCAGAATGA CTCCAAGAGC TACAGGAAGG7980CAGGTCAGAG ACCCCACTGG ACAAACAGTG GCTGGACTCT GCACCATAAC ACACAATCAA8040(2)SEQ ID NO:28的资料(ⅰ)序列特征(A)长度239个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ IDNO:28Asp Ser Gln Ala Gln Val Leu Met Leu Leu Pro Leu Trp Val Ser Gly1 5 10 15Thr Cys Gly Asp Ile Val Met Ser Gln Ser Pro Ser Ser Leu Ala Val20 25 30Ser Val Gly Glu Lys Val Thr Met Ser Cys Lys Ser Ser Gln Ser Leu35 40 45Leu Tyr Ser Arg Asn Gln Lys Asn Tyr Leu Ala Trp Phe Gln Gln Lys50 55 60Pro Gly Gln Ser Pro Lys Leu Leu Ile Phe Trp Ala Ser Thr Arg Glu65 70 75 80Ser Gly Val Pro Asp Arg Phe Thr Gly Ser Gly Phe Gly Thr Asp Phe85 90 95Asn Leu Thr Ile Ser Ser Val Gln Ala Glu Asp Leu Ala Val Tyr Asp100 105 110Cys Gln Gln Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Ala Gly Thr Lys115 120 125Leu Glu Leu Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro130 135 140Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu145 150 155 160Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp165 170 175Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp180 185 190Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys195 200 205Ala Asp Tyr Glu Lys His Lys val Tyr Ala Cys Glu Val Thr His Gln210 215 220Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys225 230235(2)SEQ ID NO:29的资料(ⅰ)序列特征(A)长度7731个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ )分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:29TTGAAGACGA AAGGGCCTCG TGATACGCCT ATTTTTATAG GTTAATGTCA TGATAATAAT 60GGTTTCTTAG ACGTCAGGTG GCACTTTTCG GGGAAATGTG CGCGGAACCC CTATTTGTTT120ATTTTTCTAA ATACATTCAA ATATGTATCC GCTCATGAGA CAATAACCCT GATAAATGCT180TCAATAATAT TGAAAAAGGA AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC240CTTTTTTGCG GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG TGAAAGTAAA300AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC TCAACAGCGG360TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA ATGATGAGCA CTTTTAAAGT420TCTGCTATGT GGCGCGGTAT TATCCCGTGT TGACGCCGGG CAAGAGCAAC TCGGTCGCCG480CATACACTAT TCTCAGAATG ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC540GGATGGCATG ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG ATAACACTGC600GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT TTTTGCACAA660CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG GAGCTGAATG AAGCCATACC720AAACGACGAG CGTGACACCA CGATGCCTGC AGCAATGGCA ACAACGTTGC GCAAACTATT780AACTGGCGAA CTACTTACTC TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA840TAAAGTTGCA GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA TTGCTGATAA900ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC CAGATGGTAA960GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG GCAACTATGG ATGAACGAAA 1020TAGACAGATC GCTGAGATAG GTGCCTCACT GATTAAGCAT TGGTAACTGT CAGACCAAGT 1080TTACTCATAT ATACTTTAGA TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT 1140GAAGATCCTT TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT CGTTCCACTG 1200AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT TTCTGCGCGT 1260AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG GTGGTTTGTT TGCCGGATCA 1320AGAGCTACCA ACTCTTTTTC CGAAGGTAAC TGGCTTCAGC AGAGCGCAGA TACCAAATAC 1380TGTCCTTCTA GTGTAGCCGT AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC 1440ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA AGTCGTGTCT 1500TACCGGGGTTG GACTCAAGACGATAGTTACC GGATAAGGCG CAGCGGTCGG GCTGAACGGG 1560GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC ACCGAACTGA GATACCTACA 1620GCGTGAGCTA TGAGAAAGCG CCACGCTTCC CGAAGGGAGA AAGGCGGACA GGTATCCGGT 1680AAGCGGCAGG GTCGGAACAG GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA 1740TCTTTATAGT CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT TGTGATGCTC 1800GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC GGTTCCTGGC 1860CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA TCCCCTGATT CTGTGGATAA 1920CCGTATTACC GCCTTTGAGT GAGCTGATAC CGCTCGCCGC AGCCGAACGA CCGAGCGCAG 1980CGAGTCAGTG AGCGAGGAAG CGGAAGAGCG CCTGATGCGG TATTTTCTCC TTACGCATCT 2040GTGCGGTATT TCACACCGCA TATGGTGCAC TCTCAGTACA ATCTGCTCTG ATGCCGCATA 2100GTTAAGCCAG TATACACTCC GCTATCGCTA CGTGACTGGG TCATGGCTGC GCCCCGACAC 2160CCGCCAACAC CCGCTGACGC GCCCTGACGG GCTTGTCTGC TCCCGGCATC CGCTTACAGA 2220CAAGCTGTGA CCGTCTCCGG GAGCTGCATG TGTCAGAGGT TTTCACCGTC ATCACCGAAA 2280CGCGCGAGGC AGCATGCATC TCAATTAGTC AGCAACCATA GTCCCGCCCC TAACTCCGCC 2340CATCCCGCCC CTAACTCCGC CCAGTTCCGC CCATTCTCCG CCCCATGGCT GACTAATTTT 2400TTTTATTTAT GCAGAGGCCG AGGCCGCCTC GGCCTCTGAG CTATTCCAGA AGTAGTGAGG 2460AGGCTTTTTT GGAGGCCTAG GCTTTTGCAA AAAGCTAGCT TACAGCTCAG GGCTGCGATT 2520TCGCGCCAAA CTTGACGGCA ATCCTAGCGT GAAGGCTGGT AGGATTTTAT CCCCGCTGCC 2580ATCATGGTTC GACCATTGAA CTGCATCGTC GCCGTGTCCC AAAATATGGG GATTGGCAAG 2640AACGGAGACC TACCCTGGCC TCCGCTCAGG AACGAGTTCA AGTACTTCCA AAGAATGACC 2700ACAACCTCTT CAGTGGAAGG TAAACAGAAT CTGGTGATTA TGGGTAGGAA AACCTGGTTC 2760TCCATTCCTG AGAAGAATCG ACCTTTAAAG GACAGAATTA ATATAGTTCT CAGTAGAGAA 2820CTCAAAGAAC CACCACGAGG AGCTCATTTT CTTGCCAAAA GTTTGGATGA TGCCTTAAGA 2880CTTATTGAAC AACCGGAATT GGCAAGTAAA GTAGACATGG TTTGGATAGT CGGAGGCAGT 2940TCTGTTTACC AGGAAGCCAT GAATCAACCA GGCCACCTCA GACTCTTTGT GACAAGGATC 3000ATGCAGGAAT TTGAAAGTGA CACGTTTTTC CCAGAAATTG ATTTGGGGAA ATATAAACTT 3060CTCCCAGAAT ACCCAGGCGT CCTCTCTGAG GTCCAGGAGG AAAAAGGCAT CAAGTATAAG 3120TTTGAAGTCT ACGAGAAGAA AGACTAACAG GAAGATGCTT TCAAGTTCTC TGCTCCCCTC 3180CTAAAGCTAT GCATTTTTAT AAGACCATGG GACTTTTGCT GGCTTTAGAT CTTTGTGAAG 3240GAACCTTACT TCTGTGGTGT GACATAATTG GACAAACTAC CTACAGAGAT TTAAAGCTCT 3300AAGGTAAATA TAAAATTTTT AAGTGTATAA TGTGTTAAAC TACTGATTCT AATTGTTTGT 3360GTATTTTAGA TTCCAACCTA TGGAACTGAT GAATGGGAGC AGTGGTGGAA TGCCTTTAAT 3420GAGGAAAACC TGTTTTGCTC AGAAGAAATG CCATCTAGTG ATGATGAGGC TACTGCTGAC 3480TCTCAACATT CTACTCCTCC AAAAAAGAAG AGAAAGGTAG AAGACCCCAA GGACTTTCCT 3540TCAGAATTGC TAAGTTTTTT GAGTCATGCT GTGTTTAGTA ATAGAACTCT TGCTTGCTTT 3600GCTATTTACA CCACAAAGGA AAAAGCTGCA CTGCTATACA AGAAAATTAT GGAAAAATAT 3660TCTGTAACCT TTATAAGTAG GCATAACAGT TATAATCATA ACATACTGTT TTTTCTTACT 3720CCACACAGGC ATAGAGTGTC TGCTATTAAT AACTATGCTC AAAAATTGTG TACCTTTAGC 3780TTTTTAATTT GTAAAGGGGT TAATAAGGAA TATTTGATGT ATAGTGCCTT GACTAGAGAT 3840CATAATCAGC CATACCACAT TTGTAGAGGT TTTACTTGCT TTAAAAAACC TCCCACACCT 3900CCCCCTGAAC CTGAAACATA AAATGAATGC AATTGTTGTT GTTAACTTGT TTATTGCAGC 3960TTATAATGGT TACAAATAAA GCAATAGCAT CACAAATTTC ACAAATAAAG CATTTTTTTC 4020ACTGCATTCT AGTTGTGGTT TGTCCAAACT CATCAATGTA TCTTATCATG TCTGGATCTA 4080ATAAAAGATA TTTATTTTCA TTAGATATGT GTGTTGGTTT TTTGTGTGCA GTGCCTCTAT 4140CTGGAGGCCA GGTAGGGCTG GCCTTGGGGG AGGGGGAGGC CAGAATGACT CCAAGAGCTA 4200CAGGAAGGCA GGTCAGAGAC CCCACTGGAC AAACAGTGGC TGGACTCTGC ACCATAACAC 4260ACAATCAACA GGGGAGTGAG CTGGAAATTT GCTAGCGAAT TCCAGCACAC TGGCGGCCGT 4320TACTAGTTAT TAATAGTAAT CAATTACGGG GTCATTAGTT CATAGCCCAT ATATGGAGTT 4380CCGCGTTACA TAACTTACGG TAAATGGCCC GCCTGGCTGA CCGCCCAACG ACCCCCGCCC 4440ATTGACGTCA ATAATGACGT ATGTTCCCAT AGTAACGCCA ATAGGGACTT TCCATTGACG 4500TCAATGGGTG GAGTATTTAC GGTAAACTGC CCACTTGGCA GTACATCAAG TGTATCATAT 4560GCCAAGTACG CCCCCTATTG ACGTCAATGA CGGTAAATGG CCCGCCTGGC ATTATGCCCA 4620GTACATGACC TTATGGGACT TTCCTACTTG GCAGTACATC TACGTATTAG TCATCGCTAT 4680TACCATGGTG ATGCGGTTTT GGCAGTACAT CAATGGGCGT GGATAGCGGT TTGACTCACG 4740GGGATTTCCA AGTCTCCACC CCATTGACGT CAATGGGAGT TTGTTTTGGC ACCAAAATCA 4800ACGGGACTTT CCAAAATGTC GTAACAACTC CGCCCCATTG ACGCAAATGG GCGGTAGGCG 4860TGTACGGTGG GAGGTCTATA TAAGCAGAGC TCGTTTAGTG AACCGTCAGA TCGCCTGGAG 4920ACGCCATCCA CGCTGTTTTG ACCTCCATAG AAGACACCGG GACCGATCCA GCCTCCGCGG 4980CCGGGAACGG TGCATTGGAA CGCGGATTCC CCGTGCCAAG AGTGACGTAA GTACCGCCTA 5040TAGAGTCTAT AGGCCCACCC CCTTGGCTTC TTATGCATGC TATACTGTTT TTGGCTTGGG 5100GTCTATACAC CCCCGCTTCC TCATGTTATA GGTGATGGTA TAGCTTAGCC TATAGGTGTG 5160GGTTATTGAC CATTATTGAC CACTCCCCTA TTGGTGACGA TACTTTCCAT TACTAATCCA 5220TAACATGGCT CTTTGCCACA ACTCTCTTTA TTGGCTATAT GCCAATACAC TGTCCTTCAG 5280AGACTGACAC GGACTCTGTA TTTTTACAGG ATGGGGTCTC ATTTATTATT TACAAATTCA 5340CATATACAAC ACCACCGTCC CCAGTGCCCG CAGTTTTTAT TAAACATAAC GTGGGATCTC 5400CACGCGAATC TCGGGTACGT GTTCCGGACA TGGGCTCTTC TCCGGTAGCG GCGGAGCTTC 5460TACATCCGAG CCCTGCTCCC ATGCCTCCAG CGACTCATGG TCGCTCGGCA GCTCCTTGCT 5520CCTAACAGTG GAGGCCAGAC TTAGGCACAG CACGATGCCC ACCACCACCA GTGTGCCGCA 5580CAAGGCCGTG GCGGTAGGGT ATGTGTCTGA AAATGAGCTC GGGGAGCGGG CTTGCACCGC 5640TGACGCATTT GGAAGACTTA AGGCAGCGGC AGAAGAAGAT GCAGGCAGCT GAGTTGTTGT 5700GTTCTGATAA GAGTCAGAGG TAACTCCCGT TGCGGTGCTG TTAACGGTGG AGGGCAGTGT 5760AGTCTGAGCA GTACTCGTTG CTGCCGCGCG CGCCACCAGA CATAATAGCT GACAGACTAA 5820CAGACTGTTC CTTTCCATGG GTCTTTTCTG CAGTCACCGT CCTTGACACG CGTCTCGGGA 5880AGCTTGCCGC CACCATGGGA TGGAGCTGGG TCTTTCTCTT TCTCCTGTCA GGAACTGCAG 5940GTGTCCTCTC TGAGGTCCAG CTGCAACAGT CTGGACCTGA GCTGGTGAAG CCTGGGGCTT 6000CAGTAAAGAT GTCCTGCAAG ACTTCTAGAT ACACATTCAC TGAATACACC ATACACTGGG 6060TGAGACAGAG CCATGGAAAG AGCCTTGAGT GGATTGGAGG TATTAATCCT AACAATGGTA 6120TTCCTAACTA CAACCAGAAG TTCAAGGGCA GGGCCACATT GACTGTAGGC AAGTCCTCCA 6180GCACCGCCTA CATGGAGCTC CGCAGCCTGA CATCTGAGGA TTCTGCGGTC TATTTCTGTG 6240CAAGAAGAAG AATCGCCTAT GGTTACGACG AGGGCCATGC TATGGACTAC TGGGGTCAAG 6300GAACCTCAGT CACCGTCTCC TCAGGTGAGT GGATCCTCTG CGCCTGGGCC CAGCTCTGTC 6360CCACACCGCG GTCACATGGC ACCACCTCTC TTGCAGCCTC CACCAAGGGC CCATCGGTCT 6420TCCCCCTGGC ACCCTCCTCC AAGAGCACCT CTGGGGGCAC AGCGGCCCTG GGCTGCCTGG 6480TCAAGGACTA CTTCCCCGAA CCGGTGACGG TGTCGTGGAA CTCAGGCGCC CTGACCAGCG 6540GCGTGCACAC CTTCCCGGCT GTCCTACAGT CCTCAGGACT CTACTCCCTC AGCAGCGTGG 6600TGACCGTGCC CTCCAGCAGC TTGGGCACCC AGACCTACAT CTGCAACGTG AATCACAAGC 6660CCAGCAACAC CAAGGTGGAC AAGAAAGTTG AGCCCAAATC TTGTGACAAA ACTCACACAT 6720GCCCACCGTG CCCAGCACCT GAACTCCTGG GGGGACCGTC AGTCTTCCTC TTCCCCCCAA 6780AACCCAAGGA CACCCTCATG ATCTCCCGGA CCCCTGAGGT CACATGCGTG GTGGTGGACG 6840TGAGCCACGA AGACCCTGAG GTCAAGTTCA ACTGGTACGT GGACGGCGTG GAGGTGCATA 6900ATGCCAAGAC AAAGCCGCGG GAGGAGCAGT ACAACAGCAC GTACCGGGTG GTCAGCGTCC 6960TCACCGTCCT GCACCAGGAC TGGCTGAATG GCAAGGAGTA CAAGTGCAAG GTCTCCAACA 7020AAGCCCTCCC AGCCCCCATC GAGAAAACCA TCTCCAAAGC CAAAGGGCAG CCCCGAGAAC 7080CACAGGTGTA CACCCTGCCC CCATCCCGGG AGGAGATGAC CAAGAACCAG GTCAGCCTGA 7140CCTGCCTGGT CAAAGGCTTC TATCCCAGCG ACATCGCCGT GGAGTGGGAG AGCAATGGGC 7200AGCCGGAGAA CAACTACAAG ACCACGCCTC CCGTGCTGGA CTCCGACGGC TCCTTCTTCC 7260TCTACAGCAA GCTCACCGTG GACAAGAGCA GGTGGCAGCA GGGGAACGTC TTCTCATGCT 7320CCGTGATGCA TGAGGCTCTG CACAACCACT ACACGCAGAA GAGCCTCTCC CTGTCTCCGG 7380GTAAATGAGT GCGACGGCCG GCAAGCCCCG CTCCCCGGGC TCTCGCGGTC GCACGAGGAT 7440GCTTGGCACG TACCCCCTGT ACATACTTCC CGGGCGCCCA GCATGGAAAT AAAGCACCGG 7500ATCTAATAAA AGATATTTAT TTTCATTAGA TATGTGTGTT GGTTTTTTGT GTGCAGTGCC 7560TCTATCTGGA GGCCAGGTAG GGCTGGCCTT GGGGGAGGGG GAGGCCAGAA TGACTCCAAG 7620AGCTACAGGA AGGCAGGTCA GAGACCCCAC TGGACAAACA GTGGCTGGAC TCTGCACCAT 7680AACACACAAT CAACAGGGGA GTGAGCTGGA AATTTGCTAG CGAATTAATT C 7731(2)SEQ ID NO:30的资料(ⅰ)序列特征(A)长度472个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:30Met Gly Trp Ser Trp Val Phe Leu Phe Leu Leu Ser Gly Thr Ala Gly1 5 10 15Val Leu Ser Glu Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Val Lys20 25 30Pro Gly Ala Ser Val Lys Met Ser Cys Lys Thr Ser Arg Tyr Thr Phe35 40 45Thr Glu Tyr Thr Ile His Trp Val Arg Gln Ser His Gly Lys Ser Leu50 55 60Glu Trp Ile Gly Gly Ile Ash Pro Asn Ash Gly Ile Pro Asn Tyr Asn65 70 75 80Gln Lys Phe Lys Gly Arg Ala Thr Leu Thr Val Gly Lys Ser Ser Ser85 90 95Thr Ala Tyr Met Glu Leu Arg Ser Leu Thr Ser Glu Asp Ser Ala Val100 105 110Tyr Phe Cys Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His115 120 125Ala Met Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ser130 135 140Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr145150 155 160Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro165 170 175Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val180 185 190His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser195 200 205Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile210 215 220Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val225 230 235 240Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala245 250 255Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro260 265 270Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val275 280 285Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val290 295 300Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln305 310 315 320Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln325 330 335Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala340 345 350Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro355 360 365Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Mer Thr370 375 380Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser385 390 395 400Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Ash Tyr405 410 415Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr420 425 430Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe435 440 445Ser Cys Ser val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys450 455 460Ser Leu Ser Leu Ser Pro Gly Lys465 470(2)SEQ ID NO:31的资料(ⅰ)序列特征(A)长度339个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:31GACATTGTGA TGACCCAATC TCCAGACTCT TTGGCTGTGT CTCTAGGGGA GAGGGCCACC60ATCAACTGCA AGTCCAGTCA GAGCCTTTTA TATTCTAGAA ATCAAAAGAA CTACTTGGCC 120TGGTATCAGC AGAAACCAGG ACAGCCACCC AAACTCCTCA TCTTTTGGGC TAGCACTAGG 180GAATCTGGGG TACCTGATAG GTTCAGTGGC AGTGGGTTTG GGACAGACTT CACCCTCACC 240ATTAGCAGCC TGCAGGCTGA AGATGTGGCA GTTTATTACT GTCAGCAATA TTTTAGCTAT 300CCGCTCACGT TCGGACAAGG GACCAAGGTG GAAATAAAA339(2)SEQIDNO:32的资料(ⅰ)序列特征(A)长度113个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:32Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly1 5 10 15Glu Arg Ala Thr Ile Ash Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser20 25 30Arg Asn Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln35 40 45Pro Pro Lys Leu Leu Ile Phe Trp Ala Ser Thr Arg Glu Ser Gly Val50 55 60Pro Asp Ar9 Phe Ser Gly Ser Gly Phe Gly Thr Asp Phe Thr Leu Thr65 70 75 80Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Val Tyr Tyr Cys Gln Gln85 90 95Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Gln Gly Thr Lys Val Glu Ile100 105 110Lys(2)SEQ ID NO:33的资料(ⅰ)序列特征(A)长度113个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:33Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly1 5 10 15Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser20 25 30Arg Asn Gln Lys Asn Tyr Leu Ala Trp Phe Gln Gln Lys Pro Gly Gln35 40 45Pro Pro Lys Leu Leu Ile Phe Trp Ala Ser Thr Arg Glu Ser Gly Val50 55 60Pro Asp Arg Phe Ser Gly Ser Gly Phe Gly Thr Asp Phe Thr Leu Thr65 70 75 80Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Val Tyr Asp Cys Gln Gln85 90 95Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Gln Gly Thr Lys Val Glu Ile100 105 110Lys(2)SEQ ID NO:34的资料(ⅰ)序列特征(A)长度113个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQIDNO:34Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala Val Ser Leu Gly1 5 10 15Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser Leu Leu Tyr Ser20 25 30Arg Asn Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln35 40 45Pro Pro Lys Leu Leu Ile Tyr Trp Ala Ser Thr Arg Glu Ser Gly Val50 55 60Pro Asp Arg Phe Ser Gly Ser Gly Phe Gly Thr Asp Phe Thr Leu Thr65 70 75 80Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Val Tyr Tyr Cys Gln Gln85 90 95Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Gln Gly Thr Lys Val Glu Ile100 105 110Lys(2)SEQ ID NO:35的资料(ⅰ)序列特征(A)长度8068个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQIDNO:35GAATTCCAGC ACACTGGCGG CCGTTACTAG TTATTAATAG TAATCAATTA CGGGGTCATT60AGTTCATAGC CCATATATGG AGTTCCGCGT TACATAACTT ACGGTAAATG GCCCGCCTGG 120CTGACCGCCC AACGACCCCC GCCCATTGAC GTCAATAATG ACGTATGTTC CCATAGTAAC 180GCCAATAGGG ACTTTCCATT GACGTCAATG GGTGGAGTAT TTACGGTAAA CTGCCCACTT 240GGCAGTACAT CAAGTGTATC ATATGCCAAG TACGCCCCCT ATTGACGTCA ATGACGGTAA 300ATGGCCCGCC TC GCATTATG CCCAGTACAT GACCTTATGG GACTTTCCTA CTTGGCAGTA 360CATCTACGTA TTAGTCATCG CTATTACCAT GGTGATGCGG TTTTGGCAGT ACATCAATGG 420GCGTGGATAG CGGTTTGACT CACGGGGATT TCCAAGTCTC CACCCCATTG ACGTCAATGG 480GAGTTTGTTT TGGCACCAAA ATCAACGGGA CTTTCCAAAA TGTCGTAACA ACTCCGCCCC 540ATTGACGCAA ATGGGCGGTA GGCGTGTACG GTGGGAGGTC TATATAAGCA GAGCTCGTTT 600AGTGAACCGT CAGATCGCCT GGAGACGCCA TCCACGCTGT TTTGACCTCC ATAGAAGACA 660CCGGGACCGA TCCAGCCTCC GCGGCCGGGA ACGGTGCATT GGAACGCGGA TTCCCCGTGC 720CAAGAGTGAC GTAAGTACCG CCTATAGAGT CTATAGGCCC ACCCCCTTGG CTTCTTATGC 780ATGCTATACT GTTTTTGGCT TGGGGTCTAT ACACCCCCGC TTCCTCATGT TATAGGTGAT 840GGTATAGCTT AGCCTATAGG TGTGGGTTAT TGACCATTAT TGACCACTCC CCTATTGGTG 900ACGATACTTT CCATTACTAA TCCATAACAT GGCTCTTTGC CACAACTCTC TTTATTGGCT 960ATATGCCAAT ACACTGTCCT TCAGAGACTG ACACGGACTC TGTATTTTTA CAGGATGGGG 1020TCTCATTTAT TATTTACAAA TTCACATATA CAACACCACC GTCCCCAGTG CCCGCAGTTT 1080TTATTAAACA TAACGTGGGA TCTCCACGCG AATCTCGGGT ACGTGTTCCG GACATGGGCT 1140CTTCTCCGGT AGCGGCGGAG CTTCTACATC CGAGCCCTGC TCCCATGCCT CCAGCGACTC1200ATGGTCGCTC GGCAGCTCCT TGCTCCTAAC AGTGGAGGCC AGACTTAGGC ACAGCACGAT1260GCCCACCACC ACCAGTGTGC CGCACAAGGC CGTGGCGGTA GGGTATGTGT CTGAAAATGA1320GCTCGGGGAG CGGGCTTGCA CCGCTGACGC ATTTGGAAGA CTTAAGGCAG CGGCAGAAGA1380AGATGCAGGC AGCTGAGTTG TTGTGTTCTG ATAAGAGTCA GAGGTAACTC CCGTTGCGGT1440GCTGTTAACG GTGGAGGGCA GTGTAGTCTG AGCAGTACTC GTTGCTGCCG CGCGCGCCAC1500CAGACATAAT AGCTGACAGA CTAACAGACT GTTCCTTTCC ATGGGTCTTT TCTGCAGTCA1560CCGTCCTTGA CACGCGTCTC GGGAAGCTTG CCGCCACCAT GGAGACAGAC ACACTCCTGC1620TATGGGTGCT GCTGCTCTGG GTTCCAGGTT CCTCCGGAGA CATTGTGATG ACCCAATCTC1680CAGACTCTTT GGCTGTGTCT CTAGGGGAGA GGGCCACCAT CAACTGCAAG TCCAGTCAGA1740GCCTTTTATA TTCTAGAAAT CAAAAGAACT ACTTGGCCTG GTATCAGCAG AAACCAGGAC1800AGCCACCCAA ACTCCTCATC TTTTGGGCTA GCACTAGGGA ATCTGGGGTA CCTGATAGGT1860TCAGTGGCAG TGGGTTTGGG ACAGACTTCA CCCTCACCAT TAGCAGCCTG CAGGCTGAAG1920ATGTGGCAGT TTATTACTGT CAGCAATATT TTAGCTATCC GCTCACGTTC GGACAAGGGA1980CCAAGGTGGA AATAAAACGT GAGTGGATCC ATCTGGGATA AGCATGCTGT TTTCTGTCTG2040TCCCTAACAT GCCCTGTGAT TATGCGCAAA CAACACACCC AAGGGCAGAA CTTTGTTACT2100TAAACACCAT CCTGTTTGCT TCTTTCCTCA GGAACTGTGG CTGCACCATC TGTCTTCATC2160TTCCCGCCAT CTGATGAGCA GTTGAAATCT GGAACTGCCT CTGTTGTGTG CCTGCTGAAT2220AACTTCTATC CCAGAGAGGC CAAAGTACAG TGGAAGGTGG ATAACGCCCT CCAATCGGGT2280AACTCCCAGG AGAGTGTCAC AGAGCAGGAC AGCAAGGACA GCACCTACAG CCTCAGCAGC2340ACCCTGACGC TGAGCAAAGC AGACTACGAG AAACACAAAG TCTACGCCTG CGAAGTCACC2400CATCAGGGCC TGAGCTCGCC CGTCACAAAG AGCTTCAACA GGGGAGAGTG TTAGAGGGAG2460AAGTGCCCCC ACCTGCTCCT CAGTTCCAGC CTGACCCCCT CCCATCCTTT GGCCTCTGAC2520CCTTTTTCCA CAGGGGACCT ACCCCTATTG CGGTCCTCCA GCTCATCTTT CACCTCACCC2580CCCTCCTCCT CCTTGGCTTT AATTATGCTA ATGTTGGAGG AGAATGAATA AATAAAGTGA2640ATCTTTGCAC CTGTGGTGGA TCTAATAAAA GATATTTATT TTCATTAGAT ATGTGTGTTG2700GTTTTTTGTG TGCAGTGCCT CTATCTGGAG GCCAGGTAGG GCTGGCCTTG GGGGAGGGGG2760AGGCCAGAAT GACTCCAAGA GCTACAGGAA GGCAGGTCAG AGACCCCACT GGACAAACAG2820TGGCTGGACT CTGCACCATA ACACACAATC AACAGGGGAG TGAGCTGGAA ATTTGCTAGC2880GAATTCTTGA AGACGAAAGG GCCTCGTGAT ACGCCTATTT TTATAGGTTA ATGTCATGAT2940AATAATGGTT TCTTAGACGT CAGGTGGCAC TTTTCGGGGA AATGTGCGCG GAACCCCTAT 3000TTGTTTATTT TTCTAAATAC ATTCAAATAT GTATCCGCTC ATGAGACAAT AACCCTGATA 3060AATGCTTCAA TAATATTGAA AAAGGAAGAG TATGAGTATT CAACATTTCC GTGTCGCCCT 3120TATTCCCTTT TTTGCGGCAT TTTGCCTTCC TGTTTTTGCT CACCCAGAAA CGCTGGTGAA 3180AGTAAAAGAT GCTGAAGATC AGTTGGGTGC ACGAGTGGGT TACATCGAAC TGGATCTCAA 3240CAGCGGTAAG ATCCTTGAGA GTTTTCGCCC CGAAGAACGT TTTCCAATGA TGAGCACTTT 3300TAAAGTTCTG CTATGTGGCG CGGTATTATC CCGTGTTGAC GCCGGGCAAG AGCAACTCGG 3360TCGCCGCATA CACTATTCTC AGAATGACTT GGTTGAGTAC TCACCAGTCA CAGAAAAGCA 3420TCTTACGGAT GGCATGACAG TAAGAGAATT ATGCAGTGCT GCCATAACCA TGAGTGATAA 3480CACTGCGGCC AACTTACTTC TGACAACGAT CGGAGGACCG AAGGAGCTAA CCGCTTTTTT 3540GCACAACATG GGGGATCATG TAACTCGCCT TGATCGTTGG GAACCGGAGC TGAATGAAGC 3600CATACCAAAC GACGAGCGTG ACACCACGAT GCCTGCAGCA ATGGCAACAA CGTTGCGCAA 3660ACTATTAACT GGCGAACTAC TTACTCTAGC TTCCCGGCAA CAATTAATAG ACTGGATGGA 3720GGCGGATAAA GTTGCAGGAC CACTTCTGCG CTCGGCCCTT CCGGCTGGCT GGTTTATTGC 3780TGATAAATCT GGAGCCGGTG AGCGTGGGTC TCGCGGTATC ATTGCAGCAC TGGGGCCAGA 3840TGGTAAGCCC TCCCGTATCG TAGTTATCTA CACGACGGGG AGTCAGGCAA CTATGGATGA 3900ACGAAATAGA CAGATCGCTG AGATAGGTGC CTCACTGATT AAGCATTGGT AACTGTCAGA 3960CCAAGTTTAC TCATATATAC TTTAGATTGA TTTAAAACTT CATTTTTAAT TTAAAAGGAT 4020CTAGGTGAAG ATCCTTTTTG ATAATCTCAT GACCAAAATC CCTTAACGTG AGTTTTCGTT 4080CCACTGAGCG TCAGACCCCG TAGAAAAGAT CAAAGGATCT TCTTGAGATC CTTTTTTTCT 4140GCGCGTAATC TGCTGCTTGC AAACAAAAAA ACCACCGCTA CCAGCGGTGG TTTGTTTGCC 4200GGATCAAGAG CTACCAACTC TTTTTCCGAA GGTAACTGGC TTCAGCAGAG CGCAGATACC 4260AAATACTGTC CTTCTAGTGT AGCCGTAGTT AGGCCACCAC TTCAAGAACT CTGTAGCACC 4320GCCTACATAC CTCGCTCTGC TAATCCTGTT ACCAGTGGCT GCTGCCAGTG GCGATAAGTC 4380GTGTCTTACC GGGTTGGACT CAAGACGATA GTTACCGGAT AAGGCGCAGC GGTCGGGCTG 4440AACGGGGGGT TCGTGCACAC AGCCCAGCTT GGAGCGAACG ACCTACACCG AACTGAGATA 4500CCTACAGCGT GAGCTATGAG AAAGCGCCAC GCTTCCCGAA GGGAGAAAGG CGGACAGGTA 4560TCCGGTAAGC GGCAGGGTCG GAACAGGAGA GCGCACGAGG GAGCTTCCAG GGGGAAACGC 4620CTGGTATCTT TATAGTCCTG TCGGGTTTCG CCACCTCTGA CTTGAGCGTC GATTTTTGTG 4680ATGCTCGTCA GGGGGGCGGA GCCTATGGAA AAACGCCAGC AACGCGGCCT TTTTACGGTT 4740CCTGGCCTTT TGCTGGCCTT TTGCTCACAT GTTCTTTCCT GCGTTATCCC CTGATTCTGT 4800GGATAACCGT ATTACCGCCT TTGAGTGAGC TGATACCGCT CGCCGCAGCC GAACGACCGA 4860GCGCAGCGAG TCAGTGAGCG AGGAAGCGGA AGAGCGCCTG ATGCGGTATT TTCTCCTTAC 4920GCATCTGTGC GGTATTTCAC ACCGCATATG GTGCACTCTC AGTACAATCT GCTCTGATGC 4980CGCATAGTTA AGCCAGTATA CACTCCGCTA TCGCTACGTG ACTGGGTCAT GGCTGCGCCC 5040CGACACCCGC CAACACCCGC TGACGCGCCC TGACGGGCTT GTCTGCTCCC GGCATCCGCT 5100TACAGACAAG CTGTGACCGT CTCCGGGAGC TGCATGTGTC AGAGGTTTTC ACCGTCATCA 5160CCGAAACGCG CGAGGCAGCT GTGGAATGTG TGTCAGTTAG GGTGTGGAAA GTCCCCAGGC 5220TCCCCAGCAG GCAGAAGTAT GCAAAGCATG CATCTCAATT AGTCAGCAAC CAGGCTCCCC 5280AGCAGGCAGA AGTATGCAAA GCATGCATCT CAATTAGTCA GCAACCATAG TCCCGCCCCT 5340AACTCCGCCC ATCCCGCCCC TAACTCCGCC CAGTTCCGCC CATTCTCCGC CCCATGGCTG 5400ACTAATTTTT TTTATTTATG CAGAGGCCGA GGCCGCCTCG GCCTCTGAGC TATTCCAGAA 5460GTAGTGAGGA GGCTTTTTTG GAGGCCTAGG CTTTTGCAAA AAGCTAGCTT CACGCTGCCG 5520CAAGCACTCA GGGCGCAAGG GCTGCTAAAG GAAGCGGAAC ACGTAGAAAG CCAGTCCGCA 5580GAAACGGTGC TGACCCCGGA TGAATGTCAG CTACTGGGCT ATCTGGACAA GGGAAAACGC 5640AAGCGCAAAG AGAAAGCAGG TAGCTTGCAG TGGGCTTACA TGGCGATAGC TAGACTGGGC 5700GGTTTTATGG ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG 5760GAAGCCCTGC AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG 5820ATCAAGATCT GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATGATTGAAC AAGATGGATT 5880GCACGCAGGT TCTCCGGCCG CTTGGGTGGA GAGGCTATTC GGCTATGACT GGGCACAACA 5940GACAATCGGC TGCTCTGATG CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC GCCCGGTTCT 6000TTTTGTCAAG ACCGACCTGT CCGGTGCCCT GAATGAACTG CAGGACGAGG CAGCGCGGCT 6060ATCGTGGCTG GCCACGACGG GCGTTCCTTG CGCAGCTGTG CTCGACGTTG TCACTGAAGC 6120GGGAAGGGAC TGGCTGCTAT TGGGCGAAGT GCCGGGGCAG GATCTCCTGT CATCTCACCT 6180TGCTCCTGCC GAGAAAGTAT CCATCATGGC TGATGCAATG CGGCGGCTGC ATACGCTTGA 6240TCCGGCTACC TGCCCATTCG ACCACCAAGC GAAACATCGC ATCGAGCGAG CACGTACTCG 6300GATGGAAGCC GGTCTTGTCG ATCAGGATGA TCTGGACGAA GAGCATCAGG GGCTCGCGCC 6360AGCCGAACTG TTCGCCAGGC TCAAGGCGCG CATGCCCGAC GGCGAGGATC TCGTCGTGAC 6420CCATGGCGAT GCCTGCTTGC CGAATATCAT GGTGGAAAAT GGCCGCTTTT CTGGATTCAT 6480CGACTGTGGC CGGCTGGGTG TGGCGGACCG CTATCAGGAC ATAGCGTTGG CTACCCGTGA 6540TATTGCTGAA GAGCTTGGCG GCGAATGGGC TGACCGCTTC CTCGTGCTTT ACGGTATCGC 6600CGCTCCCGAT TCGCAGCGCA TCGCCTTCTA TCGCCTTCTT GACGAGTTCT TCTGAGCGGG 6660ACTCTGGGGT TCGAAATGAC CGACCAAGCG ACGCCCAACC TGCCATCACG AGATTTCGAT 6720TCCACCGCCG CCTTCTATGA AAGGTTGGGC TTCGGAATCG TTTTCCGGGA CGCCGGCTGG 6780ATGATCCTCC AGCGCGGGGA TCTCATGCTG GAGTTCTTCG CCCACCCCGG GCTCGATCCC 6840CTCGCGAGTT GGTTCAGCTG CTGCCTGAGG CTGGACGACC TCGCGGAGTT CTACCGGCAG 6900TGCAAATCCG TCGGCATCCA GGAAACCAGC AGCGGCTATC CGCGCATCCA TGCCCCCGAA 6960CTGCAGGAGT GGGGAGGCAC GATGGCCGCT TTGGTCCCGG ATCTTTGTGA AGGAACCTTA 7020CTTCTGTGGT GTGACATAAT TGGACAAACT ACCTACAGAG ATTTAAAGCT CTAAGGTAAA 7080TATAAAATTT TTAAGTGTAT AATGTGTTAA ACTACTGATT CTAATTGTTT GTGTATTTTA 7140GATTCCAACC TATGGAACTG ATGAATGGGA GCAGTGGTGG AATGCCTTTA ATGAGGAAAA 7200CCTGTTTTGC TCAGAAGAAA TGCCATCTAG TGATGATGAG GCTACTGCTG ACTCTCAACA 7260TTCTACTCCT CCAAAAAAGA AGAGAAAGGT AGAAGACCCC AAGGACTTTC CTTCAGAATT 7320GCTAAGTTTT TTGAGTCATG CTGTGTTTAG TAATAGAACT CTTGCTTGCT TTGCTATTTA 7380CACCACAAAG GAAAAAGCTG CACTGCTATA CAAGAAAATT ATGGAAAAAT ATTCTGTAAC 7440CTTTATAAGT AGGCATAACA GTTATAATCA TAACATACTG TTTTTTCTTA CTCCACACAG 7500GCATAGAGTG TCTGCTATTA ATAACTATGC TCAAAAATTG TGTACCTTTA GCTTTTTAAT 7560TTGTAAAGGG GTTAATAAGG AATATTTGAT GTATAGTGCC TTGACTAGAG ATCATAATCA 7620GCCATACCAC ATTTGTAGAG GTTTTACTTG CTTTAAAAAA CCTCCCACAC CTCCCCCTGA 7680ACCTGAAACA TAAAATGAAT GCAATTGTTG TTGTTAACTT GTTTATTGCA GCTTATAATG 7740GTTACAAATA AAGCAATAGC ATCACAAATT TCACAAATAA AGCATTTTTT TCACTGCATT 7800CTAGTTGTGG TTTGTCCAAA CTCATCAATG TATCTTATCA TGTCTGGATC TAATAAAAGA 7860TATTTATTTT CATTAGATAT GTGTGTTGGT TTTTTGTGTG CAGTGCCTCT ATCTGGAGGC 7920CAGGTAGGGC TGGCCTTGGG GGAGGGGGAG GCCAGAATGA CTCCAAGAGC TACAGGAAGG 7980CAGGTCAGAG ACCCCACTGG ACAAACAGTG GCTGGACTCT GCACCATAAC ACACAATCAA 8040CAGGGGAGTG AGCTGGAAAT TTGCTAGC8068(2)SEQ ID NO:36的资料(ⅰ)序列特征(A)长度234个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:36Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro1 5 10 15Gly Ser Ser Gly Asp Ile Val Met Thr Gln Ser Pro Asp Ser Leu Ala20 25 30Val Ser Leu Gly Glu Arg Ala Thr Ile Asn Cys Lys Ser Ser Gln Ser35 40 45Leu Leu Tyr Ser Arg Asn Gln Lys Asn Tyr Leu Ala Trp Tyr Gln Gln50 55 60Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile Phe Trp Ala Ser Thr Arg65 70 75 80Glu Ser Gly Val Pro Asp Arg Phe Ser Gly Ser Gly Phe Gly Thr Asp85 90 95Phe Thr Leu Thr Ile Ser Ser Leu Gln Ala Glu Asp Val Ala Val Tyr100 105 110Tyr Cys Gln Gln Tyr Phe Ser Tyr Pro Leu Thr Phe Gly Gln Gly Thr115 120 125Lys Val Glu Ile Lys Arg Val Phe Ile Phe Pro Pro Ser Asp Glu Gln130 135 140Leu Lys Ser Gly Thr Ala Ser Val val Cys Leu Leu Asn Asn Phe Tyr145 150 155 160Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser165 170 175Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr180 185 190Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys195 200 205His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro210 215 220Val Thr Lys Ser Phe Asn Arg Gly Glu Cys225 230(2)SEQ ID NO:37的资料(ⅰ)序列特征(A)长度372个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:37CAGGTGCAAC TAGTGCAGTC CGGCGCCGAA GTGAAGAAAC CCGGTGCTTC CGTGAAAGTC 60AGCTGTAAAA CTAGTAGATA CACCTTCACT GAATACACCA TACACTGGGT TAGACAGGCC 120CCTGGCCAAA GGCTGGAGTG GATAGGAGGT ATTAATCCTA ACAATGGTAT TCCTAACTAC 180AACCAGAAGT TCAAGGGCCG GGCCACCTTG ACCGTAGGCA AGTCTGCCAG CACCGCCTAC 240ATGGAACTGT CCAGCCTGCG CTCCGAGGAC ACTGCAGTCT ACTACTGCGC CAGAAGAAGA 300ATCGCCTATG GTTACGACGA GGGCCATGCT ATGGACTACT GGGGTCAAGG AACCCTTGTC 360ACCGTCTCCT CA 372(2)SEQ ID NO:38的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ IDNO:38Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala1 5 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Arg Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gin Ala Pro Gly Gin Arg Leu Glu Trp lie35 40 45Gly Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe50 55 60Lys Gly Arg Ala Thr Leu Thr Val Gly Lys Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105 110Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:39的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:39Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala1 5 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Arg Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Ile35 40 45Gly Gly Ile Asn Pro Ash Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe50 55 60Lys Gly Arg Ala Thr Leu Thr Val Gly Lys Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Phe Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105 110Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:40的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ IDNO:40Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala1 5 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Arg Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gln Ala Pro Gly GlnArg Leu Glu Trp Ile35 40 45Gly Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe50 55 60Lys Gly Arg Val Thr Ile Thr Val Asp Thr Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105 110Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:41的资料(ⅰ)序列特征(A)长度124个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:41Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys Pro Gly Ala1 5 10 15Ser Val Lys Val Ser Cys Lys Thr Ser Gly Tyr Thr Phe Thr Glu Tyr20 25 30Thr Ile His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu Glu Trp Ile35 40 45Gly Gly Ile ASh Pro Asn Asn Gly Ile Pro Asn Tyr Asn Gln Lys Phe50 55 60Lys Gly Arg Val Thr Ile Thr Val Asp Thr Ser Ala Ser Thr Ala Tyr65 70 75 80Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys85 90 95Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His Ala Met Asp100 105 110Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser115 120(2)SEQ ID NO:42的资料(ⅰ)序列特征(A)长度7731个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQIDNO:42TTGAAGACGA AAGGGCCTCG TGATACGCCT ATTTTTATAG GTTAATGTCA TGATAATAAT 60GGTTTCTTAG ACGTCAGGTG GCACTTTTCG GGGAAATGTG CGCGGAACCC CTATTTGTTT 120ATTTTTCTAA ATACATTCAA ATATGTATCC GCTCATGAGA CAATAACCCT GATAAATGCT 180TCAATAATAT TGAAAAAGGA AGAGTATGAG TATTCAACAT TTCCGTGTCG CCCTTATTCC 240CTTTTTTGCG GCATTTTGCC TTCCTGTTTT TGCTCACCCA GAAACGCTGG TGAAAGTAAA 300AGATGCTGAA GATCAGTTGG GTGCACGAGT GGGTTACATC GAACTGGATC TCAACAGCGG 360TAAGATCCTT GAGAGTTTTC GCCCCGAAGA ACGTTTTCCA ATGATGAGCA CTTTTAAAGT 420TCTGCTATGT GGCGCGGTAT TATCCCGTGT TGACGCCGGG CAAGAGCAAC TCGGTCGCCG 480CATACACTAT TCTCAGAATG ACTTGGTTGA GTACTCACCA GTCACAGAAA AGCATCTTAC 540GGATGGCATG ACAGTAAGAG AATTATGCAG TGCTGCCATA ACCATGAGTG ATAACACTGC 600GGCCAACTTA CTTCTGACAA CGATCGGAGG ACCGAAGGAG CTAACCGCTT TTTTGCACAA 660CATGGGGGAT CATGTAACTC GCCTTGATCG TTGGGAACCG GAGCTGAATG AAGCCATACC 720AAACGACGAG CGTGACACCA CGATGCCTGC AGCAATGGCA ACAACGTTGC GCAAACTATT 780AACTGGCGAA CTACTTACTC TAGCTTCCCG GCAACAATTA ATAGACTGGA TGGAGGCGGA 840TAAAGTTGCA GGACCACTTC TGCGCTCGGC CCTTCCGGCT GGCTGGTTTA TTGCTGATAA 900ATCTGGAGCC GGTGAGCGTG GGTCTCGCGG TATCATTGCA GCACTGGGGC CAGATGGTAA 960GCCCTCCCGT ATCGTAGTTA TCTACACGAC GGGGAGTCAG GCAACTATGG ATGAACGAAA1020TAGACAGATC GCTGAGATAG GTGCCTCACT GATTAAGCAT TGGTAACTGT CAGACCAAGT1080TTACTCATAT ATACTTTAGA TTGATTTAAA ACTTCATTTT TAATTTAAAA GGATCTAGGT1140GAAGATCCTT TTTGATAATC TCATGACCAA AATCCCTTAA CGTGAGTTTT CGTTCCACTG1200AGCGTCAGAC CCCGTAGAAA AGATCAAAGG ATCTTCTTGA GATCCTTTTT TTCTGCGCGT1260AATCTGCTGC TTGCAAACAA AAAAACCACC GCTACCAGCG GTGGTTTGTT TGCCGGATCA1320AGAGCTACCA ACTCTTTTTC CGAAGGTAAC TGGCTTCAGC AGAGCGCAGA TACCAAATAC1380TGTCCTTCTA GTGTAGCCGT AGTTAGGCCA CCACTTCAAG AACTCTGTAG CACCGCCTAC1440ATACCTCGCT CTGCTAATCC TGTTACCAGT GGCTGCTGCC AGTGGCGATA AGTCGTGTCT1500TACCGGGTTG GACTCAAGAC GATAGTTACC GGATAAGGCG CAGCGGTCGG GCTGAACGGG1560GGGTTCGTGC ACACAGCCCA GCTTGGAGCG AACGACCTAC ACCGAACTGA GATACCTACA1620GCGTGAGCTA TGAGAAAGCG CCACGCTTCC CGAAGGGAGA AAGGCGGACA GGTATCCGGT1680AAGCGGCAGG GTCGGAACAG GAGAGCGCAC GAGGGAGCTT CCAGGGGGAA ACGCCTGGTA1740TCTTTATAGT CCTGTCGGGT TTCGCCACCT CTGACTTGAG CGTCGATTTT TGTGATGCTC1800GTCAGGGGGG CGGAGCCTAT GGAAAAACGC CAGCAACGCG GCCTTTTTAC GGTTCCTGGC1860CTTTTGCTGG CCTTTTGCTC ACATGTTCTT TCCTGCGTTA TCCCCTGATT CTGTGGATAA1920CCGTATTACC GCCTTTGAGT GAGCTGATAC CGCTCGCCGC AGCCGAACGA CCGAGCGCAG1980CGAGTCAGTG AGCGAGGAAG CGGAAGAGCG CCTGATGCGG TATTTTCTCC TTACGCATCT2040GTGCGGTATT TCACACCGCA TATGGTGCAC TCTCAGTACA ATCTGCTCTG ATGCCGCATA2100GTTAAGCCAG TATACACTCC GCTATCGCTA CGTGACTGGG TCATGGCTGC GCCCCGACAC2160CCGCCAACAC CCGCTGACGC GCCCTGACGG GCTTGTCTGC TCCCGGCATC CGCTTACAGA2220CAAGCTGTGA CCGTCTCCGG GAGCTGCATG TGTCAGAGGT TTTCACCGTC ATCACCGAAA2280CGCGCGAGGC AGCATGCATC TCAATTAGTC AGCAACCATA GTCCCGCCCC TAACTCCGCC2340CATCCCGCCC CTAACTCCGC CCAGTTCCGC CCATTCTCCG CCCCATGGCT GACTAATTTT2400TTTTATTTAT GCAGAGGCCG AGGCCGCCTC GGCCTCTGAG CTATTCCAGA AGTAGTGAGG2460AGGCTTTTTT GGAGGCCTAG GCTTTTGCAA AAAGCTAGCT TACAGCTCAG GGCTGCGATT2520TCGCGCCAAA CTTGACGGCA ATCCTAGCGT GAAGGCTGGT AGGATTTTAT CCCCGCTGCC2580ATCATGGTTC GACCATTGAA CTGCATCGTC GCCGTGTCCC AAAATATGGG GATTGGCAAG 2640AACGGAGACC TACCCTGGCC TCCGCTCAGG AACGAGTTCA AGTACTTCCA AAGAATGACC 2700ACAACCTCTT CAGTGGAAGG TAAACAGAAT CTGGTGATTA TGGGTAGGAA AACCTGGTTC 2760TCCATTCCTG AGAAGAATCG ACCTTTAAAG GACAGAATTA ATATAGTTCT CAGTAGAGAA 2820CTCAAAGAAC CACCACGAGG AGCTCATTTT CTTGCCAAAA GTTTGGATGA TGCCTTAAGA 2880CTTATTGAAC AACCGGAATT GGCAAGTAAA GTAGACATGG TTTGGATAGT CGGAGGCAGT 2940TCTGTTTACC AGGAAGCCAT GAATCAACCA GGCCACCTCA GACTCTTTGT GACAAGGATC 3000ATGCAGGAAT TTGAAAGTGA CACGTTTTTC CCAGAAATTG ATTTGGGGAA ATATAAACTT 3060CTCCCAGAAT ACCCAGGCGT CCTCTCTGAG GTCCAGGAGG AAAAAGGCAT CAAGTATAAC 3120TTTGAAGTCT ACGAGAAGAA AGACTAACAG GAAGATGCTT TCAAGTTCTC TGCTCCCCTC 3180CTAAAGCTAT GCATTTTTAT AAGACCATGG GACTTTTGCT GGCTTTAGAT CTTTGTGAAG 3240GAACCTTACT TCTGTGGTGT GACATAATTG GACAAACTAC CTACAGAGAT TTAAAGCTCT 3300AAGGTAAATA TAAAATTTTT AAGTGTATAA TGTGTTAAAC TACTGATTCT AATTGTTTGT 3360GTATTTTAGA TTCCAACCTA TGGAACTGAT GAATGGGAGC AGTGGTGGAA TGCCTTTAAT 3420GAGGAAAACC TGTTTTGCTC AGAAGAAATG CCATCTAGTG ATGATGAGGC TACTGCTGAC 3480TCTCAACATT CTACTCCTCC AAAAAAGAAG AGAAAGGTAG AAGACCCCAA GGACTTTCCT 3540TCAGAATTGC TAAGTTTTTT GAGTCATGCT GTGTTTAGTA ATAGAACTCT TGCTTGCTTT 3600GCTATTTACA CCACAAAGGA AAAAGCTGCA CTGCTATACA AGAAAATTAT GGAAAAATAT 3660TCTGTAACCT TTATAAGTAG GCATAACAGT TATAATCATA ACATACTGTT TTTTCTTACT 3720CCACACAGGC ATAGAGTGTC TGCTATTAAT AACTATGCTC AAAAATTGTG TACCTTTAGC 3780TTTTTAATTT GTAAAGGGGT TAATAAGGAA TATTTGATGT ATAGTGCCTT GACTAGAGAT 3840CATAATCAGC CATACCACAT TTGTAGAGGT TTTACTTGCT TTAAAAAACC TCCCACACCT 3900CCCCCTGAAC CTGAAACATA AAATGAATGC AATTGTTGTT GTTAACTTGT TTATTGCAGC 3960TTATAATGGT TACAAATAAA GCAATAGCAT CACAAATTTC ACAAATAAAG CATTTTTTTC 4020ACTGCATTCT AGTTGTGGTT TGTCCAAACT CATCAATGTA TCTTATCATG TCTGGATCTA 4080ATAAAAGATA TTTATTTTCA TTAGATATGT GTGTTGGTTT TTTGTGTGCA GTGCCTCTAT 4140CTGGAGGCCA GGTAGGGCTG GCCTTGGGGG AGGGGGAGGC CAGAATGACT CCAAGAGCTA 4200CAGGAAGGCA GGTCAGAGAC CCCACTGGAC AAACAGTGGC TGGACTCTGC ACCATAACAC 4260ACAATCAACA GGGGAGTGAG CTGGAAATTT GCTAGCGAAT TCCAGCACAC TGGCGGCCGT 4320TACTAGTTAT TAATAGTAAT CAATTACGGG GTCATTAGTT CATAGCCCAT ATATGGAGTT 4380CCGCGTTACA TAACTTACGG TAAATGGCCC GCCTGGCTGA CCGCCCAACG ACCCCCGCCC 4440ATTGACGTCA ATAATGACGT ATGTTCCCAT AGTAACGCCA ATAGGGACTT TCCATTGACG 4500TCAATGGGTG GAGTATTTAC GGTAAACTGC CCACTTGGCA GTACATCAAG TGTATCATAT 4560GCCAAGTACG CCCCCTATTG ACGTCAATGA CGGTAAATGG CCCGCCTGGC ATTATGCCCA 4620GTACATGACC TTATGGGACT TTCCTACTTG GCAGTACATC TACGTATTAG TCATCGCTAT 4680TACCATGGTG ATGCGGTTTT GGCAGTACAT CAATGGGCGT GGATAGCGGT TTGACTCACG 4740GGGATTTCCA AGTCTCCACC CCATTGACGT CAATGGGAGT TTGTTTTGGC ACCAAAATCA 4800ACGGGACTTT CCAAAATGTC GTAACAACTC CGCCCCATTG ACGCAAATGG GCGGTAGGCG 4860TGTACGGTGG GAGGTCTATA TAAGCAGAGC TCGTTTAGTG AACCGTCAGA TCGCCTGGAG 4920ACGCCATCCA CGCTGTTTTG ACCTCCATAG AAGACACCGG GACCGATCCA GCCTCCGCGG 4980CCGGGAACGG TGCATTGGAA CGCGGATTCC CCGTGCCAAG AGTGACGTAA GTACCGCCTA 5040TAGAGTCTAT AGGCCCACCC CCTTGGCTTC TTATGCATGC TATACTGTTT TTGGCTTGGG 5100GTCTATACAC CCCCGCTTCC TCATGTTATA GGTGATGGTA TAGCTTAGCC TATAGGTGTG 5160GGTTATTGAC CATTATTGAC CACTCCCCTA TTGGTGACGA TACTTTCCAT TACTAATCCA 5220TAACATGGCT CTTTGCCACA ACTCTCTTTA TTGGCTATAT GCCAATACAC TGTCCTTCAG 5280AGACTGACAC GGACTCTGTA TTTTTACAGG ATGGGGTCTC ATTTATTATT TACAAATTCA 5340CATATACAAC ACCACCGTCC CCAGTGCCCG CAGTTTTTAT TAAACATAAC GTGGGATCTC 5400CACGCGAATC TCGGGTACGT GTTCCGGACA TGGGCTCTTC TCCGGTAGCG GCGGAGCTTC 5460TACATCCGAG CCCTGCTCCC ATGCCTCCAG CGACTCATGG TCGCTCGGCA GCTCCTTGCT 5520CCTAACAGTG GAGGCCAGAC TTAGGCACAG CACGATGCCC ACCACCACCA GTGTGCCGCA 5580CAAGGCCGTG GCGGTAGGGT ATGTGTCTGA AAATGAGCTC GGGGAGCGGG CTTGCACCGC 5640TGACGCATTT GGAAGACTTA AGGCAGCGGC AGAAGAAGAT GCAGGCAGCT GAGTTGTTGT 5700GTTCTGATAA GAGTCAGAGG TAACTCCCGT TGCGGTGCTG TTAACGGTGG AGGGCAGTGT 5760AGTCTGAGCA GTACTCGTTG CTGCCGCGCG CGCCACCAGA CATAATAGCT GACAGACTAA 5820CAGACTGTTC CTTTCCATGG GTCTTTTCTG CAGTCACCGT CCTTGACACG CGTCTCGGGA 5880AGCTTGCCGC CACCATGGAC TGGACCTGGC GCGTGTTTTG CCTGCTCGCC GTGGCTCCTG 5940GGGCCCACAG CCAGGTGCAA CTGGTGCAGT CCGGCGCCGA AGTGAAGAAA CCCGGTGCTT 6000CCGTGAAAGT CAGCTGTAAA ACTAGTAGAT ACACCTTCAC TGAATACACC ATACACTGGG 6060TTAGACAGGC CCCTGGCCAA AGGCTGGAGT GGATAGGAGG TATTAATCCT AACAATGGTA 6120TTCCTAACTA CAACCAGAAG TTCAAGGGCC GGGCCACCTT GACCGTAGGC AAGTCTGCCA 6180GCACCGCCTA CATGGAACTG TCCAGCCTGC GCTCCGAGGA CACTGCAGTC TACTACTGCG 6240CCAGAAGAAG AATCGCCTAT GGTTACGACG AGGGCCATGC TATGGACTAC TGGGGTCAAG 6300GAACCCTTGT CACCGTCTCC TCAGGTGAGT GGATCCTCTG CGCCTGGGCC CAGCTCTGTC 6360CCACACCGCG GTCACATGGC ACCACCTCTC TTGCAGCCTC CACCAAGGGC CCATCGGTCT 6420TCCCCCTGGC ACCCTCCTCC AAGAGCACCT CTGGGGGCAC AGCGGCCCTG GGCTGCCTGG 6480TCAAGGACTA CTTCCCCGAA CCGGTGACGG TGTCGTGGAA CTCAGGCGCC CTGACCAGCG 6540GCGTGCACAC CTTCCCGGCT GTCCTACAGT CCTCAGGACT CTACTCCCTC AGCAGCGTGG 6600TGACCGTGCC CTCCAGCAGC TTGGGCACCC AGACCTACAT CTGCAACGTG AATCACAAGC 6660CCAGCAACAC CAAGGTGGAC AAGAAAGTTG AGCCCAAATC TTGTGACAAA ACTCACACAT 6720GCCCACCGTG CCCAGCACCT GAACTCCTGG GGGGACCGTC AGTCTTCCTC TTCCCCCCAA 6780AACCCAAGGA CACCCTCATG ATCTCCCGGA CCCCTGAGGT CACATGCGTG GTGGTGGACG 6840TGAGCCACGA AGACCCTGAG GTCAAGTTCA ACTGGTACGT GGACGGCGTG GAGGTGCATA 6900ATGCCAAGAC AAAGCCGCGG GAGGAGCAGT ACAACAGCAC GTACCGGGTG GTCAGCGTCC 6960TCACCGTCCT GCACCAGGAC TGGCTGAATG GCAAGGAGTA CAAGTGCAAG GTCTCCAACA 7020AAGCCCTCCC AGCCCCCATC GAGAAAACCA TCTCCAAAGC CAAAGGGCAG CCCCGAGAAC 7080CACAGGTGTA CACCCTGCCC CCATCCCGGG AGGAGATGAC CAAGAACCAG GTCAGCCTGA 7140CCTGCCTGGT CAAAGGCTTC TATCCCAGCG ACATCGCCGT GGAGTGGGAG AGCAATGGGC 7200AGCCGGAGAA CAACTACAAG ACCACGCCTC CCGTGCTGGA CTCCGACGGC TCCTTCTTCC 7260TCTACAGCAA GCTCACCGTG GACAAGAGCA GGTGGCAGCA GGGGAACGTC TTCTCATGCT 7320CCGTGATGCA TGAGGCTCTG CACAACCACT ACACGCAGAA GAGCCTCTCC CTGTCTCCGG 7380GTAAATGAGT GCGACGGCCG GCAAGCCCCG CTCCCCGGGC TCTCGCGGTC GCACGAGGAT 7440GCTTGGCACG TACCCCCTGT ACATACTTCC CGGGCGCCCA GCATGGAAAT AAAGCACCGG 7500ATCTAATAAA AGATATTTAT TTTCATTAGA TATGTGTGTT GGTTTTTTGT GTGCAGTGCC 7560TCTATCTGGA GGCCAGGTAG GGCTGGCCTT GGGGGAGGGG GAGGCCAGAA TGACTCCAAG 7620AGCTACAGGA AGGCAGGTCA GAGACCCCAC TGGACAAACA GTGGCTGGAC TCTGCACCAT 7680AACACACAAT CAACAGGGGA GTGAGCTGGA AATTTGCTAG CGAATTAATT C 7731(2)SEQ ID NO:43的资料(ⅰ)序列特征(A)长度472个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型蛋白质(ⅹⅰ)序列描述SEQ ID NO:43Met Asp Trp Thr Trp Arg Val Phe Cys Leu Leu Ala Val Ala Pro Gly1 5 10 15Ala His Ser Gln Val Gln Leu Val Gln Ser Gly Ala Glu Val Lys Lys20 25 30Pro Gly Ala Ser Val Lys Val Ser Cys Lys Thr Ser Arg Tyr Thr Phe35 40 45Thr Glu Tyr Thr Ile His Trp Val Arg Gln Ala Pro Gly Gln Arg Leu50 55 60Glu Trp Ile Gly Gly Ile Asn Pro Asn Asn Gly Ile Pro Asn Tyr Asn65 70 75 80Gln Lys Phe Lys Gly Arg Ala Thr Leu Thr Val Gly Lys Ser Ala Ser85 90 95Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser Glu Asp Thr Ala Val100 105 110Tyr Tyr Cys Ala Arg Arg Arg Ile Ala Tyr Gly Tyr Asp Glu Gly His115 120 125Ala Met Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ser130 135 140Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr145 150 155 160Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro165 170 175Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val180 185 190His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser195 200 205Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile210 215 220Cys Asn Val Ash His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val225 230 235 240Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala245 250 255Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro260 265 270Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val275 280 285Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val290 295 300Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln305 310 315 320Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln325 330 335Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala340 345 350Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro355 360 365Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg Glu Glu Met Thr370 375 380Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser385 390 395 400Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr405 410 415Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr420 425 430Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe435 440 445Ser Cys Ser Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys450 455 460Ser Leu Ser Leu Ser Pro Gly Lys465 470(2)SEQ ID NO:44的资料(ⅰ)序列特征(A)长度25个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ IDNO:44ACCGTCTCCT CAGGTGAGTG GATCC25(2)SEQ ID NO:45的资料(ⅰ)序列特征(A)长度14个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:45CCTCTCTTGC AGCC 14(2)SEQ ID NO:46的资料(ⅰ)序列特征(A)长度14个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:46CCTCTCTTGC AGCC 14(2)SEQ ID NO:47的资料(ⅰ)序列特征(A)长度4个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ IDNO:47Thr Val Ser Ser1(2)SEQ ID NO:48的资料(ⅰ)序列特征(A)长度4个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:48Ser Thr Lys Gly1(2)SEQ ID NO:49的资料(ⅰ)序列特征(A)长度27个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:49ACCGTCTCCT CAGCCTCCAC CAAGGGC27(2)SEQ ID NO:50的资料:(ⅰ)序列特征(A)长度8个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ IDNO:50Thr Val Ser Ser Ser Thr Lys Gly1 5(2)SEQ ID NO:51的资料(ⅰ)序列特征(A)长度27个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型cDNA(ⅹⅰ)序列描述SEQ ID NO:51ACCGTCTCCT CAGCCTCCAC CAAGGGC27(2)SEQ ID NO:52的资料(ⅰ)序列特征(A)长度9个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:52Thr Val Ser Ser A1a Ser Thr Lys Gly1 5(2)SEQ ID NO:53的资料(ⅰ)序列特征(A)长度22个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:53GAAATAAAAC GTGAGTGGAT CC 22(2)SEQ ID NO:54的资料(ⅰ)序列特征(A)长度27个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:54CTTCTTTCCT CAGGAACTGT GGCTGCA27(2)SEQ ID NO:55的资料(ⅰ)序列特征(A)长度4个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:55Thr Val Ala Ala1(2)SEQ ID NO:56的资料(ⅰ)序列特征(A)长度24个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:56GAAATAAAAC GAACTGTGGC TGCA 24(2)SEQ ID NO:57的资料(ⅰ)序列特征(A)长度7个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:57Glu Ile Lys Thr Val Ala Ala1 5(2)SEQ ID NO:58的资料(ⅰ)序列特征(A)长度24个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:58GAAATAAAAC GAACTGTGGC TGCA 24(2)SEQ ID NO:59的资料(ⅰ)序列特征(A)长度8个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:59Glu Ile Lys Arg Thr Val Kia Ala1 5(2)SEQ ID NO:60的资料(ⅰ)序列特征(A)长度20个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:60Met Asp Ser Gln Ala Gln Val Leu Met Leu Leu Leu Leu Trp Val Ser1 5 10 15Gly Thr Cys Gly20(2)SEQ ID NO:61的资料(ⅰ)序列特征(A)长度19个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:61Met Gly Trp Ser Trp Val Phe Leu Phe Leu Leu Ser Gly Thr Ala Gly1 5 10 15Val Leu Ser(2)SEQ ID NO:62的资料(ⅰ)序列特征(A)长度9个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型DNA(基因组)(ⅹⅰ)序列描述SEQ ID NO:62GCCGCCACC(2)SEQ ID NO:63的资料(ⅰ)序列特征(A)长度37个碱基对(B)类型核酸(C)链型双链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/deSC=“引物”(ⅹⅰ)序列描述SEQ ID NO:63CAGAAAGCTT GCCGCCACCA TGGATTCACA GGCCCAG37(2)SEQ ID NO:64的资料(ⅰ)序列特征(A)长度6个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ IDNO:64Met Asp Ser Gln Ala Gln1 5(2)SEQ ID NO:65的资料(ⅰ)序列特征(A)长度35个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:65CCGAGGATCC ACTCACGTTT CAGCTCCAGC TTGGT 35(2)SEQ ID NO:66的资料(ⅰ)序列特征(A)长度37个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:66CAGAAAGCTT GCCGCCACCA TGGGATGGAG CTGGGTC 37(2)SEQ ID NO:67的资料(i)序列特征(A)长度6个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型肽(ⅹⅰ)序列描述SEQ ID NO:67Met Gly Trp Ser Trp Val1 5(2)SEQ ID NO:68的资料(i)序列特征(A)长度35个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:68CCGAGGATCC ACTCACCTGA GGAGACGGTG ACTGA 35(2)SEQ ID NO:69的资料(ⅰ)序列特征(A)长度36个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:69GTCATCACAA TGTCTCCGGA GGAACCTGGA ACCCAG 36(2)SEQ ID NO:70的资料(ⅰ)序列特征(A)长度29个碱基对(B)类型核酸
(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ IDNO:70CTCCGGAGAC ATTGTGATGA CCCAATCTC 29(2)SEQ ID NO:71的资料(ⅰ)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:71CTCCGGAGAC ATTGTGATGA CCCAATCTC29(2)SEQ ID NO:72的资料(ⅰ)序列特征(A)长度72个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:72CAGTCAGAGC CTTTTATATT CTAGAAATCA AAAGAACTAC TTGGCCTGGT ATCAGCAGAA 60ACCAGGACAG CC 72(2)SEQ ID NO:73的资料(ⅰ)序列特征
(A)长度44个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:73ACCCCAGATT CCCTAGTGCT AGCCCAAAAG ATGAGGAGTT TGGG 44(2)SEQ ID NO:74的资料(ⅰ)序列特征(A)长度67个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:74TAGCACTAGG GAATCTGGGG TACCTGATAG GTTCAGTGGC AGTGGGTTTG GGACAGACTT 60CACCCTC 67(2)SEQ ID NO:75的资料(ⅰ)序列特征(A)长度53个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:75GTCCCTTGTC CGAACGTGAG CGGATAGCTA AAATATTGCT GACAGTAATA AAC 53(2)SEQ ID NO:76的资料(ⅰ)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc= 引物”(ⅹⅰ)序列描述SEQ ID NO:76GCTCACGTTC GGACAAGGGA CCAAGGTGGA AAT 33(2)SEQ ID NO:77的资料(ⅰ)序列特征(A)长度72个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/dese=“引物”(ⅹⅰ)序列描述SEQ ID NO:77CAGTCAGAGC CTTTTATATT CTAGAAATCA AAAGAACTAC TTGGCCTGGT TCCAGCAGAA60ACCAGGACAG CC72(2)SEQ ID NO:78的资料(ⅰ)序列特征(A)长度57个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/dese=“引物”(ⅹⅰ)序列描述SEQ ID NO:78GTCCCTTGTC CGAACGTGAG CGGATAGCTA AAATATTGCT GACAGTCATA AACTGCC 57(2)SEQ ID NO:79的资料(ⅰ)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:79CCCAAACTCC TCATCTATTG GGCTAGCACT AGGG 34(2)SEQ ID NO:80的资料(ⅰ)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:80CCCTAGTGCT AGCCCAATAG ATGAGGAGTT TGGG 34(2)SEQ ID NO:81的资料(ⅰ)序列特征(A)长度17个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸
(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:81TACGCAAACC GCCTCTC 17(2)SEQ ID NO:82的资料(ⅰ)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:82GAGTGCACCA TATGCGGT 18(2)SEQ ID NO:83的资料(ⅰ)序列特征(A)长度16个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:83AACAGCTATG ACCATG 16(2)SEQ ID NO:84的资料(ⅰ)序列特征(A)长度17个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:84GTTTTCCCAG TCACGAC 17(2)SEQ ID NO:85的资料(ⅰ)序列特征(A)长度47个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQIDNO:85GTGTATTCAG TGAAGGTGTA TCTACTAGTT TTACAGCTGA CTTTCAC 47(2)SEQ ID NO:86的资料(ⅰ)序列特征(A)长度53个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:86TAGTAGATAC ACCTTCACTG AATACACCAT ACACTGGGTT AGACAGGCCC CTG 53(2)SEQ ID NO:87的资料(ⅰ)序列特征(A)长度71个碱基对(B)类型核酸(C)链型单链
(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:87CCCTTGAACT TCTGGTTGTA GTTAGGAATA CCATTGTTAG GATTAATACC TCCTATCCAC 60TCCAGCCTTT G71(2)SEQ ID NO:88的资料(ⅰ)序列特征(A)长度71个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:88TAACTACAAC CAGAAGTTCA AGGGCCGGGC CACCTTGACC GTAGGCAAGT CTGCCAGCAC 60CGCCTACATG G71(2)SEQ ID NO:89的资料(ⅰ)序列特征(A)长度63个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:89GCATGGCCCT CGTCGTAACC ATAGGCGATT CTTCTTCTGG CGCAGTAGTA GACTGCAGTG60TCC 63(2)SEQ ID NO:90的资料(ⅰ)序列特征(A)长度48个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:90CTATGGTTAC GACGAGGGCC ATGCTATGGA CTACTGGGGT CAAGGAAC 48(2)SEQ ID NO:91的资料(ⅰ)序列特征(A)长度71个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:91TAACTACAAC CAGAAGTTCA AGGGCCGGGT CACCATCACC GTAGACACCT CTGCCAGCAC 60CGCCTACATG G71(2)SEQ ID NO:92的资料(ⅰ)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:92GGACACTGCA GTCTACTTCT GCGCCAG27(2)SEQ ID NO:93的资料(ⅰ)序列特征(A)长度17个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:93TACGCAAACC GCCTCTC 17(2)SEQ ID NO:94的资料(ⅰ)序列特征(A)长度18个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:94GAGTGCACCA TATGCGGT18(2)SEQ ID NO:95的资料(ⅰ)序列特征(A)长度76个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:95CCTTTGGCCA GGGGCCTGTC TAACCCAGTG TATGGTGTAT TCAGTGAAGG TGCTATCCAC 60TAGTTTCCAC TAGTTT 76(2)SEQ ID NO:96的资料(ⅰ)序列特征(A)长度28个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:96GTCACCGTCC TTGACACGCG TCTCGGGA 28(2)SEQ ID NO:97的资料(ⅰ)序列特征(A)长度17个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:97TTGGAGGAGG GTGCCAG17(2)SEQ ID NO:98的资料(ⅰ)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(xi)序列描述SEQ ID NO:98GAGACATTGT GACCCAATCT CC 22(2)SEQ ID NO:99的资料(ⅰ)序列特征(A)长度25个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc= “引物”(ⅹⅰ)序列描述SEQ ID NO:99GACAGTCATA AACTGCCACA TCTTC25(2)SEQ ID NO:100的资料(ⅰ)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:10023TTGACACGCG TCTCGGGAAG CTT(2)SEQ ID NO:101的资料(ⅰ)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链
(D)拓扑构型线性(ⅱ)分子类型其它核酸(A)描述/desc=“引物”(ⅹⅰ)序列描述SEQ ID NO:101GGCGCAGAGG ATCCACTCAC CT 2权利要求
1.一种具有单克隆抗体F19(ATCC登记号HB 8269)的互补性决定区的抗体蛋白，所述的抗体蛋白特异地结合成纤维细胞活化蛋白，并以其具有框架修饰为特征，其中这些框架修饰导致与具有F19的可变区和外源的恒定区的嵌合抗体相比在宿主细胞中改善的可制备性。
2.一种抗体蛋白，其以具有根据权利要求1的一轻链可变区和一重链可变区为特征，所述两区分别连接人的恒定区。
3.权利要求2的抗体蛋白，其中所述的人轻链恒定区为人x恒定区。
4.权利要求2的抗体蛋白，其中所述的人重链恒定区为人γ-1恒定区。
5.根据权利要求1至4中任一项的抗体蛋白，其以在原始培养基样品中通过ELISA测定的表达水平和/或纯化抗体的产量超过无框架修饰的嵌合抗体的表达水平和/或纯化产量至少10倍为特征。
6.根据权利要求1至4中任一项的抗体蛋白，其以在原始培养基样品中通过ELISA测定的表达水平和/或纯化抗体的产量超过无框架修饰的嵌合抗体的表达水平和/或纯化产量至少20倍为特征。
7.根据权利要求1至4中任一项的抗体蛋白，其以在原始培养基样品中通过ELISA测定的表达水平和/或纯化抗体的产量超过无框架修饰的嵌合抗体的表达水平和/或纯化产量至少100倍为特征。
8.根据权利要求1至7中任一项的抗体蛋白，其以在真核细胞中显示出改善的可制备性为特征。
9.根据权利要求8的抗体蛋白，其中所述的真核细胞为中国仓鼠卵巢细胞(CHO细胞)。
10.根据权利要求1至9中任一项的抗体蛋白，其中在轻链区Kabat 87位处的氨基酸不是天冬酰胺。
11.权利要求10的抗体蛋白，其中轻链区Kabat 87位的氨基酸选自芳香族或脂肪族氨基酸。
12.权利要求11的抗体蛋白，其中轻链区Kabat 87位的芳香族氨基酸为酪氨酸或苯丙氨酸。
13.根据权利要求1至12中任一项的抗体蛋白，其中轻链区Kabat 36位的氨基酸选自芳香族氨基酸。
14.根据权利要求1至13中任一项的抗体蛋白，其含有在SEQ ID NO:2中所示的轻链可变区。
15.权利要求14的抗体蛋白，其以轻链可变区是由在SEQ ID NO:1中所示的核苷酸序列所编码为特征。
16.根据权利要求1至13中任一项的抗体蛋白，其含有在SEQ ID NO:6中所示的轻链可变区。
17.权利要求16的抗体蛋白，其以轻链可变区是由在SEQ ID NO:5中所示的核苷酸序列所编码为特征。
18.根据权利要求1至17中任一项的抗体蛋白，其含有在SEQ IDNO:8、10、12、14中的任何一个所示的重链可变区。
19.权利要求18的抗体蛋白，其以重链可变区是由在SEQ ID NO:7、9、11、13中的任何一个所示的核苷酸序列所编码为特征。
20.根据权利要求1至14中任一项的抗体蛋白，其含有在SEQ ID NO:2中所示的轻链可变区以及在SEQ ID NO:12中所示的重链可变区。
21.权利要求20的抗体蛋白，其以轻链可变区是由在SEQ ID NO:1中所示的核苷酸序列所编码而重链可变区是由在SEQ ID NO:11中所示的核苷酸序列所编码为特征。
22.根据权利要求20或权利要求21的抗体蛋白，其含有在SEQ IDNO:20中所示的轻链恒定区以及在SEQ ID NO:22中所示的重链恒定区。
23.根据权利要求1至13、18或19中任一项的抗体蛋白，其含有在SEQ ID NO:2中所示的轻链可变区以及在SEQ ID NO:8中所示的重链可变区。
24.权利要求23的抗体蛋白，其以轻链可变区是由在SEQ ID NO:1中所示的核苷酸序列所编码而重链可变区是由在SEQ ID NO:7中所示的核苷酸序列所编码为特征。
25.一段核苷酸序列，其编码根据权利要求1至24中任一项的抗体蛋白。
26.一种重组DNA载体，其含有权利要求25的核苷酸序列。
27.权利要求26的重组DNA载体，所述的载体为表达载体。
28.一种宿主细胞，其携带有根据权利要求26或27的载体。
29.权利要求28的宿主细胞，其中所述的宿主细胞为真核细胞。
30.权利要求29的宿主细胞，其中所述的真核宿主细胞为哺乳动物细胞。
31.权利要求30的宿主细胞，其中所述的宿主细胞为CHO或COS细胞。
32.制备根据权利要求1至24中任一项的抗体蛋白的方法，所述的方法包括下述步骤(a)培养根据权利要求28至31中任一项的宿主细胞，其培养条件使所述抗体蛋白由所述宿主细胞表达，并且(b)分离所述的抗体蛋白。
33.权利要求32的方法，其中所述的宿主细胞为哺乳动物细胞，优选为CHO或COS细胞。
34.权利要求32或33的方法，其中所述的宿主细胞由分别携带轻链和重链表达单位的两种质粒共转染。
35.根据权利要求1至24中任一项的抗体蛋白，其中所述的抗体蛋白结合一种治疗试剂。
36.权利要求35的抗体蛋白，其中所述的治疗试剂选自放射性同位素、毒素、类毒素、炎性介质以及化疗试剂。
37.权利要求36的抗体蛋白，其中所述的放射性同位素为发射β-射线的放射性同位素。
38.权利要求37的抗体蛋白，其中所述的放射性同位素选自186铼、188铼、131碘和90钇。
39.根据权利要求1至24中任一项的抗体蛋白，其以被标记为特征。
40.权利要求39的抗体蛋白，其中所述的标记为可检测的标志物。
41.权利要求40的抗体蛋白，其中可检测的标志物选自酶、染料、放射性同位素、地高辛配基和生物素。
42.根据权利要求1至24中任一项的抗体蛋白，其结合一种可显象试剂。
43.权利要求42的抗体蛋白，其中可显象试剂为放射性同位素。
44.权利要求43的抗体蛋白，其中所述的放射性同位素为发射γ-射线的放射性同位素。
45.权利要求44的抗体蛋白，其中所述的放射性同位素为125I。
46.一种药物组合物，其含有根据权利要求1至24中任一项的抗体蛋白以及一种可药用的载体。
47.一种药物组合物，其含有根据权利要求35至38中任一项的抗体蛋白以及一种可药用的载体。
48.一种药物组合物，其含有根据权利要求42至45中任一项的抗体蛋白以及一种可药用的载体。
49.权利要求46至48的药物组合物，其用于肿瘤的治疗或显象，其中所述的肿瘤与活化的基质成纤维细胞相关，优选其中所述的肿瘤选自结直肠癌、非小细胞肺癌、乳腺癌、头颈部癌、卵巢癌、肺癌、膀胱癌、胰腺癌和脑转移癌。
50.根据权利要求1至24中任一项的抗体蛋白在癌症治疗中的应用。
51.根据权利要求35至38中任一项的抗体蛋白在癌症治疗中的应用。
52.根据权利要求42至45中任一项的抗体蛋白对于显象活化的基质成纤维细胞的应用。
53.根据权利要求39至41中任一项的抗体蛋白对于检测活化的基质成纤维细胞在标本中的存在的应用。
54.一种治疗肿瘤的方法，其中所述肿瘤与能够同根据权利要求1至24或35至38中任一项的抗体蛋白特异性形成复合物的活化的基质成纤维细胞相关，该方法包括使肿瘤与肿瘤治疗有效量的所述抗体蛋白相接触。
55.权利要求54的方法，其中所述肿瘤为具有选自结直肠癌、非小细胞肺癌、乳腺癌、头颈部癌、卵巢癌、肺癌、膀胱癌、胰腺癌和脑转移癌的癌细胞的肿瘤。
56.权利要求54的方法，其中所述接触在体外是有效的。
57.权利要求54的方法，其中所述接触在体内是有效的。
58.一种检测在正愈合的伤口、炎症或肿瘤中活化的基质成纤维细胞存在的方法，其特征是(a)在适于所述抗体和抗原形成复合物的条件下，将一种可能含有活化的基质成纤维细胞的样品同根据权利要求1至24或39至41中任一项的抗体蛋白相接触，(b)检测所述复合物的存在，由此检测在正愈合的伤口、炎症或肿瘤中活化的基质成纤维细胞的存在。
59.权利要求58的方法，其中所述肿瘤为具有选自结直肠癌、非小细胞肺癌、乳腺癌、头颈部癌、卵巢癌、肺癌、膀胱癌、胰腺癌和脑转移癌的癌细胞的肿瘤。
60.权利要求58或59的方法，其中所述抗体蛋白为根据权利要求39至41中任一项的蛋白。
61.一种显象在患者体内正愈合的伤口、发炎的皮肤或肿瘤中活化的基质成纤维细胞存在的方法，其特征是(a)在适于形成抗体-抗原复合物的条件下，将结合可显象试剂的根据权利要求1至24中任一项的抗体蛋白施予患者，(b)显象以该方式所形成的任何复合物。
62.权利要求61的方法，其中所述肿瘤为具有选自结直肠癌、非小细胞肺癌、乳腺癌、头颈部癌、卵巢癌、肺癌、膀胱癌、胰腺癌和脑转移癌的癌细胞的肿瘤。
63.一种检测肿瘤-基质的方法，其特征是(a)在适于形成抗体-抗原复合物的条件下，将一适当样品与根据权利要求1至24中任一项的抗体蛋白相接触，(b)检测因此所形成的任何复合物的存在，(c)将所述复合物的存在与肿瘤-基质的存在相联系。
64.权利要求62的方法，其中所述的抗体被可检测的标志物所标记。
65.一种在患者体内显象肿瘤-基质的方法，其包括(a)在适于形成抗体-抗原复合物的条件下，施予患者根据权利要求42至45中任一项的抗体蛋白，(b)显象因此所形成的任何复合物，并由此在患者体内显象肿瘤-基质的存在。
66.一种抗体蛋白，其含有在SEQ ID NO:2中所示的氨基酸序列。
67.根据权利要求66的抗体蛋白，其还含有在SEQ ID NO:12中所示的氨基酸序列。
68.根据权利要求66或67的抗体蛋白，其还含有在SEQ ID NO:20中所示的氨基酸序列以及在SEQ ID NO:22中所示的氨基酸序列。
69.一种DNA分子，其编码根据权利要求66至68中任一项的抗体蛋白。
70.一种宿主细胞，其携带有根据权利要求69的DNA分子。
71.一种制备权利要求66至68中任一项的抗体蛋白的方法，所述的方法包括下述步骤(a)在所述抗体蛋白由权利要求70的宿主细胞表达的条件下培养所述宿主细胞，并且(b)分离所述的抗体蛋白。
72.根据权利要求66至68中任一项的抗体蛋白，其连接放射性同位素，优选131I、125I、186Re、188Re或90Y。
73.一种药物组合物，其包括根据权利要求66至68、或72中任一项的抗体蛋白以及一种可药用的载体。
全文摘要
本发明提供了重组抗体蛋白,其特异性结合成纤维细胞活化蛋白α(FAPα)并且包含使宿主细胞中可制备性改善的框架修饰。本发明还涉及所述抗体用于诊断和治疗目的的应用以及制备所述抗体的方法。
文档编号A61K47/48GK1303430SQ99806582
公开日2001年7月11日申请日期1999年4月22日优先权日1998年4月30日
发明者约翰·E·帕克, 皮拉尔·加林－切萨, 尤维·班伯格, 沃尔夫冈·J·雷蒂格, 奥利维尔·莱杰, 乔斯·塞尔丹哈申请人:贝林格尔·英格海姆国际有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：约翰.E.帕克;皮拉尔.加林-切萨;尤维.班伯格;沃尔夫冈.J.雷蒂格;奥利维尔.莱杰;乔斯.塞尔丹哈
技术所有人：贝林格尔.英格海姆国际有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。