与人g蛋白偶联的孤儿受体的制作方法

文档序号:3564552阅读:631来源:国知局

专利名称::与人g蛋白偶联的孤儿受体的制作方法
技术领域
:本专利申请文件中所公开的发明涉及跨膜受体,进一步地讲,涉及与人G蛋白偶联的内源孤儿受体(GPCR)。
背景技术
:尽管在人体内有很多种类的受体,但到目前为止最丰富和最与治疗有关的是G蛋白偶联受体(GPCR)。据估计,在人类基因组内有大约100,000个基因,它们中的大约2%即2,000个基因被估计用来编码GPCR。包括GPCR在内,其内源配体已被认识的受体被称为"已知"受体,内源配体尚不知晓的受体被称为"孤儿"受体。GPCR代表着药物产品开发的一个重要领域60%的处方药物开发自100个已知GPCR中的大约20个。这种区别并不仅是语义上的,尤其是对GPCR来说。因此,孤儿GPCR对于制药工业来说就象金子对于19世纪晚期的加利福尼亚州一样,是一个驱动成长、扩张、提高和发展的机会。GPCR都具有一个相同的基元(motif)。所有这些受体具有七个由22到24个疏水氨基酸组成的序列,它们组成七个a螺旋,每个ct螺旋都跨过膜(每个跨度都以数字表示,例如,跨膜-l(TM-l)、跨膜-2(TM-2)等)。跨膜螺旋通过氨基酸链连接,在细胞膜的外部即"细胞外"一边的氨基酸链分别在跨膜-2和跨膜-3、跨膜-4和跨膜-5、跨膜-6和跨膜-7之间(这些分别被称为"细胞外"区1、2禾P3(EC-1、EC-2和EC-3))。在细胞膜内部即"细胞内"一边,跨膜螺旋也通过氨基酸链进行连接,这些氨基酸链分别在跨膜-1和跨膜-2、跨膜-3和跨膜-4、跨膜-5和跨膜-6之间(这些分别被称为"细胞内"区l、2和3(IC-1、IC-2和IC-3))。受体的"羧基"("C")端是在细胞内的区域,受体的"氨基"("N")端在细胞外的区域。一般来说,当内源配体与受体结合时(经常被称为受体的"活化"),细胞内区域的构象发生变化,以容许细胞内区域和细胞内"G-蛋白"进行偶联。据报道,GPCR对于G蛋白而言是"混杂的",也就是说,可与不只一个G蛋白相互作用。参见,Kenakin,T.,43,生活科学(LifeSciences)1095(1988)。尽管存在其他G蛋白,但当前已被识别的G蛋白是Gq、Gs、Gi和Go。内源配体活化的GPCR与G-蛋白的偶联引发一个信号级联过程(被称为"信号传导")。在通常情形下,信号传导最终导致细胞活化或细胞抑制。据认为,受体的IC-3环与羧基端都和G蛋白相互作用。在生理条件下,GPCR存在于细胞膜上,并在"非活化"状态和"活化"状态这两种不同构象之间保持平衡。在非活性状态下的受体不能与细胞内信号传导途径相偶联以产生生物学反应。受体构象向活性状态的转变就使它与传导途径相偶联(通过G-蛋白)并产生生物学反应。可通过内源配体或化合物如药物将受体稳定在其活性状态。发明概述这里公开的是人与G蛋白偶联的内源孤儿受体。附图的简要描述图1A和1B提供的是本文提供的某些斑点印迹的参照"格栅"(分别参见图2A和2B)。图2A和2B再现的是从hCHN3和hCHN8得到的某些斑点印迹分析的结果(分别参见图1A和1B)。图3再现的是hRUP3的RT-PCR分析结果。图4再现的是hRUP4的RT-PCR分析结果。图5再现的是hRUP6的RT-PCR分析结果。详细描述本科学文献涉及受体并采用一些术语来描述对受体具有不同作用的配体。为了清楚和前后一致,在本发明文献中将由始至终使用下列定义。在这些定义与这些词语的其他定义冲突时,选择下列定义在此应用的氨基酸縮写列于下表:丙氨酸ALAA精氨酸ARGR天冬酰胺ASNN天冬氨酸ASPD半胱氨酸CYSC谷氨酸GLUE谷氨酰胺GLNQ甘氨酸GLYG组氨酸HISH异亮氨酸ILEI亮氨酸LEU赖氨酸LYSK蛋氨酸METM苯丙氨酸PHEF脯氨酸PROP丝氨酸SERS苏氨酸THRT色氨酸TRPW酪氨酸TYRY缬氨酸VALV6组合物是指至少包含一种成分的物质。内源意味着由物种的基因组天然产生的物质。关于内源的受体,意味着由哺乳动物(例如但不限于人)或病毒天然产生的物质,这些只作为例证但却不是限制。与之相对比,术语"非内源"在本文中意味着不是由哺乳动物(例如但不限于人)或病毒天然产生的。宿主细胞意味着能在其中插入质粒和/或载体的细胞。在原核宿主细胞情形下,当宿主细胞复制时质粒典型地以自主分子方式复制(在一般情况下,质粒在复制后被分离出来以被引入真核宿主细胞中);在真核宿主细胞情形下,质粒被整合进宿主细胞的细胞DNA中,因而,当真核细胞复制时,质粒复制。为在此公开的本发明的目的,宿主细胞优选是真核细胞,更优选是哺乳动物细胞,最优选地是从293、293T和COS-7细胞中选择出来的细胞。配体意味着对内源的天然产生的受体特异的内源的天然产生的分子。非孤儿受体是指天然存在的内源分子,对天然存在的内源配体表现出特异性,配体与受体的结合使胞内信号途经得以活化。孤儿受体意味着这样的内源受体,其特异的内源配体尚未被识别或尚未知。质粒意味着载体和cDNA的结合体。一般,为cDNA复制和/或表达蛋白质的目的将质粒引进宿主细胞。针对cDNA的载体意味着能够将至少一个cDNA掺入其中且导入到宿主细胞中的环形DNA。下面部分的顺序安排是为了表达效果,而不能被解释为对下面的公开或权利要求的限制。人GPCR的确认人类基因组计划的实施导致位于人类基因组内有关核酸序列的大量信息的识别,经过这种努力,事实上,我们无需了解或认识任何特定的基因组序列是否包含翻译人类蛋白的可读框信息,即可获得遗传序列信息,几种识别人类基因组中核酸序列的方法都是本领域普通技术人员所熟悉的,比如(但不限定),此处公开的大量人类GPCR,即是通过回顾GenBankTM数据库而发现的,并通过应用先前已测序的GPCR核酸序列,检索BLAST的EST数据库,发现了其他的GPCR。下面的表A,列出了几个与GPCR各自的同源受体一道被我们发现的内源GPCR。公开的人类孤儿GPCR入藏登记表A可读框(碱基对)与指明的GPCR同源性比率参考同源GPCR(编号)hARE-3AL0333791,260bphARE-4AO0060871,119bphARE-5AC0062551,104bp52.3%LPA-RU9264236%P2Y5AF00054632%OryziasMpesD43633hGP肪hARE-lhARE-2hPPRlhG2AAA775870AI090920AA3595MH67224AA7547Q21,128bp999bp1,122bp1,053bp1,113bp43%KIAA00153%GPR2739%EBI131%GPR4D13626L31581L36148hRUP3AL0354231,005bp30%果蝇2133653hRUP4AD076581,296bp32%pNPGPRNP—00487628%斑马鱼YaAAC41276和29%斑马鱼Yb,AAB94616hRUP5AC005柳1,413bp25%DEZQ9978823%FMLPRP21462hRUP6AC0058711,245bp48%GPR66NP—006047hRUP7AC0079221,173bp43%H3RAF140538hCHN3ENI365811,113bp53%GPR27hCHN4AA8045311,077bp32%凝血酶4503637hCHN6ES121346701,503bp36%edg-lNPJKU391hCHN8EST7644551,029bp47%D13626KIAA0001hCHN9EST15415361,077bp41%LTB4RNM—000752hCHN10EST1365839l,055bp35%P2YNM—002563受体同源性对于进一步了解受体在人体中的作用是有用的。另外,这种同源性可以用来洞察可能是本文公开的孤儿GPCR的天然激活剂的可能的内源配体。B.受体筛选因为受体的传统研究一直是基于这样的前置假定(基于历史),即内源配体必须首先被识别,然后才能发现可以作用于受体的拮抗剂和其他分子,所以,在过去的几年中,用于进行内源配体识别(该识别主要是为了提供进行受体结合测定(该测定需要受体的内源配体)的各种方法)的技术越来越容易找到。甚至在拮抗剂被首先发现的情况下,搜索的目光也立即延伸到査找内源配体上去。即使在发现组成型活化受体之后,这种思维模式也一直在受体研究中持续。在此之前没有被认识到的是,是受体的活性状态对发现受体的激活剂、部分激活剂和反激活剂是最有用的。对于那些因为受体的过度活化和不够活化而导致的疾病来说,希望得到的治疗药物是能分别用来减少受体的活性状态或增强受体活性的化合物,而并不需要是对抗内源配体的拮抗剂。这是因为,一个降低或增强活化态受体活性的化合物并不需要结合在和内源配体一样的位点上。因而,正如本发明的一个方法所说的那样,对治疗性化合物的任何搜索可通过筛选针对配体非依赖性活性态的化合物而开始。如在本领域已知的情形,GPCR即使是在没有该受体的内源配体与之结合的情况下,在其内源状态GPCR也可能是"活化的"。这种天然活化的受体可被直接识别(即,不需要受体的内源配体存在)、特别是反激活剂的直接识别所筛选。另外,该受体也可通过例如受体的突变以建立该受体的非内源形式来进行活化,所述非内源形式在没有受体的内源配体存在下也处于活性状态。对应于此处公开的人孤儿GPCR的内源或非内源组成型活化形式的候选化合物进行筛选,可直接识别在细胞表面受体上起作用的候选化合物,而不需要使用受体的内源配体。通过确定此处公开的人GPCR的内源形式在体内表达或过表达的区域,有可能确定与受体表达或过表达关联的相关疾病/紊乱,这种方法在本专利申请文件中得以公开。制造可以证明此处公开的人孤儿GPCR组成型活化的突变的技术,是基于与脯氨酸残基的距离,据估计此残基位于GPCR的TM6内部,通常在TM6/IC3交界处附近(该脯氨酸残基看起来非常保守)。通过使距该残基16个氨基酸残基处的氨基酸残基(估计位于受体的IC3区)发生突变,最好是突变为赖氨酸,可以获得这种活化。其他氨基酸在此位置上的突变可用来达到此目的。C.疾病/紊乱识别和/或选择优选人孤儿GPCR的DNA序列被用来制作探针,用于进行(a)针对组织mRNA的斑点印迹和(b)组织样品中所述受体表达的RT-PCR识别。在组织或疾病组织中受体的存在,或者与正常组织相比在疾病组织中受体的浓度提高,可被优选地用来识别治疗方法(包括但不限于)与那种疾病的关联。用这种方法也可很好地把受体定位于器官的区域。基于受体被定位于其中的特定组织的已知功能,受体假想的功能性角色可被推导出来。D.候选化合物的筛选1.一般GPCR的筛选测定技术当一种G蛋白受体变为组成型活化(即,在没有内源配体与之结合的情况下活化)时,它与G蛋白(例如,Gq、Gs、Gi、Go)偶联并刺激GTP与G蛋白结合。接着,借助受体在正常情况下失活,G蛋白作为GTP酶慢慢地把GTP水解为GDP,然而,组成型活化的受体继续把GDP转化为GTP。GTP非可水解的类似物["S]GTPYS,可被用来监测与表达组成型活化受体的膜的结合。据报道,[35S]GTPYS可被用来监测在配体存在或不存在的情形下G蛋白与膜的偶联。在本领域中著名和可行的其他例证中有此种监测的一个例证,它由Traynor和Nahorski在1995年所报道。本测定系统的一个优选的应用是为了初步筛选候选化合物,因为本系统对所有G蛋白-偶联受体一般可行,而不考虑与受体的细胞内结构域相互作用的那一种特别的G蛋白。2.特定的GPCR筛选测定技术一旦应用"一般"G蛋白偶联的受体测定方法(即筛选是激活剂、部分激活剂或反激活剂的化合物的方法)识别出候选化合物,优选进一步筛选以确认作用在受体位点的化合物。例如,应用"一般"测定方法识别的化合物可以不与受体结合,但也可以仅仅从细胞内结构域与G蛋白"解偶联"。a.Gs禾口GiGs刺激腺苷酸环化酶。另一方面,Gi(和Go)抑制该酶。腺苷酸环化酶催化ATP向cAMP的转化;因此,与Gs蛋白偶联的组成型活化的GPCR与升高的细胞内cAMP水平相关联。在另一方面,与Gi(或Go)蛋白偶联的组成型活化的GPCR与降低的细胞内cAMP水平相关联。一般情况参见"突触传导的非直接机制(IndirectMechanismsofSynapticTransmission)",第8章,从神经到大脑(FromNeuronToBrain)(第三版),Nichols,J.G.等编,SinauerAssociates,Inc.(1992)。因此,检测cAMP的方法可被用来确定一个竞争性的化合物是否是受体的反激活剂(即这样的一个化合物将能降低cAMP的水平)等。本领域已知的测定cAMP的不同方法可以被利用;最优选的方法依赖于在基于ELISA的方法中应用抗-cAMP的抗体。可被应用的另一类测定方法是一种全细胞第二信使报告基因系统测定法。基因上的启动子驱动由一个特别的基因所编码的蛋白质的表达。环AMP通过以下步骤促进基因的表达,即它响应促进cAMP的DNA结合蛋白或转录因子(CREB)的结合,转录因子接着在被称为cAMP效应元件的特别位点与启动子结合并驱动基因表达。报告基因系统可被构建为具有一个启动子,该启动子在报告基因的前面含有多个cAMP效应元件,例如(3-半乳糖苷酶或荧光素酶。因而,一个被组成型活化的连接Gs的受体引起cAMP的积累,cAMP接着激活报告蛋白质的基因和表达。(3-半乳糖苷酶或荧光素酶等报告蛋白质可用标准生化方法检测到(Chen等,1995)。b.Go和GqGo和Gq与磷脂酶C的活化相联系,磷脂酶随后水解磷酸酯PIP2,并释放两种细胞内信使二酰甘油(DAG)和肌醇-1,4,5-三磷酸(IP3)。积累增加的IP3与Gq-和Go-关联的受体相关联。一般情况参见"突触传导的非直接机帝!j(IndirectMechanismsofSynapticTransmission)",第8章,从神经到大脑(FromNeuronToBrain)(第三版),Nichols,J.G.等编,SinauerAssociates,Inc.(1992)。测定IP3积累的方法可被用来确定一个候选化合物是否是例如针对Gq-或Go-关联受体等的反激活剂(即如此的化合物能降低IP3的水平)。Gq关联受体也可用API报告基因测定方法来检测,因为Gq依赖的磷脂酶C引起含有API元件的基因活化;因而,活化的Gq关联受体将导致如此基因的表达增高,而其反激活剂将导致如此表达的降低,激活剂将导致如此表达的升高。进行如此测定的商业可得的方法是可得的。3.GPCR融合蛋白内源组成型活化的孤儿GPCR或非内源组成型活化的孤儿GPCR,用于筛选候选化合物,直接识别反激活剂、激活剂和部分激活剂,提出了一个独特的筛选难题,确切地说,在没有内源配体结合的情况下,受体仍有活性。因此,使用能加强由该活化的受体获得的信号的方法是经常有用的。优选的办法就是使用GPCR融合蛋白。一般来讲,应用上述分析技术(还有其它的技术)一旦确定GPCR是或已被组成型活化的,就可能确定与内源GPCR偶联的优势G蛋白,G蛋白与GPCR的偶联提供了可被估计的信号途径。因为最好是使用哺乳动物表达系统进行筛选,就希望在这个系统中有内源G蛋白存在,确切来说,该组成型活化的孤儿GPCR在这个系统中持续产生信号。从这点上,优选使信号得到加强,从而在(例如)受体的反激活剂存在时,很可能更方便地区分与反激活剂接触的不同受体,特别是在筛选的整个过程中。GPCR融合蛋白的作用是增加G蛋白与非内源GPCR偶联的效应,GPCR融合蛋白优选用于筛选非内源组成型活化的GPCR,因为这种方法增强对这样的筛选技术非常有用的信号,虽然该GPCR融合蛋白也可(而且优选)与内源组成型活化的GPCR—起使用。重要的是有助于产生很大的"信噪"比,这种大信噪比对筛选此处公开的候选化合物是特别优选的。用于GPCR融合蛋白表达的构建体的构建技术是本领域普通技术人员所熟悉,商业可获得的表达载体和系统为实验者提供了各种可以满足特殊需要的方法,这种GPCR融合蛋白构建体重要的衡量标准,就是内源GPCR序列与G蛋白序列都符合读框(最好是,内源GPCR的序列位于G蛋白序列上游),以及必须去除或替代GPCR的"终止"密码子,从而随着GPCR的表达,G蛋白也能表达。GPCR可以直接连到G蛋白上,或在两者之间存在间隔残基(最好不超过12个,虽然本领域的普通技术人员可以很方便得知这一数字)。我们喜欢使用间隔子(其于方便),表达中不被有效利用的限制位点组成了间隔子。在制造GPCR融合蛋白构建体之前,优选首先确认与GPCR偶联的G蛋白,因为只有很少的G蛋白已被识别,所以优选包含G蛋白序列(如通用G蛋白构建体)的构建体可在其中插入内源GPCR序列,这样可有效地大规模筛选大量具有不同序列的内源GPCR。E.其他应用尽管本文公开的人孤儿GPCR的一个优选的应用是为了直接识别作为反激活剂、激活剂或部分激活剂(优选地作为药物使用)的候选化合物,人GPCR的这些形式也可被用于研究之用。例如,带有GPCR的体外或体内系统可被用来阐释和理解这些受体在正常和患病的人体状况中的作用,也可理解当它应用于理解信号级联反应时组成型活化的角色。这些人孤儿GPCR的价值在于它们作为研究工具的用途被强化了,即使在其内源配体被识别之前,由于其能够确定这些受体在人体内的位置,该GPCR可被用来理解这些受体在人体中的作用。此处所公开的受体的其他应用对于本领域的技术人员将是明显的,特别是当他们阅读了本申请文件之后。实施例下面提供的实施例,目的是要阐明而不是限制本发明。特异的核酸序列和氨基酸序列在此公开时,本领域的普通技术人员能够对这些序列进行较小的修饰,并且得到与下面报告的相同或基本相似的结果。除非下文另外指明,对于所公开的人内源孤儿GPCR的所有核酸序列均进行了测序并得到了证实。对于受体的等同物,本领域的普通技术人员可以容易地想到的是可对所公开序列进行保守取代以获得功能上等同的受体。实施例1内源人GPCR1.人GPCR的识别在浏览GenBank数据库信息的基础上,识别了一些己公开的内源人GPCR。在检索数据库的同时,下列cDNA克隆也得以识别,列表如下。<table>tableseeoriginaldocumentpage15</column></row><table>用下列EST克隆作为询问序列,对EST数据库(dbest)进行BLASTTM检索,识别出其他已公开的人内源GPCR。然后将下列已确认的EST克隆用作探针筛选人的基因组文库。己公开的人询问EST克隆/可读框核酸序列氨基酸序列孤儿GPCR(序列)入藏登记号(碱基对)SEQJDM)SEQ.ID.NOhGPCR27鼠AA7758701,125bp1516GPCR27hARE-lTDAG1689643999bp1718AI090920hARE-2GPCR27685301,122bp1920AA359504hPPRl牛2386671,053bp2122PPR1H67224hG2A鼠参见实施例l,113bp232411794262(a)hCHN3N.A.EST365811,113bp2526(全长)hCHN4TDAG11849341,077bp2728AA804531hC丽6N.A.EST21346701,503bp2930(全长)hC丽8KIAA0001EST7644551,029bp3132hCHN91365839EST15415361,077bp3334hCHN10鼠EST人13658391,005bp35361365839hRUP4N.A.AI3076581,296bp3738N.A.="不适用"2全长克隆a.hG2A(Seq.Id.No.23&24)利用鼠EST克隆1179426获取包含几乎所有三氨基酸hG2A编码序列的人基因组克隆,该编码序列通过5'RACETM获得,PCR模板为Clontech,sHumanSpleenMarathon-ReadycDNA。已被公开的人G2A用PCR扩增,第一和第二轮PCR使用G2AcDNA特异引物,其为SEQ.ID.NO.:39和SEQ.ID.NO.:40如下5'-CTGTGTACAGCAGTTCGCAGAGTG-3'(SEQ.ID.NO.:39,第一轮PCR)5'-GAGTGCCAGGCAGAGCAGGTAGAC-3'(SEaiD.NO.:40,第二轮PCR)用AdvantageGCPolymerase试剂盒进行PCR(Clontech:按商家说明进行操作),94°C30秒;94°C5秒,72°C4分钟,5个循环;94°C5秒,70°C4分钟,30个循环。将大约1.3kbPCR片段从琼脂糖凝胶中纯化出来,经HindIII和Xbal酶切,克隆到表达载体pRC/CMV2(Invitrogen)中。被克隆的插入片段用T7Sequenase试剂盒(USBAmersham;按商家说明进行操作)进行测序,并将所得序列与已存在的序列进行比较。人G2A的表达通过用P"标记片段与RNA点印迹杂交进行测定(clontech;按商家说明进行操作)。b.hCHN9(Seq.Id.No.33&34)EST克隆1541536的测序表明,hCHN9为cDNA克隆的一部分,只有起始密码子,即,没有终止密码子。用hCHN9检索数据库进行比较发现,hCHN9的3'端序列与白细胞三烯B4受体cDNA5'端非翻译区100%同源,该cDNA带有一个与hCHN9编码序列符合读框的终止密码子。为了确定LTB4RcDNA5'端非翻译区是否是hCHN9的3'端序列,进行了PCR扩增,所用引物是以在hCHN9中发现的起始密码子的5'端侧翼序列和在LTB4R5'端非翻译区中发现的终止密码子的3'端侧翼序列为基础。所用的5'端引物序列如下5'-CCCGAATTCCTGCTTGCTCCCAGCTTGGCCC-3'(SEQ.ID.NO.:41,有义)5'-TGTGGATCCTGCTGTCAAAGGTCCCATTCCGG-3'(SEQ.ID.NO.:42,反义)以胸腺cDNA为模板,并用商家提供的缓冲液系统及rTth聚合酶(PerkinElmer)进行PCR,每种引物0.25pM,4种核苷酸每种0.2mM。循环条件为94°Cl分钟,65°Cl分钟,72°C1分10秒,30个循环,由PCR获得了与预计大小一致的l.lkb片段,将该PCR片段亚克隆到pCMV中(参见下文)并测序(参见SEQ.ID.NO.:33)。c.hRUP4(Seq.Id.No.37&38)以人脑cDNA(clontech)为模板,经RT-PCR克隆了全长hRUP4。5'-TCACAATGCTAGGTGTGGTC-3'(SEQ.ID.NO.:43,有义)5'-TGCATAGACAATGGGATTACAG-3'(SEQ.ID.NO.:44,反义)使用TaqplasPrecision聚合酶(Stmtagene:按商家说明)进行PCR,经以下循环94°C2分钟;94°C30秒;55°C30秒;72°C45秒;72°C10分钟。循环2到循环4重复30次。PCR产物在1%琼脂糖凝胶上分离,提取500bpPCR片段,并克隆到pCRII-TOPO载体(Invitrogen)中,用T7Sequerase试剂盒(Amsham)和SP6/T7引物(Stratagene)进行测序。序列分析表明,该PCR片段确实是AI307658的另一种剪接形式,带有一个与其他GPCR相似的连续的可读框,该PCR片段的全序列如下丁GCCTCTTATGGTGATGCTTATTCTGTACGTAAAATTGGTTATGAACTTTGGATAAAGAAAAGAAAGAAACGAGCTGTCATTATGATGGTGACAGTGGTGGCTCTCTTTGCTGTGTGCTGGGCACCAATCAAGATGATTTTTGCTATCGTGCAAATTATTGGATTTTCCAACTCCATCTGTAATCCCATTGTCTATGCA-3'(SEQ.ID.NO.:45)以上面的序列为基础,制备两个有义寡核苷酸引物5'-CTGCTTAGAAGAGTGGACCAG-3'(SEQ.ID.NO.:46,寡聚核苷酸引物1)5'-CTGTGCACCAGAAGATCTACAC-3'(SEQ.ID.NO.:47,寡聚核苷酸引物2)两个反义寡核苷酸引物5'-CAAGGATGAAGGTGGTGTAGA-3'(SEQ.ID.NO.:48,寡聚核苷酸引物3)5'-GTGTAGATCTTCTGGTGCACAGG-3'(SEQ.ID.NO.:49,寡聚核苷酸引物4)用于3'端和5'端RACEPCR,以人脑Marathon-ReadycDNA(clontech,Cat#7400-1)为模板,按商家说明进行。经RACEPCR产生的DNA片段克隆到pCRII-TOPC)TM载体(Invitrogen)中,用SP6/T7弓|物(Stratagene)和一些中间引物测序,3'端RACE产物带有一个poly(A)尾巴和一个结束于TAA终止密码子的完整的可读框,5'端RACE产物包含不完整的5'端,即,起始密码子ATG没有出现。基于新的5'端序列,寡聚核苷酸引物3和下列引物5'-GCAATGCAGGTCATAGTGAGC-3'(SEQ.ID.NO.:50,寡聚核苷酸引物5)用于第二轮的5'端RACEPCR,对PCR产物象上面一样进行分析。第三轮的5'端RACEPCR用反义引物进行5'-TGGAGCATGGTGACGGGAATGCAGAAG-3'(SEQ.ID.NO.:51,寡聚核苷酸引物6)5'-GTGATGAGCAGGTCACTGAGCGCCAAG-3'(SEQ.ID.NO.:52,寡聚核苷酸引物7)5'端RACEPCR产物序列显示存在起始密码子ATG,再下一轮的5'RACEPCR没有产生更多的5'序列,通过利用有义引物5'-GCAATGCAGGCGCTTAACATTAC-3'(SEQ.ID.NO.:53,寡聚核苷酸引物8)和寡聚核苷酸引物4为引物进行的RT-PCR,以及由人脑和心cDNA模板(Clontech、Cat#7404-1)产生的650bpPCR产物的序列分析,证实了上述完整的5'端序列。通过利用寡聚核苷酸引物2和下列反义引物的RT-PCR:5'-TTGGGTTACAATCTGAAGGGCA3'(SEQ.ID.NO.:54,寡聚核苷酸引物9)以及由人脑和心cDNA模板(Clontech,Cat#7404-1)产生的670bpPCR产物的序列分析,证实了上述完整的3'端序列。d.hRUP5(Seq.Id.No.9&10)以人的外周白细胞cDNA(Clontech)为模板,通过RT-PCR克隆了全长的hRUP5,所用引物为在ATG起始密码子上游的有义引物(SEQ.ID.NO.:55),以及包含TCA为终止密码子的反义引物(SEQ.ID.NO.:56),其序列如下5'-ACTCCGTGTCCAGCAGGACTCTG-3'(SEQ.ID.NO.:55)5'陽TGCGTGTTCCTGGACCCTCACGTG-3'(SEQ.ID.NO.:56)AdvantagecDNA聚合酶(Clontech)用于50|al反应,经下列循环进行扩增,其中第二步到第四步重复30次94°C30秒;94°C15秒;69°C40秒;72°C3分钟;72°C6分钟。分离得到1.4kbPCR片段,并克隆到pCRII-TOPO载体(Invitrogen),用T7DNAS^uenase试剂盒(Amsham)进行全序列测定,参见SEQ.ID.NO.:9。e.hRUP6(Seq,Id.No.11&12)用下列引物及人的胸腺Marathon-ReadycDNA(Clontech)为模板,通过RT-PCR克隆了全长hRUP6。5'-CAGGCCTTGGATTTTAATGTCAGGGATGG-3'(SEQ.ID.NO.:57)5'-GGAGAGTCAGCTCTGAAAGAATTCAGG-3'(SEQ.ID.NO.:58)AdvantagecDNA聚合酶(Clontech,按商家说明)用于50)^1反应,经下列循环进行扩增94°C30秒;94°C5秒;66°C40秒;72°C2.5秒和72°C7分钟,循环2到循环4重复30次。分离得到1.3kbPCR片段,并克隆到pCRII-TOPO载体(Invitrogen),用ABIBigDyeTerminator试剂盒(P.E.Biosystem)进行全序列测定(参见,SEQ.ID.NO.:l1)。f.hRUP7(Seq.Id.No.13&14)用下列引物及人的外周白细胞cDNA(Clontech)为模板,通过RT-PCR克隆了全长PUP7,5'-TGATGTGATGCCAGATACTAATAGCAC-3'(SEQ.ID.NO.:59,有义)5'墨CCTGATTCATTTAGGTGAGATTGAGAC-3'(SEQ.ID.NO.:60,20反义)AdvantagecDNA聚合酶(Clontech)用于反应,经下列循环进行扩增,其中第二步到第四步重复30次94°C2分钟;94"C15秒;60°C20秒;72°C2分钟;72°CIO分钟。分离得到1.25kbPCR片段,并克隆到pCRn-TOPOTM载体(Invitrogen),用ABIBigDyeTerminator试剂盒(P.E.Biosystem)进行全序列测定。(参见,SEQ.ID.NO.:13)g.hARE-5(Seq.Id.No.5&6)采用hARE-5特异的引物5'-CAGCGCAGGGTGAAGCCTGAGAGC-3'SEQ.ID.NO.:69(有义,位于起始密码子ATG的5'端)和5'-GGCACCTGCTGTGACCTGTGCAGG-3'SEQ.ID.NO.:70(反义,位于终止密码子TGA的3'端)并用人基因组DNA为模板,通过PCR来克隆全长hARE-5。按照下列循环采用T叫PlusPrecisionTMDNA聚合酶(Stratagene)来扩增,其中第2步至第4步重复35次96°C2分钟;96°C20秒;58°C30秒;72°C2分钟;72°C10分钟。分离到预计大小的1.1KbPCR片段并克隆到pCRII-TOPO载体(Invitrogen),用T7DNASquenase试剂盒(Amsham)进行全序列测定(SEQ.ID.NO.:5)。h.hARE-4(Seq.Id.No.3&4)釆用hARE-4特异的引物5'-CTGGTGTGCTCCATGGCATCCC-3'SEQ.ID.NO.:67(有义,位于起始密码子ATG的5'端)和5'陽GTAAGCCTCCCAGAACGAGAGG-3'SEQ.ID.NO.:68(反义,位于终止密码子TGA的3'端)并用人基因组DNA为模板,通过PCR来克隆全长hARE-4。采用TaqDNA聚合酶(Stratagene)禾t!5。/oDMSO,按照下列循环来扩增,其中第2步至第3步重复35次94'C3分钟;94。C30秒;59°C2分钟;72°C10分钟。分离到预计大小的1.12KbPCR片段并克隆到pCRII-TOPOTM载体(Invitrogen),用T7DNASquenase试剂盒(Amsham)进行全序列测定(SEQ.ID.NO.:3)。i.hARE-3(Seq.Id.No.1&2)采用hARE-3特异的引物5'-gatcaagcttCCATCCTACTGAAACCATGGTC-3'SEQ.ID.NO.:65(有义,小写字母核苷酸代表HindIII突出端,ATG为起始密码子)和5'-gatcagatctCAGTTCCAATATTCACACCACCGTC陽3'SEQ.ID.NO.:66(反义,小写字母核苷酸代表XbaI突出端,TCA为终止密码子)并用人基因组DNA为模板,通过PCR来克隆全长hARE-3。采用TaqPhisPrecisionDNA聚合酶(Stratagene),按照下列循环来扩增,其中第2步至第4步重复35次94°C3分钟;94°C1分钟;55°C1分钟;72°C2分钟;72°C10分钟。分离到预计大小的1.3KbPCR片段并用HindIII和XbaI消化,克隆到pRC/CMV载体(Invitrogen)的HindIII和XbaI位点,用T7DNASequenase试剂盒(Amsham)进行全序列测定(SEQ.ID.NO.:l)。j.hRUP3(Seq.Id.No.7&8)采用hRUP3特异的引物5'-GTCCTGCCACTTCGAGACATGG-3'SEQ.ID.NO.:71(有义,ATG为起始密码子)和5'-GAAACTTCTCTGCCCTTACCGTC-3'SEQ.ID.NO.:72(反义,位于终止密码子TAA的3'端)并用人基因组DNA为模板,通过PCR来克隆全长hRUP3。采用TaqPlusPrecisionDNA聚合酶(Stratagene),按照下列循环来扩增,其中第2步至第4步重复35次94°C3分钟;94°Cl分钟;58°Cl分钟;72°C2分钟;72°CIO分钟。分离到预计大小的1.0KbPCR片段并克隆到pCRII-TOPO载体(Invitrogen),用T7DNASequenase试剂盒(Amsham)进行全序列测定(SEQ.ID.NO.:7)。实施例2受体表达尽管在本领域中有多种细胞可用于蛋白质的表达,但最优选应用的是哺乳动物细胞。据预测,其基本原因是实用性,即例如表达GPCR的酵母细胞的应用,有可能把一种非哺乳动物细胞引入到程序中,此细胞可能不(其实,对于酵母来说,是不)包括偶联受体、遗传机制和分泌途径,而这些是经过进化用于哺乳动物系统的。因此,在非哺乳动物细胞中得到的结果,尽管是可能有用的,但并不如从哺乳动物细胞中得到的结果优选。在哺乳动物细胞中,COS-7、293和293T细胞是特别优选的,尽管应用的特定哺乳动物细胞可按技术人员的特别需要而被判定。用于表达所公开的GPCR的一般步骤如下。第一天,将1X1(^个293T细胞接种到150mm的培养板上。第二天,准备两支试管(比例是每板用于一支试管)通过混合20吗DNA(例如pCMV载体、带有受体cDNA的pCMV载体,等)在1.2ml无血清的DMEM(IrvineScientific,Irvine,CA)来制备试管A;通过混合120fillipofectamine(GibcoBRL)在1.2ml无血清DMEM中制备试管B。把试管A和B互倾混合(几次),然后在室温下温育30-45分钟。组合物被称为"转染组合物"。植出的293T细胞用1XPBS洗涤,然后加入10ml无血清的DMEM。把2.4ml转染组合物加入到细胞中去,然后在37°C/5%C02下温育4小时。接着通过抽吸移去转染组合物,然后加入25ml的DMEM/10。/。胎牛血清。接着细胞在37。C/5。/。C02温育。72小时后收获细胞并用来进行分析。实施例3所公开的人GPCR的组织分布可用几中方法来测定本文所公开的GPCR的组织分布。1.斑点印迹分析应用商业可得的人组织斑点印迹系统,探査内源孤儿GPCR以确定这些受体所存在的区域。实施例1的GPCR的cDNA片段(放射标记的)被(或可被)用作探针按照制造商的指令,应用Prhne-It117"随机引物标记试剂盒(Stratagene,#300385),用完全受体cDNA(从载体中切下)产生(或可产生)放射标记的探针。把人RNAMasterBlot(Clontech,存7770-l)与内源人GPCR放射标记的探针杂交,并按照制造商的指令在严谨条件下洗涤。印迹曝光于KodakBioMaxTM放射自显影底片,在-8(TC过夜。几种受体的结果在表B和表C中列出(参见图1A和1B,其中分别列出了各种组织和其位置)。用hCHN3和hCHN8得到的结果显示在图2A和2B所示的典型斑点印迹中。表B孤儿GPCRhGPCR27hARE-lhPPRlhRUP3hCHN3hCHN9hCHN10组织分布(在斑点印迹中相对于其它组织的最高水平)胎脑、壳、脑下垂体、尾状核脾、外周血白细胞、胎脾脑下垂体、心、唾液腺、小肠、睾丸胰腺胎脑、壳、枕皮质胰腺、小肠、肝肾、甲状腺表C孤儿GPCR组织分布(在斑点印迹中相对于其它组织的最高水平)hARE-3左小脑、右小脑、睾丸、AccumbenshGPCR3尸体collusum、尾状核、肝、心、心脏室间隔膜hARE-2左小脑、右小脑、黑质hCHN8左小脑、右小脑、肾、月市2.RT-PCRa.hRUP3为证实hRUP3mRNA的组织分布,采用hRUP3特异的引物和作为模板的人多组织cDNA板(MTC,Clontech)进行RT-PCR。采用T叫DNA聚合酶(Stratagene)并按照下列循环在40微升反应液中来进行该PCR反应94°C2分钟;94°C15秒;55°C30秒;72°C1分钟;72°C10分钟。所用引物如下5'-GACAGGTACCTTGCCATCAAG-3'(SEQ.ID.NO.:61;有义)5'-CTGCACAATGCCAGTGATAAGG-3'(SEQ.ID.NO.:62;反义)。将20微升反应液上样到1%琼脂糖凝胶中,结果如图3所示。正如图3中的数据所支持的那样,在所使用的cDNA板的16个组织(脑、结肠、心、肾、肺、卵巢、胰腺、胎盘、前列腺、骨、小肠、脾、睾丸、胸腺白细胞和肝)中,只有胰腺显示了一条hRUP3带。hRUP3的蛋白质序列与其它GPCR的进一步的对比分析表明hRUP3与具有小分子内源配体的GPCR有关,由此可以做出这样的预测hRUP3的内源配体是小分子。b.hRUP4采用作为引物的hRUP4的寡聚核苷酸引物8和4和作为模板的人多组织cDNA板(MTC,Clontech)进行RT-PCR。采用T叫DNA聚合酶(Stratagene)并按照下列循环在40微升反应液中来进行扩增94"C30秒;94°C10秒;55°C30秒;72°C2分钟;72°C5分钟,其中循环2到循环4重量复30次。将20微升反应液上样到1%琼脂糖凝胶中来分析该RT-PCR的产物,发现hRUP4mRNA在许多人组织中表达,但在心和肾中表达最强。(参见图4)。为证实这些PCR片段的真实性,使用从hRUP4的5'末端产生的300bp片段做探针,进行Souther印迹分析。该探针用32p-dCTP采用Prime-ItII随机引物标记试剂盒(Stratagore)进行标记,并用ProbeQuantG-50微型柱(Amershan)进行纯化。进行12小时的预杂交,然后在42'C杂交过夜。最后,在65"C用O.lxSSC对印迹进行洗涤。该Southern印迹没有证实hRUP4的PCR片段。c.hRUP5采用hRUP5的下列特异的引物和作为模板的人多组织cDNA板(MTC,Clontech)进行RT-PCR:5'-CTGACTTCTTGTTCCTGGCAGCAGCGG-3'(SEQ.ID.NO.:63;有义)5'誦AGACCAGCCAGGGCACGCTGAAGAGTG國3'(SEQ.ID.NO.:64;反义)。采用TaqDNA聚合酶(Stratagene)并按照下列循环在40微升反应液中来进行扩增94°C30秒;94°C10秒;62°Cl分30秒;72°C5分钟;其中第2步至第3步重复30次。将20微升反应液上样到1.5%琼脂糖凝胶中来分析该RT-PCR的产物,发现hRUP5mRNA仅在外周血白细胞中表达(数据未显示)。d.hRUP6采用RT-PCR来证实hRUP6的表达并确定hRUP6的组织分布。基于AC005871和GPR66片断的对齐排比,采用具有下列序列的寡聚核苷酸和作为模板的人多组织cDNA板(MTC,Clontech):5'誦CCAACACCAGCATCCATGGCATCAAG-3'(SEQ.ID.NO.:73;有义)5'-GGAGAGTCAGCTCTGAAAGAATTCAGG-3'(SEQ.ID.NO.:74;反义)。采用TaqPlusPrecisionDNA聚合酶(Stratagene,按照厂商的指令)并按照下列循环在40微升反应液中来进行PCR:94°C30秒;94°C5秒;66°C40秒;72°C2分30秒;和72°C7分钟。其中第2至第4循环重复30次。将20微升反应液上样到1.2%琼脂糖凝胶中来分析该RT-PCR的产物,代表hRUP6的特异760bpDNA片段主要在胸腺中表达,而在心、肾、肺、前列腺、小肠和睾丸中仅少量表达。(参见图5)。本专利申请文件中提到的每个专利、申请及印刷出版物以其全文引入本申请作参考。本领域的普通技术人员将认识到在不背离本发明精神和实质的前提下,可以对本发明的优选实施方案做许多许多改变和修改。这些修改和变化均在本发明的范围之内。虽然本领域的普通技术人员可以得到许多不同的载体为内源和非内源GPCR的目的使用,但最好是用pCMV载体。按照国际承认用于专利程序的微生物保存布达佩斯条约,该载体于1998年10月13日保存在美国典型培养物保藏中心(AmericanTypeCultureCollection)(ATCC)(UniversityBlvd,Manassas,VA20110-2209USA7)。其DNA经ATCC测定并得到确认,ATCC为pCMV给出了下列保藏号ATCC#203351。序列表(1)一般资料U)申请人:陈若平;邓杭;廖王蓁;林伊玲(ii)发明名称与人G蛋白偶联的孤儿受体(iii)序列数74(iv)通讯地址(A)收信人阿瑞那制药公司(B〉NancyRidge大道6166号(C)城市圣地亚哥(D)州加利福尼亚州(E)国家美国(F)由卩编92121(v)计算机可读形式(A)介质类型软盘(B)计算机IBM个人兼容机(C)操作系统PC-DOS/MS-DOS(D〉软件PatentlnRelease#1.0,#1.30版(vi)本申请资料(A)申请号(B)申请日(C)分类号(Viii)代理人信息(A)姓名Burgoon,RichardP.(B)登记号34787(ix)电讯信息(A)电话(858)453-7200(B)电传(858)453-7210(2)SEQIDNO:1的资料(i)序列特征(A)长度1260个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:l的序歹lj描述ATGGTCTTCTCGGCAGTGTTGACTGCGTTCCATACCGGGACATCCAACACAACATTTGTC60GTGTATGAAAACACCTACATGAATATTACACTCCCTCCACCATTCCAGCATCCTGACCTC120AGTCCATTGCTTAGATATAGTTTTGAAACCATGGCTCCCACTGGTTTGAGTTCCTTCACC180GTGAATAGTACAGCTGTGCCCACAACACCAGCAGCATTTAAGAGCCTAAACTTGCCTCTT240CAGATCACCCTTTCTGCTATAATGATATTCATTCTGTTTGTGTCTTTTCTTGGGAACTTG300GTTGTTTGCCTCATGGTTTACCAAAAAGCTGCCATGAGGTCTGCAATTAACATCCTCCTT360GCCAGCCTAGCTTTTGCAGACATGTTGCTTGCAGTGCTGAACATGCCCTTTGCCCTGGTA420ACTATTCTTACTACCCGATGGATTTTTGGGAAATTCTTCTGTAGGGTATCTGCTATGTTT480TTCTGGTTATTTGTGATAGAAGGAGTAGCCATCCTGCTCATCATTAGCATAGATAGGTTC540CTTATTATAGTCCAGAGGCAGGATAAGCTAAACCCATATAGAGCTAAGGTTCTGATTGCA600GTTTCTTGGGCAACTTCCTTTTGTGTAGCTTTTCCTTTAGCCGTAGGAAACCCCGACCTG660CAGATACCTTCCCGAGCTCCCCAGTGTGTGTTTGGGTACACAACCAATCCAGGCTACCAG720GCTTATGTGATTTTGATTTCTCTCATTTCTTTCTTCATACCCTTCCTGGTAATACTGTAC780TCATTTATGGGCATACTCAACACCCTTCGGCACAATGCCTTGAGGATCCATAGCTACCCT840GAAGGTATATGCCTCAGCCAGGCCAGCAAACTGGGTCTCATGAGTCTGCAGAGACCTTTC900CAGATGAGCATTGACATGGGCTTTAMACACGTGCCTTCACCACTATTTTGATTCTCTTT960GCTGTCTTCATTGTCTGCTGGGCCCCATTCACCACTTACAGCCTTGTGGCMCATTCAGT1020AAGCACTTTTACTATCAGCACAACTTTTTTGAGATTAGCACCTGGCTACTGTGGCTCTGC1080TACCTCAAGTCTGCATTGAATCCGCTGATCTACTACTGGAGGATTAAGAAATTCCATGAT1140GCTTGCCTGGACATGATGCCTAAGTCCTTCAAGTTTTTGCCGCAGCTCCCTGGTCACACA1200AAGCGACGGATACGTCCTAGTGCTGTCTATGTGTGTGGGGAACATCGGACGGTGGTGTGA1260(3)SEQIDNO:2的资料(i)序列特征(A)长度419个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:2的序列描述MetValPheSerAlaValLeuThrAlaPheHisThrGlyThrSerAsn151015ThrThrPheValValTyrGluAsnThrTyrMetAsnlieThrLeuPro202530ProProPheGinHisProAspLeuSerProLeuLeuArgTyrSerPhe354045GluThrMetAlaProThrGlyLeuSerSerLeuThrValAsnSerThr505560AlaValProThrThrProAlaAlaPheLysSerLeuAsnLeuProLeu65707580GinlieThrLeuSerAlalieMetliePhelieLeuPheValSerPhe859095LeuGlyAsnLeuValValCysLeuMetValTyrGinLysAlaAlaMet100105110ArgSerAlalieAsnlieLeuLeuAlaSerLeuAlaPheAlaAspMet115120125LeuLeuAlaValLeuAsnMetProPheAlaLeuValThrlieLeuThr130135140ThrArgTrpliePheGlyLysPhePheCysArgValSerAlaMetPhe145150155160PheTrpLeuPheVallieGluGlyValAlalieLeuLeulielieSer165170175lieAspArgPheLeulielieValGinArgGinAspLysLeuAsnPro180185190TyrArgAlaLysValLeulieAlaValSerTrpAlaThrSerPheCys195200205ValAlaPheProLeuAlaValGlyAsnProAspLeuGinlieProSer210215220ArgAlaProGinCysValPheGlyTyrThrThrAsnProGlyTyrGin225230235240AlaTyrVallieLeulieSerLeulieSerPhePhelieProPheLeu245250255VallieLeuTyrSerPheMetGlylieLeuAsnThrLeuArgHisAsn260265270AlaLeuArglieHisSerTyrProGluGlylieCysLeuSerGinAla275280285SerLysLeuGlyLeuMetSerLeuGinArgProPheGinMetSerlie2恥295300AspMetGlyPheLysThrArgAlaPheThrThrlieLeulieLeuPhe305310315320AlaValPhelieValCysTrpAlaProPheThrThrTyrSerLeuVal325330335AlaThrPheSerLysHisPheTyrTyrGinHisAsnPhePheGlulie340345350SerThrTrpLeuLeuTrpLeuCysTyrLeuLysSerAlaLeuAsnPro355360365LeulieTyrTyrTrpArglieLysLysPheHisAspAlaCysLeuAsp370375380MetMetProLysSerPheLysPheLeuProGinLeuProGlyHisThr385390395400LysArgArglieArgProSerAlaValTyrValCysGlyGluHisArg405410415ThrValVal(4)SEQIDNO:3的资料(i)序列特征(A)长度1119个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:ATGTTAGCCAACAGCTCCTCACCCACCGCCGCGCTAGCCCATGTGTAACCTACTACGCACTTCCAGATGAGCCGCCATCGCTCTGCCTGGAGGCCCTCGCGACGAGCTGTCTGCTGCCCCCCCGACGCCAGTCATCTTCCCGGAGCAAGCGTGATGGTGCGCCGAGGGCTGCCACCAACGGCCACCAGGCTCTTCCTTCATGCACTTGGTTCTGGGTCTTTGGCGGCCAGTGCACCACTGACATGTACGGTGCACCCGCTGCGTGTGGGCGTTGCCGCTAGGAAAGGCAGTGGCGGCGGTCGCAGAGCCATGCTGTGCTTTGGTGGCGGCTGCTGGCCGGTCCGCAACACGGACGCGGGCCGGATGCCGCCACAGTGTCC3的序列描AACCAACAGTGGTCTACAGCCCTGCGCGCGCGACCTGCTCGCCCTTCCCCCAGCTGCATCGCGACTGCGCGCTCATCCTGCCGGGACCTCGCTGCTGCCCGGTCTACTCGGCGGCGGCGGCGTGCCCTACCAGCGTGCCTCGCCAACTGCCCTGCGCGGCGGCGCTCGCGCAGTCAGGGGCCAGGATTCC述TCTGTTCTCCTTGGTGCTGGCTGCGCGTGCTTCACCCTCTGACCTCCTGTTTCCTGATGCCACCTGCGGCGTGTTTGCCGGAGGTGCGCCCTCGTGCTGCTCGGGCCGAGAAGACCGTGCAACAGCACGCGCCCGCGATCGTGCTGGACCCTGGGCACTCCAATCCGAAACTGCTCCGACGCCCTCTGACGTGTCCTGACTGCCGGGCTACTCGGTGGTCGCTGCCCGTGCCAGACGACTCATCAACGTGGCCCCGCGTTGCCCGCCGCTATGCTTCGATGGCCGAGGCTCTTCTGGACGCCTCCTGCTTGGCGGTCTAGCGTGCGCGGCGCTGGTGTACGCACCGGGCGGTCCGCCGTCCTCCGACTCCTACCGACCTCCCCCTCAACGAGCGTGTACTCGTCTCTCCGGGCGCCATCGGACCGCTACGGCGCGGCTGCCGCGTGCACGAGCTTCAGCGCTGGGCTTCGCTGGCGCGCGGCTMCCTCCGGGCTGCTGGGTGCTGATGCTACTTTAGCCAGGACCTCGCACCACCGACCCACTCTCTG60120180240300360420480540600660720780840900960102010801119(5)SEQIDNO:4的资料(i)序列特征(A)长度372个氨基酸31(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(x;L)SEQIDN0:4的序列描述:MetLeuAlaAsnSer15SerSerThrAsnSerSerValLeuProCysPro1015AspTyrArgProThrHisArgLeuHisLeuValValTyrSerLeuVal202530LeuAlaAlaGlyLeuProLeuAsnAlaLeuAlaLeuTrpValPheLeu354045ArgAlaLeuArgValHisSerValValSerValTyrMetCysAsnLeu505560AlaAlaSerAspLeuLeuPheThrLeuSerLeuProValArgLeuSer65707580TyrTyrAlaLeuHisHisTrpProPheProAspLeuLeuCysGinThr859095ThrGlyAlaliePheGinMetAsnMetTyrGlySerCysliePheLeu100105110MetLeulieAsnValAspArgTyrAlaAlalieValHisProLeuArg115120125LeuArgHisLeuArgArgProArgValAlaArgLeuLeuCysLeuGly130135140ValTrpAlaLeulieLeuValPheAlaValProAlaAlaArgValHis145150155160ArgProSerArgCysArgTyrArgAspLeuGluValArgLeuCysPhe165170175GluSerPheSerAspGluLeuTrpLysGlyArgLeuLeuProLeuVal180185190LeuLeuAlaGluAlaLeuGlyPheLeuLeuProLeuAlaAlaValVal195200205TyrSerSerGlyArgValPheTrpThrLeuAlaArgProAspAlaThr210215220GinSerGinArgArgArgLysThrValArgLeuLeuLeuAlaAsnLeu225230235240ValliePheLeuLeuCysPheValProTyrAsnSerThrLeuAlaVal245250255TyrGlyLeuLeuArgSerLysLeuValAlaAlaSerValProAlaArg260265270AspArgValArgGlyValLeuMetValMetValLeuLeuAlaGlyAla275280285AsnCysValLeuAspProLeuValTyrTyrPheSerAlaGluGlyPhe290295300ArgAsnThrLeuArgGlyLeuGlyThrProHisArgAlaArgThrSer305310315320AlaThrAsnGlyThrArgAlaAlaLeuAlaGinSerGluArgSerAla325330335ValThrThrAspAlaThrArgProAspAlaMaSerGinGlyUuLeu340345350ArgProSerAspSerHisSerLeuSerSerPheThrGinCysProGin355360365AspSerAlaLeu370(6)SEQIDNO:5的资料(i)序列特征(A)长度1107个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:5的序列描述ATGGCCAACTCCACAGGGCTGAACGCCTCAGMGTCGCAGGCAGCTGTCGCGCACGCCGGGCGGCCGCCTGTGCGCCTGGGCCTGCACGCC丁GCGGCCAGGGACTGCTGGCGCTGCTCGGTTCGCGCTGCCGCGCTGCCCGATAGCCGCCTGGAGGTGGGGACTGCGCGACCATCATGCCGCCCCGCGCCTCGGGGTGGCGCTCGCGGCCGCGCGCTCTCTCCTGGCTGGCCGCCCTCCTTGAGGCCCCCTTTCCATCTTGGCACTGCTGCGCGCTCTACGCTGGGCCTGATGCCGCGCCCGCACTTGGCGCCGCCTGTGCCTGCTCGGCGGGCCTCGGGGCTGCTCGGCACGGCCGGCGGCCGCCGCTCGGCAACGGCGCTGGCGCACCCTGGCCGCACGCTCGCTTCCCTGGCACGCTCTCGTGCTCACCGCCGCCCGCCCTTCCGGCGCCTACGGCGCGCGGGTCCCCGGCCTCGCCGCTCGTTGGGCGCTGCTGGTTGTGCGTCGTCGCCGCCCGGTCTCCGCCGCACCGCCTCATCCGCCGTGTGCACCGCCCCCCGCTCTGGGCGCATCTTCGTGACTCCGCTCTGCCCGGGGGGTTGATCCTG60CGTGGTGCTG120GGACCTGCTG180GCTGGGCCGC240TCTGCTGCCG300CGTGCACCCG360GGCCGCGGCG420TGCTCCTGCT480CCTGCTGGCC540GGTGGCGCGT600GGACTCTCTG660CAAGGCGGCC72033CTGGCCCCAGCGCTGGCCGTGGGCCAATTTTGCCTGGCGCCCGCAGCGCGGGCCGCGGMTCGGCCTTCGCGGCTCACCCCTTCCTGTACCTGGGCCGCCTCTCTCGCCGTGCACTGCCTTGGCACCCGCGGGCACTCTTGCAATGCCTCCCTTCTGAGGCTCCAGMCAGACCCCCGAGGGGCCACCTGAGAGTTCTCTCTCCTGAGCAGCCTGCTGGCTGCCTTATGGCTGCGCG780GCCGAAGCGGCTGTCACCTGGGTCGCCTAC840GGGCTGCTGCAGCGCCCCGTGCGCTTGGCA900GGACCTGTGCGGGCCTGCACTCCGCMGCC960CAGAGACCCCCAGAGGGCCCTGCCGTAGGC1020TTGGCAGGAGGGCGGAGCCCCGCATACCAG10801107(7)SEQIDNO:6的资料(i)序列特征(A)长度368个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:6的序列描述MetAlaAsnSerThrGlyLeuAsnAlaSerGluValAlaGlySerLeu151015GlyLeulieLeuAlaAlaValValGluValGlyAlaLeuLeuGlyAsn202530GlyAlaLeuLeuValValValLeuArgThrProGlyLeuArgAspAla354045LeuTyrLeuAlaHisLeuCysValValAspLeuLeuAlaAlaAlaSer505560lieMetProLeuGlyLeuLeuAlaAlaProProProGlyLeuGlyArg65707580ValArgLeuGlyProAlaProCysArgAlaAlaArgPheLeuSerAla859095AlaLeuLeuProAlaCysThrLeuGlyValAlaAlaLeuGlyLeuAla100105110ArgTyrArgLeulieValHisProLeuArgProGlySerArgProPro115120125ProValLeuValLeuThrAlaValTrpAlaAlaAlaGlyLeuLeuGly130135140AlaLeuSerLeuLeuGlyProProProAlaProProProAlaProAla145150155160ArgCysSerValLeuAlaGlyGlyLeuGlyProPheArgProLeuTrp165170175AlaLeuLeuAlaPheAlaLeuProAlaLeuLeuLeuLeuGlyAlaTyr180185190GlyGlyliePheValValAlaArgArgAlaAlaLeuArgProProArg195200205ProAlaArgGlySerArgLeuArgSerAspSerLeuAspSerArgLeu210215220SerlieLeuProProLeuArgProArgLeuProGlyGlyLysAlaAla225230235240LeuAlaProAlaLeuAlaValGlyGinPheAlaAlaCysTrpLeuPro245250255TyrGlyCysAlaCysLeuAlaProAlaAlaArgAlaAlaGluAlaGlu260265270AlaAlaValThrTrpValAlaTyrSerAlaPheAlaAlaHisProPhe275280285LeuTyrGlyLeuLeuGinArgProValArgLeuAlaLeuGlyArgLeu290295300SerArgArgAlaLeuProGlyProValArgAlaCysThrProGinAla305310315320TrpHisProArgAlaLeuLeuGinCysLeuGinArgProProGluGly325330335ProAlaValGlyProSerGluAlaProGluGinThrProGluLeuAla340345350GlyGlyArgSerProAlaTyrGinGlyProProGiuSerSerLeuSer355360365(8)SEQIDNO:7的资料(i)序列特征(A)长度1008个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:7的序歹lJ描述ATGGAATCATCTTTCTCATTTGGAGTGATCACTAACACACTAGTGGCTCTGGCTGTGCTGCTCTGCTTCACCTTGAATCTGGCTGTGGCTCTACTCACAGACCAGCTCTCCAGCCCTTCTCGGATGGCATTTGTCACTTCCTCCGCAGCTTTTGACAGGTACCTTGCCATCAAGCAGCCCGTGGCCGGGGCCTGCATTGCCGGGCTGTGGCTCGGAATCCCCATGTTCCAGCAGACTGCCTTTCACCCTCACTTCGTGCTGACCCTCTCCTTTGTCTTCTTCTACTGCGACATGCTCAAGAAGATGGAACATGCAGGAGCCATGGCTGGATTCAAAGCTCTCCGTACTGTGTCTGTTCTCTTCCTTATCACTGGCATTGTGCAGGTGGCCGAACGGTACCTGTGGCTGCTCGGCGTGGGCTATTGGCAGAAGGAGGTGCGACTGCAGCTCCTCACCTCATTCCTCCTCTTTCTCTCGGCCAGTTCCTGTCACATCGTCACTATCTCCAGCCTTGCTGTCCTGGCCTCCCTCATCATTGCT60CTGTTGATCCACA織ATGATGGTGTCAGT120GACACCTTGATTGGTGTGGCCATCTCTGGC180CGGCCCACACAGAAGACCCTGTGCAGCCTG240GCCTCTGTCCTCACGGTCATGCTGATCACC300TTCCGCTACTTGAAGATCATGAGTGGGTTC360TTAGTGTCTTACCTCATTGGCTTCCTCCCA420TACAAAGGGCAGTGCAGCTTCTTTGCTGTA480TGCGTTGGCTTCTTCCCAGCCATGCTCCTC540ATTGCCTCCATGCACAGCCAGCAGATTCGA600GGTTATCGATCCCCACGGACTCCCAGCGAC660ATTGGGAGCTTTGCTCTATCCTGGACCCCC720TGCCAGGAGTGTCACCTCTACCTAGTGCTG780AACTCCCTGCTCAACCCACTCATCTATGCC840TACCACATGGCCCTAGGAGTGAAGAAGGTG900AGGAATTGTGGCCCAGAGAGGCCCAGGGAA960TCAGAGTTTGATGGCTAA1008(9)SEQIDNO:8的资料(i)序列特征(A)长度335个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(i幻分子类型蛋白质(XJJSEQIDNO:8的序歹lj描述MetGluSerSerPheSerPheGlyVallieLeuAlaValLeuAlaSer151015LeulielieAlaThrAsnThrLeuValAlaValAlaValLeuLeuLeu202530lieHisLysAsnAspGlyValSerLeuCysPheThrLeuAsnLeuAla354045ValAlaAspThrLeulieGlyValAlalieSerGlyLeuLeuThrAsp505560Glr\LeuSerSerProSerArgProThrGinLysThrLeuCysSerLeu65707580ArgMetAlaPheValThrSerSerAlaAlaAlaSerValLeuThrVal859095MetLeulieThrPheAspArgTyrLeuAlalieLysGinProPheArg100105110TyrLeuLyslieMetSerGlyPheValAlaGlyAlaCyslieAlaGly115120125LeuTrpLeuValSerTyrLeulieGlyPheLeuProLeuGlyliePro130135140MetPheGinGinThrAlaTyrLysGlyGinCysSerPhePheAlaVal145150155160PheHisProHisPheValUuThrLeuSerCysValGlyPhePhePro165170175AlaMetLeuLeuPheValPhePheTyrCysAspMetLeuLyslieAla180185190SerMetHisSerGinGinlieArgLysMetGluHisAlaGlyAlaMet195200205AlaGlyGlyTyrArgSerProArgThrProSerAspPheLysAlaLeu210215220ArgThrValSerValLeulieGlySerPheAlaLeuSerTrpThrPro225230235240PheLeulieThrGlylieValGinValAlaCysGinGluCysHisLeu245250255TyrLeuValLeuGluArgTyrLeuTrpLeuLeuGlyValGlyAsnSer260265270LeuLeuAsnProLeulieTyrAlaTyrTrpGinLysGluValArgLeu275280285GinLeuTyrHisMetAlaLeuGlyValLysLysValLeuThrSerPhe290295300LeuLeuPheLeuSerAlaArgAsnCysGlyProGluArgProArgGlu305310315320SerSerCysHislieValThrlieSerSerSerGluPheAspGly325330335(10)SEQIDNO:9的资料(i)序列特征(A)长度1413个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)xi)SEQIDNO:9的序列描述ATGGACACTACCATGGMGCTGACCTGGGTGCCACTGGCCACAGGCCCCGCACAGAGCTT60GATGATGAGGACTCCTACCCCCAAGGTGGCTGGGACACGGTCTTCCTGGTGGCCCTGCTG120CTCCTTGGGCTGCCAGCCAATGGGTTGATGGCGTGGCTGGCCGGCTCCCAGGCCCGGCAT180GGAGCTGGCACGCGTCTGGCGCTGCTCCTGCTCAGCCTGGCCCTCTCTGACTTCTTGTTC240CTGGCAGCAGCGGCCTTCCAGATCCTAGAGATCCGGCATGGGGGACACTGGCCGCTGGGG300ACAGCTGCCTGCCGCTTCTACTACTTCCTATGGGGCGTGTCCTACTCCTCCGGCCTCTTC360CTGCTGGCCGCCCTCAGCCTCGACCGCTGCCTGCTGGCGCTGTGCCCACACTGGTACCCT420GGGCACCGCCCAGTCCGCCTGCCCCTCTGGGTCTGCGCCGGTGTCTGGGTGCTGGCCACA480CTCTTCAGCGTGCCCTGGCTGGTCTTCCCCGAGGCTGCCGTCTGGTGGTACGACCTCGTC540ATCTGCCTGGACTTCTGGGACAGCGAGGAGCTGTCGCTGAGGATGCTGGAGGTCCTGGGG600GGCTTCCTGCCTTTCCTCCTGCTGCTCGTCTGCCACGTGCTCACCCAGGCCACAGCCTGT660CGCACCTGCCACCGCCAACAGCAGCCCGCAGCCTGCCGGGGCTTCGCCCGTGTGGCCAGG720ACCATTCTGTCAGCCTATGTGGTCCTGAGGCTGCCCTACCAGCTGGCCCAGCTGCTCTAC780CTGGCCTTCCTGTGGGACGTCTACTCTGGCTACCTGCTCTGGGAGGCCCTGGTCTACTCC840GACTACCTGATCCTACTCAACAGCTGCCTCAGCCCCTTCCTCTGCCTCATGGCCAGTGCC900GACCTCCGGACCCTGCTGCGCTCCGTGCTCTCGTCCTTCGCGGCAGCTCTCTGCGAGGAG960CGGCCGGGCAGCTTCACGCCCACTGAGCCACAGACCCAGCTAGATTCTGAGGGTCCAACT1020CTGCCAGAGCCGATGGCAGAGGCCCAGTCACAGATGGATCCTGTGGCCCAGCCTCAGGTG1080AACCCCACACTCCAGCCACGATCGGATCCCACAGCTCAGCCACAGCTGAACCCTACGGCC1140CAGCCACAGTCGGATCCCACAGCCCAGCCACAGCTGAACCTCATGGCCCAGCCACAGTCA1200GATTCTGTGGCCCAGCCACAGGCAGACACTAACGTCCAGACCCCTGCACCTGCTGCCAGT1260TCTGTGCCCAGTCCCTGTGATGAAGCTTCCCCAACCCCATCCTCGCATCCTACCCCAGGG1320GCCCTTGAGGACCCAGCCACACCTCCTGCCTCTGAAGGAGAAAGCCCCAGCAGCACCCCG1380CCAGAGGCGGCCCCGGGCGCAGGCCCCACGTGA1413(11)SEQIDNO:10的资料U)序列特征(A)长度468个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:10的序歹U描述HisArgPro15GlyTrpAsp30AlaAsnGlyAlaGlyThrMetA印ThrThrMetGluAlaAspLeuGlyAlaThrGly1510ArgThrGluLeuAspAspGluAspSerTyrProGinGly2025ThrValPheLeuValAlaLeuLeuLeuLeuGlyLeuPro354045LeuMetAlaTrpLeuAlaGlySerGinAlaArgHisGly50556038ArgLeuAlaLeuLeuLeuLeuSerLeuAlaLeuSerAspPheLeuPhe65707580LeuAlaAlaAlaAlaPheGinlieLeuGlulieArgHisGlyGlyHis859095TrpProLeuGlyThrAlaAlaCysArgPheTyrTyrPheLeuTrpGly100105110ValSerTyrSerSerGlyLeuPheLeuLeuAlaAlaLeuSerLeuAsp115120125ArgCysLeuLeuAlaLeuCysProHisTrpTyrProGlyHisArgPro130135140ValArgLeuProLeuTrpValCysAlaGlyValTrpValLeuAlaThr145150155160LeuPheSerValProTrpLeuValPheProGluAlaAlaValTrpTrp165170175TyrAspLeuVallieCysLeuAspPheTrpAspSerGluGluLeuSer180185190LeuArgMetLeuGluValLeuGlyGlyPheLeuProPheLeuLeuLeu195200205LeuValCysHisValLeuThrGinAlaThrArgThrCysHisArgGin210215220GinGinProAlaAlaCysArgGlyPheAlaArgValAlaArgThrlie225230235240LeuSerAlaTyrValValLeuArgLeuProTyrGinLeuAlaGinLeu245250255LeuTyrLeuAlaPheLeuTrpAspValTyrSerGlyTyrLeuLeuTrp260265270GluAlaLeuValTyrSerAspTyrLeulieLeuLeuAsnSerCysLeu275280285SerProPheLeuCysLeuMetAlaSerAlaAspLeuArgThrLeuLeu290295300ArgSerValLeuSerSerPheAlaAlaAlaLeuCysGluGluArgPro305310315320GlySerPheThrProThrGluProGinThrGinLeuAspSerGluGly32533033539ProThrLeuProGluProMetAlaGluAlaGinSerGinMetAspPro340345350ValAlaGinProGinValAsnProThrLeuGinProArgSerAspPro355360365ThrAlaGinProGinLeuAsnProThrAlaGinProGinSerAspPro370375380ThrAlaGinProGinLeuAsnLeuMetAlaGinProGinSerAspSer385390395400ValAlaGinProGinAlaAspThrAsnValGinThrProAlaProAla405410415AlaSerSerValProSerProCysAspGluAlaSerProThrProSer420425430SerHisProThrProGlyAlaLeuGluAspProAlaThrProProAla435440445SerGluGlyGluSerProSerSerThrProProGluAlaAlaProGly450455460AlaGlyProThr465:12)SEQIDNO:(i)序列特征(A)长度11的资料(B)(C)(D)类型链型拓扑学12487核酸单链:线形-碱基对(ii)分子类型DNA(基因组的)(xi)SEQIDNO:ATGTCAGGGATGGAAAAACT11的序列描述TCAGAATGCTTCCTGGATCTCCATTCCAGACGCAGCCACTATTGGCAATGAACTACTACCCTGGAGGTCTTTCAAGACGGAGCGTGGAGCCGCCGGGCCCAACACCAGCATCGGCCACCTTCCTTCCTATAACACCTGAATCTTCCTCCCTCCTGGTGTGTCTTCAGCCTATGAGATGTGCCCTCTTTGAGCTACGTGGCTCAGGATCCTTCCATGGCATGTACGGTCATTCTACCTCCTCAGCACCGAGCGTGTCTGTGCCTGGTGATTGGCGGTCTCTGCGCAACTACGACCGTGTGCCATCCTACACCGGCATCGTCCAAGTTCCACCAAGCCCATGCCCCATGACTGAGTATCTGGGTGTATGTGCCTGCAGCACCGACCTCCTGGCCTTTCTTGTTTCGCCTCCACCGTTCCGCGTGGGGCTTCTTACTTCCCCATGGATCTACAGTCATCAGTGACCAGCAGAACCTTCCTCTGCAATTTTTGTAGGCTATCMTCCTGCTCCTTCGGGCCCGTTCCTCAGCATCCAAACTGCACCGTGCTCTTATGGGTCCCTATTTCATCATTCCTCTACTAACTAGAAGAT60CGGACCTCGG120GGTGGGGGTC180GACGCCCACC240TGGAATGCCC300GGGCTGCTAC360CACCACCGTC420GAGCACCCGG480CTCCCTGCCC540GGTCCCAGGT600CCAGGTCACC660CCTCATGGCA720CTCAGACTAAAGAMGACAAATCTCTTGAGGCAGATGAAGGGAATGCMATATTCAAAGA780CCCTGCAGAAAATCAGTCAACAAGATGCTGTTTGTCTTGGTCTTAGTGTTTGCTATCTGT840TGGGCCCCGTTCCACATTGACCGACTCTTCTTCAGCTTTGTGGAGGAGTGGAGTGAATCC900CTGGCTGCTGTGTTCAACCTCGTCCATGTGGTGTCAGGTGTCTTCTTCTACCTGAGCTCA960GCTGTCAACCCCATTATCTATAACCTACTGTCTCGCCGCTTCCAGGCAGCATTCCAGAAT1020GTGATCTCTTCTTTCCACAAACAGTGGCACTCCCAGCATGACCCACAGTTGCCACCTGCC1080CAGCGGAACATCTTCCTGACAGAATGCCACTTTGTGGAGCTGACCGAAGATATAGGTCCC1140CAATTCCCATGTCAGTCATCCATGCACAACTCTC虹TCCCAACAGCCCTCTCTAGTGAA1200CAGATGTCAAGAACAAACTATCAAAGCTTCCACTTTAACAAAACCTGA1248(13)SEQIDNO:12的资料(丄)序列特征(A)长度415个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ工DN0:12的序歹U描述MetSerGlyMetGluLysLeuGinAsnAlaSerTrplie1510TyrGin15GinLysLeuGluAspProPheGinLysHisLeuAsnSerThrGluGluTyr202530LeuAlaPheLeuCysGlyProArgArgSerHisPhePheLeuProVal354045SerValValTyrValProliePheValValGlyVallieGlyAsnVal505560LeuValCysLeuVallieLeuGinHisGinAlaMetLysThrProThr65707580AsnTyrTyrLeuPheSerLeuAlaValSerAspLeuLeuValLeuLeu859095LeuGlyMetProLeuGluValTyrGluMetTrpArgAsnTyrProPhe100105110LeuPheGlyProValGlyCysTyrPheLysThrAlaLeuPheGluThr115120125ValCysPheAlaSerlieLeuSerlieThrThrValSerValGluArg130135140TyrValAlalieLeuHisProPheArgAlaLysLeuGinSerThrArg145150155160ArgArgAlaLeuArglieLeuGlylieValTrpGlyPheSerValLeu165170175PheSerLeuProAsnThrSerlieHisGlylieLysPheHisTyrPhe180185190ProAsnGlySerLeuValProGlySerAlaThrCysThrVallieLys195200205ProMetTrplieTyrAsnPhelielieGinValThrSerPheLeuPhe210215220TyrLeuLeuProMetThrVallieSerValLeuTyrTyrLeuMetAla225230235240LeuArgLeuLysLysAspLysSerLeuGluAlaAspGluGlyAsnAla245250255AsnlieGinArgProCysArgLysSerValAsnLysMetLeuPheVal260265270LeuValLeuValPheAlalieCysTrpAlaProPheHislieAspArg275280285LeuPhePheSerPheValGluGluTrpSerGluSerLeuAlaAlaVal290295300PheAsnLeuValHisValValSerGlyValPhePheTyrLeuSerSer305310315320AlaValAsnProlielieTyrAsnLeuLeuSerArgArgPheGinAla325330335AlaPheGinAsnVallieSerSerPheHisLysGinTrpHisSerGin340345350HisAspProGinLeuProProAlaGinArgAsnliePheLeuThrGlu355360365CysHisPheValGluLeuThrGluAsplieGlyProGinPheProCys370375380GinSerSerMetHisAsnSerHisLeuProThrAlaLeuSerSerGlu385390395400GinMetSerArgThrAsnTyrGinSerPheHisPheAsnLysThr405410415(14)SEQ工DNO:13的资料(i)序列特征(A)长度1173个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:13的序列描述ATGCCAGATACTAATAGCACAATCAATTTATCACTAAGCACTCGTGTTACTTTAGCATTT60TTTATGTCCTTAGTAGCTTTTGCTATAATGCTAGGAAATGCTTTGGTCATTTTAGCTTTT120GTGGTGGACAAAAACCTTAGACATCGAAGTAGTTATTTTTTTCTTAACTTGGCCATCTCT180GACTTCTTTGTGGGTGTGATCTCCATTCCTTTGTACATCCCTCACACGCTGTTCGAATGG240GATTTTGGAAAGGAAATCTGTGTATTTTGGCTCACTACTGACTATCTGTTATGTACAGCA300TCTGTATATAACATTGTCCTCATCAGCTATGATCGATACCTGTCAGTCTCAAATGCTGTG360TCTTATAGAACTCAACATACTGGGGTCTTGAAGATTGTTACTCTGATGGTGGCCGTTTGG420GTGCTGGCCTTCTTAGTGMTGGGCCAATGATTCTAGTTTCAGAGTCTTGGAAGGATGAA480GGTAGTGMTGTGAACCTGGATTTTTTTCGGAATGGTACATCCTTGCCATCACATCATTC540TTGGAATTCGTGATCCCAGTCATCTTAGTCGCTTATTTCAACATGAATATTTATTGGAGC600CTGTGGAAGCGTGATCATCTCAGTAGGTGCCAAAGCCATCCTGGACTGACTGCTGTCTCT660TCCAACATCTGTGGACACTCATTCAGAGGTAGACTATCTTCAAGGAGATCTCTTTCTGCA720TCGACAGAAGTTCCTGCATCCTTTCATTCAGAGAGACAGAGGAGAAAGAGTAGTCTCATG780TTTTCCTCAAGAACCAAGATGAATAGCAATACAATTGCTTCCAAAATGGGTTCCTTCTCC840CAATCAGATTCTGTAGCTCTTCACCMAGGGAACATGTTGAACTGCTTAGAGCCAGGAGA900TTAGCCAAGTCACTGGCCATTCTCTTAGGGGTTTTTGCTGTTTGCTGGGCTCCATATTCT960CTGTTCACAATTGTCCTTTCATTTTATTCCTCAGCAACAGGTCCTAAATCAGTTTGGTAT1020AGAATTGCATTTTGGCTTCAGTGGTTCAATTCCTTTGTCAATCCTCTTTTGTATCCATTG1080TGTCACAAGCGCTTTCAAAAGGCTTTCTTGAAAATATTTTGTATAAAAAAGCAACCTCTA1140CCATCACAACACAGTCGGTCAGTATCTTCTTAA1173(15)SEQIDN〇14的资料(i)序列特征(A)长度330个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:14的序歹(J描述MetProAspThrAsnSerThrlieAsnLeuSerLeuSerThrArgVal151015ThrLeuAlaPhePheMetSerLeuValAlaPheAlalieMetLeuGly202530AsnAlaLeuVallieLeuAlaPheValValAspLysAsnLeuArgHis354045ArgSerSerTyrPhePheLeuAsnLeuAlalieSer'AspPhePheVal505560GlyVallieSerlieProLeuTyrlieProHisThrLeuPheGluTrp65707580AspPheGlyLysGlulieCysValPheTrpLeuThrThrAspTyrLeu859095LeuCysThrAlaSerValTyrAsnlieValLeulieSerTyrAspArg100105110TyrLeuSerValSerAsnAlaValSerTyrArgThrGinHisThrGly115120125ValLeuLyslieValThrLeuMetValAlaValTrpValLeuAlaPhe130135140LeuValAsnGlyProMetlieLeuValSerGluSerTrpLysAspGlu145150155160GlySerGluCysGluProGlyPhePheSerGluTrpTyrlieLeuAla165170175lieThrSerPheLeuGluPheVa].lieProVallieLeuValAlaTyr180185190PheAsnMetAsnlieTyrTrpSerLeuTrpLysArgAspHisLeuSer195200205ArgCysGinSerHisProGlyLeuThrAlaValSerSerAsnlieCys210215220GlyHisSerPheArgGlyArgLeuSerSerArgArgSerLeuSerAla225230235240SerThrGluValProAlaSerPheHisSerGluArgGinArgArgLys245250255SerSerLeuMetPheSerSerArgThrLysMetAsnSerAsnThrlie260265270AlaSerLysMetGlySerPheSerGinSerAspSerValAlaLeuHis275280285GinArgGluHisValGluLeuLeuArgAlaArgArgLeuAlaLysSer290295300LeuAlalieLeuLeuGlyValPheAlaValCysTrpAlaProTyrSer305310315320LeuPheThrlieValLeuSerPheTyrSerSerAlaThrGlyProLys325330335SerValTrpTyrArglieAlaPheTrpLeuGinTrpPheAsnSerPhe340345350ValAsnProLeuLeuTyrProLeuCysHisLysArgPheGinLysAla355360365PheLeuLysliePheCyslieLysLysGinProLeuProSerGinHis370375380SerArgSerValSerSer385390(16)SEQIDNO:15的资料(i)序列特征(A)长度1128个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ工DNO:ATGGCGAACGCGAGCGAGCC15的序列描述GGGTGGCAGCGGCGGCGGCGAAGCTGGCCACTGCTGATCGTGCCTGGCCGCGTGCGGCGGCTGGCCGCGCTACCTGGCCAGCCATGCTGGGACGGCGGTGCCCGGCGCGCTACCTCCGCCCCCGCCGTCAAACTCGACGGGCAGGGCCGGAGGCTGTGCAGTCGTGGCCAACGGCCTCCGTTCAACAGGGACCACCCAGGCGCTCAGCCTTGCGGGAGCGACGGGCTGCGCCGCGGCGGGTCTTCTGCTTTCGCGCACCATGTGCGCCGCGCGACGACGATGGGCTTCCTTGCTCTTCTTGCCACGACTGCGGGCTTCGGGCCGCGGCGCAGATGTTCTAGCTACCTGCGTGTGGCTGACAGCTGAGGGACGACCCATCCGCTGCTGTGCCAGCCTGCACCGCGCTCGCCGGCGCCGCCGCCACGCCGCCCCGCTTCTATCTGGGCGCTGGGACGCGCCGGCTGCTGCTGCATCCACGACG虹TTCCACCCGCGGGCCCGCGCCGCCTCCGCCGTCACGGGTCCTGGTGCTTCGCGCAGCTGCTTCAGGCTGCGACCTGGTGAGCCTAGCGCGCCCCGTTGCCTCCCGGGGCGCGCTGGTTCCTGCTGCGCAGAGCGCCGCGCTGGCCGTGCGCCCTGGGCCGTGGTGGCGCCGCAAGAGGCCCGGGCGACGCCGCCCGCTCGTGCTGGCTGCTCTTCCCGGCCCGGCGGCCGGCATCAGCCCAGTTCCAAAGGCATTGAGGCGGCCGCCGGGCAACGTACTACCTGCTCCGTCATGCTGCTGCAAGCTTGGGCGTGGGTGGCCGGCTGCGGCCTTCCCAGCAGCGGCCTGGGCGCCACTGCGGCCCGCCCACCGGCCACGCTTGTCGGAAGAATTCAATGCTCCTCTGCCGTCCCCCAACCCCGTCGTCCTGCTGCCAGTTTATGACCTGGGCCTCGCTGTTCGCGGCTCGACCTGGGCGGCGCGGGCTCGCCTTCCGTCACCCGCGCCGTGCGCCGCCAGTGCTGCGACGGCGCCGCACCTCGTCGCGCCTGGTGGGCGGCCGCCCATCCGGCCCGACGGAGAAGGGGGCCCTACGGCCTACCTGGTGCTTCCTCGAGCCCCCGG60120180240300360420480540600660720780840900960102010801128(17)SEQIDNO:16的资料(i)序列特征45(A)长度375个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:16的序歹ll描述MetAlaAsnAlaSerGluProGlyGlySerGlyGlyGlyGluAlaAla151015AlaLeuGlyLeuLysLeuAlaThrLeuSerLeuLeuLeuCysValSer202530LeuAlaGlyAsnValLeuPheAlaLeuLeulieValArgGluArgSer354045LeuHisArgAlaProTyrTyrLeuLeuLeuAspLeuCysLeuAlaAsp505560GlyLeuArgAlaLeuAlaCysLeuProAlaValMetLeuAlaAlaArg65707580ArgAlaAlaAlaAlaAlaGlyAlaProProGlyAlaLeuGlyCysLys859095LeuLeuAlaPheLeuAlaAlaLeuPheCysPheHisAlaAlaPheLeu100105110LeuLeuGlyValGlyValThrArgTyrLeuAlalieAlaHisHisArg115120125PheTyrAlaGluArgLeuAlaGlyTrpProCysAlaAlaMetLeuVal130135140CysAlaAlaTrpAlaLeuAlaLeuAlaAlaAlaPheProProValLeu145150155160AspGlyGlyGlyAspAspGluAspAlaProCysAlaLeuGluGinArg165170175ProAspGlyAlaProGlyAlaLeuGlyPheLeuLeuLeuLeuAlaVal180185190ValValGlyAlaThrHisLeuValTyrLeuArgLeuLeuPhePhelie195200205HisAspArgArgLysMetArgProAlaArgLeuValProAlaValSer210215220HisAspTrpThrPheHisGlyProGlyAlaThrGlyGinAlaAlaAla225230235240AsnTrpThrAlaGlyPheGlyArgGlyProThrProProAlaLeuVal245250255GlylieArgProAlaGlyProGlyArgGlyAlaArgArgLeuLeuVal260265270LeuGluGluPheLysThrGluLysArgLeuCysLysMetPheTyrAla275280285ValThrLeuLeuPheLeuLeuLeuTrpGlyProTyrValValAlaSer290295300TyrLeuArgValLeuValArgProGlyAlaValProGinAlaTyrLeu305310315320ThrAlaSerValTrpLeuThrPheAlaGinAlaGlylieAsnProVal325330335ValCysPheLeuPheAsnArgGluLeuArgAspCysPheArgAlaGin340345350PheProCysCysGinSerProArgThrThrGinAlaThrHisProCys355360365AspLeuLysGlylieGlyLeu370375(18)SEQIDNO:17的资料(i)序列特征(A)长度1002个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(x:L)SEQIDNO:17的序列描述ATGAACACCACAGTGATGCAAGGCTTCAACAGATCTGAGCGGTGCCCCAGAGACACTCGG60ATAGTACAGCTGGTATTCCCAGCCCTCTACACAGTGGTTTTCTTGACCGGCATCCTGCTG120AATACTTTGGCTCTGTGGGTGTTTGTTCACATCCCCAGCTCCTCCACCTTCATCATCTAC180CTCAAAAACACTTTGGTGGCCGACTTGATAATGACACTCATGCTTCCTTTCAAMTCCTC240TCTGACTCACACCTGGCACCCTGGCAGCTCAGAGCTTTTGTGTGTCGTTTTTCTTCGGTG300ATATTTTATGAGACCATGTATGTGGGCATCGTGCTGTTAGGGCTCATAGCCTTTGACAGA360TTCCTCAAGATCATCAGACCTTTGAGAMTATTTTTCTAAAAAAACCTGTTTTTGCAAAA420ACGGTCTCAATCTTCATCTGGTTCTTTTTGTTCTTCATCTCCCTGCCAAATACGATCTTG480AGCAACAAGGAAGCAACACCATCGTCTGTGAAAAAGTGTGCTTCCTTAAAGGGGCCTCTG540GGGCTGAAATGGCATCMATGGTAAATAACATCCTMTGCTTGTGTTTTATGTGGTTATTTCCAAAAGTAAGGACAGAAAAAACAACAMGCTGTCTTCTTTGTGTGTTTTGCTCCATTTCMACCMCAATAAGACTGACTGTAGACTGACTCTCTTTTTGGCAGCAACTAACATTTGTAAAAAATTCACAGMAAGCTACCATGTATGGAAAATCATAGCAGTCAGACAGACAACATA说明书第46/81页ATATGCCAGTTTATTTTCTGGACTGTTTTT600GCAMMAAGTATATGATTCTTATAGAAAG660AAGCTGGMGGCAAAGTATTTGTTGTCGTG720CATTTTGCCAGAGTTCCATATACTCACAGT780CAAAATCAACTGTTTATTGCTAAAGAAACA840ATGGATCCCTTAATATACATATTCTTATGT900CAAGGGAGAAAGACCACAGCATCAAGCCAA960ACCTTAGGCTGA1002(19)SEQIDNO:18的资料(i)序列特征(A)长度333个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:18的序歹U描述MetAsnThrThrValMetGinGlyPheAsnArgSerGluArgCysPro151015ArgAspThrArglieValGinLeuValPheProAlaLeuTyrThrVal202530ValPheLeuThrGlylieLeuLeuAsnThrLeuAlaLeuTrpValPhe354045ValHislieProSerSerSerThrPhelielieTyrLeuLysAsnThr505560LeuValAlaAspLeulieMetThrLeuMetLeuProPheLyslieLeu65707580SerAspSerHisLeuAlaProTrpGinLeuArgAlaPheValCysArg859095PheSerSerValliePheTyrGluThrMetTyrValGlylieValLeu100105110LeuGlyLeulieAlaPheAspArgPheLeuLyslielieArgProLeu115120125ArgAsnliePheLeuLysLysProValPheAlaLysThrValSerlie130135140PhelieTrpPhePheLeuPhePhelieSerLeuProAsnThrlieLeu14515015516048SerAsnLysGluAlaThrProSerSerValLysLysCysAlaSerLeu165170175LysGlyProLeuGlyLeuLysTrpHisGinMetValAsnAsnlieCys180185190GinPheliePheTrpThrValPhelieLeuMetLeuValPheTyrVal195200205VallieAlaLysLysValTyrAspSerTyrArgLysSerLysSerLys210215220AspArgLysAsnAsnLysLysLeuGluGlyLysValPheValValVal225230235240AlaValPhePheValCysPheAlaProPheHisPheAlaArgValPro245250255TyrThrHisSerGinThrAsnAsnLysThrAspCysArgLeuGinAsn260265270GinLeuPhelieAlaLysGluThrThrLeuPheLeuAlaAlaThrAsn275280285lieCysMetAspProLeulieTyrliePheLeuCysLysLysPheThr290295300GluLysLeuProCysMetGinGlyArgLysThrThrAlaSerSerGin305310315320GluAsnHisSerSerGinThrAspAsnlieThrLeuGly325330(20)SEQ工DNO:19的资料(i)序列特征(A)长度1122个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:19的序歹lj描述ATGGCCAACACTACCGGAGAGCCTGAGGAGGTGAGCGGCGCTCTGTCCCCACCGTCCGCA60TCAGCTTATGTGAAGCTGGTACTGCTGGGACTGATTATGTGCGTGAGCCTGGCGGGTAAC120GCCATCTTGTCCCTGCTGGTGCTCAAGGAGCGTGCCCTGCACMGGCTCCTTACTACTTC180CTGCTGGACCTGTGCCTGGCCGATGGCATACGCTCTGCCGTCTGCTTCCCCTTTGTGCTG240GCTTCTGTGCGCCACGGCTCTTCATGGACCTTCAGTGCACTCAGCTGCAAGATTGTGGCC300TTTATGGCCGTGCTCTTTTGCTTCCATGCGGCCTTCATGCTGTTCTGCATCAGCGTCACC360CGCTACATGGCCATCGCCCACCACCGCTTCGCGGCTGTCATCTGCATGGCCTGGACCCTGGACGTGGGCACCTACAAGTTTATTCGGGAGTTCAAGGCCAATGACACGCTGGGCTTCATGCATGCTGTCTACGGCAAGCTGCTCCTCTTCCAGATGGTGCCAGCCATCAGCCAGAACTGGGCTGCTGCCAACTGGATCGCCGGCTTTGGCATCCGGCAGAATGGGCATGCAGCCAGCCGGGAAAAGCAGCTGGGCCGCATGTTCTACGCGCCCTACATCGTGGCCTGCTACTGGCGAGTGTACCTGGCCACTGCTGTTTGGATGAGCTTCTTCCTGCTCAACAAGGACCTCAAGAAGTGCGGAGGTGCCCCGGCTCCCAGAGAACCCTAC说明书第48/81页TACGCCAAGCGCATGACACTCTGGACATGC420TCTGTGGCCATGGCCTTCCCACCTGTCTTT480GAGGACCAGTGCATCTTTGAGCATCGCTAC540CTTATGTTGGCTGTGCTCATGGCAGCTACC600GAGTATCGTCACCGCMGATGAAGCCAGTG660ACATTCCATGGTCCCGGGGCCACCGGCCAG720CGTGGGCCCATGCCACCAACCCTGCTGGGT780CGGCTACTGGGCATGGACGAGGTCAAGGGT840ATCACACTGCTCTTTCTGCTCCTCTGGTCA900TTTGTGAAAGCCTGTGCTGTGCCCCACCGC960GCCCAGGCTGCCGTCMCCCAATTGTCTGC1020CTGACCACTCACGCCCCCTGCTGGGGCACA1080TGTGTCATGTGA1122(21)SEQIDNO:20的资料(i)序列特征(A)长度373个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型DNA(基因组)(xi)SEQIDNO:20的序歹U描述MetAlaAsnThrThrGlyGluProGluGluValSerGlyAlaLeuSer151015ProProSerAlaSerAlaTyrValLysLeuValLeuLeuGlyLeulie202530MetCysValSerLeuAlaGlyAsnAlalieLeuSerLeuLeuValLeu354045LysGluArgAlaLeuHisLysAlaProTyrTyrPheLeuLeuAspLeu505560CysLeuAlaAspGlylieArgSerAlaValCysPheProPheValLeu65707580AlaSerValArgHisGlySerSerTrpThrPheSerAlaLeuSerCys859095LyslieValAlaPheMetAlaValLeuPheCysPheHisAlaAlaPhe100105110MetLeuPheCyslieSerValThrArgTyrMetAlalieAlaHisHis115120125说明书第49/81页ArgPheTyrAlaLysArgMetThrLeuTrpThrCysAlaAlaVallie130135140CysMetAlaTrpThrLeuSerValAlaMetAlaPheProProValPhe145150155160A印ValGlyThrTyrLysPhelieArgGluGluAspGinCysliePhe165170175GluHisArgTyrPheLysAlaAsnAspThrLeuGlyPheMetLeuMet180185190LeuAlaValLeuMetAlaAlaThrHisAlaValTyrGlyLysLeuLeu195200205LeuPheGluTyrArgHisArgLysMetLysProValGinMetValPro210215220AlalieSerGinAsnTrpThrPheHisGlyProGlyAlaThrGlyGin225230235240AlaAlaAlaAsnTrplieAlaGlyPheGlyArgGlyProMetProPro245250255ThrLeuLeuGlylieArgGinAsnGlyHisAlaAlaSerArgArgLeu260265270LeuGlyMetAspGluValLysGlyGluLysGinLeuGlyArgMetPhe275280285TyrAlalieThrLeuLeuPheLeuLeuLeuTrpSerProTyrlieVal290295300AlaCysTyrTrpArgValPheValLysAlaCysAlaValProHisArg305310315320TyrLeuAlaThrAlaValTrpMetSerPheAlaGinAlaAlaValAsn325330335ProlieValCysPheLeuLeuAsnLysAspLeuLysLysCysLeuThr340345350ThrHisAlaProCysTrpGlyThrGlyGlyAlaProAlaProArgGlu355360365ProTyrCysValMet370(22)SEQIDNO:21的资料(i)序列特征51(A)长度1053个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:21的序歹lJ描述ATGGCTTTGGAACAGAACCAGTCAACAGATTATTATTATGAGGAMATGAMTGAATGGC60ACTTATGACTACAGTCAATATGAATTGATCTGTATCAAAGAAGATGTCAGAGAATTTGCA120AAAGTTTTCCTCCCTGTATTCCTCACAATAGCTTTCGTCATTGGACTTGCAGGCAATTCC180ATGGTAGTGGCAATTTATGCCTATTACAAGAAACAGAGAACCAAMCAGATGTGTACATC240CTGAATTTGGCTGTAGCAGATTTACTCCTTCTATTCACTCTGCCTTTTTGGGCTGTTAAT300GCAGTTCATGGGTGGGTTTTAGGGAMATAATGTGCAAAATAACTTCAGCCTTGTACACA360CTAAACTTTGTCTCTGGAATGCAGTTTCTGGCTTGCATCAGCATAGACAGATATGTGGCA420GTAACTAATGTCCCCAGCCAATCAGGAGTGGGAMACCATGCTGGATCATCTGTTTCTGT480GTCTGGATGGCTGCCATCTTGCTGAGCATACCCCAGCTGGTTTTTTATACAGTAMTGAC540AATGCTAGGTGCATTCCCATTTTCCCCCGCTACCTAGGAACATCAATGAAAGCATTGATT600CAAATGCTAGAGATCTGCATTGGATTTGTAGTACCCTTTCTTATTATGGGGGTGTGCTAC660TTTATCACGGCAAGGACACTCATGMGATGCCAAACATTAMATATCTCGACCCCTAAAA720GTTCTGCTCACAGTCGTTATAGTTTTCATTGTCACTCAACTGCCTTATMCATTGTCAAG780TTCTGCCGAGCCATAGACATCATCTACTCCCTGATCACCAGCTGCAACATGAGCMACGC840ATGGACATCGCCATCCAAGTCACAGAAAGCATTGCACTCTTTCACAGCTGCCTCAACCCA900ATCCTTTATGTTTTTATGGGAGCATCTTTCAAAAACTACGTTATGAAAGTGGCCAAGAAA960TATGGGTCCTGGAGAAGACAGAGACAAAGTGTGGAGGAGTTTCCTTTTGATTCTGAGGGT1020CCTACAGAGCCAACCAGTACTTTTAGCATTTAA1053(23)SEQIDN〇:22的资料(i)序列特征(A)长度350个氨基酸(B)类型氨基酸(C)链型(D)拓扑学:不相关(ii)分子类型:蛋白质(xi)SEQIDNO:22的序列描述MetAlaLeuGluGinAsnGinSerThrAspTyrTyrTyrGluGlu151015AsnGluMetAsnGlyThrTyrAspTyrSerGinTyrGluLeulieCyslie202530LysGluAspValArgGluPheAlaLysValPheLeuProValPheLeu354045ThrlieAlaPheVallieGlyLeuAlaGlyAsnSerMetValValAla505560lieTyrAlaTyrTyrLysLysGinArgThrLysThrAspValTyrlie65707580LeuAsnLeuAlaValAlaAspLeuLeuLeuLeuPheThrLeuProPhe859095TrpAlaValAsnAlaValHisGlyTrpValLeuGlyLyslieMetCys100105110LyslieThrSerAlaLeuTyrThrLeuAsnPheValSerGlyMetGin115120125PheLeuAlaCyslieSerlieAspArgTyrValAlaValThrAsnVal130135140ProSerGinSerGlyVslGlyLysProCysTrplielieCysPheCys145150155160ValTrpMetAlaAlalieLeuLeuSerlieProGinLeuValPheTyr165170175ThrValAsnAspAsnAlaArgCyslieProliePheProArgTyrLeu180185190GlyThrSerMetLysAlaLeulieGinMetLeuGlulieCyslieGly195200205PheValValProPheLeulieMetGlyValCysTyrPhelieThrAla210215220ArgThrLeuMetLysMetProAsnlieLyslieSerArgProLeuLys225230235240ValLeuLeuThrValVallieValPhelieValThrGinLeuProTyr245250255AsnlieValLysPheCysArgAlalieAsplielieTyrSerLeulie260265270ThrSerCysAsnMetSerLysArgMetAsplieAlalieGinValThr275280285GluSerlieAlaLeuPheHisSerCysLeuAsnProlieLeuTyrVal290295300PheMetGlyAlaSerPheLysAsnTyrValMetLysValAlaLysLys305310315320TyrGlySerTrpArgArgGinArgGinSerValGluGluPheProPhe325330335AspSerGluGlyProThrGluProThrSerThr340345PheSerlie350(24)SEQIDNO:23的资料(i)序列特征(A)长度1116个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDN〇23的序列描述ATGCCAGGMACGCCACCCCAGTGACCACCACTGCCCCGTGGGCCTCCCTGGGCCTCTCC60GCCAAGACCTGCAACAACGTGTCCTTCGAAGAGAGCAGGATAGTCCTGGTCGTGGTGTAC120AGCGCGGTGTGCACGCTGGGGGTGCCGGCCAACTGCCTGACTGCGTGGCTGGCGCTGCTG180CAGGTACTGCAGGGCAACGTGCTGGCCGTCTACCTGCTCTGCCTGGCACTCTGCGAACTG240CTGTACACAGGCACGCTGCCACTCTGGGTCATCTATATCCGCAACCAGCACCGCTGGACC300CTAGGCCTGCTGGCCTCGAAGGTGACCGCCTACATCTTCTTCTGCAACATCTACGTCAGC360ATCCTCTTCCTGTGCTGCATCTCCTGCGACCGCTTCGTGGCCGTGGTGTACGCGCTGGAG420AGTCGGGGCCGCCGCCGCCGGAGGACCGCCATCCTCATCTCCGCCTGCATCTTCATCCTC480GTCGGGATCGTTCACTACCCGGTGTTCCAGACGGAAGACAAGGAGACCTGCTTTGACATG540CTGCAGATGGACAGCAGGATTGCCGGGTACTACTACGCCAGGTTCACCGTTGGCTTTGCC600ATCCCTCTCTCCATCATCGCCTTCACCAACCACCGGATTTTCAGGAGCATCAAGCAGAGC660ATGGGCTTAAGCGCTGCCCAGAAGGCCAAGGTGAAGCACTCGGCCATCGCGGTGGTTGTC720ATCTTCCTAGTCTGCTTCGCCCCGTACCACCTGGTTCTCCTCGTCAAAGCCGCTGCCTTT780TCCTACTACAGAGGAGACAGGAACGCCATGTGCGGCTTGGAGGAAAGGCTGTACACAGCC840TCTGTGGTGTTTCTGTGCCTGTCCACGGTGMCGGCGTGGCTGACCCCATTATCTACGTG900CTGGCCACGGACCATTCCCGCCAAGAAGTGTCCAGAATCCATAAGGGGTGGAAAGAGTGG960TCCATGAAGACAGACGTCACCAGGCTCACCCACAGCAGGGACACCGAGGAGCTGCAGTCG1020CCCGTGGCCCTTGCAGACCACTACACCTTCTCCAGGCCCGTGCACCCACCAGGGTCACCA1080TGCCCTGCAAAGAGGCTGATTGAGGAGTCCTGCTGA,1116(25)SEQIDNO:24的资料(i)序列特征(A)长度371个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(Xi)SEQIDNO:24的序歹'J描述MetProGlyAsnAlaThrProValThrThrThrAlaProTrpAlaSer151015LeuGlyLeuSerAlaLysThrCysAsnAsnValSerPheGluGluSer202530ArglieValLeuValValValTyrSerAlaValCysThrLeuGlyVal354045ProAlaAsnCysLeuThrAlaTrpLeuAlaLeuLeuGinValLeuGin505560GlyAsnValLeuAlaValTyrLeuLeuCysLeuAlaLeuCysGluLeu65707580LeuTyrThrGlyThrLeuProLeuTrpVallieTyrlieArgAsnGin859095HisArgTrpThrLeuGlyLeuLeuAlaSerLysValThrAlaTyrlie100105110PhePheCysAsnlieTyrValSerlieLeuPheLeuCysCyslieSer115120125CysAspArgPheValAlaValValTyrAlaLeuGluSerArgGlyArg130135140ArgArgArgArgThrAlalieLeulieSerAlaCysliePhelieLeu145150155160ValGlylieValHisTyrProValPheGinThrGluAspLysGluThr165170175CysPheAspMetLeuGinMetAspSerArglieAlaGlyTyrTyrTyr180185190AlaArgPheThrValGlyPheAlalieProLeuSerlielieAlaPhe195200205ThrAsnHisArgliePheArgSerlieLysGinSerMetGlyLeuSer210215220AlaAlaGinLysAlaLysValLysHisSerAlalieAlaValValVal225230235240liePheLeuValCysPheAlaProTyrHisLeuValLeuLeuValLys245250255AlaAlaAlaPheSerTyrTyrArgGlyAspArgAsnAlaMetCysGly260265270LeuGluGluArgLeuTyrThrAlaSerValValPheLeuCysLeuSer27528028555ThrValAsnGlyValAlaAspProlielieTyrValLeuAlaThrAsp290295300HisSerArgGinGluValSerArglieHisLysGlyTrpLysGluTrp305310315320SerMetLysThrAspValThrArgLeuThrHisSerArgAspThrGlu325330335GluLeuGinSerProValAlaLeuAlaAspHisTyrThrPheSerArg340345350ProValHisProProGlySerProCysProAlaLysArgLeulieGlu355360365GluSerCys370(26)SEQIDNO:25的资料(i)序列特征(A)长度1113个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:ATGGCGAACTATAGCCATGC25的序列描述AGCTGACAACATTTTGCAAATTTCTGAAACATCTCCATTTGATCTTTGCTGTCAAAAATGGGGGTTTTGTTTAGCTATCGGTGATCTGTAGGCACTTACTGCTAATGATTGTCTACCTCAGTAGCAGCAGGCCMTTGGCCAAAATGCAAAAAAGAATCATACCTGGTGGCTAACAGCTGTTCTCAAACAAGGTTACCAATGACTTCCTTTGCTAGTGAAGTTCAGATATGCTCTACCTGCCTGTTTCCACCCATCACCGTGGTGTGGACCATTCATTAGCCTTAGGATTAGCTGATATTTCAGCCAGAATAGCAGGATTACACCACAGGGCAGAATGTTCCTGTTATTGCTGTCTGGATGGGAGCTGAGGGGAACCTTAGGGTTTCATAAGATAAGACCCCTCAGATCTGACTTATGGGCACTGCTTTCCTTCTATACATCTGTCTGTGGGAGGAAGATTATGCTGCTTTTTCGTCCACCTGGACTTTTTGGAAGGGGTCAGAAGAAGGCTATATMTGGAGAGTTTTTGAGTTTTGCCGCGCTGTTTCCTGTGTTATAATAGGAGTCATTGCATAGAGGCAATTTGTTACTCTGACTTATGCTCTTCTAAGAGGCTGAGCCATGGCATCAATGCACCTCTTGCTCTCAGATCGAAGAACATGGTCCTGCCCACACCACCTATTGGTCTACTTTTCTGTGCAAGAGGGCCAAGCAGGAAAGCACAACCCTGAATCTCTCGCCGCGTGGTGGGCACCTTACTATCCCATTTGTGCAMGTGATGCATCAGTGTCCTTTTGGACTTCCCCCGGTTCCAACACCGTCCTCCTAGCAAATGAAGCCG紅CAGTGGCCACCTTGCTTAGACGAGTTTTCTAACCTTCTGTAGTACCTCAATCCTTTTTCTTTACTGTCTAACAGCCCAACCTCCTGCTTCCTGTTGGTTCAACTCTTGCCTTTCTGCACCAGATACGTGTCTGGCTTTTAGACGTGCTCCTTCAGGCACACAGCTTAGTCCAGTTTCCAGGCAGCTGGGCATCAGGCA嵐TGGAGGTGGGGCCCCAGGGGGATTTTGTCTGCATTCAGAAAATCC60120180240300360420480540600660720780840900卿102010801113(27)SEQIDNO:26的资料(i)序列特征(A)长度370个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:26的序歹l」描述MetAlaAsnTyrSerHisAlaAlaAspAsnlieLeuGinAsnLeuSer151015ProLeuThrAlaPheLeuLysLeuThrSerLeuGlyPhelielieGly202530ValSerValValGlyAsnLeuLeulieSerlieLeuLeuValLysAsp354045LysThrLeuHisArgAlaProTyrTyrPheLeuLeuAspLeuCysCys505560SerAsplieLeuArgSerAlalieCysPheProPheValPheAsnSer65707580ValLysAsnGlySerThrTrpThrTyrGlyThrLeuThrCysLysVal859095lieAlaPheLeuGlyValLeuSerCysPheHisThrAlaPheMetLeu100105110PheCyslieSerValThrArgTyrLeuAlalieAlaHisHisArgPhe115120125TyrThrLysArgLeuThrPheTrpThrCysLeuAlaVallieCysMet130135140ValTrpThrLeuSerValAlaMetAlaPheProProValLeuAspVal145150155160GlyThrTyrSerPhelieArgGluGluA印GinCysThrPheGinHis165170175ArgSerPheArgAlaAsnAspSerLeuGlyPheMetLeuLeuLeuAla180185190LeulieLeuLeuAlaThrGinLeuValTyrLeuLysLeuliePhePhe195200205ValHisAspArgArgLysMetLysProValGinPheValAlaAlaVal210215220SerGinAsnTrpThrPheHisGlyProGlyAlaSerGlyGinAlaAla225230235240AlaAsnTrpLeuAlaGlyPheGlyArgGlyProThrProProThrLeu245250255LeuGlylieArgGinAsnAlaAsnThrThrGlyArgArgArgLeuLeu260265270ValLeuAspGluPheLysMetGluLysArglieSerArgMetPheTyr275280285lieMetThrPheLeuPheLeuThrLeuTrpGlyProTyrLeuValAla290295300CysTyrTrpArgValPheAlaArgGlyProValValProGlyGlyPhe305310315320LeuThrAlaAlaValTrpMetSerPheAlaGinAlaGlylieAsnPro325330335PheValCysliePheSerAsnArgGluLeuArgArgCysPheSerThr340345350ThrLeuTyrCysArgLysSerArgLeuProArgGluProTyrCys355360365Vallie370(28)SEQIDNO:27的资料(i)序列特征(A)长度1080个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:27的序歹lj描述ATGCAGGTCCCGAACAGCACCGGCCCGGACMCGCGACGCTGCAGATGCTGCGGAACCCG60GCGATCGCGGTGGCCCTGCCCGTGGTGTACTCGCTGGTGGCGGCGGTCAGCATCCCGGGC120AACCTCTTCTCTCTGTGGGTGCTGTGCCGGCGCATGGGGCCCAGATCCCCGTCGGTCATC180TTCATGATCAACCTGAGCGTCACGGACCTGATGCTGGCCAGCGTGTTGCCTTTCCAAATC240TACTACCATTGCAACCGCCACCACTGGGTATTCGGGGTGCTGCTTTGCAACGTGGTGACC300GTGGCCTTTTACGCAMCATGTATTCCAGCATCCTCACCATGACCTGTATCAGCGTGGAG360CGCTTCCTGGGGGTCCTGTACCCGCTCAGCTCCAAGCGCTGGCGCCGCCGTCGTTACGCG420GTGGCCGCGTGTGCAGGGACCTGGCTGCTGCTCCTGACCGCCCTGTGCCCGCTGGCGCGC480ACCGATCTCACCTACCCGGTGCACGCCCTGGGCATCATCACCTGCTTCGACGTCCTCAAG540TGGACGATGCTCCCCAGCGTGGCCATGTGGGCCGTGTTCCTCTTCACCATCTTCATCCTG600CTGTTCCTCATCCCGTTCGTGATCACCGTGGCTTGTTACACGGCCACCATCCTCAAGCTG660TTGCGCACGGAGGAGGCGCACGGCCGGGAGCAGCGGAGGCGCGCGGTGGGCCTGGCCGCG720GTGGTCTTGCTGGCCTTTGTCACCTGCTTCGCCCCCAACAACTTCGTGCTCCTGGCGCAC780ATCGTGAGCCGCCTGTTCTACGGCAAGAGCTACTACCACGTGTACAAGCTCACGCTGTGT840CTCAGCTGCCTCAACAACTGTCTGGACCCGTTTGTTTATTACTTTGCGTCCCGGGAATTC900CAOCTGCGCCTGCGGGAATATTTCGGCTGCCGCCGGGTCCCCAGAGACACCCTGGACACG960CGCCGCGAGAGCCTCTTCTCCGCCAGGACCACGTCCGTGCGCTCCGAGGCCGGTGCGCAC1020CCTGAAGGGATGGAGGGAGCCACCAGGCCCGGCCTCCAGAGGCAGGAGAGTGTGTTCTGA1080(29)SEQIDNO:28的资料(i)序列特征(A)长度3SS个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:28的序歹U描述MetGinValProAsnSerThrGlyProAspAsnAlaThrLeuGinMet151015LeuArgAsnProAlalieAlaValAlaLeuProValValTyrSerLeu202530ValAlaAlaValSerlieProGlyAsnLeuPheSerLeuTrpValLeu354045CysArgArgMetGlyProArgSerProSerValliePheMetlieAsn505560LeuSerValThrAspLeuMetLeuAlaSerValLeuProPheGinlie65707580TyrTyrHisCysAsnArgHisHisTrpValPheGlyValLeuLeuCys859095AsnValValThrValAlaPheTyrAlaAsnMetTyrSerSerlieLeu100105110ThrMetThrCyslieSerValGluArgPheLeuGlyValLeuTyrPro115120125LeuSerSerLysArgTrpArgArgArgArgTyrAlaValAlaAlaCys130135140AlaGlyThrTrpLeuLeuLeuLeuThrAlaLeuCysProLeuAlaArg145150155160ThrAspLeuThrTyrProValHisAlaLeuGlylielieThrCysPhe165170175AspValLeuLysTrpThrMetLeuProSerValAlaMetTrpAlaVal180185190PheLeuPheThrliePhelieLeuLeuPhelieProPheVallie195200205ThrValAlaCysTyrThrAlaThrlieLeuLysLeuLeuArgThrGlu210215220GluAlaHisGlyArgGluGinArgArgArgAlaValGlyLeuAlaAla225230235240ValValLeuLeuAlaPheValThrCysPheAlaProAsnAsnPheVal245250255LeuLeuAlaHislieValSerArgLeuPheTyrGlyLysSerTyrTyr260265270HisValTyrLysLeuThrLeuCysLeuSerCysLeuAsnAsnCysLeu275280285AspProPheValTyrTyrPheAlaSerArgGluPheGinLeuArgLeu290295300ArgGluTyrLeuGlyCysArgArgValProArgAspThrLeuAspThr305310315320ArgArgGluSerLeuPheSerAlaArgThrThrSerValArgSerGlu325330335AlaGlyAlaHisProGluGlyMetGluGlyAlaThrArgProGlyLeu340345350GinArgGinGluSerValPhe355(30)SEQIDNO:29的资料(i)序列特征(A)长度1503个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形60(ii)分子类型:(xi)SEQIDNO:ATGGAGCGTCCCTGGGAGGADNA(基因组的)29的序列描述CCAGTCGCCGGCTGAGTGCCCGCTGGCCCGTCGGTTCAAGCGGCCCATGGTACAACTACAGACGCCGTGGTTGGTGCTCGACGTTGTCGGCTCACGCTGACTCACTGCGTCGCAGGGGGCTGGGGCGTGTCTGGACGCTTCTCGCCTTCGGTACGCGCCACGGGCGCGTCGCCTTTGTGGGCGCGCACCTTCACTTCTGACGCCTGGTCTGCGAGCGCGGAGCTTCAGCGACAGGCAGCCTGACCGGGGCGCGCGGGACCCAACCCCCTCGCCGCAGCGCGACAGTCGGGGCTCCGGCAAGCTTGTGCCTGGCGACGCCACCCATCTGCTGGCAACTGTCCCCCCGTGCTGAGCCGCGCCCGTCGCTGCTCCTGCTCCACTGTTGGGCATCCTACGCGCGGCGGCAAGCCGCGCATGTTGGGGGTCCTGTACTACCCCATCATGCTGCGGACGCTGAGGCTTCGCTCGGAGCGCCGGTGCACCCAGCCCAGGCCCGGAGGGGGCAGCTGAGGGCTCCGGTGCCGCGGCGAGTGGCACAGGCTGGGGGAGGGGGCAACTGCTGGCGACCGCCGGTGCCAGCTCCAGCCCCGCCCCCGGAGCGGCTGCGGGTGGCGCACGACCAGGGCGCAGACCGCTGCGGCCGGCGCCGGTGAGCGAGGTCATCCGCGGTGCGAGCTACCAGCCGGGTGCCGGGGTGTGCGCCTTCATCGTGCTAGAGAATCTGCGCTTCCACGCTCCCATGTTCCTGCTCCTAGGCGCCGCCTACGCCGCCAACATCCTACTCGCGCTCTGGTTCGCACGGGAGGGAGGCGTCCTCCTGGCCATCGCGCTGGAGCGCAGCCTCTCCAGTCGGGGGCGCACGCTGGCGATGGCCGGGCTCCTGCCAGCGCTGGGCTGGAATTGCTTGCCGCTCTACGCCMGGCCTACGTGCTGGCCGCGATCTGTGCACTCTACGCGCGCATCCTGCCGGCACGGCCCGGGACTGCGGGGACCTCTCTGGCCTTGCTGCGCACGCTCAGCGTCCCCCTCTTCCTGCTGCTGTTGCTCGACGTCCTGCAGGCCGATCCCTTCCTGGGACTGGCCTACACGCTCACCAACCGCGACCTGCGCCACCACTCCTGCGGCAGAGACCCGAGTGGCTCCGGGGGCCTGCGCCGCTGCCTGCCCCCGGGCTCATCGCCCCAGCGCGACGGGCTGGACACCACAGCCGCCCGGACTCTGGTATCAGAACCCTCGCCTGTG60GCAGCCATGG120CCCTTTGCGT180GTCCGCTCAC240TTGGGGCGCG300CGTCCTGCAT360CCTGCGCGCC420AGCCGTGTTG■GGGCAGCCTC540GTCGGGGCCG600CTTCGTGGCA660CACCATGGCG720AGCCGCGGCC780CCTGGGTCGC840CTTCTGCGTG900CTACTGCCAG960CACCTCGACC1020GGTGCTCCTG1080GGCGTGCCCG1140CATGGCCAAC1200CGCGCTCCTG1260CCAGCAGTCG1320CCTTGATGGG1380CAGCGGCTCC1440GGCTGCAGAC15001503(31)SEQIDNO:30的资料(i)序列特征(A)长度500个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ工DNO:30的序歹lJ描述MetGluArgProTrpGluAspSerProGlyProGluGlyAlaAlaGlu151015GlySerProValProValAlaAlaGlyAlaArgSerGlyAlaAlaAla202530SerGlyThrGlyTrpGinProTrpAlaGluCysProGlyProLysGly354045ArgGlyGinLeuLeuAlaThrAlaGlyProLeuArgArgTrpProAla505560ProSerProAlaSerSerSerProAlaProGlyAlaAlaSerAlaHis65707580SerValGinGlySerAlaThrAlaGlyGlyAlaArgProGlyArgArg859095ProTrpGlyAlaArgProMetGluSerGlyLeuLeuArgProAlaPro100105110ValSerGluVallieValLeuHisTyrAsnTyrThrGlyLysLeuArg115120125GlyAlaSerTyrGinProGlyAlaGlyLeuArgAlaAspAlaValVal130135140CysLeuAlaValCysAlaPhelieValLeuGluAsnLeuAlaValLeu145150155160LeuValLeuGlyArgHisProArgPheHisAlaProMetPheLeuLeu165170175LeuGlySerLeuThrLeuSerAspLeuLeuAlaGlyAlaAlaTyrAla180185190AlaAsnlieLeuLeuSerGlyProLeuThrLeuLysLeuSerProAla195200205LeuTrpPheAlaArgGluGlyGlyValPheValAlaLeuThrAlaSer210215220ValLeuSerLeuLeuAlalieAlaLeuGluArgSerLeuThrMetAla225230235240ArgArgGlyProAlaProValSerSerArgGlyArgThrLeuAlaMet245250255AlaAlaAlaAlaTrpGlyValSerLeuLeuLeuGlyLeuLeuProAla260265270LeuGlyTrpAsnCysLeuGlyArgLeuAspAlaCysSerThrValLeu275280285ProLeuTyrAlaLysAlaTyrValLeuPheCysValLeuAlaPheVal290295300GlylieLeuAlaAlalieCysAlaLeuTyrAlaArglieTyrCysGin305310315320ValArgAlaAsnAlaArgArgLeuProAlaArgProGlyThrAlaGly325330335ThrThrSerThrArgAlaArgArgLysProArgSerLeuAlaLeuLeu340345350ArgThrLeuSerValValLeuLeuAlaPheValAlaCysTrpGlyPro355360365LeuPheLeuLeuLeuLeuLeuAspValAlaCysProAlaArgThrCys370375380ProValLeuLeuGinAlaAspProPheLeuGlyLeuAlaMetAlaAsn385390395400SerLeuLeuAsnProlielieTyrThrLeuThrAsnArgAspLeuArg405410415HisAlaLeuLeuArgLeuValCysCysGlyArgHisSerCysGlyArg420425430AspProSerGlySerGinGinSerAlaSerAlaAlaGluAlaSerGly435柳445GlyLeuArgArgCysLeuProProGlyLeuAspGlySerPheSerGly450455460SerGluArgSerSerProGinArgAspGlyLeuAspThrSerGlySer465470475480ThrGlySerProGlyAlaProThrAlaAlaArgThrLeuValSerGlu485490495ProAlaAlaAsp500(32)SEQIDNO:31的资料(i)序列特征(A)长度1029个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:31的序歹lJ描述ATGCAAGCCGTCGACAATCTCACCTCTGCGCCTGGGAACACCAGTCTGTGCACCAGAGAC60TACAAAATCACCCAGGTCCTCTTCCCACTGCTCTACACTGTCCTGTTTTTTGTTGGACTT120ATCACAAATGGCCTGGCGATGAGGATTTTCTTTCAAATCCGGAGTAAATCAMCTTTATT180ATTTTTCTTAAGAACACAGTCATTTCTGATATTCTTAGTGATGCCAAACTGGGAACAGGATCCGTCATATTTTATTTCACAATGTATATCGATCGCTACCAGAAGACCACCAGGCCATTTGCTAAGATTCTCTCTGTTGTCATCTGGGCAATTCTGACCAACAGGCAGCCGAGAGACAAGGAGTTCGGTCTAGTCTGGCATGAAATAGTAAATTTCTTAATTGTTATTGTATGTTATACAGTMGAACGAGGGGTGTAGGTAMGTCCCCATCATTGCTGTATTCTTTATTTGTTTTGTTCTGAGCCAAACCCGGGATGTCTTTGACTGCGAGAGCACTCTGTGGTTAACTTCCTTAAATCTTTGCAAGTCCTTCAGAAATTCCTTGATATCTCTGTCCCAGGACAATAGGAAAAAAGAACCAATGTAACTTCTCATGATTCTGACTTTTCCATTCMA240CCACTGAGAACTTTTGTGTGTCAAGTTACC300AGTATTTCATTCCTGGGACTGATAACTATC360MAACATCCAACCCCAAAAATCTCTTGGGG420TTCATGTTCTTACTCTCTTTGCCTAACATG480AATGTGMGAAATGCTCTTTCCTTAAATCA540AATTACATCTGTCAAGTCATTTTCTGGATT600CTCATTACAAAAGAACTGTACCGGTCATAC660AGGAAMAGGTGMCGTCMAGTTTTCATT720CCTTTCCATTTTGCCCGAATTCCTTACACC780ACTGCTGAAAATACTCTGTTCTATGTGAAA840GCATGCCTGGATCCGTTCATCTATTTTTTC900AGTATGCTGAAGTGCCCCAATTCTGCAACA960CAGGATGGTGGTGACCCAAATGAAGAGACT10201029(33)SEQIDNO:32的资料(i)序列特征(A)长度342个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ工DNO:32的序歹[l描述MetGinAlaValAspAsnLeuThrSerAlaProGlyAsnThrSerLeu151015CysThrArgAspTyrLyslieThrGinValLeuPheProLeuLeuTyr202530ThrValLeuPhePheValGlyLeulieThrAsnGlyLeuAlaMetArg354045liePhePheGinlieArgSerLysSerAsnPhelieliePheLeuLys505560AsnThrVallieSerAspLeuLeuMetlieLeuThrPheProPheLys65707580lieLeuSerAspAlaLysLeuGlyThrGlyProLeuArgThrPheVal859095CysGinValThrSerValliePheTyrPheThrMetTyrlieSerlie100105110SerPheLeuGlyLeulieThrlieAspArgTyrGinLysThrThrArg115120125ProPheLysThrSerAsnProLysAsnLeuLeuGlyAlaLyslieLeu130135140SerValVallieTrpAlaPheMetPheLeuLeuSerLeuProAsnMet145150155160lieLeuThrAsnArgGinProArgAspLysAsnValLysLysCysSer165170175PheLeuLysSerGluPheGlyLeuValTrpHisGlulieValAsnTyr180185190lieCysGinValliePheTrplieAsnPheLeulieVallieValCys195200205TyrThrLeulieThrLysGluLeuTyrArgSerTyrValArgThrArg210215220GlyValGlyLysValProArgLysLysValAsnValLysValPhelie225230235240lielieAlaValPhePhelieCysPheValProPheHisPheAlaArg245250255lieProTyrThrLeuSerGinThrArgAspValPheAspCysThrAla260265270GluAsnThrLeuPheTyrValLysGluSerThrLeuTrpLeuThrSer275280285LeuAsnAlaCysLeuAspProPhelieTyrPhePheLeuCysLysSer290295300PheArgAsnSerLeulieSerMetLeuLysCysProAsnSerAlaThr305310315320SerLeuSerGinAspAsnArgLysLysGluGinAspGlyGlyAspPro325330335AsnGluGluThrProMet34034)SEQIDNO:33的资料(i)序列特征(A〉长度1077个碱基对(B)类型核酸(C〉链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi),SEQIDNO:33的序列描述ATGTCGGTCTGCTACCGTCCCCCAGGGAACGAGACACTGCTGAGCTGGAAGACTTCGCGG60GCCACAGGCACAGCCTTCCTGCTGCTGGCGGCGCTGCTGGGGCTGCCTGGCAACGGCTTC咖GTGGTGTGGAGCTTGGCGGGCTGGCGGCCTGCACGGGGGCGACCGCTGGCGGCCACGCTT180GTGCTGCACCTGGCGCTGGCCGACGGCGCGGTGCTGCTGCTCACGCCGCTCTTTGTGGCC240TTCCTGACCCGGCAGGCCTGGCCGCTGGGCCAGGCGGGCTGCAAGGCGGTGTACTACGTG300TGCGCGCTCAGCATGTACGCCAGCGTGCTGCTCACCGGCCTGCTCAGCCTGCAGCGCTGC360CTCGCAGTCACCCGCCCCTTCCTGGCGCCTCGGCTGCGCAGCCCGGCCCTGGCCCGCCGC420CTGCTGCTGGCGGTCTGGCTGGCCGCCCTGTTGCTCGCCGTCCCGGCCGCCGTCTACCGC480CACCTGTGGAGGGACCGCGTATGCCAGCTGTGCCACCCGTCGCCGGTCCACGCCGCCGCC540CACCTGAGCCTGGAGACTCTGACCGCTTTCGTGCTTCCTTTCGGGCTGATGCTCGGCTGC600TACAGCGTGACGCTGGCACGGCTGCGGGGCGCCCGCTGGGGCTCCGGGCGGCACGGGGCG660CGGGTGGGCCGGCTGGTGAGCGCCATCGTGCTTGCCTTCGGCTTGCTCTGGGCCCCCTAC720CACGCAGTCAACCTTCTGCAGGCGGTCGCAGCGCTGGCTCCACCGGAAGGGGCCTTGGCG780AAGCTGGGCGGAGCCGGCCAGGCGGCGCGAGCGGGAACTACGGCCTTGGCCTTCTTCAGT840TCTAGCGTCAACCCGGTGCTCTACGTCTTCACCGCTGGAGATCTGCTGCCCCGGGCAGGT900CCCCGTTTCCTCACGCGGCTCTTCGAAGGCTCTGGGGAGGCCCGAGGGGGCGGCCGCTCT960AGGGAAGGGACCATGGAGCTCCGAACTACCCCTCAGCTGAAAGTGGTGGGGCAGGGCCGC1020GGCAATGGAGACCCGGGGGGTGGGATGGAGAAGGACGCTCCGGAATGGGACCTTTGA1077(35)SEQIDNO:34的资料(i)序列特征(A)长度358个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:34的序歹U描述MetSerValCysTyrArgProProGlyAsn1510LysThrSerArgAlaThrGlyThrAlaPhe2025LeuGlyLeuProGlyAsnGlyPheValVal3540ArgProAlaArgGlyArgProLeuAlaAla5055AlaLeuAlaAspGlyAlaValLeuLeuCeu6570PheLeuThrArgGinAlaTrpProLeuGly8590GluThrLeuLeuSerTrp15LeuLeuLeuAlaAlaLeu30TrpSerLeuAlaGlyTrp45ThrLeuValLeuHisLeu60ThrProLeuPheValAla7580GinAlaGlyCysLysAla95ValTyrTyrValCysAlaLeuSerMetTyrAlaSerValLeuLeuThr100105110GlyLeuLeuSerLeuGinArgCysLeuAlaValThrArgProPheLeu115120125AlaProArgLeuArgSerProAlaLeuAlaArgArgLeuLeuLeuAla130135140ValTrpLeuAlaAlaLeuLeuLeuAlaValProAlaAlaValTyrArg145150155160HisLeuTrpArgAspArgValCysGinLeuCysHisProSerProVal165170175HisAlaAlaAlaHisLeuSerLeuGluThrLeuThrAlaPheValLeu180185190ProPheGlyLeuMetLeuGlyCysTyrSerValThrLeuAlaArgLeu195200205ArgGlyAlaArgTrpGlySerGlyArgHisGlyAlaArgValGlyArg210215220LeuValSerAlalieValLeuAlaPheGlyLeuLeuTrpAlaProTyr225230235240HisAlaValAsnLeuLeuGinAlaValAlaAlaLeuAlaProProGlu245250255GlyAlaLeuAlaLysLeuGlyGlyAlaGlyGinAlaAlaArgAlaGly260265270ThrThrAlaLeuAlaPhePheSerSerSerValAsnProValLeuTyr275280285ValPheThrAlaGlyAspLeuLeuProArgAlaGlyProArgPheLeu290295300ThrArgLeuPheGluGlySerGlyGluAlaArgGlyGlyGlyArgSer305310315320ArgGluGlyThrMetGluLeuArgThrThrProGinLeuLysValVal325330335GlyGinGlyArgGlyAsnGlyA印ProGlyGlyGlyMetGluLysAsp340345350GlyProGluTrpAspLeu35567(3S)SEQIDNO:35的资料(i)序列特征(A)长度1005个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:35的序列描述:ATGCTGGGGACTGGAAAAGTAATACCATTGTATCTCTTTAAGGAGTTATGGTGCTTCATGTACTTGATMTTAATCTCCTATAAATCCTGCCCAACTACATTTGTGATGTGTTGCTACTGTTCTCTGTGCGGGAGTTGGACGGCCTTTGGCACTTCAGGGAGCAGATGGGTCATGGCATGACTACCTTTCTTGTTTACGGACCTCTCTGTCCAATGGAAACCAACCTCTATTAAGTATCCTGGCCATTTGTTATAACTGAACCTCATTTAGTTTCTTTTACTCTGCCCCTTTTTTACACCAGCAGTATCACCTTTCTGAAACATGCTGATCTCATGAACTGAATGCAACTCATTTTTTATCTACATCTTCCTCTGACTTACTGGATATATTACCAGCATTTTTCCGAGAAGGTTTTAGTACAATGGCACCCAGCATGTGTTTACAAGATTTGAAMGCCTCTATCACGTCGTGCACTCAGCAGTGTCATCGAATCAACTGCCTACTTTCATGCAAAAACTGGGATTGAGTTCTCTGAAGAGCTTTTCTGTGGAGACGTGCCTCTTTCTCACACCTTCTGCACCTTAGAGTACCTGTAATGCTAACACTGTGCTCTCTTCCCTCAACTTGGATGCGGAATGGTCGTCATCAAACCCTGTCTAGACACAACTTTCAGAGAAAGGCTGGCAGCTCGTTGTGGGACTGGAACAGGCACCCTCCCTCTGCATMGCTTTTATCAGA嵐GAAAGATACTACCCATATTTTGCAAGTGGGGTTCCTTAAAGCAGAGTCATCATGGCTGAGGATCGCACTCCTTTTATCTATTTTCTTCAAATCCCTAGTGAAGAGGCTGCCAGTCCTTGGACAGTAATATTCATGCTGATACAACCGATATCATAGATCGAGTTTGCTATTACTTCCCCTTTTCTGGAGACTATTCCTCTTGAATAGGCAGAGTGGTAATCTTCACGCCTGCATTGTGACATTTGGGAGATTACATCCTTT601201802403003604204805406006607207808409009601005(37)SEQ工DNO:36的资料(i)序列特征(A)长度334个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii〉分子类型蛋白质(xi)SEQIDNO:36的序列描述GlylieMetAlaTrpAsnAlaThrCysMetLeu1510LysAsnTrpLeuAla15AlaGluAlaAlaLeuGluLysTyrTyrLeuSerliePheTyrGlylie202530GluPheValValGlyValLeuGlyAsnThrlieValValTyrGlyTyr354045liePheSerLeuLysAsnTrpAsnSerSerAsnlieTyrLeuPheAsn505560LeuSerValSerAspLeuAlaPheLeuCysThrLeuProMetLeulie65707580ArgSerTyrAlaAsnGlyAsnTrplieTyrGlyAspValLeuCyslie859095SerAsnArgTyrValLeuHisAlaAsnLeuTyrThrSerlieLeuPhe100105110LeuThrPhelieSerlieAspArgTyrLeulielieLysTyrProPhe115120125ArgGluHisLeuLeuGinLysLysGluPheAlalieLeulieSerLeu130135140AlalieTrpValLeuValThrLeuGluLeuLeuProlieLeuProLeu145150155160lieAsnProVallieThrAspAsnGlyThrThrCysAsnAspPheAla165170175SerSerGlyAspProAsnTyrAsnLeulieTyrSerMetCysLeuThr180185190LeuLeuGlyPheLeulieProLeuPheValMetCysPhePheTyrTyr195200205LyslieAlaLeuPheLeuLysGinArgAsnArgGinValAlaThrAla210215220LeuProLeuGluLysProLeuAsnLeuVallieMetAlaValVallie225230235240PheSerValLeuPheThrProTyrHisValMetArgAsnValArglie245250255AlaSerArgLeuGlySerTrpLysGinTyrGinCysThrGinValVal260265270lieAsnSerPheTyrlieValThrArgProLeuAlaPheLeuAsnSer275280285VallieAsnProValPheTyrPheLeuLeuGlyAspHisPheArgAsp290295300MetLeuMetAsnGinLeuArgHisAsnPheLysSerLeuThrSerPhe305310315320SerArgTrpAlaHisGluLeuLeuLeuSerPheArgGluLys325330(38)SEQIDNO(i)序列特征(A)长度(B)类型(C)链型(D)拓扑学37的资料1296个碱基对核酸单链:线形(ii)分子类型DNA(基因组的)ATGCAGGCGCACGCGGGAGCCCGGGACGCGTTTGGCMTGMCATCTTTAGTCACCATGCGTGCCATTTGGTGGAAAGGCAGGGCTTTCATGGCACGTGCTGCTTAGAAGATCCTCTTCCCTTTGGATAAATGTCCAMACTCTTTGCTGTTTGAAAAGGGGATTTTCCAAAAAATGTTTAGGCATGGAAAATCCAGTGGTGTGAACAGACTGGCTGAGASEQIDNO:TTAACATTACAGTTCATCGCCCAAGCTGGCCTCTGGTGTTTCTGCTCCTTTCCAGAACATTCCAGTCTACACCAGGGACTCAATGCTAGGMCAACTTGAAGTGGACCAGTCCTGCCTCTAGAAAAGAGTTAGCCAGGAATGTGCTGGGCAATATGATGAACTCCATCTGTGTCTGCAGTATTCAGGAATAGGAAACCAACAGAGG歸AATTCTCCTTT37的序列描述CCCGGAGCAGTTCTCTCGGCTCTGTACCGGCCTCGTGCTCCTACGTGGTGGGCGCTCAGTTTCCGACAACCGCTGTTGTGTGTGCATCCTTGTGGTCTGGGATCAAATATCCCTGTGCACTATGGTGATGTGGGGATGGTGAAGAAACGAACCATTCCATTGTCACAATCTAATCCCATTTTGTTATTGCTACMTGATGAGGAGAAGCAG磁AAGCTCAGACAGTGGGCTGCGACCGCACCGGCGTGCACCCGCAGCAGACCTGCTCATGGCTGGGGGACAGAAATGCTTTAAMTGACTGGTGGCAGGACTTCCTATCAGAAGATCTCTTATTCTGTTCAGTGCTTCGCTGTCATTAGTTGTCCATAAAGATGATTTGTCTATGCATATAGTMATACGGAAGAAAGTTCAGTGATGMACGACATCCATTAATGCTGCGGGATCGTCTACACTCATCTTCGCAGGCCATGCGTCACCTTCTTGTGCTTTCATTCACTATGACAGTGGCAATATCATCGTAGGATGAAAAGGAACACCACCTTACAGTAAAATGAACTATTCATGATGGTGACTGATGATTGATTGCTATCGTTTATGAATGAAAACCTTCTCCAAAGTTTTCGCAACATTGATTGCTCTCTTCCACAACCTGCCCAGAGCTGCCTGGCGCTCCACCGTCACCCTGCATTCCCTTGCAAGATGCTGCATTGCTCACCAACCGAATCACCCATGACACATCTGCCATCCTTGTCTGGTTATGAATGGAAAAGAAAGTGGTGGCTATACAGTAATGCAAATTATTAAACTTCAAATCCAGCACAACCTCAGAGAGAGTCAAATTGTAGGTCTGAA60120180240300360420480540600660720780840900960102010801140120012601296(39)SEQIDNO:38的资料(i)序列特征(A)长度431个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQIDNO:38的序列描述70MetGinAlaLeuAsnlieThrProGluGinPheSerArgLeuLeuArg151015AspHisAsnLeuThrArgGluGinPhelieAlaLeuTyrArgLeuArg202530ProLeuValTyrThrProGluLeuProGlyArgAlaLysLeuAlaLeu354045ValLeuThrGlyValLeuliePheAlaLeuAlaLeuPheGlyAsnAla505560LeuValPheTyrValValThrArgSerLysAlaMetArgThrValThr65707580AsnliePhelieCysSerLeuAlaLeuSerAspLeuLeulieThrPhe859095PheCyslieProValThrMetLeuGinAsnlieSerAspAsnTrpLeu100105110GlyGlyAlaPhelieCysLysMetValProPheValGinSerThrAla115120125ValValThrGluMetLeuThrMetThrCyslieAlaValGluArgHis130135140GinGlyLeuValHisProPheLysMetLysTrpGinTyrThrAsnArg145150155160ArgAlaPheThrMetLeuGlyValValTrpLeuValAlaVallieVal165170175GlySerProMetTrpHisValGinGinLeuGlulieLysTyrAspPhe180185190LeuTyrGluLysGluHislieCysCysLeuGluGluTrpThrSerPro195200205ValHisGinLyslieTyrThrThrPhelieLeuVallieLeuPheLeu210215220LeuProLeuMetValMetLeulieLeuTyrSerLyslieGlyTyrGlu225230235240LeuTrplieLysLysArgValGlyAspGlySerValLeuArgThrlie245250255HisGlyLysGluMetSerLyslieAlaArgLysLysLysArgAlaVal260265270lieMetMetValThrValValAlaLeuPheAlaValCysTrpAlaPro275280285PheHisValValHisMetMetlieGluTyrSerAsnPheGluLysGlu290295300TyrAspAspValThrlieLysMetliePheAlalieValGinlielie305310315320GlyPheSerAsnSerlieCysAsnProlieValTyrAlaPheMetAsn325330335GluAsnPheLysLysAsnValLeuSerAlaValCysTyrCyslieVal340345350AsnLysThrPheSerProAlaGinArgHisGlyAsnSerGlylieThr355360365MetMetArgLysLysAlaLysPheSerLeuArgGluAsnProValGlu370375380GluThrLysGlyGluAlaPheSerAspGlyAsnlieGluValLysLeu385390395400CysGluGinThrGluGluLysLysLysLeuLysArgHisLeuAlaLeu405410415PheArgSerGluLeuAlaGluAsnSerProLeuAspSerGlyHis420425430(40)SEQIDNO:39的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:39的序歹!j描述CTGTGTACAGCAGTTCGCAGAGTG24(41)SEQIDNO:40的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:40的序歹lJ描述GAGTGCCAGGCAGAGCAGGTAGAC(42)SEQIDNO:41的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:41的序歹lJ描述CCCGAATTCCTGCTTGCTCCCAGCTTGGCCC(43)SEQIDNO:42的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ工DNO:42的序歹U描述TGTGGATCCTGCTGTCAAAGGTCCCATTCCGG(44)SEQIDNO:43的资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:43的序歹U描述TCACAATGCTAGGTGTGGTC20(45)SEQIDNO:44的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(Xi)SEQIDNO:44的序歹lj描述TGCATAGACAATGGGATTACAG22(46)SEQ工DNO:45的资料(i)序列特征(A)长度511个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQIDNO:45的序歹U描述TCACAATGCTAGGTGTGGTCTGGCTGGTGGCAGTCATCGTAGGATCACCCATGTGGCACG60TGCAACAACTTGAGATCAAATATGACTTCCTATATGAAAAGGAACACATCTGCTGCTTAG120AAGAGTGGACCAGCCCTGTGCACCAGAAGATCTACACCACCTTCATCCTTGTCATCCTCT180TCCTCCTGCCTCTTATGGTGATGCTTATTCTGTACGTAAAATTGGTTATGAACTTTGGAT240AAAGAAAAGAGTTGGGGATGGTTCAGTGCTTCGAACTATTCATGGAAAAGAAATGTCCAA300AATAGCCAGGAAGAAGAAACGAGCTGTCATTATGATGGTGACAGTGGTGGCTCTCTTTGC360TGTGTGCTGGGCACCATTCCATGTTGTCCATATGATGATTGAATACAGTAATTTTGAAAA420GGAATATGATGATGTCACAATCAAGATGATTTTTGCTATCGTGCAAATTATTGGATTTTC480CAACTCCATCTGTAATCCCATTGTCTATGCA511(47〉SEQIDNO:46的资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:46的序列描述CTCCTTAGAAGAGTGGACCAG(48)SEQIDNO:47的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:47的序歹U描述CTGTGCACCAGAAGATCTACAC(49)SEQ工DNO:48的资料U)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:48的序歹lJ描述CAAGGATGAAGGTGGTGTAGA(50)SEQIDNO:49的资料(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:49的序歹U描述GTGTAGATCTTCTGGTGCACAGG23(51)SEQIDNO:50的资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi〉SEQ工DNO:50的序歹!j描述GCAATGCAGGTCATAGTGAGC21(52)SEQIDNO:51的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iii)推定的是(iv)反义是(xi)SEQIDNO:51的序列描述TGGAGCATGGTGACGGGAATGCAGAAG27(53)SEQIDNO:52的资料U)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:52的序列描述GTGATGAGCAGGTCACTGAGCGCCAAG27(54)SEQIDNO:53的资料(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:53的序列描述GCAATGCAGGCGCTTAACATTAC23(55)SEQIDNO:54的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:54的序歹U描述TTGGGTTACAATCTGAAGGGCA22(56)SEQIDNO:55的资料(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:55的序歹lJ描述ACTCCGTGTCCAGCAGGACTCTG23(57)SEQ工DNO:56的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是<xi)SEQIDNO:56的序列描述TGCGTGTTCCTGGACCCTCACGTG(58)SEQIDNO:57的资料(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:57的序歹'J描述CAGGCCTTGGATTTTAATGTCAGGGATGG(59)SEQIDNO:58的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi〉SEQIDNO:58的序列描述GGAGAGTCAGCTCTGAAAGAATTCAGG(60)SEQIDNO:59的资料.(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(Xi)SEQIDNO:59的序列描述TGATGTGATGCCAGATACTAATAGCAC(61)SEQIDNO:60的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D〉拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:60的序列描述CCTGATTCATTTAGGTGAGATTGAGAC(62)SEQIDNO:61的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(Xi)SEQIDNO:61的序歹lJ描述GACAGGTACCTTGCCATCAAG(63)SEQIDNO:62的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:62的序歹U描述CTGCACAATGCCAGTGATAAGG(64)SEQIDNO:63的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(Xi)SEQIDNO:63的序歹ll描述CTGACTTCTTGTTCCTGGCAGCAGCGG(65)SEQIDNO:64的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:64的序列描述AGACCAGCCAGGGCACGCTGAAGAGTG(66)SEQIDNO:65的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:65的序列描述GATCMGCTTCCATCCTACTGAAACCATGGTC(67)SEQIDNO:66的资料(i)序列特征(A)长度35个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:66的序歹lj描述GATCAGATCTCAGTTCCAATATTCACACCACCGTC(68)SEQIDNO:67的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(i幻分子类型DNA(基因组的)(iv)反义否(xi)SEQ工DNO:67的序歹(J描述CTGGTGTGCTCCATGGCATCCC(69)SEQ工DNO:68的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:68的序歹U描述GTAAGCCTCCCAGAACGAGAGG(70)SEQIDNO:69的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:69的序歹U描述CAGCGCAGGGTGAAGCCTGAGAGC(71)SEQIDNO:70的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQIDNO:70的序歹!j描述GGCACCTGCTGTGACCTGTGCAGG(72)SEQIDNO:71的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:71的序歹ll描述GTCCTGCCACTTCGAGACATGG(73)SEQIDNO:72的资料(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组)(iv)反义是(xi)SEQIDNO:72的序歹!j描述GAAACTTCTCTGCCCTTACCGTC(74)SEQIDNO:73的资料(i)序列特征(A)长度2S个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQIDNO:73的序列描述CCAACACCAGCATCCATGGCATCAAG2326(75)SEQIDNO:74的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组)(iv)反义是(xi)SEQIDNO:74的序列描述GGAGAGTCAGCTCTGAAAGAATTCAGG278权利要求1.编码人G蛋白偶联受体的cDNA,其包含SEQ.ID.NO.7。2.由SEQ.ID.NO.:7所示的cDNA编码的人G蛋白偶联受体,其包含SEQ.ID.NO.:8。3.含有载体和SEQ.ID.NO.:7所示的cDNA的质粒。4.含有权利要求3所述的质粒的宿主细胞。全文摘要本申请是“与人G蛋白偶联的孤儿受体”。本专利申请文件所公开的发明涉及跨膜受体;具体地讲,涉及与人内源G蛋白偶联的孤儿受体。本发明公开了编码人G蛋白偶联受体的cDNA,及其表达质粒和细胞。文档编号C07K14/705GK101597608SQ200910133518公开日2009年12月9日申请日期1999年10月13日优先权日1998年11月20日发明者陈若平申请人:阿瑞那制药公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1