非内源的被组成型活化的人g蛋白偶联的受体的制作方法

文档序号:3551615阅读:1097来源:国知局
专利名称:非内源的被组成型活化的人g蛋白偶联的受体的制作方法
本专利申请是于1998年10月13日提交到美国专利商标局序号为09/170,496的美国专利申请的部分继续申请,本申请还要求下列以美国快件方式在所标日期提交给美国专利商标局的各临时申请的优先权1998年11月27日提交的美国临时申请60/110,060;1999年2月16日提交的美国临时申请60/120,416;1999年2月26日提交的并要求1998年11月20日提交的美国临时申请60/109,213的优先权的美国临时申请No.60/121,852;1999年3月12日提交的美国临时申请60/123,944;1999年3月12日提交的美国临时申请60/123,945;1999年3月12日提交的美国临时申请60/123,948;1999年3月12日提交的美国临时申请60/123,951;1999年3月12日提交的美国临时申请60/123,946;1999年3月12日提交的美国临时申请60/123,949;1999年9月3日提交的并要求1999年8月27日提交的美国临时申请60/151,114和1998年11月12日提交的美国临时申请60/108,029的优先权的美国临时申请60/152,524;1999年5月28日提交的美国临时申请60/136,436;1999年5月28日提交的美国临时申请60/136,439;1999年5月28日提交的美国临时申请60/136,567;1999年5月28日提交的美国临时申请60/137,127;1999年5月28日提交的美国临时申请60/137,131;1999年6月29日提交并要求1999年5月28日提交的美国临时申请60/136,437的优先权的美国临时申请60/141,448;1999年9月29日提交的美国临时申请60/156,633;1999年9月29日提交的美国临时申请60/156,555;1999年9月29日提交的美国临时申请60/156,634;1999年9月29日提交的美国临时申请No.---(阿瑞那制药公司(ArenaPharmaceuticals,Inc.)的卷宗号为CHN10-1);1999年10月1日提交的美国临时申请No.---(阿瑞那制药公司卷号RUP6-1);1999年10月1日提交的美国临时申请No.---(阿瑞那制药公司卷号RUP7-1);1999年10月1日提交的美国临时申请No.---(阿瑞那制药公司卷号CHN6-1);1999年10月1日提交的美国临时申请No.---(阿瑞那制药公司卷号RUP5-1)和1999年10月1日提交的美国临时申请(阿瑞那制药公司卷号CHN9-1)。本申请还涉及未决的1999年10月12日提交的美国专利中请No.---(Woodcock,Wash burn,Kurtz,Makiewicz & Norris,LLP公司的卷号AREN-0050)(通过美国快件寄交)和1999年7月30日提交的美国专利申请No.09/364,425,两者均引入本文做参考。本申请还要求1999年10月12日提交的美国专利申请No.-(Woodcock,Wash burn,Kurtz,Makiewicz & Norris,LLP公司的卷号AREN-0054)(通过美国快件寄交)的优先权,上述两申请均全文引入本申请做参考。前面的每个申请全文引入本申请做参考。
GPCR都具有一个相同的基元(motif)。所有这些受体具有七个由22到24个疏水氨基酸组成的序列,它们组成七个α螺旋,每个α螺旋都跨过膜(每个跨度都以数字表示,例如,跨膜-1(TM-1)、跨膜-2(TM-2)等)。跨膜螺旋通过氨基酸链连接,在细胞膜的外部即“细胞外”一边的氨基酸链分别在跨膜-2和跨膜-3、跨膜-4和跨膜-5、跨膜-6和跨膜-7之间(这些分别被称为“细胞外”区1、2和3(EC-1、EC-2和EC-3))。在细胞膜内部即“细胞内”一边,跨膜螺旋也通过氨基酸链进行连接,这些氨基酸链分别在跨膜-1和跨膜-2、跨膜-3和跨膜-4、跨膜-5和跨膜-6之间(这些分别被称为“细胞内”区1、2和3(IC-1、IC-2和IC-3))。受体的“羧基”(“C”)端是在细胞内的区域,受体的“氨基”(“N”)端在细胞外的区域。
一般来说,当内源配体与受体结合时(经常被称为受体的“活化”),细胞内区域的构象发生变化,以容许细胞内区域和细胞内“G-蛋白”进行偶联。据报道,GPCR对于G蛋白而言是“混杂的”,也就是说,可与不只一个G蛋白相互作用。参见,Kenakin,T.,43,生活科学(LifeSciences)1095(1988)。尽管存在其他G蛋白,但当前已被识别的G-蛋白是Gq、Gs、Gi、Gz和Go。内源配体活化的GPCR与G-蛋白的偶联引发一个信号级联过程(被称为“信号传导”)。在通常情形下,信号传导最终导致细胞活化或细胞抑制。据认为,受体的IC-3环与羧基端都和G蛋白相互作用。
在生理条件下,GPCR存在于细胞膜上,并在“非活化”状态和“活化”状态这两种不同构象之间保持平衡。在非活性状态下的受体不能与细胞内信号传导途径相偶联以产生生物学反应。受体构象向活性状态的转变就使它与传导途径相偶联(通过G-蛋白)并产生生物学反应。
受体可被内源配体或药物等化合物稳定在活性状态。近来的发现提供了除内源配体或药物之外能够促进和稳定受体到活性状态构象的方法,这包括但不限于对受体的氨基酸序列的修饰。这些方法通过模仿与受体结合的内源配体的作用来有效地稳定活性状态的受体。通过如此的配体非依赖性方法形成的稳定被称为“组成型受体活化”。
发明概述这里公开的是内源人GPCR的非内源形式及其应用。
图2是表示与内源TDAG8结合的ATP和ADP的结果(2A)以及在有血清和无血清培养基中结果的比较(2B)。
图3表示的是CMV对GPCR融合蛋白H9(F236K)Gsα的相对信号结果。
详细描述本科学文献涉及受体并采用一些术语来描述对受体具有不同作用的配体。为了清楚和前后一致,在本发明文献中将由始至终使用下列定义。在这些定义与这些词语的其他定义冲突时,选择下列定义激活剂 意味着激活细胞内反应的物质(例如,配体、候选化合物),此时它们结合受体或促进GTP与膜结合。
在此应用的氨基酸缩写列于下表
部分激活剂 意味着这样的物质(例如,配体、候选化合物),它们与受体结合时,激活细胞内反应或者促进GTP与膜结合的程度低于激活剂。
拮抗剂 意味着这样的物质(例如,配体、候选化合物),它和激活剂在同一位点与受体竞争性地结合,但不激活由受体的活性形式引起的细胞内反应,并可因此抑制由激活剂或部分激活剂促进的细胞内反应。拮抗剂在没有激活剂或部分激活剂的情形下并不削弱基本细胞内反应。
候选化合物 意味着一个将经受筛选技术检验的分子(例如但不限于化学化合物)。优选的“候选化合物”并不包括对公众来说已知选自受体的反激活剂、激活剂或拮抗剂的化合物,它们以前已通过非直接的识别方法被确定(“非直接识别的化合物”);更优选不包括先前已经确定至少在一种哺乳动物中具有治疗效果的已被非直接识别的化合物;并且,最优选不包括先前已经确定的在人体中具有治疗用途的已被非直接识别的化合物。
组合物 是指至少包含一种成分的物质;药物组合物即是组合物的一个例子。
化合物效应 意味着一个化合物抑制或者刺激受体功能的能力的量度,它与受体结合亲和力相对。测定化合物效应的典型方法在本专利申请的实施例部分中进一步公开。
密码子 是指三个一组的核苷酸(或与核苷酸相当的词),核苷酸通常由一个核苷(腺苷(A)、鸟苷(G)、胞苷(C)、尿苷(U)和胸苷(T))偶联一个磷酸基团组成,翻译时一个密码子编码一个氨基酸。
被组成型活化的受体 意味着易受组成型受体活化的受体。被组成型活化的受 体可以是内源的也可以是非内源的。
组成型受体活化 意味着不利用它的内源配体或其化学等价物与受体结合的方法而使在活性状态下的受体稳定。
接触 意味着把至少两部分放在一起,无论是在体外系统还是在体内系统中。
直接识别或被直接识别,与术语“候选化合物”相联系,意味着筛选针对组成型活化的受体、优选针对组成型活化的孤儿受体、最优选针对组成型活化的与G蛋白偶联的细胞表面孤儿受体的候选化合物。本术语在任何情形下都不应被解释或被理解为被包括或包括术语“非直接地识别”或“非直接地被识别”。
内源 意味着由物种的基因组天然产生的物质。关于内源的受体,意味着由哺乳动物(例如但不限于人)或病毒天然产生的物质,这些只作为例证但却不是限制。与之相对比,术语“非内源”在本文中意味着不是由哺乳动物(例如但不限于人)或病毒天然产生的。例如在其内源形式下并非组成型活化的受体,当对之进行操作而使之组成型活化时,此受体被最优选地指称为“非内源的被组成型活化的受体”,这只作为例证而不是限制。两个用语都可被用来描述“体内”和“体外”系统。在筛选过程中,内源的或非内源的受体可被用于体外筛选系统,这也只作为例证而不是限制。作为进一步的例子而不是限制,当操作哺乳动物的基因组以包括非内源组成型活化受体时,可以通过体内系统筛选候选化合物。
在本文的上下文中,“G蛋白偶联受体融合蛋白或GPCR融合蛋白”是指包含着内源的组成型活化的GPCR的非内源蛋白,或与至少一个G蛋白、优选G蛋白的α亚基(它是与GTP结合的亚基)融合的非内源组成型活化的GPCR,其中的G蛋白的类型优选与在天然情况下和内源孤儿GPCR偶联的G蛋白的类型是一致的。例如(但不限制),在内源状态,如果G蛋白“Gsα”是与GPCR偶联的主要的G蛋白,基于这一具体GPCR的GPCR融合蛋白就是包含与Gsα融合的GPCR的非内源蛋白。在某些情况下,正如下文将要描述的那样,非主要的G蛋白也可以和GPCR融合。G蛋白与组成型活化的GPCR的C末端可直接融合,也可在其两者之间存在间隔子。
宿主细胞 意味着能在其中插入质粒和/或载体的细胞。在原核宿主细胞情形下,当宿主细胞复制时质粒典型地以自主分子方式复制(在一般情况下,质粒在复制后被分离出来以被引入真核宿主细胞中);在真核宿主细胞情形下,质粒被整合进宿主细胞的细胞DNA中,因而,当真核细胞复制时,质粒复制。为在此公开的本发明的目的,宿主细胞优选是真核细胞,更优选是哺乳动物细胞,最优选地是从293、293T和COS-7细胞中选择出来的细胞。
非直接地识别或非直接地被识别 意味着发现药物的传统方法,该方法涉及对内源受体特异的内源配体的识别、筛选针对受体的候选化合物、确定那些干扰或竞争配体-受体相互反应的化合物、测量化合物对至少一个与活化受体相关的第二信使途径影响的效率。
抑制,与用语“反应”相联系,意味着在一个化合物存在时一个反应被降低或阻止,这正好与该化合物不存在时相反。
反激活剂 意味着这样的物质(例如,配体、候选化合物),它们与内源受体或受体的组成型活化形式结合,并且将由受体的活性形式引发的基本细胞内反应抑制到正常基础水平以下,该活性水平是在没有激活剂或部分激活剂的情况下观察的,或者它们降低GTP与膜的结合。与在没有反激活剂情况下的基本反应相比,基本细胞内反应在反激活剂的存在下优选被抑制至少30%、更优选至少50%、最优选至少75%。。
已知受体 意味着其特异的内源配体已被识别的内源受体。
配体 意味着对内源的天然产生的受体特异的内源的天然产生的分子。
关于内源受体的核苷酸和/或氨基酸序列的突变 意味着这些内源序列的特定改造,从而使内源的非组成型活化受体的突变型能造成受体的组成型活化。对于特定序列的等价物,人受体的后续突变型被认为是人受体的首次突变的等价物,如果(a)后续突变型受体的组成型活化水平与受体的首次突变所表明的在本质上一样;和(b)在后续突变型受体和受体的首次突变之间的序列同源性的百分数是至少80%,更优选地是至少90%,最优选地是至少95%。在理想的情况下,考虑到在此公开的用于进行组成型活化的最优选的盒包括在内源和非内源型GPCR之间发生变化的单一氨基酸和/或密码子,序列同源性的百分数应是至少98%。
非孤儿受体 是指天然存在的内源分子,对天然存在的内源配体表现出特异性,配体与受体的结合使胞内信号途经得以活化。
孤儿受体 意味着这样的内源受体,其特异的内源配体尚未被识别或尚未知。
药物组合物 意味着包括至少一种活性成分的组合物,借助此活性成分可以研究该组合物可在哺乳动物(例如但不限于人体)中特定的效果。本领域的那些普通技术人员将能够理解和正确评价那些适于确定活性成分是否具有基于技术人员需要的预期效果的技术。
质粒 意味着载体和cDNA的结合体。一般,为cDNA复制和/或表达蛋白质的目的将质粒引进宿主细胞。
刺激,与术语“反应”相联系,意味着当一种化合物存在时比当它不存在时反应增强。
针对cDNA的载体 意味着能够将至少一个cDNA掺入其中且能导入到宿主细胞中的环形DNA。
下面部分的顺序安排是为了表达效果,而不能被解释为对下面的公开或权利要求的限制。A.引言受体的传统研究一直是基于这样的前置假定(基于历史),即内源配体必须首先被识别,然后才能发现可以作用于受体的拮抗剂和其他分子。甚至在拮抗剂被首先发现的情况下,搜索的目光也立即延伸到查找内源配体上去。即使在发现组成型活化受体之后,这种思维模式也一直在受体研究中持续。在此之前没有被认识到的是,是受体的活性状态对发现受体的激活剂、部分激活剂和反激活剂是最有用的。对于那些因为受体的过度活化和不够活化而导致的疾病来说,希望得到的治疗药物是能分别用来减少受体的活性状态或增强受体活性的化合物,而并不需要是对抗内源配体的拮抗剂。这是因为,一个降低或增强活化态受体活性的化合物并不需要结合在和内源配体一样的位点上。因而,正如本发明的一个方法所说的那样,对治疗性化合物的任何搜索可通过筛选针对配体非依赖性活性态的化合物而开始。
B.人GPCR的确认人类基因组计划的实施导致位于人类基因组内有关核酸序列的大量信息的识别,经过这种努力,事实上,我们无需了解或认识任何特定的基因组序列是否包含翻译人类蛋白的可读框信息,即可获得遗传序列信息,几种识别人类基因组中核酸序列的方法都是本领域普通技术人员所熟悉的,比如(但不限定),此处公开的大量人类GPCR,即是通过回顾GenBankTM数据库而发现的,并通过应用先前已测序的GPCR核酸序列,检索BLASTTM的EST数据库,发现了其他的GPCR。下面的表B,列出了几个与GPCR各自的同源受体一道被我们发现的内源GPCR。
表B公开的人类 入藏登记可读框 与指明的GPCR 参考同源孤儿GPCR (碱基对)同源性比率GPCR(编号)hARE-3AL0333791,260bp52.3%LPA-R U92642hARE-4AC0060871,119bp36%P2Y5 AF000546hARE-5AC0062551,104bp32%Oryzias latipes D43633hGPR27AA7758701,128bphARE-1AI090920999bp 43% D13626KIAA001hARE-2AA3595041,122bp53%GPR27hPPR1 H67224 1,053bp39%EBI1 L31581hG2A AA7547021,113bp31%GPR4 L36148hRUP3 AL0354231,005bp30%果蝇 2133653hRUP4AI3076581,296bp32%pNPGPR NP_00487628%斑马鱼YaAAC41276和29%斑马鱼Yb, AAB94616hRUP5AC0058491,413bp25%DEZ Q9978823%FMLPR P21462hRUP6AC0058711,245bp48%GPR66 NP_006047hRUP7AC0079221,173bp43%H3R AF140538hCHN3EST365811,113bp53%GPR27hCHN4AA8045311,077bp32%凝血酶 4503637hCHN6EST2134670 1,503bp36%edg-1 NP_001391hCHN8EST764455 1,029bp47%D13626KIAA0001hCHN9EST1541536 1,077bp41%LTB4R NM_000752hCHN10 EST1365839 1,055bp35%P2Y NM_002563受体同源性对于进一步了解受体在人体中的作用是有用的,在本专利申请文件的下文中,我们将公开使这些受体产生突变的技术,以便建立这些受体的非内源组成型活化的形式。
此处公开的这些技术还已经应用到本领域已知的人其他的孤儿GPCR,随着本专利申请文件的进一步描述,该技术会更加明显。
C.受体筛选筛选出对应于此处公开的人GPCR的非内源组成型活化形式的候选化合物,可直接识别在这个细胞表面受体上起作用的候选化合物,而不需要使用受体的内源配体。通过确定此处公开的人GPCR的内源形式在体内表达或过表达的区域,有可能确定与受体表达或过表达关联的相关疾病/紊乱,这种方法在本专利申请文件中得以公开。
制造可以证明此处公开的人GPCR组成型活化的突变的技术,是基于与脯氨酸残基的距离,据估计此残基位于GPCR的TM6内部,这一算法规则公开在普通转让的审查未决的美国专利申请09/170,496中,该申请引入此文作参考。该算法规则不是依据传统的序列比对来预测,而是依据与上述TM6脯氨酸残基的特定距离。通过使距该残基(估计位于受体的IC3区)16个氨基酸残基处的氨基酸残基发生突变,最好是突变为赖氨酸,可以获得这种活化。其他氨基酸在此位置上的突变可用来达到此目的。
D.疾病/紊乱识别和/或选择正如下文将要详细描述的,最优选用本发明的方法识别针对非内源的组成型活化的GPCR的反激活剂。如此的反激活剂是治疗与这些受体有关的疾病的药物探索中先导化合物的理想候选者。因为可直接识别针对这些受体的反激活剂,因此有可能开发和搜索针对与这些受体有关的疾病和紊乱的药物组合物。例如,检查患病和正常组织样品中这些GPCR的存在,现在不仅仅是学术研究的问题,也是在识别特定GPCR的内源配体的研究道路上所致力解决的问题。可在健康和患病组织的宽广范围内进行组织检查。如此的组织检查提供了把特异受体与疾病/紊乱相联系的优选第一步骤。例如,参见待审专利申请(卷号ARE-0050)中的典型斑点印迹和本文公开的几个GPCR的RT-PCR结果。
优选内源GPCR的DNA序列被用来制作探针,用于进行(a)针对组织mRNA的斑点印迹和(b)组织样品中所述受体表达的RT-PCR识别。在组织或疾病组织中受体的存在,或者与正常组织相比在疾病组织中受体的浓度提高,可被优选地用来识别治疗方法(包括但不限于)与那种疾病的关联。用这种方法也可很好地把受体定位于器官的区域。基于受体被定位于其中的特定组织的已知功能,受体假想的功能性角色可被推导出来。
E.候选化合物的筛选1.一般GPCR的筛选测定技术当一种G蛋白受体变为组成型活化时,它与G蛋白(例如,Gq、Gs、Gi、Gz、Go)偶联并刺激GTP与G蛋白结合。接着,借助受体在正常情况下失活,G蛋白作为GTP酶慢慢地把GTP水解为GDP,然而,组成型活化的受体继续把GDP转化为GTP。GTP非可水解的类似物[35S]GTPγS,可被用来监测与表达组成型活化受体的膜的结合。据报道,[35S]GTPγS可被用来监测在配体存在或不存在的情形下G蛋白与膜的偶联。在本领域中著名和可行的其他例证中有此种监测的一个例证,它由Traynor和Nahorski在1995年所报道。本测定系统的一个优选的应用是为了初步筛选候选化合物,因为本系统对所有蛋白-偶联受体一般可行,而不考虑与受体的细胞内结构域相互作用的那一种特别的G蛋白。2.特定的GPCR筛选测定技术一旦应用“一般”G蛋白偶联的受体测定方法(即筛选是激活剂、部分激活剂或反激活剂的化合物的方法)识别出候选化合物,优选进一步筛选以确认作用在受体位点的化合物。例如,应用“一般”测定方法识别的化合物可以不与受体结合,但也可以仅仅从细胞内结构域与G蛋白“解偶联”。a.Gs,Gz和GiGs刺激腺苷酸环化酶。另一方面,Gi(和Gz和Go)抑制该酶。腺苷酸环化酶催化ATP向cAMP的转化;因此,与Gs蛋白偶联的组成型活化的GPCR与升高的细胞内cAMP水平相关联。在另一方面,与Gi(和Gz或Go)蛋白偶联的组成型活化的GPCR与降低的细胞内cAMP水平相关联。一般情况参见“突触传导的非直接机制(IndirectMechanisms of Synaptic Transmission)”,第8章,从神经到大脑(FromNeuron To Brain)(第三版),Nichols,J.G.等编,Sinauer Associates,Inc.(1992)。因此,检测cAMP的方法可被用来确定一个竞争性的化合物是否是受体的反激活剂(即这样的一个化合物将能降低cAMP的水平)等。本领域已知的测定cAMP的不同方法可以被利用;最优选的方法依赖于在基于ELISA的方法中应用抗-cAMP的抗体。可被应用的另一类测定方法是一种全细胞第二信使报告基因系统测定法。基因上的启动子驱动由一个特别的基因所编码的蛋白质的表达。环AMP通过以下步骤促进基因的表达,即它响应促进cAMP的DNA结合蛋白或转录因子(CREB)的结合,转录因子接着在被称为cAMP效应元件的特别位点与启动子结合并驱动基因表达。报告基因系统可被构建为具有一个启动子,该启动子在报告基因的前面含有多个cAMP效应元件,例如β-半乳糖苷酶或荧光素酶。因而,一个被组成型活化的连接Gs的受体引起cAMP的积累,cAMP接着激活报告蛋白质的基因和表达。β-半乳糖苷酶或荧光素酶等报告蛋白质可用标准生化方法检测到(Chen等,1995)。b.Go和GqGo和Gq与磷脂酶C的活化相联系,磷脂酶随后水解磷酸酯PIP2,并释放两种细胞内信使二酰甘油(DAG)和肌醇-1,4,5-三磷酸(IP3)。积累增加的IP3与Gq-和Go-关联的受体相关联。一般情况参见“突触传导的非直接机制(Indirect Mechanisms of Synaptic Transmission)”,第8章,从神经到大脑(From Neuron To Brain)(第三版),Nichols,J.G.等编,Sinauer Associates,Inc.(1992)。测定IP3积累的方法可被用来确定一个候选化合物是否是例如针对Gq-或Go-关联受体等的反激活剂(即如此的化合物能降低IP3的水平)。Gq关联受体也可用AP1报告基因测定方法来检测,因为Gq依赖的磷脂酶C引起含有AP1元件的基因活化;因而,活化的Gq关联受体将导致如此基因的表达增高,而其反激活剂将导致如此表达的降低,激活剂将导致如此表达的升高。进行如此测定的商业可得的方法是可得的。
3.GPCR融合蛋白内源组成型活化的孤儿GPCR或非内源组成型活化的孤儿GPCR,用于筛选候选化合物,直接识别反激活剂、激活剂和部分激活剂,提出了一个有意思的筛选难题,确切地说,在没有内源配体结合的情况下,受体仍有活性。因此,为了区分候选化合物存在或不存在时的非内源受体,这种区分的目的是要了解这种化合物是否是所述受体的反激活剂、激活剂、部分激活剂或对该受体根本没有影响,最好的办法就是加强这种差异,使用GPCR融合蛋白就是这样一种方法。
一般来讲,应用上述分析技术(还有其它的技术)一旦确定非内源孤儿GPCR为组成型活化的,就可能确定与内源GPCR偶联的优势G蛋白,G蛋白与GPCR的偶联提供了可被估计的信号途径。因为最好是使用哺乳动物表达系统进行筛选,就希望在这个系统中有内源G蛋白存在,确切来说,非内源组成型活化的孤儿GPCR在这个系统中持续产生信号。从这点上,优选使信号得到加强,从而在(例如)受体的反激活剂存在时,很可能更方便地区分与反激活剂接触的不同受体,特别是在筛选的整个过程中。
GPCR融合蛋白的作用是增加G蛋白与非内源GPCR偶联的效应,GPCR融合蛋白优选用于筛选非内源组成型活化的GPCR,因为这种方法增强对这样的筛选技术非常有用的信号,重要的是有助于产生很大的“信噪”比,这种大信噪比对筛选此处公开的候选化合物是特别优选的。
用于GPCR融合蛋白表达的构建体的构建技术是本领域普通技术人员所熟悉,商业可获得的表达载体和系统为实验者提供了各种可以满足特殊需要的方法,这种GPCR融合蛋白构建体重要的衡量标准,就是内源GPCR序列与G蛋白序列都符合读框(最好是,内源GPCR的序列位于G蛋白序列上游),以及必须去除或替代GPCR的“终止”密码子,从而随着GPCR的表达,G蛋白也能表达。GPCR可以直接连到G蛋白上,或在两者之间存在间隔残基(最好不超过12个,虽然本领域的普通技术人员可以很方便得知这一数字)。我们喜欢使用间隔子(其于方便),表达中不被有效利用的限制位点组成了间隔子。在制造GPCR融合蛋白构建体之前,优选首先确认与非内源GPCR偶联的G蛋白,因为只有很少的G蛋白已被识别,所以优选包含G蛋白序列(如通用G蛋白构建体)的构建体可在其中插入内源GPCR序列,这样可有效地大规模筛选大量具有不同序列的内源GPCR。
如上所述,预计与Gi、Gz和Go偶联的组成型活化GPCR抑制cAMP的形成,这就需要人们找到基于这些类型GPCR的分析方法(如,cAMP信号随活化降低,这样使得直接识别(例如)反激活剂(进一步减弱这种信号)更加有趣),正如本文所公开的,我们已经证实,对于这些类型的受体,有可能制造不基于内源GPCR的内源G蛋白的GPCR融合蛋白,尽力建立可行的以环化酶为基础的分析方法。举例来说,Gz偶联的受体如H9,利用Gs融合蛋白可以建立这种GPCR融合蛋白-我们相信这样的融合构建体在表达时,“驱动”或“推动”非内源GPCR与如Gs而不是“天然”的Gz蛋白偶联,从而能够建立以环化酶为基础的分析方法。对与Gi、Gz、Go偶联的受体,当使用GPCR融合蛋白并且分析是以腺苷环化酶活性测定为基础时,我们优选用Gs(或刺激腺苷酸环化酶形成的G蛋白类似物)来建立融合构建体。
F.药物化学在一般但并非经常的情况下对候选化合物直接识别与通过组合化学技术产生的化合物联合使用,其中随机制备几千种化合物用于此分析。如此筛选的结果一般将是具有独特中心结构的化合物;其后,这些化合物围绕着一个优选的中心结构而被优选进行额外的化学修饰,以进一步加强其药用性质。这样的技术在该领域中是已知的,并不需要在本专利文件中详细描述。
G.药物组合物为进一步开发而选择出的候选化合物可应用本领域周知的技术制剂成药物组合物。适宜的药物可接受的载体在本领域中是可得的;例如,参见Remington’s Pharmaceuctical Sciences,第16版,1980,MackPublishing Co.(Oslo等编)。
H.其他应用尽管公开的非内源人GPCR的一个优选的应用是为了直接识别作为反激活剂、激活剂或部分激活剂(优选地作为药物使用)的候选化合物,人GPCR的这些形式也可被用于研究之用。例如,带有GPCR的体外或体内系统可被用来阐释和理解这些受体在正常和患病的人体状况中的作用,也可理解当它应用于理解信号级联反应时组成型活化的角色。这些非内源的人GPCR的价值由于其独特的特点是它们作为研究工具的用途被强化,公开的受体可被用来理解这些受体在人体中的作用,即使在其内源配体被识别之前。公开的受体的其他应用对于本领域的技术人员将是明显的,特别是当他们阅读了本申请文件之后。
1人GPCR的识别在浏览GenBankTM数据库信息的基础上,识别了一些已公开的内源人GPCR。在检索数据库的同时,下列cDNA克隆也得以识别,列表如下(表C)。
表C
用下列EST克隆作为询问序列,对EST数据库(dbest)进行BLASTTM检索,识别出其他已公开的人内源GPCR。然后将下列已确认的EST克隆用作探针筛选人的基因组文库(表D)。
表D已公开的人询问EST克隆/ 可读框核酸序列氨基酸序列孤儿GPCR (序列) 入藏登记号(碱基对) SEQ.ID.NOSEQ.ID.NOhGPCR27鼠 AA775870 1,125bp 17 18GPCR27hARE-1 TDAG 1689643 999bp 19 20AI090920hARE-2 GPCR2768530 1,122bp 21 22AA359504hPPR1 牛 2386671,053bp 23 24
PPR1 H67224hG2A 鼠参见实施例1,113bp252611794262(a)hCHN3N.A. EST36581 1,113bp2728(全长)hCHN4TDAG 1184934 1,077bp2930AA804531hCHN6N.A. EST21346701,503bp3132(全长)hCHN8KIAA0001 EST764455 1,029bp3334hCHN91365839EST15415361,077bp3536hCHN10 鼠EST 人1365839 1,005bp37381365839hRUP4N.A. AI307658 1,296bp3940N.A.=“不适用”2全长克隆a.人G2A利用鼠EST克隆1179426获取包含几乎所有三氨基酸G2A编码序列的人基因组克隆,该编码序列通过5′RACE获得,PCR模板为Clontech’s Human Spleen Marathon-ReadyTMcDNA。已被公开的人G2A用PCR扩增,第一和第二轮PCR使用G2A cDNA特异引物,其为SEQ.ID.NO.41和SEQ.ID.NO.42如下5′-CTGTGTACAGCAGTTCGCAGAGTG-3′(SEQ.ID.NO.41,第一轮PCR)5′-GAGTGCCAGGCAGAGCAGGTAGAC-3′(SEQ.ID.NO.42,第二轮PCR)用Advantage GC Polymerase试剂盒进行PCR(Clontech按商家说明进行操作),94℃ 30秒;94℃ 5秒,72℃ 4分钟,5个循环;94℃ 5秒,70℃ 4分钟,30个循环。将大约1.3kb PCR片段从琼脂糖凝胶中纯化出来,经Hind III和XbaI酶切,克隆到表达载体pRC/CMV2(Invitrogen)中。被克隆的插入片段用T7 SequenaseTM试剂盒(USB Amersham;按商家说明进行操作)进行测序,并将所得序列与已存在的序列进行比较。人G2A的表达通过用P32标记片段与RNA点印迹杂交进行测定(clontech;按商家说明进行操作)。
b.CHN9EST克隆1541536的测序表明,CHN9为cDNA克隆的一部分,只有起始密码子,即,没有终止密码子。用CHN9检索数据库进行比较发现,CHN9的3′端序列与白细胞三烯B4受体cDNA 5′端非翻译区100%同源,该cDNA带有一个与CHN9编码序列符合读框的终止密码子。为了确定LTB4R cDNA5′端非翻译区是否是CHN9的3′端序列,进行了PCR扩增,所用引物是以在CHN9中发现的起始密码子的5′端侧翼序列和在LTB4R 5′端非翻译区中发现的终止密码子的3′端侧翼序列为基础。所用的5′端引物序列如下5′-CCCGAATTCCTGCTTGCTCCCAGCTTGGCCC-3′(SEQ.ID.NO.43,有义)5′-TGTGGATCCTGCTGTCAAAGGTCCCATTCCGG-3′(SEQ.ID.NO.44,反义)以胸腺cDNA为模板,并用商家提供的缓冲液系统及rTth聚合酶(PerkinElmer)进行PCR,每种引物0.25μM,4种核苷酸每种0.2mM。循环条件为94℃ 1分钟,65℃ 1分钟,72℃ 1分10秒,30个循环,由PCR获得了与预计大小一致的1.1kb片段,将该PCR片段亚克隆到pCMV中(参见下文)并测序(参见SEQ.ID.NO.35)。
c.RUP4以人脑cDNA(clontech)为模板,经RT-PCR克隆了全长RUP4。
5′-TCACAATGCTAGGTGTGGTC-3′(SEQ.ID.NO.45,有义)5′-TGCATAGACAATGGGATTACAG-3′(SEQ.ID.NO.46,反义)使用Taqplas PrecisionTM聚合酶(Stratagene按商家说明)进行PCR,经以下循环94℃ 2分钟;94℃ 30秒;55℃ 30秒;72℃ 45秒;72℃ 10分钟。循环2到循环4重复30次。
PCR产物在1%琼脂糖凝胶上分离,提取500bp PCR片段,并克隆到pCRII-TOPOTM载体(Invitrogen)中,用T7 SequeraseTM试剂盒(Amsham)和SP6/T7引物(Stratagene)进行测序。序列分析表明,该PCR片段确实是AI307658的另一种剪接形式,带有一个与其他GPCR相似的连续的可读框,该PCR片段的全序列如下5’-TCACAATGCTAGGTGTGGTCTGGCTGGTGGCAGTCATCGTAGGATCACCCATGTGGCACGTGCAACAACTTGAGATCAAATATGACTTCCTATATGAAAAGGAACACATCTGCTGCTTAAGAGTGGACCAGCCCTGTGCACCAGAAGATCTACACCACCTTCATCCTTGTCATCCTCTTCCTCCTGCCTCTTATGGTGATGCTTATTCTGTACGTAAAATTGGTTATGAACTTTGGATAAAGAAAAGAGTTGGGGATGGTTCAGTGCTTCGAACTATTCATGGAAAAGAAATGTCCAAAATAGCCAGGAAGAAGAAACGAGCTGTCATTATGATGGTGACAGTGGTGGCTCTCTTTGCTGTGTGCTGGGCACCATTCCATGTTGTCCATATGATGATTGAATACAGTAATTTTGAAAAGGAATATGATGATGTCACAATCAAGATGATTTTTGCTATCGTGCAAATTATTGGATTTTCCAACTCCATCTGTAATCCCATTGTCTATGCA-3’(SEQ.ID.NO.47)以上面的序列为基础,制备两个有义寡核苷酸引物5′-CTGCTTAGAAGAGTGGACCAG-3′(SEQ.ID.NO.48,寡聚核苷酸引物1)5′-CTGTGCACCAGAAGATCTACAC-3′(SEQ.ID.NO.49,寡聚核苷酸引物2)两个反义寡核苷酸引物5′-CAAGGATGAAGGTGGTGTAGA-3′(SEQ.ID.NO.50,寡聚核苷酸引物3)5′-GTGTAGATCTTCTGGTGCACAGG-3′(SEQ.ID.NO.51,寡聚核苷酸引物4)用于3′端和5′端RACE PCR,以人脑Marathon-ReadyTMcDNA(clontech,Cat#7400-1)为模板,按商家说明进行。经RACE PCR产生的DNA片段克隆到pCRII-TOPOTM载体(Invitrogen)中,用SP6/T7引物(Stratagene)和一些中间引物测序,3′端RACE产物带有一个poly(A)尾巴和一个结束于TAA终止密码子的完整的可读框,5′端RACE产物包含不完整的5′端,即,起始密码子ATG没有出现。
基于新的5′端序列,寡聚核苷酸引物3和下列引物5′-GCAATGCAGGTCATAGTGAGC-3′(SEQ.ID.NO.52,寡聚核苷酸引物5)用于第二轮的5′端RACE PCR,对PCR产物象上面一样进行分析。第三轮的5′端RACE PCR用反义引物进行5′-TGGAGCATGGTGACGGGAATGCAGAAG-3′(SEQ.ID.NO.53,寡聚核苷酸引物6)5′-GTGATGAGCAGGTCACTGAGCGCCAAG-3′(SEQ.ID.NO.54,寡聚核苷酸引物7)5′端RACE PCR产物序列显示存在起始密码子ATG,再下一轮的5′RACE PCR没有产生更多的5′序列,通过利用有义引物5′-GCAATGCAGGCGCTTAA-TTAC-3′(SEQ.ID.NO.55,寡聚核苷酸引物8)和寡聚核苷酸引物4为引物进行的RT-PCR,以及由人脑和心cDNA模板(Clontech、Cat#7404-1)产生的650bp PCR产物的序列分析,证实了上述完整的5′端序列。通过利用寡聚核苷酸引物2和下列反义引物的RT-PCR5′-TTGGGTTACAATCTGAAGGGCA3′(SEQ.ID.NO.56,寡聚核苷酸引物9)以及由人脑和心cDNA模板(Clontech,Cat# 7404-1)产生的670bp PCR产物的序列分析,证实了上述完整的3′端序列。
d.RUP5以人的外周白细胞cDNA(Clontech)为模板,通过RT-PCR克隆了全长的RUP5,所用引物为在ATG起始密码子上游的有义引物(SEQ.ID.NO.57),以及包含TCA为终止密码子的反义引物(SEQ.ID.NO.58),其序列如下5′-ACTCCGTGTCCAGCAGGACTCTG-3′(SEQ.ID.NO.57)
5′-TGCGTGTTCCTGGACCCTCACGTG-3′(SEQ.ID.NO.58)AdvantageTMcDNA聚合酶(Clontech)用于50μl反应,经下列循环进行扩增,其中第二步到第四步重复30次94℃ 30秒;94℃ 15秒;69℃ 40秒;72℃ 3分钟;72℃ 6分钟。分离得到1.4kb PCR片段,并克隆到pCRII-TOPOTM载体(Invitrogen),用T7 DNA SequenaseTM试剂盒(Amsham)进行全序列测定,参见SEQ.ID.NO.9。
e.RUP6用下列引物及人的胸腺Marathon-ReadyTMcDNA(Clontech)为模板,通过RT-PCR克隆了全长RUP6。
5′-CAGGCCTTGGATTTTAATGTCAGGGATGG-3′(SEQ.ID.NO.59)5′-GGAGAGTCAGCTCTGAAAGAATTCAGG-3′(SEQ.ID.NO.60)AdvantageTMcDNA聚合酶(Clontech,按商家说明)用于50μl反应,经下列循环进行扩增94℃ 30秒;94℃ 5秒;66℃ 40秒;72℃ 2.5秒和72℃ 7分钟,循环2到循环4重复30次。分离得到1.3kb PCR片段,并克隆到pCRII-TOPOTM载体(Invitrogen),用ABI Big Dye TerminatorTM试剂盒(P.E.Biosystem)进行全序列测定(参见,SEQ.ID.NO.11)。
f.RUP7用下列引物及人的外周白细胞cDNA(Clontech)为模板,通过RT-PCR克隆了全长PUP7,5′-TGATGTGATGCCAGATACTAATAGCAC-3′(SEQ.ID.NO.61,有义)5′-CCTGATTCATTTAGGTGAGATTGAGAC-3′(SEQ.ID.NO.62,反义)AdvantageTMcDNA聚合酶(Clontech)用于50μl反应,经下列循环进行扩增,其中第二步到第四步重复30次94℃ 2分钟;94℃ 15秒;60℃ 20秒;72℃ 2分钟;72℃ 10分钟。分离得到1.25kb PCR片段,并克隆到pCRII-TOPOTM载体(Invitrogen),用ABI Big Dye TerminatorTM试剂盒(P.E.Biosystem)进行全序列测定。(参见,SEQ.ID.NO.13)3.血管紧张素II 1型受体(“AT1”)利用基因组DNA为模板和rTth聚合酶(Perkin Elmer)及商家提供的缓冲液,每种引物0.25μM,及4种核苷酸各0.2mM,通过PCR获得人的内源血管紧张素II 1型受体(“AT1”),PCR循环条件为94℃ 1分钟;55℃ 1分钟和72℃ 1.5分钟,共30个循环。5′端PCR引物包含Hind III位点,序列为5′-CCCAAGCTTCCCCAGGTGTATTTGAT-3′(SEQ.ID.NO.63)3′端引物包含BamHI位点,序列如下5′-GTTGGATCCACATAATGCATTTTCTC-3′(SEQ.ID.NO.64)所产生的1.3kb PCR片段用HindIII和BamHI酶切,并克隆到表达载体pCMV的HindIII-BamHI位点,对该cDNA克隆进行了全序列测定,随后确定并证实了人的AT1的核酸序列(SEQ.ID.NO.65)和氨基酸序列(SEQ.ID.NO.66)。
4.GPR 38利用人的基因组DNA为模板和rTth聚合酶(Perkin Elmer)及商家提供的缓冲液,每种引物0.25μM及4种核苷核酸各0.2mM,组合两个PCR片段进行PCR,获得GPR38,每次PCR的循环条件为94℃ 1分钟,62℃ 1分钟,72℃ 2分钟,共30个循环。
第一片段的扩增使用包含终止位点的5′PCR引物,序列如下5′-ACCATGGGCAGCCCCTGGAACGGCAGC-3′(SEQ.ID.NO.67)及序列如下的3′引物5′-AGAACCACCACCAGCAGGACGCGGACGGTCTGCCGGTGG-3′(SEQ.ID.NO.68)第二PCR片段的扩增使用具有下列序列的5′引物5′-GTCCGCGTCCTGCTGGTGGTGGTTCTGGCATTTATAATT-3′(SEQ.ID.NO.69)和包含BamHI位点的3′引物,序列如下5′-CCTGGATCCTTATCCCATCGTCTTCACGTTAGC-3′(SEQ.ID.NO.70)以两个片段为模板,用SEQ.ID.NO.67和SEQ.ID.NO.70作引物(使用上述的循环条件),来扩增GPR38。所产生的1.44kb PCR片段用BamHI酶切,克隆到表达载体pCMV的Blunt-BamHI位点。
5.MC4利用人的基因组DNA为模板和rTth聚合酶(Perkin Elmer)及商家提供的缓冲液,每种引物0.25μM及4种核苷酸各0.2mM,进行PCR以获得MC4。每次PCR反应的循环条件为94℃ 1分钟,54℃ 1分钟和72℃ 1分30秒,共30个循环。
5′PCR引物包含EcoRI位点,其序列为5′-CTGGAATTCTCCTGCCAGCATGGTGA-3′(SEQ.ID.NO.71)3′引物包含BamHI位点,其序列为5′-GCAGGATCCTATATTGCGTGCTCTGTCCCC-3′(SEQ.ID.NO.72)1.0kb PCR片段用EcoRI和BamHI酶切,克隆到表达载体pCMV的EcoRI-BamHI位点,随后确定了人MC4的核酸序列(SEQ.ID.NO.73)和氨基酸序列(SEQ.ID.NO.74)。
6.CCKB利用人胃cDNA为模板和rTth聚合酶(Perkin Elmer)及商家提供的缓冲液,每种引物0.25μM及四种核苷酸各0.2mM,进行PCR以获取CCKB。每次PCR反应的循环条件为94℃ 1分钟,65℃ 1分钟和72℃ 1分30秒,共30个循环。
5′PCR引物包含HindIII位点,序列为
5′-CCGAAGCTTCGAGCTGAGTAAGGCGGCGGGCT-3′(SEQ.ID.NO.75)3′引物包含EcoRI位点,序列为5′-GTGGAATTCATTTGCCCTGCCTCAACCCCCA-3′(SEQ.ID.NO.76)产生的1.44kb PCR片段用HindIII和EcoRI酶切,克隆到表达载体pCMV的HindIII-EcoRI位点。随后确定了人CCKB的核酸序列(SEQ.ID.NO.77)和氨基酸序列(SEQ.ID.NO.78)。
7.TDAG8利用基因组DNA为模板和rTth聚合酶(Perkin Elmer)及商家提供的缓冲液,每种引物0.25μM及四种核苷酸各0.2mM,进行PCR以获取TDAG8。PCR的循环条件为94℃ 1分钟,56℃ 1分钟和72℃ 1分20秒,共30个循环。5′PCR引物包含HindIII位点,序列为5′-TGCAAGCTTAAAAAGGAAAAAATGAACAGC-3′(SEQ.ID.NO.79)3′引物包含BamHI位点,序列为5′-TAAGGATCCCTTCCCTTCAAAACATCCTTG-3′(SEQ.ID.NO.80)产生的1.1kb PCR片段用HindIII和BamHI酶切,克隆到表达载体pCMV的HindIII-BamHI位点。所产生的三个克隆经测序后发现包含三个潜在的多态性,涉及43位氨基酸由脯氨酸变为丙氨酸、97位氨基酸由赖氨酸变为天冬酰胺、以及130位氨基酸由异亮氨酸变为苯丙氨酸。随后确定了人TDAG8的核酸序列(SEQ.ID.NO.81)和氨基酸序列(SEQ.ID.NO.82)。
8.H9利用垂体cDNA为模板和rTth聚合酶(Perkin Elmer)及商家提供的缓冲液系统,每种引物0.25μM及四种核苷酸各0.2mM,进行PCR以获取H9。PCR的循环条件为94℃ 1分钟,62℃ 1分钟和72℃ 2分钟,共30个循环。5′PCR引物包含HindIII位点,序列为5′-GGAAAGCTTAACGATCCCCAGGAGCAACAT-3′(SEQ.ID.NO.15)3′引物包含BamH位点,序列为5′-CTGGGATCCTACGAGAGCATTTTTCACACAG-3′(SEQ.ID.NO.16)产生的1.9kb PCR片段用HindIII和BamHI酶切,克隆到表达载体pCMV的HindIII-BamHI位点。H9包含三个潜在的多态性,涉及氨基酸P320S、S493N和G448A的改变。随后确定和证实了人H9的核酸序列(SEQ.ID.NO.139)和氨基酸序列(SEQ.ID.NO.140)。
1.Transformer Sited-DirectedTM诱变利用Transformer Sited-DirectedTM诱变试剂盒按商家说明,由人GPCR制备非内源人GPCR可得以实现。使用两个诱变引物,首先优选的是产生赖氨酸突变的赖氨酸诱变寡核苷酸,及一个选择标记寡核苷酸。出于方便的原因,掺入人GPCR中的密码子突变用标准方式标示出来(表E)表E受体名称密码子突变hARE-3 F313KhARE-4 V233K
hARE-5 A240KhGPCR14L257KhGPCR27C283KhARE-1 E232KhARE-2 G285KhPPR1 L239KhG2A K232AhRUP3 L224KhRUP5 A236KhRUP6 N267KhRUP7 A302KhCHN4 V236KhMC4 A244KhCHN3 S284KhCHN6 L352KhCHN8 N235KhCHN9 G223KhCHN10 L231KhH9F236K使用指定的序列引物,按上面的方法使下列的GPCR产生突变(表F)。
表F受体密码子赖氨酸诱变 选择标记名称突变 (SEQ.ID.NO.) (SEQ.ID.NO.)5′-3′方向,突变序列下划线5′-3′方向,hRUP4 V272K CAGGAAGAAGAAACG CACTGTCACCATCAAGCTGTCATTATGATG TAATGACAGCTCGTGTGACAGTG(83)TTCTTCTTCCTG(84)hAT1 参见下文 其它方法,参见下文其他方法,参见下文hGPR38V297K GGCCACCGGCAGACCACTCCTTCGGTCCTCAACGCGTCCTGCTG(85)CTATCGTTGTCAGAAGT(86)hCCKBV332K 其他方法,参见下文其他方法,参见下文hTDAG8 I225K GGAAAAGAAGAGAATCCTCCTTCGGTCCTCAAAAAACTACTTGTCA CTATCGTTGTCAGAGCATC(87) AGT(88)hH9 F236K GCTGAGGTTCGCAATACTCCTTCGGTCCTCAACTAACCATGTITGT CTATCGTTGTCAGAG(143) AGT(144)hMC4 A244K GCCAATATGAAGGGAACTCCTTCGGTCCTCAAATTACCTTGACCAT CTATCGTTGTCAGAC(137) AGT(138)然后对非内源人GPCR测序,获得并证实的核酸和氨基酸序列列入本专利申请文件所附的“序列表”中,并以下面的表G作为概括。
表G非内源人GPCR 核酸序列表 氨基酸序列表HRUP4 SEQ.ID.DO.127 SEQ.ID.DO.128(V272K)hAT1 (参见下面的其它方法)(参见下面的其它方法)(参见下面的其它方法)hGPR38 SEQ.ID.DO.129 SEQ.ID.DO.130(V297K)hCCKB SEQ.ID.DO.131 SEQ.ID.DO.132(V332K)HTDAG8 SEQ.ID.DO.133 SEQ.ID.DO.134(I225K)
hH9 SEQ.ID.DO.141 SEQ.ID.DO.142(F236K)hMC4 SEQ.ID.DO.135 SEQ.ID.DO.136(A224K)2.产生非内源人GPCR的其它方法a.AT11.F239K突变制备非内源组成型活化的人AT1受体,是通过产生F239K突变(参见,核酸序列SEQ.ID.NO.289和氨基酸序列SEQ.ID.NO.90)而实现的。使用Transformer Sited-Directed MatagenesisTM试剂盒(clontech)按商家说明进行诱变,使用两个诱变引物,分别为赖氨酸诱变寡核苷酸(SEQ.ID.NO.91)和选择标记寡核苷酸(SEQ.ID.NO.92),其序列如下5′-CCAAGAAATGATGATATTAAAAAGATAATTATGGC-3′(SEQ.ID.NO.91)5′-CTCCTTCGGTCCTCCTATCGTTGTCAGAAGT-3′(SEQ.ID.NO.92)2.N111A突变通过产生N111A突变(参见,核酸序列SEQ.ID.NO.93和氨基酸序列SEQ.ID.NO.94),也可实现非内源人AT1受体的制备,使用pfa聚合酶(Stratagene)及商家提供的缓冲液系统,另添加10%DMSO、每种引物0.25μM,4种核苷酸各0.5mM,进行两个PCR反应。5′PCR有义引物的序列如下5′-CCCAAGCTTCCCCAGGTGTATTTGAT-3′(SEQ.ID.NO.95)反义引物的序列如下5′-CCTGCAGGCGAAACTGACTCTGGCTGAAG-3′(SEQ.ID.NO.96)所产生的400bp PCR片段用HindIII酶切,并亚克隆到pCMV载体的HindIII-SmaI位点(5′构建体)。3′PCR有义引物的序列如下
5′-CTGTACGCTAGTGTGTTTCTACTCACGTGTCTCAGCATTGAT-3′(SEQ.ID.NO.97)反义引物的序列如下5′-GTTGGATCCACATAATGCATTTTCTC-3′(SEQ.ID.NO.98)所产生的880bp PCR片段用BamHI酶切,插入到5′构建体的Pst(T4聚合酶补平)和BamHI位点中,产生全长的N111A构建体。循环条件为94℃ 1秒、60℃ 1分钟,72℃ 1分钟(5′PCR)或1分30秒(3′PCR),共25个循环。
3.AT2K255IC3突变通过创造AT2K255IC3“域交换”突变(参见核酸序列SEQ.ID.NO.99和氨基酸序列SEQ.ID.NO.100),实现制备非内源组成型活化的人AT1,在AT1的IC3侧面产生限制性位点,以便由来自血管紧张素II 2型受体(AT2)的相应IC3取代IC3,通过两次PCR反应来达到此目的。编码从5′非翻译区到IC3起点的5′PCR片段(片段A),通过利用SEQ.ID.NO.63作为有义引物及下列序列为反义引物来产生5′-TCCGAATTCCAAAATAACTTGTAAGAATGATCAGAAA-3′(SEQ.ID.NO.101)编码从IC3末端到3′非翻译区的3′PCR片段(片段B),通过以下列序列为有义引物及SEQ.ID.NO.64为反义引物来产生5′-AGATCTTAAGAAGATAATTATGGCAATTGTGCT-3′(SEQ.ID.NO.102)PCR的条件为94℃ 1分钟,55℃ 1分钟,72℃ 1分30秒,共30个循环,其中使用内源AT1 cDNA克隆作为模板,并用商家提供的缓冲液系统及pfu聚合酶(Stratagene),另添加10%DMSO、每种引物0.25μM及4种核苷酸各0.5mM。用HindIII和EcoRI消化片段A(720bp)并进行亚克隆。片段B用BamHI消化并亚克隆至pCMV载体中,使EcoRI位点位于该克隆PCR片段的5′端。
DNA片段(片段C)编码具L225K突变的AT2的IC3,并且5′端带有EcoRI粘性末端和3′的AflIII粘性末端,该片段C通过与2个合成的寡核苷酸退火而产生的,寡核苷酸的序列如下5′-AATTCGAAAACACTTACTGAAGACGAATAGCTATGGGAAGAACAGGATAACCCGTGACCAAG-3′(SEQ.ID.NO.103)5′-TTAACTTGGTCACGGGTTATCCTGTTCTTCCCATAGCTATTCGTCTTCAGTAAGTGTTTTCG-3′(SEQ.ID.NO.104)片段C经EcoRI和AflII位点插入到片段B的前面,然后产生的克隆经EcoRI位点与片段A连接,产生带有AT2K255IC3的AT1。
4.A243+突变制备非内源人AT1受体还可以通过创造A243+突变(参见,核酸序列SEQ.ID.NO.105,及氨基酸序列SEQ.ID.NO.106)来实现。应用以下列PCR为基础的策略构建A243+突变。使用pfu聚合酶(Stratagene)及商家提供的缓冲液系统,另添加10%DMSO、每种引物0.25μM、4种核苷酸各0.5mM,进行两个PCR反应,所用的5′PCR有义引物序列如下5′-CCCAAGCTTCCCCAGGTGTATTTGAT-3′(SEQ.ID.NO.107)反义引物的序列如下5′-AAGCACAATTGCTGCATAATTATCTTAAAAATATCATC-3′(SEQ.ID.NO.108)所用的3′PCR有义引物的序列如下5′-AAGATAATTATGGCAGCAATTGTGCTTTTCTTTTTCTTT-3′(SEQ.ID.NO.109),其包含丙氨酸插入和反义引物5′-GTTGGATCCACATAATGCATTTTCTC-3′(SEQ.ID.NO.110)循环条件为94℃ 1分钟,54℃ 1分钟和72℃ 1分30秒,共25个循环。将等份的5′和3′PCR产物作为共同模板进行第二次PCR,使用5′PCR有义引物和3′PCR反义引物,此次PCR条件与第一次的一样,只是延伸时间改为2分30秒。产生的PCR引物用HindIII和BamHI酶切,并亚克隆到pCMV载体(参见,SEQ.ID.NO.105)中。
4.CCKB通过创造V322K突变(参见,核酸序列SEQ.ID.NO.111和氨基酸序列SEQ.ID.NO.112),制备非内源组成型活化的人CCKB受体。利用来自实施例1的野生型CCKB通过PCR扩增进行诱变。
用SEQ.ID.NO.75和包含V322K突变的反义引物来扩增第一个PCR片段(1.0kb)5′-CAGCAGCATGCGCTTCACGCGCTTCTTAGCCCAG-3′(SEQ.ID.NO.113)用包含V322K突变的有义引物5′-AGAAGCGCGTGAAGCGCATGCTGCTGGTGATCGTT-3′(SEQ.ID.NO.114)和SEQ.ID.NO.76来扩增第二个PCR片段(0.44kb)。
将产生的两个PCR片段作为模板,并使用SEQ.ID.NO.75和SEQ.ID.NO.76以及上述的系统和条件,来扩增包含V332K的CCKB。产生的1.44kb PCR片段包含V332K突变,将其用HindIII和EcoRI酶切后克隆到表达载体pCMV的HindIII-EcoRI位点(参见,SEQ.ID.NO.111)。
3.QuickChangTMSite-DirectedTM诱变应用QuickChangTMSite-DirectedTM诱变试剂盒(Stratagene,按商家说明)也能够制备非内源的人GPCR。内源GPCR优选作为模板,使用两个诱变引物,最好是赖氨酸诱变寡核苷酸和选择标记寡核苷酸(试剂盒附带)。为了方便起见,参入到人GPCR中的密码子突变及各自的寡核苷酸用标准方式记录(表H)。
表H受体密码子 赖氨酸诱变 选择标记名称突变(SEQ.ID.NO.)(SEQ.ID.NO.)
5′-3′方向,突变处被标上下划线5′-3′方向,hCHN3S284KATGGAGAAAAGAATCAATATATAGAACATAAGAATGTTCTATATA(11 TCTTTTGATTCTT5) TTCTCCAT(116)hCHN6L352KCGCTCTCTGGCCTTGAAGGCTGAGCGTGCGCGCACGCTCAGC(117) CTTCAAGGCCAGAGAGCG(118)hCHN8N235KCCCAGGAAAAAGGTGAAGAAAACTTTGACAGTCAAAGTTTTC(119)TTTCACCTTTTTCCTGGG(120)hCHN9G223KGGGGCGCGGGTGAAACGGCTCACCAGCCGGCTGGTGAGC(121)TTTCACCCGCGCCCC(122)hCHN10 L231KCCCCTTGAAAAGCCTAAG GATGACCAAGTTAACTTGGTCATC(123) CTTAGGCTTTTCAAGGGG(124)
第一天,将1×107个293T细胞接种到150mm的培养板上。第二天,准备两支试管(比例是每板用于一支试管)通过混合20μg DNA(例如pCMV载体、带有受体cDNA的pCMV载体,等)在1.2ml无血清的DMEM(Irvine Scientific,Irvine,CA)来制备试管A;通过混合120μllipofectamine(Gibco BRL)在1.2ml无血清DMEM中制备试管B。把试管A和B互倾混合(几次),然后在室温下温育30-45分钟。组合物被称为“转染组合物”。植出的293T细胞用1XPBS洗涤,然后加入10ml无血清的DMEM。把2.4ml转染组合物加入到细胞中去,然后在37℃/5%CO2下温育4小时。接着通过抽吸移去转染组合物,然后加入25ml的DMEM/10%胎牛血清。接着细胞在37℃/5%CO2温育。72小时后收获细胞并用来进行分析。
1.细胞膜结合试验[35S]GTPγS试验当G蛋白偶联受体在其活性状态,并作为配体结合或者作为组成型活化的结果时,受体与G蛋白偶联并刺激GDP的释放和其后GTP与G蛋白的结合。G蛋白-受体复合物的α亚基作为GTP酶并慢慢地水解GTP为GDP,在此点受体通常发生失活。组成型活化受体继续把GDP转化为GTP。不可水解的GTP类似物[35S]GTPγS,可被用来展示[35S]GTPγS与表达组成型活化受体的膜的增强的结合。应用[35S]GTPγS结合测定组成型活化的优点是(a)它对所有G蛋白偶联受体是普遍适用的;(b)它邻近细胞膜表面,在此处较少可能拣到遇到影响细胞内级联反应的分子。
此试验利用G蛋白偶联受体的刺激[35S]GTPγS与表达相关受体的细胞膜结合的能力。因此本测定可用于直接识别法去筛选针对已知、孤儿和组成型活化G蛋白偶联受体的候选化合物。本测定是普遍的并可用于针对所有G蛋白偶联受体的药物发现。GTPγS试验在20mM HEPES、1至大约20mM的MgCl2(尽管20mM是优选的,但这个剂量可针对结果的最优化进行调整)、pH7.4、含有在0.3和1.2nM之间的[35S]GTPγS(尽管1.2是优选的,但这个剂量可针对结果的最优进行调整)、12.5到75μg膜蛋白(例如,COS-7细胞表达受体,本剂量可为最优化进行调整,尽管75μg是优选的)和1μM GDP(这个剂量可针对结果的最优化进行改造)的结合缓冲液中温育一小时。接着加入麦胚凝集素小珠(25μl,Amersham),组合物在室温下再温育30分钟,然后试管在1500×g、室温下离心5分钟,并在闪烁计数器上记数。
另一个花费更少但同样可适用的方法已被识别,它也可满足大规模筛选的需要。Flash platesTM和WallacTM闪烁带可被用来格式化高处理量的[35S]GTPγS结合测定。进一步,利用此技术,本方法可用于已知的GPCR,它在通过[35S]GTPγS的结合监测化合物效应的同时,同时监测与受体结合的由氚标记的配体。这之所以可能的是因为Wallacβ计数器可以把能量窗口切换成监测氚和35S标记的探针。本方法也可用于侦查导致受体活化的其他类型的膜活化事件。例如,本方法可用于监测许多受体的32P磷酸化(针对G蛋白偶联受体和酪氨酸激酶受体)。当膜被离心到孔的底部时,结合的[35S]GTPγS或32P磷酸化的受体将要活化包被在孔上的闪烁剂。Scinti带(Wallac)已被用来展示这个原理。另外,本方法也可通过应用放射标记的配体用来测量与受体结合的配体。以相似的方式,当放射标记的结合的配体被离心到孔底时,闪烁带标记在位于标记的配体附近,这导致活化并被检测到。
2.腺苷酸环化酶设计用来进行基于细胞的测定的Flash PlateTM腺苷酸环化酶试剂盒(New England Nuclear;目录号SMP004A)被改进以应用于未加工的胞浆膜。闪烁板的孔含有闪烁剂包被层,其中含有识别cAMP的特异抗体。在孔中产生的cAMP通过直接和放射性cAMP示踪物竞争与cAMP抗体结合而被定量。下面是对测量在表达受体的膜上cAMP水平变化程序的简短描述。
在转染后大约3天收获转染细胞。通过在含有20mM pH 7.4的HEPES和10mM MgCl2的缓冲液中均质化悬浮的细胞来制备细胞膜。均质化是在冰上用Brinkman PolytronTM进行大约10秒钟。得到的均质化物在4℃、49,000×g离心15分钟。得到的沉淀物接着在含有20mMpH 7.4的HEPES和0.1mM EDTA缓冲液中悬浮,均质化10秒钟,然后在4℃、49,000×g离心15分钟。得到的沉淀可被贮藏在-4℃备用。在测量的当天,膜沉淀物在室温下被缓慢解冻,在含有20mM pH 7.4的HEPES和10mM MgCl2的缓冲液中重新悬浮(这些数量可被优化,尽管在此列举的数值是优选的),得到最终蛋白质浓度为0.60mg/ml(重新悬浮的膜放置在冰上备用)。
按照制造商的指令制备和维持cAMP标准品和检测缓冲液(含有2μCi示踪物[125] cAMP(100μl)]的11ml检测缓冲液)。为筛选用的试验缓冲液被新鲜制备,它含有20Mm pH 7.4的HEPES、10mM MgCl2、20mM(Sigma)、0.1单位/ml肌酸磷酸激酶(Sigma)、50μM GTP(Sigma)和0.2mM ATP(Sigma);试验缓冲液可在冰上贮存备用。首先加入50μl试验缓冲液、接着加入50μl膜悬浮物到NEN Flash Plate,以开始试验。得到的测定组合物在室温下温育60分钟,然后加入100μl检测缓冲液。培养板接着再温育2-4小时,然后用Wallac MicroBetaTM液闪计数器记数。cAMP/孔的数值从标准cAMP曲线外推,该曲线包括在每个测定板之内。
C.基于报告基因的测定1.CREB报告基因测定(Gs偶联受体)检测Gs刺激的方法依赖于转化因子CREB的已知性质,它是以cAMP依赖的方式被活化的。应用PathDetectTMCREB trans-ReportingSystem(Stratagene,Catalogue #219010)来检测在293和293T细胞中Gs偶联的活性。用上述系统的质粒成分和编码内源的或突变的受体的指明的表达质粒转染细胞,其使用哺乳动物细胞转染试剂盒(Stratagene,Catalogue #200285)并按照制造商的指令。简短而言,400ng pFR-Luc(荧光素酶报告基因质粒含有Gal4识别序列)、40ng pFA2-CREB(Gal4-CREB融合蛋白含有Gal4 DNA结合域)、80ng CMV-受体表达质粒(包括受体)和20ng CMV-SEAP(分泌的碱性磷酸酶表达质粒;碱性磷酸酶活性在转染细胞的培养基中测量,以控制在样品间转染效率的变化)在磷酸钙沉淀中按照试剂盒的指令进行混合。把沉淀的一半等量地分布在96孔培养板的3个孔中,保持细胞过夜,第二天上午置换新鲜培养基。转染后48小时,处理细胞并测定,例如,荧光素酶活性。
2.AP1报告基因测定(Gq偶联的受体)测定Gq刺激依赖的方法依赖于Gq依赖的磷脂酶C已知的特性,即它可引起在其启动子含有AP1元件的基因活化。按照上述CREB报告基因测定所说的程序,使用PathdetectTMAP-1 cis-Reporting System(Stratagene,Catalogue #219073),其中只是将磷酸钙沉淀的组分改为410ng pAP1-Luc、80ng pCMV-受体表达质粒和20ng CMV-SEAP。
3.CRE-Luc报告基因测定293和293T细胞以每孔2×104个细胞的密度植于96孔板上,第二天按商家说明用Lipofectamine试剂(BRL)进行转染,每6孔转染制备DNA/脂质混合物如下100μl DMEM中的260ng质粒DNA温和地与100μl DMEM中的2μl脂质混和(260ng质粒DNA由以下组成,200ng8×CRE-Luc报告质粒(参见下文和

图1,图1示意质粒的一部分),50ng包含内源受体或非内源受体的pCMV,或单独的pCMV,以及10ng GPRS表达质粒(GPRS在pcDNA3(Invitrogen)中))。8×CRE-Luc报告质粒的制备如下在pβgal基本载体(Clontech)的BblV-HindIII位点克隆鼠生长激素抑制因子的启动子(-711+51),获得SRIF-β-gal载体,8拷贝的cAMP应答元件通过PCR由腺病毒模板AdpCF126CCRE8获得(参见,7人基因疗法(Human Gene Therapy)1883(1996)),将之克隆到SRIF-β-gal载体的Kpn-BglV位点中,产生8×CRE-β-gal报告载体,用荧光素酶基因取代8×CRE-β-gal报告载体中的β-半乳糖苷酶基因,产生8×CRE-Lus报告质粒,所述荧光素酶基因取自pGL-3基本载体(Promega)的HindIII-BamHI位点。室温下放置30分钟后,DNA/脂质混合物用400μlDMEM稀释,每孔加入100μl稀释的混合物,在细胞培养箱中培养4小时后每孔中加入100μl含10%FCS的DMEM,第二天转染的细胞每孔换成200μl含10%FCS的DMEM,8小时后,用PBS清洗一次,各样品孔改为100μl不含酚红的DMEM。次日用LucLiteTM报告基因分析试剂盒(Packard),按商家说明和在1450 MicroBetaTM闪烁发光计数器(Wallac)上读数测定荧光素酶活性。
4.SRF-Luc报告基因测定检测Gq刺激的一个方法凭借Gq依赖性磷脂酶C的已知特性,引起启动子中包含血清应答因子的基因活化。PathdetectTMSRF-Luc报告系统(Stratagene)可用来分析Gq偶联的活性,比如在COS7细胞中分析Gq偶联的活性。应用Mammalian TransfectionTM试剂盒(Stratagene,Catalogue# 200285),用该系统中各种质粒及标明的编码内源或非内源GPCR的表达质粒,按商家说明转染细胞。简单地讲,410ng SRF-Luc、80ng pCMV受体表达质粒和20ng CMV-SEAP(分泌碱性磷酸酶的表达质粒;测定转染细胞培养基中碱性磷酸酶活性以控制样品间转染效率的差别),依各个商家的说明与磷酸钙沉淀组合在一起,一半的沉淀物等量地分配到96孔板的3个孔中,使细胞在无血清培养基中保持24小时。按要求,在最后5个小时细胞与1μM血管紧张素一起培养,然后溶解细胞,使用LucLiteTM试剂盒(Packard,cat# 6016911)和“Trilax1450 Microbeta”液体闪烁发光计数器(Wallac),按各个商家的说明分析荧光素酶活性,数据用GraphPad PrismTM2.0a软件分析(GraphPadSoftware Inc.)。
5.胞内IP3积累分析在第一天,含有5-羟色胺受体(内源的和/或非内源的)的细胞被接种于24孔培养板上,一般是1×105细胞/孔(虽然该数还可优化)。在第二天转染细胞,首先混合在50μl/孔无血清DMEM中的0.25μgDNA和在50μl/孔无血清DMEM中的2μl lipofectamine。轻轻地混合溶液并在室温下温育15-30分钟。用0.5ml PBS洗涤细胞,把400μl无血清培养基与转染培养基混合并加到细胞中。然后在37℃/5%CO2下温育细胞3-4小时,再移去转染培养基,替换为1ml/孔常规培养基。在第三天,用3H-肌醇标记细胞。简短地说,移去培养基,细胞用0.5mlPBS洗涤,接着加入0.5ml/孔无肌醇/无血清培养基(GIBCO BRL)和0.25μ Ci/孔3H-肌醇,在37℃/5%CO2下温育细胞16-18小时。在第四天,用0.5ml PBS洗涤细胞,加入0.45ml试验培养基,其中含有无肌醇/无血清培养基10μM巴吉林10mM氯化锂或0.4ml试验培养基和50μl 10×ketaserin(ket)以得到10μM的终浓度。然后在37℃温育细胞30分钟。用0.5ml PBS洗涤细胞,加入200μl/孔新鲜的/冰冷的终止液(1M KOH、18mM硼酸钠、3.8mM EDTA)。溶液在冰上放置5-10分钟或直到细胞被溶解,然后用200μl新鲜的/冰冷的中和液(7.5%HCl)中和。然后把裂解物转移到1.5ml离心管中,加入1ml/管氯仿/甲醇(1∶2)。然后使溶液涡旋15秒钟,把上层上样至Biorad AG1-X8TM阴离子交换树脂(100-200目)。首先,树脂以1∶1.25 W/V的比例用水洗涤,向柱中加载0.9ml的上层溶液。用10ml 5mM肌醇和10ml 5mM的硼酸钠/60mM甲酸钠洗涤柱子。肌醇三磷酸酯被洗提入液闪管中,其中含有10ml液闪鸡尾,它有2ml 0.1M甲酸/1M甲酸铵。通过用10ml0.1M甲酸/3M甲酸铵洗涤和用ddH2O洗涤两次来再生交换柱,柱子贮存在4℃的水中。
典型的结果列入下面表I。
表I产生的信号 产生的信号差异百受体 突变所用分析 内源形式非内源形式 分比(相对光单位) (相对光单位)hAT1 F239K SRF-LUC 34 137 75%↑AT2K2551C3 SRF-LUC 34 127 73%↑hTDAG8 I225K CRE-LUC 2,715 14,440 81%↑(293细胞)CRE-LucI225K(293T细胞) 65681 185,636 65%↑hH9 F236KCRE-LUC 1,887 6,096 69%↑hCCKB V332KCRE-LUC 785 3,223 76%↑C.基于细胞的检测分析(实施例-TDAG8)293细胞以每皿1.3×107个细胞的密度植于150mm平皿上,每皿用12μg不同的DNA和60μl Lipofectamine试剂(BRL)转染细胞。使被转染的细胞在含血清的培养基中生长,转染后4小时进行检测分析。为了在转染后48小时进行检测分析(分析比较有血清和无血清培养基;参见图3),将初始培养基变为有血清或无血清培养基。无血清培养基完全由Dulbecco改良的Eagle(DME)高葡萄糖培养基(lrvine Scientific#9024)组成。除以上DME培养基外,有血清培养基还含有下列成分10%胎牛血清(Hyclone#SH30071.03),1%的100mM丙酮酸钠(lrvineScientific #9334),1%的20mM L-谷氨酰胺(lrvine Scientific #9317),及1%的青霉素-链霉素溶液(lrvine Scientific #9366)。
使用96孔腺苷酸环化酶活化FlashplateTM(NEN#SMP004A)。首先,将50μl分析用的标准物加到板中,每孔设一个重复,浓度范围从每孔50pmol到0pmol cAMP。标准的cAMP(NEN#SMP004A)在水中重建,用1×PBS(lrvine Scientific#9204)作连续稀释。进一步,将50μl激发缓冲液(NEN#SMP004A)加到所有孔中。在应用化合物测定cAMP的活化或失活的情况下,将10μl用水稀释的每种化合物加到各自的样品孔中,重复三次,所用的不同终浓度从1μM到1mM。腺苷5′-三磷酸(ATP)(Research Biochemicals International#A-141)和腺苷5′-二磷酸(ADP)(Sigma#2754)用于分析。下一步,转染24小时(有血清培养基的检测)或48小时(对有血清和无血清培养基进行比较的检测)后,收集用各自的cDNA(CMV或TDAG8)转染的293细胞,吸出培养基,细胞用1×PBS清洗一次,然后将5ml 1×PBS与3ml细胞游离缓冲液(Sigma#C-1544)一起加到细胞中,解离下的细胞转移到离心管中,室温下离心5分钟,去除上清液,细胞沉淀重悬于适量的1×PBS中至终浓度为每毫升2×106个细胞。50μl在1×PBS中的细胞(1×105细胞/孔)加到含有化合物的样品孔中,室温下将培养板在摇床上温育15分钟。制备含有示踪cAMP的测定缓冲液,在11ml测定缓冲液中(NEN#SMP004A),加入50μl(相当于1μCi)[125I]cAMP(NEN#SMP004A),放置后,50μl这种含有示踪cAMP的测定缓冲液加到每个样品孔中,将培养板放置在摇床上,室温下培养2小时。最后吸出板上样品孔中的溶液,闪光板用Wallac MicroBetaTM闪烁计数器计数。
在图2A中,ATP和ADP结合到内源TDAG8上,导致cAMP分别增加大约59%和55%。图2B证明ATP和ADP结合到在有血清和无血清培养基中转染和生长的内源TDAG8上,ATP结合到生长于有血清培养基中的内源TDAG8上,证明与没有化合物的内源TDAG8相比cAMP增加大约65%,在无血清培养基中增加大约68%。证明ADP在有血清培养基中结合内源TDAG8,增加大约61%,而在无血清培养基中,ADP结合证明增加大约62%。ATP和ADP结合内源TDAG8的EC50值分别为139.8μM和120.5μM(数据未显示)。
虽然图2B给出的结果表明有血清和无血清培养基相比结果基本一样,我们还是选择使用有血清的培养基,尽管无血清培养基也可应用。
TDAG8经Gs偶联,而H9经Gz偶联,对于下列典型的GPCR融合蛋白,实现了与Gsα的融合。
TDAG8(I225K)-Gsα融合蛋白构建体的制备如下引物设计如下
5′-gatcTCTAGAATGAACAGCACATGTATTGAAG-3′-(SEQ.ID.NO.125;有义)5′ctagGGTACCCGCTCAAGGACCTCTAATTCCATAG-3′-(SEQ.ID.NO.126,反义)小帽中的核苷酸作为间隔子包含在G蛋白与TDAG8间的限制性位点中,有义和反义引物分别包含了XbaI和KpnI限制性位点。
然后应用PCR得到各个受体序列,用于上面公开的Gsα通用载体中的融合,各PCR使用以下程序100ng TDAG8 cDNA加到不同的管中,其中各管含有每个引物(有义和反义)2μl,3μl 10mM dNTPs,10μl10×TaqPlusTM精确缓冲液,1μl TaqPlusTM精确聚合酶(Stratagene#600211),及80μl水。用于TDAG8的反应温度和循环时间如下初始变性步骤在94℃下进行5分钟,然后进行94℃ 30秒;55℃ 30秒;72℃ 2分钟的循环,最后延伸时间在72℃下进行10分钟。PCR产物走1%琼脂糖凝胶,然后纯化(数据未显示),纯化产物用XbaI和KpnI(New England Biolabs)酶切,所需的插入片段经纯化连接到Gs通用载体中各自的限制性位点。转化后分离阳性克隆并用限制性酶酶切确认;用293细胞按下述程序实现表达,对TDAG8Gs融合蛋白的每个阳性克隆进行测序以证实正确性。
对包含非内源组成型活化的TDAG8(I225K)GPCR融合蛋白进行了如上分析并证实了组成型活化。
H9(F236K)-Gsα融合蛋白构建体的制备如下引物设计如下5′-TTAgatatcGGGGCCCACCCTAGCGGT-3′(SEQ.ID.NO.145;有义)5′ggtaccCCCACAGCCATTTCATCAGGATC-3′(SEQ.ID.NO.2146;反义)小帽中的核苷酸作为间隔子被包含在G蛋白与H9之间的限制性位点中,有义和反义引物分别包含EcoRV和KpnI限制位点,因而间隔子(归因于限制性位点)存在于G蛋白与H9之间。
然后应用PCR得各个受体序列,用于在上面公开的Gsα通用载体中的融合,每次PCR使用以下规程80ng H9 cDNA加到不同的管中,其中各管均含有每个引物(有义和反义)100ng和45μl PCRSupermixTM(Gibco-Brl,Life Tech)(50μl总反应体积)。用于H9的反应温度和循环时间如下初始变性步骤在94℃下进行1分钟,接着进行一个94℃ 30秒;55℃ 30秒;72℃ 2分钟的循环,最后延伸时间在72℃下进行7分钟,使PCR产物走1%琼脂糖凝胶,然后纯化(数据未显示),将纯化出的产物克隆到pCRII-TOPOTM系统中,随后确定阳性克隆。分离阳性克隆,用EcoRV和KpnI(New England Biolabs)酶切,分离出所需的插入片段,经纯化连接到Gs通用载体中各自的限制性位点上。转化后分离阳性克隆,并经限制性酶酶切确认;用293细胞按下述规程实现表达,对H9(F236K)Gs-融合蛋白的每个阳性克隆进行测序以证实正确性。将膜冷冻(-80℃)备用。
为了证实能够测定由Gs蛋白介导的cAMP应答的能力(虽然H9与Gz偶联),以NEN腺苷酸环化酶活化FlashplateTM分析试剂盒(96孔规格)为基础,使用下面的cAMP膜分析。“结合缓冲液”的组成为10mMHEPES,100mM NaCl和10mM MgCl2(pH7.4),“再生缓冲液”用结合缓冲液制备,其中含20mM磷酸肌酸,20U肌酸磷酸激酶,20μM GTP,0.2mM ATP,及0.6mM IBMX。“cAMP标准物”用结合缓冲液制备,其组成如下CAMP原液 加到指定数量分析终浓度(2ml水中5,000pmol/ml) 结合缓冲液 (50μl到100μl中)单位μl 得到指定的pmol/孔A 250 1ml50B 500A500μl 25C 500B500μl 12.5D 500C750μl 5.0E 500D500μl 2.5F 500E500μl 1.25G 500F750μl 0.5将冷冻的膜(pCMV对照和非内源H(-Gs融合蛋白))解冻(室温下置于冰上直至溶液中),膜用polytron匀化至悬浮状态(2×15秒),膜蛋白浓度用Bradford分析规程(参见下文)确定,膜浓度用再生缓冲液稀释成0.5mg/ml(分析终浓度为25μg/孔)。此后,将50μl结合缓冲液加到各孔中。作为对照,将50μl/孔cAMP标准物加到第11排孔和12排A-G孔,12H孔只加结合缓冲液(96孔格式),此后,50μl/孔蛋白加到孔中,室温下(摇床上)放置60分钟,将100μl[125I]cAMP测定缓冲液(参见下文)加到每孔中,(最终的----50μl[125I]cAMP加入到11ml测定缓冲液中)。室温下再温育2小时,培养板用8道支管吸净,并用板盖盖住。结果(结合的cAMP的pmole数)用WallacTM1450在“Prot#15”上读取。结果在图3中给出。
图3给出的结果表明,Gs偶联的融合蛋白能够驱动环化酶反应,因而测定H9(F236K)的组成型活化是可行的,基于这些结果,应用基于环化酶的分析,有可能直接识别作为反激活剂、激活剂和部分激活剂的候选化合物。实施例6规程用[35S]GTPγS直接识别反激活剂和激活剂虽然我们已将内源组成型活性的GPCR用于直接识别(例如)作为如反激活剂的候选化合物,由于不完全了解的原因,分析内的误差会变得加重。那么,如上公开的GPCR融合蛋白也优选与非内源组成型活化的GPCR一起应用。我们已经确定使用这样的蛋白,分析内误差看起来基本稳定,因此获得有效的信噪比。这有利于对候选化合物进行更加充分的识别。因此,对于直接识别,比较好的是使用GPCR融合蛋白,并且在用时,优选用到下面的分析规程。膜制备包含目的内源组成型活性孤儿GPCR融合蛋白的膜和用于直接识别作为反激活剂、激活剂或部分激活剂的候选化合物的膜,优选按如下步骤制备如下a.材料“膜提取缓冲液”由20mM HEPES和10mM EDTA组成,pH7.4;“膜清洗缓冲液”由20mM HEPES和0.1mM EDTA组成,pH7.4;“结合缓冲液”由20mM HEPES、100mM NaCl及10mM MgCl2组成,pH7.4。
b.步骤整个过程中所有材料均置于冰上。首先,将培养基从汇合的单层细胞中吸去,随后用10ml冷的PBS清洗,随后吸掉,这之后将5ml膜提取缓冲液加到提取细胞上,随后将细胞提取物转移到50ml离心管中(4℃下20,000rpm离心17分钟),这之后吸出上清液,将沉淀重悬于30ml膜清洗缓冲液,随后4℃下20,000rpm离心17分钟,然后吸出上清液,沉淀重悬于结合缓冲液中,然后用Brinkman polytronTM均化器进行均化(15-20秒剧烈振动直到所有材料处悬浮状态),此处称之为“膜蛋白”。Bradford蛋白分析均化以后,这些膜的蛋白浓度用Bradford蛋白分析确定。(蛋白可以稀释成大约1.5mg/ml,等份分装和冷冻(-80℃)备用;冷冻状态下,所用规程如下分析的当天,将冷冻的膜蛋白室温下溶化,随后用涡旋振荡器,然后用polytron以大约12×1000rpm均化5~10秒;请注意,对于多次制备,不同制备物的均化之间应该彻底洗净均化器。
a.材料结合缓冲液(如上);Bradford染色试剂,Bradford蛋白标准物,按商家说明使用(Biorad,cat.no.500-0006)。
b.步骤准备两个试管,一个含有膜,一个作为“空白”对照。每管装入800μl结合缓冲液,之后将10μl Bradford蛋白标准物(1mg/ml)加到每个试管中,然后10μl膜蛋白只加到一个试管中(空白管中不加),这之后200μl Bradford染色试剂加到每个试管中,随后每个试管经涡旋振荡,5分钟后,试管再次涡旋振荡,将其中的材料转移到比色杯中,然后比色杯用CECIL 3041分光光度计在595波长下读数。直接识别分析a.材料GDP缓冲液由37.5ml结合缓冲液和2mg GDP(Sigma,cat.no.G.7127)组成,随后用结合缓冲液作一系列稀释以得到0.2μM GDP(每孔中GDP的终浓度为0.1μM GDP);每孔含有一种候选化合物,终体积为200μl,其中有100μl GDP缓冲液(终浓度0.1μM GDP),50μl悬浮于结合缓冲液中的膜蛋白,及50μl溶于结合缓冲液中的[35S]GTPγS(0.6nM)(每10ml结合缓冲液2.5μl[35S]GTPγS).
b.步骤候选化合物最是用96-孔板筛选(可以在-80℃冷冻),将膜蛋白(或带有除了GPCR融合蛋白的表达载体的膜,作为对照)简单地均化至悬浮状态,然后用上述的Bradford蛋白分析确定蛋白浓度。然后膜蛋白(和对照)用结合缓冲液稀释成0.25mg/ml(最终分析浓度,12.5μg/孔),这之后,100μl GDP缓冲液加到Wallac ScintistripTM(Wallac)的每个样品孔中,然后用5μl针具将5μl候选化合物转移到这些样品孔中(5μl在200μl总分析体积中为1∶40比例因而候选化合物最终的筛选浓度10μM)。再有,为避免污染,每次转移步骤后,针具应该清洗三次包括水(1X),乙醇(1X)和水(2X)----多余液体在每次清洗后甩掉,用纸和kimwipe干燥。这之后50μl膜蛋白加到每个样品孔中(对照样品孔含有不带GPCR融合蛋白的膜),室温下预育5-10分钟,这之后,50μl结合缓冲液中的[35S]GTPγS(0.6nM)加到每个样品孔中,随后室温下于摇床上温育60分钟(再有,本实施例中,培养板用金属箔盖住。然后将板以4000RPM22℃下旋转15分钟终止分析,然后用8道支管吸净板,用板盖盖住,最后板用设置在“Prot.#37”档(依各商家说明)的Wallac 1450读数。
最好是应用经改进的FlashPlateTM腺苷酸环化酶试剂盒(NewEngland;Cat.no.SMP004A),按下面的规程证实直接识别的候选化合物作为内源组成型活化的孤儿GPCR的反激活剂和激活剂。
转染后大约三天收集转染细胞,在含有20mM HEPES(pH7.4)和10mM MgCl2的缓冲液中,通过将悬浮的细胞均化来制备膜,用Brinkman PolytronTM在冰上进行均化大约10秒,产生的匀浆4℃下49,000×g离心15分钟,然后产生的沉淀重悬于含有20mM HEPES(pH7.4)和0.1mM EDTA的缓冲液中,均化10秒,随后4℃下49,000×g离心15分钟,产生的沉淀-80℃保存备用。直接识别筛选当天,将膜沉淀于室温下缓慢融化,并重悬于含有20mM HEPES(pH7.4)和10mMMgCl2的缓冲液中,产生0.6mg/ml的最终蛋白浓度(重悬的膜置于冰上备用)。
cAMP标准物和测定缓冲液(2μCi示踪物[125I cAMP 100μl]加到11ml测定缓冲液中),根据商家说明制备并保管。制备新鲜的分析缓冲液用于筛选,其中包含20mM HEPES(pH7.4),10mM MgCl2,20mM磷酸肌酸(Sigma),0.1单位/ml肌酸磷酸激酶(Sigma),50μM GTP(Sigma),及0.2mM ATP(Sigma);分析缓冲液可在冰上保存备用。
优选将以上识别的候选化合物(如冷冻,室温下融化)加到96孔板的样品孔中(3μl/孔,12μM的分析终浓度),与40μl膜蛋白(30μg/孔)和50μl分析缓冲液合在一起。然后将该混合物在室温下温育30分钟,同时轻轻摇动。
温育完成后,100μl测定缓冲液加到每个样品孔中,随后放置2~4小时,然后板在Wallac MicroBetaTM读板器中用“Prot.#31”档计数(依各商家说明操作)。
本专利申请文件中提到的每个专利、申请及印刷出版物以其全文引入本申请作参考。
本领域的普通技术人员将认识到在不背离本发明精神和实质的前提下,可以对本发明的优选实施方案做许多许多改变和修改。这些修改和变化均在本发明的范围之内。
虽然本领域的普通技术人员可以得到许多不同的载体为内源和非内源GPCR的目的使用,但最好是用pCMV载体。按照国际承认用于专利程序的微生物保存布达佩斯条约,该载体于1998年10月13日保存在美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(University Blvd,Manassas,VA20110-2209 USA7)。其DNA经ATCC测定并得到确认,ATCC为pCMV给出了下列保藏号ATCC#203351。
序列表(1)一般资料(i)申请人多米尼克·P·比汉;卡琳·莱曼-布鲁因斯玛;德里克·T·查默斯;陈若平;邓杭;马丁·戈尔;廖王蓁;林伊玲;凯文·洛斯;卡罗尔·怀特(ii)发明名称非内源的被组成型活化的人G蛋白偶联的受体(iii)序列数146(iv)通讯地址(A)收信人阿瑞那制药公司(B)Nancy Ridge大道6166号(C)城市圣地亚哥(D)州加利福尼亚州(E)国家美国(F)邮编92121(v)计算机可读形式(A)介质类型软盘(B)计算机IBM个人兼容机(C)操作系统PC-DOS/MS-DOS(D)软件PatentIn Release #1.0,#1.30版(vi)本申请资料(A)申请号(B)申请日(C)分类号(viii)代理人信息(A)姓名Burgoon,Richard P.
(B)登记号34787(ix)电讯信息(A)电话(858)453-7200(B)电传(858)453-7210(2)SEQ ID NO1的资料(i)序列特征(A)长度1260个碱基对
(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO1的序列描述ATGGTCTTCT CGGCAGTGTT GACTGCGTTC CATACCGGGA CATCCAACAC AACATTTGTC 60GTGTATGAAA ACACCTACAT GAATATTACA CTCCCTCCAC CATTCCAGCA TCCTGACCTC 120AGTCCATTGC TTAGATATAG TTTTGAAACC ATGGCTCCCA CTGGTTTGAG TTCCTTGACC 180GTGAATAGTA CAGCTGTGCC CACAACACCA GCAGCATTTA AGAGCCTAAA CTTGCCTCTT 240CAGATCACCC TTTCTGCTAT AATGATATTC ATTCTGTTTG TGTCTTTTCT TGGGAACTTG 300GTTGTTTGCC TCATGGTTTA CCAAAAAGCT GCCATGAGGT CTGCAATTAA CATCCTCCTT 360GCCAGCCTAG CTTTTGCAGA CATGTTGCTT GCAGTGCTGA ACATGCCCTT TGCCCTGGTA 420ACTATTCTTA CTACCCGATG GATTTTTGGG AAATTCTTCT GTAGGGTATC TGCTATGTTT 480TTCTGGTTAT TTGTGATAGA AGGAGTAGCC ATCCTGCTCA TCATTAGCAT AGATAGGTTC 540CTTATTATAG TCCAGAGGCA GGATAAGCTA AACCCATATA GAGCTAAGGT TCTGATTGCA 600GTTTCTTGGG CAACTTCCTT TTGTGTAGCT TTTCCTTTAG CCGTAGGAAA CCCCGACCTG 660CAGATACCTT CCCGAGCTCC CCAGTGTGTG TTTGGGTACA CAACCAATCC AGGCTACCAG 720GCTTATGTGA TTTTGATTTC TCTCATTTCT TTCTTCATAC CCTTCCTGGT AATACTGTAC 780TCATTTATGG GCATACTCAA CACCCTTCGG CACAATGCCT TGAGGATCCA TAGCTACCCT 840GAAGGTATAT GCCTCAGCCA GGCCAGCAAA CTGGGTCTCA TGAGTCTGCA GAGACCTTTC 900CAGATGAGCA TTGACATGGG CTTTAAAACA CGTGCCTTCA CCACTATTTT GATTCTCTTT 960GCTGTCTTCA TTGTCTGCTG GGCCCCATTC ACCACTTACA GCCTTGTGGC AACATTCAGT 1020AAGCACTTTT ACTATCAGCA CAACTTTTTT GAGATTAGCA CCTGGCTACT GTGGCTCTGC 1080TACCTCAAGT CTGCATTGAA TCCGCTGATC TACTACTGGA GGATTAAGAA ATTCCATGAT 1140GCTTGCCTGG ACATGATGCC TAAGTCCTTC AAGTTTTTGC CGCAGCTCCC TGGTCACACA 1200AAGCGACGGA TACGTCCTAG TGCTGTCTAT GTGTGTGGGG AACATCGGAC GGTGGTGTGA 1260(3)SEQ ID NO2的资料(i)序列特征(A)长度419个氨基酸(B)类型氨基酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO2的序列描述Met Val Phe Ser Ala Val Leu Thr Ala Phe His Thr Gly Thr Ser Asn1 5 10 15Thr Thr Phe Val Val Tyr Glu Asn Thr Tyr Met Asn Ile Thr Leu Pro20 25 30Pro Pro Phe Gln His Pro Asp Leu Ser Pro Leu Leu Arg Tyr Ser Phe35 40 45Glu Thr Met Ala Pro Thr Gly Leu Ser Ser Leu Thr Val Asn Ser Thr50 55 60Ala Val Pro Thr Thr Pro Ala Ala Phe Lys Ser Leu Asn Leu Pro Leu65 70 75 80Gln Ile Thr Leu Ser Ala Ile Met Ile Phe Ile Leu Phe Val Ser Phe85 90 95Leu Gly Asn Leu Val Val Cys Leu Met Val Tyr Gln Lys Ala Ala Met100 105 110Arg Ser Ala Ile Asn Ile Leu Leu Ala Ser Leu Ala Phe Ala Asp Met115 120 125Leu Leu Ala Val Leu Asn Met Pro Phe Ala Leu Val Thr Ile Leu Thr130 135 140Thr Arg Trp Ile Phe Gly Lys Phe Phe Cys Arg Val Ser Ala Met Phe145 150 155 160Phe Trp Leu Phe Val Ile Glu Gly Val Ala Ile Leu Leu Ile Ile Ser165 170 175Ile Asp Arg Phe Leu Ile Ile Val Gln Arg Gln Asp Lys Leu Asn Pro180 185 190Tyr Arg Ala Lys Val Leu Ile Ala Val Ser Trp Ala Thr Ser Phe Cys195 200 205Val Ala Phe Pro Leu Ala Val Gly Asn Pro Asp Leu Gln Ile Pro Ser210 215 220Arg Ala Pro Gln Cys Val Phe Gly Tyr Thr Thr Asn Pro Gly Tyr Gln225 230 235 240Ala Tyr Val Ile Leu Ile Ser Leu Ile Ser Phe Phe Ile Pro Phe Leu245 250 255Val Ile Leu Tyr Ser Phe Met Gly Ile Leu Asn Thr Leu Arg His Asn260 265 270
Ala Leu Arg Ile His Ser Tyr Pro Glu Gly Ile Cys Leu Ser Gln Ala275 280 285Ser Lys Leu Gly Leu Met Ser Leu Gln Arg Pro Phe Gln Met Ser Ile290 295 300Asp Met Gly Phe Lys Thr Arg Ala Phe Thr Thr Ile Leu Ile Leu Phe305 310 315 320Ala Val Phe Ile Val Cys Trp Ala Pro Phe Thr Thr Tyr Ser Leu Val325 330 335Ala Thr Phe Ser Lys His Phe Tyr Tyr Gln His Asn Phe Phe Glu Ile340 345 350Ser Thr Trp Leu Leu Trp Leu Cys Tyr Leu Lys Ser Ala Leu Asn Pro355 360 365Leu Ile Tyr Tyr Trp Arg Ile Lys Lys Phe His Asp Ala Cys Leu Asp370 375 380Met Met Pro Lys Ser Phe Lys Phe Leu Pro Gln Leu Pro Gly His Thr385 390 395 400Lys Arg Arg Ile Arg Pro Ser Ala Val Tyr Val Cys Gly Glu His Arg405 410 415Thr Val Val(4)SEQ ID NO3的资料(i)序列特征(A)长度1119个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO3的序列描述ATGTTAGCCA ACAGCTCCTC AACCAACAGT TCTGTTCTCC CGTGTCCTGA CTACCGACCT 60ACCCACCGCC TGCACTTGGT GGTCTACAGC TTGGTGCTGG CTGCCGGGCT CCCCCTCAAC 120GCGCTAGCCC TCTGGGTCTT CCTGCGCGCG CTGCGCGTGC ACTCGGTGGT GAGCGTGTAC 180ATGTGTAACC TGGCGGCCAG CGACCTGCTC TTCACCCTCT CGCTGCCCGT TCGTCTCTCC 240TACTACGCAC TGCACCACTG GCCCTTCCCC GACCTCCTGT GCCAGACGAC GGGCGCCATC 300TTCCAGATGA ACATGTACGG CAGCTGCATC TTCCTGATGC TCATCAACGT GGACCGCTAC 360GCCGCCATCG TGCACCCGCT GCGACTGCGC CACCTGCGGC GGCCCCGCGT GGCGCGGCTG 420CTCTGCCTGG GCGTGTGGGC GCTCATCCTG GTGTTTGCCG TGCCCGCCGC CCGCGTGCAC 480AGGCCCTCGC GTTGCCGCTA CCGGGACCTC GAGGTGCGCC TATGCTTCGA GAGCTTCAGC 540GACGAGCTGT GGAAAGGCAG GCTGCTGCCC CTCGTGCTGC TGGCCGAGGC GCTGGGCTTC 600CTGCTGCCCC TGGCGGCGGT GGTCTACTCG TCGGGCCGAG TCTTCTGGAC GCTGGCGCGC 660CCCGACGCCA CGCAGAGCCA GCGGCGGCGG AAGACCGTGC GCCTCCTGCT GGCTAACCTC 720GTCATCTTCC TGCTGTGCTT CGTGCCCTAC AACAGCACGC TGGCGGTCTA CGGGCTGCTG 780CGGAGCAAGC TGGTGGCGGC CAGCGTGCCT GCCCGCGATC GCGTGCGCGG GGTGCTGATG 840GTGATGGTGC TGCTGGCCGG CGCCAACTGC GTGCTGGACC CGCTGGTGTA CTACTTTAGC 900GCCGAGGGCT TCCGCAACAC CCTGCGCGGC CTGGGCACTC CGCACCGGGC CAGGACCTCG 960GCCACCAACG GGACGCGGGC GGCGCTCGCG CAATCCGAAA GGTCCGCCGT CACCACCGAC 1020GCCACCAGGC CGGATGCCGC CAGTCAGGGG CTGCTCCGAC CCTCCGACTC CCACTCTCTG 1080TCTTCCTTCA CACAGTGTCC CCAGGATTCC GCCCTCTGA1119(5)SEQ ID NO4的资料(i)序列特征(A)长度372个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO4的序列描述Met Leu Ala Asn Ser Ser Ser Thr Asn Ser Ser Val Leu Pro Cys Pro1 5 10 15Asp Tyr Arg Pro Thr His Arg Leu His Leu Val Val Tyr Ser Leu Val20 25 30Leu Ala Ala Gly Leu Pro Leu Asn Ala Leu Ala Leu Trp Val Phe Leu35 40 45Arg Ala Leu Arg Val His Ser Val Val Ser Val Tyr Met Cys Asn Leu50 55 60Ala Ala Ser Asp Leu Leu Phe Thr Leu Ser Leu Pro Val Arg Leu Ser65 70 75 80Tyr Tyr Ala Leu His His Trp Pro Phe Pro Asp Leu Leu Cys Gln Thr
85 90 95Thr Gly Ala Ile Phe Gln Met Asn Met Tyr Gly Ser Cys Ile Phe Leu100 105 110Met Leu Ile Asn Val Asp Arg Tyr Ala Ala Ile Val His Pro Leu Arg115 120 125Leu Arg His Leu Arg Arg Pro Arg Val Ala Arg Leu Leu Cys Leu Gly130 135 140Val Trp Ala Leu Ile Leu Val Phe Ala Val Pro Ala Ala Arg Val His145 150 155 160Arg Pro Ser Arg Cys Arg Tyr Arg Asp Leu Glu Val Arg Leu Cys Phe165 170 175Glu Ser Phe Ser Asp Glu Leu Trp Lys Gly Arg Leu Leu Pro Leu Val180 185 190Leu Leu Ala Glu Ala Leu Gly Phe Leu Leu Pro Leu Ala Ala Val Val195 200 205Tyr Ser Ser Gly Arg Val Phe Trp Thr Leu Ala Arg Pro Asp Ala Thr210 215 220Gln Ser Gln Arg Arg Arg Lys Thr Val Arg Leu Leu Leu Ala Asn Leu225 230 235 240Val Ile Phe Leu Leu Cys Phe Val Pro Tyr Asn Ser Thr Leu Ala Val245 250 255Tyr Gly Leu Leu Arg Ser Lys Leu Val Ala Ala Ser Val Pro Ala Arg260 265 270Asp Arg Val Arg Gly Val Leu Met Val Met Val Leu Leu Ala Gly Ala275 280 285Asn Cys Val Leu Asp Pro Leu Val Tyr Tyr Phe Ser Ala Glu Gly Phe290 295 300Arg Asn Thr Leu Arg Gly Leu Gly Thr Pro His Arg Ala Arg Thr Ser305 310 315 320Ala Thr Asn Gly Thr Arg Ala Ala Leu Ala Gln Ser Glu Arg Ser Ala325 330 335Val Thr Thr Asp Ala Thr Arg Pro Asp Ala Ala Ser Gln Gly Leu Leu340 345 350Arg Pro Ser Asp Ser His Ser Leu Ser Ser Phe Thr Gln Cys Pro Gln355 360 365Asp Ser Ala Leu370
(6)SEQ ID NO5的资料(i)序列特征(A)长度1107个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO5的序列描述ATGGCCAACT CCACAGGGCT GAACGCCTCA GAAGTCGCAG GCTCGTTGGG GTTGATCCTG 60GCAGCTGTCG TGGAGGTGGG GGCACTGCTG GGCAACGGCG CGCTGCTGGT CGTGGTGCTG 120CGCACGCCGG GACTGCGCGA CGCGCTCTAC CTGGCGCACC TGTGCGTCGT GGACCTGCTG 180GCGGCCGCCT CCATCATGCC GCTGGGCCTG CTGGCCGCAC CGCCGCCCGG GCTGGGCCGC 240GTGCGCCTGG GCCCCGCGCC ATGCCGCGCC GCTCGCTTCC TCTCCGCCGC TCTGCTGCCG 300GCCTGCACGC TCGGGGTGGC CGCACTTGGC CTGGCACGCT ACCGCCTCAT CGTGCACCCG 360CTGCGGCCAG GCTCGCGGCC GCCGCCTGTG CTCGTGCTCA CCGCCGTGTG GGCCGCGGCG 420GGACTGCTGG GCGCGCTCTC CCTGCTCGGC CCGCCGCCCG CACCGCCCCC TGCTCCTGCT 480CGCTGCTCGG TCCTGGCTGG GGGCCTCGGG CCCTTCCGGC CGCTCTGGGC CCTGCTGGCC 540TTCGCGCTGC CCGCCCTCCT GCTGCTCGGC GCCTACGGCG GCATCTTCGT GGTGGCGCGT 600CGCGCTGCCC TGAGGCCCCC ACGGCCGGCG CGCGGGTCCC GACTCCGCTC GGACTCTCTG 660GATAGCCGCC TTTCCATCTT GCCGCCGCTC CGGCCTCGCC TGCCCGGGGG CAAGGCGGCC 720CTGGCCCCAG CGCTGGCCGT GGGCCAATTT GCAGCCTGCT GGCTGCCTTA TGGCTGCGCG 780TGCCTGGCGC CCGCAGCGCG GGCCGCGGAA GCCGAAGCGG CTGTCACCTG GGTCGCCTAC 840TCGGCCTTCG CGGCTCACCC CTTCCTGTAC GGGCTGCTGC AGCGCCCCGT GCGCTTGGCA 900CTGGGCCGCC TCTCTCGCCG TGCACTGCCT GGACCTGTGC GGGCCTGCAC TCCGCAAGCC 960TGGCACCCGC GGGCACTCTT GCAATGCCTC CAGAGACCCC CAGAGGGCCC TGCCGTAGGC 1020CCTTCTGAGG CTCCAGAACA GACCCCCGAG TTGGCAGGAG GGCGGAGCCC CGCATACCAG 1080GGGCCACCTG AGAGTTCTCT CTCCTGA 1107(7)SEQ ID NO6的资料(i)序列特征(A)长度368个氨基酸
(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO6的序列描述Met Ala Asn Ser Thr Gly Leu Asn Ala Ser Glu Val Ala Gly Ser Leu1 5 10 15Gly Leu Ile Leu Ala Ala Val Val Glu Val Gly Ala Leu Leu Gly Asn20 25 30Gly Ala Leu Leu Val Val Val Leu Arg Thr Pro Gly Leu Arg Asp Ala35 40 45Leu Tyr Leu Ala His Leu Cys Val Val Asp Leu Leu Ala Ala Ala Ser50 55 60Ile Met Pro Leu Gly Leu Leu Ala Ala Pro Pro Pro Gly Leu Gly Arg65 70 75 80Val Arg Leu Gly Pro Ala Pro Cys Arg Ala Ala Arg Phe Leu Ser Ala85 90 95Ala Leu Leu Pro Ala Cys Thr Leu Gly Val Ala Ala Leu Gly Leu Ala100 105 110Arg Tyr Arg Leu Ile Val His Pro Leu Arg Pro Gly Ser Arg Pro Pro115 120 125Pro Val Leu Val Leu Thr Ala Val Trp Ala Ala Ala Gly Leu Leu Gly130 135 140Ala Leu Ser Leu Leu Gly Pro Pro Pro Ala Pro Pro Pro Ala Pro Ala145 150 155 160Arg Cys Ser Val Leu Ala Gly Gly Leu Gly Pro Phe Arg Pro Leu Trp165 170 175Ala Leu Leu Ala Phe Ala Leu Pro Ala Leu Leu Leu Leu Gly Ala Tyr180 185 190Gly Gly Ile Phe Val Val Ala Arg Arg Ala Ala Leu Arg Pro Pro Arg195 200 205Pro Ala Arg Gly Ser Arg Leu Arg Ser Asp Ser Leu Asp Ser Arg Leu210 215 220Ser Ile Leu Pro Pro Leu Arg Pro Arg Leu Pro Gly Gly Lys Ala Ala225 230 235 240Leu Ala Pro Ala Leu Ala Val Gly Gln Phe Ala Ala Cys Trp Leu Pro
245 250 255Tyr Gly Cys Ala Cys Leu Ala Pro Ala Ala Arg Ala Ala Glu Ala Glu260 265 270Ala Ala Val Thr Trp Val Ala Tyr Ser Ala Phe Ala Ala His Pro Phe275 280 285Leu Tyr Gly Leu Leu Gln Arg Pro Val Arg Leu Ala Leu Gly Arg Leu290 295 300Ser Arg Arg Ala Leu Pro Gly Pro Val Arg Ala Cys Thr Pro Gln Ala305 310 315 320Trp His Pro Arg Ala Leu Leu Gln Cys Leu Gln Arg Pro Pro Glu Gly325 330 335Pro Ala Val Gly Pro Ser Glu Ala Pro Glu Gln Thr Pro Glu Leu Ala340 345 350Gly Gly Arg Ser Pro Ala Tyr Gln Gly Pro Pro Glu Ser Ser Leu Ser355 360 365(8)SEQ ID NO7的资料(i)序列特征(A)长度1008个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO7的序列描述ATGGAATCAT CTTTCTCATT TGGAGTGATC CTTGCTGTCC TGGCCTCCCT CATCATTGCT 60ACTAACACAC TAGTGGCTGT GGCTGTGCTG CTGTTGATCC ACAAGAATGA TGGTGTCAGT 120CTCTGCTTCA CCTTGAATCT GGCTGTGGCT GACACCTTGA TTGGTGTGGC CATCTCTGGC 180CTACTCACAG ACCAGCTCTC CAGCCCTTCT CGGCCCACAC AGAAGACCCT GTGCAGCCTG 240CGGATGGCAT TTGTCACTTC CTCCGCAGCT GCCTCTGTCC TCACGGTCAT GCTGATCACC 300TTTGACAGGT ACCTTGCCAT CAAGCAGCCC TTCCGCTACT TGAAGATCAT GAGTGGGTTC 360GTGGCCGGGG CCTGCATTGC CGGGCTGTGG TTAGTGTCTT ACCTCATTGG CTTCCTCCCA 420CTCGGAATCC CCATGTTCCA GCAGACTGCC TACAAAGGGC AGTGCAGCTT CTTTGCTGTA 480TTTCACCCTC ACTTCGTGCT GACCCTCTCC TGCGTTGGCT TCTTCCCAGC CATGCTCCTC 540TTTGTCTTCT TCTACTGCGA CATGCTCAAG ATTGCCTCCA TGCACAGCCA GCAGATTCGA 600AAGATGGAAC ATGCAGGAGC CATGGCTGGA GGTTATCGAT CCCCACGGAC TCCCAGCGAC 660TTCAAAGCTC TCCGTACTGT GTCTGTTCTC ATTGGGAGCT TTGCTCTATC CTGGACCCCC 720TTCCTTATCA CTGGCATTGT GCAGGTGGCC TGCCAGGAGT GTCACCTCTA CCTAGTGCTG 780GAACGGTACC TGTGGCTGCT CGGCGTGGGC AACTCCCTGC TCAACCCACT CATCTATGCC 840TATTGGCAGA AGGAGGTGCG ACTGCAGCTC TACCACATGG CCCTAGGAGT GAAGAAGGTG 900CTCACCTCAT TCCTCCTCTT TCTCTCGGCC AGGAATTGTG GCCCAGAGAG GCCCAGGGAA 960AGTTCCTGTC ACATCGTCAC TATCTCCAGC TCAGAGTTTG ATGGCTAA 1008(9)SEQ ID NO8的资料(i)序列特征(A)长度335个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO8的序列描述Met Glu Ser Ser Phe Ser Phe Gly Val Ile Leu Ala Val Leu Ala Ser1 5 10 15Leu Ile Ile Ala Thr Asn Thr Leu Val Ala Val Ala Val Leu Leu Leu20 25 30Ile His Lys Asn Asp Gly Val Ser Leu Cys Phe Thr Leu Asn Leu Ala35 40 45Val Ala Asp Thr Leu Ile Gly Val Ala Ile Ser Gly Leu Leu Thr Asp50 55 60Gln Leu Ser Ser Pro Ser Arg Pro Thr Gln Lys Thr Leu Cys Ser Leu65 70 75 80Arg Met Ala Phe Val Thr Ser Ser Ala Ala Ala Ser Val Leu Thr Val85 90 95Met Leu Ile Thr Phe Asp Arg Tyr Leu Ala Ile Lys Gln Pro Phe Arg100 105 110Tyr Leu Lys Ile Met Ser Gly Phe Val Ala Gly Ala Cys Ile Ala Gly115 120 125Leu Trp Leu Val Ser Tyr Leu Ile Gly Phe Leu Pro Leu Gly Ile Pro130 135 140Met Phe Gln Gln Thr Ala Tyr Lys Gly Gln Cys Ser Phe Phe Ala Val
145 150 155 160Phe His Pro His Phe Val Leu Thr Leu Ser Cys Val Gly Phe Phe Pro165 170 175Ala Met Leu Leu Phe Val Phe Phe Tyr Cys Asp Met Leu Lys Ile Ala180 185 190Ser Met His Ser Gln Gln Ile Arg Lys Met Glu His Ala Gly Ala Met195 200 205Ala Gly Gly Tyr Arg Ser Pro Arg Thr Pro Ser Asp Phe Lys Ala Leu210 215 220Arg Thr Val Ser Val Leu Ile Gly Ser Phe Ala Leu Ser Trp Thr Pro225 230 235 240Phe Leu Ile Thr Gly Ile Val Gln Val Ala Cys Gln Glu Cys His Leu245 250 255Tyr Leu Val Leu Glu Arg Tyr Leu Trp Leu Leu Gly Val Gly Asn Ser260 265 270Leu Leu Asn Pro Leu Ile Tyr Ala Tyr Trp Gln Lys Glu Val Arg Leu275 280 285Gln Leu Tyr His Met Ala Leu Gly Val Lys Lys Val Leu Thr Ser Phe290 295 300Leu Leu Phe Leu Ser Ala Arg Asn Cys Gly Pro Glu Arg Pro Arg Glu305 310 315 320Ser Ser Cys His Ile Val Thr Ile Ser Ser Ser Glu Phe Asp Gly325 330 335(10)SEQ ID NO9的资料(i)序列特征(A)长度1413个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO9的序列描述ATGGACACTA CCATGGAAGC TGACCTGGGT GCCACTGGCC ACAGGCCCCG CACAGAGCTT 60GATGATGAGG ACTCCTACCC CCAAGGTGGC TGGGACACGG TCTTCCTGGT GGCCCTGCTG 120CTCCTTGGGC TGCCAGCCAA TGGGTTGATG GCGTGGCTGG CCGGCTCCCA GGCCCGGCAT 180GGAGCTGGCA CGCGTCTGGC GCTGCTCCTG CTCAGCCTGG CCCTCTCTGA CTTCTTGTTC 240CTGGCAGCAG CGGCCTTCCA GATCCTAGAG ATCCGGCATG GGGGACACTG GCCGCTGGGG 300ACAGCTGCCT GCCGCTTCTA CTACTTCCTA TGGGGCGTGT CCTACTCCTC CGGCCTCTTC 360CTGCTGGCCG CCCTCAGCCT CGACCGCTGC CTGCTGGCGC TGTGCCCACA CTGGTACCCT 420GGGCACCGCC CAGTCCGCCT GCCCCTCTGG GTCTGCGCCG GTGTCTGGGT GCTGGCCACA 480CTCTTCAGCG TGCCCTGGCT GGTCTTCCCC GAGGCTGCCG TCTGGTGGTA CGACCTGGTC 540ATCTGCCTGG ACTTCTGGGA CAGCGAGGAG CTGTCGCTGA GGATGCTGGA GGTCCTGGGG 600GGCTTCCTGC CTTTCCTCCT GCTGCTCGTC TGCCACGTGC TCACCCAGGC CACAGCCTGT 660CGCACCTGCC ACCGCCAACA GCAGCCCGCA GCCTGCCGGG GCTTCGCCCG TGTGGCCAGG 720ACCATTCTGT CAGCCTATGT GGTCCTGAGG CTGCCCTACC AGCTGGCCCA GCTGCTCTAC 780CTGGCCTTCC TGTGGGACGT CTACTCTGGC TACCTGCTCT GGGAGGCCCT GGTCTACTCC 840GACTACCTGA TCCTACTCAA CAGCTGCCTC AGCCCCTTCC TCTGCCTCAT GGCCAGTGCC 900GACCTCCGGA CCCTGCTGCG CTCCGTGCTC TCGTCCTTCG CGGCAGCTCT CTGCGAGGAG 960CGGCCGGGCA GCTTCACGCC CACTGAGCCA CAGACCCAGC TAGATTCTGA GGGTCCAACT 1020CTGCCAGAGC CGATGGCAGA GGCCCAGTCA CAGATGGATC CTGTGGCCCA GCCTCAGGTG 1080AACCCCACAC TCCAGCCACG ATCGGATCCC ACAGCTCAGC CACAGCTGAA CCCTACGGCC 1140CAGCCACAGT CGGATCCCAC AGCCCAGCCA CAGCTGAACC TCATGGCCCA GCCACAGTCA 1200GATTCTGTGG CCCAGCCACA GGCAGACACT AACGTCCAGA CCCCTGCACC TGCTGCCAGT 1260TCTGTGCCCA GTCCCTGTGA TGAAGCTTCC CCAACCCCAT CCTCGCATCC TACCCCAGGG 1320GCCCTTGAGG ACCCAGCCAC ACCTCCTGCC TCTGAAGGAG AAAGCCCCAG CAGCACCCCG 1380CCAGAGGCGG CCCCGGGCGC AGGCCCCACG TGA 1413(11)SEQ ID NO10的资料(i)序列特征(A)长度468个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO10的序列描述Met Asp Thr Thr Met Glu Ala Asp Leu Gly Ala Thr Gly His Arg Pro1 5 10 15Arg Thr Glu Leu Asp Asp Glu Asp Ser Tyr Pro Gln Gly Gly Trp Asp20 25 30Thr Val Phe Leu Val Ala Leu Leu Leu Leu Gly Leu Pro Ala Asn Gly35 40 45Leu Met Ala Trp Leu Ala Gly Ser Gln Ala Arg His Gly Ala Gly Thr50 55 60Arg Leu Ala Leu Leu Leu Leu Ser Leu Ala Leu Ser Asp Phe Leu Phe65 70 75 80Leu Ala Ala Ala Ala Phe Gln Ile Leu Glu Ile Arg His Gly Gly His85 90 95Trp Pro Leu Gly Thr Ala Ala Cys Arg Phe Tyr Tyr Phe Leu Trp Gly100 105 110Val Ser Tyr Ser Ser Gly Leu Phe Leu Leu Ala Ala Leu Ser Leu Asp115 120 125Arg Cys Leu Leu Ala Leu Cys Pro His Trp Tyr Pro Gly His Arg Pro130 135 140Val Arg Leu Pro Leu Trp Val Cys Ala Gly Val Trp Val Leu Ala Thr145 150 155 160Leu Phe Ser Val Pro Trp Leu Val Phe Pro Glu Ala Ala Val Trp Trp165 170 175Tyr Asp Leu Val Ile Cys Leu Asp Phe Trp Asp Ser Glu Glu Leu Ser180 185 190Leu Arg Met Leu Glu Val Leu Gly Gly Phe Leu Pro Phe Leu Leu Leu195 200 205Leu Val Cys His Val Leu Thr Gln Ala Thr Arg Thr Cys His Arg Gln210 215 220Gln Gln Pro Ala Ala Cys Arg Gly Phe Ala Arg Val Ala Arg Thr Ile225 230 235 240Leu Ser Ala Tyr Val Val Leu Arg Leu Pro Tyr Gln Leu Ala Gln Leu245 250 255Leu Tyr Leu Ala Phe Leu Trp Asp Val Tyr Ser Gly Tyr Leu Leu Trp260 265 270Glu Ala Leu Val Tyr Ser Asp Tyr Leu Ile Leu Leu Asn Ser Cys Leu275 280 285Ser Pro Phe Leu Cys Leu Met Ala Ser Ala Asp Leu Arg Thr Leu Leu290 295 300Arg Ser Val Leu Ser Ser Phe Ala Ala Ala Leu Cys Glu Glu Arg Pro305 310 315 320Gly Ser Phe Thr Pro Thr Glu Pro Gln Thr Gln Leu Asp Ser Glu Gly325 330 335Pro Thr Leu Pro Glu Pro Met Ala Glu Ala Gln Ser Gln Met Asp Pro340 345 350Val Ala Gln Pro Gln Val Asn Pro Thr Leu Gln Pro Arg Ser Asp Pro355 360 365Thr Ala Gln Pro Gln Leu Asn Pro Thr Ala Gln Pro Gln Ser Asp Pro370 375 380Thr Ala Gln Pro Gln Leu Asn Leu Met Ala Gln Pro Gln Ser Asp Ser385 390 395 400Val Ala Gln Pro Gln Ala Asp Thr Asn Val Gln Thr Pro Ala Pro Ala405 410 415Ala Ser Ser Val Pro Ser Pro Cys Asp Glu Ala Ser Pro Thr Pro Ser420 425 430Ser His Pro Thr Pro Gly Ala Leu Glu Asp Pro Ala Thr Pro Pro Ala435 440 445Ser Glu Gly Glu Ser Pro Ser Ser Thr Pro Pro Glu Ala Ala Pro Gly450 455 460Ala Gly Pro Thr465(12)SEQ ID NO11的资料(i)序列特征(A)长度1248个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO11的序列描述ATGTCAGGGA TGGAAAAACT TCAGAATGCT TCCTGGATCT ACCAGCAGAA ACTAGAAGAT 60CCATTCCAGA AACACCTGAA CAGCACCGAG GAGTATCTGG CCTTCCTCTG CGGACCTCGG 120CGCAGCCACT TCTTCCTCCC CGTGTCTGTG GTGTATGTGC CAATTTTTGT GGTGGGGGTC 180ATTGGCAATG TCCTGGTGTG CCTGGTGATT CTGCAGCACC AGGCTATGAA GACGCCCACC 240AACTACTACC TCTTCAGCCT GGCGGTCTCT GACCTCCTGG TCCTGCTCCT TGGAATGCCC 300CTGGAGGTCT ATGAGATGTG GCGCAACTAC CCTTTCTTGT TCGGGCCCGT GGGCTGCTAC 360TTCAAGACGG CCCTCTTTGA GACCGTGTGC TTCGCCTCCA TCCTCAGCAT CACCACCGTC 420AGCGTGGAGC GCTACGTGGC CATCCTACAC CCGTTCCGCG CCAAACTGCA GAGCACCCGG 480CGCCGGGCCC TCAGGATCCT CGGCATCGTC TGGGGCTTCT CCGTGCTCTT CTCCCTGCCC 540AACACCAGCA TCCATGGCAT CAAGTTCCAC TACTTCCCCA ATGGGTCCCT GGTCCCAGGT 600TCGGCCACCT GTACGGTCAT CAAGCCCATG TGGATCTACA ATTTCATCAT CCAGGTCACC 660TCCTTCCTAT TCTACCTCCT CCCCATGACT GTCATCAGTG TCCTCTACTA CCTCATGGCA 720CTCAGACTAA AGAAAGACAA ATCTCTTGAG GCAGATGAAG GGAATGCAAA TATTCAAAGA 780CCCTGCAGAA AATCAGTCAA CAAGATGCTG TTTGTCTTGG TCTTAGTGTT TGCTATCTGT 840TGGGCCCCGT TCCACATTGA CCGACTCTTC TTCAGCTTTG TGGAGGAGTG GAGTGAATCC 900CTGGCTGCTG TGTTCAACCT CGTCCATGTG GTGTCAGGTG TCTTCTTCTA CCTGAGCTCA 960GCTGTCAACC CCATTATCTA TAACCTACTG TCTCGCCGCT TCCAGGCAGC ATTCCAGAAT 1020GTGATCTCTT CTTTCCACAA ACAGTGGCAC TCCCAGCATG ACCCACAGTT GCCACCTGCC 1080CAGCGGAACA TCTTCCTGAC AGAATGCCAC TTTGTGGAGC TGACCGAAGA TATAGGTCCC 1140CAATTCCCAT GTCAGTCATC CATGCACAAC TCTCACCTCC CAACAGCCCT CTCTAGTGAA 1200CAGATGTCAA GAACAAACTA TCAAAGCTTC CACTTTAACA AAACCTGA 1248(13)SEQ ID NO12的资料(i)序列特征(A)长度415个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO12的序列描述Met Ser Gly Met Glu Lys Leu Gln Asn Ala Ser Trp Ile Tyr Gln Gln1 5 10 15Lys Leu Glu Asp Pro Phe Gln Lys His Leu Asn Ser Thr Glu Glu Tyr20 25 30Leu Ala Phe Leu Cys Gly Pro Arg Arg Ser His Phe Phe Leu Pro Val35 40 45Ser Val Val Tyr Val Pro Ile Phe Val Val Gly Val Ile Gly Asn Val
50 55 60Leu Val Cys Leu Val Ile Leu Gln His Gln Ala Met Lys Thr Pro Thr65 70 75 80Asn Tyr Tyr Leu Phe Ser Leu Ala Val Ser Asp Leu Leu Val Leu Leu85 90 95Leu Gly Met Pro Leu Glu Val Tyr Glu Met Trp Arg Asn Tyr Pro Phe100 105 110Leu Phe Gly Pro Val Gly Cys Tyr Phe Lys Thr Ala Leu Phe Glu Thr115 120 125Val Cys Phe Ala Ser Ile Leu Ser Ile Thr Thr Val Ser Val Glu Arg130 135 140Tyr Val Ala Ile Leu His Pro Phe Arg Ala Lys Leu Gln Ser Thr Arg145 150 155 160Arg Arg Ala Leu Arg Ile Leu Gly Ile Val Trp Gly Phe Ser Val Leu165 170 175Phe Ser Leu Pro Asn Thr Ser Ile His Gly Ile Lys Phe His Tyr Phe180 185 190Pro Asn Gly Ser Leu Val Pro Gly Ser Ala Thr Cys Thr Val Ile Lys195 200 205Pro Met Trp Ile Tyr Asn Phe Ile Ile Gln Val Thr Ser Phe Leu Phe210 215 220Tyr Leu Leu Pro Met Thr Val Ile Ser Val Leu Tyr Tyr Leu Met Ala225 230 235 240Leu Arg Leu Lys Lys Asp Lys Ser Leu Glu Ala Asp Glu Gly Asn Ala245 250 255Asn Ile Gln Arg Pro Cys Arg Lys Ser Val Asn Lys Met Leu Phe Val260 265 270Leu Val Leu Val Phe Ala Ile Cys Trp Ala Pro Phe His Ile Asp Arg275 280 285Leu Phe Phe Ser Phe Val Glu Glu Trp Ser Glu Ser Leu Ala Ala Val290 295 300Phe Asn Leu Val His Val Val Ser Gly Val Phe Phe Tyr Leu Ser Ser305 310 315 320Ala Val Asn Pro Ile Ile Tyr Asn Leu Leu Ser Arg Arg Phe Gln Ala325 330 335Ala Phe Gln Asn Val Ile Ser Ser Phe His Lys Gln Trp His Ser Gln340 345 350
His Asp Pro Gln Leu Pro Pro Ala Gln Arg Asn Ile Phe Leu Thr Glu355 360 365Cys His Phe Val Glu Leu Thr Glu Asp Ile Gly Pro Gln Phe Pro Cys370 375 380Gln Ser Ser Met His Asn Ser His Leu Pro Thr Ala Leu Ser Ser Glu385 390 395 400Gln Met Ser Arg Thr Asn Tyr Gln Ser Phe His Phe Asn Lys Thr405 410 415(14)SEQ ID NO13的资料(i)序列特征(A)长度1173个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO13的序列描述ATGCCAGATA CTAATAGCAC AATCAATTTA TCACTAAGCA CTCGTGTTAC TTTAGCATTT 60TTTATGTCCT TAGTAGCTTT TGCTATAATG CTAGGAAATG CTTTGGTCAT TTTAGCTTTT 120GTGGTGGACA AAAACCTTAG ACATCGAAGT AGTTATTTTT TTCTTAACTT GGCCATCTCT 180GACTTCTTTG TGGGTGTGAT CTCCATTCCT TTGTACATCC CTCACACGCT GTTCGAATGG 240GATTTTGGAA AGGAAATCTG TGTATTTTGG CTCACTACTG ACTATCTGTT ATGTACAGCA 300TCTGTATATA ACATTGTCCT CATCAGCTAT GATCGATACC TGTCAGTCTC AAATGCTGTG 360TCTTATAGAA CTCAACATAC TGGGGTCTTG AAGATTGTTA CTCTGATGGT GGCCGTTTGG 420GTGCTGGCCT TCTTAGTGAA TGGGCCAATG ATTCTAGTTT CAGAGTCTTG GAAGGATGAA 480GGTAGTGAAT GTGAACCTGG ATTTTTTTCG GAATGGTACA TCCTTGCCAT CACATCATTC 540TTGGAATTCG TGATCCCAGT CATCTTAGTC GCTTATTTCA ACATGAATAT TTATTGGAGC 600CTGTGGAAGC GTGATCATCT CAGTAGGTGC CAAAGCCATC CTGGACTGAC TGCTGTCTCT 660TCCAACATCT GTGGACACTC ATTCAGAGGT AGACTATCTT CAAGGAGATC TCTTTCTGCA 720TCGACAGAAG TTCCTGCATC CTTTCATTCA GAGAGACAGA GGAGAAAGAG TAGTCTCATG 780TTTTCCTCAA GAACCAAGAT GAATAGCAAT ACAATTGCTT CCAAAATGGG TTCCTTCTCC 840CAATCAGATT CTGTAGCTCT TCACCAAAGG GAACATGTTG AACTGCTTAG AGCCAGGAGA 900TTAGCCAAGT CACTGGCCAT TCTCTTAGGG GTTTTTGCTG TTTGCTGGGC TCCATATTCT 960CTGTTCACAA TTGTCCTTTC ATTTTATTCC TCAGCAACAG GTCCTAAATC AGTTTGGTAT 1020AGAATTGCAT TTTGGCTTCA GTGGTTCAAT TCCTTTGTCA ATCCTCTTTT GTATCCATTG 1080TGTCACAAGC GCTTTCAAAA GGCTTTCTTG AAAATATTTT GTATAAAAAA GCAACCTCTA 1140CCATCACAAC ACAGTCGGTC AGTATCTTCT TAA 1173(15)SEQ ID NO14的资料(i)序列特征(A)长度390个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO14的序列描述Met Pro Asp Thr Asn Ser Thr Ile Asn Leu Ser Leu Ser Thr Arg Val1 5 10 15Thr Leu Ala Phe Phe Met Ser Leu Val Ala Phe Ala Ile Met Leu Gly20 25 30Asn Ala Leu Val Ile Leu Ala Phe Val Val Asp Lys Asn Leu Arg His35 40 45Arg Ser Ser Tyr Phe Phe Leu Asn Leu Ala Ile Ser Asp Phe Phe Val50 55 60Gly Val Ile Ser Ile Pro Leu Tyr Ile Pro His Thr Leu Phe Glu Trp65 70 75 80Asp Phe Gly Lys Glu Ile Cys Val Phe Trp Leu Thr Thr Asp Tyr Leu85 90 95Leu Cys Thr Ala Ser Val Tyr Asn Ile Val Leu Ile Ser Tyr Asp Arg100 105 110Tyr Leu Ser Val Ser Asn Ala Val Ser Tyr Arg Thr Gln His Thr Gly115 120 125Val Leu Lys Ile Val Thr Leu Met Val Ala Val Trp Val Leu Ala Phe130 135 140Leu Val Asn Gly Pro Met Ile Leu Val Ser Glu Ser Trp Lys Asp Glu145 150 155 160Gly Ser Glu Cys Glu Pro Gly Phe Phe Ser Glu Trp Tyr Ile Leu Ala165 170 175
Ile Thr Ser Phe Leu Glu Phe Val Ile Pro Val Ile Leu Val Ala Tyr180 185 190Phe Asn Met Asn Ile Tyr Trp Ser Leu Trp Lys Arg Asp His Leu Ser195 200 205Arg Cys Gln Ser His Pro Gly Leu Thr Ala Val Ser Ser Asn Ile Cys210 215 220Gly His Ser Phe Arg Gly Arg Leu Ser Ser Arg Arg Ser Leu Ser Ala225 230 235 240Ser Thr Glu Val Pro Ala Ser Phe His Ser Glu Arg Gln Arg Arg Lys245 250 255Ser Ser Leu Met Phe Ser Ser Arg Thr Lys Met Asn Ser Asn Thr Ile260 265 270Ala Ser Lys Met Gly Ser Phe Ser Gln Ser Asp Ser Val Ala Leu His275 280 285Gln Arg Glu His Val Glu Leu Leu Arg Ala Arg Arg Leu Ala Lys Ser290 295 300Leu Ala Ile Leu Leu Gly Val Phe Ala Val Cys Trp Ala Pro Tyr Ser305 310 315 320Leu Phe Thr Ile Val Leu Ser Phe Tyr Ser Ser Ala Thr Gly Pro Lys325 330 335Ser Val Trp Tyr Arg Ile Ala Phe Trp Leu Gln Trp Phe Asn Ser Phe340 345 350Val Asn Pro Leu Leu Tyr Pro Leu Cys His Lys Arg Phe Gln Lys Ala355 360 365Phe Leu Lys Ile Phe Cys Ile Lys Lys Gln Pro Leu Pro Ser Gln His370 375 380Ser Arg Ser Val Ser Ser385 390(16)SEQ ID NO15的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO15的序列描述GGAAAGCTTA ACGATCCCCA GGAGCAACAT30(17)SEQ ID NO16的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型蛋白质(iv)反义是(xi)SEQ ID NO16的序列描述CTGGGATCCT ACGAGAGCAT TTTTCACACA G 31(18)SEQ ID NO17的资料(i)序列特征(A)长度1128个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO17的序列描述ATGGCGAACG CGAGCGAGCC GGGTGGCAGC GGCGGCGGCG AGGCGGCCGC CCTGGGCCTC 60AAGCTGGCCA CGCTCAGCCT GCTGCTGTGC GTGAGCCTAG CGGGCAACGT GCTGTTCGCG 120CTGCTGATCG TGCGGGAGCG CAGCCTGCAC CGCGCCCCGT ACTACCTGCT GCTCGACCTG 180TGCCTGGCCG ACGGGCTGCG CGCGCTCGCC TGCCTCCCGG CCGTCATGCT GGCGGCGCGG 240CGTGCGGCGG CCGCGGCGGG GGCGCCGCCG GGCGCGCTGG GCTGCAAGCT GCTCGCCTTC 300CTGGCCGCGC TCTTCTGCTT CCACGCCGCC TTCCTGCTGC TGGGCGTGGG CGTCACCCGC 360TACCTGGCCA TCGCGCACCA CCGCTTCTAT GCAGAGCGCC TGGCCGGCTG GCCGTGCGCC 420GCCATGCTGG TGTGCGCCGC CTGGGCGCTG GCGCTGGCCG CGGCCTTCCC GCCAGTGCTG 480GACGGCGGTG GCGACGACGA GGACGCGCCG TGCGCCCTGG AGCAGCGGCC CGACGGCGCC 540CCCGGCGCGC TGGGCTTCCT GCTGCTGCTG GCCGTGGTGG TGGGCGCCAC GCACCTCGTC 600TACCTCCGCC TGCTCTTCTT CATCCACGAC CGCCGCAAGA TGCGGCCCGC GCGCCTGGTG 660CCCGCCGTCA GCCACGACTG GACCTTCCAC GGCCCGGGCG CCACCGGCCA GGCGGCCGCC 720AACTGGACGG CGGGCTTCGG CCGCGGGCCC ACGCCGCCCG CGCTTGTGGG CATCCGGCCC 780GCAGGGCCGG GCCGCGGCGC GCGCCGCCTC CTCGTGCTGG AAGAATTCAA GACGGAGAAG 840AGGCTGTGCA AGATGTTCTA CGCCGTCACG CTGCTCTTCC TGCTCCTCTG GGGGCCCTAC 900GTCGTGGCCA GCTACCTGCG GGTCCTGGTG CGGCCCGGCG CCGTCCCCCA GGCCTACCTG 960ACGGCCTCCG TGTGGCTGAC CTTCGCGCAG GCCGGCATCA ACCCCGTCGT GTGCTTCCTC 1020TTCAACAGGG AGCTGAGGGA CTGCTTCAGG GCCCAGTTCC CCTGCTGCCA GAGCCCCCGG 1080ACCACCCAGG CGACCCATCC CTGCGACCTG AAAGGCATTG GTTTATGA 1128(19)SEQ ID NO18的资料(i)序列特征(A)长度375个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO18的序列描述Met Ala Asn Ala Ser Glu Pro Gly Gly Ser Gly Gly Gly Glu Ala Ala1 5 10 15Ala Leu Gly Leu Lys Leu Ala Thr Leu Ser Leu Leu Leu Cys Val Ser20 25 30Leu Ala Gly Asn Val Leu Phe Ala Leu Leu Ile Val Arg Glu Arg Ser35 40 45Leu His Arg Ala Pro Tyr Tyr Leu Leu Leu Asp Leu Cys Leu Ala Asp50 55 60Gly Leu Arg Ala Leu Ala Cys Leu Pro Ala Val Met Leu Ala Ala Arg65 70 75 80Arg Ala Ala Ala Ala Ala Gly Ala Pro Pro Gly Ala Leu Gly Cys Lys85 90 95Leu Leu Ala Phe Leu Ala Ala Leu Phe Cys Phe His Ala Ala Phe Leu100 105 110Leu Leu Gly Val Gly Val Thr Arg Tyr Leu Ala Ile Ala His His Arg115 120 125Phe Tyr Ala Glu Arg Leu Ala Gly Trp Pro Cys Ala Ala Met Leu Val130 135 140Cys Ala Ala Trp Ala Leu Ala Leu Ala Ala Ala Phe Pro Pro Val Leu145 150 155 160Asp Gly Gly Gly Asp Asp Glu Asp Ala Pro Cys Ala Leu Glu Gln Arg165 170 175Pro Asp Gly Ala Pro Gly Ala Leu Gly Phe Leu Leu Leu Leu Ala Val180 185 190Val Val Gly Ala Thr His Leu Val Tyr Leu Arg Leu Leu Phe Phe Ile195 200 205His Asp Arg Arg Lys Met Arg Pro Ala Arg Leu Val Pro Ala Val Ser210 215 220His Asp Trp Thr Phe His Gly Pro Gly Ala Thr Gly Gln Ala Ala Ala225 230 235 240Asn Trp Thr Ala Gly Phe Gly Arg Gly Pro Thr Pro Pro Ala Leu Val245 250 255Gly Ile Arg Pro Ala Gly Pro Gly Arg Gly Ala Arg Arg Leu Leu Val260 265 270Leu Glu Glu Phe Lys Thr Glu Lys Arg Leu Cys Lys Met Phe Tyr Ala275 280 285Val Thr Leu Leu Phe Leu Leu Leu Trp Gly Pro Tyr Val Val Ala Ser290 295 300Tyr Leu Arg Val Leu Val Arg Pro Gly Ala Val Pro Gln Ala Tyr Leu305 310 315 320Thr Ala Ser Val Trp Leu Thr Phe Ala Gln Ala Gly Ile Asn Pro Val325 330 335Val Cys Phe Leu Phe Asn Arg Glu Leu Arg Asp Cys Phe Arg Ala Gln340 345 350Phe Pro Cys Cys Gln Ser Pro Arg Thr Thr Gln Ala Thr His Pro Cys355 360 365Asp Leu Lys Gly Ile Gly Leu370 375(20)SEQ ID NO19的资料(i)序列特征(A)长度1002个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO19的序列描述ATGAACACCA CAGTGATGCA AGGCTTCAAC AGATCTGAGC GGTGCCCCAG AGACACTCGG 60ATAGTACAGC TGGTATTCCC AGCCCTCTAC ACAGTGGTTT TCTTGACCGG CATCCTGCTG 120AATACTTTGG CTCTGTGGGT GTTTGTTCAC ATCCCCAGCT CCTCCACCTT CATCATCTAC 180CTCAAAAACA CTTTGGTGGC CGACTTGATA ATGACACTCA TGCTTCCTTT CAAAATCCTC 240TCTGACTCAC ACCTGGCACC CTGGCAGCTC AGAGCTTTTG TGTGTCGTTT TTCTTCGGTG 300ATATTTTATG AGACCATGTA TGTGGGCATC GTGCTGTTAG GGCTCATAGC CTTTGACAGA 360TTCCTCAAGA TCATCAGACC TTTGAGAAAT ATTTTTCTAA AAAAACCTGT TTTTGCAAAA 420ACGGTCTCAA TCTTCATCTG GTTCTTTTTG TTCTTCATCT CCCTGCCAAA TACGATCTTG 480AGCAACAAGG AAGCAACACC ATCGTCTGTG AAAAAGTGTG CTTCCTTAAA GGGGCCTCTG 540GGGCTGAAAT GGCATCAAAT GGTAAATAAC ATATGCCAGT TTATTTTCTG GACTGTTTTT 600ATCCTAATGC TTGTGTTTTA TGTGGTTATT GCAAAAAAAG TATATGATTC TTATAGAAAG 660TCCAAAAGTA AGGACAGAAA AAACAACAAA AAGCTGGAAG GCAAAGTATT TGTTGTCGTG 720GCTGTCTTCT TTGTGTGTTT TGCTCCATTT CATTTTGCCA GAGTTCCATA TACTCACAGT 780CAAACCAACA ATAAGACTGA CTGTAGACTG CAAAATCAAC TGTTTATTGC TAAAGAAACA 840ACTCTCTTTT TGGCAGCAAC TAACATTTGT ATGGATCCCT TAATATACAT ATTCTTATGT 900AAAAAATTCA CAGAAAAGCT ACCATGTATG CAAGGGAGAA AGACCACAGC ATCAAGCCAA 960GAAAATCATA GCAGTCAGAC AGACAACATA ACCTTAGGCT GA1002(21)SEQ ID NO20的资料(i)序列特征(A)长度333个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO20的序列描述Met Asn Thr Thr Val Met Gln Gly Phe Asn Arg Ser Glu Arg Cys Pro1 5 10 15Arg Asp Thr Arg Ile Val Gln Leu Val Phe Pro Ala Leu Tyr Thr Val20 25 30Val Phe Leu Thr Gly Ile Leu Leu Asn Thr Leu Ala Leu Trp Val Phe35 40 45Val His Ile Pro Ser Ser Ser Thr Phe Ile Ile Tyr Leu Lys Asn Thr50 55 60Leu Val Ala Asp Leu Ile Met Thr Leu Met Leu Pro Phe Lys Ile Leu65 70 75 80Ser Asp Ser His Leu Ala Pro Trp Gln Leu Arg Ala Phe Val Cys Arg85 90 95Phe Ser Ser Val Ile Phe Tyr Glu Thr Met Tyr Val Gly Ile Val Leu100 105 110Leu Gly Leu Ile Ala Phe Asp Arg Phe Leu Lys Ile Ile Arg Pro Leu115 120 125Arg Asn Ile Phe Leu Lys Lys Pro Val Phe Ala Lys Thr Val Ser Ile130 135 140Phe Ile Trp Phe Phe Leu Phe Phe Ile Ser Leu Pro Asn Thr Ile Leu145 150 155 160Ser Asn Lys Glu Ala Thr Pro Ser Ser Val Lys Lys Cys Ala Ser Leu165 170 175Lys Gly Pro Leu Gly Leu Lys Trp His Gln Met Val Asn Asn Ile Cys180 185 190Gln Phe Ile Phe Trp Thr Val Phe Ile Leu Met Leu Val Phe Tyr Val195 200 205Val Ile Ala Lys Lys Val Tyr Asp Ser Tyr Arg Lys Ser Lys Ser Lys210 215 220Asp Arg Lys Asn Asn Lys Lys Leu Glu Gly Lys Val Phe Val Val Val225 230 235 240Ala Val Phe Phe Val Cys Phe Ala Pro Phe His Phe Ala Arg Val Pro245 250 255Tyr Thr His Ser Gln Thr Asn Asn Lys Thr Asp Cys Arg Leu Gln Asn260 265 270Gln Leu Phe Ile Ala Lys Glu Thr Thr Leu Phe Leu Ala Ala Thr Asn275 280 285Ile Cys Met Asp Pro Leu Ile Tyr Ile Phe Leu Cys Lys Lys Phe Thr290 295 300Glu Lys Leu Pro Cys Met Gln Gly Arg Lys Thr Thr Ala Ser Ser Gln305 310 315 320Glu Asn His Ser Ser Gln Thr Asp Asn Ile Thr Leu Gly
325 330(22)SEQ ID NO21的资料(i)序列特征(A)长度1122个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO21的序列描述ATGGCCAACA CTACCGGAGA GCCTGAGGAG GTGAGCGGCG CTCTGTCCCC ACCGTCCGCA 60TCAGCTTATG TGAAGCTGGT ACTGCTGGGA CTGATTATGT GCGTGAGCCT GGCGGGTAAC 120GCCATCTTGT CCCTGCTGGT GCTCAAGGAG CGTGCCCTGC ACAAGGCTCC TTACTACTTC 180CTGCTGGACC TGTGCCTGGC CGATGGCATA CGCTCTGCCG TCTGCTTCCC CTTTGTGCTG 240GCTTCTGTGC GCCACGGCTC TTCATGGACC TTCAGTGCAC TCAGCTGCAA GATTGTGGCC 300TTTATGGCCG TGCTCTTTTG CTTCCATGCG GCCTTCATGC TGTTCTGCAT CAGCGTCACC 360CGCTACATGG CCATCGCCCA CCACCGCTTC TACGCCAAGC GCATGACACT CTGGACATGC 420GCGGCTGTCA TCTGCATGGC CTGGACCCTG TCTGTGGCCA TGGCCTTCCC ACCTGTCTTT 480GACGTGGGCA CCTACAAGTT TATTCGGGAG GAGGACCAGT GCATCTTTGA GCATCGCTAC 540TTCAAGGCCA ATGACACGCT GGGCTTCATG CTTATGTTGG CTGTGCTCAT GGCAGCTACC 600CATGCTGTCT ACGGCAAGCT GCTCCTCTTC GAGTATCGTC ACCGCAAGAT GAAGCCAGTG 660CAGATGGTGC CAGCCATCAG CCAGAACTGG ACATTCCATG GTCCCGGGGC CACCGGCCAG 720GCTGCTGCCA ACTGGATCGC CGGCTTTGGC CGTGGGCCCA TGCCACCAAC CCTGCTGGGT 780ATCCGGCAGA ATGGGCATGC AGCCAGCCGG CGGCTACTGG GCATGGACGA GGTCAAGGGT 840GAAAAGCAGC TGGGCCGCAT GTTCTACGCG ATCACACTGC TCTTTCTGCT CCTCTGGTCA 900CCCTACATCG TGGCCTGCTA CTGGCGAGTG TTTGTGAAAG CCTGTGCTGT GCCCCACCGC 960TACCTGGCCA CTGCTGTTTG GATGAGCTTC GCCCAGGCTG CCGTCAACCC AATTGTCTGC 1020TTCCTGCTCA ACAAGGACCT CAAGAAGTGC CTGACCACTC ACGCCCCCTG CTGGGGCACA 1080GGAGGTGCCC CGGCTCCCAG AGAACCCTAC TGTGTCATGT GA1122(23)SEQ ID NO22的资料(i)序列特征(A)长度373个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型DNA(基因组)(xi)SEQ ID NO22的序列描述Met Ala Asn Thr Thr Gly Glu Pro Glu Glu Val Ser Gly Ala Leu Ser1 5 10 15Pro Pro Ser Ala Ser Ala Tyr Val Lys Leu Val Leu Leu Gly Leu Ile20 25 30Met Cys Val Ser Leu Ala Gly Asn Ala Ile Leu Ser Leu Leu Val Leu35 40 45Lys Glu Arg Ala Leu His Lys Ala Pro Tyr Tyr Phe Leu Leu Asp Leu50 55 60Cys Leu Ala Asp Gly Ile Arg Ser Ala Val Cys Phe Pro Phe Val Leu65 70 75 80Ala Ser Val Arg His Gly Ser Ser Trp Thr Phe Ser Ala Leu Ser Cys85 90 95Lys Ile Val Ala Phe Met Ala Val Leu Phe Cys Phe His Ala Ala Phe100 105 110Met Leu Phe Cys Ile Ser Val Thr Arg Tyr Met Ala Ile Ala His His115 120 125Arg Phe Tyr Ala Lys Arg Met Thr Leu Trp Thr Cys Ala Ala Val Ile130 135 140Cys Met Ala Trp Thr Leu Ser Val Ala Met Ala Phe Pro Pro Val Phe145 150 155 160Asp Val Gly Thr Tyr Lys Phe Ile Arg Glu Glu Asp Gln Cys Ile Phe165 170 175Glu His Arg Tyr Phe Lys Ala Asn Asp Thr Leu Gly Phe Met Leu Met180 185 190Leu Ala Val Leu Met Ala Ala Thr His Ala Val Tyr Gly Lys Leu Leu195 200 205Leu Phe Glu Tyr Arg His Arg Lys Met Lys Pro Val Gln Met Val Pro210 215 220Ala Ile Ser Gln Asn Trp Thr Phe His Gly Pro Gly Ala Thr Gly Gln225 230 235 240Ala Ala Ala Asn Trp Ile Ala Gly Phe Gly Arg Gly Pro Met Pro Pro245 250 255Thr Leu Leu Gly Ile Arg Gln Asn Gly His Ala Ala Ser Arg Arg Leu260 265 270Leu Gly Met Asp Glu Val Lys Gly Glu Lys Gln Leu Gly Arg Met Phe275 280 285Tyr Ala Ile Thr Leu Leu Phe Leu Leu Leu Trp Ser Pro Tyr Ile Val290 295 300Ala Cys Tyr Trp Arg Val Phe Val Lys Ala Cys Ala Val Pro His Arg305 310 315 320Tyr Leu Ala Thr Ala Val Trp Met Ser Phe Ala Gln Ala Ala Val Asn325 330 335Pro Ile Val Cys Phe Leu Leu Asn Lys Asp Leu Lys Lys Cys Leu Thr340 345 350Thr His Ala Pro Cys Trp Gly Thr Gly Gly Ala Pro Ala Pro Arg Glu355 360 365Pro Tyr Cys Val Met370(24)SEQ ID NO23的资料(i)序列特征(A)长度1053个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO23的序列描述ATGGCTTTGG AACAGAACCA GTCAACAGAT TATTATTATG AGGAAAATGA AATGAATGGC 60ACTTATGACT ACAGTCAATA TGAATTGATC TGTATCAAAG AAGATGTCAG AGAATTTGCA 120AAAGTTTTCC TCCCTGTATT CCTCACAATA GCTTTCGTCA TTGGACTTGC AGGCAATTCC 180ATGGTAGTGG CAATTTATGC CTATTACAAG AAACAGAGAA CCAAAACAGA TGTGTACATC 240CTGAATTTGG CTGTAGCAGA TTTACTCCTT CTATTCACTC TGCCTTTTTG GGCTGTTAAT 300GCAGTTCATG GGTGGGTTTT AGGGAAAATA ATGTGCAAAA TAACTTCAGC CTTGTACACA 360CTAAACTTTG TCTCTGGAAT GCAGTTTCTG GCTTGCATCA GCATAGACAG ATATGTGGCA 420GTAACTAATG TCCCCAGCCA ATCAGGAGTG GGAAAACCAT GCTGGATCAT CTGTTTCTGT 480GTCTGGATGG CTGCCATCTT GCTGAGCATA CCCCAGCTGG TTTTTTATAC AGTAAATGAC 540AATGCTAGGT GCATTCCCAT TTTCCCCCGC TACCTAGGAA CATCAATGAA AGCATTGATT 600CAAATGCTAG AGATCTGCAT TGGATTTGTA GTACCCTTTC TTATTATGGG GGTGTGCTAC 660TTTATCACGG CAAGGACACT CATGAAGATG CCAAACATTA AAATATCTCG ACCCCTAAAA 720GTTCTGCTCA CAGTCGTTAT AGTTTTCATT GTCACTCAAC TGCCTTATAA CATTGTCAAG 780TTCTGCCGAG CCATAGACAT CATCTACTCC CTGATCACCA GCTGCAACAT GAGCAAACGC 840ATGGACATCG CCATCCAAGT CACAGAAAGC ATTGCACTCT TTCACAGCTG CCTCAACCCA 900ATCCTTTATG TTTTTATGGG AGCATCTTTC AAAAACTACG TTATGAAAGT GGCCAAGAAA 960TATGGGTCCT GGAGAAGACA GAGACAAAGT GTGGAGGAGT TTCCTTTTGA TTCTGAGGGT 1020CCTACAGAGC CAACCAGTAC TTTTAGCATT TAA 1053(25)SEQ ID NO24的资料(i)序列特征(A)长度350个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO24的序列描述Met Ala Leu Glu Gln Asn Gln Ser Thr Asp Tyr Tyr Tyr Glu Glu Asn1 5 10 15Glu Met Asn Gly Thr Tyr Asp Tyr Ser Gln Tyr Glu Leu Ile Cys Ile20 25 30Lys Glu Asp Val Arg Glu Phe Ala Lys Val Phe Leu Pro Val Phe Leu35 40 45Thr Ile Ala Phe Val Ile Gly Leu Ala Gly Asn Ser Met Val Val Ala50 55 60Ile Tyr Ala Tyr Tyr Lys Lys Gln Arg Thr Lys Thr Asp Val Tyr Ile65 70 75 80Leu Asn Leu Ala Val Ala Asp Leu Leu Leu Leu Phe Thr Leu Pro Phe85 90 95Trp Ala Val Asn Ala Val His Gly Trp Val Leu Gly Lys Ile Met Cys100 105 110Lys Ile Thr Ser Ala Leu Tyr Thr Leu Asn Phe Val Ser Gly Met Gln
115 120 125Phe Leu Ala Cys Ile Ser Ile Asp Arg Tyr Val Ala Val Thr Asn Val130 135 140Pro Ser Gln Ser Gly Val Gly Lys Pro Cys Trp Ile Ile Cys Phe Cys145 150 155 160Val Trp Met Ala Ala Ile Leu Leu Ser Ile Pro Gln Leu Val Phe Tyr165 170 175Thr Val Asn Asp Asn Ala Arg Cys Ile Pro Ile Phe Pro Arg Tyr Leu180 185 190Gly Thr Ser Met Lys Ala Leu Ile Gln Met Leu Glu Ile Cys Ile Gly195 200 205Phe Val Val Pro Phe Leu Ile Met Gly Val Cys Tyr Phe Ile Thr Ala210 215 220Arg Thr Leu Met Lys Met Pro Asn Ile Lys Ile Ser Arg Pro Leu Lys225 230 235 240Val Leu Leu Thr Val Val Ile Val Phe Ile Val Thr Gln Leu Pro Tyr245 250 255Asn Ile Val Lys Phe Cys Arg Ala Ile Asp Ile Ile Tyr Ser Leu Ile260 265 270Thr Ser Cys Asn Met Ser Lys Arg Met Asp Ile Ala Ile Gln Val Thr275 280 285Glu Ser Ile Ala Leu Phe His Ser Cys Leu Asn Pro Ile Leu Tyr Val290 295 300Phe Met Gly Ala Ser Phe Lys Asn Tyr Val Met Lys Val Ala Lys Lys305 310 315 320Tyr Gly Ser Trp Arg Arg Gln Arg Gln Ser Val Glu Glu Phe Pro Phe325 330 335Asp Ser Glu Gly Pro Thr Glu Pro Thr Ser Thr Phe Ser Ile340 345 350(26)SEQ ID NO25的资料(i)序列特征(A)长度1116个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO25的序列描述ATGCCAGGAA ACGCCACCCC AGTGACCACC ACTGCCCCGT GGGCCTCCCT GGGCCTCTCC 60GCCAAGACCT GCAACAACGT GTCCTTCGAA GAGAGCAGGA TAGTCCTGGT CGTGGTGTAC 120AGCGCGGTGT GCACGCTGGG GGTGCCGGCC AACTGCCTGA CTGCGTGGCT GGCGCTGCTG 180CAGGTACTGC AGGGCAACGT GCTGGCCGTC TACCTGCTCT GCCTGGCACT CTGCGAACTG 240CTGTACACAG GCACGCTGCC ACTCTGGGTC ATCTATATCC GCAACCAGCA CCGCTGGACC 300CTAGGCCTGC TGGCCTCGAA GGTGACCGCC TACATCTTCT TCTGCAACAT CTACGTCAGC 360ATCCTCTTCC TGTGCTGCAT CTCCTGCGAC CGCTTCGTGG CCGTGGTGTA CGCGCTGGAG 420AGTCGGGGCC GCCGCCGCCG GAGGACCGCC ATCCTCATCT CCGCCTGCAT CTTCATCCTC 480GTCGGGATCG TTCACTACCC GGTGTTCCAG ACGGAAGACA AGGAGACCTG CTTTGACATG 540CTGCAGATGG ACAGCAGGAT TGCCGGGTAC TACTACGCCA GGTTCACCGT TGGCTTTGCC 600ATCCCTCTCT CCATCATCGC CTTCACCAAC CACCGGATTT TCAGGAGCAT CAAGCAGAGC 660ATGGGCTTAA GCGCTGCCCA GAAGGCCAAG GTGAAGCACT CGGCCATCGC GGTGGTTGTC 720ATCTTCCTAG TCTGCTTCGC CCCGTACCAC CTGGTTCTCC TCGTCAAAGC CGCTGCCTTT 780TCCTACTACA GAGGAGACAG GAACGCCATG TGCGGCTTGG AGGAAAGGCT GTACACAGCC 840TCTGTGGTGT TTCTGTGCCT GTCCACGGTG AACGGCGTGG CTGACCCCAT TATCTACGTG 900CTGGCCACGG ACCATTCCCG CCAAGAAGTG TCCAGAATCC ATAAGGGGTG GAAAGAGTGG 960TCCATGAAGA CAGACGTCAC CAGGCTCACC CACAGCAGGG ACACCGAGGA GCTGCAGTCG 1020CCCGTGGCCC TTGCAGACCA CTACACCTTC TCCAGGCCCG TGCACCCACC AGGGTCACCA 1080TGCCCTGCAA AGAGGCTGAT TGAGGAGTCC TGCTGA 1116(27)SEQ ID NO26的资料(i)序列特征(A)长度371个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO26的序列描述Met Pro Gly Asn Ala Thr Pro Val Thr Thr Thr Ala Pro Trp Ala Ser1 5 10 15Leu Gly Leu Ser Ala Lys Thr Cys Asn Asn Val Ser Phe Glu Glu Ser20 25 30Arg Ile Val Leu Val Val Val Tyr Ser Ala Val Cys Thr Leu Gly Val35 40 45Pro Ala Asn Cys Leu Thr Ala Trp Leu Ala Leu Leu Gln Val Leu Gln50 55 60Gly Asn Val Leu Ala Val Tyr Leu Leu Cys Leu Ala Leu Cys Glu Leu65 70 75 80Leu Tyr Thr Gly Thr Leu Pro Leu Trp Val Ile Tyr Ile Arg Asn Gln85 90 95His Arg Trp Thr Leu Gly Leu Leu Ala Ser Lys Val Thr Ala Tyr Ile100 105 110Phe Phe Cys Asn Ile Tyr Val Ser Ile Leu Phe Leu Cys Cys Ile Ser115 120 125Cys Asp Arg Phe Val Ala Val Val Tyr Ala Leu Glu Ser Arg Gly Arg130 135 140Arg Arg Arg Arg Thr Ala Ile Leu Ile Ser Ala Cys Ile Phe Ile Leu145 150 155 160Val Gly Ile Val His Tyr Pro Val Phe Gln Thr Glu Asp Lys Glu Thr165170 175Cys Phe Asp Met Leu Gln Met Asp Ser Arg Ile Ala Gly Tyr Tyr Tyr180 185 190Ala Arg Phe Thr Val Gly Phe Ala Ile Pro Leu Ser Ile Ile Ala Phe195 200 205Thr Asn His Arg Ile Phe Arg Ser Ile Lys Gln Ser Met Gly Leu Ser210 215 220Ala Ala Gln Lys Ala Lys Val Lys His Ser Ala Ile Ala Val Val Val225 230 235 240Ile Phe Leu Val Cys Phe Ala Pro Tyr His Leu Val Leu Leu Val Lys245 250 255Ala Ala Ala Phe Ser Tyr Tyr Arg Gly Asp Arg Asn Ala Met Cys Gly260 265 270Leu Glu Glu Arg Leu Tyr Thr Ala Ser Val Val Phe Leu Cys Leu Ser275 280 285Thr Val Asn Gly Val Ala Asp Pro Ile Ile Tyr Val Leu Ala Thr Asp290 295 300
His Ser Arg Gln Glu Val Ser Arg Ile His Lys Gly Trp Lys Glu Trp305 310 315 320Ser Met Lys Thr Asp Val Thr Arg Leu Thr His Ser Arg Asp Thr Glu325 330 335Glu Leu Gln Ser Pro Val Ala Leu Ala Asp His Tyr Thr Phe Ser Arg340 345 350Pro Val His Pro Pro Gly Ser Pro Cys Pro Ala Lys Arg Leu Ile Glu355 360 365Glu Ser Cys370(28)SEQ ID NO27的资料(i)序列特征(A)长度1113个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO27的序列描述ATGGCGAACT ATAGCCATGC AGCTGACAAC ATTTTGCAAA ATCTCTCGCC TCTAACAGCC 60TTTCTGAAAC TGACTTCCTT GGGTTTCATA ATAGGAGTCA GCGTGGTGGG CAACCTCCTG 120ATCTCCATTT TGCTAGTGAA AGATAAGACC TTGCATAGAG CACCTTACTA CTTCCTGTTG 180GATCTTTGCT GTTCAGATAT CCTCAGATCT GCAATTTGTT TCCCATTTGT GTTCAACTCT 240GTCAAAAATG GCTCTACCTG GACTTATGGG ACTCTGACTT GCAAAGTGAT TGCCTTTCTG 300GGGGTTTTGT CCTGTTTCCA CACTGCTTTC ATGCTCTTCT GCATCAGTGT CACCAGATAC 360TTAGCTATCG CCCATCACCG CTTCTATACA AAGAGGCTGA CCTTTTGGAC GTGTCTGGCT 420GTGATCTGTA TGGTGTGGAC TCTGTCTGTG GCCATGGCAT TTCCCCCGGT TTTAGACGTG 480GGCACTTACT CATTCATTAG GGAGGAAGAT CAATGCACCT TCCAACACCG CTCCTTCAGG 540GCTAATGATT CCTTAGGATT TATGCTGCTT CTTGCTCTCA TCCTCCTAGC CACACAGCTT 600GTCTACCTCA AGCTGATATT TTTCGTCCAC GATCGAAGAA AAATGAAGCC AGTCCAGTTT 660GTAGCAGCAG TCAGCCAGAA CTGGACTTTT CATGGTCCTG GAGCCAGTGG CCAGGCAGCT 720GCCAATTGGC TAGCAGGATT TGGAAGGGGT CCCACACCAC CCACCTTGCT GGGCATCAGG 780CAAAATGCAA ACACCACAGG CAGAAGAAGG CTATTGGTCT TAGACGAGTT CAAAATGGAG 840AAAAGAATCA GCAGAATGTT CTATATAATG ACTTTTCTGT TTCTAACCTT GTGGGGCCCC 900TACCTGGTGG CCTGTTATTG GAGAGTTTTT GCAAGAGGGC CTGTAGTACC AGGGGGATTT 960CTAACAGCTG CTGTCTGGAT GAGTTTTGCC CAAGCAGGAA TCAATCCTTT TGTCTGCATT 1020TTCTCAAACA GGGAGCTGAG GCGCTGTTTC AGCACAACCC TTCTTTACTG CAGAAAATCC 1080AGGTTACCAA GGGAACCTTA CTGTGTTATA TGA 1113(29)SEQ ID NO28的资料(i)序列特征(A)长度370个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO28的序列描述Met Ala Asn Tyr Ser His Ala Ala Asp Asn Ile Leu Gln Asn Leu Ser1 5 10 15Pro Leu Thr Ala Phe Leu Lys Leu Thr Ser Leu Gly Phe Ile Ile Gly20 25 30Val Ser Val Val Gly Asn Leu Leu Ile Ser Ile Leu Leu Val Lys Asp35 40 45Lys Thr Leu His Arg Ala Pro Tyr Tyr Phe Leu Leu Asp Leu Cys Cys50 55 60Ser Asp Ile Leu Arg Ser Ala Ile Cys Phe Pro Phe Val Phe Asn Ser65 70 75 80Val Lys Asn Gly Ser Thr Trp Thr Tyr Gly Thr Leu Thr Cys Lys Val85 90 95Ile Ala Phe Leu Gly Val Leu Ser Cys Phe His Thr Ala Phe Met Leu100 105 110Phe Cys Ile Ser Val Thr Arg Tyr Leu Ala Ile Ala His His Arg Phe115 120 125Tyr Thr Lys Arg Leu Thr Phe Trp Thr Cys Leu Ala Val Ile Cys Met130 135 140Val Trp Thr Leu Ser Val Ala Met Ala Phe Pro Pro Val Leu Asp Val145 150 155 160Gly Thr Tyr Ser Phe Ile Arg Glu Glu Asp Gln Cys Thr Phe Gln His
165 170 175Arg Ser Phe Arg Ala Asn Asp Ser Leu Gly Phe Met Leu Leu Leu Ala180 185 190Leu Ile Leu Leu Ala Thr Gln Leu Val Tyr Leu Lys Leu Ile Phe Phe195 200 205Val His Asp Arg Arg Lys Met Lys Pro Val Gln Phe Val Ala Ala Val210 215 220Ser Gln Asn Trp Thr Phe His Gly Pro Gly Ala Ser Gly Gln Ala Ala225 230 235 240Ala Asn Trp Leu Ala Gly Phe Gly Arg Gly Pro Thr Pro Pro Thr Leu245 250 255Leu Gly Ile Arg Gln Asn Ala Asn Thr Thr Gly Arg Arg Arg Leu Leu260 265 270Val Leu Asp Glu Phe Lys Met Glu Lys Arg Ile Ser Arg Met Phe Tyr275 280 285Ile Met Thr Phe Leu Phe Leu Thr Leu Trp Gly Pro Tyr Leu Val Ala290 295 300Cys Tyr Trp Arg Val Phe Ala Arg Gly Pro Val Val Pro Gly Gly Phe305 310 315 320Leu Thr Ala Ala Val Trp Met Ser Phe Ala Gln Ala Gly Ile Asn Pro325 330 335Phe Val Cys Ile Phe Ser Asn Arg Glu Leu Arg Arg Cys Phe Ser Thr340 345 350Thr Leu Leu Tyr Cys Arg Lys Ser Arg Leu Pro Arg Glu Pro Tyr Cys355 360 365Val Ile370(30)SEQ ID NO29的资料(i)序列特征(A)长度1080个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO29的序列描述ATGCAGGTCC CGAACAGCAC CGGCCCGGAC AACGCGACGC TGCAGATGCT GCGGAACCCG 60GCGATCGCGG TGGCCCTGCC CGTGGTGTAC TCGCTGGTGG CGGCGGTCAG CATCCCGGGC 120AACCTCTTCT CTCTGTGGGT GCTGTGCCGG CGCATGGGGC CCAGATCCCC GTCGGTCATC 180TTCATGATCA ACCTGAGCGT CACGGACCTG ATGCTGGCCA GCGTGTTGCC TTTCCAAATC 240TACTACCATT GCAACCGCCA CCACTGGGTA TTCGGGGTGC TGCTTTGCAA CGTGGTGACC 300GTGGCCTTTT ACGCAAACAT GTATTCCAGC ATCCTCACCA TGACCTGTAT CAGCGTGGAG 360CGCTTCCTGG GGGTCCTGTA CCCGCTCAGC TCCAAGCGCT GGCGCCGCCG TCGTTACGCG 420GTGGCCGCGT GTGCAGGGAC CTGGCTGCTG CTCCTGACCG CCCTGTGCCC GCTGGCGCGC 480ACCGATCTCA CCTACCCGGT GCACGCCCTG GGCATCATCA CCTGCTTCGA CGTCCTCAAG 540TGGACGATGC TCCCCAGCGT GGCCATGTGG GCCGTGTTCC TCTTCACCAT CTTCATCCTG 600CTGTTCCTCA TCCCGTTCGT GATCACCGTG GCTTGTTACA CGGCCACCAT CCTCAAGCTG 660TTGCGCACGG AGGAGGCGCA CGGCCGGGAG CAGCGGAGGC GCGCGGTGGG CCTGGCCGCG 720GTGGTCTTGC TGGCCTTTGT CACCTGCTTC GCCCCCAACA ACTTCGTGCT CCTGGCGCAC 780ATCGTGAGCC GCCTGTTCTA CGGCAAGAGC TACTACCACG TGTACAAGCT CACGCTGTGT 840CTCAGCTGCC TCAACAACTG TCTGGACCCG TTTGTTTATT ACTTTGCGTC CCGGGAATTC 900CAGCTGCGCC TGCGGGAATA TTTGGGCTGC CGCCGGGTGC CCAGAGACAC CCTGGACACG 960CGCCGCGAGA GCCTCTTCTC CGCCAGGACC ACGTCCGTGC GCTCCGAGGC CGGTGCGCAC 1020CCTGAAGGGA TGGAGGGAGC CACCAGGCCC GGCCTCCAGA GGCAGGAGAG TGTGTTCTGA 1080(31)SEQ ID NO30的资料(i)序列特征(A)长度359个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO30的序列描述Met Gln Val Pro Asn Ser Thr Gly Pro Asp Asn Ala Thr Leu Gln Met1 5 10 15Leu Arg Asn Pro Ala Ile Ala Val Ala Leu Pro Val Val Tyr Ser Leu20 25 30Val Ala Ala Val Ser Ile Pro Gly Asn Leu Phe Ser Leu Trp Val Leu
35 40 45Cys Arg Arg Met Gly Pro Arg Ser Pro Ser Val Ile Phe Met Ile Asn50 55 60Leu Ser Val Thr Asp Leu Met Leu Ala Ser Val Leu Pro Phe Gln Ile65 70 75 80Tyr Tyr His Cys Asn Arg His His Trp Val Phe Gly Val Leu Leu Cys85 90 95Asn Val Val Thr Val Ala Phe Tyr Ala Asn Met Tyr Ser Ser Ile Leu100 105 110Thr Met Thr Cys Ile Ser Val Glu Arg Phe Leu Gly Val Leu Tyr Pro115 120 125Leu Ser Ser Lys Arg Trp Arg Arg Arg Arg Tyr Ala Val Ala Ala Cys130 135 140Ala Gly Thr Trp Leu Leu Leu Leu Thr Ala Leu Cys Pro Leu Ala Arg145 150 155 160Thr Asp Leu Thr Tyr Pro Val His Ala Leu Gly Ile Ile Thr Cys Phe165 170 175Asp Val Leu Lys Trp Thr Met Leu Pro Ser Val Ala Met Trp Ala Val180 185 190Phe Leu Phe Thr Ile Phe Ile Leu Leu Phe Leu Ile Pro Phe Val Ile195 200 205Thr Val Ala Cys Tyr Thr Ala Thr Ile Leu Lys Leu Leu Arg Thr Glu210 215 220Glu Ala His Gly Arg Glu Gln Arg Arg Arg Ala Val Gly Leu Ala Ala225 230 235 240Val Val Leu Leu Ala Phe Val Thr Cys Phe Ala Pro Asn Asn Phe Val245 250 255Leu Leu Ala His Ile Val Ser Arg Leu Phe Tyr Gly Lys Ser Tyr Tyr260 265 270His Val Tyr Lys Leu Thr Leu Cys Leu Ser Cys Leu Asn Asn Cys Leu275 280 285Asp Pro Phe Val Tyr Tyr Phe Ala Ser Arg Glu Phe Gln Leu Arg Leu290 295 300Arg Glu Tyr Leu Gly Cys Arg Arg Val Pro Arg Asp Thr Leu Asp Thr305 310 315 320Arg Arg Glu Ser Leu Phe Ser Ala Arg Thr Thr Ser Val Arg Ser Glu325 330 335Ala Gly Ala His Pro Glu Gly Met Glu Gly Ala Thr Arg Pro Gly Leu340 345 350Gln Arg Gln Glu Ser Val Phe355(32)SEQ ID NO31的资料(i)序列特征(A)长度1503个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO31的序列描述ATGGAGCGTC CCTGGGAGGA CAGCCCAGGC CCGGAGGGGG CAGCTGAGGG CTCGCCTGTG 60CCAGTCGCCG CCGGGGCGCG CTCCGGTGCC GCGGCGAGTG GCACAGGCTG GCAGCCATGG 120GCTGAGTGCC CGGGACCCAA GGGGAGGGGG CAACTGCTGG CGACCGCCGG CCCTTTGCGT 180CGCTGGCCCG CCCCCTCGCC TGCCAGCTCC AGCCCCGCCC CCGGAGCGGC GTCCGCTCAC 240TCGGTTCAAG GCAGCGCGAC TGCGGGTGGC GCACGACCAG GGCGCAGACC TTGGGGCGCG 300CGGCCCATGG AGTCGGGGCT GCTGCGGCCG GCGCCGGTGA GCGAGGTCAT CGTCCTGCAT 360TACAACTACA CCGGCAAGCT CCGCGGTGCG AGCTACCAGC CGGGTGCCGG CCTGCGCGCC 420GACGCCGTGG TGTGCCTGGC GGTGTGCGCC TTCATCGTGC TAGAGAATCT AGCCGTGTTG 480TTGGTGCTCG GACGCCACCC GCGCTTCCAC GCTCCCATGT TCCTGCTCCT GGGCAGCCTC 540ACGTTGTCGG ATCTGCTGGC AGGCGCCGCC TACGCCGCCA ACATCCTACT GTCGGGGCCG 600CTCACGCTGA AACTGTCCCC CGCGCTCTGG TTCGCACGGG AGGGAGGCGT CTTCGTGGCA 660CTCACTGCGT CCGTGCTGAG CCTCCTGGCC ATCGCGCTGG AGCGCAGCCT CACCATGGCG 720CGCAGGGGGC CCGCGCCCGT CTCCAGTCGG GGGCGCACGC TGGCGATGGC AGCCGCGGCC 780TGGGGCGTGT CGCTGCTCCT CGGGCTCCTG CCAGCGCTGG GCTGGAATTG CCTGGGTCGC 840CTGGACGCTT GCTCCACTGT CTTGCCGCTC TACGCCAAGG CCTACGTGCT CTTCTGCGTG 900CTCGCCTTCG TGGGCATCCT GGCCGCGATC TGTGCACTCT ACGCGCGCAT CTACTGCCAG 960GTACGCGCCA ACGCGCGGCG CCTGCCGGCA CGGCCCGGGA CTGCGGGGAC CACCTCGACC 1020CGGGCGCGTC GCAAGCCGCG CTCTCTGGCC TTGCTGCGCA CGCTCAGCGT GGTGCTCCTG 1080GCCTTTGTGG CATGTTGGGG CCCCCTCTTC CTGCTGCTGT TGCTCGACGT GGCGTGCCCG 1140GCGCGCACCT GTCCTGTACT CCTGCAGGCC GATCCCTTCC TGGGACTGGC CATGGCCAAC 1200TCACTTCTGA ACCCCATCAT CTACACGCTC ACCAACCGCG ACCTGCGCCA CGCGCTCCTG 1260CGCCTGGTCT GCTGCGGACG CCACTCCTGC GGCAGAGACC CGAGTGGCTC CCAGCAGTCG 1320GCGAGCGCGG CTGAGGCTTC CGGGGGCCTG CGCCGCTGCC TGCCCCCGGG CCTTGATGGG 1380AGCTTCAGCG GCTCGGAGCG CTCATCGCCC CAGCGCGACG GGCTGGACAC CAGCGGCTCC 1440ACAGGCAGCC CCGGTGCACC CACAGCCGCC CGGACTCTGG TATCAGAACC GGCTGCAGAC 1500TGA 1503(33)SEQ ID NO32的资料(i)序列特征(A)长度500个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO32的序列描述Met Glu Arg Pro Trp Glu Asp Ser Pro Gly Pro Glu Gly Ala Ala Glu1 5 10 15Gly Ser Pro Val Pro Val Ala Ala Gly Ala Arg Ser Gly Ala Ala Ala20 25 30Ser Gly Thr Gly Trp Gln Pro Trp Ala Glu Cys Pro Gly Pro Lys Gly35 40 45Arg Gly Gln Leu Leu Ala Thr Ala Gly Pro Leu Arg Arg Trp Pro Ala50 55 60Pro Ser Pro Ala Ser Ser Ser Pro Ala Pro Gly Ala Ala Ser Ala His65 70 75 80Ser Val Gln Gly Ser Ala Thr Ala Gly Gly Ala Arg Pro Gly Arg Arg85 90 95Pro Trp Gly Ala Arg Pro Met Glu Ser Gly Leu Leu Arg Pro Ala Pro100 105 110Val Ser Glu Val Ile Val Leu His Tyr Asn Tyr Thr Gly Lys Leu Arg115 120 125Gly Ala Ser Tyr Gln Pro Gly Ala Gly Leu Arg Ala Asp Ala Val Val130 135 140Cys Leu Ala Val Cys Ala Phe Ile Val Leu Glu Asn Leu Ala Val Leu145 150 155 160Leu Val Leu Gly Arg His Pro Arg Phe His Ala Pro Met Phe Leu Leu165 170 175Leu Gly Ser Leu Thr Leu Ser Asp Leu Leu Ala Gly Ala Ala Tyr Ala180 185 190Ala Asn Ile Leu Leu Ser Gly Pro Leu Thr Leu Lys Leu Ser Pro Ala195 200 205Leu Trp Phe Ala Arg Glu Gly Gly Val Phe Val Ala Leu Thr Ala Ser210 215 220Val Leu Ser Leu Leu Ala Ile Ala Leu Glu Arg Ser Leu Thr Met Ala225 230 235 240Arg Arg Gly Pro Ala Pro Val Ser Ser Arg Gly Arg Thr Leu Ala Met245 250 255Ala Ala Ala Ala Trp Gly Val Ser Leu Leu Leu Gly Leu Leu Pro Ala260 265 270Leu Gly Trp Asn Cys Leu Gly Arg Leu Asp Ala Cys Ser Thr Val Leu275 280 285Pro Leu Tyr Ala Lys Ala Tyr Val Leu Phe Cys Val Leu Ala Phe Val290 295 300Gly Ile Leu Ala Ala Ile Cys Ala Leu Tyr Ala Arg Ile Tyr Cys Gln305 310 315 320Val Arg Ala Asn Ala Arg Arg Leu Pro Ala Arg Pro Gly Thr Ala Gly325 330 335Thr Thr Ser Thr Arg Ala Arg Arg Lys Pro Arg Ser Leu Ala Leu Leu340 345 350Arg Thr Leu Ser Val Val Leu Leu Ala Phe Val Ala Cys Trp Gly Pro355 360 365Leu Phe Leu Leu Leu Leu Leu Asp Val Ala Cys Pro Ala Arg Thr Cys370 375 380Pro Val Leu Leu Gln Ala Asp Pro Phe Leu Gly Leu Ala Met Ala Asn385 390 395 400Ser Leu Leu Asn Pro Ile Ile Tyr Thr Leu Thr Asn Arg Asp Leu Arg405 410 415His Ala Leu Leu Arg Leu Val Cys Cys Gly Arg His Ser Cys Gly Arg420 425 430Asp Pro Ser Gly Ser Gln Gln Ser Ala Ser Ala Ala Glu Ala Ser Gly
435 440 445Gly Leu Arg Arg Cys Leu Pro Pro Gly Leu Asp Gly Ser Phe Ser Gly450 455 460Ser Glu Arg Ser Ser Pro Gln Arg Asp Gly Leu Asp Thr Ser Gly Ser465 470 475 480Thr Gly Ser Pro Gly Ala Pro Thr Ala Ala Arg Thr Leu Val Ser Glu485 490 495Pro Ala Ala Asp500(34)SEQ ID NO33的资料(i)序列特征(A)长度1029个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO33的序列描述ATGCAAGCCG TCGACAATCT CACCTCTGCG CCTGGGAACA CCAGTCTGTG CACCAGAGAC 60TACAAAATCA CCCAGGTCCT CTTCCCACTG CTCTACACTG TCCTGTTTTT TGTTGGACTT 120ATCACAAATG GCCTGGCGAT GAGGATTTTC TTTCAAATCC GGAGTAAATC AAACTTTATT 180ATTTTTCTTA AGAACACAGT CATTTCTGAT CTTCTCATGA TTCTGACTTT TCCATTCAAA 240ATTCTTAGTG ATGCCAAACT GGGAACAGGA CCACTGAGAA CTTTTGTGTG TCAAGTTACC 300TCCGTCATAT TTTATTTCAC AATGTATATC AGTATTTCAT TCCTGGGACT GATAACTATC 360GATCGCTACC AGAAGACCAC CAGGCCATTT AAAACATCCA ACCCCAAAAA TCTCTTGGGG 420GCTAAGATTC TCTCTGTTGT CATCTGGGCA TTCATGTTCT TACTCTCTTT GCCTAACATG 480ATTCTGACCA ACAGGCAGCC GAGAGACAAG AATGTGAAGA AATGCTCTTT CCTTAAATCA 540GAGTTCGGTC TAGTCTGGCA TGAAATAGTA AATTACATCT GTCAAGTCAT TTTCTGGATT 600AATTTCTTAA TTGTTATTGT ATGTTATACA CTCATTACAA AAGAACTGTA CCGGTCATAC 660GTAAGAACGA GGGGTGTAGG TAAAGTCCCC AGGAAAAAGG TGAACGTCAA AGTTTTCATT 720ATCATTGCTG TATTCTTTAT TTGTTTTGTT CCTTTCCATT TTGCCCGAAT TCCTTACACC 780CTGAGCCAAA CCCGGGATGT CTTTGACTGC ACTGCTGAAA ATACTCTGTT CTATGTGAAA 840GAGAGCACTC TGTGGTTAAC TTCCTTAAAT GCATGCCTGG ATCCGTTCAT CTATTTTTTC 900CTTTGCAAGT CCTTCAGAAA TTCCTTGATA AGTATGCTGA AGTGCCCCAA TTCTGCAACA 960TCTCTGTCCC AGGACAATAG GAAAAAAGAA CAGGATGGTG GTGACCCAAA TGAAGAGACT 1020CCAATGTAA 1029(35)SEQ ID NO34的资料(i)序列特征(A)长度342个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO34的序列描述Met Gln Ala Val Asp Asn Leu Thr Ser Ala Pro Gly Asn Thr Ser Leu1 5 10 15Cys Thr Arg Asp Tyr Lys Ile Thr Gln Val Leu Phe Pro Leu Leu Tyr20 25 30Thr Val Leu Phe Phe Val Gly Leu Ile Thr Asn Gly Leu Ala Met Arg35 40 45Ile Phe Phe Gln Ile Arg Ser Lys Ser Asn Phe Ile Ile Phe Leu Lys50 55 60Asn Thr Val Ile Ser Asp Leu Leu Met Ile Leu Thr Phe Pro Phe Lys65 70 75 80Ile Leu Ser Asp Ala Lys Leu Gly Thr Gly Pro Leu Arg Thr Phe Val85 90 95Cys Gln Val Thr Ser Val Ile Phe Tyr Phe Thr Met Tyr Ile Ser Ile100 105 110Ser Phe Leu Gly Leu Ile Thr Ile Asp Arg Tyr Gln Lys Thr Thr Arg115 120 125Pro Phe Lys Thr Ser Asn Pro Lys Asn Leu Leu Gly Ala Lys Ile Leu130 135 140Ser Val Val Ile Trp Ala Phe Met Phe Leu Leu Ser Leu Pro Asn Met145 150 155 160Ile Leu Thr Asn Arg Gln Pro Arg Asp Lys Asn Val Lys Lys Cys Ser165 170 175Phe Leu Lys Ser Glu Phe Gly Leu Val Trp His Glu Ile Val Asn Tyr
180 185 190Ile Cys Gln Val Ile Phe Trp Ile Asn Phe Leu Ile Val Ile Val Cys195 200 205Tyr Thr Leu Ile Thr Lys Glu Leu Tyr Arg Ser Tyr Val Arg Thr Arg210 215 220Gly Val Gly Lys Val Pro Arg Lys Lys Val Asn Val Lys Val Phe Ile225 230 235 240Ile Ile Ala Val Phe Phe Ile Cys Phe Val Pro Phe His Phe Ala Arg245 250 255Ile Pro Tyr Thr Leu Ser Gln Thr Arg Asp Val Phe Asp Cys Thr Ala260 265 270Glu Asn Thr Leu Phe Tyr Val Lys Glu Ser Thr Leu Trp Leu Thr Ser275 280 285Leu Asn Ala Cys Leu Asp Pro Phe Ile Tyr Phe Phe Leu Cys Lys Ser290 295 300Phe Arg Asn Ser Leu Ile Ser Met Leu Lys Cys Pro Asn Ser Ala Thr305 310 315 320Ser Leu Ser Gln Asp Asn Arg Lys Lys Glu Gln Asp Gly Gly Asp Pro325 330 335Asn Glu Glu Thr Pro Met340(36)SEQ ID NO35的资料(i)序列特征(A)长度1077个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO35的序列描述ATGTCGGTCT GCTACCGTCC CCCAGGGAAC GAGACACTGC TGAGCTGGAA GACTTCGCGG 60GCCACAGGCA CAGCCTTCCT GCTGCTGGCG GCGCTGCTGG GGCTGCCTGG CAACGGCTTC 120GTGGTGTGGA GCTTGGCGGG CTGGCGGCCT GCACGGGGGC GACCGCTGGC GGCCACGCTT 180GTGCTGCACC TGGCGCTGGC CGACGGCGCG GTGCTGCTGC TCACGCCGCT CTTTGTGGCC 240TTCCTGACCC GGCAGGCCTG GCCGCTGGGC CAGGCGGGCT GCAAGGCGGT GTACTACGTG 300TGCGCGCTCA GCATGTACGC CAGCGTGCTG CTCACCGGCC TGCTCAGCCT GCAGCGCTGC 360CTCGCAGTCA CCCGCCCCTT CCTGGCGCCT CGGCTGCGCA GCCCGGCCCT GGCCCGCCGC 420CTGCTGCTGG CGGTCTGGCT GGCCGCCCTG TTGCTCGCCG TCCCGGCCGC CGTCTACCGC 480CACCTGTGGA GGGACCGCGT ATGCCAGCTG TGCCACCCGT CGCCGGTCCA CGCCGCCGCC 540CACCTGAGCC TGGAGACTCT GACCGCTTTC GTGCTTCCTT TCGGGCTGAT GCTCGGCTGC 600TACAGCGTGA CGCTGGCACG GCTGCGGGGC GCCCGCTGGG GCTCCGGGCG GCACGGGGCG 660CGGGTGGGCC GGCTGGTGAG CGCCATCGTG CTTGCCTTCG GCTTGCTCTG GGCCCCCTAC 720CACGCAGTCA ACCTTCTGCA GGCGGTCGCA GCGCTGGCTC CACCGGAAGG GGCCTTGGCG 780AAGCTGGGCG GAGCCGGCCA GGCGGCGCGA GCGGGAACTA CGGCCTTGGC CTTCTTCAGT 840TCTAGCGTCA ACCCGGTGCT CTACGTCTTC ACCGCTGGAG ATCTGCTGCC CCGGGCAGGT 900CCCCGTTTCC TCACGCGGCT CTTCGAAGGC TCTGGGGAGG CCCGAGGGGG CGGCCGCTCT 960AGGGAAGGGA CCATGGAGCT CCGAACTACC CCTCAGCTGA AAGTGGTGGG GCAGGGCCGC 1020GGCAATGGAG ACCCGGGGGG TGGGATGGAG AAGGACGGTC CGGAATGGGA CCTTTGA1077(37)SEQ ID NO36的资料(i)序列特征(A)长度358个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO36的序列描述Met Ser Val Cys Tyr Arg Pro Pro Gly Asn Glu Thr Leu Leu Ser Trp1 5 10 15Lys Thr Ser Arg Ala Thr Gly Thr Ala Phe Leu Leu Leu Ala Ala Leu20 25 30Leu Gly Leu Pro Gly Asn Gly Phe Val Val Trp Ser Leu Ala Gly Trp35 40 45Arg Pro Ala Arg Gly Arg Pro Leu Ala Ala Thr Leu Val Leu His Leu50 55 60Ala Leu Ala Asp Gly Ala Val Leu Leu Leu Thr Pro Leu Phe Val Ala65 70 75 80Phe Leu Thr Arg Gln Ala Trp Pro Leu Gly Gln Ala Gly Cys Lys Ala
85 90 95Val Tyr Tyr Val Cys Ala Leu Ser Met Tyr Ala Ser Val Leu Leu Thr100 105 110Gly Leu Leu Ser Leu Gln Arg Cys Leu Ala Val Thr Arg Pro Phe Leu115 120 125Ala Pro Arg Leu Arg Ser Pro Ala Leu Ala Arg Arg Leu Leu Leu Ala130 135 140Val Trp Leu Ala Ala Leu Leu Leu Ala Val Pro Ala Ala Val Tyr Arg145 150 155 160His Leu Trp Arg Asp Arg Val Cys Gln Leu Cys His Pro Ser Pro Val165 170 175His Ala Ala Ala His Leu Ser Leu Glu Thr Leu Thr Ala Phe Val Leu180 185 190Pro Phe Gly Leu Met Leu Gly Cys Tyr Ser Val Thr Leu Ala Arg Leu195 200 205Arg Gly Ala Arg Trp Gly Ser Gly Arg His Gly Ala Arg Val Gly Arg210 215 220Leu Val Ser Ala Ile Val Leu Ala Phe Gly Leu Leu Trp Ala Pro Tyr225 230 235 240His Ala Val Asn Leu Leu Gln Ala Val Ala Ala Leu Ala Pro Pro Glu245 250 255Gly Ala Leu Ala Lys Leu Gly Gly Ala Gly Gln Ala Ala Arg Ala Gly260 265 270Thr Thr Ala Leu Ala Phe Phe Ser Ser Ser Val Asn Pro Val Leu Tyr275 280 285Val Phe Thr Ala Gly Asp Leu Leu Pro Arg Ala Gly Pro Arg Phe Leu290 295 300Thr Arg Leu Phe Glu Gly Ser Gly Glu Ala Arg Gly Gly Gly Arg Ser305 310 315 320Arg Glu Gly Thr Met Glu Leu Arg Thr Thr Pro Gln Leu Lys Val Val325 330 335Gly Gln Gly Arg Gly Asn Gly Asp Pro Gly Gly Gly Met Glu Lys Asp340 345 350Gly Pro Glu Trp Asp Leu355(38)SEQ ID NO37的资料(i)序列特征(A)长度1005个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO37的序列描述ATGCTGGGGA TCATGGCATG GAATGCAACT TGCAAAAACT GGCTGGCAGC AGAGGCTGCC 60CTGGAAAAGT ACTACCTTTC CATTTTTTAT GGGATTGAGT TCGTTGTGGG AGTCCTTGGA 120AATACCATTG TTGTTTACGG CTACATCTTC TCTCTGAAGA ACTGGAACAG CAGTAATATT 180TATCTCTTTA ACCTCTCTGT CTCTGACTTA GCTTTTCTGT GCACCCTCCC CATGCTGATA 240AGGAGTTATG CCAATGGAAA CTGGATATAT GGAGACGTGC TCTGCATAAG CAACCGATAT 300GTGCTTCATG CCAACCTCTA TACCAGCATT CTCTTTCTCA CTTTTATCAG CATAGATCGA 360TACTTGATAA TTAAGTATCC TTTCCGAGAA CACCTTCTGC AAAAGAAAGA GTTTGCTATT 420TTAATCTCCT TGGCCATTTG GGTTTTAGTA ACCTTAGAGT TACTACCCAT ACTTCCCCTT 480ATAAATCCTG TTATAACTGA CAATGGCACC ACCTGTAATG ATTTTGCAAG TTCTGGAGAC 540CCCAACTACA ACCTCATTTA CAGCATGTGT CTAACACTGT TGGGGTTCCT TATTCCTCTT 600TTTGTGATGT GTTTCTTTTA TTACAAGATT GCTCTCTTCC TAAAGCAGAG GAATAGGCAG 660GTTGCTACTG CTCTGCCCCT TGAAAAGCCT CTCAACTTGG TCATCATGGC AGTGGTAATC 720TTCTCTGTGC TTTTTACACC CTATCACGTC ATGCGGAATG TGAGGATCGC TTCACGCCTG 780GGGAGTTGGA AGCAGTATCA GTGCACTCAG GTCGTCATCA ACTCCTTTTA CATTGTGACA 840CGGCCTTTGG CCTTTCTGAA CAGTGTCATC AACCCTGTCT TCTATTTTCT TTTGGGAGAT 900CACTTCAGGG ACATGCTGAT GAATCAACTG AGACACAACT TCAAATCCCT TACATCCTTT 960AGCAGATGGG CTCATGAACT CCTACTTTCA TTCAGAGAAA AGTGA 1005(39)SEQ ID NO38的资料(i)序列特征(A)长度334个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO38的序列描述Met Leu Gly Ile Met Ala Trp Asn Ala Thr Cys Lys Asn Trp Leu Ala1 5 10 15Ala Glu Ala Ala Leu Glu Lys Tyr Tyr Leu Ser Ile Phe Tyr Gly Ile20 25 30Glu Phe Val Val Gly Val Leu Gly Asn Thr Ile Val Val Tyr Gly Tyr35 40 45Ile Phe Ser Leu Lys Asn Trp Asn Ser Ser Asn Ile Tyr Leu Phe Asn50 55 60Leu Ser Val Ser Asp Leu Ala Phe Leu Cys Thr Leu Pro Met Leu Ile65 70 75 80Arg Ser Tyr Ala Asn Gly Asn Trp Ile Tyr Gly Asp Val Leu Cys Ile85 90 95Ser Asn Arg Tyr Val Leu His Ala Asn Leu Tyr Thr Ser Ile Leu Phe100 105 110Leu Thr Phe Ile Ser Ile Asp Arg Tyr Leu Ile Ile Lys Tyr Pro Phe115 120 125Arg Glu His Leu Leu Gln Lys Lys Glu Phe Ala Ile Leu Ile Ser Leu130 135 140Ala Ile Trp Val Leu Val Thr Leu Glu Leu Leu Pro Ile Leu Pro Leu145 150 155 160Ile Asn Pro Val Ile Thr Asp Asn Gly Thr Thr Cys Asn Asp Phe Ala165 170 175Ser Ser Gly Asp Pro Asn Tyr Asn Leu Ile Tyr Ser Met Cys Leu Thr180 185 190Leu Leu Gly Phe Leu Ile Pro Leu Phe Val Met Cys Phe Phe Tyr Tyr195 200 205Lys Ile Ala Leu Phe Leu Lys Gln Arg Asn Arg Gln Val Ala Thr Ala210 215 220Leu Pro Leu Glu Lys Pro Leu Asn Leu Val Ile Met Ala Val Val Ile225 230 235 240Phe Ser Val Leu Phe Thr Pro Tyr His Val Met Arg Asn Val Arg Ile245 250 255Ala Ser Arg Leu Gly Ser Trp Lys Gln Tyr Gln Cys Thr Gln Val Val260 265 270Ile Asn Ser Phe Tyr Ile Val Thr Arg Pro Leu Ala Phe Leu Asn Ser
275 280 285Val Ile Asn Pro Val Phe Tyr Phe Leu Leu Gly Asp His Phe Arg Asp290 295 300Met Leu Met Asn Gln Leu Arg His Asn Phe Lys Ser Leu Thr Ser Phe305 310 315 320Ser Arg Trp Ala His Glu Leu Leu Leu Ser Phe Arg Glu Lys325 330(40)SEQ ID NO39的资料(i)序列特征(A)长度1296个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO39的序列描述ATGCAGGCGC TTAACATTAC CCCGGAGCAG TTCTCTCGGC TGCTGCGGGA CCACAACCTG 60ACGCGGGAGC AGTTCATCGC TCTGTACCGG CTGCGACCGC TCGTCTACAC CCCAGAGCTG 120CCGGGACGCG CCAAGCTGGC CCTCGTGCTC ACCGGCGTGC TCATCTTCGC CCTGGCGCTC 180TTTGGCAATG CTCTGGTGTT CTACGTGGTG ACCCGCAGCA AGGCCATGCG CACCGTCACC 240AACATCTTTA TCTGCTCCTT GGCGCTCAGT GACCTGCTCA TCACCTTCTT CTGCATTCCC 300GTCACCATGC TCCAGAACAT TTCCGACAAC TGGCTGGGGG GTGCTTTCAT TTGCAAGATG 360GTGCCATTTG TCCAGTCTAC CGCTGTTGTG ACAGAAATGC TCACTATGAC CTGCATTGCT 420GTGGAAAGGC ACCAGGGACT TGTGCATCCT TTTAAAATGA AGTGGCAATA CACCAACCGA 480AGGGCTTTCA CAATGCTAGG TGTGGTCTGG CTGGTGGCAG TCATCGTAGG ATCACCCATG 540TGGCACGTGC AACAACTTGA GATCAAATAT GACTTCCTAT ATGAAAAGGA ACACATCTGC 600TGCTTAGAAG AGTGGACCAG CCCTGTGCAC CAGAAGATCT ACACCACCTT CATCCTTGTC 660ATCCTCTTCC TCCTGCCTCT TATGGTGATG CTTATTCTGT ACAGTAAAAT TGGTTATGAA 720CTTTGGATAA AGAAAAGAGT TGGGGATGGT TCAGTGCTTC GAACTATTCA TGGAAAAGAA 780ATGTCCAAAA TAGCCAGGAA GAAGAAACGA GCTGTCATTA TGATGGTGAC AGTGGTGGCT 840CTCTTTGCTG TGTGCTGGGC ACCATTCCAT GTTGTCCATA TGATGATTGA ATACAGTAAT 900TTTGAAAAGG AATATGATGA TGTCACAATC AAGATGATTT TTGCTATCGT GCAAATTATT 960GGATTTTCCA ACTCCATCTG TAATCCCATT GTCTATGCAT TTATGAATGA AAACTTCAAA 1020AAAAATGTTT TGTCTGCAGT TTGTTATTGC ATAGTAAATA AAACCTTCTC TCCAGCACAA 1080AGGCATGGAA ATTCAGGAAT TACAATGATG CGGAAGAAAG CAAAGTTTTC CCTCAGAGAG 1140AATCCAGTGG AGGAAACCAA AGGAGAAGCA TTCAGTGATG GCAACATTGA AGTCAAATTG 1200TGTGAACAGA CAGAGGAGAA GAAAAAGCTC AAACGACATC TTGCTCTCTT TAGGTCTGAA 1260CTGGCTGAGA ATTCTCCTTT AGACAGTGGG CATTAA 1296(41)SEQ ID NO40的资料(i)序列特征(A)长度431个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO40的序列描述Met Gln Ala Leu Asn Ile Thr Pro Glu Gln Phe Ser Arg Leu Leu Arg1 5 10 15Asp His Asn Leu Thr Arg Glu Gln Phe Ile Ala Leu Tyr Arg Leu Arg20 25 30Pro Leu Val Tyr Thr Pro Glu Leu Pro Gly Arg Ala Lys Leu Ala Leu35 40 45Val Leu Thr Gly Val Leu Ile Phe Ala Leu Ala Leu Phe Gly Asn Ala50 55 60Leu Val Phe Tyr Val Val Thr Arg Ser Lys Ala Met Arg Thr Val Thr65 70 75 80Asn Ile Phe Ile Cys Ser Leu Ala Leu Ser Asp Leu Leu Ile Thr Phe85 90 95Phe Cys Ile Pro Val Thr Met Leu Gln Asn Ile Ser Asp Asn Trp Leu100 105 110Gly Gly Ala Phe Ile Cys Lys Met Val Pro Phe Val Gln Ser Thr Ala115 120 125Val Val Thr Glu Met Leu Thr Met Thr Cys Ile Ala Val Glu Arg His130 135 140Gln Gly Leu Val His Pro Phe Lys Met Lys Trp Gln Tyr Thr Asn Arg145 150 155 160
Arg Ala Phe Thr Met Leu Gly Val Val Trp Leu Val Ala Val Ile Val165 170 175Gly Ser Pro Met Trp His Val Gln Gln Leu Glu Ile Lys Tyr Asp Phe180 185 190Leu Tyr Glu Lys Glu His Ile Cys Cys Leu Glu Glu Trp Thr Ser Pro195 200 205Val His Gln Lys Ile Tyr Thr Thr Phe Ile Leu Val Ile Leu Phe Leu210 215 220Leu Pro Leu Met Val Met Leu Ile Leu Tyr Ser Lys Ile Gly Tyr Glu225 230 235 240Leu Trp Ile Lys Lys Arg Val Gly Asp Gly Ser Val Leu Arg Thr Ile245 250 255His Gly Lys Glu Met Ser Lys Ile Ala Arg Lys Lys Lys Arg Ala Val260 265 270Ile Met Met Val Thr Val Val Ala Leu Phe Ala Val Cys Trp Ala Pro275 280 285Phe His Val Val His Met Met Ile Glu Tyr Ser Asn Phe Glu Lys Glu290 295 300Tyr Asp Asp Val Thr Ile Lys Met Ile Phe Ala Ile Val Gln Ile Ile305 310 315 320Gly Phe Ser Asn Ser Ile Cys Asn Pro Ile Val Tyr Ala Phe Met Asn325 330 335Glu Asn Phe Lys Lys Asn Val Leu Ser Ala Val Cys Tyr Cys Ile Val340 345 350Asn Lys Thr Phe Ser Pro Ala Gln Arg His Gly Asn Ser Gly Ile Thr355 360 365Met Met Arg Lys Lys Ala Lys Phe Ser Leu Arg Glu Asn Pro Val Glu370 375 380Glu Thr Lys Gly Glu Ala Phe Ser Asp Gly Asn Ile Glu Val Lys Leu385 390 395 400Cys Glu Gln Thr Glu Glu Lys Lys Lys Leu Lys Arg His Leu Ala Leu405 410 415Phe Arg Ser Glu Leu Ala Glu Asn Ser Pro Leu Asp Ser Gly His420 425 430(42)SEQ ID NO41的资料(i)序列特征(A)长度24个碱基对
(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO41的序列描述CTGTGTACAG CAGTTCGCAG AGTG 24(43)SEQ ID NO42的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO42的序列描述GAGTGCCAGG CAGAGCAGGT AGAC24(44)SEQ ID NO43的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO43的序列描述CCCGAATTCC TGCTTGCTCC CAGCTTGGCC C31(45)SEQ ID NO44的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是
(xi)SEQ ID NO44的序列描述TGTGGATCCT GCTGTCAAAG GTCCCATTCC GG 32(46)SEQ ID NO45的资料(i)序列特征(A)长度20个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO45的序列描述TCACAATGCT AGGTGTGGTC 20(47)SEQ ID NO46的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO46的序列描述TGCATAGACA ATGGGATTAC AG 22(48)SEQ ID NO47的资料(i)序列特征(A)长度511个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO47的序列描述TCACAATGCT AGGTGTGGTC TGGCTGGTGG CAGTCATCGT AGGATCACCC ATGTGGCACG 60TGCAACAACT TGAGATCAAA TATGACTTCC TATATGAAAA GGAACACATC TGCTGCTTAG 120AAGAGTGGAC CAGCCCTGTG CACCAGAAGA TCTACACCAC CTTCATCCTT GTCATCCTCT 180TCCTCCTGCC TCTTATGGTG ATGCTTATTC TGTACGTAAA ATTGGTTATG AACTTTGGAT 240AAAGAAAAGA GTTGGGGATG GTTCAGTGCT TCGAACTATT CATGGAAAAG AAATGTCCAA 300AATAGCCAGG AAGAAGAAAC GAGCTGTCAT TATGATGGTG ACAGTGGTGG CTCTCTTTGC 360TGTGTGCTGG GCACCATTCC ATGTTGTCCA TATGATGATT GAATACAGTA ATTTTGAAAA 420GGAATATGAT GATGTCACAA TCAAGATGAT TTTTGCTATC GTGCAAATTA TTGGATTTTC 480CAACTCCATC TGTAATCCCA TTGTCTATGC A511(49)SEQ ID NO48的资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO48的序列描述CTGCTTAGAA GAGTGGACCA G 21(50)SEQ ID NO49的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO49的序列描述CTGTGCACCA GAAGATCTAC AC 22(51)SEQ ID NO50的资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形
(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO50的序列描述CAAGGATGAA GGTGGTGTAG A 21(52)SEQ ID NO51的资料(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO51的序列描述GTGTAGATCT TCTGGTGCAC AGG 23(53)SEQ ID NO52的资料(i)序列特征(A)长度21个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO52的序列描述GCAATGCAGG TCATAGTGAG C 21(54)SEQ ID NO53的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iii)推定的是(iv)反义是
(xi)SEQ ID NO53的序列描述TGGAGCATGG TGACGGGAAT GCAGAAG 27(55)SEQ ID NO54的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO54的序列描述GTGATGAGCA GGTCACTGAG CGCCAAG 27(56)SEQ ID NO55的资料(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO55的序列描述GCAATGCAGG CGCTTAACAT TAC 23(57)SEQ ID NO56的资料(i)序列特征(A)长度22个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO56的序列描述TTGGGTTACA ATCTGAAGGG CA 22(58)SEQ ID NO57的资料(i)序列特征(A)长度23个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO57的序列描述ACTCCGTGTC CAGCAGGACT CTG 23(59)SEQ ID NO58的资料(i)序列特征(A)长度24个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO58的序列描述TGCGTGTTCC TGGACCCTCA CGTG 24(60)SEQ ID NO59的资料(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO59的序列描述CAGGCCTTGG ATTTTAATGT CAGGGATGG 29(61)SEQ ID NO60的资料(i)序列特征(A)长度27个碱基对
(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO60的序列描述GGAGAGTCAG CTCTGAAAGA ATTCAGG27(62)SEQ ID NO61的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO61的序列描述TGATGTGATG CCAGATACTA ATAGCAC 27(63)SEQ ID NO62的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO62的序列描述CCTGATTCAT TTAGGTGAGA TTGAGAC 27(64)SEQ ID NO63的资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO63的序列描述CCCAAGCTTC CCCAGGTGTA TTTGAT 26(6s)SEQ ID NO64的资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO64的序列描述GTTGGATCCA CATAATGCAT TTTCTC 26(66)SEQ ID NO65的资料(i)序列特征(A)长度1080个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO65的序列描述ATGATTCTCA ACTCTTCTAC TGAAGATGGT ATTAAAAGAA TCCAAGATGA TTGTCCCAAA 60GCTGGAAGGC ATAATTACAT ATTTGTCATG ATTCCTACTT TATACAGTAT CATCTTTGTG 120GTGGGAATAT TTGGAAACAG CTTGGTGGTG ATAGTCATTT ACTTTTATAT GAAGCTGAAG 180ACTGTGGCCA GTGTTTTTCT TTTGAATTTA GCACTGGCTG ACTTATGCTT TTTACTGACT 240TTGCCACTAT GGGCTGTCTA CACAGCTATG GAATACCGCT GGCCCTTTGG CAATTACCTA 300TGTAAGATTG CTTCAGCCAG CGTCAGTTTC AACCTGTACG CTAGTGTGTT TCTACTCACG 360TGTCTCAGCA TTGATCGATA CCTGGCTATT GTTCACCCAA TGAAGTCCCG CCTTCGACGC 420ACAATGCTTG TAGCCAAAGT CACCTGCATC ATCATTTGGC TGCTGGCAGG CTTGGCCAGT 480TTGCCAGCTA TAATCCATCG AAATGTATTT TTCATTGAGA ACACCAATAT TACAGTTTGT 540GCTTTCCATT ATGAGTCCCA AAATTCAACC CTTCCGATAG GGCTGGGCCT GACCAAAAAT 600ATACTGGGTT TCCTGTTTCC TTTTCTGATC ATTCTTACAA GTTATACTCT TATTTGGAAG 660GCCCTAAAGA AGGCTTATGA AATTCAGAAG AACAAACCAA GAAATGATGA TATTTTTAAG 720ATAATTATGG CAATTGTGCT TTTCTTTTTC TTTTCCTGGA TTCCCCACCA AATATTCACT 780TTTCTGGATG TATTGATTCA ACTAGGCATC ATACGTGACT GTAGAATTGC AGATATTGTG 840GACACGGCCA TGCCTATCAC CATTTGTATA GCTTATTTTA ACAATTGCCT GAATCCTCTT 900TTTTATGGCT TTCTGGGGAA AAAATTTAAA AGATATTTTC TCCAGCTTCT AAAATATATT 960CCCCCAAAAG CCAAATCCCA CTCAAACCTT TCAACAAAAA TGAGCACGCT TTCCTACCGC 1020CCCTCAGATA ATGTAAGCTC ATCCACCAAG AAGCCTGCAC CATGTTTTGA GGTTGAGTGA 1080(67)SEQ ID NO66的资料(i)序列特征(A)长度359个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO66的序列描述Met Ile Leu Asn Ser Ser Thr Glu Asp Gly Ile Lys Arg Ile Gln Asp1 5 10 15Asp Cys Pro Lys Ala Gly Arg His Asn Tyr Ile Phe Val Met Ile Pro20 25 30Thr Leu Tyr Ser Ile Ile Phe Val Val Gly Ile Phe Gly Asn Ser Leu35 40 45Val Val Ile Val Ile Tyr Phe Tyr Met Lys Leu Lys Thr Val Ala Ser50 55 60Val Phe Leu Leu Asn Leu Ala Leu Ala Asp Leu Cys Phe Leu Leu Thr65 70 75 80Leu Pro Leu Trp Ala Val Tyr Thr Ala Met Glu Tyr Arg Trp Pro Phe85 90 95Gly Asn Tyr Leu Cys Lys Ile Ala Ser Ala Ser Val Ser Phe Asn Leu100 105 110Tyr Ala Ser Val Phe Leu Leu Thr Cys Leu Ser Ile Asp Arg Tyr Leu115 120 125Ala Ile Val His Pro Met Lys Ser Arg Leu Arg Arg Thr Met Leu Val
130 135 140Ala Lys Val Thr Cys Ile Ile Ile Trp Leu Leu Ala Gly Leu Ala Ser145 150 155 160Leu Pro Ala Ile Ile His Arg Asn Val Phe Phe Ile Glu Asn Thr Asn165 170 175Ile Thr Val Cys Ala Phe His Tyr Glu Ser Gln Asn Ser Thr Leu Pro180 185 190Ile Gly Leu Gly Leu Thr Lys Asn Ile Leu Gly Phe Leu Phe Pro Phe195 200 205Leu Ile Ile Leu Thr Ser Tyr Thr Leu Ile Trp Lys Ala Leu Lys Lys210 215 220Ala Tyr Glu Ile Gln Lys Asn Lys Pro Arg Asn Asp Asp Ile Phe Lys225 230 235 240Ile Ile Met Ala Ile Val Leu Phe Phe Phe Phe Ser Trp Ile Pro His245 250 255Gln Ile Phe Thr Phe Leu Asp Val Leu Ile Gln Leu Gly Ile Ile Arg260 265 270Asp Cys Arg Ile Ala Asp Ile Val Asp Thr Ala Met Pro Ile Thr Ile275 280 285Cys Ile Ala Tyr Phe Asn Asn Cys Leu Asn Pro Leu Phe Tyr Gly Phe290 295 300Leu Gly Lys Lys Phe Lys Arg Tyr Phe Leu Gln Leu Leu Lys Tyr Ile305 310 315 320Pro Pro Lys Ala Lys Ser His Ser Asn Leu Ser Thr Lys Met Ser Thr325 330 335Leu Ser Tyr Arg Pro Ser Asp Asn Val Ser Ser Ser Thr Lys Lys Pro340 345 350Ala Pro Cys Phe Glu Val Glu355(68)SEQ ID NO67的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)
(xi)SEQ ID NO67的序列描述ACCATGGGCA GCCCCTGGAA CGGCAGC 27(69)SEQ ID NO68的资料(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组)(xi)SEQ ID NO68的序列描述AGAACCACCA CCAGCAGGAC GCGGACGGTC TGCCGGTGG 9(70)SEQ ID NO69的资料(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO69的序列描述GTCCGCGTCC TGCTGGTGGT GGTTCTGGCA TTTATAATT 39(71)SEQ ID NO70的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑学不相关(ii)分子类型DNA(基因组)(xi)SEQ ID NO70的序列描述CCTGGATCCT TATCCCATCG TCTTCACGTT AGC33(72)SEQ ID NO71的资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链
(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO71的序列描述CTGGAATTCT CCTGCCAGCA TGGTGA 26(73)SEQ ID NO72的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO72的序列描述GCAGGATCCT ATATTGCGTG CTCTGTCCCC 30(74)SEQ ID NO73的资料(i)序列特征(A)长度999个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO73的序列描述ATGGTGAACT CCACCCACCG TGGGATGCAC ACTTCTCTGC ACCTCTGGAA CCGCAGCAGT 60TACAGACTGC ACAGCAATGC CAGTGAGTCC CTTGGAAAAG GCTACTCTGA TGGAGGGTGC 120TACGAGCAAC TTTTTGTCTC TCCTGAGGTG TTTGTGACTC TGGGTGTCAT CAGCTTGTTG 180GAGAATATCT TAGTGATTGT GGCAATAGCC AAGAACAAGA ATCTGCATTC ACCCATGTAC 240TTTTTCATCT GCAGCTTGGC TGTGGCTGAT ATGCTGGTGA GCGTTTCAAA TGGATCAGAA 300ACCATTATCA TCACCCTATT AAACAGTACA GATACGGATG CACAGAGTTT CACAGTGAAT 360ATTGATAATG TCATTGACTC GGTGATCTGT AGCTCCTTGC TTGCATCCAT TTGCAGCCTG 420CTTTCAATTG CAGTGGACAG GTACTTTACT ATCTTCTATG CTCTCCAGTA CCATAACATT 480ATGACAGTTA AGCGGGTTGG GATCAGCATA AGTTGTATCT GGGCAGCTTG CACGGTTTCA 540GGCATTTTGT TCATCATTTA CTCAGATAGT AGTGCTGTCA TCATCTGCCT CATCACCATG 600TTCTTCACCA TGCTGGCTCT CATGGCTTCT CTCTATGTCC ACATGTTCCT GATGGCCAGG 660CTTCACATTA AGAGGATTGC TGTCCTCCCC GGCACTGGTG CCATCCGCCA AGGTGCCAAT 720ATGAAGGGAG CGATTACCTT GACCATCCTG ATTGGCGTCT TTGTTGTCTG CTGGGCCCCA 780TTCTTCCTCC ACTTAATATT CTACATCTCT TGTCCTCAGA ATCCATATTG TGTGTGCTTC 840ATGTCTCACT TTAACTTGTA TCTCATACTG ATCATGTGTA ATTCAATCAT CGATCCTCTG 900ATTTATGCAC TCCGGAGTCA AGAACTGAGG AAAACCTTCA AAGAGATCAT CTGTTGCTAT 960CCCCTGGGAG GCCTTTGTGA CTTGTCTAGC AGATATTAA999(75)SEQ ID NO74的资料(i)序列特征(A)长度332个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO74的序列描述Met Val Asn Ser Thr His Arg Gly Met His Thr Ser Leu His Leu Trp1 5 10 15Asn Arg Ser Ser Tyr Arg Leu His Ser Asn Ala Ser Glu Ser Leu Gly20 25 30Lys Gly Tyr Ser Asp Gly Gly Cys Tyr Glu Gln Leu Phe Val Ser Pro35 40 45Glu Val Phe Val Thr Leu Gly Val Ile Ser Leu Leu Glu Asn Ile Leu50 55 60Val Ile Val Ala Ile Ala Lys Asn Lys Asn Leu His Ser Pro Met Tyr65 70 75 80Phe Phe Ile Cys Ser Leu Ala Val Ala Asp Met Leu Val Ser Val Ser85 90 95Asn Gly Ser Glu Thr Ile Ile Ile Thr Leu Leu Asn Ser Thr Asp Thr100 105 110Asp Ala Gln Ser Phe Thr Val Asn Ile Asp Asn Val Ile Asp Ser Val
115120 125Ile Cys Ser Ser Leu Leu Ala Ser Ile Cys Ser Leu Leu Ser Ile Ala130 135 140Val Asp Arg Tyr Phe Thr Ile Phe Tyr Ala Leu Gln Tyr His Asn Ile145 150 155 160Met Thr Val Lys Arg Val Gly Ile Ser Ile Ser Cys Ile Trp Ala Ala165 170 175Cys Thr Val Ser Gly Ile Lau Phe Ile Ile Tyr Ser Asp Ser Ser Ala180 185 190Val Ile Ile Cvs Leu Ile Thr Met Phe Phe Thr Met Leu Ala Leu Met195 200 205Ala Ser Leu Tyr Val His Met Phe Leu Met Ala Arg Leu His Ile Lys210 215 220Arg Ile Ala Val Leu Pro Gly Thr Gly Ala Ile Arg Gln Gly Ala Asn225 230 235 240Met Lys Gly Ala Ile Thr Leu Thr Ile Leu Ile Gly Val Phe Val Val245 250 255Cys Trp Ala Pro Phe Phe Leu His Leu Ile Phe Tyr Ile Ser Cys Pro260 265 270Gln Asn Pro Tyr Cys Val Cys Phe Met Ser His Phe Asn Leu Tyr Leu275 280 285Ile Leu Ile Met Cys Asn Ser Ile Ile Asp Pro Leu Ile Tyr Ala Leu290 295 300Arg Ser Gln Glu Leu Arg Lys Thr Phe Lys Glu Ile Ile Cys Cys Tyr305 310 315 320Pro Leu Gly Gly Leu Cys Asp Leu Ser Ser Arg Tyr325 330(76)SEQ ID NO75的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO75的序列描述CCGAAGCTTC GAGCTGAGTA AGGCGGCGGG CT 32
(77)SEQ ID NO76的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO76的序列描述GTGGAATTCA TTTGCCCTGC CTCAACCCCC A31(78)SEQ ID NO77的资料(i)序列特征(A)长度1344个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO77的序列描述ATGGAGCTGC TAAAGCTGAA CCGGAGCGTG CAGGGAACCG GACCCGGGCC GGGGGCTTCC 60CTGTGCCGCC CGGGGGCGCC TCTCCTCAAC AGCAGCAGTG TGGGCAACCT CAGCTGCGAG 120CCCCCTCGCA TTCGCGGAGC CGGGACACGA GAATTGGAGC TGGCCATTAG AATCACTCTT 180TACGCAGTGA TCTTCCTGAT GAGCGTTGGA GGAAATATGC TCATCATCGT GGTCCTGGGA 240CTGAGCCGCC GCCTGAGGAC TGTCACCAAT GCCTTCCTCC TCTCACTGGC AGTCAGCGAC 300CTCCTGCTGG CTGTGGCTTG CATGCCCTTC ACCCTCCTGC CCAATCTCAT GGGCACATTC 360ATCTTTGGCA CCGTCATCTG CAAGGCGGTT TCCTACCTCA TGGGGGTGTC TGTGAGTGTG 420TCCACGCTAA GCCTCGTGGC CATCGCACTG GAGCGATATA GCGCCATCTG CCGACCACTG 480CAGGCACGAG TGTGGCAGAC GCGCTCCCAC GCGGCTCGCG TGATTGTAGC CACGTGGCTG 540CTGTCCGGAC TACTCATGGT GCCCTACCCC GTGTACACTG TCGTGCAACC AGTGGGGCCT 600CGTGTGCTGC AGTGCGTGCA TCGCTGGCCC AGTGCGCGGG TCCGCCAGAC CTGGTCCGTA 660CTGCTGCTTC TGCTCTTGTT CTTCATCCCA GGTGTGGTTA TGGCCGTGGC CTACGGGCTT 720ATCTCTCGCG AGCTCTACTT AGGGCTTCGC TTTGACGGCG ACAGTGACAG CGACAGCCAA 780AGCAGGGTCC GAAACCAAGG CGGGCTGCCA GGGGCTGTTC ACCAGAACGG GCGTTGCCGG 840CCTGAGACTG GCGCGGTTGG CAAAGACAGC GATGGCTGCT ACGTGCAACT TCCACGTTCC 900CGGCCTGCCC TGGAGCTGAC GGCGCTGACG GCTCCTGGGC CGGGATCCGG CTCCCGGCCC 960ACCCAGGCCA AGCTGCTGGC TAAGAAGCGC GTGGTGCGAA TGTTGCTGGT GATCGTTGTG 1020CTTTTTTTTC TGTGTTGGTT GCCAGTTTAT AGTGCCAACA CGTGGCGCGC CTTTGATGGC 1080CCGGGTGCAC ACCGAGCACT CTCGGGTGCT CCTATCTCCT TCATTCACTT GCTGAGCTAC 1140GCCTCGGCCT GTGTCAACCC CCTGGTCTAC TGCTTCATGC ACCGTCGCTT TCGCCAGGCC 1200TGCCTGGAAA CTTGCGCTCG CTGCTGCCCC CGGCCTCCAC GAGCTCGCCC CAGGGCTCTT 1260CCCGATGAGG ACCCTCCCAC TCCCTCCATT GCTTCGCTGT CCAGGCTTAG CTACACCACC 1320ATCAGCACAC TGGGCCCTGG CTGA1344(79)SEQ ID NO78的资料(i)序列特征(A)长度477个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO78的序列描述Met Glu Leu Leu Lys Leu Asn Arg Ser Val Gln Gly Thr Gly Pro Gly1 5 10 15Pro Gly Ala Ser Leu Cys Arg Pro Gly Ala Pro Leu Leu Asn Ser Ser20 25 30Ser Val Gly Asn Leu Ser Cys Glu Pro Pro Arg Ile Arg Gly Ala Gly35 40 45Thr Arg Glu Leu Glu Leu Ala Il e Arg Ile Thr Leu Tyr Ala Val Ile50 55 60Phe Leu Met Ser Val Gly Gly Asn Met Leu Ile Ile Val Val Leu Gly65 70 75 80Leu Ser Arg Arg Leu Arg Thr Val Thr Asn Ala Phe Leu Leu Ser Leu85 90 95Ala Val Ser Asp Leu Leu Leu Ala Val Ala Cys Met Pro Phe Thr Leu100 105 110Leu Pro Asn Leu Met Gly Thr Phe Ile Phe Gly Thr Val Ile Cys Lys115 120 125Ala Val Ser Tyr Leu Met Gly Val Ser Val Ser Val Ser Thr Leu Ser130 135 140Leu Val Ala Ile Ala Leu Glu Arg Tyr Ser Ala Ile Cys Arg Pro Leu145 150 155 160Gln Ala Arg Val Trp Gln Thr Arg Ser His Ala Ala Arg Val Ile Val165 170 175Ala Thr Trp Leu Leu Ser Gly Leu Leu Met Val Pro Tyr Pro Val Tyr180 185 190Thr Val Val Gln Pro Val Gly Pro Arg Val Leu Gln Cys Val His Arg195 200 205Trp Pro Ser Ala Arg Val Arg Gln Thr Trp Ser Val Leu Leu Leu Leu210 215 220Leu Leu Phe Phe Ile Pro Gly Val Val Met Ala Val Ala Tyr Gly Leu225 230 235 240Ile Ser Arg Glu Leu Tyr Leu Gly Leu Arg Phe Asp Gly Asp Ser Asp245 250 255Ser Asp Ser Gln Ser Arg Val Arg Asn Gln Gly Gly Leu Pro Gly Ala260 265 270Val His Gln Asn Gly Arg Cys Arg Pro Glu Thr Gly Ala Val Gly Lys275 280 285Asp Ser Asp Gly Cys Tyr Val Gln Leu Pro Arg Ser Arg Pro Ala Leu290 295 300Glu Leu Thr Ala Leu Thr Ala Pro Gly Pro Gly Ser Gly Ser Arg Pro305 310 315 320Thr Gln Ala Lys Leu Leu Ala Lys Lys Arg Val Val Arg Met Leu Leu325 330 335Val Ile Val Val Leu Phe Phe Leu Cys Trp Leu Pro Val Tyr Ser Ala340 345 350Asn Thr Trp Arg Ala Phe Asp Gly Pro Gly Ala His Arg Ala Leu Ser355 360 365Val Ala Pro Ile Ser Phe Ile His Leu Leu Ser Tyr Ala Ser Ala Cys370 375 380Val Asn Pro Leu Val Tyr Cys Phe Met His Arg Arg Phe Arg Gln Ala385 390 395 400Cys Leu Glu Thr Cys Ala Arg Cys Cys Pro Arg Pro Pro Arg Ala Arg405 410 415Pro Arg Ala Leu Pro Asp Glu Asp Pro Pro Thr Pro Ser Ile Ala Ser
420 425 430Leu Ser Arg Leu Ser Tyr Thr Thr Ile Ser Thr Leu Gly Pro Gly435 440 445(80)SEQ ID NO79的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO79的序列描述TGCAAGCTTA AAAAGGAAAA AATGAACAGC 30(81)SEQ ID NO80的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO80的序列描述TAAGGATCCC TTCCCTTCAA AACATCCTTG 30(82)SEQ ID NO81的资料(i)序列特征(A)长度1014个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO81的序列描述ATGAACAGCA CATGTATTGA AGAACAGCAT GACCTGGATC ACTATTTGTT TCCCATTGTT 60TACATCTTTG TGATTATAGT CAGCATTCCA GCCAATATTG GATCTCTGTG TGTGTCTTTC 120CTGCAACCCA AGAAGGAAAG TGAACTAGGA ATTTACCTCT TCAGTTTGTC ACTATCAGAT 180TTACTCTATG CATTAACTCT CCCTTTATGG ATTGATTATA CTTGGAATAA AGACAACTGG 240ACTTTCTCTC CTGCCTTGTG CAAAGGGAGT GCTTTTCTCA TGTACATGAA GTTTTACAGC 300AGCACAGCAT TCCTCACCTG CATTGCCGTT GATCGGTATT TGGCTGTTGT CTACCCTTTG 360AAGTTTTTTT TCCTAAGGAC AAGAAGAATT GCACTCATGG TCAGCCTGTC CATCTGGATA 420TTGGAAACCA TCTTCAATGC TGTCATGTTG TGGGAAGATG AAACAGTTGT TGAATATTGC 480GATGCCGAAA AGTCTAATTT TACTTTATGC TATGACAAAT ACCCTTTAGA GAAATGGCAA 540ATCAACCTCA ACTTGTTCAG GACGTGTACA GGCTATGCAA TACCTTTGGT CACCATCCTG 600ATCTGTAACC GGAAAGTCTA CCAAGCTGTG CGGCACAATA AAGCCACGGA AAACAAGGAA 660AAGAAGAGAA TCATAAAACT ACTTGTCAGC ATCACAGTTA CTTTTGTCTT ATGCTTTACT 720CCCTTTCATG TGATGTTGCT GATTCGCTGC ATTTTAGAGC ATGCTGTGAA CTTCGAAGAC 780CACAGCAATT CTGGGAAGCG AACTTACACA ATGTATAGAA TCACGGTTGC ATTAACAAGT 840TTAAATTGTG TTGCTGATCC AATTCTGTAC TGTTTTGTTA CCGAAACAGG AAGATATGAT 900ATGTGGAATA TATTAAAATT CTGCACTGGG AGGTGTAATA CATCACAAAG ACAAAGAAAA 960CGCATACTTT CTGTGTCTAC AAAAGATACT ATGGAATTAG AGGTCCTTGA GTAG 1014(83)SEQ ID NO82的资料(i)序列特征(A)长度337个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO82的序列描述Met Asn Ser Thr Cys Ile Glu Glu Gln His Asp Leu Asp His Tyr Leu1 5 10 15Phe Pro Ile Val Tyr Ile Phe Val Ile Ile Val Ser Ile Pro Ala Asn20 25 30Ile Gly Ser Leu Cys Val Ser Phe Leu Gln Pro Lys Lys Glu Ser Glu35 40 45Leu Gly Ile Tyr Leu Phe Ser Leu Ser Leu Ser Asp Leu Leu Tyr Ala50 55 60Leu Thr Leu Pro Leu Trp Ile Asp Tyr Thr Trp Asn Lys Asp Asn Trp65 70 75 80Thr Phe Ser Pro Ala Leu Cys Lys Gly Ser Ala Phe Leu Met Tyr Met
85 90 95Lys Phe Tyr Ser Ser Thr Ala Phe Leu Thr Cys Ile Ala Val Asp Arg100 105 110Tyr Leu Ala Val Val Tyr Pro Leu Lys Phe Phe Phe Leu Arg Thr Arg115 120 125Arg Ile Ala Leu Met Val Ser Leu Ser Ile Trp Ile Leu Glu Thr Ile130 135 140Phe Asn Ala Val Met Leu Trp Glu Asp Glu Thr Val Val Glu Tyr Cys145 150 155 160Asp Ala Glu Lys Ser Asn Phe Thr Leu Cys Tyr Asp Lys Tyr Pro Leu165 170 175Glu Lys Trp Gln Ile Asn Leu Asn Leu Phe Arg Thr Cys Thr Gly Tyr180 185 190Ala Ile Pro Leu Val Thr Ile Leu Ile Cys Asn Arg Lys Val Tyr Gln195 200 205Ala Val Arg His Asn Lys Ala Thr Glu Asn Lys Glu Lys Lys Arg Ile210 215 220Ile Lys Leu Leu Val Ser Ile Thr Val Thr Phe Val Leu Cys Phe Thr225 230 235 240Pro Phe His Val Met Leu Leu Ile Arg Cys Ile Leu Glu His Ala Val245 250 255Asn Phe Glu Asp His Ser Asn Ser Gly Lys Arg Thr Tyr Thr Met Tyr260 265 270Arg Ile Thr Val Ala Leu Thr Ser Leu Asn Cys Val Ala Asp Pro Ile275 280 285Leu Tyr Cys Phe Val Thr Glu Thr Gly Arg Tyr Asp Met Trp Asn Ile290 295 300Leu Lys Phe Cys Thr Gly Arg Cys Asn Thr Ser Gln Arg Gln Arg Lys305 310 315 320Arg Ile Leu Ser Val Ser Thr Lys Asp Thr Met Glu Leu Glu Val Leu325330 335Glu(84)SEQ ID NO83的资料(i)序列特征(A)长度40个碱基对(B)类型核酸
(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO83的序列描述CAGGAAGAAG AAACGAGCTG TCATTATGAT GGTGACAGTG 40(85)SEQ ID NO84的资料(i)序列特征(A)长度40个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO84的序列描述CACTGTCACC ATCATAATGA CAGCTCGTTT CTTCTTCCTG 40(86)SEQ ID NO85的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO85的序列描述GGCCACCGGC AGACCAAACG CGTCCTGCTG 30(87)SEQ ID NO86的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO86的序列描述CTCCTTCGGT CCTCCTATCG TTGTCAGAAG T31(88)SEQ ID NO87的资料(i)序列特征(A)长度37个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO87的序列描述GGAAAAGAAG AGAATCAAAA AACTACTTGT CAGCATC 37(89)SEQ ID NO88的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO88的序列描述CTCCTTCGGT CCTCCTATCG TTGTCAGAAG T31(90)SEQ ID NO89的资料(i)序列特征(A)长度1080个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO89的序列描述ATGATTCTCA ACTCTTCTAC TGAAGATGGT ATTAAAAGAA TCCAAGATGA TTGTCCCAAA 60GCTGGAAGGC ATAATTACAT ATTTGTCATG ATTCCTACTT TATACAGTAT CATCTTTGTG 120GTGGGAATAT TTGGAAACAG CTTGGTGGTG ATAGTCATTT ACTTTTATAT GAAGCTGAAG 180ACTGTGGCCA GTGTTTTTCT TTTGAATTTA GCACTGGCTG ACTTATGCTT TTTACTGACT 240TTGCCACTAT GGGCTGTCTA CACAGCTATG GAATACCGCT GGCCCTTTGG CAATTACCTA 300TGTAAGATTG CTTCAGCCAG CGTCAGTTTC AACCTGTACG CTAGTGTGTT TCTACTCACG 360TGTCTCAGCA TTGATCGATA CCTGGCTATT GTTCACCCAA TGAAGTCCCG CCTTCGACGC 420ACAATGCTTG TAGCCAAAGT CACCTGCATC ATCATTTGGC TGCTGGCAGG CTTGGCCAGT 480TTGCCAGCTA TAATCCATCG AAATGTATTT TTCATTGAGA ACACCAATAT TACAGTTTGT 540GCTTTCCATT ATGAGTCCCA AAATTCAACC CTTCCGATAG GGCTGGGCCT GACCAAAAAT 600ATACTGGGTT TCCTGTTTCC TTTTCTGATC ATTCTTACAA GTTATACTCT TATTTGGAAG 660GCCCTAAAGA AGGCTTATGA AATTCAGAAG AACAAACCAA GAAATGATGA TATTAAAAAG 720ATAATTATGG CAATTGTGCT TTTCTTTTTC TTTTCCTGGA TTCCCCACCA AATATTCACT 780TTTCTGGATG TATTGATTCA ACTAGGCATC ATACGTGACT GTAGAATTGC AGATATTGTG 840GACACGGCCA TGCCTATCAC CATTTGTATA GCTTATTTTA ACAATTGCCT GAATCCTCTT 900TTTTATGGCT TTCTGGGGAA AAAATTTAAA AGATATTTTC TCCAGCTTCT AAAATATATT 960CCCCCAAAAG CCAAATCCCA CTCAAACCTT TCAACAAAAA TGAGCACGCT TTCCTACCGC 1020CCCTCAGATA ATGTAAGCTC ATCCACCAAG AAGCCTGCAC CATGTTTTGA GGTTGAGTGA 1080(91)SEQ ID NO90的资料(i)序列特征(A)长度359个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO90的序列描述Met Ile Leu Asn Ser Ser Thr Glu Asp Gly Ile Lys Arg Ile Gln Asp1 5 10 15Asp Cys Pro Lys Ala Gly Arg His Asn Tyr Ile Phe Val Met Ile Pro20 25 30Thr Leu Tyr Ser Ile Ile Phe Val Val Gly Ile Phe Gly Asn Ser Leu35 40 45Val Val Ile Val Ile Tyr Phe Tyr Met Lys Leu Lys Thr Val Ala Ser50 55 60Val Phe Leu Leu Asn Leu Ala Leu Ala Asp Leu Cys Phe Leu Leu Thr65 70 75 80Leu Pro Leu Trp Ala Val Tyr Thr Ala Met Glu Tyr Arg Trp Pro Phe
85 90 95Gly Asn Tyr Leu Cys Lys Ile Ala Ser Ala Ser Val Ser Phe Asn Leu100 105 110Tyr Ala Ser Val Phe Leu Leu Thr Cys Leu Ser Ile Asp Arg Tyr Leu115 120 125Ala Ile Val His Pro Met Lys Ser Arg Leu Arg Arg Thr Met Leu Val130 135 140Ala Lys Val Thr Cys Ile Ile Ile Trp Leu Leu Ala Gly Leu Ala Ser145 150 155 160Leu Pro Ala Ile Ile His Arg Asn Val Phe Phe Ile Glu Asn Thr Asn165 170 175Ile Thr Val Cys Ala Phe His Tyr Glu Ser Gln Asn Ser Thr Leu Pro180 185 190Ile Gly Leu Gly Leu Thr Lys Asn Ile Leu Gly Phe Leu Phe Pro Phe195 200 205Leu Ile Ile Leu Thr Ser Tyr Thr Leu Ile Trp Lys Ala Leu Lys Lys210 215 220Ala Tyr Glu Ile Gln Lys Asn Lys Pro Arg Asn Asp Asp Ile Lys Lys225 230 235 240Ile Ile Met Ala Ile Val Leu Phe Phe Phe Phe Ser Trp Ile Pro His245 250 255Gln Ile Phe Thr Phe Leu Asp Val Leu Ile Gln Leu Gly Ile Ile Arg260 265 270Asp Cys Arg Ile Ala Asp Ile Val Asp Thr Ala Met Pro Ile Thr Ile275 280 285Cys Ile Ala Tyr Phe Asn Asn Cys Leu Asn Pro Leu Phe Tyr Gly Phe290 295 300Leu Gly Lys Lys Phe Lys Arg Tyr Phe Leu Gln Leu Leu Lys Tyr Ile305 310 315 320Pro Pro Lys Ala Lys Ser His Ser Asn Leu Ser Thr Lys Met Ser Thr325 330 335Leu Ser Tyr Arg Pro Ser Asp Asn Val Ser Ser Ser Thr Lys Lys Pro340 345 350Ala Pro Cys Phe Glu Val Glu355(92)SEQ ID No91的资料(i)序列特征(A)长度35个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO91的序列描述CCAAGAAATG ATGATATTAA AAAGATAATT ATGGC 35(93)SEQ ID NO92的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO92的序列描述CTCCTTCGGT CCTCCTATCG TTGTCAGAAG T31(94)SEQ ID NO93的资料(i)序列特征(A)长度1080个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO93的序列描述ATGATTCTCA ACTCTTCTAC TGAAGATGGT ATTAAAAGAA TCCAAGATGA TTGTCCCAAA 60GCTGGAAGGC ATAATTACAT ATTTGTCATG ATTCCTACTT TATACAGTAT CATCTTTGTG 120GTGGGAATAT TTGGAAACAG CTTGGTGGTG ATAGTCATTT ACTTTTATAT GAAGCTGAAG 180ACTGTGGCCA GTGTTTTTCT TTTGAATTTA GCACTGGCTG ACTTATGCTT TTTACTGACT 240TTGCCACTAT GGGCTGTCTA CACAGCTATG GAATACCGCT GGCCCTTTGG CAATTACCTA 300TGTAAGATTG CTTCAGCCAG CGTCAGTTTC GCCCTGTACG CTAGTGTGTT TCTACTCACG 360TGTCTCAGCA TTGATCGATA CCTGGCTATT GTTCACCCAA TGAAGTCCCG CCTTCGACGC 420ACAATGCTTG TAGCCAAAGT CACCTGCATC ATCATTTGGC TGCTGGCAGG CTTGGCCAGT 480TTGCCAGCTA TAATCCATCG AAATGTATTT TTCATTGAGA ACACCAATAT TACAGTTTGT 540GCTTTCCATT ATGAGTCCCA AAATTCAACC CTTCCGATAG GGCTGGGCCT GACCAAAAAT 600ATACTGGGTT TCCTGTTTCC TTTTCTGATC ATTCTTACAA GTTATACTCT TATTTGGAAG 660GCCCTAAAGA AGGCTTATGA AATTCAGAAG AACAAACCAA GAAATGATGA TATTTTTAAG 720ATAATTATGG CAATTGTGCT TTTCTTTTTC TTTTCCTGGA TTCCCCACCA AATATTCACT 780TTTCTGGATG TATTGATTCA ACTAGGCATC ATACGTGACT GTAGAATTGC AGATATTGTG 840GACACGGCCA TGCCTATCAC CATTTGTATA GCTTATTTTA ACAATTGCCT GAATCCTCTT 900TTTTATGGCT TTCTGGGGAA AAAATTTAAA AGATATTTTC TCCAGCTTCT AAAATATATT 960CCCCCAAAAG CCAAATCCCA CTCAAACCTT TCAACAAAAA TGAGCACGCT TTCCTACCGC 1020CCCTCAGATA ATGTAAGCTC ATCCACCAAG AAGCCTGCAC CATGTTTTGA GGTTGAGTGA 1080(95)SEQ ID NO94的资料(i)序列特征(A)长度359个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO94的序列描述Met Ile Leu Asn Ser Ser Thr Glu Asp Gly Ile Lys Arg Ile Gln Asp1 5 10 15Asp Cys Pro Lys Ala Gly Arg His Asn Tyr Ile Phe Val Met Ile Pro20 25 30Thr Leu Tyr Ser Ile Ile Phe Val Val Gly Ile Phe Gly Asn Ser Leu35 40 45Val Val Ile Val Ile Tyr Phe Tyr Met Lys Leu Lys Thr Val Ala Ser50 55 60Val Phe Leu Leu Asn Leu Ala Leu Ala Asp Leu Cys Phe Leu Leu Thr65 70 75 80Leu Pro Leu Trp Ala Val Tyr Thr Ala Met Glu Tyr Arg Trp Pro Phe85 90 95Gly Asn Tyr Leu Cys Lys Ile Ala Ser Ala Ser Val Ser Phe Ala Leu
100 105 110Tyr Ala Ser Val Phe Leu Leu Thr Cys Leu Ser Ile Asp Arg Tyr Leu115 120 125Ala Ile Val His Pro Met Lys Ser Arg Leu Arg Arg Thr Met Leu Val130 135 140Ala Lys Val Thr Cys Ile Ile Ile Trp Leu Leu Ala Gly Leu Ala Ser145 150 155 160Leu Pro Ala Ile Ile His Arg Asn Val Phe Phe Ile Glu Asn Thr Asn165 170 175Ile Thr Val Cys Ala Phe His Tyr Glu Ser Gln Asn Ser Thr Leu Pro180 185 190Ile Gly Leu Gly Leu Thr Lys Asn Ile Leu Gly Phe Leu Phe Pro Phe195 200 205Leu Ile Ile Leu Thr Ser Tyr Thr Leu Ile Trp Lys Ala Leu Lys Lys210 215 220Ala Tyr Glu Ile Gln Lys Asn Lys Pro Arg Asn Asp Asp Ile Phe Lys225 230 235 240Ile Ile Met Ala Ile Val Leu Phe Phe Phe Phe Ser Trp Ile Pro His245 250 255Gln Ile Phe Thr Phe Leu Asp Val Leu Ile Gln Leu Gly Ile Ile Arg260 265 270Asp Cys Arg Ile Ala Asp Ile Val Asp Thr Ala Met Pro Ile Thr Ile275 280 285Cys Ile Ala Tyr Phe Asn Asn Cys Leu Asn Pro Leu Phe Tyr Gly Phe290 295 300Leu Gly Lys Lys Phe Lys Arg Tyr Phe Leu Gln Leu Leu Lys Tyr Ile305 310 315 320Pro Pro Lys Ala Lys Ser His Ser Asn Leu Ser Thr Lys Met Ser Thr325 330 335Leu Ser Tyr Arg Pro Ser Asp Asn Val Ser Ser Ser Thr Lys Lys Pro340 345 350Ala Pro Cys Phe Glu Val Glu355(96)SEQ ID No95的资料(i)序列特征(A)长度26个碱基对(B)类型核酸
(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO95的序列描述CCCAAGCTTC CCCAGGTGTA TTTGAT 26(97)SEQ ID NO96的资料(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO96的序列描述CCTGCAGGCG AAACTGACTC TGGCTGAAG 29(98)SEQ ID NO97的资料(i)序列特征(A)长度42个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO97的序列描述CTGTACGCTA GTGTGTTTCT ACTCACGTGT CTCAGCATTG AT 42(99)SEQ ID NO98的资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO98的序列描述GTTGGATCCA CATAATGCAT TTTCTC26(100)SEQ ID NO99的资料(i)序列特征(A)长度1080个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO99的序列描述ATGATTCTCA ACTCTTCTAC TGAAGATGGT ATTAAAAGAA TCCAAGATGA TTGTCCCAAA 60GCTGGAAGGC ATAATTACAT ATTTGTCATG ATTCCTACTT TATACAGTAT CATCTTTGTG 120GTGGGAATAT TTGGAAACAG CTTGGTGGTG ATAGTCATTT ACTTTTATAT GAAGCTGAAG 180ACTGTGGCCA GTGTTTTTCT TTTGAATTTA GCACTGGCTG ACTTATGCTT TTTACTGACT 240TTGCCACTAT GGGCTGTCTA CACAGCTATG GAATACCGCT GGCCCTTTGG CAATTACCTA 300TGTAAGATTG CTTCAGCCAG CCTCAGTTTC AACCTGTACG CTAGTGTGTT TCTACTCACG 360TGTCTCAGCA TTGATCGATA CCTGGCTATT GTTCACCCAA TGAAGTCCCG CCTTCGACGC 420ACAATGCTTG TAGCCAAAGT CACCTGCATC ATCATTTGGC TGCTGGCAGG CTTGGCCAGT 480TTGCCAGCTA TAATCCATCG AAATGTATTT TTCATTGAGA ACACCAATAT TACAGTTTGT 540GCTTTCCATT ATGAGTCCCA AAATTCAACC CTTCCGATAG GGCTGGGCCT GACCAAAAAT 600ATACTGGGTT TCCTGTTTCC TTTTCTGATC ATTCTTACAA GTTATTTTGG AATTCGAAAA 660CACTTACTGA AGACGAATAG CTATGGGAAG AACAGGATAA CCCGTGACCA AGTTAAGAAG 720ATAATTATGG CAATTGTGCT TTTCTTTTTC TTTTCCTGGA TTCCCCACCA AATATTCACT 780TTTCTGGATG TATTGATTCA ACTAGGCATC ATACGTGACT GTAGAATTGC AGATATTGTG 840GACACGGCCA TGCCTATCAC CATTTGTATA GCTTATTTTA ACAATTGCCT GAATCCTCTT 900TTTTATGGCT TTCTGGGGAA AAAATTTAAA AGATATTTTC TCCAGCTTCT AAAATATATT 960CCCCCAAAAG CCAAATCCCA CTCAAACCTT TCAACAAAAA TGAGCACGCT TTCCTACCGC 1020CCCTCAGATA ATGTAAGCTC ATCCACCAAG AAGCCTGCAC CATGTTTTGA GGTTGAGTGA 1080(101)SEQ ID NO100的资料(i)序列特征(A)长度359个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO100的序列描述Met Ile Leu Asn Ser Ser Thr Glu Asp Gly Ile Lys Arg Ile Gln Asp1 5 10 15Asp Cys Pro Lys Ala Gly Arg His Asn Tyr Ile Phe Val Met Ile Pro20 25 30Thr Leu Tyr Ser Ile Ile Phe Val Val Gly Ile Phe Gly Asn Ser Leu35 40 45Val Val Ile Val Ile Tyr Phe Tyr Met Lys Leu Lys Thr Val Ala Ser50 55 60Val Phe Leu Leu Asn Leu Ala Leu Ala Asp Leu Cys Phe Leu Leu Thr65 70 75 80Leu Pro Leu Trp Ala Val Tyr Thr Ala Met Glu Tyr Arg Trp Pro Phe85 90 95Gly Asn Tyr Leu Cys Lys Ile Ala Ser Ala Ser Val Ser Phe Asn Leu100 105 110Tyr Ala Ser Val Phe Leu Leu Thr Cys Leu Ser Ile Asp Arg Tyr Leu115 120 125Ala Ile Val His Pro Met Lys Ser Arg Leu Arg Arg Thr Met Leu Val130 135 140Ala Lys Val Thr Cys Ile Ile Ile Trp Leu Leu Ala Gly Leu Ala Ser145 150 155 160Leu Pro Ala Ile Ile His Arg Asn Val Phe Phe Ile Glu Asn Thr Asn165 170 175Ile Thr Val Cys Ala Phe His Tyr Glu Ser Gln Asn Ser Thr Leu Pro180 185 190Ile Gly Leu Gly Leu Thr Lys Asn Ile Leu Gly Phe Leu Phe Pro Phe195 200 205Leu Ile Ile Leu Thr Ser Tyr Phe Gly Ile Arg Lys His Leu Leu Lys210 215 220
Thr Asn Ser Tyr Gly Lys Asn Arg Ile Thr Arg Asp Gln Val Lys Lys225 230 235 240Ile Ile Met Ala Ile Val Leu Phe Phe Phe Phe Ser Trp Ile Pro His245 250 255Gln Ile Phe Thr Phe Leu Asp Val Leu Ile Gln Leu Gly Ile Ile Arg260 265 270Asp Cys Arg Ile Ala Asp Ile Val Asp Thr Ala Met Pro Ile Thr Ile275 280 285Cys Ile Ala Tyr Phe Asn Asn Cys Leu Asn Pro Leu Phe Tyr Gly Phe290 295 300Leu Gly Lys Lys Phe Lys Arg Tyr Phe Leu Gln Leu Leu Lys Tyr Ile305 310 315 320Pro Pro Lys Ala Lys Ser His Ser Asn Leu Ser Thr Lys Met Ser Thr325 330 335Leu Ser Tyr Arg Pro Ser Asp Asn Val Ser Ser Ser Thr Lys Lys Pro340 345 350Ala Pro Cys Phe Glu Val Glu355(102)SEQ ID NO101的资料(i)序列特征(A)长度37个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO101的序列描述TCCGAATTCC AAAATAACTT GTAAGAATGA TCAGAAA 37(103)SEQ ID NO102的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO102的序列描述AGATCTTAAG AAGATAATTA TGGCAATTGT GCT 33(104)SEQ ID NO103的资料(i)序列特征(A)长度62个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO103的序列描述AATTCGAAAA CACTTACTGA AGACGAATAG CTATGGGAAG AACAGGATAA CCCGTGACCA 60AG62(105)SEQ ID NO104的资料(i)序列特征(A)长度62个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO104的序列描述TTAACTTGGT CACGGGTTAT CCTGTTCTTC CCATAGCTAT TCGTCTTCAG TAAGTGTTTT 60CG62(106)SEQ ID NO105的资料(i)序列特征(A)长度1083个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO105的序列描述ATGATTCTCA ACTCTTCTAC TGAAGATGGT ATTAAAAGAA TCCAAGATGA TTGTCCCAAA 60GCTGGAAGGC ATAATTACAT ATTTGTCATG ATTCCTACTT TATACAGTAT CATCTTTGTG 120GTGGGAATAT TTGGAAACAG CTTGGTGGTG ATAGTCATTT ACTTTTATAT GAAGCTGAAG 180ACTGTGGCCA GTGTTTTTCT TTTGAATTTA GCACTGGCTG ACTTATGCTT TTTACTGACT 240TTGCCACTAT GGGCTGTCTA CACAGCTATG GAATACCGCT GGCCCTTTGG CAATTACCTA 300TGTAAGATTG CTTCAGCCAG CGTCAGTTTC AACCTGTACG CTAGTGTGTT TCTACTCACG 360TGTCTCAGCA TTGATCGATA CCTGGCTATT GTTCACCCAA TGAAGTCCCG CCTTCGACGC 420ACAATGCTTG TAGCCAAAGT CACCTGCATC ATCATTTGGC TGCTGGCAGG CTTGGCCAGT 480TTGCCAGCTA TAATCCATCG AAATGTATTT TTCATTGAGA ACACCAATAT TACAGTTTGT 540GCTTTCCATT ATGAGTCCCA AAATTCAACC CTTCCGATAG GGCTGGGCCT GACCAAAAAT 600ATACTGGGTT TCCTGTTTCC TTTTCTGATC ATTCTTACAA GTTATACTCT TATTTGGAAG 660GCCCTAAAGA AGGCTTATGA AATTCAGAAG AACAAACCAA GAAATGATGA TATTTTTAAG 720ATAATTATGG CAGCAATTGT GCTTTTCTTT TTCTTTTCCT GGATTCCCCA CCAAATATTC 780ACTTTTCTGG ATGTATTGAT TCAACTAGGC ATCATACGTG ACTGTAGAAT TGCAGATATT 840GTGGACACGG CCATGCCTAT CACCATTTGT ATAGCTTATT TTAACAATTG CCTGAATCCT 900CTTTTTTATG GCTTTCTGGG GAAAAAATTT AAAAGATATT TTCTCCAGCT TCTAAAATAT 960ATTCCCCCAA AAGCCAAATC CCACTCAAAC CTTTCAACAA AAATGAGCAC GCTTTCCTAC 1020CGCCCCTCAG ATAATGTAAG CTCATCCACC AAGAAGCCTG CACCATGTTT TGAGGTTGAG 1080TGA 1083(107)SEQ ID NO106的资料(i)序列特征(A)长度360个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO106的序列描述Met Ile Leu Asn Ser Ser Thr Glu Asp Gly Ile Lys Arg Ile Gln Asp1 5 10 15Asp Cys Pro Lys Ala Gly Arg His Asn Tyr Ile Phe Val Met Ile Pro
20 25 30Thr Leu Tyr Ser Ile Ile Phe Val Val Gly Ile Phe Gly Asn Ser Leu35 40 45Val Val Ile Val Ile Tyr Phe Tyr Met Lys Leu Lys Thr Val Ala Ser50 55 60Val Phe Leu Leu Asn Leu Ala Leu Ala Asp Leu Cys Phe Leu Leu Thr65 70 75 80Leu Pro Leu Trp Ala Val Tyr Thr Ala Met Glu Tyr Arg Trp Pro Phe85 90 95Gly Asn Tyr Leu Cys Lys Ile Ala Ser Ala Ser Val Ser Phe Asn Leu100 105 110Tyr Ala Ser Val Phe Leu Leu Thr Cys Leu Ser Ile Asp Arg Tyr Leu115 120 125Ala Ile Val His Pro Met Lys Ser Arg Leu Arg Arg Thr Met Leu Val130 135 140Ala Lys Val Thr Cys Ile Ile Ile Trp Leu Leu Ala Gly Leu Ala Ser145 150 155 160Leu Pro Ala Ile Ile His Arg Asn Val Phe Phe Ile Glu Asn Thr Asn165 170 175Ile Thr Val Cys Ala Phe His Tyr Glu Ser Gln Asn Ser Thr Leu Pro180 185 190Ile Gly Leu Gly Leu Thr Lys Asn Ile Leu Gly Phe Leu Phe Pro Phe195 200 205Leu Ile Ile Leu Thr Ser Tyr Thr Leu Ile Trp Lys Ala Leu Lys Lys210 215 220Ala Tyr Glu Ile Gln Lys Asn Lys Pro Arg Asn Asp Asp Ile Phe Lys225 230 235 240Ile Ile Met Ala Ala Ile Val Leu Phe Phe Phe Phe Ser Trp Ile Pro245 250 255His Gln Ile Phe Thr Phe Leu Asp Val Leu Ile Gln Leu Gly Ile Ile260 265 270Arg Asp Cys Arg Ile Ala Asp Ile Val Asp Thr Ala Met Pro Ile Thr275 280 285Ile Cys Ile Ala Tyr Phe Asn Asn Cys Leu Asn Pro Leu Phe Tyr Gly290 295 300Phe Leu Gly Lys Lys Phe Lys Arg Tyr Phe Leu Gln Leu Leu Lys Tyr305 310 315 320
Ile Pro Pro Lys Ala Lys Ser His Ser Asn Leu Ser Thr Lys Met Ser325 330 335Thr Leu Ser Tyr Arg Pro Ser Asp Asn Val Ser Ser Ser Thr Lys Lys340 345 350Pro Ala Pro Cys Phe Glu Val Glu355 360(108)SEQ ID NO107的资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO107的序列描述CCCAAGCTTC CCCAGGTGTA TTTGAT 26(109)SEQ ID NO108的资料(i)序列特征(A)长度38个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO108的序列描述AAGCACAATT GCTGCATAAT TATCTTAAAA ATATCATC38(110)SEQ ID NO109的资料(i)序列特征(A)长度39个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO109的序列描述AAGATAATTA TGGCAGCAAT TGTGCTTTTC TTTTTCTTT39(111)SEQ ID NO110的资料(i)序列特征(A)长度26个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO110的序列描述GTTGGATCCA CATAATGCAT TTTCTC 26(112)SEQ ID NO111的资料(i)序列特征(A)长度1344个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO111的序列描述ATGGAGCTGC TAAAGCTGAA CCGGAGCGTG CAGGGAACCG GACCCGGGCC GGGGGCTTCC 60CTGTGCCGCC CGGGGGCGCC TCTCCTCAAC AGCAGCAGTG TGGGCAACCT CAGCTGCGAG 120CCCCCTCGCA TTCGCGGAGC CGGGACACGA GAATTGGAGC TGGCCATTAG AATCACTCTT 180TACGCAGTGA TCTTCCTGAT GAGCGTTGGA GGAAATATGC TCATCATCGT GGTCCTGGGA 240CTGAGCCGCC GCCTGAGGAC TGTCACCAAT GCCTTCCTCC TCTCACTGGC AGTCAGCGAC 300CTCCTGCTGG CTGTGGCTTG CATGCCCTTC ACCCTCCTGC CCAATCTCAT GGGCACATTC 360ATCTTTGGCA CCGTCATCTG CAAGGCGGTT TCCTACCTCA TGGGGGTGTC TGTGAGTGTG 420TCCACGCTAA GCCTCGTGGC CATCGCACTG GAGCGATATA GCGCCATCTG CCGACCACTG 480CAGGCACGAG TGTGGCAGAC GCGCTCCCAC GCGGCTCGCG TGATTGTAGC CACGTGGCTG 540CTGTCCGGAC TACTCATGGT GCCCTACCCC GTGTACACTG TCGTGCAACC AGTGGGGCCT 600CGTGTGCTGC AGTGCGTGCA TCGCTGGCCC AGTGCGCGGG TCCGCCAGAC CTGGTCCGTA 660CTGCTGCTTC TGCTCTTGTT CTTCATCCCA GGTGTGGTTA TGGCCGTGGC CTACGGGCTT 720ATCTCTCGCG AGCTCTACTT AGGGCTTCGC TTTGACGGCG ACAGTGACAG CGACAGCCAA 780AGCAGGGTCC GAAACCAAGG CGGGCTGCCA GGGGCTGTTC ACCAGAACGG GCGTTGCCGG 840CCTGAGACTG GCGCGGTTGG CAAAGACAGC GATGGCTGCT ACGTGCAACT TCCACGTTCC 900CGGCCTGCCC TGGAGCTGAC GGCGCTGACG GCTCCTGGGC CGGGATCCGG CTCCCGGCCC 960ACCCAGGCCA AGCTGCTGGC TAAGAAGCGC GTGAAACGAA TGTTGCTGGT GATCGTTGTG 1020CTTTTTTTTC TGTGTTGGTT GCCAGTTTAT AGTGCCAACA CGTGGCGCGC CTTTGATGGC 1080CCGGGTGCAC ACCGAGCACT CTCGGGTGCT CCTATCTCCT TCATTCACTT GCTGAGCTAC 1140GCCTCGGCCT GTGTCAACCC CCTGGTCTAC TGCTTCATGC ACCGTCGCTT TCGCCAGGCC 1200TGCCTGGAAA CTTGCGCTCG CTGCTGCCCC CGGCCTCCAC GAGCTCGCCC CAGGGCTCTT 1260CCCGATGAGG ACCCTCCCAC TCCCTCCATT GCTTCGCTGT CCAGGCTTAG CTACACCACC 1320ATCAGCACAC TGGGCCCTGG CTGA1344(113)SEQ ID NO112的资料(i)序列特征(A)长度447个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO112的序列描述Met Glu Leu Leu Lys Leu Asn Arg Ser Val Gln Gly Thr Gly Pro Gly1 5 10 15Pro Gly Ala Ser Leu Cys Arg Pro Gly Ala Pro Leu Leu Asn Ser Ser20 25 30Ser Val Gly Asn Leu Ser Cys Glu Pro Pro Arg Ile Arg Gly Ala Gly35 40 45Thr Arg Glu Leu Glu Leu Ala Ile Arg Ile Thr Leu Tyr Ala Val Ile50 55 60Phe Leu Met Ser Val Gly Gly Asn Met Leu Ile Ile Val Val Leu Gly65 70 75 80Leu Ser Arg Arg Leu Arg Thr Val Thr Asn Ala Phe Leu Leu Ser Leu85 90 95Ala Val Ser Asp Leu Leu Leu Ala Val Ala Cys Met Pro Phe Thr Leu100 105 110Leu Pro Asn Leu Met Gly Thr Phe Ile Phe Gly Thr Val Ile Cys Lys115 120 125Ala Val Ser Tyr Leu Met Gly Val Ser Val Ser Val Ser Thr Leu Ser130 135 140Leu Val Ala Ile Ala Leu Glu Arg Tyr Ser Ala Ile Cys Arg Pro Leu145 150 155 160Gln Ala Arg Val Trp Gln Thr Arg Ser His Ala Ala Arg Val Ile Val165 170 175Ala Thr Trp Leu Leu Ser Gly Leu Leu Met Val Pro Tyr Pro Val Tyr180 185 190Thr Val Val Gln Pro Val Gly Pro Arg Val Leu Gln Cys Val His Arg195 200 205Trp Pro Ser Ala Arg Val Arg Gln Thr Trp Ser Val Leu Leu Leu Leu210 215 220Leu Leu Phe Phe Ile Pro Gly Val Val Met Ala Val Ala Tyr Gly Leu225 230 235 240Ile Ser Arg Glu Leu Tyr Leu Gly Leu Arg Phe Asp Gly Asp Ser Asp245 250 255Ser Asp Ser Gln Ser Arg Val Arg Asn Gln Gly Gly Leu Pro Gly Ala260 265 270Val His Gln Asn Gly Arg Cys Arg Pro Glu Thr Gly Ala Val Gly Lys275 280 285Asp Ser Asp Gly Cys Tyr Val Gln Leu Pro Arg Ser Arg Pro Ala Leu290 295 300Glu Leu Thr Ala Leu Thr Ala Pro Gly Pro Gly Ser Gly Ser Arg Pro305 310 315 320Thr Gln Ala Lys Leu Leu Ala Lys Lys Arg Val Lys Arg Met Leu Leu325 330 335Val Ile Val Val Leu Phe Phe Leu Cys Trp Leu Pro Val Tyr Ser Ala340 345 350Asn Thr Trp Arg Ala Phe Asp Gly Pro Gly Ala His Arg Ala Leu Ser355 360 365Val Ala Pro Ile Ser Phe Ile His Leu Leu Ser Tyr Ala Ser Ala Cys370 375 380Val Asn Pro Leu Val Tyr Cys Phe Met His Arg Arg Phe Arg Gln Ala
385 390 395 400Cys Leu Glu Thr Cys Ala Arg Cys Cys Pro Arg Pro Pro Arg Ala Arg405 410 415Pro Arg Ala Leu Pro Asp Glu Asp Pro Pro Thr Pro Ser Ile Ala Ser420 425 430Leu Ser Arg Leu Ser Tyr Thr Thr Ile Ser Thr Leu Gly Pro Gly435 440 445(114)SEQ ID NO113的资料(i)序列特征(A)长度34个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO113的序列描述CAGCAGCATG CGCTTCACGC GCTTCTTAGC CCAG 34(115)SEQ ID NO114的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑学不相关(ii)分子类型DNA(基因组的)(xi)SEQ ID NO114的序列描述AGAAGCGCGT GAAGCGCATG CTGCTGGTGA TCGTT 35(116)SEQ ID NO115的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO115的序列描述ATGGAGAAAA GAATCAAAAG AATGTTCTAT ATA 33(117)SEQ ID NO116的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO116的序列描述TATATAGAAC ATTCTTTTGA TTCTTTTCTC CAT 33(118)SEQ ID NO117的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组)(iv)反义否(xi)SEQ ID NO117的序列描述CGCTCTCTGG CCTTGAAGCG CACGCTCAGC 30(119)SEQ ID NO118的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO118的序列描述GCTGAGCGTG CGCTTCAAGG CCAGAGAGCG 30(120)SEQ ID NO119的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组)(iv)反义否(xi)SEQ ID NO119的序列描述CCCAGGAAAA AGGTGAAAGT CAAAGTTTTC 30(121)SEQ ID NO120的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO120的序列描述GAAAACTTTG ACTTTCACCT TTTTCCTGGG 30(122)SEQ ID NO121的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO121的序列描述GGGGCGCGGG TGAAACGGCT GGTGAGC 27(123)SEQ ID NO122的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链
(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO122的序列描述GCTCACCAGC CGTTTCACCC GCGCCCC 27(124)SEQ ID NO123的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO123的序列描述CCCCTTGAAA AGCCTAAGAA CTTGGTCATC 30(125)SEQ ID NO124的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO124的序列描述GATGACCAAG TTCTTAGGCT TTTCAAGGGG 30(126)SEQ ID NO125的资料(i)序列特征(A)长度32个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO125的序列描述GATCTCTAGA ATGAACAGCA CATGTATTGA AG32(127)SEQ ID NO126的资料(i)序列特征(A)长度35个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO126的序列描述CTAGGGTACC CGCTCAAGGA CCTCTAATTC CATAG35(128)SEQ ID NO127的资料(i)序列特征(A)长度1296个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO127的序列描述ATGCAGGCGC TTAACATTAC CCCGGAGCAG TTCTCTCGGC TGCTGCGGGA CCACAACCTG 60ACGCGGGAGC AGTTCATCGC TCTGTACCGG CTGCGACCGC TCGTCTACAC CCCAGAGCTG 120CCGGGACGCG CCAAGCTGGC CCTCGTGCTC ACCGGCGTGC TCATCTTCGC CCTGGCGCTC 180TTTGGCAATG CTCTGGTGTT CTACGTGGTG ACCCGCAGCA AGGCCATGCG CACCGTCACC 240AACATCTTTA TCTGCTCCTT GGCGCTCAGT GACCTGCTCA TCACCTTCTT CTGCATTCCC 300GTCACCATGC TCCAGAACAT TTCCGACAAC TGGCTGGGGG GTGCTTTCAT TTGCAAGATG 360GTGCCATTTG TCCAGTCTAC CGCTGTTGTG ACAGAAATGC TCACTATGAC CTGCATTGCT 420GTGGAAAGGC ACCAGGGACT TGTGCATCCT TTTAAAATGA AGTGGCAATA CACCAACCGA 480AGGGCTTTCA CAATGCTAGG TGTGGTCTGG CTGGTGGCAG TCATCGTAGG ATCACCCATG 540TGGCACGTGC AACAACTTGA GATCAAATAT GACTTCCTAT ATGAAAAGGA ACACATCTGC 600TGCTTAGAAG AGTGGACCAG CCCTGTGCAC CAGAAGATCT ACACCACCTT CATCCTTGTC 660ATCCTCTTCC TCCTGCCTCT TATGGTGATG CTTATTCTGT ACAGTAAAAT TGGTTATGAA 720CTTTGGATAA AGAAAAGAGT TGGGGATGGT TCAGTGCTTC GAACTATTCA TGGAAAAGAA 780ATGTCCAAAA TAGCCAGGAA GAAGAAACGA GCTAAGATTA TGATGGTGAC AGTGGTGGCT 840CTCTTTGCTG TGTGCTGGGC ACCATTCCAT GTTGTCCATA TGATGATTGA ATACAGTAAT 900TTTGAAAAGG AATATGATGA TGTCACAATC AAGATGATTT TTGCTATCGT GCAAATTATT 960GGATTTTCCA ACTCCATCTG TAATCCCATT GTCTATGCAT TTATGAATGA AAACTTCAAA 1020AAAAATGTTT TGTCTGCAGT TTGTTATTGC ATAGTAAATA AAACCTTCTC TCCAGCACAA 1080AGGCATGGAA ATTCAGGAAT TACAATGATG CGGAAGAAAG CAAAGTTTTC CCTCAGAGAG 1140AATCCAGTGG AGGAAACCAA AGGAGAAGCA TTCAGTGATG GCAACATTGA AGTCAAATTG 1200TGTGAACAGA CAGAGGAGAA GAAAAAGCTC AAACGACATC TTGCTCTCTT TAGGTCTGAA 1260CTGGCTGAGA ATTCTCCTTT AGACAGTGGG CATTAA 1296(129)SEQ ID NO128的资料(i)序列特征(A)长度431个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO128的序列描述Met Gln Ala Leu Asn Ile Thr Pro Glu Gln Phe Ser Arg Leu Leu Arg1 5 10 15Asp His Asn Leu Thr Arg Glu Gln Phe Ile Ala Leu Tyr Arg Leu Arg20 25 30Pro Leu Val Tyr Thr Pro Glu Leu Pro Gly Arg Ala Lys Leu Ala Leu35 40 45Val Leu Thr Gly Val Leu Ile Phe Ala Leu Ala Leu Phe Gly Asn Ala50 55 60Leu Val Phe Tyr Val Val Thr Arg Ser Lys Ala Met Arg Thr Val Thr65 70 75 80Asn Ile Phe Ile Cys Ser Leu Ala Leu Ser Asp Leu Leu Ile Thr Phe85 90 95Phe Cys Ile Pro Val Thr Met Leu Gln Asn Ile Ser Asp Asn Trp Leu100 105 110Gly Gly Ala Phe Ile Cys Lys Met Val Pro Phe Val Gln Ser Thr Ala115 120 125Val Val Thr Glu Met Leu Thr Met Thr Cys Ile Ala Val Glu Arg His130 135 140Gln Gly Leu Val His Pro Phe Lys Met Lys Trp Gln Tyr Thr Asn Arg145 150 155160Arg Ala Phe Thr Met Leu Gly Val Val Trp Leu Val Ala Val Ile Val165 170 175Gly Ser Pro Met Trp His Val Gln Gln Leu Glu Ile Lys Tyr Asp Phe180 185 190Leu Tyr Glu Lys Glu His Ile Cys Cys Leu Glu Glu Trp Thr Ser Pro195 200 205Val His Gln Lys Ile Tyr Thr Thr Phe Ile Leu Val Ile Leu Phe Leu210 215 220Leu Pro Leu Met Val Met Leu Ile Leu Tyr Ser Lys Ile Gly Tyr Glu225 230 235 240Leu Trp Ile Lys Lys Arg Val Gly Asp Gly Ser Val Leu Arg Thr Ile245 250 255His Gly Lys Glu Met Ser Lys Ile Ala Arg Lys Lys Lys Arg Ala Lys260 265 270Ile Met Met Val Thr Val Val Ala Leu Phe Ala Val Cys Trp Ala Pro275 280 285Phe His Val Val His Met Met Ile Glu Tyr Ser Asn Phe Glu Lys Glu290 295 300Tyr Asp Asp Val Thr Ile Lys Met Ile Phe Ala Ile Val Gln Ile Ile305 310 315 320Gly Phe Ser Asn Ser Ile Cys Asn Pro Ile Val Tyr Ala Phe Met Asn325 330 335Glu Asn Phe Lys Lys Asn Val Leu Ser Ala Val Cys Tyr Cys Ile Val340 345 350Asn Lys Thr Phe Ser Pro Ala Gln Arg His Gly Asn Ser Gly Ile Thr355 360 365Met Met Arg Lys Lys Ala Lys Phe Ser Leu Arg Glu Asn Pro Val Glu
370 375 380Glu Thr Lys Gly Glu Ala Phe Ser Asp Gly Asn Ile Glu Val Lys Leu385 390 395 400Cys Glu Gln Thr Glu Glu Lys Lys Lys Leu Lys Arg His Leu Ala Leu405 410 415Phe Arg Ser Glu Leu Ala Glu Asn Ser Pro Leu Asp Ser Gly His420 425 430(130)SEQ ID NO129的资料(i)序列特征(A)长度2040个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO129的序列描述ATGGGCAGCC CCTGGAACGG CAGCGACGGC CCCGAGGGGG CGCGGGAGCC GCCGTGGCCC60GCGCTGCCGC CTTGCGACGA GCGCCGCTGC TCGCCCTTTC CCCTGGGGGC GCTGGTGCCG120GTGACCGCTG TGTGCCTGTG CCTGTTCGTC GTCGGGGTGA GCGGCAACGT GGTGACCGTG180ATGCTGATCG GGCGCTACCG GGACATGCGG ACCACCACCA ACTTGTACCT GGGCAGCATG240GCCGTGTCCG ACCTACTCAT CCTGCTCGGG CTGCCGTTCG ACCTGTACCG CCTCTGGCGC300TCGCGGCCCT GGGTGTTCGG GCCGCTGCTC TGCCGCCTGT CCCTCTACGT GGGCGAGGGC360TGCACCTACG CCACGCTGCT GCACATGACC GCGCTCAGCG TCGAGCGCTA CCTGGCCATC420TGCCGCCCGC TCCGCGCCCG CGTCTTGGTC ACCCGGCGCC GCGTCCGCGC GCTCATCGCT480GTGCTCTGGG CCGTGGCGCT GCTCTCTGCC GGTCCCTTCT TGTTCCTGGT GGGCGTCGAG540CAGGACCCCG GCATCTCCGT AGTCCCGGGC CTCAATGGCA CCGCGCGGAT CGCCTCCTCG600CCTCTCGCCT CGTCGCCGCC TCTCTGGCTC TCGCGGGCGC CACCGCCGTC CCCGCCGTCG660GGGCCCGAGA CCGCGGAGGC CGCGGCGCTG TTCAGCCGCG AATGCCGGCC GAGCCCCGCG720CAGCTGGGCG CGCTGCGTGT CATGCTGTGG GTCACCACCG CCTACTTCTT CCTGCCCTTT780CTGTGCCTCA GCATCCTCTA CGGGCTCATC GGGCGGGAGC TGTGGAGCAG CCGGCGGCCG840CTGCGAGGCC CGGCCGCCTC GGGGCGGGAG AGAGGCCACC GGCAGACCAA ACGCGTCCTG900CGTAAGTGGA GCCGCCGTGG TTCCAAAGAC GCCTGCCTGC AGTCCGCCCC GCCGGGGACC960GCGCAAACGC TGGGTCCCCT TCCCCTGCTC GCCCAGCTCT GGGCGCCGCT TCCAGCTCCC1020TTTCCTATTT CGATTCCAGC CTCCACCCGC CGGTACTTCC CATCCCCCGA GAAAACCATG1080TCCTGTCCCC CAGGAGCTCT GGGGGACCCC AGGGCGCTTT GAGGGTGGGA TCCCCGGATC1140CGATTCAGTA ACCAGCAGTG CTTTTCCAGA GCCTCTGAGA CCAGAAAGGA GAGTTGGTAA1200TTCTTAATCC AACCACCTGT TAGATGCCAC AAATGAGGAG TCCTCACAGT GCTCTTGAGA1260AGACGAGGGA GATTTCATTA AGCTAAAATT TTTTATTTAA TGTTAAGTGA TGCTGAAGGC1320TAAAGTAAAC CTTGCTCGTA TCAAAAAGTA AAGATTGTGC AGACCTGTTG TAGAATTCTT1380TTCAACAGAG AACAGAAAAC TTGTCTCCGA AGTGGGTTTG TGGAAGGAAG CCTGCCAAGG1440CGGCTTGTTC AGAGAAATTG CTCCTTCTGG TTTATGTCCA GCCTTGATAA CACATATGGG1500AGCCTACTAT GCAGTTTTAA AGCAAGTATC CATGCAGCCT GCAGCCTGGT CATTTTTTCT1560GGGGTGAGGA TCTGCCTAGG TAGAAGTTTT CTCTAATTTA TTTTGCTGTT ACTTGTTATT1620GCAGATGGTT CCTTGTCGGG GTGGGGGGTT TATTTGCTTC CCAATGCTTT TGTTAATCCC1680GGTGCTGTGT CTTATGTTGC AGTGGTGGTG GTTCTGGCAT TTATAATTTG CTGGTTGCCC1740TTCCACGTTG GCAGAATCAT TTACATAAAC ACGGAAGATT CGCGGATGAT GTACTTCTCT1800CAGTACTTTA ACATCGTCGC TCTGCAACTT TTCTATCTGA GCGCATCTAT CAACCCAATC1860CTCTACAACC TCATTTCAAA GAAGTACAGA GCGGCGGCCT TTAAACTGCT GCTCGCAAGG1920AAGTCCAGGC CGAGAGGCTT CCACAGAAGC AGGGACACTG CGGGGGAAGT TGCAGGGGAC1980ACTGGAGGAG ACACGGTGGG CTACACCGAG ACAAGCGCTA ACGTGAAGAC GATGGGATAA2040(131)SEQ ID NO130的资料(i)序列特征(A)长度412个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO130的序列描述Met Gly Ser Pro Trp Asn Gly Ser Asp Gly Pro Glu Gly Ala Arg Glu1 5 10 15Pro Pro Trp Pro Ala Leu Pro Pro Cys Asp Glu Arg Arg Cys Ser Pro20 25 30Phe Pro Leu Gly Ala Leu Val Pro Val Thr Ala Val Cys Leu Cys Leu35 40 45Phe Val Val Gly Val Ser Gly Asn Val Val Thr Val Met Leu Ile Gly50 55 60Arg Tyr Arg Asp Met Arg Thr Thr Thr Asn Leu Tyr Leu Gly Ser Met65 70 75 80Ala Val Ser Asp Leu Leu Ile Leu Leu Gly Leu Pro Phe Asp Leu Tyr85 90 95Arg Leu Trp Arg Ser Arg Pro Trp Val Phe Gly Pro Leu Leu Cys Arg100 105 110Leu Ser Leu Tyr Val Gly Glu Gly Cys Thr Tyr Ala Thr Leu Leu His115 120 125Met Thr Ala Leu Ser Val Glu Arg Tyr Leu Ala Ile Cys Arg Pro Leu130 135140
Arg Ala Arg Val Leu Val Thr Arg Arg Arg Val Arg Ala Leu Ile Ala145 150 155 160Val Leu Trp Ala Val Ala Leu Leu Ser Ala Gly Pro Phe Leu Phe Leu165 170 175Val Gly Val Glu Gln Asp Pro Gly Ile Ser Val Val Pro Gly Leu Asn180 185 190Gly Thr Ala Arg Ile Ala Ser Ser Pro Leu Ala Ser Ser Pro Pro Leu195 200 205Trp Leu Ser Arg Ala Pro Pro Pro Ser Pro Pro Ser Gly Pro Glu Thr210 215 220Ala Glu Ala Ala Ala Leu Phe Ser Arg Glu Cys Arg Pro Ser Pro Ala225 230 235 240Gln Leu Gly Ala Leu Arg Val Met Leu Trp Val Thr Thr Ala Tyr Phe245 250 255Phe Leu Pro Phe Leu Cys Leu Ser Ile Leu Tyr Gly Leu Ile Gly Arg260 265 270Glu Leu Trp Ser Ser Arg Arg Pro Leu Arg Gly Pro Ala Ala Ser Gly275 280 285Arg Glu Arg Gly His Arg Gln Thr Lys Arg Val Leu Leu Val Val Val290 295 300Leu Ala Phe Ile Ile Cys Trp Leu Pro Phe His Val Gly Arg Ile Ile305 310 315 320Tyr Ile Asn Thr Glu Asp Ser Arg Met Met Tyr Phe Ser Gln Tyr Phe325 330 335Asn Ile Val Ala Leu Gln Leu Phe Tyr Leu Ser Ala Ser Ile Asn Pro340 345 350Ile Leu Tyr Asn Leu Ile Ser Lys Lys Tyr Arg Ala Ala Ala Phe Lys355 360 365Leu Leu Leu Ala Arg Lys Ser Arg Pro Arg Gly Phe His Arg Ser Arg370 375 380Asp Thr Ala Gly Glu Val Ala Gly Asp Thr Gly Gly Asp Thr Val Gly385 390395 400Tyr Thr Glu Thr Ser Ala Asn Val Lys Thr Met Gly405 410(132)SEQ ID NO131的资料(i)序列特征(A)长度1344个碱基对
(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO131的序列描述ATGGAGCTGC TAAAGCTGAA CCGGAGCGTG CAGGGAACCG GACCCGGGCC GGGGGCTTCC60CTGTGCCGCC CGGGGGCGCC TCTCCTCAAC AGCAGCAGTG TGGGCAACCT CAGCTGCGAG120CCCCCTCGCA TTCGCGGAGC CGGGACACGA GAATTGGAGC TGGCCATTAG AATCACTCTT180TACGCAGTGA TCTTCCTGAT GAGCGTTGGA GGAAATATGC TCATCATCGT GGTCCTGGGA240CTGAGCCGCC GCCTGAGGAC TGTCACCAAT GCCTTCCTCC TCTCACTGGC AGTCAGCGAC300CTCCTGCTGG CTGTGGCTTG CATGCCCTTC ACCCTCCTGC CCAATCTCAT GGGCACATTC360ATCTTTGGCA CCGTCATCTG CAAGGCGGTT TCCTACCTCA TGGGGGTGTC TGTGAGTGTG420TCCACGCTAA GCCTCGTGGC CATCGCACTG GAGCGATATA GCGCCATCTG CCGACCACTG480CAGGCACGAG TGTGGCAGAC GCGCTCCCAC GCGGCTCGCG TGATTGTAGC CACGTGGCTG540CTGTCCGGAC TACTCATGGT GCCCTACCCC GTGTACACTG TCGTGCAACC AGTGGGGCCT600CGTGTGCTGC AGTGCGTGCA TCGCTGGCCC AGTGCGCGGG TCCGCCAGAC CTGGTCCGTA660CTGCTGCTTC TGCTCTTGTT CTTCATCCCA GGTGTGGTTA TGGCCGTGGC CTACGGGCTT720ATCTCTCGCG AGCTCTACTT AGGGCTTCGC TTTGACGGCG ACAGTGACAG CGACAGCCAA780AGCAGGGTCC GAAACCAAGG CGGGCTGCCA GGGGCTGTTC ACCAGAACGG GCGTTGCCGG840CCTGAGACTG GCGCGGTTGG CAAAGACAGC GATGGCTGCT ACGTGCAACT TCCACGTTCC900CGGCCTGCCC TGGAGCTGAC GGCGCTGACG GCTCCTGGGC CGGGATCCGG CTCCCGGCCC960ACCCAGGCCA AGCTGCTGGC TAAGAAGCGC GTGAAACGAA TGTTGCTGGT GATCGTTGTG1020CTTTTTTTTC TGTGTTGGTT GCCAGTTTAT AGTGCCAACA CGTGGCGCGC CTTTGATGGC1080CCGGGTGCAC ACCGAGCACT CTCGGGTGCT CCTATCTCCT TCATTCACTT GCTGAGCTAC1140GCCTCGGCCT GTGTCAACCC CCTGGTCTAC TGCTTCATGC ACCGTCGCTT TCGCCAGGCC1200TGCCTGGAAA CTTGCGCTCG CTGCTGCCCC CGGCCTCCAC GAGCTCGCCC CAGGGCTCTT1260CCCGATGAGG ACCCTCCCAC TCCCTCCATT GCTTCGCTGT CCAGGCTTAG CTACACCACC1320ATCAGCACAC TGGGCCCTGG CTGA1344(133)SEQ ID NO132的资料(i)序列特征(A)长度447个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO132的序列描述Met Glu Leu Leu Lys Leu Asn Arg Ser Val Gln Gly Thr Gly Pro Gly1 5 10 15Pro Gly Ala Ser Leu Cys Arg Pro Gly Ala Pro Leu Leu Asn Ser Ser20 25 30Ser Val Gly Asn Leu Ser Cys Glu Pro Pro Arg Ile Arg Gly Ala Gly35 40 45Thr Arg Glu Leu Glu Leu Ala Ile Arg Ile Thr Leu Tyr Ala Val Ile50 55 60Phe Leu Met Ser Val Gly Gly Asn Met Leu Ile Ile Val Val Leu Gly65 70 75 80Leu Ser Arg Arg Leu Arg Thr Val Thr Asn Ala Phe Leu Leu Ser Leu85 90 95Ala Val Ser Asp Leu Leu Leu Ala Val Ala Cys Met Pro Phe Thr Leu
100 105 110Leu Pro Asn Leu Met Gly Thr Phe Ile Phe Gly Thr Val Ile Cys Lys115 120 125Ala Val Ser Tyr Leu Met Gly Val Ser Val Ser Val Ser Thr Leu Ser130 135 140Leu Val Ala Ile Ala Leu Glu Arg Tyr Ser Ala Ile Cys Arg Pro Leu145 150 155 160Gln Ala Arg Val Trp Gln Thr Arg Ser His Ala Ala Arg Val Ile Val165 170 175Ala Thr Trp Leu Leu Ser Gly Leu Leu Met Val Pro Tyr Pro Val Tyr180 185 190Thr Val Val Gln Pro Val Gly Pro Arg Val Leu Gln Cys Val His Arg195 200 205Trp Pro Ser Ala Arg Val Arg Gln Thr Trp Ser Val Leu Leu Leu Leu210 215 220Leu Leu Phe Phe Ile Pro Gly Val Val Met Ala Val Ala Tyr Gly Leu225 230 235 240Ile Ser Arg Glu Leu Tyr Leu Gly Leu Arg Phe Asp Gly Asp Ser Asp245 250 255Ser Asp Ser Gln Ser Arg Val Arg Asn Gln Gly Gly Leu Pro Gly Ala260 265 270Val His Gln Asn Gly Arg Cys Arg Pro Glu Thr Gly Ala Val Gly Lys275 280 285Asp Ser Asp Gly Cys Tyr Val Gln Leu Pro Arg Ser Arg Pro Ala Leu290 295 300Glu Leu Thr Ala Leu Thr Ala Pro Gly Pro Gly Ser Gly Ser Arg Pro305 310 315 320Thr Gln Ala Lys Leu Leu Ala Lys Lys Arg Val Lys Arg Met Leu Leu325 330 335Val Ile Val Val Leu Phe Phe Leu Cys Trp Leu Pro Val Tyr Ser Ala340 345 350Asn Thr Trp Arg Ala Phe Asp Gly Pro Gly Ala His Arg Ala Leu Ser355 360 365Val Ala Pro Ile Ser Phe Ile His Leu Leu Ser Tyr Ala Ser Ala Cys370 375 380Val Asn Pro Leu Val Tyr Cys Phe Met His Arg Arg Phe Arg Gln Ala385 390 395 400
Cys Leu Glu Thr Cys Ala Arg Cys Cys Pro Arg Pro Pro Arg Ala Arg405 410 415Pro Arg Ala Leu Pro Asp Glu Asp Pro Pro Thr Pro Ser Ile Ala Ser420 425 430Leu Ser Arg Leu Ser Tyr Thr Thr Ile Ser Thr Leu Gly Pro Gly435 440 445(134)SEQ ID NO133的资料(i)序列特征(A)长度1014个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO133的序列描述ATGAACAGCA CATGTATTGA AGAACAGCAT GACCTGGATC ACTATTTGTT TCCCATTGTT 60TACATCTTTG TGATTATAGT CAGCATTCCA GCCAATATTG GATCTCTGTG TGTGTCTTTC 120CTGCAAGCAA AGAAGGAAAG TGAACTAGGA ATTTACCTCT TCAGTTTGTC ACTATCAGAT 180TTACTCTATG CATTAACTCT CCCTTTATGG ATTGATTATA CTTGGAATAA AGACAACTGG 240ACTTTCTCTC CTGCCTTGTG CAAAGGGAGT GCTTTTCTCA TGTACATGAA TTTTTACAGC 300AGCACAGCAT TCCTCACCTG CATTGCCGTT GATCGGTATT TGGCTGTTGT CTACCCTTTG 360AAGTTTTTTT TCCTAAGGAC AAGAAGATTT GCACTCATGG TCAGCCTGTC CATCTGGATA 420TTGGAAACCA TCTTCAATGC TGTCATGTTG TGGGAAGATG AAACAGTTGT TGAATATTGC 480GATGCCGAAA AGTCTAATTT TACTTTATGC TATGACAAAT ACCCTTTAGA GAAATGGCAA 540ATCAACCTCA ACTTGTTCAG GACGTGTACA GGCTATGCAA TACCTTTGGT CACCATCCTG 600ATCTGTAACC GGAAAGTCTA CCAAGCTGTG CGGCACAATA AAGCCACGGA AAACAAGGAA 660AAGAAGAGAA TCAAAAAACT ACTTGTCAGC ATCACAGTTA CTTTTGTCTT ATGCTTTACT 720CCCTTTCATG TGATGTTGCT GATTCGCTGC ATTTTAGAGC ATGCTGTGAA CTTCGAAGAC 780CACAGCAATT CTGGGAAGCG AACTTACACA ATGTATAGAA TCACGGTTGC ATTAACAAGT 840TTAAATTGTG TTGCTGATCC AATTCTGTAC TGTTTTGTTA CCGAAACAGG AAGATATGAT 900ATGTGGAATA TATTAAAATT CTGCACTGGG AGGTGTAATA CATCACAAAG ACAAAGAAAA 960CGCATACTTT CTGTGTCTAC AAAAGATACT ATGGAATTAG AGGTCCTTGA GTAG 1014(135)SEQ ID NO134的资料(i)序列特征(A)长度337个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO134的序列描述Met Asn Ser Thr Cys Ile Glu Glu Gln His Asp Leu Asp His Tyr Leu1 5 10 15Phe Pro Ile Val Tyr Ile Phe Val Ile Ile Val Ser Ile Pro Ala Asn20 25 30Ile Gly Ser Leu Cys Val Ser Phe Leu Gln Ala Lys Lys Glu Ser Glu35 40 45Leu Gly Ile Tyr Leu Phe Ser Leu Ser Leu Ser Asp Leu Leu Tyr Ala50 55 60Leu Thr Leu Pro Leu Trp Ile Asp Tyr Thr Trp Asn Lys Asp Asn Trp65 70 75 80Thr Phe Ser Pro Ala Leu Cys Lys Gly Ser Ala Phe Leu Met Tyr Met85 90 95Asn Phe Tyr Ser Ser Thr Ala Phe Leu Thr Cys Ile Ala Val Asp Arg100 105 110Tyr Leu Ala Val Val Tyr Pro Leu Lys Phe Phe Phe Leu Arg Thr Arg115 120 125Arg Phe Ala Leu Met Val Ser Leu Ser Ile Trp Ile Leu Glu Thr Ile130 135 140Phe Asn Ala Val Met Leu Trp Glu Asp Glu Thr Val Val Glu Tyr Cys145 150 155 160Asp Ala Glu Lys Ser Asn Phe Thr Leu Cys Tyr Asp Lys Tyr Pro Leu165 170 175Glu Lys Trp Gln Ile Asn Leu Asn Leu Phe Arg Thr Cys Thr Gly Tyr180 185190Ala Ile Pro Leu Val Thr Ile Leu Ile Cys Asn Arg Lys Val Tyr Gln195 200 205Ala Val Arg His Asn Lys Ala Thr Glu Asn Lys Glu Lys Lys Arg Ile210 215 220
Lys Lys Leu Leu Val Ser Ile Thr Val Thr Phe Val Leu Cys Phe Thr225 230 235 240Pro Phe His Val Met Leu Leu Ile Arg Cys Ile Leu Glu His Ala Val245 250 255Asn Phe Glu Asp His Ser Asn Ser Gly Lys Arg Thr Tyr Thr Met Tyr260 265 270Arg Ile Thr Val Ala Leu Thr Ser Leu Asn Cys Val Ala Asp Pro Ile275 280 285Leu Tyr Cys Phe Val Thr Glu Thr Gly Arg Tyr Asp Met Trp Asn Ile290 295 300Leu Lys Phe Cys Thr Gly Arg Cys Asn Thr Ser Gln Arg Gln Arg Lys305 310 315 320Arg Ile Leu Ser Val Ser Thr Lys Asp Thr Met Glu Leu Glu Val Leu325 330 335Glu(136)SEQ ID NO135的资料(i)序列特征(A)长度999个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO135的序列描述ATGGTGAACT CCACCCACCG TGGGATGCAC ACTTCTCTGC ACCTCTGGAA CCGCAGCAGT60TACAGACTGC ACAGCAATGC CAGTGAGTCC CTTGGAAAAG GCTACTCTGA TGGAGGGTGC120TACGAGCAAC TTTTTGTCTC TCCTGAGGTG TTTGTGACTC TGGGTGTCAT CAGCTTGTTG180GAGAATATCT TAGTGATTGT GGCAATAGCC AAGAACAAGA ATCTGCATTC ACCCATGTAC240TTTTTCATCT GCAGCTTGGC TGTGGCTGAT ATGCTGGTGA GCGTTTCAAA TGGATCAGAA300ACCATTATCA TCACCCTATT AAACAGTACA GATACGGATG CACAGAGTTT CACAGTGAAT360ATTGATAATG TCATTGACTC GGTGATCTGT AGCTCCTTGC TTGCATCCAT TTGCAGCCTG420CTTTCAATTG CAGTGGACAG GTACTTTACT ATCTTCTATG CTCTCCAGTA CCATAACATT480ATGACAGTTA AGCGGGTTGG GATCAGCATA AGTTGTATCT GGGCAGCTTG CACGGTTTCA540GGCATTTTGT TCATCATTTA CTCAGATAGT AGTGCTGTCA TCATCTGCCT CATCACCATG600TTCTTCACCA TGCTGGCTCT CATGGCTTCT CTCTATGTCC ACATGTTCCT GATGGCCAGG660CTTCACATTA AGAGGATTGC TGTCCTCCCC GGCACTGGTG CCATCCGCCA AGGTGCCAAT720ATGAAGGGAA AAATTACCTT GACCATCCTG ATTGGCGTCT TTGTTGTCTG CTGGGCCCCA780TTCTTCCTCC ACTTAATATT CTACATCTCT TGTCCTCAGA ATCCATATTG TGTGTGCTTC840ATGTCTCACT TTAACTTGTA TCTCATACTG ATCATGTGTA ATTCAATCAT CGATCCTCTG900ATTTATGCAC TCCGGAGTCA AGAACTGAGG AAAACCTTCA AAGAGATCAT CTGTTGCTAT960CCCCTGGGAG GCCTTTGTGA CTTGTCTAGC AGATATTAA999(137)SEQ ID NO136的资料(i)序列特征(A)长度332个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO136的序列描述Met Val Asn Ser Thr His Arg Gly Met His Thr Ser Leu His Leu Trp1 5 10 15Asn Arg Ser Ser Tyr Arg Leu His Ser Asn Ala Ser Glu Ser Leu Gly20 25 30Lys Gly Tyr Ser Asp Gly Gly Cys Tyr Glu Gln Leu Phe Val Ser Pro35 40 45
Glu Val Phe Val Thr Leu Gly Val Ile Ser Leu Leu Glu Asn Ile Leu50 55 60Val Ile Val Ala Ile Ala Lys Asn Lys Asn Leu His Ser Pro Met Tyr65 70 75 80Phe Phe Ile Cys Ser Leu Ala Val Ala Asp Met Leu Val Ser Val Ser85 90 95Asn Gly Ser Glu Thr Ile Ile Ile Thr Leu Leu Asn Ser Thr Asp Thr100 105 110Asp Ala Gln Ser Phe Thr Val Asn Ile Asp Asn Val Ile Asp Ser Val115 120 125Ile Cys Ser Ser Leu Leu Ala Ser Ile Cys Ser Leu Leu Ser Ile Ala130 135 140Val Asp Arg Tyr Phe Thr Ile Phe Tyr Ala Leu Gln Tyr His Asn Ile145 150 155 160Met Thr Val Lys Arg Val Gly Ile Ser Ile Ser Cys Ile Trp Ala Ala165 170 175Cys Thr Val Ser Gly Ile Leu Phe Ile Ile Tyr Ser Asp Ser Ser Ala180 185 190Val Ile Ile Cys Leu Ile Thr Met Phe Phe Thr Met Leu Ala Leu Met195 200 205Ala Ser Leu Tyr Val His Met Phe Leu Met Ala Arg Leu His Ile Lys210 215 220Arg Ile Ala Val Leu Pro Gly Thr Gly Ala Ile Arg Gln Gly Ala Asn225 230 235 240Met Lys Gly Lys Ile Thr Leu Thr Ile Leu Ile Gly Val Phe Val Val245 250 255Cys Trp Ala Pro Phe Phe Leu His Leu Ile Phe Tyr Ile Ser Cys Pro260 265 270Gln Asn Pro Tyr Cys Val Cys Phe Met Ser His Phe Asn Leu Tyr Leu275 280 285Ile Leu Ile Met Cys Asn Ser Ile Ile Asp Pro Leu Ile Tyr Ala Leu290 295 300Arg Ser Gln Glu Leu Arg Lys Thr Phe Lys Glu Ile Ile Cys Cys Tyr305 310 315 320Pro Leu Gly Gly Leu Cys Asp Leu Ser Ser Arg Tyr325 330(138)SEQ ID NO137的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO137的序列描述GCCAATATGA AGGGAAAAAT TACCTTGACC ATC33(139)SEQ ID NO138的资料(i)序列特征(A)长度31个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO138的序列描述CTCCTTCGGT CCTCCTATCG TTGTCAGAAG T31(140)SEQ ID NO139的资料(i)序列特征(A)长度1842个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO139的序列描述ATGGGGCCCA CCCTAGCGGT TCCCACCCCC TATGGCTGTA TTGGCTGTAA GCTACCCCAG 60CCAGAATACC CACCGGCTCT AATCATCTTT ATGTTCTGCG CGATGGTTAT CACCATCGTT 120GTAGACCTAA TCGGCAACTC CATGGTCATT TTGGCTGTGA CGAAGAACAA GAAGCTCCGG 180AATTCTGGCA ACATCTTCGT GGTCAGTCTC TCTGTGGCCG ATATGCTGGT GGCCATCTAC 240CCATACCCTT TGATGCTGCA TGCCATGTCC ATTGGGGGCT GGGATCTGAG CCAGTTACAG 300TGCCAGATGG TCGGGTTCAT CACAGGGCTG AGTGTGGTCG GCTCCATCTT CAACATCGTG 360GCAATCGCTA TCAACCGTTA CTGCTACATC TGCCACAGCC TCCAGTACGA ACGGATCTTC 420AGTGTGCGCA ATACCTGCAT CTACCTGGTC ATCACCTGGA TCATGACCGT CCTGGCTGTC 480CTGCCCAACA TGTACATTGG CACCATCGAG TACGATCCTC GCACCTACAC CTGCATCTTC 540AACTATCTGA ACAACCCTGT CTTCACTGTT ACCATCGTCT GCATCCACTT CGTCCTCCCT 600CTCCTCATCG TGGGTTTCTG CTACGTGAGG ATCTGGACCA AAGTGCTGGC GGCCCGTGAC 660CCTGCAGGGC AGAATCCTGA CAACCAACTT GCTGAGGTTC GCAATTTTCT AACCATGTTT 720GTGATCTTCC TCCTCTTTGC AGTGTGCTGG TGCCCTATCA ACGTGCTCAC TGTCTTGGTG 780GCTGTCAGTC CGAAGGAGAT GGCAGGCAAG ATCCCCAACT GGCTTTATCT TGCAGCCTAC 840TTCATAGCCT ACTTCAACAG CTGCCTCAAC GCTGTGATCT ACGGGCTCCT CAATGAGAAT 900TTCCGAAGAG AATACTGGAC CATCTTCCAT GCTATGCGGC ACCCTATCAT ATTCTTCCCT 960GGCCTCATCA GTGATATTCG TGAGATGCAG GAGGCCCGTA CCCTGGCCCG CGCCCGTGCC 1020CATGCTCGCG ACCAAGCTCG TGAACAAGAC CGTGCCCATG CCTGTCCTGC TGTGGAGGAA 1080ACCCCGATGA ATGTCCGGAA TGTTCCATTA CCTGGTGATG CTGCAGCTGG CCACCCCGAC 1140CGTGCCTCTG GCCACCCTAA GCCCCATTCC AGATCCTCCT CTGCCTATCG CAAATCTGCC 1200TCTACCCACC ACAAGTCTGT CTTTAGCCAC TCCAAGGCTG CCTCTGGTCA CCTCAAGCCT 1260GTCTCTGGCC ACTCCAAGCC TGCCTCTGGT CACCCCAAGT CTGCCACTGT CTACCCTAAG 1320CCTGCCTCTG TCCATTTCAA GGGTGACTCT GTCCATTTCA AGGGTGACTC TGTCCATTTC 1380AAGCCTGACT CTGTTCATTT CAAGCCTGCT TCCAGCAACC CCAAGCCCAT CACTGGCCAC 1440CATGTCTCTG CTGGCAGCCA CTCCAAGTCT GCCTTCAGTG CTGCCACCAG CCACCCTAAA 1500CCCATCAAGC CAGCTACCAG CCATGCTGAG CCCACCACTG CTGACTATCC CAAGCCTGCC 1560ACTACCAGCC ACCCTAAGCC CGCTGCTGCT GACAACCCTG AGCTCTCTGC CTCCCATTGC 1620CCCGAGATCC CTGCCATTGC CCACCCTGTG TCTGACGACA GTGACCTCCC TGAGTCGGCC 1680TCTAGCCCTG CCGCTGGGCC CACCAAGCCT GCTGCCAGCC AGCTGGAGTC TGACACCATC 1740GCTGACCTTC CTGACCCTAC TGTAGTCACT ACCAGTACCA ATGATTACCA TGATGTCGTG 1800GTTGTTGATG TTGAAGATGA TCCTGATGAA ATGGCTGTGT GA1842(141)SEQ ID NO140的资料(i)序列特征(A)长度613个氨基酸(B)类型氨基酸
(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID No140的序列描述Met Gly Pro Thr Leu Ala Val Pro Thr Pro Tyr Gly Cys Ile Gly Cy s1 5 10 15Lys Leu Pro Gln Pro Glu Tyr Pro Pro Ala Leu Ile Ile Phe Met Phe20 25 30Cys Ala Met Val Ile Thr Ile Val Val Asp Leu Ile Gly Asn Ser Met35 40 45Val Ile Leu Ala Val Thr Lys Asn Lys Lys Leu Arg Asn Ser Gly Asn50 55 60Ile Phe Val Val Ser Leu Ser Val Ala Asp Met Leu Val Ala Ile Tyr65 70 75 80Pro Tyr Pro Leu Met Leu His Ala Met Ser Ile Gly Gly Trp Asp Leu85 90 95Ser Gln Leu Gln Cys Gln Met Val Gly Phe Ile Thr Gly Leu Ser Val100 105 110Val Gly Ser Ile Phe Asn Ile Val Ala Ile Ala Ile Asn Arg Tyr Cys115 120 125Tyr Ile Cys His Ser Leu Gln Tyr Glu Arg Ile Phe Ser Val Arg Asn130 135 140Thr Cys Ile Tyr Leu Val Ile Thr Trp Ile Met Thr Val Leu Ala Val145 150 155 160Leu Pro Asn Met Tyr Ile Gly Thr Ile Glu Tyr Asp Pro Arg Thr Tyr165 170 175Thr Cys Ile Phe Asn Tyr Leu Asn Asn Pro Val Phe Thr Val Thr Ile180 185 190Val Cys Ile His Phe Val Leu Pro Leu Leu Ile Val Gly Phe Cys Tyr195 200 205Val Arg Ile Trp Thr Lys Val Leu Ala Ala Arg Asp Pro Ala Gly Gln210 215 220Asn Pro Asp Asn Gln Leu Ala Glu Val Arg Asn Phe Leu Thr Met Phe225 230 235 240Val Ile Phe Leu Leu Phe Ala Val Cys Trp Cys Pro Ile Asn Val Leu245 250 255Thr Val Leu Val Ala Val Ser Pro Lys Glu Met Ala Gly Lys Ile Pro260 265 270Asn Trp Leu Tyr Leu Ala Ala Tyr Phe Ile Ala Tyr Phe Asn Ser Cys275 280285Leu Asn Ala Val Ile Tyr Gly Leu Leu Asn Glu Asn Phe Arg Arg Glu290 295 300Tyr Trp Thr Ile Phe His Ala Met Arg His Pro Ile Ile Phe Phe Pro305 310 315 320Gly Leu Ile Ser Asp Ile Arg Glu Met Gln Glu Ala Arg Thr Leu Ala325 330 335Arg Ala Arg Ala His Ala Arg Asp Gln Ala Arg Glu Gln Asp Arg Ala340 345 350His Ala Cys Pro Ala Val Glu Glu Thr Pro Met Asn Val Arg Asn Val355 360 365Pro Leu Pro Gly Asp Ala Ala Ala Gly His Pro Asp Arg Ala Ser Gly370 375 380His Pro Lys Pro His Ser Arg Ser Ser Ser Ala Tyr Arg Lys Ser Ala385 390 395 400Ser Thr His His Lys Ser Val Phe Ser His Ser Lys Ala Ala Ser Gly405 410 415His Leu Lys Pro Val Ser Gly His Ser Lys Pro Ala Ser Gly His Pro420 425 430Lys Ser Ala Thr Val Tyr Pro Lys Pro Ala Ser Val His Phe Lys Gly435 440 445Asp Ser Val His Phe Lys Gly Asp Ser Val His Phe Lys Pro Asp Ser450 455 460Val His Phe Lys Pro Ala Ser Ser Asn Pro Lys Pro Ile Thr Gly His465 470 475 480His Val Ser Ala Gly Ser His Ser Lys Ser Ala Phe Ser Ala Ala Thr485 490 495Ser His Pro Lys Pro Ile Lys Pro Ala Thr Ser His Ala Glu Pro Thr500 505 510Thr Ala Asp Tyr Pro Lys Pro Ala Thr Thr Ser His Pro Lys Pro Ala515 520 525Ala Ala Asp Asn Pro Glu Leu Ser Ala Ser His Cys Pro Glu Ile Pro530 535 540Ala Ile Ala His Pro Val Ser Asp Asp Ser Asp Leu Pro Glu Ser Ala
545 550 555 560Ser Ser Pro Ala Ala Gly Pro Thr Lys Pro Ala Ala Ser Gln Leu Glu565 570 575Ser Asp Thr Ile Ala Asp Leu Pro Asp Pro Thr Val Val Thr Thr Ser580 585 590Thr Asn Asp Tyr His Asp Val Val Val Val Asp Val Glu Asp Asp Pro595 600 605Asp Glu Met Ala Val610(142)SEQ ID NO141的资料(i)序列特征(A)长度1842个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO141的序列描述ATGGGGCCCA CCCTAGCGGT TCCCACCCCC TATGGCTGTA TTGGCTGTAA GCTACCCCAG 60CCAGAATACC CACCGGCTCT AATCATCTTT ATGTTCTGCG CGATGGTTAT CACCATCGTT 120GTAGACCTAA TCGGCAACTC CATGGTCATT TTGGCTGTGA CGAAGAACAA GAAGCTCCGG 180AATTCTGGCA ACATCTTCGT GGTCAGTCTC TCTGTGGCCG ATATGCTGGT GGCCATCTAC 240CCATACCCTT TGATGCTGCA TGCCATGTCC ATTGGGGGCT GGGATCTGAG CCAGTTACAG 300TGCCAGATGG TCGGGTTCAT CACAGGGCTG AGTGTGGTCG GCTCCATCTT CAACATCGTG 360GCAATCGCTA TCAACCGTTA CTGCTACATC TGCCACAGCC TCCAGTACGA ACGGATCTTC 420AGTGTGCGCA ATACCTGCAT CTACCTGGTC ATCACCTGGA TCATGACCGT CCTGGCTGTC 480CTGCCCAACA TGTACATTGG CACCATCGAG TACGATCCTC GCACCTACAC CTGCATCTTC 540AACTATCTGA ACAACCCTGT CTTCACTGTT ACCATCGTCT GCATCCACTT CGTCCTCCCT 600CTCCTCATCG TGGGTTTCTG CTACGTGAGG ATCTGGACCA AAGTGCTGGC GGCCCGTGAC 660CCTGCAGGGC AGAATCCTGA CAACCAACTT GCTGAGGTTC GCAATAAACT AACCATGTTT 720GTGATCTTCC TCCTCTTTGC AGTGTGCTGG TGCCCTATCA ACGTGCTCAC TGTCTTGGTG 780GCTGTCAGTC CGAAGGAGAT GGCAGGCAAG ATCCCCAACT GGCTTTATCT TGCAGCCTAC 840TTCATAGCCT ACTTCAACAG CTGCCTCAAC GCTGTGATCT ACGGGCTCCT CAATGAGAAT 900TTCCGAAGAG AATACTGGAC CATCTTCCAT GCTATGCGGC ACCCTATCAT ATTCTTCTCT 960GGCCTCATCA GTGATATTCG TGAGATGCAG GAGGCCCGTA CCCTGGCCCG CGCCCGTGCC 1020CATGCTCGCG ACCAAGCTCG TGAACAAGAC CGTGCCCATG CCTGTCCTGC TGTGGAGGAA 1080ACCCCGATGA ATGTCCGGAA TGTTCCATTA CCTGGTGATG CTGCAGCTGG CCACCCCGAC 1140CGTGCCTCTG GCCACCCTAA GCCCCATTCC AGATCCTCCT CTGCCTATCG CAAATCTGCC 1200TCTACCCACC ACAAGTCTGT CTTTAGCCAC TCCAAGGCTG CCTCTGGTCA CCTCAAGCCT 1260GTCTCTGGCC ACTCCAAGCC TGCCTCTGGT CACCCCAAGT CTGCCACTGT CTACCCTAAG 1320CCTGCCTCTG TCCATTTCAA GGCTGACTCT GTCCATTTCA AGGGTGACTC TGTCCATTTC 1380AAGCCTGACT CTGTTCATTT CAAGCCTGCT TCCAGCAACC CCAAGCCCAT CACTGGCCAC 1440CATGTCTCTG CTGGCAGCCA CTCCAAGTCT GCCTTCAATG CTGCCACCAG CCACCCTAAA 1500CCCATCAAGC CAGCTACCAG CCATGCTGAG CCCACCACTG CTGACTATCC CAAGCCTGCC 1560ACTACCAGCC ACCCTAAGCC CGCTGCTGCT GACAACCCTG AGCTCTCTGC CTCCCATTGC 1620CCCGAGATCC CTGCCATTGC CCACCCTGTG TCTGACGACA GTGACCTCCC TGAGTCGGCC 1680TCTAGCCCTG CCGCTGGGCC CACCAAGCCT GCTGCCAGCC AGCTGGAGTC TGACACCATC 1740GCTGACCTTC CTGACCCTAC TGTAGTCACT ACCAGTACCA ATGATTACCA TGATGTCGTG 1800GTTGTTGATG TTGAAGATGA TCCTGATGAA ATGGCTGTGT GA1842(143)SEQ ID NO142的资料(i)序列特征(A)长度613个氨基酸(B)类型氨基酸(C)链型(D)拓扑学不相关(ii)分子类型蛋白质(xi)SEQ ID NO142的序列描述Met Gly Pro Thr Leu Ala Val Pro Thr Pro Tyr Gly Cys Ile Gly Cys1 5 10 15Lys Leu Pro Gln Pro Glu Tyr Pro Pro Ala Leu Ile Ile Phe Met Phe20 25 30Cys Ala Met Val Ile Thr Ile Val Val Asp Leu Ile Gly Asn Ser Met35 40 45Val Ile Leu Ala Val Thr Lys Asn Lys Lys Leu Arg Asn Ser Gly Asn50 55 60Ile Phe Val Val Ser Leu Ser Val Ala Asp Met Leu Val Ala Ile Tyr65 70 75 80Pro Tyr Pro Leu Met Leu His Ala Met Ser Ile Gly Gly Trp Asp Leu85 90 95Ser Gln Leu Gln Cys Gln Met Val Gly Phe Ile Thr Gly Leu Ser Val100 105 110Val Gly Ser Ile Phe Asn Ile Val Ala Ile Ala Ile Asn Arg Tyr Cys115 120 125Tyr Ile Cys His Ser Leu Gln Tyr Glu Arg Ile Phe Ser Val Arg Asn130 135 140Thr Cys Ile Tyr Leu Val Ile Thr Trp Ile Met Thr Val Leu Ala Val145 150 155 160Leu Pro Asn Met Tyr Ile Gly Thr Ile Glu Tyr Asp Pro Arg Thr Tyr165 170 175Thr Cys Ile Phe Asn Tyr Leu Asn Asn Pro Val Phe Thr Val Thr Ile180 185 190Val Cys Ile His Phe Val Leu Pro Leu Leu Ile Val Gly Phe Cys Tyr195 200 205Val Arg Ile Trp Thr Lys Val Leu Ala Ala Arg Asp Pro Ala Gly Gln210 215 220Asn Pro Asp Asn Gln Leu Ala Glu Val Arg Asn Lys Leu Thr Met Phe225 230 235 240Val Ile Phe Leu Leu Phe Ala Val Cys Trp Cys Pro Ile Asn Val Leu245 250 255Thr Val Leu Val Ala Val Ser Pro Lys Glu Met Ala Gly Lys Ile Pro260 265 270Asn Trp Leu Tyr Leu Ala Ala Tyr Phe Ile Ala Tyr Phe Asn Ser Cys275 280 285Leu Asn Ala Val Ile Tyr Gly Leu Leu Asn G1u Asn Phe Arg Arg Glu290 295 300Tyr Trp Thr Ile Phe His Ala Met Arg His Pro Ile Ile Phe Phe Ser305 310 315 320Gly Leu Ile Ser Asp Ile Arg Glu Met Gln Glu Ala Arg Thr Leu Ala325 330 335Arg Ala Arg Ala His Ala Arg Asp Gln Ala Arg Glu Gln Asp Arg Ala
340 345 350His Ala Cys Pro Ala Val Glu Glu Thr Pro Met Asn Val Arg Asn Val355 360 365Pro Leu Pro Gly Asp Ala Ala Ala Gly His Pro Asp Arg Ala Ser Gly370 375 380His Pro Lys Pro His Ser Arg Ser Ser Ser Ala Tyr Arg Lys Ser Ala385 390 395 400Ser Thr His His Lys Ser Val Phe Ser His Ser Lys Ala Ala Ser Gly405 410415His Leu Lys Pro Val Ser Gly His Ser Lys Pro Ala Ser Gly His Pro420 425 430Lys Ser Ala Thr Val Tyr Pro Lys Pro Ala Ser Val His Phe Lys Ala435 440 445Asp Ser Val His Phe Lys Gly Asp Ser Val His Phe Lys Pro Asp Ser450 455 460Val His Phe Lys Pro Ala Ser Ser Asn Pro Lys Pro Ile Thr Gly His465 470 475 480His Val Ser Ala Gly Ser His Ser Lys Ser Ala Phe Asn Ala Ala Thr485 490 495Ser His Pro Lys Pro Ile Lys Pro Ala Thr Ser His Ala Glu Pro Thr500 505 510Thr Ala Asp Tyr Pro Lys Pro Ala Thr Thr Ser His Pro Lys Pro Ala515 520 525Ala Ala Asp Asn Pro Glu Leu Ser Ala Ser His Cys Pro Glu Ile Pro530 535 540Ala Ile Ala His Pro Val Ser Asp Asp Ser Asp Leu Pro Glu Ser Ala545 550 555 560Ser Ser Pro Ala Ala Gly Pro Thr Lys Pro Ala Ala Ser Gln Leu Glu565 570 575Ser Asp Thr Ile Ala Asp Leu Pro Asp Pro Thr Val Val Thr Thr Ser580 585 590Thr Asn Asp Tyr His Asp Val Val Val Val Asp Val Glu Asp Asp Pro595 600 605Asp Glu Met Ala Val610(14A)SEQ ID NO143的资料(i)序列特征(A)长度33个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO143的序列描述GCTGAGGTTC GCAATAAACT AACCATGTTT GTG 33(145)SEQ ID NO144的资料(i)序列特征(A)长度30个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(xi)SEQ ID NO144的序列描述CTCCTTCGGT CCTCCTATCG TTGTCAGAAG T 31(146)SEQ ID NO145的资料(i)序列特征(A)长度27个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义否(xi)SEQ ID NO145的序列描述TTAGATATCG GGGCCCACCC TAGCGGT27(147)SEQ ID NO146的资料(i)序列特征(A)长度29个碱基对(B)类型核酸(C)链型单链(D)拓扑学线形(ii)分子类型DNA(基因组的)(iv)反义是(xi)SEQ ID NO146的序列描述GGTACCCCCA CAGCCATTTC ATCAGGATC 29
权利要求
1.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hARE-3(F313K)。
2.由权利要求1所述的cDNA编码的人G蛋白偶联受体的非内源形式。
3.含有载体和权利要求1所述的cDNA的质粒。
4.含有权利要求3所述的质粒的宿主细胞。
5.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hARE-4(V233K)。
6.由权利要求5所述的cDNA编码的人G蛋白偶联受体的非内源形式。
7.含有载体和权利要求5所述的cDNA的质粒。
8.含有权利要求7所述的质粒的宿主细胞。
9.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hARE-5(A240K)。
10.由权利要求9所述的cDNA编码的人G蛋白偶联受体的非内源形式。
11.含有载体和权利要求5所述的cDNA的质粒。
12.含有权利要求11所述的质粒的宿主细胞。
13.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hGPCR14(L257K)。
14.由权利要求13所述的cDNA编码的人G蛋白偶联受体的非内源形式。
15.含有载体和权利要求13所述的cDNA的质粒。
16.含有权利要求15所述的质粒的宿主细胞。
17.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hGPCR27(C283K)。
18.由权利要求17所述的cDNA编码的人G蛋白偶联受体的非内源形式。
19.含有载体和权利要求17所述的cDNA的质粒。
20.含有权利要求19所述的质粒的宿主细胞。
21.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hARE-1(E232K)。
22.由权利要求21所述的cDNA编码的人G蛋白偶联受体的非内源形式。
23.含有载体和权利要求21所述的cDNA的质粒。
24.含有权利要求23所述的质粒的宿主细胞。
25.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hARE-2(G285K)。
26.由权利要求25所述的cDNA编码的人G蛋白偶联受体的非内源形式。
27.含有载体和权利要求25所述的cDNA的质粒。
28.含有权利要求27所述的质粒的宿主细胞。
29.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hPPR1(L239K)。
30.由权利要求29所述的cDNA编码的人G蛋白偶联受体的非内源形式。
31.含有载体和权利要求29所述的cDNA的质粒。
32.含有权利要求31所述的质粒的宿主细胞。
33.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hG2A(K232A)。
34.由权利要求33所述的cDNA编码的人G蛋白偶联受体的非内源形式。
35.含有载体和权利要求33所述的cDNA的质粒。
36.含有权利要求35所述的质粒的宿主细胞。
37.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hRUP3(L224K)。
38.由权利要求37所述的cDNA编码的人G蛋白偶联受体的非内源形式。
39.含有载体和权利要求37所述的cDNA的质粒。
40.含有权利要求39所述的质粒的宿主细胞。
41.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hRUP5(A236K)。
42.由权利要求41所述的cDNA编码的人G蛋白偶联受体的非内源形式。
43.含有载体和权利要求41所述的cDNA的质粒。
44.含有权利要求42所述的质粒的宿主细胞。
45.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hRUP6(N267K)。
46.由权利要求45所述的cDNA编码的人G蛋白偶联受体的非内源形式。
47.含有载体和权利要求45所述的cDNA的质粒。
48.含有权利要求47所述的质粒的宿主细胞。
49.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hRUP7(A302K)。
50.由权利要求49所述的cDNA编码的人G蛋白偶联受体的非内源形式。
51.含有载体和权利要求49所述的cDNA的质粒。
52.含有权利要求51所述的质粒的宿主细胞。
53.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hCHN4(V236K)。
54.由权利要求53所述的cDNA编码的人G蛋白偶联受体的非内源形式。
55.含有载体和权利要求53所述的cDNA的质粒。
56.含有权利要求55所述的质粒的宿主细胞。
57.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hMC4(A244K)。
58.由权利要求57所述的cDNA编码的人G蛋白偶联受体的非内源形式。
59.含有载体和权利要求57所述的cDNA的质粒。
60.含有权利要求60所述的质粒的宿主细胞。
61.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hCHN3(S284K)。
62.由权利要求61所述的cDNA编码的人G蛋白偶联受体的非内源形式。
63.含有载体和权利要求61所述的cDNA的质粒。
64.含有权利要求63所述的质粒的宿主细胞。
65.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hCHN6(L352K)。
66.由权利要求65所述的cDNA编码的人G蛋白偶联受体的非内源形式。
67.含有载体和权利要求65所述的cDNA的质粒。
68.含有权利要求67所述的质粒的宿主细胞。
69.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hCHN8(N235K)。
70.由权利要求69所述的cDNA编码的人G蛋白偶联受体的非内源形式。
71.含有载体和权利要求69所述的cDNA的质粒。
72.含有权利要求71所述的质粒的宿主细胞。
73.编码人G蛋白偶联受体的非内源组成型活化形式的cDNA,其包含hH9(F236K)。
74.由权利要求73所述的cDNA编码的人G蛋白偶联受体的非内源形式。
75.含有载体和权利要求73所述的cDNA的质粒。
76.含有权利要求74所述的质粒的宿主细胞。
77.编码与人G蛋白偶联的AT1受体的非内源组成型活化形式的cDNA,所述受体选自hAT1(F239K);hAT1(N111A);hAT1(AT2K255IC3);和hAT1(A243+)。
78.由权利要求77所述的cDNA编码的人G蛋白偶联受体的非内源形式。
79.包含载体和权利要求77所述的cDNA的质粒。
80.包含权利要求79所述的质粒的宿主细胞。
全文摘要
本专利申请文件所公开的发明涉及跨膜受体;具体地讲,涉及人G蛋白偶联受体,其内源配体是未知的(孤儿GPCR受体);进一步具体地讲,涉及用于提供组成型活性证据的人GPCR的突变(非内源性)形式。
文档编号C07K14/435GK1439053SQ99812092
公开日2003年8月27日 申请日期1999年10月13日 优先权日1998年10月13日
发明者多米尼克·P·比汉, 卡琳·莱曼-布鲁因斯玛, 德里克·T·查默斯, 陈若平, 邓杭, 马丁·戈尔, 廖王蓁, 林伊玲, 凯文·洛斯, 卡罗尔·怀特 申请人:阿瑞那制药公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1