T1r味觉受体及其编码基因的制作方法

文档序号:5860741阅读:2403来源:国知局
专利名称:T1r味觉受体及其编码基因的制作方法
相关申请本申请要求2001年1月3日提交的U.S.Serial No.60/259,227和2001年4月19日提交的U.S.Serial No.60/284,547的优先权,此处整体引用两者作为参考文献。
背景技术
发明领域本发明涉及最近鉴定的哺乳动物化学感受性G蛋白偶联受体、这种受体的家族和编码该受体的基因与cDNA。更具体而言地,本发明涉及最近鉴定的在味觉信号传导中起作用的哺乳动物化学感受性G蛋白偶联受体、这种受体的家族、编码该受体的基因与cDNA以及在味觉调节子的分析和发现中使用这种受体、基因与cDNA的方法。本发明特别提供了编码新的在下文标识为T1R2的人味觉受体的DNA序列和相应的受体多肽。
相关领域描述味觉系统提供了有关外部世界化学组合物的感觉信息。认为哺乳动物具有至少5种基本的味觉形式甜、苦、酸、咸和umami。参见如Kawamura等人,Umami介绍一种基本的味觉(Introductionto UmamiA Basic Taste)(1987);Kinnamon等人,Ann.Rev.Physiol.,54715-31(1992);Lindemann,Physiol.Rev.,76718-66(1996);Stewart等人,Am.J.Physiol.,2721-26(1997)。每一种味觉形式被认为是由舌表面上的味觉受体细胞所表达的多种受体或一种独特的蛋白质受体来介导的(Lindemann,Physiol.Rev.,76718-716(1996))。识别苦、甜和umami味觉刺激物的味觉受体属于G蛋白偶联受体(GPCR)超家族(Hoon等人,Cell96451(1999);Adler等人,Cell 100693(2000))。(认为其他味觉形式通过离子通道介导。)G蛋白偶联受体介导了许多其他的生理学功能,如内分泌功能、外分泌功能、心率、脂解作用和糖类代谢。对于一些这种受体的生物化学分析和分子克隆已揭示出许多有关这些受体功能的原理。例如,美国专利No.5,691,188描述了当配体结合到GPCR上时,受体怎样经过构象变化从而导致异三聚体化的G蛋白的激活,其中G蛋白的激活通过促进Ga亚基表面所结合的GDP被GTP的置换以及随后Ga亚基从Gb与Gg亚基的解离来进行。游离的Ga亚基和Gbg复合物激活了多种信号转导通路的下游元件。当前已知许多人和其他真核生物化学感受性受体的完整或部分序列。参见如Pilpel,Y.和Lancet,D.,Protein Science,8969-977(1999);Mombaerts,P.,Annu.Rev.Neurosci,22487-50(1999)。也参见EP0867508A2、US 5874243、WO 92/17585、WO 95/18140、WO97/17444、WO 99/67282。由于配体-受体相互作用的复杂性,更具体而言地为味觉刺激物-受体相互作用的复杂性,关于配体-受体识别的信息是缺乏的。作为甜和umami味觉受体的GPCR的鉴定和表征可允许发现新味觉刺激物的新方法。例如,受体的可用性能够允许对于受体调节子的筛选。这种化合物能够调节味觉,并可在食品工业中用于改善多种消费产品的味道;例如,通过新人工甜味剂的开发来改善低卡路里饮料的可口性。部分地,本发明提出了对于更好地理解化学感受性受体和化学刺激物之间相互作用的需要。其中,本发明(除了其它)也提供了新的化学感受性受体和使用这种受体的方法,以及编码这种受体的基因与cDNA,从而鉴定可用于调节化学感受性转导如味觉的分子。
发明概述本发明涉及G蛋白偶联受体的新家族和编码该受体的基因与cDNA。认为受体主要地与甜味觉转导有关,但是也可以参与转导来自其他味觉形式的信号。本发明提供了在哺乳动物中(包括人)表示味觉感受和/或预测味觉感受的方法。优选地,这种方法可通过使用此处所公开的受体和编码该受体的基因来进行。所以,提供此处称为T1Rs的在味觉中起作用的哺乳动物G蛋白偶联受体新家族是本发明的一个目的。提供保留味觉刺激物结合活性的这种T1Rs的片段和变体为本发明的另一个目的。提供编码这种T1Rs或其片段或变体的核酸序列或分子是本发明的另外一个目的。提供包括编码这种T1Rs或其片段或变体的核酸序列的表达载体为本发明的另外一个目的,该核酸序列可操作地连接到至少一个调节序列上,如启动子、增强子或其他参与正或负的基因转录和/或翻译的序列。提供功能性地表达至少一种这种T1Rs或其片段或变体的人或非人细胞为本发明的另外一个目的。提供包括至少一种这种T1Rs的至少一个片段的T1R融合蛋白质或多肽为本发明的另外一个目的。提供分离的编码T1R多肽的核酸分子为本发明的另一个目的,该核酸分子含有与选自SEQ ID NOS1、2、3、9、11、13、15、16、20的核酸序列具有至少50%,优选的为75%、85%、90%、95%、96%、97%、98%或99%的一致性的核酸序列及其保守修饰的变体。提供分离的包含编码多肽的核酸序列的核酸分子为本发明的进一步的目的,该多肽具有与选自SEQ ID NOS4、10、12、14、17、21的氨基酸序列具有至少35~50%,优选的为60%、75%、85%、90%、95%、96%、97%、98%或99%的一致性的氨基酸序列及其保守修饰的变体,其中片段长度为至少20个,优选的为40、60、80、100、150、200或250个氨基酸。可选地,片段可以为与抗T1R抗体结合的抗原片段。提供分离的含有该片段变体的多肽为本发明另外的目的,其中有至多10个,优选的为5、4、3、2或1个氨基酸残基发生变异。提供这种T1Rs的激动剂或拮抗剂,或其片段或变体为本发明的另外一个目的。提供在哺乳动物包括人中表示味觉感受和/或预测味觉感受的方法为本发明的另外一个目的。优选地,这种方法可通过使用此处所公开的T1Rs或其片段或变体和编码这种T1Rs的基因或其片段或变体来进行。提供在哺乳动物中引起预定味觉感受的新的分子或分子组合为本发明的另外一个目的。这种分子或组合物可通过下述方法产生测定已知分子或分子组合在哺乳动物中的味觉感受值;测定一种或多种未知分子或分子组合在哺乳动物中的味觉感受值;将一种或多种未知组合物在哺乳动物中的味觉感受值与一种或多种已知组合物在哺乳动物中的味觉感受值进行比较;选择出在哺乳动物中引起预定味觉感受的分子或分子组合;以及合并两种或更多种未知分子或分子组合以形成在哺乳动物中引起预定味觉感受的分子或分子组合。合并步骤产生在哺乳动物中引起预定味觉感受的单一分子或分子组合。提供筛选一种或多种化合物以确定哺乳动物可探测的味觉是否存在的方法为本发明另外的目的,该方法包括将该一种或多种化合物与至少一种公开的T1Rs或其片段或变体接触的步骤,其中哺乳动物优选地为人。提供用于模拟味觉的方法为本发明的另一个目的,该方法包括下列步骤对于此处所公开的大量T1Rs或其片段或变体的每一个,优选的为人T1Rs,确定T1R与味觉刺激物相互作用的程度;以及以一定量组合大量的化合物,其中每一个具有先前所确定的与一种或多种T1Rs的相互作用,它们总和在一起提供了模拟味觉特征的受体-刺激特征。味觉刺激物与T1R的相互作用可以使用任何这里所描述的结合或受体测定来确定。然后,可将大多数化合物组合形成混和物。如果需要,大多数化合物中的一种或多种可以共价组合。组合化合物基本上刺激至少50%、60%、70%、75%、80%或90%或者所有的基本上可被味觉刺激物刺激的受体。在本发明的另外一个方面中,提供了一种方法,其中将大量的标准化合物进行抗大量T1Rs或其片段或变体的检验,从而确定每一个T1Rs与每一个标准化合物相互作用的程度,因此对于每一个标准化合物产生一个受体刺激特性。然后可将这些受体刺激特征储存在位于数据存储介质上的相关数据库中。该方法可以进一步包括提供味觉的想要的受体刺激特征;将想要的受体刺激特征与相关数据库进行比较;并确定最紧密地与想要的受体刺激特征相匹配的一种或多种标准化合物的组合。该方法可以进一步包含在一种或多种所确定的组合中来组合标准化合物以模拟味觉。提供用于在哺乳动物中表示特殊味觉刺激物的味觉感受的方法为本发明的进一步的目的,该方法包括下列步骤提供所述脊椎动物n个T1R中每一个的定量刺激的代表值X1~Xn,其中n大于或等于2;从该值中产生味觉的定量表示(representation)。T1Rs可以是这里所公开的味觉受体或者其片段或变体,所述表示可以构成n维空间中的点或组(volume),可以构成图表或谱,还可以构成定量表示的矩阵。同样的,提供的步骤可以包含将大量重组生产的T1Rs或其片段或变体与检验组合物接触,并定量测量该组合物与该受体之间的相互作用。提供用于在哺乳动物中预测由一种或多种分子或分子组合生成的味觉感受的方法为本发明的另外一个目的,该分子或分子联合物在哺乳动物中产生未知的味觉感受,该方法包括下列步骤提供该脊椎动物n个T1Rs中每一个的定量刺激的代表值X1~Xn,其中n大于或等于2;对于一种或多种分子或分子组合,在哺乳动物中产生已知味觉;并从该值中产生出对于在哺乳动物中产生已知味觉感受的一种或多种分子或分子组合在哺乳动物中味觉感受的定量表示;提供该脊椎动物n个T1Rs中每一个的定量刺激的代表值X1~Xn,其中n大于或等于2;对于一种或多种分子或分子组合,在哺乳动物中产生未知味觉感受;并从该值中产生出对于在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合在哺乳动物中味觉感受的定量表示;然后预测哺乳动物中由在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合产生的味觉感受,该预测是通过将对于在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合的哺乳动物中味觉感受的定量表示与对于在哺乳动物中产生已知味觉感受的一种或多种分子或分子组合的哺乳动物中味觉感受的定量表示进行比较来实现的。在该方法中所使用的T1Rs可以包括这里所公开的味觉受体或者其片段或变体。
附图详述

图1a-1c表示对于人T1R2/T1R3受体的功能数据。在图1a中显示了稳定表达Gα15的HEK细胞对于多种蔗糖浓度的细胞内钙反应,该HEK细胞用人T1R2、T1R3和T1R2/T1R3进行了瞬时转染。每一组相当于大约1000个汇合的、转染的和装载了钙染料的细胞。图1b中显示了由甜味觉抑制剂gurmarin对T1R2/T1R3活性的抑制。图1c中显示了对于4种甜味剂的T1R2/T1R3剂量反应和相关的心理物理学探测阈值(X轴圆圈)。图2表示对于大鼠T1R2/T1R3受体的功能数据。显示了对于350mM蔗糖、25mM色氨酸、15mM阿斯巴甜和0.05%应乐果甜蛋白的人T1R2/T1R3和大鼠T1R2/T1R3(以及混和的大鼠/人受体)反应。大鼠T1R2/T1R3不对阿斯巴甜或应乐果甜蛋白有反应,这些对于啮齿动物是不可口的。图3a-3c表示对于人T1R2/T1R3受体的功能数据。图3a中显示了稳定表达Gα15的HEK细胞对于多种浓度L-谷氨酸的细胞内钙响应,该HEK细胞用人T1R1、T1R3和T1R1/T1R3进行了瞬时转染。图3b中显示了由IMP所引起的T1R1/T1R3反应的增强。图3c中显示了对于L-谷氨酸以及L-谷氨酸加0.2mM IMP的T1R1/T1R3剂量反应,以及相关的心理物理学探测阈值(X轴圆圈)。图4a-4b表示免疫荧光和FACS实验,实验证明了将PDZIP肽(SEQ ID No1)融合到人T1R2上可增强其在HEK细胞表面的表达。图5表示对于稳定表达Gα15和人T1R1/T1R3的细胞系的自动荧光成像数据。测定了在0.5mM IMP存在时的L-谷氨酸剂量反应。图6表示对于稳定表达Gα15和人T1R2/T1R3的细胞系的自动荧光成像数据。显示了稳定细胞系的蔗糖、D-色氨酸、糖精和阿斯巴甜的剂量反应。
发明详述本发明从而提供了分离的编码味觉细胞特异性G蛋白偶联受体(“GPCR”)的核酸分子及其编码的多肽。这些核酸分子及其编码的多肽是味觉细胞特异性GPCRs的T1R家族的成员。味觉细胞特异性GPCRs的T1R家族的成员在Hoon等人,Cell96541-551(1999)、WO 00/06592和WO 00/06593中进行了鉴定,这些文献在此处整体引用作为参考。
更具体而言地,本发明提供了编码味觉细胞特异性GPCRs新家族的核酸。这些核酸及其编码的受体被认为是味觉细胞特异性GPCRs的“T1R”家族的成员。在本发明特别的实施方案中,T1R家族成员包括人T1R1、T1R2和T1R3。根据上面的描述,不同的T1R组合物可能介导了甜和umami味觉。此外,人们确信T1R家族成员可以与其他T1R家族成员、其他味觉细胞特异性GPCRs或其组合协同起作用,从而影响化学感受性味觉转导。例如,人们确信T1R1和T1R3可能在相同的味觉受体细胞类型中共表达,这两种受体可以在物理上相互作用从而形成异二聚体化的味觉受体。可选择的,T1R1和T1R3两者可以独立地结合到同类型的配体上,它们的组合结合可以导致特定的感觉到的味觉。由于核酸在味觉细胞中特异表达,因此这些核酸提供了用于鉴定味觉细胞的有价值的探针。例如,对于T1R多肽和蛋白质的探针可用于鉴定存在于叶状、轮廓状和蕈状乳头之中的味觉细胞,以及存在于味觉带(geschmackstreifen)、口腔、胃肠上皮和会厌之中的味觉细胞。它们也可作为用于产生味觉局部解剖图的工具,该图阐明了舌的味觉细胞与通向大脑味觉中心的味觉感觉神经元之间的相互关系。特别地,探测T1Rs的方法可用于鉴定对于甜味觉刺激物或其他特定形式味觉刺激物敏感的味觉细胞。此外,核酸及其编码的蛋白质可用作探针来剖析味觉诱导的行为。同样的,编码人T1Rs的基因的染色体定位可用于鉴定由T1R家族成员所引起的和与之有关的疾病、突变和性状。编码本发明的T1R蛋白质和多肽的核酸可以从多种来源分离获得,可根据WO 00/035374中所公开的方法采用遗传工程、扩增、合成和/或重组表达的方式获得,所述文献在此处整体引用作为参考。本发明也提供了筛选这些新的味觉细胞特异性GPCRs的调节子如活化剂、抑制剂、刺激物、增强剂、激动剂和拮抗剂的方法。这种味觉转导的调节子可用于味觉信号通路的药理学、化学和遗传学调节。这些筛选方法可用于鉴定味觉细胞活性的高亲和力激动剂和拮抗剂。然后这些调节化合物可用在食品和制药工业中来定制味觉,例如调节食品或药物的甜味。因而,本发明提供了用于探测和表征味觉调节的测定方法,其中T1R家族成员充当了调节子对味觉转导效应的直接或间接的报道分子。GPCRs在测定中可用于如测量体外、体内和来自体内的配体结合、离子浓度、膜电位、电流、离子流、转录、信号转导、受体-配体相互作用、第二信使浓度的变化。在一个实施方案中,T1R家族成员通过附着于第二报道分子如绿色荧光蛋白之上可用作间接的报道分子(参见如Mistili & Spector,Nature Biotechnology,15961-964(1997))。在另一个实施方案中,T1R家族成员可以在细胞中重组表达,并且通过GPCRs活性的味觉转导的调节可采用测量Ca2+水平和其他细胞内信号如cAMP、cGMP或IP3的变化来测定。在某些实施方案中,将T1R多肽的一个结构域如细胞外、跨膜或细胞内结构域融合到一个异源多肽上,因此形成一种嵌合多肽,如具有GPCR活性的嵌合多肽。这种嵌合多肽可用于如在测定中鉴定T1R多肽的配体、激动剂、拮抗剂或者其他调节子。另外,这种嵌合多肽可用于创造具有新的配体结合特异性、调节模式、信号转导通路或其他此类性质的新味觉受体,或者用于创造具有配体结合特异性、调节模式、信号转导通路等特性的新组合的新味觉受体。在一个实施方案中,T1R多肽在真核生物细胞中作为嵌合受体表达,该多肽具有异源的且有助于质膜运输或者经分泌路径成熟与定位的陪伴分子序列。可选的异源序列可以为视紫红质序列,如视紫红质的N末端片段。这种嵌合的T1R受体能够在任何真核生物细胞如HEK-293细胞中表达。优选地,这些细胞含有G蛋白,例如Gα15或Gα16或另一类型的混杂G蛋白,该混杂G蛋白能够将大范围的化学感受性GPCRs与细胞内信号通路或者与信号蛋白如磷脂酶C配对。可选择的,这些细胞可以表达嵌合的或变异的G蛋白从而产生功能性T1R味觉受体,所述嵌合或变异G蛋白是基于偶联T1R的能力挑选出来的。特别优选的变异G蛋白的例子包括在2001年10月29日提交的U.S.系列No.09/984,292中所公开的G蛋白变体,和在U.S.临时申请No.60/——、Attorney Docket No.078003-0280737中所公开的嵌合Gα15变体,这两篇文献都在此处整体引用作为参考。这些申请公开了G蛋白变体,其显示比一种熟知的混杂G蛋白Gα15能更好地偶联T1Rs。这种嵌合受体在这种细胞中的活化可以通过使用任何标准方法来探测,如通过探测细胞中FURA-2依赖性荧光来探测细胞内钙的变化。如果优选的宿主细胞不表达合适的G蛋白,它们可以用编码混杂G蛋白的基因转染,如在US申请系列No.60/243,770(此处整体引用作为参考)中所描述的那些G蛋白。味觉转导调节子的测定方法包括体外配体结合测定,该方法使用下列材料和方法T1R多肽、其部分,即细胞外结构域、跨膜区域或其组合或者含有一个或多个T1R家族成员的结构域的嵌合蛋白;表达T1R多肽、片段或融合蛋白的卵母细胞或组织培养细胞;T1R家族成员的磷酸化和去磷酸化;结合到GPCRs上的G蛋白;配体结合测定;电压、膜电位和电导的变化;离子流测定;细胞内第二信使如cGMP、cAMP和肌醇三磷酸的变化;细胞内钙水平的变化;和神经递质的释放。此外,本发明提供了探测T1R核酸和蛋白质表达的方法,该方法使得能进行味觉转导调节的研究和味觉受体细胞的特殊鉴定。T1R家族成员也提供了对于父子关系和法庭调查有用的核酸探针。T1R基因也用作用于鉴定味觉受体细胞如叶状、蕈状、轮廓状、味觉带和会厌味觉受体细胞的核酸探针。T1R受体也可用于产生用于鉴定味觉受体细胞的单克隆和多克隆抗体。可以采用下列技术来鉴定味觉受体细胞如mRNA的反转录和扩增、总RNA或聚腺苷酸化RNA的分离、RNA印迹法、点印迹法、原位杂交、RNA酶保护、S1消化、探测DNA微芯片阵列、蛋白质印迹法等。在功能上,T1R多肽含有一个相关的七跨膜G蛋白偶联受体的家族,认为该受体参与了味觉转导,并可能与G蛋白相互作用从而介导了味觉信号转导(参见如Fong,Cell Signal,8217(1996);Baldwin,Curr.Opin.Cell Biol.,6180(1994))。在结构上,T1R家族成员的核苷酸序列可能编码了含有细胞外结构域、七跨膜结构域和细胞质结构域的相关多肽。来自其他种类的相关T1R家族基因与SEQID NO1、2、3、9、11、13、15、16、20或者其保守修饰的变体在至少大约50个核苷酸,可选的为100、200、500个或更多核苷酸长的区域具有至少大约50%,可选的为60%、70%、80%或90%的核苷酸序列一致性;或者其编码的多肽与SEQ ID NO4、10、12、14、17、21或者其保守修饰的变体在至少大约25个氨基酸,可选的为50~100个氨基酸长的区域具有至少大约35~50%,可选的为60%、70%、80%或90%的氨基酸序列一致性。还鉴定了几个作为T1R家族成员的特征的共有氨基酸序列或结构域。例如,T1R家族成员一般含有与T1R共有序列1和2(分别为SEQ ID NOs 18和19)具有至少大约50%,可选的为55%、60%、65%、70%、75%、80%、85%、90%、95-99%或更高一致性的序列。因而,这些保守结构域可用于鉴定T1R家族成员,其鉴定方法有一致性比较、特异性杂交或扩增或者用抗结构域的抗体进行特异性结合。这种T1R共有序列具有下列氨基酸序列T1R家族共有序列1(SEQ ID NO18)(TR)C(FL)(RQP)R(RT)(SPV)(VERKT)FL(AE)(WL)(RHG)ET1R家族共有序列2(SEQ ID NO19)(LQ)P(EGT)(NRC)YN(RE)A(RK)(CGF)(VLI)T(FL)(AS)(ML)这些共有序列包括了那些在此处所描述的T1R多肽中所发现的序列,但是来自其他生物的T1R家族成员可以被认为包含与此处详细描述的所包含的一致序列具有大约75%或更高一致性的一致序列。T1R核苷酸和氨基酸序列的特定区域可用于鉴定T1R家族成员的多态变体、种间同系物和等位基因。该鉴定可在体外进行,例如在严格性杂交条件或PCR(如用编码上面所鉴定的T1R共有序列的引物)下,或者使用计算机系统中的序列信息来与其他核苷酸序列进行比较。单一物种种群中的T1R基因的不同等位基因也可用于确定等位基因序列的差异是否和种群成员之间味觉感受的差异有关。经典的PCR型扩增和克隆技术可用于定向同源物(ortholog)的分离,例如当简并引物对于探测物种间相关基因是足够的时,这些物种一般具有比单一物种中T1R家族的平行进化同源成员更高水平的相关一致性。例如,简并引物SAP 077(SEQ.ID NO.5)和SAP 0079(SEQ.ID NO.6)可用于从不同哺乳动物基因组中扩增和克隆T1R3基因。相反地,单一物种中与T1R3有关的基因用序列模式识别软件进行最佳鉴定以寻找相关序列。一般地,T1R家族成员的多态变体和等位基因的鉴定可以以下列方式进行,即比较含有大约25个或更多如50-100个氨基酸的氨基酸序列。大约至少35-50%,可选的为60%、70%、75%、80%、85%、90%、95-99%或更高的氨基酸一致性一般可证明蛋白质为T1R家族成员的多态变体、种间同系物或等位基因。可用任何下面所讨论的序列比较算法进行序列比较。特异地结合到T1R多肽或者其保守区域上的抗体也可用于鉴定等位基因、种间同系物和多态变体。T1R基因的多态变体、种间同系物和等位基因可通过检查推定的T1R多肽的味觉细胞特异性表达来加以确认。一般地,具有这里所公开的氨基酸序列的T1R多肽可用作与推定T1R多肽比较的正对照从而证实T1R家族成员的多态变体或等位基因的鉴定。预期多态变体、等位基因和种间同系物保留了G蛋白偶联受体的七跨膜结构。对于进一步的详情,参见WO 00/06592,其公开了相关的T1R家族成员GPCR-B3,此处以与该公开内容相一致的方式引用其内容作为参考。此处将GPCR-B3受体称为rT1R1和mT1R1。另外,参见WO00/06593,其也公开了相关的T1R家族成员GPCR-B4,此处以与该公开内容相一致的方式引用其内容作为参考。此处将GPCR-B4受体称为rT1R2和mT1R2。T1R家族成员的核苷酸和氨基酸序列信息也可用于在计算机系统中构建味觉细胞特异性多肽的模型。随后,这些模型可用于鉴定能够激活或抑制T1R受体蛋白质的化合物。然后,这种调节T1R家族成员的活性的化合物可用于研究T1R基因和受体在味觉转导中的作用。本发明还提供了测定方法,优选的为高通量的测定方法来鉴定与T1R多肽相互作用和/或调节T1R多肽的分子。在大量的试验中,使用T1R家族成员的特殊结构域,例如细胞外、跨膜或者细胞内结构域或区域。在大量的实施方案中,可以将细胞外结构域、跨膜区域或者其组合结合到固体基质上,并用来如分离配体、激动剂、拮抗剂或者任何其他能够结合和/或调节T1R多肽活性的分子。在本发明的一个方面中,提供了一种新的T1R家族的人GPCR基因,称之为hT1R3。hT1R3基因从包括GenBank的HTGS部分的人基因组序列数据库来鉴定。在SEQ.ID NOS 1-4中提供了hT1R3的核苷酸和推定的氨基酸序列。hT1R3受体在部分测序的BAC基因组克隆RP5-890O3(数据库存取号AL 139287)中通过它与候选大鼠味觉受体rT1R1(访问号AF 127389)的序列相似性来鉴定。作为参考,预测的hT1R3和rT1R1蛋白质序列之间的成对一致性为大约34%。与额外的GPCR家族C(包括钙感受受体、推定的V2R外激素受体、GABA-B受体、鱼味觉受体和metabotropic谷氨酸受体)的成员的序列比较表明,hT1R3很可能属于由T1R1和第二个大鼠候选味觉受体(rT1R2,访问号AF 127390)所定义的家族C亚群。本发明也提供了标明为rT1R1的大鼠味觉受体的人定向同源物,称之为hT1R1。rT1R1和hT1R1的基因产物具有大约74%的一致性。已经报道了小鼠基因mT1R1,参见Hoon等人,Cell,96541-551(2000),它定位在与含有hT1R1的间隔同源的染色体间隔。此处分别将核苷酸和推定的hT1R1序列描述为SEQ.ID NOS 15和16。虽然不希望受缚于任何特定理论,但是预测T1R家族受体依靠mT1R3与Sac基因座的连锁参与了甜味转导,所述影响甜味觉的Sac基因座位于染色体4的远端。也报道人T1R3位于1p36.2-1p36.33,该区域显示出与含有Sac和T1R1的小鼠间隔具有保守的同线性。然而,T1R型受体可介导其他味觉形式,如苦、umami、酸和咸。多种保守的突变和替代被包含在本发明的范围之内。例如,在本领域的技术水平之内用已知的重组基因技术规程进行氨基酸替代,该重组基因技术包括PCR、基因克隆、cDNA的定点诱变、宿主细胞的转染和体外转录。然后,可以对于味觉细胞特异性GPCR功能的活性来筛选变体。
A.T1R多肽的鉴定和表征本发明的T1R蛋白质和多肽的氨基酸序列可以通过其编码核酸序列的推定翻译来鉴定。这些多种氨基酸序列和编码核酸序列可以根据许多方法彼此或与其他序列进行比较。例如在序列比较中,一般一个序列作为参考序列,测试序列与之进行比较。当用序列比较算法时,将测试和参考序列输入计算机,如果需要,指明子序列坐标,指定序列算法程序参数。如下面对于BLASTN和BLASTP程序的描述,可以使用默认程序参数或者可以指定可选择的参数。然后,序列比较算法基于程序参数计算出测试序列相对于参考序列的序列一致性百分数。此处所用的“比较窗口”包括对于选自20至600、通常大约50至大约200、更通常大约100至大约150的邻近位置数中任一个的片段的参考,在其中,一个序列可以在两个序列最佳比对之后与具有同样邻近位置数的参考序列进行比较。比较序列的比对的方法在本领域中是公知的。比较序列的最佳比对可以通过下列方法来实施,例如Smith & Waterman,Adv.Appl.Math.2482(1981)的局部同源性算法、Needleman & Wunsch,J Mol.Biol.48443(1970)的同源性比对算法、Pearson & Lipman,Proc.Natl.Acad Sci.USA 852444(1988)的相似性搜索方法、这些算法的计算机执行(GAP、BESTFIT、FASTA和TFASTA,Wisconsin Genetics Software Package,GeneticsComputer Group,575 Science Dr.,Madison,WI)、或者手工比对和肉眼检查(参见如Current Protocols in Molecular Biology(Ausubel等人编,1995增刊))。适合于确定序列一致性和序列相似性百分比的算法的优选的例子为BLAST和BLAST 2.0算法,它们分别描述于Altschul等人,Nuc.Acids Res.253389-3402(1977)和Altschul等人,J Mol.Biol.215403-410(1990)。进行BLAST分析的软件在国家生物技术信息中心(National Center for Biotechnology Information)(http//www.ncbi.nlm.nih.gov/)上是公共可获得的。该算法包括首先通过在查询序列中鉴定长度为W的短字串而鉴定高分值的序列对(HSPs),该短字串当与数据库序列中相同长度的字串比对时,或者匹配或者满足某个正的阈值分数T。T被称为邻近字串分数阈值(Altschul等人,Nuc.Acids Res.253389-3402(1977)和Altschul等人,JMol.Biol.215403-410(1990))。这些初始的邻近字串命中值(hit)充当起始种子以发现含有该字串的更长HSPs。字串命中值在每一序列的两个方向延伸,只要累积的比对分值可以增加。累积的分值对于核苷酸序列而言是用参数M(一对匹配的残基的奖励分值;总是>0)和N(错配残基的惩罚分值;总值<0)来计算的。对于氨基酸序列,用分数矩阵来计算累积的分值。字串命中值在两个方向的延伸在如下情况时终止累积的比对分值从其最大所得值下降了量X时;累积分值由于一个或多个负分值残基比对的累积而达到零或低于零时;或者达到了任一序列的末端。BLAST程序的参数W、T和X确定了比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)默认使用字长(W)为11、期望(E)为10、M=5、N=-4和对两条链的比较。对于氨基酸序列,BLASTP程序默认使用字长为3和期望(E)为10,及BLOSUM62分值矩阵(参见Henikoff & Henikoff,Proc.Natl.Acad.Sci.USA 8910915(1989))比对(B)为50、期望(E)为10,M=5、N=-4和对两条链的比较。有用的算法的另一个例子是PILEUP。PILEUP用渐进性的成对比对从一组相关序列中创建了多重的序列比对以显示相互关系和序列一致性百分比。它也标绘了显示用于创建比对的聚类(clustering)相互关系的所谓的“树”或“树形图(dendogram)”(参见如图2)。PILEUP使用Feng & Doolittle,J Mol.Evol.35351-360(1987)的渐进性比对方法的简化方法。所用的方法与由Higgins &Sharp,CABIOS 5151-153(1989)描述的方法相似。该程序可比对多达300个序列,每一序列最长为5,000个核苷酸或氨基酸。该多重比对程序开始于对2个最相似序列的成对比对,产生了两个比对的序列的聚类。然后使该聚类与下一个最相关的序列或比对序列的聚类进行比对。2个序列聚类是通过对2个单一序列的成对比对的简单延伸而比对的。最终的比对是通过一系列渐进的成对比对完成的。该程序是通过指定特定的序列并且在序列比较的区域指定它们的氨基酸或核苷酸坐标和指定程序的参数而运行的。利用PILEUP,将参考序列与其他检验序列进行比较以用下面的参数确定序列一致性相互关系的百分比默认的缺口权重(3.00)、默认的缺口长度权重(0.10)和加权的末端缺口。PILEUP可从GCG序列分析软件包如7.0版(Devereaux等人,Nuc.Acids Res.12387-395(1984))获得。由基因编码的是来自相应可读框的推定翻译。用BLASTP算法将这些蛋白质序列与公共序列数据库中所有已知蛋白质进行的比较揭示它们与T1R家族成员有强的同源性,每一个T1R家族序列都与至少一个已知的家族成员具有至少约35~50%的,且优选地为至少55%的、至少60%的、至少65%的和最优选地为至少70%的氨基酸一致性。
B.定义如在此处所用的,下面的术语具有归于它们的意思,除非另外说明。“味觉细胞”包括组织成群体的形式以形成舌的味蕾的神经上皮细胞,如叶状、蕈状和轮廓状细胞(参见如Roper等人,Ann.Rev.Neurosci.12329-353(1989))。味觉细胞也发现于腭和其他组织,如食管和胃。“T1R”指一种或多种G蛋白偶联受体家族的成员,该成员表达于如叶状、蕈状和轮廓状细胞的味觉细胞以及腭和食管的细胞中(参见如Hoon等人,Cell,96541-551(1999),此处整体引用作为参考)。该家族的成员在WO 00/06592中也称为GPCR-B3和TR1,以及在WO 00/06593中称为GPCR-B4和TR2。GPCR-B3在此也称为rT1R1,GPCR-B4称为rT1R2。味觉受体细胞也可在形态学的基础上进行鉴定(参见如上述的Roper),或者通过在味觉细胞中特定表达的蛋白质的表达来鉴定。T1R家族成员可具有充当甜味转导的受体或者在多种其他的味觉形式间进行辨别的能力。“T1R”桉酸编码具有七跨膜区域且具有“G蛋白偶联受体活性”的GPCRs家族,如它们可响应于细胞外的刺激而结合到G蛋白上,并通过对如磷脂酶C和腺苷酸环化酶的刺激而促进第二信使如IP3、cAMP、cGMP和Ca2+的生产(对于GPCRs结构和功能的描述,参见如上述的Fong和上述的Baldwin)。单个味觉细胞可含有许多独特的T1R多肽。术语“T1R”家族因此指多态变体、等位基因、突变型和种间同系物,它们(1)与SEQ ID NOS4、10、12、14、17或21在约25个氨基酸,可选择地为50-100个氨基酸的窗口上具有至少约35~50%的氨基酸序列一致性,可选择地为约60、75、80、85、90、95、96、97、98或99%的氨基酸序列一致性;(2)特异性地结合到抗免疫原的抗体上,该免疫原包含选自SEQ ID NOS4、10、12、14、17、21及其保守修饰的变体的氨基酸序列;(3)由在严格性杂交条件下与选自SEQ ID NOS1、2、3、9、11、13、15、16、20及其保守修饰的变体的序列杂交的核酸分子(大小至少为约100个,可选地至少为约500-1000个核苷酸)编码;(4)包含与选自SEQ ID NOS4、10、12、14、17或21的氨基酸序列具有至少约35~50%的一致性的序列;或(5)是由在严格性杂交条件下与编码SEQ ID NOS7、8及其保守修饰的变体的简并引物集相同的序列杂交的引物扩增的。在拓扑学上,某些化学感受性GPCRs具有“N-末端结构域”、“细胞外结构域”、包含七跨膜区域的“跨膜结构域”和相应的胞质和胞外环、“胞质结构域”和“C-末端结构域”(参见如Hoon等人,Cell,96541-551(1999);Buck & Axel,Cell,65175-187(1991))。这些结构域可用本领域技术人员公知的技术进行结构鉴定,如鉴定疏水和亲水结构域的序列分析程序(参见如Stryer,Biochemistry,(3rded.1988);也参见许多基于因特网的序列分析程序的任何一种,如那些发现于dot.imgen.bcm.tmc.edu的)。这种结构域可用于构建嵌合蛋白质,也可用于本发明的体外测定,如配体结合测定。“细胞外结构域”因此指T1R多肽从细胞膜伸出并暴露于细胞的细胞外表面的结构域。这种结构域一般包括暴露于细胞外表面的“N-末端结构域”,并可选择地可包括跨膜结构域暴露于细胞外表面的部分细胞外环,即在跨膜区域2和3之间、跨膜区域4和5之间以及跨膜区域6和7之间的环。“N-末端结构域”区域起始于N-末端并延伸至靠近跨膜结构域开始处的区域。更具体而言地,在本发明的一个实施方案中,该结构域起始于N-末端并约终止于氨基酸位置563正负约20个氨基酸处的保守谷氨酸。这些细胞外结构域可用于可溶性和固相体外配体结合测定。另外,在下面描述的跨膜区域也可与细胞外结构域组合而结合配体,并因此也可用于体外配体结合测定。包含7个“跨膜区域”的“跨膜结构域”指T1R多肽位于质膜内部的结构域,且也可包括相应的胞质(细胞内)和细胞外环。在一个实施方案中,该区域相应于约起始于氨基酸位置563正负约20个氨基酸的保守谷氨酸残基处而约终止于位置812正负约10个氨基酸的保守酪氨酸残基处的T1R家族成员的结构域。该七跨膜区域和细胞外以及胞质环可用标准方法进行鉴定,如描述于Kyte & Doolittle,J.Mol.Biol.,157105-32(1982)或上述的Stryer中的。“胞质结构域”指T1R多肽面向细胞内侧的结构域,如“C末端结构域”和跨膜结构域的细胞内环,如在跨膜区域1和2之间的细胞内环、跨膜区域3和4之间的细胞内环和跨膜区域5和6之间的细胞内环。“C末端结构域”指跨越最后的跨膜结构域的末端和蛋白质的C-末端的区域,且该区域通常位于胞质内。在一个实施方案中,该区域起始于位置812正负约10个氨基酸的保守酪氨酸残基处并延伸到多肽的C-末端。术语“配体结合区域”或“配体结合结构域”指源自化学感受性受体,具体而言地为味觉受体的序列,该序列一般包括至少受体的细胞外结构域。在一个实施方案中,配体结合区域的细胞外结构域可包括N-末端结构域和(可选择的)跨膜结构域的部分,如跨膜结构域的细胞外环。配体结合区域能够结合配体,且更具体而言地为结合一种味觉刺激物。在检验调节T1R家族成员介导的味觉转导的化合物的测定中,短语“功能作用”包括对任何间接地或直接地受受体影响的参数如功能的、物理的和化学的作用的确定。它包括体外、体内和来自体内的配体结合、离子流变化、膜电位、电流、转录、G蛋白结合、GPCR磷酸化或脱磷酸化、信号转导、受体-配体相互作用、第二信使浓度(如cAMP、cGMP、IP3或细胞内Ca2+),且也包括其他的生理作用如神经递质或激素释放的增加或减少。在测定中,“确定功能作用”意思为对一个化合物的测定,其中该化合物增加或降低了间接或直接受T1R家族成员影响的参数,如功能的、物理的和化学的作用。这种功能作用可通过任何本领域技术人员公知的方法进行测量,如光谱学特征的变化(如荧光、吸收、折射率)、流体动力学(如形状)的、色谱的或可溶性性质、膜片钳、电压灵敏染料、全细胞电流、放射性同位素外向通量、诱导型标记、卵母细胞T1R基因表达的变化;组织培养细胞T1R表达;T1R基因的转录激活;配体结合测定;电压、膜电位和电导变化;离子流分析;细胞内第二信使如cAMP、cGMP和肌醇三磷酸(IP3)的变化;细胞内钙水平的变化;神经递质的释放等。T1R基因或蛋白质的“抑制剂”、“激活剂”和“调节子”可互换使用,用于指用体外和体内测定鉴定的对味觉转导的抑制性、激活性或调节性分子,如配体、激动剂、拮抗剂及其同系物和模拟物。抑制剂是如结合、部分或全部地阻断刺激、降低、防止、延迟活化、失活、脱敏或减量调节味觉转导的化合物,如拮抗剂。激活剂是如结合、刺激、增加、开放、活化、促进、增强活化、致敏、或增量调节味觉转导的化合物,如激动剂。调节子包括那些如改变受体与下述物质相互作用的化合物结合激活剂或抑制剂的细胞外蛋白质(如ebnerin和其他疏水载体家族的成员);G蛋白;激酶(如视紫红质激酶和参与受体失活和脱敏中的β肾上腺素能受体激酶的同源物)和也使受体失活和脱敏的视紫红质抑制蛋白。调节子可包括T1R家族成员的遗传修饰形式(如具有改变的活性)以及天然存在和合成的配体、拮抗剂、激动剂、小的化学分子等。对抑制剂和激活剂的这种测定包括(如上所述)如在细胞或细胞膜上表达T1R家族成员、在味觉刺激物如甜味刺激物存在或不存在时应用推定的调节化合物,然后确定对味觉转导的功能作用。将包含用潜在的激活剂、抑制剂或调节子处理的T1R家族成员的样品或测定物与无抑制剂、激活剂或调节子的对照样品进行比较以检查调节的程度。对对照样品(未用调节子处理的)赋于100%的相对T1R活性值。在当T1R活性值相对于对照为约80%,可选择的为50%或25-0%时,对T1R的抑制就实现了。对T1R的激活是在当T1R活性值相对于对照为110%,可选择的为150%,可选择的为500%或1000-3000%时实现的。如在此处所用的术语“纯化的”、“基本纯化的”和“分离的”指不含其他不同化合物的状态,其中本发明的化合物与所述不同化合物在天然状态下是结合的,因而“纯化的”、“基本纯化的”和“分离的”对象按重量包含给定样品的至少0.5%、1%、5%、10%或20%,且最优选地为至少50%或75%的物质。在一个优选实施方案中,这些术语指本发明的化合物按重量包含给定样品的至少95%的物质。如在此处所用的,术语“纯化的”、“基本纯化的”和“分离的”当涉及核酸或蛋白质时也指与在哺乳动物尤其是人体中天然发生的不同的纯化或浓缩状态。任何比天然发生于哺乳动物尤其是人体中的高的纯化或浓缩程度都在“分离的”意思之内,包括(1)从其他结合的结构或化合物中纯化或(2)与在哺乳动物尤其是人体中不是天然结合的结构和化合物结合。在此处描述的核酸或蛋白质或核酸或蛋白质类群可根据本领域技术人员所公知的多种方法和过程来分离,或与其天然时一般不结合的结构或化合物结合。如在此处所用的,术语“分离的”当涉及核酸或多肽时指与天然发生于哺乳动物尤其是人体中的不同的纯化或浓缩状态。任何比天然发生于哺乳动物尤其是人体中的高的纯化或浓缩程度都在此处所用的“分离的”意思之内,包括(1)从其他天然发生的结合的结构或化合物中纯化或(2)与在身体中通常是不结合的结构和化合物结合。在此处描述的核酸或多肽可根据本领域技术人员所公知的多种方法和过程来分离,或与其天然时一般不结合的结构或化合物结合。如在此处所用的,术语“进行扩增”和“扩增”指利用任何适当的扩增方法以生成或探测重组或天然表达的核酸,如在下面详细描述的。例如,本发明提供了在体内或体外扩增(如通过聚合酶链反应,PCR)天然表达的(如基因组或mRNA)或重组(如cDNA)的本发明核酸(如本发明的味觉刺激物结合序列)的方法和试剂(如特定的简并寡核苷酸引物对)。术语“七跨膜受体”意思为一种属于跨膜蛋白质超家族的多肽,该蛋白质具有跨越质膜7次的7个结构域(因而,该7个结构域被称为“跨膜”或“TM”结构域TM I~TMVII)。嗅觉和某些味觉受体的家族各自属于该超家族。七跨膜受体多肽具有相似的典型性一级、二级和三级结构,如在下面进一步详细讨论的。术语“文库”意思为一种不同核酸或多肽分子的混合物制剂,如重组生成的化学感受性,特别是味觉受体配体结合结构域的文库,该文库是用简并引物对核酸的扩增来生成的,或者是整合了扩增的配体结合结构域的载体的分离集合,或者是每个细胞随机用至少一个编码味觉受体的载体转染的细胞的混合物。术语“核酸”或“核酸序列”指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸寡核苷酸。该术语包含含有天然核苷酸的已知类似物的核酸(即寡核苷酸)。该术语也包含具有合成主链的类核酸结构(参见如Oligonucleotides and Analogues,a Practical Approach),ed.F.Eckstein,Oxford Univ.Press(1991);Antisense Strategies,Annalsof the N.y.Academy of Sciences,Vol.600,Eds.Baserga等人(NYAS1992);Milligan J.Med.Chem.361923-1937(1993);AntisenseResearch and Applications(1993,CRC Press),WO 97/03211;WO96/39154;Mata,Toxicol.Appl.Pharmacol.144189-197(1997);Strauss-Soukup,Biochemistry 368692-8698(1997);Samstag,Antisense Nucleic Acid Drug Dev,6153-156(1996))。除非另外指出的,特别的核酸序列也隐含其保守修饰的变体(如简并密码子替代)和互补序列以及明确指出的序列。特定地,简并密码子替代可通过生成如其一个或多个选择的密码子的第三位被混合的碱基和/或脱氧肌苷残基替代的序列而实现(Batzer等人,Nucleic Acid Res.,195081(1991);Ohtsuka等人,J.Biol.Chem.,2602605-2608(1985);Rossolini等人,Mol.Cell.Probes,991-98(1994))。术语核酸是与基因、cDNA、mRNA、寡核苷酸和多核苷酸互换使用的。此处术语“多肽”、“肽”和“蛋白质”是互换使用的,用于指氨基酸残基的多聚体。该术语适用于氨基酸多聚体,其中一种或多种氨基酸残基是相应的天然存在的氨基酸的人工化学模拟物,也适用于天然存在的氨基酸多聚体和非天然存在的氨基酸多聚体。术语“原生质膜转运结构域”或简单的“转运结构域”意思为这样一种多肽结构域,当该结构域整合于多肽编码序列的氨基末端时可高效地“陪伴”或将杂交(“融合”)蛋白质“转运”到细胞质膜。例如,“转运结构域”可源自一种七跨膜受体牛视紫红质受体多肽的氨基末端。然而,可使用源自任何哺乳动物的视紫红质,也可使用其他的转运促进序列。因而,该转运结构域在将七跨膜融合蛋白质转运到质膜中是特别有效的,且包含氨基末端转运结构域的蛋白质(如味觉受体多肽)可比不具有该结构域的蛋白质更有效地被转运到质膜。然而,如果多肽的N-末端结构域有结合活性,则其他转运结构域的使用是优选的。此处所描述的“转运结构域”、“配体结合结构域”和嵌合受体组合物也包括具有基本相当于示范序列的结构和活性的“类似物”或“保守的变体”和“模拟物”(“肽模拟物”)。因而,术语“保守的变体”或“类似物”或“模拟物”指具有修饰的氨基酸序列的多肽,它一般不改变多肽的(保守的变体的)结构和/或活性,如在此处所定义的。这包括氨基酸序列的保守修饰的变体,即对蛋白质活性非关键的那些残基的氨基酸替代、添加或删除,或用具有相似性质(如酸性、碱性、带正或负电荷的、极性或非极性的等)的残基替代氨基酸,从而对即使关键氨基酸的替代也一般不改变其结构和/或活性。更具体而言地,“保守修饰的变体”适用于氨基酸和核酸序列两者。关于特定的核酸序列,保守修饰的变体指那些编码相同的或基本相同的氨基酸序列的核酸,或者在核酸不编码氨基酸序列时指基本相同的序列。因为遗传密码的简并性,大量功能上相同的核酸编码任何给定的蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因而,在由密码子指定的丙氨酸的每一个位置,该密码子可改变为任何所描述的相应密码子而不改变所编码的多肽。这种核酸变异是“沉默变异”,是保守修饰的变异的一种。此处编码多肽的每个核酸序列也描述了核酸每一个可能的沉默变异。技术人员将认识到核酸中的每一个密码子(除一般为甲硫氨酸的唯一密码子的AUG和一般为色氨酸的唯一密码子的TGG外)可进行修饰以产生功能上相同的分子。因此,编码多肽的核酸的每一个沉默变异在每一个描述的序列中都是隐含的。提供功能上相似的氨基酸的保守替代表是本领域所公知的。例如,选择保守替代的示范性指南包括(原始残基之后为示范性的替代)ala/gly或ser、arg/lys、asn/gln或his、asp/glu、cys/ser、gln/asn、gly/asp、gla/ala或pro、his/asn或gln、ile/leu或val、leu/ile或val、lys/arg或gln或glu、met/leu或tyr或ile、phe/met或leu或tyr、ser/thr、thr/ser、trp/tyr、tyr/trp或phe、val/ile或leu。可选择的示范性指南使用如下的6个组,每组包含相互为保守替代的氨基酸1)丙氨酸(A)、丝氨酸(S)、苏氨酸(T);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(I);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);和6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);(参见如Creighton,Proteins,W.H.Freeman and Company(1984);Schultz和Schimer,Principles of Protein Structure,Springer-Vrlag(1979))。本领域的技术人员将理解上述的替代不是唯一可能的保守替代。例如,为了一些目的,可将所有带电荷的氨基酸认作是保守的替代,不论它们是正的还是负的。另外,在编码的序列中改变、添加或删除单个氨基酸或小百分比氨基酸的单独替代、删除或添加也可被认为是“保守修饰的变异”。术语“模拟物”和“肽模拟物”指一种合成的化学化合物,该化合物基本具有多肽的相同的结构和/或功能特征,如本发明的转运结构域、配体结合结构域或嵌合受体。该模拟物可全部由氨基酸的合成的非天然类似物组成,或可为部分的天然肽氨基酸和氨基酸的部分非天然类似物的嵌合分子。该模拟物也可包含任何量的天然氨基酸保守替代,只要这种替代也基本上不改变模拟物的结构和/或活性。与作为保守变体的本发明的多肽一样,常规的实验法将确定一个模拟物是否是在本发明的范围之内的,即其结构和/或功能基本上没有改变。多肽模拟物组合物可含有非天然结构成分的任何组合,该成分一般来自3个结构组a)除天然酰胺键(“肽键”)键合之外的残基键合组;b)替代天然存在的氨基酸残基的非天然残基;或c)诱导二级结构模拟的残基,即诱导或稳定二级结构如β-转角、γ-转角、β-折叠、α-螺旋构象等。多肽在所有或一些其残基是通过化学方法而不是天然的肽键连接时可被赋予模拟物的特征。单独的肽模拟物残基可以通过肽键、其他的化学键或偶联方式来连接,如戊二醛、N-羟基琥珀酰亚胺酯、双功能顺丁烯二酰亚胺、N,N’-二环己基碳二亚胺(DCC)或N,N’-二异丙基碳二亚胺(DIC)。可替代常规的酰胺键(“肽键”)键合的连接基团包括如氧代亚甲基(如-C(=O)-CH2-替代-C(=O)-NH-)、氨基亚甲基(CH2-NH)、亚乙基、链烯(CH=CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4)、噻唑、retroamide、硫代酰胺或酯(参见如Spatola,氨基酸、肽和蛋白质的化学和生物化学(Chemistry andBiochemistry of Amino Acids,Peptides and Proteins),Vol.7,pp267-357,“肽主链修饰(peptide Backbone Modifications)”,MarcellDekker,NY(1983))。多肽也可通过含有替代天然存在的氨基酸残基的所有或一些非天然残基而被赋予模拟物的特征;非天然的残基是在科学和专利文献中充分描述的。“标记”或“可探测的部分”是可通过光谱学、光化学、生物化学、免疫化学或化学方法进行探测的组合物。例如,有用的标记包括32P、荧光染料、电子致密试剂、酶(如通常在ELISA中所用的)、生物素、洋地黄毒苷或半抗原和蛋白质,该半抗原和蛋白质可制备为可探测的,如通过向肽中整合放射性标记的,或者可用于探测与肽特异性反应的抗体。“标记的核酸探针或寡核苷酸”是或者通过连接体或化学键共价地,或者通过离子、范德瓦耳力、静电或氢键非共价地结合到标记上的分子,从而使得探针的存在可通过探测结合到探针上的标记的存在而探测。如在此处所用的“核酸探针或寡核苷酸”定义为能够结合到目标互补序列核酸的核酸,该结合是通过一种或多种类型的化学键形成的,通常是通过互补碱基配对(通常是通过氢键)形成的。如在此处所用的探针可包括天然的(即A、G、C或T)或修饰的碱基(7-脱氮鸟苷、肌苷等)。另外,探针中的碱基可通过除磷酸二酯键之外的键合来连接,只要其不干扰杂交。因而,例如探针可为肽核酸,其中的组成碱基是通过除磷酸二酯键键合之外的肽键连接的。本领域的技术人员可理解依赖于杂交条件的严格性程度,探针可结合到与探针序列缺乏完全互补性的目标序列上。该探针可选择地直接用同位素、发色团、发光团(lumiphores)、色原进行标记,或间接地用如生物素进行标记,其后可在生物素上结合链霉抗生物素蛋白复合物。通过测定探针存在与否,人们可探测选定的序列或子序列存在与否。术语“异源的”当关于核酸的部分使用时表明核酸具有两个或多个子序列,该子序列在天然状态下未发现具有与此相同的相互关系。例如,核酸一般是重组地生产的,具有两个或多个来自不相关基因的序列,该序列被排列以形成新的功能核酸,如来自一个来源的启动子和来自另一个来源的编码区域。相似地,异源的蛋白质表明该蛋白质包含两个或多个子序列,该子序列在天然状态下未发现具有与此相同的相互关系(如融合蛋白质)。“启动子”定义为指导核酸转录的核酸序列排列。如在此处所用的,启动子包括靠近转录起始位点的必需核酸序列,如在聚合酶II型启动子的情况下为TATA元件。启动子也可选择地包括远端的增强子或抑制物元件,它们可位于离开转录起始位点长达几千个碱基对的位置。“组成型的”启动子是在大多数环境和发育条件下起作用的启动子。“诱导型”启动子是在环境或发育调节下起作用的启动子。术语“可操作地连接的”指在核酸表达控制序列(如启动子或转录因子结合位点排列)与第二个核酸序列之间的功能键合,其中的表达控制序列指导相应于第二个序列的核酸的转录。如在此处所用的,“重组”指合成的或在体外操作的多核苷酸(如“重组多核苷酸”),指利用重组多核苷酸以在细胞或其他生物系统中生产基因产物的方法,或者指由重组多核苷酸编码的多肽(“重组蛋白质”)。“重组方法”也包含将具有来自不同来源的多种编码区域或结构域或启动子序列的核酸连接入表达盒或载体中,从而用于如融合蛋白质的诱导型或组成型表达,该融合蛋白质包含本发明的转运结构域和用本发明的引物扩增的核酸序列。短语“选择性(或特异性)杂交”指在严格性的杂交条件下一个分子仅与一个存在于复杂混合物(如总的细胞或文库DNA或RNA)中的特别的核苷酸序列结合、形成双链或杂交。短语“严格性杂交条件”指在其中探针将与其一般在复杂混合物中的目标序列杂交而不与其他序列杂交的条件。严格性条件是序列依赖性的且在不同的环境下是不同的。较长的序列在较高的温度下特异性地杂交。对核酸杂交的详尽指南参见Tijssen,生物化学和分子生物学技术-用核酸探针杂交(Techniques in Biochemistry andMolecular Biology-Hybridisation with Nucleic Probes),“Overview ofprinciples of hybridization and the strategy of nucleic acid assays”(1993)。通常,严格性条件选择为比在限定的离子强度pH中特异性序列的热熔解点(Tm)低约5-10℃。该Tm是在平衡时(由于目标序列过量存在,因而在Tm时,50%的探针在平衡时杂交了)与目标互补的探针的50%与目标序列杂交的温度(在限定的离子强度、pH和核酸浓度时)。严格性条件是那些其中的盐浓度少于约1.0M钠离子,一般在pH 7.0~8.3为0.01~1.0M钠离子浓度(或其他盐),且其温度对于短的探针(如10~50个核苷酸)至少为约30℃而对于长的探针(如大于50个核苷酸)至少为约60℃。严格性条件也可通过添加去稳定剂如甲酰胺而实现。对于选择性或特异性杂交,阳性信号应为背景的至少2倍,可选择地为背景杂交的10倍。示范性严格性杂交条件可为如下的50%甲酰胺、S×SSC和1%SDS,在42℃温育,或者S×SSC和1%SDS,在65℃温育,并于65℃在0.2×SSC和1%SDS中洗涤。这样的杂交和洗涤步骤可进行如1、2、5、10、15、30、60或更多分钟。在严格性条件下没有相互杂交的核酸如果它们编码的多肽基本相关,则仍然是基本相关的。这发生于如当核酸的一个拷贝是用由遗传密码所允许的最大密码子简并性而生成的时。在这种情况下,该核酸一般在中等严格性杂交条件下进行杂交。示范性的“中等严格性杂交条件”包括在40%甲酰胺、1M NaCl、1%SDS的缓冲液中于37℃进行杂交并于45℃在1×SSC中洗涤。这种杂交和洗涤步骤可进行如1、2、5、10、15、30、60或更多分钟。阳性杂交为背景的至少2倍。那些普通技术人员易于认识到替代的杂交和洗涤条件可用于提供相似严格性的条件。“抗体”指包含来自免疫球蛋白基因或其片段的构架区域的多肽,该多肽特异性地结合并识别抗原。公认的免疫球蛋白基因包括κ、λ、α、γ、δ、ε、μ恒定区基因,以及无数的免疫球蛋白可变区基因。轻链划分为κ或者λ。重链划分为γ、μ、α、δ或ε,这依次分别定义了免疫球蛋白种类IgG、IgM、IgA、IgD和IgE。示范性的免疫球蛋白(抗体)结构单元包含四聚体。每个四聚体包含两个相同的多肽链对,每一对具有一个“轻”链(约25kDa)和一个“重”链(约50-70kDa)。每一条链的N-末端定义了约100~110个或更多氨基酸的可变区,该可变区主要负责抗原识别。术语可变的轻链(VL)和可变的重链(VH)分别指这些轻链和重链。“嵌合抗体”是这样一种抗体分子,其中(a)恒定区或其部分被改变、替代或交换了,从而抗原结合位点(可变区)连接到不同的或改变的种类的恒定区、效应物功能和/或种类或赋予了该嵌合抗体新的性质的完全不同的分子上,如酶、毒素、激素、生长因子、药物等;或(b)可变区或其部分进行改变、替代或与具有不同的或改变的抗原特异性的可变区进行交换。“抗-T1R”抗体是特异性地结合由T1R基因、cDNA或子序列编码的多肽的抗体或抗体片段。术语“免疫测定”是用抗体特异性地结合抗原的测定。免疫测定特征在于使用特定抗体的特异结合性质来分离、定位和/或定量抗原。当指蛋白质或肽时,短语“特异性地(或选择性地)结合”抗体或“特异性地(或选择性地)免疫反应”指一种结合反应,该反应确定蛋白质在蛋白质和其他生物制剂的异源群体中的存在。因而,在指定的免疫测定条件下,特异性的抗体对特定蛋白质的结合至少两倍于背景,且基本不以显著的量结合存在于样品中的其他蛋白质。在这种条件下对抗体的特异性结合可能需要一种根据其对特定蛋白质的特异性而选择的抗体。例如,从特定的物种如大鼠、小鼠或人而来的T1R家族成员的多克隆抗体可选择来获得那些多克隆抗体,该多克隆抗体特异性地与T1R多肽或其免疫原性部分进行免疫作用,而不与除T1R多肽的定向同源物或多态变体和等位基因之外的其他蛋白质进行免疫作用。该选择可通过将与T1R分子交叉反应的抗体从其他种类或其他T1R分子中减除而实现。也可选择那些仅识别T1R GPCR家族成员但不识别来自其他家族的GPCRs的抗体。多种免疫测定形式可用于选择与特定蛋白质发生特异性免疫反应的抗体。例如,固相ELISA免疫测定常规用于选择与蛋白质发生特异性免疫反应的抗体(对于可用于确定特定的免疫反应性的免疫测定形式和条件,参见如Harlow & Lane,Antibodies,A Laboratory Manual,(1988))。一般地,特异性或选择性反应将至少为背景信号或噪音的2倍,且更一般地为大于背景的10~100倍。短语“选择性地结合”指如上所述的核酸与另一种核酸“选择性地杂交”的能力,或者如上所述的一种抗体与蛋白质“选择性地(或特异性地)结合”的能力。术语“表达载体”指任何目的在于表达本发明的核酸序列的重组表达系统,该表达是在体外或体内进行的、可以是组成型的或诱导型的、可在任何细胞包括原核的、酵母的、真菌的、植物的、昆虫的或哺乳动物的细胞中进行。该术语包括线状或环状表达系统。该术语包括保持为附加体或整合入宿主细胞基因组中的表达系统。该表达系统可具有自身复制能力或不具有自身复制能力,即在宿主细胞中仅驱动瞬时的表达。该术语包括仅含有重组核酸转录所需要的最少元件的重组表达盒。“宿主细胞”意思指含有表达载体并支持该表达载体复制或表达的细胞。宿主细胞可为原核细胞如大肠杆菌(E.coli)或真核细胞如酵母、昆虫、两栖动物或哺乳动物细胞如CHO、HeLa、HEK-293等,如培养的细胞、外植体和体内的细胞。
A.T1R多肽的分离及表达本发明的T1Rs或其片段或变体的分离及表达可如下面所描述的进行。可将PCR引物用于编码味觉受体配体结合区域的核酸的扩增,且可选择地生成这些核酸的文库。然后单独的表达载体或表达载体文库可用于感染或转染宿主细胞以使得这些核酸或文库进行功能性表达。这些基因和载体可在体外或体内制备及表达。技术人员将认识到改变和控制核酸表达的想要的表型可通过调节本发明的载体内的基因和核酸(如启动子、增强子等)的表达或活性而获得。可以使用任何已知的能增加或降低表达或活性的方法。本发明可与任何本领域公知的方法或规程结合实施,其中的方法和规程是在科学和专利文献中详尽描述的。本发明的核酸序列和其他用于实施本发明的核酸,不论是RNA、cDNA、基因组DNA、载体、病毒还是其杂交体,可从多种来源分离、基因工程改造、扩增和/或重组表达。可以使用任何重组表达系统,该系统除哺乳动物细胞之外包括如细菌、酵母、昆虫或植物系统。可选择地,这些核酸可利用众所周知的化学合成技术进行体外合成,如描述于Carruthers,Cold Spring Harbor Symp.Quant.Biol.47411-418(1982);Adams,Am.Chem.Soc.105661(1983);Belousov,Nucleic Acids Res.253440-3444(1997);Frenkel,Free Radic.Biol.Med.19373-380(1995);Blommers,Biochemistry 337886-7896(1994);Narang,Meth.Enzymol.6890(1979);Brown,Meth.Enzymol.68109(1979);Beaucage,Tetra.Lett.221859(1981);美国专利No.4,458,066。然后双链DNA片段可通过合成互补链并在适当的条件下使链退火获得,或者通过用DNA聚合酶以适当的引物序列来添加互补链。对核酸进行操作的技术如在序列中生成突变、亚克隆、标记探针、测序、杂交等是在科学和专利文献中详尽描述的。参见如Sambrook,ed.,Molecular Cloninga Laboratory manual(2nded.),Vols.1-3,Cold Spring Harbor Laboratory(1989);Current Protocolsin Molecular Biology,Ausubel,ed.John Wiley & Sons,Inc.,New York(1997);生物化学和分子生物学实验室技术用核酸探针进行杂交(Laboratory Techniques in Biochemistry and Molecular BiologyHybridization With Nucleic Acid Probes),部分I,理论和核酸制剂(Theory and Nucleic Acid Preparation),Tijssen,ed.Elsevier,N.Y.(1993)。核酸、载体、病毒壳体、多肽等可通过大量本领域技术人员所公知的一般方法来分析和量化。这包括如分析生物化学技术如NMR、分光光度法、放射显影法、电泳、毛细管电泳、高效液相色谱(HPLC)、薄层色谱(TLC)和超扩散(hyperdiffusion)色谱,多种免疫学方法如流体或凝胶沉淀素反应、免疫扩散、免疫电泳、放射免疫测定(RIAs)、酶联免疫吸附测定(ELISAs)、免疫荧光测定,DNA印迹分析,RNA印迹分析,斑点印迹分析,凝胶电泳(如SDS-PAGE),RT-PCT,定量PCR,其他核酸或目标或信号扩增方法,放射性标记,闪烁计数和亲和层析。可将寡核苷酸引物用于扩增编码味觉受体配体结合区域的核酸片段。此处所描述的核酸也可用扩增技术进行克隆或定量测量。扩增方法也是本领域所公知的,且包括如聚合酶链反应PCR(PCRProtocols,a Guide to Methods and Applications,ed.Innis.AcademicPress,N.Y.(1990)和PCR Strategies,ed.Innis.Academic Press,Inc.,N.Y.(1995));连接酶链反应(LCR)(参见如Wu,Genomics 4560(1989);Landegren,Science 2411077(1988);Barringer,Gene 89117(1990));转录扩增(参见如Kwoh,Proc.Natl.Acad.Sci.USA 861173(1989));和自动维持序列扩增(参见如Guatelli,Proc.Natl.Acad.Sci.USA 871874(1990));Qβ复制酶扩增(参见如Smith,J.Clin.Microbiol.351477-1491(1997));自动Qβ复制酶扩增测定(参见如Burg,Mol.Cell.Probes 10257-271(1996))和其他RNA聚合酶介导的技术(如NASBA,Cangene,Mississauga,Ontario);也参见Berger,Methods Enzymol.152307-316(1987);Sambrook;Ausubel;美国专利Nos.4,683,195和4,683,202;Sooknanan,Biotechnology 13563-564(1995)。可将引物设计为保留“供体”7-膜受体的原始序列。可选择地,该引物可编码作为保守替代的(如用疏水残基替代疏水残基,参见上述)或功能性良性替代的(如不防止质膜插入的、导致肽酶的切割、导致受体异常折叠等)氨基酸残基。一旦扩增后,可将该核酸单独地或者作为文库根据本领域公知的方法克隆,如果需要,可以用常规的分子生物学方法克隆入多种载体中的任何一个;体外克隆扩增的核酸的方法描述于美国专利No.5,426,039。引物对可被设计为选择性地扩增T1R家族成员的配体结合区的。这些区域对不同的配体或味觉刺激物可有变化。因而,作为一个味觉刺激物的最小结合区域对于第二个味觉刺激物可能太小了。因此,可能要扩增包含不同细胞外结构域结构的不同大小的配体结合区域。设计简并引物对的范例是本领域所公知的。例如,一致-简并杂交寡核苷酸引物(Consensus-Degenerate hybridOligonucleotide Primer)(CODEHOP)策略计算机程序是易从http//blocks.fhcrc.org/codehop.html得到的,且直接从BlockMaker多重序列比对站点连接以进行开始于一套相关蛋白质序列的杂交引物预测,如已知的味觉受体配体结合区域(参见如Rose,Nucleic AcidsRes.261628-1635(1998);Singh,Biotechniques 24318-319(1998))。合成寡核苷酸引物对的方法是本领域所公知的。可使用“天然”的碱基对或合成的碱基对。例如,人工核碱基(nucleobases)的应用提供了通用的方法以处理引物序列和生成更复杂的扩增产物混合物。多种人工核碱基的家族能够通过内部键旋转而实现多重氢键定向以提供简并分子识别的方法。将这些类似物整合入PCR引物的单一位置使得能生成扩增产物的复杂文库。参见如Hoops,Nucleic AcidsRes.254866-4871(1997)。非极性分子也可用于模拟天然DNA碱基的形状。对腺嘌呤的非氢键形状模拟可对胸腺嘧啶的非极性形状模拟进行有效和选择性的复制(参见如Morales,Nat.Struct.Biol.5950-954(1998))。例如,2个简并碱基可为嘧啶碱基6H,8H-3,4-氢嘧啶[4,5-c][1,2]嗪-7-酮或嘌呤碱基N6-甲氧基-2,6-二氨基嘌呤(参见如Hill,Proc.Natl.Acad.Sci.USA 954258-4263(1998))。本发明的示范性简并引物包含核碱基类似物5’-二甲氧基三苯甲基-N-苯甲酰-2’-脱氧胞嘧啶核苷,3’-[(2-氰乙基)-(N,N-二异丙基)]-亚磷酰胺(序列中的术语“P”,见上述)。该嘧啶类似物与嘌呤包括A和G残基形成氢键。与在此处所公开的味觉受体基本相同的多态变体、等位基因和种间同系物可用上述的核酸探针进行分离。可选择地,可将表达文库用于克隆T1R多肽和其多态变体、等位基因和种间同系物,这是通过用抗T1R多肽的抗血清或纯化的抗体免疫探测表达的同系物而完成的,其中的抗血清或纯化的抗体也识别和选择性地结合T1R同系物。编码味觉受体配体结合区域的核酸可通过用简并引物对扩增(如PCR)适当的核酸序列而生成。扩增的核酸可为来自任何细胞或组织的基因组DNA或源自味觉受体表达细胞的mRNA或cDNA。在一个实施方案中,可构建融合于转运基因的、包含核酸的杂交蛋白质编码序列,该核酸编码T1Rs。也提供的是包含其他化学感受性受体家族特别是味觉受体的味觉刺激物结合结构域和转运基元的杂交T1Rs。这些核酸序列可被可操作地连接到转录或翻译控制序列上,如转录和翻译起始序列、启动子和增强子、转录和翻译终止子、聚腺苷酸化序列和其他对于将DNA转录为RNA有用的序列。在重组表达盒、载体和转基因的构建中,可采用启动子片段以指导想要的核酸在所有想要的细胞或组织中表达。在另一个实施方案中,融合蛋白质可包括C-末端或N-末端转运序列。进一步地,融合蛋白质可包含额外的元件以进行如蛋白质探测、纯化或其他应用。探测和纯化促进结构域包括如金属螯合肽如多组氨酸序列、组氨酸-色氨酸组件或其他允许在固定的金属上纯化的结构域;麦芽糖结合蛋白质;允许在固定的免疫球蛋白上纯化的蛋白质A结构域;或用于FLAGS延伸/亲和纯化系统的结构域(ImmunexCorp,Seattle WA)。在转运结构域(为了有效的质膜表达)和新翻译多肽的剩余部分之间包含可切割的连接体序列如因子Xa(参见如Ottavi,Biochimie 80289-293(1998))、枯草杆菌蛋白酶识别基元(参见如Polyak,Protein Eng.10615-619(1997))、肠激酶(Invitrogen,SanDiego,CA)等对于促进纯化是有用的。例如,一个构建体可包括一个核酸序列编码的连接到6个组氨酸残基上的多肽,随后是硫氧还蛋白、肠激酶切割位点(参见如Williams,Biochemistry 341787-1797(1995))和C-末端转运结构域。组氨酸残基促进探测和纯化,而肠激酶切割位点提供了将想要的蛋白质从剩余的融合蛋白质中纯化的方法。涉及编码融合蛋白质的载体和融合蛋白质应用的技术是在科学和专利文献中详尽描述的,参见如Kroll,DNA Cell.Biol.12441-53(1993)。包含配体结合结构域编码序列的单个表达载体或表达载体文库可通过多种常规的技术而引入到细胞的基因组或细胞质或细胞核中并表达,该技术在科学和专利文献中有详尽描述。参见如Roberts,Nature 328731(1987);上述的Berger;Schneider,Protein Expr.Purif.643510(1995);Sambrook;Tijssen;Ausubel。来自生物学试剂和实验设备的生产商的产品信息也提供了关于已知生物学方法的信息。该载体可从天然来源分离、从如ATCC或GenBank文库的来源获得或通过合成或重组的方法制备。核酸可在细胞内稳定或瞬时表达的表达盒、载体或病毒中表达(如附加体表达系统)。可将选择性标记整合到表达盒和载体中以赋予转化的细胞和序列选择性的表型。例如,选择性标记可编码附加体的维持和复制,从而整合入宿主基因组不是必需的。例如,标记可编码抗生素抗性(如氯霉素、卡那霉素、G418、博来霉素、潮霉素)或除草剂抗性(如氯磺隆(chlorosulfuron)或Basta)以允许对那些用想要的DNA转化了的细胞进行选择(参见如Blondelet-Rouault,Gene 190315-317(1997);Aubrecht,J.Pharmacol.Exp.Ther.281992-997(1997))。因为赋予对物质如新霉素或潮霉素抗性的选择性标记基因仅能用于组织培养中,所以化学抗性基因也用作体外或体内的选择性标记。嵌合的核酸序列可编码任何七跨膜多肽中的T1R配体结合结构域。因为七跨膜受体多肽具有相似的一级序列以及二级和三级结构,所以其结构上的结构域(如细胞外结构域、TM结构域、胞质结构域等)易于通过序列分析而鉴定。例如,同源性模拟、傅立叶分析和螺旋周期性探测可鉴定和表征七跨膜受体序列的7个结构域。快速傅立叶变换(FFT)算法可用于估计主要的周期,该周期表征了分析的序列的疏水性和变异性。周期性探测增强和α螺旋周期性指数可通过如Donnelly,Protein Sci.255-70(1993)所述的来进行。其他比对和模拟算法是本领域众所周知的,参见如Peitsh,ReceptorsChannels 4161-164(1996);Kyte & Doolittle,J.Md.Bio.157105-132(1982);Cronet,Protein Eng.659-64(1993)(同源性和“发现模拟”);http//bioinfo.weizmann.ac.il/。本发明不仅包括具有特定的核酸和氨基酸序列的DNA和蛋白质,也包括DNA片段特别是如40、60、80、100、150、200或250个或更多核苷酸的片段,以及如10、20、30、50、70、100或150个或更多氨基酸的蛋白质片段。可选择地,该核酸序列可编码抗原性多肽,该多肽能够结合抗T1R家族成员的抗体。进一步地,本发明的蛋白质片段可选择地为抗原性片段,该片段能够结合抗T1R家族成员的抗体。也涉及的是一种嵌合蛋白质,该蛋白质包含此处所描述的一个或至少一个T1R多肽的至少10、20、30、50、70、100或150个或更多氨基酸,这些氨基酸是与代表另一种GPCR的整体或部分的额外氨基酸相连结的,其中GPCR优选地为七跨膜家族的一个成员。这些嵌合体可从本发明的受体和另一种GPCR来制备,或可通过组合两种或多种本发明的受体而制备。在一个实施方案中,嵌合体的一个部分相应于或源自本发明的T1R多肽的细胞外结构域。在另一个实施方案中,嵌合体的一个部分相应于或源自此处所描述的T1R多肽的细胞外结构域和一个或多个跨膜结构域,且剩余的部分可来自另一种GPCR。嵌合受体是本领域众所周知的,且创造该受体的技术和用于在其中整合的G蛋白-偶联受体的结构域或片段的选择和边界也是公知的。因而,本领域技术人员的这些知识可易于用于创造这种嵌合受体。这种嵌合受体的用途可提供如一种此处特定地公开的受体的味觉选择特征,该特征与另一种受体(如在现有技术的测定系统中所用的公知的受体)的信号转导特征偶联。例如,可将一个结构域共价地连接到异源蛋白质上,该结构域可以是例如配体结合结构域、细胞外结构域、跨膜结构域、跨膜结构域、胞质结构域、N-末端结构域、C-末端结构域或其任意组合。例如,T1R细胞外结构域可连接到异源GPCR跨膜结构域上,或异源的GPCR胞外结构域可连接到T1R跨膜结构域上。其他选择的异源蛋白质可包括如绿色荧光蛋白、β-gal、谷氨酸(glutamtate)受体和视紫红质前序列。也在本发明范围之内的是表达本发明的T1Rs、片段或变体的宿主细胞。为了获得克隆的基因或核酸的高水平表达,如编码本发明的T1Rs、片段或变体的cDNA,技术人员一般将目标核酸序列亚克隆入表达载体中,该表达载体含有指导转录的强启动子、转录/翻译终止子和(如果对于编码蛋白质的核酸时)转录起始的核糖体结合位点。适当的细菌启动子是本领域公知的并描述于如Sambrook等人。然而,细菌和真核表达系统均可使用。可使用任何众所周知的将外源核苷酸序列引入宿主细胞的程序。这些包括磷酸钙转染、1,5-二甲基-1,5-二氮十一亚甲基聚甲溴化物、原生质体融合、电穿孔、脂质体、微注射、原生质载体、病毒载体和任何其他众所周知的将克隆的基因组DNA、cDNA、合成的DNA或其他外源遗传材料引入宿主细胞的方法(参见如Sambrook等人)。仅仅需要所用的特殊的基因工程程序能够成功地将至少一个核酸分子引入到能够表达目标T1R、片段或变体的宿主细胞中。在表达载体引入到细胞中后,将转染的细胞培养于有利于目标受体、片段或变体表达的条件下,然后将它们用标准技术从培养物中回收。这种技术的例子是本领域众所周知的。参见如WO00/06593,它是以与本公开内容一致的方式引用作为参考的。
B.T1R多肽的探测除了用核酸杂交技术探测T1R基因和基因表达之外,人们也可用免疫测定来探测T1Rs,如鉴定味觉受体细胞和T1R家族成员的变体。免疫测定也可用于定性地或定量地分析T1Rs。对可采用的技术的一般综述可发现于Harlow & Lane,AntibodiesA LaboratoryManual(1988)。
1.针对T1R家族成员的抗体生产特异性地与T1R家族成员反应的多克隆和单克隆抗体的方法是本领域的技术人员公知的(参见如Coligan,CurrentProtocols in Immunology(1991);上述的Harlow & Lane;Goding,Monoclonal AntibodiesPrinciples and Practice)(2d ed.1986);和Kohler & Milstein,Nature,256495-497(1975))。这种技术包括通过从噬菌体或类似载体中的重组抗体文库中选择抗体的抗体制备,以及通过对兔或小鼠进行免疫而制备多克隆和单克隆抗体(参见如Huse等人,Science,2461275-1281(1989);Ward等人,Nature,341544-546(1989))。大量包含T1R的免疫原可用于生产与T1R家族成员特异性反应的抗体。例如,重组T1R多肽或其抗原性片段可如此处所描述地进行分离。适当的抗原性区域包括如用于鉴定T1R家族成员的一致序列。重组蛋白质可如上所述表达于真核或原核细胞中,并如在上文一般描述的进行纯化。重组蛋白质是用于生产单克隆或多克隆抗体的优选免疫原。可选择地,源自此处所公开的序列并与载体蛋白质缀合的合成肽可用作免疫原。天然存在的蛋白质也可以以纯的或不纯的形式使用。然后将该产物注射入能够生产抗体的动物中。可生成单克隆或多克隆抗体以随后用于免疫测定以测量蛋白质。生产多克隆抗体的方法是本领域技术人员所公知的。例如,将小鼠(如BALB/C小鼠)或兔的近交品系用标准的佐剂如弗氏佐剂和标准的免疫接种规程用蛋白质进行免疫接种。动物对免疫原制剂的免疫反应是通过采取血样和确定对T1R的反应性效价而监控的。当获得了适当高效价的对免疫原的抗体时,从动物中收集血液并制备抗血清。如果需要,可对抗血清进行进一步的分级分离以富集对蛋白质起反应的抗体(参见上述的Harlow & Lane)。单克隆抗体可通过多种本领域技术人员所熟悉的技术获得。简要地,通常可通过与骨髓瘤细胞融合而使来自用想要的抗原免疫接种的动物的脾细胞永生化(参见Kohler & Milstein,Eur.J.Immunol.,6511-519(1976))。可选择的永生化方法包括用EB病毒、癌基因或反转录病毒进行转化或用其他本领域众所周知的方法。将从单一永生化细胞发生的集落进行筛选以生产具有想要的对抗原的特异性和亲和力的抗体,且由这种细胞生产的单克隆抗体的产量可通过多种途径来增强,包括注射入脊椎动物宿主的腹膜腔内。可选择地,人们可通过根据一般规程筛选来自人B细胞的DNA文库而分离编码单克隆抗体或其结合片段的DNA序列,该规程概述于Huse等人,Science,2461275-1281(1989)。在一个免疫测定中,如免疫原固定于固体基质上的固相免疫测定中,收集单克隆抗体和多克隆血清并测定其对免疫原蛋白质的效价。一般地,将效价为104或更高的多克隆抗血清选择出来,并用竞争性结合免疫测定来检验其对非-T1R多肽,或者甚至其他T1R家族成员或来自其他生物的其他相关蛋白质的交叉反应性。特异性的多克隆抗血清和单克隆抗体通常以至少约0.1mM的Kd结合,更通常地为至少1pM,可选择地为至少约0.1p.M或更好,更通常地为0.01pM或更好。一旦T1R家族成员特异性抗体为可获得的,那么单独的T1R蛋白质和蛋白质片段可通过多种免疫测定方法进行探测。对于免疫学和免疫测定程序的综述,参见Basic and Clinical Immunology(Stites & Terr eds.,7thed.1991)。此外,本发明的免疫测定可以以任何几个形式来进行,这在Enzyme Immunoassay(Maggio,ed.,1980)和上述的Harlow & Lane中有详尽的综述。
2.免疫学结合测定T1R蛋白质、片段和变体可用大量公认的免疫学结合测定中的任何一个进行探测和/或定量(参见如美国专利4,366,241;4,376,110;4,517,288和4,837,168)。对于一般的免疫测定的综述,也参见Methods in Cell BiologyAntibodies in Cell Biology,卷37(Asai,ed.1993);Basic and Clinical Immunology(Stites & Terr eds.,7thed.1991)。免疫学结合测定(或免疫测定)一般使用特异性结合到选择的蛋白质或抗原(在这个情况下为T1R家族成员或其抗原性子序列)上的抗体。抗体(如抗-T1R)可通过大量本领域技术人员众所周知且如上所述的方法的任何一种来生产。免疫测定经常也用标记试剂以特异性地结合并标记由抗体和抗原形成的复合物。该标记试剂自身可为包含抗体/抗原复合物的部分的一种。因而,标记试剂可为标记的T1R多肽或标记的抗-T1R抗体。可选择地,该标记试剂可为第三种特异性地结合到抗体/T1R复合物的部分如二级抗体(二级抗体一般是对一级抗体从中获得的物种的抗体具有特异性的)。其他能够特异性结合免疫球蛋白恒定区的蛋白质如蛋白质A或蛋白质G也可用作标记试剂。这些蛋白质显示与来自多种物种的免疫球蛋白恒定区的强的非免疫原性反应性(参见如Kronval等人,J.Immunol.1111401-1406(1973);Akerstrom等人,J.Immunol.1352589-2542(1985))。该标记试剂可用可探测的部分如生物素进行修饰,其他的分子如链霉抗生物素蛋白可结合到该部分上。多种可探测的部分是本领域技术人员众所周知的。在整个测定过程中,在每个试剂组合之后均需要温育和/或洗涤步骤。温育步骤可为5秒钟~几小时,可选择地为约5分钟~约24小时。然而,温育时间将依赖于测定形式、抗原、溶液体积、浓度等。通常,该测定将在环境温度进行,尽管它们可在如10℃~40℃的温度范围内进行。
a.非竞争性测定形式在样品中探测T1R多肽的免疫测定可为竞争性的或非竞争性的。非竞争性的免疫测定是其中抗原的量是直接测量的测定。如在一个优选的“三明治(sandwich)”测定中,抗-T1R抗体可直接结合到固体基质上,在其上它们得以固定。这些固定的抗体然后捕获存在于检验样品中的T1R多肽。这样固定的T1R多肽然后由标记试剂如带有标记的二级T1R抗体进行结合。可选择地,二级抗体可缺乏标记,但它将由标记的三级抗体进行结合,该三级抗体是对二级抗体从中获得的物种的抗体具有特异性的。二级或三级抗体一般可用可探测的部分如生物素进行修饰,其他的分子如链霉抗生物素蛋白可特异性地结合到该部分上以提供可探测的部分。
b.竞争性测定形式在竞争性测定中,存在于样品中的T1R多肽的量是通过测量被置换的已知的添加的(外源的)T1R多肽的量而间接测量的,其中的多肽是由存在于样品中的未知T1R多肽从抗-T1R抗体中置换(竞争掉)的。在一个竞争性测定中,将已知量的T1R多肽添加入样品中,然后使样品与特异性结合T1R的抗体接触。结合到抗体的外源T1R多肽的量与存在于样品中的T1R多肽的浓度成反比。在一个特别优选的实施方案中,该抗体是固定到固体基质上的。结合到抗体上的T1R多肽的量可通过测量存在于T1R/抗体复合物中的T1R多肽的量而确定,或者可选择地通过测量剩余的未复合的蛋白质的量而确定。T1R多肽的量可通过提供标记的T1R分子而探测。半抗原抑制测定是另一个优选的竞争性测定。在该测定中,已知的多肽是固定于固体基质上的。将抗-T1R抗体的已知量添加到样品中,然后使样品与固定的T1R接触。结合到已知固定的T1R多肽的抗-T1R抗体的量与存在于样品中的T1R多肽的量成反比。再次地,固定的抗体的量可通过探测抗体的固定比例或剩余在溶液中的抗体的比例来探测。该探测在抗体进行了标记时可为直接的,或者通过随后添加标记的部分而为间接的,该部分特异性地结合上述的抗体。
c.交叉反应性的确定竞争性结合形式的免疫测定也可用于交叉反应性的确定。例如,至少部分地由此处所公开的核酸序列编码的蛋白质可固定于固体基质上。将与抗血清对固定的抗原的结合进行竞争的蛋白质(如T1R多肽和同系物)添加到测定体系中。该添加的蛋白质与抗血清对固定的抗原的结合进行竞争的能力是与由此处所公开的核酸序列编码的T1R多肽与其自身竞争的能力进行比较的。利用标准的计算对上述蛋白质的交叉反应性百分数进行了计算。将那些与上面列出的每一种添加的蛋白质具有少于10%的交叉反应性的抗血清选择并收集。交叉反应的抗体是可选择地通过用添加的慎重考虑的蛋白质(如远缘相关的同系物)的免疫吸附从收集的抗血清中去除的。另外,包含代表保守基元的氨基酸序列的肽可用于交叉反应性的确定,其中的保守基元用于鉴定T1R家族的成员。然后将免疫吸附和收集的抗血清用于上述的竞争性结合免疫测定中以将第二个蛋白质与免疫原蛋白质(即由此处所公开的核酸序列所编码的T1R多肽)进行比较,其中的第二种蛋白质被认为可能是T1R家族成员的等位基因或多态变体。为了进行该比较,将两种蛋白质各自在广泛的浓度范围内进行测定,且确定了能抑制抗血清与固定的蛋白质50%的结合所需的每种蛋白质的量。如果抑制50%的结合所需的第二种蛋白质的量比抑制50%的结合所需的由此处公开的核酸序列编码的蛋白质的量少10倍,那么即认为该第二种蛋白质特异性地结合抗T1R免疫原的多克隆抗体。抗T1R保守基元的抗体也可用于制备仅仅特异性地结合T1R家族的GPCRs而不结合来自其他家族的GPCRs的抗体。特异性结合T1R家族的特定成员的多克隆抗体可通过用其他的T1R家族成员减除交叉反应性抗体而制备。物种特异性多克隆抗体可用相似的途径制备。例如,对人T1R1特异性的抗体可通过减除那些与定向同源序列如大鼠T1R1或小鼠T1R1交叉反应的抗体而制备。
d.其他测定形式蛋白质印迹(免疫印迹)分析用于探测和量化T1R多肽在样品中的存在。该技术一般包含通过凝胶电泳在分子量基础上分离样品蛋白质、将分离的蛋白质转移到适当的固体基质上(如硝酸纤维素滤膜、尼龙滤膜或衍生的尼龙滤膜)及将样品与特异性结合T1R多肽的抗体进行温育。抗-T1R多肽抗体特异性地结合固体基质上的T1R多肽。这些抗体可直接标记或可选择地随后用标记的抗体(如标记的绵羊抗小鼠抗体)进行探测,该标记的抗体特异性地结合抗-T1R抗体。其他的测定形式包括脂质体免疫测定(LIA),该测定使用设计为结合特定分子(如抗体)和释放所包装的试剂或标记的脂质体。然后释放的化学药剂可根据标准的技术而探测(参见Monroe等人,Amer.Clin.Prod.Rev.534-41(1986))。
e.非特异性结合的减少本领域的技术人员将理解经常期望将免疫测定中的非特异性结合减到最小。特别地,在测定包含固定于固体基质上的抗原或抗体时,即期望对底物非特异性结合的量减到最小。减小这种非特异性结合的方法是本领域技术人员众所周知的。一般地,该技术包含用蛋白质组合物包被底物。具体而言地,蛋白质组合物如牛血清白蛋白(BSA)、脱脂奶粉和明胶是广泛使用的,其中奶粉是最优选的。
f.标记在测定中所用的特殊的标记或可探测的基团不是本发明的关键方面,只要它不显著地干扰测定中所用的抗体的特异性结合。可探测的基团可为任何具有可探测的物理或化学性质的材料。这种可探测的标记已经在免疫测定领域得到充分发展,并且通常这种方法中的大多数标记都可应用于本发明。因而,标记是任何用光谱学、光化学、生物化学、免疫化学、电学、光学或化学方法可探测的组合物。本发明中有用的标记包括磁珠(如DYNABEADSTM)、荧光染料(如异硫氰酸荧光素、德克萨斯红、罗丹明等)、放射性标记(如3H、1251、3sS、14C或32P)、酶(如辣根过氧化物酶、碱性磷酸酶和其他通常用于ELISA的)和比色法标记如胶体金或有色玻璃或塑料珠(如聚苯乙烯、聚丙烯、胶乳等)。该标记可根据本领域众所周知的方法直接或间接与测定的想要成分偶联。如上所述,可使用多种标记,对标记的选择依赖于需要的灵敏度、与化合物缀合的容易程度、稳定性需要、可获得的仪器和处理规定。非放射性的标记经常通过间接方法附着。通常,配体分子(如生物素)是共价结合到分子上的。该配体然后结合到另一个分子(如链霉抗生物素蛋白),该分子本身是可探测的,或者是共价地结合到信号系统上的,如可探测的酶、荧光化合物或化学发光化合物上。该配体及其目标可用于与识别T1R多肽的抗体或识别抗-T1R的二级抗体的任何组合。该分子也可直接缀合到信号生成化合物上,如通过与酶或荧光团缀合。作为标记的目标酶主要为水解酶,具体而言地为磷酸酶、酯酶和糖苷酶,或者氧化酶(oxidotase),具体而言地为过氧化物酶。荧光化合物包括荧光蛋白及其衍生物、罗丹明及其衍生物、丹磺酰、伞形酮等。化学发光化合物包括萤光素和2,3-二氢二氮杂萘二酮类(2,3-dihydrophthalazinediones),如鲁米诺。对于可用的多种标记或信号生产系统,参见美国专利No.4,391,904。探测标记的方法是本领域技术人员众所周知的。因而,例如当标记是放射性标记时,探测手段包括闪烁计数器或放射自显影术中的照相胶卷。当标记是荧光标记时,它可通过用适当波长的光激发荧光染料并探测结果所得的荧光。该荧光可用肉眼探测、用照相胶卷的方法探测、用电子探测器如电荷偶联装置(CCDs)或光电倍增管等进行探测。相似地,酶标记可通过提供适当的酶底物并探测结果所得的反应产物而探测。最后简单的比色标记可简单地通过观察与标记有关的颜色而探测。因而,在多种量油计(dipstick)测定中,缀合的金经常显示粉色,而多种缀合的珠子显示珠子的颜色。一些测定形式不需要使用标记的成分。例如,凝集测定可用于探测目标抗体的存在。在这种情况下,抗原包被的颗粒被包含目标抗体的样品凝集。在这种形式中,没有一种成分需要进行标记,且目标抗体的存在是通过简单的肉眼观测探测的。
C.调节子的探测在下面描述了在体外或体内用于确定检验的化合物是否特异性地结合本发明的化学感受性受体的组合物和方法。可对细胞生理学的许多方面进行监控以估计配体结合到本发明的T1R多肽的作用。这些测定可在表达化学感受性受体的完整细胞上、在透化的细胞上或在由标准方法生产的膜组分上进行。味觉受体结合味觉刺激物并起始化学刺激物向电信号的转导。活化的或抑制的G蛋白将改变目标酶、通道和其他效应蛋白质的性质。一些例子为视觉系统中的转导素对cGMP磷酸二酯酶的活化、刺激性G蛋白对腺苷酸环化酶的活化、Gq和其他同类G蛋白对磷脂酶C的活化及Gi和其他G蛋白对各种通道的调节。也可检查下游的结果如由磷脂酶C生成二酰甘油和IP3及接着IP3对钙的动员。测定中的T1R蛋白质或多肽一般选自具有SEQ ID NOS4、10、12、14、17、21或其片段或保守修饰的变体的序列的多肽。可选择地,该片段和变体可为结合到抗-T1R抗体上的抗原性片段和变体。可选择地,测定中的T1R蛋白质或多肽可源自真核生物宿主细胞,并可包括与SEQ ID NOS4、10、12、14、17、21或其片段或保守修饰的变体具有氨基酸序列一致性的氨基酸子序列。通常,该氨基酸序列一致性将为至少35~50%,或可选择地为75%、85%、90%、95%、96%、97%、98%或99%。可选择地,测定中的T1R蛋白质或多肽可包含T1R蛋白质的一个结构域,如细胞外结构域、跨膜区域、跨膜结构域、胞质结构域、配体结合结构域等。进一步地,如上所述,该T1R蛋白质或其结构域可共价地连接到异源蛋白质上以创建用于此处所描述的测定中的嵌合蛋白质。T1R受体活性的调节子是用上述重组的或天然存在的T1R蛋白质或多肽进行检验的。可将重组的或者天然存在的T1R蛋白质分离,然后在细胞中表达、在源自细胞的膜中表达、在组织或动物中表达。例如,可使用舌切片、从舌解离的细胞、转化的细胞或膜。该调节可利用此处所描述的体外或体内测定的任何一种来检验。
1.体外结合测定味觉转导也可利用本发明的T1R多肽以可溶性的或固体状态的反应进行检查。在一个特殊的实施方案中,T1R配体结合结构域可在体外用于可溶性的或固体状态的反应以测定配体的结合。例如,预测T1R的N-末端结构域参与配体的结合。更具体而言地,T1R属于GPCR亚家族,该亚家族特征在于具有大的约600个氨基酸的细胞外N-末端区段。认为这些N-末端区段至少部分地形成配体结合结构域,因此可用于生物化学测定中以鉴定T1R激动剂和拮抗剂。该配体结合结构域也可含有另外的细胞外结构域部分,如跨膜结构域的细胞外环。对其他与T1Rs相关的GPCRs,如metabotropic谷氨酸受体已采用了相似的测定(参见如Han和Hampson,J.Biol.Chem.27410008-10013(1999))。这些测定可包含置换放射性或荧光标记的配体、测量内部荧光的变化或蛋白水解易感性的变化等。结合到本发明的T1R多肽的配体可在溶液中、在(可选择地附着到固相上)双层膜中、在脂单层膜或小泡中进行检验。调节子的结合可用如光谱学特征(如荧光、吸收、折射率)、流体动力学(如形状)、色谱或溶解性性质的变化来检验。本发明优选的结合测定是使用重组的可溶性N-末端T1R结构域的生物化学结合测定。也可检查受体-G蛋白的相互作用。例如,可检查G蛋白与受体的结合,或它从受体的释放。更具体而言地,在不存在GTP时,激活剂可导致G蛋白(所有三个亚基)与受体的紧密复合物的形成。该复合物可用上述的多种途径进行探测。可对这种测定进行修饰以搜索抑制剂,如通过在不存在GTP时向受体和G蛋白质添加一种激活剂,其中的受体和G蛋白形成紧密的复合物,然后通过查看受体-G蛋白复合物的解离来筛选抑制剂。在GTP存在时,G蛋白的α亚基从其他2个G蛋白亚基的释放充当激活的判别准则。活化的或抑制的G蛋白将反过来改变目标酶、通道和其他效应蛋白质的性质。在本发明的另一个实施方案中,可以采用GTPγS测定。如上所述,在GPCR活化后,G蛋白复合物的Gα亚基即受到刺激以将结合的GDP交换为GTP。对G蛋白交换活性的配体介导的刺激可在生物化学测定中进行测量,该测定测量在推定的配体存在时添加的放射性标记的GTPγ35S与G蛋白的结合。一般地,含有目标化学感受性受体的膜是与G蛋白复合物混合的。将潜在的抑制剂和/或激活剂和GTPγS添加入测定体系中,并测量GTPγS与G蛋白的结合。该结合可通过液体闪烁计数或任何其他本领域公知的方法来测量,包括闪烁亲近测定法(SPA)。在其他的测定形式中,可使用荧光标记的GTPγS。
2.荧光偏振测定在另一个实施方案中,基于荧光偏振(“FP”)的测定可用于探测和监控配体的结合。荧光偏振是一种通用的实验室技术,该技术用于测量平衡结合、核酸杂交和酶活性。荧光偏振测定由于它不需要分离步骤如离心、过滤、色谱、沉淀或电泳而是均一的。这些测定是实时地直接在溶液中进行的,且不需要固定相。偏振值可重复地并在添加试剂之后进行测量,这是因为偏振的测定是快速的且不破坏样品。通常,该技术可用于测量低的皮摩尔至微摩尔水平的荧光团偏振值。本部分描述了荧光偏振怎样以简单和定量的途径测量配体与本发明的T1R多肽的结合。当将荧光标记的分子用平面偏振光进行激发时,它释放具有与其摩尔旋光度成反比的偏振程度的光。大的荧光标记分子在激发状态(在荧光蛋白的情况下为4纳秒)保持相对的静止,且光的偏振在激发和发射之间保持相对的恒定。小的荧光标记分子在激发状态快速旋转,且偏振在激发和发射之间显著地改变。因此,小分子具有低的偏振值而大分子具有高的偏振值。例如,单链荧光蛋白标记的寡核苷酸具有相对低的偏振值,但当它与互补链杂交之后,则具有较高的偏振值。当用FP来探测和监控味觉刺激物的结合时(该结合可激活或抑制本发明的化学感受性受体),可以使用荧光标记的味觉刺激物或自发荧光的味觉刺激物。荧光偏振(P)定义为P=IntΠ-Int⊥IntΠ+Int⊥]]>其中∏是与激发光平面平行的发射光的强度,且上是与激发光平面垂直的发射光的强度。作为光强度比例的P是一个无量纲的数。例如,Beacon和Beacon 2000TM系统可连同这些测定使用。这种系统一般以毫偏振单位来表示偏振(1偏振单位=1000mP单位)。摩尔旋光度和大小的关系由Perrin方程描述,读者可参考Jolley,M.E.(1991)在杂志Journal of Analytical Toxicology,pp.236-240的文章,该文章对该方程做了详尽的解释。总之,Perrin方程表明偏振是直接与旋转弛豫时间(rotational relaxation time)成反比的,该时间为一个分子旋转约68.5°所需的时间。旋转弛豫时间通过下面的方程与粘度(η)、绝对温度(T)、分子体积(V)和气体常数(R)相关 旋转弛豫时间对于小分子(如荧光蛋白)是小的(≈1纳秒),而对于大分子(如免疫球蛋白)是大的(≈100纳秒)。如果粘度和温度保持恒定,那么旋转弛豫时间和由此的偏振则直接与分子体积相关。分子体积的变化可归因于与其他分子的相互作用、解离、多聚化、降解、杂交或荧光标记分子的构象变化。例如,荧光偏振已用于测量由蛋白酶、DNases和RNases对大的荧光蛋白标记的多聚体的酶切割。它也已用于测量蛋白质/蛋白质相互作用、抗体/抗原结合和蛋白质/DNA结合的平衡结合。
3.固相和可溶性的高生产量的测定在另外一个实施方案中,本发明提供了用T1R多肽的可溶性测定;或者表达T1R多肽的细胞或组织。在另一个实施方案中,本发明以高生产量的形式提供了基于固相的体外测定,其中T1R多肽或表达T1R多肽的细胞或组织是附着在固相基质上的。在本发明的一个高生产量的测定中,在一天内筛选达几千个不同的调节子或配体是可能的。特别地,微量滴定板上的每一个孔都可用于进行对选择的潜在调节子的单独测定,或者如果要观察浓度或温育时间的效应,每5-10个孔可检验一个调节子。因而,一个标准的微量滴定板可测定约100(如96)个调节子。如果使用1536个孔的板,那么在一个板上可容易地测定约1000~约1500个不同的化合物。也可能在每个板孔中测定多个混合物。每天测定几个不同的板是可能的;利用本发明的整合系统测定筛选多达约6,000~20,000个不同的化合物是可能的。目标分子可直接或间接地通过共价键或非共价键如通过标记而结合到固相成分上。该标记可为多种成分的任何一种。通常,将结合标记的分子(标记粘合剂)固定在固体基质上,然后将标记的目标分子(如目标味觉转导分子)通过标记和标记粘合剂的相互作用而附着于固体基质上。基于在文献中详尽描述的分子间相互作用,可采用大量的标记和标记粘合剂。例如,当标记具有天然的粘合剂如生物素、蛋白质A或蛋白质G时,它可与适当的标记粘合剂(抗生物素蛋白、链霉抗生物素蛋白、neutravidin、免疫球蛋白的Fc区域等)一起使用。对具有天然粘合剂如生物素的分子的抗体也是广泛可用的,并且也是适当的标记粘合剂(参见SIGMA Immunochemicals 1998 catalogueSIGMA,St.Louis MO)。相似地,任何半抗原或抗原化合物可与适当的抗体一起使用以形成标记/标记粘合剂对。数千种特异性的抗体是商业可获得的且许多额外的抗体在文献中有描述。例如,在一个普通的形式中,标记是一级抗体而标记粘合剂是识别该一级抗体的二级抗体。除抗体-抗原相互作用之外,受体-配体相互作用也适合于做标记和标记粘合剂对。例如,细胞膜受体的激动剂和拮抗剂(如细胞受体-配体相互作用如运铁蛋白、c-kit、病毒受体配体、细胞因子受体、趋化因子受体、白细胞介素受体、免疫球蛋白受体和抗体、钙粘着蛋白(cadherein)家族、整联蛋白家族、选择蛋白家族等;参见如Pigott & Power,TheAdhesion Molecule Facts Book I(1993))。相似地,毒素和毒液、病毒抗原决定部位、激素(如阿片剂、类固醇等)、细胞内受体(如介导多种小配体作用的,该配体包括类固醇、甲状腺激素、类视黄醇和维生素D;肽)、药物、凝集素、糖类、核酸(线状和环状多聚体构型两者)、寡糖、蛋白质、磷脂和抗体都可与多种细胞受体相互作用。合成的多聚体如聚氨基甲酸酯、聚酯、聚碳酸酯、聚脲、聚酰胺、聚乙烯亚胺、聚芳撑硫化物(polyarylene sulfides)、聚硅氧烷、聚酰亚胺和聚乙酸酯也可形成适当的标记或标记粘合剂。许多其他的标记/标记粘合剂对也可用于此处所描述的测定系统中,基于本公开内容的综述,这对技术人员显而易见的。普通的连接体如肽、聚醚等也可充当标记,并包括多肽序列,如约5~200个氨基酸的聚gly序列。这种灵活的连接体是本领域技术人员所公知的。例如,聚乙二醇连接体可得自ShearwaterPolymers,Inc.Huntsville,Alabama。这些连接体可选择地具有酰胺键、硫氢键或异功能键。标记粘合剂是用多种目前可获得的方法的任何一种固定到固体基质上的。固体基质通常是通过将基质的所有或一部分暴露于化学试剂中而衍生或功能化的,这样即在其表面固定了一个可与标记粘合剂的一部分进行反应的化学基团。例如,适合于附着较长链部分的基团可包括胺、羟基、巯羟和羧基基团。氨烷基硅烷和羟烷基硅烷可用于功能化多种表面,如玻璃表面。这种固相生物多聚体阵列的构建在文献中有详尽描述。参见如Merrifield,J.Am.Chem.Soc.,852149-2154(1963)(描述如多肽的固相成分合成);Geysen等人,J.Immun.Meth.,102259-274(1987)(描述在针上的固相合成);Frank&Doring,Tetrahedron,446031-6040(1988)(描述多种肽序列在纤维素盘上的合成);Fodor等人,Science,251767-777(1991);Sheldon等人,Clinical Chemistry,39(4)718-719(1993);和Kozal等人,Nature Medicine,2(7)753-759(1996)(均描述固定在固体基质上的生物多聚体阵列)。在基质上固定标记粘合剂的非化学方法包括其他的普通方法,如加热、用UV辐射的交联等。
4.基于计算机的测定对调节T1R多肽活性的化合物的另一种测定包括计算机辅助的化合物设计,其中将计算机系统用于生成T1R多肽的三维结构,该结构是基于由其氨基酸序列编码的结构信息的。输入的氨基酸序列与计算机程序中预先设定的算法直接和积极地相互作用以得到蛋白质的二级、三级和四级结构模型。然后再检查该蛋白质的结构模型以鉴定具有结合如配体能力的结构区域。然后将这些区域用于鉴定结合该蛋白质的配体。蛋白质的三维结构模型是通过将至少10个氨基酸残基的蛋白质氨基酸序列或相应的编码T1R多肽的核酸序列输入到计算机程序中而生成的。编码T1R多肽的核苷酸序列或其氨基酸序列可为任何此处所公开的序列和其保守修饰的形式。氨基酸序列代表了蛋白质的一级序列或子序列,该序列编码了蛋白质的结构信息。将氨基酸序列的至少10个残基(或编码10个氨基酸的核苷酸序列)从计算机键盘或计算机可读的介质输入到计算机系统中,其中的介质包括但不局限于电子存储介质(如磁盘、磁带、盒式磁带和芯片)、光学介质(如CD ROM)、由英特网站点及RAM分发的信息。然后该蛋白质的三维结构模型可利用本领域技术人员公知的软件,通过氨基酸序列和计算机系统的相互作用来生成。氨基酸序列代表了编码形成目标蛋白质的二级、三级和四级结构所需的信息的一级结构。软件查看由一级序列编码的某些参数以生成结构模型。这些参数被称为“能量条件(energy terms)”,且主要包括静电势、疏水势、溶剂可及表面和氢键。二级能量条件包括范德瓦耳斯势。生物学分子以累积的方式形成使能量条件最小化的结构。因此该计算机程序用这些由氨基酸序列的一级结构编码的条件来创建二级结构模型。然后由二级结构编码的蛋白质的三级结构在二级结构的能量条件的基础上形成。在这时用户可输入额外的变量,如该蛋白质是膜结合的还是可溶性的、它在身体内的定位及其细胞定位如胞质、表面或细胞核。这些变量与二级结构的能量条件一起用于形成三级结构的模型。在三级结构的建模中,计算机程序使二级结构的疏水面与相似的匹配,并使二级结构的亲水面与相似的匹配。一旦生成了该结构,即可通过计算机程序来鉴定潜在的配体结合区域。潜在配体的三维结构是如上所述通过将化合物的氨基酸或核苷酸序列或化学分子式输入而生成的。然后将潜在配体的三维结构与T1R多肽的结构进行比较以鉴定结合蛋白质的配体。蛋白质和配体之间的结合亲和力是用能量条件确定的,从而确定哪个配体具有增强的结合蛋白质的可能性。计算机系统也用于筛选T1R基因的突变、多态变体、等位基因和种间同系物。这种突变可与疾病状况或遗传性状相关。如上所述,GeneChipTM和相关的技术也可用于筛选突变、多态变体、等位基因和种间同系物。一旦鉴定了变体,诊断测定即可用于鉴定具有这种突变基因的病人。对突变的T1R基因的鉴定包含接受T1R基因或其保守修饰形式的第一个核酸或氨基酸序列的输入。如上所述将序列输入到计算机系统中。然后将第一个核酸或氨基酸序列与第二个(与第一个序列基本一致的)核酸或氨基酸序列进行比较。以上述的方式将第二个序列输入到计算机系统中。一旦对第一个和第二个序列进行了比较,即可鉴定序列间的核苷酸或氨基酸差异。这种序列代表多种T1R基因中的等位基因差异和与疾病状态和遗传性状有关的突变。
5.基于细胞的结合测定在一个实施方案中,T1R蛋白质或多肽是作为与异源的伴随序列的嵌合受体在真核细胞中表达的,该伴随序列促进其成熟及在分泌途径中的定位。这种嵌合T1R多肽可表达于任何真核细胞如HEK-293细胞中。优选地,该细胞包含功能性G蛋白,如Gα15,该蛋白质能够使嵌合受体与细胞内信号通路或信号蛋白质如磷脂酶C偶联。这种嵌合受体在这种细胞内的活化可用任何标准的方法探测,如通过探测细胞内钙的变化,其中钙的变化是通过探测细胞中FURA-2依赖性的荧光而实现的。活化的GPCR受体变为使受体的C-末端尾部(也可能其他位点)磷酸化的激酶的底物。因而,激活剂将促进32P从γ-标记的GTP转移到受体,这将用闪烁计数器进行测定。C-末端尾部的磷酸化将促进视紫红质抑制蛋白样蛋白质的结合及干扰G蛋白的结合。激酶/视紫红质抑制蛋白途径在许多GPCR受体的脱敏中起关键的作用。例如,调节味觉受体保持活性的持续时间的化合物将用作延长想要的味觉或切断讨厌的味觉的手段。对于GPCR信号转导和测定信号转导方法的一般综述,参见如Methods in Enzymology,卷237和238(1994)和卷96(1983);Bourne等人,Nature,10349117-27(1991);Bourne等人,Nature,348125-32(1990);Pitcher等人,Annu.Rev.Biochem.,67653-92(1998)。T1R调节可通过将用推定的T1R调节子处理的T1R多肽的反应与未处理的对照样品的反应进行比较而测定。这种推定的T1R调节子可包括抑制或激活T1R多肽活性的味觉刺激物。在一个实施方案中,指定对照样品(未用激活剂或抑制剂进行处理的)具有100的相对T1R活性值。对T1R多肽的抑制是在当相对于对照的T1R活性值为约90%,可选择地为50%,可选择地为25-0%时而获得的。T1R多肽的活化是在当相对于对照的T1R活性值为约110%,可选择地为150%、200-500%或1000-2000%时而获得的。离子流的变化可通过确定表达T1R多肽的细胞或膜的离子极化(即电势)的变化而测定。一种确定细胞极化中变化的方法是通过用电压钳和膜片钳技术测量电流的变化(因而测量极化中的变化)(参见如“细胞附着的”模式、“翻转的(inside-out)”模式和“全细胞”模式,如Ackerman等人,New Engl.J Med.,3361575-1595(1997))。全细胞电流可用标准方法方便地确定。其他已知的测定包括放射性标记的离子流测定和用电压敏感性染料的荧光测定(参见如Vestergarrd-Bogind等人,J.Membrane Biol.,8867-75(1988);Gonzales & Tsien,Chem.Biol.,4269-277(1997);Daniel等人,J.Pharmacol.Meth.,25185-193(1991);Holevinsky等人,J.Membrane Biol.,13759-70(1994))。通常,要检验的化合物是以1pM~100mM的范围存在的。检验的化合物对多肽功能的作用可通过检查任何上述的参数而测量。任何影响GPCR活性的适当生理学变化都可用于测定检验的化合物对本发明的多肽的影响。当用完整的细胞或动物来确定功能结果时,人们也可测量多种作用,如递质的释放、激素的释放、对已知或未表征的遗传标记的转录变化(如RNA印迹)、细胞代谢如细胞生长的变化或pH变化,以及细胞内第二信使如Ca2+、IP3、cGMP或cAMP的变化。优选的GPCRs测定物包括加载了离子或电压敏感性染料以报道受体活性的细胞。确定这种受体活性的测定也可用其他G蛋白偶联受体的已知激动剂和拮抗剂作为负或正对照以测定检验的化合物的活性。除了鉴定调节化合物(如激动剂、拮抗剂)的测定中,胞质中离子水平或膜电压的变化将分别用离子敏感性或膜电压荧光指示剂来监控。除了可采用的离子敏感性指示剂和电压探针外,其它可用的公开于Molecular Probes 1997 Catalog。对于G蛋白偶联的受体,混杂的G蛋白如Gα15和Gα16可用于选择的测定中(Wilkie等人,Proc.Vat’l Acad.Sci,8810049-10053(1991))。这种混杂的G蛋白允许大量受体的偶联。受体的活化一般起始了随后的细胞内事件,如第二信使如IP3的增加,这释放了细胞内的钙离子贮藏。一些G蛋白偶联受体的活化通过磷脂酶C介导的磷脂酰肌醇的水解而刺激肌醇三磷酸(IP3)的形成(Berridge & Irvine,Nature,312315-21(1984))。IP3反过来刺激细胞内钙离子贮藏的释放。因而,胞质钙离子水平的变化或第二信使如IP3水平的变化可用于估计G蛋白偶联受体的功能。作为细胞内贮藏和通过离子通道的活化两者贡献的结果,表达这种G蛋白偶联受体的细胞可显示增加的胞质钙水平,在该情况下想要的是进行这种在无钙的缓冲液中辨别由内部贮藏的钙释放导致的荧光反应的测定,尽管这不是必需的,在其中的缓冲液中可选择地补充了螯合剂如EGTA。其他测定可包括确定受体的活性,该受体当活化时通过激活或抑制如腺苷酸环化酶的活性而导致细胞内环核苷酸如cAMP或cGMP水平的变化。存在环核苷酸门控离子通道,如通过结合cAMP或cGMP而活化的阳离子可透过的杆状光受体细胞通道和嗅觉神经元通道(参见如Altenhofen等人,Proc.Nat’l Acad.Sci,889868-9872(1991)和Dhallan等人,Nature,347184-187(1990))。在受体的活化导致环核苷酸水平降低的情况下,可能优选的是在向本测定中的细胞内添加受体激活化合物之前,将细胞暴露于增加细胞内环核苷酸水平的试剂如毛喉素中。用于这类测定的细胞可通过宿主细胞的共转染而制备,其中该宿主细胞用编码环核苷酸门控离子通道、GPCR磷酸酶的DNA和编码受体的DNA(如某些谷氨酸受体、毒蝇碱性乙酰胆碱受体、多巴胺受体、5-羟色胺受体等)共转染,所述受体当活化时,导致胞质中环核苷酸水平的变化。在一个优选的实施方案中,T1R多肽活性是通过在异源细胞中表达T1R基因而测量的,该细胞具有将受体连接到磷脂酶C信号转导通路中的混杂G蛋白(参见Offermanns & Simon,J.Biol.Chem.,27015175-15180(1995))。可选择地,该细胞系是HEK-293(它并不天然地表达T1R基因),且混杂的G蛋白为Gα15(上述的Offermanns & Simon)。对味觉转导的调节是通过测量细胞内Ca2+水平的变化而测定的,该Ca2+水平响应于通过给予与T1R多肽有关的分子而对T1R信号转导通路的调节。Ca2+水平的变化可选择地用荧光Ca2+指示剂染料和荧光测定成像来测量。在一个实施方案中,细胞内cAMP或cGMP的变化可用免疫测定来测量。在Offermanns & Simon,J.Biol.Chem.,27015175-15180(1995)中描述的方法可用于确定cAMP的水平。同样地,在Felley-Bosco等人,Am.J.Resp.Cell and Mol.Biol.,11159-164(1994)中描述的方法可用于确定cGMP的水平。进一步地,测量cAMP和/或cGMP的测定试剂盒描述于美国专利4,115,538中,此处引用作为参考。在另一个实施方案中,磷脂酰肌醇(PI)水解可根据美国专利5,436,128进行分析,此处引用作为参考。简要地,该测定包括用3H-肌醇对细胞进行48或更多小时的标记。用检验化合物对标记的细胞处理1小时。使处理的细胞裂解并在氯仿-甲醇-水中抽提,其后用离子交换色谱分离肌醇磷酸并用闪烁计数进行定量。折叠刺激是通过计算在激动剂存在时的cpm与在缓冲液对照存在时的cpm的比例来确定的。同样地,折叠抑制是通过计算在拮抗剂存在时的cpm与在缓冲液对照(该对照中可含有或不含有激动剂)存在时的cpm的比例来确定的。在另一个实施方案中,可测量转录水平以估计检验化合物对信号转导的作用。使含有目标T1R多肽的宿主细胞与检验化合物接触足够的时间以引起任何相互作用,然后测量基因表达的水平。引起这种相互作用的时间可根据经验确定,如通过进行一个时程实验并测量作为时间的函数的转录水平。转录的量可通过用任何本领域技术人员公知的适当方法来测量。例如,目标蛋白质的mRNA表达可用RNA印迹来探测,或者其多肽产物可用免疫测定来鉴定。可选择地,可以利用如在美国专利5,436,128中描述的用报道基因的基于转录的测定,此处引用作为参考。该报道基因可为如氯霉素乙酰转移酶、萤光素酶、’3-半乳糖苷酶和碱性磷酸酶。此外,可通过附着于第二报道基因如绿色荧光蛋白上而使目标蛋白质用作间接的报道基因(参见如Mistili & Spector,Nature Biotechnology,15961-964(1997))。然后将转录的量或者与在检验化合物不存在时的相同细胞中转录的量进行比较,或者与缺乏T1R多肽的基本相同的细胞中转录的量进行比较。基本相同的细胞可源自相同的细胞,从所述相同细胞制备了重组细胞但该细胞未通过引入异源DNA而修饰。转录量的任何差异均显示检验化合物以某些方式改变了目标T1R多肽的活性。
6.表达化学感受性受体的转基因非人动物表达一种或多种本发明的化学感受性受体序列的非人动物也可用于受体分析。这种表达可用于确定检验化合物在体外是否特异性地结合哺乳动物味觉跨膜受体多肽,这是通过使用被核酸序列稳定或瞬时转染的非人动物与检验化合物接触而实现的,其中的核酸序列编码化学感受性受体或其配体结合区域,也可用于确定动物是否通过特异性地结合受体多肽而与检验化合物进行反应。用本发明的载体转染或感染的动物特别可用于对味觉刺激物/配体的鉴定和表征的测定中,其中的味觉刺激物/配体可结合特定的或一套受体。这种表达人化学感受性受体序列的载体感染的动物可用于味觉刺激物的体内筛选和其对如细胞生理学(如对味觉神经元)、对CNS或行为的作用中。感染/表达核酸和载体(单个的或作为文库的)的方法是本领域众所周知的。多种单独的细胞、器官或完整动物参数可通过多种方法进行测量。本发明的T1R序列可如通过用感染介质(如腺病毒表达载体)进行送递而表达于动物味觉组织中。内源的化学感受性受体基因可保持有功能的,且野生型(天然的)活性仍然可存在。在其他的情形中,当想要所有的化学感受性受体活性都由引入的外源杂交受体引起时,则基因敲除品系是优选的。构建非人的转基因动物具体而言地为转基因小鼠,以及筛选和制备重组构建体以生成转化的细胞的方法是本领域众所周知的。“基因敲除”细胞和动物的构建是基于以下前提的,即特定基因在哺乳动物中的表达水平可通过向基因组引入新的DNA序列而降低或完全取消,该DNA序列起中断要抑制的基因的DNA序列的一些部分的作用。同样地,“基因陷阱插入(gene trap insertion)”可用于破坏宿主基因,且小鼠胚胎干细胞(ES)可用于生产基因敲除的转基因动物(参见如Holzschu,Transgenic Res 697-106(1997))。外源序列的插入一般是通过在互补核酸序列之间的同源重组实现的。外源序列是要修饰的目标基因的一部分,如外显子、内含子或转录调节序列,或任何能够影响目标基因表达水平的基因组序列;或其组合。在多能胚胎干细胞中通过同源重组的基因寻靶可允许人们精确地修饰目标基因组序列。任何技术都可用于创建、筛选、繁殖基因敲除动物,如参见Bijvoet,Hum.Mol.Genet.753-62(1998);Moreadith,J.Mol.Med.75208-216(1997);Tojo,Cytotechnology 19161-165(1995);Mudgett,Methods Mol.Biol.48167-184(1995);Longo,TransgenicRes.6321-328(1997);美国专利Nos.5,616,491;5,464,764;5,631,153;5,487,922;5,627,059;5,272,071;WO 91/09955;WO 93/09222;WO96/29411;WO 95/31560;WO 91/12650。本发明的核酸也可用作生产“基因敲除”的人细胞及其后裔的试剂。同样地,本发明的核酸也可用作生产小鼠中“基因引入(knock-ins)”的试剂。人或大鼠T1R基因序列可置换小鼠基因组中的定向同源T1R。在这个途径中,表达人或大鼠T1R的小鼠即可生产。然后该小鼠可用于分析人或大鼠T1R的功能,并鉴定这种T1Rs的配体。
D.调节子作为T1R家族成员的调节子而检验的化合物可为任何小的化学化合物或生物学实体,如蛋白质、糖类、核酸或脂类。可选择地,调节子可为T1R基因的遗传改变形式。一般地,检验化合物将为小的化学分子和肽。基本上任何化合物都可以用作本发明测定中的潜在调节子或配体,尽管大多数时候使用可溶解于水或有机(尤其是基于DMSO的)溶液中的化合物。该测定通过使测定步骤自动化和从任何方便的来源为测定提供化合物而设计为能够筛选大的化学文库,这一般是平行进行的(如以微量滴定形式在机器测定的微量滴定板上)。将理解的是有许多化学化合物的供应商,包括Sigma(St.Louis,MO)、Aldrich(St.Louis,MO)、Sigma-Aldrich(St.Louis,MO)、FlukaChemika-Biochemica Analytika(Buchs,瑞士)等。在一个优选的实施方案中,高生产量的筛选方法涉及提供含有大量潜在药物组合物(潜在的调节子或配体化合物)的组合化学或肽文库。然后这种“组合化学文库”或“肽文库”在此处所描述的一种或多种测定中进行筛选,从而鉴定那些显示想要的特征活性的文库成员(特别是化学种类或亚类)。这样鉴定的化合物可充当常规的“引导化合物(lead compound)”或自身用作潜在的或实际的药物。组合化学文库是通过组合大量的化学“模块(buildingblock)”如试剂而得到的不同化学化合物的集合,该化合物是由化学合成或生物合成生成的。例如,线性组合化学文库如多肽文库是通过以各种可能的途径对于给定的混合物长度(即多肽化合物中的氨基酸数目)组合一套化学模块(氨基酸)而形成的。通过这种化学模块的组合混合可以合成数百万化学化合物。组合化学文库的制备和筛选是本领域技术人员众所周知的。这种组合化学文库包括,但不局限于肽文库(参见如美国专利5,010,175,Furka,Int.J.Pept.Prot.Res.,37487-493(1991)和Houghton等人,Nature,35484-88(1991))。也可采用其他生成化学多样性文库的化学品。这种化学品包括,但不局限于类肽(peptoids)(如PCT Publication No.WO 91/19735)、编码的肽(如PCT Publication No.WO 93/20242)、随机生物寡聚体(如PCTPublication No.WO 92/00091)、苯并二氮杂(如美国专利No.5,288,514)、diversomers如乙内酰脲、苯并二氮杂和二肽(Hobbs等人,Proc.Nat.Acad.Sci.,906909-6913(1993))、插烯多肽(Hagihara等人,J.Amer.Chem.Soc.,1146568(1992))、具有葡萄糖支架的非肽肽模拟物(peptidomimetics)(Hirschmann等人,J.Amer.Chem.Soc.,1149217-9218(1992))、小化合物文库的类似有机合成(Chen等人,,J.Amer.Chem.Soc.,1162661(1994))、寡聚氨基甲酸酯(oligocarbamates)(Cho等人,Science,2611303(1993))、肽酰磷酸酯(Campbell等人,J.Org.Chem.,59658(1994))、核酸文库(Ausubel,Berger和Sambrook,均为上述的)、肽核酸文库(美国专利5,539,083)、抗体文库(Vaughn等人,Nature Biotechnolozy,14(3)309-314(1996)和PCT/US96/10287)、糖类文库(Liang等人,Science,2741520-1522(1996)和美国专利5,593,853)、小的有机分子文库(苯并二氮杂,Baum,C&EN,1月18,33页(1993);thiazolidinones和metathiazanones,美国专利5,549,974;pynrolidines,美国专利5,525,735和5,519,134;吗啉代化合物,美国专利5,506,337;苯并二氮杂,美国专利5,288,514等)制备组合文库的装置是商业上可获得的(参见如357MPS、390MPS(Advanced Chem Tech,Louisville KY)、Symphony(Rainin,Woburn,MA)、433A(Applied Biosystems,Foster City,CA)、9050 Plus(Millipore,Bedford,MA))。此外,许多组合文库自身是商业上可获得的(参见如ComGenex,Princeton,NJ;Tripos,Inc.,St.Louis,MO;3D Pharmaceuticals,Exton,PA;MartekBiosciences;Columbia,MD等)。在本发明的一个方面,T1R调节子可用于任何食品产品、糖果、药物组合物或其成分以借此以想要的方式调节产品、组合物或成分的味道。例如,可添加增强甜味感觉的T1R调节子以使产品或组合物变甜,而可添加阻挡讨厌的味觉的T1R调节子以改善产品或组合物的味道。
E.表示和预测味觉感受的方法本发明也优选地提供了在哺乳动物包括人中表示味觉感受和/或预测味觉感受的方法。优选地,这种方法可用此处所公开的受体和编码该T1R多肽的基因来进行。在本发明中也涉及的是一种筛选一种或多种能产生哺乳动物可探测的味觉的化合物的方法,该方法包含使该一种或多种化合物与公开的受体接触,其中的哺乳动物优选地为人。在本发明中也涉及的是一种在哺乳动物中表示特殊味道的味觉感受的方法,该方法包含以下步骤提供代表该脊椎动物的n个化学感受性受体每一个的定量刺激的值X1-Xn,其中n大于或等于2;及从该值生成味觉感受的定量表示。化学感受性受体可为此处所公开的化学感受性受体,该表示可构成n-维空间中的一个点或一个组,可构成一个图表或一个谱,且可构成一个定量表示矩阵。同样地,提供的步骤可包含使大多数重组生产的化学感受性受体与检验组合物接触并定量测量该组合物与该受体的相互作用。在本发明中也涉及的是一种在哺乳动物中预测味觉感受的方法,该味觉感受是由在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合生成的,该方法包含以下步骤对于在哺乳动物中产生已知味觉感受的一种或多种分子或分子组合,提供代表该脊椎动物的n个化学感受性受体每一个的定量刺激的值X1-Xn,其中n大于或等于2;及从该值生成能在哺乳动物产生已知味觉感受的一种或多种分子或分子组合在哺乳动物中味觉感受的定量表示,对于在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合,提供代表该脊椎动物的n个化学感受性受体每一个的定量刺激的值X1-Xn,其中n大于或等于2;及从该值生成能在哺乳动物产生未知味觉感受的一种或多种分子或分子组合在哺乳动物中味觉感受的定量表示,以及通过将能在哺乳动物产生未知味觉感受的一种或多种分子或分子组合的味觉感受的定量表示与能在哺乳动物产生已知味觉感受的一种或多种分子或分子组合的味觉感受的定量表示进行比较,从而预测哺乳动物中由在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合生成的味觉感受。在该方法中所用的化学感受性受体可包括此处所公开的化学感受性受体。在另一个实施方案中,生成了在哺乳动物中引起预定味觉感受的新分子或分子组合,这通过以下步骤实现即在哺乳动物中确定上述的已知分子或分子组合的味觉感受值;在哺乳动物中确定上述的未知分子或分子组合的味觉感受值;将哺乳动物中对一种或多种未知组合物的味觉感受值与哺乳动物中对一种或多种已知组合物的味觉感受值进行比较;选择在哺乳动物中引起预定味觉感受的分子或分子组合;组合两种或多种未知分子或分子组合以形成在哺乳动物中引起预定味觉感受的分子或分子组合。该组合步骤产生了在哺乳动物中引起预定味觉感受的单一分子或分子组合。在本发明的另一个实施方案中,提供了一种模拟味觉的方法,该方法包含以下步骤对于大多数克隆的化学感受性受体(优选地为人受体)中的每一个,确定受体与味觉刺激物相互作用的程度;以一定量组合大量的化合物使得它们一起提供模拟味觉刺激物特点的受体刺激特点,其中所述化合物中的每一个都具有预先确定的与一种或多种受体相互作用的性质。味觉刺激物与化学感受性受体的相互作用可用此处所描述的任何结合或报道测定进行确定。然后组合大量化合物以形成混合物。如果需要,大量化合物的一种或多种可共价结合。组合的化合物基本刺激至少75%、80%或90%的受体,其中该受体基本是由味觉刺激物刺激的。在本发明另一个优选实施方案中,将大量标准化合物对大量化学感受性受体进行了检验以确定每一受体与每一标准化合物相互作用的程度,并从而生成对每一标准化合物的受体刺激特点。然后这些受体刺激特点可在数据储存介质上贮藏于相关的数据库中。该方法可进一步包含提供对于味觉想要的受体刺激特点;将想要的受体刺激特点与相关数据库进行比较;以及确定一种或多种与想要的受体刺激特点最匹配的标准化合物的组合。该方法可进一步包含在一种或多种确定的组合中组合标准化合物以刺激味觉。
F.试剂盒T1R基因及其同系物对鉴定化学感受性受体细胞、对法医和父子关系确定及对检查味觉转导都是有用的工具。特异性地与T1R核酸杂交的T1R家族成员特异性试剂如T1R探针和引物,以及特异性地结合T1R多肽的T1R特异性试剂如T1R抗体用于检查味觉细胞表达和味觉转导调节。包括多种技术的在样品中确定T1R家族成员的DNA和RNA是否存在的核酸测定是本领域技术人员所公知的,如DNA印迹分子、RNA印迹分析、斑点印迹、RNase保护、S1分析、如PCR的扩增技术和原位杂交。例如,在原位杂交中,目标核酸是这样从其细胞环境中释放的,从而它可用于细胞内的杂交,而同时保持了细胞的形态学以进行随后的描述和分析。下面的文章提供了对原位杂交技术的综述Singer等人,Biotechniques,4230-250(1986);Haase等人,Methods in Virology,vol.VII,pp.189-226(1984);和Nucleic AcidHybridizationA Practical Approach(Names等人,eds.1987)。此外,T1R多肽可用上述多种免疫测定技术进行探测。检验样品一般是与正对照(如表达重组T1R多肽的样品)和负对照进行比较的。本发明也提供了筛选T1R家族成员的调节子的试剂盒。这种试剂盒可从易于获得的原料和试剂制备。例如,这种试剂盒可包含下述材料的任何一种或多种T1R核酸或蛋白质、反应试管和检验T1R活性的说明书。可选择地,该试剂盒含有生物学活性的T1R受体。依赖于试剂盒的预定用户和用户的特殊需要,根据本发明可制备多种试剂盒和成分。
实施例在此处所给出的蛋白质序列中,单字母密码X或Xaa指20个常用氨基酸的任何一个。在此处所给出的DNA序列中,单字母密码N或n指4个常用核苷酸碱基A、T、C或G的任何一个。
实施例1-hT1R3在下面提供hT1R3基因组DNA,以SEQ ID NO 1和SEQID NO 2表示,其预测的编码序列(cds)以黑体字显示。在5’和3’毗连群(contig)之间的间断以elipses(‘.........’)显示。由hT1R3预测的cds描述于SEQ ID NO 3中。最后,用氨基酸的单字母密码提供优选的预测hT1R3氨基酸序列为SEQ ID NO 4。
hT1R3基因组DNA-5’毗连群(SEQ ID NO 1)AGCCTGGCAGTGGCCTCAGGCAGAGTCTGACGCGCACAAACTTTCAGGCCCAGGAAGCGAGGACACCACTGGGGCCCCAGGGTGTGGCAAGTGAGGATGGCAAGGGTTTTGCTAAACAAATCCTCTGCCCGCTCCCCGCCCCGGGCTCACTCCATGTGAGGCCCCAGTCGGGGCAGCCACCTGCCGTGCCTGTTGGAAGTTGCCTCTGCCATGCTGGGCCCTGCTGTCCTGGGCCTCAGCCTCTGGGCTCTCCTGCACCCTGGGACGGGGGCCCCATTGTGCCTGTCACAGCAACTTAGGATGAAGGGGGACTACGTGCTGGGGGGGCTGTTCCCCCTGGGCGAGGCCGAGGAGGCTGGCCTCCGCAGCCGGACACGGCCCAGCAGCCCTGTGTGCACCAGGTACAGAGGTGGGACGGCCTGGGTCGGGGTCAGGGTGACCAGGTCTGGGGTGCTCCTGAGCTGGGGCCGAGGTGGCCATCTGCGGTTCTGTGTGGCCCCAGGTTCTCCTCAAACGGCCTGCTCTGGGCACTGGCCATGAAAATGGCCGTGGAGGAGATCAACAACAAGTCGGATCTGCTGCCCGGGCTGCGCCTGGGCTACGACCTCTTTGATACGTGCTCGGAGCCTGTGGTGGCCATGAAGCCCAGCCTCATGTTCCTGGCCAAGGCAGGCAGCCGCGACATCGCCGCCTACTGCAACTACACGCAGTACCAGCCCCGTGTGCTGGCTGTCATCGGGCCCCACTCGTCAGAGCTCGCCATGGTCACCGGCAAGTTCTTCAGCTTCTTCCTCATGCCCCAGTGGGGCGCCCCCCACCATCACCCACCCCCAACCAACCCCTGCCCCGTGGGAGCCCCTTGTGTCAGGAGAATGC(SEQ ID NO1)hT1R3基因组DNA-3’毗连群(SEQ ID NO 2).........TACATGCACCCCACCCAGCCCTGCCCTGGGAGCCCTGTGTCAGAAGATGCTCTTGGCCTTGCAGGTCAGCTACGGTGCTAGCATGGAGCTGCTGAGCGCCCGGGAGACCTTCCCCTCCTTCTTCCGCACCGTGCCCAGCGACCGTGTGCAGCTGACGGCCGCCGCGGAGCTGCTGCAGGAGTTCGGCTGGAACTGGGTGGCCGCCCTGGGCAGCGACGACGAGTACGGCCGGCAGGGCCTGAGCATCTTCTCGGCCCTGGCCGCGGCACGCGGCATCTGCATCGCGCACGAGGGCCTGGTGCCGCTGCCCCGTGCCGATGACTCGCGGCTGGGGAAGGTGCAGGACGTCCTGCACCAGGTGAACCAGAGCAGCGTGCAGGTGGTGCTGCTGTTCGCCTCCGTGCACGCCGCCCACGCCCTCTTCAACTACAGCATCAGCAGCAGGCTCTCGCCCAAGGTGTGGGTGGCCAGCGAGGCCTGGCTGACCTCTGACCTGGTCATGGGGCTGCCCGGCATGGCCCAGATGGGCACGGTGCTTGGCTTCCTCCAGAGGGGTGCCCAGCTGCACGAGTTCCCCCAGTACGTGAAGACGCACCTGGCCCTGGCCACCGACCCGGCCTTCTGCTCTGCCCTGGGCGAGAGGGAGCA
GGGTCTGGAGGAGGACGTGGTGGGCCAGCGCTGCCCGCAGTGTGACTGCATCACGCTGCAGAACGTGAGCGCAGGGCTAAATCACCACCAGACGTTCTCTGTCTACGCAGCTGTGTATAGCGTGGCCCAGGCCCTGCACAACACTCTTCAGTGCAACGCCTCAGGCTGCCCCGCGCAGGACCCCGTGAAGCCCTGGCAGGTGAGCCCGGGAGATGGGGGTGTGCTGTCCTCTGCATGTGCCCAGGCCACCAGGCACGGCCACCACGCCTGAGCTGGAGGTGGCTGGCGGCTCAGCCCCGTCCCCCGCCCGCAGCTCCTGGAGAACATGTACAACCTGACCTTCCACGTGGGCGGGCTGCCGCTGCGGTTCGACAGCAGCGGAAACGTGGACATGGAGTACGACCTGAAGCTGTGGGTGTGGCAGGGCTCAGTGCCCAGGCTCCACGACGTGGGCAGGTTCAACGGCAGCCTCAGGACAGAGCGCCTGAAGATCCGCTGGCACACGTCTGACAACCAGGTGAGGTGAGGGTGGGTGTGCCAGGCGTGCCCGTGGTAGCCCCCGCGGCAGGGCGCAGCCTGGGGGTGGGGGCCGTTCCAGTCTCCCGTGGGCATGCCCAGCCGAGCAGAGCCAGACCCCAGGCCTGTGCGCAGAAGCCCGTGTCCCGGTGCTCGCGGCAGTGCCAGGAGGGCCAGGTGCGCCGGGTCAAGGGGTTCCACTCCTGCTGCTACGACTGTGTGGACTGCGAGGCGGGCAGCTACCGGCAAAACCCAGGTGAGCCGCCTTCCCGGCAGGCGGGGGTGGGAACGCAGCAGGGGAGGGTCCTGCCAAGTCCTGACTCTGAGACCAGAGCCCACAGGGTACAAGACGAACACCCAGCGCCCTTCTCCTCTCTCACAGACGACATCGCCTGCACCTTTTGTGGCCAGGATGAGTGGTCCCCGGAGCGAAGCACACGCTGCTTCCGCCGCAGGTCTCGGTTCCTGGCATGGGGCGAGCCGGCTGTGCTGCTGCTGCTCCTGCTGCTGAGCCTGGCGCTGGGCCTTGTGCTGGCTGCTTTGGGGCTGTTCGTTCACCATCGGGACAGCCCACTGGTTCAGGCCTCGGGGGGGCCCCTGGCCTGCTTTGGCCTGGTGTGCCTGGGCCTGGTCTGCCTCAGCGTCCTCCTGTTCCCTGGCCAGCCCAGCCCTGCCCGATGCCTGGCCCAGCAGCCCTTGTCCCACCTCCCGCTCACGGGCTGCCTGAGCACACTCTTCCTGCAGGCGGCCGAGATCTTCGTGGAGTCAGAACTGCCTCTGAGCTGGGCAGACCGGCTGAGTGGCTGCCTGCGGGGGCCCTGGGCCTGGCTGGTGGTGCTGCTGGCCATGCTGGTGGAGGTCGCACTGTGCACCTGGTACCTGGTGGCCTTCCCGCCGGAGGTGGTGACGGACTGGCACATGCTGCCCACGGAGGCGCTGGTGCACTGCCGCACACGCTCCTGGGTCAGCTTCGGCCTAGCGCACGCCACCAATGCCACGCTGGCCTTTCTCTGCTTCCTGGGCACTTTCCTGGTGCGGAGCCAGCCGGGCTGCTACAACCGTGCCCGTGGCCTCACCTTTGCCATGCTGGCCTACTTCATCACCTGGGTCTCCTTTGTGCCCCTCCTGGCCAATGTGCAGGTGGTCCTCAGGCCCGCCGT
GCAGATGGGCGCCCTCCTGCTCTGTGTCCTGGGCATCCTGGCTGCCTTCCACCTGCCCAGGTGTTACCTGCTCATGCGGCAGCCAGGGCTCAACACCCCCGAGTTCTTCCTGGGAGGGGGCCCTGGGGATGCCCAAGGCCAGAATGACGGGAACACAGGAAATCAGGGGAAACATGAGTGACCCAACCCTGTGATCTCAGCCCCGGTGAACCCAGACTTAGCTGCGATCCCCCCCAAGCCAGCAATGACCCGTGTCTCGCTACAGAGACCCTCCCGCTCTAGGTTCTGACCCCAGGTTGTCTCCTGACCCTGACCCCACAGTGAGCCCTAGGCCTGGAGCACGTGGACACCCCTGTGACCATC(SEQ ID NO 2)hT1R3全长基因组DNA(SEQ ID NO 20)AGCCTGGCAGTGGCCTCAGGCAGAGTCTGACGCGCACAAACTTTCAGGCCCAGGAAGCGAGGACACCACTGGGGCCCCAGGGTGTGGCAAGTGAGGATGGCAAGGGTTTTGCTAAACAAATCCTCTGCCCGCTCCCCGCCCCGGGCTCACTCCATGTGAGGCCCCAGTCGGGGCAGCCACCTGCCGTGCCTGTTGGAAGTTGCCTCTGCCATGCTGGGCCCTGCTGTCCTGGGCCTCAGCCTCTGGGCTCTCCTGCACCCTGGGACGGGGGCCCCATTGTGCCTGTCACAGCAACTTAGGATGAAGGGGGACTACGTGCTGGGGGGGCTGTTCCCCCTGGGCGAGGCCGAGGAGGCTGGCCTCCGCAGCCGGACACGGCCCAGCAGCCCTGTGTGCACCAGGTACAGAGGTGGGACGGCCTGGGTCGGGGTCAGGGTGACCAGGTCTGGGGTGCTCCTGAGCTGGGGCCGAGGTGGCCATCTGCGGTTCTGTGTGGCCCCAGGTTCTCCTCAAACGGCCTGCTCTGGGCACTGGCCATGAAAATGGCCGTGGAGGAGATCAACAACAAGTCGGATCTGCTGCCCGGGCTGCGCCTGGGCTACGACCTCTTTGATACGTGCTCGGAGCCTGTGGTGGCCATGAAGCCCAGCCTCATGTTCCTGGCCAAGGCAGGCAGCCGCGACATCGCCGCCTACTGCAACTACACGCAGTACCAGCCCCGTGTGCTGGCTGTCATCGGGCCCCACTCGTCAGAGCTCGCCATGGTCACCGGCAAGTTCTTCAGCTTCTTCCTCATGCCCCAGTGGGGCGCCCCCCACCATCACCCACCCCCAACCAACCCCTGCCCCGTGGGAGCCCCTTGTGTCAGGAGAATGCTACATGCACCCCACCCAGCCCTGCCCTGGGAGCCCTGTGTCAGAAGATGCTCTTGGCCTTGCAGGTCAGCTACGGTGCTAGCATGGAGCTGCTGAGCGCCCGGGAGACCTTCCCCTCCTTCTTCCGCACCGTGCCCAGCGACCGTGTGCAGCTGACGGCCGCCGCGGAGCTGCTGCAGGAGTTCGGCTGGAACTGGGTGGCCGCCCTGGGCAGCGACGACGAGTACGGCCGGCAGGGCCTGAGCATCTTCTCGGCCCTGGCCGCGGCACGCGGCATCTGCATCGCGCACGAGGGCCTGGTGCCGCTGCCCCGTGCCGATGACTCGCGGCTGGGGAAGGTGCA
GGACGTCCTGCACCAGGTGAACCAGAGCAGCGTGCAGGTGGTGCTGCTGTTCGCCTCCGTGCACGCCGCCCACGCCCTCTTCAACTACAGCATCAGCAGCAGGCTCTCGCCCAAGGTGTGGGTGGCCAGCGAGGCCTGGCTGACCTCTGACCTGGTCATGGGGCTGCCCGGCATGGCCCAGATGGGCACGGTGCTTGGCTTCCTCCAGAGGGGTGCCCAGCTGCACGAGTTCCCCCAGTACGTGAAGACGCACCTGGCCCTGGCCACCGACCCGGCCTTCTGCTGTGCCCTGGGCGAGAGGGAGCAGGGTCTGGAGGAGGACGTGGTGGGCCAGCGCTGCCCGCAGTGTGACTGCATCACGCTGCAGAACGTGAGCGCAGGGCTAAATCACCACCAGACGTTCTCTGTCTACGCAGCTGTGTATAGCGTGGCCCAGGCCCTGCACAACACTCTTCAGTGCAACGCCTCAGGCTGCCCCGCGCAGGACCCCGTGAAGCCCTGGCAGGTGAGCCCGGGAGATGGGGGTGTGCTGTCCTCTGCATGTGCCCAGGCCACCAGGCACGGCCACCACGCCTGAGCTGGAGGTGGCTGGCGGCTCAGCCCCGTCCCCCGCCCGCAGCTCCTGGAGAACATGTACAACCTGACCTTCCACGTGGGCGGGCTGCCGCTGCGGTTCGACAGCAGCGGAAACGTGGACATGGAGTACGACCTGAAGCTGTGGGTGTGGCAGGGCTCAGTGCCCAGGCTCCACGACGTGGGCAGGTTCAACGGCAGCCTCAGGACAGAGCGCCTGAAGATCCGCTGGCACACGTCTGACAACCAGGTGAGGTGAGGGTGGGTGTGCCAGGCGTGCCCGTGGTAGCCCCCGCGGCAGGGCGCAGCCTGGGGGTGGGGGCCGTTCCAGTCTCCCGTGGGCATGCCCAGCCGAGCAGAGCCAGACCCCAGGCCTGTGCGCAGAAGCCCGTGTCCCGGTGCTCGCGGCAGTGCCAGGAGGGCCAGGTGCGCCGGGTCAAGGGGTTCCACTCCTGCTGCTACGACTGTGTGGACTGCGAGGCGGGCAGCTACCGGCAAAACCCAGGTGAGCCGCCTTCCCGGCAGGCGGGGGTGGGAACGCAGCAGGGGAGGGTCCTGCCAAGTCCTGACTCTGAGACCAGAGCCCACAGGGTACAAGACGAACACCCAGCGCCCTTCTCCTCTCTCACAGACGACATCGCCTGCACCTTTTGTGGCCAGGATGAGTGGTCCCCGGAGCGAAGCACACGCTGCTTCCGCCGCAGGTCTCGGTTCCTGGCATGGGGCGAGCCGGCTGTGCTGCTGCTGCTCCTGCTGCTGAGCCTGGCGCTGGGCCTTGTGCTGGCTGCTTTGGGGCTGTTCGTTCACCATCGGGACAGCCCACTGGTTCAGGCCTCGGGGGGGCCCCTGGCCTGCTTTGGCCTGGTGTGCCTGGGCCTGGTCTGCCTCAGCGTCCTCCTGTTCCCTGGCCAGCCCAGCCCTGCCCGATGCCTGGCCCAGCAGCCCTTGTCCCACCTCCCGCTCACGGGCTGCCTGAGCACACTCTTCCTGCAGGCGGCCGAGATCTTCGTGGAGTCAGAACTGCCTCTGAGCTGGGCAGACCGGCTGAGTGGCTGCCTGCGGGGGCCCTGGGCCTGGCTGGTGGTGCTGCTGGCCATG
CTGGTGGAGGTCGCACTGTGCACCTGGTACCTGGTGGCCTTCCCGCCGGAGGTGGTGACGGACTGGCACATGCTGCCCACGGAGGCGCTGGTGCACTGCCGCACACGCTCCTGGGTCAGCTTCGGCCTAGCGCACGCCACCAATGCCACGCTGGCCTTTCTCTGCTTCCTGGGCACTTTCCTGGTGCGGAGCCAGCCGGGCTGCTACAACCGTGCCCGTGGCCTCACCTTTGCCATGCTGGCCTACTTCATCACCTGGGTCTCCTTTGTGCCCCTCCTGGCCAATGTGCAGGTGGTCCTCAGGCCCGCCGTGCAGATGGGCGCCCTCCTGCTCTGTGTCCTGGGCATCCTGGCTGCCTTCCACCTGCCCAGGTGTTACCTGCTCATGCGGCAGCCAGGGCTCAACACCCCCGAGTTCTTCCTGGGAGGGGGCCCTGGGGATGCCCAAGGCCAGAATGACGGGAACACAGGAAATCAGGGGAAACATGAGTGACCCAACCCTGTGATCTCAGCCCCGGTGAACCCAGACTTAGCTGCGATCCCCCCCAAGCCAGCAATGACCCGTGTCTCGCTACAGAGACCCTCCCGCTCTAGGTTCTGACCCCAGGTTGTCTCCTGACCCTGACCCCACAGTGAGCCCTAGGCCTGGAGCACGTGGACACCCCTGTGACCATC(SEQ ID NO 20)hT1R3预测的cds(SEQ ID NO 3)ATGCTGGGCCCTGCTGTCCTGGGCCTCAGCCTCTGGGCTCTCCTGCACCCTGGGACGGGGGCCCCATTGTGCCTGTCACAGCAACTTAGGATGAAGGGGGACTACGTGCTGGGGGGGCTGTTCCCCCTGGGCGAGGCCGAGGAGGCTGGCCTCCGCAGCCGGACACGGCCCAGCAGCCCTGTGTGCACCAGGTTCTCCTCAAACGGCCTGCTCTGGGCACTGGCCATGAAAATGGCCGTGGAGGAGATCAACAACAAGTCGGATCTGCTGCCCGGGCTGCGCCTGGGCTACGACCTCTTTGATACGTGCTCGGAGCCTGTGGTGGCCATGAAGCCCAGCCTCATGTTCCTGGCCAAGGCAGGCAGCCGCGACATCGCCGCCTACTGCAACTACACGCAGTACCAGCCCCGTGTGCTGGCTGTCATCGGGCCCCACTCGTCAGAGCTCGCCATGGTCACCGGCAAGTTCTTCAGCTTCTTCCTCATGCCCCAGGTCAGCTACGGTGCTAGCATGGAGCTGCTGAGCGCCCGGGAGACCTTCCCCTCCTTCTTCCGCACCGTGCCCAGCGACCGTGTGCAGCTGACGGCCGCCGCGGAGCTGCTGCAGGAGTTCGGCTGGAACTGGGTGGCCGCCCTGGGCAGCGACGACGAGTACGGCCGGCAGGGCCTGAGCATCTTCTCGGCCCTGGCCGCGGCACGCGGCATCTGCATCGCGCACGAGGGCCTGGTGCCGCTGCCCCGTGCCGATGACTCGCGGCTGGGGAAGGTGCAGGACGTCCTGCACCAGGTGAACCAGAGCAGCGTGCAGGTGGTGCTGCTGTTCGCCTCCGTGCACGCCGCCCACGCCCTCTTCAACTACAGCATCAGCAGCAGGCTCTCGCCCAAGGTGTGGGTGGCCAGCGAGGCCTGGCTGACC
TCTGACCTGGTCATGGGGCTGCCCGGCATGGCCCAGATGGGCACGGTGCTTGGCTTCCTCCAGAGGGGTGCCCAGCTGCACGAGTTCCCCCAGTACGTGAAGACGCACCTGGCCCTGGCCACCGACCCGGCCTTCTGCTCTGCCCTGGGCGAGAGGGAGCAGGGTCTGGAGGAGGACGTGGTGGGCCAGCGCTGCCCGCAGTGTGACTGCATCACGCTGCAGAACGTGAGCGCAGGGCTAAATCACCACCAGACGTTCTCTGTCTACGCAGCTGTGTATAGCGTGGCCCAGGCCCTGCACAACACTCTTCAGTGCAACGCCTCAGGCTGCCCCGCGCAGGACCCCGTGAAGCCCTGGCAGCTCCTGGAGAACATGTACAACCTGACCTTCCACGTGGGCGGGCTGCCGCTGCGGTTCGACAGCAGCGGAAACGTGGACATGGAGTACGACCTGAAGCTGTGGGTGTGGCAGGGCTCAGTGCCCAGGCTCCACGACGTGGGCAGGTTCAACGGCAGCCTCAGGACAGAGCGCCTGAAGATCCGCTGGCACACGTCTGACAACCAGAAGCCCGTGTCCCGGTGCTCGCGGCAGTGCCAGGAGGGCCAGGTGCGCCGGGTCAAGGGGTTCCACTCCTGCTGCTACGACTGTGTGGACTGCGAGGCGGGCAGCTACCGGCAAAACCCAGACGACATCGCCTGCACCTTTTGTGGCCAGGATGAGTGGTCCCCGGAGCGAAGCACACGCTGCTTCCGCCGCAGGTCTCGGTTCCTGGCATGGGGCGAGCCGGCTGTGCTGCTGCTGCTCCTGCTGCTGAGCCTGGCGCTGGGCCTTGTGCTGGCTGCTTTGGGGCTGTTCGTTCACCATCGGGACAGCCCACTGGTTCAGGCCTCGGGGGGGCCCCTGGCCTGCTTTGGCCTGGTGTGCCTGGGCCTGGTCTGCCTCAGCGTCCTCCTGTTCCCTGGCCAGCCCAGCCCTGCCCGATGCCTGGCCCAGCAGCCCTTGTCCCACCTCCCGCTCACGGGCTGCCTGAGCACACTCTTCCTGCAGGCGGCCGAGATCTTCGTGGAGTCAGAACTGCCTCTGAGCTGGGCAGACCGGCTGAGTGGCTGCCTGCGGGGGCCCTGGGCCTGGCTGGTGGTGCTGCTGGCCATGCTGGTGGAGGTCGCACTGTGCACCTGGTACCTGGTGGCCTTCCCGCCGGAGGTGGTGACGGACTGGCACATGCTGCCCACGGAGGCGCTGGTGCACTGCCGCACACGCTCCTGGGTCAGCTTCGGCCTAGCGCACGCCACCAATGCCACGCTGGCCTTTCTCTGCTTCCTGGGCACTTTCCTGGTGCGGAGCCAGCCGGGCTGCTACAACCGTGCCCGTGGCCTCACCTTTGCCATGCTGGCCTACTTCATCACCTGGGTCTCCTTTGTGCCCCTCCTGGCCAATGTGCAGGTGGTCCTCAGGCCCGCCGTGCAGATGGGCGCCCTCCTGCTCTGTGTCCTGGGCATCCTGGCTGCCTTCCACCTGCCCAGGTGTTACCTGCTCATGCGGCAGCCAGGGCTCAACACCCCCGAGTTCTTCCTGGGAGGGGGCCCTGGGGATGCCCAAGGCCAGAATGACGGGAACACAGGAAATCAGGGGAAACATGAGTGA(SEQ ID NO 3)
hT1R3推定的氨基酸序列(SEQ ID NO 4)MLGPAVLGLSLWALLHPGTGAPLCLSQQLRMKGDYVLGGLFPLGEAEEAGLRSRTRPSSPVCTRFSSNGLLWALAMKMAVEEINNKSDLLPGLRLGYDLFDTCSEPVVAMKPSLMFLAKAGSRDIAAYCNYTQYQPRVLAVIGPHSSELAMVTGKFFSFFLMPQVSYGASMELLSARETFPSFFRTVPSDRVQLTAAAELLQEFGWNWVAALGSDDEYGRQGLSIFSALAAARGICIAHEGLVPLPRADDSRLGKVQDVLHQVNQSSVQVVLLFASVHAAHALFNYSISSRLSPKVWVASEAWLTSDLVMGLPGMAQMGTVLGFLQRGAQLHEFPQYVKTHLALATDPAFCSALGEREQGLEEDVVGQRCPQCDCITLQNVSAGLNHHQTFSVYAAVYSVAQALHNTLQCNASGCPAQDPVKPWQLLENMYNLTFHVGGLPLRFDSSGNVDMEYDLKLWVWQGSVPRLHDVGRFNGSLRTERLKIRWHTSDNQKPVSRCSRQCQEGQVRRVKGFHSCCYDCVDCEAGSYRQNPDDIACTFCGQDEWSPERSTRCFRRRSRFLAWGEPAVLLLLLLLSLALGLVLAALGLFVHHRDSPLVQASGGPLACFGLVCLGLVCLSVLLFPGQPSPARCLAQQPLSHLPLTGCLSTLFLQAAEIFVESELPLSWADRLSGCLRGPWAWLVVLLAMLVEVALCTWYLVAFPPEWTDWHMLPTEALVHCRTRSWVSFGLAHATNATLAFLCFLGTFLVRSQPGCYNRARGLTFAMLAYFITWVSFVPLLANVQWLRPAVQMGALLLCVLGILAAFHLPRCYLLMRQPGLNTPEFFLGGGPGDAQGQNDGNTGNQGKHE(SEQ IDNO 4)实施例2-rT1R3和mT1R3通过PCR扩增用基于人T1R3序列的简并引物从基因组DNA中分离了大鼠和小鼠T1R3基因的区段。简并引物SAP077(5’-CGNTTYYTNGCNTGGGGNGARCC-3’;SEQ ID NO 5)和SAP079(5’-CGNGCNCGRTTRTARCANCCNGG-3’;SEQ ID NO 6)是分别与人的T1R3残基RFLAWGEPA(相应于SEQ ID NO 7)和PGCYNRAR(相应于SEQ ID NO 8)互补的。将PCR产物克隆并测序。质粒SAV115携带有小鼠T1R3基因的克隆片段,SAV118携带有大鼠基因的一个片段。下面显示的这些序列明显地代表人T1R3的在啮齿类中的对应物,因为小鼠的片段与人T1R3的相应片段有74%的一致性,且大鼠的片段与人T1R3的相应片段有80%的一致性。小鼠与大鼠的片段有88%的一致性。没有其他的数据库序列与这些T1R3片段有大于40%的一致性。
有义方向的SAV115小鼠T1R3片段(序列对应于移去的简并引物)(SEQ ID NO 9)GTGCTGTCACTCCTCCTGCTGCTTTGCCTGGTGCTGGGTCTAGCACTGGCTGCTCTGGGGCTCTCTGTCCACCACTGGGACAGCCCTCTTGTCCAGGCCTCAGGCGGCTCACAGTTCTGCTTTGGCCTGATCTGCCTAGGCCTCTTCTGCCTCAGTGTCCTTCTGTTCCCAGGACGGCCAAGCTCTGCCAGCTGCCTTGCACAACAACCAATGGCTCACCTCCCTCTCACAGGCTGCCTGAGCACACTCTTCCTGCAAGCAGCTGAGACCTTTGTGGAGTCTGAGCTGCCACTGAGCTGGGCAAACTGGCTATGCAGCTACCTTCGGGACTCTGGCCTGCTAGTGGTACTGTTGGCCACTTTTGTGGAGGCAGCACTATGTGCCTGGTATTTGACCGCTTCACCAGAAGTGGTGACAGACTGGTCAGTGCTGCCCACAGAGGTACTGGAGCACTGCCACGTGCGTTCCTGGGTCAACCTGGGCTTGGTGCACATCACCAATGCAATGGTAGCTTTTCTCTGCTTTCTGGGCACTTTCCTGGTACAAGACCAG(SEQ ID NO 9)mT1R3片段,推定的氨基酸序列(SEQ ID NO 10)VLSLLLLLCLVLGLALAALGLSVHHWDSPLVQASGGSQFCFGLICLGLFCLSVLLFPGRPSSASCLAQQPMAHLPLTGCLSTLFLQAAETFVESELPLSWANWLCSYLRDSGLLVVLLATFVEAALCAWYLTASPEVVTDWSVLPTEVLEHCHVRSWVNLGLVHITNAMVAFLCFLGTFLVQDQ(SEQ ID NO 10)有义方向的SAV118大鼠T1R3片段(序列对应于移去的简并引物)(SEQ ID NO 11)GTGCTGTCACTTCTCCTGCTGCTTTGCCTGGTGCTGGGCCTGACACTGGCTGCCCTGGGGCTCTTTGTCCACTACTGGGACAGCCCTCTTGTTCAGGCCTCAGGTGGGTCACTGTTCTGCTTTGGCCTGATCTGCCTAGGCCTCTTCTGCCTCAGTGTCCTTCTGTTCCCAGGACGACCACGCTCTGCCAGCTGCCTTGCCCAACAACCAATGGCTCACCTCCCTCTCACAGGCTGCCTGAGCACACTCTTCCTGCAAGCAGCCGAGATCTTTGTGGAGTCTGAGCTGCCACTGAGTTGGGCAAACTGGCTCTGCAGCTACCTTCGGGGCCCCTGGGCTTGGCTGGTGGTACTGCTGGCCACTCTTGTGGAGGCTGCACTATGTGCCTGGTACTTGATGGCTTTCCCTCCAGAGGTGGTGACAGATTGGCAGGTGCTGCCCACGGAGGTACTGGAACACTGCCGCATGCGTTCCTGGGTCAGCCTGGGCTTGGTGCACATCACCAATGCAGGGGTAGCTTTCCTCTGCTTTCTGGGCACTTTCCTGGTACAAAGCCAG(SEQ ID NO 11)
rT1R3片段.推定的氨基酸序列(SEQ ID NO 12)VLSLLLLLCLVLGLTLAALGLFVHYWDSPLVQASGGSLFCFGLICLGLFCLSVLLFPGRPRSASCLAQQPMAHLPLTGCLSTLFLQAAEIFVESELPLSWANWLCSYLRGPWAWLVVLLATLVEAALCAWYLMAFPPEWTDWQVLPTEVLEHCRMRSWVSLGLVHITNAGVAFLCFLGTFLVQSQ(SEQ ID NO 12)实施例3-rT1R3的克隆将上面鉴定为SEQ ID NOs 9和11的mT1R3和rT1R3区段用于筛选源自大鼠味觉组织的cDNA文库。对一个阳性克隆进行测序并发现该克隆含有在下面以SEQ ID NO 13给出的全长rT1R3序列。与mT1R3和rT1R3部分序列和与全长hT1R3序列的序列比较确定该cDNA代表hT1R3的大鼠对应物。例如,rT1R3和hT1R3之间的成对氨基酸一致性为约72%,而公共DNA序列数据库中最相关的注释的序列与rT1R3仅有约33%的一致性。
rT1R3预测的cds(SEQ.ID NO.13)ATGCCGGGTTTGGCTATCTTGGGCCTCAGTCTGGCTGCTTTCCTGGAGCTTGGGATGGGGTCCTCTTTGTGTCTGTCACAGCAATTCAAGGCACAAGGGGACTATATATTGGGTGGACTATTTCCCCTGGGCACAACTGAGGAGGCCACTCTCAACCAGAGAACACAGCCCAACGGCATCCTATGTACCAGGTTCTCGCCCCTTGGTTTGTTCCTGGCCATGGCTATGAAGATGGCTGTAGAGGAGATCAACAATGGATCTGCCTTGCTCCCTGGGCTGCGACTGGGCTATGACCTGTTTGACACATGCTCAGAGCCAGTGGTCACCATGAAGCCCAGCCTCATGTTCATGGCCAAGGTGGGAAGTCAAAGCATTGCTGCCTACTGCAACTACACACAGTACCAACCCCGTGTGCTGGCTGTCATTGGTCCCCACTCATCAGAGCTTGCCCTCATTACAGGCAAGTTCTTCAGCTTCTTCCTCATGCCACAGGTCAGCTATAGTGCCAGCATGGATCGGCTAAGTGACCGGGAAACATTTCCATCCTTCTTCCGCACAGTGCCCAGTGACCGGGTGCAGCTGCAGGCCGTTGTGACACTGTTGCAGAATTTCAGCTGGAACTGGGTGGCTGCCTTAGGTAGTGATGATGACTATGGCCGGGAAGGTCTGAGCATCTTTTCTGGTCTGGCCAACTCACGAGGTATCTGCATTGCACACGAGGGCCTGGTGCCACAACATGACACTAGTGGCCAACAATTGGGCAAGGTGGTGGATGTGCTACGCCAAGTGAACCAAAGCAAAGTACAGGTGGTGGTGCTGTTTGCATCTGCCCGTGCTGTCTACTCCCTTTTTAGCTACAGCATCCTTCATGACCTCTCACC
CAAGGTATGGGTGGCCAGTGAGTCCTGGCTGACCTCTGACCTGGTCATGACACTTCCCAATATTGCCCGTGTGGGCACTGTTCTTGGGTTTCTGCAGCGCGGTGCCCTACTGCCTGAATTTTCCCATTATGTGGAGACTCGCCTTGCCCTAGCTGCTGACCCAACATTCTGTGCCTCCCTGAAAGCTGAGTTGGATCTGGAGGAGCGCGTGATGGGGCCACGCTGTTCACAATGTGACTACATCATGCTACAGAACCTGTCATCTGGGCTGATGCAGAACCTATCAGCTGGGCAGTTGCACCACCAAATATTTGCAACCTATGCAGCTGTGTACAGTGTGGCTCAGGCCCTTCACAACACCCTGCAGTGCAATGTCTCACATTGCCACACATCAGAGCCTGTTCAACCCTGGCAGCTCCTGGAGAACATGTACAATATGAGTTTCCGTGCTCGAGACTTGACACTGCAGTTTGATGCCAAAGGGAGTGTAGACATGGAATATGACCTGAAGATGTGGGTGTGGCAGAGCCCTACACCTGTACTACATACTGTAGGCACCTTCAACGGCACCCTTCAGCTGCAGCACTCGAAAATGTATTGGCCAGGCAACCAGGTGCCAGTCTCCCAGTGCTCCCGGCAGTGCAAAGATGGCCAGGTGCGCAGAGTAAAGGGCTTTCATTCCTGCTGCTATGACTGTGTGGACTGCAAGGCAGGGAGCTACCGGAAGCATCCAGATGACTTCACCTGTACTCCATGTGGCAAGGATCAGTGGTCCCCAGAAAAAAGCACAACCTGCTTACCTCGCAGGCCCAAGTTTCTGGCTTGGGGGGAGCCAGCTGTGCTGTCACTTCTCCTGCTGCTTTGCCTGGTGCTGGGCCTGACACTGGCTGCCCTGGGGCTCTTTGTCCACTACTGGGACAGCCCTCTTGTTCAGGCCTCAGGTGGGTCACTGTTCTGCTTTGGCCTGATCTGCCTAGGCCTCTTCTGCCTCAGTGTCCTTCTGTTCCCAGGACGACCACGCTCTGCCAGCTGCCTTGCCCAACAACCAATGGCTCACCTCCCTCTCACAGGCTGCCTGAGCACACTCTTCCTGCAAGCAGCCGAGATCTTTGTGGAGTCTGAGCTGCCACTGAGTTGGGCAAACTGGCTCTGCAGCTACCTTCGGGGCCCCTGGGCTTGGCTGGTGGTACTGCTGGCCACTCTTGTGGAGGCTGCACTATGTGCCTGGTACTTGATGGCTTTCCCTCCAGAGGTGGTGACAGATTGGCAGGTGCTGCCCACGGAGGTACTGGAACACTGCCGCATGCGTTCCTGGGTCAGCCTGGGCTTGGTGCACATCACCAATGCAGTGTTAGCTTTCCTCTGCTTTCTGGGCACTTTCCTGGTACAGAGCCAGCCTGGTCGCTATAACCGTGCCCGTGGCCTCACCTTCGCCATGCTAGCTTATTTCATCATCTGGGTCTCTTTTGTGCCCCTCCTGGCTAATGTGCAGGTGGCCTACCAGCCAGCTGTGCAGATGGGTGCTATCTTATTCTGTGCCCTGGGCATCCTGGCCACCTTCCACCTGCCCAAATGCTATGTACTTCTGTGGCTGCCAGAGCTCAACACCCAGGAGTTCTTCCTGGGAAGGAGCCCCAAGGAAGCATCAGATGGGAATAGTGGTAGTAGTGAGGCAACTCGGGGACACAGTGAATGA(SEQ ID NO 13)
rT1R3推定的氨基酸序列(SEQ.ID NO.14)MPGLAILGLSLAAFLELGMGSSLCLSQQFKAQGDYILGGLFPLGTTEEATLNQRTQPNGILCTRFSPLGLFLAMAMKMAVEEINNGSALLPGLRLGYDLFDTCSEPVVTMKPSLMFMAKVGSQSIAAYCNYTQYQPRVLAVIGPHSSELA LITGKFFSFFLMPQVSYSASMDRLSDRETFPSFFRTVPSDRVQLQAVVTLLQNFSWNWVAALGSDDDYGREGLSIFSGLANSRGICIAHEGLVPQHDTSGQQLGKVVDVLRQVNQSKVQVVVLFASARAVYSLFSYSILHDLSPKVWVASESWLTSDLVMTLPNIARVGTVLGFLQRGALLPEFSHYVETRLALAADPTFCASLKAELDLEERVMGPRCSQCDYIMLQNLSSGLMQNLSAGQLHHQIFATYAAVYSVAQALHNTLQCNVSHCHTSEPVQPWQLLENMYNMSFRARDLTLQFDAKGSVDMEYDLKMWVWQSPTPVLHTVGTFNGTLQLQHSKMYWPGNQVPVSQCSRQCKDGQVRRVKGFHSCCYDCVDCKAGSYRKHPDDFTCTPCGKDQWSPEKSTTCLPRRPKFLAWGEPAVLSLLLLLCLVLGLTLAALGLFVHYWDSPLVQASGGSLFCFG LICLGLFCLSVLLFPGRPRSASCLAQQPMAHLPLTGCLSTLFLQAAEIFVESELPLSWANWLCSYLRGPWAWLWLLATLVEAALCAWYLMAFPPEWTDWQVLPTEVLEHCRMRSWVSLGLVHITNAVLAFLCFLGTFLVQSQPGRYNRARGLTFAMLAYFIIWVSFVPLLANVQVAYQPAVQMGAILFCALGILATFHLPKCYVLLWLPELNTQEFFLGRSPKEASDGNSGSSEATRGHSE(SEQ IDNO 14)实施例4-mT1R3的表达将上述包含于SAV115中的小鼠T1R3片段用M13正向和M13反向引物进行PCR扩增,然后凝胶纯化。将T1R3 DNA模板置于体外转录标记反应体系中,其中洋地黄毒苷标记的UTP被整合入反义cRNA探针中。使该探针与含有轮廓状乳头的成年小鼠味觉组织进行杂交。T1R3原位杂交和探测是根据Schaeren-Wiemers等人,Histochemistry,100431-400(1993)的规程进行的。简要地,将新鲜的冷冻小鼠舌做14μm的切片并准备杂交。使200ng/mL的反义洋地黄毒苷T1R3探针在72℃杂交14个小时。杂交后用0.2xSSC于72℃洗涤。洋地黄毒苷的探测是通过与anti-DIG碱性磷酸酶抗体的1∶5000稀释液进行温育并随后在NBT/BCIP中与磷酸酶的12个小时的反应而实现。
实施例5-hT1R1大鼠味觉受体的人定向同源物(数据库访问号AL159177)在下面提供为SEQ ID NO 15,指定为rT1R1。预测的cds以粗体显示,且一些内含子序列间隔表示为一组N。核苷酸和推定翻译的hT1R1序列也分别在此处描述为SEQ ID NO 16和17。
hT1R1基因组DNA (SEQ ID NO 15)GAGAATCTCGCGAGATCCCGTCGGTCCGCCCCGCTGCCCTCCCAGCTGCCGAAAAGAGGGGCCTCCGAGCCGCCGGCGCCCTCTGCCGGCAACCTCCGGAAGCACACTAGGAGGTTCCAGCCGATCTGGTCGAGGGGCTCCACGGAGGACTCCATTTACGTTACGCAAATTCCCTACCCCAGCCGGCCGGAGAGAGAAAGCCAGAAACCTCGCGACCAGCCATGGGCCACCTCTCCGGAAAAACACCGGGATATTTTTTTTCTCCTGCAGAAAAAGCTTTAGGATTGGCAGTTTAAACAAAACATGTCTATTTGCATACCTTCGGTTTGCATGCATTTGTTTCGAAGTGAGCAACCCTGGGTAACAAGGCGAAAGTATATGACAATTTGCTCAGAATCTTAATGTCAGAAAACTGGAGACTGGGGCAGGGGGGTGTCGACTCAAAGCTGTGTCTCATTTAGTAAACTGAGGCCCAGGTAAAAAGTTCTGAAACCTCGCAACACCCGGAGAAATTGTGTTCCAGCCTCCCACCTCGCCCCAAAATGCCAGAGCTCCTTTTCTAAGCCAGGTGAAGTCACAGAGCGTGGACAGAACCCACAACCGTCCAGAGGAAGGGTCACTGGGTGCCACCTGGTTTGCATCTGTGCCTTCGTCCTGCCCAGTTCCTGAGTGGGACCGCAGGCCCGGAATGTCAAGGCAAACAGTCCTGCTTCAGCCACTGGGCTCCAGTCCCACCCCTTTTGGGGGCCTGAAGTTAGGAAGCATCCGGCAGCTGCCTTCTATTTAAGCAACTGGCCTCCTTAGAGGCCACTCCTTGGCCATGCCAGGCGCGGGCATCTGGCCAGCATGCTGCTCTGCACGGCTCGCCTGGTCGGCCTGCAGCTTCTCATTTCCTGCTGCTGGGCCTTTGCCTGCCATAGCACGGAGTCTTCTCCTGACTTCACCCTCCCCGGAGATTACCTCCTGGCAGGCCTGTTCCCTCTCCATTCTGGCTGTCTGCAGGTGAGGCACAGACCCGAGGTGACCCTGTGTGACAGGTGAGTGAGGGGCCAGCAGAGCCACACTTAGTGGGACCCCTGGCTATAGGGCCCCTCTGGCTGCCATCCTCCAAACAGGACCTTGCCTCTGCCTTTGCCCCTTGAACTGTCCCCAGGCCTTGTTCATCAATCCACTTGCCACCTAAGTGCTGGCTAGACCTTCCTAGACACTTCGGCCAGTTTCCAATTATTTCACCCTTGCTGTTAGAATGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN
NNNNNNNAATTCCTTAAACTAAATTTCTCACTTTCTCTCTCTCTCTGGAAAACACTGACTAATGTAGCAGGTTTCTCTGCTCCAGGACTTCAGGACCTTTTCGATGCTAATAAGTTTCTCCATCAGGGCCAGCTTGTTCCTCCTACTGAGCTTGAGAGCCCTTGTTGAAGTTGTGGTTTGGGGGACTGGACCGATGACCTCAAAGGTTCCCTTTGCTCCCAAGCCTCAGAGTCTAGGAGGCCAGAGGGTCTCAGCAGGCCTTTGTCCTTCTCAGCTGTCTCTTACTGGCTTTCTCCACAGGTCTTGTAGCTTCAATGAGCATGGCTACCACCTCTTCCAGGCTATGCGGCTTGGGGTTGAGGAGATAAACAACTCCACGGCCCTGCTGCCCAACATCACCCTGGGGTACCAGCTGTATGATGTGTGTTCTGACTCTGCCAATGTGTATGCCACGCTGAGAGTGCTCTCCCTGCCAGGGCAACACCACATAGAGCTCCAAGGAGACCTTCTCCACTATTCCCCTACGGTGCTGGCAGTGATTGGGCCTGACAGCACCAACCGTGCTGCCACCACAGCCGCCCTGCTGAGCCCTTTCCTGGTGCCCATGGTAAGCTGGAGCCTCAGACCTTTGCCCATCTCCCTTCAGGCAAGTCTGGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGCCACCATGCCCGGCTAATTTTTTTGTATTTTTAGTAGAGACGGGGTTTCACCGTGTTAGCCAGGCTGGTCGCAAACTCCTAACCTCGTGATCCACCCACCTCGGCCTCCCAATGTGCTGGGATTACAGGTGTGAGCCACTGCACCCGGCCATAATGTATTAATATAATAAAATAATTATACAACTCACCATAATGTAGAATCAGTGGGAGCCCTGAGCTTGTTTTCCTACAACTAGATGGTCCCATCTGGGGGTGATGGGAGACAGTGACAGATCATCAGACATTAGATTCTCATAAGTAGCGTGCAACCCAGATCCCTCGCATGTGCAGTTCACAGTAGGGTTCAAGCTCCTACAAGAATCTGATGCTGCTGCTGATCTGACAGGAGGGGAGCAGCTGTAAATACAGATGAAGCTTCGCTTACTCACCAGCTGCTCACCTCCTCCTGTGAGGCCCGGTTCCTAACAGGCCACTGACCTAACTTCTGCCCTGACCTACACATGCTTCTCTTCTTCCTTGCAAACTGCCTCCAGTGGAAGTCCCTGAAGGTCCCCAAACACACGGGACTATTTCACTCCTATGCAGGTTTTGTCTCCTTTGCTTGGAATGCATCCCCTCACCCCTTGTCCCCAGGCAGATTCCCACCCCTCCCCCAGAACCTGCCCCAGTGGAGCCTTCGCAGGTGATTTGTCAGTTTCACAGGCTGAGGGGTGCTCTCCTGGTCTCCCCGGCTCCCTGTATCCCCACACCCAGCACAGGGCCAGGCACTGGGGGGGCCTTCAGTGGAGACTGAAATGGCTGAACGGGACCTCCCATAGATTAGCTATGCGGCCAGCAGCGAGACGCTCAGCGTGAAGCGGCAGTATCCCTCTTTCCTGCGCACCATCCCCAATGACAAGTACCAGGTGGAGACCATGGTGCTGCTGCTGCAGAAGTTCGGGTGGACCTGGATCTCTCTGGTTGGCAGCAGTGACGACTATGGGCAGCTAGGGGTGCAGGCAC
TGGAGAACCAGGCCACTGGTCAGGGGATCTGCATTGCTTTCAAGGACATCATGCCCTTCTCTGCCCAGGTGGGCGATGAGAGGATGCAGTGCCTCATGCGCCACCTGGCCCAGGCCGGGGCCACCGTCGTGGTTGTTTTTTCCAGCCGGCAGTTGGCCAGGGTGTTTTTCGAGTCCGTGGTGCTGACCAACCTGACTGGCAAGGTGTGGGTCGCCTCAGAAGCCTGGGCCCTCTCCAGGCACATCACTGGGGTGCCCGGGATCCAGCGCATTGGGATGGTGCTGGGCGTGGCCATCCAGAAGAGGGCTGTCCCTGGCCTGAAGGCGTTTGAAGAAGCCTATGCCCGGGCAGACAAGAAGGCCCCTAGGCCTTGCCACAAGGGCTCCTGGTGCAGCAGCAATCAGCTCTGCAGAGAATGCCAAGCTTTCATGGCACACACGATGCCCAAGCTCAAAGCCTTCTCCATGAGTTCTGCCTACAACGCATACCGGGCTGTGTATGCGGTGGCCCATGGCCTCCACCAGCTCCTGGGCTGTGCCTCTGGAGCTTGTTCCAGGGGCCGAGTCTACCCCTGGCAGGTAAGAGAGCCCACCCCAGCACCTCCTGTCAGGGAGAACAGCCAATCCTGAGATGAGCAGAGTGGGCACTCTCCGGTCACTCTAAATGCCAAGGGGGATAAATGCCACTAACTTGAGGTTTTTTGTTTTGTTTTGTTTTGTTTTTTGAGACAGTCTGGCTCTGTCACCCAGGCTGCAGTGTAGTGATGCGATCTCGGCTCTCTGCAACTTCCACCTCCTGGGTTCAAGTGATTCTCTTGCCTCGGCCTCCTGAGTAGCTGGGATTACAGGCACCCACCACCATGCCTGGATAATTTTTCTTTTCTTTTTTTTTTTTTTGAGATAGAGTCTCGCTCTGTTGCCCAGGCTGGAATGCAGTGGTGCGATCTTGGCTCACTGTGAGCTCCGCCTCCCAGGTTCACTCCATTCCCCTGCCTCAGCCTCCCAAGTAGGTGGGACTACGGGCGCCCGCCACCACGCCCAGCTAATTTTTTTTGTATTTTGAGTAGAGACGGGGTTTCACCATGTTAGCCAGGATGGTCTCAATCTCCTGACCTTGTCATCCGCCCACCTCGTCCTCCCAAAGTGCTGGGATTACAGGCGTGAGCCACCGCACCCGGCCTAATTTTTGTATTTTTAGTAGAGATGGGGTTTCACCATGTTGGCCAGGCTGGTCTCGAACTCCTGGCATCAAGTGATCCTCCTGCTTCGGCCTCCCAAAGTGCTGGGATTACAGGCATTAGCTCTCTTCTCTTAGACAGATCTTTCTCTCTGATCCTTGCCTTCTCTCACCCACTGTGTCTTGGAAGTGTCAAGTGATAAGATCCAGGGCTAAAACTGTCTGTAAAGGAGTGTTTGTTAGAGGCCTCCTCTCAGGAGGTTGGTGGGGAAGATTGAGGGGCTTCCTAAGAAGGAAGGGACGAGACCTTCCTGATGGGCTGAAACCACCAGGACGGAAACCCAGGAAGGCCCCAGGCCCTTGCTTCTGGGACCATGTGGGTCTGTGCTGTCTGTGGTGGCTTCATGATACGCGTTTCTTTCAGCTTTTGGAGCAGATCCACAAGGTGCATTTCCTTCTACACAAGGACACTGTGGCGTTTAATGACAACAGAGATCCCCTCAGTAGCTATAACATAATTGCCTGGGACTGGAA
TGGACCCAAGTGGACCTTCACGGTCCTCGGTTCCTCCACATGGTCTCCAGTTCAGCTAAACATAAATGAGACCAAAATCCAGTGGCACGGAAAGGACAACCAGGTAATGGGGATGTGGCTACTCACCATGTAACTGGCTTATGGGCAACCTAGAGCCTGGGGGTGATGCTGACACAGTGTACAGGGAGCAGGAGGGGGGCCCCAGGGGTCCAGCTGCCACCACTCTACCCATCCTGGCCAGGGAAGCAGGGAAGACACTCCGTAGGCGAGTGTGCAGATGCCCTGGGGCGGAAGTTCACACGACCAGGGGCCCTGCCCTGGGAGTGAGCCCTGAGGGCAGATGCACAGAGATTCTGTTTTCTGTTCCACATGTGAGCTGTCCTTTGACTTGGGCCCCTACGTGTGGCCCCTCTGGCTTCTTACAGGTGCCTAAGTCTGTGTGTTCCAGCGACTGTCTTGAAGGGCACCAGCGAGTGGTTACGGGTTTCCATCACTGCTGCTTTGAGTGTGTGCCCTGTGGGGCTGGGACCTTCCTCAACAAGAGTGGTGAGTGGGCAATGGAGCAGGCGAGCTACCCAGCACTCCCGGGGGCTGCACGGTGGAGGGAGGGCCTCCCTTGGGCCCCATGTGCCCTGCCCCAGAACCAAGGCCCAGTCACTGGGCTGCCAGTTAGCTTCAGGTTG GAGGACACCTGCTACCAGACAGAATTCTGATCAAGAGAATCAGCCACTGGGTGCGGTGGCTCATGCCTGTAATCCCAGCACTTTGGGAGGCTGAGGCGGGTGGATCACTTGAGGTCGGGAGTTCGAGACCAGCCTGGCCAACATGGTGAAACCCCATCTCTACCAAAAATATAAAAAATTAGCTGGGTGTGGTGGCGCGTGCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATCACTTGAACCCAGGAGGCGGAGGTTGCAGTGAGCCAAGATGCATTCCAGCCTGGACCACAAAGCGAGAATTCGTCCCCCCAAAAAAAGAAAGGAGGCCGGGCGCGGTGGCTCACACCTGTAATCCCAGCACTTTGGGAGGCCGAGGTGGGTGGATCACCTGAGGTCAGGAGTTCGAGACCAGCCTGACCAACATGGTGAAACCCCATCTCTACTAAAAATACAAAAAAAGTTAGCCGGGCGTTGTGGCGTGTGCCTGTAATTCCAGCTACTCGGGAGGCTGAGGCAGGAGAATTGCTTGAACCCGGGAGGCGGAGGTTGCAGTGAGCCAAGATTGCACCATTGCACTCCAGCCTGGGCGACAAGAGAAAAACTCTGTCTCAAAAAAAAAGAAAGAAAGAAAGAATTAGCCAACTGAAAGCCTTAGACTGAGGTGTGTCCTCTGTTAGAGAGCTGTCATCACAACTCCTACAAAAGCAGTCGTATCCTGAATTCAACCTCTTTCTCTAAATGAATATAGCTATTGTTCCCTTTGTGCCCTCTTGTCCTACTGTCCCTTCTGTTGCCCATGCCAAAGACAGCTAGCTCCTTGAACAGCTTGGCCTGAATACAGATACTAGCGTGTCTGCAGCAGAGAAAAAAACAGCATTCCCCATCCAGAAATGCAAGGTCAAGAACAGAGAGCAAATTAGGTAGCTAAGGACTCAGGTCCTTAGTTGGTGTCCAGGGGCCACATTCTTTCCTTTCACCATCTCTGTAGGGACAGGAATACTTCCCTTC
TGTCCTCAGAGGGTCAGGACTCAGAGAAACCACAGAGCAGCAGCTCAGGAAAGTGGTTCATGGAAATGCTGGCAAGAGAGAGGGGTTACAATGCCCTCCCTTGGGAGCAGGCTGCTCCCATCAGATCGTAACCTCTCTGGTATGTGGGCAGAGCTACCAGGTTAAGGTCCTCCCTAGGGTTTGCAAAACCCTCATGGGATCATGAGCCATACAGAACCGACCTGTGTGTCTCCAGAGTCTGTAATTAACACAGGCATTTTGAGGAAATGCGTGGCCTCAGGCCCCACTCCCGGCTACCCCCATCCCACTATGCCTAGTATAGTCTAGCTGCCCTGGTACAATTCTCCCAGTATCTTGCAGGCCCCTATTTCCTATTCCTACTCTGCTCATCTGGCTCTCAGGAACCTTCTTGGCCTTCCCTTTCAGACCTCTACAGATGCCAGCCTTGTGGGAAAGAAGAGTGGGCACCTGAGGGAAGCCAGACCTGCTTCCCGCGCACTGTGGTGTTTTTGGCTTTGCGTGAGCACACCTCTTGGGTGCTGCTGGCAGCTAACACGGTGCTGCTGCTGCTGCTGCTTGGGACTGCTGGCCTGTTTGCCTGGCACCTAGACACCCCTGTGGTGAGGTCAGCAGGGGGCCGCCTGTGCTTTCTTATGCTGGGCTCCCTGGCAGCAGGTAGTGGCAGCCTCTATGGCTTCTTTGGGGAACCCACAAGGCCTGCGTGCTTGCTACGCCAGGCCCTCTTTGCCCTTGGTTTCACCATCTTCCTGTCCTGCCTGACAGTTCGCTCATTCCAACTAATCATCATCTTCAAGTTTTCCACCAAGGTACCTACATTCTACCACGCCTGGGTCCAAAACCACGGTGCTGGCCTGTTTGTGATGATCAGCTCAGCGGCCCAGCTGCTTATCTGTCTAACTTGGCTGGTGGTGTGGACCCCACTGCCTGCTAGGGAATACCAGCGCTTCCCCCATCTGGTGATGCTTGAGTGCACAGAGACCAACTCCCTGGGCTTCATACTGGCCTTCCTCTACAATGGCCTCCTCTCCATCAGTGCCTTTGCCTGCAGCTACCTGGGTAAGGACTTGCCAGAGAACTACAACGAGGCCAAATGTGTCACCTTCAGCCTGCTCTTCAACTTCGTGTCCTGGATCGCCTTCTTCACCACGGCCAGCGTCTACGACGGCAAGTACCTGCCTGCGGCCAACATGATGGCTGGGCTGAGCAGCCTGAGCAGCGGCTTCGGTGGGTATTTTCTGCCTAAGTGCTACGTGATCCTCTGCCGCCCAGACCTCAACAGCACAGAGCACTTCCAGGCCTCCATTCAGGACTACACGAGGCGCTGCGGCTCCACCTGACCAGTGGGTCAGCAGGCACGGCTGGCAGCCTTCTCTGCCCTGAGGGTCGAAGGTCGAGCAGGCCGGGGGTGTCCGGGAGGTCTTTGGGCATCGCGGTCTGGGGTTGGGACGTGTAAGCGCCTGGGAGAGCCTAGACCAGGCTCCGGGCTGCCAATAAAGAAGTGAAATGCGTATCTGGTCTCCTGTCGTGGGAGAGTGTGAGGTGTAACGGATTCAAGTCTGAACCCAGAGCCTGGAAAAGGCTGACCGCCCAGATTGACGTTGCTAGGCAACTCCGGAGGCGGGCCCAGCGCCAAAAGAACAGGGCGAGGCGTCGTCCCCGCATCCCATTGGCCGTTCTCTGCG
GGGCCCCGCCCTCGGGGGCCGGAGCTAGAAGCTCTACGCTTCCGAGGCGCACCTCCTGGCCTGCACGCTTTGACGT(SEQ ID NO 15)hT1R1预测的cds(SEQ ID NO 16)ATGCTGCTCTGCACGGCTCGCCTGGTCGGCCTGCAGCTTCTCATTTCCTGCTGCTGGGCCTTTGCCTGCCATAGCACGGAGTCTTCTCCTGACTTCACCCTCCCCGGAGATTACCTCCTGGCAGGCCTGTTCCCTCTCCATTCTGGCTGTCTGCAGGTGAGGCACAGACCCGAGGTGACCCTGTGTGACAGGTCTTGTAGCTTCAATGAGCATGGCTACCACCTCTTCCAGGCTATGCGGCTTGGGGTTGAGGAGATAAACAACTCCACGGCCCTGCTGCCCAACATCACCCTGGGGTACCAGCTGTATGATGTGTGTTCTGACTCTGCCAATGTGTATGCCACGCTGAGAGTGCTCTCCCTGCCAGGGCAACACCACATAGAGCTCCAAGGAGACCTTCTCCACTATTCCCCTACGGTGCTGGCAGTGATTGGGCCTGACAGCACCAACCGTGCTGCCACCACAGCCGCCCTGCTGAGCCCTTTCCTGGTGCCCATGATTAGCTATGCGGCCAGCAGCGAGACGCTCAGCGTGAAGCGGCAGTATCCCTCTTTCCTGCGCACCATCCCCAATGACAAGTACCAGGTGGAGACCATGGTGCTGCTGCTGCAGAAGTTCGGGTGGACCTGGATCTCTCTGGTTGGCAGCAGTGACGACTATGGGCAGCTAGGGGTGCAGGCACTGGAGAACCAGGCCACTGGTCAGGGGATCTGCATTGCTTTCAAGGACATCATGCCCTTCTCTGCCCAGGTGGGCGATGAGAGGATGCAGTGCCTCATGCGCCACCTGGCCCAGGCCGGGGCCACCGTCGTGGTTGTTTTTTCCAGCCGGCAGTTGGCCAGGGTGTTTTTCGAGTCCGTGGTGCTGACCAACCTGACTGGCAAGGTGTGGGTCGCCTCAGAAGCCTGGGCCCTCTCCAGGCACATCACTGGGGTGCCCGGGATCCAGCGCATTGGGATGGTGCTGGGCGTGGCCATCCAGAAGAGGGCTGTCCCTGGCCTGAAGGCGTTTGAAGAAGCCTATGCCCGGGCAGACAAGAAGGCCCCTAGGCCTTGCCACAAGGGCTCCTGGTGCAGCAGCAATCAGCTCTGCAGAGAATGCCAAGCTTTCATGGCACACACGATGCCCAAGCTCAAAGCCTTCTCCATGAGTTCTGCCTACAACGCATACCGGGCTGTGTATGCGGTGGCCCATGGCCTCCACCAGCTCCTGGGCTGTGCCTCTGGAGCTTGTTCCAGGGGCCGAGTCTACCCCTGGCAGCTTTTGGAGCAGATCCACAAGGTGCATTTCCTTCTACACAAGGACACTGTGGCGTTTAATGACAACAGAGATCCCCTCAGTAGCTATAACATAATTGCCTGGGACTGGAATGGACCCAAGTGGACCTTCACGGTCCTCGGTTCCTCCACATGGTCTCCAGTTCAGCTAAACATAAATGAGACCAAAATCCAGTGGCACGGAAAGGACAACCAGGTGCCTAAGTCTGTGTGTTCCAGCGACTGTCTTGAAGGGCACCAGCGAGTGGTTACGGGTTTCCATCAC
TGCTGCTTTGAGTGTGTGCCCTGTGGGGCTGGGACCTTCCTCAACAAGAGTGACCTCTACAGATGCCAGCCTTGTGGGAAAGAAGAGTGGGCACCTGAGGGAAGCCAGACCTGCTTCCCGCGCACTGTGGTGTTTTTGGCTTTGCGTGAGCACACCTCTTGGGTGCTGCTGGCAGCTAACACGCTGCTGCTGCTGCTGCTGCTTGGGACTGCTGGCCTGTTTGCCTGGCACCTAGACACCCCTGTGGTGAGGTCAGCAGGGGGCCGCCTGTGCTTTCTTATGCTGGGCTCCCTGGCAGCAGGTAGTGGCAGCCTCTATGGCTTCTTTGGGGAACCCACAAGGCCTGCGTGCTTGCTACGCCAGGCCCTCTTTGCCCTTGGTTTCACCATCTTCCTGTCCTGCCTGACAGTTCGCTCATTCCAACTAATCATCATCTTCAAGTTTTCCACCAAGGTACCTACATTCTACCACGCCTGGGTCCAAAACCACGGTGCTGGCCTGTTTGTGATGATCAGCTCAGCGGCCCAGCTGCTTATCTGTCTAACTTGGCTGGTGGTGTGGACCCCACTGCCTGCTAGGGAATACCAGCGCTTCCCCCATCTGGTGATGCTTGAGTGCACAGAGACCAACTCCCTGGGCTTCATACTGGCCTTCCTCTACAATGGCCTCCTCTCCATCAGTGCCTTTGCCTGCAGCTACCTGGGTAAGGACTTGCCAGAGAACTACAACGAGGCCAAATGTGTCACCTTCAGCCTGCTCTTCAACTTCGTGTCCTGGATCGCCTTCTTCACCACGGCCAGCGTCTACGACGGCAAGTACCTGCCTGCGGCCAACATGATGGCTGGGCTGAGCAGCCTGAGCAGCGGCTTCGGTGGGTATTTTCTGCCTAAGTGCTACGTGATCCTCTGCCGCCCAGACCTCAACAGCACAGAGCACTTCCAGGCCTCCATTCAGGACTACACGAGGCGCTGCGGCTCCACCTGA(SEQ ID NO 16)hT1R1推定的氨基酸序列(SEQ ID NO 17)MLLCTARLVGLQLLISCCWAFACHSTESSPDFTLPGDYLLAGLFPLHSGCLQVRHRPEVTLCDRSCSFNEHGYHLFQAMRLGVEEINNSTALLPNITLGYQLYDVCSDSANVYATLRVLSLPGQHHIELQGDLLHYSPTVLAVIGPDSTNRAATTAALLSPFLVPMISYAASSETLSVKRQYPSFLRTIPNDKYQVETMVLLLQKFGWTWISLVGSSDDYGQLGVQALENQATGQGICIAFKDIMPFSAQVGDERMQCLMRHLAQAGATVVVVFSSRQLARVFFESVVLTNLTGKVWVASEAWALSRHITGVPGIQRIGMVLGVAIQKRAVPGLKAFEEAYARADKKAPRPCHKGSWCSSNQLCRECQAFMAHTMPKLKAFSMSSAYNAYRAVYAVAHGLHQLLGCASGACSRGRVYPWQLLEQIHKVHFLLHKDTVAFNDNRDPLSSYNIIAWDWNGPKWTFTVLGSSTWSPVQLNINETKIQWHGKDNQVPKSVCSSDCLEGHQRVVTGFHHCCFECVPCGAGTFLNKSDLYRCQPCGKEEWAPEGSQTCFPRTWFLALREHTSWVLLAANTLLLLLLLGTAGLFAWHLDTPVVRSAGGRLCFLMLGSLAAGSGSLYGFFGEPTRPACLLRQALFALGFTIFLSCL
TVRSFQLIIIFKFSTKVPTFYHAWVQNHGAGLFVMISSAAQLLICLTWLVVWTPLPAREYQRFPHLVMLECTETNSLGFILAFLYNGLLSISAFACSYLGKDLPENYNEAKCVTFSLLFNFVSWIAFFTTASVYDGKYLPAANMMAGLSSLSSGFGGYFLPKCYVILCRPDLNSTEHFQASIQDYTRRCGST(SEQ ID NO 17)实施例6-hT1R2大鼠味觉受体的人定向同源物的预测的cds在下面提供为SEQ ID NO 20,指定为rT1R2。hT1R2序列的推定翻译序列也在此处描述为SEQ ID NO 21。根据本发明,通过DNA印迹将hT1R2的最初两个外显子鉴定为在PAC中。外显子1是在DNA印迹实验中鉴定的BamH I/BgIII片段中分离的,而外显子2是在跨越外显子1和外显子3的PCR产物中分离的。对rT1R2序列与这最初两个外显子的比较确定该两个外显子编码rT1R2的人对应物的N-末端。例如,由两个外显子编码的hT1R2 N-末端序列和rT1R2的相应区域之间的成对氨基酸一致性为约72%,而公共DNA序列数据库中最相关的注释的序列与hT1R2仅有约48%的一致性。
hT1R2预测的cds(SEQ ID NO 20)ATGGGGCCCAGGGCAAAGACCATCTGCTCCCTGTTCTTCCTCCTATGGGTCCTGGCTGAGCCGGCTGAGAACTCGGACTTCTACCTGCCTGGGGATTACCTCCTGGGTGGCCTCTTCTCCCTCCATGCCAACATGAAGGGCATTGTTCACCTTAACTTCCTGCAGGTGCCCATGTGCAAGGAGTATGAAGTGAAGGTGATAGGCTACAACCTCATGCAGGCCATGCGCTTCGCGGTGGAGGAGATCAACAATGACAGCAGCCTGCTGCCTGGTGTGCTGCTGGGCTATGAGATCGTGGATGTGTGCTACATCTCCAACAATGTCCAGCCGGTGCTCTACTTCCTGGCACACGAGGACAACCTCCTTCCCATCCAAGAGGACTACAGTAACTACATTTCCCGTGTGGTGGCTGTCATTGGCCCTGACAACTCCGAGTCTGTCATGACTGTGGCCAACTTCCTCTCCCTATTTCTCCTTCCACAGATCACCTACAGCGCCATCAGCGATGAGCTGCGAGACAAGGTGCGCTTCCCGGCTTTGCTGCGTACCACACCCAGCGCCGACCACCACGTCGAGGCCATGGTGCAGCTGATGCTGCACTTCCGCTGGAACTGGATCATTGTGCTGGTGAGCAGCGACACCTATGGCCGCGACAATGGCCAGCTGCTTGGCGAGCGCGTGGCCCGGCGCGACATCTGCATCGCCTTCCAGGAGACGCTG
CCCACACTGCAGCCCAACCAGAACATGACGTCAGAGGAGCGCCAGCGCCTGGTGACCATTGTGGACAAGCTGCAGCAGAGCACAGCGCGCGTCGTGGTCGTGTTCTCGCCCGACCTGACCCTGTACCACTTCTTCAATGAGGTGCTGCGCCAGAACTTCACGGGCGCCGTGTGGATCGCCTCCGAGTCCTGGGCCATCGACCCGGTCCTGCACAACCTCACGGAGCTGGGCCACTTGGGCACCTTCCTGGGCATCACCATCCAGAGCGTGCCCATCCCGGGCTTCAGTGAGTTCCGCGAGTGGGGCCCACAGGCTGGGCCGCCACCCCTCAGCAGGACCAGCCAGAGCTATACCTGCAACCAGGAGTGCGACAACTGCCTGAACGCCACCTTGTCCTTCAACACCATTCTCAGGCTCTCTGGGGAGCGTGTCGTCTACAGCGTGTACTCTGCGGTCTATGCTGTGGCCCATGCCCTGCACAGCCTCCTCGGCTGTGACAAAAGCACCTGCACCAAGAGGGTGGTCTACCCCTGGCAGCTGCTTGAGGAGATCTGGAAGGTCAACTTCACTCTCCTGGACCACCAAATCTTCTTCGACCCGCAAGGGGACGTGGCTCTGCACTTGGAGATTGTCCAGTGGCAATGGGACCGGAGCCAGAATCCCTTCCAGAGCGTCGCCTCCTACTACCCCCTGCAGCGACAGCTGAAGAACATCCAAGACATCTCCTGGCACACCGTCAACAACACGATCCCTATGTCCATGTGTTCCAAGAGGTGCCAGTCAGGGCAAAAGAAGAAGCCTGTGGGCATCCACGTCTGCTGCTTCGAGTGCATCGACTGCCTTCCCGGCACCTTCCTCAACCACACTGAAGATGAATATGAATGCCAGGCCTGCCCGAATAACGAGTGGTCCTACCAGAGTGAGACCTCCTGCTTCAAGCGGCAGCTGGTCTTCCTGGAATGGCATGAGGCACCCACCATCGCTGTGGCCCTGCTGGCCGCCCTGGGCTTCCTCAGCACCCTGGCCATCCTGGTGATATTCTGGAGGCACTTCCAGACACCCATAGTTCGCTCGGCTGGGGGCCCCATGTGCTTCCTGATGCTGACACTGCTGCTGGTGGCATACATGGTGGTCCCGGTGTACGTGGGGCCGCCCAAGGTCTCCACCTGCCTCTGCCGCCAGGCCCTCTTTCCCCTCTGCTTCACAATTTGCATCTCCTGTATCGCCGTGCGTTCTTTCCAGATCGTCTGCGCCTTCAAGATGGCCAGCCGCTTCCCACGCGCCTACAGCTACTGGGTCCGCTACCAGGGGCCCTACGTCTCTATGGCATTTATCACGGTACTCAAAATGGTCATTGTGGTAATTGGCATGCTGGCCACGGGCCTCAGTCCCACCACCCGTACTGACCCCGATGACCCCAAGATCACAATTGTCTCCTGTAACCCCAACTACCGCAACAGCCTGCTGTTCAACACCAGCCTGGACCTGCTGCTCTCAGTGGTGGGTTTCAGCTTCGCCTACATGGGCAAAGAGCTGCCCACCAACTACAACGAGGCCAAGTTCATCACCCTCAGCATGACCTTCTATTTCACCTCATCCGTCTCCCTCTGCACCTTCATGTCTGCCTACAGCGGGGTGCTGGTCACCATCGTGGACCTCTTGGTCACTGTGCTCAACCTCCTGGCCATCAGCCTGGGCTACT
TCGGCCCCAAGTGCTACATGATCCTCTTCTACCCGGAGCGCAACACGCCCGCCTACTTCAACAGCATGATCCAGGGCTACACCATGAGGAGGGACTAG(SEQID NO.20)hT1R2推定的氨基酸序列(SEQ ID NO 21)MGPRAKTICSLFFLLWVLAEPAENSDFYLPGDYLLGGLFSLHANMKGIVHLNFLQVPMCKEYEVKVIGYNLMQAMRFAVEEINNDSSLLPGVLLGYEIVDVCYISNNVQPVLYFLAHEDNLLPIQEDYSNYISRVVAVIGPDNSESVMTVANFLSLFLLPQITYSAISDELRDKVRFPALLRTTPSADHHVEAMVQLMLHFRWNWIIVLVSSDTYGRDNGQLLGERVARRDICIAFQETLPTLQPNQNMTSEERQRLVTIVDKLQQSTARVVVVFSPDLTLYHFFNEVLRQNFTGAVWIASESWAIDPVLHNLTELGHLGTFLGITIQSVPIPGFSEFREWGPQAGPPPLSRTSQSYTCNQECDNCLNATLSFNTILRLSGERWYSVYSAVYAVAHALHSLLGCDKSTCTKRWYPWQLLEEIWKVNFTLLDHQIFFDPQGDVALHLEIVQWQWDRSQNPFQSVASYYPLQRQLKNIQDISWHTVNNTIPMSMCSKRCQSGQKKKPVGIHVCCFECI DCLPGTFLNHTEDEYECQACPNNEWSYQSETSCFKRQLVFLEWHEAPTIAVALLAALGFLSTLAILVIFWRHFQTPIVRSAGGPMCFLMLTLLLVAYMWPVYVGPPKVSTCLCRQALFPLCFTICISCIAVRSFQIVCAFKMASRFPRAYSYWVRYQGPYVSMAFITVLKMVIVVIGMLATGLSPTTRTDPDDPKITIVSCNPNYRNSLLFNTSLDLLLSVVGFSFAYMGKELPTNYNEAKFITLSMTFYFTSSVSLCTFMSAYSGVLVTIVDLLVTVLNLLAISLGYFGPKCYMILFYPERNTPAYFNSMIQGYTMRRD(SEQ ID NO.21)实施例7T1Rs在异源细胞中异源表达的方法使稳定地表达Gα15的HEK-293衍生细胞(Chandrashekar等人,Cell 100(6)703-11(2000))于37℃生长并维持于Dulbecco’s Modified Eagle Medium(DMEM,Gibco BRL)上,该培养基补充了10%的FBS、MEM非必需氨基酸(Gibco BRL)和3μg/ml的杀稻瘟素。对于钙-成像实验,首先将细胞接种于24-孔的组织培养平板上(约每孔10万个细胞),并用Mirus Translt-293(PanVera)通过脂质转染法进行转染。为了使谷氨酸诱导的和葡萄糖诱导的脱敏减到最小,在转染后约24小时用低葡萄糖的DMEM/GlutaMAX(Gibco BRL)置换补加的DMEM。24个小时后,在室温使细胞被钙染料Fluo-4(Molecular Probes)装载1.5个小时,该染料在Dulbecco’s PBS缓冲液(DPBS,Gibco BRL)中为3μM。在用DPBS置换之后,通过添加200μl补充了味觉刺激物的DPBS于室温进行了刺激。钙的活动化是用Imaging Workbench 4.0软件(Axon)在Axiovert S100 TV显微镜(Zeiss)上监控的。T1R1/T1R3和T1R2/T1R3反应是显著地瞬时和不同时的,其中钙的释放很少持续15秒之上。因而反应细胞的数目在整个过程中是相对恒定的;因此,通过在固定的时间点人工计数反应细胞的数目来测定细胞反应的数量,一般是在刺激添加30秒之后测定的。
实施例8人T1R2/T1R3发挥甜味受体的功能用人T1R2、T1R3和T1R2/T1R3瞬时转染稳定表达Gα15的HEK细胞,并测定响应于蔗糖浓度的增加的细胞内钙的增加(图1(a))。同样地,对几种甜味刺激物确定了T1R2/T1R3的剂量反应(图1(b))。对于不同的增甜剂反应细胞的最大百分比是不同的,在10-30%范围内。为清楚起见,使剂量反应对反应细胞的最大百分比进行了标准化。图1中的值代表4种独立反应的平均值±标准差。X-轴的圆标记了由味觉检验确定的心理物理学探测阈值。Gurmarin(10g/l过滤的Gymnema sylvestre水提取物的50-倍稀释液)抑制T1R2/T1R3对250mM蔗糖的反应,但不抑制内源β2-肾上腺素能受体对20μM异丙基肾上腺素的反应(图1(b))。图1(c)含有T1R2/T1R3共表达细胞系对不同增甜剂(蔗糖、阿斯巴甜、色氨酸和糖精)的标准化的反应。
实施例9大鼠T1R2/T1R3发挥甜味受体的功能用hT1R2/hT1R3、rT1R2/rT1R3、hT1R2/rT1R3和rT1R2/hT1R3瞬时转染稳定表达Gα15的HEK细胞。然后测定这些转染的细胞响应于350mM蔗糖、25mM色氨酸、15mM阿斯巴甜和0.05应乐果甜蛋白的细胞内钙的增加。蔗糖和阿斯巴甜的结果包含于图2中,且显示rT1R2/rT1R3也发挥甜味受体的功能。同样地,这些结果表明T1R2可控制T1R2/T1R3配体特异性。
实施例10人T1R1/T1R3发挥umami受体的功能用人T1R1、T1R3和T1R1/T1R3瞬时转染稳定表达Gα15的HEK细胞,并测定响应于谷氨酸浓度增加(图3(a))和响应于0.5mM谷氨酸、0.2mM IMP和0.5mM谷氨酸加0.2mM IMP(图3(b))的细胞内钙的增加。在0.2mM IMP存在与不存在时对谷氨酸确定了人T1R1/T1R3的剂量反应(图3(c))。反应细胞的最大百分比对于谷氨酸为约5%,且对于谷氨酸加IMP为约10%。为清楚起见,使剂量反应对反应细胞的最大百分比进行了标准化。该值代表4种独立反应的平均值±标准差。X-轴的圆标记了由味觉检验确定的心理物理学探测阈值。
实施例11作为输出序列的PDZIP将六残基PDZIP序列(SVSTW(SEQ ID NO22))与hT1R2的C-末端融合,且将嵌合受体(即hT1R2-PDZIP)转染入HEK-293宿主细胞。然后对hT1R2的表面表达用免疫荧光和FACS扫描数据进行监控。如在图6A和6B中所显示的,PDZIP序列的包含增加了hT1R2-PDZIP相对于hT1R2的表面表达。
PKZIP序列
SVSTVV(SEQ ID NO22)更特定地,图4表示myc-标记的hT1R2的免疫荧光染色,证明PDZIP显著地增加了质膜上hT1R2蛋白质的量。图4B表示证明了同样结果的FACS分析数据。——表达myc-标记的hT1R2的细胞以虚线显示,且表达myc-标记的hT1R2-PDZIP的细胞以实线显示。
实施例12稳定共表达T1R1/T1R3或T1R2/T1R3的细胞系的生成通过将线性化的源自PEAK10(Edge Biosystems)的载体(含有pCDNA3.1)和源自ZEO的载体(Invitrogen)转染入Gα15表达细胞系中而生成了稳定共表达人T1R2/T1R3或T1R1/T1R3的人细胞系,所述载体分别含有hT1R1或hT1R2表达构建体(对于T1R1为质粒SAV2485,对于T1R2为SAV2486)和hT1R3(对于T1R3为质粒SXV550)。特定地,T1R2/T1R3稳定细胞系是通过将线性化的SAV2486和SXV550共转染入稳定表达Gα15的Aurora Bioscience’sHEK-293细胞系中而生产的。T1R1/T1R3稳定细胞系是通过将线性化的SAV2485和SXV550共转染入稳定表达Gα15的相同HEK-293细胞系中而生产的。在SAV2485/SCV550和SAV2486/SXV550转染后,将嘌呤霉素抗性的和zeocin-抗性的群体选择、扩增并用钙成像检验其对甜或umami味刺激物的反应。在0.0005mg/ml嘌呤霉素(CALBIOCHEM)和0.1mg/ml zeocin(Invitrogen)中于37℃从低葡萄糖的DMEM中选择细胞,该DMEM补充了GlutaMAX、10%透析的FBS和0.003mg/ml杀稻瘟素。将抗性群体进行了扩增,且将其对甜味刺激物的反应用荧光显微镜进行了评估。为了在VIPR-II仪器(Aurora Biosciences)上进行自动荧光测定成像,首先在96-孔的平板上接种了T1R2/T1R3稳定细胞(每孔约15,000个细胞)。24个小时之后,在室温使细胞被钙染料fluo-3-AM(Molecular Probes)装载1个小时,该染料在PBS中为0.005mM。在用70ml PBS置换之后,通过添加70ml补充了味觉刺激物的PBS于室温进行了刺激。对在化合物添加后20~30秒的荧光(480nm激发和535nm发射波长)反应进行了平均,对在化合物添加之前测量的背景荧光进行了校正,并使其对一种钙离子载体0.001mM的离子霉素(CALBIOCHEM)的反应进行了标准化。然后观察到当这些细胞系与甜味或umami接触时,对于活性克隆一般80-100%的细胞对味觉刺激物有反应。出乎意料地,单独细胞反应的等级显著地大于瞬时转染细胞的反应。基于该观察,本发明者用上述的Aurora Bioscience’sVIPR仪器通过自动荧光测定成像检验了T1R稳定细胞系的活性。2个T1R1/T1R3和1个T1R2/T1R3细胞系的反应分别显示于图5和图6中。显著地,反应细胞增加的数目和增加的反应等级一起导致相对于瞬时转染的细胞的大于10倍的活性增加。(通过比较的方式,对于用T1R2/T1R3瞬时转染的细胞的离子霉素反应的百分数在最适条件下约为5%)。此外,对于稳定表达的人T1R2/T1R3和T1R1/T1R3的剂量反应与人味觉探测阈值相关。这些稳定细胞系的强T1R活性提示它们非常适合用于对化学文库的高生产量的筛选以鉴定化合物,如小分子,该化合物调节甜或umami味觉受体并因此调节、增强、阻断或模拟甜或umami味觉。虽然前述的详细说明书描述了本发明的几个实施方案,但应理解上述的说明书仅仅是说明性的,且不限制公开的本发明。本发明仅通过后面的权利要求进行限制。
序列表<110>ADLER,JON ELLIOTLI,XIAODONGSTASZEWSKI,LENAO’CONNELL,SHAWNZOZULYA,SERGEY<120>T1R味觉受体及其编码基因<130>078003-0280681<140>10/035,045<141>2002-01-03<150>60/259,227<151>2001-01-03<150>60/284,547<151>2001-04-19<160>24<170>PatentIn Ver.2.1<210>1<211>876<212>DNA<213>智人<400>1agcctggcag tggcctcagg cagagtctga cgcgcacaaa ctttcaggcc caggaagcga 60ggacaccact ggggccccag ggtgtggcaa gtgaggatgg caagggtttt gctaaacaaa 120tcctctgccc gctccccgcc ccgggctcac tccatgtgag gccccagtcg gggcagccac 180ctgccgtgcc tgttggaagt tgcctctgcc atgctgggcc ctgctgtcct gggcctcagc 240ctctgggctc tcctgcaccc tgggacgggg gccccattgt gcctgtcaca gcaacttagg 300atgaaggggg actacgtgct gggggggctg ttccccctgg gcgaggccga ggaggctggc 360ctccgcagcc ggacacggcc cagcagccct gtgtgcacca ggtacagagg tgggacggcc 420tgggtcgggg tcagggtgac caggtctggg gtgctcctga gctggggccg aggtggccat 480ctgcggttct gtgtggcccc aggttctcct caaacggcct gctctgggca ctggccatga 540aaatggccgt ggaggagatc aacaacaagt cggatctgct gcccgggctg cgcctgggct 600acgacctctt tgatacgtgc tcggagcctg tggtggccat gaagcccagc ctcatgttcc 660tggccaaggc aggcagccgc gacatcgccg cctactgcaa ctacacgcag taccagcccc 720gtgtgctggc tgtcatcggg ccccactcgt cagagctcgc catggtcacc ggcaagttct 780tcagcttctt cctcatgccc cagtggggcg ccccccaccg tcacccaccc ccaaccaacc 840
cctgccccgt gggagcccct tgtgtcagga gaatgc 876<210>2<211>2687<212>DNA<213>智人<400>2tacatgcacc ccacccagcc ctgccctggg agccctgtgt cagaagatgc tcttggcctt 60gcaggtcagc tacggtgcta gcatggagct gctgagcgcc cgggagacct tcccctcctt 120cttccgcacc gtgcccagcg accgtgtgca gctgacggcc gccgcggagc tgctgcagga 180gttcggctgg aactgggtgg ccgccctggg cagcgacgac gagtacggcc ggcagggcct 240gagcatcttc tcggccctgg ccgcggcacg cggcatctgc atcgcgcacg agggcctggt 300gccgctgccc cgtgccgatg actcgcggct ggggaaggtg caggacgtcc tgcaccaggt 360gaaccagagc agcgtgcagg tggtgctgct gttcgcctcc gtgcacgccg cccacgccct 420cttcaactac agcatcagca gcaggctctc gcccaaggtg tgggtggcca gcgaggcctg 480gctgacctct gacctggtca tggggctgcc cggcatggcc cagatgggca cggtgcttgg 540cttcctccag aggggtgccc agctgcacga gttcccccag tacgtgaaga cgcacctggc 600cctggccacc gacccggcct tctgctctgc cctgggcgag agggagcagg gtctggagga 660ggacgtggtg ggccagcgct gcccgcagtg tgactgcatc acgctgcaga acgtgagcgc 720agggctaaat caccaccaga cgttctctgt ctacgcagct gtgtatagcg tggcccaggc 780cctgcacaac actcttcagt gcaacgcctc aggctgcccc gcgcaggacc ccgtgaagcc 840ctggcaggtg agcccgggag atgggggtgt gctgtcctct gcatgtgccc aggccaccag 900gcacggccac cacgcctgag ctggaggtgg ctggcggctc agccccgtcc cccgcccgca 960gctcctggag aacatgtaca acctgacctt ccacgtgggc gggctgccgc tgcggttcga 1020cagcagcgga aacgtggaca tggagtacga cctgaagctg tgggtgtggc agggctcagt 1080gcccaggctc cacgacgtgg gcaggttcaa cggcagcctc aggacagagc gcctgaagat 1140ccgctggcac acgtctgaca accaggtgag gtgagggtgg gtgtgccagg cgtgcccgtg 1200gtagcccccg cggcagggcg cagcctgggg gtgggggccg ttccagtctc ccgtgggcat 1260gcccagccga gcagagccag accccaggcc tgtgcgcaga agcccgtgtc ccggtgctcg 1320cggcagtgcc aggagggcca ggtgcgccgg gtcaaggggt tccactcctg ctgctacgac 1380tgtgtggact gcgaggcggg cagctaccgg caaaacccag gtgagccgcc ttcccggcag 1440gcgggggtgg gaacgcagca ggggagggtc ctgccaagtc ctgactctga gaccagagcc 1500cacagggtac aagacgaaca cccagcgccc ttctcctctc tcacagacga catcgcctgc 1560accttttgtg gccaggatga gtggtccccg gagcgaagca cacgctgctt ccgccgcagg 1620tctcggttcc tggcatgggg cgagccggct gtgctgctgc tgctcctgct gctgagcctg 1680gcgctgggcc ttgtgctggc tgctttgggg ctgttcgttc accatcggga cagcccactg 1740gttcaggcct cgggggggcc cctggcctgc tttggcctgg tgtgcctggg cctggtctgc 1800ctcagcgtcc tcctgttccc tggccagccc agccctgccc gatgcctggc ccagcagccc 1860ttgtcccacc tcccgctcac gggctgcctg agcacactct tcctgcaggc ggccgagatc 1920ttcgtggagt cagaactgcc tctgagctgg gcagaccggc tgagtggctg cctgcggggg 1980ccctgggcct ggctggtggt gctgctggcc atgctggtgg aggtcgcact gtgcacctgg 2040tacctggtgg ccttcccgcc ggaggtggtg acggactggc acatgctgcc cacggaggcg 2100ctggtgcact gccgcacacg ctcctgggtc agcttcggcc tagcgcacgc caccaatgcc 2160
acgctggcct ttctctgctt cctgggcact ttcctggtgc ggagccagcc gggctgctac 2220aaccgtgccc gtggcctcac ctttgccatg ctggcctact tcatcacctg ggtctccttt 2280gtgcccctcc tggccaatgt gcaggtggtc ctcaggcccg ccgtgcagat gggcgccctc 2340ctgctctgtg tcctgggcat cctggctgcc ttccacctgc ccaggtgtta cctgctcatg 2400cggcagccag ggctcaacac ccccgagttc ttcctgggag ggggccctgg ggatgcccaa 2460ggccagaatg acgggaacac aggaaatcag gggaaacatg agtgacccaa ccctgtgatc 2520tcagccccgg tgaacccaga cttagctgcg atccccccca agccagcaat gacccgtgtc 2580tcgctacaga gaccctcccg ctctaggttc tgaccccagg ttgtctcctg accctgaccc 2640cacagtgagc cctaggcctg gagcacgtgg acacccctgt gaccatc 2687<210>3<211>2559<212>DNA<213>智人<400>3atgctgggcc ctgctgtcct gggcctcagc ctctgggctc tcctgcaccc tgggacgggg 60gccccattgt gcctgtcaca gcaacttagg atgaaggggg actacgtgct gggggggctg 120ttccccctgg gcgaggccga ggaggctggc ctccgcagcc ggacacggcc cagcagccct 180gtgtgcacca ggttctcctc aaacggcctg ctctgggcac tggccatgaa aatggccgtg 240gaggagatca acaacaagtc ggatctgctg cccgggctgc gcctgggcta cgacctcttt 300gatacgtgct cggagcctgt ggtggccatg aagcccagcc tcatgttcct ggccaaggca 360ggcagccgcg acatcgccgc ctactgcaac tacacgcagt accagccccg tgtgctggct 420gtcatcgggc cccactcgtc agagctcgcc atggtcaccg gcaagttctt cagcttcttc 480ctcatgcccc aggtcagcta cggtgctagc atggagctgc tgagcgcccg ggagaccttc 540ccctccttct tccgcaccgt gcccagcgac cgtgtgcagc tgacggccgc cgcggagctg 600ctgcaggagt tcggctggaa ctgggtggcc gccctgggca gcgacgacga gtacggccgg 660cagggcctga gcatcttctc ggccctggcc gcggcacgcg gcatctgcat cgcgcacgag 720ggcctggtgc cgctgccccg tgccgatgac tcgcggctgg ggaaggtgca ggacgtcctg 780caccaggtga accagagcag cgtgcaggtg gtgctgctgt tcgcctccgt gcacgccgcc 840cacgccctct tcaactacag catcagcagc aggctctcgc ccaaggtgtg ggtggccagc 900gaggcctggc tgacctctga cctggtcatg gggctgcccg gcatggccca gatgggcacg 960gtgcttggct tcctccagag gggtgcccag ctgcacgagt tcccccagta cgtgaagacg 1020cacctggccc tggccaccga cccggccttc tgctctgccc tgggcgagag ggagcagggt 1080ctggaggagg acgtggtggg ccagcgctgc ccgcagtgtg actgcatcac gctgcagaac 1140gtgagcgcag ggctaaatca ccaccagacg ttctctgtct acgcagctgt gtatagcgtg 1200gcccaggccc tgcacaacac tcttcagtgc aacgcctcag gctgccccgc gcaggacccc 1260gtgaagccct ggcagctcct ggagaacatg tacaacctga ccttccacgt gggcgggctg 1320ccgctgcggt tcgacagcag cggaaacgtg gacatggagt acgacctgaa gctgtgggtg 1380tggcagggct cagtgcccag gctccacgac gtgggcaggt tcaacggcag cctcaggaca 1440gagcgcctga agatccgctg gcacacgtct gacaaccaga agcccgtgtc ccggtgctcg 1500cggcagtgcc aggagggcca ggtgcgccgg gtcaaggggt tccactcctg ctgctacgac 1560tgtgtggact gcgaggcggg cagctaccgg caaaacccag acgacatcgc ctgcaccttt 1620tgtggccagg atgagtggtc cccggagcga agcacacgct gcttccgccg caggtctcgg 1680
ttcctggcat ggggcgagcc ggctgtgctg ctgctgctcc tgctgctgag cctggcgctg 1740ggccttgtgc tggctgcttt ggggctgttc gttcaccatc gggacagccc actggttcag 1800gcctcggggg ggcccctggc ctgctttggc ctggtgtgcc tgggcctggt ctgcctcagc 1860gtcctcctgt tccctggcca gcccagccct gcccgatgcc tggcccagca gcccttgtcc 1920cacctcccgc tcacgggctg cctgagcaca ctcttcctgc aggcggccga gatcttcgtg 1980gagtcagaac tgcctctgag ctgggcagac cggctgagtg gctgcctgcg ggggccctgg 2040gcctggctgg tggtgctgct ggccatgctg gtggaggtcg cactgtgcac ctggtacctg 2100gtggccttcc cgccggaggt ggtgacggac tggcacatgc tgcccacgga ggcgctggtg 2160cactgccgca cacgctcctg ggtcagcttc ggcctagcgc acgccaccaa tgccacgctg 2220gcctttctct gcttcctggg cactttcctg gtgcggagcc agccgggctg ctacaaccgt 2280gcccgtggcc tcacctttgc catgctggcc tacttcatca cctgggtctc ctttgtgccc 2340ctcctggcca atgtgcaggt ggtcctcagg cccgccgtgc agatgggcgc cctcctgctc 2400tgtgtcctgg gcatcctggc tgccttccac ctgcccaggt gttacctgct catgcggcag 2460ccagggctca acacccccga gttcttcctg ggagggggcc ctggggatgc ccaaggccag 2520aatgacggga acacaggaaa tcaggggaaa catgagtga2559<210>4<211>852<212>PRT<213>智人<400>4Met Leu Gly Pro Ala Val Leu Gly Leu Ser Leu Trp Ala Leu Leu His1 5 10 15Pro Gly Thr Gly Ala Pro Leu Cys Leu Ser Gln Gln Leu Arg Met Lys20 25 30Gly Asp Tyr Val Leu Gly Gly Leu Phe Pro Leu Gly Glu Ala Glu Glu35 40 45Ala Gly Leu Arg Ser Arg Thr Arg Pro Ser Ser Pro Val Cys Thr Arg50 55 60Phe Set Ser Ash Gly Leu Leu Trp Ala Leu Ala Met Lys Met Ala Val65 70 75 80Glu Glu Ile Asn Asn Lys Ser Asp Leu Leu Pro Gly Leu Arg Leu Gly85 90 95Tyr Asp Leu Phe Asp Thr Cys Ser Glu Pro Val Val Ala Met Lys Pro100 105 110Ser Leu Met Phe Leu Ala Lys Ala Gly Ser Arg Asp Ile Ala Ala Tyr
115 120 125Cys Asn Tyr Thr Gln Tyr Gln Pro Arg Val Leu Ala Val Ile Gly Pro130 135 140His Ser Ser Glu Leu Ala Met Val Thr Gly Lys Phe Phe Ser Phe Phe145 150 155 160Leu Met Pro Gln Val Ser Tyr Gly Ala Ser Met Glu Leu Leu Ser Ala165 170 175Arg Glu Thr Phe Pro Ser Phe Phe Arg Thr Val Pro Ser Asp Arg Val180 185 190Gln Leu Thr Ala Ala Ala Glu Leu Leu Gln Glu Phe Gly Trp Asn Trp195 200 205Val Ala Ala Leu Gly Ser Asp Asp Glu Tyr Gly Arg Gln Gly Leu Ser210 215 220Ile Phe Ser Ala Leu Ala Ala Ala Arg Gly Ile Cys Ile Ala His Glu225 230 235 240Gly Leu Val Pro Leu Pro Arg Ala Asp Asp Ser Arg Leu Gly Lys Val245 250 255Gln Asp Val Leu His Gln Val Asn Gln Ser Ser Val Gln Val Val Leu260 265 270Leu Phe Ala Ser Val His Ala Ala His Ala Leu Phe Asn Tyr Ser Ile275 280 285Ser Ser Arg Leu Ser Pro Lys Val Trp Val Ala Ser Glu Ala Trp Leu290 295 300Thr Ser Asp Leu Val Met Gly Leu Pro Gly Met Ala Gln Met Gly Thr305 310 315 320Val Leu Gly Phe Leu Gln Arg Gly Ala Gln Leu His Glu Phe Pro Gln325 330 335Tyr Val Lys Thr His Leu Ala Leu Ala Thr Asp Pro Ala Phe Cys Ser340 345 350Ala Leu Gly Glu Arg Glu Gln Gly Leu Glu Glu Asp Val Val Gly Gln
355 360 365Arg Cys Pro Gln Cys Asp Cys Ile Thr Leu Gln Asn Val Ser Ala Gly370 375 380Leu Asn His His Gln Thr Phe Ser Val Tyr Ala Ala Val Tyr Ser Val385 390 395 400Ala Gln Ala Leu His Asn Thr Leu Gln Cys Asn Ala Ser Gly Cys Pro405 410 415Ala Gln Asp Pro Val Lys Pro Trp Gln Leu Leu Glu Asn Met Tyr Asn420 425 430Leu Thr Phe His Val Gly Gly Leu Pro Leu Arg Phe Asp Ser Ser Gly435 440 445Asn Val Asp Met Glu Tyr Asp Leu Lys Leu Trp Val Trp Gln Gly Ser450 455 460Val Pro Arg Leu His Asp Val Gly Arg Phe Asn Gly Ser Leu Arg Thr465 470 475 480Glu Arg Leu Lys Ile Arg Trp His Thr Ser Asp Asn Gln Lys Pro Val485 490 495Ser Arg Cys Ser Arg Gln Cys Gln Glu Gly Gln Val Arg Arg Val Lys500 505 510Gly Phe His Ser Cys Cys Tyr Asp Cys Val Asp Cys Glu Ala Gly Ser515 520 525Tyr Arg Gln Asn Pro Asp Asp Ile Ala Cys Thr Phe Cys Gly Gln Asp530 535 540Glu Trp Ser Pro Glu Arg Ser Thr Arg Cys Phe Arg Arg Arg Ser Arg545 550 555 560Phe Leu Ala Trp Gly Glu Pro Ala Val Leu Leu Leu Leu Leu Leu Leu565 570 575Ser Leu Ala Leu Gly Leu Val Leu Ala Ala Leu Gly Leu Phe Val His580 585 590His Arg Asp Ser Pro Leu Val Gln Ala Ser Gly Gly Pro Leu Ala Cys
595 600 605Phe Gly Leu Val Cys Leu Gly Leu Val Cys Leu Ser Val Leu Leu Phe610 6l5 620Pro Gly Gln Pro Ser Pro Ala Arg Cys Leu Ala Gln Gln Pro Leu Ser625 630 635 640His Leu Pro Leu Thr Gly Cys Leu Ser Thr Leu Phe Leu Gln Ala Ala645 650 655Glu Ile Phe Val Glu Ser Glu Leu Pro Leu Ser Trp Ala Asp Arg Leu660 665 670Ser Gly Cys Leu Arg Gly Pro Trp Ala Trp Leu Val Val Leu Leu Ala675 680 685Met Leu Val Glu Val Ala Leu Cys Thr Trp Tyr Leu Val Ala Phe Pro690 695 700Pro Glu Val Val Thr Asp Trp His Met Leu Pro Thr Glu Ala Leu Val705 710 715 720His Cys Arg Thr Arg Ser Trp Val Ser Phe Gly Leu Ala His Ala Thr725 730 735Asn Ala Thr Leu Ala Phe Leu Cys Phe Leu Gly Thr Phe Leu Val Arg740 745 750Ser Gln Pro Gly Cys Tyr Asn Arg Ala Arg Gly Leu Thr Phe Ala Met755 760 765Leu Ala Tyr Phe Ile Thr Trp Val Ser Phe Val Pro Leu Leu Ala Asn770 775 780Val Gln Val Val Leu Arg Pro Ala Val Gln Met Gly Ala Leu Leu Leu785 790 795 800Cys Val Leu Gly Ile Leu Ala Ala Phe His Leu Pro Arg Cys Tyr Leu805 810 815Leu Met Arg Gln Pro Gly Leu Asn Thr Pro Glu Phe Phe Leu Gly Gly820 825 830Gly Pro Gly Asp Ala Gln Gly Gln Asn Asp Gly Asn Thr Gly Asn Gln
835 840 845Gly Lys His Glu850<210>5<211>23<212>DNA<213>人工序列<220>
<223>人工序列描述引物<220>
<221>修饰的碱基<222>(3)<223>a,t,c,g,其它或未知<220>
<221>修饰的碱基<222>(9)<223>a,t,c,g,其它或未知<220>
<221>修饰的碱基<222>(12)<223>a,t,c,g,其它或未知<220>
<221>修饰的碱基<222>(18)<223>a,t,c,g,其它或未知<400>5cgnttyytng cntggggnga rcc 23<210>6<211>23<212>DNA<213>人工序列<220>
<223>人工序列描述引物
<220>
<221>修饰的碱基<222>(3)<223>a,t,c,g,其它或未知<220>
<221>修饰的碱基<222>(6)<223>a,t,c,g,其它或未知<220>
<221>修饰的碱基<222>(18)<223>a,t,c,g,其它或未知<220>
<221>修饰的碱基<222>(21)<223>a,t,c,g,其它或未知<400>6cgngcncgrt trtarcancc ngg 23<210>7<211>9<212>PRT<213>智人<400>7Arg Phe Leu Ala Trp Gly Glu Pro Ala1 5<210>8<211>8<212>PRT<213>智人<400>8Pro Gly Cys Tyr Asn Arg Ala Arg1 5
<210>9<211>552<212>DNA<213>Mus sp.
<400>9gtgctgtcac tcctcctgct gctttgcctg gtgctgggtc tagcactggc tgctctgggg 60ctctctgtcc accactggga cagccctctt gtccaggcct caggcggctc acagttctgc 120tttggcctga tctgcctagg cctcttctgc ctcagtgtcc ttctgttccc aggacggcca 180agctctgcca gctgccttgc acaacaacca atggctcacc tccctctcac aggctgcctg 240agcacactct tcctgcaagc agctgagacc tttgtggagt ctgagctgcc actgagctgg 300gcaaactggc tatgcagcta ccttcgggac tctggcctgc tagtggtact gttggccact 360tttgtggagg cagcactatg tgcctggtat ttgaccgctt caccagaagt ggtgacagac 420tggtcagtgc tgcccacaga ggtactggag cactgccacg tgcgttcctg ggtcaacctg 480ggcttggtgc acatcaccaa tgcaatggta gcttttctct gctttctggg cactttcctg 540gtacaagacc ag 552<210>10<211>184<212>PRT<213>Mus sp.
<400>10Val Leu Ser Leu Leu Leu Leu Leu Cys Leu Val Leu Gly Leu Ala Leu1 5 10 15Ala Ala Leu Gly Leu Ser Val His His Trp Asp Ser Pro Leu Val Gln20 25 30Ala Ser Gly Gly Ser Gln Phe Cys Phe Gly Leu Ile Cys Leu Gly Leu35 40 45Phe Cys Leu Ser Val Leu Leu Phe Pro Gly Arg Pro Ser Ser Ala Ser50 55 60Cys Leu Ala Gln Gln Pro Met Ala His Leu Pro Leu Thr Gly Cys Leu65 70 75 80Ser Thr Leu Phe Leu Gln Ala Ala Glu Thr Phe Val Glu Ser Glu Leu85 90 95Pro Leu Ser Trp Ala Asn Trp Leu Cys Ser Tyr Leu Arg Asp Ser Gly100 105 110
Leu Leu Val Val Leu Leu Ala Thr Phe Val Glu Ala Ala Leu Cys Ala115 120 125Trp Tyr Leu Thr Ala Ser Pro Glu Val Val Thr Asp Trp Ser Val Leu130 135 140Pro Thr Glu Val Leu Glu His Cys His Val Arg Ser Trp Val Asn Leu145 150 155 160Gly Leu Val His Ile Thr Asn Ala Met Val Ala Phe Leu Cys Phe Leu165 170 175Gly Thr Phe Leu Val Gln Asp Gln180<210>11<211>558<212>DNA<213>Rattus sp.
<400>11gtgctgtcac ttctcctgct gctttgcctg gtgctgggcc tgacactggc tgccctgggg 60ctctttgtcc actactggga cagccctctt gttcaggcct caggtgggtc actgttctgc 120tttggcctga tctgcctagg cctcttctgc ctcagtgtcc ttctgttccc aggacgacca 180cgctctgcca gctgccttgc ccaacaacca atggctcacc tccctctcac aggctgcctg 240agcacactct tcctgcaagc agccgagatc tttgtggagt ctgagctgcc actgagttgg 300gcaaactggc tctgcagcta ccttcggggc ccctgggctt ggctggtggt actgctggcc 360actcttgtgg aggctgcact atgtgcctgg tacttgatgg ctttccctcc agaggtggtg 420acagattggc aggtgctgcc cacggaggta ctggaacact gccgcatgcg ttcctgggtc 480agcctgggct tggtgcacat caccaatgca ggggtagctt tcctctgctt tctgggcact 540ttcctggtac aaagccag 558<210>12<211>186<212>PRT<213>Rattus sp.
<400>12Val Leu Ser Leu Leu Leu Leu Leu Cys Leu Val Leu G1y Leu Thr Leu1 5 10 15Ala Ala Leu Gly Leu Phe Val His Tyr Trp Asp Ser Pro Leu Val Gln20 25 30
Ala Ser Gly Gly Ser Leu Phe Cys Phe Gly Leu Ile Cys Leu Gly Leu35 40 45Phe Cys Leu Ser Val Leu Leu Phe Pro Gly Arg Pro Arg Ser Ala Ser50 55 60Cys Leu Ala Gln Gln Pro Met Ala His Leu Pro Leu Thr Gly Cys Leu65 70 75 80Ser Thr Leu Phe Leu Gln Ala Ala Glu Ile Phe Val Glu Ser Glu Leu85 90 95Pro Leu Ser Trp Ala Asn Trp Leu Cys Ser Tyr Leu Arg Gly Pro Trp100 105 110Ala Trp Leu Val Val Leu Leu Ala Thr Leu Val Glu Ala Ala Leu Cys115 120 125Ala Trp Tyr Leu Met Ala Phe Pro Pro Glu Val Val Thr Asp Trp Gln130 135 140Val Leu Pro Thr Glu Val Leu Glu His Cys Arg Met Arg Ser Trp Val145 150 155 160Ser Leu Gly Leu Val His Ile Thr Asn Ala Gly Val Ala Phe Leu Cys165 170 175Phe Leu Gly Thr Phe Leu Val Gln Ser Gln180 185<210>13<211>2577<212>DNA<213>Rattus sp.
<400>13atgccgggtt tggctatctt gggcctcagt ctggctgctt tcctggagct tgggatgggg 60tcctctttgt gtctgtcaca gcaattcaag gcacaagggg actatatatt gggtggacta 120tttcccctgg gcacaactga ggaggccact ctcaaccaga gaacacagcc caacggcatc 180ctatgtacca ggttctcgcc ccttggtttg ttcctggcca tggctatgaa gatggctgta 240gaggagatca acaatggatc tgccttgctc cctgggctgc gactgggcta tgacctgttt 300gacacatgct cagagccagt ggtcaccatg aagcccagcc tcatgttcat ggccaaggtg 360ggaagtcaaa gcattgctgc ctactgcaac tacacacagt accaaccccg tgtgctggct 420
gtcattggtc cccactcatc agagcttgcc ctcattacag gcaagttctt cagcttcttc 480ctcatgccac aggtcagcta tagtgccagc atggatcggc taagtgaccg ggaaacattt 540ccatccttct tccgcacagt gcccagtgac cgggtgcagc tgcaggccgt tgtgacactg 600ttgcagaatt tcagctggaa ctgggtggct gccttaggta gtgatgatga ctatggccgg 660gaaggtctga gcatcttttc tggtctggcc aactcacgag gtatctgcat tgcacacgag 720ggcctggtgc cacaacatga cactagtggc caacaattgg gcaaggtggt ggatgtgcta 780cgccaagtga accaaagcaa agtacaggtg gtggtgctgt ttgcatctgc ccgtgctgtc 840tactcccttt ttagctacag catccttcat gacctctcac ccaaggtatg ggtggccagt 900gagtcctggc tgacctctga cctggtcatg acacttccca atattgcccg tgtgggcact 960gttcttgggt ttctgcagcg cggtgcccta ctgcctgaat tttcccatta tgtggagact 1020cgccttgccc tagctgctga cccaacattc tgtgcctccc tgaaagctga gttggatctg 1080gaggagcgcg tgatggggcc acgctgttca caatgtgact acatcatgct acagaacctg 1140tcatctgggc tgatgcagaa cctatcagct gggcagttgc accaccaaat atttgcaacc 1200tatgcagctg tgtacagtgt ggctcaggcc cttcacaaca ccctgcagtg caatgtctca 1260cattgccaca catcagagcc tgttcaaccc tggcagctcc tggagaacat gtacaatatg 1320agtttccgtg ctcgagactt gacactgcag tttgatgcca aagggagtgt agacatggaa 1380tatgacctga agatgtgggt gtggcagagc cctacacctg tactacatac tgtaggcacc 1440ttcaacggca cccttcagct gcagcactcg aaaatgtatt ggccaggcaa ccaggtgcca 1500gtctcccagt gctcccggca gtgcaaagat ggccaggtgc gcagagtaaa gggctttcat 1560tcctgctgct atgactgtgt ggactgcaag gcagggagct accggaagca tccagatgac 1620ttcacctgta ctccatgtgg caaggatcag tggtccccag aaaaaagcac aacctgctta 1680cctcgcaggc ccaagtttct ggcttggggg gagccagctg tgctgtcact tctcctgctg 1740ctttgcctgg tgctgggcct gacactggct gccctggggc tctttgtcca ctactgggac 1800agccctcttg ttcaggcctc aggtgggtca ctgttctgct ttggcctgat ctgcctaggc 1860ctcttctgcc tcagtgtcct tctgttccca ggacgaccac gctctgccag ctgccttgcc 1920caacaaccaa tggctcacct ccctctcaca ggctgcctga gcacactctt cctgcaagca 1980gccgagatct ttgtggagtc tgagctgcca ctgagttggg caaactggct ctgcagctac 2040cttcggggcc cctgggcttg gctggtggta ctgctggcca ctcttgtgga ggctgcacta 2100tgtgcctggt acttgatggc tttccctcca gaggtggtga cagattggca ggtgctgccc 2160acggaggtac tggaacactg ccgcatgcgt tcctgggtca gcctgggctt ggtgcacatc 2220accaatgcag tgttagcttt cctctgcttt ctgggcactt tcctggtaca gagccagcct 2280ggtcgctata accgtgcccg tggcctcacc ttcgccatgc tagcttattt catcatctgg 2340gtctcttttg tgcccctcct ggctaatgtg caggtggcct accagccagc tgtgcagatg 2400ggtgctatct tattctgtgc cctgggcatc ctggccacct tccacctgcc caaatgctat 2460gtacttctgt ggctgccaga gctcaacacc caggagttct tcctgggaag gagccccaag 2520gaagcatcag atgggaatag tggtagtagt gaggcaactc ggggacacag tgaatga2577<210>14<211>858<212>PRT<213>Rattus sp.
<400>14Met Pro Gly Leu Ala Ile Leu Gly Leu Ser Leu Ala Ala Phe Leu Glu
1 5 10 15Leu Gly Met Gly Ser Ser Leu Cys Leu Ser Gln Gln Phe Lys Ala Gln20 25 30Gly Asp Tyr Ile Leu Gly Gly Leu Phe Pro Leu Gly Thr Thr Glu Glu35 40 45Ala Thr Leu Asn Gln Arg Thr Gln Pro Asn Gly Ile Leu Cys Thr Arg50 55 60Phe Ser Pro Leu Gly Leu Phe Leu Ala Met Ala Met Lys Met Ala Val65 70 75 80Glu Glu Ile Asn Asn Gly Ser Ala Leu Leu Pro Gly Leu Arg Leu Gly85 90 95Tyr Asp Leu Phe Asp Thr Cys Ser Glu Pro Val Val Thr Met Lys Pro100 105 110Ser Leu Met Phe Met Ala Lys Val Gly Ser Gln Ser Ile Ala Ala Tyr115 120 125Cys Asn Tyr Thr Gln Tyr Gln Pro Arg Val Leu Ala Val Ile Gly Pro130 135 140His Ser Ser Glu Leu Ala Leu Ile Thr Gly Lys Phe Phe Ser Phe Phe145 150 155 160Leu Met Pro Gln Val Ser Tyr Ser Ala Ser Met Asp Arg Leu Ser Asp165 170 175Arg Glu Thr Phe Pro Ser Phe Phe Arg Thr Val Pro Ser Asp Arg Val180 185 190Gln Leu Gln Ala Val Val Thr Leu Leu Gln Asn Phe Ser Trp Asn Trp195 200 205Val Ala Ala Leu Gly Ser Asp Asp Asp Tyr Gly Arg Glu Gly Leu Ser210 215 220Ile Phe Ser Gly Leu Ala Asn Ser Arg Gly Ile Cys Ile Ala His Glu225 230 235 240Gly Leu Val Pro Gln His Asp Thr Ser Gly Gln Gln Leu Gly Lys Val
245 250 255Val Asp Val Leu Arg Gln Val Asn Gln Ser Lys Val Gln Val Val Val260 265 270Leu Phe Ala Ser Ala Arg Ala Val Tyr Ser Leu Phe Ser Tyr Ser Ile275 280 285Leu His Asp Leu Ser Pro Lys Val Trp Val Ala Ser Glu Ser Trp Leu290 295 300Thr Ser Asp Leu Val Met Thr Leu Pro Asn Ile Ala Arg Val Gly Thr305 310 315 320Val Leu Gly Phe Leu Gln Arg Gly Ala Leu Leu Pro Glu Phe Ser His325 330 335Tyr Val Glu Thr Arg Leu Ala Leu Ala Ala Asp Pro Thr Phe Cys Ala340 345 350Ser Leu Lys Ala Glu Leu Asp Leu Glu Glu Arg Val Met Gly Pro Arg355 360 365Cys Ser Gln Cys Asp Tyr Ile Met Leu Gln Asn Leu Ser Ser Gly Leu370 375 380Met Gln Asn Leu Ser Ala Gly Gln Leu His His Gln Ile Phe Ala Thr385 390 395 400Tyr Ala Ala Val Tyr Ser Val Ala Gln Ala Leu His Asn Thr Leu Gln405 410 415Cys Asn Val Ser His Cys His Thr Ser Glu Pro Val Gln Pro Trp Gln420 425 430Leu Leu Glu Asn Met Tyr Asn Met Ser Phe Arg Ala Arg Asp Leu Thr435 440 445Leu Gln Phe Asp Ala Lys Gly Ser Val Asp Met Glu Tyr Asp Leu Lys450 455 460Met Trp Val Trp Gln Ser Pro Thr Pro Val Leu His Thr Val Gly Thr465 470 475 480Phe Asn Gly Thr Leu Gln Leu Gln His Ser Lys Met Tyr Trp Pro Gly
485 490 495Asn Gln Val Pro Val Ser Gln Cys Ser Arg Gln Cys Lys Asp Gly Gln500 505 510Val Arg Arg Val Lys Gly Phe His Ser Cys Cys Tyr Asp Cys Val Asp515 520 525Cys Lys Ala Gly Ser Tyr Arg Lys His Pro Asp Asp Phe Thr Cys Thr530 535 540Pro Cys Gly Lys Asp Gln Trp Ser Pro Glu Lys Ser Thr Thr Cys Leu545 550 555 560Pro Arg Arg Pro Lys Phe Leu Ala Trp Gly Glu Pro Ala Val Leu Ser565 570 575Leu Leu Leu Leu Leu Cys Leu Val Leu Gly Leu Thr Leu Ala Ala Leu580 585 590Gly Leu Phe Val His Tyr Trp Asp Ser Pro Leu Val Gln Ala Ser Gly595 600 605Gly Ser Leu Phe Cys Phe Gly Leu Ile Cys Leu Gly Leu Phe Cys Leu610 615 620Ser Val Leu Leu Phe Pro Gly Arg Pro Arg Ser Ala Ser Cys Leu Ala625 630 635 640Gln Gln Pro Met Ala His Leu Pro Leu Thr Gly Cys Leu Ser Thr Leu645 650 655Phe Leu Gln Ala Ala Glu Ile Phe Val Glu Ser Glu Leu Pro Leu Ser660 665 670Trp Ala Asn Trp Leu Cys Ser Tyr Leu Arg Gly Pro Trp Ala Trp Leu675 680 685Val Val Leu Leu Ala Thr Leu Val Glu Ala Ala Leu Cys Ala Trp Tyr690 695 700Leu Met Ala Phe Pro Pro Glu Val Val Thr Asp Trp Gln Val Leu Pro705 710 715 720Thr Glu Val Leu Glu His Cys Arg Met Arg Ser Trp Val Ser Leu Gly
725 730 735Leu Val His Ile Thr Asn Ala Val Leu Ala Phe Leu Cys Phe Leu Gly740 745 750Thr Phe Leu Val Gln Ser Gln Pro Gly Arg Tyr Asn Arg Ala Arg Gly755 760 765Leu Thr Phe Ala Met Leu Ala Tyr Phe Ile Ile Trp Val Ser Phe Val770 775 780Pro Leu Leu Ala Asn Val Gln Val Ala Tyr Gln Pro Ala Val Gln Met785 790 795 800Gly Ala Ile Leu Phe Cys Ala Leu Gly Ile Leu Ala Thr Phe His Leu805 810 815Pro Lys Cys Tyr Val Leu Leu Trp Leu Pro Glu Leu Asn Thr Gln Glu820 825 830Phe Phe Leu Gly Arg Ser Pro Lys Glu Ala Ser Asp Gly Asn Ser Gly835 840 845Ser Ser Glu Ala Thr Arg Gly His Ser Glu850 855<210>15<211>8194<212>DNA<213>智人<220>
<221>修饰的碱基<222>(1251)..(1300)<223>a,t,c,g,其它或未知<220>
<221>修饰的碱基<222>(1951)..(2000)<223>a,t,c,g,其它或未知<400>15gagaatctcg cgagatcccg tcggtccgcc ccgctgccct cccagctgcc gaaaagaggg 60gcctccgagc cgccggcgcc ctctgccggc aacctccgga agcacactag gaggttccag 120
ccgatctggt cgaggggctc cacggaggac tccatttacg ttacgcaaat tccctacccc 180agccggccgg agagagaaag ccagaaacct cgcgaccagc catgggccac ctctccggaa 240aaacaccggg atattttttt tctcctgcag aaaaagcttt aggattggca gtttaaacaa 300aacatgtcta tttgcatacc ttcggtttgc atgcatttgt ttcgaagtga gcaaccctgg 360gtaacaaggc gaaagtatat gacaatttgc tcagaatctt aatgtcagaa aactggagac 420tggggcaggg gggtgtcgac tcaaagctgt gtctcattta gtaaactgag gcccaggtaa 480aaagttctga aacctcgcaa cacccggaga aattgtgttc cagcctccca cctcgcccca 540aaatgccaga gctccttttc taagccaggt gaagtcacag agcgtggaca gaacccacaa 600ccgtccagag gaagggtcac tgggtgccac ctggtttgca tctgtgcctt cgtcctgccc 660agttcctgag tgggaccgca ggcccggaat gtcaaggcaa acagtcctgc ttcagccact 720gggctccagt cccacccctt ttgggggcct gaagttagga agcatccggc agctgccttc 780tatttaagca actggcctcc ttagaggcca ctccttggcc atgccaggcg cgggcatctg 840gccagcatgc tgctctgcac ggctcgcctg gtcggcctgc agcttctcat ttcctgctgc 900tgggcctttg cctgccatag cacggagtct tctcctgact tcaccctccc cggagattac 960ctcctggcag gcctgttccc tctccattct ggctgtctgc aggtgaggca cagacccgag 1020gtgaccctgt gtgacaggtg agtgaggggc cagcagagcc acacttagtg ggacccctgg 1080ctatagggcc cctctggctg ccatcctcca aacaggacct tgcctctgcc tttgcccctt 1140gaactgtccc caggccttgt tcatcaatcc acttgccacc taagtgctgg ctagaccttc 1200ctagacactt cggccagttt ccaattattt cacccttgct gttagaatgt nnnnnnnnnn 1260nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn aattccttaa actaaatttc 1320tcactttctc tctctctctg gaaaacactg actaatgtag caggtttctc tgctccagga 1380cttcaggacc ttttcgatgc taataagttt ctccatcagg gccagcttgt tcctcctact 1440gagcttgaga gcccttgttg aagttgtggt ttgggggact ggaccgatga cctcaaaggt 1500tccctttgct cccaagcctc agagtctagg aggccagagg gtctcagcag gcctttgtcc 1560ttctcagctg tctcttactg gctttctcca caggtcttgt agcttcaatg agcatggcta 1620ccacctcttc caggctatgc ggcttggggt tgaggagata aacaactcca cggccctgct 1680gcccaacatc accctggggt accagctgta tgatgtgtgt tctgactctg ccaatgtgta 1740tgccacgctg agagtgctct ccctgccagg gcaacaccac atagagctcc aaggagacct 1800tctccactat tcccctacgg tgctggcagt gattgggcct gacagcacca accgtgctgc 1860caccacagcc gccctgctga gccctttcct ggtgcccatg gtaagctgga gcctcagacc 1920tttgcccatc tcccttcagg caagtctggg nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 1980nnnnnnnnnn nnnnnnnnnn gccaccatgc ccggctaatt tttttgtatt tttagtagag 2040acggggtttc accgtgttag ccaggctggt cgcaaactcc taacctcgtg atccacccac 2100ctcggcctcc caatgtgctg ggattacagg tgtgagccac tgcacccggc cataatgtat 2160taatataata aaataattat acaactcacc ataatgtaga atcagtggga gccctgagct 2220tgttttccta caactagatg gtcccatctg ggggtgatgg gagacagtga cagatcatca 2280gacattagat tctcataagt agcgtgcaac ccagatccct cgcatgtgca gttcacagta 2340gggttcaagc tcctacaaga atctgatgct gctgctgatc tgacaggagg ggagcagctg 2400taaatacaga tgaagcttcg cttactcacc agctgctcac ctcctcctgt gaggcccggt 2460tcctaacagg ccactgacct aacttctgcc ctgacctaca catgcttctc ttcttccttg 2520caaactgcct ccagtggaag tccctgaagg tccccaaaca cacgggacta tttcactcct 2580atgcaggttt tgtctccttt gcttggaatg catcccctca ccccttgtcc ccaggcagat 2640tcccacccct cccccagaac ctgccccagt ggagccttcg caggtgattt gtcagtttca 2700caggctgagg ggtgctctcc tggtctcccc ggctccctgt atccccacac ccagcacagg 2760gccaggcact gggggggcct tcagtggaga ctgaaatggc tgaacgggac ctcccataga 2820
ttagctatgc ggccagcagc gagacgctca gcgtgaagcg gcagtatccc tctttcctgc 2880gcaccatccc caatgacaag taccaggtgg agaccatggt gctgctgctg cagaagttcg 2940ggtggacctg gatctctctg gttggcagca gtgacgacta tgggcagcta ggggtgcagg 3000cactggagaa ccaggccact ggtcagggga tctgcattgc tttcaaggac atcatgccct 3060tctctgccca ggtgggcgat gagaggatgc agtgcctcat gcgccacctg gcccaggccg 3120gggccaccgt cgtggttgtt ttttccagcc ggcagttggc cagggtgttt ttcgagtccg 3180tggtgctgac caacctgact ggcaaggtgt gggtcgcctc agaagcctgg gccctctcca 3240ggcacatcac tggggtgccc gggatccagc gcattgggat ggtgctgggc gtggccatcc 3300agaagagggc tgtccctggc ctgaaggcgt ttgaagaagc ctatgcccgg gcagacaaga 3360aggcccctag gccttgccac aagggctcct ggtgcagcag caatcagctc tgcagagaat 3420gccaagcttt catggcacac acgatgccca agctcaaagc cttctccatg agttctgcct 3480acaacgcata ccgggctgtg tatgcggtgg cccatggcct ccaccagctc ctgggctgtg 3540cctctggagc ttgttccagg ggccgagtct acccctggca ggtaagagag cccaccccag 3600cacctcctgt cagggagaac agccaatcct gagatgagca gagtgggcac tctccggtca 3660ctctaaatgc caagggggat aaatgccact aacttgaggt tttttgtttt gttttgtttt 3720gttttttgag acagtctggc tctgtcaccc aggctgcagt gtagtgatgc gatctcggct 3780ctctgcaact tccacctcct gggttcaagt gattctcttg cctcggcctc ctgagtagct 3840gggattacag gcacccacca ccatgcctgg ataatttttc ttttcttttt tttttttttg 3900agatagagtc tcgctctgtt gcccaggctg gaatgcagtg gtgcgatctt ggctcactgt 3960gagctccgcc tcccaggttc actccattcc cctgcctcag cctcccaagt aggtgggact 4020acgggcgccc gccaccacgc ccagctaatt ttttttgtat tttgagtaga gacggggttt 4080caccatgtta gccaggatgg tctcaatctc ctgaccttgt catccgccca cctcgtcctc 4140ccaaagtgct gggattacag gcgtgagcca ccgcacccgg cctaattttt gtatttttag 4200tagagatggg gtttcaccat gttggccagg ctggtctcga actcctggca tcaagtgatc 4260ctcctgcttc ggcctcccaa agtgctggga ttacaggcat tagctctctt ctcttagaca 4320gatctttctc tctgatcctt gccttctctc acccactgtg tcttggaagt gtcaagtgat 4380aagatccagg gctaaaactg tctgtaaagg agtgtttgtt agaggcctcc tctcaggagg 4440ttggtgggga agattgaggg gcttcctaag aaggaaggga cgagaccttc ctgatgggct 4500gaaaccacca ggacggaaac ccaggaaggc cccaggccct tgcttctggg accatgtggg 4560tctgtgctgt ctgtggtggc ttcatgatac gcgtttcttt cagcttttgg agcagatcca 4620caaggtgcat ttccttctac acaaggacac tgtggcgttt aatgacaaca gagatcccct 4680cagtagctat aacataattg cctgggactg gaatggaccc aagtggacct tcacggtcct 4740cggttcctcc acatggtctc cagttcagct aaacataaat gagaccaaaa tccagtggca 4800cggaaaggac aaccaggtaa tggggatgtg gctactcacc atgtaactgg cttatgggca 4860acctagagcc tgggggtgat gctgacacag tgtacaggga gcaggagggg ggccccaggg 4920gtccagctgc caccactcta cccatcctgg ccagggaagc agggaagaca ctccgtaggc 4980gagtgtgcag atgccctggg gcggaagttc acacgaccag gggccctgcc ctgggagtga 5040gccctgaggg cagatgcaca gagattctgt tttctgttcc acatgtgagc tgtcctttga 5100cttgggcccc tacgtgtggc ccctctggct tcttacaggt gcctaagtct gtgtgttcca 5160gcgactgtct tgaagggcac cagcgagtgg ttacgggttt ccatcactgc tgctttgagt 5220gtgtgccctg tggggctggg accttcctca acaagagtgg tgagtgggca atggagcagg 5280cgagctaccc agcactcccg ggggctgcac ggtggaggga gggcctccct tgggccccat 5340gtgccctgcc ccagaaccaa ggcccagtca ctgggctgcc agttagcttc aggttggagg 5400acacctgcta ccagacagaa ttctgatcaa gagaatcagc cactgggtgc ggtggctcat 5460gcctgtaatc ccagcacttt gggaggctga ggcgggtgga tcacttgagg tcgggagttc 5520
gagaccagcc tggccaacat ggtgaaaccc catctctacc aaaaatataa aaaattagct 5580gggtgtggtg gcgcgtgcct gtaatcccag ctactcggga ggctgaggca ggagaatcac 5640ttgaacccag gaggcggagg ttgcagtgag ccaagatgca ttccagcctg gaccacaaag 5700cgagaattcg tccccccaaa aaaagaaagg aggccgggcg cggtggctca cacctgtaat 5760cccagcactt tgggaggccg aggtgggtgg atcacctgag gtcaggagtt cgagaccagc 5820ctgaccaaca tggtgaaacc ccatctctac taaaaataca aaaaaagtta gccgggcgtt 5880gtggcgtgtg cctgtaattc cagctactcg ggaggctgag gcaggagaat tgcttgaacc 5940cgggaggcgg aggttgcagt gagccaagat tgcaccattg cactccagcc tgggcgacaa 6000gagaaaaact ctgtctcaaa aaaaaagaaa gaaagaaaga attagccaac tgaaagcctt 6060agactgaggt gtgtcctctg ttagagagct gtcatcacaa ctcctacaaa agcagtcgta 6120tcctgaattc aacctctttc tctaaatgaa tatagctatt gttccctttg tgccctcttg 6180tcctactgtc ccttctgttg cccatgccaa agacagctag ctccttgaac agcttggcct 6240gaatacagat actagcgtgt ctgcagcaga gaaaaaaaca gcattcccca tccagaaatg 6300caaggtcaag aacagagagc aaattaggta gctaaggact caggtcctta gttggtgtcc 6360aggggccaca ttctttcctt tcaccatctc tgtagggaca ggaatacttc ccttctgtcc 6420tcagagggtc aggactcaga gaaaccacag agcagcagct caggaaagtg gttcatggaa 6480atgctggcaa gagagagggg ttacaatgcc ctcccttggg agcaggctgc tcccatcaga 6540tcgtaacctc tctggtatgt gggcagagct accaggttaa ggtcctccct agggtttgca 6600aaaccctcat gggatcatga gccatacaga accgacctgt gtgtctccag agtctgtaat 6660taacacaggc attttgagga aatgcgtggc ctcaggcccc actcccggct acccccatcc 6720cactatgcct agtatagtct agctgccctg gtacaattct cccagtatct tgcaggcccc 6780tatttcctat tcctactctg ctcatctggc tctcaggaac cttcttggcc ttccctttca 6840gacctctaca gatgccagcc ttgtgggaaa gaagagtggg cacctgaggg aagccagacc 6900tgcttcccgc gcactgtggt gtttttggct ttgcgtgagc acacctcttg ggtgctgctg 6960gcagctaaca cgctgctgct gctgctgctg cttgggactg ctggcctgtt tgcctggcac 7020ctagacaccc ctgtggtgag gtcagcaggg ggccgcctgt gctttcttat gctgggctcc 7080ctggcagcag gtagtggcag cctctatggc ttctttgggg aacccacaag gcctgcgtgc 7140ttgctacgcc aggccctctt tgcccttggt ttcaccatct tcctgtcctg cctgacagtt 7200cgctcattcc aactaatcat catcttcaag ttttccacca aggtacctac attctaccac 7260gcctgggtcc aaaaccacgg tgctggcctg tttgtgatga tcagctcagc ggcccagctg 7320cttatctgtc taacttggct ggtggtgtgg accccactgc ctgctaggga ataccagcgc 7380ttcccccatc tggtgatgct tgagtgcaca gagaccaact ccctgggctt catactggcc 7440ttcctctaca atggcctcct ctccatcagt gcctttgcct gcagctacct gggtaaggac 7500ttgccagaga actacaacga ggccaaatgt gtcaccttca gcctgctctt caacttcgtg 7560tcctggatcg ccttcttcac cacggccagc gtctacgacg gcaagtacct gcctgcggcc 7620aacatgatgg ctgggctgag cagcctgagc agcggcttcg gtgggtattt tctgcctaag 7680tgctacgtga tcctctgccg cccagacctc aacagcacag agcacttcca ggcctccatt 7740caggactaca cgaggcgctg cggctccacc tgaccagtgg gtcagcaggc acggctggca 7800gccttctctg ccctgagggt cgaaggtcga gcaggccggg ggtgtccggg aggtctttgg 7860gcatcgcggt ctggggttgg gacgtgtaag cgcctgggag agcctagacc aggctccggg 7920ctgccaataa agaagtgaaa tgcgtatctg gtctcctgtc gtgggagagt gtgaggtgta 7980acggattcaa gtctgaaccc agagcctgga aaaggctgac cgcccagatt gacgttgcta 8040ggcaactccg gaggcgggcc cagcgccaaa agaacagggc gaggcgtcgt ccccgcatcc 8100cattggccgt tctctgcggg gccccgccct cgggggccgg agctagaagc tctacgcttc 8160cgaggcgcac ctcctggcct gcacgctttg acgt 8194
<210>16<211>2526<212>DNA<213>智人<400>16atgctgctct gcacggctcg cctggtcggc ctgcagcttc tcatttcctg ctgctgggcc 60tttgcctgcc atagcacgga gtcttctcct gacttcaccc tccccggaga ttacctcctg 120gcaggcctgt tccctctcca ttctggctgt ctgcaggtga ggcacagacc cgaggtgacc 180ctgtgtgaca ggtcttgtag cttcaatgag catggctacc acctcttcca ggctatgcgg 240cttggggttg aggagataaa caactccacg gccctgctgc ccaacatcac cctggggtac 300cagctgtatg atgtgtgttc tgactctgcc aatgtgtatg ccacgctgag agtgctctcc 360ctgccagggc aacaccacat agagctccaa ggagaccttc tccactattc ccctacggtg 420ctggcagtga ttgggcctga cagcaccaac cgtgctgcca ccacagccgc cctgctgagc 480cctttcctgg tgcccatgat tagctatgcg gccagcagcg agacgctcag cgtgaagcgg 540cagtatccct ctttcctgcg caccatcccc aatgacaagt accaggtgga gaccatggtg 600ctgctgctgc agaagttcgg gtggacctgg atctctctgg ttggcagcag tgacgactat 660gggcagctag gggtgcaggc actggagaac caggccactg gtcaggggat ctgcattgct 720ttcaaggaca tcatgccctt ctctgcccag gtgggcgatg agaggatgca gtgcctcatg 780cgccacctgg cccaggccgg ggccaccgtc gtggttgttt tttccagccg gcagttggcc 840agggtgtttt tcgagtccgt ggtgctgacc aacctgactg gcaaggtgtg ggtcgcctca 900gaagcctggg ccctctccag gcacatcact ggggtgcccg ggatccagcg cattgggatg 960gtgctgggcg tggccatcca gaagagggct gtccctggcc tgaaggcgtt tgaagaagcc 1020tatgcccggg cagacaagaa ggcccctagg ccttgccaca agggctcctg gtgcagcagc 1080aatcagctct gcagagaatg ccaagctttc atggcacaca cgatgcccaa gctcaaagcc 1140ttctccatga gttctgccta caacgcatac cgggctgtgt atgcggtggc ccatggcctc 1200caccagctcc tgggctgtgc ctctggagct tgttccaggg gccgagtcta cccctggcag 1260cttttggagc agatccacaa ggtgcatttc cttctacaca aggacactgt ggcgtttaat 1320gacaacagag atcccctcag tagctataac ataattgcct gggactggaa tggacccaag 1380tggaccttca cggtcctcgg ttcctccaca tggtctccag ttcagctaaa cataaatgag 1440accaaaatcc agtggcacgg aaaggacaac caggtgccta agtctgtgtg ttccagcgac 1500tgtcttgaag ggcaccagcg agtggttacg ggtttccatc actgctgctt tgagtgtgtg 1560ccctgtgggg ctgggacctt cctcaacaag agtgacctct acagatgcca gccttgtggg 1620aaagaagagt gggcacctga gggaagccag acctgcttcc cgcgcactgt ggtgtttttg 1680gctttgcgtg agcacacctc ttgggtgctg ctggcagcta acacgctgct gctgctgctg 1740ctgcttggga ctgctggcct gtttgcctgg cacctagaca cccctgtggt gaggtcagca 1800gggggccgcc tgtgctttct tatgctgggc tccctggcag caggtagtgg cagcctctat 1860ggcttctttg gggaacccac aaggcctgcg tgcttgctac gccaggccct ctttgccctt 1920ggtttcacca tcttcctgtc ctgcctgaca gttcgctcat tccaactaat catcatcttc 1980aagttttcca ccaaggtacc tacattctac cacgcctggg tccaaaacca cggtgctggc 2040ctgtttgtga tgatcagctc agcggcccag ctgcttatct gtctaacttg gctggtggtg 2100tggaccccac tgcctgctag ggaataccag cgcttccccc atctggtgat gcttgagtgc 2160acagagacca actccctggg cttcatactg gccttcctct acaatggcct cctctccatc 2220
agtgcctttg cctgcagcta cctgggtaag gacttgccag agaactacaa cgaggccaaa 2280tgtgtcacct tcagcctgct cttcaacttc gtgtcctgga tcgccttctt caccacggcc 2340agcgtctacg acggcaagta cctgcctgcg gccaacatga tggctgggct gagcagcctg 2400agcagcggct tcggtgggta ttttctgcct aagtgctacg tgatcctctg ccgcccagac 2460ctcaacagca cagagcactt ccaggcctcc attcaggact acacgaggcg ctgcggctcc 2520acctga2526<210>17<211>841<212>PRT<213>智人<400>17Met Leu Leu Cys Thr Ala Arg Leu Val Gly Leu Gln Leu Leu Ile Ser1 5 10 15Cys Cys Trp Ala Phe Ala Cys His Ser Thr Glu Ser Ser Pro Asp Phe20 25 30Thr Leu Pro Gly Asp Tyr Leu Leu Ala Gly Leu Phe Pro Leu His Ser35 40 45Gly Cys Leu Gln Val Arg His Arg Pro Glu Val Thr Leu Cys Asp Arg50 55 60Ser Cys Ser Phe Asn Glu His Gly Tyr His Leu Phe Gln Ala Met Arg65 70 75 80Leu Gly Val Glu Glu Ile Asn Asn Ser Thr Ala Leu Leu Pro Asn Ile85 90 95Thr Leu Gly Tyr Gln Leu Tyr Asp Val Cys Ser Asp Ser Ala Asn Val100 105 110Tyr Ala Thr Leu Arg Val Leu Ser Leu Pro Gly Gln His His Ile Glu115 120 125Leu Gln Gly Asp Leu Leu His Tyr Ser Pro Thr Val Leu Ala Val Ile130 135 140Gly Pro Asp Ser Thr Asn Arg Ala Ala Thr Thr Ala Ala Leu Leu Ser145 150 155 160Pro Phe Leu Val Pro Met Ile Ser Tyr Ala Ala Ser Ser Glu Thr Leu
165 170 175Ser Val Lys Arg Gln Tyr Pro Ser Phe Leu Arg Thr Ile Pro Asn Asp180 185 190Lys Tyr Gln Val Glu Thr Met Val Leu Leu Leu Gln Lys Phe Gly Trp195 200 205Thr Trp Ile Ser Leu Val Gly Ser Ser Asp Asp Tyr Gly Gln Leu Gly210 215 220Val Gln Ala Leu Glu Asn Gln Ala Thr Gly Gln Gly Ile Cys Ile Ala225 230 235 240Phe Lys Asp Ile Met Pro Phe Ser Ala Gln Val Gly Asp Glu Arg Met245 250 255Gln Cys Leu Met Arg His Leu Ala Gln Ala Gly Ala Thr Val Val Val260 265 270Val Phe Ser Ser Arg Gln Leu Ala Arg Val Phe Phe Glu Ser Val Val275 280 285Leu Thr Asn Leu Thr Gly Lys Val Trp Val Ala Ser Glu Ala Trp Ala290 295 300Leu Ser Arg His Ile Thr Gly Val Pro Gly Ile Gln Arg Ile Gly Met305 310 315 320Val Leu Gly Val Ala Ile Gln Lys Arg Ala Val Pro Gly Leu Lys Ala325 330 335Phe Glu Glu Ala Tyr Ala Arg Ala Asp Lys Lys Ala Pro Arg Pro Cys340 345 350His Lys Gly Ser Trp Cys Ser Ser Asn Gln Leu Cys Arg Glu Cys Gln355 360 365Ala Phe Met Ala His Thr Met Pro Lys Leu Lys Ala Phe Ser Met Ser370 375 380Ser Ala Tyr Asn Ala Tyr Arg Ala Val Tyr Ala Val Ala His Gly Leu385 390 395 400His Gln Leu Leu Gly Cys Ala Ser Gly Ala Cys Ser Arg Gly Arg Val
405 410 415Tyr Pro Trp Gln Leu Leu Glu Gln Ile His Lys Val His Phe Leu Leu420 425 430His Lys Asp Thr Val Ala Phe Asn Asp Asn Arg Asp Pro Leu Ser Ser435 440 445Tyr Asn Ile Ile Ala Trp Asp Trp Asn Gly Pro Lys Trp Thr Phe Thr450 455 460Val Leu Gly Ser Ser Thr Trp Ser Pro Val Gln Leu Asn Ile Asn Glu465 470 475 480Thr Lys Ile Gln Trp His Gly Lys Asp Asn Gln Val Pro Lys Ser Val485 490 495Cys Ser Ser Asp Cys Leu Glu Gly His Gln Arg Val Val Thr Gly Phe500 505 510His His Cys Cys Phe Glu Cys Val Pro Cys Gly Ala Gly Thr Phe Leu515 520 525Asn Lys Ser Asp Leu Tyr Arg Cys Gln Pro Cys Gly Lys Glu Glu Trp530 535 540Ala Pro Glu Gly Ser Gln Thr Cys Phe Pro Arg Thr Val Val Phe Leu545 550 555 560Ala Leu Arg Glu His Thr Ser Trp Val Leu Leu Ala Ala Asn Thr Leu565 570 575Leu Leu Leu Leu Leu Leu Gly Thr Ala Gly Leu Phe Ala Trp His Leu580 585 590Asp Thr Pro Val Val Arg Ser Ala Gly Gly Arg Leu Cys Phe Leu Met595 600 605Leu Gly Ser Leu Ala Ala Gly Ser Gly Ser Leu Tyr Gly Phe Phe Gly6l0 615 620Glu Pro Thr Arg Pro Ala Cys Leu Leu Arg Gln Ala Leu Phe Ala Leu625 630 635 640Gly Phe Thr Ile Phe Leu Ser Cys Leu Thr Val Arg Ser Phe Gln Leu
645 650 655Ile Ile Ile Phe Lys Phe Ser Thr Lys Val Pro Thr Phe Tyr His Ala660 665 670Trp Val Gln Asn His Gly Ala Gly Leu Phe Val Met Ile Ser Ser Ala675 680 685Ala Gln Leu Leu Ile Cys Leu Thr Trp Leu Val Val Trp Thr Pro Leu690 695 700Pro Ala Arg Glu Tyr Gln Arg Phe Pro His Leu Val Met Leu Glu Cys705 710 715 720Thr Glu Thr Asn Ser Leu Gly Phe Ile Leu Ala Phe Leu Tyr Asn Gly725 730 735Leu Leu Ser Ile Ser Ala Phe Ala Cys Ser Tyr Leu Gly Lys Asp Leu740 745 750Pro Glu Asn Tyr Asn Glu Ala Lys Cys Val Thr Phe Ser Leu Leu Phe755 760 765Asn Phe Val Ser Trp Ile Ala Phe Phe Thr Thr Ala Ser Val Tyr Asp770 775 780Gly Lys Tyr Leu Pro Ala Ala Asn Met Met Ala Gly Leu Ser Ser Leu785 790 795 800Ser Ser Gly Phe Gly Gly Tyr Phe Leu Pro Lys Cys Tyr Val Ile Leu805 810 815Cys Arg Pro Asp Leu Asn Ser Thr Glu His Phe Gln Ala Ser Ile Gln820 825 830Asp Tyr Thr Arg Arg Cys Gly Ser Thr835 840<210>18<211>14<212>PRT<213>人工序列<220>
<223>人工序列描述一致序列<220>
<221>MOD_RES<222>(1)<223>Thr或Arg<220>
<221>MOD_RES<222>(3)<223>Phe或Leu<220>
<221>MOD_RES<222>(4)<223>Arg,Gln或Pro<220>
<221>MOD_RES<222>(6)<223>Arg或Thr<220>
<221>MOD_RES<222>(7)<223>Ser,Pro或Val<220>
<221>MOD_RES<222>(8)<223>Val,Glu,Arg,Lys或Thr<220>
<221>MOD_RES<222>(11)<223>Ala或Glu<220>
<221>MOD_RES<222>(12)<223>Trp或Leu<220>
<221>MOD_RES<222>(13)
<223>Arg,His或Gly<400>18Xaa Cys Xaa Xaa Arg Xaa Xaa Xaa Phe Leu Xaa Xaa Xaa Glu1 5 10<210>19<211>15<212>PRT<213>人工序列<220>
<223>人工序列描述一致序列<220>
<221>MOD_RES<222>(1)<223>Leu或Gln<220>
<221>MOD_RES<222>(3)<223>Glu,Gly或Thr<220>
<221>MOD_RES<222>(4)<223>Asn,Arg或Cys<220>
<221>MOD_RES<222>(7)<223>Arg或Glu<220>
<221>MOD_RES<222>(9)<223>Arg或Lys<220>
<221>MOD_RES<222>(10)<223>Cys,Gly或Phe
<220>
<221>MOD_RES<222>(11)<223>Val,Leu或Ile<220>
<221>MOD_RES<222>(13)<223>Phe或Leu<220>
<221>MOD_RES<222>(14)<223>Ala或Ser<220>
<221>MOD_RES<222>(15)<223>Met或Leu<400>19Xaa Pro Xaa Xaa Tyr Asn Xaa Ala Xaa Xaa Xaa Thr Xaa Xaa Xaa1 5 10 15<210>20<211>3563<212>DNA<213>智人<400>20agcctggcag tggcctcagg cagagtctga cgcgcacaaa ctttcaggcc caggaagega 60ggacaccact ggggccccag ggtgtggcaa gtgaggatgg caagggtttt gctaaacaaa 120tcctctgccc gctccccgcc ccgggctcac tccatgtgag gccccagtcg gggcagccac 180ctgccgtgcc tgttggaagt tgcctctgcc atgctgggcc ctgctgtcct gggcctcagc 240ctctgggctc tcctgcaccc tgggacgggg gccccattgt gcctgtcaca gcaacttagg 300atgaaggggg actacgtgct gggggggctg ttccccctgg gcgaggccga ggaggctggc 360ctccgcagcc ggacacggcc cagcagccct gtgtgcacca ggtacagagg tgggacggcc 420tgggtcgggg tcagggtgac caggtctggg gtgctcctga gctggggccg aggtggccat 480ctgcggttct gtgtggcccc aggttctcct caaacggcct gctctgggca ctggccatga 540aaatggccgt ggaggagatc aacaacaagt cggatctgct gcccgggctg cgcctgggct 600acgacctctt tgatacgtgc tcggagcctg tggtggccat gaagcccagc ctcatgttcc 660tggccaaggc aggcagccgc gacatcgccg cctactgcaa ctacacgcag taccagcccc 720gtgtgctggc tgtcatcggg ccccactcgt cagagctcgc catggtcacc ggcaagttct 780tcagcttctt cctcatgccc cagtggggcg ccccccacca tcacccaccc ccaaccaacc 840
cctgccccgt gggagcccct tgtgtcagga gaatgctaca tgcaccccac ccagccctgc 900cctgggagcc ctgtgtcaga agatgctctt ggccttgcag gtcagctacg gtgctagcat 960ggagctgctg agcgcccggg agaccttccc ctccttcttc cgcaccgtgc ccagcgaccg 1020tgtgcagctg acggccgccg cggagctgct gcaggagttc ggctggaact gggtggccgc 1080cctgggcagc gacgacgagt acggccggca gggcctgagc atcttctcgg ccctggccgc 1140ggcacgcggc atctgcatcg cgcacgaggg cctggtgccg ctgccccgtg ccgatgactc 1200gcggctgggg aaggtgcagg acgtcctgca ccaggtgaac cagagcagcg tgcaggtggt 1260gctgctgttc gcctccgtgc acgccgccca cgccctcttc aactacagca tcagcagcag 1320gctctcgccc aaggtgtggg tggccagcga ggcctggctg acctctgacc tggtcatggg 1380gctgcccggc atggcccaga tgggcacggt gcttggcttc ctccagaggg gtgcccagct 1440gcacgagttc ccccagtacg tgaagacgca cctggccctg gccaccgacc cggccttctg 1500ctctgccctg ggcgagaggg agcagggtct ggaggaggac gtggtgggcc agcgctgccc 1560gcagtgtgac tgcatcacgc tgcagaacgt gagcgcaggg ctaaatcacc accagacgtt 1620ctctgtctac gcagctgtgt atagcgtggc ccaggccctg cacaacactc ttcagtgcaa 1680cgcctcaggc tgccccgcgc aggaccccgt gaagccctgg caggtgagcc cgggagatgg 1740gggtgtgctg tcctctgcat gtgcccaggc caccaggcac ggccaccacg cctgagctgg 1800aggtggctgg cggctcagcc ccgtcccccg cccgcagctc ctggagaaca tgtacaacct 1860gaccttccac gtgggcgggc tgccgctgcg gttcgacagc agcggaaacg tggacatgga 1920gtacgacctg aagctgtggg tgtggcaggg ctcagtgccc aggctccacg acgtgggcag 1980gttcaacggc agcctcagga cagagcgcct gaagatccgc tggcacacgt ctgacaacca 2040ggtgaggtga gggtgggtgt gccaggcgtg cccgtggtag cccccgcggc agggcgcagc 2100ctgggggtgg gggccgttcc agtctcccgt gggcatgccc agccgagcag agccagaccc 2160caggcctgtg cgcagaagcc cgtgtcccgg tgctcgcggc agtgccagga gggccaggtg 2220cgccgggtca aggggttcca ctcctgctgc tacgactgtg tggactgcga ggcgggcagc 2280taccggcaaa acccaggtga gccgccttcc cggcaggcgg gggtgggaac gcagcagggg 2340agggtcctgc caagtcctga ctctgagacc agagcccaca gggtacaaga cgaacaccca 2400gcgcccttct cctctctcac agacgacatc gcctgcacct tttgtggcca ggatgagtgg 2460tccccggagc gaagcacacg ctgcttccgc cgcaggtctc ggttcctggc atggggcgag 2520ccggctgtgc tgctgctgct cctgctgctg agcctggcgc tgggccttgt gctggctgct 2580ttggggctgt tcgttcacca tcgggacagc ccactggttc aggcctcggg ggggcccctg 2640gcctgctttg gcctggtgtg cctgggcctg gtctgcctca gcgtcctcct gttccctggc 2700cagcccagcc ctgcccgatg cctggcccag cagcccttgt cccacctccc gctcacgggc 2760tgcctgagca cactcttcct gcaggcggcc gagatcttcg tggagtcaga actgcctctg 2820agctgggcag accggctgag tggctgcctg cgggggccct gggcctggct ggtggtgctg 2880ctggccatgc tggtggaggt cgcactgtgc acctggtacc tggtggcctt cccgccggag 2940gtggtgacgg actggcacat gctgcccacg gaggcgctgg tgcactgccg cacacgctcc 3000tgggtcagct tcggcctagc gcacgccacc aatgccacgc tggcctttct ctgcttcctg 3060ggcactttcc tggtgcggag ccagccgggc tgctacaacc gtgcccgtgg cctcaccttt 3120gccatgctgg cctacttcat cacctgggtc tcctttgtgc ccctcctggc caatgtgcag 3180gtggtcctca ggcccgccgt gcagatgggc gccctcctgc tctgtgtcct gggcatcctg 3240gctgccttcc acctgcccag gtgttacctg ctcatgcggc agccagggct caacaccccc 3300gagttcttcc tgggaggggg ccctggggat gcccaaggcc agaatgacgg gaacacagga 3360aatcagggga aacatgagtg acccaaccct gtgatctcag ccccggtgaa cccagactta 3420gctgcgatcc cccccaagcc agcaatgacc cgtgtctcgc tacagagacc ctcccgctct 3480aggttctgac cccaggttgt ctcctgaccc tgaccccaca gtgagcccta ggcctggagc 3540
acgtggacac ccctgtgacc arc 3563<210>21<211>839<212>PRT<213>智人<400>21Met Gly Pro Arg Ala Lys Thr Ile Cys Ser Leu Phe Phe Leu Leu Trp1 5 10 15Val Leu Ala Glu Pro Ala Glu Asn Ser Asp Phe Tyr Leu Pro Gly Asp20 25 30Tyr Leu Leu Gly Gly Leu Phe Ser Leu His Ala Asn Met Lys Gly Ile35 40 45Val His Leu Asn Phe Leu Gln Val Pro Met Cys Lys Glu Tyr Glu Val50 55 60Lys Val Ile Gly Tyr Asn Leu Met Gln Ala Met Arg Phe Ala Val Glu65 70 75 80Glu Ile Asn Asn Asp Ser Ser Leu Leu Pro Gly Val Leu Leu Gly Tyr85 90 95Glu Ile Val Asp Val Cys Tyr Ile Ser Asn Asn Val Gln Pro Val Leu100 105 110Tyr Phe Leu Ala His Glu Asp Asn Leu Leu Pro Ile Gln Glu Asp Tyr115 120 125Ser Asn Tyr Ile Ser Arg Val Val Ala Val Ile Gly Pro Asp Asn Ser130 135 140Glu Ser Val Met Thr Val Ala Ash Phe Leu Ser Leu Phe Leu Leu Pro145 150 155 160Gln Ile Thr Tyr Ser Ala Ile Ser Asp Glu Leu Arg Asp Lys Val Arg165 170 175Phe Pro Ala Leu Leu Arg Thr Thr Pro Ser Ala Asp His His Val Glu180 185 190
Ala Met Val Gln Leu Met Leu His Phe Arg Trp Asn Trp Ile Ile Val195 200 205Leu Val Ser Ser Asp Thr Tyr Gly Arg Asp Asn Gly Gln Leu Leu Gly210 215 220Glu Arg Val Ala Arg Arg Asp Ile Cys Ile Ala Phe Gln Glu Thr Leu225 230 235 240Pro Thr Leu Gln Pro Asn Gln Asn Met Thr Ser Glu Glu Arg Gln Arg245 250 255Leu Val Thr Ile Val Asp Lys Leu Gln Gln Ser Thr Ala Arg Val Val260 265 270Val Val Phe Ser Pro Asp Leu Thr Leu Tyr His Phe Phe Asn Glu Val275 280 285Leu Arg Gln Asn Phe Thr Gly Ala Val Trp Ile Ala Ser Glu Ser Trp290 295 300Ala Ile Asp Pro Val Leu His Asn Leu Thr Glu Leu Gly His Leu Gly305 310 315 320Thr Phe Leu Gly Ile Thr Ile Gln Ser Val Pro Ile Pro Gly Phe Ser325 330 335Glu Phe Arg Glu Trp Gly Pro Gln Ala Gly Pro Pro Pro Leu Ser Arg340 345 350Thr Ser Gln Ser Tyr Thr Cys Asn Gln Glu Cys Asp Asn Cys Leu Asn355 360 365Ala Thr Leu Ser Phe Asn Thr Ile Leu Arg Leu Ser Gly Glu Arg Val370 375 380Val Tyr Ser Val Tyr Ser Ala Val Tyr Ala Val Ala His Ala Leu His385 390 395 400Ser Leu Leu Gly Cys Asp Lys Ser Thr Cys Thr Lys Arg Val Val Tyr405 410 415Pro Trp Gln Leu Leu Glu Glu Ile Trp Lys Val Asn Phe Thr Leu Leu420 425 430
Asp His Gln Ile Phe Phe Asp Pro Gln Gly Asp Val Ala Leu His Leu435 440 445Glu Ile Val Gln Trp Gln Trp Asp Arg Ser Gln Asn Pro Phe Gln Ser450 455 460Val Ala Ser Tyr Tyr Pro Leu Gln Arg Gln Leu Lys Asn Ile Gln Asp465 470 475 480Ile Ser Trp His Thr Val Asn Asn Thr Ile Pro Met Ser Met Cys Ser485 490 495Lys Arg Cys Gln Ser Gly Gln Lys Lys Lys Pro Val Gly Ile His Val500 505 510Cys Cys Phe Glu Cys Ile Asp Cys Leu Pro Gly Thr Phe Leu Asn His515 520 525Thr Glu Asp Glu Tyr Glu Cys Gln Ala Cys Pro Asn Asn Glu Trp Ser530 535 540Tyr Gln Ser Glu Thr Ser Cys Phe Lys Arg Gln Leu Val Phe Leu Glu545 550 555 560Trp His Glu Ala Pro Thr Ile Ala Val Ala Leu Leu Ala Ala Leu Gly565 570 575Phe Leu Ser Thr Leu Ala Ile Leu Val Ile Phe Trp Arg His Phe Gln580 585 590Thr Pro Ile Val Arg Ser Ala Gly Gly Pro Met Cys Phe Leu Met Leu595 600 605Thr Leu Leu Leu Val Ala Tyr Met Val Val Pro Val Tyr Val Gly Pro610 615 620Pro Lys Val Ser Thr Cys Leu Cys Arg Gln Ala Leu Phe Pro Leu Cys625 630 635 640Phe Thr Ile Cys Ile Ser Cys Ile Ala Val Arg Ser Phe Gln Ile Val645 650 655Cys Ala Phe Lys Met Ala Ser Arg Phe Pro Arg Ala Tyr Ser Tyr Trp660 665 670
Val Arg Tyr Gln Gly Pro Tyr Val Ser Met Ala Phe Ile Thr Val Leu675 680 685Lys Met Val Ile Val Val Ile Gly Met Leu Ala Thr Gly Leu Ser Pro690 695 700Thr Thr Arg Thr Asp Pro Asp Asp Pro Lys Ile Thr Ile Val Ser Cys705 710 715 720Asn Pro Asn Tyr Arg Asn Ser Leu Leu Phe Asn Thr Ser Leu Asp Leu725 730 735Leu Leu Ser Val Val Gly Phe Ser Phe Ala Tyr Met Gly Lys Glu Leu740 745 750Pro Thr Asn Tyr Asn Glu Ala Lys Phe Ile Thr Leu Ser Met Thr Phe755 760 765Tyr Phe Thr Ser Ser Val Ser Leu Cys Thr Phe Met Ser Ala Tyr Ser770 775 780Gly Val Leu Val Thr Ile Val Asp Leu Leu Val Thr Val Leu Asn Leu785 790 795 800Leu Ala I1e Ser Leu Gly Tyr Phe Gly Pro Lys Cys Tyr Met Ile Leu805 810 815Phe Tyr Pro Glu Arg Asn Thr Pro Ala Tyr Phe Asn Ser Met Ile Gln820 825 830Gly Tyr Thr Met Arg Arg Asp835<210>22<211>6<212>PRT<213>人工序列<220>
<223>人工序列描述合成的PDZIP肽序列<400>22Ser Val Ser Thr Val Val1 5
<210>23<211>2520<212>DNA<213>智人<400>23atggggccca gggcaaagac catctgctcc ctgttcttcc tcctatgggt cctggctgag 60ccggctgaga actcggactt ctacctgcct ggggattacc tcctgggtgg cctcttctcc 120ctccatgcca acatgaaggg cattgttcac cttaacttcc tgcaggtgcc catgtgcaag 180gagtatgaag tgaaggtgat aggctacaac ctcatgcagg ccatgcgctt cgcggtggag 240gagatcaaca atgacagcag cctgctgcct ggtgtgctgc tgggctatga gatcgtggat 300gtgtgctaca tctccaacaa tgtccagccg gtgctctact tcctggcaca cgaggacaac 360ctccttccca tccaagagga ctacagtaac tacatttccc gtgtggtggc tgtcattggc 420cctgacaact ccgagtctgt catgactgtg gccaacttcc tctccctatt tctccttcca 480cagatcacct acagcgccat cagcgatgag ctgcgagaca aggtgcgctt cccggctttg 540ctgcgtacca cacccagcgc cgaccaccac gtcgaggcca tggtgcagct gatgctgcac 600ttccgctgga actggatcat tgtgctggtg agcagcgaca cctatggccg cgacaatggc 660cagctgcttg gcgagcgcgt ggcccggcgc gacatctgca tcgccttcca ggagacgctg 720cccacactgc agcccaacca gaacatgacg tcagaggagc gccagcgcct ggtgaccatt 780gtggacaagc tgcagcagag cacagcgcgc gtcgtggtcg tgttctcgcc cgacctgacc 840ctgtaccact tcttcaatga ggtgctgcgc cagaacttca cgggcgccgt gtggatcgcc 900tccgagtcct gggccatcga cccggtcctg cacaacctca cggagctggg ccacttgggc 960accttcctgg gcatcaccat ccagagcgtg cccatcccgg gcttcagtga gttccgcgag 1020tggggcccac aggctgggcc gccacccctc agcaggacca gccagagcta tacctgcaac 1080caggagtgcg acaactgcct gaacgccacc ttgtccttca acaccattct caggctctct 1140ggggagcgtg tcgtctacag cgtgtactct gcggtctatg ctgtggccca tgccctgcac 1200agcctcctcg gctgtgacaa aagcacctgc accaagaggg tggtctaccc ctggcagctg 1260cttgaggaga tctggaaggt caacttcact ctcctggacc accaaatctt cttcgacccg 1320caaggggacg tggctctgca cttggagatt gtccagtggc aatgggaccg gagccagaat 1380cccttccaga gcgtcgcctc ctactacccc ctgcagcgac agctgaagaa catccaagac 1440atctcctggc acaccgtcaa caacacgatc cctatgtcca tgtgttccaa gaggtgccag 1500tcagggcaaa agaagaagcc tgtgggcatc cacgtctgct gcttcgagtg catcgactgc 1560cttcccggca ccttcctcaa ccacactgaa gatgaatatg aatgccaggc ctgcccgaat 1620aacgagtggt cctaccagag tgagacctcc tgcttcaagc ggcagctggt cttcctggaa 1680tggcatgagg cacccaccat cgctgtggcc ctgctggccg ccctgggctt cctcagcacc 1740ctggccatcc tggtgatatt ctggaggcac ttccagacac ccatagttcg ctcggctggg 1800ggccccatgt gcttcctgat gctgacactg ctgctggtgg catacatggt ggtcccggtg 1860tacgtggggc cgcccaaggt ctccacctgc ctctgccgcc aggccctctt tcccctctgc 1920ttcacaattt gcatctcctg tatcgccgtg cgttctttcc agatcgtctg cgccttcaag 1980atggccagcc gcttcccacg cgcctacagc tactgggtcc gctaccaggg gccctacgtc 2040tctatggcat ttatcacggt actcaaaatg gtcattgtgg taattggcat gctggccacg 2100ggcctcagtc ccaccacccg tactgacccc gatgacccca agatcacaat tgtctcctgt 2160aaccccaact accgcaacag cctgctgttc aacaccagcc tggacctgct gctctcagtg 2220
gtgggtttca gcttcgccta catgggcaaa gagctgccca ccaactacaa cgaggccaag 2280ttcatcaccc tcagcatgac cttctatttc acctcatccg tctccctctg caccttcatg 2340tctgcctaca gcggggtgct ggtcaccatc gtggacctct tggtcactgt gctcaacctc 2400ctggccatca gcctgggcta cttcggcccc aagtgctaca tgatcctctt ctacccggag 2460cgcaacacgc ccgcctactt caacagcatg atccagggct acaccatgag gagggactag 2520<210>24<211>6<212>PRT<213>人工序列<220>
<223>人工序列描述6-His标签<400>24His His His His His His1 权利要求
1.一种分离的核酸,该核酸选自(i)一种基本由编码在味觉信号转导中起作用的T1R哺乳动物G蛋白偶联受体多肽的核酸序列组成的基因组DNA序列,其中该核酸序列基本由选自SEQ ID NOs 15和20的核酸序列组成;(ii)一种基本由编码T1R哺乳动物G蛋白偶联受体多肽的核酸序列组成的基因组DNA序列,其中的多肽含有选自SEQ ID NOs 4、14、17和21的氨基酸序列;(iii)一种与编码T1R哺乳动物G蛋白偶联受体多肽的核酸序列具有至少约50%的一致性的基因组DNA序列,其中所述核酸序列基本由选自SEQ ID NOs 15和20的核酸序列组成;选自SEQ ID Nos15和20的核酸序列;(iv)一种基本由编码T1R哺乳动物G蛋白偶联受体多肽的核酸序列组成的基因组DNA序列,其中的多肽含有与选自SEQ ID NOs 4、14、17和21的氨基酸序列具有至少约40%的一致性的氨基酸序列;(v)一种基本由编码T1R哺乳动物G蛋白偶联受体多肽的序列组成的基因组DNA序列,其中该多肽包含选自SEQ ID NOs 18和19的一致序列和与SEQ ID NOs 18或19具有至少约75%的一致性的序列;(vi)一种与基因组DNA序列中T1R哺乳动物G蛋白偶联受体多肽编码区具有相同核酸序列的cDNA序列,所述基因组DNA序列选自SEQ ID NOs 15和20;(vii)一种编码T1R哺乳动物G蛋白偶联受体多肽的cDNA序列,该多肽具有选自SEQ ID NOs 4、14、17和21的氨基酸序列;(viii)一种编码T1R哺乳动物G蛋白偶联受体多肽的cDNA序列,该多肽包含选自SEQ ID NOs 18和19的一致序列和与SEQ IDNOs 18或19具有至少约75%的一致性的序列;(ix)一种选自SEQ ID NOs 3、13、16和20的cDNA序列;(x)一种与基因组DNA序列中T1R G蛋白偶联受体多肽编码区具有至少约50%序列一致性的cDNA序列,所述基因组DNA序列选自SEQ ID NOs 15和20;(xi)一种与编码T1R哺乳动物G蛋白偶联受体多肽的序列具有至少约50%序列一致性的cDNA序列,该多肽具有选自SEQ ID NOs4、14、17和21的氨基酸序列;(xii)一种与选自SEQ ID NOs 3、13、16和20的序列具有至少约50%一致性的cDNA序列;(xiii)一种选自SEQ ID NOs 3、13、15、16和20的核酸序列的变体,该变体在编码在味觉信号转导中起作用的T1R G蛋白偶联受体多肽的区域含有至少一个保守替代;(xiv)一种编码具有选自SEQ ID NOs 4、14、17和21的氨基酸序列的T1R G蛋白偶联受体多肽的核苷酸序列的变体,该变体在T1R哺乳动物G蛋白偶联受体多肽编码区含有至少一个保守替代;和(xv)一种选自SEQ ID NOs 3、13、16和20的核酸序列的变体,该变体含有至少一个保守替代。
2.一种分离的基因组DNA分子,该分子基本由编码T1R哺乳动物G蛋白偶联受体多肽的核酸序列组成,其中该核酸序列基本由SEQ ID NO 15或20组成。
3.一种分离的RNA分子,该RNA分子从权利要求2的分离的DNA分子转录。
4.一种在严格性杂交条件下与权利要求2的DNA分子杂交的分离的核酸分子。
5.一种在中等杂交条件下与权利要求2的DNA分子杂交的分离的核酸分子。
6.一种权利要求2的基因组DNA分子的分离的片段,其长度至少约20~30个核苷酸碱基。
7.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求2的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
8.权利要求7的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
9.权利要求7的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
10.权利要求9的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
11.权利要求7的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
12.一种分离的基因组DNA分子,该DNA分子基本由编码哺乳动物G蛋白偶联受体的核酸序列组成,其中的受体具有选自SEQ IDNOs 4、14、17和21的氨基酸序列。
13.一种分离的RNA分子,该RNA分子从权利要求12的分离的DNA分子转录。
14.一种在严格性杂交条件下与权利要求12的DNA分子杂交的分离的核酸分子。
15.一种在中等杂交条件下与权利要求12的DNA分子杂交的分离的核酸分子。
16.一种权利要求12的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
17.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求12的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
18.权利要求17的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
19.权利要求17的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
20.权利要求19的嵌合或融合核酸分子,其中该异源编码序列来自哺乳动物视紫红质基因。
21.权利要求17的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
22.一种分离的基因组DNA分子,该DNA分子基本由与编码哺乳动物G蛋白偶联受体多肽的核酸序列具有至少约50%一致性的核酸序列组成,其中所述核酸序列基本由选自SEQ ID NOs 15和20的核酸序列组成。
23.一种分离的RNA分子,该RNA分子从权利要求22的分离的DNA分子转录。
24.一种在严格性杂交条件下与权利要求22的DNA分子杂交的分离的核酸分子。
25.一种在中等杂交条件下与权利要求22的DNA分子杂交的分离的核酸分子。
26.一种权利要求22的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
27.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求22的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
28.权利要求27的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
29.权利要求27的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
30.权利要求29的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
31.权利要求27的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
32.一种分离的基因组DNA分子,该DNA分子基本由编码哺乳动物G蛋白偶联受体的核酸序列组成,其中的受体具有与选自SEQ IDNOs 4、14、17和21的氨基酸序列具有至少约40%一致性的氨基酸序列。
33.一种分离的RNA分子,该RNA分子从权利要求32的分离的DNA分子转录。
34.一种在严格性杂交条件下与权利要求32的DNA分子杂交的分离的核酸分子。
35.一种在中等杂交条件下与权利要求32的DNA分子杂交的分离的核酸分子。
36.一种权利要求32的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
37.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求32的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
38.权利要求37的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
39.权利要求37的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
40.权利要求39的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
41.权利要求37的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
42.一种分离的cDNA分子,该cDNA分子包含与基因组DNA序列中所包含的哺乳动物G蛋白偶联受体多肽编码区具有相同序列的核酸序列,所述基因组DNA序列基本由选自SEQ ID NOs 15和20的核酸序列组成。
43.一种分离的RNA分子,该RNA分子从权利要求42的分离的DNA分子转录。
44.一种在严格性杂交条件下与权利要求42的DNA分子杂交的分离的核酸分子。
45.一种在中等杂交条件下与权利要求42的DNA分子杂交的分离的核酸分子。
46.一种权利要求42的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
47.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求42的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
48.权利要求47的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
49.权利要求47的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
50.权利要求49的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
51.权利要求47的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
52.一种包含权利要求42的分离的cDNA的核酸分子,所述cDNA可操作地连接到调节型或组成型异源启动子上。
53.权利要求52的核酸分子,其中所述调节型启动子在特定的环境或发育条件下是可诱导的。
54.一种分离的cDNA分子,该cDNA分子包含编码G蛋白偶联受体多肽的核酸序列,其中的多肽具有选自SEQ ID NOs 4、14、17和21的氨基酸序列。
55.一种分离的RNA分子,该RNA分子从权利要求54的分离的DNA分子转录。
56.一种在严格性杂交条件下与权利要求54的DNA分子杂交的分离的核酸分子。
57.一种在中等杂交条件下与权利要求54的DNA分子杂交的分离的核酸分子。
58.一种权利要求54的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
59.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求54的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
60.权利要求59的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
61.权利要求59的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
62.权利要求61的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
63.权利要求59的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
64.一种包含权利要求54的分离的cDNA的核酸分子,该cDNA可操作地连接到调节型或组成型异源启动子上。
65.权利要求64的核酸序列,其中所述调节型启动子在特定的环境或发育条件下是可诱导的。
66.一种分离的cDNA分子,该cDNA分子包含与基因组DNA序列中的G蛋白偶联受体多肽编码区具有至少约50%序列一致性的核酸序列,所述基因组DNA分子基本由选自SEQ ID NOs 15和20的核酸序列组成。
67.一种分离的RNA分子,该RNA分子从权利要求66的分离的DNA分子转录。
68.一种在严格性杂交条件下与权利要求66的DNA分子杂交的分离的核酸分子。
69.一种在中等杂交条件下与权利要求66的DNA分子杂交的分离的核酸分子。
70.一种权利要求66的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
71.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求66的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
72.权利要求71的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
73.权利要求71的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
74.权利要求73的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
75.权利要求71的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
76.一种包含权利要求66的分离的cDNA的核酸分子,该分子可操作地连接到调节型或组成型异源启动子上。
77.权利要求76的核酸序列,其中所述调节型启动子在特定的环境或发育条件下是可诱导的。
78.一种分离的cDNA分子,该cDNA分子包含与编码哺乳动物T1R G蛋白偶联受体多肽的序列具有至少约40%序列一致性的核酸序列,该多肽具有选自SEQ ID NOs 4、10、12、14和17的氨基酸序列。
79.一种分离的RNA分子,该RNA分子从权利要求78的分离的DNA分子转录。
80.一种在严格性杂交条件下与权利要求78的DNA分子杂交的分离的核酸分子。
81.一种在中等杂交条件下与权利要求78的DNA分子杂交的分离的核酸分子。
82.一种权利要求78的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
83.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求78的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
84.权利要求83的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
85.权利要求83的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
86.权利要求85的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
87.权利要求83的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
88.一种包含权利要求78的分离的cDNA的核酸分子,该cDNA可操作地连接到调节型或组成型异源启动子上。
89.权利要求88的核酸分子,其中所述调节型启动子在特定的环境或发育条件下是可诱导的。
90.一种分离的变体DNA分子,该变体DNA分子包含基本由选自SEQ ID NOs 15和20的核酸序列组成的核苷酸序列,该变体DNA分子在味觉信号转导中起作用的G蛋白偶联受体多肽的编码区含有至少一个保守替代。
91.一种分离的RNA分子,该RNA分子从权利要求90的分离的DNA分子转录。
92.一种在严格性杂交条件下与权利要求90的DNA分子杂交的分离的核酸分子。
93.一种在中等杂交条件下与权利要求90的DNA分子杂交的分离的核酸分子。
94.一种权利要求90的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
95.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求90的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
96.权利要求95的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
97.权利要求95的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
98.权利要求97的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
99.权利要求95的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
100.一种与权利要求90的变体DNA分子的编码区具有相同核酸序列的cDNA分子。
101.一种包含权利要求100的cDNA的核酸分子,该cDNA可操作地连接到调节型或组成型异源启动子上。
102.权利要求101的核酸序列,其中所述调节型启动子在特定的环境或发育条件下是可诱导的。
103.一种分离的变体分子,该变体分子包含编码具有选自SEQ IDNOs 4、14、17和21的氨基酸序列的多肽的核苷酸序列,且该变体分子在编码区含有至少一个保守替代。
104.一种分离的RNA分子,该RNA分子从权利要求103的分离的DNA分子转录。
105.一种在严格性杂交条件下与权利要求103的DNA分子杂交的分离的核酸分子。
106.一种在中等杂交条件下与权利要求103的DNA分子杂交的分离的核酸分子。
107.一种权利要求103的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
108.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求103的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
109.权利要求108的嵌合或融合核酸分子,其中所述异源编码序列来自编码不同G蛋白偶联受体的序列。
110.权利要求108的嵌合或融合核酸分子,其中所述异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
111.权利要求110的嵌合或融合核酸分子,其中所述异源编码序列来自哺乳动物视紫红质基因。
112.权利要求108的嵌合或融合核酸分子,其中所述异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
113.一种与权利要求103的变体DNA分子的编码区具有相同核酸序列的cDNA分子
114.一种包含权利要求113的cDNA分子的核酸分子,该cDNA分子可操作地连接到调节型或组成型异源启动子上。
115.权利要求114的核酸分子,其中所述调节型启动子在特定的环境或发育条件下是可诱导的。
116.权利要求1的分离的核酸分子,其中该核酸编码在大鼠、小鼠或人的味觉信号转导中起作用的G蛋白偶联受体多肽。
117.一种包含权利要求1的分离的核酸分子的表达载体,其中该载体选自哺乳动物载体、细菌质粒、细菌噬菌粒、哺乳动物病毒和反转录病毒、噬菌体载体和能够整合入宿主细胞基因组的线状或环状DNA分子。
118.一种用权利要求117的至少一种表达载体转染的宿主细胞,其中该宿主细胞在该宿主细胞的表面表达所编码的G蛋白偶联受体多肽。
119.一种包含权利要求1的至少一个分离的核酸分子的至少约20~30个核苷酸的核酸阵列,其中所述至少一个核酸分子可操作地共价或非共价地连接于固相基质上。
120.一种筛选激活味觉信号转导的化合物的方法,该方法包含(i)使权利要求118的宿主细胞与推定的味觉激活化合物接触;和(ii)测量来自表达于细胞表面的该G蛋白偶联受体多肽的活性。121.权利要求120的方法,其中该G蛋白偶联受体多肽的活性是通过测量细胞内Ca2+水平、cAMP、cGMP和IP3的变化,或者GTPγS的G蛋白结合来测量的。
122.权利要求120的方法,其中该宿主细胞是用至少一种编码参与味觉信号转导的基因的额外核酸构建体进行转染的。
123.权利要求122的方法,其中所说的至少一种额外基因编码参与味觉信号转导的G蛋白。
124.权利要求123的方法,其中该G蛋白是一种混杂G蛋白。
125.一种筛选调节味觉信号转导的化合物的方法,该方法包含(i)使权利要求118的宿主细胞与已知的味觉激活化合物和推定参与味觉转导调节的化合物接触;(ii)使权利要求118的宿主细胞单独与已知的味觉激活化合物接触;和(iii)将来自表达于步骤(i)的宿主细胞的细胞表面的该G蛋白偶联受体多肽的活性与来自表达于步骤(ii)的宿主细胞的细胞表面的该G蛋白偶联受体多肽的活性进行比较,从而鉴定味觉转导的调节子。
126.权利要求125的方法,其中该调节化合物选自激活剂、抑制剂、刺激物、增强子、激动剂和拮抗剂。
127.权利要求125的方法,其中该G蛋白偶联受体多肽的活性是通过测量细胞内Ca2+水平、cAMP、cGMP和IP3的变化,或者GTPγS的G蛋白结合来测量的。
128.权利要求125的方法,其中该宿主细胞是用至少一种编码参与味觉信号转导的基因的额外核酸构建体进行转染的。
129.权利要求128的方法,其中所说的至少一种额外基因编码参与味觉信号转导的G蛋白。
130.权利要求129的方法,其中该G蛋白是一种混杂G蛋白。
131.一种探测细胞中G蛋白偶联受体多肽基因表达的方法,该方法包含(i)使该细胞与能在严格性条件下与权利要求1分离的核酸分子杂交的核酸分子接触;和(ii)探测杂交,从而探测该G蛋白偶联受体多肽基因的表达。
132.一种编码在味觉信号转导中起作用的G蛋白偶联受体多肽的分离的核酸分子,该核酸分子具有SEQ ID NO1的核苷酸序列。
133.一种编码在味觉信号转导中起作用的G蛋白偶联受体多肽的分离的核酸分子,该核酸分子具有SEQ ID NO2的核苷酸序列。
134.一种编码在味觉信号转导中起作用的G蛋白偶联受体多肽的分离的核酸分子,该核酸分子具有SEQ ID NO9的核苷酸序列。
135.一种编码在味觉信号转导中起作用的G蛋白偶联受体多肽的分离的核酸分子,该核酸分子具有SEQ ID NO11的核苷酸序列。
136.一种具有SEQ ID NO3的核苷酸序列的分离的核酸分子。
137.一种具有SEQ ID NO13的核苷酸序列的分离的核酸分子。
138.一种具有SEQ ID NO15的核苷酸序列的分离的核酸分子。
139.一种具有SEQ ID NO16的核苷酸序列的分离的核酸分子。
140.一种编码具有SEQ ID NO4的氨基酸序列的多肽的分离的核酸分子。
141.一种编码在味觉信号转导中起作用的G蛋白偶联受体多肽的分离的核酸分子,该多肽具有SEQ ID NO10的氨基酸序列。
142.一种编码在味觉信号转导中起作用的G蛋白偶联受体多肽的分离的核酸分子,该多肽具有SEQ ID NO12的氨基酸序列。
143.一种编码具有SEQ ID NO14的氨基酸序列的多肽的分离的核酸分子。
144.一种编码具有SEQ ID NO17的氨基酸序列的多肽的分离的核酸分子。
145.一种编码在味觉信号转导中起作用的G蛋白偶联受体多肽的分离的核酸分子,该多肽包含SEQ ID NO18的一致序列或与SEQ IDNO18的序列具有至少75%的一致性的一致序列。
146.一种编码在味觉信号转导中起作用的G蛋白偶联受体多肽的分离的核酸,该多肽包含SEQ ID NO19的一致序列或与SEQ ID NO19的序列具有至少75%的一致性的一致序列。
147.一种用至少一个具有SEQ ID NOs 5或6的核酸序列的或者基本由编码SEQ ID NOs 18或19的一致序列的核酸序列组成的简并引物通过PCR反应扩增的基因组DNA,其中该扩增的DNA包含在味觉信号转导中起作用的G蛋白偶联受体多肽的编码序列。
148.一种分离包含在味觉信号转导中起作用的G蛋白偶联受体多肽的编码序列的基因组序列的方法,该方法包含使哺乳动物基因组与至少一个具有SEQ ID NOs 5或6的核酸序列的或基本由编码SEQ IDNOs 18或19的一致序列的核酸序列组成的简并引物接触,并且在聚合酶、游离核苷酸和辅因子存在下扩增包含该引物序列的该基因组序列。
149.一种筛选哺乳动物基因组从而得到在味觉信号转导中起作用的G蛋白偶联受体的编码序列的方法,该方法包含(i)使该哺乳动物基因组与至少一个具有SEQ ID NOs 5或6的核酸序列的或基本由编码SEQ ID NOs 18或19的一致序列的核酸序列组成的简并引物接触;(ii)在聚合酶、游离核苷酸和辅因子存在下扩增包含该至少一种引物序列的该基因组序列;和(iii)探测包含G蛋白偶联受体多肽基因的扩增序列的存在。
150.包含小鼠T1R3基因的质粒SAV115。
151.包含大鼠T1R3基因的质粒SAV118。
152.一种分离的多肽,该多肽选自(i)一种由核酸分子编码的在味觉信号转导中起作用的G蛋白偶联受体多肽,该核酸分子包含选自SEQ ID NOs 9和11的核酸序列以及基本由SEQ ID NOs 1和2组成的基因组序列;(ii)一种由核酸分子编码的在味觉信号转导中起作用的G蛋白偶联受体多肽,该核酸分子包含选自SEQ ID NOs 3、13、16和20的核酸序列,以及基本由选自SEQ ID NOs 15和20的核酸序列组成的基因组序列;(iii)一种在味觉信号转导中起作用的G蛋白偶联受体多肽,该多肽包含选自SEQ ID NOs 10和12的氨基酸序列;(iv)一种G蛋白偶联受体多肽,该多肽包含选自SEQ ID NOs 4、14、17和21的氨基酸序列;(v)一种由核酸分子编码的在味觉信号转导中起作用的G蛋白偶联受体多肽,该核酸分子包含与选自SEQ ID NOs 9和11的核酸序列具有至少约50%一致性的核酸序列,以及基本由SEQ ID NOs 1和2组成的基因组序列;(vi)一种由核酸分子编码的G蛋白偶联受体多肽,该核酸分子包含与选自SEQ ID NOs 3、13、16和20的核酸序列具有至少约50%一致性的核酸序列,以及基本由选自SEQ ID NOs 15和20的核酸序列组成的基因组序列;(vii)一种在味觉信号转导中起作用的G蛋白偶联受体多肽,该多肽包含与选自SEQ ID NOs 10和12的氨基酸序列具有至少约40%的一致性的氨基酸序列;(viii)一种G蛋白偶联受体多肽,该多肽包含与选自SEQ ID NOs4、14、17和21的氨基酸序列具有至少约40%的一致性的氨基酸序列;(ix)一种由核酸分子编码的在味觉信号转导中起作用的G蛋白偶联受体多肽的变体,该核酸分子包含选自SEQ ID NOs 9和11的核酸序列,以及基本由SEQ ID NOs 1和2组成的基因组序列,其中该变体蛋白质相对于由所述核苷酸序列编码的G蛋白偶联受体含有至少一个保守的替代;(x)一种由核酸分子编码的G蛋白偶联受体多肽的变体,该核酸分子包含选自SEQ ID NOs 3、13、16和20的核酸序列,以及基本由选自SEQ ID NOs 15和20的核酸序列组成的基因组序列,其中该变体蛋白质相对于由所述核苷酸序列编码的G蛋白偶联受体含有至少一个保守的替代;(xi)一种在味觉信号转导中起作用的G蛋白偶联受体多肽的变体,该变体包含选自SEQ ID NOs 10和12的氨基酸序列,并含有至少一个保守替代;和(xii)一种G蛋白偶联受体多肽的变体,该变体包含选自SEQ IDNOs 4、14、17和21的氨基酸序列,并含有至少一个保守替代。
153.权利要求152的多肽的片段,其中该片段包含至少约5~7个氨基酸。
154.权利要求153的片段,其中该片段包含T1R哺乳动物G蛋白偶联受体多肽的细胞外结构域。
155.权利要求154的片段,其中该细胞外结构域与参与味觉激活或调节的化合物相互作用。
156.权利要求154的片段,其中该细胞外结构域与参与味觉转导的蛋白质相互作用。
157.权利要求156的片段,其中参与味觉信号转导的该蛋白质是G蛋白亚单位。
158.权利要求157的片段,其中该G蛋白亚单位是混杂的G蛋白。
159.一种嵌合或融合多肽,其中该多肽包含至少部分的权利要求152的多肽的氨基酸序列和至少部分的异源氨基酸序列。
160.一种权利要求159的嵌合或融合多肽,其中该异源序列是来自不同G蛋白偶联受体的序列。
161.一种权利要求159的嵌合或融合多肽,其中该异源序列是来自绿色荧光蛋白质的序列。
162.一种筛选一种或多种化合物以确定激活或调节味觉信号转导的化合物是否存在的方法,该方法包括使该一种或多种化合物与根据权利要求152的一种或多种多肽的一种或多种片段接触,其中该一种或多种片段长度为至少约5~7个氨基酸。
163.一种筛选一种或多种蛋白质以确定与在味觉信号转导中起作用的G蛋白偶联受体相互作用的蛋白质是否存在的方法,该方法包括使该一种或多种蛋白质与根据权利要求152的一种或多种多肽的一种或多种片段接触,其中该一种或多种片段长度为至少约5~7个氨基酸。
164.一种包含一种或多种根据权利要求152的多肽的至少约5~7个氨基酸的区段的多肽阵列,其中该一种或多种多肽区段共价地或非共价地连接到固相基质上。
165.一种特异性地与权利要求152的多肽结合的分离的抗体或抗体片段。
166.一种具有SEQ ID NO4的氨基酸序列的分离的多肽。
167.一种具有SEQ ID NO10的氨基酸序列的分离的多肽。
168.一种具有SEQ ID NO12的氨基酸序列的分离的多肽。
169.一种具有SEQ ID NO14的氨基酸序列的分离的多肽。
170.一种具有SEQ ID NO17的氨基酸序列的分离的多肽。
171.一种在一种或多种哺乳动物中表示一种或多种味觉感受的方法,该方法包含以下步骤(i)提供该哺乳动物中n个味觉受体中每一个的定量刺激的代表值X1~Xn;(ii)从该值中产生味觉感受的定量表示,其中至少一种该味觉受体是具有与选自SEQ ID NOs 4、10、12、14和17的序列具有至少约40%一致性的序列的味觉受体多肽。
172.权利要求171的方法,其中该表示构成n维空间中的点或组。
173.权利要求171的方法,其中该表示构成图表或谱。
174.权利要求171的方法,其中该表示构成定量表示的矩阵。
175.权利要求171的方法,其中该提供的步骤包含将大量重组生产的味觉受体与检验组合物接触,并定量测量该组合物与该受体之间的相互作用。
176.一种在哺乳动物中预测由一种或多种分子或分子组合生成的味觉感受的方法,该方法包含以下步骤(i)对于在哺乳动物中产生已知味觉感受的一种或多种分子或分子组合,提供该哺乳动物n个味觉受体中每一个的定量刺激的代表值X1~Xn;(ii)从该值中产生出能在哺乳动物中产生已知味觉感受的一种或多种分子或分子组合在哺乳动物中味觉感受的定量表示;(iii)对于在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合,提供该哺乳动物n个味觉受体中每一个的定量刺激的代表值X1~Xn;(iv)从该值中产生出能在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合在哺乳动物中味觉感受的定量表示;(v)预测哺乳动物中由在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合产生的味觉感受,该预测是通过将能在哺乳动物中产生未知味觉感受的一种或多种分子或分子组合在哺乳动物中味觉感受的定量表示与能在哺乳动物中产生已知味觉感受的一种或多种分子或分子组合在哺乳动物中味觉感受的定量表示进行比较来实现的,其中至少一种该味觉受体是具有与选自SEQ ID NOs 4、10、12、14和17的序列具有至少约40%一致性的序列的味觉受体多肽。
177.一种基本由编码在味觉信号转导中起作用的哺乳动物G蛋白偶联受体多肽的核酸序列组成的基因组DNA分子,其中该多肽包含选自SEQ ID NOs 18和19的一致序列和与SEQ ID NOs 18或19具有至少约75%的一致性的序列。
178.一种分离的RNA分子,该RNA分子从权利要求177的分离的DNA分子转录。
179.一种在严格性杂交条件下与权利要求177的DNA分子杂交的分离的核酸分子。
180.一种在中等杂交条件下与权利要求177的DNA分子杂交的分离的核酸分子。
181.一种权利要求177的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
182.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求177的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
183.权利要求182的嵌合或融合核酸分子,其中该异源编码序列来自编码不同G蛋白偶联受体的序列。
184.权利要求182的嵌合或融合核酸分子,其中该异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
185.权利要求184的嵌合或融合核酸分子,其中该异源编码序列来自哺乳动物视紫红质基因。
186.权利要求182的嵌合或融合核酸分子,其中该异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
187.一种编码在味觉信号转导中起作用的哺乳动物G蛋白偶联受体多肽的cDNA序列,其中该多肽包含选自SEQ ID NOs 18和19的一致序列和与SEQ ID NOs 18或19具有至少约75%的一致性的序列。
188.一种分离的RNA分子,该RNA分子从权利要求187的分离的DNA分子转录。
189.一种在严格性杂交条件下与权利要求187的DNA分子杂交的分离的核酸分子。
190.一种在中等杂交条件下与权利要求187的DNA分子杂交的分离的核酸分子。
191.一种权利要求187的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
192.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求187的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
193.权利要求192的嵌合或融合核酸分子,其中该异源编码序列来自编码不同G蛋白偶联受体的序列。
194.权利要求192的嵌合或融合核酸分子,其中该异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
195.权利要求194的嵌合或融合核酸分子,其中该异源编码序列来自哺乳动物视紫红质基因。
196.权利要求192的嵌合或融合核酸分子,其中该异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
197.一种包含权利要求187的分离的cDNA的核酸分子,该cDNA可操作地连接到调节型或组成型异源启动子上。
198.权利要求197的核酸分子,其中该调节型启动子在特定的环境或发育条件下是可诱导的。
199.一种包含选自SEQ ID NOs 3、13、16和20的核酸序列的cDNA分子。
200.一种分离的RNA分子,该RNA分子从权利要求199的分离的DNA分子转录。
201.一种在严格性杂交条件下与权利要求199的DNA分子杂交的分离的核酸分子。
202.一种在中等杂交条件下与权利要求199的DNA分子杂交的分离的核酸分子。
203.一种权利要求199的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
204.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求199的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
205.权利要求204的嵌合或融合核酸分子,其中该异源编码序列来自编码不同G蛋白偶联受体的序列。
206.权利要求204的嵌合或融合核酸分子,其中该异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
207.权利要求206的嵌合或融合核酸分子,其中该异源编码序列来自哺乳动物视紫红质基因。
208.权利要求204的嵌合或融合核酸分子,其中该异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
209.一种包含权利要求199的分离的cDNA的核酸分子,该cDNA可操作地连接到调节型或组成型异源启动子上。
210.权利要求209的核酸序列,其中该调节型启动子在特定的环境或发育条件下是可诱导的。
211.一种包含与选自SEQ ID NOs 3、13、16和20的序列具有至少约50%一致性的核酸序列的cDNA分子。
212.一种分离的RNA分子,该RNA分子从权利要求211的分离的DNA分子转录。
213.一种在严格性杂交条件下与权利要求211的DNA分子杂交的分离的核酸分子。
214.一种在中等杂交条件下与权利要求211的DNA分子杂交的分离的核酸分子。
215.一种权利要求211的基因组DNA分子的分离片段,其长度至少约20~30个核苷酸碱基。
216.一种嵌合或融合核酸分子,其中该嵌合或融合核酸分子包含至少部分的包含于权利要求211的DNA分子中的编码序列和至少部分的异源编码序列,其中该嵌合或融合核酸分子的转录产生一个单一的嵌合核酸转录物。
217.权利要求216的嵌合或融合核酸分子,其中该异源编码序列来自编码不同G蛋白偶联受体的序列。
218.权利要求216的嵌合或融合核酸分子,其中该异源编码序列是促进该哺乳动物G蛋白偶联受体多肽在细胞表面表达的序列。
219.权利要求218的嵌合或融合核酸分子,其中该异源编码序列来自哺乳动物视紫红质基因。
220.权利要求216的嵌合或融合核酸分子,其中该异源编码序列来自编码绿色荧光蛋白质的基因或其他可探测的标记基因。
221.一种包含权利要求211的分离的cDNA的核酸分子,该cDNA可操作地连接到调节型或组成型异源启动子上。
222.权利要求221的核酸序列,其中该调节型启动子在特定的环境或发育条件下是可诱导的。
223.权利要求153的片段,其中该片段包括至少G蛋白偶联受体的N-末端片段。
224.权利要求223的片段,其中该N-末端片段参与配体结合。
225.权利要求224的多肽片段,其中该片段长度为至少约100个氨基酸。
226.权利要求224的多肽片段,其中该片段长度为至少约600个氨基酸。
227.一种鉴定味觉刺激物配体的生物化学测定,其中的配体具有与在味觉信号转导中起作用的G蛋白偶联受体的结合特异性,该测定包括(i)使根据权利要求224的一种或多种片段与一种或多种推定的味觉刺激物配体或包含一种或多种推定的味觉刺激物配体的组合物接触;和(ii)探测具有对在味觉信号转导中起作用的G蛋白偶联受体的结合特异性的味觉刺激物配体的结合。
228.权利要求227的测定,其中的结合是通过放射性标记的已知结合配体的置换来探测的。
229.权利要求228的测定,其中该已知的结合配体是对该G蛋白偶联受体具有结合特异性的抗体或抗体片段。
230.一种具有SEQ ID NO 20的核酸序列的分离的核酸分子。
231.一种嵌合或融合的多肽,该多肽包含根据权利要求152的至少一个多肽的至少一个细胞外结构域,以及至少部分的异源氨基酸序列。
232.权利要求231的嵌合或融合多肽,其中该异源氨基酸序列是来自不同的G蛋白偶联受体的序列。
233.权利要求232的嵌合或融合多肽,其中该不同的G蛋白偶联受体是T1R哺乳动物G蛋白偶联受体,且该异源氨基酸序列包括该T1R哺乳动物G蛋白偶联受体的至少一个细胞外结构域。
234.一种鉴定味觉刺激物配体的生物化学测定,其中的配体具有与在味觉信号转导中起作用的G蛋白偶联受体的结合特异性,该测定包括(i)使根据权利要求224的一种或多种片段与G蛋白和GTPγS制剂、一种或多种推定的味觉刺激物配体或包含一种或多种推定的味觉刺激物配体的组合物接触;和(ii)通过测量GTPγS与G蛋白的结合,探测具有对在味觉信号转导中起作用的G蛋白偶联受体的结合特异性的味觉刺激物配体的结合。
全文摘要
描述了最近鉴定的哺乳动物味觉细胞特异性G蛋白偶联受体以及编码该受体的基因和cDNA。特别地,描述了在味觉信号传导中起作用的T1R G蛋白偶联受体以及其编码基因和cDNA,同时还描述了用于分离该基因和用于分离与表达该受体的方法。也描述了用于在哺乳动物中表示特殊味觉刺激物的味觉感受的方法,以及用于产生在哺乳动物中引起预定味觉感受的新分子或分子组合的方法,和模仿一种或多种味觉的方法。此外,也公开了用于在哺乳动物中刺激或阻断味觉感受的方法。
文档编号G01N33/15GK1525981SQ02803431
公开日2004年9月1日 申请日期2002年1月3日 优先权日2001年1月3日
发明者J·E·阿德勒, 李晓东, L·斯塔谢夫斯基, S·奥康奈尔, S·佐祖利亚, J E 阿德勒, 环蛩够, 的味, 胬 申请人:塞诺米克斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1