釉质基质相关多肽的制作方法

文档序号：450172阅读：868来源：国知局

专利名称：釉质基质相关多肽的制作方法
技术领域：
本发明涉及编码属于一组被称为amelin的多肽的新核酸序列，其多肽序列包含与细胞表面识别有关的四肽功能域。amelin序列的可能用途涉及对硬组织形成失调的诊断，以及在生物物质形成中可作为基质成分或细胞识别标记的amelin蛋白或其片段的产生。本发明还涉及含本发明核酸片段的表达载体以生产蛋白质，涉及含所述表达载体的生物，生产该多肽的方法，含该多肽的组合物，以及治疗各种硬组织疾病或失调症的方法。
背景技术：
在骨，牙质和其他组织中，I型胶原或类似蛋白质装配成原纤维基质，后者在一些情况下作为结合矿物晶体的支架。邻近的细胞与该基质建立特异性接触，该接触由细胞外蛋白质如胶原和细胞表面受体，如整联蛋白中的功能域的相互作用的介导。已经在数种细胞外蛋白质中鉴定了涉及这些接触的肽功能域(Yamada&Kleinman，1992)。在釉质中尚未发现相当于骨中胶原纤维的结构网软骨和牙质。而且，还没有在介导其锚着于细胞粘着分子的釉质基质蛋白质中鉴定出序列片段。釉质蛋白质牙釉蛋白和enamelin不含有这类蛋白质功能域。新沉积的釉质的矿物成分是总质量的15％左右并在以后随蛋白质的降解而增加到95％(Robinson等，1988)。
在釉质中已鉴定了主要的两组蛋白质enamelin和牙釉蛋白(Termine等，1980)。在成熟釉质中的蛋白质片段类似于enamelin之一，tuftelin，它已被抗体定位于釉质角柱体之间。已确定了对应于tuftelin的cDNA序列，并推测该蛋白质可能在釉质矿化中具有功能(Deutsch等，1991)。其余(迄今所描述的)enamelin对釉质形成的意义可能是有争论的，因为主要蛋白质种类与来自血流的蛋白质是同样的(Strawich&Glinmcher，1990)。是否牙釉蛋白(最常见的蛋白质)为釉质基质提供一种支架仍在讨论之中(Simmer等，1994)。
先前已经汇集了一些从大鼠原位杂交文库随机筛选的部分序列(Matsuki等，1995)，其中有些序列显示与本发明的序列有同源性。没有阅读框被认为来自于这些部分序列。没有说明是否多肽被这些序列编码亦没有给出关于这类多肽之可能功能的假设。
已经在猪的未成熟釉质中鉴定了非牙釉蛋白蛋白质(Uchida等，1995)。一种15kDa蛋白质具有与先前已知enamelin质非同源的N末端氨基酸序列(VPAFPRQPGTHGVASL-)。假设非牙釉蛋白包含enamelin质的一个新家族但没有提出它们的功能。该蛋白质还没有被完全测序并且它们的基因属于未知。
WO89/08441涉及包括用于诱导活矿化组织的各部分之间的结合的一种组合物，其中活性成分来源于牙釉质的一种前体，即所谓的釉质基质。该组合物通过促进矿化组织再生诱导结合。该活性成分是一个蛋白质组分的一部分并以具有高达40.000kDa分子量为特征但没有鉴定为单一蛋白质。
发明概述虽然通常产生大量矿化的基质蛋白质，它们较差的溶解度妨碍了直接分析。在牙基质中基质蛋白质的生理降解发生在成熟期时的矿物质获得过程中并给分析基质蛋白质造成额外困难。本发明基于这种考虑即由于基质形成细胞合成大量的相应蛋白质，它们应含有高拷贝数的mRNA。因此，对基质形成细胞的主要种类的mRNA的序列分析可绕过部分问题并帮助研究基质的某些蛋白质成分。
这些考虑引入了所采用的导致发现新amelin mRNA序列的方法，即本发明的基础。简言之，建立了含发育牙齿的mRNA序列种类的基因文库。从单细菌克隆得到各个序列并用于整个发育中的牙齿组织切片的原位杂交实验。在形成硬组织基质细胞(例如成釉质细胞)中所检测到的序列被确定并被用于查询序列数据库。大多数这样筛选的序列在数据库中都有描述，但在现称为amelin序列的两个序列没有描述。在釉质基质形成期间新mRNA的这两个变异体在大鼠成釉质细胞中被高水平表达。所述序列分别含有407和304氨基酸残基的开放阅读框。被命名为amelin的被编码蛋白质富含脯氨酸，亮氨酸和甘氨酸残基并含有与细胞表面相互作用的其他功能域相结合的肽功能域Asp-Gly-Glu-Ala(一种整联蛋白识别序列)。编码C末端305个氨基酸残基的序列，即SEQ ID NO 2中的氨基酸102-407和SEQ ID NO4中的氨基酸19-324，3’非翻译区部分和在非翻译5’区的微卫星重复序列在两个mRNA变异体中是一致的。其余的5’区包括长的变异体(在SEQID NO1中核苷酸12-349)所特有的338个核苷酸，共有的54个核苷酸和仅在短的变异体中存在的46个核苷酸(在SEQ ID NO3中核苷酸66-111)。十四个核苷酸有潜力编码两个蛋白质在不同阅读框中的5个氨基酸(在SEQ ID NO1中的390-403和SEQ ID NO3中的52-65)。较长的变异体的阅读框包括典型N末端信号肽的密码子。amelin mRNA序列的性质表明amelin是釉质基质的一种成分并且是迄今涉及成釉质细胞表面与其细胞外基质之间的结合相互作用的唯一蛋白质。
预期amelin肽或其部分可通过化学或通过使用本文描述的序列信息借助表达载体来翻译合成。进一步预期这些肽可对设计修复牙齿或骨的医疗设备有用。这些肽还可与以提高人工植入材料的生物相容性的目的与这种材料结合使用。人的amelin mRNA或基因序列可有助于硬组织形成的遗传病症的诊断。
详细描述为获得可能是难于以直接途径分析的细胞外基质蛋白质的序列资料，以含有基质形成细胞的所有组成部分mRNA的λ噬菌体建立一个cDNA库。以下列途径筛选amelin RNA序列如实施例4进行影印嗜斑拓取(replica plaque lift)实验并与分别与cDNA和牙釉蛋白以及胶原寡聚物杂交。嗜菌斑呈现与cDNA相对强的杂交信号但与寡聚物无信号被进一步分析，设想它们含有常在cDNA中被描述但与牙釉蛋白和胶原不同的序列。这些阳性嗜菌斑克隆中的十五个被转变成Bluescript质粒。
为鉴定在基质形成细胞(即可参与基质产生和生长磨牙的矿化的细胞)中表达的序列，合成RNA探针(riboprobe)供原位杂交用。挑选四天龄大鼠，因为涉及釉质基质生成的牙釉蛋白RNA的浓度约在此时最高。

图1显示用amelin探针所得结果(见实施例4和图1a)，作为与牙釉蛋白RNA(图1b)和胶原(图1c)反应的比较。在分泌期检测含成釉质细胞的内釉质上皮中的amelin和牙釉蛋白。胶原探针主要修饰位于间充质髓周边的成牙本质细胞以及牙槽骨的成骨细胞。因此断定amelin可对形成釉质基质起作用。对使在牙结构中造成显示探针原位杂交信号阳性的十四个cDNA插入片段进行部分测序。所述片段用于查询基因库和EMBL数据库以对它们作出鉴定。迄今两个新序列没有被描述。
为确定全amelin mRNA序列，用从上述初始amelin序列得到的一个寡核苷酸筛选牙cDNA文库并分离到6个长度范围在0.5和2kb之间的另外的插入片段。序列分析表明所有7个克隆代表了对应于3’mRNA部分的序列。然而，在两个最长的插入片段中发现了两个不同的5’区特称为amelin1和amelin2(图2)。为得到全长的序列描述，从大鼠磨牙建立随机引物库，并用从所述两个突变异体的各自5’端(图2下划线)得到的两个不同的寡核苷酸筛选。用从amelin1的5’部分得到的amelin2和amelin13克隆的5’部分杂交分离出5个克隆。序列分析证实了前面的结果并扩延了现称为amelin1和amelin2的两个变异体的序列并分别在序列表中表示为SEQ ID NO1和SEQ ID NO3。两个5’mRNA序列在最多达100x(AG)(数据未显示)的多嘌呤重复处终止。考虑到在5’末端的AG重复和在3’末端的聚腺苷酸尾，合在一起的序列(图2)不比由Northern印迹(见下)所确定的mRNA短。从polyT primed cDNA库得到的克隆的序列分析显示出聚腺苷酸添加信号AATAAA(双下划线)的一个意外的3’变异下游。在某些克隆中观察到如预期的15个核苷酸下游的聚腺苷酸尾，但在其他克隆中观察到其位于最多达79核苷酸的较长距离。图2中的序列显示最长距离的聚腺苷酸化部位变异体。所有的变异被定位在终止密码子的下游。
两个cDNA序列变异体显示了单一的长开放阅读框(图2)。框内终止密码子出现在聚(AG)和开放阅读框之间，因而看来聚(AG)或近侧序列似乎不可能编码蛋白质。amelin的阅读框起始于聚(AG)重复序列的84个核苷酸下游。前86个氨基酸由一个未在amelin2中显现的序列所编码。amelin1的氨基酸87到99由amelin1和amelin2共有的序列所编码。然而，该序列不编码amelin2蛋白质。虽然它包括了ATG密码子，框内终止密码子只容许编码七肽。与七肽终止密码子重叠的下一个ATG起始编码amelin2的最长序列。有趣的是，它的前十四个核苷酸以不同的框架编码amelin1和amelin2(图2中加阴影部分)。接着的编码amelin2的15个氨基酸的46个核苷酸未出现在amelin1RNA中。在amelin2RNA中的该“插入片段”引起两个阅读框的同步化，以至最后的305个氨基酸残基对两个蛋白质是共有的。在amelin2的插入片段中有一个框内ATG密码子，它可能是作为另一个翻译的起始。在此情况下，amelin2会少5个氨基酸并且没有两个框架编码序列段。最长的可能的开放阅读框含amelin1的407个氨基酸残基的密码子和amelin2的324个残基的密码子。
自提出第一次申请以来，已经再次检查了测序结果并做了某些修正。amelin1序列已被修正如下132号核苷酸已被从G变为G没有引起氨基酸变化。191号核苷酸已被从G变为A引起33位的精氨酸变为33位谷氨酰胺。200号核苷酸已被从G变成C引起36位甘氨酸变为36丙氨酸。617号核苷酸已被从G变为C引起175位甘氨酸变为175位丙氨酸。809号核苷酸已被从G变为C引起239位甘氨酸变为239位丙氨酸。976号核苷酸已被从C变为G引起295位脯氨酸变为295位丙氨酸。1649号核苷酸已被从C变为A未引起氨基酸变化。amelin2序列已被修正如下326号核苷酸已被从G变为C引起92位甘氨酸变为92位丙氨酸。518号核苷酸已被从G变为C引起156位甘氨酸变为156位丙氨酸。685号核苷酸已被从C变为G引起212位脯氨酸变为212位丙氨酸。1358号核苷酸从C变为A没有引起氨基酸变化。
为评估amelin转录物的大小，进行了从4天龄大鼠的磨牙制备的总RNA的Northern印迹分析(图3，a泳道)。DIG标记的amelincRNA探针杂交到一2kb和一1.9kbRNA带。如cDNA序列分析所确定的，若将0.2kb的聚(AG)重复序列和0.2kb的聚腺苷酸加入到展示序列中则amelin1和amelin2 mRNAs是2.3kb和2.0kb长。这两个测定十分符合说明所述序列包含amelin的全部或几乎全部mRNA。为了比较，出示牙釉蛋白的两个主要mRNAs(1.1kb和0.8kb长)(图3，b泳道)。通过液相杂交实验确定了来自磨牙的总RNA中的与牙釉蛋白相关的amelin RNA的大部分(Mathews等，1989)。若与牙釉蛋白的含量相比，amelin RNA的量占大约5％。amelin1和amelin2的序列比较表明两个RNAs是同一初级转录物的剪接变异体，因为在相匹配的序列部分中未发现有改变。
在amelin1和amelin2中最常见的氨基酸是脯氨酸，甘氨酸和亮氨酸；在任何一个序列中都没有半胱氨酸(参见下表1)。推定的amelin1蛋白质的氨基末端具有信号肽的特点残基14到21是疏水的并具有亮氨酸序列段(图2；Leader，1979)。在amelin2序列中没观察到可比较的基元。两个amelin都含有肽功能域DGEA(Asp-Gly-Glu-Ala)(amelin1中的氨基酸370-373和amelin2中的氨基酸287-290)(图2框起的部分)，它在早些时候已被鉴定为构成对细胞表面蛋白a2b1整联蛋白的I型胶原蛋白的识别部位(Staatz等，1991)。此外，包括了具有VTKG(Val-Thr-Lys-Gly)序列的trombospondin样细胞粘着功能域(在amelin1中的氨基酸277-280和amelin2中的氨基酸194-197)(Yamada&Kleinman等，1992)。这两个功能域的存在表明amelin是细胞外基质的成分。所预言的amelin在水溶液中的低溶解度与这个模型相一致。在amelin1中信号序列的存在证实其表现为一种分泌蛋白质。在amelin2中没有信号序列不意味着该蛋白质不被分泌。无信号序列的分泌蛋白的先例是鸡卵清蛋白，其中内在的未被切割的序列提供同样的功能(在Leader，1979中讨论)。预言在细胞表面相互作用中有意义的两个另外的功能域，EKGE(Glu-Lys-Gly-Glu)(amelin1中氨基酸282-285和amelin2中氨基酸199-202)和DKGE(Asp-Lys-Gly-Glu)(amelin1中氨基酸298-301和amelin氨基酸215-218)，簇集在同一区域。如在本段落中所描述的四个肽功能域的结合是任何釉质基质蛋白迄今尚未描述的一个特点。
由于所预言的低溶解度，amelin在E.coli细胞中作为一种与硫氧还蛋白在氨基末端的末端的融合蛋白被表达。6个组氨酸标记被加到羧基末端的末端并在Ni柱上纯化蛋白质。洗脱物含一种主要的融合蛋白还有几种在Western印迹分析中与抗amelin兔血清反应的肽。可通过抗硫氧还蛋白亲和层析进一步纯化该蛋白质。
已产生抗amelin蛋白的抗体。用amelin-硫氧还蛋白融合蛋白免疫兔并通过在偶联到CNBr-活化的Sepharose上的amelin融合蛋白亲和层析纯化免疫血清。在硫氧还蛋白偶联的Sepharose上可达到进一步的纯化。这些抗体已被用于例如在大鼠牙中amelin的免疫组化定位。
还确认了牙提取物中amelin的存在。大鼠磨牙在碳酸钠缓冲液pH10.8，1毫摩尔EDTA+蛋白酶抑制剂中被匀浆。用抗amelin-硫氧还蛋白免疫血清通过Western印迹分析了粗提物的上清液。检测出与两个amelin变异体相对应的带。在SephadexG100柱上进一步层析粗提物。浓缩对应于amelin分子量的组分并进行制备电泳。电泳之后，现在通过N-末端序列分析鉴定电泳带。如果电泳带之一是amelin，测定体内转化起始。
通过研究2，5，10，15，20和25天龄的Sprague-Darley大鼠的上颌检测了在牙齿不同发育阶段中amelin序列的表达。发现amelin伴随牙釉蛋白出现在原位杂交实验中，即在分泌阶段开始时成釉质细胞伸长期间。在较后的阶段，牙釉蛋白与amelin的mRNA呈现根本不同的杂交型。在成熟阶段牙釉蛋白mRNA大量消失仅在成熟了的成釉质细胞的后期有少量存留，这个发现与Wurtz等(1995)的发现是一致的。然而用amelin探针得到的信号在成釉质细胞的成熟阶段没有或只有很少程度的降低。
在功能上，两个阶段是不同的因为在成熟期没有额外的釉质基质被沉积。然而，似乎在两个时期都有矿物质沉积，因为新沉积的釉质已经含有矿物质。将这些事件与各自的mRNA的出现相关连，amelin有可能参与矿化过程。如上所述amelin mRNA编码一种含细胞结合功能域的蛋白质，说明它还或选择性地参与成釉质细胞结合到釉质表面。amelin蛋白可起蛋白水解酶的功能。这已通过从丙烯酰胺凝胶切下并电洗脱主要融合蛋白带进行了检测。在室温温孵过夜后，融合蛋白出现3条带。4℃温孵的对照只产生1条带。这说明在较高温度降解发生。要确定是否amelin事实上起蛋白水解酶的功能需要进一步实验。
本发明提供编码对细胞结合功能域有特异结合的蛋白质。该蛋白质是硬组织基质的成分并介导与细胞表面的接触。图2描述该蛋白质的编码序列并且该序列从核苷酸的95位延伸到1361位。细胞结合功能域的新组合占据969位到1259位核苷酸。各个结合功能域可以现有形式被组合或以不同氨基酸周围的前后关联部分展现或被结合进入非蛋白质性质的聚合物中。所述核苷酸序列和衍生的蛋白质序列均可首先用作按照标准技术的amelin蛋白质的人工表达工具(Ausubel等，1994)，其次作为肽化学合成的资料。所述序列可被用于建立硬组织形成中失调的鉴别之用的诊断标准，和作为在组织工程中生产生物材料的手段。此外，本发明提供含有位于转录启动子下游的所要求的序列的表达载体，以及生产和分离amelin的方法，这些方法基于所述表达载体的使用。
本发明涉及与含至少一个能介导多肽锚着于细胞粘着分子的序列元件的多肽相关的全部釉质基质。
如下面进一步详细描述的，根据术语“釉质基质相关多肽”，就其最广泛的意义来说，意味着一种是釉质基质蛋白质或具有类似性质即能介导釉质和细胞表面之间接触的合成产生的蛋白质的多肽。
在本说明书和权利要求中，术语“多肽”包括具有至少两个氨基酸残基和最多10个氨基酸残基的短肽和寡肽(11-100个氨基酸残基)以及蛋白质(包括可通过被糖基化，被脂质化，或通过包含辅基而被化学修饰的至少一个短肽，寡肽，或多肽的功能实体)。该多肽定义还包括动物包括人中的肽/蛋白质的天然形式以及以任何形式的表达载体转化任何种类的宿主而得的重组蛋白质或肽，并且包括化学合成的肽。
本发明的已被称做amelin蛋白质的多肽不同于已知的enamelin质牙釉蛋白和enamalin因为它们含有至少一个能介导该多肽锚着于细胞粘着分子的序列元件。特别是，它们含有一个选自包含四肽DGEA(Asp-Gly-Glu-Ala)，VTKG(Val-Thr-Lys-Gly)，EKGE(Glu-Lys-Gly-Glu)和DKGE(Asp-Lys-Gly-Glu)的序列元件。
本发明的优选实施方案是有氨基酸序列SEQ ID NO2或其类似物或其变异体的多肽以及有氨基酸序列SEQ ID NO4或其类似物或其变异体的多肽，和有氨基酸序列SEQ ID NO2或SEQ ID NO4的亚序列的多肽。
进一步说，本发明涉及编码能介导釉质和细胞表面之间的接触的多肽的核酸片段。通过术语“核酸”意指作为DNA或RNA存在的高分子量多核苷酸并且可是单链或双链。
虽然编码包含SEQ ID NO2的氨基酸残基1到407之多肽的核酸片段和编码包含SEQ ID NO4的氨基酸残基1到302之多肽的核酸片段是优选实施方案，本发明还涉及编码有SEQ ID NO2中所显示的氨基酸序列或其类似物或其变异体之多肽的核酸片段并涉及编码有SEQ ID NO4显示的氨基酸序列或其类似物或其变异体之多肽的核酸序列。
术语“有SEQ ID NO2(或SEQ ID NO4)显示的氨基酸序列或其类似物或其变异体之多肽”意指有氨基酸序列SEQ ID NO2(或SEQ ID NO4)之多肽以及有所述序列的类似物或变异体之多肽，它们当本发明的核酸片段在适合的表达系统中被表达时被产生并且能介导釉质和细胞表面之间的接触，例如通过包含在组织培养中的细胞外基质和基质形成细胞的测试系统所证实的。通过加入多肽片段测试该多肽的浓度依赖型生物活性。通过显微镜观察证实如果该片段能竞争过细胞外基质蛋白质和细胞之间的接触，则细胞就从基质脱离。已知培养的细胞粘着到纤连蛋白，骨桥蛋白，胶原，层粘连蛋白和玻连蛋白。通过蛋白质的RGD细胞附着功能域介导细胞结合活性。Amelin含有择一的细胞结合功能域DGEA和VTKG。例如通过用amelin，BSA或纤连蛋白包被细胞培养皿可检测细胞附着。通过检测内源性N-乙酰-β-D-氨基己糖苷酯酶可对结合UMR大鼠骨肉瘤细胞做定量测定。
因此类似物或变异体是并不精确地具有SEQ ID NO2或SEQ IDNO4中所显示的氨基酸序列，但仍能如上面定义的介导釉质和细胞表面的接触。例如，一般说，这样的多肽当与实施例中描述的amelin蛋白质相比较时将是在氨基酸组成或翻译后修饰例如糖基化或磷酸化方面有一定程度不同的多肽。
因此在本发明上下文中使用术语“类似物”或“变异体”指与从如实施例中描述的amelin蛋白质得到的特有氨基酸序列SEQ ID NO2和SEQ ID NO4相类似的氨基酸组成或序列的蛋白质或多肽，允许其有少数改变氨基酸序列的变异例如氨基酸的缺失，替换或插入或它们的组合而产生amelin蛋白质类似物。这些修饰可产生所述类似物的有趣和有用的新特性。可从动物或人得到类似物多肽或蛋白质或可它们可有部分或完全的合成来源。还可通过使用重组DNA技术得到该类似物。
因此本发明的一个重要的实施方案涉及其中至少一个氨基酸残基已被不同的氨基酸残基替换的多肽和/或其中至少一个氨基酸残基已被缺失或被加入以至引起一个含不同于SEQ ID NO2或SEQ ID NO4中显示的氨基酸序列或如下面定义的氨基酸序列的亚序列但必须有如上面定义的amelin活性的多肽。
本发明的一个有趣的实施方案涉及一种多肽，它是本发明的含6到300氨基酸的多肽的亚序列，例如至少10个氨基酸，至少30个氨基酸，如至少60，90或120个氨基酸，至少150个氨基酸或至少200个氨基酸。
本发明的特别重要的实施方案是含SEQ ID NO2(amelin1)中氨基酸1-407的多肽和含SEQ ID NO4(amelin2)中氨基酸残基1-324的多肽。
已将氨基酸序列SEQ ID NO2和SEQ ID NO4与已知氨基酸序列做了比较。与细胞外基质蛋白质(与其同源性最高)，即牙釉蛋白和胶原IV的同源(同一性)程度是非常的低，分别是23％和26％。同一性散布于整个蛋白质中并且不限于特殊区域。在这方面应该注意amelin不含重复的三连基元，相反胶原总被重复的三连基元，G-X-Y所编码。对胶原IV和牙釉蛋白的同源性可能由于在两个蛋白质中的高含量的脯氨酸。因此看来amelin蛋白质与先前已知细胞外蛋白质，特别是釉质基质蛋白质仅有微弱的类似性。
本发明的一个重要实施方案涉及有一种氨基酸序列的多肽，其中的连续的一串20个氨基酸与选自SEQ ID NO2或SEQ ID NO4所显示的氨基酸序列的同样长度的一串氨基酸有至少80％程度的同源性。
与SEQ ID NO2或SEQ ID NO4中显示的多肽有至少80％如至少85％(例如至少90％)同源性或同一性的本发明多肽序列构成重要的实施方案。由于SEQ ID NO2和SEQ ID NO4显示的序列看上去相当独特，本发明范围还包括对选自SEQ ID NO2或SEQ IDNO4中显示的氨基酸序列的类似连续一串20个氨基酸的同源程度至少是25％，如至少50％或至少75％的多肽。可从其他物种，例如哺乳动物如小鼠，兔，豚鼠，猪，牛或人的类似蛋白质得到这类序列。
通过使用本申请中公开的序列，本领域技术人员将能检测，克隆，测序，生产，和研究amelin的人译本。由于最方便的可用牙齿材料是被拔掉或切下的牙齿，主要是第三磨牙或赘生牙，一个实际问题是缺少原初材料。这些牙齿的发育通常相当晚并因此参与基质形成的细胞远在第二期之后或不再出现。
另一种选择是，可从合用的组织培养得到原初材料，检测其中提取的RNA以测定amelin信使的存在。在人骨肉瘤细胞(Sao2细胞)的情况得到Northern印迹阳性，尽管阳性RNA长度与大鼠amelinmRNA相比要小得多。
因此，建立人骨肉瘤细胞(Saos2细胞)cDNA文库以便发现代表一个或多个人类amelin或amelin样结构的cDNA。以类似方式，从最未发育的牙齿建立cDNA库并用amelin探针或用从Saos2库得到的探针进行筛选。
术语“序列同源性”意指在多肽氨基酸的同一性和位置方面，相匹配的两个或两个以上氨基酸区段中氨基酸序列的同一性。
因此本文使用术语“同源性”以解释一个给定的多肽的氨基酸序列和在SEQ ID NO2或SEQ ID NO4中显示的氨基酸序列间同一性的程度。可从一个核苷酸序列如一个DNA或RNA序列，例如通过如下面定义的杂交得到的或可通过常规氨基酸测序方法得到的这样的序列推断与SEQ ID NO2或SEQ ID NO4中显示的氨基酸序列比较的氨基酸序列。优选以成熟多肽的氨基酸序列(即不考虑任何先导序列)确定同源程度。一般说，当比较核苷酸序列时为确定它们的内部同源性只使用编码区。
其中的一个方面是，本发明涉及编码如上定义的本发明多肽的核酸片段。特别是，本发明涉及基本上包含SEQ ID NO1中显示的序列或基本上包含SEQ ID NO3中显示的序列的核酸片段。
本发明还涉及与含SEQ ID NO1中显示的核酸序列或SEQ IDNO3中显示的核酸序列的核酸片段或所述序列的部分核酸片段杂交的核酸片段，而它们在严谨条件例如5毫摩尔单价离子(0.1×SSC)，中性pH和65℃下是稳定的。
在另一方面，本发明涉及至少18个核苷酸的SEQ ID NO1中显示的核苷酸序列或SEQ ID NO3中显示的核苷酸序列的类似物或亚序列，它们1.与SEQ ID NO1或SEQ ID NO3中显示的序列有至少90％同源性，和/或2.编码一种多肽，其氨基酸序列与SEQ ID NO2或SEQ IDNO4中显示的氨基酸序列至少有80％同源性。
本发明还涉及编码含氨基酸序列SEQ ID NO2或SEQ ID NO4的亚序列之多肽的核酸序列。在本说明书和权利要求中，术语“亚序列”指优选有至少15个核苷酸，更优选至少有18个核苷酸，并最优选有至少21个核苷酸的序列。在本发明的一些实施方案中，本发明核酸片段的亚序列或类似物将包括至少48个核苷酸，如至少75个核苷酸或至少99个核苷酸。“亚序列”应符合至少上述标准1)和2)中之一或应与含SEQ ID NO1中显示的核苷酸序列或SEQ ID NO3显示的核苷酸序列的核酸片段杂交。
众所周知在PCR技术中如本文描述的小片段是有用的。这类片段和亚序列可在其他应用中作为鉴别如实施例4中描述的本发明核苷酸序列的mRNA片段的探针。
关于本发明的核酸片段的术语“类似物”意指编码功能上类似于由SEQ ID NO2和SEQ ID NO4所编码的多肽的一种多肽的核酸片段，因为如上述测试所证实的该类似物能介导多肽锚着于细胞粘着分子。
众所周知同一氨基酸可被不同密码子编码，密码子的利用特别涉及所论及的生物表达核苷酸序列时的偏爱。因此，本发明核酸片段的一个或一个以上的核苷酸或密码子可被其他当表达时则产生相同于或基本上相同于所谈到的核酸片段编码的多肽的核苷酸或密码子改变。
考虑到少数核苷酸变异对介导上述测试证明的釉质与细胞表面之间的接触没有明显的相反作用，在本上下文中还使用术语“类似物”以指明编码构成amelin样多肽的氨基酸序列的核酸片段。
术语“明显的相反作用”意指类似物的活性(当按上面描述的而确定时)应至少10％，更优选至少20％，甚至更优选至少25％如至少50％的天然amelin附着或脱离活性。可从一个生物体如一个动物或一个人得到同源核酸片段或核苷酸序列，或它们可以是部分或完全合成来源的。还可通过使用重组DNA技术得到该类似物。
而且，术语“类似物”和“亚序列”是要考虑到序列中的变异如一个或一个以上核苷酸替换，插入(包括内含子)，添加和重排，这些变异对由核酸片段或其序列编码的多肽没有任何基本上的相反作用。
术语“替换”意指用一个或一个以上不同的核苷酸替换全长核苷酸序列中的一个或一个以上的核苷酸，“添加”被理解为意指在全长核苷酸序列任何一端加入一个或一个以上的核苷酸，“插入”意指在全长核苷酸序列内部引入一个或一个以上的核苷酸序列，“缺失”意指无论在该序列的任何一端或在序列内的任何适当位点从全长核苷酸序列删除一个或一个以上的核苷酸，和“重排”意指在该核酸内或多肽序列内分别互换两个或两个以上的核苷酸残基。然而，该核酸片段还可通过在将其插入到生物体之前或之后的诱变而被修饰。
根据本发明在本说明书和权利要求中就片段，序列，亚序列和类似物所使用的术语“片段”，“序列”，“亚序列”和“类似物”当然应被理解为不包含在其天然环境中的现象，而包含例如被分离的，被纯化的，体外或重组形式中的现象。
在本发明的一个实施方案中，可通过从细胞或组织提取RNA并将其转变成cDNA供随后的聚合酶链反应(PCR)中使用来实现对基因突变的检测和对amelinRNA的定量。可基于本发明的核酸片段如SEQID NO1或SEQ ID NO3中显示的核酸片段合成PCR引物。用于检测和/或定量的这种方法可被用做诊断以高于或低于正常的量表达mRNA之疾病状况的诊断方法。
属于本发明范围内的还有包含能检测本发明核酸片段核苷酸探针的诊断试剂以及诊断amelin表达失调(deregulated)的疾病和/或amelin基因被突变的疾病的方法，包括从被怀疑患有存在高于正常量的amelin蛋白质或amelin突变形式的疾病的病人取样进行PCR分析，其中样品与按照上面的描述诊断试剂进行接触，使任何核酸片段得到扩增并确定样品中的任何一致的或同源的核酸片段的存在。另一方面，本发明还涉及含根据本发明amelin多肽的诊断试剂。
用重组DNA技术可生产本发明的多肽。本发明的一个重要的实施方案涉及包含本发明的核酸片段的表达系统。特别是，本发明涉及可复制表达载体，它载有根据本发明的核酸片段并能调节该核酸片段的表达。
在本发明范围内有一种携带根据本发明表达载体的生物。本发明这方面可使用的生物包括微生物如芽孢杆菌属，埃希氏杆菌属或沙门氏菌属细菌，酵母如酵母属，毕赤氏酵母属，原生动物或从多细胞生物得到的细胞如真菌，昆虫细胞，植物细胞，哺乳动物细胞或细胞系。若生物体是细菌，该细菌最好是埃希氏菌属，例如E.coli。无论使用何种类型的生物，本发明的核酸片段或直接或用适当的载体被引入到该生物中。另外选择是，通过直接或用一个表达载体引入本发明的核酸片段或类似物或其亚序列可在哺乳动物细胞系中生产多肽。
核酸片段或其类似物或其亚序列还可被克隆到适当的稳定表达载体中，然后被放入适当的细胞系。然后根据在适合于所使用的载体和细胞系的条件下产量的水平来选择产生需要多肽的细胞。选出的细胞被进一步培养并形成所需要多肽的十分重要和连续不断的来源。被用于生产本发明多肽的生物也可以是高等生物例如动物。
本发明核酸序列的一个特殊类似物的实例是含SEQ ID NO1或SEQ ID NO3中显示的DNA序列或其部分的DNA序列并且该序特别适合在E.coli中表达。当与适当的调节序列一起被插入到E.coli中时，该DNA序列导致基本上具有SEQ ID NO2或SEQ ID NO4或其一部分的多肽的表达。因此，该DNA序列包含被E.coli所识别的特异密码子。
在本上下文中，术语“基因”被用于指明参与产生多肽链的核酸序列并且它包括编码区前后的区域(5’上游和3’下游序列)以及间隔序列，位于各编码区段，外显子之间或在5’上游或3’下游区域内的内含子。5’上游区域包括控制基因表达的调节序列，典型的是启动子。3’下游区包括参与基因转录终止的序列和非强制性地包括负责转录物的聚腺苷酸化的序列和3’非翻译区。本发明还涉及含如上述编码本发明多肽核酸片段的表达系统，该系统包含能介导所述核酸片段表达的5’侧翼序列。
本发明进一步涉及含编码本发明多肽或如本文定义的融合多肽的核酸序列。在一个特别重要的实施方案中，本发明的核酸片段或类似物或其亚序列或如本文定义的本发明融合核酸片段可被可复制表达载体携带，后者能在宿主生物体或细胞系中复制。
该载体可特别是质粒，噬菌体，粘粒，微型染色体或病毒。在本发明的一个有趣的实施方案中载体在被引入进宿主细胞时，被整合到该宿主细胞的基因组中。
在本发明的一个特别方面，以产生融合多肽为目的，本发明的核酸可包括编码不同于或相同于本发明多肽的另一核苷酸片段，它在阅读框内被融合于编码amelin多肽的SEQ ID NO1或SEQ ID NO3或其类似物所显示之序列的核酸片段。在使用DNA技术时，融合的核酸序列可被插入到适当的载体或基因组中。另外的选择是，核酸片段之一被插入到已经含有其他核酸片段的载体或基因组中。通过分别插入两个核酸片段并允许表达发生也可产生融合多肽。宿主生物(可属于原核生物来源或真核生物来源)在保证融合序列表达的条件下生长。然后用适当方法纯化融合蛋白并从其融合配偶体分离本发明的多肽。因此，本发明的一个方面涉及产生本发明多肽的方法，包括如下步骤
(a)将本发明的一个核酸片段插入到一个表达载体中，(b)用步骤(a)中产生的载体转化适当的宿主生物，(c)在适当条件下培养步骤(b)中产生的宿主生物以表达多肽，(d)收获多肽，和(e)非强制性地进行多肽的转录后修饰。
如上描述的一种方法也属于本发明范围内，其中通过包含一个或一个以上的步骤的方法如用固定化的amelin多肽或与所述多肽起反应的抗体进行亲和层析和/或其他层析以及电泳方法分离所产生的多肽。
作为热处理，化学处理(甲醛，戊二醛等)或酶处理(肽酶，蛋白水解酶和蛋白修饰的酶)的结果，如上述产生的多肽可受到翻译后修饰。与其天然产生环境相比，在生物体中产生时，该多肽可以一种不同的方式被加工。例如，糖基化通常在高等生物如酵母或最好是哺乳动物细胞表达多肽时完成。正常情况下发现糖基化与氨基酸残基天冬酰胺，丝氨酸，苏氨酸或羟脯氨酸有关。这对去除或改变由所谈及的宿主生物引起的加工特点可能是或不是有利的。
按照本发明，继多肽在一个生物体或一个细胞系中表达之后，该多肽可被如此使用或可先从生物体或细胞系被纯化。如果多肽被表达成一种被分泌的产物，它可被直接纯化。如果多肽被表达成一种结合物，在纯化前它可能需要宿主的部分或完全破碎。用于多肽纯化的方法的实例是(i)用抗体进行免疫沉淀或亲和层析，(ii)用适当的配基进行亲和层析，(iii)其他层析方法如凝胶过滤，离子交换或高效液相层析或上述之中的任何衍生方法，(iv)电泳方法如聚丙烯酰胺凝胶电泳，变性聚丙烯酰胺凝胶电泳，琼脂糖凝胶电泳和等电聚焦，(v)任何其他专门增溶溶解和/或纯化方法。
本发明还涉及基本纯的amelin多肽。在本上下文中，术语“基本纯”被理解为意指所谈及的多肽基本上没有其他成分，例如其他多肽或碳水化合物，它们可形成于多肽生产和/或回收过程中或另外被发现与多肽在一起。蛋白质纯度可以例如通过SDS凝胶电泳来评估。
本发明的高纯度多肽在该多肽被用于组合物时可能是有利的。还由于其高纯度，可以比常规低纯度多肽低的数量将基本纯的多肽用于大多数目的。
在本发明的一个方面，可从表达本发明多肽的适当细胞系获得纯的多肽。还可通过熟知的液相或固相肽合成方法利用多肽序列的各个氨基酸的连续偶联制备本发明多肽。另外的选择是，可通过各个氨基酸的偶联形成多肽序列的片段然后再连接这些片段以至形成需要的多肽来合成多肽。因此这些方法构成本发明的另一有趣方面。
另一方面，本发明涉及治疗和/或预防牙周疾病的方法，该方法包括根据本发明对需要它的病人施用治疗或预防有效量的多肽。期望本发明多肽将参与牙骨质形成并因此促进牙周韧带的固定。
通过amelinRNA序列在骨形成细胞中的存在表明amelin蛋白在人工局部骨形成的过程(context)的用途通过Northern杂交在大鼠股骨以及颅盖的骨组织中发现了满足17页1-5行给出的标准的amelinRNA的一个大小变异体。用amelin探针的原位杂交将该RNA定位于与生长的骨相关连的成骨细胞。在细胞培养中形成骨的大鼠颅盖细胞在整个骨形成期间也一直表达amelinRNA的骨-变异体(C.Brandsten，C.Christersson和T.Wurtz，未发表)在天然和实验骨形成系统中amelinRNA的存在表明amelin蛋白在骨形成中的作用。可以想象外部加入的amelin肽在试管内和医疗应用中都加速或介导骨形成。
而且，本发明涉及修复牙齿中损伤的方法，该方法包括向需要此种治疗的病人施用与充填材料相结合的根据本发明的有效量的多肽。
本发明还涉及接合两个骨单体的方法和涉及将植入体有效结合到骨中的方法。与此关联的内容中，如下面详细描述的可将多肽与载体联系起来施用。而且，本发明多肽可被用于促进或引起选自骨，釉质，牙质或牙骨质的硬组织的矿化。
另外，本发明还涉及促进植入器件或经皮器件从例如与在US4,578,079中描述的方式的生物相容性的方法，该方法包括根据本发明用有效量的多肽覆盖该植入器件，由此例如允许肌肉或韧带与植入物接触。
本发明还涉及通过施用本发明的多肽将上皮锚着于硬组织表面的方法，该硬组织表面选自与牙植入物相关连的釉质，牙质或牙骨质。而且，本发明涉及防止与牙的植入关联之上皮的生长，该方法包括给需要此种治疗的病人施用预防有效量的根据本发明的多肽，例如由此防止上皮生长进入牙周韧带。
本发明的一个非常重要的方面涉及含amelin多肽和生理可接受赋形剂的一种组合物。该组合物可包含本发明的一种纯化了的重组多肽。特别的但非绝对的是，本发明涉及适合于局部施用，例如用于口腔黏膜表面，的组合物。
适合于局部施用的本发明组合物可以是擦剂，凝胶，溶液，悬浮液，糊剂，喷雾剂，粉剂，牙膏，和漱口液。
本发明包括通过用牙膏制剂，例如常用类型的市售牙膏，与本发明多肽混合配制的牙膏，它可在常规的基础上被使用以预防例如牙周炎。
药膏将常含有磨光剂，表面活性剂，胶凝剂和其他赋形剂如调味剂和着色剂。磨光剂可被选自那些在牙制剂中正在被用于此目的的材料。适合的实例是水不溶性偏磷酸钠或钾，水合或无水磷酸二钙，焦磷酸钙，硅酸锆或其混合物。特别有用的磨光剂是各种形式的硅石。磨光剂通常被细分，具有小于10微米的颗粒，例如2-6微米。磨光剂可以10-99％牙膏重量被使用。一般牙膏制剂将含20-75％的磨光剂。
适当的表面活性剂通常被包含在牙膏制剂中。表面活性剂一般是水溶性的非皂合成有机去污剂。适合的去污剂是下述构层的水溶性盐高级脂肪酸单酸甘油酯单硫酸盐(例如氢化椰子脂肪酸单酸甘油酯单硫酸钠)；高级烷基硫酸盐(例如月桂硫酸纳)烷芳香基磺酸盐(例如十二烷基苯磺酸钠)；和高级烷基磺酰乙酸(例如月桂基磺乙酸钠)。此外，在酰基中可使用含12-16碳原子的低级酯族氨基羧酸的饱和高级酯族酰胺并且其中的氨基酸部分得自有2-6碳原子低级酯族饱和单氨基羧酸，如甘氨酸，肌氨酸，丙氨酸，3-氨基丙酸和缬氨酸的脂肪酸胺，特别是N-月桂基，肉豆蔻基和棕榈酰肌氨酸盐化合物。若需要的话也可包括常规的非离子表面活性剂。
表面活性物质一般以牙膏制剂重量的约0.05-10％的量存在，典型的约0.5-5％。
典型牙膏流体将主要包括水，甘油，山梨糖醇，丙二醇或其混合物。一个有利的混合物是水和甘油，最好伴有山梨糖醇。可使用胶凝剂如天然或合成树胶或树胶样物质，例如爱尔兰藓或羧甲基纤维素钠。其他可用树胶如西黄蓍胶，聚乙烯吡咯烷酮和淀粉。它们通常以牙膏重量的约10％，典型的约为牙膏重量的0.5-5％被使用。
药膏的pH基本上是中性的，如约6-8的pH。若需要的话，可加入少量调pH试剂例如少量酸如柠檬酸或碱性物质。
该牙膏还可含有其他物质如可溶性糖精，调味油(例如绿薄荷油，胡椒薄荷油，冬青油)，着色剂或增白剂(例如二氧化钛)，防腐剂(例如苯甲酸钠)，乳化剂，硅氧烷类，乙醇，薄荷醇和叶绿素化合物(例如叶绿酸钠铜)。
本发明多肽在上述类型或下面讨论的类型的牙膏中的含量通常在以总牙膏组成重量所计算的重量的1-20％范围内，如在重量的5-20％的范围内，特别是约为重量的10-20％如重量的12-18％。特别指出较后面的范围用于治疗龈炎和牙周炎的牙膏。然而，有兴趣提供有低含量的本发明多肽的牙膏，这类牙膏将适合于防止或预防性目的。对于这类目的，感兴趣的多肽含量范围可以是从约为重量的0.1到约5％。
一种特别类型的牙膏是基本上透明的凝胶。这类牙膏可完全不含磨光剂或可含如此细分的磨光剂形式以至凝胶看起来仍基本上清澈。此凝胶牙膏类型可独自被使用也可与含上面讨论的磨光剂的牙膏结合使用。
可以许多不同方式将本发明的一种牙膏制剂的多肽与其他牙齿或口腔制剂混合。通常，将优选形成本发明多肽的悬浮液并将该amelin悬浮液与其他制剂结合成膏的形式。另外的选择是，可将amelin粉与其他制剂成分混合(先与干制剂成分混合然后与液体制剂成分或半液体制剂成分混合)或将amelin本身混合进另外完成的制剂中。一般说，最好将amelin粉与磨光剂物质或牙粉一起加入。
在进行amelin或其他水不溶性或水微溶性多肽类似物的混合时，最好考虑多肽的物理和化学性质，在牙膏或牙粉或本文讨论的其他制剂方面的考虑将通常是十分简单并将通常在于加入amelin多肽到干燥的，溶解的或悬浮形式的制剂或其成分中。
局部施用可以是在或贴近于所谈及的呈现病变的身体局部的一种施用，例如在身体外部如口腔黏膜表面。此应用可以是简单涂抹该组合物，或可借助任何适于促进实现组合物与病理损害之间接触的器具。该组合物可被渗渍或散布于衬垫，膏药，纸片，纱布，海绵材料，cottonwool piece等。可任意使用一种该组合物注入形式注入进或接近损害处。
根据本发明，局部用组合物可包含1-80％重量的活性化合物(基于该制剂总重量)，如0.001-25％w/w的活性化合物，例如0.1-10％，0.50-5％，或2-5％。多于一种的活性成分化合物可被参合到该组合物中；即含与其他药物化合物合在一起的amelin蛋白的组合物也在本发明范围内。按常规该组合物一天使用1-10次，取决于损害的类型，严重性和部位。
为局部应用，可根据常规用药实践配制该组合物，如在口腔局部用药通常使用药物可接受性赋形剂。任何具体组合物制剂中使用的载体性质将取决于想要施用该组合物的方法。可用于组合物的非水载体可包括固体或液体如润滑剂，溶剂，湿润剂，增稠剂和粉剂。预期根据本发明的组合物可仅含有多肽，非强制性地与水混合，但该组合物也可含与载体，稀释剂或黏合剂如纤维素聚合物，琼脂，藻酸盐或明胶混合的多肽，它们对所谈及的目的是可接受的。就牙科应用而言，载体或稀释剂为牙科学可接受的是便利的。目前优选使用含水溶性聚合物的载体。这类聚合物的非限制性实例是羧基纤维素钠，微晶纤维素，羟乙基纤维素，羟基丙基纤维素，甲基纤维素，高分子聚丙烯酸，藻酸钠，丙二醇藻酸酯，山吨树胶，瓜耳树胶，洋槐豆树胶，改性淀粉，明胶，果胶或它们的结合物。与活性蛋白质组分混合后，这些水溶性聚合物可任意被转变成凝胶或膜，产生由于其便利的物理性质而易于应用的组合物。该组合物可非强制性地含为促进储存稳定性目的的稳定剂或防腐剂。
一种适当的赋形剂是藻酸盐，例如在EP336967中描述的。
为局部应用，该组合物的pH可主要在十分宽的范围内如3-9。在本发明的优选实施方案中，约4到8的pH是优选的。如上述的常规缓冲试剂可被用于获得需要的pH。
本发明制剂还含有其他添加剂如稳定剂，防腐剂，增溶剂，螯合剂，凝胶形成剂，pH调节剂，抗氧化剂等。而且，可便利的提供改性缓释制剂，其中活性成分被混合进入聚合物基质，或毫微颗粒，或脂质体或微胞，或吸附在离子交换树脂上，或由聚合物所携带。
组合物可根据常规用药实践被设计并可以是半固体组合物凝胶，膏，混合物。
液体组合物溶液，悬浮液，渗麸液(drench)，乳液。
如所指出的，本发明药物组合物可包含本发明多肽本身或其功能衍生物，或此类化合物的结合物。适当的功能衍生物实施例包括药用盐，特别是那些适合于在口腔环境中使用的药用盐。实施例包括氨基功能的药用盐，例如产生阴离子的酸式盐，它们是药用可接受性的，特别是在口腔环境中。实施例包括磷酸盐，硫酸盐，硝酸盐，碘化物，溴化物，氯化物，硼酸盐以及从羧酸衍生的阴离子包括醋酸盐，苯甲酸盐，硬脂酸盐等。氨基功能的其他衍生物包括酰胺，酰亚胺，脲，氨基甲酸酯等。
其他适当的衍生物包括本发明多肽的羧基基团衍生物，包括盐，酯和酰胺。实施例包括带有药物可接受性阳离子的盐，例如锂，钠，钾，镁，钙，锌，铝，正铁，亚铁，铵和低级(C1-6)-烷基铵盐。酯包括低级烷基酯。
将用数个工作实施例进一步描述本发明，它们不应被认为是对本应用范围的限制。
除非另有说明，使用常规方法和试剂盒。按照各个提供者所给的说明书使用试剂盒。本文未描述或提及的方法中的步骤和试剂被解释在分子生物学现代方法，作者F.M.Ausubel，R.Brent，R.E.Kingston，D.D.Moore，J.G.Seidman，J.A.Smith andK.Struhl；John Wiley，NewYork(1994)。所有文字引用在此明确引入作为参考。
图解图1在生长中的第一磨牙中RNA序列的定位。切下四天龄大鼠上颌，将其固定并包埋在石蜡中。用通过Bluescript质粒体外转录制备的与mRNA互补的DIG标记RNA序列对整个磨牙远中(distal-mesial)的切片做原位杂交。图1aamelin，图1b牙釉蛋白，图1cI型胶原。
图2amelin1和2序列。数个来自两个变异体的重叠序列被确定并排队。同一序列被相互对应印出，逗点表示缺少各变异体相对应的序列。最长的开放阅读框用单字符密码氨基酸名称简示。具有两个编码框的部分被划阴影(核苷酸390-403)。下划线是被用于筛选含两个变异体克降的寡聚物的互补序列(核苷酸248-272和414-430)。方框表示与细胞表面蛋白相互作用的功能域之共有序列。推测的多腺苷酸化信号被双下划线(核苷酸1892-1897)。
图3来自大鼠磨牙的RNA Northern印迹分析。从四天龄大鼠切下第一磨牙。分离RNA，在琼脂糖凝胶中每泳道4毫克电泳该RNA并将其转移到尼龙膜。将各泳道与amelin(a)和牙釉蛋白(b)DIG标记的RNA探针杂交。kb长度为已知的RNA(Gibco BRL)的位置被示明于左边际。
实施例实施例1RNA的分离用一个市售试剂盒(Promega Biotech，RNAgents总RNA分离系统)在500升4摩尔的异硫氰酸胍盐，80毫摩尔EDTA(Chomczynski&Sacchi，1987)中将从4天龄或7天龄Aprague-Dawley大鼠切下的三只生长中磨牙(B&K Universal，Sollentuna，Sweden)在玻璃-玻璃匀浆器中匀浆。然后用酚-氯仿提取并两次异丙醇沉淀。溶解RNA于0.2×SET缓冲液(0.2％十二烷基硫酸钠，4毫摩尔Tris-CIpH7.5，2毫摩尔EDTA)中并通过光密度测量确定其浓度。
实施例2cDNA文库的制备借助于结合在硅酸盐树脂的寡-dT筛选含聚腺苷酸的RNA(mRNA)(Quiagen Oligotex mRNA Midi试剂盒)。从聚腺苷酸末端引发反转录，并将双链的甲基化的cDNA连接到λZAP载体臂上并包装进入噬菌体颗粒中(Stratagen ZAP cDNA克隆试剂盒)。扩增并铺平板后，通过与总DIG标记的cDNA(见下)选出含常见表达序列的噬菌体株。从阳性噬菌斑分离噬菌体并借助于ExAssist助噬菌体超感染λZAP感染的Escherichia coli SOLR细胞将分离的噬菌体转变成质粒。为获得5’端较好的再现，还建立了cDNA文库并在随机位点引发(Stratagen Random Unidirectional Linker-Primer)。用Taq聚合酶，荧光终止子和半自动序列测试系统(Applied Biosystems，TaqDyeDeoxy Terminator Cycle Sequencing Kit)的循环测序对在基质形成细胞上产生阳性原位杂交信号的插入片段测序。用Wisconsin程序组(Genetics Computer Group，Inc.)和DNAid(Fredeic Dardel，fred@botrytis.polytechnique.fr)分析了序列。
实施例3筛选文库七天龄大鼠的第一和第二磨牙的cDNA文库(2×106克隆)噬菌体被铺平板，并将噬菌体吸附到硝酸纤维素膜(Schleicher andSchull)。影印滤膜与10毫微克/毫升cDNA或胶原-和牙釉蛋白寡核苷酸杂交。杂交在54℃进行15小时，并洗滤膜和显影(BoehringerMannheim，The DIG System)。含牙釉蛋白，胶原或其余常见表达序列的噬菌体被再克隆两次并通过用ExAssist助噬菌体(Stratagen)的重复感染实现由体内剪切使其转变成Bluescript质粒。
实施例4杂交实验用探针的制备用0.25 mM核苷酸浓度伴以补充到0.1mM的毛地黄毒苷(DIG)-dUTP(Boehringer Mannheim)从有逆转录酶的富含聚腺苷酸的RNA(Promega Biotech，逆转录系统)产生供筛选文库用的cDNA探针。
在DIG修饰的UTP(Boehringer Mannheim)存在下，通过噬菌体T7或T3RNA聚合酶(Promega RNA探针Gemini II核心系统，Melton等，1994)的体外转录合成与mRNA互补的RNA探针。含amelin(1700bp)的DNA模板是Bluescript质粒，它是通过体内剪切从λ噬菌体得到的。而且，通过限制酶切Bluescript SK质粒得到牙釉蛋白(700bp)和I型胶原(850bp)序列。用[35S]代替DIG标记定量RNA测定用的探针。
胶原特异性寡核苷酸有5’-CATGTAGGCAATGCTGTTCTTGCAGTGGTAGGTGATGTTCTGGGAGGC-3’序列(Yamada等，1983)，而牙釉蛋白特异性寡核苷酸是5’-ATCCACTTCTTCCCGCTTGGTCTTGTCTGTCGCTGGCCAAGCTTC-3’(Lau等，1992)。通过Boehringer方法中的末端转移酶反应用DIG修饰的ddUTP进行3’标记制备探针。
实施例5Northern印迹为Northern印迹分析，在50％甲酰氨存在下在使2厘米宽度的每孔中的15毫克总RNA热变性并在有2.2摩尔甲醛，0.02摩尔N-吗啉代丙烷磺酸，0.05摩尔醋酸钠，1摩尔EDTA的琼脂糖凝胶中电泳(Lehrach等1977)。在20×SSC(3摩尔氯化钠，0.3摩尔柠檬酸钠)中RNA被过夜转移到尼龙膜中(Pall Biodyne B TransferMembrane)。用紫外光使该膜交联并将其切割成条。加入100毫微克/毫升DIG标记的cRNA探针后，各条在50％甲酰氨，5×SSC，2％封闭试剂(Boehringer Mannheim)，0.1％N-月桂酰肌氨酸，0.02％十二烷基硫酸钠(SDS)中68℃预杂交1小时并随后在同样条件下杂交过夜。然后用2×SSC，0.1％SDS在室温洗膜5分钟两次并用0.1×SSC，0.1％SDS在68℃洗15分钟两次。通过磷酸酶偶联的抗DIG抗体片段显现DIG标记的RNA的存在(Boehringer Mannheim，The DIGSystem)。
实施例6溶液杂交来自切下的磨牙的RNA与过量的35S-UTP标记互补RNA探针杂交(Mathews等，1989)。40升0.6摩尔氯化钠，4摩尔EDTA，10毫摩尔二硫苏糖醇(DTT)，0.1％SDS，30毫摩尔Tris-HCI，pH7.5和25％(v/v)甲酰氨的反应物含20,000cpm探针和不同量的总RNA。用石蜡油覆盖该混合物，在70℃温孵过夜，用1毫升RNA酶溶液(40克RNA酶A，2克RNA酶T1，Boehringer-Mannheim，100克鲑鱼色测试(salmon tests)DNA，Sigma Chemical Co.)稀释并在37℃酶解1小时。用100升三氯醋酸(6摩尔)沉淀RNA酶抗性双链RNA，并在玻璃纤维滤器上收集(Whatman GF/C)和在Wallac1409流体闪烁计数器中分析之。杂该探针与已知浓度的体外合成mRNA序列杂交的标准曲线被用于将放射性与测试-RNA中杂交序列的量联系起米。
实施例7原位杂交4℃下用PBS(137毫摩尔氯化钠，2.7毫摩尔氯化钾，4.3毫摩尔磷酸氢二钠，1.4毫摩尔磷酸二氢钾)中的多聚甲醛固定四天龄Sprague Dawley大鼠的上颌24小时，使其脱水并被包埋在石蜡中。7微米厚的切片被固定在vectabond-coated(Vector)载玻片上。用二甲苯除去石蜡后，在37℃用蛋白水解酶K(20微克/毫升)处理样品30分钟，用4％甲酰氨后固定5分钟，用三乙醇胺和醋酸酐(2.66毫升三乙醇胺在200毫升水中；0.5毫升醋酸酐与该载玻片一起被加入其中)处理并渗没于2×SSC中，42℃50％甲酰氨处理60分钟。用含0.5毫微克/微升RNA探针的20微升0.3摩尔氯化钠，10毫摩尔Tris-HCIpH8.0，1毫摩尔EDTA，Danhardt试剂(Watkins，1994)，0.1克/升硫酸葡聚糖，50％甲酰氨覆盖该样品。样品被盖上盖玻片，将载玻片保持在湿室中42℃过夜，室温下用4×SSC洗一次，用2×SSC洗10分钟三次并用0.1×SSC洗10分钟三次。通过磷酸酶偶联的抗DIG抗体片段(Boehringer Mannheim方法)显示DIG标记的RNA探针的存在。由于内源磷酸酶没观察到该样品的染色。
实施例8amelin基因的依次表达使用如实施例7中描述的杂交方法检测20或25天龄大鼠中amelin基因的细胞表达。制备上颌切片并与amelinRNA探针杂交。在两个发育阶段，发现amelin基因在与根牙骨质中新沉积的牙质周边表面邻近的上皮细胞中以及在包埋于磨牙中细胞牙骨质中的细胞中都有表达。amelin基因表达进一步被定位于分泌着的成釉质细胞以及定位于上皮牙根鞘。此外，从20天龄大鼠的剪切物显示了在amelin基因表达被转向分化成釉质细胞前在外围分泌牙质的成牙质细胞中amelin表达的证据。综合起来，这些结果表明在成牙质细胞和成釉质细胞的分化期间amelin在上皮间充质中的相互作用以及amelin可能是与牙骨质生成偶联的关键蛋白质之一。
参考资料-Ausubel，F.M.，Brent，R.，Kingston，R.E.，Moore，D.D.，Seidman，J.G.，Smith，J.A.&Struhl，K.(1994).分子生物学现代方法.John Wiley，New York.
-Chomczynski，P.&Sacchi，N.(1987).硫氰酸胍-苯酚-氯仿抽提RNA分离一步法。Anal.Biolchem.162，385-293.
-Deutsch，D.，Palmon，A.，Fisher，L.W.Kolodny，N.，Termine，J.D.&Young，M.F.(1991).牛enamelin(″Tuftelin″)一种酸性enamelin质测序J.Biol.Chem.266，160221-16028.
-Hopp，T.P.&Woods，K.R.(1981).氨基酸序列的抗原决定簇之预报。Proc.Natl.Acad.Sci.U.S.A.78，3824-3838.
-Lau，E.C.，Simmer，J.P.，BringasJr，P，，Hsu，D.D.-J.，Hu，C.-C.，Zeichner-David，M.，Thiemann，F.，Scead，M.L.，Slavkin，H.C.&Fincham，A.G.(1992).小鼠牙釉蛋白初级RNA转录物的交替剪接对牙釉蛋白异质性的影响。Biochem.Biophys.Res.Commun.188，1253-1260.
-Leader，D.P.(1979).信号肽氨基酸序列。Trends Biochem.Sci.4，205-208.
-Leharach，H.，Diamond，D.，Wozney，J.M.&Boedtker，H.(1977).通过变性条件下的凝胶电泳确定RNA分子量一种关键的复查方法。Biochemistry 16，4743-4351.
-Mathews，L.S.，Enberg，B.&Norstedt，G.(1989).大鼠生长激素受体基因表达的调节。J.Biol.Chem.264，9905-9910.
-Matsuki，Y.，Nakashima，M.，Amizuka，N.，Warshawsly，H.，Goltzman，D.，Yamada，K.M.，and Yamada，Y.(1995).从大鼠剪切物随机选择的cDNA克隆中部分序列的复杂情况。J.Dent.Res，74，307-312.
-Melton，D.A.，Krieg，P.A.，Rebagliati，M.R.，Maniatis，T.，Zinn，K.&Green，M.R.(1984).从含有噬菌体SP6启动子质粒体外高效合成生物活性RNA和杂交探针Nucleic Acids Res.12，7035-7056.
-Robinson，C.，Kirkham，J.&Hallsworth，A.S.(1988).发育牛牙齿中蛋白质，矿物质和水的大量分布与浓集。Archs.Oral Biol.33，159-162.
-Simmer，J.P.，Lau，E.C.，Hu，C.C.，Aoba，T.，Lacey，M.，Nelson，D.，Zeichner-David，M.，Snead，M.L.，Slackin，H.C.&Fincham，A.G.(1994).分离和表征Eseherichia coli中表达的小鼠牙釉蛋白。Calcif.Tissue Int.54.312-319.
-Ataatz，W.D.，Fok，K.F.，Zutter，M.M.，Adame，S.P.，Rodriguez，B.A.&Santoro，S.A.(1991).胶原中α2β整联蛋白四肽识别序列的鉴定。J.Biol.Chem.266，7363-7367.
-Strawich，E.&Glimcher，M.J.(1990).牙“enamelin″主要被鉴定为血清蛋白质。Eur.J.Biochem.191，47-56.
-Termine，J.D.，Belcourt，A.B.，Christner，P.J.，Conn，K.M.&Nylen，M.U.(1980).分开提取的小牛牙基质蛋白质的性质。J.Biol.Chem.255，9760-9768.
-Uchida，T.，Fukac，M.，Tanabe，T.，Uamakoshi，Y.，Satoda，T.，Murakami，C.，Takahashi，O.&Shimizu，M.(1995).猪的未成熟釉质中15kDa非牙釉蛋白和相关蛋白质的免疫化学及免疫细胞化学研究提出一组新enamelin质“鞘蛋白”。Biomed.Res.16，131-140.
-Wilkinson，D.L.&Harrison，R.G.(1991).预断Escherichia coli中重组蛋白质的溶解度。Biochemistry 9，443-448.
-Watkins，S.(1994).原位杂交与免疫组化。分子生物学现代方法。Ausubel，F.M.，Brent，R.，Kingston，R.E.，Moore，D.D.，Seidman，J.G.，Smith，J.A.&Struhl，K.John Wiley，New York-Yamada，Y.&Kleinman，H.K.(1992).细胞粘着分子的功能域。Curr.Opin.Cell Biol.4.819-823.
-Yamada，Y.，Kuhn，K.&deCrombrugghe，B.(1983).编码C-前肽的一个片段的保守核苷酸序列被发现在不同胶原的相同位置。Nucl.Acids Res.11，2733-2744.
-WO 89/08441(Biora AB；1989年9月21日出版)序列表(1)一般资料(i)申请人(A)名称口腔生物学中心(B)街P.O.Box 4064(C)城市Huddinge(E)国家瑞典(F)邮编(ZIP)S-141 04(ii)发明题日新DNA和肽序列及相关表达载体(iii)序列号4(iv)计算机可读形式(A)介质类型软盘(B)计算机IBM兼容PC(C)操作系统PC-DOS/MS-DOS(D)软件专利发布号1.0，版本号1.30(EPO)(2)SEQ ID NO1资料(i)序列特性(A)长度1939碱基对(B)类型核酸
(C)链双链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键字CDS(B)位置94..1314(xi)序列描述SEQ ID NO1AGAGAGAGAG CCCCAGGAAC AGTCCAGAAA AAAATTAATC TTCTTTTCTT AGAACTGTTT 60TGATTGGCAT CATCAGGCCT GGGAGCACAG TGA ATG TCA GCA TCT AAG ATT CCA 114Met Ser Ala Ser Lys Ile Pro1 5CTT TTC AAA ATG AAG GGC CTG CTC CTG TTC CTG TCC CTA GTG AAA ATG 162Leu Phe Lys Met Lys Gly Leu Leu Leu Phe Leu Ser Leu Val Lys Met10 15 20AGC CTC GCC GTG CCG GCA TTT CCT CAA CAA CCT GGG GCT CAA GGC ATG 210Ser Leu Ala Val Pro Ala Phe Pro Gln Gln Pro Gly Ala Gln Gly Met25 30 35GCA CCT CCT GGC ATG GCT AGT TTG AGC CTT GAG ACA ATG AGA CAG TTG 258Ala Pro Pro Gly Met Ala Ser Leu Ser Leu Glu Thr Met Arg Gln Leu40 45 50 55GGA AGC TTG CAG GGG CTC AAC GCA CTT TCT CAG TAT TCT AGA CTT GGC 306Gly Ser Leu Gln Gly Leu Asn Ala Leu Ser Gln Tyr Ser Arg Leu Gly60 65 70TTT GGA AAA GCA CTT AAT AGT TTA TGG TTG CAT GGA CTC CTC CCA CCG 354Phe Gly Lys Ala Leu Asn Ser Leu Trp Leu His Gly Leu Leu Pro Pro75 80 85CAT AAT TCT TTC CCA TGG ATA GGA CCA AGG GAA CAT GAA ACC CAA CAG 402His Asn Ser Phe Pro Trp Ile Gly Pro Arg Glu His Glu Thr Gln Gln90 95 100CCA TCC TTG CAG CCT CAC CAG CCA GGA CTG AAA CCC TTC CTC CAG CCC 450Pro Ser Leu Gln Pro His Gln Pro Gly Leu Lys Pro Phe Leu Gln Pro105 110115ACT GCT GCA ACC GGT GTC CAG GTC ACA CCC CAG AAG CCA GGG CCT CAT 498Thr Ala Ala Thr Gly Val Gln Val Thr Pro Gln Lys Pro Gly Pro His120 125 130 135CCT CCA ATG CAC CCT GGA CAG CTG CCC TTG CAG GAA GGA GAG CTG ATA 546Pro Pro Met His Pro Gly Gln Leu Pro Leu Gln Glu Gly Glu Leu Ile140 145 150GCA CCA GAT GAG CCA CAG GTG GCG CCA TCA GAG AAC CCA CCA ACA CCC 594Ala Pro Asp Glu Pro Gln Val Ala Pro Ser Glu Asn Pro Pro Thr Pro155 160 165GAG GTA CCA ATA ATG GAT TTT GCC GAT CCA CAA TTC CCA ACA GTG TTC 642Glu Val Pro Ile Met Asp Phe Ala Asp Pro Gln Phe Pro Thr Val Phe170 175 180CAG ATC GCC CAT TCG CTG TCT CGG GGA CCA ATG GCA CAC AAC AAA GTA 690Gln Ile Ala His Ser Leu Ser Arg Gly Pro Met Ala His Asn Lys Val185 190 195CCC ACT TTT TAC CCA GGA ATG TTT TAC ATG TCT TAT GGA GCA AAC CAA 738Pro Thr Phe Tyr Pro Gly Met Phe Tyr Met Ser Tyr Gly Ala Asn Gln200 205 210 215TTG AAT GCT CCT GGC AGA ATC GGC TTC ATG AGT TCA GAA GAA ATG CCT 786Leu Asn Ala Pro Gly Arg Ile Gly Phe Met Ser Ser Glu Glu Met Pro220 225 230GGA GAA AGA GGA AGT CCC ATG GCC TAC GGA ACT CTG TTC CCA GGA TAT 834Gly Glu Arg Gly Ser Pro Met Ala Tyr Gly Thr Leu Phe Pro Gly Tyr235 240 245GGA GGC TTC AGG CAA ACC CTT AGG GGA CTG AAT CAG AAT TCA CCC AAG 882Gly Gly Phe Arg Gln Thr Leu Arg Gly Leu Asn Gln Asn Ser Pro Lys250 255 260GGA GGA GAC TTT ACT GTG GAA GTA GAT TCT CCA GTG TCT GTA ACT AAA 930Gly Gly Asp Phe Thr Val Glu Val Asp Ser Pro Val Ser Val Thr Lys265 270 275GGC CCT GAG AAA GGA GAG GGT CCA GAA GGC TCT CCA CTG CAA GAG GCC 978Gly Pro Glu Lys Gly Glu Gly Pro Glu Gly Ser Pro Leu Gln Glu Ala280 285 290 295AGC CCA GAC AAG GGC GAA AAC CCG GCT CTC CTT TCA CAG ATT GCC CCC1026Ser Pro Asp Lys Gly Glu Asn Pro Ala Leu Leu Ser Gln Ile Ala Pro300305 310GGG GCC CAT GCA GGA CTT CTT GCT TTC CCC AAT GAC CAC ATC CCC AAC1074Gly Ala His Ala Gly Leu Leu Ala Phe Pro Asn Asp His Ile Pro Asn315 320 325ATG GCA AGG GGT CCT GCA GGG CAA AGA CTC CTC GGA GTC ACC CCT GCA1122Met Ala Arg Gly Pro Ala Gly Gln Arg Leu Leu Gly Val Thr Pro Ala330 335340GCT GCA GAC CCA CTG ATC ACC CCT GAA TTA GCA GAA GTT TAT GAA ACC1170Ala Ala Asp Pro Leu Ile Thr Pro Glu Leu Ala Glu Val Tyr Glu Thr345 350 355TAT GGT GCT GAT GTT ACC ACA CCC TTG GGG GAT GGA GAA GCA ACC ATG1218Tyr Gly Ala Asp Val Thr Thr Pro Leu Gly Asp Gly Glu Ala Thr Met360 365 370 375GAT ATC ACC ATG TCC CCA GAC ACT CAG CAG CCA CCG ATG CCT GGA AAC1266Asp Ile Thr Met Ser Pro Asp Thr Gln Gln Pro Pro Met Pro Gly Asn380 385 390AAA GTG CAC CAG CCC CAG GTG CAC AAT GCA TGG CGT TTC CAA GAG CCC1314Lys Val His Gln Pro Gln Val His Asn Ala Trp Arg Phe Gln Glu Pro395 400 405TGACAACCTT GACATAGCAG CTACTTCATG TATGCACAAG CTTTTCAGCT TTGACCCCAT 1374AGCGTACCTT ATTGCTAAAA CACTTGCTAC CCTTCCACAG CGAAGGTATT AAGAGCACTA 1434AGCATGTATT AATAAATACA AGTGCCTAGA AATAGTGTAG GTCCCTTCTT GCTTCCATTC 1494TTATCGAAAT AAAACATATC AACTGTCTCC GTGACTTAGA AATACTATCG ATGATGTCAG 1554AGCAAGTCTG AGTGTCAGCA CTTGGTGATC TAGCATGTAG CTGTCTTAGG CATCATAAAA 1614TTCCTCTTAC TACATGACAT TATTATGCCC AGGAAATGTG ACACCGCTTC TTTCTCTACG 1674CAAAAGCACT TAGTTTCAGA ATTCCAAAGT ATTTCATTTA AACCGTATTA AATGGTGATT 1734GGTGGAGAAT CCTGACTGCT ATTACTGGGT ATCATATATT GGATTTAAAA TTCTTATTTA 1794TAGAATATTT TATTTAATCT AGGAAAAGAA AAGGCAATTG GCCTGTTTTA AATAAAGAAT 1854TTTTCTCACT GAAAATGTCA GGAATTGTAT GCTTATTATT TATATGTATT TAAATAGTAA 1914AGAAAAGCAT ACTCAAAAAA AAAAA1939(2)SEQ ID NO2资料(i)序列特性(A)长度407氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO2Met Ser Ala Ser Lys Ile Pro Leu Phe Lys Met Lys Gly Leu Leu Leu1 5 10 15Phe Leu Ser Leu Val Lys Met Ser Leu Ala Val Pro Ala Phe Pro Gln20 25 30Gln Pro Gly Ala Gln Gly Met Ala Pro Pro Gly Met Ala Ser Leu Ser35 40 45Leu Glu Thr Met Arg Gln Leu Gly Ser Leu Gln Gly Leu Asn Ala Leu50 55 60Ser Gln Tyr Ser Arg Leu Gly Phe Gly Lys Ala Leu Asn Ser Leu Trp65 70 75 80Leu His Gly Leu Leu Pro Pro His Asn Ser Phe Pro Trp Ile Gly Pro85 90 95Arg Glu His Glu Thr Gln Gln Pro Ser Leu Gln Pro His Gln Pro Gly100 105 110Leu Lys Pro Phe Leu Gln Pro Thr Ala Ala Thr Gly Val Gln Val Thr115 120 125Pro Gln Lys Pro Gly Pro His Pro Pro Met His Pro Gly Gln Leu Pro130 135 140Leu Gln Glu Gly Glu Leu Ile Ala Pro Asp Glu Pro Gln Val Ala Pro145 150 155 160Ser Glu Asn Pro Pro Thr Pro Glu Val Pro Ile Met Asp Phe Ala Asp165 170 175Pro Gln Phe Pro Thr Val Phe Gln Ile Ala His Ser Leu Ser Arg Gly180 185 190Pro Met Ala His Asn Lys Val Pro Thr Phe Tyr Pro Gly Met Phe Tyr195 200 205Met Ser Tyr Gly Ala Asn Gln Leu Asn Ala Pro Gly Arg Ile Gly Phe210 215 220Met Ser Ser Glu Glu Met Pro Gly Glu Arg Gly Ser Pro Met Ala Tyr225 230 235 240Gly Thr Leu Phe Pro Gly Tyr Gly Gly Phe Arg Gln Thr Leu Arg Gly245 250 255Leu Asn Gln Asn Ser Pro Lys Gly Gly Asp Phe Thr Val Glu Val Asp260 265 270Ser Pro Val Ser Val Thr Lys Gly Pro Glu Lys Gly Glu Gly Pro Glu275 280 285Gly Ser Pro Leu Gln Glu Ala Ser Pro Asp Lys Gly Glu Asn Pro Ala290 295 300Leu Leu Ser Gln Ile Ala Pro Gly Ala His Ala Gly Leu Leu Ala Phe305 310 315 320Pro Asn Asp His Ile Pro Asn Met Ala Arg Gly Pro Ala Gly Gln Arg325 330 335Leu Leu Gly Val Thr Pro Ala Ala Ala Asp Pro Leu Ile Thr Pro Glu340 345 350Leu Ala Glu Val Tyr Glu Thr Tyr Gly Ala Asp Val Thr Thr Pro Leu355 360 365Gly Asp Gly Glu Ala Thr Met Asp Ile Thr Met Ser Pro Asp Thr Gln370 375 380Gln Pro Pro Met Pro Gly Asn Lys Val His Gln Pro Gln Val His Asn385 390 395 400Ala Trp Arg Phe Gln Glu Pro405(2)SEQ ID NO3资料(i)序列特性(A)长度1648碱基对(B)类型核酸(C)链双链(D)拓扑结构线性(ii)分子类型cDNA(ix)特征(A)名称/关键字CDS(B)位置52..1023(xi)序列描述SEQ ID NO3GAGAGAGAGA GCCACCGCATAATTCTTTCC CATGGATAGG ACCAAGGGAA C ATG AAA 57Met Lys1CCC AAC AGT ATG GAA AAT TCT TTG CCT GTG CAT CCC CCA CCT CTC CCA 105Pro Ash Ser Met Glu Asn Ser Leu Pro Val His Pro Pro Pro Leu Pro5 10 15TCA CAG CCA TCC TTG CAG CCT CAC CAG CCA GGA CTG AAA CCC TTC CTC 153Ser Gln Pro Ser Leu Gln Pro His Gln Pro Gly Leu Lys Pro Phe Leu20 25 30CAG CCC ACT GCT GCA ACC GGT GTC CAG GTC ACA CCC CAG AAG CCA GGG 201Gln Pro Thr Ala Ala Thr Gly Val Gln Val Thr Pro Gln Lys Pro Gly35 40 45 50CCT CAT CCT CCA ATG CAC CCT GGA CAG CTG CCC TTG CAG GAA GGA GAG 249Pro His Pro Pro Met His Pro Gly Gln Leu Pro Leu Gln Glu Gly Glu55 60 65CTG ATA GCA CCA GAT GAG CCA CAG GTG GCG CCA TCA GAG AAC CCA CCA 297Leu Ile Ala Pro Asp Glu Pro Gln Val Ala Pro Ser Glu Asn Pro Pro70 75 80ACA CCC GAG GTA CCA ATA ATG GAT TTT GCC GAT CCA CAA TTC CCA ACA 345Thr Pro Glu Val Pro Ile Met Asp Phe Ala Asp Pro Gln Phe Pro Thr85 90 95GTG TTC CAG ATC GCC CAT TCG CTG TCT CGG GGA CCA ATG GCA CAC AAC 393Val Phe Gln Ile Ala His Ser Leu Ser Arg Gly Pro Met Ala His Asn100 105 110AAA GTA CCC ACT TTT TAC CCA GGA ATG TTT TAC ATG TCT TAT GGA GCA 441Lys Val Pro Thr Phe Tyr Pro Gly Met Phe Tyr Met Ser Tyr Gly Ala115 120 125 130AAC CAA TTG AAT GCT CCT GGC AGA ATC GGC TTC ATG AGT TCA GAA GAA 489Asn Gln Leu Asn Ala Pro Gly Arg Ile Gly Phe Met Ser Ser Glu Glu135 140 145ATG CCT GGA GAA AGA GGA AGT CCC ATG GCC TAC GGA ACT CTG TTC CCA 537Met Pro Gly Glu Arg Gly Ser Pro Met Ala Tyr Gly Thr Leu Phe Pro150 155 160GGA TAT GGA GGC TTC AGG CAA ACC CTT AGG GGA CTG AAT CAG AAT TCA 585Gly Tyr Gly Gly Phe Arg Gln Thr Leu Arg Gly Leu Asn Gln Asn Ser165 170 175CCC AAG GGA GGA GAC TTT ACT GTG GAA GTA GAT TCT CCA GTG TCT GTA 633Pro Lys Gly Gly Asp Phe Thr Val Glu Val Asp Ser Pro Val Ser Val180 185 190ACT AAA GGC CCT GAG AAA GGA GAG GGT CCA GAA GGC TCT CCA CTG CAA 681Thr Lys Gly Pro Glu Lys Gly Glu Gly Pro Glu Gly Ser Pro Leu Gln195 200 205 210GAG GCC AGC CCA GAC AAG GGC GAA AAC CCG GCT CTC CTT TCA CAG ATT 729Glu Ala Ser Pro Asp Lys Gly Glu Asn Pro Ala Leu Leu Ser Gln Ile215 220 225GCC CCC GGG GCC CAT GCA GGA CTT CTT GCT TTC CCC AAT GAC CAC ATC 777Ala Pro Gly Ala His Ala Gly Leu Leu Ala Phe Pro Asn Asp His Ile230 235 240CCC AAC ATG GCA AGG GGT CCT GCA GGG CAA AGA CTC CTC GGA GTC ACC 825Pro Asn Met Ala Arg Gly Pro Ala Gly Gln Arg Leu Leu Gly Val Thr245 250 255CCT GCA GCT GCA GAC CCA CTG ATC ACC CCT GAA TTA GCA GAA GTT TAT 873Pro Ala Ala Ala Asp Pro Leu Ile Thr Pro Glu Leu Ala Glu Val Tyr260 265 270GAA ACC TAT GGT GCT GAT GTT ACC ACA CCC TTG GGG GAT GGA GAA GCA 921Glu Thr Tyr Gly Ala Asp Val Thr Thr Pro Leu Gly Asp Gly Glu Ala275 280 285 290ACC ATG GAT ATC ACC ATG TCC CCA GAC ACT CAG CAG CCA CCG ATG CCT 969Thr Met Asp Ile Thr Met Ser Pro Asp Thr Gln Gln Pro Pro Met Pro295 300 305GGA AAC AAA GTG CAC CAG CCC CAG GTG CAC AAT GCA TGG CGT TTC CAA1017Gly Asn Lys Val His Gln Pro Gln Val His Asn Ala Trp Arg Phe Gln310 315 320GAG CCC TGACAACCTT GACATAGCAG CTACTTCATG TATGCACAAG CTTTTCAGCT 1073Glu ProTTGACCCCAT AGCGTACCTT ATTGCTAAAA CACTTGCTAC CCTTCCACAG CGAAGGTATT 1133AAGAGCACTA AGCATGTATT AATAAATACA AGTGCCTAGA AATAGTGTAG GTCCCTTCTT 1193GCTTCCATTC TTATCGAAAT AAAACATATC AACTGTCTCC GTGACTTAGA AATACTATCG 1253ATGATGTCAG AGCAAGTCTG AGTGTCAGCA CTTGGTGATC TAGCATGTAG CTGTCTTAGG 1313CATCATAAAA TTCCTCTTAC TACATGACAT TATTATGCCC AGGAAATGTG ACACCGCTTC 1373TTTCTCTACG CAAAAGCACT TAGTTTCAGA ATTCCAA GT ATTTCATTTA AACCGTATTA 1433AATGGTGATT GGTGGAGAAT CCTGACTGCT ATTACTGGGT ATCATATATT GGATTTAAAA 1493TTCTTATTTA TAGAATATTT TATTTAATCT AGGAAAAGAA AAGGCAATTG GCCTGTTTTA 1553AATAAAGAAT TTTTCTCACT GAAAATGTCA GGAATTGTAT GCTTATTATT TATATGTATT 1613TAAATAGTAA AGAAAAGCAT ACTCAAAAAA AAAAA 1648(2)SEQ ID NO4资料(i)序列特性(A)长度324氨基酸(B)类型氨基酸(D)拓扑结构线性(ii)分子类型蛋白质(xi)序列描述SEQ ID NO4Met Lys Pro Asn Ser Met Glu Asn Ser Leu Pro Val His Pro Pro Pro1 5 10 15Leu Pro Ser Gln Pro Ser Leu Gln Pro His Gln Pro Gly Leu Lys Pro20 25 30Phe Leu Gln Pro Thr Ala Ala Thr Gly Val Gln Val Thr Pro Gln Lys35 40 45Pro Gly Pro His Pro Pro Met His Pro Gly Gln Leu Pro Leu Gln Glu50 55 60Gly Glu Leu Ile Ala Pro Asp Glu Pro Gln Val Ala Pro Ser Glu Asn65 70 75 80Pro Pro Thr Pro Glu Val Pro Ile Met Asp Phe Ala Asp Pro Gln Phe85 90 95Pro Thr Val Phe Gln Ile Ala His Ser Leu Ser Arg Gly Pro Met Ala100 105 110His Asn Lys Val Pro Thr Phe Tyr Pro Gly Met Phe Tyr Met Ser Tyr115 120 125Gly Ala Asn Gln Leu Asn Ala Pro Gly Arg Ile Gly Phe Met Ser Ser130 135 140Glu Glu Met Pro Gly Glu Arg Gly Ser Pro Met Ala Tyr Gly Thr Leu145 150 155 160Phe Pro Gly Tyr Gly Gly Phe Arg Gln Thr Leu Arg Gly Leu Asn Gln165 170 175Asn Ser Pro Lys Gly Gly Asp Phe Thr Val Glu Val Asp Ser Pro Val180 185 190Ser Val Thr Lys Gly Pro Glu Lys Gly Glu Gly Pro Glu Gly Ser Pro195 200 205Leu Gln Glu Ala Ser Pro Asp Lys Gly Glu Asn Pro Ala Leu Leu Ser210 215 220Gln Ile Ala Pro Gly Ala His Ala Gly Leu Leu Ala Phe Pro Asn Asp225 230 235 240His Ile Pro Asn Met Ala Arg Gly Pro Ala Gly Gln Arg Leu Leu Gly245 250 255Val Thr Pro Ala Ala Ala Asp Pro Leu Ile Thr Pro Glu Leu Ala Glu260 265 270Val Tyr Glu Thr Tyr Gly Ala Asp Val Thr Thr Pro Leu Gly Asp Gly275 280 285Glu Ala Thr Met Asp Ile Thr Met Ser Pro Asp Thr Gln Gln Pro Pro290 295 300Met Pro Gly Asn Lys Val His Gln Pro Gln Val His Asn Ala Trp Arg305 310 315 320Phe Gln Glu Pro
权利要求
1.一种至少部分被纯化的核酸片段，它编码能介导釉质与细胞表面的接触的多肽。
2.一种权利要求1的核酸片段，它包括核苷酸序列SEQ ID NO1，其至少18个核苷酸的亚序列，或所述核酸序列或亚序列的变异体，该变异体与SEQ ID NO1或其至少18个核苷酸的亚序列至少有80％同源性。
3.一种权利要求1的核酸片段，它编码一种多肽，该多肽的氨基酸序列与SEQ ID NO2所示氨基酸序列至少有80％同源性。
4.一种权利要求1的核苷酸序列，它包括核苷酸序列SEQ IDNO3，其至少18个核苷酸的亚序列，或所述序列或亚序列的变异体，该变异体与SEQ ID NO3或其至少18个核苷酸的亚序列有至少80％同源性。
5.一种权利要求1的核酸片段，它编码一种多肽，该多肽的氨基酸序列与SEQ ID NO4中所示的氨基酸序列至少有80％的同源性。
6.一种至少部分被纯化的核酸片段，它基本包含SEQ ID NO1中所示序列。
7.一种至少部分被纯化的核酸片段，它基本包含SEQ ID NO3中所示序列。
8.一种权利要求1的核酸片段，它与含核苷酸序列SEQ ID NO1或其特异部分的核酸片段在严谨杂交条件下杂交。
9.一种权利要求1的核酸片段，它与含核苷酸序列SEQ ID NO3或其特异部分的核酸片段在严谨杂交条件下杂交。
10.一种至少部分被纯化的权利要求1的核酸片段，它编码含SEQID NO2的氨基酸序列1到407的多肽。
11.一种至少部分被纯化的权利要求1的核酸片段，它编码含SEQID NO4的氨基酸序列1到302的多肽。
12.一种权利要求1的核酸片段，它编码含氨基酸序列SEQ IDNO2或SEQ ID NO4之一或两者的亚序列的多肽。
13.一种含权利要求1-12之任何的核酸片段的表达系统。
14.一种可复制表达载体，它载有如权利要求1-12之任一中定义的核酸片段并能够介导该核酸片段的表达。
15.一种携带权利要求14的表达系统的生物，如微生物，如细菌，例如Escherichia coli，酵母，原生动物，或从多细胞生物如真菌，昆虫细胞，植物细胞，哺乳动物得到的细胞或一种细胞系。
16.一种釉质基质相关多肽，它含至少一个能介导该多肽锚着于细胞粘着分子的序列元件，该序列元件选自四肽DGEA(天冬氨酸-甘氨酸-谷氨酸-丙氨酸)，VTKG(缬氨酸-苏氨酸-赖氨酸-甘氨酸)，EKGE(谷氨酸-赖氨酸-甘氨酸-谷氨酸)和DKGE(天冬氨酸-赖氨酸-甘氨酸-谷氨酸)。
17.一种权利要求16的多肽，它含氨基酸序列SEQ ID NO2或其类似物或其变异体。
18.一种权利要求16的多肽，它含氨基酸序列SEQ ID NO4或其类似物或其变异体。
19.一种权利要求16的具有如此的氨基酸序列的多肽，所述序列中的20个氨基酸的连续链段与选自SEQ ID NO2和SEQ ID NO4中所示的氨基酸序列之同样长度的氨基酸链段至少有80％程度的同源性。
20.一种含基本上在SEQ ID NO2中的氨基酸序列1-407的多肽。
21.一种含基本上在SEQ ID NO4中的氨基酸序列1-324的多肽。
22.一种权利要求16的多肽，该多肽含氨基酸序列SEQ ID NO2和/或序列SEQ ID NO4的亚序列。
23.一种权利要求16-22的任何基本纯的多肽。
24.含权利要求23的多肽和非强制性的一种生理可接受性赋形剂的一种组合物。
25.一种产生如权利要求16中定义的多肽的方法，包括如下步骤(a)插入权利要求1-12之任何中定义的核酸片段到一个表达载体中，(b)用步骤(a)中产生的载体转化适当宿主生物，(c)在适当的条件下培养步骤(b)产生的宿主生物以表达该多肽，(d)收获该多肽，和(e)非强制性对该多肽进行翻译后修饰。
26.一种治疗和/或防止牙周疾病的方法，该方法包括给需要此种治疗的病人施用治疗或预防有效量的权利要求16的多肽。
27.一种修复牙中损害的方法，该方法包括非强制性结合适当的充填物材料给需要此种治疗的病人施用有效量的权利要求16的多肽。
28.一种接合两只骨单体的方法，该方法包括给需要此种治疗的病人施用有效量的权利要求16的多肽。
29.一种促进或引起硬组织矿化的方法，该硬组织选自骨，釉质，牙质和牙骨质，该方法包括给需要此种治疗的病人施用有效量的权利要求16的多肽。
30.一种有效结合植入物到骨中的方法，该方法包括给需要此种治疗的病人施用有效量的权利要求16的多肽。
31.一种促进植入器具或经皮器具生物相容性的方法，该方法包括用有效量的权利要求16的多肽覆盖该植入器具。
32.一种诊断试剂，它包括权利要求1的核酸片段或权利要求16的多肽。
全文摘要
本发明涉及编码能调节釉质和细胞表面接触之多肽的新核酸片段。本发明还涉及含本发明核酸片段的表达载体以生产蛋白质,涉及含所述表达载体的生物,生产该多肽的方法,含该多肽的组合物,识别该多肽的抗体或抗体片段,以及治疗各种硬组织疾病或失调症的方法。
文档编号C12N1/15GK1196086SQ96196921
公开日1998年10月14日申请日期1996年6月26日优先权日1995年7月13日
发明者R·克尔赖, I·斯拉拜, L·哈马尔斯特罗姆, T·乌尔茨, C·D·芳申请人:比奥拉公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：R·克尔赖、I·斯拉拜、L·哈马尔斯特罗姆、T·乌尔茨、C·D·芳
技术所有人：比奥拉公司
我是此专利的发明人

上一篇：用于在植物中调节基因表达的组合物和方法
上一篇：糖酵解速率增加的转基因植物细胞和植物的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。