人holf402蛋白及其编码序列的制作方法

文档序号:3554820阅读:486来源:国知局
专利名称:人holf402蛋白及其编码序列的制作方法
技术领域
本发明涉及分子生物学、基因工程学、肿瘤学、细胞生物学领域。具体地,本发明涉及一种在人类肝脏等多种组织中表达的Human Olfactomedin-like protein 402(HOLF402)蛋白及其核酸序列。本发明还涉及该蛋白和核酸序列的制备方法和用途。
背景技术
在本发明被公布之前,尚未有任何公开或报道过人类HOLF402蛋白。
青光眼目前已成为主要的、不可逆的致盲性眼病之一。在我国非选择性人群中,原发性青光眼的发病率是0.52%,年龄超过40岁的人群中,原发性青光眼的发病率高达1.2%。而原发性开角型青光眼的发病机理复杂、起病隐匿、早期自觉症状少,往往是已经造成了较严重的视功能损害才得到诊断;另一方面,由于甾体类激素尤其是糖皮质激素在眼科和全身疾病中的广泛应用和滥用,激素性青光眼的发病率迅速上升,且大多数见于青少年男性,其临床表现和病理生理特征与原发性开角型青光眼极为相似,同时也因为原发性开角型青光眼对糖皮质激素呈高度敏感的眼压升高反应,二者之间的关系受到重视。由于青光眼的盲目是不可逆的,由此而造成经济损失与增加的社会负担是相当巨大的。因此,对原发性开角型青光眼与激素性青光眼发病机理的研究,已成为眼科领域的重要而迫切的课题。
嗅觉介导素是嗅神经上皮的细胞外基质的一种主要成分。嗅觉介导素结构域最先在嗅觉介导素中发现。这个胞外结构域家族的主要成员多在后生动物蛋白中发现,如latrophilins,myocilins,和noelins。但它们的的生物学功能仍在研究中。myocilin中嗅觉介导素结构域的突变多导致原发性开角型青光眼。体外实验也证明了大鼠的optimedin与myocilin蛋白通过嗅觉介导素结构域相互作用。
随着分子生物学技术的广泛应用与发展,与原发性开角型青光眼及激素性青光眼发病最有可能相关的基因已经被发现,即TIGR(Trabecular meshwork induced glucocurticoidresponse protein)基因。TIGR基因在C末端有一个嗅觉介导素(OLFM)样区,与嗅觉介导素40%同源,嗅觉介导素是嗅神经上皮的细胞外基质的一种主要成分,这个区域含有所有已经报告的TIGR基因突变,提示其与细胞结合活性有关。故此,推测TIGR基因在这个位置突变可以阻碍蛋白的吸收与代谢,造成蛋白的堆积阻止房水流出而使眼内压升高,这种异常的眼压调节最后将导致不可逆的青光眼性的视功能损害。
故此,推测holf402蛋白可能也与眼病尤其是青光眼的发病机理有一定的联系。

发明内容
本发明的第一目的就是提供一种新的人基因HOLF402,该基因是一个人HOLF402蛋白基因。
本发明的第二目的是提供一种新的人蛋白人HOLF402。
本发明的第三目的是提供一种利用重组技术生产上述的新的人HOLF402蛋白和核酸序列的方法。
本发明还提供了这种人HOLF402蛋白多肽和编码序列的应用。
在本发明的一个方面,提供了一种分离出的DNA分子,该分子包括编码具有人HOLF402蛋白质活性的多肽的核苷酸序列,即所述的核苷酸序列SEQ ID NO.1中从核苷酸第395-1603位DNA分子的核苷酸序列。
在本发明的另一方面,提供了一种分离出的人HOLF402蛋白质多肽,它包括具有SEQ IDNO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。较佳地,该多肽是具有SEQ ID NO.2序列的多肽。
在本发明的另一方面,还提供了一种载体,它包含上述的DNA分子。
在本发明的另一方面,还提供了一种用上述载体转化的宿主细胞。在一个实例中该宿主细胞是大肠杆菌;在另一实例中,该宿主细胞是真核细胞。
在本发明的另一方面,还提供了一种产生具有人HOLF402蛋白质活性的多肽的方法,该方法包括(1)将编码具有人HOLF402蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人HOLF402蛋白表达载体;(2)将步骤(1)中的表达载体转入宿主细胞,形成人HOLF402蛋白的重组细胞;(3)在适合表达人HOLF402蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人HOLF402蛋白活性的多肽。
在该方法中使用的核酸序列具有SEQ ID NO.1中第395-1603位的序列。
在本发明中,“分离的”、“纯化的”或“基本纯的”DNA是指,该DNA或片段已从天然状态下位于其两侧的序列中分离出来,还指该DNA或片段已经与天然状态下伴随核酸的组份分开,而且已经与在细胞中伴随其的蛋白质分开。
在本发明中,术语“人HOLF402蛋白(或多肽)编码序列”指编码具有人HOLF402蛋白活性的多肽的核苷酸序列,如SEQ ID NO.1中第395-1603位核苷酸序列及其简并序列。该简并序列是指,位于SEQ ID NO.1序列的编码框第395-1603位核苷酸中,有一个或多个密码子被编码相同氨基酸的简并密码子所取代后而产生的序列。由于密码子的简并性,所以与SEQ IDNO.1中第395-1603位核苷酸序列同源性低至约70%的简并序列也能编码出SEQ ID NO.2所述的序列。该术语还包括能在中度严紧条件下,更佳的在高度严紧条件下与SEQ ID NO.1中从核苷酸第395-1603位的核苷酸序列杂交的核苷酸序列。该术语还包括与SEQ ID NO.1中从核苷酸第395-1603位的核苷酸序列的同源性至少70%,较佳地至少80%,更佳地至少90%,最佳地至少95%的核苷酸序列。
该术语还包括能编码具有与天然的人HOLF402相同功能的蛋白的、SEQ ID NO.1中开放阅读框序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-90个,较佳地1-60个,更佳地1-20个,最佳地1-10个)核苷酸的缺失、插入和/或取代,以及在5’和/或3’端添加数个(通常为60个以内,较佳地为30个以内,更佳地为10个以内,最佳地为5个以内)核苷酸。
在本发明中,“基本纯的”蛋白质或多肽是指其至少占样品总物质的至少20%,较佳地至少50%,更佳地至少80%,最佳地至少90%(按干重或湿重计)。纯度可以用任何合适的方法进行测量,如用柱层析、PAGE或HPLC法测量多肽的纯度。基本纯的多肽基本上不含天然状态下的伴随其的组分。
在本发明中,术语“人HOLF402蛋白或多肽”指具有人HOLF402蛋白活性的SEQ ID NO.2序列的多肽。该术语还包括具有与天然人HOLF402相同功能的、SEQ ID NO.2序列的变异形式。这些变异形式包括(但并不限于)若干个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括人HOLF402蛋白的活性片段和活性衍生物。
本发明的人HOLF402多肽的变异形式包括同源序列、保守性变异体、等位变异体、天然突变体、诱导突变体、在高或低的严紧条件下能与人HOLF402DNA杂交的DNA所编码的蛋白、以及利用抗人HOLF402多肽的抗血清获得的多肽或蛋白。本发明还提供了其他多肽,如包含人HOLF402多肽或其片段的融合蛋白。除了几乎全长的多肽外,本发明还包括人HOLF402多肽的可溶性片段。通常,该片段具有人HOLF402多肽序列的至少约10个连续氨基酸,通常至少约30个连续氨基酸,较佳地至少约50个连续氨基酸,更佳地至少约80个连续氨基酸,最佳地至少约100个连续氨基酸。
在本发明中,“人HOLF402保守性变异多肽”指与SEQ ID NO.2的氨基酸序列相比,有至多10个,较佳地至多8个,更佳地至多5个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表1进行替换而产生。
表1

发明还包括人HOLF402蛋白或多肽的类似物。这些类似物与天然人HOLF402多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
在本发明中,可选用本领域已知的各种载体,如市售的载体,包括质粒,粘粒等。在生产本发明的人HOLF402多肽时,可以将人HOLF402编码序列可操作地连于表达调控序列,从而形成人HOLF402蛋白表达载体。
如本文所用,“可操作地连于”指这样一种状况,即线性DNA序列的某些部分能够影响同一线性DNA序列其他部分的活性。例如,如果信号肽DNA作为前体表达并参与多肽的分泌,那么信号肽(分泌前导序列)DNA就是可操作地连于多肽DNA;如果启动子控制序列的转录,那么它是可操作地连于编码序列;如果核糖体结合位点被置于能使其翻译的位置时,那么它是可操作地连于编码序列。一般,“可操作地连于”意味着相邻,而对于分泌前导序列则意味着在阅读框中相邻。
在本发明中,术语“宿主细胞”包括原核细胞和真核细胞。常用的原核宿主细胞的例子包括大肠杆菌、枯草杆菌等。常用的真核宿主细胞包括酵母细胞、昆虫细胞和哺乳动物细胞。较佳地,该宿主细胞是真核细胞,如CHO细胞、COS细胞等。
本发明还提供了对人HOLF402特异的抗体,包括多克隆抗体和单克隆抗体。
在本发明中,可以使用一系列本领域已知的方法来制备针对人HOLF402特异的抗体。例如,将提纯的人HOLF402基因产物或它的抗原片段注射入动物体内以产生多克隆抗体。同样,表达人HOLF402或它的抗原片段的细胞也可以用来对动物致免疫而产生抗体。根据本发明制备的抗体也可以是单克隆抗体,这些单克隆抗体可以用杂交瘤技术制备(例如,Kohler et al.,Nature 256495,1975;Kohler et al.,Eur.J.Immunol.6511,1976;Kohler et al.,Eur.J.Immunol.6292,1976)。本发明的抗体包括可以阻抑人HOLF402功能的抗体,也可以是不影响人HOLF402功能的抗体。每一类抗体都可以通过对人HOLF402基因产物的片段或功能域致免疫而产生,而人HOLF402基因产物及其片段可以用重组方法产生或用多肽合成仪进行合成。与非修饰形式的人HOLF402基因产物结合的抗体,可以通过用在原核细胞例如E.coli中产生的基因产物来免疫动物而得到。与翻译后修饰形式如糖基化或磷酸化蛋白或多肽结合的抗体,可以通过用在真核细胞如酵母或昆虫细胞中产生的基因产物的来免疫动物而得到。
本发明的人HOLF402抗体可以用来鉴定表达人HOLF402蛋白或多肽的细胞,如Jurkat T细胞。例如,可以用一种可检测的分子例如荧光素异硫氰酸(FITC)来标记人HOLF402特异抗体,然后让人HOLF402特异抗体与细胞样品接触,再用荧光显微镜或流式细胞仪检测出与人HOLF402特异抗体结合的细胞。
除了在细胞表面检测人HOLF402外,还可以用Western印迹技术分析该蛋白质。细胞裂解液可以从培养细胞或取自病人的组织标本如肝脏中提取,并溶解在含有去污剂的裂解缓冲液中。然后用SDS聚丙烯酰胺凝胶电泳分离细胞提取物(同时将提纯的人HOLF402多肽作为阳性对照),接着通过电泳杂交将其转移到硝酸纤维素上。为了用Western印迹免疫探测人HOLF402多肽,可以使用典型的抗体结合检测方法,例如放射自显影或碱性磷酸酶检测方法。并可使用免疫接种血清或不相关的单克隆抗体作为非特异反应的对照。
还可用Nothern印迹法技术分析人HOLF402基因产物的表达,即分析人HOLF402的RNA转录物在细胞中的存在与否和数量。
人HOLF402DNA的Nothern印迹分析和人HOLF402特异抗体的Western印迹分析可以联合使用,以证实人HOLF402在生物样本中的表达。人HOLF402DNA还可以用于Southern印迹分析或原位杂交分析,以将该基因定位于染色体上,并可进行遗传连锁分析以找出其它可能的疾病相关基因。
此外,本发明还提供了一种可用作探针的核酸分子,该分子通常具有人HOLF402核苷酸编码序列的8-100个,较佳地15-50个连续核苷酸。该探针可用于检测样品中是否存在编码人HOLF402的核酸分子。
本发明还提供了检测样品中是否存在人HOLF402核苷酸序列的方法,它包括用上述的探针与样品进行杂交,然后检测探针是否发生了结合。较佳地,该样品是PCR扩增后的产物,其中PCR扩增引物对应于人HOLF402核苷酸编码序列,并可位于该编码序列的两侧或中间。引物长度一般为15-50个核苷酸。
此外,根据本发明的人HOLF402核苷酸序列和氨基酸序列,可以在核酸同源性或表达蛋白质的同源性基础上,筛选人HOLF402同源基因或同源蛋白。
为了得到与人HOLF402基因相关的人cDNAs或基因组DNAs的点阵,可以用DNA探针筛选人cDNA或基因组DNA文库,这些探针是在低严紧条件下,用32P对人HOLF402的全部或部分做放射活性标记而得的。最适合于筛选的cDNA文库是来自人肝脏组织的文库。来自参与内分泌的其它人体组织或特定人体细胞株的cDNA文库也可用于筛选目的。构建来自感兴趣的细胞或者组织的cDNA文库的方法是分子生物学领域众所周知的。另外,许多这样的cDNA文库也可以购买到,例如购自Clontech,Palo Alto,Cal.。这种筛选方法可以识别与人HOLF402相关的基因家族的核苷酸序列。
根据核苷酸相似性筛选人HOLF402同源物可以按如下方法完成。人体肝脏cDNA文库,例如Clontech Cat.#7429-1(Clontech,Palo Alto,Cal.)可以使用一段包含人HOLF402基因序列的全部或部分的随机引物化DNA探针筛选。要完成对与人HOLF402序列至少有70%同源性的DNA插入序列的克隆的鉴定,可以使用杂交温度为55℃的杂交液,然后用0.5×SSC和0.1%SDS清洗。用这种方法识别的克隆的DNA插入序列可以进一步用DNA限制性内切酶分析和DNA测序来评价它与人HOLF402基因的相似性。组织表达的分布可以用上述的Northern印迹法技术分析。
人HOLF402同源物也可以用针对人HOLF402蛋白或多肽的抗体来识别。例如,可以用标准的方法对商品化的或者用已知方法构建的,来自细胞或者组织例如肝脏的表达文库进行筛选。将文库倒入平皿,菌落转移到一张硝化纤维素膜上,使表达的重组蛋白结合到膜上。然后就可以用特异性的人HOLF402抗体进行典型的抗体结合和检测。用这种方法所识别出克隆中的DNA插入序列,可以进一步用DNA限制性内切酶分析和DNA测序进行分析以评价它与人HOLF402基因的相似性。新识别的基因的组织表达分布可以同样地按上述方法进行分析。
本发明的人HOLF402核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工化学合成的方法来合成有关序列。在本申请之前,现有技术已完全可以通过先合成多个多核苷酸小片段,然后再进行连接而获得编码本发明人HOLF402蛋白的的核酸序列。然后,可将该核酸序列引入本领域中各种现有的DNA分子(如载体)和细胞中。此外,还可通过化学合成将突变引入本发明蛋白序列中。
除了用重组法产生之外,本发明蛋白的片段还可用固相技术,通过直接合成肽而加以生产(Stewart等人,(1969)Solid-Phase Peptide Synthesis,WH Freeman Co.,San Francisco;Merrifield J.(1963)J.Am Chem.Soc 852149-2154)。在体外合成蛋白质可以用手工或自动进行。例如,可以用Applied Biosystems的431A型肽合成仪(Foster City,CA)来自动合成肽。可以分别化学合成本发明蛋白的各片段,然后用化学方法加以连接以产生全长的分子。
本发明蛋白的编码序列可用于基因定位。例如,通过荧光原位杂交技术(FISH),将cDNA克隆与分裂中期的染色体进行杂交,可以准确地进行染色体定位。该技术可以使用短至约500bp的cDNA;也可以使用长至约2000bp或者更长的cDNA。对于该技术,可参见Verma等人,Human ChromosomesA Manual of Basic Techniques,Pergamon Press,New York(1988)。
一旦序列被定位于染色体上的某个精确位置,将可以将序列在染色体上的物理位置与遗传图谱数据相关联。这些遗传图谱数据是可以获得的,例如通过孟德尔(Mendelian)人遗传数据库(可通过Johns Hopkins University Welch Medical Library在网上获得)。然后,通过连锁分析来鉴定基因与已定位于同一染色体区域的疾病之间的相关性。
接着,有必要确定患病个体和健康个体之间的cDNA或基因组序列方面的差异。如果某一突变存在于部分或全部患病个体但不存在于正常个体,那么该突变可能就是该疾病的致病因素。
利用本发明的人HOLF402蛋白,通过各种常规筛选方法,可筛选出与人HOLF402发生相互作用的物质或,如受体、抑制剂或拮抗剂等。
本发明人HOLF402蛋白及其抗体、抑制剂、拮抗剂或受体等,当在治疗上进行施用(给药)时,可提供不同的效果。通常,可将这些物质配制于无毒的、惰性的和药学上可接受的水性载体介质中,其中pH通常为约5-8,较佳地pH约为6-8,尽管pH值可随被配制物质的性质以及待治疗的病症而有所变化。配制好的药物组合物可以通过常规途径进行给药,其中包括(但并不限于)肌内、腹膜内、皮下、皮内、或局部给药。
以本发明的人HOLF402蛋白为例,可以将其与合适的药学上可接受的载体联用。这类药物组合物含有治疗有效量的蛋白质和药学上可接受的载体或赋形剂。这类载体包括(但并不限于)盐水、缓冲液、葡萄糖、水、甘油、乙醇、及其组合。药物制剂应与给药方式相匹配。本发明的人HOLF402蛋白可以被制成针剂形式,例如用生理盐水或含有葡萄糖和其他辅剂的水溶液通过常规方法进行制备。诸如片剂和胶囊之类的药物组合物,可通过常规方法进行制备。药物组合物如针剂、溶液、片剂和胶囊宜在无菌条件下制造。活性成分的给药量是治疗有效量,例如每天约1微克/千克体重-约5毫克/千克体重。此外,本发明的多肽还可与其他治疗剂一起使用。
当本发明的人HOLF402蛋白多肽被用作药物时,可将治疗有效剂量的该多肽施用于哺乳动物,其中该治疗有效剂量通常至少约10微克/千克体重,而且在大多数情况下不超过约8毫克/千克体重,较佳地该剂量是约10微克/千克体重-约1毫克/千克体重。当然,具体剂量还应考虑给药途径、病人健康状况等因素,这些都是熟练医师技能范围之内的。
通过同源检索发现,本发明的新基因具有与已发表并被确认为小家鼠HOLF402蛋白的基因高度同源的序列,并且本发明的新蛋白具有小家鼠HOLF402蛋白高度保守的氨基酸序列。所以,本发明的人HOLF402是小家鼠HOLF402蛋白基因的一个同源基因而具有相似的功能。


图1为本发明的人HOLF402与小家鼠HOLF402基因核酸序列(GenBank Accession No.AK078505)的同源比较(FASTA)图。其中,相同的核苷酸用“|”标出。
图2为本发明的人HOLF402蛋白与小家鼠HOLF402蛋白的氨基酸序列(SwissProtAccession No.BAC37312.1)的同源比较(FASTA)图。其中,相同的氨基酸在两个序列之间用氨基酸单字符标出,相似的氨基酸用“+”标出。
具体实施例方式
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆实验室手册(New YorkCold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。
实施例1人HOLF402基因的克隆1.基因的全长克隆(Cloning of Full-length cDNA)在得到的新基因片段序列信息基础上,进行cDNA全长克隆,分两阶段进行(1)“电子克隆”(Electronic Cloning)以新基因片段序列作为探针搜寻dbEST数据库,将重叠序列>50bp,同源性在98%以上的表达序列标签(Expressed Sequence Tag,简称“EST”)序列认为同一序列(consensussequence),取出并用AUTOASSEMBLER软件进行拼接,部分EST可以延伸探针序列。再用STRIDER软件分析被延伸的序列是否具有完整的开放阅读框架(Open Reading Frame,ORF),用BLAST搜寻Genbank或SwissProt以确定该序列在核苷酸和氨基酸水平上是否与其他物种有同源性,以帮助判别所得到的基因全长完整性如何。通过电子克隆的方法,通常可获取人HOLF402基因的全长序列。
(2)cDNA末端快速扩增(Rapid Amplification of cDNA Ends,RACE)如果通过“电子克隆”方法仍未得到完整的cDNA全长,则在已有序列的5’或3’端设计引物,在人类肝脏Marathon-Ready cDNA文库(Clontech Lab,Inc,USA)中进行长距离PCR反应。然后对PCR产物克隆、测序。用AUTOASSEMBLER及STRIDER软件分析被延长的序列有无完整的ORF,如无,重复上述过程直至获得全长。
(3)RT-PCR对于5’和3’端已知的序列,如果中间尚有一段间隙(gap)无法从已有的公共数据库或自身数据库获得,可考虑采用RT-PCR的方法。在序列5’端设计引物,3’端引物采用Oligo-dT,在肝脏总RNA库中进行扩增。然后对产物进行克隆、测序。最后拼接并获得全长。
通过组合使用上述3种方法,获得了候选的人HOLF402蛋白的全长编码序列。在拼接得到全长(至少包含完整的开放读框)的基础上,进一步设计引物R15’-CCGGCTAGCAGAAGAGCCACAGCATAAG-3’(SEQ ID NO.3)为正向引物,寡核苷酸R25’-GCCGGTACCCTTCAGAGGCAGCTTTCTC-3’(SEQ ID NO.4)为反向引物,以人9种组织的混合cDNA(spleen,heart,brain,thymus,small intestine,testis,lung,kidney,liver)为模板,进行PCR扩增,R1/R2的PCR条件为94℃4分钟,随之以94℃40秒、58℃30秒和72℃1.5分钟进行35个循环,最后以72℃延伸7分钟。电泳检测PCR扩增产物,获得扩增片段长度为1252bp。然后按常规方法以PCR扩增产物进行克隆、测序,获得SEQ ID NO.1所示的序列。
实施例2人HOLF402基因的序列信息与同源性分析本发明新的人HOLF402全长cDNA的长度为2320bp,详细序列见SEQ ID NO.1,其中开放读框位于395-1603位核苷酸。根据全长cDNA推导出人HOLF402的氨基酸序列,共402个氨基酸残基,分子量45950.89,pI为8.29。详细序列见SEQ ID NO.2。
将人HOLF402的全长cDNA序列及其编码蛋白质用BLAST程序在Non-redundantGenBank +EMBL+DDBJ+PDB和Non-redundant GenBank CDS translations +PDB+SwissProt+Superdate+PIR数据库中进行核苷酸和蛋白质同源性检索,结果发现它与小家鼠的基因存在一定的同源性。在核苷酸水平上,它与小家鼠unnamed protein基因的mRNA全编码序列(GenBank Accession No.NM_172907)的1152-1373位碱基有83%的相同性,186-238位碱基有78%的相同性(图1),在氨基酸水平上,它与小家鼠HOLF402蛋白(SwissProtAccession No.BC047207.1)的第1-233位氨基酸残基有80%的相同性和85%的相似性(图2)。由上可见,人HOLF402基因与小家鼠HOLF402基因无论从核酸还是蛋白水平上都存在较高的同源性,属于同一家族并且两者在功能上也有很高相似性。
本发明的人HOLF402除了可作为该家族一员用于进一步的功能研究,还可用于与其他蛋白一起产生融合蛋白,比如与免疫球蛋白一起产生融合蛋白。此外,本发明的人HOLF402还可以与该家族的其他成员进行融合或交换片段,以产生新的蛋白。例如将本发明的人HOLF402蛋白的N端与小家鼠HOLF402蛋白的N端进行交换,以产生新的活性更高或具有新特性的蛋白。
针对本发明人HOLF402的抗体,用于筛选该家族的其他成员,或者用于亲和纯化相关蛋白(如该家族的其他成员)。
此外,本发明人HOLF402核酸(编码序列或反义序列)可以被引入细胞,以提高人HOLF402的表达水平或者抑制人HOLF402的过度表达。本发明的人HOLF402蛋白或其活性多肽片段可以施用于病人,以治疗或减轻因人HOLF402缺失、无功能或异常而导致的有关病症。此外,还可以用基于本发明的核酸序列或抗体进行有关的诊断或预后判断。
由于本发明的人HOLF402蛋白具有源自人的天然氨基酸序列,因此,与来源于其他物种(如小家鼠)的同族蛋白相比,预计在施用于人时将具有更高的活性和/或更低的副作用(例如在人体内的免疫原性更低或没有)。
实施例3人HOLF402蛋白的结构和功能研究将人HOLF402蛋白的氨基酸序列在PROSITE数据库(网址为http://expasy.hcuge.ch/sprot/scnpsitl.btml)中检索基序(motif),得到以下结果1 MMVALRGASA LLVLFLAAFL PPPQCTQDPA MVHYIYQRFR VLEQGLEKCT51 QATRAYIQEF QEFSKNISVM LGRCQTYTSE YKSAVGNLAL RVERAQREID101 YIQYLREADE CIESEDKTLA EMLLQEAEEE KKIRTLLNAS CDNMLMGIKS151 LKIVKKMMDT HGSWMKDAVY NSPKVYLLIG SRNNTVWEFA NIRAFMEDNT201 KPAPRKQILT LSWQGTGQVI YKGFLFFHNQ ATSNEIIKYN LQKRTVEDRM251 LLPGGVGRAL VYQHSPSTYI DLAVDEHGLW AIHSGPGTHS HLVLTKIEPG301 TLGVEHSWDT PCRSQDAEAS FLLCGVLYVV YSTGGQGPHR ITCIYDPLGT
351 ISEEDLPNLF FPKRPRSHSM IHYNPRDKQL YAWNEGNQII YKLQTKRKLP LK(1)在氨基酸序列中,存在以下功能基序黑体区(162-397)Olfactomedin-like domain(2)功能分析Olfactomedin-like domain属于olfactomedin家族,在多种蛋白如olfactomedin,myocilin,pancortin和latrophilin中存在。
实施例4人HOLF402多肽的制备和提纯在该实施例中,将全长的人HOLF402编码序列或片段构建入商品化的蛋白质融合表达载体之中,以表达和提纯重组蛋白。
1.将人HOLF402多肽以GST融合蛋白的形式在大肠杆菌中进行原核表达。
原核表达载体的构建,以及转化大肠杆菌根据人HOLF402的全长编码序列(SEQ ID NO.1),设计扩增出完整编码阅读框的引物(分别对应于编码序列5’和3’端的约20个以上核苷酸),并在正反引物上分别引入限制性内切酶位点(这根据选用的pGEX-4T载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将人HOLF402基因在保证阅读框正确的前提下克隆至pGEX-4T-1载体(Pharmacia,Piscataway,NJ)。鉴定好的表达载体利用CaCl2方法转入大肠杆菌DH5α,筛选鉴定得到含有pGEX-4T-1-HOLF402表达载体的工程菌DH5α-pGEX-4T-1-HOLF402。
表达GST-HOLF402重组蛋白的工程菌的分离鉴定挑取单菌落的DH5α-pGEX-4T-1-HOLF402工程菌于3ml含100μg/ml氨苄青霉素的LB培养基中振摇培养过夜,按1∶100的浓度吸取培养液于新的YT培养基(含100μg/ml氨苄青霉素)中培养约3小时,至OD600达0.5后,加入IPTG至终浓度0.2mol/L继续于30℃分别培养0,1,2,3小时。取培养时间不同的1ml菌液离心,在细菌沉淀物中加入裂解液(2×SDS上样缓冲液50μl,蒸馏水45μl,二巯基乙醇5μl),混悬细菌沉淀,沸水浴中煮5分钟,10000rpm离心1分钟,上清加入15%SDS-PAGE胶中电泳。染色后观察预期分子量大小的蛋白量随IPTG诱导时间增加而增加的菌株即为表达GST-HOLF402融合蛋白的工程菌。
GST-HOLF402融合蛋白的提取纯化按上述方法诱导表达GST-HOLF402融合表达蛋白的工程菌DH5α-pGEX-4T-HOLF402。诱导后的细菌离心沉淀,按每400ml菌加入20ml PBS重悬细菌,超声破碎细菌。破菌完全的超声液离心取上清按每毫升加入20微升的量加入PBS饱和的50%谷胱苷肽Sepharose 4B,37℃振摇结合30分钟,10000rpm离心10分钟沉淀结合了GST-HOLF402的谷胱苷肽Sepharose 4B,弃上清。按每毫升超声液加入10ml PBS的量清洗两次,而后按每毫升超声液加入10μl还原型谷胱苷肽洗脱液,4℃过夜洗脱,10000rpm离心10分钟,上清即为洗脱的融合蛋白。重复洗脱两次。洗脱的上清保存于-80℃,并进行SDS-PAGE电泳,检测纯化效果。在40kDa处的蛋白质条带即为人HOLF402蛋白。
实施例5人HOLF402蛋白或多肽在CHO细胞中进行真核转染证明分泌性1.人HOLF402杆状病毒表达载体的构建及转染细胞株根据人HOLF402的全长编码序列(SEQ ID NO.1),设计扩增出完整编码阅读框的引物,并在正反引物上分别引入限制性内切酶位点(这可视选用的载体而定),以便构建表达载体。以实施例1中获得的扩增产物为模板,经PCR扩增后,将人HOLF402cDNA在保证阅读框架的前提下克隆至pcDNA3.1A载体(Invitrogen,Carlsbad,CA)。鉴定好的表达载体2μg,pcDNA3.1A DNA(BaculoGoldTMACMNPV DNA,Pharmingen,San Diego,CA)1μg和Lipofection(Gibco-BRL,NY)25μl,加入1ml无血清的DMEM培养基中,振荡15秒混匀,室温孵育15分钟备用。取1ml(2×106)CHO细胞悬液于60mm组织培养板中,贴壁1小时后换转染培养基,室温孵育15分钟后弃培养基,加入前面制备好的DNA载体转染混合物,Parafilm密封培养板,于室温27℃振摇培养4小时,而后换完全培养基培养3天,收集上清和细胞裂解液备用。
2.转入重组表达载体的CHO细胞株的筛选鉴定转染3天后的CHO细胞进行Western鉴定。将细胞裂解后进行SDS-PAGE电泳,电泳后的胶于Pharmacia的Multiphor II半干电转移仪中将蛋白质转印到硝酸纤维膜上,将硝酸纤维膜置于封闭液中封闭2小时,而后于c-myc抗体溶液中封闭1小时,PBST液振摇清洗10分钟共3次,而后将膜置于荧光标记的D&R第二抗体溶液中振摇1小时,PBST清洗,加入荧光显色剂反应1分钟,显影观察蛋白条带。
发现该蛋白在上清和细胞裂解液中均有存在。
实施例6抗人HOLF402抗体的制备1.免疫小鼠和脾细胞的制备将上述获得的人HOLF402蛋白用层析法进行分离后备用,也可以用SDS-PAGE凝胶电泳法进行分离,将电泳条带从凝胶中割下,并用等体积的完全Freund’s佐剂乳化。取6-8周龄Balb/C雌鼠,用50-100μg/0.2ml乳化过的蛋白,对小鼠进行腹膜内注射。14天后,用非完全Freund’s佐剂乳化的同样抗原对小鼠以50-100μg/0.2ml的剂量再加强免疫一次,3-5天后用于融合。其中,脾细胞制备见鄂征主编,《组织培养和分子细胞学技术》,北京出版社,第210页。
2.按《组织培养和分子细胞学技术》(同上),第371页中的方法,制备饲养细胞。
3.按《组织培养和分子细胞学技术》(同上),第213页中的方法,进行细胞融合。
4.抗体的检测在细胞融合10-15天后,需逐孔进行检查,一旦发现旺盛的杂交细胞集落生长,就应用人HOLF402蛋白做抗体活性的初步筛选,常用的方法有免疫荧光试验、发射免疫试验(RIA)、酶联免疫吸附试验(ELISA)。检查出抗体活性的孔后,立刻进行克隆培养,并分离出抗体。
序列表<110>上海人类基因组研究中心<120>人HOLF402蛋白及其编码序列<130>NP-1375<160>4<170>PatentIn version 3.2<210>1<211>2320<212>DNA<213>Homo sapiens<220>
<221>CDS<222>(395)..(1603)<400>1gggggaaggg aacgggggga agccatcttc accccccacc ccaatgcaca cacaattaag 60ccaggaagca gcttgcaacc actagcctgg ggagggtccg catgtgtcaa gggtgagggc 120aacagatgct ggacccaggg agctctctgc cacaggtcag tctacaaggc ctcagggacc 180aacttgccaa cagctggact tgatcactag ctggcaaact gagctcacgt atcgggtgga 240ataacaagcg gactttgctc tctgctgtgc aaaacgctgt ttttagagga tttgccacag 300cagcggatag agcaggagag caccaccgga gcccttgaga catccttgag aagagccaca 360gcataagaga ctgccctgct tggtgttttg cagg atg atg gtg gcc ctt cga gga 415Met Met Val Ala Leu Arg Gly1 5gct tct gca ttg ctg gtt ctg ttc ctt gca gct ttt ctg ccc ccg ccg463Ala Ser Ala Leu Leu Val Leu Phe Leu Ala Ala Phe Leu Pro Pro Pro10 15 20cag tgt acc cag gac cca gcc atg gtg cat tac atc tac cag cgc ttt511Gln Cys Thr Gln Asp Pro Ala Met Val His Tyr Ile Tyr Gln Arg Phe25 30 35
cga gtc ttg gag caa ggg ctg gaa aaa tgt acc caa gca acg agg gca 559Arg Val Leu Glu Gln Gly Leu Glu Lys Cys Thr Gln Ala Thr Arg Ala40 45 50 55tac att caa gaa ttc caa gag ttc tca aaa aat ata tct gtc atg ctg 607Tyr Ile Gln Glu Phe Gln Glu Phe Ser Lys Asn Ile Ser Val Met Leu60 65 70gga aga tgt cag acc tac aca agt gag tac aag agt gca gtg ggt aac 655Gly Arg Cys Gln Thr Tyr Thr Ser Glu Tyr Lys Ser Ala Val Gly Asn75 80 85ttg gca ctg aga gtt gaa cgt gcc caa cgg gag att gac tac ata caa 703Leu Ala Leu Arg Val Glu Arg Ala Gln Arg Glu Ile Asp Tyr Ile Gln90 95 100tac ctt cga gag gct gac gag tgc atc gaa tca gag gac aag aca ctg 751Tyr Leu Arg Glu Ala Asp Glu Cys Ile Glu Ser Glu Asp Lys Thr Leu105 110 115gca gaa atg ttg ctc caa gaa gct gaa gaa gag aaa aag atc cgg act 799Ala Glu Met Leu Leu Gln Glu Ala Glu Glu Glu Lys Lys Ile Arg Thr120 125 130 135ctg ctg aat gca agc tgt gac aac atg ctg atg ggc ata aag tct ttg 847Leu Leu Asn Ala Ser Cys Asp Asn Met Leu Met Gly Ile Lys Ser Leu140 145 150aaa ata gtg aag aag atg atg gac aca cat ggc tct tgg atg aaa gat 895Lys Ile Val Lys Lys Met Met Asp Thr His Gly Ser Trp Met Lys Asp155 160 165gct gtc tat aac tct cca aag gtg tac tta tta att gga tcc aga aac 943Ala Val Tyr Asn Ser Pro Lys Val Tyr Leu Leu Ile Gly Ser Arg Asn170 175 180aac act gtt tgg gaa ttt gca aac ata cgg gca ttc atg gag gat aac 991Asn Thr Val Trp Glu Phe Ala Asn Ile Arg Ala Phe Met Glu Asp Asn185 190 195acc aag cca gct ccc cgg aag caa atc cta aca ctt tcc tgg cag gga1039Thr Lys Pro Ala Pro Arg Lys Gln Ile Leu Thr Leu Ser Trp Gln Gly200 205 210 215aca ggc caa gtg atc tac aaa ggt ttt cta ttt ttt cat aac caa gca1087
Thr Gly Gln Val Ile Tyr Lys Gly Phe Leu Phe Phe His Asn Gln Ala220 225 230act tct aat gag ata atc aaa tat aac ctg cag aag agg act gtg gaa1135Thr Ser Asn Glu Ile Ile Lys Tyr Asn Leu Gln Lys Arg Thr Val Glu235 240 245gat cga atg ctg ctc cca gga ggg gta ggc cga gca ttg gtt tac cag1l83Asp Arg Met Leu Leu Pro Gly Gly Val Gly Arg Ala Leu Val Tyr Gln250 255 260cac tcc ccc tca act tac att gac ctg gct gtg gat gag cat ggg ctc1231His Ser Pro Ser Thr Tyr Ile Asp Leu Ala Val Asp Glu His Gly Leu265 270 275tgg gcc atc cac tct ggg cca ggc acc cat agc cat ttg gtt ctc aca1279Trp Ala Ile His Ser Gly Pro Gly Thr His Ser His Leu Val Leu Thr280 285 290 295aag att gag ccg ggc aca ctg gga gtg gag cat tca tgg gat acc cca1327Lys Ile Glu Pro Gly Thr Leu Gly Val Glu His Ser Trp Asp Thr Pro300 305 310tgc aga agc cag gat gct gaa gcc tca ttc ctc ttg tgt ggg gtt ctc1375Cys Arg Ser Gln Asp Ala Glu Ala Ser Phe Leu Leu Cys Gly Val Leu315 320 325tat gtg gtc tac agt act ggg ggc cag ggc cct cat cgc atc acc tgc1423Tyr Val Val Tyr Ser Thr Gly Gly Gln Gly Pro His Arg Ile Thr Cys330 335 340atc tat gat cca ctg ggc act atc agt gag gag gac ttg ccc aac ttg1471Ile Tyr Asp Pro Leu Gly Thr Ile Ser Glu Glu Asp Leu Pro Asn Leu345 350 355ttc ttc ccc aag aga cca aga agt cac tcc atg atc cat tac aac ccc1519Phe Phe Pro Lys Arg Pro Arg Ser His Ser Met Ile His Tyr Asn Pro360 365 370 375aga gat aag cag ctc tat gcc tgg aat gaa gga aac cag atc att tac1567Arg Asp Lys Gln Leu Tyr Ala Trp Asn Glu Gly Asn Gln Ile Ile Tyr380 385 390aaa ctc cag aca aag aga aag ctg cct ctg aag taa tgcattacag 1613Lys Leu Gln Thr Lys Arg Lys Leu Pro Leu Lys395 400
ctgtgagaaa gagcactgtg gctttggcag ctgttctaca ggacagtgag gctatagccc1673cttcacaata tagtatccct ctaatcacac acaggaagag tgtgtagaag tggaaatacg1733tatgcctcct ttcccaaatg tcactgcctt aggtatcttc caagagctta gatgagagca1793tatcatcagg aaagtttcaa caatgtccat tactccccca aacctcctgg ctctcaagga1853tgaccacatt ctgatacagc ctacttcaag ccttttgttt tactgctccc cagcatttac1913tgtaactctg ccatcttccc tcccacaatt agagttgtat gccagcccct aatattcacc1973actggctttt ctctcccctg gcctttgctg aagctcttcc ctctttttca aatgtctatt2033gatattctcc cattttcact gcccaactaa aatactatta atatttcttt cttttctttt2093cttttttttg agacaaggtc tcactatgtt gcccaggctg gtctcaaact ccagagctca2153agagatcctc ctgcctcagc ctcctaagta cctgggatta caggcatgtg ccaccacacc2213tggcttaaaa tactatttct tattgaggtt taacctctat ttcccctagc cctgtccttc2273cactaagctt ggtagatgta ataataaagt gaaaatatta acatttg 2320<210>2<211>402<212>PRT<213>Homo sapiens<400>2Met Met Val Ala Leu Arg Gly Ala Ser Ala Leu Leu Val Leu Phe Leul 5 10 15Ala Ala Phe Leu Pro Pro Pro Gln Cys Thr Gln Asp Pro Ala Met Val20 25 30His Tyr Ile Tyr Gln Arg Phe Arg Val Leu Glu Gln Gly Leu Glu Lys35 40 45Cys Thr Gln Ala Thr Arg Ala Tyr Ile Gln Glu Phe Gln Glu Phe Ser
50 55 60Lys Asn Ile Ser Val Met Leu Gly Arg Cys Gln Thr Tyr Thr Ser Glu65 70 75 80Tyr Lys Ser Ala Val Gly Asn Leu Ala Leu Arg Val Glu Arg Ala Gln85 90 95Arg Glu Ile Asp Tyr Ile Gln Tyr Leu Arg Glu Ala Asp Glu Cys Ile100 105 110Glu Ser Glu Asp Lys Thr Leu Ala Glu Met Leu Leu Gln Glu Ala Glu115 120 125Glu Glu Lys Lys Ile Arg Thr Leu Leu Asn Ala Ser Cys Asp Asn Met130 135 140Leu Met Gly Ile Lys Ser Leu Lys Ile Val Lys Lys Met Met Asp Thr145 150 155 160His Gly Ser Trp Met Lys Asp Ala Val Tyr Asn Ser Pro Lys Val Tyr165 170 175Leu Leu Ile Gly Ser Arg Asn Asn Thr Val Trp Glu Phe Ala Asn Ile180 185 190Arg Ala Phe Met Glu Asp Asn Thr Lys Pro Ala Pro Arg Lys Gln Ile195 200 205Leu Thr Leu Ser Trp Gln Gly Thr Gly Gln Val Ile Tyr Lys Gly Phe210 215 220Leu Phe Phe His Asn Gln Ala Thr Ser Asn Glu Ile Ile Lys Tyr Asn225 230 235 240
Leu Gln Lys Arg Thr Val Glu Asp Arg Met Leu Leu Pro Gly Gly Val245 250 255Gly Arg Ala Leu Val Tyr Gln His Ser Pro Ser Thr Tyr Ile Asp Leu260 265 270Ala Val Asp Glu His Gly Leu Trp Ala Ile His Ser Gly Pro Gly Thr275 280 285His Ser His Leu Val Leu Thr Lys Ile Glu Pro Gly Thr Leu Gly Val290 295 300Glu His Ser Trp Asp Thr Pro Cys Arg Ser Gln Asp Ala Glu Ala Ser305 310 315 320Phe Leu Leu Cys Gly Val Leu Tyr Val Val Tyr Ser Thr Gly Gly Gln325 330 335Gly Pro His Arg Ile Thr Cys Ile Tyr Asp Pro Leu Gly Thr Ile Ser340 345 350Glu Glu Asp Leu Pro Asn Leu Phe Phe Pro Lys Arg Pro Arg Ser His355 360 365Ser Met Ile His Tyr Asn Pro Arg Asp Lys Gln Leu Tyr Ala Trp Asn370 375 380Glu Gly Asn Gln Ile Ile Tyr Lys Leu Gln Thr Lys Arg Lys Leu Pro385 390 395 400Leu Lys
<210>3<211>28<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>3ccggctagca gaagagccac agcataag 28<210>4<211>28<212>DNA<213>人工序列<220>
<221>misc_feature<223>引物<400>4gccggtaccc ttcagaggca gctttctc 28
权利要求
1.一种分离出的DNA分子,其特征在于,它包括编码具有人HOLF402蛋白质活性的多肽的核苷酸序列,而且所述的核苷酸序列与SEQ ID NO.1中从核苷酸第395-1603位的核苷酸序列有至少70%的同源性;或者所述的核苷酸序列能在中度严紧条件下与SEQ ID NO.1中从核苷酸第395-1603位的核苷酸序列杂交。
2.如权利要求1所述的DNA分子,其特征在于,所述的序列编码具有SEQ ID NO.2所示的序列的多肽。
3.如权利要求1所述的DNA分子,其特征在于,该序列具有SEQ ID NO.1中从核苷酸第395-1603位的核苷酸序列。
4.一种分离出的人HOLF402蛋白多肽,其特征在于,它包括具有SEQ ID NO.2氨基酸序列的多肽、或其保守性变异多肽、或其活性片段,或其活性衍生物。
5.如权利要求4所述的多肽,其特征在于,该多肽是具有SEQ ID NO.2序列的多肽。
6.一种载体,其特征在于,它包含权利要求1所述的DNA。
7.一种用权利要求6所述载体转化的宿主细胞。
8.一种产生具有人HOLF402蛋白质活性的多肽的方法,其特征在于,该方法包括(1)将编码具有人HOLF402蛋白活性的多肽的核苷酸序列可操作地连于表达调控序列,形成人HOLF402蛋白表达载体,所述的核苷酸序列与SEQ ID NO.1中从核苷酸第395-1603位的核苷酸序列有至少70%的同源性;(2)将步骤(1)中的表达载体转入宿主细胞,形成人HOLF402蛋白的重组细胞;(3)在适合表达人HOLF402蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有人HOLF402蛋白活性的多肽。
9.一种能与权利要求7所述的人HOLF402蛋白多肽特异性结合的抗体。
10.一种核酸分子,其特征在于,它包含权利要求1所述的DNA分子中8-100个连续核苷酸。
全文摘要
本发明提供了一种在人体正常肝脏等多种组织中表达的新的人HOLF402蛋白及其编码序列,本发明还提供了该蛋白和核酸序列的制备方法,以及在样品中检测人HOLF402核酸序列和多肽的方法。
文档编号C07K16/18GK1724664SQ20041005305
公开日2006年1月25日 申请日期2004年7月22日 优先权日2004年7月22日
发明者朱弘, 周宇波, 黄健, 韩泽广 申请人:上海人类基因组研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1