一种人白血病相关逆转录病毒基因组编码的蛋白质与多肽序列及其应用的制作方法

文档序号:1173513阅读:345来源:国知局
专利名称:一种人白血病相关逆转录病毒基因组编码的蛋白质与多肽序列及其应用的制作方法
技术领域
本发明涉及与人白血病病因、发病机理及治疗有关的逆转录病毒基因组编码的新蛋白质,其具有SEQ ID NO.1、3或5所示的氨基酸序列或其片段,或为与其同源性在95%以上的病毒蛋白多肽变体或衍生物。本发明还涉及该病毒基因组编码的病毒蛋白质和多肽序列的制备方法。本发明还涉及一种用于检测样本中是否存在人白血病相关逆转录病毒基因组编码的病毒蛋白的方法和一种用于阻抑人白血病相关逆转录病毒方法。
本发明人首次从白血病患者原代白血病细胞中分离和克隆到一种全长逆转录病毒前病毒基因组。实验证实该病毒基因组不仅存在于大多数白血病患者中,表达相应的病毒RNA和病毒蛋白,而且具有恶性转化正常细胞的功能。并在此基础上得到了与人白血病病因、发病机理及治疗有关的逆转录病毒基因组编码的新蛋白质。由此,为鉴定、治疗和/或预防人类白血病提供了一条新的途径。
本发明的另一方面提供了一种分离的人白血病相关逆转录病毒基因组POL基因编码的病毒蛋白多肽,其具有SEQ ID NO.3所示的氨基酸序列或其片段,或为与其同源性在95%以上的病毒蛋白多肽变体或衍生物。
本发明的再一方面,提供了一种分离的人白血病相关逆转录病毒基因组ENV基因编码的病毒蛋白多肽,其具有SEQ ID NO.5所示的氨基酸序列或其片段,或为与其同源性在95%以上的病毒蛋白多肽变体或衍生物。
本发明的又一方面,提供了一种用于检测样本中是否存在人白血病相关逆转录病毒基因组编码的病毒蛋白的方法,其特征在于利用了本发明所述的病毒蛋白多肽。
本发明的又一方面,提供了一种用于阻抑人白血病相关逆转录病毒方法,其特征在于利用了本发明所述的病毒蛋白多肽。
图2显示GAG基因编码的癌性蛋白与猫肉瘤病毒的编码的酪氨酸蛋白激酶的氨基酸序列同源性比较结果。
图3显示ENV基因编码的癌性蛋白与肿瘤病毒癌基因v-src编码的癌性蛋白氨基酸序列同源性比较结果发明详述在本发明中,术语“该病毒基因组编码的病毒蛋白质和多肽的氨基酸序列”是指如SEQ ID NO.1、SEQ ID NO.3、或SEQ ID NO.5所述的GAG、POL、ENV基因编码的病毒蛋白质和多肽的氨基酸序列。该术语还包括与SEQ ID NO.1、SEQ ID NO.3、或SEQ ID NO.5所述的序列同源性在95%以上的所有具有生物学功能的蛋白质和多肽变体或衍生物。
“分离的”指“通过人工”从天然状态改变和/或从天然环境分离。这样,如果存在于自然界的“分离的”组合物或物质被“分离”,那么它已被改变或已被从其最初的环境移走,或两者都有。例如,天然存在于活的动物内的多核苷酸或多肽不是“分离”的,但从其天然状态的共存物质中分离的同一多核苷酸或多肽是“分离的”,正如此处所用的该术语。
此处所用的术语“变体”是指多核苷酸或多肽,其分别不同于参考的多核苷酸或多肽,但保留了基本的特性,如基本的生物特性、结构特性、调节特性或生化特性。多核苷酸的一般变体之核苷酸序列不同于另一个,参考核苷酸。变体核苷酸序列的变化可改变或不改变多肽的氨基酸序列,其中所述的多肽由参考多核苷酸编码。核苷酸的变化可导致参考序列所编码的多肽中氨基酸的替换、添加、删除、融合和截短,对此将在下面讨论。多肽的一般变体之氨基酸序列不同于另一个,参考多肽。通常,差异是有限的,以使参考多肽之序列与变体总体上非常相似,并且在许多区域是相同的。变体和参考多肽氨基酸序列上的差异可以是一个或多个氨基酸以任一组合的替换、添加和删除。替换或插入的氨基酸残基可由遗传密码编码,也可不由遗传密码编码。多核苷酸或多肽的变体可以自然产生(如等位基因变体),或者它可以是非自然产生的变体。多核苷酸和多肽之非自然产生的变体可通过诱变技术或直接合成而产生。
“同源性”是对核苷酸序列或氨基酸序列之同源性的量度。通常将序列排列起来,以获得最大限度的匹配。“同源性”本身具有本领域认知的意义并且可用公开的技术计算。见例如(计算分子生物学(COMPUTATIONAL MOLECULAR BIOLOGY),Lesk,A.M.,ed.,牛津大学出版社,纽约,1988;生物计算机学资讯学和基因组计划(BIOCOMPUTINGINFORMATICS AND GENOME PROJECTS),Smith,D.W.,ed.,学术出版社,纽约,1993;序列数据的计算机分析,第一部分(COMPUTER ANALYSIS OF SEQUENCE DATA,PARTI),Griffin,A.M.,和Griffin,H.G.,eds.,Humana Press,新泽西,1994;分子生物学中的序列分析(SEQUENCE ANALYSIS IN MOLECULARBIOLOGY),von Heinje,G.,学术出版社,1987;以及序列分析导引(SEQUENCE ANALYSIS PRIMER),Gribskov,M.和Devereux,J.,eds.,M Stockton Press,纽约,1991)。虽然存在许多可用于测量两个多核苷酸或多肽间同源性的方法,该术语“同源性”为技术人员周知(Carillo,H.,和Lipton,D.,工业与应用数学会应用数学杂志(SIAMJ.Applied Math.)(1988)481073)。测定两个序列间的同源性或相似性的常用方法包括(但不限于)公开于超大计算机指南(Guide to HugeComputers),Martin J.Bishop,ed.,学术出版社,圣地亚哥,1994和Carillo,H.,和Lipton,D.,工业与应用数学会应用数学杂志(1988)481073中的方法。测定同源性或相似性的方法已按规则编在计算机程序中。优选的、用于测定两个序列间的同源性或相似性的计算机程序方法包括(但不限于)GCG程序包(Devereux,J.,等人,核酸研究(Nucleic AcidsResearch)(1984)12(1)387)、BLASTP、BLASTN、FASTA(Atschul,S.F.等人,分子生物学杂志(J.Molec.Biol.)(1990)215403)。
通过一种多核苷酸进行说明,其所具有的核苷酸序列例如与SEQ IDNO1的参考核苷酸序列至少具95%的“同源性”是指在SEQ ID NO1的参考核苷酸序列之每100个核苷酸中,该多核苷酸的核苷酸序列除了含有多达5个核苷酸的不同外,该多核苷酸之核苷酸序列与参考序列相同。换句话说,为了获得核苷酸序列与参考核苷酸序列至少95%相同的多核苷酸,参考序列中多达5%的核苷酸可被删除或被另一核苷酸替代;或可将一些核苷酸插入参考序列中,其中插入的核苷酸可多达参考序列之总核苷酸的5%;或在一些核苷酸中,存在删除、插入和替换的组合,其中所述核苷酸多达参考序列之总核苷酸的5%。参考序列的这些突变可发生在参考核苷酸序列的5或3末端位置,或在这些末端位置之间的任意地方,它们或单独散在于参考序列的核苷酸中,或以一个或多个邻近的组存在于参考序列中。
类似地,一种多肽,其所具有的氨基酸序列例如与SEQ ID NO2的参考氨基酸序列至少具95%的“同源性”是指在SEQ ID NO2的参考氨基酸序列之每100个氨基酸中,该多肽之氨基酸序列除了含有多达5个氨基酸的变化外,该多肽之氨基酸序列与参考序列相同。换句话说,为了获得氨基酸序列与参考氨基酸序列至少95%相同的多肽,参考序列中多达5%的氨基酸残基可被删除或被另一氨基酸替代;或可将一些氨基酸插入参考序列中,其中插入的氨基酸多达参考序列之总氨基酸残基的5%。参考序列的这些突变可发生在参考氨基酸序列的氨基或羧基末端位置,或在这些末端位置之间的任意地方,它们或单独散在于参考序列的残基中,或以一个或多个邻近的组存在于参考序列中。
本发明的一个方面,提供了一种分离的人白血病相关逆转录病毒基因组GAG基因编码的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.1所示的氨基酸序列或其片段,或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。事实上,SEQ ID NO.1是由GAG基因(1570个核苷酸)编码的由523个氨基酸组成的多聚蛋白,在氨基端含有一个逆转录病毒核壳体基质蛋白(MA)保守功能域(Conserved Domain,CD),在羧基端含有一个逆转录病毒核壳体P30蛋白保守功能域(Conserved Domain,CD)。具体地,在本发明的一个实施方案中,提供了一种分离的人白血病相关逆转录病毒基因组GAG基因编码的病毒蛋白多肽的片段,其特征在于与肿瘤病毒癌基因v-abl高度同源,具有与SEQ ID NO.4所示的氨基酸序列同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。更具体地,在本发明的一个实施方案中,提供了一种分离的人白血病相关逆转录病毒基因组GAG基因编码的病毒蛋白多肽的片段,其特征在于具有SEQ ID NO.2所示的氨基酸序列。事实上,由该病毒基因组中GAG基因编码的癌性蛋白氨基酸序列与肿瘤病毒癌基因v-abl编码的癌性蛋白的氨基酸序列的同源性高达36%(58/159),与猫肉瘤病毒的编码的酪氨酸蛋白激酶的氨基酸序列同源性高达47%(33/70)。
本发明的又一方面,提供了一种分离的人白血病相关逆转录病毒基因组POL基因编码的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.3所示的氨基酸序列或其片段,或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。事实上,SEQ ID NO.3是由POL基因(3550个核苷酸)编码的由1183个氨基酸组成的多聚蛋白,从氨基端到羧基端依次含有逆转录病毒蛋白酶、逆转录酶、逆转录酶H和整合酶四个保守功能域(Conserved Domain,CD)。具体地,在本发明的一个实施方案中,提供了一种分离的人白血病相关逆转录病毒基因组POL基因编码的病毒蛋白多肽的片段,其特征在于与肿瘤病毒癌基因v-src高度同源,具有与SEQ ID NO.4所示的氨基酸序列同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物.更具体地,在本发明的一个实施方案中,提供了一种分离的人白血病相关逆转录病毒基因组POL基因编码的病毒蛋白多肽的片段,其特征在于具有SEQ ID NO.4所示的氨基酸序列。
本发明的另一方面,提供了一种分离的人白血病相关逆转录病毒基因组ENV基因编码的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.5所示的氨基酸序列或其片段,或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。事实上,SEQ ID NO.5是由ENV基因(2047个核苷酸)编码的由682个氨基酸组成的多聚蛋白,在氨基端含有一个逆转录病毒外壳蛋白的表面糖蛋白,在羧基端含有一个逆转录病毒外壳跨膜蛋白TM保守功能域(Conserved Domain,CD)。本发明中,由该病毒基因组中ENV基因编码的癌性蛋白氨基酸序列与肿瘤病毒癌基因v-src编码的癌性蛋白的氨基酸序列的同源性高达32%(49/154)。
在本发明的另一方面,还提供一种载体,它包含了该病毒基因组中ENV基因全长表达序列。
本发明的又一方面, 提供一种利用基因重组技术生产上述新的人白血病相关逆转录病毒基因组编码的各种病毒蛋白和多肽及相应核酸序列的方法。在本发明的一个实施方案中,提供一种利用基因重组技术生产该病毒基因组中GAG基因编码的病毒蛋白方法,其步骤如下(1)将编码该病毒基因组中GAG完整蛋白的核苷酸序列可操作地连接于表达调控序列,形成GAG蛋白表达载体;(2)将步骤(1)中表达载体转入宿主细胞,形成该病毒基因组中GAG基因编码的病毒蛋白的重组细胞;(3)在适合表达病毒GAG蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有生物活性的病毒GAG蛋白。
在本发明的另一实施方案中,提供一种利用基因重组技术生产该病毒基因组中ENV基因编码的病毒蛋白方法,其步骤如下(1)将编码该病毒基因组中ENV完整蛋白的核苷酸序列可操作地连接于表达调控序列,形成ENV蛋白表达载体;(2)将步骤(1)中表达载体转入宿主细胞,形成该病毒基因组中ENV基因编码的病毒蛋白的重组细胞;(3)在适合表达病毒ENV蛋白多肽的条件下,培养步骤(2)中的重组细胞;(4)分离出具有生物活性的病毒ENV蛋白。
本发明还提供了对上述逆转录病毒GAG、POL、ENV基因编码的病毒蛋白及由GAG和ENV基因编码的癌性蛋白特异性结合的各种抗体,包括多克隆抗体和单克隆抗体。
在本发明中,可以使用一系列本领域已知的方法来制备针对上述逆转录病毒GAG、POL、ENV基因编码的病毒蛋白及由GAG和ENV基因编码的癌性蛋白的各种特异性抗体。例如,将提纯的上述各种病毒基因产物或他们的抗原片段注入动物体内(如兔、羊、马、小鼠等)来产生多克隆抗体。同样,也可以应用杂交瘤技术制备针对上述各种病毒蛋白特异性单克隆抗体。本发明的抗体包括可以抑制上述各种病毒蛋白生物功能的抗体,也可以是不影响所述功能的抗体。每一种抗体都可以通过对上述病毒基因产物片段或功能域致免疫而产生,而上述病毒基因产物及其片段还可以用重组的方法生产或多肽合成仪生产。
本发明的各种特异性抗体可以用来鉴定表达上述病毒GAG、POL、ENV基因编码的病毒蛋白及由GAG和ENV基因编码的癌性蛋白的细胞,如人白血病细胞。如可以用本发明的各种特异性抗体结合免疫荧光试验、免疫细胞化学、流式细胞术等技术,检测和分析表达相应病毒蛋白或多肽的细胞。也可以用本发明的抗体结合免疫印迹技术(Western Blot)定量分析细胞表达病毒蛋白或多肽。
本发明又一方面,提供了一种用于检测样本中是否存在人白血病相关逆转录病毒基因组编码的病毒蛋白的方法,其特征在于利用了本发明所述的病毒蛋白多肽。在本发明的一个实施方案中,利用本发明所述病毒蛋白多肽制备了相应的单克隆抗体或多克隆抗体。进一步地,利用如上制备的单克隆或多克隆抗体用本领域周知的酶免疫试验、免疫组织化学技术、免疫印迹如WESTERN BLOT等方法检测生物学样本中的与人白血病相关逆转录病毒基因组编码的多种病毒蛋白。
本发明的再一方面,提供了一种用于阻抑人白血病相关逆转录病毒方法,其特征在于利用了本发明所述的病毒蛋白多肽。在本发明的一个实施方案中,利用本发明所述的病毒蛋白多肽制备相应的单克隆抗体或多克隆抗体;以及利用所得单克隆抗体或多克隆抗体直接封闭该病毒基因组编码的多种活性病毒蛋白多肽。
本发明进一步构思了利用本发明所述的病毒蛋白多肽,从其中的功能域中寻找和设计相应的药物来阻断或抑制所述病毒蛋白,进而抑制该病毒的活性。具体地,本发明提供的该病毒基因组编码的病毒蛋白或多肽氨基酸序列SEQ ID NO.1、SEQ ID NO.2、SEQ ID NO.3、SEQ IDNO.4及SEQ ID NO.5,还可以用作设计抗病毒药物靶分子或靶位点。可以根据这些序列设计相应的多克隆抗体或单克隆抗体用于阻抑和封闭病毒蛋白或多肽。也可以利用这些序列中的一些有重要功能的功能域(Domain)寻找和设计相应的化学药物,来阻断或抑制病毒。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人编著的《分子克隆实验手册》中所述的实验条件,或按照试剂或试剂盒制造商提供的实验条件。
将GAG基因编码的癌性蛋白214氨基酸残基用NCBI提供的BLAST工具对GenBank、EMBL等蛋白质数据库进行同源性检索,结果发现在氨基酸水平上它与肿瘤病毒癌基因v-abl编码的癌性蛋白的氨基酸序列的同源性高达36%(58/159,结果见附

图1),与猫肉瘤病毒的编码的酪氨酸蛋白激酶的氨基酸序列同源性高达47%(33/70,结果见附图2)。
将编码人白血病相关逆转录病毒基因GAG病毒蛋白多肽以GST融合蛋白形式在大肠杆菌中进行原核表达。
原核表达载体的构建根据SEQ ID NO.1提供的序列,设计扩增编码完整GAG病毒蛋白多肽的核酸序列的PCR引物,经PCR扩增后将扩增的DNA片段克隆到pGEX-T载体。然后,用氯化钙方法转入合适的大肠杆菌中,筛选和鉴定含有能表达GAG病毒蛋白多肽的重组子。
表达GAG重组融合蛋白分离和纯化取含有GAG病毒蛋白多肽的重组子的工程菌,放入含7ml LB培养液试管中,37℃振摇培养过夜。然后,按1∶100浓度比例将工程菌接种到新鲜的LB培养基中,37℃继续振摇培养3小时,然后加入IPTG(终浓度1mmol/L),37℃继续振摇培养3小时。取IPTG诱导后的工程菌液,离心,弃上清液,用PBS悬浮细菌沉淀,然后用超声粉碎法破碎细菌。然后用柱离心法纯化重组GAG病毒蛋白。
SEQUENCE LISTING<110>养生堂有限公司浙江大学医学院附属第二医院<120>一种新的人白血病相关逆转录病毒基因组编码的蛋白质与多肽序列及其应用<130>idc020022<160>5<170>PatentIn version 3.1<210>1<211>523<212>PRT<213>Homo sapiens<400>1Met Leu Lys Asn Phe Lys Lys Gly Phe Asn Gly Asp Tyr Gly Val Thr1 5 10 15Met Thr Pro Gly Lys Leu Arg Ile Leu Cys Glu Ile Asp Trp Pro Thr20 25 30Leu Glu Val Gly Trp Pro Ser Glu Gly Ser Leu Asp Arg Ser Leu Val35 40 45Ser Lys Val Trp His Lys Val Thr Gly Lys Ser Gly His Ser Asp Gln50 55 60Phe Pro Tyr Ile Asp Thr Trp Leu Leu Gln Leu Val Gln Asp Pro Pro65 70 75 80Gln Trp Leu Arg Gly Gln Ala Ala Ala Val Leu Val Ala Lys Gly Gln85 90 95Ile Ala Lys Glu Gly Ser Arg Ser Thr His Trp Gly Lys Ser Thr Pro100 105 110Glu Val Leu Phe Asp Pro Thr Ser Glu Asp Pro Leu Gln Glu Met Ala
115 120 125Pro Val Ile Pro Val Leu Pro Ser Pro Tyr Gln Ala Glu Arg Leu Pro130 135 140Thr Phe Glu Pro Thr Val Leu Val Pro Pro Gln Asp Lys His Ile Pro145 150 155 160Arg Pro Pro Arg Val Asp Lys Arg Gly Gly Glu Ala Ser Gly Glu Thr165 170 175Pro Pro Leu Ala Ala Cys Leu Arg Pro Lys Thr Gly Ile Gln Met Pro180 185 190Leu Arg Glu Gln Arg Tyr Thr Gly Ile Glu Glu Asp Gly His Met Val195 200 205Glu Lys Arg Val Phe Val Tyr Gln Pro Phe Thr Ser Ala Asn Leu Leu210 215 220Asn Trp Lys Asn Asn Thr Leu Ser Tyr Thr Glu Lys Pro Gln Ala Leu225 230 235 240Ile Asp Leu Leu Gln Thr Ile Ile Gln Thr His Asn Ser Thr Arg Ala245 250 255Asp Cys His Gln Leu Leu Met Phe Leu Phe Asn Thr Asp Glu Arg Gln260 265 270Arg Val Leu Gln Ala Ala Thr Lys Trp Val Gln Glu His Ala Pro Ala275 280 285Asp Tyr Gln Asn Pro Gln Glu Cys Val Arg Thr Gln Leu Pro Gly Thr290 295 300Asp Pro Gln Trp Asp Pro Asn Glu Arg Glu Asp Met Gln Arg Leu Asn305 310 315 320Arg Asp Arg Glu Ala Val Leu Glu Gly Leu Lys Arg Gly Ala Gln Lys325 330 335Ala Thr Asn Val Asn Lys Val Ser Glu Val Ile Arg Gly Lys Glu Glu340 345 350Ser Pro Ala Gln Phe Tyr Gln Arg Leu Cys Glu Gly Tyr Arg Met Tyr355 360 365Thr Pro Phe Asp Pro Val Ser Pro Glu Asn Gln Arg Met Val Asn Met370 375 380Ala Leu Val Ser Gln Ser Ala Glu Asp Ile Arg Arg Lys Leu Gln Lys385 390 395 400Gln Asp Gly Phe Ala Gly Thr Asn Thr Ser Gln Leu Leu Glu Val Ala405 410 415Asn Gln Val Phe Val Asn Arg Asp Ala Val Ser Pro Lys Glu Asn Arg420 425 430Arg Glu Asn Glu Arg Gln Ala Arg Arg Asn Ala Glu Leu Leu Ala Ala435 440 445Ala Val Gly Gly Val Ser Ser Lys Arg Gln Gly Lys Gly Gly Pro Gly450 455 460Lys Glu Thr Gln Pro Gly Cys Gln Ser Leu Gln Cys Asn Gln Cys Ala465 470 475 480Tyr Cys Lys Glu Ile Gly Tyr Trp Lys Asn Lys Cys Pro Gln Leu Lys485 490 495Gly Lys Gln Gly Asp Leu Glu Gln Glu Val Pro Asp Lys Glu Glu Gly500 505 510Ala Leu Leu Asn Leu Ala Glu Glu Leu Leu Asp515 520<210>2<211>214<212>PRT<213>Homo sapiens<400>2Met Leu Lys Asn Phe Lys Lys Gly Phe Asn Gly Asp Tyr Gly Val Thr1 5 10 15Met Thr Pro Gly Lys Leu Arg Ile Leu Cys Glu Ile Asp Trp Pro Thr20 25 30Leu Glu Val Gly Trp Pro Ser Glu Gly Ser Leu Asp Arg Ser Leu Val35 40 45Ser Lys Val Trp His Lys Val Thr Gly Lys Ser Gly His Ser Asp Gln50 55 60Phe Pro Tyr Ile Asp Thr Trp Leu Leu Gln Leu Val Gln Asp Pro Pro65 70 75 80Gln Trp Leu Arg Gly Gln Ala Ala Ala Val Leu Val Ala Lys Gly Gln85 90 95Ile Ala Lys Glu Gly Ser Arg Ser Thr His Trp Gly Lys Ser Thr Pro100 105 110Glu Val Leu Phe Asp Pro Thr Ser Glu Asp Pro Leu Gln Glu Met Ala115 120 125Pro Val Ile Pro Val Leu Pro Ser Pro Tyr Gln Ala Glu Arg Leu Pro130 135 140Thr Phe Glu Pro Thr Val Leu Val Pro Pro Gln Asp Lys His Ile Pro145 150 155 160Arg Pro Pro Arg Val Asp Lys Arg Gly Gly Glu Ala Ser Gly Glu Thr165 170 175Pro Pro Leu Ala Ala Cys Leu Arg Pro Lys Thr Gly Ile Gln Met Pro180 185 190Leu Arg Glu Gln Arg Tyr Thr Gly Ile Glu Glu Asp Gly His Met Val195 200 205Glu Lys Arg Val Phe Val210<210>3<211>1183<212>PRT<213>Homo sapiens<400>3Met Ala Arg Met Thr Val Gly Gly Lys Asp Ile Asp Phe Leu Val Asp1 5 10 15Thr Gly Ala Glu His Ser Val Val Thr Ala Pro Val Ala Pro Leu Ser20 25 30Lys Lys Thr Ile Asp Ile Ile Gly Ala Met Gly Val Ser Ala Lys Gln35 40 45Ala Phe Cys Leu Pro Arg Thr Cys Thr Val Gly Gly His Lys Val Ile50 55 60His Gln Phe Leu Tyr Met Pro Asp Cys Pro Leu Pro Leu Leu Gly Arg65 70 75 80Asp Leu Leu Ser Lys Leu Arg Ala Thr Ile Ser Phe Thr Glu His Gly85 90 95Ser Leu Leu Leu Lys Leu Pro Gly Thr Gly Val Ile Met Thr Leu Thr100 105 110Val Pro Arg Glu Glu Glu Trp Arg Leu Phe Leu Thr Glu Ser Gly Gln115 120 125Glu Ile Arg Pro Ala Leu Ala Lys Arg Trp Pro Arg Val Trp Ala Glu130 135 140Asp Asn Pro Pro Gly Leu Ala Val Asn Gln Ala Pro Val Leu Ile Glu145 150 155 160Val Lys Pro Gly Ala Gln Pro Val Arg Gln Lys Gln Tyr Pro Val Pro165 170 175Arg Glu Ala Leu Glu Gly Ile Gln Val Pro Leu Lys Cys Leu Arg Thr180 185 190Phe Gly Met Ile Val Pro Cys Gln Ser Pro Trp Asn Thr Pro Leu Leu195 200 205Pro Val Pro Glu Pro Lys Thr Lys Asp Tyr Trp Pro Gly Gln Asp Leu210 215 220Arg Leu Val Lys Gln Ala Thr Val Thr Leu His Pro Ala Val Pro Asn225 230 235 240Pro Tyr Thr Leu Leu Gly Leu Leu Pro Ala Glu Asp Ser Cys Phe Thr245 250 255Cys Leu Asp Leu Lys Asp Ala Phe Phe Ser Ile Arg Phe Ala Pro Glu260 265 270Ser Gln Lys Leu Phe Ala Phe Gln Trp Glu Asp Pro Glu Ser Gly Val275 280 285Thr Thr Gln Tyr Thr Trp Thr Trp Leu Pro G1n Gly Phe Lys Asn Ser290 295 300Pro Thr Ile Phe Gly Glu Glu Leu Ala Arg Asp Leu Gln Lys Cys Pro305 310 315 320Thr Arg Asp Leu Gly Cys Val Leu Leu Gln Tyr Val Asp Asp Leu Leu325 330 335Leu Gly His Pro Thr Ala Val Gly Cys Ala Lys Gly Thr Asp Ala Leu340 345 350Leu Arg His Leu Glu Asp Cys Gly Tyr Lys Val Ser Lys Lys Lys Ala355 360 365Gln Ile Cys Arg Pro Gln Val Arg Tyr Leu Gly Phe Thr Ile Arg Gln370 375 380Gly Glu Arg Ser Leu Gly Ser Glu Arg Lys Gln Val Ile Cys Thr Leu385 390 395 400Pro Glu Pro Lys Ser Arg Lys Gln Val Arg Lys Phe Leu Gly Ala Ala405 410 415Gly Phe Cys Arg Leu Trp Ile Pro Asn Phe Ala Val Leu Ala Lys Pro420 425 430Leu Tyr Glu Val Thr Lys Trp Gly Asp Arg Glu Pro Phe Glu Trp Gly435 440 445Ser Gln Gln Gln Gln Ala Phe Arg Glu Leu Lys Glu Lys Leu Met Ser450 455 460Ala Pro Ala Leu Gly Leu Pro Asn Leu Thr Lys Pro Phe Thr Leu Tyr465 470 475 480Val Ser Glu Arg Glu Lys Met Ala Val Arg Val Leu Thr Gln Thr Val
485 490 495Gly Pro Trp Pro Arg Pro Val Ala Tyr Leu Ser Lys Gln Leu Asp Gly500 505 510Val Ser Lys Gly Trp Pro Pro Cys Leu Arg Ala Leu Ala Ala Thr Ala515 520 525Leu Leu Val Gln Glu Ala Val Lys Leu Thr Leu Gly Gln Asn Leu Asn530 535 540Ile Lys Ala Pro His Ala Met Val Thr Leu Ile Asn Thr Lys Gly His545 550 555 560His Trp Leu Thr Asn Ala Arg Leu Thr Lys Tyr Gln Ser Leu Leu Cys565 570 575Glu Asn Pro Arg Ile Thr Ile Glu Ile Cys Asn Thr Leu Asn Pro Thr580 585 590Thr Leu Leu Leu Val Ser Glu Gly Pro Val Glu His Asp Cys Val Glu595 600 605Val Leu Asp Ser Val Tyr Ser Ser Arg Pro Asp Leu Gln Asp Gln Pro610 615 620Trp Ala Pro Val Asp Trp Glu Leu Tyr Met Asp Gly Gly Ser Phe Ile625 630 635 640Asn Pro Gln Gly Glu Arg Gly Ala Gly Tyr Ala Val Val Thr Leu Asp645 650 655Thr Val Val Glu Ala Arg Ser Leu Pro Gln Ala Thr Ser Ala Gln Lys660 665 670Ala Glu Leu Ile Ala Phe Ile Arg Ala Leu Glu Leu Ser Glu Gly Glu675 680 685Thr Val Asn Ile Tyr Thr Asp Ser Arg Tyr Pro Phe Leu Thr Leu Gln690 695 700Val His Glu Ala Ser Tyr Lys Glu Lys Gly Leu Leu Asn Ser Gly Gly705 710 715 720Lys Asp Ile Lys Tyr Gln Gln Glu Ile Leu Gln Leu Leu Glu Ala Val725 730 735Trp Lys Pro His Lys Val Ala Val Met His Cys Arg Gly His Gln Arg740 745 750Ala Ser Thr Leu Val Gly Leu Gly Asn Ser Arg Ala Asp Ala Arg Lys755 760 765Ala Ala Ser Ala Pro Phe Arg Ala Ser Val Thr Ala Pro Leu Leu Pro770 775 780Gln Ala Pro Asp Leu Leu Pro Thr Tyr Ser Lys Glu Glu Lys Asp Phe785 790 795 800Leu Gln Ala Glu Gly Gly Gln Val Met Glu Glu Gly Trp Ile Arg Leu805 810 815Pro Asp Gly Arg Glu Ala Val Pro Gln Leu Leu Gly Ala Ala Val Val820 825 830Leu Ala Val His Lys Thr Thr His Leu Gly Gln Glu Ser Leu Glu Lys835 840 845Leu Leu Val Arg Tyr Phe Tyr Ile Leu His Leu Ser Ala Leu Ala Lys850 855 860Thr Val Thr Gln Arg Cys Val Thr Cys Pro Lys His Asn Ala Lys Gln865 870 875 880Gly Pro Ala Val Pro Pro Val Ile Gln Ala Tyr Gly Ala Ala Pro Phe885 890 895Glu Asp Val Gln Val Asp Phe Thr Glu Met Pro Lys Cys Gly Gly Asn900 905 910Lys Tyr Leu Leu Val Leu Val Cys Thr Tyr Ser Gly Gly Trp Arg Leu915 920 925Ile Gln His Lys Leu Arg Lys Leu Val Lys Leu Thr Cys Val Leu Leu930 935 940Arg Asp Pro Ile Pro Arg Phe Gly Leu Pro Leu Arg Ile Gly Ser Asp945 950 955 960Asn Gly Pro Ala Phe Val Ala Asp Leu Val Gln Lys Arg Ala Lys Val965 970 975Leu Gly Asn Thr Trp Lys Leu His Ala Ala Tyr Arg Pro Gln Ser Ser980 985 990Gly Lys Val Glu Gln Met Asn Trp Thr Ile Lys Asn Ser Lys Gly Lys995 10001005Val Cys Gln Glu Thr Gly Leu Lys Trp Ile Gln Ala Leu Pro Met1010 1015 1020Val Leu Phe Lys Ile Arg Cys Thr Pro Ser Lys Arg Thr Gly Tyr1025 1030 1035Ser Pro Tyr Glu Ile Leu Tyr His Arg Pro Pro Pro Ile Leu Arg1040 1045 1050Gly Leu Pro Gly Thr Pro Arg Glu Leu Gly Glu Ile Glu Leu Gln1055 1060 1065Arg Gln Leu Gln Ala Leu Gly Lys Ile Thr Gln Thr Ile Ser Ala1070 1075 1080Trp Val Asn Glu Arg Cys Pro Val Ser Leu Phe Ser Pro Val His1085 1090 1095Pro Phe Ser Pro Gly Asn Arg Val Trp Ile Lys Asp Trp Asn Val1100 1105 1110Ala Ser Leu Cys Pro Arg Trp Lys Gly Pro Gln Thr Val Ile Leu1115 1120 1125Thr Thr Pro Thr Ala Val Lys Val Glu Gly Val Pro Ala Trp Ile1130 1135 1140His His Ser Arg Val Lys Pro Ala Val Pro Glu Thr Ser Glu Val1145 1150 1155Arg Pro Ser Pro Glu Asp Pro Cys Arg Val Thr Leu Lys Lys Thr1160 1165 1170Thr Ser Pro Ala Pro Val Thr Pro Gly Ser1175 1180<210>4<211>179<212>PRT<213>Homo sapiens<400>4Met Leu Asn Gln Ile Ile Arg Leu Gln Thr Val Leu Glu Ile Ile Thr1 5 10 15Asn Glu Thr Gly Arg Ala Leu Thr Val Leu Ala Arg Gln Glu Thr Gln20 25 30Met Arg Asn Ala Ile Tyr Gln Asn Arg Leu Ala Leu Asp Tyr Leu Leu35 40 45Ala Ala Glu Gly Gly Val Cys Gly Lys Phe Asn Leu Thr Asn Cys Cys50 55 60Leu Gln Ile Asp Asp Gln Gly Gln Val Ile Glu Asn Ile Val Arg Asp65 70 75 80Met Thr Lys Leu Ala His Thr Pro Ile Gln Val Trp His Lys Phe Asp85 90 95Pro Glu Ser Leu Phe Gly Lys Trp Phe Pro Ala Ile Gly Gly Phe Lys100 105 110Thr Leu Ile Val Gly Val Leu Leu Val Ile Arg Thr Cys Leu Leu Leu115 120 125Pro Cys Val Leu Pro Leu Leu Phe Gln Met Ile Lys Gly Ile Val Ala130 135 140Thr Leu Val His Gln Lys Thr Ser Ala His Val Asn Tyr Met Asn His145 150 155 160Tyr Arg Ser Ile Ser Gln Arg Asp Ser Lys Ser Glu Asp Glu Ser Glu165 170 175Asn Ser His<210>5<211>682<212>PRT<213>Homo sapiens<400>5Met Arg Lys Leu Ile Val Gly Phe Ile Phe Leu Thr Phe Trp Thr Tyr1 5 10 15Thr Val Arg Ala Ser Thr Asp Leu Thr Gln Thr Gly Asp Cys Ser Gln20 25 30Ser Ile His Gln Val Thr Glu Val Gly Gln Gln Ile Lys Thr Asn Phe35 40 45Leu Phe Tyr Ser Tyr Tyr Glu Cys Met Gly Thr Leu Lys Glu Thr Cys50 55 60Leu Tyr Asn Ala Thr Gln Tyr Lys Val Cys Ser Pro Gly Asn Asp Arg65 70 75 80Pro Asp Val Cys Tyr Asn Pro Ser Glu Pro Pro Ala Thr Thr Val Phe85 90 95Glu Ile Arg Leu Arg Thr Gly Leu Phe Leu Gly Asp Thr Ser Lys Ile100 105 110Ile Thr Arg Thr Val Glu Lys Gly Ile Pro Lys Gln Ile Thr Leu Arg115 120 125Phe Asp Ala Arg Ala Ala Ile Asn Ser Asn Lys Leu Gly Thr Arg Cys130 135 140Gly Ser Leu Asn Trp Glu Arg Ser Tyr Thr Val Gln Asn Lys Tyr Val145 150 155 160Cys His Glu Ser Gly Val Cys Glu Asn Cys Ala Phe Trp Pro Cys Val165 170 175Ile Trp Ala Thr Trp Lys Lys Asn Lys Lys Asp Pro Val His Leu Gln180 185 190Lys Gly Glu Ala Asn Pro Ser Cys Ala Ala Gly His Cys Asn Pro Leu195 200 205Glu Leu Ile Ile Thr Asn Pro Leu Asp Pro Pro Trp Lys Lys Gly Glu
210 215 220Arg Val Thr Leu Gly Ile Asp Gly Thr Gly Leu Asn Pro Gln Val Ala225 230 235 240Ile Leu Val Arg Gly Glu Val His Lys Arg Ser Pro Lys Pro Val Phe245 250 255Gln Thr Phe Tyr Glu Glu Leu Asn Leu Pro Ala Pro Glu Leu Pro Lys260 265 270Lys Thr Lys Ser Leu Phe Leu Gln Leu Ala Gly Asn Val Ala His Ser275 280 285Leu Asn Val Thr Ser Cys Tyr Val Cys Arg Gly Thr Thr Ile Gly Asp290 295 300Arg Trp Pro Trp Glu Ala Arg Glu Leu Val Pro Thr Asp Pro Ala Pro305 310 315 320Asp Ile Ile Pro Val Gln Lys Ala Gln Ala Ser Asn Phe Trp Val Leu325 330 335Lys Thr Ser Ile Ile Gly Gln Tyr Cys Ile Ala Arg Glu Gly Lys Glu340 345 350Phe Ile Val Pro Val Gly Lys Leu Asn Cys Ile Gly Gln Lys Leu Tyr355 360 365Asn Ser Thr Thr Lys Thr Ile Thr Trp Trp Gly Leu Asn His Thr Glu370 375 380Lys Asn Pro Phe Ser Lys Phe Ser Lys Leu Lys Thr Ala Trp Ala His385 390 395 400Pro Glu Ser His Gln Asp Trp Thr Ala Pro Thr Gly Leu Tyr Arg Ile405 410 415Cys Gly His Thr Ala Tyr Ile Gln Leu Pro Asn Lys Trp Ala Gly Ser420 425 430Cys Val Ile Gly Thr Ile Lys Leu Ser Phe Phe Leu Leu Pro Ile Lys435 440 445Thr Gly Glu Leu Leu Gly Phe Arg Val Tyr Thr Ser Arg Glu Lys Arg450 455 460Gly Ile Val Ile Gly Asn Trp Lys Asp Asn Glu Trp Pro Pro Glu Arg465 470 475 480Ile Ile Gln Tyr Tyr Gly Pro Ala Thr Trp Val Gln Asp Gly Ser Trp485 490 495Gly Tyr Gln Thr Pro Ile Tyr Met Leu Asn Gln Ile Ile Arg Leu Gln500 505 510Thr Val Leu Glu Ile Ile Thr Asn Glu Thr Gly Arg Ala Leu Thr Val515 520 525Leu Ala Arg Gln Glu Thr Gln Met Arg Asn Ala Ile Tyr Gln Asn Arg530 535 540Leu Ala Leu Asp Tyr Leu Leu Ala Ala Glu Gly Gly Val Cys Gly Lys545 550 555 560Phe Asn Leu Thr Asn Cys Cys Leu Gln Ile Asp Asp Gln Gly Gln Val565 570 575Ile Glu Asn Ile Val Arg Asp Met Thr Lys Leu Ala His Thr Pro Ile580 585 590Gln Val Trp His Lys Phe Asp Pro Glu Ser Leu Phe Gly Lys Trp Phe595 600 605Pro Ala Ile Gly Gly Phe Lys Thr Leu Ile Val Gly Val Leu Leu Val610 615 620Ile Arg Thr Cys Leu Leu Leu Pro Cys Val Leu Pro Leu Leu Phe Gln625 630 635 640Met Ile Lys Gly Ile Val Ala Thr Leu Val His Gln Lys Thr Ser Ala645 650 655His Val Asn Tyr Met Asn His Tyr Arg Ser Ile Ser Gln Arg Asp Ser660 665 670Lys Ser Glu Asp Glu Ser Glu Asn Ser His675 680
权利要求
1.一种分离的人白血病相关逆转录病毒基因组GAG基因编码的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.1所示的氨基酸序列或其片段,或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。
2.如权利要求1所述病毒蛋白多肽,其特征在于与肿瘤病毒癌基因v-abl高度同源,具有SEQ ID NO.2所示的氨基酸序列或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。
3.一种分离的人白血病相关逆转录病毒基因组POL基因编码的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.3所示的氨基酸序列或其片段,或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。
4.如权利要求3所述的病毒蛋白多肽,其特征在于与肿瘤病毒癌基因v-src高度同源,具有SEQ ID NO.4所示的氨基酸序列或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。
5.一种分离的人白血病相关逆转录病毒基因组ENV基因编码的病毒蛋白多肽,其特征在于,它具有SEQ ID NO.5所示的氨基酸序列或其片段,或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。
6.一种用于检测样本中是否存在人白血病相关逆转录病毒基因组编码的病毒蛋白的方法,其特征在于利用了权利要求1-5中任一项所述病毒蛋白多肽。
7.权利要求6所述的方法,其中包括利用权利要求1-5中任一项所述病毒蛋白多肽制备相应的单克隆抗体或多克隆抗体。
8.一种用于阻抑人白血病相关逆转录病毒方法,其特征在于利用了权利要求1-5中任一项所述病毒蛋白多肽。
9.权利要求8所述的方法,其中包括利用权利要求1-5中任一项所述病毒蛋白多肽制备相应的单克隆抗体或多克隆抗体;以及利用所得单克隆抗体或多克隆抗体直接封闭该病毒基因组编码的多种活性病毒蛋白多肽。
10.权利要求8所述的方法,其中包括利用了权利要求1-5中任一项所述病毒蛋白多肽,中的功能域寻找和设计相应的药物来阻断或抑制病毒。
全文摘要
本发明涉及与人白血病病因、发病机理及治疗有关的逆转录病毒基因组编码的新蛋白质,其具有SEQ ID NO.1、3或5所示的氨基酸序列或其片段,或为与其同源性在95%以上的具有相同或相似生物学功能的病毒蛋白多肽变体或衍生物。本发明还涉及该病毒基因组编码的病毒蛋白质和多肽序列的制备方法。本发明还涉及一种用于检测样本中是否存在人白血病相关逆转录病毒基因组编码的病毒蛋白的方法和一种用于阻抑人白血病相关逆转录病毒方法。
文档编号A61P35/02GK1461752SQ02121790
公开日2003年12月17日 申请日期2002年5月31日 优先权日2002年5月31日
发明者徐荣臻, 郑树, 钟睒睒 申请人:浙江养生堂天然药物研究所有限公司, 浙江大学医学院附属第二医院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1