抑制hiv复制的突变型apobec3g分子及其应用的制作方法

文档序号:3477100阅读:489来源:国知局

专利名称::抑制hiv复制的突变型apobec3g分子及其应用的制作方法
技术领域
:本发明属于生物工程领域,涉及一种抑制HIV复制的突变型APOBEC3G分子及其应用。技术背景阿朴脂蛋白BmRNA编辑的酶催化多肽类3G(APOBEC3G,A3G),最初被确定为CEM15,是一种具有很强的抗病毒活性的宿主细胞蛋白(Sheehyetal.,2002)。在新合成的负链DNA中,脱氨基脱氧胞苷(dC)转变为脱氧尿苷(dU),引起病毒正链DNA的G到A的超突变,从而抑制多种逆转录酶病毒感染,参见Harrisetal.《细胞》.113(6),803-809(2003)。APOBEC3G基因是胞啶脱氧酶基因家族的一员。它是在基因簇中发现的七种相关基因或假基因之一,被认为是染色体22上的基因复制的结果。蛋白质被认为可能是RNA编译的酵,可促进生长或进行细胞周期控制。该基因编码的蛋白质已被发现在缺乏病毒体感染因子(V泡)的情况下,能对人体免疫缺陷病毒-1(HIV-1)和一些猿免疫缺陷病毒感染进行特效的抑制。人们已知HIV-1病毒体感染因子(Vif)保护病毒的复制免受诱使HIV-1基因组超变异的宿主限制因子的影响。参见Lecossieretal.,《科学》300,1112(2003);M旭geatetal.,《自然》424,99-103(2003);Zhangetal.,《自然》424,94-98(2003);Harrisetal.,《细胞》113,803-809(2003)。病毒体感染因子粘结在APOBEC3G上,促使其迅速降解,这样,就将它从细胞中清除出去,并防止它进入HIV-1病毒体。Vif包含两个域,一个粘结在APOBEC3G上,另--个带有保守的SLQ(Y/F)LA基序,可以通过以蛋白酶依赖的方式,调节APOBEC3G的降解。参见Kabatetal.,美国专利出版号2004/0234956.最近的研究显示,在人类和非洲绿猴的第128位上的单氨基酸变化,控制着这些蛋白质对Vif引介的病毒特异性的抑制。参见Mangeatetal.,/历o/Oie加.2004年4月9Fh279(15):14481-3.Epub2004年2月13日。此外,Vif对APOBEC3G的种类特异性,经证明是由第128位的单氨基酸变化决定的。参见Schrofelbaueretal.,/VocJVa//^corf&i'f/SA2004年3月16闩;101(11):3927-32。Epub2004年2月20日。虽然进行了这些研究及其它一些针对第128位的交换的研究,但是通过转变其它氨基酸来抑制降解,从而减少APOBEC3G的结合或抑制,这方面的努力并没能清楚地阐明。对于Vif人们巳经知道了很多,它与APOBEC3G相结合,促发了APOBEC3G的多泛素化和快速降解。参见NavarroandLandau^Cw/rC^w'n/附/m/朋/.2004年8月;16(4):477-82.人类免疫细胞拥有一个内在的机制,可以潜在地阻止诸如HIV-1等的逆转录酶病毒的复制。这个保护机制以APOBEC3G为中心,进入到病毒体中,最终能中止HIV完成--'个生命周期。然而,HIV-l具有一种可专门抑制APOBEC3G活性的蛋白Vif。Vif是通过对细胞内APOBEC3G的储藏损耗来抑制其活性的,因此,使得这种抗病毒酶无法进入出芽的病毒体。APOBEC3G损耗包括通过Vif补充一种特殊的E3连接酶复合物,促使这种酶的多泛素化、及蛋白酶介导的这种酶的降解来实现。APOBEC3G的有效活性使得人们将浓厚的兴趣投在发现能中断Vif引发的降解过程的小分子上面。参见StopakandGreene,Cw/rCjpi"/"ve甜gZ)rwgj.2005年2月;6(2):141誦7。相应地,抑制Vif引发的APOBEC3G降解过程以及研制出抑制HIV复制的方法的需求也存在着。因此,人们需要的是一个蛋白分子,它可以抵抗Vif引发的降解,从而防止HIV-1和/或HIV-2的感染。
发明内容本发明的目的是提供一种能够抑制HIV复制的突变型APOBEC3G分子。本发明另一个目的是提供上述突变型APOBEC3G分子在制备抗HIV病毒药物中的应用。本发明的目的是通过下列技术措施来实现的—种突变型人类APOBEC3G蛋白质,该蛋白质为(a)或(b):(a).由SEQIDNo.2、4、6或8所示的氨基酸序列组成的蛋白质;(b).在(a)中的氨基酸序列至少有一个或多个氨基酸替代,同时第129位的替代为D或F或其他的除了P以外的氨基酸,且能抵抗HIV-Vif引发的蛋白酶降解的由(a)衍生的蛋白质。编码上述突变型人类APOBEC3G蛋白质的核苷酸。所述的核苷酸,该核苷酸是(a)或(b):(a),序列为SEQIDNo.l、3、5或7的核苷酸;(b).在严格条件下与(a)限定的DNA核苷酸序列杂交且编码具有抵抗HIV-Vif引发的蛋白酶降解功能的变异的APOBEC3G蛋白质的核苷酸。含有上述核苷酸的表达载体。含有上述核苷酸的重组宿主细胞。上述蛋白质的特异性抗体。含有有效治疗剂量的上述蛋白质、核苷酸、表达载体、重组宿主细胞或特异性抗体的药物。含有上述蛋白质、核苷酸、表达载体、重组宿主细胞或特异性抗体的试剂盒。上述的突变型人类APOBEC3G蛋白质在制备抗HIV病毒药物中的应用。上述的核苷酸在制备抗HIV病毒药物中的应用。名词术语解释除非本文另有定义,与本发明相关的科技术语应采用业内具有普通技能者一般理解的含义。此外,除非在特定环境下另有要求,单数的术语应包含复数含义,复数的术语应包含单数含义。通常,本文中所述的与生物化学、酶学、分子和细胞生物学、微生物学、基因学、蛋白质、核酸化学及杂交相关的术语及技术在业内是众所周知和普遍使用着的。本发明中的方法和技术一般依据业内知名的常规方法及在现有规范中引用和讨论过的各种通用的或更加专业的参考文献中所描述的执行,除非另有说明。参见例如SambrookWfl/.《分子克隆法实验室指南》,第二版,冷泉港实验室出版社,纽约冷泉港(1989);Ausubelwa/.,《分子生物学现行草案》,GreenePublishingAssociates(1992,及2002年增刊);HarlowandLane,《抗体实验室指南》,冷泉港实验室出版社,冷泉港,纽约(19卯)TaylorandDrickamer,《糖生物学介绍》,牛津大学出版社(2003);《Worthington酶指南》,Worthington生化公司,Freehold,新泽西州;《生化便览第一节蛋白质》,巻一,CRC出版社(1976);《生化便览第一节蛋白质》,巻二,CRC出版社(1976);《糖生物学基础》,冷泉港实验室出版社(1999)。本文所提及的所有的出版物、专利和其它参考文献都纳入本文作为全文参考。以下的术语,除非另有说明,应理解为具有以下的含义术语"多聚核苷酸"或"核苷酸分子"指多聚体形式的核苷酸,长度为至少10个碱基。该术语包括DNA分子(例如cDNA、或基因组、或合成的DNA)及RNA分子(例如mRNA或合成的RNA),及含有非天然核苷相似体、非天然核苷酸间键合、或同时含有两者的DNA或RNA的相似体。核酸可以是任何拓朴结构的。比方说核酸可以是单链、双链、三链、四链、部分双链、枝形、簪形、环形或U形的构造。除非另有说明,"含有序列标识号:X的核酸"指一种核酸,它至少有一部分或者是(i)序列标识号:X序列,或者是(ii)序列标识号:X的互补序列。对于两者的选择视具体情况而定。例如如果核酸作为探针使用,那么对于两者的选择由探针对理想目标的互补需要决定。一个"孤立的"或"近乎纯粹的"核酸或多核苷酸(例如RNA,DNA或混合的聚合体)是与其它的细胞成分显著分离的,在其宿主细胞内,天然伴生着天然多核苷酸,例如与其有着天然关联的核糖体、聚合酶和基因组序列等。该术语包含核酸或多核苷酸,其(l)已经远离了天然存在的环境,(2)与多核苷酸的整体或部分没有联系,从本质上看是"孤立的多核苷酸",(3)与天然不相联系的多核苷酸有效联接着,或(4)不会天然的存在。术语"孤立的"或"近乎纯粹的"还可以用在重组细胞或克隆DNA的分离上、用化学方法合成的多核苷酸相似体、或可通过异质系统进行生物合成的多核苷酸相似体上。然而,"孤立的"不特别要求上述的核酸或多核苷酸本身从其天然环境中分离出来。例如如果异源序列的位置邻近内生的核酸序列,那么生物体基因组中内生的核酸序列被认为是内在的"孤立的",这样,内生的核酸序列的表达就改变了。在这种情况下,不管异源序列本身是否是内生的(起源于同一宿主细胞或其子代),或外生的(起源于不同的宿主细胞或子代)。异源序列不是天然性地邻近内生核酸序列的。举例来说,启动子序列可以用来替换(例如通过同源重组)宿主细胞基因组中的基因的天然启动子,这样,这个基因就有了一个改变了的表达方式。这个基因由于至少从与其天然相邻的一些序列中分离开来,现在变为"孤立的"。核酸如果包含了--些相对于基因组中的相应核酸是非天然性的修饰,那么也被视为是"孤立的"。例如内生的编码序列如果包含插入、删除、或人工介导的点突变,例如通过人为的干涉,那么被认为是"孤立的"。"孤立的核酸"还包括在异源位点与宿主细胞染色体结合起来的核酸,及结构显现为游离体的核酸。此外,当采用重组技术制造时,"孤立的核酸"可以充分地脱离于其它的细胞物质,或充分地脱离培养基,或当使用化学法合成时,可以充分地脱离于化学前体或其它化学物。按照本文的用法,短语"简并变异体",在参照核酸序列中,依据标准遗传密码,包含可以转译的核酸序列,以提供与参照核酸序列的转译结果相同的氨基酸序列。术语"简并寡核苷酸"或"简并引物"用来表示能够与目标核酸序列相杂交的寡核苷酸,序列不必是相同的,但是对于一个或更多的特定的片段,应是彼此同源的。在核酸序列的情况下,术语"百分比序列匹配率"或"一致的"指在最大化对应状态下相同的两个序列的残基。序列匹配率比对的长度可以是至少大约9个核苷的长度,通常为至少大约20个核苷,更常见的是至少大约24个核苷,典型地,至少大约28个核苷,更为典型地,至少大约32个核苷,适宜地,至少大约36个或更多的核苷。在技术上己经知道了一些不同的运算法则,可以用来测量核苷酸序列匹配率。例如多核苷酸序列可以采用FASTA,Gap或Bestfit进行比对,这些程序采用位于威斯康星州麦迪逊市的遗传学计算机集团(GCG)的WisconsinPackage10.0版本编写而成。FASTA提供了査询与检索序列间的最佳交叠区域的对准和百分比序列匹配率。参见Pearson,她决o&五nzymo/.183:63-98(1990)(引入本文作为全文参考)。例如核酸序列之间的百分比序列匹配率可以使用带有缺省参数的FASTA进行测定(单词长度为6及计分矩阵的NOPAM因子),或使用带有GCG6.1版所提供的缺省参数的Gap,引入本文以备参考。序列的比对还可以选择性地使用计算机程序BLAST(参见AltechulWa/.,/Afo/.历o/.215:403-410(19卯);GishandStates,A/irfwreGew拔3:266-272(1993);MaddenWa/.,£ngww/.266:131-141(1996);AltschulWa/.,M/c/c爿cf必及饥25:3389-3402(1997);ZhangandMadden,及战7:649-656(1997)),特别地,blastp或tblasto(Altschula/.,M/c/efcy4Vfc及饥25:3389-3402(1997))。术语"实质的同源"或"实质的相似",当涉及核酸或核酸片段时,表示,当用适宜的核苷插入或删除来调整到最佳状态时,与另一个核酸(或它的互补链)间,根据使用任何一种著名的序列匹配率运算法则测量所得,例如上文讨论的FASTA,BLAST或Gap,核酸序列匹配率为至少大约卯%,更适宜的为95%,通常至少大约96%,更常见的,至少大约80%,适宜的,至少大约卯°/。,而更适宜的,至少大约95%,96%,97%,98%或99%。或者,当一个核酸或核酸片段与另一个核酸、另一个核酸的链、或互补链进行杂交时,在严格的杂交状态下,存在着实质的同源或相似。在核酸杂交试验条件下,"严格的杂交状态"和"严格的洗涤状态"依赖于多个不同的物理参数。核酸杂交会受到诸如含盐浓度、温度、溶剂、杂交品种的碱基组成、互补区域长度、及杂交的核酸之间的核苷碱基错配等的多种条件的影响,业内技术娴熟者可以轻易地发现这些问题。业内具有普通技能的人知道怎样来改变这些参数,以实现特定的杂交严格度。一般来说,对于一组特殊条件下的特定的DNA杂交,"严格的杂交"在大约25。C的热熔点(Tm)以下执行。对于一组特殊条件下的特定DNA杂交,"严格的洗涤"在大约5。C低于Tm的温度范围内执行。在Tm这一温度下,50%的目标序列与完美匹配的探针进行杂交。参见Sambrooketal.,《分子克隆法实验室指南》第二版,冷泉港实验室出版社,纽约冷泉港(1989),第9.51页,引入本文以备参考。为实现文中所述目的,"严格的条件"定义为溶液相杂交,例如水相杂交,(即不含甲酰胺),溶液为6XSSC(20XSSC含3.0M氯化钠和0.3M柠様酸钠),in/。SDS在65。C时放置8-12小时,接着采用两种洗涤剂,为0.2乂88(:,0.1%808在65°€:时放置20分钟。娴熟的技术工人会发现,杂交在65。C时发生,杂交的速率是不同的,取决于杂交序列的长度和百分比匹配率等多项因素。本发明中的核酸(也指多核苷酸)可以同时包括RNA、cDNA、基因组DNA的正义链和反义链、及它们的合成形态及混合态聚合体。它们可以通过化学或生化方法进行修饰,或包含非天然的或衍生的核苷碱基,业内技术娴熟者可以轻易地发现它们。上述的修饰包括,例如一个或多个天然生成的带有相似物的核苷酸的示踪、甲基化、及替换,及寡核苷酸修饰,例如无电荷联接(如甲基膦酸酯、phosphotriesters,phosphoramidates,氨基甲酸盐等)、电荷联接(如phosphorothioates,phosphorodithioates等)、未定部分(如多肽)、插层剂(如吖啶、补骨脂素等)、螯合剂、烷基类、及经过修饰的联接(如a-异构核酸等),还包括能够模仿多核苷酸,通过氢键结合及其它化学反应,与指定序列相结合的合成分子。这些分子是业内已知的,包括例如在分子骨架上,用肽键替换了磷酸盐键的那些分子。其它的修饰包括例如相似物,其核糖环含有桥层部分或其它的诸如在"锁定"核酸中发现的修饰结构。术语"变异的",当应用于核酸序列时,指核酸序列中的核苷,与参照核酸序列相对照,可以是插入、删除或改变的。单独的改变可以是在一个位点(点突变),或多个核苷在单一的位点被插入、删除或改变。此外,一个或多个改变可以在核酸序列内的任何数量的位点上发生。核酸序列可以采用业内任何已知的方法进行转变,包括但不限于突变形成技术如"错误倾向PCR"(在DNA聚合酶的复制保真度低的条件下,执行PCR的过程,因此,延PCR产品全长可获取高的点突变率;参见例如LeungWfl/.,《技术》,1:11-15(1989),和CaldwellandJoyce,《PCR方法应用》.2:28-33(1992));及"寡核苷酸引导的突变"(能使任何克隆的DNA目的片段上发生位点特异性突变的过程;参见:例如Reidh咖-OlsonandSauer,《科学》241:53-57(1988》。术语"载体"在本文中指一个核酸分子能够将另一个核酸运送到其联接区。一类载体是"质粒",指环状双链DNA环,上面可以接入额外的DNA片段。其它载体包括co咖ids、细菌染色体(BAC)和酵母人工染色体(YAC)。另一类载体是病毒载体,在上面可以接入额外的DNA片段,运送到病毒基因组内(下文详细论述)。特定的载体可以在它们引介的宿主细胞上自行复制(例如具有复制起点的载体在宿主细胞内进行复制)。其它载体在引介进入宿主细胞后,可以与宿主细胞的基因组相结合,随后,与宿主基因组-起被复制。此外,特定的优选载体能够指导其有效联接着的基因的表达。这些载体在本文中指"重组表达载体"(或者简言之,"表达载体")。此外,表达载体可以包括额外的元素。例如表达载体可以具有两个复制系统,使它得以在两个生物体中维持,例如在哺乳动物或昆虫细胞内的表达,及在原核宿主内的克隆与扩增。此外,对于表达载体的结合,表达载体包含至少一个与宿主细胞基因组同源的序列,更为适宜的是位于表达结构侧面的两个同源序列。结合的载体可能通过选择与载体内物质相适宜的同源序列,被引介至宿主细胞内的特定的位点。结合的载体的结构是业内所熟知的。一个可供模仿的表达载体系统是逆转录病毒载体,如在PCT/US97/01019和PCT/US97/01048中所概述的,两者均引入本文中以备参考。结构的描述还可参见美国专利第6,153,380号。iF.如文中所使用的,术语"APOBEC3G",是阿朴脂蛋白BmRNA编辑的酶催化多肽类3G的简称,在文中定义为人类蛋白质,通过侵入病毒和破坏病毒的基因物质,可以抑制HIV的复制。病毒蛋白Vif可以从两种途径中断上述过程(1)通过粘合到APOBEC3G上,防止其侵入病毒;及(2)靶向作用APOBEC3G加以破坏,几乎可以将其从细胞中消除干净。术语"标记序列"或"标记基因"指能够表达活动的核酸序列,可以对宿主细胞内的存在或缺乏的序列做出正或负的选择。标记序列或基因无需同时显示IH选择和负选择。表达载体可以包含一个可选的标记基因,以对转化的宿主细胞进行选择。选择基因是业内熟知的,会随着使用的宿主细胞的不同而变化。"有效连锁的"表达控制序列指这样的连锁,它的表达控制序列紧邻目的基因,并控制目的基因,同时表达控制基因在转化中发挥作用,或在远处控制目的基因。本文中使用的术语"表达控制序列"指多核苷酸序列,这些序列对于其有效连锁的编码序列的表达极为重要。表达控制序列是可以控制转录、转录后事件、及核酸序列转译的序列。表达控制序列包括适宜的转录起始、终止、启动子和增强子序列有效的RNA处理信号如剪接和多聚腺苷化信号;稳定细胞质mRNA的序列;增强转译效率的序列(如核糖体粘合位点);增强蛋白质稳定性的序列以及需要时,增强蛋白分泌的序列。此类控制序列的性质依宿全生物体而有疥不同;在原核生物中,此类控制序列通常包括启动子、核糖体结合位点、及转录终止序列。术语"控制序列"希望至少包括所有的其存在对表达至关重要的成分,还可以包括额外的、其存在是有利的成分,例如前导序列和融合伴侣序列。通常,转录与转译调控序列可以包括但不限于启动子序列、核糖结合位点、转录起始与终止序列、转译起始与终止序列、及增强子或激活子序列。举-个具体的例子调控序列包括启动子和转录起始与终止序列。启动子序列对组成型启动子或诱导型启动子进行编码。启动子可以是自然存在的启动子或杂交启动子。杂交启动子,结合了超过一个启动子的元素,也是业内所熟知的,并且对于现有的发明是有用的。本文中使用的术语"重组宿主细胞"(或简称"宿主细胞")指一个已经将目的基因引介到重组载体内的细胞。对这些术语应理解为,细胞不仅指特定的主体细胞,而且指此细胞的后代。因为由于突变或环境影响,特定的修饰可能在后代出现,而事实上,这样的后代与祖细胞是不相同的,但是还包含在本文中使用的术语"宿主细胞"的范围之内。重组宿主细胞可以是在培养基中生长的孤立的细胞或细胞系,也可以是在活组织或生物体内存在的细胞。本文中使用的术语"肽"指短多肽,例如典型地小于大约50个氨基酸长、及更为典型地,小于大约30个氨基酸长的多肽。本文中使用的该术语包括相似体以及模仿结构和生物性功能的模拟物。术语"多肽"同时包括自然存在的和非自然存在的蛋白质、和片段、突变体、衍生物及其相似体。例如保守的氨基酸修饰可以完成,虽然这些修饰会改变蛋白质或肽的一级序列,但是通常不改变其功能。保守的氨基酸替换典型地包括在以下群内的替换氨基乙酸、丙胺酸、缬氨酸、异亮氨酸、亮氨酸、天冬氨酸、谷氨酸;天冬酰胺酸、谷氨酸盐、丝氨酸、苏氨酸、赖氨酸、精氨酸、苯基丙氨酸、酪氨酸。修饰(通常不改变一级序列)包括在活的生物体内或在生物体外的多肽的化学衍生,例如乙酰化作用、或羧化作用。还包括转译后的修饰;糖基化,例如通过在多肽合成及处理或进一歩的处理过程中,修饰多肽的糖基化模式而进行的修饰;例如让多肽与可以影响糖基化的酶相接触,例如糖基化的酶如糖基转移酶或糖苷酶等。还包括带有磷酸化的氨基酸残基的序列,例如磷酸酪氨酸、磷酸丝氨酸、或磷酸苏氨酸。术语"孤立的蛋白质"或"孤立的多肽"是一种蛋白质或多肽,由子它的衍生起源或来源,故(1)没有在自然状态下与其有着天然联系的共生的成分相联接,(2)呈现自然界中不存在的纯粹状态,这种纯度可根据其它细胞物质的存在来判断(例如不包含同种类的其它蛋白质)(3)由不同种类的细胞表达,或(4)自然界中不存在(例如在自然中发现的多肽片段,或者包含不是天然存在的氨基酸相似物或衍生物,或者含有非标准的肽键的联接)。因此,在细胞系统中化学合成的或合成的多肽不同于自然起源的细胞,将会被从其天然相连的成分中"孤立"出来。多肽或者蛋白质还可以经过离析,采用业内己知的蛋白净化技术,与天然联系着的成分完全分离。根据这样的定义,"孤立的"不严格要求上述的蛋白质、多肽、肽或寡肽从其天然环境中物理性地移出。文中使用的术语"多肽片段"指经过剪切的多肽,例如相对于全长的多肽,氨基木端和/或羧基水端被剪切。举一个理想的例子,多肽片段是一个连续的序列,其片段的氨基酸序列与天然发生的序列的对应位置相同。片段典型地具有至少5,6,7,8,9或10个氨基酸长,适宜地,至少12,14,16或18个氨基酸长,更适宜地,至少20个贫基酸长,更适宜地,至少25,30,35,4()或45个氨基酸长,更更适宜地,至少50或60个氨基酸长,而更更更适宜地,至少70个氨基酸长。"修饰的衍生"指与一级结构序列大体同源的多肽或片段,但是包括例如在活的生物体内或在生物体外经过化学或生物化学修饰的、或者包含天然多肽没有的氨基酸。这些修饰包括,例如乙酰化作用、羧化作用、磷酸化作用、糖基化、泛素化、标记,例如带放射性核、及各种酶的修饰,业内技术娴熟者可以轻易地发现这些。标记多肽的多种方法及对上述目的有用的替代或标记是业内熟知的,包括放射性同位素如125I,32P,35S,和3H,与作标记的配合基相结合的配合基(如抗体)、荧光团、化学发光剂、酶、及配合基,可作为标记配合基的特殊粘结对的选择取决于敏感度要求,与引物结合的轻易度,稳定度要求,及使用仪器的可获得性。标记多肽的方法是业内熟知的。参见例如Ausubelefa/.,《分子生物学现行草案》,Gree加PublishingAssociates(1992,及2002年增刊)(引入本文以备参考)。术语"融合蛋白"指两个不同的基因通过融合而形成一个基因后表达的产物。含有与异源氨基酸序列结合的多肽或片段的多肽。融合蛋白很有用,因为其结构可以包含来自于两个或更多的不同蛋白质的两个或更多的理想的功能元素。融合蛋白由至少10个来自目的多肽的连续氨基酸构成,更适宜地,至少20或30个氨基酸,更适宜地,至少40,50或60个氨基酸,还要更适宜地,至少75,100或125个氨基酸。囊括了本发明中所有的蛋白质的融合具有特殊的功用。本发明中融合蛋白里面含有的异源多肽至少为6个氨基酸的长度,通常至少8个氨基酸长,有效地,至少15,20和25个氨基酸长。融合包括更大的多肽,如一个IgGFc区域,甚至整个蛋白质,如绿荧光蛋白("GFP")含发色团蛋白具有特殊的功用。融合蛋白可以通过构造对多肽或多肽片段进行编码的核酸序列来重组制造,核酸序列编译出不同的蛋白质,然后对融合蛋白做出表达。替代的做法,融合蛋白可以通过将多肽或多肽片段与另一个蛋白质进行交联,用化学方法制造。本文中使用的术语"抗体"指多肽,至少部分地被至少一个免疫球蛋白基因或片段编码,可以与理想的目的分子进行特殊的结合。本术语包括天然存在的形态,及片段和衍生物。术语"抗体"范围内的片段包括经过各种蛋白酶消化而制造的片段,用化学分裂和/或化学离异法制造或重组制造的,只要片段保持了与目的分子进行特殊粘合的能力。这些片段包括Fab,Fab',Fv,F(ab')2,及单链Fv(scFv)片段。术语范围内的衍生物包括序列中经过了修饰但仍保留着与目的分子进行特殊粘合的能力的抗体(或抗体片段),包括种间嵌合抗体及人源化抗体抗体融合;异聚抗体复合体和抗体融合,如双功能抗体(双特异性抗体)、单链双功能抗体、及内抗体(参见例如《细胞内抗体研究与疾病应用》(Marasco,ed.,Springer-VeriagNewYorl^Inc.,19诉),本文引用全文以备参考)。本文中使用的抗体可以采用任何己知技术制造,包括天然B淋巴细胞培养的产物、杂种细胞培养产物、重组表达系统和噬菌体展示。术语"非肽相似体"指具有与对照多肽相类似的属性的化合物。非肽化合物可以被称为"肽模拟物"或"多肽模拟物",参见例如Jones,《氨基酸和肽合成》,牛津大学出版社(1992);Jung,《组合肽与非肽库便览》,JohnWiley(1997);BodanszkyWfl/.,《肽化学——实用课本》SpringerVerlag(1993);《合成肽用户指南》(Grant,ed.,W.H.FreemanandCo.,1992);Evansa/.,MedCTiew.30:1229(1987);Fauchere,15:29(1986);VeberandFreidinger,7VemfcWewwcz"8:392-396(1985);及上述文献各自的参考资料,均引入本文以备参考。这些化合物经常釆用计算机化分子模型来辅助研制。与本发明中的有用的肽在结构上类似的肽模拟物可以用来产生等量效果,因此被视为本发明的一部分。"多肽突变体"或"突变蛋白质"指与天然或野生型态的蛋白质的氨基酸序列相比照,序列中包含一个或多个氨基酸的插入、复制、删除、重整或替换的多肽。突变蛋白质可以具有一个或多个氨基酸位点替换,在一个位点上的单个氨基酸已经变化为另一个氨基酸,一个或多个插入和域删除,其中,一个或多个氨基酸分别被插入或删除了,在天然生成的蛋白质序列中,和/或氨基端或羧基端其中之一或两者的氨基酸序列截断。与天然生成的蛋白质相比照,突变蛋白质可以具有相同的,但是更为适宜地,具有不同的生物活性。氨基酸替换可以包括以下的U)减少蛋白水解的敏感性,(2)减少氧化敏感性,(3)改变形成蛋白复合体的结合亲和力,(4)改变结合亲和力或酶的活性,及(5)赋予或修饰,使其具有类似相似物的其它的物理化学或功能属性。文中使用的二十种常规的氨基酸及其縮写遵循传统用法。参见《免疫学一一合成》(GolubandGreneds.,SinauerAssociates,Sunderland,Mass,,2nded.1991),引入本文以备参考。二十种常规氨基酸的立体异构体(例如D-贫基酸),非天然氨基酸如0t-、(X-位双取代氨基酸、W-烷基氨基酸、及其它非常规贫基酸也可以作为本发明的多肽的适宜成分。例举一些非常规的氨基酸,包括4-羟(基)脯氨酸、,羧基谷氨酸、e-AWM三甲基赖氨酸、e-M乙酰赖氨酸、0-磷酸丝氨酸、M乙酰丝氨酸、M甲酰甲硫氨酸、3-甲基组氨酸、5-羟(基)赖氨酸、W-甲基精氨酸、及其它类似的氨基酸和亚氨基酸(例如4-羟(基)脯氨酸)。文中使用的多肽符号,依据标准用法与惯例,左手末端对应氨基末端,右手末端对应羧基水端。如果对一个蛋白质编码的核酸序列相似于对另一个蛋白质编码的核酸序列,那么这两个蛋白质是"同源"或是"同源的"。或者,如果两个蛋白质具有"相似的"氨基酸序列,那么一个蛋白质与另--个是同族关系。(因此,术语"同源蛋白质"定义为两个蛋白质具有类似的氨基酸序列。)举一个适宜的例子同源的蛋白质是展示了至少80%序列与野生型蛋白质同源,更适宜地,至少85%的序列同源。还更适宜地,同源的蛋白质的至少86-卯%序列与野生型蛋白质同源。举一个更适宜的例子,同源的蛋白质展示了至少95%,98%,99%或99.9%的序列一致。文中,两个区域的氨基酸序列的同源(特别是关于预见的结构相似)被解释为功能的隐含相似。当引用"同源的"来描述蛋白质或多肽时,不相同的残余的位置通常与保守的氨基酸替换不同。"保守的氨基酸替换"是其中的氨基酸残基被另一个具有类似的化学属性(如电荷或疏水性)的侧链(R群)的氨基酸残基所替换。通常,保守的氨基酸替换不会实质地改变蛋白质的功能属性。在两个或更多的氨基酸序列在进行保守的替换后彼此不相同的情况下,百分比序列匹配率或同源度可以上调,以更正替换的保守性质。进行这种调整的方式是业内技术娴熟者所熟知的。参见例如:Pearson,1994,M"todsMo/.说o/.24:307-331和25:365-389(引入本文以备参考)。以下六个群中每个所包含的氨基酸彼此都可以保守的替换1)丝氨酸(S),苏氨酸(T);2)天冬氨酸(D),谷氨酸(E);3)天冬酰胺酸(N),谷氨酸盐(Q):4)精氨酸(R),赖氨酸(K)5)异亮氨酸(I),亮氨酸(L),蛋氨酸(M),丙胺酸(A),缬氨酸(V),及6)苯基丙氨酸(F),酪氨酸(Y),色氨酸(W)。多肽的序列同源,也指百分比序列匹配率,典型地可以使用序列分析软件来测量。参见例如遗传学计算机集团(GCG)的序列分析软件包,威斯康星州生物技术中心大学,位于威斯康星州麦迪市大学街910号,邮编53705。蛋白质分析软件使用同源测量法将类似的序列配对,分配给各种替换,删除和其它修饰,包括保守的氨基酸替换。例如GCG含有诸如"Gap"和"Bestfit"的程序,可以用来与缺省参数一同测定紧密切相关的多肽之间的序列同源或序列匹配率,例如有机物的不同种类的同源多肽,或野生型蛋白质与变异体之间的同源多肽。参见例如GCG第6.1版。当将特定的多肽序列与包含了来自于不同的生物体的大量序列的数据库相对照时,首选的运算法则是计算机程序BLAST(Altschul"a/.,/Mo/.历o/.215:403410(1990);GishandStates,Atoh^eGe"汰3:266-272(1993);Madden"a/.,Afert.£ngwo/.266:131-141(1996);Altschul"or/.,M/c/c爿ci必及战25:3389-3402(1997);ZhangandMadden,Gewo加g7:649-656(1997)),especiallyblastportblastn(Altschul"fl/.,A^c/ei'cy4ci必及战25:3389-3402(1997)).BLASTp的首选参数包括期待值10(缺省);筛选Seg(缺省);开口成本11(缺省);扩口成本1(缺省);最大调整100(缺省);单词长11(缺省);描述号100(缺省)处罚矩阵BLOWSUM62。进行同源比对的多肽序列的长度通常至少大约16个氨基酸残基,通常至少大约20个残基,更常见地,至少大约24个残基,典型地,至少大约28个残基,适宜地,超过大约35个残基。当从大量的不同的生物体中査找一个包含了序列的数据库时,最好能比对氨基酸序列。使用氨基酸序列来进行数据库检索可以通过运算法则而不是业内己知的其它blastp来测量。例如多肽序列的比对可以使用FASTA,一个GCG第6.1版本的程序。FASTA提供了査询与检索序列之间最佳重合区域的排比和百分比序列匹配率。参见Pearson,A^/w必五ng柳o/.183:63-98(19卯)(纳入本文以备参考)。例如,氨基酸序列之间的百分比序列匹配率可以使用FASTA以及缺省参数来测定(单词长为2,PAM250计分矩阵),按照GCG第6.1版,纳入本文以备参考。"特异性结合"指两个分子在所处环境下优先于与其它分子的结合而彼此结合的能力。典型地,"特异性结合"至少两倍、更典型地至少10倍、通常至少100倍地歧视反应中的偶发的结合。典型地,特异性结合反应的亲和力或活动性,以分裂常数量化表示,大约1(^M或更强(例如大约10'8M、1(^M或更强)。本文使用的术语"区域"指生物分子初级结构的物理相邻部分。在蛋白质情况下,区域定义为蛋白质氨基酸序列的相邻部分。本文使用的术语"域"指属于生物分子的已知或可疑功能的结构。域可以与分子的区域或部分共存,域还可以包括生物分子的明显的,非相邻的区域。例举几个蛋白质域,包括但不限于Ig域、细胞外域、横跨膜域、及细胞质域。文中使用的术语"分子"指任何复合物,包括但不限于,小分子、肽、蛋白质、糖、核苷、核酸、脂质等,此类复合物可以是天然的或合成的。文中使用的术语"突变"指基因或染色体内DNA序列的任何变化。突变类型包括碱基替换位点突变(例如转换或颠换)、删除、及插入。错义突变将不同的氨基酸引介进被编码的蛋白质序列中;错义突变引入新的终止密码子。对于插入或删除,突变可以是框架内(不改变序列整体结构)或框架飘移突变,可能造成大量密码子的误读,并且,由于终止密码子在可选框架中的存在,经常导致被编码的产品的非正常终止。本文使用的术语"有效量"涉及药物成分(实施例4),是至少足够用来治疗、减轻、缓解或以其它方式来抑制给定的疾病状态的药量。在HIV-1情况下,指足以用来减轻、缓解或以其它方式抑制HIV-1的复制的药量。类似地,对于HIV-2,指足以用来减轻、缓解或以其它方式抑制HIV-2的复制的药量。除非另有定义,本文中使用的所有的科技术语都具有与本发明适用的业内一般技能人士所普遍理解的相同的含义。方法和材料的例子在下文中做了描述,但是与本文所述的相似或相同的方法或材料也可以应用在本发明的实践中,并且对于业内技术人员是浅显的。文中提及的所有的出版物和其它参考资料都全文引用以备参考。如果出现冲突,以现行的规范包括定义为准。材料、方法和举例只起说明作用,而不是限制性的。在本规范及要求的全文中,词语"包含"或其单数、现在分词等形式的变体应理解为包含了所说明的整数或整数群,而没有排除任何其它的整数或整数群。APOBEC3G突变体的多肽和核酸编码本文所述的是能够抑制HIV-1和/或HIV-2的复制的重组核酸分子。本发明提供了重组核酸分子编码的、至少在野生型APOBEC3G(SEQIDNo.35和36)位点129上具有一个氨基酸替换的APOBEC3G。例如,核酸分子包括例如SEQIDNo.1,3,5和7及相关的多肽序列例如SEQIDNo.2,4,6和8、相似物、变异体、片段和融合物编码的突变APOBEC3G,以缓解或抵抗由HIV-Vif引起的蛋白酶降解。突变体P129A(在此的数字代表一个氨基酸在野生型APOBEC3G蛋白氨基酸序列即SEQIDN0.35中的位置,数字左侧的字母代表替换前的氨基酸,数字右侧的字母代表替换后的氨基酸,下同)的全长核酸序列为SEQIDNo.1,编码的氨基酸序列为SEQIDNo.2。本发明的APOBEC3G突变和其它的APOBEC3G突变的产生见实施例1所述。此外,突变体APOBEC3GP129G的全长核酸序列对已经识别和排序了的蛋白质进行编码(SEQIDNo.3),编码的氨基酸序列被规定为SEQIDNo.4。APOBEC3G蛋白质的第129位突变体在HIV-1编码的病毒蛋白质Vif存在的情况下,抑制了HIV-1的复制。本文提供了突变体APOBEC3GP129D的全长核酸序列,它对已经识别和排序的蛋白质进行编码(犯QIDNo.5),编码的氨基酸序列被规定SEQIDNo.6。APOBEC3G蛋白质的第129位点突变在HIV-1编码病毒蛋白质Vif存在的情况下抑制HIV-1的复制。此外,突变体APOBEC3G蛋白质在HIV-2编码的病毒蛋白质Vif存在的情况下,抑制了HIV-2的复制。P129D突变体是对HIV-1或HIV-2的复制的有效的抑制剂。对于抑制HIV-1或HIV-2复制的另一个突变体的核苷酸序列被规定为SEQIDNo.7,其编码的氨基酸被规定为SEQIDNo.8。P129F突变体蛋白质抑制了HIV-1或fflV-2的复制。举一个具体的例子突变体APOBEC3G多肽保存了脱氧胞嘧啶脱氨酶活性。因此,本发明的APOBEC3G蛋白质至少对于减少细胞内的HIV-1和域HIV-2的复制特别有用。适宜地,突变体蛋白质抑制了人体内HIV-1和/或HIV-2的感染。本发明还包括了上述能够中和或抑制HIV-1和/或HIV-2感染的蛋白质或多肽的相似物。相似物由于在保守的氨基酸序列上的差异、或不影响序列的修饰、或同时出于这两种原因,而与天然存在的蛋白质或多肽有所不同。本发明包括经过提纯的氨基酸序列,与序列标识号为2,4,6或8的氨基酸共享了至少大约卯%的匹配率,适宜地,至少大约95%的匹配率,更适宜地,至少大约99.9%的匹配率,条件是这些相似物具有Vif抑制活性。特别地,APOBEC3G多肽在本发明的范围内,具有至少一个第129位点上的氨基酸替换。不同于野生型APOBEC3G,它在第129位包含脯氨酸,本发明的APOBEC3G突变体在第129位包含一个氨基酸替换。本发明的多肽在HIV-1Vif或HIV-2Vif存在的情况下,抑制了HIV-1和/或HIV-2的复制,同时保留其功能。适宜地,APOBEC3G突变体P129A的静态蛋白质水平在HIV-1Vif或HIV-2Vif存在的情况下不受影响。举一个具体的例子APOBEC3G蛋白质的突变体是一个P129A替换。另一个具体的例子APOBEC3G蛋白质的突变体是一个P129G的替换。理想的情况下,APOBEC3G蛋白质的突变体是一个P129F替换。更为适宜的例子,APOBEC3G蛋白质的突变体是一个P129D的替换。另举--个例子氨基酸序列第129位点的突变可以是除脯氨酸之外的任何氨基酸替换。在一些具体的情况下,其它的在129位发生了氨基酸替换的APOBEC3G蛋白质减少或抑制了宿主细胞或宿主体内的病毒传染和复制。还包括采用普通的分子生物技术进行了修饰的多肽,以改善蛋白降解抗性或优化溶解性的属性。这类多肽的相似物包括那些包含非天然生成的L-氨基酸的残基,例如D-氨基酸或非天然生成的合成的氨基酸。本发明的肽不限于文中所列举的任何特定的示例过程的产品。除实质性的全长多肽外,本发明提供了多肽的酶活性片段。多肽可以是单节显性或聚合的。此外,多肽可以包括不同的域,每个域都具有一项或多项明显的活性。在本发明的另--方面,本文提供了具有核酸序列的重组核酸分子,该核酸序列由突变体APOBEC3G序列(犯QIDNo.1,3,5或7)、相似体、同源体、变异体、及衍生物组成。本发明还提供了一个带有突变体APOBEC3G基因降解变异体序列的核酸分子。更为具体地,本发明提供了一个带有突变体APOBEC3G基因核变异体序列的核酸分子,具有与野生型基因至少卯%的匹配率。核酸序列可以适宜地具有至少91-95%的相对于野生型基因的匹配率。更适宜地,核酸序列可以与野生型基因有着96%,97%,98%,99%,99.9%或更高的匹配率。熟练的技工将能轻易地发现重组核酸分子可以用多种宿主细胞包括晡乳动物的细胞、酵母细胞、真菌细胞、昆虫细胞和细菌细胞来表达。相应地,核酸分子还可以是优化的密码子,其中的一个或多个氨基酸序列被改变了,包括保守的氨基酸的替换、增加、删除、或结合。本发明还提供了在严格条件下与上述核酸分子杂交的核酸分子。正如上文的定义及业内众所周知的,严格的杂交在大约25°C以下的热熔点(Tm)执行,对于一套特殊条件下的特定的DNA杂交,Tm的温度是50%的目的序列与相匹配的探针完美地进行杂交。严格的洗涤在--组特殊的条件下的大约5°C低于Tm的特殊DNA杂交温度执行。本文还提供了包含了上述任何一个核酸序列的片段的核酸分子。这些片段适宜地包含至少20个连续核苷。更适宜地,核酸序列的片段包含了至少25,30,35,40,45,50,60,70,80,卯,100或更多的连续核苷。本发明中的多肽和多核苷酸可以通过化学合成法制造,或者,更为常见地,通过对核酸的孤立片段进行人工处理、已知的基因工程技术来制造,特别是当有结构表达载体时。商业可行的肽合成器可以依照已知的协议来加以使用。肽的化学合成的说明参见S.B.H.Kent,《生物医学聚合体》,eds.GoldbergandNakajim4学术出版社,纽约,第213-242页,1980;Mitchelletal.,J.《有机化学》,43:2845-52,1978;T咖etal.,Tet.Letters,4033-6,1979;Mojsovetal.,J.《有机化学》,45:555-60,1980;T咖etal.,Tet.Letters,2851-4,1981;和Kentetal.,《第四届关于蛋白质序列分析方法的国际研讨会会议录》(BrookhavenPress,Brookhaven,纽约,1981.本发明的核酸序列片段展示了多种系统和方法的功效。例如片段可以用作各种杂交技术的探针。依凭此方法,目标核酸序列可以是DNA或RNA。目标核酸序列可以是在杂交前先进行分馏(例如凝胶电泳),或在原位执行样品的杂交。业内的一项技术将对已知序列的核酸探针在测定染色体结构中(例如通过Southern印迹杂交)和在测量基因表达(例如通过Northern印迹杂交)的大显身手而加以赞赏。在这些实验中,最好对序列片段加以标记,以便它们与目标序列进行的特异性杂交可以被发现和有选择地加以量化。业内熟练技工可在大量的印迹杂交技术(非本文中特别说明的沖应用本发明的核酸片段。本文所公布的核酸序列还可以用作探针,固定在微阵列上。通过在支撑基层上沉积和固定核酸来创建微阵列的方法是业内周知的。参见《DNA微阵列实用方法》(实用方法系列),Schena(ed.),牛津大学出版社(1999)(ISBN:0199637768);NatureGenet.21(1)(suppl):l-60(1999);《微阵列生物芯片工具与技术》,Schena(ed.),伊顿出版公司/生物技术书刊公司(2000)(ISBN:1881299376),本文引用上述披露的文献全文以备参考。分析,例如,对采用由核酸序列片段组成的微阵列做出的基因表达,如本文披露的核酸序列片段,是细胞和分子生物学领域内序列片段的重要的用途。固定在微阵列上的序列片段的其它用途参见Gerholdetal.,TrendsBiochem.Sci.24:168-173(1999)和Zweiger,TrendsBiotechnol.17:429-436(1999);《DNA微阵列实用方法》(实用方法系列),Schena(ed.),牛津大学出版社(1999)(ISBN:0199637768);NatureGenet.21(1)(suppl):l-60(1999);《微阵列生物芯片工具与技术》,Schena(ed.),伊顿出版公司/生物技术书刊公司(2000)(ISBN:1881299376),全文引用上述披露的每份文献的全文以备参考。针对突变体APOBEC3G多肽的抗体本发明的另一方面,发明提供了特异的抗体,包括片段和衍生物,这些片段和衍生物特异性地结合到本发明中的孤立的多肽和多肽片段上,或由本发明^I孤立的核酸所编码的一个或多个的多肽上。本发明的抗体可以是对线性抗原有特效的,不连续的抗原或此类多肽或多肽片段的构象表位,既可以是以天然结构呈现在多肽上,或者,在一些情况下,以变性的形态呈现在多肽上,例如通过SDS溶解。在本发明中所提供的有用的抗体片段包括Fab,Fab',Fv,F(ab'h,和单链Fv(SCFvs)片段。这些抗体片段的定义如下(l)Fab,包含了由整个抗体与木瓜蛋白酶消化而产生的抗体分子的单价抗原结合的片段,产生了一个完整的轻链和一部分的重链;(2)Fab',通过用胃蛋白酶处理整个抗体而获得的抗体分子的片段,经过减数分裂,可产生一个完整的轻链和一部分的重链;(3)F(ab,)2,通过用胃蛋白酶处理整个抗体而不再经过差数分裂而获得的抗体的片段;(4)F(ab')2,两个Fab'片段用两个二硫化键结合成的二聚物;(5)Fv,基因工程片段,包含轻链可变区和重链可变区,表达为两个链;及(6)单链抗体("SCA"),基因工程分子,包含轻链的可变区,重链的可变区,由适宜的多肽连接链链接,作为一个基因融合的单链分子。制造这些片段的方法是常规的。通过"特殊地结合"及"特定的结合",本文指出抗体优先于与其它的分子种类相结合,而与首位分子种类相结合的能力,抗体和首位分子种类与这些其它的分子种类是混合在一起的。文中所述的抗体专门指当它可以与首位分子种类进行特定的结合的时候,"识别"了首位分子种类。正如业内众所周知的,抗体在混合物中的多个分子种类中的分辨能力部分地依赖于混合物中种类的构象关系;典型地,本发明的抗体可以至少两倍地、更典型地至少5倍、典型地超过10倍、25倍、50倍、75倍,经常超过100倍,偶尔超过500倍或1000倍地分辨出与不相关的多肽的偶然的结合。典型地,本发明中的抗体与本发明中的多肽或多肽片段的亲和力或强度(或抗体多聚体,在IgM五聚物的情况下)将是至少大约1X1(^M,典型地,至少大约5X1(^M,有用地,至少大约1X10-7M,亲和力和强度为lXl(TgM,5X1(T9M,1X10""M及更强,经证实特别的有用。本发明的孤立的抗体可以是来自任何哺乳动物种类的天然形态,如IgGIgM,IgD,IgE,和IgA。例如抗体可以有效地从以下种类中获取啮齿动物一一典型地,鼠,但是也有家鼠、豚鼠和仓鼠一一兔类动物,典型地,野兔,也有更大的哺乳动物,如绵羊、山羊、母牛和马。按照标准免疫条约,动物是典型地肯定地经过了免疫的,具有本发明中的多肽或多肽片段。事实上,本发明中的多肽的8个或更多的连续的氨基酸的所有片段,当与载体缀合时,都可以有效地用作免疫原,典型地,诸如牛甲状腺球蛋白、钥孔虫戚血蓝蛋白、或牛血清蛋白,方便地使用了双功能的连接链。免疫原性还可以通过本发明中的多肽及多肽片段与其它半族相融合而得到。例如本发明中的肽可以通过在分支的多熔素核心矩阵上的固相合成法来制造;这些多抗原肽(MAPS)为疫苗的研发提供了高纯度,增强的强度,精确的化学定义和改善的安全性。参见例如Tametal.,Proc.Natl.Acad.Sci.USA85:5409-5413(1988);Posnettetal.,J.Biol.Chem.263,1719-1725(1988).免疫的协议是业内众所周知的。这些协议通常包括多种免疫,带有或不带有诸如Freund的完全佐剂和Freund的不完全佐剂等佐剂。本发明的抗体可以是多克隆的或单克隆的,多克隆的抗体在本发明中的蛋白质的免疫组织化学检测方面具有特定的优势,而单克隆的抗体在辨别与发现本发明中的蛋白质的特定的抗原表位方面具有优势。经过免疫之后,本发明中的抗体可以采用任何业内认可的技术制造。用于重组抗体生产的宿主细胞一一或者是整个的抗体,抗体片段,或者是抗体的衍生物一一可以是原核的或真核状态的。正如业内众所周知的,原核的宿主对于制造抗菌素显示的抗体特别的有用。真核细胞,包括哺乳动物、昆虫、植物和真菌细胞,也对本发明中的抗体、抗体片段以及抗体衍生物的表达很有用。本发明中的抗体还可以采用无细胞翻译法制备。本发明中的孤立的抗体,包括抗体的片段和衍生物,可以被有效地加标记。因此,本发明的另一个方面,是提供作了标记的抗体,专门结合到本发明中的一个或多个多肽和多肽片段中。标记的选择,部分地依赖于理想的用途。在一些情况下,本发明中的抗体可以用酶来有效地标记。或者,抗体可以用胶体金或荧光团来标记。用加了标记的亲和素、链亲和素、captavidin或中性链亲和素进行第二次检测,本发明中的抗体可以采用生物素来有效地标记,例如在western印迹杂交应用中,可以有效地采用放射性同位元素如33P,32P,35S,3H和1251来标记。正如人们所理解的那样,上述标记的使用不限于任何的特定的应用。抗-X蛋白质抗体(例如专门识别APOBEC3G蛋白质的抗体)可以采用大量文献中描述的标准程序来制造,包括HarlowandLane(《抗体,实验室指南》CSHL,纽约1988)。对只与特定的蛋白质进行充分结合的特定试剂的测定可以采用或采取常规的程序。一种适宜的体外化验法采用western印迹程序(在许多标准文献中都有记述,包括HarlowandLane(《抗体,实验室指南》,CSHL,纽约,1988)).本文印迹法可以用来测定特定的蛋白质结合,如只有X蛋白质结合的抗-X蛋白质单克隆抗体。重组APOBEC3G突变体多肽的表达本发明中的蛋白质通过用由核酸编码的蛋白质构成的表达载体来转染、培养重组宿主细胞的方法制造(图2),在适宜的条件下,引起或促进蛋白质表达。蛋白质表达的适宜条件随所选择的表达载体和宿主细胞而变化,业内技术娴熟者可以采用常规实验轻易地加以确定。例如在表达载体中使用组成型启动子需要优化宿主细胞的生长和增殖,而使用诱导型启动子要求具有诱导的适宜生长条件。适宜的宿主细胞包括酵母、细菌、原生细菌、真菌类、和昆虫及动物细胞,包括哺乳动物的细胞。具有重大意义的有果蝇细胞、甲醇酵母和甲醇型酵母、酿酒酵母和其它酵母、大肠杆菌、枯草杆菌、SF9细胞、SF21细胞、C129细胞、骨肉瘤Saos-2细胞、Hi-细胞、293细胞、293T细胞、脉孢菌、BHK、CHO、COS、及海拉细胞。意义最为重大的有A549、海拉、HUVEC、Jurkat、BJAB、CHMC、及从T细胞或巨噬细胞中衍生而成的细胞系。举一个具体的例子,蛋白质在哺乳动物细胞中特别是人体细胞中的重组表达。哺乳动物表达系统也是业内已知的,包括反病毒系统。哺乳动物启动子(即哺乳动物细胞中的启动子功能)是任何能将哺乳动物RNA聚合酶结合起来的DNA序列,并开启下游(3')蛋白质进入mRNA的编码序列的转录。启动子具有一个转录开启区,通常放置在最靠近编码序列5'端,和一个TATA盒,使用转录开启位点的定位的25-30碱基对上游。TATA盒被认为是将RNA聚合酶II接引到适宜的位点去启动RNA的合成。哺乳动物启动子还包含上游启动子元素(加强子元素),典型地位于TATA盒的100至200个碱基对上游。上游启动子元素决定着转录启动的速率,可以是任何方向的。哺乳动物启动子的特别的用途是来自哺乳动物病毒基因的启动子,病毒基因经常是髙度表达的,具有宽泛的宿主范围。例子包括SV40早期启动子、大鼠乳腺癌病毒LTR启动子、腺病毒主要晚期启动子、单纯疱疹病毒启动子、及CMV启动子。典型地,哺乳动物细胞发现的转录终止和腺嘌呤序列是在调整区,将3'定位在转译终止密码子,这样,连同启动子元素一起,位于编码序列的側面。成熟的mRNA的3'术端是通过特定位点的转译后分裂和多聚腺苷酸化而形成的。转录终止子和多聚腺苷酸信号的例子包括那些衍生的形态SV40。将外源的核酸引介进哺乳动物宿主及其它宿主的方法是业内众所周知的,随使用的宿主细胞而变化。技术包括葡聚糖介导转染,磷酸钙沉淀、聚凝胺介导转染、原生质体融合、电穿孔、病毒传染、脂质体中的多核苷酸包复、及DNA直接进入细胞核的显微注射。举个适宜的例子,实施例2描述了293T细胞转染核酸序列,通过宿主和重组核酸序列间的同源重组在选定的位置,将序列纳入诸如宿主基因组等。本发明中的序列可以适宜地联接到一个或多个表达控制序列中,以便序列编码的蛋白质可以在包含了孤立的核酸分子的宿主细胞中在适宜的条件下被表达。稳定的基因合成可以通过生化选择在哺乳动物细胞中获得,例如新霉素(SouthernandBerg,1982,J.Mol.Appl.Genet.1:32741)和mycophoenolic酸(MulliganandBerg,1981,Proc.Natl.Acad.Sci.美国78:2072-6).将异源的核酸引介进宿主细胞中的方法是业内众所周知的,并随宿主细胞而变化。DNA到诸如人或其它哺乳动物细胞的真核状态的转染,是业内已知的技术。载体作为纯DNA(转染)被引入受体宿主细胞,例如,磷酸钙沉淀(GrahamandvanderEb,1973,《病毒学》52:466)磷酸锶(Brashetal.,1987,《分子细胞生物学》7:2013),电穿孔(Neumannetal.,1982,EMBOJ.1:841),脂染(Feigneretal.,1987,Proc.Natl.Acad.SciUSA84:7413),DEAR葡聚糖(McCuthanetal..,1968,J.Natl.癌症研究所41:351),显微注射(Muelleretal.,1978,《细胞》15:579),protopiast融合(Schaiher,l诉O,Proc.Natl.Acad.Sci.USA77:2163-7),或粒丸枪(Kleinetal.,1987,《自然》327:70)。其它方法包括通过病毒载体传染来引介cDNA,例如逆转录病毒酶(Bernsteinetal.,1985,Gen.Engrg.7:235)如腺病毒(Ahmadetal.,J.Virol.57:267,1986)或疱疹(Spaeteetal.,Cell30:295,l诉2).APOBEC3G突变体多肽能在Vif存在的条件下抑制HIV-1或HIV-2的病毒复制本发明中的突变体APOBEC3G蛋白质显示了在HIV-lVif或HIV-2Vif存在情况下,与野生型APOBEC3G相对比时,至少一些病毒抑制功能,及与其它的APOBEC3G突变体相比较,具有更高的抗逆转录病毒功能(见图3)。举一个例子,P129D蛋白质在HIV-Vif存在情况下抑制大约90%的病毒活性。适宜地,抑制率大约为95-99.9%。更适宜地,抑制为100%。在抗病毒活动中,APOBEC3G的单氨基酸替换突变效应(例如P129D)由HIV-1Vif或HIV-2Vif的缺乏或存在的状态所决定。图3显示了野生型APOBEC3G蛋白质及其突变体在HIVV泡缺乏或者在HIV-l或HIV-2Vifs存在的情况下的抗逆转录病毒活性。在HIV-l或HIV-2Vifs缺乏的情况下,图3A中显示的所有的APOBEC3G突变体和野生型蛋白质可以有效地抑制HIV的复制。在HIV-1vif存在的情况下,野生型APOBEC3G丧失了抗逆转录病毒活性,而D128K,P129A,P129D和P129F仍然能有效地抑制HIV。在这些突变体中,P129D是最有效的一个。在HIV-2vif存在的情况下,野生型APOBEC3G和D128K突变体部分地丧失了它们的抗逆转录活性,但是P129A,P129D和P129F突变体可以有效地抑制病毒的复制。而P129D再次成为最有效的个。虽然几种突变体APOBEC3G在HIV-1Vif或HIV-2Vif存在的情况下抑制了HDV-EGFP的复制,并且展示了相对其它的突变体的Vif抗性,然而,结果显示,P129D突变体比D128K,P129A或P129F突变体略微更有效一些。相应地,另外举一个例子,P129D突变体蛋白质比其它的APOBEC3G突变体更加有效抑制了病毒的复制。使用本发明中的APOBEC3G具有几个优势。HIV-1Vif或HIV-2不减缓细胞内的APOBEC3G突变体的稳态水平,这是本发明的一个显著特点。P129D突变体显示了具有Vif抗性的显型。采用实施例2中描述的方法,突变体APOBEC3G抗病毒活生由HIV-1或HlV-2Vif的存在或缺乏来决定。图4显示了P129D对HIV-1Vif和HIV-2Vif同时具有抵抗性。APOBEC3G表达载体(pcDNA-AP03G和pAP03G-P129D)及Vif表达载体(pC-Help)被共同转染到293T细胞中。细胞溶菌在转染后48小时收获,并接受SDS-page上的电泳和免疫印迹分析(实施例3)。APOBEC3G由抗cMyc抗体检测得到。结果显示野生型APOBEC3G蛋白质的含量在HIV-l(vif+)存在的情况下减少了,但是D128K,P129A,P129D和P129F突变体蛋白质的含量在当Vif与APOBEC3G及其在病毒制造细胞中的突突体被共同表达时,没有减少,只有P129D对由HIV-2Vif引介的降解具有抵抗性(图4C)。本发明在另一方面,提供了一个减少细胞内的HIV-1和/或HIV-2感染的方法,包括通过引介可以管理突变体APOBEC3G多肽的疗效量的Vif来抑制蛋白酶降解,从而抑制、减低或防止宿主细胞内的病毒传染(实施例4)。举一个具体的例子,提供突变体APOBEC3G的方法仍然保持了脱氧胞嘧啶脱氨酶活性。通过管理突变体APOBEC3G作为抗病毒化合物,至少HIV-1和/或HIV-2感染减少了。举一个具体的例子突变体APOBEC3G是与其它的抗病毒药物包括白介素、抗生素、蛋白酶抑制剂、非核苷逆转录酶抑制剂等结合而进行管理的。另外举一个例子本方法提供本发明中的多肽的管理,使其作为细胞免疫防卫机制的一部分来抵抗Vif。正如业内所知,病毒感染性测定显示,对病毒复制和病毒感染性的抑制可以通过多种方法来测量。例如突变体APOBEC3G可以采用病毒感染性测定进行检测,参阅(例5)。另外的一些病毒感染性的例子也是业内众所周知的。其它的方法和技术也适用于病毒感染性的测量,正如业内技术娴熟者所知道的那样。图1显示了APOBEC3G序列和几种突变体,包括P129F,P129D,P129A和D128K氨基酸替代的氨基酸序列示意图。图2解释了APOBEC3G表达载体的质粒图,用来表达野生型APOBEC3G蛋白质或它的突变型蛋白质。图3描述了结果图,显示在缺乏HIVVtfs时,或在HIV-1或HIV-2V泡存在的情况下,野生型APOBEC3G蛋白质及其突变体的抗逆转录病毒活性比较。图4描述了SDS-PAGE图象关于细胞内APOBEC3G及其变异体的蛋白水平的分析,及APOBEC3G表达载体与Vif表达载体共同转染到293T细胞内的蛋白质表达的免疫杂交分析。图5是本发明几个突变体抑制HIV复制比较图。具体实施方式以下通过实施例对本发明作进一步的阐述,但不限制本发明的范围。实施例l:重组APOBEC3G突变体的获得用以生成APOBEC3G突变结构的突变体采用多位点突变试剂盒(Stratagene)或基于PCR的变异,然后测定序列以验证突变。氨基酸替换被引介到pcDNA-AP03G内,参见Kaoetal.,J.Virol.77,11398-11407(2003)。从APOBEC3G蛋白的N末端到C末端,通过氨基酸替换获得的典型的突变型APOBEC3G蛋白如下P129A(核苷酸序列为SEQIDNo.l,对应的氨基酸序列为犯QIDNo.2);P129G(核苷酸序列为SEQIDNo.3,对应的氨基酸序列为SEQIDNo.4):P129D(核苷酸序列为SEQIDNo.5,对应的氨基酸序列为SEQIDNo.6);P129F(核苷酸序列为SEQIDNo.7,对应的氨基酸序列为SEQIDNo.8);D128K(核苷酸序列为SEQIDNo.9,对应的氣基酸序列为SEQIDNo.lO)。上述突变型APOBEC3G蛋白与野生型APOBEC3G蛋白的氨基酸替代的示意图如图1所示。以下的质粒在前文巳有说明pHDV-EGFP,参见Unutmazetal.,J.E邻.Med.189,1735-1746(1999);pNL4-3,参见Adachietal.,J.Virol.59,284-291(1986);pcDNA-AP03Q参见Kaoetal.,J.Virol.77,11398-11407(2003);pC-Help,参见Mochizukietal.,J.Virol.72,8873-8883(1998);pC-HelpAVif,参见Kaoetal.J.Virol.77:11398407,2003;和pANC,参见Ottetal.,J.Virol.77,5547-5556(2003)。PcDNA表达载体包含APOBEC3GcDNA的第129位的氨基酸替换(GenbankANBC024268)。依照生产商说明,转染采用PolyFect试剂(Qiagen,Inc.),所有质粒等摩尔比率,36小时后收获,除非另有说明。实施例2:在宿主细胞中表达APOBEC3G。用于测定APOBEC3G变异体的抗HIV复制的能力。其实验的流程为1、生产用于测试的含APOBEC3G变异体的病毒。使用野生型APOBEC3G及其突变体与pHDV-EGFP(HIV-1产生的载体),pCMV-g(VSVg膜表达载体)和pcHelpAvif(Vif杆)或pcHelp(表达HIV-1vif,Vif+杆)共转染293T细胞,采用CalPhos哺乳动物转染试剂盒(BD生物科学)。2、使用上一步生产出的病毒来感染哺乳动物细胞。病毒在转染后48小时收获,采用0.45mm针头式过滤器进行过滤(Coming)。每个病毒的p24衣壳采用P24ELISA工具来测量(Perkin-Elmer),每个样器中等于p24的30ng的病毒被用来在6孔盘中感染293T细胞。3、测定被感染的细胞比例,使用流式细胞分析的方法。被感染的293T细胞在感染48小时后收获,进行FACScan分析(Becton-Dickinson)。样本中的被转染了pHDV-EGFP、pCMV-g、野生型APOBEC3G和pcHelp的GFP阳性细胞被设定为100%。野生型APOBEC3G及其突变体与pHDV-EGFP(HIV-1产生的载体),pCMV-g(VSVg膜表达载体)和pcHelpAvif(Vif杆)或pcHelp(表达HIV-1vif,Vif+杆)到293T细胞的共转染采用CalPhos哺乳动物转染试剂盒(BD生物科学)。病毒在转染后48小时收获,采用0.45mm针头式过滤器进行过滤(Corning)。每个病毒的p24衣壳采用P24ELISA工具来测量(Perkin-Elmer),每个样器中等于p24的30ng的病毒被用来在6孔盘中感染293T细胞。被感染的293T细胞在感染48小时后收获,进行FACScan分析(Becton-Dickinson)。样本中的被转染了pHDV-EGFP、pCMV-g、野生型APOBEC3G和pcHelp的GFP阳性细胞被设定为100%。为了测定野生型或突变体APOBEC3Gs在Vif存在的条件下对HIV-l或HIV-2复制的效果,pHDV-EGFP,pC-HelpAVif,pHCMV-G和pcDNA-AP03G或pcDNA-AP03G的突变体分别采用20:15:4:4ug的DNA来共同转染。pHDV-EGFP,pCHelpAVif,pHCMV-G和pcDNA-AP03G或APOBEC3G突变质粒的摩尔比率分别为大约1:1:0.4:0.4。为了测定野生型或突变体APOBEC3Gs在Vif(Vif+)存在的条件下对HIV-1或HIV-2复制的效果,pHDV-EGFP,pC-Help,pHCMV-G和pcDNA-AP03G或pcDNA-AP03G的突变体分别采用20:15:4:4yg的DNA来共同转染。pHDV-EGFP,pC-Help和pcDNA-AP03G野生型或突变体质粒的摩尔比率分别为大约1:1:0.4:0.4。为了测定是否突变体对野生型APOBEC3G,pHDV-EGFP,pC-Help和pHCMV-G具有优势,质粒与pcDNA-AP03G和/或突变体APOBEC3G质粒pAP0129D被共同转染。APOBEC3G质粒的总量在每次实验中是4ug,pHDV-EGFP,pC-Help,pHCMV-G和APOBEC3G质粒的摩尔比率是1:1:0.4:0.4。野生型和突变体APOBEC3G对于pHDV-EGFP的复制的效果见图3所示。突变体APOBEC3G在HIV-1Vif表达不存在的条件下的效果显示了在GFP-阳性细胞内的重大减损直至低于10。/o。突变体APOBEC3G在HIV-1Vif或HIV-2Vif存在的条件下的复制效果见图3所示。野生型APOBEC3G的表达没有减少感染细胞内的GFP表达水平,然而,P129DP129A和P129F突变体和D128K突变体显示了对HIVVifs的抵抗性。这些突变体有效地抑制了HDV-EGFP的复制,即使是在pC-Help存在的条件下。实施例3:APOBEC3G突变体P129A,P129D和P129F能够抵抗fflV-l和HIV-2Vifs引起的蛋白酶降解。细胞内的野生型APOBEC3G和突变体APOBEC3G蛋白质的稳态水平在HIVV泡存在或缺乏的条件下,采用C端myc-标记的APOBEC3G蛋白质的western印迹检测法来测定。对于共同免疫沉淀反应,依照厂商说明(DynalBiotech),抗c-Myc抗体(Sigma-Aldrich)连接到顺磁熔珠。293T细胞与APOBEC3G表达质粒以及pC-Help或pC-HelpAVif共转染。转染之后大约36小时,2x106个细胞被收获,用冰冻的PBS洗涤两次,在1ml细胞抽提液中溶解(20mMTris-Cl,pH8.0,137mMNaCl,1mMEDTA,lmMNaV03,10%甘油,1°/。TritonX-100和蛋白酶抑制剂的混合物[Roche])。细胞提取物使用Bradford试剂调整为等量的蛋白质浓度(BioRad实验室),然后使用等分试样进行共免疫沉淀反应和western印迹分析。细胞抽取物采用1,500xg分离4分钟,采用与顺磁熔珠相结合的抗c-Myc抗体培养上清液,4t:RKDynal(DynalBiotech)转子上缓慢转动3小时,培养后,熔珠用50mM碱-盐酸缓冲液,pH7.5,500mM氯化锂,lmM偏钒酸钠和0.5%TritonX-100洗涤3次,用50mM碱-盐酸缓冲液,pH7.5,500mM氯化锂,1mM偏钒酸钠洗涤3次,用1mMNaV03偏钒酸钠洗涤1次。粘合的蛋白质采用加热到卯X:保持5分钟的方法在SDS-PAGE上样缓冲液中从熔珠上洗掉。对于细胞裂解,收获了2"06个细胞,转染后用冰冻的PBS洗涤36小时,在1xSDS-PAGE上样缓冲液中溶解,加热到90°C保持5分钟。对于western印迹分析,myc抗原表位标注的APOBEC3G蛋白质采用抗c-Myc抗原进行检测,HIV-1Vif蛋白质采用抗HIV-1HXB2Vif抗血清(DanaGabuzd^Dana-Farber癌症研究所)进行检测,这种抗血清通过美国国立卫生研究所(NIH)国立过敏与传染病研究所(NIAID)爱滋病研究部的爱滋病试剂与推荐计划而获得的。图4中的结果显示野生型APOBEC3G蛋白质在HIV-1(PanelB)存在的情况下减少了,但是D128K,P129A,P129D和P129F的量没有减少。如果HIV-2Vif与APOBEC3G及其突变体在病毒制造的细胞中被共同表达,只有P129D对由HIV-2Vif(panelC)引介的降解有抵抗性,P129F和P129A部分具有抵抗性。野生型APOBEC3G蛋白舉的稳态水平在HIV-l或HIV-2Vif存在的情况下大量衰竭,但是突变体APOBEC3G蛋白质不存在这种情况。因此,P129D对由于HIV-lVif或HIV-2Vif引起的蛋白酶降解具有更好的抵抗性。实施例4:药物成分药物配方中的突变体多肽成分可以通过阻止免疫缺陷病毒的复制,来治疗慢病毒感染,例如HIV和AIDS。测定速效药物成分的有效量可以采用常规的计算方法基于动物数据完成。一种试剂的治疗有效量可以在一次疗程中通过--次或许多次的剂量来控制。成分包括可以按需要管理的治疗试剂。一项具体例子中,有效剂量包含每千克人体质量大约10ng和大约100jig之间的核酸分子。在另一项具体例子中,有效剂量包含有每千克人体质量大约100ng和大约10jig之间的核酸分子。在另一项具体例子中,有效剂量包含每千克人体质量大约1pg和大约5ng之间的核酸分子。在另一项具体例子中,有效剂量包含每千克人体质量大约10ng和大约100pg之间的核酸分子在一项适宜的例子中,有效剂量包含每千克人体质量大约100叫和500叫之间的核酸分子。在另一项具体例子中,有效剂量包含每千克人体质量大约500ng和1000pg之间的核酸分子。在另一项具体例子中,有效剂量包含每千克人体质量大约lmg和2mg之间的核酸分子。本发明中的化合物还可以混合,装入胶囊,组合或者用其它的方式与其它的分子、分子结构或化合物的混合物相结合,例如脂质体、受体目标分子、口服、直肠、局部的、皮肤的、气管内的、吸服的或其它配方,来帮助摄取、分散和/或吸收。辅助性配方包括但不限于美国专利号5,354,934;5,108,921;5,354,844;5,416,016;5,459,127;5,521,291;5,543,158;5,547,932;5,583,020;5,591,721;4,426,330;4,534,899;5,013,556;5,108,921;5,213,804;5,227,170;5,264,221;5,356,633;5,395,619;5,416,016;5,417,978;5,462,854;5,469,854;5,512,295;5,527,528;5,534,259;5,543,152;5,556,948;5,580,575;和5,595,756,这些编号中的每一个都引入本文以备参考。其它的药物传送机制诸如缓释(例如聚合体、微胶囊)、机械仪器包括可植入融合设备和泵,也是可以控制的。药物成分的有效剂量可以控制在病人需要的剂量,每天或隔天服用l-8次或者更多次。剂量取决于被治疗的疾病的严重程度和药效反应,疗程持续几天至数月,直至痊愈或者症状减轻。实际的有效量,或剂量的控制应当考虑病人的体积和体重,治疗的性质是预防性的还是治疗性的,病人的年龄、体重、健康状况和性别,用药途径,及其它因素包括医生的处方。药物成分还包含适用的赋形剂和助剂,以加快核酸进入药用制剂的过程。通常,发明中使用的药剂的配方既可以是非肠道的也可以是肠内形式的,通常是肠内形式的,特别是口服的药方。适宜地,发明中使用的试剂的配方是肠胃外用药,例如通过皮肤、皮层内、腹膜腔内、静脉内、或肌肉注射。此外,肠胃外或口服药品的适宜药水和药物成分可以通过口腔或舌下吸收,包括化合物,含有有效成分的重量从大约0.1。/。到大约99%,以及赋形剂。本发明的药物制剂采用业内众所周知的方式制造。例如药物制剂可以通过常规的混合、粒化、糖衣丸、溶剂、或冻干方法制造。使用的方法最终取决于使用的活性成分的物理性质。实施例5:从表达AP0BEC3G变异体的细胞中生产出的病毒无法进行复制。病毒感染性测定的方法在文献"Asingleaminoacidsub劲itutioninhumanAPOBEC3GantiretroviralenzymeconfersresistancetoHIV-1virioninfectivityfactor-inducedd印letion."(Xuetal.,2004)中有详细的描述。基于细胞的测定、基于膜囊的测定以及基于膜片断的测定可以用来识别在Vif调介的APOBEC3G降解途径中影响交互作用的化合物。表达Vif或APOBEC3G的细胞系,或者包含了上述蛋白质的-个域或片断(或它们的组合体)的融合蛋白质,或通过基因工程来表达蛋白质或融合蛋白质(例如通过APOBEC3G或VifDNA的转染或转导)的细胞系(例如COS细胞、CHO细胞、HEK293细胞等),都可以被使用。影响降解途径的测试化合物,例如可以通过监控APOBEC3G、或者包含了域或片断的融化蛋白质的水平或量的变化或转换率来检测。对于基于细胞的测定,大约20,000~250,000个细胞被理想的病原菌所感染,例如HIV-1,潜伏期持续3-7天。试验试剂可以在感染了病毒的前中后期应用于细胞。使用的病毒和试剂量的可以由娴熟技工来测定。在一些情况下,潜在治疗剂的几种不同的剂量可以用来识别最佳的剂量范围。转染后,执行化验来测定不同试剂下细胞对感染的抵抗性。例如,H1V-1抗原的存在可以使用HIV-1蛋白质的特效抗原来测定,然后检测抗体。HIV-1抗体的举例包括在ELISA试剂盒(Perkin-Elmer)中针对HIV的p24的抗体,和针对HlV-lVif蛋白质的抗HIV-1HXB2Vif抗血清(DanaGabuzd^Dana-Farber癌症研究所),可通过美国国立卫生研究所(NED国立过敏与传染病研究所(NIAID)爱滋病研究部的爱滋病试剂与推荐计划获得。举一个例子,专门与HIV-1蛋白质相结合的抗体被加上标记,例如可检测的标记光团等。或者,抗体也可以采用含标记的第二抗体来检测。然后,检测绑结抗体的存在性,例如使用显微镜法、流式细胞术和ELISA。测定可以设计为有助于高通量测定。细胞可以在适宜的容器中培养,适宜采用高通筛选的容器(例页如多孔盘)。本发明还公开了其他一些A3G变异体的核苷酸和氨基酸序列129位上有变异的是A3G—CD系列;129位上无变异的为A3G—C系列,作为对照。A3G—CD系列与A3G—P129D的相似率为similaritybetweentwomoleculesDNAproteinA3G-P129DA3G誦CD189%79%A3G-P129DA3G-CD293%87%A3G-P129DA3G-CD395%91%A3G-P129DA3G-CD496%93%A3G-P129DA3G-CD598%97%A3G-P129DA3G-CD699%99%图5显示了这些变异体在HIV—1或HIV—2Vif存在或缺少的情况下抑制HIV复制的能力。从图5可以看出,129位上有变异的是A3G—CD系列抑制HIV复制的效果较好。阿朴脂蛋白BmRNA编辑的酶催化多肽类3G(APOBEC3G),最初被确定为CEM15,是一种具有很强的抗病毒活性的宿主细胞蛋白,其cDNA序列被几个实验室先后确定(Sheehyetal.,2002)(Harrisetal.,2003),并被克隆进质粒pcDNA—AP03G(由Dr.KlauseStrebelofNIH完成)。本发明中的所有APOBEC3G变异体都是由在该质粒的基础上进行特定位点的氨基酸替代而来。我们使用"多位点突变试剂盒(Stratagene)"根据生产厂商的说明书进行操作,或使用基于PCR的变异法用以生成APOBEC3G突变体。该步骤的产物为带APOBEC3G变异体的表达载体(质粒)。我们使用DNA测序来鉴定这些载体,以确定其带有我们所需的APOBEC3G的变异体。以下是本发明中所采用的一些实验方法,可作为本领域普通技术人员实现本发明的参考,但实现本发明的实验方法不限于以下的描述一、DNA质粒的转化1、将100^1感受态细胞冰浴10分钟;2、加入5-10ngDNA质粒,继续冰浴20~30分钟;3、在42'C水浴槽中加温45-卯秒,然后快速放回冰上l-2分钟;4、加入卯0mlLB或SOC培养基,37"摇床温育60分钟;5、取lOOjil培养液均匀涂抹在含抗生素(Ampf)的培养皿上,37X:孵箱温育16小时(0/N)。6、(可取舍步骤)将剩余的900jil培养液离心沉淀,涂抹在另一个培养皿上,37"C,0/N。(以备菌落太少时使用)二、转化DNA的鉴定1、挑取若千单个菌落分别接种在母板和1.5ml或5mlLB培养基中。(培养基内含相应抗生素,Amp+)2、将母板放置37'C孵箱温育16小时;3、将接种的培养基在37C摇床中温育16小时;4、第二天进行质粒DNA的小量制备,下面是Qiagen公司的QIAprepSpinMiniprepKit(Cat27104)的制备歩骤(1)将培养基离心沉淀,13K,30",收取细菌沉淀块;(2)加入250fUPl缓冲液,重新悬浮细菌沉淀块;(3)加入250nlP2缓冲液,上下倒置试管5-6次;(4)加入350jUP3缓冲液,上下倒置试管5-6次;(5)高速离心,13K,10,(6)小心将上清液转移到QIAprep过滤管柱中,离心30";(7)加入750fUPB缓冲液,清洗QIAprep过滤管柱,离心30"^60";(8)将过滤液倒弃,继续离心l分钟,13K;(9)将QIAprep过滤管柱放到另一个干净的1.5ml离心管中,加入50^1或lOOfilddH20(或EB缓冲液),放置l分钟后,13K离心l分钟(10)将所制备的DNA质粒放在-2(TC冰柜中存放。5、质粒的鉴定(1)进行限制酶切分析;(2)进行DNA测序;(3)杂交筛选等其他方法。三、DNA质粒的扩增和大量制备1、在母板上排选一个正确的DNA质粒菌落,接种在5mlLB培养基中(含相应抗生素),在37X:摇床中温育6-8小时;2、取100nl上述培养液加到500mlLB培养基中(含相应抗生素),在37"摇床中温育16小时;3、第二天进行DNA质粒的大量制备,下面QiagenPlasmidMaxKit(Cat12162)的制(1)离心6000g,15分钟,沉淀收集细菌;(2)加入10mlPl缓冲液,重新悬浮沉淀的细菌;(3)加入10mlP2缓冲液,温和混匀后放置3-5分钟;(4)加入10mlP3缓冲液C4D,混匀后冰浴20-30分钟;(5)离心20000g,30分钟,化:(6)小心收取上清液。(若含有较多的浮渣,可再次离心或过滤);(7)加入10mlQBT缓冲液到Qiagen-tip500过滤柱中;(8)当QBT缓冲液滴光时,加上歩骤(6)上清液到过滤柱中;(9)当上清液滴光时,用2x30mlQC缓冲液清洗过滤柱;(10)用15mlQF缓冲液洗脱DNA;(11)在上述洗脱液中加入10.5ml异丙醇,混匀后髙速离心沉淀DNA质粒,>15000x30,,4t);(12)小心倒去液体,加入5ml75n/。酒精溶液;(13)高速离心,》15000x30,,4";(14)小心倒去酒精溶液,将离心倒置5-10分钟;(15)加入500nlddH2O溶解DNA质粒后,存储在-20"C冰柜中。四、转染a.使用磷酸钙法(SambrookandRussell,2001)表达载体转染宿主细胞。(--)储备溶液制备1、2MCaCl2溶液,0.22nm过滤;2、2xHepes溶液280mMNaCl50mMHepes1.5mMNa2HP04调节pH值至7.1i0.02,0.22jim过滤;(二)工作溶液制备1、溶液I10cm培养皿(或者6孔板"ddH20597.7}il(upto700fU)2MCaCl286.8(ilDNA(inH20)根据需要(例如,表1中的DNA构成)(*一个10cm培养皿相当于一个六孔板)2、溶液II2xHepes溶液700^1(三)转染液制备将溶液I逐滴加入溶液II,混匀后置于室温下20分钟。(四)转染细胞1、293T细胞的准备用1/2的10cm培养皿的细胞(80-卯%饱和度),分到2块6孔板中,每孔中用3ml细胞培养液;(1)即分即用在转染前6小时分细胞,转染时不用更换培养液;(2)隔夜分在转染前夜分细胞,转染前需更换培养液。2、制备溶液I(一个10cm细胞培养皿=一个6孔板,一孔6孔板-1/610cm培养皿)表1在测定APOBEC3G变异体的抗病毒能力的试验中使用的质粒及其用量<table>tableseeoriginaldocumentpage33</column></row><table>表2生产HIV—GFP病毒试验中使用的质粒及其用<table>tableseeoriginaldocumentpage34</column></row><table>3、转染(1)制备转染用溶液I(2)用移液管将溶液I滴注入溶液II(均匀缓慢地进行,每滴一滴,摇动一次)(3)溶液I和溶液II混合液在室温下放置20分钟;(4)(如果是隔夜分的细胞,则需要更换新鲜的细胞培养液)(5)将步骤(3)的混合液均匀地滴注入6孔板细胞槽中(轻轻摇匀,在显微镜下可看到均匀细致的结晶颗粒)(6)37iC,5%C02,孵育8小时或0/N;(7)小心吸去培养液,沿壁小心加入3ml新的培养液;(8)37X:,5%C02,孵育48小时;(9)用5ml塑料针筒轻轻吸取细胞培养液,经0.45nm过滤后收集到2ml离心管内,以供病毒感染实验或储存在-2or(短期)或液氮(长期)中;4、GFP细胞观察在转染后24小时,在荧光显微镜下可观察到GFP细胞。b.宿主细胞的培养增殖的步骤;己转染的细胞可用neomycin(300ng/ml)来进行筛选,然后置于37度C02孵箱中让其生长。五、在宿主细胞中的表达目标产物的步骤;将表达质粒转染入细胞,APOBEC3G即可表达。六、表达产物鉴定及生物学活性测定的步骤和结果。1)使用标准的免疫印迹试验(SambrookandRussell,2001)来检测该蛋白的表达。在试验中我们使用APOBEC3G多克隆抗体来检测该蛋白。2)使用APOBEC3G活性试验来测定APOBEC3G变异体的活性。APOBEC3G活性试验的方法在发明人的论文(Svarovskaiaetal.,2004)中有详尽的描述。七、病毒的感染1、在实验前6小时候,将293T细胞分到二块6孔板内;2、在每个孔槽内加入0.5ml经0.45nm过滤的细胞转染培养液;3、37°C,5%C02,孵育6小时后,加入3ml细胞培养液;4、37X:,5°/。C02,孵育48小时;5、小心移走细胞培养液,用3mllxPBS洗涤一次;6、加入0.5ml用PBS制备的胰蛋白酶,将细胞收集到1.5ml离心管内。7、加入O.lml用PBS制备的6%福尔马林溶液,送检FACS。参考文献Harris,R.S.,Bishop,K.N.,Sheehy,A.M.,Craig,H.M.,Petersen-Mahr^S.K.,WaALN.,Neuberger,M.S.,andMalim,M.H.(2003).DNAdeaminationmediatesinnateimmunitytoretroviralinfection.Cell113(6),803-9.Sambrook,J"andRussell,D.W.(2001)."MolecularCloning:ALaboratoryManual."ThirdEditioned.,3.3vols.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork.Sheehy,A.M.,Gaddis,N.C.,Choi,J.D.,andMalim^M.H.(2002).IsolationofahumangenethatinhibitsHIV-1infectionandissuppressedbytheviralVifprotein.Nature418(6柳),646-50.Svarovskaia^E.S,,Xu,H.,MbisaJ.L.,Barr,R.,Gorelicl^R.J"Ono,A,,Freed,E.O.,Hu,W.S.,andPathak,V.K.(2004).HumanapolipoproteinBmRNA-editingenzyme-catalyticpolypeptide-like3G(APOBEC3G)isincorporatedintoHIV-1virionsthroughinteractionswithviralandnonviralRNAs,JBiolChem279(34),35822-8.Xu,H.,Sv咖vskaia^E.S.,Ban,R.,Zhang,Y.,Khan^M.A.,Strebel,K.,andPathak^V.K.(2004).AsingleaminoacidsubstitutioninhumanAPOBEC3GantiFetroviralenzymeconfersresistancetoHIV-1virioninfectivityfactor-induceddepletion.PfocNatlAcadSciUSA101(15),5652-7.Harris,R.S.,Bishop,K.N,,Sheehy,A.M.,Craig,H.M.,Petersen陽Mahrt,S.K.,Watt,I.N.,Neuberger,M.S.,andMalim,M.H.(2003).DNAdeaminationmediatesinnateimmunitytoretroviralinfection.Cell113(6),803-9.S咖brook,J"andRussell,D.W.(2001)."MolecularCloning:ALaboratoryManual."ThirdEditioned"3.3vols.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NewYork,Sheehy,A.M.,Gaddis,N.C.,Choi,J.D.,andMalim,M.H.(2002).IsolationofahumangenethatinhibitsHIV隱linfectionandissuppressedbytheviralVifprotein.Nature418(6898),646-50.Sv咖vskai^E.S.,Xu,H.,Mbis4J.L.,Barr,R.,Gorelick,R.J.,O加,A.,Freed,E.O.,Hu,W.S.,andPathak,V.K.(2004).HumanapolipoproteinBmRNA-editingenzyme-catalyticpolypeptide-like3G(APOBEC3G)isincorporatedintoHTV-lvirionsthroughinteractionswithviralandnonviralRNAs.JBiolChem279(34),35822-8.序列表说明SEQIDNo.1是P129A核苷酸序列SEQIDNo.2是P129A氨基酸序列SEQIDNo.3是P129G核苷酸序列SEQIDNo.4是P129G氨基酸序列SEQIDNo.5是P129D核苷酸序列SEQIDNo.6是P129D氨基酸序列SEQIDNo.7是P129F核苷酸序列SEQIDNo.8是P129F氨基酸序列SEQEDNo.9是D128K核苷酸序列犯QIDNo.10是D128K氨基酸序列SEQIDNo.11是A3G—CI的核苷酸序列SEQIDNo.12是A3G—CI的氨基酸序列SEQIDNo.13是A3G—C2的核苷酸序列SEQIDNo.14是A3G—C2的氨基酸序列SEQIDNo.15是A3G—C3的核苷酸序列SEQIDNo.16是A3G—C3的氨基酸序列犯QIDNo.17是A3G—C4的核苷酸序列SEQIDNo.18是A3G—C4的氨基酸序列SEQIDNo.19是A3G—C5的核苷酸序列SEQIDNo.20是A3G—C5的氨基酸序列SEQIDNo.21是A3G—C6的核苷酸序列SEQIDNo.22是A3G—C6的氨基酸序列SEQIDNo.23是A3G一CD1的核苷酸序列SEQIDNo.24是A3G_CD1的氨基酸序列SEQIDNo.25是A3G一CD2的核苷酸序列SEQIDNo.26是A3G—CD2的氨基酸序列SEQIDNo.27是A3G—CD3的核苷酸序列SEQIDNo.28是A3G一CD3的氨基酸序列SEQIDNo.29是A3G一CD4的核苷酸序列SEQIDNo.30是A3G一CD4的氨基酸序列SEQIDNo.31是A3G—CD5的核苷酸序列SEQIDNo.32是A3G—CD5的氨基酸序列SEQIDNo.33是A3G—CD6的核苷酸序列SEQIDNo.34是A3G—CD6的氨基酸序列犯QIDNo.35是APOBEC3G野生型的cDNA核苷酸序列(基因库的索引号BC024268)SEQIDNo.36是与SEQIDNo.35相对应的氨基酸序列SEQIDNo.37是APOBEC3GHis核苷酸序列SEQIDNo.38是与SEQIDNo.37相对应的氨基酸序列<formula>formulaseeoriginaldocumentpage39</formula>〈110〉时旭生物医药科技(上海)有限公司〈120〉抑制HIV复制的突变型APOBEC3G分子及其应用<藤38<2隨<211>醒<212>DNA<213>人工序列<220><223>AP0BEC3GP129Amutant<220><221>CDS<222>(5)..(1231)<400>1aaggatgaagcctcacttcagaaacacagtggagcgaatgtatcgagacaca52MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr151015ttctectac幼cttttat幼tagacccatectttctcgtegg幼tacc100PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530gtctggctgtgctacgaagtgE迈aacaaagggtccctea鄉ccccct148Va]TrpteuCysTyrGluVall,ysThrLysGlyProSerArgProPro354045ttggacgcaaagatetttcgaggccaggtgtattecgaacttaagtac196LeuAspAlaLysliePheArgGlyGinValTyrSerGluLeuLysTyr505560cacccagagatgagattcttccactggttcageaagtggaggaagctg244HisProGluMetArgPhePheHisTrpPheSerLysTrpArgLysLeu65707580catcgtgaccaggagtatgaggtcacetggtacatatectggageccc292HisArgAspGinGluTyrG]uValThrTrpTyrlieSerTrpSerPro859095tgcacaaagtgtacaagggatatggccacgttcctggccgaggacccg34039<formula>formulaseeoriginaldocumentpage40</formula>LeuAspGinAspTyrArgValThrCysPheThrSerTrpSerProCys275280285ttcagePheSer290tgtgcccagCysA]aGingaaGluatgMet295getAlaLysUcPheattlieteaSer300lysAsn犯aLysC3CHJs916gtgageValSer305ctgtgcateLeuCysliet.l:cPhe310actThrgccAlacgcArgatelietatTyr315gatAspgatcaaAspGinggaGly卿Arg320964CysGingaggggctgGLuGlyLeu325cgc.Argax'.cThrctgLeugccAlagagGlu330getAlagggGlygccsaaAlaLys3ttlie335teaSer1012ataatgTieMetacat£icagtThrTyrSe'r340g朋GluUtPhe」yscacHis345tgcCystggTrpgacAspacctttThrPhe350gtgValgacAsp1060caccagHisGinggatgtcccGlyCysPro355UcPhecagGJn360tggTrpgatAspggaGlyetaLeugatgagAspGlu365cacHisageSer1108G]nAsp370ctgagtgggLeuSerGlyaggArgctgLeu375eggArggccAlaattlieetcLeucagGin380aatcagAsnGing肪Glu肪cAsn1156Aagctt.LysLeu385gggcccgaaGlyProGluca.aGin390LysetcLeuatelietC£lSergaaGlu395gagGlug3tctgAspLeuAsnageSer4001204gccgtcA]aValgaccat.catAspHisHis405HiscatHiscatHiscatHistgagtttaaa1241<210〉2〈211〉409〈212>PRT〈213>人工序列〈220〉〈223〉AP0BEC3GP129Amutant〈400〉2MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr11015PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530ValT卬LeuCysTyrGluVa丄LysThriLysGlyProSerArgProPro354045LeuAspAlaLysliePheArgGlyGinValTyrSerGluLeuLysTyr505560HisProGiuMetArgPhePheHisTrpPheSerLysTrpArgLysLeu65707580HisArgAspGinGluTyrGluValThrTrpTyrlieSerTrpSerPro859095CysThrLysCysThrArgAspMetAlaThrPheLeuAlaGluAspPro100105110LysValThrLeuThrI:丄ePheValAlaArgLeuTyrTyrPheTrpAsp115120125AlaAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140ProArgAlaThrMetLyslieMetAsnTyrAspGluPheGinHisCys145150155160TrpSerLysPheValTyrSerGinArgGluLeuPheGluProTrpAsn165170175AsnLeuProLysTyrTyrlieLeuLeuHislieMetLeuGlyGlulie180185190LeuArgHisSerMetA'spProlJroThrPheThrPheAsnPheAsnAsn195200205GluProTrpValArgGlyArgHisGluThrTyrLeueysTyrGluVal210215220GluArgMetHisAsnAspThrTrpValLeuLeuAsnGinArgArgGly225230235240AlaProHisLysHisGlyPheLeuGluGlyArg245250255HisAlaGluLeuCysPheLeuAspVallieProPheTrpLysLeuAsp260265270LeuAspGLnAspTyrArgValThrCysPheThrSerTrpSerProCys275280285PheSerCysAlaGinGluMetAlaLysPhelieSerLysAsnLysHis290295300VaiSerLeuCysIePheThrAlaArglieTyrAspAspGinGlyArg305310315320CysGinGluGlyLeuArgThr:」euAlaGluAlaGlyAlaLyslieSer325330335lieMetThrTyrSerGluPheHisCysTrpAspThrPheValAsp340345350HisGinGlyCysProPheGinProTrpAspGlyLeuAspGluHisSer355360365GinAspLeuSerGlyArgLeuArgAlalieLeuGinAsnGinGluAsn370375380LysLeuGlyProGluGinLysLeulieSerGluGluAspLeuAsnSer385390395400AlaValAspH:isHisHisHisHisHis405<210〉3<2U>1241〈212〉,〈213>人工序列〈220〉〈223〉AP0BEC3GP129Gmutant<220><221>CDS<222>(5).(1231)〈400>3aaggatg£iagcctcacttcagaaacacagtggagcgaatgtatcgagacaca52MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr151015ttctectacaacttttataat;柳cccatectttctcgteggaatacc100PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530gtctggctgtgctacgaagtgaaaacaaagggtcccteaaggccccct148Va丄TrpLeuCysTyrG]uValLysThrLysGlyProSerArgProPro354045ttggacgcaaagatetttcgaggccaggtgtattecgaacttaagtac1%LeuAspAlaLysliePheA:rgGlyGinValTyrSerGluLeuLysTyr505560caccc3I-lisPro65gagGiuatgMetagaArgUcPhe70ttcPhecactggttcHisTrpPheageSer75aagtggaggLysTrpArgLysCtgLeu80244catcgtgaccaggagtatgaggtcacctggtacatatectggageccc292HisArgAspGinGluTyrGluValThrTrpTyrlieSerTrpSerPro859095tgcacaCysThrLystgtCys10acaThraggArggatAsp;itggccacgMetAlaThr105ttcPhectggccgagLeuAlaGlu110gacAspccgPro340aaggttaccctgaccatetttgttgcccgcetctactacttctgggac388LysVa.l.ThrLeuThrliePheValAlaArgLeuTyrTyrPheTrpAsp115120125ggcgattaccaggaggcgctt('.gcagectgtgtcagaaaagagacggtGlyAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140436ccgcgtgccaccatgaagateatgaattatgacgaatttcagcactgt484ProArgAlaThrMetLyslieMetAsnTyrAspGluPheGinHisCys145150155160tggageaagttcgtgtacagecaaagagagetatttgagccttggaat532TrpSerLysPheValTyrSerGinArgGluLeuPheGluProTrpAsn165170175<table>tableseeoriginaldocumentpage45</column></row><table>caccagggatgtcccHisGinGlyCysPro355caagacctgagtgggGinAspLeuSerGly:370AagcttgggcccgaaLysLeuGlyProGlu385gccgtcgaccatcatAlaVaAspHisHis405〈210>4<211>409<212>PRT<213〉人工序列<220><223>AP0BEC3GP129G<400MMetLysProHisPhe15ttcPhe郷ArgC3£lGin390catHisGinctgLeu375LyscatHiscccPro360eggArgetc乙eucatHistgggatggaetagatgagcacage1108TrpAspGlyLeuAspGluHisSer365gccattetccagaatcaggaaaac1156AlalieLeuGinAsnGinGluAsn380ateteagaagaggatctg犯tage1204lieSerGluGluAspLeuAsnSer395400cattgagtttaaa1241HismutantArgAsnThrValGluArgMetTyrArgAspThr1015PheSerTyrAsnPheTyrAsn《rgProlieLeuSerArgArgAsnThr202530ValTrpLeuCysTyrGluValLysThrLysGlyProSerArgProPro354045LeuAspAlaLysliePheArgGlyGinValTyrSerGluLeuLysTyr505560HisProG]uMetArgPhePheHisTrpPheSerLysTrpArgLysLeu65707580HisArgAspGinGluTyrGluValThrTrpTyrlieSerTrpSerPro859095CysThrLysCysThrArgAspMetAlaThrPheLeuA丄aGluAspPro100105110LysValThrLeuThrliePheValAlaArgLeuTyrTyrPheTrpAsp115L20125GlyAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140ProArgAlaThrMetLyslieMetAsnTyrAspGluPheGinHisCysM5150155160TrpSerLysPheValTyrSerGinArgGluLeuPheGluProTrpAsn165170175AsnLeuProLysTyrTyrI]eLeuLeuHislieMetLeuGlyGlulie180185190LeuArgHisSerMetAspProProThrPheThrPheAsnPheAsnAsn195,205GluProTrpValArgGlyArgHisGluThrTyrLeuCysTyrGluVal210215220GluArgMetHisAsnAspThr':、rpValLeuLeuAsnG]nArgArgGly225230235240PheLeuCysAsnG]nAlaProHisLysHisGlyPheLeuGluGlyArg245250255HisA:laGIuLeuCysPheLeuAspVallieProPheTrpLysLeuAsp260265270LeuAspGinAspTyrArgValThrCysPheThrSerTrpSerProCys275280285PheSerCysAlaGinGluMetAlaLysPhelieSerLysAsnLysHis290295300ValSerLeuCysIePheThrAlaArgI].eTyrAspAspGinGlyArg305310315320CysGinGluGlyLeuArgThrLeuAlaGluAlaGlyAlaLyslieSer325330335lit'MetThrTyrSerGluPhel,ysHisCysTrpAspThrPheVaJAsp340345350His(;]nGlyCysProPheGinProTrpAspGlyLeuAspGluHisSer355,60365GinAspLeuSerGlyArgLeuArgAlalieLeuGinAsnGinGluAsn:370375380LysLt'uGlyProGluG丄nLysLeulieSerGluGluAspLeuAsnSer385390395400AlaValAspHisHisHisH]'sHisHis〈210〉5〈211〉1241〈212>DNA<213>人工序列〈220〉〈223〉APOBEC3GP129Dmutant〈220><221>CDS<222>(5)..(1231)〈400〉5aaggatgaagccLcacttcagaaacacagtggagcgaatgtatcgagacaca52Metl」ysProHisPheArgAsnThrVa:lGluArgMetTyrArgAspThr151015ttctectacPheSerTyraacAsn20t.tttatPheTyrAsn,柳ArgcccPro25atectttctlieLeuSercgtArgeggaatArgAsn30Thr100gtctggctgVa丄TrpLeu35tgcCystacgaaTyrGJugtgVal幼340ax:aThraagggtcccLysGlyProteaSer45aggcccArgProcctPro148ttggacgcaLeuAspA]a50aagLysat(:tttIk、PhecgaArg55ggcGlycagGingtgtattecValTyrSer60g朋GlucttaagLeuLystacTyr196cacccagagHisProGlu65atgMetagaUcArgPhe70ttcPhecacHistggTrpttcageaagPheSerLys75tggTrpaggaagArgLysctgLeu80244catcgtgaccaggagUit:gaggtcacctggtacatatectggageccc292l.lisArgAspG]nGluTyrGluValThrTrpTyrlieSerT'rpSerPro859095tgcacaCy,sThrtgtCys100Thr观ggatAspatgMetgccAla105acgThrttcPhectgLeugccAlagagGlu110g£lCAspccgPro340LysValticcThrL15ctgLeu3CCThrJitCI]etuPheVal120gccAlacgcArgetcLeutacTyrtacTyr125ttcPhetggTrpgacAsp388gacgatAspAsp130ttiCTyrcagGing观GlugcgA]acttLeu135':gcArgageSerctgLeutgtCyscagGin140Lys卿gacAspggtGly436ccgcgtProArg145gccA]a3CCThrMeleuagLys150lieatgMetAsntatTyrgateAsp155gaaGlutttPhecagGinC£LCHistgtCys160484tggageTrpSerLysUcPhegtgVal165tacTyrageSer(:犯(;ln卿ArggagGlu170etaLeutttPhegagGlucctProtggTrp17583tAsn532朋tctgAsnl」eucctProLys180tatTyrtat,Tyrliel'euctgLeu185C3CHisatelieatgMetctgLeugggGly190gagGluattlie580etcHga匕euArgcacHis195tegSerMetgatAspProcccI)ro2003C3ThrttcPheactThrttcPheaacAsn205tttPheAsnAsn628gaacctGluPro210tggTrpgtcVal卿Arggg3Glyegg215catHisgagGluactThrtacTyrctgLeu220tgtCystatTvrgagGlugtgVal676gagcgcGluA:rg225atgMetcacHis朋tAsng£LCAsp230ThrTrpgtcValctgL>euctgLeu235Asnc缚GincgcArg鄉ArgggcGly240724tttct,aPheLeutgcCysAsncagGin245getAlaCC£lProcatHisLyscticHis250ggtGlyUcPhecULeugaaGluggcGly255cgcArg772catgcagagctgtgcttcctggacgtgattcccttttggaagctggac820HisAlaGluLeuCysPhe260AspVallieProPheTrpLysLeuAsp265270ctggaccaggactacagggtt:icctgcttcacctectggageccctgcLeuAspGinAspTyrArgVa丄ThrCysPheThrSerTrpSerProCys275280285868ttcagetgtgcccaggaa.atggetaaattcattteaaaaaacaaacacPheSerCysAlaGinGluMetAlaLysPhelieSerLysAsnLysHis290295300916gtgagectgtgcatettcactgcccgcatetatgatgatcaaggaagaValSerLeuCysliePheThrAlaArglieTyrAspAspGinGlyArg305310315320964tgtcaggaggggCysGinG:luGlyctgLeu325cgcArg3CCThr':tgLeugccAlag观Glu330getggggccGlyAlaLysattlie335teaSer1012ataatgacatacagl.gaatttaagcactgctgggacacctttgtggaclieMetThrTyrSerGluPheLysHisCysTrpAspThrPheValAsp3403453501060caccagggatgtcccUccagccctgggatggaetagatgagcacageHisGinGlyCysProPheGinProTrpAspGlyLeuAspGluHisSer3553603651108caagacctgagtgggaggctgegggccattetccagaatcaggaaaacGinAspLeuSerGlyArgLeuArgAla[leLeuGinAsnGinGluAsn3703753801156AagcttgggcccgaacaaaaaetcateteagaagaggatctgaatageLysLeuGlyProGluG]nLysLeulieSerGluGluAspLeuAsnSer3853903954001204gccgtcgaccatAla,ValAspH.iscettHis405catHiscatHiscatHiscatHistgagtttaaa1241<210>6<211>409<212>PRT<213〉人工序列〈220〉〈223〉APOBEC3GP129Dmutant〈400〉6MetLys1ProHisPheArgAsnThrValGluArgMetTyrArg510AspThr15PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530ValTrpLeuCysTyrGluV;alLysThrLysGlyProSerArgProPro354045LeuAspAlaLysliePheA:rgGlyGinValTyrSerGluLeuLysTyr505560HisProGluMetArgPhePheHisTrpPheSerLysTrpArgLysLeu65707580HisArgAspGLnGluTyrGluValThrTrpTyrlieSerTrpSerPro859095CysThrLysCysThrArgAspMetAlaThrPheLeuAlaGluAspPro100105110LysValThrLeuThrI]ePheValAlaArgLeuTyrTyrPheTrpAsp115120125AspAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140ProArgAlaThrMetLyslieMetAsnTyrAspGluPheGinHisCys145150155160TrpSerLysPheValTyrSerGinArgGluLeuPheGluProTrpAsn165170175AsnLeuProLysTyrTyrlie^euLeuHislieMetLeuGlyGlulie180185190LeuArgHisSerMetAspProProThrPheThrPheAsnPheAsnAsn195200205GluProTrp'ValArgGlyArgHisGluThrTyrLeuCysTyrGluVal210215220GluArgMetHisAsnAspThr'TrpValLeuLeuAsnGinArgArgGly225230235240PheLeuCysAsnGinAlaProHisLysHisGlyPheLeuGluGlyArg245250255HisAlaGluLeuCysPheLeuAspVallieProPheTrpLysLeuAsp260265270LeuAspGinAspTyrArgValThrCysPheThrSerTrpSerProCys275280285PheSerCysAlaGinGluMetAlaLysPhelieSerLysAsnLysHis290295300ValSerLeuCys丄lePheThrAlaArglieTyrAspAspGinGlyArg305310315320CysGinG]uGlyLeuArgThrLeuAlaGluAlaGlyAlaLyslieSer325330335丄IeMetThrTyrSerGluPheLysHisCysTrpAspThrPheValAsp340345350His(;lnG:lyCysProPheGinProTrpAspGlyLeuAspGluHisSe.r355360365GinAspLeuSerGlyArgLeuArgAlalieLeuGinAsnGinGluAsn370375380Ly'sLeuGlyProGluGinLysLeulieSerGluGluAspLeuAsnSer385390395400AlaValAspHisHisHisHisHisHis405〈210〉7〈211>1241〈212>DNA〈213>人工序列〈220〉〈223〉AP0BEC3GP129Fmutant〈220〉〈221〉CDS〈222>(5)..(1231)<400>7幼ggatgaagcctca,ct:tcagaaacacagtggagcgaatgtatcgagacaca52MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr151015ttc.tectacaacttttataat:igacccatectttctcgteggaatacc100PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530gtctggctgtgctacgaagtgaaaacaaagggtcccteaaggccccct148ValTrpLeuCysTyrGluVal乙ysThrLysGlyProSerArgProPro354045ttggacgcaaagatetttcga.ggccaggtgtattecgaacttaagtac196LeuAspA]aLysliePheArgGlyGinValTyrSerGluLeuLysTyr505560cacccagagatgagattcttccactggttcageaagtggagg犯gctg244HisProGluMetArgPhePheHisTrpPheSerLysTrpArgLysLeu65707580catcgtgaccaggagtatgaggtcacctggtacatatectggageccc292HisArgAspGinGluTyrGluValThrTrpTyrI]eSerTrpSerPro859095tgcacaaagtgtacaagggatatggccacgttcctggccgaggacccg340CysThrLysCysThrArgAspMetAlaThrPheLeuAlaGluAspPro100105110aaggttaccctgaccatetttgtt,gcccgcetctactacttctgggac388LysValThrLeuThr]iePheVaiAlaArgLeuTyrTyrPheTrpAsp115120125Ucgattaccaggaggcgcttcgcagectgtgtcagaaaagagacggt436PheAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140ccgcgtgccaccatgaagateatg组tatgacgaatttcagcactgt484ProArgAlaThrMetLysI丄eMetAsnTyrAspGluPheGinHisCys145150155160tggageTrpSer£l£lgLysttcPhegtgVal165tacTyrageSerc幼Gin卿gagGlu170etaLeutttPheg明GlucctProtggTrp175a_£itAsn532f迈tctgAsnLeucctPro333Lys180tatTyrtatTyr3t3liet.taL,euctgLeu185cacHisatelieatgMetctgLeugggGly190gagGluattlie580etcagaLeuArgC3CHis195tegSeratgMet.gatAspCC3Pro('.ccPro200ThrttcPheactThrttcPheAsn205mPhet迈cAsnAsn628gaacctGluPro210tggTrpgtcVal缚aArgggaGlyCggAxg215catHisgagGluactThrtacTyrCtgLeu220tgtCystatTyrgagGlugtgVal676gagcgcGluA:rg225atgMetcacHisAsngacAsp2303CCThr1'ggTrpgtcValctgLeuctgLeu235aacAsncagGincgcArgaggArgggcGly240724tttetaPheLeutgcCysAsncagG]n245getAlaCC3ProcatHisLysca_cHis250ggtGlyUcPhecttLeug肪GluggcGly255cgcArg772catgcaHisAlagagGluctgleu260tgcCysttcPhectgLeugacAspgtgVal265attliecccProtttPhetggTrpLys270ctgLeugacAsp820ctggaccaggactacagggttacctgcttcacctectggageccctgc868LeuAspGinAspTyrArgValThrCysPheThrSerTrpSerProCys275280285ttcagePheSer290tgtCysgccAlacagGing33GluMet295getAlaLysttcPhelieteaSer300Lys犯cAsnLyscacHis916gtgageVa.lSer305ctgLeutgcCysatelieUcPhe310actThrAlacgcArgatelietatTyr315gatAspgatAspc朋GinggaGly卿Arg320964tgtcagCysGingagGlugggGlyctgLeu325cgcArgaccThrctgLeugccAlagagGlu330getAlagggGlygccAlaLysattlie335Ser1012ataatgacaUicagtgaattta.agcac1:gctggUeMetThrTyrSerG:luPheLysHisCysTrp340345gacacctttgtggac1060AspThrPheValAsp350caccagggatgtcccttccagccctgggatggaHis(;]nGlyCysProPheGinProTrpAspGly355:柳etagatgagcacage1108LeuAspGluHisSer365c朋gacctgagt;gggaggGinAspLeuSerG]yArg370ctg(:gggccattetccag肌tcaggaaaacLeuArgAlalieLeuGinAsnGinGluAsn3753801156AagcttgggcccgaacaaaaaetcateteagaaLysLeu(;]yProGluGinLysLeulieSerGlu385390395gaggatctgaatage1204GluAspLeuAsnSer400gccgtcgaccatAlaValAspHiscatcatHisHis405catcatcattgagttt肌EiHisHisHis1241〈210>8〈211〉409〈212>PRT〈213〉人工序列<220>〈223〉AP0BEC3GP129Fmutant<400>8MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr151015PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530ValTrpLeuCysTyrGluVall」ysThrLysGlyProSerArgProPro354045LeuAspAlaLysliePheArgGlyGinValTyrSerGluLeuLysTyr505560HisProGluMetArgPhePheHisTrpPheSerLysTrpArgILysLeu65707580HisArgAspGinGluTyrGluValThrTrpTyrlieSerTrpSerPro859095CysThrLysCysThrArgAspMetAlaThrPheLeuAlaGluAspPro100105110LysValThrLeuThrliePheValAlaArgLeuTyrTyrPheTrpAsp115120125PheAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140ProArgAlaThrMetLyslieMetAsnTyrAspGluPheGinHisCys145150155160TrpSerLysPheValTy.rSerGinArgGluLeuPheGluProTrpAsn165170175Asni,euProLysTyrTyr丄.leLeuLeuHislieMetLeuGlyGlulie180185190LeuArgHisSerMetAspProProThrPheThrPheAsnPheAsnAsn195200205Glul)roTrpValArgG丄yArgHisGluThrTyrLeuCysTyrGluVal210215220ArgMetHisAsnAspThrTrpValL,euLeuAsnGinArgArgGly225230235240PheLeuCysAsnGinAlaProHisLysHisGlyPheLeuGluGlyArg245250255HisAlaGluLeuCysPheLeuAspVallieProPheTrpLysLeuAsp260265270LeuAspGinAspTyrArgValThrCysPheThrSerTrpSerProCys275280285PheSerCysAlaG丄nGluMetAlaLysPhelieSerLysAsnLysHis290295300ValSerLeuCysliePheThrAlaArglieTyrAspAspGinGlyArg305310315320<formula>formulaseeoriginaldocumentpage57</formula><table>tableseeoriginaldocumentpage58</column></row><table>tttcta.tgcaacca.ggetccacataaacacggtttccttgaaggccgc772PheLeuCysAsnGinAlaProHisLysHisGlyPheL,euGluGlyArg245250255catgcagagctgtgctt.cctggacgtgattcccttttggaagctggac820HisAlaGluL,euCysPheLeuAspVallieProPheTrpLysLeuAsp260265270ctggaccaggactacagggttacctgcttcacctectggageccctgc868LeuAspGinAspTyrArgVaThrCysPheThrSerTrpSerProCys2751!8()285ttcagePheSer290tgtgccAlacagGinG]uatgMet295getAla333匕ysttcPheattlieteaSer300LysAsn&&3LysC3CHis916gtgagectgtgcateUcactgcccgcatetatgatgatcaaggaaga964ValSerLeuCysliePheThrAlaArglieTyrAspAspGinGlyArg305310315320tgtcagCysGingagGugggGlyctgLeu325cgcArga_ccThrctgLeugccAlagagGlu330getAlagggGlygccaaa.AlaLysattlie335teaSer1012ataatgacatacagtgaatttaagcactgctgggacacctttgtggac1060lieMetThrTyrStTGluPheLysHisCysTrpAspThrPheValAsp340M5350caccagggatgtcccttccag(;cctgggatggaetagatgagcacage1108HisGinGlyCysProPheGinProTrpAspGlyLeuAspGluHisSer355360365caagacctgagtgggaggctgegggccattetccagaatcaggaaaac1156GinAspLeuSerGlyArgLeuy\rgAlalieLeuGinAsnGinGluAsn370375380Aagcttgggcccgtificaaauaaetcateteagaagaggatctgaatage1204LysLeuGlyProGluG]nLysLeulieSerGluGluAspLeuAsnSer385390395400gccgtxgaccatcatca,tca,tcatcattgagtttaaa1241AlaValAspHisHisHisHisbisHis405〈210>10<211M09〈212〉PRT<213〉人工序列〈22()><223>AP0BEC3GD128Kmutant.〈40()M0MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr151015PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530Val'TrpLeuCysTyrGluValL,ysThrLysGlyProSerArgProPro354045LeuAspAlaLysliePheArgGlyGinValTyrSerGluLeuLysTyr505560HisProG:luMetArgPhePheHisTrpPheSerLysTrpArgLysLeu65707580HisArgAspGinGluTyrGlu\a]ThrTrpTyrlieSerTrpSerPro859095CysThrLysCysThrArgAspMetAlaThrPheLeuAlaGluAspPro100105110LysValThrLeuThrJlePheValAlaArgLeuTyrTyrPheTrpLys115〗20125ProAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140ProArgAlaThrMetLyslieMetAsnTyrAspGluPheGinHisCys145150155160TrpSerLysPheValTyrSerGinArgGluLeuPheGluProTrpAsn165170175AsnLeuProLysTyrTyrI:leLeuLeu.HislieMetLeuGlyGlulie180185190Leu.'VrgHisSerMetAspProProThrPheThrPheAsnPheAsnAsn195200205GluProTrpValArgGl.yArgHisGluThrTyrLeueysTyrGluVal2t0215220GluArgMetHisAsnAspThrTrpValLeuLeuAsnGinArgArgGly225230235240PheLeuCysAsnGinAlaProHisLysHisGlyPheLeuGluGlyArg245250255HisAlaGluLeuCysPheLeuAspVallieProPheTrpLysLeuAsp260265270LeuAspG]nAspTyrArgValThrCysPheThrSerTrpSerProCys275280285PheSerCysA丄aGinG丄uMetAlaLysPhelieSerLysAsnLysHis290295300Va—ISerLeuCys丄lePheThrAlaArglieTyrAspAspGinGlyArg305310315320Cys(;lnG]uGiyLeuArgThrLeuAlaGluAlaGlyAlaLyslieSer325330335lieMetThrTyrSerG丄uPheLysHisCysTrpAspThrPheValAsp340345350His(;lnGlyCysProPheGinProTrpAspGlyLeuAspGluHisSer355360365GinAspLeuSerGlyArgLeuArgAlalieLeuGinAsnGinGluAsn370375380LysLeuGlyProG:luGinLysLeulieSerGluGluAspLeuAsnSer385390395400A丄aValAspHisHisHisHisHisHis405<210〉11〈21]M1:U<212雄<213>人工序列〈220).<221〉CDS〈222〉(1)…(1131)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列〈400>11atgaagcct.cactlxagaaac£.cagtggagcgaatgta.tcgagac45Metl,ysProHisPheArgAsnThrValGluArgMetTyrArgAsp151015acattcThrPhetecSerta.cTyrAsn20Pheta.tTyrAsn卿ArgcccPro25ateliecttLeutctSercgtArgegg90Arg30AsnThrgtcValtggTrpctg35tgcCysTyrgaaGlugtgValLys40Thrl,ysggtGlycccProtea135Ser45aggcccArgProcctProttgLeugacAsp50gcaAla助gLystitclietttPhecgaArg55ggcGlycagGingtgValt3tTyrtec180Ser60g幼cttGluLeuLystacTyrC3CHis65ProgagGluatgMetaga/\rgttcPhe70ttcPheC3CHistggTrpUcPheage225Ser75aagtggLy'sTrpagg幼gCtgLeu80catHiscgtArggacAspcagGingagGlu85tatTyrgagGlugtcValaccThrtgg270Trp90TyriletecSertggTrpage95cccProtgcCys;iC3ThrLystgtCys100seaThraggArggatAspatgMetgcc315Ala105acgUcThrPhec.tgLeugccAlagaggacAspccgProaaggttValaccThr115ctgLeu;accThrateliettcPhegtt360Val120gcccgcetctactacU,ctgg,gacccagattaccaggaggcgctt405<image>imageseeoriginaldocumentpage63</image>ProLysPheSerLysAlaGinLysMetAlaLysPhelieSerAsn290295300AsnLyscatHisgt.gValageSer305UgLeutgc3tClieUcPhegetAla310gccAlacgcArgatelietatTyrgat945Asp315g3tCMAspG]nG]yArgtgt320cagGingagGlugggGlyctgLeucgcArg3253CCThrctgLeucacHisaggArggat990Asp330ggggccGlyAlaLysattliegcaAla335gtgValatgMet3acAsntacTyragtSer340gaaGlutttPhegagGlutacTyrtgc1035Lys345tgggacTrpAspax:cTh:rttt[)hegtgVal350gacAspcgcArgcagGinggaGlycgtArg355cccProttcPhecagGincccProtggTrp3601080gatggaAspGlyetaLeuga,tAspgagGlu365C3CHisageSercaaGingccAlactgLeu370agtSergggGly郷ArgcttLeuegg1125Arg375gccattA]alie1131〈210>12<211>377〈212〉PRT<213>人工序列<220>〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<40()>12Metl,ysProHisPheArgAsn"IhrValGluArgMetTyrArgAsp151015ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AsnThrVa丄TrpLeuCysTyrGluValLysThrLysGlyProSer354045ArgProProL,euAspA]aLysliePheArgGlyGinValTyrSer505560GJul.euLysTyrHisProG丄uMetArgPhePheHisTrpPheSer657075LysT卬ArgLysLeuHisA:rgAspGinGluTyrGluValThrTrp808590Tyr]leSerTrpSerProCysThrLysCysThrArgAspMetAla95100105ThrPheLeuAlaGluAspProLysValThrLeuThrliePheVal110115120AlaArgLeuTyrTyrPheTrpAspProAspTyrGinGluAlaLeu125130135ArgSerLeuCysGinLysArgAspGlyProArgAlaThrMetLys140145150lieMetAsnTyrAsnGluPhe(;丄nHisCysTrpAsnGluPheVal155160165AspGlyGinGl.yLysProPheLysProArgLysAsnLeuProLys170175180HisTyrThrLeuLeuHisAlaThrLeuGlyGlyLeuLeuArgHis185190195ValMet:AspProGlyThrPheThrSerAsnPheAsnAsnLysPro200205210TrpValSerGlyGinArgGlurhrTyrLeuLysTyrLysValGlu215220225ArgSerHisAsnAspThrTrpValLeuLeuAsnGinHisArgGly230235240PheLeuArgAsnGinAlaProAspArgHisGlyPheProLysGly245250255ArgHisAlaG]uL,euLysPheLeuAspLeulieProPheTrpLys260265270LeuAspAspGinGinTyrArgValThrLysPheThrSerTrpSer275280285ProLysPheSerLysAlaGinL.ysMetAlaLysPhelieSerAsn290295300AsnLysHisValSerLeuLys]lePheAlaAlaArglieTyrAsp305310315AspGinGlyArgLysGinGluGlyLeuArgThrLeuHisArgAsp320325330GlyAlaLyslieAlaValMetAsnTyrSerGluPheGluTyrLys335340345TrpAspThrPheValAspArgGinGlyArgProPheGinProTrp350355360AspGlyLeuAspGluHisSer(;lnAlaLeuSerGlyArgLeuArg365370375Alalie<210M3〈211>1131<212〉DNA<213〉人工序列<220><221>CDS〈222〉(1)…(1131)〈223〉人工合成的变异型人类AP()BEC3G蛋白质的核苷酸序列<400>13atgaagcctcacttcagaaac;acagtggagcgaatgtatcgagac45MetLysProHisPheArgAsnThrValGluArgMetTyrArgAsp151015acaUctectacaacttttat.aatagacccatectttctcgtegg90ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530aataccgtctggctgtgctacgaa,gtgaaaacaaagggtccctea135AsnThrValTrpLeuCysTyrGluValLysThrl>ysGlyProSer354045aggccccctttggacgcaaagatetttcgaggccaggtgtat.tec180ArgProProLeuAspAlaLysliePheArgGlyGinValTyrSer505560gaacttaagtaccacccagagatgagattcttccactggttcage225GluLeuLysTyrHisProGluMetArgPhePheHisTrpPheSer657075aagtggaggaagctgcatcgtgaccaggagtatgaggtcacctgg270LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590tacatatectggageccctgcacaaagtgtacaagggatatggcc315TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAla95100105acgttcctggccgaggacccgaaggttaccctgaccatettcgtt360Thrl)heLeuAlaG丄uAspProl,ysValThrLeuThrliePheVal110115120gcccgcetctac.tacttctgggacccagattaccaggaggcgctt405AlaArgi」euTyrTyrPheTrpAspProAspTyrGinGluAlaLeu125130135cagaaaagagacggtccgcgtgccaccatgaag450GinLysArgAspGlyProArgAlaThrMetLys140145150cgcagectgtgtArgSerLeuCysateatgaattatlieMetAsnTyrTyrtattatatat:taTyrTyrlieLeugacgaattt(:£LgAspGluPheGin155ctgcacat:catgLeuHJslieMet185cactgttggageHisCysTrpSer160ccttgg£uataatProTrpAsnAsn175ctgggggagattLeuGlyGlylie190sagttcgtg495LysPheVa]165ctgcctaaa540LeuProLys180etcagacat585LeuArgHis195agec犯agagagetatttgagSerGinArgGluLeuPheGlu170txgatggatccaggcacgttcacttecaactttaacaata犯cct630SerMetAspProGlyThrPheThrSei'AsnPheAsnAsnLysPro200205210tgggtcagtggacagcgt.gagacttacctgtgttacgtggag675TrpVa丄Se.rGlyGinArgGlu'IhrTyrLeuLysTyrLysValGlu215220225cgct.cgA:rgSercacHisAsngacAsp230a_ccThrtggTrpgtcctgVa]l」euctgLeu235幼cAsncagGinC3CHisaggArgggc720Gly240tttetaPhel,eucgcArgAsnGin245getAlaProgat£igaAspArgC3CHis250ggtGlyttcPhecctProLysggc愿Gly255cgccatArg卜iisgcaAlagagGluctgLeu260tgcLysttcPhectggacL,euAspctgLeu265a_ttliecccProutPhetggTrpaag810Lys270ctggf丄tLeuAspgacAspCfigGinG.ln275taxTyr郷ArggttaccValThrtgcLys280ttcPhe3CCThrtecSertggTrpage855Ser285CCCLgCProLystttPheageSertgtLys290gccAlacagGin£咖iitgL,ysMetgetAla2953a3LysttcPheattlieteaSeraat900Asn300Asn匕ysca.tHisVala.gcSer305UgLeutgcLysatettcliePhegetAlei310gccAlacgcArgatelietatTyrgat945Asp315gatcaaAspGinGlyArgtgtl.ys320cagGingagGlugggctgGlyLeucgcArg3253CCThrctgleuC3CHis郷Arggat990Asp330ggggccGlyAlaLysattliegcaAla335gtgValatgMetAsnTyragtSer340GlutttPheg观GlutacTyrtgc1035Lys345tgggacTrpAspaccThrmPhegtgVal350gacAspcgcArg(;agggaGinGlycgtArg355cccProttcPheC3gGincccProtgg1080Trp360gatggaAspGlyetaLeugatAspgagGlu365C8CHisageSer(:giagcc(;lnAlactgL>eu370agtSergggGlyaggArgcttLeuegg1125Arg375gccatt1131Ala1L(<210>14<211〉377<212>PRT<213>人工序列〈220>〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<40()〉14MetLysProHis〖)heArgAsnThrValGluArgMetTyrArgAsp151015ThrPheSerTyrAsnlJheTyrAsnArgProlieLeuSerArgArg202530AsnThrValTrp1」euCysTyrGluValLysThrLysGlyProSer354045ArgProProLeuAspAlaLysliePheArgGlyGinValTyrSer505560(;luLeuLysTyrHisProGuMetArgPhePheHisTrpPheSer657075LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAla95100105ThrPheLeuAlaG]uAspProLysValThrLeuThrIePheVal1〗0115120AlaZ\rgl止'uTyrTy'rPheTrpAspProAspTyrGinGluAla.Leu125130135ArgSerLeuCysGinLysArgAspGlyProArgAlaThrMetLys140145150lieMetAsnTyrAspGluPhe(;lnHisCysTrpSerLysPheVal155160165TyrSerGinArgGluLeuPheGluProTrpAsnAsnLeuProLys170175180TyrTyrlieLeuLeuHislieMetLeuGlyGlylieLeuArgHis185190195SerMetAspPro(;lyThrPheThrSerAsnPheAsnAsnLysPro200205210TrpValSerGlyGinArgGluThrTyrLeuLysTyrLysValGlu215220225ArgSerHisAsnAspThrTrp\'alLeuLeuAsnGinHisArgGly230235240PheLeuArgAsnGinAlaProAspArgHisGlyPheProLysGly245250255ArgHisAlaGluLeuLysPhel,euAspLeulieProPheTrpLys260265270LeuAspAsp(;lnGinTyrArgValThrLysPheThrSerTrpSer275280285ProLysPheSerLysAlaGinl,ysMetAlaLysPhelieSerAsn290295300AsnLysHisValSerLeuLys[lePheAlaAlaArglieTyrAsp305310315AspGinGlyArgLysG'lnGluGlyLeuArgThrLeuHisArgAsp320325330G丄yAlaLyslieAlaValMetsnTyrSerGluPheGluTyrLys335340345T卬AspThrPheValAspArgGinGlyArgProPheGinProT卬350355360AspGlyLeuAspGluHisSerGlr.AlaLeuSerGlyArgLeuArg365370375Alalie<210〉15〈211>1131<212>隱〈213〉人工序列〈220><221〉CDS<222>(1)…(mi)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列<400〉15atgaagcctcacUcagaaaca.cagtggagcgaatgtatcgagac45MetL,ysProHisPheArgAsnlhrValGluArgMetTyrArgAsp151015acaUctectacaacUtt.ataatagacccatectttctcgtegg90ThrPheSerTyrAsnPheTy—rAsnArgProlieLeuSerArgArg202530aataccgt.ctggctgtgctacgaagtgaaaacaaagggtccctea135AsnThrValTrpLeuCysTyr(;luValLysThrLysGlyProSer354045aggccccctUggacgt:aaagatetttcgaggccaggtgtattec180ArgProProLeuA印AlaLys[lePheArgGlyGinValTyrSer505560gaacttaagtaccacccagagatgagattcttccactggttcage225GluLeuLysTyrHisProGluMetArgPhePheHisTrpPheSer657075aagtggaggaagctgcatcgtgaccaggagtatgaggtcacctgg270LysTrpArgLysLeuHisA:rgAspGinGluTyrGluValThrTrp808590tacatatectggageccctgcacaaagtgtacaagggatatggcc315TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAla95100105acgUcctggccgaggacccgaaggtta,ccctgaccatettcgtt360ThrPhel」euAlaGluAspProLysVa丄ThrLeuThrliePheVal110115120gcccgcetctactacUctgggacccagattaccaggaggcgcU405A]aArgLeuTyrTyrPheTrpAspProAspTyrGinGluAlaLeu125130135cgcagectgt.gt.cagaaaagagacggtccgcgtgccaccatgaag450ArgSerLeuCysGinLysA:rgAspGlyProArgAlaThrMetLys140145150atea,tg[leMet朋t:Asnta.tTvrgacAsp155g犯Gluut.PheGinC3CHistgtCys160tggTrp3gCSer朋gLysttcPhegtg495Val165tacageTyrSerC£l£l(;丄na.ga.ArggagGlu170etaLeuUtPhegagGlucctProtggTrp175助tAsn组AsnctgLeucctProaaa540Lys180tatta_tTyrTyrataliettaL,euctgLeu185C£ICHisatelleatgMetctgLeugggGly190gagGlylieetcLeu卿cat585His1951xgatgSerMetgatAspc.ct〗ProcccPro200ThrttcPheactThrttcPheAsn205tttPhe33CAsnAsng朋Glucct630Pro210tgggtcTrpVal卿GlycagArg215catHisgagGluactThrtacTyrctgLeu220tgtLystatTyrgagGlugtgValgag675Glu225cgcal.gArgMetca_cHisemtAsngacAsp230eiccThrtggTrpgtcValctgLeuctgLeu235幼cAsncagGinC3CHisaggArgggc720Gly240tttcuiPheLeucgcArg朋cAsnGin245getA]acctiProgatAsp卿ArgceicHis250ggtGlyttcPhecctProLysggc服Gly255cgccatArgHisgcaAlagagGluctgLeu260tgcLysttcPhectgLeugacAspctgLeu265attliecccProtttPhetggTrpaag810270Ctgg£lt匕euAspgacAspc邻Ginc幼Gin275tacTyraggArggttValaccThrtgcLys280UcPheaccThrtecSertggTrpage855Ser285ccctgcProLysUtPheageSerLys290gccAlaC3gGinLysatgMetgetAla295LysUcPheattlieteaSeraat900Asn300aacaaacatgtgagettgtgcatettcgetgcccgcatetatgat945AsnLysHisValSer305gatcaagga;柳tgtAsp(;lnGlyArgL,ys320ggggccaaaattgca(;lyAlaLyslieAla335tgggacaccUtgtgTrpAspThrPheVa]350gatggacUigtitgagAsp(、'lyLeuAsp(;]ugccatt1131Alalie<2i()>L6<2n>377<212>PRT<213>人工序列<22()〉〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列〈40()>16MetLysProHisPheArgAsnThrValGluArgMetTyrArgAsp151015Thri)heSe:rTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AsnThrValTrpLeuCysTyrGluValLysThrLysGlyProSer354045ArglJroProLeuAspAlaLys::lePheArgGlyGinValTyrSer505560GluLeuLysTyrHisProGluMetArgPhePheHisTi-pPheSer657075LeuLysHePheAlaAlaArglieTyrAsp310315caggaggggctgcgcaccctgcacagggat990GinGluGlyLeuArgThrLeuHisArgAsp325330gtgatgaactacagtgaatttgagtactgc1035ValMetAsnTyrSerGluPheGluTyrLys340345gaccgccagggacgtcccttcca.gccctgg1080AspArgGinGlyArgProPheGinProTrp355360cacagecaagccctgagtgggaggcttegg1125HisSer(;]nAlaLeuSerGlyArgLeuArg370375LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590Tyr1leSerTrpSerProCysThrLysCysThrArgAspMetAla95100105ThrPheLeuAlaGluAspProLysValThrLeuThrliePheVal110115120AlaArgLeuTyrTyrPheTrpAspProAspTyrGinGluAlaLeu125130135ArgSerLeuCysGinLysArgAspGlyProArgAlaThrMetLys140145150lieMetAsnTyrAspG丄uPheGinHisCysTrpSerLysPheVal155160165TyrSerGinArgGluLeuPheGluProTrpAsnAsnLeuProLys170175180TyrTyrlieLeuLeuHislieMetLeuGlyGlylieLeuArgHis185190195SerMetAspProProThrPheThrPheAsnPheAsnAsnGluPro200205210TrpValArgGyArgHisGluThrTyrLeuLysTyrGluValGlu215220225ArgMetHisAsnAspThrTrpValLeuLeuAsnGinHisArgGly230235240PheLeuArgAsnGinAlaProAspArgHisGlyPheProLysGly245250255ArgHisAlaGluLeuL,ysPheLeuAspLeulieProPheTrpLys260265270LeuAspAspGinGinTyrArgValThrLysPheThrSerTrpSer275280285ProLysPheSerLysAlaGinLysMetAlaLysPhelieSerAsn290295300AsnLysHisValSerLeuLysliePheAlaAlaArglieTyrAsp305310315AspGtnGlyArgLysG丄nGluGLyLeuArgThrLeuHisArgAsp320325330GlyAlaLyslieAlaVaMetAsnTyrSerGluPheGluTyrLys335340345TrpAspThrPheValAspArgGinGlyArgProPheGinProTrp350355360AspGlyLeuAspGluHisSe.rGinAlaLeuSerGlyArgLeuArg365370375Alalie<210>17〈21〗>1134<212〉廳<2]3〉人工序列<220><221>CDS<222>(1)…(1134)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列<400〉17atg;.迈gcctcactt.cMetLysProH:isPhe15acattctectacaacThrPheSerTyrAsn20aataccgtctggctgAsnThrVaJTrpLeu35aggccccctttggacArgProProLeuAsp50gaa.cttaagtar.cac75卿ArgAsnac;aThrgtgValgagGlu10Cg£lArgatgMettatTyrcgagac45ArgAsp丄5tttPhetatTyr;边tAsn卿ArgcccPro25ateliecttLeutctSercgtegg90ArgArg30tgctacgaagtgaaaacaetagggtccctea135CysTyrGluValLysThrLysGlyProSer4045gcaAlaLysatelietttPhecgaArg55ggcGlycagGingtgValtattec180TyrSer60CC3gagatgagattcttccactggttcage225LeuL.ysTyrHisProGluMetArgPhePheHisTrpPheSer657075犯gtggagg犯gctgcatcgtgaccaggagtatgaggtcacctgg270匕ysTrpArgl:.ysL,euHisArgAspGinGluTyrGluValThrTrp808590tacatatectggageccctgcacaaagtgtacaagggatatggcc315TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAla95100105ticgttcctggccg已ggacccg£3ggttaccThrPheLeuAlaGluAspProL,ysValThr110115ctgaccatettcgtt360LeuThrliePheVal120gcccgcetctactacttctgggacccagatAlaArgLeuTyrTyrPheTrpAspProAsp125130taccaggaggcgctt405TyrGinG]uAlaLeu135cgcagectgtgtcagaaaagagacggtccgArgSerLeuCysG]nLysArgAspGlyPro140145cgtgccaccstgaag450ArgAlaThrMetLys150ateatgaattatLieMetAsnTyrtaceigcc犯agsTyrSerGinArggacgaatttcagAspGluPheGin155gagetatttg已gGluLeuPheGlu170cactgttggageHisCysTrpSer160ccttggaataatProTrpAsnAsn175aagttcgtg495LysPheVal165ctgcctaaa540LeuProLys180tattatataUactgcacateatgctgggggagattetcagacat585TyrTyrlieLeuLeuHislieMetLeuGlyGlylieLeuArgHis185190195tcgatggatccacccacattcactttcaactttaacaatgaacct630SerMetAspProProThrPheThrPheAsnPheAsnAsnGluPro200205210tgggtcagaggacagcatgagacttacctgtgttatgaggtggag675TrpValArgGlyArgHisGluThrTyrLeuLysTyrGluValGlu215220225cgc.atgcacaatgacacctgggtxctgctgaaccagcgcaggggc720ArgMetHisAsnAspThrTrpVal230tttetatgcaaccaggetccacatPheLeuLysAsnGinAlaProHis245LeuLeuAsnGinArgArgGly235240aaacacggtttccttgaaggc765LysHisGlyPheLeuGluGly250255cgccatgcagagctgtgcttcctggacgtgattcccttttggaag810ArgHisAlaGluLeuLysPheLeuAspVallieProPheTrpLys260265270ctggacctggaccaggactacagggttacctgcttcacctectgg855LeuAspLeuAspGinAspTyrArgValThrLysPheThrSerTrp275280285ageccctgcUcagetgtgcccaggaaatggetaaattcattt,ca900SerProLysPheSe.rLysA]a('InGluMetAlaLysPhelieSer290295300aaaaacaaacacgtgagectgtgcatettcactgcccgcate1:at945LysAsnLysHisValSerLeul,ysliePheThrAlaArglieTy:r305310315gatgatcaaggaagaLgtcaggaggggctgcgcaccctgcacagg990AspAspGinGlyA:rgLysGin(;luGlyLeuArgThrLeuHisArg320325330gatggggcxaaaattgcagtgatgaactacagtgaatttgagtac1035AspGlyAlaLyslieAlaValMetAsnTyrSerGluPheGluTyr335340345tgctgggacacctttgtggaccgccagggacgtcccttccagccc1080LysT卬AspThrPheValAspArgGinGlyArgProPheGinPro350355360tgggatggaetagatgagcacagecaagccctgagtgggaggctt1125TrpAspGLyLeuAspGluHisSerGinAlaLeuSerGlyArgUrn365370375egggccatt1134ArgAlalie<2]()>18<211>378《212>PRT<213>人工序列〈220>〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列〈400>18MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspi51015ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AsnThrValTrpLeuCysTyrGluValLysThrLysGlyProSer354045ArgProProLeuAspAlaI,ysliePheArgGlyGinVal.TyrSer505560GluLeuLysTyrHis65LysTrpArgLysLeu80ProGluMetArgPhe70H'isArgAspGinGlu85PheHisTrpPheSer75TyrGluValThrTrp90TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAla95〗00〗05ThrPheLeuAlaGluAspProLysValThrLeuThrliePheVal1〗()115120AlaArgLeuTyrTyrPheTrpAspProAspTyrGinGluAlaLeu125130135ArgSerLeuCysGinLysArgAspGlyProArgAlaThrMetLys140145150lieMetAsnTyrAspGluPheGinHisCysTrpSerLysPheVa:t155160165TyrSerGinArgGluLeuPheGluProTrpAsnAsnLeuProLys170175180TyrTyrlieLeul丄、uHislieMetLeuGlyGlylieLeuArgHis185190195SerMetAspProProThr'Ph(,TirPheAsnPheAsnAsnGluPro200205210T卬Va丄ArgGlyArgHisGluThrTyrLeuLysTyrGluValGlu215220225ArgMet,HisAsnAspThrTrpVa]LeuLeuAsnG:LnArgArgG丄y230235240PheLeuLysAsnGinAlaProHtsLysHisGlyPheLeuGluGly245250255Ar.gi-lisAla(;luLeuLysPheL^uAspValJleProPheTrpLys260265270LeuAspLeuAspGinAspTyrArgValThrILysPheThrSerTrp275280285SerProLysPheSerLysAlaG」.nGluMetAlaLysPhelieSer290295300LysAsnLysHisValSerLeuL々'sliePheThrAlaArglieTyr305310315AspAspG].nGlyArgLysGinG]uGlyLeuArgThrLeuHisArg320325330Asp(;lyAlaLyslieAlaVa]MetAsnTyrSerG]uPheGluTy.r335340345LysTrpA印ThrPheValAspArgGinGlyArgProPheGinPro350355360TrpAspG]yl.euAspG丄uHisSerGinAlaLeuSerGlyArgLeu365370375ArgAlalie<210>19<211〉]134〈212〉DNA〈213〉人工序列〈22()>〈221墓<222〉(1)...(1134)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列<400〉19atgaagcctcacttcagaaacacagtggagcgaatgtatcgagac45MetLysProHisPheArgAsnTnrValGluArgMetTyrArgAspi51015a,cat:t.cThrPhetecSertacTyr肪cAsn20tuPhetatTyr33tAsn卿ArgcccPro25ateliecttLeutctSercgtegg90Arg30aataccAsnThrgtcValtggTrpLeu35tgcCystacTyrgaaG丄ugtgVal333Lys40Thr肪gLysggtGlycccProtea135Ser45aggcccArgProcct.ProgLeugacAsp50gcaAla卿3tClietttPhecgaArg55ggcGlycagGingtgValtatTyrtec180Ser60gaacttGluLeu鄉LystacTyrcacHis65CC3ProgagGlu3tgMet卿ArgUcPhe70■UcPhecacHistggTrpttcPhea.gc225Ser75aagtggLysTrp鄉ArgEl邻Lysctg匕eu80catH:iscgtArggacAspcagGingagGlu85tatTyrgagGlugtcVal3CCThrtgg270Trp90TyrlietecSertggTrpageSer95cccProtgcCysThr犯gLystgtCys100Thr郷ArggatAspMetgcc315Ala]05acgl.t:cThrPhectgLeugccAlagagGlu1]0gacAspccgProaagL,ysgttValEICCThr115ctgLeuThrateliettcPhegtt360Val120gcccgcAlaArgetcLeuta_cTyrTyr125ttcPhetggTrpgacAspCC3ProgatAsp〗30tacTyrcagGingagG丄ugcgAlactt匕eu135405cgcageArgSerctgL,eutgtCysC£lgG]nMOLysArggacAspggtGlyccgPro145cgtArggccAla3CCThratgMetaag450Lys150ateatgaattatgacgaatu(:agcactgttggageaagttcgtg495lieMetAsnTytAspG.luPheGinHisCysTrpSerLysPheVal155160165tacageTyrSt'rGin卿gagGlu170LeuPhGgagGlucctProtggTrp17533tAsnaatAsnctgLeucctProaaa540Lys180tattatTyrTyr3taHettaLeuctgLeu]85ca_cHis[le3tgMetctgLeugggGly190gagGlyattlieetcLeu卿Argcat585His195tcgatgSerMetgatAspccaProcccPro200Thr■ttcPhe3CtThrttcPheaacAsn205tttPheAsn朋tAsnGlucct630Pro210tgggtcTrpVal卿ArgggaGlycag215catHisgagGluact:ThrtacTyrctgLeu220tgtLystatTyrgagGlugtgValgagG巧Glu225cgcatgArgMetcacHisAsngacAsp2303CCThrtggTrpgtcValctgctgLeu235Asnc邻GincgcArgaggArgggc720Gly240tttetaPhel,.eutgcLysAsncag〔;]n245get.AlaCC3ProcatHisaaaLysC3CHis250ggtGlyttcPhecttLeug朋Gluggc765(;ly255cgccatArgHisgcaAlag3gGluctgLeu260tgcLysUcPhe〔.tg[,eugacAspgtgVal265attliecccProtttPhetggTrpaag810Lys270〔:tggacLeuAspctgLeuAspcagGin275gacAsptacTyragggttValThr280tgcLysUcPheaxeThrtecSertgg855Trp285HlgCCCCSerProtgcLysttcPheageSer290tgtLysgccAla(:agGinGluatgMet295getAlaaaaLysttcPheattlietea■Ser300LysAsn朋BLysC3CHisgtgVal305ageSerctgLeutgcateliettcPhe310actThrgccAlacgcArgatelietat945Tyr315gatgatcaaggaagatgtcaggaggggctgcgcaccctggccgag990AspAspGinGlyArgLysGinGluGlyLeuArgThrLeuAlaGlugetgggAlaGlytgctggLysTrptgggatTrpAspgecA]agacAspggaLys£1CCThretaLeu320attlie335t:UPhe350gatAsp365325330teaataatgacatacagtgaatttaagcac1035SerlieMetThrTyrSerGluPheLysHis340345gtggaccgccagggacgtcccttccagccc1080ValAspArgGinGlyArgProPheGinPro355360gagcac&gccaagecctgagtgggaggctt1125GluHisSerGinAlaLeuSerGlyArgLeu370375egggeceitt1134ArgAla.Jle<210>20<2〗1>378<212>PRT<220〉〈22.3〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<4()0>20MetLysProHisPheArgAsn'i,hrValGluArgMetTyrArgAsp151015ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AsnThrValT.rpLeuCysTyrGluValLysThrLysGlyProSer354045ArgProProLeuAspAlaLysLiePheArgGlyGinValTyrSer505560GluLeuLysTyrHisProGluvletArgPhePheHisTrpPheSer657075LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590TyrlieSerT卬SerProCys『hrLysCysThrArgAspMetAla95100105ThrPheLeuAla,GluAspProLysValThrLeuThrliePheVal110115120AlaArgLeuTyrTyrPheTrpAspProAspTyrGinGluAlaLeu125130135ArgSerLeuCysGinLysArgAspGlyProArgAlaThrMetLys140145150l丄eMetAsnTyrAspGluPheGinHisCysTrpSerLysPheVal155160165TyrSerGinArgGluLeuPheGluProTrpAsnAsnLeuProL,ys170175180TyrTyr]leLeuLeuHisI]eMetLeuGlyGlylieLeuArgHis185190〗95SerMetAspProProThrPheThrPheAsnPheAsnAsnGluPro200205210TrpValArg(;]yArgHisG]ulhrTyrLeuLysTyrGluValGlu2〗5220225ArgMetHisAsnAspThrTrp\'alLeuLeuAsnGinArgArgGly230235240PheLeuLysAsnGinAlaProHisLysHisGlyPheLeuGluGly245250255ArgHisAlaGluLeuLysPheL,euAspVallieProPheTrpLys260265270LeuAspLeuAspGinAspTyrArgValThrLysPheThrSerTrp275280285'SerProLysPheSerLysA〗—a(;lnGluMetAlaLysPhelieSer290295300LysAsnLysHisValSerLeuLysliePheThrAlaArglieTyr305310315AspAspGinGlyArgLysGinGluGlyLeuArgThrLeuAlaGlu320325330AlaGiyAlaLyslieSerlieMetThrTyrSerGluPheLysHis335340345LysTrpAspThrPheValAspArgGinGlyArgProPheGinPro350355360TrpA印GlyLeuAspGluHisSerGinAlaLeuSerGlyArgLeu365370375ArgAlalie<210>21〈211>1131<212〉DNA<213>人工序列〈220〉<221>CDS〈222〉(1)…(1131)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列<400>21atg犯tcct:C£i£iate£tga朋catggtggagc肪atgg£iaMetAsnProG丄nlieArgAsnMetValGluGinMetGlu10atattctiePheAsnThrgggcccGlyProgaggetGluAlagtcValgtcValcctProaagLystacTyrtggTrpttgLeugacAsp5tacTyr20ctgLeu35gacAsp50C£ICHis65ProttcPhetgcCysgcaAlaCC3ProAsritacTyr犯cAsngagGlu朋cAsnGluatelieatgMetArggtgValtttPheaagLyscccPro25Lys40c朋Gin55ttcPhe70atelieThrggcGlyetcLeucttLeuaagLys鄉LystctSe:rgacAspctgLeuC3CHistggTrpggtGlycctProtacTyrttcPhegac45Asp15egg90Arg30tea135Ser45ccc180Pro60cgc225Arg75aagtggaggcagctgcat.cgtgaccaggagtacgaggtcacctgg270.ysT卬ArgGinLeuHisArgAspGinGluTyrGluValThrTrp808590tacgtaTyrValtecSertggTrpageSer95cccProtgcCysac£iThr;柳ArgtgtCys100gC£lAlaAsnagtSergtgValgcc315Ala105acgttcThrPhectgLeugccAlagagGlu110gacAspccgProaagLysgttVal3CCThr115ctgLeuaccThratelietttPhegtt360Val120gcccgcAlaArgetcLeutacTyrtacTyr125ttcPhetggTrpgacAspCC3ProgatAsp130tacTyrcagGincagGingcgAlactt405Leu135cgcateArgTiectgLeutgtCyscagGin140g朋Glu卿ggcGlyggtGlyccgPro145catHisgccAla3CCThratgMetaag450Lys150a^tcatglieMetaatAsntatTyra_acAsn155g犯GlutttPhecaaGincacHistgtCys160tggTrp犯cAsngagGluttcPhegtg舰Val165gacggcAspGlyGinggaGly朋gLys170ccaProtttPheaagcctProeggArg175LysAsnctgLeucctPro朋a.540180cattatHisTyrThrLeuctgL>eu185C3CHisgccAlaacgThrctgLeugggGly190gagGlucttLeuetcLeu卿Argcat585His195gtgatgVa]MetgatAspccaProggcGly200ThrttcPheactThrtecSer犯cAsn205mPheAsnAsn3aaLyscct630Pro210tgggtcTrpValagtSerggaGlycagGin215cgtArgg观GluactThrtacTyrctgLeu220tgtCystacTyr£l£lgLysgtgValgag675Glu225cgctcgArgSerC3CHis朋tAsngacAsp230accThrtggTrpgtcValctgLeuctgLeu235認cAsncagGinC3CHisaggArgggc720Gly240Utct.acgcaaccaggetccagatagacacggtttccctaaaggc765PheLeuArgAsnGinAlaProAspArgHisGlyPheProLysGly245250255cgccatgcaArgHisAlagagGluctgLeu260tgcCysUcPhectggacctgL,euAspL,eu265attliecccProtttPhetggTrp鄉810Lys270ctggatgacLeuAspAspcagGinC£13Gin275tacTyraggArggttacctgcValThrCys280ttcPheEICCThrtecSertggTrpage855Ser285ccctgctttProCysPheageSertgtCys290gccAlacagGinf腿atggetLysMetAla295aaaLysttcPhe3ttlieteaSeraat900Asn300幼ca朋catAsnLysHisgtgValageSer305ttgLeutgcCvsitcttcgetlePheAla310gccAlacgcateI]etatTyrgat945Asp315gatcaaggaAspGinGlyArgtgt,Cys320cagGinGlugggctgcgc(;lyLeuArg3253CCThrctgLeucacHisaggArggat990Asp330ggggccaaaGlyAlaLysattliegca.Ala335gtgValatgMet;iactacagtAsnTyrSer340GlutttPhegagGlutacTyrtgc1035Cys345tgggacacctttgtggaccgccagTrpAspThrPheValAspArgGin350gatggacUigatgagcacagecaaAspGlyLeuAsp(;〗uHisSerGin365ggacgtcccttccagccctgg1080GlyArgProPheGinProTrp355360gccctgagtgggaggcttegg1125AlaLeuSerGlyArgLeuArg370375gccatt113丄Alalie<210>22〈211>377<212>PRT〈2K3〉人工序列<220>〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<400〉22MetAsnProGinlieArgAsnMetValGluGinMetGluProAsp151015liePheValTyrTyrPheAsnAsnArgProlieLeuSerGlyArg202530AsnThrValTrpLeuCysTyrGluValLysThrLysAspProSer354045GlyProProLeuAspAlaAsn]lePheGinGlyl.,ysLeuTyrPro505560GluAlaLysAspHisProGluMetLysPheLeuHisTrpPheArg657075LysTrpArgGinLeuHisArgAspGinGluTyrGluValThrTrp808590TyrValSerTrpSerProCysThrArgCysAlaAsnSerValAla95100105ThrPheLeuAl.aGluAspProLysValThrLeuThrliePheVal110115120AlaArgLeuTyrTyrPheTrpAspProAspTyrGinGinAlaLeu125130135ArglieLeuCysGinG]uArgGlyGlyProHisAlaThrMetLys140145150lieMetAsnTyrAsnGluPheGinHisCysTrpAsnGluPheVal155160165AspGlyGl.nG]yLysProPheLysProArgLysAsnLeuProLys170175180HisTyrThrLeuLeuHisAl—aThrLeuGlyGluLeuLeuArgHis185190195ValMetAspProGlyThrPheThrSerAsnPheAsnAsnLysPro200205210TrpValSerGlyGinArgGluThrTyrLeuCysTyrLysValGlu225ArgSerHisAsnAspThrTrpValLeuLeuAsnGinHisArgGly230235240PheLeuArgAsnGinAlaProAspArgHisGlyPheProLysGly245250255ArgHisAlaGluLeuCysPheLeuAspLeulieProPheTrpLys260265270LeuAspAspGinGinTyrArgValThrCysPheThrSerTrpSer275280285Pro(:ysPheSerCysAlaGinLysMetAlaLysPhelieSerAsn290295300AsnLysHisVa'LSerLeuCys〕lePheAlaAlaArgI〗eTyrAsp305310315AspGinGlyArgCysGinGJuGlyLeuArgThrLeuHJsArgAsp320325330(;]yA丄aLysJeAlaValMetAsnTyrSerGluPheGluTyrCys335340345TrpAspThrPheValAspArgGinGlyArgProPheGinProTrp350355360AspGlyLeuAsp(UuHisSerGinAlaLeuSerGlyArgLeuArg365370375Alalie〈21()〉23<211>1131〈212>DNA<213>人工序列〈220〉<221〉CDS<222>(1)…(1131)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列<40()>2:3<table>tableseeoriginaldocumentpage89</column></row><table>gacggcAspGlyGinGlyLys170ProtttPhe卿LyscctProegg175犯gLysAsnctgLeucctProa£is540Lys180catLatHisTyra,c3ThrttaLeuctg匕eu185C3CHisgccAlaacgTh:rctgLeugggGly190gagGlycttLeuetcLeu卿Argcat585His195gtgEltgValMetgatAspCC3ProggcGly200acgThrttcPheactThrtecSeraacAsn205tttPheAsnAsnLyscct630Pro210tgggtcTrpValSergg3GlyGin215cgtArggagGlu3CtThrtacTyrctgLeu220tgtLystacTyr犯gLysgtgValgag675Glu225cgctegArgSerC3CHis331.AsngacAsp230accThrtggTrpgtcValctgLeuctgLeu235朋cAsncagGinC3CHis郷Argggc720Gly240tttetaPheLeucgcArgsuaeAsncagGin245getAlaCC3ProgatAsp卿ArgcacHis250ggtGlyttcPhecctProLysggc765Gly255cgccatArgHisgcaAlagagGluctgLeu260tgcLysttcPhectgLeugacAspctgLeu265attliecccProtttPhetggTrpaag810L,ys270ctggatLeuAspgacAspcagGinGin275tacTyraggArggttVal3CCThrtgcLys280ttcPheaxeThrtecSertggTrpage855Ser285ccctgcProLystttPheageSertgtLys290gccAlacagGinLysatgMetgetAla295LysUcPheattlieteaSeraat900Asn300AsnLyscatHisgtgValageSer305ttgLeutgcLysate]leUcPhegetAla310gccAlacgcArgatelietatTyrgat945Asp315gatcaaAspGinggaGly卿ArgtgtLys320cagGing缚GlugggGlyctgLeucgcArg3253CCThrctgLeuC3CHis郷Arggat990Asp330ggggccaaaattgcagtgatgaactacagtgaatttgagtacGlyAlaLysLieAlaV;ilMet/vsnTyrSerGluPheGluTyr335340tgggacacctt.tgtggaccgc(:agggacgtcccttccagcccTrpAspThrPheValAspArgGinGlyArgProPheGinPro350355gatggaetagatgagcacage(:aagccctgagtgggaggcttAspGlyLeuAspGuHisSer(;lnAlaLeuSerGlyArgLeu365370gccatt1131Alalie〈210〉24<211>377〈212〉PRT〈213〉人工序列<220>〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<400>24tgc1035Lys345tgg1080Trp360(:gg1125/\rg375MetLysProHisPhe15ArgAsnThrValGluArg10MetTyrArgAsp15ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AsnThrValTrpLeuCysTyrGluValLysThrLysGlyProSer354045ArgProProLeuAspAla.LysliePheArgGlyGinValTyrSer505560GluLeuLysTyrHisProGluMetArgPhePheHisTrpPheSer657075LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAla95100105ThrPheLeuAlaGluAspProLysValThrLeuThrliePheVal110115120Al.aArgLeuTyrTyrPheTrpAspAspAspTyrGinGluAlaLeu125130135ArgSerLeuCysGLnLysArgAspGlyProArgAlaThrMetLys140145150丄leMetAsnTyrAsnGluPheGinHisCysTrpAsnGluPheVal155160]65AspGlyGinGlyLysProPheL,ysProArgLysAsnLeuProLys170175.80HisTyrThrLeuLeuHisAlaThrLeuGlyG—lyLeuLeuArgHisL85190195ValMetAspProGlyTlirPheThrSerAsnPheAsnAsnLysPro200205210TrpValSerGlyGinArgGluThrTyrLeuLysTyrLysValGlu215220225ArgSerHisAsnAspThrTrpValLeuLeuAsnGinHisArgGly230235240PheLeuArgAsnGinAiaProAspArgHisGlyPheProLysGly245250255ArgHisAlaGluLeuLysPheLeuAspLeulieProPheTrpLys260265270LeuAspAspGinGinTyrArgValThrLysPheThrSerTrpSer275280285ProLysPheSerLysAlaGinLysMetAlaLysPheILeSerAsn290295300AsnLysHisValSerLeuLys工lePheAlaAlaArglieTyrAsp305310315AspGinG:lyArgLysG丄nGluGlyLeuArgThrLeuHisArgAsp320325330(;lyAJaLyslieAlaValMetAsnTyrSerGluPheGluTyrLys335340345TrpAspThrPheVa]AspArgGinGlyArgProPheGinProTrp:〗50355360Asp(;lyLeuAspGluHisSerGinAlaLeuSerGlyArgLeuArg365370375Alalie<21()>25〈211>1131〈212>DNA〈213>人工序列<220〉〈221>CDS<222>(1)…(1131)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列<400>25atgaagcctcacttcagaaacacagtggagcgaatgtatcgagac45MetLysProHisPheArgAsnThrValGluArgMetTyrArgAsp15L015acat.tctectacaacttttataatagacccatectttctcgtegg90ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530助tacegtctggctgtgctacgaagtgaaaacaaagggtcccteaAsnThrValTrpLeuCysTyrGluValLysThrLysGlyProSer354045135aggccccctttggacgcaaag.itctttcgaggccaggtgtattecArgProProLeuAspAaLysliePheArgGlyGinValTyrSer505560180gaacUaagtaccacccagagatgagattcttccactggttcage225GluLeuLysTyrHisProGluMetArgPhePheHisTrpPheSer657075aagtggaggaagctgcatcgtgaccaggagtatgaggtcacctgg270LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590tacataTyr:11etecSertggTrp£igcSer95cccProtgcCys3ca_Thr卿LystgtCys100Thr观gArggatAspatgMetgcc315Ala105acgttcThrPhectgLeugccAlagagGlu110gacAspccgProaagLysgttValaccThr115ctgteuaccThrateliettcPhegtt360Val120gcccgcAlaArgetcLeutacTyrtacTyr125ttcPhetggTrpgacAspgacAspgatAsp130tacTyrcagGingagGlugcgAlactt405Leu135cgca.gcArgSe.rctgLeutgtCyscagGin140Lys卿ArggacAspggtGlyccgPro145cgtArggccAla3CCThra/tgMetaag450Lys150atetitglieMet33tAsntatgacAsp155g£UrlGlutuPhecagGinceicHistgtCys160tggTrpageSer朋gLysttcPhegtg495Val165tacageTyrSerc朋Gina_gaArgg缚Glu170etaLeumPhegagGlucctProtggTrp175朋tAsnaatAsnctgLeucctProaaa540Lys180tattatTyrTyr3t3liettaLeuctgLeu185C3CHisatelieatgMetctgLeugggGly190gagGlyattlieetcLeu卿cat585His195tcgtitgSerMetgatAspccaProggcGly200acgThrttcPhe3CtThrtecSer朋cAsn205tttPheAsnAsnL/yscct630Pro210tgggtcTrpValagtSerggaGlycagGin215cgtGluactThrta_cTyrctg220tgtLystacTyraagLysgtgValgag675Glu225cgctcgArgSerCE1CHis朋tAsngacAsp230accThrtggTrpgtcValctgLeuctgLeu235sacAsncagGinC3CHisaggggc720Gly240PheLeucgcArg肪cAsnca,gGin245getAlaCC3ProgatAsp卿ArgC3CHis250ggtGlyttcPhecctPro333Lysggc765Gly255cgccatArgHisgcaAlagagGluctgLeu260tgcLysttcPhectgLeugacAspctgleu265attliecccProtttPhetggTrp肌g810Lys270ctggatgaccagcaatacagggttacctgcttcacctectggage855LeuAspAspGinGinTyrArgValThrLysPheThrSerTrpSer275280285ccctgctttagetgtgcccagaaaatggetaaattcattteaaat900ProLysPheSerLysAlaGinLysMetAlaLysPhelieSerAsn290295300aacaaacatgtgagettgtgcatettcgetgcccgcatetatgat945AsnLysHisValSerLeuL,ysliePheAlaAlaArglieTyrAsp305310315gatcaaAspGinggaGlyagaArgtgtLys320cagGingagGlugggGlyctgLeucgcArg325accThrctgLeuC3CHisaggArggat990Asp330ggggccaaaattgcagtgatgaactacagtgaatUgagtactgc1035GlyAlaLysI]eAlaVa丄MetAsnTyrSerGluPheGluTyrLys335340345tgggacTrpAspaccThrtttPhegtgVal350gacAspcgcArgcagGinggaGlycgtArg355cccProttcPhecagGincccProtgg1080Trp360gatggaAspGlyetaLeugatAspgagGlu365C£ICHisageSerGingccAlactgLeu370agtSergggGly3ggArgcttLeueggU25Arg375gccatt1131Alalie<210〉26〈211〉377〈212〉PRT〈213>人工序列〈220〉〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<400>26MetLysProHisPheArgAsnThrValGluArgMetTyrArgAsp151015ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AsnThrValTrpLeuCysTyrGluValLysThrLysGlyProSer354045ArgProProLeuAspAlaLysliePheArgGlyGinValTyrSer505560GluLeuLysTyrHisProGl丄iMetArgPhePheHisTrpPheSer657075LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAla95100105ThrPheLeuAlaGluAspProLysValThrLeuThrliePheVal110115120AlaArgLeuTyrTyrPheTrpAspAspAspTyrGinGluAlaLeu125130135ArgSerLeuCysGinLysArgAspGlyProArgAlaThrMetLys140145150lieMet.AsnTyrAspGluPheGinHisCysTrpSerLysPheVal155160165TyrSer(;lnArgGluLeuPheGluProTrpAsnAsnLeuProLys170175180TyrTyr丄丄eLeuLeuHislieMetLeuGlyGlylieLeuArgHis185190195SerMetAspProGlyThrPheThrSerAsnPheAsnAsnLysPro200205210TrpValSerGl—yGinA:rgGluThrTyrLeuLysTyrL,ysValG丄u215220225ArgSerHisAsnAspThrTrpValLeuLeuAsnGinHisArgGly230235240PheLeuArgAsnGinAlaProAspArgHisGlyPheProLysGly245250255ArgHisAlaGluLeuLysPhel,euAspLeulieProPheTrpLys260265270LeuAspAspGinGinTyrArgValThrLysPheThrSerTrpSer275280285ProLysPheSer1」ysAlaGinl,ysMetAlaLysPhelieSerAsn290295300AsnLysHisValSerLeuLys〗lePheAlaAlaArglieTyrAsp305310:〗15AspGin(;]yArgLysG丄nGluGlyLeuArgThrLeuHisArgAsp320325330GlyAlaLyslieAlaValMetAsnTyrSerGluPheGluTyrLys335340345TrpAspThrPheValAspArgGinGlyArgProPheGinProTrp350355360AspGlyLeuAspGluHisSerGinAlaLeuSerGlyArgLeuArg365370375Alalie〈210>27<211>113]<212>DNA<213>人工序列〈220〉<22]〉CDS<222>(1)…(113〗)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列<40()>27atgfciagcctcacttcagaaacacagtggagcgaatgtatcgagac45Met.LysProHisPheArgAsnThrValGluArgMetTyrArgAsp1510]5ThrPhet.cctacSerTyrAsr]20PhetatTyrtat邓BAsnArgcccPro25ateliecttLeutctSercgtegg90ArgArg30i边tHCCAsnThrgtctggV&i]TrpctgLeu35tgcCysTyr,gtg(;luVal犯£1Lys40acaThr鄉ggtGlyccctea135ProSer45aggc:cccctttggacgcaaagatetttcgaggccaggtgtattec180ArgProProLeuAspALaLys]lePheArgGlyGinValTyrSer505560g犯cttG丄uLeu朋gtacLysTyrc;ac.His65Pro鹏GluatgagaMetArgUcPhe70ttcPhecarHistggTrpttcage225PheSe厂75aagtggaggaagct:gcatcgt明ccaggagtatgaggtcacctgg270LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590tac.atatectggageccctgcacaaagtgtacaagggatatggcc315TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAla95100105acgttcctggccgaggacccg;aaggttaccctgaccatettcgtt360ThrPheLeuAlaGluAspPro—.ysValThrLeuThrliePheVal1L0115120gcccg'cA]fiArgetctacLeuTyrtax、.Tyr1.25ttcPhetggTrpspAspgat.Asp130tacTyrcagGingagGlugcgctt405AlaLeu135cgcageArgSerctgtgtLeuCyscagGinM()L.ys卿ArggacggtAspGlyccgPro145cgtArggccAlaa.ccThratgaag450MetLys150ateatgI]c、MetaattatAsnTyrgacAsp155gaaGlutttPhec;agcacGinHistgtCys160tggTrp3gcSeraagLysttcgtg495PheVal165tacageTyrSerc犯3gaGinArggagGlu170etaLeuUtPhegagcctGluProtggTrp175aatAsnAsnctgLeucctaaa540ProLys180<formula>formulaseeoriginaldocumentpage99</formula>t.gggacaccttt,gtggaccgccagggacgtcccttccagccctgg1080TrpAspTh'rPheValAspArgGinGlyArgProPheGinProTrp350355360gatggaetagatgagcacage(加gccctgagtgggaggcttegg1125AspGlyL,euAspGluHisSerGinAlaLeuSerGlyArgLeuArg365370375gccatt1131Ala[le<21()〉28<211>377<212>PRT<213>人工序列〈220>〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<400>28MetLysProHisPheArgAsnThrValGluArgMetTyrArgAsp151015ThrPheSerTyrAsnPheTyr\snArgProlieLeuSerArgArg202530AsnThrValTrpLeuCysTyrGluValLysThrLysGlyProSer354045ArgProProLeuAspAlaLysliePheArgGlyGinValTyrSer505560Glul,euLysTyrHisProGluMet,ArgPhePheHisTrpPheSer657075LysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590Tyrlie'SerTrpSerProCysThrLysCysThrArgAspMetAla95100105ThrPheLeuAlaGluAspProLysValThrLeuThr[lePheVal110115120AlaArgLeuTyrTyrPheTrpAspAspAspTyrGinGluAlaLeu125130135ArgSerLeuCysG]nLysArgAspGlyProArgAlaThrMetLys140145150lieMetAsnTyrAspGluPheGinHisCysTrpSerLysPheVal155160165SerGinArgGluLeuPhe(;luProTrpAsnAsnLeuProLys170175180TyrTyr:[].eLeuLeuHislieMetLeuGlyGlylieLeuArgHis185190195SerMetAspProProThrPheThrPheAsnPheAsnAsnGluPro200205210TrpValArgGlyArgHisGluThrTyrLeuLysTyrGluValGlu215220225ArgMetHisAsnAspThrTrpValLeuLeuAsnGinHisArgGly230235240PheLeuArgAsnGinAlaProAspArgHisGlyPheProLysGly245250255ArgHisAlaGluLeuLysPheLeuAspLeulieProPheTrpLys260265270LeuAspAspGinG]nTyrArgVaiThrLysPheThrSerTrpSer275280285ProLysPheSerLysAlaGinLysMetAlaLysPhelieSerAsn290295300AsnLysHisValSe:rLeuLysliePheAlaAlaArglieTyrAsp305310315AspGinGlyArgLysGinGluGlyLeuArgThrLeuHisArgAsp320325330AlaLyslieAlaValMetAsnTyrSerGluPheGluTyrLys335340345TrpAspThrPheValAspArgGinGlyArgProPheGinProTrp350355360Asp(;—lyLeuAspGluHisSerGinAlaLeuSerGlyArgLeuArg365370375Ala11e<210〉29<211>1134〈212〉DNA<213>人工序列〈220〉<221>CDS<222>(1)…(1134)〈223〉人工合成的变异型人类AP()BEC3G蛋白质的核苷酸序列〈400>29atgaagcctcacttcagaaac.acagtggagcgaatgtatcgagac45MetLysProHisPheA'rgAsnThrValGluArgMetTyrArgAsp151015acaUctectacaactUtataatagacccatectttctcgtegg90ThrPheSerTyrAsnPheTyrAsn.ArgProlieLeuSerArgArg202530aataccgtctggctgtgctacgaagtgaaaacaaagggtccctea135AsnThrVaJTrpLeuCysTyrGluValLysThrLysGlyProSer354045aggccccctttggacgcaaagatetttcgaggccaggtgtattec180ArgProProLeuAspAlaLysliePheArgGlyGinValTyrSer505560gaacttatigtaccacccagagatgagattcttccactggttcage225GluLeuLysTyrH〗sProGluMetArgPhePheHisTrpPheSer657075aagtggaggaagctgcatcgtgaccaggagtatgaggtcacctgg270LysT.rpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590tacatatectggageccctgcacaaagtgtacaagggatatggcc315TyrlieSerTrpSe'rProCysThrLysCysThrArgAspMetAla95100105acgUcThrPhectgLeugccAlag3gGlu110gacAspccgProaagLysgttValaccctgThrLeu1153CCThrate[lettcPhegtt360Val120gcccgcAlaArgetc力uTyrt3CTyr125ttcPhetggTrpgacAspgacAspgattacAspTyr130C3gGing3gGlugcgAlactt405Leu135cgcageArgSerctgLeutgtCyscagGin140Lysagaga_cAspggtGlyccgcgtProArg145gccAla3CCThratgMetaag450]50ateatgtieMetAsntatTyrgacAsp155GlutuPhe〔.agGinC3CHistgttggCysTrp160ageSerlysttcPhegtg495Val165tacageTyrSerc朋Gin聊ArggagGlu170etaLeutt.tPhegagGlucctProtggaatTrpAsn175a_atAsnctgLeucctProaaa540Lys180tati.atTyrTyrata丄lettaLeuctgLeu185ca_cHisatelieatgMetctgLeuggggagGlyGly190attlieetc匕eu卿Argcat585His195tcgatgSerMetgatAspccaProcccPro200ThrttcPheThrttcPheaactttAsnPhe205AsnAsng幼Glucct630Pro210tgggtcTrpVa]卿ArgggaGlycagArg215catHisGluactThrtacTyrctgtgtLeuLys220tatTyrg观GlugtgValgag675Glu225cgcatgArgMetC3CHis助tAsngacAsp2303CCThrtggTrpgtcValctgLeuctgaacLeuAsn235cagGincgcaggArgggc720Gly240tttetaPheLeutgcLysAsncagGin245getAlaccaProcatHisLyscacggtHisGly250ttcPhecttLeug幼Gluggc765Gly255cgccatArgHisgcaAlagagGluctgLeu260tgcLysUcPhectgLeugacAspgtgattVallie265cccProUtPhetggTrpaag810Lys270ctggacctggaccaggactacagggttacctgcttcacctectgg855LeuAspLeuAspGinAspTyrArgValThrl.,ysPheThrSerTrp275280285ageccctgcttcagetgtgcccaggaaatggetaaattcatttea900SerProLysPheSerLysAlaGinGluMetAlaLysPhelieSer290295300aaaaacaaacacgtgagectgtgcatettcactgcccgcatetat945LysAsnLysHisVa]SerLeuLysliePheThrAlaArglieTyr305310315gatgatAspAspGinggaGly卿Arg320tgtLyscagGingagGlugggGlyctgLeu325cgcArg3CCThrctgLeucacHisagg990Arg330gatggggccaaaattgcagtgatgaactacagtgaatttgagtac1035AspGlyA]aLyslieAlaValMetAsnTyrSerGluPheGluTyr335340345tgctggLysTrpgacAspaccThrtuPhe350gtgValgacAspcgcArgC3gGinggaGly355cgtArgcccProttcPhecagGincccPro3601080tgggatTrpAspGlyetaLeugatAsp365gagGlucacHisageSerc幼GingccAla370ctgLeuagtSergggGlyaggArgctt1125Leu375egggccatt1134ArgAlalie〈210〉30<21]>378<212>PRT〈213〉人工序列<220>〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<400>30MetLysProHisPheArgAsnThrValGluArgMetTyrArgAsp151015ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AsnThrValTrpL,euCysTyrGluValLysThrLysGlyProSer354045ArgProProLeuA印AlaLys]lePheArgGlyGinValTyrSer505560GluLeuLysTyrHisProG]uMetArgPhePheHisTrpPheSer657075LysTrpA.rgLysLeuHisArgAspGinGluTyrGluValThrTrp808590TyrI丄eSerTrpSerProCysThrLysCysThrArgAspMetAla95100〗05ThrF)heLeuAlaGluAspProL,ysValThrLeuThrliePheVal110115120AlaArgLeuTyrTyrPheTrpAspAspAspTyrGinGluAlaLeu125]30J35ArgSerL,euCysGinLysArgAspGlyProArgAlaThrMetLys140145150ILeMetAsnTyrAspGluPheGinHisCysTrpSerLysPheVal155160165TyrSerGinArgGluLeuPheGluProTrpAsnAsnLeuProLys170175180TyrTyrlieLeuLeuHis工leMetLeuGlyGlylieLeuArgHis185190195SerMetAspP:roProThrPheThrPheAsnPheAsnAsnGluPro200205210TrpValArgGlyArgHisGluThrTyrLeuLysTyrGluValGlu215220225ArgMetHisAsnAspThrTrpValLeuLeuAsnGinArgArgGly230235240PheLeuLysAsnGinAlaProHisLysHisGlyPheLeuGluGly245250255ArgHisAlaG]uLeuLysPheLeu260LeuAspLeuAspGinAspTyrArg275SerPro!LysPheSerLysAla(;ln290LysAsnLysHisValSerLeuLys305AspAspG丄nGlyArgLysGinGlu320AspGlyAlaLysILeAlaValMet335LysTrpAspThrPheValAsprg350TrpAspGlyLeuAspGluHisSer365ArgAlaLie<21()〉31<211>1134〈212〉隱〈213>人工序列〈220〉<221>CDS〈222〉(1)…(1134)〈223〉人工合成的变异型人类APOBEC3G蛋白质的核苷酸序列<400〉31atg幼gcctcacttcagaaacacagtggagcgaatgtatcgagac45MetLysProHisPheArgAsnThrValGluArgMetTyrArgAsp151015acattctectacaa.cttttataat.agacccatectttctcgtegg90ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AspVallieProPheTrpLys265270ValThrLysPheThrSerTrp280285GluMetAlaLysPhelieSer295300liePheThrAlaArglieTyr310315GlyLeuArgThrLeuHisArg325330AsnTyrSerGluPheGluTyr340345GinGlyArgProPheGinPro355360GinAlaLeuSerGlyArgLeu370375朋t3CCAsnThrgtcValtggTrpctgLeu35tgcCysTyrGlugtgValL>ys40Thra_agLysggtGlycccProtea135Ser45aggcccArgProcctProttgLeugacAsp50gcaAlaLysfitxlietttPhecgaArg55ggcGlycagGingtgValtatTyrtecSer60180gaacttGlu匕euaagtacTyrCEICHis65CC3ProgagG]uatgMetagattcPhe70ttcPhecacHistggTrpttcPheage225Ser75aagtggLysTrpagg/VrgaagCtgLeu80catHiscgtArggac/邻cagGingagGlu85tatTyrgagGlugtcVal£LCCThrtgg270Trp90tacataTyr工letecSertggTrpageSe:r95cccProtgcCvsThraagLystgtCys100ThraggArggatAspatgMetgcc315Ala!05acgt:tcThr'PhectgLeugccAlagagGlu110gacAspccgProaagLysgttValaccThr115ctgLeu£ICCThrateliettcPhegtt360Val120gcccgcAlaArgetcLeutacTyrtacTyr125ttcPhetggTrp砂cAspgacAspgatAsp130tacTyrcagGingagGlugcgAlactt405Leu135cgcageArgSerctgLeutgtCyscagGinMOl>ys卿ArggacAspggtGlyccgPro145cgtArggccAla£ICCThratgMetaag450Lys150atea_tglieMetE迈tAsntatTyrAsp155gaa_GlutttPhecagGinca_cHistgtCys160tggTrpageSer鄉LysttcPhegtg495Val165tacageTyrSerGin卿ArggagGlu170etaLeutuPhegagGlucctProtggTrp175AsnaatAsnctgLeucctProaaa540Lys180tattatTyrTyratalieleuctgLeu185ca.cHisate工]eatgMetctgLeugggGly1.90gagGlyattlieetcLeu卿Argcat585His195tcgatggat,ccacccacattcadttcaactttaacaatgaacct630SerMetAspProProThrPheThrPheAsnPheAsnAsnGluPro200205210tgggtcagaggacagcatgagacttacctgtgttatgaggtggag675TrpVaArgGlyArgHisGluTnrTyrLeuLysTyrG]uValGlu215220225cgcat.gcacaatgacacctgggtcctgctgaaccagcgcaggggc720ArgMetHisAsnAspThrTrpValLeuLeuAsnGinArgArgGly230235240tttetatgcaaccaggetccacataaacacggtttccttgaaggc765PheLeuLysAsnGinA]aProHisLysHisG]yPheLeuGluGly245250255cgccatgcagagctgtgcUcctggacgtgattcccttttggaag810ArgHisAlaGluLeuLysPhel一euAspValI]eProPheTrpLys260265270ctggacctggaccaggactacagggttacctgcttcacctectgg855LeuAspLeuAspGinAspTyrArgValThrLysPheThrSerTrp275280285ageccctgcttcsgctgtgcccaggaaatggetttcatttea900SerProLysPheSerLysAlaClnGluMetAlaLysPhelieSer290295300aaaaacaaacacgtgagectg"tgcatettcactgcccgcatetat945LysAsnLysHisValSerLeuLysliePheThrAlaArglieTyr305310315gatgatcaaggaagatgtcaggaggggctgcgcaccctggccgag990AspAspGinG]yArgLysG〗nGluGlyLeuArgThrLeuAlaGlu320325330getggggccaaaattteaataatgacatacagtgaatttaagcac1035AlaGlyAlaLys丄LeSerlieMetThrTyrSerGluPheLysHis335340345tgctgggacaccLtAgtggac(;gccagggacgtcccttccagccc1080LysTrpAspThrPheValAspArgGinGlyArgProPheGinPro350355360tgggatggactagat:gagcacagecaagecctgagtgggaggctt1125TrpAspG〗yLeuAspGluHisSi)rGinAlaLeuSerGlyArgLeu365370375egggecatt1134ArgALalie<210〉32<211>378<212〉PRT<213>人工序列〈220〉〈223〉人工合成的变异型人类APOBEC3G蛋白质的氨基酸序列<400〉32MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspo1015ThrPheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArg202530AsnThrValTrpLeuCysTyrG:uValLysThrLysGlyProSer354045ArgProProLeuAspA]aLysI:;ePheArgGlyGinValTyrSer505560GluLeuLysTyrHisProGluM(,tArgPhePheHisTrpPheSer657075.ysTrpArgLysLeuHisArgAspGinGluTyrGluValThrTrp808590TyrlieSerTrpSerProCysThrLysCysThrArgAspMetAJa95100105ThrPheLeuAlaGluAspProLysValThrLeuThrliePheVal110115120AlaArgLeuTyrTyrPheTrpA:spAspAspTyrGinGluAlaLeu125130135A.rgSerLeuCysGinLysArgAspGlyProArgAlaThrMetLys140145150lieMetAsnTyrAspGluPheGLnHisCysTrpSerLysPheVal155160165TyrSerGinArgGluLeuPheGLuProTrpAsnAsnLeuProLys170175180TyrTyrlieLeuLeuH〗slieMetLeuGlyGlylieLeuArgHis185190195SerMetAspProProThrPheThrPheAsnPheAsnAsnGluPro200205210TrpValArgGlyArgHisGluThrTyrLeuLysTyrGluValGlu215220225ArgMetHisAsnAspThrTrpValLeuLeuAsnGinArgArgGly230235240Phel,euLysAsnGinAlaProhisLysHisG]yPheLeuGluGly245250255ArgHisAlaGluLeuLysPheL,euAspVallieProPheTrpLys260265270LeuAspLeuAspGinAspTyrArgValThrLysPheThrSerTrp275280285SerProL,ysPheSerLysAlaGinGluMetAlaLysPhelieSer290295300L.ysAsnLysHisValSerL,eul,ysliePheThrAla.ArglieTyr305310315AspAspGinGlyArgLysGin(;l.uGlyLeuArgThrLeuAlaGlu320325330AlaGlyAlaLyslieSerIl—eMetThrTyrSerGluPheLysHis335340345Lysl'rpAspThrPheValAsp.\rgG丄nGlyArgProPheGinPro350355360TrpAspGlyLeuAspGluHisSerGinAlaLeuSerGlyArgLeu365370375<table>tableseeoriginaldocumentpage111</column></row><table><table>tableseeoriginaldocumentpage112</column></row><table>ccctgctttagetgtgcccagaaaatggetaaattcattteaaat900ProCysPheSerCysAlaGinL//sMetAlaLysPhelieSerAsn290295300aacaaacatgtgagettgtgcatettcgetgcccgcatetatgat945AsnLysHisVa丄SerLeuCysliePheAlaAlaArglieTyrAsp305310315gatcaaggaagatgtcaggaggggctgcgcaccctgcacagggat990AspGinGlyArgCysGinGluGlyLeuArgThrLeuHisArgAsp320325330ggggccGlyAlaaaaaUgcagtgatgaactacagtgaatttgagtactgc1035LysIl.eAlaValMetAsnTyrSerGluPheGluTyrCys335340345tgggacacctttgtggaccgccaggga.cgtcccttccagccctgg1080TrpAspThrPheValAspArgGinGlyArgProPheGinProTrp350355360gatggaetagatgagcacagecaagccctgagtgggaggcttegg1125Asp(;lyLeuAspGluHisSerGinAlaLeuSerGlyArgLeuArg365370:375gccaU1131AlaUe<210〉34<211>377<212〉PRT<213>人工序列〈220〉〈223〉人工合成的变异型人类AP()BEC3G蛋白质的氨基酸序列<400>34MetAsnProGinlieArgAsnMetValGluGinMetGluProAsp151015liePheVa丄TyrTyrPheAsnAsnArgProlieLeuSerGlyArg202530AsnThrValTrpLeuCysTyrGiuValLysThrLysAspProSer354045GlyProProLeuAspAlaAsnliePheGinGlyLysLeuTyrPro505560GluAlaLysAspHisProGluMetLysPheLeuHisTrpPheArg657075LysTrpArgGinLeuHisArgAspGinGluTyrGluValThrTrp808590TyrValSerTrpSerProCysThrArgCysAlaAsnSerValAla95100105ThrPheLeuAlaGluAspProLysValThrLeuThrliePheVal110115120AlaArgLeuTyrTyrPheTrpAspAspAspTyrGinGinAlaLeu125130135ArglieLeuCysGinGluArgGlyGlyProHisAlaThrMetLys140145150lieMetAsnTyrAsnGluPheGinHisCysTrpAsnGluPheVal155160165AspGlyGinGlyLysProPheLysProArgLysAsnLeuProLys170175180HisTyrThrLeuLeuHisAlaThrLeuGlyGluLeuLeuArgHis185190195ValMetAspProGiyThrPheThrSerAsnPheAsnAsnLysPro200205210TrpValSerGlyGinArgGluThrTyrLeuCysTyrLysValGlu215220225ArgSerHisAsnAspThrTrpValLeuLeuAsnGinHisArgGly230235240PheLeuArgAsnGinAlaProAspArgHisGlyPheProLysGly245250255ArgHisAlaGluLeuCysPheLeuAspLeulieProPheTrpLys260265270LeuAspAspGinGinTyrArg,'/alThrCysPheThrSerTrpSer275280285ProCysPheSerCysA]aGinLysMetAlaLysPhelieSerAsn290295300AsnLysHisValSerLeuCys[lePheAlaAlaArglieTyrAsp305310315AspGinGlyArgCysGinGluGlyLeuArgThrLeuHisArgAsp320325330GlyAlaLyslieA丄aValMetAsnTyrSerGluPheGluTyrCys335340345TrpAspThrPheValAspArgGinGlyArgProPheGinProTrp350355360AspGlyLeuAspGluH〗sSerGinAlaLeuSerGlyArgLeuArg365370375Alalie〈210>35<211〉il55<212>隱<213>hornosapiens〈220〉〈221>CDS〈222>(1).(1155)<400>35atgaagcctcacttxagaaacacagtggagcgaatgt.atcgagacaca48MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr151015ttctectacaacttt,tataatagacccatectttctcgteggaatacc%PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530gtctggctgtgctacgaagtgaaaacaaagggtcccteaaggccccct144Va]TrpLeuCysTyrGluValLysThrLysGlyProSerArgProPro354045ttggacgcaaagatetttcgaggccaggtgtattecgaacttaagtac192LeuAspAlaLysliePheArgGlyGinValTyrSerGluLeuLysTyr505560cacccagagatgagattcttc(:actggttcageaagtggaggaagctg240HisProGluMetArgPhePheHisTrpPheSerLysTrpArgLysLeu65707580catcgtgaccaggagtatgaggtcacctggtacatatectggageccc288HisArgAspGinGluTyrGluValThrTrpTyrlieSerTrpSerPro859095tgcacaaagtgtacaagggat.atggccacgttcctggccgaggacccg336CysThrLysCysThrArgAspfvletAlaThrPheLeuAlaGluAspPro100105110aaggttaccctgaccatetttgttgcccgcetctactacttctgggac384LysValThrLeuThrliePheVaiAlaArgLeuTyrTyrPheTrpAsp115120125cca_gattaccaggaggcgcttcgcagectgtgtcagaaaagagacggt432ProAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140ccgcgtgccaccatgaagat,cdtgaattatgacgaatttcagcactgt480ProArgAlaThrMetLyslieMetAsnTyrAspGluPheGinHisCys145150155160tggageaagttcgtgtacagecaaagagagetatttgagccttggaat528TrpSerLysPheValTyrSerGinArgGluLeuPheGluProTrpAsn165170175aat.ctgAsnLeucctProLys副tatTyrtatTyr3t3lietta匕euctgLeu185C3CHisatelieatgMetctgLeugggGly190gagGluattlie576etcagacactegatggatccacccacattcactttcaactttaacaat624LeuArgHisSerMetAspProProThrPheThrPheAsnPheAsnAsn195200205gaacctGluPro210tggTrpgtcVal卿ArgGlyegg215catHisgagGluactThrtacTyrctgLeu220tgtCystatTyrGlugtgVal672gagcgcGluArg225atgMetcticHisAsngax;giccAspThr230TrpgtcValctgLeuctgLeu235aia_cAsnGincgcArgaggArgggcGly240720tttetaPheLeutgcCysAsnC£lgGin245getccaAlaProcatllisLysC3CHis250ggtGlyttcPhect.tLeuGluggcGly255cgcArg768catgcaHisAlagagGluctgLeu260tgcCysttcctgPheLeugacAspgtgVal265liecccProtttPhetggTrp卿Lys270ctgLeugacAsp816ctggacL.euAspcagGin275gacAsptacTyragggttArgVal;iccThr280tgcCysUcPhe3CCThrtecSertggTrp285ageSercccProtgcCys864ttcagePheSer290tgtCysgccAlacagGingaa3tgGluMet295getAlaLysttcPheElttlieteaSer300LysAsnLysC3CHis912gtgt堪cValSer305ctgLeutgcCysate[lettcactPheThr310gccAlacgcArgatelietatTyr315gatAspgatAspGinggaGlyArg320960tgtcagCysGingagGlugggGlyctgLeu325cgcaccArgThrctgLeugccAlagagGlu330getAlagggGlygccAlaLysattlie335teaSer1008ataatgI].eMetaca_ThrtacTyr340agtSergfistt.tG]uPhe幼g匕ysC3CHis345tgcCystggTrpgacAsp3CCThrtttPhe350gtgValgacAsp1056caccagHisGinggaGly355tgtCyscccProttccagPheGincccPro360tggTrpgatAspggaGlyetaLeugatAsp365gagGluC3CHisageSer1104cm.gacG丄nAsp370ctgLeuagtSergggGly3ggctgArgLeu375egggccAlaattlieetcLeucagGin380aatAsncagGingemGlu33CAsn1152tga1155<210〉36<211>384<212>PRT〈213>homosapiens<400>36MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr151015PheSerTyrAsnPheTyrAsnArgProl丄eLeuSerArgArgAsnThr202530ValTrpLeuCysTyrGluValLysThrLysGlyProSerArgProPro354045LeuAspAlaLysliePheArgG]yGinValTyrSerGluLeuL,ysTyr505560HisPro(;]uMetArgPhePheHisTrpPheSerLysTrpArgL,ysLeu65707580HisArgAspGinGluTyrGluVaJThrTrpTyrlieSerTrpSerPro859095CysThrLysCysThrArgAspMetAlaThrPheLeuAlaGluAspPro100105110LysVa丄ThrLeuThr丄JePheValAlaArgLeuTyrTyrPheTrpAsp115120125ProAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly30135140ProArgAla,ThrMetLyslieMetAsnTyrAspGluPheG丄nHisCys145150155160TrpSerLysPheValTyrSerGinArgGl.uLeuPheGluProTrpAsn165170175AsnLeuProLysTyrTyrlieLeuLeu.HislieMetLeuGlyGlulie180185190LeuArgHisSerMetAspProProThrPheThrPheAsnPheAsnAsn195200205G丄uProTrpVa丄ArgGlyArgHisGluThrTyrLeueysTyrGluVal210215220(;l.uArgMetHisAsnAspThrTrpValLeuLeuAsnGinArgArgGly225230235240PheLeuCysAsnGinAlaProHisL'ysHisGlyPheLeuGluGlyArg245250255HisAlaGluLeuCysPheLeuAspVallieProPheTrpLysLeuAsp260265270LeuAspGinAspTyrArgVal.ThrCysPheThrSerTrpSerProCys275280285PheSerCysAlaGinGluMetAlaLysPhelieSerLysAsnLysHis290295300ValSerLeuCys11—ePheThrA.laArglieTyrAspAspG〗nGlyArg305310315320CysG丄nG]uGlyLeuArgThrLeuAlaGluAlaGlyAlaLysILeSer325330335lieMetThrTyrSerGluPheLysHisCysTrpAspTh:rPheValAsp340345350HisG丄nG.lyCysProPheGinProTrpAspGlyl>euAspGluHisSer355360365GinAspLeuSerGlyArgLeuArgAlalieLeuGinAsnGinGluAsn370375380〈210〉37〈211〉1241<212>DNA<213>artificialsequence<220〉<223〉AP0BECHis〈220><221>CDS〈222〉(5)..(1231)<400〉37aaggatgaagcctcacttcagaaacacagtggagcgaatgtatcgagacaca52MetLysProHisPheArgAsnThrValGluArgMetTyrArgAspThr1015Uct.ccPheSert£icTyrAsnPhe20tatTyraatAsnagacccProatelie25cttLeutctSercgtCggArgaatAsn30a_ccThr100gtctggValT卬ctgLeutgcCys35TyrGlugtgVal33aLysThr40幼gLysggtGlycccProteaSeraggArg45cccProcctPro148ttggacLeuAspgcaAla50犯ga.tclietttPhecgaArgggcGly55cagGingtgValtatTyrtecSerg肪Glu60cttLeu33gtacTyr196C3CCC3HisPro65g缚GluatgMet卿UcPhettcPhe70cacHistggTrpUcPheageSer紛gLys75tggTrpaggEUigL,ysctgLeu80244catcgtHi'sArggacAspcag(;]ngagGhi85tatTyrgagG]ugtcValaceThrtggTrp90tacTyratalietecSertggTrpageSer95cccPro292tgcacaCysThrLystgtCys100£icaThr郷ArgggitAsptitgMetgccAla105acgThrUcPhectgLeugccAlag缚Glu110gacAspccgPro340aaggttLysVa]iiCCThr115ctgLeuThratelietttPhegttVal120gccAlacgcArgetcleutacTyrtacTyr125UcPhetggTrpgacAsp388ccagatProAsp130tacTyrcagGingagGlugcgAlacttLeu135cgcArgageSerctgLeutgtCyscagGin140LysArggacAspggtGly436ccgcgtProArg145gccAla3CCThratgMetLys150ateatgMetaa_tAsntatTyrgacAsp155g朋GluUtPheC£lgGinC3CHistgtCys160484tggageTrpSer朋gLysttcPhegtgVa165tacTyrageSer(加GinagagagGlu170etaLeutttPhegagGlucctProtggTrp175Asn532aatctgcctaaatattatatattactgcacateatgAsnLeuProLysTyrTyrlieL,euLeuHislieMet180185ct,gggggagattLeuGlyGlulie190580etcagacactcgatggatccacccacattcactttcLeuArgHisSerMetAspProProThrPheThrPhe195L'OOaactttaacaatAsnPheAsnAsn205628gaa.ccttgggtcagaggaeggcatgagacttacctgGluProTrpValArgGlyArgHisGluThrTyrLeu210215220tgttatgaggtgCysTyrGluVal676gagcgcatgcacaatgacacci:gggtcctgctgaacGluArgMetHisAsnAspThr':'rpValLeuLeuAsn225230235cagcgcaggggcGinArgArgGly240724tttetatgcaaccaggetccacataaacacggtttcPheLeuCysAsnGinAlaProHisLysHisGlyPhe245250cttgaaggccgcLeuGluGlyArg255772catgcagagctgtgcttcctggacgtgattccctttHisAlaGluLeuCysPheLeuAspVallieProPhe260265tgg鄉ctggacTrpLysLeuAsp270820ctggaccaggactacagggttacctgcttcacctecLeuAspGinAspTyrArgValThrCysPheThrSer275280tggageccctgcTrpSerProCys285868ttcagetgtgcccaggaaatggetaaattcattteaPheSerCysAlaGinGluMetAlaLysPhelieSer290295300a3383Cfi£l£lCfiCLysAsnLysHis920gtgagectgtgcatettcactgcccgcatetatgatVa]SerLeuCysliePheThrAlaArglieTyrAsp305310315gatcaaggaagaAspGinGlyArg320964tgtcaggaggggctgc.gcaccct.ggccgaggetgggCysG:lnGluGlyLeuArgThrLeuAlaGluAlaGly325330gccaaaattteaAlaLyslieSer3351012ataatgacatacagtg朋tttsagca_ctgctgggaclieMetThrTyrSerGluPheLysHisCysTrpAsp340345sectttgtggacThrPheValAsp3501060C3CCtigHisGinC3£igaicGinAsp370AagcttLysLeu385gccgtcAlaValggatgtccc.GlyCysPro355ctgagtgggLeuSerGlygggcccgaaGlyProGlugaccatcat.AspHisHis405ttccagccctgggatggaetagatgagcacage1108PheGinProTrpAspGlyLeuAspGluH.isSer360365aggctgegggccattetccagaatcaggaaaac1156ArgLeuArgAlalieLeuGinAsnGinGluAsn375380caaaaaetcateteagaagaggatctgaatage1204GinLysLeulieSerGluGluAspLeuAsnSer390395400catcatcatcattgagtttaaa1241HisHishisHis〈210>38〈211〉409〈212>PRT<213>artificia丄sequence〈220〉<223>AP0BECHis<400〉38Met:LysProHisPhe15ArgAsnThrValGluArgMetTyrArgAspThr1015PheSerTyrAsnPheTyrAsnArgProlieLeuSerArgArgAsnThr202530ValTrpLeuCysTyrGluValLysThrLysGlyProSerArgProPro354045LeuAspAlaLysI丄ePheArgGlyGinValTyrSerGluLeuLysTyr505560HisProGluMetArgPhePheHisTrpPheSerLysTrpArgLysLeu65707580HisArgAspGinGluTyrGluValThrTrpTyrlieSerTrpSerPro859095CysThrLysCysThrArgAspMetAlaThrPheLeuAlaGluAspPro10010510LysVa]ThrLeuThrl]ePheValAlaArgLeuTyrTyrPheTrpAsp1.15120125ProAspTyrGinGluAlaLeuArgSerLeuCysGinLysArgAspGly130135140ProArgAlaThrMetLyslieMetAsnTyrAspGluPheGinHisCys145150155160TrpSerLysPheValTyrSerGinArgGluLeuPheGluProTrpAsn165170175AsnLeuProLysTyrTyrlieLeuLeuHislieMetLeuGlyGlulie180185190LeuArgHisSerMetAspProProThrPheThrPheAsnPheAsnAsn195200205GluProTrpValArgGlyArgHisGluThrTyrLeueysTyrGluVal210215220GluArgMetHisAsnAspThrTrpValLeuLeuAsnGinArgArgGly225230235240PheLeuCysAsn(;lnAlaProHisLysHisGlyPheLeuGluGlyArg245250255HisAlaGluLeuCysPheLeuAspVallieProPheTrpLysLeuAsp260265270LeuAspGinAspTyrArgValThrCysPheThrSerTrpSerProCys275280285PheSerCysA]aG]nGluMetAlaLysPhelieSerLysAsnLysHis290295300ValSerLeuCysliePheThrAlaArglieTyrAspAspGinGlyArg305310315320CysGinGluGlyLeuArgThrl,euAlaGluAlaGlyAlaLysT.leSer325330335lieMetThrTyrSerGluPheLysHisCysTrpAspThrPheValAsp340345350HisG丄nGlyCysProPheGinProTrpAspGlyLeuAspGluHisSer3553(;0365GinAspLeuSerGlyArgLeuArgAlalieLeuGinAsnGinGluAsn370375380LysLeuGlyProGluGinLysLeulieSerGluGluAspLeuAsnSer385390395400AlaValAspHisHisHisHisHtsHis40权利要求1、一种突变型人类APOBEC3G蛋白质,该蛋白质为(a)或(b)(a).由SEQIDNo.2、4、6或8所示的氨基酸序列组成的蛋白质;(b).在(a)中的氨基酸序列至少有一个或多个氨基酸替代,同时第129位的替代为D或F或其他的除了P以外的氨基酸,且能抵抗HIV-Vif引发的蛋白酶降解的由(a)衍生的蛋白质。2、编码权利要求l所述突变型人类APOBEC3G蛋白质的核苷酸。3、根据权利要求2所述的核苷酸,该核苷酸是(a)或(b):(a).序列为SEQIDNo.l、3、5或7的核苷酸;(b).在严格条件下与(a)限定的DNA核苷酸序列杂交且编码具有抵抗HIV-Vif引发的蛋白酶降解功能的变异的APOBEC3G蛋白质的核苷酸。4、含有权利要求2或3所述核苷酸的表达载体。5、含有权利要求2或3所述核苷酸的重组宿主细胞。6、权利要求l所述蛋白质的特异性抗体。7、含有有效治疗剂量的上述蛋白质、核苷酸、表达载体、重组宿主细胞或特异性抗体的药物。8、含有上述蛋白质、核苷酸、表达载体、重组宿主细胞或特异性抗体的试剂盒。9、权利要求1所述的突变型人类APOBEC3G蛋白质在制备抗HIV病毒药物中的应用。10、权利要求2所述的核苷酸在制备抗fflV病毒药物中的应用。全文摘要本发明公开了一种抑制HIV复制的突变型APOBEC3G分子及其应用。该突变型APOBEC3G分子是由为(a)或(b)表示的蛋白质(a)由SEQIDNo.2、4、6或8所示的氨基酸序列组成的蛋白质;(b)在(a)中的氨基酸序列至少有一个或多个氨基酸替代,同时第129位的替代为D或F或其他的除了P以外的氨基酸,且能抵抗HIV-Vif引发的蛋白酶降解的由(a)衍生的蛋白质。本发明还公开了编码所述蛋白质的核苷酸序列,及其表达载体、转化体,所述蛋白质的特异性抗体,以及它们在制备抗HIV病毒药物中的应用。文档编号C07K14/435GK101161676SQ20061009670公开日2008年4月16日申请日期2006年10月10日优先权日2006年10月10日发明者军石,许弘展申请人:时旭生物医药科技(上海)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1