产多形性蛋白质序列的位点特异性系统的制作方法

文档序号:440269阅读:440来源:国知局
专利名称:产多形性蛋白质序列的位点特异性系统的制作方法
技术领域
本发明涉及利用含有作为多样性模板的序列区域的核酸分子使核酸序列多样化。本发明提供多样化的核酸分子,那些核酸分子可用作该模板区(TR)的定向定点多样化和编码所需的酶,以及供制备和应用这些核酸序列的方法。
背景技术
博德特氏菌(Bordetella)博德特氏菌噬菌体负责宿主菌特异性嗜性的基因会产生多样性。产生这种改变是由于遗传元件(包括转录、逆转录元件)以及腺嘌呤特异性定点诱变。此过程必须是两个区域之间信息的逆转录酶介导的交换,一个区域是作为供体的模板区(TR),另一个区域是作为可变序列信息的受体,即可变区(VR)。
引起哺乳动物包括人呼吸道感染的博德特氏菌,是编码产生多样性独特系统噬菌体家族的宿主菌,其嗜菌体能利用该菌上的不同受体分子附着然后感染该菌(Liu,M.等,《博德特氏菌噬菌体中逆转录酶介导的嗜性转换)(Reverse transcriptase-mediatedtropism stitching in Bordetella bacteriophage),Science 2952091-2094,2002和Liu,M.等,《基因组和遗传分析博德特氏菌中编码逆转录酶介导的嗜性盒》(Genomic andgenetic analysis of Bordetella bacteriophages encoding reverse transcriptase-mediatedtropism-switching cassettes),J Bacteriol,1861503-17,2004)。由于BvgAS磷酸中继(其调节了该菌的感染周期)介导的基因表达程序复杂,博德特氏菌的细胞表面差别很大(Ackerley,B.J.,Cotter,P.A.和Miller,J.F.,《靶毛素调节子的异位表达改变了博德特氏菌-宿主相互作用的发生》(Ectopic expression of the flagellar regulon altersdevelopment of the Bordetella-host interaction),Cell 80611-620,1995;Uhl,M.A.&Miller,J.F.,《多个结构域整合在二组分传感蛋白中百日咳博德特氏菌的BvgAS磷酸中继》(Integration of multiple domains in a two-cinoibebt sensor proteinthe Bordetellapertussis BvgAS phosphorelay),EMBO J.151028-36,1995;Cotter,P.A.和Miller,J.F.,《博德特氏菌》(Bordetella),选自E.Groisman编的《细菌致病原理》(Principlesof Bacterial Pathogenesis),,Academic Press,San Diego,CA,619-674,2000;Mattoo,S,Foreman-Wykert,A.K.,Cotter,P.A,Miller,J.F.,《博德特氏菌致病机理》(Mechanismsof Bordetella pathogenesis),Front Biosci 6,E168-E186,(2001))。
噬菌体BPP-1优先感染有毒力的Bvg+博德特氏菌,这是由于细菌外膜上噬菌体受体粘附素(Prn,pertactin)的表达存在差异(见本文

图1和Emsley,P.,Charles,I.G.,Fairweather,N.F.,Isaacs,N.W.,《百日咳博德特氏菌毒力因子P.69粘附素的结构》(Structure of the Bordetella pertussis virulence factor P/69 pertactin),Nature 38190-92,1996;van den Berg,B.M.,Beekhuizen,H.,Willems,R.L.,Mooi,F.R.,van Furth,R.,《百日咳博德特氏菌毒力因子粘附人呼吸道上皮细胞的作用》(Role of Bordetellapertussis virulence factors in adherence to epithelial cell lines derived form the humanrespiratory tract),Infect Immun 671056-62,1999;和King,A.L.等,《百日咳博德特氏菌蛋白粘附素的多态性区1在免疫力中的作用》(Tole ofthe polymorphic region 1of the bordetella pertussis protein pertactin in immunity),Microbiology 1472885-95,2001)。就特征性感染率而言,BPP-1产生了识别不同表面受体和分别优先感染无毒力Bvg-菌或不能区别Bvg状态的嗜性变异菌(BMP和BIP)。这些寄生病毒物质的演化跟上了它们靶宿主横贯感染周期的表面结构的动态演化。
引用以上文献并非承认任何上述文献是在先技术。关于日期的所有声明或关于这些文献提供的内容都是依据本申请人可得到的信息,并非构成承认所提及的日期或这些文献的内容正确。

发明内容
本发明部分依据以下发现,即博德特氏菌噬菌体基因组中控制感染特定细菌能力的灵敏的嗜性开关(switching)是由噬菌体基因组内编码的产变异盒(cassette)介导的(见本文图1b)。此盒的功能是在mtd基因座3’末端134bp可变区(VR)中23个位点导入核苷酸取代。推定的尾蛋白质Mtd是噬菌体形态发生和传染力所必须,Mtd中的VR序列决定了其(细菌宿主)嗜性的特异性。BBP-1衍生的GST-Mtd融合蛋白与博德特氏菌细胞表面的结合依赖于细菌外膜是否表达粘附素(Prn)与亲代噬菌体的感染性能有关。所述盒示于图1b,其功能是在配体-受体相互作用中通过位点特异性诱变VR序列和使其多样化而产生可塑性。
因此,在第一方面内容中,本发明提供含有操作性连接于模板区(TR)的可变区(VR)的核酸分子,该分子中所述TR是能指导(direct)所述VR位点特异性诱变的模板序列。所述核酸分子可以是重组的,即意味其所含的核酸序列是天然状态时不结合在一起的序列,如合成的(非天然产生的)和/或用分子生物学和基因工程技术从异源获得而结合在一起的序列。或者是分离的核酸分子,即意味其含有的天然序列已与其天然状态时周围的生物因子或序列相分离。
本发明核酸分子的VR和TR区之间的操作性连接,指TR能够作为模板来定向位点特异性诱变VR中的序列或使其产生多样性。因此在本发明的一种可能的实施方式中,所述重组核酸分子可含有顺式连接的供体模板区(TR)和可变区(VR),因而此TR可作为位点特异性诱变VR的模板序列。TR和VR区可相隔任何距离,只要仍维持操作性连接。在另一个实施方式中,TR与VR不顺式连接,但TR仍保持对VR位点特异性诱变的指导。例如TR与VR区反式操作性相连接,二区序列存在于分开的核酸分子中。
本发明也提供一对核酸分子,其中,该对的第一分子所含的VR操作性连接于该对第二分子的TR。本发明提供的TR是指导所述VR位点特异性诱变的模板序列。所述核酸分子任选是重组的,即意味它们所含的核酸序列是天然状态时不结合在一起的序列,如利用分子生物学和基因工程技术从异源获得而结合在一起的序列。当然可以是合成的(非天然产生的)序列,或天然产生的但已与它们天然状态周围的生物因子或序列相分离的序列。
在VR与TR反式相连的本发明实施方式中,TR操作性连接于编码下述具有逆转录酶(RT)活性的序列。如此VR与逆转录酶的编码序列彼此反式相连。在某些实施方式中,TR和RT编码序列任选与源自同一种生物的TR和RT编码序列彼此顺式操作性相连。在其它实施方式中,TR和RT编码序列可以彼此维持反式操作性相连,因而TR仍能指导操作性相连的VR中的RT介导的变化。当然可如下所述相对于该生物的天然TR,改变此TR和RT的编码序列。或者,此TR和RT编码序列可以是彼此异源的,即来源于或分离自不同生物,或其中一个或另一个,或二者是合成的(非天然产生的或不是分离自天然的)。合成的序列包括衍生自天然产生序列的那些合成序列。
本发明也部分依据以下发现,即博德特氏菌噬菌体VR中的变异位点对应于通常同源模板区TR中的腺嘌呤残基,而TR区本身是不变的,这是嗜性转换必须的。本发明还部分依据以下发现,即TR中的(翻译)沉默(或“同义词)”取代在转换期间可传递给VR区,其中TR提供了变异的初始序列信息。
因此本发明的重组核酸分子包括的初始分子中TR区与VR区相同,因此TR中的腺苷残基将指导VR序列诱变或相应位点多样化。就差异性而言,本发明提供的核酸分子所述TR序列优选是所述VR序列的直接重复,因此,对于VR区的多样化而言,VR区中将突变成为另一核苷酸(即胞苷、胸苷或鸟苷)的一个或多个腺苷残基也见于TR区中,但它们在TR区没有改变。
或者,本发明提供的核酸分子中TR与VR区不相同,而TR仍能指导VR的多样化。这种多样化包括VR区中依据TR的相应腺苷残基位置的核苷酸残基诱变。
不受理论的束缚和为了促进对本发明的理解,这种逆转录介导的能力依据以下机理TR转录物可作为逆转录的模板,在产生单链cDNA时将核苷酸随机掺入到TRRNA转录物中替代腺苷残基。然后在称为“诱变返祖(mutagenic homing)”的过程中用该TR衍生的诱变的cDNA序列复制整个VR或其一或部分。支持此机理的是发现博德特氏菌噬菌体中编码逆转录酶(RT)的brt基因座是产生多样性所必须的。发现诱变只发生在TR中的腺苷位点也支持此机理。随后用另一核苷酸人为取代TR中的腺苷时即消除了VR中相应位点的变异,而导入一异位腺苷随之在VR中产生一异质性新位点。
因此在另一方面内容中,本发明提供了通过在与VR操作性相连的TR中引入腺苷残基使VR序列多样化。本发明提供的核酸分子中TR区含有VR区中没有的一个或多个腺苷残基,TR中的这种腺苷残基将指导VR序列相应位点的诱变或多样化。换言之,本发明提供的重组核酸分子中由于一个或多个腺苷残基取代了所述VR中的一个或多个非腺苷残基,而所述TR序列不是所述VR序列的完全直接复制品,因而可称为腺苷介导的多样化。
或者,与VR相比,TR含有一个或多个腺苷插入,任选也插入其它核苷酸以维持阅读框正确,作为一非限制性例子,可将多组三联核苷酸(包括一个或多个腺苷)框内插入到TR中以指导在VR中插入可变密码子。
在其它实施方式中,本发明提供通过改变操作性连接于VR的TR中的其它核苷酸残基而多样化的VR序列。一个非限制性例子,本发明提供的TR含有一个或多个密码子缺失,用于指导与其操作性相连的VR缺失相应的密码子。另一个例子,TR含有一个或多个插入的密码子,从而指导操作性相连的VR中插入密码子。本发明的TR还包括那些TR,其相对于操作性相连的VR,含有一个或多个核苷酸的缺失或插入,从而改变了VR的读框。TR中核苷酸的缺失或插入指导操作性相连的VR中的缺失或插入,而可同时利用TR的一部分来指导核苷酸缺失,和利用TR的另一部分来指导核苷酸插入。这称为缺失/插入介导的多样化。
在其它实施方式中,本发明提供的多样化基于TR中非腺苷残基的取代。TR中的核苷酸用非腺苷残基取代将指导这种取代转化为操作性相连VR中相对应位置的取代。一个非限制性例子是,TR中的胞苷(C)被取代成鸟苷(G)将在操作性相连的VR中产生同样的C→G取代。这称为取代介导的多样化。
本发明还提供利用腺苷介导的、缺失/插入介导的、和/或取代介导的多样化的任何组合来改变VR序列。
在本发明的某些核苷酸中,TR的5’端附近也可存在RT编码区和/或atd区(或bbp7区)。这些区域与TR区顺式相关。因此在本发明VR和TR彼此反式相关的实施方式中,atd区可与VR反式相关。在其它实施方式中,atd区缺失或被功能同类区的序列,如调节或指导TR区表达和操作性连接RT编码序列的启动子序列所取代。
如上所述,本发明多样性发生系统的一个特征是定向转移伴随诱变的序列信息。因此,这种TR能指导一种或多种操作性连接的VR序列改变。虽然VR高度可变,但其操作性连接的TR仍保持不变,成为不受影响的序列信息,包括保留VR编码蛋白分子基本结构完整性信息的来源。本发明还依据命名为IMH的核酸序列(诱变返祖)的鉴定,该序列决定了TR向VR转移序列信息的方向。
在本发明某些实施方式中,IMH序列位于博德特氏菌噬菌体各区的3’端,包含14bp(其中含G和C残基)和其后的21bp序列。VR区3’末端的IMH序列与TR区的相应序列有5个位置不同(见本文图1)。本发明也部分依据证明这些多态性来自决定返祖方向的顺式作用位点一部分。通过用与TR区3’末端结合的相应IMH样序列(BPP-3’TR)取代21bp VR IMH序列得出此证据。其结果是取消了嗜性转换。逆向取代VR IMH序列中的相应TR IMH-样序列(BPP-3’VR)不影响此转换。而是,取代VR和TR二者3’末端的VR IMH序列导致令人惊奇地产生了TR及VR的腺苷依赖性变异(见本文图1),此现象在野生型噬菌体中未曾观察到。变异继续只发生在亲代TR腺苷残基的位置,表明维持着诱变的基本机制。而且,在不同BBP-3’VR噬菌体中观察到的诱变模式表明,TR区是TR和VR变异的唯一区域(见本文图1d)。
这些观察证明,称为IMH的序列帮助确定了序列信息从TR至VR的定向转移。它们也支持利用TR区3’末端的相应TR IMH-样序列来防止TR受损同时用IMH指导VR变异。而且缺失分析表明VR与TR之间的同源程度确定了VR中信息转移的5’边界。
本发明的核酸分子可含有位于VR区3’末端的IMH序列和位于TR区同一末端的IMH样序列。或者,该分子在VR和TR二区此末端可含有IMH序列,而TR区的该序列可不同导致“超级多样性”产生系统。
在多样化感兴趣序列(或“理想的VR”)不与必须的TR区操作性相连的本发明实施方式中,可将IMH序列操作性安置在该理想VR区的3’末端,然后操作性连接于含IMH-样3’末端的合适TR区。这类系统的一个非限制性例子见于理想的VR,此VR是插入了合适的IMH和导入了含合适的相应措施IMH样区的TR的细胞基因组的整个序列或部分序列,其中的IMH样区顺式连接于RT编码序列,用于多样化该理想的VR。此TR可以是通过TR中的腺苷而多样化可诱变的该理想VR序列的简单直接重复。或者,该TR在相应于VR多样性所需的那些特定位点含有异位腺苷、缺失/插入、和/或取代。可利用TR和VR之间的同源长度在功能上确定该理想VR的多样化。
本发明的VR可以是利用本发明产生诱变或多样化的感兴趣核酸分子。在某些实施方式中,该序列是编码靶分子结合伴侣的整个序列或部分序列。靶分子可以是实施本发明技术人员感兴趣的任何细胞因子或其一部分。非限制性例子有多肽、细胞表面分子、糖、脂、激素、生长和分化因子、细胞受体、受体的配体、细菌蛋白或表面组分、细胞壁分子、病毒颗粒、免疫或免疫耐受因子、MHC分子(如I类或II类分子)、肿瘤细胞中或细胞上发现的肿瘤抗原,和技术人员所知和/或本文所述的其它分子。结合伴侣(由该理想VR至少编码其一部分)可以是其表达的多肽,该多肽在生理条件下,或实验室条件(体内、体外、或培养时)下能结合靶分子。
在本发明的某些实施方式中,所述结合伴侣是细菌素(包括弧菌素、绿脓菌素或大肠杆菌素)、噬菌体蛋白(包括决定宿主特异性的尾组分)、荚膜或膜表面组分(包括决定生理、药理或药效性能的那些组分)、细胞表面因子的配体、或经鉴定的药物或诊断用靶分子,或需要和/或本文所述的其它分子。
可利用结合伴侣编码区的一部分或全部作为该理想的VR。然而,在本发明的某些实施方式中,该理想的VR是编码所述结合伴侣所述序列的3’部分。编码序列的该3’部分终止于终末密码子。在本发明的其它实施方式中,该理想的VR位于待多样化编码序列终末密码子的约50个、约100个、约150个、约200个、约250个、约300个、或约350个或更多个密码子内。换言之,该理想VR可含有距离编码区终末核苷酸约20个、约50个、约100个、约150个、约200个、约250个、约300个、约400个、约450个、约500个、约550个、约600个、约650个、约700个、约750个、约800个、约900个、约100个、约1500个、约200外、约2500个、约3000个或更多个核苷酸。在某些实施方式中,IMH不是该VR翻译后的一部分,可任选包含在内含子中。换言之,本发明某些实施方式提供转录但不翻译的IMH,或既不转录也不翻译的IMH,而VR和含VR的较大序列可转录和翻译成编码的多肽。
在其它实施方式中,所述结合伴侣是融合蛋白的一部分,其产生的嵌合蛋白含另一多肽。融合蛋白的另一成员可以与该结合伴侣异源。或者,可以是同一结合伴侣的另一部分,因而该融合蛋白是自然界没有的重组分子。
在其它实施方式中,要定点诱变的该理想VR是一种不能翻译的和任选不能转录的调控区。可利用本发明使这种调控序列多样化以改进其功能。以5’调节元件为例,一个非限制性例子是,可利用本发明来产生能导致较强(如较强启动子)或较弱(如较弱启动子)表达的调节区。或者,可多样化所述调节区以提高或降低它们对调节的灵敏性(如受到更紧密或更不紧密的调节)。以3’调节元件为例,可利用本发明来产生能提高或降低所表达RNA分子稳定性的区域。可类似地多样化其它调节序列。
如上所述,本发明也提供衍生自天然序列的分离的核酸分子。这种分离的核酸分子描述为含有供体的模板区(TR)和可变区(VR),其中所述TR是模板序列,其操作性连接于所述VR能指导所述VR位点特异性诱变。这些分离的核酸分子所含编码序列包含VR和TR及指导VR在异源系统中位点特异性诱变所需的其它组分。衍生自天然序列的其它序列的非限制性例子,是编码RT活性的序列,和具有IMH功能能将序列信息从TR定向转移至VR的序列,或IMH样序列,以防止或减少TR序列的变化几率。包含这些VR和TR区与这些其它组分的分子称为本发明的产多样性反转录因子(DGR,diversity generating retroelement)。
这些分离的核酸分子也可用作实施本发明所用的其它IMH序列、RT编码区和atd区的来源。分离的核酸分子的非限制性例子包括本文图2中所示的那些。它们包括分离自哈氏弧菌(Vibrio Harveyi)ML噬菌体、长双岐杆菌(Bifidobacterium longum)、多形拟杆菌(Bacteroides thetaiotaonicron)、齿垢密螺旋体(Treponema denticola)的分子,或蓝细菌的DGR。这类蓝细菌的非限制性例子包括红海束毛蓝细菌(Trichodesmiumerythraeum)#1、红海束毛蓝细菌#2、念珠蓝细菌(Nostoc)PPC ssp.7120#1、念珠蓝细菌PPC ssp.7120#2或点型念珠蓝细菌(Nostocpunctiforme)。图2所示的相关序列都是技术人员可公开获得和接触的。
要某些实施方式中,本发明提供的分离核酸分子含有供体的模板区和操作性连接的RT编码序列。这种分子宜不是Bvg+嗜性(tropic)噬菌体-1(BPP-1)、Bvg-嗜性噬菌体-1(BMP-1)、或Bvg不区分(indiscriminate)噬菌体-1(BIP-1)的分子。该分离分子可得自噬菌体、细菌的原噬菌体(prophage)、细菌或螺旋体。
当然,也提供含本发明核酸分子的细胞。这种细胞可以是原核或真核细胞,能支持本文所述的定点诱变。也可利用不能支持这种诱变的细胞来复制本发明的核酸分子,或产生它们编码的蛋白质供测序列。以原核细胞为例,可修饰本发明的核酸将它们用于原核环境。这些修饰包括采用真核RNA聚合酶能识别的启动子序列;将内含子序列导入TR-brt中以促进转录的RNA从细胞核输出到胞质中而翻译brt;和存在作为RT编码序列的一部分的核定位信号(NLS)编码序列,如此RT多肽所含的NLS可导致其输出或保留在真核细胞核中。在某些实施方式中,NLS定位于RT多肽的N或C末端。
另一方面,本发明提供定点诱变感兴趣核酸,如本发明VR的方法。该方法包括利用本文所述核酸分子,此分子中的VR含有感兴趣的所述核酸序列和TR,TR是该VR或感兴趣序列的直接重复。因此诱变将限于TR中存在的腺苷残基。或者,可采用未鉴定的TR,如VR的重复,或含有异位腺苷残基、插入、缺失或取代的感兴趣序列。该方法还包括在细胞中表达其VR区的一个或多个核苷酸位点或感兴趣序列被不同残基取代的核酸分子。
可实施本发明方法取代VR的一个以上核苷酸位点或感兴趣序列。如上所述,VR或感兴趣序列可包含靶分子结合伴侣的全部或一部分(如3’部分)。当然可利用本发明的这些方法来改变结合伴侣的结合性能,而改变其与靶分子的相互作用。这种改变的非限制性例子包括改变结合伴侣的特异性或结合亲和力。可用这些方法修饰特定的结合伴侣,使其与不同的靶分子结合。本发明此方面的非限制性例子是修饰噬菌体的嗜性决定子,使其能结合异源细菌的感兴趣表面组分。制备的噬菌体表达这类衍生物而对异源细菌有感染力。此法的优点是是可作为一种产生噬菌体或噬菌体颗粒的方法,这种噬菌体或噬菌体颗粒能结合、感染和/或杀伤(如通过裂解或溶解膜成分)表达亲代嗜性决定子的噬菌体不能正常感染的菌株。也可利用本发明作为扩大或扩展噬菌体宿主的方法,或扩大其结合范围包括亲代噬菌体或任何噬菌体通常不能结合或感染的靶分子、菌种或菌株。另一非限制性例子是修饰序列以恢复或改变其结合活性或酶活性,例如恢复磷酸转移酶活性。
如本文所述,也可利用含有本文所述VR和TR天然组合的分离的核酸分子,来实施已知噬菌体蛋白质的定点诱变。此类分子的非限制性例子包括那些来自哈氏弧菌ML噬菌体、长双岐杆菌、多形拟杆菌、齿垢密螺旋体的分子,或来自蓝细菌的DGR。这类蓝细菌的非限制性例子包括红海束毛蓝细菌#1、红海束毛蓝细菌#2、念珠蓝细菌PPC ssp.7120#1、念珠蓝细菌PPC ssp.7120#2、或点型念珠蓝细菌。
另一方面,本发明提供一种制备重组核酸分子的方法,该方法是将含所述VR的第一核酸分子操作性连接于含所述TR的第二核酸分子,这样所述TR将作为模板来指导所述VR的位点特异性诱变。就VR和TR之间的顺式连接而言,将第一和第二核酸分子以本文所述的操作性连接方式连接在一起。就反式连接而言,将第一和第二核酸分子以操作性连接方式置于同一细胞环境中,或体外反应混合物中进行定点诱变。
在另一方面,本发明提供鉴定其它RT编码序列、IMH和IMH样序列、及相应的TR和VR序列的方法。此方法基于采用本发明鉴定的RT活性结合基序列来鉴定其它生物中的附加RT编码序列。然后在推定的附加RT编码序列的附近区域中寻找1)连接该推定的TR序列的接近IMH类型的序列,或2)用其寻找VR连接的IMH序列。
本发明一种或多种实施方式的详述见以下附图和描述。从这些附图和详述,以及从权利要求书中将明白本发明的其它特征、目的和优点。
附图简述图1a-1d显示博德特氏菌噬菌体的嗜性转换。图1a说明了关于支气管炎博德特氏菌(B.bronchiseptica)BvgAS介导的噬菌体转换的特异性和嗜性转换频率。BPP、BMP和BIP分别对Bvg+噬菌体、Bvg-噬菌体、或两种噬菌体具有嗜性。图1b显示产变异盒的组成。下划线是扩展的mtd 3’部分和134bp VR序列。可变碱基(红色)对应于TR中的腺苷残基。图1c显示在野生型(wt)BPP-1中,信息从TR单向传递给VR,伴随腺苷依赖的诱变。BPP-3’TR不能置换嗜性,而BPP-3’VR能转换野生型嗜性的频率的TR及VR中产生变异。图1d中,显示TR腺苷在上部后随亲代VR的相应核苷酸。TR1-9是体外对BPP-3’VR进行的变异试验中产生的TR序列。红色核苷酸表示变异位点。变异位点与亲代TR中的腺苷残基位置相同。
图2a和2b显示显示和噬菌体基因组中的产多样性反转录因子(DGR)。图2a显示DGR与其它种类反转录因子相关的系统发生树。显示了DGR,产多样性反转录因子(红线)的GenBank登录号;G2,第II组内含子;Rpls,线粒体逆转录质粒;Rtn,逆转录子;NLTR,非-LTR元件;LTR,LTR反转录因子;Telo,端粒酶;PEL,Penelope-样元件。用邻域参加(neighbor-joining)算法PHYLIP3.6b,以1000引导程序(bootstrap)取样分析RT结构域,表示为百分比。DGR形成了具有92%引导程序支持的明确确定的进化枝(红线;Brt粉红色园圈)。预测组II内含子它们最密切相关,但支持很弱(55%)。图2b显示与博德特氏菌噬菌体DGR相当的9个推定的DGR。所有DGR都包括一个ORF(191-888aa),其C-末端含有103-190bp VR(灰色箭头)、一个136-1220bp的间插区,在一些情况下含有一个与atd大小相似的小开放读框、和在紧靠近RT(283-415aa)处(22-339bp)与VR等长的TR(黑色箭头)。含两个VR、VR1和VR2的束毛蓝细菌(Trichodesmium)和念珠蓝细菌(Nostoc)元件看来产生自不同的诱变返祖事件,源于相同的TR。RT的E-值与Brt相当,范围是1E-11到4E-37。
图3a-3c显示多重取代实验的结果。图3a中,噬菌体MS1的TR含有用黑线标出的同义取代(见本文实施例1);TR腺苷用红线标出,毗邻位点用单线。紫色或兰色框内数据代表9个独立嗜性变体的VR序列。紫色框,BPP-MS1→BMP或BIP;兰色框,BMP-MS1>BPP。黑色线表示获自TR的取代;红线表示与亲代相比的变异位点。下图显示同义取代(传递直方图)转换的频率。紫色标杆(bar),BPP-MS1→BMP/BIP;兰色标杆,BMP-MS1→BPP。图3b显示体外变异试验的结果(见以下实施例1),选择从TR同义取代转换到VR后赋予了对MboII(紫色框位点100)或Af1III(兰色框位点37)的抗性。下图显示对应于MboII选择(紫色标杆)或Af1III选择(兰色标杆)的传递直方图,与限制性酶切割位点(箭头)。图3c显示噬菌体MS2的TR在位点106处含1bp缺失,如果传递给VR将导致mtd的移码突变和无感染性噬菌体(见方法)。紫色框内的数据说明BPP-MS2→BMP/BIP嗜性变体的VR序列。噬菌体MS3的TR在位点9含1bp缺失,如传递给VR导致无感染性噬菌体。兰色框中的数据显示BPP-MS3→BMP/BIP嗜性变体。传递直方图对应于BPP-MS2→BMP/BIP(紫色杆)或BPP-MS3→BPP(兰色标杆)反应。星号表示没有移码突变的传递为阴性选择。
图4a和4b显示诱变返祖产生的镶嵌VR序列。图4a中,用直方图显示在不同选择条件下TR转移的平均长度,和用气泡表示转移序列长度的分布(气泡大小代表给定长度克隆的相对数目)。复合选择,如要求嗜性转换(BPP→BMP;BMP→BIP)的选择,选出了含较长延伸段(stretch)转移序列的较为罕见分离物。较简单的单个核苷酸取代转移导致限制酶抗性(Af1IIIs→Af1IIIr;MboIIs→MboIIr)的选择,选出了更丰富的含较短延伸段转移序列的克隆,而不论选择的位点。图4b显示所产生的含不同长度随机TR部分的VR序列。在本发明提出的此模型中,诱变返祖后逆转录中,TR产生的逆转录物以同源依赖方式整合入VR形成异质双链体。这种整合起初在IMH位点,其机制类似于靶引导的逆转录(TPRT),如组II内含子提出的那样(Morrish,T.A.等,《内切核酸酶不依赖的LINE-1逆转录所介导的DNA修复》(Dna repair mediated byendonuclease-independent LINE-1 retrotransposition),Nat Genet,31159-165,2002;Wank,H.,SanFilippo,J.,Singh,R.N.,Matsuura,M.,Lambowitz,A.M.,《逆转录酶/成熟酶通过组II内含子RNA中其自身编码区段的结合推动剪切》(A reversetranscriptase/meturase promotes splicing by binding at its own coding segment in a groupII Intron RNA),Mol Cell,4239-250,1999)。产生的异质双链体由于腺苷特异性诱变而含有向密度的错配碱基对(红星)该异质双链体的一部分然后通过错配修复机制和/或重组转变为亲代VR序列。DNA复制将产生具有TR-衍生的变异序列斑点的镶嵌VR。
图5显示利用框内缺失来确定BPP-1生多样性盒的边界。将框内缺失导入倘接brt-mtd区的噬菌体基因中。显示含嗜性转换区的BPP-1基因组区段图,与因框内缺失导致的表型。用丝裂霉素C诱导溶源菌后产生的感染性噬菌体颗粒明确已发生变异。诱导溶源菌后用体外变异试验检测到产生的噬菌体DNA含有腺苷诱变的VR序列明确发生了变异。噬菌体基因bbp1、bbp2、bbp3和bbp4都是BPP-1活力所必须,但不是VR变体所必须。这些结构中,噬菌体基因brt、atd和mtd都是VR变体所必须。这三种变体盒基因中,只有mtd是BPP-1活性所必须。变体或活性不需要噬菌体基因bbp9和bbp10。迄今鉴定到的所有变异决定子都位于该噬菌体基因组的明确连续区域中,支持变异产生基因座为盒的观点。
图6a-c显示TR的腺苷依赖性诱变。图a上部序列显示TR有23个天然产生的腺苷(粗体字)残基和通过位点特异性诱变然后等位基因交换(位点55,红粗体字)引入新位点的一个额外异位腺苷残基。VR1-VR5显示独立分离的嗜性变体的VR序列,其中见有改变的异位腺苷。部分c显示该异位腺苷处变异的真实频率。这些数据证明TR中加入的此异位腺苷残基在VR中产生了一个新的变异位点。部分b上部序列显示TR中位点23-24的天然腺苷对已被GC取代(红色粗体字)。粗体字是其余21个天然腺苷。显示20个独立分离的嗜性变体中的代表性5个变体(VR1-VR5)其位点23-24无变异。由于嗜性转换期间位点23-24的天然腺苷对的变化频率为约95%,消除TR中的腺苷残基即消除了VR中相应位点的变异。部分c用体外变异试验计算出的传递的腺苷上的诱变频率。图中显示,数对传递的腺苷上的诱变频率导致位点之一(AA→NA/NN;AA→AN/NN)或二位点(AA→NN)发生取代(n=20)。也显示了位点35的单个内源腺苷(内源A→N,n=50)或位点55的异位腺苷(A→N,n=50)上的诱变频率。如所见和属于本发明范围的腺苷是与单个腺苷相比非常可能变化的一对碱基的一部分,位点55处的异位腺苷(见以上部分a)变化频率几乎与位点35处的内源腺苷相同。
图7的a和b显示内部缺失实验的结果。部分a此图显示(放大)BPP-1的TR和VR缺失了序列延伸段,用体外变异试验检测到所产生的菌侏VR中存在变异。右侧栏中VR中的变异用“+”表示,而没有变异用“-”表示。除非常大的缺失(D118)外,该系统能容纳不同大小和位置的缺失(Δ18、Δ39、Δ61)。最显著的是VR的5’部分大缺失(Δ61)仍显示了变异,表明不存在与该系统部分依据的同类性返祖IMH类似的5’顺式作用位点。部分b衍生自Δ61噬菌体的变体VR(VR1-4)序列与TR和VR(见上)的排列对比。显示了缺失与G/C延伸之间的序列。也显示了所选的MboII位点(下划线)及对应于TR中腺苷(粗体字)的残基处的诱变(红色)图8部分a和b,显示TR中含有多个取代的噬菌体嗜性转换频率。菌株名缩写与图3相同。MS1含5个同义取代而MS2和MS3除同义取代外含1bp缺失(见图3)。部分a在BMP-1背景(MS1、MS2、MS3)或野生型BMP-1中选出的转换为BBP嗜性的多个取代构建物。在Bvg-细菌上增殖溶源菌诱生的噬菌体,检测能在Bvg+上形成空斑的噬菌体组分。部分b在BPP-1背景或野生型BPP-1中选出的转换为BMP或BIP嗜性的多个取代构建物。在Bvg+宿主菌上增殖溶源菌诱生的噬菌体,检测能在Bvg-宿主菌上形成空斑的噬菌体组分。在部分a和b中,MS2和MS3噬菌体的嗜性转换频率较野生型低,表明通过阴性选择消除了该噬菌体组分。然而二例子中,这些突变噬菌体能转换嗜性同时避免了移码突变的传递(图3c)。
图9显示不同DGR的VR和TR的核苷酸序列排列对比。上部为TR序列,下部为VR序列。小字母为终止密码子。粗体字表示TR中的腺苷,而VR中的对应碱基如与TR不同为黑体字。注意,差别主要局限于TR腺苷,而非不是腺苷取代,表明DGR中诱变的基本机制是保守性的。3’末端的错配与博德特氏菌噬菌体中的IMH相似,用颜色(绿色VR,兰色TR)表示。此外,下划线的3’末端保守的TCTT基序功能未知。这些相似性表明其机制可能是保守的,尽管不同元件之间缺乏相同序列。
图10显示本发明的代表性构建物。在第一构建物中所示终止子的3’端与TR区起始端之间有一个atd区。在第二构建物中,启动子与所示TR区之间有atd区。第三构建物中没有atd或TR区。
图11显示诱生的原噬菌体上VR的诱变。
图12显示对经设计诱变产生含新有TR和IMH的异源序列的说明。
图13显示对用于诱变磷酸转移酶编码序列的构建物说明。
图14显示在诱变非博德特氏菌APH(3’)-IIa编码序列中所用的VR氨基酸序列。大写“L”表示在位点234插入一个琥珀密码子消除卡那霉素结合和灭活卡那霉素抗性的位置。
图15显示本发明各种DGR(包括蓝细菌DGR以及来自点型念珠蓝细菌、念珠蓝细菌ssp.7120#1和#2、红海束毛蓝细菌#1和#2及其它菌的DGR)的序列排列对比。
实施本发明的具体模式的详细描述本发明提供核酸分子和它们在位点特异性诱变感兴趣序列中的应用方法,所述感兴趣序列是VR与同源重复序列(TR)之间操作性相连的VR的全部或一部分,这种诱变可指导该感兴趣序列TR中腺苷所在位点的多样化。本发明所产生的多样性程度与能够指导VR中取代的腺苷位置数不相等。而是,TR中的各个腺苷(变异)可导致VR中该位点的3种不同核苷酸取代,其中许多将导致VR所编码的相应位点氨基酸取代。一个非限制性例子是,实施本发明时有23个腺苷酸理论上能产生高达1012种不同的多肽序列。
因此,本发明在给定的TR中提供高达23个或更多个腺苷酸(改变)来指导相应VR中的诱变。TR中存在的腺苷可能是天然产生的,或如本文所述在TR中精心插入或取代而产生的,就TR中天然产生的腺苷酸而言,可通过将该腺苷酸置换为非腺苷酸但不改变编码的氨基酸(沉默取代)来产生或避免诱变。就精心插入或取代而言,本发明提供的方法是在TR中导入1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多的腺苷酸。
如本文所述,本发明提供的重组和分离的核酸分子含有的可变区(VR)与模板区(TR)操作性相连,其中VR和TR序列位于同一分子或不同分子中。所述TR是与所述VR操作性相连的模板序列而能指导所述VR的位点特异性诱变。然而,该分子优选不是衍生分子,在Bvg+嗜性噬菌体-1(BPP-1)噬菌体的主要嗜性决定子(mtd)基因、atd区、和/或brt编码序列中只含一个或多个缺失突变。
如本文所述,VR和TR二区可在物理上顺式操作性相连或反式操作性相连。当顺式相连时,二区之间的间隔范围可以是给100个碱基对,或低于约1200个碱基对或更多,当以反式构型相连时,TR和操作性相连的RT编码序列的表达可处在内源或异源启动子的控制下;当反式相连时,TR和操作性相连的RT编码序列的表达可处在内源或异源调节性启动子的控制下。
本发明的核酸分子也含有与TR区顺式相连的RT编码区。RT编码序列的非限制性例子包括本文提供的哈氏弧菌ML噬菌体、长双岐杆菌、多形拟杆菌、齿垢密螺旋体的RT编码序列、或蓝细菌如红海束毛蓝细菌、念珠蓝细菌属或点型念珠蓝细菌的DGR。这些来源的有关RT编码序列都是技术人员可公开接触和获得的。另外,一些核酸分子在紧靠TR的5’末端可含一atd区(或bbp7区)。不受理论的束缚和为了促进对本发明的理解,认为该atd区参与了TR转录的调节和可利用异源启动子增强其功能。
在包括采用异源启动子的本发明实施方式中,所述启动子是适合在所用条件下表达TR和RT编码序列的任何启动子。一个非限制性例子是,当采用含VR和TR区的原核细胞时,所述启动子是适合用于原核细胞的任何启动子。非限制性例子包括丝状(噬菌体)血凝素启动子(fhaP)、lac启动子、tac启动子、trc启动子、phoA启动子、lacUV5启动子和araBAD启动子。当所述条件是采用真核细胞时,启动子的非限制性例子包括巨细胞病毒(CMV)启动子、人延伸因子-1E启动子、人泛素C(UbC)启动子、SV40早期启动子;对于酵母菌是Gal11启动子和Gal1启动子。当然,VR可维持在(如存在)内源启动子控制下,或在独立选自以上所述的,或根据所用的细胞是原核还是真核的其它异源启动子的控制下。如果实施本发明采用无细胞系统,应根据所用的细胞转录组分(如RNA聚合酶)选择启动子。
本发明的核酸分子还含有IMH序列或其功能同类物。上面已描述了IMH的功能,本发明还提供鉴定、分离和使用其它功能类似序列,不论是天然的或合成的序列的方法。就天然产生的功能同类物而言,实施本发明时可将它们与异源VR和TR序列一起使用。
用于实施本发明的IMH和IMH样序列的非限制性例子包括下表所列的那些。IMH和IMH样序列的3’末端可含有富含GC的区域。
表1


在还有一方面,本发明提供鉴定其它RT编码序列、IMH和IMH样序列、TR序列和VR序列的方法。在一实施方式中,本发明提供通过检索存在一种或两种含氨基酸序列IGXXXSQ或LGXXXSQ(其中“X”代表天然氨基酸)的保守性核苷酸结合位点的序列来鉴定RT编码序列的方法。可采用检索序列信息的任何适当方法。非限制性例子包括用BLAST或PSI-BLAST检索蛋白质序列数据库。
本发明也提供鉴定IMH序列的方法,该方法包括鉴定生物基因组中RT编码序列,任选如上所述在约5kb的RT ORF内搜索编码链,并鉴定含腺苷缺失DNA的18-48核苷酸延伸段的IMH样序列;和a)利用推定的IMH样序列搜索整个基因组中密切相关的推定的IMH,并比较5’末端至该IMH样序列和推定的IMH序列之间的DNA序列以分别发现同源TR和VR区;或b)利用位于5’端至IMH样序列之间的长100-350个碱基对的DNA来鉴定推定的TR,并利用该TR和IMH样序列的全部或一部分来搜索整个基因组中匹配的推定的VR和IMH序列。
可任选地选择可能的VR区进一步分析是否存在编码区或推定的编码区。根据位于整合区附近的RT编码序列选择可能的TR。当然可采可能的TR和VR区的序列排列对比来证实它们是操作性相连,特别是,如果序列差别主要在腺苷酸时。一个非限制性例子是,所述序列可以是约80%以上、约85%以上、约90%以上或约95%以上同源,其主要差别在于TR中腺苷碱基位置的变异。作为另一选择,鉴定TR或VR序列可包括检索或鉴定约100-350碱基对或更长的序列。
就鉴定IMH样序列或IMH序列而言,可利用在可能的TR和VR区3’末端处检索选自TCGG、TTTTCG或TTGT的保守序列。图9显示TR和VR对之间不相同的3’最末端核苷酸后的一些保守序列模式。
已按照TR和VR之间不相同的3’最末端核苷酸鉴定到保守序列的模式。比较VR区后面的区域(直达或略超过含VR基因终止密码子)揭示了几个共同特征,包括1)这些区域的长度约18-44个核苷酸(平均长约38个);2)这些区域没有或有很少腺苷酸;3)几乎所有(19/23)都以TC或TT开始,然后是富含一个或两个核苷酸单元的亚区;4)所有都在近3’端有一个或多个错配(9个核苷酸长度内最多有5个错配);和5)大多数(13/23)在该区域的3’端含有TCTT基序,其它(5/23)有类似的基序。因此可设计出具有一种或多种此类特征的本发明IMH和IMH样序列。
上述方法可采用生物信息算法形式来鉴定GDR和IMH。技术人员将知道,可以计算机可读媒介(如软件)方式来实施上述方法。
或者,可利用BPP1brt蛋白序列,以PSI-BLAST算法不检索蛋白质库中的同源序列。可利用先前鉴定的推定DGR的Bet同源序列进行第二次重复检索,可进一步检查RT编码序列附近TR和IMH样序列的顶级命中(top hit)。在某些实施方式中,可检索含有密切相关RT基因的生物体基因组中离RT编码序列上游和下游约2000-5000bp的基因组区域,有无直接重复序列,例如长度≤4或>50nt的重复序列。如果上游基因的3’端和RT基因上游整个区域内含重复序列即可鉴定为潜在的TR和VR区。排列对比所鉴定到的潜在TR和VR区是否序列差异主要在于腺苷酸。可检查该推定的TR和VR区中上述保守的IMH和IMH样序列基序。
本发明也提供从对比无不同3’末端的TR和VR得到的至少二种分类模式。蓝细菌序列形成了高度相似的亚组,而在此二区一端或二端含保守基序的其它TR/VR对具有不相似的内部序列(见图15)。终止密码子的位置距各区保守基序下游不同距离。
本发明位点特异性诱变序列的非限制性例子是编码靶分子结合伴侣的所有或部分序列。结合伴侣的非限制性例子包括糊精、THF-γ2、肾上腺髓质素、胰岛素、VEGF、PDGF、锯鳞(蝰)血抑(环)肽、人生长激素、MMP、纤连蛋白、整联蛋白、钙调蛋白、选择素、HBV蛋白、HBV抗原、HBV核心抗原、纤维蛋白溶酶、蛋白酶、肥大细胞蛋白酶、Src、Lyn、周期蛋白D激酶(Cdk)、p16INK4、SH2/SH3结构域、SH3拮抗剂、ras效应器结构域、法尼基转移酶、p21WAF1、Mdm2、粘着斑蛋白、补体组分、C3b、C4结合蛋白(C4BP)、受体、尿激酶受体、肿瘤坏死因子(TNF)、TNFα受体、抗体(Ab)和单克隆抗体(MAb)、CTLA2 MAb、白介素、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、IL-13、IL-17、干扰素、LIF、OSM、CNTF、GCSF、白介素受体、IL-1受体、c-MpI、促红细胞生成素(EPO)、EPO受体、T细胞受体、CD4受体、B细胞受体、CD30-L、CD40L、CD27L、瘦蛋白、CTLA-4、PF-4、SDF-1、M-CSF、FGF、EGF。
在本发明某些实施方式中,所述结合伴侣是细菌素(包括弧菌素、绿脓菌素或大肠杆菌素)、噬菌体蛋白(包括决定宿主特异性的尾组分)、荚膜或膜表面组分、细胞表面因子的配体、或经鉴定的药物或诊断用靶分子。
在其它实施方式中,所述结合伴侣是融合蛋白的一部分,其产生的嵌合蛋白含另一种多肽。融合蛋白的另一多肽成员可选自以下非限制列表噬菌体的尾纤维、毒素、神经毒素、抗体、生长因子、趋化因子、细胞因子、神经生长因子。
在其它实施方式中,所述结合伴侣可以是核酸、核酸分子的一部分、或适体。
如上所述,本发明也提供衍生自天然序列的分离的核酸分子。这种分离的核酸分子描述为含有供体的模板区(TR)和可变区(VR),其中所述TR是模板序列,其操作性连接于所述VR能指导所述VR位点特异性诱变。优选所述分子是噬菌体的分子,但不是Bvg+嗜性噬菌体-1(BPP-1)、Bvg-嗜性噬菌体-1(BMP-1)、或Bvg不区分噬菌体-1(BIP-1)的分子。
本发明的核酸分子可以是载体或载体对的一部分,将它们导入细胞能产生VR的位点特异性诱变,和/或支持该分子复制。载体的非限制性例子包括质粒和病毒载体,包括可用于表达多样性VR序列的噬菌体展示载体。其它非限制性实施方式是含有VR序列的载体,用于本发明方法时除去了操作性相连的TR序列以防止TR表达,因而不进一步产生多样性数量VR-编码的蛋白质,可用作诊断、预后或治疗产品本发明也提供本身含一种以上VR序列的“多样性集合物”,或就载体组成而言至少含二种彼此序列不同的VR序列。在一些实施方式中,序列的不同导致VR序列产生编码不同的多肽,但所述不同也可以是沉默或同义(不同密码子编码同一氨基酸)密码子,任选在需要改进所编码多肽的表达时,用于密码子优化。“多样性集合物”也称为载体组成中VR序列本身文库或集合。因此,本发明也提供本文所述的多种核酸分子或库。该多种分子或库可包含经操作性连接的TR指导的多样性VR。
含本发明核酸的细胞的非限制性例子包括支持本文所述位点特异性诱变噬菌体的细菌细胞,或支持诱变和/或产生及加工重组诱变蛋白的任何物种来源的真核细胞。在一些实施方式中,可采用酵母菌和真菌细胞。在其它实施方式中,可采用高级真核细胞。
现已总体上描述了本发明,通过参考以下提供的实施例不难更好地理解本发明,但这些实施例是为了阐述而非限制本发明,除非另有说明。
实施例实施例1材料与方法细菌菌株、噬菌体和质粒博德特氏菌菌株衍生自经测序的RB50株(Uh1和Parkhill J.等,《百日咳博德特氏菌、副百日咳博德特氏菌和支气管炎博德特氏菌基因组序列的比较性分析》(Comparative analysis of the genome sequences of Bordetella pertussis,Bordetellaparapertussis and Bordetella bronchiseptica),Nat Genet,3532-40,2003),BPP-1诱生自支气管炎博德特氏菌的家兔分离物(Liu等,2002)。用嗜性转换试验(见下)从BPP-1分离得到BMP-1。采用软琼脂覆盖法制备平板裂解液(Adams,M.H.,《噬菌体》(Bacteriophages),Interscience Publishers Inc,New York,NY,1959),按先前报导(Liu等,2002)实施嗜性转换试验。利用等位基因交换产生细菌和噬菌体构建物(Edwards,R.A.,Keller,L.H.,Schifferli,D.M.,《改进的等到位基因交换载体和它们在分析987P原纤维蛋白基因表达中的应用》(Improved allelic exchange vectors and their use toanalyze 987P fimbria gene expression)Gene.207149-157,1998),Figurski,D.H.和Helinski,D.R.,《依赖于反式提供的质粒功能的含起点的衍生质粒RK2的复制》(Replication of an origin-containing derivative of plasmid RK2 dependent on a plasmidfunction provided in trans),Proc Natl Acad Sci USA,761648-1652,1979。
多取代构建物BPP-MS1和BMP-MS1(图3a和3b)分别是BPP-1和BMP-1的衍生物,其TR中含有以下同义取代T7-A(PstI),G37-T(BstXI),C55-A(XhoI),C79-G(ApaI)和G100-C(NlaIII)。各取代产生了所示的独特限制性酶切位点。37和100位的取代分别消除了Af1III和MboII限制性位点,得以体外选择变异(图3b)。噬菌体MS2(图3c)是BPP-1的衍生物,在TR中106位点含有1bp缺失和以下取代T7-A、G37-T、C55-A、C-79G。噬菌体MS3(图2c)是BMP-1R的衍生物,在TR中9位点含有1bp缺失和以下取代G37-T、C-55-A、C79-G和G100-C。
体外变异试验选择体外变异试验从TR转移一个核苷酸取代至VR,以赋予对限制性酶切的抗性。用丝裂霉素C诱导溶源菌,用PCR扩增VR序列以适当限制酶消化。用嵌套引物重复该扩增-限制循环直到救发现进一步切割,将产物克隆到pBluescript KS+载体(Stratagene)中用于测序。用BsrI(能切割亲代TR但不切割经腺苷修饰而赋了抗性的TR序列)检测TR中由于“自身返祖(self-homing)”所至的变异(图1c,BPP-3’VR)。对于图3b的多重取代实验,纯化扩增产物用Af1III消化BMP-MS1噬菌体或用MboII消化BPP-MS1噬菌体。二例中,切割含有特定同义取代的噬菌体亲代VR序列而消除限制性酶切位点,从TR转移获得抗性。
生物信息学注译的BPP-1序列获自GenBank登录号AY029185。整个数据库含有编辑的保守逆转录酶催化结构域(Pfam00078 rvt),用PHYLIP软件包(evolution.genetics.washington.edu/phylip.html)构建发生树图。用REPuter程序(Kurtz,S.等,《REPuter在基因组范围重复分析的多种应用》(REPuterthe manifoldapplications ofrepeat analysis on a genomic scale),Nucleic Acids Res.,294633-2624,2001)搜索和Brt一起分组的入口(entry)以得到最接近RT的直接重复的存在。用Aetemis软件收集数据并帮助注释(Rutherford,K等,《Artemis序列观察和编辑》(Artemissequence visualization and annotation),Bioinformatics,16944-945,2000)。
实施例2多种同义取代根据TR中的保守性核苷酸取代会掺入到VR中,产生嗜性转换的噬菌体这一发现,设计了产生序列变异跟踪此现象的遗传策略。通过沿TR序列部位导入多个同义取代,嗜性转换期间该TR部分的转移可通过记录VR序列中所见到的取代模式来确定。从所产生的“单倍型”图可重建嗜性转换的机制。
观察到沿VR传递信息时不均匀。图3a显示传递模式伴随BPP→BMP/BIP或BMP→BPP嗜性转换。二例中,3’标记传递效率是100%,而5’标记传递频率大约是50%。腺苷处的变异与最近取代的转移相关,而变异与它们的缺失无关。在几种情况下所见的镶嵌模式中变异延伸。TR-衍生序列中间插有非变异的VR衍生序列(小册子,图3a)。总之,这些结果不赞同转座反应中常见的简单切割和粘贴机制(Pena,C.E.,Kahlenberg,J.M.,Hatfull,G.E.,《位点特异性重组复合体的装配和活化》(Assemblyand activation of site-specific recombination complexes),PNAS 977760-5,2002;和Hallett B.,Sherratt,D.J.,《转座和定点整合各种基因重排的适应性DNA切割和粘贴机制》(Transposition and site-specific integrationadapting DNA cut-and pastemechanisms to a variety of genetic rearrangements),FEMS Microbiol Rev.21157-78)。
由于尚不清楚决定受体特异性的序列决定子,先天强有力也是不够明确的选择性压力造成了嗜性转换试验的偏差。因此用PCR体外试验记录取代模式,该试验可选择单一精确确定位置的变异,但不能选择嗜性转换或噬菌体的感染性。这些试验依据的是由于TR中的同义取代传递所至亲代VR序列中丧失了限制性位点。
如3b所示,体外变异试验揭示,在标记转移的特异性选择模式中Af1III选出的克隆优先转移含选择位点(位点37)的TR中间部分,转移频率双向之一均陡峭。MboII选出的克隆转移了含选择位点(位点100)的TR3’末端,但与5’末端处的序列变异无不同。二种情况下,标记转移的最大频率偏移到确切的选择点。大多数转移显示间断的传递形式,或侧接不变序列的传递片(小册子,图3b)。
尽管没能选择到诱变,但图3b的所有VR序列都含腺苷取代。为进一步检测可逆性程度,对TR的3’或5’边界的转移进行了强负选择。通过导入移码突变实施此选择,如果能转移则产生无活性噬菌体此系统令人惊奇地容纳了这些极端选择。二种突变噬菌体均转换了嗜性同时避免了移码突变,产生了传递直方图基本为镜象图形(图3c和图8)。
实施例3基因转换进行体外限制性酶试验选择单个位点时,倾向于分离得到以选择点为中心的较短可变序列。新的受体特异性更为复杂的选择要选择较大的可转移的诱变序列的区段(图4a)。
初始在IMH处定点返祖,然后因重组或修复产生基因随机转换的机制可满足这些条件。按照此模式,在产生变异的过程中VR处将形成异质双链体(图4a)。见Morrish等和Wank等。该异质双链体的特征是VR与TR衍生的DNA杂交所至的高密谋碱基对错配。错配修复或同类型加工将产生含“斑块状”序列变异的嵌合性VR。
产生多样性机制造成的结果是,以高度靶向方式将变异导入mtd基因座中。多样性只发生在可变重复序列的边界处,只发生在对应于TR中腺苷残基位点处,局限于所选的碱基亚组。此种变异的“焦点”可能具有很高的适应性,因为它能有效应对选择压力同时最大程度减少非必须或有害取代的积聚。鉴于高比例的腺苷诱变,此修复步骤可能是必须的,通过反复多轮的选择可优化受体的特异性(Wrighton,N.C.等,《可作为蛋白激素促红细胞生成素的强效模拟物的小肽》(Small peptides as potentmimetics of the protein hormone erythropoietin),Science 273458-64,1996;和Fairbrother,W J等,《选择能结合血管内皮生长因子靶向受体结合位点的新型肽》(Novel peptides selected to bind vascular endothelial growth factor target thereceptor-binding site),Biochemistry,3717754-64,1998)。
实施例4其它生物中的相关基因多样化系统能够使参与配体-受体相互作用的蛋白结构域多样化具有极其广泛的用途。因此本发明提供从其它天然来源发现的博德特氏菌噬菌体反转录因子同类元件。为鉴定相关序列,编辑了细菌来源的含保守性RT结构域的开放读框(ORF)。群集了系统发育上含Brt的亚组(图2a)。检查了毗邻序列,鉴定了所有情况VR位于ORF 3’末端的TR和VR候选重复序列。
进一步注译揭示存在一种我们现称为推定的产多样性反转录因子(DGR)的盒阵列。虽然与RT结构域高度相关,但DGR具有共同的全部保守性结构特征(图4b)。这些相关盒的其它组分之间几乎没有任何序列相似性。
每种情况VR同类物与它们的同源TR不同几乎都在于与腺苷相对应的位点(图9)。此发现支持利用这些盒依据它们的功能以相似方式来产生多样性。
同源VR和TR的3’末端比较,也提示同源序列存在于博德特氏菌噬菌体的IMH位点(图9)。如图2b所示,在广泛的细菌菌种的染色体内均发现有DGR,它们显示共同的变异。例如,念珠蓝细菌和蓝细菌属所含的盒中,一种TR看来提供了二种含序列变异的不同VR。此类例子中,VR的ORF共生同源部分序列相同性超过90%,除与TR中腺苷相对应的碱基外均相同。
此外,几种蓝细菌含多个不同源的DGR,因而是独立获得的。虽然博德特氏菌和哈氏弧菌的盒存在于问及此事噬菌体上,但无噬菌体其余序列相关的证据。根据图2数据,提出在多种生物体中DGR已通过进化而能行施无数功能。
逆转录元件,如组II内含子(Bonen,L&Vogel,J.,《组II内含子的出入》(The insand outs of group II introns),Trend Genet 17322-331,2001)、逆转录转座子(Bushman,F.D.,《靶向存活逆转录病毒整合位点选择和LTR逆转录转座子》(Targeting survivalintegration site selection by retroviruses and LTR retrotransposons).Cell.115135-38,2003)、逆转录病毒(Gifford,R&Tristem M.,《内源逆转录病毒的进化分布和多样性》(The evolution,distribution and diversity of endogenous retroviruses),Virus Gene.26291-315,2003)和人LINE(Kazazian,H.H.Jr.&Goodier,J.L.,《LINE驱动反转录转座子和基因组不稳定性》(LINE driveretrotransposition and genome instability),Cell.110277-80,2002)共同具有相关的特征。
实施例5顺式和反式作用的DGR元件利用博德特氏菌菌株61-11(RB50 BPP-1Δbrt,见图10)来特征鉴定DGR的顺式和反式作用元件。该菌株缺失了原噬菌体的RT基因(brt),使该噬菌体不能转换其嗜性。
PCR扩增用限制酶消化的完整RB50 BPP-1溶源菌的含各种DGR组分的DNA片段,将它们克隆入含fha启动子的载体pBBRmcsF中。表1和图10显示了二种质粒pfhaP-atd-TR-brt和pfhaP-TR-brt。在pfhaP-atd-TR-brt中pfhaP与atd-TR-brt序列之间没有终止子。在pfhaP-TR-brt中fha启动子与TR之间没有atd。
所产生的构建物见表2表2

在质粒转化到菌株61-11中后,用丝裂霉素诱导溶源菌细胞检测嗜性转换,将噬菌体裂解物直接接种RB53(Bvg+菌株)或RB54(Bvg-菌株)上观察空斑形成(见图11,采用pfhaP-atd-TR-brt提呈)。
将诱生的含pfhaP-atd-TR-brt细胞裂解液直接接种在RB53(Bvg+)或RB54(Bvg-)菌上。分离RB53平板上的18个空斑,PCR扩增后测定它们VR区的序列发现对应于TR中腺苷的位点有变异。100微升裂解液直接接种RB54平均可见到15个空斑(与接种RB53相比频率约10-3)。
平行实验中,将诱生的含pfhaP-TR-brt细胞裂解液直接接种在RB53(Bvg+)或RB54(Bvg-)菌上。分离RB53平板上10个空斑的噬菌体,用PCR扩增它们的VR区并测序。在VR中对应于TR中腺苷的位点均有变异。100微升裂解液直接接种RB54平均可见到15个空斑(与接种RB53相比频率约10-3)。
因为所有噬菌体,甚至嗜性没转换的噬菌体的VR区在对应于TR中腺苷残基的位点都有核苷酸变异,诱变频率当采用异源强效启动子时效率为100%。
用pfhaP-brt和pfhaP-atd-TR进行类似实验显示无嗜性转换。
结果显示,弥补brt缺失、恢复嗜性转换能力所需的最小单元是TR-brt区,此区中i)TR与brt以顺式连接发挥ii)TR以反式连接对VR发挥作用此结果表明再次提示反式作用构建物方能指导噬菌体VR序列前病毒拷贝的诱变。
实施例6未诱导原噬菌体的反式诱变检测在不诱导噬菌体时,TR-brt反式表达能否改变原噬菌体(染色体)的VR序列。在未诱导的含质粒pfhaP-atd-TR-brt的溶源菌61-11中,PCR扩增过夜培养物,将DNA产物克隆入测序载体。
在一实验中,挑取一个菌落在LB培养基中37℃培养过夜。PCR扩增5微升过夜培养物的VR区,将其克隆入测序载体(pBluesriptII)。测定20个质粒的序列,二个在对应于TR中腺苷处有变异(10%)。在另一实验中,挑取5个菌落分别在LB培养基中37℃培养过夜。PCR扩增5微升各过夜培养物的VR区,将其克隆入测序载体(pBluesriptII)。每次接种测定3个质粒的序列,15个中有5个在对应于TR中腺苷处有变异(30%)。
fha启动子指导的TR-brt区转录导致VR诱变水平升高,证明i)TR-brt转录可在异源启动子的控制下,替代对atd元件的需要(见下)ii)控制TR-brt转录影响到VR诱变水平iii)在细菌染色体中TR-brt区反式作用于同源的VR区。
实施例7导入添加的诱变位点利用定点诱变,置换TR区59-61核苷酸的3个腺苷。该相应的VR核苷酸编码不变异的Mtd残基A356。利用同源重组,将3个腺苷被置换的TR导入菌株6405(RB54BMP-1溶源菌)。通过测序和限制性消化证实成功修饰了6405TR,产生菌株6405(见下)。
TR-菌株6405
cgctgctgcgctattcggcggcaactggaacaacacgtcgaactcgggttctcgcgctGCGaactggaacaacgggccgtcgaactcgaacgcgaacatcggggcgcgcggcgtctgtgcccatcaccttcttgTR-ALT SRI 6405AAAcgctgctgcgctattcggcggcaactggaacaacacgtcgaactcgggttctcgcgctAAAaactggaacaacgggccgtcgaactcgaacgcgaacatcggggcgcgcggcgtctgtgcccatcaccttcttg诱导菌株6405AAA。用PVR扩增所产生的噬菌体混合物,并用限制酶(MboII)消化切除VR序列的3’末端至AAA取代。体外选择亲代MboII识别序列的多样性,不评估其对编码多肽的作用。再扩增NboII未消化的VR序列然后克隆,测序显示新导入的TR腺苷残基已传递给VR并产生了多样性。
实施例8返祖诱变不需要atd将终止密码子放在atd不能消除诱变。这表明atd不编码诱变所需的蛋白质。
采用定点诱变,用终止密码子取代推定是辅助嗜性决定子(atd)ORF的第9位氨基酸。利用同源重组将含终止密码子的该atd导入溶源菌株6405中。测序证实成功修饰了6405。
诱导和增加一轮增殖后,分离能在BVG+和BVG-支气管炎博德特氏菌上产生空斑的噬菌体。因此该噬菌体保持了嗜性转换的能力。此外,原代诱导的噬菌体产生了变异。在限制酶/PCR选择方法中利用对限制性消化敏感性的变化,在原代裂解物中选到变体证明了此点。
结合以上实施例5的结果,可得出结论,嗜性转换不需要atd编码的多肽,因此atd序列完全可用异源启动子替代。
Atd-野生型atggaacccatcgaggaagcgacaAAGtgctacgaccaaatgctcattgtggaacggtacgaaagggttatttcgtacctgtatcccattgcgcaaagcatcccgaggaagcacggcgttgcgcgggaaatgttcctgaagtgcctgctcgggcaggtcgaattattcatcgtggcgggcaagtccaatcaggtgagcaagctgtacgcagcggacgccgggcttgccatgctgcgattttggttgcgctttctcgcgggcattcagaaaccgcacgctatgacgccgcatcaggtcgagacagcacaagtgctcatcgccgaagtggggcgcattctcggctcctggattgcccgcgtgaatcgcaaagggcaggctgggaaataaatd-含终止密码子atggaacccatcgaggaagcgacaTAGtgctacgaccaaatgctcattgtggaacggtacgaaagggttatttcgtacctgtatcccattgcgcaaagcatcccgaggaagcacggcgttgcgcgggaaatgttcctgaagtgcctgctcgggcaggtcgaattattcatcgtggcgggcaagtccaatcaggtgagcaagctgtacgcagcggacgccgggcttgccatgctgcgattttggttgcgctttctcgcgggcattcagaaaccgcacgctatgacgccgcatcaggtcgagacagcacaagtgctcatcgccgaagtggggcgcattctcggctcctggattgcccgcgtgaarcgcaaagggcaggctgggaaataa实施例9异源多肽的多样性用限制酶SacI和XbaI从质粒pZS24*Luc分离含自身启动子的编码氨基糖苷-3’-磷酸转移酶-II(APH(3’)-IIa的卡那霉素抗性基因,将其克隆入质粒pBBRmcs(图12)。携带此新质粒pBBR-Kan的大肠杆菌菌株XL1-blue能在存在卡那霉素和氯霉素时生长。
(APH(3’)-IIa的氨基酸序列长264个残基,如下M I E Q D G L H A G S P A A W V E R L F G Y D W A Q Q TI G C S D A A V F R L S A Q G R P V L F V K T D L S G A L N E LQ D E A A R L S W L A T T G V P C A A V L D V V T E A G R D WL L L G E V P G Q D L L S S H L A P A E K V S I M A D A M R R LH T L D P A T C P F D H Q A K H R I E R A R T R M E A G L V D QD D L D E E H Q G L A P A E L F A R L K A R M P D G E D L V VT H G D A C L P N I M V E N G R F S G F I D C G R L G V A D R YQ D I A L A T R D I A E E L G G E W A D R F L V L Y G I A A P DS Q R I A F Y R L L D E F F突出显示243位的Leu残基。
用定点诱变将终止密码子(taa)导入243位。此突变消除了含质粒pBBR-Kan宿主菌的卡那霉素抗性。质粒pZS24*Luc得自Lutz,R.&Bujard,H.,Nucleic Acids Res.251203-1210,1997。
用PVR扩增此卡那霉素抗性基因,用限制酶(KpnI和HindIII消化。将DNA片段转置于质粒pfhaP-atd-TR-brt(其在atd上游缺失了转录终止子结构)的5’至atd-TR-brt区(见图13)。
设计的卡那霉素抗性基因(APH(3’)-IIa的VR区包含该基因的最末75bp(编码25残基,以Phe终止),后接终止密码子tga和55bp的基因mtd末端(见图14)。该55bpmtd区显示有一假设的编码肽序列,包括14bp富含GC区(图14下划线)后随IMH序列。用PCR以携带与质粒pKan-atd-TR-brt的5’端插入位点两侧互补侧接区的寡核苷酸扩增此mtd区。纯化OCR产物,用作引物在质粒pKan-atd-TR-brt上产生修饰的位点特异性诱变。所产生的质粒是pKan-IMH-atd-TR-brt(图13)。
以下显示设计的卡那霉素抗性基因TR区与其同源VR区序列的排列对比。显示与VR相对应的130bp区和对应于大写字母Leu243的密码子。最末的55bp与BPP-1DGR区中的TR区相同,用大写字母强调。

用改进的位点特异性诱变制备质粒pKan-IMH-atd-TR-brt中的卡那霉素抗性基因和TR’区。最终的质粒是pKan-IMH-atd-TR’-brt(图13)或pKan-TR’。通过位点特异性诱变将一个琥珀终止密码子导入该卡那霉素抗性基因的位点243,产生pKan243 am-IMH-atd-TR’-brt(也称为pKan243-TR’)。
将该质粒转化溶源菌61-11。在卡那霉素存在时含质粒pKan-TR’的溶源菌生长正常。
如下选择含pKan243-TR’的卡那霉素抗性菌。将携带质粒pKan243-TR’的溶源菌61-11作系列稀释后培养过夜。将各稀释液接种含40微克/ml卡那霉素的LB平板。预计含卡那霉素抗性质粒的61-11宿主菌(含通过腺苷特异性诱变产生的“修复”琥珀终止密码子)在存在卡那霉素时会形成菌落。从含pKan243-TR’的宿主菌平板中分离得到二个强势菌落243resis1VR和243resis2VR,扩增它们的VR区并测序。
上栏中显示了结果,其中243resis1VR含taa到tac(Tyr)变异;tac是与TR’相同的密码子序列。表明可用TR’序列替代VR序列。换言之,此变异是由于TR’的序列替代了VR的序列。
243resis2VR中,由于同一密码子中的二个突变taa变成ttc(Phe)。两个诱变事件之一是由于TR’中相应的A多样性同时如243resis1VR所见TR’模板发生A变成C的取代(或返祖取代)。Phe和Tyr是结构非常相似的氨基酸,二者均为亲水性,结果显示当天然序列243位(原先是Leu,也是亲水性)是Tyr或Phe时能恢复卡那霉素抗性。这提示243位耐受Leu被Tyr或Phe取代,仍能维持或恢复磷酸转移酶功能。
如Nurizzo等(J Mol Bio1.,327491-506,2003)所示,卡那霉素抗性蛋白的C末端结构域参与了卡那霉素分子结合。根据其公布的晶体结构。L243变成琥珀密码子突变在α螺旋7和8之前截短了此蛋白。这导致丧失形成卡那霉素结合袋一部分的C-末端残基260-264。因此,从终止密码子到243resis1VR和243resis2VR中的那些(氨基酸取代)反映了磷酸转移酶卡那霉素结合结构域的恢复。
以上结果也表明,发生诱变时不需要翻译IMH,因为IMH后随上述卡那霉素磷酸转移酶结构中的tga终止密码子。也可采用能提供在第二分子上另一启动子控制下的TR和RT编码序列的反式构建物来实现上述结果。
实施例10齿垢密螺旋体DGR的鉴定齿垢密螺旋体是一种寄居在人口腔的与牙龈疾病有关的可运动厌氧螺旋体。其经鉴定的134碱基对的可变区(VR)位于开放读框TDE2269的3’末端。相应的模板区(TR)位于VR下游199碱基对与逆转录酶编码序列(含博德特氏菌噬菌体逆转录酶(brt)的同源区6e-39)上游573碱基对之间。VR和TR有26处不同,其中23处不同位于VR中对应于TR的腺苷酸处。与腺苷不对应的三处中的二处可能是IMH的信号(传导)部分,因为它们是变异的最远端3’处(见下)。还有,TDE2269具有脂蛋白信号序列(下划线),表明此蛋白可能输出到外膜。下文的黑体表示VR区。
TDE2269-329氨基酸MKNTNSKLKTKVLNRAISITALLLAAGVLLTGCPTGQGKSGGGESSEVTPNTPVDKTYTVGSVEFTMKGIAAVNAQLGHNDYSINQPHTVSLSAYLIGETEVTQELWQAVMGNNPSHFNGSPAVGETQGKRPVENVNWYQAIAFCNKLSIKLNLEPCYTVNVGGNPVDFAALSFDQIPDSNNADWDKAELDINKKGFRLPTEAEWEWAAKGGTDDKWSGTNTEAELKNYAWYGSNSGSKTHEVKKKKPNWYGLYDIAGNVAEWCWDWRADIHTGDSFPQDYPGPASGSGRVLRGGSWAGSADYCAVGERVNISPGVRCSDLGFRLACRP为验证VR中对应TR中的腺苷变异,在变异试验中采用限制酶HinCII来鉴定齿垢密螺旋体的VR与测序的VR在25个核苷酸位点不同。25处不同中的21处位于对应于TR中的腺苷酸位点,其余4处不同之一看来是如以下所示TR的直接核苷酸转移(或返祖)。
HinCII的识别位点是GTYRAC,其中Y是C或T;R是A或G。TR链是模板区;VR链是可变区;IV链是可变区中鉴定到的变异。黑体分别表示TR和VR推定的IMH-样和IMH序列的一部分。
TRCCGCGTCAGGCTCTAACCGTGTTAAACGCGGCGGCAGCTGGAACAACAACGCGAACAAVRCCGCGTCAGGCTCTGGCCGTGTTTTACGCGGCGGCAGCTGGGCCGGCAGCGCGGACTAIV------------------------------------------A-AA-TA------GGGTRCTGCACTGTAGGCAAACGGAATAACAACAGTCCTGACAACAGGAACAACAATCTTGGCVRCTGCGCTGTAGGCGAACGGGTCAACATCAGTCCTGGCGTCAGGTGCAGCGATCTTGGCIV----A----G---ACC----GT---GG--AC------AA----G---A-CT-------TRTTCCGCTTGGCTTGTCGGCCVRTTCCGCCTGGCTTGCCGGCCIV--------------------本文引用的所有文献全部纳入本文参考文献中,不论是否曾专门纳入。本文所用的术语“一个”,“一种”和“一类”各包括单数和复数形式。
现已全面描述了本发明,本领域技术人员知道,无须过多实验,可采用广泛范围的同等参数、浓度和条件实施本发明但这不脱离本发明的思路和范围。虽然结合具体实施方式
描述了本发明,但应理解可进一步修改本发明。此申请书包括按照本发明的总体原理作出的任何变化、应用或适应,包括本文公开的内容,如已知的或本领域客户按照本文所述内容实施的,和本文所述特征的应用。
权利要求
1.单个重组核酸分子或核酸分子对,所述分子含有操作性连接于供体模板区(TR)的可变区(VR);其中,所述TR操作性连接于逆转录酶编码序列并且是指导所述VR位点特异性诱变的模板序列,和所述单个分子不是衍生的、只含有Bvg+嗜性噬菌体-1(BPP-1)噬菌体的主要嗜性决定子(mtd)基因、atd区和/或brt编码序列中一个或多个的缺失突变。
2.如权利要求1所述的分子,其特征在于,所述TR的序列是由于在所述TR中一个或多个腺苷酸被取代、或VR中的一个或多个非腺苷酸在TR中被腺苷取代、或VR中的腺苷酸在TR中被非腺苷酸取代所产生的VR中序列的有缺陷的直接重复。
3.如权利要求1或2所述的分子,其特征在于,所述VR是编码靶分子结合伴侣的序列的全部或一部分。
4.如权利要求3所述的分子,其特征在于,该分子还包含编码所述结合伴侣的全部序列,其中所述VR可以是编码所述结合伴侣的序列的3’部分。
5.如权利要求3或4所述的分子,其特征在于,所述结合伴侣结合细胞表面分子、激素、生长或分化因子、受体、受体的配体、细菌细胞壁分子、病毒颗粒、免疫或免疫耐受因子、或MHC分子。
6.如权利要求3或4所述的分子,其特征在于,所述结合伴侣是细菌素。
7.如权利要求1-6中任一项所述的分子或分子对,其特征在于,所述TR和RT编码序列在异源启动子如fha启动子控制下转录。
8.一种含有权利要求1-7中任一项所述分子或分子对的细胞。
9.一种制备权利要求1所述单个分子的方法,其特征在于,所述方法包括将含有所述VR的第一核酸分子操作性连接于含所述TR的第二核酸分子,所述TR是指导所述VR位点特异性诱变的模板序列。
10.一种制备权利要求7所述单个分子或分子对的方法,其特征在于,所述方法包括将异源启动子序列操作性连接于含所述TR和RT编码序列的核酸分子。
11.一种位点特异性诱变感兴趣核酸序列的方法,其特征在于,所述方法包括获得权利要求1所述的核酸分子或分子对,其中,所述VR含所述感兴趣的核酸序列,且所述TR是所述感兴趣序列的有缺陷的无缺陷的重复,其中,所述TR是操作性连接于所述感兴趣的序列以指导该序列位点特异性诱变的模板序列,且所述TR是由于所述感兴趣序列中一个或多个腺苷酸被非腺苷酸取代或一个或多个非腺苷酸被腺苷酸取代而产生的有缺陷的重复;和在细胞中表达所述核酸分子,所述感兴趣序列的一个或多个核苷酸位点被不同核苷酸取代。
12.如权利要求11所述的方法,其特征在于,其中所述感兴趣序列的一个以上核苷酸位点被取代。
13.如权利要求11或12所述的方法,其特征在于,所述感兴趣的序列编码靶分子结合伴侣的全部或部分。
14.如权利要求13所述的方法,其特征在于,所述结合伴侣的结合性被改变。
15.如权利要求13或14所述的方法,其特征在于,所述VR是编码所述结合伴侣的序列的3’部分。
16.如权利要求13或14或15所述的方法,其特征在于,所述结合伴侣结合细胞表面分子、激素、受体、受体的配体、细菌细胞壁分子、病毒颗粒、或MHC分子。
17.如权利要求13或14所述的方法,其特征在于,所述结合伴侣是细菌素或细菌噬菌体部分。
18.一种分离的核酸分子,其包含供体模板区(TR)和操作性连接的RT编码序列,其中所述分子不来自Bvg+嗜性噬菌体-1(BPP-1)、Bvg-嗜性噬菌体-1(BMP-1)、或Bvg不区分噬菌体-1(BIP-1)噬菌体。
19.如权利要求18所述的分子,其特征在于,所述分子分离自噬菌体、细菌的原噬菌体、细菌或螺旋体。
20.如权利要求1所述核酸分子的集合或分子库。
21.如权利要求20所述的核酸分子集合或分子库,其特征在于,所述VR经历TR指导的多样化。
22.一种鉴定IMH序列的方法,其特征在于,所述方法包括鉴定生物体基因组中的RT编码序列;在RT ORF的约5kb内搜索该编码链,并鉴定含腺苷缺失DNA的18-48核苷酸延伸段的IMH样序列;和a)利用推定的IMH样序列搜索整个基因组中密切相关的推定的IMH,将连接于IMH样序列5’端的序列与推定的IMH序列进行比较以找到TR和VR区;或b)利用连接于5’末端的长100-350个碱基对的DNA来鉴定推定TR,并利用此TR和IMH样序列的全部或一部分来搜索整个基因组中匹配的推定VR和IMH序列。
23.如权利要求22所述的方法,其特征在于,所述RT编码序列通过搜索氨基序列IGXXXSQ或LGXXXSQ之一或两者而鉴定;或其中,该IMH样序列或IMH序列含有选自TCGG、TTTCG或TTGT的保守序列;或其中,所鉴定的TR和VR序列可以长约100-350个碱基对,具有约80%以上的同源性,且大部分差异在于TR中的腺苷酸碱基位点。
24.一种位点特异性诱变感兴趣核酸序列的方法,所述方法包括获得含供体模板区(TR)和可变区(VR)的核酸分子,其中所述TR或VR或操作性连接的逆转录酶编码区分离自哈氏弧菌ML噬菌体、长双岐杆菌、多形拟杆菌、齿垢密螺旋体或蓝细菌的产多样性反转录因子(DGR),和在细胞中表达所述核酸分子从而所述VR的一个或多个核苷酸位点被不同核苷酸取代。
25.如权利要求24所述的方法,其特征在于,所述DGR分离自红海束毛蓝细菌#1、红海束毛蓝细菌#2、念珠蓝细菌PPC ssp.7120#1、念珠蓝细菌PPC ssp.7120#2或点型念珠蓝细菌。
26.如权利要求24或25所述的方法,其特征在于,所述分子编码异源结合蛋白,且该产物的结合性被改变。
全文摘要
本发明涉及利用含有作为多样性模板的序列区域的核酸分子使核酸序列多样化的方法。因此,本发明提供了待多样化的核酸分子,以及用作模板区(TR)和与TR协同进行定向定点多样化的核酸分子。还提供制备和应用这些核酸序列的方法。
文档编号C12N15/31GK101090967SQ200580032944
公开日2007年12月19日 申请日期2005年8月3日 优先权日2004年8月3日
发明者J·F·米勒, S·道拉托夫, A·霍兹, 徐敏, M·金格瑞, D·W·小马丁 申请人:加利福尼亚大学董事会, 阿维德百奥提克斯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1