用于确定抑制性rna分子的体内选择方法

文档序号：563930阅读：742来源：国知局

专利名称：用于确定抑制性rna分子的体内选择方法
技术领域：
本发明涉及用于选择最佳抑制性RNA分子的体内方法。
背景技术：
利用抑制性RNA分子抑制靶核酸序列的转录和/或翻译是相当重要的。抑制性RNA分子可以直接或间接地结合核酸序列或其转录产物并实现其切割。这样的例子包括核酶(能直接切割靶序列)、外部指导序列(EGSs)及反义或有义RNA(能通过其它因子引起切割)。
不利的是，由于mRNA复杂的二级结构，上述技术的应用遇到了许多的困难。除非试图定向于每一个位置，通常不可能预计mRNA中开放或易接近的位点的位置。
用于搜寻这些开放区域的一个方法是Southern(1997)和Milner(1997)所述的体外“寡核苷酸排列”方法。不过，这些方法包括费时地产生各个特殊靶mRNA的独特排列。另外，异源双螺旋是在非生理条件下形成的。由于考虑到mRNA在5’和3’末端均结合有许多蛋白质，这一点尤其成问题。
因此使用“体内”选择方法发现正常生理条件下开放的mRNA位点是有利的。另外，此方法一般来说都是有用的，因为所有RNA分子都可用此方法检测，而无需每次凭借特殊的选择方法。
因此，本发明的目的是提供确定有效定向于所给RNA序列的抑制性RNA分子的体内选择方法。
本发明还显示，有可能使用表达靶序列的细胞在体内选择抑制性RNA分子，此靶序列与可检测的标记有效连接，从而使靶序列及可检测标记作为邻接的RNA分子在细胞中表达。
靶序列/可检测标记mRNA将包含正常的5’帽和3’polyA尾。如果5’帽和3’polyA尾被去除(例如，通过抑制性RNA分子从靶序列上切割下来)，mRNA将不稳定而被降解。这将预防可检测标记基因的翻译。
例如，如果可检测标记是能将前体药物转变成细胞毒性化合物的酶，靶序列的切割将使得细胞对前体药物不敏感。
表达可检测标记/靶基因的细胞可用于筛选许多抑制性RNA分子。尤其是，本发明的发明者已利用这样的细胞来筛选核酶表达载体的文库，其中的各核酶具有不同的特异性区域。对前体药物具抗性的细胞包含有活性核酶，然后可用聚合酶链式反应(PCR)之类的技术确定其序列。
为此，本发明提供了适于体内使用的选择系统，该系统包含(i)第一核苷酸序列群，这些序列编码的基因产物能直接或间接地与核苷酸序列或其转录产物结合并实现其切割；其中结合所说核苷酸序列所需之第一核苷酸序列的区域在第一核苷酸序列群间是异质的；(ii)第二核苷酸序列，其含有(a)编码与mRNA稳定及/或翻译所需序列有效连接之可检测标记的编码区；以及(b)第三核苷酸序列，其位于编码区及mRNA稳定和/或翻译所需序列中至少一种之间；其中(a)和(b)与调控序列有效连接，此调控序列能指导(a)和(b)作为毗邻的分子在宿主细胞中表达。
本发明提供了载体系统，该系统包含(i)载体群，这些载体独立地含有所编码的基因产物能直接或间接地与核苷酸序列或其转录产物结合并实现其切割的第一核苷酸序列；其中结合所说核苷酸序列所需的第一核苷酸序列中的区域在载体群内是异质的；(ii)第二核苷酸序列，含有(a)编码与mRNA稳定及/或翻译所需序列有效连接之可检测标记的编码区；以及(b)第三核苷酸序列，其位于编码区及至少mRNA稳定和/或翻译所需序列中至少一种之间；其中(a)和(b)与调控序列有效连接，此调控序列能指导(a)和(b)作为毗邻的分子在宿主细胞中表达，其中第二核苷酸序列存在于载体群中或作为另外载体的一部分。
优选基因产物选自核酶、反义核糖核酸和外部指导序列。
优选该载体是病毒载体，更优选逆转录病毒载体。
优选的可检测标记是选择标记，更优选能将前体药物转变成细胞毒性化合物的酶。在特别优选的实施方案中，该酶是胸苷激酶，而前体药物是丙氧鸟苷(gancyclovir)。
本发明进一步提供了病毒颗粒群，各病毒颗粒含有上述第一核苷酸序列和/或第二核苷酸序列。
本发明还提供了产生上述病毒颗粒群的方法，该方法包括将以下成分引入生产者细胞(i)上述第一核苷酸序列群，和(ii)上述第二核苷酸序列。还提供了此方法产生的病毒颗粒群。
此外，本发明提供了从上述第一核苷酸序列群中选择所编码基因产物能直接或间接地与第三核苷酸序列或其转录产物结合并实现其切割的第一核苷酸序列的方法；该方法包括(i)将一种或多种第一核苷酸序列引入含上述第二核苷酸序列的宿主细胞中；并(ii)选择可检测标记在其中不以活性形式表达的宿主细胞；并任意地，(iii)分离该第一核苷酸序列并测定其核苷酸序列。
优选在步骤(ii)中，可检测标记是选择标记，且宿主细胞与前体药物之类的化合物接触，该前体药物在选择标记存在时具有细胞毒性。更优选地，选择标记是胸苷激酶，前体药物是丙氧鸟苷。
在优选的实施方案中，所说的第一核苷酸序列群中的各第一核苷酸序列均位于编码可检测标记无活性变体之第四核苷酸序列的下游，从而去除所编码基因产物能与可检测标记编码区结合并实现其切割的任何第一核苷酸序列。
在本发明优选的方面，第一核苷酸序列群存在于病毒载体群中，所说的病毒载体包含编码可检测标记无活性变体的第四核苷酸序列，且作为预备步骤，载体群被引入一种或多种生产者细胞中，产生的用于步骤(i)中将第一核苷酸序列引入生产者细胞中的任何感染性病毒颗粒含第二核苷酸序列。
另一方面，本发明提供了用本发明上述方法获得的第一核苷酸序列。这些第一核苷酸序列可用于治疗。
此外，本发明提供了利用本发明的第一方面的选择系统鉴定mRNA分子上开放位点的方法。
发明详述A.选择系统的组成(i)编码抑制性RNA分子的第一核苷酸序列群本发明选择系统的第一组分是编码抑制性RNA分子的核苷酸序列群。抑制性RNA分子定义为，能通过与核酸序列结合而抑制其转录和/或翻译的核糖核酸。通常，抑制性RNA分子能直接或间接地与核酸序列或其转录产物结合并实现其切割。例如核酶(直接切割)、外部指导序列(EGSs)和反义或有义RNA(通过其它因子引起切割)。
编码抑制性RNA分子的第一核苷酸序列群基本上是异质的，从而为选择过程产生了多样性序列。因此，至少结合靶核苷酸序列所需的抑制性分子部分将有变化。优选地，催化活性、结构整体性和与降解靶核苷酸序列之细胞组分的相互作用所需的序列是不变化的。不过用诱变技术产生文库可能是方便的，这样可以在整个抑制性RNA分子序列中进行随机改变。在反义和有义RNA构建体中，任何状态下这种情况通常都是合乎需要的。至于核酶和EGS序列，优选使用随机合成的寡核苷酸来产生文库，这些寡核苷酸在合适的位置连接入核酶或EGS构建体。如此产生了核酶/EGS构建体文库，其中与其特异性相关的区域有变化，而其它功能结构域通常是恒定的。
举例说来，通过构建下述寡核苷酸可产生随机核酶文库，此寡核苷酸包含两侧有随机核苷酸之锤头状核酶的保守酶促螺旋。两侧序列提供了核酶的识别区。尽管8个核苷酸是合适的长度，但各个侧翼序列的长度可以有所变化。这就造成了有约164(65536)个不同分子的复杂性。
按照本发明适用的第一核苷酸序列编码导致靶核苷酸序列(通常是核糖核苷酸)切割和/或酶促降解的基因产物。举例说来，核酶、外部指导序列和反义序列都有可能。
核酶是在特异位点切割RNA的RNA酶。可将核酶改造使其特异于含核酶切割位点的任何所选序列。因此，核酶可构建为在被转录的病毒序列中具有选择好的识别位点。举例说来，由第一核苷酸序列编码的核酶识别和切割产生病毒颗粒所需之病毒基因组的基本元件，如包装成分和mRNA基因组。因此，对于逆转录病毒基因组，这样的基本元件包括gag、pol和env基因产物以及病毒mRNA基因组。至少识别gag、pol和env基因序列之一，或更通常地自这些基因转录时RNA序列的合适核酶能结合并切割所说的序列。在合适的情况下，这将减少或防止gal、pol或env蛋白质以及mRNA基因组的产生，从而减少或防止逆转录病毒颗粒的产生。
核酶可以有多种形式，包括锤头状、发卡状和肝炎δ反基因组核酶。此处优选的是锤头状核酶，部分原因是由于它们相对较小，它们的靶切割位点所需的序列是最小的，且对它们的性质研究也比较清楚。目前研究中最常使用的核酶是锤头状和发卡状核酶。
各核酶均具有识别和结合靶RNA中识别位点的基元。基元采取一个或多个“结合臂”的形式，通常是两个结合臂。锤头状核酶的结合臂是侧翼序列Helix I和Helix III，它们在Helix II的两侧。这些序列长度是可变的，通常在6-10个核苷酸之间，但也可以更短或更长。侧翼序列的长度可影响切割的速率。例如，已发现将侧翼序列的总核苷酸数从20降低到12，可10倍提高核酶切割HIV序列的转换率。在锤头状核酶中，核酶Helix II的催化基元于称作切割位点的位点处切割靶RNA。核酶是否切割任何给定的RNA取决于含有合适切割位点的核酶识别位点的存在与否。
各类型的核酶识别其自身的切割位点。锤头状核酶的切割位点上游紧接着核苷酸碱基三联体GUX，其中G是鸟嘌呤，U是尿嘧啶，而X是任何核苷酸碱基。发卡状核酶具有切割位点BCUGNYR，其中B是除腺嘌呤之外的任何核苷酸碱基，N是任何核苷酸，Y是胞嘧啶或胸腺嘧啶，而R是鸟嘌呤或腺嘌呤。发卡状核酶的切割发生在切割位点的G和N之间。
反义技术是本领域众所周知的。反义序列发生作用的一个机制是将细胞蛋白RNAseH募集到靶序列/反义构建体异源双螺旋中，导致此异源双螺旋的切割和降解。与核酶相反，据说这样的反义构建体可间接导致靶序列的切割/降解。因此，按照本发明，第一核苷酸序列可编码反义RNA，此反义RNA可与编码基本/包装组分的基因或自所说基因转录的RNA结合，从而使该基因的表达被抑制，例如是因为产生的异源双螺旋的RnaseP降解作用。反义构建体不必编码基本/包装组分编码基因的全长互补序列，其中一部分就足够了。本领域技术熟练人员很容易就能确定如何设计合适的反义构建体。
外部指导序列(EGSs)是与互补靶序列结合从而在靶RNA序列中形成环的RNA序列，整个结构是RNaseP介导的靶RNA序列切割的底物。EGS与靶RNA退火形成的结构与tRNA前体中发现的非常相似。通过设计合适的EGS，可将RNaseP的天然活性导向切割靶RNA。设计EGS的通常原则如下，参照

图13所示的一般性EGS。
哺乳动物细胞中EGS设计的原则(见
图13)靶序列-所有tRNA前体分子在RNaseP切割位点3’之后紧接着G(即G与ACCA序列前受体茎顶端的C形成碱基对)。另外，在所有tRNA中，在8个核苷酸下游处有一U(即，G在第一位，U在第八位)。切割位点的5’端优选嘧啶。通常无需其他特异的靶序列。
EGS序列-7个核苷酸长的“受体茎”类似物是最理想的(5’杂交臂)。优选4个核苷酸长的‘D-茎’类似物(3’杂交臂)。此长度变化可能改变反应动力学。这将特异于各靶位点。共有的“T-茎和环”类似物是必需的。优选最小的5’和3’非配对序列以降低EGS RNA非所需折叠的可能性。
删除“反密码子茎和环”类似物可能是有益的。在体外可耐受可变环的删除，但在体内对二者删除的最适取代环仍未有详细说明。进一步的指导可获自文献，例如，Werner等(1997)；Werner等(1998)；Ma等(1998)和Kawa等(1998)。
核苷酸序列通常是载体构建体的一部分，因此所说的载体构建体包含编码与调控序列有效连接之抑制性RNA分子的第一核苷酸序列，该调控序列允许抑制性RNA分子在宿主细胞中表达。包括病毒载体构建体在内的载体构建体的进一步细节见下文B部分。
ii含报道构建体的第二核苷酸序列系统中第二核苷酸序列的基本功能是作为报道构建体。因此第二核苷酸序列包含编码可检测标记的编码区。可检测标记是其表达可被检测的任何基因产物。例子包括lacZ绿色荧光蛋白和选择标记。优选的可检测标记是利用荧光激活细胞分拣术(FACS)可分拣的。
选择标记通常是其表达或缺乏会影响细胞生存力的基因产物。这样的例子包括抗诸如新霉素之类抗生素的抗性基因。尤其优选的例子包括直接或通过前体药物转换成毒性化合物而对细胞有毒的基因产物。后者的一个例子是将丙氧鸟苷之类的化合物转变成细胞毒性化合物的胸苷激酶。因此优选第二核苷酸序列编码在表达时能直接或于存在外来添加化合物的条件下降低细胞的生存力(包括引起细胞死亡)的基因产物。
第二核苷酸构建体的重要特征是，除编码区外，还有至少一种第三核苷酸序列存在于编码序列的上游或下游，这第三核苷酸序列预期用于检测抑制性RNA分子的文库。例如，第三核苷酸序列可能是病毒的一个组分，诸如逆转录病毒的组分，诸如编码全部或部分gag.pol序列的序列。第三核苷酸序列在可检测标记编码序列上游或下游的存在意指，当由第一核苷酸序列编码的一种抑制性RNA分子与第三核苷酸序列或其转录产物结合时，产生的相互作用可防止第二核苷酸序列的转录并/或引起第二核苷酸序列所产生之mRNA的稳定性降低，从而可检测标记的表达减少或受到抑制。在胸苷激酶的例子里，TK表达的抑制消除了细胞对丙氧鸟苷的敏感性。因此，任何生存的细胞均不表达在丙氧鸟苷存在时足以引起细胞死亡的TK。在使用Tk/丙氧鸟苷时，优选同时施用狄氏剂以使由于细胞毒性化合物通过间隙连接进入邻近细胞所产生的副作用最小化。类似的考虑也适用于具有副作用的其他细胞毒性化合物。
因此，第三核苷酸序列相对于编码序列来定位，从而使其位于编码序列及mRNA稳定性和/或翻译所需序列之间。例如，第三核苷酸序列在转录mRNA中可以恰好位于5’帽的下游或3’polyA尾的上游。与其结合并引起5’帽和/或3’polyA尾切割的抑制性RNA分子将增强mRNA剩余部分的降解作用。因此，第三核苷酸序列通常将位于编码可检测标记之mRNA的5’和/或3’非翻译区(UTR)内。
第三核苷酸序列可以是预期识别与其有效作用之抑制性RNA分子的任何核苷酸序列。因此，它可以编码期望其表达被抑制或减少的基因产物全长或部分。这样的基因产物可以包括其表达与疾病相关的哺乳动物细胞基因产物。或者，第三核苷酸序列可以编码病原生物的组分，尤其是诸如逆转录病毒之类的病毒病原体，包括HIV。这样的组分可以包括，例如，gag、pol或env或附属因子。
至于第一核苷酸序列、含一个或多个第三核苷酸序列的第二核苷酸序列通常是B部分所述的核酸载体的一部分。
B.核酸载体第一和第二核苷酸序列通常存在于核酸载体中，它们可以是相同或不同的核酸载体，所说的第一类或第二核苷酸序列与允许其在宿主细胞中表达的调控序列有效连接。
术语“有效连接”意指所说组分之间处于允许其按各自预期方式发挥功能的关系之中。与编码序列“有效连接”的调控序列是以这样的方式与其连接的，即在与调控序列相容的条件下达到编码序列的表达。
控制序列可以被修饰，例如添加额外的转录调节元件以使控制序列指导的转录水平更易受转录调节子的影响。
本发明的载体可被转化或转染进入下述合适宿主细胞中供抑制性RNA分子表达。选择与所用宿主细胞相容的载体。
与抑制性RNA分子编码序列有效连接的控制序列包括启动子/增强子和其它表达调节信号。选择与表达载体预期使用的宿主细胞相容的控制序列。术语启动子在本领域是众所周知的，包括大小和复杂性在最小启动子到含上游元件及增强子的启动子之间变化的核酸区。
尽管也可使用在诸如昆虫细胞之类其它真核细胞内有功能的启动子，但通常选择于哺乳动物细胞内有功能的启动子。启动子通常来源于病毒或真核基因的启动子序列。例如，它可以是来自欲在其中进行表达的细胞的基因组。也可使用病毒启动子，例如莫罗尼鼠白血病病毒长末端重复(MMLV LTR)启动子、劳氏肉瘤病毒(RSV)LTR启动子或人病毒(CMV)IE启动子。
本发明方法中所用的载体可以是非病毒的，例如，质粒、染色体或人工染色体。典型的转染方法包括电穿孔、DNA biolistics、脂质介导转染、紧缩DNA介导的转染、脂质体、免疫脂质体、脂转染、阳离子物质介导的转染、阳离子表面两性分子(cationic facialamphiphile，CFA)(自然生物技术(Nature Biotechnology)199614；556)及其它们的联合使用。
或者，载体可以是病毒载体。病毒载体包括但不局限于腺病毒载体、腺伴随病毒(AAV)载体、疱疹病毒载体、逆转录病毒载体、慢病毒载体、杆状病毒载体。术语“病毒载体”指含有能在宿主细胞中转录之病毒基因组的核苷酸构建体，该基因组包含足够的病毒遗传信息，以允许病毒RNA基因组在包装组分存在的条件下进行包装，成为能感染靶细胞的病毒颗粒。靶细胞的感染包括逆转录并在对特殊病毒合适的位置整合进入靶细胞基因组。使用中的病毒载体通常携带将由载体运送至靶细胞的异源编码序列(目的核苷酸)，例如编码抑制性核酶的第一核苷酸序列。在最终的靶细胞内病毒载体不能独立复制产生感染性的病毒颗粒。
术语“病毒载体系统”的意思是指一试剂盒，它可与产生病毒颗粒的其它必需组分联合使用从而在宿主细胞内产生病毒颗粒。例如，第一核苷酸序列群通常可存在于适于将第一核苷酸序列克隆入病毒基因组载体构建体的质粒载体构建体中。当它们与第二核苷酸序列(报道构建体，可存在于另外的质粒载体构建体中)结合起来使用时，含第一核苷酸序列之质粒群与含第二核苷酸序列之质粒间的联合包括本发明的基本元件。然后本领域的技术熟练人员可将这样的试剂盒用于合适的病毒载体基因组构建体的生产中，该构建体在与质粒及任选的编码病毒装配所需其它组分的核酸构建体一起转染进入宿主细胞时，将导致产生感染性病毒颗粒。
第二核苷酸序列也可作为与第一核苷酸构建体相同的载体构建体的一部分存在。以这种方式，可确保第一核苷酸序列和报道构建体(如TK基因)在任何个体细胞中的共表达。同样的，病毒载体也可同时包含第一和第二核苷酸序列。
或者，第二核苷酸序列可以稳定存在于试剂盒所含之包装细胞系中。
试剂盒可以包括产生病毒颗粒所需的其它组分，诸如宿主细胞和编码病毒装配所需之基本病毒多肽的其它质粒。举例说来，试剂盒可以包含质粒群，这些质粒中含有编码抗HIV核酶的第一核苷酸序列及编码TK的第二核苷酸序列，以及与之有效连接并置于其5’和/或3’UTR内的第三核苷酸序列。任选的组分将是(a)具有合适限制性酶识别位点的HIV病毒基因组构建体，用于将第一和第二核苷酸序列克隆入病毒基因组中；(b)编码VSV-G env蛋白质的质粒以及(c)编码gag.pol的质粒。或者，编码病毒颗粒装配所需之病毒多肽的核苷酸序列可作为含这些核苷酸序列之包装细胞系提供于试剂盒中，例如VSV-G表达细胞系。
病毒载体通常是逆转录病毒载体，尤其是诸如HIV载体之类的慢病毒载体。本发明的逆转录病毒载体可能来自或可以来自任何合适的逆转录病毒。许多不同的逆转录病毒已被鉴定。这样的例子包括鼠白血病病毒(MLV)、人类免疫缺陷病毒(HIV)、猿猴免疫缺陷病毒、人T-细胞白血病病毒(HTLV)、马传染性贫血症病毒(EIAV)、小鼠乳腺肿瘤病毒(MMTV)、劳氏肉瘤病毒(RSV)、Fujinami肉瘤病毒(FuSV)、莫洛尼鼠白血病病毒(Mo-MLV)、FBR鼠骨肉瘤病毒(FBR MSV)、莫洛尼鼠肉瘤病毒(Mo-MSV)、Abelson鼠白血病病毒(A-MLV)、禽髓细胞瘤病毒-29(MC29)和禽成红细胞增多症病毒(AEV)。逆转录病毒的详细名单可见文献Coffin等，1997，“逆转录病毒(Retrovirus)”，冷泉港实验室出版社，编辑JM Coffin，SM Hughes，HE Varmus，第758-763页。
本领域中可找到一些逆转录病毒详细的遗传结构。举例说来，HIV和Mo-MLV的详细结构可从NCBI基因库中找到(基因组接受号分别为AF033819和AF033811)。
慢病毒组可进一步分为“灵长类”和“非灵长类”。灵长类慢病毒的例子包括人免疫缺陷病毒(HIV)这种引起人自身免疫缺陷综合症(AIDS)的物质及猿免疫缺陷病毒(SIV)。非灵长类慢病毒组包括原型“慢病毒”绵羊髓鞘脱落病毒(visna/maedi virus，VMV)，以及相关的山羊关节炎-脑炎病毒(CAEV)，马传染性贫血病毒(EIAV)，和最近所述的猫免疫缺陷病毒(FIV)和牛免疫缺陷病毒(BIV)。
逆转录病毒基因组的基本结构是5’LTR和3’LTR，在两者之间或其中定位有包装信号以使基因组可被包装、引物结合位点、整合位点以使其能整合入宿主细胞基因组以及编码包装组分的gag、pol和env基因-这些都是病毒颗粒装配所需的多肽。更复杂的逆转录病毒具有另外的特征，诸如在HIV中有rev和RRE序列，它们能使整合原病毒的RNA转录产物从所感染靶细胞的核中有效输出到细胞质内。
在原病毒中，这些基因两端是被称为长末端重复片段(LTR)的区域。LTR负责原病毒的整合和转录。LTR还可用作增强子-启动子序列并能控制病毒基因的表达。逆转录病毒RNA的衣壳化依赖于定位在病毒基因组5’端的psi序列。
LTR自身是可分为三个元件的相同序列，这些元件分别被称为U3、R和U5。U3来自RNA 3’端独特的序列。R来自RNA两端重复的序列片段，而U5来自RNA 5’端的独特序列。在不同的逆转录病毒之间这三个元件的大小可以有相当的变化。
在缺陷型逆转录病毒载体基因组中，gag、pol和env可以缺失或无功能。RNA两端的R区域是重复序列。U5和U3分别代表RNA基因组5’和3’末端的独特序列。
在用于基因治疗及/或分子生物学其它技术的典型逆转录病毒载体里，复制所必需的gag、pol和env蛋白编码区中至少一个或多个部分可以从病毒中去除。这使得逆转录病毒载体成为复制缺陷型。甚至可用诸如第一核苷酸之类的目的核苷酸序列(NOI)替代被去除的部分，从而产生能将其基因组整合入宿主基因组的病毒，其中被修饰的病毒基因组由于缺乏结构蛋白质而不能增殖自身。在整合入宿主基因组时发生NOI表达-产生例如治疗和/或诊断作用。因此，通常通过以下步骤将NOI转移到目的位点将NOI整合入重组病毒载体；将被修饰的病毒载体包装入病毒体衣壳中；转导至目的位点-诸如靶细胞或靶细胞群中。
因此本发明所用的最小逆转录病毒基因组包含(5’)R-U5-第一核苷酸序列及/或第二核苷酸序列-U3-R(3’)。不过，用于在宿主细胞/包装细胞内产生逆转录病毒基因组的质粒载体还包括与逆转录病毒基因组有效连接的转录调控序列，指导基因组在宿主细胞/包装细胞中的转录。这些调控序列可以是与被转录的逆转录病毒序列相关的天然序列，即5’U3区域，或者它们可以是诸如另一病毒启动子之类的异源启动子，如CMV启动子。
一些逆转录病毒基因组需要附加序列来有效产生病毒。例如，在HIV中，优选包含rev和RRE序列。不过对rev和RRE的需要可以通过密码最优化被降低或消除。
一旦逆转录病毒载体基因组作为原病毒DNA整合入其靶细胞的基因组中，核酶序列就需要表达。在逆转录病毒中，启动子定位于原病毒的5’LTR U3区。在逆转录病毒载体中，驱动异源基因表达的启动子可以是在5’U3区的天然逆转录病毒启动子，或者是通过基因工程引入载体的其它启动子。此其它启动子可以取代逆转录病毒自身的5’U3启动子，或者它可以在载体基因组中的不同位置掺入，诸如在LTRs之间。
通过包装或辅助细胞系与重组载体联合使用，通常可增殖复制缺陷型逆转录病毒载体，从而例如制备合适滴度的逆转录病毒载体用于随后的转导。也就是说，三种包装蛋白可反式提供。
“包装细胞系”包含逆转录病毒gag、pol和env基因中的一个或多个。包装细胞系产生包装逆转录病毒DNA所需的蛋白质，但由于缺乏psi区，它不会引起衣壳化。不过，当携带NOI和psi区的重组载体被引入包装细胞系时，辅助蛋白质可包装psi阳性的重组载体以产生重组病毒原种。此病毒原种可用于转导细胞以将NOI引入靶细胞的基因组中。因为已显示这样做提高了病毒的滴度，所以优选使用psi包装信号，被称为psi+，它包含从剪接供体上游延伸到gag起始密码子下游的附加序列(Bender等，1987)。
基因组中缺乏所有制备病毒蛋白质所需基因的重组病毒只能转导一次且不能遗传。这些只能转导靶细胞一个循环的病毒载体即为已知的复制缺陷型载体。因此，NOI被引入宿主/靶细胞基因组而不会产生潜在的有害逆转录病毒。关于可获得的包装细胞系的总结参阅文献Coffin等，1997(同上)。
优选使用这样的逆转录病毒包装细胞系，其中gag、pol和env病毒编码区携带于不同的表达质粒上，这些质粒被独立转染入包装细胞系中。这一策略有时候被称为三质粒转染方法(Soneoka等，1995)，由于野生型病毒的产生需要进行三次重组，所以这一策略减少了产生能复制的病毒的可能性。因为同源性可大大促进重组，所以还可降低或消除载体基因组与辅助病毒基因组间的同源性来缓解能复制的辅助病毒产生的问题。
稳定转染包装细胞系的一个可选择方案是使用瞬时转染细胞系。在生产载体的时候，瞬时转染可利于检测载体产生的水平。在这一方面，瞬时转染避免了产生稳定载体生产者细胞系所需的较长时间，且如果载体或逆转录病毒包装组分对细胞有毒性，还可使用瞬时转染的方法。通常用于产生逆转录病毒载体的组分包括编码gal/pol蛋白质的质粒、编码env蛋白质的质粒以及含NOI的质粒。载体的生产包括将这些组分中的一个或多个瞬时转染入含其它必需组分的细胞。若载体编码毒性基因或诸如细胞周期抑制物之类干扰宿主细胞复制的基因或诱发细胞凋亡的基因，就有可能难于产生稳定的载体生产者细胞系，但可使用瞬时转染在细胞死亡前产生载体。此外，已利用瞬时转染开发出了生产载体的滴度水平与稳定载体生产者细胞系的水平相似的细胞系。
生产者细胞/包装细胞可以是任何合适的细胞类型。最通常使用的是哺乳动物生产者细胞，但也不排除使用诸如昆虫细胞之类的其它细胞。明确的说，需要能有效翻译env和gag、pol mRNA的生产者细胞。许多合适的生产者/包装细胞系是本领域所已知的。本领域技术熟练人员还能通过，例如将编码包装组分的核苷酸构建体引入细胞系中而制备合适的包装细胞系。
若逆转录病毒基因组中的第一核苷酸序列编码欲检测其完成gag、pol和/或env RNA转录产物切割的能力的抑制性RNA分子，则通过整合或质粒携带的方式存在于包装细胞系或瞬时转染的生产者细胞系中的gag、pol和/或env蛋白质编码核苷酸序列可被修饰以减少或防止抑制性RNA分子的结合。以这种方式，抑制性RNA分子将不会阻止病毒颗粒包装所必需的病毒多肽在包装细胞系中的表达。明显地，由于文库的随机特性，文库中的一些序列仍然有可能切割被修饰的包装组分，但因存在第三核苷酸序列及编码相应包装组分的序列之间的不同，影响被修饰包装组分的抑制性分子不大可能也同时影响第三核苷酸序列，因此在许多情况下细胞将产生可检测的标记并从筛选中被排除。
术语“病毒颗粒包装所必需的病毒多肽”指通常由待包装成病毒颗粒的病毒基因组编码的多肽，缺乏它的时候病毒基因组不能包装。例如，在逆转录病毒中这样的多肽包括gag、pol和env。术语“包装组分”和“必需组分”也包括在此定义范围内。
以核酶为例，抗性通常是由于序列中消除了核酶识别位点的改变造成的。同时，仍保留必需/包装组分的氨基酸编码序列以便由此序列编码的病毒组分保持相同或至少足够的相似，从而使必需/包装组分的功能不被损害。此外，由于第一核苷酸序列群常常随机化的特性，可能需要对编码包装组分的核苷酸序列进行大量修饰。
在反义序列的情况下，第三核苷酸序列与编码病毒包装组分的核苷酸序列有一定程度的区别，以致尽管反义序列可与第三核苷酸序列或其转录本结合，但反义序列不能与编码所需包装组分的核苷酸序列或从其转录而来的RNA有效结合。尽管如上所述，在必需/包装组分的功能不被显著破坏的前提下，少数氨基酸的改变是可以容忍的，但第三核苷酸序列与编码所需包装组分的核苷酸序列之间的差异通常为保守的变化。
更通常的是，一种合适的方法可能为改变所需包装组分的核苷酸序列以使与第三核苷酸序列相应区域的核苷酸同源性低于95％，优选少于90、80或70％，而氨基酸的同源性优选至少95％。
优选地，除了消除抑制性RNA的识别位点，病毒组分编码序列的改变还可改善序列在哺乳动物细胞或其它细胞中的密码子用法，所说的细胞用作产生逆转录病毒载体颗粒的生产者细胞。这种密码子用法上的改善被称为“密码子优化”。包括HIV和其它慢病毒在内的许多病毒使用大量稀有密码子，通过改变它们使其与通常使用的哺乳动物密码子一致，可提高包装组分在哺乳动物生产者细胞中的表达。哺乳动物及多种其它生物体中密码子的使用表在本领域中是已知的。
因此优选的，编码包装组分的序列是经密码子优化的。更优选的是该序列全部都经密码子优化。密码子优化后，发现在野生型gag、pol和env序列中有许多位点可用作抑制性RNA的识别位点且不再存在于编码包装组分的序列中。
密码子优化HIV包装组分的另一优点是，它可以提高基因的表达。尤其是，它可以使gag、pol的表达不依赖于Rev，从而rev和RRE无需包含在基因组中(Haas等，1996)。因此Rev非依赖型载体是有可能的。这又使得能够在逆转录病毒载体中使用抗-rev或RRE因子。
在实验和实际应用中都极希望使用高滴度的病毒制备品。提高病毒滴度的技术包括使用如上所述的psi+包装信号及病毒原种的浓缩物。此外，使用不同的包膜蛋白质，诸如来自水泡性口炎病毒的G蛋白，已将浓缩之后的滴度提高至109/ml。不过，包膜蛋白通常经过选择以使病毒颗粒优选感染被预期治疗之病毒感染的细胞。例如，在HIV载体用于治疗HIV感染的情况下，所用的env蛋白将是HIV env蛋白。
C.选择方法本发明的选择方法包括在第二核苷酸序列存在的情况下将一或多种第一核苷酸序列引入宿主细胞。将核酸引入宿主细胞的方法是本领域众所周知的，例如转染。一般说来，核苷酸序列是载体的一部分。第一和第二核苷酸序列可以是同一载体的部分或存在于不同的核酸分子上。第二核苷酸序列甚至可以稳定的引入宿主细胞基因组中。
若由第一核苷酸序列编码的抑制性RNA分子抑制或减少可检测标记的表达，那么就有可能将含这种分子的细胞与含有不能导致可检测标记的表达被抑制或减少之第一核苷酸序列的细胞区分开。含有效的抑制性RNA分子的细胞可用于，例如，PCR反应中，以鉴定抑制性RNA分子的序列以及靶分子区域的序列。
如果可检测标记是FACS可分拣的，那么就可从剩余细胞中选择出含有效抑制性RNA分子的细胞。若可选择标记是能将前体药物转变成细胞毒性化合物的酶，那么可基于它们对前体药物的不敏感性将含有效抑制性RNA分子的细胞选择出来。更具体地说，含有效抑制性RNA分子的细胞在用前体药物筛选时能更好地存活。
在优选的实施方案中，用含第一核苷酸序列的病毒载体文库方便地完成上述后一种选择过程。病毒载体文库被转染入含编码例如TK的第二核苷酸序列的生产者细胞中。通过施用前体药物(例如，丙氧鸟苷)后仍存活而选择出来的细胞通常含至少一种编码有效抑制性RNA分子的第一核苷酸序列。进一步的可选步骤是从所说的细胞中收获病毒颗粒并使用感染性的病毒颗粒来转导更多的细胞。此额外步骤的好处在于，通常只有不切割必需病毒序列/包装组分的第一核苷酸序列能成功地进行到此第二阶段。此外，通过对获自可生存细胞的病毒上清液进行一系列稀释，有可能产生只含一种第一抑制性序列的生产者细胞，这将简化通过PCR的鉴定。
应当指出的是，一些抑制性分子可能是由于其它原因引起细胞死亡，而非不能定向于第三核苷酸序列。例如，抑制分子可能引起细胞生存所必需的mRNA的降解。大体上，因为含所说分子的细胞将死亡，不需要针对随机文库中的这些元件进行选择。
若第一核苷酸序列能结合并影响编码可检测标记之编码区的切割，也有可能获得假阳性。例如，若选择过程取决于含有效抑制性RNA分子在用前体药物选择时的生存能力，如果抑制分子直接靶向于所编码酶将前体药物转变成细胞毒性化合物的mRNA，就可能获得假阳性。在尤其优选的实施方案中，选择步骤包括去除编码靶向于第二核酸中所用可检测标记的序列的抑制分子的载体。
这可以，通过例如将第一核苷酸序列插入含编码可检测标记之非功能性核苷酸序列且缺少第三核苷酸序列的构建体中(“第四核苷酸序列”)中而完成。优选的，其它载体序列与含第二核苷酸序列之载体的序列是相同的。通常，已通过插入或删除修饰编码可检测标记的核苷酸序列以阻止功能性可检测标记的表达。除了使其无功能的突变外，无活性的可检测标记其序列与第二类核酸中所用的可检测标记序列是相同的。
然后可用此构建体产生病毒载体文库以供初始的筛选阶段使用。编码具有以下特性的抑制分子的基因组将不能包装成病毒颗粒(i)能与可检测标记结合并引起其切割；(ii)影响含有它的病毒基因组；(iii)影响病毒包装；或(iv)杀死细胞。因此可产生含预选第一核苷酸序列群的病毒库，所选第一核苷酸序列群不会(i)引起可检测标记的切割；(ii)对细胞生存有害，或(iii)抑制在选择试验中病毒的产生。
然后可如上所述在选择循环中将此病毒库用于转导含第二核苷酸序列的细胞。
D.优化后的抑制性RNA分子的使用用本发明选择方法鉴定的优化抑制性RNA分子，诸如核酶，可用于抑制其靶核苷酸序列或其转录产物在靶细胞中的表达。
例如，可将此用于消除体外或体内细胞中基因的表达，以研究通过诸如“敲除”实验阻断基因表达的效果。这样的实验是有用的，例如，用于目标确认、筛选或模型构建。
或者，由本发明选择方法鉴定的优化抑制性RNA分子可用于治疗应用中，诸如基因治疗及RNA的直接施用。尤其是，定向于编码病原基本组分之靶核苷酸序列的优化抑制性RNA分子可用于治疗由所说病原体引起的疾病。因此定向于HIV组分的优化抑制性RNA分子可用于减轻或防止HIV感染或相关症状。
因此含编码优化抑制性RNA分子之核苷酸序列的核酸载体可用于治疗或防止病毒感染，优选逆转录病毒感染，特别是慢病毒，尤其是HIV的感染。特别是，可将所说的核酸载体用于运送抑制性RNA分子至需要治疗病毒感染的人或动物中。核酸载体包括病毒载体和由此获得的传染性病毒颗粒。若病毒载体包含选定的靶向于病原性病毒组分的第一核苷酸序列，所说的组分也是含所选第一核苷酸序列之传染性病毒颗粒产生所需要的，则在包装/生产者细胞中此组分的核苷酸序列通常将如上所述被修饰。尤其是，在参考实施例中给出了关于核酶及被修饰逆转录病毒env和gag.pol序列的使用指导。
HIV-1为开发抵抗HIV-1感染的策略提供了理想的载体。这是因为可利用除去了开放阅读框架并由反式生产的病毒颗粒包装的基因组(因此是非病原性的，但仍然具免疫原性)运送抗HIV分子，如核酶、intra-bodies、intra-kines、RNA decoys和/或反式显性突变蛋白质(trans-dominant mutated Protein).
若保留剪接供体和剪接受体位点，则可用一个病毒构建体产生8个以上独特的抗HIV因子。例如，可用定向于Tat的核酶取代Tat阅读框架，用tat反式显性突变体取代nef阅读框架。
诸如核酶之类的抑制性RNA分子将是这一系统的重要组分。
优选将核酸载体/病毒颗粒与药用可接受载体或稀释液结合以产生药物组合物。因此，本发明还提供了用于治疗个体的药用混合物，其中该混合物含治疗有效量的本发明核酸载体/病毒颗粒以及药用可接受载体、稀释剂、赋形剂或佐剂。此药用混合物可用于人或动物。
可按用药的预期路径及标准的制药实践选择药用载体、赋形剂或稀释剂。合适的载体和稀释剂包括等渗盐溶液，例如磷酸缓冲盐水。药物组合物可包括载体、赋形剂或稀释剂，或除此之外还有任何合适的粘合剂、润滑剂、悬浮剂、包被物质、增溶剂及其它能帮助或提高病毒进入靶位点的载体试剂(例如脂质送递系统)。
药物组合物可配制成非肠道、肌肉内、静脉内、颅内、皮下、眼内或穿皮施用的药物。
在合适的情况下，药物组合物可通过以下形式中的任一种或多种施用吸入剂；栓剂或子宫托的形式；通过洗剂、溶液、乳霜、油膏或粉剂而从表面施用的形式；利用皮肤贴片；以含淀粉或乳糖之类赋形剂的药片形式口服，单独或与赋形剂混合含于胶囊或卵形小体中；或以含香料或色素的酏剂、溶液或悬浮液形式施用；或它们可通过非肠道的形式注射用药，例如海绵体内(intra cavernosally)、静脉内、肌肉内或皮下注射。对于非肠道用药来说，组合物最好以无菌水溶液的形式施用，其中可以包含其它物质，例如足够的盐或单糖以使溶液与血液等渗。对于经颊或舌下用药来说，组合物可以片剂或锭剂的形式施用，它们可按传统方法配制。
施用病毒的量一般在103-1010pfu的范围内，优选105-108pfu，更优选106-107pfu。注射时，通常施用1-10μl在药用可接受载体或稀释液中的病毒。
当多核苷酸/载体以裸核酸形式施用时，施用核酸的量通常在1μg-10mg的范围内，优选100μg-1mg。
当用本发明方法所选的第一核苷酸序列(或其它治疗性序列)在可诱导调控序列控制下时，可能只需在治疗的持续期间诱导基因表达。一旦疾病治愈了，诱导剂被去除，核苷酸序列的表达终止。这一点具有明显的临床优势。这样的系统可以包括例如施用抗生素类的四环素，通过其在tet阻遏子/VP16融合蛋白上的作用激活基因表达。
E.体内选择的方法一方面，本发明提供了鉴定mRNA分子上开放位点的方法。
术语“开放”是指mRNA处于其生理学构象时，核酶、反义RNA或EGS之类抑制性RNA分子容易接近的位点。
利用本发明的选择系统，mRNA由第三核苷酸序列编码。例如，若此第三核苷酸序列是完整的基因，则选择系统可用于鉴定相应mRNA分子上的一个或多个开放位点。一旦抑制性RNA分子(诸如核酶、反义RNA或EGS)已用该选择系统鉴定为能与第三核苷酸序列结合，则利用标准技术就可推断出靶位点。例如，若抑制分子是反义序列，则此反义序列之“最适”互补序列和mRNA序列之间的序列比较可揭示反义序列与mRNA结合的位点。
下文将通过实施例对本发明进行进一步的描述，这是为了帮助本领域的常规技术人员进行本发明的操作，绝非对本发明范围的限制。实施例参照图示。在附图中
图1.前体药物剂量应答-生存百分率对前体药物浓度的曲线图A.大肠杆菌硝基还原酶(nitroreductase，NTR)/灭滴灵(MTZ)；B.HSV-1胸苷激酶(TK)/丙氧鸟苷(GCV)。图2.副作用-生存百分率对前体药物浓度的曲线图A.NTR/MTZ；B.TK/GCV。图3显示含CTKtatSN的HeLa细胞系存活百分率的柱形图，所述细胞系已用pH4Z(tat-4Z)、催化活性位点去除的抗tat核酶(tat-RzM)或抗tat核酶(tat-Rz)转导。细胞已与GCV或GCV和狄氏剂温育。图4显示载体基因组的图示说明。图5示意性的显示插入四个不同HIV载体的核酶。图6示意性的显示如何通过PCR构建合适的3’LTR。图7显示HXB2菌株(接收号K03455)的野生型HIVgag、pol的密码子使用表。图8显示指定为gag、pol-SYNgp的密码子最优化序列的密码子使用表。图9显示被称为env-mn的野生型HIV env的密码子使用表。
图10显示指定为SYNgp160mn的HIV env密码子最优化序列的密码子使用表。
图11显示本发明所用的三种质粒构建体。
图12显示用于生产逆转录病毒载体颗粒的两系统的原理。
图13A、B-外部指导序列的设计。
本发明将通过以下实施例得到进一步的描述，但这只作为说明而非对本发明范围的限制。
实施例本发明的发明者已开发了一种以核酶文库产生为基础的方法，其中的核酶均含有锤头状核酶的催化结构域。步骤包括产生这样的病毒，其基因组含编码自杀基因(优选胸苷激酶(TK))的核苷酸序列。靶序列插入其下游。或者，或另外，若内部核糖体进入位点(IRES)插入TK序列的上游，那么靶序列可插入它的上游。用此载体转导的细胞将对丙氧鸟苷敏感。
不过，当病毒基因组被转录时，mRNA不仅含TK基因，还含有靶序列。此mRNA将包含正常的5’帽和3’polyA尾。如果用核酶切割去除5’帽和polyA尾，mRNA就不稳定并被降解。这就防止了TK基因的翻译，使得表达活性核酶的细胞对丙氧鸟苷不敏感。实施例1-前体药物系统的选择(可选择标记)本发明的第二核苷酸编码可检测标记。我们已选择用酶-前体药物选择系统对本发明进行举例说明。检测两个著名的酶-前体药物组合的剂量应答来选择有效的前体药物系统。
A.大肠杆菌硝基还原酶(NTR)/灭滴灵(MTZ)联合作用将HT1080细胞(NTR-)和HT1080 NTR阳性细胞(NTR+)与各种不同浓度的MTZ一起保温，检测存活细胞的百分数(
图1A)。
B.HSV-1胸苷激酶(TK)/丙氧鸟苷(GCV)的联合作用用GCV处理以多种病毒载体转导的HeLa细胞系72小时，检测存活细胞的百分数(见
图1B)。CXSN＝空病毒载体，CTKSN＝TK阳性病毒，CTKmSN＝TK突变病毒，CTKtatSN＝活性TK基因下游含HIV-1 tat基因ORF的载体(图4D)。CTKenvSN＝活性TK基因下游含HIV-1 env基因ORF的载体。从pHIT111.C中去除lacZ基因制备成CXSN。C＝代替5’U3的CMV启动子，X＝克隆位点，用于基因插入，S＝SV40启动子，而N＝新霉素抗性基因。Tk＝胸苷激酶。TKm＝胸苷激酶突变体。
这些结果显示，用TK/GCV系统可以获得更好的敏感性。不过，TK/GCV系统产生了一定的副作用。一般说来，所用药物应不具有副作用，即引起在表达可激活前体药物的酶的细胞周围的细胞死亡。副作用是由于活性形式的前体药物或穿过原生质膜进入周围细胞或通过缝隙连接进入其它细胞造成的。以GCV为例，副作用是由于药物通过缝隙连接穿过所引起的。幸运的是，这些缝隙连接可用药物狄氏剂阻断并因而限制了副作用(Touraine等，1998)。
图2显示了上述两个酶/前体药物系统的副作用。在图2A中，将HT1080 NTR阳性稳定细胞系与HT1080细胞在10mM MTZ中共培养24小时。在图2B中，将HeLa TK稳定细胞系与HeLa细胞同GCV在狄氏剂(16μg/ml)存在或缺乏的情况下共培养72小时。
从此数据明显可知，用狄氏剂可将TK/GCV的副作用降低到最低。
因此，我们选择使用HSV-1 TK/GCV/狄氏剂，而不优先选择不具有副作用的NTR/灭滴灵(MTZ)，因为TK/GCV在辨别细胞有无此酶上更敏感(
图1A、1B)。研究中所用GCV的量是如
图1所确定的3μg/ml。实施例2-利用锤头状核酶进行体内选择用随机寡核苷酸合成产生锤头状核酶的文库。然后将它们插入失活Tk编码序列下游的CTKmSN(图4B)中，得到许多酶(CTKmRzLB-图4C)。
通过去除pHIT111的lacZ(Soneoka等，1995)得到中间构建体CKSN(图4A)，然后在其中插入由移码突变(在BsP EI位点切除并重新填入)构建的失活TK编码序列，从而构建成CTKmSN(图4B)。在文献Wagner等，1981(基因库接受号V00467)中提供了人疱疹病毒1的序列。
必需在失活形式的酶下游插入文库以保证在载体文库中不含可切割含TK之RNA的核酶(由此会在选择中导致假阳性)。通过三质粒共转染系统(Soneoka等，1995)产生病毒并用于转导HeLa细胞。在暴露于GCV中后检测存活细胞以评估突变体的活性。
在病毒载体CTKSN(图4B)中活性形式酶的下游插入靶RNA序列，制备CTKXSN，其中X＝靶序列(图4C)。在CXSN(图4A)中插入TK序列制备CTKSN。三质粒共转染后将病毒用于转导细胞，诸如NIH3T3、HeLa之类的细胞或其它细胞。选择HeLa细胞使副作用降低到最低程度(HeLa细胞具有低百分率的缝隙-连接联系，而GCV的副作用是由于单磷酸鸟苷类似物穿过缝隙连接的传送造成的)。狄氏剂也可用于减少副作用。
通过新霉素选择(G418，1mg/ml，10天)产生稳定的细胞系。这些细胞系现可用含核酶文库(CTKmRxLB)的载体转导，随后进行GCV选择。任何切割HIV序列的核酶都将防止TK的翻译，从而细胞可存活。所有的其它细胞将由于保留了功能性TK而死亡。然后可用PCR方法得到核酶序列。实施例3-用最优化的核酶进行体内检测按实施例1得到的最优化核糖体可用于治疗疾病。尤其是，这些核酶中有许多可串联使用，从而定向于多个位点。此外，在HIV的治疗中，可用HIV载体运送核酶，因为这将引起对野生型基因组包装的干扰作用。
为了检测此方法的可行性，我们对tat稳定细胞系检测了抗tat核酶。如图3所示，有可能选择出含功能型核酶的细胞。同时清楚的表明需消除副作用才能进行这样的选择。
此技术可用于寻找对HIV基因组的全部或部分具特异性的核酶。此外，该方法提供了体内分离任何靶RNA相关核酶的途径。
参考实施例1-携带核酶的基因组的构建
HIVgag.pol序列经密码子最优化(图8和SEQ I.D.No.1)并用约40个核苷酸左右的重叠寡核苷酸合成。这有三个优点。首先，它允许基于HIV的载体携带核酶及其他治疗因子。其次，密码子最优化可由于较高水平的基因表达而产生较高水平的载体滴度。第三，gag.pol表达变成于rev非依赖型的，这样就允许使用抗rev或RRE因子。
参照洛斯阿莫斯国家实验室(Los Alamos National Laboratory)的HIV序列数据库(http//hiv-web.lanl.gov)鉴别gag.pol中的保守序列并用于设计核酶。由于HIV-1亚型之间的可变性，核酶被设计成可切割北美、拉丁美洲和加勒比、欧洲、日本及澳大利亚中的主要亚型，即亚型B。所选序列与合成的gagpol序列前后对照以保证切断密码子最优化的gagpolmRNA的可能性较低。核酶的5’和3’末端分别设计成XhoI和SalI位点。这样就允许进行分离和串联的核酶的构建。
核酶为锤头状结构，大体结构如下螺旋I 螺旋II 螺旋III5′-NNNNNNNN～CUGAUGAGGCCGAAAGGCCGAA～NNNNNNNN～核酶的催化结构域(螺旋II)可耐受一些改变而不降低其催化转换数。
具有基本GUX三联体、定向于gag和pol的切割位点如下(其中X是任何核苷酸碱基)GAG 1 5′ UAGUAAGAAUGUAUAGCCCUACGAG 2 5′ AACCCAGAUUGUAAGACUAUUUGAG 3 5′ UGUUUCAAUUGUGGCAAAGAAGGAG 4 5′ AAAAAGGGCUGUUGGAAAUGUGPOL 1 5′ ACGACCCCUCGUCACAAUAAAGPOL 2 5′ GGAAUUGGAGGUUUUAUCAAAGPOL 3 5′ AUAUUUUUCAGUUCCCUUAGAUPOL 4 5′ UGGAUGAUUUGUAUGUAGGAUCPOL 5 5′ CUUUGGAUGGGUUAUGAACUCCPOL 6 5′ CAGCUGGACUGUCAAUGACAUAPOL 7 5′ AACUUUCUAUGUAGAUGGGGCAPOL 8 5′ AAGGCCGCCUGUUGGUGGGCAG
POL 9 5′ UAAGACAGCAGUACAAAUGGCA将核酶插入4种不同的HIV载体中(pH4(Gervaix等，1997)、pH6、pH4.1.或pH6.1)(图5)。在pH4和pH6中，由内部HCMV启动子驱动核酶的转录(Foecking和Hofstetter，1986)。对于pH4.1和pH6.1，核酶自5’LTR表达。pH4和pH6(及pH4.1和pH6.1)之间的主要不同在于生产质粒的3’LTR中。pH4和pH4.1在3’LTR中具有HIV U3。pH6和pH6.1在3’LTR中具有HCMV。HCMV启动子取代大部分U3，将驱动高水平的组成型表达，而HIV-1 U3只在Tat存在时才支持高水平的表达。
用三个PCR引物进行重组PCR建立HCMV/HIV-1杂合3’LTR(图6)。用RIB1和RIB2进行第一轮PCR，以pH4(Kim等，1998)为模板扩增HIV-1HXB2序列8900-9123。第二轮PCR循环通过从pH4中扩增杂合5’LTR造成了HIV-1 U3 5’末端和HCMV启动子之间的连接。第一轮PCR反应的产物及RIB3分别用作5’和3’引物。
RIB1 5′-CAGCTGCTCGAGCAGCTGAAGCTTGCATGC-3′RIB2 5′-GTAAGTTATGTAACGGACGATATCTTGTCTTCTT-3′RIB3 5′-CGCATAGTCGACGGGCCCGCCACTGCTAGAGATTTTC-3′然后用SphI和SalI切割PCR产物并插入pH4中，从而取代3’LTR。产生的质粒称为pH6。为了构建pH4.1和pH6.1，用Bluescript II KS+(Stratagene)的多克隆位点(SpeI-XhoI)取代pH4和pH6中的内在HCMV启动子(SpeI-XhoI)。
核酶被插入基因组载体骨架中的XhoI位点。任何形状的任何核酶都可以相似方式使用。
参照实施例2-包装系统的构建包装系统可采用多种形式。在第一种形式的包装系统中，HIVgag、pol组分与HIV env编码序列共表达。这种情况下，gag.pol和env编码序列都被改变以便它们耐受插入基因组的抗HIV核酶。改变密码子用法获得耐受性的同时，可以选择与哺乳动物基因最高表达使用模式相配的密码子。这显著提高了表达水平(Schneider等，1997；Schwartz等，1992)，并因此提高了滴度。经密码子最优化的HIV env编码序列参见文献Haas等(1996)。在本实施例中，使用了修饰后的密码子最优化HIV env序列(SEQ I.D.No.3)。相应的env表达质粒命名为pSYNgp160mn。修饰后的序列包含Haas等没有使用的附加基元。附加序列来自MN株的HIV env序列并经密码子最优化。只要使用相应于丰富tRNA的密码子(Zolotukhin等，1996)，核酸序列的任何类似修饰都将具有类似功能，并导致对基因组中核酶的抗性。
在具最优化密码子用法的gag.pol编码序列的一个例子中，合成重叠寡核苷酸，随后连接在一起，从而产生合成的编码序列。野生型序列(基因库接收号K03455)和合成(gagpol-SYNgp)gagpol序列分别如SEQ I.D.No.1和2所示，它们的密码子用法分别见图7和8。野生型env编码序列的序列(基因库接收号M17449)见SEQ I.D.No.3，合成的密码子最优化序列见SEQ I.D.No.4，它们的密码子用法表分别见图9和10。与env编码序列一样，任何可获得核酶抗性的gag.pol序列均可使用。所示的合成序列被称为gag.pol-SYNgp，其在5’末端具有EcoRI位点，在3’末端具有NotI位点。它被插入pClneo(Promega)，产生质粒pSYNgp。
在第二种形式的包装系统中，合成的gag.pol盒与产生假HIV表面蛋白质的非HIV包膜编码序列共表达。这可以是，例如VSV-G(Ory等，1996；Zhu等，1990)、兼嗜性MLV env(Chesebro等，1990；Spector等，1990)或任何可掺入HIV颗粒的其它蛋白质(Valsesia Wittmann等，1994)。这包括能将载体靶向于特异组织的分子。非HIV包膜蛋白质的编码序列不被核酶切割，因此无需序列修饰(尽管由于其它原因可能期望有一些序列修饰，诸如哺乳动物细胞中密码子使用的最优化)。
参照实施例3-载体颗粒生产载体颗粒可由与Soneoka等(1995)所述相似的瞬时三质粒转染系统或与其它逆转录病毒载体所用相似的生产者细胞系(Ory等，1996；Srinivasakumar等，1997；Yu等，1996)生产。这些原理如
图11和12所述。例如，如Soneoka等(1995)所述，用pH6Rz、pSYNgp和pRV67(VSV-G表达质粒)在293T细胞的三质粒转染(
图12)中产生被命名为H6Rz-VSV的载体颗粒。这样将H6Rz基因组转导至诸如C1866或Jurkat之类的CD4+细胞中，产生多目标核酶。在这些细胞中的HIV复制从此时起被严格限制了。
所有以上说明书中所提及的文献在此均引入作为参考。在不背离本发明范围和精神的原则下，本发明所述方法和系统的多种修饰和变化对本领域技术熟练人员是显而易见的。尽管用特别优选的实施例对本发明进行了描述，但应当理解为要求专利保护的本发明不应只局限于所说的实施方案。事实上，为进行本发明而做的所述模式的多种修饰对分子生物学或相关领域内的技术熟练人员是显而易见的，它们也在以下权利要求的范围内。
说明的序列表部分SEQ.ID.NO.1-HXB2株的野生型gagpol序列(接收号K03455)ATGGGTGCGA GAGCGTCAGT ATTAAGCGGG GGAGAATTAG ATCGATGGGA AAAAATTCGG 60TTAAGGCCAG GGGGAAAGAA AAAATATAAA TTAAAACATA TAGTATGGGC AAGCAGGGAG 120CTAGAACGAT TCGCAGTTAA TCCTGGCCTG TTAGAAACAT CAGAAGGCTG TAGACAAATA 180CTGGGACAGC TACAACCATC CCTTCAGACA GGATCAGAAG AACTTAGATC ATTATATAAT 240ACAGTAGCAA CCCTCTATTG TGTGCATCAA AGGATAGAGA TAAAAGACAC CAAGGAAGCT 300TTAGACAAGA TAGAGGAAGA GCAAAACAAA AGTAAGAAAA AAGCACAGCA AGCAGCAGCT 360GACACAGGAC ACAGCAATCA GGTCAGCCAA AATTACCCTA TAGTGCAGAA CATCCAGGGG 420CAAATGGTAC ATCAGGCCAT ATCACCTAGA ACTTTAAATG CATGGGTAAA AGTAGTAGAA 480GAGAAGGCTT TCAGCCCAGA AGTGATACCC ATGTTTTCAG CATTATCAGA AGGAGCCACC 540CCACAAGATT TAAACACCAT GCTAAACACA GTGGGGGGAC ATCAAGCAGC CATGCAAATG 600TTAAAAGAGA CCATCAATGA GGAAGCTGCA GAATGGGATA GAGTGCATCC AGTGCATGCA 660GGGCCTATTG CACCAGGCCA GATGAGAGAA CCAAGGGGAA GTGACATAGC AGGAACTACT 720AGTACCCTTC AGGAACAAAT AGGATGGATG ACAAATAATC CACCTATCCC AGTAGGAGAA 780ATTTATAAAA GATGGATAAT CCTGGGATTA AATAAAATAG TAAGAATGTA TAGCCCTACC 840AGCATTCTGG ACATAAGACA AGGACCAAAG GAACCCTTTA GAGACTATGT AGACCGGTTC 900TATAAAACTC TAAGAGCCGA GCAAGCTTCA CAGGAGGTAA AAAATTGGAT GACAGAAACC 960TTGTTGGTCC AAAATGCGAA CCCAGATTGT AAGACTATTT TAAAAGCATT GGGACCAGCG 1020GCTACACTAG AAGAAATGAT GACAGCATGT CAGGGAGTAG GAGGACCCGG CCATAAGGCA 1080AGAGTTTTGG CTGAAGCAAT GAGCCAAGTA ACAAATTCAG CTACCATAAT GATGCAGAGA 1140GGCAATTTTA GGAACCAAAG AAAGATTGTT AAGTGTTTCA ATTGTGGCAA AGAAGGGCAC 1200ACAGCCAGAA ATTGCAGGGC CCCTAGGAAA AAGGGCTGTT GGAAATGTGG AAAGGAAGGA 1260CACCAAATGA AAGATTGTAC TGAGAGACAG GCTAATTTTT TAGGGAAGAT CTGGCCTTCC 1320TACAAGGGAA GGCCAGGGAA TTTTCTTCAG AGCAGACCAG AGCCAACAGC CCCACCAGAA 1380GAGAGCTTCA GGTCTGGGGT AGAGACAACA ACTCCCCCTC AGAAGCAGGA GCCGATAGAC 1440AAGGAACTGT ATCCTTTAAC TTCCCTCAGG TCACTCTTTG GCAACGACCC CTCGTCACAA 1500TAAAGATAGG GGGGCAACTA AAGGAAGCTC TATTAGATAC AGGAGCAGAT GATACAGTAT 1560TAGAAGAAAT GAGTTTGCCA GGAAGATGGA AACCAAAAAT GATAGGGGGA ATTGGAGGTT 1620TTATCAAAGT AAGACAGTAT GATCAGATAC TCATAGAAAT CTGTGGACAT AAAGCTATAG 1680GTACAGTATT AGTAGGACCT ACACCTGTCA ACATAATTGG AAGAAATCTG TTGACTCAGA 1740TTGGTTGCAC TTTAAATTTT CCCATTAGCC CTATTGAGAC TGTACCAGTA AAATTAAAGC 1800CAGGAATGGA TGGCCCAAAA GTTAAACAAT GGCCATTGAC AGAAGAAAAA ATAAAAGCAT 1860TAGTAGAAAT TTGTACAGAG ATGGAAAAGG AAGGGAAAAT TTCAAAAATT GGGCCTGAAA 1920ATCCATACAA TACTCCAGTA TTTGCCATAA AGAAAAAAGA CAGTACTAAA TGGAGAAAAT 1980TAGTAGATTT CAGAGAACTT AATAAGAGAA CTCAAGACTT CTGGGAAGTT CAATTAGGAA 2040TACCACATCC CGCAGGGTTA AAAAAGAAAA AATCAGTAAC AGTACTGGAT GTGGGTGATG 2100CATATTTTTC AGTTCCCTTA GATGAAGACT TCAGGAAGTA TACTGCATTT ACCATACCTA 2160GTATAAACAA TGAGACACCA GGGATTAGAT ATCAGTACAA TGTGCTTCCA CAGGGATGGA 2220AAGGATCACC AGCAATATTC CAAAGTAGCA TGACAAAAAT CTTAGAGCCT TTTAGAAAAC 2280AAAATCCAGA CATAGTTATC TATCAATACA TGGATGATTT GTATGTAGGA TCTGACTTAG 2340AAATAGGGCA GCATAGAACA AAAATAGAGG AGCTGAGACA ACATCTGTTG AGGTGGGGAC 2400TTACCACACC AGACAAAAAA CATCAGAAAG AACCTCCATT CCTTTGGATG GGTTATGAAC 2460TCCATCCTGA TAAATGGACA GTACAGCCTA TAGTGCTGCC AGAAAAAGAC AGCTGGACTG 2520TCAATGACAT ACAGAAGTTA GTGGGGAAAT TGAATTGGGC AAGTCAGATT TACCCAGGGA 2580TTAAAGTAAG GCAATTATGT AAACTCCTTA GAGGAACCAA AGCACTAACA GAAGTAATAC 2640CACTAACAGA AGAAGCAGAG CTAGAACTGG CAGAAAACAG AGAGATTCTA AAAGAACCAG 2700TACATGGAGT GTATTATGAC CCATCAAAAG ACTTAATAGC AGAAATACAG AAGCAGGGGC 2760AAGGCCAATG GACATATCAA ATTTATCAAG AGCCATTTAA AAATCTGAAA ACAGGAAAAT 2820ATGCAAGAAT GAGGGGTGCC CACACTAATG ATGTAAAACA ATTAACAGAG GCAGTGCAAA 2880AAATAACCAC AGAAAGCATA GTAATATGGG GAAAGACTCC TAAATTTAAA CTGCCCATAC 2940AAAAGGAAAC ATGGGAAACA TGGTGGACAG AGTATTGGCA AGCCACCTGG ATTCCTGAGT 3000GGGAGTTTGT TAATACCCCT CCCTTAGTGA AATTATGGTA CCAGTTAGAG AAAGAACCCA 3060TAGTAGGAGC AGAAACCTTC TATGTAGATG GGGCAGCTAA CAGGGAGACT AAATTAGGAA 3120AAGCAGGATA TGTTACTAAT AGAGGAAGAC AAAAAGTTGT CACCCTAACT GACACAACAA 3180ATCAGAAGAC TGAGTTACAA GCAATTTATC TAGCTTTGCA GGATTCGGGA TTAGAAGTAA 3240ACATAGTAAC AGACTCACAA TATGCATTAG GAATCATTCA AGCACAACCA GATCAAAGTG 3300AATCAGAGTT AGTCAATCAA ATAATAGAGC AGTTAATAAA AAAGGAAAAG GTCTATCTGG 3360CATGGGTACC AGCACACAAA GGAATTGGAG GAAATGAACA AGTAGATAAA TTAGTCAGTG 3420CTGGAATCAG GAAAGTACTA TTTTTAGATG GAATAGATAA GGCCCAAGAT GAACATGAGA 3480AATATCACAG TAATTGGAGA GCAATGGCTA GTGATTTTAA CCTGCCACCT GTAGTAGCAA 3540AAGAAATAGT AGCCAGCTGT GATAAATGTC AGCTAAAAGG AGAAGCCATG CATGGACAAG 3600TAGACTGTAG TCCAGGAATA TGGCAACTAG ATTGTACACA TTTAGAAGGA AAAGTTATCC 3660TGGTAGCAGT TCATGTAGCC AGTGGATATA TAGAAGCAGA AGTTATTCCA GCAGAAACAG 3720GGCAGGAAAC AGCATATTTT CTTTTAAAAT TAGCAGGAAG ATGGCCAGTA AAAACAATAC 3780ATACTGACAA TGGCAGCAAT TTCACCGGTG CTACGGTTAG GGCCGCCTGT TGGTGGGCGG 3840GAATCAAGCA GGAATTTGGA ATTCCCTACA ATCCCCAAAG TCAAGGAGTA GTAGAATCTA 3900TGAATAAAGA ATTAAAGAAA ATTATAGGAC AGGTAAGAGA TCAGGCTGAA CATCTTAAGA 3960CAGCAGTACA AATGGCAGTA TTCATCCACA ATTTTAAAAG AAAAGGGGGG ATTGGGGGGT 4020ACAGTGCAGG GGAAAGAATA GTAGACATAA TAGCAACAGA CATACAAACT AAAGAATTAC 4080AAAAACAAAT TACAAAAATT CAAAATTTTC GGGTTTATTA CAGGGACAGC AGAAATTCAC 4140TTTGGAAAGG ACCAGCAAAG CTCCTCTGGA AAGGTGAAGG GGCAGTAGTA ATACAAGATA 4200ATAGTGACAT AAAAGTAGTG CCAAGAAGAA AAGCAAAGAT CATTAGGGAT TATGGAAAAC 4260AGATGGCAGG TGATGATTGT GTGGCAAGTA GACAGGATGA GGATTAG 4307SEQ.ID.NO.2-gagpol-SYNgp-密码子最优化的gagpol序列ATGGGCGCCC GCGCCAGCGT GCTGTCGGGC GGCGAGCTGG ACCGCTGGGA GAAGATCCGC 60CTGCGCCCCG GCGGCAAAAA GAAGTACAAG CTGAAGCACA TCGTGTGGGC CAGCCGCGAA 120CTGGAGCGCT TCGCCGTGAA CCCCGGGCTC CTGGAGACCA GCGAGGGGTG CCGCCAGATC 180CTCGGCCAAC TGCAGCCCAG CCTGCAAACC GGCAGCGAGG AGCTGCGCAG CCTGTACAAC 240ACCGTGGCCA CGCTGTACTG CGTCCACCAG CGCATCGAAA TCAAGGATAC GAAAGAGGCC 300CTGGATAAAA TCGAAGAGGA ACAGAATAAG AGCAAAAAGA AGGCCCAACA GGCCGCCGCG 360GACACCGGAC ACAGCAACCA GGTCAGCCAG AACTACCCCA TCGTGCAGAA CATCCAGGGG 420CAGATGGTGC ACCAGGCCAT CTCCCCCCGC ACGCTGAACG CCTGGGTGAA GGTGGTGGAA 480GAGAAGGCTT TTAGCCCGGA GGTGATACCC ATGTTCTCAG CCCTGTCAGA GGGAGCCACC 540CCCCAAGATC TGAACACCAT GCTCAACACA GTGGGGGGAC ACCAGGCCGC CATGCAGATG 600CTGAAGGAGA CCATCAATGA GGAGGCTGCC GAATGGGATC GTGTGCATCC GGTGCACGCA 660GGGCCCATCG CACCGGGCCA GATGCGTGAG CCACGGGGCT CAGACATCGC CGGAACGACT 720AGTACCCTTC AGGAACAGAT CGGCTGGATG ACCAACAACC CACCCATCCC GGTGGGAGAA 780ATCTACAAAC GCTGGATCAT CCTGGGCCTG AACAAGATCG TGCGCATGTA TAGCCCTACC 840AGCATCCTGG ACATCCGCCA AGGCCCGAAG GAACCCTTTC GCGACTACGT GGACCGGTTC 900TACAAAACGC TCCGCGCCGA GCAGGCTAGC CAGGAGGTGA AGAACTGGAT GACCGAAACC 960CTGCTGGTCC AGAACGCGAA CCCGGACTGC AAGACGATCC TGAAGGCCCT GGGCCCAGCG 1020GCTACCCTAG AGGAAATGAT GACCGCCTGT CAGGGAGTGG GCGGACCCGG CCACAAGGCA 1080CGCGTCCTGG CTGAGGCCAT GAGCCAGGTG ACCAACTCCG CTACCATCAT GATGCAGCGC 1140GGCAACTTTC GGAACCAACG CAAGATCGTC AAGTGCTTCA ACTGTGGCAA AGAAGGGCAC 1200ACAGCCCGCA ACTGCAGGGC CCCTAGGAAA AAGGGCTGCT GGAAATGCGG CAAGGAAGGC 1260CACCAGATGA AAGACTGTAC TGAGAGACAG GCTAATTTTT TAGGGAAGAT CTGGCCTTCC 1320TACAAGGGAA GGCCAGGGAA TTTTCTTCAG AGCAGACCAG AGCCAACAGC CCCACCAGAA 1380GAGAGCTTCA GGTCTGGGGT AGAGACAACA ACTCCCCCTC AGAAGCAGGA GCCGATAGAC 1440AAGGAACTGT ATCCTTTAAC TTCCCTCAGA TCACTCTTTG GCAACGACCC CTCGTCACAA 1500TAAAGATAGG GGGGCAGCTC AAGGAGGCTC TCCTGGACAC CGGAGCAGAC GACACCGTGC 1560TGGAGGAGAT GTCGTTGCCA GGCCGCTGGA AGCCGAAGAT GATCGGGGGA ATCGGCGGTT 1620TCATCAAGGT GCGCCAGTAT GACCAGATCC TCATCGAAAT CTGCGGCCAC AAGGCTATCG 1680GTACCGTGCT GGTGGGCCCC ACACCCGTCA ACATCATCGG ACGCAACCTG TTGACGCAGA 1740TCGGTTGCAT GCTGAACTTC CCCATTAGCC CTATCGAGAC GGTACCGGTG AAGCTGAAGC 1800CCGGGATGGA CGGCCCGAAG GTCAAGCAAT GGCCATTGAC AGAGGAGAAG ATCAAGGCAC 1860TGGTGGAGAT TTGCACAGAG ATGGAAAAGG AAGGGAAAAT CTCCAAGATT GGGCCTGAGA 1920ACCCGTACAA CACGCCGGTG TTCGCAATCA AGAAGAAGGA CTCGACGAAA TGGCGCAAGC 1980TGGTGGACTT CCGCGAGCTG AACAAGCGCA CGCAAGACTT CTGGGAGGTT CAGCTGGGCA 2040TCCCGCACCC CGCAGGGCTG AAGAAGAAGA AATCCGTGAC CGTACTGGAT GTGGGTGATG 2100CCTACTTCTC CGTTCCCCTG GACGAAGACT TCAGGAAGTA CACTGCCTTC ACAATCCCTT 2160CGATCAACAA CGAGACACCG GGGATTCGAT ATCAGTACAA CGTGCTGCCC CAGGGCTGGA 2220AAGGCTCTCC CGCAATCTTC CAGAGTAGCA TGACCAAAAT CCTGGAGCCT TTCCGCAAAC 2280AGAACCCCGA CATCGTCATC TATCAGTACA TGGATGACTT GTACGTGGGC TCTGATCTAG 2340AGATAGGGCA GCACCGCACC AAGATCGAGG AGCTGCGCCA GCACCTGTTG AGGTGGGGAC 2400TGACCACACC CGACAAGAAG CACCAGAAGG AGCCTCCCTT CCTCTGGATG GGTTACGAGC 2460TGCACCCTGA CAAATGGACC GTGCAGCCTA TCGTGCTGCC AGAGAAAGAC AGCTGGACTG 2520TCAACGACAT ACAGAAGCTG GTGGGGAAGT TGAACTGGGC CAGTCAGATT TACCCAGGGA 2580TTAAGGTGAG GCAGCTGTGC AAACTCCTCC GCGGAACCAA GGCACTCACA GAGGTGATCC 2640CCCTAACCGA GGAGGCCGAG CTCGAACTGG CAGAAAACCG AGAGATCCTA AAGGAGCCCG 2700TGCACGGCGT GTACTATGAC CCCTCCAAGG ACCTGATCGC CGAGATCCAG AAGCAGGGGC 2760AAGGCCAGTG GACCTATCAG ATTTACCAGG AGCCCTTCAA GAACCTGAAG ACCGGCAAGT 2820ACGCCCGGAT GAGGGGTGCC CACACTAACG ACGTCAAGCA GCTGACCGAG GCCGTGCAGA 2880AGATCACCAC CGAAAGCATC GTGATCTGGG GAAAGACTCC TAAGTTCAAG CTGCCCATCC 2940AGAAGGAAAC CTGGGAAACC TGGTGGACAG AGTATTGGCA GGCCACCTGG ATTCCTGAGT 3000GGGAGTTCGT CAACACCCCT CCCCTGGTGA AGCTGTGGTA CCAGCTGGAG AAGGAGCCCA 3060TAGTGGGCGC CGAAACCTTC TACGTGGATG GGGCCGCTAA CAGGGAGACT AAGCTGGGCA 3120AAGCCGGATA CGTCACTAAC CGGGGCAGAC AGAAGGTTGT CACCCTCACT GACACCACCA 3180ACCAGAAGAC TGAGCTGCAG GCCATTTACC TCGCTTTGCA GGACTCGGGC CTGGAGGTGA 3240ACATCGTGAC AGACTCTCAG TATGCCCTGG GCATCATTCA AGCCCAGCCA GACCAGAGTG 3300AGTCCGAGCT GGTCAATCAG ATCATCGAGC AGCTGATCAA GAAGGAAAAG GTCTATCTGG 3360CCTGGGTACC CGCCCACAAA GGCATTGGCG GCAATGAGCA GGTCGACAAG CTGGTCTCGG 3420CTGGCATCAG GAAGGTGCTA TTCCTGGATG GCATCGACAA GGCCCAGGAC GAGCACGAGA 3480AATACCACAG CAACTGGCGG GCCATGGCTA GCGACTTCAA CCTGCCCCCT GTGGTGGCCA 3540AAGAGATCGT GGCCAGCTGT GACAAGTGTC AGCTCAAGGG CGAAGCCATG CATGGCCAGG 3600TGGACTGTAG CCCCGGCATC TGGCAACTCG ATTGCACCCA TCTGGAGGGC AAGGTTATCC 3660TGGTAGCCGT CCATGTGGCC AGTGGCTACA TCGAGGCCGA GGTCATTCCC GCCGAAACAG 3720GGCAGGAGAC AGCCTACTTC CTCCTGAAGC TGGCAGGCCG GTGGCCAGTG AAGACCATCC 3780ATACTGACAA TGGCAGCAAT TTCACCAGTG CTACGGTTAA GGCCGCCTGC TGGTGGGCGG 3840GAATCAAGCA GGAGTTCGGG ATCCCCTACA ATCCCCAGAG TCAGGGCGTC GTCGAGTCTA 3900TGAATAAGGA GTTAAAGAAG ATTATCGGCC AGGTCAGAGA TCAGGCTGAG CATCTCAAGA 3960CCGCGGTCCA AATGGCGGTA TTCATCCACA ATTTCAAGCG GAAGGGGGGG ATTGGGGGGT 4020ACAGTGCGGG GGAGCGGATC GTGGACATCA TCGCGACCGA CATCCAGACT AAGGAGCTGC 4080AAAAGCAGAT TACCAAGATT CAGAATTTCC GGGTCTACTA CAGGGACAGC AGAAATCCCC 4140TCTGGAAAGG CCCAGCGAAG CTCCTCTGGA AGGGTGAGGG GGCAGTAGTG ATCCAGGATA 4200ATAGCGACAT CAAGGTGGTG CCCAGAAGAA AGGCGAAGAT CATTAGGGAT TATGGCAAAC 4260AGATGGCGGG TGATGATTGC GTGGCGAGCA GACAGGATGA GGATTAG 4307SEQ.ID.NO.3-来自HIV-1MN的包膜基因(基因库接收号M17449)ATGAGAGTGA AGGGGATCAG GAGGAATTAT CAGCACTGGT GGGGATGGGG CACGATGCTC 60CTTGGGTTAT TAATGATCTG TAGTGCTACA GAAAAATTGT GGGTCACAGT CTATTATGGG 120GTACCTGTGT GGAAAGAAGC AACCACCACT CTATTTTGTG CATCAGATGC TAAAGCATAT 180GATACAGAGG TACATAATGT TTGGGCCACA CAAGCCTGTG TACCCACAGA CCCCAACCCA 240CAAGAAGTAG AATTGGTAAA TGTGACAGAA AATTTTAACA TGTGGAAAAA TAACATGGTA 300GAACAGATGC ATGAGGATAT AATCAGTTTA TGGGATCAAA GCCTAAAGCC ATGTGTAAAA 360TTAACCCCAC TCTGTGTTAC TTTAAATTGC ACTGATTTGA GGAATACTAC TAATACCAAT 420AATAGTACTG CTAATAACAA TAGTAATAGC GAGGGAACAA TAAAGGGAGG AGAAATGAAA 480AACTGCTCTT TCAATATCAC CACAAGCATA AGAGATAAGA TGCAGAAAGA ATATGCACTT 540CTTTATAAAC TTGATATAGT ATCAATAGAT AATGATAGTA CCAGCTATAG GTTGATAAGT 600TGTAATACCT CAGTCATTAC ACAAGCTTGT CCAAAGATAT CCTTTGAGCC AATTCCCATA 660CACTATTGTG CCCCGGCTGG TTTTGCGATT CTAAAATGTA ACGATAAAAA GTTCAGTGGA 720AAAGGATCAT GTAAAAATGT CAGCACAGTA CAATGTACAC ATGGAATTAG GCCAGTAGTA 780TCAACTCAAC TGCTGTTAAA TGGCAGTCTA GCAGAAGAAG AGGTAGTAAT TAGATCTGAG 840AATTTCACTG ATAATGCTAA AACCATCATA GTACATCTGA ATGAATCTGT ACAAATTAAT 900TGTACAAGAC CCAACTACAA TAAAAGAAAA AGGATACATA TAGGACCAGG GAGAGCATTT 960TATACAACAA AAAATATAAT AGGAACTATA AGACAAGCAC ATTGTAACAT TAGTAGAGCA 1020AAATGGAATG ACACTTTAAG ACAGATAGTT AGCAAATTAA AAGAACAATT TAAGAATAAA 1080ACAATAGTCT TTAATCAATC CTCAGGAGGG GACCCAGAAA TTGTAATGCA CAGTTTTAAT 1140TGTGGAGGGG AATTTTTCTA CTGTAATACA TCACCACTGT TTAATAGTAC TTGGAATGGT 1200AATAATACTT GGAATAATAC TACAGGGTCA AATAACAATA TCACACTTCA ATGCAAAATA 1260AAACAAATTA TAAACATGTG GCAGGAAGTA GGAAAAGCAA TGTATGCCCC TCCCATTGAA 1320GGACAAATTA GATGTTCATC AAATATTACA GGGCTACTAT TAACAAGAGA TGGTGGTAAG 1380GACACGGACA CGAACGACAC CGAGATCTTC AGACCTGGAG GAGGAGATAT GAGGGACAAT 1440TGGAGAAGTG AATTATATAA ATATAAAGTA GTAACAATTG AACCATTAGG AGTAGCACCA 1500ACCAAGGCAA AGAGAAGAGT GGTGCAGAGA GAAAAAAGAG CAGCGATAGG AGCTCTGTTC 1560CTTGGGTTCT TAGGAGCAGC AGGAAGCACT ATGGGCGCAG CGTCAGTGAC GCTGACGGTA 1620CAGGCCAGAC TATTATTGTC TGGTATAGTG CAACAGCAGA ACAATTTGCT GAGGGCCATT 1680GAGGCGCAAC AGCATATGTT GCAACTCACA GTCTGGGGCA TCAAGCAGCT CCAGGCAAGA 1740GTCCTGGCTG TGGAAAGATA CCTAAAGGAT CAACAGCTCC TGGGGTTTTG GGGTTGCTCT 1800GGAAAACTCA TTTGCACCAC TACTGTGCCT TGGAATGCTA GTTGGAGTAA TAAATCTCTG 1860GATGATATTT GGAATAACAT GACCTGGATG CAGTGGGAAA GAGAAATTGA CAATTACACA 1920AGCTTAATAT ACTCATTACT AGAAAAATCG CAAACCCAAC AAGAAAAGAA TGAACAAGAA 1980TTATTGGAAT TGGATAAATG GGCAAGTTTG TGGAATTGGT TTGACATAAC AAATTGGCTG 2040TGGTATATAA AAATATTCAT AATGATAGTA GGAGGCTTGG TAGGTTTAAG AATAGTTTTT 2100GCTGTACTTT CTATAGTGAA TAGAGTTAGG CAGGGATACT CACCATTGTC GTTGCAGACC 2160CGCCCCCCAG TTCCGAGGGG ACCCGACAGG CCCGAAGGAA TCGAAGAAGA AGGTGGAGAG 2220AGAGACAGAG ACACATCCGG TCGATTAGTG CATGGATTCT TAGCAATTAT CTGGGTCGAC 2280CTGCGGAGCC TGTTCCTCTT CAGCTACCAC CACAGAGACT TACTCTTGAT TGCAGCGAGG 2340ATTGTGGAAC TTCTGGGACG CAGGGGG G GAAGTCCTCA AATATTGGTG GAATCTCCTA 2400CAGTATTGGA GTCAGGAACT AAAGAGT GT GCTGTTAGCT TGCTTAATGC CACAGCTATA 2460GCAGTAGCTG AGGGGACAGA TAGGGTTATA GAAGTACTGC AAAGAGCTGG TAGAGCTATT 2520CTCCACATAC CTACAAGAAT AAGACAGGGC TTGGAAAGGG CTTTGCTATA A 2571SEQ.ID.NO.4-SYNgp-160mn-密码子最优化的env序列ATGAGGGTGA AGGGGATCCG CCGCAACTAC CAGCACTGGT GGGGCTGGGG CACGATGCTC 60CTGGGGCTGC TGATGATCTG CAGCGCCACC GAGAAGCTGT GGGTGACCGT GTACTACGGC 120GTGCCCGTGT GGAAGGAGGC CACCACCACC CTGTTCTGCG CCAGCGACGC CAAGGCGTAC 180GACACCGAGG TGCACAACGT GTGGGCCACC CAGGCGTGCG TGCCCACCGA CCCCAACCCC 240CAGGAGGTGG AGCTCGTGAA CGTGACCGAG AACTTCAACA TGTGGAAGAA CAACATGGTG 300GAGCAGATGC ATGAGGACAT CATCAGCCTG TGGGACCAGA GCCTGAAGCC CTGCGTGAAG 360CTGACCCCCC TGTGCGTGAC CCTGAACTGC ACCGACCTGA GGAACACCAC CAACACCAAC 420AACAGCACCG CCAACAACAA CAGCAACAGC GAGGGCACCA TCAAGGGCGG CGAGATGAAG 480AACTGCAGCT TCAACATCAC CACCAGCATC CGCGACAAGA TGCAGAAGGA GTACGCCCTG 540CTGTACAAGC TGGATATCGT GAGCATCGAC AACGACAGCA CCAGCTACCG CCTGATCTCC 600TGCAACACCA GCGTGATCAC CCAGGCCTGC CCCAAGATCA GCTTCGAGCC CATCCCCATC 660CACTACTGCG CCCCCGCCGG CTTCGCCATC CTGAAGTGCA ACGACAAGAA GTTCAGCGGC 720AAGGGCAGCT GCAAGAACGT GAGCACCGTG CAGTGCACCC ACGGCATCCG GCCGGTGGTG 780AGCACCCAGC TCCTGCTGAA CGGCAGCCTG GCCGAGGAGG AGGTGGTGAT CCGCAGCGAG 840AACTTCACCG ACAACGCCAA GACCATCATC GTGCACCTGA ATGAGAGCGT GCAGATCAAC 900TGCACGCGTC CCAACTACAA CAAGCGCAAG CGCATCCACA TCGGCCCCGG GCGCGCCTTC 960TACACCACCA AGAACATCAT CGGCACCATC CGCCAGGCCC ACTGCAACAT CTCTAGAGCC 1020AAGTGGAACG ACACCCTGCG CCAGATCGTG AGCAAGCTGA AGGAGCAGTT CAAGAACAAG 1080ACCATCGTGT TCAACCAGAG CAGCGGCGGC GACCCCGAGA TCGTGATGCA CAGCTTCAAC 1140TGCGGCGGCG AATTCTTCTA CTGCAACACC AGCCCCCTGT TCAACAGCAC CTGGAACGGC 1200AACAACACCT GGAACAACAC CACCGGCAGC AACAACAATA TTACCCTCCA GTGCAAGATC 1260AAGCAGATCA TCAACATGTG GCAGGAGGTG GGCAAGGCCA TGTACGCCCC CCCCATCGAG 1320GGCCAGATCC GGTGCAGCAG CAACATCACC GGTCTGCTGC TGACCCGCGA CGGCGGCAAG 1380GACACCGACA CCAACGACAC CGAAATCTTC CGCCCCGGCG GCGGCGACAT GCGCGACAAC 1440TGGAGATCTG AGCTGTACAA GTACAAGGTG GTGACGATCG AGCCCCTGGG CGTGGCCCCC 1500ACCAAGGCCA AGCGCCGCGT GGTGCAGCGC GAGAAGCGGG CCGCCATCGG CGCCCTGTTC 1560CTGGGCTTCC TGGGGGCGGC GGGCAGCACC ATGGGGGCCG CCAGCGTGAC CCTGACCGTG 1620CAGGCCCGCC TGCTCCTGAG CGGCATCGTG CAGCAGCAGA ACAACCTCCT CCGCGCCATC 1680GAGGCCCAGC AGCATATGCT CCAGCTCACC GTGTGGGGCA TCAAGCAGCT CCAGGCCCGC 1740GTGCTGGCCG TGGAGCGCTA CCTGAAGGAC CAGCAGCTCC TGGGCTTCTG GGGCTGCTCC 1800GGCAAGCTGA TCTGCACCAC CACGGTACCC TGGAACGCCT CCTGGAGCAA CAAGAGCCTG 1860GACGACATCT GGAACAACAT GACCTGGATG CAGTGGGAGC GCGAGATCGA TAACTACACC 1920AGCCTGATCT ACAGCCTGCT GGAGAAGAGC CAGACCCAGC AGGAGAAGAA CGAGCAGGAG 1980CTGCTGGAGC TGGACAAGTG GGCGAGCCTG TGGAACTGGT TCGACATCAC CAACTGGCTG 2040TGGTACATCA AAATCTTCAT CATGATTGTG GGCGGCCTGG TGGGCCTCCG CATCGTGTTC 2100GCCGTGCTGA GCATCGTGAA CCGCGTGCGC CAGGGCTACA GCCCCCTGAG CCTCCAGACC 2160CGGCCCCCCG TGCCGCGCGG GCCCGACCGC CCCGAGGGCA TCGAGGAGGA GGGCGGCGAG 2220CGCGACCGCG ACACCAGCGG CAGGCTCGTG CACGGCTTCC TGGCGATCAT CTGGGTCGAC 2280CTCCGCAGCC TGTTCCTGTT CAGCTACCAC CACCGCGACC TGCTGCTGAT CGCCGCCCGC 2340ATCGTGGAAC TCCTAGGCCG CCGCGGCTGG GAGGTGCTGA AGTACTGGTG GAACCTCCTC 2400CAGTATTGGA GCCAGGAGCT GAAGTCCAGC GCCGTGAGCC TGCTGAACGC CACCGCCATC 2460GCCGTGGCCG AGGGCACCGA CCGCGTGATC GAGGTGCTCC AGAGGGCCGG GAGGGCGATC 2520CTGCACATCC CCACCCGCAT CCGCCAGGGG CTCGAGAGGG CGCTGCTGTA A 2571
参考文献Bender等，1987，病毒学杂志J Virol 611639-1646Chesebro，B.，K.Wehrly，和W.Maury.1990.病毒学杂志J Virol.644553-7Foecking，M.K.，和H.Hofstetter.1986.基因Gene.45101-105.
Gervaix，A.，X.Li，G.Kraus，和F.Wong Staal.1997.病毒学杂志J Virol.713048-53.
Haas，J.，E.-C.Park，和B.Seed.1996.当代生物学CurrentBiology.6315.
Kawa等，1998，RNA 41397-1406.
Kim，V.N.，K.Mitrophanous，S.M.Kingsman，和K.A.J.1998.病毒学杂志J Virol72811-816.
Ma等，1998，反义及核酸药物发展Antisense and Nucleic AcidDrug Development 8415-426.
Miller，N.，和J.Whelan.1997.人类基因治疗Hum GeneTher.8803-15.
Milner N.，Mir KU，Southern EM，1997，自然生物技术NatBiotechnol.，15(6)537-41.
Ory，D.S.，B.A.Neugeboren，和R.C.Mulligan.1996.美国国家科学院院报Proc Natl Acad Sci USA.9311400-6.
Schneider，R.，M.Campbell，G.Nasioulas，B.K.Felber，和G.N.Pavlakis.1997.病毒学杂志J Virol.714892-903.
Schwartz，S.，M.Campbell，G.Nasioulas，J.Harrison，B.K.Felber，和G.N.Pavlakis.1992.病毒学杂志J Virol.667176-82.
Soneoka，Y.，P.M.Cannon，E.E.Rarnsdale，J.C.Griffiths，G.Romano，S.M.Kingsman，和A.J.Kingsman.1995.核酸研究NucleicAcids Res.23628-33.
Southern E.M.，Milner N.，Mir K.U.，1997，Ciba Found Symp，20938-44；讨论44-46.
Spector，D.H.，E.Wade，D.A.Wright，V.Koval，C.Clark，D.Jaquish，和S.A.Spector.1990.病毒学杂志J Virol.642298-2308.
Srinivasakumar，N.，N.Chazal，C.Helga Maria，S.Prasad，M.L.Hammarskjold，和D.Rekosh.1997.病毒学杂志JVirol.715841-8.
Touraine RL，Ishii-Morita H，Ramsey WJ，Blaese RM，1998，基因治疗Gene Ther，5(12)1705-11.
Valsesia Wittmann，S.，A.Drynda，G.Deleage，M.Aumailley，J.M.Heard，O.Danos，G.Verdier，和F.L.Cosset.1994，病毒学杂志JVirol.684609-19.
Wagner MJ，Sharp JA，Summers WC.，1981美国国家科学院院报Proc Natl Acad Sci USA，78(3)1441-5.(接收号J02224或V00467).
Werner等，1997，核酸研讨会Nucleic Acids Symposium系列号3619-21.
Werner等，1998，RNA 4847-855.
Yu，H.，A.B.Rabson，M.Kaul，Y.Ron，和J.P.Dougherty.1996.病毒学杂志J Virol.704530-37.
Zhou，C.，I.Bahner，J.J.Rossi，和D.B.Kohn.1996.反义核酸药物发展Antisense Nucleic Acid Drug Dev.617-24.
Zhu，Z.H.，S.S.Chen，和A.S.Huang.1990，获得性免疫缺陷综合症杂志J Acquir Immune Defic Syndr.3215-Zolotukhin，S.，M.Potter，W.W.Hauswirth，J.Guy，和N.Muzyczka.1996.病毒学杂志J Virol.704646-54.
权利要求
1.适于体内使用的选择系统，该系统包含i)所编码基因产物能直接或间接与核苷酸序列或其转录产物结合并实现其切割的第一核苷酸序列群；其中结合所述核苷酸序列所需的第一核苷酸序列的区域在第一核苷酸序列群中是异质的；和ii)第二核苷酸序列，其包含(a)编码与mRNA稳定及/或翻译所需序列有效连接的可检测标记的编码区；及(b)第三核苷酸序列，其位于编码区及至少一个mRNA稳定和/或翻译所需序列之间；其中(a)和(b)与能指导(a)和(b)作为毗邻RNA分子在宿主细胞中表达的调控序列有效连接。
2.载体系统，该系统包含i)载体群，其中各载体独立包含所编码基因产物能直接或间接与核苷酸序列或其转录产物结合并实现其切割的第一核苷酸序列；其中结合所述核苷酸序列所需的第一核苷酸序列的区域在载体群中是异质的；和ii)第二核苷酸序列，其包含(a)编码与mRNA稳定及/或翻译所需序列有效连接的可检测标记的编码区；及(b)第三核苷酸序列，其位于编码区及至少一个mRNA稳定和/或翻译所需序列之间；其中(a)和(b)与能指导(a)和(b)作为毗邻RNA分子在宿主细胞中表达的调控序列有效连接，其中第二核苷酸序列存在于载体群中或作为另一载体的部分存在。
3.按照权利要求1或2的系统，其中基因产物选自核酶、反义核糖核酸和外部指导序列。
4.按照权利要求2或3的系统，其中的载体是病毒载体。
5.按照权利要求4的系统，其中的病毒载体是逆转录病毒载体。
6.按照上述权利要求中任一项的系统，其中的可检测标记是选择标记。
7.按照权利要求6的系统，其中的选择标记是能将前体药物转变为细胞毒性化合物的酶。
8.按照权利要求7的系统，其中的酶是胸苷激酶，而前体药物是丙氧鸟苷。
9.按照上述权利要求中任一项的系统，其中第三核苷酸序列存在于第二核苷酸序列的3’和/或5’非翻译区。
10.病毒颗粒群，其中各病毒颗粒含按权利要求1的第一核苷酸序列及按权利要求1的第二核苷酸序列。
11.产生按权利要求10的病毒颗粒群的方法，该方法包括将以下核苷酸序列引入生产者细胞a)如权利要求1中所定义的第一核苷酸序列群和b)如权利要求1中所定义的第二核苷酸序列。
12.用权利要求11的方法产生的病毒颗粒群。
13.从第一核苷酸序列群中选择所编码基因产物能直接或间接与第三核苷酸序列或其转录产物结合并实现其切割的第一核苷酸序列的方法，该方法包括i)将一或多种第一核苷酸序列引入包含权利要求1所定义的第二核苷酸序列的宿主细胞；并ii)若可检测标记不以活性形式在宿主细胞中表达，则选择出该宿主细胞；并任选的，iii)分离第一核苷酸序列并确定其核苷酸序列。
14.按照权利要求13的方法，其中在步骤(ii)中，可检测标记是选择标记，且宿主细胞与选择标记存在时具细胞毒性的化合物接触。
15.按照权利要求14的方法，其中选择标记是胸苷激酶，而化合物是丙氧鸟苷。
16.按照权利要求13至15中任一项的方法，其中进一步包含选择步骤以去除所编码基因产物能直接或间接与可检测标记编码区结合并实现其切割的任何第一核苷酸序列。
17.按照权利要求16的方法，其中第一核苷酸序列群中的各第一核苷酸序列均位于编码可检测标记无活性变体的第四核苷酸序列的下游。
18.按照权利要求16或17的方法，其中第一核苷酸序列群存在于病毒载体群中，所说的病毒载体含编码可检测标记无活性变体的第四核苷酸序列，并且作为一个选择步骤，将载体群引入一种或多种生产者细胞中，产生的任何感染性病毒颗粒用于步骤(i)中从而将第一核苷酸序列引入含第二核苷酸序列的生产者细胞中。
19.用权利要求13至18中任一项所述方法获得的第一核苷酸序列。
20.含按照权利要求19之第一核苷酸序列的逆转录病毒载体。
21.按照权利要求19的第一核苷酸序列用于治疗。
22.利用权利要求1-9中任一项的选择系统鉴定mRNA分子上的开放位点的方法。
全文摘要
本发明提供了适于体内使用的选择系统,该系统包含:i)所编码基因产物能直接或间接与核苷酸序列或其转录产物结合并实现其切割的第一核苷酸序列群;其中结合所述核苷酸序列所需的第一核苷酸序列的区域在第一核苷酸序列群中是异质的;和ii)第二核苷酸序列,其包含(a)编码与mRNA稳定及/或翻译所需序列有效连接的可检测标记的编码区;及(b)第三核苷酸序列,其位于编码区及至少一个mRNA稳定和/或翻译所需序列之间;其中(a)和(b)与能指导(a)和(b)作为毗邻RNA分子在宿主细胞中表达的调控序列有效连接。
文档编号C12N15/09GK1353769SQ0080836
公开日2002年6月12日申请日期2000年6月2日优先权日1999年6月3日
发明者K·米特罗法诺斯, N·金, E·科特索波罗申请人:牛津生物医学(Uk)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：K.米特罗法诺斯;N.金;E.科特索波罗
技术所有人：牛津生物医学(UK)有限公司
我是此专利的发明人

上一篇：构建dna文库的方法和其上固定有dna文库的支持物的制作方法
上一篇：食品坯料供给方法及装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。