设计与选择天然的siRNA作为基因药物的方法及药物配方的制作方法

文档序号:1131136阅读:429来源:国知局
专利名称:设计与选择天然的siRNA作为基因药物的方法及药物配方的制作方法
技术领域
本发明的领域是一种小分子的双链寡聚核苷酸与一种制造基因药物的方法和过程。
2 最为接近的现有技术状况技术背景计算机芯片的问世把人类的聪明才智刻进了从精制导弹、电子网络到掌上电脑等一系列的高科技产品中,而生物芯片的诞生给人类带来了另一个惊喜,使人们能够看到自身的基因结构、了解癌基因的表达失调以及鉴定老年化过程中基因结构的变化。随着计算机科学和生物学技术的结合,科学家们完成了伟大的人体基因组计划,排出了人体基因组中320亿个碱基的序列,鉴定了基因组中大量的重复序列,推算出了人体基因组中大约含有32000个基因。而这些基因却只占人体全部DNA序列的5%(Pandey,A.et al.2001,Nature 405837-846;Shoemaker,DD et al.,2001,Nature 409922-927)。人体基因组的单核苷酸多型性(SNP)图谱的绘制确定和定位了142万个SNP(The international SNP map working group,2001,Nature409928-933)。生物计算机信息技术和网络高速公路的汇合,使世界不同地方的科学家们能够通过一些公共的基因数据库如BLAST和FASTA进行基因序列的排列,相似性的比较、序列型式的鉴定和高保守片段的检出(Brown SA,2000,Bioinformatics Eaton Publishing)。总之,大量的来自于人体基因组结构和功能的信息资料和快速的计算机处理方式正在构筑一条宽阔的生物信息高速公路。它必将加速研发新型的广谱的直接导向基因组的功能mRNA分子的基因药物。这些改变世界的芯片技术赋予生物医学工作者一种强大的能力,使他们能够同时分析成千上万的基因,就像速读一本生命之书那样。基因测序和基因芯片技术使科学家们了解到,一组异常表达的基因使肿瘤细胞不同于正常的细胞。近来引人注目的来自少见的遗传病的单基因的发现将会让位于明天的惊喜,如易患心脏病或老年性痴呆症的患者是由于基因中的某段基因序列型式的变化(Marcotte,et al,2001,Trends inPharmacological Science 22426-437)。更为令人惊叹的是,这些高技术对地球上每年要花费200兆美金的药物公司的冲击,正在迫使他们研发新一代的药物。这些新药将会因人而异地并高效地治疗不同的疾病,而且能全面地预防那些疾病。更重要的是,它亦将引起一场药物学上的革命,大大地改变药物的形式、靶子和成份。如果说生物芯片允许人们能同时地鉴定一个组织中多种不同基因的表达和了解疾病过程中不同分子事件的发生的全貌,那么,生物计算机信息技术能授予人们更强的能力去快速地发现某一基因中高保守的序列的和特定的序列模式,搜索高特异的DNA片段作为靶子,并以其为模板制成高效的基因药物的活性成份。随着人体基因组图谱的完成,基因数据库能够成为一个搜索基因组信息,比较不同种属间的保守序列,设计有效的基因药物的重要工具。越来越多的网站开始建立其有特色的基因数据库。这些数据库涉及到各种不同疾病的相关基因的信息资料,如有关肿瘤、糖尿病、神经疾患、艾滋病、心脏病、肥胖症、高血压等的数据库(Marcotte,et al,2001,Trends in Pharmacological Science 22426-437)。可见,基因组计划的完成留给人们最大的利益是从已知的基因组序列中,直接地去鉴定潜在的需治疗的靶基因和方便地去设计那些与它们相互补的基因药物序列,而不需要间接地以相应的蛋白质的理化特性和晶体结构为基础来慢慢地研发作用于蛋白质水平的生物药物。显然,下一代生物技术药物必将是对人体功能性蛋白质的基因组的研发所带来的硕果,而不是经典的蛋白质化学给人们的启迪。为什么癌症难以被现有的药物和治疗方法所克服,其答案离我们并不遥远。新的基因芯片技术将允许医务工作者们去分析来自癌细胞的高达65000个基因的表达形式,进而与正常的细胞的基因表达加以比较。数以百万的数据可进行计算机分析,药物与靶子的相互作用也可通过计算机进行模拟。令人兴奋的是,许多有希望的基因疗法正在被设计和开发。科学家们已找到了一个19-25个核苷酸长的双链寡聚核苷酸(SDSO),它们能够真正地高效地灭活其同源的RNA分子的功能。现在主要的注意力已集中到怎样地挑选和定位一个mRNA分子中特异的靶区,将其作为模板来合成高效的基因药物(Lockhart,et al.,2000,Nature405827-838)。自从1998年发现RNA干扰(RNAi)这个现象至今的几年内,它已经变得很清楚这个过程的自然功能是一种古老的生物基因组的防御系统,它被用来对抗诸如转座子、病毒等可运动的遗传物质的侵犯。RNAi,这种最古老、最多能的抗病毒系统,与植物和真菌内转录后基因表达的机制有着密切的关系。在昆虫、蛙类、大鼠、小鼠、猴和人类的体内,继而也被观察到了存在这种RNA干扰(RNAi)现象。在最近的实验中,一种能够使荧火虫发出奇异光芒的酶——荧光素酶基因被导入一组哺乳类动物细胞,包括人类胚胎肾组织和中国仓鼠组织。而相继被导入这些细胞的短链干扰RNA(siRNA)能够有效地降低荧光素酶基因的功能。不久,在平熄诸如前列腺癌细胞内bcl-2基因等几种自然发生的基因的非正常表达方面,RNAi也被证明是卓有奇效的(Carthew,R.W.2001,Curr.Opin.Cell Biol.13,244-248;Bernstein,E.,et al.,2001,Nature,(London)409,363-366;Tuschl,T.,et al.,1999,Genes Dev.13,3191-3197;Oelgeschlager,M.,et al.,2000,Nature,(London)405,757-763)。2.2市场背景各大药品制造厂商研发新型的生物药物的动力来源于下述诸方面在过去十年中,病毒性和真菌性感染在全世界范围内呈现增长的趋势,外加艾滋病不可控制的蔓延。抗人体肿瘤的有效药物仍然寥寥无几,尤其是肝癌、肺癌和白血病等癌症的死亡率居高不下。自然的或获得的对化学药物的抗性在不断增加,以及化学药物的毒副效应的不断出现。无特异而有效的药物能够用于治疗那些遗传性疾患的事实。从外源性的病毒、细菌和真菌的感染,到内源性的癌症、高血脂症、老年痴呆症和其他一些遗传性病症都表明,人体内不正常的基因表达是引起许多疾病的主要原因。医学和健康保健最重要的目的就是着力去发现各种科学的并行之有效的方法,来阻止这些不正常的基因表达,以便有效地控制疾病的发展与传播,直至最终完全彻底地治愈它们。自然,大批有才华和能力的科学家们以及各大药物公司都在着手解决上述问题,企图发现更有希望和更有效益的治疗方法,基因药物毫无疑问地正在成为药物公司致力研发的下一代新药中的明珠。现已清楚,新的生物学技术能够提供对疾病分子机制的更深入的了解,科学家们正在使用RNA抑制和促进子(Promoter)干扰等技术,来鉴定那些与病毒、真菌和细菌的生长、肿瘤的发生以及遗传病的本质有关的基因。自然,当这些基因作为治疗的靶子时,它们同源的核苷酸序列将是最特异和最有效的药物。基于这种设想,新药物的研发在很大程度上将有赖于具有独特作用模式的特定靶基因的鉴定和它们同源核苷酸序列的设计和制作。这种新药的研发方法亦将大大地降低研发的成本和所需的时间。鉴定一个药物与其靶分子相互作用的结构,常常能提供对其药物作用机制的深刻了解,估价这一相互作用的最可靠的方法是通过实验的程序来了解药物与靶复合物的结构,不言而喻,这种实验需要昂贵的器材、苛刻的条件、大量的人力和较长的时间。典型的程序是人们先了解药物分子的物理和化学特性,然后再用它们来寻找与靶子互补的区域,例如,一个携带负电荷的药物分子最可能与一个具有正电荷特性的互补区域的靶子相结合。显然,基因药物本身就能够完美地解决这些困扰新药设计者们的难题,因为基因药物中的活性成份SDSO分子能借助Watson-Crick碱基配对的氢键与其靶子mRNA分子特异地结合,从而高效地抑制mRNA的功能。如果对用RNA作为一种药物的靶子的兴趣是由于RNA某些特性优越于传统的蛋白质靶子的话,那么,战略地研发RNA作为一种药物也许是由于RNA本身还有着比其它生物药物更有用的特性。此外,由于人体基因组计划的完成所带来的大量的有关DNA序列的信息资科,更加使科学家们比以往任何时候更易了解RNA的生物学功能和分子结构如它们的初级和三维结构的特性与变化。再者,现代的计算机技术亦赋予研发者们能够搜索和比较大量的基因序列片段的能力。当所有这些充分而必要的条件与技术结合到一块时,设计和开发新型的基因药物才有可能变为现实,成为二十一世纪药物学上最令人注目的课题。RNA是一类相当独特的靶子,因为它是一种两性生物分子,不但具有携带遗传信息的属性(与DNA相似),还有表现催化功能的活性(如一种蛋白酶)。与蛋白质相似,RNA可以与一些多肽分子或其它小分子结合,调整其特异的三维结构,以获得其独特的生物学功能。不同形式的寡聚核苷酸有一种潜能可作为治疗用的活性药物。其原理是通过Watson-Crick碱基间的氢键与相应的mRNA分子中的一段同源的序列相结合,从而干扰含有这段序列的mRNA分子的生物学功能,利用RNA分子的这一特征配制成的基因药物亦必将能够抑制那些致病基因的RNA分子的表达。因此,这种药物可用来对付肿瘤、病毒性感染和遗传性疾患和用于其它的生物学目的的研究。三个不同的战略方法已被用来进行基因治疗的设计,这三个不同的基因治疗的战略已为大家所关注。这些基因疗法雇用三种不同的RNA核酸酶,即RNase L,RNase H和RNase III。这些酶在一段特异的核酸的引导下,去切断相应的RNA分子,从而使其丧失应有的功能。由于不同RNA核酸酶的激活需要不同的核酸作为激活剂,研究表明2-5A分子、cDNA、和dsRNA能够分别激活RNase L,RNase H和RNase III。一般来说,RNase L可灭活单链的mRNA分子,RNase H切断双链中的mRNA分子(cDNA-mRNA),而RNase III可干扰三链中的mRNA分子(dsRNA-mRNA)。以mRNA作为药靶是一个引人注目的设想,因为mRNA比其相应的基因来更易于接近。最为熟悉的方法是,把一条反意核酸链导入一个细胞,这条反意核酸链能与其靶mRNA形成Watson-Crick碱基配对,杂交的mRNA不再能行使其生物功能,以致杂交的mRNA分子被这个RNase H酶所降解。RNase H酶能够特异地切断RNA-DNA双螺旋中的RNA链。因此,激活的RNase H酶将导致RNA靶子的断裂,由此可提高反意链DNA抑制基因表达的效益。虽然许多研究和临床试用一直在进行着,但是,以反意链作为基因治疗手段的战略遭到许多实际问题的挑战,比如,cDNA分子的稳定性、对核酸酶的抗性、以及其治疗的效果都不十分令人满意。第二个被采用的基因治疗方法是人为地产生一种杂合的核酸分子,它具有一个序列公式,即sp5′A2′[p5′A2′]3O(CH2)4OpO(CH2)4Op5′(dN)m,其公式可简写为2-5A4-Bu2-(dN)m。2-5A分子的5’端含有一个5-monothiophosphoryl基团,此分子与一个反意核酸链相连,反意核酸可与相应的mRNA分子杂交,从而把与2-5A相结合的RNase L酶导向相应的mRNA分子。这样,这个RNase L酶就能把与2-5A杂合链相杂交的那个mRNA分子降解。现研究发现,RNase L是一个非特异性的核酸酶。当它被活化后,能够切断所有的与其结合的mRNA分子,而2-5A则是激活此酶的辅基(Maitra RK,et al.,1995,J Biol Chem27015071;Cirino NM,et al.,1997,Proc Natl Acad Sci USA 941937;Szczylik C,et al.,1991.,Science 253562;Lesiak K,et al.,.1993,Bioconjugate Chem 4467)。近来有实验报告指出,这种杂合的核酸片段,即2-5A反意核酸链,能够有效地控制呼吸道合胞病毒的感染。结果显示2-5A反意核酸链的药效是目前抗呼吸道合胞病毒的最好的药物,即Ribavirin 50-90倍。但是,2-5A反意核酸链的稳定性和抗核酸酶的性能以及其特异性仍有待于进一步地阐明。第三种也是本发明所推荐的方法,是一种RNA干扰技术。现已发现,RNA干扰现象存在于从植物、低等动物一直到人体的细胞中,这些生物体包括植物、原虫、线虫、昆虫、鱼类、鸟类、哺乳类和人类等。RNA干扰是一种最原始的细胞用来对抗病毒、转座子、及其外来遗传物质的天然防卫系统。RNA干扰借助于一种基因特异的双链RNA分子,这种分子在一种核酸酶称为RNase III酶的作用下,转变成一系列的短小干扰RNA分子(siRNA)。一个siRNA分子可特异地与其同源的mRNA分子结合,导致相应的mRNA分子被RNase III酶特异地降解(Fire,A.et al.,1999 Trends Genet.15,358-363;Cogoni,C.& Macino,G.2000,Curr.Opin.Genet.Dev.10,638-643;Matzke,M.A.,et al.,2001,Curr.Opin.,Genet.Dev.11,221-227;Zamore,P.D.,Tuschl,T.,Sharp,P.A.& Bartel,D.P.2000,Cell 101,25-33)。本发明采用体外扩增这些天然的细胞内自有的siRNA分子方法,然后将治疗量的多种不同的作为基因药物中主要的活性成份的siRNAs导入细胞来治疗那些由于某些基因过度表达所引起的疾患。因此,本发明的基因药物有下述与众不同的特点,它们包括但不局限于1.全新的理论采用天然的存在于活细胞中的siRNA分子作为治疗特定疾病的基因药物。
2.高度的抗性采用19-25个核苷酸长的双链寡聚核苷酸,避免了单链寡聚核苷酸易被核酸酶降解的缺点。
3.特异的靶导采用人体基因库搜索方法,精选特异的siRNA分子为活性物质。这些siRNA分子与同一家族基因的mRNA分子中的特定片段100%的相同。
4.高效的灭活用具有三个强的酶切点为中心的siRNA分子,能够确保高效地切断相应的mRNA分子。
5.长效的作用由于siRNA分子可能具有自我复制的能力和使相应DNA片段甲基化的能力,其生物效应在活细胞中可能持续较长时间。
6.满意的治疗不同种类和不同剂量的多种19-25个核苷酸长的双链寡聚核苷酸分子可形成无限的组合来适应不同疾病和不同患者的需要。
3 发明的目的及要解决的问题本发明集RNA干扰技术、人体基因库搜索技术、生物计算机信息技术、生物芯片技术和基因工程技术为一体,来研发和配制一种天然的基因药物。本发明的两个主要目的在于● 提供实用而系统的方法。这些方法涉及研制基因药物的一系列的过程,它们包括怎样筛选、预测、鉴定、合成、配制和组装一种天然的基因药物,以及怎样治疗动物和人的多种不同的病毒性感染、肿瘤和遗传性疾病的相应方案。其中,特别推荐一种预测和精选高效的、短小的干扰性双链寡聚核苷酸(SDSO)的简便方法。● 描述一系列的基因药物的有效成份的配制,特别是19-25个核苷酸长的双链寡聚核苷酸。SDSO的结构特征包括一个以腺嘌呤开头,以胸腺嘧啶或尿嘧啶结尾,中间含有三个强的酶切割位点的双链寡聚核苷酸。特异的SDSO分子能与其同源的核酸相互作用,从而抑制相应的RNA分子的表达和调节含有同源DNA片段的基因的功能。
本发明亦详尽地阐述一些基因药物的药效成份,也进一步地提供治疗和预防某些顽疾和人或动物易感的某些疾患的方法。这些疾患可通过给予不同剂量和不同型式的本发明所说的一种或数种19-25核苷酸长的双链寡聚核苷酸,达到治疗和预防的目的。
本发明要解决的问题主要包括基因药物的特异性,高效性和稳定性。本发明的基因药物是天然存在于活细胞内的SDSO分子,它是一种短小的双链的寡聚核苷酸,具有一个强大的酶切中心和极高的特异性。当多种不同类型的SDSO分子与其他的辅助成份组装成基因药物时,这些基因药物与其他的生物药物相比,能够展现出下述多种优点(1)全新的设计和研制理论细胞内存在着一种天然的RNAi保护系统。这一系统中的效应成份可在体外通过生物工程的方法加以放大和增强,然后将其输回生物体内。它能特异并高效地灭活那些同源的致病基因。本发明的效应成份中的序列型式CGGAU(T)、CGGGA或它们的衍生序列是设计和精选高效的SDSO分子作为基因药物的重要指标。(2)较短的新药研发周期借助计算机和基因芯片等技术,精选特定的mRNA序列中的最保守的部分作为基因药物的靶子,而其同源的序列作为基因药物的活性成份。这一新的研发战略能够大大地减少用于研究一种药物分子的化学和物理性能的时间,和找出它在靶分子上的作用位点的时间。(3)较低的药物研发成本研究一个新药和与其靶分子之间的相互作用常常需要高额的研究经费和大量的研究时间,快速的计算机运算方法和公共的基因数据库的免费使用,将能明显地降低研发新型的基因药物的成本。(4)极高的特异性本发明能够筛选出特定mRNA序列中的最具潜能的靶片段,用其同源的SDSO作为基因药物。它们通过经典的Watson-Crick碱基配对的原理相互识别和作用。再者,选出的片段只被相同基因家属的成员所共有,而与其它基因家属的成员仅有极少的相似性,从而使药物的特异性得到充分的保证。(5)极低的毒副效应本发明的基因药物中的主要活性成份是一种天然的核酸片段,它存在于从低等动物到人体的细胞中。由于其高特异性和高效性,使其用量明显地低于其它的药物。显然,其毒副作用也远远地低于其它的药物。(6)较高的稳定性本发明的SDSO分子是一种双链寡聚核苷酸,能够与一些蛋白质和其他小分子相互作用,有比其它单链的核酸如cDNA有好得多的稳定性。它能有效地抵抗核酸酶的降解,易与一些蛋白质形成稳定的复合物。其某些碱基也易于修饰,用于增强抗核酸酶的性能。(7)多种用途本发明的基因药物是一种不同类型、不同剂量和多种SDSO分子的混合物。它们能够根据病人的具体情况和疾病的严重程度加以调整,并可制成不同型式的制剂,用于不同的途经,将会开创为每一病人诊病开药的新时代。(8)高效性能高效地打断相应的mRNA分子并能同时灭活数种不同的致病基因是本发明基因药物的一个特点,这一方法学上的突破尤其适用于癌症的治疗和预防,病毒和真菌所造成的顽疾以及那些难治的遗传性疾患。(9)高抗突变性根据数学概率论的原理,一个核苷酸的突变在一短小的序列中发生的可能率必将大大地小于在一段很长的序列中的概率。此外,本发明的基因药物中亦可含有抑制抗药性基因的SDSO分子。4 发明的具体技术方案基因药物也许不久将成为世界上治疗不同疾病的领头药品,在美国,基因治疗正处于不同的研发阶段,从研究、开发到临床一、二、三期的试用。现已发现反意链治疗战略存在着一些明显的弱点,如不稳定性和低效性。许多有识之士正开始试图找出更为合理的方法来配制一种具有高效性和高稳定性的基因药物。为了达到这两大目的,一个全新的有关战略思路已被提出。那就是配制一种天然的高效而又稳定的基因药物。这一战略设想充分体现了我们在分子水平上对基因治疗的各种方法有了更好地了解、对以mRNA和其它RNA分子为直接药靶的兴趣和信心、以及对自然选择和计算机选择出的最具潜能的基因药物能做出更全面的估价。随着人类对疾病的基因序列和人体基因组的认识的逐步提高和对计算机科学、生物芯片及siRNA干扰技术全面掌握和应用,一种全新的治疗方法将被用于治疗那些困扰人们以久的艾滋病、肿瘤、老年性痴呆和其它多种遗传性疾患。本发明的对基因药物的精选和鉴定的方法将能保证所配制的基因药物的安全、特异和有效、及最终能治愈有关的疾病。本发明也阐明基因药物的关键成份的配方和相应的配制方法,亦将详尽地描述系统地和简便地精选基因药物的完整过程、用本发明的基因药物来治疗那些目前尚不能医治的疾病的有关实例和应用以及用本发明的基因药物中的活性成份来预防疾病、促进健康和美化容貌的可能。
5.1 名词术语在本发明的上下文中,术语“基因药物”是指一种或多种不同量的带有一个酶切割中心的双链寡聚核酸(SDSO),和相应的能将这些SDSO分子导入一个动物尤其是人的特异的细胞并在药效上能够接受的一种生物膜载体的混合物。术语“基因药物”进一步也包括那些裸露的SDSO分子和/或其它的辅助成份的混合物。它们可直接用于临床治疗,疾病的预防和基础研究。
如这里所用的术语“双链寡聚核苷酸”是一种含有核苷酸的多聚体或寡聚体的双体。如一个双链的RNA分子(dsRNA),一个双链的DNA分子(dsDNA),一个双链的sRNA-cDNA杂合分子。此术语进一步包括由天然的核苷酸、糖和共价的核苷酸之间的连接,以及经过修饰的或非天然的核苷酸所组成的寡聚核苷酸。这些寡聚体中的每一种类型以及他们的无数的衍生物已被广泛报道。那些被修饰或替代的核苷酸常常优越于自然的核苷酸,如被用来合成相应的寡聚核苷酸,其产物可能有更强的抗酶解性能,更好的被细胞摄入性能和更高的与其靶核酸的亲和性能。
如这里所用的术语“双链的RNA分子(dsRNA),双链的DNA分子(dsDNA),双链的sRNA-cDNA杂合分子”是指一种核酸双体。它们的每一条链由19-25个核苷酸组成。它们可被简写成SDSO分子。本发明的这种SDSO分子能够有效地灭活一个细胞中同源的RNA分子。本发明的SDSO分子包括但不局限于那些phosphorothioate寡聚核苷酸和其它的经过修饰的寡聚核苷酸。
如这里所用的术语“特异的SDSO分子”是指一个具有19-25个核苷酸长的特定核酸双体。它的正意链与其相同基因家族的大部分或所有成员的某一DNA片段100%的相同,而与其它基因家族的基因序列没有或者只有不到80%的相似性。它的反意链可与相应的mRNA分子杂交,引导RNase III酶特异地降解这一mRNA分子,而不会灭活其它RNA分子的功能。几线的研究报告已指出如果siRNA分子与其靶mRNA分子间有一个以上的核苷酸不同,那么这一siRNA分子就不能抑制那个靶mRNA分子的活性。
如这里所用的术语“高效的SDSO分子”是指一种短链寡聚核苷酸双体。它包括一个酶切割中心,这个酶切中心的序列包括但不局限于CGGAU(T),CGGAA,CGGAC,CGGAG,CGGGC,CGGGA和CGGGU(T)。这些序列含有两到三个高强度的酶切位点,它们是GG,GA和AU。因此,含有两到三个高强度的酶切位点的SDSO分子能够引导RNase III酶高效而特异地降解含有同源序列的mRNA分子。
如这里所用的术语“同源核酸或同源序列”,包括那些能编码蛋白和其它功能的RNA的DNA分子,从这些DNA产生的RNA分子包括未成熟的mRNA,成熟的mRNA和其它RNA分子以及这些DNA分子中的相同的片段。一个SDSO分子与靶核酸的相互作用将能影响这个核酸的相应功能。这种由SDSO分子介导的靶核酸功能的抑制通常被定义为“RNA或DNA干扰”。RNA被干扰的功能包括那些mRNA的转录,RNA的转位(从核内到具产生蛋白的地方)RNA的拼接(产生一种或多种mRNA分子),RNA的转译和其它由RNA介导的特殊功能。DNA被干扰的功能包括,DNA的复制、转录、修复和重组。这些靶核酸被干扰的最终结果是,合成蛋白或多肽的mRNA的降解,其它RNA分子的特殊功能的灭活,以及同源DNA序列的甲基化。虽然SDSO分子能特异地与一个或多个同源的核酸相互作用,具有较高的稳定性和有效性,但本发明的宗旨主要在于抑制那些基因组的RNA分子的功能,从而能够防范和治疗癌症、病毒性感染和遗传性疾患。本发明所涉及的核酸分子包括但不局限于mRNA分子,它们是● 编码癌基因产物的mRNA,如H-ras,K-ras,N-ras,C-myc,rhoB,BRCA1&2,mdm-2,p-53,p-21,● 编码生长因子的mRNA,如EGF,HGF,IGF-1&2,NGF,PDGF,TNF,VEGF,alpha-FGF,beta-FGF,TGF-alpha,TGF-beta,GGF,● 编码生长因子受体的mRNA,如EGF-R,HGF-R,IGF-1&2-R,NGF-R,PDGF-R,TNF-R,VEGF-R,alpha-FGF-R,beta-FGF-R,TGF-alpha-R,TGF-beta-R,GGF-R,HuH-7,● 编码信号传递分子的mRNA,如PKC-alpha,Stat3&5,CDK-2&4,Ras,Raf,FAK,Src,MEK,CDKN2A,● 编码激素受体的mRNA,如estrogen(SERMs),progesterone,testosterone,aldosterone,corticosterone,● 编码成活分子的mRNA,如BCL-2,BCL-6,BCL-xl,Telomerase,● 编码与细胞定位有关的mRNA,如Integrins,E-cadherin,● 编码与有关的mRNA,如Cytokines,Interleukins,interferons,● 编码与有关的mRNA,如CD401/CD40,ICAM-1/LFA-1,Hyalurin/CD44,● 编码与遗传疾患有关的mRNA,如LDL-R,Amyloid protein,WNKs,● 编码病毒有关的蛋白质的mRNA,如RSV,HPV-16&18,EBV, Protease(PROT),polymerase(POL),integrase(INT),gp120 and gp41,transactivating protein(TAT),regulator of expression of virion protein(REV),and viral infectivity factor(VIF)。
5.2 鉴定与疾病有关的mRNA分子正常与不正常的人类基因组序列数据库的使用和强有力的生物芯片技术的发展,允许专家们能够迅速地鉴定那些在任何病患组织和细胞中的基因分子和那些不正常表达的转录产物,和有针对性设计特异的基因药物。这些高新技术也使人们能够更好地了解RNA分子和蛋白质的各个方面。本发明中的基因药物的活性成份能够通过生物芯片技术和科学文献中报到的其它方法加以确定和选择。
生物芯片技术正在赋予人们深入了解癌症真正本质的方法,使人们认识到癌症不是一种坏基因的产物,而是一组不正常表达的基因所共创的恶果。在最近几年中,科学家们已鉴定了许多癌症的细胞中许多基因表达模式的改变。这些癌症包括白血病、淋巴瘤、前列腺癌、乳腺癌、鳞状上皮癌、黑色素细胞癌、脑瘤等。一些专家们以能够决定哪些癌细胞可能应答目前的治疗和哪些不能应答。此外,研究者们也认识到癌细胞是被一组基因而不是被单一的基因控制着它们的发展,维持扩散与转移。这些发现将为基因药物的设计和配制提供必要的信息资料。显然,进一步地在这些致癌基因中精选出最有效的靶序列,设计相应的SDSO活性成份,然后把它们组装成一种特效的基因药物,是本发明的宗旨所在。
现在已很清楚,随着生物芯片技术的不断完善,准确地检测出所有基因表达形式的变化将成为可能。越来越多的生物公司正致力于发展新一代的基因芯片技术来识别细胞中在特定时间内哪些基因在开启、而哪些基因在关闭,找出哪些基因表达的改变涉及到肿瘤的发生、发展和转移,和鉴定哪些基因与遗传疾患有关。再者,有些公司正在研发将生物芯片作为常规的方法来诊断一般的疾患,例如人的体液和血液经过一定的处理后,可用于专门的生物芯片,以致于一滴病人的唾液,就可诊断患者是得了病毒性感染还是细菌性感染。同样,用生物芯片检测一滴来自于一个有癌症家族史病人的血液,就能知道患者是否已遭癌症攻击。在临床应用上,生物芯片技术已被用来比较患有黑色素细胞癌的病人是否易于遭到肿瘤转移的威胁或是易于得到病情恶化的结果。
本发明使用生物芯片的主要目的在于鉴定在一个不正常的细胞中哪些基因过度表达,其中哪些是直接导致疾病的关键基因。由于并非所有的高表达的基因都会产生过量的蛋白质或多肽,一个蛋白的合成和其量的改变也许是一个可靠地反映其基因是否过度表达的指标。它可被用来更准确地估价相关基因的功能变化的危险性。本发明中基因芯片和蛋白质芯片的结合,必将提供更全面而特异的检测信息。比较正常与异常细胞和/或组织中基因表达与蛋白质合成的变化,比较它们在患者不同时期的变化以及一种基因表达与其蛋白质合成之间的差异,必将为我们精选靶RNA分子和设计相应的SDSO分子作为基因药物提供有价值的信息和依据。
5.3 鉴定内源性siRNAs在获得有关靶基因和它们的RNA转录子的信息后,本发明引入一个能够有效地搜索内源性RNAi基因…一个SDSO分子的模板的方法。鉴定内源性RNFA干扰基因是搜索一个特异的基因组DNA序列作为高效的基因药物的活性成份的关键步骤。因为内源性RNA干扰基因含有一个21核苷酸长的特异序列,它能有效地抑制相应的mRNA的功能。这一序列经过漫长的自然选择与进化的长河,始终保留着原有的核苷酸的组成和顺序。因此,内源性RNAi基因是作为基因药物的最好的选择。同时,它也能节省搜索特异的基因组DNA序列作为高效的基因药物的活性成份的时间。
虽然人类基因组序列的完成提供了一个研究大多数编码蛋白的基因,tRNA,和rRNA的生物信息库,但仍有困难去迅速鉴定那些非编码蛋白的基因。尤其是这些新型的内源性RNA干扰序列长期地被忽视,而无独特的识别标志。本发明提出RNA的高保守序列,特别是干环状结构可用作为一个重要的识别标志,它可被用来筛选RNA干扰序列,因为RNA干扰序列必须含有一段反向互补序列。本发明使用现有的计算机软件方法如折叠排序法(FOLDALIGN)和其它能够预测RNA的干环状结构的特殊计算机软件在人体基因组信息库中搜索RNA干扰分子。此外,其他多种方法也是有用的,如计算机寻找具有小分子RNA所共有的特怔性的结构,微阵列测定在基因间和它们的内含子区内的互补序列,和从与RNA结合的蛋白质如脱胺酶(一个siRNA结合蛋白)中分离RNA分子。总之,在人体基因组信息库中搜索是否存在着相应的内源性RNA干扰分子是精选特异的SDSO分子的模板的一个关键的步骤,因为天然的RNA干扰分子是作为设计相应的基因药物的最好原形型。
RNA干扰被定义为一类RNA分子,它们并不编码一个完整的开放阅读框架,这些来自不同种属的RNA分子具有高保守的序列。例如,人和线虫的RNA干扰基因几乎完全一样,有着大于95%的高保守序列,而一个典型来自不同种属的编码蛋白质的基因,常常只有不到70%的相似性。根据序列保守程度随机地从非编码基因区域或基因的内含子区域内筛选RNA干扰序列是一种可行的方法。因此,本发明提出筛选RNA干扰序列标准是(1) RNA的干环状结构,(2) 高保守的干部区域,(3) 干部区域的长度为19-25个核苷酸,(4)此序列位于编码基因间区或编码基因的内含子区。
所有可能的RNA干扰分子都来源于基因间区或基因的内含子区,至今,有关所有种属的基因间区的DNA序列信息和资料尚不完整或完全缺少。这构成了搜索相应RNA序列的主要障碍。然而,现已存在一些正在发展的人体基因库和专门的软件。这些专门的软件采用的原理是大家熟知的那就是,一个核苷酸的第一区域,可能互补于同一核苷酸的第二区域,这两个区域以反向平行的方式排列。第一区域中的一个核苷酸能够与第二区域内的核苷酸配对。当第一和第二区域以反向平行的方式排列时,第一区域内至少有95%的核苷酸与第二区域内的核苷酸配对。这两个区域的长度大约跨越19-25个核苷酸长度。最理想的是第一区域中的所有核苷酸与第二区域中的所有核苷酸互补。如第一区域中的一个腺嘌呤与第二区域中的胸腺嘧啶或尿嘧啶以反向平行的方式形成氢键连接。相似地,第一区域中的一个胞嘧啶能与第二区域中的鸟嘌呤也以反向平行的方式相配对。例如,let-7,一个RNA干扰基因位于一个基因间区。根据序列保守程度和保守序列的长度,对来自于人体、线虫和果蝇的这一基因间区的序列进行比较测定,结果发现let-7含有一个21个核苷酸的高度保守序列,可获得最高的得分,BLAST42(图1)。根据文献资料,来自不同种属的大多数促进子区域不可能获得这样的高分和具有所有这些结构特点。序列1显示了一套由BLAST搜索出来的人体let-7干扰序列,它位于不同的基因间区,它的21个核苷酸几乎与来自线虫和果蝇的这一基因的序列完全相同。由此可见,基因间区的一个干环状结构和21核苷酸长度的高保守DNA序列可以作为鉴定一个RNA干扰序列的标准。
5.4 用结构同源分析来搜索高保守的序列如果在现有的人体基因数据库中不能检出所要的RNA干扰片段,有必要进行一个基因家族的同源性序列的分析,以搜索相应基因家族的所有成员。在搜索这一步中,主要的任务是搜索不同种属的某一基因家族的大多数成员或全部成员所共享的结构同源序列。结构同源性是一个大分子三维结构的属性。它密切相关于一级结构的核苷酸组成和排列顺序。高保守序列(Motif)含有最重要的遗传信息,这些信息在进化的过程中被持续地保存下来并展现在保守序列之中。它通常由特定的序列和一定的结构限制组成,既使其初级结构的某些部分已发生变化,其整个结构也能得到保留。搜索特殊的基因片段的一个重要的注意事项是,在不同的种属的同一基因家族中找出高保守的序列和在同一基因家族的不同的变种中鉴定出特殊的序列型式(Pattern),而这些保守序列和序列型式却很少为其它基因家族所共有。例如为了灭活一种癌基因家族中的所有成员,必须能够鉴定出哪一段序列为所有的成员所共有。这样当选出的这段序列作为基因药物的活性片段时,它能有效地灭活这个家族中的每一个成员。这个特点非常有利于治疗那些基因变异较大的疾患。如不同的病人携带着同一基因的不同变异体,本发明的基因药物就能同样程度地医治这些病人的疾患,否则,只能用于某一病人,而对其他病人无效。
多序列排列程式能够在不同种属的同一基因中检出共有的序列,对于两个以上的序列排列来说,归纳型程式是最合适的选择,通常多序列排列首先用进行型排列程式来完成。这些计算机程式运算较快,不需要容量较大的基因芯片,这样在微机上就能运行。在所有使用这种程式的软体中,首推CLUSTAL W和MUSCA最为好用。CLUSTAL W也可以用来排列多条序列的某一特定区域,而不需要改变其它部分的排列。如果在第一次要求的排列中,所有的序列的全部都显示出彼此的相似性,那么,这一定是最好的结果,不必再用其他任何的软体来加以确定。本发明所排列的基因序列是用BLAST算法程式从不同的种属基因数据库中得到(图2),例如,来自不同种属的IGF-2基因的所有成员的序列在CLUSTAL W软体中加以排列,所得到的排列结果可进行人工的精确调整,以反映共同的保守区域,最后,IGF-2的序列排列可作为进一步的分析和应用的基础(图3和图4a)。
然而,如果遇到一些高度差异的序列,如含有大的缺失,或不良的保守区域,有必要使用不同的方式或不同的软体来比较所得到的结果,图5显示两个共享的同源区段被一段非保守区段分开,这种情况常常发生在基因组DNA序列中,如使用进行式的排列程式,特别易产生错误。主要由于逐步比较法对较长缺失倾向给与较大的判罚指数。为了避免这一缺点,BLAST的两序列排列程式是最好的选择。序列搜索相似性的灵敏度还可以通过根据保守序列的大小平衡所选区域的长短来加以改善。这样,一但几个同源的序列被鉴定,使用BLAST的概貌搜索方法,能够排列出那些相距较大的同一基因家族的不同成员的序列。
5.5 用人体基因组的序列型式分析来精选所要的序列在这部分,有必要搞清楚哪些高保守区域不但被同一基因家族的不同成员所共有,而且被其它的基因家族所共享。一个分析序列的方法是先将这一序列分成不同的段,而这些不同的段属于不同的基因家族,它们在进化上,结构上,或功能上是相关的,并保留着它们共有的特征或型式。现已知道高度保守的DNA序列一定涉及到某一种重要的功能,而这一序列的型式可用来区别家族的成员和非成员间的差异。结合序列型式的发现运算法和严格的多序列排列程式,可以提供一种有效的方法来鉴定反映家族间差异的序列和家族内共有的区域。最后,这种只存在于一种基因内的恒定的序列型式将被用作本发明中选择基因药物的活性成份的基础。
为了检出同源的DNA序列,可用BLAST和FASTA搜索引擎来检索与它们相匹配的数据库,如Genebank,Swiss-port EMBL。这些数据库都经过专门的整理和良好的组织,具有目前所有发表的核苷酸序列,检索非常方便。但至今仍不可能只依靠一个数据库中的注释来查到同一基因的所有的同源序列。近来最有效的方法是,取出同一基因家族的某一成员,作为的提问序列,然后开启相应的计算程式,与数据库中的每一序列加以比较,最终得到所有的同源序列。在本发明的一系列的独立的试验中,一个特异的DNA序列如IGF-2被用来寻找相应的转录子,在这一转录子中有一段siRNA的同源序列(图2)。这一序列可用来作为基因药物中的个活性成份,用于抑制IGF-2 mRNA的功能,即阻止其合成相应的IGF-2蛋白序列。因此,本发明推荐用BLAST搜索引擎在NCBI人体基因库中寻找相应的同源序列。此外,为了保证一个更全面彻底地搜索,另一个方法也是可行的,那就是用在第一步鉴定的来自不同种属几个差异较大同源序列来重复地进行这个寻找过程,直到发现所有的同源序列。在进行BLAST搜索后,它会指出有多少序列被比较过,有多少序列与提问序列有不同程度的相似性。在BLAST搜索的结果中,有一定相似性的序列被按它们相似程度的大小从上而下地进行排列。根据得分的差异,具有最高相似性的序列组能够一目了然地看到,来自相同基因家族和不同基因家族的成员的数目能够累计算出。比较不同的搜索结果,能够精选出最好的序列,它与其基因家族的大多数成员或全部成员具有的共同的序列型式,而与其他基因家族的成员只有较少的相似性,并且所有序列相似总数也是最低的。
5.6 通过特异的切割模式来选择SDSO序列本发明有关特异序列的另一个问题是序列中的核苷酸的数目的排列顺序以及特别的序列型式。嘌呤丰富的双链寡聚核苷酸,特别是那些含有四个鸟嘌呤碱基的双链寡聚核苷酸,在生理条件下,具有形成稳定的四聚体结构的倾向。单链寡聚核苷酸中的鸟嘌呤没有双链寡聚核苷酸中的空间限制,因此,能够形成一些非Watson-Crick碱基配对中各种氢键,于是会生一种大家熟知的四聚体,即鸟嘌呤四体。这种四体的解离率是非常低的,所将会影响与其靶mRNA分子杂交,导致基因药物中的活性成份失效。另一个有趣的是RNase III核酸酶似乎更喜欢有多个尿嘌呤的寡聚核苷酸。这样,如果一个19-25个寡聚核苷酸含有较多的尿嘧啶,它们间的亲和性也许有所增强。特异的结合和高效的切割是设计和精选一个有效SDSO分子的最重要指标。本发明有机地把一组强大的酶切割位点和高特异的序列整合为一体,作为基因药物活性成份的基本结构。同时也提供一种简化的方法,便能够正确地预测一个高效的SDSO分子。这简化的选择方法主要以一酶切割中心为种子,然后在其两边分别向两侧延伸大约7个核苷酸长度。这个酶切割心包括一套切割位点的序列,它们由CGGAU(T)、CGGGA和它们的衍生序列所组成。几组研究已表明,RNA核酸酶(RNase III)能够在GG,GA或AU之间快速地切断它们间的共价键,使一条完整而长长mRNA链变成两条相应短小的核苷酸链,从而丧失其转译蛋白质的功能。这个酶切中心的CGG序列也许是一个甲基化酶的作用中心,它将在调节DNA的功能中挥一定的功能。可见,本发明提出的酶切中心不但有利于预测有效SDSO分子和节省挑选和搜索有关特异顺序的时间,而且也为探索调节基因组功能开辟了另一途径。
仔细地分析一个酶切中心后可发现每个中心有一个核心序列,即CGG。CGG是一个高保守顺序与预测序列的高特异性密切相关,如果改变CGG,甚至只改变CGG序列中的C,就会引起SDSO序列特异性的根本变化,总的来说,非特异性的配对或部分的互补序列就会增多(表1和表2)。酶切中心结构的衍生序列主要由于此序列中第四和第五位核苷酸替换所致。即使第四位可以是A、C、G或U,但最好的选择是A和G,这是因为这两个核苷酸不但能与他们前一个核苷酸G形成一个强的酶切割位点,而且它们也密切地相关于SDSO分子的特异性。虽然有时第四位是C或T也能选出较特异的SDSO分子,但有较大的可能选出大量的非特异性的序列(如表3和表4)。同样,第五位的核苷酸亦可是四个核苷酸中的任何一个,但是T和A分别能与第四位的A和G组成强的酶切位点。这里不同的核苷酸对SDSO分子的特异性影响较少(如表3和4)。总之,本发明用来预测一个有效的SDSO分子的酶切中心的序列成员,包括但不局限于CGGAU(T)、CGGAA、CGGAC、CGGAG、CGGGA、CGGGC和CGGGU。换句话说,含有上述任一酶切中心的SDSO分子,可选作基因药物中活性成份的候选者,它们将能有效地灭活相应的mRNA分子。
本发明中的特殊酶切中心是CGGAU(T)、CGGGA或它们的衍生序列,这些中心位于SDSO分子的正意链上,而它们的互补序列,AU(T)CCG、U(T)CCCG及它们的衍生序列必须位于反意链上,酶切中心的第二个G应位于SDSO分子的开端下游的第十或第十一位上,因为RNA核酸酶(RNase III)通常在第十或第十一位上打断与SDSO分子互补的mRNA分子或其它RNA分子。可见,簇化的酶切位点有利于保证酶切割的效率和成功率。
5.7 选择一个特异而高效的SDSO分子的简便的方法除上述系统地搜索和精选一个有效的SDSO的复杂的方法外,本发明亦提供一个简便的预测一个能有效地抑制相应基因表达的SDSO分子的方法,此方法的特点主要是决定SDSO分子的反意链是否能与同源基因的RNA分子上的某一序列完全互补。这一序列并含有一个酶切中心如CGGAT,CGGGA或它们的衍生序列。
此方法的第一步是搜索一个特定基因组DNA中哪一段序列含有一个酶切中心如CGGAT或CGGGA或其它相应的酶切中心,SDSO分子的反意链上应有一段与酶切中心的互补的序列,如AU(T)CCG或U(T)CCCG。这一含有酶切中心互补序列的核苷酸片段,能够与相应的基因组DNA序列的RNA分子杂交。
第二步是排列酶切中心在SDSO分子上的位置。通常是将SDSO分子上酶切中心的第二个G和与其互补的C置于SDSO分子上的第十位。
第三步是以此酶切中心为中心向其两侧延伸7个核苷酸,从而得到一个19个核苷酸长的SDSO分子。
第四步是以此序列为提问序列,去人体基因库中搜索其它相似的序列,从而得到一系列完全相同或部分相同的序列。
第五步,比较不同提问序列所得到的结果,以能找出大多数或全部同一基因家族的成员,而只能找出极少或不能找出任何与其它基因家族的成员相似的序列为当选序列。
第六步,在所有的当选序列中,以开端为腺嘌呤,或其前一个核苷酸为腺嘌呤,结尾为胸腺嘧啶者为最佳选择,作为基因药物的活性成份。
现已发现具有酶切中心的序列能够展示出其高度的特异性,它不含有或只含有极少的与其它基因家族成员相似的序列。本发明已证明SDSO分子的反意链上的酶切中心的互补片段,如AUCCG是一个可靠的酶切标志,它能保证所选的SDSO分子能高效地灭活相应的mRNA分子。这样,有理由推荐基因组DNA序列上含有酶切中心的片段,可用作为设计SDSO分子的理论基础。充分地认识到一个有效的SDSO分子上酶切中心的生物学意义,体现了本发明方法学上优越于过去的设计方法,SDSO分子上酶切中心的存在,也反映出此分子在抑制相应的RNA分子的表达的高效性和高特异性。本发明将举例描述本方法的实际应用(表1、2、3和4)。
下述表格显示以酶切中心为标志来精选一个高特异的SDSO分子的例子。具有酶切中心的一些寡聚核苷酸被用来在人体基因库中寻找其它完全或部分相同的序列,一个选出的SDSO分子的特异性可以用下述方法加以估价。方法是用一个SDSO分子作为提问序列,将其与人体基因库中的大约960000个不同的序列加以比较,由其所有寻找出来的完全或部分相似的核苷酸序列根据它们相似性的不同程度可被分成三组,第一组是100%的配对,第二组是80-95%的配对,第三组是小于80%的配对。下列每张表中的每个特定基因都有一个专门的接近人体基因组序列数据库的代号,每一个SDSO分子都有相应的序列代号、被找出的序列的总数、以及不同序列的起点与终点、序列中的碱基成份、酶切中心和不同程度配对的数目。在配对程序栏下,m表示同一家族的成员,n表示非同一家族的成员,数字的大小代表序列的多少。根据所找出的不同相似的基因序列的多少,对选出的SDSO分子加以比较,就可能估计出所选SDSO分子的特异性和灵敏性的高低。
表1和表2显示了由三个字母即CGG形成的酶切中心中的核心,如果这个核心序列中的C被其它的A、G、或T所取代,那么找出的序列总数就会增高。表1. 人amyloid beta(A4)前体蛋白(gi|14780094)
表2显示了由三个字母即CGG形成的酶切中心中的核心,如果这个核心序列被其它序列所取代,那么找出的序列总数就大,反之就小。比较由CGGAT或由其它序列所组成的酶切中心可以发现以本发明中所推荐的酶切中心为标志来精选的VEGF siRNA具有高得多的特异性。表2. 人血管内皮细胞生长因子(gi|15422108)
表3和表4以人BCL2和人蛋白激酶为例来说明构成酶切中心的CGGAT,CGGGA或它们的衍生序列对精选一个PRKWNK4的siRNA分子的特异性的影响。仔细观察可以发现酶切中心序列中第四和第五位核苷酸可以改变。即使第四位可以是A、C、G或U,但最好的选择是A和G。虽然有时第四位是C或T也能选出较特异的SDSO分子,但有较大的可能选出大量的非特异性的序列。表3. 人BCL2,B-cell CLL/lymphoma 2(gi|13646672)
表4. 人蛋白激酶,lysine deficient 4(PRKWNK4),mRNA(NM 032387.1 GI15277311)
5.8 SDSO分子的灵敏度和特异性虽然有关一个反意寡聚核苷酸的特异性和灵敏度估价方法已有许多报道,但是随着人体基因组DNA序列数据库的建立和生物计算机信息技术的发展,一些新的概念要求阐明。为了估价一个SDSO分子对人体基因库的灵敏度或特异性,Matthews相关系数,一个通常用于生物计算机信息的度量方法,它可被用来估价一个有效的SDSO分子的预测结果和定量分析和预测的SDSO分子与人体基因库搜索结果的一致性。本发明中所提及的一个SDSO分子的灵敏度系指它与一个特定基因家族成员共享全部或部分序列的可能率,而其特异性则指它与其它基因家族成员之间共享全部或部分序列的概率。其它有关的术语和定义如下真阳性(TP)是对一个SDSO分子同源性测定的阳性结果,它表明一个特定基因家族的成员与其它有全部或部分序列的相似的概率大小。
真阴性(TN)是对一个SDSO分子同源性测定的阴性结果,它表明其它基因家族的成员没有与其序列全部或部分相似的可能性。
假阳性(FP)是对一个SDSO分子同源性测定的阳性结果,它表明其它基因家族的成员有与其序列全部或部分相似的可能性。
假阴性(FN)是对一个SDSO分子同源性测定的阴性结果,它表明一个特定基因家族的成员没有与其序列全部或部分相似的可能性。
在本发明的上下文中,一个特定的SDSO分子的灵敏度和特异性相关于一个序列的长短,一个保守区域的属性和相应的RNA分子中酶切序列型式的变化,众所周知,当一个寡聚核苷酸序列的长度变短时,这个序列与人体基因组数据库中其它同源序列相似性的可能性就会上升,例如一个有20个核苷酸组成的序列,当人体基因组数据库中其它同源序列与其中核苷酸配对的数目从20个下降到10个时,它将会从人体基因组数据库中寻找到越来越多的同源序列。换句话说,这一寡聚核苷酸分子寻找到同源序列的假阳性(FP)将会增加,而其特异性将会降低。当一段高保守区域被一特定基因家族成员所共有,并且也为其它基因家族成员所分享时,与这段高保守区域中某段序列相同的一个SDSO分子就不但能与这种特定基因家族的成员的转录子杂交,而且也能与其它基因家族所编码的mRNA分子相作用,所以,这一SDSO分子就会有较高的灵敏度和较低的特异性。在酶切中心序列型式差异方面,只要一个SDSO分子含有任一酶切中心的序列,即CGG AU(T)、CGGGA或它们的衍生序列时,它就可能获得较高的特异性,反之,如采用其它序列为酶切中心,在大多数情况下,那一个SDSO分子就会得到可能较高的灵敏度和较低的特异性。总之,如果想要一个SDSO分子获得最高的特异性,本发明推荐最佳的方案是但不局限于SDSO分子与其特定的基因家族的成员有100%的序列相似性,同源基因序列中的高保守区段只为特定基因家族所享有,和酶切中心必须是CGGAU、CGGGA或它们的衍生序列。如果需要平衡一个SDSO分子的灵敏度和特异性,使用本发明中的方法去调节这些相关参数就可实现。一个SDSO分子的抑制其同源RNA分子的活性的效益,是设计基因治疗方案必须认真考虑的重要问题,它也密切关系到一个SDSO分子的灵敏度和特异性。然而,怎样估价一个SDSO分子的效益,在许多以往中请的专利中和研究文献上都极少提及,主要是由于存在着一些技术上的困难。随着人体基因库计划的完成、人体基因组序列数据库的不断完善、大多数基因结构的鉴定、和生物计算机信息技术的应用,这些技术上的困难现已逐步得到解决。不言而喻,当一个小片段的寡聚核苷酸被引入细胞内后,与其同源的许多不同种的RNA将竞相与其杂交。如果这些同源的RNA分子越多,那么一定量的SDSO分子对特定的mRNA分子的灭活效应也将越低。其二,SDSO分子的效益也相关于与其要抑制的mRNA分子的在一个细胞中的含量。如果含量越高,所需的SDSO分子亦越多,才能达到完全灭活的效果。其三,SDSO分子的效益与酶切中心有关,如果一个SDSO分子含有多个强的酶切位点组成的酶切中心,那么,这个SDSO分子的抑制相应mRNA分子的表达能力也就越强,反之则弱。最后一个因素是有关靶RNA和SDSO分子的配对程度。现有资料表明,当SDSO分子与其靶RNA的某一区段完全地互补,那么其结合的Rnase III核酸酶就能发挥切割效应,否则,Rnase III核酸酶就不能切断相应的mRNA分子。结果是SDSO分子以一种与mRNA分子部分结合所造成的物理方式来干扰相应mRNA分子表达的活性。因此,要提高一个SDSO分子的特异性和灵敏度,本发明所介绍的方法是一条达到此目的的简便而可靠的途径。同时,这些方法也为精确地调整一个特定的蛋白质的合成提供了新的选择。
5.9 合成、纯化、和鉴定所选的siRNA分子合成一条双链寡聚核苷酸分子的方法在文献上已有许多介绍(Needham-VanDevanter et al.1984,Nucleic Acids Res.,126159-6168,Beaucage and Caruthers,1981,Tetrahedron Letts,221859-1862)。一个寡聚核苷酸分子在合成后需经进一步的纯化,常用的方法是阴离子交换树脂或聚丙稀酰胺电泳(Pearson andRegnier,1983,J.Chrom.255137-149.)。纯化后的寡聚核苷酸分子可用化学降解法和核酸序列分析仪来加以鉴定(Maxam and Gilbert,1980,in Grossman and Moldave(eds.)Academic Press,New York,Methods inEnzymology 65499-560)。这里只是列举一种双链寡聚核苷酸分子的合成和纯化的方法来加以说明有关的过程,常用的核酸合成工具是一种自动化的RNA/DNA合成仪。本发明包括但不局限于用下述的方法来合成一个SDSO分子。5.9.1 RNA合成(1) 1毫摩尔的G-碱基柱(iPr-Pac-G-RNA 500)和含有2’-O-TBDMS保护剂(t-Butyl-dimethylsilyl)的寡聚核糖核苷酸(Bz-A-CE Phosphoramidite,U-CE Phosphoramidite,dmf-G-CE Phosphoramidite,Ac-C-CE Phosphoramidite)以及RNA合成激活剂(0.25 M 5-Ethylthio-1H-Tetrazole in acetonitrile)用于RNA的合成。(2) 用DNA/RNA合成仪(型号为392)来合成双链寡聚核苷酸的正意链(+)和反意链(-),如(+)RNA5’-ACUUAGUCGGAUCAAGGUATT-3’或DNA(-)RNA5’-UACCUUGAUCCGACUAAGUTT-3’或DNA(3) 在合成仪上设定合成循环为1毫摩尔的RNA,同时调整偶联时间为10-15分钟。(4) 整个寡聚体的合成大约需要4小时左右。5.9.2将产物与合成柱分离,并去掉碱基和磷酸基保护基团(1)打开合成柱,将支持体倒入一个试管内,此时不需要无菌操作。(2)在此试管中加入1毫升的乙醇/胺(体积比为1∶3),然后将其紧密封闭,置于55℃的温箱中,孵育28小时。(3) 将此试管置于冰块上冷却,然后离心沉淀,小心打开试管。从此开始,所有操作需在无菌条件下进行。除去上清,用2次1毫升的双蒸水淋洗固体的支持物,同时收集所有的洗脱液,继而将收集的洗脱液蒸发至干。5.9.3除去2’-O-silyl保护基团(TBDMS)(1) 在带有保护基团的寡聚核糖核苷酸中加入0。4毫升的1摩尔HTF(tetrabutylammonium floride)的溶液,轻轻地摇晃试管,然后将其置于室温6小时。(2) 再在管中加入0.4ml的1摩尔TEAA溶液(aqueous triethylammonium acetate),继而再加入1ml的双蒸水。5.9.4使RNA寡聚体脱盐(1) 将脱盐柱中的防腐剂倒出,用15毫升的双蒸水清洗柱子,将RNA溶液加到柱上,用1毫升的双蒸水淋洗柱子,收集洗脱液,注意这些洗脱液中不应含有任何RNA分子。(2) 进一步用4毫升双蒸水从柱上将RNA分子洗脱下来,收集这4毫升的洗脱液,其中含有所要的RNA分子,再用双蒸水再洗一次,可得到残余的少量被盐污染的RNA分子。(3) 冷冻干燥这些RNA分子。5.9.5用尿素和聚丙稀酰胺电泳来纯化RNA分子(1) 配制一种尿素聚丙稀酰胺凝胶(7.3摩尔的尿素,20%的聚丙稀酰胺)。胶块大小为16×30cm。
●尿素70.4克●10倍的TBE母液16毫升●38∶2母液80ml●10%APS 1.6ml●TEMED 60ml●总量=160ml(2) 配制RNA样品液●将RNA样品溶于600微升的样品缓冲液中(400ul的双蒸水+100ul RNA染料缓冲液+100ul的100%的甘油)●加热至100度,保持2分钟,然后立即于冰上冷却。(3) 将样品液加到胶的顶部,并在500V电压下跑胶2小时。(4) 将RNA带从胶上切割下来。
●将胶放在一块TLC板上,在UV灯下检查RNA带的位置。
●将含有RNA分子的胶带切下,并将胶带切成小的片块。(5) 从胶中提取RNA分子。
●将小块状的RNA胶浸泡在20ml的TBE溶液中,并置于自动摇摆器上,于4度过夜。
●收集溶液并将胶片再次置于20ml的TBE溶液中,于4度过夜。
●合并这些液体。(6) 浓缩含有RNA的液体。
●加9ml 3摩尔的醋酸钠(最终浓度为0.3摩尔)和45ml的isopropanol(最终浓度为50%)●将溶液置于-20度中过夜或-80度中30分钟,●将RNA置于离心机中,在4度下以15000rpm离心30分钟,●倒掉上清液,用冷的80%乙醇洗RNA沉淀物,然后再在4度下以10000rpm离心30分钟。
●将沉淀物于真空瓶中干燥。
●将RNA溶于0.5ml的双蒸水中。(7) 将纯化的RNA脱盐,方法如IV步,冷冻干燥和储存于-20度下。最终产量为每1mmol柱为1mg。5.9.6 dsRNA的合成 将25ul的50uM摩尔浓度的正意链和反意链置于150ul的20毫摩尔的HEPES-KOH缓冲液中,其中含有50mM的醋酸钾、3mM的醋酸镁和pH 7.2。 反应混合物加热至95℃持续3分钟,然后将其逐渐冷却至室温,维持16至20小时。如不是全部,亦为大部份的单链寡聚体将转变为双链的寡聚体。 储存于-20度下,可反复冷冻溶解5次。这是本发明中的一个具体实例,选择和合成的双链寡聚核苷酸具有与相应的RNA分子中的某特异片段的相似性。在一个肿瘤细胞或一个病变的组织中,相应RNA分子的功能可能被本发明中的SDSO分子完全或大部分抑制,通过抑制致病基因的表达,癌细胞的生长、病毒的感染或遗传性疾患能得到有效的控制。
5.10挑选合适的载体由于在PBS溶液中裸露的寡聚核苷酸很难进入细胞,有效的传递基因药物是能否治疗成功的一个重要环节。寡聚核苷酸的传递系统分为两大类,即生物的和机械的传递途径。生物传递可分为两种,一种是病毒性的,一种是非病毒性的,而机械传递可分为手工注射法和基因枪注射法。本发明主要采用但不局限于一种由脂质体和多聚体组成的复合物。
理想的非病毒类混合物包括脂肪酸和脂质,阳离子脂质体,阳离子扑啉,融基因多肽和人造病毒体。这些混合物能与寡聚核苷酸形成一种复合物,其原理是寡聚核苷酸上带副电荷的磷酸基团与带正电荷的载体颗粒通过静电的相互作用而结合成一体。此外,这些载体也能提供对寡聚核苷酸的保护,以防核酸酶的降解(De Smedt et al.,2000,Pharmaceutical Research 17113-126)。
一些脂肪酸,脂肪酸脂,鳌合物和表面活化物质,也许都可用来作为载体,协助寡聚核苷酸进入细胞,常被使用的脂肪酸和各种脂,包括但不局限于1-dodecylazacycloheptan-2-one,arachidonic acid,羊脂酸(caprylic acid),山羊脂酸(capric acid),甘油二月桂酸脂(dilaurin),甘油二酯(diglyceride),dicaprate,花生酸(eicosanoic acid),glyceryl 1-monocaprate,lauric acid,linoleic acid,linolenic acid,单酸甘油酯(monoglyceride)甘油一油酸(monoolein)肉豆冠酸(myrtstic acid),油酸(oleic acid),棕酸(palmiticacid),硬脂酸(stearic acid),和tricaprate.等。
阳离子脂质体是用于人体基因治疗的最佳载体之一,因为它们是非感染性的,几乎没有免疫原性和毒性。在形态学方面,阳离子脂质体可分为三个主要类型,即小型的单层小泡,大型的单层小泡和多层的小泡。常用的脂质和脂质体包括中性脂,即DLPE(1,2-dilauroyl-sn-glycero-3-phosphoethanolamine)、DiPPE(1,2-diphytanoyl-sn-glycero-3-phosphoethanolamine)和DOPE。这些脂质和脂质体能够协助入胞后的内涵体的破裂。阳离子脂质如DOTAP(dioleoyltetramethylaminopropyl)、DOTMA(the cytofectinN-[1-(2,3-dioleoyl)phosphatidyl]-N,N,N trimethyl ammonium chloride)和TMAG(N-(α-trimethylammonioacetyl)-didodecyl-D-glutamate chloride)。理想的脂质载体通常是一种等比例的阳离子脂质和中性脂质的混合物。
另一种阳离子脂质是阳离子扑啉。tetra(4-methylpyridyl)porphyrin(TMP)和tetraanilinium porphyrin(TAP)能比裸露的寡聚核苷酸本身更有效地协助寡聚核苷酸进入细胞。此外,阳离子扑啉不仅能帮助寡聚核苷酸进入细胞,也能将其传递到细胞核内,以便寡聚核苷酸在那里能与相应的mRNA分子和RNase III核酸酶相作用。人造的病毒体是另一类传递媒介,它能够利用一个病毒进入细胞的那种天然能力来帮助寡聚核苷酸进入细胞,重组的流感病毒胞膜是一种著名的病毒体,它能通过受体介导的内吞作用而进入细胞,并与内噬体膜合为一体。近来研究已将阳离子脂质与病毒体溶合为一体来作为一种新型的运载工具。
多聚阳离子体是另一类有用的载体,可用来增强阳离子脂质体介导的入胞作用,可用的阳离子多聚体包括多聚L型赖氨酸(poly-L-lysine),硫酸鱼精蛋白(protamine sulfate),重组人体组蛋白H1(recombinanthumanHl histone protein),精氨酸(spermidine)和PEI(polyethylenimine)。聚氮丙啶(PEI)已被证明是一种有效的非病毒性载体,可将基因递送进不同类型的细胞,和促进寡聚核苷酸进入哺乳类细胞的胞核,PEI其他的特征包括能与核酸结合,将核酸压缩,具有高效的缓冲能力和内在的溶解内噬体的活性。此外,它还能保护核酸对抗核酸酶的降解。在外用或注射线状的22KDa大小的PEI和寡聚核苷酸复合物后,在细胞内可以看到其传递的标志基因能够高效地表达。进一步的研究发现,分支状的25KDa的PEI除了与线状的PEI在体外转染实验中有相似的效果外,它还被证明其体内的基因传递效果远远好于线状的PEI。当结合所有这些PEI的特点与受体介导的基因传递机制在一起时,与配体结合的PEI能够更有效地将基因导入各种不同的肿瘤细胞。
此外。还需提及的其它方法包括结合肽和基因枪。结合肽能够在寡聚核苷酸周围形成一个多肽圈,有利于寡聚核苷酸被细胞摄入。许多含有多聚赖氨酸的结合肽可引起膜的去稳定性。一般来说,这些结合肽比脂质有较低的细胞毒性,并具有相似的传递效果。除了老式的手工注射法外,一种新型的基因枪也已宣告诞生,其原理是高压的氦气能够产生一种超声的速度,从而通过极高的加速度将金颗粒包裹的DNA分子打入活的细胞中,此方法可以用来有效地并直接地传递寡聚核苷酸进入细胞。
5.1 1选择特异的细胞靶导分子有关基因药物的一个重要活题是怎样把一种有治疗效果的基因药物递送到靶细胞或靶组织内,而不损伤正常的细胞和组织。组织靶导可以通过将基因药物直接地注射进相应的组织,或借助于一种导航分子如抗体、配体、或病毒颗粒来完成,许多这方面的方法在文献中已有大量报道。本发明偏重特异的靶导系统包括但不局限于下述几个方面5.11.1靶导抗体(1) 高效亲和的单克隆抗体--AF-20能够识别一种能被速度内噬的180KDa的细胞表面的糖蛋白。这种抗体可引导含有SDSO分子的载体特异地与肝癌细胞相作用,而将相应的基因药物导入肝癌细胞。(2) 高特异性的CD3抗体。它可与多聚赖氨酸相连,后者又能与SDSO分子相互作用,这样此抗体可与淋巴细胞上的CD3受体相互作用,从而特异地把SDSO分子导入白血病细胞。(3) 将一种高分子量的黑色素细胞瘤相关抗原的抗体的单链片段与脂质体偶联,用来将有关的SDSO分子特异地导入那些转移的黑色素细胞瘤的细胞内。5.11.2靶导多糖或蛋白配体(4) 一种糖蛋白能与CD4阳性的T细胞上的一种特异受体相互作用,这种糖蛋白可用来将SDSO分子特异地导入那些T细胞,用于治疗艾滋病或T细胞白血病。(5) 胆固醇与精氨酸的结合体可特异地将SDSO分子通过识别肝癌细胞表面的一种糖蛋白导入那些AF-20阳性的肝癌细胞内。(6) 腺病毒或逆转录病毒或柯萨奇病毒均能通过有关的受体如CAR受体将SDSO分子送入有此受体的细胞内,如肺癌细胞中。(7) 结合多聚赖氨酸、低密度脂蛋白和SDSO分子为一体可特异地与LDL受体结合,将SDSO分子导入肥胖病的脂肪细胞。5.11.3其它的靶导媒介其它种类的靶导媒介亦被不同的生物公司研发,Pentratin就是其中一种,它是一种多肽,有16个氨基酸所组成,它能与DNA结合,并将其转位进入活细胞的胞浆和胞核内。
5.12其它成份本发明的基因药物中除了活性的双链寡聚核苷酸外也许还有其它多种辅助成份,如传统的药品那样,这些成份也许包括但不局限于下述诸种抗炎的活性成份如非固醇类抗炎药和可的松等、抗氧化剂、局部麻醉剂、润滑剂、防腐剂、稳定剂、增厚剂、湿化剂、染料、香料、胶。
然而,这样的辅助成份当需加入时,以不影响SDSO分子的生物活性为前提,否则不可使用。
5.13基因药物的组装一个基因药物的组装涉及到方方面面许多因素,包括SDSO分子、与脂质的比例、它们的浓度、缓冲液的PH值、离子强度和其增加稳定性的物质,主要需注意的事项是避免或减少混合物的沉淀,保护SDSO分子以免被降解和提高转化的效益。本发明认为下述的诸条件是构成最佳药物组装的保证。
(1)含有5%葡萄糖的PBS缓冲液,它被用来稀释SDSO分子的浓度(2)PBS缓冲液的PH值为5.5-6(3)低离子强度(4)1∶6的SDSO与脂质(5)SDSO的浓度不超过4ug/ul(不包括静脉内、动脉内和颅内给药)(6)载体大小此外,理想的通过皮肤粘膜上皮等途径给药所需的转化复合物的大小为30-60nm(纳米),用于吸入途径的转化复合物的大小为50-200nm,而用于静脉内给药的转化复合物的大小最好为200-600nm。
活性成份是一种或一组不同的特异的SDSO分子,他们能有效地抑制相关的靶RNA分子,根据疾病细胞中一组基因过度表达的程度,来调节SDSO分子的种类、剂量和组合的方式,以便获得最大的治疗效果和最低的毒副效应。
尽管基因药物可配制成许多不同种型,但这里只描述基因药物水状的悬浮液的配制作为一个例子。(1)10ug的SDSO分子溶于10ul的葡萄糖液中(无离子双蒸水配制)。(2)10ul的20mM的25kDa的分枝状的PIE(用0.01M的PBS含有100mM氯化钠,PH值5.5)。(3)将溶液(1)滴入溶液(2),轻轻混合后置于室温下10分钟。(4)将30ul的阳离子脂质体,如FuGene6溶于50ul的0.01M的PBS含有150mM氯化钠,PH值7.4。(5)将溶液(3)慢慢滴入溶液(4)后,轻轻摇晃使它们充分混合,然后置室温中40分钟。(6)最终的混合溶液可用于细胞的转染或其它用途。
基因药物水状的悬浮液的形状如图7所示。
5.14基因药物因为药物被定义为一种能够调整生物体的特定过程的化学物质,所以,基因药物可被视为一种化学物质中的一种能影响活细胞的功能的寡聚核苷酸。5.14.1基因药物的特征基因药物有如下特征(1)不改变基因的结构序列和所携带的遗传信息。(2)能与基因组DNA、mRNA或其它RNA分子中某一特定区域互补。(3)能够特异地干扰、抑制或完全灭活相应基因的功能或表达。5.14.2基因药物活性成份的结构本发明的具体实例之一是有关SDSO分子的结构。一个理想的SDSO分子是一条19个核苷酸长的双链寡聚核苷酸,它应以腺嘌呤或第一个碱基前为腺嘌呤的碱基开头,在这碱基上有一个磷酸残基,并以胸腺嘧啶为结尾,在胸腺嘧啶上有一个游离的羟基。在分子中有一个酶切中心,此中心有3个强的酶切位点,即G*G、G*A或A*U。此分子的每条链的3’端上有一个由2个游离的胸腺嘧啶所组成的突起。因此,一个理想的SDSO分子的每条链应是21个核苷酸长,其总长度为23个核苷酸。SDSO分子包括三种类型的21-23个核苷酸长的双链寡聚核苷酸,即21-23nt siRNA(表5),21-23nt sRNA-cDNA(表6)和21-23ntsiDNA(表7)。酶切中心的序列型式包括CGGAU,CGGGA和它们的衍生序列,这些衍生序列包括但不局限于CGGAA,CGGAC,CGGAG,CGGGC,CGGGU(T)和CGGGA。
短小的干扰RNAs(siRNAs)是一条21-23个核苷酸长的双链RNA。21-23nt sRNA-cDNA是一条杂合的双链寡聚核苷酸,其中sRNA为正意链而cDNA为反意链。siDNA一条21-23个核苷酸长的双链DNA。表5.21-23nt siRNA.的基本级构
表6.21-23nt sRNA-cDNA.的基本级构
表7.21-23nt siDNA.的基本级构
5.14.3基因药物的配方不同类型的双链寡聚核苷酸本发明的另一实例是可采用不同类型的双链寡聚核苷酸作为一种SDSO分子,并且这些不同类型的SDSO分子以相同或不同的剂量,组成一种混合物。这三种不同类型的SDSO分子的不同配伍也许可用来设计产生不同长短疗效的治疗方案,就象传统的药物的配伍那样。例如,每种类型的SDSO分子的反意链可产生立即的功效。由于它们均能与相应的mRNA分子杂交,从而阻断其生物学功能。类型siRNA和sRNA-cDNA中的正意链也许能作为模板产生更多的反意链从而扩大SDSO分子的效能。或者它们可能与甲基转移酶结合,对同源的DNA片段进行甲基化修饰,导致相应基因的活性的下降或完全关闭。相反,siDNA却没有这些功能。但是siDNA和sRNA-cDNA中的反意链DNA却能激活另一核酸酶的活性。这样如混合配伍这三种不同的双链寡聚核苷酸就能使酶切效益大大增加,因为,它们能激活二种不同的核酸酶的活性。表8不同类型的双链寡聚核苷酸,相关的酶和它们的功能
一种或多种不同类型的双链寡聚核苷酸的配伍一种或多种不同类型的双链寡聚核苷酸的配伍是有关本发明的基因药物特点的另一个实例。基因药物活性成份包括一种或多种不同类型的双链寡聚核苷酸,尤其是基因药物中的不同的SDSO分子能够分别地与不同的靶mRNA相互作用,如第一种SDSO分子能抑制一个mRNA分子,第二、第三……第n个SDSO分子能抑制第二、第三……第n个不同的mRNA分子。这种把多种特异的活性成份结合在一起,对付一个动物特别是人体内细胞中一组相应的过表达的mRNA分子的配方是本发明的又一个重要的实例。因为这种方法特别适用于肿瘤的预防和治疗,两种或多种结合的SDSO分子可以同时或相继地导入细胞,以发挥它们各自的功能。在本发明的实例和应用中,还将继续阐明此方法的细节。双链寡聚核苷酸的用量为每一病人诊治配药,是二十一世纪医药界的一个新趋势。患有同一种疾病的不同病人,也许他们基因的表达模式并不一样,根据基因芯片的检测结果,可以得到那些致病基因表达的模式和丰度,计算出每一种相应SDSO分子的不同剂量,然后将它们组装成相应的基因药物,是对症治疗病人的最佳途径。因此,一种、两种或多种不同类型的SDSO分子以相同或不同的剂量配制成特定的基因药物,这种基因药物才能真正从根本上治愈不同病人的疾病。基因药物的形态基因药物可配制成不同的形态,如水剂、粉剂、油剂、药膏、药片、药丸、药水、胶剂、雾化剂、皮下包埋块。传统的药效载体、水化物、粉或油状物或其它形状也许是必需的或希望的。口服药的成份和配制包括粉状物、颗粒状物、微粒子状、钠粒子状的混合物、水状或非水状的悬浮液,胶囊,药片或微小药丸。此外,增厚剂、香料、稀释剂、乳化剂、分散剂或结合剂也许是需要的或要求的。给药途径本发明的有效成份或配伍包括21-23个核苷酸长的双链寡聚核苷酸,即21-23nt siRNA(表5),21-23nt sRNA-cDNA(表6)和21-23nt siDNA(表7)。除了双链寡聚核苷酸外,其它的有关成份包括药效上接受的载体,或其它常用来增强和促进药物吸收的辅助成份。给药途径包括但不局限于下述诸种(1)外用包括眼、耳、鼻、直肠、阴道等。(2)吸入包括气管内、鼻腔内、过皮或皮外的粉剂或雾化剂。(3)口服(4)注射或点滴包括静脉内、动脉内、皮下、腹腔内或肌肉内等。(5)颅内给药鞘膜内、脑室内。基因药物的用法有关治疗配伍和有关给药次数的研究已有大量的报告,剂量的大小取决于疾病的严重程度、顺应性和病人的健康状态。治疗过程可从几天到几星期、几月、几年或直到疾病被治愈或明显缓解,理想的剂量尺度可以通过度量药物在人体内的分布和积累的情况来决定。专家们通常易于决定理想的剂量。
理想的剂量也许会随着具体不同的双链寡聚核苷酸的相对效能的变化而改变,通常根据EC50S来估价。因为EC50S在为什么内外的动物模式研究中是一种可靠的指标,一般来说,SDSO分子的剂量范围为5ng~200mg/kg体重,此剂量可以每天一次或数次或每周一次或数次、每月一次或数次、每年一次或数次。专家们通常能够根据测定所给药物在人体内的逗留时间,药物在体液或组织中的浓度来决定给药的次数和频率。随着成功的治疗后,对病人进行维持治疗以防止疾病的复发也是常常需要的。此时,一个维持量的双链寡聚核苷酸是必要的,通常剂量范围是5ng~200mg/kg体重,此剂量可以每天一次或数次或每周一次或数次、每月一次或数次、每年一次或数次给予病人。最佳剂量范围是5mg~50mg/kg体重/天。基因药物的代谢机制抑制那些不要的基因的表达对细胞能行施其正常的功能来说是非常重要的。使基因灭活的原理包括一系列的转录和转录后的监制过程。许多研究指出内源性的或外源性的双链寡聚核苷酸平熄基因活性的机制至少涉及到四个转录后的监制过程。第一个对双链寡聚核苷酸非特异性的应答的主要途径是由dsRNA依赖的蛋白激酶(PKR)所介导。这个酶能够磷酸化,转译因子eIF2a,磷酸化后的eIF2a就失去活性,从而不能引发蛋白质的合成,造成细胞内所有蛋白质合成的非特异性抑制,以致开启病理性或非病理性的细胞死亡通道。DsRNA以一种长度依赖的方式激活蛋白激酶PKR。现已发现,当dsRNA长度超过80个核苷酸时,它就能完全地激活PKR,而当dsRNA长度小于30个核苷酸时,就不能引起PKR的从抑制型转为激活型。因此,为了避免激活PKR,开启一条非特异性的细胞死亡通道而造成的毒副效应,本发明强调只向细胞内导入治疗性的19-25个核苷酸长的双链寡聚核苷酸分子。
第二个机制相关于一条由一个依赖于2-5A的核酸酶介质的途径。这条dsRNA应答途径涉及到dsRNA诱导的2-5A(多聚腺苷酸)的合成。2-5A可以激活一个非特异性的核酸酶,即RNase L,此酶激活后能够非特异地切断所有的mRNA分子,从而抑制细胞内任何蛋白质的合成,最终导致细胞的死亡。然而,19-25个核苷酸长的双链寡聚核苷酸分子却不会诱导的2-5A(多聚腺苷酸)的合成,从而也不能激活那个非特异性的核酸酶RNase L(Maitra RK,et al.,1995,J Biol Chem 27015071;Cirino NM,et al.,1997,ProcNatl Acad Sci USA 941937;Szczylik C,et al.,1991.,Science 253562;Lesiak K,et al.,.1993,Bioconjugate Chem 4467)。
第三个机制与RNAi干扰有关。一条长的dsRNA能够被一个叫做RNaseIII的核酸酶切成一系列短小的双链寡聚核苷酸分子,它们通常为19-25个核苷酸长。这些短小的双链寡聚核苷酸分子(siRNA)能够与它们同源的mRNA分子相作用,从而引导与它们结合在一起的RNaseIII的核酸酶去特异地切断那些mRNA分子。现已发现,生物体内细胞能够采用这一机制来灭活细胞内的那些异常的RNA分子,调控细胞在不同发育期中对某些蛋白质的需要,保护细胞清除外来的遗传物质,对抗病毒等病原体的侵犯。可见RNAi干扰是细胞内的一套天然的防御机制,就像人体免疫系统那样。尽管它们的防护水平不一样,但有着类同的目的。
第四条监制途径涉及到DNA分子。当dsDNA或sRNA-cDNA导入细胞后,它们中间的cDNA链可引发一个典型的由RNase H核酸酶介导的代谢途径。当cDNA链与其靶mRNA结合后,RNase H核酸酶就能切断那条mRNA分子链,从而终止其生物学功能。这里应引起注意的是,反意DNA以一种杂合的或纯合的双链分子存在,它们也许有较强的抵抗核酸酶的性能,否则它们需经修饰才能延长其在生物体内的半衰期。
最近,几线的证据显示,19-25个核苷酸长的siRNA对mRNA的干扰效果明显优于单链cDNA介导的mRNA表达的抑制。通常后者在细胞内的半衰期只有几分钟。而由RNAi干扰介导的效应可持续几天,乃至更长时间。同样,许多研究也证明,siRNA似乎非常稳定,这样它不需要进一步的化学修饰,也降低了合成的成本。最重要的是siRNA还能够特异性地抑制靶基因的表达。几个实验室对反意链治疗技术和RNA干扰技术作了比较,结果发现ssRNA只能部分地抑制一个基因的表达,而siRNA却能导致对mRNA表达几倍乃至几百倍的抑制。显然,这些观察亦为本发明的基因药物的高效性和特异性提供了有力的支持。同时,这也坚定了人们去进一步开发RNAi或DNA干扰技术,将其造福于人类的健康和幸福(Aravin AA.,etal,2001,Curr Biol Jul 10;11(13)1017-27)。
此外,19-25个核苷酸长的siRNA被发现还与DNA的甲基化有关,DNA甲基化不仅能抑制基因的表达,也可能增加受影响基因发生突变的可能性。虽然DNA甲基化在正常的生物学过程中起着重要的作用,但不正常的DNA甲基化亦会造成细胞的突变和癌症的发生。尤其是一些证据已证明肿瘤抑制基因如p53和Rb的促进子区中DNA的甲基化可引起这些抑癌基因功能的下降或完全丧失。此外,编码蛋白区的DNA甲基化还会引起氨基酸的突变和蛋白质功能的异常。所有这些分子事件都能促进癌症的发生和发展,而构成对现代治疗癌症的重要障碍。一个新的设想是,用siRNA来作为一种治疗癌症的药物。因为siRNA能够与一种甲基转移酶相结合。当它与其同源的DNA片段上的特定区域相互作用时,它就能把这个甲基转移酶导向这个特定的区域,从而使这个特定区域中的DNA序列进行非特异性的甲基化,从而抑制被甲基化基因的功能。再者,还可设计一个SDSO分子,这个SDSO分子能够特异地抑制癌细胞内编码甲基转移酶的mRNA分子的功能,从而解除对肿瘤抑制基因的抑制。因此,如果一个SDSO分子与一个细胞中的某个致病基因相互作用,促使其被甲基化,就有可能较长时间地抑制那个基因的表达功能(Matzke,M.A.,et al.,(2001)Curr.Opin.,Genet.Dev.11,221-227;Carthew,R.W.(2001)Curr.Opin.Cell Biol.13,244-248;Elbashir,S.M.,Lendeckel,W.& Tuschl,T.(2001)Genes Dev.15,188-200)。5 同现有技术相比所有的优点同现有技术相比本发明所具有的优点包括(1)全新的设计和研制理论细胞内存在着一种天然的RNAi保护系统。这一系统中的效应成份可在体外通过生物工程的方法加以放大和增强,然后将其输回生物体内。它能特异并高效地灭活那些同源的致病基因。本发明的效应成份中的序列型式CGGAU(T)、CGGGA或它们的衍生序列是设计和精选高效的SDSO分子作为基因药物的重要指标。(2)较短的新药研发周期借助计算机和基因芯片等技术,精选特定的mRNA序列中的最保守的部分作为基因药物的靶子,而其同源的序列作为基因药物的活性成份。这一新的研发战略能够大大地减少用于研究一种药物分子的化学和物理性能的时间,和找出它在靶分子上的作用位点的时间。(3)较低的药物研发成本研究一个新药和与其靶分子之间的相互作用常常需要高额的研究经费和大量的研究时间,快速的计算机运算方法和公共的基因数据库的免费使用,将能明显地降低研发新型的基因药物的成本。(4)极高的特异性本发明能够筛选出特定mRNA序列中的最具潜能的靶片段,用其同源的SDSO作为基因药物。它们通过经典的Watson-Crick碱基配对的原理相互识别和作用。再者,选出的片段只被相同基因家属的成员所共有,而与其它基因家属的成员仅有极少的相似性,从而使药物的特异性得到充分的保证。(5)极低的毒副效应本发明的基因药物中的主要活性成份是一种天然的核酸片段,它存在于从低等动物到人体的细胞中。由于其高特异性和高效性,使其用量明显地低于其它的药物。显然,其毒副作用也远远地低于其它的药物。(6)较高的稳定性本发明的SDSO分子是一种双链寡聚核苷酸,能够与一些蛋白质和其他小分子相互作用,有比其它单链的核酸如cDNA有好得多的稳定性。它能有效地抵抗核酸酶的降解,易与一些蛋白质形成稳定的复合物。其某些碱基也易于修饰,用于增强抗核酸酶的性能。(7)多种用途本发明的基因药物是一种不同类型、不同剂量和多种SDSO分子的混合物。它们能够根据病人的具体情况和疾病的严重程度加以调整,并可制成不同型式的制剂,用于不同的途经,将会开创为每一病人诊病开药的新时代。(8)高效性能高效地打断相应的mRNA分子并能同时灭活数种不同的致病基因是本发明基因药物的一个特点,这一方法学上的突破尤其适用于癌症的治疗和预防,病毒和真菌所造成的顽疾以及那些难治的遗传性疾患。(9)高抗突变性根据数学概率论的原理,一个核苷酸的突变在一短小的序列中发生的可能率必将大大地小于在一段很长的序列中的概率。此外,本发明的基因药物中亦可含有抑制抗药性基因的SDSO分子。(10)长效的作用由于siRNA分子可能具有自我复制的能力和使相应DNA片段甲基化的能力,其生物效应在活细胞中可能持续较长时间。
6 有关说明和附图共10幅附图和10条


。图1.来自不同种簇的一个内源性的RNAi干扰基因的同源序列。图2.一套典型的由BLAST排序程式找出的人血管内皮细胞生长因子的基因的同源序列。图3.一套典型的由CLUSTAL W多序列排序程式排出的来自不同种簇的胰岛素样的生长因子2的基因的同源序列。图4a.人胰岛素样的生长因子基因序列的BLAST搜索。图4b.不同人胰岛素样的生长因子序列的相似序列。图5.二序列排列的BLAST搜索的结果。图6 估价用酶切序列型式所预测的一个SDSO分子的特异性。图7基因药物的模式图。图8A是一种大型的单层小泡脂质体(蓝色)和它所含有的SDSO分子(红色)、分枝状的PIE(灰色)、导航分子(紫色)。图8B描绘了小型的单层小泡脂质体与SDSO分子和其它成份之间的相互关系。图8.Dermogene能够有效地抑制人体黑色素细胞癌的细胞A375在裸鼠上的增殖和存活。图9.Leukogene对CML细胞的增殖和存活抑制的效应。图10.比较Leukogene和空脂质体对CML细胞的增殖和存活的抑制。
7 发明的实施例子及最佳实施方案实例1--用BLAST序列排列程式来分析简便选择法所选出的SDSO分子的特异性表9显示简便选择法能够可靠地获得具有高特异性和酶切效益的序列。在人c-myc原癌基因中存着含有酶切的五个不同的片段。然而,当用这五个不同的片段为提问序列在人体基因库中所搜索时,它们均能找到高特异性的同源序列,如Seq.ID#5中的2、3、4、5和6。相反,随机选择法却获得许多低特异性的相似序列,如Seq.ID#5中的1和7。表9人c-myc原癌基因mRNA中的不同片段的相似序列(gi|11493193)
表10列举了用mdm2基因中不同的19个核苷酸长的序列为提问序列在人体基因库中所搜索到的同源序列。其中4个随机选出的序列,可找出高达347个相似性序列,只有1个随机选出的序列具有较高的特异性。相反,用酶切序列型式设计和选出的一个序列,就能获得较高的特异性(Seq.ID#6中的1)。这一结果说明,随机选择的可靠性较小,并需要多次的尝试,更重要的是,它们更缺少强的酶切位点,这将影响基因药物的效益。表10人mdm2样的mRNA中的不同片段的相似序列(XM 052466,GI14762555)
表11列举了另个例子来说明酶切中心序列在预测一个高效的SDSO分子中的重要性。比较本发明推荐的简便选择法与随机选择法,可以发现前者能够充分地保证所选序列,如人转型生长因子序列3能够具有高的特异性和强的酶切效应,而后者的成功率是非常的小,特异性亦非常的低,如表5中的其它6个序列(Seq.ID#7中的1、2、4、5、6和7)。表11.人转化生长因子-beta2的mRNA中的不同片段的相似序列 (gi|31959)
以表12中人端粒酶mRNA中的不同片段为提问序列,搜索结果进一步表明简便选择法选出的序列具有高特异性和高酶切效益,如Seq.ID#8中的2和4。表12人端粒酶mRNA中的不同片段的相似序列(AF221907)
表13进一步显示随机选择法的不确定性。它有时能选出较特异的序列如序列2和5,但同时获得高特异性和高酶切效益的可能性是非常小的,如序列7含有高效的酶切位点,但其特异性却很低。表13.人转型生长因子beta 1(TGFB1)mRNA中的不同片段的相似序列(gi|10863872)
表14显示虽然简便选择法能够可靠地获得具有高特异性和酶切效益的序列,但在所选择的那些序列中,乃存在着差异(Seq ID#10中的1、3和4),经过进一步的比较,可从中精选出最好的序列,如Seq.ID#4。表14.人循环素依赖的激酶2(CDK2)mRNA中的不同片段的相似序列(gi|14759971)
表15又一个用简便选择法选出的高特异性高效的SDSO分子的序列(Seq.ID#11中的4)。它可用于灭活人肝细胞生长因子的mRNA的功能。表15.人肝细胞生长因子HGF mRNA中的不同片段的相似序列(gi|4750937)
实例2--简便选择法所选出的SDSO分子能够高效地抑制相应的mRNA的功能人体黑色素细胞癌的细胞A375和SK-Mel-28从美国组织型培养收集中心(ATTCC)得到,所有的细胞维持在改进的Dulbecco’s培养液中(DMEM,5g/l的葡萄糖,10%胎牛血清,100单位/ml的青霉素,100ug/ml链霉素和0.25ug/ml amphoterin B),裸鼠(6-8周)饲养在无病原体的条件下。
用一宽头针将3mm大小的肿瘤块移植到裸鼠的背侧,待移植的肿瘤长到1cm大小的时候,将接种了肿瘤的裸鼠随机地分为五组,用于治疗实验。在第一组的肿瘤内各天注射15ul的PBS;在第二组的肿瘤内各天注射15ul的150钠摩尔的空脂质体;在第三组的肿瘤内各天注射15ul的150钠摩尔的空脂质体及5ug的双链寡聚核苷酸;在第四组的肿瘤内各天注射15ul含有50mg的环磷酰胺的150钠摩尔的空脂质体;在第五组的肿瘤内每天注射含有15ul的150钠摩尔的空脂质体及5ug的双链寡聚核苷酸。在第五组的实验中,脂质体需每两天注射一次。此外,每五天用微型卡尺测量肿瘤的大小,以便估计药物对移植肿瘤的生长抑制。肿瘤的体积可通过下述公式进行计算ab2/2。这里a是肿瘤的宽度,b是肿瘤的长度。相对肿瘤大小(百分比)可通过另一公式得到,即Tn/To X100。这里的To为在肿瘤内注射时的肿瘤的重量,Tn为用药后的肿瘤重量。
图8显示一组由7个不同的SDSO分子能够抑制人体黑色素细胞癌的细胞A375在裸鼠上的增殖和存活。在接种了肿瘤的35天的观察期中,在第一组的肿瘤内各天注射PBS和在第二组的肿瘤内各天注射空脂质体对人体黑色素细胞癌的增殖和存活都没有任何作用。在第三组的肿瘤内各天注射含有7种不同的SDSO分子的脂质体和在第四组的肿瘤内各天注射含有50mg的环磷酰胺的脂质体在前15天内能不同程度地够抑制人体黑色素细胞癌的的增殖,但在后20天内却逐渐尚失它们的抑制能力。然而,在第五组的肿瘤内每天注射含有7种不同的SDSO分子的脂质体能够有效地抑制人体黑色素细胞癌在裸鼠上的增殖和存活。结果表明接种的肿瘤在7种不同的SDSO分子的作用下,肿瘤由大变小并逐渐消失,在35天所取得的裸鼠组织中不能找到人体黑色素细胞癌的细胞。
另一组实验是关于21个核苷酸长的siRNA对CML细胞的增殖和存活抑制效果的观察。为了决定21核苷酸长的siRNA对慢性髓样白血病细胞的影响,三个不同CML病人的骨髓的细胞被用于本实验。对这些细胞进行了染色体分析和RT-PCR检测,发现这些细胞中含有b3/a2型的bcr/abl。把来自这三个病人的骨髓的细胞进行培养,然后用含有bcr和abl的mRNA和bcl-6和N-ras的mRNA中特定同源序列的SDSO分子进行处理,用分别50ng/ml的SDSO就能有效地抑制细胞的增殖。相反,空脂质体对慢性髓样白血病细胞没有任何作用(图9),来自正常人的骨髓细胞,却能抵抗SDSO对细胞生长的抑制效应(图10)。实例3--用BLAST序列排列程式来分析那些被报告有高效抑制活性的反意核苷酸链的特异性。
为了鉴定其它实验室所报告的有效的ASO的特异性,本研究在PubMed数据库中对近十年的相关文献进行了一个综合性搜索,从中挑选出那些对相应的mRNA分子有较高的抑制性的ASO分子,然后,将这些分子作为提问序列,对人体基因组数据库中的960,000个不同序列进行比较,来观察这些序列是否有真正的较高的特异性。
在文献搜索中,下述的标准被用来选择那些ASO分子(1) 对10个以上的ASO分子的效益作了比较研究的实验中的ASO分子。(2) 对同一个mRNA分子上不同的区段的反意链的效益作了观察中的ASO分子。(3) 一些FDA批准的可用于临床实验的ASO分子。(4) 一些用于专利申请的ASO分子表16列举了一系列的对人体Nedd-4样的泛激素连结酶mRNA具有不同抑制效应的ASO分子,并同时比较了其它实验室所选出的WWP2 DNA同源片段的ASO分子和用本发明中的简便方法选出的SDSO分子之间的特异性和灵敏度。其它实验室选出的WWP2-ASO分子可分为三组,第一组为高效性的,如High1、2、3、4和5对WWP2的抑制率从80-100%;第二组为中效性的,如Med1、2、和3对WWP2的抑制率从40-60%;第三组为低效性的,如Low 1、2、3和4对WWP2的抑制率从0-20%。表16人体Nedd-4样的泛激素连结酶mRNA(XM 028151.2 GI15318611)
仔细观察后可以发现,在高效组中,每个ASO分子可找出较少的同源序列,平均为20个。每个分子可寻找出平均6个100%的同一基因家族的成员。几乎没有80-95%的相似序列,而含有7-32个不等的少于80%的相似的非家族性同源序列。在中效组中,每个ASO分子平均可寻找出30个同源序列,其中,平均4个为100%相同的同一家族成员的序列,12个80-95%相同的非家族性序列和10-38个不等的小于80%相似的非同源性序列。在低效组中,每个ASO分子平均可找出89个同源序列,其中平均3个为100%相同的同基因家族的成员,20个为80-95%相似的非家族性成员的序列,和38-97个不等的小于80%的相似的非家族性成员的序列。总之,高效的ASO分子能检出几乎全部的同一家族的成员,只与极少的非家族性DNA序列有较低的相似性。相反,低效的ASO分子只能检出部分的同一家族的成员,而与较多的非家族性成员的DNA序列有较高程度的相似性。
用本发明所推荐的简便方法选出的DNA序列的特异性可以与其它实验室所选出的WWP2 DNA同源片段的ASO分子的特异性相媲美。任何一个由简便方法选出的DNA序列都具有较高特异性,平均每个DNA序列可找出17个同源序列。找出的序列总数甚至低于上述高效组所检出的数目。最值得注意的是,在高效组中,有三个序列也含有本发明所推荐的核心序列中的一种,即CGGTG。由此可见,本发明所推荐的挑选高效双链寡聚核苷酸的标准是行之有效的。它不但比任何选择高效的ASO分子的方法更方便,而且有更好的结果。同时,它不但适用于挑选SDSO分子,还可用于其它的ASO分子的选择。
表17列举了文献上报告的9个最有效益的反意核酸链。其中每个反意链都有它们的在报告中所用的名称。链的起点和终点、链的特异性由相似性栏下的数目大小所表示。有效性是指各个反意链能够抑制相应基因表达的程度,用高、中、低度抑制率来表示。只有那些具有高抑制程度的ASO分子被选用。BCL意为B细胞、慢性髓样白血病/淋巴瘤。2分子VCAM是指血管粘附分子。PKC是指蛋白激酶C。P53是一个癌基因抑制蛋白。表17.文献上报告的9个最有效益的反意核酸链的特异性。
仔细观察每例中的相似序列的多少后可以发现,如果一个ASO分子能与同一基因家族的成员有100%的同源性,而与较少的其它基因家族的成员有极低的相似性,那么这个ASO分子相应的基因表达就有较高的抑制效益。如这里所指出的,能够有效地抑制相应基因表达的ASO分子都有一段特异性较高的DNA序列。在它们中间,有两个序列含本发明所推荐的核心序列,即CGGGA和CGGGG。相似地,用本发明所推荐的简便方法选出的DNA序列的特异性都很高,它能与所有的或部分的同一基因家族的成员有100%的同源性,而与其它基因家族的成员有较少的相似性。此外,简便选择法选出的DNA序列还具有强的酶切中心,所以,由简便选择法选出的DNA序列为模板制成的SDSO分子也一定能够有效地抑制一个细胞中相应基因的表达。实例4--简便选择法所选出的SDSO分子将用于治疗有关的疾病和功能异常一个好的基因药物应具有高度的稳定性,易被导入靶子细胞,能获得足够高的细胞内浓度,能与靶RNA高特异地结合,高效地切断靶mRNA,以及低乃至无毒副效应。本发明的基因药物是天然存在于活细胞内的SDSO分子,当这些分子与一种有效的载体结合时,就能被特异地导入靶细胞内,抑制那些异常表达的基因,从而达到治疗疾病和功能异常的目的。同时,它还可用于预防或延迟炎症、感染和肿瘤的发生。治疗肿瘤有许多基因治疗战略用来对付肿瘤,但它们的共同特点是用一种反意核苷酸链来抑制一个细胞中的一个特定的基因,而近来的基因芯片的研究结果指出,肿瘤不是一种基因,而是一组基因异常表达的综合性结果。因此,本发明采用一种治疗癌症的战略是,从mRNA分子水平着手,用一组SDSO分子同时医治一个肿瘤细胞内一组致癌基因的表达,解除对癌抑制基因的抑制,阻断细胞病理性生长和分裂的途径,重建细胞内的死亡通道。显然,这就要求对治疗性的药物的生物学特性提出更高的要求。为了达到这些目的,本发明采用一组特异的SDSO分子为活性成份。这些SDSO分子可分为二组。一组是针对癌细胞所共有的特征,如抑癌基因的活性下降,非控制性生长和分裂,刺激血管的生长以获得营养等。另一组则是针对不同癌细胞所自有的特征,特定的癌基因的激活,某种受体的高表达或某种特殊功能蛋白的异常高调等。本发明中第一组基因药物的活性成份(它们的相应序列如表18所示)包括但不局限于CDK-2 and 4、Stat-3 and 5、Mdm-2、PKC-alpha、Telomerase、VEGF、b-FGF。第二组基因药物的活性成份包括但不局限于DermogeneHPV(E6),CDKN2A,HDC,N-Ras,Spermidine或PEI。LungeneIGF,K-RAS,Neu,HGF,BCL-2 and-xl,liposome,Spermidine,或virosome。HepatogeneHuH-7(Hepatoma-derived Growth Factor),rhoB,c-myc,TR3 orphan receptor,TGF-alpha,N-RAS,and HGF,liposome,或Fugene。LeukogeneBCL-6,Bcr-Abl,N-Ras,liposome,或Fugene。BreastogeneBRCA1 and 2,erbB-2,Estrogen receptor,。BraintumogeneN-RAS,liposome,或Fugene。
其中Dermogene、Lungene、Hepatogene、Leukogene、Breastogene和Braintumogene是本发明中基因药物的名称,而其它术语为不同的SDSO分子的名称,它们的相应序列如表18所示。这些SDSO分子能够有效地抑制相应的mRNA分子的功能,并与其它辅助成份一起组成治疗不同肿瘤的基因药物。治疗病毒和真菌感染对病毒和真菌感染的治疗战略是,通过增强自然的存在于生物体内的抗病毒和真菌的双链寡聚核苷酸的防御机制来达到治疗目的。短小的DsRNA是一种极好的抗病毒的活性成份,将其在体外放大后,通过适当的途径,如雾化吸入来防治感冒与合胞病毒的感染等,通过外用来抑制胞疹病毒所引起的皮肤性疾病。通过系统注射来对付艾滋病等。例如,这里筛选和设计了对抗艾滋病的基因的SDSO分子,此基因药物被命名为AIDSogene,其中的活性成份包括但不局限于蛋白酶(Protease)、多聚酶(polymerase)、整合酶(integrase)、转激活蛋白(transactivating protein)、病毒蛋白表达调节子(regulator of expression of virion protein)、病毒感染因子(viral infectivity factor)、gp120和gp41分子。
相似,其它许多根据本发明中所推荐的方法能够设计和精选出其它多种特异的SDSO分子。用它们来治疗其它不同种的病毒或真菌感染。通过不同的给药途径来防治这些由病毒或真菌引起的疾病。治疗遗传性疾病遗传病是另一类难医治的疾病。它涉及到基因结构和基因表达程度的改变。所以,怎样关闭那些不正常的基因和过表达的基因,亦是本发明的基因药物的主要对象之一。与治疗肿瘤和病毒性感染等疾病的原理一样,设计和精选出那些特异的SDSO分子,使它们具有与相应的致病基因中某特定区域有100%的同源性,在这些分子的特异引导下,用有关的核酸酶去切断那些不要的mRNA分子,从而去医治有关的遗传性疾患,如老年性痴呆症和高血压病等。本发明已揭示和列举了一些具体的实例和方法的应用。显然,那些具有这方面知识和技术的人将根据本发明的提示和设想,能很容易地做出类似的或进一步改进的技术和方法,以及获得直接或间接的结果。所以,本发明附加的申请包括但不局限于所有相关的具体实例和等价的修饰或改进。
8核苷酸序列序列1 一个内源性的RNAl干扰基因,人Iet-7 RNA基因的有关序列(黑色)。其中蓝色代表Iet-7RNA基因正意链的序列,而红色代表一段与Iet-7RNA基因以反向平行的方式相互补的序列。 序列2.由MUSCA序列型程式所从人PRKWNK4基因中搜索到的有关CGGAG,CGGGA和它们的衍生序列型式。人旦白激酶(PRKWNK4)NM_032387.1 GI152773111 gccctgctct ttcctcatgt tggcaatccc cggccacgga gaccaccgtc ctcatgtccc61 agactgaggc cgacctggcc ctgcggcccc cgcctcctct tggcaccgcg gggcagcccc121 gcctcgggcc ccctcctcgc cgagcgcgcc gcttctccgg gaaggctgag ccccggccgc181 gctcttctcg tctcagccgc cgtagctcag tcgacttggg gctgctgagc tcttggtccc241 tgccagcctc acccgctccg gacccccccg atcctccgga ctccgctggt cctggccccg301 cgaggagccc accgcctagc tccaaagaac cccccgaggg cacgtggacc gagggagccc361 ctgtgaaggc tgcggaagac tccgcgcgtc ccgagctccc ggactctgca gtgggcccgg421 ggtccaggga gccgctaagg gtccctgaag ctgtggccct agagcggcgg cgggagcagg481 aagaaaagga ggacatggag acccaggctg tggcaacgtc ccccgatggc cgatacctca541 agtttgacat cgagattgga cgtggctcct tcaagacggt gtatcgaggg ctagacaccg601 acaccacagt ggaggtggcc tggtgtgagc tgcagactcg gaaactgtct agagctgagc661 ggcagcgctt ctcagaggag gtggagatgc tcaaggggct gcagcacccc aacatcgtcc721 gcttctatga ttcgtggaag tcggtgctga ggggccaggt ttgcatcgtg ctggtcaccg781 aactcatgac ctcgggcacg ctcaagacgt acctgaggcg gttccgggag atgaagccgc841 gggtccttca gcgctggagc cgccaaatcc tgcgg act tcatttccta cactcccggg901 ttcctcccat cctgcaccgg gatctcaagt gcgacaatgt ctttatcacg ggacctactg961 gctctgtcaa aatcgg ac ctgggcctgg ccacgctcaa gcgcgcctcc tttgccaaga1021 gtgtcatcgg gaccccggaa ttcatggccc ccgagatgta cgaggaaaag tacgatgagg1081 ccgtggacgt gtacgcgttc ggcatgtgca tgctggagat ggccacctct gagtacccgt1141 actccgagtg ccagaatgcc gcgcaaatct accgcaaggt cacttcgggc agaaagccga1201 acagcttcca caaggtgaag atacccgagg tgaaggagat cattgaaggc tgcatccgca1261 cggataagaa cgagaggttc accatccagg acctcctggc ccacgccttc ttccgcgagg1321 agcgcggtgt gcacgtggaa ctagcggagg aggacgacgg cgagaagccg ggcctcaagc1381 tctggctgcg catggaggac gcgcggcgcg g ggcgccc acgggacaac caggccatcg1441 agttcctgtt ccagctgggc cgggacgcgg ccgaggaggt ggcacaggag atggtggctc1501 tgggcttggt ctgtgaagcc gattaccagc cagtggcccg tgcagtacgt gaacgggttg1561 ctgccatcca gcgaaagcgt gagaagctgc gtaaagcaag ggaattggag gcactcccac1621 cagagccagg acctccacca gcaactgtgc ccatggcccc cggtcccccc agtgtcttcc1681 cccctgagcc tgaggagcca gaggcagacc agcaccagcc cttccttttc cgccacgcca1741 gctactcatc taccacttcg gattgcgaga ctgatggcta cctcagctcc tccggcttcc1801 gctgagtccc atctctgcct gccctcggct tttgccctat ccattccacg ttctggccct1861 ggaagtgact tttcccccgg ggacagctat gcctcagatg cagcttcagg ccttagcgat1921 gtgggagaag ggatgggaca aatgaggaga cccccaggga ggaatctccg gcgcagaccc1981 cgatcccggc tgcgggtcac tagtgtctca gaccagaatg acagagtggt tgagtgccag2041 ctacagaccc ataacagcaa gatggtgacc ttccgatttg atctggatgg ggacagcccg2101 gaagagattg cagctgccat ggtatataac gagttcattc tgccttcgga gcgagatgga2161 tttctcagac ggattcggga gattatccag cgagtggaga ccctgttgaa gagagacact2221 ggccccatgg aggctgctga agacacccta agcccccagg aggagccagc accattacct2281 gccctgcccg tccccctccc agacccatcc aatgaagagc tccagagcag cacctccctg2341 gagcacagga gctggacagc cttctccacc tcctcatctt ctcctggaac tcctttgtct2401 cctggaaacc cattttcccc tggaaccccc atttccccag gtcccatctt ccccatcact2461 tctcccccat gtcatcccag cccctcccca ttctccccca tttcttccca ggtctcctca2521 aatccctctc cacaccccac cagctctcca cttccattct cctccagcac acccgagttt2581 ccggtcccac tctctcagtg tccctggagt tctctcccca cgacttctcc acctacgttc2641 tctcccactt gttctcaggt cactcttagt tcccctttct ttcctccgtg cccctccact2701 tcttccttcc cctccaccac agcagcccct ctcctttctc tggctagtgc cttctcactg2761 gctgtgatga ctgtggccca gtccctgctg tccccctcac ctgggctcct ttcccagtct2821 cctccagccc ctcctagtcc cctccctagc ctgccccttc cccctcccgt tgctcctggt2881 ggccaggaaa gcccttcacc ccacacagct gaggtggaga gtgaggcctc accacctcct2941 gctcggcccc tcccagggga agccaggctg gcgcccatct ctgaagaggg aaagccgcag3001 cttgttgggc gtttccaagt gacttcatcc aaggaaccgg ctgagcctct tcccttgcag3061 ccaacatccc ccactctctc tggttctcca aaaccttcaa cccctcagct cacttcagag3121 agctcagata cagaggacag tgctggaggc gggccagaga ccagggaagc tctggctgag3181 agcgaccgtg cagctgaggg tctgggggct ggagttgagg aggaaggaga tgatgggaag3241 gaaccccaag ttgggggcag cccccaaccc ctgagccatc ccagcccagt gtggatgaac3301 tactcctaca gcagcctgtg tttgagcagc gaggagtcag aaagcagtgg ggaagatgag3361 gagttctggg ctgagctgca gagtcttcgg cagaagcact tgtcagaggt ggaaacacta3421 cagacactac agaaaaaaga aattgaagat ttgtacagcc ggctggggaa gcagccccca3481 ccgggtattg tggccccagc tgctatgctg tccagccgcc agcgccgcct ctccaagggc3541 agcttcccca cctcccgccg caacagccta cagcgctctg agcccccagg ccctggcatc3601 atgcgaagga actctctgag tggcagcagc accggctccc aggagcagcg ggcaagcaag3661 ggggtgacat tcgccgggga tgttggcagg atgtga表18 由本发明中系统选择法和简便选择法所精选出的序列。
9参考文献The international SNP map working group,2001,Nature 409928-933Aravin AA.,etal,2001,Curr Biol Jul 10;11(13)1017-27Bernstein,E.,et al.,(2001)Nature,(London)409,363-366.Brown,2000,Bioinformatics Eaton PublishingCaplen,N.J.,Fleenor,J.,Fire,A.& Morgan,R.A.(2000)Gene 252,95-105.Carthew,R.W.(2001)Curr.Opin.Cell Biol. 13,244-248.Cirino NM,et al.,1997,Proc Natl Acad Sci USA 941937.Cogoni,C.& Macino,G.(2000)Curr.Opin.Genet.Dev.10,638-643.Durbin et al,1998,Biological sequence analysis.Cambridge University PressElbashir,S.M.,Lendeckel,W.& Tuschl,T.(2001)Genes Dev.15,188-200.Fire,A.& Mello,C.C.(1999)Cell 99,123-132.Fire,A.(1999)Trends Genet.15,358-363.Frischmeyer,P.A.& Dietz,H.C.(1999)Hum.Mol.Genet.8,1893-1900.Hamilton,A.J.& Baulcombe,D.C.(1999)Science 286,950-952.Hammond,S.M.,etal.,2000,Nature(London)404,293-296.Higgns et al,2000 Bioinformatics.Oxford University PressKasschau,K.D.& Carrington,J.C.(1998)Cell 95,461-470.Ketting,R.F.,et al.,(1999)Cell 99,133-141.Lesiak K,et al.,.1993,Bioconjugate Chem 4467.Llave,C.,et al.,(2000)Proc.Natl.Acad.Sci.US4 97,13401-13406.Lockhart,et al.,2000,Nature 405827-838Maitra RK.et al.,1995,J Biol Chem 27015071.Marcotte,et al,2001,Trends in Pharmacological Science 22426-437Matzke,M.A.,et al.,(2001)Curr.Opin,Genet.Dev.11,221-227.Mitchell,P.& Tollervey,D.(2000)Curr.Opin.Genet.Dev.10,193-198.Nakano,H.,et al.,(2000),Biochem.Biophys.Res.Commun.274,434-439.Oelgeschlager,M.,et al.,(2000),Nature,(London) 405,757-763.Parrish,S.,etal.,(2000)Mol.Cell.6,1077-1087.Svoboda,P.,et al.,(2000),Development,(Cambridge,U.K.)127,4147-4156.Szczylik C,et al.,1991.,Science 253562.Tabara,H.,Sarkissian,M.,Kelly,W.G.,Fleenor,J.,Grishok,A.,Timmons,L.,Tuschl,T.,et al.,(1999)Genes Dev.13,3191-3197.Ui-Tei,K.,Zenno,S.,Miyata,Y.& Saigo,K.(2000)FEBS Lett.479,79-82.Wargelius,A.,et al.,(1999),Biochem.Biophys.Res.Commun.263,156-161.Wianny,F.& Zernicka-Goetz,M.(2000)Nat.Cell Biol.2,70-75.Wolffe,A.P.& Matzke,M.A.(1999)Science 286,481-486.Zamore,P.D.,Tuschl,T.,Sharp,P.A.& Bartel,D.P.(2000)Cell 101,25-33.10 SEQUENCE LISTING<110> Yin,Dongsheng Yin,James Q.<120> Method for design and selection of short double-strandedoligonucleotides as gene drugs and compounds of gene drugs<130> 01-2793<140> 01144177.1<141> 2001-12-14<160> 53<170> PatentIn version 3.1<210> 1<211> 720<212> DNA<213> Homo sapiens<400> 1tcacacagga aaccaggatt accgaggagg aaaaaaagcc ttcctgtggt gctcaactgt 60gattcctttt caccattcac cctggatgtt ctcttcactg tgggatgagg tagtaggttg 120tatagtttta gggtcacacc caccactggg agataactat acaatctact gtctttccta 180acgtgataga aaagtctgca tccaggcggt ctgatagaaa gtcagttaac taattgtaca 240gataatttta tgttgaaatt ttctttcgaa agagattgta ctttccattc cagaagaaaa 300cattgctcta tcagagtgag gtagtagatt gtatagttgt ggggtagtga ttttaccctg 360ttcaggagat aactatacaa tctattgcct tccctgagga gtagacttgc tgcattattt 420tctttttatt tagatgatat taaaactcag aagaattaat tttgacattt tgtatttaca 480aattagaaac aaaactcaaa gaacatgacc taatttaaca ggttaatttg aagtgcatct 540gccaagtaga agaccagcaa gaaaaaaaaa atgggttcct aggaagaggt agtaggttgc 600atagttttag ggcagggatt ttgcccacaa ggaggtaact atacgacctg ctgcctttct 660tagggcctta ttattcaccg ataacctgtt tccttgctac tttgctttgg tgtaagcaga 720<210> 2<211> 3696<212> DNA<213> Homo sapiens<400> 2gccctgctct ttcctcatgt tggcaatccc cggccacgga gaccaccgtc ctcatgtccc 60agactgaggc cgacctggcc ctgcggcccc cgcctcctct tggcaccgcg gggcagcccc 120gcctcgggcc ccctcctcgc cgagcgcgcc gcttctccgg gaaggctgag ccccggccgc 180gctcttctcg tctcagccgc cgtagctcag tcgacttggg gctgctgagc tcttggtccc 240tgccagcctc acccgctccg gacccccccg atcctccgga ctccgctggt cctggccccg 300cgaggagccc accgcctagc tccaaagaac cccccgaggg cacgtggacc gagggagccc 360ctgtgaaggc tgcggaagac tccgcgcgtc ccgagctccc ggactctgca gtgggcccgg 420ggtccaggga gccgctaagg gtccctgaag ctgtggccct agagcggcgg cgggagcagg 480aagaaaagga ggacatggag acccaggctg tggcaacgtc ccccgatggc cgatacctca 540agtttgacat cgagattgga cgtggctcct tcaagacggt gtatcgaggg ctagacaccg 600acaccacagt ggaggtggcc tggtgtgagc tgcagactcg gaaactgtct agagctgagc 660ggcagcgctt ctcagaggag gtggagatgc tcaaggggct gcagcacccc aacatcgtcc 720gcttctatga ttcgtggaag tcggtgctga ggggccaggt ttgcatcgtg ctggtcaccg 780aactcatgac ctcgggcacg ctcaagacgt acctgaggcg gttccgggag atgaagccgc 840gggtccttca gcgctggagc cgccaaatcc tgcggggact tcatttccta cactcccggg 900ttcctcccat cctgcaccgg gatctcaagt gcgacaatgt ctttatcacg ggacctactg 960gctctgtcaa aatcggggac ctgggcctgg ccacgctcaa gcgcgcctcc tttgccaaga 1020gtgtcatcgg gaccccggaa ttcatggccc ccgagatgta cgaggaaaag tacgatgagg 1080ccgtggacgt gtacgcgttc ggcatgtgca tgctggagat ggccacctct gagtacccgt 1140actccgagtg ccagaatgcc gcgcaaatct accgcaaggt cacttcgggc agaaagccga 1200acagcttcca caaggtgaag atacccgagg tgaaggagat cattgaaggc tgcatccgca 1260cggataagaa cgagaggttc accatccagg acctcctggc ccacgccttc ttccgcgagg 1320agcgcggtgt gcacgtggaa ctagcggagg aggacgacgg cgagaagccg ggcctcaagc 1380tctggctgcg catggaggac gcgcggcgcg gggggcgccc acgggacaac caggccatcg 1440agttcctgtt ccagctgggc cgggacgcgg ccgaggaggt ggcacaggag atggtggctc 1500tgggcttggt ctgtgaagcc gattaccagc cagtggcccg tgcagtacgt gaacgggttg 1560ctgccatcca gcgaaagcgt gagaagctgc gtaaagcaag ggaattggag gcactcccac 1620cagagccagg acctccacca gcaactgtgc ccatggcccc cggtcccccc agtgtcttcc 1680cccctgagcc tgaggagcca gaggcagacc agcaccagcc cttccttttc cgccacgcca 1740gctactcatc taccacttcg gattgcgaga ctgatggcta cctcagctcc tccggcttcc 1800gctgagtccc atctctgcct gccctcggct tttgccctat ccattccacg ttctggccct 1860ggaagtgact tttcccccgg ggacagctat gcctcagatg cagcttcagg ccttagcgat 1920gtgggagaag ggatgggaca aatgaggaga cccccaggga ggaatctccg gcgcagaccc 1980cgatcccggc tgcgggtcac tagtgtctca gaccagaatg acagagtggt tgagtgccag 2040ctacagaccc ataacagcaa gatggtgacc ttccgatttg atctggatgg ggacagcccg 2100gaagagattg cagctgccat ggtatataac gagttcattc tgccttcgga gcgagatgga 2160tttctcagac ggattcggga gattatccag cgagtggaga ccctgttgaa gagagacact 2220ggccccatgg aggctgctga agacacccta agcccccagg aggagccagc accattacct 2280gccctgcccg tccccctccc agacccatcc aatgaagagc tccagagcag cacctccctg 2340gagcacagga gctggacagc cttctccacc tcctcatctt ctcctggaac tcctttgtct 2400cctggaaacc cattttcccc tggaaccccc atttccccag gtcccatctt ccccatcact 2460tctcccccat gtcatcccag cccctcccca ttctccccca tttcttccca ggtctcctca 2520aatccctctc cacaccccac cagctctcca cttccattct cctccagcac acccgagttt 2580ccggtcccac tctctcagtg tccctggagt tctctcccca cgacttctcc acctacgttc 2640tctcccactt gttctcaggt cactcttagt tcccctttct ttcctccgtg cccctccact 2700tcttccttcc cctccaccac agcagcccct ctcctttctc tggctagtgc cttctcactg 2760gctgtgatga ctgtggccca gtccctgctg tccccctcac ctgggctcct ttcccagtct 2820cctccagccc ctcctagtcc cctccctagc ctgccccttc cccctcccgt tgctcctggt 2880ggccaggaaa gcccttcacc ccacacagct gaggtggaga gtgaggcctc accacctcct 2940gctcggcccc tcccagggga agccaggctg gcgcccatct ctgaagaggg aaagccgcag 3000cttgttgggc gtttccaagt gacttcatcc aaggaaccgg ctgagcctct tcccttgcag 3060ccaacatccc ccactctctc tggttctcca aaaccttcaa cccctcagct cacttcagag 3120agctcagata cagaggacag tgctggaggc gggccagaga ccagggaagc tctggctgag 3180agcgaccgtg cagctgaggg tctgggggct ggagttgagg aggaaggaga tgatgggaag 3240gaaccccaag ttgggggcag cccccaaccc ctgagccatc ccagcccagt gtggatgaac 3300tactcctaca gcagcctgtg tttgagcagc gaggagtcag aaagcagtgg ggaagatgag 3360gagttctggg ctgagctgca gagtcttcgg cagaagcact tgtcagaggt ggaaacacta 3420cagacactac agaaaaaaga aattgaagat ttgtacagcc ggctggggaa gcagccccca 3480ccgggtattg tggccccagc tgctatgctg tccagccgcc agcgccgcct ctccaagggc 3540agcttcccca cctcccgccg caacagccta cagcgctctg agcccccagg ccctggcatc 3600atgcgaagga actctctgag tggcagcagc accggctccc aggagcagcg ggcaagcaag 3660ggggtgacat tcgccgggga tgttggcagg atgtga 3696<210> 3<211> 19<212> DNA<213> Artificial<400> 3tcagttacgg aaacgatgc 19<210> 4<211> 19<212> DNA<213> Artificial<400> 4gattatgcgg atcaaacct 19<210> 5<211> 19<212> DNA<213> Artificial<400> 5cgggacccgg tcgccagga 19<210> 6<211> 19<212> DNA<213> Artificial<400> 6atccgcacgg ataagaacg 19<210> 7<211> 19<212> DNA<213> Artificial<400> 7tgcgacccgg acgacgaga 19<210> 8<211> 19<212> DNA<213> Artificial<400> 8ccagcttcgg aacaagaga 19<210> 9<211> 19<212> DNA<213> Artificial<400> 9tgaacaacgg attgagcta 19<210> 10<211> 19<212> DNA<213> Artificial<400> 10agaggaacgg agcgagtcc 19<210> 11<211> 19<212> DNA<213> Artificial<400> 11atgtcaccgg agttgtgcg 19<210> 12<211> 19<212> DNA<213> Artificial<400> 12gactcgccgg gccctattc 19<210> 13<211> 19<212> DNA<213> Artificial<400> 13atgtccacgg aagaggaga 19<210> 14<211> 19<212> DNA<213> Artificial<400> 14aagatcccgg acgcacaga 19<210> 15<211> 19<212> DNA<213> Artificial<400> 15ccttcagcgg ccagtagca 19<210> 16<211> 19<212> DNA<213> Artificial<400> 16aaagctccgg gtcttaggc 19<210> 17<211> 19<212> DNA<213> Artificial<400> 17gagtctccgg ggctctatg 19<210> 18<211> 19<212> DNA<213> Artificial<400> 18tgccccccgg agccgcgag 19<210> 19<211> 19<212> DNA<213> Artificial<400> 19gaggctgcgg attgtgcga 19<210> 20<211> 19<212> DNA<213> Artificial<400> 20ctttctacgg acgtgggat 19<210> 21<211> 19<212> DNA<213> Artificial<400> 21tttctgccgg agagctttg 19<210> 22<211> 19<212> DNA<213> Artificial<400> 22aagattccgg gagttggtg 19<210> 23<211> 19<212> DNA<213> Artificial<400> 23gccggcccgg attgacgag 19<210> 24<211> 19<212> DNA<213> Artificial<400> 24aaggggtcgg tggaccggt 19<210> 25<211> 19<212> DNA<213> Artificial<400> 25ggtggaccgg tcgatgtat 19<210> 26<211> 19<212> DNA<213> Artificial<400> 26ctgtgcacgg aactgaaca 19<210> 27<211> 19<212> DNA<213> Artificial<400> 27gtgcctgcgg tgccagaaa 19<210> 28<211> 19<212> DNA<213> Artificial<400> 28gcaagttcgg cagcagctt 19<210> 29<211> 19<212> DNA<213> Artificial<400> 29atagttgcgg agagtctgc 19<210> 30<211> 19<212> DNA<213> Artificial<400> 30tgaatttcgg cacctgcaa 19<210> 31<211> 19<212> DNA<213> Artificial<400> 31tcccagaacg gaggcgaac 19<210> 32<211> 19<212> DNA<213> Artificial<400> 32tacattccgg aaagattgt 19<210> 33<211> 19<212> DNA<213> Artificial<400> 33gttattttgg ttcgagaga 19<210> 34<211> 19<212> DNA<213> Artificial<400> 34taatgggggc gagctgttt 19<210> 35<211> 19<212> DNA<213> Artificial<400> 35tggaccccgg attgctgct 19<210> 36<211> 19<212> DNA<213> Artificial<400> 36ctctgagcgg gaaggtgag 19<210> 37<211> 19<212> DNA<213> Artificial<400> 37aaaaaagcgg agacaggag 19<210> 38<211> 19<212> DNA<213> Artificial<400> 38ccatcccgac ctcgcgcta 19<210> 39<211> 19<212> DNA<213> Artificial<400> 39gtttctacgg gaaatcatt 19<210> 40<211> 19<212> DNA<213> Artificial<400> 40cgccattgca cgtgccctg 19<210> 41<211> 19<212> DNA<213> Artificial<400> 41tccagtcgga tgtctactc 19<210> 42<211> 19<212> DNA<213> Artificial<400> 42tcagcgccgg gcatcagat 19<210> 43<211> 19<212> DNA<213> Artificial<400> 43ctttgctcgg aagacgttc 19<210> 44<211> 19<212> DNA<213> Artificial<400> 44aagagagcgg gcaccagta 19<210> 45<211> 20<212> DNA<213> Artificial<400> 45tcccgcctgt gacatgcatt20<210> 46<211> 19<212> DNA<213> Artificial<400> 46cttcgagcgg atccgcaag 19<210> 47<211> 19<212> DNA<213> Artificial<400> 47gaggtgtcgg accgcatca 19<210> 48<211> 19<212> DNA<213> Artificial<400> 48catgttccgg gacaaaagc 19<210> 49<211> 19<212> DNA<213> Artificial<400> 49acaactacgg agttgccat 19<210> 50<211> 19<212> DNA<213> Artificial<400> 50tcaaagtcgg acagcctca 19<210> 51<211> 19<212> DNA<213> Artificial<400> 51gtttctgcgg atgcttctg 19<210> 52<211> 19<212> DNA<213> Artificial<400> 52ctcttagcgg ttatccacg 19<210> 53<211> 19<212> DNA<213> Artificial<400> 53atgaccggga gtcgtggcc 19
权利要求
1一个完整制备基因药物的过程,它包括筛选、预测、鉴定和合成19-25个核苷酸长的双链寡聚核苷酸分子并将它们组装成特异而高效的基因药物,用于治疗多种不同的病毒性感染、肿瘤和遗传性疾病。具体的步骤如下● 用基因和蛋白质芯片技术精选那些过度表达的致病基因;● 用生物计算机信息技术和人体基因库搜索技术来鉴定一个特异的位于一个致病基因中的高保守DNA序列(Motif);● 根据特定的基因序列型式(Sequence Pattern)来预测一个基因内哪些片段可用来配制其同源的一个短小的双链寡聚核苷酸(SDSO);● 用DNA/RNA自动合成仪来合成短小的双链寡聚核苷酸分子;● 组装一组相关的SDSO分子成为特异而高效的基因药物。
2一个鉴定人体基因组中特异DNA序列的过程(系统,它包括● 借助计算机和特殊的软件来鉴定人体基因组中有关的内源性的短小的干扰RNA(siRNA)序列;● 使用多序列排列程式和特定的序列型式测定技术以及人体基因数据库搜索技术来寻找那些位于不同种属的相同基因内的高保守序列;● 精选出一个具有19-25个核苷酸长的特定序列,它与同一基因家族的大部分或所有成员的相关的DNA片段100%的相同;● 估价这精选出的19-25个核苷酸长的序列,标准是这一序列必须与其家族的成员基因的某一片段100%的相同,而与其它基因家族的DNA序列没有或者只有不到80%的相似性。
3在申明(1)或(2)的条款中,一个19-25个核苷酸长的序列是一段基因内的DNA片段,它能被用来作为合成一个19-25个核苷酸长的双链寡聚核苷酸(SDSO)的模板。
4在申明(1)的条款中,特定的基因序列型式是一个酶切中心序列像CGGA(U)T,CGGGA和它们的衍生序列,这个酶切中心位于SDSO分子的正意链上,而它们的互补序列,AU(T)CCG、U(T)CCCG及它们的衍生序列位于SDSO分子的反意链上,酶切中心的第二个G应位于SDSO分子的开端下游的第十或第十一位上。
5在申明(1)或(3)条款中,短小的双链寡聚核苷酸(SDSO)是一个19-25个核苷酸长的dsRNA或sRNA-cDNA或dsDNA分子。
6在申明(5)条款中,所说的sRNA-cDNA中的cDNA是寡聚核苷酸双链中的一条反意链,而sRNA是寡聚核苷酸双链中的一条正意链。
7在中明(1)、(2)、(3)、(4)和(5)条款中,19-25个核苷酸长的双链寡聚核苷酸是一个SDSO分子,它能够与一个编码蛋白质或具有其它生物功能的RNA分子特异地杂交,从而干扰其活性或灭活其功能。此外,它亦可能调节相应的基因组DNA上特异片段的甲基化,而导致相应基因的关闭。
8在申明(1)条款中,所指的内源性的短小的干扰RNA(siRNA)序列是基因组DNA上一个位于基因间区或基因的内含子区中的序列,这段序列能够形成一个长19-25个核苷酸的反向平行互补的双链核苷酸分子。
9在申明(1)和(8)的条款中,内源性的siRNA的来源包括不编码蛋白质的基因间区和编码蛋白质基因的内含子区。
10基因药物的配方,它包括但不局限于下述的所有或部分成份药效成份、一个或多个核酸压缩成份、一个或多个药效上能接受的载体、一个或多个特异的靶导蛋白质或多肽、其它的活性成份、辅助成份或添加剂。
11在申明(10)中的药效成份,它是一个19-25个核苷酸长的双链寡聚核苷酸(dsRNA、sRNA-cDNA和/或dsDNA),它具有一个酶切中心,能有效地抑制一个动物,特别是人体内的一种mRNA的表达。
12在申明(10)中的药效成份,它是一组由一种或多种双链寡聚核苷酸组成,能与相应的RNA分子中的特异靶序列杂交的分子。
13在申明(10)中的配方,它是一系列的能有效地灭活相应的mRNA分子的19-25个核苷酸长的双链寡聚核苷酸。它们包括下列序号的双链寡聚核苷酸分子。它们是1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37。
14在申明(1)、(2)、(3)、(4)和(5)条款中,19-25个核苷酸长的双链寡聚核苷酸也可用来做为预防疾病、促进健康和美化容貌的一种途经或一种产品中的成份。
15在申明(10)中的配方,是一种混合物,由一种或多种不同形式的双链寡聚核苷酸分子,以等量或不等量的方式,或以任何其它的配伍形式所组成,特别适用于治疗不同的肿瘤。
16在中明(10)中的配方,它是一种短小的双链寡聚核苷酸分子,在它的正意链中包括一个酶切中心序列,这个酶切中心的序列包括但不局限于CGGAU(T),CGGAA,CGGAC,CGGAG,CGGGC,CGGGA,CGGGU(T),CGGGG,CGGU(T)A,CGGU(T)C,CGGU(T)G,和CGGU(T)U(T)。酶切中心序列是一个19-25个核苷酸长的序列中的关键部分,这个部分可作为预测一个基因中某个片段是否可作为一种灭活那个相应基因的有效的药物成份的根据。
17在申明(10)中的配方,它是一种双链寡聚核苷酸分子,它也许是一种杂合式的寡聚核苷酸分子。
18一种由申明(14)中的混合物和一种药效上可接受的载体或一种稀释剂组成的复合物。
19在中明(10)中的配方,它可进一步形成一种胶质状的分散系统。
20一种简便的选择方法,它包括一个酶切中心序列的确定和六个具体的步骤,这个简便的选择方法可用于精选特异而高效的SDSO分子和反意寡聚核苷酸分子(ASO)。
全文摘要
本发明集RNA干扰技术、人体基因库搜索技术、生物计算机信息技术、生物芯片技术和基因工程技术为一体,提供一种实用的方法,以便能更好地设计和预测高特异性的基因片断,用其作为高效的基因药物,来灭活一组相关的致病基因。本发明特别涉及一个完整的基因药物的制备过程,它包括精选致病的靶基因,鉴定内源性的siRNA序列,预测特效的SDSO分子,将一种或多种天然的SDSO分子、运载成份、靶导成份和其它有关的辅助成份组装成新型的基因药物,来防治多种病毒性感染、肿瘤和遗传性疾病。本发明进一步亦包括基因药物的配方,尤其是那些含有一个酶切中心序列(5’-CGGAU-3’5’-CGGGA-3’或它们的衍生序列),由21对核苷酸组成的双链寡聚核苷酸分子。
文档编号A61P35/00GK1427008SQ0114417
公开日2003年7月2日 申请日期2001年12月14日 优先权日2001年12月14日
发明者殷冬生, 殷勤伟 申请人:殷冬生, 殷勤伟
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1