Rna分子及其应用的制作方法

文档序号:601481阅读:683来源:国知局
专利名称:Rna分子及其应用的制作方法
技术领域
本发明涉及能够调节靶基因表达的短RNA分子及其设计、合成和应用。
背景技术
RNA干扰(RNAi)是一种重要的基因调节机制,它能够引起靶mRNA的序列特异下调。RNAi通过“干扰RNA (iRNA)”介导;干扰RNA是概括性术语,包括多种在RNAi过程中起作用的短双链RNA (dsRNA)分子。外源dsRNA能够被核糖核酸酶蛋白Dicer加工成19至25个碱基对的双链片段,所述片段的每一个3’末端均有几个未结合的碱基,形成3’突出。这些短双链片段被定义为小干扰RNA (siRNA),这些分子导致靶基因下调表达。基于它们功能的阐·明,siRNA已经被用作下调特定基因的工具。它们可以提供瞬时抑制;或者当它们稳定地结合成短发夹环RNA (shRNA)时,它们可以提供稳定抑制。siRNA和shRNA已经被广泛地应用于“敲减”或“功能丧失”实验,在这些实验中,通过观察目标基因表达的减少效果研究该基因的功能。RNAi被认为是具有作为绘制和注释基因组的技术的潜在益处。同样已经尝试开发在治疗中应用RNA干扰。一种被称为RNA诱导的沉默复合体(RISC)的蛋白复合体与siRNA链之一结合并使用这条链作为识别靶mRNA的向导。依赖于向导RNA和mRNA之间的互补性,RISC破坏或抑制该mRNA的翻译。元全互补导致mRNA断裂和破坏,并且作为断裂的结果,mRNA不g纟再被翻译成蛋白。部分互补(特别是mRNA的3’未翻译区(UTR)中的位点)导致翻译抑制。RNAi在多数真核生物中是保守的,并且通过引入外源siRNA,RNAi可以被用作下调特定基因的工具。最近已经发现,尽管RISC主要调节基因的转录后,但是RNAi也可以调节基因转录本身。在裂殖酵母中,小RNA通过RISC复合体的类似物调节染色质。所述载有RNA的RISC复合体明显地结合非编码RNA(ncRNA)并因此将组氨酸修饰蛋白补充至ncRNA位置。植物、苍蝇、线虫、纤毛虫和真菌也具有类似的机制。在哺乳动物中,精确的机制仍然不清楚,但是人们相信,短RNA通过祀定以破坏转录本而调节转录,所述转录本是被调节的RNA的正义或反义链并且被推测为是非编码转录本。基于RNA靶的性质,通过RNA靶定破坏这些非编码转录本对表观遗传调节模式具有不同作用。破坏对于给定的mRNA是正义链的ncRNA靶导致该mRNA的转录抑制,而破坏对于给定的mRNA是反义链的ncRNA祀导致所述mRNA的转录激活。通过靶定这样的反义转录本,RNAi因此可以被用于上调特定基因。导致靶基因上调的短RNA分子被定义为短活化RNA分子(saRNA)。通过使用saRNA上调靶基因的已知方法包括:测定与目标靶基因反义的RNA转录本,设计下调所述鉴定的转录本的短RNA分子。从已知转录本或EST的数据库鉴定靶反义RNA转录本,所述已知转录本或EST位于目标基因的基因座周围的基因组区域中。可选地,反转录酶PCR (RT-PCR)(一种用于鉴定RNA的公知手段)被用于鉴定可能的靶RNA转录本。例如,US2009/0092988公开了一种选择性调节哺乳动物细胞的基因组中靶基因的表达的方法,包括:检测编码的反义转录本的存在并用外源双链RNA接触所述转录本,所述外源双链RNA与所述转录本的一部分互补。该发明人已经提供了一种设计上调靶基因的短活化RNA分子的新的算法/方法。该设计方法发现了在包括涉及多潜能性基因的基因组中的广泛适用性。Kruppel样因子4 (消化道)(KLF4)是一种重要的维持胚胎干(ES)细胞的转录因子。KLF4和三种其它转录因子P0U5F1 (也被称为0CT3/4)、S0X2和MYC的异位表达已经显示出将小鼠和人的成纤维细胞改编成诱导性多潜能干(iPS)细胞。一项近期的关于ES细胞转录网络的研究表明,KLF4是控制其它多潜能因子(包括P0U5F1、S0X2、MYC和NAN0G)的表达的主要调节因子[Kim等(2008) Cell 132:1049-1061]。诱导性多潜能干细胞(iPSC)的发展已经成为理解干细胞领域的里程碑。iPSC技术依赖于四种基因KLF4、P0U5F1 (0ct3/4)、S0X2和MYC的上调,或者在某些细胞中,依赖于这四种基因中的几个和其它多潜能因子如NANOG和LIN28的上调。这通过将这些基因遗传引入至非胚胎干细胞而实现。已经怀疑操纵KLF4表达因此可以是控制干细胞的一种有效方法。可以通过上面提及的基因的激活将非胚胎细胞(如成纤维细胞)诱导成多潜能干细胞状态。从治疗观点,iPSC的主要优势是病患自己的成纤维细胞可以被改编以产生干细胞,这排除了对于免疫抑制药物或匹配组织相容性基因的需要。目前上调多潜能因子的表达的方法需要引入额外拷贝的所述基因(在该领域中被认为是干性(sternness)基因),该引入过程可以通过使用病毒以将额外拷贝的基因引入至宿主基因组中或者通过引入表达额外拷贝的干性基因的质粒。因此,对于KLF4和其它干性因子的上调,普遍地需要将表达载体侵入性地瞬时转染或稳定地病毒转导至细胞。目前的方法包括上调制剂的非瞬时应用。这些方法的一个限制是它们的效果是相似地非瞬时的,即,被诱导的干细胞不能扩增并被改编以分化。

发明内容
本发明的发明人已经开发了新的短RNA分子,这些短RNA分子能够实现上调或下调靶基因并克服与上述现有方法相关的问题。特别地,本发明的分子具有较少的侵入性并且它们的作用是瞬时的。因此,本发明的发明人已经提供了新的短RNA分子,所述短RNA分子靶定宿主细胞中的RNA转录本以调节靶基因,特别是作为诱导多潜能基因的靶基因或引起分化的基因。本发明的短RNA是比现有技术的表达载体小的分子,因此具有较少的侵入性;但是,本发明的分子使用宿主自身的调节系统以调节基因的事实同样比向宿主中引入额外拷贝的基因具有较少的侵入性。本发明的短RNA可以上调靶基因的mRNA和蛋白水平。本发明的算法设计方法导致设计上调靶基因表达的短活化RNA分子(saRNA)。本文所证明的是完全不同的选择的基因的上调,这些基因通过使用本发明的方法设计的saRNA分子上调,这些基因包括KLF4、MYC、P0U5F1、S0X2、BCL2 和 IL-8。

本发明的KLF4-、MYC-, P0U5F1-和S0X2-活化RNA对于扩增在再生医学中使用的造血干细胞是有效的、非入侵性的和安全的选择。
本发明的一个主要优势是它涉及活化基因的小RNA的瞬时应用,这些小RNA的作用是瞬时的。这允许所述诱导的干细胞被扩增并随后被改编以分化。在第一个方面,本发明提供一种设计短RNA分子的方法,所述短RNA分子通过下调非编码RNA转录本而增加细胞中靶基因的表达,所述方法包括以下步骤:a)获得所述靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间;b)确定与在步骤a)中确定的核苷酸序列反向互补的RNA序列;和c)设计短RNA分子,所述短RNA分子与步骤b)中确定的序列的某一区域反向互补或与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性;其中,所述方法不包括确定所述非编码RNA转录本的存在的步骤。另一方面考虑,本发明提供一种设计短RNA分子的方法,所述短RNA分子通过下调非编码RNA转录本而增加细胞中靶基因的表达,所述方法包括以下步骤:i)获得所述靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间;和ii)设计短RNA分子,所述短RNA分子与步骤i)中确定的序列的某一区域有至少80%的序列一致性,其中出于确定序列一致性的目的,短RNA分子中的尿嘧啶核苷酸被认为是与步骤i)中确定的序列的所述区域的胸腺嘧啶残基相同;其中,所述方法不包括确定所述非编码RNA转录本的存在的步骤。在本文中,术语“设计的方法”和“设计方法”与术语“设计的算法”和“算法”可交替使用。基因的“编码链”是包含所述基因的mRNA的编码序列的链。基因的“模板链”是不包含所述基因的mRNA的编码序列、但被RNA聚合酶实际读取的链。如本文中所使用的,术语“RNA”表示包含至少一个核糖核苷酸残基的分子。“核糖核苷酸”表示在β-D-呋喃核糖基团的2’位置具有羟基的核苷酸。该术语包括双链RNA、单链RNA和分离的RNA如部分纯化的RNA、基本纯的RNA、合成RNA、重组产生的RNA以及通过添加、缺失、取代和/或改造一个或多个核苷酸而与天然产生的RNA不同的改变的RNA。这样的改造可以包括向如所述RNA的一个或多个末端或中间部位(例如所述RNA的一个或多个核苷酸处)添加非核苷酸物质。本发明的RNA分子中的核苷酸同样可以包括非常规核苷酸,如非天然产生的核苷酸或化学合成的核苷酸或脱氧核苷酸。这些改变的RNA可以被定义为天然产生的RNA的类似物。本文中使用的术语“双链RNA”或“dsRNA”指核糖核酸双聚体,包括但不限于,内源或人工siRNA、短发夹环RNA (shRNA)和微小RNA (miRNA)。本文中使用的术语“短干扰RNA”或“siRNA”指能够通过RNAi经由一种或多种靶RNA转录本的序列特异介导的分裂而调节基因表达的核酸分子。典型地,在RNAi中,所述RNA转录本是mRNA,因此该靶的分裂导致基因表达的下调。但是,在本发明中,通过分裂与目标靶基因是反义链或正义链的RNA转录本可以分别实现所述靶基因的上调或下调。当这样的短RNA分子增强基因表达时,它们被定义 为短(或小)活化saRNA分子(saRNA),并且它们可能具有与其它短RNA分子(如siRNA)相同的结构特征。siRNA是双链RNA分子,典型的长度是19至25个碱基对,在每一个3’末端具有几个未成对的碱基形成3’突出。siRNA所包含的其中一条链的序列与靶RNA转录本的某一区域完全或几乎完全互补。一种已知为RNA诱导的沉默复合体(RISC)的蛋白复合体与所述siRNA双聚体的这条链(引导链)结合并使用它作为识别所述靶RNA转录本的模板。然后,RISC参与与被结合的链完全或几乎完全互补的靶RNA转录本的分裂。所述siRNA分子的另一条链被定义为过客链,所述过客链与靶RNA转录本的区域不互补。能够通过RISC相关的分裂下调同它们具有完全或几乎完全互补性的靶RNA转录本的单链RNA分子或不是siRNA分子的双链RNA分子被认为具有siRNA样活性。通过本发明的方法设计的短RNA分子具有该活性。基因的“活化”或“上调”表示基因表达水平或由基因编码的多肽的水平或其活性的增加,或者在缺少通过本发明的方法设计的短RNA分子时观察到的从上述基因转录的RNA分子的水平的增加。通过本发明的方法设计的短RNA分子有效地并特异地上调了细胞中的靶基因,即,通过下调与靶基因的编码链上的基因组序列反义的RNA转录本,短RNA分子增加了靶基因的表达。不希望受理论的束缚,人们认为反义RNA转录本抑制靶基因的表达,且通过本发明的算法设计的短RNA分子通过下调下调性的反义RNA转录本而上调靶基因。如上所提及的,这可以通过与所述反义RNA转录本中的序列具有高度互补性的短RNA实现。但是,本发明的算法不需要鉴定任何与靶基因反义的RNA转录本。本发明的发明人惊奇地发现,如果获得(即,通过测序而确定或在数据库中发现)基因的转录起始位点的上游200个核苷酸和基因的转录起始位点的下游200个核苷酸之间的区域的基因的编码链核苷酸序列,并且确定所述区域的反向互补RNA序列,则与所述反向互补RNA序列反向互补的短RNA分子或与所述反向互补RNA序列的反向互补序列具有至少80%序列一致性的短RNA分子可以用于上调所述 靶基因。尽管现有技术中设计短活化RNA分子的算法/方法需要从数据库或通过RT-PCR确定靶的反义RNA转录本的存在,然而本发明的方法没有这个需要。结果,本发明的方法提供一种更快捷、更便宜以及更有效地设计针对任何目标靶基因的短活性RNA分子的方式。不需要在设计saRNA之前确定反义RNA转录本的存在或鉴定的实现引导本发明的发明人创造出本发明的方法。因此,本发明的方法不包括确定所述非编码RNA转录本(S卩,将被下调的靶转录本)的存在的步骤。现有技术中设计saRNA的方法确定非编码RNA转录本目标的存在。“确定存在”表示检索靶基因的基因座周围的EST和/或反义转录本的数据库以鉴定合适的靶转录本,或者使用RT PCR或任何其它已知技术以确定细胞中靶反义RNA转录本的物理存在。在本发明方法的步骤a)或步骤i )中,获得基因的编码链的核苷酸序列,所述序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间。该序列可以通过参考本领域技术人员公知的基因序列数据库或通过对序列测序而获得。用于对目标基因测序的手段是本领域普通技术人员熟知的。优选地,上述方法的步骤a)和步骤i)包括获得靶基因的编码链的核苷酸序列,所述序列至少在所述基因的转录起始位点的上游300个核苷酸和所述基因的转录起始位点的下游300个核苷酸之间。更优选地,上述方法的步骤a)和步骤i)包括获得靶基因的编码链的核苷酸序列,所述序列至少在所述基因的转录起始位点的上游500个核苷酸和所述基因的转录起始位点的下游500个核苷酸之间。更优选地,上述方法的步骤a)和步骤i)包括获得靶基因的编码链的核苷酸序列,所述序列至少在所述基因的转录起始位点的上游1000个核苷酸和所述基因的转录起始位点的下游1000个核苷酸之间。从一个方面看,所述方法进一步包括上述步骤b),在该步骤中确定与在步骤a)中确定的核苷酸序列反向互补的RNA序列。不同于现有技术的方法,不确定该RNA序列的存在,即所述确定的RNA序列是假定的、理论序列。该步骤不包括参考任何数据库或使用任何已知技术以确定具有确定序列的RNA转录本的真实存在。上述步骤c)需要设计短RNA分子,所述短RNA分子与步骤b)中确定的序列的某一区域反向互补或与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性。优选地,所述短RNA分子与步骤b)中确定的序列的某一区域反向互补或与步骤b)中确定的序列的某一区域的反向互补序列有至少85%、更优选地90%、甚至更优选地95%的序列一致性。如果第一条序列是第二条序列的反向互补序列,则它与第二条序列的反向序列完全或几乎完全互补。“互补性”或“互补”表示第一条核酸可以例如通过沃森-克里克碱基配对与第二条核酸形成氢键。可以通过非沃森-克里克碱基配对与另一核酸形成氢键的核酸同样落入具有互补性的定义中。百分比互补性显示可以与第二条核酸序列形成氢键(如,沃森-克里克碱基配对)的核酸分子中残基的百分比(如,10中5、6、7、8、9、10是50%、60%、70%、80%、90%和100%互补)。优选地,本发明的方法包括设计短RNA分子的步骤,所述短RNA分子在其全长上与在步骤b)中确定的RNA序列的某一区域有任何这样的互补性程度。所述短RNA分子在其全长上与在步骤b)中确定的RNA序列的某一区域优选地有至少85%、90%或95%的互补性,最优选地有100%的互补性。所述短RNA与同它互补的、在步骤b)中确定的RNA转录本的所述区域的序列有不超过5个、优选地不超过4或3个、更优选地不超过2个、甚至更优选地不超过I个错配,最优选地没有错配。在本节中,“错配”是在两条序列的给定位置处,两条序列的核苷酸不互补。可以通 过本领域已知的任何方法测定两条或多条序列的互补程度。优选地,使用的方法是在Hossbach等(同上)列出的那些。根据本方法,使用在http://www.mpibpc.mpg.de/groups/luehrmann/siRNA 中获得的 Perl 原本。“完全互补”或“完全互补性”表示第一条核酸序列的所有连续残基将与第二条核酸序列中的相同数量的连续残基形成氢键。“几乎完全”互补表示第一条核酸序列的基本上所有连续残基将与第二条核酸序列中的相同数量的连续残基形成氢键,但是,由于第一条核酸通过例如转录的不完全的过程或涉及使用生物分子的分子生物学过程而制备,所述第一条序列可能与第二条序列不是100%互补。但是,所述第一条序列中不能与第二条序列中的对应残基形成氢键的残基的数量非常低,使得两条核酸序列仍然在期望的目的所需要的范围内通过氢键结合。典型地,“几乎完全互补性”表示第一条核酸序列与第二条核酸序列有至少95%的互补性。所述短RNA分子在其全长上与步骤b)中确定的RNA序列的某一区域优选地几乎完全互补、更优选地完全互补。所述短RNA分子不需要是步骤b)中确定的序列的所述区域的反向互补序列,取而代之,它可以与步骤b)中确定的序列的所述区域的反向互补序列具有一定的序列一致性程度。“一致性”、“一致”或“序列一致性”表示第一条核酸在序列上与第二条核酸序列一致。百分比一致性表示第一条核酸分子中与第二条核酸序列相同的残基百分比(如10中5、6、
7、8、9、10是50%、60%、70%、80%、90%和100% —致)。优选地,本发明的方法包括设计短RNA分子的步骤,所述短RNA分子在其全长上与在步骤b)中确定的序列的所述区域的反向互补序列具有该程度的序列一致性。所述短RNA分子在其全长上与在步骤b)中确定的序列的所述区域的反向互补序列优选地具有至少85%、90%或95%的序列一致性,最优选地具有100%的序列一致性。所述短RNA与在步骤b)中确定的序列的所述区域的反向互补序列有不超过5个、优选地不超过4或3个、更优选地不超过2个、甚至更优选地不超过I个错配,最优选地没有错配。在本节中,“错配”是在两条序列的给定位置处,两条序列的核苷酸不互补。优选地,所述短RNA分子是步骤b)中确定的序列的某一区域的反向互补序列或与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性或本文记述的任何其它序列一致性,所述步骤b)中确定的序列本身是包括转录起始位点的基因编码链的某一区域的反向互补序列。换言之,优选地,所述短RNA分子是步骤b)中确定的序列的某一区域反向互补序列或与步骤b)中确定的序列的某一区域的反向互补序列有一定程度的序列一致性,所述区域内包括所述基因的转录起始位点的反向互补序列。另一方面看,本发明的方法包括设计短RNA分子,所述短RNA分子与步骤i)中确定的序列的某一区域一致。“一致性”、“一致”或“序列一致性”表示第一条核酸在序列上与第二条核酸序列一致。百分比一致性表示第一条核酸分子中与第二条核酸序列相同的残基百分比(如10中5、6、7、8、9、10是50%、60%、70%、80%、90%和100%—致)。优选地,本发明的方法包括设计短RNA分子的步骤,所述短RNA分子在其全长上与在步骤i)中确定的序列的某一区域具有该程度的一致性。所述短RNA分子在其全长上与在步骤i)中确定的序列的所述区域优选地具有至少85%、90%或95%的序列一致性,最优选地具有100%的序列一致性。所述短RNA与在步骤i)中确定的序列的某一区域有不超过5个、优选地不超过4或3个、更优选地不超过2个、甚至更优选地不超过I个错配,最优选地没有错配。在本节中,“错配”是在两条序列的给定位置处,两条序列的核苷酸不一致。优选地,所述短RN A分子与所述基因的编码链的某一区域一致,所述区域包括所述基因的转录起始位点。“完全一致性”或“完全一致”表示第一条核酸序列的所有连续残基与第二条核酸序列中的相同数量的连续残基一致。“几乎完全”一致性表示第一条核酸序列的基本上所有连续残基与第二条核酸序列中的相同数量的连续残基一致,但是,由于第一条核酸通过例如转录的不完全的过程或涉及使用生物分子的分子生物学过程而制备,所述第一条序列可能与第二条序列不是100%—致。但是,所述第一条序列中的与第二条序列中的对应残基不同的残基的数量非常低,使得出于给定的目的,两条核酸序列仍然充分一致。典型地,“几乎完全一致性”表不第一条核酸序列与第二条核酸序列有至少95%的一致性。可以使用本领域已知的任何方法或工具测定序列比对和百分比一致性或百分比互补性计算,这些方法或工具包括但不限于LASARGENE生物信息学计算组的Megalign程序(DNASTAR Inc.,Madison, Wl)、比对的 Clustal V 方法(Higgins 和 Sharp (1989)CAB10S.5:151-153)和BLAST 2.0组程序。公众可以例如通过美国国家生物技术信息中心使用用于进行BLAST分析的软件。本领域技术人员能设定这些工具的参数以适合他们的需要的目的。
当评价第一条核酸序列和第二条核酸序列的一致性或互补性,而一条序列是DNA序列另一个序列是RNA序列时,必须铭记,RNA序列包括尿嘧啶而DNA序列可能取而代之包括胸腺嘧啶。因此,在这些情况下,当评价序列一致性时,尿嘧啶残基被认为是与胸腺嘧啶残基一致;当评价互补性时,尿嘧啶残基被认为是与腺嘌呤残基互补/能够与腺嘌呤残基形成氢键。所述“区域”的大小对应于所述短RNA分子的大小,本文中定义了这些分子的优选大小。这些区域和短RNA分子的长度将典型地小于100个核苷酸,优选地长度小于50个核苷酸,但是长度至少是12个核苷酸,最优选的长度是16-30个核苷酸。可选地,上述步骤c)和步骤ii)包括导致设计具有具体期望的结构和/或功能特性的短RNA分子的更多步骤。将在下文同设计具有这些特性的短RNA分子所需要的工具一起讨论这些特性。现在将讨论通过本发明的方法设计的这些短RNA分子的可选的和优选的特征。所述方法优选地包括设计具有每一种、任何一种和全部的这些优选特征的短RNA分子的步骤。优选地,通过本发明的方法设计的“短” RNA分子的长度是16个核苷酸至30个核苷酸;更优选地,长度是19至30个核苷酸;甚至更优选地,长度是19至25或19至23个核苷酸;最优选地,长度是19或21个核苷酸。所设计的短RNA分子可以是单链。但是,优选地,所述方法进一步包括产生合并了所述短RNA分子的双链分子的步骤。优选地,所述双聚体的每一链的长度至少是16个核苷酸,更优选地至少是19个核苷酸。优选地,所述双聚体的杂交长度是至少12个核苷酸,更优选地至少15个核苷酸,更优选地至少17个核苷酸,甚至更优选地至少19个核苷酸。每一链的长度可以是精确的19个核苷酸,或者在一种优选实施方式中,一条链的长度是25个核苷酸,另一条链是27个核苷酸。优选地,所述双聚体的长度是小于30个核苷酸,因为超过这个长度的双聚体可能有增加诱导干扰素响应的风险。形成dsRNA双聚体的链可以是相同长度或不同长度。换言之,本发明的方法优选地包括设计这些优选长度的短RNA分子的步骤。最优选地,所述短RNA分子是短干扰RNA (siRNA)分子。可选地,所述短RNA分子是由两条稳定地碱基配对的链组成的dsRNA分子,同时在每一链的3’末端具有一定数量的未配对核苷酸形成3’突出。形成每一链的3’突出的未配对核苷酸数目优选地范围在I至5个核苷酸,更优选地I至3个核苷酸,以及最优选地2个核苷酸。公知有多种设计和分析短RNA分子的工具,这些工具能够使本领域普通技术人员确定那些可以实现有效和特异下调靶RNA转录本(即,靶反义转录本)的RNA分子。确定的方法包括例如,GPboost和Reynolds算法(PMIDs: 15201190,14758366)。此外,可以使用测量细胞中RNA或蛋白水平的标准技术评估短RNA引起靶RNA有效下调的能力。例如,本发明的短RNA可以被递送至培养的细胞,且可以通过包括但不限于RNA印迹或斑点印迹的技术或通过定量RT-PCR测量靶RNA的水平。优选地,所设计的短RNA不具有aaaa、cccc、gggg或tttt基序。优选地,所述短RNA的GC百分比至少是20%但不多于75 %,即20%至75 %,优选地20%至55%。上述方法的短RNA是理想的热力学稳定的双聚体,其中每一链的GC百分比至少是25%但不多于75%,即25%至75 %,优选地20%至55%,更优选地20%至50%。用于测量RNA是否具有aaaa、cccc、gggg或tttt基序或用于测量所述分子/链的百分比GC含量工具和算法是本领域技术人员公知的。这样的工具包括在Saetoom和 Snove, (2004)Biochem Biophys Res Commun 321:247-253 和 Vert 等,(2006)BMCBioinformatics 7:520(17页)中描述和参考的。短RNA可以诱导与所述短RNA链有少量错配的非靶转录本的下调,所述短RNA链合并在RISC蛋白复合体中。这降低了短RNA分子的功效,因此是不期望的。因此,短RNA分子应当与转录本而不是预计靶具有有限的互补性以防止未预计的脱靶效应。具有基于分裂的脱靶效应的短RNA候选物的概率是它对非靶RNA序列的互补性的函数,并可以通过本领域已知的任何方法测量。可选地,未缺口的Smith-Waterman方法(TF Smith& MS Waterman (1981) Journal of molecular biology 147:195-197)可以用于筛选针对Ensembl (Flicek, P.,等(2008)Ensembl 2008.Nucleic Acids Res 36:D 707-714)人类转录本数据库(Snovc.0., Jr.,等,(2004)Biochem Biophys Res Commun 325:769-773)的候选短RNA,以鉴定短RNA的可能的脱靶转录本。另选地,可以针对不包括全部Ensembl人类转录本数据库的一群选择的RNA序列(例如,选自GenBank序列)筛选短RNA。另选地,可以使用Hamming距离测量。优选地,所述短RNA分子与被鉴定的脱靶转录本具有多于两个错配。另一方面看,优选地,所述短RNA分子与 所有可能的脱祀转录本有2或更多的Hamming距离。如果短RNA是双链分子的一部分,则优选地,两条链都满足这个要求。可选地,所述短RNA分子具有同已知的高效的标准的siRNA —样的性质。优选地,所述短RNA,或者如果是双链分子的部分,所述短RNA的一条或两条链,它的GPboost分值大于0.1。GPboost是一种已知的基于遗传程序的siRNA功效预测系统,用于测量siRNA链的 GPboost 分值的方法在 “Predicting the efficacy of short oligonucleotidesin antisense and RNAi experiments with boosted genetic programming”, PUSaetrom(2004)Bioinformatics 20(17):3055-3063中公开,该文章内容通过引用的方式结合至本文。另选地或其它地,所述短RNA分子具有与高效siRNA有关联的特异序列特征。由 Reynolds [Reynolds 等(2004) Nature biotechnology 22 (3): 326-330]描述的算法(通过引用的方式结合至本文)能够测定短RNA是否具有足够的该类型特征。本领域技术人员出于他的具体目的能够定义和再定义他的阈值。可选地,所述短RNA分子包含与高效siRNA有关联的位置特异序列基序。siRNA功效预测算法是本领域公知的,与高效siRNA有关联的基序在Saetrom和Snove, (2004)Biochem Biophys Res Commun 321:247-253中讨论,这篇文章的内容通过引用的方式结合至本文。可选地,支持向量机(SVM)可以用于提供一种额外的测量给定的短RNA序列在下调靶转录本中有效的可能性的方式。支持向量机(SVM)是计算机科学中用于一组相关的有指导的学习方法(所述学习方法分析数据和识别模型)的一种概念,用于分类和回归分析。标准的SVM采用一组输入数据,并预测,对于每一个给定的输入数据,所述输入量数据是哪两种可能类别的成员,这使得SVM成为一种非盖然论的二元线性分类器。给定一组教育实例,每个被标记为属于两个种类之一,SVM教育算法建立了将新的实例分配至一个种类或另一种类的模型。SVM模型是如同空间中的点的实例的代表,绘制点使得不同种类的实例通过尽可能宽的缺口分开。然后将新的实例绘制在相同的空间中,并基于它们落在缺口的哪一侧预测新的实例所属的种类。任何已知的SVM可以用于在本发明中使用的saRNA分子的设计中。特别合适的 SVM(2004)Bioinformatics 20 (17):3055-3063 中描述。优
选地,选择SVM分值大于O的短RNA分子。优选地,所述短RNA分子能够直接进入细胞的RNAi机制,或者在进入细胞的RNAi机制之前能够被Dicer加工。测定短RNA分子在进入细胞的RNAi机制之前是否能够被Dicer加工的方法是本领域公知的,例如在Tiemann等(2010) RNA 16 (6): 1275-1284和Rose 等(2005) Nucleic Acid Research 33 (13): 4140-4156 公开的体外 Dicer 实验中。如果短RNA分子是双链分子的一部分(即,是所述双链分子的一条链)且如果仅这条链能够有效地和特异地下调靶RNA转录本,则优选地,该链优先地加载至RISC。设计一条链优先地加载至RISC的双链RNA分子在本领域普通技术人员的能力范围内。例如,靶定靶RNA转录本的短RNA分子的链的5’末端可以被制成或选择为比另一链5’末端的热力学稳定性低。优选地,双聚体·热力学末端稳定性有很大差异,使得靶定靶RNA转录本的短RNA分子的链的5’末端比另一链的5’末端的热力学稳定性低。可以根据本领域任何标准方法计算双聚体热力学末端稳定性差异的绝对值(Δ AG)。可选地,通过RNAfold(Hofacker等,(2003) Nucleic Acids Research 31 卷,13 期,3429-3431 页),考虑双聚体多个末端的5个结束核苷酸,计算双聚体热力学末端稳定性差异的绝对值。优选地,通过RNAfold计算的双聚体热力学末端稳定性差异的绝对值大于Okcal/mol,更优选地大于lkcal/mol,更优选地大于3kcal/mol。许多如上所述的设计短RNA的标准工具提供了评估所述分子该特性的方式。例如,如果双链分子的热力学特性支持一条链越过另一链融合至RNAi机制中,可以选择这样的双链分子。另选地,通过使用包含与天然产生的RNA不同的RNA(通过添加、缺失、取代和/或改造一个或多个核苷酸而形成)的dsRNA实现优先加载一条链。这样的变异是本领域技术人员公知的并在下文进一步讨论。Dicer是核糖核酸酶蛋白,将外源dsRNA切割成19至25个碱基对的双链片段,双链片段的每一 3’末端具有几个未配对的碱基形成3’突出。在上述方法中使用的短RNA可以是Dicer作用物的siRNA (D-SiRNA)0被设计为Dicer作用物的siRNA与标准长度的siRNA和shRNA相比具有增强的潜能。D-siRNA是不对称的siRNA-双聚体,其中所述链的长度是22至30个核苷酸。典型地,一条链(过客链)是22至28个核苷酸长,优选地25个核苷酸长,而另一条链(引导链)是24至30个核苷酸长,优选地27个核苷酸长,使得所述双聚体的过客链的3’末端是钝末端并在所述引导链的3’末端形成突出。所述突出的长度是I至3个核苷酸,优选地2个核苷酸。所述过客链同样包含5’磷酸。典型地,在D-siRNA中,所述过客链的3’末端的两个核苷酸是脱氧核糖核酸(DNA)而不是核糖核酸(RNA)。所述DNA和钝末端双聚体保证了所述酶Dicer将所述双聚体加工成分别由所述起始D-siRNA的过客链和引导链的5’和3’末端的21个核苷酸组成的21mer双聚体。
将标准的19mer siRNA分子扩展成D-siRNA的方法是本领域公知的,例如在Hefner 等(2008) J.Biomol.Tech.19(4):231-237 中所描述的方法。当扩展至27mer/25mer D-siRNA时,许多siRNA分子具有这样一种末端结构:所述过客链的3’末端的未配对碱基的预测数量小于或等于所述引导链的5’末端的未配对碱基的预测数量。基于已知miRNA的结构和所述Dicer PAZ域的结合需要,该结构对于Dicer加工最可能是次优的;因此,虽然这样的双聚体作为siRNA分子是有用的,但是当扩展成Dicer作用物siRNA分子时不大有用。因此,优选地,通过本发明的方法设计的短RNA不具有这样的结构,相反地,所述过客链的3’末端的未配对碱基的预测数量大于所述引导链的5’末端的未配对碱基的预测数量。可选地,通过本发明的方法设计的短RNA分子可以包括变异,即,通过添加、缺失、取代和/或改造一个或多个核苷酸而与天然产生的RNA不同的RNA。例如,如果所述短RNA是双链分子的一部分,则所述dsRNA分子的两条链可以通过例如化学连接基团或寡核苷酸连接物的连接成分连接,其结果是得到的dsRNA的结构是发夹结构。所述连接成分必须不能例如通过阻碍链加载至RISC复合体中或阻碍链与Dicer联合而阻碍所述dsRNA的活性或者另外地负面影响所述dsRNA的活性。本领域已知许多合适的化学连接基团。如果使用寡核苷酸连接物,它可以是任何序列或长度,只要保留了所述dsRNA的全部功能性。优选地,所述连接物序列包含的尿苷和鸟嘌呤的数量比其它核苷酸碱基多,且所述连接物序列的长度优选是大约4至9个残基,更优选地8或9个残基。如果变异不妨碍所述RNA组合物作为Dicer的作用物,所述短RNA可以被设计为包含所述变异。可以产生一种或多种变异,所述变异提高所述dsRNA的Dicer加工过程、导致更有效的RNAi产生、支撑更大的RNAi效果、导致每一个将要被递送至细胞的dsRNA分子有更大的潜力和/或在保证治疗环境中对保证dsRNA稳定性有益。可以将变异加入至所述序列的3’末端区域、5’末端区域、3’末端和5’末端区域,或者在一些情况下,加入至所述序列内的多个位置中。铭记上述提及的限制,可以将任何数量和组合的变异加入至RNA中。当存在多种变异时,它们可以是相同的或不同的。可以考虑的是对碱基、糖基团、磷酸骨架的变异以及它们的组合。任一 5’末端可以被磷酸化。可以通过定位在所述过客链的3’末端的合适修饰物对短dsRNA分子进行修饰以用于Dicer加工,即,将dsRNA设计成引导Dicer结合和加工的方向。合适的修饰物包括核苷酸如脱氧核糖核苷酸、双脱氧核糖核苷酸、无环核苷酸(acyclonucleotide)等,和空间位阻分子如荧光分子等。无环核苷酸用2-羟基乙氧基甲基取代dNMP上天然存在的2’ -脱氧呋喃核糖。其它核苷酸修饰物可以包括3’ -脱氧腺苷(虫草素)、3’ -叠氮-3’ -脱氧胸苷(AZT)、2,,3’ -双脱氧次黄嘌呤核苷(ddl)、2,,3’ -双脱氧_3’ -硫代胞苷(3TC)、2’,3’ -双脱氢-2’,3’ -双脱氧胸苷(d4T)以及3’ -叠氮-3’ -脱氧胸苷(AZT)、2’,3’ -双脱氧_3’ -硫代胞苷(3TC)和2’,3’ -双脱氢-2’,3’ -双脱氧胸苷(d4T)的单磷酸核苷酸。脱氧核苷酸可以用作修饰物。当使用核苷酸修饰物时,将1-3个核苷酸修饰物或2个核苷酸修饰物取代所述过客链的3’末端的核糖核苷酸。当使用位阻分子时,它们与所述过客链的3’末端的核糖核苷酸连接。因此,加入修饰物并不改变所述链的长度。可选地,dsRNA中的两个DNA碱基被取代以引导Dicer加工的方向。可选地,两个末端DNA碱基被定位于所述过客链的3’末端以代替形成在所述引导链的5’末端 和所述过客链的3’末端上的双聚体的钝末端的两个核糖核苷酸,且两个核苷酸的RNA突出被定位在所述引导链的3’末端上。这是一个不对称组合物,其中DNA在钝末端上而RNA碱基在突出末端上。预期的用于磷酸骨架的修饰的实例包括磷酸盐修饰,包括甲基磷酸盐、磷硫酰和磷酸三酯修饰,如烷基磷酸三酯等。预期的用于糖基团的修饰的实例包括2’ -烷基嘧啶,如2’ -O-甲基、2’ -氟、氨基和脱氧修饰等(见,如Amarzguioui等,2003)。预期的用于碱基基团的修饰的实例包括无碱基糖、2-0-烷基修饰的嘧啶、4-硫脲嘧啶、5-溴尿嘧啶、5-碘尿嘧啶和5-(3-氨烷基)-尿嘧啶等。同样可以加入锁核酸或LNA。许多其它的修饰是已知的并且可以使用,只要满足上述标准即可。通过本发明的方法设计的短RNA同样可以包括部分纯化的RNA、基本纯的RNA、合成RNA或重组产生的RNA。对于短RNA的其它可能的改造包括向所述短RNA的一个或多个末端或所述短RNA的一个和多个内部核苷酸加入非核苷酸物质;修饰以使得所述短RNA对核酸酶消化有抗性(如,使用2’ -取代的核糖核苷酸或对糖-磷酸骨架进行修饰);或者用脱氧核糖核苷酸取代短RNA中的一个或多个核苷酸。如果所述短RNA是双链分子的一部分,两条链均可以能够有效和特异地下调如上所定义的靶RNA转录本。设计这种多功能siRNA分子的方法在Hossbach等(2006) RNABiology 3(2):82-89中公开,该文章中的内容通过引用的方式结合至本文。如果所述短RNA分子是双链分子的一条链(功能链,S卩,引导链),则设计互补的“过客”双聚体链在本领域普通技术人员的能力范围内。根据本发明,优选地,将所述siRNA或其它双链分子的第二条链设计成尽可能地失活以将第一条链的抵消作用最低化。标准工具(包括本文中描述的那些)可以用于设计这样的链。如果所述短RNA是双链分子的一部分且两条链均能够有效和特异地下调如上所定义的靶RNA转录本,则优选地,双聚体热力学末端稳定性中没有很大的差异。可以根据本领域任何标准方法计算双聚体热力学末端稳定性差异的绝对值(Λ AG)。可选地,通过RNAfold (Hofacker 等,(2003) Nucleic Acids Research 31 卷,13 期,3429-3431 页),考虑双聚体多个末端的5个结束核苷酸,计算双聚体热力学末端稳定性差异的绝对值。优选地,通过RNAfold计算的双聚体热力学末端稳定性差异的绝对值小于3kcal/mol,更优选地小于 lkcal/mol。步骤c)和ii)可以包括初始产生的一群候选saRNA,然后在一系列步骤中从该群选择具有期望的一种或多种特性的那些。初始群可以包括一些或每一种选择的一种或多种长度的可能的短RNA单链序列,所述短RNA单链序列分别与步骤b)或步骤i)中确定的序
列互补/ 一致。“靶基因”或“目标基因”是期望调节其表达的基因。该术语包括任何核苷酸序列,所述核苷酸序列可以包括或不包括鉴定的基因,所述核苷酸序列包括但不限于编码区、非编码区、非转录区、内含子、外显子和遗传因子。所述靶基因可以是源自细胞的基因、内源基因、转基因或外源基因如病原体的基因,所述外源基因在转染细胞后存在于细胞中。包含所述靶基因的细胞可以源自任何生物体或包含在任何生物体中。“靶mRNA”序列是源自靶基因的mRNA序列。在另一方面 ,本发明提供一种生产短RNA分子的方法,包括实施本文任意一处所定义的方法,然后合成通过所述方法设计的一种或多种RNA分子。
可以通过任何合适的方法生产通过本发明的方法设计的短RNA分子,例如使用本领域技术人员公知的标准分子生物学技术合成或在细胞中表达。例如,可以使用本领域已知的方法化学合成或重组生产所述短RNA,如在Tuschl等的美国公开的申请2002/0086356中描述的体外系统中的果蚬,或者使用在Verma和Eckstein (1998) Annu Rev Biochem67:99-134中描述的合成RNA分子的方法,这些文献的全部内容通过引用的方式结合至本文。可以使用适当保护的核糖核苷亚磷酰胺和常规的DNA/RNA合成仪化学合成所述短RNA。如果所述短RNA是双链RNA的一部分,则它们可以作为两个分离的、互补的RNA分子被合成,或者作为具有两个互补区域的单一 RNA分子被合成。合成的RNA分子或合成试剂的商业供应商包括 Proligo (汉堡,德国)、Dharmacon Research (Lafayette, Col0.,美国)、Pierce Chemical(Perbio Science 的部分,Rockford, 111.,美国)、GlenResearch (Sterling, Va.,美国)、ChemGenes (Ashland, Mass.,美国)和 Cruachem(Glasgow,英国)。也可以使用任何合适的启动子从重组环状或线性DNA质粒中表达所述短RNA。用于从质粒表达本发明的短RNA的合适的启动子包括,例如,U6或Hl RNApol III启动子序列和巨细胞病毒启动子。其它合适的启动子的选择是本领域的常识。本发明的重组质粒同样可以包括可诱导的或可调节的启动子,用于在特定组织或特定的细胞内环境中表达所述短 RNA。可以通过标准技术从培养的细胞表达系统中分离重组质粒表达的短RNA。可以从重组质粒将由本发明的方法设计的双链短RNA表达成两个分离的、互补的RNA分子或具有两个互补区域的单一 RNA分子。适于表达短RNA的质粒的选择、将表达短RNA的核酸序列插入至质粒的方法以及将重组质粒递送至目标细胞的方法是本领域常识。见,如Tuschl,T.(2002), Nat.Biotechnol.20:446-448 和 Brummelkamp T R 等(2002),Science 296:550-553,所述文献的全部内容通过引用的方式结合至本文。

同样可以从重组病毒载体在细胞内体内表达由本发明的方法设计的短RNA。本发明的重组病毒载体包括编码本发明的短RNA的序列和用于表达所述短RNA序列的任何合适的启动子。合适的启动子包括,例如,U6或Hl RNA pol III启动子序列和巨细胞病毒启动子。其它合适的启动子的选择是本领域的常识。可以从重组病毒载体将双链短RNA表达成两个分离的、互补的RNA分子或具有两个互补区域的单一 RNA分子。可以使用能够接受将被表达的dsRNA分子的编码序列的任何病毒载体,例如,源自腺病毒(AV)、腺相关病毒(AAV)、逆转录病毒(如慢病毒(LV)、弹状病毒、鼠白血病病毒)、疱疹病毒等的载体。可以通过用来自其它病毒的包膜蛋白或其它表面抗原对所述载体假型(pseudotype)来修饰病毒载体的向性,或者合适地,通过取代不同的病毒壳体蛋白来修饰病毒载体的向性。重组病毒载体的选择、将表达短RNA的核酸序列插入至载体的方法以及将病毒载体递送目标细胞的方法是本领域常识。见,如Dornburg R(1995), Gene Therap.2:301-310,所述文献的全部内容通过弓I用的方式结合至本文。本发明的发明人已经使用上述方法设计了针对多种靶基因的短活化saRNA。优选地,所述靶基因是诱导多潜能基因。诱导多潜能基因或“干性基因”是已知它的活性是诱导或维持多潜能所必需的基因。优选地,所述靶基因是选自KLF4、P0U5F1(也被称为0CT3/4)、S0X2、MYC, NANOG和LIN28的基因。更优选地,所述靶基因选自KLF4、P0U5F1 (也被称为0CT3/4)、S0X2和MYC。最优选地,所述靶基因是KLF4。在另一方面,本发明提供一种通过下调非编码RNA转录本以增加细胞中的靶基因的表达的方法,所述方法包括以下步骤:a)获得所述靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间;b)确定与在步骤a)中确定的核苷酸序列反向互补的RNA序列;c)设计短RNA分子,所述短RNA分子是步骤b)中确定的序列的某一区域的反向互补序列,或者所述短RNA分子与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性;和d)用所述短RNA分子接触所述细胞;其中,所述方法不包括确定所述非编码RNA转录本的存在的步骤。与设计短RNA分子的方法有关的上述定义和描述已作必要修正应用于所述增加细胞中靶基因的表达的方法。上述方法的设计短RNA分子的步骤可以在计算机上进行。因此,本发明同样提供一种设计短RNA分子的计算机实现的方法,所述短RNA分子通过下调非编码RNA转录本增加细胞中靶基因的表达,所述方法包括步骤:a)获得所述靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间;

b)确定与在步骤a )中确定的核苷酸序列反向互补的RNA序列;和c)设计短RNA分子,所述短RNA分子与步骤b)中确定的序列的某一区域反向互补或与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性;其中,所述方法不包括确定所述非编码RNA转录本的存在的步骤。与设计短RNA分子的方法有关的上述定义和描述已作必要修正应用于所述设计短RNA分子的计算机实现的方法。本发明的设计短RNA分子的方法可以,至少部分地,使用软件(如计算机程序)实现。因此,当基于数据加工手段运行时,本发明提供特异适合实现本文描述的任何一种方法的计算机软件;当数据加工手段运行程序单元时,本发明提供包括用于实施本文描述的任何一种方法的计算机软件代码部分的计算机程序单元;以及当基于数据加工手段运行所述程序时,本发明提供包括适于实施本文描述的任何一种方法的多个步骤的代码手段的计算机程序。本发明同样扩展至一种包括这种软件的计算机软件载体,当所述软件被用于操作处理器、电子装置或包括数据加工手段的系统时,引起与所述数据加工手段、所述处理器、电子装置和系统联合以实现本文描述的任何一种方法的多个步骤。因此,在另一方面,本发明提供一种或多种计算机可读介质,所述介质包括计算机可执行的指令以指示计算机系统进行:a)接收靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间;b)确定与步骤a)中接收的核苷酸序列反向互补的RNA序列;和
c)输出信息以构建短RNA分子,所述短RNA分子被设计为通过下调非编码RNA转录本以增加细胞中靶基因的表达,所述短RNA分子是步骤b)中确定的序列的某一区域的反向互补序列或与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性;其中,所述指令不包括要求确定所述非编码RNA转录本的存在的指令。优选地,一种或多种计算机可读介质进一步包括输出信息以向计算机可读介质构建短RNA分子的指令。与设计短RNA分子的方法有关的上述定义和描述已作必要修正应用于这些一种或多种计算机可读介质。这样的介质可以是物理(非短时间的)存储介质,如ROM芯片、⑶ROM或磁盘,或可以是短时间介质或信号,如越过金属丝的电信号、光信号或无线电信号。应当进一步意识到,不是本发明方法的所有步骤都需要通过计算机软件实现。因此,本发明提供计算机软件和安装这样的软件的计算机软件载体,用于实现本文列出的方法的多个步骤的至少一步。

因此,本发明可以被合适地表达为与电子装置或系统一起使用的计算机程序产品。这个执行将包括一系列计算机可读指令,所述指令或者固定在真实的介质上如计算机可读介质(如磁盘、CD ROM、ROM或硬盘),或者通过调制解调器或其它界面装置经过任一真实介质(包括但不限于光或类似物的通讯线路)或者使用无线技术(包括但不限于微波、红外线或其它传输技术)无形地传输至计算机系统。一系列的计算机可读指令体现了本文之前描述的全部或部分功能性。本领域技术人员将意识到,这样的计算机可读指令可以用多种程序设计语言写,以用于多种计算机体系或操作系统。此外,可以使用任何存储技术(目前或未来,包括但不限于半导体技术、磁技术或光学技术)存储这些指令,或者使用任何通讯技术(目前或未来,包括但不限于光、红外线或微波)传输这些指令。预期这样的计算机程序产品可以分布为附有印刷文件或电子文件的可移动介质(例如热缩塑料包软件)、预载有计算机程序(例如在系统ROM或硬盘上)或在网络(如因特网或互联网)上的任一或某一服务器或电子公告板上分布。在另一方面,本发明提供一种通过上调细胞中的靶基因将体细胞或多能细胞改编成多潜能细胞的方法,其中所述靶基因是诱导多潜能基因,所述方法包括用特异下调存在于所述细胞中的靶RNA转录本的短RNA分子接触所述细胞,其中所述靶RNA转录本:i)转录自:a)直到所述靶基因的转录起始位点的上游IOOkb的某一基因座的一条链,b)直到所述靶基因的转录终止位点的下游IOOkb的某一基因座的一条链;或者c)与靶基因物理性相互作用的某一基因座的一条链;和ii)包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列反义的序列。从另一方面看,本发明提供一种通过上调所述细胞中的靶基因而维持或增加一群细胞分化潜能的方法,其中所述靶基因是诱导多潜能基因且所述方法包括用特异下调所述细胞中的靶RNA转录本的短RNA分子接触所述细胞,其中所述靶RNA转录本:
i)转录自:a)直到所述靶基因的转录起始位点的上游IOOkb的某一基因座的一条链,b)直到所述靶基因的转录终止位点的下游IOOkb的某一基因座的一条链;或者c)与靶基因物理性相互作用的某一基因座的一条链;和ii)包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列反义的序列。体细胞是形成生物体的身体的任何类型细胞,除了生殖系细胞(接合体)、形成接合体的细胞(配子细胞)、多能细胞和多潜能细胞。所述体细胞可以源自任何动物,但是优选地是哺乳动物细胞,最优选地是人细胞。多潜能细胞是具有分化成三个胚层中任意一个的潜能的细胞,所述三个胚层是:内胚层(内部胃粘膜、消化道和肺)、中胚层(肌肉、骨、血液、泌尿生殖器)或外胚层(表皮组织和神经系统)。分化潜能是细胞可以分化成不同类型细胞的范围。多潜能细胞比多能细胞具有更大的分化潜能。在一群细胞中,单独细胞可能具有不同的分化潜能。一群多能细胞在一段时间后,可能包含一些已经分化成体细胞的细胞和一些没有分化仍然是多能细胞的细胞。相似地,一群多潜能细胞在一段时间后,可能包含多能细胞、体细胞以及多潜能细胞。因此,上述维持或增加一群细胞的分化潜能的方法可以与一群体细胞、多能细胞或多潜能细胞联合使用。诱导的多潜能干细胞(缩写为iPSC或iPS细胞)是一类通过诱导某些基因“强迫”表达的人工的源自非多潜能细胞(典型地,成人体细胞)的多潜能干细胞。多能细胞是一种具有从多种但有限种细胞系产生细胞的潜能的细胞。多能细胞的一个实例是造血细胞,一种 能够发展成几种类型的血细胞但是不能发展成脑细胞或其它类型细胞的造血干细胞。间充质干细胞或MSC是发展成多种多种细胞类型(包括成骨细胞(骨细胞)、软骨细胞和脂肪细胞)的多能干细胞。优选地,本发明的所有方法在体外进行。在本发明的方法中,通过上调(B卩,激活)靶诱导多潜能细胞完成将体细胞或多能细胞改编成多潜能细胞或诱导多潜能干细胞。所述上调是“顺式”上体。在上下文中,“顺式”上调表示所述靶RNA转录本转录自与靶基因的基因座相关联的基因座。这样的“相关联”可以在下面三种方式之一中:首先,所述靶RNA转录本可以转录自直到所述靶基因的转录起始位点的上游IOOkb的某一基因座。第二,所述靶RNA转录本可以转录自直到所述靶基因的注释的转录终止位点的下游IOOkb的某一基因座。第三,所述靶RNA转录本可以转录自与靶基因物理性相互作用的某一基因座。在后一种情况中,所述靶RNA转录本可以转录自与所述靶基因的转录起始位点有任意距离的基因座或者甚至转录自不同染色体上的基因座。本领域公知,DNA的不同区域在相同染色体或不同染色体中能够远程互相作用[Lieberman-Aiden等(2009)Science 326:289-293]。相反,如果所述靶RNA转录本不是转录自所述靶基因的转录起始位点的上游IOOkb内的或所述靶基因的转录终止位点的下游IOOkb内的某一基因座,或者不是转录自与所述靶基因物理性相互作用的某一基因座,可能产生“反式”上调。在本发明的方法中,“反式”上调是不考虑的。
因此,上述方法的靶RNA转录本转录自直到所述靶基因的转录起始位点的上游IOOkb的某一基因座,或者转录自直到所述靶基因的转录终止位点的下游IOOkb的某一基因座,或者转录自与所述靶基因物理性相互作用的某一基因座。优选地,所述RNA转录本转录自直到所述靶基因的转录起始位点的上游60kb的某一基因座,或者转录自直到所述靶基因的转录终止位点的下游60kb的某一基因座,或者转录自与所述靶基因物理性相互作用的某一基因座。更优选地,所述RNA转录本转录自直到所述靶基因的转录起始位点的上游40kb的某一基因座,或者转录自直到所述靶基因的转录终止位点的下游40kb的某一基因座,或者转录自与所述靶基因物理性相互作用的某一基因座。更优选地,所述RNA转录本转录自直到所述靶基因的转录起始位点的上游20kb的某一基因座,或者转录自直到所述靶基因的转录终止位点的下游20kb的某一基因座,或者转录自与所述靶基因物理性相互作用的某一基因座。可选地,所述RNA转录本转录自直到所述靶基因的转录起始位点的上游Ikb的某一基因座,或者转录自直到所述靶基因的转录终止位点的下游Ikb的某一基因座,或者转录自与所述靶基因物理性相互作用的某一基因座。可选地,所述RNA转录本转录自直到所述靶基因的转录起始位点的上游100个核苷酸的某一基因座,或者转录自直到所述靶基因的转录终止位点的下游100个核苷酸的某一基因座,或者转录自与所述靶基因物理性相互作用的某一基因座。在本发明的靶RNA转录本的内容中,术语“转录自[某一具体基因座]”表示“[在所述具体基因座处]发现所述靶RNA转录本的转录起始位点”。假如存在所述靶RNA转录本的其它必要特征,可以在包含所述靶基因的染色体的任一链上发现所述靶RNA转录本的转录起始位点。优选地,本发明的祀RNA转录本的转录起始位点和转录终止位点在上面定义的区域i) a)或i) b)之一中。换言之,优选地,所述祀RNA转录本的转录起始位点和转录终止位点均分别定位于直到所述靶基因的转录起始位点上游IOOkb或者直到所述靶基因的转录终止位点的下游lOOkb。上述与所述靶RNA转录本转录自的位置有关的优选实施方式已作必要修正转用于所述靶RNA转录本的转录终止位点的位置。在上述方法中,所述祀RNA转录本包括与定位于所述祀基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列反义的序列。更优选地,所述靶RNA转录本包括与定位于所述靶基因的转录起始位点的上游60kb和所述靶基因的转录终止位点的下游60kb之间的基因组序列反义的序列。更优选地,所述靶RNA转录本包括与定位于所述靶基因的转录起始位点的上游40kb和所述靶基因的转录终止位点的下游40kb之间的基因组序列反义的序列。更优选地,所述靶RNA转录本包括与定位于所述靶基因的转录起始位点的上游20kb和所述靶基因的转录终止位点的下游20kb之间的基因组序列反义的序列。更优选地,所述靶RNA转录本包括与定位于所述靶基因的转录起始位点的上游Ikb和所述靶基因的转录终止位点的下游Ikb之间的基因组序列反义的序列。更优选地,所述祀RNA转录本包括与定位于所述祀基因的转录起始位点的上游100个核苷酸和所述靶基因的转录终止位点的下游100个核苷酸之间的基因组序列反义的序列。可选地,所述靶RNA转录本包括与包括所述靶基因的编码区的基因组序列反义的序列。
当用于描述本发明内容中的核酸序列时,术语“正义”表示所述序列与所述靶基因的编码链上序列一致。当用于描述本发明内容中的核酸序列时,术语“反义”表示所述序列与所述靶基因的编码链上的序列互补。
术语“互补”或“互补性”在上文中定义。优选地,所述靶RNA转录本包括在其全长上与所述靶基因的编码链上的序列有至少75%、优选至少85%、更优选至少90%、甚至更优选至少95%互补性的序列。优选地,所述靶RNA转录本包括在其全长上与所述靶基因的编码链上的序列完全互补或几乎完全互补的序列。另选地,所述靶RNA转录本包括一个或多个、通常几个(如至少3个或至少6个)未缺口序列,所述未缺口序列与所述靶基因的编码链上的某一序列完全或几乎完全互补,所述未缺口序列的长度至少是16个核苷酸,更优选地至少25个核苷酸,更优选地至少50个核苷酸,甚至更优选地至少75个核苷酸,最优选地至少100个核苷酸。在本发明的几个方面中,所述靶RNA转录本可以包括与所述靶基因内的某一序列正义的序列,即,所述靶RNA转录本可以包括与所述靶基因的编码链上的序列有一致性的序列。术语“一致性”和“一致”如上文所定义的。优选地,所述靶RNA转录本包括在其全长上与所述靶基因的编码链上的序列有至少75%、优选地至少85%、更优选地至少90%、甚至更优选地至少95%的一致性的序列。优选地,所述靶RNA转录本包括在其全长上与所述靶基因的编码链上的序列完全一致或几乎完全一致的序列。另选地,所述靶基因转录本包括一个或多个、通常几个(如至少3个或至少6个)未缺口序列,所述未缺口序列与所述靶基因的编码链上的某一序列完全或几乎完全一致,所述未缺口序列的长度至少是16个核苷酸,更优选地至少25个核苷酸,更优选地至少50个核苷酸,甚至更优选地至少75个核苷酸,最优选地至少100个核苷酸。当评估RNA转录本和上述基因组序列之间的一致性/互补性时,所述编码链/模板链被认为是延伸了所述基因的被转录区域的上游和下游,即,术语“编码链”和“模板链”仅标记实际链,并不显示任何长度限制。所述靶RNA转录本是编码RNA分子(即,编码氨基酸序列的RNA分子)或非编码RNA分子(即,不编码氨基酸序列的RNA分子)。优选地,所述靶RNA转录本是非编码RNA。
所述靶RNA转录本的优选长度是至少16个核苷酸。但是,优选地,所述靶RNA转录本的长度是至少100个核苷酸,更优选地至少200个核苷酸,最优选地至少1000个核苷酸,可能至少四千个核苷酸。在上述方法中,所述祀RNA转录本包括与定位于所述祀基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列反义的序列。为了清楚起见,自此,术语“基因组序列”用作术语“定位于所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列”的简略形式。换言之,所述靶RNA转录本包括与所述靶基因的编码链上的基因组序列互补的序列。可选地,与所述靶RNA转录本反义的基因组序列包括所述靶基因的启动子区域的一部分。换言之,可选地,所述靶RNA转录本包括与定位于所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列反义的序列且所述序列包括所述靶基因的启动子区域的一部分。描述该特征的另一种方式是所述反义靶RNA转录本与所述靶基因的启动子区域“交迭”。基因可能具有多个启动子区,这种情况下,所述靶RNA转录本可以与一个、两个或更多个启动子区交迭。可以使用注释基因的基因座在线数据库以鉴定所述基因的启动子区。对于给定的启动子区,不需要全部启动子区都被交迭,启动子区内的次序列被靶RNA转录本交迭已经足够,即,所述交迭可以是部分交迭。相似地,不需要全部靶RNA转录本与所述启动子区内的序列反义,靶RNA转录本仅需要包括与所述启动子区反义的序列。所述靶RNA转录本和所述靶基因的启动子区之间的交迭区的长度可以短至单个碱基,但是优选地,所述长度是至少15个核苷酸,更优选地至少25个核苷酸,更优选地至少50个核苷酸,更优选地至少75个核苷酸,最优选地至少100个核苷酸。任一下列排列被计划为落入所述术语“交迭”的范围内:a)所述靶RNA转录本和所述靶基因的启动子区的长度是一样的,且它们在全部长度上交迭(即,它们互补)。b)所述靶RNA转录本比所述靶基因的启动子区短,且所述靶RNA转录本在它的全部长度上与所述靶基因的启动子区交迭(即,所述靶RNA转录本在其全部长度上与所述靶基因的启动子区内的某一序列互补)。c)所述靶RNA转录本比所述靶基因的启动子区长,且所述靶基因的启动子区被所述靶RNA转录本完全交迭(即,所述靶基因的启动子区在其全部长度上与所述靶RNA转录本的某一序列互补)。d)所述靶RNA转录本和所述靶基因的启动子区的长度相同或不同,且所述交迭区域的长度比所述靶RNA转录本的长度和所述靶基因的启动子区的长度都短。“交迭”的上述定义已作必要修正应用于贯穿全文的其它交迭序列的描述。明显地,如果某一反义RNA转录本被描述为与所述靶基因的某一区域而不是所述启动子区域交迭,则所述转录本的序列与该区域的序列而不是所述启动子区内的序列互补。如果涉及正义靶RNA转录本,术语“交迭”表示所述靶RNA转录本包括与所述启动子区或所述靶基因的其它陈述的区内的序列正义的序列。换言之,所述正义靶RNA转录本包括与所述靶基因的编码链上的序列或所述靶基因的特定区内的序列一致或有一致性的序列。优选地,所述RNA转录本包括与包括所述祀基因的转录起始位点的基因组序列反义的序列。换言之,优选地,所述靶RNA转录本包括与所述靶基因的转录起始位点交迭的序列。不希望被任何理论约束,相信本发明的短RNA通过诱导RNA转录本的siRNA-样分裂而调节所述靶基因,所述RNA转录本与所述靶基因的某一区域反义(或者,在一些情况下,正义)。本发明的短RNA同样能够与Argonaute蛋白联合作为调节染色质修饰蛋白的锚定物。测定细胞中是否存在RNA转录本的方法是本领域公知的。例如,可以检索目标基因的基因座周围的基因组区域中的到接的表达序列标签。表达序列标签或EST是转录的cDNA序列的短次序列。EST通常用于鉴定基因转录本。EST的公共数据库是本领域已知的,例如GenBank数据库。另选地,逆转录酶PCR (RT-PCR)(一种公知的鉴定RNA的方式)可以用于鉴定潜在的靶RNA转录本。另选地,高通量测序或其它这样方法可以用于对全部RNA、大小分级的RNA或其它合适子集的RNA进行测序,并使用这样的测序数据库以鉴定源于目标区域的RNA转录本。另选地,可以检索一群已知的RNA转录本以鉴定合适的转录本。可以使用本领域已知的任何RNA转录本数据库,例如加州大学圣克鲁兹分校(UCSC)剪接的EST路径。另选地,所述群可以从由实施本发明的本 领域技术人员所持有的一个群中根据他本人具体的目的而制备。例如,如果已知所述靶基因在某一具体细胞类型中表达,则所述转录本数据库可以是已经确定在该细胞类型中存在的那些。本领域技术人员将能够确定用于他特定期望目的的群。为了将体细胞或多能细胞改编成多潜能细胞,通常需要激活KLF4、P0U5F1、S0X2和MYC中的每一个。上面讨论的方法需要使用短RNA以上调靶基因,即,至少一种靶诱导多潜能基因。因此,本方法使得不被使用本发明的短RNA激活的那些诱导多潜能基因被本领域已知的其它方式激活。可选地,所述方法包括通过使用本发明的短RNA上调选自KLF4、P0U5F1、S0X2和MYC中的2种或3种靶基因。优选地,至少一种由本发明的短RNA上调的靶基因是KLF4。可选地,所述方法包括通过本发明的短RNA上调KLF4、P0U5F1、S0X2和MYC中的每一个。可选地,这样的方法进一步包括通过本领域已知的任何方法上调NANOG或/和LIN28。优先地,如果所述方法包括上调NANOG或/和LIN28的步骤,所述上调通过使用本发明的短RNA分子完成。在上面的方法中,用本发明的短RNA分子接触所述细胞或细胞群。可以通过使用与本发明的短RNA相关联的任何合适的递送试剂将所述短RNA分子施用于所述细胞。这样合适的递送试剂包括Mirus Transit TKO亲脂性试剂、lipofectin、lipofectamine、cellfection或聚阳离子(如,聚赖氨酸)、基于病毒的颗粒、电穿孔或脂质体。优选的递送试剂是脂质体。已知多种制备脂质体的方法,例如在Szoka等(1980),Ann.Rev.Biophys.Bioeng.9:467和美国专利号4,235,871和5,019,369中记载的那些,这些文献的全部内容通过引用的方式结合至本文。特别优选地,修饰封装本发明的短RNA的脂质体以避免被单核巨噬细胞和网状内皮系统清除,例如通过将调理作用抑制部分与所述结构的表面结合而清除。在一种实施方式中,本发明的脂质体可以包括调理作用抑制部分和配体。表达短RNA的重组质粒可以直接施用或与合适的递送试剂联合施用,所述递送试剂包括 Mirus Transit LTl 亲 脂性试剂、lipofectin、lipofectamine、cellfection、聚阳离子(如,聚赖氨酸)或脂质体。表达所述短RNA的重组病毒载体和用于将这些载体递送至细胞的方法是本领域已知的。优选地,所述接触步骤每天或每两天实施、至少一天,优选地至少四天,更优选地至少6天,甚至更优选地至少8天,甚至更优选地至少12天,甚至更优选地大约18至23天,最优选地大约21天。优选地,所述接触步骤每天或每两天实施一次、两次或三次。在上述方法中,如果多于一种靶基因被上调,则用于上调不同靶基因的短RNA可以以不同的频率和不同的时间间隔施用。本领域普通技术人员可以容易地确定所使用的具体施用方案,以满足他所期望的目的、具体的起始细胞类型和递送方法。例如,可以使用皮摩尔浓度的本发明的短RNA分子。可以单独提供本发明的短RNA或与已知在被考虑的具体方法中有作用的其它活性试剂一起提供。所述其它活性试剂可以与本发明的短RNA同时地、各自地或次序地施用。因此,可能使用单一的本发明的短RNA、两种或更多种本发明的短RNA的组合,或是适当地,使用所述短RNA和其它活性物质的组合。在另一方面,本发明提供一种上调靶基因的方法,其中所述靶基因是诱导多潜能基因,且所述方法包括用特异下调存在于所述细胞中的靶RNA转录本的短RNA分子接触包括所述靶基因的细胞,其中所述靶RNA转录本:
i)转录自:a)直到所述靶基因的转录起始位点的上游IOOkb的某一基因座的一条链,b)直到所述靶基因的转录终止位点的下游IOOkb的某一基因座的一条链;或者c)与靶基因物理性相互作用的某一基因座的一条链;和ii)包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列反义的序列。上述与将体细胞或多能细胞改编成多潜能细胞的方法或维持或增加细胞群分化潜能的方法有关的定义和描述已作必要修正应用于该上调靶诱导多潜能基因的方法。在另一方面,本发明提供一种下调靶基因的方法,所述靶基因引起分化,所述方法包括用特异下调存在于所述细胞中的靶RNA转录本的短RNA分子接触包括所述靶基因的细胞,其中所述祀R·NA转录本:i)转录自:a)直到所述靶基因的转录起始位点的上游IOOkb的某一基因座的一条链,b)直到所述靶基因的转录终止位点的下游IOOkb的某一基因座的一条链;或者c)与靶基因物理性相互作用的某一基因座的一条链;和ii)包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列正义的序列。上述方法可以单独使用,或者如果期望,所述方法可以作为上面讨论的将体细胞或多能细胞改编成多潜能细胞的方法或维持或增加细胞群分化潜能的方法的额外步骤。在制备多潜能细胞中分化的抑制是有利的,以使得它们不能无控制地分化。除非另有说明,上述与将体细胞或多能细胞改编成多潜能细胞的方法或维持或增加细胞群分化潜能的方法有关的定义和描述已作必要修正应用于该下调引起分化的靶基因的方法。在该下调引起分化的靶基因的方法中,所述下调是“顺式”下调。本部分中的术语“顺式”如上面所描述的。在该下调引起分化的靶基因的方法中,所述靶RNA转录本与所述靶基因是正义。术语“正义”如上面所描述的。在该下调引起分化的靶基因的方法中,所述靶RNA转录本包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列正义的序列。换言之,所述靶RNA转录本包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的靶基因的编码链上的序列一
致/有一致性的序列。可选地,与所述靶RNA转录本正义的基因组序列包括所述靶基因的启动子区的一部分。换言之,可选地,所述靶RNA转录本包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列正义的序列,且该序列包括所述靶基因的启动子区的一部分。描述该特征的另一种方式是所述正义靶RNA转录本与所述靶基因的启动子区域“交迭”。基因可能具有多个启动子区,这种情况下,所述靶RNA转录本可以与一个、两个或更多个启动子区交迭。可以使用注释基因的基因座在线数据库以鉴定所述基因的启动子区。
对于给定的启动子区,不需要全部启动子区都被交迭,启动子区内的次序列被靶RNA转录本交迭已经足够,即,所述交迭可以是部分交迭。相似地,不需要全部靶RNA转录本与所述启动子区内的序列正义,靶RNA转录本仅需要包括与所述启动子区正义的序列。所述交叠区如上定义。优选地,所述RNA转录本包括与包括所述祀基因的转录起始位点的基因组序列正义的序列。换言之,优选地,所述靶RNA转录本包括与所述靶基因的转录起始位点交迭的序列。在另一方面,本发明提供一种设计能够调节细胞中靶基因表达的短RNA的算法,所述算法包括以下步骤:(i)鉴定存在于所述细胞中的一群潜在靶RNA转录本,所述靶RNA转录本转录自:a)直到所述靶基因的转录起始位点的上游IOOkb的某一基因座的一条链,b)直到所述靶基因的转录终止位点的下游IOOkb的某一基因座的一条链;或者c)与靶基因物理性相互作用的某一基因座的一条链;(ii)如果期望上调所述靶基因,鉴定在步骤(i)中鉴定的与所述靶基因反义的那些RNA转录本,或者如果期望下调所述靶基因,鉴定在步骤(i )中鉴定与所述靶基因正义的那些RNA转录本;(iii)从步骤(ii)中鉴定的RNA转录本中,鉴定包括与定位在所述祀基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列交迭的序列的那些RNA转录本;和(iv)产生与步骤(iii)中鉴定的正义或反义非编码RNA转录本互补的短RNA序列。上述算法以及甚至本发明的所有方面的关键特征是:用本发明的短RNA靶定反义RNA转录本导致上调所述靶基因,而靶定正义RNA转录本导致下调所述靶基因。可以用本领域已知的任何方法进行步骤(i)中的潜在RNA转录本的鉴定。例如,可以检索目标基因的基因座周围的基因组区域中的到接的表达序列标签鉴定潜在的反义转录本。表达序列标签或EST是转录的cDNA序列的短次序列。EST通常用于鉴定基因转录本。EST的公共数据库是本领域已知的,例如GenBank数据库。典型地,这样的数据库不仅仅公开了 EST在与所述靶基因的转录起始位点的距离方面它的位置,也公开了它所定位的链、它的转录方向和长度。因此,步骤(i)、(ii)和
(iii)的任何一步可以作为组合步骤实施,其中,满足上述步骤(i)至(iii)中陈述的全部要求的靶RNA转录本在一步检索步骤中鉴定。例如,可以在EST数据库中检索以下EST:i)定位于a)直到所述靶基因的转录起始位点的上游lOOkb,b)直到所述靶基因的转录终止位点的下游IOOkb ;或者c)与靶基因物理性相互作用的某一基因座;i i )存在于所述靶基因的编码链上(如果期望鉴定正义转录本)或者存在于所述靶基因的模板链上(如果期望鉴定反义转录本);以及

iii)标记RNA分子的转录起始位点,所述RNA分子足够长并且在期望的方向上转录以交迭定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列。除非另有说明,与本发明方法有关的上述定义和描述已作必要修正应用于本发明的算法方面。可以任何顺序进行上述算法的步骤(i )、( i i )和(i i i )。但是,步骤(i )至(i i i )必须在步骤(iv)之前进行。另选地,逆转录酶PCR (RT-PCR)(一种公知的鉴定RNA的方式)可以用于鉴定潜在的靶RNA转录本。另选地,高通量测序或其它这样方法可以用于对全部RNA、大小分级的RNA或其它合适子集的RNA进行测序,并使用这样的测序数据库以鉴定源于目标区域的RNA转录本。另选地,可以检索一群已知的RNA转录本以鉴定满足上述标准的RNA转录本。可以使用本领域已知的任何RNA转录本数据库,例如加州大学圣克鲁兹分校(UCSC)剪接的EST路径。另选地,所述群可以从由实施本发明的本领域技术人员所持有的一个群中根据他本人具体的目的而制备。例如,如果已知所述靶基因在某一具体细胞类型中表达,则所述转录本数据库可以是已经确定在该细胞类型中存在的那些。本领域技术人员将能够确定用于他特定期望目的的群。上述算法的步骤(iv)需要设计能够有效和特异下调在步骤(iii)中鉴定的正义或反义非编码RNA转录本的短RNA分子。可以如上面任何一处所定义的设计所述短RNA分子。因此上述算法可以包括更多步骤,或上述步骤的修改形式,这些步骤需要设计或选择具有上面任何一处所描述的特征的短RNA分子。上面的讨论详述了本领域技术人员公知的用于实施这些步骤的方式和方法。优选地,所述算法包括以下步骤(iv):(iv)产生短RNA分子,所述短RNA分子与步骤(iii)中鉴定的正义或反义非编码RNA转录本互补,且在施用至与包括步骤(iii)中鉴定的正义或反义非编码RNA转录本的细胞后通过杂交,所述RNA分子可以完成下调步骤(iii)中鉴定的正义或反义非编码RNA转录本。 在上述算法中鉴定的靶RNA转录本可以如上文任何一处所定义的。因此,上述算法可以包括更多步骤或上面讨论的步骤的修改形式,这些步骤需要鉴定具有如上文任何一处所定义的特征的祀RNA转录本。具体地,优选地,所述算法包括在步骤(iv)之前实施的更多步骤(iii) (a):(iii) (a)从步骤(iii)鉴定的RNA转录本中,鉴定包括与基因组序列反义的序列的RNA转录本,所述基因组序列包括所述靶基因的启动子区的一部分或所述靶基因的转录起始位点。步骤(i)、(ii)、(iii)和(iii) (a)可以以任何顺序实施,只要它们在步骤(iv)之前实施。另选地,上述算法可以包括在步骤(iv)之前实施的更多步骤(iii) (a)’:(iii) (a)’从步骤(iii)鉴定的RNA转录本中,鉴定包括与基因组序列正义的序列的RNA转录本,所述基因组序列包括所述靶基因的启动子区的一部分或所述靶基因的转录起始位点。步骤(i)、(ii)、(iii)和(iii) (a)可以以任何顺序实施,只要它们在步骤(iv)之前实施。
在上述算法中,所述靶基因可以是任何上述的靶基因。优选地,所述靶基因是诱导多潜能基因或引起分化的基因,更优选地是诱导多潜能基因。甚至更优选地,所述诱导多潜能基因选自KLF4、P0U5F1 (也被称为0CT3/4)、S0X2、MYC、NANOG和LIN28。更优选地,所述靶基因选自KLF4、P0U5F1 (也被称为0CT3/4)、S0X2和MYC。最优选地,所述靶基因是KLF4。在另一方面,本发明提供一种设计短RNA分子的方法,所述方法包括实施上面定义的算法。在另一方面,本发明提供一种产生短RNA分子的方法,所述方法包括实施上面定义的算法,然后合成一种或多种由所述算法产生的RNA分子。在另一方面,本发明提供一种短RNA分子,所述短RNA分子通过下调存在于所述细胞中的靶RNA转录本而特异上调细胞中的靶基因,其中所述靶基因是诱导多潜能基因且所述革El RNA转录本:i)转录自:a)直到所述靶基因的转录起始位点的上游IOOkb的某一基因座的一条链,b)直到所述靶基因的转录终止位点的下游IOOkb的某一基因座的一条链;或者c)与靶基因物理性相互作用的某一基因座的一条链;和ii)包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列反义的序列。在另一方面,本发明提供一种短RNA分子,所述短RNA分子通过下调存在于所述细胞中的靶RNA转录本而特异下调细胞中的靶基因,其中所述靶基因是引起分化的基因且所述革El RNA转录本:i)转录自:a)直到所述靶基因的转录起始位点的上游IOOkb的某一基因座的一条链,b)直到所述靶基因的转录终止位点的下游IOOkb的某一基因座的一条链;或者c)与靶基因物理性相互作用的某一基因座的一条链;和ii)包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列正义的序列。除非另有说明,上述与本发明的方法相关的定义和描述已作必要修正应用于本发明的产品方面。如在实施例中所讨论的,使用上述算法,本发明的发明人已经设计了有效调节多种基因活性的具体短RNA分子。因此,在另一方面,本发明提供了具有下列表中所显示的具体序列的短RNA分子。M I针对KLF4的活化小RNA (saRNA)候诜物该表列出了针对反义EST DB461753(ID DB-1和DB-2)和KLF4的启动子区(IDPr-1和Pr-2)的两种最有价值的siRNA。“Pos”是EST或KLF4启动子区内的靶起始位点;“外显子”是所述靶起始位点的外显子数;“正义”显示所述siRNA的19mer靶位点序列;“反义”显示对应的反向互补序列。所述正义和反义序列在它们的3’末端加2nt突出序列(UU,没有在表中列出)形成所述siRNA双聚体候选物。
权利要求
1.一种设计短RNA分子的方法,所述短RNA分子通过下调非编码RNA转录本而增加细胞中靶基因的表达,所述方法包括以下步骤: a)获得所述靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间; b)确定与步骤a)中确定的核苷酸序列反向互补的RNA序列;和 c)设计短RNA分子,所述短RNA分子与步骤b)中确定的序列的某一区域反向互补或与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性; 其中,所述方法不包括确定非编码RNA转录本的存在的步骤。
2.根据权利要求1所述的方法,其特征在于,所述靶基因是诱导多潜能基因。
3.根据权利要求1或权利要求2所述的方法,其特征在于,c)中定义的所述区域包括所述基因的转录起始位点的反向互补序列。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述短RNA分子的长度是16个核苷酸至30个核苷酸。
5.根据权利要求1-3任意一项所述的方法,进一步包括产生双链SiRNA分子的步骤,所述双链siRNA分子合并所述短RNA分子。
6.根据权利要求5所述的方法,其特征在于,所述双链siRNA分子的每一链长度是16-30个核苷酸,且所述分子在至少12个核苷酸长度上杂交。
7.根据前述权利要求任意一项所述的方法,其特征在于,所述短RNA分子的长度是21个核苷酸。`
8.根据权利要求1-7任意一项所述的方法,其特征在于,所述短RNA分子是步骤b)中确定的序列的某一区域的反向互补序列,或者所述短RNA分子与步骤b)中确定的序列的某一区域的反向互补序列有至少95%的序列一致性。
9.根据权利要求1-8任意一项所述的方法,其特征在于,步骤a)包括获得所述靶基因的编码链的核苷酸序列,所述序列至少在所述基因的转录起始位点上游500个核苷酸和所述基因的转录起始位点的下游500个核苷酸之间。
10.一种通过下调非编码RNA转录本以增加细胞中靶基因的表达的方法,所述方法包括以下步骤: a)获得所述靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间; b)确定与在步骤a)中确定的核苷酸序列反向互补的RNA序列; c)设计短RNA分子,所述短RNA分子是步骤b)中确定的序列的某一区域的反向互补序列,或者所述短RNA分子与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性;和 d)用所述短RNA分子接触所述细胞; 其中,所述方法不包括确定所述非编码RNA转录本的存在的步骤。
11.一种或多种计算机可读介质,所述计算机可读介质包括计算机可执行的指令以指示计算机系统进行: a)接收靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间;b)确定与步骤a)中接收的核苷酸序列反向互补的RNA序列;和 c)输出信息以构建短RNA分子,所述短RNA分子被设计为通过下调非编码RNA转录本以增加细胞中靶基因的表达,所述短RNA分子是步骤b)中确定的序列的某一区域的反向互补序列或与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性; 其中,所述指令不包括要求确定所述非编码RNA转录本的存在的指令。
12.权利要求11的一种或多种计算机可读介质,所述计算机可读介质包括计算机可执行指令以指示计算机系统,进一步包括输出信息以在计算机可读介质上构建短RNA分子的指令。
13.—种通过上调细胞中的靶基因而维持或增加一群细胞的分化潜能的方法,其中所述靶基因是诱导多潜能基因且所述方法包括用特异下调所述细胞中的靶RNA转录本的短RNA分子接触所述细胞,其中所述靶RNA转录本: i)转录自: a)直到所述靶基因的转录起始位点的上游IOOkb的某一基因座的一条链, b)直到所述靶基因的转录终止位点的下游IOOkb的某一基因座的一条链;或者 c)与靶基因物理性相互作 用的某一基因座的一条链;和 ii)包括与定位在所述靶基因的转录起始位点的上游IOOkb和所述靶基因的转录终止位点的下游IOOkb之间的基因组序列反义的序列。
14.根据权利要求13所述的方法,其特征在于,所述靶RNA转录本包括与包括所述靶基因的转录起始位点的基因组序列反义的序列。
15.根据前述权利要求任意一项所述的方法,其特征在于,所述靶基因选自KLF4、POU5F1、SOX2、MYC、NANOG 和 LIN28。
16.根据权利要求15所述的方法,其特征在于,所述靶基因是KLF4。
17.—种产生RNA分子的方法,包括实施权利要求1-9任意一项所要求的方法以及合成由此设计的RNA分子。
18.—种短RNA分子,具有说明书表1-3中所列的任意一条序列。
全文摘要
本发明涉及一种设计短RNA分子的方法,所述短RNA分子通过下调非编码RNA转录本而增加细胞中靶基因的表达,所述方法包括步骤a)获得所述靶基因的编码链的核苷酸序列,该序列至少在所述基因的转录起始位点的上游200个核苷酸和所述基因的转录起始位点的下游200个核苷酸之间;b)确定与步骤a)中确定的核苷酸序列反向互补的RNA序列;和c)设计短RNA分子,所述短RNA分子与步骤b)中确定的序列的某一区域反向互补或与步骤b)中确定的序列的某一区域的反向互补序列有至少80%的序列一致性;其中,所述方法不包括确定非编码RNA转录本的存在的步骤;本发明还涉及这样的短RNA分子及其的应用。
文档编号C12N15/113GK103201384SQ201180029349
公开日2013年7月10日 申请日期2011年6月23日 优先权日2010年6月23日
发明者P·赛特罗姆 申请人:米纳治疗有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1