组合物以及用于生产蛋白质的方法

文档序号:3586916阅读:157来源:国知局
专利名称:组合物以及用于生产蛋白质的方法
技术领域
本发明提供了大体上关于蛋白质生产领域的方法。确切地,本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法。
背景技术
许多因素影响蛋白质生产,包括基因拷贝数目、基因位点、转录以及翻译效率、转录因子以及mRNA稳定性。已经将努力集中在为了增加蛋白质生产而操纵这些因素以及其他因素的技术的开发上。因此,例如,在文献中发现众多通过改变密码子的使用来增加蛋白质表达的报道,使得这种合成基因趋近为一种用于蛋白质表达的常见的策略。尽管有报道的优点,实验的观察常常强调在异源蛋白生产效率的确定中其他因素的重要性。因此,还没有设计出用于提供在所需蛋白质生产中的可预测性水平的方法。因此,本发明通过那些提供用于对以所希望的量生产一种感兴趣蛋白质的一种mRNA进行选择的方法来解决本领域中的上述缺点。发明概述本发明的一个第一方面提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)的每个单独mRNA序列确定一种或多种下列参数:(i)整体自由能(EFE) ;(ii)在一种热力学整体中的最小自由能频率(FMFE) RNA 二级结构;以及(iii)整体多样性(ED) ;c)根据在步骤(b)中确定的这些参数,对该阵列中的这些单独mRNA序列评等级;并且d)选择来自步骤(c)的分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。本发明的另一方面提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构进行确定;c)对(a)中的每个单独mRNA序列的一种或多种下列参数进行确定:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA 二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生广该感兴趣多妝。

在其他方面,本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产一个阵列的单独的mRNA序列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的整体自由能(EFE)进行确定;
c)对(a)每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE) RNA 二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。本发明进一步提供了一种选择用于增强生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自具有MFE RNA 二级结构最高值以及FMFE RNA 二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在从大约Okcal/mol至大约_2kcal/mol范围内的MFE RNA 二级结构以及FMFE RNA 二级结构最低值的这些mRNA序列的mRNA之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。本发明的另外一方面提供了一种选择用于减少生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE)RNA二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有MFERNA 二级结构最低值以及FMFE RNA 二级结构最高值的分等级阵列中的大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在从大约_9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构以及FMFERNA 二级结构最高值的这些mRNA 序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。本发明的其他方面提供了一种选择用于增强生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列山)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;并且c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最高值以及FMFE RNA 二级结构最低值的分等级阵列中的大约0.0001%至大约20%的这些序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。在仍其他方面中,本发明提供了一种选择用于减少生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及在一个热力学整体中的最小自由能频率(FMFE)RNA 二级结构进行确定;c)根据以上步骤
(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最低值以及FMFE RNA 二级结构最高值的分等级阵列中的大约0.0001%至大约20%的这些序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。本发明进一步提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE) RNA 二级结构进行确定;c)根据在(b)中该确定的MFERNA 二级结构,从最高的MFE RNA 二级结构至最低的MFERNA 二级结构,对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自下列各项:具有在从大约Okcal/mol至大约-2kcal/mol范围内的MFE RNA 二级结构的mRNAs组,具有在从大约_2kcal/mol至大约_9kcal/mol范围内的MFERNA 二级结构的mRNAs组,或具有在从大约_9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构的mRNAs组,其中该选择的mRNA生产该感兴趣多肽。此外还提供了一种选择用于增强生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE) RNA 二级结构进行确定;并且c)选择(a)中的一种具有在从大约Okcal/mol至大约_2kcal/mol范围内的MFE RNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。在本发明的另外一方面中,提供了一种选择用于减少生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE) RNA二级结构以及(a)中的每个单独mRNA序列的表达水平进行确定;c)选择(a)中的一种具有在从大约_9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。在本发明的某些实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据本发明的这些方法选择一种对感兴趣多肽进行编码的mRNA ; (b)对(a)中mRNA的核苷酸序列进行突变以生产一种突变的mRNA,与(a)中mRNA的核苷酸序列的MFE RNA 二级结构相比,该突变的mRNA具有增加的或减少的MFE RNA 二级结构,并且与(a)中mRNA编码的多肽序列相比,该突变的mRNA编码一种突变的多肽序列;其中该突变的多肽序列保留了由(a)的mRNA编码的多肽的功能,并且在一种生物细胞中该突变的mRNA序列与野生型mRNA序列相比其表达导致该感兴趣多肽的修饰的生产。在本发明的另外的实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据本发明的这`些方法选择一种对感兴趣多肽进行编码的mRNA ; (b)对在这种根据(a)选择的mRNA的核苷酸序列与所述生物的一种野生型内源核苷酸序列之间的差别进行鉴别,其中该野生型内源核苷酸序列编码了一种感兴趣多肽,该感兴趣的多肽与这种根据(a)选择的mRNA所编码的多肽相同;并且(c)对这种编码该感兴趣多肽的内源核苷酸序列进行原位突变以将(b)中所鉴别的核苷酸的每个差别合并进该内源核苷酸序列中,由此在该生物的细胞中来自该原位突变的内源核苷酸序列的该感兴趣多肽的生产被修饰。通过阅读以下说明书并且参照形成其一部分的附图、或出于披露目的给出的本发明的实施方案的任何实例,其他的以及进一步的目的、特征以及优点将会清楚并且更易于理解。附图简要说明

图1是一个流程图,展示了根据本发明的某些实施方案的操作。图2是一个框图,展示了根据本发明的某些实施方案的系统。图3显示了用载体构建体渗入的叶的样品中,在烟草瞬态系统中用AmCyan (CFP)对N-末端ssRubisco (核酮糖-1,5- 二磷酸羧化酶)叶绿体转运肽的不同变体[表2]进行编码的AmCyan转录物的水平(A)以及AmCyan相对于PPO的mRNA水平(B)。图4显示了 CFP (AmCyan)变体的蛋白质生产水平(ELISA)与它们的最小自由能水平(A)以及它们的整体自由能水平(B)之间的相关性。

图5显示了 AmCyan (CFP)变体的蛋白质生产水平(ELISA)与它们的最小自由能水平(A)以及它们的整体自由能水平(B)之间的相关性。CFP=AmCyan[蓝绿色荧光蛋白]表达水平;CFP*(23.3PP0)=CFP表达水平,相对于PPO (来自相同的烟草瞬态载体)表达水平的归一化。图6显示在酵母系统中计算的mRNA折叠能量与蛋白质(ELISA)生产的相关性,相对于测量的转录水平(qRT-PCR)归一化。图7显示了酵母系统中AmCyan (CFP)变体的蛋白质生产水平(ELISA)与它们的整体自由能水平之间的相关性。发明详细说明本说明书并非旨在成为实施本发明的所有的不同方法、或所有的加至本发明的特征的详细目录。例如,对于一个实施方案所展示的特征可以结合在其他实施方案中,并且对于一个特定的实施方案所展示的特征可以从那个实施方案中删除。此外,鉴于本披露内容,在此建议的不偏离本发明的多种变体以及对不同实施方案的增添对于本领域的普通技术人员将是清楚的。因此,以下说明书旨在说明本发明的一些具体的实施方案,并且不是穷尽性地限定所有的排列、组合以及其变体。本发明诸位发明人通过对一种编码感兴趣蛋白质的mRNA 二级结构的一个或多个(例如1、2、3、4、5个、等)、或者两个或更多个(例如2、3、4、5个、等)热力学变量进行确定,已经发现可以选择一种对感兴趣多肽进行编码的mRNA,该mRNA以希望的或预选的速率和/或水平和/或在特定的生产条件下生产了一种蛋白质。因此,本发明的一些实施方案提供了选择一种mRNA的方法,该mRNA用于感兴趣多肽的调整的(增强的或减弱的(例如减少的))生产。因此,在本发明的一些实施方案中,可以选择一种对感兴趣多肽进行编码的mRNA,与由编码相同的感兴趣多肽的野生型(即天然的)mRNA生产的蛋白质的量相比,该mRNA生产的蛋白质的量是增强的或增加的。在本发明的仍其他的实施方案中,可以选择一种对感兴趣多肽进行编码的mRNA,与由编码相同的感兴趣多肽的野生型mRNA生产的蛋白质的量相t匕,该mRNA生产的蛋白质的量是减少的或减弱的。在本发明的另外方面,可以选择对感兴趣多肽进行编码的一种第一 mRNA,与由编码相同感兴趣多肽的一种第二 mRNA (例如,非天然的mRNA)生产的蛋白质的量相比,该第一 mRNA生产的蛋白质的量是增强的或增加的。在本发明的仍另外的方面,可以选择对感兴趣多肽进行编码的一种第一 mRNA,与由编码相同的感兴趣多肽的一种第二 mRNA生产的蛋白质的量相比,该第一 mRNA生产的蛋白质的量是减弱的或减少的。基于使用本发明的方法对mRNA的选择,增强(例如增加)或减弱(例如减少、降低)的量可以按照希望的改变。因此,可以通过使用本发明的方法选择基于天然或第二 mRNA生成的阵列的任意mRNA,与野生型或天然的mRNA或第二 mRNA相比,该阵列的任意mRNA生产改变的量的感兴趣多肽。此外,可以使用此处描述的这些方法作为一种工具以克服RNA沉默。作为一个实例,强的启动子经常被用来产生一种高水平的RNA转录物。但是,本领域的普通技术人员所熟知的是强的启动子常常导致基因沉默。反而,一种中等的或弱的启动子可以与一种包括根据本发明的方法选择的mRNA的基因构建体组合使用以生产一种更高效地被翻译的mRNA转录物。因此,尽管使用一种弱的或中等的启动子,通过使用本发明的方法可以获得高水平的蛋白质生产,这种启动子可以识别被更高效地翻译的mRNA转录物,并且在同时避免了由于高转录水平导致的基因沉默。因此,本发明的一个方面提供了选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)每个单独mRNA序列确定一种或多种下列参数:(i)整体自由能(EFE);(ii)在一种热力学整体中的最小自由能频率(FMFE) RNA 二级结构;以及(iii)整体多样性(ED);c)根据在步骤(b)中确定的这些 参数,对该阵列中的这些单独mRNA序列评等级;并且d)选择来自步骤(c)的分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。在某些实施方案中,如上所述的,当确定两种或更多种参数时,根据在步骤(b)中确定的这些参数的联合分布,对在步骤(c)的该阵列中的这些单独mRNA序列评等级。本发明的另一方面提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构进行确定;c)对(a)中每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA 二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多妝。在其他方面,本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的整体自由能(EFE)进行确定;c)对(a)中每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE) RNA 二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(c)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。因此,在本发明的某些实施方案中,可以对一个阵列的每个单独mRNA序列的下列参数或参数的组合进行确定,并且可以使用下列参数或参数的组合对单独mRNA序列评等级(应指出当确定两种或更多种参数时根据这些参数的联合分布进行评等级):(I)EFE ; (2)FMFE ; (3) MFE ; (4) ED ; (5) EFE 和 FMFE ; (6) EFE 和 ED ; (7) FMFE 和 ED ; (8) EFE, FMFE 和 ED ;
(9)MFE和FMFE ; (IO)MFE和ED ;以及(Il)MFE, FMFE和ED。进一步地,在一些方面,本发明进一步包括除了对以上所述的这些参数或参数的组合之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,如在此进一步提供的,可以对于一个阵列中的每个单独mRNA序列确定下列参数的组合,并且对于单独的mRNA序列可以根据联合分布使用下列参数的组合评等级:(I)EFE 和 BPP ; (2)FMFE 和 BPP ; (3)ED 和 BPP ; (4)EFE, FMFE 和 BPP ; (5)EFE、ED 和 BPP ; (6) FMFE、ED 和 BPP ; (7) EFE、FMFE、ED 和 BPP ; (8) MFE、FMFE 和 BPP ; (9) MFE,ED 和 BPP ;以及(10)MFE、FMFE、ED 和 BPP。将理解的是虽然术语“第一(first)”、“第二( second)”等可以在此使用以描述不同的要素,这些要素不应被这些术语限制。这些术语仅仅用于将一种要素与彼此区分。因此,以下讨论的一种“第一”要素(例如,第一 mRNA序列)还可以在不偏离本发明所传授的内容下称为一种“第二”要素(例如,第二 mRNA序列)。“野生型”核苷酸、核苷酸序列、多肽或氨基酸序列指的是天然发生的(“天然的(native)”)或内源核酸、核苷酸序列、多肽或氨基酸序列。因此,“野生型mRNA”是一种生物内天然发生的或内源性的mRNA。如在此使用的,术语“热力学优化方法”是指用来确定核酸分子的最小自由能结构的Zuker算法的任意实现方式(Zuker等人,《核酸研究》(NucleicAcidsResearch), 9, 133-148 (1981);还参见,Mathews 等人,《分子生物学期刊》(J.Mol.Biol.)288:911-940 (1999)以及 Walter 等人,PNAS91:9218-9222 (1994))。

在此使用的术语“最小自由能RNA 二级结构”(MFE)是指经热力学优化(即Zuker算法(M.Zuker 以及 P.Stiegler.,《核酸研究》(Nucleic AcidsResearch)9:133-148 (1981))的一种实现方式)发现的具有最低的自由能值的结构。术语“最小自由能频率RNA 二级结构”(FMFE)是指在热力学整体中的MFE结构的部分,该FMFE为:(e~ (-E/kT))/Z,其中E是结构的最小自由能,k是玻尔兹曼常数,T是温度并且Z是配分函数(Wuchty等人,《生物聚合物》(Biopolymers) 49:145-165 (1999))。因此,配分函数以及热力学整体的结构被用来确定FMFE RNA 二级结构。在此使用的术语“配分函数”是指由J.S.McCasldll在《生物聚合物》(Biopolymers)29:1105-1119(1990)中定义的配分函数:Z=和(e~ [Ei/kT]),其中对于给出序列,Ei是结构i的自由能并且和(sum)是对所有的结构(从i=l至i=n)进行求和。在此使用的术语“整体自由能”(EFE)是指_kT*ln Z,其中k、T、以及Z是如上所定义的并且例如在ViennaRNA软件包中被执行(1.L.Hofacker等人,《化学月刊》(Monatsh.Chem.),125:167-188 (1994))。整体自由能是由 J.S.McCaskill 在《生物聚合物》(Biopolymers) 29:1105-1119(1990)中定义。在此使用的术语“整体多样性”(ED)是指在热力学整体中的所有结构之间的碱基配对平均差:sum_a, b p_a*p_b*d(a, b),其中该和(sum)是对所有可能的结构的碱基对进行求和a, b, p_a是结构a的玻尔兹曼重量,并且d(a,b)是碱基对距离,其中碱基对距离是由Wuchty等人在《生物聚合物》(Biopolymers) 49:145-165 (1999)中所定义。
参数的“联合分布”以特定的确定参数(例如MFE、EFE、FMFE, ED和/或BPP)的形式限定了事件的概率。因此,当参数MFE、EFE、FMFE、ED和/或BPP中的两种或更多种参数确定时,根据对于每个单独mRNA的各个参数确定的值,使用一种联合分布来对mRNA评等级。因此,在此使用的“联合分布”可以通过选择感兴趣序列的一个起始部分(例如较高的5%的如上定义的MFE结构)、并且然后通过使用确定的其他参数(如FMFE)选择该起始部分的一部分来限定。例如,取较高和较低10%的MFE结构(例如对应地对于增强的和减少的表达),然后根据它们的FMFE值取这些部分各自的前50%。在此使用的术语“碱基配对概率”(BPP)是指在每个位置具有香农熵的核苷酸序列中的所有位置的平均碱基配对概率。碱基配对概率的计算是由J.S.McCaskill在《生物聚合物》(Biopolymers)29:1105-1119 (1990)中定义的,并且被实施于,例如ViennaR A软件包中(1.L.Hofacker 等人,《化学月刊》(Monatsh.Chem.),125:167-188(1994))。熵值的计算由M.Huynen在《分子生物学期刊》(J Mol.Biol.) 267:1104-1112 (1997)中描述。在本发明的具体实施方案中,这些方法包括:生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列。在本发明的某些实施方案中,通过将感兴趣多肽回译来生产一个阵列以生产对该感兴趣多肽进行编码的mRNAs。在具体实施方案中,通过将感兴趣多肽的N末端回译来生产一个阵列以生产对该感兴趣多肽的N末端进行编码的mRNAs。在另外的实施方案中,通过将感兴趣多肽的N末端回译来生产一个阵列以生产对该感兴趣多肽的N末端进行编码的mRNAs,其中这些生产的单独mRNAs包括一个起始密码子和一个大约20至70个核苷酸长度的序列。因此,在某些实施方案中,生产单独mRNA序列的一个阵列,其中这些单独mRNA序列各自包括该起始密码子以及一个长度的核苷酸,该长度是大约20至大约25个核苷酸、大约20至大约30个核苷酸、大约20至大约35个核苷酸、大约20至大约40个核苷酸、大约20至大约45个核苷酸、大约20至大约50个核苷酸、大约20至大约55个核苷酸、大约20至大约55个核苷酸、大约20至大约60个核苷酸、大约20至大约65个核苷酸、大约25至大约30个核苷酸、大约25至大约35个核苷酸、大约25至大约40个核苷酸、大约25至大约45个核苷酸、大约25至大约50个核苷酸、大约25至大约55个核苷酸、大约25至大约60个核苷酸、大约25至大约65个核苷酸、大约25个核苷酸至大约70个核苷酸、大约30至大约35个核苷酸、大约30至大约40个核苷酸、大约30至大约45个核苷酸、大约30至大约55个核苷酸、大约30至大约55个核苷酸、大约30至大约60个核苷酸、大约30至大约65个核苷酸、大约30个核苷酸至大约70个核苷酸、大约35至大约40个核苷酸、大约35至大约45个核苷酸、大约35至大约50个核苷酸、大约35至大约55个核苷酸、大约35至大约60个核苷酸、大约35至大约65个核苷酸、大约35至大约70个核苷酸、大约40至大约45个核苷酸、大约40至大约50个核苷酸、大约40至大约55个核苷酸、大约40至大约60个核苷酸、大约40至大约6 5个核苷酸、大约40至大约70个核苷酸、大约45至大约50个核苷酸、大约45至大约55个核苷酸、大约45个核苷酸至大约60个核苷酸、大约45至大约65个核苷酸、大约45至大约70个核苷酸、大约50至大约55个核苷酸、大约50至大约60个核苷酸、大约50至大约65个核苷酸、大约50至大约70个核苷酸、大约55至大约60个核苷酸、大约55至大约65个核苷酸、大约55至大约70个核苷酸、大约60至大约65个核苷酸、大约60至大约70个核苷酸、大约65至大约70个核苷酸、等等。因此,在另外的实施方案中,一个阵列的这些单独mRNA序列包括一个起始密码子以及一个长度的核苷酸,该长度是大约20个核苷酸、大约21个核苷酸、大约22个核苷酸、大约23个核苷酸、大约24个核苷酸、大约25个核苷酸、大约26个核苷酸、大约27个核苷酸、大约28个核苷酸、大约29个核苷酸、大约30个核苷酸、大约31个核苷酸、大约32个核苷酸、大约33个核苷酸、大约34个核苷酸、大约35个核苷酸、大约36个核苷酸、大约37个核苷酸、大约38个核苷酸、大约39个核苷酸、大约40个核苷酸、大约41个核苷酸、大约42个核苷酸、大约43个核苷酸、大约44个核苷酸、大约45个核苷酸、大约46个核苷酸、大约47个核苷酸、大约48个核苷酸、大约49个核苷酸、大约50个核苷酸、大约51个核苷酸、大约52个核苷酸、大约53个核苷酸、大约54个核苷酸、大约55个核苷酸、大约56个核苷酸、大约57个核苷酸、大约58个核苷酸、大约59个核苷酸、大约60个核苷酸、大约61个核苷酸、大约62个核苷酸、大约63个核苷酸、大约64个核苷酸、大约65个核苷酸、大约66个核苷酸、大约67个核苷酸、大约68个核苷酸、大约69个核苷酸、或大约70个核苷酸。在本发明的具体实施方案中,一个阵列的这些单独mRNA序列包括一个起始密码子以及大约40个核苷酸。 在本发明的另外的实施方案中,这些阵列中的单独mRNA序列包括相对于该起始密码子在-20至50位置(即起始密码子ATG (AUG)的A是O位)的核苷酸。在本发明的某些具体实施方案中,这些单独mRNA序列的5’端包括相对于该起始密码子在-4至35位置的核苷酸。在本发明的另外的实施方案中,这些单独mRNA序列的5’端包括相对于该起始密码子在-4至37位置的核苷酸。在其他实施方案中,这些单独mRNA序列包括以下各项:相对于该起始密码子在-15至50位置的核苷酸、相对于该起始密码子在-10至50位置的核苷酸、相对于该起始密码子在-5至50位置的核苷酸、相对于该起始密码子在-20至45位置的核苷酸、相对于该起始密码子在-15至45位置的核苷酸、相对于该起始密码子在-10至45位置的核苷酸、相对于该起始密码子在-5至45位置的核苷酸、相对于该起始密码子在-20至40位置的核苷酸、相对于该起始密码子在-15至40位`置的核苷酸、相对于该起始密码子在-10至40位置的核苷酸、相对于该起始密码子在-5至40位置的核苷酸、相对于该起始密码子在-20至35位置的核苷酸、相对于该起始密码子在-15至35位置的核苷酸、相对于该起始密码子在-10至35位置的核苷酸、相对于该起始密码子在-5至35位置的核苷酸、相对于该起始密码子在-20至30位置的核苷酸、相对于该起始密码子在-15至30位置的核苷酸、相对于该起始密码子在-10至30位置的核苷酸、相对于该起始密码子在-5至30位置的核苷酸、相对于该起始密码子在-20至25位置的核苷酸、相对于该起始密码子在-15至25位置的核苷酸、相对于该起始密码子在-10至25位置的核苷酸、相对于该起始密码子在-5至25位置的核苷酸、相对于该起始密码子在-20至20位置的核苷酸、相对于该起始密码子在-15至20位置的核苷酸、相对于该起始密码子在-10至20位置的核苷酸、相对于该起始密码子在-5至20位置的核苷酸、相对于该起始密码子在-20至15位置的核苷酸、相对于该起始密码子在-15至15位置的核苷酸、相对于该起始密码子在-10至15位置的核苷酸、相对于该起始密码子在-5至15位置的核苷酸、相对于该起始密码子在-20至10位置的核苷酸、相对于该起始密码子在-15至10位置的核苷酸、相对于该起始密码子在-10至10位置的核苷酸、等等。因此,在某些具体实施方案中,一个阵列的这些单独mRNA序列包括一个起始密码子以及大约40个核苷酸,这些单独mRNA序列的5’端包括相对于该起始密码子在_4至35位置的核苷酸。在本发明的某些实施方案中,生产的一个阵列包括对该感兴趣多肽进行编码的所有可能的mRNAs。在本发明的其他实施方案中,生产的一个阵列是一种“代表性阵列”。因此,如在此使用的,代表性阵列是指一种其中不是对所有的可能编码感兴趣多肽的mRNAs进行生产并且对在此所述的这些参数进行评估的阵列,而是对代表了编码该感兴趣多肽的mRNAs的分布的一种亚群或子群进行生产并且评估。可以通过使用本领域中已知的有偏协议或无偏协议对一个代表性阵列进行生产。一种生成代表性阵列的无偏方法的非限制性实例开始于一种氨基酸序列的输入。使用一种自动随机取样程序以生成对所输入的氨基酸序列进行编码的核苷酸序列(例如,BioPerl)。(Stajich等人,《基因组研究》(Genome Res)12(10):1611-8(2002))。对氨基酸序列中的各个位置,通过对来自均匀分布的可能的密码子进行取样来选择那个位置的密码子。因此,在某些实施方案中,用这种方式对于每一个输入的氨基酸序列生产了 I万种核苷酸序列。在其他的实施方案中,生产了更多或更少数目的核苷酸序列。生产的序列的数目将依赖于许多因素,这些因素包括该输入的氨基酸序列的长度。因此,在本发明的某些实施方案中,一个阵列包括大约IO3至大约IO8个单独mRNA序列。在其他实施方案中,本发明的一个阵列包括大约103、大约2\103、大约4\103、大约6父103、大约8父103、大约104、大约2X104、大约4X 104、大约6X 104、大约8X 104、大约105、大约2X105、大约4X105、大约6X105、大约8X105、大约106、大约2X106、大约4X106、大约6X106、大约8X106、大约107、大约2X107、大约4X 107、大约6X 107、大约8X107、或大约IO8个单独mRNA序列。如在此描述的,本发明提供了选择mRNA的多种方法,该mRNA具有所希望的感兴趣多肽的生产水平。因此,在某些实 施方案中,本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法,其中该感兴趣多肽 的生产增强了。在其他实施方案中,提供了一种选择用于生产感兴趣多肽的mRNA的方法,其中该感兴趣多肽的生产减少了。如在此描述的选择的mRNA可以具有轻微增强的、中等增强的或极大增强的蛋白质生产。在本发明的其他实施方案中,可以选择一种mRNA,该mRNA具有所希望水平的蛋白质生产,该所希望水平的蛋白质生产是轻微减少的、中等减少的或极大减少的。在某些实施方案中,与由野生型mRNA生产的相同感兴趣多肽相比,由选择的mRNA生产的蛋白质的水平被增强或减少。在某些实施方案中,选择一种mRNA序列,该序列与由野生型mRNA生产的相同感兴趣多肽相比,生产了相同量的蛋白质(0%增强或减少)。如在此使用的,轻微增强的或轻微减少的可以是指与天然mRNA或其他选择的mRNA相比,在感兴趣多肽的生产中的变化为:大约0.0001%、0.0005%、0.001%、0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、等等。中等增强的或中等减少的可以是指与天然mRNA或其他选择的mRNA相比,在感兴趣多肽的生产中的变化为:25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、等等。极大增强的或极大减少的可以是指与天然mRNA或其他选择的mRNA相比,在感兴趣多肽的生产中的变化为:大约 45% 至大约 100% (例如,45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、等)。在其他实施方案中,本发明提供了一种选择用于生产感兴趣多肽的第一 mRNA (选择的mRNA)的方法,其中与由一种第二 mRNA生产该多肽相比,由该第一 mRNA对该感兴趣多肽的生产增强或减少了,该第二 mRNA编码与由第一 mRNA所编码的相同的感兴趣多肽。因此,本发明提供了用于选择mRNA的方法,该选择是基于对该mRNA的评等级,它的评等级是在对于阵列中这些单独mRNA序列的各个确定的参数值的分布之内进行。因此,例如将一个阵列的这些mRNAs从对于各个确定参数(即,MFE RNA 二级结构、EFE、FMFE RNA二级结构、ED和/或BPP)的最高值至最低值分等级;因此,提供了对于单个感兴趣多肽进行编码的但是具有不同的确定参数值(即,MFE RNA 二级结构、EFE、FMFERNA 二级结构、ED、和/或BPP)的mRNAs的分布。可以将该分布描述为从在100%的最高值至在小于1% (例如0.0001%,0.0005%,0.001%,0.005%,0.01%、等)的最低值的范围。可以沿着这种分布从小于1% (例如 0.0001%, 0.0005%, 0.001%, 0.005%, 0.01%、等)至 100% 的任何地方选择一种 mRNA O因此,通过选择一种如在此描述的mRNA,可以获得所希望水平的蛋白质生产。因此,在本发明的某些实施方案中,可以从给出的阵列的mRNAs中选择一种mRNA,该给出的阵列具有一种MFE RNA 二级结构值,该MFE RNA 二级结构值是在对该序列的阵列所确定的MFE最高值的大约95%-100%之间。在其他实施方案中,可以从具有下列MFE值的mRNA序列中选择一种mRNA,该MFE值是对mRNA序列阵列所确定的在大约90%_100%、85%-100%,90%-95%、85%-95%、80%_95%、85%_90%、80%_90%、75%_90%、80%_85%、75%_85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%_55%、45%_55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%_5%、等等之间的范围内。因此,在某些 实施方案中,可以从具有下列MFE值的mRNA序列中选择一种mRNA,该MFE值是对该序列阵列所确定的MFE最高值的大约0.0001%,0.0005%,0.001%,0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。 在其他实施方案中,该MFE RNA 二级结构(MFE)值相对于在该阵列内的这些mRNA的蛋白质生产的水平没有形成一种线性模式但是反而形成了一种分段模式,该分段模式中mRNAs分成多个组,其中对于各组之内的mRNAs尽管具有不同的MFE值但是其表达水平或蛋白质生产是相同的。确切地,在一个分段模式中,当影响蛋白质表达的其他因素保持不变,具有落入特定的范围内的MFE值的mRNAs可以具有相同的蛋白质表达水平。因此,在某些实施方案中mRNAs的分组是基于计算的MFE。表达水平的分段模式可以发生,这是因为对于具有不同MFE值的mRNAs,打开给出的用于翻译的mRNA结构所要求的能量可以是相同的。因此,例如,在25° C下对于单个GTP至⑶P的水解的AG。是-6.95kcal/mol (在37° C下该AG。是-7.14)。因此,在某些实例中,某些具有不同MFE值的mRNAs为了打开它们用于翻译的结构,可以各自要求单个GTP的能量(一种“单个能量包”)。因此,尽管MFE值不同,来自那些要求“单个能量包”(例如ATP、GTP等等)的mRNAs的表达水平或蛋白质生产可以是相同的或相似的,并且因此可以通过从特定范围内的MFE值选择任意的RNA来获得相似的蛋白质生产水平。作为一个实例,一种具有_3kcal/mol的MFE值的mRNA以及另一种具有_6kcal/mol的MFE值的mRNA两者都可以为了打开它们的翻译结构要求一种或少于一种的能量包。所以,对于这两种mRNA其蛋白质生产效率是相同的,并且因此可以不用考虑蛋白质生产水平的结果而选择两者之中的任一个。通过水解的“能量包”(例如GTP、ATP等)以及对应的释放的能量的数目对在范围之间的边界进行确定。因此,例如,第一个范围可以对应于O个GTP水解,第二个范围对应于I个GTP水解,等等。这些边界在某些程度上可以是可变的,并且在相邻的范围之间存在一些重叠,这是因为(I)从水解释放的能量随着温度、以及体内水生的和离子的环境而变化并且(2)对于mRNAs的MFE的计算可以是近似的。通常,这些边界可以通过实验来计算并且在这些边界附近的mRNAs被避免。如在此所述的,计算MFE的方程在本领域中是已知的(即(e~(_E/kT))/Z,其中E是结构的最小自由能,k是玻尔兹曼常数,T是温度并且Z是配分函数(Wuchty等人,《生物聚合物》(Biopolymers) 49:145-165 (1999))。因此,在某些实施方案中,可以从一组mRNAs选择一种mRNA,该组mRNAs是在给出的阵列中,该阵列具有在从大约Okcal/mol至大约_2kcal/mol范围内的、在从大约_2kcal/mol至大约_9kcal/mol范围内的、或在从大约_9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构值。从哪个组选择的选择将依赖于所希望的蛋白质生产水平。因此,在某些实施方案中,当希望增强的蛋白质生产时,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约Okcal/mol至大约-2kcal/mol范围内的MFE RNA 二级结构值。因此,可以选择的 mRNA 具有以下 MFE 值:大约 Okcal/mol、-0.lkcal/mol、_0.2kcal/mol、_0.3kcal/mol、-0.4kcal/mol、-0.5kcal/mol、-0.6kcal mol、-0.7kcal/mol、-0.9kcal/mol、-lkcal/mol、-l.lkcal/mol、-l.2kcal/mol、_l.3kcal/mol、_l.4kcal/mol、_l.5kcal/mol、_l.6cal/mol、-1.7kcal/mol、-1.8kcal/mol、-1.9kcal/mol、_2kcal/mol、等等。在其他实施方案中,当希望减少的蛋白质生产时,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约-9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构值。在某些实施方案中,当希望减少的蛋白质生产时,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约-9kcal/mol至大约-23kcal/mol范围内的MFE RNA二级结构值。在其他实施方案中,当希望减少的蛋白质生产时,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约_9kcal/mol至大约-30kcal/mol范围内的MFERNA 二级结构值。因此,在某些实施方案中,当希望减少的蛋白质生产时,可以选择一种具有以下 MFE 值的 mRNA:大约 _9kcal/mol、-9.lkcal/mol、-9.2kcal/mol、-9.3kcal/mol>-9.4kcal/mol、_9. 5kcal/mol、_9.6kcal/mol、_9.7kcal/mol、_9.9kcal/mol、_10kcal/mol、 -10.lkcal/mol、 -10.2kcal/mol、 -10.3kcal/mol、 -10.4kcal/mol、 -10.5kcal/mol、-10.6cal/mol、-10.7kcal/mol、-10.8kcal/mol、-10.9kcal/mol、-1lkcal/mol、-11.lkcal/mol、-11.2kcal/mol、-11.3kcal/mol、-11.4kcal/mol、-11.5kcal/mol、-11.6cal/mol、-11.7kcal/mol、-11.8kcal/mol、-11.9kcal/mol、-12kcal/mol、-12.lkcal/mol、-12.2kcal/mol、-12.3kcal/mol、-12.4kcal/mol、-12.5kcal/mol、-12.6cal/mol、-12.7kcal/mol、-12.8kcal/mol、-12.9kcal/mol、-13kcal/mol、-13.lkcal/mol、-13.2kcal/mol、-13.3kcal/mol、-13.4kcal/mol、-13.5kcal/mol、-13.6cal/mol、-13.7kcal/mol、-13.8kcal/mol、-13.9kcal/mol、-14kcalmol、-14.lkcal/mol、-14.2kcal/mol、-14.3kcal/mol、-14.4kcal/mol、-14.5kcal/mol、-14.6cal/mol、-14.7kcal/mol、-14.8kcal/mol、-14.9kcal/mol、-15kcal/mol、-15.lkcal/mol、-15.2kcal/mol、-15.3kcal/mol、-15.4kcal/mol、-15.5kcal/mol、-15.6cai/mol、-15.7kcal/mol、-15.8kcal/mol、-15.9kcal/mol、-16kcal/mol、-16.lkcal/mol、-16.2kcal/mol、-16.3kcal/mol、-16.4kcal/mol、-16.5kcal/mol、-16.6cal/mol、-16.7kcal/mol、-16.8kcal/mol、-16.9kcal/mol、-17kcal/mol、-17.lkcal/mol、-17.2kcal/mol、-17.3kcal/mol、-17.4kcal/mol、-17.5kcal/mol、-17.6cal/mol、-17.7kcal/mol、-17.8kcal/mol、-17.9kcal/mol、-18kcal/mol、-18.lkcal/mol、-18.2kcal/mol、-18.3kcal/mol、-18.4kcal/mol、-18.5kcal/mol、-18.6cal/mol、-18.7kc al/mol、-18.8kcal/mol、-18.9kcal/mol、_19kcal/mol、-19.5kcal/mol、-20kcal/mol、-20.5kcal/mol、-21kcal/mol、-21.5kcal/mol λ -22kcal/mol λ -22.5kcal/mol、-23kcal/mol、-23.5kcal/mol、-24cal/mol、-24.5kcal/mol、 -25kcal/mol、 -25.5kcal/mol、 -26kcal/mol、 -26.5kcal/mol、 -27kcal/mol、-27.5kcal/mol、-28.5kcal/mol、-29kcal/mol、-29.5kcal/mol、-30kcal/mol、等。在仍其他实施方案中,依据所希望的表达水平,可以从以下一组mRNAs中选择该mRNA,该组mRNAs具有在从大约_2kcal/mol至大约_9kcal/mol范围内的MFE RNA 二级结构值。因此,可以选择一种具有以下MFE值的mRNA:大约_2kcal/mol、-2.lkcal/mol、-2.2kcal/mol、-2.3kcal/mol、-2.4kcal/mol、-2.5kcal/mol、-2.6kcal/mol、-2.7kcal/mol、-2.9kcal/mol、-3kcal/mol、-3.lkcal/mol、-3.2kcal/mol、-3.3kcal/molλ-3.4kcal/mol、-3.5kcal/mol、-3.6cal/mol、-3.7kcal/mol、-3.8kcal/mol、-3.9kcal/mol、-4kcal/mol、-4.lkcal/mol、-4.2kcal/mol、-4.3kcal/mol、-4.4kcal/mol、-4.5kcal/mol、-4.6cal/mol、-4.7kcal/mol、-4.8kcal/mol、-4.9kcal/mol、-5kcal/mol、-5.lkcal/mol λ-5.2kcal/mol、-5.3kcal/mol、-5.4kcal/mol、-5.5kcal/mol、-5.6cal/mol、-5.7kcal/mol、-5.8kcal/mol、-5.9kcal/mol、-6kcal/mol、-6.lkcal/mol、-6.2kcal/mol、-6.3kcal/molλ-6.4kcal/mol、-6.5kcal/mol、-6.6cal/mol、-6.7kcal/mol、-6.8kcal/mol、-6.9kcal/mol、-7kcal/mol、-7.lkcal mol、-7.2kcal/mol、-73kcal/mol、-7.4kcal/mol、-7.5kcal/mol、-7.6cal mol、-7.7kcal mol、-7.8kcal/mol、-7.9kcal/mol、-8kcal/mol、-8.lkcal/mol λ-8.2kcal/mol、_8.3kcal/mol、_8.4kcal/mol、_8.5kcal/mol、_8.6cal/mol、_8.7kcal/mol、-8.8kcal/mol、-8.9kcal/mol、_9kcal/mol、等。因此,在本发明的某些实施方案中,提供了一种选择用于生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构进行确定;c)根据在(b)中该确定的MFERNA 二级结构,从最高的MFE RNA 二级结构至最低的MFE RNA 二级结构,对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自下列各项:具有在大约Okcal/mol至大约_2kcal/mol范围内的MFE RNA二级结构的mRNAs组,具有在大约_2kcal/mol至大约_9kcal/mol范围内的MFE RNA 二级结构的mRNAs组,或具有在大约_9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构的mRNAs组,其中该选择的mRNA生产该感兴趣多妝。在其他实施方案中,本发明提供了一种选择选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构进行确定;并且c)选择(a)中的一种具有在大约Okcal/mol至大约_2kcal/mol范围内的MFE RNA 二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。在另外的实施方案中,提供了一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构以及(a)中的每个单独mRNA序列的表达水平进行确定;c)选择(a)中的一种具有在大约_9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。在其他实施方案中,可以从给出阵列的mRNAs中选择一种mRNA,该给出的阵列具有一种EFE值,该EFE值是在对该序列的阵列所确定的大约95%-100%的EFE最高值之间。在其他实施方案中,可以从具有以下EFE值的mRNA序列中选择一种mRNA,该EFE值是在对该mRNA序列阵列所确定的EFE最高值的大约90%-100%、85%-100%、90%-95%、85%_95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%_70%、60%_65%、55%_65%、50% 65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%_50%、40%-45%、35%-45%、 30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在某些实施方案中,可以从具有以下EFE值的mRNA序列中选择一种mRNA,该EFE值是对于该序列阵列所确定的的 EFE 最高值的大约 0.0001%、0.0005%,0.001%、0.005%,0.01%、0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、
100% O 在仍其他实施方案中,可以从给出阵列的mRNA序列中选择一种mRNA,该给出的阵列具有一种FMFE RNA 二级结构值,该FMFE RNA 二级结构值是在对该序列阵列所确定的大约95%-100%的FMFE最高值之间。在其他实施方案中,可以从具有以下FMFE值的mRNAs中选择一种mRNA,该FMFE值是在对该序列阵列所确定的EFE最高值的大约90%_100%、85%-100%,90%-95%、85%-95%、80%_95%、85%_90%、80%_90%、75%_90%、80%_85%、75%_85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%_5%、等等之间的范围内。因此,在另外的实施方案中,可以从具有下列FMFE值的mRNA序列中选择一种mRNA,该FMFE值是对该序列阵列所确定的FMFE最高值的大约1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在另外的实施方案中,可以从给出阵列的mRNA序列中选择一种mRNA,该给出的阵列具有一种MFE RNA 二级结构值,该MFE RNA 二级结构值是在对该序列阵列所确定的MFE最高值的大约95%-100%之间。在其他实施方案中,可以从具有以下MFE值的mRNAs中选择一种mRNA,该MFE值是在对该序列阵列所确定的MFE最高值的大约90%-100%、85%_100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%_25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%_5%、等等之间的范围内。因此,在另外的实施方案中,可以从具有下列MFE值的mRNA序列中选择一种mRNA,该MFE值是对该序列阵列所确定的MFE最高值的大约`0.0001%,0.0005%,0.001%,0.005%,0.01%、0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在本发明的仍是另外的实施方案中,可以从一种给出阵列的mRNAs中选择一种mRNA,该给出的阵列具有的ED是在对该序列阵列所确定的最高值的大约95%-1009ffiD之间。在其他实施方案中,可以从具有以下ED值的mRNA序列中选择一种mRNA,该ED值是在对该序列阵列所确定的ED最高值的大约90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15%-30%、20%-25%、15%-25%、10%-25%、15%-20%、10%-20%、5%-20%、10%-15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在某些实施方案中,可以从具有下列ED值的mRNA序列中选择一种mRNA,该ED值是对该序列阵列所确定的ED最高值的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在本发明的另外方面,可以从给出阵列的mRNA序列中选择一种mRNA,该给出的阵列具有的BPP值是在对该序列阵列所确定的最高值的大约95%-100%的BPP之间。在其他实施方案中,可以从具有以下BPP值的mRNA序列中选择一种mRNA,该BPP值是在对该序列阵列所确定的 BPP 最高值的大约 90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、50%-55%、45%-55%、40%-55%、45%-50%、40%-50%、35%-50%、40%-45%、35%-45%、30%-45%、35%-40%、30%-40%、25%-40%、30%-35%、25%-35%、20%-35%、25%-30%、20%-30%、15Q/『30%、20%-25%、15%-25%、10%_25%、15%_20%、10%-20%、5%_20%、10%_15%、5%-15%、0%-15%、5%-10%、0%-5%、等等之间的范围内。因此,在另外的实施方案中,可以从具有下列BPP值的mRNA序列中选择一种mRNA,该BPP值是对该序列阵列所确定的BPP最高值的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%。在本发明的另外方面,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且MFE RNA 二级结构、EFEJP /或ED是对于阵列中每个单独mRNA序列所确定的一个或多个参数(用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列所确定的MFE RNA 二级结构、EFEJP /或ED最高值的mRNA序列之中选择该mRNA。因此,在本发明的特定方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从以下mRNA序列中选择该mRNA:这些mRNA序列所具有的MFERNA 二级结构、EFEjP /或ED的值是对该阵列的序列所确定的该参数值的最高值的大约95%-100%。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下值的mRNAs中选择该mRNA,该值是在对于该序列阵列所确定的MFE RNA 二级结构、EFEjP /或ED的最高值的大约 90%-100%、85%-100%、90%-95%、85%-95%、80%_95%、85%_90%、80%_90%、75%_90%、80%_85%、75%-85%、70%-85%、75%- 80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%_65%、50%_65%、55%_60%、50%_60%、45%_60%、等的范围内。在仍其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下值的阵列的mRNA序列中选择该mRNA,该值是对于该序列阵列所确定的MFE RNA 二级结构、EFEJP / 或 ED 的最高值的大约 100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。在本发明的其他方面,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且FMFE RNA二级结构是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列所确定的FMFE RNA 二级结构最低值的mRNA序列之中选择该mRNA。因此,在本发明的特定方面,可以从具有以下FMFE值的mRNAs中选择该mRNA,该值是在对该序列阵列所确定的FMFE 二级结构最高值的大约0-5%之间。在其他实施方案中,可以从具有以下FMFE RNA 二级结构值的mRNAs中选择该mRNA,该值是对于该序列阵列所确定的FMFE RNA 二级结构最高值的大约 0%-10%、5%-10%、0%-15%、0%-20%、5%-15%、10%_15%、5%_20%、10%_20%、15%_20%、10%_25%、15%-25%、20%-25%、15%-30%、20%-30%、25%-30%、20%-35%、25%-35%、30%-35%、25%-40%、30%-40%、35%-40%、30%-45%、35%-45%、40%-45%、35%-50%、40%-50%、45%-50%、40%-55%、45%-55%、等的范围内。在仍其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下FMFE值的阵列的mRNA序列中选择该mRNA,该值是对于该序列阵列所确定的 FMFE 最高值的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、等。在本发明的另外方面,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且BPP是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列所确定的BPP最闻值的mRNA序列中选择该mRNA。因此,在本发明的特定方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下BPP值的mRNA序列中选择该mRNA,该值是对该序列阵列所确定的该参数的最大值的大约95%-100%。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下BPP值的mRNAs中选择该mRNA,该值是在对于序列阵列所确定的 BPP 最高值的大约 90%-100%、85%-100%、90%-95%、85%-95%、80%-95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、等的范围内。在仍其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,可以从具有以下BPP值的阵列的mRNA序列中选择该mRNA,该BPP值是对于序列阵列所确定的 BPP 最高值的大约 100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。

在本发明的另外方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且MFE RNA 二级结构、EFEJP /或ED是对于阵列中每个单独mRNA序列所确定的一个或多个参数(该(这些)参数被用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列对应地确定的MFE RNA 二级结构、EFEjP /或ED最低值的mRNA序列之中选择该mRNA。因此,在本发明的特定方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下值的mRNAs中选择该mRNA,该值是对该序列阵列所确定的MFE RNA 二级结构、EFEJP /或ED最高值的大约0-5%。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下值的mRNAs中选择该mRNA,该值是在对于该序列阵列所确定的MFE RNA 二级结构、EFEJP /或ED的最高值的大约0%-10%、5%-10%、0%_15%、0%-20%、5%-15%、10%-15%、5%-20%、10%_20%、15%_20%、10%_25%、15%_25%、20%_25%、15%_30%、20%-30%、25%-30%、20%-35%、25%-35%、30%-35%、25%-40%、30%-40%、35%-40%、30%-45%、35%-45%、40%-45%、35%_50%、40%_50%、45%_50%、40%_55%、45%_55%、等的范围内。在仍其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下值的阵列的mRNA序列中选择该mRNA:该值是对于该序列阵列所确定的MFE RNA 二级结构、EFEjP/ 或 ED 最高值的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、等。在本发明的另外方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且FMFE RNA二级结构是对于阵列中每个单独mRNA序列所确定的一个或多个参数(该(这些)参数被用来对阵列中的单独mRNA序列进行评等级)时,于是从具有对该mRNA序列阵列所确定的FMFE RNA 二级结构最高值的mRNA序列之中选择该mRNA。因此,在本发明的特定方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下FMFE RNA二级结构值的mRNAs中选择该mRNA,该值是对该序列阵列所确定的FMFE最高值的大约95%-100%。因此,在某些实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,可以从具有以下FMFERNA 二级结构值的mRNAs中选择该mRNA,该值是在对于该序列阵列所确定的 FMFE RNA 二级结构最 高值的大约 90%-100%、85%-100%、90%-95%、85%-95%、80%_95%、85%-90%、80%-90%、75%-90%、80%-85%、75%-85%、70%-85%、75%-80%、70%-80%、65%-80%、70%-75%、65%-75%、60%-75%、65%-70%、60%-70%、55%-70%、60%-65%、55%-65%、50%-65%、55%-60%、50%-60%、45%-60%、等的范围内。在仍其他的实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有以下FMFE值的阵列的mRNA序列中,该值是对该序列阵列所确定的FMFE最高值的大约100%、99%、98%、97%、96%、95%、94%、93%、92%、91%、90%、89%、88%、87%、86%、85%、84%、83%、82%、81%、80%、79%、78%、77%、76%、75%、74%、73%、72%、71%、70%、69%、68%、67%、66%、65%、64%、63%、62%、61%、60%、59%、58%、57%、56%、55%、54%、53%、52%、51%、50%、49%、48%、47%、46%、45%、等。在另外的实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产,并且MFERNA 二级结构是对于阵列中每个单独mRNA序列确定的并且被用于该阵列的单独mRNA序列的评等级中时,于是该mRNA是选自对于该阵列具有所确定的MFE RNA 二级结构最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%(例如大约0.0001%,0.0005%,0.001%、0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以是选自具有MFE RNA 二级结构最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有MFE RNA 二级结构最高值的该分等级阵列中的mRNA序列的大约0.0001%、0.0005%、0.001%、0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在本发明的其他方面,当选择一种mRNA用于如在此所述的感兴趣多肽的增强的生产,并且EFE是一种对于阵列中每个单独mRNA序列确定的参数(该参数被用于该阵列的单独mRNA序列的评等级中)时,于是该mRNA是选自具有EFE最高值的分等级阵列中的mRNA序列的从大约 0.0001% 至大约 20% (例如 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以是选自具有EFE最高 值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有EFE最高值的分等级阵列中的mRNA序列的大约0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在本发明的其他方面,当选择一种mRNA用于如在此所述的感兴趣多肽的增强的生产,并且ED是一种对于阵列中的每个单独mRNA序列所确定的参数(该参数用来对该阵列中的单独mRNA序列评等级)时,于是该mRNA是选自具有ED最高值的分等级阵列中的mRNA序列的从大约 0.0001% 至大约 20% (例如 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合)。因此在本发明的另外方面,当选择一种mRNA用于如在此所述的感兴趣多肽的增强的生产时,该mRNA是选自具有ED最高值的分等级阵列中的mRNA序列的约0.0001%至约10%、约1%至约10%、约5%至约15%、约10%至约15%、约10%至约20%、约5%至约20%、或它们的任何组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有ED最高值的该分等级阵列中的mRNA序列的大约0.0001%、0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在本发明的仍其他的方面,当选择一种mRNA用于如在此所述的感兴趣多肽的增强的生产,并且FMFE RNA二级结构是一种对于阵列中每个单独mRNA序列确定的参数(该参数被用于该阵列的单独mRNA序列的评等级)时,于是该mRNA是选自具有FMFE RNA 二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%(例如0.0001%,0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有FMFE RNA 二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有FMFE RNA二级结构最低值的分等级阵列中这些mRNA序列的大约0.0001%,0.0005%,0.001%,0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。本发明进一步提供了当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且BPP是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有BPP最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有BPP最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有BPP最高值的分等级阵列中的 mRNA 序列的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在本发明的仍另外的方面,当选择一种mRNA用于如在此所述的感兴趣多肽的减少的生产,并且MFE RNA 二级结构是一种对于阵列中每个单独mRNA序列确定的参数(该参数被用于该阵列的单独mRNA序列的评等级)时,于是该mRNA是选自具有MFE RNA 二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%(例如0.0001%,0.0005%、0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%)。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有MFE RNA 二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大 约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有MFE RNA 二级结构最低值的该分等级阵列中这些mRNA序列的大约0.0001%,0.0005%,0.001%,0.005%、0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在本发明的仍另外的方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且EFE是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有EFE最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有EFE最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有EFE最低值的分等级阵列中这些 mRNA 序列的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们
的任意组合。在本发明的一些方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且ED是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有ED最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%的mRNA。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有ED最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有ED最低值的分等级阵列中这些 mRNA 序列的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合或范围。在本发明的其他方面,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且FMFE RNA 二级结构是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有FMFE RNA 二级结构最高值的分等级阵列中的mRNA序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有FMFERNA 二级结构最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有FMFE RNA 二级结构最高值的分等级阵列中这些mRNA序列的大约 0.0001%, 0.0005%, 0.001%, 0.005%, 0.01%, 0.05%, 0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15`%、16%、17%、18%、19%、20%、或它们的任意组合或范围。本发明进一步提供了当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且BPP是对于阵列中每个单独mRNA序列所确定的一种参数(该参数被用来对阵列中的单独mRNA序列进行评等级)时,于是该mRNA是选自具有BPP最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有BPP最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有BPP最低值的分等级阵列中这些 mRNA 序列的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合或范围。因此,在本发明的一些方面,提供了一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列山)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自具有MFERNA 二级结构最高值以及FMFE RNA 二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在大约Okcal/mol至大约_2kcal/mol范围内的MFE RNA 二级结构以及FMFE RNA 二级结构最低值的这些mRNA序列的mRNA之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有MFE RNA 二级结构最高值以及FMFERNA 二级结构最低值的分等级阵列中的mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有MFE RNA二级结构最高值以及FMFE RNA二级结构最低值的分等级阵列中这些 mRNA 序列的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%,0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。进一步地,在一些方面,本发明进一步包括除了对MFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且BPP是确定的并且是根据联合分布用于对阵列中的单独mRNA序列进行评等级时,于是该mRNA是选自具有BPP最高值的分等级阵列中的这些序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有BPP最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有BPP最高值的分等级阵列中这些mRNA序列的大约 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在本发明的 另外方面提供了一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:a)制造一个阵列的包含编码该感兴趣多肽的不同的核苷酸序列的单独mRNA序列山)对(a)中的每个单独mRNA序列的RNA 二级结构最小自由能(MFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的RNA二级结构最小自由能频率(FMFE)进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自具有MFE RNA 二级结构最低值以及RNA 二级结构FMFE最高值的在从大约0.0001%至大约20%之间的该分等级阵列中的这些序列,或该mRNA序列是选自具有在室温下测量的在从大约_9kcal/mol至大约-18kcal/mol范围之内的MFE RNA 二级结构以及RNA 二级结构FMFE最高值的这些mRNA序列之中。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自该具有MFE RNA二级结构最低值以及FMFE RNA二级结构最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有MFE RNA 二级结构最低值以及FMFE RNA 二级结构最高值的分等级阵列中这些 mRNA 序列的大约 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。进一步地,在一些方面,本发明进一步包括除了对MFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。在本发明的一些方面,该方法进一步包括除了对MFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,当选择一种mRNA用于在感兴趣多肽的减少的生产时,并且BPP被确定并且是根据联合分布用于对阵列中的单独mRNA序列进行评等级时,于是该mRNA是选自具有BPP最低值的分等级阵列中这些序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有BPP最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有BPP最低值的分等级阵列中这些 mRNA 序列的大约 0.0001%,0.0005%,0.001%,0.005%,0.01%,0.05%、1%、2%、3%、4%、5%、6%、7%、 8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。本发明另外提供了一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列山)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;并且c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最高值以及FMFERNA 二级结构最低值的分等级阵列中的大约0.0001%至大约20%的这些序列之中。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有EFE最高值以及FMFE RNA 二级结构最低值的分等级阵列中这些 mRNA 序列的大约 0.0001% 至大约 10%、大约 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在本发明的一些方面,该方法进一步包括除了对EFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,当选择一种mRNA用于在此所述的感兴趣多肽的增强的生产,并且BPP被确定并且是根据联合分布用于对阵列中的单独mRNA序列进行评等级时,于是该mRNA是选自具有BPP最高值的分等级阵列中这些序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA可以选自具有BPP最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的增强的生产时,该mRNA是选自具有BPP最高值的分等级阵列中这些mRNA序列的大约 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在其他实施方案中,本发明提供了一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同的核苷酸序列山)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最低值以及FMFE RNA 二级结构最高值的分等级阵列中的大约0.0001%至大约20%的这些序列之中。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有EFE最低值以及FMFE RNA 二级结构最高值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有EFE最低值以及FMFE RNA 二级结构最高值分等级阵列中这些mRNA序列的大约 0.0001%, 0.0005%, 0.001%, 0.005%, 0.01%, 0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。在本发明的另外方面,该方法进一步包括除了对EFE和FMFE之外还对于每个单独mRNA序列的碱基配对概率(BPP)进行确定。因此,当选择一种mRNA用于在此所述的感兴趣多肽的减少的生产,并且BPP是确定的并且是根据联合分布用于对阵列中的单独mRNA序列进行评等级时,于是该mRNA是选自具有BPP最低值的分等级阵列中这些序列的从大约0.0001%至大约20%。因此,在本发明的另外方面,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA可以选自具有BPP最低值的分等级阵列中这些mRNA序列的从大约0.0001%至大约10%、大约1%至大约10%、大约5%至大约15%、大约10%至大约15%、大约10%至大约20%、大约15%至大约20%、或它们的任意组合。在其他实施方案中,当选择一种mRNA用于感兴趣多肽的减少的生产时,该mRNA是选自具有BPP最低值的分等级阵列中这些mRNA序列的大约 0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、或它们的任意组合。本发明的这些选择的mRNAs可以被进一步修饰以用于蛋白质生产。作为一个实例,在所选择的对感兴趣多肽进行编码的mRNA的起始密码子(AUG)中和/或起始密码子(AUG)周围的碱基配对可以被进一步修饰以使得该选择的mRNA的起始密码子更多开放(例如,具有用于蛋白质生产/翻译起始的较少的碱基配对或没有碱基配对)或更少开放(例如,具有更多的用于降低蛋白质生产/翻译起始的碱基配对)。将所选择的mRNA的起始密码子的碱基配对的量(即更多打开的或更少开放的)与对该感兴趣多肽进行编码的野生型(天然)mRNA的起始密码子作比较,或与对该多肽进行编码的第二 mRNA (不同于该选择的mRNA(例如,第一 mRNA))的起始密码子作比较。在本发明的另外的实施方案中,本发明中这些选择的mRNAs可以与其他修饰蛋白质生产的因子(例如转录和翻译增强子)组合。在本发明的某 些实施方案中,为了获得所希望水平的蛋白质生产,这些选择的mRNA序列被进一步改变(即突变),以所编码的该感兴趣多肽的氨基酸序列发生突变以结合成一种或多种无结果突变(nonconsequentialmutation)(例如一种或多种保守的氨基酸替换),这导致了所希望的mRNA的MFE值的改变以及对应的所希望的的蛋白质生产水平的改变。因此,尽管该突变的mRNA序列对突变的氨基酸序列进行编码,与野生型多肽序列相比,在该氨基酸序列中的突变没有改变该多肽的功能。因此,在本发明的某些实施方案中,提供了对一种生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据以上权利要求中任一项选择一种对感兴趣多肽进行编码的mRNA ; (b)对(a)中mRNA的核苷酸序列进行突变以生产一种突变的mRNA,与(a)中mRNA的核苷酸序列的MFERNA 二级结构相比,该突变的mRNA具有增加的或减少的MFERNA 二级结构,并且与(a)中mRNA编码的多肽序列相比,该突变的mRNA编码一种突变的多肽序列;其中该突变的多肽序列保留由(a)的mRNA编码的多肽的功能,并且与野生型mRNA序列相比在一种生物细胞中该突变的mRNA序列的表达导致该感兴趣多肽的修饰的生产。保守的或无结果突变包括点突变(单个碱基核苷酸被另一个核苷酸置换)。导致无结果突变(即不影响功能)的点突变的类型在本领域中是熟知的(参见,例如D.Bordo和P.Argos,《对于在位点定向诱变中“安全”残基的替换的建议》(Suggestionsfor"Safe〃Residue Substitutions in Site-DirectedMutagensis),《分子生物学期刊》(J.Mol.Biol.)217:721-729(1991);图2)。因此,例如,可以生成一个mRNA序列的阵列,其中保守位点突变被引入该mRNA序列并且可以从这个阵列中选择一种具有所希望的MFE值并对经突变但是仍保留野生型功能的(例如无结果突变)多肽进行编码的mRNA。因此,本发明中所选择的mRNA的MFE可以进一步地经对具有突变的mRNA序列进行突变来操作,从而导致多肽中的无结果突变。这类突变为用于获得所希望的蛋白质生产水平的用途的mRNA序列的选择提供了另外的灵活性。在另外的实施方案中,可以通过使用优选的密码子进一步对该感兴趣多肽进行优化以提高在感兴趣的特定生物中的表达,或能够以优选的密码子使用频率使用密码子对该感兴趣多肽进行合成。因此, 在某些实施方案中,这种基因的GC含量将会增加。参见,例如Campbell和Gowri (1990)《植物生理学》(Plant Physiol.)92:1-11中关于宿主优选密码子的使用的讨论。可替代地,相对于野生型mRNA或另一个选择的mRNA的蛋白质生产,被认为可阻止或减慢翻译的稀有密码子对于调整(例如减少)蛋白质生产是有用的。基于具体物种对稀有密码子进行确定(即具体的密码子在一个物种中可能是稀有的但在另一个物种中不是稀有的)。因此,如在此使用的,“稀有密码子”是一种由tRNA编码的密码子,该tRNA具有占全体tRNAs的少于大约15%的丰度,这些全体tRNAs对在特定物种或在一种物种之内的细胞型中的特定氨基酸进行编码。因此,在本发明的某些实施方案中,根据本发明的这些方法选择的单独的mRNA序列可以包括在起始密码子附近的一种或多种稀有密码子。可替代地,在本发明的其他实施方案中,包含稀有密码子的mRNA序列可以从该阵列中去除。包含稀有密码子的序列的去除可以通过使用软件程序进行。如在此使用的,“在起始密码子附近”是指那些编码最前12个氨基酸(AUG至+12氨基酸)的密码子。在多肽水平上,“在起始密码子附近”包括核苷酸I至+36。如在此使用的,“一种/ 一个(a/an)”或“该”(the)可以表示一个或多于一个。例如,“一个”细胞可以表示一个单一的细胞或许多细胞。如在此使用的,“和/或”表示并包括一个或多个相关地列出的项的任何的与所有的可能组合,并且当用可替代地(“或”)解释时组合的缺少。此外,当提到一种可测量的值(例如本发明的一种化合物(如mRNA)或试剂的量、剂量、时间、百分比、温度、等等)时,在此使用的术语“大约”是指包括该指定量的±20%、±10%、±5%、±1%、±0.5%、或甚至 ±0.1% 的变化。如在此使用的,除非另外指明,术语“多肽”包括肽以及蛋白质两者。如在此使用的,“分离的”多肽或多肽片段是指从天然发生的生物的至少一些其他组分中分离的或基本上游离的一种多肽或多肽片段,例如通常被发现是与该多肽相关联的细胞组分或其他多肽或核酸。如在此使用的,过渡型短语“基本上由……组成”表示一种权利要求的范围是要解释为包括该权利要求中所述的指定材料或步骤以及并不实质上影响本发明的一种或多种基本特征或新颖特征的那些。因此,术语“基本上由……组成”当用于本发明的权利要求中时,并不意在解释为与“包括”(“comprising”)等同。在此使用的术语“减少(reduce)”、“减少的(reduced)”、“减少(reducing)”、“减少(reduction)”、“减弱(diminish)”、以及“减少(decrease)”(以及其语法上的变体)描述的是由选择的mRNA编码的感兴趣多肽的生产的减少。这中种减少可以通过对选择的mRNA的感兴趣多肽的生产与编码相同的感兴趣多肽的野生型(即天然的)mRNA的感兴趣多肽的生产进行比较而观察到;或者可以通过对选择的mRNA的感兴趣多肽的生产与同所选择的mRNA编码相同的感兴趣多肽的另一个(第二)mRNA (不同于选择的(第一)mRNA)对该多肽的生产进行比较而观察到。在此使用的术语“增强 (enhance)”、“增强的(enhanced)”^增强(enhancing)”、“增强(enhancement) ”、“增加(increase ) ”(以及其语法上的变体)描述的是由选择的mRNA编码的感兴趣多肽的生产的增加。这种增加可以通过对选择的mRNA的感兴趣多肽的生产与野生型(即天然的)mRNA的感兴趣多肽的生产进行比较而观察到,该野生型mRNA与该选择的mRNA编码相同的感兴趣多肽;或者这种增加可以通过对选择的mRNA的感兴趣多肽的生产与另一个(第二)mRNA (不同于选择的(第一)mRNA)对该多肽的生产进行比较而观察到,该第二 mRNA与该选择的mRNA编码相同的感兴趣多肽。术语“调整(modulate)”、“调整(modulates)”、“调整的(modulated)”或“调整(mo du I at i on ) ”指的是指定的活性(例如调整的蛋白质生产)的增强(例如一种增加)或抑制(例如一种减少)。感兴趣多肽可以是任意多肽。适合用于植物中表达的感兴趣多肽的非限制性实例包括导致农艺学上重要性状的那些,这些性状例如是除草剂抗性、病毒抗性、细菌性病原体抗性、昆虫抗性、线虫抗性、以及真菌抗性。参见例如美国专利号5,569,823,5, 304,730、5,495,071,6, 329,504、以及6,337,431。感兴趣的多肽还可以是导致植物活力或产量增加的多肽(包括允许植物在不同的温度、土壤条件以及日光和沉淀水平下生长的多肽),或是允许鉴定展现感兴趣的性状(例如,选择性标记基因、种皮颜色等)的植物的多肽。除草剂抗性还有时被称为除草剂耐受性。赋予对抑制生长点或分生组织的除草剂(例如咪唑啉酮或磺酰脲)的抗性的基因可以是合适的。对于突变ALS和AHAS酶在这一分类号中的示例性基因如描述在例如在美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013, 659是针对抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及包含编码抵抗除草剂的抑制作用的谷氨酰胺合成酶(GS)突变体的基因的植物细胞以及植物,已知这些除草剂(例如草胺膦和蛋氨酸亚砜亚胺)抑制GS。美国专利号5,162,602披露了抵抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性是由改变的乙酰辅酶A羧化酶(ACCase)赋予的。由抗草甘膦的基因编码的感兴趣多肽也是适合的。参见例如美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了转基因抗草甘磷玉米植物,它的抗性是由改变的5-烯醇丙酮酰莽草酸-3-磷酸(EPSP)合成酶基因赋予的。抵抗磷酰基化合物(例如草铵膦或草胺膦、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的基因也是适合的。参见欧洲专利申请号0242246。还参见美国专利号5,879,903、5,276,268 和 5,561,236。其他合适的除草剂包括抑制光合作用的那些,例如三嗪和苯基氰(腈水解酶)。参见美国专利号4,810, 648。其他适合的除草剂包括2,2- 二氯丙酸、稀禾定、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑嘧啶除草剂、均三嗪除草剂以及溴草腈。同样适合的是赋予对原卟啉原氧化酶的抗性或者提供增强的对植物疾病的抗性、增强的对不利环境条件(非生物胁迫)的耐受性(这些条件包括但不限于干旱、极冷、极热、或极端的土壤盐度或极端的酸度或碱度)、以及在植物 构型或发育中的改变(包括发育时间方面的变化)的基因。参见例如美国专利申请公开号2001/0016956和美国专利号6,084, 155。对本发明有用的杀虫蛋白可以按一个足以控制昆虫害虫的量(即昆虫控制量)进行表达。应当理解的是,在植物中对控制昆虫必要的杀虫蛋白的表达量可以变化,这取决于栽培变种、昆虫的类型、环境因素等。对于昆虫抗性或害虫抗性有用的基因包括,例如编码在杆菌生物体中已鉴定的毒素的基因。已经克隆了编码来自几个亚种的苏云金芽孢杆菌(Bacillus thuringienSiS,Bt)毒素的基因,并且已经发现这些重组克隆对鳞翅类、双翅类和鞘翅类昆虫幼虫是有毒的(例如不同的δ -内毒素基因例如CrylAa、CrylAb, CrylAc,Cry IB > DylC、Cry ID > CrylEa、CrylFa、Cry3A> Cry9A> Cry9C 以及 Cry9B ;连同编码营养期杀虫蛋白例如Vipl、Vip2和Vip3的基因)。Bt毒素的完整清单可以在万维网在苏塞克斯大学维护的苏芸金芽胞杆菌毒素命名法数据库中找到(也参见,例如克里克摩尔(Crickmore)等人(1998)《微生物分子生物学综述》(Microbiol.Mol.Biol.Rev.) 62:807-813)。适合于在植物中表达的的感兴趣的多肽进一步包括改进或通过其他方式有助于所收获的甘蔗转化成为一种商业上有用的产品(包括例如增加的或改变的碳水化合物含量和/或分布、改进的发酵特性、增加的油含量、增加的蛋白含量、提高的消化率、以及增加的营养成分含量(例如,增加的植物留醇含量、增加的生育酚含量、增加的留烷醇含量或增加的维生素含量))的那些多肽。感兴趣的多肽还包括,例如在一种收获的作物中导致或促成不需要的成分,例如植酸、或降解糖的酶类的含量降低的那些多肽。“导致”或“促成”意指这种感兴趣的多肽可以直接地或间接地促成一种感兴趣的性状的存在(例如,通过异源表达一种纤维素酶来增加纤维素的降解)。在一个实施方案中,感兴趣的多肽促成了改进的食品或饲料的可消化度。木聚糖酶是半纤维素分解酶,这些酶改进了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小包含木聚糖的饲料的粘度。木聚糖酶在植物细胞中的表达还可以潜在地作用以协助在工业加工中木质纤维素到可发酵糖的转化。众多的来自真菌和细菌微生物的木聚糖酶已经被鉴别并表征(参见例如美国专利号5,437,992 ;Coughlin,等人(1993);“关于里氏木霉以及其他水解酶的第二次TRICEL讨论会会干1J,,(“Proceedings of the Second TRlCELSymposium on Trichoderma reeseiCeilulases and Other Hydrolases”),Espoo ;Souminen 和 Reinikainen 编写(1993),《生物技术以及工业发酵研究基础》(Foundation for Biotechnical and IndustrialFermentation Research) 8:125-135 (1993);美国专利申请公开号 2005/0208178 ;以及TO03/16654)。特别地,在里氏木霉(T.reesei)中已经鉴定出三个特异性的木聚糖酶(XYL-1、XYL-11、以及 XYL-1II) (Tenkanen 等人,(1992)《微生物酶技术》(EnzymeMicrob.Technol.) 14:566;Torronen 等人,(1992)《生物 / 工程》Bio/TechnologylO: 1461 ;以及Xu,等人,(1998)《应用微生物生物技术》(Appl.Microbiol.Biotechnol.) 49:718)。在另一个实施方案中,该感兴趣的多肽是一种多糖降解酶。此类植物可以用于产生例如用于生物加工的发酵原料。在一些实施方案中,对于发酵工艺有用的酶类包括α淀粉酶类、蛋白酶类、支链淀粉酶类、异淀粉酶类、纤维素酶类、半纤维素酶类、木聚糖酶类、环糊精糖基转移酶类(glycotransferases)、脂肪酶类、植酸酶类、漆酶类、氧化酶类、酯酶类类、角质酶类(cutinases)、颗粒淀粉水解酶类和其他葡糖淀粉酶类。多糖降解酶包括:淀粉降解酶类,例如,α-淀粉酶类(EC3.2.1.1)、葡萄糖醛酸酶类(E.C.3.2.1.131);外切1.4-a-D葡聚糖酶类,例如淀粉糖化酶类以及葡糖淀粉酶(EC3.2.1.3)、β-淀粉酶类(EC3.2.1.2)、α -糖苷酶类(EC3.2.1.20)、以及其他外切型淀粉酶类;以及淀粉脱支酶类,例如a)异淀粉酶(EC3.2.1.68)、支链淀粉酶化03.2.1.41)、以及类似物;b)纤维素酶类,例如外切-1,4-3-纤维素二糖水解酶(EC3.2.1.91)、外切-l,3-13-D-葡聚糖酶(EC3.2.1.39)、β-糖苷酶(EC3.2.1.21) ;c)L-阿拉伯糖酶类(arabinases),例如内切_1,5- a -L-阿拉伯糖酶(EC3.2.1.99)、α -阿拉伯糖苷酶类(EC3.2.1.55)以及类似物;d)半乳聚糖酶类(galactanases),例如内切-1,4-β-D-半乳聚糖酶(EC3.2.1.89)、内切-1,3-β- -半乳聚糖酶(EC3.2.1.90)、α-半乳糖苷酶(EC3.2.1.22)、β -半乳糖苷酶(EC3.2.1.23)以及类似物;e)甘露聚糖酶类(mannanases),例如内切-1,4-β- -甘露聚糖酶(EC3`.2.1.78)、β -甘露糖苷酶(EC3.2.1.25)、α-甘露糖苷酶(EC3.2.1.24)以及类似物;f)木聚糖酶类,例如内_1,4_β-木聚糖酶(EC3.2.1.8)、β-D-木糖苷酶(EC3.2.1.37)、1,3-β-D-木聚糖酶、以及类似物;g)其他酶类,例如a-L-岩藻糖苷酶(EC3.2.1.51)、a-L-鼠李糖苷酶(EC3.2.1.40)、果聚糖酶(EC3.2.1.65)、菊粉酶化03.2.1.7)、以及类似物。其他可以使用的额外的酶类包括蛋白酶类,例如真菌和细菌蛋白酶类。真菌蛋白酶类包括但不限于从曲霉属、木霉属、毛霉属以及根霉属(例如黑曲霉、泡盛曲霉(A.awamori)、米曲霉、以及米黑毛霉(M.miehei ))获得的那些酶类。在某些实施方案中,该感兴趣多肽是纤维二糖水解酶(CBH)酶类(EC3.2.1.91)。在一个实施方案中,该纤维二糖水解酶是CBHl或CBH2。其他酶类(感兴趣多肽)包括但不限于:半纤维素酶类,例如甘露聚糖酶类以及阿拉伯呋喃糖酶类(EC3.2.1.55);木素酶类;脂肪酶类(例如,E.C.3.1.1.3)、葡萄糖氧化酶类、果胶酶类、木聚糖酶类、转葡萄糖苷酶类、α 1,6糖苷酶类(例如,Ε.C.3.2.1.20);酯酶类,例如阿魏酸酯酶(EC3.1.1.73)以及乙酰基木聚糖酯酶类(EC3.1.1.72);以及角质酶类(例如,E.C.3.1.1.74)。在本发明的某些实施方案中,感兴趣多肽进一步包括一种前导肽。如在本领域中所熟知的,前导肽是一种由更大开放的阅读框的上游(5’端编码序列)编码的肽。可以用本发明的这些方法使用任何前导肽。前导肽可以是一种天然发现的肽或可以是一种被设计具有前导肽功能的合成肽。因此,在本发明的某些实施方案中,感兴趣多肽包括一种前导肽,并且因此该编码感兴趣多肽的mRNA的5’端包括一种前导序列,该前导序列对一个开放阅读框的前导肽上游(5’端编码序列)进行编码。因此,在某些实施方案中,由这些单独mRNA序列的阵列对融合于感兴趣多肽的前导序列进行编码,这些mRNA序列包括对该感兴趣多肽进行编码的不同核苷酸序列。在某些实施方案中,可以通过对融合于该感兴趣多肽的前导序列的表达的调整而对该感兴趣多肽的生产进行调整。因此,根据本发明的任意方法选择一种编码前导肽的mRNA并且将该前导肽融合于该感兴趣多肽中。通过调整该前导肽的表达,可以对该前导序列融合到其中的多肽的表达进行调整。因此,可以对该感兴趣多肽的表达进行调整,而不用改变编码该感兴趣多肽的核苷酸序列或该感兴趣多肽的氨基酸序列。前导肽的非限制性实例包括信号肽、转运肽、靶向肽、信号序列、以及类似物。如在本领域中熟知的,信号/转运肽将由一种核基因编码的蛋白质靶向或运送至特定的细胞器,这些细胞器例如线粒体、质体(如顶质体(apicoplast)、色质体、叶绿体、蓝色小体、类囊体、造粉体、以及类似物)、微体(如单膜界定的小细胞器,诸如过氧化物酶体、氢化酶体、乙醛酸循环体、以及糖酵解酶体)。前导肽在本领域中是熟知的,并且可以在公共数据库中找到,例如:“信号肽网址:信号序列以及信号肽的信息平台”(WWW.signalp印tide, de);“信号肽数据库(Signal Peptide Database),,(proline.bic.nus.edu.Sg/spdb/index, html) (Choo 等人,《BMC 生物信息学》(BMC Bioinformatics) 6:249 (2005))(在 www.biomedcentral.com/1471-2105/6/249/abstract 中是可获得的);Ch1roP (www.cbs.dtu.dk/services/ChloroP/ ;预测在蛋白质序列中叶绿体转运肽(cTP)的存在以及潜在cTP切割位点的位置);LipoP (www.cbs.dtu.dk/services/LipoP/ ;预测革兰氏阴性菌中的脂蛋白以及信号肽);MIT0PR0T (mg2.helmholtz-muenchen.de/ihg/mitoprot.html ;预测线粒体的革巴向序列);PlasMit (gecc0.0rg.chemie.unifrankfurt.de/plasmit/index.html ;预测键状痕原虫中的线粒体转运妝);Predotar (urg1.Versailles, inra.fr/predotar/predotar.html ;预测线粒体以及质体的革巴向序列);PTS1 (mendel.1mp.ac.at/mendeljsp/sat/ptsl/PTSlpredictor.jsp ;预测包含蛋白质的过氧化物酶体的革巴向信号I) ;SignalP (www.cbs.dtu.dk/services/SignalP/ ;预测来自不同生物的氨基酸序列中的信号肽切割位点的存在以及位置,这些生物是:革兰氏阳性原核生物、革兰氏阴性原核生物、以及真核生物。该方法基于一些人工神经网络以及隐马尔可夫模型,将对切割位点的预测与信号肽/非信号肽的预测结合在一起);以及TargetP (www.cbs.dtu.dk services/TargetP/ ;预测真核蛋白质的亚细胞的位置-该位置分配是基于预测的任何N-末端的前序列的存在,这些N-末端的前序列为叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP))。(还参见,von Heijne, G.,《欧洲生物化学期刊》(Eur J Biochem) 133 (I) 17-21 (1983) ;Martoglio等人,《细胞生物学动向》(Trends Cell Biol) 8 (10):410-5 (1998) ;Hegde等人,《生物化 学科学动向》(Trends Biochem Sci) 31 (10):563-71 (2006) ;Dultz等人,《生物化学期刊》 (J Biol Chem)283 (15):9966-76(2008) ;Emanuelsson 等人,《自然研究步骤期刊》(Nature Protocols) 2 (4) 953-971 (2007) ;Zuegge 等人,280 (1-2): 19-26 (2001) ;Neuberger 等人, 《分子生物学期刊》(J Mol Biol )328(3):567-79(2003);以及Neuberger等人,《分子生物 学期刊》(J Mol Biol) 328(3):581-92(2003))。具体的转运肽的非限制性实例在表I中提供。表1.将蛋白质定向至不同细胞器(包括叶绿体、内质网、过氧化物酶体、线粒体以及液泡)的前导肽。

权利要求
1.一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)的每个单独mRNA序列确定以下一个或多个参数:⑴整体自由能(EFE);( )在一种热力学整体中的最小自由能频率(FMFE) RNA 二级结构;(iii)整体多样性(ED);c)根据在步骤(b)中确定的这些参数的联合分布,对该阵列的这些单独mRNA序列评等级;并且d)选择来自步骤(c)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多妝。
2.根据权利要求1所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
3.根据权利要求1或权利 要求2所述的方法,其中该感兴趣多肽的生产增强。
4.根据权利要求1或权利要求2所述的方法,其中该感兴趣多肽的生产减少。
5.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE并且步骤(d)中的该mRNA是选自该具有EFE最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
6.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE并且该步骤(d)中的mRNA是选自该具有最低EFE值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
7.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是FMFERNA 二级结构并且该步骤(d)中的mRNA是选自该具有FMFE RNA 二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
8.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是FMFERNA 二级结构并且该步骤(d)中的mRNA是选自该具有FMFE RNA 二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
9.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是ED并且该步骤(d)中的mRNA是选自该具有ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
10.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是ED并且该步骤(d)中的mRNA是选自该具有最低ED值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
11.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和FMFE,并且该步骤(d)中的mRNA是选自该具有EFE最高值以及FMFE RNA 二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
12.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和FMFE,并且该步骤(d)中的mRNA是选自该具有最低EFE值以及FMFE RNA 二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
13.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和ED,并且该步骤(d)中的mRNA是选自该具有EFE最高值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
14.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和ED,并且该步骤(d)中的mRNA是选自该具有EFE最低值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
15.根据权利要求3所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和FMFE RNA 二级结构以及ED,并且该步骤(d)中的mRNA是选自该具有EFE最高值和FMFE最低值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
16.根据权利要求4所述的方法,其中在步骤(b)中该确定的一个或多个参数是EFE和FMFE RNA 二级结构以及ED,并且该步骤(d)中的mRNA是选自该具有EFE最低值和FMFE最高值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
17.根据权利要求5、7、9、11、13或15中任一项所述的方法,其中在步骤(d)中该确定的一个或多个参数是碱基配对概率。
18.根据权利要求6、8、10、12、14或16中任一项所述的方法,其中在步骤(d)中该确定的一个或多个参数是碱基配对概率。
19.根据权利要求1所述的方法,其中当来自步骤(b)的两种或更多种参数被确定时,根据这些确定的参数的联合分布,对在步骤(C)的该阵列中的这些单独序列评等级。
20.根据权利要求1至9中任一项所述的方法,其中在步骤(d)中该选择的单独mRNA序列包括在起始密码子附近的一种或多种稀有密码子。
21.一种选择用于生 产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构进行确定;以及c)对(a)每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA 二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(C)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多妝。
22.根据权利要求21所述的方法,其中步骤(c)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
23.根据权利要求21所述的方法,其中该步骤(e)中的mRNA是选自以下各项:具有在从大约Okcal/mol至大约_2kcal/mol范围内的MFE RNA 二级结构的mRNA的组,具有在从大约-2kcal/mol至大约_9kcal/mol范围内的MFERNA 二级结构的mRNA的组,或具有在从大约_9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构的mRNA的组。
24.根据权利要求21-23中任一项所述的方法,其中该感兴趣多肽的生产增强。
25.根据权利要求21-23中任一项所述的方法,其中该感兴趣多肽的生产减少。
26.根据权利要求24所述的方法,其中在步骤(c)中该确定的一个或多个参数是ED并且该步骤(e)中的mRNA是选自该具有MFE RNA 二级结构最高值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
27.根据权利要求25所述的方法,其中在步骤(c)中该确定的一个或多个参数是ED并且该步骤(e)中的mRNA是选自该具有MFE RNA 二级结构最低值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
28.根据权利要求24所述的方法,其中在步骤(c)中该确定的一个或多个参数是FMFERNA 二级结构以及ED,并且该步骤(e)中的mRNA是选自具有该MFE RNA 二级结构最高值、FMFE RNA 二级结构最低值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
29.根据权利要求25所述的方法,其中在步骤(c)中该确定的一个或多个参数是FMFERNA 二级结构以及ED,并且该步骤(e)中的mRNA是选自具有该MFE RNA 二级结构最低值、FMFE RNA 二级结构最高值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
30.根据权利要求26或权利要求28所述的方法,其中在步骤(c)中该确定的一个或多个参数是碱基配对概率。
31.根据权利要求27或权利要求29所述的方法,其中在步骤(c)中该确定的一个或多个参数是碱基配对概率。
32.根据权利要求24所述的方法,其中该步骤(e)中的mRNA是选自具有如在室温下测量的在从大约Okcal/mol至大约_2kcal/mol范围内的MFERNA 二级结构的mRNA之中。
33.根据权利要求25所述的方法,其中该步骤(e)中的mRNA是选自具有如在室温下测量的在从大约-9kcal/mol至大约-18kcal/mol范围内的MFERNA 二级结构的mRNA之中。
34.一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)进行确定;c)对(a)每个单独mRNA序列确定一种或多种下列参数:(i)在一种热力学整体中的最小自由能频率(FMFE)RNA 二级结构;以及(ii)整体多样性(ED);d)根据在以上步骤(b)和(C)中确定的这些参数的联合分布,对该阵列中的这些单独mRNA序列评等级;并且e)选择来自步骤(d)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多妝。
35.根据权利要求34所述的方法,其中步骤(c)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
36.根据权利要求34或35所述的方法,其中该感兴趣多肽的生产增强。
37.根据权利要求34或35所述的方法,其中该感兴趣多肽的生产减少。
38.根据权利要求36所述的方法,其中在步骤(c)中该确定的一个或多个参数是ED并且该步骤(e)中的mRNA是选自该具有EFE最高值以及ED最高值的分等级阵列中大约·0.0001%至大约20%的这些序列之中。
39.根据权利要求37所述的方法,其中在步骤(c)中该确定的一个或多个参数是ED并且该步骤(e)中的mRNA是选自该具有EFE最低值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
40.根据权利要求36所述的方法,其中在步骤(c)中该确定的一个或多个参数是FMFERNA 二级结构以及ED,并且该步骤(e)中的mRNA是选自该具有EFE最高值、FMFE RNA 二级结构最低值以及ED最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
41.根据权利要求37所述的方法,其中在步骤(c)中该确定的一个或多个参数是FMFERNA 二级结构以及ED,并且该步骤(e)中的mRNA是选自该具有EFE最低值、FMFE RNA 二级结构最高值以及ED最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中。
42.根据权利要求38或权利要求40所述的方法,其中在步骤(c)中该确定的一个或多个参数是碱基配对概率。
43.根据权利要求39或权利要求41所述的方法,其中在步骤(c)中该确定的一个或多个参数是碱基配对概率。
44.根据权利要求21至43中任一项所述的方法,其中在步骤(e)中该选择的单独mRNA序列包括在起始密码子附近的一种或多种稀有密码子。
45.一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列; b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有MFERNA 二级结构最高值以及FMFE RNA 二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在从大约Okcal/mol至大约_2kcal/mol范围内的MFE RNA 二级结构以及FMFE RNA 二级结构最低值的这些mRNA序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
46.根据权利要求45所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
47.一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA二级结构以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;c)根据以上步骤(b)中这些确定的MFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有MFERNA 二级结构最低值以及FMFE RNA 二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中,或选自具有如在室温下测量的在从大约_9kcal/mol至大约_18kcal/mol范围内的MFERNA 二级结构以及FMFE RNA 二级结构最高值的这些mRNA序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。
48.根据权利要求47所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
49.一种选择用于增强生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含编码该感兴趣多肽的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及(a)中的每个单独mRNA序列的在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;并且c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最高值以及FMFE RNA 二级结构最低值的分等级阵列中大约0.0001%至大约20%的这些序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
50.根据权利要求49所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进 行确定。
51.一种选择用于减少生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含编码该感兴趣多肽的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的整体自由能(EFE)以及在一个热力学整体中的最小自由能频率(FMFE) RNA 二级结构进行确定;c)根据以上步骤(b)中这些确定的EFE和FMFE的联合分布对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自该具有EFE最低值以及FMFE RNA 二级结构最高值的分等级阵列中大约0.0001%至大约20%的这些序列之中,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的减少生产。
52.根据权利要求51所述的方法,其中步骤(b)进一步包括对(a)中的每个单独mRNA序列的碱基配对概率进行确定。
53.一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构进行确定;c)根据在(b)中该确定的MFERNA 二级结构,从最高的MFERNA 二级结构至最低的MFERNA 二级结构,对该阵列中的这些单独mRNA序列评等级;并且d)从步骤(c)的该分等级阵列中选择一种mRNA序列,其中该mRNA是选自下列各项:具有在从大约Okcal/mol至大约_2kcal/mol范围内的MFE RNA 二级结构的mRNA的组,具有在从大约_2kcal/mol至大约_9kcal/mol范围内的MFE RNA 二级结构的mRNA的组,或具有在从大约_9kcal/mol至大约-18kcal/mol范围内的MFE RNA 二级结构的mRNA的组,其中该选择的mRNA生产该感兴趣多肽。
54.根据权利要求53所述的方法,其中该mRNA被选择用于一种感兴趣多肽的增强生产,并且是选自具有一种在从大约Okcal/mol至大约_2kcal/mol范围内的MFE的mRNA的组。
55.根据权利要求53所述的方法,其中该mRNA被选择用于一种感兴趣多肽的减少生产,并且是选自具有一种在从大约_9kcal/mol至大约-18kcal/mol范围内的MFE的mRNA的组。
56.根据权利要求45至55中任一项所述的方法,其中在步骤(d)中该选择的单独mRNA序列包括在起始密码子附近的一种或多种稀有密码子。
57.一种选择用于增强生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构进行确定;并且c)选择(a)中的一种具有在从大约Okcal/mol至大约_2kcal/mol范围内的MFERNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
58.一种选择用于减少生产感兴趣多肽的mRNA方法,该方法包括:a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)中的每个单独mRNA序列的最小自由能(MFE)RNA 二级结构以及(a)中的每个单独mRNA序列的表达水平进行确定;c)选择(a)中的一种具有在从大约_9kcal/mol至大约_18kcal/MFE范围内的MFERNA二级结构的mRNA序列,其中与野生型mRNA序列相比,该选择的mRNA序列的表达导致该感兴趣多肽的增强生产。
59.根据权利要求57或权利要求58所述的方法,其中在步骤(e)中该选择的单独mRNA序列包括在起始密码子附近的一种或多种稀有密码子。
60.根据权利要求1-19、21-43、44-55、57或58中任一项所述的方法,该方法进一步包括除去来自步骤(a)的该单独mRNA阵列中的包含在起始密码子附近的一种或多种稀有密码子的单独mRNA序列。
61.—种对生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据以上权利要求中的任一项,选择一种对感兴趣多肽进行编码的mRNA ;(b)对(a)中的该mRNA的核苷酸序列进行突变以生产一种突变的mRNA,与(a)中的该mRNA的核苷酸序列的MFERNA 二级结构相比,该突变的mRNA具有增强的或减少的MFE RNA 二级结构;其中与由(a)中的mRNA编码的多肽序列相比,该突变的mRNA编码一种突变的多肽序列,该突变的多肽序列保留了由(a)中的mRNA编码的多肽序列的功能,并且与野生型mRNA序列相比,该突变的mRNA序列的表达导致该感兴趣多肽的修饰的生产。
62.—种用于对生物细胞中的感兴趣多肽的生产进行修饰的方法,该方法包括:(a)根据权利要求1-60中的任一项,选择一种对感兴趣多肽进行编码的mRNA;(b)对在这种根据(a)选择的mRNA的核苷酸序列与一种所述生物的野生型内源核苷酸序列之间的差别进行鉴别,其中该野生型内源核苷酸序列编码了与根据(a)选择的mRNA所编码的相同的一种感兴趣多肽;并且(c)对编码该感兴趣多肽的该内源核苷酸序列进行原位突变以将(b)中所鉴别的核苷酸的每个差别合并进该内源核苷酸序列中,由此在该生物的细胞中来自该原位突变的内源核苷酸序列的该感兴趣多肽的生 产被修饰。
全文摘要
本发明提供了一种选择用于生产感兴趣多肽的mRNA的方法,该方法包括a)生产单独mRNA序列的一个阵列,这些单独mRNA序列包含对该感兴趣多肽进行编码的不同核苷酸序列;b)对(a)的每个单独mRNA序列确定一种或多种或者两种或更多种下列参数(i)最小自由能(MFE)RNA二级结构;(ii)整体自由能(EFE);(iii)在一种热力学整体中的最小自由能频率(FMFE)RNA二级结构;以及(iv)整体多样性(ED);c)根据步骤(b)中确定的这些参数,对该阵列中的单独mRNA序列评等级;并且d)选择来自步骤(c)的该分等级阵列中的一个mRNA序列,其中该选择的mRNA生产该感兴趣多肽。本发明进一步提供了一种选择用于增强或减少生产感兴趣多肽的mRNA的方法。
文档编号C07H21/04GK103080123SQ201180038845
公开日2013年5月1日 申请日期2011年6月9日 优先权日2010年6月11日
发明者S.S.巴苏, K.K.丹格, K.阿扎卡南达姆, T.Z.麦克尼尔, S.郭 申请人:先正达参股股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1