烷烃的重组合成的制作方法_2

文档序号:8947070阅读:来源:国知局
同源性"或"基本相似性"当指核酸或其片段时表示在W适合的核巧酸 插入或缺失与另一核酸(或其互补链)最佳比对时,W上面讨论的任何公知的序列同一性 算法如FASTA、BLAST或Gap测定的,在至少约76 %、80 %、85 %,优选至少约90 %,更优选至 少约95 %、96 %、97 %、98 %或99 %的核巧酸碱基中存在核巧酸序列同一性。
[0064] 或者,当核酸或其片段与另一核酸、与另一核酸的链或与其互补链在严格杂交条 件下杂交时,存在基本同源性或相似性。核酸杂交试验情况中的"严格杂交条件"和"严格 洗涂条件"取决于多种不同的物理参数。如本领域技术人员容易理解的,核酸杂交会受到如 盐浓度、溫度、溶剂、杂交物质的碱基组成、互补区域长度和杂交核酸之间核巧酸碱基失配 的数目的运些条件的影响。具备本领域常识的人知道怎样改变运些参数W实现特定的杂交 严格性。
[0065] 通常,"严格杂交"在低于特定条件集下的特定DNA杂合体的热烙点灯m)约25°C 下进行。"严格洗涂巧低于特定条件集下的特定DNA杂合体的Tm约5°C的溫度下进行。Tm 是50%的祀序列与完全匹配的探针杂交的溫度。见Sambrook等,MolecularCloning=A LsborstoryM曰nu曰1,第二片反,ColdSpringHsrborLsborstoryPress,ColdSpring Harbor,N.Y. (1989),9. 51页,在此并入作为参考。出于本发明的目的,"严格条件"对于溶液 相杂交定义为在6xSSC(其中20xSSC含有3.OM化Cl和0. 3M巧樣酸钢),1%SDS中,65°C 下的水相杂交(即,没有甲酯胺)8-12小时,随后在0. 2xSSC,0. 1 %SDS中,65°C下进行20 分钟的两次洗涂。技术人员可W理解在65°C下的杂交根据包括杂交的序列长度和百分同一 性的多种因素W不同速率发生。
[0066] 本发明的核酸(也被称为多核巧酸)可W包括RNA、cDNA、基因组DNA及上述 核酸的合成形式和混合聚合体的有义链和反义链。如本领域技术人员容易理解的,它们 可W被化学和生物化学地修饰,或可W包含非天然的或衍生的核巧酸碱基。运样的修饰 包括,例如,标记、甲基化、一个或多个天然存在的核巧酸被类似物替换、核巧酸间修饰 (intemucleotidemodification)如不带电连接(如甲基麟酸醋、憐酸S醋、氨基憐酸醋、 氨基甲酸醋等)、带电的连接(如硫代憐酸醋、二硫代憐酸醋等)、侧部分(如多肤)、嵌入剂 (如叮晚、补骨脂素等)、馨合剂、烧化剂和修饰的连接(如,a异头核酸等)。也包括模拟 多核巧酸通过氨键键合和其他化学相互作用结合指定序列的能力的合成分子。运样的分子 是本领域已知的且包括,例如,在分子骨架中肤键替代憐酸醋键的分子。其他修饰可包括, 例如其中核糖环包含桥接部分或其他结构的类似物,如在"锁"核酸中发现的修饰。
[0067] 当用于核酸序列时,术语"突变的"意思是与参考核酸序列相比,核酸序列中的核 巧酸可W被插入、缺失或改变。可W在基因座处进行单一改变(点突变)或在单个基因座 处插入、缺失或改变多个核巧酸。此外,可W在核酸序列内多个基因座处进行一个或多个改 变。核酸序列可W用任何本领域已知的方法突变,包括但不限于诱变技术如"易错PCR"(在 DNA聚合酶的复制保真度低的条件下进行PCRW使得沿PCR产物的全长获得高点突变率 的过程,见Leung等,Technique, 1:11-15 (1989)W及Caldwell和Joyce,PCRMethods Applic. 2:28-33 (1992));和"寡核巧酸定点诱变"(能够在任何感兴趣的克隆DNA片段中产 生位点特异性突变的过程;见,如Rei化aar-Olson和Sauer,Science241:53-57 (1988))。 [006引本发明使用的术语"减弱"通常指功能缺失,包括对基因序列或控制基因序列转录 的序列进行的突变、部分或全部缺失、插入、或其他变化,其降低或抑制基因产物的产生,或 导致基因产物为非功能性的。在某些情况下功能缺失被描述为敲除突变。减弱也包括通过 改变核酸序列的氨基酸序列变化、将基因置于较不活跃的启动子控制之下、下调、表达祀向 感兴趣的基因的干扰RNA、核酶或反义序列或者通过任何其他本领域已知的技术。在一个实 例中,特定酶对于反馈抑制或非产物或反应物的组合物引起的抑制(非途径特异性反馈) 的敏感性较低,W使得酶活性不受化合物存在的影响。在其他情况下,已被改变为较低活性 的酶可W被称为减弱的。
[0069] 缺失:从核酸分子中去除一个或多个核巧酸或从蛋白质中去除一个或多个氨基 酸,任一侧的区域连接在一起。
[0070] 敲除:其表达水平或活性被降低至零的基因。在某些实例中,基因通过其编码序列 的部分或全部的删除被敲除。在其他实例中,基因通过向其开放阅读框中引入一个或多个 核巧酸(其导致无义的或另外非功能性的蛋白质产物的翻译)被敲除。
[0071] 本发明中使用的术语"载体"意图指能够转运其连接的另一核酸的核酸分子。载体 的一种类型是"质粒",其通常是指环形双链DNA环,另外的DNA片段可W接合到其中,但也 包括线性双链分子如由聚合酶链式反应(PCR)扩增得到的或从用限制性内切酶处理环形 质粒得到的线性双链分子。其他载体包括粘粒、细菌人工染色体度AC)和酵母人工染色体 (YAC)。另外一种类型的载体是病毒载体,其中另外的DNA片段可W被接合到病毒基因组中 (下面更详细地讨论)。特定载体能够在其被引入的宿主细胞内自主复制(如,具有在宿主 细胞内起作用的复制起点的载体)。其他载体在被引入宿主细胞中时可W被整合进宿主细 胞的基因组中,并由此随宿主基因组一起复制。此外,特定的优选载体能够指导其可操作地 连接的基因的表达。运样的载体本发明中被称为"重组表达载体"(或简称"表达载体")。
[0072]"可运行地连接的"或"可操作地连接的"表达控制序列是指其中表达控制序列与 感兴趣的基因邻接W控制感兴趣的基因的连接,W及W反式方式或在一定距离起作用W控 制感兴趣的基因的表达巧制序列。
[0073] 本发明中使用的术语"表达控制序列"是指影响与之可操作连接的编码序列的表 达所必须的多核巧酸序列。表达控制序列是控制核酸序列的转录、转录后事件和翻译的序 列。表达控制序列包括适合的转录起始、终止、启动子和增强子序列;高效的RNA加工信号 如剪接和多腺巧酸化信号;稳定胞质mRNA的序列;提高翻译效率的序列(如,核糖体结合 位点);提高蛋白质稳定性的序列讯当需要时,增加蛋白质分泌的序列。运样的控制序列 的性质依宿主生物体的不同而不同;在原核生物中,运样的控制序列通常包括启动子、核糖 体结合位点和转录终止序列。术语"控制序列"意图至少包括其存在对于表达至关重要的 所有组分,且也可W包括其存在有利的其他组分,例如前导序列和融合伴体序列。
[0074] 本发明中使用的术语"重组宿主细胞"(或简称"宿主细胞")意指重组载体被引 入其中的细胞。应当理解运样的术语不仅意指特定对象细胞,也指运样细胞的后代。由于 突变或环境影响可能导致后续世代中发生特定的改变,运样的后代可能实际上不与母细胞 相同,但仍然包含在本发明使用的术语"宿主细胞"的范围内。重组宿主细胞可W是培养物 中生长的分离的细胞或细胞系,或可W是定殖于活组织或生物体中的细胞。
[00巧]本发明中使用的术语"肤"是指短的多肤,如通常低于50个氨基酸长度和更通常 低于30个氨基酸长度的多肤。本发明中使用的该术语包括类似物和模拟结构和由此模拟 生物功能的模拟物。
[0076] 术语"多肤"包括自然发生的和非自然发生的蛋白质及其片段、突变体、衍生物和 类似物。多肤可W是单体的或聚合的。此外,多肤可W包括多个不同的结构域,各结构域有 一种或多种不同的活性。
[0077] 术语"分离的蛋白质"或"分离的多肤"是就其起源或衍生来源来说(1)不与在其 原始状态中伴随的天然相关的组分关联的,(2)W自然中不存在的纯度存在的,其中纯度可 W相对于其他细胞物质的存在来判定(如,不含来自相同种的其他蛋白质),(3)由来自不 同物种的细胞表达的,或(4)不是自然界发生的(如其是自然界发现的多肤的片段,或其包 含自然中不存在的氨基酸类似物或衍生物或不同于标准肤键的连接)。因此,化学合成的或 在不同于其天然来源细胞的细胞系统中合成的多肤将与其自然相关的组分"分离"。多肤或 蛋白质也可W通过使用本领域公知的蛋白质纯化技术分离而使得基本没有天然相关的组 分。如此定义的,"分离的"不必须是需要运样描述的蛋白质、多肤、肤或寡肤已从其原始环 境中物理移除。
[0078] 本发明中使用的术语"多肤片段"是指与全长的多肤相比具有缺失的多肤,如氨基 端和/或簇基端缺失。在优选的实施方式中,多肤片段是其中片段的氨基酸序列与自然发 生序列中的对应位置相同的连续序列。片段通常为至少5、6、7、8、9或10个氨基酸长,优选 至少12、14、16或18个氨基酸长,更优选至少20个氨基酸长,更优选至少25、30、35、40或 45个氨基酸长,甚至更优选至少50或60个氨基酸长,甚至更优选至少70个氨基酸长。
[0079]"修饰的衍生物"是指初级结构序列基本同源,但包括例如体内或体外化学或生物 化学修饰或整合了天然多肤中不存在的氨基酸的多肤或其片段。如本领域技术人员容易 理解的,运样的修饰包括,例如乙酷化、簇化、憐酸化、糖基化、泛素化、标记(如用放射性核 素)W及各种酶学修饰。多种标记多肤的方法和多种用于运种目的的取代物或标记是本领 域公知的,并包括放射性同位素如i25I、32P、35S和咱、连接到标记的抗配体物(antiligand) (如抗体)的配体、巧光团、化学发光剂、酶及可W作为标记配体的特异性结合对成员的抗 配体物。标记的选择取决于需要的灵敏度、与引物偶联的难易、稳定性要求和可用的手段。 标记多肤的方法是本领域公知的。参见如Ausubel等,QirrentProtocolsinMolecular Biology,GreenePublishingAssociates(1992,和 2002 增刊)(通过引用并入本文)。
[0080] 术语"融合蛋白"是指包含与异源氨基酸序列偶联的多肤或片段的多肤。融合蛋 白是有用的,因为它们可W被构建为包含来自两个或更多个不同蛋白质的两个或更多个需 要的功能元件。融合蛋白包含来自感兴趣的多肤的至少10个连续氨基酸,更优选至少20 或30个氨基酸,甚至更优选至少40、50或60个氨基酸,还更优选至少75、100或125个氨 基酸。包括本发明蛋白质整体的融合体有特别的用途。包括在本发明融合蛋白中的异源多 肤至少6个氨基酸长,经常至少8个氨基酸长,并有利地至少15、20和25个氨基酸长。包 括更大的多肤(如IgGFc区域)和甚至整个蛋白质(如含有绿色巧光蛋白("GFP")发色 团的蛋白质)的融合体有特别的用途。融合蛋白可W通过构建与编码不同蛋白质或肤的核 酸序列同框的编码多肤或其片段的核酸并随后表达该融合蛋白来重组产生。可选地,融合 蛋白可W通过将多肤或其片段与另一蛋白质交联来化学产生。
[0081] 术语"非肤类似物"是指具有与参考肤的特性相似的特性的化合物。非肤化合物也 可W被称为"肤模拟物"或"拟肤"。参见,例如,Jones,AminoAcidandPeptideSyndesis, OxfordUniversityPress(1992) ;Jung,CombinatorialPeptideandNonpeptide Libraries:AHandbook,JohnWiley(1997);Bodanszky等,PeptideChemistry-A PracticalTextbook,SpringerVerlag(1993);SyntheticPeptides:AUsersGuide, (Grant,作者,W.H.RreemanandCo. ,1992);Evans等,J.Med.Qiem. 30:1229(1987); Fauchere,J.Adv.DrugRes. 15:29 (1986);Veber和Freidinger,TrendsNeurosci., 8:392-396 (1985),及上述各文献中引用的参考文献,运些都通过引用并入本文。运样的化 合物通常在计算机分子建模的辅助下开发。与本发明中有用的肤结构相似的肤模拟物可W 用于产生等同的效果,且因此被设想为本发明的部分。
[0082]"多肤突变体"或"突变蛋白"是指与天然或野生型蛋白质的氨基酸序列相比,其序 列包含一个或多个氨基酸的插入、重复、缺失、重排或置换的多肤。突变蛋白可W在自然发 生的蛋白质的序列中具有一个或多个氨基酸点置换(其中一个位置上的单个氨基酸被改 变成另一种氨基酸)、一个或多个插入和/或缺失(其中一个或多个氨基酸分别被插入或缺 失)和/或在氨基或簇基端的任一端或在两端截短。与自然发生的蛋白质相比,突变蛋白 可W具有相同的,但优选具有不同的生物活性。
[0083] 突变蛋白具有与其野生型对应物至少85 %的总体序列同源性。甚至更优选是与野 生型蛋白质具有至少90%的总体序列同源性的突变蛋白。
[0084] 在甚至更优选的实施方式中,突变蛋白显示至少95%的序列同一性,甚至更优选 98 %,甚至更优选99 %W及甚至更优选99. 9 %的总体序列同一性。
[0085] 序列同源性可W通过任何常见序列分析算法,如Gap或Bestfit来测定。
[0086] 氨基酸置换可W包括:(1)降低对蛋白水解的易感性,(2)降低对氧化的易感性, (3)改变形成蛋白复合物的结合亲和力,(4)改变结合亲和力或酶活性,和(5)赋予或改变 运类类似物的其他物理化学或功能特性的置换。
[0087] 如本文中所用,二十种常见氨基酸和其缩写遵循常规用法。参见Immunology-A Synthesis(Golub和Gren编车茸,SinauerAssociates,Sunderland,Mass.,第二片反,1991), 其并入本文作为参考。二十种常见氨基酸的立体异构体(例如D-氨基酸)、非天然氨基酸 如a-,a-双取代氨基酸、N-烷基氨基酸和其他非常规氨基酸也可W是本发明多肤的适合 组分。非常规氨基酸的例子包括:4-径脯氨酸、丫-簇基谷氨酸、e-N,N,N-S甲基赖氨酸、 e-N-乙酷基赖氨酸、0-憐酸丝氨酸、N-乙酷基丝氨酸、N-甲酯基蛋氨酸、3-甲基组氨酸、 5-径赖氨酸、N-甲基精氨酸W及其他相似氨基酸和亚氨基酸(如4-径脯氨酸)。在本发 明中使用的多肤符号中,按照标准的用法和规则,左手端对应氨基末端和右手端对应簇基 末端。
[0088] 如果编码蛋白质的核酸序列具有与编码第二蛋白质的核酸序列相似的序列,则该 蛋白质与第二蛋白质具有"同源性"或者是与其"同源的"。可选地,如果两种蛋白质有"相 似"的氨基酸序列,蛋白质与第二蛋白质具有同源性。(因此,术语"同源蛋白质"定义为表 示两种蛋白质具有相似的氨基酸序列)。如本发明中使用的,氨基酸序列的两个区域间的同 源性(特别是关于预测的结构相似性)被解释为暗示了功能上的相似。
[0089] 当对蛋白质或肤使用"同源的"时,公认的是不相同的残基位置通常因保守的氨基 酸置换而不同。"保守的氨基酸置换"是其中氨基酸残基由带具有相似化学性质(如电荷或 疏水性)的侧链巧基)的另一氨基酸残基置换。通常,保守的氨基酸置换不显著改变蛋白 质的功能特性。在其中两个或多个氨基酸序列由于保守氨基酸置换而互不相同的情况下, 百分序列同一性或同源度可W上调W对于置换的保守性特性进行校正。进行运种调整的方 法是本领域技术人员所公知的。参见,例如化arson, 1994,MethodsMol.Biol. 24:307-31 和25:365-89(通过引用并入本文)。
[0090]下列六组各包含互为保守置换的氨基酸:1)丝氨酸(S)、苏氨酸(T);2)天口冬氨 酸值)、谷氨酸巧)诚天口冬酷胺㈱、谷氨酷胺佩;4)精氨酸佩、赖氨酸化)试异亮 氨酸(I)、亮氨酸化)、蛋氨酸(M)、丙氨酸(A)、鄉氨酸(V)和6)苯丙氨酸(F)、酪氨酸(Y)、 色氨酸(W)。
[0091] 多肤的序列同源性,也被称为百分序列同一性,通常使用序列分析软件测定。见, 女日SequenceAnalysisSoftwarePackageoftheGeneticsComputerGroup(GCG), UniversityofWisconsinBiotechnologyCenter,910UniversityAvenue,Madison, Wis. 53705。蛋白质分析软件使用赋于各种置换、缺失和其他修饰(包括保守氨基酸置换) 的同源性量值来匹配相似序列。例如,GCG包含如"Gap"和"Bestfit"的程序,运些程序可 W默认参数使用W确定密切相关的多肤(如来自不同物种生物体的同源多肤)之间或野生 型蛋白质与其突变蛋白之间的序列同源性或序列同一性。见,如GCG,版本6. 1。
[0092] 当比较特定多肤序列和包含来自不同生物体的大量序列的数据库时,优选的算 法是计算机程序BLAST(Altschul等,J.Mol.Biol. 215:403-410 (1990);Gish和States, NatureGenet. 3:266-272 (1993);Madden等,Meth.Enzymol. 266:131-141 (1996); Altschul等,NucleicAcidsRes. 25:3389-3402(1997);Zhang和Madden,Genome Res. 7:649-656(1997)),特别是blas1:p或忧lastn(Altschul等,NucleicAcids Res.25:3389-3402(1997))。
[0093]BLAS化优选的参数为:期望值10:(默认);过滤器:seg(默认);开放空位罚分: 11(默认);扩展空位罚分:1(默认);最大比对:100(默认);字长:11(默认);描述编号: 100 (默认);罚分矩阵:BL0WSUM62。
[0094] 比较同源性的多肤序列的长度一般至少约16个氨基酸残基,经常至少约20个残 基,更经常至少约24个残基,通常至少约28个残基,优选多于约35个残基。当检索包含来 自大量不同生物体的序列的数据库时,优选比较氨基酸序列。使用氨基酸序列的数据库检 索可W通过本领域已知的bias化W外的算法测定。例如,可W使用FASTA,GCG版本6. 1中 的程序来比较多肤序列。FASTA提供查询和检索序列间最佳重叠区域的比对和百分序列同 一性。F*earson,MethodsEnzymol. 183:63-98 (1990)(通过引用并入本文)。例如,如GCG 版本6. 1 (通过引用并入本文)中提供的,氨基酸序列间的百分序列同一性可W使用FASTA W其默认参数(2的字长和PAM250得分矩阵)确定。
[0095]"特异性结合"是指两个分子优先于与环境中的其他分子结合而相互结合的能力。 通常,"特异性结合"区别于反应中的偶然结合至少2倍、更通常至少10倍,经常至少100 倍。通常,如通过解离常数量化的,特异性结合反应的亲和力或亲合力约为10 或更强(如 10 %、10 9m或甚至更强)。
[0096] 本发明中使用的术语"区域"是指生物分子初级结构的物理连续部分。在蛋白质 的情况下,区域被定义为该蛋白质氨基酸序列的连续部分。
[0097] 本发明中使用的术语"结构域"是指导致生物分子的已知或可能的功能的生物分 子的结构。结构域可W与其区域或部分同延;结构域也可W包括生物分子的不同的非连续 区域。蛋白质结构域的例子包括,但不限于,Ig结构域、胞外结构域、跨膜结构域和胞质结 构域。
[009引本发明中使用的术语"分子"指任何化合物,包括但不限于,小分子、肤、蛋白质、 糖、核巧酸、核酸、脂质等,且运样的化合物可W是天然的或合成的。
[0099]"感兴趣的碳基产物"包括醇类,如乙醇、丙醇、异丙醇、下醇、脂肪醇、脂肪酸醋、蜡 醋;控和烧控,如丙烷、辛烧、柴油、喷气推进剂8(JP8);聚合物如对苯二酸醋、1,3-丙二醇、 1,4-下二醇、多元醇、聚径基烧酸醋(PHA)、聚-e-径基下酸醋(P皿)、丙締酸醋、己二酸、e-己内醋、异戊二締、己内酷胺、橡胶;商品化学物质,如乳酸醋、二十二碳六締酸值HA)、 3-径基丙酸、丫-戊内醋、赖氨酸、丝氨酸、天口冬氨酸醋、天口冬氨酸、山梨醇、抗坏血酸 盐、抗坏血酸、异戊締醇、羊毛酱醇、C0-3DHA、番茄红素、衣康酸醋、1,3-下二締、乙締、丙締、 班巧酸醋、巧樣酸醋、巧樣酸、谷氨酸醋、苹果酸醋、3-径基丙酸(HPA)、乳酸、THF、丫-下内 醋、化咯烧酬、径下酸醋、谷氨酸、乙酷丙酸、丙締酸、丙二酸;特种化学品如类胡萝h素、类 异戊二締、衣康酸;药物和药物中间体如7-氨基脱乙酷氧基头抱烧酸(7-ADCA)/头抱菌素、 红霉素、聚酬、他汀类、紫杉醇、多西紫杉醇、祗、肤、类固醇、CO-脂肪酸和其他合适的目的产 物。运样的产物在生物燃料、工业和特种化学品的情况中作为用于其他产品如营养补充剂、 保健品(neutraceutical)、聚合物、石蜡替代品、个人护理产品和药品的中间体是有用的。
[0100] 生物燃料:生物燃料是指源于生物来源的任何燃料。生物燃料可W指一种或多种 控、一种或多种醇(如乙醇)、一种或多种脂肪醋或其混合物。
[0101]控:该术语通常指由元素碳(C)、氨(H)和任选的氧(0)组成的化合物。控基本有 =种类型,如芳香控、饱和控和不饱和控如締控、烘控和二締控。该术语也包括燃料、生物燃 料、塑料、蜡、溶剂和油。控包括生物燃料,W及塑料、蜡、溶剂和
当前第2页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1