新的酰基转移酶多核苷酸、多肽、及其使用方法_3

文档序号:9400854阅读:来源:国知局
la)、隐甲藻属(Crypthecodinium)、江蓠属(Gracilaria)、马尾藻 属(Sargassum)、颗石藻属(Pleurochrysis)、紫球藻属(Porphyridium)、褐指藻属 (Phaeodactylum)、红球藻属(Haematococcus)、球等鞭金藻属(Isochrysis)、概藻属 (Scenedesmus)、单胞藻属(Monodus)、小环藻属(Cyclotella)、菱形藻属(Nitzschia)或雪 藻属(Parietochloris)。在另一个实施方案中,所述藻类细胞为莱茵衣藻(Chlamydomonas reinhardtii)。在另一个实施方案中,所述细胞选自耶罗威亚酵母属(Yarrowia)、假丝 酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球酵 母属(Cryptococcus)、丝孢酵母属(Trichosporon)、油脂酵母属(Lipomyces)、腐霉属 (Pythium)、裂殖壶菌属(Schizochytrium)、破囊壶菌属(Thraustochytrium)、或吾肯氏壶 藻属(Ulkenia)。在另一个实施方案中,所述细胞为选自红球菌属(Rhodococcus)、大肠杆 菌属(Escherichia)或蓝藻(cyanobacterium)的细菌。在另一个实施方案中,所述细胞为 酵母细胞。在另一个实施方案中,所述细胞为合成细胞。
[0193] 植物
[0194] 本发明的变体DGATl序列可以为天然存在的DGATl序列。优选地,所述变体DGATl 序列来源于植物。在某些实施方案中,表达本发明的DGATl蛋白的细胞来源于植物。在另 一些实施方案中,本发明的DGATl蛋白在植物中表达。
[0195] 本发明的DGATl蛋白来源的植物细胞、植物细胞来源的植物、以及表达本发明的 DGATl蛋白的植物可来自任何植物物种。
[0196] 在一个实施方案中,所述植物细胞或植物源自裸子植物物种。
[0197] 在另一个实施方案中,所述植物细胞或植物源自被子植物物种。
[0198] 在另一个实施方案中,所述植物细胞或植物源自双子叶植物物种。
[0199] 在另一个实施方案中,所述植物细胞或植物源自单子叶植物物种。
[0200] 其它优选的植物为来自包括、但不限于以下各属的草料植物物种:玉蜀黍属 (Zea)、黑麦草属(Lolium)、大麦属(Hordium)、芒属(Miscanthus)、甘鹿属(Saccharum)、 羊茅属(Festuca)、鸡脚茅属(Dactylis)、雀麦属(Bromus)、偃麦草属(Thinopyrum)、三 叶草属(Trifolium)、苜蓿属(Medicago)、梯牧草属(Pheleum)、金丝雀草属(Phalaris)、 绒毛草属(Holcus)、大豆属(Glycine)、莲属(Lotus)、车前草属(Plantago)及菊苣属 (Cichorium)〇
[0201] 其它优选的植物为豆科植物。豆科植物或其部分可涵盖在豆科(Leguminosae或 Fabaceae)植物科中的任何植物。例如,所述植物可选自草料豆科(legumes),包括苜蓿草、 三叶草;银合欢;谷物豆科,包括豆、小扁豆、羽扇豆、豌豆、花生、大豆;开花豆科,包括羽扇 豆;药用或工业用豆科;及休耕或绿肥豆科物种。
[0202] 特别优选的属为三叶草属。优选的三叶草物种包括白三叶草(Trifolium repens);兔足三叶草(Trifoliumarvense);亲和三叶草(Trifoliumaffine);及类白三 叶草(Trifoliumoccidentale)。尤其优选的三叶草物种为白三叶草。
[0203] 另一个优选的属为苜蓿属。优选的苜蓿物种包括紫苜蓿(Medicagosativa)及蒺 藜苜蓿(Medicagotruncatula)。尤其优选的苜蓿物种为紫苜蓿,常称为苜蓿草。
[0204] 另一个优选的属为大豆属。优选的大豆物种包括大豆(Glycinemax)及爪哇大豆 (Glycinewightii)(也称为爪唾大豆(Neonotoniawightii))。尤其优选的大豆物种为大 豆(Glycinemax),常称为大豆(soybean)。尤其优选的大豆物种为爪哇大豆,常称为多年 生大豆。
[0205] 另一个优选的属为5工豆属(Vigna)。尤其优选的5工豆物种为5工豆(Vigna unguiculata),常称为豆工豆(Cowpea)0
[0206] 另一个优选的属为黧豆属(Mucana)。优选的黧豆物种包括刺毛黧豆(mucana pruniens)。尤其优选的黧豆物种为刺毛黧豆,常称为黧豆(velvetbean)。
[0207] 另一个优选的属为花生属(Arachis)。尤其优选的花生物种为多年生花生 (Arachisglabrata),常称为多年生花生(perennialpeanut)。
[0208] 另一个优选的属为豌豆属(Pisum)。优选的豌豆物种为豌豆(Pisumsativum),常 称为豌豆(pea)。
[0209] 另一个优选的属为莲属(Lotus)。优选的莲物种包括百脉根(Lotus corniculatus)、长柄百脉根(Lotuspedunculatus)、窄叶百脉根(Lotusglabar)、细叶百 脉根(Lotustenuis)及大百脉根(Lotusuliginosus)。优选的莲物种为百脉根,常称为角 果百脉根(BirdsfootTrefoil)。另一优选的莲物种为窄叶百脉根,常称为窄叶角果百脉 根。另一优选的莲物种为长柄百脉根,常称为湿地百脉根(Bigtrefoil)。另一优选的莲物 种为细叶百脉根,常称为细长百脉根(Slendertrefoil)。
[0210] 另一个优选的属为芸苔属(Brassica)。优选的芸苔物种为羽衣甘蓝(Brassica oleracea),常称为草料甘蓝菜(foragekale)及甘蓝(cabbage)。优选的芸苔属为亚麻# (Camelina)。优选的亚麻养种为亚麻养(Camelinasativa)。
[0211] 其它优选的物种为含油种子作物,包括、但不限于以下各属:芸苔属、红花属 (Carthumus)、向日葵属、玉蜀黍属及芝麻属(Sesamum)。
[0212] 优选的含油种子属为芸苔属。优选的含油种子物种为甘蓝型油菜(Brassica napus)〇
[0213] 优选的含油种子属为芸苔属。优选的含油种子物种为羽衣甘蓝(Brassica oleraceae)〇
[0214] 优选的含油种子属为红花属。优选的含油种子物种为红花籽草(Carthamus tinctorius)〇
[0215] 优选的含油种子属为向日葵属。优选的含油种子物种为向日葵(Helianthus annuus)〇
[0216] 优选的含油种子属为玉蜀黍属。优选的含油种子物种为玉米(Zeamays)。
[0217] 优选的含油种子属为芝麻属。优选的含油种子物种为芝麻(Sesamumindicum)。
[0218] 优选的青贮料属为玉蜀黍属。优选的青贮料物种为玉米。
[0219] 优选的谷物生产属为大麦属(Hordeum)。优选的谷物生产物种为大麦(Hordeum vulgare)〇
[0220] 优选的牧草属为黑麦草属。优选的牧草物种为黑麦草(Loliumperenne)。
[0221] 优选的牧草属为黑麦草属。优选的牧草物种为黑麦草(Loliumarundinaceum)。
[0222] 优选的牧草属为三叶草属。优选的牧草物种为白三叶草。
[0223] 优选的牧草属为大麦属。优选的牧草物种为大麦。
[0224] 优选的植物也包括草料,或动物原料植物。所述植物包括、但不限于以下各属:芒 属、甘鹿属、黍属(Panicum)。
[0225] 优选的生物燃料属为芒属。优选的生物燃料物种为巨芒(Miscanthus giganteus)〇
[0226] 优选的生物燃料属为甘鹿属。优选的生物燃料物种为甘鹿(Saccharum officinarum)〇
[0227] 优选的生物燃料属为黍属。优选的生物燃料物种为柳枝稷(Panicumvirgatum)。
[0228] 植物部分、繁殖体和子代
[0229] 术语"植物"意欲包括整个植物,植物的任何部分,植物的种子、果实、繁殖体及子 代。
[0230] 术语"繁殖体"是指植物中可用于繁殖或增殖的任何部分,其为有性或无性的,包 括种子及插枝。
[0231] 可培养本发明的植物,并使其自交或与不同植物品系杂交,获得的包含本发明的 多核苷酸或构建体,和/或是能够表达本发明的DGATl序列的子代,也形成本发明的一个方 面。
[0232] 优选地,所述植物、植物部分、繁殖体和子代包含本发明的多核苷酸或构建体,和/ 或是能够表达本发明的DGATl序列。
[0233] 多核苷酸和片段
[0234] 本文中所用术语"多核苷酸"是指,任意长度但优选至少15个核苷酸的单链或双 链脱氧核糖核苷酸或核糖核苷酸聚合物,包括以下非限制性实例:编码及非编码的基因序 列、有义及反义互补序列、外显子、内含子、基因组DNA、cDNA、pre-mRNA、mRNA、rRNA、siRNA、 miRNA、tRNA、核酶、重组多肽、分离和纯化的天然存在的DNA或RNA序列、合成的RNA和DNA 序列、核酸探针、引物和片段。
[0235] 本文中提供的多核苷酸序列的"片段"是指连续核苷酸的子序列。
[0236] 术语"引物"是指,通常具有游离3' OH基团的短多核苷酸,其与模板杂交,且用于 引发与靶物互补的多核苷酸的聚合。
[0237] 术语"探针"是指,在基于杂交的试验中,用于检测与探针互补的多核苷酸序列的 短多核苷酸。所述探针可由如本文所定义的多核苷酸的"片段"组成。
[0238] 多肽和片段
[0239] 本文中所用术语"多肽"包括任意长度但优选至少5个氨基酸的氨基酸链,包括全 长蛋白,其中氨基酸残基通过共价肽键相连。本发明的多肽或用于本发明方法中的多肽可 为纯化的天然产物,或可使用重组或合成技术部分地或整体地生产。
[0240] 多肽的"片段"为多肽的子序列,其优选地执行所述多肽的功能/活性,和/或影 响所述多肽的三维结构。
[0241] 当用于本文中所公开的多核苷酸或多肽序列时,术语"分离的"用于指从它们的天 然细胞环境中取出的序列。该分离的序列优选地从这样的序列中分离出来,所述序列是天 然存在环境中序列侧翼发现的。可通过任何方法或方法的组合获得分离的分子,包括生物 化学技术、重组技术及合成技术。
[0242] 术语"重组的"是指,从多核苷酸序列的天然背景所包围的序列中取出的多核苷酸 序列,和/或与在其天然背景下不存在的序列重组。
[0243] 通过从"重组的"多核苷酸序列翻译,制备"重组的"多肽序列。
[0244] 就源自特定属或种的本发明的多核苷酸或多肽而言,术语"源自"是指,所述多核 苷酸或多肽具有与在该属或种中天然发现的多核苷酸或多肽相同的序列。源自特定属或种 的多核苷酸或多肽因此可以合成制备或重组制备。
[0245] 变体
[0246] 本文中所用术语"变体"是指,不同于特别鉴别出的序列的多核苷酸或多肽序列, 其中缺失、置换或添加了一个或多个核苷酸或氨基酸残基。变体可为天然存在的等位基因 变体或非天然存在的变体。变体可来自同一物种或来自其它物种,且可包括同系物、旁系同 源物及直系同源物。在某些实施方案中,本发明多肽的变体具有与本发明多肽相同或类似 的生物活性。就多肽而言,术语"变体"包括所有形式的多肽和如本文所定义的多肽。
[0247] 多核苷酸变体
[0248]变体多核苷酸序列优选地与本发明的序列表现出至少50%、更优选至少51%、更 优选至少52 %、更优选至少53 %、更优选至少54 %、更优选至少55 %、更优选至少56 %、更 优选至少57 %、更优选至少58 %、更优选至少59 %、更优选至少60 %、更优选至少61 %、更 优选至少62 %、更优选至少63 %、更优选至少64 %、更优选至少65 %、更优选至少66 %、更 优选至少67 %、更优选至少68 %、更优选至少69 %、更优选至少70 %、更优选至少71 %、更 优选至少72 %、更优选至少73 %、更优选至少74 %、更优选至少75 %、更优选至少76 %、更 优选至少77 %、更优选至少78 %、更优选至少79 %、更优选至少80 %、更优选至少81 %、更 优选至少82 %、更优选至少83 %、更优选至少84 %、更优选至少85 %、更优选至少86 %、更 优选至少87 %、更优选至少88 %、更优选至少89 %、更优选至少90 %、更优选至少91 %、更 优选至少92 %、更优选至少93 %、更优选至少94 %、更优选至少95 %、更优选至少96 %、更 优选至少97%、更优选至少98%和最优选至少99%同一性。在本发明的多核苷酸的至少 20个核苷酸位置、优选至少50个核苷酸位置、更优选至少100个核苷酸位置且最优选整个 长度的比较窗上,发现同一性。
[0249] 可以如下方式测定多核苷酸序列同一性。在bl2seq(TatianaA.Tatusova,Thomas L.Madden(1999),"Blast2sequences-anewtoolforcomparingproteinand nucleotidesequences",FEMSMicrobiolLett. 174:247-250)中,使用BLASTN(来自BLAST 程序套件,2. 2. 5版[2002年11月]),将主题多核苷酸序列与候选多核苷酸序列进行比较, 所述bl2seq可从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得。除应关闭对低复杂 性部分的过滤以外,利用bl2seq的默认参数。
[0250] 可使用以下unix命令行参数检验多核苷酸序列的同一性:
[0251]bl2seq-inucleotideseql- jnucleotideseq2 -FF-pblastn
[0252] 参数-FF关闭对低复杂性区段的过滤。参数-p为序列对选出适当算法。bl2seq 程序在"Identities="行中将序列同一性报告为相同核苷酸的数量及百分比。
[0253]使用总体序列比对程序(例如Needleman,S.B.和胃11118(311,(10.(1970)]\]\1〇1. Biol. 48, 443-453),也可以在候选序列与主题多核苷酸序列之间的重叠部分的整个长度上 计算多核苷酸序列同一性。Needleman-Wunsch总体比对算法的一个完整实现,参见EMBOSS 套件(Rice,P.Longden,I.andBleasby,A.EMBOSS:TheEuropeanMolecularBiologyOpen SoftwareSuite,TrendsinGeneticsJune2000,第 16 卷,第 6 期,第 276-277 页)中的 needle程序。该EMBOSS套件可从http://www.hgmp.mrc.ac.uk/Software/EMBOSS/ 得到。 EuropeanBioinformaticsInstitute月艮务器也在http:/www.ebi.ac.uk/emboss/align/ 上在线提供执行两个序列之间的EMBOSS-needle总体比对的工具。
[0254] 或者,可使用GAP程序,其计算两个序列在无处罚末端空隙的情况下的最佳总体 比对。GAP描述在以下论文中:Huang,X. (1994)0nGlobalSequenceAlignment.Computer ApplicationsintheBiosciences10, 227-235。
[0255] 计算多核苷酸%序列同一,性的优选方法是基于使用Clustal X(Jeanmougin等 人,1998, Trends Biochem. Sci. 23, 403-5.)对比待比较的序列。
[0256] 本发明的多核苷酸变体也涵盖这样的变体:所述变体展现与可能保留那些序列的 功能等效性的一个或多个特别鉴别的序列的相似性,且不能合理地预期随机发生。使用从 来NCBI网站(ftp://ftp.ncbi.nih.gov/blast/)的BLAST程序套件(2. 2. 5 版[2002 年 11 月])可公开获得的bl2seq程序,可以测定有关多肽的这种序列相似性。
[0257] 可使用以下unix命令行参数检验多核苷酸序列的相似性:
[0258] bl2seq-i nucleotideseql-j nucleotideseq2-FF-ptblastx
[0259] 参数-FF关闭对低复杂性区段的过滤。参数-p为序列对选出适当算法。该程序 发现序列之间的相似性区域,且为每个这样的区域报导一个"E值",所述E值为预期在含有 随机序列的固定参考尺寸的数据库中找到该偶然匹配的预期次数。此数据库的尺寸是由 bl2seq程序中的默认值设定。对于远小于1的小E值而言,E值大致为这样的随机匹配的 机率。
[0260] 当与任一个特别鉴别的序列相比较时,变体多核苷酸序列优选地表现出小于 IxlO6、更优选地小于1x10 9、更优选地小于1x10 12、更优选地小于1x10 15、更优选地小于 IxlO18、更优选地小于1x10 21、更优选地小于1x10 3°、更优选地小于1x10 4°、更优选地小于 1x10 5°、更优选地小于1x10 6°、更优选地小于1x10 7°、更优选地小于1x10 8°、更优选地小于 1x10 9°和最优选地小于1x10 的E值。
[0261] 或者,本发明的变体多核苷酸或用于本发明方法中的变体多核苷酸在严谨条件下 与指定的多核苷酸序列或其互补序列杂交。
[0262] 术语"在严谨条件下杂交"及其语法等效描述是指,多核苷酸分子在限定的温度及 盐浓度条件下与靶多核苷酸分子(诸如固定于DNA或RNA印迹(诸如DNA印迹或RNA印 迹)上的靶多核苷酸分子)杂交的能力。通过最初在更低严谨性条件下杂交,随后将严谨 性增加至希望的严谨性,可以测定在严谨杂交条件下杂交的能力。
[0263] 关于长度大于约100个碱基的多核苷酸分子,典型的严谨杂交条件为,比天然 双链体的解链温度(Tm)低不超过25至30°C(例如KTC)(一般参见,Sambrook等人 编,1987,MolecularCloning,ALaboratoryManual,第 2版?ColdSpringHarborPress;Ausubel等人,1987,CurrentProtocolsinMolecularBiology,GreenePublishing)。 大于约100个碱基的多核苷酸分子的Tm可通过下式来计算:Tm= 81. 5+0. 41 % (G+C-log(Na+) ?(Sambrook等人,Eds, 1987,MolecularCloning,ALaboratoryManual, 第 2 版.ColdSpringHarborPress;BoltonandMcCarthy, 1962,PNAS84:1390)。长度 大于100个碱基的多核苷酸的典型严谨条件是这样的杂交条件,诸如在6XSSC、0. 2%SDS 的溶液中预洗涤;在65°C,在6XSSC、0. 2%SDS中杂交过夜;随后在1XSSC、0. 1%SDS中 在65°C进行两次各30分钟的洗涤,并在0. 2XSSC、0. 1%SDS中在65°C进行两次各30分 钟的洗涤。
[0264] 关于长度小于100个碱基的多核苷酸分子,示例性的严谨杂交条件是,比Tm低5 至10°C。平均而言,长度小于100碱基对的多核苷酸分子的Tm降低大约(500/寡核苷酸长 度)。。。
[0265]关于称为肽核酸(PNA)的DNA模拟物(Nielsen等人,Science. 1991年12月6日; 254 (5037) : 1497-500),Tm值高于DNA-DNA或DNA-RNA杂交物的Tm值,且可使用Giesen等 人,NucleicAcidsRes. 1998年11月1日;26 (21) :5004-6中所述的公式来计算。长度小 于100个碱基的DNA-PNA杂交物的示例性的严谨杂交条件为,比Tm低5至10°C。
[0266] 本发明的变体多核苷酸或用于本发明方法中的变体多核苷酸也涵盖这样的多核 苷酸:其不同于本发明的序列,但因遗传密码的简并性而编码具有与由本发明的多核苷酸 所编码的多肽相似的活性的多肽。不改变多肽的氨基酸序列的序列变化是"沉默变异"。除 ATG(甲硫氨酸)和TGG(色氨酸)以外,同一氨基酸的其它密码子可通过本领域认可的技术 发生改变,例如,以优化在特定宿主有机体中的密码子表达。
[0267]引起编码的多肽序列中的一个或若干个氨基酸的保守置换但不显著改变其生物 活性的多核苷酸序列变化,也包括于本发明中。技术人员知晓制造表型沉默的氨基酸置换 的方法(参见,例如,Bowie等人,1990, Science 247, 1306)〇
[0268]使用从NCBI网站(ftp://ft
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1