Sqs基因的制作方法

文档序号：558062阅读：790来源：国知局

专利名称：Sqs基因的制作方法
技术领域：
本发明涉及在提高类胡萝卜素的微生物生产的过程中使用的基因。
虾青素这种类胡萝卜素分布于各种有机体例如动物、藻类和微生物中。它对活性氧种类具有强烈的抗氧化特性。虾青素被用做着色剂，特别是用于鱼类例如鲑鱼等的养殖工业中，这是因为虾青素赋予动物与众不同的橙红色，有助于在市场上吸引消费者。
从通常的代谢物中乙酰辅酶A开始的类胡萝卜素生成(carotenogenic)途径(例如Phaffia rhodozyma的)的步骤之一，是通过IPP异构酶的作用将异戊烯焦磷酸(IPP)异构化为二甲基芳基焦磷酸(DMAPP)。然后，通过头尾缩合，IPP和DMAPP转化为C10单元，即香叶基焦磷酸(geranylpyrophosphate)(GPP)。
在GPP和IPP之间的类似缩合反应中，GPP被转化为C15单元即法呢基焦磷酸(FPP)，它是动物中的胆固醇和酵母中的麦角固醇以及例如RAS蛋白等调节蛋白发生法呢基化的重要底物。通常，从IPP和DMAPP生物合成GPP和FPP是用一种叫做FPP合酶的酶催化的。另一方面，在原核生物例如真细菌中，异戊烯焦磷酸通过1-脱氧木酮糖-5-磷酸从丙酮酸以不同的方式合成的，其中丙酮酸在酵母和动物中不存在。大多数参与甲羟戊酸途径的基因和FPP合酶基因是从P.rhodozyma(EP 955,363)克隆的。
一方面，本发明提供了含有编码酶鲨烯合酶基因的新的DNA片段。
更具体地，本发明提供了具有调节区域的DNA，所述调节区域例如启动子和终止子，以及鲨烯合酶基因的可读框。
本发明提供了在Phaffia rhodozyma中编码鲨烯合酶的DNA片段。所述DNA是指cDNA和含有调节序列的基因组DNA，所述cDNA仅包含侧接于该DNA 5’-和3’-未翻译区的短片段之间的可读框，所述基因组DNA的调节序列例如在P.rhodozyma中表达鲨烯合酶基因所必须的启动子和终止子。
因此，本发明涉及含有核酸分子的多核苷酸，所述核酸分子选自(a)核酸分子，其编码至少SEQ ID NO3所示多肽的成熟形式；(b)核酸分子，其含有SEQ ID NO2所示的编码序列；
(c)核酸分子，其核苷酸序列由于遗传密码而是(a)或(b)的核苷酸序列的简并序列；(d)编码多肽的核酸分子，所述多肽衍生自(a)到(c)之一的多核苷酸编码的多肽，所述衍生是通过取代、缺失和/或添加一个或数个氨基酸来进行的，其中所述氨基酸是(a)到(c)之一的多核苷酸所编码多肽的氨基酸序列的氨基酸。
(e)编码多肽的核酸分子，所述多肽衍生与由(a)或(b)的核酸分子编码的多肽的氨基酸序列具有51.3％或51.3％以上序列同一性的多肽；(f)核酸分子，该核酸分子含有由(a)到(e)之一的核酸分子所编码多肽的片段或表位-携带部分，并且所述片段或表位-携带部分具有鲨烯合酶活性；(g)含有多核苷酸的核酸分子，该多核苷酸具有这样的核酸分子序列，所述序列使用SEQ ID NO4、5和6所述的引物从Phaffia或Xanthophylomyces的核酸文库扩增；(h)编码具有鲨烯合酶活性的多肽的核酸分子，其中所述多肽是由(a)到(g)之一的核酸分子所编码多肽的片段；(i)核酸分子，该核酸分子含有(a)到(d)之一的多核苷酸的至少15个核苷酸；(j)编码具有鲨烯合酶活性的多肽的核酸分子，其中所述多肽由抗(a)到(h)之一的核酸分子所编码多肽的抗体识别；(k)编码具有鲨烯合酶活性的多肽的核酸分子，其可通过使用具有(a)到(j)之一所述核酸分子的序列的探针在严格条件下筛选适当的文库而获得；和(l)核酸分子，其互补链在严格条件下与(a)到(k)之一的核酸分子杂交，并且该核酸分子编码具有鲨烯合酶活性的多肽。
本文使用的术语“基因”、“多核苷酸”、“核酸序列”、“核苷酸序列”、“DNA序列”或“核酸分子”是指核糖核苷酸或脱氧核糖核苷酸的任何长度的核苷酸聚合形式。该术语仅指所述分子的一级结构。
因此，该术语包括双链或单链的DNA和RNA。它还包括已知类型的修饰，例如甲基化作用、用类似物来“加帽(cap)”取代一个或多个天然存在的核苷酸。优选地，本发明的DNA序列含有编码上述多肽的编码序列。
“编码序列”是核苷酸序列，当置于适当调控序列的控制下时，该序列转录成mRNA和/或翻译成多肽。编码序列的边界通过5’-末端的翻译起始密码子和3’-末端的翻译终止密码子确定。编码序列可包括，但不仅限于mRNA、cDNA、重组体核苷酸序列或基因组DNA，而在一些条件下有内含子存在。SEQ ID1描述了基因组DNA，其中内含子序列被插入来自Phaffiarhodozyma的鲨烯合酶基因的编码序列。
通常，基因由数个部分组成，这些部分具有相互不同的功能。在真核生物中，编码相应蛋白质的基因被转录为未成熟的(pre-mature)信使RNA(前mRA(pre-mRNA))，这与核糖体RNA(rRNA)和小核RNA(snRNA)和转运RNA(tRNA)的基因不同。尽管RNA聚合酶II(PolII)在该转录事件中发挥决定作用，但在没有覆盖含启动子和上游激活序列(UAS)的上游区的顺式元件(cis element)以及反式作用蛋白因子的情况下，PolII不能单独地起始转录。首先，由数个碱性蛋白成分组成的转录起始复合体识别待表达基因的5’-相邻区域的启动子序列。在这一事件中，在一些特定调节下表达的基因需要一些附加的参与成分，所述调节例如热休克反应或营养饥饿适应等。在这种情况下，需要UAS存在于启动子序列附近的5’-非翻译上游区域，以及识别UAS并与其结合的一些正或负调控蛋白。转录起始复合体与启动子序列的结合力受到该启动子周围的反式作用因子的这种结合影响，并且这样能调节转录活性。
转录起始复合体通过磷酸化作用被激活后，转录起始复合体从转录起始位点起始转录。从启动子区域到基因的3’方向，转录起始复合体的一些部分被解离作为延伸复合体(这一步骤被称做启动子清除事件)，而延伸复合体继续转录，直到它到达位于基因的3’-相邻下游区域的终止序列。这样产生的前信使RNA在细胞核中通过在加帽位点增加帽状结构，并通过在位于3’-相邻下游区域的polyA信号处增加polyA片段得以修饰，所述加帽位点几乎与转录起始位点相对应。而后，从编码区除去内含子结构，而外显子部分被结合以产生可读框，该可读框的序列与相应蛋白质的一级氨基酸序列对应。这种产生成熟mRNA的修饰对于稳定的基因表达是必需的。概括地说，cDNA与从成熟mRNA序列进行反转录得到的DNA序列对应。从实验角度而言，它可通过使用成熟mRNA做模板，用衍生自病毒种类的反转录酶合成。
为了表达衍生自真核细胞的基因，经常用将cDNA克隆入大肠杆菌的表达载体的方法。所述方法起因于这样的事实，即内含子结构的特异性在不同的有机体中不同，且不能识别其它种类的内含子序列。事实上，在自身的遗传背景中原核生物不具有内含子结构。即使在酵母中，在子囊菌(Ascomycetes)和担子菌(Basidiomycetes)之间遗传背景也是不同的，酿酒酵母(Saccharomyces cerevisiae)属于前者，P.rhodozyma属于后者，例如，来自P.rhodozyma肌动蛋白基因的内含子结构不能为酿酒酵母这种子囊菌类(ascomycetous)酵母识别或剪接。一些种类基因的内含子结构似乎参与调节其各自基因的表达。目的基因在自身克隆时，使用具有内含子基因组片段可能是很重要的，所述目的基因的内含子结构参与调节其自身基因的表达。为了将遗传改造方法应用于菌株改良研究，研究例如转录和翻译过程中的遗传机制是必需的。为研究遗传机制，确定遗传序列例如其UAS、启动子、内含子结构和终止子是重要的。
根据本发明，确定了编码来自P.rhodozyma的鲨烯合酶(SQS)基因，所述基因包括其5’-和3’-相邻区域以及内含子结构。
本发明进一步包含由于遗传密码的简并性而不同于SEQ ID NO2显示的核苷酸序列之一(及其一部分)的多核苷酸，并因此该多核苷酸编码SEQID NO2所示核苷酸序列所编码的鲨烯合酶。另外，本发明的多核苷酸具有编码含有氨基酸序列SEQ ID NO3的蛋白质的核苷酸序列。在一个实施方案中，本发明的多核苷酸编码全长Phaffia rhodozyma蛋白，该蛋白实质上与氨基酸序列SEQ ID NO3同源。
此外，本领域熟练的技术人员应当理解，导致氨基酸序列改变的DNA序列多态性可存在于种群中(例如，P.rhodozyma种群)。由于自然变异，鲨烯合酶基因中的这种遗传多态性可存在于种群内的个体之间。
本文使用的术语“基因”和“重组基因”是指含有编码鲨烯合酶的可读框的核酸分子，优选是来自P.rhodozyma的鲨烯合酶。
这种天然变异通常可导致鲨烯合酶基因中1-5％的核苷酸序列发生改变。本发明包括任何及全部这种核苷酸变异，以及导致的鲨烯合酶氨基酸多态性，其是天然变异的结果并不改变鲨烯合酶的功能活性。
对应于自然变体以及本发明鲨烯合酶cDNA的非-P.rhodozyma同源物的多核苷酸可基于它们与本发明公开的P.rhodozyma鲨烯合酶多核苷酸的同源性，依据标准杂交技术，在严格的杂交条件下使用本发明的多核苷酸或其一部分作为探针进行分离。因此，在另一个实施方案中，本发明的多核苷酸长度至少为15个核苷酸。优选，它在严格条件下与这样的核酸分子进行杂交，所述核酸分子含有本发明的多核苷酸例如SEQ ID NO2的核苷酸序列。在其它实施方案中，核酸长度至少为20、30、50、100、250或更多个核苷酸。上文说明了术语“在严格条件下杂交”，并意在描述杂交和洗涤的条件，在所述条件下，相互之间具有至少60％同一性的核苷酸序列通常保持相互杂交。优选，所述条件是这样的，相互之间具有至少约65％或70％、更优选至少约75％或80％，更优选至少约85％、90％或95％以上同一性的序列通常保持相互杂交。优选地，在严格条件下与序列SEQ ID NO2杂交的本发明的多核苷酸对应天然存在的核酸分子。
本发明中，所述多核苷酸序列包括SEQ ID NO2和片段，其含有在严格条件下与SEQ ID NO2杂交的多核苷酸序列，所述严格条件足以鉴定与SEQ ID NO2的特异性结合。例如，下述杂交与洗涤条件的任意组合可用于实现所需的特异性结合高严格性杂交6X SSC；0.5％SDS，100μg/ml变性的鲑精DNA，50％的甲酰胺，在42℃轻摇保温过夜。
高严格性洗涤在室温在2X SSC、0.5％SDS中洗涤1次(15分钟)，然后在0.1X SSC、0.5％SDS中在室温再洗涤15分钟。
低严格性杂交6X SSC，0.5％SDS，100μg/ml变性的鲑精DNA，50％的甲酰胺，在37℃轻摇保温过夜。
低严格性洗涤室温在0.1X SSC、0.5％SDS中洗涤1次(15分钟)。
中等严格条件可通过改变上述杂交反应发生的温度和/或洗涤条件来获得。本发明中，优选使用高严格性杂交和洗涤条件，以详细说明针对来自P.rhodozyma的鲨烯合酶基因的反义活性。
术语“同源性”是指各个核酸分子或编码的蛋白质在功能上和/或结构上相当。与上述核酸分子同源、且是所述核酸分子的衍生物的核酸分子是例如所述核酸分子的变异，所述变异代表具有相同生物功能，具体地为编码具有相同或基本上相同的生物功能的蛋白质的修饰。它们可以是天然存在的变异(例如来自其它植物品种或种类的序列)或突变。
这些突变可天然存在或可通过诱变技术获得。等位基因变体可以是天然存在的等位基因变体，也可以是通过合成方法产生的或遗传改造的变体。结构对等物可例如通过检验所述多肽和抗体的结合来鉴别。结构对等物具有相似的免疫学特征，例如包含相似的表位。
如本文使用的，“天然存在的”的核酸分子是指具有天然存在的核苷酸序列的RNA或DNA分子(例如，编码天然蛋白质)。优选，该多核苷酸编码天然P.rhodozyma的鲨烯合酶。
除可能存在于种群中的天然存在鲨烯合酶序列的变体外，本领域熟练的技术人员应进一步理解可通过突变将改变引入编码鲨烯合酶的多核苷酸的核苷酸序列，因此导致编码的鲨烯合酶的氨基酸序列的改变，而不改变鲨烯合酶的功能性。例如，导致在“非必需”氨基酸残基处发生氨基酸取代的核苷酸取代可在编码鲨烯合酶的多核苷酸例如SEQ ID NO2的序列中进行。“非-必需”氨基酸残基是这样一种残基，它可以改变自鲨烯合酶的野生型序列之一，而不改变所述鲨烯合酶的活性，而“必需”氨基酸残基是鲨烯合酶活性所需要的。然而，其它氨基酸残基(例如那些在具有鲨烯合酶活性的结构域中并非保守的或仅仅是半-保守的氨基酸残基)可能不是活性所必需的，因此很可能被改变但不改变鲨烯合酶的活性。
因此，本发明涉及编码鲨烯合酶的多核苷酸，该多核苷酸含有鲨烯合酶活性的非必需氨基酸残基的改变。这种鲨烯合酶的氨基酸序列不同于包含于SEQ ID NO3中的序列，却还保持着本文所描述的鲨烯合酶活性。该多核苷酸可包含编码多肽的核苷酸序列，其中该多肽包含与SEQ ID NO3的氨基酸序列具有至少约60％同一性的氨基酸序列，并能参与鲨烯的合成。优选，由所述核酸分子编码的蛋白质与SEQ ID NO3的序列具有至少约60％-65％的同一性，更优选与SEQ ID NO3中的序列之一具有至少约60％-70％的同一性，更优选与SEQ ID NO3中的序列具有至少约70-80％、80-90％、90-95％的同源性，最优选与SEQ ID NO3中的序列具有至少约96％、97％、98％或99％的同一性。
为了测定两个氨基酸序列(例如，SEQ ID NO3的序列之一和其突变形式)或两个核酸的同源性百分比，对所述序列进行比对以进行最佳比较(例如，可将间隙引入一个蛋白质或核酸的序列，以与另一蛋白质或核酸最佳比对)。然后比较位于相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当一个序列(例如，SEQ ID NO2或3的序列之一)中的位置被位于另一序列(例如所选序列的突变形式)中相应位置的相同氨基酸残基或核苷酸所占据时，那么所述分子在该位置同源(即，本文使用的氨基酸或核酸“同源性”与氨基酸或核酸“同一性”等同)。两个序列之间的同源性百分比是所述序列共有的相同位置数的函数(即，％同源性＝相同位置数/位置的总数×100)。同源性可通过如Blast 2.0的计算机程序确定(Altschul SF，Nuc.Acid.Res.，25，3389-3402，1997)。本发明中，使用GENETYX-SV/RC软件(SoftwareDevelopment Co.，Ltd.，Tokyo，Japan)(采用默认算法)作为这种同源性分析软件。该软件使用Lipman-Pearson方法进行分析算法。
编码与SEQ ID NO3的蛋白质序列同源的鲨烯合酶的核酸分子可通过将一个或多个核苷酸的取代、增加或缺失引入本发明多核苷酸的核苷酸序列(具体是序列SEQ ID NO2)来产生，使得一个或多个氨基酸取代、增加或缺失就被引入到编码的蛋白质中。突变可通过标准技术引入到例如SEQ IDNO2的序列中，所述技术例如定点诱变和PCR-介导的诱变。优选，保守氨基酸的取代在一个或多个预测的非必需氨基酸残基处进行。“保守氨基酸的取代”是这样的取代，其中氨基酸残基用具有相似侧链的氨基酸残基替换。具有相似侧链的氨基酸残基家族在本领域已经有所描述。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸、色氨酸)、具有β-分枝侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳香族侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此，鲨烯合酶中预测的非必需氨基酸残基优选用来自相同家族的另一个氨基酸残基取代。可选，在另一个实施例中，突变可通过例如饱和诱变(saturation mutagenesis)沿着鲨烯合酶的全部或部分编码序列随机引入，并且可筛选所得突变体的本文所述的鲨烯合酶活性，以鉴别保持了鲨烯合酶活性的突变体。对SEQ ID NO2的序列之一进行诱变后，编码的蛋白质可被重组表达，且蛋白质的活性可使用例如本文所描述的实验测定。
因此，在一个优选的实施方案中，本发明的多核苷酸是DNA或RNA。
本发明的多核苷酸，例如具有SEQ ID NO2的核苷酸序列的核酸分子或其一部分，可使用标准分子生物技术和本文提供的序列信息分离。例如，鲨烯合酶cDNA可使用本发明的多核苷酸序列之一的全部或部分作为杂交探针、并利用标准杂交技术从文库中分离。而且，包含本发明的多核苷酸序列之一的全部或部分的多核苷酸可使用基于该序列设计的寡核苷酸引物、通过聚合酶链反应分离，例如，包含本发明的多核苷酸序列之一的全部或部分的核酸分子，可使用例如基于本发明的多核苷酸序列SEQ IDNO4、5或6设计的寡核苷酸引物，通过聚合酶链反应分离。例如，mRNA可从细胞例如Phaffia(例如，通过Chirgwin等的硫氰酸胍提取方法)中分离，且cDNA可使用反转录酶(例如从Promega(Madison，USA)购得的MoloneyMLV反转录酶或AMV反转录酶)制备。用于聚合酶链反应扩增的合成的寡核苷酸引物可基于SEQ ID NO2所示的核苷酸序列之一设计。本发明的多核苷酸可根据标准PCR扩增技术、可选地使用cDNA或基因组DNA作为模板以及适当的寡核苷酸引物进行扩增。这样扩增的多核苷酸可被克隆入适当的载体并由DNA序列分析表征。另外，对应于鲨烯合酶核苷酸序列的寡核苷酸可通过标准合成技术制备，例如使用自动DNA合成仪。
术语“片段”、“序列的片段”或“部分序列”指原始序列的截短序列。该截短的序列(核酸或蛋白质序列)的长度可变化很大；最小的序列具有足够的大小，以使该序列具有所述原始序列的至少类似功能和/或活性，而最大长度不是关键性的。在一些申请中，通常最大长度基本上不超过提供所述原始序列的所需活性和/或功能所需的序列。
通常，截短的氨基酸序列的长度为约5到60个氨基酸。然而，更常见地，该序列最长约为50个氨基酸，优选地最长约为30个氨基酸。通常需要选择至少约10、12或15个氨基酸的序列，最长达约20或25个氨基酸。
术语“表位”涉及抗原内的特异性免疫反应性位点，也称做抗原决定簇。这些表位可以是聚合体组合物中线性排列的单体(例如蛋白质中的氨基酸)或包含更复杂的二级或三级结构。技术人员将认识到所有的免疫原(即能够激发免疫反应的物质)都是抗原；然而，一些抗原，例如半抗原，不是免疫原但可通过与载体分子偶联而获得免疫原性。术语“抗原”包括这样的物质，针对该物质可产生抗体和/或抗体对该物质具有特异性免疫反应性。
术语“一个或数个氨基酸”涉及至少一个氨基酸，但不超过导致同源性低于60％同一性的氨基酸数目。优选，所述同一性超过70％或80％，更优选为85％、90％或95％，甚至更优选为96％、97％、98％或99％同一性。
术语“鲨烯合酶”或“鲨烯合酶活性”涉及下文所述多肽的活性或者在酶分析方法中测定的所述活性。此外，在本文的实验中无活性、却被与鲨烯合酶特异性结合的抗体所识别(即具有一个或多个鲨烯合酶表位)的多肽，也包含于术语“鲨烯合酶”中。在这些情况下，活性是指它们的免疫活性。
术语“多核苷酸”和“核酸分子”也涉及“分离的”多核苷酸或核酸分子。“分离的”核酸分子是从存在于该核酸的天然来源中的其它核酸分子分离的核酸分子。优选，在所述核酸来源的有机体的基因组DNA中，“分离的”的核酸不含有天然位于该核酸侧翼的序列(即序列位于该核酸的5’和3’末端)。
例如，在各种实施方案中，PNO多核苷酸可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列，这些序列天然地位于核酸所来源细胞(例如Phaffia细胞)的基因组DNA中的该核酸分子的侧翼。而且，本发明的多核苷酸，具体为“分离的”核酸分子，例如cDNA分子，当其用重组技术生产时可基本不含其它细胞物质或培养基，当其通过化学方法合成时可基本不含化学前体或其它化学物质。
优选，本发明的多肽包含SEQ ID NO2所示的核苷酸序列之一。SEQ IDNO2的序列对应于本发明的P.rhodozyma鲨烯合酶cDNA。
另外，本发明的多核苷酸包含这样一种核酸分子，该核酸分子是上述多核苷酸的核酸序列之一的补体或其一部分。与显示于SEQ ID NO2的核苷酸序列之一互补的核酸分子是这样的核酸分子，它与SEQ ID NO2所示的核苷酸序列之一充分互补，使得它可与SEQ ID NO2所示的核苷酸序列之一杂交，因此形成稳定的双链体。
本发明的多核苷酸包含与SEQ ID NO2所示的核苷酸序列或其一部分具有至少约60％，优选至少约65-70％，更优选至少约70-80％、80-90％或90-95％，甚至更优选至少约95％、96％、97％、98％、99％以上同源性的核苷酸序列。本发明的多核苷酸序列包含这样的核苷酸序列，所述核苷酸序列与SEQ ID NO2的核苷酸序列之一或其一部分杂交，例如在本文的严格条件下进行杂交。
另外，本发明的多核苷酸可仅包含SEQ ID NO2的序列之一的部分编码区域，例如可用做探针或引物的片段或编码鲨烯合酶生物活性部分的片段。通过克隆来自P.rhodozyma的鲨烯合酶基因确定的核苷酸序列允许产生这样的探针和引物，所述探针和引物设计为用于在其它细胞类型和有机体中鉴定和/或克隆鲨烯合酶同源物。该探针/引物通常包括充分纯化的寡核苷酸。该寡核苷酸通常包括这样的核苷酸序列区域，所述核苷酸序列区域在严格条件下与例如SEQ ID NO2所述的序列之一的有义链、例如SEQ IDNO2的序列之一的反义链或其天然存在的突变体的至少约12、15，优选约20或25，更优选约40、50或75个连续的核苷酸发生杂交。基于本发明的核苷酸的引物可用于PCR反应以克隆鲨烯合酶同源物。基于鲨烯合酶核苷酸序列的探针可用于检测转录物或编码相同或同源蛋白的基因组序列。该探针可进一步含有附着于其上的标记基团，例如该标记基团可以是放射性同位素、荧光化合物、酶或酶辅因子。这种探针可被用做基因组标记物检验试剂盒的一部分，用于鉴定表达鲨烯合酶的细胞，所述鉴定可例如通过测定细胞样品中鲨烯合酶-编码核酸分子的水平，如，检测鲨烯合酶mRNA水平或确定基因组鲨烯合酶基因是否已突变或缺失来进行。
本发明的多核苷酸编码包括基本上与SEQ ID NO3的氨基酸序列同源的氨基酸序列的多肽或其一部分，这样，蛋白质或其一部分保持参与鲨烯合成的能力，具体是如实施例中所描述的微生物或植物中鲨烯合酶的活性。如本文所使用的，词语“基本上同源”是指蛋白质或其一部分，其氨基酸序列包含最少的与SEQ ID NO3的氨基酸序列相同或相当(例如，与本发明多肽序列之一的氨基酸残基具有相似侧链的氨基酸残基)的氨基酸残基，使得在微生物或植物中蛋白质或其一部分能够参与鲨烯的合成。本文还叙述了鲨烯合酶活性的实例。
所述蛋白质与SEQ ID NO3的整个氨基酸序列的同源性至少约为60-65％，优选至少约66-70％，更优选至少约70-80％、80-90％、90-95％，最优选至少约96％、97％、98％、99％或更高。
由本发明的鲨烯合酶多核苷酸编码的部分蛋白质优选是鲨烯合酶的生物活性部分。
如本文所提到的，术语“鲨烯合酶的生物活性部分”意图包括参与鲨烯的生物合成或具有免疫活性的部分例如结构域或基序，它可与特异性结合鲨烯合酶的抗体相结合。为了确定鲨烯合酶或其生物活性部分是否可参与代谢，可进行酶活性分析。这种分析方法为本领域熟练的技术人员所熟知，如实施例中详细描述。其它编码鲨烯合酶生物活性部分的核酸片段可通过如下过程制备分离SEQ ID NO2的序列之一的一部分，表达鲨烯合酶或肽的被编码部分(例如通过体外重组表达)并评估鲨烯合酶或肽的被编码部分的活性。
首先，含有部分SQS基因的部分基因片段用简并PCR(degenerate PCR)方法克隆。所述简并PCR是克隆目的基因的方法，其氨基酸序列与已知来自其它物种并具有相同或相似功能的酶高度同源。在简并PCR中被用做引物的简并引物，通过将氨基酸序列反向翻译(reverse translation)为相应的核苷酸(简并的)而设计。在这样的简并引物中，通常使用由任意A、C、G或T组成的混合引物，或在多义密码中含有次黄苷的引物。本发明中，这种混合引物被用做简并引物以克隆上述基因。
可标记由上述简并PCR获得的部分DNA片段并将其作为探针，通过在适当的宿主中筛选在噬菌体载体或质粒载体中构建的基因组文库，从染色体克隆含有编码区域及内含子和调节区(例如启动子或终止子)的完整基因。通常，大肠杆菌作为宿主菌株和大肠杆菌载体，噬菌体载体(例如λ噬菌体载体)或质粒载体(例如pUC载体)常用于构建文库以及随后的遗传操纵中，所述操作例如测序、限制酶切消化、连接等。本发明中，P.rhodozyma的EcoRI基因组文库在λ载体衍生物λDASHII中构建。插入物大小(插入物必须被克隆的长度)在文库构建前通过基因的Southern印迹杂交确定。本发明中，根据供应商提供的方案(Boehringer-Mannheim，Mannheim，Germany)，探针DNA用洋地黄毒苷(digoxingenin)(DIG)而不是常规的32p进行标记，所述标记是一种类固醇半抗原。从P.rhodozyma的染色体构建的基因组文库通过使用具有部分目的基因的DIG-标记的DNA片段做探针进行筛选。选取杂交的空斑并将其用于进一步研究。在使用λDASHII的情况下(插入物的大小从9kb到23kb)，制备的λDNA通过EcoRI消化，随后将EcoRI插入物克隆入质粒载体，例如pUC19或pBluescriptII SK+。对这样获得的质粒DNA进行测序。
本发明中，我们使用自动荧光DNA测序仪，ALFred系统(Pharmacia，Uppsala，Sweden)，并利用自动循环测序方案，所述方案在大多数测序情况下使用Taq DNA聚合酶。
测定基因组序列以后，利用编码区的序列来克隆相应基因的cDNA。仍使用PCR方法克隆cDNA片段。与可读框(ORF)的5’-和3’-末端的序列相同的PCR引物通过增加适当的限制性位点而合成，并使用那些PCR引物进行PCR。本发明中，在所述cDNA的PCR克隆中，cDNA库(pool)被用做模板。所述的cDNA库由各种cDNA种类组成，这些cDNA种类通过使用从P.rhodozyma获得的mRNA作模板、经病毒反转录酶和Taq聚合酶(由Clontech，Palo Alto，U.S.A.生产的CapFinder试剂盒)在体外合成。确认这样获得的目的cDNA的序列。
在另一个实施例中，本发明涉及制备重组载体的方法，包括将本发明的多核苷酸插入载体。
此外，本发明还涉及含有本发明的多核苷酸或通过本发明所述方法制备的重组载体。
如本文所使用的，术语“载体”是指能够转运多核苷酸的核酸分子，其中所述多核苷酸与核酸分子相连。一种类型的载体是“质粒”，它指环状的双链DNA环，其中可连有附加的DNA片段。另一种类型的载体是病毒载体，其中附加的DNA或RNA片段可连接到该病毒的基因组中。一些载体能够在它们被引入的宿主细胞中自主复制(例如具有细菌复制起点的细菌载体和游离型哺乳动物载体)。其它载体(例如非游离型哺乳动物载体)一旦引入宿主细胞就被整合到宿主细胞的基因组中，并因此沿着宿主基因组进行复制。另外，一些载体能够指导与其可操作地连接的基因的表达。本文中这种载体被称做“表达载体”。通常，在重组DNA技术中使用的表达载体常为质粒的形式。本申请中，由于质粒是最常用的载体的形式，“质粒”和“载体”可交换使用。然而，本发明意欲包含其它形式的表达载体，例如病毒载体(例如，复制缺陷型反转录病毒、腺病毒和腺伴随病毒)，它们具有相同的功能。
本发明还涉及基因工程中常规使用的粘粒、病毒、噬菌体和其它载体，它们含有依据本发明的核酸分子。可使用本领域熟练的技术人员所熟知的方法构建各种质粒和载体。换言之，本发明的核酸分子和载体可经重构进入脂质体来被递送到靶细胞。
本发明另一个优选的实施方案涉及载体，其中本发明的多核苷酸可操作地连接于允许在原核或真核宿主细胞中进行表达的表达控制序列。这种控制序列的特性随宿主有机体的不同而不同。在原核生物中，控制序列通常包括启动子、核糖体结合位点和终止子。在真核生物中，控制序列通常包括启动子、终止子并在一些情况下，包括增强子、反式激活蛋白或转录因子。
术语“控制序列”最少包括，表达必需的成分，还可包括附加的有利成分。
术语“可操作地连接”是指并置(iuxtaposition)，其中所描述的成分的关系允许它们以其目的方式发挥功能。“可操作地连接于”编码序列的控制序列是以可在与控制序列相容的条件下表达所述编码序列的的方式进行连接的。如果所述控制序列是启动子，对熟练的技术人员来说很明显应使用的是双链核酸。
这种调节序列是熟练的技术人员已知的。调节序列包括那些在多种类型的宿主细胞中指导核苷酸序列的构成型表达的序列，和仅在一些宿主细胞中或一些条件下指导核苷酸序列表达的序列。本领域熟练的技术人员应当理解表达载体的设计可取决于下述因素例如被转化的宿主细胞的选择，所需蛋白质的表达水平等。本发明的表达载体可被引入宿主细胞，从而产生由本文所描述的多核苷酸编码的蛋白质或肽，包括融合蛋白或肽。
涉及本发明的重组表达载体以便在原核或真核细胞中表达鲨烯合酶。例如，编码本发明的多核苷酸的基因可用载体根据WO 98/01,572所述的转化方法在如下细胞中表达例如大肠杆菌的细菌细胞；昆虫细胞(使用杆状病毒表达载体)；酵母和其它真菌细胞；藻类；下述种类的有纤毛类(ciliates)齿爪鳃金龟(Holotrichia)，Peritrichia、Spirotrichia、吸管虫(Suctoria)、四膜虫(Tetrahymena)、草履虫(Paramecium)、豆形虫(Colpidium)、Glaucoma、Platyophrya、Potomacus、Pseudocohnilembus、Euplotes、Engclmaniella、和Stylonychia，尤其是Stylonychia lemnae的有纤毛类；以及多细胞植物细胞或哺乳动物细胞。适当的宿主细胞是本领域熟练的技术人员已知的。换句话说，重组表达载体可在体外被转录和翻译，例如使用T7启动子调节序列和T7聚合酶。
原核生物中蛋白质的表达最常使用含有指导融合或非融合蛋白质表达的组成型或可诱导的启动子的载体来进行。融合载体将多个氨基酸加入其中所编码的蛋白质，通常加入到所述重组蛋白的氨基末端，也加入到C-末端或在蛋白质的适当区域内融合。这种融合载体通常具有三种用途1)提高该重组蛋白的表达；2)提高该重组蛋白的可溶性；和3)通过在亲合纯化中充当配体辅助该重组蛋白的纯化。通常，在融合表达载体中，蛋白水解酶切位点在融合部分与重组蛋白的连接处被引入，以便纯化融合蛋白之后能够从所述融合部分分离重组蛋白。这种酶，以及它们的同源识别序列，包括因子Xa、凝血酶和肠激酶。
常见的融合表达载体包括Pgex(Pharmacia Biotech Inc.)、pMAL(NewEngland Biolabs，Beverly，USA)和pRIT5(Pharmacia，Piscataway，USA)，它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白质A与靶重组蛋白融合。在一个实施方案中，由本发明的多核苷酸编码的多肽的编码序列被克隆进入pGEX表达载体，以产生编码包括GST-凝血酶酶切位点-X蛋白N-末端到C-末端的融合蛋白的载体。该融合蛋白可使用谷胱甘肽-琼脂糖树脂通过亲合层析纯化，例如未与GST融合的重组鲨烯合酶可通过用凝血酶切割融合蛋白回收。
适当的可诱导的非融合大肠杆菌表达载体的例子包括pTrc和pET lld。从pTrc载体表达靶基因依赖于从杂交trp-lac融合启动子转录宿主RNA聚合酶。从pET lld载体表达靶基因依赖于由共表达病毒RNA聚合酶(T7 gnl)介导的、从T7 gnl0-lac融合启动子开始的转录。在lacUV启动子的转录控制下，这种病毒聚合酶由宿主菌株BL21(DE3)或HMS 174(DE3)、通过含有T7 gnl基因的固有λ原噬菌体来提供。
重组蛋白质表达最大化的一个策略是在这样的宿主细菌中表达蛋白质，所述细菌对重组蛋白的蛋白水解切割能力降低。另一个策略是改变被插入到表达载体中的核酸的序列，这样每一个氨基酸各自的密码子在选择用于表达的细菌中被优选使用，所述细菌例如大肠杆菌。各自的本发明这种核酸序列的改变可通过标准DNA合成技术进行。
另外，鲨烯合酶载体可以是酵母表达载体。用于在酿酒酵母(S.cerevisiae)中表达的载体的例子包括pYepSecl、pMFa、pJRY88和pYES2(InVitrogen，San Diego，USA)。适合于在其它真菌例如丝状真菌中使用的载体和所述载体的构建方法是本领域熟练技术人员已知的。
另外，可使用杆状病毒表达载体将本发明的多核苷酸引入昆虫细胞。可用于在培养的昆虫细胞中(例如Sf 9细胞)表达蛋白质的杆状病毒载体包括pAc系列和pVL系列。
另外，使用哺乳动物表达载体将本发明的多核苷酸引入哺乳动物细胞。哺乳动物表达载体的例子包括pCDM8和pMT2PC。当在哺乳动物细胞中使用时，表达载体的控制功能常常由病毒调节元件提供。例如，通常使用的启动子衍生自多瘤病毒(polyoma)、腺病毒2(Adenovirus 2)、巨细胞病毒(meglovirus)和猴病毒40(Simian Virus 40)。其它用于原核和真核细胞的适当的表达系统是本领域熟练的技术人员已知的。
重组哺乳动物表达载体能够在具体的细胞类型中优选地指导核酸的表达(例如组织-特异性调节元件被用于表达核酸)。组织特异性调节元件是本领域已知的。适当的组织-特异性启动子的非限制性例子包括白蛋白启动子(肝-特异性)、淋巴-特异性启动子，具体是T细胞受体和免疫球蛋白的启动子、神经元-特异性启动子(例如神经丝启动子)、胰腺-特异性启动子、和乳腺-特异性启动子(例如乳清启动子；US 4,873,316和EP 264,166)。还包括发育-调节启动子，例如小鼠hox启动子和胎蛋白(fetoprotein)启动子。
可例如通过酶分析方法检验表达的SQS基因的活性。一些试验方法描述于文献中。下面是一种用于测定鲨烯合酶活性的方法通过监测[1-3H]FPP向鲨烯的转化确定鲨烯合酶的活性。反应混合物(500ml)包括50mMTris-HCl(pH7.4)，2mM KF，1mM MgCl2，1mM NADPH，酶，10Mm[1-3H]FPP(370MBq/mmol，3.7kBp/mL；New England Nuclear，Boston，MA)。通过加入[1-3H]FPP开始反应。在37℃培养10分钟后，通过加入1mL的乙醇停止反应。加入1mL的水后，混合物加入3mL的石油醚剧烈震荡30分钟。萃取的脂类被蒸发(evaporate)并悬浮于25ml的氯仿中。样品加入到塑性底衬(plastic backed)的平板上(硅胶60(Silica gel 60)，F254；Merck，Rahway，HJ)用于薄层层析(TLC)，并在庚烷中展开15分钟。包含于鲨烯级分中的放射活性通过液闪计数测定。当使用酿酒酵母的表达载体时，可通过使用衍生自酿酒酵母的条件型鲨烯合酶突变体ERG 9菌株作为宿主菌株，方便地利用互补分析(complementation analysis)来证实鲨烯合酶的活性(Merjulov等，Yeast，16，197-206，2000)。
酶的活性确定后，表达的蛋白将被纯化并用于激发抗纯化的酶的抗体。在菌株改良研究、培养条件优化的研究等中，这样制备的抗体将被用于表征相应酶的表达。
在另一个实施方案中，本发明涉及与本发明的多肽或其一部分(即这种蛋白的特异性片段或表位)特异性结合的抗体。
本发明的抗体可用于鉴别和分离其它鲨烯合酶和基因。这些抗体可以是单克隆抗体、多克隆抗体或合成抗体以及抗体的片段，例如Fab、Fv或scFv片段等。单克隆抗体可例如通过本领域技术人员已知的技术制备，所述技术包括小鼠骨髓瘤细胞与衍生自免疫后哺乳动物的脾细胞的融合。
此外，上述肽的抗体或其片段可使用本领域技术人员已知的方法获得。这些抗体可用于，例如根据本发明的蛋白质的免疫沉淀和免疫定位并用于监测例如在重组有机体中这种蛋白质的合成，以及用于鉴别与本发明的蛋白质相互作用的化合物。例如，在BlAcore系统中使用的表面胞质团共振(surface plasmon resonance)可用于提高噬菌体抗体选择的效率，从而使与本发明蛋白的表位结合的噬菌体抗体的单个文库的亲合性大大增加。在许多情况下，抗体与抗原结合的现象与其它配体/抗配体的结合是一样的。
本发明中，鲨烯合酶的基因片段从P.rhodozyma克隆，目的是使用克隆的基因片段通过遗传方法降低所述基因在P.rhodozyma中的表达水平。
本发明提供了类胡萝卜素的生产方法，其中编码鲨烯合酶的基因在适当的宿主例如P.rhodozyma中被修饰以减少所述基因的表达，以及在适当的培养条件下在适当的培养基中培养这种转化体。
为了用遗传方法降低基因的表达，可使用一些策略。策略之一是基因破坏(gene-disruption)方法。这种方法中，将被破坏的目标基因的部分片段与整合载体上的药物抗性盒连接，所述载体不能在宿主有机体中复制。药物抗性基因常被用于选择标记，所述基因编码能够使宿主在有毒的抗生素存在的情况下存活的酶。存在于pGB-Ph9中的G418抗性基因是在P.rhodozyma中行使功能的药物抗性基因的例子。营养互补(nutrition complementation)标记也可用于具有适当的营养缺陷型标记的宿主。需要胞苷用于其生长的P.rhodozyma ATCC24221菌株是营养缺陷型的一个例子。通过使用CTP合成酶作为ATCC24221的供体DNA，利用营养互补的宿主载体系统可被建立。
宿主有机体被转化，且载体上的目标基因片段与其宿主有机体染色体上相应的基因片段之间进行重组后，通过单交重组，整合载体被整合到宿主染色体。作为重组的结果，药物抗性盒将被插入目标基因，其中仅合成不具有该目标基因的酶功能的截短形式的翻译产物。目标基因的两个部分也以类似的方式用于基因破坏研究，其中药物抗性基因可插入整合载体上的目标基因的所述两个部分片段之间。在使用这种类型载体的情况下，可预期位于所述整合载体上的基因片段和宿主染色体上相应的基因片段之间的双重组事件。尽管这种双交换重组的频率比单交重组低，但由双交重组产生的目标基因的无效表型(null phenotype)比通过单交重组获得的更稳定。
本策略被用于构建产朊念珠菌(Candida utilis)的产番茄红素重组体，它具有质粒的细菌类胡萝卜素生成基因(Shimada等，(应用和环境微生物学(Applied and Environmental Microbiology)，64(7)，2676-2680，1998))。从产朊念珠菌克隆编码鲨烯合酶的ERG9基因，在产番茄红素型产朊念珠菌的染色体上的ERG9基因发生双交重组后诱导了所述基因的基因破坏体(disruptant)。Shimada等报道ERG9基因的破坏对重组产朊念珠菌的类胡萝卜素生成具有积极效果，所述产朊念珠菌具体衍生自这样的宿主，其中3-羟甲基戊二酰辅酶A还原酶在宿主染色体的多拷贝核糖体DNA基因座处扩增。
另一方面，当对宿主有机体而言基因(例如鲨烯合酶基因)的功能是必需的且该基因的破坏会致命时，该策略有困难。在上述参考文献中(Shimada等)，对宿主染色体的两个鲨烯合酶基因拷贝中的任何一个进行破坏。在这样一种构建中，没有证实下降的鲨烯合酶活性水平足以增加进入类胡萝卜素途径的碳流量。
在这种情况下，可运用其它策略减少(不是破坏)基因表达。策略之一是常规诱变以筛选其鲨烯合酶的表达被降低的突变体。该方法中，其中适当的报道基因与来自宿主有机体的鲨烯合酶基因的启动子区域相融合的适当重组体被突变，且显示较弱的报道基因产物活性的突变体可被选出。在这种突变体中，预期除了位于启动子基因本身的突变以外，可影响鲨烯合酶基因表达的、位于报道基因的启动子区或反式作用区中的突变可降低所述突变体表达的鲨烯合酶的活性。在报道基因融合物的启动子区出现突变的情况下，这种突变可通过相应区域的序列分离。这样分离的突变可被引入各种类胡萝卜素具体是虾青素生产突变体，所述突变体通过染色体上的鲨烯合酶基因的原始启动子和突变的启动子片段之间的重组从自P.rhodozyma衍生。为了排除在反式作用区发生的突变，突变也可通过对启动子区的顺式元件进行体外诱变来诱导。该方法中，含有报道基因的基因盒被诱变并引入P.rhodozyma，所述报道基因的5’-末端与在衍生自目的基因的启动子区融合，并且其3’-末端与来自目的基因的终止子区融合。通过检测报道基因活性的差别，有效突变可被筛选出来。这种突变可通过与体内突变法相同的方法被引入染色体上天然启动子区出来的序列。但是，这些方法有一些缺陷，它们具有一些耗时的步骤。
降低基因表达的另一个策略是反义方法。这种方法常常应用于降低基因的表达，即使当有性型(teleomorphic)有机体例如P.rhodozyma被用做宿主有机体时也如此，对这些有机体突变和基因破坏方法通常难以应用。反义方法通过引入一个人工基因片段降低目的基因的表达，该人工基因片段的序列与目的基因的cDNA片段互补。
“反义”核酸分子含有与编码蛋白质的“有义”核酸分子互补的核苷酸序列，例如与双链cDNA分子的编码链互补，或与mRNA序列互补。因此，反义核酸分子可以通过氢键与有义核酸分子结合。反义核酸分子可与整个鲨烯合酶-编码链互补，或仅与其一部分互补。相应地，反义核酸分子可与编码鲨烯合酶的核苷酸序列的编码链的“编码区”反义。术语“编码区”是指这样的核苷酸序列的区域，所述区域含有被翻译为氨基酸残基的密码子。此外，反义核酸分子与编码鲨烯合酶的核苷酸序列的编码链的“非编码区”反义。术语“非编码区”是指在编码区侧翼的、不被翻译为多肽的5’和3’序列(即，也称做5’和3’非翻译区)。
由于本发明公开了编码鲨烯合酶的编码链序列，本发明的反义核酸分子可根据Watson和Crick碱基配对的规则进行设计。反义核酸分子可与鲨烯合酶mRNA的整个编码区互补，但也可以是仅与部分鲨烯合酶mRNA的编码区或非编码区反义的寡核苷酸。例如，反义寡核苷酸可与鲨烯合酶mRNA的翻译起始位点周围的区域互补。反义寡核苷酸的长度可以是例如，约5、10、15、20、25、30、35、40、45或50个核苷酸。本发明的反义核酸分子可使用化学合成和酶连接反应使用本领域已知的方法构建。例如，反义核酸分子(例如反义寡核苷酸)可通过化学方法，使用天然产生的核苷酸或各种修饰的核苷酸合成，所述修饰被设计为用于提高分子的生物稳定性或提高反义和有义核酸形成的双链体的物理稳定性，例如可使用硫代磷酸(phosphorothiate)衍生物和吖啶取代的核苷酸。可用于产生反义核酸的修饰的核苷酸的例子包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶(chlorouracil)、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧羟甲基)尿嘧啶、5-羧甲基氨甲基-2-硫尿核苷、5-羧甲基氨甲基尿嘧啶、二氢尿嘧啶、3-D-半乳糖基-queosine、次黄苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基次黄苷、2，2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨甲基尿嘧啶、5-甲氧基氨甲基-2-硫尿嘧啶、β-D-甘露糖基queosine(mannosylqueosine)、5-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-N6-异戊烯基腺嘌呤、尿嘧啶-5-羟基乙酸(oxyacetic acid)(v)、wybutoxosine、假尿嘧啶(pseudouracil)、queosine、2-巯基胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-羟基乙酸甲酯、尿嘧啶-5-羟基乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-N-2-羧丙基)尿嘧啶、(acp3)w，和2，6-二氨基嘌呤，此外，反义核酸可使用表达载体通过生物方法产生，在所述载体中已经以反义方向(即，从插入的多核苷酸转录的RNA为目的靶多核苷酸的反义方向，下面的部分中将进一步描述)亚克隆了多核苷酸。
本发明的反义核酸分子通常被给予细胞或在原位产生，使得它们与细胞mRNA和/或编码鲨烯合酶的基因组DNA杂交和结合，从而例如通过抑制转录和/或翻译来抑制蛋白质的表达。杂交可通过常规核苷酸互补作用进行而形成稳定的双链体，或者例如在反义核酸分子与DNA双链体结合的情况下，通过在双螺旋的大沟中的特异性相互作用进行所述杂交。反义分子可被修饰，这样它与在选择的细胞表面上表达的受体或抗原特异性结合，例如通过将反义核酸分子与多肽或与细胞表面受体或抗原结合的抗体相连接。反义核酸分子也可使用本文描述的载体传递给细胞。为了获得足够的细胞内反义分子浓度，优选这样的载体构建物，其中的反义核酸分子被置于强的原核生物、病毒或真核生物包括植物的启动子的控制下。
另一个实施方案中，本发明的反义核酸分子可以是α-异头(anomeric)核酸分子。α-异头核酸分子形成与互补RNA杂交的特异性双链，其中，与通常的β-单元相反，该双链互相平行。反义核酸分子还可包含2’-o-甲基核糖核苷酸或嵌合的RNA-DNA类似物。
此外，本发明的反义核酸分子可以是核酶。核酶是具有核糖核酸酶活性的催化的RNA分子，它能够切割单链核酸，例如mRNA，核酶具有与所述单链核酸互补的区域。因此，核酶(例如，锤头核酶)可用于催化性切割鲨烯合酶mRNA转录物，以因此而抑制mRNA的翻译。对鲨烯合酶-编码核酸分子具有特异性的核酶可基于本发明的多核苷酸序列设计。例如，四膜虫(tetrahymena)L-19IVS RNA的衍生物可被构建，其中活性部位的核苷酸序列与在编码mRNA中待切割的核苷酸序列互补(US 4,987,071和US5,116,742)。另外，鲨烯合酶mRNA可用于从RNA分子库中选择具有特异性核糖核酸酶活性的催化型RNA。
从P.rhodzyma构建类胡萝卜素过量生产型菌株的反义方法的应用举例描述于EP 1,158,051中。
在一个实施方案中，本发明涉及制备重组宿主细胞的方法，该方法包括将本发明的载体或多核苷酸引入宿主细胞。
通过常规转化或转染技术，载体DNA可被引入原核或真核细胞。如本文所使用的，术语“转化”和“转染”，接合和转导意欲指各种用于将外源核酸(例如DNA)引入宿主细胞的人工识别技术，包括磷酸钙或氯化钙共沉淀、DEAE-右旋糖酐介导的转染、脂转染、天然感受态(natural competence)、化学介导的转移或电穿孔。转化或转染宿主细胞包括植物细胞适当的方法是技术人员已知的。
为进行哺乳动物细胞的稳定转染，已知，取决于使用的表达载体和转染技术，仅一小部分细胞可将外源DNA整合进入它们的基因组。为了鉴别和选择这些整合体，编码选择标记(例如对抗生素抗性)的基因通常同目的基因一起被引入宿主细胞。优选的选择标记包括赋予药物抗性的那些标记物，所述药物例如G418、潮霉素和氨甲蝶呤。编码选择标记的核酸可通过编码本发明多肽的载体，或可通过不同的载体被引入宿主细胞。具有引入的核酸的稳定转染的细胞可通过例如药物选择鉴别(例如掺入了选择标记基因的细胞将存活，而其它细胞将死亡)。
为了生产同源重组微生物，制备包含至少部分本发明的多核苷酸的载体，该载体中被引入了缺失、增加、或取代，从而改变例如破坏所述鲨烯合酶基因的功能。优选，该鲨烯合酶基因是P.rhodozyma鲨烯合酶基因，但它可以是来自相关或不同来源的同源物。可选，该载体可设计为发生同源重组时所述内源鲨烯合酶基因被突变或被改变，但仍编码功能性蛋白(例如，上游调节区可被改变，从而改变内源性鲨烯合酶的表达)。为了通过同源重组产生点突变，也可使用被称做嵌合体形成(chimeraplasty)的DNA-RNA杂交。
载体被引入细胞，并使用本领域已知的技术选择其中被引入的多核苷酸基因与内源鲨烯合酶基因发生同源重组的细胞。
可生产其它宿主细胞，其包含允许调节被引入基因的表达的选择系统。例如，将本发明的多核苷酸包含于这样的载体中，所述载体将所述多核苷酸置于lac操纵子的控制下，这仅在IPTG存在的情况下允许所述多核苷酸的表达。
优选，引入的核酸分子对宿主细胞来说是外源的。
“外源”是指核酸分子或者与宿主细胞异源，这是指其衍生自具有不同遗传背景的细胞或有机体，或者与宿主细胞同源但位于不同于所述核酸分子的天然存在对应物的遗传环境中。这意思是，如果该核酸分子与宿主细胞同源，它不在所述宿主细胞基因组中它的自然位置上，具体的说它是被不同的基因包围。在这种情况下，核酸分子或者可以在其自身的启动子控制下，或者在异源启动子的控制下。根据本发明存在于宿主细胞中的载体或核酸分子或者可被整合进入所述宿主细胞的基因组，或者可以以一些形式保留在染色体外。在这一方面，还应理解本发明的核酸分子可用于通过同源重组恢复或建立突变基因。
因此，本发明的另一个实施方案涉及用本发明的多核苷酸或本发明的载体遗传改造宿主细胞。
本文中术语“宿主细胞”和“重组宿主细胞”可交换使用。应理解该术语不仅指具体受检的细胞，还指这种细胞的子代或可能的子代。因为一些修饰由于或者突变或者环境影响可在后代中发生，事实上所述子代与亲代细胞可不同，但仍包含于本文使用的术语范围内。
例如，本发明的多核苷酸可被引入细菌细胞以及昆虫细胞、真菌细胞或哺乳动物细胞(例如中华仓鼠卵巢细胞(CHO)或COS细胞)、藻类、纤毛虫类、植物细胞、真菌或其它微生物，如大肠杆菌。其它适当的宿主细胞是本领域熟练的技术人员已知的。较佳的是大肠杆菌、杆状病毒、土壤杆菌或真菌细胞，例如糖酵母属(Saccharomyces)的细胞，例如，酿酒酵母或P.rhodozyma的细胞(Xanthophylomyces dendrorhous)。
另外，在一个实施方案中，本发明涉及制备真菌转化体的方法，包括将本发明的多核苷酸或载体引入所述真菌细胞的基因组。
为在植物细胞中以有义或反义方向表达本发明的核酸分子，该分子被置于确保其在真菌细胞中被表达的调节元件的控制下。这些调节元件对于被表达的核酸分子以及对于被转化的真菌种类而言可以是异源的或是同源的。
通常，这种调节元件包含在真菌细胞中有活性的启动子。为了在真菌细胞中获得构成型表达，使用优选的构成型启动子，例如来自P.rhodozyma的甘油醛-3-脱氢酶启动子(WO 97/23,633)。为了能够精确地控制表达，可使用诱导型启动子。诱导型启动子的例子是编码热激蛋白的基因的启动子。还描述了作为这种诱导型启动子的候选物的淀粉酶基因启动子(EP1,035,206)。调节元件可进一步含有在真菌细胞中发挥功能的转录和/或翻译增强子。此外，调节元件可包括转录终止信号，例如聚腺苷酸(poly-A)信号，它导致聚腺苷酸尾增加到转录物上，这可改善其稳定性。
外源DNA引入真菌细胞的方法也是本领域中所熟知的。这些方法包括，例如，用LiCl方法转化、原生质体融合、电穿孔、biolistic方法例如粒子轰击，以及本领域已知的其它方法。适当载体的制备方法是本领域熟练的技术人员已知的。使用biolistic方法进行转化的方法是本领域熟练的技术人员熟知的。
本文使用的术语“转化”是指将外源多核苷酸转移到宿主细胞中，这与用于转移的方法无关。多核苷酸可被瞬时或稳定地引入宿主细胞并可保持非整合态，例如，作为质粒或作为嵌合连接物(chimeric link)，或可选地可整合进入宿主基因组。
通常，可根据本发明进行修饰并显示本发明蛋白质的过量表达或所述蛋白质合成减少的真菌可衍生自任何所需的真菌种类。
此外，在一个实施方案中，本发明涉及真菌细胞，其包含可通过本发明的方法获得的多核苷酸或载体。
因此，本发明还涉及转基因的真菌细胞，该细胞包含(优选稳定地整合进入基因组)与调节元件连接的本发明的多核苷酸，它允许多核苷酸在真菌细胞中的表达，其中所述多核苷酸对于转化的真菌细胞来说是外源的。外源的含义见上文。
转化的真菌细胞中多核苷酸的存在和表达可调节，优选减少鲨烯的合成并使得在这样获得的转化的真菌细胞中，优选是在P.rhodozyma细胞中类胡萝卜素具体是虾青素的生产增加，。
因此，本发明还涉及根据本发明转化的真菌细胞。
相应地，由于鲨烯合酶表达的改变，细胞代谢途径在产量和/或生产效率方面受到调节。
术语“生产(production)”或“生产力(productivity)”是本领域所认可的并包括在给定的时间和给定的发酵体积中(例如kg产物/小时/升)在给定时间内形成的发酵产物(例如脂肪酸、类胡萝卜素、(多)糖、维生素、类异戊二烯、脂类、蜡酯(wax ester)和/或聚合体如多羟基烷羧酸酯(polyhydroxyalkanoates)和/或其代谢产物或本文所述其它所需的精细化学药品)的浓度。
术语生产“效率”包括达到具体生产水平所需的时间(例如，细胞花费多长时间才能达到所述改变的产量的具体输出速率，具体地说，为改变成类胡萝卜素、(多)糖、脂类、维生素、类异戊二烯等)。
术语“产量(yield)”或“产物/碳产量”是本领域所认可的，并包括将碳源转化为产物(即乙酰辅酶A、脂肪酸、类胡萝卜素、维生素、类异戊二烯、脂类等和/或如上所述的其它化合物，以及基于所述产物通过生物方法合成的化合物)的效率。这通常书写为例如，kg产物/kg碳源。通过提高化合物的产量或生产，在给定的培养物中、在给定的时间内，该化合物的回收分子(recovered molecules)的量或有用的回收分子的量被提高。
术语“生物合成”(它与在细胞、组织植物等中“通过生物方法的生产(biological production)”的“合成”是同义的)或“生物合成途径”是本领域所认可的，并包括通过细胞从中间化合物合成化合物，优选是有机化合物，其可为多步骤且高度调节化的过程。
术语“代谢”是本领域所认可的，并包括在有机体中发生的全部生化反应。那么，具体化合物的代谢(例如乙酰辅酶A、脂肪酸、己糖、脂类、类异戊二烯、维生素、类胡萝卜素等的代谢)包括在与该化合物相关的细胞中全部的生物合成、修饰和降解途径。
可在适当的培养基中培养这种基因改造的P.rhodozyma，并评估其类胡萝卜素，特别是虾青素的生产力或/和产量。这样选择的高虾青素生产者将通过其生产力以及通过这种基因改造方法引入的基因或蛋白质的表达水平之间的关系而得以证实。
本发明用下文描述的实施例进一步举例说明。
在下文描述的实施例中使用如下材料和方法
菌株P.rhodozyma ATCC96594(依照布达佩斯条约(Budapest Treaty)于1998年4月8日以入藏登记号ATCC74438进行重新保藏(re-deposite))。
DH5αF-，φ80d，lacZΔM15，Δ(lacZYA-argF)U169，hsd(rK-，mK+)，recA 1，endA 1，deoR，thi-1，supE44，gyrA96，relAl(Toyobo，Osaka，Tapan)XL1 MRA(P2)Δ(mcrA)183，Δ(mcrCB-hsdSMR-mrr)173，endA1，supE44，thi-1，gyrA96。relA1，lac(P2溶原体)(Stratagene，La Jola，U.S.A.)载体λDASHII(Stratagene)pBluescriptII KS(Stratagene)pMOSBlue T-载体(Amersham，Buckinghamshire，U.K.)培养基P.rhodozyma菌株常规保藏于YPD培养基中(DIFCO，Detroit，U.S.A.)。菌株保藏于LB培养基中(10g Bacto-trypton，5g酵母提取物(DIFCO)和5gNaCl/升)。NZY培养基(5g NaCl，2g MgSO4-7H2O，5g酵母提取物(DIFCO)，10g A型NZ胺(NZ amine type A)(WAKO，Osaka，Japan)/升)被用于λ噬菌体在软琼脂中(0.7％琼脂(WAKO))的繁殖。当制备琼脂培养基时，添加1.5％的琼脂(WAKO)。
方法限制性内切酶和T4DNA连接酶从Takara Shuzo(Ohtsu，Japan)购买。
使用QIAGEN Genomic试剂盒(QIAGEN，Hilden，Germany)，依照生产商提供的方法从P.rhodozyma分离染色体DNA。用自动DNA分离系统(Automatic DNA isolation system)(PI-50，Kurbo，Co.Ltd.，Osaka，Japan)由转化的大肠杆菌小量制备(mini-prep)质粒DNA。通过使用QIAGEN柱(QIAGEN)由大肠杆菌转化体小量制备质粒DNA。λDNA的分离使用WizardIambda preps DNA纯化系统(Promega，Madison，U.S.A.)依照生产商提供的方法进行。通过使用QIAquick或QIAEX II(QIAGEN)从琼脂糖中分离和纯化DNA片段。λ噬菌体衍生物的操作用生产商(Stratagene)制定的方案进行。
从P.rhodozyma分离总RNA通过使用Isogen(Nippon Gene，Toyama，Japan)用石炭酸法进行。使用mRNA分离试剂盒(Clontech)从这样获得的总RNA中纯化mRNA。使用CapFinder cDNA构建试剂盒(Clontech)合成cDNA。
使用Gigapack III金包装提取物(gold packaging extract(Stratagene)进行体外包装。
使用来自Perkin Elmer 2400型的热循环仪进行聚合酶链反应(PCR)。各个PCR条件描述于实施例中。PCR引物从商家购买。用于DNA测序的荧光DNA引物从Pharmacia购买。用自动荧光DNA测序仪(ALFred，Pharmacia)进行DNA测序。
DH5α的感受态细胞从Toyobo(Japan)购买。
实施例1从P.rhodozyma分离mRNA和cDNA文库的构建为了构建P.rhodozyma的cDNA文库，在细胞破坏后立即使用石炭酸提取方法分离总RNA，且来自P.rhodozyma ATCC96594菌株的mRNA通过使用mRNA分离试剂盒(Clontech)纯化。
菌株ATCC96594(在10ml YPD培养基中培养2天)的细胞通过离心收集(1500xg 10分钟)，并用提取缓冲液(包含0.7M KCl的10mM柠檬酸钠/HCl(pH6.2))洗涤一次。在2.5ml的提取缓冲液中悬浮后，用弗氏压碎匀浆机(French press homogenizer)(Ohtake Works Corp.，Tokyo，Japan)以1500kgf/em2的压力破碎细胞，并根据生产商描述的方法立即与两倍体积的isogen(Nippon gene)混合。这一步骤中，回收400μg总RNA。
然后，该总RNA用mRNA分离试剂盒(Clontech)根据生产商描述的方法纯化。最后，获得了16μg的来自P.rhodozyma ATCC96594菌株的mRNA。
为了构建cDNA文库，根据生产商指定的方法使用CapFinder PCRcDNA构建试剂盒(Clontech)。1μg纯化的mRNA被用于第一条链的合成，随后进行PCR。PCR扩增后，获得了1mg的cDNA文库。
实施例2从P.rhodozyma克隆部分SQS(鲨烯合酶)基因为了从P.rhodozyma中克隆部分SQS基因，使用简并的PCR方法。其鲨烯合酶序列被用于多重对比分析的种类和数据库保藏号如下。
玉蜀黍黑粉菌(Ustilago maydis)Q92459(SwissProt)粟酒裂殖酵母(Schizosaccharomyces pombe) P36596(SwissProt)酿酒酵母(Saccharomyces cerevisiae) M63979(GenBank)褐家鼠(Rattus norvegicus)Q02769(SwissProt)
小家鼠(Mus musculus) P53798(SwissProt)白色念珠菌(Candida albicans) P78589(SwissProt)人(Homo sapiens) 138245(Pir)拟南芥(Arabidopsis thaliana) U79159，AF004396硕大利什曼原虫(Leishmania major) U30455光果甘草(Glycyrrhiza glabra) D86410两种混合的引物，所述引物的核苷酸序列基于来自其它种类的已知鲨烯合酶基因的共同序列设计和合成，即squ 1(有义引物)(SEQ ID NO4)，squ4(反义引物)(SEQ ID NO5)和squ 5(反义引物)(SEQ ID NO6)(序列中“n”意思为核苷酸a、c、g或t，“r”意指核苷酸a或g，“y”意指核苷酸c或t。
通过使用ext.(Takara Shuzo)作为DNA聚合酶和在实施例1中获得的cDNA文库作为模板在如下条件下进行PCR反应95℃30秒、45℃30秒和72℃15秒，共进行25个循环，然后对该反应混合物进行琼脂糖凝胶电泳。具有所需长度的各个PCR带从PCR反应混合物中回收，其中分别使用squ 1和squ 4、和squ l和squ 5的组合，并用QIAquick(QIAGEN)根据生产商提供的方法进行纯化，然后与pMOSBlue-T-载体(Amersham)连接。感受态大肠杆菌DH5α转化后，选择了6个白色的菌落，并用自动DNA分离系统分离质粒。测序结果发现3个克隆具有其推定的氨基酸序列与已知的鲨烯合酶基因相似的序列。这些分离的cDNA克隆被命名为pSQS1007(它使用squ 1和squ 5从PCR反应中获得)和pSQS1006(它使用squ 1和squ 4从PCR反应中获得)，且pSQS1006被用于进一步的筛选研究。
实施例3从P.rhodozyma分离基因组DNA为了从P.rhodozyma分离基因组DNA，根据生产商指定的方法使用QIAGEN基因组试剂盒。
来自YPD培养基中的100ml过夜培养物的P.rhodozyma ATCC96594细胞通过离心(1500xg进行10分钟)收集，并用TE缓冲液(含有1mM EDTA的10mM Tris/HCl(pH8.0))洗涤一次。悬浮于8ml的QIAGEN基因组试剂盒的Y1缓冲液中后，溶细胞酶(lyticase)(SIGMA.St.Louis，U.S.A.)以2mg/ml的浓度加入，以便通过酶降解破坏细胞，所述反应混合物在30℃保温培养90分钟，然后进行下一提取步骤。最后获得20μg基因组DNA。
实施例4使用pSQS1006作为探针进行Southern印迹杂交进行Southern印迹杂交以克隆含有来自P.rhodozyma的SQS基因的基因组片段。用EcoRI消化2μg的基因组DNA，所述DNA经过琼脂糖凝胶电泳后用酸和碱处理。通过使用transblot(Joto Rika，Tokyo，Japan)将变性的DNA转移到尼龙膜上(Hybond N+，Amersham)并放置1小时。被转移到尼龙薄膜上的DNA通过加热处理固定(80℃，90分钟)。用DIG多重引物(multipriming)方法(Boehringer Mannheim)标记模板DNA(EcoRI-消化的pSQS1006)来制备探针。用生产商指定的方法进行杂交。结果，在9.0-23.0千碱基(kb)的范围内可见杂交带。
实施例5含有SQS基因的基因组片段的克隆4μg的基因组DNA用EcoRI消化，并进行琼脂糖凝胶电泳。然后，根据生产商指定的方法使用QIAEX II凝胶提取试剂盒(QIAGEN)回收长度在9.0-20.0kb范围内的DNA。在16℃，将纯化的DNA与用0.5μg EcoRI-消化并用CIAP(牛小肠碱性磷酸酶)处理的λDASH II(Stratagene)连接、过夜，并用Gigapack III金包装提取物(Stratagene)包装。该包装的提取物被感染到大肠杆菌MRA(P2)菌株，用倾注到LB琼脂培养基上的NZY培养基覆盖。使用EcoRI-消化的pSOS1006作为模板筛选出约5000个空斑。5个空斑与标记的探针杂交。
这种含有推定的来自P.rhodozyma的SQS基因的λDASH II衍生物通过使用Wizard Iambda preps DNA纯化系统(Promega)制备。然后，使用这些λDASH II衍生物做模板和两种引物squ 9和squ 10作为引物进行PCR。这些squ 9和squ 10引物基于pSQS1006的内部序列squ 9(有义引物)(SEQ IDNO7)和squ 10(反义引物)(SEQ ID NO8)来设计。
作为在实施例2所述PCR条件下进行的PCR的结果，产生了预期的0.5kb的带。这表明所有那些λDASH II衍生物可含有推定的来自P.rhodozyma的SQS基因。这些λDASH II衍生物之一中约20kb的EcoRI插入片段用QIAEX II(QIAGEN)纯化，并用DH5α作为宿主菌株将所述片段亚克隆进入pBluescriptII KS-载体(Stratagene)，严生pSQ1229。
实施例6含有SQS基因的基因组片段的测序通过使用AutoRead测序试剂盒(Pharmacia)用引物步长方法(primerwalking procedure)测定pSQS1229序列。
测序的结果为，测定了包含基因组片段的4807个碱基对的核苷酸序列(SEQ ID NO1)，所述序列含有来自P.rhodozyma的SQS基因，并具有所述基因的启动子(1549bp)和终止子(836bp)。
编码区为2422个碱基对长，由9个外显子和8个内含子组成。内含子分散在整个的编码区，不偏向于5’或3’。用GENETYX-SV/RC软件(SoftwareDevelopment Co.，Ltd.，Tokyo，Japan)进行同源性搜索的发现，可读框(SEQID NO2)由512个氨基酸(SEQ ID NO3)组成，所述氨基酸序列与已知的来自其它种类的鲨烯合酶的氨基酸序列显著相似(与来自粟酒裂殖酵母的鲨烯合酶有51.3％的同一性)。
实施例7为SQS基因构建反义质粒覆盖SQS基因的全部结构基因的反义基因片段使用PCR方法扩增，然后克隆进入整合载体，其中反义SQS基因在P.rhodozyma中通过其自身的SQS启动子而被转录。
这种引物包括限制性内切酶的不对称识别序列SfiI(GGCCNNNNNGGCC)，但是它们的不对称突出(hang-over)序列被设计为不同的。这使得能够定向克隆入表达载体，所述载体在它们的连接序列中具有相同的不对称序列。这种构建物的使用在EP 1,158,051中有举例说明。
对于能够驱动反义SQS基因的转录的启动子和终止子片段，使用SEQID NO1中列出的序列信息从染色体中克隆SQS基因启动子和终止子。
接着，通过将含有pG418Sa330(EP 1,035,206)的G418抗性盒的SQS终止子的DNA片段与适当的载体例如pBluescriptII KS-(Stratagene)连接，使SQS终止子片段与G418抗性盒融合。
然后，含有核糖体DNA(rDNA)基因座(Wery等，Gene，184，89-97，1997)的3.1kb的SacI片段被插入这样制备的质粒的G418盒下游。rDNA片段存在于真核生物细胞的染色体的多拷贝中。通过rDNA片段的整合载体事件将导致在所用宿主染色体中的多拷贝整合，且这能够使存在于该表达载体中的外源基因过量表达。
随后，SQS启动子被插入SQS终止子的上游以构建在P.rhodozyma中发挥功能的表达载体。
最后，通过将含有反义SQS的1.5kb SfiI片段插入这样制备的表达载体中来完成反义SQS的构建，所述表达载体可在P.rhodozyma中发挥功能。相似的质粒构建体在EP 1,158,051中举例说明。
实施例8利用SQS-反义载体转化P.rhodozyma依照EP 1,158,051中描述的方案，通过基因枪(bliolistic)转化，将这样制备的SQS-反义载体转化进入P.rhodozyma野生型菌株ATCC96594。
实施例9P.rhodozyma的反义SQS重组体的表征在20℃，通过使用它们的种子培养物，P.rhodozyma的反义SQS重组体ATCC96594在500ml锥型瓶中的50ml YPD培养基中培养3天，该种子培养物在试管中(直径21mm)的10ml YPD培养基中、于20℃生长3天。为了分析产生的类胡萝卜素，回收适当体积的培养液，用于分析生长以及类胡萝卜素特别是虾青素的生产力。为了分析生长，将培养液在100℃微量离心一天，然后对1ml培养液中的细胞进行干燥，从而测定其干细胞质量，除此以外还使用UV-1200光度计(Shimadzu Corp.，Kyoto，Japan)测定在660nm的光密度。
为了分析虾青素和类胡萝卜素的总含量，细胞通过对1.0ml的培养液进行显微离心来收集，并用玻璃珠破坏P.rhodozyma细胞以提取类胡萝卜素。提取后，通过离心除去破坏的细胞，用HPLC分析所得物质的类胡萝卜素含量。使用的HPLC的条件如下HPLC柱；Chrompack Lichrosorbsi-60(4.6mm，250mm)；温度；室温；洗脱液；丙酮/己烷(18/82)向洗脱液中加入1ml/L的水；注射体积；10μl；流速；2.0ml/分钟；检测；UV，450nm。
参考样品可从Hoffmann La-Roche(Basel，Switzerland)(特别是虾青素)或其它供应商(WAKO，SIGMA等)获得。
序列表<110>罗奇维生素股份公司(Roche Vitamins AG)<120>SQS基因<130>NDR5218<140>PCT/EP03/10573<141>2003-09-23<150>EP 02021619.8<151>2002-09-27<160>8<170>PatentIn version 3.2<210>1<211>4807<212>DNA<213>Phaffia rhodozyma<220>
<221>5′UTR<222>(1469)..(1470)<220>
<221>外显子<222>(1550)..(1577)<220>
<221>内含子<222>(1578)..(1752)<220>
<221>外显子<222>(1755)..(1766)<220>
<221>内含子<222>(1767)..(1882)<220>
<221>外显子<222>(1883)..(2071)<220>
<221>内含子<222>(2072)..(2182)<220>
<221>外显子<222>(2183)..(2395)<220>
<221>内含子<222>(2398)..(2474)<220>
<221>外显子<222>(2476)..(3087)<220>
<221>内含子<222>(3088)..(3230)<220>
<221>外显子<222>(3231)..(3356)<220>
<221>内含子<222>(3357)..(3453)
<220>
<221>外显子<222>(3454)..(3474)<220>
<221>内含子<222>(3476)..(3564)<220>
<221>外显子<222>(3567)..(3881)<220>
<221>内含子<222>(3882)..(3958)<220>
<221>外显子<222>(3959)..(3970)<220>
<221>聚A_位点<222>(4106)..(4107)<400>1gttcctgttc agtcaaagag tgggaaaaac atgaaagtaa aaagatgtaa tgaaagaagg 60ggtcagaaca tcggagatac aatggcccat agaggaagga aagctactta ccagaaacca120gtgaggtttg cctaggaagt aatcccttcg tttctcaaag atatcttttt tgaaagcatc180gatgaacgac atgtcgaacc catctccatc ctcgaaatca agtttactcg atttagacct240ttccagcttt tctgctctct ccagtttcgc agctttctct tcgggaagaa gctctccgcc300agtcgatgtt ctgtcgacag gagaccagta gaaggcggaa ccgacaattt tggatggatc360ggaggacagg gtggctttaa caaatcggta gtacggagga tcgaacggcg cttctctcgt420tcgaaggttg actcctcttg ctatgtgtat gagagcatat ccgttgatgt ctcagttaaa480atttcctttt ctttctaccc ggagagtaag acacacaaag aatcacgaag aatatgatga540ctgaccgatc cgaatatcta gcgcaggttg cttctctact ggttccattc ttcgaacgat600aggttcatgt ttgaaagcat tgatcctagt tgcctctatc tgaggccagt ctgccaatgt660agcaggctca atgatcactt ggggtttgtg catcttgatg ttcaaccaag tgtcgcaacg720gtcgagattc ttttttcttc ttttggtcga gaaaaaaaaa cggcttcgct tcgcacgcgc780gcgggggatc acccgcatat taagcggtat gacgctcatc aaccggccaa gtgttcttca840tcataggtga aggttaaaac ggaatggata ggaggagcta accacgtttt tattttaatt900
cgacttgggc agcctcgtcc atagtgtctg atggttatat cgtcatagaa aggcagcgcc 960tggcgggttc gtcatggccg tgatcatctg ctttgttaga cattgtccat cagtcacctc1020aatgacagtt tcccgacgcc atcactaaga cacaaacgta tccagcacgc catgtccatc1080actgaagaag gtagggtctc gtcgagccag tgcaaccaga gttacagatg aacatcaggc1140cttgatcaga cccgacttat gaatatggcc gttattgtac acttcttggt gctcctcgag1200ctgctctttc gtgtttttca ctttctttcc ggatcaaacg agactgctcg tgtatctatc1260tgtgcttgcc atatgagcat cccatgcctc tgctcaaatg atgctggagc tacgatccat1320cagagacgac acaaaacggg gttgtatgaa ctctacattt cctaatgtta ttggaatttt1380ctgtaatgcg ttcttcatct ttctctaatg cttttttgta gtccgtcttt tcaaccttgc1440cagcgtttcg cgtgtcttct ttctcctttg acggtcatca ctttcttctc tcttctcgtt1500ctttcttccg tccttccttc tctctcttcg tctgaacatc agcatcatc atg ggc ata1558Met Gly Ile1tca gat tac ctc gtt ctg g gtcagttctg tcttttgttt gattcttatc 1607Ser Asp Tyr Leu Val Leu5ttcttgccgg cggtcgcctg tcttgggtat atcatcagca atgagaaaca tgatgttccc1667cccgcgtcaa tcactgacct tttggtcctc tacttctttc ctgtcgaatt gatcctgatt1727gatacgtgtg ccggctgctt aacag ct ttc acg cat cct gtaggtgttt1776Ala Phe Thr His Protatcgtatgc ttcatgttga tgtttagtca cgcggactga cctggccggt tgattttctg1836tatgatcgct tgtgctaccg tctttcttgg aaatccttcc catcag gcc gat ctg 1891Ala Asp Leu15cga gct tta atg cag tac gcg atc tgg cat gag cct cga agg aat atc 1939
Arg Ala Leu Met Gln Tyr Ala Ile Trp His Glu Pro Arg Arg Asn Ile20 25 30act gca cag gag gaa cat gca aca tcc ggt tgg gac cga gaa act atg1987Thr Ala Gln Glu Glu His Ala Thr Ser Gly Trp Asp Arg Glu Thr Met35 40 45aag gaa tgt tgg aag tat ttg gat ctg act tca aga agt ttc gca gct2035Lys Glu Cys Trp Lys Tyr Leu Asp Leu Thr Ser Arg Ser Phe Ala Ala50 55 60 65gtc atc aaa gag ttg gac gga gat ctt acc cga gtc gtacgtgttt 2081Val Ile Lys Glu Leu Asp Gly Asp Leu Thr Arg Val70 75tcatcttctc tctcctttga gatctggtcg cctccgcatt ttcttgttgc agaagggtca 2141gaagctgaca acaccatctc tactgttcgg gacacggcta g atc tgt tta ttc tat 2197Ile Cys Leu Phe Tyr80ctc gct ctt cga gga ctg gat acc att gag gat gac atg agt cta tct2245Leu Ala Leu Arg Gly Leu Asp Thr Ile Glu Asp Asp Met Ser Leu Ser85 90 95aat gat gtg aag ctt ccc ctg ctt cgg aca ttc tgg gaa aag ctt gac2293Asn Asp Val Lys Leu Pro Leu Leu Arg Thr Phe Trp Glu Lys Leu Asp100 105 110tcc cct ggg t ggacc ttt act gga tcc ggt cca aat gag aag gat aga2341Ser Pro Gly Trp Thr Phe Thr Gly Ser Gly Pro Asn Glu Lys Asp Arg115 120 125 130gag ctt ctt gtt cac ttc gat gtg gcc atc gcc gag ttt gcc aac ttg2389Glu Leu Leu Val His Phe Asp Val Ala Ile Ala Glu Phe Ala Asn Leu135 140 145gac gtc aa gtgagtttcc ctttat ggtt ggatcatccg ctcgacagac 2437Asp Val Asntcgaaacgct catcactttg gtctgcttga tgaacag c tct cgg aac gtc att 2490Ser Arg Asn Val Ile150
cga gac atc act cgc aag atg ggt aac ggt atg gcc gac ttt gct tct2538Arg Asp Ile Thr Arg Lys Met Gly Asn Gly Met Ala Asp Phe Ala Ser155 160 165 170ctc tct acg ccc tcc aag cct gtg gcc gag gtc cag tcg acc gaa gat2586Leu Ser Thr Pro Ser Lys Pro Val Ala Glu Val Gln Ser Thr Glu Asp175 180 185ttc aac cta tac tgt cat tac gtc gct gga ctc gtc ggc gag gga ctc2634Phe Asn Leu Tyr Cys His Tyr Val Ala Gly Leu Val Gly Glu Gly Leu190 195 200tcc cga ctc ttt gtc gcg acc gag aag gaa cga cca ttc ttg gcc aac2682Ser Arg Leu Phe Val Ala Thr Glu Lys Glu Arg Pro Phe Leu Ala Asn205 210 215cag atg gta ctt tca aac tcg ttc gga ctc ctt ctc caa aag aca aac2730Gln Met Val Leu Ser Asn Ser Phe Gly Leu Leu Leu Gln Lys Thr Asn220 225 230atc ctt cga gat att cgg gag gac gcc gac gaa ggt cgt ggc ttc tgg2778Ile Leu Arg Asp Ile Arg Glu Asp Ala Asp Glu Gly Arg Gly Phe Trp235 240 245 250cca aga gag atc tgg gcc aac ccg atc tat act gcg cat gca ccg ggc2826Pro Arg Glu Ile Trp Ala Asn Pro Ile Tyr Thr Ala His Ala Pro Gly255 260 265aca agg ttt aac tcg ttg act gac ctg gtc aag aaa gaa aac atc gac2874Thr Arg Phe Asn Ser Leu Thr Asp Leu Val Lys Lys Glu Asn Ile Asp270 275 280aaa gga tca atg tgg gtg ttg agt gcg atg aca ctc gac gcg atc acc2922Lys Gly Ser Met Trp Val Leu Ser Ala Met Thr Leu Asp Ala Ile Thr285 290 295cat act acc gac gca ctg gac tac ctc tca ctt cta aag aac cag agt2970His Thr Thr Asp Ala Leu Asp Tyr Leu Ser Leu Leu Lys Asn Gln Ser300 305 310gtt ttc aac ttt tgt gct atc ccg gct gtc atg tcg att gca acg ttg3018Val Phe Asn Phe Cys Ala Ile Pro Ala Val Met Ser Ile Ala Thr Leu315 320 325 330
gag cta tgc ttc atg aac cca gcg gtg ttc caa cga aac ata aaa atc3066Glu Leu Cys Phe Met Asn Pro Ala Val Phe Gln Arg Asn Ile Lys Ile335 340 345aga aag gga gaa gcc gtc gag gtgcgttcgc gcgttctgtt tctacctttc 3117Arg Lys Gly Glu Ala Val Glu350ataacattgg aggttcttga ctcttaagcg tcttccaatc tgatgcctcc aattatcatc 3177atttttgtct tttttgcttt cctcttgttt cttttcggcg tgattcaatc cag ctc 3233Leuatt atg aag tgc aac aac cct cgg gag gtg gca tac atg ttt aga gat3281Ile Met Lys Cys Asn Asn Pro Arg Glu Val Ala Tyr Met Phe Arg Asp355 360 365 370tat gct cga aag att cat gcc aag gct att cct aca gat cct aac ttc3329Tyr Ala Arg Lys Ile His Ala Lys Ala Ile Pro Thr Asp Pro Asn Phe375 380 385atc aag ttg agc gtt gcg tgt ggt cga gtgagttgat cgatcgatcc 3376Ile Lys Leu Ser Val Ala Cys Gly Arg390 395atcttttgtt ttgatcatcg cgagacttga ctgatcgatt actcaaaaca tcatcgcttc 3436tccttcttgc tctctag atc gaa caa tgg gct gag cac t gtat gttcct 3485Ile Glu Gln Trp Ala Glu His400ccgcccctcc ttcaagtttc ctctcgcttc atctttgttg agaagaggga tctgatgtat 3545ctttctttgt tcggatcag ac tac ccc tca ttt atg atg att cgg cct tcg3596Tyr Tyr Pro Ser Phe Met Met Ile Arg Pro Ser405 410aat gac cct caa aac ccc gca ccc tca acg gcg ctt gac cct ttc tca3644Asn Asp Pro Gln Asn Pro Ala Pro Ser Thr Ala Leu Asp Pro Phe Ser415 420 425gga gac gct cgt tta agg ata gcc tct aag aag gct gag atc acc gcc3692
Gly Asp Ala Arg Leu Arg Ile Ala Ser Lys Lys Ala Glu Ile Thr Ala430 435 440 445gct gct ctt gtc agg aag aaa gcc cgg gat cac gct aag tgg aga gag3740Ala Ala Leu Val Arg Lys Lys Ala Arg Asp His Ala Lys Trp Arg Glu450 455 460tcc aag gga ttg cct ccg agc gat ccg aac aag ccg gac aac tcg gag3788Ser Lys Gly Leu Pro Pro Ser Asp Pro Asn Lys Pro Asp Asn Ser Glu465 470 475gat gtt aat tgg gta ttg atc ggc ggt atg atc gtt gga ttg ttg ctc3836Asp Val Asn Trp Val Leu Ile Gly Gly Met Ile Val Gly Leu Leu Leu480 485 490gtg atg ggc gtg ctc ggt ttg gct atc gct tgg gtt gtt ctt cag3881Val Met Gly Val Leu Gly Leu Ala Ile Ala Trp Val Val Leu Gln495 500 505gtgcgttctt ccaaagagcc tttctctcat gaacacgcac ataggttgat ctaattctat 3941cttactctgt catacag ttt gag caa taa tctcaagatt ctagtccatc 3990Phe Glu Gln510ctttcgctca acgatctgct tcttctcctt ctccttctcc gtcttctctg gtttcttttc 4050ttactttctg ggatcttcct tcttgaatcc tccgatccaa tgtaatctgc ataccctcgc 4110tttagtagaa accgatcctt cattcgatct tggcgaaaat ctaagcaaag agaatcactt 4170ttgtctaata aaatttcctt taaagagtcg gctttttctt gtggcgaagc ttcatcccgt 4230cttcctctgg accatctctt ctcaatattc tttgtgctac tatatgatca agttctttga 4290aatcaaagaa gaacatgtat ttgattttga ggttccaaga atacaaccgg cccaagtcgt 4350tcttcgcagt tttcatcaga cagcacatat ctctcctcct ctctatagaa gccgtatggg 4410gccaatcgac tctcatgggt agaccgtgcc cttttgacac ggggagaaag agaacgaaag 4470gacacttgac cgattcgtta ataaagccgt ccccaccttt tctttaatgg caattcaaga 4530agagaaaaac aacccctgcg cgcactcgag tagtcgatca gaccttccga acgacagata 4590
tcatttgctg aaatcgaccg gattttaaag ctgctgccag gtcggtgaat ccccctaggt4650gatctccttg tacaaagatg ttgggcacgg acttttcgac ccggatgaga acgtcgtgaa4710gagtttgaaa aagattatca acataatgtg tctttttttc ttttttcttt cgtaactctc4770tagagaacga ggagacgtac ggtctgattt gttatcg 4807<210>2<211>1536<212>DNA<213>Phaffia rhodozyma<220>
<221>CDS<222>(1)..(1536)<400>2atg ggc ata tca gat tac ctc gtt ctg gct ttc acg cat cct gcc gat 48Met Gly Ile Ser Asp Tyr Leu Val Leu Ala Phe Thr His Pro Ala Asp1 5 10 15ctg cga gct tta atg cag tac gcg atc tgg cat gag cct cga agg aat 96Leu Arg Ala Leu Met Gln Tyr Ala Ile Trp His Glu Pro Arg Arg Asn20 25 30atc act gca cag gag gaa cat gca aca tcc ggt tgg gac cga gaa act 144Ile Thr Ala Gln Glu Glu His Ala Thr Ser Gly Trp Asp Arg Glu Thr35 40 45atg aag gaa tgt tgg aag tat ttg gat ctg act tca aga agt ttc gca 192Met Lys Glu Cys Trp Lys Tyr Leu Asp Leu Thr Ser Arg Ser Phe Ala50 55 60gct gtc atc aaa gag ttg gac gga gat ctt acc cga gtc atc tgt tta 240Ala Val Ile Lys Glu Leu Asp Gly Asp Leu Thr Arg Val Ile Cys Leu65 70 75 80ttc tat ctc gct ctt cga gga ctg gat acc att gag gat gac atg agt 288Phe Tyr Leu Ala Leu Arg Gly Leu Asp Thr Ile Glu Asp Asp Met Ser85 90 95
cta tct aat gat gtg aag ctt ccc ctg ctt cgg aca ttc tgg gaa aag336Leu Ser Asn Asp Val Lys Leu Pro Leu Leu Arg Thr Phe Trp Glu Lys100 105 110ctt gac tcc cct ggg tgg acc ttt act gga tcc ggt cca aat gag aag384Leu Asp Ser Pro Gly Trp Thr Phe Thr Gly Ser Gly Pro Asn Glu Lys115 120 125gat aga gag ctt ctt gtt cac ttc gat gtg gcc atc gcc gag ttt gcc432Asp Arg Glu Leu Leu Val His Phe Asp Val Ala Ile Ala Glu Phe Ala130 135 140aac ttg gac gtc aac tct cgg aac gtc att cga gac atc act cgc aag480Asn Leu Asp Val Asn Ser Arg Asn Val Ile Arg Asp Ile Thr Arg Lys145 150 155 160atg ggt aac ggt atg gcc gac ttt gct tct ctc tct acg ccc tcc aag528Met Gly Asn Gly Met Ala Asp Phe Ala Ser Leu Ser Thr Pro Ser Lys165 170 175cct gtg gcc gag gtc cag tcg acc gaa gat ttc aac cta tac tgt cat576Pro Val Ala Glu Val Gln Ser Thr Glu Asp Phe Asn Leu Tyr Cys His180 185 190tac gtc gct gga ctc gtc ggc gag gga ctc tcc cga ctc ttt gtc gcg624Tyr Val Ala Gly Leu Val Gly Glu Gly Leu Ser Arg Leu Phe Val Ala195 200 205acc gag aag gaa cga cca ttc ttg gcc aac cag atg gta ctt tca aac672Thr Glu Lys Glu Arg Pro Phe Leu Ala Asn Gln Met Val Leu Ser Asn210 215 220tcg ttc gga ctc ctt ctc caa aag aca aac atc ctt cga gat att cgg720Ser Phe Gly Leu Leu Leu Gln Lys Thr Asn Ile Leu Arg Asp Ile Arg225 230 235 240gag gac gcc gac gaa ggt cgt ggc ttc tgg cca aga gag atc tgg gcc768Glu Asp Ala Asp Glu Gly Arg Gly Phe Trp Pro Arg Glu Ile Trp Ala245 250 255aac ccg atc tat act gcg cat gca ccg ggc aca agg ttt aac tcg ttg816Asn Pro Ile Tyr Thr Ala His Ala Pro Gly Thr Arg Phe Asn Ser Leu260 265 270
act gac ctg gtc aag aaa gaa aac atc gac aaa gga tca atg tgg gtg 864Thr Asp Leu Val Lys Lys Glu Asn Ile Asp Lys Gly Ser Met Trp Val275 280 285ttg agt gcg atg aca ctc gac gcg atc acc cat act acc gac gca ctg 912Leu Ser Ala Met Thr Leu Asp Ala Ile Thr His Thr Thr Asp Ala Leu290 295 300gac tac ctc tca ctt cta aag aac cag agt gtt ttc aac ttt tgt gct 960Asp Tyr Leu Ser Leu Leu Lys Asn Gln Ser Val Phe Asn Phe Cys Ala305 310 315 320atc ccg gct gtc atg tcg att gca acg ttg gag cta tgc ttc atg aac1008Ile Pro Ala Val Met Ser Ile Ala Thr Leu Glu Leu Cys Phe Met Asn325 330 335cca gcg gtg ttc caa cga aac ata aaa atc aga aag gga gaa gcc gtc1056Pro Ala Val Phe Gln Arg Asn Ile Lys Ile Arg Lys Gly Glu Ala Val340 345 350gag ctc att atg aag tgc aac aac cct cgg gag gtg gca tac atg ttt1104Glu Leu Ile Met Lys Cys Asn Asn Pro Arg Glu Val Ala Tyr Met Phe355 360 365aga gat tat gct cga aag att cat gcc aag gct att cct aca gat cct1152Arg Asp Tyr Ala Arg Lys Ile His Ala Lys Ala Ile Pro Thr Asp Pro370 375 380aac ttc atc aag ttg agc gtt gcg tgt ggt cga atc gaa caa tgg gct1200Asn Phe Ile Lys Leu Ser Val Ala Cys Gly Arg Ile Glu Gln Trp Ala385 390 395 400gag cac tac tac ccc tca ttt atg atg att cgg cct tcg aat gac cct1248Glu His Tyr Tyr Pro Ser Phe Met Met Ile Arg Pro Ser Asn Asp Pro405 410 415caa aac ccc gca ccc tca acg gcg ctt gac cct ttc tca gga gac gct1296Gln Asn Pro Ala Pro Ser Thr Ala Leu Asp Pro Phe Ser Gly Asp Ala420 425 430cgt tta agg ata gcc tct aag aag gct gag atc acc gcc gct gct ctt1344Arg Leu Arg Ile Ala Ser Lys Lys Ala Glu Ile Thr Ala Ala Ala Leu435 440 445
gtc agg aag aaa gcc cgg gat cac gct aag tgg aga gag tcc aag gga1392Val Arg Lys Lys Ala Arg Asp His Ala Lys Trp Arg Glu Ser Lys Gly450 455 460ttg cct ccg agc gat ccg aac aag ccg gac aac tcg gag gat gtt aat1440Leu Pro Pro Ser Asp Pro Asn Lys Pro Asp Asn Ser Glu Asp Val Asn465 470 475 480tgg gta ttg atc ggc ggt atg atc gtt gga ttg ttg ctc gtg atg ggc1488Trp Val Leu Ile Gly Gly Met Ile Val Gly Leu Leu Leu Val Met Gly485 490 495gtg ctc ggt ttg gct atc gct tgg gtt gtt ctt cag ttt gag caa taa1536Val Leu Gly Leu Ala Ile Ala Trp Val Val Leu Gln Phe Glu Gln500 505 510<210>3<211>511<212>PRT<213>Phaffia rhodozyma<400>3Met Gly Ile Ser Asp Tyr Leu Val Leu Ala Phe Thr His Pro Ala Asp1 5 10 15Leu Arg Ala Leu Met Gln Tyr Ala Ile Trp His Glu Pro Arg Arg Asn20 25 30Ile Thr Ala Gln Glu Glu His Ala Thr Ser Gly Trp Asp Arg Glu Thr35 40 45Met Lys Glu Cys Trp Lys Tyr Leu Asp Leu Thr Ser Arg Ser Phe Ala50 55 60Ala Val Ile Lys Glu Leu Asp Gly Asp Leu Thr Arg Val Ile Cys Leu65 70 75 80Phe Tyr Leu Ala Leu Arg Gly Leu Asp Thr Ile Glu Asp Asp Met Ser85 90 95
Leu Ser Asn Asp Val Lys Leu Pro Leu Leu Arg Thr Phe Trp Glu Lys100 105 110Leu Asp Ser Pro Gly Trp Thr Phe Thr Gly Ser Gly Pro Asn Glu Lys115 120 125Asp Arg Glu Leu Leu Val His Phe Asp Val Ala Ile Ala Glu Phe Ala130 135 140Asn Leu Asp Val Asn Ser Arg Asn Val Ile Arg Asp Ile Thr Arg Lys145 150 155 160Met Gly Asn Gly Met Ala Asp Phe Ala Ser Leu Ser Thr Pro Ser Lys165 170 175Pro Val Ala Glu Val Gln Ser Thr Glu Asp Phe Asn Leu Tyr Cys His180 185 190Tyr Val Ala Gly Leu Val Gly Glu Gly Leu Ser Arg Leu Phe Val Ala195 200 205Thr Glu Lys Glu Arg Pro Phe Leu Ala Asn Gln Met Val Leu Ser Asn210 215 220Ser Phe Gly Leu Leu Leu Gln Lys Thr Asn Ile Leu Arg Asp Ile Arg225 230 235 240Glu Asp Ala Asp Glu Gly Arg Gly Phe Trp Pro Arg Glu Ile Trp Ala245 250 255Asn Pro Ile Tyr Thr Ala His Ala Pro Gly Thr Arg Phe Asn Ser Leu260 265 270
Thr Asp Leu Val Lys Lys Glu Asn Ile Asp Lys Gly Ser Met Trp Val275 280 285Leu Ser Ala Met Thr Leu Asp Ala Ile Thr His Thr Thr Asp Ala Leu290 295 300Asp Tyr Leu Ser Leu Leu Lys Asn Gln Ser Val Phe Asn Phe Cys Ala305 310 315 320Ile Pro Ala Val Met Ser Ile Ala Thr Leu Glu Leu Cys Phe Met Asn325 330 335Pro Ala Val Phe Gln Arg Asn Ile Lys Ile Arg Lys Gly Glu Ala Val340 345 350Glu Leu Ile Met Lys Cys Asn Asn Pro Arg Glu Val Ala Tyr Met Phe355 360 365Arg Asp Tyr Ala Arg Lys Ile His Ala Lys Ala Ile Pro Thr Asp Pro370 375 380Asn Phe Ile Lys Leu Ser Val Ala Cys Gly Arg Ile Glu Gln Trp Ala385 390 395 400Glu His Tyr Tyr Pro Ser Phe Met Met Ile Arg Pro Ser Asn Asp Pro405 410 415Gln Asn Pro Ala Pro Ser Thr Ala Leu Asp Pro Phe Ser Gly Asp Ala420 425 430Arg Leu Arg Ile Ala Ser Lys Lys Ala Glu Ile Thr Ala Ala Ala Leu435 440 445
Val Arg Lys Lys Ala Arg Asp His Ala Lys Trp Arg Glu Ser Lys Gly450 455 460Leu Pro Pro Ser Asp Pro Asn Lys Pro Asp Asn Ser Glu Asp Val Asn465 470 475 480Trp Val Leu Ile Gly Gly Met Ile Val Gly Leu Leu Leu Val Met Gly485 490 495Val Leu Gly Leu Ala Ile Ala Trp Val Val Leu Gln Phe Glu Gln500 505 510<210>4<211>27<212>DNA<213>人工的<220>
<223>引物<220>
<221>misc_feature<222>(3)..(3)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(4)..(4)<223>y＝c或t<220>
<221>misc_feature<222>(6)..(6)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(12)..(12)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(15)..(15)<223>n＝a，c，g或t<400>4gcnytngaya cngtngarga ygayatg 27<210>5<211>26<212>DNA<213>人工的<220>
<223>引物<220>
<221>misc_feature<222>(3)..(3)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(9)..(9)
<223>n＝a，c，g或t<220>
<221>misc_feature<222>(15)..(15)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(18)..(18)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(21)..(21)<223>n＝a，c，g或t<400>5atngccatna cytgnggnat ngcrca 26<210>6<211>29<212>DNA<213>人工的<220>
<223>引物<220>
<221>misc_feature<222>(3)..(3)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(6)..(6)<223>n＝a，c，g或t<220>
<221>misc_featurc<222>(9)..(9)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(12)..(12)<223>n＝a，c，g或t<220>
<221>misc_feature<222>(15)..(15)<223>n＝a，c，g或t<400>6ccnacngtnc cngcnacrta rtgrcarta29<210>7<211>20<212>DNA<213>人工的<220>
<223>引物<400>7aatgatgtga agcttcccct 20<210>8<211>20<212>DNA<213>人工的<220>
<223>引物<400>8ccagatctct cttggccaga 20
权利要求
1.含有一或多种核酸分子的分离的多核苷酸，其中所述核酸分子选自(a)核酸分子，其编码至少SEQ ID NO3所示多肽的成熟形式；(b)核酸分子，其含有SEQ ID NO2所示的编码序列；(c)核酸分子，其核苷酸序列由于遗传密码而是(a)或(b)的核苷酸序列的简并序列；(d)编码多肽的核酸分子，所述多肽衍生自(a)到(c)之一的多核苷酸编码的多肽，所述衍生是通过取代、缺失和/或添加一个或数个氨基酸来进行的，其中所述氨基酸是(a)到(c)之一的核苷酸所编码多肽的氨基酸序列的氨基酸。(e)编码多肽的核酸分子，所述多肽衍生自与(a)或(b)的核酸分子编码的多肽的氨基酸序列具有51.3％或51.3％以上序列同一性的多肽；(f)核酸分子，该核酸分子含有(a)到(e)之一的核酸分子编码并具有鲨烯合酶活性的片段；(g)含有多核苷酸的核酸分子，所述多核苷酸具有这样的核酸分子序列，所述核酸分子序列是使用SEQ ID NO4、5和6所示的引物从Phaffia核酸文库扩增的；(h)核酸分子，其编码具有鲨烯合酶活性的多肽，其中所述多肽是(a)到(g)之一的核酸分子编码的多肽的片段；(i)核酸分子，其含有(a)到(d)之一的多核苷酸的至少15个核苷酸；(j)编码具有鲨烯合酶活性的多肽的核酸分子，其中所述多肽由抗体识别，所述抗体抗(a)到(h)之一所述核酸分子编码的多肽；(k)核酸分子，其可用具有(a)到(j)之一所述核酸分子的序列的探针在严格条件下筛选适当的文库而获得，并且该核酸分子编码具有鲨烯合酶活性的多肽；(l)核酸分子，其互补链在严格条件下与(a)到(k)之一的核酸分子杂交，并且该核酸分子编码具有鲨烯合酶活性的多肽。
2.含有一或多种核酸分子的分离的多核苷酸，其中所述核酸分子选自(m)核酸分子，其编码至少SEQ ID NO1所示多肽的成熟形式；(n)核酸分子，其核苷酸序列由于遗传密码而是(m)的核苷酸序列的简并序列；(o)编码多肽的核酸分子，所述多肽衍生自(m)或(n)的多核苷酸所编码多肽，所述衍生是通过取代、缺失和/或增加一个或数个氨基酸来进行的，其中所述氨基酸是(m)或(n)的核苷酸所编码多肽的氨基酸序列的氨基酸。(p)编码多肽核酸分子，其中所述多肽衍生自与(m)的核酸分子所编码多肽的氨基酸序列具有51.3％或51.3％以上序列同一性的多肽；(q)核酸分子，该核酸分子含有(m)到(p)之一的核酸分子编码的片段并具有鲨烯合酶活性；(r)含有多核苷酸的核酸分子，所述多核苷酸具有这样的核酸分子序列，所述序列是使用SEQ ID NO4、5和6所示引物从Phaffia核酸文库扩增的；(s)核酸分子，其编码具有鲨烯合酶活性的多肽，其中所述多肽是(m)到(r)之一的核酸序列所编码的多肽的片段；(t)核酸分子，该核酸分子含有(m)到(o)之一的多核苷酸的至少15个核苷酸；(u)编码具有鲨烯合酶活性的多肽的核酸分子，其中所述多肽由抗体识别，所述抗体抗(m)到(s)之一所述核酸分子编码的多肽；(v)核酸分子，其可用具有(m)到(u)之一所述核酸分子的序列的探针在严格条件下筛选适当的文库而获得，且该核酸分子编码具有鲨烯合酶活性的多肽；(w)核酸分子，其互补链在严格条件下与(m)到(v)之一的核酸分子杂交，并且该核酸分子编码具有鲨烯合酶活性的多肽。
3.权利要求1或2所述的分离的多核苷酸，其中所述多核苷酸编码氨基酸序列，所述氨基酸序列可由SEQ ID NO3确定或与SEQ ID NO3具有51.3％或51.3％以上的同一性。
4.权利要求1-3中任一项所述的分离的多核苷酸，其中所述多核苷酸源自Phaffia rhodozyma菌株或Xanthophylomyces dendrorhous菌株。
5.制备重组载体的方法，所述方法包括将权利要求1-4中任何一项的多核苷酸插入载体。
6.重组载体，其含有权利要求1-4中任何一项的多核苷酸或由权利要求5的方法产生。
7.权利要求6的载体，其中权利要求1-4中任何一项的多核苷酸可操作地连接于表达控制序列，所述表达控制序列允许在原核或真核细胞中的表达。
8.制备重组有机体的方法，所述方法包括将权利要求6或7的载体导入宿主有机体。
9.权利要求8所述的方法，其中所述宿主有机体选自大肠杆菌、杆状病毒或酿酒酵母。
10.重组有机体，其含有权利要求6或7的载体或由权利要求8或9的方法制备。
11.制备具有鲨烯合酶活性的多肽的方法，所述方法包括培养权利要求10的重组有机体，并从该重组有机体的培养物回收所述多肽。
12.多肽，其可通过权利要求11的方法获得。
13.抗体，其与权利要求12的多肽特异性结合。
14.反义多核苷酸，其为权利要求1-4中任何一项所述多核苷酸的反义多核苷酸。
15.制备重组载体的方法，所述方法包括将权利要求14的多核苷酸插入载体。
16.重组载体，其含有权利要求14的多核苷酸或用权利要求15的方法制备。
17.权利要求16的载体，其中权利要求14的多核苷酸可操作地连接于表达控制序列，所述表达控制序列允许在原核或真核细胞中的表达。
18.制备重组有机体的方法，所述方法包括将权利要求16或17的载体导入宿主有机体。
19.权利要求18的方法，其中所述宿主有机体属于Phaffia rhodozyma菌株或Xanthophylomyces dendrorhous菌株。
20.重组有机体，其含有权利要求16或17的载体或用权利要求18或19的方法制备。
21.权利要求20所述的重组有机体，其中所述有机体的特征为，其鲨烯合酶的基因表达低于所述宿主有机体，因此其能够产生相对于宿主有机体而言较高水平的类胡萝卜素。
22.根据权利要求21的重组有机体，其中鲨烯合酶的基因表达用选自下组的技术降低反义技术、定点诱变、易错聚合酶链反应、或化学诱变。
23.生产类胡萝卜素的方法，所述方法包括培养权利要求21的重组有机体。
24.权利要求23的方法，其中所述类胡萝卜素是选自虾青素、β-胡萝卜素、番茄红素、玉米黄质或角黄素中的一种或多种。
25.根据权利要求23的方法，其中在权利要求21所述的重组有机体中，鲨烯合酶的基因表达用选自下组的技术降低反义技术、定点诱变、易错聚合酶链反应、或化学诱变。
26.生产类胡萝卜素的方法，所述方法通过在适当条件下培养微生物，并任选地回收产生的类胡萝卜素来进行，其中所述微生物的特征为其鲨烯合酶的基因表达用例如选自下组的技术降低反义技术、定点诱变、易错聚合酶链反应、或化学诱变。
全文摘要
本发明涉及在提高类胡萝卜素的微生物生产的方法中使用的基因。类胡萝卜素类物质虾青素分布于各种有机体诸如动物、藻类和微生物中。它对活性氧种类具有强烈的抗氧化特性。虾青素被用做着色剂，特别是用于诸如鲑鱼等的鱼类的养殖工业中，因为虾青素赋予动物与众不同的橙红色，有助于在市场上吸引消费者。
文档编号C12N9/10GK1777681SQ03822615
公开日2006年5月24日申请日期2003年9月23日优先权日2002年9月27日
发明者星野达雄, 尾岛和之, 濑户口丰申请人:Dsm Ip资产公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：星野达雄;尾岛和之;濑户口丰
技术所有人：DSMIP资产公司
我是此专利的发明人

上一篇：用于预防和治疗获得性免疫缺陷综合症的协同组合物的制作方法
上一篇：生产维生素b的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。