具有提高的脂质生产率的藻类突变体的制作方法

文档序号：15102762发布日期：2018-08-04 16:08阅读：230来源：国知局

本申请根据35U.S.C.§119(e)要求2015年11月2日提交的美国序列号62/249,834的优先权的权益，该专利的全部内容以引用的方式整体并入本文。

序列表的并入

随附序列表中的材料特此以引用的方式并入本申请。随附序列表文本文件名称为SGII1980_1WO_Sequence_Listing.txt，创建于2016年11月1日，大小为425kb。所述文件可在使用Windows OS的计算机上使用Microsoft Word进行评定。

发明背景

本发明涉及具有提高的脂质生产率的突变微生物，诸如藻类和不等鞭毛类，及其用于产生脂质的方法。

许多微生物诸如藻类、网粘菌纲(labyrinthulomycetes)(“壶菌类”)和产油酵母响应于营养胁迫诸如氮饥饿而诱导脂质生物合成。在氮缺乏条件下，此类微生物将化合物生物合成从蛋白质重定向到储存脂质，通常为三酰甘油脂质(“TAG”)。因为氮缺乏同时减少细胞生长，所以最佳脂质生物合成被限制在细胞代谢受损以致于不能维持高水平生产之前的相对较短窗口。

通过在营养素充足生长期间增加脂质生物合成来提高脂质生产率的许多尝试集中于操纵编码用于氮同化或脂质代谢的酶的基因以及编码涉及脂质储存的多肽的基因。例如，US2014/0162330公开了其中硝酸还原酶(NR)基因已通过基于RNAi的敲低来减弱的三角褐指藻(Phaeodactylum tricornutum)株系；Trentacoste等人((2013)Proc.Natl.Acad.Sci.USA 110:19748-19753)公开了用靶向Thaps3_264297基因的RNAi构建体转化的硅藻，Thaps3_264297基因被预测为参与脂质分解代谢；并且WO2011127118公开了用编码油质蛋白(脂质储存蛋白质)的基因以及用编码二酰甘油转移酶(DGAT)的基因转化衣藻属(Chlamydomonas)。虽然在每种情况下增加脂质产量基于显微镜观察或用亲脂性染料染色来确定，但是既未提供通过操纵的细胞来定量脂质产量，也未确定随时间推移的生物质和脂质生产率之间的关系。

Daboussi等人2014(Nature Comm.5:3881)报道，三角褐指藻中UGPase基因(据信提供昆布多糖(laminarin)(储存碳水化合物)合成的前体)的断裂会导致脂质积聚增加。然而，无生物化学数据表明昆布多糖含量受到影响(或甚至存在)，并且未报道脂质和生物质生产率。类似地，许多小组报道了衣藻属无淀粉突变体中脂质积聚的增加(Wang等人2009Eukaryotic Cell 8:1856-1868；Li等人2010MetabEng.12:387-391)，然而，实际测量脂质生产率的连续报道的结论是，当在光养条件下生长时，这些株系的生长受损(Siaut等人2011BMCBiotechnol.11:7；Davey等人2014Eukaryot Cell 13:392-400)。这些报道的结论是，最高脂质生产率(以TAG/升/天衡量)实际上由野生型亲本株系实现。

WO 2011/097261和US20120322157报道，当在衣藻属中过表达时，以“SN03”表示的编码抑制蛋白的基因在营养素充足条件下具有增加脂质产量的作用。然而，观察到SN03基因的过表达会导致未经鉴定的极性脂质的出现，它们是未经定量的，并且不会使三酰甘油(TAG)增加。另一种被鉴定为可能调节胁迫诱导的脂质生物合成的多肽已由Boyle等人((2012)J.Biol.Chem.287:15811-15825)进行了描述。相对于野生型细胞，在氮缺乏下，衣藻属中编码“SQUAMOUSA”结构域多肽的NRR1基因的敲除会导致脂质生物合成减少；然而，未获得表现出增加脂质产量的突变体。US 2010/0255550提出，推定的转录因子(TF1、TF2、TF3、TF4和TF5)在藻类细胞中过表达会增加脂质产量，但未公开此类株系。

WO 2015/130832和Ngan等人(Nature Plants,1:1507,2015)报道，PSR1基因(磷酸盐饥饿响应的调节子)的过表达会导致衣藻属中的细胞脂质积聚。被工程改造为过表达PSR1的细胞被公开为具有大圆形表型的细胞，该细胞经由营养素饥饿来诱导产生脂质。如电子显微镜所示和通过用亲脂性荧光团染色所测定，还观察到转化细胞相对于对照细胞具有更高量的细胞脂质。然而，既未显示出由培养物产生的以体积计的增加的脂质产量，也未显示出从其中观察到脂质积聚的培养物测定的培养物繁殖、生物质积聚或PSR1基因过表达。相反，显示出在基因表达的非选择性条件下PSR1转化的培养物的生长速率，并且在生长测定期期间既未评估PSR1基因表达水平也未评估脂质产量。

2016年7月14日提交的标题为“具有提高的脂质生产率的微生物(Microorganisms Having Increased Lipid Productivity)”的共同未决和共同拥有的美国实用新型申请号15/210,845公开了具有减弱的脂质调节基因“ZnCys-2845”表达的藻类突变体(本文称为“LION1”突变体)及其用于脂质生产的用途。

技术实现要素：

本文公开了产生比对照微生物(诸如突变体所源自的野生型微生物)更多的脂质，同时产生的生物质水平为在相同条件下培养的对照微生物产生的生物质水平的至少45％的突变微生物，该条件是对照微生物产生生物质的条件，例如就对照微生物而言氮充足或营养素充足的条件。在许多实施方案中，本文提供的突变微生物可以产生比对照微生物多至少20％的脂质，同时经历生物质积聚相对于对照微生物减少不超过20％、不超过15％、不超过10％、不超过5％或不超过3％。例如，突变微生物可以产生比对照微生物多至少20％、至少25％、至少30％、至少35％、至少40％、至少45％或至少50％的脂质，同时产生在与突变微生物相同的条件下培养的对照微生物产生生物质的至少80％、至少85％、至少90％、至少95％、至少100％或大约100％的生物质，该条件是其中对照微生物产生生物质的条件。对照微生物在一些实例中可以是野生型微生物，例如突变微生物直接或间接所源自的野生型微生物。突变微生物可以例如通过经典诱变或通过基因工程技术产生，并且可以具有基因的突变或减弱表达，所述基因是编码具有TAZ锌指结构域和/或布罗莫(Bromo)结构域的多肽的基因，和/或编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一个具有至少50％、55％、60％、65％、70％、75％、80％、85％、90％或95％的多肽的基因。

在第一方面，本文提供了产生比对照微生物所产生多至少20％的脂质，同时产生在相同条件下培养的对照微生物产生的生物质的不少于45％的生物质的突变微生物，其中该培养条件支持对照微生物产生生物质。例如，当对照微生物在与突变微生物相同的条件下培养时，本文提供的突变微生物可以产生比对照微生物所产生的脂质多至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少100％、至少105％、至少110％或至少115％的脂质，同时产生对照微生物所产生的生物质的量的至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少100％的生物质的量，该条件是其中对照微生物积聚生物质的条件。在一些实例中，本文提供的突变微生物产生比对照微生物所产生的脂质多至少20％的脂质，例如多至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少100％、至少105％、至少110％或至少115％的脂质，同时产生在相同条件下培养的对照微生物所产生的生物质的不少于45％的生物质，其中该培养条件是就对照微生物而言氮充足的，并且优选地营养素充足的，并且该培养条件支持对照微生物和突变微生物二者产生生物质。脂质可以是脂肪酸甲酯可衍生的脂质，即“FAME脂质”或“FAME”。生物质积聚可以是例如干重、无灰干重(AFDW)或总有机碳(TOC)积聚。在一些实例中，对照微生物可以是野生型微生物，例如突变微生物直接或间接所源自的野生型微生物。

提高的生产率可以是提高的平均每日生产率，其中所产生的量是多日的平均值。在一些实施方案中，在至少三天、至少五天、至少七天、至少八天、至少十天、至少十二天、至少十四天、至少十五天、至少二十天、至少二十五天、至少三十天、至少六十天或至少九十天的培养期中，突变微生物可以产生对照微生物所产生的生物质的量的至少45％、至少约50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或至少约100％的生物质的量，并且产生比在相同条件下培养的对照微生物所产生的脂质多至少约25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少100％、至少110％或至少120％的脂质，其中在培养期期间对照微生物和突变微生物二者均产生生物质。例如，突变体可以产生的脂质平均每日量比对照微生物的平均每日量多至少25％，同时产生的生物质平均每日量为对照细胞产生的每日量的至少45％持续三至九十天，诸如五至六十天、五至三十天或五至十四天的时期。在许多实施方案中，本文提供的突变微生物产生对照微生物所产生的生物质的至少70％、至少75％、至少80％、至少85％、至少90％或至少95％的生物质以及对照微生物所产生的脂质的量的至少25％、至少30％、至少35％、至少40％、至少45％、至少50％或至少55％的脂质的量持续至少三天、至少五天、至少七天、至少八天、至少十天、至少十二天、至少十四天、至少二十天、至少三十天、至少六十或至少九十天，其中突变体和对照微生物在对照微生物和突变微生物二者均积聚生物质的相同条件下培养。例如，培养条件可以是就对照微生物而言氮充足的，并且在许多实例中就对照微生物而言营养素充足的。在其中本文提供的突变微生物产生对照微生物(如，野生型微生物)的生物质的45％的生物质并且比对照微生物多至少20％的脂质的一些实施方案中，培养基包含硝酸盐作为突变体和对照微生物的生长和繁殖的基本上唯一氮源。

例如，当突变微生物和对照微生物在相同的的培养条件(其中对照微生物产生生物质)下培养时，本文提供的突变微生物可以产生比对照微生物更多的FAME可衍生的脂质(“FAME脂质”或“FAME”)，例如多至少20％的FAME脂质，同时产生对照微生物产生的生物质的不少于45％的生物质。例如，在至少三天、至少五天、至少七天、至少十天、至少十二天、至少十五天、至少二十天、至少三十天或至少六十天的培养期中，本文提供的突变体的FAME生产率(其可以是例如本文提供的突变体的平均每日FAME生产率)可以比对照或野生型微生物的FAME生产率高至少25％、至少30％、至少35％、至少40％、至少45％、至少50％或至少55％，同时平均每日生物质(如，AFDW或TOC)生产率可以是对照或野生型微生物的平均每日生物质生产率的至少45％、至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约80％、至少约85％、至少约90％、至少约95％或至少约100％，在该培养期期间突变微生物和对照微生物二者均产生生物质。在具体实施方案中，在至少十天的培养期中，本文提供的突变微生物可以产生比对照或野生型微生物多至少25％的FAME脂质，同时产生达对照微生物的生物质的至少45％的生物质，其中在至少十天培养期中的任一天，突变体产生的每日FAME量不低于对照或野生型微生物产生的每日FAME量，在此期间突变体和对照微生物二者均积聚生物质。

在一些实例中，突变体产生比对照或野生型微生物更多的脂质的培养条件可以是其中培养基中铵的浓度小于约2.5mM，例如培养基中铵的浓度可以为约2mM或小于约2mM、小于约1.5mM、小于约1mM或小于或等于约0.5mM的培养条件。在一些实例中，培养基可以不包含添加的铵或基本上不包含铵。在一些实例中，培养基可以不包含微生物的还原氮的添加源，例如不包含可以支持培养物的生长和/或繁殖的添加的铵、尿素或氨基酸。在一些实例中，培养基可以包含氮源，诸如硝酸盐。例如，硝酸盐可以以大于约1mM，或至少约2mM、至少约2.5mM、至少约3mM、至少约4mM或至少约5mM的浓度存在。在一些实例中，培养基包含硝酸盐作为培养物的生长和/或繁殖的基本上唯一氮源。例如，在一些实施方案中，当在营养素充足条件下培养时，本文公开的突变微生物可以产生比对照微生物更多的脂质，同时产生的生物质的水平为对照微生物产生的生物质的水平的至少45％，在该条件中硝酸盐是培养物的生长和繁殖的基本上唯一氮源。在许多实施方案中，培养基可以是就突变微生物所源自的物种的野生型微生物而言营养素充足的。

在分批、连续或半连续培养条件中的任一者之下，本文提供的突变微生物可以产生比对照或野生型微生物更多的脂质，例如更多的FAME脂质，同时产生对照或野生型微生物所产生的生物质的量的至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％的生物质的量。在一些实施方案中，突变微生物是突变光合微生物，诸如藻类，并且培养物暴露于光下持续培养期的至少一部分。在一些实例中，突变光合微生物产生比对照光合微生物多至少20％的脂质，同时产生达对照光合微生物的的生物质的至少45％的生物质的培养条件是光合自养条件，例如其中无机碳是微生物可用的基本上唯一碳源的条件。在一些实例中，突变微生物是突变光合微生物，诸如藻类，并且该突变体在包括昼夜循环的光合自养条件下显示出提高的生产率，其中每二十四小时循环的光周期可以介于约两小时和约二十二小时之间，例如介于约四小时和约二十小时之间，诸如每二十四小时昼夜循环介于约六和约十六小时之间，介于约八和约十八小时之间，或介于约十二和约十六小时之间。

在一些实施方案中，在至少三天、至少四天、至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二或至少十三天，例如至少五天、至少十天、至少十五天、至少二十天或至少三十天的培养期期间，本文提供的突变微生物可以产生比野生型或对照微生物所产生的脂质多至少20％的脂质，同时产生野生型或对照微生物所产生的生物质的量的至少75％的生物质的量，其中突变体和对照微生物在对照和突变微生物培养物二者均产生生物质的相同条件下培养。例如，在其中对照和突变微生物培养物二者均产生生物质的条件下，本文提供的突变体的平均每日FAME生产率可以比野生型或对照微生物多至少30％、至少35％、至少40％、至少45％、至少50％或至少55％，并且例如在其中突变体具有与对照微生物基本上相同的生物质生产率的条件下，突变体的平均每日生物质生产率(如，TOC生产率)为对照微生物的每日生物质生产率(如，TOC生产率)的至少75％、至少80％、至少85％、至少90％或至少95％。在一些实例中，突变微生物可以产生比野生型或对照微生物多至少30％、多至少35％、多至少40％、多至少45％或多至少50％的FAME脂质，同时产生在相同条件下培养的野生型微生物所产生的生物质的至少约90％或至少约95％的生物质，该条件是就野生型微生物而言营养素充足的。在其他实例中，突变微生物可以产生比野生型或对照微生物多至少50％的FAME脂质，同时产生的生物质与在所述条件下野生型或对照微生物产生生物质的相同条件下培养的野生型微生物所产生的生物质大约相等(如，在对照微生物产生的生物质的量的5％之内)。在许多实例中，培养至少三天、至少四天、至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二天或至少十三天，例如培养至少五天、至少十天、至少十五天、至少二十天或至少三十天的平均每日FAME生产率可以比野生型或对照微生物的平均每日FAME生产率大至少50％，同时突变微生物表现出与在相同条件下培养的野生型微生物大约相等的生物质生产率(如，在对照微生物的生物质生产率的量的约5％之内)，该条件是其中野生型或对照微生物产生生物质的条件。

突变微生物，诸如当突变微生物和对照微生物在相同培养条件下培养时，产生比对照微生物所产生的脂质多至少25％的脂质，同时产生对照微生物产生的生物质的不少于45％或不少于约50％的生物质的本文提供的任何突变微生物可以具有的FAME脂质(FAME)/总有机碳(TOC)比率比野生型微生物的FAME/TOC比率大至少25％。本文提供的突变微生物的FAME/TOC比率可以例如比在相同的条件下培养的对照微生物的FAME/TOC比率大至少30％、大至少40％、大至少50％、大至少60％或大至少70％，在所述条件下对照微生物和突变微生物二者均产生生物质。本文提供的突变微生物的FAME/TOC比率可以例如比在相同的条件下培养的对照微生物的FAME/TOC比率大至少25％、大至少30％、大至少35％、大至少40％、大至少45％、大至少50％、大至少55％、大至少60％、大至少65％或大至少70％，在所条件下对照微生物和突变微生物二者均产生生物质，并且所述条件是就野生型微生物而言营养素充足的。

本文提供的具有高于对照微生物的脂质生产率，同时产生对照微生物的生物质的至少45％的生物质的突变微生物可以具有减弱的编码蛋白质的基因的表达，该基因的减弱表达影响其他基因，如至少十个、至少二十个、至少三十个、至少四十个、至少五十个、至少六十个、至少七十个、至少八十个、至少九十个或至少100个另外的基因的表达。例如，在其中表达突变表型(如，提高的脂质产量)的条件下，本文提供的突变体可以具有相对于野生型微生物上调的至少十个基因和相对于野生型微生物下调的至少十个基因。在其中表达突变表型(如，相对于野生型微生物提高的脂质产量)的条件下，本文提供的突变体可以具有相对于野生型微生物上调的至少二十个、至少三十个、至少四十个、至少五十个、至少六十个、至少七十个、至少八十个、至少九十个或至少100个基因和相对于野生型微生物下调的至少二十个、至少三十个、至少四十个、至少五十个、至少六十个、至少七十个、至少八十个、至少九十个或至少100个基因。

在许多实例中，本文公开的产生比对照微生物多至少20％的脂质，同时产生达对照微生物的生物质的至少45％的生物质的突变体可以具有减弱的编码多肽的基因的表达，该多肽具有TAZ锌指结构域，如具有编码TAZ锌指结构域的氨基酸序列，该TAZ锌指结构域被表征为保守结构域cl02660或SMART结构域smart00551或属于pfamPF02135的TAZ锌指结构域。在一些实施方案中，本文提供的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽包含与SEQ ID NO:9具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。作为另外一种选择或除此之外，突变微生物，诸如本文公开的产生比对照微生物多至少20％的脂质，同时产生达对照微生物的生物质的至少45％的生物质的任何突变微生物可以具有减弱的编码多肽的基因的表达，该多肽具有布罗莫结构域，例如可以具有编码布罗莫结构域的氨基酸序列，该布罗莫结构域被表征为保守结构域cd05506或SMART结构域smart00297或属于pfam PF00439的布罗莫结构域。在一些实例中，布罗莫结构域可以包含与SEQ ID NO:10具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。

因此，本文在许多实施方案中提供了具有减弱的编码多肽的基因的表达的突变微生物，该多肽具有TAZ锌指结构域，其中该突变微生物产生比对照微生物所产生的脂质多至少20％的脂质和达对照微生物所产生的生物质的至少45％的生物质，并且在许多实施方案中产生达对照微生物所产生的生物质的至少90％的生物质，该对照微生物不具有减弱的编码具有TAZ锌指结构域的多肽的基因的表达。例如，在其中对照和突变微生物培养物二者均产生生物质的培养条件下，本文提供的具有减弱的含TAZ锌指结构域的多肽的表达的突变微生物可以产生比野生型或对照微生物所产生的脂质多至少30％、至少35％、至少40％、至少45％、至少50％或至少55％的脂质(如，FAME)，并且当突变微生物和对照微生物在相同的条件下培养时，突变体产生对照微生物所产生的生物质的至少45％、至少50％、至少60％、至少70％、至少80％、至少90％或至少95％的生物质，在所述条件下对照微生物经历TOC增加。一些实施方案中，包含TAZ锌指结构域的多肽在还可以包含布罗莫结构域。

本文还提供了具有减弱的基因表达的突变微生物，该基因编码具有布罗莫结构域的多肽，其中该突变微生物产生比对照微生物所产生的脂质多至少20％的脂质和达对照微生物的生物质的至少45％的生物质并且在许多实例中达至少90％的生物质，该对照微生物不具有减弱的编码具有布罗莫结构域的多肽的基因的表达。例如，在其中对照和突变微生物培养物二者均产生生物质的条件下，本文提供的具有减弱的含布罗莫结构域的多肽的表达的突变微生物可以产生比野生型或对照微生物所产生的脂质多至少30％、至少35％、至少40％、至少45％、至少50％或至少55％的脂质(如，FAME)，并且当突变微生物和对照微生物在相同的条件下培养时，突变体产生对照微生物所产生的生物质的至少45％、至少50％、至少60％、至少70％、至少80％、至少90％或至少95％的生物质，在所述条件下对照微生物培养物经历TOC增加。在一些实施方案中，包含布罗莫结构域的多肽还可以包含TAZ锌指结构域。

作为另外一种选择或除此之外，本文提供的产生比对照微生物多至少20％的脂质和达对照微生物的生物质的至少45％的生物质的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。编码多肽可以具有至少一个TAZ锌指结构域和/或可以具有至少一个布罗莫结构域。在示例性实施方案中，本文提供的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12中的任一者具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。

减弱的编码具有TAZ锌指结构域和/或布罗莫结构域，或与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽的基因可以是相对于野生型基因具有插入、缺失和/或一个或多个碱基变化的基因。插入、缺失或一个或多个碱基变化可以在基因的编码区、内含子、3’非翻译区或5’非翻译区中，或可以在基因的5’非翻译区的上游，例如在基因的启动子区中。作为另外一种选择或除此之外，本文提供的突变微生物可以包含反义分子或构建体、RNAi分子或构建体、作为CRISPRi系统的一部分的引导RNA(gRNA)、或用于表达引导RNA的构建体、核酶、或用于产生靶向编码多肽的基因的核酶的构建体(该多肽具有TAZ锌指结构域和/或布罗莫结构域或与任何引述序列具有至少50％同一性，其中该构建体的存在或表达使基因表达减少)。

本文提供的突变微生物可以是任何真核微生物，在一些实例中是不等鞭毛类或藻类。例如，突变微生物可以是粘菌门(Labyrinthulomycte)种，诸如例如网粘菌属(Labryinthula)、类网粘菌属(Labryinthuloides)、破囊壶菌属(Thraustochytrium)、裂殖壶菌属(Schizochytrium)、不动壶菌属(Aplanochytrium)、Aurantiochytrium、矩圆壶菌属(Oblongichytrium)、日本壶菌属(Japonochytrium)、双孔虫属(Diplophrys)或吾肯氏壶菌属(Ulkenia)的种。或者，突变微生物可以是藻类种，诸如例如属于以下属中的任一种的种：曲壳藻属(Achnanthes)、茧形藻属(Amphiprora)、双眉藻属(Amphora)、纤维藻属(Ankistrodesmus)、星胞藻属(Asteromonas)、黄金色藻属(Boekelovia)、Bolidomonas、波氏藻属(Borodinella)、气球藻属(Botrydium)、葡萄藻属(Botryococcus)、片球藻属(Bracteococcus)、角毛藻属(Chaetoceros)、四鞭藻属(Carteria)、衣藻属、绿球藻属(Chlorococcum)、绿梭藻属(Chlorogonium)、小球藻属(Chlorella)、蓝隐藻属(Chroomonas)、金球藻属(Chrysosphaera)、鳄球藻属(Cricosphaera)、隐甲藻属(Crypthecodinium)、隐藻属(Cryptomonas)、小环藻属(Cyclotella)、栅藻属(Desmodesmus)、杜氏藻属(Dunaliella)、后棘藻属(Elipsoidon)、赫氏圆石藻属(Emiliania)、独球藻属(Eremosphaera)、衣迪斯藻属(Ernodesmius)、眼虫藻属(Euglena)、真眼点藻属(Eustigmatos)、被棘藻属(Franceia)、脆杆藻属(Fragilaria)、拟脆杆藻属(Fragilaropsis)、丽丝藻属(Gloeothamnion)、红球藻属(Haematococcus)、菱板藻属(Hantzschia)、赤潮异弯藻属(Heterosigma)、膜胞藻属(Hymenomonas)、等鞭金藻属(Isochrysis)、鳞孔藻属(Lepocinclis)、微星藻属(Micractinium)、蒜头藻属(Monodus)、单针藻属(Monoraphidium)、微绿球藻属(Nannochloris)、微拟球藻属(Nannochloropsis)、舟形藻属(Navicula)、新绿藻属(Neochloris)、异鞭藻属(Nephrochloris)、肾藻属(Nephroselmis)、菱形藻属(Nitzschia)、棕鞭藻属(Ochromonas)、鞘藻属(Oedogonium)、卵囊藻属(Oocystis)、青绿藻属(Ostreococcus)、拟小球藻属(Parachlorella)、缺刻缘绿藻属(Parietochloris)、帕氏藻属(Pascheria)、巴夫藻属(Pavlova)、金藻属(Pelagomonas)、褐指藻属(Phaeodactylum)、噬菌体属(Phagus)、Picochlorum、扁藻属(Platymonas)、颗石藻属(Pleurochrysis)、肋球藻属(Pleurococcus)、原壁菌属(Prototheca)、伪小球藻属(Pseudochlorella)、伪新绿藻属(Pseudoneochloris)、伪角星鼓藻属(Pseudostaurastrum)、塔胞藻属(Pyramimonas)、桑椹藻属(Pyrobotrys)、栅列藻属(Scenedesmus)、裂衣藻属(Schizochlamydella)、骨条藻属(Skeletonema)、水绵藻属(Spyrogyra)、裂丝藻属(Stichococcus)、四球藻属(Tetrachlorella)、扁藻属(Tetraselmis)、海链藻属(Thalassiosira)、黄丝藻属(Tribonema)、无隔藻属(Vaucheria)、鲜绿球藻属(Viridiella)、魏氏藻属(Vischeria)和团藻属(Volvox)。在一些实例中，突变藻类是不等鞭毛藻类，并且可以属于硅藻(bacillariophyte)、黄绿藻(eustigmatophyte)、黄藻(xanthophyte)、褐藻(phaeophyte)、金藻(chrysophyte)或针胞藻(raphidophyte)。在一些实例中，突变藻类是硅藻，并且属于以下属，诸如但不限于茧形藻属、双眉藻属、角毛藻属、小环藻属、脆杆藻属、拟脆杆藻属、菱板藻属、舟形藻属、菱形藻属、褐指藻属、褐指藻属、骨条藻属、和海链藻属。在一些实例中，突变藻类是黄绿藻，并且属于选自以下的属：小绿藻属(Chloridella)、Chlorobptrys、椭球藻属(Ellipsoidion)、真眼点藻属、角绿藻属(Goniochloris)、Monodopsis、蒜头藻属、微拟球藻属、伪小桩藻属(Pseudocharaciopsis)、伪角星鼓藻属、伪四角藻属和魏氏藻属。在一些实例中，突变藻类细胞是微拟球藻属的种。

另一个方面是产生脂质的方法，其包括培养本文提供的突变微生物以及从微生物、培养基或它们二者分离脂质。培养基可以是就对照(如，野生型)微生物而言营养素充足的。在该方法的一些实施方案中，突变微生物可以在包含少于约5mM的铵例如少于约2.5mM的铵、少于或等于约1.5mM的铵、少于或等于约2mM的铵、少于或等于约1.5mM的铵、少于或等于约1mM的铵或少于或等于约0.5mM的铵的培养基中培养。培养基可以包含例如约0至约5mM的铵、约0至约4mM的铵、约0至约3mM的铵、约0至约2.5mM的铵、约0.1至约2.5mM的铵、约0.5至约2.5mM的铵、约0至约2mM的铵、约0.1至约2mM的铵、约0.2至约2mM的铵、约0.5至约1.5mM的铵、约0.1至约1.5mM的铵、约0.2至约1.5mM的铵、约0.5至约1.5mM的铵、约1mM至约1.5mM的铵、约0.1至约1.5mM的铵或约0.2至约1mM的铵。微生物可以在包含硝酸盐的培养基中培养，硝酸盐在一些实例中可以是培养基中的基本上唯一氮源，或可以除铵之外存在，其中铵可以以少于5mM、少于2.5mM、少于2mM、少于1.5mM或少于1mM的浓度存在。在一些实例中，突变微生物是突变藻类，并且微生物在培养期的至少一部分期间暴露于光。在一些实例中，突变微生物是突变藻类，并且微生物在光合自养条件，例如其中无机碳是培养基中的基本上唯一碳源条件下培养。所述方法还可以包括从微生物、培养基或它们二者提取脂质。

本公开的又一个方面是包含编码多肽的核酸序列的核酸分子，该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。例如，核酸分子可以与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性。

本文提供的核酸分子所编码的编码多肽可以包含编码TAZ锌指结构域的氨基酸序列，和/或可以包含编码布罗莫结构域的氨基酸序列。在许多实例中，核酸分子可以是或包括cDNA，和/或可以缺乏天然存在的基因中存在的一个或多个内含子，或者作为另外一种选择或除此之外，核酸分子可以包含天然存在的基因中不存在的一个或多个内含子。在许多实例中，核酸分子可以具有与天然存在的基因不具有100％同一性的序列。在许多实例中，核酸分子可以包含异源启动子，所述异源启动子可操作地连接至编码以下多肽的序列，该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列；和/或可以包括载体，所述载体包含编码以下多肽的序列，该多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。例如，核酸分子可以是cDNA、表达盒或载体，其包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的核酸序列。

另一个方面是设计为减弱编码含有TAZ锌指结构域和/或布罗莫结构域的多肽的基因的表达的构建体。在许多实例中，构建体可以是或包含编码CRISPR系统的引导RNA的序列、RNAi构建体、反义构建体、核酶构建体或用于同源重组的构建体，例如具有一个或多个核苷酸序列和/或该基因所源自的天然基因组中与其邻近的序列的构建体，所述一个或多个核苷酸序列与本文公开的天然存在的编码TAZ锌指结构域和/或编码布罗莫结构域的基因具有同源性。例如，构建体可以包含编码具有TAZ锌指结构域和/或布罗莫结构域的多肽的基因的至少一部分或与编码以下多肽的基因的至少一部分同源的序列：所述多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列，包括与基因的编码链或其一部分互补的核酸序列。作为另外一种选择或除此之外，构建体可以包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％至少90％或至少95％同一性的序列，或其一部分，包括与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45中的任一者的编码链互补的序列，与其中的任一者或与其中的任一者的一部分具有至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的序列。

还包括靶向编码以下多肽的基因的引导RNA，所述多肽与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性；或靶向与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的基因的引导RNA，或其一部分。在具体实施方案中，本发明提供包含以下序列的引导RNA，所述序列与SEQ ID NO:61、SEQ ID NO:68、SEQ ID NO:70和SEQ ID NO:72中的任一者的靶序列对应；并且在示例性实施方案中可以是嵌合引导，诸如SEQ ID NO:60、SEQ ID NO:67、SEQ ID NO:69和SEQ ID NO:71中的任一者。

在结合附图阅读本发明的以下具体实施方式时，本发明的这些和其他目标和特征将变得更完全地显而易见。

附图简述

图1A是示出在分批测定中在含硝酸盐的培养基上生长的野生型加的斯微拟球藻(Nannochloropsis gaditana)株系WT-3730的FAME/TOC比率以及十八个突变株系的FAME与TOC比率的图，其中每个突变株系在转录因子基因中进行敲除(具有基因断裂插入)，所述转录因子基因的基因组基因座提供于沿图x轴的每个柱之下。在所测定的十八个株系中，仅在鉴定为Naga_100104g18的基因中敲除的株系具有高于野生型的FAME/TOC比率。

图1B是加的斯微拟球藻Bromo-1091基因的示意图。方框表示TAZ锌指结构域(TAZ)和布罗莫结构域(BR)的位置。还示出了推定的核定位信号(NLS)的大致位置，以及三个富含谷氨酰胺的区域，以字母“Q”表示。箭头1-5指向由CRISPR指导序列靶向的编码区上游的位置。标记为GE-8563的箭头表示TAZ锌指结构域下游的基因区域，其中使用CRISPR/Cas9来插入潮霉素抗性标记以产生敲除株系GE-8563。还标示了确定敲低的转录物水平的qRT-PCR的引物位点。该图未按比例绘制。

图2是加的斯微拟球藻Bromo-1091基因的四种Bromo-1091转录物编码的四种Bromo-1091同种型的比对。图2A)提供了多肽的N-末端部分；图2B)提供了多肽的不变中央部分；并且C)提供了多肽的C末端区域。

图3是用于将Cas9引入加的斯微拟球藻野生型株系WT-3730以产生Cas9编辑系的载体pSGE-6206的示意图。

图4A)是描绘如从培养的奇数天(3、5和7)采集的样品所测定，以分批模式在仅硝酸盐培养基中培养的野生型和Bromo-1091敲除加的斯微拟球藻细胞的FAME生产率的图；图4B)是描绘分批生产率测定的第3至7天的TOC值的图。图4C)是描绘从培养的奇数天采集的样品计算的FAME/TOC比率的图。图中的误差棒代表三种独立培养物(生物学重复)的标准偏差。图中所用符号：星号代表在硝酸盐+铵培养基PM124中预培养的野生型WT-3730，实心菱形代表在硝酸盐+铵培养基PM124中预培养的敲除突变体GE-8563，X代表在仅硝酸盐培养基PM074中预培养的野生型WT-3730，实心圆形代表在仅硝酸盐培养基PM074中预培养的敲除突变体GE-8563。

图5提供了描绘半连续测定中加的斯微拟球藻野生型株系和GE-8563Bromo-1091敲除株系的生产率的图，其中培养基包含硝酸盐作为唯一氮源。图5A)示出了在七天测定中每日FAME生产率；图5B)示出了在相同的七天测定中每日TOC生产率；图5C)提供了相同的七天测定的FAME/TOC比率。图中的误差棒代表三种独立培养物(生物学重复)的标准偏差。图中所用符号：圆形代表野生型WT-3730，X代表敲除突变体GE-8563。

图6A)是Bromo-1091基因的示意图，其中核定位信号(NLS)、TAZ锌指结构域(TAZ)和布罗莫结构域(BR)的位置以方框示出，箭头描绘了CRISPR靶向的突变的位点，图6B)示出了对应的CRISPR靶向的突变体的相对转录物水平(图6A示出了用于转录物评估的引物的位置)，其中“BASH-1”是株系GE-13027，“BASH-4”是GE-13030，“BASH-5”是GE-13032，Bromo-1091敲除株系是GE-8563。归一化表达水平相对于设定为1.0的平均野生型水平。

图7A)是描绘以分批模式在仅硝酸盐培养基中培养的野生型和Bromo-1091敲低加的斯微拟球藻细胞的FAME生产率的图；图7B)是描绘在仅硝酸盐培养基中分批筛选的奇数天(第3、5和7天)的TOC值的图；图7C)是提供在第3、5和7天计算的培养物的FAME/TOC比率的图。图中所用符号：空心圆形代表野生型WT-3730，星号代表“BASH-1”敲低突变体GE-13027：+号代表“BASH-4”敲低突变体GE-13130；X代表“BASH-5”敲低突变体GE-13132；空心三角形代表Bromo-1091敲除突变体GE-8563。

图8A至8E提供了描绘半连续测定中加的斯微拟球藻野生型株系和Bromo-1091敲低株系的生产率的表和图，其中每日稀释所用的培养基包含硝酸盐作为唯一氮源。图8A)是在十天半连续测定的每天Bromo-1091敲低株系以及野生型株系WT-3730各自的三种培养物的平均FAME生产率的表，三种培养物平均值的标准偏差在括号中；图8B)是示出在十天的测定中平均每日FAME生产率(mg/L培养物)的图；图8C)是在十天半连续测定的每天Bromo-1091敲低株系以及野生型株系WT-3730各自的三种培养物的平均TOC生产率的表，三种培养物平均值的标准偏差在括号中；图8D)是示出在十天的测定中培养物的每日TOC生产率(以g/m²/d计)的图；图8E)是提供测定的每天的FAME/TOC比率的表；图8F)是提供在十天的测定中培养物的每日FAME/TOC比率的图。图中所用符号：圆形代表野生型WT-3730；三角形代表“BASH-1”敲低突变体GE-13127；X代表“BASH-4”敲低突变体GE-13130；菱形代表“BASH-5”敲低突变体GE-13132。图中的误差棒代表三种独立培养物(生物学重复)的标准偏差。

图9是与野生型细胞相比的Bromo敲低突变体的生物分子组成的柱状图。

图10是示出与野生型株系WT-3730(WT)相比的两种Bromo-1091敲低株系GE-13027(BASH-1)和GE-13132(BASH-5)的叶绿素含量的柱状图。

图11A至11B描绘了转录物组学“热图”，其中带(每个带代表一个基因)的黑度与基因的表达水平相关(以FPKM值评估)。图11A)描绘了在存在铵的情况下的相对转录物丰度。从左至右：Bromo 1091敲低株系GE-13032样品1，Bromo 1091敲低株系GE-13032样品2，ZnCys-2845敲除株系GE-8564样品1，ZnCys-2845敲除株系GE-8564样品2，Cas9亲本株系样品1，Cas9亲本株系样品2；图11B)描绘了在存在硝酸盐的情况下的相对转录物丰度。从左至右：Bromo 1091敲低株系GE-13032样品1，Bromo 1091敲低株系GE-13032样品2，ZnCys-2845敲除株系GE-8564样品1，ZnCys-2845敲除株系GE-8564样品2，NR敲除株系样品1，NR敲除样品2，Cas9亲本株系样品1，Cas9亲本株系样品2。

具体实施方式

定义

除非另外定义，否则在本文中使用的所有技术和科学术语均具有与本发明所属领域的一般技术人员通常理解的含义相同的含义。在发生冲突的情况下，以本申请(包括定义)为准。除非受上下文另外要求，否则单数术语应包括复数形式且复数术语应包括单数形式。除非另外具体指出，本申请中提供的所有范围包括该范围的上界和下界值。

本文所提及的所有出版物、专利和其他参考文献均以引用的方式整体并入用于所有目的，正如每个单独的出版物或专利申请被明确地和单独地指定为以引用的方式并入一样。

本文在短语中使用的术语“和/或”，如诸如“A和/或B”旨在包括“A和B”、“A或B”、“A”和“B”。

“约”意指在规定值的10％之内，或在规定值的5％之内，或在一些情况下在规定值的2.5％之内，或“约”可以意指取整到最近的有效数字。

术语“基因”广泛用于指编码多肽或表达的RNA的核酸分子(通常为DNA，但任选地为RNA)的任何区段。因此，基因包括编码表达的RNA的序列(其可以包括多肽编码序列，或例如功能性RNA诸如核糖体RNA、tRNA、反义RNA、微RNA、短发夹RNA、核酶等)。基因还可以包含其表达所需或影响其表达的调控序列，以及与其天然状态下编码蛋白质或RNA的序列相关的序列，诸如例如内含子序列、5’或3’非翻译序列等。在一些实例中，“基因”可以仅指DNA或RNA分子的编码蛋白质部分，它可以或不可以包含内含子。基因优选地长度大于50个核苷酸，更优选地长度大于100个核苷酸，并且例如长度可以介于50个核苷酸和500,000个核苷酸之间，诸如长度介于100个核苷酸和100,000个核苷酸之间或长度介于约200个核苷酸和约50,000个核苷酸之间，或长度为约200个核苷酸和约20,000个核苷酸。基因可以从许多来源获得，包括从所关注的来源克隆或从已知的或预测的序列信息合成。

术语“核酸”或“核酸分子”是指DNA或RNA(如，mRNA)区段，并且还包括具有修饰的骨架(如，肽核酸、锁核酸和其他修饰的核酸或核酸类似物(例如，Efimov和Chakhmakhcheva(2005)Methods Mol Biol.288:147-163))或修饰的或非天然存在的核碱基的核酸。核酸分子可以是双链的或单链的；包含基因或其一部分的单链核酸分子可以是编码(有义)链或非编码(反义)链。

核酸分子可以“源自”指定来源，其包括从指定来源分离(全部或部分)核酸区段。核酸分子也可以从指定来源通过例如直接克隆、PCR扩增或从指定多核苷酸来源或根据与指定多核苷酸来源相关的序列的人工合成(该来源可以是例如一类生物物种)来衍生。源自特定来源或物种的基因或核酸分子还包括具有相对于来源核酸分子的序列修饰的基因或核酸分子。例如，源自来源(如，特定参考基因)的基因或核酸分子可以包括相对于来源基因或核酸分子的非有意的或有意引入的一个或多个突变，并且如果一个或多个突变，包括取代、缺失或插入，是有意引入的，则序列改变可以通过细胞或核酸的随机或靶向突变、通过扩增或其他基因合成或分子生物学技术或通过化学合成或它们的任何组合来引入。源自编码功能性RNA或多肽的参考基因或核酸分子的基因或核酸分子可以编码与参考或来源功能性RNA或多肽具有至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％序列同一性的功能性RNA或多肽，或其功能性片段。例如，源自编码功能性RNA或多肽的参考基因或核酸分子的基因或核酸分子可以编码与参考或来源功能性RNA或多肽具有至少85％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％序列同一性的功能性RNA或多肽，或其功能性片段。

如本文所用，“分离的”核酸或蛋白质从所述核酸或蛋白质存在于自然中的天然周围环境或背景中去除。例如，分离的蛋白质或核酸分子从所述蛋白质或核酸分子在其天然或自然环境中相关的细胞或生物体去除。在一些实例中，分离的核酸或蛋白质可以是部分或基本上纯化的，但分离不需要特定的纯化水平。因此，例如，分离的核酸分子可以是已从其在自然中被整合至其中的染色体、基因组或附加体切除的核酸序列。

“纯化的”核酸分子或核苷酸序列或蛋白质或多肽序列基本上不含细胞材料和细胞组分。纯化的核酸分子或蛋白质可以例如基本上不含除缓冲剂或溶剂之外的化学品。“基本上不含”不旨在意指除新核酸分子之外的其他组分是不可检测的。

术语“天然存在的”和“野生型”是指在自然中发现的形式。例如，天然存在的或野生型核酸分子、核苷酸序列或蛋白质可以存在于天然来源中并且从所述天然来源分离，并且未通过人为操纵有意地修饰。

如本文所用，“减弱的”意指量、程度、强烈度或强度降低。减弱的基因表达可以指所讨论的基因的转录或编码蛋白质的翻译、折叠或组装的量和/或速率的显著降低。作为非限制性实例，减弱的基因可以是突变或断裂基因(例如，通过部分或全部缺失、截短、框移或插入突变而断裂的基因)，该突变或断裂基因不编码完整功能性开放阅读框或由于基因调控序列的改变或断裂而具有减少的表达。减弱的基因也可以是减少基因表达的构建体所靶向的基因，诸如例如反义RNA、微RNA、RNAi分子或核酶。减弱的基因表达可以是消除的例如减少至不显著或不可检测的量的基因表达。减弱的基因表达也可以是产生无完整功能的或无功能的RNA或蛋白质的基因表达，例如减弱的基因表达可以是产生截短的RNA和/或多肽的基因表达。

“外源核酸分子”或“外源基因”是指已经引入(“转化”)进细胞的核酸分子或基因。转化的细胞可以称为重组细胞，其中可以引入另外的外源基因。如果转化有核酸分子的细胞的子代继承了外源核酸分子，则所述子代称为“转化的”。相对于被转化的细胞，外源基因或核酸分子可以源自不同的物种(因此称为“异源”)，或源自相同的物种(因此称为“同源性”)。“内源性”核酸分子、基因或蛋白质由于其存在于宿主中或由宿主天然产生，因此是天然核酸分子、基因或蛋白质。

术语“天然”在本文中用于指在宿主中天然存在的核酸序列或氨基酸序列。术语“非天然”在本文中用于指并非在宿主中天然存在的核酸序列或氨基酸序列。因此，“非天然”核酸分子是非天然存在于宿主细胞中的核酸分子，例如非天然核酸分子对于其引入的宿主细胞或微生物是外源的，并且就宿主细胞或微生物而言可以是异源的。另外，已从细胞移除，经过实验室操纵，引入或再引入宿主细胞，使得其序列或基因组中的位置不同于其在未操纵的生物体中的位置(即，并置于或可操作地连接至非转化生物体中未并置于或可操作地连接至的序列)的核酸序列或氨基酸序列被认为是“非天然”的。非天然基因还包括可操作地连接至已重组到宿主基因组的一个或多个异源调控序列的宿主微生物内源性基因。

“重组”或“工程改造的”核酸分子是已通过人为操纵改变的核酸分子。作为非限制性实例，重组核酸分子包括经过以下操纵的任何核酸分子：1)已经例如使用化学或酶学技术(例如，使用化学核酸合成，或使用用于核酸分子的复制、聚合、消化(核酸外切或核酸内切)、连接、逆转录、转录、碱基修饰(包括例如甲基化)、整合或重组(包括同源性和位点特异性重组)的酶)部分或完全体外合成或修饰；2)包括在自然中未连接的连接核苷酸序列；3)已经使用分子克隆技术进行工程改造，使得其相对于天然存在的核酸分子序列缺乏一个或多个核苷酸；和/或4)已经使用分子克隆技术操纵，使得其相对于天然存在的核酸序列具有一个或多个序列变化或重排。作为非限制性实例，cDNA是重组DNA分子，如已通过体内聚合酶反应产生的、或接头所连接的、或已整合进载体(诸如克隆载体或表达载体)的任何核酸分子。

术语“重组蛋白质”在本文中用于指通过基因工程产生的蛋白质，而无论氨基酸是否与野生型蛋白质是否有所不同。

当应用于生物体时，术语重组、工程改造或基因工程改造是指通过将异源或外源重组核酸序列(如，非天然核酸序列)引入生物体而操纵生物体，并且包括基因敲除、靶向突变、基因替换和启动子替换、缺失、断裂或插入以及将转基因或合成基因或核酸序列引入生物体。也就是说，重组、工程改造或基因工程改造是指已通过人为干预改变的生物体。重组或基因工程改造生物体也可以是用于基因“敲低”的构建体已引入其中的生物体。此类构建体包括但不限于RNAi、微RNA、shRNA、siRNA、反义和核酶构建体。还包括基因组已通过大范围核酸酶、锌指核酸酶、TALEN或cas/CRISPR系统的活性改变的生物体。外源或重组核酸分子可以整合进重组/基因工程改造生物体的基因组，或在其他实例中可以不整合进宿主基因组。如本文所用，“重组微生物”或“重组宿主细胞”包括本发明的重组微生物的子代或衍生物。因为某些修饰可以由于突变或环境影响而在后续代中出现，所以此类子代或衍生物可能实际上与亲本细胞不相同，但仍然包括在本文所用的术语的范围内。

术语“启动子”是指能够结合细胞中的RNA聚合酶并且启动下游(3'方向)编码序列的转录的核酸序列。启动子包括在大于背景的可检测水平上启动转录所需的最小碱基或元件数量。启动子可以包括转录起始位点以及负责RNA聚合酶的结合的蛋白质结合结构域(共有序列)。真核启动子通常但不总是含有“TATA”盒和“CAT”盒。原核启动子可以含有-10和-35原核启动子共有序列。来自许多不同来源的许多启动子，包括组成型、诱导型和抑制型启动子是本领域熟知的。代表性来源包括例如藻类、病毒、哺乳动物、昆虫、植物、酵母和细菌细胞类型，并且来自这些来源的合适启动子是容易获得的，或可以根据在线公开可得的序列合成制备，或者例如来自保藏库诸如ATCC以及其他商业或个人来源。启动子可以是单向的(在一个方向启动转录)或双向的(在任一方向启动转录)。启动子可以是组成型启动子、抑制型启动子或诱导型启动子。除其中RNA聚合酶结合以启动转录的基因近端启动子之外，启动子区还可以包括可以在基因的转录起始位点的1kb、2kb、3kb、4kb、5kb或更多内的基因上游的另外的序列，其中另外的序列可以影响下游基因的转录速率，以及任选地启动子对发育、环境或生物化学(如，代谢)条件的响应性。

当结合多核苷酸、基因、核酸、多肽或酶使用时，术语“异源”是指来自除宿主生物体物种之外的来源或源自除宿主生物体物种之外的来源的多核苷酸、基因、核酸、多肽或酶。相比之下，“同源性”多核苷酸、基因、核酸、多肽或酶在本文中用于表示源自宿主生物体物种的多核苷酸、基因、核酸、多肽或酶。当提及用于维持或操纵基因序列的基因调控序列或辅助核酸序列(例如，启动子、5’非翻译区、3’非翻译区、多聚腺苷酸添加序列、内含子序列、剪接位点、核糖体结合位点、内部核糖体进入序列、基因组同源性区、重组位点等)时，“异源”意指该调控序列或辅助序列不与其中调控或辅助核酸序列在构建体、基因组、染色体或附加体中并置的基因天然缔合。因此，可操作地连接至在天然状态下(即在非基因工程改造生物体的基因组中)未可操作地连接的基因的启动子在本文中称为“异源启动子”，即使启动子可以源自与其连接的基因相同的物种(或在一些情况下相同的生物体)。

如本文所用，术语“蛋白质”或“多肽”旨在涵盖单数“多肽”以及复数“多肽”，并且是指由通过酰胺键(也称为肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或更多个氨基酸的任何一条或多条链，并且不涉及特定长度的产物。因此，肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或用于指两个或更多个氨基酸的一条或多条链的任何其他术语包括在“多肽”的定义中，并且术语“多肽”可以代替这些术语中的任一个或与其可互换地使用。

基因和蛋白质登录号，通常提供于基因或物种名之后的括号中，是可在美国国立卫生研究院(United States National Institutes of Health)维护的美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)网站(ncbi.nlm.nih.gov)公开获取的序列记录的唯一标识符。“GenInfo Identifier”(GI)序列标识号是核苷酸或氨基酸序列特异性的。如果序列发生任何变化，则会分配新的GI号。序列修订历史(Sequence Revision History)工具可用于跟踪具体GenBank记录中出现的序列的多个GI号、版本号和更新日期。根据登录号和GI号搜索和获取核酸或基因序列或蛋白质序列是例如细胞生物学、生物化学、分子生物学和分子遗传学领域熟知的。基因座标识符是指Corteggiani Carpinelli等人(2014)Mol Plant 7:323-335描述的以及可在nannochloropsis.org在线获取的公开基因组。

如本文所用，就核酸或多肽序列而言，术语“同一性百分比”或“同源性”被定义为在进行序列的最大同一性百分比比对和引入空位(如有需要)以实现最大同源性百分比之后，与已知多肽相同的候选序列中的核苷酸或氨基酸残基的百分比。对于多肽序列，N-末端或C-末端插入或缺失不应解释为影响同源性，并且内部缺失和/或小于约65个、小于约60个、小于约50个、小于约40个、小于约30个、小于约20个或小于约10个氨基酸残基插入多肽序列不应解释为影响所比较的氨基酸(蛋白质)序列的同源性。对于核酸序列，5’末端或3’末端插入或缺失不应解释为影响同源性，并且内部缺失和/或小于约200个、小于约180个、小于约150个、小于约120个、小于约100个、小于约90个、小于约80个、小于约70个、小于约60个、小于约50个、小于约40个或小于约30个核苷酸插入多肽序列不应解释为影响所比较的核酸序列的同源性。核苷酸或氨基酸序列水平上的同源性或同一性可以使用程序blastp、blastn、blastx、tblastn和tblastx所利用的算法通过BLAST(基本局部比对搜索工具，Basic Local Alignment Search Tool)分析来确定(Altschul(1997),Nucleic Acids Res.25,3389-3402和Karlin(1990),Proc.Natl.Acad.Sci.USA 87,2264-2268)，这些程序是为序列相似性搜索定制的。由BLAST程序使用的方法是首先考虑查询序列和数据库序列之间的具有或不具有空位的类似区段，然后评估被鉴定的所有匹配的统计学显著性，最后汇总只有那些满足显著性的预选阈值的匹配。对于序列数据库的相似性搜索方面的基本问题的讨论，参见Altschul(1994),Nature Genetics 6,119-129。直方图、描述、比对、期望(即，报告针对数据库序列的匹配的统计学显著性阈值)、截止值、矩阵和过滤(低复杂性)的搜索参数可以是默认设置。blastp、blastx、tblastn和tblastx使用的默认评分矩阵是BLOSUM62矩阵(Henikoff(1992),Proc.Natl.Acad.Sci.USA 89,10915-10919)，推荐用于长度超过85个(核苷酸碱基或氨基酸)的查询序列。

对于设计用于比较核苷酸序列的blastn，评分矩阵由M(即，一对匹配残基的奖分)与N(即，错配残基的罚分)的比率设定，其中M和N的默认值可以分别为+5和-4。四个blastn参数可以如下进行调整：Q＝10(空位生成罚分)；R＝10(空位延伸罚分)；wink＝1(沿着查询在每个winkth位置产生字命中)；以及gapw＝16(设置在其中产生空位比对的窗口宽度)。用于氨基酸序列比较的等效Blastp参数设置可以是：Q＝9；R＝2；wink＝1；以及gapw＝32。在GCG软件包10.0版中可用的序列之间的最佳拟合(Bestfit)比较可以使用DNA参数GAP＝50(空位生成罚分)和LEN＝3(空位延伸罚分)，并且蛋白质比较中的等效设置可以为GAP＝8和LEN＝2。

因此，当提及本发明的多肽或核酸序列时，包括与全长多肽或核酸序列，或包含整个蛋白质的至少100个、至少125个、至少150个或更多个氨基酸残基的连续序列的其片段的至少40％、至少45％、至少50％、至少55％、至少70％、至少65％、至少70％、至少75％、至少80％或至少85％的序列同一性，例如至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或约100％序列同一性；此类序列的变体，例如其中至少一个氨基酸残基插入含有插入和取代的公开序列的N-和/或C-末端和/或之内。设想的变体可以另外地或替代地包括通过例如同源重组或定点或PCR诱变而含有预先确定的突变的那些变体，以及其他物种的对应的多肽或核酸，包括但不限于本文所述的那些，含有插入和取代的多肽或核酸家族的等位基因或其他天然存在的变体；和/或其中多肽已经共价修饰的衍生物，该共价修饰使用除含有插入和取代的天然存在的氨基酸之外的部分(例如，可检测部分，诸如酶)通过取代、化学、酶学或其他适当的手段来进行。

如本文所用，短语“保守氨基酸取代”或“保守突变”是指一个氨基酸被另一个具有共同性质的氨基酸的替换。定义单个氨基酸之间的共同性质的功能方法是分析同源生物体的对应蛋白质之间的氨基酸变化的归一化频率(Schulz(1979)Principles of Protein Structure,Springer-Verlag)。根据这种分析，氨基酸组可以被定义为其中组内氨基酸优先地彼此交换，因此在其对总体蛋白质结构的影响方面彼此最相似(Schulz(1979)Principles of Protein Structure,Springer-Verlag)。以这种方式定义的氨基酸组的实例可以包括：“带电/极性组”，包括Glu、Asp、Asn、Gln、Lys、Arg和His；“芳族或环状组”，包括Pro、Phe、Tyr和Trp；和“脂族组”，包括Gly、Ala、Val、Leu、Ile、Met、Ser、Thr和Cys。在每个组内，还可以确定亚组。例如，带电/极性氨基酸组可以细分为以下亚组：“带正电亚组”，包括Lys、Arg和His；“带负电亚组”，包括Glu和Asp；以及“极性亚组”，包括Asn和Gln。在另一个实例中，芳族或环状组可以细分为以下亚组：“氮环亚组”，包括Pro、His和Trp；以及“苯基亚组”，包括Phe和Tyr。在另一个实例中，脂族组可以细分为以下亚组：“大脂族非极性亚组”，包括Val、Leu和Ile；“脂族微极性亚组”，包括Met、Ser、Thr和Cys；以及“小残基亚组”，包括Gly和Ala。保守突变的实例包括上述亚组内氨基酸的氨基酸取代，诸如但不限于：Lys取代为Arg或反之亦然，使得可以维持正电荷；Glu取代为Asp或反之亦然，使得可以维持负电荷；Ser取代为Thr或反之亦然，使得可以维持游离的-OH；以及Gln取代为Asn或反之亦然，使得可以维持游离的-NH2。“保守变体”是包含一个或多个氨基酸被取代的多肽，该置换的目的是使用具有共同性质的氨基酸例如属于上文描述的相同氨基酸组或亚组的氨基酸来替换参考多肽(例如，序列在出版物或序列数据库中公开，或序列已通过核酸测序确定的多肽)的一个或多个氨基酸。

如本文所用，“表达”包括至少RNA产生水平上的基因表达，并且“表达产物”包括表达基因生成的产物，如多肽或功能性RNA(如，核糖体RNA、tRNA、反义RNA、微RNA、shRNA、核酶等)。术语“增加的表达”包括促进增加mRNA产量和/或增加多肽表达的基因表达改变。[基因产物的]“增加的产量”包括与多肽的天然产量或酶活性相比，多肽表达量增加、多肽的酶活性水平增加，或它们二者的组合。

本发明的一些方面包括特定多核苷酸序列表达的部分、基本上或完全缺失、沉默、失活或下调。基因可以是部分、基本上或完全缺失、沉默、失活的或其表达可以是下调的，从而影响其编码的多肽表现的活性，诸如酶的活性。基因可以是通过核酸序列的插入而部分、基本上或完全缺失、沉默、失活或下调的，所述核酸序列的插入破坏了基因的功能和/或表达(例如，病毒插入、转座子诱变、大范围核酸酶工程改造、同源重组或本领域已知的其他方法)。术语“消除”、“消去”和“敲除”可与术语“缺失”、“部分缺失”、“基本上缺失”或“完全缺失”互换使用。在某些实施方案中，所关注的微生物可以通过定点同源重组或靶向整合或突变，使用cas/CRISPR系统来敲除所关注的特定基因来进行工程改造。在其他实施方案中，使用cas/CRISPR系统、RNAi或反义DNA(asDNA)构建体来靶向插入基因调控区或基因调控区的突变可以用于部分、基本上或完全沉默、失活或下调所关注的特定基因。

某些核酸分子或特定多核苷酸序列的这些插入、缺失或其他修饰可以理解为涵盖“基因修饰”或“转化”，使得所得的微生物菌株或宿主细胞可以理解为“基因修饰的”、“基因工程改造的”或“转化的”。

如本文所用，“上调的”或“上调”包括所关注的基因或核酸分子的表达或酶的活性的增加，例如与未上调的在其它方面相同基因或酶的表达或活性相比，基因表达或酶活性的增加。

如本文所用，“下调的”或“下调”包括所关注的基因或核酸分子的表达或酶的活性的减少，例如与未下调的在其它方面相同基因或酶的表达或活性相比，基因表达或酶活性的减少。

如本文所用，“突变体”是指具有作为经典诱变(例如使用γ辐照、UV或化学诱变剂)的结果的基因突变的生物体。“突变体”在本文中还用于指作为基因工程的结果，具有改变的结构或基因表达的重组细胞，作为非限制性实例，所述基因工程可以包括过表达，包括在不同的时间、生物学或环境调控下和/或达到不同于天然存在的程度的基因的表达和/或不在重组细胞中天然表达的基因的表达；同源重组，包括敲除和敲入(例如，基因被编码具有大于或小于野生型多肽和/或显性阴性多肽的活性的多肽的基因替换)；经由RNAi、反义RNA或核酶等等的基因减弱；以及使用大范围核酸酶、TALEN和/或CRISPR技术等等的基因组工程改造。因此突变体不是天然存在的生物体。所关注的突变生物体通常将具有不同于对应野生型或缺乏突变的祖先株的表型，其中该表型可以通过生长测定、产物分析、光合性质、生化测定等来评估。当提及基因时“突变体”时，意指该基因相对于天然或野生型基因具有至少一个碱基(核苷酸)变化、缺失或插入。突变(一个或多个核苷酸的变化、缺失和/或插入)可以在基因的编码区中或可以在内含子、3’UTR、5’UTR或启动子区中，例如在转录起始位点的2kb内或在3kb或翻译起始位点内。例如，本文公开的具有减弱的基因表达的突变体可以具有突变，该突变可以是一个或多个核碱基变化和/或一个或多个核碱基缺失和/或一个或多个核碱基插入转录起始位点5’的基因区，诸如在非限制性实例中，在已知的或推定的转录起始位点的2kb内、1.5kb内、1kb内或0.5kb内，或在翻译起始位点的3kb内、2.5kb内、2kb内、1.5kb内、1kb内或0.5kb内。作为非限制性实例，突变基因可以是在启动子区内具有可以增加或减少基因的表达的突变、插入或缺失的基因；可以是具有导致产生非功能性蛋白质、截短的蛋白质、显性阴性蛋白质或不产生蛋白质的缺失的基因；可以是具有导致编码蛋白质的氨基酸变化的一个或多个点突变或导致基因转录物的异常剪接的基因等。

多肽的保守结构域包括在“cd”(保守结构域)数据库、COG数据库、SMART数据库、PRK数据库、TIGRFAM数据库或本领域已知的其他数据库中鉴定的那些保守结构域。美国国立卫生研究院主办的美国国家生物技术信息中心网站(ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)包括保守结构域数据库(CDD)，该数据库被描述为“由一组详细注释的远古结构域和全长蛋白质的多序列比对模型组成的蛋白质注释资源。这些数据库以经由RPS-BLAST快速鉴定蛋白质序列中的保守结构域的位置特异性评分矩阵(PSSM)提供。CDD内容包括NCBI规划的结构域，其使用3D结构信息来明确定义结构域边界并且提供对序列/结构/功能关系的理解，以及从许多外部来源数据库(Pfam、SMART、COG、PRK、TIGRFAM)导入的结构域模型。”可以在NCBI的cdd数据库(ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)中搜索序列的保守结构域。参见Marchler-Bauer等人(2015)Nuclic Acids Res.43(D)222-226。

术语“Pfam”是指Pfam Consortium维护的一大组蛋白质结构域和蛋白质家族，并且可从多个主办万维网站获取，包括：pfam.sanger.ac.uk/(Welcome Trust，桑格研究所(Sanger Institute))；pfam.sbc.su.se(斯德哥尔摩生物信息学中心(Stockholm Bioinformatics Center))；pfam.janelia.org/(Janelia Farm，霍华德·休斯医学研究所(Howard Hughes Medical Institute))；pfam.jouy.inra.fr/(法国国家农业研究院(Institut national de la Recherche Agronomique))；和pfam.ccbb.re.kr。Pfam的最新版本是Pfam 30.0(2016年6月)，其基于UniProt蛋白质数据库2012_06版。Pfam结构域和家族使用多序列比对和隐马尔可夫(Markov)模型(HMM)来鉴定。Pfam-A家族或结构域指定是使用蛋白质家族的代表性成员和基于种子比对的谱隐马尔可夫模型通过规划种子比对产生的高质量指定。(除非另外指明，查询蛋白质与Pfam结构域或家族的匹配为Pfam-A匹配。)然后将所有属于该家族的鉴定序列用于自动产生该家族的完全比对(Sonnhammer(1998)Nucleic Acids Research 26,320-322；Bateman(2000)Nucleic Acids Research 26,263-266；Bateman(2004)Nucleic Acids Research 32,Database Issue,D138-D141；Finn(2006)Nucleic Acids Research Database Issue 34,D247-251；Finn(2010)Nucleic Acids Research Database Issue 38,D211-222)。通过访问Pfam数据库，例如使用上述网站中的任一个，蛋白质序列可以使用HMMER同源性搜索软件(例如，HMMER2、HMMER3或更高版本、hmmer.janelia.org/)针对HMM进行查询。将查询蛋白质鉴定为在pfam家族中(或具有特定Pfam结果域)的显著匹配是其中比特分大于或等于Pfam结构域的收集阈值的那些匹配。期望值(e值)也可以用作查询蛋白质包括于Pfam中或用于确定查询蛋白质是否具有特定Pfam结构域的标准，其中较低的e值(远小于1.0，例如小于0.1或小于或等于0.01)代表匹配由于机会而引起的小概率。

“cDNA”是包含mRNA分子的核苷酸序列的至少一部分的DNA分子，不同的是DNA分子取代mRNA序列中存在的核碱基胸腺嘧啶或T代替尿嘧啶或U。cDNA可以是双链的或单链的，并且可以是例如mRNA序列的互补序列。在优选的实例中，cDNA不包括cDNA对应的天然存在的基因(即，如生物体的基因组中存在的基因)中存在的一个或多个内含子序列。例如，cDNA可以具有与天然存在的基因的内含子下游的序列并置的天然存在的基因的内含子上游的序列，其中上游和下游序列在自然中的DNA分子中不是并置的(即，序列在天然存在的基因中不是并置的)。cDNA可以通过mRNA分子的逆转录产生，或可以基于cDNA序列的知识例如通过化学合成和/或通过使用一种或多种限制性酶、一种或多种连接酶、一种或多种聚合酶(包括但不限于可用于聚合酶链式反应(PCR)的耐高温聚合酶)、一种或多种重组酶等来合成，其中cDNA序列的知识可以任选地基于从基因组序列鉴别编码区和/或从多个部分cDNA序列编译。

在没有对预期含义的进一步解释的情况下，提及“基本上相同的”或“基本上同一的”性质旨在意指该性质在参考值的10％内，优选地在5％内，并且可以在2.5％内。在特定上下文中未阐明“基本上”的预期含义的情况下，该术语用于包括次要和不相关的偏差，这些偏差对于在本发明的主题的上下文中被认为是重要的特征是非必需的。

“对照细胞”或“对照微生物”是突变微生物(基因工程或诱变微生物)直接或间接所源自的野生型细胞或微生物，或者是与提及的突变细胞或微生物基本上相同(即，相同的属和种，优选地相同的菌株)的细胞或微生物，不同的是对照细胞或微生物不具有主题微生物所具有的导致增加脂质产量的突变。例如，在突变微生物具有减弱的编码包含TAZ锌指结构域和/或布罗莫结构域的多肽的基因或编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽的基因的表达的情况下，对照细胞可以与突变微生物基本上相同，不同的是对照微生物不具有减弱的编码包含TAZ锌指结构域和/或布罗莫结构域的多肽的基因或编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽的基因的表达。

如本文所用，“相同条件”或“相同培养条件”意指基本上相同的条件，即可能存在的参考条件之间的任何差异对于本发明是必需的微生物的功能或性质(包括脂质产生或生物质产生)是次要和不相关的。

如本文所用,“脂质”或“脂类”是指脂肪、蜡、脂肪酸、脂肪酸衍生物诸如脂肪醇、蜡酯、烷烃和烯烃、固醇、单酰甘油、二酰甘油、三酰甘油、磷脂、鞘脂、糖脂和甘油脂。“FAME脂质”或“FAME”是指具有可以衍生为脂肪酸甲酯的酰基部分的脂质，诸如例如单酰甘油、二酰甘油、三酰甘油、蜡酯，以及膜脂质，诸如磷脂、半乳糖脂等。脂质生产率可以以FAME生产率(以毫克/升(mg/L)计)评估，并且对于藻类，可以以克/平方米/天(g/m²/d)报告。在本文提供的半连续测定中，通过考虑入射辐照度的面积(SCPA烧瓶架孔为1 1/2”×33/8”或0.003145m²)和培养物的体积(550ml)，将mg/L值转换为g/m2/d。为了获得生产率值(以g/m²/d计)，将mg/L值乘以每日稀释率(30％)和转换因子0.175。除非另外指出，在脂质或其子类(例如，TAG或FAME)以百分比提及的情况下，百分比是重量百分比。

“生物质”是指细胞聚集体，无论是活细胞还是死细胞，并且可以例如使用本领域已知的方法，以抽吸沉淀物重量，但更优选地干重(如，培养物样品或沉淀细胞的冻干物)、无灰干重(AFDW)或总有机碳(TOC)评估。在生长允许条件下，生物质在培养物的生长期间增加，例如在分批培养中可以称为“生物质积聚”。在经历稳定或常规稀释的连续或半连续培养中，产生或积聚于培养物中的生物质在培养物稀释期间移除。因此，这些培养物的每日生物质生产率(生物质增加)也可以称为“生物质积聚”。生物质生产率可以以TOC生产率(以毫克/升(mg/L)计)评估，对于藻类，可以以克/平方米/天(g/m²/d)报告。在本文提供的半连续测定中，通过考虑入射辐照度的面积(SCPA烧瓶架孔为1 1/2”×33/8”或0.003145m²)和培养物的体积(550ml)，将mg/L值转换为g/m2/d。为了获得生产率值(以g/m²/d计)，将mg/L值乘以每日稀释率(30％)和转换因子0.175。除非另外指出，在生物质以百分比表示的情况下，百分比是重量百分比。

在本发明的上下文中，“氮源”是可以被主题微生物摄取和代谢并且掺入生物分子用于生长和繁殖的氮的来源。例如，不能被微生物摄取和/或代谢用于生长的含氮化合物(例如，含氮生物缓冲剂诸如Hepes、Tris等)在本发明的上下文中不视为氮源。

如本文所用，“还原氮”是呈铵、氨、尿素或氨基酸(例如，可以被培养中的微生物摄取和代谢，以提供掺入生物分子的氮源，从而支持生长的氨基酸)的化学形式的氮。可以是氮源的氨基酸的实例可以包括但不限于谷氨酸、谷氨酰胺、组氨酸、脯氨酸、赖氨酸、精氨酸、天冬酰胺、丙氨酸和甘氨酸。在可以存在于微生物培养基中的氮源的上下文中，“非还原氮”是指在被微生物同化为有机化合物之前必须还原的硝酸盐或亚硝酸盐。

“[培养基中的]唯一氮源”可与“基本上唯一氮源”互换使用，并且表示不会有意地将其他可以被微生物代谢的氮源(即，氮源提供了可以被微生物摄取并且被微生物掺入生物分子诸如蛋白质和核酸的氮)加入培养基，或者没有其他氮源以足以显著增加在参考培养基中培养的微生物或细胞的生长的量存在。在整个本专利申请中，为简洁起见，术语“仅硝酸盐”用于表征其中硝酸盐是微生物可用于支持生长的仅有氮源的培养基。

类似地，“[培养基中的]唯一碳源”可与“基本上唯一碳源”互换使用，并且表示没有其他可以被微生物代谢的碳源(即，用作能源或用作产生生物分子的碳源)以足以提高在参考培养基中培养的微生物或细胞的生产率、生长或繁殖的量存在，或者可以掺入生物分子(诸如微生物或细胞产生的脂质)以大于5％的碳的百分比掺入生物分子。

“氮充足”条件是指其中另外的氮(呈微生物可以使用的形式)加入培养基不会赋予另外生长或繁殖益处的培养基条件。类似地，“营养素充足”条件是指其中营养素对生长或繁殖不限制的培养基条件，即当培养基营养素充足时，另外的营养素加入培养基不会提高生长或繁殖速率。在“营养素充足”的上下文中，作为非限制性实例，“营养素”包括磷酸盐、硫、铁以及任选地二氧化硅，但排除碳源，诸如可以被生物体用作能量来源的糖或有机酸。

本文公开了用于操纵、测定、培养和分析微生物的方法。本文示出的本发明还利用用于本领域已知的细胞培养、微生物转化、基因工程和生物化学分析的标准方法、技术和试剂。虽然与本文所述的方法和材料类似和等同的那些可用于实践或测试本发明，但下文描述了合适的方法和材料。材料、方法和实例仅为说明性的而非旨在进行限制。本发明的其他特征和优点将根据具体实施方式以及根据权利要求而显而易见。

本文引用的所有参考文献均以引用的方式整体并入本文。所有标题都是为了便于读者阅读，并且不以任何方式限制本发明。提及本发明的方面或实施方案不一定表示所描述的方面可以不与本发明的其他所述方面或本发明的其他方面的特征组合。

具有提高的脂质生产率的突变微生物

本发明提供了这样的突变微生物(例如，通过经典诱变或基因工程获得的微生物)：当突变微生物和对照微生物二者在基本上相同培养条件下培养时突变微生物具有比对照微生物高至少20％的脂质生产率，同时产生对照微生物所产生的生物质的至少45％的生物质，在所述培养条件下对照微生物培养物产生生物质，例如在其中突变体对照微生物二者均产生生物质的条件下。本文提供的突变微生物产生比对照微生物多至少20％的脂质和达对照微生物的的生物质的至少45％的生物质的培养条件就对照微生物而言可以是氮充足的，并且可以是营养素充足的。在一些实施方案中，对照微生物是突变体直接或间接所源自的相同物种的野生型微生物，并且本文提供的突变微生物产生比野生型微生物多至少20％的脂质和达野生型微生物的的生物质至少45％的生物质的培养条件是就野生型微生物而言氮充足的，并且可以是营养素充足的。

当本文提供的突变微生物和对照微生物在支持对照微生物的生长和繁殖的基本上相同条件下，即在其中对照微生物培养物产生生物质的条件下培养时，在至少三天的培养期中，例如在至少四天、至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二天、至少十三天、至少十四天、至少十五天、至少二十天、至少三十天或至少六十天的培养期中，突变微生物可以显示出比对照微生物更高的脂质生产率和对照微生物的生物质生产率的至少45％的生物质生产率(如，平均每日生物质生产率)。在一些实例中，其中本文提供的突变微生物产生对照微生物的生物质的至少45％的生物质并且产生比对照微生物多至少20％的脂质的培养期可以小于180天、小于120天或小于90天，其中突变体在该时间段内可以具有更高的平均每日脂质生产率。例如，在三至九十天、三至六十天、三至三十天或三至十五天的培养期中，本文提供的突变微生物可以产生对照微生物的生物质的至少45％的生物质和比对照微生物多至少20％的脂质。例如，在五至九十天、五至六十天、五至三十天、或五至十五天、或七至九十天、七至六十天、七至三十天、七至二十天、或七至至少十五天的培养期中，本文提供的突变微生物可以产生对照微生物的生物质的至少45％的生物质和比对照微生物多至少20％的脂质。

生产率可以是体积生产率，例如培养物的生产率可以以重量/毫升或升培养物表示，并且可以是每日生产率(例如，毫克/升/天或克/升/天)，例如多日培养(例如，至少三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五或更多天)的平均每日生产率，或可以是在培养中确定时间段内每单位体积产生的总量。生产率优选地在培养期中测量多次，例如至少两次或至少三次，并且可以每天、每两天、每三天等评估。

生物质生产率可以例如通过测量总有机碳(TOC)或通过其他方法，诸如测量干重、无灰干重(AFDW)来评估。用于测量TOC的方法是本领域已知的(例如美国专利No.8,835,149)并且在本文提供。测量AFDW的方法也是熟知的，并且可见于例如美国专利No.8,940,508，该专利以引用的方式整体并入本文。

测量微生物产生的脂质的量的方法也是本领域熟知的并且提供于本文的实施例中。例如，总可提取脂质可以根据例如Folch等人(1957)J.Biol.Chem.226:497-509；Bligh&Dyer(1959)Can.J.Biochem.Physiol.37:911-917；或Matyash等人(2008)J.LipidRes.49:1137-1146测定，并且以脂质存在的生物质的百分比也可以使用傅里叶(Fourier)变换红外光谱(FT-IR)评估(Pistorius等人(2008)Biotechnol&Bioengin.103:123-129)。FAME和TAG的重量分析的另外参考文献提供于例如美国专利No.8,207,363和WO 2011127118中，每个专利以引用的方式整体并入本文。

在许多实施方案中，在其中突变体和对照微生物二者均产生生物质的培养条件下，本文提供的突变体可以产生比对照微生物多至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少80％、至少90％或至少100％的脂质，并且在至少三天、至少五天、至少七天、至少九天、至少十天、至少十二天、至少十三天或至少十四天中，突变体平均每天产生野生型微生物所产生的生物质的至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少100％、至少105％、至少110％或至少115％的生物质。在一些实施方案中，本文提供的突变微生物产生比对照微生物更多的脂质量和对照微生物所产生的生物质的至少45％但小于150％、小于200％、小于250％或小于300％的生物质。在一些实施方案中，本文提供的突变微生物相对于对照微生物产生至少45％的生物质和比对照微生物所产生的脂质多至少20％的脂质，但不超过100％、不超过150％、不超过200％的脂质。

在许多实例中，当突变微生物和对照微生物在相同的培养条件下培养时，在至少三天、至少四天、至少五天、至少七天、至少十天、至少十二天或至少十四天的时间段内，本文提供的突变微生物每天产生比对照微生物平均多至少25％的FAME脂质，例如每天多至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少80％、至少90％或至少100％的脂质，同时每天产生不少于对照微生物所产生的生物质的平均约50％的生物质，并且每天可以产生野生型微生物所产生的生物质的至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少100％、至少105％、至少110％或至少115％的生物质，在所述培养条件下对照微生物的培养物产生生物质，其中就对照微生物而言，培养条件是氮充足的，并且优选地营养素充足的培养条件。培养条件可以包括在包含少于约3mM、少于约2.5mM、少于约2mM或少于约1.5mM的还原氮源诸如铵的培养基中培养。作为另外一种选择或除此之外，培养条件可以包括在包含硝酸盐作为基本上唯一氮源的培养基中培养。在一些实例中，对照微生物是野生型微生物，例如突变微生物直接或间接所源自的野生型微生物。

在一些实施方案中，本文公开的突变微生物可以是藻类或不等鞭毛类细胞，其在包含少于约5mM、少于约4.5mM、少于约4mM、少于约3.5mM、少于约3mM、约2.5mM铵或更少、约2.0mM铵或更少、约1.5mM铵或更少、约1.0mM铵或更少、约0.5mM铵或更少或基本上不含铵，并且包含例如至少1.0mM、至少2.0mM、至少3.0mM、至少4.0mM、至少5.0mM、至少6.0mM、至少7.0mM、至少8.0mM或至少10.0mM硝酸盐的培养基中产生比对照微生物多至少25％的FAME，同时产生对照微生物的TOC量的至少45％的TOC量。例如，铵浓度可以在约0至约5mM、约0至约4.0mM、约0至约3mM、约0至约2.5mM、约0至约2.0mM、约0至约1.5mM、约0至约1.0mM、或约0至约0.5mM的浓度范围内。铵浓度可以在约0.2至约3mM、0.2至约2.5mM、约0.2至约2.0mM、约0.2至约1.5mM、约0.2至约1mM、或约0.3至约2.5mM、或约0.3至约1mM、约0.3至约1.5mM、或约0.3至约2mM的浓度范围内。在另外的实例中，铵浓度可以在约0.5mM至约2.5mM、约0.4至约2mM、或约0.4至约1.5mM的浓度范围内。

作为另外一种选择或除此之外，在相同时间段内在培养物中，本文提供的突变体可以产生对照细胞所产生的生物质的至少45％的生物质和比对照细胞多至少25％的脂质，该培养物包含硝酸盐，例如至少约1mM、至少约1.5mM、至少约2mM、至少约2.5mM、至少约3mM、至少约3.5mM、至少约4mM、至少约4.5mM或至少约5mM的硝酸盐，并且在一些实例中，还可以任选地包含小于约5mM的铵，诸如小于约2.5mM的铵、小于约2mM的铵、小于约1mM的铵、或小于约0.5mM的铵。

在一些实施方案中，突变微生物可以是光合微生物，并且在光合自养条件下(可以在昼夜循环下)，可以产生比对照或野生型细胞更多的脂质和对照或野生型细胞的脂质的至少45％的脂质。昼夜循环的光周期可以具有任何长度，并且可以为例如每二十四小时循环约四小时至约二十二小时，并且可以为例如约六小时至约二十小时，如约八小时至约十八小时。微生物可以暴露于自然或人造光或它们的组合之下。在整个光周期中可用的光的强度可以变化。

就在其中对照微生物和突变微生物二者均产生生物质的相同的条件下培养的对照微生物而言，本文提供的突变微生物可以具有更大的碳与脂质分配(partitioning of carbon to lipid)。与对照微生物相比，具有增加的碳与脂质分配的突变体可以具有增加的碳与总可提取脂质、与总中性脂质、与三酰甘油和/或与FAME可衍生的脂质的分配。例如，本文提供的突变微生物可以具有比对照微生物高至少25％的所产生的FAME可衍生的脂质(“FAME”)与所产生的生物质(例如，TOC或无灰干重(AFDW))的量的比率。脂质和生物质产生和/或生产可以例如通过本领域已知的和本文的实施例示出的重量分析来评估。例如，当突变微生物和对照微生物二者在其中突变微生物的培养物和对照微生物的培养物二者均产生生物质的条件下培养时，本文提供的突变微生物可以具有的FAME与TOC比率比对照微生物的FAME/TOC比率高至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％或至少75％。在一些实施方案中，本文提供的突变微生物的FAME/TOC比率与在相同条件下培养的对照微生物的FAME/TOC比率相比可以增加小于约200％或小于约150％。

在许多实例中，当突变微生物和对照微生物二者均在其中对照培养物产生生物质(如，TOC)并且突变培养物产生对照培养物所产生的生物质的量的至少45％、至少50％、至少60％、至少70％、至少80％、至少90％或至少95％的生物质的量的条件下培养时，本文提供的突变微生物可以具有比对照微生物的FAME/TOC比率高至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％或至少75％的所产生的FAME与所产生的TOC的量的比率。在许多实例中，当在其中突变微生物培养物产生达对照微生物培养物的生物质的至少45％、至少50％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85、至少90％或至少95％的生物质(如，TOC)的条件下，在其中对照和突变培养物二者产生生物质的条件下培养时，本文提供的突变体的FAME/TOC比率可以为至少0.27、至少0.30、至少0.35、至少0.40、至少0.45、至少0.50或至少0.55。在许多实例中，当在其中突变培养物产生达对照微生物所产生的生物质的至少约50％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85、至少90％、至少95％或至少100％的(如，TOC)的生物质的条件下培养时，当突变体和对照微生物二者均在就对照微生物而言氮充足例如营养素充足的条件下培养时，本文提供的突变体的FAME/TOC比率可以为至少0.27、至少0.30、至少0.35、至少0.40、至少0.45、至少0.50或至少0.55。

在一些实例中，当在其中对照和突变微生物二者均产生生物质的条件下培养时，本文提供的突变微生物可以产生比对照细胞(诸如野生型细胞)所产生的FAME多至少50％的FAME，同时产生对照细胞所产生的TOC的至少80％、至少85％或至少90％的TOC，并且突变微生物的FAME/TOC比率比对照微生物的FAME/TOC比率高至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％或至少75％。突变微生物的FAME/TOC比率可以为例如至少0.30、至少0.35、至少0.40、至少0.45或至少0.50。培养条件可以包括例如包含少于2.5mM、少于2mM、少于1.5mM、少于1.0mM或少于0.5mM的铵，并且在一些实例中可以包含至少2mM、至少4mM或至少6mM的硝酸盐的培养基。在一些实例中，培养条件可以基本上不包含铵，并且在一些实例中，可以基本上不包含还原氮作为氮源。在一些实例中，培养物包含硝酸盐作为氮源，其任选地可以是培养基中的基本上唯一氮源。

将本文提供的具有增加的脂质产量的突变体的性质与对照微生物的相同性质进行比较，该对照微生物可为与突变体相同物种的野生型生物体，优选地为脂质过量产生突变体的祖先株。或者，对照微生物可以是与突变微生物基本上相同的微生物，不同的是对照微生物不具有导致更高的脂质生产率的突变。例如，对照微生物可以是经进一步突变或工程改造为产生本文公开的具有提高的脂质生产率和/或增加的脂质分配的突变体的基因工程微生物或经典突变生物体。

在一些实例中，对照微生物可以是与突变微生物基本上相同的微生物，不同的是对照微生物不具有调节脂质诱导的基因(即，在其中突变微生物具有祖先株的生物质生产率的至少约一半的生物质生产率的条件下，突变导致增加的脂质产量的基因)的突变。也将具有断裂、减弱或者直接或间接基因操纵的基因(导致结构改变或脂质诱导调节基因的表达)的脂质过量产生突变体的性质与不具有断裂、减弱或者直接或间接基因操纵的脂质诱导调节基因(导致结构改变或脂质诱导调节基因的表达)的对照细胞(无论该细胞是否为“野生型”)的相同性质进行比较。例如，对照细胞可以是包含一个或多个非天然基因的重组细胞或除脂质诱导调节基因之外的基因发生突变、效果正在评估的细胞等。

考虑用于本发明的不等鞭毛类种包括但不限于硅藻、黄绿藻、网粘菌(Labrinthulid)和破囊壶菌(Thraustochytrid)、诸如例如以下属的种：网粘菌属、类网粘菌、破囊壶菌属、裂殖壶菌属、不动壶菌属、Aurantiochytrium、矩圆壶菌属、日本壶菌属、双孔虫属或吾肯氏壶菌属。

在许多实例中，具有本文公开的性质的突变微生物，诸如具有减弱的调节脂质生物合成的基因(诸如加的斯微拟球藻及其直系同源物的Bromo-1091基因)表达的突变微生物可以属于任何真核微藻株系，诸如例如以下属中的任一种的任何种：曲壳藻属、茧形藻属、双眉藻属、纤维藻属、星胞藻属、黄金色藻属、Bolidomonas、波氏藻属、气球藻属、葡萄藻属、片球藻属、角毛藻属、四鞭藻属、衣藻属、绿球藻属、绿梭藻属、小球藻属、蓝隐藻属、金球藻属、鳄球藻属、隐甲藻属、隐藻属、小环藻属、栅藻属、杜氏藻属、后棘藻属、赫氏圆石藻属、独球藻属、衣迪斯藻属、眼虫藻属、真眼点藻属、被棘藻属、脆杆藻属、拟脆杆藻属、丽丝藻属、红球藻属、菱板藻属、赤潮异弯藻属、膜胞藻属、等鞭金藻属、鳞孔藻属、微星藻属、蒜头藻属、单针藻属、微绿球藻属、微拟球藻属、舟形藻属、新绿藻属、异鞭藻属、肾藻属、菱形藻属、棕鞭藻属、鞘藻属、卵囊藻属、青绿藻属、拟小球藻属、缺刻缘绿藻属、帕氏藻属、巴夫藻属、金藻属、褐指藻属、噬菌体属、Picochlorum、扁藻属、颗石藻属、肋球藻属、原壁菌属、伪小球藻属、伪新绿藻属、伪角星鼓藻属、塔胞藻属、桑椹藻属、栅列藻属、裂衣藻属、骨条藻属、水绵藻属、裂丝藻属、四球藻属、扁藻属、海链藻属、黄丝藻属、无隔藻属、鲜绿球藻属、魏氏藻属和团藻属。特别合适的种的非限制性实例包括例如硅藻，诸如例如以下属中的任一种的种：双眉藻属、角毛藻属、小环藻属、脆杆藻属、拟脆杆藻属、菱板藻属、蒜头藻属、舟形藻属、菱形藻属、褐指藻属或海链藻属或黄绿藻，例如真眼点藻属、微拟球藻属、伪角星鼓藻属或魏氏藻属。

突变体可以是具有减弱的调节基因表达的自发突变体、经典衍生突变体或工程改造突变体，该调节基因是例如其表达影响很多其他基因(诸如编码转录因子或转录活化因子的基因)表达的基因。例如，在其中对照微生物和本文公开的突变微生物二者均积聚生物质的条件下(例如，就对照微生物(其可以是野生型微生物)而言营养素充足的条件下)产生比对照微生物多至少25％的脂质和达对照微生物的生物质至少45％的生物质的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽具有TAZ锌指结构域，如具有编码TAZ锌指结构域的氨基酸序列，该TAZ锌指结构域被表征为属于保守结构域家族cd15614或SMART域00551或属于pfam PF02135的TAZ锌指结构域。TAZ锌指(转录接头蛋白推定的锌指)结构域是可见于转录共活化因子CREB结合蛋白(CBP)和P300的锌结合结构域。转录共活化因子是通过其活化结构域募集到DNA结合转录因子和增加转录的蛋白质。CBP和P300是催化核小体中全部四个组蛋白的可逆乙酰化，发挥经由染色质重塑的调节转录的作用的组蛋白乙酰转移酶(EC)(De Guzman等人(2004)J.Biol.Chem.279:3042-3049)。此类结构域可以在本文提供的基因编码的多肽中鉴定，其中e值例如小于约0.01、小于约0.001或小于约10^-6。在一些实施方案中，本文提供的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽募集到pfamPF02135，其中比特分大于20.0(PF02135的收集截留值)并且e值例如小于0.01、小于约0.001或小于约10^-6。在一些实施方案中，本文提供的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽具有与SEQ ID NO:9具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。

作为另外一种选择或除此之外，突变微生物，诸如本文公开的产生比对照微生物多至少20％的脂质，同时产生达对照微生物的生物质的至少45％的生物质的任何突变微生物可以具有减弱的编码多肽的基因的表达，该多肽具有布罗莫结构域，例如可以具有编码布罗莫结构域的氨基酸序列，该布罗莫结构域被表征为保守结构域cd05506、SMART域00297、COG域5076或属于pfam PF00439的布罗莫结构域。布罗莫结构域是具有大约110个氨基酸的蛋白质结构域，可见于一些染色质相关蛋白上。布罗莫结构域识别乙酰化赖氨酸残基，诸如组蛋白的N-末端尾部上的那些。据发现，组蛋白乙酰化的变化伴随着与转录活性变化一起出现的染色质重塑(Dhalluin等人Nature 399:491-496)。在一些实施方案中，本文提供的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽募集到pfam PF00439，其中比特分大于21.0(PF00439的收集截留值)并且e值例如小于0.01、小于约0.001或小于约10^-6。在一些实施方案中，本文提供的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽具有与SEQ ID NO:10具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。

例如，产生比对照微生物多至少20％的脂质，同时产生达对照微生物的生物质的至少45％的生物质的本文提供的突变微生物可以具有减弱的编码多肽的基因的表达，该多肽包含TAZ锌指结构域和/或包含布罗莫结构域。在一些实施方案中，突变微生物具有减弱的编码多肽的基因的表达，该多肽具有被表征为pfam PF02135的TAZ结构域，其中比特分大于20.0并且e值小于0.01；和被表征为pfam PF00439的布罗莫结构域，其中比特分大于21.0并且e值小于0.01。作为另外一种选择或除此之外，突变微生物可以包含与SEQ ID NO:9具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列和/或与SEQ ID NO:10具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。

作为另外一种选择或除此之外，在许多实施方案中，在其中对照微生物和突变微生物二者均积聚生物质的条件下(例如，在就对照微生物(其可以是野生型微生物)而言营养素充足的条件下)，产生比对照微生物多至少25％的脂质和达对照微生物的生物质的至少45％的生物质的本文公开的突变微生物可以具有减弱的基因的表达，所述基因编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽，和/或具有与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的编码区。

具有减弱的调节脂质产量的基因的表达的突变微生物可以是“敲除”突变体，例如其中多肽的阅读框是断裂的，从而不产生功能性蛋白质。例如，基因可以包含在阅读框中的插入、缺失或突变，从而不产生功能性蛋白质。在许多实例中，敲除突变可以通过序列(通常但不一定包括选择性标记基因)插入基因，例如插入基因的编码区来产生。此类插入可以例如通过利用cas/CRISPR系统来实现，cas/CRISPR系统将供体片段整合进靶标基因座，或可以通过同源重组来实现。此类插入可以使开放阅读框和/或剪接信号断裂，或产生非功能性融合蛋白或截短的蛋白质。在其他实例中，突变微生物可以是其中基因的表达减少但未消除的“敲低”突变体，例如相对于野生型细胞的表达水平减少5％或更少至95％或更多，例如5％至95％或10％至90％。敲低可以是其中突变、插入或缺失出现在基因的非编码区，例如基因的5’或3’区的突变体，或可以受到在细胞中表达减少靶基因的表达的构建体，诸如RNAi、核酶或反义构建体的影响。除CRISPR系统之外，同源重组可以用于产生插入突变体(敲低或敲除)。

本文提供的突变微生物可以通过靶向所关注的微生物的内源性基因来设计，该基因编码包含本文公开的TAZ锌指结构域和/或本文公开的布罗莫结构域的多肽。此类基因可以使用生物信息学方法、分子生物学技术以及它们的组合在所关注的微生物中鉴定。例如，编码包含TAZ锌指结构域和/或布罗莫结构域的多肽的基因可以使用Southern杂交、通过杂交筛选cDNA文库或PCR(例如，使用简并探针和/或引物)来鉴定。公开或专有数据库中可用的基因组序列可以通过许多执行序列匹配(如，blast程序诸如blastp、blastn和tblastn(针对翻译的核苷酸序列查询的蛋白质序列))或分析编码氨基酸序列的域结构的程序中的任一种搜索。例如，hmmer.org提供了用于分析由基因编码的结构和功能结构域的软件，该软件可以用于扫描基因组序列，包括例如hmmsearch和hmmscan。此类搜索可以在线进行。程序诸如MUSCLE和hmmalign也可以用于通过构建系统发生树以确定蛋白质之间的关系来搜索蛋白质诸如本文公开的蛋白质(如，含TAZ锌指结构域多肽)的直系同源物。基因靶向可以利用在所关注的微生物的基因组中鉴定的序列。靶向基因以进行减弱不必解析基因的完整结构。例如，使用本文公开的方法，包括但不限于cas/CRISPR基因组编辑、RNAi构建体、反义构建体、同源重组构建体和核酶构建体，仅一部分基因序列可用于基因减弱构建体和技术。

基因减弱

本文提供的具有减弱的调节脂质生物合成的基因的表达的突变微生物是通过人为干预，例如通过经典诱变或基因工程产生的突变体。例如，本文提供的突变微生物可以是通过任何可行的诱变方法(包括但不限于UV辐照、γ辐照或化学诱变)，并且筛选具有增加的脂质产量的突变体(例如通过用亲脂性染料诸如尼罗红或BODIPY染色产生的突变体(例如，Cabanelas等人(2015)Bioresource Technology 184:47-52)。用于产生微生物菌株的突变体的方法是熟知的。

本文提供的产生比祖细胞多至少25％的脂质，同时产生祖细胞的生物质的至少50％的生物质的突变体也可以是基因工程突变体，例如其中调控基因诸如Bromo-1091或其直系同源物(例如，编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽的基因)被通过同源重组靶向以进行敲除或基因替换的突变体(例如具有可以编码具有相对于野生型多肽减少的活性的多肽的基因的突变形式)。例如，所关注的微生物菌株可以通过定点同源重组以将序列插入基因组基因座从而改变基因和/或其表达，或将启动子插入宿主微生物的基因座以影响基因座处特定基因或一组基因的表达来进行工程改造。

例如，通过同源重组进行的基因敲除或替换可以通过转化包含与待改变的基因组的区域具有同源性的序列的核酸(如，DNA)片段来进行，其中同源性序列被外源序列(通常是允许选择整合的构建体的选择性标记基因)中断。外源序列或突变基因序列的任一侧上的基因组同源性侧接序列的长度可为例如至少50个、至少100个、至少200个、至少300个、至少400个、至少500个、至少600个、至少700个、至少800个、至少900个、至少1,000个、至少1,200个、至少1,500个、至少1,750个或至少2,000个核苷酸。其中靶基因序列侧接外源序列的基因敲除或基因“敲入”构建体可以以提供于可以任选地线性化的载体中，例如经历同源重组的区域外侧，或可以在不是载体的情况下以线性片段形式提供，例如敲除或敲入构建体可以是分离的或合成的片段，包括但不限于PCR产物。在一些实例中，分裂标记系统可以用于通过同源重组产生基因敲除，其中可以引入两个DNA片段，这两个DNA片段可以通过三次交换事件使选择性标记再生并且使所关注的基因座断裂(Jeong等人(2007)FEMS Microbiol Lett 273:157-163)。

在一个方面，本发明提供了基因修饰的生物体，例如具有一个或多个基因修饰的微生物，该基因修饰用于减弱脂质调节基因的表达，所述脂质调节基因诸如编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少55％同一性的多肽的基因，或具有与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45中的任一者具有至少55％同一性的编码区的基因。如本文所用，“减弱的脂质调节基因的表达”意指以减少完全功能蛋白质的产生的方式减少或消除基因的表达。用于减弱脂质调节基因的手段包括例如同源重组构建体；CRISPR系统，包括引导RNA、Cas9或其他cas酶，任选地用于插入靶位点的供体片段；RNAi构建体，包括shRNA、反义RNA构建体；核酶构建体；TALEN、锌指核酸酶；和大范围核酸酶。

例如，被工程改造为具有减弱的脂质调节基因的表达的重组微生物可以具有断裂的脂质调节基因，该断裂脂质调节基因包含减少或消除基因表达的至少一个插入、突变或缺失，使得完全功能脂质调节基因不产生或以小于不包含断裂的脂质调节基因的对照微生物所产生的量产生。

突变(一个或多个核苷酸的变化、缺失和/或插入)可以在基因的编码区中或可以在内含子、3’UTR、5’UTR或启动子区中，例如在转录起始位点的2kb内或在3kb或翻译起始位点内。例如，本文公开的具有减弱的基因表达的突变体可以具有突变，该突变可以是一个或多个核碱基变化和/或一个或多个核碱基缺失和/或一个或多个核碱基插入转录起始位点5’的基因区，诸如在非限制性实例中，在已知的或推定的转录起始位点的2kb内、1.5kb内、1kb内或0.5kb内，或在翻译起始位点的3kb内、2.5kb内、2kb内、1.5kb内、1kb内或0.5kb内。作为非限制性实例，突变基因可以是在启动子区内具有可以增加或减少基因的表达的突变、插入或缺失的基因；可以是具有导致产生非功能性蛋白质、截短的蛋白质、显性阴性蛋白质或不产生蛋白质的缺失的基因；可以是具有导致编码蛋白质的氨基酸变化的一个或多个点突变或导致基因转录物的异常剪接的基因等。

断裂的脂质调节基因可以通过例如同源重组和/或大范围核酸酶,锌指核酸酶(Perez-Pinera等人(2012)Curr.Opin.Chem.Biol.16:268-277)、TALEN(WO 2014/207043；WO 2014/076571)或CRISPR系统的cas蛋白(例如，Cas9蛋白质)的活性介导的插入或基因替换来断裂。

Hsu等人(Cell 157:1262-1278,2014)最近评述的CRISPR系统，除cas核酸酶多肽或复合物之外，还包含通过与靶位点序列互补而与基因组靶位点相互作用的靶向RNA，通常表示为“crRNA”，与cas多肽复合的反式激活(“tracr”)RNA，并且还包含结合(通过互补)靶向crRNA的区域。

本发明设想了可以共转化至宿主菌株(或在宿主菌株中表达)的两种RNA分子(“crRNA”和“tracrRNA”)的使用，该宿主菌株表达或转染有用于基因组编辑的cas蛋白；或包含与靶序列互补的序列以及与cas蛋白相互作用的序列的单引导RNA的使用。也就是说，在一些策略中，本文所用的CRISPR系统可以包含两种单独的RNA分子(RNA多核苷酸：“tracr-RNA”和“靶向物-RNA”或“crRNA”，参见下文)，并且在本文中称为“双分子DNA靶向RNA”或“两分子DNA靶向RNA”。或者，如实施例所示，DNA靶向RNA也可以包含用于与cas蛋白相互作用的反式激活序列(不同于靶标同源性(“cr”)序列)，也就是说，DNA靶向RNA可以是单RNA分子(单RNA多核苷酸)，在本文中称为“嵌合引导RNA”、“单引导RNA”或“sgRNA”。术语“DNA靶向RNA”和“gRNA”是包含性的，两个都是指双分子DNA靶向RNA和单分子DNA靶向RNA(即，sgRNA)。单分子引导RNA和两种RNA系统均在文献例如美国专利申请公开No.US 2014/0068797中详细描述，该专利申请公开以引用的方式整体并入本文。

任何cas蛋白均可用于本文的方法，例如Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Cbf1、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Cpf1、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、C2c1、C2c2、C2c3及其同源物，或其修饰形式。cas蛋白可以是Cas9蛋白，诸如作为非限制性例子的酿脓链球菌(Staphylococcus pyogenes)、嗜热链球菌(S.thermophilus)、肺炎链球菌(S.pneumonia)、金黄色葡萄球菌(S.aureus)或脑膜炎奈瑟菌(Neisseria meningitidis)的Cas9蛋白。还考虑了美国专利申请公开No.US 2014/0068797中以SEQ ID NO:1-256和795-1346提供的Cas9蛋白，该专利申请公开以引用的方式整体并入本文；和可以组合来自多于一个Cas9蛋白的结构域的嵌合Cas9蛋白；以及鉴定的Cas9蛋白的变体和突变体。

Cas核酸酶活性切割靶DNA以产生双链断裂。然后细胞以两种方式之一修复这些断裂：非同源性末端接合或同源性介导的修复。在非同源性末端接合(NHEJ)中，双链断裂通过断裂末端彼此的直接连接修复。在这种情况下，无新核酸物质插入位点，但可能丢失一些核酸物质，导致缺失或改变，常常导致突变。在同源性介导的修复中，供体多核苷酸(有时称为“供体DNA”或“编辑DNA”)(其可以与切割的靶DNA序列具有同源性)用作切割的靶DNA序列修复的模板，导致遗传信息从供体多核苷酸转移到靶DNA。因此，新核酸物质可以插入/复制到该位点。由于NHEJ和/或同源性介导的修复(例如使用供体DNA分子)而产生的靶DNA修饰可以导致例如基因修正、基因替换、基因标记、转基因插入、核苷酸缺失、基因断裂、基因突变等。

在一些实例中，通过定点修饰多肽(如，cas核酸酶、锌指核酸酶、大范围核酸酶或TALEN)进行的DNA切割可以用于通过切割靶DNA序列，并且允许细胞在不存在外源提供的供体多核苷酸的情况下修复序列而使核酸物质从靶DNA序列缺失。此类NHEJ事件可能导致会引起基因断裂的切割末端的重新接合位点处的突变(“错修复”)。

或者，如果DNA靶向RNA与供体DNA一起共施用于表达cas核酸酶的细胞，则主题方法可以用于将核酸物质加入(即插入或替换)靶DNA序列(如通过插入诱变“敲除”，或“敲入”编码蛋白质(如，选择性标记和/或所关注的任何蛋白质)、siRNA、miRNA等的核酸)，以修饰核酸序列(例如，引入突变)等等。

在具体实施方案中，供体DNA可以包含基因调控序列(如，启动子)，所述基因调控序列可以使用CRISPR靶向来插入基因的编码区上游和基因的假定近端启动子区上游，例如脂质调节基因的编码区的起始ATG上游至少50bp、至少100bp、至少120bp、至少150bp、至少200bp、至少250bp、至少300bp、至少350bp、至少400bp、至少450bp或至少500bp。供体DNA可以包含某一序列，诸如例如选择性标记或可以干扰天然启动子的任何适当序列。插入脂质调节基因开放阅读框的起始ATG上游(例如，脂质调节基因的转录起始位点的5’UTR中或上游)的另外序列可以减少或甚至消除内源性脂质调节基因的表达。作为另外一种选择或除此之外，天然脂质调节基因的内源性启动子可以被更弱或差异调节的启动子、或非启动子序列完全或部分替换。

在一些实例中，引入宿主细胞以产生高效基因组编辑细胞系的核酸分子编码相对于对应的野生型酶突变的Cas9酶，使得突变Cas9酶缺乏切割含靶序列的靶多核苷酸的一条或两条链的能力。例如，来自酿脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸至丙氨酸的取代(D10A)将Cas9从切割两条链的核酸酶转换为切口酶(切割单条链的酶)。使Cas9成为切口酶的突变的其他实例包括但不限于H840A、N854A和N863A。在一些实施方案中，Cas9切口酶可以与引导序列，例如两个引导序列组合使用，这两个引导序列分别靶向DNA靶标的有义和反义链。该组合允许两条链被切割并用于诱导NHEJ。两个切口酶靶标(非常接近但靶向不同的DNA链)可以用于诱导诱变NHEJ。这种使用在交错位置切割相反链的酶的基因座靶向也可以减少非靶向切割，因为两条链必须准确地和特异性地切割以实现基因组突变。

在另外的实例中，切割DNA的能力受损的突变Cas9酶可以在细胞中表达，其中还引入靶向靶基因的转录或翻译起始位点上游的序列的一种或多种引导RNA。在这种情况下，cas酶可以结合靶序列并且阻断靶基因的转录(Qi等人(2013)Cell 152:1173-1183)。这种基因表达的CRISPR干扰可以称为RNAi，并且还在Larson等人(2013)Nat.Protoc.8:2180-2196中详细描述。

在一些情况下，cas多肽诸如Cas9多肽是融合多肽，其包含例如：i)Cas9多肽(其可以任选地为上文描述的变体Cas9多肽)；和b)共价连接的异源多肽(也称为“融合伴侣”)。异源核酸序列可以连接至另一个核酸序列(例如，通过基因工程)，以产生编码嵌合多肽的嵌合核苷酸序列。在一些实施方案中，Cas9融合多肽通过使Cas9多肽与提供亚细胞定位的异源序列融合来产生(即，异源序列是亚细胞定位序列，例如用于靶向核的核定位信号(NLS)；用于靶向线粒体的线粒体定位信号；用于靶向叶绿体的叶绿体定位信号；ER滞留信号；等等)。在一些实施方案中，异源序列可以提供易于跟踪和/或纯化的标签(即，异源序列是可检测标签)(例如，荧光蛋白如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等等；血凝素(HA)标签；FLAG标签；Myc标签；等等)。

宿主细胞可以使用例如载体构建体进行基因工程改造(例如，转导或转化或转染)，该载体构建体可以是例如包含与宿主细胞的脂质调节基因基因座的一部分或其邻近区域同源的核酸序列的用于同源重组的载体，或可以是用于表达以下任一者或它们的组合的表达载体：cas蛋白(如，Cas9蛋白)、CRISPR嵌合引导RNA、crRNA和/或tracrRNA、RNAi构建体(如，shRNA)、反义RNA或核酶。载体可以是例如质粒、病毒颗粒、噬菌体等的形式。用于表达用于基因组编辑的多肽或RNA的载体也可以设计为整合进宿主，例如通过同源重组。含有本文所述的多核苷酸序列，例如与宿主脂质调节基因序列具有同源性的序列(包括编码的脂质调节子序列上游和下游的序列)，以及任选地选择性标记或报告基因的载体可以用于转化适当的宿主以引起脂质调节基因减弱。

在一些实例中，重组微生物可以具有减少但不消除表达的脂质调节基因，并且重组微生物可以具有例如约25％至约200％或更多的脂质产量增加。在一些实例中，本文提供的基因修饰的微生物可以包含用于减弱脂质调节基因的表达的核酸构建体，该脂质调节基因诸如例如编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽的基因。例如，宿主微生物可以包含用于表达减少脂质调节基因的表达的RNAi分子、核酶或反义分子的构建体，该脂质调节基因编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少55％同一性的多肽。在一些实例中，本文提供的重组微生物可以含有至少一个引入的(外源的或非天然的)用于减少脂质调节基因的表达的构建体。

在一些实例中，可以选择工程改造菌株用于表达与对照细胞相比减少的脂质调节基因，该对照细胞不包含使用本领域已知的方法，诸如例如RNA-Seq或逆转录-PCR(RT-PCR)来减弱脂质调节基因表达，但不消除的基因修饰。

本文提供的基因工程改造菌株可以通过减少编码脂质调节子的基因的mRNA的量、稳定性或可翻译性来工程改造为包含用于减弱基因表达的构建体。例如，微生物诸如藻类或不等鞭毛类株可以使用本领域已知的方法用靶向脂质调节基因的mRNA的反义RNA、RNAi或核酶构建体来转化。例如，包含基因的转录区的全部或一部分的反义RNA构建体可以引入微生物以减少基因表达(Shroda等人(1999)The Plant Cell 11:1165-78；Ngiam等人(2000)Appl.Environ.Microbiol.66:775-782；Ohnuma等人(2009)Protoplasma 236:107-112；Lavaud等人(2012)PLoS One 7:e36806)。作为另外一种选择或除此之外，靶向具有TAZ锌指结构域和/或布罗莫结构域的基因的RNAi构建体(例如，编码短发夹RNA的构建体)可以引入微生物，诸如藻类或不等鞭毛类，用于减少脂质调节基因的表达(参见例如Cerruti等人(2011)Eukaryotic Cell(2011)10:1164-1172；Shroda等人(2006)Curr.Genet.49:69-84)。

核酶是以位点特异性方式切割核酸的RNA-蛋白质复合物。核酶带有具有核酸内切酶活性的特定催化结构域。例如，美国专利No.5,354,855(以引用的方式并入本文)报道了，某些核酶可以作为序列特异性大于已知的核糖核酸酶并且接近DNA限制性酶的核酸内切酶。催化RNA构建体(核酶)可以设计为与本文提供的编码基因的mRNA碱基配对，以切割mRNA靶标。在一些实例中，核酶序列可以整合进反义RNA构建体之内，以介导靶标的切割。可以考虑许多类型的核酶，其设计和使用是本领域已知的，并且例如在Haseloff等人(1988)Nature 334:585-591中有所描述。

核酶借助于通过互补碱基配对相互作用进行的与位点的退火而被靶向至给定序列。两个同源性片段是所述靶向必须的。这些同源性序列片段侧接上文定义的催化核酶结构。每个同源性序列片段的长度可以在7至15个核苷酸之间变化。定义同源性序列的唯一要求是，在靶RNA上，它们被作为切割位点的特异性序列分隔开。对于锤头核酶(hammerhead ribozyme)，切割位点是靶RNA上的二核苷酸序列，为尿嘧啶(U)然后是腺嘌呤、胞嘧啶或尿嘧啶(A、C或U)(Thompson等人，(1995)Nucl Acids Res 23:2250-68)。在任何给定RNA中该二核苷酸出现的频率在统计学上为3/16。因此，对于1,000个碱基的给定靶信使RNA，187个二核苷酸切割位点在统计学上是可能的。

核酶指导RNA切割活性的一般设计和优化已详细讨论(Haseloff和Gerlach(1988)Nature 334:585-591；Symons(1992)Ann Rev Biochem 61:641-71；Chowrira等人(1994)J Biol Chem 269:25856-64；Thompson等人(1995)，出处同上)，所有参考文献均以引用的方式整体并入。设计和测试有效切割靶RNA的核酶是本领域的技术人员熟知的方法。用于设计和测试核酶的科学方法的实例如Chowrira等人，(1994)，出处同上以及Lieber和Strauss(1995)Mol Cell Biol.15:540-51所述，每个参考文献均以引用的方式并入。用于下调给定基因的操作性和优选序列的鉴定是制备和测试给定序列的问题，并且是本领域技术人员已知的常规实践的“筛选”方法。

RNAi构建体的使用在例如上文引用的文献以及US2005/0166289和WO 2013/016267(两个专利均以引用的方式并入本文)中有所描述。与靶基因具有同源性的双链RNA被递送至细胞或通过RNAi构建体例如RNAi短发夹(sh)构建体的表达在细胞中产生。构建体可以包含与靶基因相同，或与靶基因的序列具有至少70％、80％、90％、95％或在95％和100％之间同一性的序列。构建体可以与靶基因具有至少20、至少30、至少40、至少50、至少100、至少200、至少300、至少400、至少500、至少600、至少700、至少800、至少900或至少1kb的序列同源性。表达载体可以使用被选择用于RNAi构建体诸如产生shRNA的构建体的连续或诱导型表达的启动子进行工程改造。

用于基因减弱的核酸构建体，例如核酶、RNAi或反义构建体可以包含与待工程改造的微生物的内源性脂质调节基因的序列的至少一部分具有至少80％同一性，诸如至少85％、至少90％、至少95％或至少99％同一性或与其互补的至少十五个、至少二十个、至少三十个、至少四十个、至少五十个或至少六十个核苷酸。用于基因减弱的核酸构建体，例如核酶、RNAi或反义构建体可以包含与天然存在的基因的序列具有至少80％，诸如至少95％或约100％同一性或与其互补的至少十五个、至少二十个、至少三十个、至少四十个、至少五十个或至少六十个核苷酸，诸如与内源性脂质调节基因具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％或至少85％、至少90％或至少95％序列同一性的基因。例如，用于基因减弱的核酸构建体，例如核酶、RNAi或反义构建体可以包含与天然存在的脂质调节基因，诸如本文提供的任何基因的序列具有至少80％同一性或与其互补的至少十五个、至少二十个、至少三十个、至少四十个、至少五十个或至少六十个核苷酸。核苷酸序列的长度可以为例如约30个核苷酸至约3000个碱基或更长，例如长度为30至50个核苷酸，长度为50至100个核苷酸，长度为100至500个核苷酸，长度为500个核苷酸至1kb，长度为1kb至2kb，或2至5kb。例如，反义序列的长度可以为约100个核苷酸至约1kb。例如，用于基因减弱的核酸构建体，例如核酶、RNAi或反义构建体可以包含与内源性脂质调节基因或其一部分具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％或至少85％，例如至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％或至少95％同一性或与其互补的至少十五个、至少二十个、至少三十个、至少四十个、至少五十个、至少六十个或至少一百个核苷酸。

用于反义、RNAi或核酶构建体的启动子可以是在宿主生物体中发挥功能和适合于将靶基因的表达减少至所需量所需的表达水平的任何启动子。在藻类和不等鞭毛类中发挥功能的启动子是本领域已知的和本文公开的。可以使用任何可行的方法，包括本文公开的任何方法将构建体转化至藻类。用核酸分子(诸如但不限于反义、RNAi或核酶构建体)转化以减弱脂质调节基因表达的重组生物体或微生物可以具有本文所述的脂质调节子突变体的性质，包括例如与不包含导致减弱的基因表达的外源核酸分子的宿主生物体或微生物相比，减少的叶绿素、提高的光合效率和在培养中提高的生产率。

核酸分子和构建体

本文还提供了编码多肽的核酸分子，所述多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。作为另外一种选择或除此之外，本文提供的核酸分子可以包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的序列。与选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44和SEQ ID NO:46的氨基酸序列具有至少60％同一性，和/或由与SEQID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43和SEQ ID NO:45具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的核苷酸序列编码的多肽可以包含编码TAZ锌指结构域，例如属于pfamPF02135的域的氨基酸序列。例如，由核酸分子编码的多肽可以包含具有与SEQ ID NO:9具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列的TAZ锌指结构域。作为另外一种选择或除此之外，由本文提供的核酸分子编码的多肽还可以任选地包含布罗莫结构域，例如属于pfamPF00439的结构域。例如，由本文提供的核酸分子编码的多肽可以包含与SEQ ID NO:10具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的布罗莫结构域。

在许多实例中，核酸分子可以是或包含缺乏天然存在的基因中存在的一个或多个内含子的cDNA，或者可以包含天然存在的基因中不存在的一个或多个内含子。在许多实例中，核酸分子可以具有与天然存在的基因不具有100％同一性的序列。例如，核酸分子可以包含就天然存在的基因而言的突变，该突变减少编码多肽的活性或减少由基因编码的mRNA或蛋白质的表达。

在许多实例中，核酸分子可以包含异源启动子，所述异源启动子可操作地连接至以下序列：所述序列编码包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列的多肽，和/或与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性。作为另外一种选择或除此之外，核酸分子可以包括包含以下序列的载体，所述序列编码包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列的多肽，和/或与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性。

本发明的另一个方面是设计用于减弱编码TAZ锌指结构域和/或布罗莫结构域的基因的表达的构建体。在许多实例中，构建体可以是或包含编码CRISPR系统的引导RNA的序列、RNAi构建体、反义构建体、核酶构建体或用于同源重组的构建体，例如具有与本文公开的天然存在的编码TAZ锌指和/或布罗莫结构域的基因具有同源性的一个或多个核苷酸序列和/或基因所源自的天然基因组中邻近所述基因的序列的构建体。例如，构建体可以包含编码具有TAZ锌指结构域和/或布罗莫结构域的多肽的基因的至少一部分，例如与编码以下多肽的基因的至少一部分同源的序列，所述多肽包含与SEQ ID NO:9或SEQ ID NO:10具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的氨基酸序列。

用于基因减弱的构建体可以沿有义或反义方向包含例如编码多肽的基因的编码区的至少一部分、内含子、5’UTR、启动子区或3’UTR，所述多肽为具有TAZ锌指结构域和/或布罗莫结构域的多肽，或与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少60％同一性的多肽；或包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45具有至少50％同一性的基因的至少一部分。

在另外的实例中，构建体可以设计为体外或体内表达引导RNA(如，CRISPR系统的引导RNA)，该引导RNA设计为靶向以下基因，所述基因具有与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的至少一部分具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的序列，或编码具有TAZ锌指结构域和/或布罗莫结构域的多肽或与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少60％同一性的多肽；和/或可以包含与编码具有TAZ锌指结构域和/或布罗莫结构域的多肽的基因的一部分同源的序列，包括例如内含子、5’UTR、启动子区和/或3’UTR。

在又一个实例中，用于减弱编码含有TAZ锌指结构域和/或布罗莫结构域的多肽的基因的表达的构建体可以是引导RNA或反义寡核苷酸，其中与编码具有TAZ锌指结构域和/或布罗莫结构域的多肽的基因的转录区具有同源性的序列沿反义定向。

用于减弱编码TAZ锌指结构域和/或布罗莫结构域的基因或编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少60％同一性的多肽的基因的表达的核酸构建体可以包含以下基因的序列的例如至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个或至少25个核苷酸，所述基因为天然存在的编码TAZ锌指结构域和/或布罗莫结构域的基因，或编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少60％同一性的多肽的基因，和/或与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45中的任一者的一部分具有至少50％同一性的基因。

在一个实例中，本文提供了与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的至少一部分具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的核酸分子，其中该核酸分子编码CRISPR系统的引导RNA。核酸分子可以包含天然存在的TAZ锌指结构域和/或布罗莫结构域基因的序列，诸如但不限于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45的例如至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个或至少25个核苷酸。

此外，本文提供了反义、核酶或RNAi构建体，其包含以下基因的至少一部分，所述基因为编码TAZ锌指结构域和/或布罗莫结构域或与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46中的任一者具有至少60％同一性的多肽的基因，和/或与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45中的任一者的一部分具有至少50％同一性的基因，其中启动子诸如异源启动子可操作地连接至TAZ锌指结构域和/或布罗莫结构域基因序列，并且TAZ锌指结构域和/或布罗莫结构域基因序列沿反义定向。

另外，本文提供了用于同源重组的构建体，其包含来自藻类基因组的编码TAZ锌指结构域和/或布罗莫结构域的基因座的至少一个序列，该序列与异源核酸序列并置，在非限制性实例中所述异源核酸序列可以是选择性标记或可检测标记基因。在一些实例中，用于同源重组的构建体包含来自藻类基因组的编码TAZ锌指结构域和/或布罗莫结构域的基因座的两个核酸序列，其中这两个序列侧接供插入TAZ锌指结构域和/或布罗莫结构域基因座的异源序列。

本领域的技术人员将了解，多种转化方法可以用于微生物的遗传转化，因此可被用于本发明的方法。“稳定转化”旨在意指引入生物体的核酸构建体整合进生物体的基因组并且是稳定附加型构建体的一部分且能够由其子代遗传。“瞬时转化”旨在意指多核苷酸引入生物体中且不整合进基因组或者以另外的方式确立且通过连续传代稳定遗传。

遗传转化可以引起转基因、来自核或质粒的构建体的稳定插入和/或表达，并且在一些情况下可以引起转基因的瞬时表达。转化方法也可以用于引入引导RNA或编辑DNA。据报道，微藻的遗传转化已在超过30种不同的微藻株系获得了成功，这些微藻株系属于绿藻、红藻和褐藻、硅藻、眼虫藻和甲藻的至少约22个种(参见例如Radakovits等人，Eukaryotic Cell，2010；和Gong等人，J.Ind.Microbiol.Biotechnol.，2011)。此类有用的转化方法的非限制性实例包括在玻璃珠或碳化硅晶须存在的情况下搅拌细胞，如例如Dunahay,Biotechniques,15(3):452–460,1993；Kindle,Proc.Natl.Acad.Sci.U.S.A.,1990；Michael和Miller，Plant J.,13,427–435,1998所报道。电穿孔技术已成功用于几种微藻种的遗传转化，包括微拟球藻属(参见例如，Chen等人，J.Phycol.，44:768–76，2008)、小球藻属(参见例如，Chen等人，Curr.Genet.，39:365-370，2001；Chow和Tung，Plant Cell Rep.，第18卷，第9期，778-780，1999)、衣藻属(Shimogawara等人，Genetics，148:1821–1828，1998)、杜氏藻属(Sun等人，Mol.Biotechnol.，30(3):185-192，2005)。微弹轰击(也称为微粒轰击、基因枪转化或生物弹轰击)已成功用于几种藻类种，包括例如硅藻的种，诸如褐指藻属(Phaeodactylum)(Apt等人，Mol.Gen.Genet.，252:572-579，1996)、小环藻属和舟形藻属(Dunahay等人，J.Phycol.，31:1004–1012，1995)、细柱藻属(Cylindrotheca)(Fischer等人，J.Phycol.，35:113-120,1999)和角毛藻属(Miyagawa-Yamaguchi等人，Phycol.Res.59:113–119,2011)，以及绿藻种诸如小球藻属(El-Sheekh，Biologia Plantarum，第42卷，第2期：209-216，1999)和团藻属种(Jakobiak等人，Protist,155:381-93，2004)。另外，农杆菌属(Agrobacterium)介导的基因转移技术也可以用于微藻的遗传转化，如例如Kumar，Plant Sci.，166(3):731-738，2004，和Cheney等人，J.Phycol.，第37卷，增刊11，2001所报道。

本文所述的转化载体或构建体通常将包含将选择性或可评分表型赋予靶宿主细胞，如藻类细胞的标记基因，或可以与包含标记的构建体共转化。许多选择性标记已被成功开发用于藻类的遗传转化子的有效分离。常见选择性标记包括抗生物素抗性、荧光标记和生物化学标记。许多不同的抗生素抗性基因已成功用于选择微藻转化子，包括灭瘟素、博来霉素(参见例如，Apt等人，1996，出处同上；Fischer等人，1999，出处同上；Fuhrmann等人，Plant J.，19，353-61，1999，Lumbreras等人，Plant J.，14(4):441-447，1998；Zaslavskaia等人，J.Phycol.，36:379–386，2000)、壮观霉素(Cerutti等人，Genetics，145:97–110，1997；Doetsch等人，Curr.Genet.，39，49-60，2001；Fargo，Mol.Cell.Biol.，19:6980-90，1999)、链霉素(Berthold等人，Protist，153:401-412，2002)、巴龙霉素(Jakobiak等人，Protist，出处同上；Sizova等人，Gene，277:221-229，2001)、诺尔丝菌素(Zaslavskaia等人，2000，出处同上)、G418(Dunahay等人，1995，出处同上；Poulsen和Kroger，FEBS Lett.，272:3413–3423，2005，Zaslavskaia等人，2000，出处同上)、潮霉素(Berthold等人，2002，出处同上)、氯霉素(Poulsen和Kroger，2005，出处同上)等等。用于微藻诸如衣藻属的另外选择性标记可以是提供卡那霉素抗性和阿米卡星抗性(Bateman,Mol.Gen.Genet.263:404-10,2000)、叶霉素(zeomycin)和腐草霉素(例如，ZEOCIN^TM腐草霉素D1)抗性(Stevens,Mol.Gen.Genet.251:23-30,1996)以及巴龙霉素和新霉素抗性(Sizova等人，2001，出处同上)的标记。已使用的其他荧光或生色标记包括荧光素酶(Falciatore等人，J.Mar.Biotechnol.，1:239–251，1999；Fuhrmann等人，Plant Mol.Biol.，2004；Jarvis和Brown，Curr.Genet.，19:317–322，1991)、β-葡糖醛酸酶(Chen等人，2001，出处同上；Cheney等人，2001，出处同上；Chow和Tung，1999，出处同上；El-Sheekh，1999，出处同上；Falciatore等人，1999，出处同上；Kubler等人，J.Mar.Biotechnol.,1:165–169，1994)、β-半乳糖苷酶(Gan等人，J.Appl.Phycol.，15:345–349，2003；Jiang等人，Plant Cell Rep.，21:1211–1216，2003；Qin等人,High Technol.Lett.，13:87–89，2003)和绿色荧光蛋白(GFP)(Cheney等人，2001，出处同上；Ender等人，Plant Cell，2002，Franklin等人，Plant J.，2002；56，148，210)。

本领域的技术人员将容易地了解，许多已知的启动子序列可以有用地配置用于根据本发明的微藻物种的转化系统。例如，通常用于驱动微藻中的转基因表达的启动子包括许多形式的花椰菜花叶病毒启动子35S(CaMV35S)，其已用于甲藻和绿藻二者(Chow等人，Plant Cell Rep.，18:778-780，1999；Jarvis和Brown，Curr.Genet.，317-321，1991；Lohuis和Miller，Plant J.，13:427-435，1998)。还报道了，来自猿猴病毒的SV40启动子在几种藻类中具有活性(Gan等人，J.Appl.Phycol.，151 345-349，2003；Qin等人，Hydrobiologia 398-399，469-472，1999)。也可以使用来自衣藻属的RBCS2(核酮糖二磷酸羧化酶，小亚基)(Fuhrmann等人，Plant J.，19:353-361，1999)和PsaD(光系统I复合物的丰富蛋白；Fischer和Rochaix，FEBS Lett.581:5555-5560，2001)的启动子。当置于其他启动子上游时，HSP70A/RBCS2和HSP70A/β2TUB(微管蛋白)的融合启动子(Schroda等人，Plant J.，21:121-131，2000)也可以用于转基因的改善表达，其中HSP70A启动子可以用作转录活化因子。所关注的基因的高水平表达也可以在例如硅藻种中，在编码硅藻岩藻黄素-叶绿素a/b结合蛋白的fcp基因(Falciatore等人，Mar.Biotechnol.，1:239-251，1999；Zaslavskaia等人，J.Phycol.36:379-386，2000)或编码黄绿藻紫黄素-叶绿素a/b结合蛋白的vcp基因(参见美国专利No.8,318,482，该专利以引用的方式并入本文)的启动子的控制下实现。如果需要，诱导型启动子可以提供基因在转基因微藻中的快速和严格控制的表达。例如，编码硝酸还原酶的NR基因的启动子区可以用作此类诱导型启动子。NR启动子活性通常受到铵的抑制并且在铵被硝酸盐替换时诱导(Poulsen和Kroger，FEBS Lett 272:3413-3423，2005)，因此当微藻细胞在铵/硝酸盐存在的情况下生长时基因表达可以被关闭或打开。可以用于本文提供的构建体和转化系统的另外藻类启动子包括美国专利No.8,883,993；美国专利申请公开No.US 2013/0023035；美国专利申请公开No.US 2013/0323780；和美国专利申请公开No.US 2014/0363892中公开的那些，所有专利申请以引用的方式整体并入本文。

宿主细胞可以是未转化的细胞或已经用至少一种核酸分子转染的细胞。例如，工程改造为具有减弱的脂质调节基因的表达的藻类宿主细胞还可以包含可以赋予任何所需性状的一个或多个基因，所述所需性状诸如但不限于提高所关注的生物分子，诸如一种或多种蛋白质、颜料、醇或脂质的产量。

产生脂质的方法

本文还提供了通过在相同的培养条件下培养与对照细胞相比具有提高的脂质生产率，同时产生对照细胞产生的生物质的至少45％的生物质的本文提供的突变微生物来产生脂质的方法。该方法包括在合适的培养基中培养本文提供的突变微生物以产生脂质，以及从培养物回收生物质或至少一种脂质。在一些实例中，微生物可以是藻类，并且培养物可以是光合自养培养物。培养可以以分批、半连续或连续模式进行。

在一些实例中，突变微生物可以在含有少于约5mM的铵，例如少于约2.5mM的铵、少于约2mM的铵、少于约1.5mM的铵、少于或等于约1mM的铵或少于或等于约0.5mM的铵的培养基中培养。培养基可以包含例如约0至约2.5mM铵、约0.1至约2.5mM铵、约0.5至约2.5mM铵、约0至约1.5mM铵、约0.1至约1mM铵、或约0.2至约1mM铵。微生物可以在含有硝酸盐的培养基中培养，在一些实例中硝酸盐可以是培养基中的基本上唯一氮源，或可以以除少于5mM铵、少于2.5mM铵、少于1.0mM铵或少于或等于约0.5mM铵之外的量存在。作为另外一种选择或除此之外，培养基可以包含尿素，在一些实例中尿素可以是培养基中的基本上唯一氮源。

产生脂质的微生物可以在任何合适的容器，包括烧瓶或生物反应器中培养。在一些实例中，突变微生物是藻类并且暴露于光下持续培养期的至少一部分，其中藻类可以暴露于人造或自然光下(或补充有人造光的自然光)。包含响应于弱光解除调节的突变藻类的培养物可以在光照/黑暗循环中培养，该光照/黑暗循环可以是例如自然或编程的光照/黑暗循环，并且作为说明性实例，可以提供十二小时光照至十二小时黑暗、十四小时光照至十小时黑暗、十六小时光照至八小时黑暗等。或者，藻类突变体可以在连续光照中培养。

培养是指通过使用选择和/或控制的条件有意的促进一种或多种细胞的生长(例如，增加细胞大小、细胞内容物和/或细胞活性)和/或繁殖(例如，通过有丝分裂增加细胞数量)。生长与繁殖二者的组合可称为增殖。本文提供的微生物可以培养至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二天、至少十三天、至少十四天或至少十五天或至少一周、两周、三周、四周、五周、六周、七周、八周、九周或十周或更长。培养可以在就对照藻类而言营养素充足的培养基中进行。

可以用于培养重组微生物的选择和/或控制的条件的非限制性实例可以包括使用确定的培养基(具有已知特征，诸如pH、离子强度和/或碳源)、指定温度、氧气张力、二氧化碳水平、在生物反应器中生长等等或其组合。在一些实施方案中，可以使用光和还原碳源使微生物或宿主细胞以兼养方式生长。或者，可以以光养方式培养微生物或宿主细胞。当以光养方式生长时，藻类株系可以有利地使用光作为能源。无机碳源诸如CO2或碳酸氢盐可以被微生物用于合成生物分子。如本文所用，“无机碳”包括不能由生物体用作可持续能源的含碳化合物或分子。通常“无机碳”可以为CO2(二氧化碳)、碳酸、碳酸氢盐、碳酸盐、酸式碳酸盐等等或它们的组合的形式，它们不能进一步氧化用于可持续能量也不能被生物体用作还原力的来源。以光合自养方式生长的微生物可以在其中无机碳基本上是唯一碳源的培养基上生长。例如，在其中无机碳基本上是唯一碳源的培养物中，可在培养基中提供的任何有机(还原)碳分子或有机碳化合物不能被细胞摄取和/或代谢用于能量和/或不以足以提供用于细胞培养物的生长和增殖的可持续能量的量存在。

可根据本发明的方法使用的微生物和宿主细胞可以存在于全世界各个地方和环境中。用于脂质和/或其他产物的最佳繁殖和传代的特定生长培养基可以改变并且可以优化为促进产物诸如脂质、蛋白质、颜料、抗氧化剂等的生长、繁殖或产生。在一些情况下，某些微生物菌株由于存在一些抑制性组分或不存在特定微生物菌株或宿主细胞的一些必需营养要求，可能不能在特定生长培养基中生长。

固体和液体生长培养基通常可从许多来源获得，用于制备适用于许多微生物菌株的特定培养基的说明也可从许多来源获得。例如，关于用于培养藻类的培养基和方法，许多新鲜水和盐水培养基可以包括Barsanti(2005)Algae:Anatomy,Biochemistry&Biotechnology,CRC Press中描述的那些。藻类培养基配方也可见于许多藻类培养物保藏中心网站，包括，作为非限制性实例，UTEX藻类培养物保藏中心(UTEX Culture Collection of Algae)(www.sbs.utexas.edu/utex/media.aspx)；藻类和原生动物培养物保藏中心(Culture Collection of Algae and Protozoa)(www.ccap.ac.uk)；以及Katedra Botaniky(botany.natur.cuni.cz/algo/caup-media.html)。

培养方法可以任选地包括诱导一种或多种基因的表达和/或调节微生物中的代谢途径。诱导表达可以包括将营养素或化合物加入培养物，从培养基移除一种或多种组分，增加或减少光照和/或温度，和/或促进所关注的基因的表达的其他操纵。此类操纵可以在很大程度上取决于可操作地连接至所关注的基因的(异源)启动子的性质。

在本发明的一些实施方案中，具有提高的脂质生产率的微生物可以在配备有人造光源和/或具有一个或多个足以透过光(包括自然光)的壁的光生物反应器中培养，以允许、促进和/或维持可接受的微生物生长和增殖。对于脂肪酸产物或三酰甘油的产生，光合微生物或宿主细胞可以另外地或替代地在摇瓶、试管、小瓶、微量滴定盘、培养皿等等或其组合中培养。

另外地或替代地，突变或重组光合微生物或宿主细胞可以在池塘、水渠、海基生长容器、壕沟、水沟、河道等等或其组合中生长。在此类系统中，温度可以是未调节的，或可以使用许多加热或冷却方法或装置。就标准生物反应器而言，无机碳源(诸如但不限于CO2、碳酸氢盐、碳酸盐等等)包括但不限于空气、富含CO2的空气、烟道气等等或其组合可以提供给培养物。当提供除CO2之外还可以包含CO的烟道气和/或其他无机源时，可为必要的是预处理此类源以使得引入(光)生物反应器的CO水平不构成就微生物的生长、增殖和/或存活而言的危险和/或致死剂量。

突变微生物可以任选地包含一个或多个编码用于产生产物诸如但不限于脂质的多肽的一个或多个非天然基因。

方法包括培养本文提供的突变微生物，诸如本文提供的在产生生物质或脂质的相同培养条件下，与对照细胞相比具有提高的脂质生产率，同时产生对照细胞产生的生物质的至少50％的生物质的突变微生物。脂质可以通过本领域的普通技术人员已知的回收手段从培养物回收，诸如通过例如使用有机溶剂的全培养物提取或通过首先分离脂质从中提取的生物质(参见例如Hussein等人Appl.Biochem.Biotechnol.175:3048-3057；Grima等人(2003)Biotechnol.Advances 20:491-515)。在一些情况下，脂肪酸产物的回收可以通过细胞的均化而增强(Gunerken等人(2015)Biotechnol.Advances 33:243-260)。例如，可以通过在升高的温度和/或压力下使用溶剂提取藻类而从藻类分离脂质诸如脂肪酸、脂肪酸衍生物和/或三酰甘油，如2012年2月29日提交的标题为“用溶剂从藻类提取产物(Solvent Extraction of Products from Algae)”的共同未决、共同受让的美国专利公开No.US 2013/0225846中所描述，该专利以引用的方式整体并入本文。

生物质可以例如通过离心或过滤来收集。生物质可以是干燥的和/或冷冻的。可以从生物质分离另外的产物，诸如例如许多脂质或一种或多种蛋白质。本发明还包括藻类生物质，其包括脂质调节子突变体的生物质，所述突变体诸如本文公开的任何脂质调节子突变体，诸如但不限于包含以下基因中的突变的脂质调节子突变体，所述基因编码与包含选自SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44和SEQ ID NO:46的氨基酸序列的多肽具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽。

作为另外一种选择或除前述实施方案中的任一个之外，本发明还提供了以下实施方案：

实施方案1是突变微生物，其产生在其中对照微生物和突变微生物产生生物质的基本上相同的条件下培养的对照微生物所产生的多至少25％的脂质和多至少45％的生物质，任选地其中满足以下各项中的任一项或多项：

(a)所述对照微生物是野生型微生物：

(b)在至少三天、至少四天、至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二天、至少十三天、至少十四天、至少十五天、至少二十天、至少三十天或至少六十天的培养期期间，所述突变微生物产生达所述对照微生物的生物质的至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少100％、至少105％、至少110％、至少120％或至少150％的生物质，其可以以平均生物质(例如，TOC)生产率/天评估；

(c)在至少至少三天、至少四天、至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二天、至少十三天、至少十四天、至少十五天、至少二十天、至少三十天或至少六十天的培养期期间，所述突变微生物产生比对照微生物所产生的脂质多至少25％、至少30％、至少55％、至少40％、至少45％、至少50％、至少55％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少100％、至少110％、至少115％、至少120％或至少150％的脂质，其可以以平均脂质(例如，FAME)生产率/天评估；

(d)培养基包含少于约5mM、少于约4mM、少于约3mM、少于2.5mM的铵、少于或等于约2mM的铵、少于或等于约1.5mM的铵、少于或等于约1mM的铵或少于或等于约0.5mM的铵；

(e)所述培养基包含硝酸盐，任选地其中硝酸盐是所述培养基中的基本上唯一氮源；和/或

(f)所述微生物是不等鞭毛类或藻类。

实施方案2是根据实施方案1所述的突变微生物，其中所述突变体具有减弱的编码以下多肽的基因的表达，所述多肽：

(a)包含TAZ锌指结构域和/或布罗莫结构域；和/或

(b)与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少96％、至少97％、至少98％或至少99％同一性。

实施方案3是根据实施方案1或实施方案2所述的突变微生物，其中所述突变体是经典衍生的突变体或工程改造的突变体，任选地其中所述突变体是以下工程改造的突变体：

(a)具有编码脂质生物合成的调节子的断裂基因，其中所述基因在编码区中或在非编码区中断裂；

(b)缺失编码脂质生物合成的调节子的基因的全部或一部分；

(c)包含靶向编码脂质生物合成的调节子的基因的反义构建体、RNAi构建体、引导RNA构建体或核酶构建体；

(d)包含编码脂质生物合成的调节子的基因中的插入，任选地其中所述插入通过CRISPR/cas基因组编辑产生，另外任选地其中所述插入在所述基因的非编码部分中，诸如例如所述基因的5’UTR、启动子区、3’UTR或内含子；和/或

(e)包含编码脂质生物合成的调节子的基因中的突变，所述突变任选地通过CRISPR/cas基因组编辑产生，任选地其中所述突变在所述基因的非编码部分中，另外任选地其中所述突变在所述基因的5’UTR、启动子区、3’UTR或内含子中。

实施方案4是根据实施方案1至3中的任一个所述的突变微生物，其中：

(a)当在其中对照和突变微生物二者均产生生物质的条件下培养时，所述突变体产生比对照细胞所产生的FAME多至少50％的FAME(例如，每天平均生产率)，同时产生对照细胞所产生的TOC的至少85％或至少90％的TOC，例如，以每天计的TOC生产率；和/或

(b)其中当在其中所述对照和突变微生物二者均产生生物质的条件下培养时，所述突变微生物的FAME/TOC比率比所述对照微生物的FAME/TOC大至少30％、至少35％、至少40％、至少45％或至少50％，同时产生对照细胞(诸如野生型细胞)所产生的TOC的至少85％或至少90％的TOC；和/或

(c)当在其中所述对照和突变微生物二者均产生生物质的条件下培养时，所述突变微生物的FAME/TOC比率为至少0.30、至少0.35、至少0.40、至少0.5或介于约0.3和约0.8之间，和/或

(d)其中FAME/TOC比率维持在介于0.3和约0.7之间持续至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二天或至少十三天的培养期，在所述培养期期间所述突变微生物产生对照微生物所产生的生物质的至少50％、至少60％、至少70％或至少75％、至少80％或至少85％的生物质，所述对照微生物在其中所述对照微生物积聚生物质的相同的条件下培养。

实施方案6是根据实施方案1至3中的任一个所述的突变微生物，其中：

(a)当在其中野生型和突变微生物二者均产生生物质的条件下培养时，所述突变体产生比对照微生物(诸如野生型细胞)多至少25％、至少30％、至少35％、至少40％、至少45％或至少50％的FAME(例如，以每天平均值计)，同时产生对照微生物所产生的TOC的至少90％、至少95％、至少100％的TOC(例如，以每天平均值计)；和/或

(b)当在其中野生型和突变微生物二者均产生生物质的条件下培养时，所述突变微生物的FAME/TOC比率比对照微生物的FAME/TOC比率大至少25％、至少30％、至少35％、至少40％、至少45％或至少50％；和/或

(c)当在其中所述野生型积聚生物质的条件下培养时，所述突变微生物的FAME/TOC比率为至少0.30、至少0.35、至少0.40、至少0.45或至少0.50，并且所述突变微生物产生对照微生物所产生的TOC的至少80％、至少85％、至少90％或至少95％的TOC。

实施方案7是根据实施方案1至6中的任一个所述的突变微生物，其中：

(a)其中所述突变微生物产生更多脂质的培养条件是分批、半连续或连续培养；和/或

(b)在整个培养期中，例如在整个至少三天、至少四天、至少五天、至少六天、至少七天、至少八天、至少九天、至少十天、至少十一天、至少十二天、至少十三天、至少十四天、至少十五天、至少二十天、至少三十天或至少六十天的培养期中的每天，所述突变体的每日脂质生产率大于所述对照微生物的每日脂质生产率。

实施方案8是根据实施方案1至7中的任一个所述的突变微生物，其中所述突变微生物包含减少基因表达的基因的非编码区中的突变，任选地其中所述突变是插入。

实施方案9是根据实施方案1至7中的任一个所述的突变微生物，其中所述突变微生物包含减少基因表达的构建体，其中所述构建体编码RNAi、引导RNA、反义转录物或核酶。

实施方案10是根据实施方案1至9中的任一个所述的突变微生物，其中所述突变微生物是粘菌门的种，

任选地其中所述突变微生物是属于以下属中的任一种的种：网粘菌属、类网粘菌、破囊壶菌属、裂殖壶菌属、不动壶菌属、Aurantiochytrium、矩圆壶菌属、日本壶菌属、双孔虫属或吾肯氏壶菌属；或其中所述突变微生物是藻类种，

任选地属于以下属中的任一种的种：曲壳藻属、茧形藻属、双眉藻属、纤维藻属、星胞藻属、黄金色藻属、Bolidomonas、波氏藻属、气球藻属、葡萄藻属、片球藻属、角毛藻属、四鞭藻属、衣藻属、绿球藻属、绿梭藻属、小球藻属、蓝隐藻属、金球藻属、鳄球藻属、隐甲藻属、隐藻属、小环藻属、栅藻属、杜氏藻属、后棘藻属、赫氏圆石藻属、独球藻属、衣迪斯藻属、眼虫藻属、真眼点藻属、被棘藻属、脆杆藻属、拟脆杆藻属、丽丝藻属、红球藻属、菱板藻属、赤潮异弯藻属、膜胞藻属、等鞭金藻属、鳞孔藻属、微星藻属、蒜头藻属、单针藻属、微绿球藻属、微拟球藻属、舟形藻属、新绿藻属、异鞭藻属、肾藻属、菱形藻属、棕鞭藻属、鞘藻属、卵囊藻属、青绿藻属、拟小球藻属、缺刻缘绿藻属、帕氏藻属、巴夫藻属、金藻属、褐指藻属、噬菌体属、Picochlorum、扁藻属、颗石藻属、肋球藻属、原壁菌属、伪小球藻属、伪新绿藻属、伪角星鼓藻属、塔胞藻属、桑椹藻属、栅列藻属、裂衣藻属、骨条藻属、水绵藻属、裂丝藻属、四球藻属、扁藻属、海链藻属、黄丝藻属、无隔藻属、鲜绿球藻属、魏氏藻属和团藻属。

实施方案11是包含实施方案1至10中的任一个的突变微生物中的任一个的生物质。

实施方案12是核酸分子，其包含编码以下多肽的序列，所述多肽与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性，

其中满足以下各项中的任一项或多项：

(a)所述多肽包含编码TAZ锌指结构域的氨基酸序列，任选地其中所述TAZ锌指结构域与SEQ ID NO:9具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性；

(b)所述多肽包含编码布罗莫结构域的氨基酸序列，任选地其中所述布罗莫结构域与SEQ ID NO:10具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性；

(c)在许多实例中，所述核酸分子包括缺乏天然存在的基因中存在的一个或多个内含子的cDNA，或者是包含天然存在的基因中不存在的一个或多个内含子的基因构建体；

(d)在许多实例中，所述核酸分子可以具有与天然存在的基因不具有100％同一性的序列；

(e)所述核酸分子与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46或其任一者的一部分具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性；

(f)所述核酸分子包含可操作地连接至所述序列的异源启动子；和/或

(g)所述核酸分子包括载体。

实施方案13是用于减弱基因的表达的核酸分子构建体，所述基因编码根据与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽，其中所述核酸分子构建体包括：

编码CRISPR系统的引导RNA的序列、RNAi构建体、反义构建体、核酶构建体或用于同源重组的构建体；

另外任选地其中所述核酸分子构建体包含与本文公开的编码天然存在的TAZ锌指结构域的基因具有同源性的一个或多个核苷酸序列；和/或基因所源自的天然基因组中其邻近的序列。

实施方案14是工程改造细胞以增加脂质产量的的方法，其包括减弱进入微生物的基因的表达，以产生比祖先微生物具有更高的脂质生产率的突变微生物，所述基因是编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:46具有至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的多肽的基因，任选地是具有与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:45中的任一者具有至少50％、至少55％、至少60％、至少65％、至少70％或至少75％、至少80％、至少85％、至少90％或至少95％同一性的编码序列的基因，任选地其中减弱所述基因的表达包括将根据实施方案13所述的核酸分子引入所述微生物。

实施方案15是用于产生脂质的方法，其包括培养根据实施方案1至10中的任一个所述的突变体，以产生脂质，任选地其中满足以下各项中的任一项或多项：

(a)所述培养基包含硝酸盐；

(b)所述培养基包含少于5mM、少于4mM、少于3mM、少于2.5mM的铵、少于或等于约2mM的铵、少于或等于约1.5mM的铵、少于或等于约1mM的铵或少于或等于约0.5mM的铵；

(c)所述培养是分批、半连续或连续培养；

(d)所述培养期是至少5天、7天、8天、9天、10天、11天、12天、13天、至少15天、20天、30天、40天、50天或60天；

(e)所述突变体是藻类突变体，并且所述培养是光合自养的；

(f)在所述培养期期间，所述突变体产生比对照微生物多至少25％的脂质，优选地是FAME脂质，和对照微生物的生物质的至少45％的生物质；

(g)在所述培养期的每天，所述突变体产生更多的脂质，优选地FAME脂质；和/或

(h)在所述培养期的每天，所述突变体积聚生物质。

实施方案16是用于产生脂质的方法，其包括在其中FAME/TOC比率在整个培养期中维持在介于约0.3和约0.8之间的条件下培养微生物，任选地其中满足以下各项中的任一项或多项：

(a)所述培养基包含硝酸盐；

(b)所述培养基包含少于5mM、少于4mM、少于3mM、少于2.5mM的铵、小少于2mM的铵、少于或等于约1.5mM的铵、少于或等于约1mM的铵或少于或等于约0.5mM的铵；

(c)所述培养是分批、半连续或连续培养；

(d)所述培养期是至少5天、7天、8天、9天、10天、11天、12天、13天、至少15天、20天、30天、40天、50天或60天；

(e)所述微生物是藻类微生物，并且所述培养是光合自养的；

(f)在所述培养期的每天，所述微生物积聚生物质；和/或

(g)所述微生物是根据实施方案1至10中的任一个所述的突变微生物。

实施例

实施例中所用的培养基

PM066培养基(实施例1)包含10mM硝酸盐作为唯一氮源。PM066培养基包含10mM硝酸盐(NO3)和0.417mM磷酸盐(PO4)以及痕量金属和维生素，溶于Instant Ocean盐。PM066培养基通过将5.71ml 1.75M NaNO3储备液(148.7g/L)和5.41ml 77mM K2HPO4·3H2O储备液(17.57g/L)加入981ml Instant Ocean盐溶液(35g/L)以及4ml螯合金属储备液和4ml维生素储备液来制备。螯合金属储备液通过向400ml水中加入2.18g Na2EDTA·2H2O；1.575g FeCl3·6H2O；500μl39.2mM储备液(0.98g/100ml)CuSO4·5H2O；500μl 77.5mM储备液(2.23g/100ml)ZnSO4·7H2O；500μl 42.0mM储备液(1.00g/100ml)CoCl2·6H2O；500μl 910.0mM储备液(18.0/100ml)MnCl2·4H2O；500μl 26.0mM储备液(0.63g/100ml)Na2MoO4·2H2O；补足至500ml的最终体积并过滤灭菌来制备。维生素储备液通过向400ml水中加入0.05g盐酸硫胺素、500μl 0.37mM氰钴胺素储备液(0.05g/100ml)；以及2.5ml 0.41mM生物素储备液(0.01g/100ml)，补足至500ml最终体积并过滤灭菌来制备。

PM067培养基不包含氮源(无硝酸盐或铵)，但包含0.417mM磷酸盐(PO4)以及痕量金属和维生素，溶于Instant Ocean盐。PM067培养基通过将5.41ml 77mM K2HPO4·3H2O储备液(17.57g/L)以及4ml螯合金属储备液和4ml维生素储备液加入987ml Instant Ocean盐溶液(35g/L)来制备。螯合金属储备液通过向400ml水加入2.18g Na2EDTA·2H2O；1.575g FeCl3·6H2O；500μl 39.2mM储备液(0.98g/100ml)CuSO4·5H2O；500μl 77.5mM储备液(2.23g/100ml)ZnSO4·7H2O；500μl 42.0mM储备液(1.00g/100ml)CoCl2·6H2O；500μl 910.0mM储备液(18.0/100ml)MnCl2·4H2O；500μl 26.0mM储备液(0.63g/100ml)Na2MoO4·2H2O，补足至500ml最终体积并过滤灭菌来制备。维生素储备液通过向400ml水中加入0.05g盐酸硫胺素；500μl 0.37mM氰钴胺素储备液(0.05g/100ml)；以及2.5ml 0.41mM生物素储备液(0.01g/100ml)，补足至500ml最终体积并过滤灭菌来制备。

PM074是通过将1.3mlF/2藻类饲料部分A(Aquatic Eco-Systems)和1.3mlF/2藻类饲料部分B(Aquatic Eco-Systems)加入1升最终体积Instant Ocean盐溶液(35g/L)(Aquatic Eco Systems,Apopka,FL)来制备的10X F/2氮充足(“仅硝酸盐”)培养基。脯氨酸A和脯氨酸B一起包含8.8mM NaNO3、0.361mM NaH2PO4.H2O、10X F/2痕量金属和10X F/2维生素(Guillard(1975)Culture of phytoplankton for feeding marine invertebrates，载于“Culture of Marine Invertebrate Animals”(Smith W.L.和Chanley M.H.编)Plenum Press,New York,USA，第26–60页)。

PM123培养基是补充有另外的脯氨酸B使得硝酸盐浓度从大约8.8mM提高至大约15mM的PM074培养基。这也是“仅硝酸盐”培养基。

PM124培养基是补充有5mM铵和10mM HEPES(pH8.0)的PM074。它通过将10ml 1M HEPES(pH8)和5ml NH4Cl加入PM074配方来制备(最终体积1L)。具有控制铵水平的另外培养基通过调整PM074的铵浓度和加入另外的Hepes缓冲剂来制备。

PM066、PM074、PM123和PM124培养基就野生型微拟球藻属而言是氮充足和营养素充足的。

实施例1.在氮饥饿期间下调的多肽的鉴定。

为了鉴定影响脂质生物合成的基因，进行比较转录物组学实验，其中将在氮饥饿下(在该条件下微拟球藻属诱导储存脂质生物合成)加的斯微拟球藻细胞的基因的RNA转录物水平与在相同条件下(不同的是生长培养基中氮的量不受限制)生长的相同加的斯微拟球藻株系的RNA转录物水平进行比较。

使野生型加的斯微拟球藻(WT-3730)细胞在营养素充足培养基中16小时光照(120μE)/8小时黑暗循环下生长至光限制，在光周期开始时离心沉降并重悬于氮充足培养基PM074或缺乏氮源的培养基(“氮缺乏”培养基PM067)中。在重悬于氮充足或氮缺乏培养基后三小时从每个样品分离RNA。通过离心沉降10mL每种藻类细胞培养物(4000×g，5分钟)并倾析上清液来分离RNA。将沉淀重悬于1.8mL缓冲剂A(5mL TLE研磨缓冲剂、5mL苯酚、1mL 1-溴-3-氯丙烷和20μl巯基乙醇，其中TLE研磨缓冲剂包含9mL 1M Tris(pH8)、5mL10％SDS、0.6mL 7.5M LiCl和0.45M EDTA，最终体积为50mL)中并转移至含有大约0.5mL 200μm锆珠粒的2mL微量离心管中。将管在4℃下剧烈涡旋5min然后以11.8×g离心2min。然后移除水层并吸移至新的2mL管中，向其加入1mL 25:24:1酚提取缓冲液(25mL苯酚(pH8或5.1)；24mL 1-溴-3-氯丙烷和1mL异戊醇)。剧烈振荡管并以11.8×g离心2min。在离心之后，移除水层并吸移至新的2mL离心管，向其加入1ml 1-溴-3-氯丙烷。振荡该管并以11.8×g再次离心2min。将水层移至新管中并加入0.356体积7.5M LiCl。将管翻转10-12次并储存于-20℃下过夜。第二天，使样品在不混合的情况下升至室温并以16,000×g离心30分钟。移除上清液并用1mL冰冷的80％乙醇洗涤沉淀。将管以16,000×g离心30min并在移除上清液之后使其风干。最后，将RNA沉淀重悬于50μl超纯水中。根据制造商说明书使用Agilent 2100生物分析仪和RNA6000LabChip通过芯片上凝胶电泳(on-chip gel electrophoresis)评估RNA质量。

根据制造商说明书利用TruSeq标准mRNA样品制备试剂盒(Illumina,San Diego,CA)从分离的RNA制备新一代测序文库。使用边合成边测序法(Illumina MiSeq)对TruSeq文库测序，以使用mRNA-Seq程序产生100bp双端读段(如Mortazavi等人(2008)Nature Methods 5:621-628所述)。使用TopHat(tophat.cbcb.umd.edu/)将可映射的读段与加的斯微拟球藻参考基因组序列比对。使用Cufflinks软件的Cuffdiff组件(cufflinks.cbcb.umd.edu)计算每个注释基因的表达水平。使用R软件包edgeR(McCarthy等人(2012)Nucl.Acids Res.40:doi:10/1093/nar/gks042)进行差异表达分析。使用标准参数对于每种样品中的每个基因报道以每百万每千个碱基片段数(FPKM)为单位的表达水平。FPKM是针对转录物长度差异而标准化的相对转录水平的量度。

从该分析编制在氮充足和氮缺乏条件下差异表达的基因列表。将差异表达的基因列表与推定的微拟球藻属转录因子的生物信息学规划列表进行比较，该转录因子的生物信息学规划列表先前使用植物转录因子数据库作为参考通过挖掘微拟球藻属基因组的含有DNA结合结构域和特征性转录因子特有的其他保守pfam域的蛋白质而在内部产生(Perez-Rodriguez等人(2010)Nucl.Acids Res.38:D822-D827；Jin等人(2013)Nucl.Acids Res.42:D1182-D1187)。

如共同拥有、共同未决的美国专利申请15/210,845中所公开，ZnCys-2845基因被鉴定为在氮缺乏开始时差异调节的转录因子基因(图1A)。未鉴定为转录因子的第二基因也被鉴定为在氮充足和氮缺乏样品之间差异表达的。该编码多肽(SEQ ID NO:2)的基因(以SEQ ID NO:1提供的cDNA序列)编码具有可见于转录共调节子的结构域的多肽。据观察，该多肽具有TAZ锌指结构域(PfamPF02135)、可见于转录调节子的蛋白质-蛋白质相互作用域(参见例如Guzman等人(2004)J.Biol.Chem.279:3042-3049)和布罗莫结构域(pfam PF00439)(SEQ ID NO:10)、已知结合乙酰化组蛋白的结构域，并且被命名为“Bromo-1091”。图1B中提供了SEQ ID NO:2的多肽的图。

实施例2.Bromo-1091蛋白的生物信息学分析：结构域和直系同源物

除编码SEQ ID NO:2的转录物之外，通过RNA Seq和3’RACE(cDNA末端的快速扩增；Frohman等人(1988).Proc.of the Natl Acad Sci.USA 85:8998–9002)还鉴定了三种另外的起源于Bromo-1091基因并且与SEQ ID NO:1广泛重叠的转录物。使用cDNA扩增试剂盒(Clontech,Mountain View,CA)进行RACE以从使用NUCLEOmRNA微型RNA分离试剂盒(Clontech)分离的RNA获得cDNA。这些转录物的核苷酸序列如SEQ ID NO:3、SEQ ID NO:5和SEQ ID NO:7所提供，它们分别编码SEQ ID NO:4、SEQ ID NO:6和SEQ ID NO:8的多肽。由四个cDNA编码的多肽变体的序列的比对如图2A-C所提供。由Bromo-1091基因的转录物编码的每个多肽包含相同的“TAZ”锌指结构域(PF002135)，即SEQ ID NO:2的氨基酸827-892和SEQ ID NO:4的氨基酸769-834(SEQ ID NO:9)。SEQ ID NO:2和SEQ ID NO:4也包含被鉴定由为Bromo-1091cDNA SEQ ID NO:2编码的多肽中的保守结构域的相同的“Bromo”结构域(pfam PF00439)，即SEQ ID NO:2的氨基酸1223至1264和SEQ ID NO:4的1165-1206(SEQ ID NO:10)。为简洁起见，在本文中我们将全部四条多肽称为“Bromo-1091蛋白”或“Bromo-1091多肽”，其中不同的同种型(同种型a、b、c和d)似乎是交替剪接的结果(称为Bromo-1091转录物a、b、c和d)，不同之处主要在于羧基末端(如，SEQ ID NO:2、4、6和8的多肽的末端25-35个氨基酸)。SEQ ID NO:4也缺乏从SEQ ID NO:2的氨基酸226延伸至氨基酸289的其他同种型中存在的氨基酸片段。

2016年7月14日提交的共同未决和共同拥有的美国专利申请No.15/210,845公开了调节基因“ZnCys-2845”，其突变导致突变株系能够在存在氮源诸如硝酸盐的情况下诱导脂质合成，甚至同时继续繁殖并且积聚生物质。本文新公开的包含TAZ锌指结构域和布罗莫结构域的“Bromo-1091”基因是被发现的第二基因，其突变导致突变株系能够在存在氮源诸如硝酸盐的情况下诱导脂质合成，同时继续繁殖和积聚生物质。ZnCys-2845基因及其在其它物种中的直系同源物在本文中可以称为LION1(“针对硝酸盐的脂质诱导(Lipid Induced On Nitrate)1”)基因，Bromo-1091基因及其直系同源物在本文中称为“LION2”(“针对硝酸盐的脂质诱导2”)基因。

Bromo-1091的许多潜在直系同源物通过生物信息学鉴定。具体地讲，在具有TAZ锌指结构域和布罗莫结构域二者的不等鞭毛虫(不等鞭毛类)中鉴定了许多基因，包括海洋微拟球藻(Nannochloropsis oceanica)中的直系同源物的部分序列(SEQ ID NO:11，编码氨基酸序列SEQ ID NO:12)，其中氨基酸序列(SEQ ID NO:12)似乎不是完整多肽，显示出与SEQ ID NO:2的一部分具有84％同一性，并且包含与加的斯微拟球藻Bromo-1091(“LION2”)多肽(SEQ ID NO:9)的TAZ锌指结构域具有95％同一性的TAZ锌指结构域。包含布罗莫结构域和TAZ锌指结构域二者的其他推定的直系同源物包含来自硅藻，例如褐指藻属、海链藻属、舟形藻属、拟脆杆藻(Fragilariopsis)和小环藻属以及金球藻(Aureococcus)、水云属(Ectocarpus)和网粘菌纲裂殖壶菌属的多肽(参见表1)。

表1.不等鞭毛类中的海洋微拟球藻Bromo-1091的推定的Bromo-1091直系同源物

实施例3.微拟球藻属中Bromo-1091基因座的敲除

为了确定Bromo-1091多肽和脂质诱导之间是否存在任何关系，使用2015年12月31日提交的共同拥有、共同未决的美国专利申请号14/986,492和对应的PCT申请公开no.WO2016/109840中描述的CRISPR技术敲除Bromo-1091基因。如U.S.14/986,492所述，表达编码酿脓链球菌Cas9核酸酶的基因的高效微拟球藻属Cas9编辑系加的斯微拟球藻株系pSGIE-6791被用作用嵌合引导RNA和供体DNA进行转化的宿主以供进行插入敲除。

为了产生高效微拟球藻属Cas9编辑系，工程改造和分离表现出引入的Cas9基因的表达接近100％的生长培养物的细胞群的微拟球藻属株系。用于转化野生型加的斯微拟球藻株系pSGIE-6791的载体pSGE-6206(SEQ ID NO:47)，包含以下三个元件：1)Cas9表达盒，其包含来自酿脓链球菌的、针对加的斯微拟球藻而密码子优化的Cas9基因(SEQ ID NO:48)，所述基因包含编码N-末端FLAG标签的序列(SEQ ID NO:49)、核定位信号(SEQ ID NO:50)和肽接头(SEQ ID NO:51)，由加的斯微拟球藻RPL24启动子(SEQ ID NO:52)驱动并且由加的斯微拟球藻双向终止子2(SEQ ID NO:53)终止；2)选择性标记表达盒，其包含来自土曲霉(Aspergillus terreus)的、针对加的斯微拟球藻而密码子优化的blast基因(SEQ ID NO:54)，由加的斯微拟球藻TCTP启动子(SEQ ID NO:55)驱动，然后是EIF3终止子(SEQ ID NO:56)；以及3)GFP报告基因表达盒，其包含针对加的斯微拟球藻而密码子优化的TurboGFP基因(Evrogen,Moscow,Russia)(SEQ ID NO:57)，由加的斯微拟球藻4A-III启动子(SEQ ID NO:58)驱动，然后是加的斯微拟球藻双向终止子5(SEQ ID NO:59)。

将转化混合物接种至含有100mg/L杀稻瘟素的PM074琼脂培养基。将所得的菌落贴到选择培养基进行分析和存档。从斑块采集小量生物质并完全重悬于300μl 1×Instant Ocean溶液中。注意不要添加太多的生物质从而获得浅绿色重悬物。使用BD Accuri C6流式细胞仪通过流式细胞术直接分析该液体，使用488nm激光和530/10nm滤光器来测量每个细胞的GFP荧光。使用慢速射流设置记录每个样品的10,000-30,000个事件。所得的图用独立运行的野生型细胞(即，不表达荧光蛋白的细胞)的图覆盖。只有培养物中具有完全外显表达的株系才用于进行后续实验；这意味着流式细胞术图显示出单峰或钟形曲线，其中当以对数尺度绘制时，峰值完全偏移高于野生型自体荧光峰。这些株系被称为“完全外显的”Cas9表达株系，因为GFP基因的表达可见于株系培养物的全部细胞中。也就是说，虽然在任何给定时间点，GFP的量(从而荧光)在细胞之间可以稍微变化，得到钟形曲线，但是不存在表现出独特的GFP表达分布的细胞亚群。因此，完全外显的株系是其中存在单峰(或具有峰的钟形曲线)的株系，其中该峰为分离形式并且荧光值大于非表达细胞(例如，未用GFP表达构建体转化的细胞)的背景峰。因为GFP基因与Cas9基因物理相关，所以据推测Cas9基因也可能在完全外显的GFP株系的株系培养物的全部细胞中表达。

随后通过蛋白质印迹测试相对于非转化细胞显示出单个明显的偏移荧光峰的完全外显的Cas9株系，其中抗FLAG抗体作为Cas9表达的证据。具有偏移至大于野生型细胞所显示的荧光水平的单荧光峰的并且蛋白质印迹显示出Cas9蛋白表达的株系称为株系GE-6791，该株系被选为通过转化pSGE-6202而获得的完全外显的Cas9株系，所述pSGE-6202用于通过本文所述的基因组编辑进行的突变体产生。

对于靶向Bromo-1091基因以进行断裂，合成(SGI-DNA,La Jolla,CA)T7启动子序列下游的包含嵌合引导序列(SEQ ID NO:60)的DNA分子，所述嵌合引导序列包含对应于Bromo-1091基因内的序列的18bp序列(SEQ ID NO:61))。使用MEGAshortscript^TM T7试剂盒(Life Technologies#AM1354M)根据制造商的说明书将构建体用于体外转录反应。使用Zymo-Spin^TM V-E柱(Zymo Research#C1024-25)根据制造商的方案纯化所得的RNA。

用于插入靶向Bromo-1091基因座的供体片段包含选择性标记盒，其包含加的斯微拟球藻EIF3启动子(SEQ ID NO:63)下游的潮霉素抗性基因(HygR，SEQ ID NO:62)，然后是加的斯微拟球藻双向终止子2(SEQ ID NO:53)，其中整个启动子-潮霉素抗性基因终止子序列被5’(SEQ ID NO:64)和3’(SEQ ID NO:65)末端上的27个碱基对的鉴定序列侧接，产生称为“Hyg抗性盒”的DNA片段(SEQ ID NO:66)。

对于Bromo-1091基因座的靶向敲除，使用5μg纯化的靶向Bromo-1091基因(SEQ ID NO:60)的嵌合引导RNA和1μg可选择供体DNA(Hyg抗性盒；SEQ ID NO:66)通过电穿孔转化SGIE-6791。在电穿孔之后，将细胞接种于含有潮霉素的琼脂培养基上，以选择掺入潮霉素抗性盒的转化子。通过菌落PCR筛选供体片段插入Bromo-1091基因的转化子。

对于菌落PCR筛选，将来自待筛选的菌落的少量细胞悬浮于100μl 5％Chelex 100Resin(BioRad)/TE溶液中，将悬浮液在99℃下煮沸10分钟，然后将管短暂离心。将一微升裂解物上清液加入PCR反应混合物，其中该PCR混合物和反应根据制造商提供的QIAGEN Fast Cycling PCR Master Mix Protocol(该手册可从qiagen.com下载)设定和进行。根据基于PCR的菌落筛选，选择一个敲除株系GE-8563进行进一步分析。

实施例4.分批生产率测定中的Bromo-1091敲除突变体

为了确定敲除Bromo-1091基因对生长和脂质产量的影响，使Bromo-1091敲除株系GE-8563和野生型加的斯微拟球藻祖先株WT-3730在分批生产率测定中生长，其中细胞在含有175ml培养基PM123的75cm²矩形组织培养瓶中培养一周，所述培养基PM123包含15mM硝酸盐作为唯一氮源，即稀释起始培养物以用于生产率分析的培养基无还原氮来源。将WT-3730和GE-8563各自的三个培养瓶从起始培养物接种培养至初始OD730为0.5。Bromo敲除株系GE-8563的起始培养物使用PM124培养基，所述培养基除大约8.8mM硝酸盐之外还包含5mM铵。野生型WT-3730起始培养物使用PM074仅硝酸盐培养基。通常起始培养物稀释至测定培养基为使用PM123(仅硝酸盐)培养基从15-35ml起始培养物稀释至175ml总体积。因此分批测定中铵的初始浓度在大约0.4mM至大约1mM的范围内。将包含1％CO2的空气通过连接至每个培养瓶的盖子的管鼓泡通入培养物，光(从较窄的一侧指向培养瓶(即，光从沿培养瓶的最窄宽度尺寸一侧引入))被编程为模拟南加州春天经历的强度，在“中午”达到峰值大约1200μE的强度。昼夜循环为16h光照/8h黑暗。通过将培养瓶定位于水浴中使温度保持在大约25℃。在第0天接种培养物并且在第3、5和7天移除样品(5ml)用于评估细胞密度、脂肪酸甲酯(FAME)和总有机碳(TOC)。

对2mL使用GeneVac HT-4X干燥的样品进行FAME分析。向干燥的沉淀加入：500μL 500mM溶于甲醇的KOH、200μL含有0.05％丁基化羟基甲苯的四氢呋喃、40μL 2mg/ml C11:0游离脂肪酸/C13:0三酰甘油/C23:0脂肪酸甲酯内标混合物和500μL玻璃珠粒(425–600μm直径)。用敞口PTFE隔膜内衬盖盖住小瓶并且在1.65krpm下置于SPEX GenoGrinder中7.5分钟。然后将样品在80℃下加热五分钟并使其冷却。对于衍生化，将500μL 10％溶于甲醇的三氟化硼加入样品，然后在80℃下加热30分钟。使管冷却，然后加入2mL庚烷和500μL 5M NaCl。然后以2krpm涡旋样品五分钟，最后以1krpm离心三分钟。使用Gerstel MPS自动取样器对庚烷层进行取样。定量使用80μg C23:0FAME内标。

通过用DI水将2mL细胞培养物稀释至20mL总体积来测定总有机碳(TOC)。将每次测量的三种注射液注入Shimadzu TOC-Vcsj分析仪中以用于测定总碳量(TC)和总无机碳(TIC)。将燃烧炉设定为720℃，并且通过从TC减去TIC来测定TOC。4点校准范围为2ppm至200ppm，对应于非稀释培养物的20-2000ppm，其中相关系数r²>0.999。

以分批模式在包含硝酸盐作为唯一氮源的培养基中培养的株系的FAME和TOC分析结果提供于表2-4中。

表2.由野生型和Bromo-1091敲除细胞产生的FAME(μg/ml)

表3.由野生型和Bromo-1091敲除细胞产生的生物质(TOC)(μg/ml)。

表4.Bromo-1091敲除突变体和野生型株系的FAME/TOC比率。

表2示出了到测定的第3天，Bromo-1091敲除突变体已产生比野生型细胞多大约33％的FAME脂质。然而，与野生型细胞相比，脂质产量增加在测定的过程中下降，从而到分析的第5天，突变株系仅产生比野生型所产生的FAME/ml多20％的FAME/ml。到第7天，Bromo-1091敲除培养物具有与野生型培养物基本上相同量的FAME/ml。

表3示出在分批测定的每个阶段，Bromo-1091敲除突变体培养物具有小于野生型培养物的生物质，并且随着测定的进行Bromo-1091敲除突变体培养物的生物质积聚也落后于野生型培养物。

表4示出在测定期间野生型具有大约0.25的典型非诱导FAME/TOC比率(在第3天稍微较大的值0.28可能是由于稀释至测定培养瓶而产生的应激响应，所述稀释至测定培养瓶导致细胞仍可能在第3天恢复的光应激期)。然而，在第3天Brom-1091敲除突变体被诱导产生脂质，如由升高的FAME/TOC比率0.45所证实，即使Bromo-1091敲除突变体在整个测定中继续积聚生物质，例如Bromo-1091敲除突变体积聚的生物质在整个测定中达到的水平仅比野生型细胞积聚的生物质的量少约20-25％，例如少18-27.5％。

将Bromo-1091突变体和野生型株系WT-3730各自在相同的分批测定中培养，不同的是分批测定的培养基为PM124，其包含硝酸盐(8.8mM)和铵(5mM)二者作为氮源。如上文所述移除样品病区分析FAME和TOC。FAME和TOC分析的结果提供于表5-7中。

表5.由在硝酸盐+铵培养基中预培养和分批培养的野生型和Bromo-1091敲除细胞产生的FAME(μg/ml)。

表6.由在硝酸盐+铵培养基中分批培养的野生型和Bromo-1091敲除细胞产生的生物质(TOC)(μg/ml)。

表7.在使用硝酸盐+铵培养基的分批测定中Bromo-1091敲除突变体和野生型株系的FAME/TOC比率。

表2和表5提供的FAME分析结果绘制于图4A中，其中可以看出Bromo-1091敲除培养物，当在作为唯一氮源的硝酸盐上生长时(而不是当培养基包含铵时)，在培养开始时(在第3天)与野生型相比FAME增加，但实际上在第3-7天与野生型相比每天产生的FAME较少，使得到第7天培养物中FAME的量高度相似。低FAME生产率可归因于总体长速率减缓，如图4B所证实，该图提供了测定期间的生物质积聚图。表6示出在存在铵和硝酸盐的情况下生长的Bromo-1091敲除突变体的生物质积聚以及相同培养物的FAME积聚(表5)，二者均类似于到测定第5天的野生型。当突变体和野生型二者在仅硝酸盐培养基中培养时，与野生型(非诱导)细胞相比，Bromo-1091敲除突变体的FAME/TOC比率升高大约60％(表4)。在培养基中包含铵的Bromo-1091敲除突变体培养物的第3天观察到FAME/TOC比率的增加非常少(38％)；然而与野生型细胞相比，在接下来的4天中，该增加显著减少至仅比野生型FAME/TOC比率大10-15％。因此，如在分批测定的过程中的FAME/TOC比率(图4C)所证实，Bromo-1091敲除突变体在仅硝酸盐培养基上诱导脂质生物合成，但当培养基中存在铵时则不诱导。

实施例5.在半连续培养物中Bromo-1091敲除突变体的生长和脂质生物合成

还在半连续生产率测定中测定了Bromo-1091Cas9敲除株系GE-8563。在连续生产率测定中，给225cm²培养瓶中的PM074(仅硝酸盐)培养基接种微拟球藻属种子培养物，使得初始550ml(接种最终体积)培养物具有0.15的初始OD730。典型的稀释在PM124培养基(含有5mM铵)中使用大约150ml起始培养物，其后使用PM074培养基扩大至550ml，使得半连续测定中铵的起始浓度小于1.5mM。随着测定的进行每日使用PM074培养基稀释进一步降低铵浓度。每个株系启动三种培养物。培养瓶包括搅拌棒并且具有带管的塞子，所述管与注射过滤器连接，用于递送鼓泡通入培养物的富含CO2的空气(1％CO2，流速100ml/min)。培养瓶置于搅拌盘上，转速设定为450rpm。使培养瓶与LED光排相对的宽度(最窄尺寸)对齐，该LED光排被编程为光照/黑暗循环，并且光分布在“中午”之前增加，然后减少直到光周期结束。从光源延伸回来的培养瓶的“深度”尺寸为13.7cm。考虑到培养瓶的定位，从光源的表面至培养瓶中细胞的最远距离为大约15.5cm。光分布被设计为模拟南加州的春天：16h光照:8h黑暗，且光强峰值为大约2000uE。每日在光周期的中间(峰值)稀释培养物，所述稀释通过移除30％(150ml)的培养物体积并更换为新鲜的稀释PM074培养基(将66ml去离子H2O加入1L PM074培养基)来进行，以调整由于培养物中出现的蒸发而增加的盐度。从移除用于稀释的培养物采集FAME和TOC分析样品。连续测定通常运行7-14天。表8-10示出了半连续测定中运行的敲除和野生型培养物的FAME和TOC分析的结果。提供了三种培养物的平均值，其中括号中为每个值的标准偏差。

表8.每日在仅硝酸盐培养基中稀释的半连续培养物中的野生型和Bromo-1091敲除细胞的FAME的每日产量(μg/ml)。

表9.每日在仅硝酸盐培养基中稀释的半连续培养物中的野生型和Bromo-1091敲除细胞的TOC的每日产量(μg/ml)。

表10.每日在仅硝酸盐培养基中稀释的半连续培养物中的野生型和Bromo-1091敲除细胞的每日FAME/TOC比率。

在使用仅硝酸盐培养基进行的半连续测定中，Bromo-1091敲除突变体显示出比野生型株系更高的FAME生产率，并且每日生产率高于野生型细胞的FAME生产率约20％至约50％的范围(表8和图5A)。然而，Bromo-1091敲除突变体的生物质(TOC)积聚出乎意料地与野生型细胞一致(表9和图5B)。在测定的过程中，碳与脂质的分配的增加与Bromo-1091敲除突变体的FAME/TOC比率无关(表10和图5C)，这显示出在测定的过程中，突变体具有约0.26至约0.30的FAME/TOC比率，而在相同的培养条件下测定的野生型的FAME/TOC比率在约0.21至0.23之间变化。

实施例6.Cas9Bromo-1091敲低构建体

为了测试可能减少但未消除Bromo-1091基因的表达的另外突变等位基因的生产率，使用实施例3中提供的方法利用Cas9(图6A，参见标记为1-5的箭头)和表11中提供的靶向基因的5’启动子的引导RNA产生基因的启动子区的多个插入。

表11.用于产生插入Bromo-1091基因的启动子的引导RNA序列

如实施例3所述合成和纯化嵌合引导DNA构建体。如实施例3所述，将每个嵌合引导RNA以及包含Hyg抗性(“HygR”)盒(SEQ ID NO:67)的供体片段单独转化至微拟球藻属编辑株系GE-6791。如本文所述使用邻近Bromo-1091基因的靶向区的引物(引物Br-启动子-FP(ATTGCTAGCCGTGCTTTCAAC；SEQ ID NO:73)和Br-启动子-RP(GTCGGTTTGGAGACCCTAGA；SEQ ID NO:74))通过菌落PCR选择和筛选潮霉素抗性菌落，以确认插入Bromo-1091基因的5’区的供体片段。

对从这些“basher”品系分离的RNA进行定量逆转录-PCR(qRT-PCR)以确定这些品系中的Bromo-1091基因的表达是否实际上减少。使Bromo-1091Bash敲低株系在标准氮充足条件(PM074(仅硝酸盐)培养基)下生长并且在早期稳定期期间收集，并且使用上文实施例1中提供的方法从细胞分离总RNA。使用BioRad的iScript^TM Reverse Transcription Supermix逆转录反应混合物试剂盒根据制造商的方案将RNA转换为cDNA。对于PCR，Ssofast^TMSupermix PCR反应混合物(Bio-Rad,Hercules,CA)与基因特异性引物一起使用。在与CFX实时系统(BioRad)偶联的C1000热循环仪上进行PCR反应。引物和cDNA浓度根据制造商的推荐使用。用于扩增Bromo-1091转录物的序列的引物为SEQ ID NO:75和SEQ ID NO:76(表12)。

每个样品的转录物水平使用引物1704-F(SEQ ID NO:77)和1704-R(SEQ ID NO:78)针对在不同的培养条件下具有持续表达水平的管家基因(基因1T5001704)归一化，并且相对表达水平使用BioRad的CFX Manager软件使用ddCT方法来计算。

表12.用于qRT/PCR的引物

图6B示出许多株系具有降低水平的Bromo-1091转录物。其中，靶向Bromo-1091基因的5’末端的株系GE-13027(Bromo-1091BASH-1)、GE-13030(Bromo BASH-4)和GE-GE-13032(Bromo-1091BASH-5)分别以基因的野生型水平的约35％、20％和50％的水平表达Bromo-1091基因。

实施例7.分批测定中的敲低构建体

显示出Bromo-1091基因的减弱表达的Bromo-1091敲低“basher”株系GE-13027、GE-13030和GE-13032(参见图6A和6B)在分批生产率测定中测试，如实施例4所述，该测试通过扩大在培养基PM124(其包含NH4和NO3作为氮源)中的培养以及通过在包含硝酸盐作为唯一氮源的PM123培养基中进行测定来进行。此外，野生型加的斯微拟球藻株系WT-3730和Bromo-1091敲除突变体GE-8563在相同的测定中测试。

如实施例4所提供分析FAME和TOC。这些分析的结果提供于表13-16中，所提供的值是三种培养物的平均值，标准偏差提供于括号中。

表13.在使用仅NO3培养基(mg/L培养物)的分批测定中Bromo-1091敲低株系与野生型相比的FAME生产率

表14.在使用仅NO3培养基(mg/L培养物)的分批测定中Bromo-1091敲低株系与野生型相比的TOC生产率

表15.在使用仅NO3培养基的分批测定中Bromo-1091敲低株系与野生型相比的FAME/TOC比率

表13示出，具有减少表达的Bromo-1091基因的所有基因减弱敲低株系GE-13027、GE-13030和GE-13032产生比野生型株系更多的脂质，如分析在测定的第3、5和7天的所测量。这些敲低株系是比敲除株系GE-8563更持续脂质产生株，GE-8563在测定的第3天产生比野生型多至少30％的脂质，但在测定的第7天脂质产量稍微落后于野生型。表14示出，GE-13027、GE-13030和GE-13032不减少其生物质产量，与敲除株系GE-8563在测定的过程中一样多。实际上，在测定的第7天，GE-13027和GE-13030在相同的测定中产生由野生型细胞所产生的生物质的量的5％之内，并且株系GE-13032仅产生比野生型株系WT-3730少约7％的生物质。在测定的每天，由敲低株系产生的生物质的量显著大于由敲除株系GE-8563所产生的生物质，换句话讲，与野生型株系相比，敲低株系具有的生物质产量仅稍微不足，相比之下，在测定的过程中，相对于野生型生物质的产量水平，敲除株系GE-8563的生物质产量减少约25％-40％。表15提供了在分批测定的第3、5和7天的突变体和野生型培养物的FAME/TOC比率。就野生型株系而言，在第3天敲除株系GE-8563具有的FAME/TOC比率为野生型的两倍(即，大100％)，但该比率在测定的过程中减少至比野生型FAME/TOC比率大约30％。敲低株系与GE-8563所见相比，开始时FAME/TOC比率的增加更缓慢，但在测定的过程中，与野生型相比，增加更持续，对于GE-13027在30-35％的范围内，对于GE13030为23-26％，对于GE-13032为45-53％。

结果以图解方式绘制于图7A-C中。图7A示出，当使用硝酸盐作为唯一氮源培养时，所有Bromo-1091基因敲低减弱突变体(GE-13027(二分X)、GE-13030(+号)和GE-13032(X))产生的FAME的量大于野生型(圆形)，脂质产量的增加在测定结束时最多。这与在仅硝酸盐培养基中培养的敲除突变体(GE-8563，三角形)相反，其中与野生型相比在第3天FAME的增加在测定结束时(第7天)消失。因此，在总FAME产生中，Bromo-1091敲低突变体与敲除突变体相比显著提高。图7B提供了甚至更出乎意料的结果：与敲低株系(三角形)不同的是，在使用硝酸盐作为唯一氮源的的分批培养中，敲低突变体(GE-13027(二分X)、GE-13030(+号)和GE-13032(X))接近在整个培养测定过程中生物质产生的野生型水平。然而，也如图4B所示，与野生型株系(圆形)相比，敲低突变体(三角形)具有的TOC积聚持续显著减少。

图7C示出，当两种株系在仅硝酸盐培养基中分批培养时，与野生型株系相比，敲除株系的FAME/TOC比率增加(也如图4C所示)。图中还示出，与野生型株系相比，对于野生型和敲除株系比率之间的大部分中间值，敲低突变体的FAME/TOC比率增加。

实施例8.半连续生产率测定中的Bromo-1091敲低突变体

然后在实施例5中所述的半连续生产率分测定中测定Bromo-1091减弱(BASH)株系GE-13127、GE-13130和GE-13132，其中测定培养基PM074包含硝酸盐作为唯一氮源，并且敲低株系在除8.8mM硝酸盐之外还包含5mM铵的PM124培养基中预培养。

将起始培养物用于接种225cm²矩形组织培养瓶，每个培养瓶在接种之后包含最终总体积550ml的培养物。接种培养物以使得每种550ml培养物具有0.9的初始OD730。典型接种物体积为大约200ml扩大培养物，将该扩大培养物加至大约350ml分析培养基PM074(仅硝酸盐培养基)。每天中午光强度处于其峰值时，通过移除30％体积(165ml)并更换为相同体积的测定培养基(PM074)+另外10ml去离子水以补充蒸发(包含在补充培养基中)来稀释培养物。因此，测定培养物从扩大培养物接种，该扩大培养物的培养基(PM124培养基)中包含5mM铵，该培养基开始时具有大量铵(如，小于2mM的铵)，在测定的过程期间逐渐进一步稀释。在培养物达到平衡(培养物的生长速率等于30％的稀释速率，由细胞计数和光密度确定)之后，运行半连续测定10天。仅计算已达到稳定状态(其中生长的增加等于测定的稀释因子)的培养物的每日脂质和生物质生产率。每种株系运行三种培养物。

测定的结果提供于图8A-F中。图8A中提供的表格示出了半连续培养物在十天期的每日FAME生产率，其中它们每天稀释30％，每个值为三种培养物的平均值(标准偏差提供于括号中)。每个Bromo-1091敲低突变体具有比野生型株系显著更高的FAME生产率，其中在十天测定过程中GE-13127和GE-13132各自显示出比野生型高至少50％的FAME生产率，其中硝酸盐是细胞的唯一氮源。图8B的图清晰地示出，敲低突变体以显著高于野生型的水平大量持续产生FAME。

图8C提供了以图8A和8B所示的相同测定的半连续培养物的TOC测定的每日生物质生产率，每个值是三种培养物的平均值(标准偏差提供于括号中)。出乎意料的是，虽然突变体在测定的每天产生比野生型细胞更多的脂质(图8A和8B)，但它们产生的生物质并不显著少于野生型细胞(以TOC测定)。因此，与细胞氮饥饿时出现的经典脂质诱导不同的是，与野生型细胞相比，培养物未经历生物质丧失，同时产生比野生型更多的脂质。图8D清晰地示出：虽然培养物显示出每天生物质产量的变化很小，但野生型(圆形)平均未显著超过Bromo-1091减弱突变体。

图8E提供了培养物的每日FAME/TOC比率。在整个培养期过程中，野生型培养物具有0.29的平均FAME/TOC比率，而具有减弱的Bromo-1091基因表达的株系培养物在培养期中具有0.39(株系GE-13030)、0.42(株系GE-13032)和0.50(株系GE-13127)的平均FAME/TOC比率。在十天分析过程中，株系GE-13030具有33％的平均FAME/TOC值，大于野生型培养物；株系GE-13132具有43％的平均FAME/TOC值，大于野生型培养物；株系GE-13027具有72％的平均FAME/TOC值，大于野生型培养物。图8F的图清晰地示出，敲低突变体的大量持续FAME/TOC比率显著高于野生型的比率。

实施例9.Bromo-1091敲低突变体的近似分析

为了确定Bromo-1091减弱突变体的总体生物质组成，对实施例8的培养物样品进行定量分析，以确定半连续培养物中细胞的脂质、蛋白质和碳水化合物含量。

如实施例4所述对实施例8的半连续分析中培养的株系分析FAME脂质，结果提供于图8A中。

为了确定蛋白质含量，使分离的生物质样品水解，并将氨基酸衍生为丙氧基羧基丙基酯(AAPE)，经由GC/MS分析，并且针对内标定量，如下文所详述。

将来自实施例8的培养物(从用于确定FAME含量的相同稀释样品采集)的野生型加的斯微拟球藻(WT-3730)和Bromo-1091减弱(BASH)株系GE-13127(“Bromo Bash-1”)和GE-13132(“Bromo Bash-5”)的0.5ml等分样品离心，并用磷酸盐缓冲盐水(PBS)洗涤沉淀两次。最后将细胞重悬于0.5ml最终体积(起始体积)中并转移至4ml玻璃小瓶。向培养物样品加入800μl含TGA的6M HCl(在使用之前将400μl巯基乙酸(TGA)加入19.6ml 6M HCl)。然后将10μlβ-巯基乙醇加入小瓶，然后加入200μl 20mM正缬氨酸作为内标。每个小瓶用N2覆盖10秒，其后以2500rpm涡旋小瓶1min以均化样品。然后将小瓶置于110℃烘箱中22小时。

在水解温育结束时，以2500rpm涡旋小瓶10min，然后以最高1000rpm离心，之后停止离心。从每个小瓶取出50份等分样品，置于酸安全EZ-2Genevac中干燥，以HCl法运行EZ-2Genevac至少3小时，然后衍生化。

对于衍生化，将250μl milli-Q H2O加入干燥的酸水解产物，其后加入10μl抗氧化剂混合物，然后加入120μl 0.5M NaOH。抗氧化剂混合物通过将0.25ml正丙醇、50μl硫二甘醇和几粒苯酚加入2.20ml Milli-Q H2O并涡旋来制备。然后加入80μl催化剂、吡啶和正丙醇的4:1混合物，盖上小瓶并以2500rpm涡旋1min。在1min温育后，再次以2500rpm涡旋小瓶1min。然后将500μl异辛烷和氯仿的4:1混合物加入小瓶，再次盖上并以2500rpm涡旋1min。然后用另一个样品架覆盖样品小瓶架并振荡20次以确保样品乳化。然后离心样品直到离心机达到1000rpm，然后停止离心。将200μl有机层移入新的具有玻璃内插管的GC小瓶并通过GC/MS分析。

使用ZB-AAA 10×0.25mm ID氨基酸分析GC柱通过GC/MS分析样品并使用正缬氨酸内标定量。洗针1溶剂为丙酮，洗针2溶剂为异辛烷/氯仿(80/20)，程序为110℃，保持0min，30℃/min升温至320℃，保持0.5min，使用4μl注射，15:1分流，250℃1.1ml/min，300℃传输线。

将GC-MS数据乘以0.0005L得到μmol值，然后乘以氨基酸的分子量。将该值除以5以校正体积得到每种氨基酸的μg/ml。在酸水解期间天冬酰胺转换为天冬氨酸，因此在这些方法中天冬酰胺+天冬氨酸被确定为天冬氨酸。色氨酸不能通过这些方法测定，但不构成微拟球藻属蛋白质中的大部分氨基酸。

对于总碳水化合物定量，使生物质在6N盐酸中水解一小时以将多糖转化为单糖。使用MSTFA N-甲基-N-三甲基硅基三氟乙酰胺与1％三甲基氯硅烷将所得的单糖转换为三甲基硅基醚，并且使用GC-MS分析对醚进行解析和定量。在该分析中，我们能够定量阿拉伯糖、鼠李糖、木糖、甘露糖、半乳糖、甘露糖醇和葡萄糖，它们涵盖了微拟球藻属中存在的大部分糖。

对于培养物样品的酸水解，将500μl Milli-Q H2O加入4ml小瓶中的500μl培养样品，或在培养物样品更浓(更高的TOC)的情况下，将800μl Milli-Q H2O加入200μl培养物样品。将20μl 2.5mg/ml核糖醇和U-¹³C-葡萄糖作为内标加入4ml小瓶中的1ml稀释培养物样品中。然后将1ml浓HCl加入每个小瓶，盖上小瓶并置于105℃干浴中1小时。然后允许样品冷却至室温，将100μl转移至1.5ml微量离心管内部的玻璃内插管。

对于衍生化，将包括含有样品的玻璃内插管的微量离心管置于酸安全EZ-2Genevac中，以HCl法运行EZ-2Genevac至少3小时。在干燥之后，将100μl衍生化试剂(由800μl干燥吡啶加入1ml新打开的MFSTA-1％TMCS而组成)加入每个样品。在40℃下温育样品1小时，同时在Eppendorf热混合仪中以1000rpm混合。在温育之后，通过GC/MS直接分析样品。

使用DB5-MS 30m×250μm×25μm GC柱通过GC/MS分析样品并使用U-¹³C-葡萄糖内标定量。洗针溶剂为吡啶，程序为1min平衡，170℃8min，10℃/min升温至210℃0min，然后50℃/min升温至325℃2min(总运行时间16.3min)。

图9示出了对野生型加的斯微拟球藻株系以及Bromo-1091基因减弱敲低突变体GE-13127和GE-13132的该分析的结果。正如与野生型相比，“basher”突变体的升高FAME/TOC比率(参见例如表15和图9E)所预期的那样，与野生型相比，敲低突变体具有的总有机碳的百分比随着脂质而提高。有趣的是，突变体如实施例8所示在半连续测定中具有与野生型基本上相同的总有机碳积聚，该突变体的蛋白质和碳水化合物含量减少约相同的程度，这显示出与野生型水平相比，蛋白质和碳水化合物二者减少大约20％。

实施例10.Bromo-1091敲低突变体的叶绿素含量

有趣的是，Bromo-1091基因减弱突变培养物明显比对应的野生型培养物淡。GE-13127和GE-13132突变体以及在相同条件下培养的野生型细胞(实施例8的半连续生产培养物)的叶绿素a含量(叶绿素a是微拟球藻属中存在的唯一叶绿素)通过使用DMSO/丙酮提取细胞，并且通过分光光度法分析提取上清液来确定。

简而言之，将200-250μl培养物等分样品吸移至2.0ml微量离心管，并且使用桌上型微量离心机以12,000rpm离心沉淀3分钟。立即将上清液吸离沉淀，将每个沉淀重悬于1ml 1:1DMSO:丙酮中。然后涡旋样品2-5min，并且使用桌上型微量离心机在室温下以12,000rpm离心沉淀细胞碎片3min。所得的沉淀是白色的。

含有1ml 1:1DMSO:丙酮的比色杯在663nm和720nm下作为空白，并且读取DMSO:丙酮提取的细胞的上清液的读数(使用至少750种样品上清液)。

为了计算每种样品中存在的叶绿素a，从663nm下的吸光度减去720nm下的吸光度。将吸光度值乘以稀释因子(如，200μl细胞培养物等分样品为5)和20.15的消光系数以确定叶绿素a的ug/ml浓度，或乘以18.01的消光系数以确定μmol/ml浓度。

图10提供的分析结果可以看出GE-13027和GE-13032Bromo-1091基因减弱突变体具有的每个细胞总叶绿素减少为大约55％。

表16.在使用仅NO3培养基的半连续分析中Bromo-1091敲低株系与野生型株系相比的叶绿素含量

实施例11.LION突变体的转录物组分析。

为了确定Bromo-1091多肽以及2016年7月14日提交的共同拥有和共同未决的美国专利申请号15/210,845公开的ZnCys调节子调节哪些基因，对GE-13032、Bromo-1091 5’BASH-5突变体、ZnCys-2845敲除突变体GE-8564(2015年7月14日提交的美国临时申请)和硝酸还原酶(NR)功能丧失(敲除)突变体进行转录物组分析。GE-13032和GE-8564在本文中称为针对硝酸盐的脂质诱导或“LION”突变体。GE-8564被称为LION1，是指涉及美国专利申请号15/210,845公开的ZnCys-2845基因和其他物种的直系同源物中的减弱、断裂或突变的突变体，GE-13032被称为LION2，是指涉及本文公开的Bromo基因和其他物种的直系同源物中的减弱、断裂或突变的突变体。GE-13032和GE-8564株系和适当的亲本对照使用仅含有硝酸盐作为氮源的PM074培养基在分批测定中生长。在7天测定的第5天期间收集样品，提取RNA并使用内部可用的NextSeq平台测序。从NextSeq获得的总读段的成对校准、主要组分和重复成簇分析(以每百万个绘制读段的每百万个碱基外显子的片段数FPKM定量)表明生物学重复成簇在一起，从而验证了实验设置。正如预期的那样，亲本对照(Cas9编辑株系和野生型)显示出一种转录模式，突变体显示出不同的转录模式。有趣的是，ZnCys-2845敲除突变体、Bromo-1091 5'bash突变体和硝酸还原酶突变体各自显示出不同的模式。

图11A-11B提供了在基于硝酸盐的培养基上以分批测定生长的ZnCys-2845敲除、Bromo-1091 5’bash启动子断裂突变体和硝酸还原酶功能丧失突变体(分别为ZnCys-KO、Bromo-5’Bash和NR-KO)的转录谱的“热图”。使用Pearson校准根据丰度对基因分级成簇(以FPKM度量)。颜色强度分别对应于FPKM值，其中较深的带代表较大的值，较淡的带代表较小的值。每个突变系的生物学重复成簇在一起，从而验证了实验设置。正如预期的那样，亲本对照(Cas9启用的株系)分入“野生型”进化枝，并且突变体形成不同的单独进化枝。有趣的是，在突变进化枝内，ZnCys-2845敲除和Bromo-1091突变体二者均显示出与硝酸还原酶突变体不同的基因表达模式，并且其基因表达模式彼此显著不同。Bromo-1091敲除突变体被观察到，与Cas9亲本株系相比1895个基因上调至少2倍，而与Cas9亲本株系相比，1025基因被观察到下调至少2倍(FDR<0.01)。

序列表

<110> 合成基因组股份有限公司

I·阿加维

L·索里亚戈

M·阿奎

E·R·默里林

<120> 具有提高的脂质生产率的藻类突变体

<130> SGI1980-1WO

<150> US 62/249,834

<151> 2015-11-02

<160> 78

<170> PatentIn 3.5版

<210> 1

<211> 3921

<212> DNA

<213> 加的斯微拟球藻

<220>

<221> misc_feature

<223> 布罗莫-1091基因转录物a

<220>

<221> misc_feature

<223> 编码SEQ ID NO:2的多肽

<400> 1

atggattcga acgcgcaaac caccagtggc accgtcgttg aaagcacggc tagcaatgga 60

gaggcttctg cgcccgcgcc catgctttcg tcctcccttc cttctccaag ctttgagtcc 120

ggcccagacc ccccccccca gttagcaagg cgggtccccg ggaacgtgcc gcttgacccc 180

tcggccgccg acgtggacga caaggaccgc gcctccagcg cctacggaga cgaacctccc 240

ctccccctcc ccctcctcac gtccacctcg atgacagcct cagaagcgag cagcggtcaa 300

ggaggggaag ctggggccgc cccaggggtg ccctcccttg cttcctcccc tgccttcgcc 360

cccgcagcta ccggcctgtc cccgtctcac tccgccggtt ccggcatgtc agtgctgatc 420

caagtgcctc aaaacgggcc cagcgaggct ctgtcgcctt tgcccttgcc gaccactgcc 480

ttggatactc ccttggacac ccggtcgtcc accccccgcc ccgcgcccgc cccagccccg 540

ccttctcctt accagactgt tggaggcctc cacggcgggg agcactcgtt ccttcctccc 600

gtcagtacgg aagggctggc ccctccggcg atgggcacgg gggaaggagg gcttgagggc 660

ggggatggag ggtcggtagg tttttatccc ccccttgccc agtcgcagac gcaactcgcg 720

ccgttgccgg gcccaccgcc tccgcaggcg caagattcgc tgcagtacaa gcctgcttcg 780

gtaccggagc cgactaggat gatggaaggg tccagtgatc ctccttttca ttcgtcggag 840

acgcccaggg cgatggggat cggccggggg ggagggaatt cgcagatggt tgcacctgcc 900

cccgcgccat cgttgcaaca gtcggcgccg ttgcaacaac gtcagcaatt gcaacctcaa 960

cagcaccaac agttccattc gcgctcccac ccacaagtag cgccactcca ggtgcagcaa 1020

cggcagcaac cgcgggcact ggtgccaggg ccccagcagc agcagcagca tcagcagcag 1080

caagctctct atgcatcttc gcaacagcag cagcaacagc agcagcagca acagcagcaa 1140

catcagcagc agcagcagca gcagcagcag caacagcagc agagacatca cccgcaccca 1200

cagcaactgc agcaacaaca gcgacacaac cagcagcagc cactccagca tccacaagca 1260

cagcatcgag tcccacccca gggcatgcct cagcaccagc acgtccgggc gccacagcaa 1320

cagcggcagc agcaactcct ccctcttcca accgcgggca atgccgtccc aggcggccag 1380

gcaaccggca ccccgcacgc gtcgcaactg cctcacgccc agctctccca acaacaacaa 1440

cccgcgcatt ccttgcccca acggcagggc ctgggcgcgc agcccctcaa cccacaggac 1500

actgccttgc ggcccggaat ggtcaagaac atcatggtct tgctccaaca acgcaaaccc 1560

gccgccgatc cttccaaacc cttggtggaa actcggttga aggagatggc gatccggctg 1620

gaggactacc tgtggaaacg ctcgtccacg ttggcggagt actcggatct gagcaccctc 1680

aaacaccgcc tgcagtgttt ggcagtctac atgggcaagc accagcagcg gggtcaaact 1740

gtaccggcgg gcgcaagggg cagaggggga gggatgccga atcaagcgcc ccagccacag 1800

gggggggggc tctctgggaa cacgaaccaa ctgcaacgtt tggtgcctac cgccaatgcc 1860

agcaatattc acctgcccaa ccctcatccc ggaggtcttt cgggtggaat gggggcggga 1920

ggcgcgcgtg tgggagggcg gggcagtggg atcggcggag gggggttgat catgcaacct 1980

gggagtgcca tccacggaca tccccccggg ccccagttgc ggggcagctc tctcccccac 2040

caagggcaag tgcaaccgac ctcgcagcag ggaagtcagc aaagaagggt gggaacgggt 2100

ctggcgcctg cgcctggcac acaacccgcg tttttaccac aggaacaaac gcaaatgcaa 2160

ggtcggcggg tagggggggg agggatgctg cccgtaaatg ggggtaacag ccaccctcct 2220

cccgcgccag gtcctccaca aggccatctg cagccgccgc agcagtcatc aggacagggg 2280

caagccgctc ccttgaacgt gatggggggg gcacagcaag tggggggggg cggtaatgcg 2340

aaccgagggc tccctatgcc tttatcttca ggccccgggg gtaccgcctc cgccagtcag 2400

aagaaacgcg tccagcacac gcccgaacaa cgtcagcaaa tcttgcacca gcagcagcag 2460

cggctgcttt acttgcgcca tgcgtccaag tgcattcatg tggacggccg ctgtccccag 2520

gggtacccga actgcatcgg gatgaaggag ctttggaagc acatcgcctc ctgtagggaa 2580

caacggtgca agttccccca ctgcgtgtcc tcgagatacg tcctgtccca ctaccacaaa 2640

tgtaaggaca cgcagtgccc ggtgtgcgga cccgtacgaa acacgatccg atcttctcgc 2700

tcctcggcgc atcccatgcc gcaacttggt cagggtgtgg cagacgccga cggaggaggc 2760

gagggaggcg gatctggagt ccagcagcag cagcagcagc agcaacaaca acaacaacaa 2820

caacaacaac aacagcaaca acaacagcaa ttggtagcac agagtaatca acgcacgcag 2880

cagcaacaaa tgttgatcgc ccagcagccc ccccccgcag ggatgggggg agggagggtc 2940

ggaggcatga ctggggccct ggcgaatgga ggcaggggtg ggagggtcgg agggagggcg 3000

cggggcaggg ggggtcaagt cgtgcttcct cagcaggttg cggccggggg gcggggaata 3060

ggcggtcaga atgtaggtgg aagtggaatg aaccagcaac gattgcagca acagcaacaa 3120

cagcagcagc aacaacaaca gcagcagcag cagcagcagc agcagcagca gcaacgccca 3180

caaaatatgg cttccgtgcc ggttcctggg gtaggacgtg ggggaggagg ggtgcgagct 3240

ggcggggaag ccctcgcctt gggcactgcg ggtggagcgg gcagcaaacc tggggcccgg 3300

agcggttcgg ggaaaatgcc agtcgtagcc aagactccga atggcctcat gatccagacg 3360

gaaacgcatg gatgggtgcc ggtagagccc acgaaaaacg gcggctaccg tcccctggtg 3420

cctctgcccg gctccggtca aagcttctca caggctgccg gcggggctgg cgcgggcgga 3480

cgtcctggcg gcgttgggag aggggtgccc ggcgtacctg ccccaccttc cgcggcagcg 3540

ttgcagcggt tcgaagactc cgtgtccttg gtgaactcct tcacggacgc acaaattaag 3600

gcgcacatgg cctctctgcg ttcaggggga gggttttgga ctcccgccaa gttgaaactt 3660

aaggttctcc ccctcgtggt aaaacagctg aaatcggagt atggatggat ttttgaagaa 3720

cccgtggacc ccgtgaagct cgggctcccg gattacttcg atgtgatcaa gcaccctatg 3780

gacttgggca ctgtacgtcg gcttgtgggg aggggagggc gaagagaggc gggagggaaa 3840

gacaatccca atggacaact gtcagtcgac gacaagggag aattggagga ggaggtcgac 3900

ggacttcagg aacttctttg a 3921

<210> 2

<211> 1306

<212> PRT

<213> 加的斯微拟球藻

<220>

<221> misc_feature

<223> 布罗莫-1091多肽，同种型a

<400> 2

Met Asp Ser Asn Ala Gln Thr Thr Ser Gly Thr Val Val Glu Ser Thr

1 5 10 15

Ala Ser Asn Gly Glu Ala Ser Ala Pro Ala Pro Met Leu Ser Ser Ser

20 25 30

Leu Pro Ser Pro Ser Phe Glu Ser Gly Pro Asp Pro Pro Pro Gln Leu

35 40 45

Ala Arg Arg Val Pro Gly Asn Val Pro Leu Asp Pro Ser Ala Ala Asp

50 55 60

Val Asp Asp Lys Asp Arg Ala Ser Ser Ala Tyr Gly Asp Glu Pro Pro

65 70 75 80

Leu Pro Leu Pro Leu Leu Thr Ser Thr Ser Met Thr Ala Ser Glu Ala

85 90 95

Ser Ser Gly Gln Gly Gly Glu Ala Gly Ala Ala Pro Gly Val Pro Ser

100 105 110

Leu Ala Ser Ser Pro Ala Phe Ala Pro Ala Ala Thr Gly Leu Ser Pro

115 120 125

Ser His Ser Ala Gly Ser Gly Met Ser Val Leu Ile Gln Val Pro Gln

130 135 140

Asn Gly Pro Ser Glu Ala Leu Ser Pro Leu Pro Leu Pro Thr Thr Ala

145 150 155 160

Leu Asp Thr Pro Leu Asp Thr Arg Ser Ser Thr Pro Arg Pro Ala Pro

165 170 175

Ala Pro Ala Pro Pro Ser Pro Tyr Gln Thr Val Gly Gly Leu His Gly

180 185 190

Gly Glu His Ser Phe Leu Pro Pro Val Ser Thr Glu Gly Leu Ala Pro

195 200 205

Pro Ala Met Gly Thr Gly Glu Gly Gly Leu Glu Gly Gly Asp Gly Gly

210 215 220

Ser Val Gly Phe Tyr Pro Pro Leu Ala Gln Ser Gln Thr Gln Leu Ala

225 230 235 240

Pro Leu Pro Gly Pro Pro Pro Pro Gln Ala Gln Asp Ser Leu Gln Tyr

245 250 255

Lys Pro Ala Ser Val Pro Glu Pro Thr Arg Met Met Glu Gly Ser Ser

260 265 270

Asp Pro Pro Phe His Ser Ser Glu Thr Pro Arg Ala Met Gly Ile Gly

275 280 285

Arg Gly Gly Gly Asn Ser Gln Met Val Ala Pro Ala Pro Ala Pro Ser

290 295 300

Leu Gln Gln Ser Ala Pro Leu Gln Gln Arg Gln Gln Leu Gln Pro Gln

305 310 315 320

Gln His Gln Gln Phe His Ser Arg Ser His Pro Gln Val Ala Pro Leu

325 330 335

Gln Val Gln Gln Arg Gln Gln Pro Arg Ala Leu Val Pro Gly Pro Gln

340 345 350

Gln Gln Gln Gln His Gln Gln Gln Gln Ala Leu Tyr Ala Ser Ser Gln

355 360 365

Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln His Gln Gln Gln

370 375 380

Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Arg His His Pro His Pro

385 390 395 400

Gln Gln Leu Gln Gln Gln Gln Arg His Asn Gln Gln Gln Pro Leu Gln

405 410 415

His Pro Gln Ala Gln His Arg Val Pro Pro Gln Gly Met Pro Gln His

420 425 430

Gln His Val Arg Ala Pro Gln Gln Gln Arg Gln Gln Gln Leu Leu Pro

435 440 445

Leu Pro Thr Ala Gly Asn Ala Val Pro Gly Gly Gln Ala Thr Gly Thr

450 455 460

Pro His Ala Ser Gln Leu Pro His Ala Gln Leu Ser Gln Gln Gln Gln

465 470 475 480

Pro Ala His Ser Leu Pro Gln Arg Gln Gly Leu Gly Ala Gln Pro Leu

485 490 495

Asn Pro Gln Asp Thr Ala Leu Arg Pro Gly Met Val Lys Asn Ile Met

500 505 510

Val Leu Leu Gln Gln Arg Lys Pro Ala Ala Asp Pro Ser Lys Pro Leu

515 520 525

Val Glu Thr Arg Leu Lys Glu Met Ala Ile Arg Leu Glu Asp Tyr Leu

530 535 540

Trp Lys Arg Ser Ser Thr Leu Ala Glu Tyr Ser Asp Leu Ser Thr Leu

545 550 555 560

Lys His Arg Leu Gln Cys Leu Ala Val Tyr Met Gly Lys His Gln Gln

565 570 575

Arg Gly Gln Thr Val Pro Ala Gly Ala Arg Gly Arg Gly Gly Gly Met

580 585 590

Pro Asn Gln Ala Pro Gln Pro Gln Gly Gly Gly Leu Ser Gly Asn Thr

595 600 605

Asn Gln Leu Gln Arg Leu Val Pro Thr Ala Asn Ala Ser Asn Ile His

610 615 620

Leu Pro Asn Pro His Pro Gly Gly Leu Ser Gly Gly Met Gly Ala Gly

625 630 635 640

Gly Ala Arg Val Gly Gly Arg Gly Ser Gly Ile Gly Gly Gly Gly Leu

645 650 655

Ile Met Gln Pro Gly Ser Ala Ile His Gly His Pro Pro Gly Pro Gln

660 665 670

Leu Arg Gly Ser Ser Leu Pro His Gln Gly Gln Val Gln Pro Thr Ser

675 680 685

Gln Gln Gly Ser Gln Gln Arg Arg Val Gly Thr Gly Leu Ala Pro Ala

690 695 700

Pro Gly Thr Gln Pro Ala Phe Leu Pro Gln Glu Gln Thr Gln Met Gln

705 710 715 720

Gly Arg Arg Val Gly Gly Gly Gly Met Leu Pro Val Asn Gly Gly Asn

725 730 735

Ser His Pro Pro Pro Ala Pro Gly Pro Pro Gln Gly His Leu Gln Pro

740 745 750

Pro Gln Gln Ser Ser Gly Gln Gly Gln Ala Ala Pro Leu Asn Val Met

755 760 765

Gly Gly Ala Gln Gln Val Gly Gly Gly Gly Asn Ala Asn Arg Gly Leu

770 775 780

Pro Met Pro Leu Ser Ser Gly Pro Gly Gly Thr Ala Ser Ala Ser Gln

785 790 795 800

Lys Lys Arg Val Gln His Thr Pro Glu Gln Arg Gln Gln Ile Leu His

805 810 815

Gln Gln Gln Gln Arg Leu Leu Tyr Leu Arg His Ala Ser Lys Cys Ile

820 825 830

His Val Asp Gly Arg Cys Pro Gln Gly Tyr Pro Asn Cys Ile Gly Met

835 840 845

Lys Glu Leu Trp Lys His Ile Ala Ser Cys Arg Glu Gln Arg Cys Lys

850 855 860

Phe Pro His Cys Val Ser Ser Arg Tyr Val Leu Ser His Tyr His Lys

865 870 875 880

Cys Lys Asp Thr Gln Cys Pro Val Cys Gly Pro Val Arg Asn Thr Ile

885 890 895

Arg Ser Ser Arg Ser Ser Ala His Pro Met Pro Gln Leu Gly Gln Gly

900 905 910

Val Ala Asp Ala Asp Gly Gly Gly Glu Gly Gly Gly Ser Gly Val Gln

915 920 925

Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln

930 935 940

Gln Gln Gln Gln Gln Gln Leu Val Ala Gln Ser Asn Gln Arg Thr Gln

945 950 955 960

Gln Gln Gln Met Leu Ile Ala Gln Gln Pro Pro Pro Ala Gly Met Gly

965 970 975

Gly Gly Arg Val Gly Gly Met Thr Gly Ala Leu Ala Asn Gly Gly Arg

980 985 990

Gly Gly Arg Val Gly Gly Arg Ala Arg Gly Arg Gly Gly Gln Val Val

995 1000 1005

Leu Pro Gln Gln Val Ala Ala Gly Gly Arg Gly Ile Gly Gly Gln

1010 1015 1020

Asn Val Gly Gly Ser Gly Met Asn Gln Gln Arg Leu Gln Gln Gln

1025 1030 1035

Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln Gln

1040 1045 1050

Gln Gln Gln Gln Gln Arg Pro Gln Asn Met Ala Ser Val Pro Val

1055 1060 1065

Pro Gly Val Gly Arg Gly Gly Gly Gly Val Arg Ala Gly Gly Glu

1070 1075 1080

Ala Leu Ala Leu Gly Thr Ala Gly Gly Ala Gly Ser Lys Pro Gly

1085 1090 1095

Ala Arg Ser Gly Ser Gly Lys Met Pro Val Val Ala Lys Thr Pro

1100 1105 1110

Asn Gly Leu Met Ile Gln Thr Glu Thr His Gly Trp Val Pro Val

1115 1120 1125

Glu Pro Thr Lys Asn Gly Gly Tyr Arg Pro Leu Val Pro Leu Pro

1130 1135 1140

Gly Ser Gly Gln Ser Phe Ser Gln Ala Ala Gly Gly Ala Gly Ala

1145 1150 1155

Gly Gly Arg Pro Gly Gly Val Gly Arg Gly Val Pro Gly Val Pro

1160 1165 1170

Ala Pro Pro Ser Ala Ala Ala Leu Gln Arg Phe Glu Asp Ser Val

1175 1180 1185

Ser Leu Val Asn Ser Phe Thr Asp Ala Gln Ile Lys Ala His Met

1190 1195 1200

Ala Ser Leu Arg Ser Gly Gly Gly Phe Trp Thr Pro Ala Lys Leu

1205 1210 1215

Lys Leu Lys Val Leu Pro Leu Val Val Lys Gln Leu Lys Ser Glu

1220 1225 1230

Tyr Gly Trp Ile Phe Glu Glu Pro Val Asp Pro Val Lys Leu Gly

1235 1240 1245

Leu Pro Asp Tyr Phe Asp Val Ile Lys His Pro Met Asp Leu Gly

1250 1255 1260

Thr Val Arg Arg Leu Val Gly Arg Gly Gly Arg Arg Glu Ala Gly

1265 1270 1275

Gly Lys Asp Asn Pro Asn Gly Gln Leu Ser Val Asp Asp Lys Gly

1280 1285 1290

Glu Leu Glu Glu Glu Val Asp Gly Leu Gln Glu Leu Leu

1295 1300 1305

<210> 3

<211> 3894

<212> DNA

<213> 加的斯微拟球藻

<220>

<221> misc_feature

<223> 布罗莫-1091基因转录物b

<220>

<221> misc_feature

<223> 编码SEQ ID NO:4的多肽

<400> 3