蛋白产生方法及其用途的制作方法

文档序号:439306阅读:1709来源:国知局

专利名称::蛋白产生方法及其用途的制作方法
技术领域
:本发明涉及具有改进的性质的蛋白,尤其是Rubisco蛋白的产生方法及其用途。
背景技术
:核酮糖-l,5-二磷酸(RuBP)羧化酶/氧合酶更常见为缩写Rubisco。Rubisco是参与卡尔文(Calvin)循环中固碳的酶,通过所述卡尔文循环空气中的二氧化碳被固定并以高能分子的形式可供生物系统利用。在植物、藻类、蓝细菌及向光性和化能自养变形菌中,Rubisco包含大亚基(LSU)链和小亚基(SSU)链。底物结合位点位于所述大链内。大链形成二聚体,其中来自各条大链的氨基酸造就了结合位点。总共四个大链二聚体和八条小链组装成约540,000Da的更大的复合体。Rubisco催化光合作用中C02同化的第一步(碳还原),还催化产生在光呼吸碳氧化中回收的废产物的02的竟争性固定。Rubisco是无机碳进入生物系统的关键化学反应的主要催化剂的事实突出了它的重要性。此外,Rubisco是非常丰富的蛋白。Parry等(2003)指出Rubisco占叶绿体中总可溶蛋白的30%~50o/o。然而,Rubisco的相对丰富可归因于它是非常緩慢作用的酶的事实,它每秒仅固定若干C02分子,与之相反的是许多酶的特征在于每秒数千化学反应。所述酶作为RuBP羧化的催化剂效率低下且受到02的竟争性抑制、氨曱酰化损耗的失活以及在所述酶被C02氨曱酰化激活之前由于RuBP结合的端点抑制。该非最佳行为使Rubisco成为光合作用中的限速。因此,在大多数情况下和当光照没有限制光合作用时,Rubisco是卡尔文循环的主要限速酶。由于Rubisco对于植物中的光合作用常常是限速的,Rubisco的改良形式将对提高农业生产力产生显著影响。已经进行一些尝试以提高Rubisco介导的反应的效率。此前研究包括将表达Rubisco的构建体从一个生物体引入另一个生物体、增加Rubisco亚基的表达水平、从叶绿体DNA表达Rubisco小亚基和通过诱变改变Rubisco基因以便试图增加对二氧化碳(超过氧气)的特异性或者增加固碳速率。已经尝试了将外来Rubisco,例如来自具有高0)2/02特异性的诸如GaWen'ap"W/to的红藻的Rubisco,引入开花绿色植物中。原本期望这将改善农作物的光合作用效率,但这些尝试由于外来Rubisco在宿主植物中的产生、组装和调节的问题而失败(SpreitzerandSalvucci,2002;Parry等,2003)。另一方面,已经成功地用更简单的紫色光合细菌深红红螺菌(i/zodos^W〃wmn^n/w)的同源大亚基替代了烟草Rubisco的大亚基,所述深红红螺菌无需小亚基以进行折叠和组装为活性酶(Andrews和Whitney,2003)。尽管证实了Rubisco替代是切实可行的,但转基因植物表现出深红红螺菌Rubisco的非常差的特异性和催化性质。使用定点突变连同来自数个物种的Rubisco复合体的X射线晶体学结构的认知进行了大量尝试以确定活性位点残基在反应的特定步骤中的作用或修饰,以及改进Rubisco的催化性质。然而,这些研究没能提供在整个反应时间过程中活性位点残基的各种作用的详细且前后一致的定义。这些技术一律未能成功设计出"更好的"Rubisco。尽管通过这些研究可以推导出Rubisco作用的一种机理,然而该才几理由于对不完整实验数据的不同的可能解释而不是唯一的,因此它可能并非现实中存在的机理。例如,在对Rubisco的Cleland共享机理中提出的机理假设在羧化反应活性复合体形成前从活性位点的镁置换了一个水分子,因此反应中的所有后续步骤也在发生了该置换的前提下进行。然而,没有水事实上被置换的实验证据。与之对比的是许多其它酶的再造(re-engineering)程序,其中已证实了直接从由实验获得的结构和机理数据导出的单一突变或某些情况下的多重突变成功地在可预知的所需方向改进了底物特异性或催化效率。实现Rubisco的理论再造方法的主要困难是,由于上述实验数据的接证据,也没有提供所有参与的活性位点残基的准确作用。实验方法于实验探针是"隐形"的。Rubisco活性位点的复杂性和涉及一系列反应的事实与上述困难叠加在一起。已提出有包括参与不同反应步骤的活性位点残基的不同组合的多个活性位点"元素",其中所述残基基团常常被重复使用。似乎现有Rubisco仅代表最优化酶效率的"部分进化方案",即不能有效采样LSU序列空间的进化过程,且似乎这些现有解决方案代表了远非最佳的解决方案。因此,有机会可通过不同途径或途径组合来创建比生物进化目前为止能提供的方案更理想的解决方案。通过转化、选择性育种或其它操作在光合生物中更有效的Rubisco形式的创建或鉴定和?1入可以允许这些生物包括绿色植物尤其是开花植物更有效的生长,因为它们将更有效的利用水和氮气,且能在更高温度下更有效的生长。这反过来为更高产作物、退化或易干旱土地的植被恢复、固碳的改良选择和生物燃料或生物质能的生产的改善等等提供了前景。总之,需要产生具有改进的功能性质的蛋白诸如Rubisco,其中例如这些蛋白具有改进的效率且特异性地适应于特定环境条件。
发明内容本发明人假设了现存Rubisco仅采样了一部分理论上可利用的突变空间以改善其效率且不同空间可能由不同Rubisco组所采样。因此,他们提出了通过将来自一个以上系统发育组或来自一个以上适应环境的物种的特征4家接到宿主Rubisco上来将这些部分进化"方案"结合以便获得比在自然上可能的更宽的进化突变采样。他们提出该过程将鉴定出具有改进的效率或其它功能性质的Rubisco。才艮据本发明的第一方面,提供了生成具有改进的功能性质的蛋白,所述方法包括(a)鉴定第一蛋白中的至少一个目标氨基酸残基,其中所述目标氨基酸残基与所述功能性质相关;(b)将第一蛋白与来自于第一蛋白相同或不同的系统发育分支的至少一个同源第二蛋白比较并鉴定第一蛋白与第二蛋白之间的至少一个变异氨基酸残基;(c)在候选氨基酸残基影响与所述功能性质相关的所述目标氨基酸残基的基础上从(b)中所鉴定出的变异氨基酸残基中选择至少一个所述候选氨基酸残基;(d)计算机模拟形成至少一个候选突变蛋白或在体外产生至少一个候选突变蛋白,其中来自第二蛋白的至少一个候选氨基酸残基取代了第一蛋白中的相应残基;和(e)筛选(d)中产生的所述至少一个候选突变蛋白以鉴定具有改进的功能性质的蛋白。在一个实施方式中,步骤(a)和步骤(b)可同时进行。在另一个实施方式中,步骤(b)可在步骤(a)之前进行。在一个实施方式中,步骤(a)的对第一蛋白中至少一个目标氨基酸残基的鉴定可减少为来自步骤(b)中鉴定的变异氨基酸残基的候选氨基酸残基而检验的序列空间量。在一个实施方式中,步骤(d)包括通过使用来自第二蛋白的至少一个候选氨基酸残基来取代同源蛋白中和/或不同于第一蛋白或除第一蛋白之外的同源蛋白中的相应残基而形成或生成至少一个候选突变蛋白。在另一实施方式中,步骤(d)包括通过使用来自第二蛋白的至少两个候选氨基酸残基来取代第一蛋白中和/或不同于第一蛋白或除第一蛋白之外的同源蛋白中的相应残基而形成或生成至少一个候选突变蛋白。在一个实施方式中,所述至少一个目标氨基酸残基包含在第一蛋白中或含有第一蛋白的蛋白组中。在某些实施方式中,所述至少一个目标氨基酸残基为至少2个、至少3个、至少4个、至少5个、至少10个、至少12个、至少15个、至少20个、至少30个或至少50个目标氨基酸残基。在一个实施方式中,所述蛋白是酶并且且所述改进的功能性质选自以下的一种或多种,即改进的所述酶的动力学效率、改变的所述酶对一个或多个底物的特异性、改变的所述酶对一个或多个产物的特异性和改变的酶催化有效温度范围。当所述蛋白是Rubisco时,所述改进的功能性质可为改进的催化效率或改进的对二氧化碳的特异性。在一个实施方式中,所述目标氨基酸残基选自直接与底物或反应中间体相互作用的那些残基,所述残基包括例如在Rubisco中与反应中心直接配位的那些残基("第一层"残基),或与一个或多个上述残基直接配位的那些残基(即,"第二层"残基)。当所述蛋白为Rubisco时,Rubisco第一层残基可选自Glu60、Asn123、Lys175、LYS177、KCX201、Asp203、Glu204、His294和Lys334的任何一个或多个。在一个实施方式中,所述Rubisco蛋白的目标氨基酸残基是在Rubisco蛋白大亚基的N端域。所述N端域目标氨基酸残基可参与由Rubisco酶介导的羧化酶催化的气体加成步骤。在一个具体实施方式中,参与所述气体加成步骤的N端域目标氨基酸残基选自ASN123、GLU60和Tyr20。在一个实施方式中,所述蛋白是酶,并且在适应于具体生长环境的动力学和功能特性诸如热适应或冷适应或抗干旱的基础上选择所述第二蛋白。这些特性可以从所述第二蛋白的环境多样性数据中鉴定。在另外一个实施方式中,所述至少一个候选氨基酸残基被鉴定为能影响(a)中鉴定的所述至少一个目标氨基酸残基的残基且所述至少一个候选氨基酸残基调节了所形成蛋白的功能性质。所述候选氨基酸残基由于该候选氨基酸残基与所述至少一个目标氨基酸残基的临近而可能影响与所述功能性质有关的所述至少一个目标氨基酸残基。例如,所述影响可能出于位阻效应、静电效应和疏水效应。在某些替代性实施方式中,步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个趋异候选氨基酸残基而非至少一个候选氨基酸残基。在具体实施方式中,步骤(c)包括选择至少2个趋异候选氨基酸残基。在某些替代性实施方式中,步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个替代候选氨基酸残基而非至少一个候选氨基酸残基。在具体实施方式中,步骤(c)包括选择至少2个替代候选氨基酸残基。在其它具体实施方式中,步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个替代候选氨基酸残基和至少一个趋异候选氨基酸残基而非至少两个候选氨基酸残基。在一个实施方式中,鉴定至少一个目标氨基酸残基的步骤(a)包括基于所述蛋白结构的经验数据的活性位点片段QM计算和/或杂化QM/QM和/或QM/MM计算的步骤。在一个实施方式中,所述经验数据是X射线晶体结构或溶液NMR结构。在一个实施方式中,所述经验数据还包括突变数据、动力学数据、同位素鉴别、量热数据和光谱数据中的任意一个或多个(Fersht,1998;Frey和Hegeman,2007)。在一个实施方式中,通过用QM/MM可能性分子动力学(MD)模拟对所述QM/MM计算进行了补充(Gready爭,2006)。在一个实施方式中,从所述至少一个变异氨基酸残基选择至少一个候选氨基酸残基的步骤包括评估(a)中鉴定的所述至少一个目标氨基酸残基与(b)中鉴定的变异氨基酸残基的临近性和/或与二级结构单元的相对位置。选择至少一个候选氨基酸残基的步骤(c)可包括鉴定所述第一蛋白和所述第二蛋白之间与静电相互作用和/或疏水相互作用有关的变化,所述静电相互作用和/或疏水相互作用是(b)中所鉴定的一个或多个变异氨基酸残基与(a)中所鉴定的至少一个目标氨基酸残基和/或含有步骤(a)中所鉴定的至少一个目标残基的二级结构单元之间的相互作用。所述选择过程还包括鉴定除去由在第一蛋白中引入候选氨基酸残基造成的位阻效应所必须的补偿突变。在另一实施方式中,筛选至少一个候选突变蛋白的步骤包括计算机模拟分析、生化评估和生理学评估中的任何一种或多种。所述生化评估可包括蛋白的正确折叠和/或组装的评估、蛋白结构的评估、蛋白的催化活性和/或其它结合功能的评估或蛋白在体外的稳定性的评估。所述生理学评估可包括蛋白的正确表达、正确折叠和/或组装的评估、蛋白结构的评估、蛋白的催化活性的评估或蛋白在体内的稳定性的评估。在所述第一方面的另一个实施方式中,所述方法还包括在步骤(C)之后和步骤(d)之前的额外步骤,该额外步骤对预测为在所述至少一个目标氨基酸残基上有累积效应的候选氨基酸残基分组。例如所述累积效应可通过静电效应和/或疏水效应和/或位阻效应中的一种或多种由例如修饰所述效应的在二级结构单元和环的定位上的协同效应或补偿效应而发生影响。在另一个实施方式中,所述方法包括紧接步骤(d)之后进行的对具有所述改进的功能性质的候选突变蛋白排序的额外步骤。对所述候选突变蛋白排序的过程可包括评估它们具有所述改进的功能性质的相似性。该过程包括评估所述候选突变蛋白中候选氨基酸残基和/或替代候选氨基酸残基和/或趋异候选氨基酸残基对所述改进的功能性质的相对可能性贡献。在一个实施方式中,所述第一方面包括将从步骤(e)中候选突变蛋白的至少一轮筛选导出的信息用于蛋白结构内部的亚区的鉴定,所述亚区优先影响与所述区域相连的目标氨基酸残基的性质。在另一个实施方式中,所述亚区可提供鉴定经预测可与由步骤(a)(e)鉴定的候选残基、替代候选残基和/或趋异候选残基相互作用的额外候选残基、替代候选残基、共变异残基和/或趋异候选残基的基础。所述多轮筛选可用于产生一组优选突变位点,及其一组优选的组合。在所述第一方面的另一个实施方式中,所述方法包括在具有所述改进的功能性质的蛋白上进行定向进化并筛选其产物的额外步骤。根据本发明的第二方面,提供了产生具有改进的功能性质的Rubisco蛋白的方法,所述方法包括(a)鉴定第一Rubisco蛋白中的至少一个目标氨基酸残基,其中所述目标氨基酸残基与所述功能性质相关;(b)将第一Rubisco蛋白与来自于第一Rubisco蛋白相同或不同的系统发育分支的至少一个同源第二Rubisco蛋白进行比较并鉴定第一Rubisco蛋白与第二Rubisco蛋白之间的至少一个变异氨基酸残基;(c)在候选氨基酸残基影响与所述功能性质相关的所述目标氨基酸残基的基础上从(b)中所鉴定的变异氨基酸残基中选择至少一个所述候选氨基酸残基;(d)通过计算机模拟形成至少一个候选突变Rubisco蛋白或在体外产生至少一个候选突变Rubisco蛋白,其中来自第二Rubisco蛋白的所述至少一个候选氨基酸残基取代了第一Rubisco蛋白中的相应残基;和(e)筛选(d)中产生的所述至少一个候选突变Rubisco蛋白以鉴定具有所述改进的功能性质的Rubisco蛋白。在一个实施方式中,步骤(a)和步骤(b)可同时进行。在另一个实施方式中,步骤(b)可在步骤(a)之前进行。在另一个实施方式中,步骤(a)的对第一蛋白中至少一个目标氨基酸残基的鉴定减少了为来自步骤(b)中鉴定的变异氨基酸残基的^f夷选氨基酸残基而枱r验的序列空间量。在所述第二方面的另一实施方式中,用于与第一Rubisco比较的第二Rubisco蛋白的残基包含与Rubisco蛋白活性位点直4妄配位的所有残基、与Rubisco蛋白的底物或中间体反应物种的反应活性中心相互作用的所有残基,以及在Rubisco蛋白活性位点的近距离内的其它残基或这些残基的子集。例如所述接近距离可为离底物或中间体反应物种的任何原子3A28A。典型的是,所述接近距离为离底物或中间体反应物种的任何原子6A20A。更典型的是,所述接近距离为离底物或中间体反应物种的任何原子9A~15A。在所述第二方面的一个实施方式中,所述第一Rubisco蛋白取自绿色植物和蓝细菌,而所述第二Rubisco蛋白取自红藻。在一个具体实施方式中,所述第一Rubisco蛋白取自开花植物和蓝细菌,而第二Rubisco蛋白取自红藻。在所述第二方面的一个实施方式中,步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个趋异候选氨基酸残基而非至少一个候选氨基酸残基。在具体实施方式中,步骤(c)包括选择至少2个趋异候选氨基酸残基。在所述第二方面的某些替代性实施方式中,步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个替代候选氨基酸残基而非至少一个候选氨基酸残基。在具体实施方式中,步骤(c)包括选择至少2个替代候选氨基酸残基。在其它具体实施方式中,步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个替代候选氨基酸残基和至少一个趋异候选氨基酸残基而非至少两个候选氨基酸残基。在所述第二方面的一个实施方式中,提供了纯化Rubisco蛋白的方法,所述方法包括步骤(a)将H6标记的泛素(Ub)序列(H6Ub)融合进第一载体至rbcS基因的5'端;(b)将所述第一载体与编码Rubisco蛋白的大亚基和小亚基的第二载体共转化到宿主内;(c)诱导所述Rubisco蛋白和载体的表达;(d)基于融合到所述Rubisco小亚基的泛素标记的表达来纯化所述Rubisco蛋白;(e)从所述Rubisco中去除Ub片段。在一个实施方式中,纯化所述蛋白的步骤(d)使用色谱诸如金属亲和色谱进行。在一个实施方式中,所述第一和/或第二载体为质粒。在一个实施方式中,所述宿主为大肠杆菌。在一个实施方式中,所述大亚基包含一个或多个突变。在一个实施方式中,所述Ub片段使用Ub特异性蛋白酶除去。根据本发明的第三方面,提供了由本发明的第一或第二方面的方法产生的蛋白。根据本发明的第四方面,提供了由本发明的第一或第二方面的方法产生的Rubisco蛋白。根据本发明的第五方面,提供了包含如SEQIDNO:26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、74、76、78所示的序列或其功能性等价物的Rubisco蛋白。根据本发明的第六方面,提供了由如SEQIDNO:25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、73、75、77所示的多核苦酸或其功能性等价物编码的Rubisco蛋白。根据本发明的第七方面,提供了包含一个氨基酸残基取代或氨基酸残基取代组合的Rubisco大亚基多肽,所述氨基酸残基取代或氨基酸残基取代组合选自(Y25W,D51I)、(Y25W,D51V)、(T23G,K81R)、(G54A,C84A,187V)、(G54S,C84A,187V)、(T23G,Y25W,D51I,K81R)、(Y25W,D51I,G54A,C84A,187V)、(Y25W,D51I,G54S,C84A,187V)、(Y25W,D51V,G54A,C84A,I87V)、(V121I,M297G,V300T)、(L36I,1116L,F140L)、(L36I,I116L,V121I,F140L,M297G,V300T)、(K18I,T23G)、(K21A,L22K,(空隙)M,T23G,Y25W)、(T23G,K18I,T68V,K81R)、(T23G,K81R,P104E)、(T23G,D19P,K81R)、(T23G,K81R,V121I,M297G,V300T)、(T23G)、(K81R)、(V121I,M297G)、(M297G)、(V1211)。在一个实施方式中,所述Rubisco大亚基存在于Rubisco蛋白中。在一个实施方式中,所述Rubisco蛋白以保留了Rubisco的生物活性的融合蛋白或其片段的形式提供。本发明还提供了根据所述第七方面编码RubiscoLSU多肽的多核苷酸。本发明还提供了包含所述第五方面的多核苷酸序列或第六方面中定义的多核苷酸序列的载体。在一个实施方式中,所述载体包含组成型启动子或选择性表达启动子。在一个实施方式中,所述载体包含选择性标记。根据本发明的第八方面,提供了用根据如上方面的核酸序列或载体转化的宿主细胞。在一个实施方式中,所述宿主细胞为原核细胞或真核细胞。在某些实施方式中,所述原核宿主细胞为细菌细胞诸如大肠杆菌。根据本发明的第九方面,提供了用上述方面之一的核酸序列或载体转化的光合生物体。在一个实施方式中,所述光合生物体为蓝细菌。在另一实施方式中,所述生物为聚球藻(S,ec/20COCCW力,诸如聚球藻PCC7942或聚球藻PCC6301。在一个实施方式中,所述光合生物为开花植物。所述生物可为野生型或转基因烟草(普通烟草(iWc^/wa"ato6acwm))。所述转基因烟草可为其中天然烟草AcL被来自深红红螺菌(W/zo^w;zV77/wwra6raw)的AcM所替代的转基因烟草。在一个实施方式中,所述蛋白在光合作用细胞器中表达。在另外一个实施方式中,所述细胞器为质体。在另一个实施方式中,所述细胞器可选自包括叶绿体(含叶绿素的质体)、黄化质体(未在光下暴露的叶绿体)、有色体(非含叶绿素质体)或白色体(储存淀粉(淀粉体)、脂(油质体)或蛋白(蛋白质体)的无色质体)的光合真核生物质体。根据本发明的第十方面,提供了增加生物的光合作用效率的方法,所述方法包括在所述生物内引入编码根据上述任一方面的Rubisco蛋白的核i^f列并表达所述Rubisco蛋白。根据本发明的第十一方面,提供了增加农作物产量的方法,所述方法包括在所述农作物植4朱内引入编码根据上述任一方面的Rubisco蛋白的核酸序列。根据本发明的第十二方面,提供了增加植物抗旱性的方法,其中所述方法包括在所述植物中引入编码才艮据上述方面之一的Rubisco蛋白的核晚字列。根据本发明的第十三方面,提供了增加一种或多种植物或其它光合生物的生物量的方法,其中所述方法包括在所述植物或生物中引入编码才艮据上述方面之一的Rubisco蛋白的核酸序列。根据本发明的第十四方面,提供了生产包含来自一种或多种植物或其它光合生物的材料的生物燃料的方法,其中所述方法包括在所述植物或生物中引入编码根据上述方面之一的Rubisco蛋白的核酉拼列。在所述第十至第十四方面的一个实施方式中,所述蛋白的引入可包括转化、有性繁殖的步骤或其组合。缩写a"dA带来对链霉素和大观霉素耐受的质粒基因ACR替代候选残基2CABP2-羧基阿拉伯糖醇-l,5-二磷酸2C3KABP2-羧基-3-酮基阿拉伯糖醇-l,5-二磷酸3-PGA3-磷-D-甘油酸酯CM候选突变体CPK模型半径与原子范德华半径成比例的球形原子的Corey-Pauling-Koltu空间填充分子模型CR候选残基CvR共变异残基DCR趋异候选残基DFT密度泛函理论ESP静电势FM片段模型H66倍体组氨酸亲和标记《c0%氧气下C02的Michadis常数(Km)21°/。(环境)氧气下C02的Michaelis常数(Km)羧基化转换率《。或《,。02的Michaelis常数(《JLSU大亚基MD分子动力学PDB号蛋白数据库(ProteinDataBank)编号ONIOM本发明自有n层整合分子轨道+分子力学方法QM量子力学QM/MM杂化量子力学/分子力学QM/QM杂化量子力学/量子力学AcL编码Rubisco大亚基的多核苷酸AcLS编码聚球藻的Rubisco大亚基的多核苦酸AcLS-(或/^cL-S)编码聚球藻的Rubisco大亚基和Rubisco小亚AcSS基的多核苷酸AcM编码来自深红红螺菌的II型Rubisco的多核苷酸AcS编码Rubisco小亚基的多核苷酸AcSS编码聚球藻的Rubisco小亚基的多核苷酸RuBP核酮糖-1,5-二磷酸Rubisco核酮糖-l,5-二磷酸羧化酶/氧合酶Sc,o定义为(kccat/Kc)/(k°eat/Ko)的C02相比02的Rubisco特异性SSU小亚基SsVR物种特异性变异残基TIM桶首先在磷酸丙糖异构酶中确定的蛋白域结构TR目标残基TS过渡态Ub泛素K皿外推最大羧化酶活性VR变异残基定义如本申请中所用,除非上下文明确说明,单数形式"一个,,和"所述一个"包括复数指代。例如,术语"一个植物细胞"也包括复数个植物细胞。如本文所用,词语"包含"意指"包括"。词语"包含"的变化形式,诸如不同人称下使用的"包含",具有相应变化的意思。因此,例如,"包含"编码蛋白的序列的多核苷酸可以仅由该序列组成或包含一个或多个其他序列。"宿主细胞"是指含有引入的核酸构建体并支持所述构建体的复制和/或表达的细胞。宿主细胞可为原核细胞诸如大肠杆菌,或真核细胞诸如藻类、真菌、酵母菌、昆虫、两栖动物、线虫、植物或哺乳动物细胞。所述宿主细胞可为植物细胞,诸如单子叶植物细胞或双子叶植物细胞。宿主细胞的一个实例为大肠杆菌宿主细胞。本文所用术语"绿色植物"意欲涵盖包括但不必限于来自蕨类植物门(户teW^p/^a)(蕨类)、苔藓植物门CSo^//^to)(莒藓)、轮藻门(C77"ra/7/^to)和绿藻门(C7z/orap/^to)(水生绿藻)、木兰门(Mag"o/z'o//^to)(开花植物或被子植物)和松柏门(乃V2op/z少to)(针叶树)的单细胞或多细胞生物的生物。如本文所用,"同源"蛋白是共享进化起源的蛋白。同源蛋白可共享相同的主要功能(直系同源蛋白)或可展示明显不同的进化分化的功能(旁系同源蛋白)。如本文所用,"核酸"指多核香酸且包括脱氧核糖核苦酸或核糖核香酸碱基的单链或多链聚合物。核酸还可包括片段和修饰的核苦酸。如本文所用"可行性连接"指至少两个序列的功能性连接。可行性连接包括启动子与第二序列之间的连接,其中所述启动子序列启动并介导对应于所述第二序列的DNA序列的转录。AcL-S是可行性连接序列的一个实例。如本文所用,"光合作用"指在绿色植物和某些其它生物中的使用光作为能量来源从二氧化碳和水合成糖的过程。光合作用的大多数形式释放氧气作为副产物。如本文所用,"系统发育分支"指一组线性相连的生物。在本发明的背景下,系统发育学制定了根据进化关联性程度分类生物组的方法。一个系统发育分支可包含不同分类学的门、纲、目、科、属或种的生物。"系统发育移植"指将来自一个系统发育分支的生物的供体蛋白的至少一个氨基酸残基引入来自不同系统发育分支的生物的接受蛋白内的过程,所述过程的目的是改善所述接受蛋白的功能性质。系统发育移植可通过将至少一个氨基酸残基取代到接受蛋白序列中的给定位置来执行,所述至少一个氨基酸残基位于在系统发育分析基础上选出的第二供体蛋白中的相同位置。如本文所用,"植物"包括了植物以及包括但不限于植物细胞、诸如叶、茎、根、花和种子的植物组织在内的植物部分。如本文所用,"启动子"指参与RNA聚合酶和其它蛋白的识别和结合乂人而启动转录的DNA区域。如本文所用,"蛋白"指无论天然还是合成产生的通过肽键或修饰肽键连接的任何氨基酸聚合物。本发明的蛋白可包含非肽成分,诸如糖基。糖和其它非肽取代基可以由产生所述蛋白的细胞加入,且随细胞类型变化。本文中根据蛋白的氨基酸主链结构而定义蛋白;诸如糖基的取代基通常不具体说明,但仍然可能出现。如本文所定义,蛋白的"功能"指所述蛋白在细胞内的正常作用,或可设计所述蛋白来执行的作用。当蛋白为酶时,所述功能可为至少一个化学反应的催化。在其它实施方式中,所述功能可为结构性的(例如充当细胞骨架蛋白)。所述功能可能涉及在细胞内或细胞内部和细胞外部之间、或细胞内不同隔室之间、或生物的不同区域之间的物质的主动和被动转运,例如其中蛋白参与通道或膜孔、或蛋白参与将材料运送到特定细胞隔室或蛋白充当分子伴侣或转运子。所述功能可能与配体/受体相互作用有关,例如其中蛋白是生长因子、细胞因子、神经递质或者细胞内或细胞外配体,或蛋白是所述生长因子、细胞因子、神经递质或者细胞内或细胞外配体的受体。当蛋白为酶时,该酶可参与分解代谢或新陈代谢。所述酶可参与至少一种产物的合成。所述酶可参与至少一种底物的化学修饰,例如在分子内添加或删除一个或多个磷酸基。所述酶可参与至少一种底物的降解。因此,蛋白的"功能性质"是有助于蛋白功能的性质。例如当蛋白为酶时,所述功能性质可为酶对具体底物的特异性、酶的动力学效率、酶的催化有效温度范围,或酶对催化其正常反应并最小化产生不需要的和/或可能有毒的副产物的副反应的特异性。术语"残基"在多肽的背景下是指线性多肽链的氨基酸单元。它是当在多肽形成中从a-氨基酸即NHrCHR-COOH除去水之后每个^J^酸的所剩余的部分,即-NH-CHR-C-。术语"目标氨基酸残基"或"目标残基"(TR)指被鉴定为和/或预测为直接对蛋白功能作出贡献的氨基酸残基。当蛋白为酶时,目标残基对功能性质的贡献可以是所述目标残基在由所述酶执行的催化反应上在一个或多个所述酶的活性位点通过与所述活性位点直接相互作用或参与的直接影响。目标残基不会远离酶活性位点。当蛋白为受体时,所述目标残基将直接参与受体位点。在本文所述方法中,可通过计算和/或分子模拟方法来鉴定目标残基,因为这些方法能考虑与酶活性位点或受体位点内的目标残基相关的水分子、质子、电离状态和氢键,而这无法由实验明确地定义。在本发明的方法中,期望的是所述目标残基的突变将通常导致功能的破坏或降低。于是在本发明的方法中,所述目标残基并非通过用另一氨基酸取代直接改变,而是通过对与所述目标残基相互作用的一个或多个残基的操作来"调节"所述目标残基的性质诸如其位置和电荷。术语"变异氨基酸残基"或"变异残基"(VR)指第二蛋白的特定氨基酸残基或在多个第二蛋白的共有序列中鉴定的特定氨基酸残基,其中所述残基不同于与所述第二蛋白同源的第一蛋白中发现的对应氨基酸残基。变异残基可使用例如第一和第二蛋白的氨基酸序列的比对来鉴定。第一蛋白和/或第二蛋白的序列可为共有序列。所述序列可来自相同或不同系统发育分支的生物。对于Rubisco大亚基,不同生物的序列之间很少存在除对Rubisco催化功能无关紧要的N端或C端区域外的序列添加或删除。然而,出于本发明的目的,在一个实施方式中变异氨基酸残基可为存在于第一蛋白中但不存在于第二蛋白中的残基,或不存在于第一蛋白中但存在于第二蛋白中的残基。术语"候选氨基酸残基"或"候选残基"(CR)指从多个变异残基中选出的来自第二蛋白的氨基酸残基,所述候选残基疑似能立体地或静电地影响一个或多个目标残基并从而影响由所述一个或多个目标残基介导的蛋白功能。候选残基是可选择性移植到宿主的第一蛋白内以便试图调节所述第一蛋白的功能活性逼近所述第二蛋白的期望功能活性的残基。在某些实施方式中,可在两个以上的系统发育分支之间的氨基酸残基的共同性和/或差别的基础上选择所述候选残基。在选择Rubisco的候选残基的背景下,候选残基是疑为能例如通过改变所述目标残基上的电荷分布和/或改变所述目标残基的空间位置和/或改变所述目标残基的移动能力而立体地和/或静电地影响一个或多个Rubisco目标残基的残基。当蛋白为Rubisco时,所述候选残基可存在于来自红藻的共有序列中,但在来自开花植物和蓝细菌的共有序列内的对应残基位置中不同,或可位于其中氨基酸在开花植物和蓝细菌中相同的位置。在具体实施方式中,所述候选氨基酸残基可选自红藻中存在的残基。当蛋白为Rubisco时,对疑为影响气体加成步骤的候选残基的鉴定aia'兀a残基,所述分支或亚分支可能呈现中性系统发育漂移或可能具有诸如在折叠、组装中的包括与小亚基的相互作用或稳定性的分支特异性的生理学作用。术语"趋异候选氨基酸残基"或"趋异候选残基"(DCR)指疑为能立体地和/或静电地影响一个或多个目标残基并从而影响由所述一个或多个目标残基介导的蛋白功能的选自多个变异残基的氨基酸残基。在至少三个系统发育分支中的蛋白的共有序列内的给定位置上的氨基酸残基差异的基础上选择所述趋异候选残基。例如,在选择Rubisco的趋异候选残基的背景下,趋异候选残基是疑为能立体地和/或静电地影响一个或多个Rubisco目标氨基酸残基的残基,该趋异候选残基可存在于来自红藻的共有序列中但在来自开花植物的共有序列和蓝细菌的共有序列的对应残基中不同,且还在来自开花植物的共有序列和蓝细菌的共有序列的对应残基处不同。所述趋异候选残基可选自来自任何被比较的系统发育分支之一的蛋白的序列或共有序列。术语"替代候选氨基酸残基"或"替代候选残基"(ACR)指表达于第二蛋白中的候选残基的位置上但不是表达于第二蛋白的共有序列中的氨基酸的替代氨基酸。因此替代候选残基提供了表达于至少一种第二蛋白中的给定位置上但不在来自相同系统发育分支的大多数序列中表达的残基。当蛋白为Rubisco时,ACR可以选自例如展示了明显高于来自典型红藻物种的Rubisco的催化速率的Gnj^ffe,awo"o/fsRubisco序列。术语"共变异氨基酸残基"或"共变异残基"(CvR)指在来自特定物种的第二蛋白序列中鉴定为处于替代候选残基附近且显示出与所述替代候选残基互补的变化的残基。不存在于第二蛋白的共有序列中的所述共变异残基的变化似乎反映了替代候选残基和共变异残基的结构和/或静电性质中的互补变化。共变异残基的鉴定提供了鉴定第一蛋白中可突变以更好地适应由转移替代候选残基引起的变化的辅助残基位置的方法。术语"物种特异性变异氨基酸残基"或"物种特异性变异残基"(SsVR)指蛋白的近缘物种间变化的残基。连同每种变异蛋白的相关功能数据,SsVR可用于绘制序列-结构-功能关系图。这些相关性可用于预测哪个可变残基可能对所述蛋白的期望性质的改善贡献最多。该SsVR信息可连同普通方法用于鉴定CR。对含有残基组的候选突变蛋白的预测可包括除更直接影响目标残基的CR、ACR、DCR或CvR外的SsVR。术语"候选突变蛋白"或"候选突变体"(CM)指其中将两个以上CR和/或ACR和/或DCR中至少之一或多组与可选的额外CvR或SsVR一起并入单一蛋白的突变蛋白。术语"区域"指可能在一个或多个特定目标残基与反应中心或结合位点的特定部分的临近性的基础上形成的围绕目标残基的蛋白结构分区。区域包含空间性连续体积的蛋白结构,所述蛋白结构含有可能优选地影响一个或多个特定目标残基与反应中心或结合位点的特定部分的相互作用的CR、DCR、ACR、CvR和SsVR的子集。区域的边界没有准确定义。区域可含有蛋白结构的重叠片段。定义区域的目的是通过对可聚集以形成候选突变体的CR、DCR、ACR、CvR和SsVR的子集的松散鉴定来协助系统发育嫁接方法的应用。例如,当蛋白为Rubisco时,包含大多数大亚基N端域和数个来自相邻大亚基的C端域的小结构片段的标为区域1的区域可鉴定为能影响目标残基Asnl23、Glu60和Tyr20,所述目标残基在气体加成步骤中与反应物种的新生羧酸根基团直接或间接地特异性相互作用。术语"亚区"指可能在一个或多个特定目标残基与区域的成员部分的临近性的基础上形成的区域分区。亚区包含空间性连续体积的蛋白结构,所述蛋白结构含有被预测为优选地影响与所述区域相连的一个或多个特定目标残基的性质的所述区域的CR、DCR、ACR、CvR和SsVR的子集。亚区的边界没有准确定义。亚区可含有蛋白结构的重叠片段。定义亚区可以通过对可优选地聚集以形成候选突变体的所述区域的CR、DCR、ACR、CvR和SsVR的子集的松散鉴定来协助系统发育嫁接方法的应用。例如,当蛋白为Rubisco时,可以鉴定出分别被预测为优选地影响目标残基Tyr20、Asnl23和Glu60的性质的标为1A、1B和1C的区域1的成员区域。术语"序列空间"广泛地指特定长度的聚合物的所有可能残基序列的组。例如,长度为100个氨基酸残基的蛋白或多肽的完整序列空间为由所述100个氨基酸的所有可能变化组成的所有序列的组。如果仅考虑单一突变,则长度为100个氨基酸残基的蛋白或多肽的序列空间为IOO乘以19(对于20氨基酸残基组)。因此,给定长度的蛋白或多肽的序列空间的减少将减少一组蛋白或多肽突变体中的氨基酸残基的可能序列数量。在本发明背景下,对目标氨基酸残基和变异氨基酸残基的独立鉴定产生了两个不同的待检验的序列空间的缩减组。当使用目标氨基酸残基来从变异残基中鉴定候选氨基酸残基时受影响的所述组的后继交集进一步减少了可供考虑的序列空间。于是,需要考虑用于突变的蛋白残基及其组合的数目从而极大减少。如本文所用,术语"定向进化"指针对修饰目标蛋白的功能和/或结构的方法。一般而言,定向进化是"修改"蛋白以在不同或现存的天然或人工化学或生物环境中发挥作用和/或引出新功能和/或增加或降低给定活性和/或调节给定特性的过程。现在将参考附图通过实施例的方式对本发明进行说明。流程图1提供了Rubisco再造策略的流程图,突出了计算化学和生物信息学在提供机理、序列、结构和系统发育信息中的作用,所述信息由系统发育嫁接方法整合以产生对候选突变蛋白的计算机模拟预测。该整合提供了可以使用目标残基来从变异残基中选出候选残基的方法,从而极大减少了需要考虑用于趋向功能性质的改进的突变的蛋白的残基及其组合的数目。如中列所示,候选残基可以可选地包括ACR和/或DCR。这些过程更详细显示于流程图2中。预测步骤之后是实验筛选和对功能性质的改进的评价。结果可反馈到预测步骤中以改进对候选突变蛋白的预测,其后是更多轮的计算和实验筛选以及对功能性质的改进的评价,以最优化蛋白活性。虚线框表示对核心系统发育嫁接方法的可选扩展,所述可选扩展以放大形式显示于流程图3中。流程图2提供了详细说明系统发育嫁接方法的预测策略的流程图,显示了计算化学与生物信息学分析的整合以产生候选突变蛋白的排序列表。该过程涉及选择对目标残基的可变残基以产生候选残基(所述候选残基可选地可包含ACR和/或DCR)、分组并合并候选残基(和/或趋异候选残基或替代候选残基)的组以及对所述组排序并合并所述组以产生用于可选的计算预筛选和实验筛选的候选突变蛋白排序列表的步骤。流程图3提供了详细说明系统发育嫁接方法的可选扩展的流程图,其中评估了一列候选残基并组装为候选突变体,然后可以基于在目标残基上的影响补充额外的候选残基、替代候选残基、趋异候选残基、共变异残基和物种特异性变异残基并分组,然后形成新的改进候选突变体。图1提供了参与对将RuBP在Rubisco活性位点处转化为两分子3-PGA提出的反应机理的分子结构的图示。显示了烯醇化、羧化、水化、C2-C3键断裂和C2质子化的五步。罗马数字对应于图3和图4中显示的中间体和产物种类。R基=-CH(OH)-CH2-0-P032-。图2显示了指定为FM20的Rubisco活性位点的77原子片賴j莫型的分子结构,所述^^莫型用于反应途径的从头算QM计算化学研究。显示了用于表示LYS175、LYS177、ASP203、GLU204、KCX201(氨曱酰化的LYS201)、HIS294、和LYS334氨基酸残基、水分子、二氧化碳分子和底物RuBP的烯二醇形式的4碳片段的分子片段种类。此外,还显示了成分种类的电荷状态及其相互作用,即与Mg原子配位的六个原子、氢键和C02与C2之间的范德华相互作用。图3A3E提供了使用从头算QM方法为图2中所示FM20片段模型计算出的一系列分子结构。这些图显示了沿Rubisco羧化酶反应中从烯二醇式到最终产物的反应途径的局部最小值的几何构型。用黑色圆圏突出了Mg配位水分子的氢原子。通过标记显示了展示出随着反应进行成员之间变化的相互作用的各个结构的相关距离。某些结构上的标记可能被隐藏。标记"d,,指RKCX201-H...O2,"i,,指Row…c3,"j,,指RH20[Mg]-Hwl...O-GLU204而"k"指RH20[Mg]-Hwl。罗马数字对应于图4中所示的中间体、过渡态和产物种类。图4提供了说明羧化酶途径中的羧化和后续反应的势能表面的图,所述势能表面使用从头算QM计算化学计算在带77个原子的片段模型(FM20)上计算。所述羧化酶反应进程的不同阶段分布于X轴上。沿所述反应途径的罗马数字指定了图1所示的羧化酶反应的起始态(I)、中间态(in、v、vn)和产物态(ix),和它们的连接过渡态(n、iv、vi、vm)。所有这些状态的结构显示于图3中。所有状态的能量(kcal/mol)显示为与起始烯二醇式状态l的相对值,而相对于起始或相关中间态的过渡态能量由Ea和箭头显示。图5A5D使用单字母氨基酸符号提供了来自属于覆盖了红藻、蓝细菌、灰藻和植物(10门)的十三个不同门的光合生物的RubiscoLSU氨基酸序列的序列比对。这些序列还以SEQIDNO:l13提供。当在一门中有超过一个Rubisco序列可利用时,使用50%共有序列来表示该门。对于所述共有序列,括号内数字表示其序列用于产生所述共有序列的属的数目。在表1中给出了在所述比对中使用的所有序列的数据库登录号。所述图显示了RubiscoLSU序列高度保守,包括除N端和C端处的微小差异外几乎完全没有空隙以及475个残基的长多肽链(植物和蓝细菌)的编码。符号""表示序列空隙。单字母的大写字母表示氨基酸残基字母,而小写字母和其它符号显示于其中仅保留了残基类型的共有序列中的位置上"h",疏水残基(A,C,F,G,H,I,K,L,M,R,T,V,W,Y);"s",小残基(A,C,D,G,N,P,S,T,V);"u",极小残基(A,G,S);"a",芳香残基(F,H,W,Y);"c",带电荷残基(D,E,H,K,R);"1",脂族残基(I,L,V);"p",极性残基(C,D,E,H,K,N,Q,R,S,T);"o",醇类残基(S,T);"t,,,易转角残基(A,C,D,E,G,H,K,N,Q,R,S,T);"-,,,带负电残基(D,E);和"+,,带正电残基(H,K,R)。使用位于http:〃coot.embl.de/Alignment//consensus.html的月良务器获4寻了共有序列。基于菠菜(pdb8ruc)、聚球藻(pdblrbl)和(pdblbwv)与Mg"及2CABP的复合体的X射线结构之间的结构比较修正了所述比对。所述结构的SEQIDNO分别为17、16和14,如表1中所示。行末的数字表示序列数。顶部均匀隔开的数字是比对标记,而粗体数字表示菠菜的序列数。图6A和6B提供了来自红藻(红藻门;9种)、蓝细菌门(ll种)和开花植物(木兰门;134种)的RubiscoLSU的50%共有序列。这些序列分别呈现在列为SEQIDNO:2、3和11的序列中,如表1所示。浅灰色阴影表示在开花植物和蓝细菌中相同但在红藻中不同的134个残基,即变异残基。序列中的空隙由""显示。大写和小写字母及"-"和"+"符号的定义与图5中相同。行末的数字表示序列数。顶部均匀隔开的数字是比对标记,而粗体数字表示菠菜的序列数。图7A和7B提供了来自红藻(红藻门;9种)、蓝细菌门(ll种)和开花植物(木兰门;134种)的RubiscoLSU的50%共有序列,与图6所示相同的序列。其中氨基酸残基在所有三个共有序列中得到保留的位置对于红藻(首行)由单字母符号显示而对于蓝细菌和植物由打点线表示。其中蓝细菌或植物的氨基酸残基与红藻相同的位置对于红藻(首行)由单字母符号显示而对蓝细菌或植物由打点线显示。其中在蓝细菌与植物中相同而在红藻中不同的氨基酸残基,即图6中所示134个变异残基的位置对于红藻(首行)由单字母符号显示且对蓝细菌(第二行)由单字母符号显示,而所述残基位置对植物(第三行)为空白位置。反转阴影突出了选为区域1的候选残基的那些VR位置,如表2所示,及聚集为所预测的候选突变体的那些VR位置,如表3和表4所示。符号""表示序列空隙。大写和小写字母及"-"和"+"符号的定义与图5中相同。行末的数字表示序列数。顶部均匀隔开的数字是比对标记,而粗体数字表示菠菜的序列数。图8提供了一个LSU多肽的C端TIM筒(残基151~475)和包含了隐含一个Rubisco活性位点的相邻LSU的N端域(残基1~150)的结构的侧面图。该图显示了区域l的目标残基E60、N123及Y20,区域2的目标残基H294和区域3的目标残基K334。该结构使用来自于Mg"和2CABP的复合体中的野生型菠菜Rubisco(pdb8ruc)的完整LsSs十六聚体的X射线结构的原子坐标绘制。2CABP以CPK模型显示。残基E60和N123分别位于N端域的螺旋aB内和螺旋aC的C端末端附近。这两个残基的侧链各位于2CABP的羧酸根基团的一侧。螺旋aB和螺旋aC与N端域的(3-链具有疏水相互作用。Y20位于卩A的N端末端附近的单一螺旋结构上。K334和H294都位于含有大多数活性位点的第一层残基的C端域。K334在环6中,而H294在05中。图9提供了以棍式模型模拟的带有用于突变体tf6(T23G、Y25W、D51IGp、K81R)以及成员突变体弁4(T23G、K81R)和弁la(Y25W、D51IGp)的突变残基(G23、R81、W25和151)的侧链的RubiscoLSU多肽N端域结构的图(使用来自菠菜X射线结构8ruc的坐标)。突变体定义参见表3。该图显示了所述残基在所述结构中的相对位置,还显示了残基25(W25)与51(151)之间以及残基23(G23)与81(R81)之间的相互作用。所述突变与野生型Y25和D51相比在残基W25和151之间加入了疏水相互作用,且去除了残基23和81之间的氢键相互作用(野生型T23,K81相比突变体G23,R81)。据预测这两个双重突变可分别或一起改变残基Y20的方向。目标残基Y20、E60和N123以球棍模型显示作为参考,而反应中间体模拟物2CABP以线模型形式显示。图10提供了以棍式模型模拟的带有用于突变体存7a(Y25W、D51IGp、G54AGp、C84A、187V)以及成员突变体弁la(Y25W、0511,和#5a(G54AGp、C84A、I87V)的突变残基(W25、151、A54、A84、V87)的侧链的RubiscoLSU多肽N端域结构的图0吏用来自菠菜X射线结构8ruc的坐标)。该图显示了通过在位点54(G—A)、84(C—A)和87(I—V)突变的疏水区域的形成。此外,如果将野生型G54突变为S54^而非A54GP(突变体弁7b、#5b),则据预测会引入与残基51的骨架之间的额外氢键。反过来,151具有与残基W25的疏水相互作用。据预测所有这些变化会影响目标残基Y20的定位,所述残基以球棍形式显示。其它区域1目标残基E60和N123的位置以球棍模型显示作为参考,而反应中间体模拟物2CABP以线模型形式显示。作为参考,还显示了突变体#4(G23、R81)的突变位置。图11提供了以棍式模型模拟的带有突变残基(VGP或IGm36、L116,、1121、lGp或igm140、g297、t300)的侧链的Rubiscolsu多肽的n端域的图(使用来自菠菜X射线结构8ruc的坐标),所述突变残基用于突变体弁10a(L36V、H16L、V12U、F140L、M297G、V300T)与其它突变体弁10Gp/Gm变异体(弁10b、c、d)以及成员突变体#8(V1211、M297G、V300T)和弁9a(L36V、1116L、F140L)和其它突变体#9Gp/Gm变异体(#9b、c、d)。没有突变的残基A296和V271也以棍式模型显示。为了帮助理解经预测由所述突变造成的相互作用的变化,RHS嵌入框以棍式模型显示了野生型聚球藻中的对应残基。该图显示了所预测的野生型中的残基V300、M297与V121之间的疏水相互作用的破环从而形成了突变体(#8或弁10a)内A296、V271与1121之间新的疏水相互作用。该预测基于菠菜(pdb8ruc)、聚球藻(pdblrbl)和Ga/WeW/ar故a(pdblbwv)与Mg"和2CABP的复合体的X射线结构之间的结构比较。还预测了由L—V、F—L和I—L产生的残基36、140与116之间新的疏水相互作用。据预测由所述突变组介导的这些新的疏水相互作用会分别或一起影响以球棍模型显示的目标残基N123的位置和方向。其它区域1目标残基E60和Y20的位置以球棍模型显示作为参考。图12提供了菠菜RubiscoLSU的N端域的立体图(使用来自菠菜X射线结构8ruc的坐标)。所有N端残基的侧链以线框^f莫型显示。目标残基(Y20、E60和N123)以棍式模型显示。羧化中间体模拟物2CABP和Mg2+以球棍模型显示。该图显示了所述N端域的所有残基侧链的完整3-D图示,从所述N端域的所有残基侧链选出了预测会影响所述TRY20、E60和N123的CR,如图13所示。作为参考,所述结构的方向与图15中相同。图13提供了菠菜RubiscoLSU的N端域的立体图(使用来自菠菜X射线结构8ruc的坐标),其中表2中所列的20个候选残基和6个趋异候选残基以棍式模型显示而目标残基标为N123、E60和Y20。该图显示了预测会影响所述TRY20、E60和N123的N端域内的CR和DCR侧链,以及来自显示了据预测也会影响所述TR的CRM297和V300的伴侣LSU的C端域的小片段的完整3-D图示。标为T23和K81的残基是在突变体糾中突变的残基(T23G、K81R),而标为Y25和E51的残基是在突变体#6中额外突变的残基(T23G、Y25W、D51lGP、K81R)。图14A和14B提供了来自开花植物(木兰门;134种)、蓝细菌门(11种)和红藻(红藻门;9种)的RubiscoLSU的N端域的50%共有序列,以及几种植物(菠菜、烟草、水稻、大豆和甘蔗)、聚球藻PCC6301和特殊兴趣的红藻种类(G3W/en'/or故a,Gn^^/w/amcwofc)的氨基酸序列比对。本图中所示序列也在此前图5~7中所用的SEQIDNO2、3和11,及SEQIDNO14~21中进行说明。它们与数据库登录号一起列于表l中。全序列对于蓝细菌共有序列以单字母和符号形式显示(符号的解释参见图5),而其它序列中的氨基酸残基如果被保留的话由点显示或如果不保留的话由单字母/符号格式显示。行末的数字表示序列数。顶部均匀隔开的数字是比对标记,而粗体数字表示菠菜的序列数。黑色反转阴影的垂直条带突出了所述N端域中的17个当前候选残基(即在来自开花植物和蓝细菌的50%共有序列中相同而在红藻中不同的那些残基)残基18、19、23、25、51、54、59、64、68、81、84、87、88、104、114、118、121。灰色阴影的垂直条带突出了6个当前趋异候选残基(即在绿色植物、蓝细菌和红藻中不同的那些残基)残基36、86、116、117、138、140。图15提供了菠菜RubiscoLSU的N端域和相邻亚基的C端域片段(使用来自菠菜X射线结构8ruc的坐标)。在(3-酮基反应中间体(2-羧基-3-酮基阿拉伯糖醇-l,5-二磷酸(2C3KABP);III;参见图l)的底部,在活性位点的第一层配位的Mg^和来自伴侣LSU的C端域的其它残基及它们对目标残基Y20、E60和N123的配置。Y20、E60和N123与所述(3-酮基反应中间体以球棍模型显示,而活性位点残基以细棍模型显示。该图显示了N端域内的亚区1A以及N端域和相邻亚基的C端域片段内的亚区1B。亚区1A包含CR18和新的CR19、68和104的位置,所述新CR19、68和104被期望如果以组合或它们的进一步组合而突变(弁17-1A(#4+K18I/T68V)、#18-1A(斜+P104E(D)),#19(#4+D19P))会改善突变体弁4(T23G/K81R)。亚区1B包含含有DCR116、117、138和140、CR121及完全保留的残基135的新候选突变体弁20-lB(VI16L/L117T/V121I/I138M/F140L)。图16A和16B提供了带有亚区1B内的候选突变体弁20-lB(V116L/L117T/V121I/I138M/F140L)内的相互作用的扩大图的图。A图显示了完整的N端域、TRN123、E60和Y20以及活性位点中心(2CABP,Mg"和螺旋C和链E作为参考。B图显示了位于螺旋C和链E上的成员残基116、117、120、121与残基135、138和140如何相互作用,和对这些相互作用的改变如何被预测会影响附近的TRN123;另一图示在图17中。2CABP和Mg"以CPK才莫型显示。N123、E60和Y20以粗棍模型显示。图17提供了作为带状模型的RubiscoLSU的N端域和相邻亚基的C端域片段,显示出所有三个亚区1A、1B和1C以及这些亚区内的某些CR和DCR的相对位置。用于设计区域1候选突变体的某些关键的预测相互作用由连接CR和DCR的线条显示。图18提供了在以DFT作为高层而半经验(PM3))作为低层进行的QMONIOMQM/QM计算中使用的结构模型。所述DFT层(以大球棍模型显示)包含了包括活性位点的第一配位层中所有残基片段和底物的93个原子镁原子(Mg2+)、RuBP的烯二醇式、GLU60、ASN123、LYS175、LYS177、氨曱酰化LYS201,ASP203、GLU204、HIS294、LYS334。该核心层还由PM3(半经验QM)层中的711个原子围绕,所述PM3层包含离Mg"最远约12A的氨基酸残基。起始坐标取自菠菜Rubisco-2CABP复合体(pdb8ruc)的X射线结构。整个体系的尺寸为804个原子。图19提供了显示Rubisco活性位点的核心结构和围绕目标残基的结构分为三个空间连续区域的图。区域l包含能影响TRGLU60、ASN123和TYR20的氨基酸残基,还包含N端域和相邻亚基的C端域小片段。区域2和3在C端域内且分别包含能影响TRHIS294和LYS334的氨基酸残基。图20提供了显示通过非变性聚丙烯酰胺电泳分离深红红螺菌L2Rubisco和烟草L8S8Rubisco的凝胶。用于动力学测量的来自野生型烟草、烟草突变体#4和烟草突变体#23-1B株的可溶叶蛋白通过非变性聚丙烯酰胺电泳分离并由考马斯染色显像。存在于zlaadA烟草-红株(tr)中和异种组织烟草突变体#4转化抹#4(即它产生"和突变L8S8Rubisco)中的L2Rubisco在其它烟草突变^^或野生型烟草转化林中不存在。带尺寸的标记蛋白以(m)标识。显示了每列加载的可溶叶蛋白量。具体实施例方式本发明提供了产生具有改进的功能性质的蛋白的方法。首先,本发明包括通过使用机理(计算)信息和生物信息学信息和数据库(系统发育特异性/环境特异性序列变化、动力学数据、3-D结构和模拟)信息来确定带一个或优选多个突变的突变体从而缩减用于传统突变测试的序列空间的过程。该过程寻求对所有可利用信息特别是编码于Rubisco序列内的部分进化改变最大化,从而对于所需功能性质的所述蛋白改善过程开始于更接近所需功能效率水平的功能水平。所述方法的第一步包括鉴定第一蛋白内的目标氨基酸残基的过程。如下文中更详细说明,鉴定目标氨基酸残基的过程可包括活性位点片段QM计算(使用例如DFT方法的步骤(i))和杂化QM/QM或QM/MM计算(使用例如ONIOM方法的步骤(ii))联合经验数据(例如,动力学数据和X射线晶体结构)的使用。可以分别使用分子动力学(MD)模拟(步骤(iii))以及使用qm、qm/qm或qm/mm和md方法的组合的计算(步骤(iv)和(v))来评估所预测候选突变蛋白的稳定性,或更详细理解对所述目标残基在所述酶反应中的作用。这些目标氨基酸残基将通常为用于与所研究的功能性质有关的蛋白的正确功能化的基础残基。本发明的一个优选特征是所述改进的功能性质通过修饰这些残基的化学性质(通过其它残基的突变)以便改进例如它们的动力学活性来达成。Rubisco氨基酸残基的编号约定在本说明书中由始至终,当由数字来鉴定RubiscoLSU的残基时,残基编号基于来自菠菜RubiscoLSU(SEQIDNO:17)的氨基酸序列的残基编号。该编号约定用于在计算化学中、蛋白结构中和突变中所鉴定的所有残基。由于这些数字能映射到比对中或来自结构比较的序列数字,且相应地给定菠菜残基数可完全有信心映射到结构等价的蓝细菌或红藻残基数字,因此这不会造成混淆。序列列表表1提供了本文讨论的和在计算机可读序列列表中提供的天然存在Rubisco氨基酸序列和50%共享Rubisco氨基酸序列,SEQIDNO显示在"SEQID"栏中。当使用多个序列以产生50%共有序列时,参与所述共有序列创建的序列的总数列在"说明"栏的括号内。数据库登录号为所用的各个序列包括在共有序列的创建中考虑的那些序列提供了唯一标识符。比对使用所述序列的图的编号也在"图号"栏中给出。表l:图5、6、7和14中所用RubiscoLSU序列的数据库登录号。序列ID号对应于在算计可读序列列表中的ID号。<table>tableseeoriginaldocumentpage41</column></row><table><table>tableseeoriginaldocumentpage42</column></row><table><table>tableseeoriginaldocumentpage43</column></row><table>目标残基的鉴定——计算机理下文中有关于目标氨基酸残基的鉴定的步骤(i)和(ii)对于从头算QM和ONIOM计算(Frisch等,2004)使用GAUSSIAN程序包进行,但也有一些可替代性地使用的其它可用的专有程序或免费使用的程序。步骤(iii)使用了通常可用的AMBER程序(Case等,2006)以进行蛋白MD模拟;该能力在许多其它程序中也可利用。步骤(iv)和(v)对酶机理模拟采用了已发表的理论、协议和程序(Gready等,2006);在程序MOPS(Cummins,1996)中实行了核心半经验QM/MMMD模拟方法(Cummins&Gready,1997,1998,1999,2003,2005;Cummins等,2007)。(i)活性位点片段复合体QM计算下列说明涉及关于RubsicoLSU的计算,其中活性位点残基在种类之间完全被保留。这些计算使用高级从头算QM方法(B3LYP/6-31G(d,p))以确定多步Rubisco反应机理中的反应物种(底物、过渡态(TS)、中间体和产物复合体)的能量学和结构,如图1所示。使用Gaussian03程序组(Frisch等,2004)并用取自菠菜Rubisco-2CABP复合体(pdb8ruc)的X射线结构的起始坐标,对从气体加成反应开始的反应步骤进行了计算。如图2中所示的FM20的活性位点片段模型足够大到可包含与反应中心和活性位点内的配位Mg原子直接相互作用的所有残基和水分子,且可允许对它们在包括关键气体(C02或02)加成步骤的不同反应步骤中的作用的确定。羧基化和后继反应步骤的反应物种结构和反应能量途径分别显示在图3和图4中。(ii)ONIOM杂化QM/QM和QM/MM计算这些计算确定了对能量学和反应途径物种的微扰,且主要集中在来自活性位点残基的次近临近基团及其外基团的气体加成步骤上。这使用了对系统核心(即如(i)中)使用高阶但计算性昂贵的从头算QM模型和对扩展区域使用更低廉的QM(半经验QM)或MM模型的方法来完成。所述计算(QM/QM和QM/MM)使用GAUSSIAN03中的ONIOM模块在数个阶段进行。所述ONIOMQM/QM计算使用93个原子的高级从头算QM核心层的模型。对所述气体加成步骤的起始点的研究,所述QM核心层包含镁原子(Mg^)、RuBP的烯二醇式(为计算后继反应物种的结构和能量使用了相应的RuBP衍生化学物质)、GLU60、ASN123、LYS175、LYS177、氨曱酰化LYS201、ASP203、GLU204、HIS294和LYS334。所述核心层由在PM3(半经验QM)级别计算的外层中的另外711个原子围绕,所述外层包括了离所述镁原子最远约12A的氨基酸残基。起始坐标取自菠菜Rubisco-2CABP复合体(pdb8ruc)的X射线结构。该模型在图18中显示。这些计算的作用是比较活性位点附近的嫁接残基与野生型的残基在所述反应途径物种的能量学和结构上的效果,主要集中于所述气体加成步骤上。这些计算允许了对类似于用于图3和4中所示QMFM20模型的活性位点片段的所述反应物种的93原子活性位点片段的结构和能量在环绕酶残基(所述711原子外层)的环境中重新优化,并因此允许了由于待评估的嫁接残基造成的所述反应的能量分布的微扰。因此这些计算可以提供对在本情形中的待确定野生型菠菜Rubisco的基本机理的纟鼓扰,具体而言,所述气体加成步骤中所结合C02和新生羧酸根基团的结构的细节的宝贵认识。通过这些方式,可以计算出因候选突变体中的嫁接残基引起的对目标残基与反应物种的相互作用的静电微扰的数量级和方向。该信息可以用于预筛选用于实验测试的候选突变体和/或用于对如流程图1左侧列中所示的实^r测试结果的解读。(iii)蛋白复合体的分子动力学(MD)模拟这些模拟评估了嫁接Rubisco候选突变体的蛋白结构是否能容纳改变的残基,即所述突变蛋白结构是否为构象稳定的或它是否趋向于解链。MD模拟对多重嫁接突变体特别有用,且提供了全局稳定性筛选测试以对在来自(ii)的化学机理上的电子测试进行补充。这些计算用AMBER8或AMBER9程序包进行(Case等,2006),但也可使用其它蛋白MD模拟包(例如GROMACS)来获得相似结果。(iv)复合体的不同抽样构象态的多重ONIOM杂化QM/QM或QM/MM计算在该方法中使用取自QM/MMMD才莫拟的轨迹快照的蛋白复合体的坐标执行了一系列计算(例如对于不同反应步骤),如Gready等所述(2006)。这些计算允许了对所述催化途径的特征,即蛋白构象的灵活性在酶复合体几何构型和激活和反应能量上的影响的更详细的4t睑。(v)气体加成反应的全反应自由能曲面的产生在反应步骤的完整过程中的酶状态的完整统计总体(构象平均)可以从对反应坐标(自由能超曲面)定义的点格的半经验QM/MMMD模拟产生。然后更精确的自由能曲面可通过ONIOMQM/MM计算在从头算QM等级产生,所述ONIOMQM/MM计算使用例如多达120的从半经验QM/MM反应超曲面上的点采样的多个组态(Gready等,2006;Cummins等,2007)。这些酶的自由能曲面提供了可直接与诸如实验测定的动力学常数的实验数据进行比较的反应和活化自由能,且还可用于计算野生型和突变体之间的在反应和活化自由能中的差异。(vi)反应机理和目标残基的确定基于这些计算结果,本发明人能推导出在羧化酶催化中的整个反应序列的机理,并确定活性位点残基各自和协同的确切作用。从所述QM片段计算中,对各反应步骤鉴定了一对关键氨基酸残基,一个作为碱而另一个作为酸。具体而言,对所述气体加成步骤鉴定出了HIS294和LYS334对。对于Rubisco羧化酶反应,起始点是带有结合到活性位点的RuBP的烯二醇形式的Rubisco复合体和保持在与所述烯二醇式的C2^友的范德华相互作用距离处的C02分子。该状态在图1、3和4中以I表示。所述反应通过过渡态进行,所述过渡态的特征为C02的碳原子和所述烯二醇式的C2碳之间的部分共价键伴以所述烯二醇式的C2和C3碳原子之间以及C3和03原子之间的部分双键的形成。该状态在图3和4中以II表示。所述反应步骤以气体分子和p-酮基中间体(2C3KABP)的C2碳之间的共价键的形成而结束。该状态在图1、3和4中以III表示。在所述气体加成步骤中,HIS294充当^f威以从03原子完全除去一个质子;这转移了部分负电荷到C2碳且使其能与C02的碳原子形成共价键,并且还将所述负电荷转移到新生的羧酸根基团。带正电的LYS334帮助稳定了在所述新生羧酸根基团上发展的负电荷。这些特征可见于图3中的IIII的详细结构中。因此,HIS294的名威性和LYS334的酸性(电荷)对所述气体加成步骤是至关重要的。对这两个残基的性质的修饰可能影响所述气体加成步骤的能量学,所述修饰可通过例如空间地改变它们与烯二醇式底物或p-酮基中间体的相互作用的方向/距离或电子地改变与烯二醇式底物或P-酮基中间体相互作用的原子上的电荷来进行。因此,HIS294和LYS334被鉴定为"目标残基",所述"目标残基"广泛地定义为经预测为在反应才几理和能量学上具有显著影响的残基。HIS294和LYS334在C端域内,在空间上独立,且影响烯二醇式底物或(3-酮基中间体的不同部分。因此,可能影响它们的性质的氨基酸已划分在不同区域内;对His294为区域2而对Lys334位区域3,如图19所示。尽管残基ASN123没有包括在用于QM计算的FM20活性位点片段模型中,对晶体结构的检验和初步QM/QM计算表明该残基也参与了稳定在C2加入的新生羧酸根基团上的电荷。此外,对晶体结构的检验显示E60和Y20被安置来直接改变LYS334上的电荷(即LYS334的电荷/方向可通过才喿控E60和Y20来改变),和中间体2C3KABP的C2-羧酸根基团。因此,将E60、Y20和N123也鉴定为目标残基。这三个残基在所述LSU的N端域内,且因此可能影响它们的性质的氨基酸划分为属于与HIS294和LYS334的区域(图19)不同的区域(区域1)。这三个残基在所有催化活性RubiscoLSU中严格保留且据预测会在所述气体加成步骤中以协同方式起作用。这可以通过对图8、9、10、12和15的观察来估计,所述图提供了ASN123、GLU60和Tyr20关于p-酮基中间体类似物(2C3KABP)的羧酸根基团的相对位置的不同视图。这些图显示了ASN123、GLU60和Tyr20与所述N端域的三个不同二级结构区连接且它们的侧链以三分式构象延伸进入所述活性位点内。总之,上述方法包括了在全局或更详细的水平对Rubisco野生型和任何预测的候选突变体的羧基化和氧合步骤研究机理、能量和稳定性问题的一整套计算方法。如此,可以鉴定一个或多个目标残基以充当系统发育嫁接的焦点。蛋白比较-系统发育,在最广泛的形式下,本文所述方法还包括至少一个第二蛋白与至少第一蛋白的比较。所述第二蛋白可能源自与所述第一蛋白相同或不同的系统发育分支。比较过程需要鉴定至少一个所述第一蛋白与所述第二蛋白之间的变异氨基酸残基。所述第二蛋白的多个变异残基充当不同特异性氨基酸残基标识库,所述氨基酸残基可以"嫁接,,到所述第一蛋白上以试图改善由所述目标残基介导的第一蛋白的功能性质。以Rubisco为例,Rubisco氨基酸序列中的系统发育分支特异性变化,诸如来自不同进化谱系的系统发育组的Rubisco中或表达环境特异性变化的Rubisco中的变化,代表了所述Rubisco的催化效率的可能性部分优化。开发了称作"系统发育嫁接,,的策略以鉴定代表这些部分进化方案的关键残基和将这些残基选择性"移植"到诸如来自聚球藻属的Rubisco的宿主Rubisco内,所述策略通过将所述具体宿主残基改变为带一种或多种改善(或优选)动力学特征的供体Rubisco或供体Rubisco组的残基进行,其意图为产生带这些改进的动力学特征的宿主Rubisco。上述部分进化方案通过将流程图1左栏中所示计算研究的结果(目标残基)与流程图1右栏中所示系统发育分析的结果(变异残基)合并以选择如流程图1中间栏中所示的候选残基的过程来确定。这些方案分布在不同Rubisco系统发育分支之间的LSU的特征性(共享)保留序列变化中的候选残基当中,或分布在来自相同分支且更加适应于例如干燥/湿润或炎热/寒冷的特定环境的Rubisco当中的变化中的候选残基当中。()对计算研究的结果与系统发育分析的结果进行整合从而鉴定变异残基的特定子集(即候选残基)使之能区分可能影响功能性质(例如气体加成步骤的效率)的残基与系统发育分支之间的其它特征性(共享)保守序列变化,所述变化代表了例如中性系统发育漂移或分支特异性生理学作用()。以Rubisco酶为例,分支特异性生理学作用可以包4舌所述蛋白的折叠和组装,包括小亚基之间的相互作用,或蛋白稳定性。(i)系统发育分析对变异残基的鉴定下面对Rubisco的特异性因子的讨论说明了为了鉴定变异残基而对鉴定带序列保守的目标残基的计算推导机理与系统发育信息的组合使用。红藻Rubisco的极高特异性因子可能归因于在蓝细菌和开花植物Rubisco中相同但在红藻Rubisco中不同的残基。本文中将这些残基定义为"变异残基"。如果将充当红藻Rubisco中的特异性决定因子的单一变异残基或多个变异残基鉴定出并选择性结合到开花植物/蓝细菌Rubisco内,则可以产生在宿主生物内生理学活性的Rubisco,该Rubisco具有比天然酶更高的对C02的特异性。第一层残基,即直接与反应中心配位的那些残基(Glu60、Asnl23、Lysl75、LYS177、KCX201、Asp203、Glu204、His294和Lys334)在Rubisco中完全保守。该保守如图5中所示,显示了来自属于覆盖了红藻、蓝细菌、灰藻和植物(10门)的十三个不同门类的光合生物的RubiscoLSU序列的比对。当在一门中有一种以上Rubisco序列可以利用时,使用50%共有序列代表该门。所述共有序列使用在http:〃coot.embl.de/Alignment/7consensus.html的月艮务器获4寻。图5还显示了475个残基的RubiscoLSU序列通常高度保守,包括除N端和C端的细微差异外几乎完全不存在空隙。然而,在围绕反应中心的第二层和后继层中的残基显示了在开花植物、红藻和蓝细菌的主要Rubisco分支当中的变化。红藻显示了最大的对C02的特异性,这由约160的C(V02比相比于绿色植物的约80和蓝细菌的约40的0)2/02比而确定。在图6中的比对中更清楚的说明了在开花植物、红藻和蓝细菌当中的序列变化,该图仅包含已在图5中显示的来自红藻(红藻门;9种)、蓝细菌门(l1种)和开花植物(木兰门;134种)的RubiscoLSU的50%共有序列。图6显示出134个残基在开花植物和蓝细菌中相同但在红藻中不同,即变异残基。图5和6中的比对中所用各个序列的数据库登录号在表1中给出,同时给出的还有用于计算才几可读序列列表的SEQIDNO。在该实例中,从RubiscoLSU鉴定了134个变异残基,其中分布了对由红藻Rubisco所展示的增高特异性的部分进化方案起作用的残基。这些残基在图6的比对中以灰色阴影残基显示。由于所述特异性决定因子可由数个变异残基的组合编码,可能有上千种这样的组合。因此,为了具有实际使用性,需要从变异残基列表中选出包含所述特异性决定因素的子集。(ii)(a)候选戎基的鉴定使用如下所述方法,鉴定了具有影响Rubisco所催化的反应的气体加成步骤的潜力的具体变异残基,并将它们命名为"候选残基"。这允许了对系统发育分支或亚分支/亚种之间的保守变化的忽略,所述系统发育分支或亚分支/亚种可能呈现中性系统发育漂移或可能具有在诸如所述RubiscoLSU的稳定性、折叠或组装中的分支特异性生理学作用。许多变异残基可能不对Rubisco的改善性质作出贡献且因此可能不是对本实例中的增加的C02特异性的进化方案的一部分,而是沉默突变或与诸如细胞内蛋白的折叠和组装或稳定性的其它酶性质相关的突变。为了鉴定很可能是对所述改进性质即本实例中提高的C02特异性的进化方案的一部分的变异残基,采用了从QM计算中所获的机理认识来从多个变异残基中选择候选残基。该过程基于能影响目标残基的功能性的变异残基形成了进化方案的一部分的假设,所述目标残基通过计算化学步骤鉴定为参与Rubisco的气体加成步骤中。这是用于从所述变异残基中选择以获得本文所称"候选残基"的子集的主要标准。一般而言,所述选择过程基于对所述变异残基与所述目标残基的空间临近性的评估以及对所述变异残基影响所述目标残基的静电和方向的能力的估计和排序。选择可以使用诸如AccelrysDiscoveryStudiov2.0(AccelrysSoftwareInc.,SanDiego,CA,2007)的分子模拟利用和可视化程序包来对晶体学结构进行可视化筛选,尽管也可使用其它类似模拟包。在用于选择的残基的初始扫描中可以使用标准的分子间相互作用的化学概念,诸如电荷-电荷静电配对、典型范德华距离和氢键距离及氨基酸侧链的空间填充模型。所述过程也可系统化,例如通过将各个变异残基的所有原子与原子的静电和疏水相互作用与在3A5A距离内的所有其它氨基酸残基映射并且排除在第一和第二蛋白序列中等价的那些相互作用。主链-主链相互作用。如果例如在一个蛋白序列中的疏水相互作用涉及变异残基的侧链的a或p脂肪族碳和非变异残基的一个原子,且在第二蛋白序列中所述氨基酸变异残基尽管不同于所述另一蛋白序列中的变异残基,但仍在侧链中含有与第一蛋白序列中的相同非变异残基相互作用的a或(3脂肪族碳,则该相互作用也被认为是等价的。如果仅特定曱基参与与非变异残基的相互作用,则认为诸如缬氨酸、亮氨酸和异亮氨酸中的氨基酸侧链中的曱基相互作用是等价的。如果对应氢键距离相似,则认为由天冬氨酸和谷氨酸残基的羧酸根基团形成的氬键也是等价的。在第一和第二蛋白序列之间以相互作用模式筛选变异残基后,仅保留了具有通过改变的相互作用模式来影响所鉴定的目标残基的潜力的那些变异残基。变异残基影响目标残基的潜力由变异残基与所述目标残基或与与目标残基相邻的氨基酸残基或与在包含所述目标残基的二级结构单元中的氨基酸残基的相互作用来确定。即使是环、转角或无特定结构的链的一部分,但与包含所述目标残基的二级结构单元相连的变异残基具有通过经改变的相互作用来协助所述二级结构单元重新定位而改变目标残基的方向的潜力。选出的具有一个或多个改变的相互作用和影响目标残基的潜力的变异残基构成了"候选残基"组。鉴定为能够影响区域1中的目标残基即ASN123、Glu60和TYR20的20个候选残基可由图7中比对的反转阴影所识别,且在图13中以图显示。它们也列在表2中。(ii)(b)替代候选戎基和趋异候选戎基(ACR和DVR)的鉴定选择候选残基的上述方案依赖于一个选择标准,该选择标准是所述候选残基存在于显示了改进的或期望的性质的第二蛋白的共有序列中,而不同于不显示所述改进的或期望的性质的多个第一蛋白共有序列中的对应残基,且其中所述第一蛋白的共有序列共享相同的残基。因此,使用Rubisco中的C02特异性的实例,候选残基将为存在于红藻共有序列中的残基,且所述残基与开花植物和蓝细菌的共有序列中相同的残基不同。其它部分进化方案也可在变异残基库中发现的残基中表达。这些残基被命名为替代候选残基和趋异候选残基。自然中发现的这些部分方案可用于扩展选择候选突变体的过程,以便产生用来影响目标残基的替代性或补充性残基的扩展库。例如,当所选的第二蛋白的残基并不是第二蛋白的共有序列中发现的主要残基而是在多个第二蛋白中以较低频率发现,尽管它仍然与多个第一蛋白的共有序列中存在的残基不同,其中所述第一蛋白的共有序列共享相同残基,则所述残基命名为替代候选残基(ACR)。ACR代表了在候选残基位置上的共享残基的替代选择。对于候选残基,ACR必须仍然满足有关于影响相关目标残基的选择标准。引入ACR的目的可能是提供嫁接用残基,所述残基疑为与比所述第二蛋白的共有序列的主要残基更大的对期望性质的改进有关。因此,使用Rubisco中的C02特异性的实例,所述替代候选残基将为由对红藻共有序列有贡献的至少一种红藻表达的残基,该残基不是所述共有序列内含有的主要残基且与绿色植物和蓝细菌的共有序列的相同残基不同。与其它红藻种类相比,红藻种Gn讲f/m'amowofo具有更高的催化速率且保持了红藻典型的高特异性(Whitney等,2001),因此Gn^^s/awowoto序列可用作ACR源。图14中显示了在G.wo"ofc和红藻共有序列和典型(参照)红藻种类Ga/J&n';^W/to之间的RubiscoN端域序列的变化。这显示出在残基36、51、54、88和104处的ACR。注意残基36还是DCR。共变异残基(CvR)可在来自特殊种类的第二蛋白序列中作为在替代候选残基(ACR)的附近且显示出与该ACR互补变化的残基而被鉴定。不存在于第二蛋白的共有序列中的CvR位置处的该变化疑为会反映所述ACR和CvR的结构和/或静电性质的互补变化。这些互补变化可构成部分进化方案。对CvR的鉴定提供了鉴定可在第一蛋白中突变以更好的适应移植ACR造成的变化的辅助残基位置的方法。然而还可以在变异残基库中发现的残基中表达另一个部分进化方案,在所述变异残基库中检验了来自至少三个系统发育分支的残基,且其中据预测选中残基会影响至少一个目标残基且该选中残基发现于来自一个分支的第二蛋白的共有序列中而不同于在至少两个其它分支的共有序列中存在的残基,并且其中在相同的位置第一蛋白的共有序列也不同。这样的残基命名为趋异候选残基(DCR)。对于候选残基,DCR必须仍然满足与影响相关目标残基有关的选择标准。引入DCR的目的可能是提供嫁接用残基,所述嫁接用残基疑为与所述改进的或期望的性质有关,但还可以期望的是,在取代到来自所述至少两个系统发育分支的不同第一(宿主)蛋白中时,该残基会产生比如果用候选残基取代所可期望的更大的所表达的性质的变化。因此,使用Rubisco中的C02特异性的实例,趋异候选残基可为在红藻共有序列中表达的残基,但该残基不同于在开花植物的共有序列中和在蓝细菌的共有序列中表达的残基,而同时开花植物和蓝细菌共有序列的残基在该位置也不同。鉴定为能影响区域1中的目标残基(ASN123、Glu60和TYR20)的六个趋异候选残基在图7的比对中可由灰色阴影识别,且在图13中以图显示。表2显示了在这六个位置上开花植物和蓝细菌间的残基变化。表2.在当前20个候选残基(包括来自伴侣LSU的C端域的三个)和6个趋异候选残基位点处的蓝细菌、开花植物和红藻的残基组成表(以百分比表示)。使用的序列数在括号内显示。DCR在表的底部(36、<table>tableseeoriginaldocumentpage52</column></row><table><table>tableseeoriginaldocumentpage53</column></row><table>f对于残基86,仅对蓝细菌和开花植物显示了超过5%出现率的那些替代残基。如表2中所示,大多CR在所述3组(蓝细菌、开花植物、红藻)的一组以上中具有替代残基,尽管大多数情况下所述共享残基以>70%频率出现。例外的是59、64、81、114、118和121以及相邻LSU的C端域片段(亚区1B)中的所有三个CR(271、297和300)。然而,由于各组的序列组并非系统发育学平衡的,该变化的量级极不显著。此外,该变化仅应当作与CR定义的一致程度的大致指示。最强突变体#4区IB的最强突变体,突变体#8(V121I/M297G/V300T)(参见实施例7)也没有显示任何所述3个CR的变化。(iii)候选残基、替代候选残基和趋异候选残基在候选突变体中的聚集超过一个候选残基(CR)、替代候选残基(ACR)和趋异候选残基(DCR)或它们的组合可以有助于第一和第二蛋白的序列之间的单一连续相互作用区域中的变化。例如,单个非变异氨基酸残基可以与两个CR、两个ACR、两个DCR或/人这些组中的两组中书t生的两个残基的组合相互作用,从而两个改变的相互作用都可影响相同的目标残基。所述两个CR、两个ACR、两个DCR或组合就可以聚集到单个候选突变体中。相似地,给定CR、ACR或DCR可能有助于超过一个影响目标残基的连续相互作用区域内的变化。因此,可能有其它CR和/或ACR和/或DCR可以与给定CR、ACR或DCR聚集以形成其它候选突变体。这些聚集的CR、ACR、DCR或其组合可以对拟定候选突变体酶作出贡献,在所述候选突变体酶中每个聚集的CR、ACR、DCR或其組合被"嫁接"到宿主上,替代了第一(宿主)蛋白的序列中的对应残基。(iv)合并候选突变体以产生累计效应如果来自两个以上的候选突变体(一个以上的CR和/或ACR和/或DCR的组)的残基突变影响了包含目标残基的相同二级结构单元,且期望每个这些候选突变体的突变在改变相互作用中以协同方式起作用,则可以进一步合并所述候选突变体以形成单个复合候选突变体。例如,如果目标残基是螺旋的一部分,其中一个候选突变体与所述螺旋的N端末端相互作用而另一候选突变体与所述螺旋的C端末端相互作用,且两个相互作用都涉及加入从第一蛋白序列到第二蛋白序列的疏水相互作用,则可预测带有在所述第一蛋白内嫁接了两个所述候选突变体的复合候选突变体会在重新定位所述螺旋中显示出协同效应。(v)突变体排序尽管考虑用作突变的残基数的大量减少,所述残基受针对目标残基的变异残基的初始选择影响以产生候选残基(CR)和可选的替代候选残基(ACR)和趋异候选残基(DCR)的列表,可由聚集CR、ACR和DCR产生的预测的候选突变体的数目仍可能很大。因此,有用的是对所述候选突变体基于其显示对期望功能性质的增强的预测潜力来排序。排序较高的候选突变体就可作为进一步计算和实验评估的第一选择,从而将人力和成本最小化。如流程图2所示,在排序中可以考虑几个原则(a)受所述候选突变体影响的目标残基。不同目标残基在反应步骤中有不同的参与程度,因此有不同相对重要性。例如,一个目标残基可以直接参与质子转移,而另一个目标残基可能仅是被动氢键供体/受体。对于在反应步骤中有更大参与度的目标残基,据预测相关候选突变体的突变影响更大,因此相应候选突变体排序更高。(b)所述CR和/或ACR和/或DCR在所述候选突变体中的相互作用程度。如果与候选突变体的突变相关的相互作用中的预测变化涉及强静电或疏水相互作用的形成或消除,则排序将更高。(c)伴随候选突变体的突变的相互作用变化的数目。即4吏所述突变仅涉及弱相互作用的添加或去除,总的变化可能涉及目标残基蛋白环境内的许多这样的相互作用,在结构和静电学上引起大的净累计效应,并因此在功能性质上产生显著效应。因此,这类突变可排序较高。(vi)扩展系统发育,预测扩展系统发育嫁接预测可用于开发所述系统发育嫁接方法通过对来自上述对目的蛋白的候选突变体的预测和测试的核心方法的应用周期的结果(成功结果和失败结果)的解读而"从经验中学习"的能力。尽管上述核心方法集中在识别候选残基、替代候选残基和趋异候选残基并基于这些残基的相互作用网络把它们聚集在候选突变体内,实施例3中详细说明的对Rubisco的初始结果显示出一部分这些候选突变体对Rubisco功能无效或甚至轻微有害,尽管并不严重。扩展系统发育嫁接策略允许重新解读成功和失败的累积认识并嵌入对具体蛋白应用进一步定制的方法中,且该方法可以随着额外结果的获得而继续改进。所述扩展系统发育嫁接技术和上述核心方法的相互作用如流程图13中所示。所述扩展系统发育嫁接策略有三个主要组成部分。首先,改进候选残基和/或替代候选残基和/或趋异候选残基的相互作用网络的概念作为聚集到候选突变体内的核心方法的基础。对Rubisco的区域1突变体的初始成功和失败结果的检验,具体而言对聚球藻突变体弁6a及其成员突变体#4和弁la(在实施例3和4中进一步讨论)的比较,表明了改进的预测框架将涉及认识到含有改善Rubisco的部分进化方案的对进化适应的"热点",且对这些"可突变亚区"的鉴定提供了鉴定候选残基、替代候选残基和趋异候选残基的更好的或补充性基础,而不是如所述核心方法中仅仅使用区域内的相互作用网络,其中所述候选残基、替代候选残基和趋异候选残基应该优选地聚集以形成候选突变体从而操控Rubisco的功能性质。因此,在所述扩展方法中,研究的焦点更集中在鉴定空间区域上而不是鉴定残基的相互作用网络上。第二,在该框架内重新解读Rubisco的区域1突变体的初始结果允许了对称作亚区的空间连续体积的蛋白结构的鉴定,所述亚区含有所述区域的CR(包括初始鉴定的ACR和DCR)的子集且据预测会优选地影响与所述区域相连的特定目标残基或多个目标残基的性质。对所述区域的CR、ACR和DCR的这些子集的鉴定提供了可以将它们聚集以形成候选突变体的方法。第三,对不精确和重叠边界的亚区的鉴定为鉴定额外CR、ACR、CvR和DCR提供了基础,所述额外CR、ACR、CvR和DCR据预测会与CR、ACR和DCR的核心子集相互作用且可补充到所述核心子集中以提供聚集到候选突变体内的额外残基。此外,对作为天然序列变化的热点的亚区的鉴定提供了鉴定和利用诸如物种特异性变异残基(SsVR)的其它类型的序列多样性数据的方法,所述物种特异性变异残基在近缘物种之间变化且可呈现诸如对特定环境诸如炎热/干燥或寒冷/湿润的适应的部分进化方案。使用Rubisco为例,图14显示了两种红藻种类和五种开花植物种类之间的天然序列变化。例如,RubiscoLSU的区域1的三个亚区被鉴定为可突变热点,且标为区域1A、1B和1C,如图15和17中所示。如实施例4中所详细说明,本发明人已使用所述扩展方法来将额外残基补充到区域1的突变用优选残基组和形成额外候选突变体,所述候选突变体被预测为对由所述核心方法的应用产生的最"领先"突变体的改善,详见实施例3。总之,所述扩展系统发育嫁接方法的开发提供了改善"领先"突变体的功能性质的方法。对作为进化热点和作为建立从预测测试映射到实验数据的蛋白序列数据库的框架的亚区的概念的发展还将所述系统发育嫁接技术定位来更好的利用序列多样性数据。例如,可针对序列多样性数据质询上述数据以鉴定可作为物种特异性变异残基(SsVR)补充而可能包括进候选突变体中的残基。例如对于Rubisco,序列数据和某些情况下的动力学数据可用于在不同的或非典型环境下生长的光合生物,包括用于相关C3植物种类诸如发现于巴利阿里群岛的对干旱和温度有不同耐受性的C3植物(Galmes等,2005)、适应干旱的南部非洲Marama豆(Parry等,2007)和喜好极端条件的Cyanidiales红藻(Ciniglia等,2004)。对于Rubisco替代性的是,如果当这样的序列多样性和其它功能数据可用于诸如小麦的作物植物时(Evans&Austin,1986),上述数天然物种。产生蛋白具有来自第二蛋白的至少一个候选残基和/或替代残基和/或趋异候选残基的且可选地包括CvR和/或SsVR的其它取代的蛋白可以由计算机模拟,或通过例如编码所述蛋白的多核苷酸的定点突变在体外和/或在体内工程化,然后在表达系统内表达。筛选突变蛋白其后,筛选候选突变蛋白以鉴定具有所述改进的功能性质的那些候选突变蛋白,所述候选突变蛋白包含目标残基与一个以上候选残基和/或替代候选残基和/或趋异候选残基的组合,且可选地包括共变异残基(CvR)和/或物种特异性变异残基(SsVR)的其它取代。所述候选突变蛋白的筛选过程可使用任何一种以上的若干技术且可包括催化评估、生化评估和生理学评估。定向进化本发明的蛋白可通过定向进化修饰。于是,由本发明的方法产生的蛋白的功能可能被改进或变更。一般而言,定向进化可能涉及对一种以上亲代分子模板进行诱变处理并在后代分子中鉴定任何期望的分子。然后可以通过评估例如所述分子的活性、所述分子的稳定性和/或所述分子内的突变频率来筛选有所期望性质的后代分子。然后可以选出带所期望性质的后代分子并进行更多轮的诱变和筛选。进行定向进化的方法在本领域内众所周知。示例性方法除其他以外包括美国申请序列第10/022,249号中所述的理论定向进化方法;和美国公布申请第US-2004-0132977-A1号。对于定向进化中所设计的实验方法学和技术的一般i兌明,可参考Sambrook等,MolecularCloning,ALaboratoryManual2nded.,ColdSpringHarborLaboratoryPress,1989。在本发明的一个实施方式中,由本发明的方法产生的突变蛋白可用作定向进化的"起始点"。以Rubisco蛋白为例,可以选"l奪已发现具有改进的酶活性的候选突变蛋白并通过定向进化进一步优化。该优化可以帮助例如对由SvR和可鉴定为与所述候选突变蛋白中的突变互补的其它天然存在的变异残基的补充引起的空间位阻的緩解。因此具有改进的酶活性的候选突变蛋白可以充当定向进化的新型起始点,因为它们具有与野生型Rubisco相比不同的探索序列空间的潜力。适于Rubisco的定向进化的系统包括但不限于近期报道的采用大肠杆菌菌株MMI的系统(Mueller-Cajar等,2007)。Rubisco蛋白根据本发明产生的蛋白包括功能性等价物、变异体、活性片段和融合蛋白。为避免疑问,下列物质包含在本发明的范围内所述活性片段和融合蛋白的功能性等价物;所述功能性等价物和融合蛋白的活性片段;以及包含功能性等价物或活性片段的融合蛋白。术语"片段"指编码成分或是全长蛋白的成分的核酸或多肽序列。在多肽方面,所述片段拥有与所述全长蛋白共同的定性的生物活性。根据本发明使用的生物活性片段通常可拥有至少约50°/。的相应全长蛋白的活性,更通常为至少约60%的该活性,更通常为至少约70%的该活性,更通常为至少约80%的该活性,更通常为至少约90%的该活性,且更通常为至少约95%的该活性。测量蛋白序列标识的方法在本领域内众所周知,且本领域内的技术人员可以理解的是,在本背景下,序列标识在氨基酸标识的基础上计算(有时称作"硬同源性")。在对其所述序列后计算序列标识。本发明人4吏用了BioEditSequenceAlignmentEditor(Hall,1999)内所提供的ClustalW程序(Thompson等,1994)来对其所述序列。有几种可用的进行序列比对且有效地产生相同结果的免费使用的和专有软件。变异残基的鉴定还可通过使用例如BLAST搜索来从在选用于改进的动力学性质上不同的一个或多个系统发育组收集Rubisco序列,并使用例如CLUSTALW将它们对所述第一序列比对来进行。本发明的功能性等价物、活性片段和融合蛋白保留了所述蛋白(对聚球藻PCC7942为SEQIDNO:23,而对烟草为SEQIDNO:72)作为带有改进的效率的Rubisco酶的能力。然而,本领域技术人员能设计评估酶活性的分析或方法。因此,根据本发明的功能性等价蛋白意图包括突变体(诸如含有氨基酸取代、插入或删除的突变体)。这些突变体可包括其中一个以上的氨基酸残基被保守性或非保守性氨基酸残基取代的蛋白,且所述取代的氨基酸残基可以是或可以不是由遗传密码编码的残基。特别优选的是其中若干即30-50、2030、15~20、10~15、510、15、1~3、1~2或仅1个氨基酸以任何组合被取代、删除或添加的蛋白。"突变"蛋白还包括其中一个以上的氨基酸残基包含取代基的蛋白。这些片段可为"独立式",即不是其它氨基酸或蛋白的部分或与之融合,或它们可包含在较大蛋白内而形成该蛋白的一部分或区域。当包含在较大蛋白内时,在一个实施方式中的本发明的片段形成了单一连续区域。此外,在单个较大蛋白内可以包含若干片段。在本发明的一个实施方式中,提供了包含与多肽或其它蛋白融合的诸如标记的蛋白的融合蛋白,所述标记可为例如生物活性、放射性、酶或荧光的,或为抗体。例如,通常有利的是包括了可能含有分泌序列或前导序列、前序列、纯化中的协助序列或例如在重组物生成过程中带来更高蛋白稳定性的序列的一个以上的额外氨基酸序列。替代性地或附加性地,可以将成熟蛋白与另一化合物诸如增加所述蛋白的半衰期的化合物(例如,聚乙二醇)融合。酶功能在另一实施方式中,根据本发明产生的蛋白是酶。当所述蛋白是酶时,所述功能可为对至少一个化学反应的催化。在其它实施方式中,所述功能可为结构性的(例如充当细胞骨架蛋白)。所述功能可能涉及在细胞内或细胞内部和细胞外部之间、或细胞内不同隔室之间、或生物的不同区域之间的物质的主动和被动转运,例如其中蛋白参与通道或膜孔、或蛋白参与将材料运送到特定细胞隔室或蛋白充当分子伴侣或转运子。所述功能可能与配体/受体相互作用有关,例如其中蛋白是生长因子、细胞因子、神经递质或者细胞内或细胞外配体,或蛋白是所述生长因子、细胞因子、神经递质或者细胞内或细胞外配体的受体。当所述蛋白为酶时,该酶可参与分解代谢或新陈代谢。所述酶可参与至少一种产物的合成。所述酶可参与至少一种底物的降解。所述酶可参与至少一种底物的化学修饰,例如在分子内添加或删除一个或多个》粦睃基。所述酶可能适用于例如杀虫剂和洗涤剂残留物的降解、矿物提取或"大量"或精细化学工艺,诸如淀粉酶。所述酶也可适用于医学应用中,且具体可使用于将对生物和物理化学稳定性的变化最小化。所述酶可能具有特别设计的性质,例如在期望的温度范围内理想工作的能力,更窄、更宽或改变的底物特异性,或防止有毒或可能有毒的副产物的产生和/或释放的能力。可以将所述酶重新设计从而使得它是对野生型酶的次要反应有效的催化剂,该酶使用其天然底物或替代性底物以产生不同产物。Rubisco蛋白的纯化本发明提供了纯化根据本发明方法生成的Rubisco蛋白的方法。来自真核生物的Rubisco(I型Rubisco)的功能化形式的全酶是由8个大亚基(LSU)和8个小亚基(SSU)构成的十六聚体,且需要合适的分子伴侣来正确折叠和正确组装该酶。大肠杆菌是最广泛使用的表达重组DNA和蛋白的微生物宿主。当来自聚球藻PCC7942的Rubisco基因(rbcLS和rbcSS)的操纵子编码在大肠杆菌中表达时,两种亚基都得到充足地合成,然而当功能化Rubisco的量累积到大肠杆菌可溶蛋白的约1°/0~3°/。(重量/重量)时仅约1%~5°/。的受表达LSU正确地折叠并组装为功能化形式。为了克服这些困难,可以使用近来改编的系统(Baker等,2005,本文通过参考引用其全部内容)来纯化天然或突变Rubisco蛋白。这时,上述系统用于在大肠杆菌中表达的聚球藻PCC7942Rubisco的纯化。所述纯化方法的第一步涉及在第一载体内将H6标记的泛素(Ub)序列(H6Ub)的编码序列融合到rbcSS基因的5,端。然后将宿主与所述第一载体和编码所述Rubisco蛋白的天然(或突变)大亚基和小亚基的第二载体共转化,接着诱导所述Rubisco蛋白和载体的表达,产生了所有三种Rubisco亚基多肽(即,LSU、SSU和H6UbSSU)。一些多肽组装为由8xLSU的八聚体核心以及不同比例的SSU(最多8个)和H6UbSSU构成的功能性Rubisco十六聚体。基于与所述Rubisco小亚基融合的He标记的表达来纯化所述Rubisco蛋白。可以例如使用诸如金属亲和色谱的色谱技术来进行所述纯化。然后使用例如Ub特异性蛋白酶将所述Ub片段/人所述Rubisco除去。现在将参考具体实施例对本发明进行说明,但不应将这些实施例理解为以任何方式对本发明的范围的限制。实施例实施例1目标残基的鉴定——计算化学使用从头算QM计算在扩展的活性位点片段复合体上的完整Rubisco羧化机理和互补氧合机理的计算研究提供了本策略的基础。该片读复合体模型包含了已经确立或有争论在Rubisco活性位点处催化的反应系列中具有关键作用的大多数活性位点氨基酸残基片段。该模型包含所有的直接与Mg"配位或与底物的反应中心相互作用的残基。所述片段复合体从PDB码8ruc的晶体结构(激活的Rubisco与MgS和2-羧基阿拉伯糖醇-l,5-二磷酸(2CABP)的复合体的晶体结构)的坐标建立。最初,从所述晶体学坐标建立了Rubisco与2-羧基-3-酮基阿拉伯糖醇-l,5-二磷酸(2C3KABP)的片段复合体模型,所述2C3KABP是2CABP的结构模拟物和在Rubisco羧化酶作用过程中的实际反应中间体。如图2中所示,名为FM20的77原子片段模型包含了代表LYS175、LYS177、ASP203、GLU204、KCX201(氨曱酰化LYS201)、HIS294和LYS334氨基酸残基及底物RuBP的烯二醇形式的4碳片段再加上水分子和二氧化碳分子的分子片段种类。使用量子化学包Gaussian03(Frisch等,2004)优化了所述结构。通过修饰该优化的几何构型产生了在羧化酶反应途径中所有其它反应物种的猜想几何构型,然后仍然使用所述Gaussian03包获得了它们的能量最优化结构。一般而言,对各个物种考虑了通过例如氢键模式或原子方向而不同的几种可能结构。然后检验了这些基团在所述催化酶和氧合酶反应的气体加成和后继步骤中的作用,导致了更有把握的预测,具体而言,对直接参与所述气体加成(C02或02)步骤的基团和所述两个步骤的相对能量学的确定的预测。所述分析完全集中在所述大亚基上(LSU)。尽管包括绿色植物、藻类和蓝细菌的大多数Rubisco是由8个大亚基(LSU;约475个残基)和8个小亚基(SSU;约140个残基)构成的复杂多聚体(十六聚体)蛋白,然而活性位点化学仅通过LSU二聚体构成的蛋白区域进行,在所述十六聚体蛋白中有8个这样的二聚体活性位点。一个LSU的C端(TIM桶)域的一部分包含了大多数活性位点残基,同时相邻LSU的N端域的较小区域使该活性位点完整。然而,更普遍地从生物信息学研究中得出的预测表明其它区域可能参与对所述化学的调控,例如,亚区间接触(LSU-LSU或LSU-SSU)。图1显示了基于所述QM计算提出的羧化酶反应机理的示意图。曲线箭头指示了象征导致后续反应物种的键形成和键断裂事件的电子流动。该示意图确定了氨基酸残基在每个反应步骤且具体为所述气体加成步骤(羧化)中的参与。预测为在所述气体加成步骤中有作用的残基包含前文所定义的目标残基组。图3和4分别提供了所述羧化酶反应物种的几何构型和相对能量。下文将对所提出反应机理的最重要的特征进行讨论。首先本发明人已惊人地发现了在羧化过程中C02没有将H20[Mg]从镁配位中替代。所述水分子实际上协助C02结合到活性位点并有助于羧化产物和对应TS的稳定性。同一水分子在其后步骤中充当水化的水。此前该水化角色被指派到在配位范围的附近发现的水分子。本发明人还惊人地发现02原子在烯二醇式中间体中保持未质子化,尽管从普通化学原理的期望是它需要脱质子化以便将羧化专门地导向C2而不是C3。ESP衍生的原子电荷显示03比02更带负电。然而,该意外结果可由对LYS175和质子化KCX201与02之间的强氢键:的观察发现所解释,该强氬键有效防止了02将羧化导向C3。此外,由于LYS334与所述酶中的Pl磷酸基氢键结合,如果发生C3羧化则会破坏LYS334与底物C02的相互作用,从而不给对应TS和中间体的稳定留下机会。本发明人所阐明的反应机理的其它特征如下。KCX201仅在初始烯醇化反应中起直接作用且它在烯醇化后保持在质子化状态中。KCX201和LYS175在通过部分中和02上的负电荷而阻碍C3羧化中起作用。HIS294在Rubisco的多步催化中有重要作用。它在Ne和03之间来回传送质子,从而适当的调节C3-03键长。GLU204通过抽取Mg配位的7jc化用水分子的质子而激活该水分子。因此,羧化和水化都在所述烯二醇式中间体的同一面上进行。H3质子仅在酸式酸中间体(VII)形成后最终转移到02。所述酸式酸中间体上的电荷由LYS175和LYS334所稳定。LYS175保证了所述C2碳的立体特异性质子化以产生最终产物。LYS334与LYS175共享其质子。在上述发现的基础上,本发明人对每个反应步骤鉴定出了两个氨基酸残基,一个作为酸而另一个作为碱。对于所述气体加成步骤,HIS294通过从03夺取质子而作为石咸,而LYS334是提供质子以稳定由C02加成形成的羧酸根的酸。在这两个关键残基或结构上或化学上(通过静电相互作用)与它们相连的任何其它残基的立体环境或电子环境中的变动将影响所述酶的特异性并且还可能影响&at。残基TYR20、GLU60、ASN123也被鉴定为对气体分子在加成前相对于底物的正确定位和对气体加成物和对应过渡态结构的稳定性是至关重要的。这五个残基构成进一步检验的初始目标残基组。实施例2鉴定含特异性决定戎基的变异戎基的系统发育分析收集来自可用门类的光合生物的RubiscoLSU序列来通过使用菠菜RubiscoLSU序列作为查询序列执行蛋白BLAST搜索(Altschul等,1997)/人而由NCBI(www.ncbi.nlm.nih.gov)和JGI(http:〃img.igi.doe.gov/cgi-bin/pub/main.cgi)的爿>共可用H据库进4亍系统发育分析。由于所述LSU序列如此出众,且与多数蛋白同系物类相比在如此宽广的进化距离上相对高的保留,这些LSU序列易于鉴定且其它免费使用或专有搜索软件也会同样有效。<吏用BioEditSequenceAlignmentEditor(Hall,1999)内的ClustalW软件(Thompson爭,1994)进行了对从属于覆盖红藻、蓝细菌、灰藻和植物(IO门)的十三个不同门类的光合生物中提取的RubiscoLSU序列的比对以评估其多样性。一个比对显示于图5中;在其中有超过一个来自同门的序列的情况下,为了效率使用了50%共有序列。使用在http:〃coot.embl.de/Alignment〃consensus.html的服务器获得所述共有序列。可以出于同样的目的使用任何其它专有或免费使用的比对工具,因为事实上这些Rubisco的总体保留度如此之高以至会有效地获得相同的比对结果。图5显示了来自相去甚远的系统发育的RubiscoLSU序列可以多么多样化。因此,尽管在该多样性中嵌入了用于改变Rubisco以适应特定环境的部分进化方案的信息,却无法直接分析该信息以鉴定对诸如增加的特异性的具体改变起作用的残基。为解决这个问题,本发明人开发了基于假设的系统发育嫁接方法并将它应用来鉴定已经表现出对增强的特异性(Sc,o)的天然部分进化方案的Rubisco残基。众所周知,不同的光合生物特征性地表现出不同Sc/0值。大多数陆生植物拥有典型Sc,o值80,而已知红藻具有最高的特异性因子(约160)。蓝细菌的特异性因子具有约40的中等值。由于蓝细菌是陆生植物和红藻的共同祖先,且陆生植物与红藻相比更早地在进化中从蓝细菌分化出去(http:〃www.geocities.com/we—evolve/Plants/chloroplast.html),嵌入纟工藻中的氨基酸残基变化中的用于增强的特异性的部分进化方案可通过比较来自这三组的RubiscoLSU序列而部分地揭示。图6显示了此前在图5中显示的来自红藻、蓝细菌和开花(绿色)植物的RubiscoLSU的50%共有序列的比对,但现在显示来用灰色阴影突出与蓝细菌和开花植物中共有的残基不同的红藻中的134个残基,即变异残基。普遍认同的是单一残基变化不会造成Rubisco特异性的显著改善(否则进化将能够相当容易地探索序列空间以优化给定生物中的特异性),即使鉴定所述特异性决定残基的这134个残基的已缩减的序列空间是无法想象的巨大,仍需要对例如2~10个残基的多重突变的数目进行测试以便探索。为使用该变异残基列表,过滤掉了与目的酶性质(即特异性)无关的变异。实施例3使用核心系统发育嫁接方法的候选残基的鉴定、聚集和排序;sjt候选突变体的预测为了鉴定导致红藻Rubisco的增加的特异性的特异性决定残基,本发明人使用了来自实施例1中所述QM计算的酶机理认识来开发选择实施例2中鉴定的134个变异残基的子集的方法。针对实施例1中鉴定的在所述气体加成步骤中有功能性作用的目标残基对实施例2中鉴定的变异残基进行选择,以便鉴定候选残基。若干所选候选残基也是替代候选残基。此外,还选出了若干趋异候选残基。这使用了基于修性和动力学效率的一般原则的方法。因此,认为具有在电子上或结构上影响所述目标残基的潜力并因此造成所述酶的功能性质的变化的任何变异残基都是优化所述性质的部分进化方案的一部分,所述酶功能性质在该情形下为特异性和动力学效率。将所述选择方法应用于鉴定这样的候选残基、替代候选残基和趋异候选残基。使用来自菠菜(PDB码8ruc)和Ga/cfen'a/a^to(PDB码1BWV)的Rubisco晶体结构,通过可视化分析和用AccelrysDiscoveryStudiovl.5.1(AccelrysSoftwareInc.,SanDiego,CA,2005)对残基内相互作用中差异的比较来进行选择。因为可用结构的分辨率相对于菠菜Rubisco结构更高,因此使用了菠菜Rubisco而非来自聚球藻PCC6301(PDB码1RB1)的晶体结构。然而,本发明人在分析所述残基内相互作用时说明了菠菜LSU与聚球藻PCC6301LSU之间的残基变化,且还使用所述聚球藻结构作为参考。五个目标残基中的三个,TYR20、GLU60和ASN123在RubiscoLSU的N端域内,而HIS294和LYS334在形成所述TIM桶结构(图8)的C端域内。为了将能形成部分进化方案的残基子集的CR、ACR和DCR组分类,将所述目标残基划分为属于三个不同区域。残基TYR20、GLU60和ASN123共同地与(302加成后形成的中间体的羧酸根相互作用(图8、9和15)。含有这三个残基的二级结构单元还与所述N端域的其它螺旋和折叠缠绕(图8、9和15)。如图15中可见,ASN123、GLU60和TYR20与所述N端域的三个不同二级结构区相连且它们的侧链以三分式构象延伸进入活性位点内。因此,将这三个目标残基划分为区域1残基。HIS294位于所述TIM桶的一部分的(34折叠中;围绕HIS294的区域定义为区域2。尽管LYS334在HIS294和区域1残基的附近,它在所述LSU的"环6"(图8)内且在所述LSU的开放形式中它与其它目标残基分开;因此,含有LYS334的区域划分为区域3。通过对区域1内变异残基的考虑来说明初始分析和候选突变体设计。由于RubiscoLSU的N端域是紧密的域(图9和15),蛋白结构的考虑表明在大部分所述域中的氨基酸残基变化能影响所述目标残基TYR20、GLU60和ASN123。通过映射两个晶体结构中的LSU中的每个变异残基与所有其它残基之间的所有静电和疏水相互作用来开始所述选择过程。忽略在两个晶体结构中具有等价相互作用的变异残基。所述等价相互作用主要包括涉及变异残基的主链原子的相互作用,和大多在螺旋内或两个P链之间发生的相互作用。如果在菠菜(或聚球藻PCC6301)和Ga/^eWa中的变异残基仅在侧链长度上不同,而且相互作用的原子化学类型相同且在两个晶体结构中在大致相同的距离内,则也认为该相互作用是等价的。类似地,如果缬氨酸、亮氨酸和异亮氨酸的侧链仅有一个曱基参与相互作用且相互作用距离在两个晶体结构之间没有明显差异,则认为所述涉及缬氨酸、亮氨酸和异亮氨酸的相互作用是等价的。该过程从作为可能候选残基(或趋异候选残基)的进一步考虑中除去了某些变异残基。然后分析了与相互作用有关的剩余变异残基的影响目标残基的潜力。将其侧链与目标残基的主链或侧链相互作用的变异残基,或其侧链与属于包含所述目标残基的二级结构单元的残基相互作用的变异残基认为是候选残基(或趋异候选残基)。例如,目标残基GLU60在螺旋aB的C端末端,而在该螺旋的N端末端的变异残基ILE51与在Ga/Ww/aLSU中的另一变异残基TRP"相互作用(参见图14和表2),但该相互作用在菠菜和聚球藻PCC6301LSU中不存在。据预测将这些变异残基从Ga/tfen'a;^W/to"嫁接"到聚球藻PCC6301内会影响螺旋aB的方向并因此影响GLU60。因此,认为这两个变异残基51和25都是候选残基。这些残基在所述LSU结构中的位置显示于图9中。在该情况下,有用的是将共享连续的相互作用区域的这两个候选残基聚集到单一突变中,因为有可能它们会形成部分进化方案的协同部分。在表3中将这个最筒单的聚集体编号为候选突变体弁la。如此聚集的候选残基代表了将来自GaW/en'apa^to序列的残基替代(嫁接)到聚球藻PCC6301序列上的突变,其用意在于将更高特异性的特征转移到聚球藻PCC6301Rubisco中。在嫁接前,可将候选残基组进一步合并为能进一步在协调和放大在给定目标残基或多个目标残基上的微扰效应中起作用的组。如果不同的两组候选残基影响相同的二级结构单元,则这样的扩展聚集有用。例如,两个<吳选残基组{25,51}和{54,84,87}通过两种不同相互作用都影响包含GLU60的螺旋(xB。因此,预测的突变体之一包含了这些合并组(表3中显示为突变体弁7a)。对可能的嫁接候选突变体进一步评估以检查通过将残基从/a^to"嫁接"到聚球藻PCC6301而引入的新的不利的空间相互作用。这样的不受欢迎的空间相互作用可通过对所述候选突变体添加空间性补充突变来矫正,或可由MD模拟来研究以评估緩解这种不良接触的结构弛豫是否在能量上可实现。所述候选突变体预测过程中的最终步骤是对可能的嫁接突变体排序以开发用于优化实验测试或详细的计算计算机模拟预篩选的排序列表。该排序反映了对个体候选突变体中的合并突变在本实施例中在朝着对特异性改进的方向来改变所述功能性质所期望的期望程度,所述对特异性的改进通过影响C02和02的气体加成步骤的化学过程和相对化学过程进行。排序取决于若干参数,诸如受所述候选残基组影响的目标残基、所述目标残基区域内的所述候选残基组的改变的相互作用的强度,和对各个候选残基组这种相互作用的数目。除了来自GaW/eWapaW/to的Rubisco序列,在所述分析中还考虑了另一纟工藻种类Gnj^f/w/a附o"o/"的序歹'J,已^口GWj^^/w/amo"o/h具有比pw故"更好的A:ec。f。对于选中的初始候选残基组合,两个残基(51和54)显示出在G.pa^to和G.mo朋fc之间的差异,即它们是替代候选残基。形成了带有在位置51和54处的两个残基变异体的候选突变体,如表3中所示CM的弁1、#5、#6、#7和#13。例如,从区域1目标残基的初始分析中预测了表3中所示十六个候选残基组的组合,形成了21个可能的候选突变体(带G.par故a和G.mo"ofc变异体)。对于各个候选突变体,表3中的末栏详细说明了与所述突变有关的预测结构变化。对于某些候选突变体,这些变化以图来图示性解释;该表的第二栏给出了这些CM的图号。表3还显示了实验测试的优先级的排序。表3显示出由于对相关性候选突变体(#9和#10)总结的原因,在该初始分析中选出了两个趋异候选残基(36、116和140;参见表2)。这些DCR中的两个(36和140)还显示出在G.paW/to和G.wowofc之间的差异(参见表2);对于候选突变体#9和#10,36的Gm变异体和140的Gp变异体^^皮判定为最有希望移植到聚球藻中。表3.从围绕目标残基TYR20、GLU60和ASN123的RubiscoLSUN端域内的区域1的分析中预测和排序的候选突变体。上标Gp和Gm分另'J表示来自Ga/cfer/a/ar故a和GW,^S7'"mo"ofc的歹戋基。编号图a突变体排序受影响区域lalb9,109,10Y25W/D51IGpY25W/D51VGm3在aB的C端末端和PA之间加入新的疏水相互作用。|3A在序列中靠近Y20。在aB的C端末端和pA之间加入新的疏水相互作用。(3A在序列中接近Y20。2-A59G/G64A6交换突变体。在aB与将aB连接到(3C的长链之间的相互作用。交换的曱基在空间上接近Y20且与E60相邻。3-P49D/D51I10改变将aB连接到|3B的短环内的相互作用。49,10T23G/K81R4卩A与|3C之间的相互作用被破坏。影响Y20的定位。5310G54AGp/C84A/I87V5在aB与(3C之间引入强疏水相互作用。5b10G54SGm/C84A/I87V5在aB与pC之间引入强疏水相互作用。6a6b99T23G/Y25W/D51IGp/K81RT23G/Y25W/D51VGm/K81R11突变体釘a在|3A和aB之间加入疏水相互作用,而突变体#4破坏PA与(3C的相互作用。这两组突变一起可能在Y20上有较大的影响。突变体弁lb在|3A和aB之间加入疏水相互作用,而突变体#4破坏卩A与(3C的相互作用。这两组突变一起可能在Y20上有较大的影响。7a7b7c7d10101010Y25W/D51IGp/G54AGp/C84A/I87VY25W/D51IGp/G54SGm/C84A/I87VY25W/D51VGm/G54AGp/C84A/I87VY25W/D51V0"1/G54SGm/C84A/I87V2222突变体存la和弁5a在E60上的累积效应。突变体弁la和存5b在E60上的累积效应。突变体弁lb和存5a在E60上的累积效应。突变体針b和弁5b在E60上的累积效应。811V121I緒97G/7两个LSU之间的疏水相互作用被破V300T坏(残基297和300来自含有所考虑的活性位点的Mg复合体的相邻LSU)。影响N123。911L36IGm/I116L/F140L0158形成了涉及两个相邻p链((3B和|3E)和aC的末端的大疏水作用区。能改变N123的方向/定^f立。1011L36IUm/I116L/V121I/F140LGp/M297G/V300T3能一起作用在aC上且在N123上具有累积效应。11T114A/T118A/T271V/V121I2在伴倡LSU中的114及118与271的极性相互作用被^C坏。271与121形成新的疏水相互作用。影响N123。1217K18I/T23GT23和K18的侧链之间的极性相互作用被破坏。影响Y20。13a9,10Y25W/D51lGP/插入A216(la+A21)A21的插入将K21从残基51移开并与151形成新的疏水相互作用。1417KLTYY-(21-25)國AKMGYW4与Y20相邻的螺旋形状被改变,影响Y20的方向。涉及插入(M);参见图6。K18I/KLTYY-(21-25)-AKMGYW/K81R紧邻Y20的螺旋形状的改变与其与1517118(失去极性相互作用)及81(长度变化)的相互作用的改变有关,且可能在Y20上有协同效应。可能的残基18和68之间的能将N端尾部与所余区域相结合的相互作A15S/K18I/T68V/用;保留的残基69与伴侣LSU的MO71y407相互作用;在红藻中S15能与伴4吕LSU的408和409的主链羰基形成强氢4建。目标为Y20。实施例4使用扩展系统发育嫁接方法的候选残基的鉴定、聚集和排序及候选突变体的预测如上所述且如流程图1和3所示,扩展系统嫁接方法提供了将功能"图"知识有效利用到突变中的方法,所述方法从候选突变体的预测和测试的所述核心方法的多轮应用中所获经^r得到发展。在本实施例中参考预测的区域1候选突变体(实施例3)的初始结果来对该扩展方法的使用进行说明,所述区域1候选突变体在表5中给出并在实施例7中更详细的讨论。所述扩展方法首先用于解读所述核心方法结果。这导致了对聚集已鉴定出的CR、ACR和DCR的新模型的鉴定(参见表3中CM),该鉴定基于作为可突变热点的亚区而不是如所述核心方法中那样集中在相互作用网络上。三个亚区(1A、1B和1C)显示出据预测会优选地影响与区域l相连的三个目标残基之一的性质的性质亚区1A对TYR20、1B对ASN123而1C对GLU60。在图15中图示性地显示了所述三个TR与区域1的所述亚区的"锚定"。在图17中图示性地显示了在替代性方向的所述亚区。所述亚区完全限制在所述N端域,除了相邻LSU的C端域片段形成了亚区1B的一部分。对所述亚区的鉴定为使用前文所述的使用所述核心方法鉴定CR和DVR的直观检查和其它分析来鉴定额外CR和DCR提供了基础,可将所述额外CR和DCR优选地与已通过所述核心方法鉴定出的CR和DCR聚集以形成新的候选突变体(参见表4)。如此鉴定的额外CR和DCR分别为位置19、68、88和104,以及86、117和138。替代性的是,对所述亚区的鉴定为将由所述核心方法已鉴定出的CR和DCR优选重新组合以形成新的候选突变体。下面参考的实施例说明了所述扩展方法的使用以及补充特定额外CR和DCR的基础,所述实施例用于由所述核心方法预测并已初始测试的突变体的活性的改进(表5)。新预测的CM显示在表4中。表4.使用改进最有希望的初始预测的候选突变体(表3)的扩展系统发育嫁接方法预测的候选突变体。另外列出的是这些最有希望的初始预测的候选突变体的单<table>tableseeoriginaldocumentpage70</column></row><table><table>tableseeoriginaldocumentpage71</column></row><table>下文第一个实施例集中在来自第一轮测试的最佳突变体,突变体#4(T23G/K81R)上,还集中在亚区1A上。如表3所示,突变体#4及突变体糾a(Y25W/D51lGP)是突变体弁6a(T23G/Y25W/D51lGP/K81R)的组成部分。然而,尽管突变体#63显示出增加的特异性(8.5%,参见表5),它没有显示出效率的改善,且总体上比显示出增加的特异性(10°/。)和效率(8%)的突变体#4差。对突变体玑a的结果的参考表明它是仅有3.4%的增加的特异性而效率上没有变化的相对较差的突变体。因此,推断出将突变体糾的突变与突变体弁la的突变聚集是无效的,因为总效果不是累积性改善而是两个突变组明显不利地相互干扰。由于亚区1A含有突变体#4中的突变的残基位置,推论出将突变体#4突变与亚区1A中的其它CR和/或DCR的突变结合可能为改进该"领先"突变体的性质提供更好的策略。验,尤其是对在亚区1A中已鉴定出的CR和DCR的物种特异性共变异数据的分析,鉴定了可能影响TRTYR20或残基81(突变体#4的成分)的三个额外CR,19、68和104。因此,据预测下面的新CM是在突变体#4上的可能改善,所述CM中显示了指示的相互作用的变化。关于突变体弁17-1A(#4+K18I/T68V),据预测K18I和T68V突变会在N端尾部与阳和螺旋B之间区域之间造成改变的相互作用。将这与突变体#4中的突变(T23G和K81R)结合可期望在TRTYR20上有增加的影响。关于突变体弁18-1A(#4+P104EGp(DGm)),期望CR104(也是ACR)的突变,即P104EGp或P104D^会造成与残基81的主链N的新的相互作用。期望的是合并的CM#18-1A中的三个突变会在TRTYR20上有增加的影响。关于突变体弁19-1A(存4+D19P),在蓝细菌和植物中残基19与残基21(K或R)形成了盐桥,在红藻中不存在该残基21而其中残基19为P。期望的是突变D19P会影响TRTYR20进入活性位点的范围,且这与突变体#4突变联合将产生在TRTYR20上增加的影响。这些预测图示性显示于图15和图17中。下文第二实施例涉及对主要的新突变区域(亚区1B)的鉴定,该鉴定反过来导致了对突变体弁20-lB(VI16L/L117T/V121I/I138M/F140L)的初始预测。该突变体有由所述核心方法(表3)鉴定的突变体#8(V121I/M297G/V300T)作为组成部分。如表5中所示,突变体#8的初始测试显示出特异性的改进(5,6%),这为进一步表征提供了基础。在所述亚区1B的鉴定之后,对残基121(与TRN123相邻的CR;参见图16A)附近的残基变化的检查导致了螺旋C和P折叠E之间的相互作用网络的发现。该网络更清楚地可见于图16B中。在该相互作用网络中的变化能影响TRN123的方向。所述相互作用涉及残基116、117、120、121、124、133、135、138和140。其中,残基121是CR,而残基120、124、133和135在所有主要的生物组中被保留(参见图5)。残基116、117、138和140是DCR,即在三个主要生物组,红藻、蓝细菌和开花植物当中不同(表2)。观察到在该空间区域中相互作用的CR和DCR(即21,及116、117、138和140)中的变化似乎在主要生物组中是补偿性的。因此,随着对这些变化在N123的方向上的影响的初始测试,预测了突变体弁20-lB(VI16L/L117T/V121I/I138M/F140L)(表4)。实施例5突变Rubisco的生成及其筛选基于表3和4中排序的预测候选突变体,通过将所述红藻特异性残基以多组多重突变方式突变到聚球藻PCC7942的区域1内来进行原理证明研究。开始,通过用QuickChange多重诱变试剂盒(Stmtagene)使用适当引物对所聚球藻PCC7942AcLS基因突变来对实施例3中详细说明且列于表3中的14个预测LSU突变体(突变体弁la、#lb、#4、#5a、#5b、#6a、#7a、#7b、#7d、#8、#9、#10、#12和#14,其中"a,,和"b,,分别指其中移植的是G.的CR或G.wowofc的ACR)进行工程化。此外,将作为预测突变体的成分的带有单一突变(弁22-lA、#23-lA、#25、#26-18)或双重突变(#24)的几个突变体工程化作为对照。"野生型"聚球藻PCC7942的AcL-AcS序列(操纵子)的基因组序列如SEQIDNo.22所示。该序列与聚球藻PCC6301的序列相同。在天然基因组序列中,AcLS编码序列读取ATGCCC(编码Met然后编码Pro),但在所有克隆的r6cLS序列中所读取为ATGGCC(编码Met然后编码Ala)。对用于所述基因的克隆的唯一限制位点(A^coI)的密码引入了该核苦酸取代。为克隆目的还引入了在所述AcSS序列中的倒数第二个密码子(Arg)中的沉默突变(CGA到CGC)。所述野生型大亚基的翻译后序列如SEQIDNo.24中所示而野生型小亚基的翻i奪后序列如SEQIDNo.23中所示。突变体的核苷酸和蛋白序列在表5中由SEQIDNO显示,例如对于突变体弁la分别为SEQIDNO:25和26。在对这些初始结果的考虑和所述扩展系统发育嫁接方法的开发后,通过相同方法将实施例4中详细说明且列于表4中的额外四个预测LSU突变体(突变体弁17-1A、#18-1A、#19-1A、弁21-1A,B)工程化。所有上述对照突变体(弁22-lA、#23-lA、#24、#25、弁26-lB)是这四个突变体的成分,且具体而言与突变体糾和^21-1A,B有关联。这些突变体的核苷酸和蛋白序列在表5中由SEQIDNO显示,例如对于突变体存17-1A分别为SEQIDNO:53和54。在将突变后AcLS基因克隆回对突变的LSU和天然SSU编码的第二表达质粒内前对其测序。使用实施例6中所述方法表达和纯化了突变Rubisco。在十八个聚球藻PCC7942突变体和五个对照突变体上的这些初始实验显示了活性(即正确折叠和组装的十六聚)突变Rubisco在大肠杆菌内的良好表达,所述突变Rubisco带有相当于或好于野生型的特异性和动力学常数。在流程图1中显示了实施例611中详细说明的实验测试和优化过程与预测和在计算机模拟筛选步骤中的整合方式。流程图1还显示了实验结果如何能反馈到所述预测过程中以改进突变蛋白的预测,继以额外的计算机模拟筛选和实验筛选和对所述功能性质的改进的评估,以便优化该预测过程。实施例6突变Rubisco的表达和纯4匕尽管大肠杆菌是最广泛使用的表达重组DNA和蛋白的微生物宿主,但从真核生物获得Rubisco的功能形式(本文定义为"I型"蛋白)更加复杂。由于I型Rubisco的全酶是8个大亚基(LSU)和8个小亚基(SSU)构成的十六聚体,它需要适当的分子伴侣以正确折叠并正确组装所述酶。然而,方便的是,当编码来自聚球藻PCC7942的Rubisco基因(AcLS和r&SS)的操纵子在大肠杆菌内表达时,LSU和SSU亚基都得到充分地合成。因此,此处使用聚球藻PCC7942作为Rubisco预测的初始测试的模型LsS8酶,且大肠杆菌用作产生所述突变Rubisco的表达宿主的自然选择。然而,当功能化Rubisco的量累积到大肠杆菌可溶蛋白的约1%~3%(重量/重量)时仅约1%5%的受表达LSU正确地折叠并组装为功能化形式。通过传统方法对所述功能化Rubisco的纯化是可能花费长达3天的费时费力的过程。使用6x组胺酸(H6)亲和标记是能对酶纯化节省大量人力和时间的有吸引力的替代方法。但实验已经显示H6标记与I型Rubisco的LSU或SSU的任意端的融合能损害催化活性。为克服这些困难,使用了近期改编的系统(Baker等,2005,本文通过参考引用其全部内容)来简化和加速大肠杆菌内表达的聚球藻PCC7942Rubisco的纯化。该系统涉及独特(基于pACYC的)质粒载体的构建,该质粒载体在框架内加入了融合到r6cSS5'端的H6标记的泛素(Ub)序歹寸(H6Ub)。质粒pTrcSynLS(含有所述PCC7942AcL-AcS操纵子;Emlyn-Jones等,2006)中的野生型AcLS被突变的AcLSOkiS"替代,然后与编码H6Ub标记的野生型SSU(H6Ub-SSU)的基于pACYC的质粒一起共转化到大肠杆菌内。当用IPTG诱导Rubisco亚基表达时,产生了所有三种Rubisco亚基多肽(即LSU、SSU和H6UbSSU)。某些多肽被组装为由8xLSU八聚体核心及不同比例的SSU(最多8个)和H6UbSSU构成的功能性Rubisco十六聚体。可使用固定金属亲和色谱(IMAC)轻易地将带一个以上H6标记的Rubisco从其它大肠杆菌蛋白中纯化,然后用H6Ub特异性蛋白酶切割所述HgUb序列,切下的H6Ub序列与未组装的H6Ub多肽一起可由IMAC除去。使用这个方法,在约1小时内从大肠杆菌中分离了纯化的Rubisco。使用如上方法表达并纯化了在实施例5中说明并在表3或4中鉴定的十八个突变Rubisco和五个对照突变体以及野生型。实施例7突变Rubisco的体外动力学分析使用实施例6中所述方法纯化的Rubisco蛋白来测量对C02的Michaelis常数(^)和底物饱和的羧化速率(7/""),所述测量^f艮据Andrews(1988)中所述方法使用了在25°C、pH8的14C02固定分析,本文通过参考引用该方法的全部内容。纯化酶在含20mMMgCl2和25mMNaHC03的緩沖液中在25°C预培养30min,然后在氮气喷雾隔板封口的闪烁管内进行&测量。通过在0.5mLN2平衡的分析緩冲液(100mMEPPS-NaOH,20mMMgCl2,0.8mM核酮糖-P2,0.1mg/mL碳酸酐酶)中加入10(xL纯化酶来引发反应,所述緩冲液含有不同浓度的NaH14C03。通过将数据带入Michaelis-Menten方程确定Michaelis常数。使用Ruuska等(1998)和Whitney&Andrews(2001)所述的[2-"C]羧基阿拉伯糖-P2("2CABP)结合分析测量了在所述分析中对Rubisco含量的定量。通过将外推最大羧化酶活性(^^)除以所述分析中Rubisco活性位点的浓度来计算了底物饱和的羧化周转率(U。纯化Rubisco制备物还用于测定在pH8.3的如Kane等(1994)所述的C(V02特异性(Sc/。)。表5中显示了所得结果的总结。对于特异性,平均结果以与野生型相比的变化%给出正值表示改进。对于动力学,给出了数值和与野生型相比的变化%;正的对于催化速率F加和催化效率^^/&的变化%表示改进,而负的对Michaelis常数&的变化%表示改进。表5.聚球藻PCC7942突变Rubisco的特异性和动力学结果。"SEQID"栏中的数字对应于在计算机生成的序列列表上的序列,n.m.表示在提交时没有测量。<table>tableseeoriginaldocumentpage75</column></row><table><table>tableseeoriginaldocumentpage76</column></row><table>a,b-指在不同日期在不同Rubisco样品上完成的平行测定。c-在给出时,指明突变在亚区1A、IA,B或IB中。d-在不同日期在不同Rubisco样品上完成的平行测定的平均。e-与序列文件中对应的序列ID号。在进行了特异性测定的十八个突变体和两个单一(对照)突变体中,都显示出与野生型相当的特异性,即没有突变体显著受损,而五个突变体和两个对照体显示出5%或更好的改善。有趣的是,这些中的四个包含了T23G和/或K81R突变。此外,有趣的是带ACR变异体(对位置51为弁la和糾b,对位置54为弁5a和弁5b,而对位置51和54是弁7a、#7b和#7*的突变体显示出显著差异(对突变体#5和#7变异体为8%级别),所述差异表现出特异性对在空间上相对远离所述活性位点(参见图10)的这些变化的灵敏性。突变体#8中5.6%的Sc,。值改善是值得注意的,因为突变在与由所述核心方法预测的大多数初始突变体组不同的N端域部分(参见图15)。在分析了F^的9个突变体中,大多数显示出与野生型相比轻微至明显更低(即更差)的值,例外的是显示出8%显著改进的突变体#4。分析了^的对应9个突变体显示出一系列值,其中4个显示出适当改进的C02结合(糾a、#5a、#5b、#6a),2个显示出几乎没有变化(#4、#7a)而2个显示出(:02结合的削弱(#10、#14)。类似地,总体催化效率值(&。/iQ显示出与野生型相比时的一系列从'J、到大的改善(#4、#5a、#5b),到几乎没有变化(糾a、#6a、弁7a)到明显变差(#10、#12)。可注意到的是在烟草中(参见实施例11),突变体弁23-lA显示出明显更差的f加值以及总体催化效率,然而突变体#4显示出在所有三个动力学量度中显著的改进。从由所述核心方法预测的初始突变体组(#1#14)的结果中,根据总体表现的突出突变体是突变体糾和弁6a,它们分别显示出在特异性和动力学效率上10%和8%,及8.5%和0%的改善。包含#4和玑a中的突变的更复杂突变体^6a)的性质总体上差于突变体#4(当前列表上的最佳突变体)。该观察表明其它突变可能与突变体#4的突变比与变体弁la的突变聚集更有利。如实施例4中所讨论,该观察鼓励了亚区概念和所述扩展方法的发展,这产生了首批预测的突变体"7-lA、#18-1A和#19-1A,以及还包含来自亚区IB的CR的更复杂的突变体(弁21-1A,B)。这些扩展方法的预测的特异性结果与野生型相比显示出几乎没有变化。实施例8聚球藻突变体在大肠杆菌中的定向进化系统发育嫁接突变体代表了一种对未在自然中采样的序列空间区域的探索的"定向"策略。然而,这些突变体的活性的任何增加可能因某些"序列配合差"的区域而受到削弱,因为不能将它们对宿主Rubisco结果优化。尽管扩展系统发育嫁接方法提供了可用于优化"领先"突变体的理论计算机模拟策略,包括緩解由可鉴定为与所述"领先"突变体中的突变互补的SvR和其它天然存在的变异残基的补充引起的空间矛盾,然而最小化这些矛盾的影响的替代性选择可以是使用实验定向进化方法来优化它们,即用这些部分优化的Rubisco作为起始点。这些突变体还自身提供了定向进化的新型起始点,因为它们具有与野生型相比不同的探索序列空间的潜力。如实施例6中所详细说明,不像所有其它来自真核生物的I型Rubisco(即十六聚体),来自聚球藻PCC7942的Rubisco能在大肠杆菌内正确组装并以被选作突变体筛选过程。使用实施例57中所述方法,可最初在大肠杆菌内筛选候选突变体预测(可包含关联突变组,和在围绕目标残基的不同结构区域内的独立突变组)以确认它们有活性并获得用于互相比较和与野生型比较的体外动力学常数。使用当前技术能常规产生带多达10~12个突变的突变体。如实施例57中所详细说明,可制成选中的单一突变体来测试作为所述系统发育4家接方法的一般性假设,所述假设为单一突变体容易为低活性/无活性,且至少两个关联突变对产生可接受的活性酶是必须的。近来报道了适用于大肠杆菌内Rubisco定向进化的系统(Mueller-Cajar等,2007)。它使用了工程化大肠杆菌菌抹MM1,当该MM1菌抹与磷酸核酮糖激酶(PRK)共表达时可以使得其生长依赖于Rubisco的功能性表达。通过删除甘油醛-3-磷酸脱氪酶基因(空隙A)阻断了MM1中的糖酵解,并引入了包含聚球藻PRK和深红红螺菌Rubisco的代谢分流旁路。结果,MM1依赖于功能性Rubisco表达来代谢对大肠杆菌是毒性的PRK催化产物,核酮糖-l,5-二磷酸。可使用该普遍方法来评估是否能从实施例7和表5中详细说明的最有希望的聚球藻PCC7942嫁接突变体的失活形式开始更有效地进化出带显著增强活性的Rubisco。为此,可以将这些失活基因的随机诱变库(使用Mueller-Cajar等,2007所报道的方法制成)转化到在不同选择性条件下(例如,改变生长C(V02压力,改变PRK产生程度)生长的MM1细胞内。可以分离出表达了具有改进的适应性(即在筛选中存活的那些)进化的Rubisco变异体的菌落,并对其进行测序,然后表征了如实施例7中详细说明的纯化突变Rubisco的动力学。实施例9聚球藻突变体生化和生理能力的体内测试实施例7中的体外功能性测试鉴定了具有改进的Rubisco活性的若干聚球藻突变体,所述聚球藻突变体在从所述大肠杆菌表达系统表达并如实施例6中所述纯化时还必要地并因此正确地折叠和组装。在所述Rubisco再造策略中,使用了聚球藻作为最方便的鉴定"领先"候选人的突变体预测的实验测试的初始宿主。由于在模型植物烟草中使用质体转化来工程化突变Rubisco中的近期发展,如实施例10中所述,在本文所述工作中,没有进行流程图1中所示中间步骤而直接在所述测试开花植物(烟草)中测试了被鉴定为有希望的聚球藻突变体的候选突变体(#4),所述中间步骤为确认能让该聚球藻突变体适应回到其天然宿主(聚球藻)内而不损害其表现型。该改良方法允许了在79周内对烟草中突变Rubisco的组装和动力学的评估,这比获得和生长蓝细菌转化体所需时间要快。当突变体发展的最终目的是将改进的Rubisco工程化到植物中时,将优选该策略。然而,如果最终目的是将改进的Rubisco工程化到蓝细菌中,则优选的是在聚球藻中进行生理测试步骤以评估催化有利的突变是否会引入不相容问题,所述不相容问题会扰乱通过蓝细菌分子伴侣复合体或诸如那些参与羧化体形成的其它相互作用蛋白的生产性折叠-组装。对在聚球藻内进行这些测试的方法说明如下。在聚球藻PCC7942中,Rubisco基因(AcLS和AcSS)由染色体(其中每个细胞通常有5个染色体拷贝)上的单个操纵子编码,且与大肠杆菌类似的是,该蓝细菌植抹是天然有能力的且能通过由同源性重组对其染色体的耙向修饰(例如基因删除、基因取代)或通过在其细胞内质粒穿梭载体的稳定保留来遗传转化。已经开发了聚球藻PCC7942突变植林(例如参见Emlyn-Jones等,2006和Price等,1993)。可以使用其中删除了染色体AcLS-AcSS操纵子的聚球藻PCC7942突变植林(即7942AAcLS植林)来帮助重新引入突变RubiscoAcLS-AcSS基因。由于聚球藻PCC7942不能异养生长(即在外部碳来源上生长)且需要Rubisco来生长,可通过如下步骤来生成7942AAcLS植株(1)在聚球藻PCC7942内引入质粒穿梭载体上的第二Rubisco基因(例如编码来自细菌深红红螺菌或天然L8S8PCC7942Rubisco的结构性不同的II型Rubisco同二聚体(L2)的AcM)然后(2)在抗生素抵抗的基因kmR中同源性重组以替代各个染色体拷贝中的AcLS-AcSS操纵子(即从而可使突变完全分离)。其后可将与在穿梭载体上表达的AcM—起转化的聚球藻PCC7942细胞与另一质粒一起转化以用kmR基因同源性地替代所述染色体AcLS-AcSS编码区。在完全分离的7942AAcLS::kmR转化体分离后(即所有染色体的AcLS-AcSS由kmR替代),可以使用PCC7942AAcLS细胞来同源性地重新引入突变的AcLS^口AcSS基因及所述穿梭载体处理的细胞。使用成熟技术(例如参见Emlyn-Jones等,2006),可以对所述转化细胞的表现型进行生化和生理综合表征,所述生化表征例如评估所述突变RubiscoLSU亚基是否容易折叠并正确组装,所述生理表征例如评估在光合作用能力、无机碳分配或生长速率上是否有差异。实施例10烟草中Rubisco质体系转化体的生成可应用于高级植物Rubisco的Rubisco再造策略是通过使用突变的AcLS*基因的质体系转化。烟草的质体系可容易地转化(Andrews&Whitney,2003)且用作进行对其它植物的转化的原理证明测试的模型。最有希望的聚球藻Rubisco突变体糾用作初始测试案例。也对成分单一突变体T23G(突变体弁22-1A)和K81R(突变体弁23-1A)进行了测试。在表6中给出了烟草突变体#4和弁23-lA的核苷酸和蛋白SEQIDNO。突变体弁22-lA的SEQIDNO是77和78。由于这些残基是候选残基(参见表2),这些相同突变如同在聚球藻中一样用于烟草中。可利用的是转质烟草系,该烟草系允许了对突变烟草Rubisco动力学的迅速筛选而非传统的冗长的叶绿体转化方法,在该传统方法中使用Svab&Maliga(1993)中所述微粒轰击转化技术用突变型取代了质体系中的天然AcL基因(Andrews&Whitney,2003(supra))。在对将突变或外来的AcL基因转化回所述烟草质体系内的方法的近期改善中,用来自深红红螺菌的AcM基因和aadA选择性标记基因(对大观霉素抵抗性编码)替代了天然AcL基因,然后除去所述加dA基因以产生无标记(Aa^/A)的烟草-深红红螺菌转质系。这些林系通过用质粒p^trLA(基因库登录号AY827488)微粒轰击转化野生型烟草(普通烟草L.cvPetitHavana[7V,7V])的质体系而生成。转化体内的aadA基因与通过CRE-lox重组来启动其切割的34-bp/oxiM立点侧面相接。为切除aadA,用CRE转化系的叶(Corneille等,2001)。将轰击后的叶切碎(约0.5cm、并在卡那霉素选择性培养基(含3%(重量/体积)蔗糖、15|ig/mL卡那霉素和激素的琼脂固化Mumshige-Skoog盐(Svab&Maliga,1993》中培植。将从漂白的轰击后的叶切片中出现的首批小植^M争移到MS培养基(没有卡那霉素和激素的选择性培养基)中并通过常规PCR分析确认了fladA的丢失。所述Aa^/A烟草-深红红螺菌系允许了重新使用所述aadA标记基因来随后转化其质体系,诸如重新转化回突变的烟草Acl^变异体中以替代AcM。在所述AaadA烟草-深红红螺菌中用变异Acl^基因替代AcM的转化效率比转化野生型烟草高出3~10倍,且它免疫于在将Acl^转化到野生型烟草质体系中时可能发生的不需要的重组事件。在68周内随着含有所述AcM基因的质体系拷贝被快速除去,所述方法允许了仅含Acl^转化的质体系拷贝的转化体(即非同源相似性转化体)的产生。由于深红红螺菌Rubisco是小的LSU同二聚体(L2,100kDa),可通过如Whitney&Sharwood(2007)中所述由非变性聚丙烯酰胺凝胶电泳和由L2Rubisco的缺失测得的非同源相似性来分离可溶性叶蛋白而鉴定产生较大的I型L8S8Rubisco(520kDa)的^丄*转化系。该系统可能可改造用于其中质体转化已得到报道的其它植物。已经报道了在多种不同植物中的质体的遗传转化,例如Koop等(1997)中,本文通过参考引用其全部内容。使用QuickChange多重诱变试剂盒(Stratagene)用适当引物对野生型烟草(普通烟草)质体系AcL编码序列进行了突变体#4、#22-lA和弁23-lA的突变,且将所述突变引入到转化质粒pLEVl的烟草质体系中,在该质粒中通过在AcL下游加入无启动子a"t/A基因来帮助对转化体的选择(Whitney等,1999)。将编码诱变后的^cL承拷贝的所述pLEVl衍生转化质粒与编码突变体#4、弁22-lA和弁23-lA以及野生型的核脊酸序列^t粒轰击转化到Aa^/A烟草-深红红螺菌系中,且如(Svab&Maliga,1993)所述选择了抗大观霉素的小植抹。对突变体弁22-lA没有分离出小植林。通过使用非变性聚丙烯酰胺凝胶电泳的L8S8Rubisco的产生来鉴定其中用^cl^或AcL基因替代了AcM的转化体(参见图20)。实施例11烟草Rubisco转化体的生化和生理学表征使用如下方法来提取并纯化在非同源相似性转质体烟草细胞和野生型烟草细胞中表达的Rubisco以进行动力学分析。使用放射性标记14co2固定分析用可溶性叶蛋白提取物来测量底物饱和的周转率(V,和在0%02(K)或21%02(iC",时的C02Michaelis常数。在光周期过程中取得叶片(1cm亏并4吏用玻璃均4b器(Wheaton,USA)在水上提取到0.8mL无C02提取緩冲液中(50mMN-二羟乙基甘氨酸-NaOH,pH8.0,1mMEDTA,2mMDTT,1%(体积/体积)植物蛋白酶抑制剂混合液(Sigma-Aldrich)和1%(重量/体积)PVPP)。离心所述样品(36,000g,5min,4°C),将可溶性蛋白与NaHC03和MgCl2(各为15mM)培养(激活)15min并以与40"2-CABP培养的双份等分试样用于测量Rubisco含量,且通过凝胶过滤回收了Rubisco结合的"2-CABP的量(Ruuska爭,1998),或使用培养(激活)后的所述可溶性蛋白来用14C02固定分析测量在25°C、pH8.0时的《c和iC""(Andrews1988;Whitney&Sharwood,2007)。为确认所用样品是非同源相似性的(即仅含有带Acl^基因的质体系而无带AcM的质体系),还在非变性聚丙烯酰胺凝胶上分离了所述蛋白(图20)。对于野生型对照,仅在突变体糾和弁23-lA转化体中表达了突变的L8S8Rubisco而没有表达L2Rubisco。通过在隔板封口的闪烁管内加入激活的可溶性蛋白提取物来启动所述动力学分析,所述闪烁管含有N2(对iQ或无C02的空气(对7C",平tf的含090jiM14C02的分析緩沖液(100mMN-二羟乙基甘氨酸-NaOH,15mMMgCl2,0.6mM核酮糖-P2,0.1mg/mL石友酸酐酶)。核酮糖-P2根据(Kane等,1998)合成。1min后用0.5体积的25%(体积/体积)曱酸终止所述分析,在80。C干燥反应并将残留物溶于水中,加入两体积的闪烁剂并涡旋,然后通过闪烁技术来测定"C。T^和iC^从羧化速率对[C02]的Michaelis-Menten图中计算。^"的测定使用含15mMNaH"C03的可比性14C02固定分析并将所述底物饱和的羧化速率K"""除以由"2-CABP结合测得的Rubisco活性位点浓度来计算(见上)。使用纯化的Rubisco来完成了特异性测定。如上所述提取了可溶性叶蛋白并用0.2mL经过用特异性緩沖液(30mM三乙醇胺,pH8.3,30mM醋酸镁)平衡的Superdex200HR10/30柱使用AKTA探测系统(APBiotech)进行色谱分析。将含LgS8Rubisco的三个峰组分(0.3ml)汇集并用于测量C02/02特异性,所述测量如(Kane等,1994)所述在25°C在与使用三个W6sthoff精密气体混合泵控制的在02中含500ppmC02的空气平衡后进行。所得结果的总结显示在表6和7中。对于特异性,平均结果以与野生型相比的变化%给出正值表示改进。对于动力学,给出了数值和与野生型相比的变化。/。;正的对于催化速率^加和催化效率^y《c的变化%表示改进,而负的对Michaelis常数&的变化%表示改进。表6.在空气(0221。/。)中对烟草突变Rubisco测定的特异性和动力<table>tableseeoriginaldocumentpage83</column></row><table>a_对应于序列列表中的序列ID号;第一数字是核苷酸SEQIDNO而第二数字是蛋白SEQIDNO。表6中的空气(21%02)中测定结果显示了突变体糾对野生型在&。,和&^值中分别为7%和-13%的改进,产生了21%的催化效率的总体改进。然而,尽管单一突变体^23-lA显示出在;C中的相似改进(-14%),它具有显著削弱的速率(-31%)从而产生了20%的催化效率的总体降低。使用从两种(野生型、#23-1八)或三种(#4)不同转化体提取的可溶性叶蛋白获得了动力学结果(三份分析)。平行的孤立Rubsico给出相似结果,这促成了测定的较小误差。对两个突变体的特异性结果与野生型相比显示出几乎没有变化。这些值从使用来自两个野生型、两个突变体#4和两个突变体#23-1入转化体的纯化Rubisco的四份测量获得。将所述特异性结果和动力学结果一起考虑表明了突变体#4在羧化效率上的改进与在氧合效率上的相当的改进相匹配。作为对氧合效率的变化是否可由F^或K。的变化造成的初始测试,测量了0%02下的〖c。表7中给出的这些结果显示出两个突变体都具有比野生型更差的^值,对突变体#4和弁23-lA分别高出18%和9%。这表明突变体的《。值好于野生型,即它们更少受02抑制。在末栏显示的〖。的大概值才艮据Whitney等(1999)计算。由于这些《。测定仅基于在两个02浓度(即在氮气中0%和21%(体积/体积))的^测定,它们仅应认作估计值。然而,假设它们是可靠的,则可推断出所述突变体的必须得到改进以解释由所述特异性结果表明的氧合效率的改进。表7.在0°/。02中测定的烟草突变Rubisco的特异性和动力学结果<table>tableseeoriginaldocumentpage84</column></row><table>总之,所述结果显示了突变体#4在烟草中保留了其优越性质,尽管它们更多表现在催化效率的改进上而不是如聚球藻突变体#4的情形中大致平均的特异性和效率的改进上。非同源相似性转质系和野生型烟草对照可在可控环境生长室或玻璃房中在土壤中生长至成熟,然后进行标准生理学测试。这些测试仅对显示出在特异性和/或动力学上对野生型的改进的最有希望的突变Rubisco完成,且包括使用成熟方法学对光合作用能力、生长速率和叶生物化学的确定,包括Rubisco表达水平、代谢物、碳和氮水平(Whitney等,1999;Whitney&Andrews,2001;Whitney等,2001)。参考文献AltschulSF,MaddenTL,SchafferAA,ZhangJ,ZhangZ,MillerW,LipmanDJ.(1997)GappedBLASTandPSI-BLAST:anewgenerationofproteindatabasesearchprograms.iVwc/e/d/^25,3389-3402.AndrewsTJ.(1988)Catalysisbycyanobacterialribulosebisphosphatecarboxylaselargesubunitsinthecompleteabsenceofsmallsubunits.CT^w.263,12213-12220.AndrewsTJ,WhitneySM.(2003)Manipulatingribulosebisphosphatecarboxylase/oxygenaseinthechloroplastsofhigherplants.Jrc/z.S/c^/zjks*.414,159-169.BakerRT,CatanzaritiAM,KarunasekaraY,SobolevaTA,SharwoodR,WhitneyS,BoardPG.(2005)Usingdeubiquitylatingenzymesasresearchtools.她z^o(iy五"2^附o/.398,540-554.CaseDA,DardenTA,CheathamIII,TE,SimmerlingCL,WangJ,DukeRE,LuoR,MerzKM,PearlmanDA,CrowleyM,WalkerRC,ZhangW,WangB,HayikS,RoitbergA,SeabraG,WongKF,PaesaniF,WuX,BrozellS,TsuiV,GohlkeH,YangL,TanC,MonganJ,HomakV,CuiG,BerozaP,MathewsDH,SchafineisterC,RossWS,KollmanPA.(2006)9,UniversityofCalifornia,SanFrancisco.CinigliaC,YoonHS,PollioA,PintoG,BhattacharyaD.(2004)HiddenbiodiversityoftheextremophilicCyanidialesredalgae.她/.13,1827-1838.ComeilleS,LutzK,SvabZ,MaligaP.(2001)EfficienteliminationofselectablemarkergenesfromtheplastidgenomebytheCRE-loxsite-specificrecombinationsystem.尸/耐J,27,171-178.CumminsPL.(1996)MolecularOrbitalProgramsforSimulations(MOPS),AustralianNationalUniversity,Canberra.CumminsPL,GreadyJE.(1997)Acoupledsemiempiricalmolecularorbitalandmolecularmechanicalmodel(QM/MM)fororganicmoleculesinaqueoussolution./Compwf.C/z亂18,1496-1512.CumminsPL,GreadyJE.(1998)Amoleculardynamicsandfreeenergyperturbation(MD/FEP)studyofthehydride-iontransferstepindihydrofolatereductaseusingacombinedquantumandmolecularmechanical(QM/MM)model.Co附pw/.19,977-988.CumminsPL,GreadyJE.(1999)Coupledsemiempiricalquantummechanicsandmolecularmechanicsmodel(QM/MM)calculationsontheaqueoussolvationenergiesofionisedmolecules.JC0附/7wAC7/e肌20,1028-1038.CumminsPL,GreadyJE.(2003)ComputationalmethodsforthestudyofenzymicreactionmechanismsII:Anoverlappingmechanicallyembeddedmethodforhybridsemiempirical-QM/MMcalculations.T服(9C朋M632,245-255.CumminsPL,GreadyJE.(2005)ComputationalmethodsforthestudyofenzymicreactionmechanismsIII:aperturbationplusQM/MMapproachforcalculatingrelativefreeenergiesofprotonation.CompwACTzem.26,561-568.CumminsPL,RostovI,GreadyJE.(2007)Calculationofacompleteenzymicreactionsurface:reactionandactivationfreeenergiesforhydride-iontransferindihydrofolatereductase.J!CTze附.T7zeorC戸/.3,1203-1211.Emlyn隱JonesD,WoodgerFJ,PriceGP,WhitneySM.(2006)RbcXcanfunctionasambiscochaperonin,butisnon-essentialinSynechococcusPCC7942.CW/尸一o/.47,1630-1640.EvansJR,AustinRB.(1986)Thespecificactivityofribulose-l,5-bisphosphatecarboxylaseinrelationtogenotypeinwheat.尸/"w/"167,344-350.FershtA.(1998)Structureandmechanisminproteinscience:guidetoenzymecatalysisandproteinfolding.W.H.Freeman&Co.,1998.FreyPA,HegemanA.(2007)Enzymaticreactionmechanisms.OxfordUniversityPressUSA,2007.FrischMJ,(80co-authors)andPopleJA.(2004)Ga2m7"w眠RevisionC.02,GaussianInc.,Wallingford,CT.GalmesJ,FlexasJ,KeysAJ,CifreJ,MitchellRAC,MadgwickPJ,HaslamRP,MedranoH,ParryMAJ.(2005)Rubiscospecificityfactortendstobelargerinplantspeciesfromdrierhabitatsandinspecieswithpersistentleaves.P/awfCW/28,571-579.GreadyJE,RostovI,CumminsPL.(2006)Simulationsofenzymereactionmechanismsinactivesites:accountingforanenvironmentwhichismuchmorethanasolventperturbation.In"ModellingMolecularStructureandReactivityinBiologicalSystems",K丄Naidoo,M.Harm,J.Gao,M.FieldandJ,Brady,eds,RoyalSocietyofChemistry,London,pp.10卜118.HallTA.(1999)BioEdit:auser-friendlybiologicalsequencealignmenteditorandisanalysisprogramforWindows95/98/NT.M/c7,爿czVfe5^早5fer41,95.KaneHJ,ViilJ,EntschB,PaulBK,MorellMK,AndrewsTJ.(1994)AnimprovedmethodformeasuringtheC02/02specificityofribulosebisphosphatecarboxylase-oxygenase.爿組户/"wf尸/z,'o/.21,449-461.KaneHJ,WilkinJM,PortisAR,AndrewsTJ.(1998)Potentinhibitionofribulose-20bisphosphatecarboxylasebyanoxidizedimpurityinribulose-l,5-bisphosphate.iVaw/尸/2jw'o/.117,1059-1069.KoopH-U,HerzS,GoldsTJ,NickelsenJ.(2007)Thegenetictransformationofplastids.TopicinCurrentGenetics.DOI10.1007/473520070225/Publishedonline:15May2007.Mueller-CajarO,MorellM,WhitneySM.(2007)DirectedevolutionofRubiscoinEscherichicolirevealsaspecificity-determininghydrogenbondintheFormIIenzyme.fi/oc/^/m、^y,inpress,Sept2007.ParryMA,AndralojcPJ,MitchellRA,MadgwickPJ,KeysAJ.(2003)ManipulationofRubisco:theamount,activity,functionandregulation.J£!xp/754,1321-1333.ParryMAJ,MadgwickPJ,CarvalhoJFC,AndralojcPJ.(2007)ProspectsfromincreasingphotosynthesisbyovercomingthelimitationsofRubisco.Jvlg.5b/.145,31-43.PriceGD,HowittSM,HarrisonK,BadgerMR.(1993)AnalysisofagenomicDNAregionfromthecyanobacteriumSynechococcussp.strainPCC7942involvedincarboxysomeassemblyandftmction.c/5a"eWo/.175,2871-2879.RuuskaS,AndrewsTJ,BadgerMR,HudsonGS,LaiskA,PriceGD,vonCaemmererS.(1998》TheinterplaybetweenlimitingprocessesinC-3photosynthesisstudiedbyrapid-responsegasexchangeusingtransgenictobaccoimpairedinphotosynthesis.J!尸/"wf尸A戸o/.25,859-870.SvabZ,MaligaP.(1993)High-frequencyplastidtransformationintobaccobyselectionforachimericaadAgene./Voc.7Va//Jc"d.5W.90,913-917.SpreitzerRJ,SalvucciME.(2002)Rubisco:structure,regulatoryinteractions,andpossibilitiesforabetterenzyme,/tnww.iev.尸/awAB/o/.53,449-475.ThompsonJD,HigginsDG,GibsonTJ.(1994).CLUSTALW:improvingthesensitivityofprogressivemultiplesequencealignmentthroughsequenceweighting,position-specificgappenaltiesandweightmatrixchoice.M/c/ezcj"'^22,4673-4680。WhitneySM,vonCaemmererS,HudsonGS,AndrewsTJ.(1999)DirectedmutationoftheRubiscolargesubunitoftobaccoinfluencesphotorespimtionandgrowth.户/aW尸/yw'o/.121,579-588.WhitneySM,AndrewsTJ.(2001)Plastome陽encodedbacterialribulose-1,5-bisphosphatecarboxylase/oxygenase(Rubisco)supportsphotosynthesisandgrowthintobacco.7VW/爿cad5W.98,14738-14743.WhitneySM,BaldetP,HudsonGS,AndrewsTJ.(2001).FormIRubiscosfromnon-greenalgaeareexpressedabundantlybutnotassembledintobaccochloroplasts.尸/"""26,535-547.WhitneySM,SharwoodRE.(2007)LinkedRubiscosubunitscanassembleintofunctionaloligomerswithoutimpedingcatalyticperformance./S/o/.CTew.282,3809-3818.权利要求1.产生具有改进的功能性质的蛋白的方法,所述方法包括(a)鉴定第一蛋白中的至少一个目标氨基酸残基,其中所述目标氨基酸残基与所述功能性质相关;(b)将第一蛋白与来自于与第一蛋白相同或不同的系统发育分支的至少一个同源第二蛋白进行比较,并鉴定第一蛋白与第二蛋白之间的至少一个变异氨基酸残基;(c)在候选氨基酸残基影响与所述功能性质相关的所述目标氨基酸残基的基础上,从(b)中所鉴定出的变异氨基酸残基中选择至少一个所述候选氨基酸残基;(d)计算机模拟形成至少一个候选突变蛋白或在体外产生至少一个候选突变蛋白,在所述候选突变蛋白中来自第二蛋白的所述至少一个候选氨基酸残基取代了在第一蛋白中的相应残基;和(e)筛选(d)中产生的所述至少一个候选突变蛋白,以鉴定具有所述改进的功能性质的蛋白。2.如权利要求l所述的方法,其中步骤(a)和步骤(b)同时进行。3.如权利要求l所述的方法,其中步骤(b)在步骤(a)之前进行。4.如权利要求1~3中任一项所述的方法,其中步骤(a)的对第一蛋白中至少一个目标氨基酸残基的鉴定减少了为了从在步骤(b)中鉴定的变异氨基酸残基中鉴定出候选氨基酸残基而需要检验的序列空间量。5.如权利要求14中任一项所述的方法,其中步骤(d)包括通过使用来自第二蛋白的至少一个候选氨基酸残基来取代同源蛋白中或者不同于第一蛋白或除第一蛋白之外的同源蛋白中的相应残基而形成或产生至少一个候选突变蛋白。6.如权利要求1~4中任一项所述的方法,其中步骤(d)包括形成或产生至少一个候选突变蛋白,在所述候选突变蛋白中来自第二蛋白的至少两个候选氨基酸残基取代了第一蛋白中和/或不同于第一蛋白的同源蛋白中的相应残基。7.如权利要求1~6中任一项所述的方法,其中所述至少一个目标氨基酸残基包含于第一蛋白或含有第一蛋白的蛋白组中。8.如权利要求1~7中任一项所述的方法,其中所述至少一个目标氨基酸残基为至少2个、至少3个、至少4个、至少5个、至少10个、至少12个、至少15个、至少20个、至少30个或至少50个目标氨基酸残基。9.如权利要求18中任一项所述的方法,其中所述蛋白为酶,且所述改进的功能性质选自改进的所述酶的动力学效率、改变的所述酶对一个或多个底物的特异性、改变的对所述酶的一个或多个产物的特异性和改变的^f崔化有效温度范围。10.如权利要求1~9中任一项所述的方法,其中所述蛋白是核酮糖-1,5-二磷酸羧化酶/氧合酶。11.如权利要求IO所述的方法,其中所述改进的功能性质是改进的催化效率或改进的对二氧化碳的特异性。12.如权利要求111中任一项所述的方法,其中所述目标氨基酸残基选自直接与底物或反应中间体相互作用的那些残基。13.如权利要求12所述的方法,其中所述蛋白是核酮糖-l,5-二磷酸羧化酶/氧合酶。14.如权利要求13所述的方法,其中所述核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的目标氨基酸残基是与反应中心直接配位的"第一层"残基或与一个或多个的所述"第一层"残基直接配位的"第二层"残基。15.如权利要求14所述的方法,其中所述核酮糖-l,5-二磷酸羧化酶/氧合酶的第一层残基选自Glu60、Asnl23、Lysl75、LYS177、KCX201、Asp203、Glu204、His294和Lys334。16.如权利要求13所述的方法,其中所述核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的目标氨基酸残基是核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白大亚基的N端域。17.如权利要求16所述的方法,其中所述N端域目标氨基酸残基参与了由核酮糖-l,5-二磷酸羧化酶/氧合酶介导的羧化酶催化的气体加成步骤。18.如权利要求16或17所述的方法,其中参与所述气体加成步骤的N端域目标氨基酸残基选自ASN123、GLU60和Tyr20。19.如权利要求1~18中任一项所述的方法,其中所述蛋白为酶,且在适应于具体生长环境的动力学和功能特性诸如热适应或冷适应或抗干旱的基础上选择所述第二蛋白。20.如权利要求19所述的方法,其中从所述第二蛋白的环境多样性数据中鉴定所述特性。21.如权利要求1~19中任一项所述的方法,其中所述至少一个候选氨基酸残基被鉴定为能影响(a)中鉴定的所述至少一个目标氨基酸残基的残基,并且所述至少一个候选氨基酸残基调节了所形成蛋白的功能性质。22.如权利要求21所述的方法,其中所述候选氨基酸残基由于该候选氨基酸残基与所述至少一个目标氨基酸残基的临近而影响了与所述功能性质有关的所述至少一个目标氨基酸残基。23.如权利要求22所述的方法,其中所述影响选自位阻效应、静电效应和疏水效应。24.如权利要求1~23中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个趋异候选氨基酸残基而非至少一个候选氨基酸残基。25.如权利要求123中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少两个趋异候选氨基酸残基而非至少两个候选氨基酸残基。26.如权利要求1~23中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个替代候选氨基酸残基而非至少一个候选氨基酸残基。27.如权利要求123中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少两个替代候选氨基酸残基而非至少两个候选氨基酸残基。28.如权利要求1~23中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个替代候选氨基酸残基和至少一个趋异候选氨基酸残基而非至少两个候选氛基酸残基。29.如权利要求1~28中任一项所述的方法,其中鉴定至少一个目标氨基酸残基的步骤(a)包括基于所述蛋白结构的经验数据的活性位点片段QM计算和/或杂化QM/QM和/或QM/MM计算的步骤。30.如权利要求29所述的方法,其中所述经验数据是X射线晶体结构或溶液核磁共振结构。31.如权利要求30所述的方法,其中所述经验数据还包括突变数据、动力学数据、同位素鉴别、量热数据和光谱数据中的任意一种或多种。32.如权利要求29~31中任一项所述的方法,其中通过利用QM/MM可能性的分子动力学(MD)模拟对所述QM/MM计算进行了补充。33.如权利要求132中任一项所述的方法,其中从所述至少一个变异氨基酸残基中选择至少一个候选氨基酸残基的步骤包括评估(a)中鉴定的所述至少一个目标氨基酸残基与(b)中鉴定的变异氨基酸残基的临近性和/或与二级结构单元的相对位置。34.如权利要求1~33中任一项所述的方法,其中选择至少一个候选氨基酸残基的步骤(c)包括鉴定所述第一蛋白和所述第二蛋白之间与静电相互作用和/或疏水相互作用有关的变化,所述静电相互作用和/或疏水相互作用为(b)中所鉴定的一个或多个变异氨基酸残基与(a)中所鉴定的至少一个目标氨基酸残基和/或含有步骤(a)中所鉴定的至少一个目标残基的二级结构单元之间的相互作用。35.如权利要求34所述的方法,其中选择至少一个候选氨基酸残基的步骤(c)还包括对消除由在第一蛋白中引入候选氨基酸残基造成的位阻效应所必须的补偿突变的鉴定。36.如权利要求1~35中任一项所述的方法,其中筛选至少一个候选突变蛋白的步骤(e)包括计算机模拟分析、生化评估和生理学评估中的任何一种或多种。37.如权利要求36所述的方法,其中所述生化评估包括在体外蛋白的正确折叠和/或组装的评估、蛋白结构的评估、蛋白的催化活性和/或其它结合功能的评估、和/或蛋白的稳定性的评估。38.如权利要求37所述的方法,其中所述生理学评估包括在体内蛋白的正确表达、正确折叠和/或组装的评估、蛋白结构的评估、蛋白的催化活性的评估、和/或蛋白的稳定性的评估。39.如权利要求36~38中任一项所述的方法,所述方法包括在步骤(c)之后和步骤(d)之前的额外步骤,所述额外步骤对预测为在所述至少一个目标氨基酸残基上有累积效应的候选氨基酸残基进行归类。40.如权利要求39所述的方法,其中所述累积效应通过静电效应和/或疏水效应和/或位阻效应中的一种或多种而发生影响。41.如权利要求40所述的方法,其中所述静电效应和/或疏水效应和/或位阻效应由在二级结构单元和环的定位上的协同效应或补偿效应造成。42.如权利要求3641中任一项所示的方法,所述方法包括紧接步骤(d)之后进行的对具有所述改进的功能性质的候选突变蛋白排序的额外步骤。43.如权利要求42所述的方法,其中对所述候选突变蛋白排序包括评估所述候选突变蛋白中候选氨基酸残基和/或替代候选氨基酸残基和/或趋异候选氨基酸残基对所述改进的功能性质的相对可能性贡献。44.如权利要求143中任一项所述的方法,所述方法包括将从步骤(e)中候选突变蛋白的至少一轮筛选导出的信息用于蛋白结构内部的亚区的鉴定的另一个额外步骤,所述亚区优先影响与所述区域相连的目标氨基酸残基的性质。45.如权利要求44所述的方法,其中所述亚区提供了鉴定经预测可与由步骤(a)(e)鉴定的候选残基、替代候选残基和/或趋异候选残基相互作用的其他候选残基、替代候选残基、共变异残基和/或趋异候选残基的基础。46.如权利要求44所述的方法,其中所述至少一轮筛选用于产生一组优选突变位点,及所述优选突变位点的一组优选组合。47.如权利要求1~46中任一项所述的方法,所述方法包括在具有所述改进的功能性质的所述蛋白上进行定向进化并筛选其产物的另一个步骤。48.产生具有改进的功能性质的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的方法,所述方法包括(a)鉴定第一核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白中的至少一个目标氨基酸残基,其中所述目标氨基酸残基与所述功能性质相关;(b)将第一核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白与来自于与第一核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白相同或不同的系统发育分支的至少一个同源第二核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白进行比较,并鉴定第一核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白与第二核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白之间的至少一个变异氨基酸残基;(c)在候选氨基酸残基影响与所述功能性质相关的所述目标氨基酸残基的基础上,从(b)中所鉴定的变异氨基酸残基中选择至少一个所述候选氨基酸残基;(d)通过计算机模拟形成至少一个候选突变核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白或在体外产生至少一个候选突变核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白,在所述至少一个候选突变核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白中来自第二核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的所述至少一个候选氨基酸残基取代了在第一核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白中的相应残基;和(e)筛选(d)中产生的所述至少一个候选突变核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白,以鉴定具有所述改进的功能性质的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白。49.如权利要求48所述的方法,其中所述步骤(a)和步骤(b)同时进行。50.如权利要求48所述的方法,其中步骤(b)在步骤(a)之前进行。51.如权利要求48~50中任一项所述的方法,其中步骤(a)的对第一蛋白中至少一个目标氨基酸残基的鉴定减少了为了从在步骤(b)中鉴定的变异氨基酸残基中鉴定出候选氨基酸残基而需要检验的序列空间量。52.如权利要求4851中任一项所述的方法,其中用于与第一核酮糖-l,5-二磷酸羧化酶/氧合酶比较的第二核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的残基包含与核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白活性位点直接配位的所有残基、与核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的底物或中间体反应物种的反应活性中心相互作用的所有残基、以及在核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白活性位点的接近距离内的其它残基、或上述残基的子集。53.如权利要求52所述的方法,其中所述接近距离为与底物或中间体反应物种的任何原子相距3A28A。54.如权利要求52所述的方法,其中所述接近距离为与底物或中间体反应物种的任何原子相距6A20A。55.如权利要求52所述的方法,其中所述接近距离为与底物或中间体反应物种的任4可原子相距9A~15A。56.如权利要求4855中任一项所述的方法,其中第一核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白取自绿色植物和蓝细菌物种,且第二核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白取自红藻物种。57.如权利要求4855中任一项所述的方法,其中第一核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白取自开花植物和蓝细菌物种,且第二核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白取自红藻物种。58.如权利要求4857中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个趋异候选氨基酸残基而非至少一个候选氨基酸残基。59.如权利要求4858中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少两个趋异候选氨基酸残基而非至少两个候选氨基酸残基。60.如权利要求4858中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个替代候选氨基酸残基而非至少一个候选氨基酸残基。61.如权利要求4858中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少两个替代候选氨基酸残基而非至少两个候选氨基酸残基。62.如权利要求4858中任一项所述的方法,其中步骤(c)包括从(b)中所鉴定的变异氨基酸残基中选择至少一个替代候选氨基酸残基和至少一个趋异候选氨基酸残基而非至少两个候选氨基酸残基。63.如权利要求4862中任一项所述的方法,所述方法包括在步骤(c)之后和步骤(d)之前进行的使用包括下列步骤的方法来纯化所述核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的另一个步骤(a)将H6标记的泛素(Ub)序列(H6Ub)融合进第一载体至rbcS基因的5'端;(b)将所述第一载体与编码核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的大亚基和小亚基的第二载体共转化到宿主内;(c)诱导所述核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白和载体的表达;(d)基于融合到所述核酮糖-l,5-二磷酸羧化酶/氧合酶小亚基的泛素标记的表达来纯化所述核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白;(e)从所述核酮糖-l,5-二磷酸羧化酶/氧合酶中去除Ub片段。64.如权利要求63所述的方法,其中纯化所述蛋白的步骤(d)使用色谱进行。65.如权利要求64所述的方法,其中所述色谱为金属亲和色谱。66.如权利要求6365所述的方法,其中所述宿主为大肠杆菌。67.如权利要求6366所述的方法,其中所述大亚基包含一个或多个突变。68.如权利要求6367所述的方法,其中所述Ub片段使用Ub特异性蛋白酶除去。69.由权利要求1~68中任一项所述的方法产生的蛋白。70.由权利要求1~68中任一项所述的方法产生的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白。71.包含如SEQIDNO:26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、74、76、78所示的序列或其功能性等价序列的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白。72.由包含如SEQIDNO:25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、73、75、77所示的序列或其功能性等价序列的多核苷酸编码的核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白。73.包含一个氨基酸残基取代或氨基酸残基取代组合的核酮糖-1,5-二磷酸羧化酶/氧合酶大亚基多肽,所述氨基酸残基取代或氨基酸残基取代组合选自(Y25W,D51I)、(Y25W,D51V)、(T23G,K81R)、(G54A,C84A,187V)、(G54S,C84A,187V)、(T23G,Y25W,D51I,K81R)、(Y25W,D51I,G54A,C84A,187V)、(Y25W,D51I,G54S,C84A,187V)、(Y25W,D51V,G54A,C84A,I87V)、(VI211,M297G,V300T)、(L36I,I116L,F140L)、(L36I,I116L,V121I,F140L,M297G,V300T)、(K18I,T23G)、(K21A,L22K,(空隙)M,T23G,Y25W)、(T23G,K18I,T68V,K81R)、(T23G,K81R,P104E)、(T23G,D19P,K81R)、(T23G,K81R,V121I,M297G,V300T)、(T23G)、(K81R)、(V121I,M297G)、(M297G)和(V1211)。74.由权利要求72所述的核酮糖-l,5-二磷酸羧化酶/氧合酶大亚基多肽编码的核酮糖-l,5-二磷S吏羧化酶/氧合酶大亚基,其中所述核酮糖-1,5-二磷酸羧化酶/氧合酶大亚基存在于核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白中。75.如权利要求74所述的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白,所述核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白以保留了核酮糖-l,5-二磷酸羧化酶/氧合酶的生物活性的融合蛋白或其片段的形式提供。76.编码权利要求73或74所述的核酮糖-l,5-二磷酸羧化酶/氧合酶LSU多肽的多核苷酸。77.包含权利要求76所述的多核苷酸序列或权利要求72中定义的多核普酸序列的载体。78.如权利要求77所述的载体,其中所述载体包含组成型启动子或选择性表达启动子。79.如权利要求78所述的载体,其中所述载体包含选择性标记。80.用权利要求76所述的多核苷^列或权利要求72中定义的多核苷酸序列转化的宿主细胞。81.如权利要求80所述的宿主细胞,其中所述宿主细胞为原核细胞或真核细胞。82.如权利要求81所述的宿主细胞,其中所述宿主细胞为细菌细胞。83.如权利要求81所述的宿主细胞,其中所述宿主细胞为大肠杆菌。84.用如权利78所述的载体、如权利要求76所述的多核苷酸序列或权利要求72中定义的多核苷酸序列转化的光合生物。85.如权利要求84所述的光合生物,其中所述生物为蓝细菌。86.如权利要求85所述的光合生物,其中所述生物为聚球藻。87.如权利要求86所述的光合生物,其中所述生物为聚球藻PCC7942或聚球藻PCC6301。88.如权利要求84所述的光合生物,其中所述生物为开花植物。89.如权利要求88所述的光合生物,其中所述生物为野生型或转基因烟草(普通烟草)。90.如权利要求88所述的光合生物,其中所述生物为转基因烟草,在该转基因烟草中天然烟草rbcL被来自深红红螺菌的rbcM所替代。91.如权利要求88-90中任一项所述的光合生物,其中在光合作用细胞器中表达了如权利要求7174所述的蛋白。92.如权利要求91所述的光合生物,其中所述细胞器为质体。93.如权利要求92所述的光合生物,其中所述细胞器选自包括叶绿体(含叶绿素的质体)、黄化质体(未暴露于光的叶绿体)、有色体(非含叶绿素质体)或白色体(用于储存淀粉(淀粉体)、脂质(油质体)或蛋白(蛋白质体)的无色质体)的光合真核生物质体。94.增加生物的光合作用效率的方法,所述方法包括在所述生物内引入编码如权利要求70~73中任一项所述的核酮糖-1,5-二磷酸羧化酶/氧合酶蛋白的多核苷酸序列并表达所述核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白。95.增加农作物产量的方法,所述方法包括在所述农作物植抹内引入编码如权利要求70~73中任一项所述的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的多核苷酸序列。96.增加植物抗旱性的方法,其中所述方法包括在所述植物中引入编码如权利要求70~73中任一项所述的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的多核普l^f列。97.增加一种或多种植物或其它光合生物的生物量的方法,其中所述方法包括在所述植物或生物中引入编码如权利要求7073中任一项所述的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的多核苷酸序列。98.生产包含来自一种或多种植物或其它光合生物的材料的生物燃料的方法,其中所述方法包括在所述植物或生物中引入编码如权利要求7073中任一项所述的核酮糖-l,5-二磷酸羧化酶/氧合酶蛋白的多核香酸序列。99.如权利要求9498中任一项所述的方法,其中所述多核苷酸序列的引入可包括转化、有性繁殖的步骤或其组合。全文摘要产生具有改进的功能性质的蛋白的方法,所述方法包括(a)鉴定第一蛋白中的至少一个目标氨基酸残基,其中所述目标氨基酸残基与所述功能性质相关;(b)将第一蛋白与来自于与第一蛋白相同或不同的系统发育分支的至少一个同源第二蛋白进行比较并鉴定第一蛋白与第二蛋白之间的至少一个变异氨基酸残基;(c)在候选氨基酸残基影响与所述功能性质相关的所述目标氨基酸残基的基础上从(b)中所鉴定出的变异氨基酸残基中选择至少一个候选氨基酸残基;(d)计算机模拟形成至少一个候选突变蛋白或在体外产生至少一个候选突变蛋白,其中来自第二蛋白的至少一个候选氨基酸残基取代了在第一蛋白中的相应残基;和(e)筛选(d)中产生的所述至少一个候选突变蛋白以鉴定具有所述改进的功能性质的蛋白。文档编号C12N15/29GK101553499SQ200780045611公开日2009年10月7日申请日期2007年10月10日优先权日2006年10月10日发明者吉尔·E·格里迪,巴布·坎纳潘申请人:澳大利亚国立大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1