一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法

文档序号:2622695阅读:693来源:国知局
专利名称:一种树干毕赤酵母基因组规模代谢网络模型构建及分析方法
技术领域
本发明涉及ー种以整合基因组注释技术为核心的树干毕赤酵母基因组规模代谢网络模型构建方法及对构建所得模型的分析方法,属于系统生物学领域。
背景技术
人类基因组计划的完成标志着后基因组时代的到来,后基因组时代各种高通量的组学技术的发展使的生物学的研究从传统的分子生物学进入到系统生物学时代,而基因组规模代谢网络模型(Genome Scale Metabolic Model)无疑是研究热点之一。继流感嗜血杆菌基因组规模代谢网络模型构建完成,迄今已有80多个不同物种的基因组规模代谢网络模型被公布。基因组规模代谢网络模型就是将细胞内所有的生化反应看作ー个整体,在 系统水平上研究所有參与代谢过程的基因、酶和反应物之间的相互作用。根据拟稳态的假设,代谢网络处于ー种瞬时平衡稳态,运用模拟算法可得到完整的细胞代谢流分布图,掲示细胞代谢变化规律,为代谢工程改造和生理生化代谢特点解析提供依据。作为一种非传统型酵母,树干毕赤酵母(Scheffersomyces stipitis CBS6054)因其宽广的碳源代谢能力而成为纤维素こ醇的潜在生产菌。由于自然环境的进化选择,树干毕赤酵母不仅可以利用葡萄糖、甘露糖、半乳糖等六碳糖,还可以发酵木糖、阿拉伯糖等酿酒酵母不能利用的五碳糖,甚至可以代谢纤维ニ糖、木聚糖等。在其已公布的全基因组测序结果中也证实了大量糖代谢相关基因的存在。此外,树干毕赤酵母利用木糖发酵产こ醇的得率最高已达O. 47g/g木糖,并且利用树干毕赤酵母发酵还具有营养要求简单、抗污染能力强等优点。然而,エ业化应用也存在许多不可避免的问题,如底物吸收较低,发酵こ醇需要严格控制溶氧水平等。因此,我们需要在系统层面上研究树干毕赤酵母的代谢机理,为树干毕赤酵母更为广泛的应用提供一个有效的平台。常规的基因组规模代谢网络模型构建以公布的基因组测序结果为信息源提取具有代谢功能的基因,再整合生化数据库信息,进而组合成能代表此微生物细胞内发生的所有己知生化反应的反应列表。本发明提出的是ー种半自动化的整合微生物基因组规模代谢网络模型构建方法。运用此方法进行代谢网络模型构建的优点是更加省时、方便,且所得模型更为全面、准确。

发明内容
本发明的目的是提供ー种树干毕赤酵母基因组规模代谢网络模型构建及分析方法。本发明的技术方案I.基因组规模代谢网络模型构建与分析包括全基因组注释与粗略模型的构建、模型的精炼、数学模型的建立、模型的验证与分析四个步骤。I)全基因组注释与粗略模型的构建首先从Uniprot、NCBI Entre Gene或者EBI等公共数据库平台上下载最新的FASTA格式基因组序列,后采用多种全自动化的基因组注释方法,包括在线数据库 KAAS (KEGG Automatic Annotation Server)、IdentiCS、和位点特异比对(PSI-BLAST)对特定的全基因组序列进行整合注释得到关于目的微生物全面的代谢基因信息,构建出以基因-蛋白质-反应关联为核心的粗略代谢网络模型。2)模型的精炼模型精炼的主要目标是通过整合生化数据库和文献组学的数据来建立物种特异的详细反应列表,具体工作包括验证补充基因-蛋白质-反应关联信息,添加必要的运输交换反应,文献信息的挖掘与补充,生物量方程及能量維持反应的建立等。3)数学模型的建立将上述反应列表转换成数学模型,其核心内容是计量系数矩阵,通常用S表示。在安装COBRA工具箱之后,通过加载Matlab程序可将精细代谢模型转、换成系统生物学语言格式的文件(SBML)后可在计算机上模拟。为使模拟结果更加接近微生物真实的代谢通常要添加一定的约束条件如代谢通量平衡(S-V = O)、热力学平衡(ΛΕ=O)等。4)模型的验证与分析基于约束条件的模拟优化方法是基因组规模代谢网络模型常用的模拟算法,而通量平衡分析(FBA Flux Balance Analysis)是Matlab平台上最常用的算法,通过函数调用和COBRA工具箱的使用,模拟微生物在特定条件下的代谢状況。2.树干毕赤酵母的基因组规模代谢网络模型。基于上述原理,构建获得树干毕赤酵母基因组规模代谢网络模型iTL779,注释出的具有代谢功能的779个基因占树干毕赤酵母总基因的13. 2%。运用通量平衡分析方法证实模型的准确性后,运用COBRA单基因、单反应敲除程序鉴定出树干毕赤酵母细胞生长所需的最小基因、反应集合分别为110个基因和158个反应。


图I树干毕赤酵母的基因组规模代谢网络模型构建示意流程图
具体实施例方式以下是树干毕赤酵母的基因组规模代谢网络模型构建、分析的实施例。实施例I树干毕赤酵母基因组规模代谢网络模型构建过程I)从NCBI Entre Gene数据库中下载最新的Scheffersomyces stipitis CBS6054基因组序列,采用以下三种方法对其进行基因组注释。①在KAAS中上传S. stipitisFASTA格式的基因组序列,选择与之亲缘关系较近的多种菌种的数据库进行双向BLAST。
②IdentiCS是ー种快速的独立基因组注释软件,采用简化的两步注释法,用公共数据库如UnipiOt的基因注释信息来比对所要注释的基因序列而鉴别出更多可能的基因编码序列。
③PSI-BLAST是ー种利用迭代的BLAST搜索,在线提交目的微生物序列后返回与选定的在线数据库的比对结果特点是可增加发现远亲进化关系的相似序列数目。整合三种自动化基因组注释结果,得到树干毕赤酵母的初始代谢反应列表。关于基因编码的蛋白质的定位我们采用在线注释的方法在PA-SUB和CELLO上得到细胞器定位結果,据此将模型划分为细胞质、线粒体、过氧化物酶体和胞外四个区室。2)从KEGG, MetaCyc and PubMed等专业数据库中以树干毕赤酵母为关键词检索树干毕赤酵母代谢相关信息,补充添加到粗模型中,同时从文献和测序结果中提取生物量组成等模拟所需组分,由此得到精确的树干毕赤酵母代谢网络模型。3)将上述精细模型加载到Matlab,设置合适的约束条件对模型进行通量平衡分析。 表I建模过程使用的数据库
权利要求
1.ー种以整合基因组注释技术为核心的树干基因组规模代谢网络模型的构建方法,其特征在于根据公布的目的微生物的测序结果,采用多种基因组注释技术进行全基因注释,同时补充生化数据库和文献组学数据,构建具有基因-蛋白质-反应关联的基因组规模代谢网络模型,后使用基于Matlab平台的COBRA工具箱对所构建的模型进行模拟验证与分祈。
2.根据权利要求I所述,其涉及的目的微生物为ScheffersomycesstipitisCBS6054,其构建的最终模型为iTL779。
3.根据权利要求I所述,整合基因组注释技术包括KAAS、IdentiCS和位点特异比对(PSI-BLAST)相结合的基因组序列比对方法。
4.根据权利要求I所述,补充信息来源于KEGG和MetaCyc生化数据库及PubMed文献组学数据。
5.根据权利要求I所述,模型证实运用通量平衡分析方法考察五种碳源对生长的影响,并与文献实验数据进行比较。
6.根据权利要求I所述,模型分析鉴定出維持树干毕赤酵母细胞生长所需的最小基因、反应集合分别为110个基因和158个生化反应。
全文摘要
本发明以树干毕赤酵母为例具体阐述了一种整合的基因组规模代谢网络模型构建及分析方法,属于系统生物学领域。基于此方法对构建所得的树干毕赤酵母基因组规模代谢网络模型进行系统层次的细胞生长模拟和最小基因、反应集合的鉴别,为全面理解树干毕赤酵母的代谢特征和机理提供了重要的平台。
文档编号G09B19/12GK102663924SQ20121009773
公开日2012年9月12日 申请日期2012年4月6日 优先权日2012年4月6日
发明者刘婷, 刘立明, 徐楠 申请人:江南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1