一种土曲霉基因组规模代谢网络模型及其构建方法

文档序号:6441305
专利名称:一种土曲霉基因组规模代谢网络模型及其构建方法
技术领域
本发明属于从基因编码蛋白序列出发,构建土曲霉基因组规模代谢网络的系统生物学领域。涉及土曲霉基因组规模代谢网络模型及其构建方法。
背景技术
工业微生物产业的发展迫切需要对微生物进行系统全面的认识,以在此基础上对微生物代谢功能进行有目的、有效率的设计和改造,以推进工业生物技术的快速发展。而伴随微生物基因组学(Genomic)、蛋白组学(ftOteomics)、代谢组学(Metabonomics)等高通量数据的不断积累和生物信息学策略的不断完备,使得基因组规模代谢网络模型(Genome Scale Metabolic Model,GSMM)构建成为全面系统研究和调控微生物生物生理代谢功能的最佳途径。1999年大肠杆菌基因组规模代谢网络模型构建完成至今,已发展出多种模型构建方法和分析方法。典型的模型构建过程从基因组序列的注释开始,结合各类反应、酶学数据库,获得基因-蛋白-反应(Gene-Protein-Reaction,GPR)的关系列表,进而构建出生物的基因组规模代谢网络。常用的模型分析方法有流量平衡分析(Flux Balance Analysis, FBA)、动态流量平衡分析(Dynamic Flux Balance Analysis,DFBA)等。以上分析方法的基本原理是在代谢网络模型质量平衡(Mass balance)体系的假稳态(Pseudo steady-state) 条件下,对底物吸收的种类和速率加以约束条件,通过最大化或最小化目标方程,得到该约束条件下的代谢流量分布解空间(Solution space)。基因组规模代谢网络模型提供了全局理解微生物生理代谢功能的高效平台。如微生物生长表型的预测和分析,模糊反应的存在性及途径可能性的验证,目标产物代谢途径中关键基因、反应的发现以及系统水平上的代谢工程改造等等。± 曲 β (Aspergillus terreus)M M M (Eurotiomycetes) f^ ^ ^ g (Eurotiales)发菌科(Trichocomaceae)曲霉属(Aspergillus)丝状真菌,工业上广泛用于重要有机酸如衣康酸(Itaconic acid)、顺乌头酸(Cis-aconitic acid)以及降胆血脂药物洛伐他汀(Lovastatin)的生产。土曲霉还被应用于重金属离子的吸附,此外也是导致人、 动植物疾病及粮食腐败的微生物之一。为了更好的利用该微生物,我们有必要从系统生物学的角度出发全面解析土曲霉的生理特性。而通过基因组规模代谢网络模型的构建和分析是实现全面解析其生理特性的最佳途径。

发明内容
本发明提供了一种土曲霉基因组规模代谢网络模型的构建方法。该方法能够用于任何生物基因组规模代谢网络模型的构建;该方法能够提供真菌细胞基因组规模代谢网络构建所需的反应。本发明首次完成了土曲霉菌基因组规模代谢网络模型的构建。该模型包含1300 个基因、1149个代谢物及1575个生化反应。
本发明补充了土曲霉基因编码蛋白的注释信息。2005年Birren B. W等完成对土曲霉(Aspergillus terreus NIH2624)的基因组注释,注释结果包含10402个基因编码蛋白(Gene encoding-protein)。其中包含 5253个假定未知蛋白(Putative uncharacterized protein)和3494个预测蛋白(Predicted protein) 0本发明所构建的土曲霉基因组规模代谢网络模型为其中的86个预测蛋白,645个假定未知蛋白重新分配了生理功能。本发明明确了土曲霉衣康酸的生物合成途径。通过FBA对土曲霉基因组规模代谢网络模型中衣康酸合的三种成可能途径逐一进行流量分析,并实验数据进行比较。结果验证了衣康酸由顺乌头酸合成的途径。本发明确定了土曲霉的生物量组成成分。生物量方程一般作为模型模拟的目标方程(objective function),获取微生物细胞生物量构成及比例对模型的构建及模拟至关重要。本发明从实验和文献数据中获取了土曲霉的生物量组分及比例,并根据模型模拟的结果进行了修正。土曲霉生物量组分及比例为32. 80%蛋白质、0. 80% DNA,5. 30% RNA、 19. 00%脂质、0. 10%糖原、5. 40%几丁质、14. 60%葡聚糖、0. 70%甘油、6. 10%甘露聚糖以及15. 2%灰分构成。


图1为土曲霉基因组规模代谢网络模型重建所遵循的流程图;图2为生物系统发生树;图3为碳源限制条件下氧气对模型生长的影响。
具体实施例方式实施例1系统发生树信息获取^t NCBI Taxonomy ^ig^fiiA Aspergillus terreus NIH2624> Aspergillus niger和Aspergillus oryzae进行检索,获取各菌间的亲缘关系。结果见图2.实施例2编码基因及其蛋白名称及功能从 Uniprot protein knowledgebase 中下载 Aspergillus terreus NIH2624、 Aspergillus niger禾口 Aspergillus oryzae RIB40的基因编码的蛋白序列。示例如下表。表1编码基因及其蛋白序列
/,___
ORF(A. terreus)_______ Function____________
IovB Lovastatin nonaketide synthase (EC 2.3.1.161) ATEG_10097 Succinate/fumarate mitochondrial transporter ATEG_10103_Alpha-amylase_实施例4基因组规模代谢网络模型构建1.比对菌模型的统一主要进行代谢物名称的统一。如水的表达形式有H20和Water,统一后均表示为 H20。2.临时模型构建目的菌与比对菌进行蛋白序列Blastp比对,筛选相似性大于等于40 %的比对序列。数量筛选示例见表2。表2筛选示例
权利要求
1.一种土曲霉基因组规模代谢网络模型的构建方法,其特征在于根据生物系统发生树下亲缘微生物蛋白功能相似性,构建目的微生物基因组规模代谢网络模型。
2.根据权利要求1所述,其涉及的生物系统发生树来源于美国国家生物技术信息中心。
3.根据权利要求1所述,其涉及的蛋白由编码基因编码合成。
4.根据权利要求1和3所述,其涉及的蛋白至少包含目的微生物细胞中的一个酶或膜转运蛋白。
5.根据权利要求1所述,其蛋白功能相似性由美国国家生物技术信息中心的Blastp比对工具获得。
6.根据权利要求1和5所述,筛选功能相似性大于或等于40%的蛋白序列用于基因组规模代谢网络模型构建。
7.根据权利要求1的方法,基因组规模代谢网络模型构建的步骤包括①比对菌模型的统一;②提取比对菌模型中与权利要求6所筛选的蛋白序列适配的反应信息,构建临时模型;③整合临时模型,获得目的微生物的基因组规模代谢网络模型。
8.根据权利要求7所述,步骤①中所述比对菌为Aspergillusniger,Aspergillus oryzae RIB40。
9.根据权利要求1、4和7所述,其中涉及的目的微生物为Aspergillusterreus OTH2624。
10.根据权利1、7所述,其中涉及的土曲霉基因组规模代谢网络模型。
全文摘要
本发明涉及土曲霉的基因组规模代谢网络模型及其构建方法。模型的构建基于生物系统发生树下亲缘微生物的基因编码蛋白序列比对。通过模型的构建,明确了土曲霉生理活动中所发生的反应及其基因,补充了基因编码蛋白序列的注释信息。土曲霉的基因组规模代谢网络模型进一步对深入了解土曲霉的生理特性将有极大的推进作用。
文档编号G06F19/12GK102495976SQ20111041931
公开日2012年6月13日 申请日期2011年12月15日 优先权日2011年12月15日
发明者刘杰, 刘立明, 陈坚, 高倩 申请人:江南大学
再多了解一些
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1